数据中心基础设施运行维护管理规范

数据中心基础设施运行维护管理规范
数据中心基础设施运行维护管理规范

数据中心基础设施运行维护管理规范

征求意见稿

数据中心基础设施运行维护管理规范编写原则:

1、每个小节名称不可和章节名称相同;

2、正文条文中不得有目的的描述,如需可在条文说明中描述;

3、正文中不得采用形容词;

4、每个条文应注明主语,语句中不可出现“包括但不限于”这样的

不规范用语;

5、正文中凡是“例如”的部分应体现在条文说明中。

目录

第一章总则

第二章符号和术语

第三章一般规定

第四章运维流程

第五章组织架构及人员管理

第六章文件管理

第七章日常维护

第八章应急管理

第九章环境健康和安全

第十章数据中心一体化运维管理第十一章质量管理的监督与检查第十二章其他

第一章总则

1.1、范围

本标准给出国网数据中心基础设施运维管理的指南,包括总则、符号和术语、一般规定、运维流程、组织架构及人员管理、文件管理、日常维护、应急管理、环境健康和安全、数据中心一体化运维管理、质量管理的监督与检查、成本管理等。

本标准可为国网数据中心管理者提供基础设施运维管理系统性指导,也可作为用户或第三方评价国家电网数据中心基础设施运维管理水平的参考。

1.2、规范性引用文件

下列文件对于本标准的应用是必不可少的。凡是注明日期的引用文件,仅注日期的版本适用于本标准。凡是不注明日期的引用文件,其最新版本(包括所有的修改单)适用于本标准。

GB/T 33136 信息技术服务数据中心服务能力成熟度模型

GB/T 51314 数据中心基础设施运行维护标准

GB/T 2887 计算机场地通用规范

GB/T 26572 电器电子产品有害物质限制使用管理办法

GB 26860 电力安全工作规程发电厂和变电站电气部分

GB 50174 数据中心设计规范

DL 408 电业安全工作规程

AQ7004-2007 制冷空调作业安全技术规范

GB/T24353风险管理原则与实施指南

第二章符号和术语

2.1、数据中心能效管理

是在保证业务连续可用的基础上,应用工业自动化、数据采集分析等多个技术对数据中心全生命周期内连续供应的能源进行综合利用、能效分析评估及改善提升。

2.2、电力能耗指标

PUE(POWER USAGE EFFICIENCY)=数据中心总电力能耗/IT设备能耗,用于反映数据中心电力用于IT设备和辅助IT设备运行的效率衡量指标。

2.3、水能耗使用指标

WUE(WATER USAGE EFFICIENCY)=数据中心耗水量/IT设备功耗,用于反映数据中心用水损耗指标。

2.4、能效

是能源利用效率(数据中心实际消耗的总能耗与IT设备能耗之比)的简称。

2.5、数据中心设施运维团队

以数据中心设施运行提供保障支持为主要工作内容的团队。

2.6、安防团队

以数据中心的消防、周边和安全相关监控管理为主要工作内容的团队。

2.7、综合管理团队

负责数据中心综合管理,包括园区物业管理、行政管理等。

2.8、专业执照

是指政府强制要求的执业证书,如:高压进网许可证、高压电工作业证、低压电工操作证、建(构)筑物消防员证等。

2.9、管理手册

规定了运行维护工作的框架结构、执行范围、组织结构、工作规范及各的主要职责的手册

2.10、操作手册

标准操作流程

对数据中心IT系统、基础设施系统、用户服务系统、安防系统,分别制定相应的标准化操作流程,用来指导和规范日常的运行维护工作的标准操作手册。维护操作流程

用于规范和明确数据中心运行维护工作中各项设备的维护操作流程、操作步骤

2.11、维护手册

应急操作流程

用于规范应急操作过程中的流程及操作步骤,确保运行维护人员可以迅速启动,确保有序、有效地组织实施各项应对措施的紧急操作手册。

2.12、日常记录表单

在日常运维工作中执行的标准化的操作流程、预防性维护计划、紧急操作流程,进行详细记录,形成的日常记录表单。

2.13、访问控制

是指对主体访问客体的权限或能力的限制,以及限制进入物理区域(出入控制)和限制使用计算机系统和计算机存储数据的过程(存取控制)。

2.14、预期寿命

从开始投入使用时起,一直到因设备功能完全丧失而最终退出使用的总的时间长度。

2.15、应急组织管理

主要针对应急组织架构、应急领导小组、应急管理小组、应急技术与执行小组、应急保障小组的组织的建立与管理。

2.16、应急事件管理

因基础设施设备故障或者公共灾难危害事件引发数据中心服务中断的事件,应纳入事件管理流程,执行应急响应和紧急恢复。包括:地定义基础设施应急事件、基础设施应急响应、基础设施应急预案编制、基础设施应急通讯联络管理。

2.17、应急预案目标对象

应针对重要设施设备及公共类事件制定应急预案。应急预案须明确该预案的适用场景、通知通报、恢复操作步骤等内容。

2.18、应急演练管理

应制定基础设施年度测试演练计划,明确演练项目、演练方式、演练时间、演练内容等项细则。

2.19、桌面演练

对预案的组织架构和应急流程进行验证。组织数据中心基础设施运维人员,通过设计恰当的故障场景,采用参演人员集中培训、讨论、文字考核等手段加深对应急处置策略、手段和应急预案的了解。

2.20、模拟演练

由数据中心基础设施运维团队人员及应急预案的协同单位共同参与,模拟验证应急预案。模拟应急情况下的报警流程、应急操作执行动作、通知通报及恢复等工作。

2.21、实战演练

数据中心基础设施运维机构可以独自或联合其它部门及客户组织实战演练。在数据中心投运前或投运后的计划性维护期间,假设相应的故障场景,组织相关人员按照应急预案流程进行实操性演练。

2.22、应急演练方案

是演练准备的方案和计划,包括风险控制方案、演练剧本(参演人员的台词,流程、时间控制、执行的动作等)。

2.23、应急演练登记表

是参演人员登记和签名表。

2.24、应急演练过程记录单

是演练各项活动执行情况记录。

2.25、应急演练总结报告

是应急演练过程的总结,可暴露问题,促进完善改进措施和行动计划。

2.26、公共灾难和危害事件

主要包括恐怖袭击、炸弹威胁、治安事件等公共安全危害事件,地震、雷击、异常气候自然灾害等。

2.27、基础设施意外故障事件

主要包括火灾及火灾防范系统故障、建筑物内水患、供配电系统故障、备用应急电源系统故障、空调制冷系统故障、安防系统故障和动力环境监控系统

故障、通讯系统故障等。

2.28、IT系统类故障事件

包括IT系统故障、IT设备故障、网络通讯系统故障、主干传输线路故障等。

2.29、应急预案

对不同等级的故障事件和灾难事件,针对重要设施设备及公共类事件制定应急预案,主要包括供配电系统、制冷系统、消防、监控、网络等基础设施故障,以及暴雨、暴雪、大风、雷击、地震等气候灾难。

2.30、应急通讯管理

要避免应急发布时大群多头现象,按照决策等级情况建立不同的群组,同时应避免层级过多的情况出现,尽量扁平化。群组内明确相应负责人及汇报人,实现信息的准确传达与汇总。

2.31、应急通讯平台工具

具有在应急事件发生时快速的有效的通知到相关执行人员、参与决策组织。通过应急通讯工具平台完成应急事件发布、决策发布、处置执行情况的快速收集和反馈。

2.32、通讯工具

可由多种沟通联络渠道组成,可采用电话会议、视频会议、无线通讯网络、第三方平台等单种或多种方式组成。

2.33、国家数据中心/数据中心

指国家电网数据中心

第三章一般规定

3.1数据中心已参照《数据中心设计规范》GB50174中数据中心分级依据,和

《数据中心基础设施运行维护标准》GB/T51314中的方法和要求,根据自身的使用性质、管理要求及其在经济和社会中的重要性确定,建立运维管理流程、运维管理团队与运维管理制度,并给予落实,以确保数据中心的运行满足IT系统运行需要。

3.2数据中心的运维管理流程应覆盖数据中心运维管理的全过程,并制定计划

进行周期性检视与修正。

3.3数据中心的运维管理队伍应该满足业务开展需要,技能与资质符合政府监

管要求。

3.4数据中心的运维管理制度应涵盖数据中心的各项工作。

3.5数据中心应详尽识别潜在的风险,并制定对应的风险应对方案,制定计划

进行演练。

3.6数据中心的运维活动应关注成本,在确保可用性不受影响的基础上实施节

能减排。

第四章运维流程

4.1 一般规定

数据中心宜依据GB/T 24405 信息技术服务管理标准,建立数据中心服务支持流程,包括服务请求管理、事件管理、变更、问题管理。

4.2服务台

4.2.1 数据中心应建立服务台,以记录、分解、跟踪来自故障的事件、服务请求、投诉建议及其他事项。

4.2.2服务台宜建立和提供多种沟通渠道,包括电子邮件、热线电话、移动应用等,提供7×24小时服务响应和支持。

4.2.3 服务台应设置专门服务座席,由专人负责服务请求、事件等的集中受理和跟踪。

4.2.4 数据中心应建立服务台相关管理制度,明确服务台工作职责、工作内容、监督考核等方面要求。

4.3 服务请求管理

4.3.1数据中心应及时响应并记录来自内外部的各类服务请求,包括:

1.应接受来自用户的服务请求,并记录相关信息。

2.应对服务请求进行确认,根据客户合约和SLA要求,判断是否需履

行此服务请求。

3.应根据服务请求类型,分派服务请求至数据中心服务团队。

4.3.2 应根据要求履行服务请求,包括履行服务请求应包括:

1.应有明确的服务请求分类分级定义、处理时限和升级规则。

2.应履行服务请求,执行相应的响应、处理、升级等活动。

3.应监督、监控服务请求处理进展,并根据需要协调解决。

4.3.3 应对服务请求进行回顾并关闭。包括:

1.应明确服务请求关闭规则,服务请求履行完毕应与用户书面确认。

2.应定期回顾、更新服务请求列表并告知用户。

3.宜对服务请求的完成情况进行满意度调查。

4.应设计服务请求管理绩效指标,用于考量服务请求执行过程的符合度

和有效性,如服务请求按时解决率、及时响应率等。

4.4事件管理

4.4.1 所有事件均应被记录,包括接收的事件和主动发现的事件。

4.4.2应对事件进行分类分级,包括:

4.4.2.1应明确事件的分类分级的定义

4.4.2.2应按事件的影响度和处理优先级,确定事件等级。

4.4.2.3应定义各等级事件的响应时间、恢复时间、解决时间目标。

4.4.2.4应建立重大事件子流程。

4.4.3应快速解决影响数据中心服务的事件。包括:

4.4.3.1应对事件进行分析,尽快处理解决,并记录事件的解决方法。

4.4.3.2事件涉及人员应该能够访问、匹配并关联相关信息,包括相关服务请求、已知错误、问题解决方案和配置管理数据库(CMDB)。

4.4.3.3应监督、监控事件处理进展,并根据需要协调解决。

4.4.4应定义和执行事件升级子流程,包括:

1.应明确定义事件升级规则,包括技术升级和管理升级处理规则

2.符合事件升级规则的事件,应根据事件升级规则进行升级和转移委

派等以确保事件的及时解决。

4.4.5 事件解决后,对事件处理过程进行回顾并关闭事件。包括:

1.应有明确的事件关闭规则。

2.应在关闭事件时对事件的记录进行更新,确认事件的最终分类和分级,

受影响的服务,以及导致事件发生的配置项等。

3.应设计事件管理绩效指标,用于考量过程的合规性和有效性,例如事

件及时响应率、按时解决率等。

4.5问题管理

4.5.1应明确问题触发条件,并识别问题。包括:

4.5.1.1应明确问题来源和触发条件。

4.5.1.2应识别问题并记录。

4.5.2应对问题进行分类分级。包括:

4.5.2.1应明确问题分类分级的定义。

4.5.2.2应按问题的属性划分问题分类和优先级。

4.5.3应检查问题产生异常的根本原因。包括:

4.5.3.1应分析问题现象和关联事件,定位产生异常的根本原因。

4.5.3.2应根据需要转移委派后线支持人员处理。

4.5.4应制定问题解决方案并实施。包括:

4.5.4.1针对问题的根本原因,提出并实施根本解决方案,并记录解决过程。

4.5.4.2暂时无法根本解决的问题,应采用规避措施作为临时解决方案。

4.5.4.3应监督、监控问题处理进展,并根据需要协调解决。

4.5.5应对问题进行回顾和关闭。包括:

4.5.5.1应有明确的问题关闭规则。

4.5.5.2应回顾问题的解决过程与结果。

4.5.5.3应设计问题管理绩效指标,用于考量过程的合规性和有效性等。

4.6变更管理

4.6.1应明确变更管理范围,制定变更策略。包括:

4.6.1.1应制定变更策略,包括但不限于变更范围、变更的分类分级标准;实施前变更应被测试;实施过程中应及时与相关方进行沟通。

4.6.1.2新服务或服务重大变化的落实应参照变更管理执行。

4.6.1.3宜定义数据中心标准变更类型,以简化数据中心变更审批和实施过程。

4.6.1.4对紧急和重大变更的授权和实施,建立独立的策略和子过程。

4.6.2应接收、记录并评估变更。包括:

4.6.2.1所有变更都被记录。

4.6.2.2应接收变更申请,并检查变更申请的完整性,评估变更的影响、风险和需要的资源。

4.6.3 应制定变更方案。变更方案内容应包括变更原因、变更实施方案、实施计划、回退方案或补救措施等。

4.6.4 所有变更均应经过评审和授权后,方能执行。高等级变更宜组织正式的变更评审会议,由基础设施运维、客户服务、运营管理等相关部门进行共同评审后,做出变更评审结论。

4.6.5应监督变更执行进展,协调变更实施。包括:

4.6.

5.1应全程推进、协调变更的实施。

4.6.

5.2应对变更实施结果进行回顾及验证。

4.6.

5.3应更新设备管理信息,并根据需要更新操作手册以及必要培训。

4.6.6应对变更实施过程进行回顾与关闭。包括:

4.6.6.1应有明确的变更关闭规则。

4.6.6.2应回顾变更实施的过程和结果。

4.6.6.3设计变更管理绩效指标,用于考量过程的合规性和有效性等。

4.7风险管理

4.7.1 一般规定

数据中心应建立风险管理过程,控制数据中心建设和运行风险。风险管理的实施方法可依据GB/T24353 《风险管理原则与实施指南》。

4.7.2数据中心的风险管理的内容和过程,包括风险背景建立、风险评估、风险处置、批准监督、监管审查、沟通咨询六个方面,其中监管审查、沟通咨询贯穿于风险背景建立、风险评估、风险处理、批准监督步骤过程中。

4.7.3数据中心基础设施运维工作风险管理应涉及人员的角色和责任宜结合信息安全风险管理相关体系进行分类定义,并建立管理机制。

4.7.4数据中心应依据基础设施运维工作范围,确定风险管理对象、范围、实施风险管理的准备、相关信息的调查和分析背景的建立。

4.7.5数据中心运维团队宜密切关注内外部环境变化,并评估变化可能带来的风

险,包括:

4.7.

5.1数据中心业务和客户的变化,组织架构和人员的变化,技术上的改变等;

4.7.

5.2 相关法律法规的变更。

4.7.6数据中心风险管理应制定风险评估计划、评估方案、评估方法和工具,并定期回顾和完善。

4.7.7数据中心应定期识别和记录影响数据中心安全运行的各类风险。可从以下来源识别数据中心安全风险:

4.7.7.1已发生的安全事件和故障;

4.7.7.2数据中心人员日常运维中主动发现的隐患;

4.7.7.3监管方、客户方和第三方在审计中发现的问题和隐患;

4.7.7.4在内部检查中发现的风险隐患。

4.7.8数据中心风险识别过程除技术风险外,还应涵盖以下类型的风险:

4.7.8.1客户与合约:合约及SLA执行上的风险等;

4.7.8.2供应商管理:设备供应商、维保服务商、运营商、物业等方面可能影响安全运行的风险等;

4.7.8.3团队管理:组织架构、岗位设置、人员能力方面的风险等;

4.7.8.4制度流程:制度流程缺失、不健全等方面的风险等。

4.7.9数据中心应在风险评估之前,应从风险发生的后果、可能性、度量方法、等级等方面制定评价风险重要程度的标准,并持续不断地检查和完善。

4.7.10数据中心风险管理工作应针对已识别的风险进行定性和定量分析,根据风险发生可能性和影响确定风险等级,综合评价风险状况,并形成风险评估报告。

4.7.11数据中心风险管理工作应对评估出的风险,选择相应的风险处置措施,确定风险处置计划,包括风险处置措施、负责人、计划完成时间等。

4.7.12数据中心风险管理工作应对风险处置计划实施情况进行定期跟踪,对风险处置措施实施后的残余风险进行评估,确保风险可控可接受。

4.7.13数据中心风险管理应对背景建立、风险评估、处置的结果进行批准监督,建立批准监督流程和机制,并形成管理制度。通过批准申请、批准处理和持续监督三个批准监督过程,对风险管理活动做决策和监管。

4.7.14数据中心风险管理应对批准的有效期、风险背景的变化情况进行持续监督,并形成监督记录。

4.7.15数据中心风险识别、评估及处置过程应形成制度记录文档。

4.7.16数据中心宜对风险管理的背景建立、风险评估、风险处置和批准监督全过程进行监控和审查,并输出相应的过程审查记录。监控审查内容宜包括:

4.7.16.1风险管理过程有效性及成本有效性;

4.7.16.2风险管理结果的有效性和符合性;

4.7.17数据中心风险管理的审查工作应对高等级的风险每年审查一次,其他等级风险二年至少审查一次。审查方式可以为现场或非现场的内部审查、外部审查和第三方检验检测机构审查。

4.7.18数据中心应建立风险管理的沟通咨询机制,保障风险管理中的背景建立、风险评估、风险处置、批准监督活动过程顺利有效,相关行动人员的协调统一,以及有效的知识技能培训咨询。

4.7.19数据中心沟通咨询过程应按照制度输出相应的沟通咨询度记录,并及时向内外部相关人员报告。

4.8 能效管理

4.8.1、一般规定

1 数据中心能效管理是在保证业务连续可用的基础上,应用工业自动化、数据采集分析等多个技术对数据中心全生命周期内连续供应的能源进行综合利用、能效分析评估及改善提升。

2 数据中心机房应按照设计相关要求做好维护管理工作。

3 针对维护管理中出现的问题,应及时评估分析并优化改进。

4 采用能源利用效率(PUE/WUE)作为机房整体能效的衡量指标。

5 应制定热源安全管理制度,明确控制机房内部和外部产生热量的工作细则,在保障机房设备工作温度的情况下,达到节能降耗的目的。

6 数据中心应支持对内部各种设备的能耗进行综合管理。

4.8.2、能效管理体系

1 通过采集和监控各类用能系统(电气、暖通、电梯、给排水等)整体的实际运行状态,找出关键耗能点和异常耗能点,进行控制和管理。

2 能效管理体系须包含三个子系统:即能耗的采集、分析评估与优化。

4.8.3、能效采集

1 数据的收集宜采用自动化的监控系统和工具,借助智能电量仪、智能传感器等,并经监控系统进行统一数据上传和存储,减少人为因素影响。

2 数据中心能源损耗数据应按照各物理机房模块、子系统、设备分别进行计量统计和可视化展示,包括IT设备运行功耗、电力线路损耗、制冷系统能耗等。

3 应计算并可视化展示实时、日、月、季、年的能效数据(PUE),宜计算并可视化展示水效(WUE)。

4 宜对保证数据中心连续运行的电力、制冷等关键系统的安全运行范围、系统最大承载能力、最佳效率区间等进行统计。

4.8.4、能效分析评估

1能够提供多种能耗分析如同比、环比、排名等方式,可实现对区域能耗、具体能耗类型、设备类型能耗等进行分析,并可生成设备能耗与系统能效分析报告。

2 应能计算发现低利用率设备、低能效设备与异常能耗设备,形成节能操作工单或实现节能自动控制。

3 需建立合理的评估机制,在机房实施相关节能方案后,应能对比机房节能方案实施前、后能耗数据,找出存在的主要问题并提出改进建议。

4.8.5、能效优化

1 数据中心能效优化,应从机房、供电、散热、机房布局、设备选型等多个方面考虑降低能耗。

2 应当建立完整的绿色能效管理制度,为数据中心绿色能效发展提供体制机制保障。

3 宜应用模拟测试等优化方法,分析和测试相关变更可能对电源容量和冷却能力配置规划产生的影响。

数据中心基础设施技术规范

据中心基础设施技术规范 1. 标准及等级 序号 项目 技术规范 1.1. 遵循规范 * 国标GB/50174-2008,A级 2. 建筑系统 序号 项目 技术规范 2.1. 建筑结构 机房为专用设计,竣工日期在3年以内 2.2. 安全设计 抗震设防烈度:8度 防火及防水设计等级:均为Ⅰ级 2.3. 荷载规格 (均布活荷载) 架空地板:每机柜1000 KG(超过时需另行加固) 2.4. 货运交通 客货分流:各自独立的人员和物流进出口 通道净宽1.5米、通道净高2.2米、运行区净高3米(或以上)垂直运输:专用货梯 3. 供配电系统 序号 项目 技术规范 3.1. 市电接入 高压专线供电,双路冗余(1+1) 3.2. 备用发电 启动方式:全自动启动及并机,投入时间小于10分钟 油库容量:配有大容量油库,并支持不停机加油 冗余方式:N+1冗余 3.3. UPS系统

冗余方式:双路(2N)冗余 电池容量:满负荷不低于30分钟/15分钟(单路全载时)3.4. 变配电系统 配电系统:全程双路冗余(1+1),独立路由 变压器:2台一组(1+1),互为冗余备份 3.5. 末端配电 工业 连接器 规范:GB/T 11918 及IEC/EN 60309 型式:L+NP+E(220V)或3L+NP+E(380V) 最大电流:16A、32A或63A(依据设备规格确定) 1.1. 机柜 电源插座 规范:GB 1002-2008、GB 2099.1-2008及IEC 60884-1 型式:L+NP+E(220V) 最大电流:10A或16A(依据设备规格确定) 3.6. 末端 电源规格 频率:50Hz,≤±3% 电压:单相220V 或三相380V,≤±3% 零地电压差:≤3V 4. 空调系统及空气环境 序号 项目 技术规范 4.1. 冗余设计 机组:分组,组内N+1冗余 供电:独立双路供电,具备ATS自动切换功能 4.2. 气流组织 下送风、上回风,按冷、热通道分离布置 4.3. 空气环境 环境温度:23±1℃ 相对湿度:40%~55%,不结露 测量点: 冷通道,距地板1.0米处 4.4. 新风系统

数据中心机房管理规范

永诚财产保险股份有限公司 数据中心机房管理规范 第一章总则 第一条为规范公司数据中心机房安全管理,保护和支持关键业务的设备免受各种环境威胁,根据《永诚财产保险股份有限公司机房管理办法》,特制定本规范。 第二条数据中心机房工作人员是指系统管理员、数据库管理员、网络管理员、机房管理员等。 第三条数据中心机房共分为3个区域,各区域的主要功能如下: (一)操作间:主要用于信息设备调试、信息资料及小配件等的存放区域。 (二)辅助机房:主要放置UPS、各运营商线路接入、桌面网络设备、桌面电话设备及测试和开发环境设备等的区域。 (三)主机房:是数据中心核心区域。主要放置公司生产环境的网络设备、安全设备、服务器设备、存储设备等的区域。 第四条数据中心机房由信息管理部门负责日常管理。 第二章机房出入 第五条数据中心机房是生产重地,未经许可,任何人员不得出入。 第六条任何人员因工作需要进入机房,均需填写《机房出入登记表》。

第七条获得出入权限的员工门禁卡仅限个人使用,任何情况下不得转借他人。 第八条确因工作需要,需外单位人员进机房进行相关工作时,须填写《机房工作申请表》,并由相关设备管理员确认签字后方可进入机房进行相关工作,工作完毕后由机房管理员签字确认后方可离开。 第九条确因工作需要,需带领非本公司人员进入机房参观,须填写《机房参观申请表》,并经信息管理部负责人同意后由机房工作人员陪同下方可进入机房。 第十条机房管理员应定期对《机房出入登记表》以及《机房工作申请表》进行检查,确保所有进入机房的人员均已授权并通过适当的审批,以确保机房设备的运行。 第三章机房卫生 第十一条机房管理员每月定期对机房进行除尘,保证机房内环境、设备的清洁。 第四章机房设备管理 第十二条机房管理员应使用设备管理软件或电子表格对机房内设备做好登记,以便跟踪设备变化。 第十三条机房工作人员对机房设备的操作必须严格按照操作程序进行。 第十四条非机房工作人员未经允许,不得擅自对机房设备进行操作。

数据中心基础设施管理系统DCIM总体方案

数据中心基础设施管理系统(DCIM) 总体方案

目录 1.平台概述及需求理解 (4) 1.1.项目背景简介 (4) 1.2.项目管理范围 (4) 1.3.项目建设原则 (5) 1.4.项目建设目标 (6) 1.5.解决方案概述 (7) 2.系统架构及实现原理 (11) 2.1.系统架构 (11) 2.1.1.采集层 (12) 2.1.2.处理层 (12) 2.1.3.管理层 (13) 2.1.4.交互展现层 (13) 2.2.系统集成 (14) 2.2.1.第三方集成 (14) 2.2.2.短信猫集成 (15) 2.2.3.短信网关集成 (15) 2.3.开发工具及技术介绍 (16) 2.3.1.自定义流程引擎 (16) 2.3.2.成熟的开发标准技术 (17)

2.3.3.分布式通讯调度 (17) 2.3.4.搜索引擎 (18)

1.平台概述及需求理解 1.1.项目背景简介 伴随着数据中心规模的不断扩大,业务量的逐渐增大,对数据中心的运维管理也变的越来越重要。一旦基础设施系统出现问题,而没有及时地得到妥善解决,常常会给企、事业造成很大的损失。怎样能7x24小时保证设备系统的正常运行,避免各种故障的发生,优化和改进传统的运维模式,提高客户服务的及时性和满意度就显得非常重要。 因此,建设一套数据中心基础设施管理系统势在必行。一个完备的运维管理系统能够提供7x24小时检测基础设施运行状态、各种资源状态的信息。运维管理人员依靠流程管理系统可以及时排除故障避免造成重大损失,控制运维质量提高服务水平。 1.2.项目管理范围 项目内容: 设施故障发现与警报; 记录日常运维日志信息; 设施故障统计; 设施软硬件信息统计; 服务进程管理;

数据中心和网络机房基础设施规划指南

避免数据中心和网络机房基础设施因过度规划造成的资金浪费

典型数据中心和网络机房基础设施最大的、可以避免的成本就是过度规划设计成本。数据中心或 网络机房中的物理和供电基础设施利用率通常在50%-60%左右。未被利用的容量就是一种原本可以避免的投资成本,这还代表着可以避免的维护和能源成本。 本文分为三个部分。首先,介绍与过度规划设计有关的情况和统计数据。接下来,讨论发生这种情况的原因。最后,介绍避免这些成本的新的架构和实现方法。 任何从事信息技术和基础设施产业的人都曾见过未被利用的数据中心空间、功率容量以及数据中心中其他未加利用的基础设施。为了对这种现象进行量化,对讨论中用到的术语进行定义是很重要的。 表1中定义了本文中有关过度规划设计的术语: 建模假设 为了收集并分析过度规划设计的相关数据,施耐德电气对用户进行了调查,并开发了一个简化模型来描述数据中心基础设施容量规划。该模型假设: ?数据中心的设计寿命为 10 年; ?数据中心规划有最终的设计容量要求和估计启动IT 负载要求; ?在数据中心典型生命周期过程中,预期负载从预期的启动负载开始呈线性增长,在预期生命周期一半的时候,达到预期最终容量。 由以上定义的模型得出下面图 1 显示的规划模型。我们假定,它是具有代表性的“一步到位”模式的系统规划模型。 简介有关过度规划设计的情况和统计数据表1 过度规划的相关定义

上图显示了一个典型的规划周期。在传统的设计方案中,供电和冷却设备的安装容量与设计容量相等。换句话说,系统从一开始就完全建成。根据计划,数据中心或网络机房的预期负载将从30% 开始,逐步增加到最终预期负载值。但是,实际启动负载通常小于预期启动负载,并且逐步增长到最终实际负载;最终实际负载有可能大大小于安装容量(注意:由于冗余或用户希望的额定值降低余量,实际安装设备的额定功率容量会大于计划安装容量)。 第143号白皮书《数据中心项目:成长模型》详细讨论了数据中心的规划以及制定一个有效的成长计划战略的关键要素。 实际安装数据收集 为了了解实际安装的情况,施耐德电气从许多客户那里收集了大量数据。这些数据是通过实际安装设备调查和客户访谈获得的。结果发现,预期启动负载通常只有最终设计容量的 30%,预期最终负载只有预期设计容量的80%-90%(留有安全余量)。进一步发现,实际启动负载通常只有最终设计负载的20%,而且实际最终负载通常为设计容量的 60% 左右。图 1 汇总了这些数据。根据设计值,通常的数据中心最终的容量设计比实际需要大 1.5 倍。在刚刚安装或调试过程中,超大规模设计甚至更加显著,通常在 5 倍左右。 与过度规划设计相关的额外成本 与过度规划设计相关的生命周期成本可以分为两个部分:投资成本和运营成本。 图 1 阴影部分指出了与投资相关的额外成本。阴影部分代表平均安装设备中未利用的系统设计容量的部分。额外容量可直接导致额外的投资成本。额外投资成本包括额外供电设备和冷却设备的成本,以及包括布线和管路系统的设计开销和安装成本。 对于一个典型的 100 kW 数据中心,供电和冷却系统有550万人民币(55元人民币/W )左右的资本成本。分析表明,这个投资的 40% 左右被浪费掉了,相当于 220万人民币。在使用早期,这个浪费甚至更大。算进资金周转的时间成本之后,由于过度规划设计导致的损失几乎等于数据中心50%的投资成本。也就是说,单单原始资本的利息几乎就能够满足实际资本一般的需求。 与过度规划设计有关的额外生命周期成本还包括设施运行的开支。这些成本包括维护合同、消耗品和电力。如果设备按制造商的说明进行维护,年维护费用一般是系统成本(投资成本)的10%左右,因此,数据中心或网络机房的生命周期过程中的维护成本几乎等于投资成本。由于过度规划设计会产生未充分利用的设备,而且这些设备必须加以维护,所以会浪费很大一部分的维护成本。以 100 kW 数据中心为例,系统生命周期过程中浪费的成本约为 950万人民币。 0% 20% 40% 60%80%100%120% 012345678910 容量百分比数据中心运行年份 图1 数据中心生命周期过程中的设计容量和预期负载要 求

数据中心机房管理制度规范

机房设备操作及维护管理制度 (试行) 第一条定期检查、整理设备线路,检查硬件运行状态。定期查看软硬件运行日志记录,并做好数据和配置备份。 第二条严禁在设备上随意安装、拆卸硬件或更改设备连线,严禁随意进行硬件安装。 第三条严禁在机房设备上进行试验性质或与工作无关的任何操作。 第四条对机房设备进行位置、配置调整前须提交申请,经信息中心同意后,由专业技术人员进行操作,并做好详细记录。 第五条对重要设备配置更改前,须做好数据备份和备品备件准备工作,并在专用测试服务器上验证通过后进行操作。 第六条机房内服务器不得擅自安装与系统无关的软件;软件安装前须对安装文件进行病毒检测,发现病毒后及时清理,并做好记录;不得擅自在服务器上使用U盘、外存储设备;定期对服务器系统的杀毒软件进行升级;每月对服务器进行安全扫描和漏洞修补,并做好记录。 第七条根据实际情况,实时调整机房内相关安全设备的防范策略,并做好记录。 第八条每季度对机房精密空调室外机组和过滤网进行一次冲洗,每年对精密空调全部电器控制系统和制冷、除湿及进出水道进行一次全面检查。 第九条定期检查机房供配电、消防设备运行状态,确保其正常运行。

(试行) 第一条机房钥匙、门禁卡配发由信息中心管理,不得私自配制或借给他人使用。来访人员因工作需要进入机房须经信息中心同意后由机房管理人员陪同进入,并做好记录。任何人未经许可,严禁在机房内随意触摸设备、拍照或录像。 第二条每日定期检查机房内烟感、温感、声光报警器、安全出口指示标志、气体灭火设备及消防控制线路,确保其运行正常。 第三条机房内严禁存放和使用易燃易爆物品,严禁吸烟和携带使用明火,严禁在消防设备周围堆放杂物。 第四条气体消防系统灭火设备应设专人管理(消防运维单位),任何人不得擅自操作、更改消防系统工作状态、设备位置。每月定期进行钢瓶间设备巡检,发现过期或低压失效的消防设备,应及时进行维护更换。 第五条每季度定期检查机房配电柜、UPS设备、精密空调的运行状况,监测输入输出电流、电压是否正常、有无异常噪音及声、光报警。监控电池间运行环境。 第六条每日定期对机房的设备和线路进行安全检查,发现故障、老化、破损、绝缘不良等不安全因素,必须及时报修,并做好记录备案。 第七条严禁随意对设备断电、更改设备供电线路,严禁随意串接、并接、搭架各种供电线路。 第八条防雷接地系统按国家有关部门的管理要求,每年由防雷中心对机房防雷系统进行一次全面的安全技术检测。

数据中心基础设施管理运行维护流程!

目录 数据中心基础设施管理运行维护流程!.............................。 简介...............................................................。 1.标准操作流程(SOP).............................................。 2.维护操作流程(MOP).............................................。 3.应急操作流程(EOP).............................................。 数据中心基础设施管理运行维护流程! 简介: 数据中心基础设施监控管理系统是对数据中心资产设备,资源设备运行状况的进行全面监控和管理,包含基础设施监控和基础设施管理两大功能模块。通过采集设备、传输设备和管理设备等,DCIM提供一个全面的管理平台,对数据中心资产设备和场地基础设施进行统一监控、科学管理、全方位展示。 数据中心基础设施管理运行维护流程。设备是数据中心基础设施的组成子集,对设备的维护是保障基础设施稳定运行的重要措施。设备维护的工作主要包括维护流程的制定、预防性维护工作的执行、维护档案的管理和故障的处理几方面内容。 运行维护流程是设备维护工作的指导和依据,数据中心管理者首先要保证各维护流程的正确性、完整性和全面性,同时通过反复的培训和演练使运维人员对流程充分熟悉和理解,并在实际工作中严格执行。 运行维护流程通常包括三个主要类别:标准操作流程(SOP)、维护操作流程(MOP)、应急操作流程(EOP)。

数据中心基础设施需求

附件3 机房机柜及配套设施要求 1.整机柜服务器机柜(数量845个,287个20A、558个32A) 说明:863个服务器机柜由百度提供,由乙方负责机柜部署区域的物理条件保障。 ?机柜尺寸:20A机柜,高2100mm、宽600mm、纵深1200mm ,重量小于1200KG;32A 机柜,高2100mm、宽600mm、纵深1200mm,重量小于1000KG; ?供电要求:双路UPS(或高压直流)供电,交流220V;20A机柜平均电流为20A/架,最大峰值电流不超过24A/架;32A机柜平均电流为32A/架,最大峰值电流不超过36A/架(数值均为交流参数,如机房为高压直流,涉及供电参数需换算为直流参数); ?电力配置:每个20A机柜配置双路32A工业连接器,规格IEC60309 32A 220V/2P+E; 每个32A机柜配置双路64A工业连接器,规格IEC60309 63A 220V/2P+E;工业连接器由乙方提供并安装,其中公头提供给百度安装; ?接地需求:机柜架顶设置接地铜排,高度2600mm-3100mm,每个机柜对应接地铜排需要开孔2个,直径为6mm; ?机柜定位:机柜落地位置需提供机600*1200mm的框示,保证立体空间的仅供服务器机柜使用;机房冷通道立柱宽度需满足600mm的倍数,如是架空地板机墩需符合 百度设计要求; ?机柜连接:冷通道设计使用毛刷或软胶作为与机柜顶部的软结合(毛刷及软胶需满足机房防火要求),设计高度为50mm,其中25mm低于机柜高度,即毛刷或软胶高度在2075mm~2125mm; ?机柜运输:园区道路要求能同时容纳2~3辆40英尺标准集装箱货柜车停车等待,满足18米车辆转弯半径需求,地面承重大于40吨货车;具备18米货车直达卸货平台能力,支持货车对接卸货,如是地面卸货,由运营商提供人工驾驶叉车进行驳运(承载能力>3000KG);从卸货平台到机柜部署区域通道需要坡度小于8度,所有通道无 门槛,如是非耐磨地面需提供保护材料;24小时货梯,轿厢尺寸需要大于高2400mm、深2000mm、门宽800mm、承重大于2T, 电梯故障时及时维修,避免影响机柜运输; 运输全程需要满足机柜竖向及侧向承重; ?机柜拆装:卸货区域附近需要配置机柜拆装区(从卸货区到拆装区及机房全程需要防雨),并在拆装区域附近配置6个IEC60309 32A 220V/2P+E、6个IEC60309 63A 220V/2P+E测试工业连接器用于机柜测试。 2.网核心机柜(10个) 说明:网络核心机柜由百度提供,由乙方负责该机柜的整体承重底座制作及机柜安 装。 ?数量:10个(2个数据中心核心,8个网核心) ?目前使用的机柜尺寸:高2258mm、宽1017mm、纵深1200mm; ?供电要求:每个机柜要求由有来自两组不同的UPS组进行供电;单机柜最大功率 13.75KW;

数据中心机房管理制度

XX、有限公司数据中心机房管理制度 为安全、有效管理IDC机房,保障网络系统安全的应用、高效运行,特制定本规章制度,请遵照执行。 一、机房管理 1、计算机房要保持清洁、卫生,并由专人7*24负责管理和维护(包括温度、湿度、电力系统、网络设备等)。 2、严禁非机房工作人员进入机房,特殊情况需经中心值班负责人批准,并认真填写登记表后方可进入。进入机房人员应遵守机房管理制度,更换专用工作鞋;机房工作人员必须穿着工作服。非机房工作人员未经许可不得擅自上机操作和对运行设备及各种配置进行更改。 3、进入机房人员不得携带任何易燃、易爆、腐蚀性、强电磁、辐射性、流体物质等对设备正常运行构成威胁的物品。 4、建立机房登记制度,对本地局域网络、广域网的运行,建立档案。未发生故障或故障隐患时当班人员不可对中继、光纤、网线及各种网络、系统设备进行任何调试;若有故障应对所发生的故障、处理过程和结果等做好详细登记。 5、路由器、交换机和服务器以及通信设备是网络的关键设备,须放置计算机机房内,不得自行配置或更换,更不能挪作它用 6、机房工作人员应做好网络安全工作,服务器的各种帐号严格保密。并对各类操作密码定期更改,超级用户密码由系统管理员掌握。系统管理人员随时监控中心设备运行状况,发现异常情况应立即按照预案规程进行操作,并及时上报和详细记录。 7、机房工作人员应恪守保密制度,不得擅自泄露中心各种信息资料与数据。 8、做好操作系统的补丁修正工作。 9、网络、系统管理人员统一管理计算机及其相关设备,完整保存

计算机及其相关设备的驱动程序、保修卡及重要随机文件。 10、计算机及其相关设备的报废需经过管理部门或专职人员鉴定,确认不符合使用要求后方可申请报废。 11、不定期对机房内设置的消防器材、监控设备进行检查,以保证其有效性。 12、制定数据管理制度。对数据实施严格的安全与保密管理,防止系统数据的非法生成、变更、泄露、丢失及破坏。当班人员应在数据库的系统认证、系统授权、系统完整性、补丁和修正程序方面实时修改。 二、操作管理 1、中心机房的数据实行双人作业制度;操作人员遵守值班制度,不得擅自脱岗。 2、值班系统管理员必须认真、如实、详细填写《系统管理员机房操作日志》等各种登记簿,以备后查。 3、严格按照每日预制操作流程进行操作,对新上业务及特殊情况需要变更流程的应事先进行详细安排并书面报负责人批准签字后方可执行;所有操作变更必须有存档记录。 4、每日对机房环境进行清洁,以保持机房整洁;每周进行一次大清扫,对机器设备吸尘清洁。 5、值班人员必须密切监视中心设备运行状况以及各网点运行情况,确保安全、高效运行。 6、严格按规章制度要求做好各种数据、文件的备份工作。中心服务器数据库要定期进行双备份,并严格实行异地存放、专人保管。所有重要文档定期整理装订,专人保管,以备后查。 三、运行管理 1、中心机房和开发调试机房隔离分设。未经负责人批准,不得在中心机房设备上编写、修改、更换各类软件系统及更改设备参数配置。 2、各类软件系统的维护、增删、配置的更改,各类硬件设备的添加、更换必需经负责人书面批准后方可进行;必须按规定进行详细登记和记录,对各类软件、现场资料、档案整理存档。

现代化数据中心的建设与设计

现代化数据中心的建设与设计 数据中心的基础设施是计算机机房建设的很重要的环节。计算机机房工程不仅 集建筑、电气、安装、网络等多个专业技术于一体,更需要丰富的工程实施和 管理经验。计算机机房设计与施工的优劣直接关系到机房内计算机系统是否能 稳定可靠地运行,是否能保证各类信息通讯畅通无阻。由于计算机机房的环境 必须满足计算机等各种电子设备和工作人员对温度、湿度、洁净度、电磁场强度、噪音干扰、安全保安、防漏、电源质量、振动、防雷和接地等要求。因此,一个合格的现代化计算机机房,应该是一个安全可靠、舒适实用、节能高效和 具有可扩充性的具有绿色理念的现代化机房。一个现代化的数据中心建设一般 应包括以下几个方面:装饰装修系统工程、供配电系统工程、空调和新风系统 工程、建筑智能化系统工程、防雷系统工程以及消防系统工程等。而每个系统 工程又由若干个子系统构成,每个子系统又由若干个单项工程组成。正是由这 些不可再分的单项工程共同组成了一个复杂的数据中心的有机体。 1 装饰装修系统 1.1 设计理念 机房内的装饰设计从风格上一般力求简洁、明快;从使用功能上吊顶和地板可拆卸以便维护,甚至有的用户要求墙面也要做到可拆卸;从功能分区上要遵循机房使用的一些基本需求,如更衣室、缓冲间、主机房、维修间、备品备件室、监控中心、参观走廊等都是必备的功能划分;从平面布局上力求合理和实用;从 层高的考虑上不可一味追求大空间,这样会加大空调的配置,也不能太过低矮 会造成压抑等不适感,同时过矮的情况下如果摆放机柜过密还会影响机柜操作 区域的照度;层高一般宜在2400mm左右,不宜高于3000mm,不宜低于2200mm. 1.2 设计要点 (1)隔断的设计 为了保证机房内不出现内柱,机房建筑常采用大跨度结构。针对计算机系 统的不同设备对环境的不同要求,便于空调控制、灰尘控制、噪音控制和机房 管理,往往采用玻璃隔断墙将大的机房空间分隔成较小的功能区域。机房外门 窗多采用防火防盗门窗,机房内门窗一般采用无框大玻璃门,这样既保证机房 的安全,又保证机房有通透、明亮的效果。 (2)地面设计

数据中心信息安全管理及管控要求正式版

Guide operators to deal with the process of things, and require them to be familiar with the details of safety technology and be able to complete things after special training.数据中心信息安全管理及管控要求正式版

数据中心信息安全管理及管控要求正 式版 下载提示:此操作规程资料适用于指导操作人员处理某件事情的流程和主要的行动方向,并要求参加施工的人员,熟知本工种的安全技术细节和经过专门训练,合格的情况下完成列表中的每个操作事项。文档可以直接使用,也可根据实际需要修订后使用。 随着在世界范围内,信息化水平的不断发展,数据中心的信息安全逐渐成为人们关注的焦点,世界范围内的各个机构、组织、个人都在探寻如何保障信息安全的问题。英国、美国、挪威、瑞典、芬兰、澳大利亚等国均制定了有关信息安全的本国标准,国际标准化组织(ISO)也发布了ISO17799、ISO13335、ISO15408等与信息安全相关的国际标准及技术报告。目前,在信息安全管理方面,英国标准 ISO27000:2005已经成为世界上应用最广泛与典型的信息安全管理标准,它是在

BSI/DISC的BDD/2信息安全管理委员会指导下制定完成。 ISO27001标准于1993年由英国贸易工业部立项,于1995年英国首次出版BS 7799-1:1995《信息安全管理实施细则》,它提供了一套综合的、由信息安全最佳惯例组成的实施规则,其目的是作为确定工商业信息系统在大多数情况所需控制范围的唯一参考基准,并且适用于大、中、小组织。1998年英国公布标准的第二部分《信息安全管理体系规范》,它规定信息安全管理体系要求与信息安全控制要求,它是一个组织的全面或部分信息安全管理体系评估的基础,它可以作为一个正式认证方案的根据。ISO27000-1与ISO27000-2经

大数据中心运维操作实用标准及流程

数据中心运维操作标准及流程

郑州向心力通信技术股份有限公司 二零一八年 1 机房运维管理前期准备

1.1 管理目标 机房基础设施运维团队应与业主管理层、IT部门、相关业务部门共同讨论确定运维管理目标。制定目标时,应综合考虑机房所支持的应用的可用性要求、机房基础设施设施的等级、容量等因素。目标宜包括可用性目标、能效目标、可以用服务等级协议(SLA)的形式呈现。不同应用的可用性目标的机房,可设定不同等级的机房基础设施的运维管理目标。 1.2 参与数据中心建设过程 机房运维团队应充分了解自己将要管理的场地基础设施。对于新建机房,应尽早参与机房基础设施的建设过程,以便将运维阶段的需求在规划、设计、建造、安装和调试等过程中得到充分的考虑;同时为后期做好运维工作打下基础。 1.2.1 应参与规划设计 机房的规划设计是一个谨慎和严谨的过程,需要所有参与机房建设的相关方共同完成,才能确保规划和设计的有效性、实用性等要求。其中,基础设施运维团队应提出运维要求,从运维经验、实际运维难度、提高运维可易性等方面对规划和设计过程进行配合。 1.2.2 应参与相关供应商遴选 机房基础设施运维团队应参与机房基础设施设备供应商选择的全过程,及时地了解各种产品及服务的品牌、型号、规格等关键参数,使之更能满足运维的要求。并就在安装、调试过程中的注意事项等提出建议,还需要对后续的设备保修等服务提出要求。

1.2.3 应参与建造管理 机房的基础设施运维团队应积极参与机房基础设施的建造工作,并协助做好建设项目的项目管理工作,着重关注工程建造中如材料的使用、工序、建造过程等工作,重点关注隐蔽工程的安装工艺和质量。 机房基础设施运维团队应充分了解施工过程中的工艺。对于新建数据中心,从施工质量和日后运维方便性出发,尽早发现施工过程的问题,及时纠正,方便日后运维和节省日后整改成本。 1.3 测试验证 机房基础设施投产前的测试验证是确保机房基础设施满足设计要求和运行要求的关键环节。 1.3.1 时间和预算 机房的业主应设立测试验证专项预算,预算应包括外部测试验证服务提供商的相关费用,以及在测试验证阶段产生的电费、水费、油费等相关费用。应制定测试验证的工期规划,以更准确地预测机房基础设施交付投产的日期。 1.3.2 测试验证参与方 项目建设管理部门可作为测试验证工作的主体责任单位;运维管理部门可作为测试验证工作的主体审核单位;第三方测试服务商可作为测试验证的实施单位及整体组织工作的协调单位。但运维管理部门应要求测试服务商预先提供测试方案,在运维管理部门审核后方可进行。机房基础设施运维团队可参与测试验证工作,在此过程中熟悉设施和设备,可建立相关运维技术文档库,为后期的运维工作做好准备。

IDC运维标准服务内容

数据中心基础设施基本运维管理服务内容与标准 1.服务目的 为甲方提供包括日常运维管理服务、定期维护管理服务、应急演练管理服务和紧急响应服务在内的数据中心基础设施基本运维管理服务,以保障甲方数据中心供配电、空调暖通、安防、消防及环境动力监控系统正常运行。乙方提供的技术服务满足本合同附件的要求。 2.服务时间 乙方为甲方提供数据中心基础设施基本运维管理服务时间为7x24小时,各项服务的响应时间应满足双方在服务水平协议中的要求。 3.服务团队 乙方应根据甲方数据中心各模组投入使用的时间计划相应配置足够的专业技术人员,具体如下表:

4.服务内容 乙方应组织数据中心基础设施运维管理团队,为甲方数据中心提供包括7x24小时值班监控、日常巡检、预防性维护管理、能耗分析与运行优化、资产(配置)管理、容量管理、供应商管理、变更管理、应急预案及演练管理、故障处理及应急响应在内的基本运维管理服务,具体如下: 4.17x24小时值班监控 乙方应组织其专业技术人员在集中监控中心利用数据中心环境动力监控系统对供配电系统、空调暖通系统、数据中心温湿度环境、漏水监测和CCTV视频监控等进行7x24小时不间断值班监控,保障甲方数据中心运行正常。 4.2日常巡检 乙方应根据其专业能力和运维经验并结合项目实际情况,合理设计日常巡检线路和巡检内容,日常巡检内容如下: 4.2.1供配电系统巡检内容 4.2.1.1高压开关柜 (1)抄录高压开关柜计量表数值 (2)巡检高压开关柜断路器状态

(4)巡检高压开关柜继电保护装置 (5)巡检高压开关柜的柜体设备 (6)巡检高压开关柜微机综保设备4.2.1.2变压器 (1)抄录变压器计量表数值 (2)巡检变压器环境温度 (3)巡检变压器散热设备 (4)巡检变压器温度 (5)巡检变压器运行状态 (6)巡检变压器冷却系统设备 (7)巡检变压器固定件、紧固件 (8)巡检变压器外观 (9)巡检变压器防护外壳 (10)巡检变压器控制面板 4.2.1.3低压开关柜 (1)抄录低压开关柜计量表数值 (2)巡检低压开关柜继电保护装置

数据中心基础设施监控管理系统(DCIM)-技术方案

数据中心 基础设施管理系统(DCIM)技术方案

目录 第1章项目技术方案 (5) 1.1.项目概述 (5) 1.2.技术标准 (5) 1.3.系统设计 (6) 1.3.1.系统描述 (6) 1.3.2.项目范围 (6) 1.3.3.系统架构 (7) 1.3.4.串口设计 (10) 1.3.5.双总线(A/B路)设计 (12) 1.3.6.系统性能 (13) 1.4.基础设施监控实现 (14) 1.4.1.动环监控实现 (14) 1.4.1.1.变压器监测 (14) 1.4.1.2.发电机监测 (15) 1.4.1.3.列头柜监测 (15) 1.4.1.4.电量仪监测 (16) 1.4.1.5.UPS监测 (17) 1.4.1.6.EPS监测 (18) 1.4.1.7.ATS监测 (19) 1.4.1.8.蓄电池监测 (19) 1.4.1.9.氢气监测 (20)

1.4.1.11.新风机监控 (21) 1.4.1.12.温湿度监测 (22) 1.4.1.13.机柜温度监测 (23) 1.4.1.14.漏水监测 (23) 1.4.1.15.入侵监测 (24) 1.4.2.第三方系统集成 (25) 1.4.2.1.系统集成架构描述 (25) 1.4.2.2.视频系统集成实现 (26) 1.4.2.3.门禁系统集成实现 (26) 1.4.2.4.BA系统集成实现 (27) 1.4.2.5.消防系统集成实现 (27) 1.4.2.6.极早期探测系统集成实现 (28) 1.5.基础设施管理平台功能 (28) 1.5.1.系统界面 (28) 1.5.2.冷通道管理 (34) 1.5.3.告警管理 (39) 1.5.4.报表管理 (42) 1.5.5.联动管理 (45) 1.5.6.远程管理 (46) 1.5.7.日志管理 (46) 1.5.8.数据管理 (46)

中国数据中心机房等级分类及标准

中国数据中心机房等级分类及标准数据中心(DataCenter)通常是指在一个物理空间内实现对数据信息的集中处理、存储、传输、交换、管理,一般含有计算机设备、服务器设备、网络设备、通讯设备、存储设备等关键设备。数据中心的基础设施(DataCenterInfrastructure)是指为确保数据中心的关 A级为容错型,在系统需要运行期间,其场地设备不应因操作失误、设备故障、外电源中断、维护和检修而导致电子信息系统运行中断。A级是最高级别,主要是指涉及国计民生的机房设计。其电子信息系统运行中断将造成重大的经济损或公共场所秩序严重混乱。像国家气象台;国家级信息中心、计算中心;重要的军事指挥部门;大中

城市的机场、广播电台、电视台、应急指挥中心;银行总行等属A级机房。 B级为冗余型,在系统需要运行期间,其场地设备在冗余能力范围内,不应因设备故障而导致电子信息系统运行中断。B级定义为电子信息系统运行中断将造成一定的社会秩序混乱和一定的经济损失 》 ,它们是数据中心建设定位、功能指标、设计技术、施工工艺、验收标准等的具体技术要求与体现。 在《电子计算机机房设计规范》中,涵盖了A、B、C三级机房设计要素中的各种要求和规则,如位置选择、环境要求、建筑结构、空气条件、电气技术、供电电源质量要求、机房布线、环境和设备监控

系统、安全防范系统、消防等。比如,在环境要求项下的主机房开机温度标准中,A级和B级机房为23+/-1摄氏度,C级则为18~28摄氏度。 数据中心机房等级分类及标准,为国内数据中心机房建设提供了参考指标和方向。想要进行机房建设的企业或机构都应该充分参考,

大数据中心信息数据管理制度

大数据数据中心信息数据管理制度 为进一步加强和规范数据管理,保障数据安全,提高开放共享水平,支撑政府治理能力现代化,制定本制度。 一、数据管理遵循分级管理、安全可控、充分利用的原则,明确数据的采集生产、加工整理、开放共享和管理使用等活动的责任主体,加强能力建设,促进开放共享。 二、数据采集生产、使用、管理活动应当遵守有关法律法规及规章,不得利用科学数据从事危害国家安全、社会公共利益和他人合法权益的活动。 三、贯彻落实国家数据管理政策;建立健全管理政策和制度;指导相关单位加强和规范数据管理。 四、引导督促数据产生者要按照相关标准规范组织开展数据采集生产和加工整理,形成便于使用的数据库,保证数据的准确性和可用性。 五、引导督促相关单位要对数据进行分级分类,明确数据的密级和保密期限、开放条件、开放对象和审核程序等,按要求公布数据开放目录,通过在线下载、系统共享或定制服务等方式向社会开放共享。 六、对于政府决策、公共安全、国防建设、环境保护、防灾减灾、公益性科学研究等需要使用数据的,应当无偿提供;确需收费的,应按照规定程序和非营利原则制定合理的

收费标准,向社会公布并接受监督。对于因经营性活动需要使用数据的,当事人双方应当签订有偿服务合同,明确双方的权利和义务。法律法规有特殊规定的,遵从其规定。 七、涉及国家秘密、国家安全、社会公共利益、商业秘密和个人隐私的数据,不得对外开放共享;确需对外开放的,要对利用目的、用户资质、保密条件等进行审查,并严格控制知悉范围。 八、涉及国家秘密的数据按照国家有关保密规定执行。建立健全涉及国家秘密的数据管理与使用制度,对制作、审核、登记、拷贝、传输、销毁等环节进行严格管理。 九、按照网络安全管理规定,建立网络安全保障体系,采用安全可靠的产品和服务,完善数据管控、属性管理、身份识别、行为追溯、黑名单等管理措施,健全防篡改、防泄露、防攻击、防病毒等安全防护体系。 十、建立应急管理和容灾备份机制,按照要求建立应急管理系统,对重要的数据进行异地备份。

数据中心基础设施可视化运维管理

数据中心基础设施可视化运维管理 谁说高大上的机房不能炫!设备环境团队联合运营平台研发、网络、系统三、系统二等团队,历经一年的时间、7轮次需求细化讨论、11次版本更新,精雕细琢、倾尽洪荒之力打造了中国银行数据中心基础设施可视化平台!这是一个集才智美貌于一身,融合酷炫、可视等元素,高效、创新、高颜值的基础设施运维平台。平台包括两大功能模块: 一、基础设施运维数据模块 为了整合基础设施运维大数据资源,设备环境团队以严谨细致的态度,自主开发了基础设施运维数据模块,将分散的、手工维护的硬件设备、应用部署、机房资源和综合布线等各项基础环境资源的运维信息进行整合,累计整理各类数据10万多条,近50万字段,初步建成了IT设备生命周期管理体系。 二、基础设施可视化模块 在全面、准确的运维数据的基础上,基础设施可视化模块解决了以前需要多个系统、多张excel表格或者报表进行耗时耗力的分析和比对才能获取的信息,用三维的形式在一张视图内呈现,改变了传统运维信息展现的方式,其所带来的运维效率的大幅提升、故障的快速准确定位等,已经不是简单的炫所能表达的。(一)机房环境可视化 以黑山扈机房实际场景为原型,利用三维仿真技术,对机房内三百多种型号的设备设施逐一采集信息、模型建模,从细节入手,设备模型精确到端口级,实现了机房内三千多个机柜级设备和四千多个机架级设备的精确建模,构建了多视角、多维度分层呈现的虚拟现实环境。 (二)资产管理可视化 资产管理可视化可在机房三维场景中直接查询并精确定位设备设施,两万多条资产数据自动更新,点一下鼠标,位置、外观、型号、系统应用、容量、端口使用等设备信息即时呈现,精准、详细。 (三)容量管理可视化 机房资源的容量管理一直是个难题,往往需要兼顾空间、配电、硬件资源等多维度因素。现在可以在可视化场景中将环境、资源、配电、设备资源、PUE等信息多维度集中展现,两万五千余条实时采集数据,基础资源使用情况一目了然,再也不用只对着excel纸上谈兵了。 (四)运维管理可视化 联动一体化监控,硬件高等级事件自动定位至相关设备并显着提示,点击即可快速获取设备资产、运维(IP、系统、维护变更信息等)、配线连接等信息,有效提升故障定位、预判及处理效率。

数据中心基础设施运行维护管理规范

数据中心基础设施运行维护管理规范 征求意见稿

数据中心基础设施运行维护管理规范编写原则: 1、每个小节名称不可和章节名称相同; 2、正文条文中不得有目的的描述,如需可在条文说明中描述; 3、正文中不得采用形容词; 4、每个条文应注明主语,语句中不可出现“包括但不限于”这样的 不规范用语; 5、正文中凡是“例如”的部分应体现在条文说明中。

目录 第一章总则 第二章符号和术语 第三章一般规定 第四章运维流程 第五章组织架构及人员管理 第六章文件管理 第七章日常维护 第八章应急管理 第九章环境健康和安全 第十章数据中心一体化运维管理第十一章质量管理的监督与检查第十二章其他

第一章总则 1.1、范围 本标准给出国网数据中心基础设施运维管理的指南,包括总则、符号和术语、一般规定、运维流程、组织架构及人员管理、文件管理、日常维护、应急管理、环境健康和安全、数据中心一体化运维管理、质量管理的监督与检查、成本管理等。 本标准可为国网数据中心管理者提供基础设施运维管理系统性指导,也可作为用户或第三方评价国家电网数据中心基础设施运维管理水平的参考。 1.2、规范性引用文件 下列文件对于本标准的应用是必不可少的。凡是注明日期的引用文件,仅注日期的版本适用于本标准。凡是不注明日期的引用文件,其最新版本(包括所有的修改单)适用于本标准。 GB/T 33136 信息技术服务数据中心服务能力成熟度模型 GB/T 51314 数据中心基础设施运行维护标准 GB/T 2887 计算机场地通用规范 GB/T 26572 电器电子产品有害物质限制使用管理办法 GB 26860 电力安全工作规程发电厂和变电站电气部分 GB 50174 数据中心设计规范 DL 408 电业安全工作规程 AQ7004-2007 制冷空调作业安全技术规范 GB/T24353风险管理原则与实施指南

数据中心安全管理制度

益阳市紧急医疗救援指挥中心 数据中心安全管理制度 为保证数据中心中的设备及数据的安全,中心办公室设立以下管理规定,所有授权进出数据中心的人员必须严格遵守此规定。 一、硬件安全 1. 数据中心机房只有授权人员才可以进入,其他公司技术和管理人员获得邀请并登记后也可以进入数据中心。 2. 离开数据中心前应确保关闭机柜门、整理好有关设备、离开时必须关闭数据中心大门。 3. 进入数据中心操作时应穿防静电鞋套,保持服装整洁,以防带入灰尘。 4. 进入数据中心后应关闭大门,以免灰尘飘入数据中心。 5. 数据中心内禁止饮食、吸烟,禁止带入不相关的东西。 6. 数据中心专用工具及软件应由系统管理员统一注册、并统一保管,外借工具应登记(借出、借入方均需签名)并应在两工作天内归还,借出者负责跟进收回工具。 7. 系统管理员必须定期检查所有设备是否工作正常,包括检查网络是否畅通、散热设备是否运转、设备是否过热及服务器状态是否良好等等,一般可定一星期检查一次。 二、软件安全 1. 所有数据中心设备(包括服务器、路由器、交换机及精密空调等等)均需设置密码进行保护。 2. 密码最少八位长度,必须由数据中心管理人员一人或多人完全掌握。 核心数据密码不宜写在纸上或文件中,并要求至少三个月更新一次。 3. 控制系统操作人员权限,数据库及应用系统超级管理员权限只能赋予数据中心内部人员,开发运维商只能赋予普通用户权限,开发运维商如需登录数据库或应用系统时须在数据中心内部人员的陪同下进行。 4. 更新/维护设备或软件时,必须至少提前一天通知受影响用户,紧急情况

时应尽量将影响程度降至最低。 5. 按需求安装软件时,必须在其它机器中测试并验证可用后,才可以在服务器中安装。 6. 服务器中软件均为正版软件,禁止在服务器中安装没有授权证(License)的软件,不应在服务器中安装测试版软件。

数据中心基础设施管理

数据中心基础设施管理 骆洪德 【摘要】本论文从理论角度,结合实践经验阐述了数据中心基础设施管理的基本概念、水冷精密空调系统的构成、工作原理及节能运行、数据中心能耗指标及节能措施等。 【关键词】数据中心基础设施水冷空调系统数据中心能源使用效率PUE 一、数据中心基础设施管理的概念 数据中心基础设施是除了IT设备(计算机、服务器、网络设备等)之外的所有数据机房辅助设施,包括暖通系统、电气系统、消防系统、安防系统及弱电系统等。 暖通系统包括为数据机房、变配电室、消防控制室、管理人员办公室及公共环境(走廊等)进行空气调节的系统,空调调节包括温度、湿度控制(制热、制冷、加湿、除湿等)及通风(送新风、排风)等。 电气系统包括变电系统、配电系统(配电箱、配电柜、列头柜及电缆、母排等)、柴油发电机组、UPS系统等。 消防系统包括灭火系统(气体灭火系统、水喷雾系统、水喷淋系统等)、报警系统(烟感探测器、温感探测器、报警控制设备等)、空气采样系统等。 安防系统包括视频监控系统、周界报警系统、出入口管理系统(门禁系统、停车管理系统等)、巡更系统等。 弱电系统包括楼宇自动控制系统(包括对水系统、通风系统、柴油输送系统、报警联动系统等)、电力监控系统、环境监控系统等。 数据中心基础设施管理是指对上述各系统的统一、系统地管理,尤其重要的是对暖通系统、电气系统的管理。 数据中心基础设施管理的主要目标包括: 1.使数据中心安全、稳定地运行; 2.延长数据中心基础设施设备的使用寿命; 3.节能。

二、暖通系统的运行管理 2.1大型数据中心节能水冷精密空调系统 新一代大型数据中心一般首选离心式水冷空调系统,其特点是制冷量大并且整个系统的能效比高。 离心式制冷压缩机的构造和工作原理与离心式鼓风机极为相似。它的工作原理与传统的活塞式压缩机有根本的区别,它不是利用汽缸容积减小的方式来提高气体的压力,而是依靠动能的变化来提高气体压力。离心式压缩机具有带叶片的工作轮,当工作轮转动时,叶片就带动气体运动或者使气体得到动能,然后使部分动能转化为压力能从而提高气体的压力。这种压缩机由于它工作时不断地将制冷剂蒸汽吸入,又不断地沿半径方向被甩出去,所以称这种型式的压缩机为离心式压缩机。压缩机工作时制冷剂蒸汽由吸汽口轴向进入吸汽室,并在吸汽室的导流作用引导由蒸发器(或中间冷却器)来的制冷剂蒸汽均匀地进入高速旋转的工作轮(工作轮也称叶轮,它是离心式制冷压缩机的重要部件,因为只有通过工作轮才能将能量传给气体)。气体在叶片作用下,一边跟着工作轮作高速旋转,一边由于受离心力的作用,在叶片槽道中作扩压流动,从而使气体的压力和速度都得到提高。由工作轮出来的气体再进入截面积逐渐扩大的扩压器(因为气体从工作轮流出时具有较高的流速,扩压器便把动能部分地转化为压力能,从而提高气体的压力)。气体流过扩压器时速度减小,而压力则进一步提高。经扩压器后气体汇集到蜗壳中,再经排气口引导至中间冷却器或冷凝器中。

相关文档
最新文档