IDC中心机房预防措施与应急预案

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

IDC 机房维保预防措施及应急预案

IDC 数据中心机房的安全无疑是整个计算机信息系统安全的前提,如果数据中心机房存在这样那样的不安全因素,从而导致发生数据中心机房事故,则整个信息系统的安全也就不可能实现。

随着网络信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务。为确保系统及机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”

的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、

反应迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度

减轻到最低。

1、维保预防措施

1、建立健全机房维保技术人员管理制度

1.1在正常工作日内,信息技术人员负责对机房进行监控,主要职责是:

巡视网络设备及系统的运行情况,发生异常情况及时处理,消除故障隐患。

1.2 周末、节假日及重大会议期间技术人员轮流值班,负责处理有关异常

情况。

2、应提高对机房可靠性、可用性、安全性等方面的认识,既要重视信息系

统安全,又要重视机房的运行维护管理,重视对计算机硬件、软件及网络设备的维护。要树立大局意识和忧患意识,对机房设施安全的重要性给予足够的重视。

3、应重点加强管理制度的执行。管理制度包括预防维护流程和紧急情况处

理预案两个方面。要制定相应的管理制度,包括机房管理岗位制度、机房操作规程等,以明确岗位职责。为应对机房中可能会发生的紧急情况,如火灾、断电、

数据丢失、设备失灵等,应按各种紧急情况分列处置措施,还要对预案进行演练。

4、应不断提高机房管理人员的技术水平。机房设施非常复杂,涉及很多专

业和系统,维护人员只有通过不断的总结以往出现的各种问题进行后续学习和培训,提高技术水平,才能避免更多的相同的问题及异常情况甚至事故的发生。

5.应加强供配电、照明等电源子系统的监测。同时应重点对温度、湿度、灰尘、有害气体等进行评估和监测。还要加强静电防护、干扰源分析及保护、雷击

防护、电磁干扰、振动控制,防火、防水等工作。

5、应加强对进入机房人员的管理。工作人员行为、素质等因素均可能

对机房安全造成影响,因此,除管理制度约束外,门禁和视频监视等物理安全策略均可有效提高机房安全水平。

7、应定期对机房设施进行安全评估。最好每年聘请第三方机构进行安

全评估,专业评估机构拥有专家力量,能够比较安全地对所有的设备进行操作,

不会因为误操作引起机房故障。

8、机房内严格采取防雷、防火、防尘、防静电等措施以及机房24 小时监控等措施。

9、认真做好数据备份工作,定期做一次数据库完全备份,每月检查服

务器运行和备份情况。

10、对机房的主要网络设备(路由器、主干交换机等)进行工作时间内

全程监控,发现异常情况应及时进行处理,确保整个网络的正常运行。

2、应急处置措施

2.1机房漏水应急预案

(1)发生机房漏水时,第一目击者应立即通知运维服务小组,并及时报告

监控系统突发故障应急领导小组。

(2)若空调系统出现渗漏水,运维服务小组负责人应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,同时启动备用空调,必要情况

下可临时用备用空调对服务器进行降温。

(3)若为墙体或机房门渗漏水,运维服务小组负责人应立即采取有效措施

确保机房安全,及时清除积水,维修墙体或门窗,消除渗漏水隐患。

2.2 设备发生被盗或人为损害事件应急预案

(1)发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告系

统突发故障应急领导小组,同时保护好现场。

(2)系统突发故障应急领导小组接报后,通知用户保卫部门、相关领导,

一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。

(3)事发单位和当事人应当积极配合公安部门进行调查,并将有关情况向系

统突发故障应急领导小组汇报。

(4)系统突发故障应急领导小组安排运维服务小组、事发单位及时恢复系统正常运行,并对事件进行调查。运维服务小组和事发单位应在调查结束后一日内书面

报告系统突发故障应急领导小组。事态或后果严重的,应向相关领导汇报。

2.3机房长时间停电应急预案

(1)定期检查机房供电设备的运行状况和电路线缆器材情况,当发生下列

突发事件时,按照以下方案进行处置:

(2)当机房发生市电供电突然停电或是电源异常时。首先应和后勤部门

联系确认正常停电以及预计停电时间。检查不间断电源的电池可供电时间,确保

设备正常运行,如遇到突然断电,应及时将空调等不在 UPS电源供电范围内的设

备及时断电,预防突然来电时瞬间电流过大导致设备损坏等现象。

(3)当确定停电时间超出机房 UPS承载范围后,首先确定停电的范围以及

受影响的设备范围。并及时通知各部门做好停电应急准备。然后通知机房电源

维护人和设备的负责人到达现场,做好各设备的电源停电准备。在 UPS供电电量

仅剩10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复。

(4)当确定停电原因是在本身供电系统范围内,立即汇报给负责领导,并

及时联系相关维护人员达到现场检修。对于恢复时间无法预计的,要通知后勤部

门做好柴油机发电及移动电源车供电准备

(5)恢复供电后,严格按照操作程序逐步恢复机房设备和 UPS的供电,以防

瞬间电流过大造成设备损坏。

2.4通信网络故障应急预案

(1)发生通信线路中断、路由故障、流量异常、域名系统故障后,操作员应

及时通知本单位信息系统管理员,经初步判断后及时上报运维服务小组和系统突

发故障应急领导小组。

(2)运维服务小组接报告后,应及时查清通信网络故障位置,隔离故障区

相关文档
最新文档