计算机机房应急预案
机房应急预案

机房应急预案一、应急预案目的。
为了确保机房设备和数据的安全,及时有效地应对各种突发事件,保障机房运行的连续性和稳定性,特制定机房应急预案。
二、应急预案内容。
1. 应急响应组成员及联系方式。
应急响应组成员包括机房管理员、网络工程师、系统管理员等相关人员,每位成员需提供24小时联系方式。
2. 应急预案流程。
(1)突发事件发生后,应急响应组成员立即启动应急预案,第一时间进行紧急处置。
(2)应急响应组成员根据事件的性质和严重程度,采取相应的措施,包括隔离受影响的设备、启动备用设备、通知相关部门等。
(3)应急响应组成员在处理突发事件的过程中,需及时记录相关信息和处理过程,以备日后追溯和总结。
3. 应急预案内容。
(1)火灾。
在发生火灾时,应急响应组成员需立即通知消防部门并采取紧急疏散措施,确保人员安全。
同时,尽量减少设备和数据的损失。
(2)电力故障。
在发生电力故障时,应急响应组成员需立即启动备用电源,保障机房设备的正常运行。
同时,及时通知电力部门进行故障排查和修复。
(3)网络故障。
在发生网络故障时,应急响应组成员需立即进行故障定位和修复,确保网络的正常运行。
同时,通知相关部门进行协助和支持。
4. 应急预案演练。
定期组织应急预案演练,提高应急响应组成员的应急处理能力,确保在突发事件发生时能够迅速有效地应对。
三、应急预案总结。
在每次突发事件发生后,应急响应组成员需及时总结应急处理过程和效果,发现问题并及时改进,不断完善应急预案。
以上为机房应急预案,希望能够确保机房设备和数据的安全,保障机房运行的连续性和稳定性。
机房安全突发事件应急预案

一、编制目的为保障机房安全,提高机房突发事件应对能力,降低突发事件对生产、生活的影响,特制定本预案。
二、适用范围本预案适用于我公司所有机房,包括数据中心、服务器机房、网络设备机房等。
三、组织机构及职责1. 机房安全突发事件应急指挥部(1)总指挥:公司总经理(2)副总指挥:公司副总经理、各部门负责人(3)指挥部办公室:负责应急工作的组织、协调、调度、信息报送等工作。
2. 机房安全突发事件应急小组(1)组长:公司副总经理(2)副组长:各部门负责人(3)成员:各部门相关人员四、突发事件分类及响应措施1. 突发事件分类(1)火灾:机房内部及周边发生火灾。
(2)电力故障:机房供电系统发生故障。
(3)网络故障:机房网络设备发生故障。
(4)设备故障:机房服务器、存储设备等发生故障。
(5)自然灾害:地震、洪水、台风等自然灾害。
2. 响应措施(1)火灾1)立即启动火灾报警系统,通知相关人员。
2)组织人员迅速撤离,确保人员安全。
3)启动灭火设备,进行初期灭火。
4)报告消防部门,等待救援。
(2)电力故障1)立即通知电力部门,进行故障排查。
2)启动备用电源,确保机房设备正常运行。
3)报告上级部门,等待救援。
(3)网络故障1)立即通知网络部门,进行故障排查。
2)采取应急措施,保障网络畅通。
3)报告上级部门,等待救援。
(4)设备故障1)立即通知设备厂家或维修人员,进行故障排查。
2)采取应急措施,确保设备恢复正常运行。
3)报告上级部门,等待救援。
(5)自然灾害1)立即启动应急预案,组织人员撤离。
2)保障重要设备、资料的安全。
3)报告上级部门,等待救援。
五、应急物资及设备1. 灭火器、灭火毯、消防水带等消防设备。
2. 备用电源、UPS、应急照明等电力设备。
3. 网络设备、服务器、存储设备等设备。
4. 应急通讯设备、车辆等。
六、应急演练1. 定期组织应急演练,提高员工应急能力。
2. 演练内容包括火灾、电力故障、网络故障、设备故障等。
机房应急预案

一、前言随着信息化建设的不断推进,机房已成为企事业单位的重要基础设施。
为确保机房在突发事件发生时能够迅速、有效地进行应急处理,最大限度地减少损失,特制定本应急预案。
二、适用范围本预案适用于我单位所有机房,包括数据中心、网络设备室、服务器机房等。
三、组织机构及职责1.成立机房应急指挥部,负责组织、协调、指挥机房应急工作。
2.设立应急小组,负责具体实施机房应急措施。
(1)组长:负责组织、协调、指挥应急工作。
(2)副组长:协助组长工作,负责应急物资的储备和调配。
(3)成员:负责机房设备、环境、安全等方面的监控和应急处理。
四、应急响应1.预警阶段(1)密切关注机房设备运行状况,发现异常情况立即上报。
(2)根据预警信息,启动应急预案,通知相关人员。
2.应急响应阶段(1)应急小组接到通知后,立即到达现场,了解情况。
(2)根据现场情况,采取相应措施,确保机房安全稳定运行。
(3)如遇设备故障,立即进行维修或更换。
(4)如遇环境异常,立即采取相应措施,确保机房环境恢复正常。
(5)如遇安全事故,立即启动应急预案,进行救援和处理。
3.应急恢复阶段(1)恢复正常运行后,对应急过程进行总结,分析原因,提出改进措施。
(2)加强机房设备、环境、安全等方面的监控,防止类似事件再次发生。
五、应急保障1.物资保障(1)储备必要的应急物资,如备用电源、维修工具、应急通讯设备等。
(2)定期检查物资储备情况,确保应急物资完好可用。
2.技术保障(1)加强机房设备维护,确保设备正常运行。
(2)定期进行技术培训,提高应急小组的应急处置能力。
(3)建立应急预案数据库,方便查询和更新。
六、宣传培训1.定期开展应急知识培训,提高员工的安全意识和应急能力。
2.组织应急演练,检验应急预案的有效性。
3.加强与相关部门的沟通与合作,共同应对突发事件。
七、附则1.本预案自发布之日起实施。
2.本预案由机房应急指挥部负责解释。
3.本预案如遇特殊情况,可进行修订和补充。
机房应急处置方案(3篇)

机房应急处置方案总则1、保证人员和财产的安全为前提的原则:在由于火灾或电力问题造成的主机故障,在解决故障前,应以保证人员的生命安全和财产的安全为前提,然后进行故障的解决。
2、最快时间恢复业务的原则:本着先想尽一切方法,尽快恢复业务的原则来处理故障,如在有备用设备的情况下,主设备产生了故障,应先尽快将应用切换到备用机上,使业务能够运行,再对故障设备进行诊断和维修。
3、故障应急人员高度负责的原则:当故障应急人员在节假日接到故障通知时,本着高度负责的态度,应迅速接手处理障碍,如远程无法处理解决,应迅速赶到故障设备所在地,进行现场处理,处理故障的同时应及时向领导汇报。
应急人员不可互相推卸责任,如因特殊情况,确实无法处理障碍,部门领导必须安排好其他人员处理。
4、尽可能全面的保留故障现场的原则:当故障发生后,应急人员应尽可能全面的备份出能够反映故障现象的各种日志、记录、受损文件等,便于业务恢复后,对故障的分析、解决,杜绝故障的再次发生。
应急方案的目标:保证预付卡运营系统连续安全稳定地运行。
第二节应急领导小组应急领导小组成员:组长:副组长:成员:电话:第三节电源系统故障故障应急处理定期检查信息中心机房电源设备的运行状况,当发生下列___时,按以___案进行处置:当中心机房发生市电供电突然停电或远程报警电源异常时。
首先确认是否为正常停电及预计停电时间。
检查不间断电源的电池可供电时间,需在不间断电源供电时效内关闭所有服务器及网络设备。
联系工程部查看停电原因,尽快恢复供电,并将情况报告相关领导.工程部联系电话:第四节空调系统故障应急处理定期对空调的运行情况进行检查,如有报警信息,应及时查找故障原因,对于不能自行排除的问题,应及时与设备提供商进行联系。
当中心机房主空调因故障无法制冷,致使机房内环境温度超过摄氏40度时,打开机房房门,并关闭所有服务器及网络设备。
对于无法自行处置的空调系统异常情况,及时与设备提供商联系,并报告公司领导。
计算机机房应急预案

计算机机房应急预案
一、预案目标与原则
预案的目标是确保在紧急情况下能够迅速、有序地采取措施,最大程度地减少损失,保护人员安全,并尽快恢复机房的正常运作。
在制定预案时,应遵循以下原则:预防为主、防患于未然;快速响应、有效控制;科学决策、合理调度;分级负责、明确职责。
二、组织机构与职责
1. 应急指挥部:由机房负责人担任指挥长,负责全面协调应急处置工作。
2. 技术支持组:负责机房设备的紧急维护和修复工作。
3. 安全保障组:负责现场秩序维护、人员疏散和安全防护。
4. 信息联络组:负责信息的收集、整理和上报,以及与外部机构的沟通协调。
三、风险评估与预警机制
定期对机房进行风险评估,识别潜在的安全隐患,并建立相应的预警机制。
一旦发现异常情况,立即启动预警程序,通知相关人员做好准备工作。
四、应急处置流程
1. 发现异常:任何员工在发现机房出现异常情况时,应立即报告给应急指挥部。
2. 启动预案:应急指挥部接到报告后,根据情况判断是否启动应急预案。
3. 紧急处置:各小组按照预定职责迅速行动,采取紧急措施,如切断电源、启用备用系统等。
4. 信息收集与上报:信息联络组负责收集现场信息,并及时上报给上级管理部门和相关机构。
5. 后续恢复:在确保安全的前提下,逐步恢复机房的正常运作。
五、培训与演练
定期对机房工作人员进行应急预案的培训和演练,提高他们的应急处理能力和自我保护意识。
六、预案更新与完善
随着技术的发展和环境的变化,应定期对应急预案进行评估和修订,确保其适应性和有效性。
机房应急预案(通用8篇)

机房应急预案(通用8篇)第一篇:机房应急预案—总则1.目的与依据为确保机房运营的安全及稳定,迅速应对突发事件,减少故障对业务的影响,制定本应急预案,旨在提供详细的应急管理流程和操作指南。
2.适用范围本预案适用于所有机房工作人员,包括但不限于操作维护人员、管理人员、安全人员等。
3.术语与缩略语3.1 应急预案:为有效应对突发事件而制定的一系列应急管理措施和操作指南。
3.2 机房:指存放计算机设备、网络设备及相关设备的房间。
3.3 突发事件:指可能影响机房运营的紧急情况,包括但不限于火灾、水灾、停电等。
4.责任分工4.1 机房经理:负责指导机房日常运维工作及应急响应。
4.2 安全专员:负责机房安全检查、应急培训等工作。
4.3 运维人员:负责机房设备的日常管理维护。
4.4 其他相关人员:按照职责进行应急任务执行和配合。
5.紧急联系人员5.1 机房经理:姓名、联系方式5.2 安全专员:姓名、联系方式5.3 运维人员:姓名、联系方式6.机房应急设备6.1 灭火器材:火灾报警器、灭火器、灭火器柜等。
6.2 应急照明设备:应急照明灯、应急出口指示灯等。
6.3 紧急通信设备:手机、对讲机、应急广播设备等。
附件:1. 突发事件应急处置流程图2. 机房紧急联系人名单法律名词及注释:1. 突发事件应急处置法:根据突发事件的性质和程度,针对突发事件的发生和处置提供法律保障。
2. 《安全生产法》:中华人民共和国国家立法,旨在保障生产经营单位的人员安全和设施设备安全,维护社会稳定和人民生命财产安全。
计算机机房安全应急预案
一、预案背景随着信息技术的快速发展,计算机机房已成为企业、机构正常运行的核心设施。
为确保机房安全稳定运行,预防突发事件对机房造成损害,特制定本预案。
二、预案目标1. 保障机房设施和设备的安全运行,降低安全事故发生概率。
2. 建立健全机房安全管理机制,提高应急处置能力。
3. 确保在突发事件发生时,迅速、有序地采取应急措施,最大限度地减少损失。
三、预案组织架构1. 成立机房安全应急指挥部,负责指挥、协调、监督和指导机房安全应急工作。
2. 设立应急小组,包括以下部门:(1)信息部门:负责机房设备的维护、监控和故障处理;(2)安保部门:负责机房的安全保卫和人员疏散;(3)财务部门:负责应急物资的采购和调配;(4)行政部门:负责协调各部门的应急工作。
四、预案内容1. 机房日常维护(1)建立健全机房管理制度,明确各岗位职责;(2)加强机房设备的巡检和维护,确保设备正常运行;(3)定期对机房进行安全检查,发现安全隐患及时整改;(4)做好数据备份工作,确保数据安全。
2. 应急处置方案2.1 电源系统应急预案(1)定期检查机房供电设备的运行状况,确保供电稳定;(2)发生突然停电或电源异常时,立即启动应急电源,确保机房设备正常运行;(3)与电力部门联系,及时恢复供电。
2.2 网络安全应急预案(1)加强网络安全防护,防止黑客攻击和病毒入侵;(2)发现网络安全事件,立即启动应急预案,切断受影响设备,防止事态扩大;(3)配合公安机关调查,追查网络攻击源头。
2.3 消防安全应急预案(1)机房内配备消防设施,定期检查和维护;(2)发现火情,立即启动消防应急预案,组织人员疏散;(3)配合消防部门灭火,确保人员安全。
3. 应急演练定期组织应急演练,提高应急处置能力。
演练内容包括:电源系统故障、网络安全事件、火灾等。
五、预案实施与监督1. 本预案由机房安全应急指挥部负责实施,各部门积极配合;2. 定期对预案进行修订和完善,确保预案的适用性和有效性;3. 对预案实施情况进行监督,确保各项措施落实到位。
电脑机房_应急预案
一、应急预案的目的为确保电脑机房在突发事件发生时,能够迅速、有序地应对,最大限度地减少损失,保障电脑机房的安全运行,特制定本预案。
二、应急预案的适用范围本预案适用于电脑机房在遇到以下突发事件时:1. 突发停电;2. 突发火灾;3. 突发水灾;4. 突发网络故障;5. 其他影响电脑机房正常运行的事件。
三、应急预案的组织机构及职责1. 应急领导小组:负责组织、协调、指挥电脑机房应急工作,下设以下小组:(1)现场指挥小组:负责现场应急工作的组织实施,协调各部门、各岗位的应急行动。
(2)安全保障小组:负责现场安全保障,确保应急工作顺利进行。
(3)设备保障小组:负责电脑机房的设备保障,确保设备正常运行。
(4)信息报送小组:负责收集、整理、上报应急信息。
2. 各部门、各岗位职责:(1)值班人员:负责电脑机房日常巡查,发现异常情况立即报告。
(2)设备维护人员:负责电脑机房的设备维护,确保设备正常运行。
(3)网络管理员:负责网络设备的维护,确保网络正常运行。
(4)消防员:负责电脑机房的消防安全,确保消防设施完好。
四、应急预案的具体措施1. 突发停电(1)值班人员发现停电情况,立即报告应急领导小组。
(2)现场指挥小组启动应急预案,组织相关人员采取应急措施。
(3)设备保障小组检查UPS电源,确保备用电源正常运行。
(4)信息报送小组及时上报停电情况。
2. 突发火灾(1)消防员发现火灾,立即报告应急领导小组。
(2)现场指挥小组启动应急预案,组织人员疏散。
(3)消防员迅速扑灭火源,确保人员安全。
(4)信息报送小组及时上报火灾情况。
3. 突发水灾(1)值班人员发现水灾,立即报告应急领导小组。
(2)现场指挥小组启动应急预案,组织人员疏散。
(3)设备保障小组关闭电源,防止水进入设备。
(4)信息报送小组及时上报水灾情况。
4. 突发网络故障(1)网络管理员发现网络故障,立即报告应急领导小组。
(2)现场指挥小组启动应急预案,组织相关人员排查故障。
机房应急预案-详细版
机房应急预案-详细版机房应急预案随着XXX信息化建设不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是信息部门目前面临一项重要任务。
为应对机房可能发生的突发事件,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。
1.1机房突发事件分类1.自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。
2.事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。
3.人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏。
1.2应急处理人员组织机构1.3应急机构人员岗位职责机房应急预案-详细版1、应急总指挥职责(1)保证在任什么时候间,及时协调应急行动所有涉及的岗位人员;(2)提供必须的紧急响应设备;(3)在紧要情况下周全负责紧要行动;(4)在必要时向外界求救,例如:119、110、120等。
2、应急副总批示职责(1)在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;(2)根据获得的应急信息下达命令。
3、各相关设备负责人职责(1)负责尽快收集信息向应急总指挥汇报事故情况;(2)负责现场临时设备抢救和对局势控制;(3)听从上级批示人员批示。
1.4信息与网络安全突发事件处理原则1.预防为主。
立足安全防护,加强预警,重点保护基础信息网络和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑信息与网络安全保障体系。
2.快速反应。
突发事件发生时,按照快速反应机制,及时获取充分而准确的信息,跟踪研判,果断决策,迅速处置,最大程度地减少危害和影响。
3.分级负责。
按照“谁主管,谁负责”的原则,建立和完善安全责任制及联动工作机制。
根据各负责人职能,各司其职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责。
机房停电应急预案
机房停电应急预案机房安全应急预案【1】机房是我单位的重要场所,重要仪器、设备相对集中,一旦发生事故,会造成严重后果。
为此特制定本应急预案。
一、触电(1)发生触电事故时,迅速安全地切断电源,避免与触电者直接接触。
(2)即刻拨打紧急电话120并通知相关领导,同时开展现场应急救护。
二、火灾1、报警程序:即刻通知领导及相关部门,根据火情大小如需报警立即就近用电话或手机报告消防中心(电话119).。
2、组织实施:机房管理员一旦发现火情后,应即刻切断电源,并使用灭火器扑救起火设备。
三、空调漏水若空调系统出现渗漏水,应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,同时临时用电扇进行降温。
四、设备发生被盗或人为损害事件( 1)发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告中心负责人,同时保护好现场。
( 2)中心负责人接报后,通知保卫处,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。
( 3)当事人应当积极配合公安部门进行调查,并将有关情况向领导汇报。
五、机房停电(1)接到长时间停电通知后,应及时发布相关信息,部署应对具体措施。
(2)如遇临时停电,且停电时间在3小时之内,管理员要检查UPS是否正常工作,以确保机房设备的正常运行。
六、网络故障(1)通信线路中断、路由故障、流量异常等故障发生后,网络管理员应及时查明通信网络的故障位置,隔离故障区域,组织相关技术人员对故障区域进行检测,逐步恢复故障区域与服务器的网络连接,恢复通信网络,保证正常运行。
(2)事态或后果严重的,应及时报告领导并请求协助解决。
七、不良信息和病毒事件(1)发现不良信息或网络病毒时,管理员应立即断开网线,终止不良信息或网络病毒传播,并报告。
(2)中心负责技术人员应采取隔离网络等措施,及时杀毒或清除不良信息,并追查不良信息来源。
(3)情况或后果严重的,应及时向有关领导和有关部门报告。
八、服务器软件系统故障(1)发生服务器软件系统故障后,在确认安全的情况下,重新启动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;(2)若重启失败,应立即安排备份服务器启用,并请求技术人员支援,作好技术处理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机机房应急预案XXXX单位名称20XX年XX月编制人员编制审核XXX XXXX前言近年来,经常会听到某地机房发生因某种原因导致灾难性的事件;由于处理不及时或人为因素操作不当,导致严重后果,造成了巨大的经济损失。
为了避免类似事情发生,项目组每年对应急预案进行修订,优化使用流程及操作步骤,保障在突发情况下及时、有效处理各类应急情况。
本应急预案编制依据《单位网络系统运行管理规定》而编写。
根据单位领导提出新的改进建议,应急预案的版本修订相比之前有了较大的改动,项目组结合机房的实际情况,针对所涉及故障及其处理方法分别进行说明并细化了每一个处理步骤,增加了非工作时间机房出现突发事件的处理步骤及紧急联系人相关信息,确保维护人员能够直观、及时、有效地处理突发情况,在维护人员不能第一时间到达现场,其他人员也能以及有效协助处理突发情况。
项目组每年组织两次的机房应急演练,模拟机房设备故障,维护人员参照应急预案能够熟练操作并进行突发事件的处理,验证应急预案对于机房的有效性和可用性。
目次1概述 (1)1.1目的 (1)1.2应急预案存放 (1)1.3编制依据 (1)1.4技术资料 (1)2 适用范围及启动条件 (1)3 应急组织和职责 (2)4应急响应流程 (3)4.1 应急事件响应 (3)4.2 应急事件升级 (3)5应急执行流程 (4)5.1 影响程度的评估 (4)5.2 宣告启动应急 (4)5.3 应急恢复 (5)5.4 事后处理 (5)5.5 应急注意事项 (5)6应急恢复步骤 (6)6.1强电系统故障 (6)6.2 UPS故障 (9)6.3 网络系统故障 (10)6.4 机房漏水 (12)6.5 空调故障 (14)6.6 机房火灾 (17)附表一交换机信息 (22)附表二自主运维办公交换机信息 (22)附表三交换机常用命令 (23)附表四机房应急预案联系人信息表 (23)附表五机房服务器联系人信息表 (23)7 预案附录 (24)附录一机房示意图 (24)附录二配电柜操作说明书 (24)附录三 UPS操作说明 (24)附录四空调操作手册 (24)附录五设备监控软件使用说明书 (24)1概述1.1目的为了提高单位计算机机房、网络突发事件的应急处理能力,最大程度地预防和减少突发事件及其造成的损害,保障设备正常运行,制定本预案。
本预案参照单位领导的要求,对机房空调、电力、消防、漏水以及网络系统五种突发情况制定具体的应急工作流程。
1.2应急预案存放1) 电子版本本应急预案电子版存放于单位共享服务器及所有项目组成员工作电脑中。
2) 纸质版本本应急预案纸质文档存放于机房缓冲区桌面、运维人员办公室。
1.3编制依据本应急预案编制依据《单位安全管理规定》编写。
1.4技术资料2 适用范围及启动条件1)地域范围:本预案适用于本单位机房及网络运行中发生故障时使用。
2)人员范围:本预案在执行中涉及的人员包括机房、网络运维人员,相关主管领导,大楼安保人员以及机房内各应用系统负责人等。
3)启动条件机房、网络运行中出现的一般性突发事件和重大突发事件。
一般性突发事件:是指机房、网络突发故障,将影响机房提供正常服务及网络服务的能力且预计修复时间大于30分钟,此时应立即启动应急预案,主要包括:1)市电中断和UPS故障引起的电力供应中断。
2)机房空调冷凝水或上下水管道漏水。
3)机房温度超过30℃。
4)网络故障影响用户范围超过20%,预计修复时间在2小时以内。
重大突发事件:是指一般性突发事件在特定的时间内无法修复或发生特殊事件时,严重影响机房提供正常服务及网络服务的能力,并且修复时间大于2小时,此时除了立即启动应急预案外还应升级为重大事件,其中包括但不限定于以下分类:1)机房出现火灾。
2)市电中断和UPS故障引起的电力供应中断。
3)机房温度超过40℃。
4)网络故障造成全网中断,预计修复时间超过2小时。
3 应急组织和职责计算机机房应急组名单如下:表1 应急小组名单4应急响应流程4.1 应急事件响应1、发生突发事件时,通过电话或当面通知应急小组组长报告情况。
2、必要时第一时间启动应急预案。
3、应急小组组长根据实际情况启动应急预案,参照应急恢复步骤组织协调相关人员进行应急处理。
4、电话通知机房内生产业务系统管理员做相应的应急措施。
5、应急小组组长根据情况判定是否需要将事件升级为重大事件。
6、事件处理完毕后,应急小组组长将事件处理详细经过形成书面报告,上报部门主任和单位领导。
4.2 应急事件升级在应急小组组长认定突发事件升级为重大事件时,应按以下步骤操作:1、立即通知部门主任。
2、通知机房内生产业务系统管理员事件升级为严重,参照应急恢复步骤做相应的应急措施。
3、根据应急决策领导的决策指令处理故障。
4、事件处理完毕后,应急小组组长将事件处理详细经过形成书面报告,上报部门主任和单位领导。
5应急执行流程5.1 影响程度的评估表2 影响程度评估表5.2应急小组组长宣告启动应急预案,并通知应急预案操作岗所有成员参与预案的执行。
重大事件时要向部门主任、单位领导汇报。
5.3 应急恢复突发事件发生后,应急组长根据不同的启动条件执行应急预案进行应急恢复。
表3 应急恢复步骤5.4 事后处理事后仔细分析事件发生的原因,查找引起事件发生的根本原因,力争杜绝类似问题的再次发生;总结每次应急处理的经验与不足,及时进行总结记录,作为知识储备,进行共享;重大事件处理完毕时,要向部门主任、单位领导及时汇报整个事件的处理过程,并提出预防措施建议。
5.5 应急注意事项为了在突发事件发生时,能够及时顺畅地执行预案,应保证以下几点:⏹平时多做应急演练,对应急小组的组织和预案执行力进行检验和加强。
⏹熟读应急预案,责任分工明确,应急流程掌握熟练。
⏹加强技术能力和业务能力。
⏹通讯保持畅通,应急小组的人员要保持24小时手机开机。
⏹处理应急突发事件时要认真做好应急处理记录,有利于进行问题回溯。
6应急恢复步骤6.1强电系统故障6.1.1 市电中断1)当发生市电中断或同时收到UPS输入、电量仪、空调及数据库读取异常等告警短信,立即到机房检查UPS工作状态。
非工作时间发生电力中断时,电话联系保安人员进入机房确认是否停电,同时联系附近的紧急联系人协助处理,并直接跳到第三步。
紧急联系人姓名联系电话备注(住所)2)检查UPS的负载量及电池能够支持的时间:步骤:双击UPS控制面板“ESC”按键,点击“”键,找到相关信息,查看电池负载;在“电池参数显示”处,查看备用时间确认UPS供电剩余时间。
(具体详情可参照附录三:《UPS操作说明》进行操作。
图1 UPS控制面板3)立即拨打物业电话,询问断电原因及断电预计恢复时间,同时通知应急小组组长。
(如电话无人接听,立即拨打物业人员手机询问具体情况,物业人员详细联系方式可参照附表三:《联系人信息表》进行查询)4)当发生单路供电中断时,应立即通知物业切换至另一路供电,观察UPS状态是否供电正常,等待第一路供电恢复切回。
5)如物业通知无法切换电路且30分钟内无法恢复供电,应立即按照附表五:《机房服务器联系人信息表》的清单顺序通知各生产业务系统管理员进行系统备份并关闭系统。
同时维护项目组关闭机房内负责的所有设备。
6)向部门主任及单位领导汇报当前情况。
7)确认所有服务器关闭后,直接手动拉下配电柜01后面A4、A5、A6、B2、B5、C3机柜输出开关,关闭网络设备。
8)当机房温度超过40度时,为确保机房内服务器安全,经单位领导许可,维护组人员按顺序直接拉下位于配电柜01后面所有机柜输出开关,关闭机房内所有设备。
图2 配电柜019)待市电恢复供电后,打开网络机柜对应的输出开关,启动网络设备。
10)按附表五中的清单分批次对系统服务器加电,通知相关人员进行测试,并要求相关人员电话回复系统测试结果。
11)如UPS故障造成的电力供应中断,手动重启UPS,查看UPS故障是否解除并恢复正常。
(在UPS显示屏上点击“开机”,查看UPS是否正常启动)12)如UPS故障依旧,立即通知各生产业务系统切换备份系统。
13)向部门主任和单位领导汇报当前情况,并联系厂商对UPS进行检修。
14)待所有系统恢复正常后,提交处理报告,上报部门主任和单位领导。
6.1.2 市电中断流程图图3 强电系统故障处理流程图6.2 UPS故障6.2.1 UPS电池漏液、冒烟1)发生机房电池漏液、冒烟或监控组人员发现机房电池柜冒烟,立即到机房查看电池状态。
(电池柜位于储藏室内部)图4 机房电池柜2)如发现是电池漏液、冒烟导致,应按照下列处理方法操作。
并密切观察UPS工作状态。
3)关闭电池供电时,先将机房手提式干冰灭火器放置电池柜附近。
4)打开两组电池柜,手动关闭电池开关。
开关位于电池柜的下方,此时应用力向左拨动电池开关,直至开关显示“OFF”状态。
图5 电池柜的开关位置5)如电池出现火情,使用事先准备的手提式干冰灭火器进行灭火。
6)确认无火情后,查看UPS状态,供电情况,立即联系厂商工程师进行检修。
注意:关闭电池开关不会影响机房的正常供电。
7)向部门主任做口头汇报,电话上报单位领导。
8)事件处理完毕后,将事故处理报告,单位领导。
6.2.1 电池火情无法控制导致机房火灾1)处理电池漏液、冒烟过程中,无法使用手提灭火器控制火情。
2)打开电池柜,手动关闭电池开关。
3)立即按照机房火灾处理步骤进行操作。
(详情见步骤6.6机房火灾进行操作)4)火灾处理完毕后,消除火灾报警,恢复市电,查看UPS运行状态,如无法恢复市电,立即通知物业切换备用电路,观察UPS状态是否正常供电。
步骤:打开机房配电柜2,手动用力推上机房电力闸恢复市电供应。
图6 机房电力总开关5)立即联系UPS厂商进行处理并向部门主任做口头汇报,电话上报单位领导。
(详细联系方式可参照附表三:《联系人信息表》进行查询)6)统计火灾造成损失,提交相关更换UPS电池的申请。
7)事件处理完毕后,将事故处理报告,上报部门主任和单位领导。
6.2.3 UPS故障处理流程图7 UPS故障处理流程图6.3 网络系统故障局部楼层网络中断1.如果是局部楼层断网,首先判断是否是交换机故障;2.远程PING交换机管理地址(各楼层管理地址详见附表1)看是否可以正常PING 通3.如果可以PING通,证明交换机本身没有故障,网线没有故障。
交由网络管理员处理。
4.如果不能PING通,说明交换机主线断或交换机宕机,应去弱电机房找到该楼层交换机上联端口和电源灯状态是否正常,如果上联端口不亮(光纤口),证明主线有问题,更换主线测试。
5. 如果看到交换机电源灯不亮,证明交换机掉电,检查电源和电源线。
6. 如果以上通过检查交换机和线路后故障现象仍然存在,由此判断可能交换机存在异常,按交换机故障进行处理。