计算机系统应急预案

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.1目标与范围

(1)确保公司的日常业务能够连续运行,不出现中断。在某些系统或子系统功能失效的情况下,关键系统不至于瘫痪,主要功能不会丧失。

(2)应急方案必须采取各种措施,把由于问题而产生的风险降到最低。

(3)对于可能产生的风险,采取技术和管理方面的补救措施,尽量将各种损失减少到最低。

(4)尽量避免因为系统故障而产生灾害的高危系统造成的直接或间接影响,确保人公司财产安全和社会稳定。

1 服务器故障应急预案

1 目的

为提高科室处理公司局域网中服务器故障的能力,形成科学、有效、反应迅速的应急工作机制,确保局域网系统的安全和高效,最大限度地减小服务器故障对经营的影响,保护公司利益,特制定本预案。

2 适用范围

本预案适用于公司局域网中提供公共服务的服务器发生和可能发生的故障。

3 预防机制

服务器故障预防措施包括分析风险,建立检测体系,准备应急处理措施,控制影响扩大。

3.1 服务器故障分类

服务器硬件或软件的故障;自然灾害(水、火、电等)造成的物理破坏;电脑病毒等恶意代码危害等。

3.2 应急准备

科室相关工作人员明确职责和管理范围,根据实际情况,安排应急值班,确保到岗到人联络畅通,处理及时准确。

3.3

具体措施

(1)建立安全、可靠、稳定运行的机房环境,防火、防雷电、防水、防静电、防尘;建立备份电源系统。

(2)服务器采用可靠、稳定硬件,落实数据备份机制,遵守安全操作规范;安装有效的防病毒软件,及时更新升级扫描引擎。

4 有关应急预案

4.1 机房漏水应急预案

(2)若空调系统出现渗漏水,相关人员立即通知球所综合管理室进行处理,并及时清除机房积水。(3)若墙体或窗户渗漏水,相关人员立即采取有效措施确保机房安全,同时通知球所综合管理室,及时清除积水,维修墙体或窗户,消除渗漏水隐患。

4.2 机房长时间停电应急预案

接到长时间停电通知后,相关人员应及时部署应对具体措施,启动备用电源,保证服务器正常运行。

4.3 服务器硬件故障应急预案

(1)核心服务器双机配置,配置好备用服务器,随时待命。

(2)发生服务器硬件故障后,相关人员应及时查找、确定故障原因,进行先期处置。若故障服务器在短时间内无法修复,相关人员应启动备用服务器,保持局域网系统的正常运行;将故障服务器脱离网络,进行故障排除工作。

(3)服务器硬件故障预防与排除参考附件1

4.4 服务器软件系统故障应急预案

(1)做好服务器软件系统的定时备份,系统崩溃后,能够及时恢 3 复系统。(2)发生服务器软件系统故障后,相关人员应检查出现故障的原因并尽快排除。

(3)如遇服务器系统崩溃,应启用备份系统进行恢复。

(4)服务器软件故障预防与排除参考附件2。

(1)在正常工作日内,信息管理人员负责对机房进行监控,主要职责是:巡视网络设备及系统的运行情况,发生异常情况及时处理,消除网络故障隐患。

(2)节假日期间办公室安排人员轮流值班,负责处理有关异常情况。

(3)机房重地,未经允许,无关人员不得进入公司机房区域。

2、机房内严格采取防雷、防火、防尘、防静电等措施以及机房入口处24小时监控录像等措施。

3、认真做好数据备份工作,定期做一次数据库完全备份,每月检查服务器运行和备份情况。

4、信息管理员对机房的主要网络设备(路由器、主干交换机等)进行工作时间内全程监控,发现异常情况应及时进行处理,确保整个分公司网络的正常运行。

二、机房突发事件应急处置方案

1、电源系统应急预案

(1)定期检查机房供电设备的运行状况和电路线缆器材情况,当发生下列突发事件时,按照以下方案进行处置:

(2)当机房发生市电供电突然停电或是电源异常时。首先应和供电局联系确认正常停电以及预计停电时间。检查不间断电源的电池可供电时间,确保设备正常运行,如遇到突然断电,应及时将空调等不在UPS电源供电范围内的设备及时断电,预防突然来电时瞬间电流过大导致设备损坏等现象。

(3)当确定停电时间超出机房UPS承载范围后,首先确定停电的范围以及受影响的设备范围。并及时通知各部门做好停电应急准备。然后通知机房电源维护人和设备的负责人到达现场,做好各设备的电源停电准备。在UPS供电电量仅剩10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复。

(4)当确定停电原因是在本身供电系统范围内,立即汇报给负责领导,并及时联系相关维护人员达到现场检修。对于恢复时间无法预计的,要通知出单点通过远程和VRC钥匙等方式做好出单工作。

(5)恢复供电后,严格按照操作程序逐步恢复机房设备和UPS的供电,以防瞬间电流过大造成设备损坏。

2、网络和服务器络系统应急预案

(1)发生网络故障时,首先检查机房设备情况,确定网络故障的原因。

(2)确认原因后,首先启动备用线路和设备,保证网络的正常运行。然后联系网络维护人员,及时处理和排除故障。

(3)当确认原因为短时间无法恢复,应该及时向负责领导汇报,并向省公司相关部门汇报。然后通知各部门和支公司营销部,做好应急准备。然后再联系维护人员,及时处理故障。(4)当人为或病毒破坏的故障发生时,具体按以下顺序进行:判断破坏的来源及性质,断开影响安全与稳定的信息网络设备,断开与破坏来源的物理网络连接,跟踪并锁定破坏的来源和其他网络用户信息,修复被破坏的信息,恢复系统。

(5)发生服务器系统故障后,应立即电话向相关领导汇报情况,及时组织启动备份服务器系统,由备份服务器接管相关业务应用,同时安排人员将故障服务器脱离网络,保存系统状态不变,保护原始数据。

在确认安全的情况下,重新启动故障服务系统:若重启系统成功,则检查数据丢失情况利

相关文档
最新文档