网络故障运维流程图

合集下载

网络运维与故障排除技巧

网络运维与故障排除技巧

网络运维与故障排除技巧在如今数字化时代,网络已经成为我们生活和工作中不可或缺的一部分。

然而,随着网络规模的扩大和复杂性的增加,网络故障和运维变得更加困难。

本文将介绍一些网络运维和故障排除的技巧,帮助您更好地管理和维护网络。

一、网络运维技巧1. 建立完善的网络设备清单:清单中应包括网络设备的品牌、型号、序列号、购买日期和保修期等信息,以便及时跟踪设备状况和维修保养。

2. 定期备份网络配置:定期备份网络设备的配置文件,以防止配置丢失或者出现故障时可以快速恢复。

3. 规划合理的网络拓扑结构:合理的网络拓扑可以提高网络性能和可靠性。

根据组织的需求和资源,设计简洁有效的网络架构。

4. 实施访问控制策略:通过实施访问控制策略,可以保护网络安全,并确保只有授权用户可以访问网络资源。

5. 维护网络设备的软件和固件:定期升级网络设备的软件和固件,以获取最新的功能和安全修复,以及提高设备的性能和稳定性。

6. 监控网络性能:使用网络性能监测工具对网络进行实时监测,及时发现并解决性能问题,提高网络的可用性和可靠性。

二、网络故障排除技巧1. 了解常见的网络故障类型及其原因:熟悉常见的网络故障类型,例如网络延迟、丢包、ARP欺骗等,以便快速定位问题。

2. 使用适当的网络故障排除工具:网络故障排除工具可以帮助您快速诊断和解决问题,例如Ping、Traceroute、Wireshark等工具。

3. 检查物理连接:检查网络设备之间的物理连接是否正常,包括网线、光纤等。

确保连接牢固和正确连接。

4. 分析网络设备日志:网络设备的日志记录了设备的运行状态和事件,通过分析日志可以找到潜在的故障原因。

5. 排查网络设备配置问题:检查网络设备的配置是否正确,例如IP 地址、子网掩码、网关等是否配置正确。

6. 使用分层故障隔离方法:将网络拓扑进行分层,逐个隔离故障,确定出问题的层级,以便有针对性地解决问题。

7. 合理运用重启和重置操作:在排除其他可能原因后,适当时候进行重启或重置网络设备,以恢复设备到正常状态。

网络运维中的监控和故障排除技术

网络运维中的监控和故障排除技术

网络运维中的监控和故障排除技术随着互联网的快速发展,网络运维变得越来越重要。

在企业和组织中,网络故障可能会导致生产力下降、服务中断和潜在的安全风险。

为了确保网络的稳定运行,监控和故障排除技术成为网络运维工程师的必备技能。

本文将详细介绍网络运维中的监控和故障排除技术的步骤和方法。

一、网络监控技术1. 定义监控指标:网络运维人员应根据实际需求和企业目标,定义适合的监控指标,如带宽利用率、网络延迟、丢包率等。

将指标具体化,并制定相应的阈值。

2. 选择监控工具: 有很多网络监控工具可供选择,如Zabbix、Nagios等。

根据需求选择合适的工具并进行安装和配置。

3. 配置监控设备: 将监控设备与网络连接,并对设备进行配置和管理,确保监控系统能够获取到准确的数据。

4. 设定警报机制: 当监控指标超过预设的阈值时,监控系统应能够及时发出警报,以便运维人员可以在故障发生前得到相应的通知。

5. 监控数据分析: 运维人员应定期分析监控数据,以获得对网络性能和运行状况的深入了解。

例如,对于频繁发生故障的设备,需要进一步排查原因并采取相应的措施。

6. 网络容量规划: 运维人员应根据监控数据分析结果,进行网络容量规划。

根据当前及未来的需求,适时扩展网络设备以保证网络的正常运行。

二、故障排除技术1. 收集故障信息: 当网络故障发生时,及时收集相关信息是故障排除的第一步。

运维人员应尽快了解故障的具体表现、发生时间和受影响的用户或服务。

2. 查看监控数据: 运维人员应查看监控系统中的相关数据,以了解故障的范围和可能的原因。

例如,查看带宽利用率是否超过阈值、是否有网络丢包等异常情况。

3. 逐层排查: 从物理层开始逐层排查可能的问题。

首先检查网络设备的连接状态和配置,确保设备工作正常。

然后检查路由器和交换机的配置和路由表,确认网络路径是否正确。

4. 使用网络分析工具: 使用网络分析工具如Wireshark或tcpdump等,捕获网络数据包以追踪故障。

网络运维常见问题解决方案汇总

网络运维常见问题解决方案汇总

网络运维是指对网络进行维护和管理的工作,随着网络的普及和发展,网络运维相关的问题也不断出现。

本文将汇总一些常见的网络运维问题,并提供相应的解决方案。

一、网络故障网络故障是网络运维中经常面临的一个挑战。

故障的原因可能有很多,如硬件故障、软件配置问题等。

解决网络故障的关键是快速定位和修复问题。

1. 使用网络监控工具网络监控工具可以实时监测网络的状态,当出现故障时能够提供警报和报告,帮助运维人员快速定位问题所在。

常用的网络监控工具包括Zabbix、Nagios等。

2. 故障排除方法当出现网络故障时,可以按照以下步骤进行排除:- 检查物理连接:确保网络设备之间的物理连接正常,如电缆是否松动、交换机端口是否发生故障等。

- 检查IP地址配置:确保设备的IP地址配置正确,避免IP冲突等问题。

- 检查路由和转发表:审查设备的路由和转发表,确保数据包能够正确转发。

- 检查防火墙和ACL配置:检查防火墙和访问控制列表(ACL)的配置,确保不会阻塞合法的网络流量。

- 使用抓包工具:当无法找到故障原因时,可以使用抓包工具如Wireshark来分析网络流量,找出异常的数据包。

二、网络安全问题网络安全是网络运维中一个非常重要的方面。

网络安全问题可能包括黑客攻击、病毒感染、数据泄露等。

保护网络安全的关键是综合使用多种安全措施。

1. 配置防火墙防火墙是保护网络免受未经授权访问的一道重要防线。

配置防火墙可以限制入站和出站的网络流量,过滤恶意流量,确保网络的安全性。

2. 使用加密通信协议在网络传输敏感数据时,使用加密通信协议如HTTPS可以保护数据的机密性和完整性,防止数据被窃取或篡改。

3. 更新和升级软件及时更新和升级操作系统和应用软件可以修复已知的安全漏洞,提升网络的安全性。

4. 实施访问控制通过访问控制列表(ACL)、用户权限管理等手段,限制用户对网络资源的访问权限,减少潜在的安全风险。

5. 增强密码策略实施强密码策略,要求用户使用复杂的密码,并定期更换密码,以防止密码被破解和盗用。

机房系统故障及应急处理预案

机房系统故障及应急处理预案

机房系统故障及应急处理预案随着网络息化建设的不断深入,加强机房各类设备、系统以及息与网络安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务。

为确保系统及机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。

本预案共分为应用系统故障应急流程和机房突发事件应急流程。

一、系统故障应急流程说明1、故障发生系统运维服务小组可从以下途径得知故障的发生:1.1运维服务中心通过网管告警发现故障1.2维护站点通过维护巡检发现故障1.3用户发现故障,报给呼叫中心1.4驻场工程师发现故障2、报障受理监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情形。

3、息研判运维服务小组根据了解到的系统故障情况进行分析判断,以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案。

4、预案启动如需启动应急预案,则立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进行全面管控处理。

5、资源确认系统突发故障应急预案启动后,首先是根据现场突发故障实际状况、紧急程度、技术难度、备品备件等情况对相关资源(主要是参与人员)依据经验进行调度和确认,主要有以下资源:5.1我公司技术支持人员;5.2相关厂家技术支持人员;5.3我公司聘请的技术专家6、预案执行按照既定的预案进行突发故障抢修,如遇到题目实时向系统突发故障应急领导小组汇报。

7、预案终止预案的停止时间由故障现场技术人员根据现场的实际进展情形,在与用户单位有关部门和谐后报系统突发故障应急领导小组决意。

8、结果上报预案中止后,相关预案参与人员将整个变乱过程中的经验和教训,修改、美满变乱应急预案。

然后集中上报至系统突发故障应急领导小组。

中国电信枣庄分公司网络故障工单处理规范

中国电信枣庄分公司网络故障工单处理规范

枣庄电信网络故障工单处理规范为规范网络故障工单处理,加强网络故障管控,枣庄网络监控维护中心制订了网络故障工单的处理流程、处理要求及考核标准。

本规范适用于枣庄电信集中监控维护范围内的网络故障工单处理工作。

一、网络故障工单处理流程1、网络故障工单处理流程图:2、网络故障工单处理流程说明:(1)综合告警系统根据设定的派单规则对网络告警进行自动派单。

(2)枣庄NOC监控人员主动发现、投诉反映或者其它部门告知的故障,且综合告警系统没有自动派单,由枣庄NOC一级监控根据接收到的信息进行手动派单。

(3)枣庄NOC一级监控根据预处理情况在工单中填写预处理信息。

(4)枣庄NOC一级监控人员对经过预处理但未恢复的故障进行工单派发。

(5)处理工位在规定时间内接收工单,并对工单中的内容进行确认,如存在问题可以退回。

(6)处理工位对故障处理过程中的告警核对、原因定位、关键步骤等主要信息进行反馈。

(7)处理工位根据故障情况对当前故障级别进行判断,判定是否为严重以上级别故障。

(8)如处理人员判定为严重以上级别故障,需要上报简要故障报告。

(9)处理工位对故障恢复信息进行反馈。

(10)处理工位填写故障原因和主要操作等信息,进行回单。

(11)处理工位按照规定模板提交故障报告。

二、网络故障工单处理要求:1、派单:对于综合告警系统自动派发的故障工单,枣庄NOC一级监控人员进行确认和预处理,经预处理未直接销障的,一般故障在30分钟内、严重及以上级别故障在15分钟内向枣庄NOC二级监控或对应专业人员派发故障工单;2、接单:处理工位在15分钟之内接收和确认工单信息,并根据故障现象及工单内容展开处理。

3、预处理:枣庄NOC一级监控人员按照“山东电信NOC网络故障预处理要求”进行预处理并填写预处理内容。

4、故障处理反馈:处理工位要及时准确地将故障原因、处理进展和操作步骤等故障管控关键点进行反馈,一般故障接单后需每4小时反馈一次,严重以上级别故障需每小时反馈一次。

专网数据卡故障处理流程

专网数据卡故障处理流程

专网数据卡故障处理流程第一部分:核查系统数据是否有误(市、区县集客部)一、查询是否欠费在BOSS系统的一键通受理或营业缴费界面,可查询用户状态是否欠费、停止、销户等状态。

二、查询是否开通专有APN在BOSS系统的营业受理—新业务受理,可查询手机号码是否开通GPRS类型为“[30533900]专有APN”,即专网数据卡的GPRS功能类型;是否关闭了“[35002500]GPRS业务(0元)”,即公网数据卡的GPRS功能类型。

三、查询是否捆绑APN-IP地址1、在ESOP系统—客户管理—集团客户管理—成员订购信息查询,查询手机号码是否存在“DDN随E行”产品订购关系。

2、在ESOP 系统—端到端—产品设置—APN-IP 地址维护,查询手机号码捆绑的APN 、IP 地址是否正确。

3、找集客部相关产品经理,核实IP 地址是否正确,核实交换上的IP 和APN 是否一致(ESOP 中数据和HLR 上数据不一致,数据卡也不能上线)。

如果不一致,在ESOP 中删除订购关系,重新捆绑IP 地址。

第二部分:无线网卡测试APN 联网状态(责任部门:市、区县客响中心)排除数据制问题后,通过无线上网卡测试号码是否能连上对应服务器,如果可以,确定是用户设备问题,如果不行,可能是sim 卡损坏,换卡测试。

附:目前造成数据卡掉线的原因及处理办法1、客户欠费导致掉线处理方法:缴清欠费,并重新关开GPRS 功能,必要时重启设备。

如需大批量开关GPRS 功能,可走工单至业务支撑申请。

2、网络割接导致信号出现问题处理方法:此种原因容易引起大批量数据卡掉线,待割接完后,数据卡会陆续自动上线。

如果未上线,报网络部门处理。

3、设备问题处理方法:有的供电抄表卡设备,gprs 功能不稳定,导致数据卡无法联网。

需要重启设备或更换设备。

4、由于设备电压过大等原因,导致sim卡损坏处理方法:更换SIM卡5、数据制作问题,包括未捆绑IP地址,未开通专有APN功能,ESOP数据未同步到交换(HLR),两边数据不一致处理方法:删除原有订购关系,重新订购并捆绑IP。

机房紧急故障处理预案

机房紧急故障处理预案

一、预案背景随着信息技术的快速发展,机房作为企业、机构的核心基础设施,其稳定性和安全性至关重要。

为保障机房在发生紧急故障时能够迅速、有效地进行处理,降低故障带来的影响,特制定本预案。

二、预案目标1. 确保机房设备安全,减少故障损失。

2. 快速恢复机房运行,降低故障对企业或机构的影响。

3. 提高机房运维人员应对紧急故障的能力。

三、预案适用范围本预案适用于本机构所有机房在发生紧急故障时的处理。

四、组织架构1. 应急指挥部:负责指挥、协调机房紧急故障处理工作。

2. 技术支持小组:负责分析故障原因,提出解决方案。

3. 现场处置小组:负责现场故障处理工作。

4. 信息通报小组:负责故障信息的收集、整理和发布。

五、故障分类及响应1. 一般故障:- 故障现象:设备运行异常,但不影响整体运行。

- 响应措施:现场处置小组负责现场检查,必要时更换设备或调整参数。

- 处理时限:1小时内恢复。

2. 重大故障:- 故障现象:设备损坏,影响整体运行。

- 响应措施:应急指挥部立即启动预案,技术支持小组分析故障原因,现场处置小组进行现场处理。

- 处理时限:4小时内恢复。

3. 紧急故障:- 故障现象:设备损坏,严重影响整体运行,可能造成重大损失。

- 响应措施:应急指挥部立即启动预案,技术支持小组分析故障原因,现场处置小组进行现场处理,必要时暂停相关业务。

- 处理时限:8小时内恢复。

六、处理流程1. 信息收集:信息通报小组接到故障报告后,立即向应急指挥部汇报。

2. 应急启动:应急指挥部接到报告后,立即启动预案,通知相关小组。

3. 现场处置:现场处置小组根据技术支持小组提供的解决方案,进行现场处理。

4. 故障恢复:故障处理后,进行测试,确保设备恢复正常运行。

5. 信息发布:信息通报小组发布故障处理结果。

七、故障处理措施1. 设备故障:- 检查设备电源、网络连接、散热系统等。

- 检查设备硬件,如CPU、内存、硬盘等。

- 更换损坏的设备部件。

运维系统及中心机房应急预案

运维系统及中心机房应急预案

运维小组应急预案随着网络信息化建设的不断深入;加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务..为确保系统及机房安全与稳定;以保证正常运行为宗旨;按照“预防为主;积极处置”的原则;本着建立一个有效处置突发事件;建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标;将正在发生或已发生事故的损害程度减轻到最低;确保员工安全;特制定本应急处置预案..本预案共分为应用系统故障应急流程和机房突发事件应急流程系统故障应急流程一、系统故障应急流程说明1、故障发生系统运维服务小组可从以下途径得知故障的发生:1.1、运维服务中心通过网管告警发现故障1.2、维护站点通过维护巡检发现故障1.3、用户发现故障;报给呼叫中心1.4、驻场工程师发现故障2、报障受理监控系统运维服务小组得知系统故障发生后;立即响应;并向报障人或单位详细了解系统故障情况..3、信息研判运维服务小组根据了解到的系统故障情况进行分析判断;以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案..4、预案启动如需启动应急预案;则立刻通知系统突发故障应急领导小组;由领导小组启动应急预案;对系统突发故障应急事件进行全面管控处理..5、资源确认系统突发故障应急预案启动后;首先是根据现场突发故障实际状况、紧急程度、技术难度、备品备件等情况对相关资源主要是参与人员依据经验进行调度和确认;主要有以下资源:我公司技术支持人员;相关厂家技术支持人员;我公司聘请的技术专家6、预案执行按照既定的预案进行突发故障抢修;如遇到问题及时向系统突发故障应急领导小组汇报..7、预案终止预案的终止时间由故障现场技术人员根据现场的实际进展情况;在与用户单位有关部门协调后报系统突发故障应急领导小组决定..8、结果上报预案中止后;相关预案参与人员将整个事件过程中的经验和教训;修改、完善事件应急预案..然后集中上报至系统突发故障应急领导小组..二、系统故障应急处理流程图机房突发事件应急流程一、机房突发事件分类1、自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏..2、事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏..3、人为破坏:指人为破坏网络线路、通信设施;黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏..二、应急处理人员组织机构三、应急机构人员岗位职责1、应急总指挥职责1.1、保证在任何时间;及时协调应急行动所有涉及的岗位人员;1.2、提供必须的紧急响应设备;1.3、在紧急情况下全面负责紧急行动;1.4、在必要时向外界求救;例如:119、110、120等..2、应急副总指挥职责2.1、在总指挥领导下具体开展工作;当总指挥不在时履行总指挥职责;2.2、根据获得的应急信息下达命令..3、各相关设备负责人职责3.1、负责尽快收集信息向应急总指挥汇报事故情况;3.2、负责现场临时设备抢救和对事态的控制;3.3、听从上级指挥人员的指挥..四、突发事件处理原则1.预防为主..立足安全防护;加强预警;重点保护基础信息网络和关系信息安全、稳定的重要信息系统;从预防、监控、应急处理、应急保障等环节;在管理、技术、人员等方面采取多种措施充分发挥各方面的作用;共同构筑安全保障体系..2.快速反应..突发事件发生时;按照快速反应机制;及时获取充分而准确的信息;跟踪研判;果断决策;迅速处置;最大程度地减少危害和影响..3.分级负责..按照“谁主管;谁负责”的原则;建立和完善安全责任制及联动工作机制..根据各负责人的职能;各司其职;加强各负责人的协调与配合;共同履行应急处置工作的管理职责..4.以人为本..把保障人员以及公共利益的安全作为首要任务..5.常备不懈..加强技术储备;规范应急处置措施与操作流程;定期进行预案演练;确保应急预案切实有效;实现网络与信息安全突发公共事件应急处置的科学化、程序化与规范化..五、机房应急开关机具体措施机房各设备关闭顺序如下:六、机房日常维护1、建立健全机房管理制度1.1在正常工作日内;信息技术部人员负责对机房进行监控;主要职责是:巡视网络设备及系统的运行情况;发生异常情况及时处理;消除网络故障隐患..1.2节假日期间技术人员轮流值班;负责处理有关异常情况..1.3机房采取来人来访登记制度;未经允许;无关人员不得进入公司机房区域..2、机房内严格采取防雷、防火、防尘、防静电等措施以及机房24小时监控等措施..3、认真做好数据备份工作;定期做一次数据库完全备份;每月检查服务器运行和备份情况..4、对机房的主要网络设备路由器、主干交换机等进行工作时间内全程监控;发现异常情况应及时进行处理;确保整个网络的正常运行..七、服务器及存储设备故障处理1、排错流程2、应急处置具体措施2.1 机房漏水应急预案1发生机房漏水时;第一目击者应立即通知运维服务小组;并及时报告监控系统突发故障应急领导小组..2若空调系统出现渗漏水;运维服务小组负责人应立即安排停用故障空调;清除机房积水;并及时联系设备供应方处理;同时启动备用空调;必要情况下可临时用备用空调对服务器进行降温..3若为墙体或机房门渗漏水;运维服务小组负责人应立即采取有效措施确保机房安全;及时清除积水;维修墙体或门窗;消除渗漏水隐患..2.2 设备发生被盗或人为损害事件应急预案1发生设备被盗或人为损害设备情况时;使用者或管理者应立即报告系统突发故障应急领导小组;同时保护好现场..2系统突发故障应急领导小组接报后;通知用户保卫部门、相关领导;一同核实审定现场情况;清点被盗物资或盘查人为损害情况;做好必要的影像记录和文字记录..3事发单位和当事人应当积极配合公安部门进行调查; 并将有关情况向系统突发故障应急领导小组汇报..4系统突发故障应急领导小组安排运维服务小组、事发单位及时恢复系统正常运行;并对事件进行调查..运维服务小组和事发单位应在调查结束后一日内书面报告系统突发故障应急领导小组..事态或后果严重的;应向相关领导汇报..2.3 机房长时间停电应急预案1定期检查机房供电设备的运行状况和电路线缆器材情况;当发生下列突发事件时;按照以下方案进行处置:2当机房发生市电供电突然停电或是电源异常时..首先应和后勤部门联系确认正常停电以及预计停电时间..检查不间断电源的电池可供电时间;确保设备正常运行;如遇到突然断电;应及时将空调等不在UPS电源供电范围内的设备及时断电;预防突然来电时瞬间电流过大导致设备损坏等现象..3当确定停电时间超出机房UPS承载范围后;首先确定停电的范围以及受影响的设备范围..并及时通知各部门做好停电应急准备..然后通知机房电源维护人和设备的负责人到达现场;做好各设备的电源停电准备..在UPS供电电量仅剩10%之后;严格按操作手册停掉各服务器的电源;最后停核心交换机和路由器;等待电力恢复..4当确定停电原因是在本身供电系统范围内;立即汇报给负责领导;并及时联系相关维护人员达到现场检修..对于恢复时间无法预计的;要通知后勤部门做好柴油机发电及移动电源车供电准备5恢复供电后;严格按照操作程序逐步恢复机房设备和UPS的供电;以防瞬间电流过大造成设备损坏..2.4 通信网络故障应急预案1发生通信线路中断、路由故障、流量异常、域名系统故障后;操作员应及时通知本单位信息系统管理员;经初步判断后及时上报运维服务小组和系统突发故障应急领导小组..2 运维服务小组接报告后;应及时查清通信网络故障位置;隔离故障区域;并将事态及时报告系统突发故障应急领导小组;通知相关通信网络运营商查清原因;同时及时组织相关技术人员检测故障区域;逐步恢复故障区与服务器的网络联接;恢复通信网络;保证正常运转..3 事态或后果严重的;应向应急指挥办公室和相关领导汇报..4应急处置结束后;运维服务小组应将故障分析报告;在调查结束后一日内书面报告系统突发故障应急领导小组..2.5 不良信息和网络病毒事件应急预案1发现不良信息或网络病毒时;信息系统管理员应立即断开网线;终止不良信息或网络病毒传播;并报告指挥调度中心运维服务小组和系统突发故障应急领导小组..2运维服务小组应根据系统突发故障应急领导小组指令;采取隔离网络等措施;及时杀毒或清除不良信息;并追查不良信息来源..3事态或后果严重的;应向监控中心办公室和相关领导汇报..4处置结束后 ;运维服务小组应将事发经过、造成影响、处置结果在调查工作结束后一日内书面报告系统突发故障应急领导小组..2.6 服务器软件系统故障应急预案1发生服务器软件系统故障后;运维服务小组负责人应立即组织启动备份服务器系统;由备份服务器接管业务应用;并及时报告系统突发故障应急领导小组;同时安排相关责任人将故障服务器脱离网络;保存系统状态不变;取出系统镜像备份磁盘;保持原始数据..2运维服务小组应根据系统突发故障应急领导小组的指令;在确认安全的情况下;重新启动故障服务器系统;重启系统成功;则检查数据丢失情况;利用备份数据恢复;若重启失败;立即联系相关厂商和上级单位;请求技术支援;作好技术处理..3事态或后果严重的;应向监控中心应急指挥办公室和相关领导汇报..4处置结束后;运维服务小组应将事发经过、处置结果等在调查工作结束后一日内报告系统突发故障应急领导小组..2.7 黑客攻击事件应急预案1当发现网络被非法入侵、网页内容被篡改;应用服务器上的数据被非法拷贝、修改、删除;或通过入侵检测系统发现有黑客正在进行攻击时;使用者或管理者应断开网络;并立即报告系统突发故障应急领导小组..2接报告后;系统突发故障应急领导小组应立即指令运维服务小组核实情况;关闭服务器或系统;修改防火墙和路由器的过滤规则;封锁或删除被攻破的登陆帐号;阻断可疑用户进入网络的通道..3运维服务小组应及时清理系统;恢复数据、程序;恢复系统和网络正常;情况严重的;应向监控中心应急指挥办公室和相关领导汇报;并请求支援..4处置结束后 ;运维服务小组应将事发经过、处置结果等在调查工作结束后一日内报告系统突发故障应急领导小组..2.8 核心设备硬件故障应急预案1发生核心设备硬件故障后;运维服务小组应及时报告系统突发故障应急领导小组;并组织查找、确定故障设备及故障原因;进行先期处置..2若故障设备在短时间内无法修复运维服务小组应启动备份设备;保持系统正常运行;将故障设备脱离网络;进行故障排除工作..3运维服务小组故障排除后;在网络空闲时期;替换备用设备;若故障仍然存在;立即联系相关厂商;认真填写设备故障报告单备查..4事态或后果严重的;应向监控中心应急指挥办公室和相关领导汇报..2.9 业务数据损坏应急预案1 发生业务数据损坏时;运维服务小组应及时报告系统突发故障应急领导小组;检查、备份业务系统当前数据..2运维服务小组负责调用备份服务器备份数据;若备份数据损坏;则调用磁带机中历史备份数据;若磁带机数据仍不可用;则调用异地备份数据..3业务数据损坏事件超过 2小时后;运维服务小组应及时报告系统突发故障应急领导小组;及时通知业务部门以手工方式开展业务..4运维服务小组应待业务数据系统恢复后;检查历史数据和当前数据的差别;由相关系统业务员补录数据;重新备份数据;并在工作结束后一日内报告系统突发故障应急领导小组..2.10 雷击事故应急预案1 遇雷暴天气或接上级部门雷暴气象预警;运维服务小组应及时报告系统突发故障应急领导小组;经请示同意后关闭部分服务器;切断电源;暂停内部计算机部分网络工作..2 雷暴天气结束后;运维服务小组报经系统突发故障应急领导小组同意;及时开通服务器;恢复内部计算机网络工作;对设备和数据进行检查..3 因雷击造成损失的;运维服务小组应会同相关部门进行核实、报损;并在调查工作结束后一日内书面报告系统突发故障应急领导小组..必要时;应向监控中心应急指挥办公室和相关领导汇报..2.11 空调设备故障应急预案若机房专用空调损坏;应第一时间启用机房备用空调;并通知厂家上门进行维修;并及时报告信息部相关领导请示;获得授权后按机房设备关闭顺序关闭各类设备..2.12 火灾事故应急预案1一旦机房发生火灾;应遵照下列原则:首先确保人员安全;其次保护关键设备、数据安全;三是保护一般设备安全;2人员疏散的程序是:机房工作人员立即按响火警警报;并通过119电话向公安消防请求支援;所有人员戴上防毒面具;所有不参与灭火的人员按照预先确定的线路;迅速从机房中撤出;3人员灭火的程序是:首先切断所有电源;启动自动喷淋系统或使用灭火器;灭火值班人员戴好防毒面具;从指定位置取出泡沫灭火器进行灭火..2.13 电源设备故障应急预案机房目前使用UPS系统;在紧急情况发生时;应按如下步骤进行关机:1确认所有负载均已安全关机..2关闭UPS负载电源..3将UPS的系统启用开关切换到off 的状态..4将电池连接断路器切换到off的位置..八、维护小组成员1. 现场服务人员联系方式2. 厂家协助服务人员联系方式。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档