故障管理故障处理流程规定

故障管理故障处理流程规定
故障管理故障处理流程规定

故障管理和故障处理流程规定

(暂行稿)

工程运维中心

二〇〇八年八月

目录

第一章目的 (3)

第二章工程运维中心在95013业务维护管理中的职责 (3)

第三章 95013业务故障分类 (3)

第四章故障处理的原则: (4)

第五章故障处理时限要求。 (4)

第六章故障管理和故障报告制度 (4)

第七章故障通报制度 (5)

第八章故障处理及报告流程图 (5)

第九章工程运维中心内部处理流程 (6)

第十章外部支持流程(研发、建设和其他厂家) (6)

第十一章工程运维中心各部门及公司相关部门的责任 (7)

第十二章故障的跟踪管理 (7)

附件一:95013业务重大/严重故障分析报告 (9)

第一章目的

工程运维中心承担95013业务网络和平台日常维护工作,为规范故障管理和故障处理的工作流程,使网络和平台故障能够得到正确及时地处理,保证 95013业务安全稳定的运行,特制定本规定。

第二章工程运维中心在95013业务维护管理中的职责

a)工程运维中心网管中心值班工程师和各分公司运维人员承担95013业务的日常运行监控和维护工作。

b)工程运维中心运维组负责95013平台的故障处理;各地分公司运维人员负责现场支持,并负责协调当地运营商的运维支持。

c)建立故障通报制度,如发生重大故障,应按照故障等级和故障上报流程逐级向上汇报。

d)定期召开网络质量分析会,遇有重大故障,应及时召开故障分析会。

负责全公司运维人员的技术业务培训,提高运维人员的技术维护水平和工作能力。

第三章 95013业务故障分类

95013业务系统和网络故障分为重大故障、严重故障和一般故障。

1.重大故障:全部业务中断

2.严重故障包括:

一种以上业务全部中断≥60分钟

一省以上业务全部中断≥60分钟

用户注册、业务受理全部中断≥4个小时

3.一般故障:除重大故障、严重故障以外的其它故障。

第四章故障处理的原则:

先抢通,后修复;先核心,后边缘;先本端,后对端;先网内,后网外,分故障等级进行处理。

第五章故障处理时限要求。

1. 重大故障,故障处理时限≤2小时。

2. 严重故障,故障处理时限≤4小时。

3. 一般故障,故障处理时限≤24小时。

第六章故障管理和故障报告制度

a)发生故障时,各级运维人员应按照故障等级和时间,逐级上报。

当严重故障时间≥1小时,运维组人员应报告给工程运维中心。

当严重故障时间≥2小时,上报给公司主管副总。

当严重故障时间≥4小时,上报给公司总裁。

当网络和平台出现重大故障时,各级运维人员应在第一时间逐级上报。

b) 对于95013业务系统各级故障,若在规定故障处理时限内未能恢复,故障级别自动上升一级,故障处理人员应按新的故障等级进行处理。

c) 重大故障发生或其他故障升级为重大故障后,如果超过故障处理时限1小时仍未能解决,需升级到工程运维中心协调解决;如果工程运维中心2小时内仍无法解决,需由工程运维中心升级上报到公司管理层。

d)重大故障处理结束1个工作日内,工程运维中心运维组应填写故障报告并上报工程运维中心。

e) 重大故障处理结束后的2个工作日内,提交《95013业务重大/严重故障分析报告》。第七章故障通报制度

1.客服通报:当出现故障时,工程运维中心应立即通知客服,通报故障影响范围、故

障处理可能需要的时间,以便客服对用户解释。故障解决业务恢复正常后,应及时通知客服部门。故障处理完以后,应向客服部门通报故障原因,以及采取的措施。

2.市场部和业务部门通报:工程运维中心根据故障的具体情况,向市场部或其他业

务部门通报。

第八章故障处理及报告流程图

总部运维组研发技术支持外部支持

1.故障输入包括网管监控发现故障、客服收到用户投诉、各地运维上报、市场业务部

门投诉和其他途径告知。

2.运维组制定专门人员,受理来自于其他部门的故障申告。

3.非值班人员发现故障后,请第一时间通知网管值班人员进行记录(录入事件管理平

台)并可要求值班人员配合故障处理及测试;故障恢复后请告知运维值班人员故障原因及处理方法,值班人员进行观察,确定故障确已恢复。

4.网管值班人员在发现故障或者接到故障通知后,需首先明确故障现象和影响范围,

确定故障级别。值班人员在有能力处理故障情况下应首先自行处理。在故障上报时限内处理完毕的故障应记录到值班日志里. (事件管理平台)。

5.当值班人员不能解决故障,且故障级别为一般故障,值班人员应记录到值班日志并

把故障情况录入事件处理系统平台。转由总部运维组工程师处理。

6.当故障级别在重大故障和严重故障,且值班人员不能解决或不能在上报时间内解

决故障,需在上报时间内电话通知技术支持人员,并记录在值班日志和事件处理系统平台里。

7.运维组人员如在上报时限内解决了故障,需在事件处理系统平台里关闭故障,并通

知值班人员,值班人员把情况记录到值班日志(事件管理平台)。

8.如运维组支持人员不能在上报时限里解决问题,须在上报时限内通知工程运维中

心负责人,并根据情况通知研发、建设部门或设备厂家相关人员,请求协助。

第十章外部支持流程(研发、建设和其他厂家)

1.业务发展中心研发的接口。业务发展中心协调员是研发的故障处理接口人,当运

维人员处理故障需要研发支持时,应该通知研发设计部门的协调专员。为提高效率,当遇到重大故障时,运维人员可以直接找相关研发人员寻求支持。

2.对于重大故障,所有外部支持都需要立即响应,积极配合,不得推诿。

3.故障处理人在故障处理完后需在事件处理系统平台里关闭故障,并通知值班人员,

值班人员把情况记录到值班日志(事件管理平台)。

第十一章工程运维中心各部门及公司相关部门的责任

1.工程运维中心的网管值班工程师负责网络日常监控,对于网管系统可以监控的故

障,网管中心必须在规定的故障发现时限内发现故障。运维组直接受理客服和其它途径报告的故障。网管中心值班工程师必须在规定时间对故障进行响应和上报。

2.运维组运维工程师负责处理网管值班工程师上报的故障,必须在规定时间对故障进

行响应和上报。运维工程师遇到自身不能处理的故障时,在上报时限内通知外部支持,可能是研发、建设、第三方设备厂家或运营商机房的值班工程师。

3.各地分公运维工程师负责本地平台的日常监控和维护,协助工程运维中心网管值班

工程师或者运维组运维工程师处理故障,提供现场技术支持。

4.业务发展中心技术支持人员负责处理自行开发设备的故障,在必要时也需要配合第

三方设备厂家定位问题。业务中心的技术支持人员必须在规定时间对故障进行响应。

5.任何部门都必须在规定的时间对故障响应,不得推诿。对于重大故障不及时响应,

导致故障不能及时恢复的,上报公司领导,根据情节严重做相应处罚。一般故障不能按规定时间响应的,上报工程运维中心。

第十二章故障的跟踪管理

1.值班日志

值班日志用于记录特定时间内所有重要的网络事件,故障是其中最重要内容之一。网管值班人员需要在值班日志里详细记录故障及故障处理情况,以便接班人员能清楚情况,并方便以后査询。所有故障都需要录入值班日志。

2.事件处理管理平台

事件处理管理平台主要用于故障的跟踪。故障的负责人要及时处理故障,如果不能解决,则应该及时把故障转给更合适的人员。严重级别为重大故障和严重故障的故障录入时需要抄送给工程运维中心负责人。当故障不能马上解决且会造成用户使用不正常时,需要抄送给客服部门、和市场管理部。

原则上所有故障都应录入事件处理管理平台,以下故障不需要录入事件处理管理平台:

立即解决,并且原因清楚的故障,

重复出现,不需要再收集数据的故障

补充:本管理规定自发布之日起执行。

本管理规定解释权归总部工程运维中心。

附件一:95013业务重大7严重故障分析报告

说明:

故障编号:定义GZBJ各地节点汉语拼音第一个字母)xxxx年xx月XX日如:GZBJ20061201

故障管理故障处理流程规定

故障管理和故障处理流程规定 (暂行稿) 工程运维中心 二〇〇八年八月 目录 第一章目的 (3)

第二章工程运维中心在95013业务维护管理中的职责 (3) 第三章 95013业务故障分类 (3) 第四章故障处理的原则: (4) 第五章故障处理时限要求。 (4) 第六章故障管理和故障报告制度 (4) 第七章故障通报制度 (5) 第八章故障处理及报告流程图 (5) 第九章工程运维中心内部处理流程 (6) 第十章外部支持流程(研发、建设和其他厂家) (6) 第十一章工程运维中心各部门及公司相关部门的责任 (7) 第十二章故障的跟踪管理 (7) 附件一:95013业务重大/严重故障分析报告 (9) 第一章目的 工程运维中心承担95013业务网络和平台日常维护工作,为规范故障管理和故障处理的工作流程,使网络和平台故障能够得到正确及时地处理,保证 95013业务安全稳定的运行,特制定本规定。 第二章工程运维中心在95013业务维护管理中的职责

a)工程运维中心网管中心值班工程师和各分公司运维人员承担95013业务的日常运行监控和维护工作。 b)工程运维中心运维组负责95013平台的故障处理;各地分公司运维人员负责现场支持,并负责协调当地运营商的运维支持。 c)建立故障通报制度,如发生重大故障,应按照故障等级和故障上报流程逐级向上汇报。 d)定期召开网络质量分析会,遇有重大故障,应及时召开故障分析会。 负责全公司运维人员的技术业务培训,提高运维人员的技术维护水平和工作能力。 第三章 95013业务故障分类 95013业务系统和网络故障分为重大故障、严重故障和一般故障。 1.重大故障:全部业务中断 2.严重故障包括: 一种以上业务全部中断≥60分钟 一省以上业务全部中断≥60分钟 用户注册、业务受理全部中断≥4个小时 3.一般故障:除重大故障、严重故障以外的其它故障。 第四章故障处理的原则: 先抢通,后修复;先核心,后边缘;先本端,后对端;先网内,后网外,分故障等级进行处理。 第五章故障处理时限要求。 1. 重大故障,故障处理时限≤2小时。

运维制度及流程

运行维护管理制度 2017年8月

目录3 3 3 5 6 6 7 8 8 9 9

1、总则 第一条为保障公司信息系统软硬件设备的良好运行,使员工的运维工作制度化、流程化、规范化,特制订本制度。 第二条运维工作总体目标:立足根本促发展,开拓运维新局面。在企业发展壮大时期,通过网络、桌面、系统等的运维,促进企业稳定可持续性发展。 第三条运维管理制度的适用范围:运维部全体人员。 2、编制方法 本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。 本实施细则以ITIL/ISO20000为基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。 3、运维部工作职责 一、负责网站运维和技术支持 (一)根据网站运营战略和目标,负责网站整体架构、栏目、应用系统等技术开发方案制定和组织开发,保障网站技术的稳定性和先进性。 (二)负责网站栏目和应用系统的使用培训和操作使用指南编

写,对用户使用过程中出现问题的沟通和解决; (三)网站设备和软件购买计划书的拟定,包括采购数量、品牌规格、技术参数。会同行政部进行采购。 (四)网站设备和软件操作规程和应用管理制度的制定,并负责监督执行。 (五)网站设备和软件安装、调试和验收,使用培训和维修保养。 (六)网站日常运行过程中信息安全和技术问题的协调解决,保障网站24小时安全稳定运行。 (七)网站技术服务外包管理,主要包括技术外包开发、运行服务托管和空间域名管理。 (八)负责网站管理系统及设备保密口令的设置和保存,保密口令设置后报中心主任备案,保密口令设定后任何人不得随意更改,保密口令每季度更新一次。 (九)负责网站新程序、新系统和网站改版升级方案技术的设计开发。 二、负责网站信息和技术安全 (一)执行国家和省上有关网络信息技术安全的法律法规,与通信管理和网络安全监管部门联络,及时处理网站信息技术安全方面存在的问题,确保网站安全、稳定、可靠运行。 (二)网站信息技术安全保密制度和工作流程的制定,落实信息技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人。

故障管理及故障处理流程规定

故障管理和故障处理流程规定 (暂行稿) 工程运维中心 二〇〇八年八月 目录 第一章目的 (3)

第二章工程运维中心在95013业务维护管理中的职责 (3) 第三章 95013业务故障分类 (3) 第四章故障处理的原则: (4) 第五章故障处理时限要求。 (4) 第六章故障管理和故障报告制度 (4) 第七章故障通报制度 (5) 第八章故障处理及报告流程图 (5) 第九章工程运维中心内部处理流程 (6) 第十章外部支持流程(研发、建设和其他厂家) (6) 第十一章工程运维中心各部门及公司相关部门的责任 (7) 第十二章故障的跟踪管理 (7) 附件一:95013业务重大/严重故障分析报告 (9) 第一章目的 工程运维中心承担95013业务网络和平台日常维护工作,为规范故障管理和故障处理的工作流程,使网络和平台故障能够得到正确及时地处理,保证 95013业务安全稳定的运行,特制定本规定。

第二章工程运维中心在95013业务维护管理中的职责 a)工程运维中心网管中心值班工程师和各分公司运维人员承担95013业务的日常运行监控和维护工作。 b)工程运维中心运维组负责95013平台的故障处理;各地分公司运维人员负责现场支持,并负责协调当地运营商的运维支持。 c)建立故障通报制度,如发生重大故障,应按照故障等级和故障上报流程逐级向上汇报。 d)定期召开网络质量分析会,遇有重大故障,应及时召开故障分析会。 负责全公司运维人员的技术业务培训,提高运维人员的技术维护水平和工作能力。 第三章 95013业务故障分类 95013业务系统和网络故障分为重大故障、严重故障和一般故障。 1.重大故障:全部业务中断 2.严重故障包括: 一种以上业务全部中断≥60分钟 一省以上业务全部中断≥60分钟 用户注册、业务受理全部中断≥4个小时 3.一般故障:除重大故障、严重故障以外的其它故障。 第四章故障处理的原则:

公司运维服务规范

某公司运维服务规范 第一章总则 第一条为保障公司运维工作有序开展,规范运维工作和人员的服务要求,避免人为操作不当引起的重大、关健运维事故,根据电信公司及公司维护管理办法要求,特制定本规范。 第二条本规范是公司运行维护管理的基本依据,维护岗位人员必须严格遵照执行。 第三条本规定的最终解释权在技术质量管理部。 第二章适用范围 第四条本规定所指的系统是指公司及各部门承接的运维项目中涉及的范围,按合同约定包括:网络设备、服务器、操作系统、应用系统、数据及保障项目正常运行的各项辅助设施。 第五条本规定适用于对各部门运维分管领导、运维管理员、运维项目经理及成员等各维护岗位人员(包括各部门外包员工)的运维管理要求。 第三章运维服务要求 第六条运维岗位人员要具备良好的工作作风和严谨的工作态度,服从管理,认真负责,坚守岗位,在问题面前不推诿、不拖拉、不盲目、不蛮干,要冷静分析、沉着处理。 第七条遵照公司各项运维管理制度及客户运维工作要求,严格执行维护工作服务规范,确保人员、系统及各项设施安全。具体要求

包括: (一)、基本维护要求 1、遵守客户业务管理和现场管理要求。 2、周期性的维护工作应经客户审批同意后方可实施。 3、因故障修复、功能升级等引起的系统版本升级和割接工作应经客户测试通过后方可实施。 4、未经客户同意,各维护岗位人员不得私自对客户的在线系统进行数据变更、数据统计、应用程序变更、系统参数调整、硬件设备调整。 5、维护外包人员须经业务和管理培训,明确岗位职责,通过部门考核确认后方可上岗。在客户现场以理想公司员工身份执行维护工作,遵循各项运维管理制度。 6、定期检查所维护系统的安全状况,为客户提出合理的预防处理措施。 (二)、故障响应/处理制度 1、遵照公司(故障控制管理办法)要求,在接到故障报修通知后,及时与用户取得联系后进行排障,故障排除后填写故障修复信息。 2、各维护岗位人员应确保通讯工作24小时畅通。 3、严格执行故障处理和处理逐级上报制度。 (三)、信息记录(维护资料管理) 1、建立健全系统维护文档和记录资料库,相关资料由各部门妥

基站故障处理流程规范报告

基站故障处理流程规范 1.概述 1.1 编制背景 为进一步规范移动基站处理流程,及时处理基站发生的故障,保证基站故障设备能够在最短时间得以恢复及对网络指标的影响降到最低,特制定基站故障抢修指导手册,以便基站维护人员发现、处理、分析故障问题提供参考。 1.2 编制单位 中国移动通信集团江西有限公司鹰潭分公司网络部 1.3 指标要求 按照基站维护服务技术规范书的要求,基站维护人员在接到设备障碍通知后,应及时到现场处理。 1.4 处理原则 1.维护人员应按“先室内,后室外,先软件,后硬件”的原则进行故障处理 工作,即在排除电力、光缆中断的因素后,再进入基站处理故障,在排除 软件吊死、数据丢失等软件原因后,再对调、更换硬件。 2.在充分了解故障信息的情况下,尽量缩短故障处理时长,更换需更换且 仅需更换的板件。因此,接到故障通知后,应根据通知内容对故障进行 预判断,以便采取针对性的处理措施,定位真正的故障点,避免错误信 息误导,延长故障恢复时间。 3.维护人员在故障处理过程中,需协调其它部门或单位解决问题时,应立 即展开协调并向上级报告相关进展情况。 4. 对载频,主控板,传输板等故障处理应禁止在网络指标考核 (8:00-11:00,18:00-20:00)时段进行处理

2. 故障处理流程

3. 基站故障分类及参考处理步骤 3.1基站载频退服 步骤1:先要求机房查看载频信令是否激活,即是否处于WO状态。如果载频信令没办法激活或已激活,整个BCF也已重启,但载频依然退服,则带上对应型号的载频。 步骤2:到站后,若扇区没开跳频,则闭掉一块正常工作的载频,将故障板件和它对调。若扇区开了跳频,则先叫机房闭站。 步骤3:对调后,重新集成,观察载频是否能正常工作,如果故障随着载频走,则用新板更换故障载频;如果故障依然存在原位置,则可能与载频硬件无关,需重新定位故障点。 步骤4:故障恢复后,处理板卡标签和固定资产变动,签好出入登记本以及故障处理记录,离开基站。 3.2基站因停电退服 步骤1:维护人员接到停电通知后,首先需询问当地电力公司,看该基站附近是否在做电力抢修,如果电力公司确定是在做电力抢修,详细了解将停电时长及恢复供电时间。 步骤2:在得到确切的时间后,根据基站固定资源调查表,或平时巡检表的信息,判断电池组的持续供电时间,如果电业局确定能恢复供电的时间很短,远小于电池组的安全供电时间,则不必带油机前往基站发电,但需每隔1小时跟踪一次供电恢复情况。如果电池组不能或勉强能撑到交流供电恢复时间,则需立即带上小油机去站上发电。 步骤3:根据基站的配置选定功率匹配并已经过检测完好的油机和电缆线,备足燃油和工具(万用表、钳形表、电笔、绝缘胶布以及其他常用工具)及时到达市电故障的基站。 具体油机选定方法举例如下:某基站通信设备直流负荷为45A(空调、照明除外),配置 GFM400Ah/48V蓄电池2组,开关电源为48V电源,基站由三相交

问题与故障处理流程图

NGBOSS3.0系统问题及故障管理流程 1、相关概念 1)问题定义:问题是一个或多个不知原因的事件。 2)问题与故障(或突发事件)的关系:当问题的影响符合故障(或突发事件)定义 标准时,问题即形成故障(或突发事件)。 3)故障处理小组:故障处理小组由各业务流的故障牵头处理人组成,共同完成故障 管理相关工作。目前业务运营中心故障处理小组包括话单流陈霞、订单流张嘉琦、账务流刘华、热线支持组马立娜及值班组阴衍亮。 2、故障处理 一、角色及职责定义 1)故障上报人 ●根据故障上报标准判断为故障后,第一时间按要求发出报告邮件,并电话通 知故障分派员。 ●对于符合故障或突发事件定义的问题,逐层升级至本部门主管经理;未达到 标准的通知主管,由主管酌情升级。 ●对于故障或突发处理过程中未按时限回复进展情况,由故障上报人直接升级 至故障分派员。 ●对于发生的故障,统一按业务运营中心内部要求进行登记。 ●故障上报人由业务运营中心50000号值班班长及运维组人员担当。 2)故障分派员 ●接收故障上报人的报障邮件和报障电话通知。

●根据故障情况,以邮件及电话方式指定故障处理牵头人。 ●根据故障牵头人要求,协助故障牵头处理人进行故障处理,跟进处理步骤, 监督执行。 ●故障分派员由值班组人员担任。 3)故障处理牵头人 ●牵头处理故障分派员分派的故障。 ●指派故障涉及的各部分人员协助进行故障处理,如有必要,可要求相关人员 现场支持。 ●跟踪整个故障处理过程,做好记录,评估各步骤的完成情况。 ●组织BMCC相关人员和相关厂商人员进行故障处理方案的制定,掌控整个过 程。 ●监督故障处理各重要步骤的执行,做好资源调度,在异常问题及时升级至相 关领导,协助完成资源调配。 ●在原因明确后、方案确认后、方案实施关键点完成后及时通报故障最新进展, 直至故障解决。。 ●根据故障处理情况及时向领导汇报故障处理情况。 ●与对外信息发布人及时沟通,协商确认对外发布口径。 ●记录问题处理过程,登记故障问题管理列表中的相关处理信息。 ●负责故障处理完成后,整理并填写故障分析报告,并按时提交。 ●总结及优化类似故障的处理步骤,为后续故障处理提供依据。 ●根据故障管理员的要求组织故障分析会、故障分享会,对故障进行总结分 析。

医院信息系统故障处理应急预案

医院信息系统故障处理应急预案 一、总则 (一)目得 为有效防范医院信息系统运行过程中产生得风险,预防与减少突发事 件造成得危害与损失,建立与健全医院计算机信息系统突发事件应急机制,提高计算机技术与医院业务应急处理与保障能力,确保患者在特殊情况下能够得到及时、有效地治疗,确保计算机信息系统安全、持续、稳健运行. (二)编写依据 根据《湖南省网络与信息安全应急预案》及国家信息安全相关要求与 有关信息系统管理得法律、法规、规章,并结合医院得实际,编制木预案。 (三)工作原则 统一领导、分级负责、严密组织、协同作战、快速反应、保障有力(四)适用范围 适用于医院计算机网络及各类应用系统 二、组织机构与职责 根据计算机信息系统应急管理得总体要求,成立医院计算机信息系统应急保障领导小组(简称应急领导小组),负责领导、组织与协调全院计算机信息系统突发事件得应急保障工作。 1.领导小组成员: 组长由院长担任。

副组长由相关副院长担任。 成员由信息中心、院办、医务科、护理部、财务科、医保办、总务科 等部门主要负责人组成。 应急小组日常工作由医院信息中心承担,其她各相关部门积极配合。 2。领导小组职责: (1 )制定医院内部网络与信息安全应急处置预案。 (2)做好医院网络与信息安全应急工作。 (3)协调医院内部各相关部门之间得网络与信息安全应急工作, 协调与软件、硬件供应商、线路运营商之间得网络与信息安全应急工作. (4)组织医院内部及外部得技术力量,做好应急处置工作。 三、医院信息系统出现故障报告程序 当各工作站发现计算机访问数据库速度迟缓、不能进入相应程序、不能保存数据、不能访问网络、应用程序非连续性工作时,要立即向信息中心报告?信息中心工作人员对各工作站提岀得问题必须高度重视,做好记录,经核实后及时给各工作站反馈故障信息,同时召集有关人员及时进行分析,如果故障原因明确,可以立刻恢复得,应尽快恢复工作;如故障原因不明、情况严重、不能在短期内排除得,应立即报告应急领导小组,在网络不能运转得情况下由应急领导小组协调全院各部门工作,以保障全院医疗工作得正常运转。 四、医院信息系统故障分级 根据故障发生得原因与性质不同分为三类与其它故障: 一类故障:由于服务器不能正常工作、光纤损坏、主服务器数据丢失、

各种应急预案及处理流程模板

一、突然停水应急预案 1、突然停水时,白天与总务科联系,夜间与院总值班联系,汇报停水情况,查询原因,及时维修。 2、加强巡视,随时解决患者饮水及用水需求。 3、供水方式: (1)联系未停水区。 (2)其他地方取水。 二、突然停水应急处理程序 突然停水 (白天)(晚上) 报告总务科报告院总值班 加强巡视,解决患者的饮用水需求 值班护士 联系停水区指导保洁员其他地方取水

一、突然停电应急预案 1、突然停电后,立即启动应急替代方法,维持抢救工作。 2、白天立即报告总务科,夜间报院总值班。 3、为病房点燃照明用蜡烛。 4、加强巡视病房,注意患者安全,注意防火防盗。 二、突然停电应急处理程序 突然停电 使用呼吸机患者,吸痰、洗胃者, 启用简易呼吸器维持呼吸启用30ml或50ml注射器抽吸 立即报告 (白天)(晚上) 总务科院总值班 点燃照明用蜡烛 巡视病房,注意患者安全,注意防火、防盗

火灾的应急预案与处理程序 一、火灾的应急预案 1、发现火情后立即呼叫周围人员,积极组织人员使用现有的灭火器材和水源灭火,同时报告保卫科(夜间报告院总值班)。 2、迅速切断电源。 3、发现火情无法扑灭,马上拨打119报警,告知准确方位。 4、迅速撤离疏散患者到安全地带,稳定患者情绪,保证患者生命安全,组织撤离时,不要乘坐电梯,可走安全通道,叮嘱患者用湿毛巾捂住口鼻,尽可能以最低的姿势或匍匐快速撤离。 5、撤出易燃易爆物品并抢救贵重仪器设备及重要科技资料。 6、关闭临近房间的门窗,以减慢火势扩散速度。 二、火灾的应急处理程序 发生火情 立即呼叫组织人员使用现有消防器材和水源灭火 报告保卫科(夜间报告院总值班) 火势猛烈时 打119报警

信息系统的应急预案

一、总则 (一)、基本原则:明确责任、分级负责。按照“谁主管谁负责”的原则,建立和完善责任制度、协调管理机制和联动工作机制。根据部门职能,各司其职,落实到人,加强部门间的协调与配合,形成合力,共同履行应急处置工作的管理职责。 (二)、适用范围:本预案适用于史丹利化肥有限公司网络与信息系统故障的应急响应工作。 二、日常准备工作 (一)、软资源备用:对重要信息资源需要有足够备份,并将备份存放于攻击和灾害不能及的地方。 (二)、设备备用:在工作现场有主板、硬盘、光驱、网线等备件,以及备用的外部设备。 (三)、电源备用:配置不间断UPS电源。不间断电源可在断电后维持工作3小时以上。 (四)、重要或大型系统中的关键设备和信息安全产品采用双机热备份。 三、应急处理流程 信息管理科人员在监控过程中发现或收到其他部门反馈不能正

常使用办公或业务应用系统等故障事件,相关软件、硬件的技术人员立即行动,初步查明原因(电力、服务器、存储、网络、应用系统软件等),并向科室、部门相关领导汇报。 部门领导在听取情况汇报后,根据事件的范围、影响和紧急程度启动相应的专题预案。如果没有相应的专题预案,要根据情况迅速采取措施抑制事件的扩散,恢复系统运行。 信息管理科尽快通过OA、电话、短信平台、网上销售系统网站等方式向各科室、各分厂下发《应用系统暂停通知》或公告。各部门、各分厂要做好信息系统出现故障后的应急安排,尽力减小对公司正常业务的影响。 信息管理科人员进一步落实故障原因,根据事件的范围、影响程度,采取应急措施,尽快恢复系统运行。 信息管理科在对系统完成修复后,在完成测试的基础上,经请示相关领导进行系统的启用,同时通过OA、网上销售系统网站、电话等向各部门、各分厂发布系统恢复公告。 四、事件分类 事件类型按照各种突发紧急事件的影响范围,将史丹利网络与信息系统事件分成全局事件(总公司核心信息系统因电力、网络、软硬件等故障原因,导致全厂信息系统无法正常工作)和区域事件(SAP、网上销售系统、OA、BO、用友等系统故障,导致局部范围内的业务工作无法正常进行)。 五、全局事件处理

监控系统故障应急处置措施

监控系统故障应急处置措施 一、监测监控故障应急处理措施 故障处置负责人:张谦具体处置人员:刘海龙张雷 故障处置程序: 1、监控值班员发现传感器断线,或接到现场施工人员汇报传感器断线后,要立即向值班领导汇报。 2、根据领导指示检查监控主机设置是否正确,且是否将控制范围内电源切断。 3、联系施工现场班组长或电工,检查传感器航空插头线,并重接。如恢复故障处置完毕。 4、上述过程不能恢复,监控维修值班员要带好备件及抢修工具及时赶赴现场,到达现场后,监控维修值班员由施工队组电工配合,从分站到传感器各接点一一排查,直至更换传感器或更换分站接口。 4、故障处置完毕后,监控维修值班员在现场电话联系监控值班员确认数据上传是否正常。监控系统正常运行后方可上井。 (二)、分站断线不能上传数据。 故障处置程序: 1、监控值班员发现一分站所有传感器断线不能上传数据时,要立即向值班领导汇报。 2、根据领导指示检查监控主机设置是否正确,且是否将控制范围内电源切断,监控主机与该分站的网络通讯是否正常。a、如该分站的网络节点与监控主机通讯不正常,到环网交换机处更换分站网络

节点,由监控值班员重新设置。b、如该分站的网络节点与监控主机通讯正常,立即下井检查,分站电源供电是否正常、环网交换机与分站的连接线是否短路或断路,直至故障处置完毕。 3、故障处置完毕后,监控维修值班员在现场电话联系监控值班员确认数据上传是否正常。监控系统正常运行后方可上井。 (三)、环网交换机断线不能上传数据。 故障处置程序: 1、监控值班员发现若干分站所有传感器断线不能上传数据时,要立即向值班领导汇报。 2、根据领导指示检查监控主机设置是否正确,且是否将控制范围内电源切断,断线分站是否同属一台环网交换机,如不同属一台环网交换机,按分站断线处置。如同属一台环网交换机,立即检查监控主机与该环网交换机的所有网络节点的通讯是否正常。a、如该环网交换机的所有网络节点与监控主机通讯不正常,要及时赶赴现场检查环网交换机电源是否供电正常或现场更换环网交换机,由监控值班员重新设置。b、如该环网交换机的部分网络节点与监控主机通讯正常,立即更换故障分站的网络节点,由监控值班员重新设置。 3、故障处置完毕后,监控维修值班员在现场电话联系监控值班员确认数据上传是否正常。监控系统正常运行后方可上井。 (四)、监控主机故障,不能实时监控。 故障处置程序: 1、监控值班员发现监控主机不能运行时,要立即向值班领导汇

问题及故障处理流程

系统问题及故障管理流程 1、相关概念 1)问题定义:问题是一个或多个不知原因的事件。 2)问题与故障(或突发事件)的关系:当问题的影响符合故障(或突发事件)定义标 准时,问题即形成故障(或突发事件)。 3)故障处理小组:故障处理小组由各业务流的故障牵头处理人组成,共同完成故障管 理相关工作。目前业务运营中心故障处理小组包括话单流陈霞、订单流张嘉琦、账 务流刘华、热线支持组马立娜及值班组阴衍亮。 2、故障处理 一、角色及职责定义 1)故障上报人 ●根据故障上报标准判断为故障后,第一时间按要求发出报告邮件,并电话通知 故障分派员。 ●对于符合故障或突发事件定义的问题,逐层升级至本部门主管经理;未达到标 准的通知主管,由主管酌情升级。 ●对于故障或突发处理过程中未按时限回复进展情况,由故障上报人直接升级至 故障分派员。 ●对于发生的故障,统一按业务运营中心内部要求进行登记。 ●故障上报人由业务运营中心50000号值班班长及运维组人员担当。 2)故障分派员 ●接收故障上报人的报障邮件和报障电话通知。 ●根据故障情况,以邮件及电话方式指定故障处理牵头人。 ●根据故障牵头人要求,协助故障牵头处理人进行故障处理,跟进处理步骤,监 督执行。 ●故障分派员由值班组人员担任。 3)故障处理牵头人 ●牵头处理故障分派员分派的故障。 ●指派故障涉及的各部分人员协助进行故障处理,如有必要,可要求相关人员现 场支持。 ●跟踪整个故障处理过程,做好记录,评估各步骤的完成情况。 ●组织BMCC相关人员和相关厂商人员进行故障处理方案的制定,掌控整个过程。 ●监督故障处理各重要步骤的执行,做好资源调度,在异常问题及时升级至相关 领导,协助完成资源调配。 ●在原因明确后、方案确认后、方案实施关键点完成后及时通报故障最新进展, 直至故障解决。。 ●根据故障处理情况及时向领导汇报故障处理情况。 ●与对外信息发布人及时沟通,协商确认对外发布口径。

运维管理制度

运维管理制度 XXXXXX有限公司2014年5月18日

目录 引言 (1) 1、总则 (2) 2、编制方法 (2) 3、运维部工作职责 (2) 3.1系统运维和技术支持 (2) 3.2.平台信息和技术安全 (3) 4、运维服务管理体系 (4) 4.1运维服务管理对象 (4) 4.2运维系统功能框架 (4) 4.3运维管理组织结构 (5) 4.3.1项目负责人 (5) 4.3.2项目经理 (5) 4.3.3技术主管 (6) 4.3.4服务台 (6) 4.3.5网络管理员 (7) 4.3.5应用、数据库管理员 (7) 4.3.7终端管理员 (7) 4.4运维服务流程 (8) 4.4.1项目运维服务工作流程图 (9) 4.4.2服务台 (9) 4.4.3事件管理 (10) 4.4.4工单管理 (10) 4.4.5问题管理 (10) 4.4.6变更管理 (10) 4.4.7配置管理 (11) 4.4.8知识库管理 (11) 4.4.9统计及工作报告 (11) 5、运维服务内容 (11) 5.1服务目标 (11) 5.2IT资产统计服务 (12) 5.3网络、安全系统运维服务 (12) 5.4主机、存储系统运维服务 (13) 5.5数据库系统运维服务 (13) 5.6中间件运维服务 (14) 5.7终端、外设运维服务 (14) 6、应急服务响应措施 (14) 6.1应急预案实施基本流程 (15) 6.2突发事件应急策略 (15) 7、服务管理制度规范 (16) 7.1服务时间 (16) 7.2行为规范 (16)

001-2 办公信息系统协同管理及协同数据交换策略研究运维制度引言 本文件是依据《XXXXXX系统协同管理及数据交换策略研究》分任务要求,完成“运维制度”的研究工作。 课题组参照国际国内标准有: ITIL/ISO20000标准 GBT 28827.1-2012 信息技术服务运行维护第1部分:通用要求 GBT 28827.2-2012 信息技术服务运行维护第2部分:交付规范 GBT 28827.3-2012 信息技术服务运行维护第3部分:应急响应规范 结合XXX课题应用实施及运维管理的实际情况研究、编制运行维护管理制度,本文分为7章内容分别为: 1.总则 2.编制方法 3.运维部工作职责 4.运维服务管理体系 5.运维服务内容 6.应急服务响应措施 7.服务管理制度规范等内容。

信息系统(设备)故障处理制度

信息系统(设备)故障处理制度(试行) (2018年8月版) 第一章总则 为规范公司信息系统的故障申告、受理、处理和修复后业务验证等日常维护支撑和管理工作,保证故障申告、受理、处理和业务验证的及时性和有效性,进一步明确各部门的职责、工作流程、相关要求以及考核指标,特制定本制度。 第一条适用范围 本制度所指信息系统包括:机房环境、配套网络、计算机硬件平台、基础软件、应用软件。 第二章故障处理流程 第二条信息系统的分类 将信息系统分为重要信息系统和非重要信息系统两类。重要信息系统是指支撑公司重要业务,信息安全和服务质量的信息系统。包括面向客户、涉及账务处理且实时性要求较高的业务处理类、渠道类和涉及客户风险管理等业务的管理类信息系统,以及支撑系统运行的机房和网络等基础设施。非重要信息系统是指除重要信息系统之外的信息系统。 第三条信息系统故障分级 据信息系统故障的影响范围及持续时间等因素,将信息系统故障分为重大故障、较大故障、一般故障三个级别。当故障满足多个级别的定级条件时,按最高级别确定故障级别。 重大故障(一级): 由于线上系统服务宕机,系统的操作性能严重降低,重要信息系统服务异常,在主要业务服务时段导致业务无法正常开展达3个小时(含)以上,对业

务运作造成重大影响。 较大故障(二级): 由于系统操作功能受损,使业务运作中的某一部分功能受到不良影响,但其它部分业务功能仍可正常运作,重要信息系统服务异常,在主要业务服务时段导致业务无法正常开展达半个小时(含)以上, 一般故障(三级): 由于系统的操作性能(效率)降低,业务运作的受到不良影响,但业务功能应用仍可正常工作,在主要业务服务时段导致业务无性能不足达1个小时(含)以上; 第四条执行标准 本制度由负责解释和修订,自发文之日起开始执行。 第五条组织及职责,故障管理实行-两级管理体系 本制度涉及的相关组织有信息系统故障申告部门、受理部门、处理部门。 1、申告部门包括、分支机构相关信息系统的使用部门。申告分为、和三个层面。申告到层面能够解决的故障和问题,无须上报层面,在层面归口解决,解决不了的再上报层面解决。 2、受理部门分为和两个层面。原则上,负责故障受理和预处理,各负责级故障受理和预处理。 3、处理部门分为和两个层面。原则上,负责上报到的故障处理;各负责级的故障处理;科技联系人负责级的简单故障处理。 申告部门职责 1.负责将发现的系统故障以及问题、建议提交到故障受理部门。 2.负责在故障处理过程中与故障处理部门进行沟通。 3.负责对已修复的故障进行业务验证,在业务验证通过后及时关闭故障。 受理部门职责

设备故障应急处理预案完整版本

设备故障应急处理预案 1 设备维修程序 1.1 设备需要维修,使用部门如实填报报修单,部门负责人签字后送工程部。 1.2 急需维修时,使用部门也可直接电话通知工程部。 1.3 工程部接报修单或电话后应在5分钟内及时派工,维修人员到达现场后,凭报修单进行维修。特殊情况可先维修,然后补报修单。 1.4 修复后使用部门应在报修单上签字认可。 1.5 无法修复时,维修工应将无法修复的原因写在报修单上,签字并送工程部负责人手中 1.6 工程部负责人根据情况,属零配件问题的,可按程序填报申报表;属技术原因无法修复的,在2-4小时内报主管总经理。 1.7 关于维修时现场维修应注意的礼仪,按《维修服务规范》执行。 2 公共部位巡查检修对于几个部门共同使用且较难界定由谁负责的公共部位设施设备,工程部派人进行巡查检修。每周一次,做好记录,一般故障由巡查员现场修复,重大故障由巡查员汇报当班负责人后安排检修。 当设备发生故障时 1、先停用故障设备,起动备用设备,防止故障设备的故障扩大及防止影响服务区域。 2、自动化的设备失灵后,即安排人员进行手动操作确保服务区域正常,与此同时再积极组织抢修。 3、降低设备的负荷,减少服务范围,尽力保证不影响对客服务。 4、如空调设备发生问题时,应严格控制新风量,确保空调区域的温度。 停电 一、事故停电 1、事故停电是指外供电线路发生事故造成停电,这种停电分大面积停电无法恢复和瞬间闪断两种。 2、事故停电由于属于突发事件,所以情况一般都非常紧急需要各部门协调工作。 3、配电值班人员发现停电后要第一时间询问供电部门停电原因,及时通知大堂副理、夜间要通知值班经理、部门经理、及酒店各相关值班岗位。

设备故障处置过程中的九大错误与解决办法

设备故障 处置过程中的九大错误与解决办法设备故障处理是设备管理和维修人员经常会面对的问题之 O 维修人员在日常的设备故障检查处理过程中,外部受时间、环境、人员等方面的压力,内部受维修人员本身的技术水平、经验、设备熟悉程度、人员身体精神状态等的影响,这些因素,会对故障快速、准确的处置造成一定的影响。 维修人员对设备故障的排查和处置不当,会导致故障处置时间、人力、成本等的增加,或为下次故障留下隐患。 问题一.不能正确判断分析故障,盲目大拆大卸 1、现象: —些维修人员由于对机械结构、原理不清楚,未认真分析清楚故障原因,不能准确判断故障部位,凭着〃大概、差不多〃的思想盲目对机械大拆大卸,结果不但原故障未排除,而且由于维修技能和工艺较差,又出现新的问题。 2、解决办法: 当机械出现故障后,要通过检测设备进行检测,如无检测设备,可通过"问、看、查、试〃等传统的故障判断方法和手段,结合工程机

械的结构和工作原理,确定最可能发生故障的部位。在判定工程机械故障时,一般常用〃排除法〃和〃比较法",按照从简单到复杂、先外表后内部、先总成再部件的顺序进行,切忌"不问青红皂白,盲目大拆大卸"。 问题二■盲目更换零部件,一味"换件修理" 1、现象: 有些维修人员一贯采用换件试验的方法,不论大件小件,只要认为可能是导致故障的零部件,一个一个更换试验,结果非但故障没排除,且把不该更换的零部件随意更换了,增加了消费者的开支。还有些故障零部件完全可以通过修理恢复其技术性能,不需要复杂修理工艺即可修复,但维修人员却要求用户更换新件,一味采取〃换件修理"的方法,造成严重的浪费。 2、解决办法: 在维修时,应根据故障现象认真分析判断故障原因及部位,对能修复的零部件要采取修理的方法恢复技术性能,杜绝盲目更换零部件的做法。 问题三、不检查新件质量,装配后出现故障 1、现象: 在更换配件前,有些维修人员对新配件不做技术检查,皇来后直接安装到设备上,这种做法是不科学的。目前市场上出售的零配件质量良

运维体系说明

运维体系说明 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-MG129]

投标人运维体系说明我公司为用户提供免费技术服务热线,在接到用户请求后,根据请求情况协调公司资源,第一时间给用户反馈并解决问题。 运维组织架构 运维流程 技术支持服务热线工作流程图 1、诊断故障并提交故障诊断报告 根据系统运行过程中出现的系统故障或其它异常情况,及时进行故障诊断,并提出故障诊断报告。故障诊断报告的主要内容包括:故障现场情况记录、故障的级别和紧急处理过程记录等。 2、制定系统维护和故障恢复的实施计划 根据提交的故障诊断报告,制定系统维护和故障恢复的实施计划。按照制定的计划实施系统维护工作。 3、管理、监督维护计划的实施 组成系统维护工程管理和监督工作组,全面负责管理和监督系统维护工作实施过程(应包含用户方与项目承包商双方)。并根据系统维护实施的各个阶段提交维护工作报告。 4、确认维护工作完成并提交维护报告 在系统维护工作完成后,由系统维护人员提交系统维护工作报告,由用户方项目组的技术人员对系统维护情况进行测试并予以确认。 5、提交成果 每次系统维护工作完成后,都应提交如下的报告、记录等文档等资料:

故障诊断报告 系统维护和故障恢复的实施计划 维护工作阶段报告 系统维护工作报告 说明:紧急情况下,以排除故障,满足用户需要为首要任务,可以进行紧急处理,但事后要补充相应文档与记录。 现场服务流程 众所周知,最优的售后服务是一个项目的承建商必须做出的承诺。但是,如何根据用户的实际情况(人员素质、计算机应用水平、系统的要求等),做出切合实际的项目售后服务计划书,才是用户关注的问题。优质的售后服务也一直是我们公司在经营活动中最基本的原则。公司的技术支撑部门担负着专业的服务工作,无论是在系统的安装调试过程中还是在系统投入运行之后,无论发生任何问题用户都可以得到最快的响应,售后服务流程如下图所示: 售后服务流程 社会保险的组织结构、计算机应用水平、系统对人员素质要求等情况的分析,我们认为:社会保险信息系统稳定运行是保证本项目建设成功的一项关键因素。 公司提供的服务内容包括: 应用软件运行维护:应用软件自身缺陷的调整,为客户及时解决日 常运行中出现的问题。

管理信息系统开发过程中存在的问题及怎么解决

管理信息系统开发过程中存在的问题及怎么解决 1.对管理信息系统的认识有偏差 管理信息系统的建设与评价侧重计算机硬件配置.而不是信息开发与利用的方法和深度.这种误读给国内外许多组织的管理信息系统带来惨重损失。 2.目标不明确 管理信息系统开发前调研不够充分,分析不够清楚明了,就比如开发的工作人员中,对整个系统所需要达到的目标没有基本的,明确的、全面的的概念,就照着自己的想法做下去,进行设计和开发,做了大量工作后才发现设计不能满足用户的需要,而使得系统开发失败,重新开发设计,这样就浪费了大量的人力、物力、财力以及时间。 3.开发时忽视了高层领导者的态度 有时候开发人员本着自己的意愿设计并开发出了管理信息系统,尽管系统很好,但领导不满意属下擅自动手,不听指挥,从而浪费了时间,资源和心血,还加剧了与领导之间的隔阂。并且在没有领导的授权和支持下,能开发出一个好的信息系统很是艰难。 4.开发时缺乏既懂计算机知识又懂管理业务的复合型人才,并且人员之间的合作能力较差 “只要熟练掌握几门计算机语言,就可以成为一个优秀的信息系统开发人员”这种观点是极其错误的。计算机程序设计语言是实现计算机信息系统的一种工具或手段,编码只不过是计算机信息系统开发过程中的一小部分工作,管理信息系统开发是一项多人群体性的任务,需要很好的合作与协调,没有这些很难开发出所需要的系统,并且会使系统开发周期变长,无针对性。 5.教育、理论体系研究落后 在教育方面主要表现在教学内容陈旧,理论落后于实践,理论在某种程度上又脱离实践,在教学中往往注重学生的编程技巧能力培养,而忽视系统分析、设计能力的培养,学生的实践能力差,团队合作能力差,系统开发本身还缺乏一套严格的理论基础以及缺少一套简单有力的开发工具。 6.开发后缺乏软件测试,并且安全性有待提高 软件测试是开发过程的必要过程,不进行的话,很难知道是否达到预先的要求,实现想要达到的目的,安全性问题在我国是一个很大的问题,山寨,盗版比较猖獗,这增加了开发的成本并严重影响了更新的速度。

日常运维管理制度

日常运维管理制度 令狐采学 1.运维保障机制 (1)建立硬件、网络、系统、应用及业务软件日常维护流程机制; (2)建立故障应急处理流程机制; (3)建立备份恢复保障机制; (4)建立安全保障管理机制; (5)建立版本管理机制,管理平台生产环境运行的软件版本; 以上机制应形成文档,作为日常遵循规范,按要求执行。2.硬件维护能力 需对硬件设备具备7*24小时不间断的支持、响应能力,原则上每日对硬件设备至少健康检查一次并记录;定期对网络环境进行检查。我公司服务器部署在移动云上定期通过命令进行硬件检测,内存、硬盘、I/O的使用情进行查询并进行登记,每台服务器运行的软件对硬件性能使用情况检测,对于服务器我们进行系统备份、软件,每日对网络使用情况进行观察,针对突发异常流量进行分析。

3.故障处理响应及要求 设备(系统)出现故障时,根据不同的故障级别提供相应的服务响应,响应方式及要求如下: 4.具备应急预案 针对部署国家平台节点服务器我们实施系统备份、软件重要数据实时备份,主机备份是提供的保留某个时间点上的主机系统数据状态的服务。基于主机备份可以随时生成或删除备份,并基于已备份进行主机的恢复,实现已有应用和主机数据

的快速复用,如系统出现事故无法使用将进行系统恢复并把最近一次备份的数据进行恢复。对于突发情况建立应急服务流程,主要是针对可能发生的各种意外情况设计应急的方案,以控制和规避突发事件带来的集中性风险,从而降低设备集中性风险所造成的损失,制定以下流程图: 为保证服务实施的质量能够稳定并不断有所提升,保障客户需求能够得到有效满足,保障服务实施团队为客户提供统一、标准

医院信息系统故障处理应急预案

检验科信息系统故障处理应急预案 一、编制目的 为有效防范医院信息系统运行过程中产生的风险,预防和减少突发事件造成的危害和损失,建立和健全医院计算机信息系统突发事件应急机制,提高计算机技术和检验科业务应急处理和保障能力,确保患者在特殊情况下能够得到及时、有效地治疗,确保计算机信息系统安全、持续、稳健运行。 二、编制依据 根据《内蒙古网络与信息安全应急预案》及国家信息安全相关要求和有关信息系统管理的法律、法规、规章,并结合医院的实际,编制本预案。 三、适用范围 适用于检验科各类应用系统 四、组织机构 根据计算机信息系统应急管理的总体要求,成立检验科计算机信息系统应急保障领导小组(简称应急领导小组),负责领导、组织和协调检验科计算机信息系统突发事件的应急保障工作。 (一)人员构成: 组长:田永丽 副组长:李阳,段弘张建强凌海峰

成员:何斌兰宁王元霞李建雄邓小英董敖渤贾姝洁 段立志刘晶 (二)工作职责: (1)制定检验科内部网络与信息安全应急处置预案。 (2)做好检验科网络与信息安全应急工作。 (3)协调医院内部各相关部门之间的网络与信息安全应急工作,协调与软件、硬件供应商、线路运营商之间的网络与信息安全应急工作。 (4)组织医院内部及外部的技术力量,做好应急处置工作。 五、应急处置程序 (一)医院信息系统出现故障报告程序 当各工作站发现计算机访问数据库速度迟缓、不能进入相应程序、不能保存数据、不能访问网络、应用程序非连续性工作时,要立即向信息中心报告。信息中心工作人员对各工作站提出的问题必须高度重视,做好记录,经核实后及时给各工作站反馈故障信息,同时召集有关人员及时进行分析,如果故障原因明确,可以立刻恢复的,应尽快恢复工作;如故障原因不明、情况严重、不能在短期内排除的,应立即报告应急领导小组,在网络不能运转的情况下由应急领导小组协调全院各部门工作,以保障全院医疗工作的正常运转。 (二)医院信息系统故障分级 根据故障发生的原因和性质不同分为三类和其它故障:

(完整word版)运维系统及中心机房应急预案

运维小组应急预案 随着网络信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务。为确保系统及机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。 本预案共分为应用系统故障应急流程和机房突发事件应急流程 系统故障应急流程 一、系统故障应急流程说明 1、故障发生 系统运维服务小组可从以下途径得知故障的发生: 1.1、运维服务中心通过网管告警发现故障 1.2、维护站点通过维护巡检发现故障 1.3、用户发现故障,报给呼叫中心 1.4、驻场工程师发现故障 2、报障受理 监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况。 3、信息研判 运维服务小组根据了解到的系统故障情况进行分析判断,以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案。 4、预案启动 如需启动应急预案,则立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进行全面管控处理。 5、资源确认

系统突发故障应急预案启动后,首先是根据现场突发故障实际状况、紧急程度、技术难度、备品备件等情况对相关资源(主要是参与人员)依据经验进行调度和确认,主要有以下资源: 我公司技术支持人员; 相关厂家技术支持人员; 我公司聘请的技术专家 6、预案执行 按照既定的预案进行突发故障抢修,如遇到问题及时向系统突发故障应急领导小组汇报。 7、预案终止 预案的终止时间由故障现场技术人员根据现场的实际进展情况,在与用户单位有关部门协调后报系统突发故障应急领导小组决定。 8、结果上报 预案中止后,相关预案参与人员将整个事件过程中的经验和教训,修改、完善事件应急预案。然后集中上报至系统突发故障应急领导小组。

相关文档
最新文档