第五章 故障管理
服务器故障处理手册范本

服务器故障处理手册范本第一章:引言服务器是现代信息技术发展中不可或缺的一部分。
然而,随着服务器使用量的增加,服务器故障的频率也随之增加。
为了保障服务器的稳定运行和数据的安全,有必要建立一份服务器故障处理手册,以指导运维人员在遇到故障时能够快速定位和解决问题。
本手册旨在为管理员提供一份范本,帮助其根据实际情况定制适合自身服务器环境的故障处理手册。
第二章:故障识别与分类2.1 故障识别服务器故障的识别是故障解决的第一步,常见的故障识别包括网络连接、硬件故障、系统崩溃等。
管理员需要通过日志、系统监控工具等手段来定位故障原因。
2.2 故障分类根据故障的性质和影响程度,可以将故障分为紧急故障、一般故障和次要故障。
不同类型的故障需要采取不同的处理策略和时间安排,管理员应根据实际情况进行分类。
第三章:紧急故障处理3.1 紧急故障定义紧急故障指的是服务器遭遇停机、系统崩溃等导致业务无法正常进行的故障,处理紧急故障时需要迅速且高效地恢复服务器功能。
3.2 紧急故障处理流程1. 迅速通知相关人员:管理员应立即通知上级、相关技术人员和业务人员,确保所有人员都能及时响应。
2. 开启备用服务器:若有备用服务器,应及时切换至备用服务器,确保业务的持续运行。
3. 分析故障原因:管理员通过查看日志、排除硬件故障等方式,尽快确定故障原因。
4. 发布紧急修复方案:管理员需根据故障原因和解决方法,编写紧急修复方案,并尽快发布给相关人员。
5. 实施修复方案:相关人员按照修复方案进行操作,确保服务器功能的快速恢复。
6. 监测与验证:恢复服务器功能后,管理员需要对服务器进行监测和验证,确保故障已经解决。
7. 故障报告和总结:管理员需撰写故障报告和总结,包括故障原因、处理过程、修复方法等信息,以供后续参考和优化。
第四章:一般故障处理4.1 一般故障定义一般故障指的是服务器遇到影响业务但非立即崩溃的故障,处理一般故障时需要在较短的时间内解决问题,并确保业务正常进行。
供电公司故障管理制度

第一章总则第一条为确保供电公司电力设备安全稳定运行,提高故障处理效率,保障电力供应的连续性和可靠性,特制定本制度。
第二条本制度适用于供电公司内部所有电力设备的故障处理工作。
第三条故障处理工作应遵循“预防为主、防治结合、快速响应、安全第一”的原则。
第二章故障分类与分级第四条故障分类:(一)一般故障:指对供电系统运行影响较小的故障;(二)重大故障:指对供电系统运行影响较大,可能导致停电的故障;(三)紧急故障:指对供电系统运行影响极大,可能导致大面积停电的故障。
第五条故障分级:(一)一级故障:影响整个供电区域或重要用户的供电;(二)二级故障:影响部分供电区域或重要用户的供电;(三)三级故障:影响个别用户的供电。
第三章故障处理流程第六条故障报告:(一)发现故障后,应及时向故障处理中心报告;(二)报告内容包括:故障时间、地点、现象、影响范围、初步判断等。
第七条故障处理:(一)故障处理中心接到报告后,应立即组织相关人员进行分析、评估;(二)根据故障等级,制定相应的处理方案;(三)故障处理人员应按照处理方案,迅速开展故障排查和修复工作。
第八条故障修复:(一)故障修复前,应做好安全措施,确保人员和设备安全;(二)修复过程中,应遵循规范操作,避免造成二次故障;(三)修复完成后,应进行试运行,确保故障已完全消除。
第九条故障总结:(一)故障处理后,应及时进行总结,分析故障原因,制定预防措施;(二)将故障处理情况及预防措施上报相关部门。
第四章安全管理第十条故障处理人员应具备相应的专业技能和应急处置能力。
第十一条故障处理过程中,应严格遵守安全操作规程,确保人员和设备安全。
第十二条故障处理现场应设立警戒线,设置安全警示标志,防止无关人员进入。
第五章考核与奖惩第十三条对在故障处理工作中表现突出的个人和集体,给予表彰和奖励。
第十四条对因工作失误导致故障扩大或造成安全事故的,依法依规追究责任。
第六章附则第十五条本制度由供电公司负责解释。
故障管理和故障处理流程规定

故障管理和故障处理流程规定(暂行稿)工程运维中心二〇〇八年八月目录第一章目的 (3)第二章工程运维中心在95013业务维护管理中的职责 (3)第三章 95013业务故障分类 (3)第四章故障处理的原则: (4)第五章故障处理时限要求。
(4)第六章故障管理和故障报告制度 (4)第七章故障通报制度 (5)第八章故障处理及报告流程图 (5)第九章工程运维中心内部处理流程 (6)第十章外部支持流程(研发、建设和其他厂家) (6)第十一章工程运维中心各部门及公司相关部门的责任 (7)第十二章故障的跟踪管理 (7)附件一:95013业务重大/严重故障分析报告 (9)第一章目的工程运维中心承担95013业务网络和平台日常维护工作,为规范故障管理和故障处理的工作流程,使网络和平台故障能够得到正确及时地处理,保证 95013业务安全稳定的运行,特制定本规定。
第二章工程运维中心在95013业务维护管理中的职责a)工程运维中心网管中心值班工程师和各分公司运维人员承担95013业务的日常运行监控和维护工作。
b)工程运维中心运维组负责95013平台的故障处理;各地分公司运维人员负责现场支持,并负责协调当地运营商的运维支持。
c)建立故障通报制度,如发生重大故障,应按照故障等级和故障上报流程逐级向上汇报。
d)定期召开网络质量分析会,遇有重大故障,应及时召开故障分析会。
负责全公司运维人员的技术业务培训,提高运维人员的技术维护水平和工作能力。
第三章 95013业务故障分类95013业务系统和网络故障分为重大故障、严重故障和一般故障。
1.重大故障:全部业务中断2.严重故障包括:一种以上业务全部中断≥60分钟一省以上业务全部中断≥60分钟用户注册、业务受理全部中断≥4个小时3.一般故障:除重大故障、严重故障以外的其它故障。
第四章故障处理的原则:先抢通,后修复;先核心,后边缘;先本端,后对端;先网内,后网外,分故障等级进行处理。
第五章故障处理时限要求。
公司设备故障管理制度

公司设备故障管理制度第一章总则第一条为了规范公司设备的使用和管理,提高设备的利用率和效率,保障公司正常生产经营,制定本制度。
第二条公司设备包括生产设备、办公设备、通讯设备、运输设备等各类设备。
第三条公司设备故障管理制度适用于公司所有设备的维护和管理工作。
第四条公司设备故障管理制度实行设备设施管理负责人负责,相关部门协作配合的原则。
第五条公司设备故障管理制度应与公司其他管理制度相互配合,确保设备的正常运转。
第二章设备故障预防第六条公司设备设施管理负责人应加强设备的日常维护,及时发现并排除可能引发设备故障的隐患。
第七条公司设备设施管理负责人应制定设备的定期保养计划,定期对设备进行检查和维护,确保设备处于良好状态。
第八条公司设备设施管理负责人应组织设备故障的隐患排查,对可能导致故障的问题及时处理,防止故障的发生。
第九条公司员工在使用设备时要严格按照操作规程操作设备,不得擅自改动设备的结构和功能。
第三章故障管理流程第十条公司设备故障发生后,相关人员应快速发现并报告设备故障情况。
第十一条设备故障报告包括故障发生时的设备状态、故障原因的初步分析、故障对公司生产经营的影响等内容。
第十二条设备故障报告应及时提交设备设施管理负责人,由设备设施管理负责人派遣专业人员进行故障排除。
第十三条设备故障排除过程中,应根据实际情况选择适当的维修方式,确保设备能够尽快恢复正常运行。
第十四条设备故障排除后,应及时对设备进行检测和试运行,确保设备正常运转。
第四章故障记录和分析第十五条公司应建立设备故障记录,记录每次设备故障的发生时间、原因、处理方式等信息。
第十六条设备故障记录应及时整理汇总,由设备设施管理负责人进行分析,找出故障的共性和规律,制定相应的防范措施。
第十七条设备故障分析结果应及时向相关部门通报,并提出改进建议,以避免类似故障的再次发生。
第五章故障处理责任第十八条设备故障的处理责任应明确,设备设施管理负责人应对设备故障的处理负最终责任。
中国联通通信网络运行维护规程--网管及运维支撑系统分册

运行维护规程网管及运维支撑系统分册中国联合网络通信集团有限公司二零一零年六月目录第一章通则 (3)第二章运行维护组织体系及职责界面 (4)第一节维护组织机构及职责 (4)第二节维护界面划分 (6)第三章基本维护要求 (6)第四章维护作业计划 (9)第五章故障管理 (10)第六章质量管理 (12)附录1 总部网管及支撑系统故障处理流程 (14)附录2 省级分公司网管及支撑系统故障处理流程 (16)附录3 中国联通网管及支撑系统作业计划 (17)第一章通则第1条.中国联通网管及运维支撑系统(以下简称网管及支撑系统)是为中国联通通信网络的运行维护及管理提供支撑的系统,可以实现为集中维护、集中管理、集中监控提供系统平台,满足各业务层面不同的网管应用需求。
网管及支撑系统包括根据有关技术体制和技术规范以及网络维护工作需要开发建设的综合性网络管理系统。
第2条.中国联通网络网管及运维支撑系统包括:厂家OMC 系统、网管系统、网管私有DCN网络系统等。
网管系统是由总部统一部署建设或由省内根据需要自行建设的支撑系统,包括综合网管、电子运维管理系统、专业网管、信令监测、安全管理、拨测系统、直放站和室内分布网管系统、业务平台网管系统、业务平台集中监控系统、性能测试系统、综合话务分析系统、动力环境监控系统、安全监控系统、网络资源管理系统等。
第3条.网管及支撑系统专业维护的范围主要指通信网网管及支撑系统的软硬件及相关配套设备的维护,包括:网管及支撑系统主机硬件设备、系统软件(操作系统、数据库、中间件等)、应用软件及相关的网络设备(路由器、交换机、防火墙、拨号设备等)、存储备份设备(磁盘阵列、磁带库、光盘等)、安全设备(入侵检测设备、补丁服务器、防病毒服务器及软件、网管配套使用的VPN 接入设备等)、时间服务器、DDF/ODF 架及相关连接光电缆等。
第4条.为规范网管及支撑系统的维护管理,提高中国联通网管及支撑系统服务质量,确保网管及支撑系统各类设备的正常运行,保障网管系统数据质量和网元同步接入,提高维护队伍整体素质和水平,特制定本管理规程,作为中国联通网管及支撑系统的维护管理工作依据。
供电公司故障管理制度

供电公司故障管理制度第一章总则第一条为规范供电公司的故障管理工作,提高电力供应的稳定性和可靠性,保障用户的用电需求,根据《电力法》等相关法律法规,制定本制度。
第二条本制度适用于供电公司的所有工作人员,包括管理人员、工程技术人员、维修人员等,涉及供电公司的故障管理工作。
第三条供电公司的故障管理工作,应遵循“预防为主、快速应急、迅速恢复、长效管理”的原则,确保故障管理工作的高效性和实效性。
第二章故障管理的组织机构和职责第四条供电公司应建立完善的故障管理组织机构,明确各级部门的职责和权限,确保故障管理工作的有序开展。
第五条供电公司应设立故障管理委员会,负责对公司的故障管理工作进行统筹协调和监督检查,及时处理和解决重大故障事件。
第六条供电公司应设立故障管理部门,负责具体的故障管理工作,包括故障预防、故障处理、故障统计等。
第七条供电公司应设立故障管理指挥中心,负责对公司的故障信息进行收集、分析和传递,及时指挥和协调故障抢修工作。
第八条供电公司的各级部门应根据自身职能和业务范围,合理划分故障管理工作职责,明确责任人和责任单位,确保故障管理工作的科学性和有效性。
第九条供电公司应建立健全的故障管理工作制度,包括故障处理流程、故障处理标准、故障处理责任等,确保故障管理工作的规范性和规范性。
第十条供电公司应建立故障管理工作考核评估制度,对故障管理工作进行定期检查和评估,及时发现问题并加以改进,确保故障管理工作的效果和效率。
第三章故障管理的预防措施第十一条供电公司应建立完善的故障预防措施,包括设备检修、设备保养、设备更新等,确保供电设备的正常运行和可靠性。
第十二条供电公司应建立设备管理台账,对各类设备进行登记和管理,定期进行检查和维护,确保设备的安全和可靠性。
第十三条供电公司应加强设备的定期检修和保养,对设备进行全面检查和维护,及时消除隐患,确保设备的安全和稳定。
第十四条供电公司应加强设备更新和技术改造,对老化设备和落后技术进行更新和改造,提高设备的性能和可靠性。
设备故障管理制度

设备故障管理制度第一章总则第一条为规范设备故障的管理,提高设备的稳定性和可靠性,保证生产的顺利进行,制定本制度。
第二条本制度适用于公司的所有设备,包括生产设备、办公设备等。
第三条公司设备的维护和保养由专门的设备部门负责。
设备部门负责设备的维修和保养工作,确保设备的正常运转。
第四条本制度由公司设备部门负责实施,所有员工都必须遵守本制度。
第五条设备故障管理制度是公司设备管理的一个重要组成部分,对设备的维护和保养起到关键作用。
只有制定适当的设备故障管理制度,才能保证设备的正常运转,提高设备的使用寿命。
第六条本制度的目的是规范设备的管理,提高设备的稳定性和可靠性,确保生产的顺利进行。
第七条公司设备部门负责设备的维护和保养工作。
设备部门负责设备的日常维护工作,包括设备的保养、检修等。
第二章设备故障管理的原则第八条设备故障管理应当遵循以下原则:(一)维护为主、预防为辅的原则。
维护是设备管理的重点,要注重设备的日常维护工作,做好设备的保养和检修工作,确保设备的正常运转。
(二)技术先进、设备更新的原则。
要注重引进先进的设备和技术,及时更新设备,提高设备的生产力。
(三)责任明确、分工合理的原则。
不同的设备管理人员要明确责任,分工合理,密切配合,确保设备的正常运转。
(四)安全第一、操作规范的原则。
设备管理人员要严格遵守操作规程,严格执行安全操作程序,确保设备的安全运转。
第三章设备故障管理的流程第九条设备故障管理的流程如下:(一)设备故障报告。
一旦发现设备故障,首先要立即报告设备部门,设备部门会安排人员进行检修。
(二)设备维修。
设备部门人员到达现场后,会对设备进行检修,找出故障原因,并及时修复。
(三)设备保养。
设备维修完成后,要及时进行设备的保养工作,确保设备的正常运转。
(四)设备检修。
定期对设备进行检修,找出潜在故障,及时修复,确保设备的稳定性和可靠性。
第四章设备故障管理的责任第十条设备管理人员要严格履行以下责任:(一)设备管理员要负责设备的日常管理工作,确保设备的正常运转。
运维操作管理制度

运维操作管理制度第一章总则第一条为了规范运维操作行为,提高系统运行的稳定性和安全性,保障业务的正常运转,制定本管理制度。
第二条本管理制度适用于所有参与运维操作的人员,包括但不限于运维工程师、系统管理员等相关人员。
第三条运维操作管理应当遵循“规范、高效、安全、稳定”的原则,全面提高运维过程的管理水平和执行效果。
第四条运维操作管理制度包括运维操作流程管理、运维工单管理、运维变更管理、运维故障管理等内容。
第五条运维行为应当遵循“责任明确、操作规范、保密安全”的基本要求,确保运维工作的有效性和安全性。
第六条运维操作管理应当根据实际情况不断完善和优化,提高运维效率和质量。
第七条运维操作管理制度由公司相关部门进行监督和检查,对违反本管理制度的行为进行处理和追究责任。
第八条本管理制度实行责任追究制度,对违规的运维行为将会受到相应的处罚。
第二章运维操作流程管理第九条运维操作流程是指运维人员在处理运维事件时应当遵循的一系列规范操作步骤。
第十条运维操作流程应当根据具体的运维任务和流程要求予以确定和规范。
第十一条运维操作流程应当包括以下内容:运维操作前的准备工作、运维操作的具体步骤、运维操作后的检查和验证等。
第十二条运维操作流程应当编制详细的操作手册,明确每一步骤和操作方法,便于运维人员进行操作。
第十三条运维操作流程的执行应当严格按照操作手册的要求,不得随意变更或省略操作步骤。
第十四条运维操作流程的执行过程中应当注意操作安全和数据保护,任何隐患或风险应当及时报告和处理。
第十五条运维操作流程的执行记录应当详细完整,包括操作时间、操作人员、操作步骤、执行结果等信息。
第十六条运维操作流程的执行情况应当进行定期检查和评估,对不符合要求的情况进行整改和纠正。
第三章运维工单管理第十七条运维工单是指系统故障、变更等运维事件的记录和处理单据。
第十八条运维工单应当详细记录运维事件的内容、处理过程和结果等信息。
第十九条运维工单应当依据实际需要和操作要求进行及时处理,并在规定的时间内完成。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大兴区水务局 乔社文
5.2 故障管理的重要性
•
故障管理的主要优点 ① 及时解决事件,从而最小化业务影响; ② 改善对支持资源的利用; ③ 更好地理解事件对SLA指标的影响,从而 允许改进优先顺序; ④ 关于正在发生的事件的准确信息; ⑤ 消除“遗漏”的事件和服务请求; ⑥ 提高管理信息的可用性。
大兴区水务局 乔社文
① 维护并检查错误日志; ② 接受错误检测报告并作出响 应; ③ 跟踪、辨认错误; ④ 执行诊断测试; ⑤ 纠正错误。
大兴区水务局 乔社文
5.1 什么是故障管理
• 5.1.2 故障管理与ITIL的关系 ITIL服务支持 故 障 管 理 帮助台 借鉴 事故管理 问题管理 负责管理和协调客户和 用户的服务请求 负责协调各支持小 组和第三方供应商 来解决事故和问题
大兴区水务局 乔社文
5.1 什么是故障管理
• 5.1.1 基本概念 • 概念:故障管理是指在系 统出现异常情况下的管理 操作,简单的说就是找出 故障的位置并进行恢复。 • 目标:自动监测、记录网 络故障并通知用户,以便 网络有效地运行。 • 网络的故障管理包括故障 检测、隔离和纠正三方面。
故障 检测 隔离 纠正
大兴区水务局 乔社文
5.1 什么是故障管理
• 5.1.2 故障管理与ITIL的关系 问题管理的主要目标是查 明事故发生的潜在原因并 找到解决此事故的方法或 防止其再次发生的措施, 而事故管理的主要目标是 在事故发生后尽可能快的 恢复服务,即使采取的是 一些应急措施不是永久性 的解决方案。 事故管理强调速度,而问 题管理强调质量,为了发 现事故原因和防止事故再 次发生,问题管理可能需 要花费更多时间解决事故 且可能推迟恢复服务。
大兴区水务局 乔社文
5.5 故障管理知识库
• 5.5.2 知识发布流程 用户 管理员 审批人 管理员
提交
分派
审批
发布
大兴区水务局 乔社文
5.5 故障管理知识库
• 5.5.3 知识库作用
实现知识共享 实现知识转化 避免知识流失
提高运维响应 速度和质量 挖掘、分析 IT应用信息
大兴区水务局 乔社文
本章小结
大兴区水务局 乔社文
5.4 故障管理的流程
• 5.4.2 故障升级 一线故障支持 二线故障支持 三线故障支持 四线故障支持 故障支持 指帮助台和服务台; 指管理部门; 指软件开发人员和架构设计师; 指第三供应商。
是指当一线支持在规定时间内不能解决或 没有解决某个故障时,便将其交给更有经 验或权限的支持人员。
故障管理知识库 故障严重 否 是 补充其他相关信息 初步归类和支持 向上报告/告知用户 记录基本分析信息 故障编号
大兴区水务局 乔社文
5.5 故障管理知识库
• 5.5.1 知识要素 知识要素 主要包括: 记录IT应用或网络出现的故障; 记录故障状况、引起的原因、关联问题、提交 人等; 提供一系列行之有效的解决方案; 拥有负责人,便于维护和跟踪; 隶属于一个或几个类别。便于查找和统计; 拥有生命周期,当它不再具备服务作用或被更 加有效的方法代替,应该及时“退休”。
• 5.1.5 问题管理 问题 知名错误 问题管理 目标 是存在于某个未知的潜在原因的一种情形。 是问题经过诊断分析后找到事故产生的根本原因 并制定出可能的解决方案时所处的状态。 指负责解决IT服务运营和管理过程中遇到所有问 题的流程。包括问题处理和问题控制两部分。 在于减少由于IT基础架构的错误而导致的问题和 将事故对业务产生的负面影响减少到最低,以及 防止这些错误有关的事故再次发生。
服务台
大兴区水务局 乔社文
5.1 什么是故障管理
• 5.1.4 事故管理 事故管理负责记录、归 类和安排专家处理事故并监 督整个处理过程直至事故得 到解决和终止。 “事故”指任何不符合标 准操作且已经引起或可能引 起服务中断和服务质量下降 的时间。
正在处理的
已终止的
大兴区水务局 乔社文
5.1 什么是故障管理
1. 网络故障管理包括故障检测、隔离和纠正三方面。 2. 在故障管理的过程中,帮助台负责管理和协调客户和用 户的服务请求,而事故和问题管理则负责协调各支持小 组和第三方供应商来解决事故和问题。 3. 问题管理的主要目标是查明事故发生的潜在原因并找到 解决此事故的方法或防止其再次发生的措施,而事故管 理的主要目标是在事故发生后尽可能快的恢复服务,即 使采取的是一些应急措施不是永久性的解决方案。事故 管理强调速度,而问题管理强调质量,为了发现事故原 因和防止事故再次发生,问题管理可能需要花费更多时 间解决事故且可能推迟恢复服务。
大兴区水务局 乔社文
5.1 什么是故障管理
• 5.1.3 服务台 是负责管理、协调并尽快解决IT服务运营与 管理发生的以外事故的部门或平台。 拓展了帮助台或呼叫中心的范围,通过提供 一个全球集中的服务联络点促进了组织业务 流程和服务管理基础架构的集成。
Help Desk
帮助台
Service Desk
第五章 故障管理
大兴区水务局 乔社文
第五章 故障管理
学习内容: • 什么是故障管理 • 故障管理的重要性 • 故障管理的内容 • 故障管理的流程 • 故障管理知识库 学习目标: • 理解: – 故障管理的重要性 – 知识库在故障管理中的 重要性 • 掌握: – 故障管理的内容和流程 – 故障管理软件的简单操 作步骤
大兴区水务局 乔社文
负责 解决 故障并 跟踪、 监督、 控制和 协调 解决 过程
故障检测和记录 初步归类和支持 服务请求 故障调查和分析 解决故障和恢复服务 终止进程 故障知识库 处理服务请求
大兴区水务局 乔社文
用户 服务台
系统 基本信息
服务台 故障管理
其他IT部门 否 相同故障 是 创建新记录 更新相记录
大兴区水务局 乔社文
大兴区水务局 乔社文
本章小结
8. 一般来说,对于不同情况下的故障,可以提供的支持可 分为:一线故障支持,指帮助台和服务台;二线故障支 持,指管理部门;三线故障支持,指软件开发人员和架 构设计师;四线故障支持,指第三方供应商。 9. 在实际运用中,网络故障管理流程一般包括故障检测、 故障隔离、故障修复和记录结果等几部分。 10. 知识库管理包括角色划分、流程定制和信息采集,知 识的抽取步骤大致可分为提交 分派 审批 发布。 11. 知识库的作用包括实现知识共享、实现知识转化、避 免知识流失、提高运维响应速度和质量,以及挖掘与分 析IT应用信息。
5.3 故障管理的内容
故障检测 故障信息管理 检索/分析 故障信息
故障报警 排错支持工具
大兴区水务局 乔社文
5.4 故障管理的流程
• 5.4.1 影响度/紧迫性/优先级
• 受影响的用户数 • 受影响的系统数 • 用户需求 • 服务级别协议 • 错误的严重性 • ……
影响度 优先级 紧迫性
估计:人力、 资源和时间
大兴区水务局 乔社文
一线支持
二线支持 故障管理
三线支持
N线支持
服务 请求 是 处理 流程
检查和记录 服务请求 初步支持 是否解决 恢复服务 否 调查分析 是否解决 恢复服务 否 调查分析 是否解决 恢复服务 否 继续 调查 分析
终止
大兴区水务局 乔社文
5.4 故障管理的流程
• 5.4.3 故障管理流程 – 1、故障检测和记录 – 2、初步归类和支持 故 障 管 理 流 程 理 程 和 – 3、故障调查和分析 – 4、 – 5、故障 – 6、故障 故障和
大兴区水务局 乔社文
本章小结
4. 故障管理的内容包括故障监测、故障报警、故障信息管 理、排错支持工具和检索/分析故障信息。 5. 影响度是衡量故障影响业务大小程度的指标,通常相当 于故障影响服务质量的程度,一般是根据受影响的人或 系统的数量来确定的。 6. 紧迫性是评价故障危机程度的指标,是根据客户的业务 需求和故障影响度而制定的。 7. 优先级是根据影响程度和紧急程度而制定的处理故障的 先后顺序。