网络运维与机房应急预案

网络运维与机房应急预案
网络运维与机房应急预案

网络运维小组应急预案

随着网络信息化建设的不断深入,加强机房各类设备、系统以及信息与网络安全等方面应对突发事件的处理能力将是我们目前面临的一项重要任务。为确保系统及机房安全与稳定,以保证正常运行为宗旨,按照“预防为主,积极处置”的原则,本着建立一个有效处置突发事件,建立统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安全,特制定本应急处置预案。

本预案共分为应用系统故障应急流程和机房突发事件应急流程

系统故障应急流程

一、系统故障应急流程说明

1、故障发生

系统运维服务小组可从以下途径得知故障的发生:

1.1、运维服务中心通过网管告警发现故障

1.2、维护站点通过维护巡检发现故障

1.3、用户发现故障,报给呼叫中心

1.4、驻场工程师发现故障

2、报障受理

监控系统运维服务小组得知系统故障发生后,立即响应,并向报障人或单位详细了解系统故障情况。

3、信息研判

运维服务小组根据了解到的系统故障情况进行分析判断,以确定采用一般故障处理流程还是立即启动系统突发故障应急处理预案。

4、预案启动

如需启动应急预案,则立刻通知系统突发故障应急领导小组,由领导小组启动应急预案,对系统突发故障应急事件进行全面管控处理。

5、资源确认

系统突发故障应急预案启动后,首先是根据现场突发故障实际状况、紧急程度、技术难度、备品备件等情况对相关资源(主要是参与人员)依据经验进行调度和确认,主要有以下资源:

我公司技术支持人员;

相关厂家技术支持人员;

我公司聘请的技术专家

6、预案执行

按照既定的预案进行突发故障抢修,如遇到问题及时向系统突发故障应急领导小组汇报。

7、预案终止

预案的终止时间由故障现场技术人员根据现场的实际进展情况,在与用户单位有关部门协调后报系统突发故障应急领导小组决定。

8、结果上报

预案中止后,相关预案参与人员将整个事件过程中的经验和教训,修改、完善事件应急预案。然后集中上报至系统突发故障应急领导小组。

二、系统故障应急处理流程图

机房突发事件应急流程

一、机房突发事件分类

1、自然灾害:指地震、火灾等因自然因素引起的网络与信息系统的损坏。

2、事故灾难:指电力中断、网络损坏、软件、硬件设备故障等引起的网络与信息系统的损坏。

3、人为破坏:指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏。

二、应急处理人员组织机构

三、应急机构人员岗位职责

1、应急总指挥职责

1.1、保证在任何时间,及时协调应急行动所有涉及的岗位人员;

1.2、提供必须的紧急响应设备;

1.3、在紧急情况下全面负责紧急行动;

1.4、在必要时向外界求救,例如:119、110、120等。

2、应急副总指挥职责

2.1、在总指挥领导下具体开展工作,当总指挥不在时履行总指挥职责;

2.2、根据获得的应急信息下达命令。

3、各相关设备负责人职责

3.1、负责尽快收集信息向应急总指挥汇报事故情况;

3.2、负责现场临时设备抢救和对事态的控制;

3.3、听从上级指挥人员的指挥。

四、突发事件处理原则

1.预防为主。立足安全防护,加强预警,重点保护基础信息网络和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、应急保障等环节,在管理、技术、人员等方面采取多种措施充分发挥各方面的作用,共同构筑安全保障体系。

2.快速反应。突发事件发生时,按照快速反应机制,及时获取充分而准确的信息,跟踪研判,果断决策,迅速处置,最大程度地减少危害和影响。

3.分级负责。按照“谁主管,谁负责”的原则,建立和完善安全责任制及联动工作机制。根据各负责人的职能,各司其职,加强各负责人的协调与配合,共同履行应急处置工作的管理职责。

4.以人为本。把保障人员以及公共利益的安全作为首要任务。

5.常备不懈。加强技术储备,规范应急处置措施与操作流程,定期进行预案演练,确保应急预案切实有效,实现网络与信息安全突发公共事件应急处置的科学化、程序化与规范化。

五、机房应急开关机具体措施

机房各设备关闭顺序如下:

六、机房日常维护

1、建立健全机房管理制度

1.1在正常工作日内,信息技术部人员负责对机房进行监控,主要职责是:巡视网络设备及系统的运行情况,发生异常情况及时处理,消除网络故障隐患。

1.2节假日期间技术人员轮流值班,负责处理有关异常情况。

1.3机房采取来人来访登记制度,未经允许,无关人员不得进入公司机房区域。

2、机房内严格采取防雷、防火、防尘、防静电等措施以及机房24小时监控

等措施。

3、认真做好数据备份工作,定期做一次数据库完全备份,每月检查服务器运行和备份情况。

4、对机房的主要网络设备(路由器、主干交换机等)进行工作时间内全程监控,发现异常情况应及时进行处理,确保整个网络的正常运行。

七、服务器及存储设备故障处理

1、排错流程

2、应急处置具体措施

2.1 机房漏水应急预案

(1)发生机房漏水时,第一目击者应立即通知运维服务小组,并及时报告监控系统突发故障应急领导小组。

(2)若空调系统出现渗漏水,运维服务小组负责人应立即安排停用故障空调,清除机房积水,并及时联系设备供应方处理,同时启动备用空调,必要情况下可临时用备用空调对服务器进行降温。

(3)若为墙体或机房门渗漏水,运维服务小组负责人应立即采取有效措施确保机房安全,及时清除积水,维修墙体或门窗,消除渗漏水隐患。

2.2 设备发生被盗或人为损害事件应急预案

(1)发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告系统突发故障应急领导小组,同时保护好现场。

(2)系统突发故障应急领导小组接报后,通知用户保卫部门、相关领导,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录。

(3)事发单位和当事人应当积极配合公安部门进行调查,并将有关情况向系统突发故障应急领导小组汇报。

(4)系统突发故障应急领导小组安排运维服务小组、事发单位及时恢复系统正常运行,并对事件进行调查。运维服务小组和事发单位应在调查结束后一日内书面报告系统突发故障应急领导小组。事态或后果严重的,应向相关领导汇报。

2.3 机房长时间停电应急预案

(1)定期检查机房供电设备的运行状况和电路线缆器材情况,当发生下列突发事件时,按照以下方案进行处置:

(2)当机房发生市电供电突然停电或是电源异常时。首先应和后勤部门联系确认正常停电以及预计停电时间。检查不间断电源的电池可供电时间,确保设备正常运行,如遇到突然断电,应及时将空调等不在UPS电源供电范围内的设备

及时断电,预防突然来电时瞬间电流过大导致设备损坏等现象。

(3)当确定停电时间超出机房UPS承载范围后,首先确定停电的范围以及受影响的设备范围。并及时通知各部门做好停电应急准备。然后通知机房电源维护人和设备的负责人到达现场,做好各设备的电源停电准备。在UPS供电电量仅剩10%之后,严格按操作手册停掉各服务器的电源,最后停核心交换机和路由器,等待电力恢复。

(4)当确定停电原因是在本身供电系统范围内,立即汇报给负责领导,并及时联系相关维护人员达到现场检修。对于恢复时间无法预计的,要通知后勤部门做好柴油机发电及移动电源车供电准备

(5)恢复供电后,严格按照操作程序逐步恢复机房设备和UPS的供电,以防瞬间电流过大造成设备损坏。

2.4 通信网络故障应急预案

(1)发生通信线路中断、路由故障、流量异常、域名系统故障后,操作员应及时通知本单位信息系统管理员,经初步判断后及时上报运维服务小组和系统突发故障应急领导小组。

(2)运维服务小组接报告后,应及时查清通信网络故障位置,隔离故障区域,并将事态及时报告系统突发故障应急领导小组,通知相关通信网络运营商查清原因;同时及时组织相关技术人员检测故障区域,逐步恢复故障区与服务器的网络联接,恢复通信网络,保证正常运转。

(3)事态或后果严重的,应向应急指挥办公室和相关领导汇报。

(4)应急处置结束后,运维服务小组应将故障分析报告,在调查结束后一日内书面报告系统突发故障应急领导小组。

2.5 不良信息和网络病毒事件应急预案

(1)发现不良信息或网络病毒时,信息系统管理员应立即断开网线,终止不良信息或网络病毒传播,并报告指挥调度中心运维服务小组和系统突发故障应

急领导小组。

(2)运维服务小组应根据系统突发故障应急领导小组指令,采取隔离网络等措施,及时杀毒或清除不良信息,并追查不良信息来源。

(3)事态或后果严重的,应向监控中心办公室和相关领导汇报。

(4)处置结束后 ,运维服务小组应将事发经过、造成影响、处置结果在调查工作结束后一日内书面报告系统突发故障应急领导小组。

2.6 服务器软件系统故障应急预案

(1)发生服务器软件系统故障后,运维服务小组负责人应立即组织启动备份服务器系统,由备份服务器接管业务应用,并及时报告系统突发故障应急领导小组;同时安排相关责任人将故障服务器脱离网络,保存系统状态不变,取出系统镜像备份磁盘,保持原始数据。

(2)运维服务小组应根据系统突发故障应急领导小组的指令,在确认安全的情况下,重新启动故障服务器系统;重启系统成功,则检查数据丢失情况,利用备份数据恢复;若重启失败,立即联系相关厂商和上级单位,请求技术支援,作好技术处理。

(3)事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。

(4)处置结束后,运维服务小组应将事发经过、处置结果等在调查工作结束后一日内报告系统突发故障应急领导小组。

2.7 黑客攻击事件应急预案

(1)当发现网络被非法入侵、网页内容被篡改,应用服务器上的数据被非法拷贝、修改、删除,或通过入侵检测系统发现有黑客正在进行攻击时,使用者或管理者应断开网络,并立即报告系统突发故障应急领导小组。

(2)接报告后,系统突发故障应急领导小组应立即指令运维服务小组核实情况,关闭服务器或系统,修改防火墙和路由器的过滤规则,封锁或删除被攻破的登陆帐号,阻断可疑用户进入网络的通道。

(3)运维服务小组应及时清理系统,恢复数据、程序,恢复系统和网络正

常;情况严重的,应向监控中心应急指挥办公室和相关领导汇报,并请求支援。

(4)处置结束后 ,运维服务小组应将事发经过、处置结果等在调查工作结束后一日内报告系统突发故障应急领导小组。

2.8 核心设备硬件故障应急预案

(1)发生核心设备硬件故障后,运维服务小组应及时报告系统突发故障应急领导小组,并组织查找、确定故障设备及故障原因,进行先期处置。

(2)若故障设备在短时间内无法修复运维服务小组应启动备份设备,保持系统正常运行;将故障设备脱离网络,进行故障排除工作。

(3)运维服务小组故障排除后,在网络空闲时期,替换备用设备;若故障仍然存在,立即联系相关厂商,认真填写设备故障报告单备查。

(4)事态或后果严重的,应向监控中心应急指挥办公室和相关领导汇报。

2.9 业务数据损坏应急预案

(1)发生业务数据损坏时,运维服务小组应及时报告系统突发故障应急领导小组,检查、备份业务系统当前数据。

(2)运维服务小组负责调用备份服务器备份数据,若备份数据损坏,则调用磁带机中历史备份数据,若磁带机数据仍不可用,则调用异地备份数据。

(3)业务数据损坏事件超过 2小时后,运维服务小组应及时报告系统突发故障应急领导小组,及时通知业务部门以手工方式开展业务。

(4)运维服务小组应待业务数据系统恢复后,检查历史数据和当前数据的差别,由相关系统业务员补录数据;重新备份数据,并在工作结束后一日内报告系统突发故障应急领导小组。

2.10 雷击事故应急预案

(1)遇雷暴天气或接上级部门雷暴气象预警,运维服务小组应及时报告系统突发故障应急领导小组,经请示同意后关闭部分服务器,切断电源,暂停内部计算机部分网络工作。

(2)雷暴天气结束后,运维服务小组报经系统突发故障应急领导小组同意,及时开通服务器,恢复内部计算机网络工作,对设备和数据进行检查。

(3)因雷击造成损失的,运维服务小组应会同相关部门进行核实、报损,并在调查工作结束后一日内书面报告系统突发故障应急领导小组。必要时,应向监控中心应急指挥办公室和相关领导汇报。

2.11 空调设备故障应急预案

若机房专用空调损坏,应第一时间启用机房备用空调,并通知厂家上门进行维修,并及时报告信息部相关领导请示,获得授权后按机房设备关闭顺序关闭各类设备。

2.12 火灾事故应急预案

(1)一旦机房发生火灾,应遵照下列原则:首先确保人员安全;其次保护关键设备、数据安全;三是保护一般设备安全;

(2)人员疏散的程序是:机房工作人员立即按响火警警报,并通过119电话向公安消防请求支援,所有人员戴上防毒面具,所有不参与灭火的人员按照预先确定的线路,迅速从机房中撤出;

(3)人员灭火的程序是:首先切断所有电源,启动自动喷淋系统或使用灭火器,灭火值班人员戴好防毒面具,从指定位置取出泡沫灭火器进行灭火。

2.13 电源设备故障应急预案

机房目前使用UPS系统,在紧急情况发生时,应按如下步骤进行关机:

(1)确认所有负载均已安全关机。

(2)关闭UPS负载电源。

(3)将UPS的系统启用开关切换到off 的状态。

(4)将电池连接断路器切换到off的位置。

八、维护小组成员

1. 现场服务人员联系方式

2. 厂家协助服务人员联系方式

银行网络系统应急预案

银行通信网络系统应急预案 1事故类型和危害程度分析 1.1编制目的 为有效预防、及时控制和最大限度地减少本银行由于电力供应、通信线路以及计算机系统各类突发事件的危害和影响,确保通信网络系统的安全、稳定运行和业务的连续性,维护正常的经济、生产秩序。 1.2编制依据 1.2.1《中华人民共和国计算机信息系统安全保护条例》。 122《国家突发公共事件总体应急预案》。 1.2.3《中国人民银行突发事件应急预案管理办法》 1.2.4《中华人民共和国中国人民银行法》 1.3适用范围 本预案适用于本银行III、IV级应急处理工作和具体响应,I、II 级应急处理工作。 1.4危险源与危害程度分析 1.4.1由于网络设备或者计算机损坏,造成通信系统无法连接或软件系统运行中断。 1.4.2由于外部通信线路被毁造成银行系统使用中断。 1.4.3由于电力系统故障造成无法正常通信或系统无法正常使用。 1.4.4由于病毒破坏,造成行内网络瘫痪或软件数据丢失。 1.4.5由于黑客入侵,造成行内重要信息泄露及通信网络瘫痪。

2应急处置基本原则 2.1统一领导,协同作战。 通信网络系统突发事件应急工作由应急指挥部统一领导和协调,督促信息中心遵照“统一领导、归口负责、逐级上报、各司其职的原则协同配合、具体实施,完善应急工作体系和机制。 2.2明确责任,依法规范。 各分行和支行,按照“属地管理、分级响应、及时发现、及时报告、及时救治、及时控制”的要求,依法对通信网络系统突发事件进行防范、监测、预警、报告、响应、指挥和协调、控制。按照“谁主管、谁负责,谁运行、谁负责”的原则,实行责任制和责任追究制。 2.3防范为主,加强监控。 宣传普及通信网络系统防范知识,贯彻预防为主的思想,树立常备不懈的观念,经常性地做好应对突发事件的思想准备、预案准备、机制准备和工作准备,提高公共防范意识以及基础网络和重要软件系统的信息安全综合保障水平。加强对信息安全隐患的日常监测,发现和防范重大通信网络突发性事件,及时米取有效的可控措施,迅速控制事件影响范围,力争将损失降到最低程度。 3组织机构及职责 通信网络系统应急救援组织机构分为一、二级编制,总行和各分行设置为应急预案实施的一级应急组织机构,各支行设置为应急计划实施的二级应急组织机构。 总行通信网络系统应急救援领导小组组长由总行长担任,副组长为分管通信安全的副行长担任,组员由各部门中层组成。领导小组的日常办事机构为总行。主要负责协调出现通信网络系统故障后的总体协调指挥工作,并做好善后处理工作。

平台安全系统运维保障方案设计

实用文档 平台运维保障方案 1.目的 为了保障平台各项业务的正常开展,确保信息系统的正常运行,规范信息系统日常操作及维护阶段安全要求,特制订此方案。 2.系统日常操作及维护管理 2.1.建立双向联动责任人机制 所有涉及到业务平台的资源,包括主机操作系统、应用系统、网络设备和安全设备,指定电信接口人和支撑单位接口人双向联动,由电信公司指定维护接口人专门负责对接支撑单位的技术负责人和维护人员,电信公司的接口人对支撑单位的日常工作进行监督,支撑单位对业务系统的日常操作和维护按照本方案进行记录,做到责任到人,保证各个业务平台的正常运行。 2.2.操作系统日常操作及维护 (1)必须严格管理操作系统账号,定期对操作系统账号和用户权限分配进行检查,系 统维护人员至少每月检查一次,并报信息技术管理员审核,删除长期不用和废弃 的系统账号和测试账号。 (2)必须加强操作系统口令的选择、保管和更换,系统口令做到: ●长度要求:8位字符以上; ●复杂度要求:使用数字、大小写字母及特殊符号混合; ●定期更换要求:每90天至少修改一次。 (3)支撑单位维护人员需定期进行安全漏洞扫描和病毒查杀工作,平均频率应不低于 每月一次,重大安全漏洞发布后,应在3个工作日内进行上述工作。为了防止网 络安全扫描以及病毒查杀对网络性能造成影响,应根据业务的实际情况对扫描时 间做出规定,需安排在非业务繁忙时段。技术负责人应为每个系统指定专门的系 统维护人员,由系统维护人员对所负责的服务器进行检查,至少每天一次,确保

各系统都能正常工作;监控系统的CPU利用率、进程、内存和启动脚本等使用情况。 (4)当支撑单位维护人员监测到以下几种已知的或可疑的信息安全问题、违规行为或 紧急安全事件系统时,应立即报告技术负责人,同时采取控制措施,并进行记录: a)系统出现异常进程; b)CPU利用率,内存占用量异常; c)系统突然不明原因的性能下降; d)系统不明原因的重新启动; e)系统崩溃,不能正常启动; f)系统中出现异常的系统账户; g)系统账户口令突然失控; h)系统账户权限发生不明变化; i)系统出现来源不明的文件; j)系统中文件出现不明原因的改动; k)系统时钟出现不明原因的改变; (5)系统日志中出现非正常时间登录,或有不明IP地址的登录; (6)系统维护人员对操作系统的任何修改,都需要进行备案,对操作系统的重大修改 和配置(如补丁安装、系统升级等操作)必须向技术负责人提交系统调整方案,由信息技术管理员审核通过后方可实施。操作系统的配置和修改必须在非业务时间进行,重大调整必须提前准备应急预案和回退方案。 (7)保证操作系统日志处于运行状态,系统维护人员应定期对日志进行审计分析,至 少每月审计一次,重点对登录的用户、登录时间、所做的配置和操作做检查,在发现有异常的现象时及时向信息技术管理员报告。 (8)系统维护人员应设置操作系统日志归档保存功能,历史记录保持时间不得低于一 年。

机房的维护管理方案

机房管理方案 随着计算机技术的快速发展和员工对计算机使用操作步骤的日益增加,播出机房的地位和作用越来越重要。合理有效地对机房进行管理,将对设备的运行维护、快速处理设备故障、降低成本具有十分重要的意义。 一、机房环境的要求 1、机房空气环境 机房设备维护主要包括电气环境、温湿度、防尘、防鼠等方面。 (1)电气环境要求 电气环境的要求主要是指防静电要求和防电磁干扰等。 防静电要求播出设备内部电路采用大量的半导体、CMOS等器件。由于这类器件对静电的敏感范围为25~1000V,而静电产生的静电电压往往高达数千伏甚至上万伏,足以击穿各种类型的半导体器件,因此机房应铺设抗静电活动地板,地板支架要接地,墙壁也应做防静电处理,机房内不可铺设化纤类地毯。工作人员进入机房内要穿防静电服装和防静电鞋,避免穿着化

纤类服装进入机房。柜门平常应关闭,工作人员在机房内搬动设备和拿取备件时动作要轻,并尽量减少在机房内来回走动的次数,以免物体间运动摩擦产生静电。 对于长期运行但无法经常清洁的设备,专门对设备做一次清洁是很有必要的。在长期的维护工作中,有时会碰到电路板的告警,如果对该电路板重新插拔,清洁掉电路板插针周围的灰尘,电路板就会恢复正常。 电磁干扰对播出设备的硬件和软件都有可能造成损害,播出设备本身产生的电磁辐射也会对临近的电子设备产生影响。因此,设备在安装时,应与临近用电设备保持一定的距离,必要时机房应采取屏蔽措施,以免临近电子设备之间相互产生干扰。播出设备的机外布线最好与火线交叉通过,并尽量避免长距离靠近并行。 (2)温湿度要求 播出设备尤其是交换机和磁盘阵列等设备对机房的温度有着较高的要求。温度偏高,易使机器散热不畅,使晶体管的工作参数产生漂移,影响电路的稳定性和可靠性,严重时还可造成元器件的击穿损坏。播出设备在长期运行工作期间,机器温度控制在18℃~25℃之间较为适宜。湿度对通信设备的影响也很大。空气潮湿,易引起设备的金属部件和插接件管部件产生锈蚀,并引起电路板、插接件和布线的绝缘降低,严重时还可

数据中心运维服务方案

数据中心机房及信息化终端设备维护方案 一、概况 xxx客户数据中心机房于XX年投入使用,目前即将过保和需要续保运维的设备清单如下:

另外,全院网络交换机设备使用年限较长,已全部过保,存在一定的安全隐患。 二、维保的意义 通过机房设备维护保养可以提高设备的使用寿命,降低设备出现故障的概率,避免重特大事故发生,避免不必要的经济损失。设备故障时,可提供快速的备件 供应,技术支持,故障处理等服务。 通过系统的维护可以提前发现问题,并解决问题。将故障消灭在萌芽状态, 提高系统的安全性,做到为客户排忧解难,减少客户人力、物力投入的成本。为 机房内各系统及设备的正常运行提供安全保障。可延迟客户设备的淘汰时间,使 可用价值最大化。 通过引入专业的维护公司,可以将客户管理人员从日常需要完成专业性很强 的维护保养工作中解放出来,提升客户的工作效率,更好的发挥信息或科技部门 的自身职能。 通过专业的维护,将机房内各设备的运行数据进行整理,进行数据分析,给

客户的机房基础设施建设、管理和投入提供依据。 三、维护范围 1、数据中心供配电系统 2、数据中心信息化系统 3、全院信息化终端设备 4、数据库及虚拟化系统 四、提供的服务 为更好的服务好客户,确实按质按量的对设备进行维护;我公司根据国家相关标准及厂商维护标准,结合自身多年经验积累和客户需求,制定了一套自有的服务内容: 1、我公司在本地储备相应设备的备品备件,确保在系统出现故障时,及时免费更换新的器件,保障设备使用安全。 2.我公司和客户建立24小时联络机制,同时指定一名负责人与使用方保持沟通,确保7*24小时都可靠联系到工程技术人员,所有节日都照此标准执行。 3.快速进行故障抢修:故障服务响应时间不多于30分钟,2小时内至少2人以上携带相关工具、仪器到达故障现场,直到设备恢复正常运行。 4.我公司对维修维护的设施设备的使用性能负责,在维修维护过程中严格执行技术规范,保证设施设备的性能符合相关技术标准要求。在维修维护间,我方应对设施设备可能存在的故障隐患做出评估,并进行恰当的预防性处理,以保证设

银行网络应急预案

银行网络应急方案 XX股份有限公司 网络与安全服务部 2012年2月 目录 一、银行网络结构拓扑................................... 二、骨干网通信故障..................................... 1.故障处理人员..................................... 2.电信、联通网络通信故障........................... 3.通信故障恢复..................................... 4.到总行路由器故障................................. 5.路由器故障处理................................... 三、核心交换机故障应急................................. 1.一台4506交换机故障应急.......................... 2.当核心交换同时瘫痪在20分钟内保证业务正常运作 .... 四、第三方外联区网络应急............................... 1.第三方业务银联区网络应急......................... 2.其它第三方业务区网络应急......................... 五、联系方式:.........................................

一、银行网络结构拓扑 二、骨干网通信故障 1.故障处理人员 参与人:XX、XX、XX 2.电信、联通网络通信故障 根据到总行的两台cisco 7206路由器的日志以及实际登陆设备使用show int ATM4/0.1 、ping对端地址、show ip route、show log,查看上述相关设备和线路是否有反复重起、误码率高、异常路由、错误连接等情况即可确认故障。 3.通信故障恢复 恢复步骤: 1)重启故障新路相连路由器,看是否能够自动恢复 2) 断电重起无法解决故障的,停止使用故障设备和线路,防止其影响网络其他部分。 3) 如系线路故障通知各有关方面(逐项对照处理): ●如为中国电信线路故障,向报修,并通知分行办公室相关人员。 ●如为中国联通线路故障,向XXXX 报修,并通知分行办公室相关人员。 4.到总行路由器故障 查看日志,检查设备故障前的异常日志信息;登陆路由器使用show log,show ip int brie , show process cpu his , show ip route , ping对端地址等命令来确认故障。 5.路由器故障处理 一旦发现到总行7206路由器故障可按以下步骤来处理: ●联系XX公司,并启动原厂商保修服务备件更换程序。 ●因为两台7206路由器是互为备份的,一台发生故障不影响实际业务,不调用库房备件和集成商备件更换,等待原厂商备件到达。 ●对于能够在线插拔的接口模块、有standby 的引擎和电源,优先使用在线更换方式。在线更换的具体操作流程如下: a) 用笔记本电脑连接在网络设备的Console 上,启动Console 监控和记录;

运维应急预案

项目部运维应急预案 一、停电应急措施 1.当突然停电时,各部人员接到通知后,应立即赶赴现场,检查应急灯、走火通道指示等情况及停电原因,共同组织维持现场 的秩序; 2.检查机房设备,查看指示灯,确保设备在不间断电源提供的电力下正常运转。 3.如果属于阳蓄项目部营地内发生故障而引起停电的,积极配合检测排查。 4.后勤部门打开发电机前,通知业主关闭各自连接终端设备的排插电源。发电机启动后,快速检查用户终端设备是否又因突然 停电而引起的终端设备故障。 5.恢复供电后,各部门要检查各类电器设备是否完好,运行是否正常; 6.向业主及相关方反馈停电所造成的通讯设备及终端设备的情况。 二、台风应急措施: 1.各工作岗位人员应坚守岗位,未经允许或接替决不可离岗。 2.对电话线、网线等进行检查,必要时予以加固。应做好电力设备的保障工作,防止因台风引起线路故障或电击伤人事故。 3.关紧机房门窗及设备的框架的铁门,确保设备勿因外力而造成故障。 4.定点定时加强巡视,确保项目部内的各通讯设备的正常运行。 三、重大活动技术支持 1.重大活动由业主定义。 2.随时配合业主做重大活动现场技术支持 3.按业主要求进行现场的环境搭建及服务支持。 4.重大活动前,对系统进行调试检查工作。 5.重大活动期间,对信息系统设备进行定时巡视服务。 6.重大活动期间,如发生问题进行快速故障排除,必要时应聘请原厂服务人员保证重大活动过程中信息设备的稳定运行。 在紧急事故处理中应随时关注,预先防范,沉着应对,维持现场,拍照记录!

阳蓄项目部火警、火灾应急预案流程图 善后处理,记录备案。 阳蓄项目部停电、停水应急预案流程图

系统维护和机房运维方案

运 维 服 务 方 案 2016年5月18日

目录 1 服务内容 (3) 1.1 服务目标 (3) 1.2 信息资产统计服务 (3) 1.3 网络、安全系统运维服务 (4) 1.4 主机系统运维服务 (6) 1.5 存储系统运维服务 (10) 1.6 数据安全存储及灾备运维服务 (11) 1.6.1 传统的灾备方式 (11) 1.6.2 容灾方案的关键指标 (13) 1.6.3 常见的备份策略 (14) 1.6.4 容灾的核心问题 (15) 1.6.5 容灾的实现方式 (16) 1.6.6 异地容灾技术 (18) 1.6.7 灾难恢复级别 (20) 1.7 容灾建设方式 (21) 1.7.1 企业信息系统保护层次 (21) 1.7.2 容灾技术模型 (23) 1.7.3 业务平台的保护---业务处理能力的冗余 (23) 1.7.4 数据平台的保护---业务状态数据的复制 (24) 1.7.5 接入平台冗余和贴换 (24) 1.7.6 容灾模式 (24) 1.7.6.1 容灾层次 (25) 1.7.6.2 容灾范围 (25) 1.7.6.3 同级容灾或降级容灾 (26) 1.7.6.4 容灾技术概述 (27) 1.7.6.5 基于存储的数据复制技术建设容灾系统 (28) 1.7.6.6 小结 (31) 2 运维服务流程 (32) 3 服务管理制度规范 (34) 3.1 服务时间........................................................................... . (34) 3.2 行为规范............................................................................. .. (34) 3.3 现场服务支持规范................................................................. . (35) 3.4 问题记录规范.......................................................................... ................................................ .35 4 应急服务响应措施................................................................... (37) 4.1 应急基本流程................................................................................................................................ ..37 4.2 预防措施......................................................................................... .............................. . (37) 4.3 突发事件应急策略 (38)

村镇银行网络与信息安全应急预案

村镇银行网络与信息安全应急预案 一、总则 (一)编制目的 提高处置网络与信息安全突发公共事件的能力,形成科学、有效、反应迅速的应急工作机制,确保重要计算机信息系统的实体安全、运行安全和数据安全,最大程度地预防和减少网络与信息安全突发公共事件及其造成的损害,保障公众的生命财产安全,维护正常的政治、经济和社会秩序,促进经济社会全面、协调、可持续发展。 (二)编制依据 根据《中华人民共和国计算机信息系统安全保护条例》、《计算机病毒防治管理办法》制定本预案。 (三)分类分级 本预案所称网络与信息安全突发事件,是指信息系统突然遭受不可预知外力的破坏、毁损、故障,发生对国家、社会、公众造成或者可能造成重大危害,危及公共安全的紧急事件。 1.事件分类 根据网络与信息安全突发公共事件的性质、机理和发生过程,网络与信息安全突发公共事件主要分为以下三类: (1)自然灾害。指地震、台风、雷电、火灾、洪水等引起的网络与

信息系统的损坏。 (2)事故灾难。指电力中断、网络损坏或是软件、硬件设备故障等引起的网络与信息系统的损坏。 (3)人为破坏。指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏。 2.事件分级 根据网络与信息安全突发事件的可控性、严重程度和影响范围,一般分为四级:I级(特别重大)、Ⅱ级(重大)、Ⅲ级(较大)和Ⅳ级(一般)。 (1)I级(特别重大)、Ⅱ级(重大)。重要网络与信息系统发生全市性大规模瘫痪,事态发展超出总行及自治区联社的控制能力,需要由省网络与信息安全应急协调小组跨部门、跨地区协同处置,对国家安全、社会秩序、经济建设和公共利益造成特别严重损害的突发公共事件。(2)Ⅲ级(较大)。市内某一区域的重要网络与信息系统瘫痪,对国家安全、社会秩序、经济建设和公共利益造成一定损害,但在总行和有关主管部门控制之内的突发公共事件。 (3)Ⅳ级(一般)。重要网络与信息系统受到一定程度的损坏,对公民、法人和其他组织的权益有一定影响,但不危害国家安全、社会秩序、经济建设和公共利益的突发公共事件。 (四)适用范围 本预案适用于本行发生或可能导致发生网络与信息安全突发事件的应急处置工作。本预案所指网络与信息系统主要是指核心业务

机房IT运维技术方案书

机房IT运维技术方案1.0 项目综述 1.1项目背景 随着社会经济及科学技术的飞速发展,计算机网络的逐渐普及,XXX(建设单位)作为行业的领先者在IT建设方面投入大量的资金,建立起多种的业务系统,为企业的长远发展提供源动力及运营保障。伴随着XXX(建设单位)业务系统的不断增加,IT硬件和软件应用的也不断增涨,其环境复杂,多系统、多数据库和多应用平台、多厂商网络及系统设备的网络运行环境,使网络维护难度成几何倍数的增长,系统管理人员的工作压力越来越大。 在XXX(建设单位)网络系统的日常管理中,IT基础设施的故障和性能监控是很重要的一个环节,它是网络系统稳定、可靠的保证。如果XXX(建设单位)的网络失效或运行状态不佳,数据流就会受到阻塞,关键数据就不能得到有效共享,导致各项业务工作效率的下降,XXX(建设单位)对外提供的社会服务及内部企业运行流程都将受到影响。为保证网络畅通,网管人员需要对XXX(建设单位)现有网络设备、链路和多种操作系统的服务器进行7X24的监测,降低网络管理工作的复杂性,提高网络管理的工作效率。 1.2需求分析 1.2.1IT管理现状 随着XXX(建设单位)业务系统的不断完善,XXX(建设单位)缺少统一IT综合监控管理平台,网络运维人员经常是在故障发生后,才能去进行处理,工作处于被动状态。由于缺少及时有效了故障发现工具,需要花费很长时间去寻找和诊断故障,极大地影响了工作效率。缺少直观的业务服务拓扑功能,应用系统的监测和管理显得非常繁琐。无法对各种应用系统进行有效的监测管理,如何不断提高各种业务系统的服务质量,是XXX(建设单位)系统管理人员急需解决的问题。 网络运维人员急需建立起一套IT统一综合监测管理平台及时把握其业务系统的健康运行情况,对网络运行状态进行趋势分析,做到及时防范、及时告警、及时处理,需要对网络设备、服务器系统资源及应用软件的运行状况进行实时监测。形成对网络的集中、统一的管理,从而在整体上把握各业务系统运行性能。

银行系统故障技术应急预案

银行系统故障技术应急预案 一、总则 1.1目的 本预案旨在全面提高应对金融生产系统中各种突发事件的能力,提供科学的指挥方案,最大限度地减少突发事件所造成的业务停顿时间。力争在最短的时间内恢复系统运行,保证生产系统的稳定、安全运行。 1.2工作原则 1.2.1 贯彻统一领导,分级负责,反应及时,措施果断,依靠科学,加强合作的原则。邮政金融系统故障具有突发性强、影响大、范围广的特点,一旦出现重大故障必须在行领导的统一指挥下,以省级运行维护部门为中心,相关部门积极配合,协同作战,迅速反应,最大限度地保证业务的连续性和安全性。 1.2.2 遵循预防为主,常备不懈的方针。做好应对突发事件的思想准备和思想教育;加强生产系统的日常监控;通过技术创新和技术进步完善监控和预警手段;加强专业队伍建设和培训;制定完善的单项应急处理流程,提高处理速度。定期进行预演。 二、组织结构与职责 金融技术应急组织机构由突发事件领导小组,突发事件应急办公室和各技术应急小组构成。 2.1应急领导小组

应急领导小组由相关技术领导组成,负责重大故障应急对应的决策。 2.2 应急办公室 2.2.1应急办公室由市局信息技术中心和市行渠道与科技部。 2.2.2应急办公室工作职责。 1)贯彻执行上级领导部门的工作部署。 2)进行生产环境安全教育,定期演练。 3)组织安全检查;监督应急措施的落实和整改。 4)遇到故障发生,协调相关各部门、厂商和省分行相关部门,行使指挥职能。 2.3技术应急小组。 2.3.1技术应急小组由省分行技术部门的运行维护技术人员组成。 2.3.2技术应急小组职能。 1)制定具体的应急措施,不断完善应急措施。 2) 24小时监控系统运行,发生故障及时预警、上报。 3)执行上级制定的应急措施。 技术应急小组由市局信息技术中心和市行渠道与科技部组成。 三、监测和预警 3.1故障监测与预警发布 3.1.1 监控。省级维护部门建立了网络和主要设备、系统的运行监控系统,一旦发生故障,会产生声音报警。其他设备和系统采用设备巡检制度,定时对设备运行状态进行记录。

数据机房维保方案

机房维保方案 一、服务队伍及联系方式 二、维保期服务内容 1、巡检服务:本方案按合同载明的设备(系统)清单,分别提供不同标准的巡检服务。对所有的设备(系统)提供一年四次的巡检保养。 2、故障响应服务:本方案按故障等级提供不同的故障响应服务,力求在最短的时间内排除故障,并在事后及时提交故障排除报告,报告内容包括:故障排除过程描述及故障分析等。 3、培训服务:本方案提供现场培训和集中培训。 三、巡检服务流程及内容 1、巡检服务流程: 1)我方提交巡检方案给用户; 2)用户通知巡检; 3)我方工程师进入现场巡检; 4)巡检完毕后,收拾好现场并于五个工作日内提交巡检报告给用户。 2、巡检服务内容: ⑴空调系统 环境检查 1)房间的清洁程度 2)房间的温度分布是否合理 3)房间的出风布置是否合理 4)检查新风系统

5)检查空调及空调周围是否有凝露并解决 ●过滤网 1)外观检查 2)清洁 3)更换(如果需要) ●皮带 1)外观 2)调整松紧度 3)更换(如果需要) ●风机电机 1)外观 2)轴承 3)噪音情况 4)运行电压 5)运行电流 6)气流开关 7)I/O板 ●压缩机 1)外观 2)清洁 3)油镜 4)管路 5)液镜 6)压缩机的运行压力 7)高压开关 8)低压开关 9)干燥过滤器 10)液体管路电磁阀 11)安全阀 12)膨胀阀 13)运行电压 14)运行电流

15)I/O板 16)压缩机过热保护器 ●蒸发器的清洗 1)蒸发器外观检查 2)所有翅片上的灰尘污垢清洗 3)冷凝器 4)外观 5)清洁(需用户提供水源) 6)冷凝风扇 ●加湿系统 1)外观 2)清洗 3)更换加湿罐(如果需要) 4)运行电压 5)运行电流 6)进水阀 7)排水阀 8)加湿控制板 9)I/O板 ●电加热 1)外观 2)运行电压 3)运行电流 4)过热保护器 ●主控制系统 1)外观 2)接线情况 3)电路板及附件的情况 4)输入电压 5)软件的版本 6)升级 7)传感器的校验

银行基础设施应急预案

XXX基础设施演练方案

文档修订记录

目录 1. 演练基本信息.......................................................... - 4 - . 概述............................................................... - 4 -. 演练时间........................................................... - 4 -. 演练地点........................................................... - 4 -. 演练类型........................................................... - 4 -2. 演练总体策略.......................................................... - 5 - . 演练过程简述....................................................... - 5 -. 演练目标........................................................... - 5 -. 演练原则........................................................... - 6 -. 演练时间策略....................................................... - 6 -3. 演练方案.............................................................. - 7 - . 灾难恢复演练场景................................................... - 7 -. 演练方式说明....................................................... - 7 -. 参演单位及工作分工................................................. - 7 -总行部门........................................................ - 7 -. 灾难演练工作安排................................................... - 9 -应急响应及灾难恢复预案培训及辅导................................ - 9 - 技术测试........................................................ - 9 - 对外通报........................................................ - 9 - 演练培训....................................................... - 10 - 桌面推演....................................................... - 10 - 演练场地准备................................................... - 11 - 演练案例确认................................................... - 12 - 供电系统灾难恢复演练........................................... - 12 - 演练后撰写《供电系统灾难恢复演练报告》......................... - 12 -4. UPS供电系统演练..................................................... - 13 - . 演练阶段.......................................................... - 13 -5. 演练组织............................................................. - 16 - . 演练组织架构...................................................... - 16 -. 演练组织成员...................................................... - 16 -. 演练现场指挥...................................................... - 17 -. 演练具体角色分配.................................................. - 17 -. 值班人员要求...................................................... - 18 -

运维服务技术研发规划

1. 目的 在运行维护服务实施过程中,随着运维业务的扩大,可能面临各种问题(如硬件故障)、风险(如安全漏洞)以及新技术和前沿技术应用所提出的新要求,因此为解决相应的问题满足运维需求,制定本技术手册研发规划,用以解决在运维过程中面临的各种问题、应用所提出的新要求。我公司针对运维实施过程中可能出现的各种问题,提出相应的解决方案,及时发现解决问题和控制风险,提高IT 运维水平,同时在本研发规划中明确了研发方向、研发投入、研发进度计划以及研发成果等。 我公司在运行维护服务的主体定位于数据中心机房、智能化系统、桌面外设、操作系统等各种运行维护,通过系统监测和例行巡检等方式,及时发现并解决设备、系统运行中存在 受 控 分发号

的安全隐患和发生的故障,确保系统稳定、高效的运行,并制定了应急预案,确保了用户的系统持续性运行。技术研发体系依据公司运维服务的要求、结合目前主流的监控工具使用技术,为运维提供技术的解决方案,研究使用运维工具,辅助提高运行维护效率,为运维实施提供服务支撑和技术保障。 2.研发方向 4.技术手册研发规划

GFA6700用户手册2015.3.16 2015.4.16 NTSC9000网络服务器使用说明2015.4.10 2015.5.10 慧锐高清平台系统操作手册2015.4.25 2015.5.10 IBM TS3200带库操作指南2015.5.10 2015.6.10 IBM BladeCenter H SMM管理 使用手册2015.5.15 2015.6.25 BRT网络系统培训教材2015.6.28 2015.7.30 廉政宣传教育 基地 5.监控工具综合使用研发规划 类型研发内容启动日期结束日期部署项目 监控工具Watch up 网络监控软件 使用 2015.01.20 BRT中心机 房,市行政 服务中心 排队叫号主机监控工具 使用 2015.3.10 市行政服务 中心卓豪监控软件应用2015.06.21 廉政宣传教 育基地 6.应急预案规划 类型研发内容启动日期部署项目 应急预案BRT中心机房突发事件应急 处理预案 2015.1.24 BRT中心机房机房断电应急方案2015.3.10 市行政服务中心机房突发事件应急处理预案2015.3.10 市行政服务中心排队叫号系统应急预案2015.3.10 市行政服务中心网络系统应急预案2015.10.15

银行重庆分行网络故障突发事件应急预案

XX银行重庆分行 网络故障突发事件应急预案 为应对网络突发事故,保障分行及支行各营业网点的营业正常运行,特制订此预案。 一、网络故障类型: (一)线路故障,即电信、联通运营商因故导致的网络中断。 (二)网络设备故障,即网络设备因故导致的网络中断。 二、报告流程 1.营业网点及营业部网络故障报告流程 事发网点科技工作兼岗人员→事发网点分管行领导 事发网点科技工作兼岗人员→分行科技中心系统网络及机房管理岗→分行科技中心主任→分行会计结算部负责人→分行分管行长注:当地有监管部门的事发网点按监管机构要求进行报告。 2.分行网络故障报告流程 系统网络及机房管理岗→分行科技中心主任→分行会计结算部负责人→分行分管行长 系统网络及机房管理岗→监管机构

系统网络及机房管理岗→总行 3.中心机房网络故障报告流程 中心机房值班人员或夜间值班岗→系统网络及机房管理岗→分行科技中心主任→分行会计结算部负责人→分行分管行长系统网络及机房管理岗→监管机构 系统网络及机房管理岗→总行 三、操作流程 1.营业部及各支行网络故障操作流程 系统网络及机房管理岗接到事发网点科技工作兼岗人员故障报告后,立即检查并判断故障点。 (1)线路故障 (一)生产数据将自动切换至备线传输,系统网络及机房管理岗立即 通知线路运营商进行线路修复,并持续跟踪修复进度。 (二)修复完成后,在非营业时间对主备线路进行切换演练。(2)生产路由器或生产交换机故障 (一)事发网点科技工作兼岗人员立即将故障设备上的所有网线断 开,插入设备备机对应端口。 (二)系统网络及机房管理岗立即申请网络设备管理员口令,携带两

个同类型设备赶往事发网点,将故障设备移除,安装携带的同类型设备,并对其进行配置。 (三)此时,生产数据通过设备备机传输,测试业务是否正常。若正 常,待当日营业结束后,对新安装的设备进行切换演练。若不正常,立即将备机上的网线全部断开,接入新安装的设备上。(四)测试业务是否正常。若正常,待当日营业结束后,配置并测试 备机,确保主备机均能正常工作。若不正常,继续配置并测试另一台设备,直至业务正常为止。 (五)业务及主备机均正常后,系统网络及机房管理岗带离所有故障 设备并通知设备供应商进行维修。 (六)设备维修好后,在非营业时间,将其安装至原位置。对其进行 配置、测试,确保主备机均能正常工作。 (3)办公交换机故障 (一)系统网络及机房管理岗立即申请网络设备管理员口令,携带两 个交换机赶往事发网点,将故障设备移除,安装携带的同类型设备,并对其进行配置。 (二)测试业务是否正常。若正常,系统网络及机房管理岗将故障设 备带离并通知设备供应商进行维修。若不正常,继续配置并测试另一台设备,直至业务正常为止。 (三)设备维修好后,申请网络设备管理员口令,在非营业时间,将 其安装至原位置。对其进行配置、测试,确保主备机均能正常工

村镇银行网络与信息安全应急预案

村镇银行网络与信息安全应急预案一、总则 (一)编制目的 提高处置网络与信息安全突发公共事件的能力,形成科学、有效、反应迅速的应急工作机制,确保重要计算机信息系统的实体安全、运行安全和数据安全,最大程度地预防和减少网络与信息安全突发公共事件及其造成的损害,保障公众的生命财产安全,维护正常的政治、经济和社会秩序,促进经济社会全面、协调、可持续发展。 (二)编制依据 根据《中华人民共和国计算机信息系统安全保护条例》、《计算机病毒防治管理办法》制定本预案。 (三)分类分级 本预案所称网络与信息安全突发事件,是指信息系统突然遭受不可预知外力的破坏、毁损、故障,发生对国家、社会、公众造成或者可能造成重大危害,危及公共安全的紧急事件。 1(事件分类 根据网络与信息安全突发公共事件的性质、机理和发生过程,网络与信息安全突发公共事件主要分为以下三类: (1)自然灾害。指地震、台风、雷电、火灾、洪水等引起的网络与 —— 1 —— 信息系统的损坏。 (2)事故灾难。指电力中断、网络损坏或是软件、硬件设备故障等引起的网络与信息系统的损坏。. (3)人为破坏。指人为破坏网络线路、通信设施,黑客攻击、病毒攻击、恐怖袭击等引起的网络与信息系统的损坏。 2(事件分级 根据网络与信息安全突发事件的可控性、严重程度和影响范围,一般分为四级:I 级(特别重大)、?级(重大)、?级(较大)和?级(一般)。 (1)I级(特别重大)、?级(重大)。重要网络与信息系统发生全市性大规模瘫痪,事态发展超出总行及自治区联社的控制能力,需要由省网络与信息安全应急协调小组跨部门、跨地区协同处置,对国家安全、社会秩序、经济建设和公共利益造成特别严重损害的突发公共事件。(2)?级(较大)。市内某一区域的重要网络与信息系统瘫痪,对国家安全、社会秩序、经济建设和公共利益造成一定损害,但在总行和有关主管部门控制之内的突发公共事件。 (3)?级(一般)。重要网络与信息系统受到一定程度的损坏,对公民、法人和其他组织的权益有一定影响,但不危害国家安全、社会秩序、经济建设和公共利益的突发公共事件。 (四)适用范围 本预案适用于本行发生或可能导致发生网络与信息安全突发事件的应急处置工作。本预案所指网络与信息系统主要是指核心业务 —— 2 —— 系统的网络、门户网站信息系统 (以下简称重要信息系统)。不包括电信及网通

银行网络故障应急处理预案

青岛胶南海汇村镇银行网络故障应急处理预案

1. 应急响应机制 1.1. 基本处理流程 发现故障 初步判定 启动应急预案,并通知领导联系技术支持处理 联系开发人员或厂家工程师现场处理 故障恢复 总结,修订应急预案 扩大应急 突发事件应急组 按事件流程处理 一般事件 突发事件 已解决 已解决 记录 汇报进度 汇报进度 增援 汇报 未解决 (1)值班人员平时应做好应急事件的监控工作,对于突发事件应认真分析、准确判定故障发生的数据域,负责跟踪该事件直至其结束。对于不在运维中心的故障,应在第一时间内通知负责人去现场处理,密切关注事件流程及进展情况,并做好登记工作上报领导。 (2)正常情况下,要求值班人员在10分钟内进行事件确认。如果属于一般事件则按照事件流程进行分派处理,否则应迅速启动《应急预案》,并严格按照《应急预案》所规定的步骤快速实施应急处置,及时汇报上级领导,掌握实时处理情况。

(3)在处理过程中,如需其他部门去现场增援处理,应及时向上级领导部门汇报,协调沟通,尽快联系技术工程师或厂家技术支持赶赴现场援助处理。 2.演练准备工作 2.1.视频监控系统 检查视频监控是否正常工作,图像是是否清晰。检查接受到的视频图像为实时图像。 2.2.湿温监控系统 检查湿度控制器、温度控制器是否正常工作,检测当湿度过高或温度过高时其是否实现实时报警。 2.3.UPS检测系统 检查监控中心所收到的UPS运行状态,与实时UPS运行状况是否一致,具体参数是否正常(如输入电压、电流、蓄电池供电情况等)。 3.演练过程 3.1.机房市电供电异常 3.1.1.准备工作 机房供电系统图、配电系统维修工具、应急灯、UPS操作手册、应急联系

桌面终端设备运行维护和技术支持服务-服务流程及应急预案

桌面终端设备信息系统运行维护和技术支持 服务流程及应急预案 编制:****

一、运维服务方式 为了保证项目涉及的所有软硬件设备的正常运行,我方提供了灵活的服务方式,可以充分满足项目对运维服务及应急故障处理的需求,服务方式有以下几种:现场服务——派驻工作人员于工作日内提供技术支持、现场维护服务。 服务台——提供技术咨询、服务请求受理、任务分派、意见受理、客户服务专员快速通道、服务查询等服务。 远程支持服务——为远程终端用户提供远程技术维护、技术支持服务。 1.1、现场服务 我方将分派专业的技术工程师至现场提供运行维护服务及技术支持,不分节假日至少保证1人24小时值班。现场服务工程师严格履行合同中的各项指标承诺,对故障问题进行处理、分析和总结,保证项目涉及的软硬件系统满足客户的日常工作及应急处理的需求。 1.2、服务台 延伸了服务的范围,使业务流程与服务实施相结合,服务台人员对所有用户提交的服务请求、故障和问题等在服务系统进行记录、分派等操作,服务台提供以下的服务: ●对问询服务电话实时应答 ●直接处理简单的请求和投诉 ●记录事件/服务请求到服务管理系统 ●对所有事件进行初始化分析和设计解决方案 ●首先尝试解决事件再寻求二线支持 ●对所有事件监控与升级管理 ●提交服务管理报告 1.3、远程支持服务 我方为用户提供远程支持与协助服务,由远程技术支持工程师负责对终端客户的服务请求进行解答、指导和远程操作。 1)、电话支持

通过电话的方式协助用户完成设备故障排查、优化配置等工作。 2)、邮件支持 提供技术支持邮箱,可以通过邮件沟通,解决用户邮件咨询的问题。 3)、远程软件支持 通过远程协助软件,运用远程直接访问的方式,远程协助用户操作并解决问题。 二、服务流程 为保证运维服务工作的质量,我们制订了贯穿整个运行维护过程的服务流程,这个流程是服务成功实施的重要保障,有效的将人力和事件融合到流程中,用流程贯穿整个过程,将有效的提高服务质量。针对项目,我方将采用以下流程,并固化到服务台中,以更好地提供服务,保障项目服务水平达到项目要求,流程图包括: ●服务台及现场服务流程图 ●应急服务流程图 ●健康检查服务流程图 ●第三方服务流程图 ●其他服务流程图 2.1、服务台及现场服务流程图 为保证现场服务实施的质量能够稳定并不断有所提升,保障客户需求能够得到有效满足,保障现场服务实施团队为客户提供统一、标准化的服务支持,并为客户设立专门的客户服务专员,对运维进行全程跟踪,提升服务实施专业性,制定服务流程: 服务台及现场服务流程图

相关文档
最新文档