计算机机房巡检管理制度

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算机机房巡检管理制度

一、轮流巡检

1、机房每周巡检共5 个工作日,采用轮流巡检制,按事先安排的人员执行,确保机房的不间断管理。

2、临时有事无法按值班排班表值班的员工,请事先与IT 支持中心主管协商,由主管安排好人员替班。

3、必须按要求填写纸面的《计算机机房值班检查记录表》,登记表记录应在巡检期间填写,以记录时间为准,不得事后补填,并及时填写电子版以供做周汇报时附加;纸介质的巡检记录表必须妥善归档保存。

二、计算机机房运维巡检检查范围

(本项根据实际情况做一个表)

下表中所列出的是目前计算机机房物理环境、关键的IT 设备、网络、应用系统。

该清单未来可能会随网络和应用系统的变化而随时更新。

1、计算机机房物理环境

UPS 动力(状态,读数)(此处根据实际情况写上客户处的相关设备)

2、网络

(1)机房网络设备

骨干交换机华为*** 交换机(此处根据实际情况写上客户处的相

关设备)

路由器CISCO 7507 CISCO 3640 华为NE-20 华为AR-40

防火墙CISCO PIX 525 华为1000F

思达Q0毀备

(2)网络线路连通情况

广域网及互联网联通情况

3.主机/ 应用系统

DC-ONE (此处根据实际情况写上客户处的相关设备)

三、巡检要求

1、计算机机房运维人员必须遵守巡检安排中的作息时间规定,严格按操作规程操作,做到不迟到,不早退,不违规操作。

2、所有运维人员均要保持联系畅通。

3、计算机机房巡检必须按要求填写纸面的《计算机机房值班检查记录表》,登记表记录应在巡检期间填写,以记录时间为准,不得事后补填,并及时填写电子版以供做周汇报时附加;纸介质的巡检记录表必须妥善归档保存。

4、巡检期间,进行状态检查发现计算机机房物理环境异常、设备状态异常、网络或应用系统故障,应立即按操作规程执行进行恢复操作,马上通知相关工程师进行紧急处理;并通知客户接口人备案。

5、如果故障按恢复规程无法有效恢复,特别是当发生机房环境

(动力、空调)故障、关键的设备、网络、系统、服务如无法及时恢复时,应立即通知到本单位及客户处相关领导,由相关领导协调资源进行故障处理。

6、故障处理过程必须在机房日常巡检表的备注栏中详细记录,以备查阅。

四、计算机机房现场管理要求

1、非医院信息中心工程师到机房时,需信息中心负责人签字后方可进入;同时运维人员要在机房现场,检查监督其人员工作,避免其他人员未经授权擅自接触机房物理设备。

(2)计算机机房的设备到货接货,拆箱验货,配合设备上架安装、加电测试、系统调试工作;(需在《计算机机房值班登记表》中记录);

(3)计算机机房的机柜、线缆、设备等的标签管理;

(4)计算机机房环境清理。

五、机房故障恢复操作规程(本项根据用户机房情况随时调整)

1、机房物理安全事件、机房环境与动力系统故障如遇到计划停电、故障紧急停电、机房物理安全事件、机房环境动力系统故障(包括:空调、UPS消防等),需立即响应,与供应商联系并协做处理;并立即电话汇报信息中心负责人,同时做书面备案。

2、中心机房网络不通

按如下顺序检查和恢复:

(1) 检查动力,如配线间停电,则通知总务科协调处理;

(2) 检查设备状态,如设备坏(模块/ 端口),则通知相关网络工程师处理,必要时联系设备供应商工程师;

(3) 检查链路状态,如链路介质坏(UTP光纤),贝卩通知相关网络工程师处理;

(4) 检查互联网接入状态,如遇网络中断,贝立即向相关运营商

网管中心电话报障;并通知大客户负责人协调处理;

(5) 上述均无故障,但网络无法恢复,贝相关网络工程师处理;

3、主机无法访问

按如下顺序检查和恢复:

(1) 检查主机网络连接,如主机网络连接断,贝尝试重启服务器;如无法恢复,贝通知相关主机工程师到现场解决;

(2) 检查主机运行状态,如主机硬件故障( 板件/ 模块/ 硬盘) ,贝通知相关主机工程师到现场处理。

4.应用系统不能访问

按如下顺序检查和恢复:

( 1)检查主机/ 服务器状态,如主机无法访问,按“主机无法访问”的步骤处理。

(2)检查数据库服务状态,如DB服务DOW,则尝试重启DB 或OS 如重启无效,则通知相关DBA处理。

(3)应用服务状态检查,如应用服务DOW或死锁,贝卩尝试重启应用或OS如重启无效,则通知相关应用系统管理员处理。

5、基础服务无法访问

按如下顺序检查和恢复:

(1)检查主机,如主机无法访问,则按“主机无法访问”的步骤处理。

(2)检查应用服务状态,如应用服务DOW或死锁,贝S尝试重启应用或OS如重启无效,则通知相关应用系统管理员

注:以上所有故障处理前后都需详细备案。

六、值班要求:

1. 所有运维人员必须遵守值班安排中的作息时间规定,严格按操作规程操作,做到不迟到,不早退,不违规操作。

2. 有急事无法按排班表值班时(如:病假、事假、年休假),必须事先以书面方式(或邮件)向信息中心主任请假,批准后安排好替班方可休假。

3. 所有运维工程师均要求手机24 小时开机,并且要求手机随身携带,无故违反者给予50元/ 次的处罚。

巡检应该指信息系统的巡检. 主要分为以下几部分: 信息应用系统的巡检

服务器及数据库方面巡检

计算机设备类的巡检

网络设备类的巡检不同部分的巡检频度是不同的, 举例: 机房物理设施我安排早晚各巡一次.

挂号及收费等窗口单位的应用系统应急系统设备巡检, 每天安排一次.

网络管井的设备除尘等巡检一个月一次, 网络配置巡检一周一次并备份配置.

相关文档
最新文档