服务器巡检指示灯查看指南

服务器巡检指示灯查看指南
服务器巡检指示灯查看指南

服务器指示灯查看指南

1. 快速诊断板电源、风扇、内存、CPU、pci-raiser、及温度过热的状态指示灯

2. UID按钮/指示灯蓝色=激活;闪烁=系统被远程访问;不亮=无人远程访问机器或没有按

UID按钮

3. 内部健康灯绿色=正常;橙色=系统降级,确认处于降级状态的备件。参考快速诊断板;

红色=系统严重故障,确认有严重故障的备件。参考快速诊断板

4. 外部健康灯(电源)绿色=正常;橙色=冗余电源故障,确认处于降级状态的电源,参照

快速诊断板;红色=严重电源故障,确认有严重故障的电源。参考快速诊断板。

5. 网卡指示灯绿色=网卡已连接;闪烁=网卡已连接且有数据访问;不亮=网卡没有连接,或

者无此位置网卡。

6. 电源按钮/指示灯绿色=系统开机运行;橙色=系统关机但电源正常连接;不亮=电源线没

有连接或电源故障。

*下图为380G6服务器前面板

1. 指示灯所在位置:位于DL380 G6服务器前面板左侧。(以后机房为DL380Gen8服务器,诊断板位于机器前面板右侧。诊断板信息类似,请对比参考。DL580为插板拔出后一样为诊断板)

2. 内部健康灯报警,必然伴随着快速诊断板上有相对应的硬件指示灯报警,下图为快速诊断板上各个指示灯的含义

服务器定期巡检制度

服务器定期巡检制度 为了保证省内各网点服务器正常、有序、安全运转,提升工作效率,保障客户能够更好的应用汇信科技产品及相关服务,特制定本制度,对服务器巡检加以规范。 服务器由专人负责统一管理和日常维护,其他员工未经允许,不得擅自动用。如必须在服务器控制台上进行操作,须经管理人员同意,并对所进行的所有操作进行登记(《服务器使用登记表》)。 一文件管理 每天对修改的文件进行备份,系统文件的正常拷贝。 每周对文件系统进行修复性检查。 每月对整个系统进行备份。 根据备份,恢复被不当修改的文件系统。 二服务器资源管理 检查服务器资源使用情况,处理由于服务器有限资源的使用而遇到的问题。 排除由于连接问题而造成的网络阻塞。 失控进程检查。 磁盘空间使用情况检查:查找无主注册区,删除临时文件和由于不当关机或其他原因而生成的大型文件。 服务器工作效率检查,按需重新调整系统、分配资源。 三日志管理: 对服务器上所起服务的各项日志进行整理、清理,对反映出的问题向相应人员进行反馈。对系统的修改和重大事件进行纪录。 四安全管理: 实时关注系统安全问题,包括病毒防范、外来攻击。 安装病毒防火墙,并保证实时更新;每周对服务器进行一次整体病毒扫描。 管理员制定服务器超级用户口令,并需保密,不得外泄。口令须6位以上,由字符、数字、符号组合而成,且每季更换。 按需制定员工的服务器使用权限,分配口令。员工只能在被允许的工作目录里进行操作,禁止试图进行权限外操作。 对软件使用权限进行审定。 寻找权限失控的文件,并检查文件所有者和大小。 寻找无主文件。 五员工使用管理: 员工需对自己的服务器登陆口令保密,严禁随意传播。 员工只能在分配到的工作目录里进行操作,严禁进行可能对服务器产生伤害的操作。 在未经允许的情况下,禁止在服务器控制台上进行操作,需向管理人员提交操作要求,由管理人员进行处理,若却有必要由本人进行操作,须经管理人员同意,并填写《操作日志》。

设备日常巡检记录表

热轧电气设备日常巡检保养记录表 表码:R-DS-01编号:01 年月 巡检项目巡检日期配电 室温 度 配电 室无 漏水 配电 柜无 放电 开关 运行 正常 配电 柜指 示正 常 三相 电压 电流 平衡 无报 警故 障现 象 柜门 关好 电机 无振 动噪 声 电机 无臭 味冒 烟 电机 温度 正常 电缆 无破 损 冷却 良好 粉尘 堆积 情况 其它 设备 异常情况描述巡检人 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 填写说明:

2、其它设备包括:热轧电气设备日常巡检保养记录表 表码:R-DS-02编号:02 年月 巡检项目巡检日期配电 室温 度 配电 室无 漏水 配电 柜无 放电 开关 运行 正常 配电 柜指 示正 常 三相 电压 电流 平衡 无报 警故 障现 象 柜门 关好 电机 无振 动噪 声 电机 无臭 味冒 烟 电机 温度 正常 电缆 无破 损 冷却 良好 粉尘 堆积 情况 其它 设备 异常情况描述巡检人 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 填写说明:

巡检项目巡检日期配电 室温 度 配电 室无 漏水 配电 柜无 放电 开关 运行 正常 配电 柜指 示正 常 三相 电压 电流 平衡 无报 警故 障现 象 柜门 关好 电机 无振 动噪 声 电机 无臭 味冒 烟 电机 温度 正常 电缆 无破 损 冷却 良好 粉尘 堆积 情况 其它 设备 异常情况描述巡检人 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 填写说明:

服务器定期巡检

服务器定期巡检制度为了保证省内各网点服务器正常、有序、安全运转,提升工作效率,保障客户能够更好的应用汇信科技产品及相关服务,特制定本制度,对服务器巡检加以规范。服务器由专人负责统一管理和日常维护,其他员工未经允许,不得擅自动用。如必须在服务器控制台上进行操作,须经管理人员同意,并对所进行的所有操作进行登记(《服务器使用登记表》。) 一文件管理每天对修改的文件进行备份,系统文件的正常拷贝。每周对文件系统进行修复性检查。每月对整个系统进行备份。根据备份,恢复被不当修改的文件系统。 二服务器资源管理检查服务器资源使用情况,处理由于服务器有限资源的使用而遇到的问题。排除由于连接问题而造成的网络阻塞。失控进程检查。磁盘空间使用情况检查:查找无主注册区,删除临时文件和由于不当关机或其他原因而生成的大型文件。服务器工作效率检查,按需重新调整系统、分配资源。 三日志管理:对服务器上所起服务的各项日志进行整理、清理,对反映出的问题向相应人员进行反馈。对系统的修改和重大事件进行纪录。 四安全管理:实时关注系统安全问题,包括病毒防范、外来攻击。安装病毒防火墙,并保证实时更新;每周对服务器进行一次整体病毒扫描。管理员制定服务器超级用户口令,并需保密,不得外泄。口令须 6 位以上,由字符、数字、符号组合而成,且每季更换。按需制定员工的服务器使用权限,分配口令。员工只能在被允许的工作目录里进行操作,禁止试图进行权限外操作。对软件使用权限进行审定。寻找权限失控的文件,并检查文件所有者和大小。寻找无主文件 。五员工使用管理:员工需对自己的服务器登陆口令保密,严禁随意传播。员工只能在分配到的工作目录里进行操作,严禁进行可能对服务器产生伤害的操作。在未经允许的情况下,禁止在服务器控制台上进行操作,需向管理人员提交操作要求,由管理人员进行处理,若却有必要由本人进行操作,须经管理人员同意,并填写《操作日志》。 六其他:定期对操作系统进行更新或按实际情况进行修复。实施解决由于外界原因产生的问题对员工在使用服务器时提出的问题进行处理。

服务器维护规范2016

服务器维护规范 1、预防性维护服务 定期预防性维护也就是日常的一般性维护,是一种基于预防性维护的主动服务。定期对系统进行预防性维护,是确保系统正常健康运行的重要预防措施。通过该服务及时检查、发现故障隐患,更换与排除故障部件,调整系统参数,尽量减少系统故障及宕机时间,保持业务持续性运行。 1.1 预防性维护服务周期 每三个月预防性维护服务一次,对系统软硬件进行预防性检查维护,尽量将隐患消除在萌芽之中。 1.2 预防性维护服务内容 *系统运行环境检查,包括机房温度、湿度和零地电压、零火电压等 *系统硬件运行情况检查 *系统错误日志分析 *超级用户邮件分析,清理过期邮件 *对磁带机、光驱和软驱做读写测试和必需的清洗 *文件系统空间使用情况检查 *系统运行状态、性能检查和优化,包括CPU、内存和交换区使用情况,硬盘和网络的IO 情况检查 *记录系统存储空间的逻辑结构 *双机系统软件配置检查及有效性测试 *操作系统版本及微码检查 *设备除尘处理。 *检查如发现有隐患的部件将及时更换 1.3 预防性维护服务维护的方法 *主机和磁盘阵列的物理状态检查,具体包括电源、风扇状态、LED状态灯检查等。 主要部件的状态检查,具体操作如下: *适配卡状态(包括SCSI卡、网卡等):检查是否处于Available状态。 *内存状态:检查是否处于Available状态以及内存容量是否与机器原始配置相同。 * CPU状态:检查是否处于Available状态 *硬盘状态:检查是否处于Available状态 *网络通讯状态统计:检查其中Ierr和Oerr基本为0 *磁盘空间使用情况检查,要求已经使用空间在80%以下,并且至少有12MB以上的剩余空间。 软驱、光盘驱动器、磁带机的可用性检查,具体操作如下: *光盘驱动器:装入一张光盘,检查光盘的内容是否正确。 *磁带机:把一个文本文件写入空白磁带再读回,检查与原始文件是否一致。 *检查系统错误日志,主要检查其中是否存在永久性不可恢复的硬件错误;读取root邮件等,检查是否有需要处理的部件故障。 系统性能情况检查,具体操作如下: *检查系统内存使用和cpu使用的性能情况。 *检查磁盘I/O的性能情况。 *检查系统交换空间的使用情况。

机房巡检制度

机房巡检制度 一、每日对机房的所有设备进行巡检并认真填写巡检记录。 二、巡检双机系统的主备机切换是否正常,以便一台发生故障时,另一台仍能正常运行。 三、检查机房各接点以及接触部分是否良好,有无脏污、放电现象,有无过热,变色现象。 四、检查各种装置是否清洁,有无异常音响及异常气味。 五、对巡检中发现的问题及隐患要及时排查并消除隐患,加强网络监控,通过告警指示判断故障部位并排除故障。

附件3:计算机设备管理制度 加强计算机设备管理是保质保量完成信息系统安全生产任务的重要保证,各科室、车间(班组)要认真按照计算机设备管理制度要求,抓好本部门的计算机设备的质量管理。 一、由段技术信息科负责建立计算机设备管理台帐,并按规定每年12月30日前将信息系统设备管理台帐上报公司信息技术所。 二、各科室、车间(班组)计算机设备由各科室、车间(班组)负责保管,各部门的计算机信息系统的使用者不经主管领导及技术科主管人员同意,严禁私自拆移,改动任何硬件设备,若发现随意拆卸或丢失设备,要对该部门进行考核,并赔偿损失。 三、各部门不论通过何种形式、渠道增添计算机及相关设备时,必须及时向技术信息科备案并建立相应的设备台帐。对增添了设备而不办理备案手续的部门要对部门主管进行考核。 四、各部门使用的信息技术设备有下列情形之一者,应向技术信息科提出书面申请,经检查属实后统一向上级主管单位申请报废,各部门不得私自处理。 (1)设备能力不能达到铁路运输生产的最低要求。 (2)维护检修费用过高,无使用价值。 (3)系统严重损坏,无法修复。 (4)系统存在重大缺陷,无改造价值。 (5)存在安全隐患,可能危及铁路运输生产安全。

服务器巡检流程表

服务器巡检流程表 服务器巡检流程 一( 准备工作 1. 电话与客户联系,确定巡检的具体时间、地点,并了解服务器型号、规格,数量,服务器有无出现过故障现象,并作好详细记录。 2. 准备相关工具(比如螺丝刀、钳子、刷子)与必要的备品备件(如硬盘、CPU、电源、内存等)。 二( 现场操作步骤 第一步:检查服务器的是否有报警声,指示灯面板是否有红灯和黄灯显示(电源指示灯除外)若有,则表示指示灯对应的该部件有故障,需要仔 细检查此部件,直至将故障排除(指示灯一般正常为绿灯) 第二步:根据客户所用操作系统的不同,分别予以说明: WINDOWS操作系统 a. 检查系统CPU利用率 通过windows操作系统“任务管理器”,检测三次,每次5分钟,记录大约平均的利用率。CPU 5分钟平均利用率低于70%,无进程占用大量资源为正常。 另外内存使用率应低于65%。 b. 在“控制面板?管理工具”中找到“事件查看器”,查看有无明显异常Logging信息。 c. 网络连接信息 在命令行提示符窗口中,输入“ipconfig /all”,查看。若采用了网卡容错, 则需查看主备网卡的flag状态是否为UP,同时检查ip地址和netmask是否正

确。最后使用ping [ip address]检查网络是否通畅,是否有掉包或返回时间是 否较大(内网返回时间值一般为1至2毫秒,外网返回值一般不超过10毫秒为正常)。 d. 磁盘信息: 在“运行”对话框中手工键入“diskmgmt.msc”,打开“磁盘管理”对话框,查看 每一个逻辑分区状态是否为正常状“状态良好”,若为其他出错信息的话,则说明 该块磁盘可能存在故障。需更换做或做其他进一步检测。 Linux操作系统 a. 查看CPU和内存使用率 # top 在命令输出行的第三行和第四行分别显示CPU和内存的使作率。检测三次,每次5分钟,记录大约平均的利用率。CPU 5分钟平均利用率低于70%,无进程占用大量资源为正常。另外内存使用率应低于65%。 b. 网卡的状态 : # ifconfig –a 查看网络连接信息。若采用了网卡容错,则需查看主备网卡的flag状态是否为UP, 同时检查ip地址和netmask是否正确。最后使用ping [ip address]检查网络是否通 畅,是否有掉包或返回时间是否较大(内网返回时间值一般为1至2毫秒,外网返

机房巡检管理制度

机房巡检管理制度 一、巡检时间 每个工作日上午8点 二、巡检部门 微机室 三、巡检目的 进行服务器的检查,对系统数据库进行备份以及软件系统的检查;进行机房网络设备的检查;进行公司网络状态的检测。及时查找、发现网络及信息系统设备隐患,排除故障。 四、巡检要求 1.巡检期间,进行状态检查,若发现问题,如计算机机房物理环境异常、设备状态异常、网络或应用系统故障,应立即按操作规程执行进行恢复操作。 (1)电源、UPS:检查机房供电状况,UPS工作情况、指示状态。 (2)服务器:检查服务器是否当机,服务器(磁盘阵列)硬盘灯指示是否正常。 (3)机房环境:检查机房空调工作状态,机房温度。 (4)网络设备:检查网络设备,包括交换机、路由器、防火墙等及其属设备。检查设备工作状态。 (5)网络通道:检查内外网络通道状态,包括公司内部局域网、公司与INTERNET、公司至各合作单位的网络通道状态。 (6)电话通道:检查电话系统通信及手机通信是否畅通。 (7)SQL SERVER2005数据库:检查信息系统数据库服务是否正常。 2.如果故障按恢复规程无法有效恢复,特别是当发生机房环境(动力、空调)故障、关键的设备、网络、系统、服务如无法及时恢复时,应立即通知总经理等相关领导,由相关领导协调资源进行故障处理。 3.故障处理过程必须在机房日常巡检表的备注栏中详细记录,以备查阅。 五、计算机机房现场管理要求 1.除微机室的工作人员外,其他工作人员进出机房,需总经理签字后方可进入,同时微机室人员要在现场,检查监督其人员工作,避免其他人员未经授权擅自接触机房物理设备。 2.机房的机柜、线缆、设备等的标签管理; 3.机房环境清理。 重庆市金马天然气开发有限公司微机室 2011年9月1日

服务器、网络设备以及安全设备日常维护管理制度

服务器、网络设备以及安全设备日常维护管理制度 第一条 服务器、网络设备及安全设备的安全、性能检查。每台服务器、网络设备及安全设备至少保证每周检查两次,每次检查的结果要求进行登记记录。 第二条 数据备份工作。定期对服务器、网络设备、安全设备的配置文件进行备份,每次更改配置、策略后,都要及时更新备份文件,保证当前为备份最新数据。 第三条 服务器、网络设备及安全设备的监控工作。每天正常工作期间必须保证监视所有服务器、网络设备及安全设备状态,一旦发现服务器、网络设备或安全设备异常,要及时采取相应措施。 第四条 服务器、网络设备及安全设备的相关日志操作。每台服务器、网络设备及安全设备保证每周或依据数据情况对相关日志进行整理,整理前对应的各项日志如应用程序日志、安全日志、系统日志等应进行保存。 第五条 要及时做好服务器的补丁升级和漏洞修复工作。对于新发布的漏洞补丁和应用程序方面的安全更新,要及时分发给每台服务器。 第六条 服务器、网络设备及安全设备的安全检查主要包括CPU利用率、运行状态、性能、网络流量等方面。安全管理员必须保证对服务器、网络设备及安全设备每月进行一次安全检查。每次的检查结果必须做好记录,并生成检查报告。 第七条 不定时的相关工作。每台服务器如有应用软件更改、需要安装新的应用程序或卸载应用程序等操作,应提前告知所有管理员。 第八条 密码定期更改工作。每台服务器、网络设备及安全设备保证至少每一个月更改一次密码,密码长度不少于8位,且要满足复杂度要求。

第九条 系统管理人员要定时对系统服务器进行病毒检查,发现病毒要及时处理。 第十条 未经许可,任何人不得在服务器上安装新软件,若确实需要安装,安装前应得到授权并进行病毒例行检查。 第十一条 经远程通信传送的程序或数据,必须经过检测确认无病毒后方可使用。 第十二条 定时对硬件进行检查、调试和修理,确保其运行完好。 第十三条 关键设备应指定专人保管,未经授权的人员不得进行单独操作。 第十四条 所有设备未经许可一律不得借用,特殊情况须经批准后办理借用手续,借用期间如有损坏应由借用部门或借用人负责赔偿。 第十五条 硬件设备发生损坏、丢失等事故,应及时上报,填写报告单并按有关规定处理。 第十六条 业务系统设备及其附属设备的管理(登记)与维修由系统、网络管理员负责。设备管理人员每半年要核对一次设备登记情况。 第十七条 系统服务器、网络设备及安全设备应由相关管理人员每周进行一次例行检查和维护,并详细记录检查过程及检查结果。 第十八条

机房日常巡检制度及操作规范初稿

各机房日常巡检制度及操作规范 为规范客户驻地各机房日常巡检工作,统一工作要求及执行标准,特制定此制度及规范。 日常巡检制度 1,运维服务工程师必须按日常工作安排及巡检要求,按时进行日常巡检工作。2,未经运维负责人员授权,运维服务工程师不得擅自调整巡检频度及巡检时间点,如遇特殊情况无法按时进行巡检工作时,应及时向运维负责人汇报。3,经安排的巡检测工作,运维服务工程师将对其执行的巡检过程及巡检结果承担相应责任,不得推卸、推脱相应责任。 4,巡检工程师在巡检过程中发现相关故障及问题,应及时如实进行记录,针对非单点性故障应及时向运维负责人汇报,由运维负责人进行下一步处理。5,巡检结束后,运维工程师应及时、全面、如实填写巡检结果记录文件,并签字确认巡检结果。巡检记录文件不得由非巡检人进行填写或代填。 6,针对巡检工作出现不适合现场实际工作等情况,运维服务工程师可向运维负责人提出问题和个人建议。 7,运维负责人须定期对巡检记录及巡检过程视频进行检查,检查频度不低于一周一次,且对检查结果进行记录和汇总。 8,针对相关超出制度约束范围情况,由运维负责人负责进行解释。 日常巡检规范 巡检规范根据各机房的具体情况及以前故障情况,针对性编制,视各个机房不同情况进行逐一说明。每个机房机房规范包括如下内容:巡检工作安排,巡检时间点,巡检线路,巡检关键点进行说明。

一,总局六楼机房巡检操作规范: 1)巡检工作安排: 本机房日间工作时段(8:00-17:00)内巡检工作按日常工作情况由值班人员和白班人员共同执行;夜间工作时段(17:00-次日8:00)内巡检工作由值班人员独立执行。间隔两小时巡检一次。 每日8:00点由白班人员检查,并将结果同前日晚班人员巡检结果进行核对。每日16:00点由晚班人员检查,并将结果同当日白班人员巡检结果进行核对。 2)巡检时间点: 日间巡检时间点为:8:00,10:00,12:00,14:00,16:00,其中8点巡检由当日白班人员执行,共5次,其中16点巡检由晚班人员执行。 夜间巡检时间点为:18:00,20:00,22:00,24:00,次日2:00,次日4:00,次日6:00,共7次。 巡检时间点尽可能按上述时间点要求执行,一般巡检实际发生时间和规范要求时间偏差不超过30分钟。 3)巡检路线说明: 建议巡检次序为,先基础环境巡检,再分区巡检(从A区到B区C区D区E 区G区)。 建议巡检步行路线从平台门到各台空调,再由A区通道到B区通道C区D区E 区G区等,最后检查门口粘灰板情况。 4)巡检关键点说明: 基础环境部分: 机房各门的开启情况;空调运行情况;玻璃地板下情况;上水加热器情况

信息机房管理日常巡检制度

信息机房管理日常巡检制度 一、网络机房管理制度 1、网络机房的管理工作由网络管理主管和网络管理员负责,内容包括机房安全管理、电源管理、环境管理、钥匙管理等。 2、进入网络机房需换拖鞋。 3、网络机房内禁止吸烟。 4、网络机房的钥匙由网络管理员和系统管理员保管,要对钥匙的安全性负责 ,如需借出信息中心时,要填写借出登记(附表一) 5、信息中心人员进入网络机房要对机房内设备的安全负责。 6、信息中心人员非工作时间进入网络机房要进行登记,并确保网络机房安全。 7、非信息中心人员进入网络机房需经信息中心人员许可,并进行登记(附表二),且应由一名信息中心人员进行监护。非信息中心人员进入后不许随意对设备进行操作及改动,有问题及时与监护人交流。监护人对网络机房安全负责。 8、工作完毕离开网络机房时要关灯关窗锁门,对于办公楼网络机房还要投入报警装置。 二、机房建设要求 1、计算机机房建设应符合国标 GB2887-89《计算机站场地技术条件》、 GB9361-88《计算机场地安全要求》以及其他相关标准和行业要求。 2、机房应专用,不能与生产区和办公区在一起,更不能当作存放其他物品的仓库,以免进入机房的人员角色混杂。 3、保证机房使用面积宽敞,机房应有足够的余留空间,机架密度不能过高。

4、机房应聘请专业人员进行网络布线,所有网线均贴上提示标签,光纤尾纤使用塑料套管保护。 三、机房物理访问控制要求 1、机房应设置门禁系统,出入机房的人员需进行出入记录。 2、实行机房出入登记制度(附表二),严禁无关人员及外来人员进入机房或上机操作,如有特殊需要,须经领导或安全责任人批准。 3、机房重要主机尽可能不设光驱、软驱和 USB口等输出设备,否则由专人负责机柜上锁。 4、所有机房设置监控系统,有效监控非法物理破坏。 5、进入机房内的所有设备增加、系统安装、配置变更、线路调整等系统变更情况均需做登记记录。 6、非本单位人员在进入公司之前,要求提供明确的身份证明。一旦被允许进入,在预定的访问时间内将有公司员工陪同。 四、环境保护要求 1、机房维护人员、值班人员以及进入机房的其他人员必须更换专用工作鞋或穿鞋套。 2、所有机房均单设配电室,采用电源质量改善措施和隔离防护措施,如滤波、稳压、稳频设备等;尽可能使用双路供电,或者使用备用发电机或 UPS电源, UPS电源应保证停电后至少运行 4小时。 3、机房应使用专用空调负责调节温度、湿度、通风等指标,并有电源措施保证空调 7x24小时运行。交换机房内的温度应保持在 + 15 ℃至+ 25 ℃,相对湿度应保持在 20%至 60%,且保持正常通风,防止不良气体及灰尘侵入。 4、机房应设置相应的火灾自动报警系统和充足的消防设备,各种灭火器材应定位放置,随时保持有效,人人会使用。设备机房及大

服务器巡检操作规划

服务器巡检报告 一、服务器巡检的重要性 服务器是系统重要的业务运行平台,对服务器进行巡检能够及时发现服务器的隐患,以便于改善和优化服务器的性能;观察服务器的运行状况,及时对设备进行调整,提高平台的整体服务水平。同时可根据日常维护和相关记录,为平台后续发展提供整体建设规划和建议。 二、日常巡检内容包括以下方面: 机房环境温度、湿度巡检 服务器外壳整体检查 服务器清洁程度 服务器的外表温度 服务器风扇运行监测 服务器电源连接检查 服务器网络接口检查 服务器LED警示屏幕检查 服务器硬盘、电源、网卡等设备灯的状态 服务器硬件磁盘、内存、cpu、网卡使用情况 服务器系统日志 运行与服务器上应用是否可用 应用系统日志检查(根据实际情况执行) 杀毒软件的检查

三、巡检内容详细说明 1、服务器硬件巡检主要内容

2、操作系统检查 3、性能检查 一、Windows系统服务器性能查询(1)内存、cpu使用情况巡检用命令打开任务管理器

检查方法: Windows下使用任务管理器,记录占用内存、cpu最多的前五位进程或应用程序; 性能 CPU使用情况:表明处理器工作时间百分比的图表,该计数器是处理器活动的主要指示器,查看该图表可以知道当前使用的处理时间是多少。 CPU使用记录:显示处理器的使用程序随时间的变化情况的图表,图表中显示的采样情况取决于“查看”菜单中所选择的“更新速度”设置值,“高”表示每秒2次,“正常”表示每两秒1次,“低”表示每四秒1次,“暂停”表示不自动更新。 PF使用情况:正被系统使用的页面文件的量。 页面文件使用记录:显示页面文件的量随时间的变化情况的图表,图表中显示的采样情况取决于“查看”菜单中所选择的“更新速度”设置值。 总数:显示计算机上正在运行的句柄、线程、进程的总数。 认可用量:分配给程序和操作系统的内存,由于虚拟内存的存在,“峰值”可以超过最大物理内存,“总数”值则与“页面文件使用记录”图表中显示的值相同。 物理内存:计算机上安装的总物理内存,也称RAM,“可用”表示可供使用的内存容量,“系统缓存”显示当前用于映射打开文件的页面的物理内存。 内核内存:操作系统内核和设备驱动程序所使用的内存,“页面”是可以复制到页面文件中的内存,由此可以释放物理内存;“非分页”是保留在物理内存中的内存,不会被复制到页面文件中。

机房服务器检查细则

机房服务器维护说明 第一类、机房环境及物理检查 一、机房环境 1.温度与湿度: 最佳工作温度:20-25摄氏度 极限工作温度:10-40摄氏度 湿度: 8-80%(在23摄氏度条件下) 2.同时机房要保证服务器清洁. 机房应保持服务器清洁,若空气灰尘过多,很容易造成资源读写错误及磁盘机中磁盘或读写磁头毁损。定时使用皮老虎、刷子清除服务器灰尘。 二、电源 电压: 要求电压稳定,尖峰电压会损坏设备 电压范围:220V +/- 10%,即200-240V, 50-60Hz 电源功率: 视机器类型和系统配置而定 电源线: 标准的零,地,火三相电,其中零,地电压不得超过 3.0V. 电源接驳:

用符合电流要求的空气开关或其他设备和主机电源线接驳,保证计算机系统的可靠工作应使用稳压电源和UPS,对于冗于电源的接入,采用两路单独输入. 三、硬件检查 检查服务器、磁阵的安装、电源线主机接线符合要求。 服务器状态检查: 1.当服务器处于启动和正常工作状态时,其前面板上的液晶显示屏上应无信息显示。 2.当液晶显示器上出现带数字和字母的信息时,说明有硬件告警。可以通过查询相关机型的面板报警数字信息查到相应告警原因,情况严重的,则要立即通知服务器厂商进行问题排查。 1.当服务器的状态灯出现橙黄色时,说明有硬件告警,此时要检查磁柜的电源、接线、硬盘等。如果有硬件故障则立即进行更换和更正,如果查不出具体问题,则需要联系相关厂商进一步诊断。 2.当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,如该硬盘有读写操作,则绿灯会不规则闪烁,当硬盘损坏时或RAID出现问题时,则硬盘状态灯将熄灭,或者呈闪烁状态: 以1~3秒的频率有规律地、不停地闪烁 第二类、系统日常维护流程 2.1系统启动 系统启动正常顺序如下: 首先对外设(磁盘阵列、磁带库等)加电。 待所有外设加电自检完成后,主机加电正常起机。主机加电后,才能按POWER键起机. 2.2系统关闭

服务器巡检规范

服务器巡检规范 一)收集服务器(应用、数据库)软硬件信息部分 此部分工作基本为一次性工作,收集完毕后整理成文档保存以备查。 1.收集主机名: hostname 2.收集cpu数量和信息: grep "model name" /proc/cpuinfo 3.收集内存信息: free 4.收集磁盘信息: fdisk –l 5.收集磁盘使用情况: df –m 6.收集系统信息: getconf LONG_BIT lsb_release –a cat /etc/issue cat /proc/version 7.收集应用安装路径 jdk安装路径 tomcat 安装路径及startup.sh参数 trans 安装路径及startup.sh参数 8.收集数据库信息 cat /home/oracle/.bash_profile (数据库安装参数) 以下使用PL/SQL DEVELOPER工具查看 select * from v$version; (数据库版本) select name,value from v$parameter where name in ('db_name','service_names','instance_name','processes','sga_max_size','db_cache_size','larg e_pool_size','shared_pool_size','java_pool_size','log_buffer','log_archive_dest','undo_mana gement','undo_tablespace','undo_retention','db_recovery_file_dest_size','db_recovery_file_

机房巡检制度

机房巡检制度 为了保障集团公司信息中心设备稳定运行,系统信息更加安全,特制定本机房巡检制度。 一、卫生检查: 巡检人员必须每天对机房巡检一次,每周进行室内卫生和设备卫生打扫,机房应防尘,门窗要严密。 二、线路方面检查: 认真检查各线路的连接情况,发现有接头松动、接触不良、线缆破损现象应先告知相关部门领导后更换解决,并做好记录。认真检查电源线路、空气开关有无负载过重引起发热现象,发现异常提出解决方案,并作出报告立刻予以更改。如发现电路质量欠佳或机线障碍,应立即采取相应措施,作好记录,并向领导汇报,每四个月对UPS 进行一次放电试验。机房所有设备、机柜要用铜芯线做好防雷接地,应有良好的防静电措施检查线头有无松动现象,确保系统稳定可靠运行。 三、环境外设检查: 检查空调运行状况,是否存在异响,指示灯闪亮是否正常,空调有无漏水现象,记录机房内温度数据,每个月清洗一次过滤器。检查加湿器运行情况,是否存在异响,指示灯闪亮是否正常,水箱有无漏水现象及水箱内水位情况,记录机房内湿度数据。 四、服务器运行检查: 认真检查每一个服务器的运行情况,电源与硬盘指示灯是否正常闪亮,服务器运行时是否存在异响,杀毒软件是否查杀到病毒,服务器是否正常提供服务、从外网是否能进行流畅访问。定期对系统各项指标进行测试,分析测试结果,评估系统运行状态,对异常情况提出

解决方案,并作出测试报告。 五、架构方面检查: 认真检查联通光猫、电信光猫、负载均衡、防火墙、级联交换机、核心交换机指示灯闪亮情况,检测联通与电信网络连接情况。 六、危险源检查: 机房是防火重地,巡检人员必须熟悉消防设施情况,掌握消防器材的使用方法和急救的基本知识。严禁存放、堆放易燃易爆物品,禁止吸烟、明火,经常检查并保持消防和安全设施的良好状态。 七、防盗 离开机房时,必须确保关好门窗将其反锁好才可离开。

服务器设备日常巡检指导书

服务器设备日常巡检指导书

目录 1、声明 (3) 2、巡检工具清单 (3) 3、机房环境及线缆布局巡检项目 (3) 3.1、巡检注意事项 (3) 3.2、服务器所在机房环境巡检 (4) 3.3、服务器相关的线缆布局情况巡检 (4) 4、Tecal 服务器巡检 (5) 4.1、服务器指示灯巡检 (5) 4.2、服务器iMana健康信息巡检 (5) 4.3、MM管理模块健康信息巡检 (6) 附录:服务器巡检清单 (6)

1、声明 本指导书用于华为Tecal服务器设备的日常维护巡检,操作前应征得客户同意。巡检的操作应仅仅针对服务器外观以及系统的管理单元,如服务器的iMana单元或者MM 管理模块等,不应对业务面有任何操作,以免意外中断客户重要业务。 现场工程师在操作前应仔细阅读相关服务器设备的用户指南(用户指南可在配套光盘中获取到,或者通过登录https://www.360docs.net/doc/fd2719566.html,/enterprise进行下载),有任何不清楚的地方务必确认清楚,整个操作过程请做好静电防护和机器保护工作。 2、巡检工具清单 3、机房环境及线缆布局巡检项目 3.1、巡检注意事项 在巡检之前,为了避免潜在的危险,请先熟悉下表中所列的安全信息符号,下列符号可能放置在服务器的一些部件上面。

3.2、服务器所在机房环境巡检 检查机房环境主要包括机房内部的空调、供电设备和策略等。 3.3、服务器相关的线缆布局情况巡检 对线缆的巡检,建议肉眼查看即可,即使需要重新拔插,也得征得客户的同意。日常操作线缆时,为防止损坏,需注意以下事项: ●检查电源线。 –确保三线制电源接地线的接头表面良好。 –确保电源线的类型正确。 –确保电源线表面绝缘部分没有任何破损。 ●保证线缆远离热源;线缆避免紧绷,保持松弛。 ●插拔线缆时,不要用力过大。

日常巡查管理制度

日常巡查管理制度 为了加强设备的管理和维护,及时的了解和控制故障,使基地网络能够正常高效运行,特制定本制度。 1.1机房设备的维护 1.1.1维护基本条件 经常检查常用工具,配置常用的维修工具及检修仪器,如各种钳子、螺丝刀、测电笔、巡线仪、胶布等等,需要时还应随时添置。 1.1.2巡查地点 一楼机房,二楼机房,五楼机房,各教室多媒体设备 1.1.3中心机房工作流程: 1、利用PING命令测试到服务器、各交换机、路由器、VPN网关以及外部 网络的连通性。 2、查看所有网络设备的端口以及状态灯的工作状态(包括一楼、二楼和五 楼的机房),保证检查的设备工作正常。 3、检查网络线缆及连接状态,确保网络线缆完好无损。 4、将所有的检查结果记录备案,对安全隐患提前预防 1.1.4机房监控设备的维护 1、每季度一次设备的除尘、清理,打扫监控设备显露的尘土,对摄像机、 防护罩、门禁、监控采集模块等部件要卸下彻底吹风除尘,之后用无水酒精棉将各个擦干净,调整摄像头清晰度,确保机器正常运行。

2、对容易老化的监控设备部件每月一次进行全面检查,一旦发现老化现象 应及时更换、维修,如视频头、采集模块等。 1.1.5空调控制系统的维护 1、从空调系统的显示屏上检查空调系统的各项功能及参数是否正常; 2、如有报警的情况要检查报警记录,并分析报警原因; 3、检查温度、湿度传感器的工作状态是否正常; 4、检查空调外机及保温管是否漏水 1.1.6机房基础设备维护 1、吊顶表面清洁;板材松动、翘起修复,变形、损坏更换;龙骨调平等 2、墙面污迹清理,裂缝修补 4、静电地板清洗清洁,地面除尘;缝隙调整;平整度调整;损坏更换 5、接地电阻测试;主接地点除锈、接头紧固;防雷器检测;接地线触点 防氧化加固。 6、线路测试;模块、光纤配线检查;标签检查;整理凌乱线缆;对所发 生的故障及时排除; 7、机柜除尘、清洁;机柜及网络设备整理,包括交换机、配线架和网线 的重新整理、排序,并重新标上统一的编号 1.2机房服务器的维护 1.2.1服务器维护流程

主机服务器运维管理制度

左机服务器运维管理制度 2013-03-21 发布2013-03-21 执行

XXXXX发布 为了实现励治支付公司IT规范管理,明确各相关部门职责,规范业务管理,使信息系统正常、高效安全运行,充分发挥系统的良好作用,特制定本管理制度。 本管理制度由励治支付公司技术部提出、起草、归口并解释。 本管理制度的主要编写人员:董昱李启洋 本管理制度的审核人:张宏涛 本管理制度的批准人:王骐恺 本管理制度自发布之日起实施。 执行中的问题和意见,请及时反馈至励治支付公司技术部。

、范围 本制度明确了励治支付公司IT的使用规定及工作规范。 本制度适用于励治支付公司IT运维管理工作。励治支付公司所 有相关人员均应严格遵照执行, 与信息安全相关的业务也应严格遵守 本制度。 二、规范性引用文件 F列文件对于本规范的应用是必不可少的。凡是注日期的引用文 件,仅注日期的版本适用于本规范。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本规范。 中华人民共和国计算机信息系统安全保护条例中华人民共和国国家 安全法中华人民共和国保守国家秘密法计算机信息系统国际联网保 密管理规定中华人民共和国计算机信息网络国际联网管理暂行规定 IS027001标准/IS027002指南 公通字[2007]43号信息安全等级保护管理办法 GB/T 21028-2007信息安全技术服务器安全技术要求 GB/T 20269-2006信息安全技术信息系统安全管理要 GB/T 22239-2008信息安全技术信息系统安全等级保 护基本要求 GB/T 22240-2008信息安全技术信息系统安全等级保

服务器网络设备以及安全设备日常维护管理制度

服务器、网络设备以及安全设备 日常维护管理制度 第一条服务器、网络设备及安全设备的安全、性能检查。每台服务器、网络设备及安全设备至少保证每周检查两次,每次检查的结果要求进行登记记录。 第二条数据备份工作。定期对服务器、网络设备、安全设备的配置文件进行备份,每次更改配置、策略后,都要及时更新备份文件,保证当前为备份最新数据。 第三条服务器、网络设备及安全设备的监控工作。每天正常工作期间必须保证监视所有服务器、网络设备及安全设备状态,一旦发现服务器、网络设备或安全设备异常,要及时采取相应措施。 第四条服务器、网络设备及安全设备的相关日志操作。每台服务器、网络设备及安全设备保证每周或依据数据情况对相关日志进行整理,整理前对应的各项日志如应用程序日志、安全日志、系统日志等应进行保存。 第五条要及时做好服务器的补丁升级和漏洞修复工作。对于新发布的漏洞补丁和应用程序方面的安全更新,要及时分发给每台服务器。 第六条服务器、网络设备及安全设备的安全检查主要包括CPU利用率、运行状态、性能、网络流量等方面。安全管

理员必须保证对服务器、网络设备及安全设备每月进行一次安全检查。每次的检查结果必须做好记录,并生成检查报告。 第七条不定时的相关工作。每台服务器如有应用软件更改、需要安装新的应用程序或卸载应用程序等操作,应提前告知所有管理员。 第八条密码定期更改工作。每台服务器、网络设备及安全设备保证至少每一个月更改一次密码,密码长度不少于8位,且要满足复杂度要求。 第九条系统管理人员要定时对系统服务器进行病毒检查,发现病毒要及时处理。 第十条未经许可,任何人不得在服务器上安装新软件,若确实需要安装,安装前应得到授权并进行病毒例行检查。 第十一条经远程通信传送的程序或数据,必须经过检测确认无病毒后方可使用。 第十二条定时对硬件进行检查、调试和修理,确保其运行完好。 第十三条关键设备应指定专人保管,未经授权的人员不得进行单独操作。 第十四条所有设备未经许可一律不得借用,特殊情况须经批准后办理借用手续,借用期间如有损坏应由借用部门或借用人负责赔偿。 第十五条硬件设备发生损坏、丢失等事故,应及时上

运维服务服务器网络设备日常巡检报告

巡检报告 单位名称时间 巡检人 巡检内容检查方法结果一、服务器系统 设备名称:设备型号: 1、检查服务器的是否有报警声,指示灯面板是否有红灯显示(电 源指示灯除外)观察指示灯 有(无)报警声 有(无)红灯 2、通过windows操作系统“任务管理器”,检查系统CPU利用率检测三次,每次5分钟,记录大约平均的利用率 3、通过windows操作系统“任务管理器”,检查系统内存利用率检测三次,每次5分钟,记录大约平均的利用率 4、检查系统盘和数据盘的空间占用硬盘共分几个分区,哪几个分区?每个分区空间大小,分别使用多少 5、操作系统启动和运行状况检查加电启动是(否)正常 6、数据库启动和运行情况应用启动测试是(否)正常 7、应用程序启动和运行情况应用使用测试是(否)正常异常问题记录(上面检查发现的问题或在各检查项外发现的问题请在此具体描述) 备注:以每台设备为单位填写。 二、网络设备系统 设备名称:设备型号: 1、检查设备面板指示灯状态,看是否有红灯报警观察面板指示灯有(无)红灯

2、从本局网络中的某台PC机上ping下属的分支机构和部局的某台服务器Ping对方IP地址□通 □不通 3.管理级用户控制: 远程登录用户必须设置密码。 检查是否需要密 码才能进入管理级 别用户。 □完善 □不完善 4. Telnet登录控制: Telnet口令和Super口令的设置要不同,使用密文格式。□完善□不完善 5. 接口配置: 不使用端口置为shutdown状态。Display current-configuration □完善 □不完善 6. FE/GE口配置: 端口模式(包括速率、双工模式)配置对接双方必须一致;端口实际工作模式必须与对端一致。Display current-configuration Display interface □完善 □不完善 7. telnet和串口登录: telnet和串口两种方式能正常登录。□完善□不完善 8. 端口统计数据: 查看各个使用的端口收发统计数据是否正常,异常报文是否有增长。Display interface □完善 □不完善 09.电源状态查看: 各电源模块工作状态正常。Display system device □完善 □不完善 10. CPU占有率: CPU占有率应正常,与当前开展的业务类型和转发流量相符。Display system cpu □完善 □不完善 11.系统当前正在发生的告警信息:有告警及时处理。Display alarm □完善 □不完善 12.内存使用情况:内存占有率。Display memory □完善 □不完善 异常问题记录(上面检查发现的问题或在各检查项外发现的问题请在此具体描述) 备注:以每台设备为单位填写。 三、安全设备系统 设备名称:规格型号: 设备名称:规格型号: 设备名称:规格型号: 1、检查防病毒的工作状态。观察系统运行状 态 是(否)正常

服务器巡检流程表

服务器巡检流程 一.准备工作 1.电话与客户联系,确定巡检的具体时间、地点,并了解服务器型号、规格,数量,服 务器有无出现过故障现象,并作好详细记录。 2.准备相关工具(比如螺丝刀、钳子、刷子)与必要的备品备件(如硬盘、CPU、电源、 内存等)。 二.现场操作步骤 第一步:检查服务器的是否有报警声,指示灯面板是否有红灯和黄灯显示(电源指示灯除外)若有,则表示指示灯对应的该部件有故障,需要仔 细检查此部件,直至将故障排除(指示灯一般正常为绿灯)第二步:根据客户所用操作系统的不同,分别予以说明: WINDOWS操作系统 a.检查系统CPU利用率 通过windows操作系统“任务管理器”,检测三次,每次5分钟,记录大约平 均的利用率。CPU 5分钟平均利用率低于70%,无进程占用大量资源为正常。 另外内存使用率应低于65%。 b. 在“控制面板→管理工具”中找到“事件查看器”,查看有无明显异常Logging信息。 c. 网络连接信息 在命令行提示符窗口中,输入“ipconfig /all”,查看。若采用了网卡容错, 则需查看主备网卡的flag状态是否为UP,同时检查ip地址和netmask是否正 确。最后使用ping [ip address]检查网络是否通畅,是否有掉包或返回时间是 否较大(内网返回时间值一般为1至2毫秒,外网返回值一般不超过10毫秒 为正常)。 d.磁盘信息: 在“运行”对话框中手工键入“diskmgmt.msc”,打开“磁盘管理”对话框,查看 每一个逻辑分区状态是否为正常状“状态良好”,若为其他出错信息的话,则说明 该块磁盘可能存在故障。需更换做或做其他进一步检测。 Linux操作系统 a.查看CPU和内存使用率 # top 在命令输出行的第三行和第四行分别显示CPU和内存的使作率。检测三次,每 次5分钟,记录大约平均的利用率。CPU 5分钟平均利用率低于70%,无进程 占用大量资源为正常。另外内存使用率应低于65%。 b. 网卡的状态 : # ifconfig –a

相关文档
最新文档