巡检服务报告(IBM小型机)v1.3
机房巡检服务报告

机房巡检服务报告XXX巡检服务支持记录用户单位:服务开始时间:服务结束时间:服务工程师:一、机房设备维护管理1)机房网络定期常规维护维护内容:1.检查服务器设备电源电压是否正常。
2.检查机器设备的开关、连线、插头插座等是否正常,有无错位、松动。
3.检查设备的各种指示灯和运行状况是否正常。
4.检查设备主要性能,发现问题及时解决或通知维修部门解决。
5.检查设备外部灰尘情况,是否需要清洁机内灰尘。
6.检查是否启用内、外网络设备防火墙控制策略。
7.检查路由器、交换机、UPU、内存利用率是否正常。
8.对设备进行级间连接可靠性检查,系统测试及校准。
9.检查各信息点接入网络情况。
10.登陆各网络设备,备份设备的配置文件。
检查结果:正常□电压过高□电压过低插头无松动,连线无错位□插头、连线有松动、错位设备运行正常□设备运行有异常□设备不运行设备性能优异□设备性能良好□设备性能差机外灰尘很少,不需清洁□机外灰尘较多,需清洁已启用策略管理□未启用策略管理利用率正常□利用率偏高设备间连接与系统测试均正常□设备间连接与系统测试出现异常各信息点接入网络正常□各信息点接入网络异常已备份□未备份备注:11.机房环境2)硬件网络设备部分是否完成定期常规维护,如果存在问题,请进行问题描述及处理记录(如果没有,可以填写无)。
二、服务器维护管理1)服务器定期常规维护维护内容:1.检查服务器是否有报警声,指示灯面板是否有红灯显示。
2.检查操作系统启动和运行状况是否正常。
3.检查服务器系统定时任务执行情况是否正常。
4.检查数据库启动和运行情况。
5.检查应用程序启动和运行情况。
6.检查服务器操作系统是否安装杀毒软件。
7.检查服务器IP地址配置、服务器网络数据路由。
检查结果:正常□异常正常□异常正常□异常正常□异常正常□异常已安装□未安装配置正确,网络正常通讯□配置有误,需修改□配置重新设定本地备份数据□异地备份数据□无备份备份正常□备份不正常(已修正)软件运行正常,无需安装软件能运行异常,已经调试安装软件无法运行,有问题待解决。
巡检报告(电子版)

巡检报告(电子版)巡检报告(电子版)IBMp系列小型机巡检报告客户名:客户号:巡检时间:客户代表签字:IBM工程师签字:P系列系统预防性维护服务报告单(硬件部分)客户名称:_____________________________机器型号:______序列号:______________检查时间:_____年____月____日____时本年度第______次检查1.机房环境:8.SAN交换机是否正常:□正常□不正常电源电压_____□符合要求□不符合9.通信:零地电压_____□符合要求□不符合网卡状态、IP地址□正常□不正常温度、湿度□符合要求□不符合网卡通信□正常□不正常2.检查系统硬件情况:10.磁盘阵列RAID盘的状态:设备故障灯是否有亮□有□无IBM存储型号______________有其他异常情况□有□无□Good□Degraded□Failed3.硬件错误报告(ErrorLog):□Cache打开□Cache关闭有否硬件故障□有□无□有热备盘□无热备盘mail中有否硬件错误□有□无数据保护方式______________bootlog/consolelog:□正常□不正常是否硬件告警□有□无ServiceProcesslog□正常□不正常11.系统硬件诊断:系统板、CPU、内存□正常□不正常4.机器清洁:I/O 板、扩展卡□正常□不正常根据需要清洁机器□已清洁□不需要硬盘、磁盘阵列□正常□不正常过滤网是否需要更换□需更换□不需要磁带机、磁带库□正常□不正常12.SA是否设置调通□是□否5.逻辑卷/硬盘检查:SA平时是否连接□是□否是否有stale的逻辑卷□有□无13.微码(Microcode)是否满足稳定运行需要6.磁带机是否需要清洗:□需要□不需□是□否7.CPU有否被disable□有□无CPUGUARD设置:□正确□不正确14.运行”snap-r;snapgfkbLc”,取回存档.□主机及主要设备的微码版本:本次预防性维护发现的问题:已经解决的问题及下一不工作计划:客户意见及建议:□非常满意□满意□一般□不满意□非常不满意客户签字:____________年___月___日工程师签字:____________年___月___日IBM全球服务(中国)有限公司技术支持服务部P系列系统预防性维护服务报告单(软件部分)客户名称:_____________________________机器型号:______序列号:______________检查时间:_____年____月____日____时本年度第______次检查1.系统错误报告:6.通信是否系统软件故障:□有□无路由表设置:□正常□不正常mail中有否软件错误:□有□无域名设置:□正常□不正常其他LOG文件:□正常□不正常7.数据是否已作保护2.文件系统:□所有数据□部分数据□没有保护使用率是否正常:□是□否数据保护方式:□RAID-1□RAID-5JFSLOG设置:□正常□不正常□RAID-10□LV镜像□逻辑卷0+13.内存交换区:使用率是否超过70%:□是□否8.系统DUMP设置:□正常□不正常交换逻辑卷设置:□正常□不正常9.用户登录记录检查:□正常□不正常10.HACMP测试:4.系统性能:ClusterVerification:□正常□不正常是否性能瓶颈:□有□无相关参数设置检查:□正常□不正常5.数据备份:接管测试:□正常□不正常系统备份是否符合要求:□是□否最近一次系统备份时间:___________11.补丁程序(PTF):数据备份是否符合要求:□是□否满足稳定运行需要:□是□否备份介质是否保存妥善:□是□否12.运行”snapr;snapgfkbLc”,取回存档操作系统及重要软件的补丁版本:本次预防性维护发现的问题:已经解决的问题及下一步工作计划:客户意见及建议:□非常满意□满意□一般□不满意□非常不满意客户签字:____________年___月___日工程师签字:____________年___月___日IBM全球服务(中国)有限公司技术支持服务部扩展阅读:巡检报告空压机巡检报告报告编号:EXJ-201*-空压机型号:整机编号:服务商公司名称:用户名称:用户联络人:部门:联系电话:传真电话:空压站运行情况描述1.空压机运行时数:小时,压力设置范围:bar。
服务器系统巡检报告(一)

服务器系统巡检报告(一)引言概述:服务器系统巡检报告(一)旨在对服务器系统进行全面的巡检和评估,确保其正常运行和高效性能。
本报告将从以下五个大点进行阐述,包括硬件检查、操作系统检查、网络配置检查、安全性检查和性能评估。
正文:一、硬件检查1. 检查服务器硬件设备是否正常运行,包括电源、风扇、内存、硬盘等。
2. 检查硬件设备是否存在异常噪音、发热等问题。
3. 检查网络连接是否稳定,网线是否插好并没有松动。
二、操作系统检查1. 检查操作系统是否正常启动,并确认是否有最新的安全补丁和更新。
2. 检查系统日志以排查任何可能的错误和异常。
3. 检查磁盘空间使用情况,并清理不必要的文件和日志。
三、网络配置检查1. 检查服务器的网络配置是否正确,包括IP地址、子网掩码、网关等是否设置正确。
2. 检查防火墙和路由器的配置是否正确,并确保网络安全性和稳定性。
3. 检查网络带宽使用情况,分析网络流量并进行优化和调整。
四、安全性检查1. 检查服务器的安全性设置,包括用户权限、访问控制列表等是否合理和有效。
2. 检查防火墙和入侵检测系统是否正常运行,并及时更新规则和策略。
3. 检查系统密码和认证机制的设置,确保安全性和防止未经授权的访问。
4. 检查备份机制和数据恢复计划是否有效,并进行必要的调整和更新。
五、性能评估1. 运行性能测试工具,检查服务器的处理能力、响应时间等性能指标。
2. 分析服务器的负载情况,包括CPU、内存和磁盘等的使用率和负载均衡。
3. 检查数据库的性能和优化情况,包括查询性能、索引使用和缓存配置等。
4. 根据巡检结果提出性能优化建议,并制定相应的改进计划。
总结:通过对服务器系统的全面巡检和评估,我们发现了硬件设备存在轻微噪音和发热问题,同时操作系统和网络配置等方面均得到了正常运行和合理设置。
在安全性方面,系统的用户权限和认证机制设置得当,同时备份机制和数据恢复计划也是有效的。
性能评估显示了服务器的高处理能力但存在负载不均衡的问题。
IBM小型机巡检内容及操作指导

IBM小型机巡检内容及操作指导一、巡检内容:1.确认机房环境:检查机房温湿度是否正常,观察机房是否通风良好,排查是否存在灰尘、杂物等对机器运行造成的影响。
2.检查电源供应:检查电源线是否正常连接,确认主机和外围设备的电源是否正常工作。
3.确认网络连接:检查网络线是否正常连接,确认小型机与其他设备、服务器的网络连接是否正常。
4.检查主机状态:确认小型机主机的状态是否正常,例如观察指示灯是否正常亮起,听觉上是否存在异常噪音等。
5.检查存储设备:检查存储设备(如硬盘、光驱等)是否正常运作,确认是否存在故障或异常。
6.检查数据备份:确认小型机的数据备份是否按照设定时间和规则进行,并进行验证备份数据的可用性。
7.检查软件运行:确认小型机上安装的软件是否正常运行,是否存在异常报错等情况。
8.检查安全性:确认小型机上的安全措施是否完善,例如防火墙的配置、病毒防护软件的更新等。
9.备份日志文件:对小型机的日志文件进行备份,以便后续查阅和分析问题。
10.更新系统和软件:对小型机的操作系统和安装的软件进行更新和升级,以确保系统的安全性和稳定性。
二、巡检操作指导:1.确保巡检前机器处于关闭状态,并断开电源线。
2.进入机房后,首先检查机房环境是否正常,如温湿度、通风等。
3.检查电源供应:确认主机和外围设备的电源线是否正常连接,然后接通电源线并开机。
4.检查网络连接:确保网络线与小型机的网口连接正常,并通过网络测试工具检查网络连接是否正常。
5.检查主机状态:观察小型机主机状态指示灯是否正常亮起,听音觉察是否有异常噪音。
6.检查存储设备:通过操作系统的设备管理工具检查存储设备的状态,如硬盘是否正常运行、光驱是否可用等。
7.检查数据备份:登录小型机系统,查看备份工具的设置和备份日志,确认数据备份是否按照规则进行,并验证备份数据的可用性。
8.检查软件运行:登录小型机系统,运行安装好的软件,检查是否存在异常报错等情况。
9.检查安全性:登录小型机系统,确认防火墙的配置是否符合规范,病毒防护软件是否及时更新。
IBM小机巡检报告格式

异常□
检查路由表
执行命令:
netstat -rn
检查系统网关是否有配置,各个路由表是否正确。
正常□
异常□
检查群集进程
执行命令:
lssrc–g cluster
检查群集进程是否开启,默认情况下
clstrmgrES该进程应该是激活的。
正常□
异常□
检查群集状态执行命令:clstat -a检查当前群集状态,各个网卡接口状态是否为UP;各个资源组状态是否为online。
检查系统卷组的镜像状态。
各个逻辑卷的PPs数量应该为LPs数量的整数倍,倍数大于1并且能被PVs整除,表示卷组已经作镜像。
各个逻辑卷的LV STATE应该为syncd,否则表示镜像不同步。
各个逻辑卷的LV STATE应该为syncd,否则表示镜像不同步。
正常□
异常□
文件系统
执行命令:
df -k
检查已经挂载的文件系统的使用状态。
重点检查/(根) /tmp(临时)/var (日志文件)这些动态文件系统的使用率最好保持在70%以下。
正常□
异常□
错误日志
执行命令:
errpt
检查系统日志是否有硬件或软件方面的永久错误。若发现错误类型为P的信息,则需要注意。
正常□
异常□
网卡配置情况
执行命令:
ifconfig–a
检查各个网卡的配置情况,状态是否为UP,检查ip地址和子网掩码等配置是否正确。
CPU状态为Available,表示CPU使用正常
正常□
异常□
内存
执行命令:
lsattr–El mem0
检查内存数量及状态。
size与goodsize的数量相等表示内存使用正常
IBM设备巡检报告

客户名称:机器型号序列号分区名: IP地址:配置: xC xGHz /xG AIX版本:1. 检查系统硬件情况:设备故障灯是否有亮□有■无;有其他否异常情况□有■无2.系统错误报告(Error Log):有否硬件故障■有□无(errpt or errpt -a)有否软件故障□有■无3.有否发给root用户的错误报告(mail): □有■无(mail)4.检查hacmp.out,smit.log,bootlog等■正常□不正常(more /tmp/hacmp.out andsmit.log and alog –o –t boot)5.关键文件系统的使用率不大于80% □是■否(df -g)6.逻辑卷:有否"stale"状态的逻辑卷□有■无(lsvg –l vgname or lsvgvgname)7.内存交换区:使用率是否超过70% □是■否(lsps -a)8.rootvg quorum 设置是否正常■是□否(lsvg rootvg)9.检查系统启动镜像是否正常■是□否(bootlist –m normal -o)10.内存交换区的大小是否设置正常■是□否(内存小于8GB为2倍,大于8G,根据应用需求来设置)(lsps -a)11.备份:有否有符合要求的系统备份■有□无 (ls –l /image*) 系统备份的时间_2012-10-18有否符合要求的用户数据备份■有□无磁带机是否需要清洗□需要■不需12.通信:网卡的状态、IP地址、路由表等■正常□不正常(netstat –i or netstat -nr)网卡通信(ping)■正常□不正常/etc/hosts文件或DNS设置■正常□不正常13.是否有数据保护方式如RAID10/RAID5 ■是□否是否有Hot Spare ■有□无14.系统DUMP设置是否正确:■正常□不正常(sysdumpdev -l)15.检查系统参数是否正确:■是□否1./etc/environment文件中TZ不应有夏时制(echo $TZ 输出结果不包含DT字样)2.如有数据库系统:Aio :available (lsdev –Cc aio)3.Hacmp 系统中Power Monitor子系统应关闭(more /etc/inittab)16.检查rootvg是否有做镜像:■是□否#lsvg –l rootvg如有镜像,所有的lv所对应的LP为PP的两倍。
企业服务器系统巡检报告

企业服务器系统巡检报告概述本次巡检目的是评估企业服务器系统的稳定性和性能,并确保系统能够正常运行。
通过对系统硬件、软件以及安全性的检查,发现并解决潜在的问题,提升服务器的可靠性和安全性。
巡检内容1. 硬件检查- 检查服务器硬件设备是否正常运行,包括主板、内存、硬盘等组件是否损坏。
- 检查服务器供电情况,确认电源是否正常工作。
- 清理服务器内部和外部灰尘,确保散热器通畅。
- 检查网络线缆连接是否牢固,避免网络中断和故障。
2. 软件检查- 检查操作系统是否最新,并进行必要的系统更新。
- 检查服务器上安装的软件版本,确保其与操作系统兼容。
- 检查系统日志,识别系统错误和警告信息。
- 检查服务器的防火墙设置,确保服务器安全。
3. 安全检查- 检查服务器的操作权限,确保只有授权人员能够访问。
- 检查服务器的密码复杂度和过期时间,确保密码安全性。
- 检查服务器的远程登录方式,限制不安全的远程访问方式。
- 检查服务器的备份策略,确保数据可以及时恢复。
巡检结果1. 硬件检查- 服务器硬件设备运行正常,无任何损坏。
- 服务器供电正常,电源工作稳定。
- 服务器内、外部清洁良好,散热器通畅。
- 网络线缆连接牢固,不存在松动和断裂情况。
2. 软件检查- 操作系统为最新版本,并进行了系统更新。
- 服务器上的软件版本与操作系统兼容。
- 系统日志中无系统错误和警告信息。
- 服务器防火墙设置良好,保护系统安全。
3. 安全检查- 服务器的操作权限受到管理,只有授权人员可访问。
- 服务器密码复杂度要求符合安全要求,且定期更新。
- 服务器远程登录方式限制,只允许使用安全的远程访问方式。
- 服务器备份策略健全,数据可以及时恢复。
建议和改进1. 提供定期维护计划,包括硬件设备检查和清洁,以延长服务器的使用寿命。
2. 定期更新操作系统,确保系统的安全性和稳定性。
3. 定期检查和更新服务器上安装的软件版本,以提升系统性能。
4. 检查和修复系统错误和警告信息,以确保服务器的正常运行。
服务器系统巡检报告

服务器系统巡检报告服务器系统巡检报告1.介绍本文档旨在对服务器系统进行巡检,并提供详细的报告,包括服务器硬件、操作系统、网络配置、安全性、备份恢复等方面的检查情况。
2.服务器硬件检查2.1 服务器型号及配置详细列出服务器的型号、CPU、内存、硬盘等配置信息。
2.2 服务器状态检查服务器的物理状态,包括电源、风扇、硬盘、网卡等是否正常运作。
2.3 温度和风扇转速记录服务器温度和风扇转速,确保在正常工作范围内。
3.操作系统检查3.1 操作系统版本确认服务器所安装的操作系统版本,并检查是否为最新版本。
3.2 补丁和更新检查操作系统的补丁和更新是否已经安装,确保系统安全性和稳定性。
3.3 磁盘空间和文件系统检查磁盘空间占用情况,确保足够的存储空间,并检查文件系统的健康状态。
3.4 日志管理审查系统日志,特别关注错误和警告信息,确保系统运行正常。
4.网络配置检查4.1 IP地质和子网掩码检查服务器所使用的IP地质和子网掩码是否正确配置。
4.2 网络连接测试服务器的网络连接是否正常,包括ping测试和网络延迟测试。
4.3 域名解析确认域名解析是否正确配置,确保服务器可以正常访问。
5.安全性检查5.1 防火墙设置检查服务器上的防火墙配置,确保适当的端口被打开,不必要的端口被关闭。
5.2 用户管理审查服务器上的用户账户和权限,确保只有授权用户能够访问。
5.3 安全更新和补丁确认服务器上的安全更新和补丁是否已经安装,保护系统免受已知漏洞的攻击。
6.备份和恢复检查6.1 备份策略检查服务器的备份策略,包括备份频率、备份目标等。
6.2 数据完整性验证测试备份文件的完整性,确保备份文件没有损坏或丢失。
6.3 恢复测试进行恢复测试,确保备份文件能够正确恢复数据。
附件:本文档附带服务器系统配置表、巡检记录表、网络拓扑图等。
法律名词及注释:1.操作系统:计算机系统软件的一部分,负责管理和控制计算机硬件和软件资源。
2.IP地质:Internet协议地质的缩写,用于唯一标识一个连接到互联网的设备。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
IBM小型机系统预防性维护服务报告单
客户名称:机器型号序列号
检查时间:20 年月日时本年度第次检查机器名
1. 机房环境:
电源电压□符合要求□不符合;零地电压□符合要求□不符合温度、湿度:□符合要求□不符合
2. 检查系统硬件情况:
设备故障灯是否有亮:3. 系统错误报告(Error Log):
有否硬件故障:□有
□有
□无;有其他否异常情况:□有
□无;启动日志:□正常
□无
□不正常
mail中有否错误报告:□有□无;服务进程日志:□正常□不正常
4. CPU有否被disable:□有□无;CPU GUARD设置:□正确□不正确
5. 逻辑卷:
6. 有否"stale"状态的逻辑卷:□有□无
7. 关键文件系统:
使用率是否正常:□是□否;JFSLOG设置:□正常□不正常
8. 磁带机是否需要清洗:□需要□不需要
9. SAN交换机是否正常:□正常□不正常□没有
10. 通信:
网卡的状态、IP地址:□正常□不正常网卡通信(ping):□正常□不正常/etc/hosts文件或DNS设置:□正常□不正常
路由表设置:□正常□不正常;域名设置:□正常□不正常11. 磁盘阵列RAID盘的状态:
IBM存储型号数据保护方式□Cache打开
□有热备盘
□Cache关闭
□无热备盘
12. 机器清洁:
根据需要清洁机器各部件:□已清洁□不需要
过滤网是否需要更换:□要更换□不需要
13. 补丁程序(PTF) 系统补丁级别:
最新补丁级别:
微代码(Microcode) 系统微码级别:
最新微码级别:
网卡、控制卡、硬盘微码是否需要升级:□是□否请与客户沟通是否需要升级系统补丁和微码:□是□否14. 系统硬件诊断:
系统板、CPU、内存、I/O板□正常□不正常
网卡、SCSI卡、SSA卡系统其他扩展卡
硬盘、磁盘阵列
磁带机、磁带库□正常
□正常
□正常
□正常
□不正常
□不正常
□不正常
□不正常
15. 内存交换区:
使用率是否超过70%:□是□否
大小是否大于物理内存的1.5倍:□是□否
16. 备份:
有否有符合要求的系统备份:□有□无最近一次系统备份的时间
有否符合要求的用户数据备份:□有□无
备份介质是否妥善保存:□有□无
17. 检查rootvg是否有做镜像:□有□无
18. 系统DUMP设置是否正常:□正常□不正常
19. 检查errdemon,srcmstr是否正常:□正常□不正常
20. 检查系统参数是否正确:□是□否
1./etc/environment文件中TZ不应有夏时制
2.如有数据库系统:Aio :available
3.Hacmp 系统中I/O pacing: High Water Mark/Low Water Mark:33/24
4.Hacmp 系统中Syncd:10
5.Hacmp 系统中Power Monitor子系统应关闭
21. 系统性能:
有否性能瓶颈:□有□无
22. HACMP 测试:□是□否
Cluster Verification:□正常□不正常;相关参数设置检查:□正常□不正常接管测试(根据需要):□正常□不正常
23. 运行“#snap –r;snap –gfkbLc” ,取回存档。
注: 12、22 为B类维护(半年维护),13、21、23 为C类维护(年度维护)。
24. 系统目前存在的问题:。