服务器巡检表

服务器巡检流程表

服务器巡检流程表 服务器巡检流程 一( 准备工作 1. 电话与客户联系,确定巡检的具体时间、地点,并了解服务器型号、规格,数量,服务器有无出现过故障现象,并作好详细记录。 2. 准备相关工具(比如螺丝刀、钳子、刷子)与必要的备品备件(如硬盘、CPU、电源、内存等)。 二( 现场操作步骤 第一步:检查服务器的是否有报警声,指示灯面板是否有红灯和黄灯显示(电源指示灯除外)若有,则表示指示灯对应的该部件有故障,需要仔 细检查此部件,直至将故障排除(指示灯一般正常为绿灯) 第二步:根据客户所用操作系统的不同,分别予以说明: WINDOWS操作系统 a. 检查系统CPU利用率 通过windows操作系统“任务管理器”,检测三次,每次5分钟,记录大约平均的利用率。CPU 5分钟平均利用率低于70%,无进程占用大量资源为正常。 另外内存使用率应低于65%。 b. 在“控制面板?管理工具”中找到“事件查看器”,查看有无明显异常Logging信息。 c. 网络连接信息 在命令行提示符窗口中,输入“ipconfig /all”,查看。若采用了网卡容错, 则需查看主备网卡的flag状态是否为UP,同时检查ip地址和netmask是否正

确。最后使用ping [ip address]检查网络是否通畅,是否有掉包或返回时间是 否较大(内网返回时间值一般为1至2毫秒,外网返回值一般不超过10毫秒为正常)。 d. 磁盘信息: 在“运行”对话框中手工键入“diskmgmt.msc”,打开“磁盘管理”对话框,查看 每一个逻辑分区状态是否为正常状“状态良好”,若为其他出错信息的话,则说明 该块磁盘可能存在故障。需更换做或做其他进一步检测。 Linux操作系统 a. 查看CPU和内存使用率 # top 在命令输出行的第三行和第四行分别显示CPU和内存的使作率。检测三次,每次5分钟,记录大约平均的利用率。CPU 5分钟平均利用率低于70%,无进程占用大量资源为正常。另外内存使用率应低于65%。 b. 网卡的状态 : # ifconfig –a 查看网络连接信息。若采用了网卡容错,则需查看主备网卡的flag状态是否为UP, 同时检查ip地址和netmask是否正确。最后使用ping [ip address]检查网络是否通 畅,是否有掉包或返回时间是否较大(内网返回时间值一般为1至2毫秒,外网返

Windows服务器巡检报告

Windows服务器巡检报告 服务器巡检报告 (每周) 客户签字: 工程师签字: 第一联-公司 ? 第二联-用户 中原区XXX局IBM X3650服务器巡检报告 巡检时间:xx/8/19 服务器是系统重要的业务运行平台,对服务器进行巡检能够及时发现服务器的隐患,以便于改善和优化服务器的性能;观察服务器的运行状况,及时对设备进行调整,保证服务器24小时不间断的工作;帮助客户采集服务器日志信息,及时记录服务器日志信息。 本次巡检主要包含以下几个方面: 1、 2、 3、 4、

服务器物理硬件巡检机房环境巡检服务器系统日志分析检查 硬件运行声音是否异常 一、服务器硬件情况 IBM X3650服务器是xx年底IBM推出的一款服务器,本单位用的服务器是xx年9月20号出厂的,已过质保期(原厂三年质保)。下面是在IBM官网上查询到的信息: CPU:Inter至强E5335(2.0GHz),属于Inter公司xx年的产品,在服务器上已经淘汰使用,性能不及现在市面上普通电脑上使用的 I5处理器。 内存:本单位使用的服务器还是早期的2G内存,现在的服务器上标配都是8G及以上内存,2G内存根本无法满足现在的业务处理能力。 RAID:本单位机器只有一块硬盘,没有做任务RAID阵列,无法保护数据的安全,即使有异地硬盘备份,也不可能达到数据实时存储。 操作系统:本单位使用的操作系统是windows 2000的系统,微软在xx

年已经停止对该系统的补丁包服务,安全性比较弱,很容易被植 入病毒及木马。 现在主流系统都是windows server xx和windows server xx.。 二、机房环境情况 本单位机房环境没有按照《计算机信息中心机房建设管理标准》 来建设,机房的温度、洁净度、安全性和监控管理等都没有应对措施,造成服务器内部有特别多的灰尘,严重影响服务器的正常运行。打开机箱盖之后,可以清晰的看到在各个硬件里的灰尘,如图: 三、服务器系统日志分析 X3650服务器属于老款服务器,设备本身没有IMM模块,不能通 过管理口来收集日志,只能通过安装DSA软件才能收集系统常规日志,通过收集到的系统日志发现CPU运行温度过高,还存在一些异常断电产生的服务器关机,其他信息暂未发现。 四、服务器硬件运行声音是否存在异常

服务器巡检操作规划

服务器巡检报告 一、服务器巡检的重要性 服务器是系统重要的业务运行平台,对服务器进行巡检能够及时发现服务器的隐患,以便于改善和优化服务器的性能;观察服务器的运行状况,及时对设备进行调整,提高平台的整体服务水平。同时可根据日常维护和相关记录,为平台后续发展提供整体建设规划和建议。 二、日常巡检内容包括以下方面: 机房环境温度、湿度巡检 服务器外壳整体检查 服务器清洁程度 服务器的外表温度 服务器风扇运行监测 服务器电源连接检查 服务器网络接口检查 服务器LED警示屏幕检查 服务器硬盘、电源、网卡等设备灯的状态 服务器硬件磁盘、内存、cpu、网卡使用情况 服务器系统日志 运行与服务器上应用是否可用 应用系统日志检查(根据实际情况执行) 杀毒软件的检查

三、巡检内容详细说明 1、服务器硬件巡检主要内容

2、操作系统检查 3、性能检查 一、Windows系统服务器性能查询(1)内存、cpu使用情况巡检用命令打开任务管理器

检查方法: Windows下使用任务管理器,记录占用内存、cpu最多的前五位进程或应用程序; 性能 CPU使用情况:表明处理器工作时间百分比的图表,该计数器是处理器活动的主要指示器,查看该图表可以知道当前使用的处理时间是多少。 CPU使用记录:显示处理器的使用程序随时间的变化情况的图表,图表中显示的采样情况取决于“查看”菜单中所选择的“更新速度”设置值,“高”表示每秒2次,“正常”表示每两秒1次,“低”表示每四秒1次,“暂停”表示不自动更新。 PF使用情况:正被系统使用的页面文件的量。 页面文件使用记录:显示页面文件的量随时间的变化情况的图表,图表中显示的采样情况取决于“查看”菜单中所选择的“更新速度”设置值。 总数:显示计算机上正在运行的句柄、线程、进程的总数。 认可用量:分配给程序和操作系统的内存,由于虚拟内存的存在,“峰值”可以超过最大物理内存,“总数”值则与“页面文件使用记录”图表中显示的值相同。 物理内存:计算机上安装的总物理内存,也称RAM,“可用”表示可供使用的内存容量,“系统缓存”显示当前用于映射打开文件的页面的物理内存。 内核内存:操作系统内核和设备驱动程序所使用的内存,“页面”是可以复制到页面文件中的内存,由此可以释放物理内存;“非分页”是保留在物理内存中的内存,不会被复制到页面文件中。

Linux服务器巡检报告21672

Linux服务器巡检指导 (一)服务器硬件检查

(二)操作系统检查 (二)性能检查

Top命令 统计信息区 前五行是系统整体的统计信息。第一行是任务队列信息,同uptime 命令的执行结果。其内容如下: 16:35:22 当前时间 up 17 day 5:45 系统运行时间,格式为时:分 4 user 当前登录用户数 load average: 0.15, 0.15, 0.08 系统负载,即任务队列的平均长度。三个数值分别为 1分钟、5分钟、15分钟前到现在的平均值。 Tasks: 366 total 进程总数 1 running 正在运行的进程数 364 sleeping 睡眠的进程数 0 stopped 停止的进程数 1 zombie 僵尸进程数 Cpu(s): 0.3% us 用户空间占用CPU百分比 0.0% sy 内核空间占用CPU百分比 0.0% ni 用户进程空间内改变过优先级的进程占用CPU百分比 99.9% id 空闲CPU百分比 0.0% wa 等待输入输出的CPU时间百分比 0.0% hi 0.0% si 第五行以后内容是内存信息。内容如下: Mem: 16429816k total 物理内存总量 16366812k used 使用的物理内存总量 63004k free 空闲内存总量

377544k buffers 用作内核缓存的内存量Swap: 18481144k total 交换区总量 320k used 使用的交换区总量18480824k free 空闲交换区总量 7835708k cached 缓冲的交换区总量。内存中的内容被换出到交换区,而后又被换入到内存,但使用过的交换区尚未被覆盖,该数值即为这些内容已存在于内存中的交换区的大小。相应的内存再次被换出时可不必再对交换区写入。 PID 每个进程的父进程ID。 USER 每个进程所有者的用户名。 PR 每个进程的优先级别。 NI 该进程的优先级值。 VIPT 该进程的代码大小加上数据大小再加上堆栈空间大小的总数。单位是KB。 RES 该进程占用的物理内存的总数量,单位是KB。 SHR 该进程使用共享内存的数量。 S 该进程的状态。其中S代表休眠状态;D代表不可中断的休眠状态;R代表运行状态; Z代表僵死状态;T代表停止或跟踪状态。 CPU % 该进程自最近一次刷新以来所占用的CPU时间和总时间的百分比。 MEM% 该进程占用的物理内存占总内存的百分比。 TIME+ 该进程自启动以来所占用的总CPU时间。如果进入的是累计模式,那么该时间还包括这个进程子进程所占用的时间。且标题会变成CTIME。 COMMAND 该进程的命令名称,如果一行显示不下,则会进行截取。内存中的进程会有一个完整的命令行。

服务器巡检报告

服务器巡检报告 The Standardization Office was revised on the afternoon of December 13, 2020

巡检报告单 机器型号: 序列号: 检查时间:_______年____月____日 1.机房环境: 温度□符合要求□不符合 湿度□符合要求□不符合 2机器清洁(根据需要清洁机器各部件):□已清洁□不需要3.检查系统硬件情况: 设备故障灯是否有亮□有□无 是否有其他否异常情况(如硬盘、风扇异常的声音,电缆破损) □有□无 4.系统错误报告(Error Log): 有否硬件故障□有□无 故障内容: 若有硬件,运行故障诊断分析错误报告( eg: diag -ed hdisk1) 结论(如SRN, FRU等): 有否软件故障□有□无 故障内容: 结论:

5.有否发给root用户的错误报告(mail):□有□无 结论: 6.检查,,bootlog等:□正常□不正常 7.文件系统的使用率不大于80%:□是□否 8.查看卷组信息(lsvg -l vg_name),有没有"stale"状态的逻辑卷: □是□否 若有,用syncvg 命令修复"stale"逻辑卷。 备注: 9.系统性能,有否性能瓶颈(topas, vmstat等):□有□无交换区使用率是否超过70%(lsps -s),实际值____ CPU是否繁忙(sar 1 10),idle值_____ I/O平衡(iostat 1) 10.备份: 有否合符要求的系统备份:□有□无 最近一次系统备份的时间_________ 有否符合要求的用户数据备份:□有□无 有否符合要求的用户数据备份:□有□无 磁带机是否需要清洗:□需要□不需

Windows服务器巡检报告

[标签:标题] 篇一:Windows服务器巡检报告 Windows 系统健康检查报告 一、服务器巡检的重要性 windows服务器是系统重要的业务运行平台,对服务器进行巡检能够及时发现服务器的隐患,以便于改善和优化服务器的性能;观察服务器的运行状况,及时对设备进行调整,保证服务器的24小时不间断的工作;以及采集网内服务器信息。 二、日常巡检内容包括以下方面: 1、服务器物理硬件巡检 2、机房环境巡巡检 3、操作系统的磁盘、内存、cpu情况使用情况 4、服务器系统日志 5、运行与服务器上应用是否可用 6、应用系统日志检查(根据实际情况执行) 7、杀毒软件的检查 8、系统定时任务执行情况 三、巡检内容详细说明1、服务器硬件巡检主要内容 2、操作系统检查 3、性能检查 (1)内存、cpu使用情况巡检用命令taskmgr.exe打开任务管理器检查方法: Windows下使用任务管理器,记录占用内存、cpu最多的前五位进程或应用程序; 性能 CPU使用情况:表明处理器工作时间百分比的图表,该计数器是处理器活动的主要指示器,查看该图 表可以知道当前使用的处理时间是多少。 CPU使用记录:显示处理器的使用程序随时间的变化情况的图表,图表中显示的采样情况取决于“查 看”菜单中所选择的“更新速度”设置值,“高”表示每秒2次,“正常”表示每两秒1次,“低”表示每四秒1次,“暂停”表示不自动更新。 PF使用情况:正被系统使用的页面文件的量。 页面文件使用记录:显示页面文件的量随时间的变化情况的图表,图表中显示的采样情况取决于“查 看”菜单中所选择的“更新速度”设置值。 总数:显示计算机上正在运行的句柄、线程、进程的总数。 认可用量:分配给程序和操作系统的内存,由于虚拟内存的存在,“峰值”可以超过最大物理内存, “总数”值则与“页面文件使用记录”图表中显示的值相同。 物理内存:计算机上安装的总物理内存,也称RAM,“可用”表示可供使用的内存容量,“系统缓存” 显示当前用于映射打开文件的页面的物理内存。 内核内存:操作系统内核和设备驱动程序所使用的内存,“页面”是可以复制到页面文件中的内存, 由此可以释放物理内存;“非分页”是保留在物理内存中的内存,不会被复制到页面文件中。(2)硬盘使用情况, 检查方法:Windows下通过查看‘我的电脑’—‘管理’—‘磁盘管理’可以查看磁盘分

服务器巡检流程表

服务器巡检流程 一.准备工作 1.电话与客户联系,确定巡检的具体时间、地点,并了解服务器型号、规格,数量,服 务器有无出现过故障现象,并作好详细记录。 2.准备相关工具(比如螺丝刀、钳子、刷子)与必要的备品备件(如硬盘、CPU、电源、 内存等)。 二.现场操作步骤 第一步:检查服务器的是否有报警声,指示灯面板是否有红灯和黄灯显示(电源指示灯除外)若有,则表示指示灯对应的该部件有故障,需要仔 细检查此部件,直至将故障排除(指示灯一般正常为绿灯)第二步:根据客户所用操作系统的不同,分别予以说明: WINDOWS操作系统 a.检查系统CPU利用率 通过windows操作系统“任务管理器”,检测三次,每次5分钟,记录大约平 均的利用率。CPU 5分钟平均利用率低于70%,无进程占用大量资源为正常。 另外内存使用率应低于65%。 b. 在“控制面板→管理工具”中找到“事件查看器”,查看有无明显异常Logging信息。 c. 网络连接信息 在命令行提示符窗口中,输入“ipconfig /all”,查看。若采用了网卡容错, 则需查看主备网卡的flag状态是否为UP,同时检查ip地址和netmask是否正 确。最后使用ping [ip address]检查网络是否通畅,是否有掉包或返回时间是 否较大(内网返回时间值一般为1至2毫秒,外网返回值一般不超过10毫秒 为正常)。 d.磁盘信息: 在“运行”对话框中手工键入“diskmgmt.msc”,打开“磁盘管理”对话框,查看 每一个逻辑分区状态是否为正常状“状态良好”,若为其他出错信息的话,则说明 该块磁盘可能存在故障。需更换做或做其他进一步检测。 Linux操作系统 a.查看CPU和内存使用率 # top 在命令输出行的第三行和第四行分别显示CPU和内存的使作率。检测三次,每 次5分钟,记录大约平均的利用率。CPU 5分钟平均利用率低于70%,无进程 占用大量资源为正常。另外内存使用率应低于65%。 b. 网卡的状态 : # ifconfig –a

Windows服务器巡检报告

Windows服务器巡检报告 Windows 系统健康检查报告一、服务器巡检的重要性 windows服务器是系统重要的业务运行平台对服务器进行巡检能够及时发现服务器的隐患以便于改善和优化服务器的性能观察服务器的运行状况及时对设备进行调整保证服务器的24小时不间断的工作以及采集网内服务器信息。二、日常巡检内容包括以下方面 1、服务器物理硬件巡检 2、机房环境巡巡检 3、操作系统的磁盘、内存、cpu情况使用情况 4、服务器系统日志 5、运行与服务器上应用是否可用 6、应用系统日志检查根据实际情况执行 7、杀毒软件的检查 8、系统定时任务执行情况三、巡检内容详细说明 1、服务器硬件巡检主要内容检查项检查操作参考标准机柜或者服务器上的防尘网观察机柜以及机器上的防尘网上的灰尘是否在防尘上堵塞导致气流不畅。系统风扇运转检查观察并用手感觉进风和出风是否正常主机和磁盘柜的所有风扇运转正常。系统运装噪音检查仔细听系统运转声音噪音是否过大有无异常声音系统电源指示灯检查观察液晶面板、电源指示灯、硬盘报警灯等显示液晶面板、电源指示灯、硬盘报警灯等显示情况正常服务器硬盘工作状态硬盘指示灯指示是否正常一般绿色为正常绿色闪烁服务器网卡工作状态服务器插上网线后若有数据传输则网卡指示灯呈现规律性闪烁若闪烁不正常或指示灯指示颜色不正常则说明系统数据传输将不正常网卡指示灯正常闪烁服务器散热检测靠近服务器检查是否有热风吹出服务器电源连接检查电源连接线是否有松动、接触不良等情况服务器外壳整体检查服务器整体是否有移动或损害痕迹服务器机房温度机房的温度是否异常变动温度数值多少参考值温度20?-26? 服务器机房湿度机房的湿度是否异常变动湿度计数值多少参考值温度45-60 服务器机房静电防护防静电地板是否损坏防静电设备是否正常服务器标签检查标签是否松动、脱落字体是否模糊不清 2、操作系统检查检查项检查操作参考标准操作系

Windows服务器巡检报告

Windows 服务器巡检报告 Windows 系统健康检查报告一、服务器巡检的重要性windows 服务器是系统重要的业务运行平台对服务器进行巡检能够及时发现服务器的隐患以便于改善和优化服务器的性能观察服务器的运行状况及时对设备进行调整保证服务器的24 小时不间断的工作以及采集网内服务器信息。二、日常巡检内容包括以下方面1 、服务器物理硬件巡检2、机房环境巡巡检3、操作系统的磁盘、内存、cpu情况使用情况4 、服务器系统日志5、运行与服务器上应用是否可用6、应用系统日志检查根据实际情况执行7、杀毒软件的检查8 、系统定时任务执行情况三、巡检内容详细说明1、服务器硬件巡检主要内容检查项检查操作参考标准机柜或者服务器上的防尘网观察机柜以及机器上的防尘网上的灰尘是否在防尘上堵塞导致气流不畅。系统风扇运转检查观察并用手感觉进风和出风是否正常主机和磁盘柜的所有风扇运转正常。系统运装噪音检查仔细听系统运转声音噪音是否过大有无异常声音系统电源指示灯检查观察液晶面板、电源指示灯、硬盘报警灯等显示液晶面板、电源指示灯、硬盘报警灯等显示情况正常服务器硬盘工作状态硬盘指示灯指示是否正常一般绿色为正常绿色闪烁服务器网卡工作状态服务器插上网线后若有数据传输则网卡指示灯呈现规律性闪烁若闪烁不正常或指示灯指示颜色不正常则说明系统数据传输将不正常网卡指示灯正常闪烁服务器散热检测靠近服务器检查是否有热风吹出服务器电源连接检查电源连接线是否有松动、接触不良等情况服务器外壳整体检查服务器整体是否有移动或损害痕迹服务器机房温度机房的温度是否异常变动温度数值多少参考值温度20?-26? 服务器机房 湿度机房的湿度是否异常变动湿度计数值多少参考值温度45-60 服务器机房静 电防护防静电地板是否损坏防静电设备是否正常服务器标签检查标签是否松动、脱落字体是否模糊不清2 、操作系统检查检查项检查操作参考标准操作系 统版本检查执行命令winver.exe 主机连接系统网络情况在其它机器上采用ping 命

Windows服务器巡检报告

Windows服务器巡检报告 篇一:PC服务器巡检报告 服务器巡检报告 (每周) 客户签字: 工程师签字: 第一联-公司 ? 第二联-用户 篇二:服务器巡检报告 中原区XXX局IBM X3650服务器巡检报告 巡检时间:2021/8/19 服务器是系统重要的业务运行平台,对服务器进行巡检能够及时发现服务器的隐患,以便于改善和优化服务器的性能;观察服务器的运行状况,及时对设备进行调整,保证服务器24小时不间断的工作;帮助客户采集服务器日志信息,及时记录服务器日志信息。 本次巡检主要包含以下几个方面: 1、 2、 3、 4、 服务器物理硬件巡检机房环境巡检服务器系统日志分析检查硬件运行声音是否异常 一、服务器硬件情况

IBM X3650服务器是20xx年底IBM推出的一款服务器,本单位用的服务器是20xx年9月20号出厂的,已过质保期(原厂三年质保)。下面是在IBM官网上查询到的信息: CPU:Inter至强E5335(2.0GHz),属于Inter公司20xx年的产品,在服务器上已经淘汰使用,性能不及现在市面上普通电脑上使用的I5处理器。 内存:本单位使用的服务器还是早期的2G内存,现在的服务器上标配都是8G及以上内存,2G内存根本无法满足现在的业务处理能力。 RAID:本单位机器只有一块硬盘,没有做任务RAID阵列,无法保护数据的安全,即使有异地硬盘备份,也不可能达到数据实时存储。 操作系统:本单位使用的操作系统是windows 2000的系统,微软在20xx 年已经停止对该系统的补丁包服务,安全性比较弱,很容易被植入病毒及木马。 现在主流系统都是windows server 2021和windows server 2021.。 二、机房环境情况 本单位机房环境没有按照《计算机信息中心机房建设管理标准》来建设,机房的温度、洁净度、安全性和监控管理等都没有应对措施,造成服务器内部有特别多的灰尘,严重影响服务器的

Windows服务器巡检报告

Windows 系统健康检查报告 一、服务器巡检的重要性 windows服务器是系统重要的业务运行平台,对服务器进行巡检能够及时发现服务器的隐患,以便于改善和优化服务器的性能;观察服务器的运行状况,及时对设备进行调整,保证服务器的24小时不间断的工作;以及采集网内服务器信息。 二、日常巡检内容包括以下方面: 1、服务器物理硬件巡检 2、机房环境巡巡检 3、操作系统的磁盘、内存、cpu情况使用情况 4、服务器系统日志 5、运行与服务器上应用是否可用 6、应用系统日志检查(根据实际情况执行) 7、杀毒软件的检查 8、系统定时任务执行情况

三、巡检内容详细说明 1、服务器硬件巡检主要内容

2、操作系统检查 检查项检查操作参考标准操作系统版本检查执行命令winver.exe 主机连接系统网络情况在其它机器上采用ping命令观察5分钟是否有丢包情 况 主机网络配置情况执行命令ipconfig /all IP地址、子网掩码正确 系统账户检查利用administrator身份、口令登陆能够正常登陆到系统 3、性能检查 (1)内存、cpu使用情况巡检用命令taskmgr.exe打开任务管理器 检查方法: Windows下使用任务管理器,记录占用内存、cpu最多的前五位进程或应用程序; 性能 CPU使用情况:表明处理器工作时间百分比的图表,该计数器是处理器活动的主要指示器,查看该图表可以知道当前使用的处理时间是多少。

CPU使用记录:显示处理器的使用程序随时间的变化情况的图表,图表中显示的采样情况取决于“查看”菜单中所选择的“更新速度”设置值,“高”表示每秒2次,“正常”表示每两秒1次,“低”表示每四秒1次,“暂停”表示不自动更新。 PF使用情况:正被系统使用的页面文件的量。 页面文件使用记录:显示页面文件的量随时间的变化情况的图表,图表中显示的采样情况取决于“查看”菜单中所选择的“更新速度”设置值。 总数:显示计算机上正在运行的句柄、线程、进程的总数。 认可用量:分配给程序和操作系统的内存,由于虚拟内存的存在,“峰值”可以超过最大物理内存,“总数”值则与“页面文件使用记录”图表中显示的值相同。 物理内存:计算机上安装的总物理内存,也称RAM,“可用”表示可供使用的内存容量,“系统缓存”显示当前用于映射打开文件的页面的物理内存。 内核内存:操作系统内核和设备驱动程序所使用的内存,“页面”是可以复制到页面文件中的内存,由此可以释放物理内存;“非分页”是保留在物理内存中的内存,不会被复制到页面文件中。

Linux服务器巡检报告

Linux服务器巡检 (一)操作系统检查

(二)性能检查 Top命令 统计信息区 前五行是系统整体的统计信息。第一行是任务队列信息,同uptime 命令的执行结果。其内容如下:

16:35:22 当前时间 up 17 day 5:45 系统运行时间,格式为时:分4 user 当前登录用户数 load average: 0.15, 0.15, 0.08 系统负载,即任务队列的平均长度。三个数值分别为 1分钟、5分钟、15分钟前到现在的平均值。 Tasks: 366 total 进程总数 1 running 正在运行的进程数 364 sleeping 睡眠的进程数 0 stopped 停止的进程数 1 zombie 僵尸进程数 Cpu(s): 0.3% us 用户空间占用CPU百分比 0.0% sy 内核空间占用CPU百分比 0.0% ni 用户进程空间内改变过优先级的进程占用CPU百分比 99.9% id 空闲CPU百分比 0.0% wa 等待输入输出的CPU时间百分比 0.0% hi 0.0% si 第五行以后内容是内存信息。内容如下: Mem: 16429816k total 物理内存总量 16366812k used 使用的物理内存总量 63004k free 空闲内存总量 377544k buffers 用作内核缓存的内存量 Swap: 18481144k total 交换区总量 320k used 使用的交换区总量 18480824k free 空闲交换区总量 7835708k cached 缓冲的交换区总量。内存中的内容被换出到交换区,而后又被换入到内存,但使用过的交换区尚未被覆盖,该数值即为这些内容已存在于内存中的交换区的大小。相应的内存再次被换出时可不必再对交换区写入。 PID 每个进程的父进程ID。 USER 每个进程所有者的用户名。 PR 每个进程的优先级别。 NI 该进程的优先级值。 VIPT 该进程的代码大小加上数据大小再加上堆栈空间大小的总数。单位是KB。 RES 该进程占用的物理内存的总数量,单位是KB。

Linux服务器巡检报告

Linux服务器巡检指导

(一)服务器硬件检查

(二)操作系统检查 (二)性能检查

统计信息区 前五行是系统整体的统计信息。第一行是任务队列信息,同uptime 命令的执行结果。其内容如下:16:35: 22 当前时间 up 17 day 5:45 系统运行时间,格式为时:分 4 user 当前登录用户数 load average: 0.15, 0.15, 0.08 系统负载,即任务队列的平均长度。三个数值分别为 1分钟、5分钟、15分钟前到现在的平均值。 Tasks: 366 total 进程总数 1 running 正在运行的进程数 364 sleeping 睡眠的进程数 0 stopped 停止的进程数 1 zombie 僵尸进 程数 Cpu(s): 0.3% us 用户空间占用CPU百分比 0.0% sy 内核空 间占用 CPU百 分比0.0% ni 用户进 程空间 内改变 过优先 级的进 程占用 CPU百 分比99.9% id 空闲 CPU百 分比

0.0% wa 等待输 入输出 的CPU 时间百 分比 0.0% hi 0.0% si 第五行以后内容是内存信息。内容如下: k total 物理内存总量 k used 使用的物理内存总量 63004k free 空闲内存总量 377544k buffers 用作内核缓存的内存量 k total 交换区总量 320k used 使用的交换区总量 k free 空闲交换区总量 7835708k cached 缓冲的交换区总量。内存中的内容被换出到交换区,而后又被换入到内存,但使用过的交换区尚未被覆盖,该数值即为这些内容已存在于内存中的交换区的大小。相应的内存再次被换出时可不必再对交换区写入。 PID 每个进程的父进程ID。 USER 每个进程所有者的用户名。 PR 每个进程的优先级别。 NI 该进程的优先级值。 VIPT 该进程的代码大小加上数据大小再加上堆栈空间大小的总数。单位是KB。 RES 该进程占用的物理内存的总数量,单位是KB。 SHR 该进程使用共享内存的数量。 S 该进程的状态。其中S代表休眠状态;D代表不可中断的休眠状态;R代表运行状态; Z代表僵死状态;T代表停止或跟踪状态。 CPU % 该进程自最近一次刷新以来所占用的CPU时间和总时间的百分比。 MEM% 该进程占用的物理内存占总内存的百分比。 TIME+ 该进程自启动以来所占用的总CPU时间。如果进入的是累计模式,那么该时间还包括这个进程子进程所占用的时间。且标题会变成CTIME。 COMMAND 该进程的命令名称,如果一行显示不下,则会进行截取。内存中的进程会有一个完整的命令行。 (三)安全检查

服务器健康状况检查

1 IBM 服务器健康检查表 客户名称:机器信息: 系统健康检查时间:机器型号/机器序列号:业务用途: 检查内容: 1.检查机房环境,电源 温度、湿度是否符合要求:□符合要求□不符合备注:电源: 相电压:□符合要求□不符合备注: 线电压:□符合要求□不符合备注: 零地电压:□符合要求□不符合备注: 2.检查系统硬件情况 检查设备故障灯是否有亮:□有□无备注: 有否异常情况(如硬盘、风扇异常的声音,电缆破损):□有□无备注: 3.检查有无内置磁带机 内置磁带机:□有□无 4.检查系统错误报告(Error Log)有否硬件故障:□有□无故障内容: 有否软件故障:□有□无故障内容: 2 结论: 注意:如果故障记录太多,应将故障报告取回,作进一步分析。5.查文件系统 查看有没有“满”的文件系统。文件系统满可导致系统不能正常工作,尤其是AIX 的基本文件系统。如/(根文件系统)满则会导致用户不能登录。有否“满”的文件系统:□有□无备注: 6.检查内存交换区(paging pace)使用率使用率是否超过70%:□有□无 备注: 7.检查CPU 是否繁忙(sar 1 10)CPU 空闲是否小于20%:□有□无备注: 8.检查I/O 是否繁忙(iostat 1) 是否大数据读写都集中在某些硬盘上:□有□无备注: 9.检测诊断(Diagnostic) 机器shutdown 后以慢启动方式作自检,启动后运行diag 系统诊断程序。系统板、CPU、内存、I/O 板:□正常□不正常网卡、SCSI 卡、SSA 卡:□正常□不正常系统其他扩展卡:□正常□不正常硬盘、磁盘阵列:□正常□不正常磁带机、磁带库:□正常□不正常备注: 10.通信测试 检查各网卡的状态、IP 地址、路由表等:□正常□不正常用“ping”等命令检查通信:□正常□不正常备注: 11.检查磁盘阵列(如:7133)状况,并填写下表: 序列号硬盘数量硬盘容量硬盘微码有无Hot Spare 何种数据保护 12.检查硬盘使用率整体存储空间:GB 使用空间:GB 客户签字:工程师签字: 年月日年月日

服务器巡检报告

中原区XXX局IBM X3650服务器巡检报告 巡检时间:2015/8/19 服务器是系统重要的业务运行平台,对服务器进行巡检能够及时发现服务器的隐患,以便于改善和优化服务器的性能;观察服务器的运行状况,及时对设备进行调整,保证服务器24小时不间断的工作;帮助客户采集服务器日志信息,及时记录服务器日志信息。 本次巡检主要包含以下几个方面: 1、服务器物理硬件巡检 2、机房环境巡检 3、服务器系统日志分析 4、检查硬件运行声音是否异常 一、服务器硬件情况 IBM X3650服务器是2006年底IBM推出的一款服务器,本单位用的服务器是2007年9月20号出厂的,已过质保期(原厂三年质保)。下面是在IBM 官网上查询到的信息:

CPU:Inter至强E5335(2.0GHz),属于Inter公司2007年的产品,在服务器上已经淘汰使用,性能不及现在市面上普通电脑上使用的I5处理器。 内存:本单位使用的服务器还是早期的2G内存,现在的服务器上标配都是8G及以上内存,2G内存根本无法满足现在的业务处理能力。

RAID:本单位机器只有一块硬盘,没有做任务RAID阵列,无法保护数据的安全,即使有异地硬盘备份,也不可能达到数据实时存储。 操作系统:本单位使用的操作系统是windows 2000的系统,微软在2007年已经停止对该系统的补丁包服务,安全性比较弱,很容易被植入病毒及木马。

现在主流系统都是windows server 2008和windows server 2012.。 二、机房环境情况 本单位机房环境没有按照《计算机信息中心机房建设管理标准》来建设,机房的温度、洁净度、安全性和监控管理等都没有应对措施,造成服务器内部有特别多的灰尘,严重影响服务器的正常运行。打开机箱盖之后,可以清晰的看到在各个硬件里的灰尘,如图:

运维服务服务器网络设备日常巡检报告记录

运维服务服务器网络设备日常巡检报告记录

————————————————————————————————作者:————————————————————————————————日期:

鹏博科技工作室服务器巡检报告 单位名称时间 巡检人 巡检内容检查方法结果一、服务器系统 设备名称:设备型号: 1、检查服务器的是否有报警声,指示灯面板是否有红灯显示(电 源指示灯除外)观察指示灯 有(无)报警声 有(无)红灯 2、通过windows操作系统“任务管理器”,检查系统CPU利用率检测三次,每次5分钟,记录大约平均的利用率 3、通过windows操作系统“任务管理器”,检查系统内存利用率检测三次,每次5分钟,记录大约平均的利用率 4、检查系统盘和数据盘的空间占用硬盘共分几个分区,哪几个分区?每个分区空间大小,分别使用多少 5、操作系统启动和运行状况检查加电启动是(否)正常 6、数据库启动和运行情况应用启动测试是(否)正常 7、应用程序启动和运行情况应用使用测试是(否)正常异常问题记录(上面检查发现的问题或在各检查项外发现的问题请在此具体描述) 备注:以每台设备为单位填写。

二、网络设备系统 设备名称:设备型号: 1、检查设备面板指示灯状态,看是否有红灯报警观察面板指示灯有(无)红灯 2、从本局网络中的某台PC机上ping下属的分支机构和部局的某台服务器Ping对方IP地址□通 □不通 3.管理级用户控制: 远程登录用户必须设置密码。 检查是否需要密码 才能进入管理级别 用户。 □完善 □不完善 4. Telnet登录控制: Telnet口令和Super口令的设置要不同,使用密文格式。□完善□不完善 5. 接口配置: 不使用端口置为shutdown状态。Display current-configuration □完善 □不完善 6. FE/GE口配置: 端口模式(包括速率、双工模式)配置对接双方必须一致;端口实际工作模式必须与对端一致。Display current-configuration Display interface □完善 □不完善 7. telnet和串口登录: telnet和串口两种方式能正常登录。□完善□不完善 8. 端口统计数据: 查看各个使用的端口收发统计数据是否正常,异常报文是否有增长。Display interface □完善 □不完善 09.电源状态查看: 各电源模块工作状态正常。Display system device □完善 □不完善 10. CPU占有率: CPU占有率应正常,与当前开展的业务类型和转发流量相符。Display system cpu □完善 □不完善 11.系统当前正在发生的告警信息:有告警及时处理。Display alarm □完善 □不完善 12.内存使用情况:内存占有率。Display memory □完善 □不完善 异常问题记录(上面检查发现的问题或在各检查项外发现的问题请在此具体描述)备注:以每台设备为单位填写。

相关文档
最新文档