小型机日常检查流程
小型机、服务器内存和磁盘检查

小型机、服务器内存和磁盘检查
一、内存检查占用率
1、小型机AIX系统查看内存占用
•vmstat命令查看
查看mem这项为总内存空间,fre这项除以4000为剩余内存空间,占比不宜超过80%
•nmon命令查看(topas)
输入nmon,在下一个界面按m,下图为当前内存占用情况,
图中圈起来的是当前内存使用比例,占比不宜超过80%
2、服务器LINUX系统查看内存占用
•free命令查看
mem这行为内存,swap这行为交换分区
total这列为总容量,used这列为使用容量,计算占比,即为内存使用率,占比不宜超过80%
•top命令查看
第四行Mem,total为总容量,used为使用容量,计算出来占比即为内存使用率,占比不宜超过80%
二、磁盘空间检查
1、AIX磁盘占用检查
第一步:查看%used这列,使用率有没有超过80%
如果有超过80%的,进入该目录查看,执行第二步、第三步,反复执行
2、LINUX磁盘占用检查
第一步:查看%used这列,使用率有没有超过80%
如果有超过80%的,进入该目录查看,执行第二步、第三步,反复执行
3、SC服务器磁盘占用清理1、2号线数据库备份清理,步骤如下
3号线SC数据库备份清理如下。
工程机械设备巡查制度

工程机械设备巡查制度第一章总则为了确保工程机械设备的安全运行,提高设备的利用率和使用寿命,根据国家有关法律法规和公司实际情况,制定本制度。
第二章巡查范围本制度适用于公司所有工程机械设备的巡查工作,包括但不限于挖掘机、推土机、装载机等设备。
第三章巡查内容1. 巡查前的准备工作(1)查看设备的近期维修记录,了解设备的运行情况;(2)检查设备的相关文件资料,确保设备的证件齐全;(3)检查设备的安全设施,确保设备的安全性能正常。
2. 设备巡查过程(1)对设备的外观进行检查,包括外观是否完整,有无损坏及漏油现象等;(2)查看设备的润滑情况,确保设备各部位的润滑情况良好;(3)检查设备的主要部件,例如发动机、液压系统、轮胎等,确保其正常运行;(4)检查设备的仪表盘,确保设备的各项指标正常;(5)进行设备的试车,确保设备的各项功能正常。
3. 巡查后的处理工作(1)对巡查过程中发现的问题进行记录,并及时报告维修部门;(2)对巡查过程中发现的问题进行及时处理,确保设备的正常运行;(3)对设备进行清洁和整理,保持设备的整洁。
第四章巡查频率1. 设备的日常巡查:每天进行一次对设备的日常巡查,检查设备的外观、润滑情况、主要部件等。
2. 设备的定期巡查:每周进行一次对设备的定期巡查,对设备的各项指标进行全面检查。
3. 设备的季度巡查:每季度进行一次对设备的季度巡查,对设备的整体情况进行综合评估。
第五章巡查记录巡查人员应当对每次巡查的情况进行详细记录,包括巡查的时间、地点、内容、发现的问题及处理情况等,并及时上报相关部门。
第六章巡查责任1. 巡查人员:负责设备的日常巡查、定期巡查和季度巡查,对设备的安全运行负有直接责任。
2. 监督部门:负责对巡查人员进行巡查工作的监督,并对巡查情况进行核实和评估。
3. 维修部门:负责设备发现的问题进行及时处理并修复,保证设备的正常运行。
第七章巡查奖惩对巡查工作中表现优秀的人员进行奖励,并对巡查工作不力的人员进行相应的纪律处分。
中小型机具安全技术操作规程(3篇)

中小型机具安全技术操作规程一、工作现场准备1. 工作环境检查:检查工作现场是否有明显的安全隐患,如地面坑洞、杂物堆放等,及时清理。
2. 装备检查:检查使用的机具是否完好,有无损坏或漏电等情况。
3. 用电检查:如使用电动机具,要检查电源是否正常,插头和插座是否完好,电线是否破损等。
4. 监护人检查:确定一个或多个监护人,负责监督现场安全,并做好与现场人员的沟通。
二、机具操作前准备1. 个人防护:操作人员在操作机具前,要穿戴好个人防护装备,如安全帽、护目镜、耳塞等。
2. 检查机具:对机具进行全面的检查,确保各个部件正常运行,不存在故障或损坏。
3. 操作区域划定:确保操作区域没有其他工作人员或无关人员,在需要时进行标识。
4. 现场安全设施:检查现场的安全设施是否完善,如紧急停机按钮、安全防护网等,确保其功能正常。
5. 周围环境检查:检查机具操作周围的环境,如地面是否平整、有无障碍物等。
三、机具操作规范1. 操作流程:按照机具的操作手册或相关规范,进行正确的机具操作流程。
2. 操作方法:根据机具的特点,采取正确的操作方法,避免操作错误造成事故。
3. 防护设施使用:根据现场环境的需要,使用必要的防护设施,如护目镜、手套等。
4. 紧急情况处理:如发生机具故障或意外事故,立即停止操作,并采取相应的应急措施,如通知监护人、拉动紧急停机按钮等。
四、机具操作后处理1. 停机程序:完成操作后,按照机具的停机程序进行停机,确保机具全部停止。
2. 清理机具和周围环境:将机具周围的杂物清理干净,确保现场整洁。
3. 关闭电源:如使用电动机具,要及时关闭电源,拔掉插头。
4. 检查机具:对机具进行检查,确认机具没有故障或损坏。
五、事故处理程序1. 发生事故时,首先确保人员的安全,采取避险措施,如拉动紧急停机按钮、进行紧急撤离等。
2. 即使事故没有造成人员伤亡,也要及时汇报给主管部门或相关责任人。
3. 现场保护:在事故发生后,要确定一个或多个人员保护现场,禁止其他人员靠近。
IBM小型机巡检内容及操作指导

IBM小型机巡检内容及操作指导一、巡检内容:1.确认机房环境:检查机房温湿度是否正常,观察机房是否通风良好,排查是否存在灰尘、杂物等对机器运行造成的影响。
2.检查电源供应:检查电源线是否正常连接,确认主机和外围设备的电源是否正常工作。
3.确认网络连接:检查网络线是否正常连接,确认小型机与其他设备、服务器的网络连接是否正常。
4.检查主机状态:确认小型机主机的状态是否正常,例如观察指示灯是否正常亮起,听觉上是否存在异常噪音等。
5.检查存储设备:检查存储设备(如硬盘、光驱等)是否正常运作,确认是否存在故障或异常。
6.检查数据备份:确认小型机的数据备份是否按照设定时间和规则进行,并进行验证备份数据的可用性。
7.检查软件运行:确认小型机上安装的软件是否正常运行,是否存在异常报错等情况。
8.检查安全性:确认小型机上的安全措施是否完善,例如防火墙的配置、病毒防护软件的更新等。
9.备份日志文件:对小型机的日志文件进行备份,以便后续查阅和分析问题。
10.更新系统和软件:对小型机的操作系统和安装的软件进行更新和升级,以确保系统的安全性和稳定性。
二、巡检操作指导:1.确保巡检前机器处于关闭状态,并断开电源线。
2.进入机房后,首先检查机房环境是否正常,如温湿度、通风等。
3.检查电源供应:确认主机和外围设备的电源线是否正常连接,然后接通电源线并开机。
4.检查网络连接:确保网络线与小型机的网口连接正常,并通过网络测试工具检查网络连接是否正常。
5.检查主机状态:观察小型机主机状态指示灯是否正常亮起,听音觉察是否有异常噪音。
6.检查存储设备:通过操作系统的设备管理工具检查存储设备的状态,如硬盘是否正常运行、光驱是否可用等。
7.检查数据备份:登录小型机系统,查看备份工具的设置和备份日志,确认数据备份是否按照规则进行,并验证备份数据的可用性。
8.检查软件运行:登录小型机系统,运行安装好的软件,检查是否存在异常报错等情况。
9.检查安全性:登录小型机系统,确认防火墙的配置是否符合规范,病毒防护软件是否及时更新。
小型机日常检查维护和备份

三、日常检查维护1.文件系统是否满方法:df –k 可以以K为单位检查文件系统的使用率。
(90%以上,需要调整)df –m –groot@smk_exchange2:〉df -mFilesystem MB blocks Free %Used Iused %Iused Mounted on/dev/hd4 4096.00 4012.76 3%6152 1% //dev/hd2 8192。
00 6277。
69 24% 41437 3%/usr/dev/hd9var 8192.00 7947。
95 3% 7095 1%/var/dev/hd3 2048.00 1929.64 6%102 1%/tmp/dev/hd1 40960。
00 40451.16 2% 1775 1% /home/proc —- —- - /proc/dev/hd10opt 40960.00 40756.11 1% 8568 1% /optroot@smk_exchange2:〉df —gFilesystem GB blocks Free %Used Iused %Iused Mounted on/dev/hd4 4.00 3。
92 3% 6152 1%//dev/hd2 8。
00 6.13 24%41437 3%/usr/dev/hd9var 8。
00 7.76 3% 7095 1% /var/dev/hd3 2.00 1。
88 6% 102 1%/tmp/dev/hd1 40。
00 39。
50 2%1775 1% /home/proc —- - - - /proc/dev/hd10opt 40。
00 39。
80 1% 8568 1%/optroot@smk_exchange2:>“Iused"是什么意思?已使用的i-node,i-node是分配给文件系统的文件节点,它决定文件系统中文件和文件夹的总数.节点,文件系统下,每个文件,目录都需要的,如果节点用完了,就是该文件系统还有空间,也不能再往里面放东西了,节点和文件,目录一一对应的。
小机检修技术方案

小机检修技术方案一、技术方案的概述小型机的检修技术方案是指对小型机进行维修和保养的具体操作过程。
小型机检修技术方案的目的是确保小型机的正常运行,延长其使用寿命,保障作业效率。
本技术方案主要包括以下几个方面:检修前的准备工作、小型机的拆卸与装配、零部件的检修与更换、小型机的调试和测试。
二、检修前的准备工作1.确认检修所需工具和设备,并做好记录。
2.准备必要的耐磨防护装备,确保安全。
3.查阅小型机的使用手册和维修手册,熟悉机器的结构和工作原理。
4.将小型机停机,并断开电源。
三、小型机的拆卸与装配1.拆卸前,进行必要的标记和记录。
2.根据机器结构图,按照逆向顺序拆卸小型机的各个部件,同时记录下来。
3.清洁拆卸下来的零部件,并进行检查,发现问题时做好记录。
4.根据维修手册指引,按照正向顺序装配零部件,确保装配的正确性和完整性。
四、零部件的检修与更换1.对拆卸下来的零部件进行全面的检查。
2.根据检查结果,进行合理的修理和更换。
3.对已修复或更换的零部件进行清洗和润滑处理。
4.对已修复或更换的零部件进行安装,注意装配的正确性和紧固程度。
5.进行必要的调整和校正,确保零部件工作正常。
五、小型机的调试和测试1.检查并确认已装配的零部件的位置和固定情况。
2.将机器连接上电源,进行电气系统调试。
3.开启小型机,进行短时间的观察和听觉测试,确保小型机的运行平稳、无异常声音。
4.进行小型机的各项功能测试,确保其工作正常。
5.对测试结果进行记录,分析和处理测试中出现的问题。
六、技术方案的安全措施1.检修人员应进行必要的专业培训,具备相关的技术知识和操作经验。
2.严格按照操作规程进行操作,注意仪器仪表和设备的正确使用。
3.在操作过程中注意人身安全,佩戴充足的个人防护设备。
4.在拆卸和装配零部件时,遵循操作规程,确保安全。
5.在调试和测试过程中,注意观察异常情况,并及时采取措施。
6.定期检查和维护设备,确保设备的安全性和可靠性。
工区设备检查制度模版

工区设备检查制度模版一、目的和适用范围本制度的目的是规范工区设备的检查工作,确保设备的正常运行和安全使用。
适用于所有工区的设备检查工作。
二、责任和权限1. 工区设备管理员负责制定、实施和监督设备检查工作,制定检查计划和安排检查人员。
2. 检查人员应按照工区设备管理员的安排进行设备检查,及时发现设备问题并报告。
3. 工区领导负责对设备检查工作的监督和评估,及时整改设备问题。
三、设备检查程序1. 检查前准备检查人员应提前了解设备的基本情况和技术要求,熟悉设备的操作流程和安全规范。
2. 检查内容(1)外观检查:检查设备外观是否完整无损、是否存在松动、积水等情况。
(2)功能检查:检查设备各项功能是否正常,如电源、传感器、控制阀等是否正常运作。
(3)安全检查:检查设备的安全装置是否齐全并正常工作,如紧急停机按钮、报警器等。
(4)清洁检查:检查设备是否清洁,有无积尘、杂物等情况。
3. 检查记录和报告检查人员应将检查情况记录并填写检查报告,包括设备的问题和建议的整改措施。
检查报告应及时提交给工区设备管理员。
四、设备检查频率设备检查的频率应根据设备的特点和使用情况确定,一般应按照以下频率进行检查:1. 日常检查:对设备进行日常巡检,发现问题及时处理。
2. 定期检查:对设备进行定期维护和检查,确保设备的长期稳定运行。
3. 特别检查:在设备出现故障、大修后进行的专项检查。
五、设备问题整改1. 对于发现的设备问题,检查人员应及时向工区设备管理员报告,并提出整改措施。
2. 工区设备管理员应根据问题的严重程度和影响,制定整改计划,并指派责任人进行整改。
3. 整改完成后,应进行再次检查和验收,确保问题得到彻底解决。
六、设备检查记录和归档1. 设备检查记录应详细记录每次检查的时间、检查人员、检查内容和发现的问题等。
2. 设备检查记录应按照规定的格式整理和归档,方便查阅和追溯。
七、设备检查的评估和改进1. 工区领导应定期对设备检查工作进行评估,了解设备检查的情况和问题,提出改进建议。
IBM 小型机巡检服务过程

IBM 小型机巡检服务过程一.提取机器的型号。
#uname -uM二.机房内场地环境检查。
三.检查系统硬件灯是否有亮。
四.查看系统错误报告。
1.查看是否有硬件和软件故障。
#Errpt –d H | more ,# errpt –d S | more, #errpt –aj *******|more查看具体错误信息# errpt -d H -T PERM>/tmp/hwerror.log //可以把错误的报告存成一个文件。
2.有否发给root用户的错误报告(mail)。
#Mail3.检查hacmp.out,smit.log,bootlog等.#lssrc –g cluster/#>lssrc –g cluster,一般hacmp.out的位置在:/use/sbin/cluster/或者/tmp/,找到最近hacmp.out文件查看是否有错误信息。
4.查看是否有“满”的系统文件。
#df –k 查看系统文件有没有超过90%的使用率,有请用户改善。
5.查看是否有“stale”(不可用)状态的逻辑卷.#lsvg -l rootvg,系统还有其卷组的也要查看。
6.查看内存使用率是否超过70%。
#Lsps -a五.系统性能检查,查看系统是否有性能瓶颈。
#topas #vmstat 1 10 #iostat 1 10六.网络与通讯检查,查看网卡的状态,IP地址,路由器等。
#ifconfig –a,#netstat–in,#netstat –rn(查看路由情况),#vi/etc/hosts(查看hosts文件有否特殊定义),#ping ******(IP),#lsattr –Elet0(路由的检测,显示true正确的就是没问题)。
七,数据安全检查。
1.查看是否有符合要求的备份。
#ls –l/image.date(查看系统有没有备份image文件,记录备份最后日期),#lsvg –l rootvg(查看有否符合要求的数据备份和保护)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、查看小型机前面板上的警告灯,如果有黄色显示,表示该系统出现问题,继续检查
2、检查硬件,外观观看硬件,是否出现问题(查看两台服务器的灯是否一致)。
3、检查文件系统
df –g
Filesystem GB blocks Free %Used Iused %Iused Mounted on
/dev/hd4 5.00 4.98 1% 2479 1% /
/dev/hd2 20.00 17.96 11% 49315 2% /usr
/dev/hd9var 5.00 4.95 2% 722 1% /var
/dev/hd3 10.00 9.97 1% 165 1% /tmp
/dev/fwdump 1.00 1.00 1% 4 1% /var/adm/ras/platform
/dev/hd1 5.00 5.00 1% 7 1% /home
/proc - - - - - /proc
/dev/hd10opt 5.00 4.92 2% 1706 1% /opt
/dev/fslv00 20.00 13.01 35% 16600 1% /oracle
/dev/sg186lv 597.50 596.25 1% 16 1% /sg186
查看%Used的使用率有无大于85%的,如果有大于85%的,则相应的进行增大空间。
以上面得/home为例增大空间:
chfs -a size='10G' /home 将/home增大到10G
chfs -a size=+ 10G /home 将/home增大10G
4、检查系统出错日志
使用errpt|more命令检查
IDENTIFIER 为错误编号,当需要检查详细信息时常会用到。
TIME STAMP 为时间标签,它记录的是出错时间,其格式:月月日日时时分分年年
T:为Type,它记录的是错误类型
P:为永久错误,需引起注意
T:为临时错误。
C:为Class,它记录的是错误种类,如
H:Hardware
S:Software
O:Errloger command messages
U:undetermined
其中引起关注的主要有P和H的错误
# errpt
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
51E537B5 0112162310 P H sysplanar0 platform_dump saved to file
291D64C3 0112162310 I H sysplanar0 Platform dump data
BFE4C025 0112162310 P H sysplanar0 UNDETERMINED ERROR
51E537B5 0112162210 P H sysplanar0 platform_dump saved to file
291D64C3 0112162210 I H sysplanar0 Platform dump data
BFE4C025 0112162210 P H sysplanar0 UNDETERMINED ERROR
38A8D4BB 0112161110 I H ent3 HEA PORT DOWN
AFA89905 0112160810 I O grpsvcs Group Services daemon started
97419D60 0112160810 I O topsvcs Topology Services daemon started
6D19271E 0112155910 I O topsvcs Topology Services daemon stopped
28854E81 0112155910 I O grpsvcs Group Services daemon stopped
使用errpt -aj <IDENTIFIER> 查看错误详细信息;
# errpt -aj BFE4C025
主要看一下
Description 查看一下描述,了解是哪出了问题
例如:
Description: Power/Cooling subsystem Unrecovered Error, bypassed
with loss of redundancy. Refer to the system service
documentation for more information.
这就是电源故障,或该电源掉电了。
清日志
#errclear 0
5、检查双机状态
每台主机共享的卷组是否活动 #lsvg –o或#lspv
每台主机的IP地址: #netstat –in或#ifconfig –a
/ usr/es/sbin/cluster/clstat 查看cluster状态。