IBM硬件故障检测板详解

合集下载

IBM T4系列开机不显示的维修方法简介诊断卡

IBM T4系列开机不显示的维修方法简介诊断卡

IBM T4系列开机不显示的维修方法简介目录在修到这种板子的时候,应该先把所以的电压、频率、复位都量测一遍。

在确认这些信号均无误以后,打北桥到CPU的A/D信号线,BIOS的信号,CLOCK的频率,南桥到北桥的DMI信号线,用示波器量LPC_FRAME#的波形等等。

注:在量打北桥到CPU的A/D信号线的对地阻抗的时候,万用表笔应该和正常量法相反,即黑接地,红笔量。

量测到的阻抗如高的不多,一般是CPU端OPEN;如高的很多,一般是北桥端OPEN。

1.1 VCORE=0V量VCORE是否短路,在这里应该注意VCORE的阻值在2欧姆以上就算OK。

量VCORE_ON是否为3.3V。

量VCORE芯片的工作电压,参考电压,反馈电压电流是否正常。

量VCORE芯片的对地阻抗是否正常。

量VCORE芯片与输出端的上下桥MOS管组成的反馈电路有无问题。

量VID0~VID6的对地阻抗和电压值。

可能不良零件:VCORE芯片,CPU本体,VCORE芯片周围的一些小电容电阻有损件,击穿,错件等制程问题,U4/U5以及输出端上下桥MOS管等等。

1.2.1 CPURST=0V量PCIRST是否等于3.3V。

量CPURST的对地阻抗。

量北桥和CPU的工作电压,参考电压,工作频率。

可能不良零件:北桥,南桥,CPU,CLOCK,电压芯片等等。

1.2.2 CPURST=0.4V量CLOCK发到南北桥的频率是否都为100MHz。

量南北桥之间的DMI信号的对地阻抗,电压。

量1.8V,1.05V,1.25V,1.5V电压(包括B电压和AMT电压)进南北桥的电感是否OPEN。

量PLTRST是否正常。

可能不良零件:北桥,南桥,CLOCK,电压芯片,CARDBUS以及PCB板本体OPEN。

1.2.3 CPURST=0.1V量北桥和CPU的工作频率和工作电压。

量CPURST的对地阻抗。

可能不良零件:北桥和CPU。

1.2.4 CPURST=1.05V如果量到CPURST=1.05V,但是DEBUG还是跑00的话,应该说就比较麻烦了,打北桥到CPU的A/D信号线,BIOS的信号均OK,而且换BIOS TCPA后现象依旧的话,那就开始换桥,一般换桥的顺序是:北桥,南桥,CPU。

IBM小型机硬件及系统检测情况汇总

IBM小型机硬件及系统检测情况汇总
#lsattr –El inet0
正常
HACMP 服务
#lssrc –g cluster
正常
HACMP I/O Pacing
#lsattr –El sys0 |grep out
正常
/etc/host文件
#more /etc/hosts
正常
HACMP 日志
#tail –f /tmp/hacmp.out
# sysdumpdev –l
正常
系统备份检查
做vg配置信息的备份
已备份
询问客户有否在系统变更后或每半年做系统备份
询问客户数据库及应用、应用数据是否定期有效
进行备份
系统性能检查
CPU
#topas
正常
Disk
#vmstat
正常
应用程序磁盘
#iostat
正常
交换区
#lsps -a
正常
#bindprocessor -q
The available processors are: 0 1 2 3 4 5 6 7
系统板、CPU、内存、I/O板
#diag
No trouble was found 正常
网卡、SCSI卡、SSA卡
#diag
No trouble was found 正常
系统其他扩展卡
#diag
No trouble was found 正常
硬盘、磁盘阵列
#diag
No trouble was found 正常
磁带机、磁带库
#diag
No trouble was found 正常
网卡的状态、IP地址
#ifconfig –a
正常
网卡通信(ping)

IBM-小型机巡检内容及操作指导

IBM-小型机巡检内容及操作指导

IBM 小型机巡检内容及操作指导1.IBM 小型机小型机机房要求:1.机房的卫生状况,要求清洁,键盘、显示器、机柜上没有灰尘。

2.温度(摄氏℃)10 ℃-40℃湿度(%)8% -80%2.设备故障灯分类:•主机故障灯面板上不能有数字显示,如果有的话,说明系统有故障。

磁盘阵列故障灯告警灯为黄色表示有故障磁带机故障灯告警灯为黄色说明有故障或磁带机太脏,须清洗。

3.系统错误报告(Error Log)的检查:硬件故障检测命令:# errpt -d H -T PERM若有故障执行命令# errpt -a -d H -T PERM>/tmp/harderror.log保存,分析结果报告给客户软件故障检测命令:# errpt -d S -T PERM若有故障执行命令# errpt -a -d S -T PERM>/tmp/softerror.log保存,分析结果报告给客户4.有否发给root用户的错误报告(mail):#mail1.观察所有未读消息,注意有关diagela的消息。

2.常用命令:h [<num>] Display headings of group containing message<num>t [<msg_list>] Display messages in <msg_list> or currentmessage.n Display next message.q Quit3.对发现的问题详细分析,结果报告给客户5.文件系统的检查:命令:# df –k%Used为文件系统的使用率。

所有文件系统的使用率不能大于80%6.磁带机清洁的检查:命令:#/usr/lpp/diagnostics/bin/utape -cd rmt0 -n显示结果为磁带机使用的小时数,若大于72小时,则不论磁带机黄灯是否亮都应用清洁带清洗。

#/usr/lpp/diagnostics/bin/utape -d rmt0 -n 会提示是否需要clean6.信系统的检测:1.网卡的状态命令:#ifconfig –a输出判断:en0:flags=e080863<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GR OUPRT,64BIT>inet 192.9.200.2 netmask 0xffffff00 broadcast 192.9.200.255en1:flags=e080863<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GR OUPRT,64BIT>inet 192.9.201.1 netmask 0xffffff00 broadcast 192.9.200.255主备网卡的flag为UP属正常。

IBM A30笔记本维修及故障表

IBM A30笔记本维修及故障表

IBM A30笔记本维修及故障表故障代码机器型号及故障描述可能故障点A01 IBM A30 无声音输出,无声声卡,功放芯片,线路,耳机接口A02 IBM A30 声音左右不均衡声卡,功放芯片,线路,耳机接口A03 IBM A30 喇叭左右声道相反声卡,功放芯片,线路,耳机接口A04 IBM A30 耳机无声音输出声卡,功放芯片,线路,耳机接口A05 IBM A30 麦克风测试不通过声卡,功放芯片,线路,耳机接口A06 IBM A30 耳机杂音声卡,功放芯片,线路,耳机接口A07 IBM A30 麦克风测试有杂音声卡,功放芯片,线路,耳机接口A08 IBM A30 音量无法调整声卡,功放芯片,线路,耳机接口A09 IBM A30 喇叭杂音声卡,功放芯片,线路,耳机接口A10 IBM A30 外接麦克风测试不良声卡,功放芯片,线路,耳机接口A11 IBM A30 调整vr1时喇叭杂音声卡,功放芯片,线路,耳机接口A12 IBM A30 插上耳机喇叭有杂音输出声卡,功放芯片,线路,耳机接口A13 IBM A30 line in 测试不良声卡,功放芯片,线路,耳机接口A14 IBM A30 Optical audio 测试不良声卡,功放芯片,线路,耳机接口B01 IBM A30 电池不能冲放电电芯老化,电芯失效,线路版损坏,主板故障B02 IBM A30 电池电量不足电芯老化,电芯失效,线路版损坏B03 IBM A30 变压器无输出电源线,电源适配器损坏B04 IBM A30 辅助电池无输出电芯老化,电芯失效,线路版损坏,主板故障B05 IBM A30 无法暖开机主板接口,主板故障,电源适配器故障B06 IBM A30 无电源主板接口,主板故障,电源适配器故障B07 IBM A30 自动开机主板故障,电源适配器故障B08 IBM A30 自动重复开机主板故障,电源适配器故障B09 IBM A30 开机后断电主板接口,主板故障,电源适配器故障B10 IBM A30 不开机主板接口,主板故障,电源适配器故障B11 IBM A30 无法关机主板故障B12 IBM A30 无法由电池开机电芯老化,电芯失效,线路版损坏,主板故障B13 IBM A30 机器死机主板故障,内存故障C01 IBM A30 无法由CD-ROM开机光盘损坏,光驱损坏C02 IBM A30 CD-ROM有杂音光盘损坏,光驱损坏C03 IBM A30 DVD测试不良光盘损坏,光驱损坏C04 IBM A30 CD-ROM/DVD 托盘自动弹出光驱损坏C05 IBM A30 CD-ROM/DVD 托盘无法弹出光驱损坏C06 IBM A30 CD-ROM放音乐有杂音光盘损坏,光驱损坏D01 IBM A30 键盘失效,报警主板故障,键盘故障D02 IBM A30 触摸板失效触摸板损坏,主板故障D03 IBM A30 触摸板漂移触摸板损坏D04 IBM A30 指点杆失效指点杆失效,主板故障D05 IBM A30 指点杆漂移指点杆失效D06 IBM A30 外接键盘无效键盘接口损坏,主板故障D07 IBM A30 外接鼠标无效鼠标口损坏,主板故障D08 IBM A30 键盘缺键,报警键盘损坏F01 IBM A30 开机后软驱报错软驱损坏,主板故障F02 IBM A30 无法从软驱启动软驱损坏,主板故障F03 IBM A30 软驱读盘杂音软驱损坏F04 IBM A30 软驱挡板脱落软驱损坏G01 IBM A30 屏幕有光无显示,白屏主板故障,lcd故障,屏线故障G02 IBM A30 屏幕显示不稳定主板故障,lcd故障,屏线故障G03 IBM A30 屏幕无图像主板故障,lcd故障,屏线故障G04 IBM A30 屏幕图像抖动主板故障,lcd故障,屏线故障G05 IBM A30 幕图像扭曲主板故障,lcd故障,屏线故障G06 IBM A30 屏幕显示乱码主板故障,lcd故障,屏线故障G07 IBM A30 屏幕亮点过多lcd故障G08 IBM A30 屏幕有线条lcd故障G09 IBM A30 屏幕亮度不均匀lcd故障G10 IBM A30 屏幕有水平亮线lcd故障G11 IBM A30 屏幕有垂直亮线lcd故障G12 IBM A30 屏幕破裂lcd故障H01 IBM A30 开机后硬盘无法识别硬盘故障,主板故障H02 IBM A30 硬盘有杂音硬盘故障F01 IBM A30 主机温度过高风扇故障F02 IBM A30 风扇不转风扇故障,主板故障F03 IBM A30 风扇有杂音风扇故障M01 IBM A30 网卡口失效网卡接口损坏,主板故障M02 IBM A30 FAX/MODEM口失效接口损坏,主板故障P01 IBM A30 PC卡插槽无效PC卡插槽损坏,主板故障P02 IBM A30 PC卡无法推出PC卡插槽损坏P03 IBM A30 开机有密码,解密主板Q01 IBM A30 COM口无效接口损坏,主板故障Q02 IBM A30 打印口无效接口损坏,主板故障Q03 IBM A30 外接显示口无效接口损坏,主板故障Q04 IBM A30 USB接口无效接口损坏,主板故障Q05 IBM A30 红外口无效主板故障Q06 IBM A30 1394口无效主板故障Q07 IBM A30 记忆卡插槽无效主板故障R01 IBM A30 开机报警主板故障R02 IBM A30 开机cmos时间丢失cmos电池失效R03 IBM A30 cmos时间不准cmos电池失效,主板故障R04 IBM A30 操作系统故障软件故障R05 IBM A30 系统受病毒感染软件故障R06 IBM A30 驱动程序丢失软件故障R07 IBM A30 机器太脏清洁服务U01 IBM A30 屏幕外壳破裂(1号壳,A壳)修补U02 IBM A30 屏幕内壳破裂(2号壳,B壳)修补U03 IBM A30 机器掌托破裂(3号壳,C壳)修补U04 IBM A30 机器底壳破裂(4号壳,D壳)修补U05 IBM A30 屏幕左屏轴损坏修补U06 IBM A30 屏幕右屏轴损坏修补。

IBMX3650M4主板故障

IBMX3650M4主板故障

IBMX3650M4主板故障故障描述:今天突然接到报警,⼀台服务器⽆法连通,⽆法登录、⽆法 ping 通。

打电话到 IDC ,授权⼯程师查看服务器状态,返回结果如下:1、服务器关机状态2、⽆法开机 ( 电源灯亮 ),按开机键没反应。

3、尝试拔掉电源,等待⼏分钟后再次开机,结果还是不⾏。

这是⼀台宿主机,上⾯开了 5 个虚拟机,⼀下⼦全狗带了... 关键数据还在⾥⾯。

好在,受影响的业务不是主要业务,但也处于⽆法提供服务的状态。

解决⽅法:第⼆天去机房把服务器拉回公司 ( 机房在外地 ),通电发现还真是⽆法开机,还发现⼀点就是,服务器诊断⾯板上 BOARD 亮黄灯!基本断定是主板故障了吧?下⾯是搞数据:1、好在公司机房机架上还有⼀台同型号的服务器 IBM X3650 M42、这台服务器跟坏掉的服务器机器型号、RAID卡信息、硬盘数量等都⼀致3、唯⼀的区别就是,公司的这台服务器没有做 RAID,坏掉的这台是 RAID104、机柜服务器关机 ( 最好先备份⼀下数据 ),拔出硬盘 ( 8块硬盘,顺序不能乱 )5、将坏掉的服务器硬盘按顺序拔出,插⼊机柜中这台好的服务器中 ( 顺序不能乱 )6、开机,根据提⽰导⼊ RAID 信息( 输⼊ C、是否导⼊ Y、选择配置⽂件,其实就⼀个,选 all 即可,Start、同意导⼊ import,退出 exit,reboot 重启服务器 )7、很顺利,由于线上服务器密码极度复杂,这⾥重启的时候顺便重置⼀下 root ⽤户密码8、进⼊系统配置IP,然后就可以不⽤在机房待着了,备份数据,传到线上,恢复业务9、关机、拔出硬盘,按顺序插⼊原来的坏机器,给机柜上的机器重新按顺序插⼊原硬盘10、执⾏第六步,重启进⼊系统异地备份很重要。

IBM光通路诊断面板中文图文对照说明

IBM光通路诊断面板中文图文对照说明

IBM光通路诊断面板中文图文对照说明1、OVER SPEC:电源消耗的功率超过它们的最大额定功率,解决办法:1、从服务器卸下可选设备;2、更换发生故障的电源。

2、LOG:表示需要查看时间日志或remote supervisor。

3、LINK:网卡发生故障。

解决办法:更换网卡。

4、PS:电源发生故障。

解决办法:更换发生故障的电源。

5、PCI:PCI总线或系统上发生错误,发生故障的PCI插槽旁的附加指示灯将点亮。

6、SP:服务处理器遇到错误。

7、FAN:风扇发生故障,或是运行过慢,或是卸下风扇,可能会导致TEMP指示灯点亮。

8、TEMP:系统温度超标。

9、MEM:内存条发生故障。

解决办法:查看内存板上指示灯,拔出亮灯内存条,更换内存条位置,重新测试,如果MEM还亮着,就只能更换内存条了。

10、NMI:出现一个不可屏蔽终端。

(具体什么意思我也不知道,没遇到过这问题)11、CNFG:发生硬件配置错误。

解决办法:1、查看是否安装了不兼容的硬件设备;2、还原主板配置。

3、查看系统日志。

12、CPU:CPU处理器出现故障。

13、VRM:微处理器稳压器模块(VRM)上发生错误。

14、DASD:发生硬盘驱动器错误。

解决办法:更换硬盘,更换硬盘前先查看服务器是否做了RAID等。

15、RAID:发生RAID控制器错误。

解决办法:更换阵列卡,看是否是阵列卡出现问题。

16、BRD:主板发生错误。

解决办法:首先检测主板上其它硬件是否有问题,有可能是其它硬件错误,导致BED报错。

反之,其它指示灯报错,也有可能是主板出现问题导致的,所以检查清楚在更换。

IBM 3650光通路指示灯说明

IBM 3650光通路指示灯说明

7
CNFG
8
MEM
9 NMI 10 S ER3 RAID 14 FAN 15 TEMP 16 BRD
发生硬盘驱动器错误。 发生 RAID 控制器错误。 风扇发生故障,或者是运行过慢,或者是 已卸下风扇。TEMP 指示灯可能也会点 亮。 系统温度已超出阈值级别。发生故障的风 扇会导致 TEMP 指示灯点亮。 系统板上发生错误。
光通路诊断指示灯 下表描述光通路诊断面板上的指示灯,以及纠正检测到的问题的建议操作 注:更换 FRU 之前,请检查系统事件/错误日志和 BMC 系统事件日志 指示灯 1 2 3 4 5 6 无,但系统 错误指示灯 点亮。 OVER SPEC PS 1 PS 2 CPU VRM 问题 已发生错误但无法诊断,或 Remote Supervisor Adapter II SlimLine 上的高级 系统管理(ASM)处理器发生故障。光 通路诊断指示灯不表示该错误。 电源功率超过最大额定值。 电源托架 1 中的电源发生故障。 电源托架 2 中的电源发生故障。 微处理器发生故障。 微处理器稳压器模块(VRM)上发生错 误。 发生硬件配置错误。 当该指示灯点亮时,表明发生了内存错 误。 发生机器检查错误。 。。
17 PCI
PCI 总线或系统板上发生错误。发生故障 的 PCI 插槽旁的附加指示灯将点亮。
到的问题的建议操作。 系统事件日志,获取其他信息 操作 检查系统错误日志,获取有关错误的信息。 更换发生故障的电源,或从服务器卸下可选设备。 确保该电源已正确安装就位。如果问题仍然存在,请更换发生故障的电 源。 确保该电源已正确安装就位。如果问题仍然存在,请更换发生故障的电 源。 确保由系统板上点亮的指示灯表明的发生故障的微处理器已正确安装。 更换 VRM。如果问题仍然存在,请更换系统板(主板) 检查刚安装的微处理器,确保它们彼此兼容,并与 VRM 兼容 。更换不 兼容的微处理器。 检查系统错误日志,获取有关错误的信息。更换日志所指明的任何组件 。 更换由系统板上点亮的指示灯表明的发生故障的 DIMM。 检查系统错误日志,获取有关错误的信息。 从服务器卸下交流电源;然后将服务器重新连接到交流电源并重新启动 服务器。更新 BMC 上的 firmware。如果已安装 Remote Supervisor Adapter II SlimLine,则更新 firmware;如果问题仍然存在,请更换适配器。如果问题仍然存在,请 更换系统板 检查硬盘驱动器上的指示灯,并更换所指示的(桔黄色的指示灯)驱动 器。 如果问题仍然存在,请更换硬盘驱动器底板。 检查系统错误日志,获取有关错误的信息。或是拔打8008101818 更换由风扇机身上点亮的指示灯表明的发生故障的风扇。 确定是否风扇发生故障。如果是,更换发生故障的风扇。 确保室温不会太高。确保通风孔未堵塞。 检查系统板上的指示灯,确定引起错误的组件。 检查系统错误日志,获取有关错误的信息。

IBM xSeries 336 1879 型和 8837 型 硬件维护手册和故障检修指南

IBM xSeries 336 1879 型和 8837 型 硬件维护手册和故障检修指南

xSeries 3361879型和8837型硬件维护手册和故障检修指南E RserverxSeries 3361879型和8837型硬件维护手册和故障检修指南E Rserver注:v在使用本资料及其支持的产品之前,请阅读第127页的附录B,『安全信息』和第161页的附录C,『声明』。

v可以从/pc/support/获取本文档的最新版本。

第一版(2004年8月)©Copyright International Business Machines Corporation2002.All rights reserved.关于本手册本文档包含IBM®Eserver™xSeries®3361879型和8837型服务器的基本配置信息、诊断信息、错误代码、错误消息、维护信息以及症状到FRU索引。

要点:本文档中的现场可更换部件(FRU)的过程针对熟悉IBM产品的受过培训的服务人员。

客户替换部件(CRU)可由客户来更换。

请参阅第119页的第7章,『部件清单,1879型和8837型』以确定正在替换的组件是FRU还是CRU。

在维护IBM产品之前,请务必阅读第127页的附录B,『安全信息』。

重要的安全信息Be sure to read all caution and danger statements in this book before performing anyof the instructions.Leia todas as instruções de cuidado e perigo antes de executar qualquer operação.Prenez connaissance de toutes les consignes de type Attention etDanger avant de procéder aux opérations décrites par les instructions.Lesen Sie alle Sicherheitshinweise,bevor Sie eine Anweisung ausführen.Accertarsi di leggere tutti gli avvisi di attenzione e di pericolo prima di effettuare qualsiasioperazione.Lea atentamente todas las declaraciones de precaución y peligro ante de llevar a cabocualquier operación.警告:操作本产品上的电源线或与随本产品一起销售的附件相关联的电源线将使您易受铅的伤害,(一种加利福尼亚州已知的导致癌症、生殖缺陷或其它再生性伤害的化学物质)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

故障提示:
ps 指示灯:当此指示灯发亮时,表明电源2 出现故障。

temp 指示灯:当此指示灯发亮时,表明系统温度超出阈值级别。

fan:当此指示灯点亮时,表明散热风扇或电源风扇出现故障或运行太慢。

风扇发生故障还会导致over temp 指示灯发亮。

link指示灯:当此指示灯发亮时,网卡出现故障。

vrm 指示灯:当此指示灯发亮时,表明微处理器托盘上的某个vrm 出现故障。

cpu 指示灯:当此指示灯发亮时,表明某个微处理器出现故障。

pci 指示灯:当此指示灯发亮时,表明某个pci 总线发生错误。

mem 指示灯:当此指示灯发亮时,表明发生内存错误。

dasd 指示灯:当此指示灯发亮时,表明某个热插拔硬盘驱动器出现故障。

nmi 指示灯:当此指示灯发亮时,表明出现一个不可屏蔽中断(nmi)。

sp 指示灯:当此指示灯发亮时,表明服务处理器遇到错误。

brd 指示灯:当此指示灯发亮时,表明某个连接的i/o 扩展单元出现故障。

log 指示灯:当此指示灯发亮时,表明您应该查看事件日志或remotesupervisor。

cnfg指示灯:当此指示灯发亮时,表明BIOS配置错误。

raid 指示灯:当此指示灯发亮时,表明阵列卡故障。

over spec 指示灯:当此指示灯发亮时,表明对电源的需求超过了指定的电源供应。

remind 按钮:按下此按钮可重新设置操作员信息面板上的系统错误指示灯并将服务器置于提醒方式。

在提醒方式下,故障并没有清除但系统错误指示灯会闪烁(每2 秒闪烁一次)而不是持续发亮;如果出现另一个系统错误,则系统错误指示灯将会持续发亮。

BRD 主板上发生错误。

CNFG 发生硬件配置错误。

DASD 发生硬盘驱动器错误。

FAN 风扇发生故障,或者是运行过慢,或者是 已卸下风扇。

TEMP 指示灯可能也会点 亮。

LINK 保留。

LOG 已将错误消息写入系统事件日志。

查看IMM 系统事件日志和系统错误日志,获取有关错误的信息。

MEM 当只有MEM 指示灯点亮时,才表示发生 了内存错误。

当MEM 指示灯和CNFG 指示灯都点亮 时,表示内存配置无效。

O V E R SPEC 由于某个电源通道上出现电源超负荷情 况,所以关闭了服务器。

电源功率超过最 大额定值。

PS 电源发生故障。

RAID RAID阵列出错。

SP 服务处理器(IMM)发生故障。

TEMP 系统温度已超出阈值级别。

发生故障的风 扇会导致TEMP 指示灯点亮。

VRM 保留。

相关文档
最新文档