AIX故障排除--LED解释

合集下载

aix硬件故障分析和排除

aix硬件故障分析和排除

RS/6000小型机故障的基本定位方法一故障的定义.弄清楚系统发生了什么问题.系统现在能做什么?不能做什么?.故障什么时候发生的?.有没有做平时不同的操作?.故障有没有规律?定时还是不定时?发生的频率有多高?.是一台机器出现故障还是多台机器故障?故障现象是否相同?.最近有没有做改动?如安装了新的硬件、软件,改变了系统的一些设臵。

二故障信息的收集1)收集故障信息对于判断、诊断故障原因,修复系统非常重要。

2)系统故障记录(errorlog)errdemon进程在系统启动时自动运行记录包括硬件、软件及其他操作信息故障记录文件为/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析 errpt 命令的使用(普通用户权限也可使用)#errpt |more 列出简短出错信息ERROR_ID TIMESTAMP T C RESOURCE_NAME ERROR_DESCRIPTION192AC071 0723100300 T 0 errdemon Error logging turned off0E017ED1 0720131000 P H mem2 Memory failure9DBCFDEE 0701000000 T 0 errdemon Error logging turned on038F2580 0624131000 U H scdisk0 UNDETERMINED ERRORAA8AB241 0405130900 T O OPERATOR OPERATOR NOTIFICATIONTIMESTAMP: MMDDHHMMYY (月日时分年)T(类型): P 永久; T 临时; U 未知(永久性的错误应引起重视)C(分类): H 硬件; S 软件; O 用户; U未知#errpt -d H 列出所有硬件出错信息#errpt -d S 列出所有软件出错信息#errpt -aj ERROR_ID 列出详细出错信息# errpt -aj 0502f666 <--- ERROR_ID用大小写均可例:LABEL: SCSI_ERR1ID: 0502F666Date/Time: Jun 19 22:29:51Sequence Number: 95Machine ID: 123456789012Node ID: host1Class: HType: PERMResource Name: scsi0Resource Class: adapterResource Type: hscsiLocation: 00-08VPD: <--- Virtal Product DataDevice Driver Level (00)Diagnostic Level (00)Displayable Message.........SCSIEC Level....................C25928FRU Number..................30F8834 Manufacturer................IBM97FPart Number.................59F4566Serial Number (00002849)ROS Level and ID (24)Read/Write Register Ptr (0120)DescriptionADAPTER ERRORProbable CausesADAPTER HARDWARE CABLECABLE TERMINATOR DEVICEFailure CausesADAPTERCABLE LOOSE OR DEFECTIVERecommended ActionsPERFORM PROBLEM DETERMINATION PROCEDURESCHECK CABLE AND ITS CONNECTIONSDetail DataSENSE DATA0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 00003)控制面板上的LED 代码.8 位代码,通常系统故障灯会同时亮起。

AIX清除报警

AIX清除报警

[TOP]
+ sys0 -------00-00 --System Object
+ sysplanar0 -00-00 --System Planar
+ oppanel ----00-00 --ห้องสมุดไป่ตู้perator panel
+ mem0 -------00-00 --Memory
+ proc0 ------00-00 --Processor
+ L2cache0 ---00-00 --L2 cache
+ scsi1 ------30-58 --Wide SCSI I/O Controller
[MORE...22]
6.执行完毕退出诊断,报警灯将熄灭,恢复正常.
还有可能就是要进asmi跟hmc来清除了
4、按“F7”提交。以上步骤可以熄灭小型机橙色告警灯
黄色报警等亮并不一定表示系统出现问题,如果在errpt中有过硬件报错(可能是临时错误或异常操作等)都会导致黄色报警灯亮。根据上述现象,需要重新设置一下LED,具体步骤如下:
1.以root用户身份登录进入系统;
2.在命令行输入“diag”命令,进入下一级菜单;
2、选择“Identify and Attention Indicators”,回车继续;
3、选择“Set System Attention Indicator to Normal”,回车,“Set System
Attention Indicator to Normal”前面出现“+”号,表示选定此项;
aix 清除报警信息
方法一:
灭故障灯的办法:
以root权限运行

AIX启动故障判断

AIX启动故障判断

启动故障诊断本文包括下面的内容:引导过程概述;MCA和PCI两种总线结构类型主机引导过程的区别;AIX引导过程的第一阶段——配置基本设备;AIX引导过程的第二阶段——激活rootvg;AIX引导过程的第三阶段——配置其余的设备;常见主机引导故障及解决方法。

主机引导问题是最常见的故障,本文首先概括引导过程的各个阶段,之后针对每个阶段及该阶段出现的led代码展开详细的说明和讨论。

(现在所有的RS/6000主机都配置有一块PANEL,并在启动过程的每个步骤显示相应的3位LED代码)1. 引导过程概述 (1)2. BIST-POST (2)2.1 MCA系统 (2)2.2 PCI系统 (4)3. 引导第一阶段 (6)4. 引导第二阶段 (6)4.1 LED代码551、555、557 (8)4.2 LED代码552、554、556 (8)4.3 LED代码518 (9)4.4 alog命令 (9)5. 引导第三阶段 (10)5.1 /etc/inittab文件 (11)5.2 LED代码553 (11)5.3 LED代码C31 (12)5.4 LED代码581 (12)6. 错误日志中与引导有关的错误 (13)7. 总结 (14)7.1 启动阶段总结 (14)7.2 LED代码综述 (14)1. 引导过程概述引导的过程与主机的硬件平台有关,尤其在初始阶段,PCI和MCA两种总线类型的主机有比较大的区别,这种不同影响到对不同硬件架构造成的引导故障要采取相应不同的解决方法。

正常的引导流程如图1:传统的MCA的RS/6000与现在的PCI系统在引导过程中存在差别。

首先介绍MCA系统。

2.1 MCA系统在MCA系统引导过程中,首先执行的是BIST,这些测试程序储存在EPROM芯片中,并仅对主板上的部件进行测试,BIST过程中显示的LED代码范围是100~195,之后执行POST。

POST的任务是找到一个保存完好BLV的硬件设备,bootlist中所有的设备都会被测试,该过程中显示的LED代码范围是200~2E7,如果期间出现软件或硬件故障都将导致引导过程中断。

LED显示屏常见故障及其排除方法

LED显示屏常见故障及其排除方法

LED显示屏常见故障及其排除方法在使用LED显示屏的过程中,常会遭遇一些故障。

以下将列举一些常见的故障,并提供相应的排除方法。

这些故障包括:1.显示屏无法启动:在启动时,显示屏没有反应或者只有一部分屏幕亮起。

-检查电源:确保电源连接正确并且没有松动。

检查电源线是否损坏,如果需要,请更换电源线。

-检查控制卡:检查控制卡是否连接正确。

确认电源开关是否打开。

尝试重新插拔控制卡。

-检查信号线:确保信号线连接正确并且没有松动。

尝试更换信号线。

2.显示屏中出现黑点或亮点。

-清洁屏幕:使用专门的屏幕清洁剂和柔软的布清洁屏幕表面。

避免使用化学溶剂或者硬物品清洁屏幕。

-更换模块:如果清洁无效,可能是像素点出现故障。

尝试更换故障模块。

3.显示内容杂乱或模糊。

-调整分辨率:确认计算机或播放设备的输出分辨率与显示屏的分辨率匹配。

尝试调整码率和刷新率。

-更换信号线:可能是信号线出现问题。

尝试使用新的高质量信号线。

4.显示屏颜色不均匀或出现色差。

-检查光源:确认光源是否正常工作。

尝试更换光源。

-调整颜色设置:有些LED显示屏可以手动调整颜色设置。

尝试调整颜色平衡和对比度。

5.显示内容闪烁。

-调整刷新率:尝试调整刷新率以适应显示屏的要求。

-检查电源:检查电源供应是否稳定。

尝试使用稳定的电源。

6.部分显示区域无法正常显示。

-检查模块连接:检查模块之间的连接是否正确。

尝试重新插拔模块。

-重启显示屏:尝试重启显示屏以重新加载显示内容。

7.显示屏出现闪屏、重影或者卡顿。

-检查信号线:检查信号线是否连接稳定。

尝试更换信号线。

-更新驱动程序:确保计算机或者播放设备的相关驱动程序是最新的版本。

总结起来,对于大多数LED显示屏故障,我们应该首先检查电源、控制卡和信号线是否正常连接,然后尝试调整相关设置。

如果问题仍然存在,我们可以考虑更换故障的模块或者更换相关设备。

最重要的是定期维护和保养LED显示屏,避免灰尘、水分或者其他物质进入显示屏内部,严格控制使用环境的温度和湿度。

AIX报错信息

AIX报错信息

LABLE:事件名称IDENTIFIER:事件IDDate/Time:发生的时间Sequence Number:事件序列号Machine ID:机器标识Node ID:节点标识Class:事件来源S-软件H-硬件I-信息U-未定的Type:事件类型PEND-设备或组件的可用性损失是急迫的。

PERF-设备或组件的性能已下降到可接受的级别以下。

PERM-出现了不可恢复的情况。

如果错误类型为这个值,那么通常是最严重的错误,并且很可能意味着出现了硬件设备或者软件模块的故障。

如果错误类型为PERM 之外的其他值,通常并不表示故障,但是对这些错误进行了记录,以便可以使用诊断程序对它们进行分析。

TEMP—在出现多次不成功的尝试之后,所恢复到的状态。

这种错误类型也可以用于记录信息性条目,如 DASD 设备的数据传输统计信息。

UNKN—无法确定错误的严重程度。

INFO—错误日志条目是信息性的,并且不是某个错误所产生的结果。

Resource Name:检测到错误的资源的名称。

对于软件错误,这是某个软件组件或可执行程序的名称。

对于硬件错误,这是某个设备或系统组件的名称。

它并不表示该组件出现故障或者需要更换。

相反,它用于确定合适的诊断模块以用于对错误进行分析。

Resource Class:检测到故障的资源的一般类别(例如,磁盘的设备类别)。

Resource Type:检测到故障的资源的类型。

Location Code:设备的路径。

最多可能有四个字段,分别是抽屉、插槽、连接器和端口。

VPD:关键的产品数据。

这个字段的内容(如果存在)可能各不相同。

设备的错误日志条目通常返回有关设备制造商、序列号、工程变更级别、以及只读存储级别的信息。

Description:错误的汇总信息。

Probable Cause:一些可能的错误原因的列表。

User Causes:由用户错误所导致错误的可能原因的列表。

用户所导致的错误可能包括不正确插入的磁盘、未能开启的外部设备(如调制解调器和打印机)。

如何解决AIX的文件系统故障网络服务器-电脑资料

如何解决AIX的文件系统故障网络服务器-电脑资料

如何解决AIX的文件系统故障网络服务器-电脑资料在进行文件系统维护和管理过程中,会碰到这样一些问题,例如无法安装文件系统或者无法拆卸文件系统,当文件系统的超级块被破坏,而无法正常使用文件系统,如何修复rootvg中的主要文件系统,下面就讨论如何解决一些常见的文件系统问题,。

一、恢复超级块错误在进行文件系统维护和管理过程中,会碰到这样一些问题,例如无法安装文件系统或者无法拆卸文件系统,当文件系统的超级块被破坏,而无法正常使用文件系统,如何修复rootvg中的主要文件系统,下面就讨论如何解决一些常见的文件系统问题。

一、恢复超级块错误有些用户在使用fsck或mount命令时,当见到下面的提示信息时,可能是文件系统的超级块出了问题:<PRE>fsck: Not an AIX3 file systemfsck: Not an AIXV3 file systemfsck: Not an AIX4 file systemfsck: Not an AIXV4 file systemfsck: Not a recognized file system typemount: invalid argument</PRE>例如,当用户安装一个/allenfs文件系统时,出现下面的错误提示:<PRE>#mount /allenfs</PRE>mount: 0506-324 Cannot mount /dev/lv1 on /allenfs: A system call received a parameter that is not valid.修复该文件系统时,出现下面错误提示,并异常终止:<PRE>#fsck /dev/lv1Not a recognized filesystem type. (TER<strong>MI</STRONG>NATED)</p><p> </PRE>要解决这个问题,只能用备份的超级块来恢复主超级块,我们都知道,在文件系统中,1号逻辑块是主超级块,31号逻辑块是备份超级块,因此就把31号逻辑块上的内容写到1号逻辑块上去。

AIX操作系统错误日志及日常维护

AIX操作系统错误日志及日常维护

AIX操作系统错误日志及日常维护一、系统故障记录(errorlog)errdemon 进程在系统启动时自动运行记录包括硬件软件及其他操作信息故障记录文件为/var/adm/ras/errlog 可备份下来或拷贝到别的机器上分析errpt 命令的使用(普通用户权限也可使用)#errpt |more 列出简短出错信息ERROR_ID TIMESTAMP T C RESOURCE_NAME ERROR_DESCRIPTION192ACror logging turned off038FTIMESTAMP: MMDDHHMMYY (月日时分年T 类型: P 永久; T 临时; U 未知永久性的错误应引起重视C 分类: H 硬件; S 软件; O 用户; U未知#errpt -d H 列出所有硬件出错信息#errpt -d S 列出所有软件出错信息#errpt -aj ERROR_ID 列出详细出错信息# errpt -aj 0502f666 <--- ERROR_ID用大小写均可,例:LABEL: SCSI_ERR1ID: 0502F666Date/Time: Jun 19 22:29:51Sequence Number: 95Node ID: host1Class: HType: PERMResource Name: scsi0Resource Class: adapterResource Type: hscsiLocation: 00-08VPD: <--- Virtal Product DataDevice Driver Level (00)Diagnostic Level (00)Displayable Message.........SCSIEC Level....................C25928FRU Number..................30F8834 Manufacturer................IBM97FPart Number.................59F4566Serial Number (00002849)ROS Level and ID (24)Read/Write Register Ptr (0120)DescriptionADAPTER ERRORProbable CausesADAPTER HARDWARE CABLECABLE TERMINATOR DEVICEFailure CausesADAPTERCABLE LOOSE OR DEFECTIVERecommended ActionsPERFORM PROBLEM DETERMINATION PROCEDURESCHECK CABLE AND ITS CONNECTIONSDetail DataSENSE DATA0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000二、控制面板上的LED 代码.8 位代码通常系统故障灯会同时亮起某些机型还会同时显示故障设备位置代码.4 位代码通常是Exxx.3 位代码通常为0yyy 只看后3位.8 位和4位代码可查看系统服务手册 (Service Guide)3 位代码可查看系统诊断手册(Diagnostic Information for Multiple Bus System).闪动的 888, 系统崩溃硬件或软件原因造成按reset 键会显示更多内容888-102 一般为软件故障888-102-207 例外系统会产生一个dump888-102-xxx-0C9 系统正在做dump, 请等待888-102-xxx-0C0 系统dump完成可关电重启888-103 或 105硬件故障一般有 SRN 代码及位置代码三、其他用于收集系统信息的命令lsdev -C 系统设备信息#lsdev -Cc diskhdisk0 Available 00-06-00-2,0 4.5 GB 16 Bit SCSI Disk Drivehdisk1 Available 00-06-00-1,0 4.5 GB 16 Bit SCSI Disk Drivehdisk2 Defined 00-06-00-4,0 16 Bit SCSI Disk Drivelspv 查看物理卷信息#lspvhdisk0 0007821160af3d76 rootvghdisk1 000782117f571294 rootvghdisk2 0000000045c45bde datavglsvg 查看卷组信息#lsvg datavgVOLUME GROUP: datavg VG IDENTIFIER: 0000000055e2458bVG STATE: active PP SIZE: 4 megabyte(s)VG PERMISSION: read/write TOTAL PPs: 2169 (8676 megabytMAX LVs: 256 FREE PPs: 1 (4 megabytes)LVs: 3 USED PPs: 2168 (8672 megabytOPEN LVs: 2 QUORUM: 2TOTAL PVs: 1 VG DESCRIPTORS: 2STALE PVs: 0 STALE PPs: 0ACTIVE PVs: 1 AUTO ON: yesMAX PPs per PV: 2032 MAX PVs: 16#lsvg -l rootvgrootvg:LV NAME TYPE LPs PPs PVs LV STATE MOUNT POINThd5 boot 1 1 1 closed/syncd N/A...lv00 jfs 51 102 1 closed/stale /ibmcxxlv01 jfs 1 1 1 open/syncd /cics_regionslv02 jfs 4 4 1 open/syncd /var/mqmlslpp 查看文件组信息# lslpp -L |grep 23100020....100020.rte 4.3.2.7 C IBM PCI 10/100 Ethernet Adapt看某个文件组是否已安装如以太网卡驱动也用于查询补丁程序的版本lsattr 查看设备参数设置# lsattr -El ent2busio 0x7fffc00 Bus I/O address Falsebusintr 9 Bus interrupt level Falseintr_priority 3 Interrupt priority Falsetx_que_size 512 TRANSMIT queue size Truerx_que_size 256 RECEIVE queue size Truerxbuf_pool_size 384 RECEIVE buffer pool size Truemedia_speed 10_Half_Duplex Media Speed Trueuse_alt_addr no Enable ALTERNATE ETHERNET address Truealt_addr 0x000000000000 ALTERNATE ETHERNET address Trueip_gap 96 Inter-Packet Gap Truelscfg 查看VPD信息Virtual Product Data)# lscfg -vl ssa1DEVICE LOCATION DESCRIPTIONssa1 30-68 IBM SSA Enhanced RAID Adapter(14104500)Part Number.................097H0645FRU Number..................097H0645 <-- 备件号Serial Number...............C8217227EC Level....................0000F20825 Manufacturer................IBM053ROS Level and ID............7201 <-- 微码版本Loadable Microcode Level (04)Device Driver Level (00)Displayable Message.........SSA-ADAPTERDevice Specific.(Z0)........DRAM=032Device Specific.(Z1)........CACHE=0Device Specific.(Z2)........000000062955dab2Device Specific.(YL)........P2-I7 <-- 槽号不同的硬件设备有不同的VPD 所含的格式和信息都不一样通常备件号和微码版本最有参考价值注FRU(Field Replace Unit)才是真正的备件号。

AIX故障排除--LED解释

AIX故障排除--LED解释

RS/6000液晶显示屏上显示代码(LED)的含义本文介绍RS/6000启动过程中机器上的液晶显示屏代码的含义。

本文代码不针对具体机型。

IPL ROM CRC comparison error (irrecoverable).RAM POST memory configuration error or no memory found (irrecoverable).RAM POST failure (irrecoverable).Power status register failed (irrecoverable).A low voltage condition is present (irrecoverable).IPL ROM code being uncompressed into memory.End of bootlist encountered.RAM POST is looking for 1M bytes of good memory.RAM POST bit map is being generated.L2 cache is not detected. (The display shows a solid 21c for 5 sec)IPL control block is being initialized.NVRAM CRC comparison error during AIX.IPL(Key Mode Switch in Normal mode).Reset NVRAM by reaccomplishing IPL in Service mode. For systems with an internal, direct-bus-attached(DBA)disk,IPLROM attempted to perform an IPL from that disk before halting with this three-digit display value. Attempting a Normal mode IPL from Standard I/O planar attached devices specified in NVRAM IPL Devices List.Attempting a Normal mode IPL from SCSI attached devices specified in NVRAM IPL Devices List.Note: May be caused by incorrect jumper setting for external SCSI devices or by incorrect SCSI terminator.REFER FFC B88Attempting a Normal mode restart from 9333 subsystem device specified in NVRAM device list. Attempting a Normal mode IPL from IBM 7012 DBA disk attached devices specified in NVRAM IPL Devices List.Attempting a Normal mode restart from Ethernet specified in NVRAM device list.Attempting a Normal mode restart from Token Ring specified in NVRAM device list. Attempting a Normal mode IPL from NVRAM expansion code.Attempting a Normal mode IPL from NVRAM IPL Devices List; cannot IPL from any of the listed devices, or there areno valid entry in the Devices List.Attempting a normal mode IPL from FDDI specified in NVRAM IPL device list.Attempting a Normal mode restart from adapter feature ROM specified in IPL ROM devices list. Attempting a Normal mode restart from Ethernet specified in IPL ROM devices list.Attempting a Normal mode IPL from Standard I/O planar attached devices specified in Rom Default Device List.Attempting a Normal mode IPL from SCSI attached devices specified in IPL ROM Default Device List.Attempting a Normal mode restart from 9333 subsystem device specified in IPL ROM device list. Attempting a Normal mode IPL from IBM 7012 DBA disk attached devices specified in IPL ROM Default Device List.Attempting a Normal mode restart from Ethernet specified in IPL ROM default devices list. Attempting a Normal mode restart from Token Ring specified in IPL ROM default device list. Attempting a Normal mode restart from Token Ring specified by the operator.System failed to restart from the device chosen by the operator.Attempting a normal mode IPL from FDDI specified in IPL ROM device list.Attempting a Service mode restart from adapter feature ROM.Attempting a Normal mode IPL from devices specified in the NVRAM IPL Devices List.Unknown tape drive being identified or configured. Unknown display being identified or configured. Unknown input device being idenor configuredUnknown adync device being idenor configured。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

RS/6000液晶显示屏上显示代码(LED)的含义
本文介绍RS/6000启动过程中机器上的液晶显示屏代码的含义。

本文代码不针对具体机型。

IPL ROM CRC comparison error (irrecoverable).
RAM POST memory configuration error or no memory found (irrecoverable).
RAM POST failure (irrecoverable).
Power status register failed (irrecoverable).
A low voltage condition is present (irrecoverable).
IPL ROM code being uncompressed into memory.
End of bootlist encountered.
RAM POST is looking for 1M bytes of good memory.
RAM POST bit map is being generated.
L2 cache is not detected. (The display shows a solid 21c for 5 sec)
IPL control block is being initialized.
NVRAM CRC comparison error during AIX.
IPL(Key Mode Switch in Normal mode).
Reset NVRAM by reaccomplishing IPL in Service mode. For systems with an internal, direct-bus-attached(DBA)disk,IPL
ROM attempted to perform an IPL from that disk before halting with this three-digit display value. Attempting a Normal mode IPL from Standard I/O planar attached devices specified in NVRAM IPL Devices List.
Attempting a Normal mode IPL from SCSI attached devices specified in NVRAM IPL Devices List.
Note: May be caused by incorrect jumper setting for external SCSI devices or by incorrect SCSI terminator.
REFER FFC B88
Attempting a Normal mode restart from 9333 subsystem device specified in NVRAM device list. Attempting a Normal mode IPL from IBM 7012 DBA disk attached devices specified in NVRAM IPL Devices List.
Attempting a Normal mode restart from Ethernet specified in NVRAM device list.
Attempting a Normal mode restart from Token Ring specified in NVRAM device list. Attempting a Normal mode IPL from NVRAM expansion code.
Attempting a Normal mode IPL from NVRAM IPL Devices List; cannot IPL from any of the listed devices, or there are
no valid entry in the Devices List.
Attempting a normal mode IPL from FDDI specified in NVRAM IPL device list.
Attempting a Normal mode restart from adapter feature ROM specified in IPL ROM devices list. Attempting a Normal mode restart from Ethernet specified in IPL ROM devices list.
Attempting a Normal mode IPL from Standard I/O planar attached devices specified in Rom Default Device List.
Attempting a Normal mode IPL from SCSI attached devices specified in IPL ROM Default Device List.
Attempting a Normal mode restart from 9333 subsystem device specified in IPL ROM device list. Attempting a Normal mode IPL from IBM 7012 DBA disk attached devices specified in IPL ROM Default Device List.
Attempting a Normal mode restart from Ethernet specified in IPL ROM default devices list. Attempting a Normal mode restart from Token Ring specified in IPL ROM default device list. Attempting a Normal mode restart from Token Ring specified by the operator.
System failed to restart from the device chosen by the operator.
Attempting a normal mode IPL from FDDI specified in IPL ROM device list.
Attempting a Service mode restart from adapter feature ROM.
Attempting a Normal mode IPL from devices specified in the NVRAM IPL Devices List.
Unknown tape drive being identified or configured. Unknown display being identified or configured. Unknown input device being idenor configured
Unknown adync device being idenor configured。

相关文档
最新文档