华为告警处理-入门篇

合集下载

华为TD 告警处理

华为TD 告警处理

常见故障维护TD一般故障主要就几种,下面将一一介绍(处理方法仅供参考,各故障还须根据具体情况具体而定。

)1)传输问题,会出现类似下图告警(E1T1的或者IMA的):可以登陆对应基站,如图所示为CZTD3002基站,第一条上报来源CZHRNC01-820,对应的RNC侧IUB接口的传输是1框,25槽,27号链路,所属NODEB是CZTD3002。

我们可以在RNC的维护终端上或者直接在OMC上查看该条E1T1的状态。

如下图示(OMC上):输入命令如下图示:执行后我们会看上方窗体出现我们可以看到我们执行了DSP E1T1: SRN=1, SN=25, BT=AOU, LNKN=27;这条命令,下面的链路状态信息中链路运行状态为链路故障,另外在下方我们可以看到该条传输是被CZTD3002站点占用。

如果传输状态是好的,应为链路运行状态=链路可用。

在基站侧看往往显得更加直观,当我们需要判断传输问题是属于基站侧还是RNC侧时或开站时,我们就可能需要在RNC侧看传输。

可以让基站侧施工人员环回到RNC侧,这时如果链路状态变为可用则说明从RNC到基站传输设备没有问题,而问题出现在基站端。

如果链路仍然不可用,就须通知传输班或者让基站侧督导直接和传输人员联系。

下面介绍如何在基站端看传输状态如上图所示出现传输故障的是7槽1,2,3三个端口(NODEB BBU上的单板都是在0柜0框),由于我们定义的端口是从0开始的,也就是说该站的第二,三,四条传输有问题。

进入该站的MML命令窗口,查询传输状态:我们可以看到端口号1,2,3的链路运行状态是“存在信号丢失告警”,使用标志为“是”。

该站就需上站处理传输问题,当然由于是维护建议先让传输班看下,然后看是否需要上站处理。

一般传输问题都是传输头有问题或者传输端子有问题。

让基站侧代维先处理,如果处理不好,再让他环回给你看。

一种是向RNC侧环,前面已经讲过了,一种是向NODEB侧环,当向RNC环回可用的情况下,向NODEB侧环回链路运行状态变为物理环回,这种情况基本上把头子接好了就没有问题了,如果链路运行状态还是信号丢失告警的话,可能原因有几种,首先让代维重做传输头子,看是否存在虚焊等情况。

华为PTN告警处理规范

华为PTN告警处理规范

华为PTN告警处理规范1.ETH_LOS告警解释:ETH_LOS为以太网端口连接丢失告警。

该告警表示以太网端口接收不到以太网信号。

产生原因:以太网端口的电缆或光纤没有连接好。

电缆或光纤故障。

本端网元接收光功率过低。

单板故障。

处理步骤:检查以太网端口的电缆或光纤是否接好,插紧松脱的电缆或光纤。

检查电缆或光纤是否存在故障,更换故障的电缆或光纤。

检查法兰盘或光衰减器是否连接正确,光衰减器的衰减值是否过大。

更换上报告警的处理板。

若告警未消除,更换对端网元对应的处理板。

2.MPLS_TUNNEL_LOCV告警解释:MPLS_TUNNEL_LOCV为Tunnel连通性丢失告警。

连续3个周期内没有收到希望的CV/FFD报文时出现此告警。

产生原因:PW对端停止CV/FFD。

物理链路故障。

PW对端单板正在复位。

业务接口配置错误。

网络出现严重拥塞。

处理步骤:在网管上查看PW对端是否停止了CV/FFD。

在网管上检查该链路两端网元是否存在单板或光模块相关的告警。

若告警未清除,查看光纤或电缆是否故障,更换故障的光纤或电缆。

在网管上检查对端单板是否上报COMMUN_FAIL告警。

若存在,说明对端单板可能正在复位。

清除COMMUN_FAIL告警后,查看本告警是否清除。

对照网元规划表,在网管上查看业务接口是否配置错误。

如果是,重新配置业务接口后,查看告警是否消除。

检查故障Tunnel的带宽是否已被完全占用。

如果是,增大Tunnel带宽配置或消除非法发送大数据量的根源。

查看告警是否清除。

3. BD_STATUS告警解释:BD_STATUS为物理单板离线告警。

当用户在网管上配置了逻辑单板而物理子架上却没有插入实际单板时就会上报此告警。

产生原因:单板正在硬复位。

单板未插上,或单板插上,但与母板接触不良。

板间通讯故障。

处理步骤:在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若是,则该单板处于硬复位状态。

等待3至5分钟,该单板的工作状态转成绿色后,查看本告警是否消除。

华为PTN告警处理规范

华为PTN告警处理规范
检查单板是否存在TR_LO(告警,指示单板收到的38M系统时钟故障。若 存在,优先清除TR_LO告警。检查单板是否存在POWER_ABNOR告AL,指示单板电压异常。若存在,优先清除POWER_ABNOR告AL检查单板 是否存在HARD_BA告警,指示单板硬件故障。若存在,硬复位单板后, 查看告警是否清除。若告警未清除,更换上报HARD_BA告警的单板,并
对照网元规划表,在网管上查看业务接口是否配置错误。如果是,重新
配置业务接口后,查看告警是否消除。
检查故障Tunnel的带宽是否已被完全占用。如果是,增大Tunnel带宽 配置或消除非法发送大数据量的根源。查看告警是否清除。
3.
告警解释:BD_STATU为物理单板离线告警。当用户在网管上配置了逻辑单
板而物理子架上却没有插入实际单板时就会上报此告警。
在网管上查看两端端口是否存在LOOP_AL告警,若存在,优化清除LOOP_AL告警后,查看本告警是否清除。
对照网元规划表, 查看上报告警的端口是否错插了纤缆, 造成两端端口工 作模式不一致。
在网管上查看两端网元的相关单板是否存在HARD_BA等硬件类告警。若 存在,更换存在硬件类告警的单板后,查看本告警是否清除。
产生原因:
单板正在硬复位。
单板未插上,或单板插上,但与母板接触不良。
板间通讯故障。
处理步骤:
在网管的“运行态”槽位视图中查看该单板的工作状态是否为蓝色,若 是,则该单板处于硬复位状态。等待3至5分钟,该单板的工作状态转 成绿色后,查看本告警是否消除。
检查相应槽位的单板是否插入。若未插入,请插入相应物理单板,告警 将自动清除。 检查单板与母板是否接触良好, 母板连接器的导针是否歪 斜。修正歪斜的导针,重新插拔单板使之与母板良好接触,告警将自动 清除。

华为分布式HLR告警处理手册

华为分布式HLR告警处理手册

告警处理手册_华为V1.0文档更新记录目录V1.0 (1)一、CGP告警 (10)1. 紧急告警 (10)1ALM-1005 单板CPU过载 (10)2ALM-2413 XPTU与CP通信中断 (11)3ALM-3161 流量失衡 (13)4ALM-3162 IP地址冲突 (15)5ALM-3163 网关探测失败 (16)6ALM-3164 IP泛洪攻击 (19)7ALM-3166 IP不可达故障告警 (21)8ALM-4100--ALM4200 模拟量或数字量传感器告警 (22)9ALM-7403 性能业务指标阈值四级越限 (23)2. 重要告警 (24)1ALM-101 主备模块补丁状态不一致 (24)2ALM-1003 模块故障 (26)3ALM-1009 剩余存储空间不足 (28)4ALM-1015 SDM板不在位 (29)5ALM-1016 NTP请求超时 (30)6ALM-1022 本地RAID1故障 (31)7ALM-1023 单板端口故障 (33)8ALM-1030 本地存储介质故障 (37)9ALM-1039 框号冲突 (39)10ALM-2001 单板故障 (41)11ALM-2015 电源输入模块故障 (44)12ALM-2037 ATM端口故障 (46)13ALM-2069 模块间通讯故障 (48)14ALM-2135 风扇故障 (50)15ALM-2402 OMU与LIG/LIC通信中断 (52)16ALM-2411 XPTU逻辑驱动器空间不足 (53)17ALM-2414 XPTU与GSOSM连接中断 (54)18ALM-3010 单板温度二级越限 (55)19ALM-3013 单板扳手打开 (56)20ALM-3015 空气过滤网不在位 (57)21ALM-3017 SMM板与框内设备硬件监控总线故障 (58)22ALM-3077 单板电压二级越限 (60)23ALM-3095 风扇温度二级越限 (61)24ALM-3101 电源输入模块温度二级越限 (62)25ALM-3107 风扇电压二级越限 (63)26ALM-3113 电源输入模块电压二级越限 (64)27ALM-3160 主备SMM板的框号不一致 (65)28ALM-3802 E1T1端口故障 (66)29ALM-3807 OMU与TDM扣板程序校验不一致 (68)30ALM-3808 窄带接口板故障 (69)31ALM-3810 TDM扣板时钟故障 (70)32ALM-3814 TDM扣板硬件故障 (73)33ALM-4402 OMU与单板单平面连接故障 (75)34ALM-4403 OMU与单板通信故障 (76)35ALM-4405 OMU与机框双平面通信故障 (77)36ALM-4421 S3100磁盘阵列故障 (78)37ALM-4501 LAN Switch冷启动 (79)38ALM-4503 LAN Switch端口故障 (80)39ALM-4507 LAN Switch输入电源失效 (83)40ALM-4508 LAN Switch风扇失效 (84)41ALM-4509 LAN Switch端口处于去激活状态 (85)42ALM-4601 SMM板与配电盒通讯故障 (85)43ALM-4602 配电盒管理功能失效 (86)44ALM-4603 配电盒输入电压异常 (86)45ALM-4605 配电盒输出电源开关关闭 (88)46ALM-4606 配电盒外接开关传感器警报 (89)47ALM-4670 扣板故障 (90)48ALM-4671 扣板不在位 (91)49ALM-4752 格式化失败 (91)50ALM-4754 联机设定失败 (92)51ALM-4756 数据表自动CRC校验错误 (94)52ALM-5008 鉴权失败 (95)53ALM-5009 非法登录 (96)54ALM-5010 普通用户执行特通专用命令鉴权失败 (97)55ALM-5102 特通退出服务 (97)56ALM-5201 配置事务即将超时 (98)57ALM-5203 配置事务超时自动回滚 (99)58ALM-5230 MOD MAXT命令发送失败 (100)59ALM-5301 SMM板主备通讯故障 (100)60ALM-5401 主机运行版本和OMU不一致 (101)61ALM-5521 S2600磁盘阵列故障 (102)62ALM-6402 文件加载失败 (103)63ALM-6416 安装失败 (105)64ALM-6417 单板操作系统重新安装 (106)65ALM-7404 性能业务指标阈值三级越限 (107)66ALM-7407 CHR上传单据故障重要告警 (108)67ALM-8301 OMU与RMU设备通信故障 (109)68ALM-8302 OMU与交换板通信故障 (110)69ALM-8304 OMU与RAID设备通信故障 (113)70ALM-8305 OMU与LSW设备通信故障 (114)71ALM-8306 OMU与SMM板管理单元通讯故障 (115)72ALM-8308 SMM板文件加载失败 (117)73ALM-8502 OMU双机数据库同步失败 (118)74ALM-8504 OMU双机通信故障 (118)75ALM-8505 OMU双机文件同步失败 (119)76ALM-8510 单板运行文件与OMU不一致 (120)77ALM-8600 OMU资源异常 (121)78ALM-8601 OMU双机主备倒换 (123)79ALM-8605 主备OMU倒换失败 (124)80ALM-8610 OMU浮动IP冲突 (125)81ALM-8702 OMU向NTP服务器同步时间失败 (126)82ALM-8706 RTC故障 (127)83ALM-9004 创建SNMP会话实体失败 (128)84ALM-9996 SMM板倒换失败 (129)3. 次要告警 (131)1ALM-102 补丁激活后未确认 (131)2ALM-753 告警箱处于离线状态 (132)3ALM-2010 风扇转速越限 (133)4ALM-2375 同一类型模块确认的补丁个数不一致 (134)5ALM-3001 CPU报错 (135)6ALM-3009 单板温度一级越限 (137)7ALM-3076 单板电压一级越限 (138)8ALM-3094 风扇温度一级越限 (139)9ALM-3100 电源输入模块温度一级越限 (140)10ALM-3106 风扇电压一级越限 (141)11ALM-3112 电源输入模块电压一级越限 (141)12ALM-4404 OMU与机框单平面通信故障 (142)13ALM-4502 LAN Switch热启动 (144)14ALM-6415 软件包损坏 (144)15ALM-7405 性能业务指标阈值二级越限 (146)16ALM-8307 SMM主备板软件版本不一致 (147)17ALM-8503 OMU双机连接故障 (147)18ALM-8703 OMU与特定的NTP服务器通信故障 (148)19ALM-8704 OMU与NTP服务器时间偏差超出同步阈值 (150)4. 提示告警 (151)1ALM-3165 端到端质量检测超标 (151)2ALM-4766 帐户锁定 (152)3ALM-4790 帐户锁定 (153)4ALM-7406 性能业务指标阈值一级越限 (153)二、USCDB告警 (155)1. 紧急告警 (155)1ALM-5217 License特征段限制业务 (155)2ALM-5218 License文件限制业务 (156)3ALM-11000 磁阵与服务器单板的连接状态异常 (156)4ALM-11001 数据库表空间不足 (162)5ALM-11003 数据库连接异常 (167)6 ALM-11007 双机信任关系异常 (179)7ALM-11008 CRS资源状态异常 (182)8ALM-12011 容灾故障 (190)9ALM-12012 流控开始 (193)10ALM-12015 License用户数已经达到容量限制 (195)11ALM-22005 加载LDAP SCHEMA文件失败 (196)2. 重要告警 (198)1ALM-101 主备模块补丁状态不一致 (198)2ALM-371 节点内存不足 (199)3ALM-794 禁止格式化转换 (200)4ALM-2069 模块间通讯故障 (201)5ALM-4488 配置进入脱机状态 (203)6ALM-4752 格式化失败 (203)7ALM-4754 联机设定失败 (204)8ALM-4756 数据表自动CRC校验错误 (206)9ALM-5215 License特征段已经失效 (207)10ALM-5216 License文件已经失效 (208)11ALM-5221 License文件无效 (209)12ALM-5401 主机运行版本和OMU不一致 (210)13ALM-11002 物理数据库备份或恢复失败 (211)14ALM-11004 硬盘空间占用率超过90% (225)15ALM-12001 节点心跳超时 (227)16ALM-12007 节点加载失败 (229)17ALM-12008 节点备份失败 (236)18ALM-14002 DPU同步文件数目超出上限 (242)19ALM-14003 DPU与远端DPU连接失败 (244)20ALM-14007 PGW流控启用 (245)21ALM-22001 DSG SCTP链路传输质量下降 (247)22ALM-22002 DSG SCTP链路负荷过载 (248)23ALM-22003 DSG SCTP链路拥塞 (250)24ALM-22004 DSG SCTP链路故障 (251)3. 次要告警 (253)1ALM-102 补丁激活后未确认 (253)2ALM-369 节点内存使用率过高 (254)3ALM-1043 模块备份开关关闭 (255)4ALM-3451 License宽限保护打开 (256)5ALM-10000 PCDR缓冲区溢出 (257)6ALM-14004 PGW同步静态数据出错 (258)7ALM-14009 DPU文件传输失败 (259)8ALM-14011 PGW节点与物理库连接异常 (261)9ALM-22000 DSG SCTP路径故障 (262)4. 提示告警 (264)1ALM-5213 License特征段即将失效 (264)2ALM-5214 License文件即将失效 (265)3ALM-12014 License用户数即将达到容量限制 (265)三、HLR-FE告警 (267)1. 紧急告警 (267)1ALM-1701 MTP目的信令点不可达 (267)2ALM-1713 MTP路由不可用 (268)3ALM-1815 M3UA路由不可用 (270)4ALM-1817 M3UA目的实体不可达 (271)5ALM-2752 SCCP目的信令点不可达 (272)6ALM-2758 远端SCCP故障 (273)7ALM-5217 License特征段限制业务 (274)8ALM-5218 License文件限制业务 (275)2. 重要告警 (276)1ALM-101 主备模块补丁状态不一致 (276)2ALM-743 主用FE和容灾FE动态数据同步心跳超时 (277)3ALM-794 禁止格式化转换 (279)4ALM-1705 MTP链路故障 (280)5ALM-1707 MTP缓冲区拥塞 (286)6ALM-1709 MTP二层拥塞 (289)7ALM-1715 MTP链路发送负荷过载 (291)8ALM-1717 MTP链路接收负荷过载 (293)9ALM-1728 MTP链路故障自环检测 (296)10ALM-1762 M3UA SCTP路径故障 (297)11ALM-1768 M3UA链路传输质量故障 (298)12ALM-1793 M3UA链路集不匹配 (301)13ALM-1809 M3UA链路拥塞 (304)14ALM-1811 M3UA链路故障 (307)15ALM-1831 M3UA链路负荷过载 (310)16ALM-2069 模块间通讯故障 (312)17ALM-2754 SCCP子系统禁止 (314)18ALM-2756 SCCP子系统故障 (316)19ALM-3228 信令点拥塞 (317)20ALM-4488 配置进入脱机状态 (318)21ALM-4752 格式化失败 (318)22ALM-4754 联机设定失败 (319)23ALM-4756 数据表自动CRC校验错误 (321)24ALM-5215 License特征段已经失效 (322)25ALM-5216 License文件已经失效 (323)26ALM-5221 License文件无效 (324)27ALM-5401 主机运行版本和OMU不一致 (325)28ALM-12001 节点心跳超时 (326)29ALM-22001 DSG SCTP链路传输质量下降 (327)30ALM-22002 DSG SCTP链路负荷过载 (329)31ALM-22003 DSG SCTP链路拥塞 (331)32ALM-22004 DSG SCTP链路故障 (332)33ALM-125300 特通消息缓冲区满 (334)3. 次要告警 (335)1ALM-102 补丁激活后未确认 (335)2ALM-1043 模块备份开关变化告警 (336)3ALM-2763 SCCP消息环回错误 (337)4ALM-3451 License宽限保护打开 (338)5ALM-22000 DSG SCTP路径故障 (339)6ALM-125301 特通消息缓冲区占用空间超过阈值 (340)4. 提示告警 (341)1ALM-5213 License特征段即将失效 (341)2ALM-5214 License文件即将失效 (342)四、DX80磁盘阵列告警处理 (343)1. J类型告警 (343)1J 0ASSMM0p Controller Module#m(zz xxHz) BE Expander Port#p Warning <pppppsssss rrrrr> (343)2J 0CSSMM00 Controller Module#m(zz xxHz) Flash ROM Warning <ppppp sssss rrrrr> (344)3J 0ESSMM00 Controller Module#m(zz xxHz) NAND Flash Warning <ppppp sssss rrrrr> (346)4J 01SSMM00 Controller Module#m(zz xxHz) Warning factor(ww) <ppppp sssss rrrrr> (347)5J 06SSMM00 Controller Module #m(zz xxHz) BE Expander Warning <ppppp sssss rrrrr> (349)6J 08SSMM0p Controller Module#m(zz xxHz) DI Port#p Warning <ppppp sssss rrrrr> (350)7J 09SSMM00 Controller Module#m(zz xxHz) SAS Port#nn Warning <ppppp sssss rrrrr> (351)8J 80SSMMnn Disk Drive DE#MM-Disk#nn(SAS xxxGB yykrpm ccccc) SMART(Warning)<ppppp sssss rrrrr> (353)9J 900xMM0n Expander DE#MM/EXP#n Warning <ppppp sssss rrrrr> (354)10J 910xMMnp Expander Port DE#MM/EXP#n/Port#p Warning <ppppp sssss rrrrr>35611J C1MM0000 Controller Module#m(zz xxHz) Reboot <ppppp sssss rrrrr> (357)12J C3SSMM00 Controller Module#m(zz xxHz) Cache(MEM) Correctable Error <pppppsssss rrrrr> (358)13J D20xMM0n Power Supply Unit DE#MM/PSU#n Warning <ppppp sssss rrrr> (360)14J DA0xMM00 DE Exhaust temperature (sensor) DE#MM Warning (361)15J DB0xMM00 DE Intake temperature DE#MM Warning (362)2. M类型告警 (363)1M 21810xxx RAID Group#0xxx REBUILD to HS(DV)(Recovered end) (363)2M E005nxxx WRITE BAD DATA (364)3M E10300xx PINNED DATA (365)4M E207000B NOT READY(11:Power Off/Fail Incomplete) (366)5M E207000C NOT READY(12:Backup Fail) (367)6M E207000D NOT READY(13:Multi CM Down) (367)7M E207000E NOT READY(14:Machine Down Recovery End) (368)8M E207000F NOT READY(15:Machine Down Recovery Failed) (368)9M E2070001 NOT READY(01:Configuration Error) (369)10M E2070002 NOT READY(02:CM F/W Version Error) (369)11M E2070004 NOT READY(04:Restore Fail) (370)12M E2070010 NOT READY(16:DE Build Error) (370)13M E2070011 NOT READY(17:CM Memory Shortage) (371)14M E2070015 NOT READY(21:Configuration Data restored from System Disk) (371)15M E2070016 NOT READY(22:No Version) (372)3. P类型告警 (372)1P 0ASSMM0p Controller Module#m(zz xxHz) BE Expander Port#p Fault <ppppp sssss rrrrr> (372)2P 0BSSMM00 Controller Module#m(zz xxHz) Cache(MEM) Fault <ppppp sssss rrrrr> (373)3P 0CSSMM00 Controller Module#m(zz xxHz) Flash ROM Falut <ppppp sssss rrrrr> 374 4P 0ESSMM00 Controller Module#m(zz xxHz) NAND Controller Fault <ppppp sssss rrrrr> (375)5P 0FSSMM00 Controller Module#m(zz xxHz) SCU Fault <ppppp sssss rrrrr> (376)6P 1A00MM0p FC SFP Controller Module#m Port#p Fault <ppppp sssss rrrrr ooooo> (377)7P 1C00MM0p FC SFP+ Controller Module#m Port#p Fault <ppppp sssss rrrrr ooooo> (378)8P 01SSMM00 Controller Module#m(zz xxHz) Fault <ppppp sssss rrrrr> (379)9P 06SSMM00 Controller Module#m(zz xxHz) BE Expander Fault <ppppp sssss rrrrr> (380)10P 08SSMM0p Controller Module#m(zz xxHz) DI Port#p Fault <ppppp sssss rrrrr> 381 11P 09SSMM00 Controller Module#m(zz xxHz) SAS Port Fault <ppppp sssss rrrrr> .. 382 12P 11SSMM0p Controller Module#m(zz xxHz) Port#p Fault <ppppp sssss rrrrr> (383)13P 12SSMM00 Controller Module#m(zz xxHz) FE Expander Fault <ppppp sssss rrrrr> (384)14P 13SSMM0p Controller Module#m(zz xxHz) FE Expander Port#p Fault<ppppp sssss rrrrr> (385)15P 80SSMMnn Disk Drive DE#MM-Disk#nn(SAS xxxGB yykrpm ccccc) Fault (Failed Usable)<ppppp sssss rrrrr> (386)16P 88SSMMnn Disk Drive DE#MM-Disk#nn(SAS xxxGB yykrpm ccccc) Fault <ppppp sssss rrrrr> (387)17P 900xMM0n Expander DE#MM/EXP#n Fault <ppppp sssss rrrrr> (388)18P 910xMMnp Expander Port DE#MM/EXP#n/Port#p Fault <ppppp sssss rrrrr> (390)19P D20xMM0n Power Supply Unit DE#MM/PSU#n Fault <ppppp sssss rrrrr> (391)20P DA0xMM00 DE Exhaust temperature (sensor) DE#MM Fault (392)21P DB0xMM00 DE Intake temperature sensor DE#MM Fault (393)4. R类型告警 (394)1R 06SSMM00 Controller Module#m(zz xxHz) BE Expander Normal <ppppp sssss rrrrr> (394)2R 900xMM0n Expander DE#MM/EXP#n Normal<ppppp sssss rrrrr> (395)3R D20xMM0n Power Supply Unit DE#MM/PSU#n Normal <ppppp sssss rrrrr> (396)4R DA0xMM00 DE OUT TEMP Normal (396)5R DB0xMM00 DE IN TEMP Normal (397)一、CGP告警1. 紧急告警1ALM-1005 单板CPU过载告警解释当系统检测到CPU的占用率大于过载告警的门限(可由用户设置)时,上报此告警。

华为告警处理手册1.0

华为告警处理手册1.0

目录1. MSC SERVER处理分册 (3)1.1 告警箱处于离线状态 (3)1.2、FE端口故障 (3)1.3、WCKI时钟参考源丢失 (4)1.4、控制框与业务框通信失败 (5)1.5、BAM到主机通讯失败 (6)1.6、BAM到主机连接中断 (7)1.7、与NTP服务器断连 (8)1.8、Q922链路故障 (9)1.9、TCP链路故障 (11)1.10、CPU过载 (12)1.11、单板网口协商失败 (13)1.13、许可证文件即将失效 (14)1.14、计费中心长时间未取话单 (16)1.15、心跳中断 (17)1.16、双机倒换 (18)1.17、私网中断 (19)1.18、IP资源失效 (20)1.19、备份连接失败 (21)1.20、单板故障 (22)1.21、许可证即将过期告警 (23)1.22、许可证已经过期告警 (24)1.23、电源输出开关关闭 (25)1.24、H.248 SCTP链路故障 (26)1.25、MGW退出服务 (28)1.26、MTP目的信令点不可达 (29)1.27、MTP路由传输禁止 (31)11.28、MTP链路故障 (32)1.29、MTP缓冲区拥塞 (34)1.30、M2UA链路故障 (35)1.31、SCCP目的信令点禁止 (37)1.32、SCCP子系统禁止 (38)N => 联系对端局点确认其子系统是否恢复。

(40)2. MGW处理分册 (40)2.1 FE级联网口故障 (40)2.2 风扇框通讯故障 (42)2.3 NET单板时钟检测异常 (44)2.4 NET单板时钟失锁 (47)2.5 GE级联光口故障 (48)2.6 NET单板时钟失锁 (50)2.7 NET单板时钟配线故障 (52)2.8 级联光口故障 (54)2.9 GE通道光模块故障 (56)2.10 TDM通道光模块故障 (58)3.11 BLU时钟检测异常 (60)2.12 信令链路故障告警 (62)2.13 SPF扣板链路故障 (64)2.14 L2UA链路组故障 (67)2.15 L2UA链路故障 (68)2.16 单板软件异常告警 (70)2.17 SIWF故障告警 (72)2.18 控制平面拥塞 (74)2.19 单板故障 (75)2.20 告警箱断链 (77)2.21 单板上存在故障的半永久 (78)2.22 参考源丢失 (80)2.23 虚拟媒体网关迁移出业务态 (82)1. MSC SERVER处理分册1.1 告警箱处于离线状态告警含义1. 告警解释当BAM与告警箱之间通信中断时间超过10秒钟后,系统将产生该告警。

华为硬件告警及故障处理培训

华为硬件告警及故障处理培训

•Interface Processing Unit
•CPRI0 •CPRI1
•ANT1 •DU P
•ANT2 •DU P
PPT文档演模板
2020/11/1 星期日
华为硬件告警及故障处理培训
DRFU单板发射模式-发分集模式
u 发分集模式下,DRFU工作于单载波模式。 u 发分集模式可以基站提高下行信号的质量。 u 发分集模式下,同一个载波的下行信号从通道1和通道2进行2路发射。
•Interface Processing Unit
•CPRI0 •CPRI1
PPT文档演模板
2020/11/1 星期日
•ANT1 •DU P
•ANT2 •DU P
华为硬件告警及故障处理培训
DRFU单板接收模式-主分集接收
u 主分集模式下,DRFU板可以工作于双载波模式。 u 每一个载波的接收信号分别来自于2个天馈。 u 下图中,1个载波的接收信号来自于本DRFU的A和B通道。但是在双拼方案里,
上下行不平衡定义标准
华为总部定义上下行不平衡标准为: ➢上下行平衡等级1的比例大于等于30% 则认为不平衡(下行偏弱或上行偏强) ➢上下行平衡等级11的比例大于等于 30% 则认为不平衡(下行偏强或上行偏弱)
PPT文档演模板
华为硬件告警及故障处理培训
上下行链路平衡等级和接收电平的关系
上下行链路平衡等级
PPT文档演模板
华为硬件告警及故障处理培训
各种场景载频数据配置-S3/3
PPT文档演模板
华为硬件告警及故障处理培训
•内容提要
•第一讲 3900硬件和数据配置 •第二讲 3900常见告警处理 •第三讲 上下不平衡故障处理
PPT文档演模板

华为GSM告警原因及处理步骤

华为GSM告警原因及处理步骤

E1/T1信号丢失告警
GSM小区退出服务告警
光口支路滑帧告警 光口支路滑帧告警 时钟参考源异常告警
E1/T1信号丢失告警
光口支路远端告警
光口支路远端告警
射频单元接收通道异常告警 射频单元接收通道异常告警 光口支路告警指示信号告警 光口支路告警指示信号告警
1、人工闭塞:执行了人工闭塞小区或者主BCCH载频的操作。 2、其它OM操作:人工复位基站或小区、动态数据配置操作(如修改主B 频点)引起BSC对BTS进行复位操作。 3、基站掉电:基站无电源输入。 4、其他原因:LAPD链路或载频属性调整导致的BTS短时不可用、BSC复 位引起基站复位、基站自动复位、单板故障、传输故障、数据配置错误 、人工复位BTS单板等原因。 0 0 0 1、E1/T1配置错误。 2、E1/T1传输线路连接异常。 3、本端设备异常。 4、E1/T1传输中继问题。 5、对端设备异常。 1、光纤没有插牢固。 2、本端设备和对端设备的帧格式配置不一致。 3、本端设备的发送故障。 4、对端设备的接收故障。 5、传输设备故障或传输线路故障。 1、光纤没有插牢固。 2、本端设备和对端设备的帧格式配置不一致。 3、本端设备的发送故障。 4、对端设备的接收故障。 5、传输设备故障或传输线路故障。 1、连接载频的主集或分集接收口的射频电缆松动或者损坏。 2、载频损坏。 1、连接载频的主集或分集接收口的射频电缆松动或者损坏。 2、载频损坏。 1、对端设备没有信号输出到传输设备。 2、传输设备故障。 1、对端设备没有信号输出到传输设备。 2、传输设备故障。 1、E1/T1配置错误。 2、E1/T1传输线路连接异常。 3、本端设备异常。 4、E1/T1传输中继问题。 5、对端设备异常。 1、光纤没有插牢固。 2、本端设备和对端设备的帧格式配置不一致。 3、本端设备的发送故障。 4、对端设备的接收故障。 5、传输设备故障或传输线路故障。 1、光纤没有插牢固。 2、本端设备和对端设备的帧格式配置不一致。 3、本端设备的发送故障。 4、对端设备的接收故障。 5、传输设备故障或传输线路故障。

华为LTE告警原因与处理建议

华为LTE告警原因与处理建议

华为LTE常见告警处理建议2017-8-15华为LTE常见告警目录1射频单元业务不可用告警32小区不可用告警43射频单元维护链路异常告警44BBU IR接口异常告警55网元断连66传输光接口异常告警67S1接口故障告警68射频单元IR接口异常告警79License试运行告警710以太网链路故障告警811用户面故障告警812射频单元时钟异常告警913基站S1控制面传输中断告警914射频单元交流掉电告警915BBU IR光模块收发异常告警1016射频单元驻波告警1017远程维护通道故障告警1118小区服务能力下降告警1119射频单元光模块收发异常告警1120射频单元光接口性能恶化告警1221交流掉电告警1222时钟参考源异常告警1323射频单元硬件故障告警1324射频单元输入电源能力不足告警1425配置数据超出License限制告警1426射频单元ALD电流异常告警1427RRU组网级数与配置不一致告警1528射频单元发射通道增益异常告警1529星卡锁星不足告警1530星卡天线故障告警1531BBU IR光模块/电接口不在位告警1632天线设备维护链路异常告警1633制式间通信异常告警1634配置数据不一致告警1735系统时钟不可用告警1736时间同步失败告警1837射频单元软件运行异常告警1838BBU直流输出异常告警1839单板温度异常告警1940射频单元光模块/电接口不在位告警1941射频单元接收通道RTWP/RSSI过低告警19 42BBU单板维护链路异常告警2043BBU光模块收发异常告警2044RRU组网拓扑类型与配置不一致告警2145证书失效告警2146远程维护通道配置与运行数据不一致告警22 47系统无License运行告警2248单板不在位告警2249未配置时钟参考源告警2350MAC错帧超限告警2351单板下电告警2352单板硬件故障告警2453版本自动回退告警2454单板类型和配置不匹配告警2455单板软件运行异常告警2556机框类型配置与实际不一致告警2557射频单元工作模式与单板能力不匹配告警2558License Feature不可用告警2659传输光模块不在位告警2660单板软件同步失败告警2661射频单元CPRI接口异常告警2762射频单元光模块类型不匹配告警2863小区重配置失败告警2864BBU IR光接口性能恶化告警2865单板时钟输入异常告警2966射频单元过载告警2967射频单元温度异常告警2968星卡维护链路异常告警301 射频单元业务不可用告警故障原因:1、配置原因:小区配置与设备支持规格冲突;射频模块在共模SDR配置下, 制式间载波频率间隔、功率规格、载波数规格、带宽规格等配置错误;CPRI速率配置错误;SFN跨框场景下,扇区设备配置错误;ODI配置错误;2、软件原因:License资源不足;3、单板不可用:小区使用的CPRI链路故障;小区使用的基带单元故障;小区使用的射频单元收发通道故障;CPRI带宽不足;CPRI MUX场景单板不支持;数据链路故障;控制链路故障;时钟精度不足;处理建议:1、检查小区和设备规格,更换型号匹配设备;核查配置参数是否有误,调整正确参数配置;2、核查小区LICENSE,增加LICENSE。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

要求:
熟练掌握“中继链路分配表”,这样就不需要用几个命令组合去查找相应的中继信息。

11月份开始进行华为端局升级,新版本的MSOFTX3000上告警显示的直接是到某个局向的CIC号,这样直接就可以知道是到哪个局向的第几条中继故障(0-31是第一条,32-63是第二条,依次类推)。

直接查找“中继链路分配表”就很直接。

在MSOFTX3000或者UMG上通过端口环回操作确认不是本端问题后联系传输处理或者联系对局确认是否对方做什么操作了。

常用手段就是通过端口环回确认问题出在本端:
MSOFTX3000侧命令:环回STR PORTLOP: ; 取消环回STP PORTLOP: ;这上面主要是到LSTP
和本地HLR的直连中继和信令.注意:老版本的MSOFTX3000(V100R003C07B016)到各个局向的逻辑链路也在上面,新版本(V100R005C10B019)没有
UMG8900侧命令:环回和取消环回都是LOP E1:;这上面主要是到各个局向的中继和信令,出现告警后,查看详细告警信息,然后查“中继链路分配表”。

了解是到那个局向的第几条中继以及上面是否带链路。

MSOFTX3000常见告警:
一:sccp 目的信令点禁止、MTP路由传输禁止、 MTP目的信令点不可达、sccp子系统禁止
首先查看目的信令点编码了解是哪个局向(本例中编码为AFE10)
指令为LST N7DSP:;
输出界面:
由此我们初步判断是:本端局至JNRZHLR的相关告警
由于JNRZHLR至本地端局经常出现此告警,可采用手动恢复,并清除告警。

若是至其他局向出现此告警,则需立即通知维护人员。

(此告警属于严重告警须重视)
当出现一条链路故障的告警,确认是否同时伴有中继告警,是则一般是中继故障引起,然后通过环回确认是否本端设备故障,然后联系对局确认传输或者对局是否存在问题。

一般出现到sccp 目的信令点禁止、MTP路由传输禁止、 MTP目的信令点不可达这些告警时,并且我其他大量异常告警,一般是对局在做操作或者设备故障导致。

联系对局确认。

UMG8900相关告警
二:E1/T1 远端告警
此类告警为传输电路告警,表示本端局至某局向电路中断或闪断
首先:双击红色圈中的信息会弹出如下对话框:
该告警我们可以通过E1环回来确认是否本端故障:LOP E1: FN=1, SN=13, LOC=PORT, MODE=INERLOP, PN=31;环回以后如果告警消失,说明是设备之外部分出现问题,通知传输进行处理或者连续对局是否在做一些中继操作。

另外,如果是晚上传输暂时无法处理,又要将告警消除:请关闭该中继的告警输出(SET E1ALM: FN=1, SN=13, SPN=31, EPN=31, SW=DISABLE;),并手工回复该告警。

但需要做好标记,等第二天值班人员交班时记着打开告警(SET E1ALM: FN=1, SN=13, SPN=31, EPN=31, SW=ENABLE;),后面有该操作的附图
如果问题出在MSOFTX3000上:也有端口环回命令STR PORTLOP: ; (环回命令)STR PORTLOP: ;(解开环回命令)
下图是在MSOFT3000上查看电路状态,一般不需要。

可以了解一下
其次:根据框、槽、端口号,可以查找电路文档信息得出进一步详细信息:
1)对端局向为:JNIGM3,TID:2016 模块号:29 起始电路:5408 终止电路:5439
2)交换ddf (对应传输ddf要传输人员再次确认)
以上信息均为手工录入信息,其中TID(终端标示)信息是最准确的,为确保电路文档信息正确,可在相应server下进
行如下操作来进行验证:LST TKCBYTID (类似于exdep)
会出现如下相关信息:(包括局向、中继群、模块号、起始电路号)
第三:根据以上信息可以进行以下预处理:
1)查看该电路状态:DSP N7TKC(类似于爱立信的stdep)
会出现如下信息:
电路状态是:空闲、忙均代表正常,若是其他状态如:闭塞、锁定、故障、未知均为故障状态2)根据ddf,联系传输处理
3)如果出现传输闪断现象,或者传输人员正在处理该电路时,需要输入如下指令以防止告警不断出现,造成不必要的扣分。

(类似于dtfse)。

切忌:将告警屏蔽后,一定要在文档中标注!
4)如何配合传输查看电路
一般传输人员为排查线路故障,会要求我们配合查看电路状态
一般可以从面板中直接查看电路是好是坏,或者用指令DSP E1PORT(类似于dtstp)
如图所示:查看1框13槽23端口
绿色:代表wo,红色:代表abl 说明电路是故障的
三:提高篇:链路故障SPF扣板链路故障
此告警是比较重要的告警,类似于爱立信的C7 link 告警
首先双击红色圈中的定位信息,进行初步定位:查找相应的电路、ddf等信息
(mgw的告警)
1)以上红色圈中的三个参数信息是比较重要的信息:
链路名称:JIG4-1这是说明是对端局向是到jig4的
接口班组号+E1端口号:确定该链路所在电路,以及相关ddf信息
根据以上信息,联系传输处理该电路。

一般是由于闪断、故障等原因,导致链路故障。

2)链路故障时,在server侧也会出现相关告警
(server会出现相关告警)
用指令dsp n7lnk (类似c7stp),查看链路状态
输入界面会有以下信息
信令链路选择码如果是一串序列号,表示链路状态是是好的,如果是<null>表示该链路不正常,需继续处理
去激活链路指令:DEA N7LNK
激活链路指令:ACT N7LNK
另外还有一些告警:计费中心长时间不取话单、话单服务器心跳中断、话单文件备份失败,性能统计丢失等告警,应急工作站连接失败或者数据备份失败等。

1、出现计费中心不取话单:并且无其他话单服务器的告警时,一般是计费网络问题或者账务中心话单采集设备在做操作或者故障导致。

如果不是账务中心出问题请及时通知维护人员,在维护人员的指导下做一些恢复操作
2、话单服务器心跳中断:话单服务器之间有两条心跳,断一条时基本上无影响。

可以暂时手工恢复该告警等第二天维护人员上班后处理。

如果两条都中断的话应该也会伴有服务器故障,主机到服务器中断的告警,这种情况一般是其中一套服务器故障引起。

请及时通知维护人员。

3、话单文件备份失败:如果开局后备份正常,后来突然出现问题。

一般情况是备份话单的电脑出现问题,磁盘空间不足,或者关机了,或者网卡故障(很少),或者FTP进程因为病毒停掉了(很少)。

该问题不严重,可以手动恢复。

第二天等维护人员上班后处理
4、性能统计丢失(NSP告警平台出):一般是局点BAM服务器的性能统计进程异常或者bam服务器死掉。

也可能是上级网管出现问题或者中间的维护网络出现问题。

通过如下操作可以确认是否前一种:看能否PING通相应局点的维护IP地址或者登陆,可以的话表示BAM服务器正常。

然后登陆性能统计平台,如果一直无法登陆表明是统计进程异常,请通知维护人员。

其他情况一般就是上级网管问题或者网络不通,联系相关人员处理
5、应急工作站连接失败或者数据备份失败:该问题不严重,可以手工恢复该告警,第二天请维护人员处理。

6、凌晨出现一些数据加载等告警:这种告警不必关注,这是设备为了前后台数据一致进行的单板软件复位进行数据程序重新加载。

属于正常。

7、告警箱未连接:手动恢复,第二天等维护人员处理
8、单板故障:查看是否有其他相关的紧急、重要告警请及时联系维护人员。

如果可以的话,请进行单板的硬件复位操作在设备维护面板将显示红色的单板进行复位(一定要是硬件复位),看是否可以正常运行。

相关文档
最新文档