常见告警处理方法

合集下载

室分基站常见告警处理方法、流程及技术联系人

室分基站常见告警处理方法、流程及技术联系人

2G一)OML链路故障告警(E1TI故障告警):即断站1 、与传输网管核对,光端机运行是否正常(即是否能监控到本基站光端机),如果可以监控到,则说明是基站侧问题,需上站处理。

如果不能,则可判定传输光缆中断或者传输设备断电,上站核实。

(仅限于华为光端机)2 、上站核查是否断电,掉电则上电即可,如果没断电则检查基站2M质量并环回。

设备对应的传输2M环回,与传输网管核实该端口状态,如果正常则再向BSC网管核实。

如果传输网管看到该端口正常而BSC网管看到不通,则需传输网管与BSC网管进行核实,并找机房相关人员处理。

如果基站环回没问题,则可判定是基站侧问题。

3、检查设备2M头质量。

(自环或者万用表测)GSM可以自环,观察LIU0-4指示灯,WCDMA早期部分基站也有此功能。

4、是否为设备单板故障。

主控板GSM(GTMU),WCDMA(WMPT)5、由于室分安装场景比较复杂,而且有的相当恶劣。

检查是否有进水迹象或者高温等。

观察设备外观,及主控板RUN指示灯运行状态(绿色慢闪)。

风扇(BBU的FAN 模块)运行状态。

6、室分传输比较多样。

华为可由网管监控,但格林威尔传输及PDH等网管看不到,需相应厂家配合。

二)CPRI链路异常告警、射频单元维护链路异常告警、光接口性能恶化、光模块收发异常告警。

此类告警通俗点说即:BBU与RRU之间通讯不正常。

1、首先核实设备全部上电。

同时检查基站尾纤与光模块是否匹配(室分基站全部为单模尾纤,对应单模光模块1.125G-1310nm-10KM)。

2、观察主控板及RRU的CPRI接口指示灯。

正常为绿色。

有时指示灯正常,但依然有光接口性能恶化告警,说明光衰较大。

这时需用光功率计测各个光路,光衰不能大于-15db。

3、尾纤拔插,酒精清洗接头,更换法兰盘等。

法兰盘对接要插入凹槽内松紧适度4、正常状态下BBU及RRU的CPRI接口灯为绿色常亮。

RUN慢闪,ACT常亮,具体各指示灯含义见下表1,RRU指示灯见表2注:2G一些设备在后台数据去激活状态下主控板GTMU的CPRI接口指示灯不会亮,需要后台把数据激活才能看到光口亮灯,但是未激活状态下BBU与RRU之间如果光路正常则RRU的CPRI指示灯可以看到绿色。

阿尔卡特SDH常见告警及处理方法

阿尔卡特SDH常见告警及处理方法

阿尔卡特SDH常见告警及处理方法阿尔卡特SDH故障2.1 RUP, RUM, ICP类告警处理告警名称或故障现象:Replaceable Unit Problem机盘故障; Replaceable Unit Missed机盘不在位; Internal Communication Problem 内部通信(控制信号)故障,相应的故障机盘报故障。

告警产生原因:1.原因1 RUM还可能是网管配置了板,但实际配插板2.原因2 机盘硬件故障3.原因3 ICP有可能是其它盘引起,如1660的矩阵、主控;1662的SYNTH16;1642的MB板告警处理方法:1.原因1 对于RUM首先核实是否现场每插板,如没插板可在网管去配置(对于有配置电路或作为时钟源的,需先删除这些配置),当然现场每插板,由配置了电路或时钟源需仔细核实是否是垃圾数据在删。

2.原因2 替换相应的故障盘3.对于ICP告警如替换故障盘后仍不消失,则需考虑可能是其它的矩阵、主控、SYNTH16、MB盘等引起。

可先对这些怀疑的板做插拔(注意对业务和监控的影响,一般主控盘插拔只影响监控;矩阵和SYNTH16均有保护,如无异常状态或第二处故障,插拔备用也不影响业务(要插拔当前的主用矩阵需先切换成备用角色再插拔,切换后等15分钟让它同步完再操作)),定位到故障板后替换故障板。

2.2 TD, URU, TF告警告警名称或故障现象:设备光口或端口报TD(Transmitter Degraded), URU (Underlying Resource Unavailable), TF (Transmitter Failure)告警。

告警产生原因:1.原因1 如有光模块的机盘,则可能是故障2.原因2 机盘故障告警处理方法:1.原因1 替换光模块2.原因2 替换机盘2.3 LOS, LOF告警处理告警名称或故障现象:LOS(Loss of signal;LOF(Loss Of Frame);MS-AIS;MS-RDI告警告警产生原因:1.原因1 光缆故障2.原因2 对端设备停电或吊死(主要是接入设备)3.原因3 显现硬件故障,相应光板报RUP、RUM、ICP、URU、TD、TF等告警4.原因4 隐性硬件故障5.原因5 光模块吊死告警处理方法:1.原因1 对光及OTDR测试等排查光路故障,清除光缆故障(具体见光缆故障处理)2.原因2 现场开电或环MB板3.原因3 显现硬件故障请替换相应的故障板4.原因4 当光路对光正常,无明显的硬件故障后,则可能是隐性硬件故障。

SDH常见告警及处理方法

SDH常见告警及处理方法

SDH常见告警及处理方法
一、SDH常见告警
1、AIS(Alarm Indication Signal):系统发生严重故障,但故障定位困难时发出的报警信号,其特征是所有光纤信道的信号都变为8kHz的正弦波。

2、RDI 告警:Remote Defect Indication,用来标识由网络其中一端的故障引起的报警信号,其特征是只有发送方端口发出的信号变为
8kHz 正弦波,接收端口不发生改变。

3、LOS(Loss of Signal): 信号丢失告警,当根据多模解调器的输出结果发现收发光纤的质量有问题时,就发出此类报警。

4、LOF (Loss Of Frame):帧丢失告警,当多模解调器未能正确解调出SDH/SONET信号帧,只能解调出时隙时,就发出此类报警。

5、LOFL(Loss Of Frame Lock):解调锁定丢失告警,当多模解调器未能正确解调SDH/SONET信号帧,会给发出此类报警。

6、TIM(Trace Identify Mismatch):诊断路径标识错误报警,当多模解调器识别进入端口的信号的诊断路径标识,与设置的诊断路径标识不一致时,就发出此报警。

7、STU(Signal Fail):发射信号失效报警,当多模解调器发射板信号失效时,就发出此报警。

二、SDH常见告警的处理原则
1、首先仔细考察AIS信号,是否处纤芯断纤等原因导致的。

2、考察RDI信号,区分是单向报警还是双向报警,以及是否真的是本段线路出现问题还是根据RDI反向传输到下一个站点的问题。

北电TN-1X常见告警处理方法

北电TN-1X常见告警处理方法

TN-1X的常见告警处理方法如下,首先命令行方式登陆TN-1X网元,然后按下面方法清除告警。

1.PPI-LOS产生原因:2M端口打开,但未加业务。

处理方法:对该端口的监控状态设为Standy,设置方法:假定该端口为S11-1, 使用UI登陆网元,键入/ c r s s11-12.PPI-AIS产生原因:2M端口硬件环回,端口监控状态为“auto”处理方法:※拆除2M端口硬件环回,后将端口状态设置为“standy”(方法同上)※或者不拆除硬件环回,而通过将2M端口的PPI-AIS告警屏蔽清除。

屏蔽方法:键入/ c a m p a o s11-1。

屏蔽后PPI-AIS将不再上报。

3.PPI-Unexpected Signal产生原因:2M端口监控状态为“Standy”,但有业务信号接入处理方法:修改2M端口的监控状态为“auto”即可,设置方法:/ c r t s11-14.PPI-DEG/EXC & INT_LP_IP_Buffer产生原因:一般为DDF架上2M端子松动处理方法:插紧相应的2M端子,或者更换2M端子5.TU-AIS产生原因:一般为通道交叉连接不完整,或者Payload Manager故障引起。

处理方法:检查2M通道交叉连接的完整性,或有无远端线路AIS,有则先处理之。

或者将Payload Manager主备倒换,如告警清除时,则需更换Payload盘。

注意:Payload Manager主备倒换时业务会瞬间的中断,慎用。

6.INT-TU-AIS产生原因:可能是Payload Manager故障或者是支路板故障处理方法:倒换主备用Payload Manager,或者更换支路板7.SYNC-Src_Not_Primary & INT-SYNC-Trib_Line_Fail产生原因:TN-1X时钟分三级,第一级为提取线路时钟,第二级为外接时钟,第三级时钟为内部自由振荡,正常应提取线路时钟。

SDH常见告警及处理方法

SDH常见告警及处理方法

华为SDH故障1.1 R_LOS告警名称或故障现象:R_LOS告警表示接收线路侧信号丢失(Receive loss of signal),为紧急告警。

告警产生原因:1、断纤;2、线路衰耗过大;3、本板接收方向故障;4、对端站发送部分故障,线路发送失效;5、对端站交叉时钟板故障或不在位。

告警处理方法:1、现场用光功率计检测告警单板的接收光功率是否正常。

如果接收光功率正常,请转至步骤8。

2、检查光缆是否有故障,排除光缆故障后,查看告警是否排除。

3、清洁本站尾纤接头和线路板接收光口,查看告警是否排除。

4、检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。

正确使用法兰盘和光衰减器后,查看告警是否排除。

5、用光功率计检查对端站的发射光功率是否正常,如果发射光功率不正常,更换线路板。

6、如果发射光功率正常,清洁对端站的尾纤接头,查看告警是否排除。

7、检查对端站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。

正确使用法兰盘和光衰减器后,查看告警是否排除。

8、更换本站上报告警的线路板,查看告警是否排除。

9、更换对端站的线路板,查看告警是否排除。

1.2 R_LOF、R_OOF告警名称或故障现象:R_LOF告警表示接收线路侧帧丢失(Receive loss of frame),为紧急告警。

告警产生原因:1、接收信号衰减过大;2、对端站发送信号无帧结构;3、本板接收方向故障。

告警处理方法:1、在网管上查看是否有高级别的R_LOS告警,优先处理这些高级别告警后,查看告警是否排除。

2、检测告警单板的接收光功率是否正常。

如果接收光功率正常,请转至步骤9。

如果收光不正常,让现场定位衰耗点在机房内还是在线路上,如果在线路上,转至步骤8。

3、清洁本站尾纤接头和线路板接收光口,查看告警是否排除。

4、检查本站的法兰盘和光衰减器是否连接正确,光衰减器的衰减值是否过大。

正确使用法兰盘和光衰减器后,查看告警是否排除。

常见告警、性能及处理

常见告警、性能及处理

常见告警、性能及处理在我们日常使用各种设备和系统的过程中,经常会遇到各种各样的告警信息和性能问题。

这些问题如果不及时处理,可能会影响到我们的工作效率、甚至导致严重的后果。

下面,让我们来了解一些常见的告警、性能问题以及相应的处理方法。

首先,来说说网络方面的常见告警和性能问题。

网络连接中断是一个让人十分头疼的问题。

当我们突然无法访问网页、无法收发邮件或者与他人的在线交流中断时,很可能就是网络连接出现了故障。

这时候,我们首先要检查自己的网络设备,比如路由器、交换机等,看看指示灯是否正常。

如果指示灯显示异常,可能是设备出现了硬件故障,需要进行维修或更换。

另外,网络延迟过高也是常见的问题。

当我们在玩网络游戏或者进行视频通话时,如果出现卡顿、画面不流畅的情况,很可能就是网络延迟导致的。

造成网络延迟的原因可能是网络拥堵、服务器负载过高或者本地网络设置问题。

解决这个问题,可以尝试关闭其他占用网络带宽的程序,或者更换网络连接方式,比如从无线网络切换到有线网络。

还有一种常见的网络告警是 IP 冲突。

当多个设备被分配了相同的IP 地址时,就会出现这种情况。

这会导致网络连接不稳定,甚至无法正常上网。

解决方法是手动为每个设备设置不同的静态 IP 地址,或者通过路由器的 DHCP 功能自动分配 IP 地址。

接下来,我们谈谈计算机系统方面的常见告警和性能问题。

系统死机是很多人都遇到过的情况。

电脑突然停止响应,鼠标和键盘都无法操作,这可能是由于系统资源耗尽、软件冲突或者硬件故障引起的。

如果是系统资源耗尽,可以尝试关闭一些占用大量内存和 CPU 资源的程序。

如果是软件冲突,可以卸载最近安装的可疑软件。

如果是硬件故障,可能需要检查硬件设备是否正常工作,或者寻求专业的维修服务。

系统运行缓慢也是一个常见的问题。

当我们打开一个程序需要很长时间,或者在操作过程中经常出现卡顿,这可能是由于系统垃圾文件过多、硬盘空间不足、病毒感染等原因造成的。

linux系统内存告警处理方法

linux系统内存告警处理方法

linux系统内存告警处理方法【导语】Linux系统作为服务器和开发环境的主流操作系统,其稳定性和性能至关重要。

内存告警是系统管理中常见的问题,它可能会影响系统的正常运行。

下面将详细介绍几种处理Linux系统内存告警的方法。

### Linux系统内存告警处理方法#### 1.分析内存使用情况首先,您需要分析系统内存的使用情况,找出内存使用过高的原因。

- 使用`free -m`命令查看内存使用情况。

- 使用`top`命令查看内存占用最多的进程。

#### 2.关闭不必要的服务和进程检查是否有不必要的后台服务和进程在运行,关闭它们以释放内存。

- 使用`systemctl status`查看服务状态。

- 使用`kill`命令或`pkill`命令结束占用内存过高的进程。

#### 3.调整虚拟内存如果物理内存不足,可以尝试调整虚拟内存。

- 使用`vmstat`命令查看虚拟内存状态。

- 修改`/etc/sysctl.conf`文件,增加`vm.swappiness`的值,允许系统使用更多的交换空间。

#### 4.增加交换空间如果条件允许,增加交换空间(swap space)是解决内存不足的有效方法。

- 创建新的交换文件或分区。

- 使用`mkswap`和`swapon`命令启用新的交换空间。

#### 5.优化系统配置调整系统配置,优化内存使用。

- 修改`/etc/sysctl.conf`,调整内核参数,如`net.ipv4.tcp_fin_timeout`和`net.ipv4.tcp_max_tw_buckets`等。

- 更新内核,以获得更好的内存管理性能。

#### 6.定期清理缓存和临时文件定期清理系统缓存和临时文件。

- 使用`clear`命令清理缓存。

- 删除`/tmp`目录下的临时文件。

#### 7.监控和告警建立系统监控和告警机制,以便及时发现内存告警并处理。

- 使用如Nagios、Zabbix等监控工具。

传输设备常见告警解释及处理建议

传输设备常见告警解释及处理建议

传输设备常见告警解释及处理建议LianLv一、 LOS 告警:信号丢失1、正常情况下两个网元之间要通信,中间的信号流必须是畅通的,如下图;2、从上图可以看书信号从MSC 发出2M 信号,经过SDH 设备复用后传递给下一个设备,最后末端SDH 设备解复用出2M 信号给另一端的MSC 。

也就是说,产生信号源的设备是发出信号的设备,当相邻的设备收不到对端发出的信号时就会上报LOS 告警,即信号丢失;A 、上图中由于SDH2发出的光信号SDH1收不到所以SDH1的收光口会上报LOS 告警;B 、上图中MSC2发出的2M 信号由于2M 线中断导致SDH2的2M接口收不到信号,所以SDH2的2M 接口会上报LOS 告警;C 、 上图是MSC1收不到信号的情况;说明:在通信标准中信号丢失的告警名都为LOS,但是不同厂家在编写网管软件时其有所不同,比如:华为公司传输设备,光口收不到信号上报告警为R-LOS ,支路口(2M 口)收不到信号时报T-ALOS;二、 LOF 告警:帧丢失1、当收到的信号功率太大或太小时都会上报OOF 告警;2、是指可以收到信号,但是检测不到信号的开始位置。

一般在波分和SDH 相连时,由于中继段线路中断,造成SDH 设备收到的信号为非调制光。

四、 AIS 告警:全1指示告警举例:SDH2收不到BTS 发来的2M 信号,SDH2会上报LOS 告警,并下插“1”码,当BSC1收到的2M 信号为全要“1”的时候就会上报AIS 告警。

这个故障我们日常维护中经常碰到,如果基站发送处理的2M 信号在中间传输环节中中断,BSC 的dip 端口都会上报AIS 告警。

五、 RDI 告警:远端告警指示举例:当BTS 收到的2M 信号在传输途中中断,但是BSC 可以收到BTS 发送的信号,那么BTS 就会发送AIS 信号给BSC ,当BSC 收到AIS 信号时就会上报RDI ,即远端告警指示说明故障点在BTS 端。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
诺基亚LTE基站常见告警处理方 法
张小通 2016.02.18
诺基亚LTE基站告警组成
ALARM_NUMBER ALARM_TEXT SPECIFIC_FAULT GROUP_FAULT SUPPLEMENTARY_INFO 7652 BASE STATION NOTIFICATION 4122 4122 GPS Receiver alarm: Not Tracking Satellites 7651 BASE STATION OPERATION 1898 DEGRADED 3080 BTS reference clock missing DIAGNOSTIC_INFO 100 100 100 4122FYGA 1 0 path=N/A additionalFaultId:4122; 100 1 100 1898FSMF 1 16 path=N/A additionalFaultId:3080;
SPECIFIC_FAULT GROUP_FAULT SUPPLEMENTARY_INFO 10 3030 shared:N;Failure in optical RP3 interface 4064 3030 shared:N;Failure in optical RP3 interface
1 0 path=N/A additionalFaultId:3030; 4 0 path=N/A additionalFaultId:3030;
RF MODULE RRU
DL Opt2-R UL
诺基亚LTE基站RP3告警可能的故障 点
BBU和RRU直连光链路的速率不匹配 D-Bus线 SFP问题(光纤两端SFP不匹配,超过SFP支持的长度,坏了) 光纤问题(长度不匹配,断面不干净,有伤痕衰耗大) BBU问题(包括FSMF和FBBC) RRU问题
RP3告警详细fault分类:Missing RP3-01 link
告警名称:光接口RP3辅光口故障
4064
Hale Waihona Puke 原因分析:出现 4064 告警,多数是因为光模块或光纤问题导致,表现为辅光路 state 为 idle 或者 off, 说明辅光路没有 同步。可能原因是RRU、BBU、光纤故障,也可能光模块型号不匹配。 判断方法: 1,如果有光功率计,用光功率计测试收光,如果收光很低,比如到了-15db或者更低,表示对端发光有问题。 2,在BBU侧将故障光口和正常光口对调,如果从sitemanager看到故障依旧,表示故障在BBU侧,可更换光模块,如 果光模块更换无效,需要更换BBU;如果sitemanager看到故障端口转到了更换前的正常光口,表示故障在光纤或者 RRU,需要参照第二步,判断是RRU或者光纤故障。 3,判断RRU或者光纤问题,可以在RRU侧将故障光路和正常光路对调,从sitemanager看,如果故障口对调了,表示 RRU的源故障光路对应的RRU光口故障;如果从sitemanager看到故障端口保持不变,判断为光纤故障。 处理方法: 1,远程掉电重启基站,如果无效需上站排障。 2,上站处理时,根据判断方法判断的故障点进行处理。尝试拔插光纤,更换光模块或者更换光纤,少数BBU及RRU 端口损坏需更换硬件,链路的BBU侧和RRU侧所用光模块型号不匹配需要统一光模块型号。
呈现的告警号为76533030(告警号+组故障ID) 76533030(告警号+组故障ID) 详细故障ID 组故障ID
诺基亚LTE基站主要告警编号
基站告警 • 7650(BASE STATION FAULTY) • 7651(BASE STATION OPERATION DEGRADED) • 7652(BASE STATION NOTIFICATION) 小区告警 • 7653(CELL FAULTY) • 7654(CELL OPERATION DEGRADED) • 7655(CELL NOTIFICATION) 基站S1断链告警 • 7656(BASE STATION CONNECTIVITY LOST) • 7657(BASE STATION CONNECTIVITY DEGRADED) 基站管理面断链告警 • 71058(NE O&M CONNECTION FAILURE)
呈现的告警号为76524122(告警号+组故障ID) 76513080(告警号+组故障ID)
详细故障ID
DIAGNOSTIC_INFO 100 11 1 0010FXEB 100 14 1 4064FXEB
组故障ID
ALARM_NUMBER ALARM_TEXT 7653 CELL FAULTY 7653 CELL FAULTY
诺基亚LTE基站常见告警分类
• RP3告警 • GPS告警 • 驻波告警 • 传输告警 • 风扇告警 • 网管断链告警 • 射频模块告警
诺基亚LTE基站RP3接口示意 图
DL
Opt1-S UL
DL
UL Opt1是主光路 Opt2是辅光路
Opt1-R
SYSTEM MODULE BBU
DL Opt2-S UL
诺基亚LTE基站组故障ID编号
Fault编号 3000 3003 3010 3012 3020 3030 3040 3050 3060 3070 3080 3090 3100 3120 3511 Fault_Name System Module failure Failure in replaceable baseband unit RF Module failure Failure In Optical Interface <optIf ID> Baseband Bus failure Failure in optical RP3 interface Temperature alarm Fan failure Commissioning error: <x> Configuration error: <x> BTS reference clock missing BTS internal SW management problem Antenna Line Device failure Mast Head Amplifier fault No connection to Flexi transport submodule Fault解释 系统模块错误 基带模块错误 射频模块错误 光接口错误 基带总线错误 RP3光口错误 温度告警 风扇错误 开通错误 配置错误 参考时钟丢失 基站内部软件管理问题 天线设备错误 塔防错误 传输子模块无连接
相关文档
最新文档