诺西TD-NodeB相关告警处理方法总结

诺西TD-NodeB相关告警处理方法总结
诺西TD-NodeB相关告警处理方法总结

所有小区退服

小区被闭塞

RNC上执行DSP CELL查看该小区状态

小区配置数量不一致

1. 该站点NODEB侧和RNC侧小区配置数量

不一致,导致小区退服;

2. NODEB侧无相关告警;

3. 导致RNC侧看到有小区未建立。

E1/T1告警指示信号传输的物理层有问题

E1/T1 远端告警传输的物理层有问题

E1/T1信号丢失告警传输的物理层有问题

E1/T1线路AIS告警传输的物理层有问题

E1/T1帧失步告警传输的物理层有问题

E1/T1环回故障传输的物理层有问题

E1/T1高误码率门限告警传输的物理层有问题

E1/T1高误码率告警传输的物理层有问题

IMA组配置失败告警传输的链路层有问题

IMA/UNI链路信元定界丢

失告警

传输链路层有问题

IMA链路帧失步告警传输链路层有问题

IMA链路延迟失步传输链路层有问题

IMA组内激活链路数不足

告警

传输链路层有问题

IMA链路信元定界失步故

传输链路层有问题

IMA链路远端接收不可用

告警

传输链路层有问题

FE接口故障

FE口没有接网线或FE口故障所致,对使用

ATM传输的基站不会有影响

BOOTP启动告警

传输数据未配置或配置有误所致,OMCH不

可用

DHCP启动告警

传输数据未配置或配置有误所致,OMCH不

可用

传输配置数据失效告警配置的传输数据无法生效

CCP故障CCP不可用

SAAL链路断承载在其上的业务传输会有问题

AAL2邻节点不可达

邻结点不可用,建立在其上的业务传输会有

问题

PATH故障建立在其上的业务的传输会出问题

邻节点无可用资源

邻结点不可用,建立在其上的业务传输有问

BBI下行光口断链

CPRI闪断故障

1. 该告警提示用服人员BBI上的某个光口有

光路故障;

2. 当光路故障恢复后,该告警自动清除。

传输告警

RRU 下行光口断链

1. 该告警提示用服人员RRU 上检测到下一级RRU 光路有故障;

2. 当光路故障恢复后,该告警自动清除。

RRU 配置但不可用超时

1. BBU 启动后,会对RRU 进行配置不可用检测;

2. 当RRU 可用后,该检测停止;如果RRU 在配置1小时后,仍然不可用,则上报RRU 配置但不可用超时告警;

3. 当RRU 启动并可用后,该告警自动清除。RRU 心跳检测失败告警

1. RRU 启动并可用后,BBU 会对RRU 进行3秒一次的心跳检测;

2. 如果连续10次BBU 侧收不到RRU 回复,则会上报RRU 心跳检测失败告警,并将RRU 置为不可用,同时停止心跳检测消息的发送;

3. 当RRU 复位启动并再次可用后,该告警自动清除。

上行通道告警

下行通道告警

上行无可用校准通道告警

下行无可用校准通道告警

发射/接收通道天线通道幅相一致性告警

下行输出欠/过功率告警

RRU 离线不可用

RRU PATH 不可用

下行驻波比告警

TX 功率异常RX 功率异常

TX 的功率超出门限值RX 的功率超出门限值所有校准path 不可用驻波比异常/驻波比异常(RRU268)

GPS 状态故障GPS 状态告警

1. 当GPS 硬件出现问题,产生该告警,可能安装在7槽或5槽,需要GPS 天线,详细参数说明如下:0:星卡不存在1:星卡天线短路2:星卡天线开路3:星卡自检失败4:串口通讯异常5:星卡正常

2. NODEB 侧执行DSP GPS ,看到GPS 操作态为不可用,从而导致小区无法建立。

DSP 初始化超时DSP 加载问题

DSP 响应超时DSP 的心跳检测失败问题

不可用

DSP 不可用

BBI心跳检测失败BBP心跳检测失败1. BBI/BBP启动并可用后,MPTA会对

BBI/BBP进行3秒一次的心跳检测;

2. 如果连续10次MPTA收不到BBI/BBP回复,则会上报BBI/BBP心跳检测失败告警,并将BBI/BBP置为不可用,同时停止心跳检测消息的发送;

3. 当BBI/BBP复位启动并再次可用后,该告警自动清除。

BBI配置但不在位超时BBP配置但不在位超时1. BBI/BBP配置后,MPTA会对BBI/BBP进行配置不在位超时检测,如果该BBI/BBP已配置但不在位超过30秒,则上报BBI/BBP配置但不在位超时告警;

2. 当该BBI/BBP板接入后,该告警会自动清除。

Q922通路检测失败1. MPTA与外围单板会进行Q922链路检测,如果发现该链路中断,MPTA会上报Q922通路检测失败告警;

2. 如果检测到Q922链路恢复正常,该告警会自动清除。

公共信道故障导致小区不可用公共信道故障导致小区不

可用

公共信道故障,导致小区不可用

RRU可用,但PORT不可用

1. NODEB侧执行DSP RRU,看到RRU操作

态可用;执行DSP PORT发现PORT不可

用;

2. NODEB侧无其它相关告警。

时钟源状态告警

(GPS)

时钟源状态告警

(1588)

当时钟源出现问题时,产生该告警,此时的

时钟源可能是GPS,也可能是1588,通过告

警ID区分,详细参数说明如下:

0:正常

1:丢失

2:不可用

3:大频偏

4:抖动

5:未知

单板不可用

时钟锁相环状态次要告警

1. 软件锁相环PLL 由锁定变为保持时,产生该告警;

2. 该告警与当前的时钟源状态密切相关,不会影响业务,但需要注意,超过一定时间没有恢复会产生时钟锁相环状态严重告警;

3. 详细参数的说明:0:自由震荡1:快捕状态2:锁定状态3:保持状态时钟锁相环状态严重告警1. 软件锁相环PLL 由保持变为自由震荡或是快捕时,产生该告警,小区会被删除;2. 详细参数的说明:

0:自由震荡

1:快捕状态2:锁定状态3:保持状态

IPCLK 状态告警

1. 当IPClK 的链路出现问题时,会产生该告警,错误原因是链路不可用;

2. 告警的详细参数说明如下:0:链路01:链路1

没有时钟源告警

1. 当NODEB 没有配置任何可用的时钟源时(从有到无的过程),会产生该告警,无告警详细参数。其它常见RRU 告警

电源故障告警RRU 电源问题

光口信号丢失

上行支路单元告警指示信号

光口再生段追踪符失配告警

低阶通道信号标记失配上行支路单元指针丢失低阶通道未装载F5 CC 激活失败告警

光口参考时钟失锁告警指示信号告警

光口接收数据失锁告警指示信号

其它时钟源相关问题

RNC 其它常见告警(与NODEB 无直接关系)

服,需要检查该基站的其它告警信息

1. 如果该小区被闭塞,需要解闭塞该小区该操作是解决小区退服类

问题的前提,以免外场人

员的无谓排查

1. 如果查明两边小区配置数量不一致,需要确认配置脚

本的问题,可以和当地用服联系解决该问题。

一般是E1链路不通导致,工程上先排查E1

一般是E1链路不通导致,工程上先排查E1

一般是E1链路不通导致,工程上先排查E1

一般是E1链路不通导致,工程上先排查E1

一般是E1链路不通导致,工程上先排查E1

由于E1做环路导致,去环即可

一般是E1链路不通导致,工程上先排查E1

一般是E1链路不通导致,工程上先排查E1

检查IMA配置或者重启MPTA

1. 一般由E1引起,E1链路恢复,该告警即可恢复;

2. 如果不行,再RNC侧执行RST IMAGRP把IMA组弄好

1. 一般由E1引起,E1链路恢复,该告警即可恢复;

2. 如果不行,再RNC侧执行RST IMAGRP把IMA组弄好

1. 一般由E1引起,E1链路恢复,该告警即可恢复;

2. 如果不行,再RNC侧执行RST IMAGRP把IMA组弄好

一般是E1链路不通导致,工程上先排查E1

一般是E1链路不通导致,工程上先排查E1

一般是E1链路不通导致,工程上先排查E1

LCR4.0版本的问题,FE0没有接网线,无影响的告警,

可以手动清除掉

盲起起来但不成功,需要检查传输线路

盲起起来但不成功,需要检查传输线路

可能是盲起起来了,重启MPTA即可

传输的传递告警,一般是因为IMA组不可用导致的,参考

IMA不可用的处理方法

1. 这几个告警均为传输的传递告警,一般是因为IMA组不

可用导致的,参考IMA不可用的处理方法:看看是否同时

有E1的告警,如果有E1告警,需要工程上先把E1弄好;

2. 如果没有E1告警,只有IMA的告警,可能有E1做自环

了,需要上站排除自环的E1;也可能是盲起过程起来

了,但是盲起没有成功(这个需要等待半个小时确认);

3. 可以尝试在RNC上执行RST IMAGRP复位一下IMA

组,如果还不行,需要上站定位。

1. 如果出现上述两个告警,则需要根据告警指示的光口

号,先检查光纤连接的稳定性,包括是否有持续的该告警

、是否有闪断的该告警,都说明该站点某光路稳定性不

够,需要工程上排查;

2. 排查时,可以通过调换光模块或者光纤的方法进行。

1. 如果出现RRU 下行光口断链告警,则需要先检查该RRU 下行光纤的连接,以及下一级RRU 光纤的连接,包括是否有持续的该告警、是否有闪断的该告警,都说明该光路稳定性不够,需要工程上排查;

2. 排查时,可以通过调换光模块或者光纤的方法进行。1. 如果没有光口断链告警,则需要工程上排查一下该RRU 的版本和升级状态,尤其是在该站点升级前后的时期;

2. 如果远程已无法操作RRU ,则需要尝试上站掉电复位该RRU ,使RRU 重新启动;

3. 如果掉电复位不起作用,则需要近端连接串口线查看该RRU 的运行状态,并返回研发分析;

4. 如果站点RRU 无法近端连接串口,则需要暂时更换1. 如果没有光口断链告警,则需要工程上排查一下该RRU 的版本和升级状态,尤其是在该站点升级前后的时期;

2. 如果远程已无法操作RRU ,则需要尝试上站掉电复位该RRU ,使RRU 重新启动;

3. 如果掉电复位不起作用,则需要近端连接串口线查看该RRU 的运行状态,并返回研发分析;

4. 如果站点RRU 无法近端连接串口,则需要暂时更换1. 该告警的可能原因主要有: 1)频率上存在干扰 2)天线接头问题 3)RRU 硬件问题

2. 首先需要从工程上按照上面其它PATH 告警的排查方法,查看是否有校准值在门限附近。如果有,则很容易受到频率和温湿度的影响,而产生该告警。

3. 如果排除了工程问题和干扰问题,则需要更换RRU 解决。

RRU 幅相一致性告警与通道告警的关系:

1. 如果某个PATH 上的所有载波校准不通过,则会上报上行/下行通道告警;

2. 如果某个PATH 上部分载波校准不通过,则会上报发射/接收通道天线通道幅相一致性告警

1. 该告警为功率状况的提示告警,不会对PATH 状态和小区建立有任何影响;

2. 由于功率上限值较大,所以一般情况下,该告警都是欠功率告警,此时可以考虑提高PCCPCH 值来解决。

1. 引起这些告警的原因,大部分是由于RRU 到天线之间的连线引起的,需要工程上排查;

2. 建议在接收和验收新替换站时,在NODEB 侧执行RST RRU ,选择本RRU 复位,1~2分钟后,用MML 命令DSP RRU 看一下初始化的校准结果:

1)回环RX 结果的值,应该在60左右,门限

(56~6A ),回环TX 结果的值,应该在8A 左右,门限(80~94),如果相差较大或者在门限附近,就有产生告警的风险;

2)如果验收时发现回环结果在门限的临界值(回环RX 结果在56-59/67-6A ,回环TX 结果在80-83/91-94),建议将出现告警的PATH 与未出告警的PATH 互换连接线,定位是RRU 硬件问题还是连接问题;

3)根据检查结果重新检查连线,或者更换新的连线,RRU 通道告警检测机制:1. RRU268在室外覆盖的场景下需要进行校准,并且268的PATH 1, 2, 5为校准PATH ;

2. 如果PATH 1, 2, 5中的任意两个PATH 上报上行/下行通道告警,则这两个PATH 会被置为不可用。这时,RRU 检测到校准PATH 不足2个,则会上报上行/下行无可用校准通道告警。

1. 如果原来驻波比已经没问题的,只是告警还存在,导致小区无法建立,可以进行手动清除,预期小区可以正常建立,同时需要再清除该小区的退服等告警,系统不会自动清除。

2. 如果原来驻波比还是存在问题的,手动清除该告警后,小区仍然无法建立,则需要复位RRU,使RRU重新检测驻波比。如果仍然告警,则需要工程人员检查RRU,此时就不需要再清除此告警;如果复位后没有此问题,则小区建立正常,告警也不会再上报。

3. 无论清除还是复位RRU,如果基站几天里反复报次告警,那么就不需要手动清除,则需要工程人员上站检查RRU。RRU驻波比检测机制:1. RRU261:启动时检测,并且启动后,如果配置的PCCPCH>30dBm,则在运行过程中进行轮询检测;

2. RRU268:只在启动时检测一次。

这几个告警为LCR4.0 RRU PATH告警,处理方法与上述RRU告警处理方法相同。

1. 该站点的GPS天线存在工程问题,需要上站排查,包括天线角度、连接线等;

2. 该告警可能原因:

1)天线没有接好

2)天线长度过长导致1pps信号非常弱

3)星卡在主控板上没有扣紧

1. 如果出现DSP初始化超时或者DSP响应超时告警,DSP都会自动复位,并重新加载;在NODEB侧连续多次执行DSP DSP,如果DSP操作状态变为可用,并且一直可用,则说明DSP重新加载成功,载波小区建立成功;

2. 如果连续多次执行DSP DSP后,发现DSP在可用与不可用间切换,而相应单板始终可用,则说明相关载波在反复尝试重建,DSP也会反复尝试加载。如果出现这种情况:

1)在NODEB侧反复执行DSP DSP,并查看DSP操作态;

2)在NODEB侧执行DSP RRU, DSP BRD, DSP PORT, DSP CARRIER, DSP LOCELL等,查看该NODEB侧相关单板和资源状态,并保存MML执行结果; 3)在TPCWIN上获取MPTA和故障DSP所在的

BBI/BBP的LOG(最好能够近端采集,以避免丢失消息);

4)跟踪RNC侧IUB口消息并保存。

上述LOG的采集,需要等待至少一个完整的载波建立流程,也可以持续抓取LOG 3分钟,并返回给研发分析。

对于该问题,在成功获取LOG后,可以通过执行RST BRD,复位故障DSP所在单板进行规避。

1. 如果仅有BBI/BBP配置不在位告警,则是因为配置了BBI/BBP板,但是实际基站上没有接入相应单板导致的;

2. 如果仅有心跳检测失败告警,则需要:

1)用一键上传功能提取日志信息,并返回研发分析; 2)在提取完日志信息后,在NODEB侧执行RST BRDPWROFF,进行故障单板掉电复位;

3)如果该单板仍然不能启动成功,则需要上站复位该单板;

4)如果该单板经常性出现此类问题,则需要更换该单板。

1. 如果出现该告警,并且长期保持,首先需要查看该单板是否接入在BBU上,配合BBI/BBP配置但不在位超时告警,可以查明这点;

2. 如果确认该单板已经接入,则说明MPTA与外围单板间Q922链路出现故障,需要执行RST BRDPWROFF,对该单板进行掉电复位;

3. 如果仍然无法解决,则需要上站查看;

4. 该问题出现概率极低,如果出现,请当地用服人员用一键上传功能,上传NODEB上所有日志和黑匣子信息,并返回研发处理。

1. 首先确认该站点不存在上述导致小区退服的原因;

2. 跟踪IUB口消息,查看公传建立流程,并保存该LOG;

3. 上传该NODEB站点的调试日志,也可以直接用一键上传命令,上传所有NODEB日志信息,并返回给NODEB 研发同事分析;

4. 在获取上述信息后,可以在RNC侧通过去激活—激活小区的操作,使公传再次建立成功;

5. 如果仍然有问题,请直接联系NODEB研发同事。

1. 如果有这种情况发生,可以通过执行RST RRU,使RRU复位,待RRU启动成功后,查看PORT状态,如果仍然不可用,则需要抓取MPTA和相关RRU的TPCWIN LOG,并返回研发分析。

1. 该告警的可能原因:

GPS:

1)搜星数目不足

2)1pps故障

1588v2:

1)时间戳不正确

2)建链不成功

1. 该告警是由于当前时钟源出现故障;

2. 需要检查时钟源状态。

1. 该告警是由于时钟锁相环处于保持状态超过了设定的时间;

2. 在LCR4.0.0版本中,锁相环的保持时间为43200s,可以通过执行MML:MOD SYNCNODEB设置,范围在(3600s~172800s);在LCR4.0.1的版本中,锁相环的保持时间为86400s,不可以设置。该告警会导致载波资源不可用;

3. 需要检查时钟源状态。

1. 该告警的可能原因:链路的配置错误,或是光纤、网线接触不好;

2. 需要检查:

1)物理连接是否正常;

2)相应的光口或电口使用UP,同时与SERVER能否PING通;

3)SERVER是否已经处于锁定状态。

1. 该告警的可能原因:删除时钟源后,且基站没有配置任何时钟源;

2. 执行MML:LST CLKSRC检查时钟源配置。

排查RRU的电源

1. 这几个告警均为RNC侧告警,与NODEB运行无直接关系;

2. 如果出现,建议联系RNC同事以获取解决方法。

相关文档
最新文档