LTEFDD常见告警处理指导

LTEFDD常见告警处理指导
LTEFDD常见告警处理指导

LTE-FDD 常见告警处理指导 SCTP 偶联断 告警原因 1. 本端或对端偶联参数配置错误; 2. 传输链路故障。 处理措施 1. 在告警管理系统中, 检查告警详细信息中的附加文本字段, 查看 SCTP 偶联 号; 2. 在动态管理系统中,运行“查询 SCTP ”命令,根据 SCTP 偶联号查询对应 偶联的运行状态,确认 SCTP 偶联已断; 3. 在配置管理系统中,检查 SCTP 偶联参数配置,确保 SCTP 偶联的远端地 址、远端端口号与对端的本端地址、本端端口号一致; 4. 在诊断测试系统中,进入 [IP 通道测试 ]界面,然后在『目的 IP 』中输入对端 IP 地址(即 eNodeB 的远端地址) ,进行 ping 测试,判断本端( eNodeB ) 到对端( MME/SGW/ 邻接 eNodeB )的传输地址是否可达; 5. 在配置管理系统中,排查基站至对端的静态路由是否配置正确,包括:目的 IP 地址、下一跳 IP 地址等; 6. 在配置管理系统中, 排查 SCTP 链路所在的 IP 层参数是否配置正确, 包括: VLAN ID 、 IP 地址、网关 IP 等参数; 7. 如果上述配置数据不正确,修改参数,同步配置数据到基站。检查告警是否 清除,如果告警仍未消除,联系传输人员排查传输链路问题; S1 断链告警 告警原因 1.SCTP 偶联断。 2.S1AP 建立失败(协商失败或基站无小区)。 处理措施 1. 检查告警详细信息中的附加文本字段,是否 SCTP 偶联断,如果是,参照 “ SCTP 偶联断”告警的处理措施进行排查; 2. 检查告警详细信息中的附加文本字段, 是否 S1AP 建立失败。如果是,在配 置管理系统中检查基站是否配置小区, S1 配置参数是否有效; (1)检查 MCC 、MNC 是否配置正确,必须按照运营商提供的数据规划 来配置 MCC 、MNC ,由于 EPC 可能同时和不同 E-UTRAN 系统 对接,因此 eNodeB 侧配置的 MCC 、 MNC 必须在 EPC 侧也配置 了,否则会导致 S1AP 层信令交互失败、 S1 断链(此时 SCTP 链 路是通的); ( 2)检查 TAC 是否配置正确;并与核心网侧人员确认 EPC 是否已相应 配置了基站的 TAC 参数。若 eNodeB 侧和 EPC 侧配置的 TAC 参 数不一致,则会导致 S1 断链; ( 3)检查 eNodeB 标识( eNBID )是否配置正确,若整网存在 eNodeB 标识( eNBID )冲突的情况,则会导致 S1 链路闪断; ( 4)联系核心网侧人员检查 EPC 是否对接入的最大 eNodeB 数量做了限 制。

1.1

1.1.1

1.1.2

1.2

1.2.1

1.2.2

EPC 侧有个参数『全局最大动态eNodeB 数』,它为EPC 侧规划参

数,默认值不同版本而不同,需要根据网络规模合理规划和配置。该参

数控制能够和其对接的最大eNodeB 的数量;如果当前和EPC 对接成

功的(S1 链路正常)的eNodeB 数量已经达到该参数设置值,那么新

增eNodeB 是不能和EPC 建立SCTP 链路并成功对接的。

3. 如果上述配置数据不正确,修改参数,同步配置数据到基站。

1.3 X2 断链告警

1.3.1 告警原因

1.SCTP 偶联断。

2. X2 AP 建立失败(协商失败或基站无小区)。

1.3.2 处理措施

1. 检查告警详细信息中的附加文本字

段,是否SCTP 偶联断,如果是,参照

“ SCTP 偶联断”告警的处理措施进行排查。

2. 检查告警详细信息中的附加文本字段,是否X2 AP 建立失败。如果是,在

配置管理系统中检查基站是否配置小区,X2 配置参数是否有效。

(1)对于我司基站,可直接在统一网管中检查邻接eNodeB 是否配置了

至本端的X2 SCTP ;

(2)对于异厂家基站,需要联系异厂家人员检查是否配置了至我司基站的X2

SCTP 。

3. 如果配置数据不正确,修改参数,同步配置数据到基站。

1.4 小区退出服务

1.4.1 告警原因

1. 小区被关断。

2.S1 链路故障。

3. 小区所使用的主控板、基带板或RRU 故障。

4. 小区配置失败。

5. 时钟失锁。

1.4.2 处理措施

1. 进入动态管理,查询小区状态。

2. 查询运行版本是否正确,必要情况下和其他运行正常的基站进行版本对比。

3. 查告警详细信息中的附加文本字段是否为“小区关断”。

4. 查询S1 链路状态,如果S1 链路断,先根据S1 链路断故障排查指导进行排

查,解决S1 链路断的问题。

5. 查看告警管理中告警监控是否有时钟失锁相关告警。

6. 在告警管理中告警监控中检查小区所使用的主控板、基带板、RRU 是否有

告警。

7. 在配置管理中检查小区参数配置。确保小区参数配置正确,并同步配置数据到

eNodeB 。

基站退出服务 告警原因 基站无可用 LTE 小区。 LTE 小区发生故障或被关断。 处理措施 1. 在动态管理中检查是否有小区被关断。 如果有,在动态管理中手动解除小区关断,观察是否有小区能恢复为可用 小区,如果有,检查告警是否消除。 2. 排查故障小区。参考“小区退出服务”的处理建议进行处理,观察小区是否 能恢复为可用小区,检查告警是否清除。网元断链告警 网元断链告警 告警原因 1. 网元到网管的通信链路断 2. 配置数据错误 3. 网管自身故障 4. 基站自身状态不正常 处理措施 1. 首先检查和网管断链基站的范围,是个别基站还是大量基站。 如果是大量基站, 则重点检查网管自身运行情况, 包括排查网管常见功能 模块是否运行正常 (告警界面能否打开、 配置管理界面能否打开和查看配置数 据、版本管理界面是否正常等) ,检查 CPU/ 内存 /硬盘等使用情况, 使用 Ping 检查网管到网关通信是否正常。 2. 检查 OMC 服务器与网元连接是否正常。 在配置管理界面中查到对应的网元 地址,从 OMC 服务器检查是否能 ping 通该网元 如果能 ping 通,需要检查网管运行情况; 如果不能 ping 通,逐级 ping 基 站的网关、网管的网关等中间节点的设备,如果能 ping 通中间节点的设备, 则说明基站到相应设备传输有问题,或者网元自身运行有问题。 3. 检查配置等相关数据。 ( 1)在配置界面上查看该网元的相关状态;如果运维状态处于 "未开通 ", 请改为 "开通"状态;如果割接状态处于 "割接中",请改为 "正常"状态; 如果该步骤无效,则进行第二步 (2)进入动态管理界面, 进行 "查询链路状态 "或"查询人工断链状态 "操作; 如果链路处于人工断链状态,请进行 "人工断链恢复 "。 (3)检查网元管理IP 、基站IP 层数据、OMC 通道数据等数据是否正确。 4. 到站点用 LMT 检查基站的运行情况,包括版本是否正确、传输配置是否正 确。在 LMT 上使用 Ping 命令检查到网关 /网管的通信情况。 软件运行异常 告警原因 1. 单板软件运行异常: 单板软件未正常运行, 无法正常上报心跳到主控主板。 2. 产品进程运行异常: 产品进程得不到及时调度, 或单板产品进程未正常运 行,无法正常上报心跳到管理进程。 3. 子单元软件运行异常: 单板子单元和主控单元之间通讯链路断, 或单板子 单元软件未正常运行,无法正常上报心跳到主控单元。 1.7.2

处理措施 1. 查看告警附加文本,确认故障详细信息及位置,根据具体描述进行处理。

1.5

1.5.1

1.5.2

1.6

1.6.1

1.6.2

1.7

1.7.1

2. 单板软件运行异常:

(1)查看基站告警,检查单板是否存在硬件类型和配置不一致告警,如有则先处

理,否则执行下一步。

(2)查看基站告警,检查单板是否存在参数配置错误告警,如有则先处理,否则

执行下一步。

(3)复位单板,如果告警恢复则结束处理,否则执行下一步。

(4)硬复位单板,如果告警恢复则结束处理,否则执行下一步;

(5)寻求更高一级的设备维护支持。

3. 产品进程运行异常:复位对应产品进程

4. 子单元软件运行异常:复位告警对应单板单板。

5. 查看告警是否消除,如果告警消除,结束告警处理,否则寻求更高一级的设备维

护支持。

1.8 单板电源关断

1.8.1 告警原因

1. 单板过温;

2. 单板过流;

3.OMC 发起关断;

4. 软件异常关电。

1.8.2 处理措施

1. 查看告警附加文本,确定单板电源关断原因,根据关断原因分别处理。

2. 管理电源过流、业务电源过流:

(1)插拔单板,如果告警恢复则结束处理,否则执行下一步;(2)将单板改配

到其它槽位,等待 5 分钟,若不再上报告警,则结束处

理,否则执行下一步;

(3)更换单板,若告警恢复则结束处理,否则寻求更高一级的设备维护支持。

3. 过温关断:

(1)检查是否存在风扇故障告警,如有则先处理,否则执行下一步;

(2)检查外围环境,如空调是否工作正常、是否有大功率发热设备等,外围环境

恢复后,等待10 分钟,如果告警恢复则结束处理,否则执行下一步;

(3)检查设备的进风口以及防尘网是否被堵,去除堵塞物或者清洗防尘网,等待

10 分钟,如果告警恢复则结束处理,否则寻求更高一级的设备维护支

持;

4. 人工关断:在动态管理中打开对应单板电源。

5. 智能下电:

节能下电,无需处理。

6. 其它:

插拔单板。

1.9 单板通讯链路断

1.9.1 告警原因

单板与主控板之间的链路连接故障。

1.9.2 处理措施

1. 拔插单板,如果告警恢复则结束处理,否则执行下一步;

2. 更换槽位(需要在对应槽位做好该单板配置数据),如果恢复则原槽位有故障;

3. 更换单板。

1.10 单板温度异常告警

1.10.1 告警原因

单板温度过高或过低,超过告警门限。

1.10.2 处理措施

1. 检查插箱风扇是否正常工作;

2. 检查防尘网是否堵塞;

3. 检查环境温度是否正常。

1.11 进风口温度异常

1.11.1 告警原因

1. 过高:

(1)进风口或者防尘网堵塞;

(2)外围环境温度过高;

(3)温度告警门限设置不合理。

2. 过低:

(1)外围环境温度过低;

(2)温度告警门限设置不合理。

1.11.2 处理措施

1. 在配置管理中将温度告警门限恢复为默认值,并同步配置数据到网元,等待

5 分钟,告警恢复则结束处理,否则查看告警附加文本,如果是温度过高,转

步骤 2 ,如果温度过低,转步骤4

2. 检查外围环境,如空调是否正常工作、热交换器是否故障、是否有大功率发热设

备等,外围环境恢复后,等待10 分钟,如果告警恢复则结束处理,否则执行下

一步。

3. 检查设备的进风口以及防尘网是否堵塞,去除堵塞物或者清洗防尘网,等待

10 分钟,如果告警恢复则结束处理,否则请寻求更高一级的设备维护支持。

4. 检查外围环境,如空调是否正常工作,加热器是否故障等,外围环境恢复后,

等待10 分钟,如果告警恢复则结束处理,否则寻求更高一级的设备维护支持。

1.12 RRU 链路断

1.1

2.1 告警原因

1. RRU 运行异常;

2. RRU 与主控板之间的通讯链路故障。

1.1

2.2 处理措施

1. 检查是否存在“光口未接收到光信号”、“光模块接收功率异常”、“光口接收

帧失锁”告警,如有则依据对应处理指导处理,否则执行下一步;

2. 检查是否存在“版本包故障”告警,如有则先处理,否则执行下一步;

(1)进入“软件版本管理”,查询对应站点运行版本,判断运行不正确的版本

包。

(2)在“升级任务管理”中新建升级任务,对运行异常的版本进行以下单个或组

合处理:下载:备用包无或者不正确。预激活:目标版本非激活状态。

激活生效:通过复位单板将激活状态的版本转化成运行版本。

3. 检查RRU 是否存在“硬件类型和配置不一致”告警,如有则先处理,否则执行下

一步;

(3)若不符删除重新添加正确的类型,查看实物的铭牌识别

(4)修改正确后,在配置管理中进行数据同步。

4. 检查RRU 是否存在“参数配置错误”告警,如有则先处理,否则执行下一步;

(1)配置管理中重点检查“光口速率”和“光模块协议类型”,“光口速率”同

RRU 的硬件类型、实际使用光模块支持的速率、MIMO 模式相关联,需

要根据实际情况配置正确数值;对于FDD LTE ,光模块协议类型使用

“PHY CPRI ”,对于TDD LTE ,光模块协议类型使用“ PHY LTE

IR ”。

5. 复位RRU ,如果告警恢复则结束处理,否则执行下一步;

(1)打开动态管理,选择对应站点。

(1)对相应RRU 进行复位。

6. 硬复位RRU ,如果告警恢复则结束处理,否则执行下一步。

7. 复位与该RRU 连接的上级单板或RRU ,如果告警恢复则结束处理,否则执行

下一步。

8. 寻求更高一级的设备维护支持。

1.13 光口未接收到光信号

1.13.1 告警原因

1. 光纤/电缆损坏;

2. 本端或对端光/电模块或光纤/电缆没插好;

3. 本端或对端设备的光/电模块损坏。

1.13.2 处理措施

1. 确保对端设备工作正常,如果告警恢复则结束处理,否则执行下一步;

(1)确保RRU 已正常上电。

(2)BPL/FS 至RRU 的光纤收发连接正确。

(3)对于RRU 拉远场景,首先要在RRU 侧用光功率计测试BPL/FS 至RRU

的发射光通道的光信号强度,若强度在-2dBm~-10dBm 之间,连接到

RRU 后,再在BBU 侧测试RRU 至BPL/FS 的发射光通道的光信号强

度是否正常。

2. 确保光纤长度没有超过光模块支持

的最大距离(在诊断测试中诊断光模块支

持的最大距离),如果告警恢复则结束处理,否则执行下一步;

(1)右键打开诊断测试,点击组合测试按钮,在相应BPL/FS 中勾选光/

点模块诊断。

(2)在测试结果中可以看到BPL/FS 对应光模块支持的最大传输距离以及光模

块接受和发射的光功率强度,强度的正常范围一般为-2~-10dBm 。

(3)了解工程上实际的光纤长度,若超过光模块支持的传输距离,要求

3. 确保光纤/电缆插好;检查光纤/电缆插头端面是否有污染,若有则清洁光纤/

电缆插头。如果告警复则结束处理,否则执行下一步;

4. 排查光纤故障,如果告警复则结束处理,否则执行下一步;(1)根据诊断测试中

的发送和接收功率,对可能的物理故障点进行光纤

插拔。例如BPL1 0端口的TX发射功率为-4dBm , RX接收功率均为-

15dBm 左右,可能是RRU的光模块TX处或者BPL10端口的RX 处光纤

未插好。

(2)采用交叉替换检测的方法确定是否为光纤问题,若故障随光纤变动,

则是光纤问题,更换问题光纤。

5. 拔插相应光/电模块,如果告警复则结束处理,否则执行下一步;

( 1 )根据告警管理中判断故障的BPL/FS 端口所在,物理单板最右侧的

端口为0。

(2)插拔对应BPL/FS 端口的光模块

(3)插拔对应RRU 的光模块

6. 更换相应光/电模块。

(1 )采用交叉替换检测的方法确定是否为光模块问题,若故障随光模块变动,则

是光模块问题,更换对应的光模块。

1.14 光模块接收光功率异常

1.14.1 告警原因

1. 光纤损坏;

2. 光模块老化;

3. 光纤实际长度大于光模块支持的长度。

1.14.2 处理措施

1. 确保光纤长度没有超过光模块支持

的最大距离(在诊断测试中诊断光模块支

持的最大距离), 如果告警恢复则结束处理,否则执行下一步;

( 1 )右键打开诊断测试,点击组合测试按钮,在相应BPL/FS 中勾选光/

电模块诊断。

(2)在测试结果中可以看到BPL/FS 对应光模块支持的最大传输距离以及光模块

接受和发射的光功率强度,强度的正常范围一般为

-2~-10dBm 。

(3)对RRU 进行光/电模块诊断,在测试结果中可以看到BPL/FS 对应光模

块支持的最大传输距离以及光模块接受和发射的光功率强度,强度的正

常范围一般为-2~-10dBm 。

(4)了解工程上实际的光纤长度,若超过光模块支持的传输距离,要求工程队进

行BPL/FS 和RRU 上光模块的更换。

2. 拔插光纤或光模块,如果告警恢复则结束处理,否则执行下一步;(1)根据诊断

测试中的发送和接收功率,对可能的物理故障点进行光纤或光模块插拔。例如BPL10

端口的TX 发射功率和RX 接收功率均为-4dBm左右;RRU侧TX发射功率为-

4dBm , RX接收功率为-11dBm ,则可能是BPL1 向RRU 的发射信号光纤两端接头

未插紧导致。

(2)重新进行诊断测试,查看发送和接收功率是否正常。

3. 更换光纤或光模块。

(1)采用交叉替换检测的方法确定是否为光纤问题,若故障随光纤变动,

则是光纤问题,更换问题光纤。

相关主题
相关文档
最新文档