S1断链告警处理案例
5G网络设备常见故障处理

2.告警原因分析、处理方法
天馈类告警分析,处理方法:
告警码 198098465 天馈驻波比异常
告警原因 驻波比设置门限问题 RRU安装的工艺问题导致,防水问题 RRU设备自身通道故障
天馈线缆存在挤压、弯折,或馈缆损坏
198094848 天线校正失败
天馈线缆连接故障 校准线连接松动或者错误
时钟类告警分析,处理方法
6.GNSS接收机搜星故障
● 告警原因:
➢ GNSS天馈连接线缆异常; ➢ GPS天馈方向有建筑物阻挡; ➢ 周边环境存在干扰。
• 排查步骤:
• 1.进入诊断测试界面查看GPS配置是否生效、天馈状态是否正常;
• 2.检查GNSS天馈线缆连接,确保连接正常,且GPS天线安装符合工程规范(GPS天线竖直方向±45°范围内无遮挡物),确保良好的卫 星视通条件;
1.判定是否高业务期,若是,建议扩容解决 2.更新处理功能更强的最新单板(CCE1,BPN2)
2.告警原因分析、处理方法
传输类告警分析,处理方法:
告警码
告警原因 本端或对端偶联参数配置错误
198092230 SCTP偶联断
传输链路故障
198099803 网元断链告警源自网元与OMM服务器链路断 网元配置IP不正确 传输故障导致 网管服务器异常
• 1.首先检查和网管断链基站的范围,是个别基站还是大量基站,如果是大量基站断链,优先核 查传输是否存在断点,电力是否成片停电的情况;
• 2.针对单个站点断链,上站核查BBU至PTN间跳纤是否存在断点,光模块收发光是否正常; • 3.从网管侧路由跟踪,查看那一跳路由之后不通,联系传输核查; • 4.从基站侧使用LMT工具登录CC板,检查能否PIING通传输网关,能ping通则联系传输后续
VOLTE异常事件典型案例分析

异常事件典型案例分析未接通对第四轮测试数据进行分析发现未接通常见案例如下:未接通原因分类求和项:统计次数测试软件问题 6被叫振铃未接听 2测试设备断链 4端到端问题 4TAU与QCI建立流程冲突 1TCP链路问题 1切换与QCI1建立流程冲突 1终端在2G侧无响应 1核心网问题 5TAU与切换流程冲突导致TAU失败 4同一个MME下NAS消息sequence number不连续导致承载未建立 1其他原因 3人为挂断 3终端问题 2跨TAC但未发TAU导致服务拒绝 2总计201、测试软件问题(1)11月25日网格8 被叫振铃未接听主叫号码:136******** 被叫号码:136********(Time: 13:57:00.354,Latitude: 39.92886,Lontitude: 116.52397)13:56:25.184主叫占用朝阳平房乡政府南公园西北HLG-3发起呼叫,RSRP -78 dBm,SINR 17dB,无线环境良好,13:56:27.776主叫收到网络侧转发的被叫的invite 180后,由于被叫一直没有摘机导致在13:56:47.988被叫主动挂机上报invite 603,携带原因为decline,主叫判断为未接通,被叫判断为掉话。
此处属于测试软件问题,应该予以剔除。
(2)11月19日网格55 测试设备断链主叫号码:136******** 被叫号码:136********(Time: 12:57:39.940,Latitude: 39.86454,Lontitude: 116.43406) 12:57:30.631主叫占用丰台左安门桥南HLG-5发起呼叫,RSRP -99 dBm,SINR 6dB 空口良好,由于被叫终端设备断链导致未接通,应该予以剔除。
2、端到端问题(1)11月16日网格67 QCI1与TAU流程冲突主叫号码:136******** 被叫号码:136********(Time: 13:13:21.299,Latitude: 39.92329,Lontitude: 116.41997)13:13:11.358主叫占用东城语文出版社HL-1发起呼叫,被叫于13:13:13.870上发invite 183之后,开始建立QCI1承载,UL information transfer还没有上发时发起TAU,流程冲突导致被叫主动上发invite 580,属于端到端问题,需要集团规范协议流程。
S1链路漏配导致切换成功率低问题处理

S1链路漏配导致切换成功率低问题处理摘要:S1链路漏配导致切换成功率低问题处理。
关键字:漏配S1【故障现象】:日常指标监控时发现市区瓜果市场北侧两个站点TL-市区-烟草公司广告牌的3小区和TL-市区-瓜果市场的1小区的同频切换失败率分别高达36.12%和29.48%,其余指标正常。
【告警信息】:查询基站TL-市区-烟草公司广告牌和TL-市区-瓜果市场内均无故障告警,小区状态正常。
【原因分析】:出现此类问题的大致原因:1.外部小区信息配置错误;2.切换参数配置错误;3.干扰4.传输链路异常;具体处理步骤:1.首先核查问题小区外部信息,确认无任何异常。
2.使用PEAC平台进行站点参数对比核查,切换参数与正常站点设置一致。
3.查询站点上行干扰站点无干扰,核查工参信息,站点无明显MOD3干扰对打问题。
4.核查问题站点传输链路,发现站点配置4条S1传输链路,并且传输链路正常。
5.取全网两两小区切换指标,发现这问题站点主要都是往TL-市区-豪邦康-HFTA-449019-55小区切换时失败的。
6.核查TL-市区-豪邦康站点状态,发现该站点S1链路只有1条,漏配一条传输,导致周围站点使用第2条传输切换过来时全部失败。
根因与工程督导联系说明此情况,督导反应前期核心网增加MME时,批量增加过传输链路,该站点断链无法增加传输链路,近期站点恢复未及时增加传输导致周围站点切换失败较高。
【解决方法】:TL-市区-豪邦康站增加一条传输链路后,切换到该站点指标恢复正常。
原问题小区指标也恢复正常,问题得到解决。
【经验教训或建议与总结】:为了避免此情况发生,督导后期会定期核查因断站导致无法及时修改参数的问题,避免因类似问题导致全网指标恶化。
MME地址错误导致S1切换全部失败处理

名称: MME地址错误导致S1切换全部失败
问题描述:
2014年8月28日指标监控时发现,云浮云安西边D-DLH与周边站点的S1切换全部失败,全天各个时段都有一定次数的S1切换失败,影响整体切换指标。
问题分析:
查看多个CDL日志发现,切换失败均发生在云浮云安西边D-DLH与周边站点的切换上,且云浮云安西边D-DLH与其他基站间的所有切换都为S1切换,且切换全部失败。
该基站前几日处于断链状态,到27日晚才恢复,站点起来后指标与其他基站切换指标就出现问题,因此主要核查该基站告警及参数配置情况。
1.查看目标小区状态正常,无告警;
2.核查邻区参数配置无误;
3.查看多个CDL日志,发现和目标小区的所有切换均通过S1链路,且均失败,CDL看,源小区发送S1 Handover Required后,EPC回复S1 Handover Preparation Failure,携带的消息为核心网原因导致S1切换出准备失败,怀疑是否为核心网传输方面出现问题;
4.联想到在这几天进行新MME割接,而云浮云安西边D-DLH前几日均处于基站断链退服状态,因此登录到目标基站查看路由关系,发现云浮云安西边D-DLH站的MME地址仍使用MME割接前的地址100.6
5.254.203/204,而割接完后的新MME应为100.65.254.209/210;
解决措施:
将云浮云安西边D-DLH基站MME地址由原来的100.65.254.203/204修改为割接完后的新地址100.65.254.209/210后,指标恢复正常。
现网仍存在7个传输断连导致无法完成新MME割接的站点,后续将做好跟踪,在故障处理好
后第一时间完成MME割接,避免对全网切换指标造成影响。
中国铁塔动环常见告警处理指导手册

中国铁塔动环常见告警处理指导手册第一篇:中国铁塔动环常见告警处理指导手册中国铁塔动环常见告警处理指导手册一、FSU离线告警告警名称:FSU离线;告警解释:FSU和铁塔集团平台连接通讯中断;原因分析:1)信号差或不稳定;2)FSU设备掉电;3)无线模块硬件故障;4)FSU设备硬件故障;5)天线和无线模块连接中断,或天线丢失;6)VPN服务器连接不上;7)SIM卡被盗、欠费或故障。
平台处理方法:查询历史告警记录,如频繁离线或长时间离线,需现场检查。
现场处理方法:第一步检查供电:1)在运维监控系统检查离线站点是否有停电告警,判断是否现场停电;2)现场检查FSU指示灯不亮设备没有供电。
原因分析:FSU供电异常。
解决方案:1)检查整个基站是否停电,如停电则通知相关人员取电;2)检查FSU供电空开是否跳闸及通电线路是否正常。
第二步检查无线模块:检查无线模块指示灯都不亮或都常亮。
原因分析:无线模块供电异常或无线模块故障。
解决方案:1)无线模块供电故障,则检查给无线模块供电接线是否正常如正常,则用万用表测量给无线模块供电FSU输出端是否有12V,如没有则为FSU供电板问题,更换FSU供电板。
2)确认供电正常,则更换无线模块进行测试。
下站建议:下站时建议随身带上一套可以成功拨号的无线网卡和SIM卡,下站的时候作对比验证,快速确认是SIM卡问题,还是无线模块问题。
第三步FSU检查通过EISUConfig软件登陆FSU设备,点击设备诊断管理。
1)信号强度弱:通过设备软件登录设备,如信号强度小于15。
解决方案:更换运营商无线模块或将天线外延(室内站放到室外,室外柜放到底部隐蔽区域或有外层保护情况下放到机柜顶部)2)铁塔VPN网络连接异常:铁塔VPN网络提示连接异常3)铁塔网管未注册:铁塔网管提示连接异常(正常显示连接正常)解决方案:确认总部平台正常,重启FSU(等待程序连接)。
如重启后未恢复,联系厂家专业人员。
平台恢复确认:告警管理-活动告警监控-当前告警查询该站点,确认告警是否消除。
LTE常见故障总结

故障总结目录故障总结 (1)告警部分 (2)1.System module failure (0010) (2)2.BTS reference clock missing (1898) (3)3.Configuration error: Unit initialization failure (0012) (3)4.Configuration error: Not enough HW for LCR (1868) (3)5.Configuration error: Power level not supported (4008) (4)6.Cell configuration data distribution failed (6253) (4)7.Failure in optical RP3 interface (4064) (4)8.Failure in optical RP3 interface (0010) (5)9.Baseband bus failure (3020,1906) (5)10.RF module failure (6259,1911、1711、1712) (5)11.Cell power failure (4090) (6)12.GPS Receiver alarm: Control Interface not available (4011) (7)13.X2 interface setup failure(6304) (7)14.Transport layer connection failure in X2 interface (7)15.Failure in replaceable baseband unit (7)16.Temperature alarm(0002) (8)17.VSWR(1838) (8)18.Failure in optical RP3 interface (2004) (8)19.GPS时钟盒闪断,时钟信号不正常,无法识别RRU (9)20.Failure in optical RP3 interface(2000) (9)21.光纤交叉连接 (9)22.基站始终无法建立S1连接,只到configed状态 (9)23.某一个小区的RRU无法识别 (10)24.BBU版本无法识别 (11)26.校准初步排查 (11)27.本地IP地址和路由正常,ping不通MME和网关 (12)28.TRS文件始终无法生效 (12)29.远程ping不通基站(断链) (12)31.风扇告警 (13)32.BTSlog有link消息,但是pinger始终不亮 (13)34.pinger正常,但是SM里小区显示橙黄色告警 (13)36.FOSI 和FOSN的光功率范围 (13)38.MAC绑定及载波冲突 (13)39.传输不通 (14)40.升级完成后出现驻波告警 (14)案例部分 (14)特殊操作部分 (20)1、登录RRU 查看RRU光路状态。
网元断链告警处理案例

➢网元断链告警处理案例1.故障现象描述✧在双模站点开通过程中,部分站点在初期会有断链情况。
告警显示“网元断链告警(198099803)”这样的话,后台就无法监控到断链站点的状态。
2.故障分析排查思路1、只有个别基站在所属网管服务器上面断链,可以排查网管服务器故障;2、大批基站集中断链,可以排除基站本身硬件、供电故障;3、如果个别站点在正常运行,排除基站无硬件、供电故障后,出现断链,一般为传输问题,需要联系移动传输室来联合排查定位;3.传输网络结构介绍✧LTE基站OMC维护网络从IP传输网络架构来看,可分为3段,依次是:基站------基站网关------网管服务器网关------网管服务器。
整个传输网络结构如下图所示:4.网元断链故障处理流程5.故障排查总结通过上述的排查总结如下:1、首先确认BBU设备是否运行正常,站点传输设备是否正常,基站供电系统是否正常。
2、然后检查下站点的配置数据,确保站点配置无误,可能由于传输割接导致站点断链。
网管配置参数如下图所示:网元中配置的OMC操作维护地址:基站传输网络→IP传输→IP层配置中的OMC操作维护地址:基站传输网络→IP传输→OMC链路服务器地址:3、关于ping命令,有两种使用情况:a)从后台ping前台基站的话:直接在网管服务器上:ping ip地址。
b)从前台基站上ping后台服务器:需要通过使用LMT工具来,下面简单介绍其使用方法:启动EDMS登录基站---Ping包检测—设置ping的包大小,次数及相应的IP地址---再点击对应的按钮开始测试。
Ping包检测开始后,会在ping包信息区域显示每次ping包的详细信息。
Ping包结束后,会在ping包统计区显示统计信息,包括是否存在丢包、延时等等。
无线网络问题处理

➢GNSS天馈连接线缆异常 ➢GPS天馈方向有建筑物阻挡 ➢周边环境存在干扰
排查思路:
➢检查配置数据GPS配置是否生效 ➢检查GNSS天馈线缆连接正常,且GPS天线安装符合工程规范 ➢通过扫频仪查看周边是否存在GNSS干扰源 ➢采用电压和电阻测量法检查物理链路质量 ➢复位基站CC单板
电压测量法:
4 DHCP服务器回送确认 单播报文DHCP Ack 确认IP地址可用
© ZTE Corporation. All rights reserved
维护通道问题处理步骤2
第二步:检查传输DHCP Relay配置
➢如果基站侧DHCP Discover消息发出, SUSE系统服务器没有收到相应的报文,确定 是传输没有把DHCP Discover消息送达到服务器上
第二步:选择对应网元告警
第三步:双击告警,查看具体信息
第四步:查看告警处理建议
© ZTE Corporation. All rights reserved
传输配置问题处理思路
: 故障现象 S1断链告警(198094420)
原因分析:
➢S1建链失败 ➢下层承载SCTP链路中断
排查思路:按照协议栈逐层排查,协商数据一致性检查
➢天馈驻波比异常(198098465) ➢GNSS天馈链路故障(198096836) ➢GNSS接收机搜星故障(198096837) ➢没有可用的空口时钟源(198092217)
© ZTE Corporation. All rights reserved
课程内容
传输维护问题处理思路 设备硬件问题处理思路 综合业务问题处理思路
故障现象:RRU功率检测异常(198098472) 原因分析:
➢基带处理单板问题 ➢RRU软硬件问题 ➢光纤、跳线附属器件问题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
S1断链告警处理指导1.故障现象描述告警管理中查看到基站上报“S1断链告警(0)”告警码,如下图所示:2.故障分析排查思路根据TD-LTE的网络接口协议,S1链路是建立在物理传输层、数据链路层、IP协议层、SCTP偶联链路之上的传输协议层,如下图所示:所以处理S1链路故障,需要从底层开始排查:1、首先排查站点是否存在传输告警,排除传输故障;2、其次基站IP地址配置是否正常;3、再次确认SCTP偶联断告警,排除SCTP偶联告警;4、最后排查是否存在S1 AP建立失败(协商失败或基站无小区),与核心网核对小区TAC值是否配置一致。
3.故障排查步骤1、查看基站告警,是否存在传输类相关告警,例如“网元断链告警”、“SCTP偶联断链”告警,若存在以上告警,需要先按照以上告警排查指导手册,先解决以上告警。
2、检查ENODEB------MME或SGW 路由IP地址是否配置正确;通过telnet命令登录到CC板,使用 BRS命令对MME及SGW地址进行PING包测试,详细登录方式如下,红色字体均需要输入:通过服务器远程登录:$ telnet 前台通过网线直连登录地址:正在尝试...连接到()(none) login: zte(用户名)Password: zte(密码)Processing /etc/profile... Done# /ushell-> Please input password!->***(密码zte)-> Login success!!ushell tool menu: ------------------------------------------------------------------------------'ps' or 'PS' list process run on the board'pr xxx' or 'PR xxx' take over xxx process printf info'npr xxx' or 'NPR xxx' not take over xxx process printf info'db xxx' or 'DB xxx' debug xxx process printf info'ndb xxx' or 'NDB xxx' not debug xxx process printf info'pad xxx' or 'PAD xxx' debug and take over xxx process printfinfo'npad xxx' or 'NPAD xxx'not debug and take over xxx process printf info'pall' or 'PALL' display current debug and take over info'ncheck' or 'NCHECK' Do not check another ushell exist'check' or 'CHECK' Do check another ushell exist'Q' or 'q' cancel all process debug and printf info'exit' or 'EXIT' cancel ushellxxx is process id you want to debug or take over printfinfo------------------------------------------------------------------------------$$ps(查看前台进程)PID USER VSZ STAT COMMAND1 root 1304 S init2 root 0 SW [softirq-high/0]3 root 0 SW [softirq-timer/0]4 root 0 SW [softirq-net-tx/]5 root 0 SW [softirq-net-rx/]6 root 0 SW [softirq-block/0]7 root 0 SW [softirq-tasklet]8 root 0 SW [softirq-sched/0]9 root 0 SW [softirq-hrtimer]10 root 0 SW [softirq-rcu/0]11 root 0 SW [watchdog/0]12 root 0 DW [chkeventd/0]13 root 0 SW< [events/0]14 root 0 SW< [rt_events/0]15 root 0 SW< [khelper]16 root 0 SW< [kthread]17 root 0 SW< [rt_kthread]37 root 0 SW< [kblockd/0]42 root 0 SW< [khubd]83 root 0 SW [pdflush]84 root 0 SW [pdflush]85 root 0 SW< [kswapd0]86 root 0 SW< [aio/0]621 root 0 SW [mtdblockd]678 root 1253m S /680 root 9156 S /tftp683 root 1308 S telnetd685 root 1312 S inetd686 root 1312 S -/bin/./ash697 root 0 SWN [jffs2_gcd_mtd0]1201 root 457m S / 88 91 /1750 root 1316 S -sh1751 root 9216 R /ushell1753 root 1304 R sh -c ps1754 root 1308 R ps$$pad 678(登录到平台进程)[678]ushell enter print modushell enter debug mod$$brsping ""(ping核心网MME地址)[678][ begin to excel fun:brsping ]value = 0(0x0)[ end to excel fun:brsping ]Ping : find no route for dest, send by default gateway [0xac1e8fc1]. send ping seq: 1...$$[678]PING===>reply from packetsize=36 time=14ms.——正常ping通时返回的时长[678]send ping seq: 2...[678]PING===>reply from packetsize=36 time=4ms.[678]send ping seq: 3...[678]PING===>reply from packetsize=36 time=3ms.[678]send ping seq: 4...[678]PING===>reply from packetsize=36 time=24ms.[678]Ping statistics for Packets: Sent = 4, Received = 4, Lost = 0(0% loss), Approximate round trip times in milli-seconds:Minimum = 3ms, Maximum = 24ms, Average = 11ms(ping核心网MME控制面地址结果,丢包率0%,证明基站到MME链路正常。
)brsping "" (ping核心网SGW地址)[678][ begin to excel fun:brsping ]value = 0(0x0)[ end to excel fun:brsping ]send ping seq: 1...$$[678]PING===>reply from packetsize=36 time < 1ms.[678]send ping seq: 2...[678]PING===>reply from packetsize=36 time < 1ms.[678]send ping seq: 3...[678]PING===>reply from packetsize=36 time=1ms.[678]send ping seq: 4...[678]PING===>reply from packetsize=36 time < 1ms.[678]Ping statistics for Packets: Sent = 4, Received = 4, Lost = 0(0% loss), Approximate round trip times in milli-seconds:Minimum = 0ms, Maximum = 1ms, Average = 0ms(ping核心网SGW用户面地址结果,丢包率0%,证明基站到SGW链路正常。
)通过以上步骤,排查基站到EPC的控制面MME和用户面SGW链路均正常。
3、Pad 到平台进程, showtcb 查看偶联状态,继续在平台进程中输入“showtcb”命令查看,偶联状态是否正常,若偶联异常,按照偶联断链告警指导手册处理。
$$showtcb[678][ begin to excel fun:showtcb ]=====Begin:Show Assoc TCB Info=====TCB info 0:偶联号0ULPID = 0, AssoID = 0, Checksum = 1, InstanceID = 0LocalPort = 6051, SourIP = VpnId = 31PeerPort = 6051, DestIP = VpnId = 31Association State = established(此处显示偶联状态,established标示偶联正常)CulTsnAcked = 24, NextTsnAssign = 25, LastRecvTSN = 61OutStandingSize = 0, PendingChkNum = 261888, MtuSize = 1500 TxReChkNum = 0TxStrmNum = 2, RxStrmNum = 2PeerVerifTag = 57, MyVerifTag = 17TCB info 11:偶联号11ULPID = 11, AssoID = 11, Checksum = 0, InstanceID = 11LocalPort = 36422, SourIP = VpnId = 31PeerPort = 36422, DestIP = VpnId = 31Association State = established(此处显示偶联状态,established标示偶联正常)CulTsnAcked = 01, NextTsnAssign = 02, LastRecvTSN = 0OutStandingSize = 0, PendingChkNum = 261888, MtuSize = 1500 TxReChkNum = 0TxStrmNum = 2, RxStrmNum = 2PeerVerifTag = 2, MyVerifTag = 77TCB info 12:偶连号12ULPID = 12, AssoID = 12, Checksum = 1, InstanceID = 12LocalPort = 36422, SourIP = VpnId = 31PeerPort = 36422, DestIP = VpnId = 31Association State = established(此处显示偶联状态,established标示偶联正常)CulTsnAcked = 01, NextTsnAssign = 02, LastRecvTSN = 40OutStandingSize = 0, PendingChkNum = 261888, MtuSize = 1500 TxReChkNum = 0TxStrmNum = 2, RxStrmNum = 2PeerVerifTag = 12, MyVerifTag = 77TCB info 13:偶连号13ULPID = 13, AssoID = 13, Checksum = 1, InstanceID = 13LocalPort = 36422, SourIP = VpnId = 31PeerPort = 36422, DestIP = VpnId = 31Association State = cookie_wait(此处显示偶联状态,cookie wait标示偶联不正常)CulTsnAcked = 0, NextTsnAssign = 05, LastRecvTSN = 0OutStandingSize = 0, PendingChkNum = 68, MtuSize = 0TxReChkNum = 0TxStrmNum = 2, RxStrmNum = 2PeerVerifTag = 0, MyVerifTag = 05TCB info 14:偶连号14ULPID = 14, AssoID = 14, Checksum = 1, InstanceID = 14LocalPort = 36422, SourIP = VpnId = 31PeerPort = 36422, DestIP = VpnId = 31Association State = cookie_wait(此处显示偶联状态,cookie wait标示偶联不正常)CulTsnAcked = 0, NextTsnAssign = 69, LastRecvTSN = 0OutStandingSize = 0, PendingChkNum = 68, MtuSize = 0TxReChkNum = 0TxStrmNum = 2, RxStrmNum = 2v1.0 可编辑可修改PeerVerifTag = 0, MyVerifTag = 69=====End:Show Assoc TCB Info=====value = 34(0x22)[ end to excel fun:showtcb ]$$exit(退出平台进程)ushell recv signo:0.quit debug and exit ushell!# exit(退出基站CC单板连接)关闭连接。