WCDMA掉话分析及解决方法(精华)

WCDMA掉话分析及解决方法(精华)
WCDMA掉话分析及解决方法(精华)

WCDMA掉话分析及解决方法

一、掉话的定义

1.路测的掉话定义

路测的掉话定义是:从 UE侧记录的空口信令上看,在通话过程(连接状态下)中,如果空口的消息满足以下3个条件的任何一个就视为路测掉话。

(1)收到任何的BCH消息(即系统消息)。

(2)收到无线资源释放的消息且释放的原因为非正常的。

注释:收到RRC Release消息(原因为非正常释放Not normal)

(3)收到呼叫控制断开连接、呼叫控制释放等消息,而且释放的原因为非正常的。

注释:收到CC Disconnect,CC Release Complete,CC Release三条消息中的任何一条,而且释放的原因为Not Normal Clearing或者Not Normal,Unspecified。

2.话统指标中的掉话定义

广义的掉话率应该包含CN和UTRAN的掉话率,由于我们做网优重点关注与UTRAN侧的掉话率指标,今天讲的掉话率描述也重点关注UTRAN侧的KPI指标。

注:UMTS Terrestrial Radio Access Network -- UMTS陆地无线接入网

从大的方面讲,掉话分为两大类,信令面掉话和用户面掉话。

需要说明的是:无线接入网话统掉话的定义只从Iu接口的角度进行统计,统计了RNC主动发起的非正常资源释放的请求次数;路测的掉话定义主要从空口的消息和非接入层的消息结合原因值来进行定义的,两者不完全一致。“比如说,对于同时进行主被叫通话,工具记录主叫的空口消息,如果被叫异常掉话,那么分析主叫的流程也会是一次掉话,但从话统上看,这次主叫是没有掉话指标记录的。所以两者的定义是不完全一致的,在分析时需加以区分。”

注:从RNC记录的信令上看,如果在Iu接口上看到了RNC 发向CN的消息为IuRelease Request或者RNC发给CN的消息为RAB Release Request消息,此时定义为异常掉话。

二、掉话原因分析

由于掉话分析将涉及到具体的信令分析,因此本文参考华为设备的参数设置进行分析,而不同设备的参数定义并不一定相同,但是分析方法是相通的。

1.邻区漏配

一般来讲,掉话在初期优化过程中大多数是由于邻区漏配导致的。对于同频邻区,通常采用以下方法来确认是否为同频邻区漏配。

方法一:观察掉话前UE记录的激活集EcIo信息和Scanner记录的BestServerEcIo信息。如果UE记录的激活集EcIo很差,而Scanner记录的BestServer EcIo很好,同时检查Scanner记录Best Server EcIo扰码是否出现在掉话前最近出现的同频测量控制的邻区列表中。如果同频测量控制的邻区列表中没有该最好小区的扰码,那么可以确认是邻区漏配。

方法二:如果掉话后UE马上重新接入,UE重新接入的小区扰码和掉话时的扰码不一致,也可以怀疑是邻区漏配问题,可以通过测量控制,进一步进行确认(从掉话位置的消息开始往前找,找到最近一条同频测量控制消息,检查该测量控制消息的邻区列表)。

方法三:有些UE会上报检测集(DetectedSet)信息,如果掉话发生前检测集信息中有相应的扰码信息,也可以确认是邻区漏配的问题。

邻区漏配导致的掉话包括异频邻区漏配和异系统邻区漏配。异频邻区漏配的确认方法和同频几乎相同,主要是掉话发生的时候,手机没有测量或者上报异频邻区,而手机掉话后重新驻留到异频邻区上。异系统邻区漏配表现为手机在3G 网络掉话,掉话后手机重新选网驻留到2G网络,从信号质量来看,2G网络的质量很好(在掉话点用2G测试手机观察RSS信号)。

2.覆盖差

一般来说,对于Voice而言,当CPICH的EcIo大于-14dB,RSCP大于-100dBm 时(采用的测量值),不可能是由于覆盖差导致的掉话。通常所说的覆盖差主要是指RSCP很差,或者EcIo和RSCP都很差。

上行覆盖差还是下行覆盖差的问题需要通过掉话前上行或者下行的专用信道功率来确认。如果掉话前的上行发射功率达到最大值,并且上行的BLER也很差或者从RNC记录的单用户跟踪上看到NodeB上报RL failure,基本可以认为上行覆盖差导致的掉话;如果掉话前,下行发射功率达到最大值,并且下行的BLER很差,基本可以认为是下行覆盖不行导致的掉话。

由于缺站、扇区接错、功放故障导致基站关闭等原因都会导致覆盖差,在一些室内,由于过大的穿透损耗也会导致覆盖太差。扇区接错或者站点由于故障原因关闭等容易在优化过程中出现,表现为其他小区在掉话点的覆盖差,需要注意分析区别。

确认覆盖的问题简单直接的方式:

直接观察Scanner采集的数据,若最好小区的RSCP和EcNo都很低,就可以认为是覆盖问题。

3.切换导致的掉话

软切换/同频导致掉话主要有两类原因:切换来不及或者乒乓切换。

从信令流程上看,CS业务表现为手机收不到激活集更新命令(同频硬切换时为物理信道重配置),PS业务也有可能收不到激活集更新命令,也有可能在切换之前先发生TRB复位。

解决切换来不及导致的掉话,可以通过调整天线扩大切换区,也可以配置

1a事件的切换参数使切换更容易发生,或者配置CIO使目标小区能够提前发生切换。

注释:从信号上看,切换来不及主要有以下两种现象:

1)拐角效应:源小区EcIo陡将,目标小区EcNo陡升(即突然出现就是很高的值);2)针尖效应:源小区EcIo快速下降后一段时间后上升,目标小区出现短时间的陡升。

解决乒乓切换带来的掉话问题,可以调整天线使覆盖区域形成主导小区,也可以配置1b事件的切换参数减少乒乓切换的发生等方法来进行。

注释:乒乓切换主要有以下两种现象:

1)主导小区变化快:2个或者多个小区交替成为主导小区,主导小区具有较好的RSCP和EcIo每个小区成为主导小区的时间很短;

2)无主导小区:存在多个小区,RSCP正常而且相互之间差别不大,每个小区的EcIo都很差。

对于异频切换和系统间切换,在切换前需要通过启动压缩模式来进行异频或者异系统测量。压缩模式启动太迟,可能导致手机来不及测量目标小区的信号,从而产生掉话,也可能手机完成了测量,但下发的异频切换或者异系统切换请求手机不能正常接收而导致掉话。

4.干扰导致的掉话

下行和上行的干扰都会导致掉话。一般情况下,对于下行,当激活集CPICH RSCP大于-85dB,而激活集综合EcIo小于-13dB产生了掉话,基本上可以认为是下行干扰的问题(当切换不及时的时候,也可能出现服务小区RSCP信号很好,EcIo很差,但此时监视集小区RSCP和EcIo都很好);对于上行RTWP比正常值(-107~-105)超过10dB,干扰时间超过2~3s,就有可能造成掉话,需要重点解决。

下行干扰通常是指导频污染,指覆盖地区存在3个或者以上的小区满足切换条件,由于信号的波动常常出现激活集替换或者最优小区发生变化,通常当激活集综合质量不好(CPICH的EcIo都在-10dB左右波动),容易出现切换失败导致SRB复位,也可能出现TRB复位。

上行干扰增加了连接模式的手机上行发射功率,从而产生过高的BLER导致SRB、TRB复位或者由于失步导致掉话。另外,在切换的时候,新建链路由于上行干扰导致链路不能同步,从而造成该小区的切换成功率低,或者造成切换失败而导致掉话。

5.设备问题导致的掉话

在排除了以上的原因之后,其他的掉话一般需要怀疑设备的问题,需要通过查看设备的日志,告警等进一步来分析掉话原因。

例如:同步失败导致的链路不停增加和删除。

例如:手机不上报1a测量报告导致掉话。

6.还有一类就是流程交互问题导致的掉话:

一些需要信令交互的流程,如AMR控制、DCCC以及压缩模式的启停、UE的状态迁移等,常常会由于信号的原因,手机支持方面的原因或者RAN设备和手机的配合问题,导致流程失败,最后导致掉话。

这类问题需要针对特定的流程和手机进行分析,没有一般性的处理方法。

三、掉话分析流程

1.掉话分析流程

掉话数据分析流程如图1所示。

图一

2.准备数据

路测软件采集数据文件,RNC记录单用户跟踪,RNC记录CDL。

3.获取掉话位置和时间

采用路测数据处理软件,比如:用Analyzer获取掉话的时间和地点,获取掉话前后Scanner采集的导频数据,手机采集的活动集和监视集信息,信令流程等。

4.分析Scanner主导小区的变化情况

主要分析主导小区的变换情况,如果主导小区相对稳定,进一步分析RSCP 和EcIo的情况;如果主导小区变化频繁,需要区分主导小区变化快的情况。如果没有主导小区的情况,然后进一步进行乒乓切换掉话分析。

5.分析Scanner主导小区信号RSCP和EcIo

观察Scanner主导小区RSCP和EcIo,根据不同的情况分别处理。

RSCP差,EcIo差,可以确定为覆盖问题。

RSCP正常,EcIo差(排除切换来不及导致的,同频邻区干扰),可以确定为导频干扰问题;

RSCP正常,EcIo正常,如果UE激活集中小区与Scanner最好小区不一致,可能为邻区漏配或者切换来不及导致的掉话;如果UE活动集中小区与Scanner 最好小区一致,可能为上行干扰或者异常掉话。

6.路测重现问题

由于一次路测不一定能够采集到定位掉话问题需要的所有信息,此时需要通过进一步路测来收集数据。通过进一步的路测也能确认该掉话点是随机掉话点还是固定掉话点,一般来说固定掉话点一定需要解决,而随机掉话点则需要根据掉话发生的概率来确定是否需要解决。

四、掉话的解决方法

1.工程参数调整

工程参数的调整是非常有限的,最基本的可以调整站点的位置、天线的高度、下倾角、天线的波瓣宽度、天线增益以及方向角等。

(1)对于上行或下行覆盖问题导致的掉话,增加站点是最好的办法,同时可以考虑更改天线的高度、下倾角,也可以更换增益更高的天线或者增加塔放。

(2)对于针尖和拐角效应,调整天线是比较有效的解决办法,由于针尖效应和拐角效应往往出现在街道拐弯的地方或者两条街道交界的地方,可以考虑通过天线的方向角与街道错开一定角度的方式来调整,但同时需要注意不能使原来街道路边商铺的覆盖有很大的影响。

(3)对于导频干扰引起的覆盖问题,可以通过调整某一个天线的工程参数,使该天线在干扰位置成为主导小区;也可以通过调整其他几个天线参数,减小信号到达这些区域的强度从而减少导频个数;如果条件许可,可以增加新的基站覆盖这片地区;如果干扰来自一个基站的两个扇区,可以考虑进行扇区合并。

工程参数的调整需要综合考虑整个小区的调整效果,在解决一个问题的同时要注意不在其它区域引入新的问题。

一般来说,在不方便频繁调整天线并且有条件进行仿真的时候,在调整前后需要分析仿真结果;如果没有条件进行仿真,但方便多次调整天线的时候,可以根据经验并结合实际路测的方法来进行调整。

2.参数调整

(1)小区偏置

该值与实际测量值相加所得的数值用于UE的事件评估过程。UE将该小区原始测量值加上这个偏置后作为测量结果用于UE的同频切换判决,在切换算法中起到移动小区边界的作用。

该参数设置越大,则软切换越容易,处于软切换状态的UE越多,占用资源越多;设置越小,软切换越困难,有可能影响接收质量。

对于针尖效应或者拐角效应,配置5dB左右的CIO是比较好的解决办法,但也会带来增加切换比例等的副作用。

(2)软切换相关的延迟触发时间

延迟触发时间是1A、1B、1C和1D事件相关的触发时间,触发时间的配置会影响切换的及时性。一般情况下,缺省参数的配置能够满足绝大多数场景的要求,但对于一些密集城区,需要通过容易加入活动集和难以从活动集中删除这样的方式来切换过于频繁或者来不及切换避免掉话。

触发时间配置对切换区比例的影响比较大,特别是1B事件触发时间的调整可以比较好地控制切换比例。

切换参数可以针对小区设置,在根据环境设定了一套基本参数之后,针对每个小区单独进行调整,可以把参数更改的影响限制在几个小区之间,对系统的影响也较小。

(3)同频测量滤波系数FilterCoef

层3滤波应尽量滤除随机冲击的能力,使得滤波后的测量值反映实际测量的基本变化趋势。由于输入层3滤波器的测量值已经经过层1滤波,基本消除了快衰落的影响,因此层3应对阴影衰落和少量快衰落毛刺进行平滑滤波,以为事件判决提供更优的测量数据。

滤波系数越大,对毛刺的平滑能力越强,但对信号的跟踪能力减弱,必须在两者之间进行权衡。

典型值可以设置如下:

a、若切换区信号变化较慢,同频滤波系数可设为7;

b、若切换去信号变化速度中等,同频滤波系数设为6;

c、若切换区信号变化较快,同频滤波系数设为3。

(4)压缩模式启停门限

压缩模式一般在异频切换或者异系统切换前启动,通过压缩模式来测量异频或者异系统小区的质量。压缩模式的启动可以根据CPICH的RSCP或者EcIo是否满足条件来触发,在实际的应用中,一般都采用RSCP作为触发条件。

一般情况下,压缩模式需要测量目标小区(异频或者异系统)的质量并获取相关信息,同时由于移动台的运动导致当前小区的质量恶化,所以对于压缩模式的启动门限一般要求要求在当前小区的质量下降到导致掉话之前能够及时测量到目标小区的信号完成切换为要求,对于停止门限则要求避免压缩模式的频繁启动和停止。

(5)无线链路最大下行发射功率RLMaxDLPwr

配置大的专用链路的发射功率有利于克服覆盖导致的掉话点,但同样带来干扰问题,由于单个用户允许的功率大,当用户在边缘是就可能消耗大的功率,从而对其他用户造成影响,降低系统的下行容量。一般情况下下行发射功率的配置由链路预算提供,适当的增加或者减少1~2dB,一般情况下在单次路测情况下,很难看出对掉话的影响,但可以从话统指标上看出来,对于一些小区,由于覆盖原因存在比较大的掉话率,可以考虑增加专用信道的最大发射功率;对于一些小区,由于负载过高导致用户有较大的接入失败概率,可以考虑适当降低该参数。

(6)信令和业务的最大重传次数

在较高的误块率信道条件下,信令由于重传达到最大值就会产生复位,信令的一次复位就会导致掉话;采用AM模式进行业务传输的业务也同样会重传,重传达到最大值之后产生复位信令,系统配置了最大允许的复位次数,当复位次数达到最大值之后,系统开始释放业务,也同样会造成掉话。

系统缺省的配置可以保证突发误块不会导致异常的掉话,但在进入覆盖比较差的场合能够及时进行复位而导致掉话,从而释放业务占用的资源。对于一些场景,有较多的突发干扰,或者针尖效应比较明显的场景,干扰突发期间可能导致100%误块,而又不希望过多的掉话,此时可以考虑适当增加重传次数,通过重传来抵抗突发干扰。

该参数是针对RNC配置。

(7)RSCP表示的小区异频硬切换门限

当异频测量启动以后,手机开始测量异频小区,当异频小区的质量高于该门限,RNC发起异频切换。

结合压缩模式的启动停止门限来配置该参数,如果配置较小的值,可以提早触发硬切换,如果配置较大的值,可以延迟进行硬切换,从而可以控制切换区或者降低掉话概率。

(8)切换判决门限GsmRSSICSThd、GsmRSSIPSThd

异系统切换门限可以针对CS业务和PS业务分开设置,方法和异频硬切换门限的设置方法相同。

五、案例:软切换掉话解决方法

a.调整天线,使目标小区的天线覆盖能够越过拐角,在拐角之前就能发生切换,或者使当前小区的天线覆盖越过拐角,从而避免拐角带来的信号快速变化过程来降低掉话。在实际的实施过程中,由于天线工程参数的调整以及是否能越过拐角的判断过多地依赖于经验,使得这个方法的实施存在一定困难。

b.针对小区配置1A事件参数,使得切换更容易触发。比如,降低触发时间为200ms,减小迟滞;一般情况需要针对小区进行配置,这个参数的更改会导致该小区和其他小区(没有拐角效应的小区)的切换也更容易发生,可能会造成过多的乒乓切换。

c.配制拐角效应产生两个小区之间的CIO,使目标小区更容易加入。由于CIO 只影响两个小区之间的切换行为,影响面相对较小,但CIO会对切换产生影响,这种配置可能导致切换比例的增加。

综合以上的措施,建议优先采用a,如果a不能解决,采用方法b,最后在b无法解决问题的情况下,采用方法c。

六、SRB,TRB复位问题

总体来说,掉话的原因有多种可能,包括:邻区漏配、覆盖太差、干扰过强、软切换、硬切换、系统间切换以及设备异常等.SRB复位:指的是在信令面,发端采用RLC AM模式传送RRC 消息,但相关定时器Time Out后,仍未收到对端回馈的ACK/NACK消息.这时,发端的RLC实体会发送RESET PDU 给对端,通知对端复位RLC接收实体. 通常SRB复位会导致掉话.

TRB复位:这种情况主要在PS业务上发生,voice和VP业务不会产生TRB

复位。一般可以通过确认掉话发生时的UE发射功率或者下行码发射功率情况来辅助确认.

上行失步:因为WCDMA的上行的Timing alignment与下行有固定的chip offset,所以当下行失去同步后,上行也自然无法保持正确的timing alignment.上行失同步典型表现在切换异常或边缘覆盖差的场景.

Uu无响应:重点排查影响RF coverage的各项指标和因素.

RL的上下行不平衡也会导致SRB掉话。当然,UE原因也是有的。譬如UE

自身导致的误码,导致SRB/TRB复位。

SRB复位:指的是在信令面,发端采用RLC AM模式传送RRC 消息,但相关定时器Time Out后,仍未收到对端回馈的ACK/NACK消息.这时,发端的RLC实体会发送RESET PDU 给对端,通知对端复位RLC接收实体. 通常SRB复位会导致掉话.

TRB复位:这种情况主要在PS业务上发生,voice和VP业务不会产生TRB 复位。一般可以通过确认掉话发生时的UE发射功率或者下行码发射功率情况来辅助确认.

下行的干扰通常是指导频污染,指覆盖地区存在3个以上的小区满足切换条件,由于信号的波动常常出现活动集替换或者最优小区发生变化,通常当活动集综合质量不好(CPICH的EcIo都在-10dB左右波动),容易出现切换失败导致SRB复位,也可能出现TRB复位。

上行的干扰增加了连接模式的手机上行发射功率,从而产生过高的BLER导致SRB或者TRB复位或者由于失步导致掉话。

七、总结

掉话问题的产生是很复杂的,对于有些地方的掉话原因要进行仔细分析,避免被表面现象迷惑,找出问题的根本原因才能彻底解决问题。

相关主题
相关文档
最新文档