EVDO掉话率优化指导书
深圳EVDO掉话率优化指导书
华为技术有限公司
版权所有侵权必究
目录
1 概述 (3)
1.1 掉话的定义 (3)
1.2 掉话机制 (4)
1.2.1 反向掉话机制 (4)
1.2.2 前向掉话机制 (4)
1.3 掉话的相关话统 (5)
1.3.1 掉话率 (5)
1.3.2 连接成功次数 (5)
1.3.3 连接正常释放次数[次] (5)
1.3.4 连接释放次数(空口丢失)[次] (6)
1.3.5 连接释放次数(其它原因)[次] (6)
1.3.6 连接释放次数(休眠态定时器超时)[次] (7)
1.3.7 连接释放次数(休眠态定时器超时AT无响应)[次] (7)
1.4 掉话的分类 (8)
1.4.1 空口丢失 (8)
1.4.2 其它原因 (8)
2 掉话问题分析处理思路 (9)
2.1 整网问题分析思路 (9)
2.2 TOP小区优化思路 (10)
2.3 TOPN小区优化流程图 (12)
3 掉话常见原因及处理方法 (13)
3.1 异常用户 (13)
3.2 用户直接拔卡 (14)
3.3 1X/DO互操作 (15)
3.4 设备告警 (15)
3.5 RSSI异常 (16)
3.6 覆盖差 (17)
3.7 邻区配置不合理 (18)
3.8 PN复用不合理 (18)
4 影响掉话的常见参数 (19)
5 相关案例 (21)
5.1 异常用户产生大量掉话 (21)
5.2 空口问题造成指标不良 (23)
5.3 邻区问题导致掉话指标不良 (26)
5.4 参数设置不合理导致掉话指标异常 (27)
5.5 邻小区闭塞导致切换失败次数超高 (28)
5.6 DO终端频繁掉线问题 (29)
1 概述
在无线通信网络运行中,掉话是运营商关注的热点网络问题之一,也是无线网络质量优劣的直接反映,因此掉话率是衡量CDMA2000 EV-DO系统好坏的重要指标。掉话是指各种连接建立成功后的异常释放,主要包括空口丢失和其他原因。无线网络中存在一定比例的掉话是正常的,但对于一些掉话率较高的小区必须进行优化。
本文旨在对EV-DO网络中的掉话分析提供一些思路和方法。
1.1 掉话的定义
EVDO对于掉话的定义是:已经成功建立的连接(AN收到A9-Update A8 Ack后),由于某种异常原因导致连接释放。EV-DO的呼叫释放有可能是AT发起的也有可能是AN发起的,掉话统计都是AN发起的呼叫异常释放。
AN发起的呼叫释放流程如图1-1所示:
(注:“休眠态定时器超时”和“休眠定时器超时AT无响应”属于正常释放,不会统计到掉话中)
图1-1 EV-DO连接性能统计(AN发起的释放)
关于掉话的几点说明
1、数据业务空口连接掉话,会由终端或系统侧重新发起连接,对用户感受的影响不像1x
掉话那么明显。
2、有部分DO连接掉话是因为DO-1X互操作导致的,影响指标但对用户感受没有影响。
3、用户异常行为如直接拔卡也会被系统侧统计成空口掉话。
1.2 掉话机制
1.2.1反向掉话机制
AN定义了反向掉话机制:当反向DRC无法正确被系统解调时,AN启动对应的定时器,若在指定时间内还没有正确解调出DRC,则AN会发起释放,记为一次掉话。
反向掉话流程如下图所示:
当BTS无法解调DRC时,向BSC发送Abis-DO ForwardStopped消息,FMR启动监控定时器(缺省为3s),若在该定时器内没有收到Abis-DO ForwardRequest消息,FMR向CCM发送SDU_CCM_Forward_Stop消息,同时CCM启动107号定时器(缺省为5s),若在定时器内没有收到数据传输恢复消息,则为一次反向掉话。
注:FMR和CCM为AN的内部模块。
1.2.2前向掉话机制
前向掉话机制:当终端连续检测到DRC为0超过“(DRCSupervisionTimer ×10) + 240 ms”就会关闭反向发射机,然后再等待12个控制信道周期,即5.12s,这段时间内如果DRC 仍然持续为0,则手机会转到Inactive态,即终端侧掉话。
无论是前向掉话还是反向掉话,在话统中一般都体现为“空口丢失”掉话。如果终端先
于系统掉话,并且在系统释放连接之前又向系统发送了CR消息,那么系统会将原来的连接释放,掉话原因统计为“其他原因”。
1.3 掉话的相关话统
1.3.1掉话率
话统中掉话率指标的计算公式为:
([连接释放次数(空口丢失)[次]]+[连接释放次数(其它原因)[次]])/[连接成功次数])*100 1.3.2连接成功次数
指标含义:所有连接建立成功次数的总和(次)。
计算公式:[A T发起连接成功次数] + [AN发起连接成功次数]
1.3.3连接正常释放次数[次]
指标含义:已经成功建立的连接正常释放的次数。
统计点说明:已经成功建立的连接(在AN收到“A9-Update A8 Ack”后),由于正常释放原因发起释放时统计,正常释放原因包括:
1、AT发起的连接释放,如图1-3中A点所示:
图1-3 A T发起的连接释放流程
2、PDSN发起的正常连接释放,如图1-4所示,原因值包括Dormant释放和正常释放。
图1-4 PDSN发起的连接释放流程
3、AN发起的正常连接释放,包括AT进入Dormant态引起的连接释放、AT切换到其
他AN时引起的连接释放、会话释放引起的连接释放、配置协商完成后发起的释放、配置协商失败后发起的连接释放、鉴权成功后发起的连接释放、鉴权失败后发起的
连接释放、测试呼叫完成后的连接释放和操作维护引起的连接释放等。
1.3.4连接释放次数(空口丢失)[次]
指标含义:已经成功建立的连接因为空口丢失而释放的次数。
统计点说明:已经成功建立的连接,由于空口丢失发起释放,即AN在一段时间内无法捕获AT信号从而释放连接时统计,此时AT可能关闭发射机或者转入1X网络等,如图1-1中的A点。
1.3.5连接释放次数(其它原因)[次]
指标含义:对于已经建立成功的连接,除了因“连接正常释放”、“空口丢失”、“休眠定时器超时”和“休眠定时器超时AT无响应”之外的其它原因而释放的次数。其中也包括因专线用户接入而导致的连接释放,即专线用户接入时由于接入载频支持的用户数已经达到每载频的最大用户数,为保证专线用户接入,则按照优先级从低到高的次序选择一个低优先级用户释放其一个分支(如果该用户只有一个分支,则释放连接),将释放的资源分配给接入的专线用户。
统计点说明:已经建立成功的连接由于上述三种释放原因之外的其它原因发起连接释放
时统计。
1.3.6连接释放次数(休眠态定时器超时)[次]
指标含义:已经建立成功的连接因为RLP的休眠定时器超时而释放的次数。
统计点说明:已经成功建立的连接(在AN收到“A9-Update A8 Ack”后),由于AN的RLP休眠定时器超时而发起连接释放,即RLP在一段时间内没有数据收发而引起休眠态释放时统计,如图1-1中的B点。
“休眠态定时器超时”属于正常释放,不统计在掉话中。
1.3.7连接释放次数(休眠态定时器超时AT无响应)[次]
指标含义:在因RLP的休眠定时器超时而发起的连接释放过程中,AT对AN发送的“ConnectionClose”消息没有响应的次数。
统计点说明:已经成功建立的连接,由于RLP的休眠定时器超时发起释放,AN发送“ConnectionClose”消息后收不到AT应答的“ConnectionClose”消息时统计,如图1-1中的C 点。
“休眠态定时器超时AT无响应”属于正常释放,不统计在掉话中。
1.4 掉话的分类
由于掉话问题一般都是从话统指标观察中得到,所以本文也按照话统指标中定义的连接释放种类来描述,主要有两类:“空口丢失”和“其它原因”。
其中“空口丢失”在CDR中对应的释放原因值为0x272F;“其他原因”最常见的释放
原因值为0x120E。
1.4.1空口丢失
“空口丢失”是指:已经成功建立的连接(在AN收到A9-Update A8 Ack后),由于空口丢失发起释放,即AN在一段时间内无法捕获AT信号从而释放连接。类似于1X里面的C05掉话。
1.4.2其它原因
“其它原因”是指:已经建立成功的连接(在AN收到A9-Update A8 Ack后),由于“连接正常释放”、“空口丢失”、“休眠定时器超时”和“休眠定时器超时AT无响应”等原因之外的其它原因而产生的释放。如在连接态收到AT的连接请求导致连接释放,设备、链路故障导致的连接释放等。对应的原因值有很多,最常见为120E。
0x120E,指的是系统在激活态又收到终端上报的连接建立请求导致连接异常释放。
EVDO空口协议中规定,当终端连续检测到DRC为0超过“(DRCSupervisionTimer × 10) + 240 ms”(由于DRCSupervisionTimer的默认值是0,
那么这个时长就是240ms)就会关闭反向发射机,然后再等待TFTCMPRestartTx
(12个控制信道周期,即5.12s),这段时间内如果DRC持续为0,则手机会转到
Inactive态。由此可知,终端的掉话定时器实际上是“240ms+5.12s=5.36s”
所以有时终端已经将空口连接释放了,而系统侧还没有释放,此时如果终端再发起连接,会导致前一次连接异常释放,CDR中记录的释放原因值为0x120E。
2 掉话问题分析处理思路
2.1 整网问题分析思路
1、采集相关数据。
a)话统(包括BSC级、载频级,至少一周的数据,包括全天指标、忙时指标、各个时
段指标,包括关联指标如:连接成功次数、各种原因值的连接释放次数、软切换成
功率、AN间切换成功率、1X话务模型、DO话务模型、DRC申请速率、用户远近
点分析比例、RSSI等)
b)日志/CDR
c)告警(包括检查驻波、GPS锁星状态、传输等)
d)后续根据分析的需要再采集其他相关数据,如操作记录、参数、邻区、路测数据等。
2、分析话统、日志或CDR,获得整体认识(先整体再局部),检查问题存在的规律,如分
布范围、原因值分布、IMSI分布、时间相关性等。
a) 问题范围及分布规律:通过查询话统(如需要可结合日志、CDR)分析掉话分布
的范围,是全局分布还是集中在某些载频?或集中在连片的区域?或集中在某个频
点?
b)时间相关性:该指标从什么时间开始变差的?还是一直就差?还是只是在某个时间
段变差?如果有明显的时间相关性,那么就需要重点分析在指标变差的时间段,进
行了哪些操作(如参数调整、新开基站、传输割接、版本升级、BSC/BTS故障等)?
c)原因值分布:失败原因值分布如何?有哪些异常的原因值(正常情况下不会出现的
原因值)?
d)用户分布:是否集中在某些IMSI?
e)结合告警、其他指标联动分析:有无异常告警?时间是否与掉话对应?其他指标如
呼叫建立成功次数、各具体原因掉话次数、呼叫建立成功率及失败原因、周边基站
的切换成功率及失败原因、AN间切换成功率等与掉话率有什么一致的变化规律?2.2 TOP小区优化思路
【说明】不管掉话原因值是“空口丢失”还是“其他原因”,引起掉话的原因大部份都是相同的,处理方法也相同。
引起掉话的常见原因有以下方面:
1、异常用户(如终端乱报PN、孖机、MEID为全0等);
2、用户直接拔卡;
3、 1x与DO互操作引起掉话;
4、设备有告警(包括传输中断或传输闪断、时钟告警或GPS锁星不足、BTS板件故障等);
5、 RSSI异常(包括RSSI过高、RSSI过低、主分集差异大);
6、邻区配置问题(邻区漏配、邻区错配、邻区冗余、优先级不合理、1way/2way、超远邻
区等);
7、 PN复用不合理;
8、参数配置不合理(如切换参数、DRC信道增益、去激活定时器等);
9、覆盖问题(如覆盖不连续、室内覆盖差、越区覆盖、导频污染)。
TOPN小区的处理流程
当遇到掉话问题时,建议按如下步骤进行核查,发现问题则按第三章的具体介绍进行处理:
1、话统(结合日志、CDR)分析,掌握整体状况,初步筛选问题原因。
a) 掉话原因值分布。失败原因值分布如何?有哪些异常的原因值(正常情况下不会出
现的原因值)?
b) 掉话IMSI分布。是否集中在某些IMSI?这些IMSI有什么共同规律?如果集中在某
些IMSI,可直接参考下面异常用户分析部分介绍的方法处理。
c) 掉话时间相关性。掉话率是从什么时间开始变差的?还是一直就差?还是只是在某
个时间段变差?如果有明显的时间相关性,那么就需要重点分析在指标变差的时间
段,进行了哪些操作(如参数调整、新开基站、传输割接、版本升级、BSC/BTS故
障等)?或者在指标差的时间段有哪些特点(如大型活动、某时间段有特殊的资费
政策、话务量过高等)?
d) 问题分布范围:本基站各个频点、各个扇区的掉话情况比较,与周边基站的掉话情
况比较。看问题分布是否有规律,如是否集中在某个频点?并分析其异同点,以快
速找到突破口。
e) 结合其他指标联动分析:如呼叫建立成功次数、各具体原因掉话次数、呼叫建立成
功率及失败原因、周边基站的切换成功率及失败原因、AN间切换成功率等与掉话率
有什么一致的变化规律?
2、通过CDR分析,检查是否存在个别异常用户引起大量掉话。
3、通过CDR分析,检查是否存在大量用户直接拔卡导致的掉话。
4、通过CDR分析,检查是否由于1X/DO互操作引起较多掉话。
5、检查是否存在告警(关注告警时间与掉话时间是否对应)。
6、检查载频的RSSI是否存在异常。
7、检查邻区是否配置合理。
8、检查PN复用是否合理。
9、检查参数设置是否合理。
10、通过DT/CQT及数据分析,检查覆盖是否正常。
2.3 TOPN小区优化流程图
3 掉话常见原因及处理方法
本章介绍掉话的常见原因及对应的处理方法,具体处理思路请参考2.1、2.2节的介绍。
3.1 异常用户
对EVDO网络来说,异常用户引起的掉话比例很高,通过CDR或日志分析,往往发现个
别或部分IMSI掉话次数特别多(如深圳网络TOP 10终端的掉话次数可以占到全网掉话次数
的15~20%)。根据以往的经验,一般有如下几种可能:
1、终端缺陷(如北京发现某厂家终端对导频强度测量错误导致乱报PN,严重影
响切换,并且在相同情况下PER是正常终端的20倍)。
2、孖机(同一个IMSI对应不同的ESN,可能经常会遇到。当某用户在激活态时,
其孖机发起连接,则AN会将原来的连接释放;当该用户正在建立连接,此时
其孖机发起连接,则AN会释放原来正在建立的连接,造成连接建立失败)
3、MEID为全0的终端。某些终端由于软件问题,上报的MEID为全0。MEID全
零的终端转换成的ESN都是同一个0x80F28490,因此当存在多个MEID为0
的终端就相当于大量孖机,任一用户发起连接都会将原来的连接释放。
4、覆盖问题。这些用户所处的位置覆盖特别差,导致频繁掉话。
具体分析时,可通过CDR数据分析具体的ESN和IMSI,加上对TOP用户进行电话回访,
找出规律性(是否属于同一种型号的终端?或集中在某几款终端?),以确定问题根因。
?孖机
1)判断方法:通过CDR数据或在维护台信令跟踪来分析IMSI跟ESN的对应关系,
当一个IMSI对应两个或以上的ESN时,就是孖机的情况。
2)解决措施:严重影响用户的话,建议考虑给用户重新开卡解决。
?MEID为全0 (ESN为0x80F28490)终端
1)判断方法:
a)通过CDR分析现网是否有ESN为0x80F28490且有正常连接记录的用户,这
些终端应该是开通了DO业务,但是终端上报的MEID为零。一般来说这些
用户会存在较多1201的接入失败;
b)统计全网ESN为0x80F28490但是未接入成功的用户,这些终端应该是没
有开DO业务,但是终端上报的MEID为零,同样会影响网络DO连接建立成
功率指标。
2)解决措施:推动终端厂家进行终端软件升级。
?覆盖特别差:通过RF或参数调整等手段改善覆盖,可参考3.6节的介绍。
3.2 用户直接拔卡
?现象描述及原因分析
部分DO用户由于个人使用习惯,在上网结束后不按正常的流程将PPP连接先断掉,而是直接拔卡或断电,这样在系统侧会统计为一次“空口丢失”掉话。
实际上这种掉话是由用户行为引起的,不能反映实际的网络质量,但却影响掉话率指标。
?判断拔卡掉话的方法
由于“正常DO用户掉话”和“用户直接拔卡”有不同的行为特点,因此可通过CDR结合其行为特点来粗略判断,找出部分疑似用户拔卡导致的掉话。
行为差异:一般来说,如果用户在上网过程中发生掉话,会在较短时间内再次发起连接;而如果是用户直接拔卡,一般来说上网结束,可能会在较长时间内不会再次发起连接。因此可以结合这个特点,根据用户发生掉话到再次发起连接的时间间隔来判断疑似直接拔卡的情况。
拔卡掉话具体判断方法:通过CDR分析,若同一用户在“空口丢失”的掉话(CDR中释放原因值272F)后30分钟内没有再次发起连接,则认为本次掉话为疑似用户直接拔卡导致的掉话。
?解决措施
目前没有方法能完全准确的找出直接拔卡引起的掉话,CDR的分析只是大概的一个统
计。也无法从话统中剔除,只能通过运营商对DO用户加大拨号上网流程的宣传来适当缓解。
3.3 1X/DO互操作
?现象描述及原因分析
在1x和DO叠加网络中,终端处于DO Rev.A激活态的时候,当满足如下两种条件时终端会切换到1X网络:
1、收到1x的语音或短消息寻呼。
2、终端检测到DO激活集中的所有导频强度低于-7dB,且此时1X导频强度大于-14dB,
这种状态如果持续了4S,终端会停止当前在DO网络中的数据传送,转到1x网络
进行业务。
对DO Rev.A网络来说,这种释放会记为空口丢失的掉话。
?具体判断方法
通过CDR进行分析,对同一个IMSI,如果其DO连接异常释放时间点前有1x连接建立的
记录,并且DO连接异常释放时间点与1x连接建立的点的时间相隔小于8秒(掉话定时器缺
省为8s),则认为该次掉话是由于发生1x、DO互操作引起。
?解决措施
互操作造成的掉话暂时无法解决。在出现该类型的掉话时,需要通过各种手段进行统计和分析,评估其对掉话率指标的影响,以区分掉话问题是真正的空口掉话增多还是互操作掉话导致。
3.4 设备告警
?常见告警
1、传输问题;
2、 BTS时钟问题(常见时钟问题有:GPS天线及连线故障、CK板故障、GPS锁星数<4颗);
3、其他故障。
?判断方法
1、传输告警
a)首先在维护台查询相应的传输告警。
b)结合接入和切换的指标一起分析:
i.如果发现某载扇连接成功率一直很低,且失败原因基本都是“AT发起连接失
败失败(分配呼叫资源失败)”,则很可能是该基站传输中断导致;
ii.如果发现某载扇只是在个别时间段的连接成功率很低(失败原因基本都是“AT 发起连接失败失败(分配呼叫资源失败)”),同时与该载扇有邻区关系的某些
扇区在这些时间段内的软切换成功率也突然变差(失败原因基本都是增加分支
时“要求的Abis资源不可用”),则很可能是该基站传输闪断导致。
2、时钟问题
a) 对于显性的GPS天线及连接故障、CK板故障,可通过告警查询;
b) 对于锁星数过少的,可通过命令DSP CBTSBRDSPECSTAT可查询GPS锁星数,
锁星为0的需立即处理,锁星小于4颗的也要安排工程队检查GPS天线的安装位置
以及跳线质量。
3、其他故障:其他如BSC单板故障、BTS单板故障等也可能产生空口掉话,需要结合告警
来查询确认。
?解决措施
对发现由于告警引起掉话,需要设备侧工程师配合分析设备相关故障。
3.5 RSSI异常
?常见RSSI问题有:
1、RSSI过高(一般认为高于-90dBm为严重异常需马上处理,高于-93dBm需关注并根据实
际情况安排处理)
2、RSSI过低(一般认为低于-113dBm且RSSI长期无变化需要处理)
3、主分集差异大(一般认为大于10dB需处理,实际上要么是某一集过高,要么是某一集过
低,与前面两个原因可能也是相关的)
?引起RSSI异常的常见原因有:
1、工程质量问题;
2、外界干扰;
3、室分直放站/干放/耦合器/功分器等器件导致。
3.6 覆盖差
当前面介绍的原因都已经检查并处理过,掉话率仍然比较高,那么可能就是覆盖原因导致的。需要到现场进行DT、CQT以掌握具体的覆盖情况,同时也可结合CDR辅助分析。
?常见覆盖问题:
1、室外覆盖不连续(孤岛站、遮挡严重、地势起伏等引起);
2、越区覆盖(基站过高、下倾角设置不合理、沿江/沿路、跨海等引起);
3、导频污染(导频杂且弱,无主导频,多出现在密集城区的江面、桥上、建筑物
的高层等场景);
4、前反向链路不平衡(前向很好但是反向却很差,无法锁定反向DRC信道导致
掉话);
5、室内覆盖差(建筑密集,穿透损耗大,室分系统故障等引起)。
?判断方法:
1、室外覆盖不连续:结合路测数据,分析掉话点附近室外的C/I(<-4dB)和Rx
(<-90dBm)是否都较差,如果C/I和Rx都较差则说明覆盖不连续或覆盖差。
2、越区覆盖:
a) 通过分析路测数据,结合单PN覆盖图来判断是否存在越区覆盖;
b) 通过话统统计小区接入距离来辅助判断。
3、导频污染:导频污染可根据以下三种方法判断:
a) 结合路测数据来分析判断;
b)通过统计CDR里面RU中上报的各分支导频强度,如果大于Tadd的分支数
大于或等于4的呼叫记录很多,则认为可能存在导频污染;
4、前反向链路不平衡:通过路测数据分析,当出现服务小区前向覆盖很好,但反
向链路很差,且主要表现为前向的Active PN为A,但反向DRC为Unlocked。这种情况即为前反向链路不平衡。
5、室内覆盖差:结合室内步测数据或CQT数据,分析掉话点附近室外的C/I
(<-4dB)和Rx(<-90dBm)是否都较差,如果C/I和Rx都较差则说明覆盖差。
?解决措施:
针对各类覆盖问题,可以采取如下措施(注意:由于DO一般与1X共天馈,调整时需要结合1X覆盖情况来综合考虑):
1、室外覆盖不连续:通过加站来根本解决;调整方位角、下倾角、挂高、功率来
适当改善。
2、越区覆盖:通过调整功率、下倾角、挂高来控制。
3、导频污染:通过加站、调整功率、方位角、下倾角等方式营造出主导频,抑制
其他导频。
4、前反向链路不平衡:RF优化来改善覆盖;检查是否反向RSSI高导致反向覆盖
不足。
5、室内覆盖差:增加室内分布系统;对由于直放站/干放功率余量不足引起室内
覆盖差的,可以考虑用RRU进行替换。
3.7 邻区配置不合理
常见邻区问题有:邻区漏配、邻区错配、邻区冗余、优先级不合理、1way/2way、单向邻区、超远邻区。
邻区评估可通过Nastar相应的邻区核查功能、同PN疑似错配功能、1way/2way工具、mapinfo、Google Earth等一起来综合判断。
3.8 PN复用不合理
?常见PN复用问题:
1、PN复用距离不够;
2、1way/2way邻区;
移动台根据PN的不同相位来区分不同扇区的信号。当举例较近的两个扇区PN相邻或者相同时,这两个信号到达移动台的时延可能一样,移动台将无法识别出收到信号属于那个
扇区,此时这两个信号互相影响,形成干扰,PER升高,最终可能导致掉话。
?分析判断方法:
1、通过工具把复用距离、层数不满足要求的小区找出来,进行PN调整。
2、进行1way/2way核查,也可发现PN复用问题。
3、BSC边界(尤其是异厂商边界、不同城市边界)需要进行额外核查,避免出现PN
复用问题(如双方未互相考虑边界则必然存在问题;新开站规划PN未考虑对方工参表也极容易导致PN复用问题)
处理措施:当发现PN存在问题时,需要进行PN调整。
4 影响掉话的常见参数