GSM优化指南

北电网络

GSM网络监测和优化指南

(试行)

1 前言 (4)

本书的功能和对象 (4)

内容和结构 (4)

词汇表 (5)

2 网络服务质量的评估和优化 (6)

监测目标、范围简介 (6)

确定网络优化的对象和目标 (7)

2.1.1工作平台 (9)

2.1.2性能观测数据的定义 (10)

2.1.3计数器观测周期和统计报表 (11)

2.1.4网络性能报表的定义 (11)

2.1.5主要的性能指标 (12)

2.1.6 主要优化措施 (13)

2.1.7 网络监测和优化流程 (13)

3 BSS故障分析和优化 (14)

3.1 参数检验 (14)

3.2 分配失败(ASSIGNMENT FAILURE) (15)

问题描述 (15)

故障分析 (16)

解决措施 (17)

3.3 TCH可用性 (18)

问题描述 (18)

故障研究 (18)

解决措施 (19)

3.4 TCH/SDCCH拥塞 (20)

问题描述 (20)

故障分析 (22)

解决措施 (22)

3.5 掉话率(TCH CALL DROP RATE) (25)

问题描述 (25)

故障研究 (28)

解决措施 (29)

3.6 切换失败率(HANDOVER FAILURE RATE) (31)

问题描述 (31)

故障分析 (31)

措施 (32)

3.7 因为下行链路质量触发的切换 (35)

问题描述 (35)

故障分析 (35)

解决措施 (35)

3.8 因为上行链路质量的切换 (36)

问题描述 (36)

故障分析 (36)

解决措施 (36)

3.9 因为下行链路电平的切换 (38)

问题描述 (38)

故障分析 (38)

解决措施 (38)

3.10 因为上行链路电平的切换 (39)

问题描述 (39)

现象分析 (39)

解决措施 (39)

3.11 因为距离的切换 (40)

问题描述 (40)

故障分析 (40)

解决措施 (40)

3.12 RACH有效性 (41)

问题描述 (41)

常见故障现象 (41)

故障分析 (41)

解决措施 (42)

3.1.1Case 1: 建立请求数低 (44)

3.1.2Case 2: Avg Lev. of Non decoded RACH值高 (45)

3.13 没有话务量/切换/SDCCH (46)

问题描述 (46)

故障分析 (46)

解决措施 (46)

4 射频(R F)优化 (47)

上、下链路的干扰检测 (47)

4.1.1上行链路的干扰 (47)

4.1.2下行链路的干扰检测 (48)

上、下链路平衡验证 (50)

4.1.3链路平衡分析的预备信息 (50)

4.1.4现场数据采集 (50)

4.1.4.1 采用协议分析仪收集数据 (50)

4.1.4.2 利用OMC-R的C all PATH TracinG或C ALL TRAC E C ONTROL (51)

4.1.5数据处理及分析 (52)

4.1.5.1 数据处理 (52)

4.1.5.2 数据分析 (54)

上下链路平衡在设计上的考虑 (58)

5 网络的话务量及移动性分析 (62)

简介 (62)

小区的呼叫模型 (62)

确定小区忙时 (62)

小区呼叫模型的组成元素: (63)

BSC的呼叫模型 (68)

确定BSC的忙时 (68)

BSC呼叫模型的组成元素: (68)

MSC的呼叫模型 (73)

用户呼叫模型 (75)

BHC A m easurem ent (75)

附录 1 计数器列表 (77)

附录 2 常用的BSS性能报表项目的计算公式 (80)

1 前言

本书的功能和对象

随着北电GSM设备的广泛应用,网络系统结构日趋复杂,对网络的日常维护和优化提出了更高的要

求。另一方面,随着网络用户数量的激增,运营商对网络服务质量也提出了更高的要求。为了帮助

现场技术人员更好的监测、维护和优化采用北电设备的GSM网络,北电网络工程技术部(Department

of Engineering, Network Solutions)编写了这本“GSM网络监测优化指南”。

本指南针对移动通信网中常见的故障现象,如掉话、干扰和拥塞等,提出了相应的检测、分析、故

障诊断和处理流程。重点介绍了网络服务质量监测和优化的数据采集、分析方法、工具使用及优化

实例。本书的主要应用对象是北电BSS系统及OMC-R V9版本。

本书供负责网络优化(NSS+BSS)工作的系统工程师以及无线工程师在网络监测和日常优化工作中使

用。

维护人员技术要求:

1.具备GSM规范的基础知识;

2.参加过北电GSM系统的基本培训,包括GSM运维基础(OM1、OM2)、BSS参数优化(NE2)和网络

优化基础(NEO)等;

3.有一定的GSM网络维护经验,熟悉北电的OMC-R运维平台

4.掌握网络监测和优化工具的工作原理、应用范围和使用方法(CT7200、CT7300、CT7400、覆盖路

测数据采集和分析、系统分析仪表、接口协议分析仪表等)。

内容和结构

本指南由三部分组成。

第一部分为一般性的优化原理,主要介绍网络性能指标、监测手段、优化工作的内容和工作流程。

第二部分则更重实用性,针对各种常见网络性能问题,逐个进行现象分析、原因调查并建议了故障

处理和优化程序和方法。主要内容有:信道分配失败、掉话、拥塞、切换失败、各种原因造成的紧

急救援性切换、干扰等。

第三部分讨论无线优化。重点介绍无线链路平衡的检测方法和分析方法。结合常规的路测数据,无

线信道电平和误码率的统计分析是解决干扰,优化覆盖的重要手段。

词汇表

以下是本手册中的常用词汇。

NQO 网络质量优化

NEO 网络优化

NQO 网络检验与优化

RSV 无线覆盖检测

QOS 服务质量

2 网络服务质量的评估和优化

监测目标、范围简介

本章讲述了网络服务质量监测的过程、方法、工具及所需处理的数据。

我们这里谈到的服务质量的监测,主要是指利用BSS系统中固有的性能统计机制,定期地对网络运

行状态进行分析,因此只有当网络拥有相当数量的用户时,统计数据给出的结果才会具备可靠性和

真实性。

移动通讯网络是一个动态的多维系统,一旦投入使用,它会在以下四个主要范畴里发生变化:

?终端用户的变化(新的呼叫模型,用户的地理分布)

?网络的运行环境的变化(新的建筑,道路,植被)

?网络结构的变化(覆盖范围,系统容量)

?应用技术的变化(新设备,新标准,新业务)

因此网络优化工作和相关的监测工作将会伴随着目标网络的发展而循序渐进,不可能一蹴而就。要

求运行商和设备厂商之间密切配合,充分发挥设备能力,以保证终端用户得到优质的服务。

除了分析处理系统的定期观测数据以外,日常的维护、故障排除工作也是和网络的性能密切相关的。

因此有必要对系统的维护工作进行记录跟踪,并向网络监测优化小组及时报告。

最后我们给出了一个有关移动网络从设计到最后投入使用的工作流程,从中可以发现,整个过程都

会影响到后期的网络性能,因此从网络性能的监测及优化的角度来看,必须对每一个环节进行密切

的质量控制。

确定网络优化的对象和目标

网络中存在的问题和需要改进之处是指那些没有达到性能要求的部分。进行优化工作(包括日常性优化和阶段性优化)的主要目的是解决: - 局部网络或个别网络单元(小区)的性能明显低于网络平均水平; - 一项或多项指标突明显恶化。

- 网络运营质量未达到运营商的预期目标。

网络性能主要包括成功率和资源利用率两个方面,据此还可以再细分为各种具体的指标。并由此定义出各种指标的允许门限值,此类门限值的集合就构成了NEO 模板,NEO 模板实际上就是运营商对

网络质量要求的量化定义。需要强调指出的是,NEO模板或网络性能指标应根据网络的实际情况确定。

在NEO模板建立以后,一旦发现网络的某一项性能指标超出模板的门限要求,即需对其进行分析处理。如下图所示:

图2.2 QOS 监测流程

2.1.1 工作平台

下图是为分析网络性能及开展优化工作所要求的基本工作的平台:

接入数据库处理

存储

数据库接入

图 2.3 网络监测优化平台

2.1.2 性能观测数据的定义

有关 BSS 性能的信息,包含以下内容。

北电GSM 系统的运行统计是由大量计数器(counter )完成的,计数器由BSC 的软件实现,并定期向OMC-R 报告计数结果。

每一个计数器都和BSS 中的某一网络单元的某一事件相关,即某一特定事件的发生会触发对应的计数器作加一计数,这样通过在某一观测时间段内对某一事件的发生次数进行统计,就得到网络的运行统计。观测和分析OMC-R 各计数器 数值,就可掌握网络的运行质量并进行故障分析,这里要求监测人员必须具备GSM 网络的呼叫控制,信道管理,干扰分析等基础知识。 观测记录数据的提取由以下两部分组成 :

? 数据采集。每隔一段时间(如30分钟),计数器会刷新一次,把所得到的 ? 数据转存到BSC 的硬盘中。

? 观测结果通过FTAM 协议传到OMC-R 。

计数器往往按通信过程分类。以下是几类直接影响网络性能的重要过程: ? CCCH ? 无线资源分配 ? 信道模式

?专用信道分配

?切换

?信道释放

?信道建立

而网络监测所最关心的网络单元有

?Abis 接口,

? A 接口,

?BSC,

?小区,

?

?邻小区表,

?相邻小区对。

对于上述过程和单元,北电管理系统多定义了采样点和计数器。利用这些计数器,我们可以定义一

系列的公式进行掉话率、堵塞率、切换成功率、寻呼成功率等指标的计算并提供网络运行的统计报

表。

2.1.3 计数器观测周期和统计报表

这是指计数器的记录/刷新时间。在报表中一般有忙时和全天监测两类。忙时的确定可分为网络忙时

和系统单元忙时:前者由NSS话务统计的峰值时间确定,后者则为统计对象的话务峰值小时(例:小

区忙时)或系统负荷峰值时间(例:SCID忙时)。

往往有必要在一天中的多个观测时段内采集数据以监测网络/小区/单元等在一天中的不同时间的话

务变化和负荷变化。尤为值得一提的是,在进行干扰分析时,研究干扰强度的昼夜变化,有助于确

定干扰性质,比如:判断是系统内干扰或外来干扰。

附录1. 中列出了主要计数器的编号和意义,供读者参考。

2.1.4 网络性能报表的定义

计数器几乎记录了所有事件。但要准确明了地反映网络运行情况还需要对计数器的原始数据进行二

次计算,从而得到的网络性能报表。报表中的质量指标将网络性能的定量描述与终端用户对服务质

量的感受直接连系起来,更便于理解和应用。主要有这些方面:

?掉话,

?呼叫困难(阻塞, 干扰...),

?网络接入(大覆盖, 室内覆盖...),

?话音质量.

任何一方面一旦出现问题,都会降低网络总体服务质量,必须及时处理。网络质量下降的原因可分

为两类:

1.硬件故障,如坏板或局部设备中断服务。这类故障一般会在OMC-R上产生相应的告警信息,

现场维护人员须查明故障位置、类型并及时解决。

2.软故障,系统仍然运行,但出现局部不稳定状态或处于非最佳状态。如干扰、邻小区定义

不完整、PCM工作不稳定等。从而导致服务质量下降,如:掉话率上升、接通率下降等。

这些问题必须由优化人员通过网络性能监测、分析并采取相应优化措施。

对于后者,通常采用三种方式进行故障监测和诊断:

1.网络观测结果与目标门限(NEO模板)相比较。预先确定一组门限(质量模板),一旦发现某些网络

单元超标(如5%掉话率),即定为优化对象,进行进一步分析和故障处理。需要强调,每一个门

限应根据网络的实际情况确定,同时考虑到:

?局部与整体的关系,集中力量解决个别超标小区。

?网络维护水平,高水平的日常维护是优良网络性能的前提条件。

?网络的动态发展,不同规模、不同覆盖水平的网络显然要求不同的门限指标。

2.动态变化比较。如网络稳定运行,各观测项目不应有大的浮动。一旦发现局部网络的性能突然

恶化,如1%掉话率激增至3%,应引起充分重视。通过预置变化量门限,可以筛选出这类问题,

以保证网络的稳定运行。

3.N个最差小区。在日常优化工作中,每阶段对几个最差小区的故障处理可有效的提高整体网络

性能指标。

2.1.5 主要的性能指标

掉话

由计数器提供的数据计算出掉话率,即掉话数与通话数之比,包括网络掉话率和小区掉话率。

呼叫建立失败

这是评价用户发起呼叫的难易程度,当小区未达满负荷时,我们定义成呼叫建立失败数与呼叫请求

数之比。

TCH 分配失败

这也是指小区容量未满时,用户呼叫的难易,但与呼叫建立失败率不同,它是

TCH分配失败率。移动台不能接入预期的信道。

TCH阻塞率& SDCCH阻塞率

这是指由于小区容量已满而造成的呼叫困难。TCH(SDCCH)阻塞率是分配失败数(由于TCH (SDCCH)

不足)除以TCH (SDCCH)请求分配数。

切换失败率

这是对切换过程的质量评估,定义为:切换失败数/切换请求数。切换是对服务质量影响最大的一个

方面,尤其是掉话,但用户一般并不能直接感受到。

不能解码的RACH平均电平值

这个指标对终端用户来讲是不可见的,但它间接地反映了通话质量的好坏。而且这个指标对于对检

测硬件问题和干扰有很大帮助。

小区承载的E rlang

如果某小区无话务,说明该小区有硬件故障。反之,如果话务非常高,就要考虑小区容量问题。高话

务量对TCH和SDCCH阻塞率都有影响,并可能演变成为终端用户可感觉到堵塞现象。一定的容量冗

余对于应付突发事件(如体育比赛)是必要的。另外,话务量往往还对网络性能产生间接影响。如小

区话务突然下降,应考虑是否小区覆盖变小,如新建筑或广告牌阻挡天线。

BSC 容量

这个指标主要涉及到BSC中各种CPU在忙时负荷的百分比,以及不同的事件对CPU负荷的影响。其中

包括SICD,SUP,MPU,BIFP的最大及平均负荷的统计。

2.1.6 主要优化措施

为了使网络优化工作的覆盖范围及责任更清楚、明了,可将日常优化工作分为四个主要部分:

?网络监测,及时发现并解决可能减低网络服务质量的故障和潜在问题,

?BSS参数的局部调整。

?射频优化(包括覆盖范围的调整,干扰的消除)。

?系统容量及话务负荷的调整。

这三项内容是互相密切结合的。首先,网络监测是一切优化工作的基础。而经常不断的预防性维护和优化则是保证网络正常运行和深入优化的前提条件。对网络不同方面的优化又往往是互相关联的,比方讲在进行系统容量及话务负荷的调整时,有时可以通过适当调整相邻小区之间的覆盖范围大小来实现,而不是去直接调整设备资源,如增加小区配置的载波数量。而在进行无线参数调整时,又可以通过合理控制小区的切换,位置更新,小区重选等事件,从而达到减轻BSC负荷提高系统容量的目的。反过来看,在话务和系统容量合理匹配时,又可以达到降低掉话,提高切换成功率的目的,尤其对于跳频系统意义尤为显著。

考虑到对现场维护和优化工作的实用性和指导性,本书将用主要篇幅去探讨网络常见的故障,结合网络监测分析各种现象,原因,并建议了常用的优化措施,如BSS参数的调整等,这也是在优化工作中最为重要和复杂的部分。对于射频优化部分,本书中将不具体讨论站址考察,路测分析和天线的调整等,而是主要针对较为普遍的上、下行链路的不平衡,干扰和常见故障等问题进行讨论。

2.1.7 网络监测和优化流程

3 BSS故障分析和优化

在下面的内容里,将按照主要的网络性能指标,分不同的小节具体讨论故障可能涉及到的原因,调

整哪些BSS参数可以改善它,以及如何利用相关计数器观察参数调整前后的变化。

3.1 参数检验

网络优化的第一步是验证并清理当前BSS参数的设置,主要检查BSS参数表中的缺省值及与缺省值相

异的参数,有否因为引进新设备和软件升级造成BSS参数设置上的混乱,较为常见的有小区的邻小

区表与小区本身参数表的不一致或小区定义不平衡、不对称等问题。

CT7400(又称Netconf)是检验BSS参数设置一致性的重要工具。一旦发现有不正确的参数或疑点,应

尽快通知工程设计人员核查并及时纠正。

3.2 分配失败(assignment failure )

移动台在SDCCH 信道向BSC 发出要求分配TCH 信道的请求,而未能成功接入TCH 信道的情况。必需是移动台主叫或被叫,不包括切换(除小区内切换)。

问题描述

M SC

BSC

BT S

M S

A SSIG N RE Q U E ST CH A N N E L A CT IV A T IO N CH A N N E L A CT IV A T IO N A CK A SSIG N CO M M A N D

SA BM

U A

A SSIG N FA IL U RE (1)

B S

C 无法完成M S C 的信道请求B T S 无法完成B S C 的信道请求M S 无法占用B S C 所指派的信道

ASSIGNMENT …FAILURE 是和ASSIGNMENT …REQUEST 对应的,反映了一次TCH 分配失败。其原因多数情况下是由于没有空闲的信道,当然还包括了其他原因,如上图所示。我们所说的是第(3)种情形,这一部分我们只研究发生在空中接口的信道指派失败。

计数器C1049(分配请求,BSC 向MS 发出的消息个数)和C1055(分配失败,BSC 检测到的由于无线链路失败而造成的分配失败次数),可用来计算 分配失败率。 下面是一个实际例子,表中列出了30个分配失败率最高的小区:

故障分析

? TRX 故障:TRX 的RTS 部分或全部停止工作,造成TRX 不能正确解码MS 发出的消息。且分配失败率与发生故障的RTS 成比例。 ? 干扰:由于干扰引起误码率高,移动台不能与BTS 建立起第二层链路,导致分配失败。 大多数情况,可按按失败率的高低,大致判断故障原因:

如果某小区分配失败率超过10%,那么TRX 故障可能性最大;如果大于5%,一般怀疑是TRX 故障或干扰;如果在3%与5%之间,那么可能是由阻塞或干扰引起;低于 3%,通常是无线环境影响。

解决措施

1、为了更准确地定位故障点,还需检查小区的切入切换执行失败率:确认切换失败(HO执行- HO

成功)/HO执行是否与分配失败率相关。在空中接口的信道接入,移动台和切换目标小区建立第二

层链路的过程,类似于呼叫建立时的信道指派过程。

2、分配失败率高(大于5%):怀疑TRX问题。运维人员应检查OMC-R告警记录(往往是某一Rx模

块出现故障)。如果从OMC-R上未发现问题,可进行Abis接口观测,北电BSS设备的呼叫路径跟踪

功能可以帮助找出分配失败的具体TRX (设备号为TEI)中的RTS(见第4章)。

3、上行链路信号丢失或接收路径失败也可导致失败。小区路径均衡测量可以找出失败的原因。路径

均衡测量可采用Abis跟踪分析仪或路径测量统计。

4、干扰:这时高分配失败率往往伴随其他现象,如:大量由于质量(高BER)触发的切换,RACH解

码电平过高等。进行路测可帮助发现系统内干扰。

5、阻塞:检查该小区分配失败与拥塞率的相关性。

分配失败的完整分析过程如下:

3.3 TCH可用性

问题描述

可用TCH(C1056)是指每小区TCH信道平均可用数。在日常观测中设置为从0至小区所配置的数量。计

数器C1056与最大值的差别表示小区信道即时故障率。在下面给出一个统计实例(见图2.9):

图2.9。TCH 可用性

故障研究

需要参考OMC-R上小区,基站,BSC,PCM的告警,观察分析。

可能是某个TRX不稳定或物理连接出现问题,如PCM中断等。

解决措施

可用性是维护工作的重要检测指标。另一方面,对于移动通信网,故障设备还可引发一系列的运行

问题。

?当发现网络性能下降时,如怀疑硬件故障,应注意由它们引起的其它告警。检测相关设备的链路故障,特别是由于设备不可用而触发的切换, RLT,拥塞等。并尽快解决。

?检查OMC-R的notifications 记录。

?在作数据分析时,可以将可用TCH低于配置数量的小区按他们的归属BSC可用性和相关的PCM可用性进行排队处理,并作TCH可用性和PCM可用性的相关性分析以明确故障原因。

?统计相关小区的稳定性(包括基站,BSC,PCM)。维护人员应检查设备运行记录。一旦确认,须尽快解决。

3.4

TCH/SDCCH 拥塞

问题描述

SDCCH 信道的申请与分配

(1) T he B SC can 抰 allo cate the reso urce requested by the M o bile

M SC

BSC

BTS

M S

C HA N N EL A C TIV A TIO N C HA N N EL A C TIV A TIO N N A C K IM M E

D IA T

E A SSIGN EM EN T R EJEC T

R A C H/C HA N N EL R EQ U EST

(1)

T3122 starts at the M S

当BSC 根据 ? Channel Activation Nack ?而每发送一次? Immediate Assignment Reject ?时,计数器C1036? SDCCH 分配失败 ?将累加一次。实际上,当没有可用SDCCH 时,BSC 将向移动台发出? Assignment Reject ?,该消息还包含T3122, 它定义了暂时禁止移动台发出下次呼叫的最小时间间隔。

TCH 的申请与信道:

(1) T he B S C can ’t allocate the resource requested by the NS S (2) T he B T S can ’t activate the channel requested by the B S C (3) T he m obile can ’t get hooked on the proposed channel

在此,我们讨论的情形是(1)。当BSC 向MSC 发送ASSIGN FAILURE (原因 = 没有无线资源)时,计数器C1039?TCH allocation ailure ? 会累加一次。

TCH 堵塞率是因为没有空闲的TCH 资源,而造成的TCH 分配失败数除以总的TCH 分配请求数。 注意 TCH 请求总数中包含SDCCH 溢出到TCH 和呼叫重建对TCH 的申请。 TCH 拥塞率和 SDCCH 拥塞率的具体计算公式 (每小区)是:

相关主题
相关文档
最新文档