西安MOS提升专题

西安MOS提升专题
西安MOS提升专题

2011年5月西安集团自动路测指标提升阶段小结

网络优化中心

2011年5月

目录

1概述 (4)

2MOS3.0 专项分析及提升 (5)

2.1MOS指标原理解析 (5)

2.1.1语音评估系统简介 (5)

2.1.2PESQ算法简介 (6)

2.1.3PESQ系统 (7)

2.1.4主客观评估结果的比较 (19)

2.1.5范围和应用 (20)

2.1.6小结 (20)

2.2MOS3.0指标主要影响因素解析 (21)

2.2.1语音编码影响分析 (21)

2.2.2切换影响分析 (21)

2.2.3算法影响分析 (22)

2.3MOS3.0指标提升方案与实施 (23)

2.3.1MOS3.0 整体指标提升方案概述 (23)

2.3.2错误参数设置纠正 (24)

2.3.3降低半速率占比 (25)

2.3.4冗余切换控制 (27)

2.3.5PBGT LIMIT调整 (28)

2.3.6功控与切换参数优化 (31)

2.3.7900M/1800M话务转移 (41)

2.3.8微蜂窝泄露控制 (58)

2.3.9无线覆盖控制 (60)

2.3.10下步计划 (60)

3全程呼叫成功率分析及提升.....................................................错误!未定义书签。

3.1接通率分析及提升.......................................................... 错误!未定义书签。

3.1.1接通率指标分析 ....................................................... 错误!未定义书签。

3.1.2接通率提升方案 ....................................................... 错误!未定义书签。

3.1.3接通率提升下步计划 ................................................... 错误!未定义书签。

3.2掉话率分析及提升.......................................................... 错误!未定义书签。

3.2.1掉话率指标分析 ....................................................... 错误!未定义书签。

3.2.2掉话率改善方案 ....................................................... 错误!未定义书签。

3.2.3掉话率改善下步计划 ................................................... 错误!未定义书签。4质量分析及提升..............................................................错误!未定义书签。5最差网格指标提升 ............................................................错误!未定义书签。

5.1最差网格问题分析思路...................................................... 错误!未定义书签。

5.1.1全程呼叫成功率优化思路 ............................................... 错误!未定义书签。

5.1.2MOS3.0占比优化思路 ................................................... 错误!未定义书签。

5.1.3质量占比优化思路 ..................................................... 错误!未定义书签。

5.1.4路测小区梳理 ......................................................... 错误!未定义书签。

5.1.5风险点应急优化思路 ................................................... 错误!未定义书签。

5.1.6切换序列梳理-切换通道 ................................................ 错误!未定义书签。

5.1.7网格14专题优化前后指标对比 ........................................... 错误!未定义书签。

1概述

以下指标为:4月份(截止4月13日)陕西西安集团自动路测指标(取所有网格平均)和5月份(5月16日至5月26日)陕西西安集团自动路测指标(取所有网格平均)的主要测试指标

升。

而5月份,随着优化的深入,呼叫全程完好率与MOS占比也在不断改善。

以下章节就主要测试指标项:MOS3.0占比、全程呼叫成功率、道路测试Rx_Quality分析提升工作,及最差网格的指标提升思路及案例进行介绍。

2MOS3.0 专项分析及提升

2.1MOS指标原理解析

2.1.1语音评估系统简介

现代通信网络无法通过信噪比来完全确切地评估其通信质量。简单地测试信噪比无法对其它参数进行评估,如译码损耗、误码以及话音活动检测等等。语音质量的评估可分为主观和客观两种。ITU-TP.800定义了MOS的主观测试方法,客观测试方法主要有:PSQM、MNB、PSQM +、PAMS99、PESQ等。主观评估即采用人耳来感受评估,具体方法为测试人员通过测试电话、手机等来现场感受话音质量。通信网络是个实时的监控系统,采用主观评估方法不仅费时费力,而且往往受测试条件的限制和测试人员主观因素的影响,测试结果的可靠性受到各方面的质疑。客观语音评估方法一般可分为时域、频域和听觉域的评估方法。时域和频域评估方法是利用网络中的一些客观参量来反映语音质量,如信噪比、误码率、接收质量等等。但是这些客观参量不能准确反映人们的主观感受,因此,听觉域的评估方法更受关注。

听觉域的客观语音评估算法利用人耳的听觉模型,用客观算法对主观评估过程进行一定程度的模拟。目前能提供主客观相关性较高的音质客观评价方法,都是考虑了人耳的听觉特性,使用听觉感知模型来模拟收听这一过程的。因此当前的主流是使用感知(听觉域)模型来评估非线性和易出错的音频通信系统。

评价语音服务等级即QOS的主要尺寸是端到端的通话话音质量。话音质量的评估对设备选型、监控和差错排查、服务等级分类以及网络优化等都有非常重要的意义。

影响现代通信系统语音质量的因素有很多,主要包括以下几点:

◆背景噪声

◆静音抑制

◆低速率的编码方式

◆误码(移动或者数据)

◆时间延迟

◆回音

◆手机或者接入网的过滤

相对来说,以前的质量评估模式(例如ITU-T P.861 PSQM, P.861 MNB, PSQM+ 等)只用在窄带编解码测试中,并且无法对某些类型的编解码、背景噪声和端到端的影响,比如滤波和时延变化等给出精确的预测值:

◆无法准确预测一些重要的编码器的质量

◆无法正确计算数据包丢失的噪音和误码

◆无法正确说明模拟器件的过滤方式(例如手机和双线接入)

◆不能处理不同的延迟(通常指IP电话)

感知语音质量测试(PSQM),在1996年被国际电联ITU-T采纳为P.861建议。1998年,一个基于归一化块测试(MNB)的可选系统作为附件添加到P.861中。MNB是在考虑听觉过程的基础上,采用MNB方法来模拟人的判断过程,评价结果与主观评价相关度较高。Hollier扩展了巴克谱失真(BSD)模型,引领了感知分析测试系统(PAMS)的发展。PAMS是第一个关注端到端行为,包括滤波和时延变化所造成的影响的模型。这些因素,再加上某些类型的编码失真、包丢失和背景噪声等,造成BSD,PSQM和MNB等早期模型无法准备评估网络的语音质量。因此ITU-T 12研究组进行了一项实验来寻找一种新的模型,以期能适应更广泛的编解码器和网络情况,具有更好的性能和表现。对各种模型进行比较后,研究组发现PAMS和PSQM99(PSQM的更新和扩展版本)两种算法的性能最好,在这两种算法的基础上产生了一个新的模型,叫做PESQ。2001年2月PESQ被定为P.862建议。

语音质量感知评估PESQ(Perceptual Evaluation of Speech Quality)模型能提供比P.861模型、PSQM、MNB和主观模型等更好的相关性。它能在更广泛的条件下对主观质量给出精确的预测,包括有背景噪声,模拟滤波,和/或时延变化等。PESQ适用于现代通信网络的语音质量评估(如电话网络和语音编解码等等)。

2.1.2PESQ算法简介

PESQ提供一种客观的测试方法来预测通信网中的主观听觉测试。为了测试语音质量,PESQ 采用了一种感知模型来将原始的、未压缩的参考信号同输出端的质量降低的测试信号进行对比。具体情况下图所示:

参考信号同测试信号两者之间的比较结果就是质量分值。该分值类似于根据ITU-T P.800.计算的主观MOS 分值。PESQ 分值使用大量的主观测试数据来校准。一般地,根据PESQ 算法还能够得到需要的其它一些判断信息。

2.1.3 PESQ 系统

PESQ 全称为Perceptual Evaluation of Speech Quality ,即话音质量的感知评估。PESQ 的结构如图所示:

开始时两个信号都通过电平调整,再用输入滤波器模拟标准电话听筒进行滤波(FFT)。这两个信号要在时间上对准,并通过听觉变换。听觉变换过程包括对系统中线性滤波和增益变化的补偿和均衡。根据以上过程提取出两个失真参数,并在频率和时间上综合起来,映射到对主观平均意见分的预测。 2.1.3.1 输入信号 语音信号

参考信号

失真系统

PESQ 质量分值

其它失真测试

PESQ需要两个输入信号:原始的未处理过的参考信号和通过失真系统的已经降低质量的测试信号。另外,该模型需要知道语音文件的带宽,一般为8kHz和16kHz。参考信号应该是类语

音信号,因为所用的PESQ编码器技术是专门针对语音信号进行设计传输的。如果是简单的合成信号如正弦信号和白噪声信号等等,采用PESQ算法将无法得到语音质量的感知结果。

采样率

PESQ能够处理8kHz和16kHz的带宽的语音信号。两个输入语音信号必须采用相同的带宽。

在特定的应用中,PESQ应用设备的取样率(即带宽)可以固定。

2.1.

3.2电平调整

为了便于比较,参考信号和质量降低的测试信号应该有相同的、固定的功率电平。各个待测系统的增益一般差别比较大,而且对参考信号没有确定的校准电平,所以有必要将二者调整到统一、恒定的电平上来。PESQ假定人耳的主观听觉电平为79dB。

该电平通过如下方法计算得到:

a)参考信号和测试信号经过电平校准FFT滤波器进行滤波

b)计算得到该滤波信号的平均平方值

PESQ中的电平调整算法如下所示:

?电平校准FFT滤波器抑制所有低于250 Hz的低频分量,在250 Hz -2000 Hz通带内幅度

恒定为0dB,带外各频点电平幅度分别为{2000 Hz, 0 dB}、{2500 Hz, –5 dB }、{3000Hz,-10dB}、{3150 Hz, -20 dB}、{3500 Hz, –50 dB}、{4000 Hz 和大于该频率, -500dB},高端阻带。

?参考信号和测试信号都需要计算其不同的平均平方值。

?参考信号X(t)和质量降低的测试信号Y(t)在进行电平调整时会得到不同的增益,然后分

别输出X S(t)和Y S(t)(参见下图)。

2.1.

3.3输入滤波

在PESQ中有两处使用了输入滤波器,即在模型的输入端和和时间校准的前端。电平校准后接着就是经过输入滤波器。因为考虑到了电话手柄的电学和声学影响,PESQ算法采用了接收滤波器来模拟电话和手机的接收通道。在普通的窄带电话系统中采用IRS(全称为modified Intermediate Reference System,详见ITU-T P.830)滤波器,而在宽带电话中则采用高通IIR滤波器,经过滤波后输出为X IRSS(t)和Y IRSS(t)。

2.1.

3.4时间对准

PESQ 模型系统中会遇到时延,在静默期间和说话期间时延可以改变。为了比较参考信号和测试信号,需要对其进行互相调整。PESQ中采用了话音激活检测技术(VAD)来识别信号中的语音部分。感知模型对时间很敏感,因此需要准确计算和校准取样时延。为此,采用了两种不同的时间校准方式即粗校准和细校准。粗校准时间校准滤波器采用27级IIR滤波器,其时延可以忽略不计。下图分别是该滤波器(16kHz模型下)的响应,以及时间校准的框图。

IIR滤波器频率响应图时间校准滤波器

粗调过程是用话音激活检测技术来校准整个话音信号。细调是针对语音信号的信号帧,计算语音信号的互相关进行校准的。对于针对分组数据的业务来说,细调是必需的。

另外,在听觉变换以后还需要对语音进行进一步的校准。它主要是针对语音中的“坏间隙”(有比较大的扰动的语音部分)。如果在时间校准过程中没有准确识别小语音文件的时延变换时,可以在这个阶段提高模型的准确性。

具体地说,时间校准有以下步骤:

◆信号通过窄带滤波,突出对感知重要的部分。这些滤波后的信号只用于时间对准;

◆基于包络的延时估计;

◆把参考信号按话语分成段;

◆对每一段进行基于包络的延时估计;

◆对每一段话语进行基于柱状图的、精细的、互相关的延时验证;

◆对于说话中的延时改变进行话语分解(splitting)和重定位。

◆每一段话语都给出延时估计,然后得出听觉变换要用的一帧一帧的延时。

延时时间间隔判断的流程图:时间校准过程

其中,di 是根据时延变化的数目来决定的。

2.1.

3.

4.1 语音识别

通过话音激活检测器(VAD )识别的语音是一种连续的语音脉冲。它可能包含低于200ms 预判决门限的时间间隙。一个包含两个语音的采样信号如下图所示。为了维持语音的原状,测试信号语音的开始和结尾处都被标记(比参考信号强度降低)。在这里,测试的信号的最后一段是静音的。

低于域值的静音期

参考信号

测试信号

语音分类

语音1

语音2

语音识别

延时时间间隔的计算

2.1.

3.

4.2 语音处理

语音处理包含以下过程:

◆ 语音时间校准,为了防止不同的大时延; ◆ 语音电平校准,用自动电平控制保持电平状态; ◆ 听觉变换和错误提取;

在上图中,在前端处理模型中,已经考虑到了参考信号和测试信号间的延迟。随着延迟的移动,在测试信号中,每个语音都希望在相应的参考信号的两边的搜索缓存区内

(300ms )。语音搜索域(参考信号的一部分)以及测试信号的相应部分经过时间校准。校准后的参考语音和测试语音通过该模型的其它部分继续处理。

2.1.

3.5 听觉变换

PESQ 模型的核心部分就是听觉变换。这种变换是一个心理声学模型,它把信号变换到时频可感知的响度来表达。

听觉变换的组成如上图所示。通过用32ms 的汉明窗口(帧),用FFT 变换来计算每一帧的瞬时功率谱。相邻两汉明窗之间重叠50%。FFT 变换后的信号经过巴克变换。参考信号再经过传递函数来补偿信号的畸变,而测试信号则采用本地增益进行补偿。

参考信号 测试信号 校准窗口

语音1

语音2

语音搜寻域

微小的延迟

话音处理程序

降低的感觉界面

听觉变换的组成

用计算机计算出平均用户能够听到的信息即感觉界面。参考信号和测试信号经过响度变

形后得到的感觉界面分别存储在不同的队列中。

测试信号的加汉明窗和帧处理过程依赖于时间校准延迟值。我们在上文中已经介绍了时间校准延迟值的计算。在测试信号中汉明窗的起始点根据时间校准延迟值而转移。参考信号的时间轴也同测试信号一样相应地移动。如果系统的延迟增加,部分测试信号将在处理中被

忽略。

2.1.

3.5.1巴克变换

FFT变换后的第一步就是进行巴克变换。人耳基底膜具有同频谱分析仪相似的作用,在20—16,000Hz范围内的频率可分成24个频率群(临界频带,Bark),频率群的划分相应于基底膜分成许多很小的部分,每一部分对应一个频率群,并且长度相等。对应于同一基底膜部分的那些频率的声音在大脑中似乎是叠加在一起进行评估的。这就是说人类的听觉系统对于声音频率的感知与实际频率的对应关系,是一种非线性映射关系,这就引出了所谓Bark尺度的概念。Traunmullar给出了线性频率同Bark频率之间的关系,即

b=6.7αsinh[(f-20)/600]

其中b为Bark频率,f为线性频率

所谓临界频带是指当某个纯音被以它为中心频率,且具有一定带宽的连续噪声所掩蔽时,如果该纯音刚好能被听到时的功率等于这一频带内噪声的功率,那么这一带宽称为临界频带宽度。临界频带的单位叫巴克(Bark),1Bark=一个临界频带宽度。频率小于500Hz 时,1Bark约等于freq/100;频率大于500Hz时,1Bark约等于9+41og(freq/1000),即约为某个纯音中心频率的20%。

用巴克频率计算得到的参考信号和测试信号的频谱包含以下内容:

◆话音频谱(只在话音激活周期发生)

◆噪音频谱(静音周期)

◆整个信号的平均频谱

每个巴克频段上的频谱强度都是以dBov为单位,而每个巴克段的中心频率单位是Hz。这样,我们可以用线性图来表示参考信号和测试信号的语音频谱,如下图所示

2.1.

3.5.2传递函数补偿

在待测系统的传递函数中,参考信号和测试信号的功率密度在时间上计算激活话音帧的

平均巴克谱值。激活话音帧的信号强度要求大于绝对听觉域30 dB。假设待测系统有恒定的频率响应,根据参考话音和参考话音间的比率就能给出传输函数补偿因子。参考话音的帧功率密度乘以该因子来同测试信号话音均衡,该补偿因子最多不超过±20dB。

参考信号使用了传递函数补偿,而在典型的主观试验中测试信号是凭主观判断的,因此无

需传递函数补偿。

2.1.

3.5.3本地增益补偿

系统中一些用户无法感知到的设备如自动功率控制设备等会引起信号的瞬间增益变化。在PESQ中瞬间增益变化通过一帧一帧的处理基音功率密度得到部分补偿。每一帧中,计算所有超过听觉门限的基音功率密度值,得到参考信号和失真信号的功率比值(3×10-4—5)。该功率比值通过一阶低通滤波器滤波得到增益调整因子,每一帧的测试信号乘以该调整因子,补偿到

和参考信号相当。

2.1.

3.5.4响度变形

听觉变形的最后就是根据Zwicker定律将参考信号和测试信号的巴克谱映射到响度(宋,Sone)上,包括一个频率门限和指数[2]。这样在每一时频单元能给出感受到的响度。

其中P0(f) 为听觉门限绝对值,而Sl为响度比例因子。

当超过4巴克,Zwicker 功率γ为0.23;低于4巴克,Zwicker 功率将轻微增加来说明补充效应。得到的结果称为感觉界面。

2.1.

3.6干扰处理

参考信号与测试信号间的绝对差值会给听觉误差一个测试,我们称为差错表面。差错值为正数表明有噪音分量等混在测试信号当中,为负数明在测试信号中可以忽略噪音等干扰。

在每一个时频单元都使用一个简单的门限来进行屏蔽,在门限以下的干扰是听不见的。该门限值设定为参考函数和失真函数中响度较小的一个乘以0.25。 时频单元差错值的计算根据如下的规则:

? 如果差错值是正的并且大于该屏蔽值,则差错值减掉屏蔽值; ? 差错值在正负屏蔽值之间,则差错值为0;

? 差错值小于屏蔽值的负数,则差错值为原来的差错值加上屏蔽值。 计算的目的是使差错值接近于零,同时强信号中的微小失真可以屏蔽掉。

PESQ 的非对称因子是由测试信号对参考信号在每一时频单元的巴克谱密度比得到的。非对称因子的值如果小于3,则定为零,如果大于12,则定为12。不对称加权的干扰值,通过乘以这个因子得到,结果只计算附加的失真。

和P.861 PSQM 不同的是,PESQ 计算两个不同的误差平均,其中一个有不对称因子,一个没有。在下述公式中[1],D(f)n 为干扰密度,而DA(f)n 为非对称干扰密度。M n 乘以因子 1/(原始帧的强度+C 常数)0.04, W f 为修正后的巴克门宽的常数,相乘以后帧干扰值将被限制在45之内。该累加值D n 和 DA n 即为所谓的帧干扰。

()

()

3

...,13

∑==bands

Bark of Number f f

n n n W f D M D

()()∑==bands

Bark of Number f f n n

n W f DA M DA ...,1

理解了这些局部的误差感知,PESQ 使用确定误差在时间上和幅度上取得最好的分布方法,在几个时-频尺度上综合了干扰值。干扰值分为瞬时间隔内的干扰总计和话音持续时间内的干扰总计(约10秒)。

2.1.

3.7 坏间隙以及重新校准坏间隙

听觉变换后,大于门限值的干扰通过互相关来识别和重新校准。我们在时间校准中曾经指出,时间校准除了粗调和细调外,还需要在听觉变换后对“坏间隙”(有比较大的干扰的语音部分)进行重新校准。超过干扰门限值的连续帧称为“坏间隙”。坏间隙的时延通过计算参考信号和测试信号之间的最大互相关来估计。

如果最大互相关低于门限值,可以断定该间隙对噪音匹配,故该间隙也就符合要求了。因此我们就不需要计算它的真干扰;否则重新计算该间隙的帧干扰,如果该值比原来计算的小,则代替原来参考信号的帧干扰。

2.1.

3.8P ESQ的质量分值

PESQ有三种质量分值,即根据P.862计算的PESQ分值、根据类MOS尺度的PESQ-LQ分值、根据

评估模型计算的损耗因子PESQ-Ie。后两者PESQ-LQ和PESQ-Ie都是根据PESQ分值采用简单的公式转换得来得。PESQ-LQ值是根据心里声学来计算的,而PESQ-Ie是根据ITU-T P.834得到的。

2.1.

3.8.1 PESQ分值的计算

PESQ通过计算两个干扰参数来得到语音质量的预测值。即为:

?绝对(对称)干扰:绝对的听觉错误

?外加(非对称)干扰:明显高于参考信号的听觉错误

计算PESQ,需要在三个平均阶段计算很大数量的不同的对称和非对称的参数。先使用参数的线性组合来预测主观MOS分,进一步对每次主观测试进行回归分析说明、解决不同的题目的前后关系和选择的偏好,如第3部分中所讨论的;这一步还用到了线性映射。对所有的候选参数集都进行了选择。这样找到了最优的组合,能给出最好的平均相关系数。这样可以在几百个候选参数中找到最好的。

举例来说,PESQ中用到部分补偿,在增益调制的均衡中,就要避免使用大量的参数来预测质量。只用到两个参数的组合—一个对称干扰(dSYM)和一个非对称干扰(dASYM),在预测精度和概括能力上有很好的平衡。然而,由于低维数的模型依靠早先的阶段组合出复杂的感知作用,要求有几个迭代设计。听觉变换中的系数和干扰处理经过优化,找到了最优的参数,然后重复处理过程。下面给出PESQ中映射的得分[1]:

PESQMOS=4.5-0.1 dSYM-0.0309 dASYM

对于正规的主观测试,得分在1.0和4.5之间。在失真情况严重时,得分可能会低于1.0,

但这种情况很少见。

2.1.

3.8.2 PESQ-LQ

在同样差的话音质量条件下,PESQ分值要比主观的MOS值大。心里声学通过大量的主观测试数据来进行分析。为了更好地将PESQ和传统的MOS值联系起来,我们引入了PESQ-LQ 的概念。根据ITU-T P.800的介绍,PESQ-LQ更接近人的主观听觉质量。MOS值一般在1到5之间,而PESQ-LQ的分值在1到4.5之间。在主观测试中,PESQ-LQ的最大值为4.5。

以上给出了话音质量的用户感知同同分值之间的关系。最高的4.5分,意味着在测试中没有发现失真。随着失真的增加话音质量随之下降。

2.1.

3.8.3PESQ和PESQ-LQ分值的关系

下图就是PESQ和PESQ-LQ分值的对应关系。

PESQ-LQ 可以通过如下过程来计算:

如果 pesq_score < 1.7 那么 pesq_lq = 1.0;

否则 pesq_lq = –0.157268 pesq_score3 + 1.386609 pesq_score2 – 2.504699 pesq_score + 2.023345

PESQ-LQ和PESQ的对应关系

2.1.

3.8.4PESQ和PESQ-Ie映射关系

PESQ-Ie是根据评估模型的输入信号得到的损耗因子Ie。PESQ-Ie的分值范围为0到140 之间,它是根据图3.14中PESQ-Ie同PESQ分数的关系计算得来的。

该映射关系详见ITU-T P.836建议。具体计算公式如下所示:

Ie = (K . 7.8502) / 0.5226

If Ie < 0 Ie = 0

where

K = 87.2 - R’

and

if MOS > 4.5 then

R’ = 100

else if MOS > 1.0 then

else R’ = 6.5.

PESQ和PESQ-Ie映射关系

2.1.4 主客观评估结果的比较

主观MOS 分值同语音评估结果的客观评价虽然是两个不同的概念,但是它们之间也存在着一定的关系。

2.1.4.1 将PESQ 映射到主观的MOS 分

一般说来,一定条件下两个不同的主观测试其分数不会相同,在比较主客观分数时需要考虑到这一点。主观测试容易受测试条件的限制和测试人员主观因素的影响,测试结果的可靠性受到各方面的质疑。既然主观测试无法直接互相比较,客观模型如PESQ 等也无法完全得到每一个主观测试的准确结果。

然而,同样条件下的两种得分差通常并不是一条平滑的曲线,还要加上误差值。下图即为主观MOS 值同客观的PESQ 分值的对应关系曲线,其中左图为针对移动编解码器的各种条件的主观测试时PESQ 平均值同主观MOS 分之间的简单关系:

PESQ 同MOS 分值之间的关系使用单调的三次多项式来模拟,实线表示多项式函数。该多项式可以将测试中的MOS 值同PESQ 分值对应起来。图3.15b 为同时的主观条件下得到的MOS 值同PESQ 值的关系。 2.1.4.2 互相关因子

PESQ 同主观分数之间的关系可以通过相关因子来计算得到。通常实将客观值映射到主观值上来计算条件平均值(如图3.15b 所示)。

该因子根据皮尔森公式来计算:

MOS 条件值 MOS 条件值

主观条件下MOS 同PESQ 的关系

主观条件下MOS 同PESQ 的关系

在该公式中,xi 是指i 条件下的MOS 值,_

x 是为xi —xn 条件下的平均值。 Yi 是指i 条件下的

映射条件平均值,_

y 是指yi —yn 条件下的平均值。在上右图中,相关因子为 r=0.988。

2.1.5 范围和应用

ITU-T 相关的资料已证明PESQ 是能够给出精确的预测值的,包括以下编解码和误码失真,波形编码(如G.711,G.726),CELP/高于4kbit/s 的混合编解码(如G.728),移动编解码/系统(包括GSM FR 、EFR 、HR 、AMR 、CDMA EVRC 、TDMA ACELP 、VSELP 和TETRA);各种编解码的代码转换,随机的、突发的、包丢失误差。PESQ 能够用于编解码或系统评估、选择和优化。 这样PESQ 可以广泛的用于现场和模拟网络中端到端测量。背景(环境)噪声和噪声处理,可以通过用PESQ 比较干净的、未处理的信号和编码的、经噪声干扰失真的信号评估得到。 用静默来取代语音,也是一种失真,给所有的感知模型在预测MOS 分时带来困难。一般前端和后端的50ms 的削波(话音激活检测)不会给主观印象带来很大的影响。然而,在话音期间削波,比如包丢失后用静默代替,将严重影响主观感受---每50ms 的丢失,MOS 分下降一分。PESQ 的情况在这两种之间,每50ms 的削波通常引起0.5分左右的下降,而不管处于什么位置。对于前端暂时的削波,特别是未察觉的丢失了单词时,PESQ 是很敏感的。相反的,PESQ 对经常的、短时的削波不很敏感(短时间内语音被静默取代)。在这两种情况下,PESQ 与主观MOS 分之间的相关性会减弱。作为一个有固定假设听觉级的只听模型,PESQ 一般不应用来评估收听级、侧音/说话人回音,或对话延迟的影响,而且,它也不是供非入侵性测试使用的。其他一些应用的特性还没有得到证明,或者需要部分改变模型。包括:音乐音质;宽带话音;所谓“媒体音频质量”;接受端回声;低于4kbit/s 的低比特率编解码器;声学的和电话机参考当量测试。 2.1.6

小结

PESQ 已经被发展为通过人的感知的客观过程来鉴别语音畸变,它通过主观的测试来预测话音质量等级,包括实际系统(例如,通过VoIP ),手机的影响,编码方式,编码器和差错方式等。

相关主题
相关文档
最新文档