第07讲_规则脉冲激励线性预测编码

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

限失真信源编码定理


限失真信源编码定理:只要信源符号序列长 度N足够大,当每个符号的信息率大于R(D) ,必存在一种编码方法,其平均失真可无限 逼近D;反之,若信息率小于R(D),则任何 编码的平均失真必将大于D。 利用信息论中连续(模拟)有记忆信源的信息 率--失真R(D)函数理论可以分析波形编码的 性能。
物理层关键技术1
信源编码
移动通信信源编码基本概念



信源编码是利用信源的统计特性,解除信源的 相关性,去掉信源多余的冗余信息,达到压缩 信源信息率,提高系统效率(有效性)的目的。 移动通信的频谱资源十分稀少珍贵,为了提高 频谱利用率,需积极开发低速率、高质量信源 编码技术,即高效信源编码技术。 第二代移动通信主要是语音业务,所以信源编 码主要指语音压缩编码。第三代移动通信中的 信源编码将不仅包含语音压缩编码,还包含各 类图像压缩编码和多媒体数据压缩等方面内容。
P

为了降低LPC的码率,提高稳定性,可采用以 下两种方法:

采用一类反射系数格形算法 采用矢量量化技术
27
混合编码的基本原理



混合编码是介于波形编码与参量编码之间的一种 编码方法,兼有参量编码低速率与波形编码的高 质量的优点。 实现混合编码的基本思想是以参量编码原理,特 别是以LPC原理为基础,保留参量编码低速率的优 点,并适当的吸收波形编码中能部分反映波形个 性特征的因素。重点改善自然度性能。 改进LPC主要从三方面入手:改进语音生成物理模 型、激励源结构和合成滤波器结构,提高语音质 量;改进参量量化和传输方法,进一步压缩传输 速率;采用自适应技术,进一步解决系统与信源 和信道之间的统计匹配。 28
I1(上限) log 2 N=log 2 (256)10 80bps I 2(下限) log2 N=log2 (128)10 70bps
最后可计算出压缩比K为:
K 64 Kbps 914 ~ 800倍 70 ~ 80bps
混合编码的性能估计

显然混合编码的理论压缩比是介于上述两类 编码之间,且与语音质量需求有关。若要求 混合编码偏重于个性特征,则其压缩比靠近 波形编码的压缩比值,若要求混和编码偏重 于共性,则其压缩比靠近于参量编码。


浊音:有声音—英语元音、汉语韵母 清音:无声音—英语多数辅音、汉语多数声母

时变滤波器的参数
线性预测编码LPC


分帧处理:10~20ms 语音分析:

基音提取—浊音/清音判决,基音周期提取 短时线性分析—线性滤波器系数OR格型网络参 数,以及增益


线性预测分析:一个语音抽样能够用过去若 干个语音抽样的线性组合逼近,使在有限时 间内的实际语音抽样与线性预测抽样之间的 差值平方最小—均方预测误差最小。 估计模型参数的基础:最小均方误差准则。
35
3.5
3.1
16
语音压缩编码原理

波形编码的基本原理



自适应差分脉冲编码调制(ADPCM)是建立在差分脉 冲编码调制(DPCM)的基础上,而DPCM又是建立在 脉冲编码调制(PCM)的基础上。 PCM可分为三个基本步骤:取样、量化与编码。 DPCM不直接传送PCM数字化信号,而改为传送其 取样值与预测值(通过前面样点值经线性预测求得的) 的差值,并将其量化、编码后传送。 ADPCM与DPCM原理一样,主要差别在于ADPCM中 的量化器和预测器引入了自适应控制机制。同时在 译码器中多加上一个同步编码调整器,其作用是为 了在同步级联时不产生误差积累。
ADPCM基本思想


利用自适应改变量化阶的大小,即使用小的量化阶去 编码小的差值,使用大的量化阶去编码大的差值,使 用过去的样本值估算下一个输入样本的预测值,使实 际样本值和预测值之间的差值总是最小。ADPCM记 录的量化值不是每个采样点的幅值,而是该点的幅值 与前一个采样点幅值之差。 IMA ADPCM算法对量化步长的调整使用了简单的查 表方法,对于一个输入的PCM值X(n),将其与前一 时刻的X(n-1)预测值做差值 得到d(n),然后根据当 前的量化步长对d(n)进行编码,再用此样点的编码 值调整量化步长,同时还要得到当前样点的预测值 供下一样点编码使用。

参量编码(声源编码)


混合编码


波形编码质量最高,其质量几乎与压缩处理之前相同,适 用于公用骨干(固定)通信网。参量编码质量最差,仅适合 于特殊通信系统,比如军事与保密通信系统。混和编码质 量介于两者之间,目前主要用于移动通信网。
用于移动通信的语音编码
标准 GSM CD-900 IS-54 IS-95 PDC 服务类型 语音编码 蜂窝 蜂窝 蜂窝 蜂窝 蜂窝 SBC子带编码 VSELP矢量和激励线性预测编码 CELP码本激励线性预测编码 VSELP矢量和激励线性预测编码 速率(bps) 16 8 1.2~9.6 4.5,6.7,11.2 RPE-LTP规则脉冲激励长期预测编码 13
参量编码的基本原理

参量编码不直接传送语音波形,而是传送产 生、激励语音波形的基本参量。
根据语音产生机理,采用下列物理模型:
周期性信号源

u(n )
时变线性滤波 输出 器 合成话音 C ( n ) 增益控制G
随机性信号源
24
反映语言特征的主要参数

基音频率与基金周期:声带振动频率、周期 共振峰频率:声道的谐振频率 语音强度: 浊音/清音判决
移动通信语音编码技术概述

语音编码:移动通信数字化的基础,第1/2 代蜂窝系 统的根本区别。 语音编码的意义:

提高通话质量(数字化+信道编码纠错); 提高频谱利用率(低码率编码); 提高系统容量(低码率,语音激活技术)。 编码速率低,语音质量好; 有较强的抗噪声干扰和抗误码的性能; 编译码延时小,总延时在65ms 以内; 编译码器复杂度低,便于大规模集成化; 功耗小,便于应用于手持机。
波形编码的性能估计

信息率--失真R(D)为:
1 2 (1 2 ) R( D) log 2 2 D
D:最大允许失真,σ2:方差,ρ相关系数 广义平稳遍历马氏链信源且有 R( ) 2 0 1 上式的计算结果如下表所示
信噪比(dB) 35 R(D)(bit/样点) 4 压缩倍数K 2 32 28 3.5 2.5 2.28 3.2 25 23 20 17 2.34 2 1.5 1 3.42 4 5.3 8


研究在限定失真下为了恢复信源符号所必需 的信息率,简称率失真理论。 率失真理论就是用以计算不同类型的信源在 各种失真限度下所需的最小信息率。 率失真函数--计算率失真函数是率失真理论 的中心问题。率失真函数只指出限失真条件 下所必需的最小信息率。从理论上讲,尚应 能证明实际存在一种编码方法,用这样的信 息率就能实现限失真的要求。

移动通信对语音编码的要求:

语音编码的分类

波形编码


将时间域信号直接变换为数字代码,目的是尽可能精确地再现原来 的话音波形 PCM、ΔM 将信源信号在正交变换域提取特征参量,并将其变换为数字代码 线性预测编码LPC 波形编码+参量编码 数字语音信号中既有语音特征参量又有部分波形编码
LPC的基本原理

典型参量编码的线性预测LPC方案如图所示
ai
预测 系数分析 G 输入 话音 A D 清浊音 判决 U/V 参 量 量 化 编 码 信 道 参 量 译 码
ˆ P
ˆ ai
随机 信源
ˆ G
ˆ ˆ U V
话音合成 滤波器 (IIR 滤波器)
输出 合成 话音
周期 信源
基音 提取
移动通信中的语音编码

高质量的混合编码是移动通信中的优选方案。


移动通信频谱资源有限,低码率、高压缩比至关重 要; 加入公用网信噪比又不能太低。

决定混合编码的4 个主要参量:比特率、质量、 复杂度和处理时延。


比特率:度量信源压缩率和通信系统性的主要指标; 话音质量:国际流行的MOS 法,5 级评分制; 复杂度:指完成语音编码所需的加法、乘法的运算 次数,一般可用MIPS 表示; 处理时延:复杂度高→处理时延大。
波形编码的性能估计
由上述分析结果可以得到如下结论: 当语音质量达到进入公网要求标准时,即 σ2/D≈26dB,其K=3.4 倍。 若进一步考虑实际语音分布与主观因素的影 响(因为正态分布R(D)其压缩倍数可以进一步 增大,取K=4 (保守值)这时语音速率可以从未 压缩的PCM 64Kbps降至1/4速率的16Kbps。
ADPCM编码原理
ADPCM编码原理

32Kbps ADPCM编码原理如下图所示
ADPCM输出 PCM 线性码 自适应 量化器
y(n) c (n )
c ' (n)
x(n)

d (n)
逆量化 器
dˆ ( n )
自适应 预测器
x (n )

y(n)
xˆ ( n )
定标因子 自适应
y (n )
自适应 速度控制
编码器类型 数据比特率 (Kbps) 64 复杂度 (MIPS) 0.01 时延 (ms) 0 质量 (MOS) 4.3
脉码调制PCM
自适应差分脉码调制ADPCM
自适应子带编码 多脉冲线性预测编码
32
16 8
0.1
1 10
0
25 35
4.1
4 3.5
随机激励线性预测编码
线性预测声码器
4
2
100
1
35
目前已实用化的DPCM为32Kbps。
参量编码的性能估计
语音可以采用各种不同形式的参量来表达。为了 分析方便,采用最基本的参量“音素”。以英语音 素为例进行分析。英语中共有音素27=128~ 28=256 。 按照通常讲话速率,每秒大约平均发送10个音素。 由信息量计算公式,对于等概率事件有:I=log2N , N为总组合数,则:
数据压缩


目的:在保证一定图像(或声音)质量的条 件下,以最小的数据率来表达和传送图像或 声音信息。 数据能够压缩的可能性在于:


原始数据中存在着大量的冗余信息(时间冗余、 空间冗余、统计冗余); 人的视觉和听觉器官都具有某种不敏感性,舍去 人的感官所不敏感的信息,对图像或声音质量的 影响很小,在某些情况下甚至可以忽略不计。
CT2
DECT PHS PCS-1800 PACS WCDMA
无绳
无绳 无绳 蜂窝 蜂窝
ADPCM
ADPCM ADPCM
32
32 32 32
RPE-LTP规则脉冲激励长期预测编码 13 AMR
个人通信 ADPCM
信息率-失真理论
information rate-distortion theory

17
ADPCM波形编码



ADPCM是利用样本与样本之间的高度相关性和量 化阶自适应来压缩数据的一种波形编码技术。 该算法利用了语音信号样点间的相关性,并针对 语音信号的非平稳特点,使用了自适应预测和自 适应量化,在32kbps/8kHz速率上能够给出网络等 级话音质量。 ADPCM标准是一个代码转换系统,它使用ADPCM转 换技术实现64Kb/s A律或u律PCM(脉冲编码调制) 速率和32Kb/s速率之间的相互转换。 应用:WAV,MP3,G.721等


பைடு நூலகம்

14
语音质量

度量方法不外乎客观与主观两个角度:
客观度量可以采用信噪比、误码率、误帧率, 相对而言简单、可行。 主观度量是由人耳主观特性来判断,比客观 度量复杂。目前国际上常采用的主观评判方 法称为MOS方法 。


15
复杂度与处理时延

语音编码硬件复杂度取决于DSP处理能力,而软件复杂度则主要体现 在算法复杂度上。算法复杂度增大,也会带来更长的运算时间和更大 的处理时延 。 如下所示,我们给出几种已知低数据比特率语音编码的上述四个参数 与性能比较表格。
数据比特率(bps)

数据比特率越低压缩倍数就越大,可通信的话路 数也就越多,移动通信系统也就越有效。
数据比特率降低,语音质量也随之相应降低,为 了补偿质量的下降,可采用提高设备硬件复杂度 和算法软件复杂度的办法。 降低比特速率另一种有效方法是采用可变速率的 自适应传输,它可以大大降低语音的平均传送率。 还可以进一步采用语音激活技术,充分利用至少 3/8的有效空隙,可获得大致约2.67dB的有效增益。
Q L (n )
21
ADPCM编码原理
ADPCM解码原理

32Kbps ADPCM译码原理如下图所示
c(n) 逆量化 ˆ x(n) ˆ d (n) + + x (n) y (n) y (n) 自适应 预测
PCM 线性码
同步编码 调整
定标因子 自适应
y (n)
Q L (n )
自适应 速度控制
23
相关文档
最新文档