第07讲规则脉冲激励线性预测编码
第07讲_规则脉冲激励线性预测编码

14
语音质量
度量方法不外乎客观与主观两个角度:
客观度量可以采用信噪比、误码率、误帧率, 相对而言简单、可行。 主观度量是由人耳主观特性来判断,比客观 度量复杂。目前国际上常采用的主观评判方 法称为MOS方法 。
15
复杂度与处理时延
语音编码硬件复杂度取决于DSP处理能力,而软件复杂度则主要体现 在算法复杂度上。算法复杂度增大,也会带来更长的运算时间和更大 的处理时延 。 如下所示,我们给出几种已知低数据比特率语音编码的上述四个参数 与性能比较表格。
物理层关键技术1
信源编码
移动通信信源编码基本概念
信源编码是利用信源的统计特性,解除信源的 相关性,去掉信源多余的冗余信息,达到压缩 信源信息率,提高系统效率(有效性)的目的。 移动通信的频谱资源十分稀少珍贵,为了提高 频谱利用率,需积极开发低速率、高质量信源 编码技术,即高效信源编码技术。 第二代移动通信主要是语音业务,所以信源编 码主要指语音压缩编码。第三代移动通信中的 信源编码将不仅包含语音压缩编码,还包含各 类图像压缩编码和多媒体数据压缩等方面内容。
编码器类型 数据比特率 (Kbps) 64 复杂度 (MIPS) 0.01 时延 (ms) 0 质量 (MOS) 4.3
脉码调制PCM
自适应差分脉码调制ADPCM
自适应子带编码 多脉冲线性预测编码
32
16 8
0.1
1 10
0
25 35
4.1
4 3.5
随机激励线性预测编码
线性预测声码器
4
2
100
1
35
17
ADPCM波形编码
第七章 预测编码

信道
解码器
LPC合成器
发送端(分析部分) 图5.4
接收端(合成部分) LPC声码器方框图
第三节 语音信号的预测编码
各语音线性预测编码方法之间的联系: 如果LPC声码器不是根据发送端的预测参数在接收端用白噪声和周 期脉冲分别合成清音和浊音,而是靠发送端直接将预测误差传过来,再 与接收端的预测值共同恢复与发送端相近的语音波形,就基本上成了 ADPCM;如果把ADPCM的适应去掉,就成了DPCM;再令DPCM的阶 数N=1及 a1 1,便成了例5-1介绍的前值预测;前值预测中若只用1位 量化器,就成了ΔM,其逐步简化(数码率增加)过程可如图5.5所示。 直接以信号的前一个取样值x k 1 作为当前取样值xk 的预测 值。
第三节 语音信号的预测编码
语音特有的短时功率谱密度 语音信号的短时功率谱,在某些频率上出现峰值,在另一些频率上出现谷 值。在这些峰值频率,也就是能量较大的频率,通常称为共振峰 (Format)频率。 此频率不止一个,最主要的是第1、2个,由它们绝对了不同的语音特征。另外, 整个谱也是随频率增加而递减。更重要的是,整个功率谱的细节以基音频率为 基础形成了高次谐波结构。 从频域,我们也同样看到了语音信号具有较大的冗余度。
x i ai xk i
i 1
N
(5.2-1)
实际的 x k 值与其预测值x k 之间有一个差值信号e k ,所以
e k xk x i xk ai xk i
i 1
N
(5.2-2)
1、 MMSE线性预测
最经典的是采用最小均方误差准则(MMSE)来讨论,这也叫做 均方误差(MSE)意义下的最佳设计。即我们希望使式( 5.2-2)之预 2 2 2 E ( x x ) k 测误差的均方值 k 为最小。显然,当N给定后, 是依赖于所有预测系数 a i 的函数,而 2 xk E 2( x k x k ) i=1,2,· · · ,N 0 ai a i 是MSE最小的必要条件。将式(5.2-1)之 代入,即
全速率规则脉冲激励线性预测声码器

全速率规则脉冲激励线性预测声码器(RPE-LPC)全速率规则脉冲激励线性预测声码器(RPE-LPC)语音编解码器是改良的线性预测编码器(LPC),它将人类声域建模成一系列不同宽度的圆柱体。
通过迫使空气通过这些柱体,即可产生语音。
LPC编码器用一组联立方程来进行建模。
标准LPC编码器不能提供电话系统所需的话音质量(虽能听清语句,但很难或不可能分辨出说话的人)。
GSM系统中采用两种技术来提高LPC编码器的质量,即:长期预测(LTP)与规则脉冲激励(RPE),而全速率编解码器就被称为RPE-LTP线性预测编码器。
输入至RPE-LTP编码器的数据为包括160个采样值的20ms语音,每一个采样值都拥有13位精度。
数据首先通过预加重滤波器来提高信号的高频分量,以获得更好的传输效率。
滤波器一般还消除信号上的任何偏移以简化进一步的计算。
语音产生模型可看成是空气通过一组不同大小的圆柱体。
短期分析级采用自动相关来计算与模型所用的8个圆柱体有关的8个反射系数,同时采用一种称为Schur递归的技术来有效地求解所得到的方程组。
参数被变换成可以更少的位数来进行更佳量化的LAR(log-area ratio)。
这些是传输流的前8个参数。
然后再将编码后的LAR解码成系数,并用来对输入采样值进行滤波。
解码LAR的原因是为了确保编码器使用解码器上的相同信息来进行滤波。
这一级上的其余采样值用于编解码器的LTP级。
160个采样值被分成4个子窗口,每一个子窗口都拥有40个采样值。
长期预测器为每一子窗口产生2个参数:滞后与增益。
滞后由当前帧与后两帧之间的交叉相关峰值确定,而增益则由归一化交叉相关系数决定。
滞后与增益参数被应用到长期滤波器上,同时对现有短期剩余信号进行预测。
RPE级通过十取一及交错将40个剩余采样值转换成13个参数,并用APCM 将所得出的13个值编码,其中最大值用对数编码成6位,然后再将13个参数均表示成3位,总共45位。
线性预测编码LPC

LPC 系数预测实验目的语音线性预测的基本思想是:一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近。
通过使实际语音抽样值与线性预测抽样值的均方误差达到最小,可以确定唯一的一组线性预测系数。
本实验要求掌握LPC 原理,利用自相关法,将语音序列加窗,然后对加窗语音进行LP 分析,编写程序求12阶线性预测系数。
实验原理1、线性预测编码LPC 算法由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,从而可以通过使实际语音和线性预测结果之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。
而这组系数就能反映语音信号的特性,可以作为语音信号特征参数来用于语音编码、语音合成和语音识别等应用中去。
假设)(n y 是一实数据列,+∞<<∞-n ,我们可以用过去时刻的N 个数据来预测当前时刻的数据)(n y , 即:+∞<<∞--=∑=n - , )()()(ˆ1Nk N k n y k a n y(1)这里)(k a N 即为预测系数。
定义预测误差)(n e 为)(ˆ)()(n yn y n e -= (2)我们将采用最小均方误差准则来选择)(k a N 的值,使得式(3)总误差N E 最小。
∑∑∑∞-∞==∞-∞=⎥⎦⎤⎢⎣⎡-+==n Nk N n N k n y k a n y n e E 212)()()()((3)这种优化参数)(k a N 的方法导致了求解如下的正则方程组N l l R l k R k ayy Nk yy N,,2, , )()()(1=-=-∑=(4)这里的)(k R yy 是序列)(n y 的自相关系数。
式(4)可写成如下的矩阵形式:N N N r a R -=⋅(5)其中[]TN N N N N a a a )(,),2(),1( =a(6) []Tyy yy yy N N R R R )(,),2(),1( =r(7)注意到)(k R yy 具有)()(j i R j i R yy yy -=-的性质,式(5)中的N R 可写成如下形式⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡----=)0()2()1()2()0()1()1()1()0(yy yy yy yy yy yy yy yy yy N R N R N R N R R R N R R R R (8) 2、Levinson-Durbin 算法Levinson-Durbin 算法是求解正则方程组中的预测系数N a 的有效算法。
第08讲码本激励线性预测编码

CELP语音编码
CELP语音编码算法用线性预测提取声道参 数,用一个包含许多典型的激励矢量的码本 作为激励参数,每次编码时都在这个码本中 搜索一个最佳的激励矢量,这个激励矢量的 编码值就是这个序列的码本中的序号。 CELP已经被许多语音编码标准所采用,美 国联邦标准FS1016就是采用CELP的编码方 法,主要用于高质量的窄带语音保密通信 ITU-T建议G.728, G.729, G.723.1
第08讲码本激励线性预测编码
CELP编码的基本思想
对一定时间内残差信号可能出现的各种样值的组合按 一定规则排列构成一个码本,编码时从本地码本中搜 索出一组最接近的残差信号,然后对该组残差信号对 应的地址编码并传送,解码端也设置一个同样的码本 ,按照接收到的地址取出相应的残差信号加到滤波器 上完成话音重建,则显然可以大大减少传输比特数, 提高编码效率。
第08讲码本激励线性预测编码
随机激励线性预测合成模型
第08讲码本激励线性预测编码
随机激励线性预测合成模型的 基本思想
利用几乎是白噪声的信号激励两个时变的线性递 归滤波器,在每个滤波器反馈环路上有一个预测 器,其中一个是长时预测器(或基音预测器)LTP (Long-Term Predictor)P(z),用来生成浊音语 音的音调结构(谱的细致结构),另一个是短时 预测器STP(Short-Term Predictor)F(z),用来 恢复语音的短时谱包络。
而人的声管相当于一组滤波器,对不同的激励产生 不同的响应,形成特定声音的输出。
为了提高重建话音的自然度,编码端可以增加一组 预测滤波器,采用闭环LPC结构,由特征参数激励 得到预测信号,将此信号与原信号s(n)相减得到残 差信号e(n),把此信号与有关参数一并编码传送, 在解码端进行误差修正可有效改善语音质量。
语音信号处理第一章绪论

语⾳信号处理第⼀章绪论第⼀章绪论1、语⾳信号?语⾳信号是具有声⾳的语⾔,⼈类表⽰信息的常⽤媒体,⼈类通信的有效⼯具。
2、语⾳信号包含的信息?1)说话内容,说什么;2)说话⼈⾝份,谁说的;3)说话⼈说话时的状态,⽣理状态、⼼理状态、情绪等。
(语⾳信号处理主要关⼼前两项)3、为什么要学习和研究语⾳信号处理技术?答:1)语⾳是⼈类最重要、最有效、最常⽤和最⽅便的交换信息的⽅式;2)让计算机能够理解⼈类的语⾔,是⼈类⾃计算机诞⽣以来就梦寐以求的想法;随着计算机的便携化,⼈们渴望摆脱键盘的束缚⽽代之以语⾳输⼊的⽅式。
⽐如苹果公司的iphone⼿机,在其最新版本4s中,推出了siri功能-即语⾳助⼿,可以通过语⾳输⼊,让其充当闹钟,⽐如还可以让它为你找出最近的咖啡厅,另外找出⾏路线往往需要输⼊不少⽂字,省事的话,报出地点,它可以调⽤google地图来找出出⾏⽅案,还可以让它播放⾳乐,发送短信等等。
3)语⾳信号技术始终与当时信息科学最活跃的前沿科学保持密切联系,并且⼀起发展。
语⾳信号处理是以语⾳语⾔学和数字信号处理为基础的涉及多⽅⾯的综合性学科,它与⼼理学、⽣理学、计算机科学、通信与信息科学以及模式识别和⼈⼯智能等学科都有着密切的关系。
对于语⾳信号处理的研究⼀直是数字信号处理技术发展的重要推进⼒量,⽽数字信号处理许多新⽅法的提出,⼜是⾸先在语⾳信号处理中获得成功,⽽后再推⼴到其他领域的。
⽐如,语⾳信号处理算法的复杂性和实时处理的要求,促进了⾼速信号处理器的设计。
⽽这些产品产⽣之后,⼜是⾸先在语⾳信号处理中得到最有效的应⽤的。
4、语⾳信号处理的发展情况1)语⾳信号处理的发展标志是在1940年产⽣的通道声码器技术,该技术打破了以往的“波形原则”,提出了⼀种全新的语⾳通信技术,即从语⾳中提取参数加以传输,在接收端重新合成语⾳。
其后,产⽣了“语⾳参数模型“的思想。
2)40年代后期,研制成功了“语谱仪”,为语⾳信号分析提供了有⼒的⼯具。
预测编码理论

预测误差门限型:(非线性预测器) ei ui ui 1 仅与前一样值作预测 若
ei K 则不传送 u i ; ei
K
则传送
ui
K为最大误差的门限值,即信宿可接收的最大误差
信号相关性越强,则此时传送的数据越少。
谢谢大家!
一、预测编码原理
对于有记忆信源,信源输出的各个分量之间是 有统计关联的,这种统计关联性可以加以充分利用, 预测编码就是基于这一思想。它不是直接对信源输 出的信号进行编码,而是将信源输出信号通过预测 变换后再对预测值与实际值的差值进行编码,其原 理图见下图。
一、预测编码原理
预测编码是利用信源的相关性来压缩码率的。
第五章预测编码
本章内容
预测编码原理 预测编码理论基础 预测编码方法 预测编码的应用
一、预测编码原理
预测编码是数据压缩三大经典技术(统计编 码、预测编码、变换编码)之一。预测编码 是建立在信号数据的相关性之上,较早用于 信源编码的一种技术。它根据某一模型,利 用以往的样本值对新样本值进行预测,以减 少数据在时间和空间上的相关性,达到压缩 数据的目的。
设信源第i瞬间的输出值为ui,而根据信源ui的前 k(k<i)个样值,给出的预测值为
u i f (ui 1 , ui 2
^
, ui k )
式中:f(· )——预测函数。 f可以是线性也可以是非线性函数。 则第i个样值的预测误差值为
ei ui u i
^
根据信源编码定理,若直接对信源输出ui进行编 码,则其平均码长 Lu 应趋于信源熵:
H (U ) p(ui )loga p(ui ), ui U
若对预测变换后的误差值e进行编码,其平均码 长 Le 应趋于误差信号熵:
码本激励线性预测

码本激励线性预测(CELP)编码3.2.7码本激励线性预测(CELP)编码码本激励线性预测(Codebook Excited Linear Prediction,cELP)编码简称为码本激励编码。
它是一种用码本(Codebook)作为激励源的编码方法。
把残差信号可能出现的、已经量化了的、按一定规则排列的各种样值事先存储在存储器中,好像一本字典一样。
每一个样值组合都有一地址码,所以这个存储器就称为码本。
收、发方各有一个同样的码本。
在线性预测的过程中,并不传输残差信号的本身,而是先在本方的码本中,榆查出与这信号最接近的样值组合的地址码,然后将这个码本的地址码发送到对方。
对方收到这个地址码,从同样的码本中取出这个地址的残差信号,然后通过滤波器得到重建的话音。
由于不传输残差信号的本身,而传输的是码本上的地址码,所以大大减少了传输的比特数,可得到低速率的编码器。
因此只要码本编得好,只要它有足够的数量而义和实际的残差信号十分接近,那么在低速率的编码下就得到较好的话音质量。
因此编一个好的码本是这种编码的关键。
码本的要求如下:①码本中的信号应与实际信号非常相近,即相差最少。
②在满足第一条的条件下,码本容量最小。
这样地址码数目少,即编码的长度最小。
③检查码本找出最接近信号(即搜索码本)的时问最短。
这样处理时间短,时延小。
码本的编制举例如下。
把话音每20ms为一帧,每帧又分为4个子帧,则每个子帧为5ms,采样率为8 000Hz,这样每个子帧共有40个样点。
40个样点经LPC预测分析后可得到残差信号,也是40个样点。
将这40个样点组合用l0比特的编码来代表,l0比特共可编出l 024种序列。
把这l 024种编码序列存储起来就可代表话音中的各种可能的残差信号,这就是码本,这个码本的容量为1024。
显然,只用1024种编码来代表40个样点的各种可能的情况是不够的。
但如果能够选择最可能的1024种情况,使它在实际运用时,合成话音的主观感觉误差最小,那么这个码本就是可以使用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020年6月5日星期五
移动通信信源编码基本概念
信源编码是利用信源的统计特性,解除信源的 相关性,去掉信源多余的冗余信息,达到压缩 信源信息率,提高系统效率(有效性)的目的 。
移动通信的频谱资源十分稀少珍贵,为了提高 频谱利用率,需积极开发低速率、高质量信源 编码技术,即高效信源编码技术。
还可以进一步采用语音激活技术,充分利用至少 3/8的有效空隙,可获得大致约2.67dB的有效增益 。
原始数据中存在着大量的冗余信息(时间冗余、 空间冗余、统计冗余);
人的视觉和听觉器官都具有某种不敏感性,舍去 人的感官所不敏感的信息,对图像或声音质量的 影响很小,在某些情况下甚至可以忽略不计。
移动通信语音编码技术概述
语音编码:移动通信数字化的基础,第1/2 代蜂窝系 统的根本区别。
语音编码的意义:
目前已实用化的DPCM为32Kbps。
参量编码的性能估计
语音可以采用各种不同形式的参量来表达。为了 分析方便,采用最基本的参量“音素”。以英语音 素为例进行分析。英语中共有音素27=128~ 28=256 。 按照通常讲话速率,每秒大约平均发送10个音素。
由信息量计算公式,对于等概率事件有:I=log2N ,N为总组合数,则:
研究在限定失真下为了恢复信源符号所必需 的信息率,简称率失真理论。
率失真理论就是用以计算不同类型的信源在 各种失真限度下所需的最小信息率。
率失真函数--计算率失真函数是率失真理论 的中心问题。率失真函数只指出限失真条件 下所必需的最小信息率。从理论上讲,尚应 能证明实际存在一种编码方法,用这样的信 息率就能实现限失真的要求。
数据比特率(bps)
数据比特率越低压缩倍数就越大,可通信的话路 数也就越多,移动通信系统也就越有效。
数据比特率降低,语音质量也随之相应降低,为 了补偿质量的下降,可采用提高设备硬件复杂度 和算法软件复杂度的办法。
降低比特速率另一种有效方法是采用可变速率的 自适应传输,它可以大大降低语音的平均传送率 。
第二代移动通信主要是语音业务,所以信源编 码主要指语音压缩编码。第三代移动通信中的 信源编码将不仅包含语音压缩编码,还包含各 类图像压缩编码和多媒体数据压缩等方面内容 。
数据压缩
目的:在保证一定图像(或声音)质量的条 件下,以最小的数据率来表达和传送图像或 声音信息。
数据能够压缩的可能性在于:
移动通信频谱资源有限,低码率、高压缩比至关重 要;
加入公用网信噪比又不能太低。
决定混合编码的4 个主要参量:比特率、质量 、复杂度和处理时延。
比特率:度量信源压缩率和通信系统性的主要指标 ;
话音质量:国际流行的MOS 法,5 级评分制; 复杂度:指完成语音编码所需的加法、乘法的运算
次数,一般可用MIPS 表示; 处理时延:复杂度高→处理时延大。
限失真信源编码定理
限失真信源编码定理:只要信源符号序列长 度N足够大,当每个符号的信息率大于R(D) ,必存在一种编码方法,其平均失真可无限 逼近D;反之,若信息率小于R(D),则任何 编码的平均失真必将大于D。
利用信息论中连续(模拟)有记忆信源的信息 率--失真R(D)函数理论可以分析波形编码的 性能。
波形编码的性能估计
信息率--失真R(D)为:
D:最大允许失真,σ2:方差,ρ相关系数 广义平稳遍历马氏链信源且有 上式的计算结果如下表所示
信噪比(dB) 35 R(D)(bit/样点 4 )
压缩倍数K 2
32 28 3.5 2.5
2.28 3.2
25 23 20 17 2.34 2 1.5 1
3.42 4 5.3 8
波形编码的性能估计
由上述分析结果可以得到如下结论: 当语音质量达到进入公网要求标准时,即 σ2/D≈26dB,其K=3.4 倍。 若进一步考虑实际语音分布与主观因素的影 响(因为正态分布R(D)其压缩倍数可以进一步增 大,取K=4 (保守值)这时语音速率可以从未压 缩的PCM 64Kbps降至1/4速率的16Kbps。
4.5,6.7,11.2
CT2
无绳 ADPCM
32
DECT
无绳 ADPCM
32
PHS
无绳 ADPCM
32
PCS-1800 蜂窝 RPE-LTP规则脉冲激励长期预测编码 13
PACS
个人通信 ADPCM
32
WCDMA
蜂窝 AMR
信息率-失真理论
information rate-distortion theory
最后可计算出压缩比K为:
混合编码的性能估计
显然混合编码的理论压缩比是介于上述两类 编码之间,且与语音质量需求有关。若要求 混合编码偏重于个性特征,则其压缩比靠近 波形编码的压缩比值,若要求混和编码偏重 于共性,则其压缩比靠近于参量编码。
移动通信中的语音编码
高质量的混合编码是移动通信中的优选方案。
提高通话质量(数字化+信道编码纠错); 提高频谱利用率(低码率编码); 提高系统容量(低码率,语音激活技术)。
移动通信对语音编码的要求:
编码速率低,语音质量好; 有较强的抗噪声干扰和抗误码的性能; 编译码延时小,总延时在65ms 以内; 编译码器复杂度低,便于大规模集成化; 功耗小,便于应用于手持机。来自用于移动通信的语音编码
标准
服务类型 语音编码
速率(bps)
GSM
蜂窝 RPE-LTP规则脉冲激励长期预测编码 13
CD-900
蜂窝 SBC子带编码
16
IS-54
蜂窝 VSELP矢量和激励线性预测编码
8
IS-95
蜂窝 CELP码本激励线性预测编码
1.2~9.6
PDC
蜂窝 VSELP矢量和激励线性预测编码
语音编码的分类
波形编码
将时间域信号直接变换为数字代码,目的是尽可能精确地再现原来 的话音波形
PCM、ΔM
参量编码(声源编码)
将信源信号在正交变换域提取特征参量,并将其变换为数字代码 线性预测编码LPC
混合编码
波形编码+参量编码 数字语音信号中既有语音特征参量又有部分波形编码
波形编码质量最高,其质量几乎与压缩处理之前相同,适 用于公用骨干(固定)通信网。参量编码质量最差,仅适合于 特殊通信系统,比如军事与保密通信系统。混和编码质量 介于两者之间,目前主要用于移动通信网。