码本激励线性预测

码本激励线性预测
码本激励线性预测

码本激励线性预测(CELP)编码

3.2.7码本激励线性预测(CELP)编码

码本激励线性预测(Codebook Excited Linear Prediction,cELP)编码简称为码本激励编码。它是一种用码本(Codebook)作为激励源的编码方法。把残差信号可能出现的、已经量化了的、按一定规则排列的各种样值事先存储在存储器中,好像一本字典一样。每一个样值组合都有一地址码,所以这个存储器就称为码本。收、发方各有一个同样的码本。在线性预测的过程中,并不传输残差信号的本身,而是先在本方的码本中,榆查出与这信号最接近的样值组合的地址码,然后将这个码本的地址码发送到对方。对方收到这个地址码,从同样的码本中取出这个地址的残差信号,然后通过滤波器得到重建的话音。由于不传输残差信号的本身,而传输的是码本上的地址码,所以大大减少了传输的比特数,可得到低速率的编码器。因此只要码本编得好,只要它有足够的数量而义和实际的残差信号十分接近,那么在低速率的编码下就得到较好的话音质量。因此编一个好的码本是这种编码的关键。码本的要求如下:

①码本中的信号应与实际信号非常相近,即相差最少。

②在满足第一条的条件下,码本容量最小。这样地址码数目少,即编码的长度最小。

③检查码本找出最接近信号(即搜索码本)的时问最短。这样处理时间短,时延小。

码本的编制举例如下。

把话音每20ms为一帧,每帧又分为4个子帧,则每个子帧为5ms,采样率为8 000Hz,这样每个子帧共有40个样点。40个样点经LPC预测分析后可得到残差信号,也是40个样点。将这40个样点组合用l0比特的编码来代表,l0比特共可编出l 024种序列。把这l 024种编码序列存储起来就可代表话音中的各种可能的残差信号,这就是码本,这个码本的容量为1024。显然,只用1024种编码来代表40个样点的各种可能的情况是不够的。但如果能够选择最可能的1024种情况,使它在实际运用时,合成话音的主观感觉误差最小,那么这个码本就是可以使用。因此编制码本是十分重要的。如果选定的码本中所代表的40样点组合后和实际话音相差太远,则合成的话音质量就不好。如果码本编得好,即实际的话音都能用码本中1 024种组合来代表,误差很小。只用10个比特就能传送一组40个样点的残差信号。这样不但码速低而且话音质量好。一般来说码本容量小,能存储的序列就少,但和实际信号的差别必然大,这是一对矛盾。但是不同的编制方法(即码本中样点组合的选取)可以找到_种最佳的结果,则该码本即为最佳码本。

图3.13为CELP原理图,它的两个时变线性滤波器各有一个预测器,其中一个为短时预测器,另一个为长时预测器。长时预测滤波器只用3阶,故有3个系数,短时滤波器在这里使用16阶,故有l6个系数,这些系数也要编码传输到对方,但和码本激励的编码分开,前者称为边信息,后者称为主信息。

从图3.13中可以看出,由码本取出的激励e(n)经短时预测和长时预测之后,可得到§(n)的预测值,此时实际话音S(n)加入,两者之差为残差信号d,通过感觉加权滤波,并将它平方求和后再求出平均值,这就是均方误差。如果这个误差最小,则这个码本激励就是和实际最接近的激励,把这个激励传送出去。因此在选择这个地址之前,要做一系列的计算和比较,才能选定这个地址的码本,这就叫做码本的搜索。最简单也是最费事的搜索办法,就是将上例码本的l 024个激励值一一计算,就可比较出来。但这样计算量就太大了,而且时延也会增加。所以如何提高搜索的效率,也是改进CELP编码器性能的一个重要方面。近几年在研究码本激励技术方面取得了很大进展,而研究简化算法又是实现实时运算的关键。

随机激励线性预测编码(Stochastically Excited LPC,SEL)和下面几节要介绍的低时延码本激励线性预测编码、矢量量化话音编码及矢量和激励线性预测编码均属于码本激励的范畴。

预测编码

4.4预测编码 1.预测编码的基本原理 预测编码(Prediction Coding)是根据某一种模型,利用以前的(已收到)一个或几个样值,对当前的(正在接收的)样本值进行预测,将样本实际值和预测值之差进行编码。如果模型足够好,图像样本时间上相关性很强,一定可以获得较高的压缩比。具体来说,从相邻像素之间有很强的相关性特点考虑,比如当前像素的灰度或颜色信号,数值上与其相邻像素总是比较接近,除非处于边界状态。那么,当前像素的灰度或颜色信号的数值,可用前面已出现的像素的值,进行预测(估计),得到一个预测值(估计值),将实际值与预测值求差,对这个差值信号进行编码、传送,这种编码方法称为预测编码方法。 预测编码的基本思想 建立一个数学模型利用以往的样本数据对新样本值进行预测将预测值与实际 值相减对其差值进行编码,这时差值很少,可以减少编码码位。 2.预测编码的分类 最佳预测编码:在均方误差最小的准则下,使其误差最小的方法。 线性预测:利用线性方程计算预测值的编码方法。非线性预测:利用非线性方程计算预测值的编码方法。线性预测编码方法,也称差值脉冲编码调制法(Differention Pulse Code Modulation,DPCM)。 如果根据同一帧样本进行预测的编码方法叫帧内预测编码。根据不同帧样本进行预测的编码方法叫帧间预测编码。 如果预测器和量化器参数按图像局部特性进行调整,称为自适应预测编码(ADPCM) 在帧间预测编码中,若帧间对应像素样本值超过某一阈值就保留,否则不传或不存,恢复时就用上一帧对应像素样本值来代替,称为条件补充帧间预测编码。 在活动图像预测编码中,根据画面运动情况,对图像加以补偿再进行帧间预测的方法称为运动补偿预测编码方法。 3.DPCM编码算法 一幅二维静止图像,设空间坐标(i,j)像素点的实际样本为f(i,j),是预测器根据传输的相邻的样本值对该点估算得到的预测(估计)值。编码时不是对每个样本值进行量化,而是预测下一个样本值后,量化实际值与预测值之间的差。计算预测值的参考像素,可以是同一行扫描行的前几个像素,这种预测叫一维预测;也可以是本行、前一行或者前几行的像素,这种预测叫二维预测;除此之外,甚至还可以是前几帧图像的像素,这种预测就是三维预测。一维预测和二维预测属于帧内预测,三维预测则属于帧间预测。 实际值和预测值之间的差值,以下式表示:e(i,j)=f(i,j)- 将差值e(i,j)定义为预测误差,由于图像像素之间有极强的相关性,所以这个预测误差是很小的。编码时,不是对像素点的实际灰度f(i,j)进行编码,而是对预测误差信号进行量化、编码、发送,由此而得名为差值脉冲编码调制法,简写DPCM。 DPCM预测编、解码的原理图如下。

语音信号线性预测分析

《视频语音处理技术》语音信号线性预测分析 学院名称:计算机与信息工程学院 专业名称:计算机科学与技术 年级班级: 姓名: 学号:

计算机与信息技术学院综合性、设计性实验报告 一、实验目的: 综合采用各种线性预测分析的方法,能够达到预测更为准确。要求掌握各种下列语音信号线性预测分析技术,提高学生数字语音信号处理的能力。利用MATLAB 编程环境和强大的处理功能,实现语音信号线性预测。主要训练如下的项目从而获得线性预测的综合能力: 1、LPC 方程的自相关解法。 2、LPC 参数到LSP 参数的转换。 3、LSP 参数到LPC 参数的转换。 4、LPC 参数到ISP 参数的转换。 二、实验仪器或设备:w indowsXP 下的Matlab 编程环境 三、总体设计(设计原理、设计方案及流程等) 线性预测编码原理:利用过去的样值对新样值进行预测,然后将样值的实际值与其 预测值相减得到一个误差信号,显然误差信号的动态范围远小于原始语音信号的动态范围,对误差信号进行量化编码,可大大减少量化所需的比特数,使编码速率降低。 1.LPC 方程的自相关解法 利用对称托普利兹(Toeplitz)矩阵的性质,自相关法求解可用Levinson-Durbin (莱文逊-杜宾)递推算法求解。该方法是目前广泛采用的一种方法。利用Levinson-Durbin 算法递推时,从最低阶预测器开始,由低阶到高阶进行逐阶递推计算。 自相关法递推过程如下: p i E j i r a i r k i i j i j i ≤≤?? ? ?? ? -=-∑= 1 )(-)( )1(1 -11) -(,()() 0 0r E =) 1(2)1(--=i i i E k E

线性预测编码LPC

LPC 系数预测 实验目的 语音线性预测的基本思想是:一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近。通过使实际语音抽样值与线性预测抽样值的均方误差达到最小,可以确定唯一的一组线性预测系数。 本实验要求掌握LPC 原理,利用自相关法,将语音序列加窗,然后对加窗语音进行LP 分析,编写程序求12阶线性预测系数。 实验原理 1、线性预测编码LPC 算法 由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值, 从而可以通过使实际语音和线性预测结果之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。而这组系数就能反映语音信号的特性,可以作为语音信号特征参数来用于语音编码、语音合成和语音识别等应用中去。 假设)(n y 是一实数据列,+∞<<∞-n ,我们可以用过去时刻的N 个数据来预测当前时刻的数据)(n y , 即: +∞<<∞--=∑=n - , )()()(?1 N k N k n y k a n y (1) 这里)(k a N 即为预测系数。定义预测误差)(n e 为 )(?)()(n y n y n e -= (2) 我们将采用最小均方误差准则来选择)(k a N 的值,使得式(3)总误差N E 最小。 ∑∑∑∞ -∞==∞ -∞=?? ????-+==n N k N n N k n y k a n y n e E 2 12 )()()()( (3) 这种优化参数)(k a N 的方法导致了求解如下的正则方程组 N l l R l k R k a yy N k yy N ,,2, , )()()(1 =-=-∑= (4) 这里的)(k R yy 是序列)(n y 的自相关系数。式(4)可写成如下的矩阵形式: N N N r a R -=? (5) 其中 []T N N N N N a a a )(,),2(),1( =a (6) [] T yy yy yy N N R R R )(,),2(),1( =r (7) 注意到)(k R yy 具有)()(j i R j i R yy yy -=-的性质,式(5)中的N R 可写成如下形式

线性预测编码习题

线性预测编码部分习题: 1. 设有差分方程 ∑=+-=p k k n G k n h a n h 1)()()(δ h(n)的自相关函数定义为 ∑∞ =+=0~)()()(n m n h n h m R (a ) 证明)()(~ ~m m R R -= (b ) 将差分方程代入)(~m R 的表示式,证明 )()(1~~k m R a m p k k R -=∑=,m=1,2,……,p 2.线性预测分析可以看成是在一定假设的基础上,一个线性系统的最佳估计方法,下图表明线性系统能够用另一种方法来估计。假定x(n)和y(n)这二者我们都能观察到,并设e(n)是白色高斯噪声,其平均值为零,方差为2 e σ,且e(n)与x(n)统计无关。若试图对线性系统的冲激响应作出估计,使得均方误差 ]))(*)()([(2n x n h n y E -=ε 为最小,其中)(n h ) 10(-≤≤M n 是)(n h 的估值。 (a) 对于)(n h ,求一组用x(n)的自相关函数和y(n)与x(n)的互相关函数表示的线性方程组。

(b) 你如何针对(a)中导出的方程组去求一组解?他们和本章讨论的LPC 法有何关系? (c) 导出最小均方误差ε的表示式。 (n ) 3. 在推导格型公式时,i 阶预测误差滤波器定义为 ∑=--=i k k i k i z a z A 1)()(1)( 预测器系数满足 )1()1()(----=i j i i i j i j a k a a , 11-≤≤i j i i i k a = 将)( i j a (11-≤≤i j ) 的表示式代入)()(z A i ,求证 )()(z A i =)()(1)1(1)1(-----z A z k z A i i i 4.有一种以LPC 为基础的基音检测方法,利用LPC 误差信号e(n)的自相关函数,记住e(n)可以写成 ∑=--=p i i i n s a n s n e 1) ()()(

西工大lpc线性预测编码实验报告

LPC 线性预测编码 16 邹维韬 一、 LPC 基本原理 基本原理:线性预测编码就是利用过去的样值对新样值进行预测,然后将样值的实际值与其预测值相减得到一个误差信号,显然误差信号的动态范围远小于原始语音信号的动态范围,对误差信号进行量化编码,可大大减少量化所需的比特数,使编码速率降低。 设语音信号的样值序列为s(n),n=1,2,…,n ,其中语音信号的当前取样值,即第n 时刻的取样值s(n)。而p 阶线性预测,是根据信号过去p 个取样值的加权和来预测信 号当前取样值s(n),此时的预测器称为p 阶预测器。设?s (n)为s(n)的预测值,则有 1 ?()()p i i s n a s n i ==-∑ (1) 式中,a1,a2,…,ap ,称为线性预测系数,式(1)称为线性预测器,预测器的阶数为p 阶。p 阶线性预测器的传递函数为1()p i i i P z a z -== ∑ (2) 信号s(n)与其线性预测值?s (n)之差称为线性预测误差,用e(n)表示。则e(n)为 1 ?()()()()()p i i e n s n s n s n a s n i ==-=--∑ (3) 可见,预测误差e(n)是信号s(n)通过具有如下传递函数的系统输出 1 ()1p i i i A n a z -==-∑ (4) 图一 LPC 误差滤波器

如图一所示。称系统A(z)为LPC 误差滤波器,设计预测误差滤波器A (z)就是求解预测系数a1,a2,…,ap ,使得预测器的误差e(n)在某个预定的准则下最小,这个过程称为LPC 分析。 Levinson-Durbin 算法递推求解自相关法求解式 据线性预测分析的原理可知,求解p 个线性预测系数的依据,是预测误差滤波器的输出方均值或输出功率最小。可称这一最小方均误差为正向预测误差功率Ep ,即 2 min 1 1 ()[()]{()[()()]}[()()][()()]p p i i i i E p E e n E e n s n a s n i E e n s n a E e n s n i ====- -=--∑∑ (17) 已知上式的第二项为0。再将式(3)代入上式可得 1 1 [()()][()()][()()](0)() p p p i i i i E E e n s n E s n s n a E s n s n i R a R i ====--=-∑∑ (18) 将式(18)与式(12)组合起来可得 121(0) (1)()(1)(0)(1)0(2) (1)(2)0()(1)(0)0p p R R R p E a R R R p a R R R p a R p R p R ?????? ?????? --??? ??? ??-????=-? ?????? ?????????? ?--?????? (19) 式(19)方程的系数矩阵是对称的,且沿着任一与主对角线平行的斜对角线上的所有元素相等,系数矩阵大小为p ×p,这样的矩阵称为Toeplitz(特普利茨)矩阵。式(19)称为Yule-Walker 方程,其中R(p)为根据式(9)确定的待分析语音信号s(n)的自相关序列。可见,为了解得线性预测系数,必须先计算出R (k ),然后解式(19)即可。 经典的线性预测求解方法之自相关法,该方法假定语音信号序列s(n)在间隔0≤n ≤N-1以外为0;用窗函数从语音序列中截取出选定的序列部分,截取出的序列记为s(0),s(1),…,s(N-1)。 用对称Toeplitz 矩阵的性质,自相关法求解式( 19)可用Levinson-Durbin(莱文森一杜宾)递推算法求解。算法的计算复杂度为O (p2),利用Levinson-Durbin 算法

线性预测编码LPC

线性预测编码LPC LPC系数预测实验目的语音线性预测的基本思想是:一个语音信号的抽样值可以用过去若干个取样值的线性组合来逼近。通过使实际语音抽样值与线性预测抽样值的均方误差达到最小,可以确定唯一的一组线性预测系数。本实验要求掌握LPC 原理,利用自相关法,将语音序列加窗,然后对加窗语音进行LP分析,编写程序求12阶线性预测系数。实验原理1、线性预测编码LPC算法于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值,从而可以通过使实际语音和线性预测结果之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。而这组系数就能反映语音信号的特性,可以作为语音信号特征参数来用于语音编码、语音合成和语音识别等应用中去。假

设y(n)是一实数据列,???n???,我们可以用过去时刻的N个数据来预测当前时刻的数据y(n),即:?(n)???aN(k)y(n?k), -??n??? yk?1N可写成如下的矩阵形式:RN?aN??rN 其中(5) aN??aN(1),aN(2),?,aN(N)? T (6) (7) TrN?Ryy(1),Ryy(2),?,Ryy(N) ??注意到Ryy(k)具有Ryy(i?j)?Ryy(i?j)的性质,式(5)中的RN可写成如下形式页第 1 Ryy(1)?Ryy(N?1)??Ryy(0)?R(1)?R(0)?R( N?2)yyyyyy?(8) RN??????????R(N?1)R(N?2)?R(0)??yyyy ?yy?2、Levinson-Durbin算法Levinson-Durbin算法是求解正则方程组中的预测系数aN的有效算法。这种算法利用了自相关矩阵中特殊的对称性。注意到RN(i,j)?Ryy(i?j),即对角线上的元素都相等,所以这个自相关矩阵是Toeplitz矩阵。Levinson-Durbin

线性预测编码LPC复习课程

线性预测编码L P C

LPC 系数预测 实验目的 语音线性预测的基本思想是:一个语音信号的抽样值可以用过去若干个取样值的线性组 合来逼近。通过使实际语音抽样值与线性预测抽样值的均方误差达到最小,可以确定唯一的一组线性预测系数。 本实验要求掌握LPC 原理,利用自相关法,将语音序列加窗,然后对加窗语音进行LP 分析,编写程序求12阶线性预测系数。 实验原理 1、线性预测编码LPC 算法 由于语音样点之间存在相关性,所以可以用过去的样点值来预测现在或未来的样点值, 从而可以通过使实际语音和线性预测结果之间的误差在某个准则下达到最小值来决定唯一的一组预测系数。而这组系数就能反映语音信号的特性,可以作为语音信号特征参数来用于语音编码、语音合成和语音识别等应用中去。 假设)(n y 是一实数据列,+∞<<∞-n ,我们可以用过去时刻的N 个数据来预测当前时刻的数据)(n y , 即: +∞<<∞--=∑=n - , )()()(?1N k N k n y k a n y (1) 这里)(k a N 即为预测系数。定义预测误差)(n e 为 )(?)()(n y n y n e -= (2) 我们将采用最小均方误差准则来选择)(k a N 的值,使得式(3)总误差N E 最小。 ∑∑∑∞ -∞==∞ -∞=?? ????-+==n N k N n N k n y k a n y n e E 2 12 )()()()( (3) 这种优化参数)(k a N 的方法导致了求解如下的正则方程组 N l l R l k R k a yy N k yy N ,,2, , )()()(1 Λ=-=-∑= (4) 这里的)(k R yy 是序列)(n y 的自相关系数。式(4)可写成如下的矩阵形式:

线性预测分析LPC

语音信号的线性预测分析概述 参数模型法是现代谱估计的主要内容,经常采用的模型有3个 1.自回归模型是一个全极点模型AR 2.移动平均模型是一个全零点模型MA 3.自回归-移动平均模型是一个既有零点,又有极点的模型。ARMA AR模型反应频谱中的峰值,MA模型反应频谱中的谷值,ARMA模型反映两者。AR模型可以与基于级联无损声管的语音产生模型相联系,因此在语音处理中他是被广泛采用的模型;而与其相关的线性预测分析也是语音信号中普遍采用的核心技术之一。 对语音信号进行线性预测分析的基本思想是:一个语音的采样能够用过去若干个语音采样的线性组合来逼近。通过使线性预测到的采样在最小均方误差意义上逼近实际语音采样,可以求取一组唯一的预测系数。这里的预测系数就是线性组合中所用的加权系数。这种线性预测分析技术最早用于语音编码中,因此也常被简称为LPC。 线性预测的基本原理 根据参数模型功率谱估计的思想,语音信号可以看做使用一个输入序列激励一个全极点的系统模型而产生的输出。 最小均方误差准则 线性预测系数或LPC系数 预测残差能量 浊音情况下,激励可以看做是准周期的脉冲串;在清音情况下,可以看做是高斯白噪声。考虑模型阶数的选择,通过预加重对高频部分的提升。 由于声门脉冲形状和口唇辐射的影响,语音信号的频谱在总趋势上会有高频衰落的现象,大约每倍程下降6DB。抵消这一影响,通常在做LPC分析之前采用一个非常简单的一阶FIR 滤波器进行预加重,进行高频提升。 线性预测分析是在短时平稳这一现实的假定基础上进行的,即一段语音信号是各态历经的平稳随机过程。线性预测分析被普遍应用到语音处理的各个方面。大量的实践证明:LPC参数是反映语音信号特征的良好参数。 线性预测方程组的解法 线性预测系数为变量的线性方程组。有两种经典的解法:自相关法和协方差法,还可以避开自相关和协方差计算,直接由样本递推的线性预测解法:格型法。 自相关法:定义n的求和范围的一种较直接的方法是,认为语音段外的数据全为零,只计算范围n以内的语音数据。相当于先将语音加窗,在进行处理。存在误差,为了减少误差的影响,在LPC中一般不采用突变的矩形窗,采用两端平滑过渡特性的窗函数。如汉明窗。求解Yule-Walker方程,其系数矩阵,即自相关矩阵是一个p阶对称矩阵,称为托布利兹矩阵。可以特殊的递推算法来求解。指导思想为:第i阶方程组的解可以用第i-1阶方程组的

语音信号线性预测分析仿真

专业课设 2013年1月 语音信号线性预测分析仿真 院(系、部): 信 息 工 程 学 院 姓 名: 熊 洁 班 级: 通 092 学 号: 090935 指导教师签名: 王 嵩

摘要 作为最有效的语音分析技术之一,线性预测是一种基于全极点模型假定和均方预测误差最小准则下的波形逼近技术,通过对音频信号的时域和频域分析对声道参数进行估值,以少量低信息率的时变参数精确地描述语音波形及其频谱的性质,能够在尽量保持原音质的基础上合成出高质量的语音。 本文重点研究了线性预测(LPC)的原理、Levinson-Durbin算法,基于MATLAB进行语音线性预测仿真,并对参数的选取做了比较分析。 关键词语音信号LPC Levinson-Durbin算法MATLAB仿真 Abstract As one of the most effective speech analysis technique, linear prediction is a kind of based on the pole model assumption and minimum mean square error criterion of wave approximation technique, based on the audio signal of time domain and frequency domain analysis of track parameters valuations, with a few low information rate of time-varying parameters accurately describe the nature of the speech waveform and spectrum, to be able to try to keep the original sound quality on the basis of the synthesis of high quality speech. This paper mainly studies the linear prediction (LPC), Levinson - from the principle of the algorithm, based on MATLAB speech linear prediction simulation, and the selection of parameters to do a comparative analysis. Keywords voice signal LPC Levinson - Durbin algorithm MATLAB simulation

码本激励线性预测

码本激励线性预测(CELP)编码 3.2.7码本激励线性预测(CELP)编码 码本激励线性预测(Codebook Excited Linear Prediction,cELP)编码简称为码本激励编码。它是一种用码本(Codebook)作为激励源的编码方法。把残差信号可能出现的、已经量化了的、按一定规则排列的各种样值事先存储在存储器中,好像一本字典一样。每一个样值组合都有一地址码,所以这个存储器就称为码本。收、发方各有一个同样的码本。在线性预测的过程中,并不传输残差信号的本身,而是先在本方的码本中,榆查出与这信号最接近的样值组合的地址码,然后将这个码本的地址码发送到对方。对方收到这个地址码,从同样的码本中取出这个地址的残差信号,然后通过滤波器得到重建的话音。由于不传输残差信号的本身,而传输的是码本上的地址码,所以大大减少了传输的比特数,可得到低速率的编码器。因此只要码本编得好,只要它有足够的数量而义和实际的残差信号十分接近,那么在低速率的编码下就得到较好的话音质量。因此编一个好的码本是这种编码的关键。码本的要求如下: ①码本中的信号应与实际信号非常相近,即相差最少。 ②在满足第一条的条件下,码本容量最小。这样地址码数目少,即编码的长度最小。 ③检查码本找出最接近信号(即搜索码本)的时问最短。这样处理时间短,时延小。 码本的编制举例如下。 把话音每20ms为一帧,每帧又分为4个子帧,则每个子帧为5ms,采样率为8 000Hz,这样每个子帧共有40个样点。40个样点经LPC预测分析后可得到残差信号,也是40个样点。将这40个样点组合用l0比特的编码来代表,l0比特共可编出l 024种序列。把这l 024种编码序列存储起来就可代表话音中的各种可能的残差信号,这就是码本,这个码本的容量为1024。显然,只用1024种编码来代表40个样点的各种可能的情况是不够的。但如果能够选择最可能的1024种情况,使它在实际运用时,合成话音的主观感觉误差最小,那么这个码本就是可以使用。因此编制码本是十分重要的。如果选定的码本中所代表的40样点组合后和实际话音相差太远,则合成的话音质量就不好。如果码本编得好,即实际的话音都能用码本中1 024种组合来代表,误差很小。只用10个比特就能传送一组40个样点的残差信号。这样不但码速低而且话音质量好。一般来说码本容量小,能存储的序列就少,但和实际信号的差别必然大,这是一对矛盾。但是不同的编制方法(即码本中样点组合的选取)可以找到_种最佳的结果,则该码本即为最佳码本。 图3.13为CELP原理图,它的两个时变线性滤波器各有一个预测器,其中一个为短时预测器,另一个为长时预测器。长时预测滤波器只用3阶,故有3个系数,短时滤波器在这里使用16阶,故有l6个系数,这些系数也要编码传输到对方,但和码本激励的编码分开,前者称为边信息,后者称为主信息。

预测编码方法

预测编码方法 1 基本原理 预测编码是一种直接利用数据间的相关性去相关,去冗余,实现数据压缩的信源编码 技术。此时,编码传输或存储的并不是信源输出的数据本身,而是当前数据的预测值与实际 值之间的差值 设信源输出的数据x(n)之间具有某种程度的相关性,利用这些相关性可以根据该时 刻前面的某些数据做出当前数据x(n)的预测值p(n),定义两者之间的误差: e (n) =x(n)-p(n) 并将d (n)称为预测误差或差值信号。 由于p(n)是利用x(n)与相邻数据之间的相关性进行估计(预测)得到的,因此, 当前数据x(n)与预测值p(n)之间的预测误差所构成的差值信号序列{ d (n) }中,数据 之间的相关性将减小,{ e (n) }中的信息冗余将降低。 例外,由于预测值p(n)是利用数据之间的相关性进行估计得到的,因此从统计观点 来讲,多数预测值p(n)与当前数据的实际取值x(n)比较接近。于是,虽然差值信号序 列{ e (n) }的数值分布区间扩大了一倍,但是预测误差 e (n)的取值将只集中在零附近的 一个较小范围内,如图所示。 理论研究表明,e (n) 的概率分布可近似为拉普拉斯(Laplace )分布,即 P(e)= 其中,e为差值信号e (n)的取值,为的差值信号均方值。 2 差值脉冲编码调制 差值脉冲编码调制( Differential Pulse Code Modulation , DPCM)是一种最典型的限失真 预测编码方法。DPCM原理框图如下;

在接收端解码恢复的再现数据为f’(x)。于是,经过系统传输,输入数据与输出数据之间产生误差为; f (x) -f’(x)= 可见,再现数据中产生的失真正是由发送端量化器的量化误差造成得,,与解码器是完全无关的。 预测模型可以是一维的,也可以是二维或多维的;可以是线性的,也可是非线性的。下面先讨论一维线性预测方法。 设预测值为 可见,相关性R k 越大,预测误差方差2e σ越小于信号方差,压缩效率也就越高 3 线性预测

非线性预测编码

1985年,Ackley和Hinton等人首次把多层前馈神经网络模型用于数据压缩变换。其基本思想是设计一个多层前馈网络,将N个数据输入到N个神经元,构成一种输入模式,再将该输入模式通过少量的隐层神经元(如M个)映射到一组输出模式,并使输入模式尽可能等同于输入模式,即采用同一学习模式,且输出层也为N个神经元,只要隐层神经元数比输入模式少(即M

相关文档
最新文档