3第三章矢量量化技术
矢量量化编码

矢量量化编码1. 引言矢量量化是一种高效的数据压缩技术,它具有压缩比大、解码简单和失真较小等优点。
自从1980年提出矢量量化器(Vector Quantizater)码书设计的LBG算法[Linde et al(1980)]以来,矢量量化(Vector Quantization)技术[Gray(1984)]已经成功地应用到图像压缩和语音编码中。
矢量量化压缩中最核心的技术是码书的设计,码书的优化性直接影响到压缩效率和图像复原质量。
这里主要对码书设计算法进行讨论。
首先介绍了经典的LBG算法及其在图像压缩中的应用;然后,针对LBG算法的不足,结合图像处理的特点,提出了改进的覆盖聚类算法,有效改善了系统性能。
2 .码书的设计码书设计是矢量量化压缩系统的关键环节。
码书设计得越优化,矢量量化器的性能就越好。
实际中,不可能单独为每幅待编码的图像设计一个码书,因此通常是以一些代表性图像构成的训练集为基础,为一类图像设计一个最优码书。
从数学的观点看,矢量量化中的码书设计,实质是把系统的率失真函数看成目标函数,并使之在高维空间中成为最小的全局优化问题。
假设采用平方误差测度作为失真测度,训练集中的矢量数为M,目的是生成含N(N<M)个码字(码矢量)的码书。
码书设计过程就是寻求把M 个训练矢量分成N类的一种最佳方案(使均方误差最小),而把各类的质心矢量作为码书的码字。
可以证明,各种可能的码书个数为(1/ N!)Σ(一1)(N-i)CNiM,其中( 为组合数。
通过测试所有码书的性能可得到全局最优码书。
然而,在N 和M 比较大的情况下,搜索全部码书是根本不可能的。
为了克服这个困难,各种码书设计方法都采取搜索部分码书的方法得到局部最优或接近全局最优的码书。
因此,研究码书设计算法的目的就是寻求有效的算法尽可能找到全局最优或接近全局最优的码书以提高码书性能,并尽可能减少计算复杂度。
3 LBG算法描述经典的码书设计算法是LBG算法[它是Y.Linde,A.Buzo与R.M.Gray 在1980年推出的,其思想是对于一个训练序列,先找出其中心,再用分裂法产生一个初始码书A0,最后把训练序列按码书A0中的元素分组,找出每组的中心,得到新的码书,转而把新码书作为初始码书再进行上述过程,直到满意为止。
矢量量化在语音信号处理中的应用

矢量量化在语音信号处理中的应用简介矢量量化是一种常用的数据压缩技术,旨在通过将连续信号离散化表示来减少数据传输和存储的成本。
在语音信号处理中,矢量量化广泛应用于语音编码、语音识别和语音合成等领域。
本文将深入探讨矢量量化在语音信号处理中的应用。
语音编码语音信号的特点为了更好地理解矢量量化在语音编码中的应用,首先需要了解语音信号的特点。
语音信号是一种时间连续的信号,具有较高的带宽要求和较低的信噪比。
此外,语音信号中的语音内容通常通过谐波周期、共振峰和无意义的噪声等特征进行表示。
矢量量化在语音编码中的角色在语音编码中,矢量量化被用于将连续的语音信号转换为离散表示,以实现对语音信号的压缩。
通过将语音信号分割成不同的时间段或频率帧,并将这些帧用离散的码矢量表示,矢量量化可以显著减少所需的传输和存储资源。
此外,矢量量化还能提供一种方式来描述和比较不同语音片段之间的相似性。
矢量量化的实现方法在语音编码中,有许多矢量量化的实现方法可供选择。
其中,最简单但性能相对较差的方法是基于均匀矢量量化。
该方法将矢量空间均匀划分为一系列子区域,并为每个子区域分配一个代表矢量。
然而,由于语音信号的非均匀分布特性,均匀矢量量化的效果有限。
为了克服均匀矢量量化的不足,研究人员提出了一些更高级的方法,如聚类算法和向量量化树。
聚类算法将语音帧分成几个类别,并为每个类别分配一个代表矢量。
而向量量化树则是一种层次结构,通过递归地将帧分成更小的子集,并为每个叶子节点分配一个代表矢量。
这些方法相对于均匀矢量量化能够更好地适应语音信号的分布特性,从而提高编码效果。
矢量量化的应用实例矢量量化在语音编码中的应用有很多,以下是一些常见的实例:1.无损压缩:通过高效地将连续语音信号转换为离散表示,矢量量化可以实现对语音信号的无损压缩。
这种压缩方法无需对语音信号进行任何信息损失,因此在一些对语音质量要求较高的应用中非常有用。
2.语音传输:矢量量化能够显著减少语音信号传输所需的带宽和存储资源。
矢量量化技术

(2)矢量量化
将语音信号的取样值或语音的特征参数值分成若干 组,每组构成一个矢量,然后分别对每个矢量进行量 化。这种量化就称为矢量量化(N维)。
- 波形特征参数矢量量化:设L = 1024(40种语音单 位,每个对应25种变形),即为了指定码本中任意码 矢需要10bit,则对每秒100个特征矢量的传输需率就 为1,000bit/s。
矢量量化原理
(1)标量量化 对语音信号的每个取样值,或语音信号的每个特征参
数值分别独立地进行量化,称为标量量化(一维)。 - 标量量化与传输率 - 波形量化:采样频率为10kHz、振幅量化为16bit的语 音信号的传输速率是:
16x10000 = 160i,0=000bit/s(bps)。 - 波形特征参数量化:对次数为10、每秒100个特征矢 量(如频谱包络参数),如振幅量化也为16bit的话,其 传输速率是:16x100x10=16,000bit/s。矢量量化示意图N来自.码矢12
3
t
4
VQ
(Vector Quantization )
f
142 t
矢量量化过程
设: 有限矢量集合Y={ yi, 1≤i≤L} ,Y称为码本,L是码本的大小,yi 称 为码矢,码矢是N维矢量,即yi = ( yi1, yi2, …, yiN)T。 -码本搜索:对输入矢量x进行VQ的过程,就是在码本中以某种方 式进行搜索,寻找一个与x最接近的码矢之过程,即用该码矢去替代 x。这里,所谓最接近,应按某种失真测度d(x, yi)为标准来衡量。 I = argmin d(x, yi) i -码矢地址编码:为了传输量化后得到的码矢yi,一般都需要进行 编码。通常,并不是直接对yi进行编码,而是对yi在码本中的地址或 标号进行编码。要传送的正是这个标号的码字I。在接受到标号的码 字后,就可在接受端的码本中找到相应的码矢,这便是重建码矢。 对于L级码本来说,为了表示其中任意一个码矢的标号,最多只要 log2L个bit的二进制代码就够了。
矢量量化器

最佳矢量量化器码本设计指导教师姓名: ×××报告提交日期: 20××年×月×日摘要矢量量化技术作为一种有损压缩编码技术在语音信号的存储和低码率传输过程中起到了巨大的推动作用。
本文主要介绍了适量量化的一些基本概念,以及矢量编码器的码本设计方法。
关键词适量量化矢量量化器矢量量化矢量量化介绍矢量量化是70年代后期发展起来的一种数据压缩技术基本思想:将若干个标量数据组构成一个矢量,然后在矢量空间给以整体量化,从而压缩了数据而不损失多少信息。
矢量量化技术是七十年代后期发展起来的一种数据压缩和编码技术,广泛应用于语音编码、语音合成、语音识别和说话人识别、图像压缩等领域。
矢量量化的基本原理是:将若干个标量数据组成一个矢量(或者是从一帧语音数据中提取的特征矢量)在多维空间给予整体量化,从而可以在信息量损失较少的情况下压缩数据量。
矢量量化有效地应用了矢量中各元素间的相关性,因此可以有比标量量更好的压缩效果。
一般来说矢量维数越大量化越优越。
矢量量化原理概述标量量化将抽样值的整个动态范围被分成若干个小区间,每个小区间有一个代表值,量化时落入小区间的信号值就用这个代表值代替,或者叫被量化为这个代表值。
这时的信号量是一维的,所以称为标量量化。
矢量量化若干个标量数据组成一个矢量,矢量量化是对矢量进行量化,和标量量化一样,它把矢量空间分成若干个小区域,每个小区域寻找一个代表矢量,量化时落入小区域的矢量就用这个代表矢量代替,或者叫被量化为这个代表矢量。
矢量量化的要点首先设计一个好码本。
关键在于如何划分J个区域边界。
这需要大量的输入信号矢量,经过统计实验才能确定,这个过程称为“训练”或“学习”。
应用聚类算法,按照一定的失真度准则(失真测度),对训练的数据进行分类,从而把训练数据在多维空间中划分成一个以码字为中心的胞腔,常用的是LBG算法来实现。
未知矢量的量化。
矢量量化VQ

矢量量化(vector quantizization)技术技术是一种数据压缩和编码技术,矢量量化压缩技术的应用领域非常广阔,如军事部门和气象部门的卫星(或航天飞机)遥感照片的压缩编码和实时传输、雷达图像和军用地图的存储与传输、数字电视和DVD 的视频压缩、医学图像的压缩与存储、网络化测试数据的压缩和传输、语音编码、图像识别和语音识别等等 。
其具体的方法如下图所示:
几个术语的解释:
1.压缩比:log 2Nc/n*n*bpp (像素字节数bpp )
n*n 即一个与编码本中一个数对应的向量,所以Nc 个数我们可以对应所有向量即全图,而Nc 的字节数为log 2Nc 。
2. d(B, C):我们可以解释为距离差,d 的定义有很多种可以是Σ|b i c i |,Σ(b i – c i )2 ,Max|b i - c i |等等。
例子:
編碼端解
由上图我们可以看到左边为原图像,而右边为编码本。
例如我们可以讲原图像以如图所示的方式分为若干个有四个量的向量如(100,100,80,80)其余编码本中的
(100,100,90,90)计算的d (X ,Xk )最小故我们可以用数字k 表示向量
(100,100,80,80)。
其实我们可以理解为矢量量化就是讲图像中分割成若干的小块,然后再将小块分类,一类用一个码表示。
下面是一个我论文中看到的也是最常用的VQ 算法:LBG 算法也叫K 平均分类算法。
以下是步骤:
当然我们可以设置一个收敛的条件,这个可以根据自己需求设置ε大小,当到达某一步 时 收敛即迭代结束。
ε≤---)1()1(l l l D D
D。
东南大学语音信号处理期末考试复习总结(全面)

语音信号处理是研究数字信号处理技术对语音信号进行处理的一门科学语音:是声音和语言的结合体,是一连串的音组成的语言的声音。
人的说话过程:想说,说出,传送,接收,理解。
句法的最小单位是单词,词法的最小单位是音节。
语音特征:音色,音调,音强,音长。
语音音素:元音和辅音。
辅音包括浊音(声带振动)和清音共振xx:元音激励进入声道时引起共振特性,产生一组共振频率。
基音频率:浊音的声带振动的基本频率。
汉语是一种声调语言,声调具有辩义作用。
声调的变化就是浊音基音周期的变化。
汉语音节的一般结构:声带,韵母,声调对发音影响最大的是声带。
基音周期:声带每开启和闭合一次的时间,倒数就是基音频率。
语音听觉系统:耳:内耳(将机械信号转化为神经信号),中耳(声阻抗变换),外耳(声源定位和声音放大)。
掩蔽效应:在一个强信号附近,弱信号将变得不可闻。
被掩蔽掉的不可闻信号的最大声压级称为掩蔽门限或掩蔽阈值。
掩蔽效应:同时掩蔽和短时掩蔽。
同时掩蔽:存在一个弱信号和一个强信号频率接近,强信号会提高弱信号的听阀,当弱信号的听阀被升高到一定程度就会导致这个弱信号弱不可闻。
短时掩蔽:当A声和B声不同时存在时也存在掩蔽作用,称为短时掩蔽。
语音信号生成的数学模型:激励模型(一般分为浊音激励和清音激励),声道模型(一般分为声管模型和共振峰模型,共振峰模型又分为三种:级联,xx,混合型),辐射模型。
浊音激励模拟成是一个以基音周期为周期的斜三角脉冲串。
可以把清音模拟成随机白噪声。
完整的语音信号的数学模型的传输函数H(z) = AU(z)V(z)R(z).一阶高通形式的R(z)=R0(1-z^(-1))把和时序相关的傅里叶分析的显示图形称为语谱图。
语谱图是一种三维频谱,它是表示语音频谱随时间变化的图形。
第三章:语音信号分析1.参数性质不同:时域,频域,倒频域。
分析方法:模型分析法(根据语音信号产生的数学模型来分析和提取表征这些模型的特征参数)和非模型分析法(时域,频域,倒频域)。
矢量量化

矢量量化有损压缩是利用人眼的视觉特性有针对地简化不重要的数据,以减少总的数据量。
量化是有损数据压缩中常用的技术。
量化可以分为两种,即标量量化与矢量量化。
标量量化每次只量化一个采样点。
而矢量量化在量化时用输出组集合中最匹配的一组输出值来代替一组输入采样值。
根据香农的速率-失真理论,即使信源是无记忆的,利用矢量编码代替标量编码总能在理论上得到更好的性能,矢量量化可以看作标量量化的推广。
基本的矢量量化器编码,传输与解码过程如图所示。
矢量量化编码器根据一定的失真测度在码书中搜索出与输入矢量最匹配的码字。
传输时仅传输该码字的索引。
解码过程很简单,只要根据接收到的码字索引在码书中查找该码字,并将它作为输入矢量的重构矢量。
码字匹配信道查表信宿信源码书码书输入矢量索引索引编码器解码器输出矢量矢量量化编码和解码示意图假定码书}|,,,{110k j N R C ∈=-y y y y ,其中N 为码书的大小,而k 维输入矢量T k x x x ),,(110-= x 与码字T k j j j j y y y ),,()1(10-= y 之间的失真测度采用平方误差测度来表示,即:22210)(),(jjl k l l j y x d y x y x -=-=∑-=则矢量量化码字搜索问题就是在码书C 中搜索与输入矢量x 最匹配的码字bm y ,使得bm y 与x 之间的失真是所有码字中最小的,即:),(min ),(10bm N bm bm d d y x y x -≤≤= 全搜索算法(FS )是一种最原始、最直观的码字搜索算法,它需要计算输入矢量与所有码字之间的失真,并通过比较找出失真最小的码字。
由于FS 算法每次失真计算需要k 次乘法,12-k 次加法,故为了对矢量进行编码需要Nk 次乘法,)12(-k N 次加法和1-N 次比较运算。
而FS 算法的计算复杂度是由码书的大小和矢量维数决定,而高效率矢量量化编码系统往往采用大码书和高维矢量,这时计算复杂度是非常大的,故减少码字搜索的计算负担是非常必要的,必须寻求快速有效的码字搜索算法。
矢量量化的图像压缩技术及应用

由上所述,LBG算法是一个不断迭代、 不断调整聚类中心的过程,聚类速度慢,初 始点的选取对聚类影响大。所以如何克服经 典LBG算法因迭代次数过大而导致程序运行 时间长的缺点值得进一步对算法研究,提出 不仅缩短运行时间,又能提高解码出来后图 像的质量的算法。
谢谢大家
矢量量化的图像压缩技术
通信与信息系统 汪金涛
矢量量化过程: A B C
矢量量化码书的设计
编码阶段
解码阶段
选择最优训练码书
•要实现信噪比高的矢量量化压缩图像 ,先要建立一个优质的训练码书。要 做好Байду номын сангаас量量化算法,建立好的训练码 书是关键。 •采用的压缩图像是512*512的,先选 择码书大小为64的为例,这样每个图 像就是8*8的图像块,再设定码书中 码字的大小为4*4。
•由于矢量量化压缩图像的方法就是对图像 行比较,选出最贴近码书中码字的数值, 用码书中的数值代替该图像中对应位置上 的数值,而且代入的数值只是对应码字的 位置编号,并不是该码字的数值,通过这 样的方法对图像进行压缩。最后图像中, 出现的数值就是1~64,分别代表每个位置 中,对应的训练码书中的数值。
•
码本设计对压缩性能产生重要影响,码本设 计的好坏直接关系到图像矢量量化的质量。
• 最著名的优化码本设计算法是由Linde等人提 出的LBG算法。其主要思想是:从一组码矢量 出发,将所有的图像适量进行划分,然后再 重新计算码矢量,直到码矢量的变化收敛时 ,即完成了码书的选择。
LBG算法的基本步骤如下:
m 1 m 1 m m
Dm (Qm )
的码字中的编号代替原图像中的数值。 对图像进行距离的计算,并得出最相近 数值,用其对应的编号进行代替,从而 实现矢量量化的压缩过程。压缩后,图 像中的所有数据都被码书中码字的编号 代表了,这样就压缩了数据的存储量, 实现了编码中压缩算法的目的。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.2 矢量量化的基本原理 四.判断规则 判断规则 当给矢量量化器输入一个任意矢量Xi进行矢量量化 当给矢量量化器输入一个任意矢量Xi进行矢量量化 Xi 时,矢量量化器首先判断它属于那个子空间,如何 矢量量化器首先判断它属于那个子空间, 判断就是要依据一定的规则, 判断就是要依据一定的规则,选择一个合适的失真 测度,分别计算每个码字代替Xi所带来的失真,当 测度,分别计算每个码字代替Xi所带来的失真, Xi所带来的失真 确定产生最小失真的那个码字Yj时 就将Xi量化成 确定产生最小失真的那个码字Yj时,就将Xi量化成 Yj Xi Yj, Yj就是Xi的重构矢量 和恢复矢量)。 就是Xi的重构矢量( Yj, Yj就是Xi的重构矢量(和恢复矢量)。
(所谓码速率是指每秒钟能够传输的二进制码元(bit)数目, 所谓码速率是指每秒钟能够传输的二进制码元( )数目, 所谓码速率是指每秒钟能够传输的二进制码元 用来反映传输数据所需要的通信信道的带宽的大小。 用来反映传输数据所需要的通信信道的带宽的大小。)
19
3.2 矢量量化的基本原理 六.矢量量化的关键之处 首先设计一个 码本。 一个好 1 首先设计一个好码本。关键在于如何划 个区域边界。这需要大量的输入信号矢量, 分J个区域边界。这需要大量的输入信号矢量, 经过统计实验才能确定,这个过程称为“训练” 经过统计实验才能确定,这个过程称为“训练” 学习” 或“学习”。 应用聚类算法,按照一定的失真度准则( 应用聚类算法,按照一定的失真度准则(失 真测度) 对训练的数据进行分类, 真测度),对训练的数据进行分类,从而把训练 数据在多维空间中划分成一个以码字为中心的胞 常用的是LBG算法来实现。 LBG算法来实现 腔,常用的是LBG算法来实现。
9
3.2 矢量量化的基本原理 一.矢量的定义 矢量的定义 若干个标量数据组成一个矢量, 若干个标量数据组成一个矢量,标量的个数就为矢 量的维数。如语音信号某一帧中提取的声道参数, 量的维数。如语音信号某一帧中提取的声道参数, ,Xi={ai1,ai2,…,aiK}。 Xi是一个 维矢量。 是一个K 共K个,Xi={ai1,ai2,…,aiK}。则Xi是一个K维矢量。 设共有N 设共有N个K维矢量X={X1,X2,…,XN},其中第i个矢量 维矢量X={X1,X2,…,XN},其中第i X={X1,X2, 其中第 Xi,i=1,2,… 类比过来, 个语音帧, 为Xi,i=1,2,…N。类比过来,N个语音帧,每帧中 共有K个声道参数,共组成N 共有K个声道参数,共组成N个K维矢量。 维矢量。
17
3.2 矢量量化的基本原理 Y1={ y11,y12,…,y1K} ,y Xi={ai1,ai2,…,aiK} ,a Y2={ y21,y22,…,y2K} ,y 计算失真 YJ={ yJ1,yJ2,…,yJK} ,y 矢量量化器 码本) (码本)
18
Y2 最小失真
3.2 矢量量化的基本原理 五.标量量化和矢量量化比较 一个k维最佳矢量量化器的性能总是优于k个最佳标 量量化器。 量量化器。 =1的矢量量化 的矢量量化。 标量量化是维数为k=1的矢量量化。一般矢量量化 >1多维量化 多维量化。 均指k>1多维量化。 在相同的编码速率下, 在相同的编码速率下,矢量量化的失真明显比标 量量化的失真小;而在相同的失真条件下, 量量化的失真小;而在相同的失真条件下,矢量量 化所需的码速率比标量量化所需的码速率低得多。 化所需的码速率比标量量化所需的码速率低得多。 由于矢量量化的复杂度随矢量维数成指数形式增 故矢量量化的复杂度比标量量化的复杂度高。 加,故矢量量化的复杂度比标量量化的复杂度高。
12
3.2 矢量量化的基本原理 二.矢量空间的划分 举例: 举例 K=2为例来说明 为例来说明。 K=2时 所得到的是二维矢量。 以K=2为例来说明。当K=2时,所得到的是二维矢量。 所有可能的二维矢量就构成了一个平面。 所有可能的二维矢量就构成了一个平面。 个二维矢量记为: Xi={xi1,xi2}。 第i个二维矢量记为: Xi={xi1,xi2}。先把这个平 面划分成J块互不相交的子区域, 面划分成J块互不相交的子区域,从每个子区域中 找出一个代表矢量。 J=7。 找出一个代表矢量。如J=7。
13
3.2 矢量量化的基本原理 x2 二.矢量空间的划分 Y3 Y4 Y1 Y5 Y6 Y2 x1 Y7
码本 Y={Y1,Y2,…,YJ} ,Y 码本长度 J=7 j=1,2,…J 码字
3.2 矢量量化的基本原理 二.矢量空间的划分 矢量量化器定义: 维数为k 码本长度为J的矢量量化器Q定义: 维数为k,码本长度为J的矢量量化器Q定义: 为从k维欧几里德空间R 到一包含N个输出(重构) 为从k维欧几里德空间Rk到一包含N个输出(重构) 点的有限集合C的映射, 点的有限集合C的映射, →C,其中C={y Q:Rk→C,其中C={y1 ,y2 ,… ,yJ} 1,…,J yi ∈ Rk,i=1, ,J 集合C称作码本或码书 码本长度为 码本或码书, 集合C称作码本或码书,码本长度为J 。 码本的J个元素称作码字或码矢量, 码字或码矢量 码本的J个元素称作码字或码矢量,它们均 中的K维矢量。 为Rk中的K维矢量。
10
3.2矢量量化的基本原理 矢量量化的基本原理 一.矢量的定义 矢量的定义 a11,a12,…,a1K ,a 第 1帧 X1=a11,a12,…,a1K ,a X2=a21,a22,….,a2k .,a aN1,aN2,…,aNK ,a 第 N帧
XN=aN1,aN2,….,aNk .,a N个矢量,每个矢量的维数为K 个矢量,每个矢量的维数为K
6
3.1 概述 矢量量化: 二. 矢量量化: x2
Y3 Y4 Y1 Y5 Y6 Y2 x1 Y7
Yi(x1i ,x2i)
7
3.1
概述
三.举例说明标量量化与矢量量化的区别 假设声道滤波器传输函数用4个系数来描述, 假设声道滤波器传输函数用4个系数来描述, 而且,又假设声道只能为4个可能的形状之一。 而且,又假设声道只能为4个可能的形状之一。这 意味着只存在4组可能的声道滤波器传输函数。 意味着只存在4组可能的声道滤波器传输函数。 现在考虑对每一个滤波器系数单独进行标量量 需要2bit 每一分析帧需要8bit来进行编码。 2bit, 来进行编码。 化,需要2bit,每一分析帧需要 来进行编码
3
3.1 概述 一.标量量化 xa(t) xa(nT) x(n)
采样
量化
x(n)=Q[xa(nT)]。 (nT)]。
x1 xa1
∆
xk xak xak+1
xk+1 xaL
xL xaL+1
3.1概述 概述 一.标量量化 标量量化
-2∆ -∆
∆ 2 ∆ 2∆
标量量化
5
3.1 概述 矢量量化: 二. 矢量量化: 若干个标量数据组成一个矢量, 若干个标量数据组成一个矢量,矢量量化是对 矢量进行量化,和标量量化一样, 矢量进行量化,和标量量化一样,它把矢量空间分 成若干个小区域,每个小区域寻找一个代表矢量, 成若干个小区域,每个小区域寻找一个代表矢量, 量化时落入小区域的矢量就用这个代表矢量代替, 量化时落入小区域的矢量就用这个代表矢量代替, 或者叫被量化为这个代表矢量。例如, 或者叫被量化为这个代表矢量。例如,所有可能的 二维矢量就构成了一个平面,将平面分成7个小区 二维矢量就构成了一个平面,将平面分成 个小区 域。
20
3.2 矢量量化的基本原理 六.矢量量化的关键之处 2 未知矢量的量化。 未知矢量的量化。按照选定的失真度准 失真测度),把未知矢量, ),把未知矢量 则(失真测度),把未知矢量,量化为失真度最 小的码字。 小的码字。 失真测度就是两矢量之间的距离。 失真测度就是两矢量之间的距离。
21
七. 矢量量化的失真测度 1.失真测度的定义 失真测度的定义 失真测度(距离测度)就是将输入矢量X 失真测度(距离测度)就是将输入矢量Xi用码 本重构矢量Yj来表征时所产生的误差或失真的度量 本重构矢量Y 来表征时所产生的误差或失真的度量 方法,它可以描述两个或多个模型矢量之间的相 方法, 似程度。常用的失真测度为欧氏距离测度。 似程度。常用的失真测度为欧氏距离测度。
11
3.2 矢量量化的基本原理 二.矢量空间的划分 所有K维矢量构成了一个空间为RK,无遗漏地划 所有K维矢量构成了一个空间为RK, RK 分成J个互不相交的子空间R1,R2 R1,R2… ,将Rj称 分成J个互不相交的子空间R1,R2…RJ ,将Rj称 为胞腔。在每一个子空间Rj找一代表矢量Yj Rj找一代表矢量Yj, 为胞腔。在每一个子空间Rj找一代表矢量Yj, 个代表矢量可以组成矢量集为: 则J个代表矢量可以组成矢量集为: Y={Y1,Y2,…,YJ}构成了一个矢量量化器, Y={Y1,Y2,…,YJ}构成了一个矢量量化器,Y 构成了一个矢量量化器 叫着码本, 称为码本长度, Yj称为码字 称为码字, 叫着码本,J称为码本长度, Yj称为码字,有: Yj={yj1,yj2,…,yjK},j=1,2,… Yj={yj1,yj2,…,yjK},j=1,2,…J。
8
3.1 概述
三.举例说明标量量化与矢量量化的区别 如果我们知道只有4种可能的声道形状, 如果我们知道只有4种可能的声道形状, 与4个可能的声道滤波器系数组成的矢量相对 应,若某一个滤波器系数知道了,其它系数就 若某一个滤波器系数知道了, 知道了, 知道了,也就是矢量中的标量值之间是高度相 关的,在这种情况下,一个分析帧, 关的,在这种情况下,一个分析帧,只需要一 2bits对 个滤波器系数进行编码, 个2bits对4个滤波器系数进行编码,这样降低 了所需的比特数。 了所需的比特数。矢量量化就是利用数据之间 的相关性来降低所需的比特率。 的相关性来降低所需的比特率。
2
3.1 概述 一.标量量化 标量量化 将抽样值的整个动态范围被分成若干个小区 间,每个小区间有一个代表值,量化时落入小区 每个小区间有一个代表值, 间的信号值就用这个代表值代替, 间的信号值就用这个代表值代替,或者叫被量化 为这个代表值。这时的信号量是一维的, 为这个代表值。这时的信号量是一维的,所以称 为标量量化。 为标量量化。