G.721ADPCM语音编码标准的学习及实现

合集下载

adpcm编码规则 -回复

adpcm编码规则 -回复

adpcm编码规则-回复ADPCM编码规则ADPCM(自适应差分脉冲编码调制)是一种音频编码技术,通过压缩音频数据来提高传输和存储的效率。

本文将详细介绍ADPCM的编码规则,包括差分编码、量化、预测和编码等步骤。

一、差分编码差分编码是ADPCM的第一步,通过比较相邻的音频样本,计算两者之间的差值。

这种差值通常会很小,因为音频信号在短时间内变化不大。

例如,如果前一个音频样本是X,当前的样本是Y,差分编码可以表示为Δ=Y-X。

二、量化量化是把差分值映射成离散的数值,以减少数据的位数。

量化可以通过使用特定的量化表或算法来实现,其中每个差分值被替换为最接近的离散值。

通常,量化表是根据预先确定的规则和压缩需求而生成的。

三、预测预测是用于确定下一个样本值的方法。

在ADPCM中,使用前面的差分值和预测参数来估计下一个样本值。

这种方法称为自适应预测,因为预测参数会根据音频信号的特性而变化。

四、编码在编码过程中,使用差分值和预测参数对音频样本进行压缩。

ADPCM 使用固定长度的位数来表示压缩后的差分值和预测参数。

根据压缩需求,可以选择不同的编码方案,如G.726、G.727等。

五、解码解码是ADPCM的逆过程,将压缩后的数据恢复成原始的音频信号。

解码器根据编码过程中使用的编码方案和位数,对压缩数据进行解析,恢复原始的差分值和预测参数。

然后使用差分值和预测参数来计算下一个样本值,最终重建音频信号。

ADPCM具有很多优点,使它成为一种常见的音频编码技术。

首先,它可以显著减少音频数据的存储和传输需求,提高效率。

其次,ADPCM 在保持相对高音质的同时,还能降低延迟,使其适用于实时通信和音频流媒体应用。

此外,ADPCM还具有较低的计算复杂度,可以在资源有限的嵌入式设备上实现。

然而,ADPCM也存在一些限制。

首先,压缩过程会引入一定的误差,使解码后的音频信号与原始信号略有差异。

其次,使用差分编码和预测的方法对快速变化的音频信号效果较差,可能会导致较大的误差。

ADPCM语音编解码电路设计及FPGA实现

ADPCM语音编解码电路设计及FPGA实现

ADPCM语音编解码电路设计及FPGA实现ADPCM算法及其解码器原理ADPCM综合了APCM的自适应特性和DPCM统的差分特性,是一性能较好的波形编码。

它的心思想是:利用自适改变量化阶的大小,即使用小的化阶去编码小的差值,用大的量化阶去编码大的值,使用过去的样本值估算一个输入样本的预测值,使实际样值和预测值之间的差总是最小。

ADPCM记录量化值不是每个采点的幅值,而是该点的幅值与前一采样点幅值之差。

ADPCM是利用样本与样本之的高度相关性和量化阶自适应来压数据的一种波形编码技术。

ADPCM标准是一个代转换系统,它使用ADPCM转技术实现64Kb/sA律或u律PCM速率32Kb/s速率间的相互转换。

ADPCM的简框图如图1所示。

ADPCM编解码器的入信号是G.711PCM代,采样率是8kHz,每个代码8位表示,因此它的据率为64Kb/s。

ADPCM的输出码是“自适应量化器”的输出,该出是用4位表示的差分号,它的采样率仍是8kHz,它的据率为32Kb/s,这样就获得了2:1的数据缩。

电路的整体结基于ADPCM算法,可将语音编解码VLSI芯片分成码、解码、存储、控和时钟几个模块。

编码模块实数据压缩功能,将入的PCM信号转换成ADPCM码,存储块在控制模块的作用下,保编码所得的ADPCM 码,解模块实现解压缩功,将ADPCM码转得到PCM码;控制模的作用是控制其他块的协调工作;时钟模块要实现对外部晶振的原始时钟号进行分频,以得到路系统实际所需的时钟信。

电路整体构如图2所示,其中En_enEn_de分别是编码解码的使能信号,RST则为复位信号。

当写有效,而当读有效,CS“1”时,RAM可进写或者读操作。

电路设计过程本文采用Top-doodelSimSE中,并加入所选器件相的器件库进行时序仿真,时序仿通过后,将QuartusII得到的“*.sof”文件通过JTAG配置式下载到FPGA中进不可掉电的实际测试,也可将*.pof”文件通过AS 配置式下载到FPGA中进行掉电的实际测试。

G.723.1语音编解码器的实现与应用

G.723.1语音编解码器的实现与应用

自 度 可 度 好 达 通 质 。 ̄ 然 及 懂 较 , 到 信 量芳 〕
最后,简单地讨论自 行设计两个 G731语音编解码的应用系统:基于 . 2. Wno91T的 工 N实时语音保密通信系统和可嵌入式的语音保密通信模 idw8N S D
块. 关键词 : 语音编码、 . 3 建议、 G7 . 21 代数码本激励线性预测、多脉冲最大似然
P 量化、DS
G7 .语普编解妈器时实娜与应刃 .3 21 :
Ab ta t sr c
W t t g a dvl m n o Ie e ad a t nyPce Se r t e p et n r t Ir er et, kt eh i h e e o h e f n n n n e l a t t c pc S ih g hi e be ue m rad rwdl Id il c s nl wt i t n u hs n d e m e e . it se h a c n e q a e s o n o i y f a pe i c g g wr tnmtd og PceS ih g to , w u be ip vd e r s i t uh kt wt i N w r w ol e m r e e a e h r a - c n e k e d n o s e cdc hi e t g a r l ad e b re S IU p c oe t n u t hs t qat n l r a . T e h e q h a r e ui c a e y o w i t o t r o m ne a er d te a s- - n ei cd g 731 T e e m edd l a p ii a l ib s t s oi G 2. h c i n r cv n y s y y h s n . . e ecao s nl t h h e e i Mui l Maiu Lklod xitn a f h i r cdr l u e x m i i o ti i g o e a o s t s r g t p m eh Q atao ( - Q a . bs d r e w a cdr unzt n ML ) 6 kp a f t l r e e s ii MP t 3 n o h o t o i Agba -oe xid LnaPeii (C L ) a 5 kp. h l rc d- ce i r r co A E P e iC E t e - d tn . bs T i t 3 s R cm edtn eie a dd p s ti t t n ue f eo m nao s c s c e r r e ao h c b s o i p f i o e e n tn a a e d r cm r s g sec oo ead s nl pnnom l eis v e. o p sn t peh t r i i acm oet ui d e i s ei h e r u o o h g f t a c m r F sy m p e s i s r o G 2. p c oi a t y pr ci t o f 73 s e cd g d it, a p f h y rl e e e . 1 h n n h e e a he u l c r o t T 30 C 4 bi y Scnl id cs s r ic r su u f MS2V 5X e . od , ius t c t t a t t e h r e rf e y t e h l s e ky ta ad d a t hi e ip m nn G73 r o m nao e sf r n hr r e n u o m l etg 2. e m edtn o w e a w e q n e i . 1 c c i bs o T 30 C49 0 D P p e ie paz g s e snl a d MS2V 50- 0 ciidtl m hsi o p c i a e n 1 S h n a, in n h e g

语音编码技术 G.711 G.723 G.726 G.729

语音编码技术 G.711 G.723 G.726 G.729

各标准比较
編碼方式 64kbps/PCM 32kbps/ADPCM 8kbps/CELP 13kbps/GSM
MOS (Mean Opinion Scope) 4.3 4.1 3.7 3.54
方式一:脉冲编码调制(PCM)
PCM編碼 編碼: 編碼 採樣率:對於speech signal,用8000次/Second進行採樣. 1:採樣率 採樣率 2:量化 量化:就是把采集到的数值送到量化器(A/D转换器)编码成数字(數 量化 字編碼能夠讓speech signal有較小的失真),量化级数越多,量化误差 就越小,声音质量就越好。 2.1:綫性 均勻 量化 綫性(均勻 量化:採樣率為12bits/次,數據率為96kbit/s. 綫性 均勻)量化 2.2:非綫性 非均勻)量化 非綫性(非均勻 量化:採樣率為8bits/次,數據率為64kbit/s.從節約 非綫性 非均勻 量化 帶寬的角度,PCM採用非綫性量化.对小信号采用小的量化间隔,对大 信号采用大的量化间隔,这样可以用较少的位数编码。
方式三:差分脉冲编码调制 (DPCM)
差分脉冲编码调制(DPCM)
方式四:自适应差分脉冲调制 (ADPCM)
• ADPCM综合了 综合了APCM的自适应特性和 的自适应特性和DPCM系统 综合了 的自适应特性和 系统 的差分特性。 的差分特性。 • 思想:利用自适应改变量化阶大小;用过去的样本 思想:利用自适应改变量化阶大小; 估算下一个输入样本的预测值, 估算下一个输入样本的预测值,使实际值与预测值 之间的差值尽量小. 之间的差值尽量小
自适应差分脉冲编码调制
• ADPCM是利用样本与样本之间的高度相关性和量 化阶自适应来压缩数据的一种波形编码技术,在 維持相同的語音質量下,ADPCM允許使用32Kbps 比特速率編碼,是標準64kpbs PCM的一半,CCITT为 此制定了G.721标准,及其延伸標準G.723;G.726 等等。 • ADPCM的输入信号是G.711 PCM代码,它的数据 率为64 kb/s。而ADPCM的输出是用4位表示的差 分信号,它的采样率仍然是8 kHz,它的数据率为 32 kb/s,这样就获得了2∶1的数据压缩。

语音信号adpcm编解码实现课程设计正文报告_大学论文

语音信号adpcm编解码实现课程设计正文报告_大学论文

课程设计报告设计课题: ADPCM编解码器的实现姓名:专业: 集成电路设计与集成系统学号:日期指导教师:一:课程设计任务与要求。

ADPCM编解码器的实现。

m转为Verilog,使用Matlab和Modesim联合仿真验证二:系统设计原理。

2.1 脉冲编码调制PCM脉冲编码调制就是把一个时间连续,取值连续的模拟信号变换成时间离散,取值离散的数字信号后在信道中传输。

脉冲编码调制就是对模拟信号先抽样,再对样值幅度量化,编码的过程[9]。

抽样,就是对模拟信号进行周期性扫描,把时间上连续的信号变成时间上离散的信号,抽样必须遵循奈奎斯特抽样定理。

该模拟信号经过抽样后还应当包含原信号中所有信息,也就是说能无失真的恢复原模拟信号。

它的抽样速率的下限是由抽样定理确定的。

抽样速率采用8KHZ。

量化,就是把经过抽样得到的瞬时值将其幅度离散,即用一组规定的电平,把瞬时抽样值用最接近的电平值来表示,通常是用二进制表示。

量化误差:量化后的信号和抽样信号的差值。

量化误差在接收端表现为噪声,称为量化噪声。

量化级数越多误差越小,相应的二进制码位数越多,要求传输速率越高,频带越宽。

为使量化噪声尽可能小而所需码位数又不太多,通常采用非均匀量化的方法进行量化。

非均匀量化根据幅度的不同区间来确定量化间隔,幅度小的区间量化间隔取得小,幅度大的区间量化间隔取得大。

一个模拟信号经过抽样量化后,得到已量化的脉冲幅度调制信号,它仅为有限个数值。

编码,就是用一组二进制码组来表示每一个有固定电平的量化值。

然而,实际上量化是在编码过程中同时完成的,故编码过程也称为模/数变换,可记作A/D。

2.2 差分脉冲编码调制DPCM差分脉冲编码调制DPCM是利用样本与样本之间存在的信息冗余度(预测样值与当前样值之差)来代替样值本身进行编码的一种数据压缩技术[10]。

差分脉冲编码调制可以实现在量化台阶不变(即量化噪声不变)的情况下,编码位数显著减少,信号带宽大大压缩。

语音声码器模型及ADPCM声码器仿真

语音声码器模型及ADPCM声码器仿真

语音编解码 的算法及设计既要考虑尽量保 留、还原原始语音 ,又要让编码解码过程尽量快速 。T程中 ,语 音编解码算法的时间复杂度与空间复杂度衡量着算法 的复杂程度_ 1 1 。硬件层面上 ,算法在具体实现时的时问 延迟 、鲁棒性 、硬件资源的占用等因素均影响语音编解码器的性能f 2 1 。语音编解码是在语音质量 、算法复杂
分析编解码算法及编码前后 、解码前后信息差度量 A 1 、A 2 。对0 . 8 4 1 1 秒的WA V 语 音实现了采样 频
率8 K H z ,数据率3 2 K b p s 的语 音编码 ,并很好地还原 出声 音。实现算法时要 充分考 虑环境噪音。算
法对卜0 . 1 , 0 . 1 ] 的随机加性噪声有较好 的鲁棒性 ,编解码时间稳定 ,时间复杂度为0 ( N ) 。 [ 关键 词】 声码器 ;自适应差分脉冲编码调制 ;数学模型

2 2・
D1 ×T - = Y3 .
( 5 )
将( 3 ) 代人( 5 ) ,Y 2 ×T × T - l _ l , 3 ,即 :
y 2 = y 3 . ( 6 )
△ 为解 码前后 信 息量 差 。
△2 = 1 1 I ( Y 。 ) 一 I ( D) I I . A = 1 1 I ( y : ) 一 , ( y 。 ) l I . A = 1 1 I ( Y 2 ) . , ( 】 , ) J J .
第3 2 卷第 3期
V0 l I 3 2 No . 3
长 春师 范学院 学报 ( 自然科 学版 )
J o u r n a l o f C h a n g c h u n N o r ma l U n i v e r s i t y ( N a t u r a l S c i e n c e )

语音编解码 标准

语音编解码 标准

语音编解码标准的知识G.711类型:Audio制定者:ITU-T所需频宽:64Kbps特性:算法复杂度小,音质一般优点:算法复杂度低,压缩比小(CD音质>400kbps),编解码延时最短(相对其它技术)缺点:占用的带宽较高应用领域:voip版税方式:Free备注:70年代CCITT公布的G.711 64kb/s脉冲编码调制PCM。

G.721类型:Audio制定者:ITU-T所需频宽:32Kbps特性:相对于PCMA和PCMU,其压缩比较高,可以提供2:1的压缩比。

优点:压缩比大缺点:声音质量一般应用领域:voip版税方式:Free备注:子带ADPCM(SB-ADPCM)技术。

G.721标准是一个代码转换系统。

它使用ADPCM转换技术,实现64 kb/s A律或μ律PCM速率和32 kb/s速率之间的相互转换。

G.722类型:Audio制定者:ITU-T所需频宽:64Kbps特性:G722能提供高保真的语音质量优点:音质好缺点:带宽要求高应用领域:voip版税方式:Free备注:子带ADPCM(SB-ADPCM)技术G.723(低码率语音编码算法)类型:Audio制定者:ITU-T所需频宽:5.3Kbps/6.3Kbps特性:语音质量接近良,带宽要求低,高效实现,便于多路扩展,可利用C5402片内16kRAM 实现53coder。

达到ITU-TG723要求的语音质量,性能稳定。

可用于IP电话语音信源编码或高效语音压缩存储。

优点:码率低,带宽要求较小。

并达到ITU-TG723要求的语音质量,性能稳定。

缺点:声音质量一般应用领域:voip版税方式:Free备注:G.723语音编码器是一种用于多媒体通信,编码速率为5.3kbits/s和6.3kbit/s的双码率编码方案。

G.723标准是国际电信联盟(ITU)制定的多媒体通信标准中的一个组成部分,可以应用于IP电话等系统中。

其中,5.3kbits/s码率编码器采用多脉冲最大似然量化技术(MP-MLQ),6.3kbits/s码率编码器采用代数码激励线性预测技术。

ADPCM-G721格式说明

ADPCM-G721格式说明

ADPCM WAVE文件的压缩与解压缩[原创]分类:程序设计:经典算法与技术赏析2005-10-13 21:15 8342人阅读评论(8) 收藏举报一、概述:本文叙述了如何通过IMA-ADPCM压缩和解压缩算法来完成从IMA-ADPCM文件转换为PCM文件的过程。

主要包括的内容有:PCM和IMA-ADPCM WAVE文件内部结构的介绍,IMA-ADPCM压缩与解压缩算法,以及如何生成特有的音频压缩格式文件等三方面的内容。

二、WAVE文件的认识WAVE文件是计算机领域最常用的数字化声音文件格式之一,它是微软专门为Windows系统定义的波形文件格式(Waveform Audio),由于其扩展名为"*.wav"。

wave文件有很多不同的压缩格式,而且现在一些程序生成的wave文件都或多或少地含有一些错误。

这些错误的产生不是因为单个数据压缩和解压缩算法的问题,而是因为在压缩和解压缩后没有正确地组织好文件的内部结构。

所以,正确而详细地了解各种WAVE文件的内部结构是成功完成压缩和解压缩的基础,也是生成特有音频压缩格式文件的前提。

最基本的WAVE文件是PCM(脉冲编码调制)格式的,这种文件直接存储采样的声音数据没有经过任何的压缩,是声卡直接支持的数据格式,要让声卡正确播放其它被压缩的声音数据,就应该先把压缩的数据解压缩成PCM格式,然后再让声卡来播放。

1.Wave文件的内部结构WAVE文件是以RIFF(Resource Interchange File Format,"资源交互文件格式")格式来组织内部结构的。

RIFF文件结构可以看作是树状结构,其基本构成是称为"块"(Chunk)的单元,最顶端是一个“RIFF”块,下面的每个块有“类型块标识(可选)”、“标志符”、“数据大小”及“数据”等项所组成,块的结构如表1所示:上面说到的“类型块标识”只在部分chunk中用到,如“WAVE”chunk中,这时表示下面嵌套有别的chunk,当使用了“类型块标识”时,该chunk就没有别的项(如块标志符,数据大小等),它只作为文件读取时的一个标识。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

G.721ADPCM语音编码标准的学习及实现摘要语音是人类相互之间交流时最常使用的信息载体。

在信息化高度发展的今天,语音处理技术以及它的应用已经成为信息化社会不可缺少的重要组成部分。

而语音编码作为语音信号处理的一个分支,目的就是要在保证语音音质和可懂度的条件下,采用尽可能少的比特数来表示语音,它是现代通信和信息工程领域不可缺少的关键技术。

语音编码在数字通信网中占据着重要的位置。

随着通信技术和信息社会的飞速发展,频率资源显得越来越宝贵。

因此,降低电话信道的传输码率又或者是压缩语音信号的传输带宽,一直以来都是人们所追求的目标,语音编码技术也因此显得更加重要。

总而言之,数字语音通信与存储技术和语音编码是密不可分的,语音应答系统、语音信箱、数字录音电话、语音查询系统等,也都是随着语音压缩编码技术而发展起来的。

本文简单介绍了语音信号的编码技术,主要学习了G.721 ADPCM语音编码标准并通过编程实现。

关键字:语音编码、语音通信、压缩、存储、语音信号引言语音编码是在保持一定的算法复杂度和通信时延的前提下,运用尽可能少的信道容量,传输尽可能高质量的语音。

编码器的效率和算法复杂度之间通常呈正比关系,算法越复杂,时延和费用就越高。

因此,必须在这两个矛盾的因素之间寻找一个平衡点。

语音编码发展的目的是为了使平衡点向更低的比特率方向移动。

ITU已经制定了几种码率的语音编码国际标准,这些标准推动了研究工作的进展。

1 语音编码的分类、特性及现状语音编码编码方式大致可以分为三种:波形编码、参数编码、混合编码。

波形编码是将时间域或变换域信号直接变换成数字信号,力求使重建语音波形保持原始语音信号的波形形状。

参数编码又称声码器编码,它是将信源信号在频域或其他变换域提取特征参数,然后对这些特征参数进行编码和传输,在译码端再将接收到的数字信号译成特征参数,根据这些特征参数重建语音信号。

混合编码将波形编码和参数编码结合起来,克服了波形编码和参数编码的缺点,吸收了他们的长处,能够在较低速率上得到高质量的合成语音。

在编码速率比较高的时候,波形编码能够很容易满足抗噪声、重构语音质量好、可靠性高等要求,但是一旦编码速率降低,即编码质量急剧下降。

发展到现在,成熟并且广泛使用的波形编码方式有脉冲编码调制(PCM)、自适应差分脉冲编码调制(ADPCM)、自适应增量调制(ADM)、自适应预测编码(APC)等。

但是这些编码方式在速率降低到16Kb/s以下时,重构语音信号的效果就较差。

结合波形编码中与原始语音波形逼近的特点以及参数编码中提取特征参数的优点,混合编码技术在合成语音质量和速率两方面都能达到较满意的效果,因此被作为研究的主要方向不断地得到发展。

技术比较成熟并被反复研究的混合编码算法有多脉冲激励线性预测编码(MPLPC)、码本激励线性预测编码(CELP)、混合激励线性预测编码(MELP)。

2语音编码的国际标准由于数字编码技术具有广阔的应用范围和良好的市场前景,从20世纪80年代开始,国际上著名大通信研究机构和大学均大力开展高音质低码率的语音编码技术研究,并且取得了丰硕的成果,因此,语音编码技术的标准化工作就显得尤为重要。

ITU在语音编码技术的标准化方面作了大量的工作,制定了很多标准,并且逐渐受到了业界的认同。

在其中,比较典型的有G.711、G.721、G.728、G.729等标准。

G.711标准最早的语音编码方案是PCM编码,PCM的码率为64kbps。

对语音信号按照8kHz进行采样,再对每一个要样本做8bit的标量量化。

这种方案只能将语音由模拟信号变为数字信号,但却没有做任何进一步的数学处理。

虽然它的码率很高,但是处理程序却很简单,至今仍然在很多的场合中被采用。

它被ITU定为G.711标准。

G.721标准G.711标准产生之后,人们在语音压缩编码领域投入了大量的精力进行研究。

经很长时间的研究,一种致力于消除语音信号样本间相关性的线性预测编码算法被科学家们提出了。

它可以在基本保证音质的条件下,使码率有了较大程度的压缩。

利用当时还处于初级阶段的线性预测方法,科学家们成功开发出了码率为32kbps的增量调制编码ADPCM方案,但音质略次于PCM编码,可懂度和自然度都很不错,立即受到了人们的青睐。

它被ITU定位G.721标准。

G.728标准正当人们对线性预测编码技术进行深入研究的时候,另外一种利用相关性压缩量化编码的方法即矢量量化方法被提出来。

该技术在压缩量化编码上的效率很高,但其缺点是计算量太庞大,随着IC技术的不断发展,计算机和DSP的运行处理速度加快,这种编码方式的可行性越加的明显。

不过现在的计算机和DSP芯片已经能够满足它的计算要求。

把矢量量化技术和线性预测编码技术联合起来使用,就产生了许多比较成功的音质较好的线性预测编码方法。

例如:多脉冲激励线性预测编码算法、规则脉冲激励线性预测编码算法和码激励线性预测编码算法。

其中,由CELP算法衍生出的低延时码激励线性预测编码算法更为成熟,1991年被ITU定为G.728标准。

G.729标准保持高音质就是要使合成原始语音的均方误差始终小到不易察觉。

在这样的前提下,通过改进算法,达到进一步压缩码率的目的。

其中CS-ACELP算法就是该思路的产物,它实现了8kbps的码率。

ITU在1996年将它定制为G.729标准。

3自适应差分脉冲编码调制ADPCM在许多应用中,特别是长途传输系统,64kbit/s的G.711标准占用的频带太宽,通信成本太贵。

ITU-T从1981年起经过三年的讨论与研究,于1984年提出了G.721 32kbit/s ADPCM编码标准,并于1986年根据两年间运行中出现的问题做了进一步修正。

ADPCM将脉冲编码调制、差值调制和自适应技术三者结合起来,进一步利用语音信号样点间的相关性,并针对语音信号的非平衡特点,使用了自适应预测和自适应量化,在32kbit/s速率上能够给出网络等级语音质量,从而符合进入公用网的要求。

下图是G.721算法的框图,其中虚线部分是解码器框图。

由图中可以看出,编码器中嵌入一个解码器,使得编码器的自适应修正完全取决于信号的反馈值。

这个反馈值与解码器的输出是一致的,所以后续的差值采样就补偿了量化误差,从而避免了量化误差的积累。

下面详细介绍G.721各部分算法。

(1) 求采样值s(k)与其估计s e (k)之差:d (k )=s (k )−s e (k)(2) 自适应量化d (k ),并编码输出I (k ):I (k )=log 2|d (k )|−y(k)其中,I (k )还含有一位符号。

表 给出I (k )的编码值。

y(k)是量化阶矩自适应因子,它由调整短时能量变化较快的语音信号的y u (k)和调整数据类慢变信号的y l (k)两部分,经速度调整因子a l (k)加权平均而成:y (k )=a l (k )∙y u (k −1)+[1−a l (k )]y l (k −1) 0≤a l ≤1 对快变信号a l (k)趋于1,而对慢变信号a l (k )趋于0。

归一化输入log 2|d (k )|−y(k)输出代码I (k ) 归一化量化输出log 2|d q (k )|−y(k) [3.12,+∞]7 3.32 [2.72,3.12]6 2.91 [2.34,2.72]5 2.52 [1.91,2.34]4 2.13 [1.38,1.91]3 1.66 [0.62,1.38]2 1.05 [-0.98,0.62]1 0.031 [-∞,-0.98]0 -∞(3) 阶矩自适应因子y u (k )称快速非锁定标度因子,它的取值范围在1.06≤y u (k )≤10区间,对应的线性域为∆min =21.06=2.085,∆max =210=1024。

y u (k )=(1−2−5)y (k )+2−5ω[I(k)]ω[I(k)]的取值如下表所示。

|I (k )| 7 6 5 4 3 2 1 0ω[I(k)] 70.13 22.19 12.38 7.00 4.00 2.56 1.13 -0.75 为了适应语音预测差值信号中的基音引起的能量突变,ω[I(k)]的高端取值都很大。

对计算差值信号 自适应量化器 自适应逆量化器自适应预测器 重建信号计算量化阶矩自适应 速度控制自适应 单频与瞬变音检测G .721编码器原理框图于带内数据,信号短时能量基本上是平稳的,阶矩自适应采用如下算法:y l(k)=(1−2−6)y l(k−1)+2−6y u(k)式中,y l(k)称为锁定标度因子。

(4)速度控制a l(k)是速度控制因子,它是通过I(k)的长时平均幅度值d ml(k)与短时平均幅度值d ms(k)的差求出的。

它反映了预测余量信号的变化率。

长时:d ml(k)=(1−2−7)d ml(k−1)+2−7F[I(k)]短时:d ms(k)=(1−2−5)d ms(k−1)+2−5F[I(k)]函数F[I(k)]的取值如下表所示。

当余量信号短时能量平稳时,I k的统计特性随时间变化很小,d ml ms大。

而当余量信号短时能量起伏较大时,它们出现差值.利用这一特性先计算中间参数a p(k):a p(k)={(1−2−4)a p(k−1)+2−3,当|d ms(k)−d ml(k)|≥2−3d ml(k)或当y(k)<3 (1−2−4)a p(k−1),其他情况显然,当I(k)幅度变化较大时,a p(k)→2,而差别小时a p(k)→0。

条件y(k)﹤3表明输入信号很小,处于清音段或噪声段,这时也有a p(k)→2,以便量化器处于快速自适应状态来等待输入信号的突然变化。

量器速度控制因子a l(k)是通过对a p(k)限幅得到的:a l(k)={1,当a p(k−1)≥1a p(k−1),当a p(k−1)<1这样,量化器从快速自适应向慢速自适应转变有一个延时。

对于带内调幅数据,这种延迟效应可以防止自适应速度过早变慢,从而避免脉冲沿产生太大的畸变。

(5)自适应逆量化器输出d q(k)=2y(k)+I(k)(6)自适应预测预测器采用6阶零点,2阶极点的模型。

预测信号为s e(n)=∑a i(n−1)2i=1s r(n−i)+s ez(n)s ez(n)=∑b j(n−1)d q(n−j)6j=1重建信号为s r(n)=s e(n)+d q(n)极点、零点预测器系数分别是a i和b j。

其调整方式为b j(n)=(1−2−8)b j(n−1)+2−7sgn[d q(n)]∙sgn[d q(n−j)]此式隐含差|b j(n)|≤2,为保证算法稳定,二阶极点预测器系数限制如下a2(n)≤0.75;|a1(n)|≤1−a2(n)−2−4它们的调整方式为a1(n)=(1−2−8)a1(n−1)+3∙2−8sgn[p(n)]∙sgn[p(n−1)]a 2(n )=(1−2−7)a 2(n −1)+2−7sgn [p (n )]∙{sgn [p (n −2)]−f [a 1(n −1)]∙sgn [p (n −1)]}式中p (n )=d q (n )+s ez (n )f [a 1]={4a 1 , 当|a 1|≤122sgn [a 1],当|a 1|>12(7) 单频和瞬变调整当ADPCM 编码器遇到频移键控信号(FSK )或其他窄带瞬变信号时,需要将系统从慢速自适应状态强制性的调整到快速自适应状态。

相关文档
最新文档