0_8kb_s高质量声码器算法_李军林

合集下载

AMR语音编码算法研究及复杂度剖析

匡镜明l943男湖面益阳人教授通信与电子系统专家博士生导师北京理工大学校长兼任国家教育部科技委委员北京市学位委员会委员中国电子学会通信学会副主任委员及通信学报编委等职务
2003 年第 1 期电讯技术
研究与开发
RESEARCH & D EVELOPMENT
文章编号 :1001 - 893X ( 2003) 01 - 0092 - 05
AMR 语音编码算法研究及复杂度剖析 3
郑雪帆刘春陆诚匡镜明赵胜辉
( 北京理工大学电子工程系 ,北京 100081)
摘要 : 作为 3 GPP WCDMA 的语音编码 ( Speech Coding) 候选方案 ,自适应多速率 ( AMR) 语音编码是一种多模式集成的 ACEL P 类语音编码方案。本文根据该编码方案的标准 ,分析了其方案实现中的关键算法 : 高性能码本设计、高效码本搜索算法、多级矢量量化技术、预处理算法的简化等。最后 , 设计了定点 ANSI - C 程序对 AMR 语音编码算法各部分的复杂度进行了测算。关键词 : 第三代移动通信 ; 语音编码 ; 自适应多速率 ; 码激励线性预测 ; 计算复杂度 ; 算法中图分类号 : TN91213 文献标识码 :A
收稿日期 :2002 - 06 - 12 基金项目 : 爱力信合作项目・92 ・
2003 年第 1 期电讯技术
研究与开发
RESEARCH & D EVELOPMENT
图1 AMR 编码器系统流程图
1. L SP 的矢量量化和内插
AMR 编码器各模式都使用 10 阶合成滤波器 :
= A (z/ r1 ) / [ A ^ (z) A (z/ r2 ) 的冲激响应 h ( n)

基于双通道神经网络时频掩蔽的语音增强算法

第49卷第 6 期 2021年 6 月
DOI：10.13245/j.hust.210609
华中科技大学学报（自然科学版） J. Huazhong Univ. of Sci. & Tech. (Natural Science Edition)
Vol.49 No.6 Jun. 2021
估计方向矢量，识别每路麦克风信号上用于定位的语音主导的时频 (t ime-f r e q u e n c y ，T -F )单元，使其在强噪声和混响环境下仍得到准确方向矢量估计. 最后，输入到基于加权最小化无失真响应(w e i g h t ed p o w e r minimization distortionless r e s p o n s e ， W P D )优化准则的卷积波束形成器中进行语音增强，使去噪抑制混响效果同时达到最优.与几种不同的语音增强方法相比，本文算法既消除了与语音同方向的背景噪声，又消除了不同方向的噪声干扰，得到的增强语音可懂度和清晰度都较高.并且本研究根据神经网络训练的模型，不需要任何关于麦克风阵列的先验知识，在噪声环境下有较强的鲁棒性.
模，对双麦克风信号分别进行单通道神经网络初步语音增强，达到全面利用语音非线性特征改善感知度的目的：
其次，提出一种基于自适应掩模方向矢量定位法，精确计算语音、噪声的空间协方差矩阵和方向矢量，在带噪和
混响的环境下精确定位目标声源；最后，输入信号到卷积波束形成器中，进一步去噪和抑制混响 .实验结果表
收稿日期 2020-09-01. 作者简介贾海蓉(1977-)，女，教授，E-mail: helenjia722@. 基金项目国家自然科学基金资助项目（12004275):山西省留学人员科技活动择优资助项目(20200017) ; 山西省回国留学

极低速率语音编码中LSP参数的高效量化算法_李军林

LI Junlin, CUI Huijun, TANG Kun
( State Key L aboratory of Mi crowave and Di gi tal Communications , Department of El ectronic Engi neeri ng,
Ts inghua Uni versi ty, Beij ing 100084, Chi na)
李军林, 崔慧娟, 唐昆
( 清华大学电子工程系, 微波与数字通信技术国家重点实验室, 北京 100084)
摘要: 为在极低速率下实现高质量的语音编码, 提出了一种新的有效的线谱对( LSP ) 参数量化算法—— P-RS-M SM Q 算法。此算法以多帧联合矩阵量化作为基本框架, 引入了基于超级帧模式的均值去除和帧间预测策略、矩阵分裂和子矩阵多级量化策略; 同时提出了基于语音帧短时谱能量的帧内加权和基于超级帧中各子帧重要性的帧间加权策略等。实验表明: 此算法能够在 700 b/ s 的速率下获得接近透明量化的性能; 即使在 300～400 b/ s 的极低速率下也具有较高质量的量化效果。因此该算法的实现对极低速率语音编码算法的研究具有重要的意义。
Abstract: T hisp aper pr esent s an eff ici ent linear spect rum pairs ( LSP) paramet ers quant izati on algorit hm call ed Pat t er n-bas ed Residu al Sp lit M ult i-St age M at rix Q uan tiz at ion ( P-RS -M SM Q ) . T he m et hod us es mat rix quant izat ion of m ult iplef rames w it h not only mean -valu e-removal and int er-fr ame predi ct ion bas edon t hes uper-fr ame pat t ern, but al so mat rix spl it tin g and mult i-st age mat rix quant izat ion . T he al gorit hm al so u ses an int ra-f rame w eigh tin g scheme based on t he ener gy of t he s hort -t ime spect rum an d an int er-frame w eigh ti ng scheme bas ed on t he import an ce of frames in t he s uper-fr ame. Simul at ion resul t s demonst rat e t hat t he algorit hm can ach ieve alm os t “t ransp arent ”LSP quan tiz at ion at 700 b / s and good perf or man ce at t he ver y low bit -rat eof 300 ～ 400 b / s, so t he algorit h m is very us ef ul f or very l ow bit -rate s peech coding .

高效的MPEG先进音频编码方案

高效的MPEG先进音频编码方案
李琳;郭立;黄昊
【期刊名称】《小型微型计算机系统》
【年(卷),期】2008(29)4
【摘要】为提高MPEG先进音频编码系统的编码效率,分别在三个关键模块上进行了算法优化,提出一种高效的编码实现方案.在心理声学模型中,使用新的时域分块峰值变换率准则代替感知熵来判断MDCT变换块的类型,降低误判、漏判概率,提高编码质量和速度;在分析滤波器中,基于双路并行计算技术,采用N/8点FFT算法实现N点MDCT变换,提高运算速度;在量化编码模块中,利用量化噪声能量公式,减少量化迭代次数,提高编码效率.该编码方案在保证音频质量的前提下,减少了50%的编码时间,满足实时性系统设计的要求.
【总页数】5页(P746-750)
【作者】李琳;郭立;黄昊
【作者单位】中国科学技术大学,电子科学与技术系电路与系统实验室,安徽,合肥,230027;中国科学技术大学,电子科学与技术系电路与系统实验室,安徽,合
肥,230027;中国科学技术大学,电子科学与技术系电路与系统实验室,安徽,合
肥,230027
【正文语种】中文
【中图分类】TP391
【相关文献】
1.ISO／IEC MPEG—2先进音频编码（一） [J], 任永川;史名锐
2.ISO／IEC MPEG—2先进音频编码（二） [J], 任永川;史名锐
3.ISO／IEC MPEG—2先进音频编码（三） [J], 任永川;史名锐
4.ISO/IEC MPEG-2先进音频编码(四) [J], 任永川;史名锐
5.MPEG-2先进音频编码(AAC)的研究和软件仿真 [J], 包益平;陈健
因版权原因，仅展示原文概要，查看原文内容请购买。

4．8kbps多带激励语音编码器的模拟实现

4．8kbps多带激励语音编码器的模拟实现
王都生;樊昌信
【期刊名称】《西安电子科技大学学报》
【年(卷),期】1995(22)3
【摘要】文章阐述了多带激励（ＭＢＥ）语音产生模型与以往单一激励语音产生模型的区别及其优越性。

研究了以ＭＢＥ模型为基础进行语音分析合成的基本原理和实现的算法。

提出了４．８ｋｂｐｓＭＢＥ语音编码方案，并在计算机上进行了模拟实现。

实验结果表明，所模拟的４．８ｋｂｐｓＭＢＥ语音编码器系统是成功的。

其合成语音在可懂度与自然度方面，与以往的线性预测（ＬＰＣ）、码激励线性预测（ＣＥＬＰ）语音编码系统相比都有了明显的改善。

【总页数】8页(P227-234)
【关键词】多带激励;编码器;语音编码器;计算机模拟
【作者】王都生;樊昌信
【作者单位】西安电子科技大学信息科学研究所
【正文语种】中文
【中图分类】TN912.32
【相关文献】
1.多带激励语音编码器仿真实现 [J], 汤敏;曾毓敏;谭锡林
2.2.4 kbit/s多带混合激励线性预测语音编码器的模拟 [J], 王都生;铁满霞;樊昌信
3.800/920/1200 bps改进型多带激励语音编码器的DSP实现 [J], 王都生
4.4.8kbps低延迟MBE语音编码器研究 [J], 霍亮;吴家安
5.4.8kbps多带激励音编码器的模拟实现 [J], 王都生;樊昌信
因版权原因，仅展示原文概要，查看原文内容请购买。

基于MELP改进算法的低速率声码器设计与实现

基于MELP改进算法的低速率声码器设计与实现
马金全;高世海;张连海
【期刊名称】《电子科技》
【年(卷),期】2009(22)1
【摘要】文中研究了一种基于MELP模型的0.6 kb·s-1语音编码算法,该算法将四子帧组成一个超帧,并根据各子帧的清/浊属性,划分超帧为多个模式,不同的模式采用不同的量化联合编码方案.并在TMS320C5416上实时实现了该声码器算法,合成语音清晰可懂,具有较好的自然度.
【总页数】4页(P31-34)
【作者】马金全;高世海;张连海
【作者单位】中国人民解放军信息工程大学信息工程学院,河南,郑州,450002;中国人民解放军信息工程大学信息工程学院,河南,郑州,450002;中国人民解放军信息工程大学信息工程学院,河南,郑州,450002
【正文语种】中文
【中图分类】TN912.32
【相关文献】
1.基于LPC-10声码器的极低速率语音编码算法研究 [J], 陈明义;马飞
2.改进的MELP低速率语音编码器 [J], 冯晓荣;刘晓明;田雨
3.MELP低速率语音编码器在DSP上的改进与优化 [J], 田雨;刘晓明;冯晓荣
4.基于DSP芯片的MELP声码器的算法实现 [J], 郝软层;徐金甫
5.基于DSP芯片的MELP声码器的算法实现 [J], 郝软层;徐金甫
因版权原因，仅展示原文概要，查看原文内容请购买。

基于正弦激励的3.6Kb／s低复杂度语音编码算法

低了算法的运算量和存储量。试结果显示，音质量优于欧洲集群通信标准ＴＴＡ中的ＡＥＰ４５７Ｋ／低复测语ＥＲＣＬ．ｂｓ６
杂度语音编码器，而运算量和存储量不足ＡＥＰ的１。ＣＬ／４
算法对线谱对（ｉａＳｅｔｍＰｉ，Ｓ）数进行全ＬｎｒｐｃｕａＬＰ参ｅｒｒ局最佳标量量化，且采用全１型取代正弦波幅度，并模降低了编解码的复杂度。与欧洲集群通信标准ＴＴＡＥＲ
ａｇｒｈｓｐｏｏｅ．Ｓｂｆｍｅｐｒｍｔｘａｔｎ￣ｎｕｉａｄｍｘｄｅｃｔｉｎａｓｄｔｅｈｎｅｔｅｌｉｍｉｒｓｄｏｔｐｕ —ｒａａｅｒｅｔｃｏ＇ｄｍｈｂｎｉｅｘｉｔｒｕｅｏｎａｃｈａｅｒｉ｛ａｏｅ
ＳｉｕａｉｎｅｕｔｓｗｈｔｈｅｒｐｓｄｐｅｃｈｍｌｔｏｒｓｌｓｈｏｔａｔｐｏｅｓｅｃｏｒｏｔｅｏｓｈｅＥＴＲＡ—ＡＣＥＬＰ５／ｃｄｒｎｐｅｃｏｄｅｕｐｒｒｔＴｆｍ４．６７Ｋｂｓｏｅｉｓｅｈ
ＳＥＧＹ－ｉ，ＣＩＨｉｕｎＡＧＫｎＨＮｕｘａＵｕ－ａ，ＴＮｕｊ
（ｔｔｙＬｂｒｔｒｆＭｉｒｗａｅ＆ＤｉｉｌＣｍｍｕｉａｉｎ，ＤｅｔｆＥｅｔｏｉｎｉｅｒｇ，ＳａｅＫｅａｏａｏｙｏｃｏｖｇｔｏａｎｃｔｏｐ．ｏｌｃｒｎｃＥｇｎｅｎｉ

一种新的子带声音强度参数及提取算法

一种新的子带声音强度参数及提取算法田春环;姜占才;李小航【摘要】为了使混合激励线性预测语音编码器（MELP）的应用更接近实际，提出了一种基于短时幅度与短时平均幅度差函数的子带声音强度提取方法。

该方法根据MELP声码器解码语音的（MOS）评分得出最佳的线性组合系数，进而求出5个子带的清/浊音强度，并将其植入MELP声码器中。

仿真实验表明，该算法不仅与原算法具有相同的效果，而且算法复杂度低。

%In order to make the mixed excitation linear prediction speech coder (MELP) closer to the actual application, this paper proposes a method of subband voiced intensity extraction based on a short-time magnitude and short-time average magnitude difference function. The method calculate the linear combination of the two coefficient based on MOS score of decoding speech of MELP vocoder, and calculate 5 bandpass unvoiced / voiced intensity, apply it to the MELP vocoder. Simulation experiments show that the algorithm not only decoding speech with the original algorithm of decoding speech has the same effect, but also has low algorithm complexity.【期刊名称】《电子设计工程》【年(卷),期】2016(024)020【总页数】4页(P171-173,177)【关键词】清/浊音强度;短时幅度;短时平均幅度差函数;线性组合【作者】田春环;姜占才;李小航【作者单位】青海师范大学物理系，青海西宁 810008;青海师范大学物理系，青海西宁 810008;青海师范大学物理系，青海西宁 810008【正文语种】中文【中图分类】TN912.35高质量的低速率实时语音压缩编码技术始终是语音编码中重要的研究课题［1］。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

I S SN 1000-0054CN 11-2223/N 清华大学学报(自然科学版)J Tsing hua Univ (S ci &Tec h ),2003年第43卷第1期2003,V ol .43,N o .14/3712-150.8kb /s 高质量声码器算法李军林,　杜　松,　崔慧娟,　唐　昆(清华大学电子工程系,北京100084)收稿日期:2001-08-07基金项目:国家自然科学基金资助项目(69972020);清华大学“九八五”基金项目作者简介:李军林(1978-),男(汉),四川,硕士研究生。

通讯联系人:唐昆,教授,E-mail:tangk un@mail.tsin 摘　要:随着通信的发展,对极低速率下语音压缩编码算法的需求越来越迫切。

为满足极低码率的要求并获得高质量的合成语音,提出了一种高质量的0.8kb/s 声码器算法。

此算法基于传统的线性预测模型,利用多帧联合的超级帧参数分模式联合矢量量化技术,以及多带混合激励,子带清浊音参数相关预测,自适应谱增强,脉冲扩散后滤波等技术。

主观听觉测试显示,此声码器在0.8kb/s 的速率下其合成语音不仅具有高可懂度而且具有一定的自然度,诊断押韵测试(D RT )的分数为85%,而且此声码器在10-2的随机误码的信道条件下仍然具有很好的可懂度。

关键词:声码器;线性预测;矢量量化;自适应谱增强中图分类号:T N 912.3文献标识码:A文章编号:1000-0054(2003)01-0012-040.8kb /s high quality speechcoding algorithmLI Ju nlin ,DU Song ,CUI Hu ijuan ,TANG Ku n(Department of Electronic Engineering ,Tsinghua University ,Beij ing 100084,China )Abstract :T his paper presents a 0.8kb /s high quality vocoder to obtain high quality syn th etic s peech at a very low bit rate.T he algorithm is based on a traditional linear prediction model with multi-framejointvectorquantification ,multi-b andmixingex citation,sub -ban d voicing stren gth parameter prediction,ad aptive spectral enhancement,and pulse dis pers ion etc.Sim ulation res ults dem onstrate that the intelligibility of this 0.8kb /s vocoder is quite good and the natural tone is fine.Th e d iagnos tic rh yme tes t (DRT )score is 85%in an in formal test.Furthermore,the vocoder is robus t in a noisy environmen t,and intelligible even w ith a bit error rate of 10-2.Key words :vocoder ;linear prediction ;vector quantization;ad aptivespectral enh ancement高质量低速率语音编码技术是语音编码领域中重要的研究课题之一。

2.4kb/s 及其更低速率的语音编码算法在保密通信、卫星通信和IP 电话等领域有着重要的应用。

随着数字通信的迅猛发展,带宽资源越来越紧张,因此对更低速率的语音编码算法提出了迫切的要求。

2.4kb/s 语音编码算法获得了很大的成功[1～3],但是现阶段0.8kb/s 的语音编码算法仍然是一个巨大的挑战,其中的关键是用有限的比特数有效地表示语音编码参数。

在语音编码领域,线性预测(LP )技术获得了广泛的应用,如LPC-10,CELP,M ELP [4]等,本文提出的声码器算法也以线性预测模型为基础。

为了在0.8kb/s 的极低速率下获得高质量的合成语音,本声码器算法中还引入了编码端参数多帧联合矢量量化、解码端分带合成及部分参数相关预测等新技术,从而有效的降低了传输码率,并获得高质量的合成语音。

1　编码器基本原理此声码器算法编码器的功能框图如图1所示。

图1　编码器功能框图对每帧语音分别提取预测系数、基音周期、清浊音标志和短时帧能量等4种参数。

所有编码参数均用经过预处理后的语音信号进行提取。

基音周期的估值采用自相关法:r (S )=c S (0,S )c S (0,0)c S (S ,S ),(1),c S (m ,n )=6-û-S /2-û+79k =-û-S /2-û-80s k +m s k +n ,(2)其中:S 是待搜索基音周期,搜索范围是20～160个语音样点;s k 是预处理后语音信号的低频成分(0～500Hz );求自相关的窗长为160个语音样点,窗口位置根据基音周期自适应调整。

求得整数基音周期后,在(S -1)～(S +1)范围内进行1/4样点精度的分数基音周期搜索。

用上述方法求得5个待选的基音周期后,再前瞻2帧用动态规划的办法对基音周期进行平滑,求得最终的基音周期值及其对应的本帧最大的自相关值。

如果此自相关值大于给定的域值,则判断该帧为浊音帧;否则为清音帧。

另外在基音周期估值和清浊音判决时还需要用线性预测(L P)逆滤波后的余量信号进行修正。

短时帧能量参数为G i =10lg õ0.01+1L 6Ln =1s 2n 【,(3)其中:L 是窗口的长度,其值根据基音周期的值自适应调整。

语音信号的谱包络用10阶线性预测系数表示,并转化成线谱频率(LSF)进行编码传输。

2　超级帧参数联合矢量量化本声码器的语音帧长为22.5ms ,声码器的编码速率为0.8kb /s ,因此每帧语音的量化码位数为18bit 。

为了提高参数量化的效率,首先将编码器求得的3帧语音参数组成一个超级帧,然后对超级帧参数进行分模式联合矢量量化[5,6]。

2.1　参数量化码位分配方案声码器量化码位分配如表1所示。

表1　0.8kb /s 声码器量化码位分配方案参数分配码位数/bit基音周期和清浊音判决11线谱对系数L SP 34短时帧能量8同步1总计542.2　基音周期和清浊音判决联合矢量量化对每一个超级帧所包含各帧的清浊音信息(U 代表清音,V 代表浊音)和基音周期用11bit 联合量化。

对不同的超级帧模式采用不同的量化码位分配表,如表2所示。

表2　清浊音、基音周期联合量化码位分配表U /V 模式3bit 码本8bit 码本U U UU U V U VU V U U 000前2bit 用来区分4种模式;后6bit 对模式U U U 置全0;对其余3种模式分别形成一个6bit 的量化码本。

VV U 001矢量量化码本A VU V 010矢量量化码本B U V V 100矢量量化码本C V VV011矢量量化码本D 101矢量量化码本E 110矢量量化码本F 111矢量量化码本G注:U /V 模式从左到右分别代表超级帧中所含3帧的清浊音模式。

在量化之前,先将由编码器求得的基音周期值p i (i =1,2,3)转化成其对数值p i =lg p i 。

对超级帧中只有一个浊音帧的情况,对这一个浊音帧对数基音周期采用6bit 的一维矢量码本进行量化。

对于超级帧中有2个或者3个浊音帧的情况,超级帧待量化基音周期矢量的每一维的值,对于浊音帧等于该帧基音周期的对数值,对于清音帧则置零。

其基音周期矢量量化采用新的码本搜索算法,此算法不仅考虑了超级帧中各帧基音周期在量化前后的逼近,而且还考虑了相邻各基音周期的变化趋势在量化前后不变,从而保持相邻基音周期的平滑。

具体搜索算法如下:1)先对码本进行全搜索,选出M 个候选码字,其量化误差判决采用欧氏距离准则d =63i =1ûp i -pd i û2,(4)p i 和p di 分别代表量化前和量化后的对数基音周期值。

2)用下面的公式计算量化前对数基音周期的微分。

$p i =p i -p i -1,两帧都是浊音帧;0,其它.(i =1,2,3)(5)其中p 0是上一个超级帧的最后一个对数基音周期值。

对于第一步中选出的各候选基音周期矢量作如上类似的微分运算,只需用$pd i 和p d i 分别代替上式中的$p d i 和p d i即可,其中pd 0是量化后的p 0。

3)从M 个候选码字中选择最佳的码字,使d ′最小。

d ′=63i =1ûp i -p d i û2+D 63i =1û$p i -$p d i û2=d +D 63i =1û$p i -$pd i û2,(6)13李军林,等:　0.8kb /s 高质量声码器算法式中D是一个比例因子,用来调整基音周期微分所占的权重,在本声码器算法中取为1。

2.3　线谱对参数的矢量量化对于每个超级帧中的3个待量化L S F矢量,分重要帧和次要帧分别进行矢量量化。

重要帧采用19bit的三级矢量量化,各级码本的大小分别为7, 6,6bit。

对次要帧采用7或8bit的帧间差值矢量量化。

3帧联合的L SF系数量化码位分配见表3。

其中重要帧的选择考虑了以下3点:1)重要帧选择中,一般情况下认为浊音帧比清音帧重要,多选择浊音帧为重要帧;2)兼顾浊音帧的情况下,重要帧尽量选在3帧的中间(即第2帧),这样两侧次要帧均与重要帧相邻,差值量化的精度更高;3)对于待量化超级帧模式为VUV的情况,选择中间的U帧为重要帧,因为中间的U帧多是浊音快速过渡区的情况有一定的浊音性。

表3　LSF参数矢量量化码位分配U/V L SF1L SF2L SF3T ot alU U U8766734U U V8776634U V U8766734V U U7667834U V V8766734V U V7766834V V U8766734V V V7766834注:表中L SF1,LSF2,L SF3分别代表超级帧中第1,2,3帧的L SF参数。

线谱对参数量化误差准则采用了加权欧氏距离准则,并且对重要帧的多级码本采用了最佳路径保留数M=8的多路径搜索算法,逼近全局最优。