基于ACF的基音检测算法
数模-一种基于线性预测和极大似然估计的基音检测算法

第28卷第6期声学技术Vo l.28,No.6 2009年12月 Technical Acoustics Dec., 2009一种基于线性预测和极大似然估计的基音检测算法张永亮1,鲁宇明2,张先庭1,杨焱 1(1. 南昌航空大学电子信息工程学院,南昌 330063;2. 南京航空航天大学自动化学院,南京 210016)摘要:用线性预测的方法求出语音信号的LPC(Linear Predictive Coding)谱,然后根据候选的声门激励与LPC谱卷积重构语音信号的短时频谱,当重构频谱与原始语音频谱之间的畸变最小时,声门激励之间的间隔为基音周期。
为了提高计算效率,采用频域动态搜索的方法搜索基音周期的候选值。
数值实验表明,采用线性预测和极大似燃估计(Maximum Likelihood, ML)的基音检测算法可保留更多的基音信息,并能有效地减少基音检测的错误,并且该算法比传统的ML法有更强的鲁棒性。
关键词:基音检测;线性预测;极大似然估计法中图分类号:TN192.3 文献标识码:A 文章编号:1000-3630(2009)-06-0768-05DOI编码:10.3969/j.issn1000-3630.2009.06.017A pitch detection algorithm based on linearpredictive and ML methodZHANG Yong-liang1, LU Yu-ming2, ZHANG Xian-ting1, YANG Yan1(1. Nanchang Hang Kong University, Nanchang, 330063, China;2. Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China)Abstract:A robust pitch detection algorithm based on LPC spectrum and ML method is proposed in the paper. Firstly, the LPC spectrum is obtained, and then the short time frequency spectrum is reconstructed based on the convolution of glottis and the LPC spectrum. When the aberration between the reconstructed spectrum and the original frequency spectrum reaches minimum, the interval between excitations of the glottis is the pitch. In order to improve the compu-tational efficiency, the dynamic seeking algorithm is adopted to ensure the probable pitch values. Numerical experiment indicates that the proposed method of pitch detection is effective, more information of pitch is remained and the pitch detection error is reduced effectively. In addition, the method is more robust than the traditional method of ML.Key words: pitch detection; linear predictive; maximum likelihood method1 引言基音是语音的一个重要的特征参数,对汉语更是如此。
基于FFT-ACF和候选值估计的基音周期提取方法

基于FFT-ACF和候选值估计的基音周期提取方法
徐明;陈知困;黄云森
【期刊名称】《深圳大学学报(理工版)》
【年(卷),期】2007(024)004
【摘要】利用FFT-ACF算法进行基音周期候选值估计,减少在语音基音周期提取中常见的倍频和半频错误,提出针对候选值的多重后处理算法.后处理过程:首先运用峰值筛选法进行初选,接着利用一次均值法将语音分为不同的音高段,再使用二次均值法为每个音高段确定合适的频率范围,最后精确提取出基音周期.实验结果表明,基音周期后处理算法有效,在音乐哼唱识别应用中收到良好效果.
【总页数】5页(P388-392)
【作者】徐明;陈知困;黄云森
【作者单位】深圳大学信息中心,深圳,518060;深圳大学信息中心,深圳,518060;深圳大学信息工程学院,深圳,518060;深圳大学信息中心,深圳,518060
【正文语种】中文
【中图分类】TP391;TN912
【相关文献】
1.一种基于基音周期估计的音频水印算法 [J], 付永庆;孙滢
2.基于MBE模型的基音周期估计算法改进 [J], 唐斌;樊桂花
3.基于随机共振的基音周期估计方法 [J], 何朝霞;刘凯
4.基于随机共振的基音周期估计方法 [J], 何朝霞; 刘凯
5.基于FPGA的实时基音周期估计系统 [J], 李辉;王欣;戴蓓倩;陆伟
因版权原因,仅展示原文概要,查看原文内容请购买。
基于EMD的ACF基音检测改进算法

基于正交变换的基音检测算法

基于正交变换的基音检测算法刘宇驰;杜秀娟【期刊名称】《电脑知识与技术》【年(卷),期】2015(000)036【摘要】针对随机背景噪声下的基音周期检测,提出了一种基于正交变换的基音检测算法。
该算法通过正交变换对含噪的语音进行消噪,再求消噪后语音的自相关函数(ACF)和平均幅度差函数(AMDF),对其求出比值(ACF/AMDF)的平方以突显基音周期的峰值,以便获取较准确的基音周期参数。
实验结果表明,与单一的自相关法和平均幅度差函数法相比,该算法获取的基音周期有较高的准确性和对噪声有较强的鲁棒性。
%Aiming at pitch period detection under random background noise,a kind of pitch detection algorithm based on orthogo-nal transform is put forward. Noisy speech signal was first preprocessed by orthogonal transform, the autocorrelation func-tion (ACF) and the average magnitude difference function (AMDF) for speech signal were obtained. The square of the ratio for ACF and AMDF had been applied to emphasize the peak of the true pitch period. This algorithm can get the exact pitch of the speech signal in strong noisy environment. Experimental results indicate that, compared with single autocorrelation and average magnitude difference method, the proposed algorithm has better robustness and higher accuracy.【总页数】3页(P126-128)【作者】刘宇驰;杜秀娟【作者单位】青海师范大学计算机学院,青海西宁810008;青海师范大学计算机学院,青海西宁810008【正文语种】中文【中图分类】TN911【相关文献】1.基于列正交变换实现串行干扰消除的MIMO检测算法 [J], 王赟;汪晋宽;解志斌2.一种基于小波包变换加权自相关的基音检测算法 [J], 孙婷婷;章小兵3.基于小波变换与平均幅度差函数倒数的基音周期检测算法 [J], 武良丹;4.基于多分类支持向量机和主体延伸法的基音检测算法 [J], 冯起斌; 李鸿燕5.基于优化能量值门限和增强倍频效应的抗噪基音检测算法 [J], 杨贵福;夏一鸣;冉华;冯永平;孙慧因版权原因,仅展示原文概要,查看原文内容请购买。
基于线性预测技术的语音基音检测

文章编 号: 1 0 0 3 — 5 8 5 0 ( 2 0 1 5) 0 3 — 0 0 7 4 — 0 3
2 0 1 5年第 3 期
基于线性预测技术的语音基音检测
王 琛, 姜 占才
( 青海师范大学计算机学 院, 西宁 8 1 0 0 0 1 )
摘 要 : 针对语音基音检测易受加性背景噪声和共振峰干扰的问题 , 提 出了一种基于线性 预测 技术 的语音信号基 音检测算法。该算法在维纳滤波基础上 , 利用线性预测( L P c ) 技术得到预测残差信号 , 再对其做 自相关( A C F ) N I 平均 幅度 差( A MD F ) , 得到基音的检测结果 。其检测效果 比单一 自相关 函数法和平均幅度差 函数法有明显 的改善。
大 。针对 这些 问题 , 本文 提 出了一种基 于线 性预 测技 术 的语 音 基音 检测 算法 。该 算法 在 噪 声环 境 中 能够 有 效地 提取基 音周期 , 并 减少倍 频和 半频 的错误 。
基音周期检测带来 了极大 困难。准确的基音周期提
取 成 为 语 音 信 号处 理 领 域 最 具 挑 战 性 的任者 、 不 同环 境和不 同应 用领
域 的基 音检测算 法 尚未 出现 。迄 今 为止 , 基 音提 取 的
关键词 : 语音信号 , 基音周期 , 线性预测 , 白相关 , 循环平均幅度差 中图分类号 : T N 9 1 2 . 3 文献标识码 : A
Pi t c h De t e c t i o n o f S p e e c h Ba s e d o n Li n e a r Pr e d i c t i o n a n d En d p o i n t
结合EMD与DWT-ACF的语音基音周期检测改进算法

结合EMD与DWT-ACF的语音基音周期检测改进算法
张涛;章小兵;朱明星
【期刊名称】《噪声与振动控制》
【年(卷),期】2018(038)002
【摘要】针对传统小波-自相关算法在噪声环境下检测语音的基音周期会出现偏差和漏报的情况,提出一种经验模式分解下的小波-自相关的基音周期检测改进算法.该算法首先利用经验模式分解去除含噪语音趋势项并减噪,再利用改进的小波-自相关法突出每个基音周期的峰值点,提高了基音周期检测的精度.实验结果表明,该改进方法可有效改善加噪语音在基音提取上出现的偏差误报情况以及避免部分倍频和半频错误,提高基音周期检测速率及准确率.
【总页数】7页(P173-178,192)
【作者】张涛;章小兵;朱明星
【作者单位】安徽工业大学电气与信息工程学院,安徽马鞍山243002;安徽工业大学电气与信息工程学院,安徽马鞍山243002;安徽工业大学电气与信息工程学院,安徽马鞍山243002
【正文语种】中文
【中图分类】TN912.3
【相关文献】
1.基于改进小波变换的语音基音周期检测 [J], 吴兴铨;周金治
2.一种基于线性预测与自相关函数法的语音基音周期检测新算法 [J], 柏静;韦岗
3.一种改进的正弦语音模型基音周期检测算法 [J], 孙华山
4.基于小波变换的语音基音周期实时检测算法 [J], 沈江峰;张刚
5.基于线性预测和小波变换的语音基音周期检测新算法 [J], 马霓;应益荣
因版权原因,仅展示原文概要,查看原文内容请购买。
基于EMD的ACF基音检测改进算法

基于EMD的ACF基音检测改进算法宗源;李平;曾毓敏;胡政权;李梦超【摘要】针对传统的自相关函数基音检测算法容易出现倍频错误的问题,本文提出了一种基于经验模式分解的ACF基音检测改进算法.该改进算法利用EMD将一帧语音信号的ACF分解成多个本征模式函数和残余分量,同时根据IMF的累积能量分布情况找出含有基音信息的IMF,最后通过该IMF准确地估计出该语音帧的基音.仿真实验结果表明:本文所提算法性能明显优于传统ACF算法;相比较于检测效果较好的WAC算法,本文所提算法的性能依然有了一定的提升.【期刊名称】《南京师大学报(自然科学版)》【年(卷),期】2013(036)003【总页数】6页(P42-47)【关键词】基音;经验模式分解;自相关函数;本征模式函数【作者】宗源;李平;曾毓敏;胡政权;李梦超【作者单位】南京师范大学物理科学与技术学院,江苏南京210023;泰州职业技术学院信息工程学院,江苏泰州225300;南京师范大学物理科学与技术学院,江苏南京210023;南京师范大学物理科学与技术学院,江苏南京210023;南京师范大学物理科学与技术学院,江苏南京210023【正文语种】中文【中图分类】TN912人在发浊音时,气流通过声门使声带发生张弛振荡式的振动,这种声带振动的频率称为基音(基音也可指基音周期).基音是语音信号中非常重要的特征参数之一,广泛地应用于语音编码、语音合成、语音增强以及语音识别等方面.因此,准确地检测基音具有非常重要的意义.尽管人们已经提出了许多基音检测算法,但是准确而且可信的基音检测仍然是一个具有挑战性的工作[1].目前比较经典的算法有自相关函数(Autocorrelation Function,ACF)法[2]、平均幅度差函数(Average Magnitude Difference Function,AMDF)法[3]、倒谱法[4]、小波变换法[5]等.在这些算法中,ACF算法以其方法简单、计算复杂度低和对噪声的鲁棒性好等优点而得到了广泛的应用.该算法的原理是,周期信号的自相关函数将在时延等于信号周期的地方产生一个极大值.语音信号由于具有准周期性,因此可以通过计算短时窗内语音信号的ACF,并根据ACF的最大峰值点估计出语音信号的基音.但是,该最大峰值点的选择受到了很多因素干扰,例如:复杂的声道共振峰结构、语音信号并不严格的准周期性、语音帧的大小、以及窗函数的选择等[6].因此ACF在实际应用中经常会出现倍频的检测错误.针对ACF法所存在的问题,研究人员提出了一些基于ACF的改进算法.Shimamura提出了WAC ,该算法利用AMDF加权ACF从而使ACF的基音峰值点更加突出,WAC能够避免部分倍频错误,但是由于AMDF存在均值下降趋势,易导致较后的非基音峰值点反而拥有较大的加权系数,因此效果有时并不是十分理想.文献[7]检测出语音信号的主谐波频率后,通过增强语音信号的主谐波频率成分进行语音信号的重构,利用NACF对重构后的语音信号进行基音检测,得到了较好的效果.此方法虽然具有很好的鲁棒性,但是对共振峰等所引起的ACF 的倍频错误并没有得到很好的抑制.本文提出了一种基于经验模式分解(EmpiricalMode Decomposition,EMD)的ACF的基音检测改进算法,该算法首先利用EMD将一帧语音信号的ACF分解为一系列的本征模式函数(Intrinsic Mode Function,IMF)和残余分量;接着筛选出含有基音信息的IMF;最后利用筛选出的IMF检测出该语音帧的基音.仿真实验结果表明:与传统的ACF以及其改进算法WAC相比,本文所提算法能够有效地克服ACF的倍频错误,更加准确地检测出语音的基音.1 经验模式分解EMD是Norden E.Huang等人于1998年提出的一种新的信号分解方法[8].EMD的本质是通过信号本身的特征尺度来将信号分解成IMF,它一方面具有小波变换多分辨率的优点,另一方面又克服了小波变换中选择合适的小波基的困难.因此,EMD可以有效地处理非平稳信号,且具有良好的自适应性.IMF分量必须满足以下2个条件:(1)整个信号中极值点的个数与过零点的个数相等或最多相差1;(2)信号上的任意点处,由所有局部极大值点确定的上包络和所有局部极小值所确定的下包络的均值为零,即上下包络线对称于零均线.EMD 的具体算法[10]如下:(1)令g1(t)=s(t);(s(t)为待分解信号)(2)找出g1(t)所有的极值点(包括极大值和极小值);(3)利用3次样条插值分别将所有极大值点和极小值点拟合成上包络h(t)和下包络l(t);(4)利用上包络和下包络算出局部均值:(5)从g1(t)中减去u1(t):g(t)=g(t)-μ1(t);(6)根据上文所提的IMF必须满足的两个条件判断g1(t)是否为IMF;(7)重复(2)到(6)直到g1(t)满足IMF的条件.C1(t)=g1(t)即为第一个IMF,记为IMF1,利用上述算法对残余分量进行处理提取出第二个IMF,如此循环,直至最后一个IMF即Cn(t)被提取出来.最后的残余分量rN(t)通常为一常数或者趋势项并且不可以再分解.各个IMF和残余分量可以重构信号s(t):EMD将信号分解成若干个频率从高至低的IMF,整个过程体现了多尺度的自适应滤波特性.根据这一特点,我们可以根据信号的要求,有效地对某一频率范围内的信号进行处理[11].此外,由于EMD是根据信号的局部时间尺度进行分解的,其基函数的选择来自于信号本身,因此减少了主观因素的影响.2 算法原理语音信号的短时自相关函数R(τ)定义为:其中s(n)为加矩形窗并且窗长为N的浊音语音帧,τ为延迟.R(τ)呈现出与浊音语音周期相一致的周期特性,并在τ=Fs/Fp的地方出现最大峰值点(Fs为采样频率,Fp为基音频率),因而通过计算R(τ)并找出它的除零点以外的最大峰值点就能够检测出该浊音语音帧的基音频率.但是,如引言所述,实际的最大峰值点的筛选受到多种因素影响,因此ACF在实际检测过程中经常会发生倍频错误.如图1所示,图1(a)为一帧浊音语音,图1(b)为该语音帧的ACF,可以看到ACF的实际基音峰值点应为第106采样点,但是除零点以外的第一最大峰值点出现在第46采样点,此时ACF出现了倍频检测错误.根据上文对EMD的分析我们知道,EMD可以将信号分解成若干个频率从高至低的IMF,因此我们可以利用EMD将ACF的基音信息分解到某一个IMF中.图1(c)至图1(g)是图1(b)的ACF经过EMD处理后得到的各个IMF和残余分量,可以看出IMF2包含了这一帧语音的基音信息,所以通过IMF2就可以很方便地估计出这一帧语音的基音.此外,由于理论上每一个IMF只含有单一的频率信息,因此利用IMF检测基音不会受到其他因素(如共振峰和噪声等)的影响.综上所述,如何筛选出含有基音信息的IMF是本文算法的关键.人的基音频率范围一般为50~500 Hz,我们可以在基音检测之前将语音信号通过50~500 Hz的带通滤波器,去除大部分共振峰和噪声影响,保留基音信息.由人的发音机理可以知道语音信号的能量是以基音和与其邻近的几个高次谐波的能量为主,因此含有基音以及它的邻近高次谐波信息的IMF重构组成的信号的能量理论上应接近于原始语音信号的ACF的能量.基于此,本文提出了一种基于累积能量分布的IMF选择方法,具体步骤如下:(1)定义累加信号图1 一帧浊音语音的ACF的经验模式分解Fig.1 The decomposition of ACF ofa voiced speech frame by using EMD由EMD的原理可知,ACF可以记为式(6)中resi为残余分量.(2)计算所有SUM和ACF的短时能量,记为Energy(1),Energy(2),…,Energy(n),Energy(ACF);同时定义各累加信号SUMi与ACF的短时能量差,记为并将所有的Δi归一化.(3)选定阈值Thr1,若则判定IMF1为含有基音信息的IMF;否则,转入步骤(4).(4)选定一个阈值Thr2,则含有基音信息的IMF即为图2为基于图1(b)中的ACF计算所得的Δi的折线图.如图所示,从Δ1至Δ4,它们的数值越来越小,同时Δ2至Δ4均小于Thr2=0.1(本例中设定的阈值),这说明重构信号SUMi随着IMF的累加,能量越来越接近于原始信号ACF的能量;此外,当SUMi累加至IMF2时,重构信号的能量开始首次接近于原始信号的能量,在图中表现为Δi首次小于我们设定的阈值Thr2=0.1.因此由式(9)可以判定IMF2即为包含基音信息的IMF,实际上IMF2确实包含了基音信息(由图1(d)可以看出).经过我们初步研究发现,阈值Thr1和Thr2的选择是经验性的,所以并无确切的值,一般情况下的基音检测可以设定根据以上的分析,基于EMD的ACF的基音检测改进算法的具体步骤如下(算法流程如图3所示):图2 基于图1(b)中ACF的Δi折线图Fig2 The line chart of Δi based on the ACF in Fig.1(b)图3 基于EMD的ACF的基音检测改进算法Fig.3 A modified ACF pitch detection algorithm based on EMD(1)对语音信号s(n)进行50~500 Hz的预滤波,去除大量共振峰以及各种噪声影响,得到滤波后的语音信号sf(n);(2)对滤波后的语音信号sf(n)进行分帧处理;(3)对每一帧语音进行清浊音判断,清音帧和静音帧的基音记为0;(4)求浊音帧的自相关函数ACF;(5)利用EMD对ACF进行分解,利用上文所提方法选取含有基音信息的IMF;(6)利用含有基音信息的IMF检测出浊音帧的基音,最后输出基音轨迹P(n).3 仿真实验实验所用语音为实验室录制的一名成年男子朗读“树上的落叶掉光了”的纯净语音,语音以11 025 Hz采样率,16 bit采样精度.实验中对语音分帧帧长设为40 ms,帧移为20 ms.图4为分别使用传统ACF、WAC和本文所提算法对该段语音进行基音检测的结果,图中横坐标为帧,纵坐标为基音频率(单位Hz).图4(a)、(b)和(c)分别为ACF、WAC和本文所提算法的检测结果,从它们的基音轨迹可以看出,传统ACF基音检测算法在多处出现明显的倍频错误,这是由于以共振峰为主的多种原因的影响导致ACF除零点之外的第一最大峰值点并不是真实的基音点,因此检测结果并不理想.WAC相较于ACF克服了多处倍频错误,但是由于AMDF的均值下降趋势导致倍频错误依然存在.而本文算法检测所得的基音曲线光滑规整,有效地修正了传统ACF算法中的多处倍频错误.图4 ACF、WAC和本文所提算法检测一段语音的基音Fig.4 Pitch detection of a speech signal by using ACF,WAC and the proposed algorithm为了进一步评价本文所提算法,仿真实验使用基尔基音检测参考数据库(the Keele Pitch Extraction Reference Database)[10]来测试各个算法的性能.基尔基音检测参考数据库中所有语句均以20 000 Hz采样,16 bits量化,数据库中提供以512点为帧长、200点为帧移的所有浊音帧的参考基音信息.实验选用了数据库中两位男性(M2-M3)和两位女性(F1-F2)的每人1段语句,共计4段语句进行基音检测.根据Rabiner[2]的定义,检测结果(以基音周期计算)与参考基音的误差大于或等于1 ms则定义为基音粗差(Gross Pitch Error,GPE),实验中以%GPE作为比较参量评价各个方法的性能.此外,为了更好的比较3种算法的性能,本次实验均不对检测结果做任何后期处理(如基音曲线平滑等).表1给出了3种算法在无噪声环境下的检测结果.从表中可以看出本文所提算法在4个样本F1-F2-M2-M3中均有相对较低的%GPE,相比于WAC能够更好地克服ACF检测过程中的倍频错误.表2给出了ACF和本文所提算法在无噪声环境下和高斯白噪声(SNR=10,5,0,-5,-10 dB)环境下的检测结果(由于AMDF对白噪声没有鲁棒性,白噪声环境下语音信号如无其他预处理,WAC的检测结果会明显不如ACF,所以噪声环境下的对比试验仅仅对比ACF和本文所提算法).由表2可以看出,本文所提算法在噪声环境下仍然能够较好地克服ACF的倍频错误,取得不错的%GPE.此外由于EMD的多频分辨特性,本文所提算法筛选出的含有基音信息的IMF不受其他频率分量影响,能够避免噪声等因素的干扰,因此即使在信噪比低至-10 dB时,本文所提算法的检测效果依然较好.表1 纯净语音的3种算法的检测结果比较Table 1 Comparison of three methods using clean speechACF WAC EMDACF F1 9.41 8.56 6.11 F2 6.41 5.58 4.63 M2 23.01 21.84 9.23 M3 9.45 7.86 6.07表2 不同信噪比下ACF和本文所提算法的检测结果的比较Table 2 Comparison of ACF and the proposed algorithm at different SNRF1 ACF EMDACF 41.99 28.38 F2 ACF EMDACF 9.41 6.11 11.95 7.81 13.39 10.15 17.37 11.23 25.08 15.31 41.22 25.89 M2 ACF EMDACF 6.41 4.63 8.31 6.23 10.73 8.77 13.83 10.87 23.24 15.56 56.37 41.03 M3 ACF MACF 23.01 9.23 25.18 10.04 9.45 6.07 11.70 10.60 27.21 11.76 31.69 16.86 43.05 25.94 13.48 11.92 20.05 18.31 33.05 20.87 58.73 35.934 结论本文首先介绍了EMD以及它的自适应多频分辨率的性质并且给出了EMD的分解算法;然后分析了ACF基音检测算法并指出了它的不足之处,即共振峰等因素导致ACF算法在实际应用中易出现倍频检测错误;接着针对ACF基音检测算法的不足之处给出了基于EMD的改进算法,并提出了一种如何有效选取含有基音信息的IMF 的方法;最后进行了仿真对比实验.仿真实验结果表明:本文所提算法能够有效地克服ACF算法的倍频错误,同时其性能优于传统ACF以及它的改进算法WAC.[参考文献][1] Shimamura T,Kobayashi H.Weighted autocorrelation for pitch extraction of noisy speech[J].IEEE Transactions on Speech and Audio Processing,2001,9(7):727 -730.[2] Rabiner L R,Cheng M J,McGonegal C A.A comparative performance study of several pitch detection algorithms[J].IEEE Transactions on Acoustics,Speech and Signal Processing,1976,24(5):399 -417.[3] Ross M,Shaffer H,Freudberg R,et al.Average magnitude difference function pitch extractor[J].IEEE Transactions on A-coustics,Speech and Signal Processing,1974,22(5):353 -362.[4] Ahmadi S,Spanias A S.Cepsrum-based pitch detection using a new statistical V/UV classification algorithm[J].IEEE Transactions on Speech and Audio Processing,1999,7(3):333 -338.[5] Kadame S,Broudreaux-Bartels G F.Application of the wavelet transform for pitch detection of speech signals[J].IEEE Transactions on Information Theory,1992,38(2):917 -924.[6] Amado G.Pitch detection algorithms based on zero-cross rate and autocorrelation function for musical notes[C]//Proceedings of ICALIP.Shanghai:IEEE,2008:449 -454.[7] Hasan M K,Hussain S,Setu M T H,et al.Signal reshaping usingdominant harmonic for pitch estimation of noisy speech[J].Signal Processing,2005,86(5):1 010 -1 018.[8] Huang N E,Zheng S,Long S R,et al.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[C]//Proceedings of Royal Society A.London:Royal Society,1998:903 -995.[9] Molla M,Khademul I,Hirose K,et al.Pitch estimation of noisy speech signals using empirical mode decomposition[C]//Proceedings of InterSpeech.Antwerp:ISCA,2007:2 117 -2 180.[10] Meyer G,Plante F,Ainsworth W A.A pitch extraction reference database[C]//Proceedings of EUROSPEECH.Madrid:ISCA,1995:827 -840.。
基于FFT-ACF和候选值估计的基音周期提取方法

由于语音 信号 是非平 稳 的时 变 信号 ,只有其 中
的浊 音部分能 够看 作是 准周 期 的 ,所 以在 语 音信 号 的基 音周期提 取 中通 常 采取 短时 处 理技 术 ,即对语
音信 号加窗 ( 矩形 窗 、汉 宁窗等 )分 帧 ,然 后 针对
期实 际值 ,即倍 频 错误 ) . 因此 为 准 确 提 取基 音 J 周期 ,对基音 周 期 候 选 值 的 后处 理 是 必 不 可 少 的.
存在 同样 的问题 :从 波形 上来 看 ,两 者都 随着 Ⅳ 的 增 加 ,幅度逐 渐 降低 ,呈 现 一种 减 弱 的趋 势 .而基 音 周期候 选值 通 常是用极 值 点来 估 计 的 ,这 种 减弱 的趋势 就为基 音周 期候 选值 的估 计 带来 了困难 ,导
1 基音周 期候选值估 计 函数
最 为传统 的基 音周期 候选 值估计 函数 是 A F和 C
A F MD .这两 个 函 数 的时 间复 杂 度 都 比较 高 ,设 要
A F 、幅 度 差 平 方 和 函 数 、混 合 幅 度 差 函 C
数 J A D _ 和 L A D 等 .但 在 实 际 应 用 、C M F4 V M F 中,这 些基 音 周 期 估 计 函数 往 往 要 发 生 偏 长 错 误
C MD A F的时 间复杂度 为 , N ) L A F的时 间复 J 2 ; V MD (
收 稿 日期 :2 0 -4 0 0 70 -4;修 回 日期 :2 0 6 1 0 7 0 1 基金项 目:深圳市科技计划资助项 目 ( K 0 6 1 Q 2 00 ) 作者简介 :徐 明 ( 97 ) 16 . ,男 ( 汉族 ) ,湖南省怀化市人 ,深圳大学 高级工程师
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信号的处理中具有重要作用.
目前 常 用 的 基 音 频 率 检 测 方 法 大 致 分 为 3 类 , 即波形估 计法 、 关 处 理 法 和变 换 法 . 中波 相 其 形 估计 法实 现原 理简 单 , 是 往 往 会 引入 较 大 的误 但 差; 变换 法算 法较 为 复 杂 , 增 加 实 际运 算 的难 度 ; 会 相 关处 理法 算 法 实 现 简 单 、 测 精 度 高 , 此 成 为 检 因 常用 的基音 周 期 的 检 测 方 法 . 于 此 , 文 拟 采 用 鉴 本
表征 了浊 音激 励 的本 质 特 征 , 还包 含 了汉 语 音 节 的
收稿 日期 :0 1 0 2 1 — 6—1 4
种基音 检测 算法 .
1 相关处 理法的原理实现
由于 自相 关 函数 抗 噪性 能较 强 , 别 适 于 噪 声 特
作者简介 : 郭淑婷 ( 92 ) 女 , 18 一 , 河南省新 乡市人 , 州轻 工业学院助教 , 郑 硕士 , 主要研 究方向为信 号与信 息处理
第2 6卷 第 5期 21年 1 01 0月
郑 州 轻 工 业 学 院 学 报 (自 然 科 学 版 )
JU N L F H N Z O NV R IYO IH D S R N ta Si c ) O R A E G H UU IE S F G T N U T Y( a r c ne OZ T L I ul e
p th d tci n o o a te ctto pe c ina a e c mp ee fe t ey. ic ee t fs n n x iai n s e h sg lc n b o ltd efc i l o v Ke r s: t h dee to ACF; r — r c s i g; o tp o e sn y wo d pi t cin; c p e p o e sn p s— r c s i g
相 同 的周期 性特 征. 常将 浊 音 的声 带 振 动基 本 频 通 率 称 为基音 频 率 , 倒 数 则 称 为 基 音 周 期 . 音 估 其 基
计是指采用短时分析方法对语音信 号的基音频率
或基音周期进行分析估计 , 又称作基音 检测. 基音 频率作为描述语音信号基本特性 的重要参数 , 不仅
0 引 言
语音 信 号 是 声 道 响 应 声 门 的 激 励 作 用 而 产 生 的输 出信 号 . 据 声 带 的不 同状 态 , 以将 声 门 产 根 可
声调信息 . J 因此 , 基音检测作 为语 音信号分 析处
理 中 的基 本组 成部 分 , 涉 及 的 理论 和方 法 在 语 音 其
通过结合相应的预处理、 后处理技术, 可以有效地实现浊音和清音激励语音信号的 区分 以及 浊音激
励语 音信 号 的基音 周期检 测 . 关键 词 : 基音检 测 ; 时 自相 关 函数 ; 处理 ; 处理 短 预 后
中图分 类号 :N 1 T 92
文献标 志码 : A
Pic e e to l o ih a e o t h d t ci n a g rt m b s d n ACF
第 5期
郭淑婷 , : 等 基于 A F的基音检测算法 C
GUO h t S u—i ZHAO n - u ng, Mi o E g ,hnzo nvo ih Id, hnzo 50 2 C ia C lg e r n fr n .Z eghuU i fLg t n.Z eghu4 0 0 , h ) e fE c . n . . n
V0 . 6 No 5 12 .
0c . 2 t 011
文章编号 :0 4— 4 8 2 1 )5— 0 4— 4 10 17 ( 0 1 0 0 3 0
基 于 A F的基 音检 测 算 法 C
郭淑 婷 , 赵 明辉
( 州轻工 业 学院 电气信 息 工程 学院 ,河 南 郑 州 400 ) 郑 50 2 摘 要 : 出 了基 于短 时 自相 关函数 ( C ) 提 A F 的基 音检 测 算 法 , 利 用修 正 的 A F对 此算 法进 行 改进 , 并 C
c s ig a d p s— r c s i g tc n q e t e d s rmi ai n o o a ta d s r x i t n s e c in la d e s n o t o e s e h i u ,h ic n p n i n t n s n n n u d e ct i p e h sg a n o ao
Abta tA pt eet n a o tm b sdo uocr lt nfnt n( C src : i h d t i l rh ae n at—or a o u c o A F)w spo oe n m- c c o gi e i i a rpsd ad i
prv me tc n be a hiv d b h s ft e mo i e o e n a c e e y t e u e o h d f d ACF. c r i o ACF i c mb nain wi r p o i Ac o dngt n o i to t p e- r — h
相 关处 理 法 , 于短 时 自相 关 函数 ( C ) 提 出一 基 AF ,
生的激励信号分 为清音激励和浊音激励. 中, 其 不 是通过声带振动产生 的输入信号是清音激励 , 而浊
音 激励 是通 过声 带 的周 期 性 振 动产 生 的输 入 信 号 .
因此 , 由浊音激励产生的语音信号与声带振动具有