语音信号基音检测算法研究

合集下载

论文正文-语音信号的基音频率提取算法研究

论文正文-语音信号的基音频率提取算法研究

前言语音信号的基音频率提取算法研究1前言基音是指发浊音时声带振动所引起的周期性,而声带振动频率的倒数就是基音周期。

基音周期具有时变性和准周期性,它的大小与个人声带的长短、厚薄、韧性和发音习惯有关,还与发音者的性别、年龄、发音时的力度及情感有关,是语音信号处理中的重要参数之一,它描述了语音激励源的一个重要特征。

基音周期的估计称为基音检测(Pitch Detection),基音检测的最终目标是找出和声带振动频率完全一致的基音周期变化轨迹曲线,如不可能则找出尽量相吻合的轨迹曲线。

然而由于人的声道的易变性及其声道特征的因人而异,而基音周期的范围又很宽,且同一个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,故实际中的基音周期的精确检测是一件比较困难的事情。

然而,尽管语音信号的基音检测有许多困难但由于它在语音信号处理中的重要作用,促使广大学者争相涉足该领域,提出了各种各样的基音检测算法。

2选题背景2.1基音检测技术的研究进展早在70年代,L.R.R等人就进行了自相关函数法检测语音信号的基音周期的研究工作,它是一种时域上的基音检测算法,算法的精确性高,计算量不大,是目前各种应用中最为常用的基音检测算法。

1967年,A.M.Noll提出用倒谱法(Cepstrum)检测语音信号的基音周期。

这是一个频域上的检测算法,这种方法检测基音周期精确度很高,抗噪性能好,主要的缺陷是计算量太大,要用到傅立叶变换和对数运算,不利于实现。

1972 年,J.D等提出简单逆滤波追踪法(SIFT)检测语音信号的基音周期,这是一种时域和频域相结合的算法,是一种精确度和计算量较为折中的算法,它利用逆滤波去除声道共振峰的影响,使基音信息更为突出。

1974 年,M.J.Ross等人提出平均幅度差函数法检测语音信号的基音周期,这是一种时域上的算法,也是最简单的基音检测算法,它只需在时域上进行简单的加减和少量的除法运算,运算量很小,但是很容易产生半基音和倍基音,目前还有很多人在语音信号的基音频率提取算法研究不断的提出改进的AMDF算法。

语音信号的自相关基音周期检测

语音信号的自相关基音周期检测

语音信号的自相关基音周期检测语音信号是一种人类最基本的交流方式,它包含人声的频率、强度和时间三个方面的信息。

语音信号的自相关和基音周期是语音信号分析中的重要技术,对于语音信号分析、识别、合成等应用有着积极的作用。

一、语音信号的自相关语音信号的自相关是指语音信号的样本与样本之间的相关性。

在语音信号中,相邻的样本之间一般都具有相关性,该相关性可以通过计算信号的自相关函数获得。

自相关函数描述了语音信号在不同延迟情况下的相似程度,也就是说,自相关函数可以反映语音信号的周期特征和基音周期。

二、语音信号的基音周期检测语音信号的基音周期是指人语中相邻两个基音周期之间的时间长度。

基音周期检测是一项关键的语音信号分析技术,在音素识别、语音合成、语音编码等领域应用广泛。

基音周期检测方法主要有三种:自相关法、FFT法和LP法。

自相关法是指通过计算信号与自身在不同延迟下的相似度,判断语音信号的基音周期。

具体来说,自相关法首先将语音信号进行预加重和分帧处理,然后计算每一帧的自相关函数,最后采用模板匹配的方法找到最强的周期峰值,从而得到基音周期。

FFT法则是将分帧后的语音信号进行傅里叶变换,提取频谱信息,并通过在频域滑动一个窗口,检测周期性的能量最大值,确定基音周期数。

LP法是通过线性预测,将语音信号分解成具有不同频率的谐波分量,然后利用实验数据验证模型,得到基音周期。

总的来说,不同的基音周期检测方法有其各自的优缺点。

自相关法较为简单但在噪声环境下准确度不高,FFT法可以检测到非周期性的基音,但精度不如自相关法,LP法精度较高但计算复杂度较大。

作为一门复杂的反演问题,语音信号的自相关和基音周期检测一直是语音处理研究中的重要问题,目前的研究主要集中在解决语音信号分析和识别中的实际问题和应用,为提高语音合成、语音编码等方面的应用水平提供技术支持。

语音基频检测及其频模型的研究

语音基频检测及其频模型的研究

山东大学硕士学位论文语音基频检测及其频模型的研究姓名:***申请学位级别:硕士专业:信号与信息处理指导教师:***20070522(c)图2.7。

ji2”的时域波形图2。

3.2频谱特性语音信号的时域波形虽然直观,但是对于复杂的语音信号,其一些特性需要在频域中才能体现出来;如声道传输函数的共振峰特性、人类听觉器官的频率响应特征,这些都是表征语音信号基本的频谱参数。

其中,对于元音而言一般有着3-5个共振峰,它们决定了信号频谱的总体轮廓或谱包络,是—个非常重要的频域参数。

在语音发音过程中,声道的形状随时间而发生变化,但是同声带的振动相比,其变化要缓慢得多。

因此,在对语音信号进行频域分析时,一般都假定语音信号是短时平稳的信号,即在lO-30ms内其特性是基本不变或者变化很缓慢的,然后对每一个时刻,用该时刻附近的一段语音信号分析得到一个频谱,来表征对应的频率特征.对语音信号“直zhi2”,我们利用Cooledit软件,先对语音信号进行汉明窗加权处理,再进行频谱分析。

图2.8和2.9分别为其元音部分“i”和清音部分“曲”的频谱特性,横轴为频率,纵轴为幅度。

从频谱图上可以明显地看出浊音信号的18基频及其谐波(共振峰)频率.第一个频谱的峰值点对应信号的基频,其他的峰值对应共振峰频率,相邻峰值之间的间隔基本一致.对于清音,其幅度中不存在很大的峰值,且频谱峰点的间隔是随机的,没有周期性。

图2.8元音。

i”的频谱示意图图2.9清音“zh”的频谱示意图2.4.汉语语音的组成结构及韵律特征2.4.1组成结构“音节”(Syllable)是语音流中音素结合而成的最小单位,同时也是发声的最小单位.在汉语中,最小的发声单元是一个。

字”,一个字即为一个“音节”.字构成词,词又可构成短语,他们结合起来就构成了语句,因此,汉语发音比较简单,这是汉语的一大特点。

一般而言,一个音节由元音(Vowel)和辅音(ConsonanO组成。

其中,元音为一个音节的主干,无论从时间长度还是能量角度来看,元音在音节中都占主要部分,所有的元音都是浊音。

《语音信号处理》实验2-基音周期估计

《语音信号处理》实验2-基音周期估计

华南理工大学《语音信号处理》实验报告实验名称:基音周期估计姓名:学号:班级:10级电信5班日期:2013年5 月15日1.实验目的本次试验的目的是通过matlab编程,验证课本中基音周期估计的方法,本实验采用的方法是自相关法。

2. 实验原理1、基音周期基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。

基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。

因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。

由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。

基音提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列,在语音的头、尾部并不具有声带振动那样的周期性,有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。

②声道共振峰有时会严重影响激励信号的谐波结构,所以,从语音信号中直接取出仅和声带振动有关的激励信号的信息并不容易。

③语音信号本身是准周期性的(即音调是有变化的),而且其波形的峰值点或过零点受共振峰的结构、噪声等的影响。

④基音周期变化范围大,从老年男性的50Hz到儿童和女性的450Hz,接近三个倍频程,给基音检测带来了一定的困难。

由于这些困难,所以迄今为止尚未找到一个完善的方法可以对于各类人群(包括男、女、儿童及不向语种)、各类应用领域和各种环境条件情况下都能获得满意的检测结果。

尽管基音检测有许多困难,但因为它的重要性,基音的检测提取一直是一个研究的课题,为此提出了各种各样的基音检测算法,如自相关函数(ACF)法、峰值提取算法(PPA)、平均幅度差函数(AMDF)法、并行处理技术、倒谱法、SIFT、谱图法、小波法等等。

基于MATLAB的语音信号的基音周期检测

基于MATLAB的语音信号的基音周期检测

基于MATLAB的语音信号的基音周期检测摘要:MATLAB是一种科学计算软件,专门以矩阵的形式处理数据。

MATLAB将要性能的数值计算和可视化集成在一起,并提供了大量的内置函数,从而被广泛的应用于科学计算、控制系统和信息处理等领域的分析、仿真和设计工作。

MATLAB在信号与系统中的应用主要包括符号运算和数值计算仿真分析。

由于信号与系统课程的许多内容都是基于公式演算,而MATLAB 借助符号数学工具箱提供的符号运算功能,基本满足设计需要。

例如:解微分方程、傅里叶正反变换、拉普拉斯正反变换和Z正反变换等。

MATLAB在信号与系统中的另一主要应用是数值计算与仿真分析,主要包括函数波形绘制、函数运算、冲击响应仿真分析、信号的时域分析、信号的频谱分析、系统的S域分析和零极点图绘制等内容。

本次课程设计为语音信号的基音周期检测,采集语音信号,对语音信号进行处理,区分清音浊音,并通过对采样值进行滤波、分帧、求短时自相关函数,得到浊音的基音周期。

关键字:清音、浊音、基音周期、基音检测、自相关函数目录1 概述 (1)2 AMDF算法原理及实现 (1)2.1 AMDF算法源程序 (2)3 ACF算法原理及实现 (4)3.1 用短时平均能量进行清/浊音的判断 (4)3.2 自相关函数基音检测的原理 (6)3.3 算法实现及相关程序 (6)3.3.1 带通滤波 (7)3.3.2 取样与分帧 (7)3.3.3 短时能量分析 (8)3.3.4 自相关函数分析 (11)4 总结与心得体会 (13)参考文献 (13)1 概述基音周期检测也称为基频检测(Pitch Detection) ,它的目标是找出和声带振动频率完全一致的基音周期变化轨迹曲线,或者是尽量相吻合的轨迹曲线。

基音周期检测在语音信号的各个处理领域中,如语音分析与合成、有调语音的辨意、低速率语音压缩编码、说话人识别等都是至关重要的,它的准确性及实时性对系统起着非常关键的作用,影响着整个系统的性能。

基于线性预测编码与AMDF的高精度基音检测算法

基于线性预测编码与AMDF的高精度基音检测算法

基于线性预测编码与AMDF的高精度基音检测算法摘要:根据语音信号产生原理,结合线性预测编码(lpc)与平均幅度差函数法(amdf),提出了一种高精度的基音检测算法。

该算法首先利用线性预测分析提取残差信号;然后采用累积平均归一化差分函数与差分信号修正,使基音周期的谷值点更加尖锐;最后利用二次函数拟合与基音周期的倍数检查筛选候选值,得到了准确的基音周期。

实验结果表明,与传统方法相比, 该算法的基音检测效果有了明显改善,减少了基音检测中的半频错误,在高信噪比下具有良好的准确性和鲁棒性。

关键词:语音信号;基音周期;线性预测编码;平均幅度差函数;自相关函数super resolution pitch detection based on lpc and amdfwang en.cheng1, su teng.fang1*, yuan kai.guo2, wu chun.hua 21. school of information engineering, north china university of technology, beijing 100144, china;2. school of computer, beijing university of posts and telecommunications, beijing 100876, chinaabstract:according to the mechanism of speech signal, a super resolution pitch detection algorithm which combined linear predictive coding (lpc) with average magnitude difference function (amdf) was proposed. firstly, residual of lpc was extracted by linear predictive analysis. then, cumulative mean normalized difference function and difference signal revision were used to make pitch valley sharper. at last, parabolic interpolation and pitch multiple check were taken to select real pitch period. experimental results indicate that the pitch detection effect of the algorithm is superior to that of the conventional algorithms. the proposed algorithm conquers half frequency errors, and has good accuracy and robustness under the condition of high snr. according to the mechanism of speech signal, a super resolution pitch detection algorithm, which combined linear predictive coding (lpc) with average magnitude difference function (amdf), was proposed. firstly, residual of lpc was extracted by linear predictive analysis. then, cumulative mean normalized difference function and difference signal revision were used to make pitch valley sharper. at last,parabolic interpolation and pitch multiple check were taken to select real pitch period. the experimental results indicate that the pitch detection effect of the algorithm is superior to that of the conventional algorithms. the proposed algorithm conquers half frequency errors, and has good accuracy and robustness under the condition of high signal.to.noise ratio (snr).key words:speech signal; pitch period; linear predictive coding (lpc); average magnitude difference function (amdf); auto correlation function (acf)0 引言人在发浊音时,气流通过声门使声带产生张驰振荡式振动,形成一股准周期脉冲气流,这种声带振动的频率称为基音频率,相应的周期称为基音周期。

基于Matlab的藏语语音基音检测算法研究

基于Matlab的藏语语音基音检测算法研究

基于Matlab的藏语语音基音检测算法研究卓嘎;边巴旺堆【期刊名称】《现代电子技术》【年(卷),期】2015(000)010【摘要】Very little research on Tibetan speech pitch detection has been published. Tibetan speech pitch detection is im⁃portant part of Tibetan speech processing,whose accuracy affects system performance directly. The center clip algorithm,algo⁃rithm principle of autocorrelation function and pitch detection algorithm are introduced. The procedure of Tibetan speech pitch detection was designed. The programming and simulation are executed with Matlab software. The result shows that the algorithm has simple structure,accurate result and small amount of calculation. It can be applied to detecting Tibetan speech pitch period in low SNR environment.%目前藏语语音基音检测算法相关研究较少,藏语语音基音检测是藏语语音处理过程中的重要环节,其准确性直接影响到系统的性能。

介绍中心消波和自相关函数的算法原理及基音检测算法,设计藏语语音基音检测流程,利用Mat⁃lab进行编程和仿真。

基音检测算法研究及其在方言辨识中的应用的开题报告

基音检测算法研究及其在方言辨识中的应用的开题报告

基音检测算法研究及其在方言辨识中的应用的开题报告一、选题背景:方言作为语言的一种,是一种地域文化的体现,也是汉语的重要组成部分,但由于各地方言语音差异较大,使得方言的学习和辨识成为了一项具有挑战性的任务。

因此如何进行方言的自动辨识,一直是计算机语音处理领域的一个重要研究方向,对于一些需要进行方言识别的领域如语音纠错、语音转写等具有重要意义。

基音是声音中最基础的音素之一,它对语言的声调说法和抑扬顿挫的表达有着非常重要的作用,同时也是方言中的一个重要音素之一。

因此利用基音信息进行方言辨识也是一个有前途的研究方向。

二、研究内容:本论文主要研究如何利用基音信息进行方言辨识,并重点研究基音检测算法的设计和实现。

首先,我们将通过对各地方言的音频样本进行采集,建立一个方言基音库,并利用该库作为训练集来训练基音模型。

其次,我们将研究基音检测算法的设计。

基音检测是一种识别音频信号周期性的过程,可通过串联一系列预处理、变换、差分、平滑等操作实现。

我们将对这些操作进行详细研究,并设计实现一种高效准确的基音检测算法。

最后,我们将利用基音检测算法进行方言辨识实验,并分析实验结果,以验证我们所提出的方案的有效性和可行性。

三、研究意义:本论文的研究内容将有助于解决方言的自动辨识问题,对于一些需要进行方言识别的领域如语音纠错、语音转写等具有重要意义。

同时,本论文的研究成果也可为日后基于基音信息的语音处理技术提供参考。

四、研究方法:本论文主要采用以下研究方法:1.音频采集: 收集各地方言音频样本作为训练集和测试集。

2.基音模型建立: 利用训练集建立基音模型。

3.基音检测算法设计: 对基音检测算法进行详细研究,设计实现高效准确的基音检测算法。

4.方言辨识实验:实现方言辨识实验,并对实验结果进行分析。

五、预期结果:通过本论文的研究,我们预期可以实现利用基音信息进行方言辨识,并取得一定的识别准确度,为语音处理领域的研究提供新的思路和方法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

语音信号基音检测算法研究
摘要:本文对倒谱法做了改进,在用倒谱法进行基音检测分析时,提出了一种功率谱二次处理的二次谱减法,该方法克服了倒谱法基音检测的抗噪能力低的弱点,在相同噪声环境下能更加精确地检测出语音信号的基音周期。

关键词:语音信号基音检测倒谱法二次谱减法
1、引言
近年来,基于线性预测和分析频谱的Mel倒谱系数在处理包含情感的语音识别中取得了很大的进步,能否把此种方法应用到相应状态下的基音检测中去,值得广大学者研究。

国外很多学者采用实时监控情感变化,并把影响修正基音的轨迹加以平滑或者动态改变窗的宽度,可以明显降低上述影响。

基音检测一直是语音信号处理的一大难题,短时自相关函数法、短时平均幅度差函数法、倒谱法、小波变换法等传统的经典基音检测方法,都有各自的用场,但同时也有其相应的不足。

其中任一种方法都不能作为通用的方法,但若在基音检测过程中,对预处理和后处理上进行一些改进,且突破传统的语音模型,并适当考虑说话人的个体特征及发音时的情感力度对基音检频带内谱包络测的影响,定能提高基音检测的准确性及健壮性。

本文以语音信号的基音检测为研究对象,着重分析自相关函数法p倒谱法的定义为,时间序列的z变换的模的对数的逆z变换,该序列的倒谱的傅里叶变换形式为。

落实到具体实现时,采用DFT来近似傅里叶变换,根据传统语音产生的模型及语音信号的短时性。

在其频域内,语音信号短时谱等于激励源的频谱与滤波器的频谱的乘积,浊音信号短时谱中包含的快变化周期性细致结构,则必会对应着周期性脉冲激励的基频以及各次谐波。

语音的倒谱是将语音的短时谱取对数后再进行IDFT来得到,所以浊音信号的周期性激励如果反映在倒谱上,便是同样周期的冲激。

藉此,我们可从得到的倒谱波形中估计出基音周期。

一般我们把倒谱波形中第二个冲激,认为是对应激励源的基频,即基音周期。

下面列举出一种倒谱法求基音周期的框图(见图1) 。

3、改进算法的基音检测
当用无噪声的语音信号时,采用倒谱法进行基音检测还是很理想的。

但是有加性噪声存在时,对数功率谱中的低电平部分会被噪声填满,从而掩盖了基音谐波的周期性。

这也意味着倒谱的输入不再是单纯的周期性成分,而导致倒谱中的基音峰值变宽,而且受到噪声的污染,最终导致倒谱检测方法的灵敏度也随之下降。

为此,本文提出了如下改进方法(图2):
此方法避p本文以语音信号的基音检测为研究对像,对短时自相关函数、倒谱法、这两种基音检测的方法的原理进行了分析。

在此基础上,深入研究了倒谱法基音检测的算法。

通过实验仿真,发现这种测量方法的不足;最后对这种算法进行了改进,在用倒谱法进行基音检测分析时,提出了一种功率谱二次处理的二次谱减法,该方法克服了倒谱法基音检测的抗噪能力低的弱点,在噪声环境相同的情况下能更加准确的检测出语音信号的基音周期,从而有效提高算法在基音检测时的准确性和抗噪性。

参考文献
[1]胡航.语音信号处理[M].哈尔滨:哈尔滨工业大学出版社,2000:116.126.
[2]韩纪庆,张磊,郑铁然.语音信号处理[M].北京:清华大学出版社,2004,lO.39.
[3]赵力.语音信号处理[M].北京:机械工业出版社,2003:24.40.
[5]陈小利含噪语音基音周期检测算法研究[D].解放军信息工程大学,2007.。

相关文档
最新文档