基音周期估计
基于随机共振的基音周期估计方法

基于随机共振的基音周期估计方法
何朝霞;刘凯
【期刊名称】《电脑知识与技术》
【年(卷),期】2011(007)013
【摘要】基音周期估计是语音处理和分析的最基本步骤.无论是做语音信号处理,语音压缩,还是语音识别,都要用到基音周期这一重要参数.文章基于随机共振的理论,提出了一种新的估计基音周期的方法.
【总页数】2页(P3140-3141)
【作者】何朝霞;刘凯
【作者单位】长江大学工程技术学院,湖北荆州,434023;长江大学工程技术学院,湖北荆州,434023
【正文语种】中文
【中图分类】TP334
【相关文献】
1.基于FFT-ACF和候选值估计的基音周期提取方法 [J], 徐明;陈知困;黄云森
2.基于随机共振的微弱OFDM子载波数估计改进算法 [J], 张政;马金全;王学成
3.一种随机共振联合小波变换的符号速率估计方法 [J], 张政; 马金全
4.基于随机共振的基音周期估计方法 [J], 何朝霞; 刘凯
5.基于多普勒-随机共振技术的高精度阵形估计系统研究 [J], 王世闯;王晓林;庞玉红
因版权原因,仅展示原文概要,查看原文内容请购买。
基音周期的优化算法

脚
= a r g m i n [ E V  ̄ U  ̄ r ( v ) J
( 4 )
由以上推导过程可以看出 , 式( 3 ) 比 式 ( 1 ) 减少了 ( 2 Ⅳ一
f ) ( z 一 ) / 2 次 减法 和( 2 N一 i 一 ) ( 彳 一一 ) / 2次加 法运 算, 算法 得到简 化。
来 完成 。
半计算 时间。
^ / k ^ ^ / X ^ ^ ^ / X / N ^ X ^ X ^
、X
语 音 识 别 的 首 要 步 骤 是特 征 提取 ,特 征 的选 择 对 识 别 效 果
至关重要 ,选择的标准应该体现 对异 音字特征 间的距离尽可能 的 最 大 化 ,同 音 字特 征 间 的距 离尽 可 能 的小 。 同时 ,还 要 考 虑
v a r i e d - l e n g t h a v e r a g e ma g n i t u d e d i f f e r e n c e f u n c t i o n)和 变 长 自相 关 ( V L AC v a r i e d - l e n g t h a u t o — c o r r e l a t i o n)函数 的基 音 估计 。 1 V L A MD F 基 音估 计 及 其优 化 算法
( 8 )
从式 ( 5 )中可 以看 出 ,用 自相 关 法估 计 基 音周 期 需要 计 算
为 了减少函数乘法的计算次数 ,本文提 出如下的变长 自相
关 基 音估 计 方 法 。
语音信号的最大特 征是短时平稳 性 ,即时域波形 的周期 间 隔相似性 。平均幅度差函数通过比较原始信号 及其 时移信号 的 相 似 性来 估算 语 音信 号 的基 音 周期 。 短时平均幅度差函数定义为:
基音周期检测算法比较

本科毕业论文题目语音基音周期检测算法比较学院管理科学与工程学院专业电子信息工程班级 081信工(1)班学号 *********姓名周刚指导老师段凯宇讲师二〇一二年六月语音基音周期检测算法比较摘要基音周期作为语音信号处理中描述激励源的重要参数之一,广泛的应用于语音合成、语音编码和语音识别等语音信号处理等技术领域。
准确可靠的对基音周期进行检测将直接影响整个语音处理系统的性能。
常用的基音检测算法对于纯净语音信号都能达到较好的检测效果。
然而,实际当中的语音信号不可避免的会受到外界背景噪音的影响,使得这些检测算法的检测效果都不是很理想,为此本文用两种基本算法对语音信号滤波前后进行基音周期检测,在进行比较。
论文首先介绍了语音基音检测算法的研究背景极其重要意义。
其次对现有的基音检测算法进行了归纳和总结,并详细的介绍本文将用的两种基本基音检测算法的基本原理及实现。
最后在Matlab上对语音信号进行基音周期检测。
论文还完成了算法的程序设计,在Matlab7.0仿真环境下,对上诉算法进行仿真验证,并且在滤波前后做了对比实验。
实验结果表明,经过滤波的语音信号基音周期检测的更加准确。
关键词:基音检测;自相关函数法;平均幅度差函数法;基音轨迹AbstractPitch as in speech signal processing is one of the important parameters to describe the excitation source, widely used in speech synthesis, speech coding and speech recognition speech signal processing technology. Accurate pitch period detection will directly affect the performance of the speech processing system.Commonly used algorithm for pitch detection for clean speech signal to achieve good detection effect. However, the actual speech signal will be inevitably influenced by external effects of background noise, so the detection algorithm to detect the effect is not very ideal, the paper use two basic algorithms before and after filtering the speech signal pitch detection, in comparison.The thesis first introduces the research background of speech pitch detection algorithm is very important. Next to the existing algorithm for pitch detection are summarized, and a detailed introduction to this article will use the two kinds of basic pitch detection algorithm is the basic principle and realization. Finally in Matlab on speech signal pitch period detection.The paper also finished programming algorithm, in the Matlab7.0 simulation environment, the algorithm is validated by simulation, and the contrast experiments were done before and after filtering. The experimental results show that, after the filtering of the speech signal pitch period detection is more accurate.Keywords: pitch detection; autocorrelation function; the average magnitude difference function method; pitch contrail目录第1章绪论 (1)1.1 引言 (1)1.2 基音检测的定义和意义 (1)1.3 基音检测的研究现状 (2)1.4 论文的结构安排 (3)第2章基音检测的常用算法 (4)2.1 引言 (4)2.1常用的基音检测算法及原理 (4)2.2.1 自相关函数法 (4)2.2.2 平均幅度差函数法 (6)2.3本章小结 (7)第3章基于Matlab基因周期的检测 (9)3.1 语音文件的录制与读入 (9)3.2 语音信号的采样与分帧 (9)3.3 语音信号基音周期的检测 (11)3.3.1 短时自相关函数法检测基音周期 (11)3.3.2 短时平均幅度差函数法检测基音周期 (12)3.4 基音周期检测的后处理 (14)3.5 滤波后的基音周期检测 (15)3.6 本章小结 (18)第4章总结与展望 (19)参考文献 (20)致谢 (21)附录 (22)第1章绪论1.1引言语音是语言的声学表现是人类相互之间进行信息交流时所用的重要载体和基本手段,随着现代信息科学技术的飞速发展,尤其是计算机网络技术的日益普及和完善,是的语音信号处理技术发挥着越来越重要的作用。
一种高效的基音估计算法

的 自相 关 函数 都 会 有 一 些 周 期 出 现 的局 部 最 大 值 ,第 1 局 个 部 最 大 值 与起 点 之 间的 距 离 即 为 基音 周 期 [ 清 音 的 自相 关 函 4 1 , , 数 则 没有 明 湿 的峰 值 出 现 。 因此 通 过 检 测 是 否 有 峰值 就 可判 断 是 清 音 还是 浊音 。
冉相关 法 是 检 测 基 音 周 期 的有 效 方 法 ,但 因 为求 取 自相
语 音 信号 处 理 巾重 要 的 一项 . 音 周 期 估 计 也 因 此 成 为 大 多 基 数 语 音 信 号 处 理 系统 的 重 要 组 成 部 分 。 基 音估 计 (i hE— Pt s c
t ai ) 称 基 音 检 测 ( i hD t t n , 在有 调语 音 辨 意 、 i tn又 m o Pt ee i ) 它 c co 低 速 率 语 音 编 码 、 话 人 识 别 等 方 面具 有 关 键 作 用 . 音 检 说 基 测 的 最 终 目标 是 找 m 和 声 带 振 动 频 率 完 全 一 致 的 基 音 周 期 变 化 轨 迹 曲线 , 不 可 能 , 找 出 尽 量 相 吻合 的 轨 迹 曲 线… 若 则 。 基音 周 期 估 计 一直 是语 音 信 号研 究 的 重 要 课 题 . 而 对 此 所 然 提 的很 多 方 法 有 其 局 限 性 。 都
GAO Y e u ,CHE Ya — u,MI n ,DU Ja N n p N Ga g i
( aeDe rme tXia o B s pat n, ’nC mmu & ̄in n o
, ’ 7 0 0 , hn ∞ 1 1 6 C ia)
Ab ta t h s p p r a a y e n o l ae on x s n i h d tc in a g r h , e u s fr r n ef ci e p th s r c : i a e n l s s a d C np r s s le e it g p t ee t lo t mst n p t o wad a f t i T i c o i h e v c d t cin ag r h w ih i r v s c lu a in s e dT i ag r h u e ee t l o t m h c mp o e ac lt p e .h s lo t m s s MAMDF me h d p c i g u o o s l e k o i o i t o ik n p s me p s i e p a b v l e . h n v rf s t e r v l e i ih p e iin C au s e e i h i a u s w t h g — r cso AMDF t e p i t w ih h s te mi i m au s t e p th T e T i e h 。 on h c a h n mu v l e i h i . h h c c mp tt n r d c sg e t e a s n y s v r l o n s AMDF f n t n a e a e c mp t d o u ai e u e r a l b c u e o l e e a i t ’C o y p c i y r o ue . u o
基音周期预测

专业班级组别成员实验内容:编程求解出各自声音信号的基音周期。
1 程序代码(或者软件流程图等)(1)function zhouqi=jiyinzhouqi(filename)%帧长和帧位移是重要的参数,位移是帧长的0~1/2%短时自相关分析%filename语音文件*.wav%zhouqi基音周期,以毫秒为单位表示[signal,fs]=wavread(filename); %用于得到声音文件的数据和采样率shift=0.02; %每次移动20毫秒shift=round(fs*shift); %帧移n1=fix(fs*0.01)+1; %分析起点0.01ms,帧长20msn2=fix(fs*0.03)+1;shift_count=fix((length(signal)-n1)/shift);value =zeros(1,shift_count); %存放每次移位后的帧的基音周期for ii=1:shift_count %分析次数if n2<length(signal) %防止溢出data=signal(n1:n2); %加窗,提取一帧数据N=n2-n1+1; %每一帧的长度R=zeros(1,N); %创建一个一行N列的矩阵for k=1:N-1 %求自相关序列for jj=1:N-kR(k)=R(k)+data(jj)*data(jj+k); %矩阵用于储存每次自相关的结果; endendvalue(ii)=find_maxn(R); %调用基音周期分析函数,求最大值所对应的位置,即基音周期n1=n1+shift; %移动帧,计算下一帧的基音周期n2=n2+shift;endendfigure(1)stem(value); %画出基因周期走势图axis([0 length(value) 0 1000])aver=mean(value); %基音周期的平均值,未去除野点value=value(logical(abs(value-aver)<=aver/5));%找出偏移均值超出均值的1/5的基音周期,将其去除len= length(value); %去除大野点后剩余的基音点数for jj=1:3:len/3 %中值平滑,滑动窗口宽度3,精度为中值1/4(剔除野点)average=(value(jj)+value(jj+1)+value(jj+2))/3;for kk=1:3if abs((value(jj-1+kk))-average)>average/4value(jj-1+kk)=0; %将野点置零,同时数组长度减一endendendvalue=value(( value~=0)); %出去所有野点后的基音周期数组len= length(value); %去除野点以后的基音点数figure(2)stem(value);axis([0 length(value) 0 max(value)])zhouqi=1000*sum(value)/len/fs; %求平均的基音周期,单位是毫秒(2) function nmax=find_maxn(r) %寻找峰值最大的n值及基音周期%r,自相关序列%maxn,为峰值最大的nzer=find(r==0); %找第一个零点如果存在jiaocha=0; %找第一近零点ii=1;while (jiaocha<=0)if(r(ii)>0 && r(ii+1)<0 && (ii+1)<length(r))jiaocha=ii;endii=ii+1;if ii==length(r) %没有找到符合要求的点jiaocha=1;endendif length(zer)>0 %检查是否存在零点if zer(1)<jiaocha %存在,则和jiaocha比较大小,用于祛除前点的对基音周期的查找带来的影响jiaocha=zer(1);endendr(1:jiaocha)=0; %祛除影响maxn=max(r); %找最大值temp=find(r==maxn); %返回第一个最大值nmax=temp(1);(3) function zhouqi=get_frq_frame(filename)%帧长和帧位移是重要的参数,位移是帧长的0~1/2%短时自相关分析%filename语音文件*.wav%zhouqi基音周期,以毫秒为单位表示[signal,fs]=wavread(filename);%用于得到声音文件的数据和采样率shift=0.02; %每次移动20毫秒shift=round(fs*shift); %帧移n1=fix(fs*0.01)+1; %分析起点0.01ms,帧长20msn2=fix(fs*0.03)+1;shift_count=fix((length(signal)-n1)/shift);value = zeros(1,shift_count); %存放每次移位后的帧的基音周期zhouqi = zeros(1,shift_count); %存放每次移位后的帧的基音周期for ii=1:shift_count %分析次数if n2<length(signal) %防止溢出data=signal(n1:n2); %加窗,提取一帧数据N=n2-n1+1; %每一帧的长度R=zeros(1,N);for k=1:N-1 %求自相关序列for jj=1:N-kR(k)=R(k)+data(jj)*data(jj+k);endendvalue(ii)=find_maxn(R); %调用基音周期分析函数,求最大值所对应的位置,即基音周期n1=n1+shift; %移动帧,计算下一帧的基音周期n2=n2+shift;zhouqi(ii) = 8000/value(ii);endendfor ii=1:length(zhouqi)if zhouqi(ii)==0zhouqi(ii) = [];endendplot(zhouqi);2 程序使用说明(1) function zhouqi=jiyinzhouqi(filename)① 函数基音周期是计算所采样的声音的平均基音周期的函数,函数使用加窗计算自相关函数的办法,通过帧移得到不同位置加窗信号的相关性,然后用矩阵R储存相对应的n2-n1+1个自相关值。
一种语音信号基音周期时域估计算法

一种语音信号基音周期时域估计算法作者:吴树兴来源:《电脑知识与技术》2019年第22期摘要:在语音识别和语音合成中,基频周期的准确估计是一项重要的语音处理环节。
自相关函数法是一种适用于低信噪比下的非常有效的基音周期估计算法,这种算法需要对信号相关后的峰值位置进行准确估计。
本文提出了一种峰值点位置判别方法,它可以对时域语音信号相关后的峰值点位置进行准确判断,从而比较准确地估计出语音信号的基频周期,并且复杂性不高,易于实现。
关键词:语音合成;基频周期;时域;自相关函数法;峰值估计中图分类号:TP247; ; ;文献标识码:A文章编号:1009-3044(2019)22-0214-03开放科学(资源服务)标识码(OSID): <E:\知网文件\电脑\电脑22-24\22\6xs201922\Image\image1_2.jpeg>A Time Domain Estimation Algorithm for Speech Signal Pitch PeriodWU Shu-xing(Beijing Information Technology College, Beijing 100015, China)Abstract: In speech recognition and speech synthesis, accurate estimation of the fundamental frequency period is an important part of speech processing. The autocorrelation function method is a very effective pitch period estimation algorithm suitable for low SNR. This algorithm needs to accurately estimate the peak position after signal correlation. In this paper, a method for judging the peak position is proposed, which can accurately judge the position of the peak point after the correlation of the time domain speech signal, so as to estimate the fundamental frequency period of the speech signal more accurately, and the complexity is not high and easy to implement.Key words: speech synthesis; fundamental frequency; period time domain; autocorrelation function method; peak estimation在語音信号处理技术中,基频周期的估计是一个非常重要的环节[1-2]。
基音周期

语音是语言的声学表现,语言是人类交流信息最自然、最有效、最方便的手段。
在高度信息化的今天,用现代手段研究语音处理技术,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。
语音处理的研究目标多种多样,所涉及的学科门类也是丰富多彩的,其中包括了语音和语言学、声学、心理学、认知科学、计算机、数理统计、信号处理、人工智能和模式识别等等,并且它始终与当前信息科学中最活跃的前沿学科,如神经网络理论、小波变换理论、模糊集理论、时频分布理论和混沌与分形理论等保持密切联系并共同发展着。
语音处理研究者常常从这些领域的进展中找到突破口,使语音处理技术研究取得突破性的进展,其研究成果具有重要的学术及应用价值。
语音信号处理主要包括语音识别、语音合成、语音压缩编码和语音增强等分支[1]。
语音识别技术是指计算机系统能够根据输入的语音识别出其代表的具体意义,进而完成相应的功能。
一般的方法是事先让用户朗读有一定数量文字、符号的文档,通过录音装置输入、存储到计算机,作为声音样本。
以后,当用户通过语音识别系统操作计算机时,用户的声音通过转换装置进入计算机内部,语音识别技术便将用户输入的声音与事先存储好的声音样本进行对比。
系统根据对比结果,输入一个它认为最“象”的声音样本序号,就可以知道用户刚才念的声音是什么意义,进而执行此命令。
因此通过语音识别技术,计算机可以“听”懂人类的语言。
语音合成是人机语声的一个重要组成部分,语音合成技术赋予机器“人工嘴巴”的功能,即解决让机器说话问题。
是将计算机自己产生的或外部输入的文字信息,比如文本文件内容、WORD文件内容等文字信息,按语音处理规则转换成语音信号输出,即使计算机流利地读出文字信息,使人们通过“听”就可以明白信息的内容。
也就是说,使计算机具有了“说”的能力,能够将信息“读”给人类听。
这种将文字转换成语音的技术称之为文语转换技术,简称TTS( Text to Speech)技术,也称为语音合成技术。
基于FFT-ACF和候选值估计的基音周期提取方法

由于语音 信号 是非平 稳 的时 变 信号 ,只有其 中
的浊 音部分能 够看 作是 准周 期 的 ,所 以在 语 音信 号 的基 音周期提 取 中通 常 采取 短时 处 理技 术 ,即对语
音信 号加窗 ( 矩形 窗 、汉 宁窗等 )分 帧 ,然 后 针对
期实 际值 ,即倍 频 错误 ) . 因此 为 准 确 提 取基 音 J 周期 ,对基音 周 期 候 选 值 的 后处 理 是 必 不 可 少 的.
存在 同样 的问题 :从 波形 上来 看 ,两 者都 随着 Ⅳ 的 增 加 ,幅度逐 渐 降低 ,呈 现 一种 减 弱 的趋 势 .而基 音 周期候 选值 通 常是用极 值 点来 估 计 的 ,这 种 减弱 的趋势 就为基 音周 期候 选值 的估 计 带来 了困难 ,导
1 基音周 期候选值估 计 函数
最 为传统 的基 音周期 候选 值估计 函数 是 A F和 C
A F MD .这两 个 函 数 的时 间复 杂 度 都 比较 高 ,设 要
A F 、幅 度 差 平 方 和 函 数 、混 合 幅 度 差 函 C
数 J A D _ 和 L A D 等 .但 在 实 际 应 用 、C M F4 V M F 中,这 些基 音 周 期 估 计 函数 往 往 要 发 生 偏 长 错 误
C MD A F的时 间复杂度 为 , N ) L A F的时 间复 J 2 ; V MD (
收 稿 日期 :2 0 -4 0 0 70 -4;修 回 日期 :2 0 6 1 0 7 0 1 基金项 目:深圳市科技计划资助项 目 ( K 0 6 1 Q 2 00 ) 作者简介 :徐 明 ( 97 ) 16 . ,男 ( 汉族 ) ,湖南省怀化市人 ,深圳大学 高级工程师
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
语音信号处理实验报告
实验二:语音信号的基音周期估计
学院:电子与信息学院
专业:信息工程
姓名
学号:
提交日期:2014.4.29
实验二:语音信号基音周期估计
1、 实验内容
从一段语音信号中估计出其基音周期。基音是指法浊音是声带振动所引起的
周期性,而基因周期是指声带振动频率的倒数。
2、 实验方法
尽管基音检测有许多困难,但因为它的重要性,基音的检测提取一直是一个
研究的课题,为此提出了各种各样的基音检测算法,如自相关函数(ACF)法、峰
值提取算法(PPA)、平均幅度差函数(AMDF)法、并行处理技术、倒谱法、SIFT、
谱图法、小波法等等。
2.1、短时自相关法
对于离散的语音信号x(n),它的自相关函数定义为:R(k)=Σx(n)x(n-k),
如果信号x(n))具有周期性,那么它的自相关函数也具有周期性,而且周期
与信号x(n)的周期性相同。自相关函数提供了一种获取周期信号周期的方法。
在周期信号周期的整数倍上,它的自相关函数可以达到最大值,因此可以不考虑
起始时间,而从自相关函数的第一个最大值的位置估计出信号的基音周期,这使
自相关函数成为信号基音周期估计的一种工具。
语音信号是非平稳的信号,所以对信号的处理都使用短时自相关函数。短时
自相关函数是在信号的第N个样本点附近用短时窗截取一段信号,做自相关计
算。短时自相关运算定义为下式:
10()()()NknnnmRkSmSmk
2.2、平均幅度差函数法
语音信号的短时平均幅度差函数Fn(k)定义为
10()|()()|NknnnmFkSmkSm
与短时自相关函数一样,对周期性的浊音一样,Fn(k)也呈现与浊音语音周期
一致的周期特性,不过不同的是Fn(k)在周期的各个整数倍点上具有是谷值特
性而不是峰值特性,因而通过Fn(k)的计算同样可以确定基音周期。
线性加权短时平均幅度差(W-AMDF)的定义:
101()|()()|1NknwnnmFkSmkSmNk
2.3、实验过程
2.3.1自相关法(ACF)
1、录取一段录音,采样率8K,单声道
2、用MATLAB的wavread函数把录音都进来并进行归一化处理
3、对语音信号进行预加重
4、对语音信号进行截止频率为1000Hz的低通滤波,然后进行分帧处理
5、对每帧语音进行三电平削波处理
6、对每帧分别计算短时自相关运算,去除每帧前十个点后再求最大值
7、利用最大值对应的序号N来确定基音的周期
2.3.2短时平均幅度差法(W-ADMF)
1、录取一段录音,采样率8K,单声道
2、用MATLAB的wavread函数把录音都进来并进行归一化处理
3、对语音信号进行预加重
4、对语音信号进行截止频率为1000Hz的低通滤波,然后进行分帧处理
5、对每帧语音进行三电平削波处理
6、对每帧分别计算线性加权短时平均幅度差运算,去除每帧前、后5个点后再
求最小值M1和第二最小值M2
7、利用abs(M2-M1)来确定基音的周期
3、实验结果
短时自相关法
(W-ADMF)短时平均幅度差法
4、实验分析
4.1结果分析
根据自相关法和平均幅度差两种方法的结果对比,提取出来的基音周期大小
有点差异,但是基本都相同。由此可知,用这两种方法估计基音周期还是可以的。
4.2实验感想
这次的基音周期估计实验感觉挺难的,首先上网找不到一些很成熟的方法来
计算基音周期。其次由于所录的语音周期性不强,基本看不出有周期性。语音经
过低通滤波后稍微有一点周期性,而且自相关值R(k)和短时平均幅度差F(k)
的周期性也不好,由此很难求出基音的周期。不过经过这次实验,自己解决问题
的能力提高很多。