新语音信号处理实验指导2015年秋

合集下载

(完整word版)语音信号处理实验报告实验一

(完整word版)语音信号处理实验报告实验一

通信工程学院12级1班罗恒2012101032实验一语音信号的低通滤波和短时分析综合实验一、实验要求1、根据已有语音信号,设计一个低通滤波器,带宽为采样频率的四分之一,求输出信号;2、辨别原始语音信号与滤波器输出信号有何区别,说明原因;3、改变滤波器带宽,重复滤波实验,辨别语音信号的变化,说明原因;4、利用矩形窗和汉明窗对语音信号进行短时傅立叶分析,绘制语谱图并估计基音周期,分析两种窗函数对基音估计的影响;5、改变窗口长度,重复上一步,说明窗口长度对基音估计的影响。

二、实验目的1.在理论学习的基础上,进一步地理解和掌握语音信号低通滤波的意义,低通滤波分析的基本方法。

2.进一步理解和掌握语音信号不同的窗函数傅里叶变化对基音估计的影响。

三、实验设备1.PC机;2。

MATLAB软件环境;四、实验内容1。

上机前用Matlab语言完成程序编写工作.2。

程序应具有加窗(分帧)、绘制曲线等功能。

3.上机实验时先调试程序,通过后进行信号处理。

4.对录入的语音数据进行处理,并显示运行结果。

5。

改变滤波带宽,辨别与原始信号的区别。

6。

依据曲线对该语音段进行所需要的分析,并且作出结论。

7.改变窗的宽度(帧长),重复上面的分析内容。

五、实验原理及方法利用双线性变换设计IIR滤波器(巴特沃斯数字低通滤波器的设计),首先要设计出满足指标要求的模拟滤波器的传递函数Ha(s),然后由Ha(s)通过双线性变换可得所要设计的IIR滤波器的系统函数H(z)。

如果给定的指标为数字滤波器的指标,则首先要转换成模拟滤波器的技术指标,这里主要是边界频率Wp和Ws的转换,对ap和as指标不作变化。

边界频率的转换关系为∩=2/T tan(w/2).接着,按照模拟低通滤波器的技术指标根据相应设计公式求出滤波器的阶数N和3dB截止频率∩c ;根据阶数N查巴特沃斯归一化低通滤波器参数表,得到归一化传输函数Ha(p);最后,将p=s/ ∩c 代入Ha(p)去归一,得到实际的模拟滤波器传输函数Ha(s)。

语音信号处理实验指导书

语音信号处理实验指导书

《语音信号处理》实验指导书姚丽娜电子信息学院目录实验一语音信号的特征提取 (3)实验二语音信号的基音周期提取 (11)实验一语音信号的特征提取一、实验目的1、熟练运用MATLAB软件进行语音信号实验。

2、熟悉短时分析原理、MFCC、LPC的原理。

3、学习运用MATLAB编程进行MFCC、LPC的提取。

4、学会利用短时分析原理提取MFCC、LPC特征序列。

二、实验仪器设备及软件PC机、MATLAB三、实验原理1、MFCC语音识别和说话人识别中,常用的语音特征是基于Mel频率的倒谱系数(即MFCC)。

MFCC参数是将人耳的听觉感知特性和语音的产生机制相结合。

Mel频率可以用如下公式表示:f=⨯+2595log(11/700)mel在实际应用中,MFCC倒谱系数计算过程如下;①将信号进行分帧,预加重和加汉明窗处理,然后进行短时傅里叶变换并得到其频谱。

② 求出频谱平方,即能量谱,并用M 个Mel 带通滤波器进行滤波;由于每一个频带中分量的作用在人耳中是叠加的。

因此将每个滤波器频带内的能量进行叠加,这时第k 个滤波器输出功率谱x'(k)。

③ 将每个滤波器的输出取对数,得到相应频带的对数功率谱;并进行反离散余弦变换,得到L 个MFCC 系数,一般L 取12~16个左右。

MFCC 系数为'1log ()cos[(0.5)/],1,2,,M k Cn x k k n M n L π==-=∑④ 将这种直接得到的MFCC 特征作为静态特征,再将这种静态特征做一阶和二阶差分,得到相应的动态特征。

2、 LPC由于频率响应H (e jw )反映声道的频率响应和被分析信号的谱包络,因此用 log │H (e jw )│反傅里叶变换求出的LPC 倒谱系数。

通过线性预测分析得到的合成滤波器的系统函数1()1/(1)p i i i H z a z -==-∑,其冲击响应为()h n 。

()h n 的倒谱为()h n ∧,_^1()()n n H z h n z+∞∧-==∑就是说^()H z 的逆变换()h n ∧是存在的。

语音信号处理实验大纲

语音信号处理实验大纲

语音信号处理
一、实验课程名称:语音信号处理
二、实验课程英文名称: Speech signal processing
三、实验课程编号: 0451714
四、实验课程性质:非独立设课
五、学时安排:理论课程学时42 实验课程学时12
六、实验课程学分:0学分
七、实验课程类型:专业课
八、实验课程要求:必修课
九、课程适用专业:电子信息科学与技术
十、教学目的:
使学生掌握语音信号各种处理方法的原理、算法、用matlab的编程方法和仿真。

通过实际应用和亲身体验,加深对所学知识的理解,增强动手能力。

十一、实验教学项目表
实验课教学内容项目表(必做)
十一、实验报告要求:
1.编写程序;
2.验证调试实验并写出调试结果,需指导教师确认。

十二、实验成绩评定:
分数分配:
预习:10%,操作:60%,实验报告:60%,创新能力:10%;
实验总计6个,满分20分,第一和第二个实验每个4分,第三、四、五、六个实验每个3分。

十三、教材及参考书:
1.《语音信号处理》.胡航编著.哈尔滨工业大学出版社
2.《语音信号处理实验指导书》自编
学院签署意见表。

语音信号处理实验讲义

语音信号处理实验讲义

语⾳信号处理实验讲义语⾳信号处理实验讲义编写⼈:蔡萍时间:2011-12实验⼀语⾳信号⽣成模型分析⼀、实验⽬的1、了解语⾳信号的⽣成机理,了解由声门产⽣的激励函数、由声道产⽣的调制函数和由嘴唇产⽣的辐射函数。

2、编程实现声门激励波函数波形及频谱,与理论值进⾏⽐较。

3、编程实现已知语⾳信号的语谱图,区分浊⾳信号和清⾳信号在语谱图上的差别。

⼆、实验原理语⾳⽣成系统包含三部分:由声门产⽣的激励函数()G z 、由声道产⽣的调制函数()V z 和由嘴唇产⽣的辐射函数()R z 。

语⾳⽣成系统的传递函数由这三个函数级联⽽成,即()()()()H z G z V z R z =1、激励模型发浊⾳时,由于声门不断开启和关闭,产⽣间隙的脉冲。

经仪器测试它类似于斜三⾓波的脉冲。

也就是说,这时的激励波是⼀个以基⾳周期为周期的斜三⾓脉冲串。

单个斜三⾓波的频谱表现出⼀个低通滤波器的特性。

可以把它表⽰成z 变换的全极点形式121()(1)cTG z ez --=-?这⾥c 是⼀个常数,T 是脉冲持续时间。

周期的三⾓波脉冲还得跟单位脉冲串的z 变换相乘:1121()()()1(1)v cT A U z E z G z z e z ---=?=--这就是整个激励模型,v A 是⼀个幅值因⼦。

2、声道模型当声波通过声道时,受到声腔共振的影响,在某些频率附近形成谐振。

反映在信号频谱图上,在谐振频率处其谱线包络产⽣峰值,把它称为共振峰。

⼀个⼆阶谐振器的传输函数可以写成12()1ii i i A V z B z C z--=-- 实践表明,⽤前3个共振峰代表⼀个元⾳⾜够了。

对于较复杂的辅⾳或⿐⾳共振峰要到5个以上。

多个()i V z 叠加可以得到声道的共振峰模型12111()()11Rrr MMir i N ki i i ik k b zA V z V zB zC z a z -=---======---∑∑∑∑3、辐射模型从声道模型输出的是速度波,⽽语⾳信号是声压波。

语音信号处理实验报告 语音修正短时自相关

语音信号处理实验报告 语音修正短时自相关

语音信号处理课程实验报告专业班级通信学号姓名指导教师实验名称 语音修正的短时自相关的实现 同组人 专业班级通信 学号 姓名 成绩 一、实验目的 熟悉语音修正自相关的意义。

充分理解取取不同窗长时的语音的修正自相关的变化情况。

熟悉Matlab 编程语言在语音信号处理中的作用。

能够实现对程序的重新编制。

二、实验原理 对于语音来说,采用短时分析方法,语音短时自相关函数为 ()()()[]()()[]∑--=+'++'+=k N m n m k w k m n x m w m n x k R 10 但是,在计算短时自相关时,窗选语音段为有限长度N ,而求和上限为N-1-k ,因此当k 增加时可用于计算的数据就越来越少了,从而导致k 增加时自相关函数的幅度减小。

为了解决这个问题,提出了语音修正的短时自相关。

修正的短时自相关函数,其定义如下: ()()()()() 2-m 1k m n w k m x m n w m x k R n --+-=∑+∞∞= 若令m n m '+=,代入上式得到 ()())(-)()(-ˆ21-k m w k m n x m w m n x k R m n '+'+''+=∑+∞-∞=' ()()()()1122ˆ ˆw m w m w m w m =-⎧⎪⎨=-⎪⎩定义……………………………………装………………………………………订…………………………………………线………………………………………()()() ˆˆ)()(ˆ 2-m 1k m w k m n x m w m n x k Rn ++++=∑+∞∞=则有()()121, 0n N-1ˆ0, 1, 0n N-1ˆ 0, w m K w m ≤≤⎧=⎨⎩≤≤+⎧=⎨⎩其它其它式中,K 为k 的最大值,即0≤k ≤K 。

由式(2-5)可知,要使)(ˆ2k m w +为非零值,必须使K N k m +1-≤+,考虑到K k ≤,可得1-≤N m ,故式(2-4)可以写成:∑1-0 )()()(ˆN m n k m n x m n x k R =+++= 三、实验要求1.实验前自己用Cool Edit 音频编辑软件录制声音,并把它保存为.txt 文件.2.编程实现不同矩形窗长N =320,160,70的短时修正自相关。

语音信号处理实验指导书

语音信号处理实验指导书

语音信号处理实验指导书实验一 语音信号采集与简单处理一、 实验目的、要求 (1)掌握语音信号采集的方法(2)掌握一种语音信号基音周期提取方法 (3)掌握短时过零率计算方法 (4)了解Matlab 的编程方法 二、 实验原理 基本概念: (a )短时过零率:短时内,信号跨越横轴的情况,对于连续信号,观察语音时域波形通过横轴的情况;对于离散信号,相邻的采样值具有不同的代数符号,也就是样点改变符号的次数。

对于语音信号,是宽带非平稳信号,应考察其短时平均过零率。

其中sgn[.]为符号函数⎪⎩⎪⎨⎧<=>=0 x(n)-1sgn(x(n))0 x(n)1sgn(x(n))短时平均过零的作用 1.区分清/浊音:浊音平均过零率低,集中在低频端; 清音平均过零率高,集中在高频端。

2.从背景噪声中找出是否有语音,以及语音的起点。

(b )基音周期基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。

基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。

因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。

∑--=-=1)]1(sgn[)](sgn[21N m n n n m x m x Z由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。

基音提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列,在语音的头、尾部并不具有声带振动那样的周期性,有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。

语音信号处理实验报告

语音信号处理实验报告

通信与信息工程学院信息处理综合实验报告班级:电子信息工程1502班指导教师:设计时间:2018/10/22-2018/11/23评语:通信与信息工程学院二〇一八年实验题目:语音信号分析与处理一、实验内容1. 设计内容利用MATLAB对采集的原始语音信号及加入人为干扰后的信号进行频谱分析,使用窗函数法设计滤波器滤除噪声、并恢复信号。

2.设计任务与要求1. 基本部分(1)录制语音信号并对其进行采样;画出采样后语音信号的时域波形和频谱图。

(2)对所录制的语音信号加入干扰噪声,并对加入噪声的信号进行频谱分析;画出加噪后信号的时域波形和频谱图。

(3)分别利用矩形窗、三角形窗、Hanning窗、Hamming窗及Blackman 窗几种函数设计数字滤波器滤除噪声,并画出各种函数所设计的滤波器的频率响应。

(4)画出使用几种滤波器滤波后信号时域波形和频谱,对滤波前后的信号、几种滤波器滤波后的信号进行对比,分析信号处理前后及使用不同滤波器的变化;回放语音信号。

2. 提高部分(5)录制一段音乐信号并对其进行采样;画出采样后语音信号的时域波形和频谱图。

(6)利用MATLAB产生一个不同于以上频段的信号;画出信号频谱图。

(7)将上述两段信号叠加,并加入干扰噪声,尝试多次逐渐加大噪声功率,对加入噪声的信号进行频谱分析;画出加噪后信号的时域波形和频谱图。

(8)选用一种合适的窗函数设计数字滤波器,画出滤波后音乐信号时域波形和频谱,对滤波前后的信号进行对比,回放音乐信号。

二、实验原理1.设计原理分析本设计主要是对语音信号的时频进行分析,并对语音信号加噪后设计滤波器对其进行滤波处理,对语音信号加噪声前后的频谱进行比较分析,对合成语音信号滤波前后进行频谱的分析比较。

首先用PC机WINDOWS下的录音机录制一段语音信号,并保存入MATLAB软件的根目录下,再运行MATLAB仿真软件把录制好的语音信号用audioread函数加载入MATLAB仿真软件的工作环境中,输入命令对语音信号进行时域,频谱变换。

哈尔滨工程大学语音信号处理实验报告讲述

哈尔滨工程大学语音信号处理实验报告讲述

实验报告实验课程名称:语音信号处理实验姓名:班级: 20120811 学号:Array指导教师张磊实验教室 21B#293实验时间 2015年4月12日实验成绩实验一 语音信号的端点检测一、实验目的1、掌握短时能量的求解方法2、掌握短时平均过零率的求解方法3、掌握利用短时平均过零率和短时能量等特征,对输入的语音信号进行端点检测。

二、实验设备 HP 计算机、Matlab 软件 三、实验原理 1、短时能量语音信号的短时能量分析给出了反应这些幅度变化的一个合适的描述方法。

对于信号)}({n x ,短时能量的定义如下:∑∑∞-∞=∞-∞=*=-=-=m m n n h n x m n h m xm n w m x E )()()()()]()([2222、短时平均过零率短时平均过零率是指每帧内信号通过零值的次数。

对于连续语音信号,可以考察其时域波形通过时间轴的情况。

对于离散信号,实质上就是信号采样点符号变化的次数。

过零率在一定程度上可以反映出频率的信息。

短时平均过零率的公式为:∑∑-+=∞-∞=--=---=1)]1(sgn[)](sgn[21 )()]1(sgn[)](sgn[21N n nm w w m n m x m x m n w m x m x Z其中,sgn[.]是符号函数,即⎩⎨⎧<-≥=0)(10)(1)](sgn[n x n x n x3、端点检测原理能够实现这些判决的依据在于,不同性质语音的各种短时参数具有不同的概率密度函数,以及相邻的若干帧语音应具有一致的语音特性,它们不会在S 、U 、V 之间随机地跳来跳去。

要正确判断每个输入语音的起点和终点,利用短时平均幅度参数E 和短时平均过零率Z 可以做到这一点。

首先,根据浊音情况下的短时能量参数的概率密度函数)|(V E P 确定一个阈值参数H E ,H E 值一般定的较高。

当一帧输入信号的短时平均幅度参数超过H E 时,就可以判定该帧语音信号不是无声,而有相当大的可能是浊音。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《语音信号处理》实验指导书哈尔滨理工大学自动化学院电子信息科学与技术系2014.10语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。

通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。

同时,语言也是人与机器之间进行通信的重要工具,它是一种理想的人机通信方式,因而可为信息处理系统建立良好的人机交互环境,进一步推动计算机和其他智能机器的应用,提高社会的信息化程度。

语音信号处理是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。

虽然从事这一领域研究的人员主要来自信号与信息处理及计算机应用等学科,但是它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。

20世纪60年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换(FFT)等是语音信号数字处理的理论和技术基础。

随着信息科学技术的飞速发展,语音信号处理取得了重大的进展:进入70年代之后,提出了用于语音信号的信息压缩和特征提取的线性预测技术(LPC),并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间时间匹配的动态规划方法;80年代初一种新的基于聚类分析的高效数据压缩技术—矢量量化(VQ)应用于语音信号处理中;而用隐马尔可夫模型(HMM)描述语音信号过程的产生是80年代语音信号处理技术的重大发展,目前HMM已构成了现代语音识别研究的重要基石。

近年来人工神经网络(ANN)的研究取得了迅速发展,语音信号处理的各项课题是促进其发展的重要动力之一,同时,它的许多成果也体现在有关语音信号处理的各项技术之中。

为了深入理解语音信号数字处理的基础理论、算法原理、研究方法和难点,根据数字语音信号处理教学大纲,结合课程建设的需求,我们编写了本实验指导书。

实验一 基于MATLAB 的语音信号时域特征分析一、实验目的:语音信号是一种非平稳的时变信号,它携带着各种信息。

在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。

语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。

语音信号分析可以分为时域和变换域等处理方法,其中时域分析是最简单的方法,直接对语音信号的时域波形进行分析,提取的特征参数主要有语音的短时能量,短时平均过零率,短时自相关函数等。

本实验要求掌握时域特征分析原理,并利用已学知识,编写程序求解语音信号的短时过零率、短时能量、短时自相关特征,分析实验结果,并能掌握借助时域分析方法所求得的参数分析语音信号的基音周期及共振峰。

二、实验原理:1.窗口的选择通过对发声机理的认识,语音信号可以认为是短时平稳的。

在5~50ms 的范围内,语音频谱特性和一些物理特性参数基本保持不变。

我们将每个短时的语音称为一个分析帧。

一般帧长取10~30ms 。

我们采用一个长度有限的窗函数来截取语音信号形成分析帧。

通常会采用矩形窗和汉明窗。

矩形窗的定义:一个N 点的矩形窗函数定义为如下:公式1: 1 0() 0 n N w n ≤≤⎧=⎨⎩其它, , hamming 窗的定义:一个N 点的hamming 窗函数定义为如下:公式2:()0.540.46 cos 2π/1 0() 0 n N n N w n ⎧--≤≤⎡⎤⎪⎣⎦=⎨⎪⎩其它, 2.短时能量由于语音信号的能量随时间变化,清音和浊音之间的能量差别相当显著。

因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。

定义短时能量为: 公式3: )]()([ )]()([)1(22∑∑--=+∞-∞=-=-=n N n m m n m n w m x m n w m x E 特殊地,当采用矩形窗时,可简化为: 公式4: )()1(2∑--==n N n m n m x E3.短时平均过零率过零率可以反映信号的频谱特性。

当离散时间信号相邻两个样点的正负号相异时,我们称之为“过零”,即此时信号的时间波形穿过了零电平的横轴。

统计单位时间内样点值改变符号的次数具可以得到平均过零率。

定义短时平均过零率:公式5:)()()()()()sgn sgn 1sgn sgn 1*n m Z x m x m w n m x n x n w n +∞=-∞=---⎡⎤⎡⎤⎣⎦⎣⎦=--⎡⎤⎡⎤⎣⎦⎣⎦∑在矩形窗的条件下,可以简化为:公式6:)[]()[]∑--=-=n N n m n m x m x N Z )1(|1-sgn sgn | 21短时过零率可以粗略估计语音的频谱特性。

由语音的产生模型可知,发浊音时,声带振动,尽管声道有多个共振峰,但由于声门波引起了频谱的高频衰落,因此浊音能量集中于3KZ 以下。

而清音由于声带不振动,声道的某些部位阻塞气流产生类白噪声,多数能量集中在较高频率上。

高频率对应着高过零率,低频率对应着低过零率,那么过零率与语音的清浊音就存在着对应关系。

4.短时自相关函数 自相关函数用于衡量信号自身时间波形的相似性。

清音和浊音的发声机理不同,因而在波形上也存在着较大的差异。

浊音的时间波形呈现出一定的周期性,波形之间相似性较好;清音的时间波形呈现出随机噪声的特性,样点间的相似性较差。

因此,我们用短时自相关函数来测定语音的相似特性。

短时自相关函数定义为:公式7: ()()()()() n m R k x m w n m x m k w n k m +∞=-∞=-+--∑ 令:'m n m =+,并且()()w m w m '-=,可以得到:()()()()()10 N kn m R k x n m w m x n m k w k m --=''=++++⎡⎤⎡⎤⎣⎦⎣⎦∑三、实验内容:(1) 用Matlab 绘出图1.1——这两种窗函数在帧长N=50时的时域波形。

(2) 用Matlab 绘出图1.2——这两种窗函数的频率响应幅度特性。

这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性。

(3) 用MA TLAB绘出图1.3和图1.4——给出了不同矩形窗和hamming窗长的短时能量函数,分析在用短时能量反映语音信号的幅度变化时,不同的窗函数以及相应窗的长短均有影响。

以及总结短时能量函数的应用。

(4) 用MA TLAB绘出图1.5——某一语音在矩形窗条件下求得的短时能量和短时平均过零率。

分析清音和浊音的短时能量,过零率。

总结短时平均过零率的应用。

(5) 用MATLAB绘出图1.6——给出了清音的短时自相关函数波形,用MA TLAB绘出图——1.7给出了不同矩形窗长条件下(窗长分别为N=70,N=140,N=210,N=280)浊音的短时自相关函数波形。

由图1.6、图1.7短时自相关函数波形分析判断一个语音信号是清音还是浊音,还可以判断浊音的基音周期。

四、实验要求:(1) 撰写预习报告。

(2) 用Matlab完成算法设计和程序设计并上机调试通过。

(3) 撰写实验报告,简述实验目的及原理,给出理论计算结果和程序计算结果并分析。

实验二 基于MATLAB 分析语音信号频域特征一、实验目的信号的傅立叶表示在信号的分析与处理中起着重要的作用。

因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理问题。

另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更深入地说明信号的各项红物理现象。

由于语音信号是随着时间变化的,通常认为,语音是一个受准周期脉冲或随机噪声源激励的线性系统的输出。

输出频谱是声道系统频率响应与激励源频谱的乘积。

声道系统的频率响应及激励源都是随时间变化的,因此一般标准的傅立叶表示虽然适用于周期及平稳随机信号的表示,但不能直接用于语音信号。

由于语音信号可以认为在短时间内,近似不变,因而可以采用短时分析法。

本实验要求掌握傅里叶分析原理,会利用已学的知识,编写程序估计短时谱、倒谱,画出语谱图,并分析实验结果,在此基础上,借助频域分析方法所求得的参数分析语音信号的基音周期或共振峰。

二、实验原理1.短时傅立叶变换由于语音信号是短时平稳的随机信号,某一语音信号帧的短时傅立叶变换的定义为: j j (e )[()()]e m n m X x m w n m ωω+∞-=-∞=-∑其中w(n-m)是实窗口函数序列,n 表示某一语音信号帧。

令n-m=m',则得到: j ()-j (e )()() e [()()]j n m n m n j m m X x n m w m e x n m w m e ωωωω+∞'--'=-∞+∞''=-∞''=-''=-∑∑ 假定:j j j j (e )()()e e (e )m n nn m X x n m w m X ωωωω+∞''=-∞''=-=∑则可得到: j j j j (e )e (e )e [()jb ()]n n n n n nX X a ωωωωωω--=⋅=- 同样,不同的窗口函数,将得到不同的傅立叶变换式的结果。

由上式可见,短时傅立叶变换有两个变量:n 和ω,所以它既是时序n 的离散函数,又是角频率ω的连续函数。

与离散傅立叶变换逼近傅立叶变换一样,如令2πk N ω=,则得离散的短时傅立叶吧如下:2π2πj j (e )()()()e ,01kkm N N n n m X X k x m w n m k N +∞-=-∞==-≤≤-∑2.语谱图语谱图(Spectrogram )是一种时间依赖于傅里叶分析的显示图像。

它是一种三维频谱,可同时在时间和频率上显示语音频谱随时间的变化,其纵轴为频率,横轴为时间;任意给定频率成分在给定时刻的强弱用相应点的灰度或色调的浓度来表示,通过语谱图可以确定共振峰频率及基音频率,确定讲话人的本性。

窄带语谱:带通滤波器45Hz ,有良好的频率分辨率,有利于显示基音频率及各次谐波,但时间分辨率较差,不利于观察共振峰的变化。

宽带语谱:带通滤波器300Hz ,有良好的频率分辨率及较差的频率分辨率给出语音的共振峰频率及清浊音的能量汇聚区,在语谱图中共振峰呈现为条纹。

水平方向是时间轴,垂直方向是频率轴,图上的灰度条纹代表各个时刻的语音短时谱。

语谱图反映了语音信号的动态频率特性,在语音分析中具有重要的实用价值。

被成为可视语言。

语谱图的时间分辨率和频率分辨率是由窗函数的特性决定的。

时间分辨率高,可以看出时间波形的每个周期及共振峰随时间的变化,但频率分辨率低,不足以分辨由于激励所形成的细微结构,称为宽带语谱图;而窄带语谱图正好与之相反。

相关文档
最新文档