语音信号处理试验教程

合集下载

语音信号处理实验指导书

《语音信号处理》实验指导书姚丽娜电子信息学院目录实验一语音信号的特征提取 (3)实验二语音信号的基音周期提取 (11)实验一语音信号的特征提取一、实验目的1、熟练运用MATLAB软件进行语音信号实验。

2、熟悉短时分析原理、MFCC、LPC的原理。

3、学习运用MATLAB编程进行MFCC、LPC的提取。

4、学会利用短时分析原理提取MFCC、LPC特征序列。

二、实验仪器设备及软件PC机、MATLAB三、实验原理1、MFCC语音识别和说话人识别中，常用的语音特征是基于Mel频率的倒谱系数（即MFCC）。

MFCC参数是将人耳的听觉感知特性和语音的产生机制相结合。

Mel频率可以用如下公式表示：f=⨯+2595log(11/700)mel在实际应用中，MFCC倒谱系数计算过程如下;①将信号进行分帧，预加重和加汉明窗处理，然后进行短时傅里叶变换并得到其频谱。

② 求出频谱平方，即能量谱，并用M 个Mel 带通滤波器进行滤波；由于每一个频带中分量的作用在人耳中是叠加的。

因此将每个滤波器频带内的能量进行叠加，这时第k 个滤波器输出功率谱x'(k)。

③ 将每个滤波器的输出取对数，得到相应频带的对数功率谱；并进行反离散余弦变换，得到L 个MFCC 系数，一般L 取12~16个左右。

MFCC 系数为'1log ()cos[(0.5)/],1,2,,M k Cn x k k n M n L π==-=∑④ 将这种直接得到的MFCC 特征作为静态特征，再将这种静态特征做一阶和二阶差分，得到相应的动态特征。

2、 LPC由于频率响应H (e jw )反映声道的频率响应和被分析信号的谱包络，因此用 log │H （e jw ）│反傅里叶变换求出的LPC 倒谱系数。

通过线性预测分析得到的合成滤波器的系统函数1()1/(1)p i i i H z a z -==-∑，其冲击响应为()h n 。

()h n 的倒谱为()h n ∧，_^1()()n n H z h n z+∞∧-==∑就是说^()H z 的逆变换()h n ∧是存在的。

数字语音信号处理实验指导书(学生用)

数字语音信号处理实验指导书(学生用）前言语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科，是目前发展最为迅速的信息科学研究领域的核心技术之一。

通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。

同时，语言也是人与机器之间进行通信的重要工具，它是一种理想的人机通信方式，因而可为信息处理系统建立良好的人机交互环境，进一步推动计算机和其他智能机器的应用，提高社会的信息化程度。

语音信号处理是一门新兴的学科，同时又是综合性的多学科领域和涉及面很广的交叉学科。

虽然从事这一领域研究的人员主要来自信号与信息处理及计算机应用等学科，但是它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。

20世纪60年代中期形成的一系列数字信号处理的理论和算法，如数字滤波器、快速傅立叶变换（FFT）等是语音信号数字处理的理论和技术基础。

随着信息科学技术的飞速发展，语音信号处理取得了重大的进展：进入70年代之后，提出了用于语音信号的信息压缩和特征提取的线性预测技术（LPC），并已成为语音信号处理最强有力的工具，广泛应用于语音信号的分析、合成及各个应用领域，以及用于输入语音与参考样本之间时间匹配的动态规划方法；80年代初一种新的基于聚类分析的高效数据压缩技术—矢量量化（VQ）应用于语音信号处理中；而用隐马尔可夫模型（HMM）描述语音信号过程的产生是80年代语音信号处理技术的重大发展，目前HMM已构成了现代语音识别研究的重要基石。

近年来人工神经网络(ANN)的研究取得了迅速发展，语音信号处理的各项课题是促进其发展的重要动力之一，同时，它的许多成果也体现在有关语音信号处理的各项技术之中。

要求：1、用自己的手机录音“我是贵州大学科学院XX级XX专业的学生，名叫XXX，男（女），毕业于XX省XX市（县）XX中学。

2、在实验报告中要注明手机品牌，录音的采样频率：单（双）声道3、每个人实验报告只能处理自己的录音作为输入，实验报告采用电子文档提交，不接收纸质报告，附录音记录——切记！！！！！。

语音信号处理实验讲义

语⾳信号处理实验讲义语⾳信号处理实验讲义编写⼈：蔡萍时间：2011-12实验⼀语⾳信号⽣成模型分析⼀、实验⽬的1、了解语⾳信号的⽣成机理，了解由声门产⽣的激励函数、由声道产⽣的调制函数和由嘴唇产⽣的辐射函数。

2、编程实现声门激励波函数波形及频谱，与理论值进⾏⽐较。

3、编程实现已知语⾳信号的语谱图，区分浊⾳信号和清⾳信号在语谱图上的差别。

⼆、实验原理语⾳⽣成系统包含三部分：由声门产⽣的激励函数()G z 、由声道产⽣的调制函数()V z 和由嘴唇产⽣的辐射函数()R z 。

语⾳⽣成系统的传递函数由这三个函数级联⽽成，即()()()()H z G z V z R z =1、激励模型发浊⾳时，由于声门不断开启和关闭，产⽣间隙的脉冲。

经仪器测试它类似于斜三⾓波的脉冲。

也就是说，这时的激励波是⼀个以基⾳周期为周期的斜三⾓脉冲串。

单个斜三⾓波的频谱表现出⼀个低通滤波器的特性。

可以把它表⽰成z 变换的全极点形式121()(1)cTG z ez --=-?这⾥c 是⼀个常数，T 是脉冲持续时间。

周期的三⾓波脉冲还得跟单位脉冲串的z 变换相乘：1121()()()1(1)v cT A U z E z G z z e z ---=?=--这就是整个激励模型，v A 是⼀个幅值因⼦。

2、声道模型当声波通过声道时，受到声腔共振的影响，在某些频率附近形成谐振。

反映在信号频谱图上，在谐振频率处其谱线包络产⽣峰值，把它称为共振峰。

⼀个⼆阶谐振器的传输函数可以写成12()1ii i i A V z B z C z--=-- 实践表明，⽤前3个共振峰代表⼀个元⾳⾜够了。

对于较复杂的辅⾳或⿐⾳共振峰要到5个以上。

多个()i V z 叠加可以得到声道的共振峰模型12111()()11Rrr MMir i N ki i i ik k b zA V z V zB zC z a z -=---======---∑∑∑∑3、辐射模型从声道模型输出的是速度波，⽽语⾳信号是声压波。

语音信号处理实验二

课程名称：语音信号处理实验项目：语音修正的短时自相关的实现实验地点：起点机房专业班级：/////学号：///////////学生姓名： /////////指导教师： ////////2012年 10月 23日一．实验目的1．熟悉语音修正自相关的意义。

2．充分理解取不同窗长时的语音的修正自相关的变化情况。

3．熟悉Matlab编程语音在语音信号处理中的作用。

4．能够实现程序的重新编制。

二．实验原理对于语音来说，采用短时分析方法，语音短时自相关函数为但是，在计算短时自相关时，窗选语音段为有限长度N，而求和上限为N-1-k，因此当k增加时可用于计算的数据就越来越少了，从而导致k增加时自相关函数的幅度减小。

为了解决这个问题，提出了语音修正的短时自相关。

修正的短时自相关函数，其定义如下：三．实验要求1．实验前自己用Cool Edit 音频编辑软件录制声音，并把它保存为.txt文件。

2．编程时间不同矩形窗长N=320,160,70的短时修正自相关。

3．用Matlab画出短时修正自相关的图形。

4．写出实验报告，分析实验结果。

四．实验条件计算机 Matlab软件五．实验步骤1．用Cool Edit 读入浊音语音，设置采样率为8kHz，16位，单声道。

2．将读入的语音wav文件保存为txt文件。

3．读入Matlab中，并且对照取不同矩形窗长N的短时修正自相关函数，画出图形。

六．实验程序及数据fid=fopen('zhuoyin.txt','rt')b=fscanf(fid,'%f');b1=b(1:320);N=160;A=[];for k=1:160;sum=0;for m=1:N;sum=sum+b1(m)*b1(m+k-1); endA(k)=sum;endfor k=1:160A1(k)=A(k)/A(1);endfigure(1)subplot(3,1,1)plot(A1);ylabel('R(k)')legend('N=160')axis([0,320,-1,1]);b2=b(1:200);N=100;B=[];for k=1:100;sum=0;for m=1:N;sum=sum+b2(m)*b2(m+k-1); endB(k)=sum;endfor k=1:100B1(k)=B(k)/B(1);endfigure(1)subplot(3,1,2)plot(B1);ylabel('R(k)')legend('N=100')axis([0,320,-1,1]);L=1;b3=b(1:140);N=70;C=[];for k=1:70;for m=1:N;sum=sum+b3(m)*b3(m+k-1); endC(k)=sum; endfor k=1:70C1(k)=C(k)/C(1); endfigure(1)subplot(3,1,3) plot(C1);ylabel('R(k)') legend('N=70')axis([0,320,-1,1]);050100150200250300-101R (k )N=160050100150200250300-101R (k )N=10050100150200250300-101R (k )N=70七．思考题1．在相同的实验环境下，用Matlab 程序实现语音的短时自相关的图形，并与修正的自相关进行比较，加深对修正自相关的理解。

语音信号处理实验指导书

语音信号处理实验指导书实验一：语音信号的采集与播放实验目的：了解语音信号的采集与播放过程，掌握采集设备的使用方法。

实验器材：1. 电脑2. 麦克风3. 扬声器或耳机实验步骤：1. 将麦克风插入电脑的麦克风插孔。

2. 打开电脑的录音软件（如Windows自带的录音机）。

3. 在录音软件中选择麦克风作为录音设备。

4. 点击录音按钮开始录音，讲话或唱歌几秒钟。

5. 点击停止按钮停止录音。

6. 播放刚刚录制的语音，检查录音效果。

7. 将扬声器或耳机插入电脑的音频输出插孔。

8. 打开电脑的音频播放软件（如Windows自带的媒体播放器）。

9. 选择要播放的语音文件，点击播放按钮。

10. 检查语音播放效果。

实验二：语音信号的分帧与加窗实验目的：了解语音信号的分帧和加窗过程，掌握分帧和加窗算法的实现方法。

实验器材：1. 电脑2. 麦克风3. 扬声器或耳机实验步骤：1. 使用实验一中的步骤1-5录制一段语音。

2. 将录制的语音信号进行分帧处理。

选择合适的帧长和帧移参数。

3. 对每一帧的语音信号应用汉明窗。

4. 将处理后的语音帧进行播放，检查分帧和加窗效果。

实验三：语音信号的频谱分析实验目的：了解语音信号的频谱分析过程，掌握频谱分析算法的实现方法。

实验器材：1. 电脑2. 麦克风3. 扬声器或耳机实验步骤：1. 使用实验一中的步骤1-5录制一段语音。

2. 将录制的语音信号进行分帧处理。

选择合适的帧长和帧移参数。

3. 对每一帧的语音信号应用汉明窗。

4. 对每一帧的语音信号进行快速傅里叶变换（FFT）得到频谱。

5. 将频谱绘制成图像，观察频谱的特征。

6. 对频谱进行谱减法处理，去除噪声。

7. 将处理后的语音帧进行播放，检查频谱分析效果。

实验四：语音信号的降噪处理实验目的：了解语音信号的降噪处理过程，掌握降噪算法的实现方法。

实验器材：1. 电脑2. 麦克风3. 扬声器或耳机实验步骤：1. 使用实验一中的步骤1-5录制一段带噪声的语音。

语音信号处理试验教程

语音信号处理试验实验一：语音信号时域分析实验目的：(1)录制两段语音信号，内容是“语音信号处理”，分男女声。

(2)对语音信号进行采样，观察采样后语音信号的时域波形。

实验步骤：1、使用window自带录音工具录制声音片段使用windows自带录音机录制语音文件，进行数字信号的采集。

启动录音机。

录制一段录音，录音停止后，文件存储器的后缀默认为.Wav。

将录制好文件保存，记录保存路径。

男生女生各录一段保存为test1.wav和test2.wav。

图1基于PC机语音信号采集过程。

2、读取语音信号在MATLAB软件平台下，利用wavread函数对语音信号进行采样，记住采样频率和采样点数。

通过使用wavread函数，理解采样、采样频率、采样位数等概念！Wavread函数调用格式：y=wavread（file），读取file所规定的wav文件，返回采样值放在向量y中。

[y，fs，nbits]=wavread（file），采样值放在向量y中，fs表示采样频率（hz），nbits表示采样位数。

y=wavread（file，N），读取前N点的采样值放在向量y中。

y=wavread（file，[N1，N2]）,读取从N1到N2点的采样值放在向量y中。

3、编程获取语音信号的抽样频率和采样位数。

语音信号为test1.wav和test2.wav，内容为“语音信号处理”，两端语音保存到工作空间work文件夹下。

在M文件中分别输入以下程序，可以分两次输入便于观察。

[y1,fs1,nbits1]=wavread('test1.wav')[y2,fs2,nbits2]=wavread('test2.wav')结果如下图所示根据结果可知：两端语音信号的采样频率为44100HZ，采样位数为16。

4、语音信号的时域分析语音信号的时域分析就是分析和提取语音信号的时域参数。

进行语音分析时，最先接触到并且夜市最直观的是它的时域波形。

语音信号处理实验指导书

语音信号处理实验指导书实验一语音信号采集与简单处理一、实验目的、要求（1）掌握语音信号采集的方法（2）掌握一种语音信号基音周期提取方法（3）掌握短时过零率计算方法（4）了解Matlab 的编程方法二、实验原理基本概念：（a ）短时过零率：短时内，信号跨越横轴的情况，对于连续信号，观察语音时域波形通过横轴的情况；对于离散信号，相邻的采样值具有不同的代数符号，也就是样点改变符号的次数。

对于语音信号，是宽带非平稳信号，应考察其短时平均过零率。

其中sgn[.]为符号函数⎪⎩⎪⎨⎧<=>=0 x(n)-1sgn(x(n))0 x(n)1sgn(x(n))短时平均过零的作用 1.区分清/浊音：浊音平均过零率低，集中在低频端；清音平均过零率高，集中在高频端。

2.从背景噪声中找出是否有语音，以及语音的起点。

（b ）基音周期基音是发浊音时声带震动所引起的周期性，而基音周期是指声带震动频率的倒数。

基音周期是语音信号的重要的参数之一，它描述语音激励源的一个重要特征，基音周期信息在多个领域有着广泛的应用，如语音识别、说话人识别、语音分析与综合以及低码率语音编码，发音系统疾病诊断、听觉残障者的语音指导等。

因为汉语是一种有调语言，基音的变化模式称为声调，它携带着非常重要的具有辨意作用的信息，有区别意义的功能，所以，基音的提取和估计对汉语更是一个十分重要的问题。

∑--=-=1)]1(sgn[)](sgn[21N m n n n m x m x Z由于人的声道的易变性及其声道持征的因人而异，而基音周期的范围又很宽，而同—个人在不同情态下发音的基音周期也不同，加之基音周期还受到单词发音音调的影响，因而基音周期的精确检测实际上是一件比较困难的事情。

基音提取的主要困难反映在：①声门激励信号并不是一个完全周期的序列，在语音的头、尾部并不具有声带振动那样的周期性，有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。

语音信号处理综合实验

语音信号处理综合实验电子信息科学与技术09380049 陈俊浩一：实验目的通过利用matlab设计仿真实验，理解如下知识点：1.信号的采样及混迭2.信号的频谱分析3.信号的幅度调制解调的方法4.理想滤波器的时频域特性5.数字滤波器的设计二：实验要求1.录制一段个人自己的语音信号2.采用合适的频率，对录制的信号进行采样，画出采样后语音信号的时域波形和频谱图3.给原始语音信号加噪声，画出加噪声后的语音信号和频谱图4.设计一个频域的理想带通信道5.对这语音信号进行幅度调制，画出调制后的语音信号和频谱图6.利用理想带通信道对信号进行传输7.对接受到的信号进行解调，画出解调后的语音信号和频谱图8.设计性能良好的滤波器对信号进行滤波9.对语音进行回放，并与滤波后的语音信号进行对比三：实验过程1．首先利用windows操作系统自带的录音机录取一段声音，保存为‘cjh.wav’；再利用wavread函数将这个语音文件读进matlab中，然后对这段语音进行采样，采样频率为fs=22050Hz，语音持续时间为2.5s,用sound函数听这段语音信号；2．用plot函数画出这段语音信号的时域波形，用fftshift函数对信号进行快速傅里叶变换，并调整y轴的幅度，画出原始信号的频谱图；3．为了给原始信号加噪声，用randn函数产生一段随机噪声，然后加到原始信号中，然后用sound函数听加了噪音以后的信号，和原始信号相对比，可听到有一些“沙沙”的噪声；用plot函数画出加了噪音以后的时域波形，然后再将其进行快速傅里叶变换，然后画出其频域波形4．直接用matlab的逻辑语句，设计一个理想的带通信号，其截至频率为fl=4000Hz,fh=8000Hz；5．设定载波频率，用matlab的modulate函数对其进行幅度调制，画出调制以后的信号的时域波形，然后再将其通过傅里叶变换，然后画出其频谱图；6．用matlab中的demod函数将已经调制以后的信号进行解调，在用和上述一致的方法画出解调以后的时域和频域波形；7．由于人的声音频率一般比较低，而且由画出来的原始信号的频域波形可知，信号的能量都集中在低频的范围，我们可以考虑设计一个低通滤波器对其进行滤波，然后将滤波以后的信号就行回放，与原始信号进行对比。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

语音信号处理试验
实验一：语音信号时域分析
实验目的：
(1)录制两段语音信号，内容是“语音信号处理”，分男女声。

(2)对语音信号进行采样，观察采样后语音信号的时域波形。

实验步骤：
1、使用window自带录音工具录制声音片段
使用windows自带录音机录制语音文件，进行数字信号的采集。

启动录音机。

录制一段录音，录音停止后，文件存储器的后缀默认为.Wav。

将录制好文件保存，记录保存路径。

男生女生各录一段保存为test1.wav和test2.wav。

图1基于PC机语音信号采集过程。

2、读取语音信号
在MATLAB软件平台下，利用wavread函数对语音信号进行采样，记住采样频率和采样点数。

通过使用wavread函数，理解采样、采样频率、采样位数等概念！
Wavread函数调用格式：
y=wavread（file），读取file所规定的wav文件，返回采样值放在向量y中。

[y，fs，nbits]=wavread（file），采样值放在向量y中，fs表示采样频率（hz），nbits表示采样位数。

y=wavread（file，N），读取前N点的采样值放在向量y中。

y=wavread（file，[N1，N2]）,读取从N1到N2点的采样值放在向量y中。

3、编程获取语音信号的抽样频率和采样位数。

语音信号为test1.wav和test2.wav，内容为“语音信号处理”，两端语音保存到工作空间work文件夹下。

在M文件中分别输入以下程序，可以分两次输入便于观察。

[y1,fs1,nbits1]=wavread('test1.wav')
[y2,fs2,nbits2]=wavread('test2.wav')
结果如下图所示
根据结果可知：两端语音信号的采样频率为44100HZ，采样位数为16。

4、语音信号的时域分析
语音信号的时域分析就是分析和提取语音信号的时域参数。

进行语音分析时，最先接触到并且夜市最直观的是它的时域波形。

语音信
号本身就是时域信号，因而时域分析是最早使用，也是应用最广泛的一种分析方法，这种方法直接利用语音信号的时域波形。

时域分析通常用于最基本的参数分析及应用，比如语音的分割、预处理、大分类。

这种分析方法的特点是：①表示语音信号比较直观、物理意义明确。

②实现起来比较简单、运算且少。

③可以得到语音的一些重要的参数。

④只使用示波器等通用设备，使用较为简单。

[y1,fs1,nbits1]=wavread('test1.wav');
sound(y1,fs1,nbits1);%回放语音信号
[y2,fs2,nbits2]=wavread('test2.wav');
sound(y2,fs2,nbits2);%回放语音信号
subplot(2,1,1);
plot(y1);title('原始信号1时域波形');
subplot(2,1,2);
plot(y2);title('原始信号2时域波形');
试验结果如下所示：
[y1,fs1,nbits1]=wavread('ah01.wav'); sound(y1,fs1,nbits1);%回放语音信号[y2,fs2,nbits2]=wavread('ah02.wav'); sound(y2,fs2,nbits2);%回放语音信号subplot(2,1,1);
plot(y1);title('原始信号1时域波形'); subplot(2,1,2);
plot(y2);title('原始信号2时域波形');计算频谱：
[y,fs,nbits]=wavread('rs');
sound(y,fs,nbits);%回放语音信号
N=length(y);%求出语音信号的长度
Y=fft(y,N);%傅里叶变换
subplot(2,1,1);
plot(y);title('原始信号时域波形');
subplot(2,1,2);
plot(abs(Y));
title('原始信号频谱')
函数说明：
Plot函数：
plot是最基本的二维绘图命令，在二维绘图中只要输入plot(a,b)这个命令，就可以画出一个以a为x轴，b为y轴的图形。

Subplot函数
使用方法：subplot（m,n,p）或者subplot（m n p）。

subplot是将多个图画到一个平面上的工具。

其中，m表示是图排成m行，n表示图排成n列，也就是整个figure中有n个图是排成一行的，一共m行，如果第一个数字是2就是表示2行图。

p是指你现在要把曲线画到figure中哪个图上，最后一个如果是1表示是从左到右第一个位置。

Wavread函数：
y=wavread（file），读取file所规定的wav文件，返回采样值放在向量y中。

[y，fs，nbits]=wavread（file），采样值放在向量y中，fs表示采样频率（hz），nbits表示采样位数。

y=wavread（file，N），读取前N点的采样值放在向量y中。

y=wavread（file，[N1，N2]）,读取从N1到N2点的采样值放在向量y中。

Sound函数：
sound
Convert vector into sound Syntax
sound(y,Fs)
sound(y)
sound(y,Fs,bits)
Descriptionsound(y,Fs)sends the signal in vector y(with sample frequency Fs)to the speaker on PC and most UNIX platforms.Values in y are assumed to be in the range.Values outside that range are clipped. Stereo sound is played on platforms that support it when y is an n-by-2 matrix.。