1第一章语音信号处理实验解析

合集下载

语音信号处理实验报告.docx

语音信号处理实验报告.docx
在浊音清音对比中,可以发现,对呈现谐波特征的浊音语音谱来说这个特点很明显,就是在谐波成分处LPC谱匹配信号谱的效果要远比谐波之间好得多。
在实验中,当P值增加到一定程度,预测平方误差的改善就不很明显了,而且会增加计算量,一般取为8~14,这里P取为10。
5.基音周期估计
①自互相关函数法
②短时平均幅度差法
二.实验过程
1. 系统结构
2.仿真结果
(1)时域分析
男声及女声(蓝色为时域信号,红色为每一帧的能量,绿色为每一帧的过零率)
某一帧的自相关函数
3.频域分析
①一帧信号的倒谱分析和FFT及LPC分析
②男声和女声的倒谱分析
③浊音和清音的倒谱分析
④浊音和清音的FFT分析和LPC分析(红色为FFT图像,绿色为LPC图像)
从男声女声的时域信号对比图中可以看出,女音信号在高频率分布得更多,女声信号在高频段的能量分布更多,并且女声有较高的过零率,这是因为语音信号中的高频段有较高的过零率。
2.频域分析
这里对信号进行快速傅里叶变换(FFT),可以发现,当窗口函数不同,傅里叶变换的结果也不相同。根据信号的时宽带宽之积为一常数这一性质,可以知道窗口宽度与主瓣宽度成反比,N越大,主瓣越窄。汉明窗在频谱范围中的分辨率较高,而且旁瓣的衰减大,具有频谱泄露少的有点,所以在实验中采用的是具有较小上下冲的汉明窗。
三.实验结果分析
1.时域分析
实验中采用的是汉明窗,窗的长度对能否由短时能量反应语音信号的变化起着决定性影响。这里窗长合适,En能够反应语音信号幅度变化。同时,从图像可以看出,En可以作为区分浊音和清音的特征参数。
短时过零率表示一帧语音中语音信号波形穿过横轴(零电平)的次数。从图中可以看出,短时能量和过零率可以近似为互补的情况,短时能量大的地方过零率小,短时能量小的地方过零率较大。从浊音和清音的时域分析可以看出,清音过零率高,浊音过零率低。

(完整word版)语音信号处理实验报告实验一

(完整word版)语音信号处理实验报告实验一

通信工程学院12级1班罗恒2012101032实验一语音信号的低通滤波和短时分析综合实验一、实验要求1、根据已有语音信号,设计一个低通滤波器,带宽为采样频率的四分之一,求输出信号;2、辨别原始语音信号与滤波器输出信号有何区别,说明原因;3、改变滤波器带宽,重复滤波实验,辨别语音信号的变化,说明原因;4、利用矩形窗和汉明窗对语音信号进行短时傅立叶分析,绘制语谱图并估计基音周期,分析两种窗函数对基音估计的影响;5、改变窗口长度,重复上一步,说明窗口长度对基音估计的影响。

二、实验目的1.在理论学习的基础上,进一步地理解和掌握语音信号低通滤波的意义,低通滤波分析的基本方法。

2.进一步理解和掌握语音信号不同的窗函数傅里叶变化对基音估计的影响。

三、实验设备1.PC机;2。

MATLAB软件环境;四、实验内容1。

上机前用Matlab语言完成程序编写工作.2。

程序应具有加窗(分帧)、绘制曲线等功能。

3.上机实验时先调试程序,通过后进行信号处理。

4.对录入的语音数据进行处理,并显示运行结果。

5。

改变滤波带宽,辨别与原始信号的区别。

6。

依据曲线对该语音段进行所需要的分析,并且作出结论。

7.改变窗的宽度(帧长),重复上面的分析内容。

五、实验原理及方法利用双线性变换设计IIR滤波器(巴特沃斯数字低通滤波器的设计),首先要设计出满足指标要求的模拟滤波器的传递函数Ha(s),然后由Ha(s)通过双线性变换可得所要设计的IIR滤波器的系统函数H(z)。

如果给定的指标为数字滤波器的指标,则首先要转换成模拟滤波器的技术指标,这里主要是边界频率Wp和Ws的转换,对ap和as指标不作变化。

边界频率的转换关系为∩=2/T tan(w/2).接着,按照模拟低通滤波器的技术指标根据相应设计公式求出滤波器的阶数N和3dB截止频率∩c ;根据阶数N查巴特沃斯归一化低通滤波器参数表,得到归一化传输函数Ha(p);最后,将p=s/ ∩c 代入Ha(p)去归一,得到实际的模拟滤波器传输函数Ha(s)。

语音信号处理实验报告

语音信号处理实验报告

语音信号处理实验报告——语音信号分析实验一.实验目的及原理语音信号分析是语音信号处理的前提和基础,只有分析出可表示语音信号本质特征的参数,才有可能利用这些参数进行高效的语音通信、语音合成和语音识别等处理,并且语音合成的音质好坏和语音识别率的高低,都取决于对语音信号分析的准确性和精确性。

贯穿语音分析全过程的是“短时分析技术”。

因为从整体来看,语音信号的特性及表征其本质特征的参数均是随时间变化的,所以它是一个非平稳态过程,但是在一个短时间范围内(一般认为在10~30ms的时间内),其特性基本保持不变,即相对稳定,可将其看做一个准稳态过程,即语音信号具有短时平稳性。

所以要将语音信号分帧来分析其特征参数,帧长一般取为10ms~30ms。

二.实验过程1.2. 仿真结果(1) 时域分析男声及女声(蓝色为时域信号,红色为每一帧的能量,绿色为每一帧的过零率)x 104-0.6-0.4-0.200.20.40.60.81x 105-0.4-0.200.20.40.60.811.2某一帧的自相关函数-1-0.8-0.6-0.4-0.200.20.40.60.813. 频域分析①一帧信号的倒谱分析和FFT 及LPC 分析对应的倒谱系数:119.2,-7.6895,……对应的LPC 预测系数:1,-0.1,-0.02,-0.4,-0.27,……②男声和女声的倒谱分析③浊音和清音的倒谱分析原语音波形一帧语音波形一帧语音的倒谱④浊音和清音的FFT分析和LPC分析(红色为FFT图像,绿色为LPC图像)三.实验结果分析1.时域分析实验中采用的是汉明窗,窗的长度对能否由短时能量反应语音信号的变化起着决定性影响。

这里窗长合适,En能够反应语音信号幅度变化。

同时,从图像可以看出,En可以作为区分浊音和清音的特征参数。

短时过零率表示一帧语音中语音信号波形穿过横轴(零电平)的次数。

从图中可以看出,短时能量和过零率可以近似为互补的情况,短时能量大的地方过零率小,短时能量小的地方过零率较大。

语音信号处理实验讲义

语音信号处理实验讲义
sum=0;
for m=1:N
sum=sum+b1(m)*b1(m+k-1);
end
A(k)=sum;
end
for k=1:320
A1(k)=A(k)/A(1);
end
%画图
figure(1)
subplot(3,1,1)
plot(A1);
xlabel('延时k')
ylabel('R(k)')
legend('N=320')
e=fra(256,128,x);
ee=e(20,:);
subplot(2,2,1)
ee1=ee/max(ee);
plot(ee1)
xlabel('样点数')
ylabel('幅度')
title('原始语音')
axis([0,256,-1.5,1.5])
%矩形窗傅立叶变换
r=fft(ee,1024);
axis([0,320,-0.5,1])
图2-2 修正的自相关函数(参加自相关运算的点数N取不同值)
四、思考题
1、自相关函数的作用是什么?互相关函数的作用是什么?
2、浊音信号分别加矩形窗和汉明窗时自相关函数有什么不同?
3、清音信号的自相关函数和浊音信号的有什么区别?
实验三语音信号频域特征分析
一、实验目的
plot(s2)
title('一帧语音信号');
xlabel('样点数');
ylabel('幅度');
axis([0,320,-1,1]);
subplot(3,1,2)

语音信号信号处理实验报告

语音信号信号处理实验报告

语音信号信号处理实验报告实验一语音信号的端点检测一、实验目的1、掌握短时能量的求解方法2、掌握短时平均过零率的求解方法3、掌握利用短时平均过零率和短时能量等特征,对输入的语音信号进行端点检测。

二、仪器设备 HP计算机、Matlab软件三、实验原理 3.1、短时能量3.1.1、原理:语音信号能量随时间有相当大的变化,特别是清音段的能量一般比浊音段的小得多。

语音信号的短时能量定义:xw(n)?w(n)?x(n)0?m?N?10?n?N?1?1w(n)?? 其它?0n?N?1 2En??xw(m) m?n3.1.2、短时能量序列反映了语音振幅或能量随着时间缓慢变化的规律。

从原始语音信号图中可以看到语音信号幅度随时间有相当大的变化,特别是清音段的幅度一般比浊音段的幅度小很多,语音信号的短时能量给出了反映这些幅度变化的一个合适的描述方法。

3.1.3、短时平均幅度函数和能量函数的作用 (1)区分清/浊音。

En、Mn大,对应浊音; En、Mn小,对应清音。

其中Mn是短时幅度差。

(2)在信噪比高的情况下,能进行有声/无声判决。

无声时,背景噪声的En、Mn小;有声时,En、Mn显著增大。

判决时可设置一个门限。

(3)大致能定出浊音变为清音的时刻,或反之。

3.2、短时过零率:3.2.1、定义:过零就是信号通过零值。

连续语音信号,考察其时域波形通过时间轴的情况;离散时间信号,相邻的值改变符号则称为过零。

n?N?11 Z?sgn[xw(m)]?sgn[xw(m?1)] n2m?n x(n)?0?1sgn[x(n)]????1x(n)?0窄带信号,平均过零数作为信号频率的一种简单度量是很精确的,语音信号序列是宽带信号,则不能简单用上面的公式,但是可以用短时平均过零数来得到频谱的粗略估计。

3.2.2、短时过零分析的意义:(1)、可以区分清音与浊音:浊音时具有较低的平均过零数,而清音时具有较高的平均过零数。

(2)、利用它可以从背景噪声中找出语音信号,可用于判断寂静无语音和有语音的起点和终点位置。

语音信号处理第一章绪论

语音信号处理第一章绪论

语⾳信号处理第⼀章绪论第⼀章绪论1、语⾳信号?语⾳信号是具有声⾳的语⾔,⼈类表⽰信息的常⽤媒体,⼈类通信的有效⼯具。

2、语⾳信号包含的信息?1)说话内容,说什么;2)说话⼈⾝份,谁说的;3)说话⼈说话时的状态,⽣理状态、⼼理状态、情绪等。

(语⾳信号处理主要关⼼前两项)3、为什么要学习和研究语⾳信号处理技术?答:1)语⾳是⼈类最重要、最有效、最常⽤和最⽅便的交换信息的⽅式;2)让计算机能够理解⼈类的语⾔,是⼈类⾃计算机诞⽣以来就梦寐以求的想法;随着计算机的便携化,⼈们渴望摆脱键盘的束缚⽽代之以语⾳输⼊的⽅式。

⽐如苹果公司的iphone⼿机,在其最新版本4s中,推出了siri功能-即语⾳助⼿,可以通过语⾳输⼊,让其充当闹钟,⽐如还可以让它为你找出最近的咖啡厅,另外找出⾏路线往往需要输⼊不少⽂字,省事的话,报出地点,它可以调⽤google地图来找出出⾏⽅案,还可以让它播放⾳乐,发送短信等等。

3)语⾳信号技术始终与当时信息科学最活跃的前沿科学保持密切联系,并且⼀起发展。

语⾳信号处理是以语⾳语⾔学和数字信号处理为基础的涉及多⽅⾯的综合性学科,它与⼼理学、⽣理学、计算机科学、通信与信息科学以及模式识别和⼈⼯智能等学科都有着密切的关系。

对于语⾳信号处理的研究⼀直是数字信号处理技术发展的重要推进⼒量,⽽数字信号处理许多新⽅法的提出,⼜是⾸先在语⾳信号处理中获得成功,⽽后再推⼴到其他领域的。

⽐如,语⾳信号处理算法的复杂性和实时处理的要求,促进了⾼速信号处理器的设计。

⽽这些产品产⽣之后,⼜是⾸先在语⾳信号处理中得到最有效的应⽤的。

4、语⾳信号处理的发展情况1)语⾳信号处理的发展标志是在1940年产⽣的通道声码器技术,该技术打破了以往的“波形原则”,提出了⼀种全新的语⾳通信技术,即从语⾳中提取参数加以传输,在接收端重新合成语⾳。

其后,产⽣了“语⾳参数模型“的思想。

2)40年代后期,研制成功了“语谱仪”,为语⾳信号分析提供了有⼒的⼯具。

《语音信号处理》讲稿第1章

《语音信号处理》讲稿第1章
别。
05 语音信号处理的挑战与展 望
语音信号处理的挑战
噪声干扰
语音信号在采集、传输和处理过程中容易受到各种噪声的干扰,如 环境噪声、设备噪声等,导致语音质量下降。
多变性
语音信号具有极大的多变性,不同人的发音、语速、语调等差异较 大,给语音信号处理带来很大的挑战。
实时性要求
许多语音信号处理应用需要实时处理,如语音识别、语音合成等,对 算法的复杂度和处理速度要求较高。
语音信号的基本特征
01 02
时域特征
语音信号在时域上表现为振幅随时间变化的波形。时域特征包括短时能 量、短时过零率、短时自相关函数等,用于描述语音信号的幅度、频率 和周期性等特性。
频域特征
语音信号在频域上表现为不同频率成分的分布。频域特征包括频谱、功 率谱、倒谱等,用于描述语音信号的频率结构、共振峰和声学特性等。
倒谱分析
对语音信号的频谱进行对数运算后, 再进行傅里叶反变换,得到倒谱系 数,用于语音合成、说话人识别等。
倒谱分析方法
线性预测倒谱系数(LPCC)
01
基于线性预测模型的倒谱系数,用于描述语音信号的声道特性。
梅尔频率倒谱系数(MFCC)
02
基于人耳听觉特性的倒谱系数,具有较好的抗噪性和鲁棒性,
广泛应用于语音识别、说话人识别等领域。
基音周期和基音频率
反映语音信号的周期性特征,是语音信号处理中 的重要参数。
语音信号的识别技术
模板匹配法
将待识别语音与预先存储的模板 进行比较,选取最相似的模板作
为识别结果。
随机模型法
利用统计模型来描述语音信号的 特征,通过模型参数的训练和识
别来实现语音信号的识别。
人工智能方法
包括神经网络、支持向量机、深 度学习等方法,通过训练和学习 来建立语音信号与语义之间的映 射关系,实现语音信号的智能识

语音信号处理_实验一_报告2

语音信号处理_实验一_报告2

实验一语音信号的频域特性1. 观察语音信号的时域波形特点,总结其规律。

答:1)清音段:能量低,过零率高,波形特点有点像随机的噪声。

这部分信号常与语音的辅音段对应。

2)浊音段:能量高,过零率地,波形具有周期特点。

所谓的短时平稳性质就是处于这个语音浊音段中。

3)过渡段:一般是指从辅音段向元音段信号变化之间的部分。

信号变化快,是语音信号处理中最复杂、困难的部分。

2.总结清音b/p/m/f/d/t/n/l/g/k/h/j/q/x//z/c/s/zh/ch/sh/r/共21个的短时幅值、短时过零率和自相关函数的规律,估算这21个清音的平均短时幅值和平均短时过零率;答:加矩形窗的21个清音的平均短时幅值和平均短时过零率为下表:清音音节平均短时幅值平均短时过零率b 2.126 1.000p 0.706 9.100m 2.427 5.000f 0.685 1.500d 0.817 9.667t 1.168 1.000n 1.150 4.176l 2.084 6.200g 0.150 24.333k 0.959 7.333h 0.629 21.857j 0.129 13.000q 0.184 36.909x 0.168 21.400z 0.173 6.200c 0.785 7.294s 0.158 17.000zh 0.203 31.500ch 0.237 27.535sh 0.182 28.692r 1.814 5.5333. 总结浊音a/o/e/i/u/v/ao/ai/ei/ou/an/en/in/ang/eng/ong/ing/共17个的短时幅值、短时过零率和自相关函数的规律,估算这17个浊音的平均短时幅值和平均短时过零率,从自相关函数上估算这17个浊音的基音周期;答:浊音能量高,短时幅值也比较高,短时过零率比较低,由于浊音有一定的准周期性,所以自相关函数有比较明显的峰值和周期性。

浊音音节平均短时幅值平均短时过零率基音周期a 3.662 0.643 57o 2.948 0.184 71e 2.531 0.148 59i 1.693 0.061 60u 1.300 0.032 61v 1.081 0.024 66ao 2.000 0.123 71ai 2.307 0.121 57ei 1.828 0.074 67ou 0.294 0.000 67an 1.500 0.061 58en 1.827 0.073 54in 2.257 0.118 56ang 0.591 0.009 65eng 1.473 0.053 56ong 1.712 0.059 64ing 0.494 0.014 714. /r/、/m/、/n/ 从这几个音素的自相关函数图形判断为“清音”还是“浊音”,若为浊音估算其基音周期;答:(1)/r/: 自相关函数具有周期性,基音周期为67(样本点数)(2)/m/: 自相关函数具有周期性,基音周期为67(样本点数)(3)/n/ : 自相关函数具有周期性,基音周期为59(样本点数)可以看出/r/、/m/、/n/这几个因素的自相关函数图形有准周期性,并且有比较明显的峰值,所以为浊音。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
21
语音和语言
一、语音的定义 语音是人类发音器官发出的、具有一定意义的、能起信 息交流作用的声音;由一连串的音所组成,是组成语 言的声音。 语音 (Speech):

语音是人类最重要、最有效、最方便的交换信息
其它信息 20% 图像信息 语音信息 其它信息
语音信息 20%
图像信息 60%
人类从大自然获取信息的分布图
19
语音信号处理基本概念



语音信号处理是以语音、语言学和数字信号处理为基 础而形成的一门涉及面很广的综合性学科,与生理学、 心理学、计算机科学、人工智能、数学等学科有密切 的关系。 语音信号处理是研究用数字信号处理技术对语音信号 进行处理的一门学科。其目的是要得到一些反应语音 信号重要特征的语音参数,或者通过某种运算的处理 达到某种用途的要求。 例如:
10


语音合成

以语言信息压缩、存储为主要目的对语音信号 数字模型进行研究,同时研究音素、音节、词 组与句子的发音规则。最终恢复出自然流畅的 语音来。例如文语转换系统(Text-to-speech)。 语音分析与合成将赋予计算机说话的功能。也 是进行话音编码、语音识别研究的基础。

11
语音识别

1972 年 CCITT 组织公布了第一个语音编码标准 G.711— 对数 PCM 编码,从此,数字程控交换网络淘汰了传统的模拟交换传输方式。 1988 年欧共体 13 个国家数字移动特别工作组 (GSM) 制定了采用长 时预测规则码激励的编码标准(13k bps RPE-LTP);1989年美国蜂 窝通信工业协会(CITA)宣布了北美数字移动通信话音编码标准 (8K bps矢量和激励VSELP)。 VoIP技术:是通过TCP/IP网络,在网络上对压缩的语音数据以数 据包的形式进行传输,而通常称之为IP电话技术;所用的话音编码 标准有G.723.1、G.728、G.729等。
采集: wavrecord 转换: wavread 播放:soundview 滤波:filter 自相关: xcorr 语谱图: specgram;specgramdemo 同态滤波:cceps,rceps 线性预测: lpc
17
第一篇 语音信号处理基础
第一章 语音及其产生和感知过程
18
语音信号处理概述
12
语音识别

根据对说话人说话方式的要求,可以分为孤立 字语音识别系统,连接字语音识别系统以及连 续语音识别系统。 根据对说话人的依赖程度可以分为特定人和非 特定人语音识别系统。 根据词汇量大小,可以分为小词汇量、中等词 汇量、大词汇量以及无限词汇量语音识别系统。
13


语音信号的数字处理方法
1 语音信号的特点—短时平稳性 2 短时时域处理方法—短时能量、短时平均过 零率以及短时自相关函数计算 3 短时频域分析—短时傅立叶分析 4 线性预测技术—本质上属于时域分析方法, 但其结果可以是频域参数 5 倒谱和同态分析、矢量量化和隐马尔可夫模 型

研究如何使计算机能够听懂人类的语言。



以汉语语音为例:汉语约有400个音节,加上 声调约1330个音调节,把这些语音信号的特征 存储到计算机内,并与计算机接收到的汉语发 音进行比较,找到特征相同的音节或音调节, 这个过程就是语音识别。 将识别出的音节序列转换成文字,就是语言理 解。 许多算法将理解过程溶入到识别中来提高识别 的准确性。因此可以将语音识别与理解归入同 一类应用。
14
语音信号的特点—短时平稳性
ห้องสมุดไป่ตู้
15
语音处理过程的结构框图
语音输入
模型特征参数 反混叠滤波 数模转换 分析
预处理
数字化
特征提取
传输 解压缩 语音输出 压缩处理 合成 存储
语音识别 训练
参考模式库 识别结果
识别 模式匹配
图1.2
语音处理过程的结构框图
16
实验学习工具:Matlab



高效的传输或存储 人工合成出语音 辨识出说话者 识别讲话的内容等。 语音编码 语音合成 语音识别
20
语音信号处理的研究内容

研究包括两个方面:


从语音的产生和感知进行研究。 将语音作为一种信号来处理。



基础知识 :声学,语言学,语用学,语音生产/ 感知 信号分析:时域,频谱,倒谱,线性预测参数 算法:无声检测(背景噪声),浊音-清音,基 音周期检测,共振峰估计 应用:编码,合成,识别,理解,验证,语言 翻译,加速/减速
第二章 语音信号处理的基础知识
2.1 概 述 2.2 语音产生的过程 2.3 语音信号的特性 2.4 语音信号产生的数字模型 2.5 语音感知
7
第二篇 语音信号分析
第三章 语音信号的时域分析 第四章 语音信号的短时傅里叶分析 第五章 语音信号的同态滤及倒谱分析 第六章 语音信号的线性预测分析 第七章 语音信号的矢量量化 第七章 语音信号的矢量量化 第八章 隐马尔可夫模型 第九章 语音检测分析
8
第三篇 语音信号处理技术与应用
第十章 语音编码(一)--波形编码 第十一章 语音编码(二)--声码器技术及混合编码 第十二章 语音合成 第十三章 语音识别 第十四章 说话人识别 第十五章 语音增强
9
语音编码的应用:

在保证一定语音质量的前提下,尽可能降低编码比特率, 以节省频率资源。例如:音符,乐谱。 在移动通信、卫星通信、军事保密通信和IP电话通信中 的应用:
5
课程内容
第一部分 语音信号处理的基础知识
第二部分 语音信号分析
时域分析、短时傅里叶分析、同态滤波及倒谱分析、 线性预测分析、矢量量化、语音基音和共振峰检 测
第三部分 语音信号处理技术与应用
语音编码 语音合成 语音识别 语音增强
6
第一篇 语音信号处理基础
第一章 绪 论
1.1 语音信号处理概述 1.2 语音信号处理的发展概况 1.3 本书的内容
语音信号处理实验
绪论
1
基础实验(12学时)
语言信号处理工具
短时时域分析
短时频域分析
线性预测编码(LPC)分析
基音与端点检测
共振峰检测
2
综合实验(8学时)


语音编码 语言合成 语音增强 语音识别
3
教材
胡航 .《语音信号处理》(第4版) 哈尔滨工业大学出版社
4
参考书

赵力《语音信号处理》机械工业出版社 《离散时间语音信号处理(原理与应用)》(美) 夸特尔瑞(Quatieri,T.F.)著,赵胜辉等译、电 子工业出版社
相关文档
最新文档