实验1语音信号的时域和频域分析

合集下载

语音信号的时域特征分析

中北大学课程设计说明书学生姓名：蒋宝哲学号： 24学生姓名：瓮泽勇学号： 42学生姓名：侯战祎学号： 47学院：信息商务学院专业：电子信息工程题目：信息处理实践:语音信号的时域特征分析指导教师：徐美芳职称: 讲师2013 年 6 月 28 日中北大学课程设计任务书2012-2013 学年第二学期学院：信息商务学院专业：电子信息工程学生姓名：蒋宝哲学号： 24 学生姓名：瓮泽勇学号： 42 学生姓名：侯战祎学号： 47 课程设计题目：信息处理实践:语音信号的时域特征分析起迄日期： 2013年6 月7日～2013年6月 28 日课程设计地点：学院楼201实验室、510实验室、608实验室指导教师：徐美芳系主任：王浩全下达任务书日期: 2013 年 6 月 7 日课程设计任务书课程设计任务书语音信号的采集与分析摘要语音信号的采集与分析技术是一门涉及面很广的交叉科学，它的应用和发展与语音学、声音测量学、电子测量技术以及数字信号处理等学科紧密联系。

其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快，分析速度较以往也有了大幅度的高。

本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法，并通过PC机录制自己的一段声音，运用Matlab进行仿真分析，最后加入噪声进行滤波处理，比较滤波前后的变化。

关键词：语音信号，采集与分析， Matlab0 引言通过语音传递倍息是人类最重要、最有效、最常用和最方便的交换信息的形式。

语言是人类持有的功能．声音是人类常用的工具，是相互传递信息的最主要的手段。

因此，语音信号是人们构成思想疏通和感情交流的最主要的途径。

并且，由于语言和语音与人的智力活动密切相关，与社会文化和进步紧密相连，所以它具有最大的信息容量和最高的智能水平。

现在，人类已开始进入了信息化时代，用现代手段研究语音信号，使人们能更加有效地产生、传输、存储、获取和应用语音信息，这对于促进社会的发展具有十分重要的意义。

语音信号的时域及频域特征

10
(12)
当短时谱为使用 DFT 计算时，可以证明窗函数和插值函数需要满足一下条件：
r
h(n r ) w(r n pN ) ( p)

(13)
例如，我们可以特别地选择 W ( n) 为窗长为 N 的三角窗，而 h[ n] 为矩形窗，
1 n [0, N 1] h[ n] 0 其它
第一章语音信号的时域及频域特征
1. 语音信号的主要特点
1.1. 语音信号带宽
语音信号的带宽约为 5KHz ，主要能量集中在低频段。上图为一段语音信号语谱图。
1
1.2. 语音信号是典型的随机信号
1）人的每次发音过程都是一个随机过程。很难得到两次完全相同的发音样本。 2）在信号处理中，通常假设语音信号是短时平稳的。例如，可以认为在语音的浊音段部分，语音的二阶矩统计量是平稳的(在 5~10mS 内)，即二阶矩平稳，或称为宽平稳。
2
2. 语音信号的时域波形
图 1.
语音信号的波形（shi4）
3
图 2. 语音信号波形（shi4）的局部细节
4
2.1. 语音时域信号特征
2.1.1. 语音时域信号的特点
1）清音段：能量低，过零率高，波形特点有点像随机的噪声。这部分信号常与语音的辅音段对应。 2）浊音段：能量高，过零率低，波形具有周期性特点。所谓的短时平稳性质就是处于这个语音浊音（元音）段中。 3）过渡段：一般是指从辅音段向元音段信号变化之间的部分。信号变化快，是语音信号处理中最复杂、困难的部分。
r 取值为周期时刻采样分析短时谱，间隔为
h(n)
w( n)
T N 2。

N
h( n )
w(n)

数字语音信号处理教案

数字语音信号处理实验指导书前言语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科，是目前发展最为迅速的信息科学研究领域的核心技术之一。

通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。

同时，语言也是人与机器之间进行通信的重要工具，它是一种理想的人机通信方式，因而可为信息处理系统建立良好的人机交互环境，进一步推动计算机和其他智能机器的应用，提高社会的信息化程度。

语音信号处理是一门新兴的学科，同时又是综合性的多学科领域和涉及面很广的交叉学科。

虽然从事这一领域研究的人员主要来自信号与信息处理及计算机应用等学科，但是它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。

20世纪60年代中期形成的一系列数字信号处理的理论和算法，如数字滤波器、快速傅立叶变换（FFT）等是语音信号数字处理的理论和技术基础。

随着信息科学技术的飞速发展，语音信号处理取得了重大的进展：进入70年代之后，提出了用于语音信号的信息压缩和特征提取的线性预测技术（LPC），并已成为语音信号处理最强有力的工具，广泛应用于语音信号的分析、合成及各个应用领域，以及用于输入语音与参考样本之间时间匹配的动态规划方法；80年代初一种新的基于聚类分析的高效数据压缩技术—矢量量化（VQ）应用于语音信号处理中；而用隐马尔可夫模型（HMM）描述语音信号过程的产生是80年代语音信号处理技术的重大发展，目前HMM已构成了现代语音识别研究的重要基石。

近年来人工神经网络(ANN)的研究取得了迅速发展，语音信号处理的各项课题是促进其发展的重要动力之一，同时，它的许多成果也体现在有关语音信号处理的各项技术之中。

为了深入理解语音信号数字处理的基础理论、算法原理、研究方法和难点，根据数字语音信号处理教学大纲，结合课程建设的需求，我们编写了本实验参考书。

本本参考书针对教学大纲规定的四个研究设计型实验，每个实验给出了参考程序，目的是起一个抛砖引玉的作用，学生在学习过程中，可以针对某一个实验进行延伸的创新学习，比如说，语音端点的检测、语音共振峰提取、基于HMM或DTW的有限词汇或大词汇的特定人、非特定人的语音识别、识别率的提高（如何提高有噪环境下的识别率）、以及编码问题等，同时在学习中还可深入思考如何将有关的方法在嵌入式系统或DSP 下的实现问题等。

语音信号时域和频域通俗理解

语音信号时域和频域通俗理解语音信号是一种广泛使用的信号类型，它包含了人类声音的各种特征。

在理解语音信号时域和频域的表现时，首先需要理解这两个概念的基本含义。

时域：在时间域中，信号是按照时间顺序排列的一组值。

对于语音信号，每一帧或每个样本点都代表了声音在不同时刻的强度或幅度。

在语音信号处理中，时域分析通常涉及对这些样本点进行各种操作，如加权、过滤、卷积等。

时域分析可以揭示信号的瞬态特性，如声音的起始和结束，但其对频率成分的敏感性较低。

频域：在频域中，信号被转换成了频率成分的形式。

这意味着我们将信号分解为一系列不同频率的分量，每个分量都有其特定的幅度和相位。

在语音信号中，这些频率成分反映了声音的各个部分（如基频、谐波等）如何由不同的振动模式产生。

频域分析提供了对信号的全面理解，因为它能够揭示信号的能量如何分布在不同的频率上。

现在，让我们更深入地理解语音信号在时域和频域的表现：时域中的语音：当我们说话时，我们的声带会振动并产生声音。

这些振动会产生一系列的样本点，这些点在时间上按顺序排列。

如果我们观察这些样本点，我们可能会注意到声音的起始和结束，以及一些明显的变化。

但是，如果我们想了解更多关于声音的内容，比如它的基频或谐波结构，我们需要在频域中进行分析。

频域中的语音：当我们观察语音信号的频谱时，我们会看到一系列的频率成分。

这些成分可以代表基频、谐波以及其他声音特征。

例如，如果一个声音的主要成分是基频，那么我们可能会看到一个明显的峰值在低频区域。

如果一个声音包含多个谐波，我们可能会看到一系列更高或更低的频率成分。

了解这些频率成分可以帮助我们更好地理解声音的特征，比如音调、音量等。

总之，理解语音信号时域和频域的表现对于语音处理和通信等领域非常重要。

在时域中，我们关注声音的瞬态特性；而在频域中，我们关注声音的频率成分。

通过将信号从一种表示转换到另一种表示，我们可以更全面地了解和处理语音信号。

语音信号处理(电气与电子工程学院)

四、实验条件
计算机、高分辨麦克、matlab 及相关软件。五、实验步骤
可以使用已有工作空间文件也可以自己录制一段语音（录制方法见附加内容）
1、听一下 we_be10k（可用 sound） 2、使用函数 specgram_ex3p19.显示语谱图和语音波形。对比调用参数窗长 20ms （200 点）、帧间隔 1ms（10 点）和参数窗长 5ms（50 点）、帧间隔 1ms（10 点）；再对比窗长>20ms 或小于 5ms，以及帧间隔>1ms 时的语谱图说明宽带语谱图、窄带语谱图与时频分辨率的关系及如何得到时频折中。
1-3
在自相关法中
1-1，1-3 变为
P
∑αk rn [i − k ] = rn [i − 0],i = 1, 2,3,...p
k =1
1-4
P
En = Rn [0] − ∑αk Rn [k ]
k =1
1-5
由 1-4 可列出方程组 1-6
⎛ ⎜ ⎜
Rn Rn
[0] [1]
Rn [1] Rn [0]
图2
图3
7
采用 MATLAB 中的录音函数 wavrecord（）进行语音信号的录制。同样，选择三种频率不同的采样率对同一语音信号进行采样，试听回放效果，进行比较。
二、实验涉及的 MATLAB 子函数 Wavrecord 功能：录制语音调用格式： filename=wavrecord(N, fs, ‘dtype’);录制一段 N/fs 秒长度的语音信号，采样率为 fs Hz，缺省值为 11025Hz，dtype 是录制声音的数据类型。具体可通过 help wavrecord 命令查阅。 y=wavrecord(N, fs, ch)；与上面语句不同的是最后一个参数，ch 是指录音的声道，ch 为 1 是单声道，ch 为 2 是双声道。 Wavread 功能：把数据文件的声音数据赋给变量 x。【x，fs，bits】=wavread（’filename’）;把数据文件的声音数据赋给变量 x，同时把 x 的采样频率 fs 和数据的位数 bits 放进 MATLAB 的工作空间。 Sound 功能：将变量 x 的数据转换成 MATLAB 的数据文件保存。调用格式： Sound（x，fs，bits）； Save 功能：将变量 x 的数据转换成 MATLAB 的数据文件保存。调用格式： Save‘filename’x；将数据转换成文件名与‘filename’相同，扩展名为.mat 的数据并保存，以便用 MATLAB 的各种工具进行处理。

数字信号处理实验-音频信号处理

图1 任务一程序流程图1、音频信号采集道，只取第一个声道进行处理,接着使用sound函数以fs频率进行音频回放。

2、音频信号频域分析以采样间隔T划分时域并绘制出signal信号的时域波形；调用fft函数,对signal 进行快速傅里叶变换，用abs函数取傅里叶变换后结果的幅值进行幅频分析，绘制出频谱图。

在绘制频谱图时由于考虑到快速傅里叶变换的对称性，只取序列的前半部分进行观察分析。

3、音频信号分解为了实现音频信号的分解及合成，先对原信号的频谱图进行观察分析，发现原信号的主要能量集中在三个主要频率上，于是考虑用这三频率的正弦信号合成原信号。

为了求得这三个频率，先调用findpeaks函数找到频谱图上的各个局部极大值peak及其对应的位置locs,然后用sort对峰值点进行排序，找到最大的三个值，接着用find 函数找到这三个最大值在locs中的位置，也就知道了对应的频率。

这里有一个问题就是最小的峰值频率并不是在sort排序后的第三位而是在第四位，需要有一个调整；确定了主要谱线后，使用text函数进行峰值标注；4、音频信号合成接着将这三个谱线还原回时域正弦信号，幅度的比例等于对应频率上的幅度比例然后然后叠加，得到合成后的信号，绘制出时域波形，与原信号波形进行比较,接着对两个正弦信号进行fft,绘制出他们的频谱，然后对合成的信号进行fft,做出频谱图和原信号的频谱图进行比较.5、音频信号回放用sound函数进行原信号和合成信号的回放，比较差异。

实验内容二：任意音频信号的时域和频域分析及数字滤波器设计通过对任务具体内容的分析，可以建立出任务二程序框图如下，之后将对编程思想及思路进行介绍：图2任务二程序流程图1、音频信号采样自己录音频并另存为”ding.wav”后,先用audioread函数读取音频信号得到采样序列signal及对应采样频率fs,由于获取的音频信号是双声道，只取第一个声道进行处理。

2、时域采样使用audioread函数得到的采样序列signal及采样频率fs为过采样状态，此时我们对signal再进行等间隔采样，达到减少采样点数和降低采样频率的效果，进而实现合理采样状态signal2、fs2和欠采样状态signal1、fs1;使用sound函数分别对这两种采样状态进行回放。

语音信号处理实验报告

通信与信息工程学院信息处理综合实验报告班级：电子信息工程1502班指导教师：设计时间：2018/10/22-2018/11/23评语：通信与信息工程学院二〇一八年实验题目：语音信号分析与处理一、实验内容1. 设计内容利用MATLAB对采集的原始语音信号及加入人为干扰后的信号进行频谱分析，使用窗函数法设计滤波器滤除噪声、并恢复信号。

2．设计任务与要求1. 基本部分（1）录制语音信号并对其进行采样；画出采样后语音信号的时域波形和频谱图。

（2）对所录制的语音信号加入干扰噪声，并对加入噪声的信号进行频谱分析；画出加噪后信号的时域波形和频谱图。

（3）分别利用矩形窗、三角形窗、Hanning窗、Hamming窗及Blackman 窗几种函数设计数字滤波器滤除噪声，并画出各种函数所设计的滤波器的频率响应。

（4）画出使用几种滤波器滤波后信号时域波形和频谱，对滤波前后的信号、几种滤波器滤波后的信号进行对比，分析信号处理前后及使用不同滤波器的变化；回放语音信号。

2. 提高部分（5）录制一段音乐信号并对其进行采样；画出采样后语音信号的时域波形和频谱图。

（6）利用MATLAB产生一个不同于以上频段的信号；画出信号频谱图。

（7）将上述两段信号叠加，并加入干扰噪声，尝试多次逐渐加大噪声功率，对加入噪声的信号进行频谱分析；画出加噪后信号的时域波形和频谱图。

（8）选用一种合适的窗函数设计数字滤波器，画出滤波后音乐信号时域波形和频谱，对滤波前后的信号进行对比，回放音乐信号。

二、实验原理1.设计原理分析本设计主要是对语音信号的时频进行分析，并对语音信号加噪后设计滤波器对其进行滤波处理，对语音信号加噪声前后的频谱进行比较分析，对合成语音信号滤波前后进行频谱的分析比较。

首先用PC机WINDOWS下的录音机录制一段语音信号，并保存入MATLAB软件的根目录下，再运行MATLAB仿真软件把录制好的语音信号用audioread函数加载入MATLAB仿真软件的工作环境中，输入命令对语音信号进行时域，频谱变换。

语音信号处理_实验一_报告2

实验一语音信号的频域特性1. 观察语音信号的时域波形特点，总结其规律。

答：1）清音段：能量低，过零率高，波形特点有点像随机的噪声。

这部分信号常与语音的辅音段对应。

2）浊音段：能量高，过零率地，波形具有周期特点。

所谓的短时平稳性质就是处于这个语音浊音段中。

3）过渡段：一般是指从辅音段向元音段信号变化之间的部分。

信号变化快，是语音信号处理中最复杂、困难的部分。

2.总结清音b/p/m/f/d/t/n/l/g/k/h/j/q/x//z/c/s/zh/ch/sh/r/共21个的短时幅值、短时过零率和自相关函数的规律，估算这21个清音的平均短时幅值和平均短时过零率；答：加矩形窗的21个清音的平均短时幅值和平均短时过零率为下表：清音音节平均短时幅值平均短时过零率b 2.126 1.000p 0.706 9.100m 2.427 5.000f 0.685 1.500d 0.817 9.667t 1.168 1.000n 1.150 4.176l 2.084 6.200g 0.150 24.333k 0.959 7.333h 0.629 21.857j 0.129 13.000q 0.184 36.909x 0.168 21.400z 0.173 6.200c 0.785 7.294s 0.158 17.000zh 0.203 31.500ch 0.237 27.535sh 0.182 28.692r 1.814 5.5333. 总结浊音a/o/e/i/u/v/ao/ai/ei/ou/an/en/in/ang/eng/ong/ing/共17个的短时幅值、短时过零率和自相关函数的规律，估算这17个浊音的平均短时幅值和平均短时过零率，从自相关函数上估算这17个浊音的基音周期；答：浊音能量高，短时幅值也比较高，短时过零率比较低，由于浊音有一定的准周期性，所以自相关函数有比较明显的峰值和周期性。

浊音音节平均短时幅值平均短时过零率基音周期a 3.662 0.643 57o 2.948 0.184 71e 2.531 0.148 59i 1.693 0.061 60u 1.300 0.032 61v 1.081 0.024 66ao 2.000 0.123 71ai 2.307 0.121 57ei 1.828 0.074 67ou 0.294 0.000 67an 1.500 0.061 58en 1.827 0.073 54in 2.257 0.118 56ang 0.591 0.009 65eng 1.473 0.053 56ong 1.712 0.059 64ing 0.494 0.014 714. /r/、/m/、/n/ 从这几个音素的自相关函数图形判断为“清音”还是“浊音”，若为浊音估算其基音周期；答：（1）/r/: 自相关函数具有周期性，基音周期为67（样本点数）（2）/m/: 自相关函数具有周期性，基音周期为67（样本点数）（3）/n/ : 自相关函数具有周期性，基音周期为59（样本点数）可以看出/r/、/m/、/n/这几个因素的自相关函数图形有准周期性，并且有比较明显的峰值，所以为浊音。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

短时过零分析
过零就是信号通过零值。考察连续语音信号其时域波形通过时间轴的情
况。通过相邻取值改变符号判断是否过零，从而计
算过零数。单位时间内的过零数称为平均过零数。
对窄带信号，平均过零数计算比较简单。例：有一频率为f0的正弦信号，以取样频率fs进
行取样，则每个正弦周期内有fs/f0个取样，另外，每个正弦周期有二次过零，所以平均过零数为
四、实验报告要求
1、简述实验目的和实验原理； 2、matlab程序清单及结果图形； 3、实验结果分析
添加：VOICEBOX工具箱
解压voicebox.zip，将整个目录voicebox复制到MATLAB的安
装目录的TOOLBOX目录下，如:
c:\program files\MATLAB\r2007b\toolbox\ 将voicebox加到MATLAB的搜索路径中。 >> addpath(genpath(‘c:\program files\
窗口的长度：无论什么形状的窗口，窗口序列的长度N将起决定性的作用。
N太大，能量随时间变化很小，不能反映语音信号的幅度变化，波形的变化细节就看不出来；
N太小，滤波器的通带变宽，短时能量随时间有剧烈变化，不能得到平滑的能量函数。
窗口的选择（长度的确定）又需相对不同的基音周期来选择。通常情况下，一个语音帧内应含有1—7个基音周期。然而不同的人其基音周期变化范围很大，因此窗口宽度（N）的选择有一个折衷选择为100—200（即10—20ms持续时间）。
式子中 sgn[x(n)] 是符号函数，
sgn[x(n)] 1,1,xx((nn)) 00
W(n)为窗口序列，其作用于短时平均能量一样。
短时平均过零数的实现
首先对语音信号序列进行成对采样地查对采样以确定是否发生过零，若发生符号变化，则表示有一次过零，而后进行一阶差分计算，再求取绝对值，最后进行低通滤波。
实验一语音信号的时域和频域分析
一、实验目的
理解和掌握语音信号的数字化和预处理方法。理解短时能量分析、短时过零分析、短时相关
分析。语音信号的短时傅立叶分析方法。
二、实验原理
语音信号分析可分为时域、频域、倒谱域等方法。贯穿于语音分析全过程的是“短时分析技术”。
语音信号特性是随时间而变化的，是一个非平稳的随机过程。但从另一方面，在一个相对短时间范围内其特性基本保持不变。对于这种特点是语音信号处理的一个重要出发点。因此我们可以采用平稳过程的分析处理方法来处理语音。
绘制该语音信号短时平均能量
%读入声音文件 [x,fs]=wavread('c:\wang.wav');
%常数设置 FrameLen = 240; FrameInc = 80; %计算短时能量 amp = sum(abs(enframe(filter([1 -0.9375], 1, x),
FrameLen, FrameInc)), 2); subplot(1,2,1);plot(x);title('原波形图') subplot(1,2,2);plot(amp);title('短时平均能量图')
x),FrameLen1, FrameInc)), 2); subplot(5,1,2);plot(amp);title('短时平均能量图')
amp = sum(abs(enframe(filter([1 -0.9375], 1, x),FrameLen2, FrameInc)), 2);
subplot(5,1,3);plot(amp);title('短时平均能量图') amp = sum(abs(enframe(filter([1 -0.9375], 1,
x),FrameLen3, FrameInc)), 2); subplot(5,1,4);plot(amp);title('短时平均能量图') amp = sum(abs(enframe(filter([1 -0.9375], 1,
x),FrameLen4, FrameInc)), 2); subplot(5,1,5);plot(amp);title('短时平均能量图')
Z 2 f0 fs
借助平均过零数及取样频率可精确算出频率。
对于语音信号序列是宽带信号，所以不能简单地用上面的公式计算频率。但是，可借助短时平均过零数来
得到其频谱的粗略估计。
语音信号的短时平均过零数定义为
Zn|sgn[x(m)]sgn[x(m1)]|w(nm)
|sgn[x(m)]sgn[x(m1)]|*w(n)
例：任选一段语音信号，对其进行采样，画出采样以后的时域波形。
[x1,fs]=wavread('c:\wang.wav'); %读取语音信号
sound(x1,fs);
%播放语音信号
plot(x1)
%做原始语音信号的时域图形
title('原始语音信号');
xlabel('time');
ylabel('windows');
时域分析
时域分析是语音分析中最早使用，应用范围最广的一种方法。
特点： 1、表示语音信号比较直观。（语音信号本
身就是时域信号） 2、实现简单、运算量小。 3、可以得到语音的一些重要参数。
常用短时分析技术
短时能量短时平均幅度短时过零率短时自相关函数短时平均幅度差函数短时频谱短时功率谱
短时能量分析
能量分析是基于语音信号能量随时间有相当大的变化，特别是清音段的能量一般比浊音段的小得多。
短时分析将语音流分为一段一段来处理，每一段称为一“帧”。
用有限长窗函数进行加权来实现。
En [x(m)w(nm)]2
不同的窗口选择（形状、长度），将决定短时能量的特性。
窗口的形状：窗口有多种形状，他们都是中心对称的。
当选择不同长度的窗时的短时能量
[x,fs]=wavread('c:\wang.wav'); FrameLen1 = 51; FrameLen2 = 101; FrameLen3 = 201; FrameLen4 = 401; FrameInc = 80; subplot(5,1,1);plot(x);title('原波形图') amp = sum(abs(enframe(filter([1 -0.9375], 1,