实验一显示语音信号的语谱图

合集下载

(完整word版)语音信号处理实验报告实验一

(完整word版)语音信号处理实验报告实验一

通信工程学院12级1班罗恒2012101032实验一语音信号的低通滤波和短时分析综合实验一、实验要求1、根据已有语音信号,设计一个低通滤波器,带宽为采样频率的四分之一,求输出信号;2、辨别原始语音信号与滤波器输出信号有何区别,说明原因;3、改变滤波器带宽,重复滤波实验,辨别语音信号的变化,说明原因;4、利用矩形窗和汉明窗对语音信号进行短时傅立叶分析,绘制语谱图并估计基音周期,分析两种窗函数对基音估计的影响;5、改变窗口长度,重复上一步,说明窗口长度对基音估计的影响。

二、实验目的1.在理论学习的基础上,进一步地理解和掌握语音信号低通滤波的意义,低通滤波分析的基本方法。

2.进一步理解和掌握语音信号不同的窗函数傅里叶变化对基音估计的影响。

三、实验设备1.PC机;2。

MATLAB软件环境;四、实验内容1。

上机前用Matlab语言完成程序编写工作.2。

程序应具有加窗(分帧)、绘制曲线等功能。

3.上机实验时先调试程序,通过后进行信号处理。

4.对录入的语音数据进行处理,并显示运行结果。

5。

改变滤波带宽,辨别与原始信号的区别。

6。

依据曲线对该语音段进行所需要的分析,并且作出结论。

7.改变窗的宽度(帧长),重复上面的分析内容。

五、实验原理及方法利用双线性变换设计IIR滤波器(巴特沃斯数字低通滤波器的设计),首先要设计出满足指标要求的模拟滤波器的传递函数Ha(s),然后由Ha(s)通过双线性变换可得所要设计的IIR滤波器的系统函数H(z)。

如果给定的指标为数字滤波器的指标,则首先要转换成模拟滤波器的技术指标,这里主要是边界频率Wp和Ws的转换,对ap和as指标不作变化。

边界频率的转换关系为∩=2/T tan(w/2).接着,按照模拟低通滤波器的技术指标根据相应设计公式求出滤波器的阶数N和3dB截止频率∩c ;根据阶数N查巴特沃斯归一化低通滤波器参数表,得到归一化传输函数Ha(p);最后,将p=s/ ∩c 代入Ha(p)去归一,得到实际的模拟滤波器传输函数Ha(s)。

第二章语谱图分析.

第二章语谱图分析.
因此人们致力于研究语音的时频分析特性,把和时序相关 的傅里叶分析的显示图形称为语谱图。
语谱图在1941年由贝尔实验室研究人员发明,它试图用三 维的方式显示语音频谱特性, 纵轴表示频率,横轴表示 时间,颜色的深浅表示特定频带的能量大小,语谱图的发 明是语音研究的一个里程碑,它将语音的许多特征直观的 呈现出来。
(3)时间分辨率高,可以清楚的看 到浊音共振峰时变过程
N=256
你 好 ” 窄 带 语 谱 图 灰 度 显 示 图
特点:(1)窗长长,可以 获得较高的频率分辨率。 (2)滤波器的带宽能在浊 音区分辨出每个谐波。(3) 语谱的谐波形式的结构在频 率方向清晰可见,并能看到 基音频率的时变过程。 22
N=2048
5
二、宽带语谱图的典型谱型
宽带语谱图的典型谱型: 宽横杠(Bar):代表元音的共振峰位置,表现为 图中与水平时间轴平行的较宽的黑杠,不同元音的 共振峰位置不同,根据宽带语谱图上各横杠的位置 可以区分不同的元音,不同人发音的第一共振峰位 置会不同,但其分布结构是相似的。
竖直条(spike)代表塞音(b,d,g,p,t,k)或塞 擦音(z,zh,j,c,ch,q),表现为图中与垂直频率轴 平行的较宽的黑条,在时间上持续时间很短,在频 率轴上集中区位置随不同的辅音而不同
Wideband spectrogram:给出共振峰频率 Narrowband spectrogram:基音周期及其谐波1112 13600500
400
300
200
100
0 0
10
20
30
40
50
60
70
N=1024 hamming window 幅度谱
600 500 400 300 200 100

语音信号处理(电气与电子工程学院)

语音信号处理(电气与电子工程学院)

四、实验条件
计算机、高分辨麦克、matlab 及相关软件。 五、实验步骤
可以使用已有工作空间文件也可以自己录制一段语音(录制方法见附加内容)
1、听一下 we_be10k(可用 sound) 2、使用函数 specgram_ex3p19.显示语谱图和语音波形。对比调用参数窗长 20ms (200 点)、帧间隔 1ms(10 点)和参数窗长 5ms(50 点)、帧间隔 1ms(10 点); 再对比窗长>20ms 或小于 5ms,以及帧间隔>1ms 时的语谱图说明宽带语谱图、窄 带语谱图与时频分辨率的关系及如何得到时频折中。
1-3
在自相关法中
1-1,1-3 变为
P
∑αk rn [i − k ] = rn [i − 0],i = 1, 2,3,...p
k =1
1-4
P
En = Rn [0] − ∑αk Rn [k ]
k =1
1-5
由 1-4 可列出方程组 1-6
⎛ ⎜ ⎜
Rn Rn
[0] [1]
Rn [1] Rn [0]
图2
图3
7
采用 MATLAB 中的录音函数 wavrecord()进行语音信号的录制。同样,选 择三种频率不同的采样率对同一语音信号进行采样,试听回放效果,进行比较。
二、实验涉及的 MATLAB 子函数 Wavrecord 功能:录制语音 调用格式: filename=wavrecord(N, fs, ‘dtype’);录制一段 N/fs 秒长度的语音信号,采样率为 fs Hz,缺省值为 11025Hz,dtype 是录制声音的数据类型。具体可通过 help wavrecord 命令查阅。 y=wavrecord(N, fs, ch);与上面语句不同的是最后一个参数,ch 是指录音的声 道,ch 为 1 是单声道,ch 为 2 是双声道。 Wavread 功能:把数据文件的声音数据赋给变量 x。 【x,fs,bits】=wavread(’filename’);把数据文件的声音数据赋给变量 x,同 时把 x 的采样频率 fs 和数据的位数 bits 放进 MATLAB 的工作空间。 Sound 功能:将变量 x 的数据转换成 MATLAB 的数据文件保存。 调用格式: Sound(x,fs,bits); Save 功能:将变量 x 的数据转换成 MATLAB 的数据文件保存。 调用格式: Save‘filename’x;将数据转换成文件名与‘filename’相同,扩展名为.mat 的数据并保存,以便用 MATLAB 的各种工具进行处理。

实验一 语音信号的采集及预处理(变换矩形窗函数为boxcar)(2)

实验一  语音信号的采集及预处理(变换矩形窗函数为boxcar)(2)

语音信号的采集及预处理1.语音信号的录音、读入、放音等[x,fs,nbit]=wavread('D:\2.wav'); %fs=10000,nbit=16y=soundview('D:\2.wav')2.语音信号的分帧程序:[x,fs,nbit]=wavread('D:\2.wav');len=256;inc=128;y=enframe(x,len,inc);figure;subplot(2,1,1),plot(x)subplot(2,1,2),plot(y)3.语音信号加窗:程序:N=256;w = window('rectangle',N);w1 = window('hamming',N);w2 = window('hanning',N);wvtool(w,w1,w2)4.预加重程序:[x,fs,nbit]=wavread('D:\2.wav');len=256;inc=128;y=enframe(x,len,inc);z=filter([1-0.9375],1,y)figure(2)subplot(2,1,1),plot(y)subplot(2,1,2),plot(z)语音信号的时域分析1.语音信号的录音、读入、放音等:利用函数wavread对语音信号进行采样,记住采样频率和采样点数,给出以下语音的波形图(2.wav)。

[Y,FS,NBITS]= wavread('D:\2.wav')X= wavread('D:\2.wav')plot(X)2.短时能量分析:(1)首先对语音信号预加重;(2)对预加重后的语音信号进行分帧,帧长取N=256各样值点,帧移取128个样值点;(3)求短时能量。

org=wavread('D:\2.wav')wgt=filter([1 -0.9375],1,org)w1=enframe(wgt,256,128)amp=sum(abs(w1),2)plot(amp)3.短时过零率分析:求语音信号的短时过零率。

语谱图分析 PPT

语谱图分析 PPT

彩色语谱图
发 “ah、”时得单元音 /a/
发 “eye”时得双元音 /ai/
发音 “real”
发音 “mean” 26
同一个人得语谱图
不同得讲话者 得语谱图具有 不同得“声 纹”。据此可 以区别说话人, 这与不同得人 有不同得指纹, 根据指纹可以 区别不同得人 就是一个道理。
27
5个不同发音者发音“0”得语谱图
分析中具有重要得实用价值,被称为“可视语言”
语谱图分析
语谱图中得花纹有横杠、乱纹与竖直条等
横杠就是与时间轴平行得几条黑色带纹,它们 就是共振峰,从横杠对应得频率与带宽可以确 定相应得共振峰频率与带宽
在一个语音段得语谱图中,有没有横杠出现就 是判断它就是否就是浊音得重要标志。
竖直条(又叫冲直条)就是语谱图中出现与时 间轴垂直得一条窄黑条。
语谱图在1941年由贝尔实验室研究人员发明,它试图用三 维得方式显示语音频谱特性, 纵轴表示频率,横轴表示时 间,颜色得深浅表示特定频带得能量大小,语谱图得发明就 是语音研究得一个里程碑,它将语音得许多特征直观得呈 现出来。
语谱图中显示了大量得与语音得语句特性有关得信息,它 综合了频谱图与时域波形得特点,明显地显示出语音频谱 随时间得变化情况,或者说就是一种动态得频谱。
31
汉语拼音“sou ke”得时间波
32

元音[ou]得频谱图
33
语音特性分析实例:Ten above in suburbs
34
35
36
37
38
39
辅音[s]得频谱
40
语音波形及特性
女声“她去无锡市”得时域波形图
41
对上段语音信号得分析:
❖ 这段语音得频率带宽为300-3400Hz ❖ 横轴为时间,纵轴为语音得幅度。 ❖ 采样频率为8kHz,持续时间为4s。 ❖ 时间轴压缩很短,只能瞧清该段语音得轮廓,

语音信号实验

语音信号实验

实验一语音信号的短时分析一、实验目的1.在理论学习的基础上,进一步地理解和掌握语音信号短时分析的意义,短时时域分析的基本方法。

2.进一步理解和掌握语音信号短时平均能量函数及短时平均过零数的计算方法和重要意义。

二、实验设备1.PC机;2.MATLAB软件环境。

三、实验内容1.上机前用Matlab语言完成程序编写工作。

2.程序应具有加窗(分帧)、绘制曲线等功能。

3.上机实验时先调试程序,通过后进行信号处理。

4.对录入的语音数据进行处理,并显示运行结果。

5.依据曲线对该语音段进行所需要的分析,并作出结论。

6.改变窗的宽度(帧长),重复上面的分析内容。

四、实验原理及方法一定时宽的语音信号,其能量的大小随时间有明显的变化。

其中清音段(以清音为主要成份的语音段),其能量比浊音段小得多。

短时过零数也可用于语音信号分析中,发浊音时,其语音能量约集中于3kHz以下,而发清音时,多数能量出现在较高频率上,可认为浊音时具有较低的平均过零数,而清音时具有较高的平均过零数,因而,对一短时语音段计算其短时平均能量及短时平均过零数,就可以较好地区分其中的清音段和浊音段,从而可判别句中清、浊音转变时刻,声母韵母的分界以及无声与有声的分界。

这在语音识别中有重要意义。

五、预习和实验报告要求1.预习课本有关内容,理解和掌握短时平均能量函数及短时平均过零数函数的意义及其计算方法。

2.参考Matlab有关资料,设计并编写出具有上述功能的程序。

六、上机实验报告要求1.报告中,实验目的、实验原理、实验步骤、方法等格式和内容的要求与其它实验相同。

2.画出求得的曲线,注明语音段和所用窗函数及其宽度。

阐述所作分析和判断的过程,提出依据,得出判断结论。

七、思考题1.语音信号短时平均能量及短时平均过零数分析的主要用途是什么?2.窗的宽度(帧长)的改变,对他的特性产生怎样的影响?八、程序说明Matlab编程实验步骤:1.新建M文件,扩展名为“.m”,编写程序;2.选择File/Save命令,将文件保存在F盘中;3.在Command Window窗中输入文件名,运行程序;Matlab部分函数语法格式:读wav文件:x=wavread(`filename`)数组a及b中元素相乘: a.*b创建图形窗口命令:figure绘图函数:plot(x)坐标轴:axis([xmin xmax ymin ymax])坐标轴注解:xlabel(`…`) ylabel(`…`)图例注解:legend( `…`)一阶高通滤波器:y=filter([1-0.09375],1,x)分帧函数:f=enframe(x,len,inc)x为输入语音信号,len指定了帧长,inc指定帧移,函数返回为n×len的一个矩阵,每一行都是一帧数据。

第二章语谱图


汉语拼音“sou ke”的时间波形
元音[ou]的频谱图
语音特性分析实例:Ten above in suburbs
辅音[s]的频谱
语音波形及特性 女声“他去无锡市”的时域波形图
对上段语音信号的分析:
❖ 这段语音的频率带宽为300-3400Hz ❖ 横轴为时间,纵轴为语音的幅度。 ❖ 采样频率为8kHz,持续时间为4s。 ❖ 时间轴压缩很短,只能看清该段语音的轮廓,无法辨识语音波形的具体细节。
10
20
30
40
50
60
70
N=1024 hamming window 幅度谱
600 500 400 300 200 100
0 0
10
20
30
40
50
60
70
1200 1000
800 600 400 200
0 0
10
20
30
40
50
60
70
N=2048 hamming window 幅度谱
1200 1000
“受用”语谱图
“ “
语谱图分析
你 好 ” 宽 带 语 谱 图 灰 度 显 示 图
你 好 ” 窄 带 语 谱 图 灰 度 显 示 图
特点:(1)窗长短,可以获得较高的时间分辨 率;(2)功率谱的谐波结构在频率轴方向被平 滑掉了,谐波间隙被填平了,因此在频域看不 出基音频率和频谱的谐波形式结构,但可以明 显的看成共振峰结构和语谱包络
彩色语谱图 发 “ah.”时的单元音 /a/
发音 “real”
发 “eye”时的双元音 /ai/ 发音 “mean”
同一个人的语谱图
不同的讲话者的语谱图 具有不同的“声纹”。 据此可以区别说话人, 这与不同的人有不同的 指纹,根据指纹可以区 别不同的人是一个道理。

语谱图

基于MATLAB的语音信号语谱图分析与显示姓名:陈胜学号:0212665一:实验要求1.采集语言信号,观察时域波形,理解其横纵坐标表示含义2.了解语音信号非平稳特点,对其时间、频率分析的特点3.利用MATLAB软件实时分析语音信号的语谱图二:实验流程图语音录制→数据读入程序→信号分帧加窗→信号波形显示→信号频谱显示→语谱图显示三:实验原理1.语音录制用windows自带的录音机,录取一段声音。

语音信号是一种典型的非平稳信号,但是其非平稳性是由发音器官的物理运动过程而产生的,此过程与声波振动的速度相比比较缓慢。

语谱图的产生基理由此得知,可以假定在10-30ms这样的短时间内是平稳的,傅里叶分析是分析线性系统和平稳信号状态特性的强有力的手段,而短时间傅里叶分析,也叫时间依赖傅里叶变换,就是在短时平稳的假定下,用稳态分析方法处理非平稳信号的一种方法。

2.数据读入程序即语音信号的采集,首先要将录制的wma文件转化为matlab可识别的wav文件,然后在matlab软件平台下,利用函数wavread对语音信号进行采样,采样频率一般为10Khz,记住采样频率和采样点数。

Wavread函数调用格式:Y=wavread(file),读取file所规定的wav文件,返回采样值放在向量y中。

[y,fs,nbits]=wavread(file),采样值放在向量y中,fs表示采样频率,nbits表示采样位数。

y=wavread(file,N),读取前N点的采样值放在向量y中。

y=wavread(file,[N1,N2]),读取从N1点到N2点的采样值放在向量y中。

3.信号分帧加窗分帧加窗函数:下面程序中采用的是hanning窗,根据要求还可选用hamming(N),blackman(N)及bartlett(N),其中N为窗长。

为了改善滤波器性能,尽可能使过渡带带宽窄一点,同时阻带衰减也要满足一定的要求,从而选择合适的N。

《语谱图分析》课件

04
语谱图分析方法需要具备一定的语音学和语言学知识,对于非专业人 士来说可能存在一定的门槛。
未来研究方向与展望
01
研究方向
02 深入研究语谱图分析方法在不同语言和方言中的 应用,提高其通用性和适应性。
03 加强语谱图分析方法与其他语音分析技术的融合 ,提高语音分析的精度和可靠性。
未来研究方向与展望
画图
将频域数据绘制成二维图形, 形成语谱图。
语谱图解读方法
观察ห้องสมุดไป่ตู้强分布
通过观察语谱图上的音强分布,可以了解语 音信号中各个频带的能量状况。
识别音段
通过观察语谱图上的音段特征,可以识别出 不同的音素或音节。
提取特征
从语谱图中提取出音高、音强、音长等语音 特征,用于后续的分析和处理。
语音合成
基于语谱图进行语音合成,生成与原始语音 相似的语音信号。
通过对语谱图的观察和分析,可以深入了解语音信号的特性,为语音处理和语音识别等领域的研究提供 有力支持。
音乐信号的语谱图分析
音乐信号的语谱图分析是语谱图分析中另一种重要的应用 ,通过对音乐信号进行傅里叶变换,得到音乐信号的频域 表示。
在音乐信号的语谱图中,可以观察到音乐的旋律、和声、 节奏以及音色等特征,这些特征对于音乐分类、音乐检索 以及音乐推荐等应用具有重要意义。
03
在环境监测领域中,通过对环境信号进行语谱图分析,可以了解环境中的噪声 、振动等特征,为环境保护和治理提供有力支持。
04 语谱图分析在语音识别中的应用
CHAPTER
语音识别的基本原理
语音信号的采集
01
通过麦克风等设备将声音转化为电信号,再经过数字化处理,
将连续的模拟信号转换为离散的数字信号。

用matlab实现录音以及语谱图的绘制

《语音信号处理》仿真作业院系电气与电子工程学院专业班级姓名学号指导教师2020 年3 月作业题目:语音采集与读写一、目的(1)了解matlab采集语音信号的原理与采用命令;(2)掌握基于matlab的语音文件的创建、读写等操作。

二、要求(1)利用matlab程序实现录音语音信号“你好,武汉欢迎你”,并保存为wuhan.wav文件。

(2)使用waveread函数读取wuhan.wav文件,并使用plot函数显示出来。

要求:横纵坐标带有标注,横轴的单位为秒(s),纵轴显示归一化后的数值。

三、具体步骤(包含原理、具体实现、结果对比等)1、基本原理利用matlab的语音工具箱进行录音,用电脑声卡进行声音捕获。

利用matlab打开录音的wav文件,对录音进行分析和归一化,并生成语谱图。

2、具体实现(步骤、代码)第一步,用matlab软件实现录音,并存储为wav文件,同时绘制语音数据波形,代码如下:recObj = audiorecorder;disp('Start speaking.')recordblocking(recObj, 5);%设置录音时间disp('End of Recording.');% 回放录音数据play(recObj);% 获取录音数据myRecording = getaudiodata(recObj);% 绘制录音数据波形plot(myRecording);%存储语音信号filename = 'G:\Desktop\专业学习教程\语音信号处理\wuhan.wav'; audiowrite(filename,myRecording,12000);第二步,读取wav文件并生成语谱图,代码如下:clear all;[x,sr]=audioread(' G:\Desktop\专业学习教程\语音信号处理\wuhan.wav'); %#ok<DWVRD> %sr为采样频率if (size(x,1)>size(x,2))x=x';ends=length(x);w=round(44*sr/1000); %窗长,取离44*sr/100最近的整数 n=w; %fft 的点数 ov=w/2; %50%的重叠 h=w-ov;% win=hanning(n)'; %哈宁窗 win=hamming(n)'; %汉明窗 c=1;ncols=1+fix((s-n)/h); %fix 函数是将(s-n)/h 的小数舎去 d=zeros((1+n/2),ncols); for b=0:h:(s-n)u=win.*x((b+1):(b+n)); t=fft(u);d(:,c)=t(1:(1+n/2))'; c=c+1; endtt=[0:h:(s-n)]/sr; ff=[0:(n/2)]*sr/n;imagesc(tt/1000,ff/1000,20*log10(abs(d))); colormap(gray); axis xy xlabel('时间/s'); ylabel('频率/kHz'); 3、实验结果说明语音数据波形 语谱图四、总结这次做了一些准备工作所以比较顺利,在语谱图的绘制过程中曾经忘了添加先前wav录音文件的具体位置导致编译失败,在matlab报错后可以仔细看看弹出的关于相关语句的解析,十分有助于更改错误并提高对语句的熟练程度。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验一显示语音信号的语谱图
一、实验目的
综合信号频谱分析和滤波器功能,对语音信号的频谱进行分析,并对信号含进行高通、低通滤波,实现信号特定处理功能。

加深信号处理理论在语音信号中的应用;理解语谱图与时频分辨率的关系。

二、实验原理
语谱图分析语音又称语谱分析,语谱图中显示了大量的与语音的语句特性有关的信息,它综合了频谱图和时域波形的优点,明显的显示出语音频谱随时间的变化情况。

语谱图实际上是一种动态的频谱。

窄带语谱图有良好的频率分辨率及较差的时间分辨率;而宽带语谱图具有良好的时间分辨率及较差的频率分辨率。

三、实验内容
实验数据为工作空间ex3M2.mat中数组we_be10k是单词“we”和“be”的语音波形(采样率为10000点/秒)。

1、听一下we_be10k(可用sound)
2、使用函数specgram_ex3p19.显示语谱图和语音波形。

对比调用参数窗长20ms(200点)、帧间隔1ms(10点)和参数窗长5ms(50点)、帧间隔1ms(10点);再对比窗长>20ms或小于5ms,以及帧间隔>1ms时的语谱图说明宽带语谱图、窄带语谱图与时频分辨率的关系及如何得到时频折中。

3、生成高通和低通滤波器,观察其频谱;对语音信号we_be进行滤波,听一下对比其效果。

四、实验结果
实验程序
语谱图和语音波形
低通滤波器频谱
高通滤波器频谱
结论:1、因频率分辨率随窗口宽度的增加而提高,但同时时间分辨率降低;如果窗口取短,频率分辨率下降,但时间分辨率提高。

由以上图可知:窄带语谱图有良好的频率分辨率及较差的时间分辨率,而宽带语谱图具有良好的时间分辨率及较差的频率分辨率。

窄带语谱图中的时间坐标方向表示的基因及其各次谐波;而宽带语谱图给出语音的共振峰平率及清辅音的能量汇集区。

2、因加窗的目的是要限制分析的时间以使其中的波形特性没有显著变化,因此想要得到时频折中,选用的窗函数应尽量满足a、频率分辨率高b、卷积后其他的频率成分产生的频谱泄露少。

海明窗在频率范围中的分辨率高,具有频谱泄露少的优点,频谱中高频分量弱、波动小,因而得到较平滑的谱。

3、通过低通滤波后,因虑掉了声音的高音调部分,因此声音音调较低,而通过高通滤波器后,虑掉了低音调部分声音,声音音调较高。

相关文档
最新文档