语音信号的同态滤波和倒谱分析.
7-语音信号的同态滤波和倒谱分析NEW10n

• 如果设语音信号为 x(n) ,则通过第一个卷积特征系统 ˆ ˆ D*[ ]变换为系统 x1 (n) + x 2 (n) ; ˆ ˆ • 设 x1 (n) 为声门激励信号, x2 (n) 为声道冲击响应,则 如果两者处于不同的位置,并且互不交替,那么,适当的 设计线性系统,便可将两者分开处理; • 或者是提取其中之一,而同时抑制另一个;
∗
D∗−1 [
]
• D*[ ]将两时间序列的卷积运算变为两时间序列的加法运算; • 具体而言, D*[ ]包括三步:①z变换将两时间序列的卷积变成 相应z变换之乘积;②采用对数运算将相乘的两个z变换变成它 们各自的对数的和;③逆z变换将z域转换回到时域; • 卷积特征系统D*[ ]如下图:
x1 (n) ∗ x2 (n) Ζ[
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
第四节 复倒谱的性质和计算方法
• 复倒谱的几个重要性质:证明过程略
ˆ (1)即使序列x(n)是有限长的,其复倒谱 x(n) 总是无
1 arg[ X ( N )] ⎧ 2 π N为奇数 r=⎨ 1 N −1 N +1 ⎩ 2π {arg[ X ( 2 )] + arg[ X ( 2 )]} N为偶数
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
浊音的倒谱分析实例
• 浊音倒谱分析如下图; 原信号
对数谱:DFT 后求对数,包 含慢变化包络 和快变化周期 性细致结构;
语音信号处理第3章-语音信号分析

0.54 0.46cos[2n /( N 1)], 0 n ( N 1) (n) 0, n else
信息科学与工程学院 东南大学
预处理
窗函数的形状和长度对短时参数特征影响 很大 1.窗口形状
时域:要减小时间窗两端的坡度,使窗口边缘 两端不引起急剧变化而平滑过渡到零,这样可 以使截取出的语音波形缓慢降为零,减小语音 帧的截断效应; 频域:要有较窄的3dB带宽以及较大的旁瓣衰 减(较小的边带最大值)。这里只以典型的矩形 窗和汉明窗为例进行比较。
0
20
40
60
80
100
120
140
160
0.1 0.05 0 -0.05 -0.1
0
20
40
60
80 k = -21
100
120
140
160
信息科学与工程学院
东南大学
0.1 0.05 0 -0.05 -0.1
0
20
40
60
80
100
120
140
160
0.1 0.05 0 -0.05 -0.1
0
20
信息科学与工程学院 东南大学
矩形窗与汉明窗的比较
窗类型
矩形窗 汉明窗
旁瓣峰值
-13 -41
主瓣宽度
4π/N 8π/N
最小阻带衰减
-21 -53
汉明窗的主瓣宽度比矩形窗大一倍,即带宽约增 加一倍,同时其带外衰减也比矩形窗大一倍多, 汉明窗比矩形窗更为合适。因此,对语音信号的 短时分析来说,窗口的形状是至关重要的。
信息科学与工程学院 东南大学
数字化和预处理
经过数字化和预处理过程,语音信号就已 经被分割成一帧一帧的加过窗函数的短时 平稳信号 对每一个短时语音帧,利用数字信号处理 技术来提取语音特征参数。
老师整理————语音信号处理复习知识点-11南理工

老师整理————语音信号处理复习知识点-11南理工§1.1 语音信号处理概述一、语音、语音信号处理的名词解释1、语音:是语言的声学表现,是声音和意义的结合体,是相互传递信息的重要手段,是人类最重要、最有效、最常用和最方便的交换信息的形式。
2、语音信号处理:是研究用数字信号处理技术对语音信号进行处理的一门学科,它是一门新兴的学科,同时又是综合性的多学科领域和涉及很广的交叉学科。
它与语音学、语言学、声学、认知科学、生理学、心理学有密切关系。
3、语音信号的数字处理的优点:第二页第四段二、语音学的名词解释语音学:与语音信号处理存在十分密切的关系,是研究言语过程的一门科学,它包括三个研究内容:发音器官在发音过程中的运动和语音的音位特性;语音的物理特性;以及听觉和语言感知。
§1.2 语音信号处理的发展概况1、语音编码:语音编码技术是伴随着语音信号的数字化而产生的,目前主要应用在数字语音通信领域。
2、语音合成:语音合成的目的是使计算机能像人一样说话。
3、语音识别:语音识别是使计算机判断出所说的话的内容。
§2.2 语音产生的过程一、语音、清音、浊音1、语音:声音是一种波,能被人耳听到,振动频率在20Hz-20kHz之间。
语音是声音的一种,它是由人的发音器官发出的、具有一定语法和意义的声音。
语音的振动频率最高可达15kHz左右。
2、浊音、清音:语音由声带振动或不经声带振动来产生,其中由声带振动产生的音统称为浊音,而不由声带振动产生的音统称为清音。
浊音中包括所有的元音和一些辅音,清音包括另一部分辅音。
二、语音的产生过程(人体发出声音的基本过程):人类的语音是由人体发音器官在大脑控制下的生理运动产生的。
空气从肺部排出形成气流,冲击声带,如果声带是紧绷的,则则形成准周期性脉冲的空气流,产生“浊音”。
若声带完全舒展,则形成摩擦音或爆破音。
经过声道调制的空气流最后从口或鼻腔辐射出来,形成语音。
语音信号的倒谱分析

因为
ˆ X ' (Z ) X ' (Z ) X (Z )
求复倒谱的一种有效的递推算法
ˆ Z[nx(n)] Z (nx(n))Z[ x(n)]
ˆ n( x(n)) {nx(n)} x(n)
n 1
l ˆ ˆ x(n) ( ) x(l ) x(n l ) x(n) x(0) l 0 n 可推导出: ˆ x ( n)
i 1
P
ˆ e(n) s(n) s(n) s(n) ai s(n i) ai s(n i)
i 1 i 0
P
P
线性预测原理
线性预测是目前分析语音信号的最有效的方法之一,分 析的结果是得到一组信号的全极点模型参数,所以又称 为信号参数模型法。 这个方法的基本思想是将被分析信号模型化,即用有限 数目的模型参数来描述信号中的信息,具体来说,将被 分析信号s(n)视为某系统(即模型)的输出,而系统的 输入,在s(n)为确定性信号是采用单位取样序列。在s(n) 为随机信号是采用白噪声序列。
Linear
Prediction
1947年维纳提出; 1967年板仓等人应用于语音分析与合成;
语音信号处理与分析的核心技术
提供了预测功能;
提供了声道模型和声道模型的参数估计方法;
基本思想:
语音样本之间存在相关性,一个语音信号的样本可 以用过去若干个样本的线性组合来逼近;
ˆ s ( n) a i s ( n i )
g jZ
j 0
Q
j
, A( Z ) ai Z i
i 0
P
g j 和ai都是实数,且a0 1。如果能有一种算法,可能根据已知的s (n) 正确的估计出这些参数,那么未知的系统V(Z)便可求得。由于 E ( Z )V ( Z ) S ( Z ),根据V ( Z )和S ( Z )便可以求得E(Z),从而全部解决 解卷的的问题。
语音信号的滤波与频谱分析

生物医学信号处理大作业题目:语音信号的滤波与频谱分析学生姓名学院名称精密仪器与光电子工程专业学号一、实验目的语音信号的滤波与频谱分析录制自己的一段语音:“天津大学精密仪器与光电子工程学院生物医学工程X班XXX, College of precision instrument and opto-electronics engineering, biomedical engineering”,时间控制在15秒到30秒左右;利用wavread 函数读入语言信号,记住采样频率。
二、实验过程(1)求原始语音信号的特征频带:可以分别对一定时间间隔内,求功率谱(傅里叶变换结果取模的平方)并画出功率谱。
(2)根据语音信号频谱特点,设计FIR或IIR滤波器,分别画出滤波器幅频和相频特性曲线。
说明滤波器特性参数。
用设计的滤波器对信号滤波,画出滤波后时域波形。
用sound 函数回放语音信号。
(3)求出特征频段语音信号随时间变化的曲线(每隔0.05秒求一次功率谱,连接成曲线)。
(4)选做:语谱图:横轴为时间,纵轴为频率,灰度值大小表示功率谱值的大小。
(提示,可以采用spectrogram函数)(1)读入语音文件并画出其时域波形和频域波形,实现加窗fft 并求出其功率谱。
clcclear all; close all;[x,Fs,bits]=wavread('C:\Users\刘冰\Desktop\数字信号处理\liubing');x0=x(:,1); %将采集来的语音信号转换为一个数组 sound(x0,Fs,bits); y=fft(x);figure;plot(x,’b’);title ('原始语音信号时域波形'); y1=fft(x0);y1=fftshift(y1); d = Fs/length(x);figure;plot([-Fs/2:d: Fs/2-d],abs(y1),’b’);title('原始语音信号的频域信号'); % 画出原始语音信号的频谱图123456789x 105-1-0.8-0.6-0.4-0.200.20.40.60.81原始语音信号时域波形N=length(x);w1 = window(@hann,N); w2 = window(@blackman,N); x1=x0.*w1; %对原始信号加汉宁窗处理 x2=x0.*w2; %对原始信号加布兰克曼窗处理 figure,plot(x1);title(加汉宁窗后的语音信号) %显示加窗后的时域语音信号 s=floor(length(x0)/Fs);%计算原始语音信号的时间长度,这里得到的结果是18秒,因为floor 是向下取整,所以信号的末尾一点会被去掉,但是因为最后一点没有声音信号,所以影响可以忽略。
语音信号处理课件第05章同态滤波及倒谱分析

快速傅里叶变换
快速傅里叶变换(FFT)在语音信 号处理中的应用和局限性。
小波分析
小波分析在语音信号处理中的优 势和不足。
谱包络估计
谱包络估计方法的优点和应用场 景。
总结回顾
总结本章所学的同态滤波、倒谱分析、自回归模型等知识点,提出问题和思 考建议,并展望下一章节的内容。
自回归模型
自回归模型的概念和基本原理,以及其在语音处理中的应用。
自回归模型介绍
解释自回归模型的基本概念和建模方法。
语音信号拟合
将自回归模型应用于语音信号拟合,展示拟合结果。
应用案例
列举自他信号处理方法
介绍常见的其他信号处理方法,并分析它们在语音信号处理中的优缺点。
语音谱图
同态滤波前后的语音谱图对比, 展示同态滤波的改善效果。
信号处理
同态滤波在实际语音信号处理中 的应用案例。
倒谱分析
倒谱分析的原理、方法,以及将其应用于语音信号分析的实例展示。
1
倒谱分析原理
介绍倒谱分析的基本原理和计算方法。
语音信号分析
2
倒谱分析在语音信号分析领域的应用案
例。
3
实际效果展示
通过音频示例,展示倒谱分析在语音信 号处理中的实际效果。
语音信号处理课件第05章 同态滤波及倒谱分析
本章将介绍同态滤波、倒谱分析、自回归模型等在语音信号处理中的应用。 通过丰富的图文展示,帮助您理解这些方法的原理和效果。
同态滤波
同态滤波的概念和原理,以及其在语音信号处理中的应用场景。通过实例展示同态滤波对语音信号的改善效果。
语音信号
示例语音信号,用于说明同态滤 波的效果。
第三章_语音信号的特征分析

作为短时过零率的一个改进参数,语音分析时更常 用的是短时过电平率(level-crossing rate)。
短时过电平率在区分清音和静音时很有用
利用过零率与过电平率区分清、浊音和静音
短时过零率 短时过电平率
清(U)、浊(V)、无声(S)的平均幅度(M)和过零率(Z) 的条件概率密度函数
浊音、清音、无声的短时特性
首先是窗的长度,无论什么形状的窗,长度N将起决定 性的作用。
N选得太大,不能保证每一帧的语音的平稳特性 N太小,不能保证信号的统计特性,容易产生统计噪声 对于频域分析而言,窗长N还直接决定了信号频谱的分辨率 对于语音信号,通常帧长应选择为一个语音帧包含有至少2个基音
周期为好。人的语音的基音周期值是变化的,从女性小孩的2ms到 老年男子的14ms(即基音频率为500Hz至70Hz),所以N的选择是 比较困难的。通常折衷的选择N为20~30ms。若采用频率为10KHz, 则相当于每帧的长度(即窗口序列的长度)约为200~300点为宜。 若采样频率为8KHz,相当于160~240点
几种常见的窗函数的波形
Matlab中,可以通过help window命令来查看怎么产生不同的窗
1 0.8 0.6 0.4 0.2
0 0
rectangular hamming hanning bartlett
50
100
150
200
250
几种不同的窗函数波形与频谱的比较
1
Hamming 0.8 哈明窗 0.6
判断语音信号的起点和终点的一种算法(续)
根据MH可判定输入语音中 的前后两个点 N~1和 N~,2 它们 之间肯定是语音段,但是语 音的精确起点、终点还要在 之前N~和1 之后仔N~2 细查找。 为此在设置一个低阈值参数 M平L均,幅由度M由向大前到找N~1 小,减当至短M时L 时可以确定点N1 。类似由 向后找,可以N~确2 定N2 。在 N1和N2之间仍能肯定是语 音段。
语音信号的同态滤波和倒谱分析

单击此处添加副标题
演讲人姓名
LPC系数 a1,a2,… ap
声道模拟 滤波器H(z) 线性预测滤波器Hl(z)
u(n)
线性预测滤波器Hl(z)
x(n)
2.同态信号处理的基本原理
01.
进行如下处理:
02.
特征系统D*[] 完成将卷积信号转化为加性信号的运算。
添加标题
逆特征系统D*-1[] ,恢复为卷积性信号。
添加标题
进行如下处理:
a.第一步和第三步的运算相同。 b.第二步不同,前者是对数运算,后者是指数运算。
(3)特征系统D*[]和逆特征系统D*-1[]的区别
Z
exp
Z-1
Z
ln
Z-1
x(n)
x(n)
^
x(n)
^
x(n)
添加标题
特征系统 D*[]
添加标题
x(n)
添加标题
验证一个时域信号经过同态处理,是否回到时域?
ln(.)
MFCC
DCT Y(l)
4.MFCC的应用
预处理
语音识别系统框图
特征 提取
模型库
测度 估计
单击此处添加文本具体内容
现有语音识别系统采用的最主要的两种语音特征包括:(1)线性预测倒谱参数(2)MFCC参数 后处理 输入 输出
MFCC系数考虑到了人耳的听觉特性,具有较好的识别性能。但是,由于它需要进行快速傅立叶变换,将语音信号由时域变换到频域上处理,因此其计算量和计算精度要求高,必须在DSP上完成。
1.Mel频率尺度
线性频率f
Mel频率 Mel(f)
Mel频率带宽随频率的增长而变化,在1000Hz以下,大致呈线性分布,带宽为100Hz左右,在1000Hz以上呈对数增长。将频谱通过24个三角滤波器,其中中心频率在1000Hz以上和以下的各12个。滤波器的中心频率间隔特点是在1000Hz以下为线性分布,1000Hz以上为等比数列分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、同态信号处理的基本原理 二、复倒谱和倒谱 三、语音信号两个卷积分量的复倒谱 四、语音信号倒谱 五、MEL频率倒谱参数(MFCC)
一、同态信号处理的基本原理 1.同态信号处理的作用
同态信号处理也称为同态滤波,实现将卷 积关系和乘积关系变换为求和关系的分离处
理。×,* +,将非线性信号处理变 为线性信号处理的过程。
(2)第二个子系统对加性信号进行所需要的线 性处理(满足线性叠加原理等)
yˆ(n) LTI [xˆ(n)] LTI [xˆ1 (n) xˆ2 (n)]
(3)第三个子系统是逆特征系统D*-1[],使其恢 复为卷积性信号。
(yˆ1()nZ)[yˆ (yˆn1 ()n] )Yˆyˆ(2
(n)
z)
☆复倒谱的傅立叶变换定义
xˆ(n) IFT [ln FT (x(n))] IFT [ Xˆ (e jw )]
N 1
X (e jw ) FT (x(n)) x(n)e jwn n0
x(n) IFT ( X (e jw )) 1 X (e jw )e jwn dw
2
FT [x(n)] X (e jw )
D*1[D*[x(n)]] x(n)
(1)Z[x(n)] X (z), (2) ln X (z), (3)Z 1[ln X (z)] (4)Z{Z 1[ln X (z)]} ln X (z), (5) exp{ln X (z)} X (z) (6)Z 1[ X (z)] x(n)
3.常见的同态信号处理系统
x(n) 特征系统 +
*
D*[]
线性系统
+
逆特征系统 y(n)Fra bibliotekD*-1[]
*
(1)第一个子系统特征系统D*[] 完成将卷积信 号转化为加性信号的运算。
x(n) x1(n) x2 (n) 进行如下处理:
(1)Z[x(n)] X (z) X1(z) X2(z) (2)ln X (z) ln X1(z) ln X2(z) Xˆ1(z) Xˆ 2(z) Xˆ (z) (3)Z 1[Xˆ (z)] Z 1[Xˆ1(z) Xˆ 2(z)] xˆ1(n) xˆ2(n) xˆ(n)
线性预测滤波 器Hl(z) LPC系数
a1,a2,… ap
输出 语音 x(n)
u(n)
线性预测滤波 器Hl(z)
x(n)
2.同态信号处理的基本原理
(1)特征系统D*[] 完成将卷积信号转化为加性信号的运算。
x(n) x1(n) x2 (n) 进行如下处理:
(1)Z[x(n)] X (z) X1(z) X 2(z) (2) ln X (z) ln X1(z) ln X 2(z) Xˆ1(z) Xˆ 2(z) Xˆ (z) (3)Z 1[Xˆ (z)] Z 1[Xˆ1(z) Xˆ 2 (z)] xˆ1(n) xˆ2 (n) xˆ(n)
进行如下处理:
Yˆ1 (z) Yˆ2 (z)
(2) exp(Yˆ(z)) Y (z) Y1 (z) Y2 (z)
(3) y(n) Z 1[Y1 (z) Y2 (z)] y1 (n) y2 (n)
二、复倒谱和倒谱
1.复倒频谱域和复倒谱 ^x(和n) 信^y(号n)也均是时域序列,可以证明,实
N 1
X (k) DFT(x(n)) x(n)WNnk n0
x(n)
IDFT( X (k))
1 N
N 1
X (k )WNnk
k 0
DFT[x(n)] X (k )
D*[]
:
Xˆ (k ) ln X (k )
xˆ(n) IDFT[ Xˆ (k )]
特征系统
Xˆ (k) DFT[xˆ(n)]
语音信号x(n)可视为声门激励信息u(n)及声道响 应脉冲响应h(n)的卷积:x(n)=u(n)*h(n)
通过处理可将语音信号的声门激励信息及声道响 应信息分离开来,从而求得声道共振特征和基音周 期。解卷积。
基音周期
冲激序列 发生器
随机噪声 发生器
清/浊开关 u(n)
增益G
声道模拟 滤波器H(z)
D*[]
:
Xˆ
(e
jw
)
ln
X
(e
jw
)
xˆ(n) IFT [ Xˆ (e jw )]
特征系统
Xˆ (e jw ) FT[xˆ(n)]
D*1[] :
X
(e
jw
)
exp[ Xˆ
(e
jw
)]
x(n) IFT[ X (e jw )]
逆特征系统
☆复倒谱的离散傅立叶变换定义
xˆ(n) IDFT [ln DFT (x(n))] IDFT [ Xˆ (k)]
(2)逆特征系统D*-1[] ,恢复为卷积性信号。
xˆ(n) xˆ1(n) xˆ2 (n) 进行如下处理:
(1)Z[xˆ(n)] Xˆ (z) Xˆ 1(z) Xˆ 2 (z) (2) exp(Xˆ (z)) X (z) X1(z) X 2 (z) (3)x(n) Z 1[ X1(z) X 2 (z)] x1(n) x2 (n)
D*1[ ] :
X
(k)
exp[Xˆ
(k)]
x(n) IDFT[ X (k)]
逆特征系统
求复倒谱
x(n)
Z
ln
x(n)
FT
ln
x(n) ln
DFT
Z-1
^x(n)
IFT ^x(n) IDFT ^x(n)
2. 复倒谱分析中的相位卷绕
xˆ(n) IFT[ln X (e j )] IFT[ Xˆ (e j )]
序列的复倒谱是一个实的时间序列,又称之为复 倒频谱域。 是x(n^x)(的n)复倒频谱,简称为复倒 谱,有时也称为对数复倒谱。同样 是y(^yn()n的) 复倒谱。
xˆ(n) Z 1[ ln Z(x(n))] Z 1[Xˆ(z)]
一般的,X(z)、Y(z)和 ^X、(z) 的^Y收(z)敛域包含 单位圆,则可将Z变换和反Z变换用傅立叶变换 或离散傅立叶变换来代替,有:
(3)特征系统D*[]和逆特征系统D*-1[]的区别
a.第一步和第三步的运算相同。 b.第二步不同,前者是对数运算,后者是指数 运算。
x(n)
Z
ln
Z-1
^x(n)
^x(n) Z
exp
Z-1
x(n)
验证一个时域信号经过同态处理,是否回到时域?
x(n) 特征系统 D*[]
逆特征系统 x(n) D*-1[]