语音信号的倒谱分析共62页

合集下载

语音信号处理PPT_第三章_语音信号分析

语音信号处理PPT_第三章_语音信号分析

En

xn (m )
2
m 0
T[x]=x2
短时能量及短时平均幅度分析

En是一个度量语音信号幅度值变化的函数,但它有一个缺陷,即 它对高电平非常敏感(因为它计算时用的是信号的平方)。为此, 可采用另一个度量语音信号幅度值变化的函数,即短时平均幅度 N 1 函数Mn,它定义为:
M
n


xn (m )
它与12位线性转换器等效。
预处理




由于语音信号的平均功率谱受声门激励和口鼻辐射影响,高频端 大约在800Hz以上按6dB /倍频程跌落,要在预处理中进行预加重 (Preemphasis)处理。 预加重目的: 提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整 个频带中,能用同样的信噪比求频谱,以便于频谱分析或声道参 数分析。 预加重可在语音信号数字化时在反混叠滤波器之前进行,不仅可 以进行预加重,而且可以压缩吸纳后的动态范围,有效提高信噪 比。 预加重一般在语音信号数字化之后,利用数字滤波器实现: 1 H (z) 1 z 值接近1。
S N R ( d B ) 6 .0 2 B 7 .2
x2 X S N R ( d B ) 1 0 lg 2 6 .0 2 B 4 .7 7 2 0 lg m a x e x


A/D转换器分为线性和非线性转换器两类。 目前的线性A/D转换器绝大部分是12bits的(即每一个采样 脉冲转换为12位二进制数)。非线性A/D转换器则是8位的,
n n
短时相关分析
右图中:N=401,Fs=8kHz a、b是浊音信号,c位清 音信号,由图可以看出浊 音信号的自相关函数具有 一定得周期性,而清音信 号的自相关函数缺乏周期 性。

7-语音信号的同态滤波和倒谱分析NEW10n

7-语音信号的同态滤波和倒谱分析NEW10n

• 如果设语音信号为 x(n) ,则通过第一个卷积特征系统 ˆ ˆ D*[ ]变换为系统 x1 (n) + x 2 (n) ; ˆ ˆ • 设 x1 (n) 为声门激励信号, x2 (n) 为声道冲击响应,则 如果两者处于不同的位置,并且互不交替,那么,适当的 设计线性系统,便可将两者分开处理; • 或者是提取其中之一,而同时抑制另一个;

D∗−1 [
]
• D*[ ]将两时间序列的卷积运算变为两时间序列的加法运算; • 具体而言, D*[ ]包括三步:①z变换将两时间序列的卷积变成 相应z变换之乘积;②采用对数运算将相乘的两个z变换变成它 们各自的对数的和;③逆z变换将z域转换回到时域; • 卷积特征系统D*[ ]如下图:
x1 (n) ∗ x2 (n) Ζ[
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
第四节 复倒谱的性质和计算方法
• 复倒谱的几个重要性质:证明过程略
ˆ (1)即使序列x(n)是有限长的,其复倒谱 x(n) 总是无
1 arg[ X ( N )] ⎧ 2 π N为奇数 r=⎨ 1 N −1 N +1 ⎩ 2π {arg[ X ( 2 )] + arg[ X ( 2 )]} N为偶数
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
浊音的倒谱分析实例
• 浊音倒谱分析如下图; 原信号
对数谱:DFT 后求对数,包 含慢变化包络 和快变化周期 性细致结构;

语音信号的倒谱分析

语音信号的倒谱分析

因为
ˆ X ' (Z ) X ' (Z ) X (Z )
求复倒谱的一种有效的递推算法
ˆ Z[nx(n)] Z (nx(n))Z[ x(n)]
ˆ n( x(n)) {nx(n)} x(n)
n 1
l ˆ ˆ x(n) ( ) x(l ) x(n l ) x(n) x(0) l 0 n 可推导出: ˆ x ( n)
i 1
P
ˆ e(n) s(n) s(n) s(n) ai s(n i) ai s(n i)
i 1 i 0
P
P
线性预测原理


线性预测是目前分析语音信号的最有效的方法之一,分 析的结果是得到一组信号的全极点模型参数,所以又称 为信号参数模型法。 这个方法的基本思想是将被分析信号模型化,即用有限 数目的模型参数来描述信号中的信息,具体来说,将被 分析信号s(n)视为某系统(即模型)的输出,而系统的 输入,在s(n)为确定性信号是采用单位取样序列。在s(n) 为随机信号是采用白噪声序列。
Linear
Prediction
1947年维纳提出; 1967年板仓等人应用于语音分析与合成;
语音信号处理与分析的核心技术
提供了预测功能;
提供了声道模型和声道模型的参数估计方法;
基本思想:
语音样本之间存在相关性,一个语音信号的样本可 以用过去若干个样本的线性组合来逼近;
ˆ s ( n) a i s ( n i )
g jZ
j 0
Q
j
, A( Z ) ai Z i
i 0
P
g j 和ai都是实数,且a0 1。如果能有一种算法,可能根据已知的s (n) 正确的估计出这些参数,那么未知的系统V(Z)便可求得。由于 E ( Z )V ( Z ) S ( Z ),根据V ( Z )和S ( Z )便可以求得E(Z),从而全部解决 解卷的的问题。

实验三 语音信号的mel频率倒谱参数

实验三 语音信号的mel频率倒谱参数

实验四 语音信号的mel 频率倒谱参数1 实验目的通过Matlab 编程掌握语音信号的mel 频率倒谱参数的求解方法。

2 实验原理人耳听到声音的高低与声音的频率成对数关系,即:Mel(f)=2595lg(1+f/700),实际频率f 的单位是Hz.根据Zwicker 的工作,临界频率带宽随着频率的变化而变化,并与Mel 频率的增长一致。

类似与临界带的划分,可以将语音频率划分成一系列三角形的滤波器序列,如下图所示.取每个三角形的滤波器频率带宽内所有信号幅度加权和作为某个带通滤波器的输出,然后对所有滤波器输出做对数运算,再进一步做离散余弦变换得到MFCC 。

具体步骤如下:(1)三角滤波器的输出则为此频率带宽内所有信号幅度谱加权和。

()()()()()()()|()||()|()()()()c l h l n n k o l k c l k o l h l k Y l X k X k c l o l h l c l ==--=+--∑∑l = 1,2,....,40(2)对所有滤波器输出作对数运算ln(())Y l l = 1,2,....,40(3)作离散余弦变换(DCT )得到Mel 频率倒谱参数(MFCC)。

2411ln(())cos[()]224i l C Y l i l π==-∑i = 1,2,...,P ,P 为MFCC 参数的阶数,取P =16。

3 实验过程4 实验结果[x,fs,bits]=wavread('c:\WINDOWS\Media\chimes.wav');x=x(:,1);x=x';len=length(x);N=256;M=128;Fn=fix((len-N)/M+1);y=[];for i=1:Fndown=1+(i-1)*M;up=down+N-1;temp=x(down:up);temp=temp.*hamming(N)';y=[y;temp];endL=40;R=16;k=0:N/2;f=fs/N*k;%ÕâÀï²»ÒªÔÙ³ýÒÔ2mel=2595*log(1+f/700);%melm=max(mel)melm=2595*log(1+fs/1400);r=0:L+1;tri=melm/(L+1)*r;s=[];for j=1:Fntemp1=y(j,:);p=abs(fft(temp1));for l=1:Ltri1=[tri(l),tri(l+1),tri(l+2)];low=find((mel>=tri1(1))&(mel<=tri1(2)));high=find((mel>=tri1(2))&(mel<=tri1(3)));w=[(mel(low)-tri1(1))/(tri1(2)-tri1(1)),(tri1(3)-mel(high))/(tri1(3)-tri1(2))];%ÕâÀﶪÁËÀ¨ºÅ£¬²¢ÇÒ±äÁ¿Ãû×Ö¸ã´í%tri3=tri(3)%tri2=tri(2)% w2=(tri(3)-mel(high))/(tri(3)-tri(2))m(l)=sum(w.*p([low,high]),2);endl=1:L;for q=1:Rc(q)=sqrt(2/N)*sum(log(m).*cos((l-0.5)*q*pi/L),2);ends=[s;c];endplot(s')%³ÌÐò±àдʱעÒâ±äÁ¿µÄÃû³Æ¸ãÇå³þ£¬²»ÒªÈ¡Ïà½üµÄÃû×Ö¡£À¨ºÅ²»ÒªÂ©µô¡£。

语音信号处理课件 第05章同态滤波及倒谱分析

语音信号处理课件  第05章同态滤波及倒谱分析
N p −1
M

k
5.4 语音信号两个卷积分量复倒谱的性质
ˆ ˆ 3) 对 X ( z ) 进 行 逆 z 变 换 得 到 x ( n ) : ˆ x(n) = Z 令βk
5.4 语音信号两个卷积分量复倒谱的性质
语音信号可看作是声门激励信号和声道冲激响应 的卷积 1.声门激励信号的复倒谱:(主要分析浊音激励)
x(n) =
∑α
r =0
M
r
δ ( n − rN p ) , M 和 r 均 为 正 整 数
且 0 ≤ r ≤ M , α r为 幅 度 因 子 ,N p为 用 样 点 数 表 示 的 基 音 周 期 。 ˆ 求 x(n) : 1) X ( z ) =
第5章 语音的同态滤波及倒谱分析
5.1 5.2 5.3 5.4 5.5 5.6 概述 同态信号处理的基本原理 复倒谱和倒谱 语音信号两个卷积分量复倒谱的性质 避免相位卷绕的算法 语音信号的复倒谱分析实例
5.1 概述
在这一章中讨论的同态处理方法是一种非线性方法. 它能将两个信号通过乘法合成的信号或通过卷积合 成的信号分开.
两个特征系统(它们只取决于信号的组合规则)
第一个系统以若干信号的卷积组合作为其输入,并将它变 换成对应输出的相加性组合。 第二个系统是一个普通线性系统,它服从叠加原理。
一个线性系统(它仅取决于处理的要求)。
第三个系统是第一个系统的逆变换,即它将信号的相加性 组合反变换为卷积组合。
这种同态系统的重要性在于,可以使这种系统的设计简化 为线性系统的设计问题。
5.1 概述
广义叠加原理
小四边形表示输入矢量之间的运算、小三角形表示输入矢量与 标量之间的运算、小圆形表示输出矢量之间的运算、小菱形表 示输出矢量与标量之间的运算。 输入矢量之间的运算和输出矢量之间的运算可以为: 加法、 乘法或卷积等运算。 输入矢量或输出矢量与标量之间的运算可以为: 乘法、幂或开方等运算

倒谱分析

倒谱分析




(2).倒频谱的应用
分离信息通道对信号的影响
图2.26对数功率谱关系图。

在机械状态监测和故障诊断中,所测得的信号,往往是由故障源经系统路径的传输而得到的响应,也就是说它不是原故障点的信号,如欲得到该源信号,必须删除传递通道的影响。

如在噪声测量时,所测得之信号,不仅有源信号而且又有不同方向反射回来的回声信号的混入,要提取源信号,也必须删除回声的干扰信号。

若系统的输入为x(t),输出为y(t),脉冲响应函数是h(t),两者的时域关系为: y(t)=x(t)*h(t)
频域为: Y(f)=X(f)*H(f)或Sy(f)=Sx(f)*|H(f)|2
对上式两边取对数,则有:
(2.11)
式(2.72)关系如图(2.26)所示,源信号为具有明显周期特征的信号,经过系统特性logGk(f)的影响修正,合成而得输出信号logGy(f)。

对于(2.72)式进一步作傅里叶变换,即可得幅值倒频谱:
(2.12)
即:
(2.13)
以上推导可知,信号在时域可以利用x(t)与h(t)的卷积求输出;在频域则变成X(f)与H(f)的乘积关系;而在倒频域则变成Cx(q)和Ch(q)相加的关系,使系统
特特性Ch(q)与信号特性Cx(q)明显区别开来,这对清除传递通道的影响很有用处,而用功率谱处理就很难实现。

图(2.26b)即为相应的倒频谱图。

从图上清楚地表明有两个组成部分:一部分是高倒频率q2,反映源信号特征;另一部分是低倒频率q1,反映系统的特性。

两部分在倒频谱图上占有不同的倒频率范围,根据需要可以将信号与系统的影响分开,可以删除以保留源信号。

语音信号处理PPT_第三章_语音信号分析

语音信号处理PPT_第三章_语音信号分析

3.2 数字化和预处理
➢ 语音信号的数字化一般包括放大及增益控制、反混叠滤波、
采样、A/D变换及编码(一般就是PCM码);如下图:
语音信号
带通滤 波器
自动增益控制 (AGC)
模/数转换 (A/D)
脉冲编码 调 制 ( PCM )
存入计算机
➢ 预处理一般包括预加重、加窗和分帧等。 ➢ 分析和处理之前必须把要分析的要分析的语音信号部分从输
② R n (是k )偶函数 ,即 Rn(k)Rn(k)
③ 当k=0时,自相关函数有最大值,即 Rn(0)Rn(k)
并且 等R于n (确0 ) 定性信号序列的能量或随机序列的平均功率。
短时相关分析
右图中:N=401, Fs=8kHz a、b是浊音信号,c位清 音信号,由图可以看出浊 音信号的自相关函数具有 一定得周期性,而清音信 号的自相关函数缺乏周期 性。
但是在一个短时间范围内(一般认为在10-30ms的短时间内), 其特性基本保持不变即相对稳定,因而可以将其看作是一个准稳 态过程,即语音信号具有短时平稳性。
不论是分析怎么样的参数以及采用什么分析方法,在按帧进 行语音分析,提取语音参数之前,有一些经常使用的、共同的短 时分析技术必须预先进行,如语音信号的数字化、语音信号的端 点检测、预加重、加窗和分帧等,这些也是不可忽视的语音信号 析的关键技术。
语音信号分析在语音信号处理中具有举足轻重的地位。
分类:
参数性质
时域分析 频域分析 倒谱域分析
分析方法
模型分析方法 非模型分析方法
简单、计算量小、 物理意义明确
感知特性 较好,更 为重要
依据语音信号 产生的数学模 型来分析和提 取表征这些模 型的特征参数
不进行模型化 分析

语音信号数字处理-倒频谱和线谱对

语音信号数字处理-倒频谱和线谱对
声道 h (n) 声门激励 x(n) 语音信号 y(n)
图1
3
通常,不同元音间的激励信号差异很小,因此在类似语音识别这 样的应用中,研究者更关心的是声道的特性,因为从某种意义上 讲,声道的特性是不同语音之间特征的差异所在。
人们只能观察到实际的语音,即卷积的结果,要想从中求出声道 特性,即卷积运算的一个变元,是很困难的。从两个信号之间卷 积的结果中求出其中某一个信号的过程称为“解卷积”。 我们对线性系统熟悉。如果能把上面的卷积系统转换为线性系统, 那么只要估计出激励,通过线性性就可以容易地求出声道特征了。 那么是否可以把这种卷(积)性信号变成加性信号呢?答案是肯定 的。卷积同态信号处理方法可以解决这类问题。
1
Z Z log X Z X Z Z
1
1 Z Z X Z X Z X Z Z 1 Z Z X Z Z n x n 4.8
,可以证明,
ˆ (n) x ˆ (n) x c(n) 2
即:倒谱是复倒谱的偶分量,是偶对称的
14
可以证明,复倒谱和倒谱都有很强的衰减特性, 即随着|n|的增加,复倒谱和倒谱均按至少 1/|n|的速度衰减。(郑方、徐明星,《信号处理原理》清华大学出版社)
该结论说明,在信号的复倒谱和倒谱中,能量 大部分集中在低时部分(|n|的部分),因此用很 少几个有限点就可以近似代替原始信号的特征, 起到了很好的压缩作用。复倒谱和倒谱,尤其 是倒谱,其衰减特性在语音识别的参数提取中 发挥了很大的作的角度看(实)倒谱。 语音生成模型为全极点滤波器,极点在Z平面的 单位园内。语音信号用x(n)表示,其Z变换为X(Z)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

语音信号倒谱和复倒谱的性质
语音信号倒谱和复倒谱的性质
eˆ(n) 非零 ,0,值 nn取 Np,其 2Np,他 3Np值 ,
❖ 由上式可以得出以下结论:一个周期冲激的有限长度序列, 其复倒谱也是一个同周期长度的周期冲激序列,只是其长度 变为无限长度、振幅随着K值的增加而衰减,衰减速度比原 来序列要快,显然,周期冲激序列的倒谱的这些性质对于语 音信号的分析是很有用的,这意味着除了原点之外,可以用 “高时窗”来从语音信号的倒谱中提取浊音激励信号的倒谱, 从而使倒谱法提取音调成为现实。
卷积同态信号处理系统
同态系统可以分解为两个特征系统(即特征系统和逆 特征系统)(指取决于信号的组合规则)和一个线 性系统(仅取决于处理要求)
卷积同态信号处理系统
卷积同态信号处理系统
❖ 由于加性信号的Z变换结果仍为加性信号,所以倒谱这种时 域信号,是可以用线性系统来处理的,经线性处理之后,如 欲在恢复出语音信号,则可以采用逆特征系统来实现,即特 征系统的逆运算。即将线性系统输出的加性倒谱信号:
2
c(n)称为倒频谱,简称为谱 倒Cepstrum。
复倒谱经过正逆两个特征系统变换后,序列可以还原为 本身。但是倒谱经过正逆两个特征系统变换后,序列不 可以还原为本身。
由序列的复倒谱求倒谱的方法
如果已知一x(n个 )的实 复序 倒 xˆ(n列 ), 谱那么可 xˆ(n)求 以出 由 它的倒 c(n)。 谱 首先xˆ(n将 )表示为一个偶 xˆe(n)对 和称 一序 个列 奇 xˆo(n)对 之称 和 的形式:
语音信号的倒谱分析
❖ 解卷算法可以分为两大类:
第一类是首先为线性系统V(Z)建立一个模型,然后对模型 参数按照某种最佳准则进行估计,这种方法称为参数解 卷方法。采用的模型可以分为全极点模型(AR模型)和 零极点模型(ARMA模型),如果采用最小均方误差准则 对AR模型进行估计,就得到线性预测编码算法(LPC)。
❖ 如果复倒谱是一个反因果序列:
xˆ(n)xˆ(n)u(n)
❖ 则可以推导出:
0 n0
xˆ(n)
பைடு நூலகம்
c(n)
n0
2c(n) n 0
❖ 只有当x(n)是一个因果最小相位序列是其复倒谱序
列才是一个因果稳定序列。这要求x(n)应满足两个
条件:1 x(n)=x(n)u(n);2 X(Z)=Z[x(n)]的零极点都
绝大多数数字信号 问处 题理 中X,(Z),Xˆ(Z),Y(Z),Yˆ(Z)的收敛域 都包含单位圆,Z变 正换 反都可以利用正 利负 叶福 变换来代替。
求得复倒谱的另一征 个系 特统
N2
X(expjw) F[x(n)] x(n)exp( jwn)
nN1
Xˆ(expjw) ln[X(expjw)]
xˆ(n) F1[Xˆ(expjw)] 1 Xˆ(expjw)exp(jwn)dw
2
语音信号的倒谱
求得倒谱的特征系统
N2
X (expjw) F[x(n)] x(n)exp( jwn)
nN1
C(expjw) ln[X (expjw) ]
c(n) F1[C(expjw)] 1
C(expjw)exp(jwn)dw
第二类算法称为非模型解卷。同态信号处理完成解卷任 务就是其中最重要的一种。
语音信号的倒谱分析
❖ 对信号进行分析得出它的倒谱参数的过程称为同态 处理。
❖ 对语音信号的某一帧同样可以分析出它的短时倒谱 参数,总的说来,无论对于语音通信、语音合成或 语音识别,倒谱参数所含的信息比其他参数多,也 就是语音质量好,识别正确率高。
卷积同态信号处理系统
特征系统与逆特征系统的组成
语音信号的倒谱
xˆ(n)是x(n)的复倒谱,其英C文 om为plexsCtreupm。 同样yˆ(n)是y(n)的复倒谱。复倒谱 的所 离处 散时域称为复 域倒 。谱 特征系统将离散时 的域 卷中 积运算转换为 谱复 域倒 中加运算, 而逆特征系统则为 运其 算逆 。
❖ 但其缺点是运算量比其他参数大,尽管如此,倒谱 分析方法仍不失为一种有效的语音信号的分析方法。
同态分析的基本原理
❖ 有很多客观物理现象中的信号,其中各组成分量的组 合,并不是按照加法组合原则组合起来的,如图像信 号、地震信号、调制信号、语音信号等,它们都不是 加性信号,而是乘积性或卷积性组合的信号。
已知倒谱求复倒谱的方法
要想由倒谱求复倒谱,首先复倒谱必须满足一 定的条件,比如是因果序列
x ˆ(n)x ˆ(n)u(n)
c(n则)xˆe(n)12[xˆ(n)xˆ(n)]1212xˆxˆx(ˆ(n(n)n))nnn000
因此
2c(n) n 0
xˆ(n)
c(n)
n0
0 n 0
已知倒谱求复倒谱的方法
应该在单位圆内。
语音信号倒谱和复倒谱的性质
❖ 根据语音信号产生的模型,在z域中语音信号S(Z)等于激励 信号E(Z)和声道传输函数V(Z)的乘积,即S(Z)=E(Z)V(Z)。 经过同态系统后可以得到:
sˆ(n)eˆ(n)vˆ(n)
❖ 先讨论声门激励信号。除了人们发清音时,声门激励是能量 较小、频谱均匀分布的白噪声之外;发浊音时,声门激励是 以基调周期为周期的周期脉冲序列
x ˆ(n)x ˆe(n)x ˆo(n)
❖ 由于偶对称序列的DTFT是实函数,奇对 称序列的DTFT是虚函数。
由序列的复倒谱求倒谱的方法
X ˆ(ejx ) w lp n X ([ejx ) w ]l pX n (ejx ) w j p A [X ( re g jx ) w ]p RX ( ee [jx ) w ]p jIm X (e [jx ) w ]p
因此
c(n)xe(n)1 2[x ˆ(n)x ˆ(n)]
相位倒谱的概念
假设 p(n)F 1 [A[rX ( gejxw )p ]]
则 称p(n)p 为(n 相)位x 倒ˆo(谱n)。1 2[x ˆ(n)x ˆ(n)]
不难看出 c(n, )表现的X是 (expjw)的模函数的特征 p(n)表现的X是 (expjw)的相位函数的特征, 而xˆ(n)则包含两个方面。 的特征
❖ 显然,这时不能用线性系统来处理,而必须用满足该 组合规则的非线性系统来处理。但是非线性系统地分 析非常困难。
❖ 同态信号处理法就是设法将非线性问题转化为线性问 题来处理的一种方法。按照被处理的信号来分类,大 体上可以分为乘积同态信号处理和卷积同态信号处理。
❖ 由于语音信号可以视为声门激励信号和声道响应信号 的卷积结果。我们仅讨论卷积同态信号处理系统的问 题。
相关文档
最新文档