语音倒谱分析汇编
7-语音信号的同态滤波和倒谱分析NEW10n

复倒谱的计算方法
计算中需考虑的几个具体问题:(有多种计算方法) (1)离散傅立叶变换及逆变换可以用快速傅立叶变换方 法实现,以提高运算速度; (2)相位展开,一般是在主值相位上加上一个校正相位 以得到瞬时相位; (3)复倒谱中对数计算是对绝对值进行的,符号的校正 及符号的见判定公式7.19; (4)线性相位计算可以简化;得到实用计算公式如下:
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
数字语音处理
第7章
语音信号的同态滤波和倒谱分析
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
第四节 复倒谱的性质和计算方法
• 复倒谱的几个重要性质:证明过程略
ˆ (1)即使序列x(n)是有限长的,其复倒谱 x(n) 总是无
• 式中 z −1{ln[ z ( x ( n ))]} 称为复倒谱; • 卷积特征系统D*[ ]的作用是将两个信号的卷积运算变成了 它们的复倒谱的求和运算。 ˆ ˆ • 第二个线性系统L[ ]要根据问题的要求和复倒谱 x1 (n)和 x2 (n) 的性质来设计,目的是能将它们分开进行处理;提取其一
∗
D∗−1 [
]
• D*[ ]将两时间序列的卷积运算变为两时间序列的加法运算; • 具体而言, D*[ ]包括三步:①z变换将两时间序列的卷积变成 相应z变换之乘积;②采用对数运算将相乘的两个z变换变成它 们各自的对数的和;③逆z变换将z域转换回到时域; • 卷积特征系统D*[ ]如下图:
基于MATLAB的语音倒谱分析

基于MATLAB的语音倒谱分析语音倒谱分析是一种通过对语音信号进行倒谱变换来提取语音特征的方法。
MATLAB作为一种常用的科学计算软件,具有丰富的信号处理工具箱,可以用于实现语音倒谱分析。
语音倒谱分析的基本原理是将语音信号分解为一系列频率低通滤波器的输出,然后对滤波器输出进行离散傅立叶变换(DFT),得到倒谱系数。
倒谱系数反映了语音信号的频谱特征,可用于语音识别、语音合成、语音增强等应用。
在MATLAB中进行语音倒谱分析的步骤如下:1. 读取语音信号:使用`audioread`函数读取语音文件,得到语音信号的波形数据和采样率。
例如:```matlab[x, fs] = audioread('speech.wav');```2. 预处理语音信号:通常需要对语音信号进行预处理,例如去除噪声、端点检测等。
这可以使用MATLAB的信号处理工具箱实现。
例如,使用`medfilt1`函数对语音信号进行中值滤波去噪:```matlabx = medfilt1(x, 3); % 使用中值滤波去噪```3. 分帧:将语音信号分为若干帧,每帧包含N个采样点。
通常选择帧长为20-40毫秒左右,帧移为10-20毫秒。
可以使用`buffer`函数实现:```matlabframeLength = round(fs * 0.025); % 帧长为25msframeShift = round(fs * 0.01); % 帧移为10msframes = buffer(x, frameLength, frameLength-frameShift,'nodelay');```4. 加窗:对每一帧的数据应用窗函数,以减小频谱泄漏效应。
常用的窗函数有汉明窗(hamming window)和黑曼窗(hanning window)。
可以使用`hamming`或`hanning`函数实现:```matlabwindow = hamming(frameLength); % 汉明窗```5. 计算功率谱:对窗函数加权的每一帧信号进行离散傅立叶变换(DFT),得到每帧的功率谱。
7-语音信号的同态滤波和倒谱分析NEW10n

• 如果设语音信号为 x(n) ,则通过第一个卷积特征系统 ˆ ˆ D*[ ]变换为系统 x1 (n) + x 2 (n) ; ˆ ˆ • 设 x1 (n) 为声门激励信号, x2 (n) 为声道冲击响应,则 如果两者处于不同的位置,并且互不交替,那么,适当的 设计线性系统,便可将两者分开处理; • 或者是提取其中之一,而同时抑制另一个;
∗
D∗−1 [
]
• D*[ ]将两时间序列的卷积运算变为两时间序列的加法运算; • 具体而言, D*[ ]包括三步:①z变换将两时间序列的卷积变成 相应z变换之乘积;②采用对数运算将相乘的两个z变换变成它 们各自的对数的和;③逆z变换将z域转换回到时域; • 卷积特征系统D*[ ]如下图:
x1 (n) ∗ x2 (n) Ζ[
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
第四节 复倒谱的性质和计算方法
• 复倒谱的几个重要性质:证明过程略
ˆ (1)即使序列x(n)是有限长的,其复倒谱 x(n) 总是无
1 arg[ X ( N )] ⎧ 2 π N为奇数 r=⎨ 1 N −1 N +1 ⎩ 2π {arg[ X ( 2 )] + arg[ X ( 2 )]} N为偶数
HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY Wuhan,430074, P.R. China 中华人民共和国 湖北 武汉
浊音的倒谱分析实例
• 浊音倒谱分析如下图; 原信号
对数谱:DFT 后求对数,包 含慢变化包络 和快变化周期 性细致结构;
语音信号实验3

p
z
−k
e( n ) * h ( n ) = s ( n )
逆滤波
逆滤波器 A( z ) = p a z −k ∑ k
k =0
s ( n ) * a ( n ) = e( n )
LPC倒谱分析
60
实验报告要求
• 要求实验原理叙述清楚 • 实验步骤 实验数据的采集 实验流程分析 采用自己的录音数据,记录实验结果(包括实验中 间结果),并对结果进行必要的分析. 比较各种实验方法关于基音周期检测的性能.
实验三
语音信号进行倒谱 分析
实验内容 倒谱分析、LPC倒谱分析 短时相关分析、短时幅度差分析
一、倒谱分析
• • 1. 2. 3. 4. 5. 作用 把声门激励信号与声道冲击信号分开 倒谱计算公式 去直流 sp=sp-qq s1=abs(fft(sp(1:300).*hanning’)) s2=logm(s1) mm=real(ifft(s2)) 坐标调整
汉明窗
加窗前
加窗后
坐标调整前倒谱
60
坐标调整后倒谱
二、LPC倒谱分析
原始语音分帧、加窗
LPC分析 逆滤波 DFT 倒谱分析 Ln|. | 高频分量置零 IDFT 基音检出
LPC分析
Durbin 算法
(1)
( 2)
E 0 = R n (1) n
i k i = [ Rn (i ) − ∑ a ij−1 Rn (i − j )] / E n−1 j =1 i −1
(3) E n = (1 − k i2 ) E n−1
(5)
if
(6)
− a ij = a ij−1 − k i aii−1j
1 ≤ j < i −1
语音信号的倒谱分析

因为
ˆ X ' (Z ) X ' (Z ) X (Z )
求复倒谱的一种有效的递推算法
ˆ Z[nx(n)] Z (nx(n))Z[ x(n)]
ˆ n( x(n)) {nx(n)} x(n)
n 1
l ˆ ˆ x(n) ( ) x(l ) x(n l ) x(n) x(0) l 0 n 可推导出: ˆ x ( n)
i 1
P
ˆ e(n) s(n) s(n) s(n) ai s(n i) ai s(n i)
i 1 i 0
P
P
线性预测原理
线性预测是目前分析语音信号的最有效的方法之一,分 析的结果是得到一组信号的全极点模型参数,所以又称 为信号参数模型法。 这个方法的基本思想是将被分析信号模型化,即用有限 数目的模型参数来描述信号中的信息,具体来说,将被 分析信号s(n)视为某系统(即模型)的输出,而系统的 输入,在s(n)为确定性信号是采用单位取样序列。在s(n) 为随机信号是采用白噪声序列。
Linear
Prediction
1947年维纳提出; 1967年板仓等人应用于语音分析与合成;
语音信号处理与分析的核心技术
提供了预测功能;
提供了声道模型和声道模型的参数估计方法;
基本思想:
语音样本之间存在相关性,一个语音信号的样本可 以用过去若干个样本的线性组合来逼近;
ˆ s ( n) a i s ( n i )
g jZ
j 0
Q
j
, A( Z ) ai Z i
i 0
P
g j 和ai都是实数,且a0 1。如果能有一种算法,可能根据已知的s (n) 正确的估计出这些参数,那么未知的系统V(Z)便可求得。由于 E ( Z )V ( Z ) S ( Z ),根据V ( Z )和S ( Z )便可以求得E(Z),从而全部解决 解卷的的问题。
实验四 语音信号的LPC倒谱参数

实验四 语音信号的LPC 倒谱参数的提取1 实验目的通过Matlab 编程掌握语音信号的LPC 倒谱参数的求解方法。
2 实验原理线性预测分析的基本思想是:用过去P 个样点的值来预测现在或未来的样点值:预测误差为:理论上通常采用预测系数{a k }的取值使均方误差E[e 2(n)](是{a k }的函数)最小的准则。
]))()([()]([122∑=--=pk k k n x a n x E n e E 0)]([2=∂∂k a n e E p k ≤≤1)]()([0)]()([2)]([2=-=--=∂∂j n x n e E k n x n e E a n e E k 预测误差与过去的样点不相关[]0)()()()()]()([)(])()([0)()(111=--=⎭⎬⎫⎩⎨⎧⎥⎦⎤⎢⎣⎡-⋅---=⎭⎬⎫⎩⎨⎧-⋅--⇒=-∑∑∑===p k k p k k pk kk j R a j R j n x k n x a j n x n x E j n x k n x a n x E j n x n e E j=1…P求解以上P 个方程组则可得到预测系数a k 。
方程组的求解方法有自相关的算法,有协方差的方法,本实验采用Durbin 算法来求解,完整的递推过程如下:(1) )0(0n n R E =(2) 1111)()(--=-∑--=i n i k i k n n i E a k i Ri R k∑=--='-=pk k k n x a n x n x n x n e 1)()()()()((3) i i i k a =(4) ii k i i k i k k a a a 11----= 11-=i k (5) 12)1(--=i n i i n E k E if i<p go to (2)(6) pp p p p p p p a a a a a a a a ====--,,......,112211 3 实验过程[x,fs,bits]=wavread('c:\WINDOWS\Media\chimes.wav'); x=x(:,1);%[x,fs,bits]=wavread('E:\3_1.wav');x=x';len=length(x);N=256;M=128;Fn=fix((len-N)/M+1);y=[];for i=1:Fndown=1+(i-1)*M;up=down+N-1;temp=x(down:up);temp=temp.*hamming(N)';y=[y;temp];endP=12;a=[];k=[];lpc=[];for q=1:Fntemp2=y(q,:);R=corr(temp2,P);for i=1:Pif i==1E(1)=R(1);k(1)=R(2)/R(1);a(1,1)=k(1);E(2)=(1-k(i).^2)*E(1);elsetemp4=0;for s=1:i-1temp4=temp4+a(s,i-1)*R(i-s+1);%×¢ÒâR¼Ó1endk(i)=(R(i+1)-temp4)/E(i);%×¢ÒâÓ¦¸ÃÊÇR(i+1)a(i,i)=k(i);for s=1:i-1a(s,i)=a(s,i-1)-k(i)*a(i-s,i-1);endE(i+1)=(1-k(i).^2)*E(i);endendfor n=1:P;b(n)=a(n,P);endlpc=[lpc;b];end。
倒谱计算与分析

《视频语音处理技术》倒谱计算与分析学院名称:计算机与信息工程学院专业名称:计算机科学与技术年级班级:姓名:学号:计算机与信息技术学院综合性、设计性实验报告一、 实验目的:对语音信号进行同态分析可得到语音信号的倒谱参数。
语音的倒谱是将语音的短时谱取对数后再进行IDFT 得到的,所以浊音信号的激励反映在倒谱上是同样周期的冲激,借此,可从倒谱波形中估计出基音周期。
对倒谱进行低时窗选,通过语音倒谱分析的最后一级,进行DFT 后的输出即为平滑后的对数模函数,这个平滑的对数谱显示了特定输入语音段的谐振结构,即谱的峰值基本上对应于共振峰频率,对于平滑过的对数谱中的峰值进行定位,即可估计共振峰。
对于倒谱计算与分析的设计实验可作如下训练: 1、复倒谱的几种计算方法: 2、最小相位信号法和递归法; 3、基音检测; 4、共振峰检测。
二、实验仪器或设备:windowsXP 下的Matlab 编程环境 三、总体设计(设计原理、设计方案及流程等)1.复倒谱的几种计算方法:在复倒谱分析中,z 变换后得到的是复数,所以取对数时要进行复对数运算。
这时存在相位的多值性问题,称为“相位卷绕”。
设信号为则其傅里叶变换为对上式取复对数为 则其幅度和相位分别为:)()()(21n x n x n x *=)()()(21ωωωj j j e X e X e X ⋅=)(ln )(ln )(ln 21ωωωj j j e X e X e X +=)(ln )(ln )(ln 21ωωωj j j e X e X e X +=)()()(21ωϕωϕωϕ+=)()()(21ωϕωϕωϕ+=上式中,虽然 , 的范围均在 内,但 的值可能超过范围。
计算机处理时总相位值只能用其主值 表示,然后把这个相位主值“展开”,得到连续相位。
所以存在下面的情况:(K 为整数) 此时即产生了相位卷绕。
下面介绍几种避免相位卷绕求复倒谱的方法。
最小相位信号法这是解决相位卷绕的一种较好的方法。
语音信号数字处理-倒频谱和线谱对

4
卷积同态系统框图
H(·)
* D (·)
L(·)
-1 Z (·)
D
*-1
(·)
Z (·)
Log(·)
Z (·)
Exp(·)
-1 Z (·)
图2
5
“卷积同态系统”的输入输出信号都是 卷性信号,即具有相互卷积的关系。
同态系统的一个最主要理论结果就是同 态系统的分解,分解的目的是用两个特 征系统和一个线性系统来代替非线性的 同态系统。图2给出了同态系统H(z)的组 成。
1
Z Z log X Z X Z Z
1
1 Z Z X Z X Z X Z Z 1 Z Z X Z Z n x n 4.8
先对语音序列 xn 做DFT得到 X e j ,取对数之后 ˆ e j 做IDFT得到偶函数 x ˆe n ,再用 g n 将实部 X R ˆn 。 取出 x
xn
DFT
X e j
log
ˆ e j X R
ˆ e j X I
IDFT
ˆe n x
ˆ 0 log x0 ; x
x1 ˆ 1 x ; x0 x2 1 x1 ˆ 2 ˆ 1 x x ; x0 2 x0 x3 1 x2 2 x1 ˆ 3 ˆ 1 ˆ 2 x x x ; x0 3 x0 3 x0
1
k ˆ k xn k , xn x k n
n0
(4.9)
23
利用最小相位信号序列性质
ˆn 0, xn 0, x
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Keywords: speech signal; cepstrum; MATLAB; pitch detection; resonance peak
海南大学 毕 业 论 文(设计)
题 目:基于 MATLAB 的语音倒谱分析 学 号: 姓名 年级 学 院: 专 业: 指导教师: 完成日期:2012 年
基于 MATLAB 的语音倒谱分析
摘要
语言是人类最重要的交流工具,它自然方便、准确高效。随着社会的不断发 展,各种各样的机器参与了人类的生产活动和社会活动,因此改善人与机器之间 的关系,使人对机器的操纵更加便利就显得越来越重要。随着电子计算机和人工 智能机器的广泛应用,人们发现,人和机器之间最好的通信方式是语言通信,而 语音是语言的声学表现形式。要使机器听的懂人话,就要对语音信号进行处理。 随着信息技术的不断发展,尤其是网络技术的日益普及和完善,语音信号处理技 术正发挥着越来越重要的作用。为了寻找具有良好性能的特征及提取重要参数以 提高识别系统性能,各种科学的算法应运而生,倒谱法作为信号处理的重要的方 法之一,能够得到比较好的识别性能。
I
基于 MATLAB 的语音倒谱分析
Abstract
Language is one of the most important communication tools, it is convenient and efficient. With the continuous development of the society, a variety of machines are used in the human’s production and social activities, thus improving the relationship between man and machine makes the machine more convenient what becomes more and more important. With the wide application of electronic computers and artificial intelligence machine, it was discovered that language communication is the best means of communication between man and machine, while the voice is the acoustic manifestations of the language.To make the machine understands people, it is necessary to process the speech signal. With the continuous development of IT, especially the growing popularity of network technology and improvement of the voice signal processing technology is playing an increasingly important role, in order to find a good performance characteristics and extract important parameters to improve the performance of the recognition system, a variety of scientific algorithms have emerged, the cepstrum, as the signal processing one of the important methods, can get better recognition performance.
本文以 MATLAB 为平台,通过编程实现对语音信号的倒谱分析。首先,本 文简要说明了倒谱与语音的相关理论原理,包括倒谱原理和语音的组成元素,为 之后的进一步研究奠定理论基础。然后,对语音倒谱各个方面的应用进行了 MATLAB 编程,得到了语音基音检测和共振峰检测的实验仿真结果。
关键词:语音信号;倒谱;MATLAB;基音检测;共振峰检测;
detection;
II
基于 MATLAB 的语音倒谱分析
目录
1 绪论.............................................................................................................................1 1.1 目的及意义......................................................................................................1 1.2 语音信号研究现状.........................................................................................1 1.3 主要研究内容..................................................................................................3
MATLAB as a platform, can achieve cepstrum analysis of the speech signal by programming. First, the article briefly described the itheoretical principles of cepstrum and voice, including the the cepstrum principles and elements of voice,which laied the theoretical foundation for the further research . Then the speech cepstrum application in all aspects was programmed in MATLAB, thus we got voice