语音信号处理第3章 语音信号分析方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

8 4 / N
窗函数的频率响应: 1)矩形窗: 2)海宁窗:
WR ( w) e jwnT
n 0
N 1
ห้องสมุดไป่ตู้
sin( NwT / 2) jwT ( N 1)/2 e sin( wT / 2)
2 2 ) WR ( w )] N 1 N 1
WHan ( w) 0.5 WR ( w) 0.25 [WR ( w
3)汉明窗: 2 2 WHam ( w) 0.54 WR ( w) 0.23 [WR ( w ) WR ( w )] N 1 N 1 性能对比
窗类型 旁瓣峰值 主瓣宽度 最小阻带衰减 -13 4π/N -21 矩形窗 -31 8π/N -44 汉宁窗 -41 8π/N -53 汉明窗
j 0 m
令函数 与离散数据 的误差二次方和为最小,即
ˆ k xk ) 2 ( a j k j x k ) 2 E ( x
k 1 k 1 j 0 n n m
依次对 ai求偏导,可得 m+1 元线性方程组
a j k
k 1 j 0
n
m
j i
xk k i 0
*窗口的长度
1 f NTs
频率分辨率和时间分辨率是矛盾的,应该根据不同的需要 选择合适的窗口长度。
对于时域分析来讲,如果N很大,则它等效于很窄的低通 滤波器,语音信号通过时,反映波形细节的高频部分被阻 碍,短时能量随时间变化很小,不能真实的反映语音信号 的幅度变化;反之,N太小时,滤波器的通带变宽,短时 能量随时间有急剧的变化,不能得到平滑的能量函数。
消除方法:直流分量的消除比较简单,即减去语音信号的 平均项即可。而对于线性趋势项或多项式趋势项,常用的 消除趋势项的方法是用多项式最小二乘法。在MATLAB里 自带有消除线性趋势项的函数detrend。
用一个多项式函数 表示语音信号中的趋势项:
ˆk a0 a1k a2 k 2 am k m a j k j (k [1, n ]) x
0.4 0.2
幅值
0 -0.2 -0.4 0
0.5
1 时间/s
1.5
2
2.5
产生原因:由于测试系统的某些原因在时间序列中会产生 的一个线性的或者慢变的趋势误差,例如放大器随温度变 化产生的零漂移,传声器低频性能的不稳定或传声器周围 的环境干扰,总之使语音信号的零线偏离基线,甚至偏离 基线的大小还会随时间变化。零线随时间偏离基线被称为 信号的趋势项。
第3章
语音信号分析方法
概述
语音信号预处理 时域分析
频域分析
倒谱分析
线性预测分析
3.1
概述
贯穿于语音分析全过程的是“短时分析技术”。语音信号
从整体来看其特性及表征其本质特征的参数均是随时间而 变化的,所以它是一个非平稳态过程。但是,由于不同的 语音是由人的口腔肌肉运动构成声道某种形状而产生的响 应,而这种口腔肌肉运动相对于语音频率来说是非常缓慢 的。因此,语音信号具有短时平稳性。 任何语音信号的分析和处理必须建立在“短时”基础上, 将语音信号分为一段一段来分析其特征参数。通常,每一 段被称为一“帧”,帧长一般取10~30ms。此时,对于整 体的语音信号来讲,分析出得到的参数应该是由每一帧特 征参数组成的特征参数时间序列。
0.54 0.46cos[2 n / ( N 1)], 0 n N 1 w(n ) 0, n else
不同窗函数的形状差别比较大,因此对于短时分析参 数的特性影响很大。选择合适的窗口可使短时参数更 好地反映语音信号的特性变化。此外,窗函数的长度 也是一个关键参数。
k 1
n
i [0,m]
通过解方程组求出m+1 个待定系数 ai 。
在实际语音信号数据处理中,通常取m=1~3来对采样数据进 行多项式趋势项消除的处理。
当m=0 时求得的趋势项为常数,有
0 a k x k 0 k 0 0 k 1 k 1 n n
解方程得
1 n a0 xk n k 1
xn ( m ) w( m ) x ( n m )
常用加窗函数: 1)矩形窗: 2)海宁窗: 3)汉明窗:
1, w(n ) 0,
0 n N 1 n else 0 n N 1 n else
0.5(1 cos(2 n / ( N 1))) w(n ) 0
3.2
3.2.1 分帧与加窗
语音信号预处理
分帧虽然可以采用连续分段的方法,但一般采用交叠分段的 方法。前一帧和后一帧的交叠部分称为帧移。帧移与帧长的 比值一般取为0~1/2。分帧是用可移动的有限长度窗口进行 加权的方法来实现的,即用一定的窗函数来乘以语音信号。
3.2.1 分帧与加窗
加窗信号的表示形式:
由此可知,当 时的趋势项为信号采样数据的算术平均值, 即是直流分量。消除常数趋势项的计算公式为
ˆ k xk a 0 y k xk x
n n 当 m=1时为线性趋势项,有 n 0 0 a k a k x k 0 1 k 0 k 1 k 1 k 1 n n n 2 a k ak x k 0 0 1 k k 1 k 1 k 1
(a)矩形窗 1
幅度
0.5 0 0 1 5 10 15 (b)汉宁窗 20 25 30
幅度
0.5 0 0 1 5 10 15 (c)汉明窗 20 25 30
幅度
0.5 0 0 5 10 15 点数 20 25 30
*窗口的形状 虽然不同的短时分析方法以及求取不同的语音特 征参数可能对窗函数的要求不尽一样,但一般来 讲,一个好的窗函数的标准是: 在时域,由于是语音波形乘以窗函数,所以要减 小时间窗两端的坡度,使窗口边缘两端不引起急 剧变化而平滑过渡到零,从而以使截取出的语音 波形缓慢降为零,减小语音帧的截断效应;在频 域,窗函数要有较宽的3dB带宽以及较小的边带 最大值。
窗口长度的选择更重要地是要考虑语音信号的基音周期。 通常认为在一个语音帧内应包含1~7个基音周期。
3.2.2 消除趋势项和直流分量
(a)带趋势项的语音信号 1 0.5
幅值
0 -0.5 带趋势项的语音信号 -1 -1.5 0 0.5 1 1.5 时间/s (b)消除趋势项的语音信号 趋势项信号 2 2.5
相关文档
最新文档