结点阈值小波包变换语音增强新算法
语音增强中小波收缩阈值算法和阈值函数研究

0 引 言
对 于说话 人 识别 系统 或语音 识别 系统 , 高信 噪 比情 况下 获 得 的识 别 率 可 以达 到 比较 高 的程 度 . 是 , 但 如
果 语音 信号 受到 噪声 的干 扰 , 别率 就会 大 幅下降 . 识 因此使 用有 效 的信 号增 强 方法 得 到 高 质 量 语音 信 号 , 对
摘 要 : 波 收 缩 用 于语 音 增 强 时 , 小 阈值 算 法 和 阈值 函 数是 最 重 要 的 参 量 . 了在 小 波语 音 增 强 中得 到 可 靠 的 选择 为
方案 , 通过对这两种小波收缩参数进行分析 , 得到 了相 关数 据结果 , 并给 出 S R U E阈值 算 法和 Ui rl n ea 阈值算 法的 vs
Th e h l l o ih s a d f n to f wa e e r s o d a g rt m n u c i ns o v l t
s i k g n s e c n a c m e t hrn a e i p e h e h n e n
Z HAO Xi GAO —h o a, Ya z a
tn w i eect o zdit tom j r p :o nt n n a nt n .h or pn igs] — i , h hw r a gre o w a r o ssff c os dh r f c osT ecr sodn e c o c e i n og u tu i a d u i e e
第2 7卷 第 4期
20 0 8年 8月
文章 编 号 :6 4—0 7 ( 0 8 0 17 0 6 2 0 )4—0 4 0 0 4— 4
南 昌 工 程 学 院 学 报
用后验信噪比修正小波包自适应阈值的语音增强算法

用后验信噪比修正小波包自适应阈值的语音增强算法
张雪英;任永梅;贾海蓉
【期刊名称】《中南大学学报(自然科学版)》
【年(卷),期】2013(044)011
【摘要】针对固定阈值小波包语音增强算法造成的语音失真问题,提出一种采用后验信噪比修正小波包自适应阈值的语音增强算法.该算法先用结合掩蔽效应改进的非平稳噪声估计算法估计噪声功率,确保计算出准确的节点后验信噪比;再用含有此后验信噪比的Sigmoid函数对相邻帧的随尺度变化的阈值进行平滑,保证了阈值的连续性;进一步用指数化的后验信噪比自适应修正闽值,减少语音失真.实验结果表明:新算法提高了增强语音的信噪比和分段信噪比,与固定阈值小波包语音增强算法相比,具有更好的增强效果.
【总页数】8页(P4566-4573)
【作者】张雪英;任永梅;贾海蓉
【作者单位】太原理工大学信息工程学院,山西太原,030024;太原理工大学信息工程学院,山西太原,030024;太原理工大学信息工程学院,山西太原,030024
【正文语种】中文
【中图分类】TN912.3
【相关文献】
1.基于自适应阈值的小波包非接触语音增强方法研究 [J], 薛慧君;李盛;路国华;张杨;焦腾;王健琪;荆西京
2.一种新的自适应阈值小波包语音增强算法 [J], 任永梅;肖冬瑞
3.基于新阈值函数和自适应阈值的小波包语音增强研究 [J], 刘冲冲;邹翔;周正仙
4.联合改进子空间的自适应小波包阈值语音增强算法 [J], 任永梅;张雪英;贾海蓉;贾雅琼
5.基于双正交小波包分解的自适应阈值语音增强 [J], 李如玮;鲍长春;窦慧晶
因版权原因,仅展示原文概要,查看原文内容请购买。
基于正交小波包分解的语音去噪增强

a c r ig t 盯 r l .F n l c o dn o 3 u e i al y.te d — os n n a c d s e c e r b an d va t e iv re w v ltp c e h e n i a d e h n e p e h s wee o t ie i h n e a ee a k t e s t n fr r s m.B s d Ol a o a e i MA AB,fr te s e c in t o s s d n i d a d e a c d TL o h p e h s a wi n ie wa e os n n n e .T e e p r n s s o gl h e h h x eme t h w
3 8 ・— 8 - ・ —
用动态阈值 对小波系数进行噪声抑制 , 而可 以有效 地去 除 从
噪声 , 强语音 。 增
系数 主要 由语音信号控制 。因此设置一个 合适 的阈值 , 仅利 用超过 阈值 的那 些显著的小波系数来重 构语音信号 , 可较 就
好地 去除噪声。
一
2 小 波包 阈值 增强 新算 法
l 引言
噪 声 不 仅 影 响语 音 可懂 度 和清 晰度 , 且 造 成 人 耳 听 觉 而
取 阈 值 是小 波包 增 强 算 法 的 关 键 。早 期 的 文 献 通 常 局 限 于
不 变 阈 值 , D n b 和 Jhs n 如 ooo ont e提 出 的非 线 性 小 波 变 换 阈 o
疲劳。语音增强 的 目的就是为 了抑制背 景噪声 , 改善语音质 量, 同时提高语音 的可懂度 和清 晰度 … 。一般来说 , 语音 增
强 方法 分 为 2大 类 : 时域 方 法 ( 子 空 间 法 ) 频 域 方 法 ( 如 和 如
用小波包改进子空间的语音增强方法

行分解 , 而且 对 高频部 分也 做 了二次 分解 , 对信 号 的
图 l 子 空I 司语 晋 增 强 方 法 原 理 图
分 析 能力更 强 , 别适 于处 理非 平稳信 号 l ] 特 _ 。该 算 3
法 采 用 小 波 包 变 换 的 方 法 对 子 空 间 域 中 带 噪 语 音 特 征值 进行 处理 , 即采 用 改 进 的 小 波 软 判 决 阈 值 函 数 , 得 到 更 新 的 带 噪 语 音 的 特 征 值 , 计 出 纯 净 语 音 特 估
法 , 觉感受上 增 强语音 也具 有更好 的清晰度 和 可懂度 。 听
关 键 词 : 音 增 强 ; 空 间 ; 渡 包 ;阈 值 函 数 语 子 小
中 图分 类 号 : TN9 2 音增 强是 解决 噪声 污染 的一 种有效 的 预处理
技术 , 随着数 字通 信 系统 的快速 发展 和广 泛使 用 , 人 们越来 越重 视语 音增 强在 语音处 理 方 面的作用 。近 年来 , 子空 间方 法在 语 音增 强研 究 中 已有 了较 大发
假设 带噪语 音信 号 可 以表示 为 :
S — X+ N. () 1
式 中, s是 带噪语 音 ; 是 纯 净语 音 ; 是 方 差 为 X N 的高斯 白噪声 , x, 为 K 维 矢量 。 s, N
征值 , 并采 用基 于统计 信 息算 法更 新噪 声特 征值 , 从
而实 现 了对噪 声特征 值 更加准 确 的估计 r 。 8 ]
用 小 波包 改 进 子 空 间 的语 音 增 强 方 法
贾海蓉 , 雪英 , 晓薇 张 牛
( 原 理工 大学 信 息 工 程 学 院 , 原 0 0 2 ) 太 太 3 0 4
一种新阈值函数的小波包语音增强算法

新阈值函数和新的 Bark 尺度小波包分解结构
传统阈值函数 小波阈值去噪算法中传统的阈值函数
[10 ]
( 2) ( 3)
主要有:
a) 硬阈值函数。 与硬阈值函数不同的是, 当小波包系数 的绝对值大于给定的阈值时, 则令其保持不变, 即
^
p p) 即第 j 层第 p 个节点处的小波包系 其中: d j ( k) 表示节点( j,
数; h0 ( k) 是通带在 0 ~
π 之间的低通滤波器; h1 ( k ) 为通带在 2
第 30 卷第 1 期 2013 年 1 月
计 算 机 应 用 研 究 Application Research of Computers
Vol. 30 No. 1 Jan. 2013
一种新阈值函数的小波包语音增强算法
任永梅,张雪英 ,贾海蓉
*
( 太原理工大学 信息工程学院,太原 030024 ) 摘 要: 针对传统软、 硬阈值函数去噪方法增强的语音存在失真的问题, 提出一种新阈值函数的小波包语音增
w j, k =
π ~ π 之间的高通滤波器。 2 p) 处的小波包系数 d p 在节点( j, j ( k ) 可由式( 4 ) 重建:
dp j ( k) =
p ^2 d j +1(
{
w j, k 0
w j, k ≥λ w j, k <λ
( 7)
b) 软阈值函数。 与硬阈值函数不同的是, 当小波包系数 的绝对值大于给定的阈值时, 令其减去阈值, 即
基于自适应阈值的小波包非接触语音增强方法研究

Me d i c a l E q u i p me n t J o u r n a I , 2 0 1 3, 3 4 ( 2 ) : 2 1 — 2 2 1
Ke y wo r d s n o n — c o n t a c t s p e e c h ; wa v e l e t p a c k e t ; t h r e s h o l d ; s p e c t r o g r a m
a b o r i g i n a 1 p u r e s p e e c h s i g n a 1 .G咖 l
T h i s me t h o d c a n r e mo v e t h e n o i s e o f r a d a r s p e e c h a n d i s p r a c t i c a 1 . 『 Ch i n e s e
c a p a b i l i t y o f w a v e l e t p a c k e t or f a n a l y z i n g t i me - f r e q u e n c y s i g n a l , a n a l g o r i t h m o f wa v e l e t p a c k e t t h r e s h o l dH u i - j a n , L I S h e n g , L U G u o - h u a , Z HA N G Y a n g , J I AO T e n g , WA N G J i a n — q i , J I N G X i - j i n g
基于小波包变换和小波阈值消噪的语音特征提取

Ke y wor ds:wa eetp ck tta fr ;p nc c rc e xr cin; p o c de osn v l a e rnso m ho i ha a tr e ta t o h ni n iig; wa e e hr s o d de osng v ltt e h l n ii
Ph ni h a t r e t ac i s d o a e e c e r so i o c c ar c e x r ton ba e n w v ltpa k tt an f rl l a d vee hr s ol no sn n wa lt t e h d de ii g
CHEN Ba i
( lcrncE p r n e t ,Y nh n Unvri E eto i x ei tC ne me r a s a ies y,Qih a g a 6 0 4,C ia) t n u n d o0 6 0 hn
A bsr c : Ai n tra ii g p n c c rc e xr ci n a to g rn ie b ck r un ta t mi g a e lzn ho i haa tre ta to tsr n e o s a go d,wa ee a k tTr nso m su e v ltp c e a fr wa s d, a d n
0 前
言
1 小 波 分 析
人 耳耳 蜗 内 的基 底 膜 , 其并 行 带 通滤 波 器 , 这些 滤 波 器 的脉 冲响 应保持 常 Q系 数 , 除 在 时 间 轴 上 平 移 外 , 波 即 滤 器 的 中心频 率 与带 宽之 比近似 不变 。这 一点 与小 波 的 计 算 特性相 似 , 小波 变 换 在 各 分 析 频 段 内 的 品质 因数
基于改进小波阈值函数的语音增强算法研究

基于改进小波阈值函数的语音增强算法研究作者:覃爱娜戴亮李飞曹卫华来源:《湖南大学学报·自然科学版》2015年第04期摘要:针对传统的小波阈值去噪算法中的阈值函数不足,提出一种优于非负死区阈值函数的改进的阈值函数.改进阈值函数不仅具有良好的连续性、可导性,并且克服了非负死区阈值函数没有考虑小波变换模值的衰减符合指数规律这一特点.另外在阈值的选取中,考虑了带噪语音信号的不同特性,采用谱平坦度函数修正阈值.仿真实验表明,与传统的非负死区阈值函数去噪算法相比,改进的阈值函数能更有效地消除背景噪声,在提高输出信噪比的同时,更好地保持语音质量和清晰度.关键词:语音增强;小波变换;阈值去噪中图分类号:TN912.3 文献标识码:A语音增强是将尽可能纯净的原始语音从带噪语音信号中提取出来.其主要目的是:消除背景噪音、改进语音质量、提高语音可懂度、使听者乐于接受并且不会感觉到疲劳.目前,在平稳的噪声环境下语音增强效果较好,但在非平稳环境下,尤其在低信噪比情况下对语音增强算法的研究仍是语音信号处理的一个重要方向\[1-3\].小波变换属于一种信号的时间尺度变换分析方法,可以同时很好地表征出信号在时域和频域的局部特性.小波变换具有多分辨率分析的特点,在信号的低频部分具有较低的时间分辨率和较高的频率分辨率,在信号的高频部分具有较低的频率分辨率和较高的时间分辨率,是一种适应于非平稳环境的信号处理方法\[4\].文献[5]首次提出了基于软硬阈值函数的小波语音增强算法,随后Breiman在Donoho的基础上提出了一种非负死区阈值函数去噪算法\[6\],其语音增强效果要优于传统的软硬阈值函数去噪算法.但通过分析可知:非负死区阈值函数并没有考虑语音信号的小波变换模值的衰减是符合指数规律的这一特点,因此其去噪效果有待进一步提高\[7\].本文对软硬阈值以及非负死区阈值函数进行分析,并在此基础上提出一种改进的阈值函数的小波语音增强算法.改进阈值函数克服了非负死区阈值函数的不足,仿真实验表明,改进阈值函数去噪效果要明显优于非负死区阈值函数,在抑制噪声的同时很好地保持了语音的可懂度.1 小波去噪原理信号在某点处出现间断或者其某阶导数不连续的性质称为信号的奇异性,通常采用信号的Lipschitz指数来表征信号的奇异性.文献[8]建立了信号的Lipschitz指数与小波系数的局部模极大值之间的关系.对信号f(t)来说,假设存在正数T使得不等式(1)成立:|f(t0+τ)-fn(t0+τ)|≤T|τ|δ ,n则称δ为信号f(t)在t0处的Lipschitz指数.其中n为正整数,fn(t)为信号f(t0)的n 次多项式,τ为一个充分小的量.设信号f(t)的小波变换系数的模为|Wf(a,b)|.假设存在正数b0∈(b0-τ,b0+τ)使得|Wf(a,b)|≤|Wf(a,b0)|成立.则称b0为f(t)的小波变换的局部极大值点,|Wf(a,b0)|为小波变换的模极大值.在尺度a=2j时,f(t)的Lipschitz指数δ与其小波模极大值W2jf(2j,b0)满足下式:log 2|W2jf(2j,b0)|≤log 2A+δj. (2)其中A是与基小波相关的常量.由式(2)可得,当f(t)的Lipschitz指数δ>0时,则信号f(t)的模极大值W2jf(2j,b0)将会随着分解尺度j的增大而增加;反之,当f(t)的Lipschitz指数δ由以上信号的分析特性可知,纯净语音信号的Lipschitz指数δ>0,其极大值是随分解尺度j的增大而增加;而噪声信号的Lipschitz指数δ2 小波阈值去噪算法由小波变换的线性特性可知,带噪语音信号的小波变换系数等于噪声信号的小波变换系数和纯净语音信号的小波变换系数之和.按照这一性质,利用小波变换进行阈值去噪的基本思路是:首先选择合适的基小波函数和分解层数对带噪语音信号进行多尺度小波分解;然后分别对各尺度的高频小波系数采用合适的门限阈值及阈值函数进行处理:最大限度去除噪声信号的小波系数,保留原始纯净信号的小波系数;最后对保留的各层系数进行小波逆变换,重构增强语音信号.图1为小波阈值去噪算法的基本原理框图.1 小波去噪原理信号在某点处出现间断或者其某阶导数不连续的性质称为信号的奇异性,通常采用信号的Lipschitz指数来表征信号的奇异性.文献[8]建立了信号的Lipschitz指数与小波系数的局部模极大值之间的关系.对信号f(t)来说,假设存在正数T使得不等式(1)成立:|f(t0+τ)-fn(t0+τ)|≤T|τ|δ ,n则称δ为信号f(t)在t0处的Lipschitz指数.其中n为正整数,fn(t)为信号f(t0)的n 次多项式,τ为一个充分小的量.设信号f(t)的小波变换系数的模为|Wf(a,b)|.假设存在正数b0∈(b0-τ,b0+τ)使得|Wf(a,b)|≤|Wf(a,b0)|成立.则称b0为f(t)的小波变换的局部极大值点,|Wf(a,b0)|为小波变换的模极大值.在尺度a=2j时,f(t)的Lipschitz指数δ与其小波模极大值W2jf(2j,b0)满足下式:log 2|W2jf(2j,b0)|≤log 2A+δj. (2)其中A是与基小波相关的常量.由式(2)可得,当f(t)的Lipschitz指数δ>0时,则信号f(t)的模极大值W2jf(2j,b0)将会随着分解尺度j的增大而增加;反之,当f(t)的Lipschitz指数δ由以上信号的分析特性可知,纯净语音信号的Lipschitz指数δ>0,其极大值是随分解尺度j的增大而增加;而噪声信号的Lipschitz指数δ2 小波阈值去噪算法由小波变换的线性特性可知,带噪语音信号的小波变换系数等于噪声信号的小波变换系数和纯净语音信号的小波变换系数之和.按照这一性质,利用小波变换进行阈值去噪的基本思路是:首先选择合适的基小波函数和分解层数对带噪语音信号进行多尺度小波分解;然后分别对各尺度的高频小波系数采用合适的门限阈值及阈值函数进行处理:最大限度去除噪声信号的小波系数,保留原始纯净信号的小波系数;最后对保留的各层系数进行小波逆变换,重构增强语音信号.图1为小波阈值去噪算法的基本原理框图.2.1 改进阈值函数根据小波阈值去噪的原理可知,语音信号在经过小波分解后,通过阈值函数处理带噪语音小波系数可以去除噪声.传统的小波系数处理算法有软硬阈值函数和一些改进的阈值函数.硬阈值函数j,k=wj,k,|wj,k|≥λ;0,|wj,k|硬阈值函数处理方法能够更多地保留原始语音信号的尖峰特征,但硬阈值函数在阈值±λ处是间断不连续的,从而在重构增强语音信号时会出现一定的振荡现象.软阈值函数j,k=sgn (wj,k)(|wj,k|-λ),|wj,k|≥λ;0,|wj,k|软阈值函数处理方法在阈值±λ处连续,对重构信号的小波系数具有更好的平滑作用,进而取得较好的增强效果.但j,k和wj,k之间由于存在恒定误差,会丢失原始语音信号的突变信息,使得重构信号的信噪比较低,均方误差较大.非负死区阈值函数j,k=wj,k-λ2wj,k,|wj,k|≥λ;0,|wj,k|非负死区阈值函数考虑到了随着有用信号的小波系数的增大,对噪声信号的削减力度也有所降低的性质,保证了函数在阈值±λ处的连续性,在软硬阈值门限值之间取得了一个很好的折衷.仿真实验证明非负死区阈值函数的去噪效果的确优于软硬阈值函数去噪.但其并没有考虑噪声小波变换模值的衰减是符合指数规律的这个特点,并且在|wj,k|考虑到以上因素,本文在非负死区阈值函数的基础上结合指数函数设计了一种改进的更为合理有效的阈值函数.改进阈值函数的定义为:j,k=sgn (wj,k)(|wj,k|-λ22|wj,k|e2(λ-|wj,k|)),|wj,k|≥λ;sgn (wj,k)(λ(e8|wj,k|-e8p)2(e8λ-e8p)),|wj,k|p∈(0,λ). (6)从图2可以看出,所设计的改进阈值函数克服了硬阈值函数在±λ处的不连续性以及软阈值函数存在恒定误差的缺点.在|wj,k|=λ处,改进阈值函数不像硬阈值函数那样存在突变性,从而在重构增强语音信号时不会产生振荡现象;在|wj,k|λ阶段,改进阈值函数和硬阈值更加接近,避免了j,k和wj,k之间出现恒定差值,因此也就不会过多丢失有用语音信号的突变信息;并且相对于非负死区阈值函数,改进阈值函数符合小波变换模值按指数衰减的规律,其去噪效果更佳.2.2 门限阈值选取在小波阈值去噪处理算法中,门限阈值λ是一个非常重要的参数,阈值选取的大小将直接影响小波去噪的性能.λ选取过大,则小波去噪中剔除了过多的有用信号,会造成信号的失真;λ选取太小,又会在增强语音中残留有较多的噪声信号,降低算法的去噪效果.Donoho设计的固定阈值λ=σ2log N,式中σ为小波系数wj,k的方差,N为观测语音的长度.因为对不同的分解尺度j上都采用了相同的阈值进行去噪处理,故其增强效果不理想.文献\[7\]依据随着尺度的增加,噪声的模极大值减小,其阈值也应随着尺度的增加而减小的特点,将固定阈值λ修改为λ=σ2ln N/2j-1ln (j+1).该阈值设计方法可以保证较大程度地保留有用语音信号的信息,不过这种阈值设计并不是适应所有的噪声环境,在非平稳的噪声环境下,其去噪效果有待进一步提高.为了提高在非平稳噪声环境下的小波去噪性能,我们根据带噪语音帧频谱的平坦度,来判断带噪语音信号是噪声特性还是纯净语音特性,然后针对不同的特性采用不同的自适应阈值对带噪语音信号进行去噪处理.其中,谱平坦度γ定义为:γ=10log 10(μg/μa),其中μg=nf1f2…fn为带噪语音信号的小波功率谱密度的几何平均值,μa=1n∑ni=1fi 为带噪语音信号小波功率谱密度算术平均值.自适应阈值采用一个谱平坦度函数g(γ)=2/ln (0.05γ)来修正文献\[9\]改进的阈值λ,即自适应阈值函数为:λ=σ2ln N/2j-1ln (j+1)g(γ)(7)自适应阈值既考虑了随着尺度j的增大,λ的值逐渐减小,使其与噪声在小波变换各尺度上的传播特性相一致的特性,也考虑了带噪语音的噪声和语音特性,使对门限阈值估计更准确,其去噪效果更佳.3 实验仿真实验仿真所采用的纯净语音信号是由Voice Reader软件合成的采样率为8 kHz,采样位数为16 bit的“我爱北京天安门”语音信号.噪声信号则采用在体育馆内录制的采样率为8 kHz,采样位数为16 bit的hubbub噪声.实验在信噪比(SNR=0 dB)下,对添加hubbub噪声的纯净语音分别利用非负死区阈值函数和改进阈值函数进行小波去噪处理.原始语音及添加hubbub噪声的带噪语音如图3所示,采用两种方法的实验仿真结果如图4和图5所示.由实验结果可以看出,与非负死区阈值去噪法相比,在低信噪比的情况下,采用本文改进阈值函数的方法,有效地抑制了背景噪声,减少了语音的失真度.此外,由于引入了带噪语音帧频谱的平坦度来计算阈值λ,改进阈值去噪算法能有效地消除了因音乐噪声产生的语音失真,很好地保持了语音的自然度和可懂度,主观试听效果要明显优于传统的软硬阈值和非负死区阈值去噪法.为了进一步评价增强语音的质量,我们采用语音信号的分段信噪比和分段失真来评价增强语音的质量.分段信噪比是以帧为单位先计算信噪比,然后在整个语音段求其平均值作为最终的输出信噪比.其计算公式为\[10\]:从表中可以看出,无论是在低信噪比还是高信噪比情况下,改进阈值去噪算法的输出信噪比都要大于非负死区阈值去噪算法,而其增强语音失真度都要远远小于非负死区阈值去噪法.说明改进阈值去噪算法在保持增强语音较高的输出信噪比的情况下没有过多地损伤语音的原有信息,更好地保持了语音的可懂度.4 结论针对传统的基于软硬阈值的小波去噪算法的不足,在非负死区阈值函数去噪算法的基础上提出了一种改进阈值函数的小波阈值去噪算法.改进的阈值函数克服了硬阈值存在突变、软阈值存在恒定差值的缺点,另外改进阈值函数考虑了小波变换模值按指数衰减的规律,其增强语音的小波系数获取更接近于原始纯净语音.在阈值λ的选取中,依据带噪语音信号的谱平坦度来加权阈值能获得随语音实时变换的阈值λ.仿真结果表明,改进算法在非平稳的低信噪比的情况下能有效消除背景噪声,减少残留音乐噪声和听觉失真,提高了语音的感知质量和清晰度.参考文献[1] KRISHNAMOORTHY P, PRASANNA S R M. Enhancement of noisy speech by temporal and spectral processing \[J\]. Speech Communication,2011, 53(2): 154-174.\[2\] 赵欢,王纲金,赵丽霞.一种新的对数能量谱熵语音端点检测方法\[J\]. 湖南大学学报:自然科学版, 2010,37(7):72-77.ZHAO Huan, WANG Gangjin, ZHAO Lixia, An inproved minimum search method for noise estimation\[J\].Journal of Hunan University:Natural Sciences, 2010,37(7):72-77.(In Chinese)\[3\] 覃爱娜,戴亮,桂卫华. 基于听觉掩蔽效应和最优平滑的语音增强算法\[J\].计算机工程,2013,39(8):27-30.QIN Aina, DAI Liang, GUI Weihua. Speech enhancement algorithm based on auditory masking effect and optimal smoothing\[J\]. Computer Engineering,2013,39(8):27-30.(In Chinese)\[4\] 胡昌华,李国华,刘涛,等.基于matlab6.x的系统分析与设计—小波分析\[M\].西安:西安电子科技大学出版社,2004: 5-9.HU Changhua, LI Guohua, LIU Tao,et al. Analysis and design of the system based on matlab6.x-wavelet analysis\[M\]. Xi'an: Publisher of Xidian University,2004: 5-9.(In Chinese)\[5\] LEE B,LEE K,ANN S.An EMbase approach for parameter enhancement with all application to speech signals\[J\].Signal Processing,1995,46:1-14.\[6\] ZHANG Weiqiang,SONG Guoxiang.A translationinvariant wavelet denoising method based on a new thresholding function\[C\]//International Conference on Machine Learning and Cybemetics.2003,2341-2345.\[7\] BARRI A, DOOMS A, SCHELKENS P. The near shiftinvariance of the dualtree complex wavelet transform tevisited \[J\]. Journal of Mathematical Analysis and Applications,2012,389(2): 1303-1314.\[8\] 戴亮. 非平稳噪声环境下的语音增强算法研究\[D\]. 长沙:中南大学,2012:32-34.DAI Liang. Research on speech enhancement algorithms in nonstationary noise environment\[D\]. Changsha:Central South University,2012:32-34.(In Chinese)\[9\] 董胡,钱盛友.基于小波变换的语音增强方法研究\[J\].计算机工程与应用,2007,43(31):58-60.DONG Hu, QIAN Shengyou. Research on speech enhancement based on wavelet transform\[J\].Computer Engineering and Applications,2007,43(31):58-60.(In Chinese)\[10\]QUACKENBUSH S R, BARNWELL T P,CLEMENTS M A.Objective measures of speech quaintly\[M\].Englewood Cliffs,NJ:Prentice Hall,1988:88-96.\[11\]卜凡亮,王为民,戴启军,等. 基于噪声被掩蔽概率的优化语音增强方法\[J\].电子与信息学报, 2005,27(5):753-757.BU Fanliang, WANG Weimin, DAI Qijun, et al. Optimizing speech enhancement based on noise masked probability\[J\]. Journal of Electronics & Information Technology, 2005,27(5):753-757.(In Chinese)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
analvsis
abilitv SO
that
●
it
can
better
simulate
the Irequencv
analvsis
characteristics
ot
human
ear.In this
pal
.a
.
new
algornittnhmm。 is pDrroposseed
ftoort spoeeeecclh3
fO.oV,0<厂<500
z={0.oovf+1.5,500≤f<1 220
(1)
t 61n f一32.6, f≥1 220
令小波多分辨分析中的滤波器系数分别为h孟和g孟,
f咖(右)=∑h孟dp(2t—k) I_哕(右)=∑g孟dp(2t一尼)
图1 Bark尺度小波包分解结构示意图
Fig.1 Decomposition structure of Bark--scaled wavelet package transform
进行Bark尺度小波包变换,采用结点阈值法进行阈值操
作,选取参数为。
噪声为白噪声时,进行了不同信噪比下的对比实验,对
比算法为R.Martin提出的谱减法。实验结果表明,信噪比
较高时,本文算法接近谱减法,而信噪比较低时则远远优于
谱减法。图3给出了信噪比为一5 dB时的实验结果。
1 ∞
≮
赵0
1吨nⅢ}
一1 O
●
●
1●
●
●
11
1
1
●
1
●
●
1●
nOUS nOlSe con(1ltlons.esoeelaLlV UnCIer cOlor noise ano non-statlonarV nOlSe con(1ltlons.
Key words:speech enhancement;Bark-scaled wavelet packet decomposition;node threshold;spectral entropy method
2 ∞ ¥
._.…▲…■L..I一-一…~.
-一11 寇0
二1£衄l
一一_r。
-2
0
0.5
1
1.5
2
t|S
(d)谱熵法增强后的语音信号
(d)Enhancing speech with spectral entropy
图3信噪比为一5 dB的含白噪声的语音信号增强结果
Fig.3
Enhancement results of speech signal containing white noise while SNR is一一1气 I dB
(2)计算结点n处的归一化谱熵
B
Entropy(711)=∑P咖log P咖
(6)
(3)估计频谱强度和噪声标准差,确定结点阈值
利用直方图估计每一结点的频谱强度,并设辅助阈:
o(n)=Entropy(n)·NUM凡·卢
(7)
于是得到噪声标准差:
吒,孟=nb×W
(8)
式中:儿6为大于o(n)的直方条数目,w为直方条的宽
收稿日期 万:方20数06-据06 Received Date:2006-06
结果中存在音乐噪声,因此达不到令人满意的效果。 MMSE和维纳滤波方法计算量适中,但没有提供在语音 信号的失真和残留噪声之间进行控制的机制。
基于小波变换的信号去噪是近年来发展起来的去噪 新方法,它利用信号和噪声的小波系数在各尺度上的不 同分布特性,采取阈值的方法,达到去除噪声的目的∞J。 常用的小波变换去噪法一刮以阈值的形式虽然可以对带 噪语音去除噪声,但去噪同时也丢失了大量语音清音信 息,严重影响了重建信号的质量。小波包变换是在小波 变换基础上进一步提出的,具有很好的频带划分功能。 文献[9—10]采用小波包变换对语音信号进行增强,但这 些方法是在高斯白噪声前提下提出的,具有很大局限性,
—IJ_● L.
—__1I
O.5
一
1
1.5
t/s
_o r。
(a)原始纯净语音信号 (a)Pure speech signal
_ _
2
5 ∞ ≮
越0
1衄
-£=L
-5 O
O.5
1
1.5
2
t/s
(b)信噪比为一5 dB的带噪语音信号
(b)Speech signal with SNR is-5 dB
t/s
(c)谱减法增强后的语音信号 (c)Enhancing speech with spectral subtraction
幅值很小,所余系数主要由语音信号控制。因此阈值法对
小波系数设置一个门限,仅利用超过门限的那些显著的小
波系数来重构语音信号,这样可较好地去除噪声。
常规小波阈值方法是在高斯白噪声前提下提出的,
在小波包分解情况下,阈值为人=叮以ln(儿l092 N),盯=
MAD/O.674 5,MAD是第一层小波系数的绝对值取中
图中针对8 kHz的采样信号,在原1 7个频带分解基 础上,对625 Hz以下频带和3 000~4 000 Hz频带进一步 分解,使其子带中心频率相差1/2 Bark,最终得到24个 子频带。(m,儿)表示对信号进行第m级分解得到的第儿 个结点。对16 kHz采样信号可在高频带做进一步分解。 图2是对应小波包分解得到的子带中心频率与人耳实际 特性的比较图,实线代表按式(1)得到的人耳bark—Hz曲 线;水代表本文提出的24子频带bark尺度小波包分解结 构。从图2中可见,采用的小波包很好地模拟了人耳听 觉特性。
1引
...:L一
目
由于环境的影响,语音识别系统不可避免的受到各 种噪声的污染,系统性能下降。为此,人们提出许多语音 增强算法来从带噪语音中尽可能地提取纯净的原始 语音。
一般来说,语音增强的方法分为2大类:时域方法 (如子空间法)u剖和频域方法(如谱减法旧J、最小均方误 差(MMSE)估计M1和卡尔曼滤波法∞1等)。时域方法一 般计算量较大,而频域法计算量较小,其中,谱减法是近 年来研究较多的方法,它具有计算量小的特点,但在处理
提出了一种新的基于结点阈值的小波包变换语音增强算法。采用Bark尺度小波包对含噪语音进行分解,在语音信号的子带层
次上进行阈值操作,并采用软阈值方法进行阈值处理。采用谱熵法估计结点噪声。实验表明,该算法在多种噪声,尤其是有色
噪声和非平稳噪声条件下均有较好的语音增强效果。
关键词:语音增强;Bark尺度小波包分解;结点阈值;谱熵法
与实际应用环境并不符合,因此,本文采用谱熵法帕1估计
噪声,步骤如下:
(1)用小波包分解系数直方图估计每一终端结点的
频谱密度函数(设直方图中有B个直方条)
Pn,b=蒜,¨1,2,…,B
(5)
式中:儿配m砌为在直方条b中的小波系数C舶的数目,
NUM凡为该终端结点的系数总数目,n=1,2,…,24是结
点(.7,k)的序列号,按频率大小排列。
纯净语音样本来源于安静环境下8 kHz采样的自然
连续语音,噪声来源于噪声数据包NoiseX92,选取了白噪
声(White)、F1 6战机噪声(F1 6)、粉色噪声(Pink)、工厂
噪声(Factoryl)和汽车噪声(Car)。通过改变噪声强度,
构造不同信噪比的含噪语音。采用5阶Daubechies小波
本文在上述研究的基础上提出了一种新的阈值选取
方法,称之为“结点阈值法",它是对每个小波包树的终
札=吒,孟痂 端结点应用不同的阈值,表示为:
(4)
式中:盯舶是小波包树终端结点(歹,k)处的噪声标准差。
这种阈值取法突破了高斯白噪声和平稳噪声的局限性。
在上述各种阈值中,都存在噪声标准差盯的估计问
题。传统的MAD估值方法是在高斯噪声前提下提出的,
第28卷第5期 2007年5月
仪器仪 表学 报
Chinese Journal of Scientific Instrument
VoL 28 No.5 May 2007
结点阈值小波包变换语音增强新算法
王娜,郑德忠 (燕山大学电气工程学院秦皇岛066004)
摘 要:人耳频率分辨率是非线性的,而小波包算法有灵活的时频分析能力,可较好的模拟人耳基底膜的频率分析特性。本文
耳Bark域频率频率感知特性相似的小波包分解结构,称之 为“Bark尺度小波包分解"。常规方法是模拟人耳的24个 频率群,对于8 kHz采样的语音信号,选取1至第17个频 率群,得到的每个子带的中心频率相差1 Bark。实验证实, 如果对Bark域进行更细致的划分,对语音的描述会更加细 致,也不会导致较大的计算量u1|。因此,本文提出一种新 的小波包分解结构,如图1所示。
卜(右)=在∑厄(尼)lZn(2t一尼)
N
墨
毒
I_配2州(右)=在∑厄(尼)lZn(2t一尼)
冀 o
if-
万方数据
图2 小波包分解对人耳Bark域频率描述的模拟示意图
Fig.2 Illustration of simulating Bark field frequency
●
●
●
,I
●
perception characterlstlc o土human ear using wavelet
package d小波语音增强新算法
基于阈值的小波域语音增强算法是一种直观而有效 的去噪方法。语音信号与噪声的小波变换呈现的特性截
954
仪器仪表学报
第2 8卷
然相反,语音信号的小波变换模值随小波尺度的增加而增
加,而噪声的模值随小波尺度增加而减小。这样,连续若
干次小波变换后,噪声所对应的小波变换系数基本去除或