谱减法降噪技术研究
改进谱减法结合端点检测的语音降噪

改进谱减法结合端点检测的语音降噪作者:王羔则来源:《价值工程》2020年第25期摘要:基本谱减法在在低信噪比下滤波性能不佳,會有大量的噪声残留,本文提出一种基于能量阈值的自适应谱减滤波算法,并进一步引入基于Teager能量算子的语音端点检测,实现低信噪比下的语音降噪。
Abstract: The basic spectral subtraction method has poor filtering performance at low SNR,resulting in a large amount of residual noise. This paper proposes an adaptive spectral subtraction filtering algorithm based on energy threshold. the speech endpoint detection based on Teager energy operator is further introduced to realize speech noise reduction under low SNR.关键词:语音降噪;能量阈值;TeagerKey words: speech denoising;the energy threshold;Teager中图分类号:TN912 ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; 文献标识码:A ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ;文章编号:1006-4311(2020)25-0222-030 ;引言语音通信是人们生活中最直接、最有效、最常用的通信方式之一,研究含有噪声的语音信号具有巨大的经济意义。
语音降噪是指在带噪语音信号中滤除噪声的过程,常见的语音降噪算法有谱减法[1]、最小均方差法[2]、维纳滤波法。
在高信噪比条件这三种算法均能取得明显的滤波效果,但是在低信噪比下,以上算法均无法有效的实现语音降噪。
基于 S 变换和谱减法的语音降噪

在 现实 的生 活 中 , 语音 信号 很难 避免 受到各 种 噪音 的污染 , 而语 音 增强一 个 重要 的 目的就是 把带 有噪 声的语音尽可能的去除噪声. 语音增强技术在语音编码 , 识别等语音处理领域发挥重要作用. 目前主流 的 语 音处 理 的研究 方 向有时 域处 理方法 、 频 域处 理方 法 以及时 频联合 域处 理方 法等 三大 类. E l i 具体分 为 短 时
的谱减法语音增强方法 , 将语音 变换 到时频联合域 内进 行谱 减, 从 而得到较纯净 的语 音, 再利用逆 s变换 将增 强
后语音还原输 出. 实验结果表 明, 该方法有较好 的语音 降噪能力并提高 了性 噪比. 关键词 : 离散 s变换 ; 时频联合域 ; 语音 降噪 ; 谱减 法 中图分类号 : T P 3 9 1 文献标识码 : A 文章编号 : 1 6 7 3 —1 6 2 X( 2 0 1 4 ) 0 4 -0 0 3 6 —0 5
基 于 S变 换 和 谱减 法 的语 音 降 噪
胡 国华 , 李
( 1 . 安徽大学 计算智能与信号处理教育部重点实验室 , 合肥 摘
锐
2 3 0 6 0 1 )
2 3 0 0 3 9 ; 2 . 合肥学院 电子信息与 电气工程系 , 合肥
要: s变换是一种有效 的时频表示方法 , 具有短时傅里叶变换和小波 变换 的优点 , 通 过提 出一个基于 s变换
De p a r t me n t o f E l e c t r o n i c s a n d El e c t r i c a l En g i n e e r i n g,H e f e i Un i v e r s i t y ,He f e i 2 3 0 6 0 1 , Ch i n a )
一种改进型谱减法在短波语音通信中的应用研究

一种改进型谱减法在短波语音通信中的应用研究摘要:短波语音通信中往往混杂有很多干扰和背景噪声,为了尽可能减小这些噪声,在接收端还原出更为清晰的语音,文章通过对常见语音增强算法进行仿真对比,选用谱减法并进行实现后成功应用于短波语音通信系统。
实际使用结果表明,文章提出的算法能有效抑制短波语音中的噪声干扰,显著提高了接收语音质量。
关键词:语音增强;改进型谱减法;短波;通信短波语音通信具有无可比拟的顽存性、机动性和灵活性等优越性,在广播和日常生活等多方面得到了广泛应用,但短波极易受到外界干扰,严重影响了语音通信质量。
因此如何有效抑制或滤除背景噪声一直是人们研究的热点。
语音增强的目的是从噪声背景中提取有用的语音信号,抑制、降低噪声干扰的技术。
语音增强的目的是改进语音质量,尽可能消除背景噪声、提高信噪比,同时提高语音自然度、可懂度和说话人的可辨度。
为了在短波语音通信中进一步减小噪声,还原出更加清晰的语音,有必要采取语音增强技术对接收端的语音进行进一步处理。
1 几种常见的语音增强算法的去噪效果比较常见的语音增强算法有短时谱MMSE法、谱减法、维纳滤波法等,为了检测它们的去噪效果,我们对三种算法在不同输入信噪比下的输出信噪比进行了仿真比较:从图1可以看到,三种常用的语音增强技术在不同噪声环境下对带噪语音的降噪效果不同。
短时谱MMSE法在三种算法中似乎具有最佳的降噪效果,其实不然。
短时谱MMSE法在大幅提高语音的SNR的同时也提高了噪声的幅度,因此很少进行实际应用。
谱减法和维纳滤波法相比,在输入信噪比为-7 dB以下或8 dB以上时,谱减法具有更高的输出信噪比。
在-7 dB到8 dB之间,维纳滤波法的性能更好一些。
由于我们通常接收到的可辨短波语音信噪比都在8 dB以上,因此我们选用谱减法进行实现。
2 谱减法原理谱减法又称谱相减法,即从带噪语音的频谱估值中减去噪声的频谱估值,从而得到“纯净语音”的频谱。
由于人耳对语音频谱分量的相位不敏感,因而这种方法主要针对短时功率谱。
谱减法

谱减法实验原理谱减法是利用噪声的统计平稳性以及加性噪声与语音不相关的特点而提出的一种语音增强方法。
这种方法没有使用参考噪声源,但它假设噪声是统计平稳的,即有语音期间噪声幅度谱的期望值与无语音间隙噪声的幅度谱的期望值相等。
用无语音的间隙测量计算得到的噪声频谱的估计值取代有语音的期间噪声的频谱,与含噪声语音频谱相减的估计值。
当上述差值得到负的幅度值时,将其置零。
由于人耳对语音的感知主要是通过语音信号中各频谱分量幅度获得的,对各分量的相位不敏感。
因此,此类语音增强方法将估计的对象放在短时谱幅度上。
谱相减法的优点是:总体上运算量较小,容易实时实现,增强效果也较好,是目前最常用的一种方法。
缺点是:谱相减法利用在无声期间统计得到的噪声方差代替当前帧的噪声频谱时,若该帧某频点上的噪声分量较大,则相减后有较大的噪声残留,频谱上有相应的而随机尖峰出现。
增强后的语音会夹杂着有节奏的音乐残留噪声。
增强后的语音中含有明显的“音乐噪声”,这是由频谱相减而产生的一种残留噪声,具有一定的节奏起伏感,故而得名“音乐噪声”。
“音乐噪声”产生的原因是因为在谱相减法过程中,是以无声期间统计平均的噪声方差代替当前分析帧的噪声频谱分量。
而噪声频谱具有高斯分布,即其幅度随变化范围很宽,因此相减时,若该帧某频率点噪声分量较大,就会有很大一部分保留,在频谱上呈现随机出现的尖峰,在听觉上形成有节奏性起伏的类似音乐的残留噪声。
一、课题提出的背景与研究现状语音是人类相互间交流时使用最多、最基本的信息载体。
在实际环境中,语音信号总是会受到外界环境噪声的干扰,这些噪声包括从周围环境、传输介质中引入的噪声、通信设备内部电噪声甚至其他人说话人的干扰等等。
这些干扰会使接受端的语音成为受噪声污染的语音,当噪声干扰过于严重时,语音将会完全淹没于噪声之中,使其不能被分辨出来。
语音质量的下降会使许多语音处理系统的性能急剧恶化。
比如,语音识别系统在实验室环境中可取得相当好的效果,但在噪声环境中,尤其是在噪声环境中使用时,系统的识别率将受到严重影响。
谱相减法语音增强技术中_音乐噪声_的抑制

时的统 计平均得到 & 设为 ! ,(&# ’& 对 于 分 析 帧 内 的 短 时平稳过程 &即可得到原始语音幅度谱的估计值 !
!YR
R
, ,( &# ’ W " -,(&# ’ %! ,(&#’ $
R
R
,$’
由于人耳对语音的感知是通过语音信号中各频谱 分量的幅度获取的 & 对各分量的相位则 不敏感 Q!T& 因此 直接用带噪语音的相位作为增 强以后的语音相位 & 就 可得到原始语音的估计值 *
噪声谱幅度的比值 # 并据此计算出各比值大于 =>&% 的 带宽 ( 如果带宽大于一定的数值 )# 则判定为语音信号 的谱峰 #同时在其两侧作一定带宽的拓展 # 相应的谱减 因子设定为略大于 ; 的数值 # 否则认为是随机的噪声 谱突起 # 将谱减因子设定为较大数值以削弱残余噪声 谱峰 * 谱幅度的比值低于 =>&% 的其它部分可通过实验 设定为一合适的数值 ( 在 & @AB 以上时 # 由于语音谱峰的影响已不明显 # 但笔者通过统计发现 # 针对工厂噪声 + 坦克噪声等能量 主要分布于低频的噪声而言 #’ E) 情况下语 音的高频 部分的功率谱将明显高于噪声的功率谱 # 因此在高频 部分考虑带噪语音谱峰 &>% 倍以上的噪声功率谱的带 宽 # 带宽大于 &’’ AB 的部分 # 认为是语音谱突起 # 相应
(E/8 F5@0; ) MJ,,B/ ,-/7-B,I,-; + MJ,B;?7H M5=;?7B;0>- I,;/>E + M5=;?7B;0>- @7B;>? + I7G-0;5E,%=7-EC0E;/ 7-7H9M0M
一种基于改进谱减法的语音去噪新方法

人们在语音通信过程中不可避免地会受到来自周 围环境、 传输媒介 引入的 噪声 的干扰。 在各种 语音处 理的应用中, 由于背景噪声 使得语 音质 量降低 的现象 非常普遍, 例如在移动通讯 和语音 识别 中就希 望语音 信号有尽可能高的信噪比, 因此设 法去 除语音 信号中 的非相关 噪声, 提 高语 音信 号的 信 噪比, 改善 语 音质 量, 即语音去噪技术就成为 语音研 究中 的一个 重要课 题。 目前语音信号的 去噪 方法大 体上 有四类: 噪声对 消法、 谐波增强法、 基于参数估计的语音再合成法和基 于语音短时谱 估计的 增强 算法
0
引
言
点, 在假设噪声是统计平稳的前提下, 用无语音间隙测 算得到的 噪声 频谱 估计 值 取代 有语 音期 间 噪声 的频 谱, 与含噪 语音 频谱 相 减, 从 而获 得语 音 频谱 的 估计 值。谱减法具有算法简单、 运算量小的特点, 便于实现 快速处理, 往往能够获得较高的输出信噪比, 所以被广 泛采用。该算法经典形式的不足之处是处理后会产生 具有一定 的节 奏性 起 伏、 听 上去 类似 音 乐的 音 乐噪 声
k) 是无话时 | N k | 的统计
2 1/ 2
节这两个参数可使 去噪效 果达到 比较好 的增 强效果。 但过多增加去噪程度会使增强后的语音失真增大。
平均。 此时, 原始语音的估计值如式( 4) 所示: | S ^ k | = [ | Y k | - E[ | N k | ] ]
n(
= [ | Yk | ( 4)
i= 1
∀ ^s 2( i )
N
N
( 8)
短时过零率为: 1 ∀1 | sgn[ ^s ( i ) ] - sgn[ ^s( i - 1) ] | ( 9) 2 n= 式中 ZCR 表示一帧信 号样 本改 变符号 的次 数即 过零 ZCR = 率。 其中 sgn[ ] 是符号函数:
帧间自适应的压缩感知谱减去噪方法
帧间自适应的压缩感知谱减去噪方法摘要:针对应用压缩感知理论对含噪语音进行去噪其信噪比低的问题,以及应用谱减法对含噪语音去噪后语音信号仍不清晰的情况,提出帧间自适应的压缩感知谱减去噪方法。
同时,由于传统压缩感知理论不能使语音信号在重构时实现帧间自适应的去噪效果,对此缺陷提出一种改进算法,并且将该算法应用到谱减法的去噪过程中。
相比于经典的谱减法,实验结果表明,所提算法对含噪语音进行去噪不仅可以提高含噪语音的去噪效果,还可以有效地解决谱减法无法去除背景噪声及音乐噪声的问题。
关键词:压缩感知;谱减法;语音去噪;正交匹配追踪算法中图分类号:TN912.3?34 文献标识码:A 文章编号:1004?373X(2017)09?0014?04Abstract:Since the noisy speech denoising based on compressed sensing theory has low signal?to?noise ratio,and the spectrum subtraction used to denoise the noisy speech still has poor speech signal,a speech denoising method based on adaptive inter?frame compressed sensing of spectrum subtraction is put forward. The traditional compressed sensingtheory can′t realize the adaptive inter?frame denoising effect while reconstructing the speech signal,so an improved algorithm is proposed,and applied to the denoising process of the spectrum subtraction. The experimental results show that,in comparison with the classical spectrum subtraction,the proposed algorithm used to denoise the noisy speech can improve the denoising effect of the noisy speech,and effectively eliminate the background noise and music noise that the spectrum subtraction can′t do.Keywords:compressed sensing;spectrum subtraction;speech denoising;orthogonal matching pursuit algorithm0 引言目前,有越来越多的研究已证明压缩感知(Compressed Sensing,CS)理论[1]能够使语音信号在较大的压缩比下达到较好的重构效果[2?4]。
谱减算法
基于噪声短时谱动态估计的语音增强谱减算法摘要针对某型塔台接收机模拟降噪存在的不足,采用语音增强中的普减及其改进算法实现接受语音信号的增强,谱减法增强语音后残留“音乐噪声”明显,影响语音清晰度的问题,在分析现有的噪声谱减算法基本特性的基础上,提出一种基于噪声短时谱动态估计的语音降噪方法。
通过估计噪声短时功率谱及其变化趋势,动态调整谱减法中的过减系数,有效抑制残留噪声。
仿真实验表明,新的谱减算法在提高语音信噪比的同时保持较小的失真度,具有较好的增强效果。
关键词塔台;语音增强;噪声短时谱估计;谱减;过减系数引言语音是人与人进行信息传递和情感交流最直接、最重要的方式。
但是,人们在语音通信中总是受到来自自然环境、传输媒介、通信设备内部或其他讲话者的干扰。
这些干扰使原始语音受到噪声污染,严重时会使原始语音无法分辨。
语音增强的目的是从带噪语音信号中尽可能提取纯净的原始语音。
谱减法是常用的语音增强方法[1],其特点是运算量少,易于实时实现。
但是,谱减法存在一个主要问题:由于对噪声的估计不准确,以固定的方式减去噪声功率谱使增强效果难以达到要求,同时,由此造成大量残留的“音乐噪声”,影响了增强语音的清晰度。
因此基于谱减法的语音增强算法的实际应用还有待于更深入地研究。
某型塔台接收机采用的是模拟信号降噪,处理后送往扬声器或耳机的语音仍有较多的噪声存在,给塔台指挥人员正确及时地监听直升机电台语音信号造成一定的困难,严重时甚至会影响塔台指挥人员对飞行的正确指挥。
本文在谱减法基础上引入过减系数, 并利用噪声平滑公式及时更新噪声估计值,根据噪声变化趋势动态调整过减系数,对谱减法进行进一步改进,以达到更好的增强效果和语音清晰度。
1 语音增强谱减算法谱减法的基本思路是[2]:假设在加性噪声与短时平稳的语音信号相互独立的条件下,从带噪语音的功率谱中减去噪声功率谱,得到较为纯净的语音频谱,从而估计出原始语音。
设()s t 为纯净的原始语音信号,()n t 为噪声信号,()x t 为带噪语音信号, 则有()()()x t s t n t =+ (1)用()X ω,()S ω,()N ω分别表示()x t ,()s t ,()n t 的傅里叶变换,对(1)式两端进行傅里叶变换,根据傅里叶变换的线性性质可以得到()()()X S N ω=ω+ω (2) 对(2)式两端取模后再平方,可得()()()()()()()()222cos S N X S N S N S N θθ22|ω|=|ω+ω|=|ω|+|ω|+|ω|⋅|ω|- (3)由于()s t 和()n t 相互独立,()cos S N θθ-一项为0 ,可得()()()2X S N 2|ω|=|ω+ω| (4)由于相对平稳的噪声信号可认为发音前和发音期间的变化甚小,所以可以通过发音前的“ 寂静段”信号的功率谱来估计发音期间噪声的功率谱,从而得到原始语音功率谱的估计值为()()()12S X 22⎡⎤|ω|=|ω|-|N ω|⎣⎦ (5) 根据人耳对语音信号相位不敏感的特点,可以用噪声信号的相位来代替估计之后语音信号的相位,进行傅里叶逆变换, 即可得到增强后语音的时域信号。
谱减法原理及其实现过程
(二〇一二年六月语音信号处理专题报告学校代码: 10128 学 号:题 目:谱减法原理及其实现过程 学 院: 专 业: 学生姓名: 学 号: 班 级:谱减法原理及其实现过程摘要本文主要研究谱减法原理及其实现过程及了解其在语音增强中的应用,目的是增强语音质量,减少语音失真和提高其可懂度。
S. Boll 假设噪声是平稳的或缓慢变化的加性噪声,并且语音信号和噪声信号不相关的情况下,提出了谱减法(SS:Spectral Subtraction)。
该方法能够抑制背景噪声的影响,但由于其局部平稳性的假设与实际情况并不相符,因此效果不理想,残留的音乐噪声较大;Berouti 在传统谱减法的基础上增加了调节噪声功率谱大小的系数和增强语音功率谱的最小值限制,提高了谱减法的性能,但是其修正系数和最小值是根据经验确定的,适应性较差;P. Lockwood在谱减法的基础上提出了非线性谱减法(NSS:Non-liner Spectral Subtraction),它根据语音信号的信噪比自适应调节语音增强的增益函数,提高了语音的信噪比,而信噪比并不能正确反映信号的听觉质量,因此用信噪比作为调整估计参数的依据并不能提高信号的听觉质量;Boh Lim Sim等人也提出了与此相近的改进算法,虽然提高了信号的信噪比,但残留的音乐噪声较大;Virag将人耳的掩蔽特性应用到非线性谱减法的增强算法中,部分解决了谱减法残留音乐噪声大的问题,但在信噪比较低或非平稳的情况下,其增强效果不理想;I.Cohen 等人首先估计语音信号概率密度函数,然后在此基础上改进了对数谱估计算法,使得改进的算法对非平稳噪声具有良好的抑制作用,该算法的缺点是语音信号的概率密度函数较难估计。
噪声参数估计的准确与否直接会影响谱减法语音增强效果,因此,带噪语音中背景噪声参数的估计问题值得关注。
最后,基于噪声与语音具有一定的相关性的实际情况,我们提出了算法的进一步改进设想,并对此思想做出了数学推导,得到了算法进一步改进的方向及可行性。
RASTA_PLP技术与谱减相结合的去噪方法
第26卷 第5期2000年9月自 动 化 学 报A CT A A U T OM A T ICA SI NI CAV o l.26,N o.5Sep.,2000研究简报RASTA -PLP 技术与谱减相结合的去噪方法1)吕成国 王承发 李俊庆 韩纪庆 徐近霈(哈尔滨工业大学计算机科学与工程系 哈尔滨 150001)(E -mail:lcg @ )关键词 语音识别,噪声抑制,谱减,隐马尔可夫模型.1)本文曾在第五届(1998年)全国人机语音通讯学术会议上宣读.收稿日期 1998-09-16收修改稿日期 1999-03-31A NOISE CANCELLATION METHOD BASED ON RASTA -PLPTECHNOLOGY AND SPECTRAL SUBTRACTIONLU Chengg uo WANG Cheng fa LI Junqing HAN Jiqing XU Jinpei(Department of Comp uter S cien ce and E ngineering ,H arbin Institute of T echnology ,H arbin 150001)Key words Speech recognit ion,noise suppression,spect rum subtract ion,hidden M arkov model.1 引言本文研究的是抑制加性的环境噪声和通道的卷积噪声,加性噪声可以用谱减法去除;而通道噪声相对来说是一个缓变的部分,因而可以采用RAST A -PLP (RELATIVESPECTRAL LINEAR PREDICT IVE)[1]算法,通过一个差分-积分滤波,去掉通道对原始信号的影响.采用RASTA -PLP 技术和谱减相结合的方法对噪声进行去除,取得了良好效果.2 特征提取的RA ST A -PLP 技术特征提取的整个过程如图1所示.语音信号以16kHz 的速率量化为16bit 的数字量,以8ms 的间隔分为16ms 的波形帧进行处理,窗函数采用Hamming 窗.输出的特征包括能量、12阶倒谱系数以及它们的一阶、二阶差分特征共39维特征.对语音信号进行LPC 分析,得到线性频域尺度上的谱后,用RAST A-PLP 法分析,图1 特征分析流程得到公式推导[2]1)将功率谱根据下式转换到Bark 域B =6lnf600+f 6002+11/2,0≤f ≤8kHz,(1a)f =600sin(B /6), 0≤B <25.(1b) 2)根据听觉特性,求出各个Bark 带内的Bark 谱值P (j )=∑2.5B =-1.3S (j-B ) (B ), j =0,1,2,…,24,(2)其中P (j )为Bar k 带的功率谱,而 (B )为听觉屏蔽窗函数,其形式为(B )=0,B <- 1.3,102.5(B +0.5)- 1.3≤B ≤-0.5,1,-0.5<B <0.5,10-(B -0.5),0.5≤B ≤2.5,0,B > 2.5.(3) 3)取对数将Bark 谱转换为Bark 域中的对数幅谱:R (i )=ln P (i ), i =0,1,…,24.(4) 4)差分-积分滤波:对对数幅谱R (i ),用下面的滤波器H (z )作差分-积分滤波,以消除缓变的通道影响H (z )=0.1*2+z -1-z -3-2z -4z -4(1-0.98z -1).(5) 5)求解R ′(i ),用离散余弦变换求出倒谱系数,其阶数为12C k =1M ∑24i =0R ′(i )co s(2 ki /M ), M =25,k =1,2, (12)(6) 6)短时能量特征的计算Eng =10ln ∑Ni =0x (i )2.(7) 7)特征平滑采用三点中值滤波器C k (t )=media C k (t -1),C k (t ),C k (t +1).(8) 8)对倒谱系数加权处理C k =C k +C k *(9) 9)求一阶差分与二阶差分特征718自 动 化 学 报26卷c k (t )=G ∑+2m =-2mc k (t +m ); 2c k (t )=G ∑+1m =-1m c k (t +m ).(10) 最后,特征矢量由39维的特征组成.在以上计算中加入谱减,应该放在求出功率谱之后,Bark 域分割之前.3 谱减技术谱减技术是一种实用性很高的方法,它以噪声频谱是叠加在语音频谱之上的这一假设为基础,可以在语音的无声段采集噪声,因而可以先估计噪声频谱,而后从混噪语音频谱中减去噪声频谱.谱减可用如下的公式[3]来表示Y (w ) = X (w ) - N (w ) ,(11)这里 X (w ) 是混噪语音幅值谱的短时谱估计, N (w ) 是利用无声段估计出的噪声频谱, Y (w ) 是去噪后语音频谱.在我们的谱减中,在语音识别开始时对噪声采样若干帧,对其取平均值.随着识别的继续进行,在每次语音的端点检测时,对判为无语音的噪声段,取若干帧,并将它与开始取的噪声作加权平均计算,所得结果作为这次识别的噪声.这种方法既继承了线性谱减的简单性,又考虑了噪声的非稳定性,不会由于采用唯一的噪声样本而引起误差的增大.在加权计算均值时,取本次噪声权重为0.8,原噪声权重为0.2.4 系统的模型表示系统采用多码本的半连续隐M arkov 模型(SCH MM )作为系统建模的基本方法.对每一个词,通过训练建立一个显式的HM M 模型.模型的拓扑结构为N 状态的从左向右无跳转形式的Bakis 结构.典型地N 取5.把输入的39维特征看作4个矢量流:能量及其一、二阶差分,倒谱、差分倒谱、二阶差分倒谱.这样每一帧矢量在模型的状态上的产生概率可以表示为P r (O t i )=∏4k =1∑Mm =1C k im N k (O k t ,!km ,∑km ),(12)其中O t 表示39维特征,O k t 表示第k 个流对应的特征,N k(…)表示第k 个流对应的码本中的码字(正态分布),而C kim 表示第k 个流的第m 个码字在状态i 的混合权.每个码本由若干正态分布函数表示,我们选取的码本大小为能量码本大小为64,其余三个码本大小为128.码本的训练算法采用LBG [4]方法.模型训练采用F-B(Forw ard-Backw ard)算法[5].5 实验结果本系统实验采用的背景噪声为歼-82战斗机座舱环境的噪声录音的重放,噪声无太大起伏,噪声强度分别选取了75dB 、85dB 、90dB 、95dB;实验室的环境噪声为45dB,主要为微机噪声(用来测量噪声的仪器为PSJ -2A 普通声级计,采用A 档).7195期吕成国等:RA ST A -P L P 技术与谱减相结合的去噪方法表1 实验结果训练时噪声(dB)识别时噪声(dB)识别率第一侯选词前二侯选词前三侯选词454598.5%99.0%99.0%457595.5%97.0%97.5%458594.5%95.0%96.0%459076.5%80.5%90.5%459574.0%75.5%89.5%从上表的结果可以看到,本文所采用的谱减法与RAST A-PLP技术相结合的噪声抑制方法,在高噪声环境下的语音识别上应用,取得了满意的结果.参考文献1 Hermansky H,Morgan N,Bayya A,Kohn P.RAST A-PLP speech analysis techn iq u e.In:Proceedings of1992 IEEE International Confer ence on Acou stics,Speech and S ignal Processing.San Francisco,California,Les Niles, 1992,(1):121~1242 Hermansky H.Perceptual Lin ear Predictive(PLP)an alysis of speech.Journal of Acoustica l S ociety of A merica.1990,87(4):1738~17523 Boll S.Suppression of acou stic noise in speech using spectral subtraction.I EE E T rans.A coustics,Speech and Sig-n al Processing.1979,27(2):113~1204 Linde Y,Buzo A,Gray R.An algorithm for vector quantizer design.IE EE Tr an munications,1980,28(1): 84~955 Rabiner L R.A tutorial on hidden Markov models and selected application s in speech recognition.In:Pr oceedings of IEEE,1989,77(2):257~286吕成国 男,1973年生。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)周期性噪声
周期性噪声的特点是有许多离散的窄谱峰,它往往来源于发 动机等周期运转的机械,如50或60Hz交流声会引起周期 性噪声。周期性噪声引起的问题可以通过功率谱发现,并 通过滤波或变换技术将其去掉。 无忧PPT整理发布
语音和噪声
(2)冲激噪声
者语音的干扰。例如:车站、商场、娱乐场所的公用电话
、车载电话、机载电话等都要受到强噪声的干扰。在远距
离通讯中传送的语音信号要受到信道噪声和通讯设备自身
噪声的干扰。在这些情况下则需要对带噪语音进行语音增
强处理,以消除背景噪声,提高语音质量。另外在语音识
别系统、语音编码系统中,由于这些系统在设计时一般针
称,和Mathematica、Maple并称为三大数学软件。它在
数学类科技应用软件中在数值计算方面首屈一指。
MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、
创建用户界面、连接其他编程语言的程序等,主要应用于
工程计算、控制设计、信号处理与通讯、图像处理、信号
检测、金融建模设计与分析等领域。 无忧PPT整理发布
无忧PPT整理发布
语音和噪声
• 语音特点
语音信号是一种非平稳的随机信号,但在短时内可看作 平稳随机信号。这是因为人类发声过程的变化速度有一定 的限度,一般在较短的时间内(10~30ms)人的声带与声 道的形状有相对的稳定性,可认为语音是物理特性与频谱 特性近似不变的。语音的短时特性是语音信号分析和处理 的基础,利用这一特性就可以应用平稳随机过程来分析和 处理语音信号。
者语音的干扰。使用未经处理的语音对具有个体特征的语
音数据进行分析时会产生干扰和困难,这就要求我们有更
高的科学技术和方法,本文使用matlab程序对语音中含
有不同类型噪声的语音数据段进行分析,然后通过谱减法
对其进行语音降噪,便能到更清晰的语音,提高语音的可
懂度。通过这种语音的处理方法,达到提高语音鉴定精度
的目的。
无忧PPT整理发布
基本概念
• 引言部分
•
我国自1982年10月1日起试行的《 中华人民共和国民
事诉讼法(试行)》第五十五条规定:“证据有下列几种:
(一)书证; (二)物证; (三)视听资料;(四)证人证言; (五)当事人
的陈述;(六)鉴定结论;(七)勘验笔录。以上证据必须经过查证
属实,才能作为认定事实的根据。第一次将视听资料作为独
基本概念
•
MATLAB目前已经成为国际上最流行的科学与工程计
算软件工具,现在的MATLAB已经不仅仅是一个“矩阵实
验室”了,它已经成为一种具有广泛应用前景的全新的计
算机高级编程语言,有人称它为“第四代”计算机语言,
它在国内外高校和研究部门中正扮演着重要的角色。
MATLAB语言的功能也越来越强大,不断适应新的要求提
谱减法降噪 技术研究
无忧PPT整理发布
基本概念
论文摘要 引言部分 MATLAB
语音和噪声
语音特点 噪声特点 人耳感知
谱减法
谱减法概述
分析实验
谱减法思想
三种噪声
谱减法优缺点
实际案例
无忧PPT整理发布
分析结论
基本概念
• 论文摘要
•
语音在传输过程中不可避免地要受到来自周围环境和
传输媒介引入的噪声、通讯设备内部噪声、乃至其它讲话
出新的解决方法。可以预见,在科学计算、自动控制与科
学绘图领域,MATLAB语言将长期保持其独一无二的地位
。
无忧PPT整理发布
基本概念
MATLAB 的应用范围非常广,包括信号和图像处理、 通讯、控制系统设计、测试和测量、财务建模和分析以及 计算生物学等众多应用领域。附加的工具箱(单独提供的 专用 MATLAB 函数集)扩展了 MATLAB 环境,以解决 这些应用领域内特定类型的问题。
立的诉讼证据予以规定。
•
我国在2019年3月17日在修改刑事诉讼法时增加了视
听资料这一证据种类,从而视听资料在我国三大诉讼证据体
系中的地位得到全面确立,都把视听资料规定为独立证据,
进而完善了我国证据制度。
无忧PPT整理发布
基本概念
•
语音在传输过程中不可避免地要受到来自周围环境和
传输媒介引入的噪声、通讯设备内部噪声、乃至其它讲话
冲激噪声表现为时域波形中突然出现的窄脉冲,它通常 是放电的结果。消除这种噪声可根据带噪语音信号幅度的平 均值确定阈值,当信号幅度超过这一阈值时判为冲激噪声, 然后进行消除。
(3)宽带噪声
宽带噪声的来源很多,如热噪声、气流(如风、呼吸)噪
声及各种随机噪声源等,量化噪声也可视为宽带噪声。由于
宽带噪声与语音信号在时域和频域上完全重叠,因而消除它
无忧PPT整理发布
基本概念
• MATLAB
•
MATLAB 是美国MathWorks公司出品的商业数学软
件,用于算法开发、数据可视化、数据分析以及数值计算
的高级技术计算语言和交互式环境,主要包括MATLAB和
Simulink两大部分。
•
MATLAB是矩阵实验室(Matrix Laboratory)的简
语音信号的最重要的特征表现在它的“短时频谱”(简称
为“短时谱”)上。如果从语音流中使用加窗的方法取出
其中的一个短段,再对其进行傅立叶变换,就可以得到该
段语音的短时谱。
无忧PPT整理发布
语音和噪声
• 噪声特点
噪声来源于实际的应用环境,因而其特性变化无穷,噪 声可以是加性的,也可以是非加性的。考虑到加性噪声更 普遍且易于分析问题,并且对于部分非加性噪声,如乘积 性噪声或卷积性噪声,可以通过同态变换而成为加性噪声, 这里我们仅讨论加性噪声。
除背景噪声,使听者乐于接受,不感觉疲劳,这是一种主
观度量;二是提高语音可懂度,这是一种客观度量。
•
噪声来源众多,随应用场合而异,它们的特性也各不
相同,因此针对不同的噪声,我们将采取不同的语音增强
对策。语音增强中的谱减法是处理宽带噪声的最通用技术,
即从带噪语音估值中减去噪声频谱估值,而得到纯净语音
的频谱。
对的是纯净语音,当这些系统对带噪进行处理的时候将导
致系统性能的急剧恶化,甚至不能正常工作,这时也需要
对带噪语音进行语音增强处理。
无忧PPT整理发布
基本概念
•
语音增强是解决噪声污染的一Fra bibliotek有效方法,它的一个
主要目标是从带噪语音信号中提取尽可能纯净的原始语音。
•
语音增强的目的主要有两个:一是改进语音质量,消
最为困难,这种噪声只有在语音间歇期才单独存在。对于平