基于频谱方差的抗噪声语音端点检测算法

合集下载

基于谱减法的语音增强技术

基于谱减法的语音增强技术

算法实现流程
逆快速傅里叶变换(IFFT)
对增强后的频谱进行逆快速傅里叶变换,得到增强后的时域信号。
后处理
对增强后的信号进行后处理,如门限判决、非线性处理等,以提高增强效果。
算法优化与改进
01
02
03
自适应噪声估计
采用自适应滤波算法,根 据输入信号自动调整噪声 估计的参数,以提高噪声 估计的准确性和鲁棒性。
基于谱减法的语音增强技术是 一种常用的方法,通过去除噪 声成分来提高语音质量。
研究意义
基于谱减法的语音增强技术在实 际应用中具有重要意义,如语音 通话、语音助手、语音识别等。
通过对谱减法的研究,可以深入 了解语音信号的特性,为语音处
理技术的发展提供理论支持。
基于谱减法的语音增强技术还可 以为其他相关领域提供借鉴和参 考,如音频处理、音频分析等。
在实际应用中,谱减法常用于语音信 号处理领域,特别是在语音识别、语 音合成和语音存储等场景中。
谱减法还可以与其他语音增强技术结 合使用,如基于规则的增强方法、基 于神经网络的增强方法等,以进一步 提高语音增强的效果。
通过使用谱减法,可以有效降低噪声 干扰,提高语音信号的清晰度和可懂 度,从而提高语音处理系统的性能。
谱减法在语音增强中表现出较好的效果,能够有效降低噪声干扰,提高语 音质量。
通过对不同噪声环境下的实验,证明了谱减法在不同场景下的适用性和鲁 棒性。
与传统滤波器方法相比,谱减法具有计算复杂度低、处理速度快等优势, 适合实时语音处理应用。
研究不足与展望
当前研究主要集中在谱减法的基 本算法和改进上,对于复杂噪声 环境的适应性还有待提高。
鲁棒性分析
在不同噪声类型和强度下,谱减法均表现出较好的鲁 棒性。

噪声背景下语音端点检测方法的研究

噪声背景下语音端点检测方法的研究

噪声背景下语音端点检测方法的研究摘要:在实际环境中,并没有完全纯净的语音信号,一段语音信号往往都伴有噪声信号,所以研究在背景噪声环境中的语音端点检测更为重要。

常用的短时过零率法、短时能量法以及双门限法都存在着一个共同的问题,即对信噪比要求较高。

为了解决这一问题我们提出了一改进算法,即基于谱减法思想的语音端点检测的方法,有效的提高检测的正确率。

关键词:端点检测噪声短时能量短时过零率谱减法1、引言语音端点检测是指用计算机数字处理技术来找出语音信号中的字或词等的起点和终点这俩个端点。

作为语音识别的前端,准确的端点检测可以提高识别的准确率。

语音端点检测的困难在于一段信号中的无声段或者录制一段语音段的前后人为呼吸等产生的杂音、语音开始处的弱摩擦音或弱爆破音以及终点处的鼻音,这些使得语音的端点需要综合利用语音的各种信号特征,从而确保定位的精确性,避免包含噪音信号和丢失语音信号。

常用语音端点检测法有短时过零率法、短时能量法以及双门限法。

但是对于信噪比要求较高,所以本文提出了一种基于谱减法思想的语音端点检测算法,提高语音端点检测的正确率。

2、语音端点检测方法常用方法中的短时能量法,语音和噪声的区别可以体现在它们的能量上,语音段的能量与噪声段能量相比,要大于噪声段的能量,因此可以以此为依据进行检测;短时过零率法,短时过零率可以区别语音是清音还是浊音[1,2],因此它可以从背景噪声中找出语音信号;传统双门限比较法,首先为短时能量和过零率分别确定两个门限,较低的门限对信号的变化比较敏感,较高的门限是用来确定进入语音段。

当低门限被超过时,未必是语音的开始而很有可能是由很小的噪声所引起的波动,但当高门限被超过并且在接下来的时间段内一直超过低门限时,则意味着语音信号的开始[3]。

但是上述三种方法在低信噪比时检测效果就不是很理想了。

因此我们提出了一种改进算法。

3、基于谱减法思想的语音端点检测算法的研究3.1 谱减法概述由于语音生成模型是低速率语音编码的基础,当语音受到噪声干扰时,提取的模型参数将很不准确,重建的语音质量急剧恶化。

基于频谱方差的抗噪声语音端点检测算法

基于频谱方差的抗噪声语音端点检测算法

第27卷 第9期计 算 机 仿 真2010年9月 文章编号:1006-9348(2010)09-0337-04基于频谱方差的抗噪声语音端点检测算法刘玉珍,连自锋(辽宁工程技术大学电子与信息工程学院,辽宁葫芦岛125105)摘要:在语音识别系统中,对识别的准确性有很重要的作用。

对于纯净语音信号,传统的端点检测算法能够很好地检测语音部分的起止点。

由于在有噪声干扰的情况下,算法的检测准确度往往会急剧下降。

为了改善噪声环境下的端点检测效果,从语音信号和噪声信号频域分布特性的差异出发,用频谱方差数值来区分语音和噪声,提出了基于频谱方差的端点检测算法,并进行了无噪声和噪声环境下的仿真,证明了这种算法在强噪声干扰的情况下也能够取得很好的效果。

同时将新算法和传统的基于LPCC的端点检测算法进行了对比试验,实验结果表明,在噪声环境下,新算法的检测精度有明显提高。

关键词:频谱方差;端点检测;话音活动检测;语音识别中图分类号:TN912.34 文献标识码:AA lgorith m of Anti-noise Endpoi nt D etectionBased on Spectru m VarianceLIU Yu-zhen,L IAN Zi-feng(Coll ege o f E lectron i cs and Info r ma ti on Eng i neer i ng,L i aoni ng T echnica lU niversity,Hu l udao L iaon i ng125105,Ch i na)ABSTRACT:Endpo int detec tion is a cruc i a l techno logy o f preprocessi ng step in speech recogn iti on syste m s.It play sa very i m portant pa rt i n the accuracy o f the recognition results.T o pure speech si gna,l traditi onal endpo i nt detectionm e t hods can a l so achieve fa i r l y good results i n detecti ng the start and endpo i nt.Butw hen i n terfered by no ise,the detection accuracy of such m ethods a l w ays fall s sharply,o r even loses effec tiveness.T here a re differences i n frequencydom ai n bet ween speech and no i se d istri buti on characters.To i m prove the perfor m ance of endpo i nt de tecti on i n no isyenv iron m en t,t h is article takes such d i screpancy as a sta rting po i nt,uses spectru m var i ance to d i sti ngu ish vo i ce andno ise,and proposes a new anti-no isy endpo i nt detecti on me t hod base on spec tru m var i ance.T hen si m ulate t hem e t hod in bo t h pure speech s i gna l and speech w ith wh ite no i se,prove that this ne w m ethod can a l so perfor m we ll under t he c ircu m stances o f ser i ous no ise.A contrast test is also done w ith t he new m e t hod and a trad i tiona l m ethod,based on LPCC.T he outcom e show s t hat the ne w m et hod can ach ieve bette r e ffectiveness.KEY W ORDS:Spectru m va riance;Endpo i nt de tecti on;VAD;Speech recogn iti on1 引言数字语音信号是由语音部分和各种背景噪音混合组成,要在其中将需要处理的语音信号时段与静音时段、噪声时段区分开来,确定出语音信号的起始点,这就是端点检测,也称为话音活动检测(V o i ce A cti v ity De tecti on,VAD)。

基于噪声倒谱阈值频谱估计的语音活动检测

基于噪声倒谱阈值频谱估计的语音活动检测

temeh di e u e y1 % , n oa mec m pe i f h to r d c db 8 s a dt t t o li lxt o VAD sd c e s d y i e ra e .
[ ywo d V ieA t i tcinV D) se t sma o ; es u trsodn to ; o e p crl ni (S ) atF uir Ke r s oc ci t Deet ( A ; p c a et t n cpt m heh ligmeh d P w rS et I vy o r l i i r a De syP D ;F s or t e
中 分类 T 9 ・ 田 号: N13 2
基于噪声倒谱 阈值频谱估计的语音活动检测
李 宇 一 , ,郭雷 勇 ,谭洪舟 。
(. 1 广东药学院医药信息工程学院 ,广州 5 0 0 ;2 中山大学信息科 学与技术学院 ,广州 50 7 ) 106 . 12 5

要: 针对低方差频谱估计 的语音活动检测(A ) We h V D中 l 频谱估计方法计算量大的问题, c 提出利用倒谱闽值方法估计 V D中的噪声功 A
VAD y t m s u d td. mp a o a o l x t a y i d s mu a i n r s l n i ae t a o a e t e c t o , e c mpu a i n o s s e i p a e Co utt n lc mp e i a l s sa i lto e u t i d c t h tc mp r d wi W l h me h d t o i yn n s h h t to f
Vo c tv t t c i n Ba e n ieAc i iy De e to s d 0

基于倒谱特征的带噪语音端点检测

基于倒谱特征的带噪语音端点检测
[!] 式 (!) 表示的倒谱距离可以利用式 (5) 来近似计算 :
,
图*
带噪语音倒谱距离轨迹与短时能量曲线的比较
( .) 原始语音波形; ( /) 加入白噪声后的带噪语音波形图; ( () 带 噪语音归一化倒谱距离轨迹图; ( )) 带噪语音归一化短时能量曲 线
, , ( (% ’ (* % ) )* 6’7 % 48!4,9 ( (+ ’ (* +) $ ,!
!"#$%&"’ ()’)*’&%" %+ ,%&-. /$))*0 12-)# %" 3)$-’456
%1 23456/738, 9:; <84=/>=56
( !"#$%&’"(& )* +,"-&%)(.- +(/.(""%.(/ , 01$(/1$. 2.$)&)(/ 3(.4"%5.&6 , 01$(/1$. !"""#", 71.($ )
量门限并持续一段时间, 则第一次超过能量门限的点被判定 为语音段的起点 8 而当测试信号帧的能量低于另一个噪声能 量门限并持续一定时间, 就可测定语音段的终止点 8 噪声能量 门限的估计对这种方法的性能影响很大 8 在低噪声环境下, 如 H(I 大于 !">Q 时, 这种方法具有很 好的性能 $ 然而, 实际的语音识别系统常应用于不同的环境 $ 例如, 在汽车中 H(I 通常只有几个 >Q$ 在低 H(I 环境下, 由于 难以确定适当的门限值, 基于能量的端点检测不能很好地工 作, 这种方法也会舍弃一些低能量的清音语音 (摩擦音, 如9 , 而且, 难以处理非平衡噪声 8 在有些算法中, 一些其它 DR, R BR)

基于频谱方差的抗噪声语音端点检测算法

基于频谱方差的抗噪声语音端点检测算法
n ie,a o o e a e a i— n iy n pon dee to meho s o p cr os nd pr p s s n w nt os e d it t cin t d ba e n s e tum a inc v ra e. Th n i l t he e smu ae t meho i o h p r p e h sg a n p e h wi whi o s t d n b t u es e c i la d s e c t n h t n ie,pr v h tt i e meho an as ro m l n— e o et a h sn w t d c lo pef r we lu d rt ic msa e fs ro s nos . A o ta tts s a s n wih t w t d n r d to a t o e he cr u tnc s o ei u ie c nr s e ti o do e t he ne meho a d a ta ii n lme h d, l b s d o LPCC. Th u c me s ws ta he n w t d a c e e b te fe tv ne s a e n e o t o ho h tt e meho c n a hiv e tref cie s . KEY W O RD S: e t m ai n e; En ontdee to Sp cr u v ra c dp i t ci n; VAD ; S e c e o iin p e h r c g to n
L U I Yu — z e L AN h n. I Zi—f n eg
( o e eo E e t nc n no t nE g e r g C l g f lc o is d Ifr i n i ei , l r a ma o n n

一种强噪音环境中的语音端点检测算法

一种强噪音环境中的语音端点检测算法
Comp u t e r Tec h n o l o g y a n d I t s Ap p l i c a t i o n s

种强 噪音环境 中的语音端点检测算 法
孙 科 伟 ,李 建 海 ,杨 海 东,宋 博 ( 空 军 工 程 大 学 航 空 航 天 工 程 学 院,陕 西 西 安 7 1 0 0 3 8 )
中 图 分 类 号 :T N 9 1 2 . 3 文 献 标 识 码 :A 文 章 编 号 :0 2 5 8 — 7 9 9 8 ( 2 0 1 3 ) 1 2 — 0 1 3 5 — 0 3
A v o i c e a c t i v i t y d e t e c t i o n a l g o r i t h m i n s t r o n g n o i s e e n v i r o n me n t
语 音 端 点 检 测 是 语 音 数 字 信 号 处 理 领 域 的 重 要 内 容, 端 点 检 测 的 目 的 是 从 含 噪 语 音 信 号 中 检 测 出 有 效 语 音 的端 点 。在强 噪音环 境 中 , 含 噪 语 音 信 号 的 复 杂 度 增 加导 致端 点检 测的难 度增 加 。 现 有 的 语 音 端 点 检 测 算 法 大 多是 基 于 短 时 能量 、 过零率 、 持续 参 数 ¨ 等 语 音 信 号
t i o n a l me t h o d s . F u r t h e r mo r e , f o r l o w s i g n a l —t o—n o i s e r a t i o , t h e a l g o r i t h m h a s b e t t e r r o b u s t n e s s f or d i f f e r e n t t y p e s o f n o i s e a n d h i g h e n d p o i n t d e t e c t i o n a c c u r a c y.

一种基于改进的谱减法的语音增强算法

一种基于改进的谱减法的语音增强算法

一种基于改进的谱减法的语音增强算法高留洋;朱文;桑振夏;米兰【摘要】为改善语音质量,提高语音识别系统的性能,提出了一种新的基于改进的谱减法的语音增强算法.新算法在所有噪声都能转化为加性高斯白噪声的基础上,依据高斯白噪声幅度谱服从瑞利分布的特点,对噪声幅度谱进行精确的估计,并采用频带方差进行端点检测以及时检出语音.仿真分析表明:该方法能够较好地抑制噪声,噪声消除效果较传统算法具有明显的提高.%To improve the speech quality and enhance the performance of noisy speech signals recognition, a new speech enhancement algorithm based on improved spectral subtraction is proposed and analyzed. In contrast to the standard spectral subtraction algorithm, the new algorithm accurately estimates the noise based on the fact that all noise can be changed into Additive White Gaussian Noise ( AWGN) and according to the feature that the amplitude spectral of narrowband white Gaussian noise obeys Rayleigh distribution. This algorithm also adopts a new speech activity detection technology based on frequency band variance to detect speech activity. The simulation analysis results indicate that the algorithm in this paper performs better in noise elimination than standard spectral subtraction.【期刊名称】《现代电子技术》【年(卷),期】2012(035)017【总页数】3页(P60-62)【关键词】语音增强;谱减法;端点检测;加性高斯白噪声;瑞利分布【作者】高留洋;朱文;桑振夏;米兰【作者单位】63898部队,河南济源 454650;63898部队,河南济源 454650;63898部队,河南济源 454650;63898部队,河南济源 454650【正文语种】中文【中图分类】TN912.35-340 引言PSTN网语音通信过程中不可避免地会受到环境噪声的影响,过大的环境噪声将严重影响通信质量,同时将严重影响监管环节中语音处理系统的性能。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

声带的震 动产生声音。说话时声门闭 合, 声带 受到气流 的冲击而张开。声 门不 断的闭 合和 张开使 气流 产生 一系列
的脉冲, 每开启和闭 合一次 的时 间称为 基音 周期, 其 倒数即 为基音频率, 简称 基频。基 音频 率决定 了声 调的高 低, 基频 高则声调高。
声道是气 流自声带发出之后, 对发 音起着重要 作用的器
秒。 n为谐振频点序号, L 为 声道长 度 [ 4] 。这些 谐振 有关 , 不 同的 形状 对应不
同的共振 峰, 是 声道 的重 要 声学 参数。 当声 波从 声 道 传出
时, 其频谱特性会根据声道形状发生 变化。每个人 的声道在 说话的时候都不一样 , 因此共振峰相差较大。
2. 2 传统端点检测算法及其缺点 总的来说, 端点检 测就是 利用 语音 信号的 固有 特征, 如
幅度、能量、过 零率、相关性 和频域 特性等, 以 最大似然 准则 进行判断。早 期 端点 检测 算 法多 使用 短 时能 量、短 时 过零
率、线性预测系数等 进行检 测, 这些 算法对 于纯 净语音 信号 的端点检测都很 有效, 但是 在有 一定噪 声干 扰的情 况下, 检
官。声道是一个 谐振 腔, 有许多 谐振 频率。说 话时, 口 和唇 的变化会随时改变声道 的外形和大小, 谐振频率则 由发声瞬 间的声道形状 决定。如 果声道截面是均匀的 , 那么 谐振频率 将位于:
Fn
=
( 2n - 1) c 4L
( n = 1, 2, 3,
)
( 3)
式中 c为 声音的 速度, 在 15∃ 的空气中 约为 340. 5 米 /
测效果都会急剧 下降。 近年来 又引 入了基 于倒 谱特征 的检
测方法, 如基于线 性预测 倒谱 系数 ( LPCC )和 m el倒谱 系数 的算法等, 这些 特 征参 数是 基 于人 的声 道 模型 和听 觉 机理
的, 能更好的反映语音信号的本质特征, 但在 噪声背景 下, 这 些方法的检测效果依 然有待改善。
1 引言
数字语音信号是 由语音部分和各种背 景噪音混合 组成, 要在其中将需要处理的语音信 号时段与静音 时段、噪声时段 区分开来, 确定出语音信号的起始点, 这就是 端点检测, 也称 为话音活动检测 ( V o ice A ctiv ity De tection, VAD ) 。端点检测 是语音识别预处理阶段的一项 关键技术, 对识别结 果的准确 性有重要的作 用。研究 表明, 即 使在安 静的 环境中, 语 音识 别系统中也有一半以 上的错误源于端点检测 [ 1] , 在 噪声背景 环境下, 能否精确确 定语音 信号 的起始 点, 更是 对识别 结果 的准确性起着很重要 的作用。
下面对这种 端点检 测算 法进行 仿真 分析。首 先采 集一
段无噪声的语音信号, 进行端点检测。 然后在语音 中加入噪
声, 再观察含噪语音的 LPCC 系数波形, 看语音部分和噪声部 分之间是否存在 明显 的差 别。为了 与之后 本文 将要提 出的
基于频谱距离的端点检测方法 进行对比, 本文的实 例仿真图
第 27卷 第 9期 文章编号: 1006 - 9348( 2010) 09 - 0337- 04
计算机仿真
2010年 9月
基于频谱方差的抗噪声语音端点检测算法
刘玉珍, 连自锋
( 辽宁工程技术大学电子与信息工程学院, 辽宁 葫芦岛 125105)
摘要: 在语音识别系统中, 对识别的准确性有很重要的作用。对于纯净语音信号, 传统的端点检测算法能够很好地 检测语音 部分的起止点。由于在有噪声干扰的情况下, 算法的检测准确度往往会急 剧下降。为了改善 噪声环境下 的端点检 测效果, 从语音信号和噪声信号频域分布特性的差异出发, 用频谱方差数值来区分 语音和噪声, 提出 了基于频谱方差 的端点检 测算 法, 并进行了无噪声和噪声环境下的仿真, 证明了这种算法在强噪声干扰 的情况下也能够 取得很好的效 果。同时将新 算法 和传统的基于 LPCC 的端点检测算法进行了对比试验, 实验结果表明, 在噪声环境下, 新算法的检测精度有明显提高。 关键词: 频谱方差; 端点检测; 话音活动检测; 语音识别 中图分类号: TN 912. 34 文献标识码: A
下面以 基于 LPCC 的端点检测 算法为例, 对其 原理稍作 分析, 并对其抗噪声性能进行仿真实验。
2. 3 基于线性预测倒谱系数的端点检测方法 线性预测最早由 维纳提出, 又称 为线性预 测编码。它是
基于全极点 模型 假 设, 以最 小 均方 误差 准 则来 估计 模 型参 数。线性预测分析的基本思想 是: 由于 语音信号之 间存在着
收稿日期: 2009 - 07- 23 修回日期 2009- 08- 08
常用的端点检测算 法在无噪声的情况下 , 都能 表现出很 好的性能。但在有噪声 干扰的情况下, 通常检测精 度下降很 严重。本文以语音信号和噪声的 频谱特征 的差别为出 发点, 提出了基于频 谱方差的 端点 检测 算法, 分析 了算 法原理, 并 对其在噪声环境下的检 测性能进行了仿真, 证明这 种算法在 较强噪声干扰 的情况下也能准确找到语音端点。
共振峰 Fn 的频率都是基频的整数 倍。声道对于 激励信 号的响应可以用一个全极点线 性模型来近似 描述, 每个极点 对应一个共振峰 频率。 这个线 性系 统的频 率响 应特性 决定
相关性, 每一个语音 信号的 采样 值, 都可以 由之 前的若 干个 采样值的加权和来表 示, 各加权系数应 使语音信号 的线性预 测值与实际采样值之间的误差 的平方和达到 最小, 即逼近最 小均方误差。其中的加权系数 就是线性预测系数。
P阶线性预测就是根据过去 P个信号的采样值 { s( n- 1), s( n2), , s( n- P) }的加权和来预测信号的当前采样值 s( n)。若选用全 极点参考模型进行分析,则传递函数 H( z)为:
S(z)
1
! H ( z ) = G* U ( z ) =
p
1-
k z- k
( 1)
k= 1
其中 S( z)和 U ( z) 分别 为输出 信号 s( n)和 输入 信号 u
( n) 的 Z 变换, G 为增益常数, { ak }即为线性预测系数 [3] 。 获得线性预测系数以后, 可以通过以下公式得到其倒谱:
i- 1
! Ci =
i+ k= 1
1-
k i
C i- k
k
( 2)
LPCC参数能够避免语音产生过程 中的激励对 语音特性
的影响, 主要反映声 道特性, 能 够很 好的描 述语 音的共 振峰
特 性 [ 3]。 因此语 音信 号和 噪声部 分的 LPCC 特 性会存 在较 大差别, 这使得 LPCC可以被用来进行端点检测。
ABSTRACT: Endpo int detec tion is a cruc ia l techno logy o f preprocessing step in speech recogn ition system s. It play s a very important pa rt in the accuracy o f the recognition results. T o pure speech signa,l traditional endpo int detection m e thods can a lso achieve fa ir ly good results in detecting the start and endpo int. Butw hen in terfered by no ise, the de tection accuracy of such m ethods a lw ays falls sharply, o r even loses effec tiveness. T here a re differences in frequency dom ain between speech and no ise d istribution characters. To improve the perform ance of endpo int de tection in no isy env ironm en t, th is article takes such d iscrepancy as a sta rting po int, uses spectrum var iance to d istingu ish vo ice and no ise, and proposes a new anti- no isy endpo int detection me thod base on spec trum var iance. T hen sim ulate the m e thod in bo th pure speech s igna l and speech w ith wh ite no ise, prove that this new m ethod can a lso perform we ll un der the c ircum stances o f ser ious no ise. A contrast test is also done w ith the new m e thod and a trad itiona l m ethod, based on LPCC. T he outcom e show s that the new m ethod can ach ieve bette r e ffectiveness. KEYW ORDS: Spectrum va riance; Endpo int de tection; VAD; Speech recogn ition
A lgorithm of Anti- noise Endpoint D etection Based on Spectrum Variance
相关文档
最新文档