低信噪比环境下改进的倒谱距离语音端点检测算法
一种基于倒谱均值减的语音端点检测改进方法_王帛

电光与控制 Electronics Optics & Control
Vol. 18 No. 7 July 2011
一种基于倒谱均值减的语音端点检测改进方法
王 帛1 , 冯新喜2 , 余侃民2 , 朱必浩2
( 1. 中国人民解放军 95971 部队,湖北 广水 432701; 2. 空军工程大学电讯工程学院,西安 710077)
78
电光与控制
第 18 卷
点[4],利用噪声特征均值对带噪语音进行特征补偿,可 以很好地降低噪声对于端点检测精度的影响。 1. 1 倒谱均值减
倒谱特征主要基于声道模型假设。根据语音发声 原理,可以将发声行为抽象为激励信号通过声道模型与 声道函数进行卷积的非线性过程。数字化的语音信号 是声道频率特性和激励信号源二者的共同结果,通过同 态信号处理就可以将语音信号的非线性问题转化为线 性问题,从而将激励信息与声道冲激响应分离开来。
清音部分与白噪声频谱特征极其相似,在检测中容易发生误识的问题,提出了加权平滑修正的解决方法,从一定程度
上降低了检测中的分类误识率。最后,与传统端点检测方法进行性能比较,证明了该方法的有效性。
关键词: 端点检测; 倒谱均值减; 加权平滑; 语音识别
中图分类号: V271. 4; TN912. 34
文献标志码: A
考虑到噪声、通 道 干 扰 以 及 由 分 帧 处 理 等 带 来 的 不确定性,特别是 说 话 语 音 清 音 部 分 与 白 噪 声 在 特 征 方面的相似性,对 语 音 信 号 进 行 分 类 时 难 免 会 出 现 如 图 2 的情况,即一些特征矢量会处于两种分类区间的 交叉区域,难以对其进行区分,尤其是对尾音的处理容 易造成截断效应。为了获取更好的分类效果,必须合 理地消除野值和划分信号特征矢量中的交叉元素[9]。
噪声环境下语音多子带端点检测方法

( eat e to lc o i E g er g s gu nvri ,B in 0 0 4 hn ) D pr n fEet nc n i e n ,T i h aU i s y e ig 1 0 8 ,C ia m r n i n e t j
音 的过零 率特征参数 受到 噪声干扰 , 相较于无 噪声环
语音信 号具有较 大的冗余度 , 现之一就是语 宅 表
匡 堕 筮 型生 鲞Q 妻 篓 】笾簋塑 簋
语音技术
⑥6@ 可@ 响 ⑨⑨ = @ @ 响 0 \ 『
声 的特点 , 将语 音信 号划分 为 6 子带 。低频信 号 的 个
掰[ 二 = =
3 多子 相结合 的 双 门限端点 检测算
法进行语 音端点检i 的结果 。此时 , 检i 效果 较为 贝 0 其 贝 0
理想 。 图 2是 信 噪 比(inlt— o e a o S R) Sg a o N i t ,N 为 — sR i 2 B的噪声 环境 下双 门限算法 的检 测结 果 , Od 因为语
境 的检测 结 果 , 效果 就相 对 差 了一些 , 3 S F 其 图 是 N 为 5d B的噪声环境下 的双门限端点 检测结果 , 因为 行 端点 判 决 的两 个参 数 特 征 : 量 和过 零 率都 被 啄 能 声 严 重污 染 , 以双 门 限法 在强 噪声 的环 境下 端 所
【 s a t n od rt vro e te soto ig o h rdt n lsec n pit d t t n a o tm i os Abt c】I re o oecm h hr m n fte t io a peh ed ons e ci l rh n ni r c a i e o gi y
基于压缩感知观测序列倒谱距离的语音端点检测算法

U i r t o ot a dT lc m u ia o s N nig 1 0 3 nv s y f s n ee o m nc t n , a j 0 0 ) e i P s i n 2
En p itDe e t n Alo i m a e n Ce s r l s a c f d o n t c i g r h B s d o p ta o t Dit n e o Co p e s d Se s n a u e m r s e n ig Me s r me t fSp e h Sin l n s o e c g a
YE Le i
S UN i — u Lnh i
YANG e Zh n
( .C l g f eeo m nct nadIfr ai nier g aj gU i r t o ot adT lcm u iao s 1 o eeo lcm u iao n nom t nE g ei ,N n n nv sy f s n e o m nct n , l T i o n n i e i P s e i
o m p iu p c r m fc m p e s d s n i e s e n so o c nd no — o c p e h,e dp i tdee to g rt fa lt de s e t u o o r s e e sngm a ur me t fv i e a n v i es e c n o n tci n a o hm s d o e — l i ba e n c ps
基于频谱方差的抗噪声语音端点检测算法

第27卷 第9期计 算 机 仿 真2010年9月 文章编号:1006-9348(2010)09-0337-04基于频谱方差的抗噪声语音端点检测算法刘玉珍,连自锋(辽宁工程技术大学电子与信息工程学院,辽宁葫芦岛125105)摘要:在语音识别系统中,对识别的准确性有很重要的作用。
对于纯净语音信号,传统的端点检测算法能够很好地检测语音部分的起止点。
由于在有噪声干扰的情况下,算法的检测准确度往往会急剧下降。
为了改善噪声环境下的端点检测效果,从语音信号和噪声信号频域分布特性的差异出发,用频谱方差数值来区分语音和噪声,提出了基于频谱方差的端点检测算法,并进行了无噪声和噪声环境下的仿真,证明了这种算法在强噪声干扰的情况下也能够取得很好的效果。
同时将新算法和传统的基于LPCC的端点检测算法进行了对比试验,实验结果表明,在噪声环境下,新算法的检测精度有明显提高。
关键词:频谱方差;端点检测;话音活动检测;语音识别中图分类号:TN912.34 文献标识码:AA lgorith m of Anti-noise Endpoi nt D etectionBased on Spectru m VarianceLIU Yu-zhen,L IAN Zi-feng(Coll ege o f E lectron i cs and Info r ma ti on Eng i neer i ng,L i aoni ng T echnica lU niversity,Hu l udao L iaon i ng125105,Ch i na)ABSTRACT:Endpo int detec tion is a cruc i a l techno logy o f preprocessi ng step in speech recogn iti on syste m s.It play sa very i m portant pa rt i n the accuracy o f the recognition results.T o pure speech si gna,l traditi onal endpo i nt detectionm e t hods can a l so achieve fa i r l y good results i n detecti ng the start and endpo i nt.Butw hen i n terfered by no ise,the detection accuracy of such m ethods a l w ays fall s sharply,o r even loses effec tiveness.T here a re differences i n frequencydom ai n bet ween speech and no i se d istri buti on characters.To i m prove the perfor m ance of endpo i nt de tecti on i n no isyenv iron m en t,t h is article takes such d i screpancy as a sta rting po i nt,uses spectru m var i ance to d i sti ngu ish vo i ce andno ise,and proposes a new anti-no isy endpo i nt detecti on me t hod base on spec tru m var i ance.T hen si m ulate t hem e t hod in bo t h pure speech s i gna l and speech w ith wh ite no i se,prove that this ne w m ethod can a l so perfor m we ll under t he c ircu m stances o f ser i ous no ise.A contrast test is also done w ith t he new m e t hod and a trad i tiona l m ethod,based on LPCC.T he outcom e show s t hat the ne w m et hod can ach ieve bette r e ffectiveness.KEY W ORDS:Spectru m va riance;Endpo i nt de tecti on;VAD;Speech recogn iti on1 引言数字语音信号是由语音部分和各种背景噪音混合组成,要在其中将需要处理的语音信号时段与静音时段、噪声时段区分开来,确定出语音信号的起始点,这就是端点检测,也称为话音活动检测(V o i ce A cti v ity De tecti on,VAD)。
一种基于自适应谱熵的端点检测改进方法

一种基于自适应谱熵的端点检测改进方法
王琳;李成荣
【期刊名称】《计算机仿真》
【年(卷),期】2010(0)12
【摘要】在低信噪比的环境下,为增强与噪声的区分度,提出了一种适应于低信噪比环境的语音端点检测方法.通过改进语音端点检测的特征参数,更好地区分语音信号与噪声信号,提高在低信噪比环境下的端点检测正确率.基于子带谱熵,引入正值常量对基本谱熵参数进行算法改进,得到改良的负谱熵特征,并结合自适应子带选择方法,得到一种新颖的特征参数--自适应子带常量负谱熵.特征在低信噪比的情况下有较强的抗噪能力,并能够准确地检测出语音端点.实验结果表明,不仅快速有效,具有较强的鲁棒性,而且适合低信噪比的语音端点检测.
【总页数】4页(P373-375,395)
【作者】王琳;李成荣
【作者单位】中国科学院自动化研究所,北京,100190;中国科学院研究生院,北京,100049;中国科学院自动化研究所,北京,100190
【正文语种】中文
【中图分类】TN912.3
【相关文献】
1.一种基于分带谱熵和谱能量的语音端点检测算法 [J], 李如玮;鲍长春
2.一种基于改进谱熵的语音端点检测方法 [J], 李艳;成凌飞;张培玲
3.基于自适应子带功率谱熵的语音端点检测算法 [J], 李金宝;屈百达;徐宝国;周小祥
4.基于自适应子带谱熵和短时平均幅度的心音端点检测 [J], 吴云飞;李海霞
5.一个基于谱熵的语音端点检测改进方法 [J], 王让定;柴佩琪
因版权原因,仅展示原文概要,查看原文内容请购买。
一种基于自适应谱熵的端点检测改进方法

关键词 : 语音端点检测 ; 自适应子带谱熵 ; 语音识别 ; 鲁棒性
中图 分 类 号 :N 1 . T 92 3 文 献标 识 码 : A
An I pr v d pe c dp i t De e to e ho Ba e n m o e S e h En o n t c i n M t d s d o
第 7 第1期 2卷 2
文章编号 :0 6—94 ( 00)2—07 0 10 38 2 1 1 3 3— 3
计
算
机 仿
真
21年l月 0 0 2 端 点 检 测 改 进 方 法
王 琳 , 李成 荣
( .中国科学院 自动化研究所 , 1 北京 10 9 0 10;
2 hn s c d m f c n e , e ig1 0 4 , hn ) .C i eA a e yo S i c s B in 0 0 9 C ia e e j
A S R T:hsppr r oe oe sec e co e o sdwt w r i a—t B T AC T i a e po ss nvl pehd t tnm t due i l e g l o—ni t S R . p a ei h h o sn o er i N ) s a o(
目前运用于语 音端点 检测 的特征 参数 主要包括短 时能
1 引言
随着 语 音 技 术 的发 展 , 用 的 领 域 越 来 越 广 , 些 年 , 应 近 用
量, 短时平均幅度 , 时平 均过零率 , 短 倒谱 系数 以及短时能谱 值 等。但在 噪音环境下 , 这些 端点检测方法 变得不理想 。语 音信号的能量小 时 , 被噪 声所掩 盖 , 易 因此难 于用能量 特征 参数进 行语 音端 点检测 。S e 等人提 出 了基 于信息 熵 的 hn 端 点检 测方法 , 信息熵 只与 能量 的随机性有 关 , 和能量 幅值
一种噪声环境的语音端点检测方法

一种噪声环境的语音端点检测方法王帛;冯新喜;邱浪波【期刊名称】《计算机工程与应用》【年(卷),期】2012(048)006【摘要】端点检测是语音识别系统的一个重要组成,尤其是在噪声环境中,其准确性对语音识别系统性能有直接影响.提出了一种基于小波子带倒谱系数(SBC)的语音信号端点检测方法,利用小波变换对频带进行尺度划分,采用小波子带倒谱能量检测语音端点.通过与MFCC的仿真对比以及大量实验分析,小波子带倒谱特征在语音端点检测中具有更好的识别性能.%Endpoint detection is a crucial component in speech recognition system, especially in the noisy environment, the accuracy of endpoint detection has important effect on system performance. This paper proposes an endpoint detection of speech signals based on Subband Based Cepstral(SBC) parameters. Speech signal is measured with wavelet transformation on spectral band, and the energy of SBC is used in speech endpoint detection. Comparison between SBC and MFCC, experimental results show that SBC makes better performance in speech endpoint detection.【总页数】3页(P123-125)【作者】王帛;冯新喜;邱浪波【作者单位】空军工程大学电讯工程学院,西安710077;空军工程大学电讯工程学院,西安710077;空军工程大学电讯工程学院,西安710077【正文语种】中文【中图分类】TN912.34【相关文献】1.一种强噪声环境下的语音端点检测算法 [J], 蔡萍2.一种复杂噪声环境下的语音端点检测方法 [J], 熊威;郑建立3.一种噪声环境下的实时语音端点检测算法 [J], 徐大为;吴边;赵建伟;刘重庆4.噪声环境下多特征融合的语音端点检测方法 [J], 罗思洋;龙华;邵玉斌;杜庆治5.一种噪声环境下的语音端点检测方法 [J], 王文延;曾庆宁;李琴;赵中华因版权原因,仅展示原文概要,查看原文内容请购买。
端点检测

,即得
至此,求得了x1(n),即规则部分时间序列。 (4)利用公式
求得复杂度C0 。
不同语音端点检测方法的实验结果 对比
实验条件
(1)英文数据库
(2)中文数据库
中文数据库的采集由学生,都说普通话,个别人略带地方色彩。因 语音信号主要集中在300一3400Hz,所以采用44100Hz的采样率,采样位 数16位,采样通道选用立体声,每人读5次,每次通读十个词语一遍。共 有250个有效测试session共有830MB的数据量。说话内容选择的词语考虑 到了汉语中各个元音、辅音、摩擦音、爆破音和鼻音等各个不同的汉语 因素。
式中,sgn为符号函数,即:
过零率有两类重要的应用:第一,用于粗略地描述信号的频谱特 性;第二,用于判别清音和浊音、有话和无话。从上面提到的定义出 发计算过零率容易受低频干扰,特别是50Hz交流干扰的影响。解决这 个问题的办法,一个是做高通滤波器或带通滤波,减小随机噪声的影 响;另一个有效方法是对上述定义做一点修改,设一个门限T,将过 零率的含义修改为跨过正负门限。 于是,有定义:
根据Lmapel和Ziv的研究,对几乎所有的x属于[0,1]区间的c(n) 都会趋向一个定值:
其中b(n)是随机序列的渐进行为,用它来使c(n)归一化,称为 “相对复杂度”。 定义相对复杂度:
通常就是用这个函数来表达时间序列的复杂性变化。从这种算法 可以看出,完全随机的序列C(n)值趋向于1,而有规律的周期运动的 C(n)值则趋向于0。
式中,Cn与C’n分别代表谱密度函数S(w)与S’(w)的倒谱系数。
方法: 倒谱距离的测量法步骤类似于基于能量的端点检测,只是将倒谱 距离代替短时能量来作为特征参数。首先,假定前几帧信号是背景噪 声,计算这些帧的倒谱系数,利用前几帧倒谱系数的平均值可估计背 景噪声的倒谱系数,噪声倒谱系数的近似值可按下述规则进行更新, 即当前帧被认为是非语音帧:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
低信噪比环境下改进的倒谱距离语音端点检测算法张涛;章小兵;朱明星【摘要】在强背景噪声的情况下,针对传统倒谱距离法端点检测难以判断语音段起止点的问题,提出了一种基于多窗谱估计的谱减法与改进的倒谱距离语音端点检测新方法.首先对每一帧带噪信号进行多窗谱估计得到平滑功率谱,提取前导无话段平均功率谱,再利用谱减法对带噪语音信号进行减噪处理,对语音的减噪是为了更好地进行下一步的端点检测,然后对传统的倒谱距离门限阈值进行改进,得到一种改进的自适应阈值,并结合倒谱距离法进行端点检测.通过仿真实验结果表明,与传统倒谱距离端点检测算法相比,本文方法提高了低信噪比语音端点检测的精度,具有良好的鲁棒性能.【期刊名称】《电声技术》【年(卷),期】2017(041)007【总页数】6页(P108-112,125)【关键词】端点检测;多窗谱估计谱减法;自适应门限阈值;倒谱距离;平滑功率谱【作者】张涛;章小兵;朱明星【作者单位】安徽工业大学电气与信息工程学院,安徽马鞍山243000;安徽工业大学电气与信息工程学院,安徽马鞍山243000;安徽工业大学电气与信息工程学院,安徽马鞍山243000【正文语种】中文【中图分类】TN912.35文献引用格式:张涛,章小兵,朱明星.低信噪比环境下改进的倒谱距离语音端点检测算法[J]. 电声技术,2017,41(7/8):108-112.ZHANG Tao, ZHANG Xiaobing, ZHU Mingxing.Speech endpoint detection with low SNR based on improved cepstrum distance method[J]. Audio engineering,2017,41(7/8):108-112.在语音信号预处理技术中,语音端点检测(Voice Activity Detection,VAD)广泛应用在通信系统,语音编码等领域。
端点检测在语音识别中是不可或缺的重要组成部分[1]。
从带噪语音中区分出纯净语音信号和噪声信号,并且确定原始语音的起止点是语音端点检测的目的。
传统的端点检测方法主要有时域参数法和频域参数法两大类[2]。
时域参数主要有短时能量、短时过零率、对数能量[3-5]等。
频域参数法主要包括方差法、倒谱距离法、谱熵以及小波变换[6-9]等方法。
时域参数法主要优点在于算法简洁快速,但是在低信噪比情况下表现差强人意,而频域的方法精度相对较高,但是算法较复杂且运算量较大。
这些算法在高信噪比情况下都表现良好,但是在语音环境恶劣、信噪比较低时检测性能就大打折扣,很难满足实际需求。
于是这就促使了语音信号减噪增强与传统端点检测算法的结合使用。
谱减法(Spectral Subtraction,SS)是一种在语音信号减噪中最常用的一种方法[10]。
它首先对噪声的频域进行估计,再通过谱“相减”去除噪声段的增强技术,其实用性高。
本文使用一种改进的谱减法:多窗谱估计改进谱减法[11-12],先对带噪语音段进行减噪处理,提高含噪语音信噪比,再使用改进的自适应门限阈值倒谱距离双门限的检测方法进行端点检测。
仿真结果表明,在强噪声的情况下,语音信号经过多窗谱估计谱减法增强后,利用减噪后的信噪比与端点检测门限阈值之间的关系,可使语音信号在不同噪声、不同信噪比的环境下适应性更加良好,从而达到更好的检测准确率。
1.1 基本谱减法通常待处理的语音信号会含有噪声,只是噪声信号强度不同。
在进一步处理语音信号之前往往要对带噪的语音信号进行减噪处理。
谱减法就是一种简单易行的处理方法。
设初始语音信号为x(n),对其进行加窗分帧后得到第i帧语音信号xi(m),每帧帧长为N。
对语音信号xi(m)的任一帧做DFT后有Xi(k)=xi(m)exp(j)k=0,1,…,N-1求出Xi(k)每一分量的幅值相角为谱减时保存这两组数。
前导无话段帧数是NIS,时长为IS,则该噪声段平均能量值由式(3)得,谱减算法为式中,a和b都为常数,a为过减因子,b为增益补偿因子。
谱减之后的幅值为结合保存的相角就可以用快速傅里叶逆变换(IFFT)求出谱减后的新语音序列i(m)。
通过减噪之后的语音有明显的“音乐噪声”,可以通过增加过减因子a可以减少“音乐噪声”,但是如果过减因子a过大就会使减噪后的波形失真。
1.2 多窗谱估计改进的谱减算法1982年,Thomson提出一种多窗谱(Multitaper Spectrum)估计的算法,在这之前的周期图法只采用了一个数据窗信号功率谱,而Thomson的算法是对同一数据序列应用多个正交的数据窗,求出对应的直接谱,继而将求得的直接谱平均以得到较小估计方差的谱估计。
多窗谱的定义为式中:L是数据窗的个数;表示第k个数据窗的谱式中:x(n)为数据序列;N设为序列的长度;ak(n)表示第k个数据窗,并且其满足多个数据窗之间的相互正交数据窗(Slepian窗)是一组相互正交的离散椭球序列(DPSS)。
在MATLAB的信号处理工具箱中,有多窗谱功率估计函数pmtm,可用于计算多窗谱的功率谱密度估计,从中得到谱减法中的增益因子,最后实现谱减语音增强的运算。
具体步骤如下:1)带噪语音序列为x(n),加窗分帧处理,得到序列xi(m),在相邻帧之间保留重叠部分。
2)对xi(m)进行FFT,求其幅度谱和相位谱θi(k),并对重叠部分做平滑处理,得到平均幅度谱式(8)以第i帧为中心取前后各M帧,共计2M+1帧进行平均。
通常将M取为1,即在3帧中进行平均。
3)对信号xi(m)进行多窗谱估计,得到多窗谱功率谱密度P(k,i)=PMTM[xi(m)]式中:i表示第i帧;k表示第k条谱线;PMTM表示进行多窗谱功率谱密度估计。
4)对多窗谱功率谱密度估计同样进行相邻帧之间的平滑处理,计算得到的平滑功率谱密度为从式(10)可以得出,以第i帧为中心取前后各M帧,共有2M+1帧进行平均。
通常取M为1,即在3帧中进行平均。
5)前导无话段(噪声段)有NIS帧,结合前式计算出噪声的平均功率谱密度值Pn(k)6)由谱减关系计算增益因子,得到(α为过减因子;β为增益补偿因子)式中,α的适当选择可以有效去除音乐噪声,但α的值不宜选择太大,过大的过减因子会造成语音失真。
7)由g(k,i)和的值便可求得谱减后的幅度谱最后,将幅度谱结合相位谱θi(k)进行快速傅里叶变换(IFFT),将频域幅度谱还原到时域,即得减噪后的语音信号i(m)i(m)=IDFT[exp[jθi(k)]]2.1 传统倒谱距离方法设减噪增强后的语音信号为s(n),分帧处理得到的第i帧语音信号为si(m),每帧长为N。
si(m)的频谱为Si(ω),其倒谱为ci(n),上标i为第i帧。
信号倒谱的另外一种定义是信号si(m)的倒谱ci(n)看成是Si(ω)的傅里叶级数展开,即有式中,ci(n)为倒谱系数,且ci(n)=ci(-n)是一组对称实数,有ci(0)=logSi(ω)设有两组信号s1(n)和s2(n),它们的谱函数为S1,i(ω)和S2,i(ω)。
倒谱距离可以应用Parsavel定理来表示它们对数谱的均方距离式中和为对应于谱密度函数S1,i(ω)和S2,i(ω)的倒谱系数。
倒谱距离的定义是根据每个单位时间内的信号帧与噪声帧的倒谱距离轨迹进行检测和判断,采用的是双门限判决法,具体步骤如下:1)混合语音的前导无话段实际上是背景的噪声帧段,取其前6帧倒谱系数的均值作为背景噪声倒谱系数的估计值,记作为c2(n)。
2)计算出每一帧语音段的倒谱系数值,接着算出每一帧语音段的倒谱系数值与噪声倒谱系数估计值的倒谱距离。
式(17)可近似为dcep=4.3429式中,p为倒谱距离系数的阶数。
3)根据步骤2计算的每一帧倒谱距离值勾勒出倒谱距离轨迹,用NIS帧的倒谱距离求出阈值,再运用双门限判决法检测带噪语音信号段的有话段和噪声段。
由于传统方法用NIS求出倒谱距离阈值后,其门限Ti就保持一个固定的门限乘系数。
如果阈值只是和倒谱距离估计值是固定比例系数,这就造成当信号在不同信噪比情况下门限Ti不能直接反应噪声情况,那么这样的算法就不适应信噪比变动较大的噪声环境,在这种环境下其检测效果肯定不理想。
为了提高不同信噪比以及不同噪声情况下倒谱距离法的适应性,本文提出了下面的改进算法。
2.2 改进算法由于传统倒谱距离检测方法中判决门限与倒谱距离只是一个固定的门限乘系数关系,然而固定的判决门限乘系数难以同时适应低信噪比和高信噪比这样不同信噪比噪声环境,所以需要找出一种即能随SNR变化又能合理区分倒谱距离的判决门限以提高语音端点检测的质量。
因此,本算法提出一种新的自适应门限阈值,在原固定判决门限乘系数ki的基础上增加一个门限增量系数λ,高信噪比时采用低判决门限,低信噪比时采用高判决门限,仍采用双门限判决。
本算法是由减噪后的信噪比SNRnew确定判决门限的。
判决门限是在恒定门限乘系数的基础上再增加一个与减噪后的信噪比呈某种关系的门限增量系数,因此判决门限可以重新定义为式中:dcepth为倒谱距离的估计值;k1,k2分别为判决门限的两个乘系数;λ为门限增量系数,且为了满足T2>T1,要求k2>k1。
此处经大量实验验证,式(19)的固定判决门限系数ki可以取k1=1.7,k2=2.2;门限增量系数λ可设置为0.3。
式(19)的的Ti与SNR关系式如图1所示。
与文献[13]的改进算法相比本文的改进算法平滑性更好,信号遭遇大的信噪比跳跃也不会产生剧烈波动,而且本算法的前提是在减噪增强的情况下进行的,信噪比波动范围并不大,故算法的适应性良好。
本文的算法采用MATLAB软件进行仿真,实验中采用的样本是使用专业录音机在安静的实验室环境下录制采样8 kHz、16 bit量化的.wav文件。
实验录制了一段为“安工大”的语音信号。
实验所用的噪声来自标准噪声库NOISEX-92中的白噪声(white)和粉色噪声(pink)。
分别用传统倒谱距离法,文献[14]中的方法以及本文的方法进行端点检测对比实验,结果如图2所示。
由图2、图3及表1可以看出,同在多窗谱减噪的前提下本文的改进的倒谱距离方法,明显要比传统倒谱距离以及文献[14]中能量谱熵方法检测准确率要高,且当信号在白噪声情况下传统倒谱距离法在信噪比低于-6dB时开始有误检测的情况,而文献[14]和本文的方法还可以检测语音的起始点,但是本文的方法检测准确率还是较高。
当信号处于-8 dB的粉色噪声下,传统倒谱距离以及文献[14]的方法均失效,而本文方法依旧可以成功检测出强噪声下的语音起始点,如此可以证明本文的方法的抗噪性能还是不错的。
传统的倒谱距离的缺点在于抗噪声的性能差,因为传统的倒谱距离是提取前导无话段帧作为噪声倒谱系数的估计值,如果噪声波动太大,那么得到的估计值就离实际的理想值偏差较大。