基于子带能熵比的语音端点检测算法

合集下载

一种基于改进谱熵的语音端点检测方法

ｃｏｍｂｉｎａｔｉｏｎｏｆｓｈｏｒｔｔｉｍｅａｖｅｒａｇｅｍａｇｎｉｔｕｄｅ．Ｔｈｅｓｉｍｕｌａｔｉｏｎｒｅｓｕｌｔｓｓｈｏｗｔｈａｔｔｈｉｓｍｅｔｈｏｄｈａｓｂｅｔｔｅｒｒｏｂｕｓｔｎｅｓｓａｎｄ
ｐｒｅｃｉｓｉｏｎｔｈａｎｃｏｎｖｅｎｔｉｏｎａｌｓｐｅｃｔｒａｌｅｎｔｒｏｐｙａｌｇｏｒｉｔｈｍａｎｄａｖｅｒａｇｅｍａｇｎｉｔｕｄｅａｌｇｏｒｉｔｈｍ，ｗｈｉｃｈｐｒｏｖｅｓｔｈｅｅｆｆｅｃｔｉｖｅｎｅｓｓ
ＡｂｓｔｒａｃｔＩｎｖｉｅｗｏｆｔｈｅｐｒｏｂｌｅｍｔｈａｔｃｏｎｖｅｎｔｉｏｎａｌｓｐｅｃｔｒａｌｅｎｔｒｏｐｙｓｐｅｅｃｈｅｎｄｐｏｉｎｔｄｅｔｅｃｔｉｏｎａｌｇｏｒｉｔｈｍ’ｓｄｅｔｅｃｔｉｏｎｅｆｆｅｃｔｉｓｐｏｏｒｕｎｄｅｒｔｈｅｎｏｎ－ｓｔａｔｉｏｎａｒｙｎｏｉｓｅ，ａｎｅｗｆｅａｔｕｒｅｐａｒａｍｅｔｅｒ－ｓｕｂ－ｂａｎｄａｍｐｌｉｔｕｄｅｓｐｅｃｔｒｕｍｅｎｔｒｏｐｙｗａｓｐｒｏ－
２改进谱熵
量小，在高信噪比环境下可以获得较好的检测效果，但对复杂背景噪声环境下的端点检测误判率升高［７］。２）基于语音信号频域特征的算法，如倒谱特征法［８］、谱熵法［９］和频带方差［１０］等。这些算法在纯净语音环境下可以取得良好的检测效果，但在非平稳噪声环境下检测效果骤降，尤其是当噪声与语音信号频域分布类似时，这些算法甚至不能正常工作。［１１］
语音端点检测的目的是在一段信号流中快速区分出语音提出了一种新的基于子带谱熵幅度积参数的语音端点检测方

基于多窗谱估计谱减法和能熵比法的语音端点检测算法

基于多窗谱估计谱减法和能熵比法的语音端点检测算法赵发【摘要】语音端点检测是语音处理中非常关键的一个环节,目前主要的语音端点检测算法都侧重于语音特征参数的提取而忽略了之前的语音增强.论文提出一种基于多窗谱估计谱减法和能熵比的语音端点检测复合算法,该算法利用多窗谱估计谱减法将有噪声环境下的语音信号减噪,提高性噪比,达到语音增强的效果,再结合能熵比法进行端点检测.仿真结果表明,算法在低信噪比情况下,可以提高语音端点检测的正确率.【期刊名称】《巢湖学院学报》【年(卷),期】2016(018)006【总页数】6页(P80-85)【关键词】多窗谱估计;谱减法;能熵比;端点检测【作者】赵发【作者单位】安徽工程大学,安徽芜湖 241000【正文语种】中文【中图分类】TN912.3语音端点检测属于语音信号处理的范畴[1]，是语音识别、语音合成等语音应用方面非常关键的一个环节[2]；它是指从一个连续的语音流中检测出有效的语音段，包括检测出有效语音的起始点和结束点。

现在的语音端点检测算法很多，但是主要的方法都是基于特征参数的提取，如基于短时能量和短时过零率的双门限法、倒谱法、谱熵法[3-6]等，这些方法在针对实验室高信噪比语音信号端点检测时能取得较好的效果，但是当在更真实自然的带噪声语音环境中，由于信噪比的降低，信号的特征参数提取变得困难，这时端点检测的性能将急剧下降。

针对这种低信噪比的带噪语音信号，目前又提出一些改进检测算法，如基于短时能量和过零率相结合的能零比法，基于频谱方差与谱减法的语音端点检测算法，基于短时能量和谱熵相结合的能熵比法等。

但以上算法都侧重于语音特征参数的提取，而对之前的语音增强工作有所忽视,这对低信噪比下的语音端点检测性能将会产生一定的影响。

本文提出一种基于多窗谱估计谱减法和能熵比法的语音端点检测算法改进算法，本算法通过多窗谱估计谱减法将有噪声环境下的语音信号减噪，提高性噪比，达到语音增强的效果，之后利用能熵比法进行语音端点检测。

基于LMS自适应的改进端点检测算法

基于LMS 自适应的改进端点检测算法刁鸿鹄，毛强，章小兵（安徽工业大学电气与信息工程学院，安徽马鞍山 243032)摘要：语音识别技术早已不再局限于实验室中，但部分关键技术仍需进一步优化与改进，以适应社会和用户不断增加的需求。

从语音识别的技术理论入手，着重研究端点检测技术，拟在此基础上针对现有算法进行改进，提升其在低信噪比环境下的识别准确率。

提出了一种在对语音进行LMS 自适应降噪后,采用倒谱距离熵比的新型端点检测算法,并在MATLAB 平台上进行相应测试。

结果表明该算法相比于传统方法,检测正确率确有提升。

关键词：语音识别；自适应滤噪；倒谱距离；能熵比中图分类号：TN912.3 文献标志码：A 文章编号：1671-0436（2021）01-0031-10收稿日期：2020-09-28作者简介：刁鸿鹄（1996— ），男，安徽马鞍山人，硕士研究生，*****************，主要研究方向为语音识别与测控技术。

第 34 卷第 1 期2021 年 2 月常州工学院学报Journal of Changzhou Institute of TechnologyV ol. 34 No. 1Feb.2021doi:10.3969/j.issn.1671-0436.2021.01.0080 引言语音端点检测技术是对输入语音进行有话段起止端点的标记。

它是语音识别系统中一个关键环节。

端点检测的成功与否直接影响了语音识别系统的准确率。

现实生活中，因无法保证采集环境处于安静状态，故语音输入信号不可避免地带有各种噪声。

因此，研究在低信噪比环境下具有良好识别率的语音端点检测技术有实际意义，对提升系统在恶劣环境下的工作稳定性大有益处。

Improved Endpoint Detection Algorithm Based on LMS AdaptiveDIAO Honghu ，MAO Qiang ，ZHANG Xiaobing(School of Electrical and Information Engineering, Anhui University of Technology, Maanshan 243032)Abstract: Speech recognition technology is no longer limited to the laboratory. However, some key technologies still need to be further optimized and improved to adapt to the increasing demands of society and users. Starting from the technical theory of speech recognition and focusing on the endpoint detection technology, based on which, it is planned to improve the existing algorithm and enhance its recognition accuracy in a low signal-to-noise ratio environment. A new endpoint detection algorithm using cepstral distance-entropy ratio after LMS adaptive noise reduction is proposed, and the corresponding test is performed on the MATLAB platform. The results show that compared with traditional methods, the detection accuracy of this algorithm is indeed improved.Key words: speech recognition ；adaptive noise filtering ；cepstrum distance ；energy-entropy ratio322021年常州工学院学报1 自适应滤波减噪自适应信号的主要特征是在无预设值的条件下，实时调用运行数据，根据算法不断递归，更新参数，逐步逼近最优结果[1]。

一种基于自适应谱熵的端点检测改进方法

仅快速有效，较强的鲁棒性，具有而且适合低信噪比的语音端点检测。
关键词：语音端点检测；自适应子带谱熵；语音识别；鲁棒性
中图分类号：Ｎ１．Ｔ９２３文献标识码：Ａ
ＡｎＩｐｒｖｄｐｅｃｄｐｉｔＤｅｅｔｏｅｈｏＢａｅｎｍｏｅＳｅｈＥｎｏｎｔｃｉｎＭｔｄｓｄｏ
第７第１期２卷２
文章编号：０６—９４（００）２—０７０１０３８２１１３３— ３
计
算
机仿
真
２１年ｌ月００２端点检测改进方法
王琳，李成荣
（．中国科学院自动化研究所，１北京１０９０１０；
２ｈｎｓｃｄｍｆｃｎｅ，ｅｉｇ１０４，ｈｎ）．ＣｉｅＡａｅｙｏＳｉｃｓＢｉｎ００９Ｃｉａｅｅｊ
ＡＳＲＴ：ｈｓｐｐｒｒｏｅｏｅｓｅｃｅｃｏｅｏｓｄｗｔｗｒｉａ—ｔＢＴＡＣＴｉａｅｐｏｓｓｎｖｌｐｅｈｄｔｔｎｍｔｄｕｅｉｌｅｇｌｏ—ｎｉｔＳＲ．ｐａｅｉｈｈｏｓｎｏｅｒｉＮ）ｓａｏ（
目前运用于语音端点检测的特征参数主要包括短时能
１引言
随着语音技术的发展，用的领域越来越广，些年，应近用
量，短时平均幅度，时平均过零率，短倒谱系数以及短时能谱值等。但在噪音环境下，这些端点检测方法变得不理想。语音信号的能量小时，被噪声所掩盖，易因此难于用能量特征参数进行语音端点检测。Ｓｅ等人提出了基于信息熵的ｈｎ端点检测方法，信息熵只与能量的随机性有关，和能量幅值

本科毕业论文-—语音端点检测算法的研究及matla程序仿真与实现

摘要摘要语音端点检测是指从一段语音信号中准确的找出语音信号的起始点和结束点，它的目的是为了使有效的语音信号和无用的噪声信号得以分离，因此在语音识别、语音增强、语音编码、回声抵消等系统中得到广泛应用。

目前端点检测方法大体上可以分成两类，一类是基于阈值的方法，该方法根据语音信号和噪声信号的不同特征，提取每一段语音信号的特征，然后把这些特征值与设定的阈值进行比较，从而达到语音端点检测的目的，该方法原理简单，运算方便，所以被人们广泛使用，本文主要对基于阀值的方法进行研究。

另一类方法是基于模式识别的方法，需要估计语音信号和噪声信号的模型参数来进行检测。

由于基于模式识别的方法自身复杂度高，运算量大，因此很难被人们应用到实时语音信号系统中去。

端点检测在语音信号处理中占有十分重要的地位，直接影响着系统的性能。

本文首先对语音信号进行简单的时域分析，其次利用短时能量和过零率算法、倒谱算法、谱熵算法进行语音端点检测，并对这几种算法进行端点检测，并进行实验分析。

本文首先分别用各算法对原始语音信号进行端点检测，并对各算法检测结果进行分析和比较。

其次再对语音信号加噪，对不同信噪比值进行端点检测，分析比较各算法在不同信噪比下的端点检测结果，实验结果表明谱熵算法语音端点检测结果比其他两种方法好。

关键词语音端点检测；语音信号处理；短时能量和过零率；倒谱；谱熵IAbstractEndpoint detection is a voice signal from the accurate speech signal to the identify start and the end points, the purpose is to enable to separated the effective voice signals and un-useful noise. So, in the speech recognition system, speech enhancement, speech coding, echo cancellation and other systems are widely used.In Current the endpoint detection can be roughly divided into two categories, one is based on the threshold method based on the different characteristics of speech signal and the noise signals, a voice signal for each extracted feature, and then set the values of these thresholds compare with the values to achieve the endpoint detection purposes, This method is simple, it convenient operation, it is widely used, the main in this paper is based on the method of threshold method. Another method is based on the method of pattern recognition , it needs to estimate the speech signal and the noise signal model parameters were detected. Because is based on the method of pattern recognition and high self-complexity, a large amount of computation, so it is difficult to be use in real-time voice signal system for people.The Endpoint detection is take a very important position in the speech recognition, it directly affects the performance of the system. In this article first domain analysis in simple speech signal time, than dual threshold algorithm, cepstrum algorithm, spectral entropy algorithm for endpoint detection, and these types of endpoint detection algorithms, and experimental analysis points. Firstly, the algorithm were used to the original speech signal detection, and the algorithm to analyze and compare results. Secondly, the speech signal and then adding noise, SNR values for different endpoint detection, analysis and comparison of various algorithms under different SNR endpoint detection results, experimental results show that the spectral entropy of speech endpoint detectionIIalgorithm results better than the other two methods.Keywords voice activity detection;Signal processing; Average energy use of short-term and short-time average zero-crossing rat; cepstrum; spectral entropyIII毕业设计（论文）原创性声明和使用授权说明原创性声明本人郑重承诺：所呈交的毕业设计（论文），是我个人在指导教师的指导下进行的研究工作及取得的成果。

基于子带能量的语音端点检测算法的研究

基于子带能量的语音端点检测算法的研究
基于子带能量的语音端点检测算法的研究
ＳｐｅｅｃｈＥｎｄｐｏｉｎｔＤｅｔｅｃｔｉｏｎＡｌｇｏｒｉｔｈｍＢａｓｅｄｏｎＳｕｂ－ｂａｎｄＥｎｅｒｇｙ
语音端点检测（ＳｐｅｅｃｈＥｎｄｐｏｉｎｔＤｅｔｅｃｔｉｏｎ）是指从背景噪声中分离出有声部分，又被称为语音激活检测（ＶｏｉｃｅＡｃｔｉｖｉｔｙＤｅｔｅｃｔｉｏｎ，ｖＡＤ）。高效准确的端点检测能够大幅减轻语音信号
端点检测主要基于短时语音特征，如短时能量、短时过零率，短时自相关函数等，在高信噪比和稳定噪声环境下达到了令人满
１．１特征参数设语音波形时域信号为ｘ（ｎ），分帧并加窗后的第ｎ帧信号
为Ｘｎ（ｍ），用Ｅｎ表示其短时能量，则其定义为：
，
意的效果，但在低信噪比和多变噪声环境下，检测的正确率会急
＝
剧下降。语音端点检测历经几十年的研究发展，不断有新的方法
（ｍ）
朱明明吴小培罗雅琴（安徽大学计算智能与信号处理教育部重点实验室，安徽合肥２３０６０１）
摘要
端点检泖ｌ作为语音信号处理系统前端处理的重要环节，直接影响系统处理的准确性和高效性。传统的端点检测在高

基于EMD和能零比的语音端点检测算法

• 28•语音端点检测是语音信号处理的一个重要环节。

在低信噪比的情况下，传统的能零比端点检测的方法正确率很低。

本文提出了基于EMD 和能零比的语音端点检测算法，它结合语音增强技术，利用EMD 分解特性，求出能零比参数，设置自适应检测阈值，实现了在低信噪比环境下的语音端点检测。

仿真实验结果表明该方法在低信噪比情况下能够提高检测的正确率和稳定性。

语音端点检测是语音信号处理中的一个非常重要的环节。

语音端点检测算法主要分为两大类：模型匹配端点检测和特征参数端点检测。

模型匹配端点检测如基于隐马尔科夫模型等，该类型检测算法过程复杂，运算量大，因此应用与发展受到了限制。

特征参数端点检测主要是根据语音信号的时域特征和频域特征，该算法简单，运算量小，但在低信噪比的情况下检测误判率高。

美籍华人N.E.H u a n g 在1998年提出了经验模态分解方法(Empirical Mode Decomposition ，EMD)。

该算法能够很好的适应于语音这种常见的非线性非平稳信号。

本文提出了基于EMD 和能零比的语音端点检测算法。

研究表明，该方法在低信噪比情况下能够提高语音端点检测的正确率和稳定性。

1 基于EMD和能零比的语音端点检测算法基于EMD 和能零比的语音端点检测算法，首先对含有白噪声的语音数据进行语音增强，这里采用谱减法进行语音增强。

再将增强后的语音进行EMD 分解，由于含白噪声的语音信号的能量主要分布在第2-5层IMF 中，因此重构语音信号选择第2-5个IMF 分量。

对于重构后的语音信号进行分帧，求出每帧的过零率，同时对每帧再次EMD 分解，求出各阶IMF 的Teager 能量，并将各阶能量求和，构成特征参数能零比，最后自适应门限求解、判决。

1.1 语音增强当信噪比下降时,噪声的能量变大，使得语音端点检测正确率下降。

为了能有效检测较低信噪比的语音信号的端点，应用语音增强技术来提高语音的信噪比，改进语音质量。

基于小波能量熵的语音端点检测算法

基于小波能量熵的语音端点检测算法邱文武;蒋建中;郭军利【摘要】首先对语音信号进行小波变换,引入反映信号能量分布特性的小波熵,进行端点检测.并根据浊音的特点,改进了自然加权因子.仿真表明,在低信噪比条件下其检测效果要好于自适应子带谱熵法.%First, the wavelet transformation is used on vocal signals. Then the wavelet entropy reflecting energy distributing characteristics of the signal is introduced for detecting the point. Finally, the natural weighting factor is improved based on the characteristic of sonant sound. Simulation results indicate that the new algorithm outperforms the adaptive band-partitioning spectral entropy-voice activity detection (BSE-VAD) in detection result in condition of low signal-to-noise ratio.【期刊名称】《计算机应用与软件》【年(卷),期】2011(028)002【总页数】3页(P227-228,259)【关键词】端点检测;能量熵;小波能量;小波熵【作者】邱文武;蒋建中;郭军利【作者单位】解放军信息工程大学,河南,郑州,450002;解放军信息工程大学,河南,郑州,450002;解放军信息工程大学,河南,郑州,450002【正文语种】中文0 引言日常生活中，我们说话时都会受到周围环境的噪声干扰。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

基于子带能熵比的语音端点检测算法
张毅;王可佳;席兵;颜博
【期刊名称】《计算机科学》
【年(卷),期】2017(044)005
【摘要】It is an important step of speech recognition process to identify accurately the speech endpoint.Under the environment with low SNR,in order to enhance the discrimination of noise better and improve the accuracy of speech endpoint detection system,this paper proposesd a new type of speech endpoint detection algorithm based on sub-band energy-entropy-ratio.The proposed algorithm takes the ratio of short-time sub-band energy and sub-band spectral entropy as an important parameter of endpoint detection,and sets the threshold to speech endpoint detection.Experiments show that the algorithm is fast and efficient,and it also has strong robustness and can detect the voice endpoint under lower SNR accurately.%准确地识别语音端点是语音识别过程中的一个重要步骤.在低信噪比环境下,为更好地增强语音和噪声的区分度,提高语音端点检测系统的准确率,在分析了常规子带谱熵端点检测算法的基础上结合子带能量,提出了一种基于子带能熵比的语音端点检测算法.该算法将子带能量和子带谱熵的比值作为端点检测的重要参数,以此设定阈值进行语音端点的检测.实验表明,该算法快速高效,具有较高的鲁棒性,在较低的信噪比环境下能准确地进行语音端点检测.
【总页数】5页(P304-307,319)
【作者】张毅;王可佳;席兵;颜博
【作者单位】重庆市信息无障碍与服务机器人工程技术研发中心重庆400065;重庆市信息无障碍与服务机器人工程技术研发中心重庆400065;重庆市信息无障碍与服务机器人工程技术研发中心重庆400065;重庆市信息无障碍与服务机器人工程技术研发中心重庆400065
【正文语种】中文
【中图分类】TP242.6
【相关文献】
1.基于EMD-Teager能量和子带谱熵法的语音端点检测 [J], 陈召全;刘美娟;章小兵;王晨
2.基于子带能量的语音端点检测算法的研究 [J], 朱明明;吴小培;罗雅琴
3.基于自适应子带功率谱熵的语音端点检测算法 [J], 李金宝;屈百达;徐宝国;周小祥
4.基于噪声估计的改进能量熵语音端点检测算法 [J], 蒋学仕
5.基于子带二次谱熵的语音端点检测 [J], 朱建伟;孙水发;但志平;雷帮军
因版权原因，仅展示原文概要，查看原文内容请购买。