麦克风阵列语音增强的研究(1)

合集下载

基于麦克风阵列的语音增强与干扰抑制算法

１㊀文献参考格式:王义圆ꎬ张曦文ꎬ周贻能ꎬ等.基于麦克风阵列的语音增强与干扰抑制算法[Ｊ].电声技术ꎬ２０１８ꎬ４２(２):１－５.ＷＡＮＧＹＹꎬＺＨＡＮＧＸＷꎬＺＨＯＵＹＮꎬｅｔａｌ.Ｓｐｅｅｃｈｅｎｈａｎｃｅｍｅｎｔａｎｄｉｎｔｅｒｆｅｒｅｎｃｅｓｕｐｐｒｅｓｓｉｏｎａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓ[Ｊ].Ａｕｄｉｏｅｎｇｉｎｅｅｒｉｎｇꎬ２０１８ꎬ４２(２):１－５.中图分类号:ＴＮ９１２.３５㊀㊀㊀㊀㊀文献标志码:Ａ㊀㊀㊀㊀㊀ＤＯＩ:１０.１６３１１/ｊ.ａｕｄｉｏｅ.２０１８.０２.００１基于麦克风阵列的语音增强与干扰抑制算法王义圆ꎬ张曦文ꎬ周贻能ꎬ黄际彦(电子科技大学信息与通信工程学院ꎬ四川成都６１１７３１)摘要:麦克风阵列在语音信号处理领域有着非常广泛的应用ꎬ该文提出了一种基于麦克风阵列的语音增强与干扰抑制算法ꎬ即空频联合处理算法ꎮ首先利用延迟－求和波束形成技术分别对麦克风阵列接收信号中的语音信号和干扰信号进行波束形成ꎮ然后将时域上的两个波束形成输出转换到频域ꎬ在频域上构造加权系数ꎬ利用加权系数乘以频域上的语音信号ꎬ从而进一步实现滤除干扰信号以增强语音信号的目的ꎮ仿真结果表明ꎬ该文提出的算法可以有效地对语音信号进行增强并且抑制干扰信号ꎮ相对于纯空域方法ꎬ该文提出的空频联合处理方法可以更有效地增强语音信号和抑制干扰ꎮ关键词:波束形成ꎻ麦克风阵列ꎻ语音增强ꎻ空频联合ꎻ系数加权ＳｐｅｅｃｈＥｎｈａｎｃｅｍｅｎｔａｎｄＩｎｔｅｒｆｅｒｅｎｃｅＳｕｐｐｒｅｓｓｉｏｎＡｌｇｏｒｉｔｈｍＢａｓｅｄｏｎＭｉｃｒｏｐｈｏｎｅＡｒｒａｙｓＷＡＮＧＹｉｙｕａｎꎬＺＨＡＮＧＸｉｗｅｎꎬＺＨＯＵＹｉｎｅｎｇꎬＨＵＡＮＧＪｉｙａｎ(ＳｃｈｏｏｌｏｆＩｎｆｏｒｍａｔｉｏｎａｎｄＣｏｍｍｕｎｉｃａｔｉｏｎＥｎｇｉｎｅｅｒｉｎｇꎬＵｎｉｖｅｒｓｉｔｙｏｆＥｌｅｃｔｒｏｎｉｃＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙꎬＣｈｅｎｇｄｕ６１１７３１ꎬＣｈｉｎａ)Ａｂｓｔｒａｃｔ:Ｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓｈａｓｗｉｄｅａｐｐｌｉｃａｔｉｏｎｓｉｎｔｈｅａｒｅａｏｆｓｐｅｅｃｈｓｉｇｎａｌｐｒｏｃｅｓｓｉｎｇ.Ａｓｐｅｅｃｈｅｎｈａｎｃｅｍｅｎｔａｎｄｉｎ￣ｔｅｒｆｅｒｅｎｃｅｓｕｐｐｒｅｓｓｉｏｎａｌｇｏｒｉｔｈｍｂａｓｅｄｏｎｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓｉｓｐｒｏｐｏｓｅｄ.Ｔｈａｔｉｓｓｐａｃｅａｎｄｆｒｅｑｕｅｎｃｙｐｒｏｃｅｓｓｉｎｇａｌｇｏｒｉｔｈｍ.Ｆｉｒｓｔｌｙꎬｔｈｅｓｐｅｅｃｈｓｉｇｎａｌａｎｄｉｎｔｅｒｆｅｒｅｎｃｅｓｉｇｎａｌｉｎｔｈｅｒｅｃｅｉｖｅｄｓｉｇｎａｌｏｆｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓａｒｅｂｅａｍｆｏｒｍｅｄｂｙｕｓｉｎｇｔｈｅｄｅ￣ｌａｙ－ｓｕｍｂｅａｍｆｏｒｍｉｎｇｍｅｔｈｏｄ.Ｔｈｅｎꎬｔｈｅｔｗｏｂｅａｍｆｏｒｍｉｎｇｏｕｔｐｕｔｓａｒｅｔｒａｎｓｆｏｒｍｅｄｆｒｏｍｔｈｅｔｉｍｅｄｏｍａｉｎｔｏｔｈｅｆｒｅｑｕｅｎｃｙｄｏｍａｉｎ.Ｉｎｔｈｅｆｒｅｑｕｅｎｃｙｄｏｍａｉｎꎬａｗｅｉｇｈｔｉｎｇｆｕｎｃｔｉｏｎｉｓｃｏｎｓｔｒｕｃｔｅｄｗｉｔｈｔｈｅｔｗｏｂｅａｍｆｏｒｍｉｎｇｏｕｔｐｕｔｓ.Ｆｉｎａｌｌｙꎬｉｎｏｒｄｅｒｔｏｆｉｌｔｅｒｔｈｅｉｎｔｅｒｆｅｒｅｎｃｅｓｉｇｎａｌａｎｄｅｎｈａｎｃｅｔｈｅｓｐｅｅｃｈｓｉｇｎａｌꎬｔｈｅｓｐｅｅｃｈｓｉｇｎａｌｉｓｍｕｌｔｉｐｌｉｅｄｂｙｗｅｉｇｈｔｉｎｇｆｕｎｃｔｉｏｎｉｎｔｈｅｆｒｅｑｕｅｎｃｙｄｏｍａｉｎ.Ｔｈｅｓｉｍｕｌａｔｉｏｎｒｅｓｕｌｔｓｄｅｍｏｎｓｔｒａｔｅｔｈａｔꎬｔｈｅａｌｇｏｒｉｔｈｍｐｒｏｐｏｓｅｄｉｎｔｈｉｓｐａｐｅｒｃａｎｅｎｈａｎｃｅｔｈｅｓｐｅｅｃｈｓｉｇ￣ｎａｌａｎｄｓｕｐｐｒｅｓｓｔｈｅｉｎｔｅｒｆｅｒｅｎｃｅｓｉｇｎａｌｅｆｆｅｃｔｉｖｅｌｙ.Ｃｏｍｐａｒｉｎｇｗｉｔｈｐｒｏｃｅｓｓｉｎｇｏｎｌｙｉｎｔｈｅｓｐａｃｅｄｏｍａｉｎꎬｔｈｅａｌｇｏｒｉｔｈｍｐｒｏ￣ｐｏｓｅｄｉｎｔｈｉｓｐａｐｅｒｃａｎｅｎｈａｎｃｅｓｐｅｅｃｈｓｉｇｎａｌｍｏｒｅｅｆｆｉｃｉｅｎｔｌｙ.Ｋｅｙｗｏｒｄｓ:ｂｅａｍｆｏｒｍｉｎｇꎻｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓꎻｓｐｅｅｃｈｅｎｈａｎｃｅｍｅｎｔꎻｓｐａｃｅａｎｄｆｒｅｑｕｅｎｃｙｐｒｏｃｅｓｓｉｎｇꎻｗｅｉｇｈｔｅｄｃｏｅｆｆｉｃｉｅｎｔ１㊀引言随着社会的快速发展ꎬ语音通信作为最直接㊁最有效的通信手段受到人们地广泛关注ꎬ人们对语音通信质量的要求也逐渐提高ꎮ在实际的语音通信环境中存在着各种各样的噪声干扰ꎬ这些干扰严重影响了语音通信的质量[１]ꎮ因此ꎬ为了提高语音通信的质量ꎬ语音增强技术一直是语音信号处理领域中的热点问题ꎮ语音增强是指从噪声背景中提取有用信号ꎬ抑制㊁降低噪声干扰的技术ꎬ即从带噪语音中提取尽可能纯净的原始语音信号[２]ꎮ麦克风阵列信号处理技术能够充分利用语音信号的空时信息ꎬ已经成为研究语音增强的热点所在[３－５]ꎮ目前常用的经典麦克风阵列语音增强方法２㊀包括固定波束形成㊁自适应波束形成㊁盲信号分离以及后置滤波等[６]ꎮ其中ꎬ固定波束形成算法最早由Ｆｌａｎａｇａｎ[７]提出ꎬ是最经典的空域处理方法ꎬ也是其他方法的基础ꎬ该算法通过对各麦克风阵元接收到的信号进行时延补偿ꎬ使得各通道输出信号在某一方向上保持同步ꎬ并且在该方向的入射信号获得最大增益[８]ꎮ该方法相对简单并且易于实现ꎬ但对于干扰信号的屏蔽效果不是很好ꎮ如果只做波束形成ꎬ增强后的声源信号中仍然有干扰信号的存在ꎮ此外ꎬ当前的研究主要是基于纯空域处理技术ꎬ未利用到时频信息ꎬ性能受限ꎮ本文在固定波束形成技术的基础上做了改进ꎬ在频域上构造新的加权函数ꎬ提出了空域波束形成－频域加权的空频联合处理算法ꎬ从而进一步对干扰信号进行抑制ꎮ由于利用到频率信息ꎬ所提出的算法能够更有效的抑制干扰ꎮ２㊀传统的固定波束形成算法传统的波束形成可以描述为作用于传感器阵列输出的空间滤波器ꎬ构造特定的波束方向图ꎮ这种空间滤波过程可以分为两步:时间对齐和加权求和ꎮ以简单的延迟－相加波束形成为例ꎬ第一步首先根据每个麦克风阵元与参考点之间的到达时间差ꎬ对每个阵元信号进行相应的时移ꎮ第二步是将时移后的信号相加[９]ꎮ假设语音信号为ｘｔ()ꎬ其由Ｍ个窄带信号叠加而成ꎬ表达式可记为:ｘｔ()＝ðＭｍ＝１ｘｆｍｔ()(１)式中:ｘｆｍ＝ｕｔ()ｃｏｓ２πｆｍｔ＋ｖ(ｔ)[](２)式中ꎬｘｆｍ是以ｆｍ为中心频率的窄带信号ꎬｕｔ()为慢变化的幅度调制函数ꎬｖｔ()为慢变化的相位调制函数ꎮ理想情况下ꎬ第ｉ个麦克风ꎬ在时刻ｋ的阵列输出可表示为:Ｘｉｋ()＝αｉｘｋ－ｔ－τｉ()＋ｎｉｋ()(３)式中ꎬｘｔ()为源信号ꎬｉ＝１ꎬ２ꎬ ꎬＭꎬτｉ㊁αｉ㊁ｎｉｋ()分别为从声源到第ｉ个麦克风的延迟㊁幅度衰减和干扰信号ꎮ对其进行采样ꎬ采样频率为ｆｓꎬ采样点数为Ｎꎬ第ｎ个采样点时刻的输出为:Ｘｉｎ()＝αｉｘｎＴｓ－ｔ－τｉ()＋ｎｉｎＴｓ()(４)式中ꎬＴｓ＝１/ｆｓꎬｎ＝１ꎬ２Ｎꎮ假定阵元ｉ的位置向量为:Ｒｉ＝ｒｘｉꎬｒｙｉꎬｒｚｉ()(５)式中ꎬｒｘｉ＝ｒｉｓｉｎφｉｃｏｓθｉꎬｒｙｉ＝ｒｉｓｉｎφｉｓｉｎθｉꎬｒｚｉ＝ｒｉｃｏｓφｉꎬｉ＝１ꎬ２ꎬ ꎬＭꎬφｉꎬθｉ分别为阵元位置的俯仰角和水平角ꎮｒｉ＝ｒｘｉ２＋ｒｙｉ２＋ｒｚｉ２是阵元ｉ和原点之间的几何距离ꎮ平面波从－ｒ方向入射到阵列:ｒ＝ｓｉｎφｃｏｓθꎬｓｉｎφｓｉｎθꎬｃｏｓφ()(６)式中ꎬφꎬθ为信号源的俯仰角和水平角ꎮ以原点为参考点ꎬ设该点接收信号为ｘｔ()ꎬ则阵元ｉ接收到的信号相对于原点的时间延迟[１０]为:τｉ＝－ｒˑＲｉ/ｃ＝－ｒｘｉｓｉｎφｃｏｓθ＋ｒｙｉｓｉｎφｓｉｎθ＋ｒｚｉｃｏｓφ()ｃ(７)式中ꎬｃ＝３４０ｍ/ｓꎮ根据以上求得的时间延迟对信号进行时移:Ｘａꎬｉｎ()＝Ｘｉ(ｎ＋τｉ)(８)式中ꎬ下标ａ表示时间对齐后的阵元信号ꎮ将时移后的信号加权求和ꎬ得到波束形成的输出为:ＺＸｎ()＝１ＭðＭｉ＝１Ｘａꎬｉｎ()(９)式中ꎬｉ＝１ꎬ２ꎬ ꎬＭꎮ㊀３㊀改进的空频联合处理算法在传统纯空域波束形成的基础上ꎬ本文提出了空频联合处理方法ꎮ空频联合处理算法框图如图１所示ꎬ即增加了频域上的加权处理ꎬ通过空频联合处理更加有效地对语音信号进行增强ꎮ本算法假设麦克风阵列位于声源的远场ꎬ如此可近似地认为收到的信号为平面波ꎮ声源信号和干扰信号的方向可以通过ＤＯＡ[１１－１３]估计或其他测向方式获得ꎬ已知信号方向ꎮ３㊀图１㊀空频联合处理算法框图３.１㊀算法结构１)空域:延时－求和波束形成与上一部分介绍的传统固定波束形成相同ꎬ首先根据每一个麦克风与参考点之间的时延ꎬ对麦克风接收信号进行时移ꎬ使各路输出信号在某一方向上对齐ꎮ然后将时移后的信号相加ꎬ针对声源信号与干扰信号分别形成两个波束形成输出ꎮ２)频域:系数加权将两个波束形成后的输出从时域转换到频域并构造加权系数ꎬ利用加权系数乘以频域上的声源信号ꎬ进一步地消除干扰信号以增强声源信号ꎮ３.２㊀加权系数的构造空域上ꎬ利用延迟－相加波束形成算法ꎬ分别得到指向声源信号ｓｔ()以及干扰信号Ｉｔ()的两个波束形成输出Ｚｓｎ()㊁ＺＩｎ():Ｚｓｎ()＝１ＭðＭｉ＝１Ｓａꎬｉｎ()(１０)ＺＩｎ()＝１ＭðＭｉ＝１Ｉａꎬｉｎ()(１１)式中ꎬｎ＝１ꎬ２Ｎꎬ为时域采样点序号ꎮ对波束形成后的输出进行加窗分帧[１４]:Ｚｓꎬｎｍ()＝Ｗ(ｍ)ＺＳ(ｎ＋ｍ)(１２)ＺＩꎬｎｍ()＝Ｗ(ｍ)ＺＩ(ｎ＋ｍ)(１３)式中ꎬＷ(ｍ)为窗函数ꎬｎ是帧序号ꎬｍ是帧同步的时间序号ꎬｍ＝１ꎬ２ＮꎬＮ为帧长ꎮ接着对分帧后的离散数据做短时傅里叶变换ꎬ定义角频率ω＝２πｋＮꎬ１ɤｋɤＮꎬ则离散的短时傅里叶变换为:Ｙｓꎬｎｅｊ２πｋＮ()＝ðＮｍ＝１Ｚｓꎬｎ(ｍ)ｅ－ｊ２πｋＮｍ(１４)ＹＩꎬｎｅｊ２πｋＮ()＝ðＮｍ＝１ＺＩꎬｎ(ｍ)ｅ－ｊ２πｋＮｍ(１５)构造系数Ｗｎ:Ｗｎ＝Ｓｎｅｊ２πｋＮ()Ｓｎｅｊ２πｋＮ()＋Ｉｎｅｊ２πｋＮ()(１６)式中ꎬｎ是帧序号ꎬＳｎｅｊ２πｋＮ()㊁Ｉｎｅｊ２πｋＮ()分别为声源信号和干扰信号一帧内的短时功率谱:Ｓｎｅｊ２πｋＮ()＝ＹＳꎬｎｅｊ２πｋＮ() Ｙ∗Ｓꎬｎｅｊ２πｋＮ()＝ＹＳꎬｎｅｊ２πｋＮ()２(１７)Ｉｎｅｊ２πｋＮ()＝ＹＩꎬｎｅｊ２πｋＮ() Ｙ∗Ｉꎬｎｅｊ２πｋＮ()＝ＹＩꎬｎｅｊ２πｋＮ()２(１８)由此ꎬ我们便构造出加权系数Ｗｎꎬ从式(１６)可以看出:频域上ꎬ对声源信号波束形成输出进行系数加权时ꎬ如果某一频率上声源信号中存在的干扰信号较大ꎬ权值系数Ｗｎ便会减小ꎬ从而该频率的声源信号在一定程度上被削减ꎻ干扰信号小的频点上的声源信号被保留ꎮ通过这种方法ꎬ频域上系数加权可以有效地抑制干扰信号ꎮ频域上系数加权后第ｎ帧声源信号为:ＺＳꎬｎ(ｆ)＝ｗｎˑＹｓꎬｎｅｊ２πｋＮ()(１９)再将频域信号转换到时域ꎬ得到第ｎ帧系数加权后的声源信号:ＺＳꎬｎ(ｍ)＝１ＮðＮｍ＝１ＺＳ(ｆ)ｅｊ２πｋＮｍ(２０)式中ꎬｍ是帧同步的时间序号ꎬｍ＝１ꎬ２ꎬ ꎬＮꎬＮ为帧长ꎮ最后合成所有帧信号得到系数加权后的输出信号ꎮ４㊀麦克风阵列语音增强的评价标准采用以下两种标准来衡量算法性能ꎮ４.１㊀分段信噪比信噪比是衡量语音增强算法效果的常规方法ꎬ定义为信号和噪声能量比值的对数值ꎬ信噪比越大ꎬ表示语音质量越好ꎮ不过ꎬ由于整段语音信号是时变的ꎬ而噪声能量是均匀分布的ꎬ传统信噪比计算公式只能得到大致的信噪比ꎮ因此ꎬ为了了解语音信号的信噪比情况ꎬ定义了不同时段下的分段信噪比[１５－１６]为:ＳＮＲ＝１ＭðＭ－１ｍ＝０１０ｌｏｇ１０ðＬ－１ｌ＝０ｓ２(ｌ)ｓ(ｌ)－ｓ(ｌ)[]２éëêêùûúú(２１)式(２１)中ꎬＬ为帧长ꎬＭ为帧数ꎬ对于每帧算出的信噪比设置高低门限ꎬ分别为３５ｄＢ和－１０ｄＢꎮ４㊀４.２㊀噪声抑制噪声抑制[１７](ＮｏｉｓｅＲｅｄｕｃｔｉｏｎꎬＮＲ)表征了算法对于噪声的抑制作用ꎬ定义为:ＮＲ＝１０ｌｏｇ１０ðＮ－１ｎ＝０ｖｉｎ(ｎ)２ðＮ－１ｎ＝０ｖｏｕｔ(ｎ)２æèçççöø÷÷÷(２２)式中ꎬｖｉｎ(ｎ)ꎬｖｏｕｔ(ｎ)分别为输入和输出中的噪声信号ꎮＮＲ越大ꎬ说明噪声抑制效果越好ꎮ５㊀仿真与分析仿真实验分别以长度为２２ｓ的语音信号ｓｉｇ￣ｎａｌ１.ｗａｖ和ｓｉｇｎａｌ２.ｗａｖ作为声源ꎬ声源信号为ｓｉｇ￣ｎａｌ２.ｗａｖꎬｓｉｇｎａｌ１.ｗａｖ为干扰信号ꎮ仿真条件如下:麦克分阵列为４阵元均匀线阵ꎬ阵元间距为１０ｃｍꎬ声源信号与干扰信号位置分别为(－１.７ꎬ０.６２ꎬ２.１６)ꎬ(２.１１ꎬ－０.７７ꎬ２.６８)ꎮ仿真结果如下ꎮ５.１㊀语谱图各形式下的语音语谱图如图２~图５所示ꎮ图２㊀纯净语音信号的频谱图图３㊀单麦克风接收信号的语谱图图４㊀波束形成后的语谱图图５㊀加权后的语谱图从图４可以看出ꎬ相比于图３所示的单麦克风信号语谱图ꎬ经过传统的固定波束形成方法后ꎬ信号的语谱图在很大程度上滤除了干扰信号ꎬ但仍有残存ꎻ对比图４和图５ꎬ经过本文方法频域上系数加权后ꎬ图５显示的语音信号的语谱图更干净㊁更接近图２所示的纯净语音信号ꎬ干扰信号被进一步抑制ꎮ５.２㊀分段信噪比不同情形下分段信噪比对比见表１ꎮ表１㊀不同情形下信噪比对比５㊀㊀㊀由上表可以看出ꎬ波束形成后的语音信号信噪比提高了５.１９ｄＢꎬ系数加权后的语音信号信噪比提高了６.９７ｄＢꎮ系数加权后相比于仅作波束形成信噪比提高了１.７８ｄＢꎮ由此可以看出ꎬ波束形成可以对语音进行增强ꎬ提高信噪比ꎮ而系数加权可以进一步地对干扰噪声进行滤波ꎬ从而提高信噪比ꎮ５.３㊀噪声抑制计算了仅做波束形成后信号的噪声抑制比为６.１０ｄＢꎬ而进一步系数加权后的噪声抑制比为７.７２ｄＢꎬ噪声抑制比提高了１.６２ｄＢꎮ由此可以看出ꎬ系数加权在波束形成的基础上更加有效地抑制了干扰噪声ꎮ６㊀结束语本文分析并提出了一种基于麦克风阵列的语音增强与干扰抑制算法ꎬ在波束形成之后增加了系数加权进一步滤除干扰信号ꎬ利用空频联合处理进行语音增强ꎮ仿真结果从语谱图上可以看出ꎬ波束形成后的输出信号一定程度上滤除了干扰信号ꎬ系数加权可以更加有效地提高信噪比ꎮ听音结果也显示系数加权后的语音质量相比较仅做波束形成有所提高ꎮ当然ꎬ分段信噪比的计算结果也表明系数加权对于信噪比的提高优于仅做波束形成ꎮ系数加权后对于干扰的抑制更加明显㊁有效ꎮ参考文献:[１]沈锁金ꎬ刘伟ꎬ高颖.语音增强算法的研究与实现[Ｊ].电声技术ꎬ２０１６ꎬ４０(１２):４０－４２.[２]张金虎.基于麦克风阵列的语音增强算法研究[Ｄ].兰州:兰州交通大学ꎬ２０１４.[３]于春和ꎬ苏龙.基于ＧＳＣ与谱减法的麦克风阵列语音增强方法[Ｊ].沈阳航空航天大学学报ꎬ２０１５ꎬ３２(０５):８０－８５.[４]陈磊ꎬ江伟华ꎬ童峰ꎬ等.一种可跟踪移动声源方向的麦克风阵列语音增强算法[Ｊ].厦门大学学报:自然科学版ꎬ２０１５ꎬ５４(０４):５５１－５５５.[５]戴红霞ꎬ赵力.基于麦克风阵列的数字助听器语音增强技术[Ｊ].电子器件ꎬ２０１５ꎬ３８(０３):６０６－６１０.[６]武素芳.基于延迟－求和的麦克风阵列语音增强算法研究[Ｄ].西安电子科技大学ꎬ２０１０.[７]ＪＬＦＬＡＮＡＧＡＮ.Ｃｏｍｐｕｔｅｒ－ｓｔｅｅｒｅｄｍｉｃｒｏｐｈｏｎｅａｒｒａｙｓｆｏｒｓｏｕｎｄｔｒａｎｓｄｕｃｔｉｏｎｉｎｌａｒｇｅｒｏｏｍｓ[Ｊ].ＪｏｕｒｎａｌｏｆＡｃｏｕｓｔｉｃａｌＳｏｃｉｅｔｙｏｆＡｍｅｒｉｃａｎ.１９８５ꎬ７８(５):１５０８－１５１８.[８]丁猛.基于麦克风阵列的语音增强算法概述[Ｊ].大众科技ꎬ２０１１(０３):２９－３０.[９]ＪＡＣＯＢＢꎬＣＨＥＮＪＤꎬＨＵＡＮＧＹＴ.麦克风阵列信号处理[Ｍ].邹霞ꎬ周彬ꎬ译.北京:国防工业出版社ꎬ２０１６:３３－３４.[１０]白梅.宽带恒定束宽波束形成方法研究[Ｄ].电子科技大学ꎬ２００８.[１１]叶中付ꎬ罗大为ꎬ韦进强ꎬ等.相干信号波达方向估计技术综述[Ｊ].数据采集与处理ꎬ２０１７ꎬ３２(０２):２５８－２６５.[１２]李声飞.一种改进ＭＵＳＩＣ算法ＤＯＡ估计的研究与ＦＰＧＡ实现[Ｊ].信息技术与信息化ꎬ２０１７(０６):８３－８５.[１３]田野ꎬ练秋生ꎬ徐鹤.基于稀疏信号重构的ＤＯＡ和极化角度估计算法[Ｊ].电子学报ꎬ２０１６ꎬ４４(０７):１５４８－１５５４.[１４]梁瑞宁ꎬ赵力ꎬ魏昕ꎬ等.语音信号处理[Ｍ].北京:机械工业出版社ꎬ２０１６:６５－６６.[１５]王文杰.麦克风阵列语音增强技术研究[Ｄ].河北工业大学ꎬ２０１０.[１６]徐宇卓ꎬ马建芬ꎬ张雪英.基于语音起始段检测语音可懂度客观评价方法[Ｊ].电子技术应用ꎬ２０１５ꎬ４１(０６):１５０－１５３.[１７]郑家超.宽带波束形成麦克风阵列语音增强方法的研究[Ｄ].辽宁工业大学ꎬ２０１１.作者简介:㊀㊀王义圆(１９９３－)ꎬ女ꎬ硕士研究生ꎬ主要研究领域为雷达系统及信号处理ꎻ张曦文(１９９３－)ꎬ女ꎬ硕士研究生ꎬ主要研究领域为非合作目标无线定位ꎻ周贻能(１９９１－)ꎬ男ꎬ硕士研究生ꎬ主要研究领域为连续波雷达多目标信号处理ꎻ黄际彦(１９８１－)ꎬ男ꎬ硕士研究生导师ꎬ主要研究领域为阵列信号处理ꎮ责任编辑:徐弘涛收稿日期:２０１８－０１－２５。

基于语音传感器网络的语音增强的研究

基于语音传感器网络的语音增强的研究作者：刘力来源：《中小企业管理与科技·上中下旬刊》 2015年第10期刘力东北电力大学理学院吉林吉林132000摘要：对于传统单个麦克风阵列，一般来讲声源离麦克风阵列很远，造成采集到的信号信噪比很低，同时对整个空间的采样也是局部的。

进一步来讲由于一些便携设备如手机、平板电脑等设备物理尺寸大小有限，所以对单个麦克风阵列来讲，不可能安置很多麦克风来提高算法性能。

随着无线网络和嵌入式技术的发展，出现了无线语音传感器网络。

无线语音传感器网络是由一些单独的阵列节点，通过无线通信，任意组网而成。

由于使用无线通信技术，单个麦克风阵列大小的限制也就消失了。

位置没有意义，麦克风配置更加宽松。

因此能够对很大的区域进行观测和采样。

增加了更多的空间信息。

关键词：无线语音传感器网络；语音增强；无线1 语音传感器网络的研究现状基于语音传感器网络信号处理最早可以追溯到2001 年，Aarabi采用语音传感器网络基于时延进行了声源定位。

荷兰代尔夫特理工大学Richard C. Hendriks 教授在分布式麦克风阵列下，对语音可懂度的提高展开研究。

德国埃朗根国际语音研究实验中心的EmanuelA. P.Habets 教授使用相对早期语音传递函数在多个麦克风阵列存在的情况下，进行语音去噪展开研究。

国内的各大高校及科研院所也开展了相关的研究工作，并取得了一定的进展。

2 无线传感器网络的研究挑战无线传感器网络是一种分布式传感网络，它广泛应用于军事、智能交通、环境监控、医疗卫生等多个领域，涉及很多核心技术。

我们针对数据融合和数据管理技术在语音方面展开研究。

但是这里涉及很多研究问题，如麦克风阵列的时间起点不一样，涉及同步的问题。

阵列的方向矢量估计可能存在误差，因此有校正的问题。

麦克风本身电子电路，由于电子电路随着时间的使用，电子电路放大的倍数都不一样，产生不同的增益。

因此，需要考虑麦克风的配准问题。

面向语音识别的自适应麦克风阵列技术研究

面向语音识别的自适应麦克风阵列技术研究自适应麦克风阵列技术是一种用于语音信号处理的技术，它通过调整麦克风阵列的方向和信号增益，来削减来自非目标方向的噪声，在复杂噪声环境下提高语音信号的识别准确率。

目前，自适应麦克风阵列技术已经广泛应用于语音识别、智能手机等领域。

本文旨在介绍面向语音识别的自适应麦克风阵列技术的研究进展和未来发展趋势。

一、麦克风阵列技术原理麦克风阵列技术是基于声学特性的研究，通过麦克风阵列对声场进行采集，从而获取到目标信号和干扰噪声。

麦克风阵列是由多个麦克风组成的，按照一定的几何形状排列。

根据波束形成原理，当目标声源和干扰声源位于不同方向时，各个麦克风的相位和幅度不同，通过对各个麦克风的信号进行加权和相位调整，可以使目标声源的信号增强，干扰噪声信号减弱，从而提高声音的清晰度和辨识度。

在麦克风阵列技术中，主要有两种波束形成算法：波束形成和自适应波束形成。

波束形成算法是一种基于固定权系数矩阵的波束形成方法，它把各个麦克风信号进行加权平均，形成一个固定的波束方向。

这种方法简单可行，但缺点也比较明显，由于固定的权系数不适用于噪声情况的变化，因此会使得目标信号的增益被过多压缩，同时不能对噪声进行有效消除。

自适应波束形成算法是目前应用较多的一种波束形成方法，它可以根据实时的声学环境来自动地调整阵列麦克风的权值，从而使目标信号被增强，噪声被抑制。

自适应波束形成算法的核心是根据算法目标和误差方差，通过自适应的控制算法，不断调整权值。

二、自适应麦克风阵列技术在语音识别中的应用自适应麦克风阵列技术在语音识别领域具有重要作用。

语音识别系统的核心是对声音的模式识别，然而在复杂的环境中，各种噪声会干扰到语音信号的识别，因此精度就会受到极大的影响。

通过应用自适应麦克风阵列技术，能够有效地削减来自非目标方向的噪声，提高了语音信号的识别准确率和鲁棒性。

一个经典的示例是语音助手，比如苹果公司的Siri和亚马逊的Alexa，它们需要在嘈杂的环境下准确地识别用户语音指令，因此需要有效的阵列处理技术。

麦克风阵列信号处理技术研究

麦克风阵列信号处理技术研究麦克风是我们日常生活中经常接触到的设备之一，它们在电视、手机、电脑等产品中都有广泛的应用。

随着科技的不断发展，麦克风也在不断的升级和改进。

在这些改进中，麦克风阵列信号处理技术成为了研究的热点之一。

麦克风阵列信号处理技术，是指利用多个麦克风组成一个阵列，通过信号处理算法来分析获取到的声音信号，从而实现降噪、增强语音信号、改善声音方向等效果的技术。

这一技术被广泛应用在会议系统、声源定位、语音识别等领域。

麦克风阵列信号处理技术的优势在于，相比于单个麦克风，它可以获取到更多的声音信息。

同时，多个麦克风的信号可以通过信号处理算法进行协同处理，实现对语音信号的识别和提取。

此外，麦克风阵列技术还可以改善环境噪声，提高语音信号的清晰度。

对于麦克风阵列信号处理技术的研究，主要有以下几方面：一、阵列构建阵列构建是麦克风阵列信号处理技术的基础。

麦克风阵列的构建形式通常有线性、圆形、矩形等。

在构建阵列时，需要考虑麦克风数量、布局、间距以及方向等因素。

此外，不同的阵列构建形式会影响麦克风信号的唯象，因此需要在实验室环境下进行实验，找出最优的构建形式。

二、麦克风信号处理算法麦克风阵列信号处理技术的优秀在于信号处理算法。

不同的算法对信号处理的效果也不同。

在信号处理算法中，常用的有波束形成算法、最小方差无失真响应算法以及最大信噪比算法等。

其中，波束形成算法是阵列信号处理中最基础的处理算法，也是目前最热门的处理方式之一。

通过波束形成，可以实现从多个麦克风中提取出目标信号，使得语音信号更加清晰。

三、降噪和声源定位降噪和声源定位是麦克风阵列信号处理技术中最为关键的部分。

降噪的目标是把环境噪声从语音信号中去除，从而提高语音信号的信噪比。

最常用的环境噪声消除算法是最小均方误差法，目前市场上的很多语音识别设备都采用了这一技术。

声源定位是指通过麦克风阵列获取信号，在不需要人工操作的条件下，自动确定声源的位置。

声源定位需要进行时间延迟估计、数据融合、模型匹配等处理步骤。

二维麦克风阵列语音增强算法研究的开题报告

二维麦克风阵列语音增强算法研究的开题报告一、选题背景随着语音应用的广泛应用，语音增强技术的需求越来越大。

但是传统的单麦克风采集模式容易受到环境噪声的干扰和声源方向的限制，其在实际应用中的可靠性和效果存在局限性。

因此，基于麦克风阵列的语音增强技术成为了当前研究的热点方向之一。

二、选题意义二维麦克风阵列 (2D microphone array) 能够通过收集多个麦克风的信号来获得更准确的语音信息，具有很大的潜力。

然而，如何有效地利用麦克风阵列的信号，去除环境噪声和信号混叠等问题，仍然是当前的研究热点和难点。

因此，本文旨在研究二维麦克风阵列语音增强算法，探索如何更有效地利用多通道信号进行语音增强，提高语音信号的质量和可靠性。

三、研究内容本文研究的主要内容包括以下方面：1.二维麦克风阵列的构建和信号处理技术：介绍二维麦克风阵列的构成、基本原理以及信号处理技术，为后续的声源定位和语音增强打下基础。

2.声源定位算法：基于二维麦克风阵列的多通道信号，设计一种可靠的声源定位算法，确定语音信号的来源方向。

3.语音信号增强算法：基于多通道语音信号，设计一种有效的语音增强算法，去除环境噪声和信号混叠，提高语音信号质量。

4.实验验证：通过实际场景的采集和模拟数据的模拟，对所提出的算法进行验证和评估，验证其在不同情况下的可行性和有效性。

四、研究方法本文将采用以下研究方法：1.文献综述法：对二维麦克风阵列语音增强技术的发展历程、现状和研究方向进行全面分析，梳理出当前的研究热点和难点，并为后续研究提供参考。

2.实验法：通过实际场景的采集和模拟数据的模拟，对所提出的算法进行验证和评估，验证其在不同情况下的可行性和有效性。

3.算法设计法：根据二维麦克风阵列的信号处理技术，设计声源定位算法和语音增强算法，应用于语音增强任务。

五、预期成果本文的预期成果包括：1.设计并实现一种基于二维麦克风阵列的语音增强算法，能够去除环境噪声和信号混叠，提高语音信号质量。

基于近场波束形成的麦克风阵列语音增强方法

本文的具体结构安排如下：在所选声学模型的基础上，给出基于近场波束形成的麦克风阵列语音增强方法的整体框图；接着从理论上对该方法进行推导；然后给出在仿真环境下，该方法语音增强的效果及与其他方法的噪声性能比较；最后给出结论。
68
电子与信息学报
第 29 卷
2 位于阵列近场的声波传播模型
如图 1 所示，设 r 为声源与参考麦克风的距离，θ 与 ϕ 分
摘要: 当麦克风阵列用于封闭环境中非手持式语音拾取时，必须面对的一个问题是声场为阵列近场的问题。该
文在子带自适应波束形成方法的基础上，引进了一种基于近场波束形成的麦克风阵列语音增强方法。该方法充分
利用了近场球面波的波前弯曲率，有效地衰减了混响和噪声对期望信号的影响。仿真实验结果表明，在小房间混
响条件下，基于近场波束形成的麦克风阵列语音增强方法取得了较好的噪声抑制效果。
平面内， xw = (rw, θw ) 为声源位置， xi = (ri, θi ) 为麦克风位
置， riw 为声源与第 i 只麦克风之间的距离，即
riw = rw2 + ri2 − 2rwri cos(θi − θw )
(5)
这是信号的空间表示形式。考虑到语音信号是宽带信号，则
阵列信号的延迟矢量为
αt (rw, ω) = αt = ⎡⎢⎣1, ", e−jk(L−1)cT ⎤⎥⎦H
1 r2
∂ ∂r
⎛⎜⎜⎜⎝r 2
∂s ∂r
⎞⎠⎟⎟⎟
=
1 c2
∂2s ∂t 2
(2)
于是，得到波动方程的解为
s(r, ω,t) = A exp{j(ωt − kr)}
(3)
r
式中 k = ω c 为声波波数，其中 ω 为声波角频率。当 r → ∞

基于麦克风阵列的语音增强研究

Ｏ引言
语音增强是指当语音信号被各种各样的噪声干扰，甚至淹没后，从噪声背景中提取有用的语音信号，抑制、降低噪声干扰的技术 …。在各种电子设备高度智能化的今天，语音增强与声源定位技术成为语音通
奏的残余噪声；统计方法需要大量的数据进行训练
ｈａｔａ —ｑａｅ（ＭＳｄｐｖｐｅｈｅｈｎｅｎｇｒｈ－ｎｒｏｅａｍｅｄｕｉｎｍｃｔｌｕｓｖｒｔｅｌｓｍｅｎｓｕｒＬ）ａａｔｅｓｅｃｎａｃｍｅｔｌｏｉｍｓａｄｐｐｓｔｏｓｇａｍｉｉｎｒｌｄｒｃｒｉｅａｅ－ｅ — ｉａｔｏｈｎａｏｏｅｅｖａｉｇＭＣＡ）ｏｅｔｔｅｎｉｌｓｎｔｅｄｆｃｆｅｂｏｋｎｔｘＴｉｍｅｏｐｌｅｍｆｒｎ．ｎｓｇｇｎ【Ｒｔｓｍａｔｏｓｉａｕｉｔｅｔｏｌｃｉｇｍｒ．ｈｓｔｄｉａｐｉｔｂａｏｍｉｇａｄｕｉｉｅｈｅｎｌｏｏｈｅｓｔｈａｉｈｓｄｅｏ的阈小
值获取困难，运算量大。实际应用中常常根据具体的环境噪声和语音特性将不同方法结合起来应用，中文采用非参数方法、适应噪声抵消法，自同时在噪声估
信领域中两种不可缺少的技术。在视频会议、智能机
Ｍａａｏｗａｉｌｔ．ｉｌｔｏｅｕｔｈｗａ。Ｓ— ＣＲＡｄｐｖａｏｕｔｓｅｃｎｎｃｍｅｔｎｂｓｆｒｔｓｍｕａＳｍｕａｎｒｓｌｓｏｔｔＬＭｔｅｏｅｉｓｈＭａａｔｅｈｓｒｂｓｐｅｈｅｈａｅｎ．ｉＫｅｒｓｍｉｒｐｏｅａｒｙ；ｐｅｈｅｈａｃｍｅｔａａｔｅｌａｔｍｅｎｓｕｒｇｒｔｍ；ｙｗｏｄ：ｃｏｈｎｒａｓｅｃｎｎｅｎ；ｄｐｉｅｓａｑａｅａｏｉｈＭＣＲＡｖｌ

基于麦克风阵列的语音增强方法

基于麦克风阵列的语音增强方法概述：在日常生活和工作中，语音通信是人与人之间互相传递信息沟通不可缺少的方式。

在语音通信中，语音信号不可避免地会受到来自周围环境和传输媒介的外部噪声、通信设备的内部噪声及其他讲话者的干扰。

这些干扰共同作用，最终使听者获得的是被噪声污染过的带噪声语音，严重影响了双方之间的交流。

应用阵列信号处理技术的麦克风阵列能够充分利用语音信号的空时信息，具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点，逐渐成为强噪声环境中语音增强的研究热点。

本文将介绍各种麦克风阵列语音增强方法，并总结各个方法的优劣。

最终得出更好的、能够去噪的基于麦克风阵列的语音增强方法。

1麦克风阵列麦克风阵列是将两个麦克风的信号耦合为一个信号。

在频率响应中也可以根据时域中波束形成与空间滤波器相仿的应用，分析出接收到语音信号音源的方向以及其变化。

采用该技术，能利用两个麦克风接收到声波的相位之间的差异对声波进行过滤，能最大限度将环境背景声音滤掉，只剩下需要的声波。

对于在嘈杂的环境下使用采用了这种配置的设备，在嘈杂的环境下能使听者听起来很清晰，没杂音。

2基于麦克风阵列的语音增强方法2.1基于自适应波束形成器的麦克风阵列语音增强自适应波束形成是现在广泛使用的一类麦克风阵列语音增强方法。

最早出现的自适应波束形成算法，其基本思想是在某方向有用信号的增益一定的前提下，使阵列输出信号的功率最小。

在线性约束最小方差自适应波束形成器的基础上，1982 年Griffiths 和Jim 提出了广义旁瓣消除器成为了许多算法的基本框架。

广义旁瓣消除器（GSC）的工作原理是带噪声的语音信号同时通过自适应通道和非自适应通道，自适应通道中的阻塞矩阵将有用信号滤除后产生仅包含多通道噪声参考信号，自适应滤波器根据这个参考信号得到噪声估计，最后由这个被估计的噪声抵消非自适应通道中的噪声分量，从而得到有用的纯净语音信号。

麦克风阵列的自适应算法通过迭代运算获取波束形成的最优权矢量时，噪声模型的估计是一个非常关键的因素。

基于RLS的自适应阵列抗交叉串扰语音增强研究

目的在于从含噪语音中提取尽可能纯净的原始语
音。自２世纪７年代以来，语音增强一直是人们研００
究的热点；然而，由于噪声来源众多，特性各异，
很难开发一种适用于各种噪声环境下的语音增强算法。总结国内外的研究成果，容易发现自适应噪声抵消法（ａｔｅＮｏｓａｃｌｔｎＡｄｐｉｉＣｎｅａｉ，简称ＡＮＣｖｅｌｏ１
（）＝
（一）（１／（一１，１＋一）（）ｚ）ｚ￡
至经常发散。献【】讨了基于麦克风阵列两级滤文５探
波处理系统。本文将自适应ＲＳ型一梯算法引入Ｌ格阶麦克风阵列滤波系统中，以提高算法收敛性能性能，并采用了麦克风之间抗交叉串扰方法，去除噪声的同时减少语音信号的损伤。
Ｅ（＝Ｅ（１ｌ（ｆ１）ｇｍ－＋ｌ）（）Ｉ）ｅ／一
（＝（１Ｊ（｝，１，：ｚ），／ｚ）２），＋ｚ（一）一
（＝（）Ｆ１，一／ｚ）４（一）
ｋ（）（）Ｅｆ，，＝一２ｎ／ｍ（）ｚ
（）０＝＞００＝Ｅｂ）（，￡（）０＝０，
・阶数初始化
（），０＝０
（）０＝０
（）０＝Ｘ（）０＝，＝ｂ）ｆｚ，（）（）（，（ —１＝１）
・格型部分：ｍ＝，，１Ｏ１ …，

随机麦克风阵列校正及语音增强研究

专业学位类别
工程硕士
电子与通信工程 2015.4.20
论文答辩日期
2015.6.1 2015 年 6 月 27 日
学位授予单位和日期答辩委员会主席评阅人
电子科技大学
注 1：注明《国际十进分类法 UDC》的类号。
ARBITRARY MICROPHONE ARRAY CALIBRATION AND SPEECH ENHANCEMENT
II
ABSTRACT
Finally, as the main emphasis, the basic algorithm about speech enhancement are studied in detail with their advantages and disadvantages. The thesis mainly studied the adaptive beamforming algorithm, time delay estimation method and the performance of different time delay estimation. Analysing the Generalized Sidelobe Canceller (GSC) beamforming algorithm and its performance on eliminate noises. Then based on the theory before, the thesis proposes a new GSC algorithm combined band decompose and rear filter algorithm. The algorithm is suitable for the coherent and incoherent noise field at the same time, extends the scope of application, improves the Signal-to-Noise Ratio (SNR), and reduces the amount of calculation. Also analyzing a blind beamforming algorithm which based on higher order accumulation. Compared with the traditional beamforming, the algorithm has a higher output SNR under the condition of array error. Keywords: microphone array, self-calibration, speech enhancement, adaptive beamforming, blind beamforming

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。