麦克风阵列语音增强的研究(1)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
!"
!!!!" ・ 博士论坛 ・ !"
!!!!"
关键词
麦克风阵列语音增强的研究
" % % 何成林 ", 杜利民 " 马 昕 ", ( 中国科学院声学研究所语音交互研究中心, 北京 "@@@A@) % ( 中国科学院研究生院, 北京 "@@@BC)
摘 要 文章介绍了各种基本的麦克风阵列语音增强算法,对其消噪性能进行了系统地分析,并以实测数据进行了测 试。并介绍了基于稳健波束形成器、 近场超定向波束形成器、 广义奇异值分解和传输函数广义旁瓣相消器等结构的麦克 风阵列语音增强的基本原理, 总结了各种算法的特点及其所适用的声学环境特性。 语音增强 麦克风阵列 阵列信号处理 文献标识码 ) 中图分类号 E5C"%FB
(#$
"
*+) , (#" *) )* *") , *( )&") (#" $
!) (
!
)&%
!)-!" ( !) ’!" !" (
*&% *&)-" *&% $
!)’!"( !) ( )&") *(
*&)-$
# "( ( (" -( ) $( ( "#".’")( !) () "’ " ) !) )&") ( ( 对于相干噪声场,假定在阵列的远场处仅有一个噪声源, 其空间相干函数为: ")* ( !) )0CD( #*A?4( &) 3)* E4) ( B) & 为噪声源的波达方向, 4为 其中 3)* 为麦克风之间的距离, 声速。 将( 代入( 中, 理论上噪声得到全部消除。 对于非相干 B) !) !) )%, !) ’", 噪声场, 其空间相干函数 %)* ( 得到 !"#$% ( 噪声基 本上没有得到消除。 由上可知,对于基于 :+@ 结构的麦克风阵列语音增强系 统, 其消噪性能取决于噪声场的相关性: 相关性越强, 消噪性能 越好。
( 7)
其中 $( 是后置维纳滤波器输入的先验信噪比。 由( 式 !) 7) 可知, 噪声的相关性越强, 维纳后滤波的消噪性能越差; 相关性 越弱, 消噪越明显。 结合维纳后滤波的语音增强系统能很好地消除非相干噪 声, 对混响有一定的消除; 并且由于后置滤波器的权系数是实 时更新的, 对时变的声学环境有一定的适应性, 但经过后滤波 之后的语音信号有一定的失真。 $ !""#$!! 计算机工程与应用
!""#) !!%@@@"+@D 文章编号 &""!%’((&%(
!"#"$%&’ () *+&%(,’()" -%%$. /,""&’ 0)’$)&"1")2
8 8 3" 4’")56+)7, 9: ;+1+)7 *$ <+)7, 3G’’9H I;:’2)9:6J’ E’9H;1(1K* 7’,’)29H, I;,:6:-:’ 10 L91-,:69,, ( MH6;’,’ L9)8’.* 10 396’;9’,, N’6O6;K "@@@A@) % P2)8-):’ 39H11( 10 :H’ MH6;’,’ L9)8’.* 10 396’;9’,, N’6O6;K "@@@BC) ( "
%4" 基于延迟 % 相加波束形成器的麦克风阵列语音 增强
)) 延迟%相加波束形成器的原理如图 "( 所示。设目标信号 ! , 波达方向的估计为! ! 通过对各路麦克风接收到的信号加一合 ! 方向同步, 适的时延补偿 "" , 使得各路输出信号在 ! 实现阵列 ! ! 方向的入射信号的获得最大增益。权系数 # 的作用相当 对! ! " 于对阵列的波束模式进行锥化截取。 设麦克风阵列各通道接收到的信号和噪声不相关, 且各通 道接收到的信号和噪声分别具有相同的统计特性,则延迟%相 加波束形成器的噪声消除因子( 516,’ 7’8-9:61; <)9:12, 即输 出、 输入信噪比增益) 为#%$: $%&’ ( #) = " " >( # $( "? " ) #) ( ) ") (
!
基于近场超定向波束形成器的语音增强
$
$.! 基本的麦克风阵列语音增强算法的测试
本文用卡内基 ・ 梅隆大学实测麦克风阵列数据库 6F8对上述 三种算法进行测试,该数据库所用的麦克风阵列由 "B 个麦克 风组成的线性嵌套式阵列, 并有一头戴式近距离麦克风作为参 考。本文选用其中的第 !%"$ 号麦克风组成的线性等间隔子阵 列所录制的数据进行测试,所用数据为其中 <;;7- 组数据, 录 音环境为一嘈杂的实验室, 说话者位于阵列的正前方, 离阵列 中心的距离为 "G,阵元间距为 %.%!G,录音数据的采样率为 "F5H=。 麦克风阵元接收到的信号、 图 7 比较了参考信号、 *+ 波束 形成器的输出、 后置维纳波的 :+@ 的输出的时域 :+@ 的输出、 波形及信噪比( 的比较。由图 7 可知, 由于各麦克风阵元增 >I)
为了进一步消除 *+ 波束器增强之后的语音中的非相干 /0123452 提出了在波束形成器后置维纳滤波的结构678, 如 噪声, 图 "( 所示。 9) 假设各通道接收到的信号和噪声不相关, 且各通道接收到 的噪声具有相同的统计特性, 后置维纳滤波器的噪声消除性能 为6!8: !"01 ( !) ) "&#( !) % & %( $( !) &# !)
"
引言
对于有些语音应用而言, 如视频会议、 车载免提电话等, 由
&3 波束形成器( 增强、 基于自适应波束形成器的语音增强、 或 自适应波束形成器) 结合维纳后滤波的语音增强等, 这几种方 法实现简单, 也是其他麦克风阵列语音增强算法的基础。
于说话者到麦克风有一定的距离, 麦克风接收到的语音信号受 到环境噪声和干扰的影响很大, 严重影响了通话质量, 一般的 基于单麦克风的语音增强系统难以获得较好的增强效果。 麦克 风阵列由于利用了目标信号、 噪声和干扰的空间信息, 基于麦 克风阵列的语音增强系统能提供更好的增强效果。 国外对于麦 克风阵列语音增强的研究已有二十多年的历史, 取得了很多研 而国内类似的研究很少。 本文首先介绍了各种基本的 ቤተ መጻሕፍቲ ባይዱ成果#"$, 麦克风阵列语音增强算法, 对其消噪性能进行了分析, 并以实 测数据进行了测试; 并介绍了基于稳健波束形成器、 近场超定 向波束形成器、 广义奇异值分解和传输函数广义旁瓣相消器等 结构的麦克风阵列语音增强的基本原理, 总结了各种算法特点 及其所适用的声学环境特性。
从以上分析可知, 基于的 *+ 波束形成器的麦克风阵列语 音增强结构, 对非相干噪声的消除能力十分有限, 对相干噪声 基本没有消除能力。此外, *+ 波束形成器对目标 *,- 估计误 差( 或各通道的时延估计误差) 很敏感; 不能在干扰方向置零以 有效地抑制干扰。
$.$ 结合波束形成器和后滤波的麦克风阵列语音 增强
$
基于稳健波束形成器的麦克阵列语音增强
在实际应用中,由于各通道目标信号相对时延的估计误 差、 各麦克风阵元增益的不一致性、 应用环境的混响等, 都会影 响基于 %#& 的麦克风阵列语音增强系统的性能。近年来出现 了许多基于稳健波束形成器的麦克风阵列语音增强算法’(), 大多 也基于 %#& 结构。提高基于 %#& 结构的麦克风阵列语音增强 系统的稳健性, 主要包括两类方法: ( () 对 %#& 非自适应支路中的固定波束形成器加以约束, 以使其在目标 "*+ 估计误差范围内有恒定的增益,而对在此 范围之外的入射信号有很大的衰减; ( 实时对目标信号的 "*+ 进行估计, 或对 %#& 自适应 ,) 支路的阻塞矩阵和自适应部分的系数利用一定的约束, 以减少 系统输出中对目标信号的衰减。 下面以 ’-) 中提出的 &&+./0&+./+1& 结构说明基于稳 健波束形成器的麦克风阵列语音增强的基本原理。该结构框 图如图 ! 所示: 在阻塞矩阵中利用系数约束自适应滤波器
益的不一致性以及实际应用环境的混响, 对阵元数较少的麦克 风阵列, 对于基本的 "# 波束形成器和维纳后滤波技术, 其消 噪性能十分有限。
&2344565378/&2798:;573< +<;=85>3 .5?83:, &&+.)最小化目标信 ( 号的泄漏;为了进一步防止多输入抵消器中对目标信号的消 除, 对其各滤波器的系数进行了范数约束( 02:@/&2798:;573< 。其中的 +1& ( +<;=85>3 .5?83:9 , 0&+. ) +<;=85>3 12<3 &27/ 根据目标信号的有无, 交替控制 &&+. 和 0&+. 的系数 8:2??3:) 的更新: 当只有噪声时, 更新 0&+. 部分的系数; 而存在目标信 号时, 更新 &&+. 部分的系数。
%
基本的麦克风阵列语音增强的方法
基本的麦克风阵列语音增强的方法主要包括基于延迟%相
加波束形成器( 的语音 &’()*+,-. /’).012.’2, &3 波束形成器)
基金项目: 国家 CTB 重点基础研究发展规划项目( 编号: P"CCA@B@D@D)
作者简介: 何成林( "CTT?) , 男, 博士生, 主要研究方向: 数字语音信号处理。杜利民( "CDT?) , 男, 教授, 研究员, 博士生导师。主要研究方向: 信号处 "CUC?) 理与语音交互技术。马昕( , 男, 博士生, 主要研究方向: 语音识别。
=>#2%$&2:31.’ /),69 )(K126:H., 012 .6921GH1;’ )22)* ,G’’9H ’;H);9’.’;: )2’ 6;:218-9’8 6; :H6, G)G’2, );8 :H’62 ;16,’ 2’8-9:61; G21G’2:* 6, );)(*Q’8 );8 :’,:’8 R6:H 2’918’8 8):)4EH’ .’9H);6,., 10 ,1.’ 1:H’2 )(K126:H., 012 .6921GH1;’ )22)* ,G’’9H ’;H);9’.’;: /),’8 1; 21/-,: /’).012.’2, ;’)2 ?06’(8 ,-G’2862’9:6J6:* /’).012.’2, P’;’2)(6Q’8 36;K-()2 S)(-’ &’91.G1,6:61; );8 E2);,012. <-;9:61; P’;’2)(6Q’8 368’(1/’ M);9’((’2 )2’ )(,1 G2’,’;:’84EH’ G21G’2:6’, 10 :H’,’ )(K126:H., );8 :H’ )GG21G26):’ )91-,:69 ’;J621;.’;:, 012 -,6;K :H’. )2’ )(,1 );)(*Q’84 ?".@(%A#:,G’’9H ’;H);9’.’;:, .6921GH1;’ )22)*, )22)* ,6K;)( G219’,,6;K
计算机工程与应用 !""#$!! "
$.7 基于自适应波束形成器的麦克风阵列语音增强
自适应波束形成器各个通道的权系数能随输入信号的统 计特性自适应调整, 基于自适应波束形成器的麦克风阵列语音 增强有多种具体的实现形式,其中基于广义旁瓣相消器 :030;<12=0> +2>01?90 @<3A0110;, :+@) ( 或其类似结构由于结构 简单、 易于实现, 获得了广泛应用。 基于 :+@ 的麦克风阵列语音增强的基本结构如图 $ 所 示, 由非自适应支路和自适应支路组成。上面的非自适应支路 为一固定波束形成器,下面自适应支路中阻塞矩阵 ! 的作用 相当于一空间陷波器: 阻塞从阵列指向方向上来的信号, 而通 过从其他方向上的入射信号。 通过调节自适应部分的系数 "2, !) 实现系统的噪声输出功率最小。其噪声的消除性能如式( 所示6B8。
! ! ! ! 其中# "( !) 为噪声场的复相干函数的均值: # "( !) ) $ ( !) ( $) !!".’")* ( $ ( #( ))% *&)-" 其中 ")* ( 为通道 ) 和通道 * 之间的噪声的复相干函数。 !)
(#$ (#"
" )* ( !) $%) !" /$ ( !) $(; 当噪声的相关性很弱时( , 对强相干 , 基本没有消噪能力。 噪声源( ")* ( !) $") !"/$ ( !) $", !"#$% ( !) & "’ " (’"
相关文档
最新文档