mic阵列初始

合集下载

回声消除典型应用方案

回声消除典型应用方案

回声消除降噪芯片典型应用方案引言手机用户数量的空前增长,以及使用场合的复杂性,使得环境噪声抑制技术已经成为移动通讯的迫切需求。

环境噪声通常包含点噪声和弥散噪声两部分或两者的中和。

点噪声距离使用者较近,其幅度和频率的变化较快;弥散噪声则距离使用者较远,而且幅度和频率变化缓慢,如背景噪声。

弥散噪声用一个麦克风的技术就可以抑制,而点噪声由于其变化快,需要快速捕捉和抑制,通常需要用两个麦克风阵列进行快速定位,形成空间滤波器快速收敛,并进行噪声抑制(见图1)。

本文将以MTK平台为例,介绍FM2018-380在抗噪声手机中的设计要点。

如其他型号设计有疑问可联系扣247547622,共同探讨相关技术,解决相关问题,提高设计效率。

图1手持模式的抗噪声空间滤波器极性示意图及直观图SAM技术设计要点和一个麦克风的手持应用不一样,阵列麦克风需要考虑两个麦克风之间的灵敏度差异和摆放位置(见图2)。

两个麦克风之间的距离大于60mm。

对于近场信号,主麦克风(靠近使用者嘴)拾取的近场语音信号比参考麦克风(靠近使用者耳)大6dB以上,对于远场信号(超过0.5m的噪声),主麦克风和参考麦克风拾取的信号基本一致。

根据阵列麦克风之间的差异,通过芯片处理,区别对待近场和远场信号,保留近场有用信号,对远场所有方向的噪声进行抑制。

图2直板手机麦克风的摆放位置结构设计使两个麦克风的开孔大小一致,保证麦克风腔体的气密性,若有免提通话功能,还需要更多考虑喇叭、麦克风减振等问题。

图3FM2018-380在手机的典型应用原理图抗噪声手机的设计以MTK的手机平台(MT6225、MT6318、MT6319)为例(见图3),主麦克风(MIC0)和参考麦克风(MIC1)分别需要单独的偏置电路,使用差分信号输入到芯片,麦克风偏置电路需要增加小电容以滤除射频干扰。

阵列麦克风信号经FM2018-380处理后,经线路输出(LINE_OUT),采用假差分电路送到MT6225的麦克风输入端(MICP0,MICN0),假差分电路可以减少射频干扰和本地噪声。

声源定位matlab程序

声源定位matlab程序

声源定位matlab程序在MATLAB中进行声源定位的程序通常涉及到信号处理和声学定位技术。

声源定位的目标是确定声音的方向,通常使用麦克风阵列来实现。

以下是一个简单的MATLAB程序示例,用于声源定位:matlab.% 定义麦克风阵列参数。

numMics = 4; % 麦克风数量。

micSpacing = 0.1; % 麦克风间距(以米为单位)。

% 模拟接收到的声音信号。

fs = 44100; % 采样率。

t = (0:1/fs:1-1/fs)'; % 时间向量。

f1 = 1000; % 第一个声源的频率。

f2 = 2000; % 第二个声源的频率。

signal1 = sin(2pif1t); % 第一个声源的信号。

signal2 = sin(2pif2t); % 第二个声源的信号。

% 模拟麦克风接收到的声音。

micSignals = zeros(length(t), numMics);for i = 1:numMics.distance = (i-1) micSpacing; % 麦克风到声源的距离。

delay = distance/340; % 延迟(声音传播速度为340m/s)。

micSignals(:,i) = [zeros(round(delayfs),1);signal1(1:end-round(delayfs))] + [zeros(round(delayfs),1); signal2(1:end-round(delayfs))];end.% 声源定位。

[azimuth,elevation] =locateSource(micSignals,fs,micSpacing);% 显示结果。

disp(['声源方位角: ', num2str(azimuth), '°']);disp(['声源俯仰角: ', num2str(elevation), '°']);需要注意的是,以上代码中的`locateSource`函数是一个虚构的函数,实际上需要根据具体的声源定位算法来实现。

阵列麦克风技术在手机上的应用

阵列麦克风技术在手机上的应用
NTT-DoCoMo Raku Raku Series Chang-Hong K219
Samsung W690/ W910
Lenovo P619/ P636/ P50
Lenovo ET600
Fortemedia Confidential
7
富迪科技语音萃取技术
Fortemedia VETM Voice Extraction Technology
voice + noise
voice + noise
Music noise
Pink 1 noise
Pink 2 noise
Babble noise
School noise
Fortemedia Confidential
15
SAM
TM VE 性能总结
应用两个普通全向麦克风,可以做到精确识别噪音并做准确消噪 手持使用时可在人嘴周围形成拾音球,球内声音加强,拾音球外所有 声音都被当作噪音压制 无论稳态,非稳态任何难处理噪音都可压制30db左右 超强消回音能力,适用于手机,对讲机等手持设备消噪和全双工免提 设计 在强环境噪音条件下提高语音识别率
VCPD (2pins)
在远端手机的录音,清楚体现聆听者的实际感受 SAM VE 开 启
Music noise
Pink 1 noise
Pink 2 noise
Babble noise
School noise
噪 声 压 制 关 闭
voice only
voice + noise
voice + noise
voice + noise
VoIP
VoIP speakerphones

02-华为视频会议终端配置

02-华为视频会议终端配置

在IP界面中选择 “H.323”选项, 设置注册GK的相 关参数,主要是: 启用GK、GK注册 方式选择“手动”, 填写GK地址、会 场号码和GK认证 密码
TE系列终端操作指南
返回高级界面,选 择“诊断”
TE系列终端操作指南
进入诊断界面,选 择“状态”
TE系列终端操作指南
在状态界面中的线路 状态,可查看网口连 接状况、IP地址、 GK注册信息等
TE系列终端操作指南
进入会议参数,选 择“应答方式”, 默认为“手动接 听”,修改为“自 动接听”
TE系列终端操作指南
返回设置界面,选 择“网络”
TE系列终端操作指南
进入网络界面,选 择“IP”
TE系列终端操作指南
进入IP界面,选择 “本地IP”选项, 设置:本地IP地址、 网关和子网掩码
TE系列终端操作指南
TE系列终端操作指南
在按问号键之后, 选择帮助文档,可 进入帮助界面
TE系列终端操作指南
在帮助界面中,可 查看设备的相关操 作指南
TE系列终端操作指南
TE系列终端操作指南
终端开机或通过遥控 器 呼叫键进入如下 界面。
1、会议日程:包含定义的常用会 议、已经召开和预约的会议 2、呼叫:呼叫地址本中的记录, 可以通过编辑框搜索Ldap、网络 地址本的记录; 3、会议记录:包括会议记录和呼 叫记录,点击可以发起呼叫或是 召集会议; 4、状态图标:显示当前网络、本 地音频输入输出的状态; 5、系统时间:显示当前系统时间 6、终端IP地址:显示当前终端的 IP地址,如果启用了WIFI则会显 示两个IP地址
TE系列终端操作指南
返回状态界面,进 入“网络测试”, 测试网络连通情况
TE系列终端操作指南

基因芯片的基本原理

基因芯片的基本原理

基因芯片的基本原理
基因芯片(Gene Chip,DNA Chip),又称DNA微阵列(DNA Micorarray),是指按照预定位置固定在固相载体上很小面积内的千万个核酸分子所组成的微点阵阵列。

在一定条件下,载体上的核酸分子可以与来自样品的序列互补的核酸片段杂交。

如果把样品中的核酸片段进行标记,在专用的芯片阅读仪上就可以检测到杂交信号。

基因芯片技术主要包括四个主要步骤:芯片制备、样品制备、杂交反应和信号检测和结果分析。

1、芯片制备-目前制备芯片主要以玻璃片或硅片为载体,采用原位合成和微矩阵的方法将寡核苷酸片段或cDNA作为探针按顺序排列在载体上。

芯片的制备除了用到微加工工艺外,还需要使用机器人技术。

以便能快速、准确地将探针放置到芯片上的指定位置。

2、样品制备-生物样品往往是复杂的生物分子混合体,除少数特殊样品外,一般不能直接与芯片反应,有时样品的量很小。

所以,必须将样品进行提取、扩增,获取其中的蛋白质或DNA、RNA,然后用荧光标记,以提高检测的灵敏度和使用者的安全性。

3、杂交反应-杂交反应是荧光标记的样品与芯片上的探针进行的反应产生一系列信息的过程。

选择合适的反应条件能使生物分子间反应处于最佳状况中,减少生物分子之间的错配率。

4、信号检测和结果分析-杂交反应后的芯片上各个反应点的荧光位置、荧光强弱经过芯片扫描仪和相关软件可以分析图像,将荧光转换成数据,即可以获得有关生物信息。

目前,基因芯片主要由寡核苷酸芯片和cDNA芯片两大类组成。

英特尔AC97前置音频接口(图解)

英特尔AC97前置音频接口(图解)

英特尔在AC97音频标准之后,又推出了HD(高保真)音频标准。

微软的新操作系统vista推出UAA音频。

这些音频标准对机箱的前置音频面板和接口都有各自的规定。

主板的前置音频连接座也有变化。

本文就AC97和HD的前置音频/麦克的接线方式作详细说明,供各位参考。

一、英特尔AC97前置音频接口的规范要点英特尔在《Front Panel I/O Connectivity Design Guide》中规范了主板和机箱的前置音频接口插座、连接线、针脚名称。

要点如下:1、音频连接器连接器设计应当支持使用标准的前面板麦克和耳机。

要能够直接的使用音频而不需要特别的软件。

前面板音频连接器设计要支持立体声音频输出(耳机或有源音箱)以及麦克输入(一个单声道)。

麦克输入(一个单声道)连接到安装在前面板上的3.5毫米微型插座。

插座的芯端接麦克输入信号,外环端接麦克音频偏置信号。

2、电气连接两个前面板音频输出(AUD_FPOUT_L 和 AUD_FPOUT_R)和两个前面板音频返回(AUD_RET_L 和 AUD_RET_R)连接到一个安装在前面板上的开关型的3.5毫米微型插座。

音频信号传送路径是:当前面板插座没有使用时,主板输出的音频信号由AUD_FPOUT_L和AUD_FPOUT_R送给前面板插座。

经过前面板插座再由AUD_FPOUT_L和 AUD_FPOUT_R返回主板的后置音频插座。

当前置音频插座插入耳机时,插座里连接(AUD_FPOUT_L和AUD_RET_L,AUD_FPOUT_R和AUD_RET_R)的开关断开,返回主板的音频信号就断开,后置插座无音频信号,只有前置的有无音频信号。

如下图:注:音频输出仅能使用耳机或有源音箱,如果使用无源音箱,声音很小。

3、主板连接座设计主板前置音频连接座,如下图:连接座的针脚分配:针信号名说明1 AUD_MIC_IN 前置麦克输入。

2 AUD_GND 供模拟音频电路使用的接地。

AI智能语音麦克风矩阵电路检测方法

AI智能语音麦克风矩阵电路检测方法下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。

文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!下面是小编为大家整理的AI智能语音麦克风矩阵电路检测方法(全文完整),供大家参考。

AI 智能语音麦克风矩阵电路的检测方法1.麦克风通道顺序测试对着MIC 收音孔,任意MIC 开始,逆时针依次对收音孔轻轻敲击,查看录音音频,正确的示例音频如图:此项只针对4 麦及以上麦克风阵列,2 麦克风阵列无顺序要求。

2.麦克风通道幅度一致性DUT 按照实际使用场景放置,外部声源(如有源扬声器系统)放置在距离DUT 拾音孔0.5m 处. 外部声源播放76dBC_sweep.wav,控制DUT 进行录音c) 使用Audacity 打开DUT 录制的raw 音频,查看多路麦克风录制信号多路麦克风信号包络形状基本一致,选取幅值相差较大的单频段(需是单频,打开频谱容易看出),“分析”——“对照”,若差值的绝对值≤3dB,则该频率的麦克风一致性满足要求。

以此类推,查看所有频点。

如果发现某一设备的MIC 一致性较差,可从调节MIC 的密封件的松紧或是否压紧来排查问题;若密封良好,但一致性仍无改善,则需要从元器件的差异性、焊接等因素来判断问题。

3.麦克风通道信噪比全/ 半消声室内,人工嘴100~8000Hz 频响校准,随后人工嘴播放100~8000Hz EQ 白噪声,调节MIC 处达到63dBC,设备录音10s,然后外部声源不播放,设备空录10s。

最后分析麦克风SNR,要求:200~1000Hz SNR≥20dB;1000Hz 以上SNR≥25dB。

4.麦克风通道同步性麦克风通道必须保证同步,可以用1kHz 单频电信号进行测试,比较容易看出相位差,如图: 注:电路板级同步性验证通过电信号输入的方式,该测试方案只针对模拟麦克风,数字麦克风、整机带结构的同步性验证在消声室内完成。

ReSpeaker Mic Array v2.0 远场语音识别微阵列产品说明书

(Omnidirectional) • Acoustic Overload Point: 120 dBSPL • SNR: 63 dB • Power Supply: 5V DC from Micro USB
or Expansion Header • Dimensions: 70mm (Diameter) • 3.5mm Audio Jack Output Socket
The ReSpeaker Mic Array v2.0 supports USB Audio Class 1.0 (UAC 1.0) directly. All major Operating System, including Windows, macOS, and Linux are compatible with UAC 1.0, allowing the mic array to function as a sound card without the ReSpeaker Core, while also retaining voice algorithms, such as DoA, BF, and AEC on those systems.
Copyright © 2008-2018 Seeed Development Limited All rights reserved
2
Hardware Overview
ReSpeaker Mic Array v2.0
Copyright © 2008-2018 Seeed Development Limited All rights reserved
• Voice Activity Detection • Direction of Arrival • Beamforming • Noise Suppression • De-reverberation • Acoustic Echo Cancellation

FM1188

fm1188是富迪的山姆的最新成员(小型阵列麦克风)技术的SoC(片上系统)它提供了对平稳噪声和非平稳噪声具有较好的语音质量改进的噪声抑和优越的全双工功能。

两个麦克风只有10mm分开,山姆技术超越传统的阵列麦克风,之间的麦克风距离,需要显着的利用。

由于不同的位置信息。

传统的需求限制了阵列的应用的灵活性嵌入式应用的麦克风。

富迪科技的突破,麦克风阵列技术可以避免这样的麦克风的间距定制算法的单向和全向特性。

麦克风。

1.1概述该fm1188语音处理器在一个终极高性能的最新富迪语音质量的提高,低功耗的单芯片解决方案用于回声消除和噪声抑制。

提供山姆(小麦克风阵列)与波束形成只有35MW的功耗能力技术,fm1188是理想的对于便携式应用的严格要求的电池寿命和功耗。

在一个小的提供fm1188 5x5mm BGA封装,非常适合应用包括便携式免提车载套件(hfck),然而,笔记本电脑,平板电脑,和VoIP电话。

为了实现最低的功耗,fm1188功能集成的硬件加速器加速语音相关的应用。

这种新装置的设计是实现最低的功耗,同时提供最高性能。

一个增强的编解码器,fm1188为最佳的语音质量提供了高信噪比。

fm1188提供良好的噪声抑制和全双工功能,包括非线性回声消除和侧音取消。

fm1188是引脚兼容USB fm1182e但缺乏支持。

为富迪科技的更多细节,请参阅富迪fm1188调优指南。

1.2个关键特征高度集成的单芯片解决方O语音处理器的硬件加速器O 3 ADC(模数转换器)O 2的DAC(数模转换器)哦,RAM,ROMO芯片麦克风放大器澳仕,连接外部控制器功耗低(通常为所有的信号处理功能高性强大的AEC(回声消除)(65)O优越的全双工o支持1和2麦克风模式O差分I/O降低射频干扰和提高抗噪声动态范围控制(DRC)增加语音可懂度O侧音消除25~35dBO回声尾长度范围:64~100msO mic_in和line_in PGA(可编程增益放大)范围从- 2dB + 26dBO line_out和spk_out PGA范围从29dB + 2dBO在飞切换各种旁路模式之间的语音处理模式扩展的循环模式的支持,可配置的主要参考麦克风(mic0或MIC1)主要的MIC line_out,line_in到spk_out,没有获得或配置增参考麦克风line_out,line_in到spk_out,没有获得或配置增主要的MIC spk_out,line_in到line_out,没有增益(自环回在AGC O mic_in和线哦,扬声器均衡和在嘈杂的环境容量增强支持2种类型的时钟输入:4.096MHz或13M提供48引脚BGA BGA (Ball Grid Array)-球状引脚栅格阵列封装技术和48引脚LQFP 封图1:BGA引脚配置(底视图)该语音处理器fm1188 digitizes两个麦克风输入噪声抑制与山姆和过程。

MIC相关资料

中名&IEA交流资料内容ØMIC产品知识交流;Ø耳机中MIC发展趋势报告;Ø欢迎您的提问;MiC产品知识交流一、传声器工作原理传声器是一种换能器件,其作用是将声音信号转变为相应的电信号,通常人们称之为话筒或麦克风。

T e rm .1 T e rm .2M ic C a s e2C 233p FC 110pFF E T1V s +2.0V C =10μFG N DO U T P U TR L =2.2K声学元件(极板)(振膜、垫片、极板、FET )换能元件振动元件(膜片)71432568109实际传声器的结构图一、评价传声器主要性能指标•灵敏度•频率响应•工作电流•信噪比•指向性** 特种MIC特有指标灵敏度•传声器的灵敏度是表示传声器声——电转换能力的一个指标。

传声器在声压作用下完成声电转换,输出电信号。

灵敏度的定义是在单位声压作用下,输出电压的大小。

单位是分贝(dB),也可以用μbar表示,1Pa=10μbar。

•一般定义0dB=1V/Pa,其含义是人耳1KHz的可听阀的声压级为0dB,此时作用在人耳上的声压大约是2X10-5Pa。

频率响应•不同的频率,MIC其灵敏度不一定相同,这种反映灵敏度随频率变化的特性就称为传声器的频率响应或频率特性。

通常采用灵敏度和频率之间的关系曲线表示,称为传声器的频响曲线,见下页图:频率响应单指向MIC的频率响应工作电流定义:驻极体传声器在正常工作条件下所消耗的电流。

说明:一般传声器工作电流小于0.5mA(500μA )。

此指标决定着传声器消耗的功率的大小。

信噪比•所谓的信躁比,就是传声器的输出电压与本底噪声的比值。

•信躁比(S/N)=灵敏度级-本底噪声级•信躁比越高则传声器抑制环境噪声的能力越强。

指向性•定义:指传声器对不同角度入射的声波的响应。

•当声波从不同角度入射到传声器振膜时,振膜所受到的作用力不同。

因此相应的输出也不同,这种因入射声波的入射角不同而使传声器灵敏度产生变化的特性,称为传声器的指向性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

麦克风阵列语音增强技术及其应用 Technology and application of speech enhancement based on microphone array 洪 鸥 Hong Ou 摘要:本文简要叙述了应用麦克风阵列进行语音增强的原理及方法。且由于麦克风阵列在实际语音处理时具有良好的拾取语音能力及噪声鲁棒性,本文将介绍该技术在车载系统环境、机器人语音识别、大型场所的记录会议、助听装置及声源定位等系统中的应用。 关键字:麦克风阵列;声源定位;语音增强 中图分类号:TN912.3 文献标识码:A Abstract: This paper describes the foundational theory of speech enhancement based on microphone arrays. Microphone arrays have great potential in practical applications of speech processing, due to their ability to provide both noise robustness and hands-free signal acquisition. Then this paper introduces the applications of microphone array in car environment, robot, hands-free telephony, audio conferencing, car environment, and hearing aids etc. Key words: Microphone array;Speech localization; Speech enhancement

1 引言 在目标语音的实际拾取过程中,不可避免会受到外界环境噪声和其他说话人的干扰。如果干扰噪声过强对收听者而言则会觉得刺耳乃至听不清目标语音。针对这种情况,通常采用增强语音、去除背景噪声的方法来改善系统性能。目前语音增强的方法很多,根据使用麦克风的数目可分为单麦克风系统和麦克风阵列系统。 近20年来不少研究者提出了使用一个或两个麦克风来去除噪声,但由于实际环境噪声的复杂性均不能达到满意的消噪要求。而阵列信号处理采用广义旁瓣对消思想,即用“电子瞄准”的方式从声源位置获取较高品质的语音信号同时抑制其他说话人的声音及环境噪声,具有很好的空间选择性。由此麦克风阵列明显优于具有高方向性的单麦克风系统,使其成为20年来语音信号处理的一个重要分支,以及拾取语音时减小噪声和混响颇具前景的技术之一。如果系统的算法精简得当,麦克风阵列可应用于许多场合,如视频会议、机器人语音识别、车载系统环境、大型场所会议、助听装置等。

2 麦克风阵列语音增强的原理及优点 麦克风阵列通过对拾取的多路语音信号进行分析与处理,使阵列形成的波束方向图主瓣对准目标语音,“零点”指向干扰源以抑制干扰信号,从而尽可能地获取目标语音。其中波束方向及波束主瓣宽度与麦克风的间距、麦克风数目、麦克风的摆放位置、声源入射角及采样频率紧密相关。波束的形成不仅消除了使用单个麦克风时需人工调节麦克风指向性问题,而且可以使输出语音的信噪比大幅度提高,从而无需人工干预亦可获得高质量的语音。 在实际室内环境中麦克风阵列接收到的信号不仅有直接到达的目标语音,还有目标语音经过墙面反射、衍射等其它路径到达的部分即混响,同样对于噪声源也是如此。室内存在干扰和混响的典型示意图如图1(a)所示,而利用麦克风阵列获取目标语音信号示意图如图

1(b)所示。 图1(a)室内存在干扰和混响语音示意图 图1(

b

)麦克风阵列波束示意图

由上述可见麦克风阵列较之单麦克风系统具有许多优点,具体表现在:1) 麦克风阵列系统具有空间选择特性,可以用“电子瞄准”的方式从所需声源位置提供高品质的语音信号;在此麦克风阵列明显优于高方向性的单麦克风系统;2) 高方向性的单麦克风系统通常只能拾取一路信号且其指向性一般不随声源改变。而麦克风阵列系统具有自动探测定位,可在接收区域内追踪正在说话的人,有利于获取多个声源或移动声源。

3 麦克风阵列语音增强的主要方法 麦克风阵列语音增强的处理过程主要涉及到三个方面:语音定位,空间抑制及自适应滤波。对于麦克风阵列获取语音的性能好坏而言,环境噪声是一个严峻挑战,因此迫切需要选择性地接收目标语音而抑制干扰信号及噪声的方法。目前众多研究人员应用麦克风阵列波束进行语音增强的方法大致上可分成三类[4]:延迟-累加方法(传统波束法)、自适应波束法

及基于后置自适应滤波的麦克风阵列法。 3.1 延迟-累加波束法 三种方法中最简单的是延迟-累加波束法,此方法实现空间滤波的思想来源于相控雷达的原理。通过延时控制补偿从声源到每个麦克风的延时,对每个麦克风接收到的信号进行校正。然后使麦克风阵列波束指向有最大输出功率的方向,即波束对准相应空间位置的声源信号同时削弱噪声和混响的影响。 延时-累加方法可以分为三个部分,即时间延迟估计、时间延迟补偿及累加部分(Flanagan, 1985[6]),其系统框图如图2(a)所示。其中时间延迟估计与使用麦克风数目、

麦克风间距、声源入射角及采样频率成正比,与声音的传播速度成反比。加权方法有很多种,最简单的是平均加权。该系统具有较好的鲁棒性且计算复杂度也较小,但在实际应用中,理

论上信噪比的提高与采用麦克风数目的关系为M10log10(M为所采用的麦克风数目),由

此欲达到较好指向性和较高信噪比时需要的麦克风数目较多。 3.2自适应波束法 自适应波束法利用的原理是自适应噪声抵消,即以噪声为处理对象将噪声抑制或进行非常大的衰减以提高接收信号的质量[1][2],其系统框图如图2(b)所示。由系统框图可以看

到,在自适应噪声干扰抵消器的前端,提供所需的逼近跟踪信号即噪声信号的是一个块矩阵的运算输出,此输出相当于起了参考信号的作用。这个块矩阵称为标准Griffiths—Jim块矩阵,其形式为:

⎥⎥⎥⎥⎥⎥

⎦⎤

⎢⎢⎢⎢⎢⎢

⎣⎡

−−−−

=11000011000011000011ΛΛΜΛΟΟΛΜ

ΛΛB, 延迟补偿后的信号(即含噪语音)减去块运算输出的模仿噪声信号即得到最小均方误差准则下目标语音估计信号。 在开放环境条件下,如果噪声源的数目比麦克风数目少,自适应波束法能得到很好的性能。而在封闭环境中由于反射和混响会产生多噪声域的情况,在此散射噪声条件下自适应波束法的消噪性能比较有限。 3.3 后置自适应滤波法 由于单纯的延迟-累加方法较难得到理想的语音增强,一般在较复杂的实际噪声情况下采用4个麦克风其信噪比的改善在dBdB1~5.0左右[5],因此需要进一步的增强方法。1988

年Zelinski[8]提出了在传统的波束输出后采用后置滤波来消除不相关噪声的延迟-累加-滤波方法,即后置自适应滤波法,其系统框图如图2(c)所示。 此方法中维纳滤波器的系数是根据各信道接收信号间的自相关和互相关得到,即维纳滤波器的系数是自适应变化的。延迟-累加后的含噪语音信号经过维纳滤波后得到最小均方误差准则下的目标语音估计信号。这种方法在不相关噪声的环境下能通过相对较少的麦克风数目获得较好的消噪性能。如在较复杂的实际情况下系统采用4个麦克风时,采用此方法比延迟-累加方法能提高dBdB6~4左右[5],消噪效果十分明显。 3.4 几类语音增强方法的优缺点比较 由上述分析可知,延迟-累加波束法和后置自适应滤波法适用于非相干噪声和弱相干噪声消除;而自适应波束法适用于消除相干噪声,对非相干噪声或散射噪声消除效果较差。而在实际应用中,噪声域包含的噪声既不是完全散射的也不是仅有直接路径到达麦克风的,因此需要在以后的研究中应探讨可以同时消除这两种噪声的麦克风阵列语音增强方法。

图2(a)延迟-累加波束法系统框图

麦克风阵列

Mic0Mic1Mic2Mic3

时延补偿

时延估计

加权块矩阵B

1a0a

2a

∑∑∑+

-

图2(b)自适应波束法系统框图 麦克风阵列

Mic0Mic1Mic2Mic3

时延补偿

时延估计

加权维纳滤波器参数估计

维纳滤波器

后置自适应滤波∑

图2(c)后置自适应滤波系统框图

4 麦克风阵列语音增强技术的应用 由于麦克风阵列在实际语音处理时能提供良好的拾取语音能力及噪声鲁棒性,且随着DSP芯片的飞速发展、性价比的提高使得麦克风阵列广泛应用于车载系统环境、机器人识别、视频会议、语音识别的前端、大型场所的记录会议和助听装置等。 4.1 应用于车载系统 移动电话已成为一般人日常生活中不可或缺的通信工具,而汽车行驶中驾驶员使用移动电话的安全问题已引起了广泛关注,采用麦克风阵列系统与语音识别相结合则能很好地解决此难题。汽车中的噪音主要包括汽车引擎的声音、轮胎经过道路的声音及车內音响空调的声音等,这些噪声大致可认为形成了一个不相干的噪声域。这时采用基于后置自适应滤波的麦克风阵列可以有效地提高语音的辨识效果[7]。

4.2 应用于机器人语音识别 在办公室内运作的机器人与工厂机器人最大的不同是人机交互而办公室是一个动态的工作环境,需要机器人有足够的灵活性和适应性。当人机交互时就需要机器人“准确”地识别指令,而当环境噪声比较复杂时,用单麦克风的效果是很差的。为解决这个问题就可以使用麦克风阵列,在机器人的身上放置多个麦克风从而实现语音定位,通过麦克风阵列语音增强与语音识别相结合能更精确地“理解”指令。 4.3 应用于视频会议及大型会场 参加视频会议的人很多时,欲发言讨论者也相应较多。传统方法是使用一个麦克风谁欲发言就给谁使用,该方法虽然成本不高但在实际使用时很麻烦;另一种方法则是给每一个欲发言者配备一个专用麦克风,此方法虽然方便但造价很高。使用麦克风阵列则可以较好地解决该问题,它能自适应地调整波束并对准发言者。德国工业计算机辅助中心(CAIP)于2001年把麦克风阵列应用于室内演讲中,此系统由两组每组四个成直角分布位于观众席的麦克风阵列组成,其具有定位能力以集中采集当前演讲者的语音。 4.4 应用于助听器 目前在数字助听器中,麦克风阵列的技术得到日益广泛的应用。使用这种技术的原因来自几个方面:首先,在有噪声的环境下助听器在增强目标语音信号幅度时也增强了噪声的幅度;其次,在有混响时助听器不仅增强了直接到达的语音信号也增强了后来经过反射后到达的语音;再者,助听器的输出反馈会削弱助听器的频率响应。因此一个优异的助听器不仅能增强幅度,而且要提高信噪比、减小混响影响并消除反馈。麦克风阵列可利用目标语音和噪声在空间域的差异来克服上述问题。美国斯坦福大学Bernard Widrow教授2001年发明了利用麦克风阵列的助听器[3],这种助听器是将六组细小的麦克风安装在一个V形状的项链

相关文档
最新文档