基于ADSP-21369的8路传声器阵列语音增强系统

基于ADSP-21369的8路传声器阵列语音增强系统
基于ADSP-21369的8路传声器阵列语音增强系统

线性麦克风阵列定向性能的研究

线性麦克风阵列定向性能的研究? 段进伟, 史元春, 陈孝杰 (清华大学计算机科学与技术系,北京市海淀区, 100084) Study on the Directing Performance of the Linear Microphone Array Duan Jin-wei, Shi Yuan-chun, Chen Xiao-jie (Department of Computer Science and Technology, Tsinghua University, Beijing, 100084, China) + Corresponding author: Phn: +86-010-********-805, E-mail: saundradjw945@https://www.360docs.net/doc/819287053.html, Received 2007-07-31; Accepted 2007-08-31 Abstract: Speech source localization technology, using microphone array, plays an important role in the area of human-computer interaction, especially that in smart space. The information of source position provided by the microphone array can be used in many place, such as dynamically adjust the parameters of the array in order to acquire high-quality speech audio, etc. Therefore, speech source localization has become a hot topic in both research and application areas. The objective of this paper is to analyze the affection on the symmetrical linear microphone array directing performance caused by the changes of microphone numbers, the spacing between microphones, the sampling frequency and so on. In order to accomplish this, we set up two linear microphone arrays with different hardware and designed comparative experiments. After the speech data was captured, an algorithm called SRP-PHAT was used to estimate the speech source direction. We analyzed the possible theoretic errors existed in the experiments carefully, and after the experiments, we analyzed the directing results, and compared the actual directing errors with the possible theoretic errors. At last, we summarized the performance of the two linear microphone arrays, and educed the configuration of the linear microphone array system when its integrative performance achieves the peak. Key words: linear microphone array; speech source directing; theoretic error; directing performance 摘 要: 麦克风阵列在人机交互中有着重要的研究和应用价值。而线性均匀麦克风阵列最简单,其基本功能是声源的定向。本文通过实验分析各种参数变化对线性麦克风阵列定向性能的影响。我们搭建了硬件参数不同的两套线性麦克风阵列并设计了对比实验。使用SRP-PHAT算法定向声源。我们分析了声源定向时各种可能的理论误差,对实验结果进行了误差分析,并与可能的理论误差做了对比。通过理论分析和对比实验,本文提出了线性麦克风阵列系统的性能评价指标,并给出了综合性能最优时的麦克风阵列系统参数配置。 关键词: 线性麦克风阵列; 声源定向; 理论误差; 定向性能 中图法分类号: ****文献标识码: A ?Supported by National High-Tech Research and Development Plan of China under Grant No. 2006AA01Z198; 作者简介: 段进伟(1985-),男,云南昆明人,大学本科,主要研究领域为人机交互与普适计算;

基于麦克风阵列的语音增强方法

基于麦克风阵列的语音增强方法 概述:在日常生活和工作中,语音通信是人与人之间互相传递信息沟通不可缺少的方式。在语音通信中,语音信号不可避免地会受到来自周围环境和传输媒介的外部噪声、通信设备的内部噪声及其他讲话者的干扰。这些干扰共同作用,最终使听者获得的是被噪声污染过的带噪声语音,严重影响了双方之间的交流。应用阵列信号处理技术的麦克风阵列能够充分利用语音信号的空时信息,具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点,逐渐成为强噪声环境中语音增强的研究热点。本文将介绍各种麦克风阵列语音增强方法,并总结各个方法的优劣。最终得出更好的、能够去噪的基于麦克风阵列的语音增强方法。 1麦克风阵列 麦克风阵列是将两个麦克风的信号耦合为一个信号。在频率响应中也可以根据时域中波束形成与空间滤波器相仿的应用,分析出接收到语音信号音源的方向以及其变化。采用该技术,能利用两个麦克风接收到声波的相位之间的差异对声波进行过滤,能最大限度将环境背景声音滤掉,只剩下需要的声波。对于在嘈杂的环境下使用采用了这种配置的设备,在嘈杂的环境下能使听者听起来很清晰,没杂音。 2基于麦克风阵列的语音增强方法 2.1基于自适应波束形成器的麦克风阵列语音增强 自适应波束形成是现在广泛使用的一类麦克风阵列语音增强方法。最早出现的自适应波束形成算法,其基本思想是在某方向有用信号的增益一定的前提下,使阵列输出信号的功率最小。在线性约束最小方差自适应波束形成器的基础上,1982 年Griffiths 和Jim 提出了广义旁瓣消除器成为了许多算法的基本框架。 广义旁瓣消除器(GSC)的工作原理是带噪声的语音信号同时通过自适应通道和非自适应通道,自适应通道中的阻塞矩阵将有用信号滤除后产生仅包含多通道噪声参考信号,自适应滤波器根据这个参考信号得到噪声估计,最后由这个被估计的噪声抵消非自适应通道中的噪声分量,从而得到有用的纯净语音信号。 麦克风阵列的自适应算法通过迭代运算获取波束形成的最优权矢量时,噪声模型的估计是一个非常关键的因素。它的好坏直接影响着系统波束形成的性能。系统地分析了最小均方( LMS) 自适应语音增强算法,并针对阻塞矩阵在估计噪声时存在的缺陷,在该算法的基础上提出了一种利用最小值控制递归平均( MCRA) 来估计噪声的方法。将此方法应用于波束形成,MCRA 估计出的噪声使LMS 自适应语音增强的效果更好和抗噪性更强。 2.2基于固定波束形成的麦克风阵列语音增强 固定波束形成技术是最简单最成熟的一种波束形成技术。1985 年美国学者Flanagan 提出采用延时-相加波束形成方法进行麦克风阵列语音增强,该方法通过对各路麦克风接收到的信号添加合适的延时补偿,使得各路输出信号在某一方向上保持同步,并在该方向的入射信号获得最大增益。此方法易于实现,但要想获取较高的噪声抑制能力则需要增加麦克风数目,然而对非相干噪声没有抑制能力,环境适应性差,因此实际中很少单独使用。后来出现的微分麦克风阵列、超方向麦克风阵列和固定频率波束形成技术也属于固定波束形成。 采用可调波束形成器的GSC麦克风阵列语言增强算法,其实质在GSC结构中的固定波束形成器前端引入各通道可调时延补偿,构造可调波束形成器进行声源方位估计,从而在目标声源方位获取阶段即可利用阵列的空间增益来提高方位估计性能。延迟求和波束形成器主要目的是增强主瓣方向目标信号,而抑制其他方向的噪声信号。

基于麦克风阵列的语音增强算法概述

- 29 - 基于麦克风阵列的语音增强算法概述 丁 猛 (海军医学研究所,上海 200433) 【摘 要】麦克风阵列语音增强技术是将阵列信号处理与语音信号处理相结合,利用语音信号的空间相位信息对语音信号进行增强的一种技术。文章介绍了各种基于麦克风阵列的语音增强基本算法,概述了各算法的基本原理,并总结了各算法的特点及其所适用的声学环境特性。 【关键词】麦克风阵列;阵列信号处理;语音增强 【中图分类号】TN911.7 【文献标识码】A 【文章编号】1008-1151(2011)03-0029-02 (一)引言 在日常生活和工作中,语音通信是人与人之间互相传递信息沟通不可缺少的方式。近年来,虽然数据通信得到了迅速发展,但是语音通信仍然是现阶段的主流,并在通信行业中占主导地位。在语音通信中,语音信号不可避免地会受到来自周围环境和传输媒介的外部噪声、通信设备的内部噪声及其他讲话者的干扰。这些干扰共同作用,最终使听者获得的语音不是纯净的原始语音,而是被噪声污染过的带噪声语音,严重影响了双方之间的交流。 应用阵列信号处理技术的麦克风阵列能够充分利用语音信号的空时信息,具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点,逐渐成为强噪声环境中语音增强的研究热点。美国、德国、法国、意大利、日本、香港等国家和地区许多科学家都在开展这方面的研究工作,并且已经应用到一些实际的麦克风阵列系统中,这些应用包括视频会议、语音识别、车载声控系统、大型场所的记录会议和助听装置等。 文章将介绍各种麦克风阵列语音增强算法的基本原理,并总结各个算法的特点及存在的局限性。 (二)常见麦克风阵列语音增强方法 1.基于固定波束形成的麦克风阵列语音增强 固定波束形成技术是最简单最成熟的一种波束形成技术。1985年美国学者Flanagan 提出采用延时-相加(Delay-and-Sum)波束形成方法进行麦克风阵列语音增强,该方法通过对各路麦克风接收到的信号添加合适的延时补偿,使得各路输出信号在某一方向上保持同步,并在该方向的入射信号获得最大增益。此方法易于实现,但要想获取较高的噪声抑制能力则需要增加麦克风数目,然而对非相干噪声没有抑制能力,环境适应性差,因此实际中很少单独使用。后来出现的微分麦克风阵列(Differential Microphone Arrays)、超方向麦克风阵列(Superairective Microphone Arrays )和固定频率波束形成(Frequency-Invariant Beamformers) 技术也属于固定波束形成。 2.基于自适应波束形成器的麦克风阵列语音增强 自适应波束形成是现在广泛使用的一类麦克风阵列语音增强方法。最早出现的自适应波束形成算法是1972年由Frost 提出的线性约束最小方差(Linearly Constrained Minimum Variance,LCMV)自适应波束形成器。其基本思想是在某方向有用信号的增益一定的前提下,使阵列输出信号的功率最小。在线性约束最小方差自适应波束形成器的基础上,1982年Griffiths 和Jim 提出了广义旁瓣消除器(Generalized Sidelobe Canceller, GSC),成为了许多算法的基本框架(图1)。 图1 广义旁瓣消除器的基本结构 广义旁瓣消除器是麦克风阵列语音增强应用最广泛的技术,即带噪声的语音信号同时通过自适应通道和非自适应通道,自适应通道中的阻塞矩阵将有用信号滤除后产生仅包含多通道噪声参考信号,自适应滤波器根据这个参考信号得到噪声估计,最后由这个被估计的噪声抵消非自适应通道中的噪声分量,从而得到有用的纯净语音信号。 如果噪声源的数目比麦克风数目少,自适应波束法能得到很好的性能。但是随着干扰数目的增加和混响的增强,自适应滤波器的降噪性能会逐渐降低。 3.基于后置滤波的麦克风阵列语音增强 1988年Zelinski 将维纳滤波器应用在麦克风阵列延时—相加波束形成的输出端,进一步提高了语音信号的降噪效果,提出了基于后置滤波的麦克风阵列语音增强方法(图2)。基于后置滤波的方法在对非相干噪声抑制方面,不仅具有良好的效果,还能够在一定程度上适应时变的声学环境。它的基本原理是:假设各麦克风接收到的目标信号相同,接收到的噪声信号独立同分布,信号和噪声不相关,根据噪声特性, 【收稿日期】2010-12-30 【作者简介】丁猛(1983-),男,海军医学研究所研究实习员。

麦克风阵列模组设计方案

麦克风阵列模组设计方案 一、麦克风阵列基本原理 二、麦克风阵列的应用 三、麦克风阵列模组的设计 一、麦克风阵列基本原理 阵列(Array): 数学定义--有限个相同资料形态之元素组成之集合 麦克风阵列是指按一定距离排列放置的一组麦克风,通过声波抵达阵列中每个麦克风之间的微小时差的相互作用,麦克风阵列可以得到比单个的麦克风更好地指向性。在麦克风阵列的设计中首要的改进是引入了波束成形、阵列指向性与波束宽度的概念。 波束的形成 通过对所有麦克风信号的综合处理,麦克风阵列可以组合成为所要求的强指向性麦克风,形成被称为“波束”的指向特性。麦克风阵列的波束可以经由特殊电路或程序算法软件控制使其指向声源方向而加强音频采集效果。 阵列算法处理后的指向性波束形成技术能精确的形成一个锥状窄波束,只接受说话人的声音同时抑制环境中的噪音与干扰。

图一使用单麦克风与采用波束形成技术麦克风阵列接收讲话者声音效果的对比

阵列指向性 由于麦克风阵列的输出信号中包含比单只麦克风更低的噪声和回声成份, 。麦克风阵列在1000Hz的典型指所以其固有噪声抑制能力要远高于单只麦克风 所以其固有噪声抑制能力要远高于单只麦克风。 向性波束图型如图二所示。其指向性图形要远好于任一款价格昂贵的高性能超心形麦克风。 图二麦克风阵列在1000Hz的典型指向性波束图型

指向性指数 另一个表证波束的参数是指向性指数。 波束轴线))检测到指向性指数D表征的是麦克风阵列主响应轴(波束轴线 的声源信号与需要屏蔽的各种噪声与回声信号的比值

二麦克风阵列的应用 正确的麦克风阵列几何排列(数量,类型及麦克风的位置)关系到最后的声学效果。为了保证成功的设计和用户满意度,双元件麦克风阵列适用于在较安静的办公场所及室内的条件使用。这种阵列形成的是水平方向压缩后的较窄波束,使用时应将两个麦克风连线中点指向讲话者。其几何排布如图三、图四所示 图三小型双麦克风阵列图四大型双麦克风阵列 四元件麦克风阵列适用于在一般的办公场或较嘈杂的环境使用,当讲话者到麦克风的距离达到3-5M距离时,仍有很好的录音效果,见图五、图六 图五4麦克风阵列图六L-形状的4麦克风阵列

多通道语音增强方法简介

多通道语音增强方法简介 【摘要】由于多麦克风越来越多地部署到同一个设备上,基于双麦克风和麦克风阵列的多通道语音增强研究有了较大的应用价值。介绍了自适应噪声对消法、FDM等双通道语音增强方法和波束形成、独立分量分析等麦克风阵列语音增强方法,对各个方法的原理、发展和优缺点进行了详细分析和总结,对多通道语音增强深入研究有一定帮助。 【关键词】语音增强;双通道;麦克风阵列;波束形成 1.引言 语音是人们通讯交流的主要方式之一。我们生活的环境中不可避免地存在着噪声,混入噪声的语音会使人的听觉感受变得糟糕,甚至影响人对语音的理解。在语音编码、语音识别、说话人识别等系统中,噪声也会严重影响应用的效果。语音增强成为研究的一个问题,其模型如图1所示。 图1 语音增强模型 按照采集信号的麦克风数量分类,语音增强方法可被分为单通道(single channel)、双通道(dual-channel)、麦克风阵列(microphone array)三种类型。一般来说,麦克风越多,去噪的效果越好。早期,大部分通信/录音终端都只配有一个麦克风,因此单通道语音增强吸引了大量研究者的目光,方法较为成熟。但单通道方法的缺点是缺少参考信号,噪声估计难度大,增强效果受到限制。近年来随着麦克风设备的小型化和成本的降低,双麦克风和麦克风阵列越来越多地被部署。研究者的注意力也在从单通道语音增强向双通道和麦克风阵列语音增强转移,这里对已有的多通道语音增强算法作以简单介绍。 2.双通道语音增强方法 在语音增强中,一个关键的问题就是获得噪声。在单通道语音增强中,噪声是通过从带噪语音信号中估计得到的,估计算法较为复杂且估计噪声总是与真实噪声存在差异,这就限制了增强效果的提高。为了获得真实噪声,简单的做法就是增加一个麦克风来采集噪声。从带噪语音信号中减去采集噪声来得到语音信号,这种方法叫做自适应噪声对消法(ANC,adaptive noise canceling),是最原始的最简单的双通道语音增强算法。针对双麦克风开发的算法不多,主要有噪声对消法、一阶差分麦克风(FDM,first-order differential microphone)及基于FDM 改进得到的自适应零陷波束形成法(ANF,adaptive null-forming)。 2.1 自适应噪声对消法 噪声对消法采用两个麦克风,一个麦克风采集带噪语音,另一个采集噪声信号,用带噪信号减去噪声信号,得到语音信号。减操作一般在频域进行,如果采

用小型传声器阵列测量环境噪声中简单声源声压级

V ol 35No.2 Apr.2015 噪 声与振动控制NOISE AND VIBRATION CONTROL 第35卷第2期2015年4月 文章编号:1006-1355(2015)02-0141-05 用小型传声器阵列测量环境噪声中简单声源声压级 宋玉来1,岳 磊2,金江明1,卢奂采1 (1.浙江工业大学特种装备制造与先进加工技术教育部/浙江省重点实验室,杭州310014; 2.浙江中科电声研发中心,浙江嘉兴314115) 摘要:常规声级计测量到的是目标声和环境噪声的总声压,不具备抑制环境噪声的功能。为此使用以球面波函数叠加逼近理论为基础的声波分离方法,用以提升环境噪声中简单声源声压级的测量精度。该方法以小型传声器阵列探头作为测量前端,近场声全息和声波分离为核心计算方法进行实施。为验证该方法的有效性,在全消声室内对关键参数进行了实验验证。实验结果表明,该方法在500Hz~2750Hz 频带内,且探头距目标声源5cm~12cm 的近场区域,可以在环境噪声中得到较精确的目标声源的声压级。 关键词:声学;声波分离;小型阵列探头;球波函数叠加;声压级测量;近场声全息;中图分类号:O422.2 文献标识码:A DOI 编码:10.3969/j.issn.1006-1335.2015.02.032 Measurement of Sound Pressure Level of Simple Acoustic Sources in Noisy Environment with Mini-sized Microphone Arrays SONG Yu-lai 1,YUE Lei 2,JIN Jiang-ming 1,LU Huan-cai 1 (1.Key Laboratory of E &M,Ministry of Education &Zhejiang Province, Zhejiang University of Technology,Hangzhou 310014,China;2.Zhejiang Electro-Acoustic R&D Center,Jiaxing 314115,Zhejiang China ) Abstract :Generally,conventional sound-level meters can only measure the total sound pressure of the target sound source and the environment noise instead of measuring them separately.To improve the measurement accuracy of the sound pressure level of the target sound source in noisy environment,the acoustic wave separation method based on spherical wave su-perposition was used with the input of the acoustic pressures measured by a mini-sized microphone array.The impact of param-eters on the accuracy of the sound pressure level was examined in an anechoic chamber.The results show that a reasonable ac-curacy can be obtained when the frequency is ranged from 500Hz to 2750Hz and the measurement distance is from 5cm to 12cm. Key words :acoustics ;acoustic wave separation ;mini-sized array ;spherical wave superposition ;sound pressure level measurement ;near-field acoustic holography 声级计作为现场声压测量的重要工具,具有操作简便快速的优点,可以实时的测量声场中任意一点的声压值[1]。然而,当声场中除了目标声源外还有其它干扰噪声源存在时,声级计测量到的声压大小无法反映目标对象辐射的真实声压,甚至得到错 收稿日期:2014-09-11 基金项目:国家自然科学基金资助项目(51275469;51205354)作者简介:宋玉来(1987-),男,安徽六安人,博士生,主要研 究方向:从事基于阵列信号处理的声源识别定位和声波分离方法研究。 E-mail:songyulai_svlab@https://www.360docs.net/doc/819287053.html, 通讯作者:卢奂采,女,教授,博士生导师。 E-mail:huancailu@https://www.360docs.net/doc/819287053.html, 误的测量结果。 在近场声全息[2,3]研究领域,可以利用声波分离方法来减弱干扰噪声源对声压测量值的影响,实现有噪声干扰情况下对目标声源声压测量。现有的声波分离方法在实施过程中主要涉及两种测量方式:双层阵列声压测量[4,5]及单层阵列声压—空气粒子速度测量[6,7],前一种测量方法要求在声场中布置存在精确相对位置关系的两层阵列,而后一种测量方法虽然只需要单层的阵列,但是必须同时得到阵列上测点处的复声压信号及空气粒子振速信号。这两种声波分离方法尽管能够实现噪声干扰环境下的目标声信号测量,但所需的测点数量较多,常常需要几十个测点。因此上述方法由于实际操作复杂和较高

基于麦克风阵列的声源定位技术毕业设计

毕业设计说明书基于麦克风阵列的声源定位技术 学生姓名:学号: 学院: 专业: 指导教师: 2012年 6 月

基于麦克风阵列的声源定位技术 摘要 声源定位技术是利用麦克风拾取语音信号,并用数字信号处理技术对其进行分析和处理,继而确定和跟踪声源的空间位置。声源定位技术在视频会议、语音识别和说话人识别、目标定位和助听装置等领域有着重要的应用。传统的单个麦克风的拾音范围很有限,拾取信号的质量不高,继而提出了用麦克风阵列进行语音处理的方法,它可以以电子瞄准的方式对准声源而不需要人为的移动麦克风,弥补单个麦克风在噪声处理和声源定位等方面的不足,麦克风阵列还具有去噪、声源定位和跟踪等功能,从而大大提高语音信号处理质量。 本文主要对基于多麦克风阵列的声源定位技术领域中的基于时延的定位理论进行了研究,在此基础上研究了四元阵列、五元阵列以及多元阵列的定位算法,并且分别对其定位精度进行了分析,推导出了影响四元、五元阵列目标方位角、俯仰角及目标距离的定位精度的一些因素及相关定位方程,并通过matlab仿真软件对其定位精度进行了仿真;最后在四元、五元阵列的基础上,采用最小二乘法对多元阵列定位进行了计算;通过目标计算值和设定值对比,对多元阵列的定位精度进行了分析,并得出了多元阵列的目标定位的均方根误差。 关键词:麦克风阵列,声源定位,时延,定位精度,均方根误差

Based on Microphone Array for Sound Source Localization Research Abstract Sound source positioning technology is to use the microphone to pick up voice signals, and digital signal processing technology used for their analysis and processing , Then identify and track the spatial location of sound source. Acoustic source localization techniques have a variety of important uses in videoconferencing, speech recognition and speaker identification, targets’ direction finding, and biomedical devices for the hearing impaired. The pick up range of traditional single microphone is limited, the signal quality picked up is not high, then a voice processing methods with the microphone array has been proposed . It may be electronically aimed to provide a high-quality signal from desired source localization and doe s not require physical movement to alter these microphones’ direction of reception. Microphone array has the functions of de-noising, sound source localization and tracking functions, which greatly improved the quality of voice signal processing. The article discusses some issues of sound source localization based on microphone array, On the basis ,it studies a four element array,five element array and an multiple array positioning algorithm, then the positioning precision is analyzed. Derived some factors of the azimuth and elevation angle targets the target range of the estimation precision affected and positioning equation. And through MATLAB simulation software for its positioning accuracy of simulation. finally ,based on four yuan, five yuan of array, using the least square method ,the multiple array localization were calculated. Through the contrast of the target value and set value, multiple array positioning accuracy is analyzed, and the of diverse array target positioning. Keywords: Microphone Array, Sound Source Localization, Time Delay, Positioning precision, root mean square error

麦克风阵列原理

麦克风阵列原理 1 麦克风阵列 麦克风阵列,是一组位于空间不同位置的全向麦克风按一定的形状规则布置形成的阵列,是对空间传播声音信号进行空间采样的一种装置,采集到的信号包含了其空间位置信息。根据声源和麦克风阵列之间距离的远近,可将阵列分为近场模型和远场模型。根据麦克风阵列的拓扑结构,则可分为线性阵列、平面阵列、体阵列等。 (1) 近场模型和远场模型 声波是纵波,即媒质中质点沿传播方向运动的波。声波是一种振动波,声源发声振动后,声源四周的媒质跟着振动,声波随着媒质向四周扩散,所以是球面波。 根据声源和麦克风阵列距离的远近,可将声场模型分为两种:近场模型和远场模型。近场模型将声波看成球面波,它考虑麦克风阵元接收信号间的幅度差;远场模型则将声波看成平面波,它忽略各阵元接收信号间的幅度差,近似认为各接收信号之间是简单的时延关系。显然远场模型是对实际模型的简化,极大地简化了处理难度。一般语音增强方法就是基于远场模型。 近场模型和远场模型的划分没有绝对的标准,一般认为声源离麦克风阵列中心参考点的距离远大于信号波长时为远场;反之,则为近场。设均匀线性阵列相邻阵元之间的距离(又称阵列孔径)为d,声源最高频率语音的波长(即声源的最小波长)为λmin,如果声源到阵列中心的距离大于2d2/λmin,则为远场模型,否则为近场模型,如图1所示。 图1 近场模型和远场模型 (2) 麦克风阵列拓扑结构 按麦克风阵列的维数,可分为一维、二维和三维麦克风阵列。这里只讨论有一定形状规则的麦克风阵列。 一维麦克风阵列,即线性麦克风阵列,其阵元中心位于同一条直线上。根据相邻阵元间距是否相同,又可分为均匀线性阵列(Uniform Linear Array,ULA)和嵌套线性阵列,如图2所示。均匀线性阵列是最简单的阵列拓扑结构,其阵元之间距离相等、相位及灵敏度一直。嵌套线性阵列则可看成几组均匀线性阵列的叠加,是一类特殊的非均匀阵。线性阵列只能得到信号的水平方向角信息。

传声器阵列声成像的阵列优化与稳健算法研究

传声器阵列声成像的阵列优化与稳健算法研究 基于传声器阵列技术的阵列声成像研究主要包括阵列优化设计和稳健的声源定位研究。阵列 的阵型决定了阵列波束主瓣宽度和旁瓣级,表征了阵列空间分辨能力和抗干扰能力,因此优 化设计阵形提高阵列性能,成为阵列研究中的重要内容。虽然存在各种高分辨率算法,但实 际工作环境由于混响和干扰的影响,高分辨率算法性能急剧下降而无法使用,因此计算量较 小便于实时实现的稳健波束形成算法成为一项重要研究内容。球面传声器阵列具有三维均匀 探测能力,阵列波束可以灵活地指向空间任意方向,得到广泛应用。基于球谐函数函数理论 的球面阵列处理,在阵元位置无法满足正交关系时,阵列波束将产生严重变形,因此如何设 计理想稳健波束,以及在干扰和噪声环境中最优波束的设计是球面阵列研究的重要内容。 声信号的处理主要包括信号显示分析以及阵列信号处理,其中信号显示包括波形显示和频谱 分析。阵列信号处理提供了成像频带选择、算法选择、阵形选择,选择不同的参数传输给 DLL进行声像计算。声信号经过DFT变换,将频域信号传输给算法程序,频带选择限定了声 源的成像频率范围,根据需要可以选择不同的带宽进行分析。选择时域的时延相加波束形成、频域的相移相加波束形成、改进的SRO-PHAT算法等。通过选择阵形,可以获得不同阵元坐标,结合成像距离选定信号类型,获得阵列的导向矢量,供算法调用。算法最终获得能量的 二维分布,经过归一化转化为RGB色阶的二维矩阵,而视频信号也同时转化为RGB色阶的二维矩阵,经过图像融合处理,获得最终的声成像结果。阵列性能指标主要包括空间分辨率、 旁瓣抑制能力和阵列测量频率上下限。再降低频率两个声源无法分离,此时的频率即为声成 像测量系统的测量频率下限。通常以阵列视角出现虚像的频率作为阵列的测量上限,声源虚 像是指声场视角内出现的略小于声源或与声源相当但实际并不存在的声像。将一个声源放置 于视频边缘不断提高声源频率直到视角边缘出现虚像,此时的频率即为阵列的测量频率上限。阵列的半功率波束宽度表征了阵列的空间分辨率。阵列的旁瓣级表征了阵列的干扰抑制能力。本章根据阵列优化结果设计了声成像硬件系统和软件系统,并根据实时性要求基于GPU在CUBA编程框架下实现了阵列算法,对阵列声成像系统性能进行了研究,包括测量频率下限、测量频率上限、系统空间分辨率、干扰抑制能力和抗混响性能。 采用粒子群算法进行传声器阵型的优化设计。采用实数粒子群算法优化平面螺旋阵列和同心 圆环阵列,得到旁瓣级最低的优化阵形;提出改进的实数粒子群算法,兼顾波束主瓣宽度和 旁瓣级,获得优化的八星立体阵列;研究了二进制粒子群算法及布尔粒子群算法,稀疏优化 平面矩形阵列,并提出改进的二进制粒子群算法,进一步提高收敛速度和优化性能。仿真结 果验证了采用不同粒子群算法优化阵形的有效性,可以获得在不同的优化条件下的最优设计 结果。 传声器定位算法大体分为三类:一是基于最大输出功率的可控波束形成定位算法;二是基于 高分辨率的谱估计定位技术;三是基于到达声达时间差的定位技术,可控波束形成的声源定 位算法,基本思想就是把各路传声器接受到的声源信号进行一系列运算,通过搜索声源的可 能位置来引导该波束,在整个接收空间内扫描,波束输出功率最大的点即为声源的方位。时 延估计是声源定位领域的一项关键技术,时间延迟是指传声器阵列中不同传感器接收到同源 信号之间由于传输距离不同而引起的时间差。每个时间差唯一的对应一个双曲面,多个传感 器对就可以得到多个双曲面,根据这些双曲面的交集就可以对声源进行定位。时延估计算法 很多,其中广泛应用的是广义互相关方法和自适应最小均方方法。广义互相关法,通过求两 信号之间的互功率谱,并在频率内给与一定的加权,来抑制噪声和混响的影响,然后再反变 换到时域,得到两信号之间的互相关函数,其峰值位置即为两信号之间的相对时延,自适应 滤波是基于最小均方误差准则,在收敛的情况下给出时延估计。 实时阵列成像定位要求算法具有较小的计算量和较高的稳健性,因此研究了能够在中度混响 和中低噪声环境下正常工作的可控响应功率算法。针对声场中弱声源被强声源掩蔽而无法定 位的问题提出了时延加权可控响应功率两步法定位弱声源,仿真结果验证了改进算法对非相

最新传声器阵列的选择

对声源位置进行确定首先要对声波信号进行检测和处理,这就需要使用声波传感器阵列对声波信号进行采集。传感器阵列方法的使用来自雷达、声纳等系统中采用的阵列信号处理技术,对传统的声波传感器单独使用的方式做出改进,利用多个传感器排成特定的形状的阵列同时进行声波信号采集,用阵列信号处理的方法获得更多的信息。 在实际应用中,传感器阵列可以分为直线阵、平面阵和立体阵。在这些阵列中,直线阵的结构最为简单,应用也比较广泛。但对于固定式阵列来说,直线型传感器阵列只能对阵列所在直线为界的半个平面进行定位。立体阵则可以对三位空间内的声源目标进行定位,但算法的实现更为复杂。考虑到声源定位系统的使用位置为陆地平面或近似陆地平面,并考虑到算法实现的复杂度,选择平面阵进行研究较为合适。平面阵列中常用的阵列有正三角形阵和4元十字阵。课题中选择正三角阵进行研究,主要原因有四点: ● 传感器数量少,信息的处理量随之减少,公式推导和算法设计更为简单; ● 在相同的面积上,安装的传感器数量越少,传感器之间的距离越大,声达时间差就 越大,在采样频率一定的情况下,可以降低系统误差; ● 传感器数量少,越有利于降低传感器阵列的安装复杂度; ● 二元阵在平面范围内定位没有唯一解,利用三元阵可以进行唯一定位。 1、有两个麦克风组成的直线阵列 如图所示,OF 为弹道方向,1M 2M 为由两个麦克风构成的直线阵,马赫波从EF 传播至DC ,即平行的沿着从A 至C 的方向传播,EF 平行于DC ,AC 垂直于DC 。设21M M d =,又有t V C M b s ?==1,s V 为声速,t ?为测得的马赫波到达1M 和2M 俩点的时间差,因此有)/arcsin(d b =β。由于本文研究的是超音速子弹飞行时产生的马赫波,对于马赫角θ,仅知道其初值范围。通过检索,目前阻击步枪子弹的出膛速度一般不会超过1000米/秒,如我国的85式狙击步枪的枪口速度为830米/秒,88式狙击步枪的枪口速度为895米/秒,国外新兴的拉普阿玛格努姆狙击步枪的枪口初速为914米/秒。因此使用直线阵仅能通过公式θβ--=?180求的直线阵与弹道之间夹角的大致范围,但是直线阵距离声源的距离是无

讯飞麦克风阵列声学测试方法

讯飞麦克风阵列声学测试 方法 This model paper was revised by the Standardization Office on December 10, 2020

讯飞麦克风阵列声学测试方法 测试准备 环境: 混响环境(模拟家庭客厅环境) 器材: 两个高保真音箱:1个用于播放语音,1个用于播放噪声; 音响支架2个:1个用于放置语音播放设备,1个用于放置噪音播放设备; 笔记本电脑2个:1个用于播放语音信号和噪声信号,1个用于抓取日志或录音; 分贝仪1个:用于噪声、语音信号强度测试,计算信噪比等; 卷尺1个:用于测试与设备的距离; 语料: 唤醒语料:用于测试唤醒率; 命令词语料:用于语音识别,测试识别率; 本机功放播放音频:回声消除测试使用; 家庭环境噪声音频:可播放中央台新闻节目,约30分钟; 硬件:

讯飞demo板1个 裸板1个 整机1个 软件: IPTV主板软件: 可抓日志,准备至少两个串口线。 可录音,可录15分钟以上。准备两个U盘。 可手动打开/关闭唤醒模式。可手动设置波束。 核心板固件:准备烧录工具。 唤醒词:跟唤醒词音频一致。 测试环境搭建 麦克风阵列测试示意图如下:

在安静环境下,放置阵列位于待测区域中间位置,唤醒源位于距阵列1m 处,噪声源位于距阵列处,唤醒源和阵列在一条直线上。 通过高保真音箱播放语料,通过分贝仪在阵列处测试信噪比,要求噪声源、唤醒源在阵列处的响度均为55dB 。安静环境下和噪声环境下分别测试唤醒率和识别率。 调整唤醒源的位置,距阵列的距离分别为3m 和5m 。要求唤醒源在阵列处的响度仍为55dB 。安静环境下和噪声环境下分别进行唤醒率和识别率测试。 测试说明: 测试环境因素影响非常大,唤醒源的位置角度调一调,响度校正时测试值的波动也很大。每次测试都要有对比物,只有同一时间同一环境对比测试的结果才有意义。 一、声学效果测试 1 分别对音箱6麦克整机与音箱裸麦、音箱裸麦与评估板裸麦进行唤醒、声源定位测试 测试步骤: 唤醒源 待测区域 麦克风阵

相关文档
最新文档