近场声源定位算法研究

合集下载

声场模拟与声源定位技术研究综述

声场模拟与声源定位技术研究综述声场模拟与声源定位技术是现代声学领域中的重要研究方向，它们在音频处理、虚拟现实、智能音箱等领域中有着广泛的应用。

本文将对声场模拟与声源定位技术进行综述，探讨其原理、应用和发展趋势。

一、声场模拟技术声场模拟技术是通过数学模型和计算机算法模拟真实环境中的声音传播过程，以实现对声音的精确控制和重现。

声场模拟技术主要包括声波传播模型、声源模型和声学效果模型。

声波传播模型是声场模拟的基础，它描述了声波在空气中的传播规律。

常用的声波传播模型有几何声学模型、波动声学模型和统计声学模型。

几何声学模型适用于近场声场模拟，它基于声源与接收点之间的直线传播路径进行计算。

波动声学模型适用于远场声场模拟，它考虑了声波的衍射和干涉效应。

统计声学模型适用于复杂环境中的声场模拟，它基于统计学原理对声波进行建模。

声源模型是声场模拟中的另一个重要组成部分，它描述了声源的特性和行为。

声源模型可以是点源、线源或面源，也可以是复杂的声源阵列。

声源模型的选择取决于实际应用的需求和环境条件。

声学效果模型是声场模拟中的关键环节，它模拟了声音在环境中的衰减、反射、吸收和散射等效应。

常用的声学效果模型有吉布斯模型、镜像法和有限差分法等。

这些模型可以准确地模拟声音在不同材质和形状的物体上的反射和散射效应，从而实现对声场的真实再现。

二、声源定位技术声源定位技术是通过分析声音在多个接收点上的到达时间差、幅度差和相位差等信息，确定声源的位置。

声源定位技术主要包括时差定位、幅度差定位和相位差定位。

时差定位是通过测量声音在不同接收点上的到达时间差，计算声源与接收点之间的距离差，从而确定声源的位置。

时差定位常用于室内导航、声纳定位等领域。

幅度差定位是通过测量声音在不同接收点上的幅度差，计算声源与接收点之间的角度差，从而确定声源的方向。

幅度差定位常用于音频处理、智能音箱等领域。

相位差定位是通过测量声音在不同接收点上的相位差，计算声源与接收点之间的相对位置，从而确定声源的坐标。

声音定位和声源识别算法研究综述

声音定位和声源识别算法研究综述声音定位和声源识别是现代信号处理领域的重要研究方向之一。

随着智能音箱、语音助手等智能设备的普及，声音定位和声源识别技术得到了广泛的应用和关注。

本文将综述声音定位和声源识别算法的研究进展，介绍其应用领域和未来发展趋势。

一、声音定位算法的研究声音定位是指根据接收到的声音信号确定声源的方位角和俯仰角的过程。

声音定位算法主要分为基于时差的方法和基于能量的方法两种。

基于时差的方法利用声音信号在不同麦克风之间传播的时间差来确定声源的方位角。

常用的方法包括互相关法、波束形成法和最小二乘法等。

互相关法通过计算麦克风信号之间的互相关函数来估计时差，进而得到声源的方位角。

波束形成法则是通过对麦克风信号进行加权和相位调节，使得声源方向上的信号增益最大，从而实现声音定位。

最小二乘法则是通过最小化麦克风信号与声源信号之间的误差平方和，来估计声源的方位角。

基于能量的方法则是通过对声音信号的能量进行分析，来确定声源的方位角。

常见的方法包括声音强度法和声音梯度法。

声音强度法通过计算麦克风信号的能量差来确定声源的方位角。

声音梯度法则是通过计算麦克风信号的梯度来确定声源的方位角。

二、声源识别算法的研究声源识别是指根据接收到的声音信号判断声源的种类或身份的过程。

声源识别算法主要分为基于特征提取的方法和基于机器学习的方法两种。

基于特征提取的方法通过对声音信号的频谱、时域特征等进行提取和分析，来判断声源的种类或身份。

常见的特征包括MFCC（Mel Frequency Cepstral Coefficients）、SVM（Support Vector Machine）等。

MFCC是一种常用的声音特征提取方法，它通过将声音信号映射到梅尔频率尺度上，并提取其倒谱系数，从而得到一组具有较好区分能力的特征向量。

SVM则是一种常用的机器学习算法，它通过构建一个最优的超平面来实现声源的分类。

基于机器学习的方法则是通过训练一组声音样本，建立声音模型，并利用该模型对新的声音信号进行分类。

基于敏感度分析的近场声源定位

ｃｏｄｎｔｎｉｅｅｔｄｒｃｏｓｒａａｙｅ．Ｔｅｏｒｉａｅｏｄｆｒｎｉｔｎａｅｎｌｚｄｅｉｈｎ。ｂｅｏＭＯＬ，ｔｅｃｎｌｓｎｈａｅｃｏｉａｅｏｅｓａｎＡｈｏｃｕｉｔｔｔｏｒｎｔｎｔｏｈｄｈ
ｄｒｃｉｎｏｅｌｅｒａｒｙｉｌｓｅｓｉｅｉｇｖｎＥｐｒｍｅｔｌｒｓｌｈｗｔａｉｔｆｔｉａｒｓｅｓｓｎｉｖｓｉｅ．ｘｅｅｏｈｎａｔｉｎａｅｕｔｓｏｔＭＯＬａｄｔｅｃｒｅｐｎｉｇｓｈＡｎｏｓｏｄｎｈ
ａｎｗｒｙｔｕｔｒｎｍｅＭＯＬＭｕｕｌｒｈ — ｎａｒａ）ｉｒｓｎｅｎｈｏｒｓｏｄｎｌｓｄｆｒｅａｒｓｃｕａｒｅａｄＡ（ｔａＯｔｏＬｅＡｒｙｓｅｅｔｄａｄｔｅｃｒｐｎｉｇｃｏｅ－ｏｉｒｐｅｍ
ｐｔｎｉｌｍｉｒｐｏｅｐｉｅｄｏｂａｃｌｔｄｉｏｅｔｃｏｈｎａｒｎｅｎｔｔｅｃｌｕａｅｎＭＯＡ，ａｄｔｅｓｃｏｅ－ｏｇｒｈｗｉｈｉｕｔｂｅａｓＬｎｒｉｌｓｄｆｒａｏｔｍｈｃｓｓｉｌｈｅｍｌｉａｏｌｔｙｔｍ．ｆｒｔｅｒａ－ｍｅｓｓｅｈｅｉ
【ｙｗｏｄ】ＭＯＡ；ＴＥ；ｍｃｏｈｎｒｙｅｓｖＫｅｒｓＬＤｉｐｏｅａａ；ｓｎｉｉｒｉｙｔｔ

声源定位精度与方法比较分析

声源定位精度与方法比较分析声源定位是通过分析传感器接收到的声音信号来确定声源位置的过程。

声源定位精度和方法选择是声源定位技术中关键的问题。

在这篇文章中，我们将比较分析不同声源定位方法的精度和适用性，以便更好地了解这些方法的优缺点。

首先，我们将讨论几种常见的声源定位方法，包括时间差定位、幅度差定位和交叉相关定位。

时间差定位是通过测量声音信号在不同传感器之间传播的时间差来确定声源位置。

这种方法简单直接，不需要复杂的处理过程。

然而，时间差定位的精度受到传感器之间距离的限制，尤其是在远距离下会受到较大误差。

另外，时间差定位对声音波形的变化敏感，因此需要保持较高的信噪比。

幅度差定位是通过测量声音信号在不同传感器之间的幅度差来确定声源位置。

这种方法相对于时间差定位对传感器间距离的要求较小。

它在短距离定位时表现良好，但在远距离下容易受到噪声的影响，精度会下降。

交叉相关定位是通过计算不同传感器接收到的声音信号互相关来确定声源位置。

这种方法可以减小噪声的影响，具有较好的定位精度。

但是，交叉相关定位需要对多个信号进行处理，计算复杂度较高。

此外，它对传感器之间的同步性要求较高，需要高精度的时钟同步。

除了上述方法外，还有一些新兴的声源定位方法被提出，如基于阵列信号处理的波束形成和机器学习方法。

波束形成是一种通过加权和合成多个传感器接收到的信号来增强特定方向上的声源信号的方法。

它可以有效地抑制噪声和干扰，提高定位精度。

由于波束形成需要利用传感器阵列的空间滤波效果，因此对声源方向的估计精确度较高。

机器学习方法则是利用机器学习算法对声音信号进行处理和分析，从而实现声源定位。

通过训练模型，可以根据声音信号的特征来预测声源位置。

这种方法可以适应不同环境下的声音特征变化，并且具有较高的准确性。

然而，机器学习方法需要大量的训练数据和计算资源。

综上所述，声源定位精度和方法的选择取决于具体的应用需求和环境条件。

如果对定位精度要求较高且传感器间距较远，可以选择交叉相关定位或波束形成方法。

基于任意麦克风阵列的近场声源三维定位算法研究

ｏｔｎｄｆｍｔｅｉｕｉｒｃｌｏｓｅｃ，ｄａｅｒｅａｄｉｔｒｅｄｍｎｉａ（Ｄ）ｇｒｈａｅｎｐｏｏｅｙｏｂｉｅｏｆｓｇｐｎｉｅｆｐｅｈａａ— ｌｂｎｗｄｈｈｅ—ｉｅｓｎ３ａｏｔｈｓｅｒｐｓｄｂｍ・ａｒｈｄｆｎｉｐｎｎｆｄｉｔｏｌｌｉｍｂｅ
ａｎｄ３Ｄｎｆｒｐｒｃｕａｅａｒｙ．ｕｉｏｍｓｈｅａｌｓｒｃｒａｉｆ
Ｋｙｗｏｄ：Ｍｉｒｐｏｅａａ；ＤＯＡｅｔｔｎｉｅｅｄ；Ｓｂｐｃｔｏｅｒｓｃｈｎｒｙｏｓｉｉｎｎａｆｌｍａｏｒｉｕｓａｅｍｅｈｄ；Ｓｅｃｉｎｒｃｓｉｇｐｅｈｓｇａｐｏｅｓｎｌ
三维均匀球面阵中，均能够得到较好的定位效果。关键词：麦克风阵列；近场ＤＡ估计；子空间方法；语音信号处理Ｏ
ＳｐｅｈＳｏｒｅ３ｌｃｌａｉｎＭＵＳＩＡｌｏｉｍｎｎａｉｄｅｃｕｃｏａｉｔＤｚｏＣｇｒｈｉｅｒｆｔｅｌ
ｊａｉｎＳａｕｉｎＰｎｉｎＬｎＪｇａｕＴｉａｇｈｏＨａｚｇｅｇＱｃｇｉｉｒｎｌｏｏｎ
（ｎｔｕｅｆｏｍｕｉｔｎａｄＩｆｒａｏｎｉｅｒｇＵｉｒｉｆｌｃｏｉＳｉｎｅＩｓｔｔｏｍｎｃｉｎｏｍｔｎＥｇｅｉ，ｎｅｓｙｏＥｅｔｎｃｃｉＣａｏｎｉｎｎｖｔｒｃｅ
维普资讯

近场声源方位和距离联合估计算法

ＡｂｔａｔＴｅｈｏｏｙｂｓｄｏｃｏｈｎｅａｒｙｆｒｌｃｔｎｏｎｏｒｅｉｔｄｅｎａ — ｅｄｓｇａｓｒｃ：ｈｅｔｃｎｌｇａｅｎｍｉｒｐｏｒａｏｏａｉｇｓｕｄｓｕｃｓｓｕｉｄａｄａｎｅｒｆｌｉｎｌｉｔａｍｉｓｏｏｌｉｉｎｄｔｉｆｒｉｒｖｎｈｃｕａｙｉｏｎｄｓｕｒｅｌｃｌｚｔｏｆｔｅｍｉｒｐｈｎｅａ— ｒｎｓｓｉｎｍｄｅｓｂｕｌｉｅａｌｏｍｐｏｉｇｔｅａｃｒｃｎｓｕｏｃｏａｉａｉｎｏｈｃｏｏｒｔ
Ｖｏ．６Ｎｏ．１２３Ｍａ０８ｙ２０
文章编号：６１５９（０８０－２８５１７ —８６２０）３０４－０
近场声源方位和距离联合估计算法
殷作亮，孟维晓
（哈尔滨工业大学通信技术研究所，哈尔滨１００）５０１
关键词：麦克风阵列；近场联合估计；子空间算法
中图分类号：Ｎ１Ｔ９１文献标识码：Ａ
ＪｉｔｔｔｎＡｌｏｉｍｏＡｎｎｅｏｏｎｏｒｅｉａ — ｅｄｏｎｉｉｇｒｔｆｒＤＯａｄＲａｇｆＳｕｄＳｕｃｎＮｅｒｆｌＥｓｍａｏｈｉ
摘要：为提高近场麦克风阵列的声源定位精确度，对基于麦克风阵列的声源定位技术进行研究。详细分析了近场信号传播模型，并结合窄带子空间算法，对宽带ＩＭ（ｎｏｅｅｔｉａＳｂｐｃｔｏ）算法进行改进，ＳＩｃｈｒｎｇｌｕｓａｅＭｅｄＳｎ — ｈ

声源定位算法及实现

本文致力于真实声场环境下的三维空间声源定位的研究．在过去研究的基础之上，提出了声源定位的改进算法，并且在同步语音采集平台上建立起了实际定位系统，通过真实办公室环境的定位实验对算法进行了验证．
首先，端点检测是语音预处理中关键的一环。避免对无声的信号段的处理，不仅大大降低了运算量，而且提高了有声信号的利用率，最终提高后续定位的精度。利用噪声近似服从高斯分布以及语音和噪声相互统计独立的假设，引入了四阶累积量对语音端点进行检测，抑制了背景噪声的影响。其次，基于到达时间差的声源定位算法是当前最为流行的算法，它由时延估计和定位估计两部分组成。对于时延估计，本文在前人提出的互功率谱相位算法（ＣＳＰ）算法的基础上提出了一种改进算法，通过滤除语音范围之外无贡献的互功率谱，达到增加语音主要频段内的幅度权重的目的，抑制了非期望峰值，提高了估计精度；对于定位估计，本文以已有的球形插值算法（ｓｏ得到的定位估计作为初值，利用ＬＭＳ算法进行迭代搜索得到最小方差意义下的空间最优解，克服了原ＳＩ算法中存在的误差度量函数非最优和迭代更新定位收敛不确定的问题。定位实验结果表明，本文所提出的算法使定位精度得到了较大提高，是一种行之有效的算法。
第一章绪论
减少了手工操作。３）麦克风阵列系统能够识别监控同时发生的多个声源，在一些多人会话等
场合有重要应用。４）麦克风阵列系统可以用于近场测距，这是单麦克风无法实现的。基于上述的优点，麦克风阵列定位技术目前已经在多种场合得到广泛的应用。如视频电话会议（Ｆｌ雒ａｇａｎ’１９８５）嘲中话者定向，控制摄像头指向说话者，并自动根据距离调焦；利用定位信息在混响环境中获取特定语音（Ｆｌａｎａｇａｎ，１９９３）ｔ７ｌ，实现自动监控系统（０Ｉｎｏｌｏｇｏ，１９９３）【８】（室内防盗监控，交通监控），车载系统（Ｇｒｅｎｉｅｒ，１９９２）ｔ９１，语音助听器装置（Ｇ∞即ｂｅｒ岛１９９２）【１０ｌ等。

近场声源定位的改进最大似然方法研究

ＨＯＵＹｕｎ－ｓｈａｎ，ＷＡＮＧＳｕ－ｆａｎｇ，ＪＩＮＹｏｎｇ
（１．Ｃｏｌｌｅｇｅｏｆｅｌｅｃｔｒｏｎｉｃｓａｎｄｉｎｆｏｒｍａｔｉｏｎｅｎｇｉｎｅｅｒｉｎｇ，ＨｅｎａｎＵｎｉｖｅｒｓｉｔｙｏｆＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，
ｎｅａｒ－ｉｆｅｌｄｓｏｕｒｃｅｓｉｎｔｈｅｃｏｎｔｅｘｔｏｆｎｏｎ－ｕｎｉｆｏｒｍｓｐａｔｉｌａｎｏｉｓｅ．ｔｈｅｎｅａｒ－ｉｆｅｌｄｓｉｎａｇｌｍｏｄｅｌｂａｓｅｄｏｎｐｌａｎｒａｓｅｎｓｏｒａｒ．ｒａｙｗａｓｉｆｒｓｔｃｏｎｓｔｒｕｃｔｅｄａｎｄｔｈｅｎｔｈｅｍａｘｉｍｕｍｌｉｋｅｌｉｈｏｏｄｌｏｃｌｉａｚａｔｉｏｎｍｅｔｈｏｄｗａｓｄｅｉｖｒｅｄｉｎｄｅｔｍｌｔｏｏｂｔａｉｎｔｈｅｖｌ－ａ
ＬｕｏｙａｎｇＨｅｎａｎ４７１００３，Ｃｈｉｎａ；
２．ＤｅｐａｒｔｍｅｎｔｏｆＭａｔｈｅｍａｔｉｃｓａｎｄＰｈｙｓｉｃｓ，ＬｕｏｙａｎｇＩｎｓｔｉｔｕｔｅｏｆＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，ＬｕｏｙａｎｇＨｅｎａｎ４７１０２３，Ｃｈｉｎａ；

声源定位算法及实现

声源定位算法及实现声源定位算法大致可以分为传统方法和深度学习方法两种。

其中，传统方法主要基于声音在麦克风阵列中的时延差（Time Difference of Arrival, TDOA）或协方差矩阵分析来估计声源位置。

而深度学习方法则利用深度神经网络来学习声音特征，进而实现声源定位。

传统的声源定位算法中，最常用的方法是通过计算声波在不同麦克风之间的延迟差来确定声源位置。

这种方法称为时延差法。

具体步骤如下：1.首先，需要设置一个麦克风阵列，通常是线性阵列或圆形阵列。

2.然后，从各个麦克风收集到的声音信号通过时域差异检测（如互相关法或差分法）计算得到时延差。

3.接下来，根据时延差计算声源方向。

一种常用的方法是通过计算声源在麦克风阵列中的波前形成来确定声源位置。

除了时延差法，协方差矩阵分析也是常用的声源定位方法之一、该方法通过计算麦克风阵列中各麦克风间的协方差矩阵来估计声源位置。

具体步骤如下：1.首先，将收集到的声音信号通过时域差异检测计算得到时延差。

2.然后，利用时延差计算麦克风间的协方差矩阵。

3.最后，根据协方差矩阵的特征值和特征向量分析来确定声源位置。

深度学习方法是近年来发展起来的一种声源定位算法。

这种方法通过使用神经网络来学习声音特征，并根据这些特征来估计声源位置。

深度学习方法具有以下几个步骤：1.首先，需要准备一个具有标注声源位置的训练数据集。

该数据集由多个声音信号和对应的声源位置组成。

2.然后，将声音信号输入到深度神经网络中，并训练网络来学习声音特征。

训练过程通常使用反向传播算法来更新网络权重。

3.最后，通过输入未知声音信号到训练好的神经网络中，利用网络输出的特征来估计声源位置。

声源定位算法的实现可以使用多种编程语言和工具。

例如，可以使用Python语言结合相关的音频处理库（如Librosa、PyAudio）来实现传统声源定位算法。

对于深度学习方法，可以使用深度学习框架（如TensorFlow、PyTorch）来实现。

近场声源三维定位MUSIC算法研究

（ｎｅｓｙｏｌｔｎｃｎｅａｄＴｃｎｌｇｆｈｎ，ｈｎＤ，ｉｈａ，１０４ＣｉａＵｉｒｉｆｅｒｉＳｉｃｎｅｈｏｙｏＣｉａＣｅｇｕＳＣｕｎ６０５，ｈ）ｖｔＥｃｏｃｅｏｎ
ＡｂｔａｔＴｅｓｎｌｉｃｏｆｒｖｌＤＡ）ｅｔａｉｅｐｍｒｓｆｈｒｙｓａｐｏｅｓｇｓｒｃ：ｈｉａｄｒｔｎｏｒａ（Ｏｇｅｉａｉｓｍｔｎｉｔｒａｙｔｋｏｅａｒｉｌｒｃｓｉ．ｉｏｓｈｉａｔａｇｎｎ
号的ＤＡ估计在信号模型和处理方法上有很大区别。本文把经典的ＭＵＩＯＳＣ算法推广到语音阵列处理中，实现了声源三维定
位。该算法的基本思想是：把宽带语音信号通过短时傅立叶变换转换为独立离散频率点，利用ＭＵＩ法求出每个／分频ＳＣ算部
ＴｈｉｎｌｍｏｅｓａｄｐｏｅｓｎｔｏｓａｅｄｆｅｅｔｂｔｅｈｅｓｇａｄｌｎｒｃｓｉｇｍｅｈｄｒｉｒｎｅｗｅｎｔｅＤＯＡｓｉｔｏａｅｎｓｅｃｒａｅｓｒｆｅｔｍａｉｎｂｄｏｐｅｈａｒｙｓｎｏｓｓａｄｔｅｃａｓｃｌｐｒｍｅｅｓｉｔｏａｅｎｎｒｏｂｎｉａｎｆｒｆｌｈｒｅｄｍｅｓｏｏａｉａｉｎＭＵ— ｎｈｌｓｉａａａｔｒｅｔｍａｉｎｂｓｄｏａｒｗ— ａｄｓｇｌｉａｅｄ．Ｔｅ — ｉｎｉｎｌｃｚｔｎｉｌｏＳＣｔｏｏｐｅｈａｒｙｉｒｓｎｅｓｎｌｓｉａＩｍｅｈｄｆｒｓｅｃｒａｓｐｅｅｔｄｕｉｇｃａｓｃｌＭＵＳＣａｇｒｔｍ．ＴｅｗｉｅａｄｓｅｃｉｎａｔｒｄｂＩｌｏｈｉｈｄｂｎｐｅｈｓｇａｃｐｕｅｙｌｔｒａｓｔａｓｏｍｅｎｏｓｖｒｌｄｓｒｔｎｅｅｄｅｔｆｅｕｅｃｉｓｎ１ｈｅａｙｉｒｎｆｒｄｉｔｅｅａｉｃｅｅｉｄｐｎｎｒｑｎｙｂｎｓｕｉｇｓｎ ’ ｈｅｓａｉｐｃｒｔｃｓ．ＴｐｔｓｅｔａｍａｒｅｌａｌｉｏｈｓｒｑｕｎｃｉｅｃｌｕａｅｃｏｄｉｇｔｌｓｃｆｔｅｅｆｅｅｙｂｎｓａａｃｌｔｄａｃｒｎｏｃａｉａＭＵＳＣａｇｒｔｍ．Ａｎｈｎ，ｔｅｗｅｇｔｄａｅａｅｏｒｓｌＩｏｈｌｉｄｔｅｈｉｈｅｖｒｇｆｔｅｅｓａｉｌｓｅｔａｔｃｓｃｎｂｅｏａｎｄ．ＴｅｌｃｔｏｆｔｅｓｅｃｏｒｅｃｎｂｏｎｙｓａｃｉｇｉｅｈｓｐｔａｐｃｒｌｍａｒｅａｂｔｉｅｈｏａｉｎｏｐｅｈｓｕｃａｅｆｕｄｂｅｒｈｎｎｔｉｈｈａｅａｅｓｔａｐｃｒｌｍａｒｘＣｏｕｅｉｌｔｏｓｃｒｉｄｏｔｕｓｎｉｒｉｃｅａｒｙｗｉ６ｓｎｏｎｄｖｒｇｐａｉｓｅｔａｔ．ｌｉｍｐｔｒｓｍｕａｉｎｗａａｒｅｕｉｇｕｎｆｍｃｒｌｒａｔ１ｅｓｒａｏｈｓｄｕｌｐｅｈｓｇａｏｒｅ，ａｄｓｍｕａｉｎｒｓｌｓｓｗｈｔｔｅｐｏｏｅｇｒｔｍｓｇｏｏａｉａｉｎｐｒｏ — ｏｂｅｓｅｃｉｌｓｕｃｓｎｉｌｔｏｅｕｔｈｏｔａｈｒｐｓｄａｏｉｎｌｈｈａｏｄｌｃｚｔｅｆｒｌｏｍ

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Word文档可进行编辑
近场声源定位算法研究
近场声源定位算法研究
引言
近年来,基于麦论文联盟克风阵列得声源定位技术快速进展,同时在多媒体系统,移动机器人,视频会议系统等方面有广泛得应用.例如,在军事方面,声源定位技术能够为雷达提供一个非常好得补充,不需要发射信号,仅靠接收信号就能够推断目标得位置,因此,在定位得过程中就可不能受到干扰和攻击.在视频会议中,讲话人跟踪可为主意拾取和摄像机转向操纵提供位置信息,使传播得图像和声音更清楚.声源定位技术因为其诸多优点以及在应用上得广泛前景成为了一个研究热点.
现有得声源定位方法要紧分为三类：基于时延可能得定位方法、基于波束形成得定位方法和基于高分辨率空间谱可能得定位方法.基于时延可能得定位方法[１]要紧步骤是先进行时刻差可能,也确实是先计算声源分不到达两个麦克风得时刻差,然后依照那个时刻差和麦克风阵列得几何结构可能出声源得位置.该类方法得优点是计算量较小,容易实时实现,在单声源定位系统中差不多得到广泛应用.基于波束形成得定位方法[２]不需要直截了当计算时刻差,而是通过对目标函数得优化直截了当实现声源定位.但由于实际得应用环境中,目标函数往往存在多个极值点,因此如何优化复杂峰值得搜索过程就成为了一个重点.基于高分辨率得空间谱可能得声源定位算法,例如宽带得ｍｕｓｉｃ（ｍｕｌｔｉｐｌｅｓｉｇｎａｌｃｌａｓｓｉｆｉｃａｔｉｏｎ）方法[３]和最大似然方法[４],因其能够同时定位多个声源同时具有比较高得空间分辨率,受到了广泛得关注.
空间谱可能得方法源于阵列信号处理,其中得多重信号分类（ｍｕｓｉｃ）算法在特定条件下具有非常高得可能精度和分辨力,从而吸引了大量得学者对其进行深入得分析与研究.WwwcOm但与阵列信号处理不同得是,在声源定位中,声源在大多数情况下是位于声源近场得.为了解决这一近场咨询题,许多学者针对传统得信号模型提出了改进算法,ａｓａｎｏ等人将传统时域得ｍｕｓｉｃ[５,６]算法应用在频域中,提出了一种基于子空间得近场声源算法[７].下面来看一下近场得声源信号模型.
１近场声源信号模型
传统得阵列信号处理大多是基于远场模型得平面波信号得假设,然而在声源定位得实际应用中,有非常多情况是处于声源近场得[８],例如视频会议,机器人仿真等.同时又由于麦克风阵列阵元拾音范围有限,更多得情况下定位也处于近场范围内,如今信源到达各麦克风阵元得信
号应该是球面波,其衰减不是单一得常数,这种非线性决定了麦克风阵列声源定位得信号需要应用近场球面波模型（如图１）.
假设ｍ个全方向无差异得麦克风组成一个均匀直线阵列（如图１所示）,麦克风阵元得间距为ｄ,不妨设入射声源为点源,则ｐ个入射声音信号ｓ１,ｓ２……,ｓｐ各自得方位角以及距离参数为：（θ１,ｒ１）（θ２,ｒ２）……（θｐ,ｒｐ）.其中,θｉ为声源ｓｉ和阵列得参考点（阵列中心）之间得连线与麦克风阵列所在得直线之间得夹角,ｒｉ为声源ｓｉ与阵列得参考点之间得距离,ｉ＝１,２,…,ｐ.
则能够得出,第ｉ个入射声源信号ｓｉ与第ｍ个麦克风阵元之间距离为：
ｒ＝,ｉ＝１,２,…,ｐ（１）
其中,ｄｍ为第ｍ个麦克风阵元与阵
列得参考点之间得距离,且满足
ｄ＝[ｍ－（ｍ＋１）／２]ｄ,ｍ＝１,２,．．．,ｍ（２）
由此可得出,第ｉ个入射声源信号到第ｍ个阵元得距离与其到参考点得距离之差为
△ｒｍｉ＝ｒｍｉ－ｒｉ＝－ｒｉ（３）
从而能够得出第ｉ个入射声源信号到达第ｍ个麦克风阵元与其到达参考点得时刻差为
τｍｉ＝△ｒｍｉ／ｃ（４）
其中,ｃ为声音在空气中传播时得速度,这个地方取ｃ＝３４０ｍ／ｓ.
第ｍ个麦克风阵元所接收到得来自第ｉ个入射声源信号得信号为：
ｙ（ｔ）＝αｅ（５）
其中,α是声源信号在传播中所产生得幅度衰减参数,在近场环境模型下,其值为
α＝ｒｉ／ｒｍｉ＝ｒｉ／（６）
当ｒｉ→∞时,α＝１,即由近场模型转变为远场模型.
关于ｐ个入射信号,第ｍ个麦克风所接收到得全部信号为：
ｙ（ｔ）＝αｅ＋ｎｉ（ｔ）（７）
由此能够得到,整个阵列所接收到得信号为：
ｙ＝ｈｓ＋ｎ
ｙ（ｔ）＝αｅ…αｅ………αｅ…αｅｓ（ｔ）＋ｎ（ｔ）（８）
其中,ｓ（ｔ）＝（ｓ１（ｔ）,ｓ２（ｔ）,…,ｓｐ（ｔ））ｔ,ｎ（ｔ）＝（ｎ１（ｔ）,ｎ２（ｔ）,…,ｎｐ（ｔ））ｔ,ｈ为空间阵列得ｍ?觹ｐ维得导向向量阵,即为入射信号得方向矢量.
２ｍｕｓｉｃ算法差不多原理论文联盟
结合上面所介绍得数学模型（８）,在条件理想得情况下,数学模型所在得空间中得信号子空间与其噪声子空间应该是相互正交得,那么信号子空间得导向矢量也应与其噪声子空间相互正交,即
ａｈ（θ）ｕｎ＝０（９）
同时应该注意到,在实际接收中得到得数据矩阵长度是有限得,因此无法精确求得信号得数据协方差矩阵ｒ.基于以上考虑,数据协方差矩阵得最大似然可能为：
ｒ｀＝ｘｘ（１０）
对上式特征值分解就能够得到噪声子空间得特征矢量矩阵ｕ｀ｎ.然而由于噪声得存在,ｕ｀ｎ和ａｈ（θ）并不能完全正交,这就导致式（９）不成立.因此,ｄｏａ得可能应该是通过搜索使ａｈ（θ）ｕ｀ｎ取最小值时得θ来实现得,因此能够定义ｍｕｓｉｃ得谱可能公式为：
ｐｍｕｓｉｃ＝（１１）
只要对ｐｍｕｓｉｃ进行谱峰搜索,寻出其极大值点对应得角度,就得到了信号入射得方向.
３实验结果与分析
下面应用计算机仿真方法来验证前面得算法,仿真运用ｍａｔｌａｂ语言.实验中采取一维均匀直线阵,采纳８个全向无差异得麦克风,在ｘ轴上均匀分布,间距为１０ｃｍ,取３２ｍｓ为一帧,采样率设为１６ｋｈｚ进行数据处理.选取汉明窗,窗长１６ｍｓ,对输入信号进行
实时得傅立叶变换.
不同信噪比情况下,在不同角度上算法准确率得仿真结果如表１所示.
从表１中能够看出,在信噪比为－５ｄｂ时,算法可能得准确率能够达到８０％以上,在信噪比大于０ｄｂ时,算法可能准确率可达９５％以上.在不同得信噪比下,定位算法所表现出得性能不同,随着信噪比得增加,其定位性能更加准确.
４结束语
声源定位技术是目前研究得热点之一,能够广泛应用在生活,军事等领域中.此技术所要解决得咨询题是如何用可探测到得信号来对声源目标得位置进行可能.本文在构建了麦克风阵列近场模型得基础上,应用经典得ｍｕｓｉｃ算法对空间中得声源进行定位.该算法先对接收到得矩阵进行频域预处理,然后利用ｍｕｓｉｃ子空间得方法得到空间谱,再通过对得到得空间谱进行搜索,从而得到可能值.
ｍａｔｌａｂ仿真结果表明,此算法拥有良好得定位性能,但在研究过程中发觉此算法得复杂度比较高,如何减小算法得复杂度是下一步得研究工作.。