二次加速SRP—PHAT声源定位算法
一种基于麦克风阵列的声源定位算法研究

一种基于麦克风阵列的声源定位算法研究王勇;刘颖;刘建平【摘要】麦克风阵列声源定位广泛应用于视音频会议系统及枪声定位系统等领域.提出了一种基于最小熵值(ME)的麦克风阵列声源定位新方法,其特点在于利用最小熵值方法对麦克风阵列进行时延估计,并与离散网格方法相结合,对声源进行空间搜索.实验结果表明,在同等混响或噪声条件下,该方法定位优于广义互相关-相位变换方法(GCC-PHAT).%The acoustic source is widely used in audio and video conference system and gunshot localization system. In this article, a novel acoustic source localization algorithm for microphone array based on minimum entropy and stochastic region contraction (ME) is proposed. The algorithm show that the acoustic source can be developed to estimate time delay between microphones on a basis of minimum entropy and localize the acoustic source in search space by using discrete grid search algorithm. Experimental results show that the proposed algorithm is much more robust than GCOPHAT in noise and reverberation environment.【期刊名称】《现代电子技术》【年(卷),期】2011(034)019【总页数】4页(P61-64)【关键词】麦克风阵列;声源定位;最小熵值;波达时延差【作者】王勇;刘颖;刘建平【作者单位】西安电子科技大学,陕西西安710071;武警工程学院,陕西西安710086;武警工程学院,陕西西安 710086【正文语种】中文【中图分类】TN911.3-340 引言基于麦克风阵列的声源定位是声学信号处理领域中的一个重要问题。
改进的SRP-PHAT声源定位方法

改进的SRP-PHAT声源定位方法
谭颖;殷福亮;李细林
【期刊名称】《电子与信息学报》
【年(卷),期】2006(028)007
【摘要】基于联合可控响应功率和相位变换(SRP-PHAT)的传声器阵列声源定位方法是一种鲁棒的声源定位方法.该方法在弱噪声和适度混响的环境下,可以获得较精确的波达方向角(DOA)估计,但在低信噪比或强混响的环境下,该方法的性能并不理想,而且庞大的运算量也限制了其在实时定位系统中的应用.针对这两方面的问题,本文提出了一种改进的SRP-PHAT传声器阵列声源定位方法,从而使定位方法的运算量大大降低.仿真实验表明,改进的SRP-PHAT定位方法即使在噪声干扰较大和混响影响较严重的环境下,仍具有较高的定位精度.
【总页数】5页(P1223-1227)
【作者】谭颖;殷福亮;李细林
【作者单位】大连理工大学,电子与信息工程学院,大连,116024;大连理工大学,电子与信息工程学院,大连,116024;大连理工大学,电子与信息工程学院,大连,116024【正文语种】中文
【中图分类】TN912.3
【相关文献】
1.近场声源定位的改进最大似然方法研究 [J], 侯云山;王素芳;金勇
2.基于改进TDOA的近场声源鲁棒定位方法研究 [J], 曹洁;吴尧帅;李伟;王进花
3.改进DSB方法的语音信号多声源定位 [J], 王杰;黄丽霞;张雪英
4.面向声源定位的改进广义互相关时延估计方法 [J], 屈顺彪;俞华;芦竹茂;申冲;韩钰;王晨光
5.基于广义互相关改进的麦克风阵列声源定位方法 [J], 李保伟;张兴敢
因版权原因,仅展示原文概要,查看原文内容请购买。
二次加速SRP-PHAT声源定位算法

二次加速SRP-PHAT声源定位算法乔杰;李致金;赵力【期刊名称】《数据采集与处理》【年(卷),期】2011(26)6【摘要】In microphone arrays application, sound source localization is a vitally important problem. Sound source localization algorithm based on steering response power-phase transform (SRP-PHAT) has high robustness and accuracy, especially in noisy and echo environment. But SRP-PHAT algorithm requires large computation, which is a big shortcoming in application. To solve the problem, a new algorithm is proposed by optimizing arrays construction and search strategy. Two-dimensional search space is firstly converted to one-dimensional one then a hierarchic search strategy is adopted in one-dimensional search space. Simulation results show that a bulk of computational expense is saved by using the new algorithm.%基于可控功率响应和相位变换(Steering response power-phase transform,SRP-PHAT)的声源定位算法具有较高的鲁棒性和准确性,特别是在强噪声和回响条件下.但SRP-PHAT类算法在工程应用中有一个巨大的障碍,那就是需要较大的运算量.为了解决该问题,本文从阵列拓扑结构和搜索策略两个方向出发,对SRP-PHAT类算法加速.首先,通过垂直布置的阵列将二维空间的搜索转化为一维空间的搜索;其次,采用层次搜索策略,由粗至精对一维空间进行搜索.仿真实验表明,采用该方法可以节约大量的计算量.【总页数】5页(P681-685)【作者】乔杰;李致金;赵力【作者单位】南京信息工程大学电子与信息工程学院,南京,210044;南京信息工程大学电子与信息工程学院,南京,210044;东南大学信息科学与工程学院,南京,210096【正文语种】中文【中图分类】TN912【相关文献】1.一种改进的联合SRP-PHAT语音定位算法 [J], 袁安富;孟君2.改进的SRP-PHAT声源定位方法 [J], 谭颖;殷福亮;李细林3.基于SRP-PHAT的实时声源定位算法设计与实现 [J], 刘生4.基于SRP-PHAT的实时声源定位算法设计与实现 [J], 刘生5.基于改进二次相关算法的声源定位仿真研究 [J], 简泽明;彭阳;高泽平;刘梦然因版权原因,仅展示原文概要,查看原文内容请购买。
基于麦克风阵列的实时声源定位技术研究

II
ABSTRACT
Keywords: sound source localization; microphone array; SRP–PHAT; GCC
III
目录
目 录
摘 要 ..................................................................................................................................I ABSTRACT ..................................................................................................................... II 第一章 绪 论 ................................................................................................................... 1 1.1 研究背景及研究现状 ............................................................................................ 1 1.1.1 研究背景及意义 ............................................................................................. 1 1.1.2 国内外研究现状 ............................................................................................. 3 1.2 本文研究的主要内容 ............................................................................................ 7 第二章 声源定位算法的理论基础 ................................................................................. 9 2.1 音频信号的预处理 ................................................................................................ 9 2.1.1 音频信号的短时分析 ..................................................................................... 9 2.1.2 音频活动检测 ................................................................................................. 9 2.2 麦克风阵列的近场和远场模型 .......................................................................... 11 2.2.1 麦克风阵列对信号的处理 ........................................................................... 11 2.2.2 远场模型和近场模型的区分 ....................................................................... 12 2.2.3 麦克风阵列的近场模型 ............................................................................... 12 2.2.4 麦克风阵列的远场模型 ............................................................................... 13 2.3 麦克风阵列的设计 .............................................................................................. 16 2.3.1 麦克风的种类介绍 ....................................................................................... 16 2.3.2 麦克风阵列的结构 ....................................................................................... 17 2.3.3 麦克风阵列阵元的间距和数目 ................................................................... 18 2.4 本章小结 .............................................................................................................. 19 第三章 实时声源定位算法研究 ................................................................................... 20 3.1 SRP PHAT 声源定位方法 ................................................................................ 20 3.2 SRP PHAT 算法的改进 .................................................................................. 21 3.2.1 声源定位算法的比较与选择 ....................................................................... 21 3.2.2 改进的 SRP PHAT 声源定位算法总体概述 ............................................. 22 3.3 混合结构的实时声源定位算法 .......................................................................... 24 3.3.1 语音活动检测 ............................................................................................... 24 3.3.2 时间延迟估计 ............................................................................................... 25 3.3.3 圆形群集方法 ............................................................................................... 26
基于频率信噪比加权的麦克风阵列声源定位算法

&)*)+)",)*-+./0! IhasivasXan, Chen Shu[en, Ihsu Lvn.Ssund SsueoeLsoaivZatvsn g vngSNR-ba ed KeeduenoX Levghtvng[vth M voesphsne A eaX( J ) . Jsu ena isoS vgna iP esoe vng, 2020, 36#3%! 449-456.DOA! 10.16798jj.v n.
36东南大学信息科学与工程学院" 江苏南京210096#
摘#要! 为了提高噪声和混响环境下麦克风阵列的声源定位算法性能$ 提出了一种基于频率信噪比加权的可控
响应功率定位算法' 该算法首先根据每帧阵列信号的频域协方差矩阵估计每个频率的信噪比" 然后通过激活函
SRP-PHAT的改进算法综述

SRP-PHAT的改进算法综述袁晓坤;才德;邓甲昊;栗苹;敬明旻【摘要】最大可控响应功率波束形成法( SRP - PHAT)是当前传声器阵列声源定位主流方法之一.针对该算法计算量庞大,不能进行实时声源定位的问题,对基于随机搜索的空间收缩快速算法(SRC)、由粗到精空间收缩快速算法(CFRC)、随机粒子滤波快速算法(SPF)等进行了分析、比较,总结了当前SRP - PHAT的改进方法.【期刊名称】《电声技术》【年(卷),期】2012(036)010【总页数】4页(P53-55,62)【关键词】最大可控响应功率波束形成法;声源定位;传声器阵列;搜索算法【作者】袁晓坤;才德;邓甲昊;栗苹;敬明旻【作者单位】北京理工大学信息感知与对抗国防重点实验室,北京100081;北京理工大学信息感知与对抗国防重点实验室,北京100081;北京理工大学信息感知与对抗国防重点实验室,北京100081;北京理工大学信息感知与对抗国防重点实验室,北京100081;中国石化石油工程技术研究院信息与标准化研究所,北京100101【正文语种】中文【中图分类】TN9111 引言传声器阵列信号处理技术是源于雷达、声呐等系统。
传声器阵列声源定位在通信、移动机器人和助听器装置等许多领域具有广泛应用价值[1]。
在这些应用中,最基本的就是要估计声源位置,并且需要兼顾定位精度和算法的实时性。
SRP-PHAT法将本身固有的稳健性、短时分析特性与时延估计中相位变换方法对信号周围环境的不敏感性相结合,使声源定位系统具有一定的抗噪性、抗混响性和稳健性[2]。
目前,SRP-PHAT法是一种对窄带和宽带信号均可适用的有效方法,得到了广泛研究和应用。
但是由于其全局搜索算法运算量较大,限制了该方法的实时性。
在保持定位精度不变的前提下,大量削减计算量,加快计算速度,以适应实时目标探测的要求就成为SRPPHAT算法对单目标定位研究的主要问题之一。
2SRP-PHAT算法具有的全局搜索算法尽管SRP-PHAT具有较强的稳健性,但由于存在较多局部极值,为求得全局最优解,早期的算法往往对空间网格上的所有点都进行考察,求得输出功率最大值点作为声源的估计点。
一种修正的近场声源定位时延估计方法

一种修正的近场声源定位时延估计方法杜要锋;尹雪飞;陈克安【摘要】时延估计是近场声源定位领域中的一项关键技术.相位转换广义互相关时延估计方法(PHAT-GCC)由于其低的计算复杂度和易于实现的特点使得此方法在实际的被动声定位系统中得到了广泛应用.但是此方法只能在高信噪比和适度混响条件下有较好的性能.针对此问题,给出了一种修正的PHAT-GCC方法,并在不同信噪比和混响环境下与PHAT-GCC方法进行比较,仿真实验表明,修正的方法在较低信噪比下的抗混响性能有所提高.【期刊名称】《电声技术》【年(卷),期】2010(034)002【总页数】5页(P47-50,81)【关键词】时延估计;近场;声源定位;广义互相关;混响【作者】杜要锋;尹雪飞;陈克安【作者单位】西北工业大学,电子信息学院,陕西,西安,710129;西北工业大学,电子信息学院,陕西,西安,710129;西北工业大学,航海学院,陕西,西安,710072【正文语种】中文【中图分类】TN912.31 引言声源定位问题是传声器阵列应用中的基本问题之一。
传声器阵列声源定位在车载导航、人机接口、声音检测设备、移动机器人、助听器等许多领域具有广泛的应用价值。
现有的声源定位技术主要分为三大类:基于最大输出功率的可控波束形成方法、基于子空间分解的高分辨谱估计方法和基于时延估计的双步定位方法。
可控波束形成方法[1]是对传声器所接收到的声源信号滤波并求加权求和来形成波束,进而通过搜索声源可能的位置来引导该波束,最终使波束输出功率最大的点就是声源的位置。
此方法计算量较大,且在实际应用中存在诸多缺陷,如分辨率受阵列孔径的限制,对于许多实际应用环境而言,增大阵列孔径来提高精度是不现实的;高分辨谱估计方法是利用不同的方法对阵列接收数据的协方差矩阵进行分解定出方向角。
其中以多重信号分类法(Multiple Signal Classification,MUSIC)最具代表性,该类方法精度较高,对相邻很近的2个声源具有较高分辨率,适合多声源定位问题。
SRP-NMF一种多通道盲源分离算法

第54卷 第6期2021年6月通信技术Communications TechnologyVol.54 No.6Jun. 2021文献引用格式:皮磊,郑翔,武欣嵘,等.SRP-NMF:一种多通道盲源分离算法[J].通信技术,2021,54(6):1333-1338.PI Lei,ZHENG Xiang,WU Xinrong,et al.SRP-NMF: a multi-channel blind source separationalgorithm[J].Communications Technology,2021,54(6):1333-1338.doi:10.3969/j.issn.1002-0802.2021.06.007SRP-NMF:一种多通道盲源分离算法*皮 磊,郑 翔,武欣嵘,陈美均(陆军工程大学,江苏 南京 210007)摘 要:将双通道盲源分离算法GCC-NMF扩展到广义多通道盲源分离问题中,提出了一种新的多通道盲源分离算法SRP-NMF。
该算法利用SRP-PHAT算法计算每个源信号到麦克风通道的到达时间差,对混合信号中的源信号进行定位和计数,并结合非负矩阵分解实现盲源分离算法。
实验使用WSJ0-2mix数据集和VCC数据集来评估分离结果。
通过实验数据发现,SRP-NMF算法比其他传统的算法的分离效果要好,分离准确性高,且能够保持对噪声的鲁棒性。
关键词:盲源分离;多通道信号;非负矩阵分解;到达时间差中图分类号:TP3 文献标识码:A 文章编号:1002-0802(2021)-06-1333-06SRP-NMF: A Multi-channel Blind Source Separation AlgorithmPI Lei, ZHENG Xiang, WU Xinrong, CHEN Meijun(Army Engineering University of PLA, Nanjing Jiangsu 210007, China)Abstract: This paper extends the dual-channel blind source separation algorithm GCC-NMF to the multichannel blind source separation problem and proposes a new multichannel blind source separation algorithm: SRP-NMF. The algorithm first uses the SRP-PHAT algorithm to calculate each source signal’s arrival time difference to the microphone channel and locates and counts the source signal in the mixed signal. Then, combined with non-negative matrix factorization, the blind source separation algorithm is realized. This paper uses the WSJ0-2mix data set and the VCC data set to generated multichannel mixture signals in experiments. The experimental results indicate that, SRP-NMF has a better separation effect than other traditional algorithms, with high separation accuracy, and can maintain robustness to noise.Keywords: blind source separation; multi-channel source signal; non-negative matrix factorization; time difference of arrival0 引 言鸡尾酒会问题[1]是一个经典的盲源分离问题,其目的是从混合信号中将源信号分离出来。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
次加速 S P P R — HAT声 源 定 位算 法
(. 1 南京信息工程大学电子与信 息工程学 院, 南京 ,10 4 2 东南大学信息科学与工程学院 , 204 ; . 南京 ,1 0 6 20 9 )
二
乔 杰 李 致 金 赵 力
摘 要 : 于 可 控 功 率 响 应 和 相 位 变换 (teigrs o s o e—h s rnfr , R —HAT) 基 S er ep n e w rp aetasom S P P n p 的声 源 定 位 算 法
P T 类 算 法加 速 。 首先 , 过 垂 直 布 置 的 阵 列将 二 维空 问的 搜 索 转化 为一 维空 间的 搜 索 ; 次 , 用层 次搜 索 HA 通 其 采 策略 , 由粗 至精 对一 维 空 间进 行 搜 索 。仿 真 实验表 明 , 用该 方 法 可 以 节约 大量 的计 算 量 。 采 关 键 词 : 源 定位 ;RPP AT 算 法 ; 次加 速 声 S —H 二 中 图 分 类 号 : N9 2 T 1 文献 标识 码 : A
f r ( RP P AT ) h s hg o u t e s a d a c r c e p cal n n iy a d e h n io — om S — H a i h r b sn s n c u a y, s e il i os n c o e vr n y
( . o lg fElc r nca dI f r to gn e ig,Na j g Unv riyo no main 1 C l eo e to i n no main En ie rn e ni ie st fI fr t n o
S i c & T c n lg , nig 2 0 4 , hn ;2 S h o f n o mainS i c n c ne e e h oo y Na j , 1 0 4 C ia . c o l fr t c n ea d n o I o e E gn eig S u h a t i ri , nig 1 0 6 C ia n ie r , o t e s Unv s y Na j ,2 0 9 , hn ) n e t n Ab t a t I c o h n r a s a p ia i n, s u d s u c o a ia i n i a v t l m p r a t s r c : n mir p o e a r y p l to c o n o r e l c l t s i l i o t n z o a y p o l m. S u d s u c o a ia i n a g rt m a e n s e rn e p n e p we — h s r n — rbe o n o re l c l t lo i z o h b s d o te i g r s o s o r p a e ta s
第 2 卷第 6 6 期
21 年 1 月 01 1 数 据 采 集 Nhomakorabea与
处
理
V o .2 o 1 6 N .6 No v. 2 011
J u n lo t q iiin & P o esn o r a fDaaAc ust o r c sig
文章 编 号 : 0 4 9 3 ( 0 1 0 — 6 1 0 1 0—0 7 2 1 ) 60 8—5
a d s a c tae y n e r h s r t g .Two d me so a e r h s a e i f sl o v r e o o e d m e so a n — i n i n ls a c p c s i ty c n e t d t n — i n i n lo e r t e ir r h c s a c ta e y i a o t d i n — i n i n l e r h s a e i u a i n r s ls h n a h e a c i e r h s r t g d p e o e d me s o a a c p c .S m l to e u t s n s s o t a u k o o u a i n le p n e i a e y u i g t e n w l o i m . h w h ta b l fc mp t to a x e s s s v d b s n h e a g rt h Ke r s o n o r e l c l a i n;S y wo d :s u d s u c o a i to z RP— HAT l o ih ;t c c e e a i n P a g rt m wie a c lr to
me t n .Bu RP P tS ' HAT l o ih r q ie a g o p t to a g rt m e u r sl r et m u a i n,wh c i h rc mi g i p ih i a b g s o t o n n a — s
S u d So c c lz t o g r t o n ur e Lo a i a i n Al o ihm s d o Ba e n Twi e c
Ac e r t d S c l a e RP— e PHAT
QioJ e ,LiZ i n ,Zh oLi a i hf i a 。
具 有 较 高的 鲁 棒 性 和 准 确 性 , 别 是 在 强 噪 声 和 回 响 条件 下 。 S P P 特 但 R — HAT 类 算 法在 工程 应 用 中有 一 个 巨大 的 障碍 , 就 是 需要 较 大 的 运 算 量 。 为 了 解 决 该 问 题 , 文 从 阵 列 拓 扑 结 构 和 搜 索 策 略 两 个 方 向 出发 , S P 那 本 对 R