基于麦克风阵列的语音增强算法概述

合集下载

基于RLS自适应算法的麦克风阵列语音增强

基于RLS自适应算法的麦克风阵列语音增强
科 搭赢
信 息『 j 科学
刘 金 成
基于R S自 L 适应算法的麦克风阵列语音增强
( 宁工业大学 电子与信息工程学院 , 辽 辽宁 锦州 1 10 ) 2 0 1
摘 要 : 克 风 阵列 具 有 空 间 选择 特 性 与 高信 号增 益 特 性 , 麦 因而 成 为 非 手持 式 智 能 语 音 处 理 系统 中捕 捉说 话人 语 音 的重 要 手段 。 分析 了 两种 典型的 自适麦克风阵列语音增强 中的应用, L ) RL ) 并根据仿真的结果得 出结论。 关键词 : 麦克风 阵列 ; 自适应算法 ; 最小均方算法 ; 递归最小二次方算法
1概 述 进 了 经 典 G C算 法 中 S 在 电话视频 会议 、 多媒体设备 、 语音识别 由于加权矢量误差引起 等系统的声音拾取过程中,不可避免地会受到 的有 用 信 号 的 衰 减 问 外界环境噪声或其他说话人语音的干扰 。为了 题 。G C方法由于其结 S 寻求增强语音 、 去除背景噪声的有效方法 , 多年 构清晰 , 算法易于理解 , 以来 , 语音增强技术一直是人们关注的重点。 语 计 算 量 较 小 且 对 相 干 噪 音 增 强作 为 语 音 数 字信 号 处 理 的一 项 前 置 处 理 声 有 很 好 的 消 噪效 果 而 方案是抑制干扰的一种有效方法 ,为语音信号 被 广 泛 地 应 用 于 实 际 的其他应用提供 了基础和保障。 中 。 的语 音 增 强 实 现 方 目 , 前 基于单麦克风 的语音增 强方法 己取 案 中 即 采 用 了 经 典 的 得很大进展 , 其作为一种传统 的语音增强方法 , G C算法 ,并对其 自适 S 理论上相对比较成熟。 但是 , 由于单麦克风只拾 应滤波器模块进行 了针 取一路语音信号 ,致使其可用信息仅 限于时 / 对 实 际 实 现 的 改 进 , 取 :自 适应 F i I R 频信息 , 在强混响以及非平稳等复杂噪声环境 得 了较好的效果 。 图 IG C原 理 框 图 S 中的表现并不理想。针对这种情况 , 0世纪 广 义 旁 瓣 抵 自2 肖器是 自适 毳1 9 O年代以来 ,随着阵列信号处理理论的发展 , 应 波 束形 成 器 的一 种 通用 模 型 。 广 义旁 瓣 抵 消 步骤 l 初始 化 w 0j } =0 { =O 基 于麦克 风阵列 的语音增 强技术得 到广 泛重 系统如图 1 所示 , 它由上下两个处理模块组成 。 视 , 以多麦克风拾取多路语音信号 , 其 为语音增 上面的模块 中含有一个延迟 一相加波束形成单 更新 .=《 ; } ・l 强处理提供除时 , 频以外的空域信 息 ,弥补了 元 , 其加权系数是 固定的 , 其功能是非 自适应滤 单麦克风在这方面 的不足 ,成为 当前语音信号 波 : 步骤 2 J } T : 一X J y() c :Ar , x( ) z ( 1 ) 处理领域的研究热点 。 2基本算法设计 式 中 1 l ” , e- x, 1 { ∽J: ( -{J ' l _ + 4 i 波束形成 是经典 的麦克风阵列语 音增强 良2 A = 【。 , , 以, … mM一) 1 1 ] f 2 1 方法 ,其思想是通过麦克风阵列拾取 多路语音 f 一0 。) 信号并进行分析与处理 ,使阵列形成 的波束方 为简单起见 , 设该权系数 向量满足 向图主瓣对准 目标语音 ,零点”指 向干扰源 以 “ 算法初始化 , 0 fl A 1= 0 … 抑 制 干扰 信 号 , 而尽 可 能 地 获取 目标 语 音 。 从 其 【J j 高信 噪比时取 小的正 常数 中波束方向及波束主瓣宽度与麦克风 的间距 、 随后对输 出信号 y i 按事先设定的 cn) 低 信 嗓 比 时 取 小 的 正 常 数 数 目、 摆放位置、 声源入射角度 以及采样频率密 FR进 行 滤 波 I K I 切相关 。波束的形成不仅消除了使用单个 麦克 对 每一 时刻 , ,-I 1 2, 计 算 )( = f< 一 ) , ) ∑ i ( ‘ c yn 风时需人工调节麦克风指向的问题 ,而且 可以 使输 出语音的信噪 比大幅度提高 , 而无需人 从 下面的旁瓣抵消模块含有一个阻塞矩阵处 ( 一】 l h j+ f 【 1 j p 对 工干预亦可获得高质量 的语音。波束形成方法 理 单 元 和 一 个 自适 应 K阶 FR滤 波 器 单 元 组 。 I 又可细分为 固定波束形成 、自适应波束形成和 阻 塞 矩 阵处 理 单 元 的 目的 ,是 为 了 除去 注视 方 计 算 P” = —w 1 O) ({ 《 b 一 Ⅱ 具有后 置滤波器的波束形成方法三种 。使用 自 向上的信 号, 使其输 出只为干扰噪声 的组合。 由 适应波束形成来实现麦克风阵列语音增强。分 于 经过 时 间延 迟 补偿 后 ,各 麦 克 中所 含 注 视 方 一 i一 j 《 ㈨ ^l , . 析了两种典 型的 自适 应算法 :最小 均方算 法 向上的语音信号是完全同相的,所以只要阻塞 (MS和递归最小二次方算法(L ) L ) R S在麦克风 阵 矩 阵中每一行上 的元素之和为零 ,就可以保证 , ^ l ; _r .硒h f 1 一 l 一 列语音增强中的应用 , 并根据仿真的结果得 出 输 出中不含注视方向上的语音信号。经过阻塞 结论。 矩阵处理后 的信号为 yn t )= i 一 ) L n) , () 8 U() X() =B n 自适应波束形 成方法根据 输入信号 的统 由于 ( ) n 中只由干扰噪声组成,它不包 计特性 的变化来调 整滤波 器系数 ,使阵列 的 设 代表阻塞矩阵 B中的第 m行元素 向 含有注视方 向上的信号 , 以系统对于语音信 所 波束“ 零点” 向干扰噪声 的方 向, 高了阵列 量 , 指 提 则对 于所 有 用 m需 要 满 足 号的所有处理都包含于 )中。 这样 , 寻找滤 的适应 能力。最早 的 自适应波束形成的理论是 1= 0 … 波系数 ( 向量 , 系统的噪声输 出功率最 n ) 使 Fot 17 rs 于 9 2年提 出的 ,在此基础上 ,9 2年 18 1J 0 就等同于上述的带约束的优化问题 。 不过这 Gii 和 J r h f s i m提出了广义旁瓣抵消器(ee — G nr d 由于 彼此 是 线 性 独立 的 , 以 u( 最 多 小 , 所 n ) 里的求解问题变为无约束的 L MS问题 。 滤波系 i d SdlbsC ne e, 称 G C。 该 结 构 主 有 M一1 z ie e a cU r简 e 0 S) 个线性独立组 成元素 , 也就是 说 , 阻塞 数 的 自适 应 调 整公 式 为 要 由固定波束形成 、阻塞矩阵和多通道 噪声抵 矩 阵 B行 的维数一定是 M一 或更少 。 1

《基于麦克风阵列的语音增强研究》范文

《基于麦克风阵列的语音增强研究》范文

《基于麦克风阵列的语音增强研究》篇一一、引言随着智能设备的广泛应用,语音交互技术在多个领域取得了显著的发展。

为了提高语音交互的准确性和清晰度,语音增强技术变得越来越重要。

麦克风阵列技术作为一种有效的语音增强手段,得到了广泛的研究和应用。

本文将探讨基于麦克风阵列的语音增强研究,分析其原理、方法和应用前景。

二、麦克风阵列技术原理麦克风阵列是由多个麦克风组成的系统,通过分析和处理不同位置上麦克风采集到的信号,可以有效地抑制噪声、增强目标语音。

其工作原理主要包括波束形成、时延估计和相位校正等步骤。

(一)波束形成波束形成是麦克风阵列技术的核心部分,它通过将不同位置上的麦克风信号进行加权叠加,形成一个指向目标方向的波束。

这样可以有效地抑制来自其他方向的噪声,提高目标语音的信噪比。

(二)时延估计时延估计是麦克风阵列处理中的关键步骤之一。

通过估计不同麦克风之间的信号传输时延,可以确定声源的位置。

这有助于提高波束形成的准确性,进一步增强目标语音。

(三)相位校正相位校正是为了消除由于不同麦克风之间的传输路径差异导致的相位偏差。

通过对不同位置的麦克风信号进行相位校正,可以进一步提高语音增强的效果。

三、基于麦克风阵列的语音增强方法(一)基于波束形成的语音增强通过优化波束形成的算法和参数,可以有效地抑制噪声、增强目标语音。

常见的波束形成算法包括固定波束形成、自适应波束形成等。

这些算法可以根据不同的应用场景和需求进行选择和调整。

(二)基于多通道滤波的语音增强多通道滤波是一种基于频域的语音增强方法。

通过分析不同通道之间的信号差异,可以提取出目标语音并抑制噪声。

这种方法在处理复杂环境下的语音信号时具有较好的效果。

(三)基于深度学习的语音增强随着深度学习技术的发展,越来越多的研究者开始尝试将深度学习算法应用于麦克风阵列的语音增强中。

通过训练深度神经网络模型,可以有效地提取出目标语音的特征并抑制噪声。

这种方法在处理复杂环境下的语音信号时具有较高的准确性和鲁棒性。

《2024年基于麦克风阵列的语音增强研究》范文

《2024年基于麦克风阵列的语音增强研究》范文

《基于麦克风阵列的语音增强研究》篇一一、引言随着人们对音频质量要求的不断提高,语音增强技术逐渐成为音频处理领域的研究热点。

麦克风阵列技术作为一种有效的语音增强手段,通过多个麦克风的协同作用,可以实现对声源的定位、语音信号的分离以及语音增强的功能。

本文旨在研究基于麦克风阵列的语音增强技术,以期在复杂环境中实现高保真的语音识别与通讯。

二、麦克风阵列基本原理麦克风阵列是由多个麦克风按照一定规则排列而成的阵列系统。

其基本原理是通过不同麦克风接收到的信号之间的相位差和幅度差,结合阵列几何结构,实现对声源的定位和信号的分离。

麦克风阵列技术广泛应用于语音识别、语音增强、声源定位等领域。

三、基于麦克风阵列的语音增强方法基于麦克风阵列的语音增强方法主要包括声源定位、信号分离和后处理三个步骤。

1. 声源定位:通过多个麦克风的信号到达时间差和幅度差等信息,估计出声源的方向和距离。

声源定位是后续信号分离的基础。

2. 信号分离:在确定了声源位置后,采用适当的信号处理算法,如盲源分离、基于高阶统计的分离方法等,从混合信号中提取出目标语音信号。

这一步骤中,针对噪声环境和不同背景下的分离效果尤为关键。

3. 后处理:通过语音增益调整、噪声抑制等后处理技术,进一步提高语音信号的质量。

后处理环节可以有效消除背景噪声、回声等干扰因素,使语音信号更加清晰。

四、研究现状与挑战目前,基于麦克风阵列的语音增强技术在理论研究和实际应用方面都取得了显著的成果。

然而,在实际应用中仍面临诸多挑战。

如:如何提高声源定位的准确性、如何有效分离混合信号中的目标语音、如何处理不同环境下的噪声干扰等。

此外,随着人工智能和深度学习技术的发展,如何将先进的算法应用于麦克风阵列技术,提高语音增强的效果和效率,也是当前研究的重点。

五、研究方法与实验结果为了解决上述问题,本文采用深度学习算法与麦克风阵列技术相结合的方法进行语音增强研究。

首先,通过构建神经网络模型,实现对声源的精准定位和混合信号的有效分离;其次,利用深度学习算法对后处理环节进行优化,进一步提高语音质量;最后,通过实验验证了该方法的可行性和有效性。

基于麦克风阵列的语音增强算法概述

基于麦克风阵列的语音增强算法概述
21 0 1年 第 3期 ( 第 1 9期 ) 总 3
大 众 科 技
DA ZHoNG KE J
No 3, 01 . 2 1
( muaie o1 9 Cu lt l N .3 ) vy
基 于 麦 克 风 阵列 的语 音增 强算 法 概 述
丁 猛
( 军 医学研 究 所 ,上 海 2 0 3 海 0 4 3)
法 的基 本 框 架 ( 1 。 图 )
高 的信 号 增 益 与 较 强 的 抗 干 扰 能 力 等 特 点 ,逐 渐 成 为 强 噪 声 环 境 中语 音 增 强 的 研 究 热 点 。美 国 、 德 国 、法 国 、 意 大 利 、 日本 、香 港 等 国家 和 地 区 许 多科 学 家 都 在 开 展 这 方 面 的 研 究 工 作 ,并 且 已 经应 用 到 一 些 实 际 的 麦 克 风 阵 列 系 统 中 , 这 些
的 入射 信 号 获 得 最 大 增 益 。此 方 法 易 于 实现 , 但 要 想 获 取 较
如果噪声源 的数 目比麦克风数 目少 , 自适 应波束法能得
到 很 好 的 性 能 。但 是 随 着 干 扰 数 目的 增 加 和 混 响 的 增 强 , 自 适 应 滤 波器 的 降 噪性 能会 逐渐 降低 。
偿 ,使 得 各 路 输 出信 号 在 某 一 方 向上 保 持 同 步 , 并 在 该 方 向
中 占 主 导 地 位 。在 语 音 通 信 中 , 语 音 信 号 不 可 避 免 地 会 受 到 来 自周 围环 境 和 传 输 媒 介 的外 部 噪 声 、通 信 设 备 的 内 部 噪 声
及 其 他 讲 话 者 的 干 扰 。这 些 干扰 共 同作 用 ,最 终 使 听 者 获 得 的语 音 不 是 纯 净 的 原 始 语 音 , 而 是 被 噪 声 污 染 过 的 带 噪 声 语 音 ,严 重 影 响 了双 方 之 间 的 交 流 。 应 用 阵列 信 号 处 理 技 术 的麦 克 风 阵 列 能 够 充 分 利 用 语 音 信 号 的 空 时 信 息 ,具 有 灵 活 的波 束 控 制 、较 高 的 空 间分 辨 率 、

基于麦克风阵列的语音增强算法研究

基于麦克风阵列的语音增强算法研究

第29卷第3期 2021年6月Vol.29 No.3Jun. 2021电脑与信息技术Computer and Information Technology文章编号:1005-1228(2021)03-0039-04基于麦克风阵列的语音增强算法研究于春和,马 跃(沈阳航空航天大学 电子信息工程学院,辽宁 沈阳 110136)摘 要:语音通信为最普通的一种通信模式,在我们的日常生活中发挥着极为关键的效果。

然而,在客观场景内,声音势必会因噪音而产生影响。

此类噪声与干扰不但会影响声音的可知性,还使声音处理系统的性能急剧恶化。

但是,在现实环境中,声音受到噪音和干扰是不可避免的。

这些噪声和干扰不仅影响声音的可知性,还使声音处理系统的性能急剧恶化。

麦克风阵列语音增强为语音增强中最普遍的一种模式。

文章具体讲解了几类比较普遍的麦克风阵列增强算法以及语音扩展算法的仿真处理结果,语音扩展算法可以从噪音声音中尽可能地提取清晰的声音,从而提高语音质量和主观舒适性。

关键词:麦克风阵列;语音增强;语音扩展算法中图分类号:TN912 文献标识码:AResearch on Speech Enhancement Algorithm Based on Microphone ArrayYU Chun-he, MA Yue( College of Electronic Information Engineering, Shenyang Aerospace University, Shenyang 110136, China )Abstract:Voice communication is the most basic way of communication and plays a very important role in People's Daily life.However, in the real world, sound is inevitably affected by noise and interference.These noises and disturbances not only affect the intelligibility of sound, but also make the performance of sound processing system deteriorate rapidly.However, in the real environment, it is inevitable that the sound is subjected to noise and interference.These noises and disturbances not only affect the intelligibility of sound, but also make the performance of sound processing system deteriorate rapidly.Microphone array speech enhancement is one of the most commonly used methods in speech enhancement. This paper introduces several commonly used microphone array speech enhancement algorithms and the simulation results of speech expansion algorithms. The speech expansion algorithm can extract as clear a sound as possible from the noise sound, so as to improve the speech quality and subjective comfort.Key words: microphone array; speech enhancement; speech expansion algorithm收稿日期:2020-11-11作者简介:于春和(1976-),男,辽宁绥中人,副教授,博士,主要研究方向:信息获取与处理;马跃(1996-),男,辽宁辽阳人,硕士研究生,主要研究方向:信息获取与处理。

语音信号处理中的麦克风阵列设计与信号增强算法研究

语音信号处理中的麦克风阵列设计与信号增强算法研究

语音信号处理中的麦克风阵列设计与信号增强算法研究第一章:介绍随着科技的进步和应用场景的不断拓展,语音信号处理在语音识别、语音合成、自然语言处理、语音通讯等方面的应用也越来越广泛。

麦克风阵列作为一种重要的语音采集设备,具备广泛的应用前景。

对麦克风阵列进行优化设计和信号增强算法的研究,对于提高语音识别和通讯质量具有重要意义。

本文就麦克风阵列的设计以及信号增强算法的研究进行探讨。

第二章:麦克风阵列设计2.1 麦克风阵列的原理和类型麦克风阵列是由多个麦克风按照一定的规律布置形成的,在语音信号采集时可达到降噪、抑制回声等效果。

麦克风阵列按照几何形状可以分为线性阵列、圆形阵列、矩形阵列等多种类型。

2.2 麦克风阵列的参数设计麦克风阵列的参数设计包括麦克风数目、麦克风的位置和间距等方面。

例如,麦克风距离的确定、错误安置麦克风可能导致降噪和定位错误等问题。

2.3 麦克风阵列的信号处理麦克风阵列采集来的信号需要进行信号处理,在这个过程中,需要考虑到语音增强、人声检测、信号分离、降噪、回声抑制等多方面问题。

第三章:信号增强算法研究3.1 基于卷积神经网络的语音增强算法研究卷积神经网络作为深度神经网络的一种,已经被广泛应用于音频和语音信号的处理。

基于卷积神经网络的语音增强算法,可以有效地处理语音信号的噪声,提高语音信号的识别准确率和可理解性。

3.2 基于小波变换的人声检测算法研究人声检测是基于语音增强的重要步骤,也是语音信号处理的难点之一。

基于小波变换的人声检测算法,通过消除语音信号的非人声成分,从而提取出更加纯净和准确的人声信号,进一步提高语音识别的准确率和可理解性。

3.3 基于矩阵分解的信号分离算法研究信号分离是语音增强的重要技术之一,也是语音信号处理的难题。

基于矩阵分解的信号分离算法,可以从多声源混合的语音信号中分离出单一语音信号,进一步提高语音信号识别和理解的准确率和可靠性。

3.4 基于小波变换和快速傅里叶变换的降噪算法研究噪声是语音信号处理中的重大问题,如何减少噪声对语音信号的干扰是语音增强的重要技术之一。

《基于麦克风阵列的语音增强研究》范文

《基于麦克风阵列的语音增强研究》范文

《基于麦克风阵列的语音增强研究》篇一一、引言随着人们对音频质量要求的不断提高,语音增强技术在现代通信、语音识别、语音合成等领域的应用变得越来越重要。

麦克风阵列作为一种能够接收多方向声音的装置,对于语音增强的效果起着关键的作用。

本文将基于麦克风阵列的语音增强研究进行详细介绍。

二、麦克风阵列的基本原理麦克风阵列由多个麦克风组成,通过接收不同位置的声音信号,利用信号处理技术对声音进行定位、滤波和增强等处理。

其基本原理包括声波传播、麦克风信号采集和信号处理三个部分。

声波传播过程中,声音以声波的形式传播到麦克风阵列,不同位置的麦克风接收到不同强度的声音信号。

麦克风信号采集部分负责将接收到的声音信号转换成电信号,然后通过信号处理技术对电信号进行处理。

三、基于麦克风阵列的语音增强技术基于麦克风阵列的语音增强技术主要包括波束形成、噪声抑制、回声消除和语音分离等方面。

1. 波束形成波束形成是麦克风阵列中最重要的技术之一,其目的是通过加权和延迟处理不同麦克风的信号,使得在特定方向上的声音信号得到增强,而在其他方向上的噪声信号得到抑制。

常见的波束形成算法包括相位敏感波束形成和相位无关波束形成等。

2. 噪声抑制噪声抑制是语音增强中必不可少的部分,其目的是在保证语音清晰度的前提下,尽可能地减少背景噪声的影响。

基于麦克风阵列的噪声抑制技术可以通过多通道噪声抑制算法,对不同位置的麦克风信号进行独立处理,从而实现更高效的噪声抑制效果。

3. 回声消除回声消除是解决在语音通信过程中由于传输路径或扬声器等设备引起的回声问题的重要技术。

基于麦克风阵列的回声消除技术可以通过估计回声路径并利用滤波器消除回声。

同时,也可以利用麦克风阵列中的多个麦克风来识别并抑制回声信号。

4. 语音分离语音分离的目的是将混合声音中的各个语音分离出来,以实现更好的语音识别效果。

基于麦克风阵列的语音分离技术可以通过对不同位置的麦克风信号进行时空域处理和频域分析等方法,实现多个语音信号的有效分离。

基于麦克风阵列的语音增强方法研究

基于麦克风阵列的语音增强方法研究

基于麦克风阵列的语音增强方法研究付仕明重庆第二师范学院ꎬ重庆400065摘要:在万物互联的今天ꎬ声音或语音用户接口在手机㊁平板电脑㊁可穿戴设备和其他智能设备上变得越来越普遍ꎮ基于阵列的麦克风语音增强技术是一种通过多路语音信号分析与处理拾取技术ꎬ利用语音信号的空间相位信息来实现语音信号增强的一种技术ꎮ本文主要介绍了各种采用阵列算法的麦克风语音增强方式及其相应算法的基本原理ꎬ并归纳各方法的特性及其适用的声音环境参数ꎮ关键词:麦克风阵列ꎻ语音增强ꎻ信号处理中图分类号:TN912.30引言人类社会已经进入21世纪的第三个十年ꎬ云计算㊁物联网㊁大数据和人工智能迅猛发展㊁日新月异ꎬ目前正值人工智能驱动的第四次工业革命发展的巅峰ꎮ人机交互已由鼠标键盘走向智能手机㊁Pad等多点触摸ꎮ以机器为中心的人机交互逐渐发展为以人为中心的自然交互ꎮ据不完全统计ꎬ目前已有数百万人依赖自动语音识别技术将语音转换为文字ꎬ但自动语音识别的质量主要依赖于一些最优条件ꎬ即使每个人的说话方式与声音训练数据非常类似ꎬ讲话时也处在安静的环境中ꎬ仍需要工作人员来修改文字错误㊁标点以及语法错误ꎬ还可能存在其他类型的翻译错误ꎮ因此ꎬ语音技术的持续改进对于提升设备对人类语言的识别准确度非常有必要ꎬ在手机㊁智能设备应用以及诸如汽车这样嘈杂的环境中ꎬ提升语音增强和识别准确度对实现语音识别至关重要ꎮ麦克风阵列融合了语音信号的空时信息ꎬ具有灵活的波束控制㊁较高的空间分辨率㊁高的信号增益与较强的抗干扰能力等特点ꎬ在智能车载㊁智能家居㊁手机㊁平板电脑㊁机器人㊁可穿戴设备上的应用随处可见ꎬ因而基于Beamforming技术的麦克风语音阵列技术成为人工智能时代语音处理算法的研究热点ꎮ1麦克风阵列技术的研究现状20世纪七八十年代ꎬ基于Beamforming的阵列技术开始应用到语音技术的研究ꎮ1985年Flanagan将麦克风阵列应用到室内大空间封闭环境的语音增强中ꎮ20世纪80年代Silverman将麦克风阵列语音算法应用到话音识别系统中ꎬ20世纪90年代年又将基于阵列Beamforming的数字信号处理算法应用到移动终端的语音获取ꎮ在1996年ꎬSilverman和Brandstein创造性的将阵列算法应用到复杂环境下的声源定位中ꎬ具有里程碑的意义ꎮ日本的Fasano等科学家也提出了一种复杂语音环境下基于空间的近场声源算法ꎬ应用与近场的模糊定位问题ꎬ但其准确性和对距离的分辨率都较低ꎮ美国的Chen㊁JoeC等人提出了一种新算法ꎬ应用极大似然估计算来实现高精度的声源位置定位ꎮ在国内ꎬ早期主要将麦克风阵列用在视频监控等方向ꎬ如海康威视等公司都有相关产品ꎮ如今ꎬ麦克风阵列已广泛应用于各种音频视频会议㊁语音识别及增强等领域ꎮ如科大讯飞㊁海思半导体等公司都有基于双麦克风阵列语音的硬件产品ꎮ76应用电子技术㊀㊀㊀㊀㊀㊀㊀㊀基金项目:重庆市教育委员会科学技术研究项目(KJQN201801611)ꎮ㊀2019年第11期㊀㊀2麦克风阵列语音增强方法2.1基于延时—求和算法的波束麦克风阵列语音增强技术㊀㊀1985年美国科学家Flanagan首次提出采用延时 求和(delayandsum)算法来实现Beamforming波束形成ꎬ通过精确测量声源到每个麦克风的延时ꎬ实现精确延时控制补偿ꎬ使得各个麦克风拾取的信号在某一方向上能够保持同步ꎬ然后加权㊁求和ꎬ最后输出ꎮ该类麦克风阵列语音增强方法易于实现ꎬ但是需要增加麦克风的数目才能较好的提高噪声抑制能力ꎮ这种方法适合消除相干噪声或散射噪声ꎬ但是不能抑制非相干噪声ꎬ在复杂环境下ꎬ适应性也较差ꎬ因此ꎬ实际工程中很少单独使用ꎮ2.2基于自适应Beamforming波束形成算法的麦克风阵列语音增强方法㊀㊀基于自适应Beamforming波束形成算法在强相干环境下ꎬ并且噪声源的数量少于阵列中麦克风数量时能实现较好的消噪效果ꎮ最早出现的自适应Beamforming波束形成算法是在20世纪70年代由Frost提出ꎬ是基于线性约束最小方差的自适应波束形成的一种全新算法ꎮ因此ꎬ该波束形成器也被称为Frost波束形成器ꎬ其基本思想是在某些特定方向ꎬ并且该信号的有效增益一定的情况下ꎬ通过约束阵列算法使输出信号的输出功率达到最小ꎬ从而实现噪声抑制的目的ꎮ这种算法得到较高改善信噪比ꎬ但当干扰声源数量增加和混响增强ꎬ信噪比会迅速变差ꎮ1982年Griffiths和Jim在线性约束最小方差自适应波束形成器的基础上提出了一种新的算法 广义旁瓣消除器ꎬ其成为许多衍生算法的基本框架ꎮ基于广义旁瓣的噪声消除算法在麦克风阵列语音增强技术中是最常用的一种基本算法ꎮ该算法让叠加了噪声的有效语音信号同时通过非自适应通道和自适应通道ꎬ在有用信号中滤除噪声参考信号ꎬ该参考噪声信号被自适应通道中的阻塞矩阵滤除掉ꎮ自适应滤波器根据参考信号来估计噪声信号ꎬ再由该估计的噪声信号来抵消掉非自适应通道中的噪声分量ꎬ从而得到有用的并且滤除掉噪声的有效语音信号ꎮ系统只有在麦克风的数量多余干扰噪声源数量的时候ꎬ基于自适应波束算法的降噪算法才能达到较好的消噪效果ꎮ但对于非相干噪声或弱相干噪声ꎬ自适应滤波器的降噪性能会随着相干性减弱而性能降低ꎮ2.3基于后置滤波结构的麦克风阵列语音增强方法㊀㊀后置滤波可去除声学环境中的非相干噪声ꎬ将波束形成器的输出信号通过后置滤波器从而进一步提高输出信号的信噪比ꎮ1977年Allen针对自适应波束形成器在某些场景下降噪性能差的问题将Weiner滤波器和自适应波束形成方法相结合ꎬ1988年Zelinski对Allen提出的算法加以了扩展ꎬ提出一种采用后置滤波的麦克风阵列语音增强方法ꎮ1996年Fischer和Simmer采用GSC和Wiener滤波结合的基于频域处理的麦克风阵列语音增强算法ꎮ2003年Gannot和Cohen提出采用GSC和后置滤波的频域麦克风阵列语音增强方法ꎮ该算法能够有效地去除非相干噪声ꎬ还能够在噪声环境复杂的声学环境下达到理想的降噪效果ꎮ其原理是:首先假设各个麦克风拾取到的有效声音信号相同ꎬ接收到的无用干扰噪声信号独立并且同分布ꎬ信号和噪声没有相关性ꎬ根据噪声的频谱特性ꎬ依据算法实时的更新滤波器权系数ꎬ再对所接收到数据进行滤波ꎬ从而达到降噪的目的ꎮ后置滤波方法也存在明显的缺点:算法的性能对时延非常敏感ꎬ降噪后的语音信号会出现非线性失真ꎬ对不同方向的强干扰噪声的抑制效果也不佳ꎮ2.4基于信号子空间的麦克风语音阵列增强算法㊀㊀信号子空间算法是通过计算语音信号的协方差矩阵ꎬ或者计算语音信号的自相关函数矩阵ꎬ并进行奇异值分解ꎬ将带噪声语音信号划分为两个子空间ꎬ噪声子空间和有用信号子空间ꎮ利用有用信号子空间对语音信号进行重新构建ꎬ从而得到增强后的语音信号ꎮF.Jabloun将一维的信号子空间增强方法运用到多维的阵列语音信号增强处理上ꎬ取得了比单麦克风更好的消噪效果ꎮ日本学者Asano等提出的基于麦克风阵列接收信号相干矩阵子空间的麦克风阵列语音增强方法是一种有效降低环境噪声的有效算法ꎮ该方法将200~4000Hz语音信号根据等响曲线划分为不同语音频带ꎬ再利用每个频带的有效语音信息ꎬ并结合等响曲线处理各子空间语音信号ꎮ基于子空间的麦克风阵列语音增强算法的降噪性能受各个噪声源是否相关的影响较小ꎬ非常适合远场复杂环境下的语音降噪ꎬ在非相干和相干噪声场中86㊀㊀㊀㊀㊀㊀㊀㊀应用电子技术㊀㊀2019年第11期㊀均有一定的消噪效果ꎬ但是其运算复杂度更高ꎬ实现实时处理比较困难ꎬ受限于DSP芯片的处理速度ꎮ2.5基于盲信号分离的麦克风阵列语音增强方法㊀㊀法国学者Herault和Jutten在20世纪80年代就已经提出了盲信号算法ꎬ从多个观测到的混合信号中分析没有观测的原始信号ꎮ盲信号分离是根据噪声信号与输入源语音信号的统计特性ꎬ从麦克风阵列接收到的混合信号中提取出有效的各个独立分量的过程ꎮ经过国内外科研工作者几十年来的深入研究ꎬ盲信号分离技术目前已经取得了阶段性的成果ꎬ对盲信号分离问题的研究从最初的瞬时混迭模型ꎬ发展到现在的基于非线性语音瞬时混迭模型和线性语音的卷积模型ꎬ有效地提高了复杂远场环境的降噪能力ꎮ但是ꎬ由于盲信号分离仍然是一个新兴的研究方向ꎬ虽然有很多创新和进步ꎬ但该算法运算量非常庞大ꎬ稳定性和降噪的收敛性还有很大的进步空间爱你ꎬ距离实际应用还为时尚早ꎮ2.6算法比较基于延时 求和波束的麦克风阵列语音增强方法ꎬ结构简单ꎬ对相干噪声有明显的消除ꎬ但对相干噪声的抑制能力十分有限ꎮ基于自适应波束形成的麦克风Beamforming阵列语音增强算法ꎬ比较适合于时变的声学环境ꎬ对相干噪声有明显的消除效果ꎬ但不能消除非相干噪声ꎻ基于后置滤波结构的麦克风Beamforming阵列语音增强方法ꎬ算法简单ꎬ计算复杂度低ꎬ可有效抑制非相干噪声ꎬ但增强后的语音信号存在一定的非线性失真ꎻ基于不同频段子空间的麦克风阵列语音增强方法ꎬ对阵元的增益和位置误差不敏感ꎬ计算量大ꎬ很难实现实时性ꎻ基于盲信号分离的麦克风阵列语音增强方法ꎬ分离效果较好ꎬ复杂度就比较高ꎮ麦克风阵列语音增强方法有很多种ꎬ要有效地消除噪声ꎬ需要多种算法取长补短ꎮ3结论宽带的非平稳信号的语音信号在传输过程中不可避免地会收到各种噪声的干扰ꎬ而在我们的生活中ꎬ语音识别越来越广泛地应用ꎮ语音降噪㊁分离和解混响时语音增强的三个重要内容ꎬ基于麦克风阵列的语音增强技术能够较好地解决采用单麦克风在强混响环境以及非平稳噪声场情况下干扰抑制效果不理想的情况ꎮ越来越多的学者和科研人员设计合适的麦克风阵列结构及最佳算法ꎬ研究基于麦克风阵列的语音增强解决方案和相关产品ꎬ助力信息化时代的建设ꎮ参考文献[1]L.J.GriffithsandC.W.Jim.Analternativeapproachtolinearlyconstrainedadaptivebeamforming.IEEETrans.AntennasPropagationꎬ1982(30):27 ̄34.[2]闫姝ꎬ权建军.基于麦克风阵列的语音增强算法研究.自动化仪表ꎬ2019(9):59 ̄62.[3]罗瀛ꎬ曾庆宁ꎬ龙超.多噪声环境下双微阵列语音增强算法[J].计算机应用ꎬ2019(8):2426 ̄2430.[4]戴红霞ꎬ唐於烽ꎬ赵力.基于维纳滤波与理想二值掩蔽的数字助听器语音增强算法[J].电子器件ꎬ2019(4). [5]陈楠ꎬ鲍长春.基于双耳线索编码原理的语音增强方法[J].电子学报ꎬ2019(1):227 ̄233.96应用电子技术㊀㊀㊀㊀㊀㊀㊀㊀㊀2019年第11期㊀㊀。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

- 29 -基于麦克风阵列的语音增强算法概述丁 猛(海军医学研究所,上海 200433)【摘 要】麦克风阵列语音增强技术是将阵列信号处理与语音信号处理相结合,利用语音信号的空间相位信息对语音信号进行增强的一种技术。

文章介绍了各种基于麦克风阵列的语音增强基本算法,概述了各算法的基本原理,并总结了各算法的特点及其所适用的声学环境特性。

【关键词】麦克风阵列;阵列信号处理;语音增强 【中图分类号】TN911.7 【文献标识码】A 【文章编号】1008-1151(2011)03-0029-02(一)引言在日常生活和工作中,语音通信是人与人之间互相传递信息沟通不可缺少的方式。

近年来,虽然数据通信得到了迅速发展,但是语音通信仍然是现阶段的主流,并在通信行业中占主导地位。

在语音通信中,语音信号不可避免地会受到来自周围环境和传输媒介的外部噪声、通信设备的内部噪声及其他讲话者的干扰。

这些干扰共同作用,最终使听者获得的语音不是纯净的原始语音,而是被噪声污染过的带噪声语音,严重影响了双方之间的交流。

应用阵列信号处理技术的麦克风阵列能够充分利用语音信号的空时信息,具有灵活的波束控制、较高的空间分辨率、高的信号增益与较强的抗干扰能力等特点,逐渐成为强噪声环境中语音增强的研究热点。

美国、德国、法国、意大利、日本、香港等国家和地区许多科学家都在开展这方面的研究工作,并且已经应用到一些实际的麦克风阵列系统中,这些应用包括视频会议、语音识别、车载声控系统、大型场所的记录会议和助听装置等。

文章将介绍各种麦克风阵列语音增强算法的基本原理,并总结各个算法的特点及存在的局限性。

(二)常见麦克风阵列语音增强方法1.基于固定波束形成的麦克风阵列语音增强固定波束形成技术是最简单最成熟的一种波束形成技术。

1985年美国学者Flanagan 提出采用延时-相加(Delay-and-Sum)波束形成方法进行麦克风阵列语音增强,该方法通过对各路麦克风接收到的信号添加合适的延时补偿,使得各路输出信号在某一方向上保持同步,并在该方向的入射信号获得最大增益。

此方法易于实现,但要想获取较高的噪声抑制能力则需要增加麦克风数目,然而对非相干噪声没有抑制能力,环境适应性差,因此实际中很少单独使用。

后来出现的微分麦克风阵列(Differential Microphone Arrays)、超方向麦克风阵列(Superairective Microphone Arrays )和固定频率波束形成(Frequency-Invariant Beamformers) 技术也属于固定波束形成。

2.基于自适应波束形成器的麦克风阵列语音增强自适应波束形成是现在广泛使用的一类麦克风阵列语音增强方法。

最早出现的自适应波束形成算法是1972年由Frost 提出的线性约束最小方差(Linearly Constrained Minimum Variance,LCMV)自适应波束形成器。

其基本思想是在某方向有用信号的增益一定的前提下,使阵列输出信号的功率最小。

在线性约束最小方差自适应波束形成器的基础上,1982年Griffiths 和Jim 提出了广义旁瓣消除器(Generalized Sidelobe Canceller, GSC),成为了许多算法的基本框架(图1)。

图1 广义旁瓣消除器的基本结构广义旁瓣消除器是麦克风阵列语音增强应用最广泛的技术,即带噪声的语音信号同时通过自适应通道和非自适应通道,自适应通道中的阻塞矩阵将有用信号滤除后产生仅包含多通道噪声参考信号,自适应滤波器根据这个参考信号得到噪声估计,最后由这个被估计的噪声抵消非自适应通道中的噪声分量,从而得到有用的纯净语音信号。

如果噪声源的数目比麦克风数目少,自适应波束法能得到很好的性能。

但是随着干扰数目的增加和混响的增强,自适应滤波器的降噪性能会逐渐降低。

3.基于后置滤波的麦克风阵列语音增强1988年Zelinski 将维纳滤波器应用在麦克风阵列延时—相加波束形成的输出端,进一步提高了语音信号的降噪效果,提出了基于后置滤波的麦克风阵列语音增强方法(图2)。

基于后置滤波的方法在对非相干噪声抑制方面,不仅具有良好的效果,还能够在一定程度上适应时变的声学环境。

它的基本原理是:假设各麦克风接收到的目标信号相同,接收到的噪声信号独立同分布,信号和噪声不相关,根据噪声特性,【收稿日期】2010-12-30【作者简介】丁猛(1983-),男,海军医学研究所研究实习员。

- 30 -依据某一准则实时更新滤波器权系数,对所接收到数据进行滤波,从而达到语音增强的目的。

图2 结合后置滤波的固定波束形成器后置滤波方法存在以下不足:首先,算法的性能受到时延误差的影响,使增强后的语音信号有一定失真;其次,该方法对方向性的强干扰抑制效果不佳。

后置滤波方法极少单独使用,常与其他方法联合使用。

4.基于近场波束形成的麦克风阵列语音增强当声源位于麦克风阵列近场(即阵列的入射波是球面波)情况下,声波的波前弯曲率不能被忽略,如果仍然把入射声波作为平面波考虑,采用常规的波束形成方法来拾取语音信号,那么麦克风阵列系统输出效果会很不理想。

解决这个问题最直接的方法就是根据声源位置和近场声学的特性,对入射声波进行近场补偿,但是这种方法需要已知声源位置,这在实际应用中难以满足。

由于近场声学的复杂性,目前有关近场波束形成麦克风阵列语音增强方法的研究相对较少。

5.基于子空间的麦克风阵列语音增强子空间方法的基本思想是计算出信号的自相关矩阵或协方差矩阵,然后对其进行奇异值分解,将带噪声语音信号划分为有用信号子空间和噪声子空间,利用有用信号子空间对信号进行重构,从而得到增强后的信号。

由Asano 等提出的基于相干子空间的麦克风阵列语音增强方法是一种典型的子空间方法。

该方法首先将语音信号划分到不同频带,然后在每个频带再利用空间信息,进行子空间处理。

基于子空间的麦克风阵列语音增强方法虽然降噪性受噪声场是否相关影响较小,在相干和非相干噪声场中均有一定的消噪效果,但是由于计算量较大,实现实时处理具有一定困难。

6.基于盲源分离的麦克风阵列语音增强在很多实际应用中,信号源情况和信道的传递参数都很难获取,盲源分离技术(Blind Source Separation,BSS)就是在这种需求下提出的。

盲源分离是根据输入源信号和干扰的统计特性,从传感器阵列接收到的混合信号中提取出各个独立分量的过程。

法国学者Herault.J 和Jutten.C 在信源与信道先验条件未知的情况下,利用人工神经网络分离出了有用信号,开创了盲源分离的先河。

目前为止,已有许多学者将盲源分离技术应用于麦克风阵列语音增强。

经过二十多年来国内外学者的不断深入研究,盲源分离技术已经取得了巨大的进步和发展,对盲信号分离问题的研究己经从瞬时混迭模型扩展成为线性卷积模型和非线性瞬时混迭模型,然而由于盲源分离仍属一个新兴的研究方向,理论上还不成熟,这类方法一般运算量大,全局收敛性和渐进稳定性有待加强,距离实际应用有一段距离。

7.其他方法90年代以来,一些学者将各种信号处理算法与麦克风阵列技术相融合,各种语音增强算法不断涌现,诸如倒谱分析、小波变换、神经网络、语音模型等方法已经在语音信号处理领域得到应用。

虽然这些方法从不同角度对语音增强系统的性能进行了不同程度的改善,但大多计算量庞大,不适合时变性较强的声学环境,而且在需要实时处理的场合,对硬件的要求也将大大提高。

近年来国内一些高校,如清华大学、大连理工大学、电子科技大学、西安电子科技大学等也做了一些关于麦克风阵列技术的研究工作,取得了一定的研究成果。

张丽艳等提出一种改进的麦克风阵列倒谱域语音去混响方法,改善混响环境下的语音质量。

崔玮玮等提出一种基于一阶差分麦克风阵列的实时噪声谱估计和抵消方法,提高输出信噪比的同时降低了计算量。

曾庆宁等将阵列交叉串扰信号的自适应噪声抵消方法应用于麦克风阵列语音增强,适用于在多种噪声环境中实时实现。

(三)结论语音信号增强是诸如智能控制、办公自动化、多媒体消费品等领域的关键技术之一,将麦克风阵列技术应用于语音增强,能够取得传统单麦克风难以达到的增强效果。

语音信号作为一种宽带的非平稳信号,在传输过程中不可避免地会受到各种噪声的干扰,所以采用麦克风阵列系统时需满足在一个比较宽的声域范围抑制各种噪声干扰,减少语音的失真,同时也要降低系统成本和计算时间,以达到较好的实时性和实用性。

在实际应用中应根据具体的使用环境的噪声特性,设计合适的麦克风阵列结构,选择最佳的算法及其具体的实现形式。

【参考文献】[1] Flanagan J L, Johnston D J, Zahn R, et al. Computer-steeredmicrophone arrays for sound transduction in large rooms[J].Journal of Acoustical Society of American, 1985,78(5).[2] O.L.Frost.An algorithm for linearly-constrained adaptive arrayprocessing[J].Proc.IEEE,1972,60(8).[3] L. J. Griffiths, C. W. Jim. An alternative approach to linearlyconstrained adaptive beamforming[J]. IEEE Trans.On Antennas and Propagation. 1982,30(1).[4] Khalil F, Jullien J P, Crilloire A. Microphone array for soundpickup in teleconference systems[J].Audio Engineering Society,1994,42( 9).[5] 张丽艳,等.一种适用于混响环境的麦克风阵列语音增强方法[J].信号处理,2009,25(5).。

相关文档
最新文档