解密回声消除技术汇总

解密回声消除技术汇总
解密回声消除技术汇总

因为工作的关系,笔者从2004年开始接触回声消除(Echo Cancellation)技术,而后一直在某大型通讯企业从事与回声消除技术相关的工作,对回声消除这个看似神秘、高端和难以理解的技术领域可谓知之甚详。

要了解回声消除技术的来龙去脉,不得不提及作为现代通讯技术的理论基础——数字信号处理理论。首先,数字信号处理理论里面有一门重要的分支,叫做自适应信号处理。而在经典的教材里面,回声消除问题从来都是作为一个经典的自适应信号处理案例来讨论的。既然回声消除在教科书上都作为一种经典的具体的应用,也就是说在理论角度是没有什么神秘和新鲜的,那么回声消除的难度在哪里?为什么提供回声消除技术(不管是芯片还是算法)的公司都是来自国外?回声消除技术的神秘性在哪里?

二、回声消除原理

从通讯回音产生的原因看,可以分为声学回音(Acoustic Echo)和线路回音(Line Echo),相应的回声消除技术就叫声学回声消除(Acoustic Echo Cancellation,AEC)和线路回声消除(Line Echo Cancellation, LEC)。声学回音是由于在免提或者会议应用中,扬声器的声音多次反馈到麦克风引起的(比较好理解);线路回音是由于物理电子线路的二四线匹配耦合引起的(比较难理解)。

回音的产生主要有两种原因:

1.由于空间声学反射产生的声学回音(见下图):

图中的男子说话,语音信号(speech1)传到女士所在的房间,由于空间的反射,形成回音speech1(Echo)重新从麦克风输入,同时叠加了女士的语音信号(speech2)。此时男

子将会听到女士的声音叠加了自己的声音,影响了正常的通话质量。此时在女士所在房间应用回音抵消模块,可以抵消掉男子的回音,让男子只听到女士的声音。

2.由于2-4线转换引入的线路回音(见下图):

在ADSL Modem和交换机上都存在2-4线转换的电路,由于电路存在不匹配的问题,会有一部分的信号被反馈回来,形成了回音。如果在交换机侧不加回音抵消功能,打电话的人就会自己听到自己的声音。

不管产生的原因如何,对语音通讯终端或者语音中继交换机需要做的事情都一样:在发送时,把不需要的回音从语音流中间去掉。

试想一下,对一个至少混合了两个声音的语音流,要把它们分开,然后去掉其中一个,难度何其之大。就像一瓶蓝墨水和一瓶红墨水倒在一起,然后需要把红墨水提取出来,这恐怕不可能了。所以回声消除被认为是神秘和难以理解的技术也就不奇怪了。诚然,如果仅仅单独拿来一段混合了回音的语音信号,要去掉回音也是不可能的(就算是最先进的盲信号分离技术也做不到)。但是,实际上,除了这个混合信号,我们是可以得到产生回音的原始信号的,虽然不同于回音信号。

我们看下面的AEC声学回声消除框图(本图片转载)。

Figure Acoustic Echo Cancellation in a voice communication terminal

其中,我们可以得到两个信号:一个是蓝色和红色混合的信号1,也就是实际需要发送的speech和实际不需要的echo混合而成的语音流;另一个就是虚线的信号2,也就是原始的引起回音的语音。那大家会说,哦,原来回声消除这么简单,直接从混合信号1里面把把这个虚线的2减掉不就行了?请注意,拿到的这个虚线信号2和回音echo是有差异的,直接相减会使语音面目全非。我们把混合信号1叫做近端信号ne,虚线信号2叫做远端参考信号fe,如果没有fe这个信号,回声消除就是不可能完成的任务,就像“巧妇难为无米之炊”。

虽然参考信号fe和echo不完全一样,存在差异,但是二者是高度相关的,这也是echo 称之为回音的原因。至少,回音的语义和参考信号是一样的,也还听得懂,但是如果你说一句,马上又听到自己的话回来一句,那是比较难受的。既然fe和echo高度相关,echo又是fe引起的,我们可以把echo表示为fe的数学函数:echo=F(fe)。函数F被称之为回音路径。在声学回声消除里面,函数F表示声音在墙壁,天花板等表面多次反射的物理过程;在线路回声消除里面,函数F表示电子线路的二四线匹配耦合过程。很显然,我们下面要做的工作就是求解函数F。得到函数F就可以从fe计算得到echo,然后从混合信号1里面减掉echo就实现了回声消除。

尽管回声消除是非常复杂的技术,但我们可以简单的描述这种处理方法:

1、房间A的音频会议系统接收到房间B中的声音

2、声音被采样,这一采样被称为回声消除参考

3、随后声音被送到房间A的音箱和声学回声消除器中

4、房间B的声音和房间A的声音一起被房间A的话筒拾取

5、声音被送到声学回声消除器中,与原始的采样进行比较,移除房间B的声音

求解回音路径函数F的过程恐怕就是比较难以表达的数学公式了。鉴于通俗表达数学公式的难度比发现数学公式还难,笔者就不费力解释了。下面这段表达了利用自适应滤波器原理求解函数F的过程。(以下可以跳过)

自适应滤波器

自适应滤波器是以输入和输出信号的统计特性的估计为依据,采取特定算法自动地调整滤波器系数,使其达到最佳滤波特性的一种算法或装置。自适应滤波器可以是连续域的或是离散域的。离散域自适应滤波器由一组抽头延迟线、可变加权系数和自动调整系数的机构组成。附图表示一个离散域自适应滤波器用于模拟未知离散系统的信号流图。自适应滤波器对输入信号序列x(n)的每一个样值,按特定的算法,更新、调整加权系数,使输出信号序列y(n)与期望输出信号序列d(n)相比较的均方误差为最小,即输出信号序列y(n)逼近期望信号序列d(n)。

以最小均方误差为准则设计的自适应滤波器的系数可以由维纳-霍甫夫方程解得。

B.维德罗提出的一种方法,能实时求解自适应滤波器系数,其结果接近维纳-霍甫夫方程近似解。这种算法称为最小均方算法或简称 LMS法。这一算法利用最陡下降法,由均方误差的梯度估计从现时刻滤波器系数向量迭代计算下一个时刻的系数向量

式中k s为一负数,它的取值决定算法的收敛性, V【ε2(n)】为均方误差梯度估计,

自适应滤波器应用于通信领域的自动均衡、回声消除、天线阵波束形成,以及其他有关领域信号处理的参数识别、噪声消除、谱估计等方面。对于不同的应用,只是所加输入信号和期望信号不同,基本原理则是相同的。(以上部分可以跳过)

上面这段话表明,需要求解的回音路径函数F就是一个自适应滤波器W(n)收敛的过程。所加输入信号x(n)是fe,期望信号是echo,自适应滤波器收敛后的W(n)就是回音路径函数F。收敛之后,当实际回音发生,我们把fe通过函数W(n),就可以得到一个很准确的echo,把混合信号直接减去echo,得到实际需要发送的语音speech,完成回声消除任务。值得注意的两点:

1、自适应滤波器收敛阶段,期望信号是完全的echo,不能混杂有speech。因为speech和fe是没有关系的,会扰乱W(n)的收敛过程。也就是说要求回声消除算法开始运转后收敛要非常快,最好对方还来不及说话,你一说就收敛好了;收敛好之后,如果对方开始说话,也就是有speech混合过来,这个W(n)系数就不要变化了,需要稳定下来。

2、回音路径可能是变化的,一旦出现变化,回声消除算法要能判断出来,因为自适应滤波器学习要重新开始,也就是W(n)需要一个新的收敛过程,以逼近新的回音路径函数F。

基本上来说,上面这两点是两难的,一个需要自适应滤波器收敛后保持系数稳定,以保证不受speech说话干扰,另一个需要自适应滤波器随时保持更新状态,以保证能够追踪变化的回音路径。这样一来,仅从数学算法层面,回声消除已经是难上加难!简单地说,回声消除自适应滤波器的设计具有两个互相矛盾的特性,也就是快速收敛和高度的稳定性,如何同时实现这两项特性,正是设计上的主要挑战。

经过上面的分析,相信大家对回声消除的原理和技术有了深刻的理解,这是一门即容易理解又难以实现的技术。

从应用平台来看,根据笔者多年的经验,可以把回声消除分为两大类:基于DSP等实时平台的回声消除技术和基于Windows等非实时平台的回声消除技术。两者的技术难度和重点是不一样的。

三、基于DSP平台的回声消除技术

回声消除技术传统的应用领域是各种嵌入式设备,包括各种电信网络设备和终端设备。网络设备比如交换机,网关等等,终端则包括移动电话终端,视频会议终端等。现代通讯产品里面大量应用了回声消除技术,包括在我们看得到的终端产品(比如手机)和看不到的局端产品(比如交换机)。这种嵌入式设备的共同点就是采用各种型号的DSP芯片作为回声消除

的载体。一个有效的回声消除算法需要持续的在一颗DSP芯片上面运行,会遇到以下方面的难点:

实时性与高效性,因为DSP芯片资源有限。虽然自从二十世纪七十年代DSP应用以来,日新月异的硬件芯片技术使许多沉睡在教科书上的信号处理理论算法大规模应用,但是回声消除算法需要的资源还是大得惊人。以视频会议系统,大规模的会议室可以产生超过

512ms的回音,要消除这么长延时的回音,即使按照8k赫兹采样率计算,自适应滤波器W(n)的长度都会达到4096个点,这样一方面需要非常大的存储空间来存储W(n),另一方面,W(n)的更新需要的计算量也是成倍增长,同时,W(n)的收敛难度也在加大,传统自适应滤波器的效率很难保证。对于电信设备中的应用,虽然回声消除不需要这么长的延时,但是在交换机等设备中,成本和效率就是生命,所有的处理算法都是按路或按线计算的,对算法的优化效率提出了无止境的要求。相对而言,只有像车载免提这种应用对效率要求不那么高,因为车内空间小,回音延时有限,又不要求多路应用。

传统的回声消除技术是从国外二十世纪七十年代的早期算法发展而来,这类技术的采用一直相当昂贵,提供电信级回声消除硬件应用(包括芯片或者设备)的厂家都是国外的。对于移动网络用户来说,语音品质一直是他们最关切的议题,对电信业者来说,语音也仍是他们最能获利的服务项目,因此语音的品质是不容妥协的。为了满足今日与未来的网路需求,回声消除技术的挑战正在于如何有效地降低成本并持续改善语音品质。

算法级的DSP软件解决方案,也是解决嵌入式设备回音问题的一种途径,对用户也有一定的灵活性,用户只需要把回声消除模块集成到自己的DSP软件中,再简单调整几个相关参数,就能达到较好的回声消除效果。

目前基于DSP的回声消除算法已经比较成熟,市场上也有一批专门的算法/芯片公司的能够对外提供已经优化好的基于DSP的软件回声消除模块:如俄罗斯Spririt DSP、加拿大Octastic Semiconductor、瑞典GIPS、国内科莱特斯科技Conatus Technologies以及美国Adaptive Digital、和GAO Research、英国CSR等等,另外还有美国Fortemedia、Acoustic Technologies和日本OKI等可以提供专用的回声消除DSP芯片。其中性能较好的有Octastic、Conatus、和Spririt这三家,Octastic可以提供完整的从专用芯片、板卡到DSP算法的完整方案,而Conatus和Spririt的回声消除效果更好,值得一提的是Conatus公司是目前市面上唯一提供针对专业视讯会议应用宽带回声消除模块的公司,其音频采样率可以达到48k赫兹。

四、基于Windows平台的回声消除技术

回声消除技术最新的应用领域是基于Windows平台的各种VoIP应用,比如软件视频会议,VoIP软件电话等。当回声消除算法应用到Windows平台,相对于传统的DSP平台,既

带来优势,也带来了新的难点。高效性在Windows平台已经不是问题,现在的pc机,拥有丰富的cpu资源和海量的内存资源,再复杂的回声消除算法都可以运行自如。但是,新增加的麻烦比带来的好处要多。

首先,Windows平台是一个非实时的平台,音频的采集和播放对回声消除算法而言,也是非实时的。和DSP平台不一样,DSP平台可以直接控制AD/DA芯片的采集播放,获得实时的音频流(不存在同步问题),但是Windows平台下,应用程序很难在底层直接控制声卡的采集播放,获得的是非实时的音频流,从而带来了采集和播放音频流的同步问题。

实际应用时,传给回声消除算法的两个声音信号(采集的回音信号ne和播放的参考信号fe),必须同步得非常的好。就是说,本地接收到远端说的话以后,要把这些话音数据传给回声消除算法做参考,这是一个算法需要的输入信号;然后再传给声卡,声卡放出来后经过回音路径,这时,本地再采集,然后传给回声消除算法,这是算法需要的另一个输入信号。这里的同步是指:两个信号虽然存在延时,但这个延时必须固定,在时序上要保持连贯,不能一个信号多来几个帧,另外一个信号少来几个帧。如果传给回声消除算法的两个信号同步得不好,即两个信号发生帧错位,就没有办法进行消除了。因为这时系统会变成了非因果系统,比如期望信号收到了,参考信号还没来,时间上都没有因果关系,肯定是没有办法消除的。

实际情况是,在一般的VoIP软件中,接收对方的声音并传到声卡中播放是在一个线程中进行的,而采集本地的声音并传送到对方又是在另一个线程中进行的,而声学回声消除算法在对采集到的声音进行回声消除的同时,还需要播放线程中的数据作为参考,而要同步这两个线程中的数据是非常重要的,因为稍稍有些不同步,声学回声消除算法中的自适应滤波器就会发散,不但消除不了回音,还会破坏原始采集到的声音,使声音难以分辨。

另外,pc机器的声卡种类繁多,各种各样的声卡特性进一步加剧了同步问题的复杂性。所以,同步和声卡等问题对回声消除算法的内部特性提出了更多苛刻的要求。

从上面分析来看,由于Windows平台的非实时性,基于Windows平台的回声消除技术比DSP平台要难得多。

在PC平台语音通讯领域,目前公认音质做得比较好的国外软件是Skype,记得几年前Skype一直是在用瑞典一家叫GIPS(Global IP Sound)公司的语音引擎技术。GIPS是最早介入PC平台语音通讯领域的厂商之一,在改领域具有一定的权威性,其主要优势表现在对IP网络的延时、抖动和丢包等处理较好,基于Windows平台的回音消除也做得不错,不过最近的新版本Skype上已经看不到GIPS的标志了,据说是因为Skype自己研发了一套新的更好的语音引擎的缘故。目前大家接触最多的采用了GIPS语音引擎技术的通讯软件就是腾讯QQ了,其超级语音的效果普遍评价都还不错。另外微软经过多年的研发,其最新版本的MSN语音特别是回音消除效果终于有了质的提升,目前网上评价也还不错。另外还有一些专业厂商也对外提供包含回音消除功能的语音引擎,如俄罗斯的Spirit DSP、

美国的GH Innovation和国内的科莱特斯科技(Conatus Technologies)以及赛声科技(Soft Acoustic)等等。除此之外,网络上还可以下载到一个很好的开源的语音软件Speex也提供了回音消除功能。为了进一步了解目前PC Windows平台回音消除技术的业界水平,笔者对各家的回音消除技术做一个详细的横向对比测试(所有测试都是免提状态)

为了对比,各家语音引擎的版本信息列举如下:

国外厂商:

Skype V3.8.4.182

Spirit DSP(厂家DEMO)

GIPS(QQ 2009beta)

Micorsoft (Windows Live Messenger 2009 V14.0.8064.2006)

GH Innovation(厂家DEMO)

国内厂商:

Conatus Technologies(厂家DEMO)

Soft Acoustic(厂家DEMO)

开源算法:

Speex(V1.2RC1 自己写了测试软件)

测试结果:

测试项目Skype MSN QQ Conatus Spirit Speex SoftAcoustic GH I

笔记本免提模式,外接麦克风和音箱应用模式两种模

式都无

回音

笔记

本免

提模

式有

时一

笔记

本免

提模

式偶

尔有

两种模式

都无回音

笔记本

免提模

式有时

一直有

较小回

两种模

式都有

一直较

小回音

两种模式有时都

会出现较大回音

笔记本

免提模

式一直

有很小

回音

的适应性直有

较小

回音较小

回音

单方讲话效果无回音,

效果很

基本

无回

音,效

果好

基本

无回

音,效

果好

无回音,效

果很好

基本无

回音,

效果好

一直有

较小回

音,效果

有时有很大回

音,效果差

基本无

回音,效

果好

双方同时讲话效果双方交

流流畅

无回音,

对方声

音偶尔

有轻微

断续

双方

交流

流畅,

但对

方声

音中

会夹

杂着

轻微

回音

双方

交流

流畅,

但对

方声

音中

会夹

杂着

一些

回音

双方交流

流畅无回

音,对方声

音偶尔有

轻微断续

双方交

流流

畅,但

对方声

音中间

会夹杂

着一些

回音

双方交

流比较

流畅,但

一直听

到一个

较小的

回音

双方交流不流

畅,对方声音经

常会断续

双方交

流无回

音,但对

方声音

很小很

难听清

麦克风和扬声器相对的位置改变等收敛比

较快,基

本没有

回音出

现。

收敛

比较

快,基

本没

有回

音出

现。

收敛

比较

快,基

本没

有回

音出

现。

收敛比较

快,基本没

有回音出

现。

收敛比

较快,

基本没

有回音

出现。

收敛速

度慢,有

好几句

回音

收敛速度慢,有

好几句回音

收敛比

较快,基

本没有

回音出

现。

CPU重载(CPU负载达到100%)时效果XP和

Vista下

声音都

流畅,基

本不会

出现回

音和声

音断续

XP和

Vista

下声

音都

流畅,

基本

不会

出现

XP下

声音

流畅,

基本

不会

出现

回音;

Vista

XP和

Vista下

声音都流

畅,基本不

会出现回

音和声音

断续现象

XP下

声音流

畅,基

本不会

出现回

音;

Vista

下声音

此项未

XP下声音流畅,

基本不会出现回

音;Vista下声

音断续,偶尔会

出现回音

XP下声

音流畅,

基本不

会出现

回音;

Vista下

不加负

载声音

现象回音

和声

音断

续现

象下声

音断

续,偶

尔会

出现

回音

断续,

偶尔会

出现回

都是断

续的

PC和声卡适应性稳定,基

本都能

消除回

稳定,

基本

都能

消除

回音

比较

稳定,

偶尔

有些

笔记

本免

提时

有回

稳定,基本

都能消除

回音

稳定,

基本都

能消除

回音

不稳定,

有时无

法消除

回音

不稳定,经常无

法消除回音

稳定,基

本都能

消除回

噪声抑制噪声抑

制效果

噪声

抑制

效果

一般

噪声

抑制

效果

噪声抑制

效果强

噪声抑

制效果

一般

噪声抑

制效果

噪声抑制效果强噪声抑

制效果

自动硬件增益控制和免提时能达到的最大播放音量支持,音

量较大

支持,

音量

较小

支持,

音量

适中

支持,音量

适中

支持,

音量较

不支持支持,音量较小支持,音

量非常

整体效果评价

(0-10很好,基

本没有

回音,双

方交流

较好,

有的

笔记

本免

较好,

有的

笔记

本免

很好,基本

没有回音,

音量比

skype略

较好,

有的笔

记本免

提效果

不好,一

直有个

较小的

残余回

不好,经常有完

整的回音,感觉

不稳定,双方交

流比较困难,5

一般,没

有回音,

但是音

量太小,

分评分)很顺畅,

9分提时

偶尔

有回

音且

音量

较小,

双方

交流

比较

顺畅,

7.5

提时

偶尔

有回

音,双

方交

流顺

畅,8

小,双方交

流很顺畅,

8.5分

稍差且

音量比

较小,

vista

效果稍

差,7

音,双方

交流困

难,3分

分双方交

流困难,

VISTA

下声音

断续,

5.5分

测试项目Skype MSN QQ Conatus Spirit Speex SoftAcoustic GH I

可以看出,Skype、 Conatus和 QQ(GIPS)的效果最好, MSN和Spirit的效果还不错,而GH Innovation、Soft Acoustic效果一般,Speex的效果较差。

解密回声消除技术汇总

因为工作的关系,笔者从2004年开始接触回声消除(Echo Cancellation)技术,而后一直在某大型通讯企业从事与回声消除技术相关的工作,对回声消除这个看似神秘、高端和难以理解的技术领域可谓知之甚详。 要了解回声消除技术的来龙去脉,不得不提及作为现代通讯技术的理论基础——数字信号处理理论。首先,数字信号处理理论里面有一门重要的分支,叫做自适应信号处理。而在经典的教材里面,回声消除问题从来都是作为一个经典的自适应信号处理案例来讨论的。既然回声消除在教科书上都作为一种经典的具体的应用,也就是说在理论角度是没有什么神秘和新鲜的,那么回声消除的难度在哪里?为什么提供回声消除技术(不管是芯片还是算法)的公司都是来自国外?回声消除技术的神秘性在哪里? 二、回声消除原理 从通讯回音产生的原因看,可以分为声学回音(Acoustic Echo)和线路回音(Line Echo),相应的回声消除技术就叫声学回声消除(Acoustic Echo Cancellation,AEC)和线路回声消除(Line Echo Cancellation, LEC)。声学回音是由于在免提或者会议应用中,扬声器的声音多次反馈到麦克风引起的(比较好理解);线路回音是由于物理电子线路的二四线匹配耦合引起的(比较难理解)。 回音的产生主要有两种原因: 1.由于空间声学反射产生的声学回音(见下图): 图中的男子说话,语音信号(speech1)传到女士所在的房间,由于空间的反射,形成回音speech1(Echo)重新从麦克风输入,同时叠加了女士的语音信号(speech2)。此时男

子将会听到女士的声音叠加了自己的声音,影响了正常的通话质量。此时在女士所在房间应用回音抵消模块,可以抵消掉男子的回音,让男子只听到女士的声音。 2.由于2-4线转换引入的线路回音(见下图): 在ADSL Modem和交换机上都存在2-4线转换的电路,由于电路存在不匹配的问题,会有一部分的信号被反馈回来,形成了回音。如果在交换机侧不加回音抵消功能,打电话的人就会自己听到自己的声音。 不管产生的原因如何,对语音通讯终端或者语音中继交换机需要做的事情都一样:在发送时,把不需要的回音从语音流中间去掉。 试想一下,对一个至少混合了两个声音的语音流,要把它们分开,然后去掉其中一个,难度何其之大。就像一瓶蓝墨水和一瓶红墨水倒在一起,然后需要把红墨水提取出来,这恐怕不可能了。所以回声消除被认为是神秘和难以理解的技术也就不奇怪了。诚然,如果仅仅单独拿来一段混合了回音的语音信号,要去掉回音也是不可能的(就算是最先进的盲信号分离技术也做不到)。但是,实际上,除了这个混合信号,我们是可以得到产生回音的原始信号的,虽然不同于回音信号。 我们看下面的AEC声学回声消除框图(本图片转载)。

回声产生的原因

一、回声产生的原因 在通信网络中,产生回声的原因有两类:电学回声和声学回声。 1、电学回声:在目前几乎所有的通信网络中,信号的传递都是采用4 线传输,也就是在接收和发送两个方向上,各使用两条线传输信号,其中一条是参考地,另一条是信号线。 普通PSTN: 电话用户使用的话机都是通过2 线传输的方式接入本地交换机,一条线是参考地,另一条信号线上同时传输收发双向的信号。 在本地交换机中采用2/4 线转换(hybrid)实现这两种传输方式之间的转换。 由于实际使用的2/4 线变换器中混合线圈不可能做到理想状况,总是存在一定的阻抗不匹配,不能做到将发送端和接收端完全隔离,所以从4 线一侧接收的信号总有一部分没有完全转换到2 线一侧,部分泄露到了4 线一侧的发送端,因此产生回波(红色示意),如下图所示。 这种类型的回波称为电学回波,是回波的主要来源,一般的回波抵消器主要用来消除电学回波。 2、声学回声:由于话机问题导致话机在进行放音的过程中,部分音量从收话线路中被接受,产生回声(红色示意),如下图所示。 声学回波典型现象是在空旷的山谷中高声喊叫“哟——嗬——嗬——”,就能听到远处山谷的回声,还有北京天坛的回音壁与三音石也是同样道理。在通信网中,声学回波是因为在某些电话设备中,扬声器和传声器没有良好地隔离,发出的声音经空间多次反射回传到传声器而产生的,比如在空旷的房间或者汽车里使用免提电话就有这种情况。 从上述产生回音的原因可以看出,本端听到的回声是由对端造成的。 电学回声是1、本端说话的声音转换成电信号 2、传送到对端后从对端的二四线转换器 3、从对端的二四线转换器泄漏回来的; 声学回声是1、信号一直到达对端话机 2、转换成声音信号后从对方话机的麦克泄漏回来的。 二、感知回声的条件 通信网中的回声主要是由于电学回声导致的, 由回声产生的原理可以知道回声在电话网中总是存在的,但需要满足以下条件电话用户才能感受到回声:1、回波通路延时足够长 从发话者发出声音,到回波返回发话者,所经过的时间叫做回波通路延时。 如果回波通路延时很小,回波和用户发出的声音重叠在了一起,人是感觉不到回声的。对于大多数电话用户来说,如果回波通路延时时间:

富迪语音芯片在新型应用中的回音降噪问题解决

富迪语音芯片在新型应用中的回音降噪问题解决 视听在数码娱乐中的应用越来越广,产品同质化严重已经是一个很普遍的问题。于是对产品的差异化设计需求越来越突出。每家方案设计公司,都绞尽脑汁的在挖掘新创意。 我所在公司是做一些数码方面的应用方案,每每遇到客户聚会聊天,都是讨论如何打破常规,找出卖点的思路,最近在做的两个案子就是基于老常规功能上,花了蛮多时间和精力,找到一些新的方向,得到客户和市场的认可。 其实产品大家都很熟悉,一个是机顶盒,一个是网络监控产品。 先说机顶盒,传统的机顶盒只是下行数据的看电视而已,所以在应用方面很单调,也一直无法突破啥,持续着这么多年。 但ARM芯片的发展越来越高端,处理能力越来越强悍,随之智能型的机顶盒也出现了, 近些年高速网络的普及,也为这类产品的智能化提供了完美的铺垫,通过机顶盒看电视已经是最简单的诉求了,查资讯,点播视频,看网页,也成了新的主力功能。 而安卓系统的开源,更始给机顶盒产品注入了新活力,市场上目前几家主要的主流芯片,都推出了针对安卓平台的支持,但安卓应用的通用性,最终大家做出来的产品除了外观不一样,无法从APK应用上做到更多的差异出来。 在经过多次使用和评估中,发现安卓平台上提供的通话功能,比如QQ视频,SKYPE聊天,网络免费电话等等,是智能机顶盒应用的一个不错的方向,但平台本身对一些通话过程中的缺点,比如通话中的回音问题,环境的噪音问题,另外还有就是三米之外的声音大小问题,始终无法完善。

通话当然是对话筒电路的处理最重要,我们也做了很多实验,在机顶盒加上麦克风始终无法做到理想化,当然有些产品方案在设计中采用变通的方式,比如把麦克风设计在遥控器上,然后通过对着遥控器讲话,再无线传输给机顶盒。 这种方式虽然看似解决了问题,但带来的另一些问题又来了,抛开成本方面不说,光从使用习惯上已经是一种很不方便的问题处理。那有没有一种解决办法,就是把麦克风装在机顶盒上面,使用者不需要任何的附件东西,直接坐在客厅沙发上对着电视,与远方的亲戚朋友自由畅谈呢,,于是这个思路陷入困境,, 然后在多次的找芯片原厂和一些供应商的交流后,获悉,美国富迪科技的语音芯片就具有解决的思路,当然做之前我们也没把握,联系原厂后,原厂提供了一家代理商(代理商名叫深圳市高智创电子)让我们联络过去咨询。 这里必须谢谢他们的商务郭银光先生,和FAE王喻先生,按他们之前的推广市场,是没有针对机顶盒做应用的,但当我们提到需要解决的问题时,最初是帮我们推荐了FM1188,而后在具体了解到我们的使用环境后,王工说让我们直接选用新型号FM34,虽然在硬件连接上需要做些改进,但完全可以解决我所提出的问题,而后在设计中,根据王工的要求,把机顶盒上的麦克风位置做了一些结构优化,并在调试中,做了多次尝试性的设计思路,经过多次的评测调试,,最终把配置参数和性能找到了一个比较完美的平衡。 从产品图上,大家可以看到,这两款产品功能已经相当完善,产品带有摄像头,带有麦克风,系统为安卓4.0,除了保证常规的上网,看视频,看点播,视频语音聊天,已经很方便了。 而且能保证在5米的拾音距离不受影响,这是以前很多机器不敢想象的,关于这点,有做过的工程师就知道的,远距离拾音的话,使用者本人的声音必须保证足够清晰和足够大,但又不能被环境中的噪音给淹没,所以这就是富迪芯片的大作用了,富迪的FM34在进行AGC自动增益控制的基础上,再进行噪音压制,把不需要的环境噪音给消除掉,而保留需要的人声,这样整个产品的功能实用性出出来了,也是一个非常不错的感受体验,

楼宇对讲回音消除解决办法

楼宇对讲回音消除解决方法 近年,随着大数据时代的来临,很多楼宇对讲系统也相应的进入改造行列。传统的双线四线制对讲慢慢地进入衰老淘汰期,新兴的以太网传输网络一遍火热。但是在改造的过程中工程师们也将面临着一个新的挑战——回音消除! “回音”是通讯产品及配件在实际使用的过程中,时常遇到的问题。客观地说,无论模拟式通讯、还是数字式通讯,在使用过程中,都一定存在回音的现象。因此,回音消除器产品成为了通讯业至今不息的论题。 在设计一款“回音消除”产品、或者模块化电路的时候,设计人员首先要了解“回音”产生的机理,而后从实际的条件入手,选择适合的产品方案。以下所讨论的,仅限于视频会议行业常规的使用条件下的产品。 回音的产生,最早是人们在一个空旷的峡谷中喊话,会多次听到自己的声音,这种现象是“声学回音”,指声源产生后,声波在某个物体的表面得到发射,形成“二次声源”,如果声波得到多次的反射,就会形成在峡谷中喊话的效果了。中国北京天坛回音壁就是人为地采用了这种回音原理,建造出的历史景点。 在电话出现后,人们又发现,在通话过程中,会在一定的短暂延时之后,听到自己说的话。这种回音现象,我们称之为“网络回音”,特别是采用两线式的电话系统,在两条铜线上要承载双向的语音信号,在电波延时后,就会出现“二次信号”了。 通讯中的回音,如果造成“多谐波”,就会发生“自激啸叫”,影响通讯效果。但是在电话通讯中,一定水平的“网络回音”(侧音)是有利于通话双方的沟通感觉。 目前楼宇对讲中所讨论的回音,同时包含了电路的信号延时产生的侧音和会场环境造成的声学回音两种因素,以下主要是由于声学回音Acoustic Echo造成,在下图中,解释了产生的原因: 在通讯中,室内机用户和本端用户形成了通讯的环路(Loop),一个双向的通信线路组成了一个封闭的环路。 图中所示:室内机用户的语音信号经过话筒的采集后,以数据信号的方式通过通信线路传递到室外机设备,通过扬声器播放出来;播放出来的声音和室外机用户讲话的声音同时进入话筒,

基于DSP平台的回声消除技术

一、前言 因为工作的关系,笔者从2004年开始接触回声消除(Echo Cancellation)技术,而后一直在某大型通讯企业从事与回声消除技术相关的工作,对回声消除这个看似神秘、高端和难以理解的技术领域可谓知之甚详。 要了解回声消除技术的来龙去脉,不得不提及作为现代通讯技术的理论基础——数字信号处理理论。首先,数字信号处理理论里面有一门重要的分支,叫做自适应信号处理。而在经典的教材里面,回声消除问题从来都是作为一个经典的自适应信号处理案例来讨论的。既然回声消除在教科书上都作为一种经典的具体的应用,也就是说在理论角度是没有什么神秘和新鲜的,那么回声消除的难度在哪里?为什么提供回声消除技术(不管是芯片还是算法)的公司都是来自国外?回声消除技术的神秘性在哪里? 二、回声消除原理 从通讯回音产生的原因看,可以分为声学回音(Acoustic Echo)和线路回音(Line Ech o),相应的回声消除技术就叫声学回声消除(Acoustic Echo Cancellation,AEC)和线路回声消除(Line Echo Cancellation, LEC)。声学回音是由于在免提或者会议应用中,扬声器的声音多次反馈到麦克风引起的(比较好理解);线路回音是由于物理电子线路的二四线匹配耦合引起的(比较难理解)。 回音的产生主要有两种原因: 1.由于空间声学反射产生的声学回音(见下图): 图中的男子说话,语音信号(speech1)传到女士所在的房间,由于空间的反射,形成回音speech1(Echo)重新从麦克风输入,同时叠加了女士的语音信号(speech2)。此时男子将会听到女士的声音叠加了自己的声音,影响了正常的通话质量。此时在女士所在房间应用回音抵消模块,可以抵消掉男子的回音,让男子只听到女士的声音。 2.由于2-4线转换引入的线路回音(见下图): 在ADSL Modem和交换机上都存在2-4线转换的电路,由于电路存在不匹配的问题,会有一部分的信号被反馈回来,形成了回音。如果在交换机侧不加回音抵消功能,打电话的人就会自己听到自己的声音。 不管产生的原因如何,对语音通讯终端或者语音中继交换机需要做的事情都一样:在发送时,把不需要的回音从语音流中间去掉。 试想一下,对一个至少混合了两个声音的语音流,要把它们分开,然后去掉其中一个,难度何其之大。就像一瓶蓝墨水和一瓶红墨水倒在一起,然后需要把红墨水提取出来,这恐怕不可能了。所以回声消除被认为是神秘和难以理解的技术也就不奇怪了。诚然,如果仅仅单独拿来一段混合了回音的语音信号,要去掉回音也是不可能的(就算是最先进的盲信号分离技术也做不到)。但是,实际上,除了这个混合信号,我们是可以得到产生回音的原始信号的,虽然不同于回音信号。 我们看下面的AEC声学回声消除框图(本图片转载)。

智能物理降噪算法系统及方法与相关技术

图片简介: 本技术涉及一种智能物理云端服务器降噪算法系统方法,包括智能设备、云端服务器和智能物理降噪音箱终端;所述智能设备为安装有微信公众号的智能设备;所述Wi Fi装置用于降噪处理系统装置连接云端服务器,具有音乐下载播放功能;所述降噪采集发射MIC分别设在箱体四周;用于采集环境噪音,将采集噪音发射给MIC接收装置;所述MIC接收装置用于接受降噪采集发射MIC发射的噪音;所述人体探测器用于探测箱体与人体的距离;所述环境探测器用于探测箱体所置空间的大小。所述降噪采集发射MIC将采集环境噪音数据给降噪处理系统处理。有益效果是:实现了人物在环境任何位置立体声左右平衡,降噪环境噪音,降噪人耳电器非频噪音。 技术要求 1.一种智能物理降噪系统,包括智能设备、云端服务器和智能物理降噪音箱终端;其特征在于:所述智能设备为安装有微信公众号的智能设备;所述智能设备包含Wi-Fi装置;所述Wi-Fi装置用于智能设备连接云端服务器; 所述智能物理降噪音箱终端包括:箱体、降噪处理系统装置;音箱发音设备装置;所述 降噪处理系统装置设在箱体上;所述音箱发音设备装置设在箱体两侧;所述音箱发音设 备装置至少为2个;所述音箱发音设备装置包括左声道和右声道。

2.根据权利要求1一种智能物理降噪系统所述,其特征在于: 所述降噪处理系统装置包括MCU控制装置、Wi-Fi装置、降噪采集发射MIC、MIC接收装置、人体探测器和环境探测器; 所述MCU控制装置与Wi-Fi装置、降噪采集发射MIC、MIC接收装置、人体探测器和环境探测器电连接; 所述MCU控制装置用于控制Wi-Fi装置、降噪采集发射MIC、MIC接收装置、人体探测器和环境探测器; 所述Wi-Fi装置用于降噪处理系统装置连接云端服务器; 所述降噪采集发射MIC至少为4个;且分别设在箱体四周;用于采集环境噪音,将采集噪音发射给MIC接收装置; 所述MIC接收装置用于接受降噪采集发射MIC发射的噪音; 所述人体探测器用于探测箱体与人体的距离; 所述环境探测器用于探测箱体所置空间的大小。 3.根据权利要求2所述一种智能物理降噪系统所述,其特征在于:所述降噪采集发射MIC 将采集环境噪音数据给降噪处理系统处理。 4.根据权利要求1所述一种智能物理降噪系统所述,其特征在于:所述智能设备为智能手机、平板电脑、笔记本电脑和智能手表。 5.根据权利要求1所述一种智能物理降噪系统所述,其特征在于:所述降噪控制处理系统对噪音进行数据分析比输出反向噪音给音箱发音设备装置进行噪音同步消除。 6.根据权利要求1所述一种智能物理降噪系统所述,其特征在于:所述降噪控制处理系统要求左声道和右声道与人体探测位置声波同时到达人体位置得到的同等声波幅度,达到了左声道和右声道声道平衡,主声波互绕左声道和右声道平衡降噪。 7.基于权利要求1-6任一项所述智能物理降噪系统的智能物理降噪方法,包括步骤:

回声信号的产生与消除

回声信号的产生与消除

信号与系统 姓名:苏小平 班级:电网13-1 学号:1305080116 学院:电气与控制工程学院

回声信号的产生与消除 第一部分:阐述回声产生与消除的步骤、原理。 1.步骤: (1)利用软件GOLDWAVE录取一段音频来自陈学冬的“不再见”。(2)将音频导入MATLAB中,通过编写程序,在音频里加入回声,得到了‘加回声的音乐’。 (3)通过编写程序,将加入回声的音频通过滤波器,将回声滤除,得到了‘去掉回声的音乐’。 2.原理: 无线通信中,当接收机从正常途径收到发射信号时,可能还有其它的传输路径,例如从发射机经过某些建筑物反射到达接收端,产生所谓“回波”现象,又如,当需要完成室内录音时,除了直接进入麦克风的正常信号之外,经墙壁反射的信号也可能被采集录入,这也是一种“回声”现象,为了解决这种多径传输中的失真问题,需要消除

或削弱回声。 消除回声的系统框图如下图所示: x(n)w(n)y(n) h1(n)h2(n) 系统一系统二 第二部分:利用MATLAB对音频进行处理: 1.将音乐导入MATLAB后画出加回声之前的时域波形图、幅值和相位图,见一下图形:

2.将音乐导入MATLAB 后画出加回声之前的时域波形图、幅值和相位图,见一下图形: 01234567 8 x 10 5 -0.05 -0.04-0.03-0.02-0.0100.010.020.030.04原信号波形 01234567 8 x 10 5 100200300原信号幅值 1 2 3 4 5 6 7 8 x 10 5 -4-2024原信号相位

回声消除技术介绍

回声消除技术介绍 “在PBX或局用交换机侧,有少量电能未被充分转换而且沿原路返回,形成回声。如果打电话者离PBX或交换机不远,回声返回很快,人耳听不出来,这种情况下无关紧要。但是当回声返回时间超过10ms时,人耳就可听到明显的回声了。为了防止回声,一般需要回声消除技术,在处理器中有特殊的软件代码监听回声信号,并将它从听话人的语音信号中消除。对于IP电话设备,回声消除技术是十分重要的,因为一般IP网络的时延很容易就达到40~50ms。” 一、因特网语音通信中回声的特点 与传统电话相比,因特网上进行语音的实时传输,有其致命的弱点,那就是语音质量较差,影响因特网语音质量的因素是多方面的,最关键的因素之一是回声的影响。因此,要提高因特网的语音质量,就必须在因特网的语音传输过程中进行消回声的处理,也就是说,IP电话网关作为因特网的语音接入设备,几须具有回声的消除功能。由于因特网的语音传输是采用分组交换技术实现的一种全新的电信业务,传送的语音信号要经过编码、压缩、打包等一系列处理,这不仅造成回声路径的延迟较大,而且延迟抖动也较大。因此,在因特网的语音传输过程中,回声问题显得尤其突出,并具有如下特点。 1、回声源复杂 在传统电话系统中,存在着一种所谓的"电路回击"。该回声产生的主要原回是在系统中存在2-4线的转换。完成2-4转换的混合器因阻抗匹配,造成"泄漏",从而导致了"电路回声"。从因特网IP电话网关的连接方式可以看出,IP电话网关一端连接PSTN,另一端连接因特网。 尽管电路回声产生于PSTN中,但同样会传至于IP电话网关,是因特网语音传输中的回声源之一,因特网语音传输中的第二种回声源是所谓的"声学回声"。声学回声是指扬声器播放出来的声音被麦克风拾取后发回远端,这就使得远端谈话者能听到自己的声音。声学回声又分为直接回声和间接回声。直接回声是指扬声器播放出来的声音未经任何反射直接进入麦克风。这种回声延迟最短,它与远端说话者的语音能量,扬声器与话筒之间的距离、角度、扬声器的播放音量以及话筒的拾取灵敏度等因素相关。间接回声是指扬声器播放的声音经不同的路径一次或多次反射后进入麦克风所产生的回声集合。因为周围物体的变动,例如人的走动等,都会改变回声的返回路径,因为这种回声的特点是多路径、时变的。另外,背景噪声也是产生回声的因素之一。 2、回声路径的延迟大 在因特网中的语音传输中,延迟来源有三种:压缩延迟、分组传输延迟和处理延迟。语音压缩延迟是产生回声的主要延迟,例如在G.723.1标准中,压缩一帧

如何解决音频会议回声消除

如何解决音频会议回声消除 声学回声消除(AEC)是通过声音链路使房间内各个位置声音产生相关性的一种技术。只要是一个有多个房间同时参与的、无障碍的、全双工会议,并且会议话筒会拾取到音箱中的声音时,就需要用到AEC。 一、声学回声产生的原因 在一个典型的会议形式中(图1),从房间B中通过电话线或者其他音频网络传输到房间A的声音,又通过音频网络传了回去。在房间B里的人就会听到了一个经过音频网络和房间A之后有了延时的自己的声音。如果人们在交谈时听到了自己的回声,那么就很容易被分散注意力,而且也很难有一个非常自然的交谈。对于有效的沟通来说,消除回声是非常重要的。 消除声学回声有许多种方法。有一种方法是在话筒和音箱之间加入选择开关,使它们不能同时启用(图2)。这样就打破了声音产生回声的信号通路。但它也破坏了交流,使会话的进行一点都不自然,因为听者必须等到另一端的发言人讲完。在这一系统中的声音是半双工的。这种方法通常用于对讲机系统和双通道广播,但是由于交流的自然性受到限制,所以最

好不要在音频会议系统中使用。 另一种方法是在物理上把音箱和话筒隔离开来。一个简单的例子就是电话的听筒。因为听筒中的小喇叭离人耳非常近,所以就可以把声音的电平做的很小,这样既能够听清楚又不会被话筒拾取到。因为在听筒的喇叭与话筒之间没有联结,所以在远端也就不会有回声。当然,为每个人配发听筒也就无法兼顾会议的自然交流和正常活动。 AEC已经成为会议系统中提供全双工音频的标准方法。AEC是通过消除或者移除本地话筒中拾取到的远端的音频信号来阻止远端的声音返回去的一种处理方法。这种音频的移除都是通过数字信号处理来完成的。 二、回声消除的工作原理 尽管回声消除是非常复杂的技术,但我们可以从简单的描述中来了解一下这种处理方法: 1、房间A的音频会议系统接收到房间B中的声音

[数学物理]歌曲消除人声的原理.

[数学物理]歌曲消除人声的原理 ? ? 在卡拉ok唱歌,可以切换原唱和伴唱。 ? 这里有几种技术,一种是立体声的两条轨道(左和右声道,一条是原唱,一条是伴唱。就像原来的VCD碟可以切换国语粤语。 ? 有的时候有的歌曲只提供了原唱,伴唱轨道的音乐是后来的卡拉OK 制作者重新制作的,导致原唱伴唱听起来差别很大。 ? ! 第二种技术是,两条轨道组成立体声,其中的人声可以消除掉,也可以保留,形成原唱和伴唱。这就是我这篇文章的主要介绍内容。刚才说到,有的歌曲提供了原唱但是没有伴唱,既然我们有消除人声的技术,为什么不直接消除人声,而要重新制作伴奏?肯定是因为消除不了人声,或者消除人声遇到很大障碍,才这么做。那么什么情况下可以消除人声,什么情况下不行?这就涉及到消除人声,也就是上面说的第二种技术的原理。 ? ! 首先让我们用两个正弦函数代表两段音频: ? A ? = ? s in(t ? B ? = ? -sin(t ? 那么现在我把两个音频信号的电压相加,A+B ? = ? 0,得到的结果就是一条电压为零的直线,听不到任何声音。 ? 但是如果单独听两个信号,不管幅度是正(A还是负(B,耳朵听起来是没有区别的,都是正弦波。 ? 如果您能够理解上面说的内容,请往下看: ?

! 立体声音乐之所以会听起来是立体的,是因为两个耳朵听到的声音在相位、幅度,甚至频率(简单的说就是内容上有区别。 ? 假如有一首歌的伴奏部分是立体声,伴奏的左声道用C表示,右声道用D; ? 人声演唱部分是单声道的(一个音频信号平均分配到左右两个声道,用E表示。 ? 如果我们用F和G表示这首歌左右两个声道的音频信号,那么在播放这首歌的时候,左边耳朵听到的就是F ? = ? C +E,右边耳朵听到的就是 G ? = ? ? D +E。 ? ! 现在我们把F这个信号乘以-1,或者说把电压符号改成负的。然后把 ? -F ? 和? G ? 两个信号相加: ? ! - ? F ? + ? G ? = ? - ? C ? - ? E ? + ? D ? + ? E ? = ? D ? - ? C ? ! 因为C和D两个伴奏信号的内容是不相同的,所以D-C ? 不会让D和C互相抵消,还是能听到C和D这两个伴奏的声音(只不过混成了一个声道,不能当立体声听了。 ? ! 但是我们的人声信号E,在这次相加之后就完全没有了。这样就做到了消除人声。 ? ! 另外可以得出以下结论: ?

视频会议室之回声消除

视频会议室之回声消除 作者:彭兴明 一、反馈和回声的区别 声反馈的形成是音频系统输入的某些音频信号经过放大输出后又重新回到音频系统的输入而逐渐放大。反馈产生后轻则导致啸叫发生,影响音质,重则烧毁音频设备。 为了避免声反馈的发生,可以通过增加反馈抑制器来防止反馈。反馈抑制器原理和参量均衡基本相同,只不过反馈抑制器能够自动识别反馈频率点,并且迅速地在反馈点进行衰减,整个过程不需要人为干预,具体原理如图1。 反馈抑制器不是解决音频反馈的唯一办法,还有其他很多办法,这里不作为重点介绍。 回声的产生和反馈产生的原因类似,也是音频系统的输出回到音频系统的输入,讲话人能够从音箱中听见自己讲话的回声,具体原理如图2。

回声对于反馈来说主要有以下两点不同。 (1) 回声延时较长 在召开视频会议时,本地视频会议终端和远端视频会议终端进行音频编码和解码所造成的延时,这一部分的延时时间相对较短,也不容易被察觉到,但理论上是存在的。另一部分是声波从音箱出来又回到话筒中所产生的延时,声音在空气中传播速度较慢,不同大小的会议室音箱到话筒的距离也不相同,因此产生的延时长短也不相同。 (2) 回声不进行放大或放大较小 回声在本地话筒到远端的会议终端和远端话筒到本地会议终端之间这一段是不进行放大的,放大的只是在本地会议终端到音箱和远端会议终端到音箱这一段。从本地音箱到本地话筒和远端音箱到远端话筒这一段是在空气中以声波方式传输的,因此会有衰减。当声波再次进入话筒时,信号经过延时和衰减,此时的强度不足以产生反馈时,就会听到讲话者的回声。 二、回声消除原理 通过对上面回声产生的原理进行分析,可以得出如下结论:如果要消除系统回声就要保证本地会议终端和远端会议终端只输出讲话者的音频信号给对方的会议终端,换句话说,本地或者远端音箱的声音不能进入会议终端的话筒。 让“本地或者远端音箱的声音不进入话筒”,听起来比较容易,但做起来很难,尤其是会议室面积比较大,不使用视频会议终端自带的话筒时,要满足这个要求就更难了。只有一种情况的视频会议应用满足这种要求,就是采用软件类型的视频会议系统,通过PC 方式召开远程视频会议,会议参加人数只有一人,

回声消除

回声消除 1.回声消除原理 从通讯回音产生的原因看,可以分为声学回音(Acoustic Echo)和线路回音(Line Echo),相应的回声消除技术就叫声学回声消除(Acoustic Echo Cancellation,AEC)和线路回声消除(Line Echo Cancellation, LEC)。声学回音是由于在免提或者会议应用中,扬声器的声音多次反馈到麦克风引起的(比较好理解);线路回音是由于物理电子线路的二四线匹配耦合引起的(比较难理解)。 回音的产生主要有两种原因: 1.由于空间声学反射产生的声学回音(见下图): 图中的男子说话,语音信号(speech1)传到女士所在的房间,由于空间的反射,形成回音speech1(Echo)重新从麦克风输入,同时叠加了女士的语音信号(speech2)。此时男子将会听到女士的声音叠加了自己的声音,影响了正常的通话质量。此时在女士所在房间应用回音抵消模块,可以抵消掉男子的回音,让男子只听到女士的声音。 2.由于2-4线转换引入的线路回音(见下图):

在ADSL Modem和交换机上都存在2-4线转换的电路,由于电路存在不匹配的问题,会有一部分的信号被反馈回来,形成了回音。如果在交换机侧不加回音抵消功能,打电话的人就会自己听到自己的声音。 不管产生的原因如何,对语音通讯终端或者语音中继交换机需要做的事情都一样:在发送时,把不需要的回音从语音流中间去掉。 试想一下,对一个至少混合了两个声音的语音流,要把它们分开,然后去掉其中一个,难度何其之大。就像一瓶蓝墨水和一瓶红墨水倒在一起,然后需要把红墨水提取出来,这恐怕不可能了。所以回声消除被认为是神秘和难以理解的技术也就不奇怪了。诚然,如果仅仅单独拿来一段混合了回音的语音信号,要去掉回音也是不可能的(就算是最先进的盲信号分离技术也做不到)。但是,实际上,除了这个混合信号,我们是可以得到产生回音的原始信号的,虽然不同于回音信号。 我们看下面的AEC声学回声消除框图(本图片转载)。 其中,我们可以得到两个信号:一个是蓝色和红色混合的信号1,也就是实际需要发送的speech和实际不需要的echo混合而成的语音流;另一个就是虚线的信号2,也就是原始的引起回音的语音。那大家会说,哦,原来回声消除这么简单,直接从混合信号1里面把把这个虚线的2减掉不就行了?请注意,拿到的这个虚线信号2和回音echo是有差异的,直接相减会使语音面目全非。我们把混合信号1叫做近端信号ne,虚线信号2叫做远端参考信号fe,如果没有fe这个信号,回声消除就是不可能完成的任务,就像“巧妇难为无米之炊”。 虽然参考信号fe和echo不完全一样,存在差异,但是二者是高度相关的,这也是echo 称之为回音的原因。至少,回音的语义和参考信号是一样的,也还听得懂,但是如果你说一

回声产生的原因是什么

回声产生的原因是什么 回声产生的原因是什么 在通信网络中,产生回声的原因有两类:电学回声和声学回声。 1、电学回声:在目前几乎所有的通信网络中,信号的传递都是采用4 线传输,也就是在接收和发送两个方向上,各使用两条线传输信号,其中一条是参考地,另一条是信号线。而普通pstn 电话用户使用的话机都是通过2 线传输的方式接入本地交换机,一条线是参考地,另一条信号线上同时传输收发双向的信号。于是,就在本地交换机中采用2/4 线转换(hybrid)实现这两种传输方式之间的转换。 由于实际使用的2/4 线变换器中混合线圈不可能做到理想状况,总是存在一定的阻抗不匹配,不能做到将发送端和接收端完全隔离,所以从4 线一侧接收的信号总有一部分没有完全转换到2 线一侧,部分泄露到了4 线一侧的发送端,因此产生回波(红色示意),如下图所示。 这种类型的回波称为电学回波,是回波的主要来源,一般的回波抵消器主要用来消除电学回波。 2、声学回声:由于话机问题导致话机在进行放音的过程中,部分音量从收话线路中被接受,产生回声(红色示意),如下图所示。

声学回波典型现象是在空旷的山谷中高声喊叫“哟——嗬——嗬——”,就能听到远处山谷的回声,还有北京天坛的回音壁与三音石也是同样道理。在通信网中,声学回波是因为在某些电话设备中,扬声器和传声器没有良好地隔离,发出的声音经空间多次反射回传到传声器而产生的,比如在空旷的房间或者汽车里使用免提电话就有这种情况。 从上述产生回音的原因可以看出,本端听到的回声是由对端造成的。电学回声是本端说话的声音转换成电信号传送到对端后从对端的二四线转换器泄漏回来的;而声学回声是信号一直到达对端话机又转换成声音信号后从对方话机的麦克泄漏回来的。 感知回声的条件 通信网中的回声主要是由于电学回声导致的,由回声产生的原理可以知道回声在电话网中总是存在的,但需要满足以下条件电话用户才能感受到回声: 1、回波通路延时足够长 从发话者发出声音,到回波返回发话者,所经过的时间叫做回波通路延时。如果回波通路延时很小,回波和用户发出的声音重叠在了一起,人是感觉不到回声的。对于大多数电话用户来说,如果回波通路延时时间: (1) 小于30ms,不易察觉; (2) 大于30ms,容易察觉,并影响听话效果; (3) 大于50ms,非常严重。 注:itu-t g.111(a.4.4.1 note3)指出:时延达到24ms,就会有感觉,需要加以控制;

回声消除技术

连载八:回声消除技术 一、因特网语音通信中回声的特点 与传统电话相比,因特网上进行语音的实时传输,有其致命的弱点,那就是语音质量较差,影响因特网语音质量的因素是多方面的,最关键的因素之一是回声的影响。因此,要提高因特网的语音质量,就必须在因特网的语音传输过程中进行消回声的处理,也就是说,IP电话网关作为因特网的语音接入设备,必须具有回声的消除功能。由于因特网的语音传输是采用分组交换技术实现的一种全新的电信业务,传送的语音信号要经过编码、压缩、打包等一系列处理,这不仅造成回声路径的延迟较大,而且延迟抖动也较大。因此,在因特网的语音传输过程中,回声问题显得尤其突出,并具有如下特点。 1、回声源复杂 在传统电话系统中,存在着一种所谓的"电路回击"。该回声产生的主要原因是在系统中存在2-4线的转换。完成2-4转换的混合器因阻抗匹配,造成"泄漏",从而导致了"电路回声"。从因特网IP电话网关的连接方式可以看出,IP电话网关一端连接PSTN,另一端连接因特网。 尽管电路回声产生于PSTN中,但同样会传至于IP电话网关,是因特网语音传输中的回声源之一,因特网语音传输中的第二种回声源是所谓的"声学回声"。声学回声是指扬声器播放出来的声音被麦克风拾取后发回远端,这就使得远端谈话者能听到自己的声音。声学回声又分为直接回声和间接回声。直接回声是指扬声器播放出来的声音未经任何反射直接进入麦克风。这种回声延迟最短,它与远端说话者的语音能量,扬声器与话筒之间的距离、角度、扬声器的播放音量以及话筒的拾取灵敏度等因素相关。间接回声是指扬声器播放的声音经不同的路径一次或多次反射后进入麦克风所产生的回声集合。因为周围物体的变动,例如人的走动等,都会改变回声的返回路径,因为这种回声的特点是多路径、时变的。另外,背景噪声也是产生回声的因素之一。 2、回声路径的延迟大 在因特网中的语音传输中,延迟来源有三种:压缩延迟、分组传输延迟和处理延迟。语音压缩延迟是产生回声的主要延迟,例如在G.723.1标准中,压缩一帧(30ms)的最大延迟是37.5ms。分组传输延迟也是一个很重要的来源,测试表明,端到端的最大传输延迟可达250ms以上。处理延迟是指语音包的封装时延及其缓冲时延等。 3、回声路径的延迟抖动大 在因特网的语音传输过程中,由于回声路径、语音压缩时延、分组传输路由等存在诸多不确定因素,而且波动范围较大,一般在20~50ms之间。 二、声学回声消除器的结构和相关算法 随着消回声技术的发展,当前回声消除研究的重点,已由"电路回声"的消除,转向了"声学回声"。 1、声学回声的消除法 (1) 周围环境的处理 分析声学回声的产生的机理,可以知道:声学回声最简单的控制方法是改善扬声器的周围环境,尽量减少扬声器播放声音的反射。例如,可以在周围的墙壁上附加一层吸音材料,或增加一层衬垫以增加散射,理想的周围环境是其回响时间或RT-60(声音衰减60dB所需要的时间)在300ms~600ms之间。因为这样的

回声信号的产生与消除

数字信号处理课程设计 回声信号的产生与消除 姓名张针海 学号 10300123 专业电子信息工程 指导教师樊玲 年级 10级电信2班 日期 2013 .5 . 25 【摘要】本课程是利用Windows下的录音机,录制一段自己不小于10s的语音,然后在Matlab 软件平台下,利用函数wavread对语音信号进行采样,并记录采样频率和采样点数。在抽样信号的基础上,通过采样后的的信号与原信号实现一次及多次延迟、叠加产生回波信号,再使用Matlab绘出有

回声及无回声语音信号的时域波形和频谱图。再分别用频率抽样法设计的FIR滤波器和冲激相应不变法设计设计的IIR滤波器消除回声,并记录滤波器的频域响应,再绘制滤波后信号的时域波形和频谱,并对前后信号进行对比,分析信号的变化。 [关键词] 录音 matlab 采样滤波抽样 [Abstract] this course is to use a tape recorder to record voice under Windows, a section of their own not less than 10s, then in Matlab software platform, sampling of the speech signal using the function wavread, and record the sampling frequency and sampling points. Based on the sampling signal, through its implementation of single and multiple superposition delay, echo, and use Matlab to draw the echo and echo free speech signal time-domain waveform and spectrum. FIR filter respectively by frequency sampling design method and impulse corresponding invariant IIR filter design to eliminate echo, and record the response of the filter in frequency domain, and then draw the time-domain waveform and spectrum of the filtered signal, and compared before and after the signal, analysis of signal changes 目录 1 设计目的及要求 (3) 1.1设计回音目的及要求 (3) 1.2设计滤波器目的及要求 (3) 1.2.1 FIR滤波器 (3) 1. 2. 2 巴特沃兹滤波器 (3) 1. 2. 3 距离估计要求 (4) 2 设计原理 (4) 3设计内容 (4) 3.1语音采集........ (4) 3. 2信号分析 (4) 3.3制作回音 (5) 3.4设计滤波器及滤波 (8) 3. 4. 1 设计FIR滤波器及滤波 (8)

信号与系统课设-回音消除

信号与系统课设-回音消除

信号与系统课程设计 系别____电子信息工程系______专业____电子信息工程________班级/学号__ 电信09 学生姓名 ____ 实验日期 2011年6月 成绩 _______________________ 指导教师罗倩老师

信号与系统课程设计 课程设计目的 “信号与系统”是一门重要的专业基础课,MATLAB作为信号处理强有力的计算和分析工具是电子信息工程技术人员常用的重要工具之一。本课程设计基于MATLAB完成信号与系统综合设计实验,以提高学生的综合应用知识能力为目标,是“信号与系统”课程在实践教学环节上的必要补充。通过课设综合设计实验,激发学生理论课程学习兴趣,提高分析问题和解决问题的能力。 一、课程设计时间 第十五、十六周。上机时间安排见附件一。第十六周周五提交课程设计报告并答辩。 二、参考书目 1、谷源涛、应启珩、郑君里著,信号与系统——MATLAB综合实验,北京:高等教育出版社,2008年1月。 2、郑君里、应启珩、杨为理,信号与系统引论,北京:高等教育出版社,2009年3月。

3、梁虹等,信号与系统分析及Matlab实现,北京:电子工业出版社,2002年2月。 三、注意事项 1、基本部分,共三道题,每人都需要全部完成,要求十五周周五做完。 2、提高部分,共八道题,每人按照学号分配(见附件二)只做其中的一题。 3、第十六周周五所提交的课程设计报告如有雷同,一律退回重写。 四、课程设计内容及学时安排 (一)课程设计动员 讲解课程设计内容及要求,解释相关题目(2学时)。 具体时间安排见附件一。 (二)基本部分 一、傅里叶变换分析:(自行设计:2学时,上机:4学时)

回声怎么样来就进行消除

视频会议系统中,无论会议终端还是MCU对于回声问题都有解决软件集成在设备中,有的项目中使用这些设备中的回声消除器就可以消除回声,音质也不受到影响。但不可否认,众多的项目中,当几个会议室同时打开麦克风交流时,回声问题就出现了。 轻微的回声人耳可以接受的话,只要领导不在意,那也说得过去,但有的时候回声严重,导致会议进行不下去,就要考虑该会议室的建声设备的问题了。 视频会议中得回声所指的是声回声。它的产生是由于远端的声音传到本地,通过本地的视频终端到功放到音箱扩出声音(我们先称为声音信号1),然后本地的声音(我们称为声音信号2)和由音箱扩出来的声音信号1都回被本地的麦克风拾取到,再通过视频会议终端传递到远端,这样远端传出去的语音信号又被传了回来,与会者又一次的听到音箱传出来的自己的声音,这就是回声的产生。 那么。大家就会问,为什么会发生这种情况,视频终端不是有回声消除器吗?它怎么不能消除回声?当单独使用会 议系统自带的麦克风时候应用不是很好吗?请注意:我说的发生回声情况是指有多路麦克风接入情况,由于会议系统较大,使用调音台,音频处理器等设备的会议室。 我们公司所接触到的回声发生情况有以下几种。

发生回声情况是我们所接入麦克风线路不走视频会议终端的麦克风接入线路,而直接接入视频会议终端的线路级信号入,这样进入视频会议终端的音频信号不经过视频会议终端的回声消除器,从而导致回声消除器不工作。还有一种常见情况就是有些会场面积大,会场建声条件不好,而视频会议终端的回声消除技术也有问题,也会发生回声问题。另外也见过一种情况就是地面视频会议系统和卫星通讯系统一起使用,由于卫星传输声音不经过地面系统的回声消除,传过去的声音被地面系统麦克风拾取到又被当作本地会场声音传到各个会场,这样互相的传来传去,严重影响会议的进行。 那么如何控制回声问题呢? 现在控制回声问题有下面的方法: 1.接受到远端音频信号时关闭本地麦克风。这样做导致半双工问题,不能及时回复发言者要求。而且需要人工操作,极易导致切掉发言者声音问题。 2.接受到远端音频信号时自动抑制本地麦克风。这样做也是半双工问题,也极易导致切掉发言者声音问题。 3.使用专门的回声消除器这样可以做到全双工工作,传输音频效果最佳。

基于MATLAB的 回声信号产生器

电子信息工程学院 《DSP技术及应用》课程设计报告 题目:基于MATLAB的回声信号产生器 专业班级:通信工程专业 二〇一三年六月十六日 目录 一、设计目的 (1)

二、设计要求 (1) 三、设计原理及方案 (1) 四、设计流程 (5) 五、调试分析 (5) 六、GUI界面 (17) 七、设计总结.………………………………………………………. .20

一、设计目的 综合运用我们掌握的数字信号处理知识,利用matlab语言编程进行回声信号产生器的设计再对其进行频谱分析,实现回声的产生,消除和隐藏。 1、首先熟练掌握对声音采集、处理、衰减、延时等过程的理论知识。 2、根据设计思路,学习资料的搜集与整理。 3、通过理论与实际的结合,在理论的基础结合实际情况完成课程的设计。 关于MATLAB软件:MATLAB语言具备高效、可及推理能力强等特点,是目前工程界流行最广泛的科学计算语言。MATLAB强大的运算和图形显示功能,可使信号与系统上机实验效率大大提高。特别是它的频谱分析和滤波器分析与设计功能很强,使数字信号处理工作变得十分简单,直观。 关于GUI界面:图形用户界面GUI (Graphics User Interface) 是由各种图形对象,如图形窗口、图轴、菜单、按钮、文本框等构建的用户界面,是人机交流信息的工具和方法。GUI 设计即可以基本的MATLAB 程序设计为主,也可以鼠标为主利用GUIDE 工具进行设计。 二、设计要求 首先,自己录取一个合适的原声信号,并对其进行频谱分析;然后通过数字信号处理对已录制好的原声信号进行延时,衰减,产生出回声信号,通过图形与原声信号进行比较;再把信息转换成二进制信号将其叠加在回声中,通过数字信号处理实现信息的隐藏;最后,通过设计GUI界面将结果展示出来。 1、通过计算机中的y=fft(x)傅里叶变换,对原声信号和回声信号进行频谱分 析。 2、通过设计FIR、IIR滤波器对原声信号进行衰减、延时产生一次、三次、六次 无限次回声。 3、学习并掌握MATLAB的使用方法,用MATLAB编程和会使用MATLAB中 的GUI界面设计。 三、设计原理及方案

相关文档
最新文档