基于谱减法的语音增强及其DSP实现

基于谱减法的语音增强及其DSP实现
基于谱减法的语音增强及其DSP实现

基于谱减法的语音增强及其DSP实现

摘要

语音总会受到外界噪声不同程度的干扰和影响,噪声不但降低了语音质量和可懂度,而且还将导致语音处理系统性能的急剧恶化。语音增强技术可以用来抑制噪声,提高抗噪声能力和输入信号的信噪比,改善语音质量、可懂度和系统的性能,并作为预处理或前端处理模块存在于语音处理系统中。

本论文首先从语音特性、噪声特性、人耳的感知特性以及语音信号分析得方法入手,重点研究了基于谱减法的增强算法并在MATLAB环境下对其进行了仿真,验证了谱减法在语音增强方面的有效性和可行性。

DSP(数字信号处理器)作为专用的数字信号处理芯片,具有在单机器周期内完成乘加运算、单机器周期内多次访问存储器以及丰富的片上外设等特点。采用DSP进行语音信号处理代表未来语音信号处理的发展方向,在这种情况下,本文在研究谱减法的基础上,对算法进行了分析和实现,实现了基于DSP的语音信号采集与处理系统。

关键词:语音信号处理,语音增强,谱减法,DSP

SPEECH ENHANCEMENT ALGORITHMS AND

IMPLEMENTATION ON DSP

ABSTRACT

Speech is inevitably interfered by noise. The noise not only degrades the quality and the intelligibility of speech, but also worsens the capability of the system. As speech enhancement technology can be used to reduce the noise, Improve anti-noise ability and the signal-to-noise ratio of the input signal , the input Signal-to-Noise Ratio of the speech processing system and improving the quality and intelligibility of speech, speech enhancement technology is usually used as the pre-processing module in the speech processing system.

This paper first from speech characteristics, noise characteristics, the perception of the human ear characteristics and method of speech signal analysis, Focus on the based on the spectral subtraction enhancement algorithm and in the MATLAB environment of the simulation,Verify the spectral subtraction speech enhancement in the effectiveness and feasibility.

DSP as special digital signal processor, has some unique features, such as Single-cycle multiply and accumulate (MAC),multiple accessing memories in single cycle,a wide variety of on-chip peripherals. These features lead DSP applied widely in digital speech processing field. This paper studies the traditional Spectral Subtraction and improves it to reduce “music noise”. Then based on these theories, a practical speech enhancement processing system on DSP is designed and implemented.

KEY WORDS:Speech processing,Speech enhancement,Spectral Subtraction,DSP

基于谱减法的语音增强及其DSP实现 ....................................................................................................... I 摘要 .............................................................................................................................................................. I ABSTRACT ...................................................................................................................................................II 第一章绪论.. (1)

1.1课题研究意义 (1)

1.2国内外研究现状及发展背景 (2)

1.3主要研究内容 (3)

第二章语音增强的基础知识 (4)

2.1语音的产生 (4)

2.2 人的听觉特性 (4)

2.3 语音信号产生的数字模型 (5)

2.3.1激励源模型 (5)

2.3.2声道模型 (5)

2.3.3辐射模型 (6)

2.4语音信号的短时分析技术 (6)

2.4.1预滤波、采样、A/D变换 (6)

2.4.2加窗处理 (6)

2.4.3短时频谱 (7)

2.4.4短时能量和短时平均幅度 (7)

2.4.5短时过零率 (8)

2.5语音特性 (8)

2.6语音增强的基本理论 (9)

2.6.1噪声特性 (9)

2.7语音增强效果的评价方法 (10)

第三章谱减法的原理、算法及分析 (11)

3.1谱减法的原理 (11)

3.2 谱减法的实现与仿真 (14)

3.3小结 (16)

第四章DSP介绍及基于DSP实时语音处理系统的设计 (17)

4.1 DSP概述 (17)

4.1.1 DSP芯片的基本结构 (17)

4.1.2 DSP的运算速度 (19)

4.1.3 DSP应用系统 (20)

4.2基于DSP实时语音处理系统 (21)

4.2.1基于DSP实时语音处理系统的构成 (21)

4.2.2基于DSP实时语音处理系统的设计过程 (21)

4.2.3基于DSP实时语音处理系统的开发工具 (23)

第五章基于谱减法的语音增强在DSP环境下的实现 (25)

5.1基于谱减法的语音增强在DSP环境下实时实现系统的硬件组成 (25)

5.1.1实时谱减法语音增强系统的硬件介绍 (25)

5.2 CCS (Code Composer Studio) DSP集成开发环境 (27)

5.3基于谱减法的语音增强在DSP环境下的实时实现 (27)

5.3.1系统的工作原理 (27)

5.3.2实时系统的软件设计 (29)

5.3.3系统软件的调试 (32)

5.3.4实时系统在设计过程中的关键技术及解决方案 (32)

5.3.5实时系统主要技术指标及测试 (35)

第六章结论与展望 (37)

6.1本论文主要完成的工作 (37)

6.2有待进一步研究的问题 (37)

致谢 (38)

参考文献 (39)

附录外文文献 (40)

第一章绪论

1.1课题研究意义

当今世界正处在信息时代。计算机、电子和信息技术的高速发展,推动着人类社会向信息社会不断进步。语音是人类相互之间进行交流最自然和最方便的形式之一,语音通信是一种理想的人机通信方式。人们一直梦想有朝一日可以摆脱键盘或遥控设备的束缚,拥有更为友好、亲切的人机界面,使得计算机或家用电器可以听懂人的话语,看懂人的动作,执行人们所希望的任何任务,而语音数字信号处理正是其中一项至关重要的应用技术。语音数字信号处理是一门涉及面很广的交叉学科,研究领域涉及到信号处理、人工智能、模式识别、数理统计、神经生理学和语言学等许多学科,在数字语音通信、声控打印机、自动语音翻译和多媒体信息处理等许多方面都有着非常重要的应用。语音数字信号处理包含的内容十分泛,包括语音编码、语音识别、语音合成和语音增强等。在语音数字信号处理的诸多研究领域中,语音增强是语音数字信号处理系统进入实用阶段,保证语音识别系统、说话人识别系统和各种实际环境下语音编码系统性能的重要环节。人们在语音通信过程中不可避免地会受到来自周围环境、传输媒介乃至其他讲话者的干扰,使得接收者最终接收到的语音已非纯净的原始语音信号,而是受噪声污染的带噪语音信号。通常情况下,语音增强的主要目标是从带噪语音信号中提取尽可能纯净的原始语音。然而,由于干扰往往都是随机的、不确定的、复杂的,从带噪语音中提取完全纯净的语音几乎不可能。在这种情况下,语音增强的目的主要有两个:一是改进语音质量,消除背景噪声,这是一种客观度量;二是提高可懂度,使听者乐于接受,不感觉疲劳,这是一种主观度量,但这两个目的往往不能兼得。语音增强作为预处理手段,可以应用到许多领域中:(1)目前的语音识别系统大都工作在安静环境中,在噪声环境中尤其是强噪声环境,语音识别系统的识别率将受到严重影响。(2)语音生成模型是低速率参数编码的基础,当模型参数的提取受到混杂在语音中的背景噪声严重干扰时,重建语音的质量将急剧恶化,甚至完全不可懂。(3)在国家和社会安全方面,侦听信号常常含有较大的噪声,语音增强有助于提高侦听系统的效果,可以帮助侦察破案或获取情报。

(4)在医学领域中,在复杂语音环境下,帮助听力障碍的人获取正常人的听力,正确分辨说话人的位置,选择所听取的语音信号。

1.2国内外研究现状及发展背景

早在20世纪60年代,语音增强这个课题就己经引起了人们的注意。到了20世纪70年代,随着数字信号处理理论的不断发展,人们对语音增强技术的研究形成了一个高潮,些基础性成果,这使语音增强发展成为语音信号数字处理的一个重要分支。经典的谱相减法和维纳滤波方法就是在这一时期提出来的。但由于各种算法计算量问题,导致它们的实用性受到影响。进入80年代后,VLSL技术的发展为语音增强的实时处理提供了可能,同时也涌现了大量新的算法,在语音识别中使用的概念和方法又被借鉴到语音增强算法中。90年代后,移动通信的飞速发展为语音增强研究提供了现实的动力,由于对之增强效果仍然不够满意,又进行了新的尝试。比如将小波变换用于语音增强中,利用神经网络(ANN.Arificial Neural Net、vorks)进行语音增强,基于麦克风阵列的语音增强等。一直以来,针对不同的背景噪声或者某个特殊的应用要求,人们提出了各种新的语音增强算法。尽管这些算法在理论上还没有完全解决语音增强问题,但有些方法已经证明是有效的,并在实际的应用中被采用。

语音增强算法可从信号输入的通道数上分为单通道的语音增强算法与多通道的语音强算法。单通道语音系统在实际应用中较为常见,如电话,手机等。这种情况下语音与噪声同时存在一个通道中,语音信息与噪声信息必须从同一个信号中得出。一般这种语音系统要求噪声比较平稳,以便在非语音段对噪声进行估计,再依据估计出来的噪声对带噪的语音段进行处理。如果系统是一个多通道的语音系统,各个通道之阳极存在着某些相关的特性,这些相关特性对语音增强的处理十分有利。单通道语音增强是语音增强的基础。多年来,人们对宽带加性噪声的模型进行研究,提出了各种算法。尽管目前语音增强的理论还不成熟,但己有很多实用的算法。语音增强的算法从处理方法上大体上可以分为4类:噪声对消法,基于语音谱特征的谐波增强法,基于短时谱幅度估计的语音增强算法和基于参数估计的语音合成法。常用的方法有中心削波法,谱减法,自适应抵消法等。通过语音增强技术来改善语音质量的过程如图1-1所示。

谱减法由美国Utah大学的Steven F. Boll在1979年提出,Boll的研究起源是为了

改进噪声中的线性预测(LP-Linear Prediction)分析,随后发展成估计噪声频谱并进行扣

除的经典频谱减法。谱减法及其改进算法是一种基于短时谱估计的语音增强算法,由

于它的运算量相对较小,容易实时实现,而且增强的效果也较好,是目前最常用的语

音增强算法。本文将重点研究和实现基于谱减法语音增强方法。

图 1-1 语音增强处理改善语音质量

1.3主要研究内容

本论文采用数字信号处理和声学研究相结合的方法,围绕语音增强问题,展开研

究工作。在分析、研究语音增强算法的基础上,选择谱减增强算法作为本论文的算法,

利用计算机高级语言对增强算法进行仿真。在对高级语言仿真程序进行测试分析之

后,在系统上实现语音信号的增强。本文在结构上大致可以分为6个部分:绪论(第

一章)语音增强的基础知识(第二章);谱减法的原理、算法及分析(第三章);DSP

介绍及基于DSP 实时语音处理系统的设计(第四章);基于谱减法的语音增强在DSP

环境下的实时实现(第五章);总结与展望 (第六章)。

纯净

语音 信道 干扰语音和背景噪声 传输噪声

语音增强处理 增强语

第二章语音增强的基础知识

语音信号处理是一门综合性的学科,它研究如何用数字信号处理技术对语音信号进行处理,包括四大分支——语音识别,语音合成,语音编码和语音增强。在不同的分支中,研究的目标不同,所采用的处理方法亦是多种多样的,但总的来说,处理语音信号的目的是利用语音信号所携带的信息,以最简的方式去解决实际问题。这里,简要介绍一下语音信号处理的基础知识。

2.1语音的产生

产生语音的能量,来源于正常呼吸时肺部呼出的稳定气流。声带既是阀门,又是振动部件。由声带振动产生声音,是形成声音的基本声源。声带开启和闭合使气流形成一系列脉冲。每开启和闭合一次的时间即振动周期,称为基音周期,其倒数称为基音频率,简称为基频。基频决定了声音频率的高低,随发音人的性别、年龄及具体情况而定。语音中由声带振动产生的声音称为浊音,而不由声带振动产生的声音称为清音。

声道是由咽、口腔和鼻腔组成,是一个分布参数系统,可视为一谐振腔,它放大某一频率而衰减其它频率分量。讲话时,舌和唇连续运动,使声道常常改变外形和尺寸,即改变谐振频率。这些谐振频率称为共振峰频率,简称为共振峰,语音的频率特性主要是由共振峰决定的。声门脉冲序列具有丰富的谐波成分,这些频率成分与声道的共振频率之间相互作用的结果对音质有很大影响。

2.2 人的听觉特性

一个完整的语音通信系统总是涉及到说(语音的产生)和听(语音的接收)两个方面,正常人的听觉系统是极为灵敏的,人耳所能感觉的最低声压接近空气中分子热运动所产生的声压。正常人可听到声音的频率范围为:0.016kHz~16kHz的声音。当

两个响度不同的声音作用于人耳时,则响度较高频率成分的存在会影响到人耳对响度

较低频率成分的感受,使其变得不易被觉察,称之为掩蔽效应(Masking effect)。

2.3 语音信号产生的数字模型

语音是由空气流激励声道,最后从嘴唇或鼻孔辐射出来,语音声波由振动而产生

并借助于介质点的振动而传播。对于目前的大多数研究和应用,数学模型完全满足要

求,该模型中包括三个部分:激励源、声道模型和辐射模型。

图2-1语音信号产生的数学模型

2.3.1激励源模型

激励源分浊音和清音两个分支,按照浊音/清音开关所处的位置来决定产生的语

音是浊音还是清音。为了使浊音的激励信号具有声门气流脉冲的实际波形,需要使上

述的冲激序列通过一个声门脉冲模型滤波器。清音激励信号则由随机噪声发生器产

生。

2.3.2声道模型

声道可近似地看作是由多段均匀截面积的声管级联而成,采用流体力学的方法可

以推导出,N 节级联的无损声管的系统函数是一个N 阶的全极点函数:

∑=-=p i i

i

z a z v 01

)( (2-1) 基音频率

周期脉冲

发生器 声门脉冲模型G (Z ) Av 随机噪声

发生器

Au

声道模

型V(Z) 声道参数 辐射模型R(Z)

语音信

号s(n)

其中0a =1,i a 为实数,p 为全极点滤波器的阶。p 取得越大,模型的传输函数

与声道实际传输函数的吻合程度越高,但同时也增加了算法的复杂程度。

2.3.3辐射模型

声道的终端为口和唇,因此辐射模型与嘴型有关。经研究表明,口唇端辐射在高

频端较为显著,在低频端时影响较小。口唇的辐射效应可表示为:

)1()(10--=z R z R (2-2)

综上所述,完整的语音信号数字模型可以用三个子模型:激励模型、声道模型和

辐射模型的串联来表示。其转移函数为:

)()()()(Z R z V z U z H = (2-3)

2.4语音信号的短时分析技术

语音信号是一种非平稳的时变信号,产生过程与发音器官的运动密切相关,而这

种物理运动比起声音振动速度要缓慢得多,因此语音信号常常假定为短时平稳的,即

在10~30ms 时间段内,其频谱特性和某些物理特征参量可近似地看作是不变的。所

以把每个短时的语音段称为一个分析帧,对该帧进行处理就相当于对固定特性的持续

语音进行处理。分析帧可以是连续的,也可以是交叠分帧。

2.4.1预滤波、采样、A/D 变换

预滤波的目的有两个:(1)抑制输入信号各频域分量中频率超出2

s f (s f 为采样率)以防止混叠干扰。(2)抑制50Hz 的电源干扰。这样,预滤波器必须是一个带通滤波器,

其上、下截至频率分别是H f 和L f 。对于绝大多数语音编码器,H f =3400Hz ,L f =60~

100Hz ,采样率为s f =8kHz 。语音信号经预滤波和采样后,由A/D 变换器变换为二进

制数字码。

2.4.2加窗处理

通常采用一个长度有限的窗函数w(n)来乘语音信号s(n),从而形成加窗语音)(n s w

=s(n)·w(n)。理想的窗函数的频率响应要求,主瓣无限狭窄且没有旁瓣(无频谱泄漏),

但在实际过程中无法实现。根据不同应用,通常采用矩形窗、海明窗和汉宁窗等窗函

数来逼近理想的频率响应。

矩形窗主瓣最小,但旁瓣最高;海明窗具有最宽的主瓣和最低的旁瓣高度。从应

用的角度来说,矩形窗有最高的频域分辨率,但泄漏较高,海明窗可以有效克服泄漏

现象,具有平滑的低通特性。

2.4.3短时频谱

加窗信号)(n s w 的离散傅立叶(DTFT )))(exp(ωωj s 称为s(n)的短时频谱,可以用

下面公式计算:

∑-=-=10

)exp()())(exp(N n n j n s j S ωωωω (2-4)

2))(exp(ωωj s 称为s(n)的短时功率谱。假设s(n)的DTFT 是(exp())S j ω,且w(n )

的DTFT 是(exp())W j ω,那么(exp())S j ωω是(exp())S j ω和(exp())W j ω的周期卷积。在

语音信号数字处理中,都是采用n w s () 的离散傅立叶变换(DFT )()S k ω来代替

(exp())

S j ωω,并且可以用高效的快速傅立叶变换(FFT )算法完成由n w s () 至()S k ω的转换。为了使()S k ω具有较高的分辨率,所取的DFT 以及相应的FFT 点数1N 较n w s () 的

长度N 要大。例如,在通常采样率为8kHz 且帧长为20ms 时N =160,而1N 一般取为

256,512或1024。为了将n w s () 的点数从N 扩大为1N ,可以在扩大的部分添若干的

0采样值。

2.4.4短时能量和短时平均幅度

语音信号的一帧内的能量称为短时能量,用m E 表示:

[][]∑∑

∞-∞=-+=-=-=

m N n n m m n w m x m n w m x Em 122)()()()( (2-5) 短时能量为一帧样点值的加权平方和。可以由它的量值粗略判别语音信号的有

无,同时也可以由它判断该帧是浊音还是清音。

短时能量的一个主要问题是对于信号电平值过于敏感,而且需要计算信号样值的

平方和,在定点实现时很容易溢出。为了克服这个缺点,定义短时平均幅度m M 来衡

量语音幅度的变化。

∑-+=-=1)()(1N n n m m m n w n x N M (2-6)

但 m M 的动态范围(最大值与最小值之比)要比短时能量小,接近于短时能量计

算的平方根,所以用m M 区分清音/浊音、无/有声不如短时能量明显。

2.4.5短时过零率

短时过零率其定义为:

∑∑-+=∞

-∞=---=

---=

1)

()]1(sgn[)](sgn[)()]1(sgn[)](sgn[N n n m m n m n w n x n x m n w n x n x Z (2-7) 其中sgn[·]表示取符号,即

01

1]sgn[<≥???-=x x x (2-8) 由短时过零率可以概略地得到信号的变化快慢。短时过零率也可以表征清音帧与

浊音帧,及区别语音的有无。但过零率容易收到噪声电平的扰动。一般实际应用中多

设置一个门限电平,以使过零率检测有一定的抗干扰性。准确地检测语音开始需要用

短时能量和短时过零率配合检测。

2.5语音特性

1.语音是一个时变的、非平稳随机过程

人类发声系统的生理结构的变化速度是有限的,在10~30ms 时间段内具有相对

稳定性,可以认为其特性是不变的,因此语音的短时谱分析也有相对稳定性。

2.语音大体上可以分为清音和浊音两大类

浊音在时域上呈现出明显的周期性,在频域上有共振峰结构,而且能量大部分集

中在较低频段内;清音则没有明显的时域和频域特征,类似于白噪声。

3.语音感知对语音增强研究有重要作用

语音增强效果的最终度量是人的主观感受。人耳对背景噪声有惊人的抑制作用,了解其中机理将大大有助于语音增强技术的发展。

(1)人耳对语音的感知是通过语音信号中各频谱分量幅度获得的,对各分量的相位则不敏感;

(2)人耳对频谱分量强度的感受是频率和能谱的二元函数,响度与频谱幅度的对数成正比;

(3)人耳有掩蔽效应,掩蔽的程度是声音强度与频率的二元函数。对频率临近分量的掩蔽要比频差大的分量有效得多;

(4)短时谱中的共振峰对语音的感知十分重要,特别是第二共振峰比第一共振峰更重要。因此对语音信号进行一定程度的低通滤波不会对可懂度造成影响。

2.6语音增强的基本理论

2.6.1噪声特性

噪声可以分为加性噪声和噪声。对于乘性噪声,有些可以通过变换而转变为加性噪声。加性噪声大致上有:周期性噪声、脉冲噪声、宽带噪声和同声道其它语音的干扰等。

1.周期性噪声

具有许多离散的线谱,主要来源于发动机等周期性运转的机械,可以用梳状滤波器予以抑制。然而,实际中产生的周期性噪声是由许多窄谱带组成,并且往往是时变的,且与语音信号频谱重叠,所以必须采用自适应滤波的方法才有可能自动识别和区分噪声分量。

2.脉冲噪声

表现为时域波形中突然出现的窄脉冲,来源于爆作、撞击和放电等。可根据带噪语音信号幅度的平均值确定阀值,当信号幅度超出阀值时,判别为脉冲噪声,然后对它进行适当的衰减;也可以根据相邻信号样值通过内插的方法,在时域上进行平滑。3.宽带噪声

宽带噪声来源很多,热噪声、气流(风、呼吸)噪声及各种随机噪声源,量化噪声也可视为宽带噪声。由于它与语音信号在时域和频域上完全重叠,因而消除最为困难。

这种噪声只有在语音间歇期才单独存在。对于平稳的宽带噪声,通常可以认为是白色高斯噪声。不具有白色频谱的噪声,可以先进行预白化处理。

4.同声道语音干扰

人耳可以在两人以上讲话环境中分辨出所需的声音,这种分辨能力是人体内部语音理解机理所具有的感知能力,来源于人的双耳输入效应,称之为“鸡尾酒会效应”。但当多个语音叠合在一起,在单信道传输时,双耳信号因合并而消失。

5.背景噪声对发声的影响

强噪声不仅会使人疲劳,而且还对讲话人产生影响,使讲话人改变了在安静环境或低噪声环境中的发音方式,从而改变了语音的特性参数,这称为“Lombard”效应,它对语音识别系统有很大影响。

2.7语音增强效果的评价方法

语音增强效果可以用主观测量或客观测量来评价。主观测试方法有:平均意见得分(MOS)、判断韵字测试(DRT)和判断满意度测试(DAM)等。

主观评定方法符合人类听话时对语音质量的感觉,目前得到了广泛的应用。其中,MOS采用五级评分标准。参加测试的实验者在听完所测语音后,从五个等级中选择某一级作为他对所测语音质量的评定。全体实验者的平均分就是所测语音质量的MOS分。DRT是反映清晰度或可懂度的一种测试方法,使用若干对同韵母进行测试,其主要用于低速率语音编码的质量测试。DAM是对话音质量的综合评估,它是在多种条件下对话音质量可接受程度的一种度量,也采用百分比评分。

至于客观测试方法,可以直接观测语音的时域/频域波形,也可以给出客观的数值度量,通常采用原始语音信号功率与归一化后的增强语音和原始语音之差的功率比值来度量,简称信噪比(SNR)。

第三章 谱减法的原理、算法及分析

3.1谱减法的原理

谱减法是消除噪声的经典算法,它是处理宽带噪声最通用的技术,即从带噪语音

估计值中减去噪声频谱估计值,而得到纯净语音的频谱。本文基于MATLAB 对谱减法进行设计和实现。仿真表明,谱减法可以有效的降低背景噪声,提高信噪比。

谱减法在频域将带噪语音的功率谱减去噪声的功率谱得到纯净语音功率谱估计,

开方后就得到语音幅度谱估计,用带噪语音的相位来近似纯净语音的相位,在采用反傅里叶变换恢复时域信号。它的优点是比较简单,只需要进行正反傅里叶变换,而且实时实现较容易。

假定语音为平稳信号,而噪声和语音为加性信号且彼此不相关。此时带噪语音信

号可表示为

N n n d n s n y ≤≤+=0)()()( (3-1)

式中,s(n)为纯净语音信号,d(n)为平稳加性高斯噪声,y(n)为加窗后的带噪信号。

因为减谱法不需分析语音信号的频谱特性,所以本文采用矩形窗函数。设y(n)的傅里叶系数为[]k k k Y Y exp j θ=,s(n)的傅立叶系数为[]k k k S S exp j ?=,d(n)的傅立叶系数为k N ,由(3-1),则有k k k Y S N =+。语音增强的任务就是利用估计的噪声功率谱信息,从k Y 中得到k S 。由于人耳对相位不敏感,所以只要估计出k S ,然后借用带噪语音相位,进行反傅立叶变换后就可以得到增强的语音。减谱法的原理框图如图3-1所示:

y (n )经FFT 变化后,有k k k Y S N =+,由此可得

k k k k k k k N S N S N S Y *

*+++=222 (3-2)

其中,*表示共轭。因为假定噪声为不相关的,所以k S 与k N 独立,互谱的统计平均值

为0,而k N 为零均值的高斯分布,所以有 [][][]2

22k

k k N E S E Y E += (3-3)

图3-1 谱减法原理框图

因为噪声是局部平稳的,故认为发语音前和发语音期间的噪声功率谱相同,所以

可以利用发语音前(或后)的“寂静帧”来估计噪声。对于一个分析帧内的时平稳过

程,有: )(22k S Y n k k λ+= (3-4)

其中,n λ (k)为无语音时2k N 的统计平均值,即n λ (k)=2k E N ?? ??

。由此可得原始语音的估计值: y(i)

有/无语音

判决 有语音

无语音 更新噪声谱估计 噪声谱方差

FFT 带噪信号

功率

增强后的语音信号功率

插入相位 IFFT s(i)

[][]21

22

122)()(?k Y N E Y S n k k k

k λ-=-= (3-5) 定义第k 个频谱分量的增益函数k k k Y S G ?=

以及后验信噪比)(2k Y n k k λγ= 则

(3-5)可以改写为 2

1)11(k k G γ-= (3-6) 由(3-6)可以清楚地看出谱相减的物理意义:它相当于对带噪语音的每一个频

谱分量乘以一个系数k G 。当信噪比高时,含语音的可能性很大,衰减小。反之,则

认为含有语音的可能性小,衰减则增大。

应该看到,如果假设k Y 具有高斯分布,则谱相减法相当于对k S 作最大似然估计。

因为此时有

???

???????????+-+=))((exp ))((1)(222k n k k n k k S k Y S k S Y P λλπ (3-7) 令 0)

(=??k

k k S S Y P

则有 []21

2)(?k Y S n k k λ-= (3-8)

这一结果与公式(3-5)相同。如果不给定k Y 的分布,则此时k S 的最大似然估计

式可以用如下方法求得: ???

????????????--=?)(exp exp )(1),(2k j S Y k S Y P n k k k n k k k λπλ (3-9) 通过积分消去k ?后,有

??

??????????????+-=)(2)(exp )(1)(022k S Y I k S Y k S Y P n k k n k k n k k λλπλ (3-10) 其中)(0?I 为第0阶修正贝赛尔函数

令 0)

(=??k k k S S Y P 则解方程后就可以得到k

S ?的估计式。 由于存在I 0(·),直接求解有一定的困难。为此需要采取一定的简化措施。因为

当x ≥3

??????-+=)(21?2k Y Y S n k k k λ (3-11) 时,有x x x I π2)

exp()(0≈,所以在较高信噪比条件下,解方程可以得到。

谱减法作为处理宽带噪声的传统方法,对于整个语音段采用减去相同噪声功率谱

的方法,这样,使得在实际中不能达到很理想的效果。因为:

1、语音的能量往往集中在某些频段内,在这些频段内的幅度相对较高,尤其是

共振峰处的幅度一般远大于噪声,因此,不应在整个语音段减去相同噪声功率谱;

2、由于在谱减法处理过程中,是以无声期间统计平均的噪声方差代替当前分析

帧各频率点的噪声频率分量。而宽带噪声服从高斯分布,它的能量统计特性服从正态

分布,对应的噪声帧功率谱也就随机变化,服从高斯分布,即其幅度随机变化的范围

很宽,其最大值、最小值之比往往达到几个数量级,而最大值与平均值之比也可达6-8

倍,只有对它做长期平均才能得到较平坦的谱。因此相减时,若该帧某频率点噪声分

量较大,谱减后就会有很大的残余噪声保留。

3.2 谱减法的实现与仿真

基于MATLAB 实现谱减法的仿真,其程序流程图如图3-2所示:

图3-2 谱减法语音增强仿真实现流程图

谱减法是利用噪声的统计平稳性以及加性噪声与语音不相关的特点而提出的一

种语音增强方法。这种方法没用使用参考噪声源,但它假设噪声是统计平稳的,即有

语音期间噪声幅度谱的期望值与无语音间隙噪声的幅度谱的期望值相等。用无语音间

隙测量计算得到的噪声频谱的估计值取代有语音期间噪声的频谱,与含噪声频谱相

减,得到语音频谱的估计值。当上述差值得到负的幅度时,将其置零。由于人耳对语

音的感知主要是通过语音信号中各频谱分量幅度获得的,对各分量的相位不敏感。因

此,此类语音增强方法将估计的对象放在短时谱幅度上。图3-3是在MATLAB 环境 读入语音文件 产生随机白噪声

带噪语音

加汉明窗,帧间重叠50%

短时FFT 短时相位谱

短时幅度谱

短时噪声幅度谱估计

— + 差值>0? 将差值置为零 频域中

合成语音

N Y

短时IFFT 并各帧重叠相加

去除汉明窗引起的增益

增强后的语音

下谱减法的仿真效果。

图3-3 谱减法的仿真效果

3.3小结

综合前面的讨论,现将谱减法总结如下:

1.谱减法在静音帧时估计噪声幅值谱,并且假设在其后的语音帧里噪声谱基本稳定,从带噪信号谱中扣除噪声谱,并利用人耳“相盲”这一特点,将得到的幅值和带噪信号的相位结合形成语音估计谱。

2.谱减方法的优点在于方法较简单(只需要进行傅立叶正、反变换),而且得到的增强结果和其它更复杂方法的结果相当甚至更好。

3.该方法会造成“音乐噪声”,这是因为实际噪音谱相对于估计谱的随机变化造

语音信号处理与及其MATLAB实现分析

目录 摘要 (2) 第一章绪论 (3) 1.1 语音课设的意义 (3) 1.2 语音课设的目的与要求 (3) 1.3 语音课设的基本步骤 (3) 第二章设计方案论证 (5) 2.1 设计理论依据 (5) 2.1.1 采样定理 (5) 2.1.2 采样频率 (5) 2.1.3 采样位数与采样频率 (5) 2.2 语音信号的分析及处理方法 (6) 2.2.1 语音的录入与打开 (6) 2.2.2 时域信号的FFT分析 (6) 2.2.3 数字滤波器设计原理 (7) 2.2.4 数字滤波器的设计步骤 (7) 2.2.5 IIR滤波器与FIR滤波器的性能比较 (7) 第三章图形用户界面设计 (8) 3.1 图形用户界面概念 (8) 3.2 图形用户界面设计 (8) 3.3 图形用户界面模块调试 (9) 3.3.1 语音信号的读入与打开 (9) 3.3.2 语音信号的定点分析 (9) 3.3.3 N阶高通滤波器 (11) 3.3.4 N阶低通滤波器 (12) 3.3.5 2N阶带通滤波器 (13) 3.3.6 2N阶带阻滤波器 (14) 3.4 图形用户界面制作 (15) 第四章总结 (18) 附录 (19) 参考文献 (24)

摘要 数字信号处理是将信号以数字方式表示并处理的理论和技术。数字信号处理与模拟信号处理是信号处理的子集。 数字信号处理的目的是对真实世界的连续模拟信号进行测量或滤波。因此在进行数字信号处理之前需要将信号从模拟域转换到数字域,这通常通过模数转换器实现。而数字信号处理的输出经常也要变换到模拟域,这是通过数模转换器实现的。 数字信号处理的算法需要利用计算机或专用处理设备如数字信号处理器(DSP)和专用集成电路(ASIC)等。数字信号处理技术及设备具有灵活、精确、抗干扰强、设备尺寸小、造价低、速度快等突出优点,这些都是模拟信号处理技术与设备所无法比拟的。 数字信号处理的核心算法是离散傅立叶变换(DFT),是DFT使信号在数字域和频域都实现了离散化,从而可以用通用计算机处理离散信号。而使数字信号处理从理论走向实用的是快速傅立叶变换(FFT),FFT的出现大大减少了DFT的运算量,使实时的数字信号处理成为可能、极大促进了该学科的发展。 MATLAB是矩阵实验室(Matrix Laboratory)的简称,和Mathematica、Maple 并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。 MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完相同的事情简捷得多,并且mathwork也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也加入了对C,FORTRAN,C++ ,JAVA的支持。可以直接调用,用户也可以将自己编写的实用程序导入到MATLAB函数库中方便自己以后调用,此外许多的MATLAB爱好者都编写了一些经典的程序,用户可以直接进行下载就可以用。

matlab语音信号采集与初步处理要点

《matlab与信号系统》实验报告 学院: 学号: 姓名: 考核实验——语音信号采集与处理初步 一、课题要求 1.语音信号的采集 2.语音信号的频谱分析 3.设计数字滤波器和画出频率响应 4.用滤波器对信号进行滤波 5.比较滤波前后语音信号的波形及频谱 6.回放和存储语音信号 (第5、第6步我放到一起做了) 二、语音信号的采集 本段音频文件为胡夏演唱的“那些年”的前奏(采用Audition音频软件进行剪切,时长17秒)。运行matlab软件,在当前目录中打开原音频文件所在的位置,采用wavread函数对其进行采样,并用sound函数可进行试听,程序运行之后记下采样频率和采样点。 利用函数wavread对语音信号的采集的程序如下: clear; [y,fs,bits]=wavread('music.wav'); %x:语音数据;fs:采样频率;bits:采样点数sound(y,fs,bits); %话音回放 程序运行之后,在工作区间中可以看到采样频率fs=44100Hz,采样点bits=16

三、语音信号的频谱分析 先画出语音信号的时域波形,然后对语音号进行快速傅里叶变换,得到信号的频谱特性。语音信号的FFT频谱分析的完整程序如下: clear; [y,fs,bits]=wavread('music.wav'); %x:语音数据;fs:采样频率;bits:采样点数sound(y,fs,bits); %话音回放 n = length (y) ; %求出语音信号的长度 Y=fft(y,n); %傅里叶变换 subplot(2,1,1); plot(y); title('原始信号波形'); subplot(2,1,2); plot(abs(Y)); title('原始信号频谱'); 程序结果如下图: 四、设计数字滤波器和画出频率响应 根据语音信号的特点给出有关滤波器的性能指标: 1)低通滤波器性能指标,fp=1000Hz,fc=1200 Hz,As=100dB,Ap=1dB; 2)高通滤波器性能指标,fc=4800 Hz,fp=5000 Hz As=100dB,Ap=1dB。

基于Matlab的语音信号处理与分析

系(院)物理与电子工程学院专业电子信息工程题目语音信号的处理与分析 学生姓名 指导教师 班级 学号 完成日期:2013 年5 月 目录 1 绪论.............................................................................................................. 错误!未定义书签。 1.1课题背景及意义................................................................................. 错误!未定义书签。 1.2国内外研究现状................................................................................. 错误!未定义书签。 1.3本课题的研究内容和方法................................................................. 错误!未定义书签。 1.3.1 研究内容................................................................................ 错误!未定义书签。 1.3.2 开发环境................................................................................ 错误!未定义书签。 2 语音信号处理的总体方案............................................................................ 错误!未定义书签。 2.1 系统基本概述.................................................................................... 错误!未定义书签。 2.2 系统基本要求与目的........................................................................ 错误!未定义书签。 2.3 系统框架及实现................................................................................ 错误!未定义书签。 2.3.1 语音信号的采样.................................................................... 错误!未定义书签。 2.3.2 语音信号的频谱分析............................................................ 错误!未定义书签。 2.3.3 音乐信号的抽取.................................................................... 错误!未定义书签。 2.3.4 音乐信号的AM调制.............................................................. 错误!未定义书签。 2.3.5 AM调制音乐信号的同步解调............................................... 错误!未定义书签。 2.4系统设计流程图................................................................................. 错误!未定义书签。 3 语音信号处理基本知识................................................................................ 错误!未定义书签。 3.1语音的录入与打开............................................................................. 错误!未定义书签。 3.2采样位数和采样频率......................................................................... 错误!未定义书签。 3.3时域信号的FFT分析......................................................................... 错误!未定义书签。 3.4切比雪夫滤波器................................................................................. 错误!未定义书签。 3.5数字滤波器设计原理......................................................................... 错误!未定义书签。 4 语音信号实例处理设计................................................................................ 错误!未定义书签。 4.1语音信号的采集................................................................................. 错误!未定义书签。

基于matlab的语音信号的采集与处理

文档从互联网中收集,已重新修正排版,word格式支持编辑,如有帮助欢迎下载支持。 目录 第1章前言 ................................................................................................... 错误!未定义书签。第2章语音信号分析处理的目的和要求 ................................................... 错误!未定义书签。 2.1MATLAB软件功能简介................................................................. 错误!未定义书签。 2.2课程设计意义 .................................................................................. 错误!未定义书签。第3章语音信号的仿真原理..................................................................... 错误!未定义书签。第4章语音信号的具体实现..................................................................... 错误!未定义书签。 4.1语音信号的采集................................................................................ 错误!未定义书签。 4.2语音信号加噪与频谱分析................................................................ 错误!未定义书签。 4.3设计巴特沃斯低通滤波器................................................................ 错误!未定义书签。 4.4用滤波器对加噪语音滤波................................................................ 错误!未定义书签。 4.5比较滤波前后语音信号波形及频谱................................................ 错误!未定义书签。第5章总结................................................................................................... 错误!未定义书签。参考文献......................................................................................................... 错误!未定义书签。附录................................................................................................................. 错误!未定义书签。

基于MATLAB的语音信号滤波处理

基于MATLAB的语音信号滤波处理 题目:基于MATLAB的语音信号滤波处理 课程:数字信号处理 学院:电气工程学院 班级: 学生: 指导教师: 二O一三年十二月

目录CONTENTS 摘要 一、引言 二、正文 1.设计要求 2.设计步骤 3.设计内容 4.简易GUI设计 三、结论 四、收获与心得 五、附录

一、引言 随着Matlab仿真技术的推广,我们可以在计算机上对声音信号进行处理,甚至是模拟。通过计算机作图,采样,我们可以更加直观的了解语音信号的性质,通过matlab编程,调用相关的函数,我们可以非常方便的对信号进行运算和处理。 二、正文 2.1 设计要求 在有噪音的环境中录制语音,并设计滤波器去除噪声。 2.2 设计步骤 1.分析原始信号,画出原始信号频谱图及时频图,确定滤波器类型及相关指标; 2.按照类型及指标要求设计出滤波器,画出滤波器幅度和相位响应,分析该滤波器是否符合要求; 3.用所设计的滤波器对原始信号进行滤波处理,画出滤波后信号的频谱图及时频图; 4.对滤波前的信号进行分析比对,评估所设计滤波器性能。 2.3 设计内容 1.原始信号分析

分析信号的谱图可知,噪音在1650HZ和3300HZ附近的能量较高,而人声的能量基本位于1000HZ以下。因此,可以设计低通滤波器对信号进行去噪处理。 2.IIR滤波器设计 用双线性变换法分别设计了巴特沃斯低通滤波器和椭圆低通滤波器和带阻滤波器: ①巴特沃斯滤波器 fp=800;fs=1300;rs=35;rp=0.5; 程序代码如下: fp=800;fs=1300;rs=35;rp=0.5;Fs=44100; wp=2*Fs*tan(2*pi*fp/(2*Fs));ws=2*Fs*tan(2*pi*fs/(2*Fs)); [n,wn]=buttord(wp,ws,rp,rs,'s'); [b,a]=butter(n,wn,'s'); [num,den]=bilinear(b,a,Fs); [h,w]=freqz(num,den,512,Fs);

基于MATLAB的语音信号处理系统设计(程序+仿真图)--毕业设计

语音信号处理系统设计 摘要:语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。语音信号处理的目的是得到某些参数以便高效传输或存储,或者是用于某种应用,如人工合成出语音、辨识出讲话者、识别出讲话内容、进行语音增强等。本文简要介绍了语音信号采集与分析以及语音信号的特征、采集与分析方法,并在采集语音信号后,在MATLAB 软件平台上进行频谱分析,并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器滤除噪声,恢复原信号。利用MATLAB来读入(采集)语音信号,将它赋值给某一向量,再将该向量看作一个普通的信号,对其进行FFT变换实现频谱分析,再依据实际情况对它进行滤波,然后我们还可以通过sound命令来对语音信号进行回放,以便在听觉上来感受声音的变化。 关键词:Matlab,语音信号,傅里叶变换,滤波器 1课程设计的目的和意义 本设计课题主要研究语音信号初步分析的软件实现方法、滤波器的设计及应用。通过完成本课题的设计,拟主要达到以下几个目的: 1.1.了解Matlab软件的特点和使用方法。 1.2.掌握利用Matlab分析信号和系统的时域、频域特性的方法; 1.3.掌握数字滤波器的设计方法及应用。 1.4.了解语音信号的特性及分析方法。 1.5.通过本课题的设计,培养学生运用所学知识分析和解决实际问题的能力。 2 设计任务及技术指标 设计一个简单的语音信号分析系统,实现对语音信号时域波形显示、进行频谱分析,

利用滤波器滤除噪声、对语音信号的参数进行提取分析等功能。采用Matlab设计语言信号分析相关程序,并且利用GUI设计图形用户界面。具体任务是: 2.1.采集语音信号。 2.2.对原始语音信号加入干扰噪声,对原始语音信号及带噪语音信号进行时频域分析。 2.3.针对语音信号频谱及噪声频率,设计合适的数字滤波器滤除噪声。 2.4.对噪声滤除前后的语音进行时频域分析。 2.5.对语音信号进行重采样,回放并与原始信号进行比较。 2.6.对语音信号部分时域参数进行提取。 2.7.设计图形用户界面(包含以上功能)。 3 设计方案论证 3.1语音信号的采集 使用电脑的声卡设备采集一段语音信号,并将其保存在电脑中。 3.2语音信号的处理 语音信号的处理主要包括信号的提取播放、信号的重采样、信号加入噪声、信号的傅里叶变换和滤波等,以及GUI图形用户界面设计。 Ⅰ.语音信号的时域分析 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和变换域等处理方法,其中时域分析是最简单的方法。 Ⅱ.语音信号的频域分析 信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更

基于matlab的语音信号滤波处理——数字信号处理课程设计

数字信号处理课程设计 题目:基于matlab的语音信号滤波处理学院:物理与电子信息工程 专业:电子信息工程 班级: B07073041 学号: 200932000066 姓名:高珊 指导教师:任先平

摘要: 语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴学科,是目前发展最为迅速的学科之一,通过语音传递信息是人类最重要,最有效,最常用和最方便的交换信息手段,所以对其的研究更显得尤为重要。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换成离散的数据文件,然后用起强大的矩阵运算能力处理数据。这为我们的本次设计提供了强大并良好的环境! 本设计要求自己录制一段自己的语音后,在MATLAB软件中采集语音信号、回放语音信号并画出语音信号的时域波形和频谱图。再在Matlab中分别设计不同形式的FIR数字滤波器。之后对采集的语音信号经过不同的滤波器(低通、高通、带通)后,观察不同的波形,并进行时域和频谱的分析。对比处理前后的时域图和频谱图,分析各种滤波器对于语音信号的影响。最后分别收听进行滤波后的语音信号效果,做到了解在怎么样的情况下该用怎么样的滤波器。

目录 1.设计内容 (4) 2.设计原理 (4) 2.1语音信号的时域分析 (4) 2.2语音信号的频域分析 (5) 3.设计过程 (5) 3.1实验程序源代码 (6) 3.1.1原语音信号时域、频域图 (6) 3.1.2低通滤波器的设计 (6) 3.1.3高通滤波器的设计 (7) 3.1.4带通滤波器的设计 (8) 3.1.5语音信号的回放 (9) 3.2调试结果描述 (10) 3.3所遇问题及结果分析 (15) 3.3.1所遇主要问题 (16) 3.3.2结果分析 (16) 4.体会与收获 (17) 5.参考文献 (17)

语音信号处理matlab实现

短时能量分析matlab源程序: x=wavread('4.wav'); %计算N=50,帧移=50时的语音能量 s=fra(50,50,x);%对输入的语音信号进行分帧,其中帧长50,帧移50 s2=s.^2;%一帧内各种点的能量 energy=sum(s2,2);%求一帧能量 subplot(2,2,1); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=50'); axis([0,500,0,30]) %计算N=100,帧移=100时的语音能量 s=fra(100,100,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,2); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=100'); axis([0,300,0,30]) %计算N=400,帧移=400时的语音能量 s=fra(400,400,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,3); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=400'); axis([0,60,0,100]) %计算N=800,帧移=800时的语音能量 s=fra(800,800,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,4); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=800'); axis([0,30,0,200]) 分帧子函数: function f=fra(len,inc,x) %对读入语音分帧,len为帧长,inc为帧重叠样点数,x为输入语音数据 fh=fix(((size(x,1)-len)/inc)+1);%计算帧数 f=zeros(fh,len);%设一个零矩阵,行为帧数,列为帧长 i=1;n=1; while i<=fh %帧间循环 j=1; while j<=len %帧内循环 f(i,j)=x(n); j=j+1;n=n+1; end n=n-len+inc;%下一帧开始位置 i=i+1; end

基于MATLAB的有噪声语音信号处理毕设

大学本科毕业设计论文 基于MATLAB的有噪声语音信号处理

摘要 滤波器设计在数字信号处理中占有极其重要的地位,FIR数字滤波器和IIR 滤波器是滤波器设计的重要组成部分。Matlab功能强大、简单易学、编程效率高,深受广大科技工作者的欢迎。特别是Matlab还具有信号分析工具箱,不需具备很强的编程能力,就可以很方便地进行信号分析、处理和设计。利用MATLAB信号处理工具箱可以快速有效地设计各种数字滤波器。课题基于MATLAB 有噪音语音信号处理的设计与实现,综合运用数字信号处理的理论知识对加噪声语音信号进行时域、频域分析和滤波。通过理论推导得出相应结论,再利用MATLAB作为编程工具进行计算机实现。在设计实现的过程中,使用窗函数法来设计FIR数字滤波器,用巴特沃斯、切比雪夫和双线性变法设计IIR数字滤波器,并利用MATLAB作为辅助工具完成设计中的计算与图形的绘制。通过对对所设计滤波器的仿真和频率特性分析,可知利用MATLAB信号处理工具箱可以有效快捷地设计FIR和IIR数字滤波器,过程简单方便,结果的各项性能指标均达到指定要求。 关键词?数字滤波器;MATLAB;窗函数法;巴特沃斯; 切比雪夫; 双线性变换

Abstract ?Filterdesignin digital signal processingplaysan extre melyimportant role, FIR digital filters and IIR filter is an importan tpart of filter design.Matlab is powerful,easy to learn,programming efficiency,which was welcomed bythemajority ofsc ientists. Matlab alsohas a particular signalanalysis toolbox,it need nothave strongprogrammingskills can be easily signal analysis, processing and design. Using MATLAB Signal Processing Toolbox can quickly andefficiently design avarietyof digitalfilters. MATLAB basedon the noise issuespeech signal processing design and implementation of digital signalprocessing integrated use of the theoretical knowledge ofthe speechsignal plus noise, time domain, frequencydomainanalysis andfiltering. Thecorrespondingresults obtainedthroughtheoreticalderivation, and then use MATLAB as a programming toolfor computer implementation.Implemented inthe design process,usingthewindow function methodtodesign FIR digital filters with Butterworth, Chebyshev andbilinear Reform IIR digital filter design and use ofMATLAB as asupplementary tool to complete thecalculation and graphic design Drawing. Throughthesimulation of thedesigned filter and the frequency analysis shows thatusingMatlabSignal Processing Toolbox can quickly and easily design digital filters FIR andIIR,the processis simple and convenient, the results of the performance indicators to meetthe specifiedrequirements. ? Keywords: digital filter; MATLAB;Chebyshev;Butterworth;

基于某MATLAB地语音信号采集与处理

工程设计论文 题目:基于MATLAB的语音信号采集与处理 姓名: 班级: 学号:

指导老师: 一.选题背景 1、实践意义: 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在于方便有效地提取并表示语音信号所携带的信息。所以理解并掌握语音信号的时域和频域特性是非常重要的。 通过语音相互传递信息是人类最重要的基本功能之一.语言是人类特有的功能.声音是人类常用工具,是相互传递信息的最重要的手段.虽然,人可以通过多种手段获得外界信息,但最重要,最精细的信息源只有语言,图像和文字三种.与用声音传递信息相比,显然用视觉和文字相互传递信息,其效果要差得多.这是因为语音中除包含实际发音容的话言信息外,还包括发音者是谁及喜怒哀乐等各种信息.所以,语音是人类最重要,最有效,最常用和最方便的交换信息的形式.另一方面,

语言和语音与人的智力活动密切相关,与文化和社会的进步紧密相连,它具有最大的信息容量和最高的智能水平。 语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,处理的目的是用于得到某些参数以便高效传输或存储;或者是用于某种应用,如人工合成出语音,辨识出讲话者,识别出讲话容,进行语音增强等. 语音信号处理是一门新兴的学科,同时又是综合性的多学科领域,是一门涉及面很广的交叉学科.虽然从事达一领域研究的人员主要来自信息处理及计算机等学科.但是它与语音学,语言学,声学,认知科学,生理学,心理学及数理统计等许多学科也有非常密切的联系. 语音信号处理是许多信息领域应用的核心技术之一,是目前发展最为迅速的信息科学研究领域中的一个.语音处理是目前极为活跃和热门的研究领域,其研究涉及一系列前沿科研课题,巳处于迅速发展之中;其研究成果具有重要的学术及应用价值. 数字信号处理是利用计算机或专用处理设备,以数值计算的方法对信号进行采集、抽样、变换、综合、估值与识别等加工处理,借以达到提取信息和便于应用的目的。它在语音、雷达、图像、系统控制、通信、航空航天、生物医学等众多领域都获得了极其广泛的应用。具有灵活、精确、抗干扰强、度快等优点。 数字滤波器, 是数字信号处理中及其重要的一部分。随着信息时代和数字技术的发展,受到人们越来越多的重视。数字滤波器可以通过数

matlab报告基于matlab有噪声语音信号处理

Matlab课程设计报告题目:基于MATLAB有噪声语音信号处理 系(院):计算机与信息工程学院 专业:通信工程 班级:10623102 指导教师: 学年学期:2011 ~ 2012 学年第2 学期

简介: 我们通信工程专业在实践中经常碰到需要对已接收信号进行处理的情况,而滤波器设计在数字信号处理中占有极其重要的地位。本课题基于MATLAB有噪音语音信号处理的设计与实现,综合运用数字信号处理的理论知识对加噪语音信号进行时域、频域分析和滤波。通过理论推导得出相应结论,再利用MATLAB作为编程工具进行计算机实现。在设计实现的过程中,我们使用双线性变换法设计IIR数字滤波器,对模拟加噪语音信号进行低通滤波、高通滤波及带通滤波,并利用MATLAB作为辅助工具完成设计中的计算与图形的绘制。 1 绪论: 数字信号处理是利用计算机或专用处理设备,以数值计算的方法对信号进行采集、抽样、变换、综合、估值与识别等加工处理,借以达到提取信息和便于应用的目的。数字滤波器, 是数字信号处理中及其重要的一部分。本课题采用IIR 滤波器对加噪声音信号进行处理。 IIR滤波器采用递归型结构,即结构上带有反馈环路。IIR滤波器运算结构通常由延时、乘以系数和相加等基本运算组成,可以组合成直接型、正准型、级联型、并联型四种结构形式,都具有反馈回路。同时,IIR数字滤波器在设计上可以借助成熟的模拟滤波器的成果,如巴特沃斯、契比雪夫和椭圆滤波器等,有现成的设计数据或图表可查,在设计一个IIR数字滤波器时,我们根据指标先写出模拟滤波器的公式,然后通过一定的变换,将模拟滤波器的公式转换成数字滤波器的公式。 2.原始语音信号采集与处理 2.1语音信号的采集 由于MATLAB只识别格式为.wav的声音文件,我们利用PC机上的声卡和WINDOWS操作系统进行数字信号的采集。启动录音机进行录音,以文件名“Orisound”保存入原程序所属的文件夹中。可以看到,文件存储器的后缀默认为.wav ,这是WINDOWS操作系统规定的声音文件存的标准。

基于matlab的语音信号处理程序

wavefile='a.wav'; [y,fs,nbits]=wavread(wavefile);%读取信号,采样率和采样位数[10000,19999] sound(y,fs,nbits) fs %采样频率这里每秒22050,发现采样频率为音频信号的典型值22050Hz nbits Y=fft(y,1024);%数据点数 whos y figure(1), subplot(2,1,1),plot(y);title('原始信号波形');grid on subplot(2,1,2),plot(abs(Y));title('原始信号频谱'); grid on%横坐标频率,纵坐标振幅%subplot(3,1,3),plot(angle(Y));title('原始信号相位');grid on %双线性变换法设计的低通滤波器 fp=1000;%fp为通带频率 fc=1200;%fc为阻带起始频率 As=100;%As-阻带最小衰减(dB); Ap=1;%Ap-通带波纹(dB); fs1=fs; wp=2*fp/fs1;%wp-椭圆滤波器通带截止角频率; wc=2*fc/fs1;%Ws-椭圆滤波器阻带起始角频率; [n,wn]=ellipord(wp,wc,Ap,As); %n-椭圆滤波器最小阶数; [b,a]=ellip(n,Ap,As,wn);%返回长度为n+1的滤波器系数行向量b和a, b为分子a 为分母 figure(2),freqz(b,a,512,fs1); %数字滤波器的频率响应函数,512表示选取单位圆的上半圆等间距的N个点作为频响输出; x=filter(b,a,y);%一维数字滤波器,y2为滤波前输入,x为滤波结果序列 X=fft(x,1024); figure(3), subplot(2,1,1),plot(x);title('低通滤波后信号波形');grid on subplot(2,1,2),plot(abs(X));title('低通滤波后信号频谱');grid on sound(x,fs); %分析图形,比较滤波前后时域波形和频域频谱。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% %短时能量 y=y*2^nbits/2; frameSize=256; overlap=128; %[y,fs,nbits]=wavReadInt(wavefile); fprintf('length of %s is %g sec.\n',wavefile,length(y)/fs);

基于matlab的语音信号的采集与处理

目录 第1章前言 (1) 第2章语音信号分析处理的目的和要求 (2) 2.1MATLAB软件功能简介............................................................................................ - 2 - 2.2课程设计意义 ............................................................................................................. - 2 - 第3章语音信号的仿真原理. (3) 第4章语音信号的具体实现 (4) 4.1语音信号的采集........................................................................................................... - 4 - 4.2语音信号加噪与频谱分析........................................................................................... - 5 - 4.3设计巴特沃斯低通滤波器........................................................................................... - 6 - 4.4用滤波器对加噪语音滤波........................................................................................... - 7 - 4.5比较滤波前后语音信号波形及频谱........................................................................... - 8 - 第5章总结.............................................................................................................................. - 9 - 参考文献.................................................................................................................................. - 10 - 附录.......................................................................................................................................... - 11 -

基于MATLAB的语音信号的处理

第一章语音信号的特点与采集 第一节语音信号采集的介绍 在Matlab环境中,主要可以通过以下几种方法驱动声卡,采集语音信号: 1.将声卡作为对象处理采集语音信号Matlab将声卡作为对象处理,其后的一切操作都不与硬件直接相关,而是通过对该对象的操作来作用于硬件设备(声卡)。操作时首先要对声卡产生一个模拟输入对象(ai),给ai对象添加一个通道设置采样频率后,就可以启动设备对象,开始采集数据,采集完成后停止对象并删除对象。 2.调用wavrecord功能函数采集语音信号。wavrecord功能函数只适用于windows95/98/N平台,它使用windows声音输入设备录制声音。函数调用方式:wavrecord(N,fs,ch,nbits); N:采集的样本数据量; fs:样本采集频率,为8000Hz、11025Hz、22050Hz和44100Hz之一,默认值为11025Hz; ch:样本采集通道,1为单声道,2为双声道,默认值为1(单声道); nbits:每个样本的位数(或称解析度),‘double’、‘single’或‘int16’为16位,‘uint8’为8位; 3.运用audiorecorder对象采集语音信号audiorecorder(fs,nbits,ch)可以创设一个audiorecorder对象。fs:样本采集频率,为8000Hz、11025Hz、22050Hz和44100Hz之一,默认值为8000Hz; nbits:每个样本的位数,8位或16位,默认值为8位; ch:样本采集通道,1为单声道,2为双声道,默认值为1(单声道); audiorecorder对象创设后,就可以进行相应的录音、暂停、停止、播放以及数据读取等操作。第二节语音信号的特点 通过对大量语音信号的观察和分析发现,语音信号主要有下面两个

语音信号处理matlab仿真

语音信号处理的matlab设计仿真实验 彭杰12350049 12自动化 一、目的 通过利用matlab设计仿真实验,理解如下知识点: 信号的采样及混迭 信号的频谱分析 信号的幅度调制解调的方法 理想滤波器的时频域特性 数字滤波器的设计 二、内容 ①录制一段个人自己的语音信号。 ②采用合适的频率,对录制的信号进行采样,画出采样后语音信号的时域波形和频谱图。 ③给原始语音信号加噪声,画出加噪声后的语音信号和频谱图。 ④设计一个频域的理想带通信道。 ⑤对这个语音信号进行幅度调制,画出调制后的语音信号和频谱图。 ⑥利用理想带通信道对信号进行传输。 ⑦对接受到的信号进行解调,画出解调后的语音信号和频谱图。 ⑧设计性能良好的滤波器对信号进行滤波。 ⑨对语音进行回放,并与滤波后的语音信号进行对比。

三、实验设计与仿真结果 程序汇总如下:

1、原始语音信号的采集、读取与采样 利用MATLAB中的“wavread”命令来读入(采集)语音信号,将它赋值给某一向量。再对其进行采样,记住采样频率和采样点数。wavread 函数几种调用格式如下: ①y=wavread(file) 功能说明:读取file所规定的wav文件,返回采样值放在向量y中。 ②[y,fs,nbits]=wavread(file) 功能说明:采样值放在向量y中,fs表示采样频率(hz),nbits表示采样位数。 ③y=wavread(file,N) 功能说明:读取钱N点的采样值放在向量y中。 ④y=wavread(file,[N1,N2]) 功能说明:读取从N1到N2点的采样值放在向量y中。 首先用手机录制一段音频信号(手机音频格式一般为.mp3)。然后用软件将音频

MATLAB语音信号处理

基于MATLAB的语音信号采集与处理 一、实验的目的和要求 1. MATLAB软件功能简介 MATLAB的名称源自Matrix Laboratory,1984年由美国Mathworks公司推向市场。它是一种科学计算软件,专门以矩阵的形式处理数据。MATLAB将高性能的数值计算和可视化集成在一起,并提供了大量的内置函数,从而被广泛的应用于科学计算、控制系统和信息处理等领域的分析、仿真和设计工作。 MATLAB软件包括五大通用功能,数值计算功能(Nemeric)、符号运算功能(Symbolic)、数据可视化功能(Graphic)、数字图形文字统一处理功能(Notebook)和建模仿真可视化功能(Simulink)。其中,符号运算功能的实现是通过请求MAPLE内核计算并将结果返回到MATLAB命令窗口。该软件有三大特点,一是功能强大;二是界面友善、语言自然;三是开放性强。目前,Mathworks公司已推出30多个应用工具箱。MATLAB在线性代数、矩阵分析、数值及优化、数值统计和随机信号分析、电路与系统、系统动力学、次那好和图像处理、控制理论分析和系统设计、过程控制、建模和仿真、通信系统以及财政金融等众多领域的理论研究和工程设计中得到了广泛应用。 MATLAB在信号与系统中的应用主要包括符号运算和数值计算仿真分析。由于信号与系统课程的许多内容都是基于公式演算,而MATLAB借助符号数学工具箱提供的符号运算功能,能基本满足信号与系统课程的需求。例如解微分方程、傅里叶正反变换、拉普拉斯正反变换和z正反变换等。MATLAB在信号与系统中的另一主要应用是数值计算与仿真分析,主要包括函数波形绘制、函数运算、冲击响应与阶跃响应仿真分析、信号的时域分析、信号的频谱分析、系统的S域分析和零极点图绘制等内容。数值计算仿真分析可以帮助学生更深入地理解理论知识,并为将来使用MATLAB进行信号处理领域的各种分析和实际应用打下基础。2. 本题目的意义 本次课程设计的课题为《基于MATLAB的语音信号采集与处理》,学会运用MATLAB 的信号处理功能,采集语音信号,并对语音信号进行滤波及变换处理,观察其时域和频域特性,加深对信号处理理论的理解,并为今后熟练使用MATLAB进行系统的分析仿真和设计奠定基础。 二、实验原理: 1.理论原理

相关文档
最新文档