语音信号的盲分离(毛丽娟)

语音信号的盲分离(毛丽娟)
语音信号的盲分离(毛丽娟)

课程设计任务书

学生姓名:毛丽娟专业班级:通信0906

指导教师:黄铮工作单位:信息工程学院

题目: 语音信号的盲分离

初始条件

①matlab软件

②盲信号处理知识

要求完成的主要任务:

根据盲信号分离原理,用matlab采集两路以上的语音信号,选择合适的混合矩阵生成若干混合信号。选取合适的盲信号分离算法(如独立成分分析ICA等)进行训练学习,求出分离矩阵和分离后的语音信号。

设计要求

(1)用matlab做出采样之后语音信号的时域和频域波形图

(2)选择合适的混合矩阵,得到混合信号,并做出其时域波形和频谱图

(3)采用混合声音信号进行训练学习,求出分离矩阵,编写出相应的确matlab 代码。

(4)用求出的分离矩阵从混合信号中分离出原语音信号,并画出各分离信号的时域波形和频谱图。

(5)对结果进行对比分析。

时间安排

第17周,仿真设计

第18周,完成(答辩,提交报告,演示)

指导教师签名:年月日

系主任(或责任教师)签名:年月日

目录

摘要 (3)

Abstract (4)

1 语音信号 (5)

1.1 语音特性分析 (5)

1.2 语音信号的基本特征 (6)

2 盲信号处理 (8)

2.1 盲信号处理的概述 (8)

2.1.1 盲信号处理的基本概念 (8)

2.1.2 盲信号处理的方法和分类 (9)

2.1.3 盲信号处理技术的研究应用 (9)

2.2 盲源分离法 (10)

2.2.1 盲源分离技术 (10)

2.2.2 盲分离算法实现 (10)

2.3 独立成分分析 (11)

2.3.1 独立成分分析的定义 (11)

2.3.2 ICA的基本原理 (13)

3 语音信号盲分离的实现 (15)

3.1 盲信号分离的三种算法 (15)

3.1.1 二阶盲辨识(SOBI) (15)

3.1.2 FastICA算法 (15)

3.1.3 CICA算法 (16)

3.2 不同算法的分离性能比较 (17)

3.3 FastlCA的算法仿真及结果分析 (17)

4 结论 (22)

5 参考文献 (23)

附录 (24)

摘要

语音信号盲分离处理的含义是指利用BSS技术对麦克风检测到的一段语音信号进行处理。混合语音信号的分离是盲分离的重要内容,目前的混叠语音分离大多是建立在无噪环境中的混叠情形下,主要以盲源分离(Blind Source Separation,BSS),根据信号的统计特性从几个观测信号中恢复出未知的独立源成分。

本文重点研究了以语音信号为背景的盲处理方法,在语音和听觉信号处理领域中,如何从混叠语音信号中分离出各个语音源信号,来模仿人类的语音分离能力,成为一个重要的研究问题。我们所要研究的混合语音信号盲分离问题就是用麦克风阵列或多个麦克风阵列来模仿人的耳朵,采集得到相互干扰的混叠语音信号,然后通过分离算法将混叠的语音信号相互分离开来,提取我们所感兴趣的信号。“鸡尾酒会”问题是语音盲分离问题的典型描述。它描述了在多人同时说话的嘈杂环境下,我们能够辨识感兴趣人的说话声的能力。本文主要用ICA算法进行盲分离。

关键词:语音信号,盲源分离,独立成分分析

Abstract

Blind separation of speech signal processing means is the use of BSS techniques microphone detects a voice signal processing. Separation of mixed speech signals is important for blind separation, the current separation of overlapping speech is built mostly in the absence of aliasing noise in the environment, under the circumstances, mainly in blind source separation (Blind Source Separation, BSS), the statistical characteristics of signal Several observations from the unknown signal to recover the independent source components;

This article focuses on the background to the blind speech signal processing method, signal processing, speech and hearing, how the noise from a mixture of overlapping speech signal to separate the various audio source signals to mimic human speech separation ability become an important research question. we will study mix of speech signal is blind source separation with a microphone array or more microphone array to imitate human ears, acquisition get each other interference aliasing speech signal, and then through the separation algorithm will aliasing voice signal mutual separated, extraction we are interested in signal. "Cocktail" problem is blind source separation of typical problems speech description. It describes the people speak at the same time in the noisy environment, we can identify interested in the ability of the human voice. This paper mainly ICA algorithm with blind separation. keywords: speech signal, blind source separation, independent component analysis

1 语音信号

1.1 语音特性分析

1.语音产生机理

发声器官分为三部分:肺、喉(声门)和声道。肺的作用相当于一个动力源,将气流输送到喉部。喉将来自肺部的气流调制为周期脉冲或类似随机噪声的激励声源,并送入声道。喉在发声中的作用是控制声带的开启和闭合,使得气流形成一系列脉冲,声带振动的频率决定了声音频率的高低。由声带振动产生的音统称为浊音,而不由声带振动产生的音统称为清音。

声道包括口腔、鼻腔和咽腔,它们对声源的频谱进行整形而产生不同音色的声音。声道的谐振频率称为共振峰频率,它与声道的形状和大小有关,每种形状都有一套共振峰频率作为其特征,改变声道的形状就产生不同的语音,因而,当声道形状改变时,语音信号的频谱特性就随之改变。

声源经过声道润色频谱后,最后从嘴唇或鼻孔或同时从嘴唇和鼻孔辐射出来,形成可传播的声波,被人感知为语音。

综上所述,语音由空气流经过声门激励,经由声道调制,经过嘴辐射出去,完整的语音信号产生的数学模型可以用三个子模型:激励模型、声道模型和辐射模型的串连来表示。

2.语音的特性

(1)短时平稳性

根据对语音信号的研究,语音是一种时变的、非平稳的随机过程,但另一方面,由于人类发声系统的生理结构的变化速度是有一定限度的,在一段短时间内(10~30ms)人的声带和声道形状基本稳定,并且大部分情况下,激励源参数也是如此,因此可认为短时间内语音特征是不变的,语音的短时性特点是对语音信号进行分析和处理的基础。

(2)浊音和清音

语音分为浊音和清音两大类,二者从语音产生的机理上有明显的差异,前者由周期性脉冲产生,后者由随机噪声产生,因而在特征上也有明显的区别。浊音

在时域上呈现出明显的周期性,在频域上具有共振峰结构而且能量大部分集中在较低频段内。清音则完全不同,它没有明显的时域和频域特征,类似于白噪声。

浊音在频谱上有共振峰结构,能量重要集中在低频区(<1000Hz),清音没有共振峰结构,能量小且主要集中在高频段(>1000Hz)。

1.2 语音信号的基本特征

(1)语音信号的时域特征

由于说话人在不同时刻的说话内容千变万化,而且没有确定的规律性,因此语音信号是时变的。但由于人类的发声器官的变化速率有限,声道在短时间内(5.500ms)处于平稳状态,因此语音信号具有短时平稳性。而这种短时平稳性,也是语音处理中许多理论和算法的必要前提。由于人们在说话时,各个音节或单词之间总会存在着时间上的间隔,

因此语音信号在时域上存在着有音段和无音段。通过有音段和无音段的检测,可用去除带噪语音中平稳的噪声。此外,无音段所占比例越大,语音的稀疏性越好,利用这一特点,产生了许多基于语音稀疏性的增强算法。

(2)语音信号的频域特征

语音信号的频谱能量主要集中在300-3400Hz 范围内。语音本身由浊音和清音组成,浊音含有语音信号的大部分能量,其频谱分布主要集中在低频段中的基 音频率及其各次谐波上,呈现出明显的周期性;清音则表现出随机性,在频谱上类似于白噪声。

(3)语音信号的统计特征

语音信号可以看作是一个遍历性随机过程的样本函数,其统计特性可用其幅度的概率密度函数来描述。

对语音信号的统计特性的研究表明,其幅度分布的概率密度函数可以用两种近似的表达式来较好地描述,其中一种是伽马(Gamma)分布

()k x p x -= (1-1)

式中k 是一个常数,与标准差仃,有下列关系

2x k σ= (1-2)

另一种是拉普拉斯分布(Laplacian)分布 ()0.5x p x e αα-= (1-3) 式中,口是一个由标准差仃。决定的常数,即

x ασ= (1-4)

相对说来,伽马分布对语音信号的幅度分布描述更为精确一点,而拉普拉斯分布的函数形式则更加简洁。

2 盲信号处理

2.1 盲信号处理的概述

2.1.1 盲信号处理的基本概念

盲信号处理是现代数学信号处理、算智能学近年来迅速发展的重要方向。电子信息、通信、生物医学、图像增强、雷达、地球物理信号处理等众多领域有广泛的应用前景。

盲信号处理就是利用系统(如无线信道、通信系统等)的输出观测数据,通过某种信号处理的手段, 获得我们感兴趣的有关信息(如原来独立发射的信号等)。

盲信号的研究是当前学术界的一个研究热点,而盲信号分离则是盲信号研究中的一个重要的课题。BSS是指从观测到的混合信号中分离出未知的源信号。盲信号中的“盲”意味着两个方面:第一,对源信号一无所知或只有少许的先验知识。第二,混合本身是未知的。这看似是一个不可能的任务,然而理论和实际都证实了只需要相当简单的假设,就可以得到该问题的解。这一特点使得BSS成为一种功能相当强大的信息处理方法。

图2.1 盲处理原理框图

2.1.2 盲信号处理的方法和分类

在盲信号处理中,就源信号进过传输通道的混合方式而言,其处理方法可分为线性瞬时混合信号盲处理、线性卷积混合信号盲处理和非线性混合信号盲处理三类。

根据通道传输特性中是否含有噪声、噪声特性(白噪声、有色噪声等)、噪声混合形式,可分为有噪声、无噪声盲处理,含加性噪声和乘性噪声混合信号盲处理等。

按源信号和观测信号数目的不同可以将混合方式分为欠定、适定和超定情况 ;按源信号特性的不同分为 : 平稳、非平稳、超高斯、亚高斯、超高斯和亚高斯混合分离等。

盲处理的目的可分为盲辨识和盲源分离两大类。盲辨识的目的是求得传输通道混合矩阵(新型混合矩阵、卷积混合矩阵、非线性混合矩阵等)。盲源分离的目的是求得源信号的最佳估计。当盲源分离的各分量相互独立时,就称为独立分量分析,即独立分量分析是盲源分离的一种特殊情况。

2.1.3 盲信号处理技术的研究应用

近年来,盲信号处理逐渐成为当今信息处理领域中热门的课题之一,并且已经在尤其在生物医学工程、医学图像、语音增强、遥感、通信系统、地震探测、地球物理学、计量经济学和数据挖掘等领域显示出诱人的前景,特别是盲源分离技术、ICA的不断发展和应用最为引人注目。下面介绍盲处理应用中的两个主要方面:

1.语音识别领域

语音信号分离、语音识别是盲处理应用的一个重要领域。最典型的应用就是声控计算机,计算机所接受到的语音指令肯定是肯定是带有各种环境噪声的,还可能存在其他的语音信号(如有其他人说话),而且这些信号源与接收器的相对位置也未知,计算机需要在这种情况下识别出正确的语音命令。在移动通信中,往往存在通信质量问题,极大的影响了通话效果,而盲源分离或盲均衡技术能够

消除噪声、抑制干扰及增强语音,提高通话质量。

2.生物医学信号处理

在生物医学领域,盲信号处理可应用于心电图(ECG)、脑电图(EEG)信号分离、听觉信号分析、功能磁共振图像(FMRI)分析等。例如人们常常需要从肌电图中确定神经元细胞信号的触发模式,而EMG信号通常由多个特殊的传感器在人体表处测得,从信号源到传感器之间的信号传输介质参数是未知的,而人们之间各不相同。目前已经有一些学者将盲源分离技术成功地够应用于脑电图等信号的数据处理。

2.2 盲源分离法

2.2.1 盲源分离技术

盲源信号分离(Blind Source Separation, BSS) 是20世纪90年代迅速发展起来的一个研究领域。它具有可靠的理论基础和许多方面的应用潜力。其在生物医学工程、医学图像、语音增强、遥感、通信系统、地震探测等领域有着广泛而诱人的前景 ,盲源分离成为信号处理和神经网络领域的研究热点。

盲源分离是针对从检测的混合信号中估计或恢复源信号的问题提出的,是指源信号、传输通道特性未知的情况下,仅由观测信号和源信号的一些先验知识(如概率密度)估计出源信号各个分量的过程。例如最著名的鸡尾酒会问题,仅根据多个麦克风检测信号分离或恢复出某种语音源信号。

2.2.2 盲分离算法实现

在实际的ICA盲分离算法应用中,一般有时是必需的对观测数据做一些预处理技术,如用主成分分析 ( PCA )降维和白化,用滤波器进行滤波降噪处理等。另外,由于恢复准则的局限以及先验知识的缺乏,盲信号分离方法只能得到源信号的波形,而无法确定信号的幅值以及信号之间的顺序。这两点都需要人为的制定规则(如规定信号的方差为1来确定幅值)来确定。

图2.2 盲信号分离基本原理框图

2.3 独立成分分析

独立分量分析 ( Independent Component Analy2sis , ICA) 是由Herault和J utten在1983年提出,该方法不依赖与源信号类型相关的详细知识或信号传输系统特性的精确辨识,是一种有效的冗余取消技术,被广泛应用于盲源分离 ( blind source separation BSS)、特征提取和盲解卷、生理学数据分析语音信号处理、图像处理及人脸识别等领域。该方法根据代价函数的不同 ,可以得到不同的ICA算法,如信息最大化(infomax)算法、Fast ICA算法、最大熵( M E)和最小互信息( MM I)算法、极大似然(ML)算法等。

在统计学中,独立成分分析或独立分量分析(Independent components analysis,缩写:ICA)是一种利用统计原理进行计算的方法。它是一个线性变换。这个变换把数据或信号分离成统计独立的非高斯的信号源的线性组合。独立成分分析是盲信号分离(Blind source separation)的一种特例。

2.3.1 独立成分分析的定义

ICA是一种用来从多变量(多维)统计数据里找到隐含的因素或成分的方法,被认为是主成分分析(Principal Component Analysis, PCA)和因子分析(Factor Analysis)的一种扩展。对于盲源分离问题,ICA是指在只知道混合信号,而不知道源信号、噪声以及混合机制的情况下,分离或近似地分离出源信号的一种分析过程。

独立成分分析(Independent Component Analysis, ICA)是近年来出现的一种强有力的数据分析工具(Hyvarinen A, Karhunen J, Oja E, 2001; Roberts S J, Everson R, 2001)。1994年由Comon给出了ICA的一个较为严格的数学定义,其思想最早是由Heranlt和Jutten于1986年提出来的。ICA从出现到现在

虽然时间不长,然而无论从理论上还是应用上,它正受到越来越多的关注,成为国内外研究的一个热点。特别是从应用角度看,它的应用领域与应用前景都是非常广阔的,目前主要应用于盲源分离、图像处理、语言识别、通信、生物医学信号处理、脑功能成像研究、故障诊断、特征提取、金融时间序列分析和数据挖掘等。

盲源分离技术是近二十年发展起来的一门新型科学,在各国科学家和研究人员的努力下获得了充分的发展,但是ICA的研究方兴未艾,它毕竟是一个涉及面广并且仍处于发展前沿的课题,在理论上还远没有成熟,许多问题有待进一步研究和解决。

(1)带噪混合信号的盲分离问题。盲信号处理中的未知条件太多,混合信号含有噪声的情况下的盲源分离问题解决起来是相当困难的。尽管目前已有部分算法对存在噪声的情况表现出了良好的性能,但由于噪声种类繁多,因此处理起来仍很棘手。现有的大多数盲源分离或盲解卷积算法都假设不含噪声或者把噪声看作是一个独立的信源信号来处理。

(2)非平稳混合信号的盲源分离算法。许多情况下源信号可能是非平稳的,如何利用信号的非平稳特性进行盲源分离是摆在广大研究人员面前的一个现实问题。

(3)卷积混合信号的盲源分离算法。在实际中,系统接收到的混合输入信号是源信号经过不同的传播途径到达接收器。在这个过程中,不可避免的存在信号的时延和反射。针对这种情况的盲源分离算法还很不成熟。

(4)ICA的推广应用。在算法应用方面,ICA可以取得进一步的发展,如可以在语音识别、图像处理、特征提取、医学信号处理方面作进一步的研究。目前的关键的问题是如何将理论算法转化为实际应用,以及如何建立更加符合实际情况的模型等。

(5)算法的收敛性。算法全局收敛性的研究,可以考虑将遗传算法、混沌算法等具有全局收敛性的优化算法和ICA结合起来,提高算法的全局收敛性。

2.3.2 ICA 的基本原理

(1)无噪声的ICA 模型

ICA 作为生成模型的估计给定随即变量的一组观测123(),(),()x t x t x t …

()n x t ,

其中t 是时间或者样本标号,假设它们有独立成分线性混合而产生:

1234()()()()x t x t x t x t ?????????????=A 1234()()()()s t s t s t s t ????????????? (2-1) 式中,A 是某个未知矩阵。

用向量-矩阵符号方式表示通常比上面的求和表达式更为方便。用随机向量x

来表示混合向量,其元素分别为1,...,n x x ,同样地,用s 来表示元素1,...n s s ,用矩

阵A 表示那些混合系数aij 。所有的向量都理解为列向量; 这样T

x 或者称x 的转置就是一个行向量。利用向量和矩阵符号表示,混合模型可以写为:

x As = (2-2)

有时我们需要使用矩阵A 中的列向量,如果将其表示为,则模型也可以写为: 1n i i

i x a s ==∑ (2-3)

(2)有噪声的ICA 模型

将基本的ICA 模型扩展到有噪声的情形,并且假设噪声是以加性噪声形式存在的。这是一个相当现实的假设,因为加性噪声是因子分析和信号处理中通常研究的标准形式,具有简单的噪声模型表达方式。因此,噪声ICA 模型可表示为:

x As n =+ (2-4)

式中,[]1,...T n n n n =是噪声向量。

信号源噪声,即直接添加到独立成分(即信号源)上的噪声。信号源噪声可用与式(2.1)稍有差别的下式来表示:

()x A s n =+ (2-5)

实际上,如果可以直接考虑带噪声的独立成分,那么可将此模型写为:

~

x A s

(2-6) 可以看出,这就是基本的ICA模型,只是独立成分本身变了。

3 语音信号盲分离的实现

3.1 盲信号分离的三种算法

3.1.1 二阶盲辨识(SOBI )

SOBI 先对观测信号()x t 作白化处理,得到()z t 。定义()z t 和()s t 的时延相关矩阵为

()()()T z R E z t z t πτ??=+?? (3-1)

()()()T s R E s t s t πτ??=+?? (3-2)

由()()z t Vs t =易知:

()()T z s R VR V ττ= (3-3)

又因为T T n VV V V I ==,所以 (3-4)

()()T S z R V R V ττ= (3-5) 由()s t 各分量相互独立可知,()S R τ是对角矩阵。由此可见,矩阵V 可以将()z R τ对角化。在SOBI 算法中,τ取一组不同的值12,,...,q τττ,要求V 能同时使得各个()z i R τ尽可能的对角化,其中1i q ≤≤。

3.1.2 FastICA 算法

FastICA 算法是芬兰赫尔辛基工业大学计算机及信息科学实验室Hyvarinen 等人1997年首先提出并发展起来的,在1999年进一步提出了改进——基于负熵的ICA 固定点算法。该算法基于非高斯性最大化原理,使用固定点(Fixed-point) 迭代理论寻我W1x 非高斯性最大值,采用牛顿迭代算法对观测变量x 的大量采样点进行批处理,每次从观测信号中分离出一个独立分量,是独立分量分析的一种快速算法。

FastICA 算法,由于采用了定点迭代的思想,所以又称固定点(Fixed-Point)算法或定点算法,是一种快速寻优神经网络算法。与普通的神经网络算法不同的

是这种算法采用了牛顿迭代的思想对采样点采用批处理的方式,在每一步迭代中有大量的样本数据参与运算。基于目标函数的选择不同,从而产生了FastICA 算法的基于负熵最大、峭度、互信息最小、最大似然估计等的多种形式。FastICA 算法的基本步骤:

1. 对观测数据X 进行中心化,使它的均值为0;

2. 对数据进行白化,Z X →。

3. 选择需要估计的分量的个数m ,设迭代次数1←p

4. 选择一个初始权矢量(随机的)p W 。

5. 令(){}(){}W Z W g E Z W Zg E W T p T p p '-=,非线性函数g 的选取见前文。

6. (

)j p j j T

p p p W W W W W ∑-=-=11。 7. 令p p p W W W /=。

8. 假如p W 不收敛的话,返回第5步。

9.令1+=p p ,如果m p ≤,返回第4步。

然而FastICA 算法也尤其自身的缺点,首先是它对初值的选择较自然梯度算法敏感,当初值的选择不是很合适的时候,算法的分离性能急剧的下降,其次算法的迭代步长有待进行自适应的优化。

3.1.3 CICA 算法

约束独立分量分析(Constrained independent component analysis ,CICA)算法倒是一种改良的FastlCA 算法。在ClCA 提取过程中,通过引入简单的约束参考信号来帮助分离某特定目标分量,从而有利于去除干扰信号。ClCA 算法的基本原理与FastlCA 相同,每次提取一个独立分量。文中所选用的CICA 算法,实际上是一种加入了约束参数的FastICA 算法,从而使ICA 算法不用再进行特征提取与目标判定,就可以容易的分离出所需要的目标分量。虽然CICA 算法对信号分离具有良好的效果,但在实际应用过程中,CICA 还需要进一步的探讨研究。

如阈值ξ与学习率η的选择不当,就会很容易引起输出结果发散。同时收敛速度ε的选择也有关系,误差函数的形式要根据输入数据和参考信号与误差函数(,)

y r

来进行选择。

3.2 不同算法的分离性能比较

SOBI算法利用了源信号的频谱差异性来分离源信号,当源信号中存在频谱结构相似的分量时,分离性能便会较差,这是SOBI算法的缺点。

FastICA算法的特点:

1.在1CA模型中,FastICA算的收敛速度是二次以上的,而梯度搜索法只是一次收敛。

2.与梯度搜索法相比,FastlCA的步长参数容易确定。

3该算法适用于任何非高斯信号。

4.可以通过选择不同的非线性函数G(Y)使算法的获得不同的性能。基F独立分量分析的混合语音信号自分离系统的研究

5.可以逐个的估计独立分量。

6该算法是并行的、分布的,且计算简单,需要的内存较少。

FastlCA算法和其他的ICA算法相比,有着许多我们期望的特性:收敛速度快;和梯度算法不同,无需选择步长参数,易于使用;该算法能适用于任何非高斯信号;可以通过使用不同的非线性函数G-(y)使算法获得不同的性能;独立分量可被逐个估计出来,这在仅需要估计几个独立分量的情况下,能减小计算量:FastICA算法有许多神经算法的优点:并行、分布、计算简单,内存要求小。3.3 FastlCA的算法仿真及结果分析

下面仿真中所使用的语音源信号是在干扰噪声很小的环境下用麦克风录制的3段不同的语音文件,保存成*.wav文件sound1.wav, sound3.wav,sound4.wav, 三个声音采样频率均为44100Hz,持续时间为3s。

图3.1是这3个原始语音信号的时域波形,图3.2为原始语音信号的频域波形。

原始的语音信号如下:

图3.1 原始信号时域波形图

图3.2 原始信号频域波形图

混合后的语音信号:

图3.3 混合信号的时域波形图

图3.4 混合信号的频域波形图

FastlCA算法将混合信号MixedS1,MixedS2,MixedS3分离,得到分离后信号ICAedS1,ICAedS2,ICAedS3,图3.5为分离信号的时域波形图,图3.6为分离信号的频域波形图:

图3.5 分离信号的时域波形图

语音信号的盲分离

课程设计任务书 学生:专业班级:通信1103 指导教师:许建霞工作单位:信息学院 题目: 语音信号的盲分离 初始条件:Matlab软件、PC机 要求完成的主要任务:(包括课程设计工作量及其技术要求,以及说明书撰写等具体要求)设计任务 根据盲信号分离原理,用matlab采集两路以上的语音信号,选择合适的混合矩阵生成若干混合信号。选取合适的盲信号分离算法(如独立成分分析ICA等)进行训练学习,求出分离矩阵和分离后的语音信号。 设计要求 (1) 用matlab做出采样之后语音信号的时域和频域波形图 (2) 选择合适的混合矩阵,得到混合信号,并做出其时域波形和频谱图 (3) 采用混合声音信号进行训练学习,求出分离矩阵,编写出相应的确matlab代码。 (4) 用求出的分离矩阵从混合信号中分离出原语音信号,并画出各分离信号的时域波形和频谱图。 (5) 对结果进行对比分析。 时间安排:

指导教师签名:2014年 6 月10 日 系主任(或责任教师)签名:2014 年 6 月10 日 摘要 盲信号处理(Blind Signal Processing,BSP)是指从观测到的混合信号中,在没有任何先验条件的情况下,恢复出未知的源信号过程。盲信号分离已成为信号处理学界和通信工程学界共同感兴趣的一个极富挑战性的研究热点问题,并获得了迅速的发展。 盲分离根据信号源的不同可以分为确定信号盲分离、语音信号盲分离和图像盲分离等,本设计主要讨论语音信号的盲分离。 语音信号的盲分离主要是利用盲源分离(Blind Signal Separation,BSS)技术对麦克风检测到的一段语音信号进行处理,本文重点研究了以语音信号为背景的盲处理方法,在语音和听觉信号处理领域中,如何从混有噪声的的混叠语音信号中分离出各个语音源信号,来模仿人类的语音分离能力,成为一个重要的研究问题。根据盲信号分离原理,本设计用matlab采集3路语音信号,选择合适的混合矩阵生成若干混合信号。 具体实现主要结合独立分量分析ICA技术,选取混合矩阵对3个语音信号进行混合,并从混合信号中分离出原语音信号,最后画出各分离信号的时域波形和频谱图和原来的信号进行比较。此外还运用PCA算法进行了混合语音信号的分离实现,最终对两种算法进行比较。 关键字:盲信号处理;语音信号;盲源分离BSS;独立分量分析ICA技术

matlab语音信号采集与初步处理要点

《matlab与信号系统》实验报告 学院: 学号: 姓名: 考核实验——语音信号采集与处理初步 一、课题要求 1.语音信号的采集 2.语音信号的频谱分析 3.设计数字滤波器和画出频率响应 4.用滤波器对信号进行滤波 5.比较滤波前后语音信号的波形及频谱 6.回放和存储语音信号 (第5、第6步我放到一起做了) 二、语音信号的采集 本段音频文件为胡夏演唱的“那些年”的前奏(采用Audition音频软件进行剪切,时长17秒)。运行matlab软件,在当前目录中打开原音频文件所在的位置,采用wavread函数对其进行采样,并用sound函数可进行试听,程序运行之后记下采样频率和采样点。 利用函数wavread对语音信号的采集的程序如下: clear; [y,fs,bits]=wavread('music.wav'); %x:语音数据;fs:采样频率;bits:采样点数sound(y,fs,bits); %话音回放 程序运行之后,在工作区间中可以看到采样频率fs=44100Hz,采样点bits=16

三、语音信号的频谱分析 先画出语音信号的时域波形,然后对语音号进行快速傅里叶变换,得到信号的频谱特性。语音信号的FFT频谱分析的完整程序如下: clear; [y,fs,bits]=wavread('music.wav'); %x:语音数据;fs:采样频率;bits:采样点数sound(y,fs,bits); %话音回放 n = length (y) ; %求出语音信号的长度 Y=fft(y,n); %傅里叶变换 subplot(2,1,1); plot(y); title('原始信号波形'); subplot(2,1,2); plot(abs(Y)); title('原始信号频谱'); 程序结果如下图: 四、设计数字滤波器和画出频率响应 根据语音信号的特点给出有关滤波器的性能指标: 1)低通滤波器性能指标,fp=1000Hz,fc=1200 Hz,As=100dB,Ap=1dB; 2)高通滤波器性能指标,fc=4800 Hz,fp=5000 Hz As=100dB,Ap=1dB。

孙烽原 基于MATLAB的线性盲信号分离算法的研究

毕业论文(设计)材料 题目:基于 MATLAB 的线性盲信号分离算 法的研究 学生姓名:孙烽原 学生学号:0908030229 系别:电气信息工程学院 专业:电子信息工程 届别:2013 指导教师:张大雷

填写说明 1、本材料包括淮南师范学院本科毕业论文(设计)任务书、开题报告以及毕业论文(设计)评审表三部分内容。 2、本材料填写顺序依次为: (1)指导教师下达毕业论文(设计)任务书; (2)学生根据毕业论文(设计)任务书的要求,在文献查阅的基础上撰写开题报告,送交指导教师审阅并签字认可; (3)毕业论文(设计)工作后期,学生填写毕业论文(设计)主要内容,连同毕业论文(设计)全文一并送交指导教师审阅,指导教师根据学生实际完成的论文(设计)质量进行评价; (4)指导教师将此表连同学生毕业论文(设计)全文一并送交评阅教师评阅。 3、指导教师、评阅教师对学生毕业论文(设计)的成绩评定均采用百分制。 4、毕业论文(设计)答辩记录不包括在此表中。

一、毕业论文(设计)任务书 要求完成的主要任务及达到的目标 顾名思义,盲信号是指未知的、有杂乱无章特征的信号,人们难以得知源信号以及源信号的结合形式。对于盲信号的处理是通信时代比较前沿的技术之一,从接收信号中尽力还原源信号的技术称为盲源分离、盲信号提取。这已经称为通信信号学术领域的研究焦点。盲信号处理如今广泛被语音识别、语音增强、图像处理、通信系统、地震探测、遥感、数据挖掘、计量经济学、医学成像等领域所应用。根据传输介质的不同混合方式,盲信号处理有线性瞬时混合信号盲处理、线性卷积混合信号盲处理、非线性混合信号盲处理三种。本研究主要讨论有线性瞬时混合信号忙处理的计算方法。 ?对盲信号处理学各类算法的了解和掌握; ?对有线瞬时混合信号忙处理方法的熟悉和精通; ?对于MATLAB软件的熟练操作; ?实现用MATLAB软件实现对线性盲信号分离算法。 在此基础上巩固、加深和扩大MATLAB应用的知识面,进一步了解用此款软件对数字信号处理、数字图像处理、工程设计等的应用。加深对盲信号处理知识的掌握深度,加强对线性盲信号分离算法的理解,提高综合及灵活运用所学知识研究各类数学算法的能力。学会查阅书籍,并且要能够熟练的运用数学软件、编写程序、仿真、处理信号问题的方法、内容及步骤。学会对课题设计方案的分析、选择、比较。 工作进度要求

基于matlab的语音信号的采集与处理

文档从互联网中收集,已重新修正排版,word格式支持编辑,如有帮助欢迎下载支持。 目录 第1章前言 ................................................................................................... 错误!未定义书签。第2章语音信号分析处理的目的和要求 ................................................... 错误!未定义书签。 2.1MATLAB软件功能简介................................................................. 错误!未定义书签。 2.2课程设计意义 .................................................................................. 错误!未定义书签。第3章语音信号的仿真原理..................................................................... 错误!未定义书签。第4章语音信号的具体实现..................................................................... 错误!未定义书签。 4.1语音信号的采集................................................................................ 错误!未定义书签。 4.2语音信号加噪与频谱分析................................................................ 错误!未定义书签。 4.3设计巴特沃斯低通滤波器................................................................ 错误!未定义书签。 4.4用滤波器对加噪语音滤波................................................................ 错误!未定义书签。 4.5比较滤波前后语音信号波形及频谱................................................ 错误!未定义书签。第5章总结................................................................................................... 错误!未定义书签。参考文献......................................................................................................... 错误!未定义书签。附录................................................................................................................. 错误!未定义书签。

盲源分离 开题报告

一、研究背景及意义 语音信号的分离近年来成为信号处理领域的一个研究热点,它在电话会议、助听器及便携设备、机器的语音识别方面有很多的应用与影响。而语音信号常使用盲信号处理的方法分离。 盲信号处理(Blind Source Processing)作为一种新兴的信号处理方法,逐步发展并得到了越来越多的关注。盲信号处理与现代信号处理朝向非平稳、非高斯、非线性的发展方向相吻合,有利于复杂信号的分析以及处理,其研究对象主要为非高斯信号。它在传统信号处理方法的基础上结合了信息论、统计学和人工神经网络的相关思想。如图1所示,所谓的“盲分离”是指在没有关于源信号本身以及传输信道的知识,对数据及系统参数没有太多先验知识的假设的情况下,如何从混迭信号(观测信号)中分离出各源信号的过程。它能适用于更广泛的环境,为许多受限于传统信号处理方法的实际问题提供了崭新的思路。 图1 盲分离的概念 在科学研究和工程应用中,很多观测信号都可以假设成是不可见的源信号的混合,如通信信号、图像、生物医学信号、雷达信号等等。例如经典的“鸡尾酒会”问题,在一个充满宾客的宴会厅里,我们每个人都会听到来自不同地方的声音,如音乐,歌声及说话声等,正常的人类拥有在这种嘈杂环境下捕捉到所感兴趣的语音的能力。可以看到,盲信号处理同传统信号处理方法最大的不同就在于用它致力于用最少的信息得到理想的处理结果。

盲信号分离可以有不同的分类方法。 根据所处理信号的不同,可以分为声纳信号盲分离,雷达信号盲分离,通信信号盲分离,语音信号盲分离,脑电信号盲分离等。 根据盲处理领域的不同,可以分为时域盲分离和频域盲分离。 根据传输信道的情况,可以分为无噪声,有加性噪声,有乘性噪声等。 根据源信号在传输信道中被混合方式的不同,可以分为瞬时混合,卷积混合,非线性混合等。 根据源信号和观测信号数目的不同,可以分为正定盲分离,欠定盲分离,过定盲分离等。 本文研究的主要内容是正定不含噪的卷积混合语音信号的频域盲分离 方法。 总的来说,盲信号分离是一种仅利用观测到的混合信号来估计源信号的方法,它是以独立分量分析(Independent Component Analysis,ICA)为理论基础的。与传统信号处理方法如FIR 滤波,小波分析等不同的是,它不要求有关于源信号本身以及信号传输通道的知识。受益于这种“盲”的条件,盲信号分离对多个领域有很大的促进作用,特别是它在声纳、雷达、通信、语音、图像等方面的应用对军事,国防科技的发展起着非常重要的作用。近十多年来,各国学者在盲信号分离领域展开了深入的研究,有了一系列的成果。本课题就是在这样的背景下对语音信号进行盲分离的研究,以探索新的算法,新的应用。 二、研究的基本内容,拟解决的主要问题 1.研究的基本内容 本课题详细研究语音分离的基本理论,重点研究卷积混合频域解法模型框架下的语音信号分离算法。 基于时域实值瞬时混合模型的盲分离算法已经研究的比较充分,但是在语音信号在现实中往往是卷积混合,而且在频域分离方法中信号是复值的,本文将研究利用复值信号特征的瞬时混合盲分离算法,对不同的复数域盲分

基于MATLAB的线性盲信号分离算法的研究

毕业论文(设计) 论文题目:基于MATLAB的线性盲信号分离算法的研究 学生姓名:孙烽原 学号:0908030229 所在院系:电气信息工程学院 专业名称:电子信息工程 届次:2013届 指导教师:张大雷

淮南师范学院本科毕业论文(设计) 诚信承诺书 1.本人郑重承诺:所呈交的毕业论文(设计),题目《 》是本人在指导教师指导下独立完成的,没有弄虚作假,没有抄袭、剽窃别人的内容; 2.毕业论文(设计)所使用的相关资料、数据、观点等均真实可靠,文中所有引用的他人观点、材料、数据、图表均已注释说明来源; 3. 毕业论文(设计)中无抄袭、剽窃或不正当引用他人学术观点、思想和学术成果,伪造、篡改数据的情况; 4.本人已被告知并清楚:学院对毕业论文(设计)中的抄袭、剽窃、弄虚作假等违反学术规范的行为将严肃处理,并可能导致毕业论文(设计)成绩不合格,无法正常毕业、取消学士学位资格或注销并追回已发放的毕业证书、学士学位证书等严重后果; 5.若在省教育厅、学院组织的毕业论文(设计)检查、评比中,被发现有抄袭、剽窃、弄虚作假等违反学术规范的行为,本人愿意接受学院按有关规定给予的处理,并承担相应责任。 学生(签名): 日期:年月日

目录 前言 (2) 1 概述 (2) 1.1盲信号处理的概念与分类 (3) 1.2盲处理概念 (4) 1.3盲信号处理的分类 (4) 1.4盲信号处理的应用 (4) 2 盲信号分离的基础 (4) 2.1盲信号的预处理 (5) 2.2信号的去均值处理 (5) 2.3盲信号分离原理 (5) 2.4盲信号分离的方法 (6) 3 盲分离的算法和仿真结果 (6) 3.1最大信噪比的盲信号分离算法 (6) 3.2基于最大信噪比盲信号分离的算法流程 (7) 3.3基于峭度的盲信号分离的算法 (7) 3.4基于峭度的盲信号分离的算法流程 (8) 3.5基于两种算法的仿真 (8) 3.6仿真结果分析 (12) 4 结论 (13) 4.1总结 (13) 4.2未来工作 (13) 参考文献 (14)

基于MATLAB的语音信号滤波处理

基于MATLAB的语音信号滤波处理 题目:基于MATLAB的语音信号滤波处理 课程:数字信号处理 学院:电气工程学院 班级: 学生: 指导教师: 二O一三年十二月

目录CONTENTS 摘要 一、引言 二、正文 1.设计要求 2.设计步骤 3.设计内容 4.简易GUI设计 三、结论 四、收获与心得 五、附录

一、引言 随着Matlab仿真技术的推广,我们可以在计算机上对声音信号进行处理,甚至是模拟。通过计算机作图,采样,我们可以更加直观的了解语音信号的性质,通过matlab编程,调用相关的函数,我们可以非常方便的对信号进行运算和处理。 二、正文 2.1 设计要求 在有噪音的环境中录制语音,并设计滤波器去除噪声。 2.2 设计步骤 1.分析原始信号,画出原始信号频谱图及时频图,确定滤波器类型及相关指标; 2.按照类型及指标要求设计出滤波器,画出滤波器幅度和相位响应,分析该滤波器是否符合要求; 3.用所设计的滤波器对原始信号进行滤波处理,画出滤波后信号的频谱图及时频图; 4.对滤波前的信号进行分析比对,评估所设计滤波器性能。 2.3 设计内容 1.原始信号分析

分析信号的谱图可知,噪音在1650HZ和3300HZ附近的能量较高,而人声的能量基本位于1000HZ以下。因此,可以设计低通滤波器对信号进行去噪处理。 2.IIR滤波器设计 用双线性变换法分别设计了巴特沃斯低通滤波器和椭圆低通滤波器和带阻滤波器: ①巴特沃斯滤波器 fp=800;fs=1300;rs=35;rp=0.5; 程序代码如下: fp=800;fs=1300;rs=35;rp=0.5;Fs=44100; wp=2*Fs*tan(2*pi*fp/(2*Fs));ws=2*Fs*tan(2*pi*fs/(2*Fs)); [n,wn]=buttord(wp,ws,rp,rs,'s'); [b,a]=butter(n,wn,'s'); [num,den]=bilinear(b,a,Fs); [h,w]=freqz(num,den,512,Fs);

基于matlab的语音信号滤波处理——数字信号处理课程设计

数字信号处理课程设计 题目:基于matlab的语音信号滤波处理学院:物理与电子信息工程 专业:电子信息工程 班级: B07073041 学号: 200932000066 姓名:高珊 指导教师:任先平

摘要: 语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴学科,是目前发展最为迅速的学科之一,通过语音传递信息是人类最重要,最有效,最常用和最方便的交换信息手段,所以对其的研究更显得尤为重要。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换成离散的数据文件,然后用起强大的矩阵运算能力处理数据。这为我们的本次设计提供了强大并良好的环境! 本设计要求自己录制一段自己的语音后,在MATLAB软件中采集语音信号、回放语音信号并画出语音信号的时域波形和频谱图。再在Matlab中分别设计不同形式的FIR数字滤波器。之后对采集的语音信号经过不同的滤波器(低通、高通、带通)后,观察不同的波形,并进行时域和频谱的分析。对比处理前后的时域图和频谱图,分析各种滤波器对于语音信号的影响。最后分别收听进行滤波后的语音信号效果,做到了解在怎么样的情况下该用怎么样的滤波器。

目录 1.设计内容 (4) 2.设计原理 (4) 2.1语音信号的时域分析 (4) 2.2语音信号的频域分析 (5) 3.设计过程 (5) 3.1实验程序源代码 (6) 3.1.1原语音信号时域、频域图 (6) 3.1.2低通滤波器的设计 (6) 3.1.3高通滤波器的设计 (7) 3.1.4带通滤波器的设计 (8) 3.1.5语音信号的回放 (9) 3.2调试结果描述 (10) 3.3所遇问题及结果分析 (15) 3.3.1所遇主要问题 (16) 3.3.2结果分析 (16) 4.体会与收获 (17) 5.参考文献 (17)

盲源分离算法初步研究

盲源分离算法初步研究 一、盲源分离基本问题 1.概念 BSS 信号盲分离,是指从若干观测到的混合信号中恢复出未知的源信号的方法。典型的观测到的混合信号是一系列传感器的输出,而每一个传感器输出的是一系列源信号经过不同程度的混合之后的信号。其中,“盲”有两方面的含义:(1)源信号是未知的;(2)混合方式也是未知的。 根据不同的分类标准,信号盲分离问题可以分成以下几类: (1)从混合通道的个数上分,信号的盲分离可以分为多通道信号分离和单通道信号分离。单通道信号分离是指多路源信号混合后只得到一路混合信号,设法从这一路混合信号中分离出多个源信号的问题就是单通道信号分离。多通道信号分离是M 个源信号混合后得到N 路混合信号(通常N ≥M )。从N 路混合信号中恢复出M 个源信号的问题即为多通道信号分离。一般情况下,单通道信号分离的难度要超过多通道信号分离。 (2)从源信号的混合方式上分,可将信号盲分离问题分为瞬时混合和卷积混合、线性混合和非线性混合等不同种类。在目前信号盲分离的研究文章中,所建模型大部分为瞬时混合。但是,作为更接近实际情况的卷积混合方式正受到越来越多的关注。 (3)根据源信号的种类,也可将信号盲分离分为多类。在通常的处理方法上,根据不同种类信号的特点,也有一些独特的处理技术。 2.盲分离问题的描述 BSS 是指仅从观测的混合信号(通常是多个传感器的输出)中恢复独立的源信号,在科学研究和工程应用中,很多观测信号都可以假设成是不可见的源信号的混合。所谓的“鸡尾酒会”问题就是一个典型的例子。在某个场所,多个人正在高声交谈。我们用多个麦克风来接受这些人说话的声音信号。每个人说话的声音是源信号,麦克风阵列的输出是观测信号。由于每个麦克风距离各个说话者的相对方位不同,它们接受到的也是这些人的声音信号以不同方式的混合。盲信号分离此时的任务是从麦克风阵列的输出信号中估计出每个人各自说话的声音信号,即源信号。如果混合系统是已知的,则以上问题就退化成简单的求混合矩阵的逆矩阵。但是在更多的情况下,人们无法获取有关混合系统的先验知识,这就要求人们从观测信号来推断这个混合矩阵,实现盲源分离。 3.混合模型 信号的混合模型包含两个方面的内容:(1)源信号的统计特征;(2)源信号的混合方式。 3.1源信号的统计特征 已有的研究表明如果加上源信号间相互独立的限制条件,就可以有效地补偿对以上先验知识的缺乏。如果用q i 表示第i 个分量的概率密度函数,则这种统计独立性可以表示为: 11221()()...()()n n n i i i q s q s q s q s ==???=∏q(s) 其中q(s)是s 的联合概率密度函数。 3.2源信号的混合方式 最简单的混合模型假定各个分量是线性叠加混合在一起而形成观测信号的。基于这样的假设,我们可以把观测信号和源信号用矩阵的方式表示为: ()()t t =x Hs 式中H 是n ×n 阶的混合矩阵。基于该模型,盲信号分离()()t t =x Hs 的目标可以表

语音信号处理matlab实现

短时能量分析matlab源程序: x=wavread('4.wav'); %计算N=50,帧移=50时的语音能量 s=fra(50,50,x);%对输入的语音信号进行分帧,其中帧长50,帧移50 s2=s.^2;%一帧内各种点的能量 energy=sum(s2,2);%求一帧能量 subplot(2,2,1); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=50'); axis([0,500,0,30]) %计算N=100,帧移=100时的语音能量 s=fra(100,100,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,2); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=100'); axis([0,300,0,30]) %计算N=400,帧移=400时的语音能量 s=fra(400,400,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,3); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=400'); axis([0,60,0,100]) %计算N=800,帧移=800时的语音能量 s=fra(800,800,x); s2=s.^2; energy=sum(s2,2); subplot(2,2,4); plot(energy) xlabel('帧数'); ylabel('短时能量E'); legend('N=800'); axis([0,30,0,200]) 分帧子函数: function f=fra(len,inc,x) %对读入语音分帧,len为帧长,inc为帧重叠样点数,x为输入语音数据 fh=fix(((size(x,1)-len)/inc)+1);%计算帧数 f=zeros(fh,len);%设一个零矩阵,行为帧数,列为帧长 i=1;n=1; while i<=fh %帧间循环 j=1; while j<=len %帧内循环 f(i,j)=x(n); j=j+1;n=n+1; end n=n-len+inc;%下一帧开始位置 i=i+1; end

语音信号盲分离测试工具

基于Tcl/Tk 与C 的语音信号盲分离测试工具 马骏 西安市地下铁道有限责任公司 西安 710018 摘要:如何分离多说话人环境下麦克风所采集的混合语音信号是盲源分离研究的一个重要课题。文章采用TCL/TK 与C 语言混合编程,自主开发了用于语音信号盲分离测试的工具,并介绍了该工具的结构、界面和功能。最后通过试验验证了该工具的正确性。 关键词:盲源分离 语音信号 Tcl/Tk A Tcl/Tk & C-based testing tool for blind separation of audio signals Ma Jun Xi'an Metro Co., Ltd. Xi'an 710018 Abstract: Separating independent signal from audio mixtures is one of the elementary problems in Blind Source Separation (BSS) research. The interface between Tcl/Tk is explained, and a testing tool for blind separation of audio signals is developed. The structure, interface and function of the tool are introduced. The validity of the tool is proved by experiment. Keywords :Blind source separation Audio signals Tcl/Tk 1.引言 盲源分离(BSS )[1,2,3,4]是人工神经网络与统计信号处理以及信息论相结合的产物,而混 合语音信号的盲分离是该领域的一个重要课题。使计算机具有和人类一样的听觉,是计算机智能领域研究者们的梦想。语音识别技术为我们实现计算机听觉的这一目标提供了有效的途径,使得计算机能听懂我们人类的语言,计算机操作从此变得更互动和简单自然,方便了人机的交流。混合语音信号盲分离虽然不能实现计算机听觉这一目标,但是通过该技术却能使原本相互混叠的语音信号相互剥离,来作为语音识别的预处理,从而使得噪声环境下和多说话人情形下的语音识别的实现成为可能,增大了识别算法的鲁棒性和适应能力,从这种意义上来讲该问题的研究具有很大的现实意义。 本文首先阐述了盲源分离的基本理论知识以及Tcl/Tk [5]与C 语言的接口编程,然后采用 分层软件模型开发了用于语音信号盲分离的测试工具,其外壳选择灵活的事件驱动脚本Tcl/Tk 作为基本的界面开发平台,完成配置、控制任务;而其低层的BSS 核心算法库则利用高效的编译型C 语言实现。另外为了完成语音信号的读写等操作还参考了snack [6]语音处理库及其源代码。文章介绍了该工具的结构、界面和功能,最后通过实验验证了该测试工具的正确性。 2.盲源分离模型及算法 设由N 个未知的统计独立的信号源)(t s i 构成了一个列向量,)](),...,([)(1T N t s t s t S =其中t 是离散采样时刻。设A 是一个未知的N M ?维矩阵,通常称为混合矩阵。设[]T M t x t x t X )(),...,()(1=是由M 个传感器观测到混合信号)(t x i 构成的列向量,且满足下列方程: )()((t)t V t AS X += (1) 其中T M 1t ,...,v t v t V )]()([)(=是由M 个空间白化、统计独立噪声信号(t)i v 构成的列向量。盲源分 离的命题是,对任何t ,根据观测到的)(t X ,在A 未知的条件下求)(t S 。 图1给出了语音信号盲分离算法框架图。

基于某MATLAB地语音信号采集与处理

工程设计论文 题目:基于MATLAB的语音信号采集与处理 姓名: 班级: 学号:

指导老师: 一.选题背景 1、实践意义: 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在于方便有效地提取并表示语音信号所携带的信息。所以理解并掌握语音信号的时域和频域特性是非常重要的。 通过语音相互传递信息是人类最重要的基本功能之一.语言是人类特有的功能.声音是人类常用工具,是相互传递信息的最重要的手段.虽然,人可以通过多种手段获得外界信息,但最重要,最精细的信息源只有语言,图像和文字三种.与用声音传递信息相比,显然用视觉和文字相互传递信息,其效果要差得多.这是因为语音中除包含实际发音容的话言信息外,还包括发音者是谁及喜怒哀乐等各种信息.所以,语音是人类最重要,最有效,最常用和最方便的交换信息的形式.另一方面,

语言和语音与人的智力活动密切相关,与文化和社会的进步紧密相连,它具有最大的信息容量和最高的智能水平。 语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,处理的目的是用于得到某些参数以便高效传输或存储;或者是用于某种应用,如人工合成出语音,辨识出讲话者,识别出讲话容,进行语音增强等. 语音信号处理是一门新兴的学科,同时又是综合性的多学科领域,是一门涉及面很广的交叉学科.虽然从事达一领域研究的人员主要来自信息处理及计算机等学科.但是它与语音学,语言学,声学,认知科学,生理学,心理学及数理统计等许多学科也有非常密切的联系. 语音信号处理是许多信息领域应用的核心技术之一,是目前发展最为迅速的信息科学研究领域中的一个.语音处理是目前极为活跃和热门的研究领域,其研究涉及一系列前沿科研课题,巳处于迅速发展之中;其研究成果具有重要的学术及应用价值. 数字信号处理是利用计算机或专用处理设备,以数值计算的方法对信号进行采集、抽样、变换、综合、估值与识别等加工处理,借以达到提取信息和便于应用的目的。它在语音、雷达、图像、系统控制、通信、航空航天、生物医学等众多领域都获得了极其广泛的应用。具有灵活、精确、抗干扰强、度快等优点。 数字滤波器, 是数字信号处理中及其重要的一部分。随着信息时代和数字技术的发展,受到人们越来越多的重视。数字滤波器可以通过数

语音信号的盲分离分析

目录 摘要.................................................................... I ABSTRACT ............................................................... II 第一章前言.. (2) 1.1语音特性分析 (2) 1.2语音信号的基本特征 (2) 1.3语音信号处理的理论基础 (2) 第二章盲分离的基本概念 (2) 2.1盲分离的数学模型 (2) 2.2盲源分离的基本方法 (2) 2.3盲分离的目标准则 (2) 2.4盲分离的研究领域 (2) 2.5盲分离的研究内容 (2) 第三章独立分量分析的基本算法 (2) 3.1ICA的线性模型 (2) 3.2ICA研究中的主要问题及限制条件 (2) 3.3ICA的基本算法 (2) 3.4F AST ICA算法原理 (2) 第四章语音信号盲分离仿真及分析 (2) 4.1ICA算法实现 (2) 4.2频谱分析 (2) 第五章总结 (2) 参考文献 (2)

摘要 盲源分离(BSS)是一种多维信号处理方法,它指在未知源信号以及混合模型也未知的情况下,仅从观测信号中恢复出源信号各个独立分量的过程。盲源分离已近成为现代信号处理领域研究的热点问题,在通信、语音处理、图像处理等领域具有非常重要的理论意义和广泛的应用价值。本文主要内容如下: 首先,介绍了语音信号的产生机理,特性,基本特征及语音信号处理的理论基础,为后文语音信号盲分离奠定了基础。 其次,从盲源分离的理论出发,研究了盲分离的数学模型以及基本方法,并对盲分离的目标准则、研究领域以及研究内容进行了探讨。 然后,引出了独立分量分析(ICA),并对其的概念以及相关的知识进行了研究,探讨了ICA研究中的主要问题,列出了ICA的3种基本算法:信息极大化、负熵最大化和最大似然估计法。 最后,用FastICA对三路语音信号进行了盲分离的仿真并求出了混合矩阵和分解矩阵,再接着进行了频谱,幅度,相位的分析,找出了FastICA的特点。 关键词:盲源分离;独立分量分析;频谱分析 III

matlab报告基于matlab有噪声语音信号处理

Matlab课程设计报告题目:基于MATLAB有噪声语音信号处理 系(院):计算机与信息工程学院 专业:通信工程 班级:10623102 指导教师: 学年学期:2011 ~ 2012 学年第2 学期

简介: 我们通信工程专业在实践中经常碰到需要对已接收信号进行处理的情况,而滤波器设计在数字信号处理中占有极其重要的地位。本课题基于MATLAB有噪音语音信号处理的设计与实现,综合运用数字信号处理的理论知识对加噪语音信号进行时域、频域分析和滤波。通过理论推导得出相应结论,再利用MATLAB作为编程工具进行计算机实现。在设计实现的过程中,我们使用双线性变换法设计IIR数字滤波器,对模拟加噪语音信号进行低通滤波、高通滤波及带通滤波,并利用MATLAB作为辅助工具完成设计中的计算与图形的绘制。 1 绪论: 数字信号处理是利用计算机或专用处理设备,以数值计算的方法对信号进行采集、抽样、变换、综合、估值与识别等加工处理,借以达到提取信息和便于应用的目的。数字滤波器, 是数字信号处理中及其重要的一部分。本课题采用IIR 滤波器对加噪声音信号进行处理。 IIR滤波器采用递归型结构,即结构上带有反馈环路。IIR滤波器运算结构通常由延时、乘以系数和相加等基本运算组成,可以组合成直接型、正准型、级联型、并联型四种结构形式,都具有反馈回路。同时,IIR数字滤波器在设计上可以借助成熟的模拟滤波器的成果,如巴特沃斯、契比雪夫和椭圆滤波器等,有现成的设计数据或图表可查,在设计一个IIR数字滤波器时,我们根据指标先写出模拟滤波器的公式,然后通过一定的变换,将模拟滤波器的公式转换成数字滤波器的公式。 2.原始语音信号采集与处理 2.1语音信号的采集 由于MATLAB只识别格式为.wav的声音文件,我们利用PC机上的声卡和WINDOWS操作系统进行数字信号的采集。启动录音机进行录音,以文件名“Orisound”保存入原程序所属的文件夹中。可以看到,文件存储器的后缀默认为.wav ,这是WINDOWS操作系统规定的声音文件存的标准。

语音信号的盲分离(毛丽娟)

课程设计任务书 学生姓名:毛丽娟专业班级:通信0906 指导教师:黄铮工作单位:信息工程学院 题目: 语音信号的盲分离 初始条件 ①matlab软件 ②盲信号处理知识 要求完成的主要任务: 根据盲信号分离原理,用matlab采集两路以上的语音信号,选择合适的混合矩阵生成若干混合信号。选取合适的盲信号分离算法(如独立成分分析ICA等)进行训练学习,求出分离矩阵和分离后的语音信号。 设计要求 (1)用matlab做出采样之后语音信号的时域和频域波形图 (2)选择合适的混合矩阵,得到混合信号,并做出其时域波形和频谱图 (3)采用混合声音信号进行训练学习,求出分离矩阵,编写出相应的确matlab 代码。 (4)用求出的分离矩阵从混合信号中分离出原语音信号,并画出各分离信号的时域波形和频谱图。 (5)对结果进行对比分析。 时间安排 第17周,仿真设计 第18周,完成(答辩,提交报告,演示) 指导教师签名:年月日 系主任(或责任教师)签名:年月日

目录 摘要 (3) Abstract (4) 1 语音信号 (5) 1.1 语音特性分析 (5) 1.2 语音信号的基本特征 (6) 2 盲信号处理 (8) 2.1 盲信号处理的概述 (8) 2.1.1 盲信号处理的基本概念 (8) 2.1.2 盲信号处理的方法和分类 (9) 2.1.3 盲信号处理技术的研究应用 (9) 2.2 盲源分离法 (10) 2.2.1 盲源分离技术 (10) 2.2.2 盲分离算法实现 (10) 2.3 独立成分分析 (11) 2.3.1 独立成分分析的定义 (11) 2.3.2 ICA的基本原理 (13) 3 语音信号盲分离的实现 (15) 3.1 盲信号分离的三种算法 (15) 3.1.1 二阶盲辨识(SOBI) (15) 3.1.2 FastICA算法 (15) 3.1.3 CICA算法 (16) 3.2 不同算法的分离性能比较 (17) 3.3 FastlCA的算法仿真及结果分析 (17) 4 结论 (22) 5 参考文献 (23) 附录 (24)

基于matlab的语音信号的采集与处理

目录 第1章前言 (1) 第2章语音信号分析处理的目的和要求 (2) 2.1MATLAB软件功能简介............................................................................................ - 2 - 2.2课程设计意义 ............................................................................................................. - 2 - 第3章语音信号的仿真原理. (3) 第4章语音信号的具体实现 (4) 4.1语音信号的采集........................................................................................................... - 4 - 4.2语音信号加噪与频谱分析........................................................................................... - 5 - 4.3设计巴特沃斯低通滤波器........................................................................................... - 6 - 4.4用滤波器对加噪语音滤波........................................................................................... - 7 - 4.5比较滤波前后语音信号波形及频谱........................................................................... - 8 - 第5章总结.............................................................................................................................. - 9 - 参考文献.................................................................................................................................. - 10 - 附录.......................................................................................................................................... - 11 -

基于MATLAB的语音信号的处理

第一章语音信号的特点与采集 第一节语音信号采集的介绍 在Matlab环境中,主要可以通过以下几种方法驱动声卡,采集语音信号: 1.将声卡作为对象处理采集语音信号Matlab将声卡作为对象处理,其后的一切操作都不与硬件直接相关,而是通过对该对象的操作来作用于硬件设备(声卡)。操作时首先要对声卡产生一个模拟输入对象(ai),给ai对象添加一个通道设置采样频率后,就可以启动设备对象,开始采集数据,采集完成后停止对象并删除对象。 2.调用wavrecord功能函数采集语音信号。wavrecord功能函数只适用于windows95/98/N平台,它使用windows声音输入设备录制声音。函数调用方式:wavrecord(N,fs,ch,nbits); N:采集的样本数据量; fs:样本采集频率,为8000Hz、11025Hz、22050Hz和44100Hz之一,默认值为11025Hz; ch:样本采集通道,1为单声道,2为双声道,默认值为1(单声道); nbits:每个样本的位数(或称解析度),‘double’、‘single’或‘int16’为16位,‘uint8’为8位; 3.运用audiorecorder对象采集语音信号audiorecorder(fs,nbits,ch)可以创设一个audiorecorder对象。fs:样本采集频率,为8000Hz、11025Hz、22050Hz和44100Hz之一,默认值为8000Hz; nbits:每个样本的位数,8位或16位,默认值为8位; ch:样本采集通道,1为单声道,2为双声道,默认值为1(单声道); audiorecorder对象创设后,就可以进行相应的录音、暂停、停止、播放以及数据读取等操作。第二节语音信号的特点 通过对大量语音信号的观察和分析发现,语音信号主要有下面两个

盲信号分离的理论与发展现状

前沿技术 尺寸的减小,场区参数R1和R2相应收缩。这是一个很有意义的结果。 5 结束语 基于以上的分析和验算,可以说明ISO/IEC18047标准规定的测试参数:观察距离3λ和10λ,天线尺寸 0.1m和 是可行的。 ★【作者简介】 刘礼白:研究员级高工,中国电子科技集团公司第七研究所科技委主任、专家委员会副主任,信息产业部宽带无线移动通信技术专家组成员。中华人民共和国电子工业部有突出贡献专家,享受国务院颁发的 政府特殊津贴。 1 引言 盲分离是信号处理领域一个极富挑战性的研究课题。由于盲分离在语音识别、信号去噪、无线通讯、声纳问题、生物医学信号处理、光纤通信等众多应用领域有着广泛的应用前景,从而成为信号处理领域和神经网络领域的研究热点。 盲分离(B S S,B l i n d S o u r c e S e p a r a t i o n)的研究起源于鸡尾酒问题。在多个说话人同时讲话的语音环境中,通常每个麦克风接收到是多个说话者的混合声音,如何仅仅从话筒接收到的语音信号中分离出所需要的说话者的声音?这便是盲分离问题。 盲分离问题的主要特征就是在未知混叠参数的情 盲信号分离的理论与发展现状* 李荣华 赵 敏 华南理工大学电子与信息学院 王 进 国家移动通信工程中心 【摘要】文章首先介绍了盲信号分离问题的起源、特征、含义,然后介绍了盲信号分离的原理 和算法,最后介绍了盲分离研究的现状,探讨了盲分离研究仍存在的一些问题。 【关键词】盲信号分离 混叠模型 瞬时线性 非线性 卷积 收稿日期:2008年3月14日 *本文得到国家自然科学基金重点项目(U0635001),国家 自然科学基金(60774094)的资助。

相关文档
最新文档