语音信号处理作业1

语音信号处理作业1
语音信号处理作业1

语音信号处理的发展历程及发展趋势

学号201105039

前言

在现代信息社会中,小至人们的日常生活,大到国家大事、世界新闻、社会舆论和各种重要会议,都离不开语言和文字。近年来,普通电话、移动电话和互联网已经普及到家庭。在这些先进的工具中,语音信号处理中的语音编码和语音合成就有很大贡献。再进一步,可以预料到的口呼打字机(又称听写机,它能把语音转换为文字)、语音翻译机(例如输入为汉语,输出为英语,或者相反),已经不是梦想而是提到日程上的研究工作了。

语音信号处理的理论基础就是一般的数字信号处理理论,它的主要研究内容是语音编码和语音压缩技术。语音信号是一门新兴的学科,同时又是综合性的多学科领域,是一门涉及面很广的交叉学科。虽然从事这一领域研究的人员主要来自信息处理及计算机等学科,但是它与语音学,语言学,声学,认知科学生理学,心理学及数理统计等许多学科也有非常密切的联系

语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。同时,语言也是人与机器之间进行通信的重要工具,它是一种理想的人机通信方式,因而可为信息处理系统建立良好的人机交互环境,进一步推动计算机和其他智能机器的应用,提高社会的信息化程度。

语音信号处理是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。虽然从事这一领域研究的人员主要来自信号与信息处理及计算机应用等学科,但是它与语音学、语言学、声学、认知学科、生理学、心理学等许多学科也有非常密切的联系。

语言是从千百万人的言语中历史地概括总结出来的规律符号系统,使人们用以进行思维、交际的形式。语言是人类特有的功能,它创造和记载了几千年的人类文明历史。语音是声音和意义的结合体,也是信息的载体。语音信号处理是是研究用数字信号处理技术队语音信号进行处理,处理的目的是用于得到的某些参

数以便高效传输和存储;或者应用于人工合成、语音识别和语音增强等。语音信号处理是一个新兴的的学科,同时又是综合性的多学科领域,是一门设计很广的交叉学科,它与语音学、语言学、声学,认知科学、心理学、心理学、数理统计学等许多学科也有着非常密切的联系。

自计算机诞生以来,通过语音与计算机交互一直是人类的梦想,随着计算机软硬件和信息技术的飞速发展,这不仅对语音信号数字处理提出了越来越高越来越迫切的需求,如实现用语音输入代替键盘输入实现人工智能和交互,同时也为语音信号处理提供了高效软硬件实现的可能性。

语音信号处理的发展历程

语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。语言也是人与机器之间进行通信的重要工具,可为信息处理系统建立良好的人机交互环境,可以更好地实现人工智能,为信息社会的构建是至关重要的。

20世纪60年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换(FFT)等是语音信号数字处理的理论和技术基础。在方法上,随着电子计算机的发展,以往的以硬件为中心的研究正逐渐转化为以软件为基础的研究,即计算机的软件模拟取代了硬件研制的传统做法。各种新的思想和方法不断涌现,语音信号处理也取得了重大的进展。在整个20世纪70年代,有几项研究成果对语音信号处理技术的进步和发展产生了重大的影响。70年代初由Itakura提出的动态时间规划(DTW)技术是语音识别研究方面开辟了新思路,一种模式匹配和模型训练技术,它应用动态规划的思想成功解决了语音信号特征参数序列比较时时长不等的难题,在孤立词语音识别中获得了良好性能,且由于DTW算法计算量较少、无需前期的长期训练,很容易将DTW算法移植到单片机、DSP上实现语音识别且能满足实时性要求,其在孤立词语音识别系统中仍然得到了广泛的应用。70年代中期提出了用于语音信号的信息压缩和特征提取的线性预测技术(LPC),并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间时间匹配的动态规划方法;70年代末Linda、Buzo、Gray和Markel等人提出了一种新的基于聚类分析的高效数据压缩技术——矢量量化(VQ)应用于语音信号处理中,它

不仅在语音识别、语音编码和说话人识别等方面发挥了重要作用,而且也很快推广到其他领域。

20世纪80年代,由于矢量量化、隐马尔可夫模型(HMM)和热工神经网络等相继被应用与语音信号处理,应经过不断的改进和完善,使语音信号处理技术有了突破性的进展。80年代产生的HMM是语音信号处理技术的重大发展,它是语音信号的一种统计模型,它描述语音信号过程的产生,而且HMM已构成了现代语音识别研究的重要基石,也是目前语音识别技术等地主流研究途径。其理论基础是1970年前后由Baum等人建立起来的。

20世纪90年代以来,语音信号处理在实用化处理方面取得了实质性的进展,其中,语音识别逐渐由实验室走向实用化。而且,关于文本——语音自动转化系统(TTS)近年来人工神经网络(ANN)的研究取得了迅速发展,语音信号处理的各项课题是促进其发展的重要动力之一,同时,它的许多成果也体现在有关语音信号处理的各项技术之中。

语音信号处理的发展趋势

语音编码已经比较成熟,有很多现成标准。语音合成已有比较成熟的方案,国内如科大讯飞的。语音降噪技术发展也很多年,主要分为去除平稳噪声的单麦克风降噪,以及抑制方向性噪声的双麦克风降噪。总体而言,以feature形式存在居多,难以从根本上提高语音质量。毕竟,什么信号处理技术也难以和人耳听觉系统的处理能力相比啊。回音消除技术严格说来,应该属于音频信号处理。不过其中的残余回声抑制,属于语音信号处理。可以看成是语音降噪技术的一种扩展,跟单麦克和双麦克方式都有一定的联系。这个目前在VOIP技术中已经应用广泛,可提高余地已经不大。语音识别技术目前的技术框架主要基于模式识别,对数据的匹配性要求很高,对方言,口音,以及口语的处理能力还存在很大的瓶颈。对于标准口音,还是可以处理的,不过也需要用户不低的配合度。

1 语音信号处理的关键技术

语音信号处理的理论基础就是一般的数字信号处理理论, 它的主要研究内容是语音编码和语音压缩技术。考虑到人对听觉媒体的感应特点, 研究语音信号处理必须与声音心理学联系起来。因此这里我们把声音心理学也列为语音信号处理的关键技术之一。

(1)声音心理学

声音的物理属性和心理属性既有联系也有区别。声音有两个最明显的量纲, 即响度和音调, 其它还有音色、谐和、不谐和和乐音等等。物理属性主要有强度和频率。声音的正弦波的强度增加, 声的响度也增加; 频率增加, 音调则增高。但这些关系不是线性的, 且是耦合的, 如频率的变化既影响响度也影响音调。其数量上的关系可以用等响曲线等来描述。但更精确。关系复杂, 难以建立量化模型。如即使想从客观上给出声音失真度的度量都很困难。

人的大脑处理听觉信息还有一些特性,产生了一些客观存在的效应, 如屏蔽效应。声的响度不仅取决于自身的强度和频率, 而且也依同时出现的其它声音而定。各种声音可以互相掩蔽, 一种声音的出现可能使得另一种声音难于听清。它分为听觉屏蔽、频谱屏蔽和瞬态屏蔽。频谱屏蔽是高电平音调使附近频率的低电平声音不能被人耳听到。声音的屏蔽特性可以用于声音特别是语音信号的压缩。

(2)语音编码

语音编码分为三类: 波形编码、参量编码和混合编码。

波形编码是将时域信号直接变换为数字代码, 其目的是尽可能精确地再现原来的话音波形。自适应量化、自适应比特分配和矢量量化等等。

2 在语音识别与合成中的应用

语音识别的研究是从20 世纪50 年代开始的, 但直到60 年代中期才取得了实质性进展, 其重要标志就是日本学者Itakura 将动态规划算法用于解决语音识别中语速多变的难题, 提出了动态时间收缩算法(DTW:Dy2nam ic TimeW arping)。其基本思想是: 在训练阶段, 从词汇表中通过语音信号处理技术提出每个词的特征向量(时域特征、频域特征、尺度特征及联合分布特征), 作为标准模板存入模板库中。在识别阶段, 将输入语音的特征向量依次与模板库中的各个标准模板进行比较, 计算类似度, 将类似度最高的标准模板所对应的词汇输出。在这里和一般的模式识别不一样, 存在几个问题: 说话者语速不一致的问题; 大词汇表的问题导致计算量大的问题; 协同发音的问题(即同一音素的发音随上下文不同而变化); 对于非特定人语音识别, 还有一个语音多变性的困难。

语音识别的这些问题, 除了在优化算法上应有所突破外, 一个最根本的问题是语音特征量的提取问题。目前能够用于模板匹配的特征向量还不能达到少而精的要求。能够反映特定人和非特定人在语速变化下的不变特征量、在连续语音

识别中的协同发音不变量等特征量还有待进一步的研究。这些工作的进展依赖于语音信号处理技术及一般的信号处理技术的突破。语音合成技术就是所谓“会说话的机器”。它可分为三类: 波形编码合成、参数式合成和规则合成。波形编码合成以语句、短语、词或音节为合成单元。合成单元的语音信号被录取后直接进行数字编码, 经数据压缩组成一个合成语音库。重放时根据待输出的信息, 在语音库中取出相应的合成单元的波形数据, 将它们连接在一起, 经解码还原成语音。参数式合成以音节或音素为合成单元。首先对所有待合成单元的语音进行分析, 提取有关语音参数, 将其编码后组成合成语音库。输出时根据待合成的语音信息从语音库中取出相应的合成参数, 经编辑和连接, 顺序送入语音合成器。语音合成器在合成参数的控制下, 重新还原语音波形。规则合成则是通过语音学规则产生语音。

3 多媒体数据库中的语音数据检索

所谓基于内容检索就是从语音媒体数据中提取出特定的信息线索, 然后根据这些线索从大量存储在数据库中的语音媒体中进行查找, 检索出具有相似特征的语音数据。语音的音调、含义等是难以用符号化方法描述的信息线索。人能够理解语音的含义, 但要利用这些语义线索对语音数据库进行检索就不得不在建立数据库时就事先输入并与媒体数据一起存储对应的字符信息, 对这些语音的语义进行描述。在检索时, 由人把这些语义再转换为相应的字符, 根据字符的匹配查找相应的媒体息。很显然, 这个转换过程妨碍了有效地交互, 被称为“转换障碍”, 很难满足用户的各种需求。对设计者来说, 给语音数据赋予能够表示全部语义特征的关键词也非常困难, 这与个人的经验、知识和对语音信息的理解程度相关, 而且也并不是所有对象的所有特征都能用字符来描述。基于内容检索就是要从媒体中直接地提取媒体的语义线索, 根据这些语义线索进行检索。这就把检索过程与语义的提取直接地联系到了一起, 使得检索过程更加有效和适应性更强。

基于内容的语音检索是一种集成综合技术, 不仅要确定是否能够找到, 而且还要确定相应的输入输出方法、存储方法、媒体间的组织方法等。它建立新的媒体数据表示方法和数据模型, 采用有效和可靠的查询处理算法,使用户可以在智能化的查询接口的辅助下完成查询检索工作。基于内容的语音检索技术一般

用于多媒体数据库中, 也可以单独的建立应用系统, 如语音库系统。该检索系统一般包括: 插入系统, 特征提取子系统, 数据库, 查询子系统。其中特征提取子系统其基本原理在时间轴上对模拟话音按一定的速率抽样, 然后将幅度样本分层量化并用代码表示。对于比特速率较高的编码信号, 波形编码技术能够提供相当好的话音质量, 但对于低速率语音编码信号, 波形编码的话音质量显著下降。

参量编码是将信源信号在频率域或其它正交变换域提取特征参量, 并将其变换为数字代码进行传输。它是以发音机制的模型作为基础, 用一套模拟声带频谱特性的滤波器系数和若干声源参数来描述这个编码。这种编码技术能实现低速率语音编码。下面将要重点介绍的线性预测编码(LPC)和它的各种改进型都属于参量编码。混合编码是近年来提出的, 它将波形编码和参量编码结合起来, 力图保持波形编码的高质量和参量编码的低速率的优点。它既包括若干语音特征参量又包括部分波形编码信息。

现代数字信号处理的进步都能在语音信号处理技术中得到应用。语音信号是最能体现信号非线性的一个领域。现代数字信号处理的一个主要发展趋势是对非线性、非平稳信号的研究。因此, 循环平稳信号分析、多谱分析和时频尺度理论对于语音信号的表示,关键特征的捕捉有很重要的应用前景。在此基础上, 结合语音语义理论的研究, 开展多层次的语音信号的表示将对语音信号的应用有重要价值。

目前,语音理解技术开始使计算机丢掉了键盘和鼠标,人们对语音理解的研究重点正拓展到特定应用领域的自然语音理解上。一些基于口语识别、语音合成和机器翻译的专用性系统开始出现,如信息发布系统、语音应答系统、会议同声翻译系统、多语种口语互译系统等等,正受到各方面越来越多的关注。这些系统可以按照人类的自然语音指令完成有关的任务,提供必要的信息服务,实现交互式语音反馈。

语音是语言的声学表现形式,是最符合人类自然习惯的一种人际信息传播方式,具有便捷性、高效性、随机性、交互性等显著特点,是实现人机交互的一种重要通信方式。可以预见,随着计算机技术、数字信号处理技术和大规模集成电路的迅速发展,语音信号数字处理技术将成为信息化战争不可或缺的重要组成部分,并直接进入到信息化战争的前沿。

语音信号处理实验指导书

语音信号处理实验指导书 实验一 语音信号采集与简单处理 一、 实验目的、要求 (1)掌握语音信号采集的方法 (2)掌握一种语音信号基音周期提取方法 (3)掌握短时过零率计算方法 (4)了解Matlab 的编程方法 二、 实验原理 基本概念: (a )短时过零率: 短时内,信号跨越横轴的情况,对于连续信号,观察语音时域波形通过横轴的情况;对于离散信号,相邻的采样值具有不同的代数符号,也就是样点改变符号的次数。 对于语音信号,是宽带非平稳信号,应考察其短时平均过零率。 其中sgn[.]为符号函数 ?? ?? ?<=>=0 x(n)-1sgn(x(n))0 x(n)1sgn(x(n)) 短时平均过零的作用 1.区分清/浊音: 浊音平均过零率低,集中在低频端; 清音平均过零率高,集中在高频端。 2.从背景噪声中找出是否有语音,以及语音的起点。 (b )基音周期 基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。 ∑--= -=1 )]1(sgn[)](sgn[21N m n n n m x m x Z

由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。基音提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列,在语音的头、尾部并不具有声带振动那样的周期性,有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。②声道共振峰有时会严重影响激励信号的谐波结构,所以,从语音信号中直接取出仅和声带振动有关的激励信号的信息并不容 易。③语音信号本身是准周期性的(即音调是有变化的),而且其波形的峰值点或过零点受共振峰的结构、噪声等的影响。④基音周期变化范围大,从老年男性的50Hz 到儿童和女性的450Hz ,接近三个倍频程,给基音检测带来了一定的困难。由于这些困难,所以迄今为止尚未找到一个完善的方法可以对于各类人群(包括男、女、儿童及不向语种)、各类应用领域和各种环境条件情况下都能获得满意的检测结果。 尽管基音检测有许多困难,但因为它的重要性,基音的检测提取一直是一个研究的课题,为此提出了各种各样的基音检测算法,如自相关函数(ACF)法、峰值提取算法(PPA)、平均幅度差函数(AMDF)法、并行处理技术、倒谱法、SIFT 、谱图法、小波法等等。 三、使用仪器、材料 微机(带声卡)、耳机,话筒。 四、 实验步骤 (1)语音信号的采集 利用Windows 语音采集工具采集语音信号,将数据保存wav 格式。 采集一组浊音信号和一组清音信号,信号的长度大于3s 。 (2)采用短时相关函数计算语音信号浊音基音周期,考虑窗长度对基音周期计算的影响。采用倒谱法求语音信号基音周期。 (3)计算短时过零率,清音和浊音的短时过零率有何区别。 五、实验过程原始记录(数据,图表,计算) 短时过零率 短时相关函数 P j j n s n s j R N j n n n n ,,1) ()()(1 =-=∑-= ∑--=-=10 )]1(sgn[)](sgn[21N m n n n m x m x Z

语音信号处理

信号分析与处理课程设计———语音信号处理 姓名 学号 专业 指导教师 设计日期

1 引言 MATLAB是美国Math Works公司推出的一种面向工程和科学计算的交互式计算软件。它以矩阵运算为基础,把计算、可视化、程序设计融合在一个简单易用的交互式工作环境中,是一款数据分析和处理功能都非常强大的工程实用软件。本文介绍了用MATLAB处理音频信号的基本流程,并以实例形式列出了常用音频处理技术实现程序。 2 MATLAB处理音频信号的流程 分析和处理音频信号,首先要对声音信号进行采集,MATLAB数据采集工具箱提供了一整套命令和函数,通过调用这些函数和命令,可直接控制声卡进行数据采集[1]。Windows自带的录音机程序也可驱动声卡来采集语音信号,并能保存为WAV格式文件,供MATLAB相关函数直接读取、写入或播放。本文以WAV格式音频信号作为分析处理的输入数据,用MATLAB处理音频信号的基本流程是:先将WAV格式音频信号经wavread 函数转换成MATLAB列数组变量;再用MATLAB 强大的运算能力进行数据分析和处理,如时域分析、频域分析、数字滤波、信号合成、信号变换、识别和增强等等;处理后的数据如是音频数据,则可用wavwrite 转换成WAV格式文件或用sound、wavplay等函数直接回放。 下面分别介绍MATLAB在音量标准化、声道分离合并与组合、数字滤波、数据转换等音频信号处理方面的技术实现。 4系统初步流程图

图2.2 信号调整 信号的滤波采用了四种滤波方式,来观察各种滤波性能的优缺点: 图2.3 语音信号滤波的方式 在以上三图中,可以看到整个语音信号处理系统的流程大概分为三步,首先要读入待处理的语音信号,然后进行语音信号的处理,包括信息的提取、幅度和频率的变换以及语音信号的傅里叶变换、滤波等;滤波又包括低通滤波、高通滤波、带通滤波和带阻滤波等方式。最后对处理过的语音信号进行处理后的效果显示。以上是本系统的工作流程,本文将从语音信号的采集开始做详细介绍。 3 音量标准化 录制声音过程中需对声音电平进行量化处理,最理想的量化是最大电平对应最高量化比特,但实际却很难做到,常有音轻问题。利用MATLAB很容易实现音量标准化,即最大电平对应最高量化比特。基本步骤是:先用wavread函数将WAV文件转换成列数组变量;再求出数组变量的极值并对所有元素作归一化处理;最后用wavwrite函数还原成音量标准化的WAV文件。程序如下: clear; close all; clc; [Y,FS,NBITS]=wavread('xp.wav'); % 将WAV文件转换成变量FS, NBITS % 显示采样频率和量化比特Ym=max(max(max(Y)),max(abs(min(Y)))); % 找出双声道极值 X=Y/Ym; % 归一化处理 wavwrite(X,FS,NBITS,'xps.wav'); % 将变量转换成WAV文件

语音信号处理与及其MATLAB实现分析

目录 摘要 (2) 第一章绪论 (3) 1.1 语音课设的意义 (3) 1.2 语音课设的目的与要求 (3) 1.3 语音课设的基本步骤 (3) 第二章设计方案论证 (5) 2.1 设计理论依据 (5) 2.1.1 采样定理 (5) 2.1.2 采样频率 (5) 2.1.3 采样位数与采样频率 (5) 2.2 语音信号的分析及处理方法 (6) 2.2.1 语音的录入与打开 (6) 2.2.2 时域信号的FFT分析 (6) 2.2.3 数字滤波器设计原理 (7) 2.2.4 数字滤波器的设计步骤 (7) 2.2.5 IIR滤波器与FIR滤波器的性能比较 (7) 第三章图形用户界面设计 (8) 3.1 图形用户界面概念 (8) 3.2 图形用户界面设计 (8) 3.3 图形用户界面模块调试 (9) 3.3.1 语音信号的读入与打开 (9) 3.3.2 语音信号的定点分析 (9) 3.3.3 N阶高通滤波器 (11) 3.3.4 N阶低通滤波器 (12) 3.3.5 2N阶带通滤波器 (13) 3.3.6 2N阶带阻滤波器 (14) 3.4 图形用户界面制作 (15) 第四章总结 (18) 附录 (19) 参考文献 (24)

摘要 数字信号处理是将信号以数字方式表示并处理的理论和技术。数字信号处理与模拟信号处理是信号处理的子集。 数字信号处理的目的是对真实世界的连续模拟信号进行测量或滤波。因此在进行数字信号处理之前需要将信号从模拟域转换到数字域,这通常通过模数转换器实现。而数字信号处理的输出经常也要变换到模拟域,这是通过数模转换器实现的。 数字信号处理的算法需要利用计算机或专用处理设备如数字信号处理器(DSP)和专用集成电路(ASIC)等。数字信号处理技术及设备具有灵活、精确、抗干扰强、设备尺寸小、造价低、速度快等突出优点,这些都是模拟信号处理技术与设备所无法比拟的。 数字信号处理的核心算法是离散傅立叶变换(DFT),是DFT使信号在数字域和频域都实现了离散化,从而可以用通用计算机处理离散信号。而使数字信号处理从理论走向实用的是快速傅立叶变换(FFT),FFT的出现大大减少了DFT的运算量,使实时的数字信号处理成为可能、极大促进了该学科的发展。 MATLAB是矩阵实验室(Matrix Laboratory)的简称,和Mathematica、Maple 并称为三大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。 MATLAB的基本数据单位是矩阵,它的指令表达式与数学、工程中常用的形式十分相似,故用MATLAB来解算问题要比用C,FORTRAN等语言完相同的事情简捷得多,并且mathwork也吸收了像Maple等软件的优点,使MATLAB成为一个强大的数学软件。在新的版本中也加入了对C,FORTRAN,C++ ,JAVA的支持。可以直接调用,用户也可以将自己编写的实用程序导入到MATLAB函数库中方便自己以后调用,此外许多的MATLAB爱好者都编写了一些经典的程序,用户可以直接进行下载就可以用。

DSP语音信号处理课程设计(精)

DSP语音信号处理课程设计报告书 语音信号处理GUI工具箱设计 指导老师:专业:电子信息工程 班级: 姓名:学号: 设计时间: 2011年10月12日至 地点: 摘要 语音信号处理是研究数字信号处理技术和语音信号进行处理的一门学科,是一门新型的学科,是在多门学科基础上发展起来的综合性技术,它涉及到数字信号处理、模式识别、语言学。语音信号处理是研究用数字信号处理技术对语音信号处理的一门学科。处理的目的是要得到一些语音参数以便高效的传输或存储;或者是通过处理的某种运算以达到某种用途的要求。语音信号处理又是一门边缘学科。如上所诉,它是“语言语音学”与“数字信号处理”两个学科相结合的产物。 语音信号处理属于信息科学的一个重要分支,大规模集成技术的高度发展和计算机技术的飞速前进,推动了这一技术的发展。在数字音频技术和多媒体技术迅速发展的今天,传统的磁带语音录放系统因体积大、使用不便、放音不清晰而受到了巨大挑战。本次课程设计提出的体积小巧,功耗低的数字化语音存储与回放系统,可以有效的解决传统的语音录放系统在电子与信息处理的使用中受到的限制。 本文提出了语音信号处理课程建设的实验环节中的一些考虑,作为专业课程的学习,实验内容不能仅仅停留在验证性实验上,还应增加实验延伸的设计要求,是学生加深对理论分析认识的同时,强调培养学生的实际动手能力和知识综合运用能力。从而提高语音信号的教学和实验的质量。实验内容采用MATLAB编程实现,不仅易于语音信号处理的实现,更易引导学生完成实验延伸的设计。 目录 第一章绪论 (1) 1.1课程设计的目的及意义 (1) 1.2设计要求 (1) 1.3 研究内容 (1) 第二章语音信号处理理论基础 (3) 第三章系统方案论证 (4) 2.1 设计方案 (4) 2.2 GUI界面功能介绍 (4) 2.3 GUI界面的具体操作 (5)

语音信号处理实验报告

语音信号处理实验 班级: 学号: 姓名: 实验一基于MATLAB的语音信号时域特征分析(2学时)

1)短时能量 (1)加矩形窗 a=wavread('mike.wav'); a=a(:,1); subplot(6,1,1),plot(a); N=32; for i=2:6 h=linspace(1,1,2.^(i-2)*N);%形成一个矩形窗,长度为2.^(i-2)*N En=conv(h,a.*a);% 求短时能量函数En subplot(6,1,i),plot(En); if(i==2) ,legend('N=32'); elseif(i==3), legend('N=64'); elseif(i==4) ,legend('N=128'); elseif(i==5) ,legend('N=256'); elseif(i==6) ,legend('N=512'); end end

00.51 1.52 2.5 3 x 10 4 -1 1 x 10 4 024 x 10 4 05 x 10 4 0510 x 10 4 01020 x 10 4 02040 (2)加汉明窗 a=wavread('mike.wav'); a=a(:,1); subplot(6,1,1),plot(a); N=32; for i=2:6 h=hanning(2.^(i-2)*N);%形成一个汉明窗,长度为2.^(i-2)*N En=conv(h,a.*a);% 求短时能量函数En subplot(6,1,i),plot(En); if(i==2), legend('N=32'); elseif(i==3), legend('N=64'); elseif(i==4) ,legend('N=128');

语音信号处理答案

二、问答题(每题分,共分) 、语音信号处理主要研究哪几方面的内容? 语音信号处理是研究用数字信号处理技术对语言信号进行处理的一门学科,语音信号处理的理论和研究包括紧密结合的两个方面:一方面,从语言的产生和感知来对其进行研究,这一研究与语言、语言学、认知科学、心理、生理等学科密不可分;另一方面,是将语音作为一 种信号来进行处理,包括传统的数字信号处理技术以及一些新的应用于语音信号的处理方法 和技术。 、语音识别的研究目标和计算机自动语音识别的任务是什么? 语音识别技术,也被称为自动语音识别,(),其目标是将人类的语音中的词汇内容转换为 计算机可读的输入,例如按键、二进制编码或者字符序列。 计算机自动语音识别的任务就是让机器通过识别和理解过程把语音信号转变为相应的文本 或命令的高技术。 、语音合成模型关键技术有哪些? 语音合成是实现人机语音通信,建立一个有听和讲能力的口语系统所需的两项关键技术,该系统主要由三部分组成:文本分析模块、韵律生成模块和声学模块。.如何取样以精确地抽取人类发信的主要特征,.寻求什么样的网络特征以综合声道的频率响应,.输出合成声音的质量如何保证。 、语音压缩技术有哪些国际标准? 二、名词解释(每题分,共分) 端点检测:就从包含语音的一段信号中,准确的确定语音的起始点和终止点,区分语音信号和非语音信号。 共振峰:当准周期脉冲激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。 语谱图:是一种三维频谱,它是表示语音频谱随时间变化的图形,其纵轴为频率,横轴为时间,任一给定的频率成分在给定时刻的强弱用相应点的灰度或色调的浓淡来表示。 码本设计:就是从大量信号样本中训练出好的码本,从实际效果出发寻找好的失真测度定义 公示,用最少的搜素和计算失真的运算量。 语音增强:语音质量的改善和提高,目的去掉语音信号中的噪声和干扰,改善它的质量 三、简答题(每题分,共分) 、简述如何利用听觉掩蔽效应。 一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。人耳的掩蔽效应一个较弱的声音(被掩蔽音)的听觉感受被另一个较强的声 音(掩蔽音)影响的现象称为人耳的“掩蔽效应”。被掩蔽音单独存在时的听阈分贝值,或者 说在安静环境中能被人耳听到的纯音的最小值称为绝对闻阈。实验表明,—绝对闻阈值最小,即人耳对它的微弱声音最敏感;而在低频和高频区绝对闻阈值要大得多。在范围内闻阈随频率变化最不显著,即在这个范围内语言可储度最高。在掩蔽情况下,提高被掩蔽弱音的强度, 使人耳能够听见时的闻阈称为掩蔽闻阈(或称掩蔽门限),被掩蔽弱音必须提高的分贝值称为 掩蔽量(或称阈移)。 、简述时间窗长与频率分辨率的关系。 采样周期、窗口长度和频率分辨率△之间存在下列关系:△(*) 可见,采样周期一定时,△随窗口宽度的增加而减少,即频率分辨率相应得到提高,但同时时间分辨率降低;如果窗口取短,频率分辨率下降,而时间分辨率提高,因而二者是矛盾的。 、简述时域分析的技术(最少三项)及其在基因检测中的应用。()

基于Matlab的语音信号处理与分析

系(院)物理与电子工程学院专业电子信息工程题目语音信号的处理与分析 学生姓名 指导教师 班级 学号 完成日期:2013 年5 月 目录 1 绪论 (3) 1.1课题背景及意义 (3) 1.2国内外研究现状 (3) 1.3本课题的研究内容和方法 (4) 1.3.1 研究内容 (4) 1.3.2 开发环境 (4) 2 语音信号处理的总体方案 (4) 2.1 系统基本概述 (4) 2.2 系统基本要求与目的 (4) 2.3 系统框架及实现 (5) 2.3.1 语音信号的采样 (5) 2.3.2 语音信号的频谱分析 (5) 2.3.3 音乐信号的抽取 (5) 2.3.4 音乐信号的AM调制 (5) 2.3.5 AM调制音乐信号的同步解调 (5) 2.4系统设计流程图 (6) 3 语音信号处理基本知识 (6) 3.1语音的录入与打开 (6)

3.2采样位数和采样频率 (6) 3.3时域信号的FFT分析 (7) 3.4切比雪夫滤波器 (7) 3.5数字滤波器设计原理 (8) 4 语音信号实例处理设计 (8) 4.1语音信号的采集 (8) 4.3.1高频调制与低频调制 (10) 4.3.2切比雪夫滤波 (11) 4.3.3 FIR滤波 (11) 5 总结 (12) 参考文献 (13) 语音信号的处理与分析 【摘要】语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。信号处理是Matlab重要应用的领域之一。 本设计针对现在大部分语音处理软件内容繁多、操作不便等问题,采用MATLAB7.0综合运用GUI界面设计、各种函数调用等来实现语音信号的变频、变幅、傅里叶变换及滤波,程序界面简练,操作简便,具有一定的实际应用意义。 最后,本文对语音信号处理的进一步发展方向提出了自己的看法。 【关键词】Matlab 语音信号傅里叶变换低通滤波器

语音信号处理实验报告

通信与信息工程学院 信息处理综合实验报告 班级:电子信息工程1502班 指导教师: 设计时间:2018/10/22-2018/11/23 评语: 通信与信息工程学院 二〇一八年 实验题目:语音信号分析与处理 一、实验内容 1. 设计内容 利用MATLAB对采集的原始语音信号及加入人为干扰后的信号进行频谱分析,使用窗函数法设计滤波器滤除噪声、并恢复信号。 2.设计任务与要求 1. 基本部分

(1)录制语音信号并对其进行采样;画出采样后语音信号的时域波形和频谱图。 (2)对所录制的语音信号加入干扰噪声,并对加入噪声的信号进行频谱分析;画出加噪后信号的时域波形和频谱图。 (3)分别利用矩形窗、三角形窗、Hanning窗、Hamming窗及Blackman 窗几种函数设计数字滤波器滤除噪声,并画出各种函数所设计的滤波器的频率响应。 (4)画出使用几种滤波器滤波后信号时域波形和频谱,对滤波前后的信号、几种滤波器滤波后的信号进行对比,分析信号处理前后及使用不同滤波器的变化;回放语音信号。 2. 提高部分 (5)录制一段音乐信号并对其进行采样;画出采样后语音信号的时域波形和频谱图。 (6)利用MATLAB产生一个不同于以上频段的信号;画出信号频谱图。 (7)将上述两段信号叠加,并加入干扰噪声,尝试多次逐渐加大噪声功率,对加入噪声的信号进行频谱分析;画出加噪后信号的时域波形和频谱图。 (8)选用一种合适的窗函数设计数字滤波器,画出滤波后音乐信号时域波形和频谱,对滤波前后的信号进行对比,回放音乐信号。 二、实验原理 1.设计原理分析 本设计主要是对语音信号的时频进行分析,并对语音信号加噪后设计滤波器对其进行滤波处理,对语音信号加噪声前后的频谱进行比较分析,对合成语音信号滤波前后进行频谱的分析比较。 首先用PC机WINDOWS下的录音机录制一段语音信号,并保存入MATLAB软件的根目录下,再运行MATLAB仿真软件把录制好的语音信号用audioread函数加载入MATLAB仿真软件的工作环境中,输入命令对语音信号进行时域,频谱变换。 对该段合成的语音信号,分别用矩形窗、三角形窗、Hanning窗、Hamming窗及Blackman窗几种函数在MATLAB中设计滤波器对其进行滤波处理,滤波后用命令可以绘制出其频谱图,回放语音信号。对原始语音信号、合成的语音信号和经过滤波器处理的语音信号进行频谱的比较分析。 2.语音信号的时域频域分析 在Matlab软件平台下可以利用函数audioread对语音信号进行采样,得到了声音数据变量y,同时把y的采样频率Fs=44100Hz放进了MATALB的工作空间。

语音信号处理实验报告实验一

通信工程学院12级1班罗恒2012101032 实验一语音信号的低通滤波和短时分析综合实验 一、实验要求 1、根据已有语音信号,设计一个低通滤波器,带宽为采样频率的四分之一,求输出信号; 2、辨别原始语音信号与滤波器输出信号有何区别,说明原因; 3、改变滤波器带宽,重复滤波实验,辨别语音信号的变化,说明原因; 4、利用矩形窗和汉明窗对语音信号进行短时傅立叶分析,绘制语谱图并估计基音周期,分析两种窗函数对基音估计的影响; 5、改变窗口长度,重复上一步,说明窗口长度对基音估计的影响。 二、实验目的 1.在理论学习的基础上,进一步地理解和掌握语音信号低通滤波的意义,低通滤波分析的基本方法。 2.进一步理解和掌握语音信号不同的窗函数傅里叶变化对基音估计的影响。 三、实验设备 1.PC机; 2.MATLAB软件环境; 四、实验内容 1.上机前用Matlab语言完成程序编写工作。 2.程序应具有加窗(分帧)、绘制曲线等功能。 3.上机实验时先调试程序,通过后进行信号处理。 4.对录入的语音数据进行处理,并显示运行结果。 5. 改变滤波带宽,辨别与原始信号的区别。 6.依据曲线对该语音段进行所需要的分析,并且作出结论。 7.改变窗的宽度(帧长),重复上面的分析内容。 五、实验原理及方法 利用双线性变换设计IIR滤波器(巴特沃斯数字低通滤波器的设计),首先要设计出满足指标要求的模拟滤波器的传递函数Ha(s),然后由Ha(s)通过双线性变换可得所要设计的IIR滤波器的系统函数H(z)。如果给定的指标为数字滤波器的指标,则首先要转换成模拟滤波器的技术指标,这里主要是边界频率Wp和Ws 的转换,对ap和as指标不作变化。边界频率的转换关系为∩=2/T tan(w/2)。接着,按照模拟低通滤波器的技术指标根据相应设计公式求出滤波器的阶数N和3dB截止频率∩c ;根据阶数N查巴特沃斯归一化低通滤波器参数表,得到归一化传输函数Ha(p);最后,将p=s/ ∩c 代入Ha(p)去归一,得到实际的模拟滤波器传输函数Ha(s)。之后,通过双线性变换法转换公式s=2/T((1-1/z)/(1+1/z))得到所要设计的IIR滤波器的系统函数H(z)。

大学本科语音信号处理实验讲义8学时

语音信号处理实验讲义 时间:2011-12

目录 实验一语音信号生成模型分析 (3) 实验二语音信号时域特征分析 (7) 实验三语音信号频域特征分析 (12) 实验四语音信号的同态处理和倒谱分析 (16)

实验一 语音信号生成模型分析 一、实验目的 1、了解语音信号的生成机理,了解由声门产生的激励函数、由声道产生的调制函数和由嘴唇产生的辐射函数。 2、编程实现声门激励波函数波形及频谱,与理论值进行比较。 3、编程实现已知语音信号的语谱图,区分浊音信号和清音信号在语谱图上的差别。 二、实验原理 语音生成系统包含三部分:由声门产生的激励函数()G z 、由声道产生的调制函数()V z 和由嘴唇产生的辐射函数()R z 。语音生成系统的传递函数由这三个函数级联而成,即 ()()()()H z G z V z R z = 1、激励模型 发浊音时,由于声门不断开启和关闭,产生间隙的脉冲。经仪器测试它类似于斜三角波的脉冲。也就是说,这时的激励波是一个以基音周期为周期的斜三角脉冲串。单个斜三角波的频谱表现出一个低通滤波器的特性。可以把它表示成z 变换的全极点形式 12 1()(1) cT G z e z --= -? 这里c 是一个常数,T 是脉冲持续时间。周期的三角波脉冲还得跟单位脉冲串的z 变换相乘: 112 1 ()()()1(1)v cT A U z E z G z z e z ---=?= ?--? 这就是整个激励模型,v A 是一个幅值因子。 2、声道模型 当声波通过声道时,受到声腔共振的影响,在某些频率附近形成谐振。反映在信号频谱图上,在谐振频率处其谱线包络产生峰值,把它称为共振峰。 一个二阶谐振器的传输函数可以写成 12 ()1i i i i A V z B z C z --= -- 实践表明,用前3个共振峰代表一个元音足够了。对于较复杂的辅音或鼻音共振峰要到5个以上。多个()i V z 叠加可以得到声道的共振峰模型 12 1 11 ()()11R r r M M i r i N k i i i i k k b z A V z V z B z C z a z -=---======---∑∑∑ ∑ 3、辐射模型 从声道模型输出的是速度波,而语音信号是声压波。二者倒比称为辐射阻抗,它表征了

语音信号处理 (第2版)赵力 编著 语音信号处理勾画要点

语音信号处理(第2版)赵力编著 重点考点 第2章语音信号处理的基础知识 1.语音(Speech)是声音(Acoustic)和语言(Language)的组合体。可以这样定义语音:语音是由一连串的音组成语言的声音。 2.人的说话过程可以分为五个阶段:(1)想说阶段(2)说出阶段(3)传送阶段(4)理解阶段(5)接收阶段。 3.语音是人的发声器官发出的一种声波,它具有一定的音色,音调,音强和音长。其中,音色也叫音质,是一种声音区别于另一种声音的基本特征。音调是指声音的高低,它取决于声波的频率。声音的强弱叫音强,它由声波的振动幅度决定。声音的长短叫音长,它取决于发音时间的长短。 4.说话时一次发出的,具有一个响亮的中心,并被明显感觉到的语音片段叫音节(Syllable)。一个音节可以由一个音素(Phoneme)构成,也可以由几个音素构成。音素是语音发音的最小单位。任何语言都有语音的元音(Vowel)和辅音(Consonant)两种音素。 5.元音的另一个重要声学特性是共振峰(Formant)。共振峰参数是区别不同元音的重要参数,它一般包括共振峰频率(Formant Frequency)的位置和频带宽度(Formant Bandwidth)。 6.区分语音是男声还是女声、是成人声音还是儿童声音,更重要的因素是共振峰频率的高低。 7.浊音的声带振动基本频率称基音周期(或基音频率),F0表示。 8.人的听觉系统有两个重要特性,一个是耳蜗对于声信号的时频分析特性;另一个是人耳听觉掩蔽效应。 9.掩蔽效应分为同时掩蔽和短时掩蔽。 10.激励模型:一般分成浊音激励和清音激励。浊音激励波是一个以基音周期为周期的斜三角脉冲串。 11.声道模型:一是把声道视为由多个等长的不同截面积的管子串联而成的系统。按此观点推导出的叫“声管模型”。另一个是把声道视为一个谐振腔,按此推导出的叫“共振峰模型”。 12.完整的语音信号的数字模型可以用三个子模型:激励模型、声道模型和辐射模型的串联来表示。 13.语谱图:人们致力于研究语音的时频分析特性,把和时序相关的傅立叶分析的显示图形。 第三章语音信号分析 1.贯穿于语音分析全过程的是“短时分析技术”。 2.语音信号的数字化一般包括放大及增益控制、反混叠滤波、采样、A/D变换及编码(一般就是PCM码);预处理一般包括预加重、加窗和分帧等。 3.预滤波的目的有两个:

语音信号处理实验一采集和预处理

实验一语音信号的采集及预处理 一、实验目的 在理论学习的基础上,进一步地理解和掌握语音信号预处理及短时加窗的意义及基于matlab的实现方法。 二、实验原理 1.语音信号的录音、读入、放音等:练习matlab中几个音频处理函数,利用函数wavread 对语音信号进行采样,记住采样频率和采样点数,给出以下语音的波形图(2.wav)。利用wavplay或soundview放音。也可以利用wavrecord自己录制一段语音,并进行以上操作(需要话筒)。 2.语音信号的分帧:对语音信号进行分帧,可以利用voicebox工具箱中的函数enframe。 voicebox工具箱是基于GNU协议的自由软件,其中包含了很多语音信号相关的函数。3.语音信号的加窗:本步要求利用window函数设计窗口长度为256(N=256)的矩形窗(rectwin)、汉明窗(hamming)及汉宁窗(hann)),利用wvtool函数观察其时域波形图及频谱特性,比较得出结论。观察整个信号加矩形窗及汉明窗后的波形,利用subplot与reshape函数将分帧后波形、加矩形窗波形及加汉明窗波形画在一张图上比较。取出其中一帧,利用subplot与reshape函数将一帧语音的波形、加矩形窗波形及加汉明窗波形画在一张图上比较将得出结论。 4.预加重:即语音信号通过一个一阶高通滤波器1 9375 1- -z。 .0 三、实验步骤、实验程序、图形及结论 1.语音信号的录音、读入、放音等 程序: [x,fs,nbit]=wavread('D:\2.wav'); %fs=10000,nbit=16 y=soundview('D:\2.wav') 2.语音信号的分帧 程序: [x,fs,nbit]=wavread('D:\2.wav'); len=256; inc=128; y=enframe(x,len,inc); figure; subplot(2,1,1),plot(x) subplot(2,1,2),plot(y)

第一章 思考题

第一章思考题 1、语音信号处理是如何定义的?主要解决什么问题?有哪些应用? 2、语音信号处理主要从哪几方面开展研究? 3、数字语音编码的目的是什么?请列举一些主要应用。 4、语音编码有哪几个属性? 5、语音编码分为几类? 6、波形编码、参数编码和混合编码后的语音波形形状是否和原始语音波形类似?那种方法质量最高?那种方法的压缩比最高?混合编码方法有何特点? 7、目前4kb/s以下的窄带语音编码方法有哪些?带宽是多少?采样率是多少? 8、8~64kb/s的宽带语音编码主要采用何种方法?带宽是多少?采样率是多少? 9、制定语音编码的国际组织有哪些? 10、IUT-T窄带语音编码标准有哪些?各自的编码速率是多少?A/u律PCM编码的速率是如何计算的? 11、用于GSM移动通信的ETSI窄带语音编码标准有哪些?各自的编码速率是多少?采用自适应多速率编码有何好处? 12、用于北美CDMA/TDMA移动通信的TIA/EIA语音编码标准有哪些?各自的编码速率是多少? 13、日本数字蜂窝(JDC-Japanese Digital Cellular )语音编码标准有哪些?各自的编码速率是多少? 14、保密电话的语音编码标准有哪些?主要速率有几种? 15、目前的卫星电话语音编码算法有几种?编码速率各是多少? 16、ITU-T宽带语音编码标准G.7xx有哪些?各自的算法、速率、延时和复杂度如何? 17、语音识别的目的是什么?目前的研究重点是什么?有哪些主要应用? 18、说话人识别和语音识别有何区别? 19、说话人识别有几类?各自解决什么问题? 20、语音合成(TTS)的目的是什么?TTS的核心模块是哪几个?各模块的功能是什么?韵律控制需要哪几个参数? 21、语音的合成方法有几种?各自的合成机理是什么? 22、请列举目前语音合成研究的热点课题。

语音信号处理实验报告实验二

通信工程学院12级1班 罗恒 2012101032 实验二 基于MATLAB 的语音信号频域特征分析 一、 实验要求 要求根据已有语音信号,自己设计程序,给出其倒谱、语谱图的分析结果,并根据频域分析方法检测所分析语音信号的基音周期或共振峰。 二、 实验目的 信号的傅立叶表示在信号的分析与处理中起着重要的作用。因为对于线性系统来说,可以很方便地确定其对正弦或复指数和的响应,所以傅立叶分析方法能完善地解决许多信号分析和处理问题。另外,傅立叶表示使信号的某些特性变得更明显,因此,它能更深入地说明信号的各项红物理现象。 由于语音信号是随着时间变化的,通常认为,语音是一个受准周期脉冲或随机噪声源激励的线性系统的输出。输出频谱是声道系统频率响应与激励源频谱的乘积。声道系统的频率响应及激励源都是随时间变化的,因此一般标准的傅立叶表示虽然适用于周期及平稳随机信号的表示,但不能直接用于语音信号。由于语音信号可以认为在短时间内,近似不变,因而可以采用短时分析法。 三、 实验设备 1.PC 机; 2.MATLAB 软件环境; 四、 实验内容 1.上机前用Matlab 语言完成程序编写工作。 2.程序应具有加窗(分帧)、绘制曲线等功能。 3.上机实验时先调试程序,通过后进行信号处理。 4.对录入的语音数据进行处理,并显示运行结果。 5.依次给出其倒谱、语谱图的分析结果。 6. 根据频域分析方法检测所分析语音信号的基音周期或共振峰。 五、 实验原理及方法 1、短时傅立叶变换 由于语音信号是短时平稳的随机信号,某一语音信号帧的短时傅立叶变换的定义为: 其中w(n -m)是实窗口函数序列,n 表示某一语音信号帧。令n -m=k',则得到 ()()()jw jwm n m X e x m w n m e ∞-=-∞= -∑

语音信号处理

语音信号处理 ——语音信号的清、浊音分析 班级: 姓名: 学号: 时间:2014年9月22日

1 实验目的 通过Matlab 编程实现语音信号的时域波形图,并观察清音、浊音信号的时域特点。掌握语音信号的时域分析技术,如短时平均能量、短时平均幅度、短时平均过零率分析、短时平均自相关、短时平均幅度差。 2 实验原理 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和变换域等处理方法,其中时域分析是最简单的方法,直接对语音信号的时域波形进行分析,提取的特征参数主要有语音的短时能量,短时平均过零率,短时自相关函数等。 3 实验过程 1)观察信号波形图 信号的采样周期为20kHz ,图中幅度较大的为浊音,幅度较小的为清音。 2)计算语音信号的短时能量、短时平均幅度并画图 1 20()N n n m E x m -==∑ 1 0|()|N n n m M x m -==∑

由于语音信号的能量随时间变化,清音和浊音之间的能量差别显著。平均幅度函数没有平方运算,因此动态范围比短时能量小,接近于标准能量计算的动态范围的平方根。虽然都可以用来区分清、浊音,但短时平均幅度的清浊音幅度差没有短时能量明显。 3)计算信号的短时平均过零率并画图 1 1{|sgn[()]sgn[(1)]|}2N n n m Zn x m x m -==--∑

过零率可以反映信号的频谱特性。高频率对应着高过零率,低频对应着低过零率。浊音过零率低,清音的过零率低。 4)分别取语音信号的清、浊音部分,分析其短时自相关函数 1 0()()()N k n n n m R k x m x m k --== +∑ 分别取小段浊音、清音信号,计算其短时自相关函数。浊音的自相关函数呈现出周期性,有明显突出的峰值,在80个采样点附近,其基因周期: T=(1/fs)*80=(1/20000)*80=3ms ; 清音的短时自相关函数没有周期性,也不具有明显突出的峰值,其性质类似于噪声。 5)计算语音信号的短时平均幅度差函数并画图 1 0()|()()|N k n n n m F k x m x m k --== -+∑

信号系统与语音信号处理实验平台 RZ8664型

产品详细技术方案 信号系统与语音信号处理实验平台 RZ8664 型 简述:RZ8664根据《信号与系统》和《数字信号处理》两门课相互关联的特点,在总结信号与系统实验教学经验,并结合数字信号处理技术、DDS技术、虚拟仪器技术、语音处理技术,开发出的新型“信号与系统”实验箱。它既可完成传统实验箱的实验内容,又能完成原有实验箱难以完成或结果不理想的任意信号分解、信号与系统卷积、数字滤波器、任意信号时域频域分析、语音信号分析等实验;同时也能做“数字信号处理”、“DSP应用”、“虚拟仪器技术”、“语音处理”实验;实验箱采用了正面贴膜工艺,增加了USB通信接口和语音接口。系统既美观又稳定可靠,方便管理。适合专科、本科、研究生和研发人员使用。 一、产品图片 注:产品以实物为准!

RZ-VSlab虚拟实体仿真软件 二、技术指标 1.基于STM32的DDS信号源,可产生:正弦波、三角波、占空比可变的脉冲信号、扫频信号、半波、全波、AM、DSB、SSB、FM等信号,便于学生对不同信号进行时域频域分析; 2.内置数字频率计:0HZ~250KHZ;数字豪伏表:0V~10V; 3.能完成各种卷积实验,输入信号和系统函数可由PC机设定; 4.各种无源、有源模拟滤波器设计、仿真、验证;复杂信号的抽样与恢复,恢复滤波器可开发; 5.能完成数字滤波器的在线设计、冲激与频响仿真、实现(提供整套在线设计、下载软件),学生可基于该功能研究复杂信号中谐波分量的位置与大小; 6.基于数字信号处理技术,能完成:任意信号的卷积、任意信号的分解与合成;(三角波、正弦波、半波、全波等信号、各种调制信号),可研究谐波幅度、谐波相位对信号合成的影响; 7.内置USB接口和高速数据采集模块,可实现基于LABVIEW虚拟示波器、虚拟频谱仪、虚拟选频表功能。在PC机上进行实时的信号时域频域分析;演示实时信号合成原理及吉布斯效应。采集数据可以存贮,在PC机后台分析处理各种信号:如带宽分析、频谱分析、能量分析等。 8.实验平台内置语音接口,专用语音采集芯片,采用“过采样”和“抽取滤波”技术确保语音在8KHZ 采样时也有很好的恢复效果,采样率从8KHZ到96KHZ可编程; 9.能进行DSP、数字信号处理、语音处理、虚拟仪器的二次开发,DSP和数字信号处理的二次开发软件能通过USB接口直接下载,不需仿真器;提供基于LABVIEW的虚拟仪器开发VI函数; 10.能完成信号系统的实验类型:阶跃响应与冲激响应、抽样定理与信号恢复、连续时间系统的模拟、零输入与零状态响应、二阶电路暂态响应、二阶电路传输特性、信号卷积、任意信号分解与合成、谐波幅度与相位对合成信号的影响、模拟滤波器与数字滤波器、虚拟仪器、数字滤波器在线设计及任意信号谐波分析、信号时域频域分析等实验。 11.能完成语音处理实验类型:语音信号的数字化(可以听原声,看波形图);语音基语提取,傅里叶变换(幅频特性与相频特性),语音信号尺度变换(分析变换前后语音及其频谱变化)、语音带限处理频谱分析(语音信号分别通过低通、高通和带通滤波器); 三、实验项目

语音信号处理试验教程

语音信号处理试验 实验一:语音信号时域分析 实验目的: (1)录制两段语音信号,内容是“语音信号处理”,分男女声。 (2)对语音信号进行采样,观察采样后语音信号的时域波形。 实验步骤: 1、使用window自带录音工具录制声音片段 使用windows自带录音机录制语音文件,进行数字信号的采集。启动录音机。录制一段录音,录音停止后,文件存储器的后缀默认为.Wav。将录制好文件保存,记录保存路径。男生女生各录一段保存为test1.wav和test2.wav。 图1基于PC机语音信号采集过程。 2、读取语音信号 在MATLAB软件平台下,利用wavread函数对语音信号进行采样,记住采样频率和采样点数。通过使用wavread函数,理解采样、采样频率、采样位数等概念! Wavread函数调用格式: y=wavread(file),读取file所规定的wav文件,返回采样值放在向量y中。

[y,fs,nbits]=wavread(file),采样值放在向量y中,fs表示采样频率(hz),nbits表示采样位数。 y=wavread(file,N),读取前N点的采样值放在向量y中。 y=wavread(file,[N1,N2]),读取从N1到N2点的采样值放在向量y中。 3、编程获取语音信号的抽样频率和采样位数。 语音信号为test1.wav和test2.wav,内容为“语音信号处理”,两端语音保存到工作空间work文件夹下。在M文件中分别输入以下程序,可以分两次输入便于观察。 [y1,fs1,nbits1]=wavread('test1.wav') [y2,fs2,nbits2]=wavread('test2.wav') 结果如下图所示 根据结果可知:两端语音信号的采样频率为44100HZ,采样位数为16。 4、语音信号的时域分析 语音信号的时域分析就是分析和提取语音信号的时域参数。进行语音分析时,最先接触到并且夜市最直观的是它的时域波形。语音信

语音信号处理

1、设计原理 设计数字滤波器的任务就是寻求一个因果稳定的线性时不变系统,并使系统函数H(z)具有指定的频率特性。 2、设计内容: 以Matlab实现语音信号的低通滤波器设计为例: (1)语音信号的采集 利用Windows下的录音机,录制一段自己的话音,时间在1s内。然后在Matlab 软件平台下,利用函数wavread对语音信号进行采样,记住采样频率和采样点数。通过wavread函数的使用,我们很快理解了采样频率、采样位数等概念。 这里我直接采用了一段现成的.wav格式的语音信号。 (2)语音信号的频谱分析 首先画出语音信号的时域波形;然后对语音号进行快速傅里叶变换,得到信号的频谱特性。 程序如下: clc;clear;close all; fs=32768; %语音信号采样频率为32768,即2^15 x1=wavread('qq.wav'); %读取语音信号的数据,赋给变量x1 sound(x1,32768); %播放语音信号 y1=fft(x1,1024); %对信号做1024点FFT变换 f=fs*(0:511)/1024; figure(1); plot(x1) %做原始语音信号的时域图形

title('原始语音信号');xlabel('time n');ylabel('fuzhi n'); figure(2);freqz(x1) %绘制原始语音信号的频率响应图 title('频率响应图') figure(3);subplot(2,1,1); plot(abs(y1(1:512))) %做原始语音信号的FFT频谱图 title('原始语音信号FFT频谱'); subplot(2,1,2); plot(f,abs(y1(1:512))); title('原始语音信号频谱') xlabel('Hz');ylabel('fuzhi'); 波形如下:

相关文档
最新文档