数字语音处理实验报告

合集下载

数字音频的处理实践报告(2篇)

数字音频的处理实践报告(2篇)

第1篇一、引言随着科技的不断发展,数字音频技术在各个领域得到了广泛应用。

数字音频处理是音频技术中的一个重要分支,它通过对音频信号进行数字化、压缩、解码、编辑、增强等操作,实现音频信息的存储、传输、播放和再现。

本文将结合实际操作,对数字音频处理技术进行实践报告,以期为相关领域的研究和开发提供参考。

二、实践目的1. 熟悉数字音频处理的基本概念和原理;2. 掌握数字音频处理软件的操作方法;3. 提高音频信号处理和编辑的能力;4. 了解数字音频处理在各个领域的应用。

三、实践内容1. 数字音频采集与转换(1)采集设备:使用笔记本电脑、麦克风等设备进行音频采集。

(2)采集软件:使用Audacity、Adobe Audition等软件进行音频采集。

(3)采集过程:将采集到的音频信号进行数字化处理,包括采样、量化等步骤。

2. 数字音频编辑(1)编辑软件:使用Audacity、Adobe Audition等软件进行音频编辑。

(2)编辑操作:包括剪辑、拼接、删除、复制、粘贴、调整音量等操作。

(3)编辑技巧:学习如何使用软件的特效功能,如降噪、均衡、混响等,对音频信号进行美化。

3. 数字音频压缩与编码(1)压缩算法:学习常用的音频压缩算法,如MP3、AAC、WMA等。

(2)编码软件:使用Audacity、Adobe Audition等软件进行音频编码。

(3)编码过程:对音频信号进行压缩,减小文件大小,提高传输效率。

4. 数字音频增强与修复(1)增强软件:使用Adobe Audition、iZotope RX等软件进行音频增强。

(2)增强操作:包括降噪、均衡、去噪、去抖等操作。

(3)修复技巧:学习如何修复损坏的音频文件,如修复静音、填补空白等。

5. 数字音频分析与处理(1)分析软件:使用MATLAB、Python等软件进行音频分析。

(2)分析过程:对音频信号进行频谱分析、时域分析等,提取有用信息。

(3)处理方法:根据分析结果,对音频信号进行相应的处理,如滤波、降噪等。

语音信号处理实验报告实验二

语音信号处理实验报告实验二

语音信号处理实验报告实验二一、实验目的本次语音信号处理实验的目的是深入了解语音信号的特性,掌握语音信号处理的基本方法和技术,并通过实际操作和数据分析来验证和巩固所学的理论知识。

具体而言,本次实验旨在:1、熟悉语音信号的采集和预处理过程,包括录音设备的使用、音频格式的转换以及噪声去除等操作。

2、掌握语音信号的时域和频域分析方法,能够使用相关工具和算法计算语音信号的短时能量、短时过零率、频谱等特征参数。

3、研究语音信号的编码和解码技术,了解不同编码算法对语音质量和数据压缩率的影响。

4、通过实验,培养我们的动手能力、问题解决能力和团队协作精神,提高我们对语音信号处理领域的兴趣和探索欲望。

二、实验原理(一)语音信号的采集和预处理语音信号的采集通常使用麦克风等设备将声音转换为电信号,然后通过模数转换器(ADC)将模拟信号转换为数字信号。

在采集过程中,可能会引入噪声和干扰,因此需要进行预处理,如滤波、降噪等操作,以提高信号的质量。

(二)语音信号的时域分析时域分析是对语音信号在时间轴上的特征进行分析。

常用的时域参数包括短时能量、短时过零率等。

短时能量反映了语音信号在短时间内的能量分布情况,短时过零率则表示信号在单位时间内穿过零电平的次数,可用于区分清音和浊音。

(三)语音信号的频域分析频域分析是将语音信号从时域转换到频域进行分析。

通过快速傅里叶变换(FFT)可以得到语音信号的频谱,从而了解信号的频率成分和分布情况。

(四)语音信号的编码和解码语音编码的目的是在保证一定语音质量的前提下,尽可能降低编码比特率,以减少存储空间和传输带宽的需求。

常见的编码算法有脉冲编码调制(PCM)、自适应差分脉冲编码调制(ADPCM)等。

三、实验设备和软件1、计算机一台2、音频采集设备(如麦克风)3、音频处理软件(如 Audacity、Matlab 等)四、实验步骤(一)语音信号的采集使用麦克风和音频采集软件录制一段语音,保存为常见的音频格式(如 WAV)。

数字语音处理课程实验报告

数字语音处理课程实验报告

数字语音处理课程报告语音信号的采集与分析摘要语音信号的采集与分析技术是一门涉及面很广的交叉科学,它的应用和发展与语音学、声音测量学、电子测量技术以及数字信号处理等学科紧密联系。

其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的高。

本文简要介绍了语音信号采集与分析的发展史以及语音信号的特征、采集与分析方法,并通过PC机录制自己的一段声音,运用Matlab进行仿真分析,最后加入噪声进行滤波处理,比较滤波前后的变化。

关键词:语音信号,采集与分析,时域,频域0 引言通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息的形式。

语言是人类持有的功能.声音是人类常用的工具,是相互传递信息的最主要的手段。

因此,语音信号是人们构成思想疏通和感情交流的最主要的途径。

并且,由于语言和语音与人的智力活动密切相关,与社会文化和进步紧密相连,所以它具有最大的信息容量和最高的智能水平。

现在,人类已开始进入了信息化时代,用现代手段研究语音信号,使人们能更加有效地产生、传输、存储、获取和应用语音信息,这对于促进社会的发展具有十分重要的意义。

让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。

随着计算机越来越向便携化方向发展,随着计算环境的日趋复杂化,人们越来越迫切要求摆脱键盘的束缚而代之以语音输人这样便于使用的、自然的、人性化的输人方式。

作为高科技应用领域的研究热点,语音信号采集与分析从理论的研究到产品的开发已经走过了几十个春秋并且取得了长足的进步。

它正在直接与办公、交通、金融、公安、商业、旅游等行业的语音咨询与管理.工业生产部门的语声控制,电话、电信系统的自动拨号、辅助控制与查询以及医疗卫生和福利事业的生活支援系统等各种实际应用领域相接轨,并且有望成为下一代操作系统和应用程序的用户界面。

可见,语音信号采集与分析的研究将是一项极具市场价值和挑战性的工作。

我们今天进行这一领域的研究与开拓就是要让语音信号处理技术走人人们的日常生活当中,并不断朝更高目标而努力。

推荐-太原理工大学数字语音处理实验报告 精品

推荐-太原理工大学数字语音处理实验报告 精品

本科实验报告课程名称:数字语音处理实验项目:语音短时平均能量的实现实验地点:跨越机房专业班级:学号:学生姓名:指导教师:年月实验一 语音短时平均能量的实现一、 实验目的1.熟悉Matlab 基本程序的运用。

2.充分理解取不同窗长时的语音短时平均能量的变化情况。

3.熟悉Matlab 编程语言在语音信号处理中的作用。

4.能够实现程序的重新编制。

二、 实验原理定义n 时刻某语音信号的短时平均能量nE 为:∑∑--=+∞-∞=-=-=nN n m m n m n w m x m n w m x E )1(22)]()([)]()([式中N 为窗长,可见短时平均能量为为一帧样点值的甲醛平方和。

特殊地,当窗函数为矩形窗时,有∑--==nN n m n m xE )1(2)(三、 实验要求1.实验前自己用Cool Edit 音频编辑软件录制声音“我到北京去”,并把它保存为.txt 文件。

2.编程实现不同矩形窗长N=50、100、200、800的短时平均能量。

3.用Matlab 画出不同窗长的短时平均能量的图形。

4.写出实验报告,分析实验结果。

四、 实验难点对采集到的语音阳电只进行分帧。

五、 实验条件计算机,Matlab 软件,2学时六、 实验步骤1.用Cooledit 读入语音“我到北京去”。

设置采样率为8kHz ,16位,单声道。

2.将读入的语音wav 文件保存为txt 文件。

3.把保存的文件speech.txt 读入Matlab 。

fid=fopen('speech.txt','rt');x=fscanf(fid,'%f');fclose(fid);4.对采集到得语音样点值进行分帧。

分帧子程序为fra.mfunction f=fra(len,inc,x)fh=fix(((size(x,1)-len)/inc)+1)f=zeros(fh,len);i=1;n=1;while i<=fhj=1;while j<=lenf(i,j)=x(n);j=j+1;n=n+1;endn=n-len+inc;i=i+1;end5.对照取不同矩形窗N的短时平均能量,画出图形。

数字语音信号处理实验(学生).

数字语音信号处理实验(学生).

数字语音信号处理实验指导书北方学院信息科学与工程学院电子教研室2014年1月前言语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。

通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。

同时,语言也是人与机器之间进行通信的重要工具,它是一种理想的人机通信方式,因而可为信息处理系统建立良好的人机交互环境,进一步推动计算机和其他智能机器的应用,提高社会的信息化程度。

语音信号处理是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。

虽然从事这一领域研究的人员主要来自信号与信息处理及计算机应用等学科,但是它与语音学、语言学、声学、认知科学、生理学、心理学等许多学科也有非常密切的联系。

20世纪60年代中期形成的一系列数字信号处理的理论和算法,如数字滤波器、快速傅立叶变换(FFT)等是语音信号数字处理的理论和技术基础。

随着信息科学技术的飞速发展,语音信号处理取得了重大的进展:进入70年代之后,提出了用于语音信号的信息压缩和特征提取的线性预测技术(LPC),并已成为语音信号处理最强有力的工具,广泛应用于语音信号的分析、合成及各个应用领域,以及用于输入语音与参考样本之间时间匹配的动态规划方法;80年代初一种新的基于聚类分析的高效数据压缩技术—矢量量化(VQ)应用于语音信号处理中;而用隐马尔可夫模型(HMM)描述语音信号过程的产生是80年代语音信号处理技术的重大发展,目前HMM已构成了现代语音识别研究的重要基石。

近年来人工神经网络(ANN)的研究取得了迅速发展,语音信号处理的各项课题是促进其发展的重要动力之一,同时,它的许多成果也体现在有关语音信号处理的各项技术之中。

为了深入理解语音信号数字处理的基础理论、算法原理、研究方法和难点,根据数字语音信号处理教学大纲,结合课程建设的需求,我们编写了本实验参考书。

本参考书针对教学大纲规定的八个研究设计型实验,每个实验给出了参考程序,目的是起一个抛砖引玉的作用,学生在学习过程中,可以针对某一个实验进行延伸的创新学习,比如说,语音端点的检测、语音共振峰提取、基于HMM或DTW的有限词汇或大词汇的特定人、非特定人的语音识别、识别率的提高(如何提高有噪环境下的识别率)、以及编码问题等,同时在学习中还可深入思考如何将有关的方法在嵌入式系统或DSP下的实现问题等。

北京科技大学现代通信技术实验报告---语音信号数字处理

北京科技大学现代通信技术实验报告---语音信号数字处理

北京科技大学实验报告学院:自动化学院专业:班级:姓名:学号:实验日期:2018年3月31日实验名称:实验一语音信号数字处理实验目的:观察并验证语音信号的时域特性,理解并掌握典型的语音信号时域分析方法和时域特征,为深入学习语音信号处理的各种应用奠定基础。

实验仪器:matlab R2014实验原理:采样频率:是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。

采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。

采样频率与声音频率之间有一定的关系,根据奎斯特理论,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音。

这就是说采样频率是衡量声卡采集、记录和还原声音文件的质量标准。

采样定理:在进行模拟/数字信号的转换过程中,当采样频率fs.max大于信号中,最高频率fmax的2倍时,即:fs.max>=2fmax,则采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5~10倍;采样定理又称奈奎斯特定理。

采样位数:即采样值或取样值,用来衡量声音波动变化的参数,是指声卡在采集和播放声音文件时所使用数字声音信号的二进制位数。

采样频率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。

样位数和采样率对于音频接口来说是最为重要的两个指标,也是选择音频接口的两个重要标准。

无论采样频率如何,理论上来说采样的位数决定了音频数据最大的力度范围。

每增加一个采样位数相当于力度范围增加了6dB。

采样位数越多则捕捉到的信号越精确。

对于采样率来说你可以想象它类似于一个照相机,44.1kHz意味着音频流进入计算机时计算机每秒会对其拍照达441000次。

显然采样率越高,计算机摄取的图片越多,对于原始音频的还原也越加精确。

FFT变换:对于给定的时域信号y,可以通过Fourier变换得到频域信息Y。

语音编码技术实验报告(3篇)

第1篇一、实验目的本次实验旨在了解和掌握语音编码技术的基本原理,通过实验加深对语音编码算法的理解,并评估不同编码算法在语音质量与编码效率之间的平衡。

二、实验内容1. 实验原理语音编码技术是数字通信领域的重要组成部分,其主要目的是将模拟语音信号转换为数字信号,以适应数字传输和处理的需要。

语音编码技术分为两大类:波形编码和参数编码。

2. 实验工具- 语音信号采集设备- 语音信号处理软件(如MATLAB)- 语音编码算法实现代码3. 实验步骤(1)信号采集使用语音信号采集设备采集一段语音信号,并保存为.wav格式。

(2)波形编码实验- 实验一:PCM编码使用PCM(脉冲编码调制)算法对采集的语音信号进行编码,设置不同的采样频率和量化位数,观察编码后的信号波形和码率。

- 实验二:波形编码改进对比分析不同预处理器(如噪声抑制、滤波等)对PCM编码的影响。

(3)参数编码实验- 实验三:线性预测编码(LPC)使用LPC算法对采集的语音信号进行编码,设置不同的预测阶数,观察编码后的信号和重建语音质量。

- 实验四:多带激励编码(MBE)使用MBE算法对采集的语音信号进行编码,观察编码后的信号和重建语音质量。

- 实验五:矢量量化编码(VQ)使用VQ算法对采集的语音信号进行编码,设置不同的码书大小和量化位数,观察编码后的信号和重建语音质量。

4. 实验结果与分析(1)PCM编码随着采样频率的提高,PCM编码后的信号质量逐渐提高,但码率也随之增加。

量化位数越多,信号质量越好,但码率也越高。

(2)波形编码改进预处理器对PCM编码的影响主要体现在降低噪声和抑制非线性失真,从而提高编码后的信号质量。

(3)线性预测编码(LPC)LPC编码后的信号质量与预测阶数密切相关。

预测阶数越高,编码后的信号质量越好,但计算复杂度也随之增加。

(4)多带激励编码(MBE)MBE编码后的信号质量较好,且在低码率下仍能保持较好的语音质量。

(5)矢量量化编码(VQ)VQ编码后的信号质量与码书大小和量化位数密切相关。

数字声音处理实践报告(2篇)

第1篇一、引言随着科技的不断发展,数字声音处理技术已经广泛应用于我们的日常生活中。

数字声音处理技术可以对声音进行各种处理,如降噪、回声消除、声音增强等。

本实践报告主要针对数字声音处理技术进行实践,通过对声音信号进行采集、处理和分析,探讨数字声音处理在实际应用中的效果和可行性。

二、实践内容1. 实验环境实验环境:计算机、数字声音处理软件(如MATLAB、Python等)、麦克风、耳机等。

2. 实验步骤(1)声音信号采集首先,使用麦克风采集一段需要处理的声音信号,并保存为.wav格式文件。

(2)声音信号预处理对采集到的声音信号进行预处理,包括降噪、回声消除、均衡等操作。

(3)声音信号增强对预处理后的声音信号进行增强处理,提高声音质量。

(4)声音信号分析对处理后的声音信号进行频谱分析、时域分析等,评估处理效果。

三、实践结果与分析1. 声音信号采集采集到的声音信号为一段普通的对话,采样频率为44.1kHz,采样精度为16位。

2. 声音信号预处理(1)降噪使用数字声音处理软件对采集到的声音信号进行降噪处理。

降噪过程中,采用谱减法进行噪声估计,并对噪声进行抑制。

处理后,声音信号中的噪声明显减少,人声清晰度提高。

(2)回声消除使用数字声音处理软件对采集到的声音信号进行回声消除处理。

回声消除过程中,采用自适应滤波器对回声进行抑制。

处理后,声音信号中的回声明显减少,声音更加自然。

(3)均衡使用数字声音处理软件对采集到的声音信号进行均衡处理。

均衡过程中,根据人耳的听觉特性,对声音信号进行频谱均衡。

处理后,声音信号中的低频和高频成分得到改善,声音更加舒适。

3. 声音信号增强对预处理后的声音信号进行增强处理,提高声音质量。

增强过程中,采用动态范围压缩、增益调整等技术。

处理后,声音信号的平均功率得到提升,声音更加响亮。

4. 声音信号分析对处理后的声音信号进行频谱分析、时域分析等,评估处理效果。

(1)频谱分析通过频谱分析,可以看出处理后声音信号的频谱分布更加均匀,无明显噪声和回声成分。

数字语音信号处理实验

语音信号处理实验班级:学号:姓名:2015年10月语音信号处理实验实验学时数:8实验学分:0.5实验项目数:41、目的与基本要求实验为研究型(设计型)实验,共安排4个,为了真正达到研究设计型实验的目的,采用开放实验的办法,将自主学习和研究设计型实验结合起来,统一安排。

自主学习内容由学生自主学习参考教材的内容,并采用多种渠道,如查阅最新语音信号处理方面的科技文献、资料,作出学习报告。

目的是培养学生的自学能力和科技文献的检索和查阅能力,同时可以有助于学生了解和掌握语音信号处理领域的最新技术进展和应用情况,将理论知识和实际应用结合起来,促进学生学习的积极性和主动性。

通过开放实验,目的使学生进一步理解数字语音信息处理的基本方法,提高学生自主分析、发现及解决问题的能力,锻炼学生论文写作能力,为实际的应用打下扎实的基础。

2、研究设计型实验的内容1)研究设计型实验1:基于MATLAB的语音信号时域特征分析要求:按所学相关语音处理的知识,通过网上学习、资料查阅,自己设计程序,给出某一语音信号的短时过零率、短时能量、短时自相关特征的分析结果,并借助时域分析方法检测所分析语音信号的基音周期。

2)研究设计型实验2:基于MATLAB分析语音信号频域特征要求:按所学相关语音处理的得知识,通过网上学习、资料查阅,自己设计程序,给出某一语音信号的短时谱、倒谱、语谱图的分析结果,并借助频域分析方法检测所分析语音信号的基音周期或共振峰。

3)研究设计型实验3:基于MATLAB进行语音信号的LPC分析要求:按所学相关语音处理的知识,通过网上学习、资料查阅,自己设计程序,给出某一语音信号的LPC分析结果,包括LPC谱、LPCC谱的分析结果,并借助LPC分析方法检测所分析语音信号的基音周期和共振峰。

4)研究设计型实验4:基于VQ的特定人孤立词语音识别研究要求:按所学相关语音处理的知识,通过网上学习、资料查阅,借助MATLAB工具,自己设计基于VQ的码本训练程序和识别程序(尽量选用所学HMM或DTW方法设计识别程序),能识别特定人的语音,分析所设计系统的特性。

实验一 数字音频处理实验

实验一数字音频处理实验一、实验目的:1、探讨采样频率对数据量的影响,对音质的影响以及带来的其他问题。

2、学习并掌握基本的音频处理手段。

3、熟悉和掌握WAV标准音频文件和MP3压缩音频文件的编辑方法。

二、实验要求:独立进行实验,完成实验报告。

三、实验内容:1、理论内容:在多媒体产品中,声音是必不可少的对象,其主要表现形式是语音、自然声和音乐。

要处理声音,首先要把声音数字化,这个过程叫做音频采样。

有了数字化声音后,接着对其进行处理。

处理方式主要有:剪辑、合成、制作特殊效果、增加混响、调整时间长度、改善频响特性等。

音质的好坏与采样频率成正比,当然,也与数据量成正比。

换言之,采样频率越高,音质越好,数据量也越大。

2、实验内容:(1)获取声音:准备好以WAV和MP3两种格式保存的文件,WAV格式无压缩,音质好,能够忠实地还原自然声;MP3格式是压缩格式,在压缩比不大的情况下,音质也非常好。

(2)录制声音:在录制之前,把麦克风连接到声卡上,如果使用的是带麦克风的头带耳机,检查连接线是否接好。

A、使用“录音机”录制练习:如果录制小于1min的声音,可使用Windows自带的“录音机”软件录制。

操作步骤:a、启动录音机软件。

b、单击录音按钮,开始录音。

此时,进程滑块向右移动,到右端终点位置停止,时间正好1min。

c、单击播放按钮,聆听效果。

如果不满意,选择“文件/新建”菜单,清除录音,重新进行步骤b。

d、转换采样频率。

选择“文件/属性”菜单,显示“声音的属性”画面。

“声音的属性”画面自上而下显示了声音文件的版权、长度、数据大小、音频格式。

其中的音频格式就是当前文件的采样频率。

画面显示“PCM 44100 Hz,16位,立体声”,对于语音来说,采样频率过高了,数据量过大,造成存储空间的浪费。

单击开始转换按钮,显示“选择声音”画面。

在“选择声音”画面的“属性”选择框中,选择适合语音的采样频率“22050Hz,8位,单声道22KB/s”,单击“确定”按钮。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

学院:信息与通信工程学院专业:通信工程班级:通信144学号:10姓名:刘新雨指导教师:崔艳秋1.实验目的观察并验证语音信号的时域特性,理解并掌握典型的语音信号时域分析方法和时域特征,为深入学习语音信号处理的各种应用奠定基础。

2.MATLAB程序代码(1)由麦克风采集语音数据,将采集的数据存成WAV文件(采样率为8000Hz),存在本人的文件夹中。

所用程序代码为:clear;close all;Fs=11025;y=wavrecord(5*Fs,Fs,'double');wavwrite(y,'D:\\lxy');soundview(y,Fs);(2)读取WAV文件,显示语音信号的波形。

所用程序代码为:clear;close all;x = wavread('D:\\');figure;plot(x);axis([0,size(x,1),,]);title('语音信号时域波形');xlabel('样点数'); ylabel('幅度');(3)读取WAV文件,计算并显示语音的短时能量(窗函数为矩形窗,帧长为50,200,400,600)。

所用程序代码为:clear;close all;x = wavread('d:\\');x = double(x);f1= enframe(x,50, 50);energy1 = sum(abs(f1), 2);subplot(2,2,1);plot(energy1);title('语音信号的短时能量');legend('帧长LEN =50');f2= enframe(x,200, 200);energy2 = sum(abs(f2), 2);subplot(2,2,2);plot(energy2);title('语音信号的短时能量');legend('帧长LEN = 200');f3= enframe(x,400, 400);energy3 = sum(abs(f3), 2);subplot(2,2,3);plot(energy3);title('语音信号的短时能量');legend('帧长LEN = 400');f4= enframe(x,600,600);energy4 = sum(abs(f4), 2);subplot(2,2,4);plot(energy4);title('语音信号的短时能量');legend('帧长LEN = 600');(4)读取WAV文件,计算并显示语音的短时过零率(窗函数为矩形窗,帧长为256,帧移为128),所用程序代码为:clear;close all;x = wavread('D:\\');x = double(x);LEN = 300;INC= 150;f = enframe(x, LEN, INC);% 计算短时过零率z = zeros(size(f,1),1);difs =;for i=1:size(f,1)s=f(i,:);for j=1:(length(s)-1)if s(j)* s(j+1)<0&abs(s(j)-s(j+1))>difs;z(i)= z(i)+1;endendendsubplot(2,1,1); plot(x);axis([0,size(x,1),,]);title('语音信号时域波形'); xlabel('样点数'); ylabel('幅度');subplot(2,1,2);plot(z);title('语音信号的短时过零率');xlabel('帧数'); ylabel('短时过零率');(5)读取WAV文件,计算浊音与清音的短时自相关函数所用的程序代码为:clear;close all;x = wavread('D:\\');x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC);ff=f(15,:);N=LEN;R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1));endfor k=1:NR1(k)= R(k)/R(1);endsubplot(2,1,1);plot(ff);axis([0,N,,])title('加矩形窗的语音帧'); xlabel('样点数'); ylabel('幅度'); subplot(2,1,2); plot(R1);axis([0,N,-1,1])title('加矩形窗的短时自相关函数'); xlabel('k'); ylabel('R(k)');clear;close all;x = wavread('d:\\');x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC);ff=f(124,:);ff=ff'.*hamming(length(ff));N=LEN;R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1));endfor k=1:NR1(k)= R(k)/R(1);endsubplot(2,1,1);plot(ff);axis([0,N,,])title('加汉明窗的语音帧'); xlabel('样点数'); ylabel('幅度'); subplot(2,1,2); plot(R1);axis([0,N,-1,1])title('加汉明窗的短时自相关函数'); xlabel('k'); ylabel('R(k)');clear;close all;x = wavread('D:\\');x = double(x);LEN = 10;INC= 10;f = enframe(x, LEN, INC);ff=f(500,:);N=LEN;R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1));endfor k=1:NR1(k)= R(k)/R(1);endsubplot(2,1,1);plot(ff);axis([0,N,,])title('加矩形窗的语音帧'); xlabel('样点数'); ylabel('幅度');subplot(2,1,2); plot(R1);axis([0,N,,])title('加矩形窗的短时自相关函数'); xlabel('k'); ylabel('R(k)');clear;close all;x = wavread('D:\');x = double(x);LEN = 256;INC= 128;f = enframe(x, LEN, INC);ff=f(25,:);N=LEN;R=zeros(1,N);for k=1:NR(k)= sum(ff(k:N).*ff(1:N-k+1));endfor k=1:NR1(k)= R(k)/R(1);endsubplot(2,1,1);plot(ff);axis([0,N,,])title('加矩形窗的语音帧'); xlabel('样点数'); ylabel('幅度');subplot(2,1,2); plot(R1);axis([0,N,,])title('加矩形窗的短时自相关函数'); xlabel('k'); ylabel('R(k)');3.实验结果及其分析(1)本实验利用11025Hz的采样频率对输入的语音信号进行采样,采样点数为55125个,持续时间为5秒,存储格式为double。

之后将数字语音数据写入D盘的文件,并通过放音设备进行回放。

回放的GUI界面如图1所示,通过该界面可以观察采集的语音信号。

图1 用soundview函数显示的语音信号(2)本实验将D盘的文件读取出来,并显示文件中的语音信号波形,显示的波形如图2所示。

该波形是汉语拼音“Xu”的时域波形。

从图2可以看出,[X]是清音,它的波形幅值较小,且没有周期性;[u]是浊音,它的波形幅值较大且有明显的周期性起伏结构。

图2 语音“Xu”的时域波形(3)本实验将D盘的文件读取出来,当帧长取不同值时计算语音信号的短时能量,如图3所示。

从图3可以看出,浊音短时能量大,短时平均幅度大,短时过零率低,浊音具有较强的能量值,音段内隐藏信息的能力高。

轻音短时能量小,短时平均幅度小,能量值较低,音段内隐藏信息的能力较低。

图3 不同帧长对应的短时能量(4)本实验首先读取中的语音数据,之后计算每一帧的短时过零率,最后将原始语音信号和短时过零率显示出来,如图4所示。

从图4可以看出,清音的过零率较高,浊音的过零率较低。

图4 短时过零率(5)本实验首先读取中的语音数据,之后对数据进行分帧加窗处理,帧长为256,帧移为128。

选取其中的一帧浊音(第15帧)并计算这帧的短时自相关函数。

当窗函数分别为矩形窗和汉明窗时,截取的语音信号和短时自相关函数如图5和图6所示。

从图5和图6可以看出,矩形窗能够比汉明窗更明显的显示出第一个峰值。

当窗函数为矩形窗,不同帧长(帧移=帧长)的一帧浊音对应的短时自相关函数如图7和图8所示。

从图7和图8可以看出,帧长越长,越容易区分其最大值。

当窗函数为矩形窗,帧长为256,帧移为128,选取一帧清音,获得的短时自相关函数如图9所示。

从图5和图9可以看出,浊音具有明显的周期性,清音无明显周期。

图5 加矩形窗的短时自相关函数图6 加汉明窗的短时自相关函数图7 帧长为10时的短时自相关函数图8 帧长为100时的短时自相关函数图9 清音的短时自相关函数4.思考题短时能量的主要用途有哪些?答:可以区分清音段与浊音段,可以用来区分,有声与无声的分界,生母和韵母的分界等,也可以用于语音识别中。

相关文档
最新文档