语音信号的采集和播放

语音信号的采集和播放
语音信号的采集和播放

语音信号的采集和播放

随着数字信号处理算法在DSP上的实现,基于DSP处理器的语音处理也得到了更广泛的应用。语音信号具有随机性强、应用广泛和实时性要求高等特点。DSP较其他类型处理器处理速度快、运算能力强的特点使它在语音处理方面的应用优势显著。语音信号的处理包括信号采集、处理、传输、存储和播放等一系列过程。其中,语音信号的采集、传输和播放属于语音信号的控制,满足一般的标准操作即可;而语音信号的处理和存储与应用类型有很大的联系,不同的应用要求的处理和存储算法也不一样。

语音信号的采集和播放是语音信号处理的基础,在基于DSP的语音处理系统中,DSP通过控制APD芯片采集和播放语音信号,再通过DSP实现各种语音处理算法。在TI各个系列DSP芯片中,16位的C54XX因其指令简单、接口连接方便而在语音处理系统中得到广泛应用。

1 实现目标

系统要求使用DSP和APD芯片实现语音信号的采集,然后将语音信号存储到DSP的RAM中,最后实现语音信号的播放。

2 硬件实现

2.1 解决思路

系统采用的主处理器是TMS320VC5402,利用芯片提供的多通道缓冲串口McBSP实现与APD芯片的连接。

系统采用的TLC320AD50的APD芯片采集和播放语音信号。AD50使用过采样技术提供APD和DPA的高分辨率低速信号转换。该器件包括两个串行的转换通道,在DPA之前有内插滤波器,APD 之后有抽取滤波器,由此可以降低AD50的本底噪声。在AD50正常工作以前,必须对它进行初始化。初始化的主要工作是配置AD50的四个控制寄存器CR1,CR2,CR3和CR4。控制寄存器的读写是通过二次通信来实现的。AD50启动二次通信有硬件和软件两种方式,硬件方式相对容易实现,DSP通过内部寄存器将XF引脚置高,进而控制与其连接的FC引脚到高,然后向McBSP串口写16位的控制字,低8位是AD50的控制寄存器初始化字,高8位选择要初始化的寄存器及操作。软件方式则是当AD50工作于15位模式时,将DSP输出到AD50的数据的D0位置1,即可进行二次通信。系统采用的是硬件实现的方式,在二次通信中,D0~D7为写入控制寄存器的数据或从寄存器读出的数据,D8~D12的内容决定选择哪个控制寄存器,D13决定是读操作还是写操作。D8~D13位确定的具体操作情况如表1所示。

表1 D8~D13位确定的具体操作情况

2.2 硬件设计

语音信号的采集和播放系统的硬件设计主要包括语音信号的输入输出模拟通道、DSP和AD50的连接、DSP和AD50的周边设备连接等。其中,DSP和AD50的周边设备连接包括电源电路、时钟电路、复位电路、存储器扩展电路和去耦电路等,这些电路的连接可查看相关芯片资料。

语音信号的前后端处理主要由输入输出模拟通道组成。这两个电路的主要作用是将信号进行处理,尽量避免因输入输出引入的噪声。同时,还可以调整输入输出的放大系数,使语音信号适合各种不同的功放,得到最佳的语音效果。

为了达到更好的效果,AD50的模拟信号输入采用差分输入方式,即使用两个运算放大器,将单端输入信号转换成差分输入信号,电路连接如图1所示。使用差分信号,信号一正一负同时进入采集系统,如果此时有随机噪声出现,通过正负信号的加减,可以有效消除部分噪声。

图1 差分输入电路图

AD50的DPA输出为差分信号,可以直接驱动6008的负载。输

出电路如图2所示。

图2 差分输出电路图

DSP通过多通道缓冲串口连接AD50。DSP最多可以使一个缓冲串口与3个AD50芯片连接。系统采用DSP为主设备、AD50为从设备的连接方法。如图3所示,AD50的时钟信号MCLK由DSP的定时器0的输出TOUT0提供,时钟频率可以通过设置定时器0来改变。AD50的移位时钟输出SCLK连接到DSP的缓冲串口0的接收时钟引脚CLKR0,帧同步信号FS连接带DSP缓冲串口0的FRX0。AD50的FC引脚连接到DSP的通用IPO引脚XF,用于控制二次串行通信。图3中DSP的DR0为输入,其余均为输出。

图3 二次串行通信电路

3 软件设计

系统用于实现语音信号的采集和播放,收到数据后,AD50对数

据进行模数转换,变成数字语音信号后存储于内部RAM,然后输出到AD50,AD50进行数模转换后输出到相应的后端处理电路,最后由后端电路将输入的语音信号转变成语音输出到音响设备,因此程序设计比较简单易于实现。主要包括以下几个方面:

(1) DSP的初始化。包括定时器0的初始化,以确保TOUT0引脚能输出正确的时钟信号到AD50,使AD50能根据该时钟信号进行采样。初始化缓冲串口时,应使DSP工作于主设备方式,CLKR0和FSX0引脚设为输出。DSP初始化完成后,在DSP的TOUT0,CLKR0,FSX0这3个引脚可以看到连续输出的脉冲。

(2)AD50的初始化。此时主要是设置DSP的XF引脚输出为高,以启动AD50的二次通信,在正确设置AD50的4个控制寄存器以后,AD50开始采样数据。此时检测AD50的DOUT引脚,能发现引脚有连续的信号输出。

(3)设置DSP中断。DSP的中断负责从缓冲串口读取数据,可以在CCS中查看读取的数据是否正确,如果每次读取的都是0或者同一个数据,说明AD50没有正常工作,此时需检查DSP或者AD50是否初始化成功。

(4)数据存储。DSP从缓冲串口读取数据存放到RAM,连续存放500或者1000个数据,可以通过CCS的画图功能看到采集到的数据。这时主要判断采样频率是否正确、有没有数据丢失等。

(5)数据输出。将RAM中的数据直接送到AD50的DPA单元,转换成模拟信号后输出。这时从AD50的模拟信号输出端可以看到和

输入端一样的信号。

下面给出一个MATLAB程序,读入一个采样频率为22.050 kHz、16位单声道的WAV文件,然后播放并做语音信号的波形图、频谱图和倒谱图,具体程序如下:

[y,fs] = wavread('c:\wav\wav1.wav'); %读一个已保存的W A V语音文件

wavplay(y);%播放语音文件

t=(0:length(y)-1)/fs;%计算语音播放时间

subplot(3,1,1);%确定语音波形的显示位置

plot(t,y);%画波形图

legend(‘波形图');

xlabel('时间(s)');%X 轴的标题

ylabel('幅度');%Y轴的标题

x=fft(y.*hamming(length(y)));%加hamming 窗快速傅立叶变换

fm=5000*length(x)/fs;%限定频率范围

f=(0:fm)*fs/length(x);%确定频率刻度

subplot(3,1,2);%确定语音波形的显示位置

plot(f,20*log10(abs(x(1:length(f)))+eps));%画频谱图

legend(‘频谱图');

xlabel(‘频率(Hz)');

ylabel(‘频谱幅度(dB)');

c=fft(log(abs(x)+eps));% 倒频谱计算

ms1=fs/1000;

ms20=fs/50;

q=(ms1:ms20)/fs; %确定倒频刻度

subplot(3,1,3);

plot(q,abs(c(ms1:ms20))); %画倒谱图

legend(‘倒谱图');

xlabel(‘倒频(s)');

ylabel(‘倒频谱幅度');

将程序略做修改,不存储采集到的数据到RAM,而是直接播放,通过CCS编译环境将修改后的软件进行编译后载入DSP运行,可以通过ViewPGraphP (TimePFrequency)对比采集到的波形和从RAM中读取到APD芯片的波形,可以看到波形的频率和相位一致,说明系统搭建成功。按照应用的目的不同,进一步改进程序,如加入语音编解码或语音识别程序,可以方便实现功能扩展。

4 小结

系统实现了语音信号的实时采集和播放,也搭建了一个语音信号处理的基本平台。在系统的基础上,可以在DSP的外围电路扩展FLASH,保存语音信号;也可以通过HPI接口连接到计算机,进行相应的处理;还可以在系统软件中加入语音编码解码算法、语音识别算法等进行功能的扩展。更为突出的是,该系统电路连接简单、编程容易、成本低,可称为语音处理平台的模板。

基于matlab的语音信号的采集与处理

文档从互联网中收集,已重新修正排版,word格式支持编辑,如有帮助欢迎下载支持。 目录 第1章前言 ................................................................................................... 错误!未定义书签。第2章语音信号分析处理的目的和要求 ................................................... 错误!未定义书签。 2.1MATLAB软件功能简介................................................................. 错误!未定义书签。 2.2课程设计意义 .................................................................................. 错误!未定义书签。第3章语音信号的仿真原理..................................................................... 错误!未定义书签。第4章语音信号的具体实现..................................................................... 错误!未定义书签。 4.1语音信号的采集................................................................................ 错误!未定义书签。 4.2语音信号加噪与频谱分析................................................................ 错误!未定义书签。 4.3设计巴特沃斯低通滤波器................................................................ 错误!未定义书签。 4.4用滤波器对加噪语音滤波................................................................ 错误!未定义书签。 4.5比较滤波前后语音信号波形及频谱................................................ 错误!未定义书签。第5章总结................................................................................................... 错误!未定义书签。参考文献......................................................................................................... 错误!未定义书签。附录................................................................................................................. 错误!未定义书签。

matlab语音信号采集与初步处理要点

《matlab与信号系统》实验报告 学院: 学号: 姓名: 考核实验——语音信号采集与处理初步 一、课题要求 1.语音信号的采集 2.语音信号的频谱分析 3.设计数字滤波器和画出频率响应 4.用滤波器对信号进行滤波 5.比较滤波前后语音信号的波形及频谱 6.回放和存储语音信号 (第5、第6步我放到一起做了) 二、语音信号的采集 本段音频文件为胡夏演唱的“那些年”的前奏(采用Audition音频软件进行剪切,时长17秒)。运行matlab软件,在当前目录中打开原音频文件所在的位置,采用wavread函数对其进行采样,并用sound函数可进行试听,程序运行之后记下采样频率和采样点。 利用函数wavread对语音信号的采集的程序如下: clear; [y,fs,bits]=wavread('music.wav'); %x:语音数据;fs:采样频率;bits:采样点数sound(y,fs,bits); %话音回放 程序运行之后,在工作区间中可以看到采样频率fs=44100Hz,采样点bits=16

三、语音信号的频谱分析 先画出语音信号的时域波形,然后对语音号进行快速傅里叶变换,得到信号的频谱特性。语音信号的FFT频谱分析的完整程序如下: clear; [y,fs,bits]=wavread('music.wav'); %x:语音数据;fs:采样频率;bits:采样点数sound(y,fs,bits); %话音回放 n = length (y) ; %求出语音信号的长度 Y=fft(y,n); %傅里叶变换 subplot(2,1,1); plot(y); title('原始信号波形'); subplot(2,1,2); plot(abs(Y)); title('原始信号频谱'); 程序结果如下图: 四、设计数字滤波器和画出频率响应 根据语音信号的特点给出有关滤波器的性能指标: 1)低通滤波器性能指标,fp=1000Hz,fc=1200 Hz,As=100dB,Ap=1dB; 2)高通滤波器性能指标,fc=4800 Hz,fp=5000 Hz As=100dB,Ap=1dB。

语音信号采集与处理课程设计

河南科技大学 课程设计说明书课程名称微机应用技术课程设计 题目语音信号采集与处理课程设计 学院医学技术与工程学院 班级生物医学工程1201班 学生姓名 指导教师杨晓利 日期 2014年3月29日

课程设计任务书 (指导教师填写) 课程设计名称微机应用技术课程设计 学生姓名 专业班级生物医学工程1201班 设计题目语音信号采集与处理课程设计 课程设计目的 1.学会MATLAB的使用,掌握MATLAB的程序设计方法; 2.掌握在Windows环境下语音信号采集的方法; 3.掌握信号处理的基本概念、基本理论和基本方法; 4.学会用MATLAB对信号进行分析和处理。 设计内容、技术条件和要求 1.语音信号的采集 用windows自带的录音机(开始—程序—附件—娱乐—录音机,文件—属性—立即转换—8000KHz,8位,单声道)或其他软件,录制一段语音信号,时间控制在2秒左右。然后在MATLAB软件平台下,利用函数wavread对语音信号进行采样,记住采样频率和采样点数。通过wavread函数的使用,理解采样频率、采样位数等概念。 wavread函数调用格式: y=wavread(file),读取file所规定的wav文件,返回采样值放在向量y中。 [y,fs,nbits]=wavread(file),采样值放在向量y中,fs表示采样频率(Hz),nbits表示采样位数。 y=wavread(file,N),读取前N点的采样值放在向量y中。 y=wavread(file,[N1,N2]),读取从N1点到N2点的采样值放在向量y中。2.语音信号的频谱分析 首先画出语音信号的时域波形;然后对语音信号进行频谱分析,在MATLAB中,可以利用函数fft对信号进行快速傅里叶变换,得到信号的频谱特性。 时间进度安排 第1周:查阅资料; 第2周:实现设计内容 第3周:整理资料,撰写课程设计任务书 1

基于Matlab语音信号的采集与分析

基于MATLAB 的语音信号分析和处理 【摘要】: 本文通过用三星手机系统自带录音机采集了一段语音,wav格式转换后再Matlab平台上对其进行了时域分析,频谱分析,分析语音信号的特性。利用函数对采样频率进行控制,比较其波形。通过对两段铃声(分别为男声、女声)进行分析初步找出男声女声的特点和区别。应用Matlab平台对录制的语音信号加入噪声,对比加噪前后的语音信号的时域和频域特性,回放加噪语音信号。 【关键词】: 语音信号;频域特性; 时域特性; 滤波器

目录 一、背景介绍 1.1 语音信号的概述 1.2 语音信号处理工具的选择 二、语音信号的录制采集和分析 2.1 语音信号的采集 2.2 语音信号的读入与打开 2.3 取不同采样频率得出的波形比较 三、对男声、女声语音信号特点的分析 3.1女声(vfemale.wav)男声(vmale.wav)的时域分析

3.2女声(vfemale.wav)男声(vmale.wav)的频域分析 四、加噪声与滤波处理分析 4.1 高斯白噪声(SNR=30) 4.2 单频正弦噪声 五、心得与体会 一、背景介绍 1.1语音信号的概述 语言是人类创造的,是人类区别于其他地球生命的本质特征之一。人类用语言交流的过程可以看成是一个复杂的通信过程,为了获取便于分析和处理的语音信源,必须将在空气中传播的声波转变为包含语音信息并且记载着声波物理性质的模拟(或数字)电信号,即语音信号,因此语音信号就成为语音的表现形式或载体。 1.2语音信号处理工具的选择 语音信号的进一步处理分析工作选用了Matlab平台。Matlab是一种科学计算软件,专门以矩阵的形式处理数据。Matlab将高性能的数值计算和可视化集成在一起,并提供了大量的内置函数,不断完善Matlab产品以提高产品自身的竞争能力Matlab的数据分析和处理功能十分强大,运用它来

基于MATLAB的语音信号的采集与处理详解

数字信号处理 课程设计 题目:基于MATLAB的语音信号的采集与处理学院:皖西学院 专业:通信工程 班级:通信1001班 学号:2010013461 2010013494 姓名:刘敏纵大庆指导教师:何富贵

摘要: 本次课程设计题目为<<基于MATLAB的语音信号的采集与处理>>。首先我们利用计算机上的录音软件获得语音信号,然后利用MATLAB对语音信号进行分析和处理,采集语音信号后,利用MATLAB软件平台进行频谱分析;并对所采集的语音信号加入干扰噪声,对加入噪声的信号进行频谱分析,设计合适的滤波器滤除噪声,恢复原信号!

1.背景 2. 设计目的 (2) 3. 设计原理 (2) 4. 设计过程 .......................................... ,,, 3 5. 实验代码及结果 (4) 5.1 语音信号的采集 (4) 5.2 语音信号加噪与频谱分析 ..................................... ,,,, 7 5.3 巴特沃斯滤波器的设计 .. (9) 5.4 比较滤波前后语音信号波形及频谱 (10) 6. 收获与体会 (12) 参考文献 (13)

1. 引言 数字信号处理是利用计算机或专用处理设备,以数值计算的方法对信号进行采集、抽样、 变换、综合、估值与识别等加工处理,借以达到提取信息和便于应用的目的。它在语音、雷达、图像、系统控制、通信、航空航天、生物医学等众多领域都获得了极其广泛的应用。具有灵活、精确、抗干扰强、度快等优点。 数字滤波器,是数字信号处理中及其重要的一部分。随着信息时代和数字技术的发展,受到人们越来越多的重视。数字滤波器可以通过数值运算实现滤波,所以数字滤波器处理精 度高、稳定、体积小、重量轻、灵活不存在阻抗匹配问题,可以实现模拟滤波器无法实现的特殊功能。数字滤波器种类很多,根据其实现的网络结构或者其冲激响应函数的时域特性,可分为两种,即有限冲激响应(FIR, Finite Impulse Response)滤波器和无限冲激响应(IIR,Infin ite Impulse Resp on se) 滤波器。 FIR滤波器结构上主要是非递归结构,没有输出到输入的反馈,系统函数H (z)在 z= R处收敛,极点全部在z = 0处(因果系统),因而只能用较高的阶数达到高的选 择性。FIR数字滤波器的幅频特性精度较之于IIR数字滤波器低,但是线性相位,就是 不同频率分量的信号经过FIR滤波器后他们的时间差不变,这是很好的性质。FIR数字滤波器是有限单位脉冲响应有利于对数字信号的处理,便于编程,用于计算的时延也小,这对实时的信号处理很重要。FIR滤波器因具有系统稳定,易实现相位控制,允许 设计多通带(或多阻带)滤波器等优点收到人们的青睐[1]。 IIR滤波器采用递归型结构,即结构上带有反馈环路。IIR滤波器运算结构通常由 延时、乘以系数和相加等基本运算组成,可以组合成直接型、正准型、级联型、并联型四种结构形式,都具有反馈回路。同时,IIR数字滤波器在设计上可以借助成熟的 模拟滤波器的成果,如巴特沃斯滤波器等。

对语音信号进行分析及处理资料

一、设计目的 1.进一步巩固数字信号处理的基本概念、理论、分析方法和实现方法;使自身对信号的采集、处理、传输、显示和存储等有一个系统的掌握和理解; 2.增强应用Matlab语言编写数字信号处理的应用程序及分析、解决实际问题的能力; 3.培养自我学习的能力和对相关课程的兴趣; 二、设计过程 1、语音信号的采集 采样频率,也称为采样速度或者采样率,定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。 采样位数可以理解为声卡处理声音的解析度。这个数值越大,解析度就越高,录制和回放的声音就越真实 采样定理又称奈奎斯特定理,在进行模拟/数字信号的转换过程中,当采样频率fs不小于信号中最高频率fm的2倍时,采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的5~10倍。 利用Windows下的录音机,录制了一段发出的声音,内容是“数字信号”,时间在3 s内。接着在D盘保存为WAV格式,然后在Matlab软件平台下.利用函数wavread对语音信号进行采样,并记录下了采样频率和采样点数,在这里我们还通过函数sound引入听到采样后自己所录的一段声音。 [x1,fs,bits]=wavread('E:\数字信号.wav'); %读取语音信号的数据,赋给变量x1,返回频率fs 44100Hz,比特率为16 。 2 、语音信号的频谱分析 (1)首先画出语音信号的时域波形; 程序段: x=x1(60001:1:120000); %截取原始信号60000个采样点

plot(x) %做截取原始信号的时域图形 title('原始语音采样后时域信号'); xlabel('时间轴 n'); ylabel('幅值 A'); (2)然后用函数fft 对语音号进行快速傅里叶变换,得到信号的频谱特性; y1=fft(x,6000); %对信号做N=6000点FFT 变换 figure(2) subplot(2,1,1),plot(k,abs(y1)); title('|X(k)|'); ylabel('幅度谱'); subplot(2,1,2),plot(k,angle(y1)); title('arg|X(k)|'); ylabel('相位谱'); (3)产生高斯白噪声,并且对噪声进行一定的衰减,然后把噪声加到信号中,再次对信号进行频谱特性分析,从而加深对频谱特性的理解; d=randn(1,60000); %产生高斯白噪声 d=d/100; %对噪声进行衰减 x2=x+d; %加入高斯白噪声 3、设计数字滤波器 (1)IIR 低通滤波器性能指标通带截止频Hz f c 1000=,阻带截止频率 Hz f st 1200=,通带最大衰减dB 11=δ,阻带最小衰减dB 1002=δ。 (2)FIR 低通滤波器性能指标通带截止频率Hz f c 1000=,阻带截止频率 Hz f st 1200=, 通带衰减1δ≤1dB ,阻带衰减 2δ≥ 100dB 。 (3)IIR 高通滤波器的设计指标,Hz f z 1000=,Hz f p 2000=,阻带最小衰减dB A s 30=,通带最大衰减dB A P 1=。 (4)(4)FIR 高通滤波器的设计指标,Hz f z 1000=,Hz f p 2000=,阻带最小衰减dB A s 50=,通带最大衰减dB A P 1=。 (5)用自己设计的各滤波器分别对采集的信号进行滤波,在Matlab 中,FIR 滤波器利用函数fftfilt 对信号进行滤波,IIR 滤波器利用函数filter 对信号进行滤波。比较滤波前后语音信号的波形及频谱,在一个窗口同时画出滤波前后

基于某MATLAB地语音信号采集与处理

工程设计论文 题目:基于MATLAB的语音信号采集与处理 姓名: 班级: 学号:

指导老师: 一.选题背景 1、实践意义: 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在于方便有效地提取并表示语音信号所携带的信息。所以理解并掌握语音信号的时域和频域特性是非常重要的。 通过语音相互传递信息是人类最重要的基本功能之一.语言是人类特有的功能.声音是人类常用工具,是相互传递信息的最重要的手段.虽然,人可以通过多种手段获得外界信息,但最重要,最精细的信息源只有语言,图像和文字三种.与用声音传递信息相比,显然用视觉和文字相互传递信息,其效果要差得多.这是因为语音中除包含实际发音容的话言信息外,还包括发音者是谁及喜怒哀乐等各种信息.所以,语音是人类最重要,最有效,最常用和最方便的交换信息的形式.另一方面,

语言和语音与人的智力活动密切相关,与文化和社会的进步紧密相连,它具有最大的信息容量和最高的智能水平。 语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,处理的目的是用于得到某些参数以便高效传输或存储;或者是用于某种应用,如人工合成出语音,辨识出讲话者,识别出讲话容,进行语音增强等. 语音信号处理是一门新兴的学科,同时又是综合性的多学科领域,是一门涉及面很广的交叉学科.虽然从事达一领域研究的人员主要来自信息处理及计算机等学科.但是它与语音学,语言学,声学,认知科学,生理学,心理学及数理统计等许多学科也有非常密切的联系. 语音信号处理是许多信息领域应用的核心技术之一,是目前发展最为迅速的信息科学研究领域中的一个.语音处理是目前极为活跃和热门的研究领域,其研究涉及一系列前沿科研课题,巳处于迅速发展之中;其研究成果具有重要的学术及应用价值. 数字信号处理是利用计算机或专用处理设备,以数值计算的方法对信号进行采集、抽样、变换、综合、估值与识别等加工处理,借以达到提取信息和便于应用的目的。它在语音、雷达、图像、系统控制、通信、航空航天、生物医学等众多领域都获得了极其广泛的应用。具有灵活、精确、抗干扰强、度快等优点。 数字滤波器, 是数字信号处理中及其重要的一部分。随着信息时代和数字技术的发展,受到人们越来越多的重视。数字滤波器可以通过数

语音信号的采集与时频域分析系统的设计

燕山大学 课程设计说明书 题目:语音信号的采集与时频域分系统的设计 学院(系):电气工程学院 年级专业: 09精仪一班 学号: 0901******** 学生姓名:乔召杰 指导教师:刘永红 教师职称:副教授

目录 引言 (2) 第1章语音信号时域分析 (3) 1、1 窗口选择 (3) 1、2 短时能量 (4) 1、3短时平均过零率 (5) 1、4 短时自相关函数 (6) 1、5 时域分析方法的应用 (7) 第2章语音信号频域分析 (8) 2、1 短时傅里叶变换 (8) 2、2 语谱图 (9) 2、3 复倒谱和倒谱 (9) 第3章加噪与滤波处理 (11) 3、1 原始信号加噪处理 (11) 3、2 加噪信号滤波处理 (12) 第4章总结 (13) 参考文献 (14) 附录 (15)

引言 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在与方便有效的提取并表示语音信号所携带的信息。语音信号分析可以分为时域和频域等处理方法。语音信号可以认为在短时间内(一般认为在 10~30ms 的短时间内)近似不变,因而可以将其看作是一个准稳态过程, 即语音信号具有短时平稳性。任何语音信号的分析和处理必须建立在“短时”的基础上, 即进行“短时分析”。 时域分析:直接对语音信号的时域波形进行分析,提取的特征参数有短时能量,短时平均过零率,短时自相关函数等。 频域分析:对语音信号采样,并进行傅里叶变换来进行频域分析。主要分析的特征参数:短时谱、倒谱、语谱图等。 本文采集作者的声音信号为基本的原始信号。对语音信号进行时频域分析后,进行加白噪声处理并进行了相关分析,设计滤波器并运用所设计的滤波器对加噪信号进行滤波, 绘制滤波后信号的时域波形和频谱。整体设计框图如下图所示: 图0.1时频域分析设计图 图0.2加噪滤波分析流程图

数字信号处理课程设计报告-语音信号的采集与处理

数字信号处理 课程设计报告 课设题目:语音信号的采集与处理 学院: 专业: 班级: 姓名: 学号: 指导教师: 2011 年7月1日

课程设计报告撰写要求 1、页面设置 纸张大小设置为纵向A4,页边距设置为:上3.8厘米,下 3.5厘米,左3厘米,右3厘米,页眉设置为3厘米,页脚设置为2.7厘米,文档网络设置为指定行和字符网格,每行34字,每页34行。 2、段落及字体设置 除各级标题外,首行缩进2字符;图、表及图题、表题首行不缩进,居中放置;图表不应超出版心范围;行距采用单倍行距。 正文中文采用小四号宋体,英文采用新罗马字体(Times New Roman),段前0磅,断后0磅; 一级标题采用小二号黑体,段前12磅,段后12磅 二级标题采用小三号黑体,段前6磅,段后6磅 三级标题采用四号黑体,段前6磅,段后0磅 3、装订要求 采用左侧装订,订两钉。

目录 一. 课程设计任务 (1) 二. 课程设计原理及设计方案 (2) 三. 课程设计的步骤和结果 (6) 四. 课程设计总结 (39) 五. 设计体会 (40) 六. 参考文献 (41)

一. 课程设计任务 1、语音信号的采集 利用Windows下的录音机,录制一段自己的话音,时间在1s内,然后在Matlab软件平台下,利用函数wavread对语音信号进行采样,记住采样频率和采样点数。 2、语音信号的频谱分析 在Matlab中,可以利用函数fft对信号进行快速傅立叶变换,得到信号的频谱特性,要求学生首先画出语音信号的时域波形,然后对语音信号进行频谱分析。 3、设计数字滤波器和画出其频率响应给出各滤波器的性能指标; 给定滤波器的性能指标如下: (1)低通滤波器的性能指标:fb=1000Hz,fc=1200Hz,As=100dB,Ap=1dB. (2)高通滤波器的性能指标:fc=4800Hz,fb=5000Hz,As=100dB,Ap=1dB. (3)带通滤波器的性能指标:fb1=1200Hz, fb2=3000Hz,fc1=1000Hz, fc2=3200Hz,As=100dB,Ap=1dB. 采用窗函数法和双线性变换法设计上面要求的3种滤波器,并画出滤波器的频率响应; 4、用滤波器对信号进行滤波 然后用自己设计的滤波器对采集到的信号进行滤波,画出滤波后信号的时域波形及频谱,并对滤波前后的信号进行对比,分析信号的变化; 5、回放语音信号,分析滤波前后的语音变化; 6、设计系统界面 为了使编制的程序操作方便,设计处理系统的用户界面,在所设计的系统界面上可以选择滤波器的类型,输入滤波器的参数、显示滤波器的频率响应,选择信号等。 - 1 -

(完整版)语音信号分析与处理系统设计

语音信号分析与处理系统设计

语音信号分析与处理系统设计 摘要 语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件,它可以将声音文件变换为离散的数据文件,然后利用其强大的矩阵运算能力处理数据,如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等,它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数,利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化,使人机交互更加便捷。信号处理是Matlab重要应用的领域之一。 本设计针对现在大部分语音处理软件内容繁多、操作不便等问题,采用MATLAB7.0综合运用GUI界面设计、各种函数调用等来实现语音信号的变频、变幅、傅里叶变换及滤波,程序界面简练,操作简便,具有一定的实际应用意义。 最后,本文对语音信号处理的进一步发展方向提出了自己的看法。 关键字:Matlab;语音信号;傅里叶变换;信号处理;

目录 1 绪论 (1) 1.1课题背景及意义 (1) 1.2国内外研究现状 (1) 1. 3本课题的研究内容和方法 (2) 1.3.1 研究内容 (2) 1.3.2 运行环境 (2) 1.3.3 开发环境 (2) 2 语音信号处理的总体方案 (3) 2.1 系统基本概述 (3) 2.2 系统基本要求 (3) 2.3 系统框架及实现 (3) 2.4系统初步流程图 (4) 3 语音信号处理基本知识 (6) 3.1语音的录入与打开 (6) 3.2采样位数和采样频率 (6) 3.3时域信号的FFT分析 (6) 3.4数字滤波器设计原理 (7) 3.5倒谱的概念 (7) 4 语音信号处理实例分析 (8) 4.1图形用户界面设计 (8) 4.2信号的采集 (8) 4.3语音信号的处理设计 (8) 4.3.1 语音信号的提取 (8) 4.3.2 语音信号的调整 (10)

基于MATLAB的语音信号采集与处理

基于M A T L A B的语音信 号采集与处理 This model paper was revised by the Standardization Office on December 10, 2020

工程设计论文 题目:基于MATLAB的语音信号采集与处理 姓名: 班级: 学号: 指导老师: 一.选题背景 1、实践意义: 语音信号是一种非平稳的时变信号,它携带着各种信息。在语音编码、语音合成、语音识别和语音增强等语音处理中无一例外需要提取语音中包含的各种信息。语音信号分析的目的就在于方便有效地提取并表示语音信号所携带的信息。所以理解并掌握语音信号的时域和频域特性是非常重要的。 通过语音相互传递信息是人类最重要的基本功能之一.语言是人类特有的功能.声音是人类常用工具,是相互传递信息的最重要的手段.虽然,人可以通过多种手段获得外界信息,但最重要,最精细的信息源只有语言,图像和文字三种.与用声音传递信息相比,显然用视觉和文字相互传递信息,其效果要差得多.这是因为语音中除包含实际发音内容的话言信息外,还包括发音者是谁及喜怒哀乐等各种信息.所以,语音是人类最重要,最有效,最常用和最方便的交换信息的形式.另一方面,语言和语音与人的智力活动密切相关,与文化和社会的进步紧密相连,它具有最大的信息容量和最高的智能水平。

语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,处理的目的是用于得到某些参数以便高效传输或存储;或者是用于某种 应用,如人工合成出语音,辨识出讲话者,识别出讲话内容,进行语音增强等. 语音信号处理是一门新兴的学科,同时又是综合性的多学科领域,是一门涉及面很广的交叉学科.虽然从事达一领域研究的人员主要来自信息处理及计算机等学科.但是它与语音学,语言学,声学,认知科学,生理学,心理学及 数理统计等许多学科也有非常密切的联系.语音信号处理是许多信息领域应用的核心技术之一,是目前发展最为迅速的信息科学研究领域中的一个.语 音处理是目前极为活跃和热门的研究领域,其研究涉及一系列前沿科研课题,巳处于迅速发展之中;其研究成果具有重要的学术及应用价值. 数字信号处理是利用计算机或专用处理设备,以数值计算的方法对信号进行采集、抽样、变换、综合、估值与识别等加工处理,借以达到提取信 息和便于应用的目的。它在语音、雷达、图像、系统控制、通信、航空航天、生物医学等众多领域都获得了极其广泛的应用。具有灵活、精确、抗 干扰强、度快等优点。 数字滤波器, 是数字信号处理中及其重要的一部分。随着信息时代和数字 技术的发展,受到人们越来越多的重视。数字滤波器可以通过数值运算实 现滤波,所以数字滤波器处理精度高、稳定、体积小、重量轻、灵活不存 在阻抗匹配问题,可以实现模拟滤波器无法实现的特殊功能。数字滤波器 种类很多,根据其实现的网络结构或者其冲激响应函数的时域特性,可分 为两种,即有限冲激响应( FIR,Finite Impulse Response)滤波器和无限冲激响应( IIR,Infinite Impulse Response)滤波器。

数据的采集与语音信号的频谱分析

中北大学 课程设计说明书 学生姓名:吕涛学号:10050644X23 学生姓名:王丽学号:10050644X09学生姓名:赵芳学号:10050644X15 学生姓名:孟庆慧学号:10050644X05 学院:信息商务学院 专业:电子信息工程 题目:信息处理综合实践: 数据的采集与语音信号的频谱分析 指导教师:金永职称: 副教授 2013 年 6 月 28 日

中北大学 课程设计任务书 12/13 学年第二学期 学院:信息商务学院 专业:电子信息工程 学生姓名:吕涛学号:10050644X23 学生姓名:王丽学号:10050644X09学生姓名:赵芳学号:10050644X15 学生姓名:孟庆慧学号:10050644X05 课程设计题目:信息处理综合实践: 数据的采集与语音信号的频谱分析起迄日期:2013年6月7日~2013年6月28日 课程设计地点:学院楼201、510、608实验室指导教师:金永 系主任:王明泉 下达任务书日期: 2013 年6月7 日

1.设计目的: (1)掌握USB总线或PCI总线的基本结构,了解基于USB总线或PCI总线A/D卡的通用结构; (2)掌握数据采集卡采集数据的过程和原理; (3)了解MATLAB的信号处理技术; (4)掌握MATLAB 实现音乐信号的读取、保存、拼接与频谱分析。 2.设计内容和要求(包括原始数据、技术参数、条件、设计要求等): (1)查阅相关资料,撰写关于基于USB总线或PCI总线A/D卡的报告; (2)采用麦克采集本组各个同学的语音信号; (3)采用MATLAB读取采集的语音信号,截取各信号中的一段进行拼接,并进行频谱分析; (4)保存拼接后的语音信号,并进行播放证实存储的正确性,同时对拼接后信号与原有信号的频谱作对比; (5)提高内容:编写语音采集数据程序。 3.设计工作任务及工作量的要求〔包括课程设计计算说明书(论文)、图纸、实物样品等〕: (1)要求设计组的每个成员都要了解设计的要求和思路; (2)MATLAB数据处理部分要求有正确的运行结果及结果分析; (3)总线部分和A/D采集卡部分要求每位同学有自己的理解; (4)每位同学针对上述内容撰写设计说明书(每人1份)。

基于matlab的语音信号的采集与处理

目录 第1章前言 (1) 第2章语音信号分析处理的目的和要求 (2) 2.1MATLAB软件功能简介............................................................................................ - 2 - 2.2课程设计意义 ............................................................................................................. - 2 - 第3章语音信号的仿真原理. (3) 第4章语音信号的具体实现 (4) 4.1语音信号的采集........................................................................................................... - 4 - 4.2语音信号加噪与频谱分析........................................................................................... - 5 - 4.3设计巴特沃斯低通滤波器........................................................................................... - 6 - 4.4用滤波器对加噪语音滤波........................................................................................... - 7 - 4.5比较滤波前后语音信号波形及频谱........................................................................... - 8 - 第5章总结.............................................................................................................................. - 9 - 参考文献.................................................................................................................................. - 10 - 附录.......................................................................................................................................... - 11 -

语音信号的采集和频谱分析

语音信号的采集和频谱分析: [y,fs,bits]=wavread('voice'); %读取音频信息(双声道,16位,频率44100Hz)sound(y,fs,bits); %回放该音频 Y=fft(y,4096); %进行傅立叶变换 subplot(211); plot(y); title('声音信号的波形'); subplot(212) plot(abs(Y)); title('声音信号的频谱'); 窗函数设计低通滤波器: fp=1000; fc=1200; as=100; ap=1; fs=22000; wp=2*fp/fs; wc=2*fc/fs; N=ceil((as-7.95)/(14.36*(wc-wp)/2))+1; beta=0.1102*(as-8.7); window=Kaiser(N+1,beta); b=fir1(N,wc,window); freqz(b,1,512,fs); 结果: 滤波: [y,fs,bits]=wavread('voice'); d=filter(b,a,y); D=fft(d); subplot(211) plot(d); title('滤波后的声音波形') subplot(212) plot(abs(D)) title('滤波后的声音频谱') 回放: sound(d,fs,bits) 与滤波之前相比,噪音明显降低了许多。

过零率的计算要用下面的代码: zcr = zeros(size(y,1)1); delta= 0.02; for i=1:size(y,1) x=y(i,:); for j=1;length(x)-1 if x(j)*x(j+1)<0 &abs(x(j)-x(j+1))>delta zcr(i)=zcr(i)+1; end end end 其中设置了门限delta=0.02。这是个经验值,可以进行细微的调整。在此条件下可以得到如图所示的过零率波形。与过零率曲线画在一起的是原始的语音信号波形,可以看到,语音信号音母部分的幅度比较低,但是其过零率的数值却很高,峰值将近50,而后面的韵母部分过零率则比较低,在20左右。 加矩形窗的短时能量函数: a=wavread('F:\WO.wav'); subplot(6,1,1),plot(a); N=32; for i=2:6 h=linspace(1,1, (i-1)*N);%形成一个矩形窗,长度为N En=conv(h,a.*a);%求卷积得其短时能量函数En subplot(6,1,i),plot(En); if(i==2) legend('N=32'); elseif(i==3) legend('N=64'); elseif(i==4) legend('N=128'); elseif(i==5) legend('N=256'); elseif(i==6) legend('N=512'); end end 加hamming窗的短时能量函数: 把h=linspace(1,1, (i-1)*N); 改为h1=hamming((i-1)*N); 加矩形窗的短时平均幅度: a=wavread('F:\WO.wav'); subplot(6,1,1),plot(a); N=32; for i=2:6 h=linspace(1,1,(i-1)*N);%形成一个矩形窗,长度为N En=conv(h,abs(a));%求卷积得其短时能量函数En subplot(6,1,i),plot(En); if(i==2) legend('N=32'); elseif(i==3) legend('N=64');

语音信号采集与简单处理

语音信号采集与简单处理 一、实验目的、要求 (1)掌握语音信号采集的方法 (2)掌握一种语音信号基音周期提取方法 (3)掌握短时过零率计算方法 (4)了解Matlab 的编程方法 二、实验原理 基本概念: (a )短时过零率: 短时内,信号跨越横轴的情况,对于连续信号,观察语音时域波形通过横轴的情况;对于离散信号,相邻的采样值具有不同的代数符号, 也就是样点改变符号的次数。 对于语音信号,是宽带非平稳信号,应考察其短时平均过零率。 其中sgn[.]为符号函数 x(n)-1sgn(x(n))0 x(n)1sgn(x(n)) 短时平均过零的作用 1.区分清/浊音: 浊音平均过零率低,集中在低频端; 清音平均过零率高,集中在高频端。 2.从背景噪声中找出是否有语音,以及语音的起点。 (b )基音周期 基音是发浊音时声带震动所引起的周期性,而基音周期是指声带震动频率的倒数。基音周期是语音信号的重要的参数之一,它描述语音激励源的一个重要特征,基音周期信息在多个领域有着广泛的应用,如语音识别、说话人识别、语音分析与综合以及低码率语音编码,发音系统疾病诊断、听觉残障者的语音指导等。因为汉语是一种有调语言,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息,有区别意义的功能,所以,基音的提取和估计对汉语更是一个十分重要的问题。 由于人的声道的易变性及其声道持征的因人而异,而基音周期的范围又很 10)] 1(sgn[)](sgn[21N m n n n m x m x Z

宽,而同—个人在不同情态下发音的基音周期也不同,加之基音周期还受到单词 发音音调的影响,因而基音周期的精确检测实际上是一件比较困难的事情。基音 提取的主要困难反映在:①声门激励信号并不是一个完全周期的序列, 在语音的头、尾部并不具有声带振动那样的周期性,有些清音和浊音的过渡帧是很难准确地判断是周期性还是非周期性的。②声道共振峰有时会严重影响激励信号的谐波结构,所以,从语音信号中直接取出仅和声带振动有关的激励信号的信息并不容易。③语音信号本身是准周期性的(即音调是有变化的),而且其波形的峰值点或过零点受共振峰的结构、噪声等的影响。④基音周期变化范围大,从老年男性的50Hz 到儿童和女性的450Hz ,接近三个倍频程,给基音检测带来了一定的困难。由于这些困难,所以迄今为止尚未找到一个完善的方法可以对于各类人群(包括男、女、儿童及不向语种)、各类应用领域和各种环境条件情况下都能获得满意的检测结果。 尽管基音检测有许多困难,但因为它的重要性,基音的检测提取一直是一个研究的课题,为此提出了各种各样的基音检测算法,如自相关函数 (ACF)法、峰值提取算法(PPA)、平均幅度差函数(AMDF)法、并行处理技术、倒谱法、SIFT 、谱图法、小波法等等。 三、使用仪器、材料 微机(带声卡)、耳机,话筒。 四、实验步骤 (1)语音信号的采集 利用Windows 语音采集工具采集语音信号,将数据保存 wav 格式。采集一组浊音信号和一组清音信号,信号的长度大于 3s 。(2)采用短时相关函数计算语音信号浊音基音周期,考虑窗长度对基音周期计算的影响。采用倒谱法求语音信号基音周期。 (3)计算短时过零率,清音和浊音的短时过零率有何区别。 五、实验过程原始记录(数据,图表,计算) 短时过零率 短时相关函数 P j j n s n s j R N j n n n n ,,1)()() (1 10)] 1(sgn[)](sgn[21N m n n n m x m x Z

基于MATLAB的语音信号的处理

第一章语音信号的特点与采集 第一节语音信号采集的介绍 在Matlab环境中,主要可以通过以下几种方法驱动声卡,采集语音信号: 1.将声卡作为对象处理采集语音信号Matlab将声卡作为对象处理,其后的一切操作都不与硬件直接相关,而是通过对该对象的操作来作用于硬件设备(声卡)。操作时首先要对声卡产生一个模拟输入对象(ai),给ai对象添加一个通道设置采样频率后,就可以启动设备对象,开始采集数据,采集完成后停止对象并删除对象。 2.调用wavrecord功能函数采集语音信号。wavrecord功能函数只适用于windows95/98/N平台,它使用windows声音输入设备录制声音。函数调用方式:wavrecord(N,fs,ch,nbits); N:采集的样本数据量; fs:样本采集频率,为8000Hz、11025Hz、22050Hz和44100Hz之一,默认值为11025Hz; ch:样本采集通道,1为单声道,2为双声道,默认值为1(单声道); nbits:每个样本的位数(或称解析度),‘double’、‘single’或‘int16’为16位,‘uint8’为8位; 3.运用audiorecorder对象采集语音信号audiorecorder(fs,nbits,ch)可以创设一个audiorecorder对象。fs:样本采集频率,为8000Hz、11025Hz、22050Hz和44100Hz之一,默认值为8000Hz; nbits:每个样本的位数,8位或16位,默认值为8位; ch:样本采集通道,1为单声道,2为双声道,默认值为1(单声道); audiorecorder对象创设后,就可以进行相应的录音、暂停、停止、播放以及数据读取等操作。第二节语音信号的特点 通过对大量语音信号的观察和分析发现,语音信号主要有下面两个

相关文档
最新文档