单通道16位采样率为44.1K音频信号进行压缩,实现.mp3格式的数据结构(上海大学DSP技术及其应用 )

上海大学2014～2015学年秋季学期研究生课程考试

文献阅读报告

课程名称：DSP技术及其应用课程编号：071000907

题目: 单通道16位、采样频率44.1K音频信号压缩，实现*.MP3格式的数据结构研究生姓名: 学号:

评语:

成绩: 任课教师:

评阅日期:

单通道16位、采样率为44.1K音频信号进行压缩，实现*.mp3格

式的数据结构

2015/1/15

摘要：在目前的信息社会，需要应用和传输大量的语音信息，这些信息中存在着大量的冗余，如果不去除掉这些冗余，在其传输和存储的过程中，将会占用大量的资源，因此，语音压缩技术受到了人们的普遍关注。在此基础上，对MP3编码器的基本原理和基本结构进行了研究，并对其几个关键模块包括心里声学模型、子带滤波、量化编码等进行了深入的研究。研究结果表明MP3要具有良好的编码质量，本文着重于如何将音频信号压缩为MP3格式。

关键词：MP3编解码；音频；算法原理；算法

16-channel sampling rate of 44.1K audio signal compression,

implement data structures mp3 format

Abstract：In the current information society，there is much voice information which contains mass of redundancy．It will take up vast resources in transmission and storage processes if the redundant is not removed．Therefore，voice compression technology has been paid widely attention．Based on all of these，the basic principle and structure of MPEG-1 layer3 audio code is investigated．Especially，several key modules such as psychoacoustic model，sub-band filtering and quantization coding are carried on further study．The research results show that the MP3 encoding quality to have，This article focuses on how to get the audio signal compression to MP3 format。

Key words：MP3 coding and decoding；audio frequency；algorithm principle；algorithm

近年来，MP3(MPEG一1 layer3)播放器倍受人们的喜爱，主要因为MP3播放器既具有出色的音质又有大的存储容量，对于数字音频的存储、处理和传输都提出了很高的要求，所以在保证一定质量的基础上，应该采用一定的方法来压缩音频数据，以达到降低码率的目的[8]。MPEG一1音频压缩标准提供了一种高保真度，高压缩比的压缩算法。根据编码计算复杂度及编码效率的不同，分为层I、层Ⅱ和层Ⅲ 3种标准，层次越高编码后的音质就越好，压缩率也越高，其编码的算法也就越复杂，对计算机的能力要求也就越高。层Ⅲ就是应用最为流行的MP3音乐格式，也是目前音频领域中最流行的[2]。

1 音频压缩基本理论

1.1 数字音频信号

模拟音频信号经过采样、量化、编码得到数字化的音频信号。其中涉及几个重要的参数采样频率、采样位数、声道数等。

1.1.1 采样频率

即取样频率, 指每秒钟取得声音样本的次数。采样频率越高,声音的质量也就越好,声音的还原也就越真实，但同时它占的资源比较多。

1.1.2 采样位数

就是将采样样本幅度量化的量化位数。它是用来衡量声音波动变化的一个参数，也可以说是声卡的分辨率。它的数值越大，分辨力也就越高，所发出声音的能力越强。

1.1.3 声道数

指所使用的声音通道的个数。声道有单声道和双声道之分，单声道的声音只能使用一个声道发声，双声道的PCM可以使两个声道发声（一般左右声道有分工），更能感受到空间效果。

1.1.4 比特率

表示单位时间（1秒）内传送的比特数bps（bit per second，位/秒）的速度。作为一种数字音乐压缩效率的参考性指标，通常使用kbps（通俗地讲就是每秒钟1024比特）作为单位。

1.1.5 音频文件储存量

存储量=(采样频率*采样位数*声道)*时间/8(单位：字节数)

1.2 PCM数据格式

PCM编码是Pulse Code Modulation的缩写，又叫脉冲编码调制，它是数字通信的编码方式之一，其编码主要过程是将话音、图像等模拟信号每隔一定时间进行取样，使其离散化，同时将抽样值按分层单位四舍五入取整量化，同时将抽样值按一组二进制码来表示抽样脉冲的幅值。PCM中的声音数据没有被压缩，PCM编码的最大的优点就是音质好，最大的缺点就是体积大[3]。

1.2.1 PCM数据的存放方式：

1.3 MP3文件格式

MP3的全称应为MPEG1 Layer-3音频文件。MP3文件是由帧(frame)构成的,帧是MP3文件最小的组成单位。MP3的压缩率则高达10:1-12:1[4],也就是说,一分钟CD音质的音乐,未经压缩需要10MB 的存储空间,而经过MP3压缩编码后只有1MB左右。

1.3.1 MP3 文件结构：

MP3文件大体分为三部分：ID3V2，音频数据，ID3V1。其中ID3V2、ID3V1包含了作者，作曲，专辑等信息。音频数据由一系列的帧构成，用来记录mp3 的位率，采样率，版本等信息，每个帧又分为帧头和数据实体两部分，而帧的长度可能不固定，也可能固定，由位率bitrate 决定。

1.3.2 MP3的数据帧格式：

每一帧由帧头和数据体构成。数据体包括CRC校验位、边信息、主数据和附加数据构成。

1.3.3 帧长度

Layer III使用公式：帧长度（字节）= (( 每帧采样数 / 8 * 比特率 ) / 采样频率 ) + 附加数据

1.3.4 每帧的持续时间

每帧持续时间(毫秒) = 每帧采样数 / 采样频率 * 1000

1.3.5 主数据（MAIN_DA TA）

主数据是音频文件中的主要信息部分，压缩率越大，则主数据的数据量越少。主数据部分长度是否变化决定于帧头的位率是否变化,一首MP3歌曲,kbps(比特率)表明了音乐每秒的数据量,Kbps 值越高,音质越好,文件也越大,MP3标准规定,不变的bitrate的MP3文件称作CBR,大多数MP3文件都是CBR的,而变化的bitrate的MP3文件称作VBR,每个FRAME的长度都可能是变化的。

1.4 MP3编码流程图

原始的PCM样值信号首先通过分析多相滤波器组，该滤波器将输入信号分为32个等频宽的子频带信号。然后通过改进的离散余弦变换(MDCT，Modified Discrete Cosine Transform)，将每个子带的时域信号映像到频域。同时，输入信号经过FFT后通过心理声学模型，以确定每一子带的信掩比SMR。最后将编码后的数据、边信息及其它所有数据按照MP3所规定的格式封装成比特流输出。

1.4.1 分析多相滤波器组

MPEG-1/Audio使用了32通道的伪标准正交镜像滤波器组(PQMF)技术，把输入的音频信号分解为32个等频宽的子频带信号，每个子带的分析滤波器均是由同一个原型低通滤波器h(n)通过不同频率和相位的调制而得。在MP3编码中采用了分节处理的方法，即将每一帧数据分为两节来处理，每节的样本数为576，两节数据的处理方法基本相同，都是将他们分成32个子带分别量化。

采用对每个子带分别编码来处理音频信号，主要有两个优点。第一，可根据每个子带信号在感觉上的重要性，对每个子带合理的分配比特数，就可能分别控制各子带的量化电平数目以及相应的重建信号的量化误差方差值，获得更好的主观听音质量。例如，音频信号主要集中在低频，对低频带的子带可以用较多的比特数来表示其样值；而噪声通常出现高频段，对于高频带的子带我们可以分配比较少的比特。第二，对各子带分别进行量化编码，各子带内的量化嗓音相互间独立，被束缚在自己的子带内，这样就避免输入电平较低的子带信号被其它子带的量化噪音所淹没。

1.4.2 MDCT

这一过程中，32个子带的信号经加窗截取后进行修正的离散余弦变换，实现了时域到频域的转换[7]。在频域中比在时域中处理音频信号的好处要多。相邻音频信号间在时域内存在着较强的相关性，通过信号由时域到频域的转换，可以消除信号问的相关性，且频域信号依频谱由低到高，对人的听觉系统的影响从强到弱。频域内的音频信号具有能量的集中性(低频分量的能量较高频强)和影响力的有序性的特点，因而一般的音频处理都会转换到频域处理。

1.4.3 心理声学模型

人耳的听力范围是20Hz-20k Hz的频率范围，但是人耳对不同的频率声音的灵敏度是不同的，不同频率的声音要达到能被人耳听到的水平所需要的强度是不一样。那么通过计算，可以把音乐文件中存在但不能被人耳听到的声音去掉。通过这原理，我们还可以建立模型，把大部分数据空间分配到人耳最灵敏的2kHz到5kHz范围，其余频率分配比较少的空间[9]。

遮蔽效应表现在强信号会遮蔽邻近频率的弱信号[6]。用生活经验来说，在安静的房间中，一根针掉到地上都能听见，可到了大街上，就算手机音量调到最大，来电时也未必能听见，而手机的声

音确确实实是存在的，原因就是被周围更大的声音遮蔽了。有了对遮蔽效应的研究成果，编码器就能根据已建立的数学模型，计算强信号对附近弱信号的遮蔽，把能引起人们注意的声音才保留。1.4.4 非线性量化

量化是为了用有限的二进制数表示离散化的音频信号样值，必须将连续的样值进行离散化处理，这个过程就是量化过程。量化按照它的量阶的关系可以分为线性量化和非线性量化，线性量化可以适当的表示较大的声音，但是对于大部分的轻声，我们将得到相同的二进制的值，这样就无法把轻声分频，会大大的损害语音的音质；为了解决这个问题，我们采取不同的步阶，就是根据信号的振幅而采取不同的步阶大小(step size)，这样就可以在信号的振幅时的到较多的二进制值，能够很好的把低声分频，从而可以得到较好的音质。

1.4.5 Huffman编码

Huffman编码是一种比较常用的变长编码方法，其主导思想是根据数据符号发生的概率进行编码[7]。在数据中出现概率越高的符号，相应的码长越短：出现概率越低的符号，其码长越长，从而达到用尽可能少的码符号表示源数据。Huffman编码需对原始数据进行两遍扫描，第一遍统计原始数据中各字符出现的频率，由此创建Huffman树并将其有关信息保存起来，以便解压时使用：第二遍则根据所得到的Huffman树对原始数据进行编码，并将编码信息保存起来。

①根据源数据符号出现的概率，求出各个符号出现的权值{W1，W2，?，Wn}构成n棵二叉树的集合F={T1，T2，?，Tn}，其中每棵二叉树Ti中只有一个带权为Wi的根结点，其左右子数为空。

②在F中选取两棵根结点的权值最小的树作为左右子树构造一新的二叉树，设置新二叉树的根结点的权值为左、右子树上根结点权值之和。

③在F中删除所选取的两棵子树，同时将构成得到新二叉树加入到F中。重复②、③直到F 中只包含一个二叉树为止，这棵树便是Huffman树。

2 MATLAB实现及代码

2.1 lame编码器

LAME 是最好的MP3编码器，编码高品质MP3的最好也是唯一的选择。LAME本身是DOS下的文件，需要加外壳程序才比较容易使用，也可以在别的软件（比如EAC）中间调用。是一款出色的MP3压缩程序，它使用了独创的人体听音心理学模型和声学模型，改变了人们对MP3高音发哑、低音发破的音质的印象。

LAME分DLL和EXE两种版本，DLL版本做为一个方便的接口程序在大多数抓轨软件中都能看到，但由于可控性差，与具备丰富调节参数的EXE版相比，其压缩出来的MP3效果稍逊一筹。

2.2 MATLAB代码

function mp3write(Y,FS,NBITS,ENCODING,MP3FILE)

s = which('mp3write.m');

ww = findstr('mp3write.m',s);

lame = s(1:ww-2);

wavwrite(Y,FS,NBITS,strcat(lame,'\temp.wav'));

tmpfile = strcat(lame,'\temp.wav');

MP3FILE = strcat(pwd,'\',MP3FILE);

ENCODING = num2str(ENCODING);

switch ENCODING

case {'1'}

cmd = [lame,'\lame', ' --quiet', ' ', tmpfile, ' ',MP3FILE];

case {'2'}

cmd = [lame,'\lame', ' --quiet', ' -b 128 ', tmpfile, ' ',MP3FILE];

case {'3'}

cmd = [lame,'\lame', ' --quiet', ' --abr 112 ', tmpfile, ' ',MP3FILE];

case {'4'}

cmd = [lame,'\lame', ' --quiet', ' -f ', tmpfile, ' ',MP3FILE];

case {'5'}

cmd = [lame,'\lame', ' --quiet', ' -h ', ' -V ', tmpfile, ' ',MP3FILE];

otherwise

error('Encoding parameters not suported')

end

dos(cmd);

delete(tmpfile);

mp3write函数通过cmd设置lame的不同的MP3压缩格式，再利用dos调用cmd的压缩命令，从而实现了不同的压缩效果。

3 结束语

本文理论部分首先音频压缩相关的基本音频知识以及相关的音频信号格式的介绍。并且从MPEG一1标准的角度，详细分析了MP3编码算法压缩标准的原理以及编码的主要流程。深入的学习了MP3编码的基础知识，掌握了MP3的编码算法理论。实验部分通过对录制好的wave音频文件格式压缩为MP3音频文件，再保证音质基本不变的情况，实现了压缩比约为10:1的效果，极大改善了在音频信号在传输过程中便捷。通过研究发现，如果对主要的心理声学模型、量化模块和分析滤波器组的算法进行创新的改进，最终MP3的编码速度和质量会有较大的提高．MP3编码器算法的改进和优化将成为计算机科学领域中一个重要的研究方向。

参考文献：

[1]张琦．MPEG标准的发展[J]．现代电声技术，2003(3)：124-129．

[2]谦君．3G移动语音编码标准介绍[J]．无线技术，2006(9)：97-98．QIAN Jun．Mobile 3G speech coding standard

introduction[J]．Wireless Technology ，2006(9)：97-98．

[3]李昌立，吴善培．数字语音-语音编码实用教程[M].北京：人民邮电出版社．2004．

[4]Michael Mc Candless，The MP3 revolution[J]．IEEE Intelligent Systems Archive，1999，14(3)：8-9．

[5]丰帆．MP3数字音频编解码算法的研究及实现[J]．西安电子科技大学，2008(1)：3-5．FENG Fan．MP3 digital audio code algorithm research and Realization[J]．Xi’an Electronic and Science University，2008(1)：3-5．

[6]张力光，王让定．心理声学模型及其在MP3编码中的应用[J]．宁波大学学报：理工版，2010，23(3)：27-30．ZHANG Li-guang，WANG Rang-ding．Psychoacoustic model and its application in MP3 coding[J]．Journal of Ningbo University：Science and Technology，2010，23(3)：27-30．

[7]HUANG Li-qun，WANG Yu-liang，GONG Ping．An improved construction method of Qc-LDPC codes based on the PEG algorithm [C]//Circuits，Communications and System(PACCS)，2011:1-4．

[8]Fossorier M P C．Quasi-cyclic low-density parity-check codes from circulant permutation matrices[J]．IEEE Transactions on Information Theory，2004，50(8)：1788—1793．

[9]Sullivan M E O．Algebraic construction of sparse matrices with large girth[J]．IEEE Transactions on Information Theory，February 2006，52(2)：719-727．

[10]LI Li-xin，CHEN Zheng-kang，FAN Jie，et a1．Implementation of LDPC codes decoding based on maximum average mutual information quantization[J]．International Review on Computers and Software(I．RE．CO．S．)，2011：1135-1139.

[11] 高成伟. 移动多媒体技术——标准、理论与实践[M].北京: 清华大学出版社, 2006.

[12]张风林，刘思峰．一个改进的Huffman数据压缩算法[J]．计算机工程与应用，2007，43(2)：73—74

[13] 李伟生，李域，王涛．一种不用建造Huffman树的高效Huffman编码算法[J]．中国图象图形学报，2005，10(3)：382-387．

[14] 韩俊英，韩虎．Huffman算法的分析与改进EJ3．兰州铁道学院学报(自然科学版)，2003，22(3)：120—121

[15] (美)Texas Instruments Incorporated著,田黎育,何佩琨,朱梦宇编译.TMS320C6000系列DSP编程工具与指南[M]. 清华大学出版社, 2006

[16] Iranian Journal of Information Science and Technology ,A.R.ZOLGHADR ASLI,E.GOODARZI.Real-time implementation of G.723.1 speech coder using TMS320VC5402 DSP c hip. 2004

[17]Texas Instruments,TLV320AIC23B-QI Data Manual,2004.9

[18]Texas Instrument,DSP/BIOS Driver Developer’s Guide,November 2002

[19]Texas Instrument,TMS320C6000 Optimizing Compiler User’s Guide.2004

[20]Adaptive Digital Technologies,Inc,ADTG723.l DA TA SHEET.2005

1、模拟信号到数字信号的转换

模拟信号到数字信号的转换（A/D转换）（胥永刚）现在大部分传感器输出的信号都是模拟信号，主要包括电压信号和电流信号两种，当然也有直接输出数字信号的传感器。对于传感器输出的模拟信号，除了一些简单的仪表直接进行显示之外，大部分都需要转换成数字信号，以便在网络上进行传输，并保存在硬盘、CF卡等存储介质上，用于后续的分析和处理，如此，就需要用专门的器件将模拟信号转换成数字信号。对于部分技术人员来说，了解模数转换的原理，对深入了解测试仪器，开发测试系统，修正仪器的技术参数等有着很大的帮助。对于一个完整的带反馈控制的监控系统来说，大体可以用图1这个框图来描述，从图中可以看出来，一般而言，模数转换（A/D）大多在数模转换（D/A）之前，但在很多教材上，往往是先讲数模转换（D/A），再讲模数转换（A/D），因为模数转换电路里要用到数模转换。当然这是从理论上来讲的，对于现在工程中实际应用的数模转换究竟基于什么原理，我也不是很清楚，但并不妨碍我们对模数转换的理解。. 因此，我们尝试着讲解数模转换原理，因为从对应关系上来说，这两者是一样的，只是转换电路不同而已。图1 典型的监控系统（带反馈控制） 1、数模转换原理图2是很多教材上给出的数模转换电路，要想讲清楚这个，需要用到电工电子方面的知识，这里我们就不详细展开了。（原谅我一次一次提到教材二字，因为在高校里工作，养成习惯了，^_^）图2 数模转换电路

图1是一个4位的数模转换电路，意思是将一个4位的二进制数转换成对应的电压。4位的二进制数可以表示成3210d d d d ，翻译成十进制数，就是 32103210 2*+2*+2*+2*d d d d （1）式（1）中的四位二进制数，每个位上要么是0，要么是1，不可能是其它数字。因此，四位二进制数最大可表示十进制的15，最小可表示十进制的0。若我们任意给一个四位的二进制数，可以按照如下公式进行数字和电压之间的换算。 321043210=(2+2+2+2)32F R o R U U d d d d R （2）比如，我们假设这个四位的数模转换器参考电压=10R U V ，=3F R R ，若输入的四位二进制数是0000（对应的十进制数是0），则输出的电压为： 3210 410=(2*0+2*0+2*0+2*0)=032 F o R U V R 若输入的四位二进制数是1101（对应的十进制数是13），则输出的电压为： 321041010130=(2*1+2*1+2*0+2*1)=(8+4+0+1)=321616 F o R U V R 也就是说，要是输入的十进制数是0，则输出电压0V，若输入的十进制数是13，则输出的电压为13016 V ，如此类推，我们就可以得知，输入任意一个四位二进制数（对应的十进制数在0~15之间），就可以按照式（2）得到一个对应的电压值。如此，就实现了数字信号到模拟信号的转换。当然，现在市场上很少能买到4位的数模转换器，大部分都是12位，16位，24位的，转换规律是一样的，参考下式： -1-20-1-20= (2+2++2)32F R n n n o n n R U U d d d R （3） 2 关于数模转换的直观理解不理解上面那几个公式也没关系，只要明白下面这个对应关系也可以。不管是数模转换（D/A）还是模数转换（A/D），就是根据某一个公式实现电压信号和对应的数字信号之间的转换。比如，一个数模转换器允许输入的数字范围是0~4095，对应输出的电压为-5V~+5V。之所以这样假设，是因为大多数数模转换输入的是十进制数字，12位的二进制信号对应的十进制数字就是000000000000对应着十进制的0，111111111对应着十进制的4095，常见的数模转换和模数转换电压范围为-5V~+5V。在这个假设下，如图4所示，若是数模转换，意味着输入数字为0时，输出电压是-5V，输入数字为4095时，输出电压为+5V，输入数字为2048时，输出电压为0V。

语音信号分析与处理系统设计

语音信号分析与处理系统设计摘要语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科，是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。 Matlab语言是一种数据分析和处理功能十分强大的计算机应用软件，它可以将声音文件变换为离散的数据文件，然后利用其强大的矩阵运算能力处理数据，如数字滤波、傅里叶变换、时域和频域分析、声音回放以及各种图的呈现等，它的信号处理与分析工具箱为语音信号分析提供了十分丰富的功能函数，利用这些功能函数可以快捷而又方便地完成语音信号的处理和分析以及信号的可视化，使人机交互更加便捷。信号处理是Matlab重要应用的领域之一。本设计针对现在大部分语音处理软件内容繁多、操作不便等问题，采用MATLAB7.0综合运用GUI界面设计、各种函数调用等来实现语音信号的变频、变幅、傅里叶变换及滤波，程序界面简练，操作简便，具有一定的实际应用意义。最后，本文对语音信号处理的进一步发展方向提出了自己的看法。关键字：Matlab；语音信号；傅里叶变换；信号处理；

目录 1 绪论 (1) 1.1课题背景及意义 (1) 1.2国内外研究现状 (1) 1. 3本课题的研究内容和方法 (2) 1.3.1 研究内容 (2) 1.3.2 运行环境 (2) 1.3.3 开发环境 (2) 2 语音信号处理的总体方案 (3) 2.1 系统基本概述 (3) 2.2 系统基本要求 (3) 2.3 系统框架及实现 (3) 2.4系统初步流程图 (4) 3 语音信号处理基本知识 (6) 3.1语音的录入与打开 (6) 3.2采样位数和采样频率 (6) 3.3时域信号的FFT分析 (6) 3.4数字滤波器设计原理 (7) 3.5倒谱的概念 (7) 4 语音信号处理实例分析 (8) 4.1图形用户界面设计 (8) 4.2信号的采集 (8) 4.3语音信号的处理设计 (8) 4.3.1 语音信号的提取 (8) 4.3.2 语音信号的调整 (10)

采样频率的确定

逐次比较式ADC 采样频率的选取及应用作者：吕迅，鲁聪达时间：2006-12-22 来源: 摘要: 在设计数据采集系统时，一项重要的任务是选择模数转换器(ADC) 的采样频率L 根据采样理论，采样频率至少应为输入信号带宽的两倍，实际往往采用更高的采样频率来保证数据采集系统的精度L 但当逐次比较式ADC 的采样频率过高时，会使其内部采样保持的开关电容充电不充分，从而导致ADC 转换误差过大L选择一个合适的采样频率是保证数据采集系统可靠工作的关键L通过建立ADC 及前向通道的等效模型及推导，在保证ADC 的转换精度下，推出ADC 的采样时间与信号放大电路输出阻抗的匹配关系，得到ADC 最合适的采样频率。关键词：逐次比较式；模数转换器；开关电容；采样时间；转换精度引言数据采集系统的前向通道一般是由三部分组成的: 传感器，信号放大电路和模数转换器(ADC) 。逐次比较式的模数转换器是试验机控制系统的数据采集模块及其它工业数据采集系统常采用的模数转换器L在设计这类数据采集系统时，一项重要的任务是选择模数转换器(ADC) 的采样频率。根据采样理论，信号的采样频率至少应为输入信号带宽的两倍，实际往往采用更高的采样频率来保证数据采集系统的精度。但当逐次比较式ADC 的采样频率过高时，会导致ADC 转换误差过大。这是因为这类ADC 的采样保持部分是采用开关电容阵列的结构。这种结构是靠信号放大电路的输出电压对其内部的开关电容阵列进行充

电，即ADC 的采样阶段。然后对电容阵列的电压值进行保持及转换得到对应的数字量L 而对开关电容阵列进行充电需要一定时间，如果ADC 的采样时间过短，会导致ADC 内部的开关电容阵列并未完全充电，即此时ADC 采得电压值低于实际电压值。从而导致后面转换结果与实际误差过大而无效。因此采样时间必须能保证开关电容阵列的充分充电，才能保证采样值的精度。而开关电容阵列的充电时间取决于信号放大电路的输出电阻和ADC 的转换位数。本文推导出ADC 的采样时间与信号放大电路输出阻抗的匹配关系，在保证ADC的转换精度下，得到不同转换位数ADC 的最佳采样频率。模拟输入电路的分析测控系统的传感器和信号放大电路经常采用差动式放大器和运算放大器变换电路等组成，根据戴维南原理(Théven in’s theo rem ) ，可将其简化成一个放大后的等效电压信号源。而逐次比较式ADC 的开关电容阵列结构，在其采样期间，等效于一个等效电容通过一个等效内部电阻与信号源相连L因此整个前向通道可等效并简化为图1。图1 的等效电路对本文所分析T i 公司的TLC54X，TLC154X 和TLC254X 系列的逐次比1 较式ADC 都是有效的。由于对图1 中ADC 的等效电容C i 的充电是呈指数变化，见图2根据理论分析，充电时间越长，其上的电压U c 只是无限接近于等效信号源的电压U s为保持一定采样频率，在以下的分析中，假定当等效电容C i 上的电压值达到了1/16 L SB 的误差范围之内，即算其进行了完全充电L因为在此采样误差下，再把其它的内部误差，如DNL 和NL 一起统计进来，可把总共的转换误差控制在± 1/2 L SB 之内。

实验设计：多采样率数字信号处理

实验名称：多采样率数字信号处理一．实验目的：1. 掌握信号抽取和插值的基本原理和实现； 2．掌握信号的有理数倍率转换。二．实验原理：多采样率数字信号处理共分为3方面的问题：信号的整数倍抽取、信号的整数倍插值和信号的有理数倍速率转换。 Matlab 信号处理工具箱提供了抽取函数decimate 用于信号整数倍抽取，其调用格式为： y=decimate(x,M) y=decimate(x,M,n) y=decimate(x,M,’fir’) y=decimate(x,M,n,’fir’) 其中y=decimate(x,M)将信号x 的采样率降低为原来的 M 1，抽取前缺省地采用8阶Chebyshev Ⅰ型低通滤波器压缩频带。 y=decimate(x,M,n)指定所采用Chebyshev Ⅰ型低通滤波器的阶数，通常13 n 。 y=decimate(x,M,’fir’)指定用FIR 滤波器来压缩频带。 y=decimate(x,M,n,’fir’) 指定所用FIR 滤波器的阶数。 Matlab 信号处理工具箱提供了插值函数interp 用于信号整数倍插值，其调用格式为： y=interp(x,L) y=interp(x,L,n,alpha) [y,b]=interp(x,L,n,alpha) 其中y=interp(x,L)将信号的采样率提高到原来的L 倍。 y=interp(x,L,n,alpha)指定反混叠滤波器的长度n 和截止频率alpha ，缺省值为4和0.5。 [y,b]=interp(x,L,n,alpha)在插值的同时，返回反混叠滤波器的系数向量。信号的有理数倍速率转换是使信号的采样率经由一个有理因子M L 来改变，可以通过插值和抽取的级联来实现。Matlab 信号处理工具箱提供了重采样函数resample 用于有理倍数速率转换，其调用格式为： y=resample(x,L,M);

基于MATLAB的语音信号处理系统设计(程序+仿真图)--毕业设计

语音信号处理系统设计摘要：语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。语音信号处理的目的是得到某些参数以便高效传输或存储,或者是用于某种应用，如人工合成出语音、辨识出讲话者、识别出讲话内容、进行语音增强等。本文简要介绍了语音信号采集与分析以及语音信号的特征、采集与分析方法，并在采集语音信号后，在MATLAB 软件平台上进行频谱分析,并对所采集的语音信号加入干扰噪声，对加入噪声的信号进行频谱分析，设计合适的滤波器滤除噪声，恢复原信号。利用MATLAB来读入（采集）语音信号，将它赋值给某一向量，再将该向量看作一个普通的信号，对其进行FFT变换实现频谱分析，再依据实际情况对它进行滤波，然后我们还可以通过sound命令来对语音信号进行回放，以便在听觉上来感受声音的变化。关键词：Matlab，语音信号，傅里叶变换，滤波器 1课程设计的目的和意义本设计课题主要研究语音信号初步分析的软件实现方法、滤波器的设计及应用。通过完成本课题的设计，拟主要达到以下几个目的： 1.1．了解Matlab软件的特点和使用方法。 1.2．掌握利用Matlab分析信号和系统的时域、频域特性的方法； 1.3．掌握数字滤波器的设计方法及应用。 1.4．了解语音信号的特性及分析方法。 1.5．通过本课题的设计，培养学生运用所学知识分析和解决实际问题的能力。 2 设计任务及技术指标设计一个简单的语音信号分析系统，实现对语音信号时域波形显示、进行频谱分析，利用滤波器滤除噪声、对语音信号的参数进行提取分析等功能。采用Matlab设计语言信号分析相关程序，并且利用GUI设计图形用户界面。具体任务是：

数字信号处理基础书后题答案中文版

Chapter 2 Solutions 2.1 最小采样频率为两倍的信号最大频率，即44.1kHz 。 2.2 (a)、由ω = 2πf = 20 rad/sec ，信号的频率为f = 3.18 Hz 。信号的奈奎斯特采样频率为6.37 Hz 。 (b)、3 5000π=ω，所以f = 833.3 Hz ，奈奎斯特采样频率为1666.7 Hz 。 (c)、7 3000π=ω，所以f = 214.3 Hz ，奈奎斯特采样频率为428.6 Hz 。 2.3 (a) 1258000 1f 1T S S ===μs (b)、最大还原频率为采样频率的一半，即4000kHz 。 2.4 ω = 4000 rad/sec ，所以f = 4000/(2π) = 2000/π Hz ，周期T = π/2000 sec 。因此，5个周期为5π/2000 = π/400 sec 。对于这个信号，奈奎斯特采样频率为2(2000/π) = 4000/π Hz 。所以采样频率为f S = 4(4000/π) = 16000/π Hz 。因此5个周期收集的采样点为(16000/π samples/sec )(π/400 sec) = 40。 2.5 ω = 2500π rad/sec ，所以f = 2500π/(2π) = 1250 Hz ，T = 1/1250 sec 。因此，5个周期为5/1250 sec 。对于这个信号，奈奎斯特采样频率为2(1250) = 2500 Hz ，所以采样频率为f S = 7/8(2500) = 2187.5 Hz 。采样点数为(2187.5 点/sec)(5/1250 sec) = 8.75。这意味着在模拟信号的五个周期内只有8个点被采样。事实上，对于这个信号来说，在整数的模拟周期中，是不可能采到整数个点的。 2.6 2.7 信号搬移发生在kf S ± f 处，换句话说，频谱搬移发生在每个采样频率的整数倍 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 频率/kHz

语音信号处理系统设计

课题六语音信号处理系统设计摘要：语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科。语音信号处理的目的是得到某些参数以便高效传输或存储,或者是用于某种应用，如人工合成出语音、辨识出讲话者、识别出讲话内容、进行语音增强等。本文简要介绍了语音信号采集与分析以及语音信号的特征、采集与分析方法，并在采集语音信号后，在MATLAB 软件平台上进行频谱分析,并对所采集的语音信号加入干扰噪声，对加入噪声的信号进行频谱分析，设计合适的滤波器滤除噪声，恢复原信号。利用MATLAB来读入（采集）语音信号，将它赋值给某一向量，再将该向量看作一个普通的信号，对其进行FFT变换实现频谱分析，再依据实际情况对它进行滤波，然后我们还可以通过sound命令来对语音信号进行回放，以便在听觉上来感受声音的变化。关键词：Matlab，语音信号，傅里叶变换，滤波器 1课程设计的目的和意义本设计课题主要研究语音信号初步分析的软件实现方法、滤波器的设计及应用。通过完成本课题的设计，拟主要达到以下几个目的： 1.1．了解Matlab软件的特点和使用方法。 1.2．掌握利用Matlab分析信号和系统的时域、频域特性的方法； 1.3．掌握数字滤波器的设计方法及应用。 1.4．了解语音信号的特性及分析方法。 1.5．通过本课题的设计，培养学生运用所学知识分析和解决实际问题的能力。 2 设计任务及技术指标设计一个简单的语音信号分析系统，实现对语音信号时域波形显示、进行频谱分析，利用滤波器滤除噪声、对语音信号的参数进行提取分析等功能。采用Matlab设计语言信号分析相关程序，并且利用GUI设计图形用户界面。具体任务是：

模拟信号与数字信号之间的转换

模拟数据(Analog Data)是由传感器采集得到的连续变化的值，例如温度、压力，以及目前在电话、无线电和电视广播中的声音和图像。数字数据(Digital Data)则是模拟数据经量化后得到的离散的值，例如在计算机中用二进制代码表示的字符、图形、音频与视频数据。目前，ASCII美国信息交换标准码(American Standard Code for Information Interchange)已为ISO国际标准化组织和CCITT国际电报电话咨询委员会所采纳，成为国际通用的信息交换标准代码，使用7位二进制数来表示一个英文字母、数字、标点或控制符号；图形、音频与视频数据则可分别采用多种编码格式。模拟信号与数字信号 (1)模拟信号与数字信号不同的数据必须转换为相应的信号才能进行传输：模拟数据一般采用模拟信号(Analog Signal)，例如用一系列连续变化的电磁波(如无线电与电视广播中的电磁波)，或电压信号(如电话传输中的音频电压信号)来表示；数字数据则采用数字信号(Digital Signal)，例如用一系列断续变化的电压脉冲(如我们可用恒定的正电压表示二进制数1，用恒定的负电压表示二进制数0)，或光脉冲来表示。当模拟信号采用连续变化的电磁波来表示时，电磁波本身既是信号载体，同时作为传输介质；而当模拟信号采用连续变化的信号电压来表示时，它一般通过传统的模拟信号传输线路(例如电话网、有线电视网)来传输。当数字信号采用断续变化的电压或光脉冲来表示时，一般则需要用双绞线、电缆或光纤介质将通信双方连接起来，才能将信号从一个节点传到另一个节点。 (2)模拟信号与数字信号之间的相互转换模拟信号和数字信号之间可以相互转换：模拟信号一般通过PCM脉码调制(Pulse Code Modulation)方法量化为数字信号，即让模拟信号的不同幅度分别对应不同的二进制值，例如采用8位编码可将模拟信号量化为2^8=256个量级，实用中常采取24位或30位编码；数字信号一般通过对载波进行移相(Phase Shift)的方法转换为模拟信号。计算机、计算机局域网与城域网中均使用二进制数字信号，目前在计算机广域网中实际传送的则既有二进制数字信号，也有由数字信号转换而得的模拟信号。但是更具应用发展前景的是数字信号。

分数倍采样率转换中内插与抽取的顺序研究

分数倍采样率转换中内插与抽取的顺序研究摘要：通过理论分析和仿真实验，对分数倍采样率转换分数倍采样率转换过程中的抽取与内插内插的先后顺序进行了研究。关键词：分数倍采样率转换欠采样欠采样过采样过采样运算效率在多抽样率信号处理中，分数倍采样率转换是一类比较重要的应用，对分数倍采样率转换的研究很多[1~4]，L/M倍的抽样率转换通过一个L倍内插和M倍抽取的串联实现。分数倍采样率转换必须先内插再抽取才能保证中间处理过程不丢失信息[1]。但先内插再抽取的弊端是滤波器工作在高采样率下运算效率较低。能否通过先抽取再内插的办法进行分数倍采样率转换呢？本文就是分析分数倍采样率转换过程中内插与抽取的先后顺序是否可以互换。设基带信号基带信号最高频率为fs，原始信号采样率为Nfs，分数倍采样因子为L/M，则采样后信号的采样率为LNfs/M。由奈奎斯特采样定理可知，只要采样率大于奈奎斯特频率，就可以无失真地恢复出原始信号。显然先内插再抽取的方法不会在中间过程造成基带信号的丢失；而采用先抽取再内插的方法，则当N/M≥2即奈奎斯特采样或者过采样时不会造成基带信号的丢失，而当N/M1 欠采样在欠采样下进行分数倍抽样率转换时，如果先抽取，则不满足奈奎斯特采样定理的条件，中间处理过程一定会造成基带信号的丢失，这样再内插后丢失的信号仍然得不到恢复，从而造成采样信号的失真；如果先内插，将采样率提高，再抽取降采样，就可以有效地避免基带信号丢失的现象。因此，在欠采样下进行分数倍抽样率转换，必须先内插再抽取。2 奈奎斯特采样或过采样奈奎斯特采样或者过采样下无论先抽取还是先内插，均满足奈奎斯特采样定理，因此进行分数倍抽样率转换时即可以先抽取再内插，也可以先内插再抽取。下面通过仿真实例来说明在过采样下进行分数倍抽样率转换的情况。设原始采样率48.96MHz，基带信号最高频率为4.08MHz，进行2/3倍抽样率转换，通带纹波Rp=0.5dB，阻带衰减Rs=20dB，通带上限截止频率fp=4.08MHz，阻带下限截止频率fs=5MHz。 2.1 先抽取再内插先三倍抽取再两倍内插的实现框图如图1。其中h1(n)为抗混叠滤波器，h2(n)为去镜像滤波器，可以求得h1(n)的阶数为57阶，h2(n)的阶数为37阶。它们的幅频响应分别示于图2中。 2.2 先内插再抽取先两倍内插再三倍抽取的实现框图如图3。其中，h(n)既是抗混叠滤波器，也是去镜像滤波器，可求得滤波器阶数为113阶，幅频响应如图4。 2.3 运算效率比较图5给出了过采样下原始信号和先抽取再内插以及先内插再抽取后信号的周期图功率谱。从中可以看出，先抽取再内插的方法与先内插再抽取的方法都实现了2/3倍采样率转换。现在再比较一下两种方法的运算效率。用RT*表示每秒所需要的乘法次数(MPS)，用NT表示存储系数和数据所需要的运算量，Ri表示第i级所需要的每秒乘法次数，Ni表示第i级FIR内插滤波器的阶数，Fi表示第i 级滤波器的采样率，I表示多级实现时的总级数，单级实现时I=1。由文献[1]可知：若滤波器为对称的，则利用滤波器的对称性，先三倍抽取再两倍内插每秒所需的乘法次数为：所需的存储量为:N2=113 因此先三倍抽取再两倍内插的运算效率比先两倍内插再三倍抽取的运算效率高。分数倍采样率转换过程中抽取与内插的先后顺序不仅决定是否能正确地采样，还决定着采样率转换运算效率的高低。本文通过理论分析和仿真实验，对这一问题进行了研究。研究结果表明：在欠采样下，进行分数倍抽样率转换必须先内插再抽取；在奈奎斯特采样率或者过采样下进行分数倍抽样率转换时，从信号保持角度看，先抽取再内插和先内插再抽取均可以实现无失真采样；但从运算效率角度看，则应该选择先抽取再内插的方法。

基于MATLAB的语音信号分析与处理系统的设计

数字信号处理大作业基于MATLAB的语音信号分析与处理系统的设计班级：物联网1401 学号：姓名：zk 目录一、设计目的 (2)

二、设计内容及要求 (2) 2.1设计内容 (2) 2.2设计要求 (3) 三、详细设计过程 (3) 3.1语音信号的采集 (3) 3.2 原始语音信号的时域频域分析 (3) 3.3原始语音信号加噪 (5) 3.4设计滤波器 (6) 3.5 MATLAB语音信号处理界面设计 (8) 3.6 利用C语言得出声音带宽 (11) 四、调试结果 (11) 五、结论 (12) 参考文献 (13) 一、设计目的综合运用数字信号处理的理论知识进行频谱分析和滤波器设计，通过理论推导得出相应结论，再利用 MATLAB和C语言作为编程工具进行计算机实现，从而加深对所学知识的理解，建立概念。二、设计内容及要求 2.1设计内容 ①录制一段自己的语音信号（我是物联网1401班的张坤），并对录制的信号进行采样。

②画出采样后语音信号的时域波形和频谱图。 ③给定滤波器的性能指标，采用窗函数法或双线性变换设计滤波器，并画出滤波器的频率响应。 ④利用设计的滤波器对采集的语音信号进行滤波，画出滤波后信号的时域波形和频谱，并对滤波前后的信号进行对比，分析信号的变化，回放语音信号。 ⑤用 MATLAB 设计一信号处理系统界面。 ⑥利用C语言对录制语音信号进行FFT变换（取其中的1024进行），计算出自己声带的带宽。 2.2设计要求 ①学会 MATLAB 的使用，掌握 MATLAB 的程序设计方法。 ②掌握在 Windows 环境下语音信号采集的方法。 ③掌握数字信号处理的基本概念、基本理论和基本方法。 ④掌握 MATLAB 设计 FIR 和 IIR 数字滤波器的方法。 ⑤学会用 MATLAB 对信号进行分析和处理。 ⑥学会用C语言进行FFT程序的编写和算法效果的仿真。三、详细设计过程 3.1语音信号的采集利用PC 机上的声卡和Windows 操作系统实现语音信号的的采集。打开“开始”菜单，选择“程序\附件\娱乐\录音机”项，打开Windows中自带的录音机程序，点击录音机程序界面中的录音按钮，开始声音录制。录完后点击放音按钮,可以实现所录音的重现。以文件名“zhangkun”保存入D:\ 中。文件存储器的后缀默认为.wav ,这是Windows 操作系统规定的声音文件存的标准。 3.2 原始语音信号的时域频域分析利用MATLAB中的“audioread”命令来读入（采集）语音信号，将它赋值给某一向量。再对其进行采样，记住采样频率和采样点数。根据help文档，下面介绍audioread函数三种调用格式。

八位模拟信号转换成数字信号

八位模拟信号转换成数字信号的实验设计报告一、实验目的 1、了解A/D转换的基本知识及ADC0804的工作原理。 2、掌握基本的编程方法。 3、熟练掌握protel画电路原理图及PCB板的方法。 4、掌握运用keil软件编写单片机C语言。二、基本原理 1、所谓A/D转换此就是模拟/数字转换器（ADC），是将输入的模拟信号转换成数字信号。信号输入端可以使传感器或转换器的输出，而ADC输出的数字信号可以提供给微处理器，以便更广泛地应用。 2、AT89S52的基本介绍： AT89S52是一种低功耗、高性能CMOS8位微控制器，具有8K 在系统可编程Flash 存储器，与工业80C51 产品指令和引脚完全兼容，此实验中采用AT89S52芯片。 3、ADC0804的主要技术指标： (1) 高阻抗状态输出(2) 分辨率：8 位(0~255) (3) 存取/转换时间：135 ms/100 ms (4) 模拟输入电压范围：0V~5V (5) 参考电压：2.5V (6) 工作电压：5V 3、ADC0804电压输入与数字输出关系

三、电路原理图

四、原理图接线分析 1、ADC0804芯片主要端口接线原理: (1) (CS )：片选端。与RD、WR 接脚的输入电压高低一起判断读取或写入与否，此实验直接接地让其处于选通状态。 (2) ( RD )：当CS 、RD 皆为低位准(low) 时，ADC0804 会将转换后的数字讯号经由DB7 ~ DB0 输出至其它处理单元。 (3) (WR )：启动转换的控制讯号。当CS 、WR 皆为低位准(low) 时，ADC0804 做清除的动作，系统重置。当WR 由0→1且CS ＝0 时，ADC0804会开始转换信号，此时INTR 设定为高位准(high)。 (4) (CLK IN、CLKR)：频率输入/输出。频率输入可连接处理单元的讯号频率范围为100 kHz 至800 kHz。而频率输出频率最大值无法大于640KHz，一般可选用外部或内部来提供频率。在CLK R 及CLK IN 加上电阻及电容，构成RC振荡电路，则可产生ADC 工作所需的时序，其频率约为：f=1/1.1RC ≈640KHz, (5) ( INTR )：中断请求。转换期间为高位准(high)，等到转换完毕时INTR 会变为低位准(low)告知其它的处理单元已转换完成，可读取数字数据，此实验不用中断控制，接去MCU其中某个引脚。 (6) (VIN(+)、VIN(-))：差动模拟讯号的输入端。输入电压VIN＝VIN(+) －VIN(-)，此图使用单端输入，而将VIN(-)接地，VIN(+)由电位器R1控制其电压从0~5V 变化，产生了模拟量。 (7) (A GND):模拟电压的接地端。 (8) (VREF/2):滑动变阻器R2和R3利用分压原理提供ADC芯片的基准电压。 2、AT89S52芯片主要端口接线原理： (1) XTAL2、XTAL1：晶振电路中电容C2、C3选取30pF。 (2) REST：复位电路中电容C4隔直作用，Urest=R6/(R5+R6)，因为高电平有效，故R5取小阻值1K, R6取小阻值10K. (3) P0：内部无上拉电阻，故接上1K的上拉排阻。 (3)P1：流水灯采用共阳极接法。五、控制原理及实验内容控制原理根据ADC0804芯片主要端口接线原理部分的介绍，工作控制过程可简单描述如下：调节电位器R4产生连续变化的电压值，ADC0804启动转换，产生与之对应的信号送到单片机中，其高低电平从而控制D1~D8发光二级管的亮灭，这就实现了模拟信号（连续的电压值）到数字信号（高低电平1、0）的转换。

基于FPGA的音频处理系统设计(毕业设计开题报告)

基于FPGA的音频处理系统设计 1 课题来源：随着数字记录技术和大规模集成电路技术的迅速发展,消费类电子产品正以日新月异的新姿展现在当代人的面前,音响类娱乐产品的多样化、小型化与数字化及品种的琳琅满目丰富了音响产品市场,满足了多层次消费者的不同需要。在这些科技产品的快速发展过程中，数字音频技术在其中扮演着重要的角色。现在音频处理技术的任务越来越复杂,对信号处理的效果要求不断提高,音频处理技术的算法也越来越复杂，要求在几十ms甚至几ms的时间内完成音频信号大量的数据采集、处理、存储、传输,这就对音频处理系统处理器的运算速度提出了更高的要求。 2 研究的目的和意义：随着消费电子的快速发展，数字音频技术的应用显得越来越重要，对数字音频技术的研究符合市场与科技需求。数字音频处理技术涉及生活的方方面面,包括滤波器技术、数字信号处理、人工智能、模式识别、编码学、等多个学科的知识,是信息化技术类学科当中发展极为迅速的一个方向之一。音频信号处理技术包含的内容非常多,主要有信号存储、语音合成、语音识别、音频压缩、语音理解、音频编码、语音识别、语音增强等多个分支,总而言之,音频信号处理技术包括音频信号的数字化处理、数字化实现、数字化变换、数字化存储、数字化传播、及音频的变换、语音的处理、语音的识别等自然科学多个领域的综合运用。传统的数字滤波器采用乘法和累加结构,需要进行多次的乘法和加法运算。由于乘法器庞大的结构,占用了系统芯片上的大部分面积,消耗了大部分功率,使得音频处理系统在体积和处理速度上存在着不足,所以传统的数字滤波器不能很好的满足家用和便携式音频处理器对体积小、功耗小信号处理速度高的要求。而近些年来使用范围越来越广泛，技术越来越成熟的FPGA器件对于解决对于解决音频信号的高标准、高要求有着其独特的优势。基于FPGA器件的音频信号处理的实现方案,在于对声音信号的收集、处理及应用,工作的重点是在噪声环境中如何

数字信号处理实验报告

前言《数字信号处理》是信息电子，通信工程等本科专业及其他相近专业的一门专业必修课。通过本课程的学习，学生应掌握以下基本概念、理论和方法：采样定理、离散序列的变换、离散信号的频谱分析；离散系统的传递函数、频率响应、离散系统的基本分析方法；数字滤波器的设计理论、滤波器的软件实现；离散傅立叶变换理论、快速傅立叶变换方法；有限字长效应。为了使学生更好地理解和深刻地把握这些知识，并在此基础上，训练和培养学生掌握离散系统的基本概念和分析方法，数字滤波器的设计和实现，以及如何利用快速傅立叶变换等DSP技术对数字信号进行分析、滤波等处理，设置了以下三个实验：（1）离散时间序列卷积和MATLAB实现；内容：使用任意的编程语言编制一个程序，实现两个任意有限序列的卷积和。目的：理解线性非移变系统I/O关系和实现要求：掌握使用计算机实现数字系统的方法（2）FFT算法的MATLAB实现；内容：使用MATLAB编程语言编制一个程序，实现任意有限序列的FFT。目的：理解FFT算法的意义和实现要求：掌握使用计算机实现FFT算法的方法（3）数字滤波器的设计；内容：使用MATLAB编程语言编制一个程序，实现FIR或IIR滤波器的设计目的：理解数字滤波器的设计技术要求：掌握使用计算机进行数字滤波器设计的方法（4）窗函数设计FIR滤波器；内容：使用MATLAB编程语言编制一个程序，实现FIR或IIR滤波器的设计目的：理解数字滤波器的设计技术要求：掌握使用计算机进行数字滤波器设计的方法该实验指导书是参照该课程的教学大纲而编制的，适合于信息电子工程、通信工程等本科专业及其他相近专业。

语音信号变声处理系统

数字信号处理课程设计报告课设题目：语音信号变声处理系统学院：信息与电气工程学院专业：电子信息工程班级：1102502 姓名：王珂学号：110250217 指导教师：周志权、赵占锋哈尔滨工业大学（威海） 2015年1月5日

1.设计任务电视台经常针对某些事件的知情者进行采访，为了保护知情者，经常改变说话人的声音，请利用所学的知识，将其实现。（1）自己录制一段正常的声音文件，或者通过菜单选择的方式选择一段正常声音文件；（2）能够播放该文件；（3）对语音信号进行处理，要求处理后的语音信号基本不影响正常收听与理解；（4）对处理参数能够通过matlab 界面进行调节，以对比不同处理效果；（5）能够对处理后的声音文件与原始声音文件的频谱进行观察、分析。（6）编制GUI 用户界面。 2.课程设计原理及设计方案语音科学家将人类发声过程视作一个由声门源输送的气流经以声道、口、鼻腔组成的滤波器调制而成的。人类语音可分为有声语音和无声语音，前者是由声带振动激励的脉冲信号经声腔调制变成不同的音，它是人类语言中元音的基础，声带振动的频率称为基频。无声语音则是声带保持开启状态，禁止振动引发的。一般来说，由声门振动决定的基频跟说话人的性别特征有关，如下表，而无声语音则没有体现这个特征。说话人的个性化音色和语音的另外一个声学参数——共振峰频率的分布有关。儿童由于声道短，其共振峰频率高于成年人，成年女性的声道一般短于成年男性，所以女性的共振峰频率一般高于男性。在进行性别变声时，主要考虑基频和共振峰频率的变化。当基频伸展，共振峰频率也同时伸展时，可由男声变成女声，女声变成童声；反之，基频收缩，共振峰频率也同时收缩时，则由童声变女声，女声变男声。为了获得自然度、真实感较好的变声效果，基频和共振峰频率通常必须各自独立地伸缩变化图1基频和共振峰频率分布的变化共振峰频率的改变是基于重采样实现的，从重采样原理知道，这也同时引发了基频的变化，为保证基频变化和共振峰频率变化的独立、互不相关，

采样频率的选取

采样频率的选取采样的过程就是从连续的时间信号中，每隔一定时间间隔抽取一个样本数值，得到一系列样本值构成的序列。设有一连续信号()f t ，对其进行采样的过程可以看成是由原信号()f t 与一抽样脉冲序列()s t 相乘的结果，抽样信号以()s f t 表示，则有如果()s t 各脉冲的时间间隔为s T ，则2/s s T ωπ=，其傅里叶变换为其中，n S 为()s t 的傅里叶系数，有设()F ω为信号()f t 的傅里叶变换，那么根据频域卷积定理可得抽样信号()s f t 的傅里叶变换()s F ω为由上式可知，抽样信号()s f t 的频谱()s F ω是一个周期性的连续函数，它是由信号()f t 的频谱函数()F ω以抽样角频率s ω为间隔周期重复而得到的，但是在重复的过程中()s F ω的幅度被()s t 的傅里叶系数n S 加权。由于n S 只是n 而不是ω的函数，所以()F ω在重复过程中，形状不会发生变化。抽样函数()s t 可以是不同的函数，如单位冲击序列、矩形脉冲序列，但是分析方法是相同的，这里以单位冲击序列为例进行分析。此时由于单位冲击序列傅里叶变换的系数为1/n s S T =，代入上式，则有

该式表明，由于n S 是常数，所以()s F ω是()F ω以s ω为周期等幅重复。原信号的频谱()F ω与抽样信号的频谱()s F ω之间存在如下关系：(1)在()s F ω中完整地保留了()F ω；(2) ()s F ω和()F ω在幅度上相差一个系数1/s T 。只有在符合一定条件的情况下，上述结论才是正确的，这个条件就是采样定理。设()f t 为频带受限信号，其频谱函数只在有限区间(,)m m ωω-内为有限值，在此区间外为零。那么，只有当采样间隔s T 不大于1/2m f (其中2/m s f πω=)时，信号()f t 可以用等间隔的抽样值()s f nT 唯一地表示，这就是所谓的奈奎斯特采样定理。如果采样间隔s T 不够小，以至于2s m ωω<，那么在()F ω以s ω为周期重复时将发生重叠现象，从()s F ω中取出任一个周期，都是失真了的()F ω，也就是发生了频谱混叠。根据上述分析，为了能从抽样信号中无失真地恢复出原信号，必须满足两个条件：(l)信号()f t 应是频带受限的，其频谱函数在m ωω>时为零； (2)抽样频率不能过低，应有2s m ωω>，或者说抽样间隔不能太大，要求1/2s m T f <。多数实际信号并不是频限信号，所以无论如何选择T ，抽样信号的傅里叶变换都会发生混叠现象，因此只能适当选择T ，以使混叠程度能为实际工程问题所接受。假设系统的带宽为50MHz ，如果忽略更高频的成分，可以近似认为进入到A/D 转换器的信号最高频率为50MHZ ，所以仪器的采样频率不能低于100MHz ，否则将发生频谱混叠，混叠发生后，相当于引起了信号高频成分的损失，在时域中脉冲发生了展宽，也就是引起了盲区的扩大。单纯从盲区的角度来说，采样频率越高，盲区就会越小。但是如果采样频率过高，产生的数据量就会非常大，将会使后面数据存储、数据分析的工作量急剧增加。当被测光纤比较长时，对测距精度的要求低于短光纤，也就是仪器能够接受程度更强一些的频谱混叠，所以可以采用更低的采样频率。本设计采用两种采样频率，对于较短的光纤(小于或等于4km)，仪器采用1000MHz 的采用频率，对于光纤(小于16kfn 或大于4km)，仪器采用100MHz 的采用频率，对于长光纤(大等于16km)，仪器采用12.5MHZ 的采样频率。系统的带宽是50MHZ 并不意味着50MHZ 以上的频率成分为零，所以严格说来，不但用12.5MHz 的采样频率是不够的，即使是100MHZ 甚至更高的采样频率也还是会发生频谱的混叠。大于16km 时采用12.5MHz 的采样频率是将硬件存储空间和计算机的处理速度作为主要矛盾，而不是把带宽和距离分辨率作为主要矛盾的结果。无论是100MHZ 还是12.5MHZ 的采样频率，都是综合考虑了实际需求是否能够接受和软硬件条件是否能够达到后，采取的折衷选择。

数字信号转换为模拟信号实验

一、实验目的熟悉数模转换的基本原理，掌握D/A的使用方法。二、实验内容利用D/A转换器产生锯齿波和三角波。三、实验原理图本实验用A/D、D/A电路四、实验步骤 1、实验接线 CS0 ?CS0832 示波器?DOUT DS跳线：1 ?2 2、用实验箱左上角的“VERF.ADJ”电位器调节0832的8脚上的参考电压至5V。 3、调试程序并全速运行，产生不同波形。 4、用示波器观察波形。五、实验提示利用电位器“ZERO.ADJ”可以调零，“RANGE.ADJ”电位器调整满偏值。 DAC0832在本实验中，工作在双缓冲接口方式下。当地址线A1=0时可锁存输入数据；当A1=1时，可起动转换输出。所以要进行D/A转换需分二步进行，方法如下： MOV DX，ADDRESS ；ADDRESS片选信号偶地址 MOV AL，DATA OUT DX，AL ADD DX ，2 OUT DX，AL 六、程序框图程序一产生锯齿波程序二产生三角波 (实验程序名：dac-1.asm) (实验程序名：dac-2.asm)

七、程序源代码清单 dac-1.asm assume cs:code code segment public org 100h start: mov dx,04a0h up1: mov bx,0 up2: mov ax,bx out dx,ax ;锁存数据 mov dx,04a2h out dx,ax ;输出使能 mov dx,04a0h inc bx ;数据加一 jmp up2 code ends end start dac-2.asm assume cs:code code segment public org 100h start: mov dx,04a0h mov bx,0 up: mov ax,bx out dx,ax ;锁存数据 mov dx,04a2h out dx,ax ;输出使能 inc bx

数字信号处理实验内容音频信号分析与处理

数字信号处理实验内容—— 音频信号采集、分析及处理一、实验目的 1.以音频信号为例，熟悉模拟信号数字处理过程，进一步理解数字信号处理概念。 2.掌握运用Matlab实现对音频信号的时频分析方法； 3.初步掌握数字音频信号合成的方法。 4.掌握运用Matlab设计IIR和FIR滤波系统的方法； 5.掌握运用Matlab实现对加噪的音频信号进行去噪滤波的方法。锻炼学生运用所学知识独立分析问题解决问题的能力，培养学生创新能力。二、实验性质综合分析、设计性实验三、实验任务实验内容一：windows系统中的“ding”音频信号的采集、分析、合成

1.音频信号的采集编写Matlab程序，采集windows系统中的“ding”声，得到*.wav音频文件，而后实现音频信号回放。 2.音频信号的频谱分析运用Matlab软件实现对音频信号的时域分析和频域分析，并打印相应的图形，完成在实验报告中。注意：此音频信号的频谱包含两条主要谱线，在进行频谱分析时，注意频谱的完整性，利用MATLAB实现对两条主要谱线的定位并计算谱线所对应的模拟频率。 3.音频信号的分解和合成运用Matlab软件实现音频信号的分解与合成，将音频信号的频谱中两部分频谱成分进行分解，分别绘制出分解后的两个信号的频谱图；然后将分解后的两个信号再合成为一个新的信号，将合成后的新信号的时域、频域图与原来的信号时域、频域图相比较，绘制出对比效果图。 4.音频信号的回放运用Matlab软件实现音频信号的回放，将合成后的新信号和原音频信号分别进行回放，对比两个信号的声音效果。

5.音频信号分段傅里叶分析（选作）分析对一般音频.wav信号进行一次性傅里叶分析时存在的主要问题，利用分段傅里叶变换对该音频信号重新分析并合成。对比一次傅里叶分析结果并进行总结。实验内容二：任意音频信号的时域和频域分析及数字滤波器设计 1.音频信号的采集音频信号的采集可以通过Windows自带的录音机也可以用专用的录制软件录制一段音频信号（尽量保证无噪音、干扰小），也可以直接复制一段音频信号（时间为1s），但必须保证音频信号保存为.wav的文件。 2.音频信号的时域、频域分析运用Matlab软件实现对音频信号的打开操作以及时域分析和频域分析，并画出相应的图形，打印在实验报告中。 3.引入干扰信号在原有的音频信号上，叠加一个频率为100KHz的正弦波干扰信号（幅度自定，可根据音频信号幅度情况而定）。 4.数字滤波器设计