MP3音频编解码技术标准
mp3音频格式解析

解析MP3音频格式一、概述MP3 文件是由帧(frame)构成的,帧是MP3 文件最小的组成单位。
MP3的全称应为MPEG1 Layer-3 音频文件,MPEG(Moving Picture ExpertsGroup)在汉语中译为活动图像专家组,特指活动影音压缩标准,MPEG音频文件是MPEG1 标准中的声音部分,也叫MPEG 音频层,它根据压缩质量和编码复杂程度划分为三层,即Layer-1、Layer2、Layer3,且分别对应MP1、MP2、MP3 这三种声音文件,并根据不同的用途,使用不同层次的编码。
MPEG音频编码的层次越高,编码器越复杂,压缩率也越高,MP1 和MP2 的压缩率分别为4:1 和6:1-8:1,而MP3 的压缩率则高达10:1-12:1,也就是说,一分钟CD 音质的音乐,未经压缩需要10MB的存储空间,而经过MP3 压缩编码后只有1MB 左右。
不过MP3 对音频信号采用的是有损压缩方式,为了降低声音失真度,MP3采取了“感官编码技术”,即编码时先对音频文件进行频谱分析,然后用过滤器滤掉噪音电平,接着通过量化的方式将剩下的每一位打散排列,最后形成具有较高压缩比的MP3 文件,并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。
名词解释:比特率是指每秒传送的比特(bit)数。
单位为bps(Bit Per Second),比特率越高,传送的数据越大。
比特率比特率表示经过编码(压缩)后的音、视频数据每秒钟需要用多少个比特来表示,而比特就是二进制里面最小的单位,要么是0,要么是1。
比特率与音、视频压缩的关系,简单的说就是比特率越高,音、视频的质量就越好,但编码后的文件就越大;如果比特率越少则情况刚好相反。
采样率(也称为采样速度或者采样频率)定义了每秒从连续信号中提取并组成离散信号的采样个数,单位用赫兹(Hz)来表示。
采样频率的倒数是采样周期(也称为采样时间),它表示采样之间的时间间隔。
音频编解码技术的介绍和应用

音频编解码技术的介绍和应用音频编解码技术介绍随着数字化时代的到来,音频编解码技术变得越来越重要。
它是数字音频信号从一种格式转换成另一种格式的过程,使得数字音频信号在各种设备之间的传输和处理变得更加便捷。
这种技术的核心原理在于,通过压缩不重要的数据并保留重要的数据,从而使得数字音频文件的大小变小,同时又能保证较高的音质。
音频编码技术的种类目前,市面上常用的音频编码技术有多种,其中比较常见的有以下几种:MP3编码技术:是一种最为流行、广泛应用的压缩技术,主要针对音乐类型文件进行压缩。
AAC编码技术:由电信公司根据MPEG-2/MPEG-4音频标准开发而成,可以实现高质量和低码率的平衡,可以用于存储和广播音频。
FLAC编码技术:一种非常常见的格式,主要针对无损音频的存储和播放,压缩比较大,但是音质非常高。
WAV编码技术:是一种无损音频文件格式,存储文件比较大,但是保证了高品质音频传输。
音频编码技术的应用音频编码技术广泛应用于许多领域,其中最为常见的应用是:1. 互联网音乐在互联网音乐行业中,音频编码技术起着至关重要的作用。
通过将音乐压缩成不同的格式,可以将音乐文件大小缩小,从而使得音乐在不同平台上的分发更加便捷。
而且,很多音乐平台支持多种格式的音频文件播放,这也为用户提供了更多的选择。
2. 计算机音频音频编码技术也可以应用于计算机音频领域。
通过将音频文件压缩成适当的格式,并存储在计算机硬盘上,可以使得音频文件在计算机上播放更加流畅。
而且,这种技术还可以减少存储空间的占用,让用户有更多的空间来存储其他文件。
3. 智能音箱随着智能家居的普及,智能音箱作为智能家居的重要组成部分,其应用前景也越来越广阔。
通过音频编码技术的应用,智能音箱能够对音频信号作出适当的响应,同时也可以将存储在云端的音频文件传输到智能音箱上,从而实现智能音箱的语音控制,如点播音乐等。
4. 音频传输在音频传输领域,音频编码技术也有着广泛的应用。
mp3是什么东西

MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)。
简而言之,它是一种音乐文件/音频文件的压缩格式。
它是在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。
MP3是标准是MPEG-1国际标准中音频压缩层3的简称,单声道比特率一般取64kbps,在采样率44.1kHz的情况下,其压缩比可达12倍以上,是得到最高认知度的编解码器之一,被广泛应用于互联网。
MP3是利用音频压缩技术,将声音用1:10甚至1:12的压缩率压缩成容量较小的文件,可以保持较好的音质。
由于这种压缩方式的全称叫MPEGAudioLay er3,所以人们把它简称为MP3。
以MP3形式存储的音乐就叫作MP3音乐,能播放MP3音乐的设备就叫作MP3播放器
下载mp3可以用flashget或者其他下载工具下载。
常见的音频编码标准

常见的音频编码标准在自然界中人类能够听到的所有声音都称之为音频,它可能包括噪音、声音被录制下来以后,无论是说话声、歌声、乐器都可以通过数字音乐软件处理。
把它制作成CD,这时候所有的声音没有改变,因为CD本来就是音频文件的一种类型。
而音频只是储存在计算机里的声音。
演讲和音乐,如果有计算机加上相应的音频卡,我们可以把所有的声音录制下来,声音的声学特性,音的高低都可以用计算机硬盘文件的方式储存下来。
反过来,我们也可以把储存下来的音频文件通过一定的音频程序播放,还原以前录下的声音。
自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码。
PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
然而,3G网络带来了移动多媒体业务的蓬勃发展,视频、音频编解码标准是多媒体应用的基础性标准,但其种类较多,有繁花渐欲迷人眼之感。
那么常见的编码技术就是我们必须知道的,下面我们介绍一下最常见的编码技术。
1.PCMPCM 脉冲编码调制是Pulse Code Modulation的缩写。
PCM编码的最大的优点就是音质好,最大的缺点就是体积大。
我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。
2.W A VWA V是Microsoft Windows本身提供的音频格式,由于Windows本身的影响力,这个格式已经成为了事实上的通用音频格式。
实际上是Apple电脑的AIFF格式的克隆。
通常我们使用W A V格式都是用来保存一些没有压缩的音频,但实际上W A V格式的设计是非常灵活(非常复杂)的,该格式本身与任何媒体数据都不冲突,换句话说,只要有软件支持,你甚至可以在W A V格式里面存放图像。
之所以能这样,是因为W A V文件里面存放的每一块数据都有自己独立的标识,通过这些标识可以告诉用户究竟这是什么数据。
在WINDOWS 平台上通过ACM(Audio Compression Manager)结构及相应的驱动程序(通常称为CODEC,编码/解码器),可以在W A V文件中存放超过20种的压缩格式,比如ADPCM、GSM、CCITT G.711、G.723等等,当然也包括MP3格式。
MP3标准

少;霍夫曼解码采用了树型搜索的快速算法;在反量化模块中
进行大小值分块处理,使得在被处理值动态范围较大的情况
下,也能维持良好的量化精度;在反量化、立体声处理、子
带合成滤波器、混叠抵消和 IMDCT 这几个容易引入量化误
差的模块采用了 32 比特的量化与运算精度,保证解码质量。
表 1 解码各模块运算量分析表
89.37
44.1
128
5.5
3.1
89.11
∑ 表 3 中, Error-bit= 1 N
log2 (| PCM wave[i] − PCM mp3[i] |)
∑ ∑ SNR(dB)=10 × Log10
PCM mp3[i]2 (PCM mp3[i] − PCM wave[i]2
其中 N 取 1 152。
2 MP3 解码算法分析及软件系统优化
MP3 解码流程的具体算法说明见参考文献[1,2]。 表 1 是 C 语言 MP3 解码算法的复杂度分析。 程序的解码算法的子带合成滤波器部分占相当大的比 重,所以对其采用以 LeeDCT 为基础的改进型快速算法,这
Байду номын сангаас
样将运算量减至原来的 1/3 左右,存储空间的需求也大为减
我们对最常用的 44.1kHz 采样率,64kbps 和 128kbps 比
特率音频流的测试数据如表 3。
—206—
图 3 Wave 输出数据波形图
图 4 MP3 解码器输出数据波形图
表 3 测试数据
采样率(kHz) 比特率(kbps) 压缩率 Error Bit SNR(dB)
44.1
64
11
2.9
MP3 是 MPEG1-Lay3 的缩写。MPEG-1 是从 1988 年开 始制定的,在 1992 年末最终以 ISO/IEC 标准 IS 11172 [1]确定 下来。其中 11172-3 描述的是音频系统。MPEG-1 音频标准 包括了 3 种操作模式,称为 Layer-1、Layer-2、Layer-3,其复 杂度和性能是依次提升的。MPEG-1 Layer-3 最为复杂,但是 能以低比特流速率提供最好的声音性能。MPEG-1 Layer 3 这 个标准是建立在现代感知音频编码的技术上的,充分考虑到 人耳的特性。因而能够从一个原始 CD 音频中压缩 12 倍的音 频数据而不损失丝毫声音品质。由于它的高质量、低比特率 工作特性,在 Internet 音频、数字音频广播中等得到了广泛 的应用。
数字音频播放器的数据解码技术

数字音频播放器的数据解码技术数字音频播放器是一种电子设备,可以播放以数字化形式存储的音频文件。
这类设备通常采用数字音频解码技术,将数字信号还原为模拟音频信号,以便人们可以欣赏高质量的音乐。
本文将介绍数字音频播放器的数据解码技术。
一、数字音频的存储格式在了解数字音频播放器的数据解码技术之前,先了解数字音频的存储格式是很重要的。
目前常见的数字音频存储格式有"mp3"、"wav"、"flac"等。
这些格式都是以二进制的形式存储音频数据,不同的格式有不同的数据压缩和编码方式。
二、数据解码技术数字音频播放器通过数据解码技术将音频文件还原为模拟音频信号。
下面介绍几种常见的数据解码技术。
1. 脉冲编码调制(PCM)PCM是一种常用的数据解码技术,它将模拟音频信号通过采样和量化转换为数字信号。
在数字音频播放器中,PCM解码器可以将压缩的音频数据还原成原始的数字音频信号。
PCM解码技术的主要优点是还原度高,音质效果好,但是它的数据量相对较大。
2. 压缩解码技术为了减小音频数据的存储空间,数字音频播放器常采用压缩解码技术。
目前比较常见的压缩音频格式有"mp3"和"flac"等。
这些压缩技术可以有效地减小音频数据的体积,但在解码过程中会有一定的音质损失。
因此,压缩解码技术需要平衡音质和存储空间之间的关系。
3. 数字信号处理技术数字音频播放器还可以通过数字信号处理技术对音频信号进行处理和增强,以提高音质效果。
这类技术包括均衡器、声场模拟、环绕音效等。
数字信号处理技术通过算法对音频信号进行调整和优化,使人们可以享受到更加丰富和逼真的音乐体验。
三、数字音频播放器的工作原理了解了数字音频播放器的数据解码技术,下面简要介绍数字音频播放器的工作原理。
1. 数据读取数字音频播放器首先需要将存储在存储介质(如闪存卡、固态硬盘等)上的音频文件读取到内存中。
mp3 编码原理

mp3 编码原理MP3是一种音频压缩技术,其全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III),简称为MP3。
它被设计用来大幅度地降低音频数据量。
利用MPEG Audio Layer 3 的技术,将音乐以1:10 甚至1:12 的压缩率,压缩成容量较小的文件,而对于大多数用户来说重放的音质与最初的不压缩音频相比没有明显的下降。
以下是MP3编码的基本原理:1. 采样:这是音频编码的第一步。
MP3在创建时,会以160000Hz的频率对音频信号进行采样。
这意味着每秒钟会获取160000个样本。
2. 量化:在采样后,每个样本都会被转化为一个数字。
在MP3中,这个数字的范围是-32768到32767。
这个过程被称为量化。
3. 编码:量化后的数据需要进行编码,才能被计算机理解和存储。
在MP3中,使用了Huffman编码和Run-Length Encoding(RLE)等压缩技术。
4. 心理声学模型:这是MP3编码中最核心的部分。
通过使用心理声学模型,MP3编码器可以预测哪些频率和声音人类难以察觉,从而进一步压缩数据。
5. 压缩:经过心理声学模型处理后,音频数据会被进一步压缩,以减少存储空间的需求。
6. 解码:当播放MP3时,解码器会逆转上述过程,从压缩的音频数据中还原出原始的音频信号。
7. 解码器:最后,音频信号会被送入扬声器或其他设备进行播放。
需要注意的是,这个过程是一个复杂且精细的过程,涉及到许多数字信号处理和心理学知识。
尽管如此,它仍然是现代音频编码的基础之一,影响了许多其他的音频编码和压缩技术。
MP3编码算法分析

文章编号:1008-1402(2005)01-0064-04①MP3编码算法分析马昌萍, 宋 丹, 马幼鸣(北京理工大学电子工程系,北京100081)摘 要: MPEG-I 标准中规定了三层压缩方案,分别称为层1、层2和层3.层1方案实施起来最简单,但是压缩后的音质不如其它两层好;层3方案,即MP3编码,在低比特率时能得到最好的音质,由MP3编码的音乐文件适合在互联网上广泛传播,因此深受欢迎,但是它算法复杂,实施起来难度最大.本文通过介绍MPEG-I 标准中层3的数字音频编码方案,详细地分析了MP3算法中所采用的子带编码、心理声学模型和哈夫曼编码等关键技术,给出了实现上述关键技术的具体步骤,并且进一步提出了可以对编码方案进行细化的可行性建议,用以提高编码效率.关键词: MP3;MPEG-I ;数字音频中图分类号: T N919.81 文献标识码: A0 引 言近年来,MP3播放器倍受人们的青睐,它音质出色、外形小巧、携带方便、存储量大,可以存储十几首到几十首歌曲.人们很容易就可以从互联网上下载到适合播放的几乎任何曲目,也可以将存储在光盘中的MP3或者C D 歌曲拷贝到播放器中播放.带着它就可以随时随地欣赏美妙的音乐了.MP3播放器之所以既具有出色的音质又有大的存储容量,是MP3这种数字音频编码带给我们的好处.MP3是一种数字音频的编解码方式,它是活动图像专家组MPEG (M oving Pictures Experts G roup )在1992年制定的具有1.5Mbit/s 数据传输率的数字存储媒体运动图像及其伴音MPEG-I 的标准草案中音频编码的一部分.MPEG-I 音频压缩标准[1](IS O11172)提供了一种高保真度,高压缩比的压缩算法.在这个标准中,描述了具有不同复杂度和性能的子带音频编码方案,以适应各种高音质数字音频的应用.根据编码计算复杂度及编码效率的不同,分为层1、层2、层3三种标准,分别简称为MP1,MP2,MP3.层次越高编码后的音乐质量越好,压缩率越高,而编码算法也越复杂,对计算机的计算能力要求也就越高.MP3能用尽可能低的比特率实现C D 音质的音乐而不会出现数据的损失.如果对一段声音数据不压缩的话,那么每存储一秒钟的16比特、44.1kH z 抽样的C D 格式的声音记录,每声道要高达760kb/s 的比特率.而通过MP3音频编码算法的压缩,我们可以把存储空间压缩到原来的十二分之一,而不会降低声音的质量.MP3编码之所以能够实现主要得益于对人的听觉特性的研究和编码技术的发展.MP3与MP1,MP2基本原理相同,都是基于人的心理声学模型,利用听觉掩蔽效应达到压缩数字音频信号的目的,而且MP3采用了许多的关键技术,包括子带编码技术,FFT ,M DCT ,非均匀量化编码,哈夫曼编码技术等.MP1,MP2的编码和解码已经进入实用化阶段,但是,由于MP3的算法复杂度高,计算量大,而且复杂度的增加主要体现在编码上(对解码器而言,只是提高了对存储容量的要求和少量的计算复杂度),MP3的编码一直是许多人研究的课题.本文将对MP3的编码过程做深入的探讨,主要涉及MP3编码各个模块的实现.1 MP3编码过程概述MP3的编码框图如图1所示,从整体来看,MP3编码算法流程刻大致分为时频映射(包括子带滤波器①收稿日期:2004-11-12作者简介:马昌萍(1977-),女,黑龙江人,北京理工大学,硕士研究生. 第23卷第1期 佳木斯大学学报(自然科学版) Vol.23No.1 2005 年01月 Journal of Jiamusi University (Natural Science Edition ) Jan. 2005组和M DCT ),心理声学模型,量化编码(包括比特和比例因子分配和哈夫曼编码)等三大功能模块,计算都十分复杂,实现MP3编码的关键也在于这三个功能模块.在MP3编码中,输入的数字音频信号即PC M 采样信号进入子带滤波器组后,被分成32个子带信号,M DCT (改进离散余弦变换)把子带的输出在频域里进一步地细分成18个频线,这样共产生576个频线.然后利用IS O11172标准中建议的心理声学模型计算出子带信号的信掩比,根据这些信掩比决定分配给576个频线的比特数,分别对他们进行比特分配和可变步长量化.量化后的样值再经过无失真的哈夫曼编码,以提高编码效率,并与比特分配和量化产生的边信息一起组成一帧数据.MP3编码的一帧数据包括两个组,每组有576个频线和与他们相关的边信息,边信息被存储在每一帧的帧头中.对这样一帧一帧组成的比特流,MP3解码器可以独立的进行解码,而不需要额外的信息了.图1 MP3编码框图图2 混合滤波器组 图3 子带滤波器组流程 2 混合滤波器组这部分包括子带滤波器组和M DCT 两部分.子带滤波器组编码完成样本信号从时域到频域的映射,并将规定格式的数字音频信号(若采样频率是44.1kH z ,样本量化为16位,则编码比特率为16×44100bit/s ,若是立体声,则码速率加倍为1.41Mbps ,即C D 格式音乐的比特率)分解成32个子带输出.子带分析滤波器组的32个子带是等带宽的,而由心理声学模型得出的临界带宽则不是等带宽的,所以分析滤波器的带宽与人耳听觉上的临界频带划分并不匹配.为了使得进行编码的各比例因子带与临界频带相匹配,需要对56第1期马昌萍等:MP3编码算法分析每个子带信号做M DCT 变换,从而提供更精细的频率分辨率;将子带滤波器组的输出送到M DCT 滤波器组后,每组将细分为18条频线,共产生576条频线,这对处理稳态信号能获得最大的编码增益,而且通过M DCT 进一步细分后,就可以做相应处理以减小多相滤波器组带来的频率混叠[2].子带滤波器由32个FIR 型BPF 组成,每个BPF 的长度为512点.因此实际上是用一个32×512的变换矩阵C 将输入序列{X i }中的连续512个数据点所构成的输入矢量X ,变换成一个具有32个分量的输出矢量S.其中S 的32个数据点S K 按子带频率从低到高的顺序排列.子带分析滤波器组算法步骤如下:将PCM 采样音频信号以32个为一组输入一个长度为512的X 向量缓冲区,构造一个具有512个元素的矢量空间X (如图2所示[3]);然后用矢量C 对X 加窗,得到矢量Z ,其中C i 在标准中给出;512维矢量Z 被分成8个64维矢量Y i ,然后将8个矢量相加得到矢量Y ;最后对Y 进行变换从而得到32个子带信号,计算公式如图3所示,其中M ik =cos [(2i +1)(k -16)π/64][4].通过心理声学模型可以得到每节数据的编码块类型,子带滤波器组对不同块类型的输出有不同的计算矩阵(已在MPEG-I 标准中给出),即不同的窗口类型:长窗、开始窗、结束窗和短窗.对子带滤波器组的输出加窗后,再进行M DCT 变换,这样可以有效的控制前回声[1].3 心理声学模型基于掩蔽效应的心理声学模型是MPEG-I 音频标准得以实现数据压缩的理论基础.MPEG -I 标准中提供了两种心理声学模型,第一种模型计算简单,在高比特率编码时提供适当精度;第二种模型较为复杂,推荐在较低比特率编码的情况下使用.两种模型都可用于MP3的编码,但MPEG -I 建议在MP3编码中使用心理声学模型二.心理声学模型的目的就是求出各个子带的掩蔽域值,并以此控制量化过程.心理声学模型实现过程一般是先用FFT 求出信号的频谱特性,根据频谱特性找出各频率点上的音调成分和非音调成分(或称噪音成分);根据掩蔽域曲线确定各个音调成分和非音调成分在其它频率点的掩蔽域值;最后求出各频率点的总体掩蔽域,并折算到编码子带中.对于子带滤波器组输出的谱值量化后产生的噪声,如果能够被控制在掩蔽域值以下,则最终的压缩数据被解码后的结果与原始信号可以不加区分[5].一个给定信号的掩蔽能力取决于它的频率和响度,所以心理声学模型的最终输出是信掩比S MR (signal -to -mask ra 2dio ),即信号强度与掩蔽域值的比率.4 量化编码在MPEG-I 标准中用一个三层迭代的循环模型,见图4,对经过M DCT 后输出的样本进行比特分配和量化.图4 三层迭代模型最高一级称为帧循环,它首先复位所有的迭代变量,计算能够提供给每节数据的最大比特数,然后调用外层迭代模型;外层迭代模型首先调用内层迭代循环,内层迭代循环对输入矢量进行量化,通过递增量化步长使量化输出能够在一定的比特位数限制之内被编码.然后确定哈夫曼编码表的选择,并对量化频谱进行哈夫曼编码.哈夫曼编码对量化的最大值有限制,MPEG -I 规定最大值不超过8191.所以要判断所有的量化值是否超过限定,如果超过最大限制,内层迭代循环递增量化步长,重新量化.然后确定哈夫曼编码的位数,使其所占的比特数小于由帧循环计算出的每节编码所能提供的最大比特数,否则也要增加量化步长重新量化.如果经过量化产生的噪声过大,有可能导致样本失真,无法被正确解码,所以外层迭代循环根据内层输出来检测每个比例因子频段的量化噪声,如果超过了允许的最低掩蔽域值,则以比例因子为迭代变量,不断递增其值,重新调用内层迭代循环,使量化满足要求.满足要求后,存储每个比例因子频段最终的比例因子数值,跳出外层迭代循环.在帧循环中计算存储每节数据所用的比特位数.66佳木斯大学学报(自然科学版)2005年在内层迭代中采用了哈夫曼编码是为了消除信号中的冗余,提高编码的效率.在MP3编码标准中,提供了32个哈夫曼码表用于对量化后的信号进行哈夫曼编码,使得编码的码率大大降低.哈夫曼表的选择是根据量化值的最大值以及信号的统计特性来决定的.经量化编码的信号同边信息一起组成一帧数据,并以帧流的形式存储或传输.5 结论与展望以上有重点的介绍了MP3的编码过程,可以看出MP3编码引入了混合滤波器组、心理声学模型、非均匀量化和哈夫曼编码等技术,提高了编码效率和质量,同时降低了编码率.MP3的编码过程比较复杂,仅仅根据MPEG-I 标准中所给的公式进行计算的话,显然效率还不够高.在对MP3编码有了深入的理解之后我们看到,在经过子带滤波器和M DCT 变换后,对信号的量化和哈夫曼编码中,只考虑了同一节信号的相关性[6],而不同节以及更多信号之间有可能存在的冗余还没有被挖掘出来.因此,在理解基本的编码过程之外,我们还有望继续细化编码的过程,找出更有效的编码方法.参考文献:[1] IS O/IEC 11172-3C oding of M oving Pictures and Ass ociated Audio for Digital S torage M edia at up to About 1.5Mbit/s Part 3:Audio (1993)[S].[2] 林胜,纪涌,全子一.MPEG-III 声音编码算法[J ]电声技术.1998,5,2-5.[3] Seym our Shlien.G uide to MPEG-I Audio S tandard[J ].Broadcasting .1994,4(4),206-218.[4] 梁彬,吴振扬.数字音频压缩中的变换编码算法[J ].电声技术.1999,7,3-6.[5] 王建昕,董在望,印日方强.MPEG 音频算法的研究与实时实现[J ].清华大学学报(自然科学版).1997,37(10),45-48.[6] Farshid G olchin ,K uldip K.Paliwal ,Lossless C oding of MPEG-I Layer III Encoded Audio S treams[J ].S peech ,and S ignal Processing .2000,2(7),11885-11888.ANALYSIS OF MP 3CODING ARITH METICMA Chang -ping , SONG Dan , MA You -ming(E lectronic E ngineering Dep artment ,B eijing I nstitute of T echnology ,B eijing 100081,China)ABSTRACT : The IS O MPEG-1standard describes the im plementation of three com pression schemes called layer 1,layer 2and layer 3.The layer 1scheme is the sim plest to im plementation but its efficiency is not as g ood as the other tw o layers.The layer3scheme ,comm only known as MP3,provides the best performance at low bit rates and has become widely popular for the transmission of encoded audio file (MP3’s )through the Internet.H owever ,it is al 2s o the m ost difficult one to im plement.This paper is designed to introduce the coding scheme for the MPEG-I layer3standard.In this paper we analyze the key techniques adopted by MP3coding arithmetic such as subband coding ,psy 2choacoustic m odels and Hu ffman coding particularly and find out the approach to im plement them.Furtherm ore ,a fea 2sible advice of im proving the encoding scheme is proposed to make the code m ore efficient.KE Y WOR DS : MP3;MPEG-I ;digital audio 76第1期马昌萍等:MP3编码算法分析。