mp3压缩编码标准

合集下载

7种常见的音频格式简析

7种常见的音频格式简析（MP3，WMA，WAV，APE，FLAC，OGG，AAC）MP3全称是动态影像专家压缩标准音频层面3（Moving Picture Experts Group Audio Layer Ⅲ），是当今最为流行的一种数字音频编码和有损压缩格式，在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。

它设计用来大幅度地降低音频数据量，而对于大多数用户来说重放的音质与最初的不压缩音频相比感觉不到很大的下降。

简单地说，MP3就是一种音频压缩技术，由于这种压缩方式的全称叫MPEG Audio Layer3，所以人们把它简称为MP3。

MP3是利用MPEG Audio Layer 3 的技术，将音乐以1:10 甚至1:12 的压缩率，压缩成容量较小的文件。

换句话说，能够在音质丢失很小的情况下把文件压缩到更小的程度，而且还可以较好的保持了原来的音质。

另外，正是因为MP3体积小，音质高的特点使得MP3格式几乎成为网上音乐的代名词。

每分钟音乐的MP3格式只有1MB左右大小，这样每首歌的大小只有3-4兆字节。

使用MP3播放器对MP3文件进行实时的解压缩（解码），这样，高品质的MP3音乐就播放出来了。

● MP3格式特点MP3是一个有损数据压缩格式，它丢弃掉脉冲编码调制（PCM）音频数据中对人类听觉不重要的数据（类似于JPEG是一个有损图像压缩），从而达到了小得多的文件大小（其在较大的压缩率以及基本保持低音频部分不失真的情况下，以牺牲声音文件中12kHz到16kHz的高音频部分来实现小文件）。

MP3音频可以按照不同的位速进行压缩，提供了在数据大小和声音质量之间进行权衡的一个范围。

另外，MP3格式使用了混合的转换机制将时域信号转换成频域信号。

例如，我们平时在网上见到的一些低质的MP3有64kbps，但好的也有320kbps的，两者声音差距也相当明显。

mpeg-1 标准

mpeg-1 标准MPEG-1标准。

MPEG-1是一种音频和视频压缩标准，它是由Moving Picture Experts Group （MPEG）制定的。

MPEG-1标准于1993年发布，是数字音频和视频压缩的首个国际标准。

它的出现标志着数字多媒体时代的开始，为数字音频和视频的传输和存储提供了重要的技术支持。

MPEG-1标准主要包括三个部分，音频压缩、视频压缩和多媒体系统。

在音频压缩方面，MPEG-1采用了一种称为Layer I、Layer II和Layer III的压缩技术，其中Layer III又被称为MP3，它成为了数字音乐传输和存储的主流格式。

在视频压缩方面，MPEG-1采用了一种称为MPEG-1视频的压缩技术，它可以将视频压缩到原始大小的100-200分之一。

多媒体系统部分定义了音频和视频的同步传输和存储方法，为多媒体应用提供了统一的标准。

MPEG-1标准的出现对数字音频和视频的发展产生了深远的影响。

首先，MPEG-1标准的制定使得数字音频和视频的传输和存储成为了可能，为数字音乐、数字电视等领域的发展提供了技术支持。

其次，MPEG-1标准的应用推动了数字音频和视频产业的快速发展，为数字多媒体产业的形成奠定了基础。

最后，MPEG-1标准的成功制定为后续的MPEG-2、MPEG-4等标准的制定和发展奠定了基础，为数字多媒体技术的不断进步提供了动力。

然而，随着技术的不断发展，MPEG-1标准在某些方面已经显得有些过时。

首先，MPEG-1标准的压缩比较低，无法满足高清晰度视频的传输和存储需求。

其次，MPEG-1标准的编解码复杂度较高，导致了在一些低性能设备上无法实时解码。

最后，MPEG-1标准在音频和视频的同步传输方面存在一定的局限性，无法满足一些特殊应用的需求。

为了解决这些问题，MPEG组织陆续发布了MPEG-2、MPEG-4等更新的标准，以满足不断发展的数字多媒体技术需求。

同时，随着计算机和网络技术的飞速发展，新的音频和视频压缩标准如AAC、H.264等也相继出现，逐渐取代了MPEG-1标准在一些领域的应用。

音频压缩编码原理及标准.

声音压缩编码的声学原理
声音信号的频率范围？ 20Hz-20KHz
声音频谱的特点: 高频段快速下降，高幅值大部分集中在中频段，有的延伸到低频段
电平分布特点：声音信号的电平存在冗余
声音压缩编码的声学原理
掩蔽效应
一个较弱的声音（被掩蔽音）的听觉感受被另一个较强的声音（掩蔽音）影响
掩蔽量
时频变化的方法：离散余弦变换DCT 、改进的离散余弦变换MDCT
离散余弦变换（DCT）
时频变换（DFT）
逆变换
变换时将PCM样值分为N长的一块块进行变换块长：一块中包含的样本数N 窗长：N ×（1/Fs）频率分辨率：Fs/N 频率轴上的所能得到的最小频率间隔块越长，变化编码的频率分辨率越高，但损失了时域分辨率
MPEG-1 层1原理方框图
MPEG-1 层1 1、子带分析滤波器组
将宽频带信号分割成32个子带信号子带为等宽的均匀划分
2、标定
将每个子带中12个采样值归并成一个块找出12个采样值中绝对值最大的样本值根据其值的大小确定比例因子（查表得到，大于该绝对值的一系列值中的最小值定为比例因子）将12个采样值用比例因子归一化（标定）
可预先定义压缩后的数码率
编码后的数据流支持循环冗余校验支持数据流中载带附加信息
MPEG-1 音频压缩编码的基本原理
MPEG-1音频压缩的基础是量化
MPEG-1使用感知音频编码来达到压缩音频数据又尽可能保证音质的目的。
感知音频编码的理论依据是听觉系统的掩蔽特性。基本思想是在编码过程中，保留有用的信息而丢掉被掩蔽的信号。
MPEG-1 层2
、
SCPSI 比例因子选择信息
为了降低传送比例因子的码率，信号平稳变化时，只传送其中1个或2个较大的比例因子；对于瞬态变化的信号，3个比例因子都传递。 00 传送所有的3个比例因子 01 传送第1和第3个比例因子 10 传送一个比例因子 11 传送第1和第2个比例因子

MP3编码分析（一）

MP3编码分析（⼀）⽬录⼀、MP3⽂件格式解析 (2)1、MP3⽂件及MPEG概述 (2)⼆、MP3编码原理 (4)1、MP3编码流程 (4)2、⼦带滤波器排——编码流程图中编号为1 (5)3、改良后的DCT（MDCT）——编码流程图中编号为2 (7)4、声⾳⼼理学模型——编码流程图中编号为3 (8)5、位元分配、量化和Huffman编码——4 (12)三、SHINE程序分析 (13)1、⽂件数据结构 (13)2、编码前化⼯作 (14)3、MP3编码 (14)4、后处理 (17)注：下⾯的资料参考⽹上论⽂整理⽽来⼀、MP3⽂件格式解析1、MP3⽂件及MPEG概述MP3⽂件是由帧(frame)构成的，帧是MP3 ⽂件最⼩的组成单位。

MP3 的全称应为MPEG1 Layer-3 ⾳频⽂件。

MPEG(MovingPicture Experts Group)，MPGE⾳频层指MPGE⽂件中的声⾳部分，根据编码质量和复杂程度分为3层，即Layer-1、Layer2、Layer3，对应MP1、MP2、MP3三种格式⽂件。

2、MP3⽂件结构MP3⽂件分为TAG_V2(ID3V2)，Frame, TAG_V1(ID3V1)共3部分。

（1）Frame格式帧头为4个字节，其结构如下typedef FrameHeader{unsigned intsync:11; //同步信息unsigned intversion:2; //版本unsigned intlayer:2; //层unsigned intprotection:1; // CRC校验unsigned intbitrate:4; //位率unsigned intfrequency:2; //采样频率unsigned intpadding:1; //帧长调节unsigned intprivate:1; //保留字unsigned intmode:2; //声道模式unsigned int mode extension:2; //扩充模式unsigned intcopyright:1; // 版权unsigned intoriginal:1; //原版标志unsigned intemphasis:2; //强调模式}HEADER, *LPHEADER;⽆论帧多长，每帧播放时间为26ms。

mp3文件格式

MP3文件格式一．概述：MP3文件是由帧(frame)构成的，帧是MP3文件最小的组成单位。

MP3的全称应为MPEG1 Layer-3音频文件，MPEG(Moving Picture Experts Group)在汉语中译为活动图像专家组，特指活动影音压缩标准，MPEG 音频文件是MPEG1标准中的声音部分，也叫MPEG 音频层，它根据压缩质量和编码复杂程度划分为三层，即Layer-1、Layer2、Layer3，且分别对应MP1、MP2、MP3这三种声音文件，并根据不同的用途，使用不同层次的编码。

MPEG 音频编码的层次越高，编码器越复杂，压缩率也越高，MP1和MP2的压缩率分别为4：1和6：1-8：1，而MP3的压缩率则高达10：1-12：1，也就是说，一分钟CD 音质的音乐，未经压缩需要10MB 的存储空间，而经过MP3压缩编码后只有1MB 左右。

不过MP3对音频信号采用的是有损压缩方式，为了降低声音失真度，MP3采取了“感官编码技术”，即编码时先对音频文件进行频谱分析，然后用过滤器滤掉噪音电平，接着通过量化的方式将剩下的每一位打散排列，最后形成具有较高压缩比的MP3文件，并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。

二．整个MP3文件结构：MP3文件大体分为三部分：TAG_V2(ID3V2)，Frame, TAG_V1(ID3V1)三．MP3的FRAME 格式：每个FRAME 都有一个帧头FRAMEHEADER，长度是4BYTE（32bit）,帧头后面可能有两个字节的CRC 校验，这两个字节的是否存在决定于FRAMEHEADER 信息的第16bit，为0则帧头后面无校验，为1则有校验,校验值长度为2个字节，紧跟在FRAMEHEADER 后面，接着就是帧的实体数据了，格式如下：FRAMEHEADERCRC（free） MAIN_DATA 4 BYTE0 OR 2 BYTE 长度由帧头计算得出 1．帧头FRAMEHEADER 格式如下：AAAAAAAA AAABBCCD EEEEFFGH IIJJKLMM13个帧头字符的含义如下：Sign Length (bits) Position (bits)DescriptionA11 (31-21) Frame sync (all bits set) B 2 (20,19) MPEG Audio version00 - MPEG Version 2.501 - reserved ID3V2包含了作者，作曲，专辑等信息，长度不固定，扩展了ID3V1的信息量。

MP3编码格式

MP3 编码格式MP3是MPEG-1 Audio Layer 3的简称，是当今比较流行的一种数字音频编码和有损压缩格式（有Layer 3，也必然有Layer1和Layer2，也就是MP1和MP2，但不在本文讨论范围之内）。

MP3技术的应该可以用来大幅度的降低音频文件存储所需要的空间。

它丢掉脉冲编码调制（PCM）音频数据中对人类听觉不重要得数据，从而达到了较高的压缩比（高达12：1－10：1）。

简单地说，MP3在编码时先对音频文件进行频谱分析，然后用过滤器滤掉噪音电平，接着通过量化的方式将剩下的每一位打散排列，最后形成有较高压缩比的MP3文件，并使压缩后的文件在回放时也能够达到比较接近原音源的效果。

MP3的音频质量取决于它的Bitrate和Sampling frequency，以及编码器质量。

MP3的典型速度介于每秒128到320kb之间。

采样频率也有44.1，48和32 kHz三种频率，比较常见的是采用CD采样频率——44.1kHz。

常用的编码器是LAME，它完全遵循LGPL的MP3编码器，有着良好的速度和音质。

一．概述：MP3 文件是由帧(frame)构成的，帧是MP3 文件最小的组成单位。

MP3的全称应为MPEG1 Layer-3 音频文件，MPEG(Moving Picture Experts Group) 在汉语中译为活动图像专家组，特指活动影音压缩标准，MPEG音频文件是MPEG1 标准中的声音部分，也叫MPEG 音频层，它根据压缩质量和编码复杂程度划分为三层，即Layer-1、Layer2、Layer3，且分别对应MP1、MP2、MP3 这三种声音文件，并根据不同的用途，使用不同层次的编码。

MPEG 音频编码的层次越高，编码器越复杂，压缩率也越高，MP1 和MP2 的压缩率分别为4：1 和6：1-8：1，而MP3 的压缩率则高达10：1-12：1，也就是说，一分钟CD 音质的音乐，未经压缩需要10MB的存储空间，而经过MP3 压缩编码后只有1MB 左右。

MP3软解码库Libmad详细解释

本文档版权归属于西安交通大学人工智能与机器人研究所作者：李国辉 g h l i @ a i a r . x j t u . e d u . c n
第2章 Mp3 解码算法流程
MP3 的全称为 MPEG1 Layer-3 音频文件， MPEG 音频文件是 MPEG1 标准中的声音部分，也叫 MPEG 音频层，它根据压缩质量和编码复杂程度划分为三层，即 Layer1、Layer2、 Layer3，且分别对应 MP1、MP2、MP3 这三种声音文件，并根据不同的用途，使用不同层次的编码。MPEG 音频编码的层次越高，编码器越复杂，压缩率也越高，MP1 和 MP2 的压缩率分别为 4：1 和 6：1-8：1，而 MP3 的压缩率则高达 10：1-12：1。一分钟 CD 音质的音乐，未经压缩需要 10MB 的存储空间，而经过 MP3 压缩编码后只有 1MB 左右。不过 MP3 对音频信号采用的是有损压缩方式，为了降低声音失真度，MP3 采取了“ 心理声学模型”，即编码时先对音频文件进行频谱分析，然后再根据心理声学模型把谱线分成若干个阈值分区，并计算每个阈值分区的阈值，接着通过量化和熵编码对每个谱线进行编码，最后形成具有较高压缩比的 MP3 文件，并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。
2.1. Mp3 文件格式
MP3 文件以一帧为一个编码单元，各帧编码数据是独立的。为了清晰而准确地描述 mp3 文件格式，下面采用位流语法描述，这种语法格式与 c 语言近似，易于理解，且描述清晰。其中粗体表示码流中的数据项，bslbf 代表位串，即“Bit string, left bit first ”，uimsbf 代表无符号整数，即”unsinged integer, most significant bit first”，数字表示该数据项所占的比特数。

mp3音频格式解析

MPEG2.5 384 1152 576
【每帧采样数表】
帧长度是压缩时每一帧的长度，包括帧头。它将填充的空位也计算在内。LayerI 的一个空位长 4 字节，LayerII 和 LayerIII 的空位是 1 字节。当读取 MPEG 文件时必须计算该值以便找到相邻的帧。
注意：因为有填充和比特率变换，帧长度可能变化。从头中读取比特率，采样频率和填充， LyaerI 使用公式：帧长度（字节） = 每帧采样数 / 采样频率(HZ) * 比特率（bps）/ 8 +填充 * 4 LyerII 和 LyaerIII 使用公式：帧长度（字节）= 每帧采样数 / 采样频率(HZ) * 比特率（bps）/ 8 + 填充例： LayerIII 比特率 128000，采样频率 44100，填充 0 =〉帧大小 417 字节
每帧持续时间(秒) = 每帧采样数 / 采样频率（HZ）
可以这么理解：每帧采用数就是要采取的总数，采样率就是采取的速度，相除就得到时间。这样通过计算可知 MPEG1 Layer III 采样率为 44.1KHz 的一帧持续时间为 26.12...不是整数，不过我们权且认为它就是 26 毫秒吧。如果是 MPEG2 Layer III 采样率为 16KHz 的话那一帧要持续 36 毫秒，这个相差还是蛮大的，所以还是应该通过计算来获的，当然可以按 MPEG 版本，层数和采样率来建一个表，这样直接查表就可以知道时间了。
G
1
（9）填充位（填充用来达到正确的比特率。）
0 – 没有填充
1 – 填充了一个额外的空位
H
1
（8）私有 bit，可以用来做特殊应用。例如可以
用来触发应用程序的特殊事件。
I

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

mp3压缩编码标准
MP3（MPEG-1 Audio Layer III）是一种数字音频压缩编码标准，它是MPEG（Moving Picture Experts Group）制定的音频压缩标准
之一。

MP3编码标准使用了一种称为“感知编码”的技术，它利用
人耳对声音的感知特性来去除音频信号中的冗余信息，从而实现高
效的压缩。

MP3编码标准的主要特点包括以下几个方面：
1. 压缩比，MP3编码可以实现相对较高的压缩比，通常可以将
原始音频数据压缩到其约1/10至1/12的大小，而且在保持相对较
高的音质的同时实现了这一压缩比。

2. 损失压缩，MP3是一种损失压缩技术，这意味着在压缩过程
中会丢失一些音频信息，但通常这些丢失的信息对于人耳来说是难
以察觉的，因此可以接受这种损失以换取更高的压缩比。

3. 采样率和比特率，MP3编码标准支持不同的采样率和比特率，用户可以根据需要选择不同的设置来平衡音质和文件大小之间的关系。

常见的比特率有128kbps、192kbps、256kbps等，而常见的采
样率有44.1kHz、48kHz等。

4. 广泛应用，由于MP3编码标准具有较高的压缩比和良好的音质表现，因此在互联网上广泛应用于音乐下载、在线音乐流媒体等领域，成为了数字音频传输和存储的重要标准之一。

总的来说，MP3是一种高效的音频压缩编码标准，它在保证相对较高音质的同时实现了较高的压缩比，因此被广泛应用于音频领域。