MP3编码格式

合集下载

7种常见的音频格式简析

7种常见的音频格式简析（MP3，WMA，WAV，APE，FLAC，OGG，AAC）MP3全称是动态影像专家压缩标准音频层面3（Moving Picture Experts Group Audio Layer Ⅲ），是当今最为流行的一种数字音频编码和有损压缩格式，在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。

它设计用来大幅度地降低音频数据量，而对于大多数用户来说重放的音质与最初的不压缩音频相比感觉不到很大的下降。

简单地说，MP3就是一种音频压缩技术，由于这种压缩方式的全称叫MPEG Audio Layer3，所以人们把它简称为MP3。

MP3是利用MPEG Audio Layer 3 的技术，将音乐以1:10 甚至1:12 的压缩率，压缩成容量较小的文件。

换句话说，能够在音质丢失很小的情况下把文件压缩到更小的程度，而且还可以较好的保持了原来的音质。

另外，正是因为MP3体积小，音质高的特点使得MP3格式几乎成为网上音乐的代名词。

每分钟音乐的MP3格式只有1MB左右大小，这样每首歌的大小只有3-4兆字节。

使用MP3播放器对MP3文件进行实时的解压缩（解码），这样，高品质的MP3音乐就播放出来了。

● MP3格式特点MP3是一个有损数据压缩格式，它丢弃掉脉冲编码调制（PCM）音频数据中对人类听觉不重要的数据（类似于JPEG是一个有损图像压缩），从而达到了小得多的文件大小（其在较大的压缩率以及基本保持低音频部分不失真的情况下，以牺牲声音文件中12kHz到16kHz的高音频部分来实现小文件）。

MP3音频可以按照不同的位速进行压缩，提供了在数据大小和声音质量之间进行权衡的一个范围。

另外，MP3格式使用了混合的转换机制将时域信号转换成频域信号。

例如，我们平时在网上见到的一些低质的MP3有64kbps，但好的也有320kbps的，两者声音差距也相当明显。

mp3和mp4解压方式原理2000字

mp3和mp4解压方式原理2000字MP3和MP4是两种常见的音视频文件格式，它们的解压方式和原理有所不同。

下面将详细介绍MP3和MP4的解压方式和原理。

一、MP3解压方式和原理MP3是一种音频编码格式，它通过压缩音频数据来减小文件大小，从而节省存储空间和传输带宽。

MP3的解压方式主要包括以下几个步骤：1.读取文件头部信息：MP3文件的开头部分包含了一些元数据，如音频采样率、声道数等信息。

解压时首先需要读取这些信息。

2.解析帧数据：MP3文件由一个个帧组成，每个帧包含了一定长度的音频数据。

解压时需要逐帧地解析帧数据。

3.解码音频数据：MP3文件中的音频数据经过了特定的编码算法，解压时需要将编码后的数据解码为原始的音频数据。

4.重建音频信号：解码后的音频数据是经过量化和压缩的，需要进行反量化和逆变换来还原出原始的音频信号。

MP3的解压原理主要基于人耳对声音的感知特性。

MP3格式利用了人耳对一些高频信号的较低敏感度，通过减少这些高频信号的数据量来实现压缩。

在解压时，通过一些复杂的算法来还原出原始的音频信号，以达到高音质的播放效果。

二、MP4解压方式和原理MP4是一种常见的视频文件格式，它不仅可以存储音频数据，还可以存储视频数据和其他多媒体数据。

MP4的解压方式主要包括以下几个步骤：1.解析文件结构：MP4文件的结构比较复杂，包含了多个轨道，每个轨道又包含了多个媒体样本。

解压时首先需要解析文件结构，确定需要解压的轨道和样本。

2.解析媒体样本：MP4文件中的媒体样本包括音频帧和视频帧，解压时需要逐帧地解析这些样本数据。

3.解码媒体数据：MP4文件中的音频和视频数据经过了特定的编码算法，解压时需要将编码后的数据解码为原始的音频和视频数据。

4.重建音视频信号：解码后的音频和视频数据是经过压缩的，需要进行一系列的处理步骤来还原出原始的音视频信号，包括去压缩、去块效应等处理。

MP4的解压原理主要是基于视频编码和音频编码技术。

13种音乐格式介绍及对比

硬件支持方面：MP3播放器 mp3>wma>wav>flac>ape aac ogg
手机 mp3>wma>aac wav>flac ogg>ape
性能（就是综合音质体积编码率）：aac>ogg>flac ape>mp3>wav wma (这项是我个人认为的！)
补充：目前最好的有损格式之一，MP3部分支持，智能手机装软件部分可以支持，最高比特率500kbps。
12.M4A格式
M4A是MPEG4音频标准的文件的扩展名。在MPEG4标准中提到，普通的MPEG4文件扩展名是.mp4。自从Apple开始在它的iTunes以及 iPod中使用.m4a以区别MPEG4的视频和音频文件以来，.m4a这个扩展名变得流行了。目前，几乎所有支持MPEG4音频的软件都支持.m4a。最常用的.m4a文件是使用AAC格式的（文件），不过其他的格式，比如Apple Lossless甚至mp3也可以被放在.m4a容器里（TC注：这个container的概念类似于.mkv文件）。可以安全的把只包含音频的.mp4 文件的扩展名改成.m4a，以便让它能在你喜欢的播放器里播放，反之亦然。
11.OGG格式
Ogg全称应该是OGG Vobis(ogg Vorbis) 是一种新的音频压缩格式，类似于MP3等现有的音乐格式。但有一点不同的是，它是完全免费、开放和没有专利限制的。OGG Vobis有一个很出众的特点，就是支持多声道，随着它的流行，以后用随身听来听DTS编码的多声道作品将不会是梦想。
补充：为无损格式，较ape而言，他体积大点，但是兼容性好，编码速度快，播放器支持更广
9.APE格式
APE是目前流行的数字音乐文件格式之一。与MP3这类有损压缩方式不同，APE是一种无损压缩音频技术，也就是说当你将从音频CD上读取的音频数据文件压缩成APE格式后，你还可以再将APE格式的文件还原，而还原后的音频文件与压缩前的一模一样，没有任何损失。APE的文件大小大概为CD的一半，但是随着宽带的普及，APE格式受到了许多音乐爱好者的喜爱，特别是对于希望通过网络传输音频CD的朋友来说，APE可以帮助他们节约大量的资源。

MP3编码分析（一）

MP3编码分析（⼀）⽬录⼀、MP3⽂件格式解析 (2)1、MP3⽂件及MPEG概述 (2)⼆、MP3编码原理 (4)1、MP3编码流程 (4)2、⼦带滤波器排——编码流程图中编号为1 (5)3、改良后的DCT（MDCT）——编码流程图中编号为2 (7)4、声⾳⼼理学模型——编码流程图中编号为3 (8)5、位元分配、量化和Huffman编码——4 (12)三、SHINE程序分析 (13)1、⽂件数据结构 (13)2、编码前化⼯作 (14)3、MP3编码 (14)4、后处理 (17)注：下⾯的资料参考⽹上论⽂整理⽽来⼀、MP3⽂件格式解析1、MP3⽂件及MPEG概述MP3⽂件是由帧(frame)构成的，帧是MP3 ⽂件最⼩的组成单位。

MP3 的全称应为MPEG1 Layer-3 ⾳频⽂件。

MPEG(MovingPicture Experts Group)，MPGE⾳频层指MPGE⽂件中的声⾳部分，根据编码质量和复杂程度分为3层，即Layer-1、Layer2、Layer3，对应MP1、MP2、MP3三种格式⽂件。

2、MP3⽂件结构MP3⽂件分为TAG_V2(ID3V2)，Frame, TAG_V1(ID3V1)共3部分。

（1）Frame格式帧头为4个字节，其结构如下typedef FrameHeader{unsigned intsync:11; //同步信息unsigned intversion:2; //版本unsigned intlayer:2; //层unsigned intprotection:1; // CRC校验unsigned intbitrate:4; //位率unsigned intfrequency:2; //采样频率unsigned intpadding:1; //帧长调节unsigned intprivate:1; //保留字unsigned intmode:2; //声道模式unsigned int mode extension:2; //扩充模式unsigned intcopyright:1; // 版权unsigned intoriginal:1; //原版标志unsigned intemphasis:2; //强调模式}HEADER, *LPHEADER;⽆论帧多长，每帧播放时间为26ms。

音视频编码格式汇总

一、音频编解码格式*MPEG Audio Layer 1/2*MPEG Audio Layer 3(MP3)*MPEG2 AAC*MPEG4 AAC*Windows Media audeo v1/v2/7/8/9*RealAudio cook/sipro(real media series)*RealAudio AAC/AACPlus(real media series)*QDesign Music 2(apple series)是QDesign 公司开发的用于高保真高压缩率的编码方式，类似于MP3，不过比MP3要先进。

支持流式播放.*Apple MPEG-4 AAC(apple series)*ogg(ogg vorbis音频)*AC3(DVD 专用音频编码)*DTS(DVD 专用音频编码)*APE(monkey’s 音频)*AU(sun 格式)*FLAC(fress lossless 音频)*M4A(mpeg-4音频)（苹果改用的名字，可以改成.mp4）*MP2(mpeg audio layer2音频)*WMA二、视频编解码格式*MPEG1(VCD)*MPEG2(DVD)*MPEG4(divx,xvid)*MPEG4 AVC/h.264*h.261*h.262*h.263*h.263+*h.263++*MPEG-4 v1/v2/v3(微软windows media系列)*Windows Media Video 7/8/9/10*Sorenson Video 3（用于QT5，成标准了）(apple series)*RealVideo G2(real media series)*RealVideo 8/9/10(real media series)*Apple MPEG-4(apple series)*Apple H.264(apple series)*flash video三、音视频文件格式首先要分清楚媒体文件和编码的区别：文件是既包括视频又包括音频、甚至还带有脚本的一个集合，也可以叫容器；文件当中的视频和音频的压缩算法才是具体的编码。

mp3文件格式

MP3文件格式一．概述：MP3文件是由帧(frame)构成的，帧是MP3文件最小的组成单位。

MP3的全称应为MPEG1 Layer-3音频文件，MPEG(Moving Picture Experts Group)在汉语中译为活动图像专家组，特指活动影音压缩标准，MPEG 音频文件是MPEG1标准中的声音部分，也叫MPEG 音频层，它根据压缩质量和编码复杂程度划分为三层，即Layer-1、Layer2、Layer3，且分别对应MP1、MP2、MP3这三种声音文件，并根据不同的用途，使用不同层次的编码。

MPEG 音频编码的层次越高，编码器越复杂，压缩率也越高，MP1和MP2的压缩率分别为4：1和6：1-8：1，而MP3的压缩率则高达10：1-12：1，也就是说，一分钟CD 音质的音乐，未经压缩需要10MB 的存储空间，而经过MP3压缩编码后只有1MB 左右。

不过MP3对音频信号采用的是有损压缩方式，为了降低声音失真度，MP3采取了“感官编码技术”，即编码时先对音频文件进行频谱分析，然后用过滤器滤掉噪音电平，接着通过量化的方式将剩下的每一位打散排列，最后形成具有较高压缩比的MP3文件，并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。

二．整个MP3文件结构：MP3文件大体分为三部分：TAG_V2(ID3V2)，Frame, TAG_V1(ID3V1)三．MP3的FRAME 格式：每个FRAME 都有一个帧头FRAMEHEADER，长度是4BYTE（32bit）,帧头后面可能有两个字节的CRC 校验，这两个字节的是否存在决定于FRAMEHEADER 信息的第16bit，为0则帧头后面无校验，为1则有校验,校验值长度为2个字节，紧跟在FRAMEHEADER 后面，接着就是帧的实体数据了，格式如下：FRAMEHEADERCRC（free） MAIN_DATA 4 BYTE0 OR 2 BYTE 长度由帧头计算得出 1．帧头FRAMEHEADER 格式如下：AAAAAAAA AAABBCCD EEEEFFGH IIJJKLMM13个帧头字符的含义如下：Sign Length (bits) Position (bits)DescriptionA11 (31-21) Frame sync (all bits set) B 2 (20,19) MPEG Audio version00 - MPEG Version 2.501 - reserved ID3V2包含了作者，作曲，专辑等信息，长度不固定，扩展了ID3V1的信息量。

音频编码格式介绍

移动设备
由于其高效的压缩和良好的音质，AAC在移动设备上广泛使用，如 iPhone、Android等。
AAC编码格式的优缺点
优点
高音质、高压缩效率、良好的兼容性和多声道支持。
缺点
相对于无损压缩格式，AAC仍然是一种有损压缩格式，会损失一些音频细节。
04 FLAC编码格式
FLAC编码格式的特点
无损压缩
格式也是一个不错的选择。
WAV编码格式的优缺点
优点
无损压缩、兼容性强、能够保留原始音频的所有细节。
缺点
存储空间大、传输速度慢、不适合网络传输和流媒体应用。
THANKS FOR WATCHING
感谢您的观看
FLAC编码格式的应用场景
音乐收藏
对于那些希望保留原始音乐质量的人来说，FLAC是一个很好的选择，特别是对于那些珍贵的或稀有的音乐收藏。
高品质音频需求
对于那些对音质有高要求的音乐爱好者或专业音频工作者，FLAC 是一个理想的选择。
备份
由于FLAC能够无损压缩，它也常被用作备份原始音频文件的格式，以防止数据丢失。
缺点
由于采用有损压缩，部分音频细节会丢失；一些老旧的设备可能不支持播放MP3格式；版权保护机制较弱，容易遭受盗版侵权。

03 AAC编码格式
AAC编码格式的特点
高质量
AAC编码格式提供了较高的音频质量，接近于无损压缩。
压缩效率
相对于MP3，AAC提供了更高的压缩效率，文件大小相对较小。
兼容性
有16位、24位等。
02 MP3编码格式
MP3编码格式的特点
1 2
高压缩率
MP3采用了一种名为MPEG-2 Layer III的压缩算法，能够在较低的比特率下实现较高的音质。

MP3软解码库Libmad详细解释

本文档版权归属于西安交通大学人工智能与机器人研究所作者：李国辉 g h l i @ a i a r . x j t u . e d u . c n
第2章 Mp3 解码算法流程
MP3 的全称为 MPEG1 Layer-3 音频文件， MPEG 音频文件是 MPEG1 标准中的声音部分，也叫 MPEG 音频层，它根据压缩质量和编码复杂程度划分为三层，即 Layer1、Layer2、 Layer3，且分别对应 MP1、MP2、MP3 这三种声音文件，并根据不同的用途，使用不同层次的编码。MPEG 音频编码的层次越高，编码器越复杂，压缩率也越高，MP1 和 MP2 的压缩率分别为 4：1 和 6：1-8：1，而 MP3 的压缩率则高达 10：1-12：1。一分钟 CD 音质的音乐，未经压缩需要 10MB 的存储空间，而经过 MP3 压缩编码后只有 1MB 左右。不过 MP3 对音频信号采用的是有损压缩方式，为了降低声音失真度，MP3 采取了“ 心理声学模型”，即编码时先对音频文件进行频谱分析，然后再根据心理声学模型把谱线分成若干个阈值分区，并计算每个阈值分区的阈值，接着通过量化和熵编码对每个谱线进行编码，最后形成具有较高压缩比的 MP3 文件，并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。
2.1. Mp3 文件格式
MP3 文件以一帧为一个编码单元，各帧编码数据是独立的。为了清晰而准确地描述 mp3 文件格式，下面采用位流语法描述，这种语法格式与 c 语言近似，易于理解，且描述清晰。其中粗体表示码流中的数据项，bslbf 代表位串，即“Bit string, left bit first ”，uimsbf 代表无符号整数，即”unsinged integer, most significant bit first”，数字表示该数据项所占的比特数。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

MP3 编码格式
MP3是MPEG-1 Audio Layer 3的简称，是当今比较流行的一种数字音频编码和有损压缩格式（有Layer 3，也必然有Layer1和Layer2，也就是MP1和MP2，但不在本文讨论范围之内）。

MP3技术的应该可以用来大幅度的降低音频文件存储所需要的空间。

它丢掉脉冲编码调制（PCM）音频数据中对人类听觉不重要得数据，从而达到了较高的压缩比（高达12：1－10：1）。

简单地说，MP3在编码时先对音频文件进行频谱分析，然后用过滤器滤掉噪音电平，接着通过量化的方式将剩下的每一位打散排列，最后形成有较高压缩比的MP3文件，并使压缩后的文件在回放时也能够达到比较接近原音源的效果。

MP3的音频质量取决于它的Bitrate和Sampling frequency，以及编码器质量。

MP3的典型速度介于每秒128到320kb之间。

采样频率也有44.1，48和32 kHz三种频率，比较常见的是采用CD采样频率——44.1kHz。

常用的编码器是LAME，它完全遵循LGPL的MP3编码器，有着良好的速度和音质。

一．概述：
MP3 文件是由帧(frame)构成的，帧是MP3 文件最小的组成单位。

MP3的全称应为MPEG1 Layer-3 音频
文件，MPEG(Moving Picture Experts Group) 在汉语中译为活动图像专家组，特指活动影音压缩标准，MPEG
音频文件是MPEG1 标准中的声音部分，也叫MPEG 音频层，它根据压缩质量和编码复杂程度划分为三层，即
Layer-1、Layer2、Layer3，且分别对应MP1、MP2、MP3 这三种声音文件，并根据不同的用途，使用不同层
次的编码。

MPEG 音频编码的层次越高，编码器越复杂，压缩率也越高，MP1 和MP2 的压缩率分别为4：1 和
6：1-8：1，而MP3 的压缩率则高达10：1-12：1，也就是说，一分钟CD 音质的音乐，未经压缩需要10MB
的存储空间，而经过MP3 压缩编码后只有1MB 左右。

不过MP3 对音频信号采用的是有损压缩方式，为了降
低声音失真度，MP3采取了“感官编码技术”，即编码时先对音频文件进行频谱分析，然后用过滤器滤掉
噪音电平，接着通过量化的方式将剩下的每一位打散排列，最后形成具有较高压缩比的MP3 文件，并使压
缩后的文件在回放时能够达到比较接近原音源的声音效果。

二．整个MP3文件结构：
MP3 文件大体分为三部分：TAG_V2(ID3V2)，Frame, TAG_V1(ID3V1)
ID3V2 包含了作者，作曲，专辑等信息，长度不固定，扩展了ID3V1 的信息量。

Frame 一系列的帧，个数由文件大小和帧长决定
. 每个FRAME 的长度可能不固定，也可能固定，由位率bitrate 决定
. 每个FRAME 又分为帧头和数据实体两部分
. 帧头记录了mp3 的位率，采样率，版本等信息，每个帧之间相互独立
Frame
ID3V1 包含了作者，作曲，专辑等信息，长度为128BYTE。

三．MP3的FRAME格式：
每个FRAME 都有一个帧头FRAMEHEADER，长度是4BYTE（32bit）,帧头后面可能有两个字节的CRC 校
验，这两个字节的是否存在决定于FRAMEHEADER 信息的第16bit，为0 则帧头后面无校验，为1 则有校验,
校验值长度为2 个字节，紧跟在FRAMEHEADER 后面，接着就是帧的实体数据了
2．MAIN_DA TA：
MAIN_DA TA部分长度是否变化决定于FRAMEHEADER 的bitrate是否变化，一首MP3 歌曲，它有三个版本：96Kbps（96 千比特位每秒）、128Kbps 和192Kbps。

Kbps （比特位速率），表明了音乐每秒的数据量，Kbps 值越高，音质越好，文件也越大，MP3标准规定，不变的bitrate 的MP3 文件称作CBR，大多数MP3 文件都是CBR 的，而变化的bitrate 的MP3 文件称作VBR，每个FRAME 的长度都可能是变化的。

下面是CBR 和VBR 的不同点：
1）CBR：固定位率的FRAME 的大小也是固定的（公式如上所述），只要知道文件总长度，和帧长即可由播放每帧需26ms 计算得出mp3 播放的总时间，也可通过计数帧的个数控制快进、快退慢放等操作。

2）VBR：VBR 是XING 公司推出的算法，所以在MP3 的FRAME 里会有“XING"这个关键字（现在很多流行的小软件也可以进行VBR 压缩，它们是否遵守这个约定，那就不得而知了），它存放在MP3 文件中的第一个有效FRAME 里，它标识了这个MP3 文件是VBR 的。

同时第一个FRAME 里存放了MP3 文件的FRAME 的总个数，这就很容易获得了播放总时间，同时还有100 个字节存放了播放总时间的100 个时间分段的FRAME 的INDEX，假设4 分钟的MP3 歌曲，240S，分成100 段，每两个相邻INDEX 的时间差就是2.4S，所以通过这个INDEX，只要前后处理少数的FRAME，就能快速找出我们需要快进的FRAME 头
四．ID3v1
ID3V1 比较简单，它是存放在MP3 文件的末尾，用16 进制的编辑器打开一个MP3 文件，查看其末尾
的128 个顺序存放字节
ID3V1 的各项信息都是顺序存放，没有任何标识将其分开，比如标题信息不足30 个字节，则使用''\0''
补足，否则将造成信息错误。

五．ID3V2
ID3V2 到现在一共有4 个版本，但流行的播放软件一般只支持第3 版，既ID3v2.3。

由于ID3V1 记录
在MP3 文件的末尾，ID3V2就只好记录在MP3 文件的首部了(如果有一天发布ID3V3，真不知道该记录在哪
里)。

也正是由于这个原因，对ID3V2 的操作比ID3V1 要慢。

而且ID3V2 结构比ID3V1 的结构要复杂得多，
但比前者全面且可以伸缩和扩展。

下面就介绍一下ID3V2.3。

每个ID3V2.3 的标签都一个标签头和若干个标签帧或一个扩展标签头组成。

关于曲目的信息如标题、作者
等都存放在不同的标签帧中，扩展标签头和标签帧并不是必要的，但每个标签至少要有一个标签帧。

标签
头和标签帧一起顺序存放在MP3 文件的首部。