mp3解码算法原理详解

合集下载

音频解码器工作原理

音频解码器工作原理
音频解码器是一种将数字信号转换为模拟音频信号的设备。

它的工作原理通常分为以下几个步骤：
1. 采样：音频解码器首先对输入的数字信号进行采样。

采样过程将连续的音频信号以固定的时间间隔进行离散化，将模拟信号转换为一系列数字样本。

2. 量化：采样之后，音频解码器将每个样本的值映射到最接近的离散数值，以实现数据压缩和存储。

这个过程称为量化，通常使用固定的比特数来表示每个样本的幅度。

3. 编码：在量化之后，解码器通过对量化样本进行编码来减少信号的数据量。

常用的编码方法包括脉冲编码调制（PCM）、压缩编码（如MP3）等。

编码的目的是进一步降低数据的传
输和存储需求。

4. 数字到模拟转换：解码器接收并处理编码后的数字信号，并将其转换回模拟音频信号。

这个过程通过使用数字到模拟转换器（DAC）来实现，DAC将离散的数字样本转换为连续的模
拟电压信号。

5. 输出信号：最后，音频解码器将模拟音频信号输出到扬声器或其他音频设备上，使人们能够听到解码后的音频内容。

总体而言，音频解码器的工作原理是将数字信号进行采样、量
化、编码和转换，最终输出模拟音频信号，使人们能够听到高质量的音频内容。

音响系统的音频解析和解码算法

音响系统的音频解析和解码算法在我们享受美妙音乐和精彩电影的过程中，音响系统扮演着至关重要的角色。

而音响系统中，音频解析和解码算法则是实现高质量音频播放的核心技术。

要理解音频解析和解码算法，首先得明白音频信号的本质。

音频信号其实就是一系列随时间变化的声波压力的模拟表示。

这些信号在数字化的过程中，被采样和量化，变成了我们常见的数字音频文件，比如 MP3、WAV 等。

音频解析，简单来说，就是对输入的音频信号进行分析和处理，以提取出有用的信息。

这包括识别音频的格式、采样率、声道数等基本参数。

想象一下，当你把一首歌曲放进音响系统时，系统首先要搞清楚这是什么类型的音频文件，才能知道该用什么样的方法去处理它。

在音频解析中，有一个关键的概念叫做“频率分析”。

我们听到的声音有高音和低音之分，而频率就是描述声音高低的物理量。

通过对音频信号进行频率分析，可以将声音分解成不同的频率成分。

这就像是把一道大菜分解成各种食材，让我们能更清楚地了解它的组成。

而解码算法呢，则是把经过压缩编码的数字音频数据还原成原始的音频信号。

常见的音频编码格式，如 MP3，是通过去除一些人耳不太敏感的信息来实现压缩的。

解码算法的任务就是把这些被压缩掉的信息重新找回来，尽可能还原出接近原始的音频质量。

比如说，在 MP3 解码中，会使用到一些复杂的数学模型和算法来计算被去除的音频细节。

这可不是一件简单的事情，需要考虑很多因素，比如音频的频谱特性、时域特性等。

在音频解码算法中，还有一个重要的方面是纠错处理。

因为在数字信号的传输和存储过程中，可能会出现错误。

解码算法需要有能力检测和纠正这些错误，以保证播放出来的音频不会有杂音或者失真。

为了实现高质量的音频解析和解码，工程师们不断努力改进算法。

其中，一些新的技术和方法不断涌现。

一种是基于人工智能的音频处理技术。

虽然题目要求抛开 AI 常用的算法，但在这里提一下是为了对比说明传统算法的特点。

AI 可以通过学习大量的音频数据，自动优化音频处理的参数，从而提高音频质量。

MP3软解码库Libmad详细解释

本文档版权归属于西安交通大学人工智能与机器人研究所作者：李国辉 g h l i @ a i a r . x j t u . e d u . c n
第2章 Mp3 解码算法流程
MP3 的全称为 MPEG1 Layer-3 音频文件， MPEG 音频文件是 MPEG1 标准中的声音部分，也叫 MPEG 音频层，它根据压缩质量和编码复杂程度划分为三层，即 Layer1、Layer2、 Layer3，且分别对应 MP1、MP2、MP3 这三种声音文件，并根据不同的用途，使用不同层次的编码。MPEG 音频编码的层次越高，编码器越复杂，压缩率也越高，MP1 和 MP2 的压缩率分别为 4：1 和 6：1-8：1，而 MP3 的压缩率则高达 10：1-12：1。一分钟 CD 音质的音乐，未经压缩需要 10MB 的存储空间，而经过 MP3 压缩编码后只有 1MB 左右。不过 MP3 对音频信号采用的是有损压缩方式，为了降低声音失真度，MP3 采取了“ 心理声学模型”，即编码时先对音频文件进行频谱分析，然后再根据心理声学模型把谱线分成若干个阈值分区，并计算每个阈值分区的阈值，接着通过量化和熵编码对每个谱线进行编码，最后形成具有较高压缩比的 MP3 文件，并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。
2.1. Mp3 文件格式
MP3 文件以一帧为一个编码单元，各帧编码数据是独立的。为了清晰而准确地描述 mp3 文件格式，下面采用位流语法描述，这种语法格式与 c 语言近似，易于理解，且描述清晰。其中粗体表示码流中的数据项，bslbf 代表位串，即“Bit string, left bit first ”，uimsbf 代表无符号整数，即”unsinged integer, most significant bit first”，数字表示该数据项所占的比特数。

mp3的工作原理

mp3的工作原理
MP3技术是指将音频信号以数字方式进行编码、压缩和存储
的技术。

它的工作原理可以分为编码和解码两个过程。

编码过程是将音频信号转换成数字形式的过程。

首先，音频信号会经过采样，即将连续的模拟音频信号转换为离散的数字信号。

然后，对采样后的数字信号进行量化处理，即将连续的取样值离散化为有限个符号值。

接着，对量化后的信号进行编码，将离散的符号值转换为比特流。

编码常使用有损压缩算法，如MP3算法中的MPEG-1音频层III算法，通过去除人耳无法察
觉的音频信号信息和利用人耳的听觉特性来实现高比特压缩。

解码过程则是将编码后的比特流还原为音频信号的过程。

首先，解码器会将比特流解析为离散的符号值。

然后，对解析得到的符号值进行解量化处理，将离散的符号值恢复为连续的取样值。

最后，通过重建取样值序列，将连续的数字信号转换为模拟音频信号。

在整个过程中，MP3技术利用了人耳的听觉特性，如掩蔽效
应和频率分辨能力差异，来减少对音质的影响。

通过合理地削减和压缩信号，移除不可听见的信号部分，MP3技术实现了
高比特压缩，并在一定程度上保持了音质的可接受性。

MP3工作原理范文

MP3工作原理范文MP3是一种常见的音频压缩格式，用于存储和传输音乐文件。

与其他音频格式相比，MP3文件的大小更小，但音质相对较好。

MP3的工作原理是通过压缩音频数据来实现。

MP3的工作原理可以分为三个步骤：采样、量化和编码。

首先，音频信号被采样。

采样是将连续的音频信号转换为离散的数字信号的过程。

在这一过程中，音频信号以固定的时间间隔进行采样，采样频率通常为44.1kHz。

采样频率决定了能够记录音频信号中最高频率的能力，也是在数字化过程中保留了足够的信息以还原原始音频的关键。

接下来，采样数据进行量化。

量化是将连续的采样数据转换为离散的数值的过程。

在这一过程中，采样数据的幅度被近似为最接近的离散值。

量化决定了数字化音频的精确度，也是在压缩过程中丢失信息的主要步骤之一、通常，采用16位或24位的量化深度，较大的量化深度可以提供更高的音频质量。

最后，量化数据被编码为MP3文件。

编码是将离散的量化数据转换为压缩的音频格式的过程。

在这一过程中，采用了一种称为音频编码的技术。

MP3使用的是一种称为“有损压缩”的编码方法。

有损压缩是一种通过删除不能被人耳感知的音频信号部分来减小文件大小的方法。

MP3编码器根据音频信号的特性，在频域上对音频信号进行分析，同时应用具有不同复杂度的压缩算法，根据人耳的听觉模型来决定保留和删除哪些音频信号。

MP3编码器使用了两种基本的压缩算法，即一维MDCT和Psychoacoustic模型。

一维MDCT是一种基于傅立叶变换的算法，它将时域的采样数据转换为频域的系数，以获得音频信号的频率特性。

Psychoacoustic模型则是根据人耳的听觉特性确定音频信号的感知重要性，并删除不被人耳感知的部分。

这些算法根据音频信号的特性自适应地确定使用哪种压缩方法以及压缩的程度，以最大限度地减小文件大小同时保持音质。

通过采样、量化和编码，MP3文件可以大大减小文件的大小，使其更容易存储和传输。

但是，由于压缩过程中丢失了一部分音频信息，所以与原始音频相比，MP3的音质稍有损失。

实战经验：使用媒体编码技术进行音频解码(九)

实战经验：媒体编码技术的音频解码探索音频解码在现代多媒体技术中扮演着重要的角色，而媒体编码技术则是实现音频解码的关键。

本文将通过探讨实战经验，从媒体编码技术的角度出发，分享使用媒体编码技术进行音频解码的相关知识和经验，希望能为读者提供一些有益的启发和指导。

一、媒体编码技术背景介绍媒体编码技术是将音频信号通过编码算法转换为数字信号的过程，以便在数字领域中传输、存储和处理音频信息。

媒体编码技术在音频解码中起到至关重要的作用，能够将音频信号压缩到更小的体积，同时保持较高的音质。

常见的媒体编码技术有MP3、AAC、FLAC等。

二、媒体编码技术的音频解码原理媒体编码技术的音频解码原理是将经编码后的数字信号通过解码算法还原为原始的音频信号。

解码过程是编码过程的逆过程，需要根据编码算法中的相关参数和信息对数字信号进行解析和还原。

三、媒体编码技术的音频解码实践1. 选择合适的解码器不同的媒体编码技术需要相应的解码器进行解码。

在实际应用中，需要根据需求和系统环境选择合适的解码器。

例如，使用MP3编码的音频文件需要使用MP3解码器进行解码，而使用AAC编码的音频文件则需要使用AAC解码器进行解码。

2. 解码器的配置和参数设置解码器的配置和参数设置对于音频解码的效果至关重要。

合理地设置解码器的相关参数，可以提高解码质量和音频还原的准确性。

需要根据实际情况进行调试和优化，比如调整解码器的码率、采样率、声道等参数。

3. 解码过程的优化与提速对于大规模的音频解码任务，解码速度的提升是非常重要的。

在解码过程中，可以通过合理的算法设计、并行处理、硬件加速等技术手段来提高解码速度。

此外，还可以预加载解码数据、实时缓存、采用延迟解码等策略来优化解码过程，提升用户体验。

四、媒体编码技术的发展和前景展望随着信息技术的不断发展和媒体应用的普及，媒体编码技术在音频解码领域将发挥越来越重要的作用。

未来，随着硬件设备的不断升级，媒体编码技术也将会不断加强和改进。

MP3播放器的工作原理

MP3播放器的工作原理MP3播放器是一种便携式音频设备，广泛应用于日常生活中的音乐播放、语音记录等场景。

它通过一系列的工作原理和技术实现了音频的存储、解码和播放。

本文将详细介绍MP3播放器的工作原理，包括音频编码、存储、解码和输出等方面。

一、音频编码MP3播放器中的音频文件通常采用MP3格式进行编码，MP3是一种有损压缩音频格式，能够在保持较高音质的同时减小文件大小。

音频编码的过程主要包括采样、量化和压缩三个步骤。

1. 采样：音频信号在进入MP3播放器之前，首先需要进行采样。

采样是将连续的模拟音频信号转换为离散的数字信号的过程。

在采样过程中，音频信号以一定的时间间隔被采集，并转换为数字形式的样本。

2. 量化：采样得到的音频信号是模拟信号的数字表示，为了减小文件大小，需要对音频信号进行量化。

量化是将连续的音频信号分为若干个离散的量化级别，以减小数据量。

量化级别越多，音频质量越好，但文件大小也越大。

3. 压缩：量化后的音频信号仍然占据较大的空间，为了进一步减小文件大小，需要对音频信号进行压缩。

MP3播放器使用了一种称为MPEG（Moving Picture Experts Group）的压缩算法，该算法通过利用人耳对音频信号的感知特性，去除一些听不到或听起来不明显的音频信号，从而实现压缩。

二、音频存储MP3播放器中的音频文件通常存储在闪存芯片中，闪存芯片是一种非易失性存储介质，具有容量大、读写速度快、抗震抗摔等特点。

音频文件通过USB接口或者内置存储卡读取到闪存芯片中。

1. USB接口：MP3播放器通常配备了USB接口，用户可以通过USB线将MP3播放器连接到电脑上，然后将音频文件传输到闪存芯片中。

USB接口还可以用于充电和数据传输。

2. 存储卡：MP3播放器还可以通过内置的存储卡来存储音频文件。

常见的存储卡类型有Micro SD卡、TF卡等。

用户可以将存储卡插入MP3播放器中，然后将音频文件复制到存储卡中。

音频编解码原理讲解和分析

音频编码原理讲解和分析作者：谢湘勇，算法部，**************************简述 (2)音频基本知识 (2)采样(ADC) (3)心理声学模型原理和分析 (3)滤波器组和window原理和分析 (6)Window (6)TDAC：时域混叠抵消,time domain aliasing cancellation (7)Long and short window、block switch (7)FFT、MDCT (8)Setero and couple原理和分析 (8)量化原理和分析 (9)mp3、AAC量化编码的过程 (9)ogg量化编码的过程 (11)AC3量化编码的过程 (11)Huffman编码原理和分析 (12)mp3、ogg、AC3的编码策略 (12)其他技术原理简介 (13)比特池技术 (13)TNS (13)SBR (13)预测模型 (14)增益控制 (14)OGG编码原理和过程详细分析 (14)Ogg V orbis的引入 (14)Ogg V orbis的编码过程 (14)ogg心理声学模型 (15)ogg量化编码的过程 (16)ogg的huffman编码策略 (17)主要音频格式编码对比分析 (19)Mp3 (19)Ogg (20)AAC (21)AC3 (22)DRA（A VS内的中国音频标准多声道数字音频编码） (23)BSAC，TwinVQ (24)RA (24)音频编码格式的对比分析 (25)主要格式对比表格如下 (26)语音编码算法简介 (26)后处理技术原理和简介 (28)EQ (28)SRS WOW (29)环境音效技术(EAX) (29)3D (30)Dolby多项后处理技术 (30)多声道介绍 (30)简述音频编解码目前主流的原理框图如图1，下面我希望由浅入深的对各算法原理作一说明。

音频基本知识▪人类可听的音频频率范围为20-20khz▪全音域可分为8度音阶（Octave）概念，每octave又可以分为12份，相当于1—7的每半音为一份（1/12 octave）▪音调和噪音：音调有规律的悦耳的声音（如乐器的1—7），噪音是无规律的难听的声音。

MP3编码原理概述

音频压缩由编码和解码两个部分组成。

把波形文件里的数字音频数据转换为高度压缩的形式(称为比特流)即为编码；要解码则把比特流重建为波形文件。

音频压缩可以分为无损(lossless)压缩和有损压缩。

无损压缩就是尽量降低音频数据的冗余度，以减小其体积。

音频信号经过编码和解码之后，必须要和原来的信号一致。

无损压缩的压缩率是比较有限的，不过现在比较出色的APE能做到50%的压缩率(本人用Monkey's Audio 3.97，Extra High压缩模式下压缩WAV，压缩率最低能达到52%)；有损压缩就是用尽一切手段，包括无损压缩用到的方法，丢掉一切能丢掉的数据，以减小体积。

而音频压缩后解码听起来起码是要跟原来差不多的，有损压缩的压缩比能大幅提高，MP3就是属于有损压缩，压缩比是12:1(128kbps)。

MP3文件是由帧(frame)构成的，帧是MP3文件最小的组成单位。

什么是帧?还记得最初的动画是怎么做的吗?不同的连续画面切换以达到动态效果，每幅画面就是一个“帧”，不同的是MP3里面的帧记录的是音频数据而不是图形数据。

MP3的帧速度大概是30帧/秒。

每个帧又由帧头和帧数据组成，帧头记录着该帧的基本信息，包括位率索引和采样率索引(这对理解ABR和VBR编码方式很重要)。

帧数据，顾名思义就是记录着主体音频数据。

上面说的都是MP3编码的基础，但事实上，早期的编码器都非常不完善，压缩算法近于粗暴，音质很不理想。

MP3的音质达到现在的水平有两次飞跃:人体听觉心理学模型(Perceptual Model)的导入和VBR技术的应用。

◆人体听觉心理学模型下面将简要介绍一下几个重要原理:1) 最小听觉门槛判定(The minimal audition threshold)人耳的听力范围是20Hz-20k Hz的频率范围，但是人耳对不同的频率声音的灵敏度是不同的，不同频率的声音要达到能被人耳听到的水平所需要的强度是不一样。

MP3播放器的工作原理

MP3播放器的工作原理MP3播放器是一种便携式音频设备，它能够播放存储在MP3格式的音频文件。

它的工作原理涉及到音频编码、存储、解码和输出等多个环节。

1. 音频编码：MP3播放器的工作原理首先涉及到音频编码。

MP3是一种有损压缩的音频格式，它能够将音频文件压缩至较小的体积，同时保持较高的音质。

在制作MP3文件时，首先需要将原始音频信号进行采样，并通过使用一种称为“离散余弦变换（DCT）”的算法将其转换为频域信号。

然后，通过利用掩码模型和心理声学模型，去除人耳听不到或者不敏感的音频信号，从而实现对音频文件的压缩。

2. 存储：MP3播放器通常使用闪存芯片作为存储介质。

闪存芯片具有非易失性存储特性，能够长期保存数据。

音频文件以MP3格式存储在闪存芯片中，用户可以通过USB接口或者SD卡等方式将音频文件传输到播放器的存储介质中。

3. 解码：当用户选择播放某个音频文件时，MP3播放器需要将存储在闪存芯片中的MP3文件解码为原始音频信号。

解码过程包括以下几个步骤：- 首先，播放器读取存储介质中的MP3文件，并将其传输到解码器中。

- 解码器对MP3文件进行解析，提取出音频数据和元数据。

- 接下来，解码器使用“逆离散余弦变换（IDCT）”算法将频域信号转换为时域信号。

- 解码器还需要进行声音增益控制、音量调节和均衡等处理，以提供更好的音质和音量控制功能。

4. 输出：解码后的音频信号将通过耳机插孔或者内置扬声器输出。

当用户使用耳机时，音频信号将通过耳机路线传输到耳机驱动单元，最终转换为声音。

如果用户选择使用内置扬声器，则音频信号将通过内置扬声器输出。

总结：MP3播放器的工作原理主要包括音频编码、存储、解码和输出等环节。

通过音频编码将原始音频信号压缩为MP3格式，然后将其存储在闪存芯片中。

当用户选择播放某个音频文件时，播放器将解码MP3文件为原始音频信号，并通过耳机或者内置扬声器输出。

这种工作原理使得MP3播放器成为一种便携式、高质量音频播放设备。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

MPEG1 Layer3 (MP3)解码算法原理详解本文介绍了符合ISO/IEC 11172-3(MPEG 1 Audio codec Layer I, Layer II and Layer III audio specifications) 或 ISO/IEC 13818-3(BC Audio Codec)的音频编码原理。

通过madlib解码库进行实现。

1、程序系统结构mp3解码流程图其中同步及差错检查包括了头解码模块在主控模块开始运行后，主控模块将比特流的数据缓冲区交给同步及差错检查模块，此模块包含两个功能，即头信息解码及帧边信息解码，根据它们的信息进行尺度因子解码及哈夫曼解码，得出的结果经过逆量化，立体声解码，混淆缩减，IMDCT，频率反转，合成多相滤波这几个模块之后，得出左右声道的PCM码流，再由主控模块将其放入输出缓冲区输出到声音播放设备。

2、主控模块主控模块的主要任务是操作输入输出缓冲区，调用其它各模块协同工作。

其中，输入输出缓冲区均由DSP控制模块提供接口。

输入缓冲区中放的数据为原始mp3压缩数据流，DSP控制模块每次给出大于最大可能帧长度的一块缓冲区，这块缓冲区与上次解帧完后的数据（必然小于一帧）连接在一起，构成新的缓冲区。

输出缓冲区中将存放的数据为解码出来的PCM数据，代表了声音的振幅。

它由一块固定长度的缓冲区构成，通过调用DSP控制模块的接口函数，得到头指针，在完成输出缓冲区的填充后，调用中断处理输出至I2S接口所连接的音频ADC芯片（立体声音频DAC和DirectDrive耳机放大器）输出模拟声音。

3、同步及差错检测同步及差错检测模块主要用于找出数据帧在比特流中的位置，并对以此位置开始的帧头、CRC校验码及帧边信息进行解码，这些解码的结果用于后继的尺度因子解码模块和哈夫曼解码模块。

Mpeg1 layer 3的流的主数据格式见下图：主数据的组织结构图其中granule0和granule1表示在一帧里面的粒度组1和粒度组2，channel0和channel1表示在一个粒度组里面的两个通道，scalefactor为尺度因子quantized value为量化后的哈夫曼编码值，它分为big values大值区和count1 1值区CRC校验：表达式为X16+X15+X2+13.1 帧同步帧同步目的在于找出帧头在比特流中的位置，ISO 1172-3规定，MPEG1 的帧头为12比特的“1111 1111 1111”，且相邻的两个帧头隔有等间距的字节数，这个字节数可由下式算出：N= 144 * 比特率 / 采样率如果这个式子的结果不是整数，那么就需要用到一个叫填充位的参数，表示间距为N +1。

3.2 头信息解码头信息解码目的是找出这一帧的特征信息，如采样率，是否受保护，是否有填充位等。

头信息见下图：帧头信息结构图其长度为4 字节，数据结构如下:typedef struct tagHeader {unsigned int sync : 11 ; / / 同步信息unsigned int version : 2 ; / / 版本unsigned int layer : 2 ; / / 层unsigned int error2protection : 1 ; / / CRC校正unsigned int bit2rate2index : 4 ; / / 位率索引unsigned int sample2rate2index : 2 ; / / 采样率索引unsigned int padding : 1 ; / / 空白字unsigned int extension : 1 ; / / 私有标志unsigned int channel2mode : 2 ; / / 立体声模式unsigned int mode extension : 2 ; / / 保留unsigned int copyright : 1 ; / / 版权标志unsigned int original : 1 ; / / 原始媒体unsigned int emphasis : 2 ; / / 强调方式} HEADER3.3 帧边信息解码帧边信息解码的主要目的在于找出解这帧的各个参数，包括主数据开始位置，尺度因子长度等。

帧边信息如下图所示：帧边信息(side_infomation)表3.4 main_data_beginmain_data_begin(主数据开始)是一个偏移值，指出主数据是在同步字之前多少个字节开始。

需要注意的是，1.帧头不一定是一帧的开始，帧头CRC校验字和帧边信息在帧数据中是滑动的。

2.这个数值忽略帧头和帧边信息的存在，如果main_data_begin = 0, 则主数据从帧边信息的下一个字节开始。

参见下图：同步示意图3.5 block_typeblock_type指出如下三种块类型：block_type = 0 长块block_type = 1 开始块block_type = 3 结束块block_type = 2 短块在编码过程中进行IMDCT 变换时，针对不同信号为同时得到较好的时域和频域分辨率定义了两种不同的块长：长块的块长为18个样本，短块的块长为6个样本。

这使得长块对于平稳的声音信号可以得到更高的频率分辨率，而短块对跳变信号可以得到更高的时域分辨率。

由于在短块模式下，3 个短块代替1个长块，而短块的大小恰好是一个长块的1/3，所以IMDCT的样本数不受块长的影响。

对于给定的一帧声音信号，IMDCT 可以全部使用长块或全部使用短块，也可以长短块混合使用。

因为低频区的频域分辨率对音质有重大影响，所以在混合块模式下，IMDCT对最低频的2个子带使用长块，而对其余的30个子带使用短块。

这样，既能保证低频区的频域分辨率，又不会牺牲高频区的时域分辨率。

长块和短块之间的切换有一个过程，一般用一个带特殊长转短（即，起始块block_type = 1）或短转长（即终止块，block_type = 3）数据窗口的长块来完成这个长短块之间的切换。

因此长块也就是包括正常窗，起始块和终止块数据窗口的数据块；短块也包含18个数据，但是是由6个数据独立加窗后在经过连接计算得到的。

3.6 big_values, count1每一个粒度组的频谱都是用不同的哈夫曼表来进行编码的。

编码时，把整个从0 到奈奎斯特频率的频率范围（共576个频率线）分成几个区域，然后再用不同的表编码。

划分过程是根据最大的量化值来完成的，它假设较高频率的值有较低的幅度或者根本不需要编码。

从高频开始，一对一对的计算量化值等于“0”的数目，此数目记为“rzero”。

然后4个一组地计算绝对值不超过“1”的量化值（也就是说，其中只可能有-1，0 和+1共3 个可能的量化级别）的数目，记为“count1”，在此区域只应用了4 个哈夫曼编码表。

最后，剩下的偶数个值的对数记为“big values”，在此区域只应用了32 个哈夫曼编码表。

在此范围里的最大绝对值限制为8191。

此后，为增强哈夫曼编码性能，进一步划分了频谱。

也就是说，对big values的区域（姑且称为大值区）再细化，目的是为了得到更好的错误顽健性和更好的编码效率。

在不同的区域内应用了不同的哈夫曼编码表。

具体使用哪一个表由table_select给出。

从帧边信息表中可以看到：当window_switch_flag == 0时，只将大值区在细分为2个区，此时region1_count无意义，此时的region0_count的值是标准默认的；但当window_switch_flag == 1时再将大值区细分为3 个区。

但是由于region0_count 和region1_count是根据从576个频率线划分的，因此有可能超出了big_values *2的范围，此时以big_values *2 为准. region0_count 和region1_count表示的只是一个索引值，具体频带要根据标准中的缩放因子频带表来查得.参见下图:缩放因子、大值区、1值区和零值区分布图3.7 处理流程4、缩放因子(scale factor)解码缩放因子用于对哈夫曼解码数据进行逆量化的样点重构。

根据帧边信息中的scalefactor_compress 和标准中的对应表格来确定的slen1和slen2 对缩放因子进行解码，即直接从主数据块中读取缩放因子信息并存入表scalefac_l[gr][ch][sfb]和scalefac_s[gr][ch][sfb]中。

对第2 粒度组解码时，若为长块，则必须考虑尺度因子选择信息。

4.1 尺度因子带（scalefactor-band）在mpeg layer 3中576条频率线根据人耳的听觉特性被分成多个组，每个组对应若干个尺度因子，这些组就叫做尺度因子带，每个长窗有21个尺度因子带而每个短窗有12个尺度因子带。

4.2 scfsiscfsi(尺度因子选择信息)用于指出是否将粒度组1的尺度因子用于粒度组2。

如果为0表示不用，则在比特流中需读取粒度组2的尺度因子。

4.3 处理流程缩放因子解码流程图5、哈夫曼解码哈夫曼编码是一种变长编码，在mp3哈夫曼编码中，高频的一串零值不编码，不超过1的下一个区域使用四维哈夫曼编码，其余的大值区域采用二维哈夫曼编码，而且可选择地分为三个亚区，每个有独立选择的哈夫曼码表。

通过每个亚区单独的自适应码表，增强编码效率，而且同时降低了对传输误码的敏感度。

在程序实现上，哈夫曼表逻辑存储采用了广义表结构，物理存储上使用数组结构。

查表时，先读入4bit数据，以这4bit数据作为索引，其指向的元素有两种类型，一种是值结构，另一种是链表指针式结构，在链表指针式结构中给出了还需要读取的bit数，及一个偏移值。

如果索引指向的是一个值结构，则这个值结构就包含了要查找的数据。

如果索引指向的是一个链表指针式结构，则还需再读取其中指定的比特数，再把读取出的比特数同偏移值相加，递归的找下去，直到找到值结构为止。

5.1 处理流程6、逆量化6.1 逆量化公式逆量化由下面公式算出：短窗模式：长窗模式:其中：is[i] ：由huffman编码构造的频率线sbg ：subblock_gainscalefac_multiplier ：= (scalefac_scale + 1) / 2其它值均可在帧边信息中找到。

7、联合立体声转换7.1 强度立体声转换在强度立体声模式中，左声道传的是幅值，右声道的scalefactor传的是立体声的位置is_pos。

需要转换的频率线有一个低边界，这个低边界是由右声道的zero_part决定的，并且使用右声道的尺度因子来作为is_pos。