MP3音频编码算法研究
mp3解码原理

mp3解码原理
MP3解码原理是指将MP3格式压缩的音频文件转换为原始音频数据的过程。
MP3是一种有损压缩技术,通过去除人耳重要性较低的音频信号和减少冗余数据来减小文件大小。
下面是MP3解码的基本步骤:
1. 分析压缩数据:将MP3文件的压缩数据进行分析,提取出有关音频信息的数据。
2. 解压缩:使用解压缩算法对压缩的音频数据进行解压,恢复成原始音频数据。
3. 重构信号:将解压缩的音频数据进行重构,恢复出原始的声音信号。
4. 反量化:将解压缩后的音频数据进行反量化,恢复出原始采样点的数值。
5. 逆变换:使用逆变换算法对反量化的音频数据进行逆变换,恢复出时域的音频样本。
6. 重建滤波:通过应用特定的重建滤波器将逆变换得到的音频样本进行滤波处理。
7. 输出音频:最终将重建滤波后的音频样本输出,生成原始的音频文件。
通过以上步骤,MP3解码器可以将MP3文件解码成原始的音频数据。
这些原始音频数据可以被音频播放器或其他应用程序使用来播放或处理音频文件。
mp3压缩编码标准

mp3压缩编码标准
MP3(MPEG-1 Audio Layer III)是一种数字音频压缩编码标准,它是MPEG(Moving Picture Experts Group)制定的音频压缩标准
之一。
MP3编码标准使用了一种称为“感知编码”的技术,它利用
人耳对声音的感知特性来去除音频信号中的冗余信息,从而实现高
效的压缩。
MP3编码标准的主要特点包括以下几个方面:
1. 压缩比,MP3编码可以实现相对较高的压缩比,通常可以将
原始音频数据压缩到其约1/10至1/12的大小,而且在保持相对较
高的音质的同时实现了这一压缩比。
2. 损失压缩,MP3是一种损失压缩技术,这意味着在压缩过程
中会丢失一些音频信息,但通常这些丢失的信息对于人耳来说是难
以察觉的,因此可以接受这种损失以换取更高的压缩比。
3. 采样率和比特率,MP3编码标准支持不同的采样率和比特率,用户可以根据需要选择不同的设置来平衡音质和文件大小之间的关系。
常见的比特率有128kbps、192kbps、256kbps等,而常见的采
样率有44.1kHz、48kHz等。
4. 广泛应用,由于MP3编码标准具有较高的压缩比和良好的音质表现,因此在互联网上广泛应用于音乐下载、在线音乐流媒体等领域,成为了数字音频传输和存储的重要标准之一。
总的来说,MP3是一种高效的音频压缩编码标准,它在保证相对较高音质的同时实现了较高的压缩比,因此被广泛应用于音频领域。
mp3编码原理

mp3编码原理
MP3(MPEG-1 Audio Layer III)是一种常见的音频编码格式,它使用了基于人类听觉特性的压缩算法来减小音频文件的大小。
以下是MP3 编码的基本原理:
1. 采样:音频信号首先会经过采样过程,将模拟音频信号转换为数字形式。
通常,CD音质的音频以44.1 kHz的采样率进行采样。
2. 分析与预处理:将数字化的音频信号分为小的时间片段(通常称为帧),通常每帧包含数百至数千个采样点。
在这一阶段,还会对音频信号进行一些预处理,如使用滤波器来降低高频噪音。
3. 傅里叶变换:对每个帧进行傅里叶变换,将时域的音频信号转换为频域表示。
这个步骤将音频信号分解为一系列频率成分。
4. 掩蔽模型:利用人类听觉的掩蔽效应,即在音频信号中的较强频率成分可以掩盖较弱频率成分,这样就可以有选择地保留或丢弃一些频率成分。
这有助于减小编码后的文件大小而不损失人耳感知到的音质。
5. 量化:将频域表示的音频信号进行量化,将其映射到一个较小的值集合。
这减小了文件的大小,但也引入了一些损失。
6. 编码:使用哈夫曼编码等技术对量化后的数据进行熵编码,以进一步减小文件的大小。
哈夫曼编码是一种可变长度编码,用于将频繁出现的值表示为较短的编码,而不频繁出现的值表示为较长的编码。
7. 生成比特流:最终,将所有编码后的数据组合成比特流,形成最终的MP3 文件。
MP3 编码的关键点在于利用了人耳的特性,对音频信号进行有损压缩,以尽可能减小文件大小。
由于是有损压缩,因此编码后的文件和原始音频信号之间存在一些信息损失,但通常这种损失在人耳听觉范围内是难以察觉的。
音频编解码原理讲解和分析

音频编码原理讲解和分析作者:谢湘勇,算法部,**************************简述 (2)音频基本知识 (2)采样(ADC) (3)心理声学模型原理和分析 (3)滤波器组和window原理和分析 (6)Window (6)TDAC:时域混叠抵消,time domain aliasing cancellation (7)Long and short window、block switch (7)FFT、MDCT (8)Setero and couple原理和分析 (8)量化原理和分析 (9)mp3、AAC量化编码的过程 (9)ogg量化编码的过程 (11)AC3量化编码的过程 (11)Huffman编码原理和分析 (12)mp3、ogg、AC3的编码策略 (12)其他技术原理简介 (13)比特池技术 (13)TNS (13)SBR (13)预测模型 (14)增益控制 (14)OGG编码原理和过程详细分析 (14)Ogg V orbis的引入 (14)Ogg V orbis的编码过程 (14)ogg心理声学模型 (15)ogg量化编码的过程 (16)ogg的huffman编码策略 (17)主要音频格式编码对比分析 (19)Mp3 (19)Ogg (20)AAC (21)AC3 (22)DRA(A VS内的中国音频标准多声道数字音频编码) (23)BSAC,TwinVQ (24)RA (24)音频编码格式的对比分析 (25)主要格式对比表格如下 (26)语音编码算法简介 (26)后处理技术原理和简介 (28)EQ (28)SRS WOW (29)环境音效技术(EAX) (29)3D (30)Dolby多项后处理技术 (30)多声道介绍 (30)简述音频编解码目前主流的原理框图如图1,下面我希望由浅入深的对各算法原理作一说明。
音频基本知识▪人类可听的音频频率范围为20-20khz▪全音域可分为8度音阶(Octave)概念,每octave又可以分为12份,相当于1—7的每半音为一份(1/12 octave)▪音调和噪音:音调有规律的悦耳的声音(如乐器的1—7),噪音是无规律的难听的声音。
mp3 编码原理

mp3 编码原理MP3是一种音频压缩技术,其全称是动态影像专家压缩标准音频层面3(Moving Picture Experts Group Audio Layer III),简称为MP3。
它被设计用来大幅度地降低音频数据量。
利用MPEG Audio Layer 3 的技术,将音乐以1:10 甚至1:12 的压缩率,压缩成容量较小的文件,而对于大多数用户来说重放的音质与最初的不压缩音频相比没有明显的下降。
以下是MP3编码的基本原理:1. 采样:这是音频编码的第一步。
MP3在创建时,会以160000Hz的频率对音频信号进行采样。
这意味着每秒钟会获取160000个样本。
2. 量化:在采样后,每个样本都会被转化为一个数字。
在MP3中,这个数字的范围是-32768到32767。
这个过程被称为量化。
3. 编码:量化后的数据需要进行编码,才能被计算机理解和存储。
在MP3中,使用了Huffman编码和Run-Length Encoding(RLE)等压缩技术。
4. 心理声学模型:这是MP3编码中最核心的部分。
通过使用心理声学模型,MP3编码器可以预测哪些频率和声音人类难以察觉,从而进一步压缩数据。
5. 压缩:经过心理声学模型处理后,音频数据会被进一步压缩,以减少存储空间的需求。
6. 解码:当播放MP3时,解码器会逆转上述过程,从压缩的音频数据中还原出原始的音频信号。
7. 解码器:最后,音频信号会被送入扬声器或其他设备进行播放。
需要注意的是,这个过程是一个复杂且精细的过程,涉及到许多数字信号处理和心理学知识。
尽管如此,它仍然是现代音频编码的基础之一,影响了许多其他的音频编码和压缩技术。
高效音频编解码技术的研究与实现

高效音频编解码技术的研究与实现随着数字音频技术的发展,音频编解码技术在各种领域中得到了广泛的应用,如音乐产业、广播电视、通信和多媒体等。
高效音频编解码技术在保证音质的同时能够有效压缩数据量,提高传输效率和存储空间利用率。
本文将探讨当前热门的高效音频编解码技术和它们的实现方法。
一、常见高效音频编解码技术1. MP3(MPEG-1 Audio Layer 3):MP3是一种流行的音频编码格式,它通过去除人耳听不到的频率成分和利用人耳对声音的特性进行有损压缩。
MP3编码技术在减小音频文件大小方面取得了很大的成功,使得音频文件能够更高效地在网络中传输。
2. AAC(Advanced Audio Coding):AAC是一种比MP3更高效的音频编码格式。
它通过采用更高级的信号处理算法和更多的编码参数,以更少的比特率实现与原始音频信号相似的音质。
因此,AAC成为了数字音频广播、在线音乐和移动通信领域的首选格式。
3. Opus:Opus是一种开放、免费的音频编码格式,被广泛应用于网络电话、实时音频流传输和网络音频通信等领域。
Opus具有低延迟、高音质和良好的容错性,在语音通信和音频传输中具有广阔的应用前景。
二、高效音频编解码技术的实现方法1. 信号处理算法:高效音频编解码技术的核心是信号处理算法。
在音频编码过程中,通过分析音频信号的频域信息和时域特征,对频率成分进行量化和压缩,以减少数据量。
而在解码过程中,通过反量化和重新合成来恢复原始音频信号。
因此,对信号处理算法的研究和改进至关重要。
2. 人耳音频模型:人耳对音频信号的感知与信号的物理特性有关。
高效音频编解码技术可以通过模拟人耳的感知机制,在保证音质的同时减少数据量。
研究人耳音频模型可以帮助优化编码算法和参数选择,提高压缩效率。
3. 优化压缩算法:为了提高高效音频编解码技术的压缩效率,需要从算法的角度进行优化。
通过深入研究数据压缩和压缩算法,可以将冗余部分和不必要的信息去除,以达到更高的压缩比率。
音视频编解码算法研究与应用
音视频编解码算法研究与应用一、介绍音视频编解码算法是数字媒体技术中的重要领域,它们能够将音视频信号压缩存储、传输并且恢复成高品质的音视频信号。
这些算法应用于许多领域,如网络视频传输、娱乐、通信等等。
本文将介绍音视频编解码算法的一些基本概念、常见算法以及应用。
二、编解码算法初步1、编码/压缩编码/压缩是指将音视频信号中的冗余信息和无用信息进行削减,并用最小的数据量来代表原始信号的过程。
这样可以减小音视频文件的大小,提高数据传输和存储效率。
常见压缩编码算法包括:H.264、MP3、AAC、MPEG2等等。
2、解码/解压缩解码/解压缩就是将压缩之后的数据恢复成原始音视频信号的过程。
它需要使用相应的解码器进行解压缩,并且对解码之后的数据进行进一步处理以得到高质量的音视频信号。
三、编解码算法分类1、视频编解码算法常见的视频编解码算法包括H.264、H.265、MPEG2、MPEG4等等。
其中,H.264是目前最常用的视频编解码算法之一,适用于网络视频传输、DVD压缩等领域。
而H.265是H.264的后继者,能够更好地压缩和解码高分辨率视频。
2、音频编解码算法常见的音频编解码算法包括MP3、AAC、WAV等等。
其中,MP3是比较常用的音频编解码算法,适用于网络音乐、手机铃声等领域。
而AAC比MP3质量更高,压缩率更高,能够提供更高质量的音频。
四、音视频编解码算法应用1、网络视频当前,视频网站如优酷、爱奇艺等,以及视频会议、在线教育等平台都需要使用音视频编解码算法,以便实现高效的数据传输和流畅的播放效果。
2、娱乐各种数字娱乐设备和软件都需要使用音视频编解码算法,以便提供高清晰度、高帧率的游戏画面和动态影像。
3、通信音视频编解码算法也广泛应用于通信领域,例如视频通话、音频通话、网络电话等等。
通过数据的压缩和解压缩,可以降低通讯成本和提高数据传输效率。
五、结论总之,音视频编解码算法是数字媒体技术中的核心领域之一。
音频编码算法原理解析
音频编码算法原理解析介绍本文将对音频编码算法的原理进行解析。
音频编码算法是一种将模拟音频信号转换为数字形式的算法,以实现音频的传输和存储。
它可以将音频信号的频率、幅度等信息进行编码和压缩,以达到较小的文件大小、较高的传输效率和较好的音质。
编码原理音频编码算法的原理主要包括以下几个方面:1. 采样:音频信号需要进行采样,将连续的模拟信号转换为离散的数字信号。
采样过程中需要确定采样率,即每秒采样的次数。
2. 量化:采样后的信号需要进行量化,将连续范围的数值转换为离散的数值。
量化过程中需要确定量化位数,即每个采样值的表示精度。
3. 编码:量化后的信号需要进行编码,将数值表示为二进制形式。
编码过程中可以采用各种编码算法,如脉冲编码调制、差分编码、行程长度编码等。
4. 压缩:编码后的信号可以进行压缩,以减小文件大小。
常用的压缩算法有无损压缩和有损压缩两种。
常见编码算法1. PCM编码:PCM(Pulse Code Modulation)是一种常见的音频编码算法。
它将音频信号进行线性量化和编码,并通过采样率和量化位数来确定音质和文件大小。
2. MP3编码:MP3(MPEG-1 Audio Layer 3)是一种有损压缩的音频编码算法。
它采用了人听觉系统的特性,并通过抽取信号中的冗余信息来减小文件大小。
3. AAC编码:AAC(Advanced Audio Coding)是一种高级音频编码算法。
它在MP3编码的基础上进一步优化了压缩效率和音质,广泛应用于音频传输和存储领域。
4. Vorbis编码:Vorbis是一种开源的音频编码算法。
它采用了无损压缩和可变位率编码的方式,能够在较小的文件大小和较好的音质之间取得平衡。
结论音频编码算法在音频传输和存储中起着重要作用。
通过采样、量化、编码和压缩等步骤,可以实现音频信号的数字化表示和有效的传输。
常见的编码算法包括PCM、MP3、AAC和Vorbis等。
在选择编码算法时,需要根据具体需求和资源限制来进行合理的选择。
mp3编解码原理
mp3编解码原理MP3(MPEG Audio Layer-3)是一种有损的音频压缩格式,可以高效地压缩音频文件的大小而不丢失太多的音质。
MP3编解码原理是指在将音频文件转换为MP3格式时所采用的算法和技术,以及将MP3文件转换回原始音频文件的过程。
MP3编码过程分为三个主要的步骤:声音预处理、声音量化和声音编码。
首先是声音预处理。
在这一步骤中,原始音频信号被分成多个频率带,以更好地符合人耳对声音的感知。
通过应用快速傅里叶变换(FFT)可以将音频信号从时域转换为频域,得到其频谱信息。
这一步骤还会进行声音的平滑处理和降噪。
接下来是声音量化。
在这一步骤中,声音信号的幅度被量化为一系列离散值,以便后续编码。
为了减小文件大小,量化级别是通过使用人耳模型来确定的。
人耳对于不同频率声音的敏感度不同,高频声音的数量级要比低频声音高。
因此,在量化过程中,对于高频信号使用较高的量化级别,对于低频信号使用较低的量化级别。
最后是声音编码。
在这一步骤中,使用哈夫曼编码将量化后的数据进行进一步压缩。
哈夫曼编码是一种变长编码,通过给频繁出现的量化值分配较短的编码,而给不经常出现的量化值分配较长的编码,从而实现对数据的高效压缩。
而MP3解码过程则是上述步骤的逆过程。
首先是声音解码。
在这一步骤中,使用哈夫曼解码将MP3文件中的编码数据解码为量化后的数据。
接着是声音逆量化。
与量化过程相反,逆量化将量化后的数据转回幅度值。
最后是声音逆预处理。
在这一步骤中,使用逆快速傅里叶变换(IFFT)将频域信号转换回时域信号。
总的来说,MP3编解码原理的核心是通过声音预处理、声音量化和声音编码实现了对音频数据的压缩。
通过对声音信号进行分析和压缩,MP3能够在保证一定音质的前提下,大大减小音频文件的大小,从而在存储和传输音频上发挥了重要的作用。
同时,由于MP3格式的流行,使得人们可以随时随地享受高质量的音频内容。
MP3解码算法原理
MP3解码算法原理MP3是一种常见的音频压缩格式,旨在减小存储空间和传输带宽而不显著损失声音质量。
MP3编码技术基于听觉模型原理,主要使用了声音掩蔽和频域分析等方法来减少数据量。
1.分帧:首先,MP3解码算法将原始MP3文件按照一定的长度进行分帧,通常是以毫秒为单位。
这样做是为了方便对音频信号进行处理。
2.傅立叶变换:每一帧的音频信号会通过傅立叶变换转换为频域的表达形式。
傅立叶变换可以将时域上的音频信号转换为频域上的频谱信号。
3.子带滤波:经过频域转换后的信号进行子带滤波处理。
子带滤波是将频域上的信号分解成多个子带频谱,每个子带代表一定频率范围内的信号。
4.量化:通过对子带频谱进行量化操作,将连续的音频信号变为离散的数值表示。
量化过程中,较小幅度的频谱被较高的分辨率量化,而较大幅度的频谱被较低的分辨率量化。
5.熵编码:对量化后的离散数值进行熵编码,以进一步减少数据量。
常用的熵编码方法包括霍夫曼编码和算术编码。
6.重建:通过逆量化和逆子带滤波操作对熵编码后的数据进行重建,得到重新量化的子带频谱。
7.逆傅立叶变换:将重建的子带频谱通过逆傅立叶变换,转换为时域上的音频信号。
8.重叠相加:由于初始分帧时可能会导致信号边缘的失真,为了减少这种失真,需要将相邻帧的信号进行重叠相加。
重叠相加是通过将相邻帧之间的重叠部分进行平滑混合,进而补偿边缘效应。
9.重建滤波:最后,通过重建滤波器对重叠相加后的信号进行滤波处理,去除高频噪音和失真,还原出更接近原始音频信号的解码结果。
总结起来,MP3解码算法主要包括分帧、傅立叶变换、子带滤波、量化、熵编码、重建、逆傅立叶变换、重叠相加和重建滤波等过程。
通过这些步骤,MP3解码算法可以将经过压缩的MP3文件解码为高质量的音频信号。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图2 子带编解码工作原理图
信息、 主数据等有关信息组合成适合于解码的
帧。下面分别对每一块进行讨论。
一 2—
首先用一组带通滤波器将输人信号分成若 干子带信号,然后将这些带通信号经过频谱搬 移到基带位置 ,再对它们分别采样。然后根据
算法研究
各子带的比特分配信息对信号进行量化编码, 再将各子带的信码按照一定格式合录成一个总
数字音频领域得以广泛流行。本文在介绍 M 音频编码发展现状和 M 音频编码算法基本原理的基础 冉 矜 上,对多相子带滤波器组和子带编码原理进行了深入的分析和研究。
〔 玛 ; 关健词」M 音频; 编码 ; 算法; 滤波
1 .引言
数据和音频压缩数据所需的时钟信息都包含在 系统流中, 其中音频编码可以独立使用。
பைடு நூலகம்
信码传输给解码端。在解码端,把总信码分成 各子带信码后分别进行解码,再经过插值恢复 原始采样频率,之后由频谱搬移到原来的位置,
经带通滤波器最后相加得到重建信号。根据该 过程可以看出子带编码主要有以下几个优点: ( 可以根据声音信号固有的频谱非平坦 ) 1 性,对不同的子带合理分配比特数,使数据率
信号作 M C ( oi dDs t on r s D T Md e ireCseTa - 6 c e i n
o f ,改进的离散余弦变换) m r ,得到 56 7 个等间 距的频域样值。经过时/ 频变换后得到的频域样 值需要根据所要求的模式进行声道模式处理, 经模式处理后的频域样值,就可以进行量化和 编码了。原始的PM数据流分为两路,一路进 C
更精确地与各子带的信源统计特性相匹配。 ()调整不同子带的比特分配值,就能控 2 制总的重建误差频谱形状。例如可按人耳的听 觉特性对量化噪声谱进行整形,使重建信号的
主观听觉质量提高。 ( 各子带的量化噪声相互独立,都限制 ) 3 在自己的子带内,这样就能避免能量较小的输 人信号被其他频带的量化噪声所掩蔽。 子带编码有两个关键之处:一是构造好的 多相滤波器以减少延时,并体现出人耳的听觉 临界频带特性;二是采用合适的比特分配技术 控制量化噪声谱来得到最好的主观听觉效果。
程, 将各子带搬移到零频率附近,得到相应的 低通信号表示。然后在它们的奈奎斯特频率上 重新采样, 再用 P M或其它数字编码方案进行 C 编码。在此过程中,可以根据感觉准则对不同 子带分配以不同的编码比特数。子带编码实质 上是一种频域编码方式,它的基本思想是将输 人的音频信号在频域范围内分成若干个子带, 分别对耳个子带进行合理的比特分配和量化编 码从而控制各个子带的误差,使得误差谱形状
Z X. I) X ( 下转第3 页) 7
一 3一
计算机安全
与操作系统紧密结合, 不存在兼容性、可靠性、 障; )多平台、多方位的反病毒体系。 6
参考文献:
【 M o’N .We 服 务安全技 术 与原 理 ] r l a k l i e b 【 .冉 晓呈,郭文伟译.北京:清华 大学 出版 Ml 社, 03 2 .
为犯肠15 3 肠15 且保持高保真的音质。 “ 一8 “ , 4 依次下去的等级提供更高的质量和越来越高的 压缩率, 但要求计算机有越来越强的压缩计算
能力。典型数据为,层 1 目标是每个通道 的 1 K i5 层 n的目标是每个通道 18 口 , 2 9b 口 , 2 肠15
讲师, 研究方向为通信与电子系 统及管理信息系统。 作者简介:1 .熊开盛,男,湖北通城人 硕士, 2 .董兆鑫,男, 安徽安庆人 国防科技 大学电子工程学院教授。
图I M E 一 le 1 PG l : 编码过程框图 y a
4 .多相子带滤波器组
了广泛应用。M G一 leu编码的流程如图 E P la l y r
1 所示 。
在图 1 输人的 P M音频数据是按帧处 中, C
理的,每 1 个 PM样值划分为一帧,而每 1 2 5 C 帧又分为两节,即5 样值/ 6 7 节。M 的压缩实 3 P 质上属于有损压缩,实现压缩的理论基础是人
所谓子 就 ( , ub d on) 带编码 是 S S a Cdg B bn i
利用带通滤波器 (P 组将输人信号频带分 BF )
成多个子带,通过等效于单边带幅度调制的过
7 个 C 56 PM样值作时域/ 频域变换:首先将 P M数据送人子带滤波器组,经子带滤波后均 C
匀地划分为 3 个子带信号; 2 然后分别对各子带
2 P G音频编码发展状况 .M E
M G一 音频编码标准支持单声道、双声 E P 1 道、 立体声或联合立体声的两个声音通道的编
码格式。由于该压缩算法可以把 C D音质的两 个通 道共 包 含 14 b 5的数 据 流压缩 到 .M “ i
1 K 口, 8 i 2 b 5 且仍然保持高保真的声音, 使其很
5 .结束语
本文对 M 音频编码算法进行了较为全面 玛 的介绍,并对该算法中涉及的多相子带滤波器 组进行了重点的研究。由于篇幅所限,对 M 玛 算法中涉及的生理学模型、M C 、非线性量 DT
化和编码及帧数据流格式化则没有介绍。 参考文献:
【 卢官明.数字音频原理及应用 【 .北京: ] 1 Ml 机械工业出 版社, (5 2 . ) X 〔] 2 余世聪,尹俊勋.音频压缩编码中的参数比 特分配技术 〔 .电声技术, 02 1. ] J 2 ,() 〔」 3 王建听,董在望.M G音频编码算法的研究 E P 与实时实现 【 〕 J .清华大学学报 ( 自然科 学版) , 1 7 1) 9 ,(0 . 【]潘亚涛,周宏.基于D 的M 编解码系统 4 P S 3 P
社 ,19 . 95
续5 个数据点所构成的输人矢量, 2 1 变换成一个 具有3 个分量的输出矢量, 2 输出矢量的犯 个数
据点又按子带频率从低到高的顺序排列。子带滤 波器组完成了输人样本从时域到频域的映射,由 于标准提供了特定的时频映射变换矩阵,所以计
[] e D io, .Gb n T场 Br r 媒体数字压缩 6J y T r s o ee多 g 原理与标准 【 . M] 李煌晖译.北京:电子工业出版社,
M E ( v gP t xesGo )是 on iu Epr r p PG M i c r e t u 动态图象专家组织的英文缩写,这个国际组织 成立于18 年, 98 致力于建立和制定视频和音频
压缩标准。该组织于 19 年正式推出了具有 92
1 M “ 数据传输率的数字存储媒体运动图像 . b5 Si
J 决得到国际认可。随着多媒体技术和网络通信
技术的进一步发展, 1 年又推出了1 / 在9 4 9 5 0 IC31 即M G一 运动图像及其伴音通用 E 188 E P 2
压缩标准。M G一 和 M E 2音频压缩编 E P 1 P G一 码都提供了3 个压缩层。层 1 是简单压缩,它 是一种听觉生理声学模型下的亚抽样编码, 层 n加人了更高的精度, 1是现在流行的 M 层 玛 音乐格式, 加人了非线性量化、霍夫曼编码和 其它实现低速率高保真音质的先进技术,可以 把一个 14 b 5 .M “ 的立体声双通道数据流压缩 i
系统的资源占用率和运行效率的问题; 优 ) 2 秀的病毒发现能力和病毒清除能力; 实时 ) 3
体听觉系统掩蔽效应,包括时域掩蔽效应和频 域掩蔽效应,而主要应用了频域掩蔽效应。为 了有效的应用频域掩蔽效应,需要对每节的
多相子带滤波器组对输人的时域音频数据 进行滤波和二次采样, 该滤波器组为临界采样 ( 即在时间域和分析域具有相同的样点数) 。滤 波器实现的时域到频域的转换主要是由于子带 编码的作用。子带编码是应用于音频信号的一 种功能强大的编码方式,它可以用于任何音源 的音频信号, 且效果良 好。 41 子带编码 .
每个带通滤波器的长度为5 点。因此, 2 1 实际上 是用一个 犯 * 1 的变换矩阵将输入序列中的连 5 2
设计与实现 〔 .计算机工程, 01 2 ( : - ] J 2 , 7 7 8 ) 1
8. 2
【 余崇智,李存珠译.运动图像及其伴音的压 ] 5
缩 与 编 码一M E 〔 . 南 京:南 京 大 学 出版 P G M] I
42 子带滤波器组算法 .
子带滤波器组算法是将规定格式的数字音频 信号 ( 若其采样频率是科.K Z 每样本量化为 IH ,
6 1位, 则其编码比特率为1 * 1 b 5 若是 6 4 0i , 口
立体声, 则码速率应加倍, 其值为1 lbs . Mp, l 4
即C 格式音乐的比特率)分解成3 个子带输 D 2 出。由3 个有限冲击响应型带通滤波器组成, 2
及其伴 音 的 M G 一1标 准 草 案,即 1 E P 5 / 0 IC l7 ,于 19 年正式通过。该标准规定了 E ll2 93 数字音视频编码的国际标准,主要包括三个方 面:系统 、视频和音频。视频压缩仅仅包含画 面信息, 音频压缩包含声音信息,系统则实现 音频和视频的同步。所有播放 M E PG视频压缩
基金项 目:湖北省教育厅科研计划项 目 ( 编号: 03 C0 。 20 B ) 1
一 1—
算法研究
层 m 的目 标是每个通道 6K 口 。 4 h 5 i 3 M E 1即 r 编码 . P G一 1 e l
M G一 a l le n压缩编码算法是1 ( - E P ly r 5 I 0 n
适应人耳的听觉特性 ,获得好的主观听觉质量。 编码工作原理如图2 所示。
入子带滤波器,另一路经适当延时后进人生理
声学模型。生理声学模型是对掩蔽效应的具体 应用, 它在对当前音频信号的频域特性进行分 析的基础上, 依据己预先建立起来的统计模型 数据求出各个子带的信号掩蔽比,并以此指导 频域样值量化的进行,使得量化噪声尽可能地 分布在不易察觉的频带。帧数据流格式化是编 码过程的最后一个环节,其任务是按照 M 标 玛 准所规定的码流格式,把帧头、纠错码、辅助