aac编码参数

合集下载

各种音频编码方式的对比

各种音频编码方式的对比内容简介：文章介绍了PCM编码、WMA编码、ADPCM编码、LPC编码、MP3编码、AAC编码、CELP编码等，包括优缺点对比和主要应用领域。

PCM编码(原始数字音频信号流)类型：Audio制定者：ITU-T所需频宽：1411.2 Kbps特性：音源信息完整，但冗余度过大优点：音源信息保存完整,音质好缺点：信息量大，体积大，冗余度过大应用领域：voip版税方式：Free备注：在计算机应用中，能够达到最高保真水平的就是PCM编码，被广泛用于素材保存及音乐欣赏，CD、DVD以及我们常见的WAV文件中均有应用。

因此，PCM约定俗成了无损编码，因为PCM代表了数字音频中最佳的保真水准，并不意味着PCM就能够确保信号绝对保真，PCM也只能做到最大程度的无限接近。

要算一个PCM音频流的码率是一件很轻松的事情，采样率值×采样大小值×声道数bps。

一个采样率为44.1KHz，采样大小为16bit，双声道的PCM编码的WAV文件，它的数据速率则为44.1K×16×2 =1411.2Kbps。

我们常见的Audio CD就采用了PCM编码，一张光盘的容量只能容纳72分钟的音乐信息。

WMA(Windows Media Audio)类型：Audio制定者：微软公司所需频宽：320～112kbps（压缩10～12倍）特性：当Bitrate小于128K时，WMA几乎在同级别的所有有损编码格式中表现得最出色，但似乎128k是WMA一个槛，当Bitrate再往上提升时，不会有太多的音质改变。

优点：当Bitrate小于128K时，WMA最为出色且编码后得到的音频文件很小。

缺点：当Bitrate大于128K时，WMA音质损失过大。

WMA标准不开放，由微软掌握。

应用领域：voip版税方式：按个收取备注：WMA的全称是Windows Media Audio，它是微软公司推出的与MP3格式齐名的一种新的音频格式。

aac编码介绍

音频编码流程：硬件采集→PCM编码[原始量化点|样值] →分帧[960|1024][生成原始帧raw frame|原始数据块] →封装[ADTS|LATM(较主流)] 待续Ps:原始数据块以帧的形式存在，故又称为原始帧。

AAC:最初为MPEG-2音频编码标准，后来经过优化又被加入到MPEG-4音频标准之中；相对于mp3,wmv,mp2,ac3，等在相同播放质量码率更低，有效地节约了传输带宽，在移动广播领域，互联网流媒体，IPTV中有着很广泛的应用。

其最常见的封装格式为：ADTS AND LATM这是广播电视、通信领域常用的封装格式。

RTP 协议采用的AAC封装格式是LATM格式，这里ADTS LATM间的转换尤为重要，AAC格式压缩编码标准：AAC编码规格：LC-AAC：地复杂度编码HE-ACC：高效率编码，这里引入了SBR[频段复制技术]技术，又称为AAC+技术HE-AAC-V2：在AAC+的基础之上又引入了PS[参数化立体声]技术封装格式：ADTS格式：short for ：audio data transform stream对前述原始帧进行ADTS封装就形成ADTS帧，ADTS帧：帧头+帧净荷组成，帧头存储了音频的相关参数信息：采样率，声道数，帧长度等关键信息[用帧净荷数据的解析解码]。

帧净荷主要有原始帧组成[960|1024个样值]。

可包含1~4个原始帧。

LATM格式：Low overhead MPEG-4 audio transport Multiplex.[低开销因音频传输复用] LATM也以帧为单位，组成为：AudioSpecificConfig+音频负载组成。

AudioSpecificConfig描述了一个LATM帧的信息，音频负载主要由PayloadLengthInfo及音频负载组成[多组]。

AudioSpecificConfig可以是带内传输也可以带外传输，AudioSpecificConfig一般不变，所以只需发送一次，由此可见AudioSpecificConfig采用带内传输可以适应编码信息不断变化的情况，而采用带外传输，可以节省音频传输码率，带内和带外由muxConfigPresent标志决定[0:带外|1:带内]。

AAC音频编码解析

❖ ADTS （音频传输流）是AAC 音频码流的封装格式之一。一个ADTS 帧由帧头和帧净
荷组成。帧头定义了音频采样率、声道数和帧长度等关键信息，用于帧净荷数据的解析和解码。音频经压缩后的AAC 格式码流以原始帧形式存在，帧净荷主要由原始帧组成，一个ADTS 帧以包含1 至4 个原始帧。

❖ 运算法则 AAC所采用的运算法则与MP3的运算法则有所不同，AAC通过结合其他的功能来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法（比如MP3等）。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。号称「最大能容纳48通道的音轨，采样率达96 KHz，并且在320Kbps的数据速率下能为5.1声道音乐节目提供相当于ITU-R广播的品质」。

Principle
音频编码流程图

❖ AAC系统包含了滤波器组、心理声学模型、量化与编码、预测、TNS、立体声处理和增益控制等多种高效的编码工具。这些模块或过程的有机组合形成了AAC系统的基本编解码流程。在实际应用中，并不是所有的功能模块都是必需的，下表列出了各模块的可选性：
工具(模块) 码流打包无噪声编码量化器缩放因子处理 M/S立体声处理
预测 IS(强度立体声) / 耦合声道处理
TNS 滤波器组增益控制(预处理) 心理声学模型(感知模块)

Principle
可选性必必必必选选
选
选必选
必

Principle
❖ MPEG－2 /4 AAC 音频编码技术 MPEG－2 /4AAC 是一种感知音频编码算法，通过去除音频信

录音格式AAC,MP3,WAV是什么意思

录音格式AAC,MP3,WAV是什么意思
AAC（Advanced Audio Coding），中文名：高级音频编码。

出现于1997年，基于MPEG-2的音频编码技术。

由Fraunhofer IIS、杜比实验室、AT&T、索尼等公司共同开发，目的是取代MP3格式。

MP3是一种音频压缩技术，其全称是动态影像专家压缩标准音频层面3（Moving Picture Experts Group Audio Layer III），简称为MP3。

将音乐以1:10 甚至1:12 的压缩率，压缩成容量较小的文件，而对于大多数用户来说重放的音质与最初的不压缩音频相比没有明显的下降。

它是在1991年由位于德国埃尔朗根的研究组织Fraunhofer-Gesellschaft的一组工程师发明和标准化的。

WAV格式是微软公司专门为Windows开发的一种标准数字音频文件，对音频文件基本没有压缩，文件能记录各种单声道或立体声的声音信息，并能保证声音不失真，缺点就是文件比较大。

总结：WAV是一种无损音频格式，音质较高文件较大，而MP3和AAC都是压缩音频格式，而AAC在相同码率下音质更好。

ffmpeg 各种编码器使用方法

一、介绍ffmpeg编码器ffmpeg是一个开源的音视瓶处理工具，可以进行音视瓶的编解码、转换和流媒体的处理。

在使用ffmpeg进行编码时，我们可以选择不同的编码器来实现不同的功能，比如压缩、转换、解码等。

本文将介绍一些常见的编码器，并说明它们的使用方法。

二、常见的音频编码器1. AAC编码器AAC（Advanced Audio Coding）是一种高级音频编码格式，常用于音乐和音频流媒体的编码。

在ffmpeg中，可以使用libfaac库来支持AAC编码，具体命令如下：ffmpeg -i input.wav -c:a libfaac -b:a 128k output.aac参数说明：-i input.wav：指定输入文件为input.wav-c:a libfaac：选择使用libfaac库进行音频编码-b:a 128k：设置音频比特率为128kbpsoutput.aac：指定输出文件为output.aac2. MP3编码器MP3（MPEG-1 Audio Layer 3）是一种广泛使用的有损音频压缩格式，适用于音乐和语音的编码。

在ffmpeg中，可以使用libmp3lame库来支持MP3编码，具体命令如下：ffmpeg -i input.wav -c:a libmp3lame -q:a 2 output.mp3参数说明：-i input.wav：指定输入文件为input.wav-c:a libmp3lame：选择使用libmp3lame库进行音频编码-q:a 2：设置音频质量因子为2（取值范围0-9，数值越大，音质越低）output.mp3：指定输出文件为output.mp3三、常见的视瓶编码器1. H.264编码器H.264（又称AVC）是一种高效的视瓶编码格式，适用于视瓶会议、高清电视等场景。

在ffmpeg中，可以使用libx264库来支持H.264编码，具体命令如下：ffmpeg -i input.mp4 -c:v libx264 -crf 23 -preset slowoutput.mp4参数说明：-i input.mp4：指定输入文件为input.mp4-c:v libx264：选择使用libx264库进行视瓶编码-crf 23：设置视瓶质量因子为23（取值范围0-51，数值越小，视瓶质量越高）-preset slow：设置编码速度为slow（速度越慢，压缩效率越高）output.mp4：指定输出文件为output.mp42. H.265编码器H.265（又称HEVC）是一种更高效的视瓶编码格式，可以实现更好的压缩效果和视瓶质量。

AAC以adts格式封装的分析

AAC ADTS 格式分析一、ADTS格式：ADTS的全称是Audio Data Transport Stream。

是AAC音频的传输流格式。

AAC音频格式在MPEG-2（ISO-13318-7 2003）中有定义。

AAC后来又被采用到MPEG-4标准中。

1. adts_sequence(){while (nextbits() == syncword) {adts_frame();}}2. adts_frame(){adts_fixed_header();adts_variable_header();if (number_of_raw_data_blocks_in_frame == 0) {adts_error_check();raw_data_block();}else {adts_header_error_check();for (i = 0; i <= number_of_raw_data_blocks_in_frame; i++) {raw_data_block();adts_raw_data_block_error_check();}}}3.adts_fixed_header(){syncword; 12 bslbfID; 1 bslbflayer; 2 uimsbfprotection_absent; 1 bslbfprofile; 2 uimsbfsampling_frequency_index; 4 uimsbfprivate_bit; 1 bslbfchannel_configuration; 3 uimsbforiginal/copy; 1 bslbfhome; 1 bslbf}adts_variable_header(){copyright_identification_bit; 1 bslbfcopyright_identification_start; 1 bslbfframe_length; 13 bslbfadts_buffer_fullness; 11 bslbfnumber_of_raw_data_blocks_in_frame; 2 uimsfb}详细说明下ADTS头的重要数据部分：syncword 同步字The bit string ‘1111 1111 1111’，说明一个ADTS帧的开始。

AAC音频编码

LOGO
AAC音频编码
项目报告
谢征杨诚刘英玉

Contents
1. Introduction
2.Principle
3.Module analyzes 4. Conclusion

Introduction

Module analyzes
滤波器组 AAC的分析滤波器组使用改进的离散余弦变换(MDCT) 数据变换成频域信息, 滤波器组把输入的时间样本作为块 ,并乘以窗函数,然后执行 MDCT 输入信号的每个块都由前一块和当前块的50叠加组成.变换块的长度为2048或256个样本由于窗函数对滤波器的频率响应有很大影响,滤波器组设计成允许改变窗形状以适应信号的改变根据输入信号的特征将滤波器的分辨率设为每块2048或256个样本,长块的频域,分辨率高,编码效率高.而过长的窗函数又会使时域分辨率下降,产生严重的前回声——由于存在冲击信号或类似的时域事件.有效地抑制标准根据心理声学模型的计算结果确定。平滑回声”的措施是使用短窗。窗类型转换规则从长窗到长窗或长起始窗，从长起始窗到短窗或长结束窗，从长结束窗到长窗或长起始窗从短窗到短窗或长结束窗。由于余弦变换在边界处存在固有的不连续性因此在块边界处可能产生很大的噪声。相邻块的采样值在时间上重叠，有利于消除这种噪声。这种技术称为时域混叠抵消。

Introduction
压缩算法作为一种高压缩比的音频压缩算法，AAC通常压缩比为18：1，也有资料说为20：1，远胜mp3，而音质由于采用多声道，和使用低复杂性的描述方式，使其比几乎所有的传统编码方式在同规格的情况下更胜一筹。不过直到 2006年，使用这一格式储存音频的并不多，可以播放该格式的mp3播放器更是少之又少，前所知仅有苹果iPod，而手机支持AAC的相对要多一些，此外电脑上很多音频播放软件都支持AAC格式，如苹果iTunes。运算法则 AAC所采用的运算法则与MP3的运算法则有所不同，AAC通过结合其他的功能来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法（比如MP3等）。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。号称「最大能容纳48通道的音轨，采样率达96 KHz，并且在320Kbps的数据速率下能为5.1声道音乐节目提供相当于ITU-R广播的品质」。

ACC格式和M4A格式是什么？各自的优缺点有哪些？

ACC格式和M4A格式是什么？各自的优缺点有哪些？
据说M4A是AAC的扩展名之一，以下内容来自维基：
AAC（Advanced Audio Coding），中文称为“高级音频编码”，出现于1997年，基于 MPEG-2的音频编码技术。

由Fraunhofer IIS、杜比实验室、AT&T、Sony（索尼）等公司共同开发，目的是取代MP3格式。

2000年，MPEG-4标准出现后，AAC 重新集成了其特性，加入了SBR技术和PS技术，为了区别于传统的 MPEG-2 AAC 又称为MPEG-4 AAC。

AAC编码的主要扩展名有三种：
•.AAC - 使用MPEG-2 Audio Transport Stream( ADTS，参见MPEG-2 )容器，区别于使用MPEG-4容器的MP4/M4A格式，属于传统的AAC编码（FAAC默认的封装，但FAAC亦可输出 MPEG-4 封装的AAC）
•.MP4 - 使用了MPEG-4 Part 14（第14部分）的简化版即3GPP Media Release 6 Basic (3gp6，参见3GP ) 进行封装的AAC编码（Nero AAC 编码器仅能输出MPEG-4封装的AAC）；
•.M4A - 为了区别纯音频MP4文件和包含视频的MP4文件而由苹果(Apple)公司使用的扩展名，Apple iTunes 对纯音频MP4文件采用了".M4A"命名。

M4A的本质和音频MP4相同，故音频MP4文件亦可直接更改扩展名为M4A。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

aac编码参数
AAC编码是一种高效的音频压缩编码技术，它采用了一系列参数来控制编码过程和输出音质。

以下是AAC编码中常见的参数：
1. 采样率：指每秒采集音频信号的次数。

常见的采样率有
44.1kHz、48kHz、96kHz等。

采样率越高，声音的质量越好，但文件大小也越大。

2. 声道数：指音频信号的通道数。

常见的声道数有单声道和立体声。

双声道可以更好地还原音乐、电影等多声道环境下的音效。

3. 比特率：指每秒钟音频数据传输的比特数。

比特率越高，音质越好，但文件大小也越大。

AAC编码的比特率通常在64kbps到320kbps之间。

4. 编码方式：AAC编码可以采用CBR（固定比特率）和VBR（可变比特率）两种方式。

CBR能够保证输出文件大小固定，但音质可能不稳定；VBR则根据音频信号的复杂程度动态调整比特率，可以保证较好的音质，但输出文件大小不稳定。

5. 附加参数：AAC编码还有一些其他的参数，如编码器类型、预设模式、信噪比等。

这些参数可以根据具体的应用场景进行调整，以达到更好的音频效果。

综上所述，AAC编码参数的设置对于输出音质和文件大小都有重要的影响，需要根据实际需求进行选择和调整。

- 1 -。