音频编码及常用格式

合集下载

音视频编码格式汇总

音视频编码格式汇总

一、音频编解码格式*MPEG Audio Layer 1/2*MPEG Audio Layer 3(MP3)*MPEG2 AAC*MPEG4 AAC*Windows Media audeo v1/v2/7/8/9*RealAudio cook/sipro(real media series)*RealAudio AAC/AACPlus(real media series)*QDesign Music 2(apple series)是QDesign 公司开发的用于高保真高压缩率的编码方式,类似于MP3,不过比MP3要先进。

支持流式播放.*Apple MPEG-4 AAC(apple series)*ogg(ogg vorbis音频)*AC3(DVD 专用音频编码)*DTS(DVD 专用音频编码)*APE(monkey’s 音频)*AU(sun 格式)*FLAC(fress lossless 音频)*M4A(mpeg-4音频)(苹果改用的名字,可以改成.mp4)*MP2(mpeg audio layer2音频)*WMA二、视频编解码格式*MPEG1(VCD)*MPEG2(DVD)*MPEG4(divx,xvid)*MPEG4 AVC/h.264*h.261*h.262*h.263*h.263+*h.263++*MPEG-4 v1/v2/v3(微软windows media系列)*Windows Media Video 7/8/9/10*Sorenson Video 3(用于QT5,成标准了)(apple series)*RealVideo G2(real media series)*RealVideo 8/9/10(real media series)*Apple MPEG-4(apple series)*Apple H.264(apple series)*flash video三、音视频文件格式首先要分清楚媒体文件和编码的区别:文件是既包括视频又包括音频、甚至还带有脚本的一个集合,也可以叫容器;文件当中的视频和音频的压缩算法才是具体的编码。

音频编码格式介绍

音频编码格式介绍
移动设备
由于其高效的压缩和良好的音质,AAC在移动设备上广泛使用,如 iPhone、Android等。
AAC编码格式的优缺点
优点
高音质、高压缩效率、良好的兼容性和多声道支持。
缺点
相对于无损压缩格式,AAC仍然是一种有损压缩格式,会损失一些音频细节。
04 FLAC编码格式
FLAC编码格式的特点
无损压缩
格式也是一个不错的选择。
WAV编码格式的优缺点
优点
无损压缩、兼容性强、能够保留原始音频的所有细节。
缺点
存储空间大、传输速度慢、不适合网络传输和流媒体应用。
THANKS FOR WATCHING
感谢您的观看
FLAC编码格式的应用场景
音乐收藏
对于那些希望保留原始音乐质量 的人来说,FLAC是一个很好的选 择,特别是对于那些珍贵的或稀 有的音乐收藏。
高品质音频需求
对于那些对音质有高要求的音乐 爱好者或专业音频工作者,FLAC 是一个理想的选择。
备份
由于FLAC能够无损压缩,它也常 被用作备份原始音频文件的格式, 以防止数据丢失。
缺点
由于采用有损压缩,部分音频细节会 丢失;一些老旧的设备可能不支持播 放MP3格式;版权保护机制较弱,容 易遭受盗版侵权。

03 AAC编码格式
AAC编码格式的特点
高质量
AAC编码格式提供了较高的音频质量,接近 于无损压缩。
压缩效率
相对于MP3,AAC提供了更高的压缩效率, 文件大小相对较小。
兼容性
有16位、24位等。
02 MP3编码格式
MP3编码格式的特点
1 2
高压缩率
MP3采用了一种名为MPEG-2 Layer III的压缩算 法,能够在较低的比特率下实现较高的音质。

音频编码格式比较MPFLAC和WAV

音频编码格式比较MPFLAC和WAV

音频编码格式比较MPFLAC和WAV音频编码格式比较 MP3、FLAC 和 WAV随着数字音频的快速发展,人们对音频编码格式的需求也越来越多。

在众多音频编码格式中,MP3、FLAC 和 WAV 是最常用的几种格式。

本文将对这三种格式进行比较,包括其特点、优缺点以及适用场景。

通过了解它们的差异,读者可以更好地选择适合自己需求的音频编码格式。

1. MP3MP3(MPEG-1 Audio Layer 3)是最流行的音频编码格式之一。

它具备以下特点:- 压缩比高:MP3 通过去除音频信号中的冗余部分,实现对音频数据的高压缩比。

这使得 MP3 的文件大小相对较小,方便存储和传输。

- 相对较低的音质损失:尽管 MP3 使用了有损压缩算法,但通过合理的压缩参数设置,音质损失可以控制在较低的程度。

- 广泛兼容性:MP3 格式得到了广泛的应用和支持,在各类设备和平台上都能得到良好的兼容。

然而,MP3 也存在一些缺点:- 原始音质较差:由于 MP3 使用了有损压缩算法,相比无损格式,如 FLAC 和 WAV,原始音质会有所损失。

- 频谱细节丢失:为了减小文件大小,MP3 在压缩过程中会丢失一些频谱细节。

对于非专业音频需求,这个损失可能并不明显。

适用场景:- 在存储空间有限或带宽有限的情况下,选择 MP3 格式可以减小音频文件大小,方便网络传输和存储。

- 对音频质量要求一般,例如背景音乐、在线广播等。

2. FLACFLAC(Free Lossless Audio Codec)是一种无损音频编码格式,其特点包括:- 无损压缩:FLAC 通过压缩音频数据,但不损失任何音质信息,实现了无损的音频编码。

解码后的音质与原始音频完全一致。

- 高保真音质:相比于有损压缩格式,FLAC 能够还原音频的原始质量,提供更高保真的音质体验。

- 高兼容性:FLAC 格式在各类音频设备和软件中都得到了良好的支持,可以广泛应用。

然而,FLAC 的缺点也不容忽视:- 文件大小较大:由于是无损压缩,FLAC 文件大小通常较大,占用较多的存储空间和带宽。

ffmpeg 各种编码器 使用方法

ffmpeg 各种编码器 使用方法

一、介绍ffmpeg编码器ffmpeg是一个开源的音视瓶处理工具,可以进行音视瓶的编解码、转换和流媒体的处理。

在使用ffmpeg进行编码时,我们可以选择不同的编码器来实现不同的功能,比如压缩、转换、解码等。

本文将介绍一些常见的编码器,并说明它们的使用方法。

二、常见的音频编码器1. AAC编码器AAC(Advanced Audio Coding)是一种高级音频编码格式,常用于音乐和音频流媒体的编码。

在ffmpeg中,可以使用libfaac库来支持AAC编码,具体命令如下:ffmpeg -i input.wav -c:a libfaac -b:a 128k output.aac参数说明:-i input.wav:指定输入文件为input.wav-c:a libfaac:选择使用libfaac库进行音频编码-b:a 128k:设置音频比特率为128kbpsoutput.aac:指定输出文件为output.aac2. MP3编码器MP3(MPEG-1 Audio Layer 3)是一种广泛使用的有损音频压缩格式,适用于音乐和语音的编码。

在ffmpeg中,可以使用libmp3lame库来支持MP3编码,具体命令如下:ffmpeg -i input.wav -c:a libmp3lame -q:a 2 output.mp3参数说明:-i input.wav:指定输入文件为input.wav-c:a libmp3lame:选择使用libmp3lame库进行音频编码-q:a 2:设置音频质量因子为2(取值范围0-9,数值越大,音质越低)output.mp3:指定输出文件为output.mp3三、常见的视瓶编码器1. H.264编码器H.264(又称AVC)是一种高效的视瓶编码格式,适用于视瓶会议、高清电视等场景。

在ffmpeg中,可以使用libx264库来支持H.264编码,具体命令如下:ffmpeg -i input.mp4 -c:v libx264 -crf 23 -preset slowoutput.mp4参数说明:-i input.mp4:指定输入文件为input.mp4-c:v libx264:选择使用libx264库进行视瓶编码-crf 23:设置视瓶质量因子为23(取值范围0-51,数值越小,视瓶质量越高)-preset slow:设置编码速度为slow(速度越慢,压缩效率越高)output.mp4:指定输出文件为output.mp42. H.265编码器H.265(又称HEVC)是一种更高效的视瓶编码格式,可以实现更好的压缩效果和视瓶质量。

音视频流媒体常见视频文件的编码方式和封装格式介绍汇总

音视频流媒体常见视频文件的编码方式和封装格式介绍汇总

⾳视频流媒体常见视频⽂件的编码⽅式和封装格式介绍汇总常见的AVI、RMVB、MKV、ASF、WMV、MP4、3GP、FLV等⽂件其实只能算是⼀种封装标准。

⼀个完整的视频⽂件是由⾳频和视频2部分组成的。

H264、Xvid等就是视频编码格式,MP3、AAC等就是⾳频编码格式。

例如:将⼀个Xvid视频编码⽂件和⼀个MP3视频编码⽂件按AVI封装标准封装以后,就得到⼀个AVI后缀的视频⽂件,这个就是我们常见的AVI视频⽂件了。

由于很多种视频编码⽂件、⾳频编码⽂件都符合AVI封装要求,则意味着即使是AVI后缀,也可能⾥⾯的具体编码格式不同。

因此出现在⼀些设备上,同是AVI后缀⽂件,⼀些能正常播放,还有⼀些就⽆法播放。

同样的情况也存在于其他容器格式。

即使RMVB、WMV等也不例外。

部分技术先进的容器还可以同时封装多个视频、⾳频编码⽂件,甚⾄同时封装进字幕,如MKV封装格式。

MKV⽂件可以做到⼀个⽂件包括多语种发⾳、多语种字幕,适合不同⼈的需要。

例如:MKV⽂件只要制作的时候同时加⼊国语和粤语发⾳的⾳轨和对应的简体、繁体字幕,播放的时候,你可以独⽴选择国语或粤语发⾳,并根据⾃⼰需要选择简体或繁体字幕,也可以选择不显⽰字幕。

相当⽅便。

因此,视频转换需要设置的本质就是:A设置需要的视频编码、B设置需要的⾳频编码、C选择需要的容器封装。

⼀个完整的视频转换设置都⾄少包括了上⾯3个步骤。

常⽤的有Xvid,H264,MPEG1,MPEG2。

Xvid:与RMVB格式差不多的压缩率,通⽤性很强,特别是⽤于家⽤DVD和便携式MP4等设备。

H264:⾯前压缩率最⾼的视频压缩格式,与其他编码格式相⽐,同等画⾯质量,⽂件体积最⼩,远远超过RMVB编码格式,电脑都可以播放,部分便携式视频设备也⽀持,如苹果播放器。

PDA/PPC等设备也可以使⽤。

MPEG1:其实就是VCD编码格式。

MPEG2:DVD编码格式。

⽐MPEG1强,与MPEG1⼀样,已经落后的编码格式,压缩率都不⾼,编码后的⽂件体积⼤,多⽤于希望把⽹上下载的⽂件转换为VCD或DVD碟的时候。

多媒体技术计算声音文件的大小

多媒体技术计算声音文件的大小

多媒体技术计算声音文件的大小在计算声音文件的大小时,涉及到多媒体技术中的音频编码、比特率以及文件格式等几个主要因素。

以下将详细介绍这些因素以及计算声音文件大小的方法。

1.音频编码:音频编码是指将声音信号转换为数字信号的过程。

常用的音频编码包括PCM(脉冲编码调制)和压缩编码(如MP3、AAC等)。

PCM是一种无损编码方式,将声音信号按照一定的采样率和采样位数进行编码,可以准确还原原始声音信号。

而压缩编码则采用了压缩算法,通过减少冗余信息的存储来降低文件大小,但会带来一定的失真。

2.比特率:比特率是指音频编码中每秒钟的比特数,用于衡量每秒传送的音频数据量。

比特率越高,音频质量越好,但文件大小也越大。

常见的比特率有128kbps、192kbps和320kbps等。

3.声道数和采样率:声道数和采样率也会影响声音文件的大小。

声道数指的是录制或播放声音时使用的独立通道数,常见的有单声道和立体声。

采样率是指每秒钟采集的样本数,一般常见值为44.1kHz和48kHz。

4.文件格式:文件格式也会对声音文件的大小产生影响。

常见的音频文件格式有WAV、MP3、AAC、FLAC等。

WAV格式是无损压缩格式,文件比较大;而MP3、AAC等格式则是有损压缩格式,能够减小文件大小但会带来一定的音质损失。

计算声音文件大小的方法如下:文件大小=比特率×采样率×声道数×时长/8其中,比特率以kbps为单位,采样率以Hz为单位,声道数为通道数,时长以秒为单位。

除以8是将比特率转换为字节(B)的单位。

例如,对于一个MP3格式的声音文件,比特率为128kbps,采样率为44.1kHz,声道数为立体声,时长为180秒,可以按照以下方式计算文件大小:文件大小= 128kbps × 44.1kHz × 2 × 180 / 8≈618.75MB以上是多媒体技术计算声音文件大小的相关内容。

语音编码格式名词解释

语音编码格式名词解释

语音编码格式名词解释
语音编码格式是指将语音信号转换为数字信号的过程,以便在数字通信系统中传输和存储。

以下是一些常见的语音编码格式及其解释:
1. PCM(脉冲编码调制):将模拟语音信号转换为数字信号的最基本方法,每秒钟采样8000次,每次采样用8位或16位表示。

2. ADPCM(自适应差分脉冲编码调制):采用自适应算法对PCM信号进行压缩,从而减少传输带宽和存储空间。

3. MP3(MPEG音频层3):一种有损压缩格式,通过去除人耳听不见的音频信号来减小文件大小。

4. AAC(高级音频编码):一种有损压缩格式,比MP3更高效,可以实现更高质量的音频传输和存储。

5. Opus:一种开放源代码的音频编码格式,支持低延迟和高质量的音频传输。

学习技巧:
1. 熟悉常见的语音编码格式,了解它们的特点和适用场景。

2. 学习数字信号处理和音频编码的基本原理,包括采样、量化、压缩等。

3. 练习使用相关的工具和软件,如Audacity、FFmpeg等,实践音频编码和解码的过程。

4. 参考相关的文献和教程,了解最新的音频编码技术和发展趋势。

关于音频格式及编码

关于音频格式及编码

关于音频格式及编码音频格式即我们所知的音乐文件的后缀名,因此我们应该有如下认识:不同的后缀名表明的是此文件的内部格式不同,比如MP3的末尾128个字节是ID3v1的标签数据而其它后缀的音频文件则不一定是,这就是音乐文件后缀名的作用(你可以把文件理解为一个包裹,里面有很多小包,里面小包的多少和位置等就代表该包裹的内部格式),其实MP3文件里面可以放图片也可以放文字,但MP3内部格式的划分注定它只有用来装音频数据才能发挥该内部格式化分的优势。

如果你理解了上面的内容,那么接着我们将流行的音频文件类型做个分类:1)WAV:WAV实际上是Apple电脑上音频格式AIFF的克隆。

通常我们使用WAV格式都是用来保存一些没有压缩的音频,但实际上WAV格式的设计是非常灵活(非常复杂)的,该格式本身与任何媒体数据都不冲突,换句话说,只要有软件支持,你甚至可以在WAV格式里面存放图像。

但由于它本身的结构特点,注定了它的用途是存放音频数据并用作进一步的处理。

2)MP3:MP3是第一个实用的有损音频压缩编码,在MP3出现之前,一般的音频编码即使以有损方式进行压缩,能够达到4:1的压缩比例已经非常不错了,但是,MP3可以实现12:1的压缩比例,这使得MP3迅速地流行起来。

3)MP3Pro:这种格式与之前的MP3相比最大的特点是能在低达64Kbps的比特率下仍然能提供近似CD 的音质。

该技术称为SBR(Spectral Band Replication,频带复制编码),它在原来MP3技术的基础上专门针对原来MP3技术中损失了的音频细节进行独立编码处理并捆绑在原来的MP3数据上,在播放的时候通过再合成从而达到良好的音质效果。

4)MIDI:MIDI本身也有两个版本,General MIDI和General MIDI 2。

在MIDI上还衍生了许多第三方的非标准技术,比如非常著名的X-MIDI(或者叫XG),这是由日本YAMAHA公司发明的,在原有的MIDI具有128种乐器的基础上扩充到了512种,并增加了更多的演奏控制,配合YAMAHA自己的波表播放软件或支持X-MIDI的硬件可以还原出非常动听和接近真实乐器效果的音乐。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

音频编码及常用格式音频编码标准发展现状国际电信联盟(ITU)主要负责研究和制定与通信相关的标准,作为主要通信业务的电话通信业务中使用的语音编码标准均是由ITU负责完成的。

其中用于固定网络电话业务使用的语音编码标准如ITU-T G.711等主要在ITU-T SG 15完成,并广泛应用于全球的电话通信系统之中。

目前,随着Internet网络及其应用的快速发展,在2005到2008研究期内,ITU-T将研究和制定变速率语音编码标准的工作转移到主要负责研究和制定多媒体通信系统、终端标准的SG16中进行。

在欧洲、北美、中国和日本的电话网络中通用的语音编码器是8位对数量化器(相应于64Kb/s的比特率)。

该量化器所采用的技术在1972年由CCITT (ITU-T的前身)标准化为G.711。

在1983年,CCIT规定了32Kb/s的语音编码标准G.721,其目标是在通用电话网络上的应用(标准修正后称为G.726)。

这个编码器价格虽低但却提供了高质量的语音。

至于数字蜂窝电话的语音编码标准,在欧洲,TCH-HS是欧洲电信标准研究所(ETSI)的一部分,由他们负责制定数字蜂窝标准。

在北美,这项工作是由电信工业联盟(TIA)负责执行。

在日本,由无线系统开发和研究中心(称为RCR)组织这些标准化的工作。

此外,国际海事卫星协会(Inmarsat)是管理地球上同步通信卫星的组织,也已经制定了一系列的卫星电话应用标准。

音频编码标准发展现状音频编码标准主要由ISO的MPEG组来完成。

MPEG1是世界上第一个高保真音频数据压缩标准。

MPEG1是针对最多两声道的音频而开发的。

但随着技术的不断进步和生活水准的不断提高,有的立体声形式已经不能满足听众对声音节目的欣赏要求,具有更强定位能力和空间效果的三维声音技术得到蓬勃发展。

而在三维声音技术中最具代表性的就是多声道环绕声技术。

目前有两种主要的多声道编码方案:MUSICAM环绕声和杜比AC-3。

MPEG2音频编码标准采用的就是MUSICAM环绕声方案,它是MPEG2音频编码的核心,是基于人耳听觉感知特性的子带编码算法。

而美国的HDTV伴音则采用的是杜比AC-3方案。

MPEG2规定了两种音频压缩编码算法,一种称为MPEG2后向兼容多声道音频编码标准,简称MPEG2BC;另一种是称为高级音频编码标准,简称MPEG2AAC,因为它与MPEG1不兼容,也称MPEG NBC。

MPEG4的目标是提供未来的交互多媒体应用,它具有高度的灵活性和可扩展性。

与以前的音频标准相比,MPEG4增加了许多新的关于合成内容及场景描述等领域的工作。

MPEG4将以前发展良好但相互独立的高质量音频编码、计算机音乐及合成语音等第一次合并在一起,并在诸多领域内给予高度的灵活性。

我国自主知识产权的音频编码标准发展现状具有自主知识产权的广晟数码数字音频编解码算法(简称广晟数码音频技术,DRATM),它是可以同时支持立体声和多声道环绕声的数字音频编解码技术。

其算法的特点是采用自适应时频分块(ATFT)方法实现对音频信号的最优分解,进行自适应量化和熵编码。

另外,由多家研究所、大学组成的中国音视频编码技术委员会(AVS)目前正在研究制定AVS第2部分音频标准,并已经申请了部分专利。

AVS音频标准的指导原则是:在基本解决知识产权问题的前提下,制定具有国际先进水平的中国音频编码/解码标准,使AVS音频编码的综合技术指标基本达到或超过MPEG AAC编码技术的指标。

目前正在开展移动部分AVS-M的音频标准制定工作。

语音编码技术又分为三类:波形编码、参数编码以及混合编码。

波形编码:波形编码是在时域上进行处理,力图使重建的语音波形保持原始语音信号的形状,它将语音信号作为一般的波形信号来处理,具有适应能力强、话音质量好等优点,缺点是压缩比偏低。

该类编码的技术主要有非线性量化技术、时域自适应差分编码和量化技术。

非线性量化技术利用语音信号小幅度出现的概率大而大幅度出现的概率小的特点,通过为小信号分配小的量化阶,为大信号分配大的量阶来减少总量化误差。

我们最常用的G.711标准用的就是这技术。

自适应差分编码是利用过去的语音来预测当前的语音,只对它们的差进行编码,从而大大减少了编数据的动态范围,节省了码率。

自适应量化技术是根据量化数据的动态范围来动态调整量阶,使得量阶与化数据相匹配。

G.726标准中应用了这两项技术,G.722标准把语音分成高低两个子带,然后在每个子带中分别应用这两项技术。

参数编码:利用语音信息产生的数学模型,提取语音信号的特征参量,并按照模型参数重构音频信号。

它只能收敛到模型约束的最好质量上,力图使重建语音信号具有尽可能高的可懂性,而重建信号的波形与原始语音信号的波形相比可能会有相当大的差别。

这种编码技术的优点是压缩比高,但重建音频信号的质量较差,自然度低,适用于窄带信道的语音通讯,如军事通讯、航空通讯等。

美国的军方标准LPC-10,就是从语音信号中提取出来反射系数、增益、基音周期、清/浊音标志等参数进行编码的。

MPEG-4标准中的HVXC声码器用的也是参数编码技术,当它在无信号片段时,激励信号与在CELP时相似,都是通过一个码本索引和通过幅度信息描述;在发声信号片段时则应用了谐波综合,它是将基音和谐音的正弦振荡按照传输的基频进行综合。

混合编码:将上述两种编码方法结合起来,采用混合编码的方法,可以在较低的数码率得到较高的音质。

它的基本原理是合成分析法,将综合滤波器引入编码器,与分析器相结合,在编码器中将激励输入综合滤波器产生与译码器端完全一致的合成语音,然后将合成语音与原始语音相比较(波形编码思想),根据均方误差最小原则,求得最佳的激励信号,然后把激励信号以及分析出来的综合滤波器编码送给解码端。

这种得到综合滤波器和最佳激励的过程称为分析(得到语音参数);用激励和综合滤波器合成语音的过程称为综合;由此我们可以看出CELP编码把参数编码和波形编码的优点结合在了一起,使得用较低码率产生较好的音质成为可能。

通过设计不同的码本和码本搜索技术,产生了很多编码标准,目前我们通讯中用到的大多数语音编码器都采用了混合编码技术。

音乐的主要编码技术自适应变换编码:利用正交变换,把时域音频信号变换到另一个域,由于去相关的结果,变换域系数的能量集中在一个较小的范围,所以对变换域系数最佳量化后,可以实现码率的压缩。

理论上的最佳量化很难达到,通常采用自适应比特分配和自适应量化技术来对频域数据进行量化。

在MPEG layer3和AAC标准及Dolby AC-3标准中都使用了改进的余弦变换(MDCT);在ITU G.722.1标准中则用的是重叠调制变换(MLT)。

本质上它们都是余弦变换的改进。

心理声学模型:其基本思想是对信息量加以压缩,同时使失真尽可能不被觉察出来,利用人耳的掩蔽效应就可以达到此目的,即较弱的声音会被同时存在的较强的声音所掩盖,使得人耳无法听到。

在音频压缩编码中利用掩蔽效应,就可以通过给不同频率处的信号分量分配以不同的量化比特数的方法来控制量化噪声,使得噪声的能量低于掩蔽阈值,从而使得人耳感觉不到量化过程的存在。

在MPEG layer2、3和AAC标准及AC-3标准中都采用了心理声学模型,在目前的高质量音频标准中,心理声学模型是一个最有效的算法模型。

熵编码:根据信息论的原理,可以找到最佳数据压缩编码的方法,数据压缩的理论极限是信息熵。

如果要求编码过程中不丢失信息量,即要求保存信息熵,这种信息保持编码叫熵编码,它是根据信息出现概率的分布特性而进行的,是一种无损数据压缩编码。

常用的有霍夫曼编码和算术编码。

在MPEG layer1、2、3和AAC标准及ITU G.722.1标准中都使用了霍夫曼编码;在MPEG4BSAC工具中则使用了效率更高的算术编码。

常用格式WAV格式WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。

WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播.WAV来源于对声音模拟波形的采样。

用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点,以不同的量化位数(8位或16位)把这些采样点的值转换成二进制数,然后存入磁盘,这就产生了声音的WAV文件,即波形文件。

Microsoft Sound System软件Sound Finder 可以转换AIF SND和VOD文件到WAV格式。

该格式记录声音的波形,故只要采样率高、采样字节长、机器速度快,利用该格式记录的声音文件能够和原声基本一致,质量非常高,但这样做的代价就是文件太大。

APE格式APE的本质,其实它是一种无损压缩音频格式。

庞大的WAV音频文件可以通过Monkey's Audio这个软件进行“瘦身”压缩为APE。

很时候它被用做网络音频文件传输,因为被压缩后的APE文件容量要比WAV源文件小一半多,可以节约传输所用的时间。

更重要的是,通过Monkey''s Audio解压缩还原以后得到的WAV文件可以做到与压缩前的源文件完全一致。

所以APE被誉为“无损音频压缩格式”,Monkey''s Audio被誉为“无损音频压缩软件”。

与采用WinZip或者WinRAR这类专业数据压缩软件来压缩音频文件不同,压缩之后的APE音频文件是可以直接被播放的。

Monkey''s Audio会向Winamp中安装“in_APE.dll”插件,从而使Winamp也具备播放APE文件的能力。

FLAC格式FLAC代表Free Lossless Audio Codec-免费的无损音频压缩。

简而言之,FLAC与MP3相仿,但是是无损压缩的,也就是说音频以FLAC方式压缩不会丢失任何信息。

这种压缩与Zip的方式类似,但是FLAC将给你更大的压缩比率,因为FLAC是专门针对音频的特点设计的压缩方式,并且你可以使用播放器播放FLAC压缩的文件,就象通常播放你的MP3文件一样(现在已经有许多汽车播放器和家用音响设备支持FLAC,在FLAC的网站上你可以找到这些设备厂家的连接)。

FLAC是免费的并且支持大多数的操作系统,包括Windows," unix"(Linux,*BSD,Solaris,OS X,IRIX),BeOS,OS/2,和Amiga。

并且FLAC 提供了在开发工具autotools,MSVC,Watcom C,和Project Builder上的build系统。

FLAC项目包括以下几个方面:数据流的格式以库的形式提供的参考编码器和解码器flac,一个以命令行方式工作的可以编解码FLAC文件的程序(译注:有些象Lame吧?)metaflac,以命令行方式工作的FLAC文件的metadata编辑器不同音频播放器的输入插件我们所说的“FLAC是免费的”不仅仅意味着你可以不花钱而得到它。

相关文档
最新文档