WAV文件格式说明

合集下载

wav格式「wav格式的音频一般占用存储空间较大」

wav格式「wav格式的音频一般占用存储空间较大」WAV是最常见的声音文件格式之一，是微软公司专门为Windows开发的一种标准数字音频文件，该文件能记录各种单声道或立体声的声音信息，并能保证声音不失真但WAV文件有一个致命的缺点，就是它所占用的磁盘空间太大每分钟的音。

WAV格式是微软公司开发的一种声音文件格式，也叫波形声音文件，是最早的数字音频格式，被Windows平台及其应用程序广泛支持WAV 格式支持许多压缩算法，支持多种音频位数采样频率和声道，采用441kHz的采样频率，16位量化位数。

WAV是最常见的声音文件格式之一，是微软公司专门为Windows开发的一种标准数字音频文件，该文件能记录各种单声道或立体声的声音信息，并能保证声音不失真但WAV文件有一个致命的缺点，就是它所占用的磁盘空间太大每分钟的。

WAV格式视频文件是比较常见的格式，用Windows自带播放器就可以进行播放了1找到WAV格式视频2鼠标右键点击WAV格式视频，然后选择打开方式3点击打开方式之后，选择WindowsMediaPlayer进行打开4选择WindowsMediaPlayer之后。

Hz四种WAV文件采用的是RIFF格式结构至少是由3个块构成，分别是RIFFfmt和Data所有基于压缩编码的WAV文件必须含有fact块此外所有其它块都是可选。

WAV是真正的无损格式 WAV为微软公司Microsoft开发的一种声音文件格式，它符合RIFFResource Interchange File Format文件规范，用于保存Windows平台的音频信息资源，被Windows平台及其应用程序所广泛支持，该格式也支持MSADPCM。

wav是完全无损的非压缩音频格式，容量比较大，很多电子播放设备不支持，你可以将它转换成mp3wma格式就可以了我一般用cooledit 转换。

一首3分钟左右的音乐文件在30M至50M之间其后期可经无损压缩为APE，FLAC等无损格式，也可压为MP3，AAC，wma等有损格式有些手机，MP3等录音文件也为wav，但那是低端的，文件一般很小不是以上所说的无损音频。

电脑常见文件格式介绍

电脑常见文件格式介绍随着计算机技术的发展，各种文件格式也相应涌现出来，不同的文件格式适用于不同的用途。

本文将介绍一些常见的电脑文件格式，并简要说明其特点和用途。

一、文本文件格式1. TXT（纯文本文件）：TXT文件是最简单的文本文件格式，只包含纯文本内容，没有任何格式化信息。

它适合用于存储纯文本数据，如程序代码、配置文件等。

2. DOC/DOCX（Microsoft Word文档）：DOC/DOCX是微软公司开发的一种文字处理文件格式。

DOC格式用于早期版本的Microsoft Word，而DOCX则是Office 2007以后版本的默认文件格式。

它们支持丰富的文本格式，包括字体、颜色、大小、图像等。

3. PDF（便携式文档格式）：PDF文件格式由Adobe公司开发，可在不同操作系统和软件中显示一致的排版效果。

PDF文件通常用于电子书、报告、合同等需要保持格式一致性的文档。

二、图像文件格式1. JPG/JPEG（联合图像专家组）：JPG是一种广泛应用于图像存储和传输的有损压缩格式。

它适用于照片和彩色图像，压缩比可以调整，从而平衡图像质量和文件大小。

2. PNG（便携式网络图形）：PNG是一种无损压缩的图像格式，支持高质量的图像显示。

与JPG相比，PNG文件通常更大，但能保留更清晰的图像细节。

PNG文件适用于需要保持图像质量的场景，如图标、网页设计等。

3. GIF（图形交换格式）：GIF是一种支持动画的图像格式，可以将多个图像帧存储在一个文件中，并按照特定的时间间隔进行播放。

GIF文件适用于简单的动画效果和表情包等。

三、音频文件格式1. MP3（MPEG音频层III）：MP3是一种常见的音频文件格式，它使用有损压缩算法来减小文件大小。

MP3文件适用于存储音乐、播客和语音记录等。

2. WAV（波形音频文件）：WAV是一种无损音频文件格式，能够保留原始音频的完整质量。

WAV文件通常较大，适用于音频编辑和制作等专业领域。

WAV文件格式分析与详解

WAV文件格式分析与详解作者：王若钧何杉来源：《数字技术与应用》2014年第03期摘要：WAV文件格式信息是对WAV文件编程的重要依据。

揭开WAV文件格式的奥秘是开发功能强大的具有自主知识产权的语音处理软件的关键。

本文结合波形文件的基本知识，较系统地说明了WAV文件的存储原理、文件结构、WAV文件头格式、基于PCM编码的数据组织，内容全面、清楚、准确，还包含了一些新汇集的参数。

可作为开发人员的参考资料。

关键词：文件格式 WAV 编码声音中图分类号：TP311 文献标识码：A 文章编号：1007-9416（2014）03-0093-021 引言WAV文件是在PC机平台上很常见的、最经典的多媒体音频文件，最早于1991年8月出现在Windows 3.1操作系统上，文件扩展名为WAV，是WaveFom的简写，也称为波形文件，可直接存储声音波形，还原的波形曲线十分逼真。

WAV文件格式简称WAV格式是一种存储声音波形的数字音频格式，是由微软公司和IBM联合设计的，经过了多次修订，可用于Windows，Macintosh，Linix等多种操作系统，详述如下。

2 波形文件的基础知识2.1 波形文件的存储过程声源发出的声波通过话筒被转换成连续变化的电信号，经过放大、抗混叠滤波后，按固定的频率进行采样，每个样本是在一个采样周期内检测到的电信号幅度值；接下来将其由模拟电信号量化为由二进制数表示的积分值；最后编码并存储为音频流数据。

有的应用为了节省存储空间，存储前，还要对采样数据先进行压缩。

2.2 WAV文件的编码编码包括了两方面内容，一是按一定格式存储数据，二是采用一定的算法压缩数据。

WAV格式对音频流的编码没有硬性规定，支持非压缩的PCM（Puls Code Modulation）脉冲编码调制格式，还支持压缩型的微软自适应差分脉冲编码调制Microsoft ADPCM（Adaptive Differential Puls Code Modulation）、国际电报联盟（International Telegraph Union）制定的语音压缩标准ITU G.711 a-law、ITU G.711-law、IMA ADPCM、ITU G.723 ADPCM （Yamaha）、GSM 6.10、ITU G.721 ADPCM编码和其它压缩算法。

wav文件头

一、各种WAV文件头格式WAV文件也分好几个种类，相应的非数据信息存储在文件头部分，以下是各种WAV文件头格式。

表18KHz采样、16比特量化的线性PCM语音信号的WAV文件头格式表（共44字节）表28KHz采样、8比特A律量化的PCM语音信号的WAV文件头格式表（共58字节）表38KHz采样、8比特U律量化的PCM语音信号的WAV文件头格式表（共58字节）表4ADPCM语音编码后的WAV文件头格式表（共90字节）表5GSM（Global System for Mobile Communication全球移动通信系统）语音编码后的WAV文件头格式表（共60字节）表6SBC（Sub-Band Coding子带编码）语音编码后的WAV文件头格式表（共58字节）表7CELP(Code Excited Linear Prediction码激励线性预测编码——近10年来最成功的语音编码算法)语音编码后的WAV文件头格式表（共58字节）概念1、读取WAV文件，填写WAVEFORMATEX结构WAVEFORMATEXtypedef struct{WORD wFormatTag;WORD nChannels;DWORD nSamplesPerSec;DWORD nAvgBytesPe rSec; WORD nBlockAlign;WORD wBitsPerSample;WORD cbSize;} WAVEFORMATEX;具体参数解释如下：wFormatTag：波形数据的格式，定义在MMREG.H文件中nChannels：波形数据的通道数：单声道或立体声nSamplesPerSec：采样率，对于PCM格式的波形数据，采样率有8.0 kHz,11.025kHz,22.05 kHz,44.1 kHz 等nAvgBytesPerSec：数据率，对于PCM格式的波形数据，数据率等于采样率乘以每样点字节数nBlockAlign：每个样点字节数wBitsPerSample：采样精度，对于PCM格式的波形数据，采样精度为8或16cbSize：附加格式信息的数据块大小概念2、定义设备头结构以下WAVEHDR定义了指向波形数据缓冲区的设备头。

WAV文件格式说明

WA VE文件作为多媒体中使用的声波文件格式之一，它是以RIFF格式为标准的。

RIFF是英文Resource Interchange File Format的缩写，每个W A VE文件的头四个字节便是“RIFF”。

WA VE文件由文件头和数据体两大部分组成。

其中文件头又分为RIFF／WA V文件标识段和声音数据格式说明段两部分。

WA VE文件各部分内容及格式见附表。

常见的声音文件主要有两种，分别对应于单声道（11.025KHz采样率、8Bit的采样值）和双声道（44.1KHz采样率、16Bit的采样值）。

采样率是指：声音信号在“模→数”转换过程中单位时间内采样的次数。

采样值是指每一次采样周期内声音模拟信号的积分值。

对于单声道声音文件，采样数据为八位的短整数（short int 00H-FFH）；而对于双声道立体声声音文件，每次采样数据为一个16位的整数（int），高八位和低八位分别代表左右两个声道。

W A VE文件数据块包含以脉冲编码调制（PCM）格式表示的样本。

WA VE文件是由样本组织而成的。

在单声道WA VE文件中，声道0代表左声道，声道1代表右声道。

在多声道W A VE文件中，样本是交替出现的。

WA VE文件格式说明表偏移地址字节数数据类型内容文件头00H 4 char "RIFF"标志04H 4 long int 文件长度08H 4 char "WA VE"标志0CH 4 char "fmt"标志10H 4 过渡字节（不定）14H 2 int 格式类别（10H为PCM形式的声音数据)16H 2 int 通道数，单声道为1，双声道为218H 2 int 采样率（每秒样本数），表示每个通道的播放速度，1CH 4 long int 波形音频数据传送速率，其值为通道数×每秒数据位数×每样本的数据位数／8。

播放软件利用此值可以估计缓冲区的大小。

wav文件格式分析

一. RIFF概念在Windows环境下，大部分的多媒体文件都依循着一种结构来存放信息，这种结构称为"资源互换文件格式"(Resources lnterchange File Format)，简称RIFF。

例如声音的WAV文件、视频的AV1文件等等均是由此结构衍生出来的。

RIFF可以看做是一种树状结构，其基本构成单位为chunk，犹如树状结构中的节点，每个chunk由"辨别码"、"数据大小"及"数据"所组成。

图一、块的结构示意图辨别码由4个ASCII码所构成，数据大小则标示出紧跟其后数据的长度(单位为Byte)，而数据大小本身也用掉4个Byte，所以事实上一个chunk的长度为数据大小加8。

一般而言，chunk本身并不允许内部再包含chunk，但有两种例外，分别为以"RIFF"及"L1ST"为辨别码的chunk。

而针对此两种chunk，RIFF又从原先的"数据"中切出4个Byte。

此4个Byte称为"格式辨别码"，然而RIFF又规定文件中仅能有一个以"RIFF"为辨别码的chunk。

图二、RIFF/LIST块结构只要依循此一结构的文件，我们均称之为RIFF档。

此种结构提供了一种系统化的分类。

如果和MS一DOS 文件系统作比较，"RIFF"chunk就好比是一台硬盘的根目录，其格式辨别码便是此硬盘的逻辑代码(C：或D：)，而"L1ST"chunk即为其下的子目录，其他的chunk则为一般的文件。

至于在RIFF文件的处理方面，微软提供了相关的函数。

视窗下的各种多媒体文件格式就如同在磁盘机下规定仅能放怎样的目录，而在该目录下仅能放何种数据。

二. WAV文件格式WAVE文件是非常简单的一种RIFF文件，它的格式类型为"WAVE"。

名词解释wav格式

名词解释wav格式
WAV格式是一种音频格式，全称为waveform Audio File Format，也称
为波形文件，是一种存储声音波形的数字音频格式。

它是由微软公司和IBM 联合设计的，是微软公司专门为Windows开发的一种标准数字音频文件，能记录各种单声道或立体声的声音信息，并保证声音不失真。

WAV文件可直接存储声音波形，还原的波形曲线十分逼真。

但是，WAV
文件占用空间极大，每分钟的WAV文件大约要占用12MB左右的磁盘空间，而同等大小的MP3文件，则仅需要1MB左右。

如需更多信息，建议到WAV相关论坛获取或咨询音频领域专业人士。

wav格式结构

W A V实际上是Waveform Audio File Format（波形音频文件格式）的简称，它是微软公司开发的一种声音文件格式。

W A V实际上是对PCM格式的的一种包装，W A V取样频率可以是44100Hz、22050Hz、11025Hz等，量化位数可以8位或16位，声道数可以是单声道，也可以是立体声。

W A V文件包含了一个“fmt ”段落和一个“data”段落，“fmt”段落包含了音源样本的参数信息，“data”段落包含了实际的音源数据。

在W A V文件中，“fmt”段通常包含以下信息：1. 格式说明标志位（Subchunk1ID）：4个字节，等于“fmt ”或者“wFormatTag”。

2. 格式说明标志位长度（Subchunk1Size）：4个字节，等于16或者所使用的单声道位数与有关设置的乘积加上2。

3. 音频流的通道数（nChannels）：2个字节，表示每个声道的样本数。

4. 每秒的采样数（nSamplesPerSec）：4个字节，表示每秒的采样频率。

5. 采样点振幅位数（nAvgBytesPerSec）：4个字节，等于每秒发送字节数，这是nChannels和nSamplesPerSec的乘积的两倍加一再除以8的结果。

6. 音频流码的位深度（nBlockAlign）：2个字节，等于nChannels 和nAvgBytesPerSec的乘积除以8的结果。

7. 总采样点数（wNumBlocks）：2个字节，等于采样点数。

8. 格式说明标志位（Subchunk2ID）：4个字节，等于“data”。

9. 格式说明标志位长度（Subchunk2Size）：4个字节，等于采样点数乘以nChannels再乘以nAvgBytesPerSec除以8的结果。

以上信息仅供参考，如需了解更多信息，建议咨询专业人士。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

WAV文件格式说明
――杨少军WAVE文件是以RIFF(Resource Interchange File Format,"资源交互文件格式")格式来组织内部结构的。

RIFF文件结构可以看作是树状结构，其基本构成是称为"块"（Chunk）的单元，最顶端是一个“RIFF”块，下面的每个块有“类型块标识(可选)”、“标志符”、“数据大小”及“数据”等项所组成，其中，format chunk和data chunk是必需要的，其它的chunk可选。

在data chunk中存放的数据可能是压缩的也可能是非压缩的，这是根据format chunk中的wFormatTag来决定的，如果wFormatTag为WA VE_FORMA T_PCM 时，表示数据为非压缩的，其它的为压缩的。

在非压缩格式时，存放的数据就是PCM码；而在采用压缩格式时，由于各个公司都有自己的压缩算法，没有一个统一的标准，所以压缩制式非常杂。

下面主要以INTEL 公司的IMA-ADPCM压缩算法来讲W A V文件的结构。

1.WA V文件内部结构
在讲W A V文件结构时，主要以非压缩格式和以INTEL 公司的IMA-ADPCM压缩算法来论述。

下面来谈谈INTEL 公司的IMA-ADPCM压缩算法。

IMA-ADPCM 是Intel公司首先开发的是一种主要针对16bit采样波形数据的有损压缩算法, 压缩比为4:1.它与通常的DVI-ADPCM是同一算法。

它是将声音流中每次采样的16bit 数据以4bit 存储。

具体的压缩算法可以参看其它文章。

在wFormatTag为W A VE_FORMA T_PCM时，没有Fact Chunk，也没有format chunk 中的wSamplesPerBlock，data chunk中紧跟着DataChunkSize后的就是PCM数据了。

而在wFormatTag为WA VE_FORMA T_DVI_ADPCM时，表示采用INTEL 公司的IMA-ADPCM 压缩算法，W A V文件格式即为上表所示。

在采用IMA-ADPCM压缩算法时，“data”chuck中的数据是以block形式来组织的，把它叫做“段”，也就是说在进行压缩时，并不是依次把所有的数据进行压缩保存，而是分段进行的。

Data Block一般是由block header (block头) 和data 两者组成的。

其中block header是一个结构，它在单声道下的定义如下：
Typedef struct
{
short sample0; //block中第一个采样值（未压缩）
BYTE index; //上一个block最后一个index，第一个block的index=0;
BYTE reserved; //尚未使用
}MonoBlockHeader;
有了blockheader的信息后，就可以不需要知道这个block前面和后面的数据而轻松地解出本block中的压缩数据。

对于双声道，它的blockheader应该包含两个MonoBlockHeader 其定义如下：
typedaf struct
{
MonoBlockHeader leftbher;
MonoBlockHeader rightbher;
}StereoBlockHeader;
在解压缩时，左右声道是分开处理的，所以必须有两个MonoBlockHeader;
1.1 Data chunk详述
Data中的数据可能是压缩的也可能是非压缩的，如果wFormatTag为WA VE_FORMA T_PCM格式时，表示非压缩的数据，data chunk中紧跟着DataChunkSize后的就是PCM数据了，其组成如下：
如果wFormatTag为W A VE_FORMAT_DVI_ADPCM格式时，data中的数据是从PCM 的16位采样压缩成4位的。

对于单声道的IMA-ADPCM来说，它是将PCM的数据按时间次序依次压缩并写入文件中的，每个byte中含两个采样，低四位对应第一个采样，高四位对应第二个采样。

而对于双声道的IMA-ADPCM来说，它的存储相对就麻烦一些了，它是将PCM的左声道的前8个采样依次压缩并写入到一个DWORD中，然后写入“data”chunk 里。

紧接着是右声道的前8个采样。

以此循环，当采样数不足8时（到数据尾端），应该把多出来的采样用0填充。