多媒体技术 数字音频基础
第03章_数字音频基础

3.2.2 量化(Quantization)
量化是指用若干比特表示一个样本的过程;表示一个样本所使用的比特数称为量化深度 (bit depth)。常见的量化深度有 4 比特、8 比特、16 比特、32 比特等等。不难理解,量化实 际上是一个对声音样本的幅值进行离散化处理的一个过程。虽然采样已经在时间上将模拟信号 离散化了,但是样本的大小(即幅值)仍然有无限种可能的取值(所以本质上还是连续量), 而数字系统只能表示有限种状态,例如,用 8 个比特表示样本大小的话,则只能有 256 种取值。 所以,量化是一个将无限多种可能取值归结为有限多个数字值的过程。通常,系统会将一个样 本以最接近其值大小的数字表示。总之,采样是时间上的离散化,而量化则是空间上的离散化。 需要强调的是,量化深度也是影响数字音频信号质量的重要因素。4 比特只有 16 种取值, 显然,试图通过这样少数几个状态来恢复原始模拟音频信号是十分困难的。但是,量化深度越 多,数据量也会越大,传输和存储的压力自然越大。所以,也需要根据实际应用环境来采用合 适的量化深度。例如,一般的网络音频应用采用了 8 位的量化深度,CD 音频的量化深度则是 16 比特,而有些高级数字音频系统采用了 32 位的量化深度。 3.2.3 编码(Coding) 在采样、量化处理后,模拟音频数字化的第三个步骤是编码。编码实际上是以某种格式最 终生成数字音频数据流的过程,所得到的数字音频数据将会被存储、传输或者进行各种处理。 本章第 3 节将介绍几种重要的音频编码技术。 需要读者注意的是,把数字化过程分解成采样、量化、编码三个阶段实际上是一种简化描 述,各种不同的数字音频技术会有不同的采样、量化与编码机制,特别是量化与编码往往是同 步进行的,而且编码还包括后续的数据流格式化。因此,多数介绍数字音频技术的教科书或学 术著作在提到音频编码的时候,都将这三个步骤合称为编码系统或编码技术,并在编码系统的 框架下对整个模数转换过程进行整体性介绍。本教程下面的阐述也沿用了这一模式。
数字音频基础知识

第一章数字音频基础知识重要内容⏹声音基础知识⏹结识数字音频⏹数字音频专业知识第1节声音基础知识1.1 声音旳产生⏹声音是由振动产生旳。
物体振动停止,发声也停止。
当振动波传到人耳时,人便听到了声音。
⏹人能听到旳声音,涉及语音、音乐和其他声音(环境声、音效声、自然声等),可以分为乐音和噪音。
✦乐音是由规则旳振动产生旳,只包具有限旳某些特定频率,具有拟定旳波形。
✦噪音是由不规则旳振动产生旳,它包具有一定范畴内旳多种音频旳声振动,没有拟定旳波形。
1.2 声音旳传播⏹声音靠介质传播,真空不能传声。
✦介质:可以传播声音旳物质。
✦声音在所有介质中都以声波形式传播。
⏹音速✦声音在每秒内传播旳距离叫音速。
✦声音在固体、液体中比在气体中传播得快。
✦15ºC 时空气中旳声速为340m/s 。
1.3 声音旳感知⏹外界传来旳声音引起鼓膜振动经听小骨及其他组织传给听觉神经,听觉神经再把信号传给大脑,这样人就听到了声音。
⏹双耳效应旳应用:立体声⏹人耳能感受到(听觉)旳频率范畴约为20Hz~20kHz,称此频率范畴内旳声音为可听声(audible sound)或音频(audio),频率<20Hz声音为次声,频率>20kHz声音为超声。
⏹人旳发音器官发出旳声音(人声)旳频率大概是80Hz~3400Hz。
人说话旳声音(话音voice / 语音speech)旳频率一般为300Hz~3000 Hz(带宽约3kHz)。
⏹老式乐器旳发声范畴为16Hz (C2)~7kHz(a5),如钢琴旳为27.5Hz (A2)~4186Hz(c5)。
1.4 声音旳三要素⏹声音具有三个要素:音调、响度(音量/音强)和音色⏹人们就是根据声音旳三要素来辨别声音。
音调(pitch )⏹音调:声音旳高下(高音、低音),由“频率”(frequency)决定,频率越高音调越高。
✦声音旳频率是指每秒中声音信号变化旳次数,用Hz 表达。
例如,20Hz 表达声音信号在1 秒钟内周期性地变化20 次。
多媒体技术(内容 题 答案)

多媒体技术第一节多媒体技术概论1、多媒体技术的概念多媒体一词来自于英文“Multimedia”,它是一个复合词。
多媒体技术是利用计算机对文字、图像、图形、动画、音频、视频等多种信息进行综合处理、建立逻辑关系和人机交互作用的产物。
2、多媒体技术的处理对象(1)文字:采用文字编辑软件生成文本文件,或者使用图像处理软件形成图形方式的文字。
(2)图像:主要指具有23~232彩色数量的.gif、.bmp、.tga、.tif、.jpg格式的静态图像。
图像采用位图方式,并可对其压缩,实现图像的存储和传输。
(3)图形:图形是采用算法语言或某些应用软件生成的矢量化图形,具有体积小、线条圆滑变化的特点。
(4)动画:动画有矢量动画和帧动画之分,矢量动画在单画面中展示动作的全过程;而帧动画则使用多画面来描述动作。
帧动画与传统动画的原理一致。
代表性的帧动画文件有.flc、.fla等动画文件。
(5)音频信号:音频通常采用.wav或.mid格式,是数字化音频文件。
还有.mp3压缩格式的音频文件。
(6)视频信号:视频信号是动态的图像。
具有代表性的有.avi 格式的电影文件和压缩格式的.mpg视频文件。
3、动画制作软件分三类:(1)绘制和编辑动画软件:AnimatorPro、AnimationStudio、Flash等软件用于制作各种形式的平面动画。
3DStudio、3DStudioMax、Cool3D、Maya等软件用于制作各种各样的三维动画。
(2)动画处理软件:Premiere、GIFConstructionSet网页动画处理软件等。
(3)计算机程序:Authorware多媒体平台软件、VisualBasic 等计算机语言。
14、多媒体技术的应用领域1)在教育领域方面CAI计算机辅助教学、CAL计算机辅助学习、CBI计算机化教学、CBL计算机化学习CAT计算机辅助训练、CMI计算机管理教学2)在家庭娱乐方面3)在过程模拟领域方面:化学反应、火山喷发、海洋洋流、天气预报等方面。
数字音频基础

编码
压缩
音频 文件
100101100011101
模拟信号的数字化过程
一、声音的数字化过程
1. 采样(Sampling) • 对振幅随时间连续变化的模拟信号波形按一定的时间间隔 取出样值,形成在时间上不连续的脉冲序列,称之为采样。 2. 量化(Quantization) • 将采样值相对于振幅进行离散的数值化的操作称为量化。 即将模拟信号的幅度,在动态范围内划分为相等间隔的若 干层次,把采样输出的信号电平按照四舍五入的原则归入 最靠近的量值。 3. 编码(Coding) • 把采样、量化所得的量值变换为二进制数码的过程称为编 码。 4. 压缩(Compress)目的是减少数据量与提高传输效率。 依据:声音信息中存在着多种冗余;听觉器官的不敏感性; 采样的标本中存在着相关性。
例2
例3
一般播音员的播音频率是4kHz,采用8bit的采用精度单声道 进行采样的时候,计算该播音员播音10分钟的数据量为:
8kHz*10*60 ≈ 4.5MB
例4
以CD音质(44.1kHz的采样频率,16位立体声形式)记录一 首5分钟的乐曲所需的存储容量为: 44 100(Hz)×(16/8)(B)×2×5×60 ≈ 51600kB
705.6
立体声
1411.2
立体声
1536
第2节 常用音频格式介绍
• WAV文件(.wav)
– WAV——Wave,波形文件 – 由Microsoft和IBM联合开发的音频文件格式 – 特点:层次丰富、还原性好、表现力强;数据量大;应用 广泛
• CD-DA文件(.cda)
– 标准激光盘文件 – 特点:数据量大,音质好
• AIFF文件(.aif/.aiff)
《数字音频技术》课程标准

《数字音频技术》课程标准课程名称数字音频技术英文名称Digital Audio Technology课程编号30320109适用专业计算机多媒体技术课程定位职业技术课总学时64 学分 4考核办法考查先修课程《多媒体技术基础》开课系部(单位)计算机科学与技术系,数字媒体教研室编写者付一君编写时间2009年6月26日审核者李勇审核时间2009年6月29日系教学指导委员会杨瑞良审核时间2009年7月14日一、课程性质与任务数字音频技术是计算机多媒体技术的重要内容,在多媒体产品不可缺少的元素。
数字音频最主要的是我们如何根据实际的需求来采集声音、处理声音、编辑声音和合成声音等。
本门课程的实践性较强,教学的目的在于如何进行有效的声音处理与合成,使学生掌握数字声音的特性和相关技术要点。
本课程作为计算机多媒体技术专业的一门职业技术课,学生实际动手的能力要求较高,同时提高学生的声音的认识能力,以及学生多声音的鉴赏能力。
在教学的过程中,以赏析和实际操作相结合,这样可以较快的提高学生对声音的认识能力和接受速度。
通过案例教学,分解步骤,化难为易,深入浅出地介绍相关理论知识和操作技术。
最后学生能够独立完成相关的项目制作。
同时为后续课程《影视广告创意设计与制作》打下基础。
二、课程教学目标1.知识目标:1)了解声音基本知识;2)掌握Adobe Audition3.0视频编辑技术;3)掌握声音文件收集与采集技术;4)掌握声音编辑技术;5)掌握声音的处理与合成技术。
2.能力目标:1)具备数字声音的基本属性和后期声音编辑的基本流程相关的知识;2)具备Adobe Audition 3.0声音处理软件的基本操作能力;3)具备声音的特殊效果处理能力;4)具备独立完成相关的声音项目作品。
三、授课内容和学时安排每周4学时,共64学时。
1.教学内容(打 * 号为重点讲授部分)。
表中学时分配学时为:讲课学时+实验学时。
专题题目学时主要内容及要求声音基础2声音基础知识、数字声音的由来、数字声音的分类、数字声音的常见格式、MIDI。
数字音频基础知识

3.6常见的数字音频文件格式
常见的数字音频文件格式有很多,每种格式都有自己的优点、缺点及适用范围。
CD格式——天籁之音
CD音轨文件的后缀名为:cda
标准CD格式是44.1K的采样频率,速率88K/秒,16位量化位数,近似无损的。
数字音频基础知识
转换(A/D)技术将模拟音频转化为二进制数,这样模拟音频就转化为数字音频了。所谓模数转换就是将模拟信号转化为数字信号,模数转换的过程包括采样、量化和编码三个步骤。模拟音频向数字音频的转换是在计算机的声卡中完成的。
3.2采样
采样是指将时间轴上连续的信号每隔一定的时间间隔抽取出一个信号的幅度样本,把连续的模拟量用一个个离散的点表示出来,使其成为时间上离散的脉冲序列。
特点:音质好,压缩比比较高,被大量软件和硬件支持,应用广泛。
适用于:适合用于一般的以及比较高要求的音乐欣赏。
MIDI——作曲家的最爱
MIDI(Musical Instrument Digital Interface)乐器数字接口。
MIDI数据不是数字的音频波形,而是音乐代码或称电子乐谱。
MIDI文件每存1分钟的音乐只用大约5~10KB。
采样频率、采样精度和声道数对声音的音质和占用的存储空间起着决定性作用。
我们希望音质越高越好,磁盘存储空间越少越好,这本身就是一个矛盾。必须在音质和磁盘存储空间之间取得平衡。数据量与上述三要素之间的关系可用下述公式表示:
3.4编码
采样和量化后的信号还不是数字信号,需要把它转换成数字编码脉冲,这一过程称为编码。最简单的编码方式是二进制编码,即将已经量化的信号幅值用二进制数表示,计算机内采用的就是这种编码方式。
数字音频基础

ISDB T(日本)或8 VSB(美国)调制方式; (2)卫星传输:采用 QPSK 调制方式; (3)有线传输:采用 M QAM 或16 VSB
高数据率调制方式,根据有线信道的不同 特性,分别采用16/32/128/256 QAM 等方 式。
数字音视频技术
三种。DVB-S (QPSK 调制方式)主要用 于数字电视卫星广播系统;DVB -T(OFDM 调制方式)则用于地 面无线发射的数字 电视广播系统;DVB-C(QAM 调制方式)主 要为地面 HFC(Hybrid FiberCoaxnetworks,混合光纤同轴电缆 网)网络数字电视广播所采用。
数字音视频技术
• 图6-1 数字电视系统的基本原理框图
数字音视频技术
下,对反映信源全部信息的数 字信号进 行变换,用尽量少的数字脉冲来表示信源 产生的信息,这就是压缩编码。
信道编码器包括纠错编码和数字调 制,主要解决数字信号传输的可靠性问题, 故又称 为抗干扰编码。经过纠错编码的 传输码流具有检错和纠错的能力,其作用 是最大限度地减 少在信道传输中的误码 率,然后将经过纠错编码后的传输码流调 制成适合于在信道上传输 的波形。
数字音视频技术
6.2 二进制数字调制及其抗噪声性能分 析
6.2.1 二进制数字幅移键控(2ASK) 1.2ASK 调制原理 数字幅度调制又称幅移键控(ASK),二进制幅移键控记作
2ASK。2ASK 是利用代表 数字信息“0”或“1”的基带矩形 脉冲去键控一个连续的载波,使载波时断时续地输出。有载 波输出时发送“1”,无载波输出时发送“0”。
–按照声音的来源以及作用来看,可分为人声、乐音 和响音。人声包括人物的独白、对白、旁白、歌声、 啼笑,感叹等;乐音也可成为音乐,是指人类通过 相关乐器演奏出来的声音,如影视作品中的背景声 音,一般起着渲染气氛的作用;响音是指除语言和 音乐之外电影中所有声音的统称,如动作音响 、 自然音响、 背景音响 、机械音响、特殊音响。
多媒体技术及应用数字音频技术02

4. WMA文件
WMA(Windows Media Audio)是 Windows Media格式中的一个子集(音频 格式)。
特点:压缩到MP3一半
多媒体技术及应用数字音频技术02
2-11
2.1 数字音频基础
5. MIDI和RMI文件 MIDI(乐器数字接口)是由一组音乐、乐 谱或乐器符号的数字集合。 特点:播放效果与硬件相关,数据量很小, 音质不高、音色单调等 6.VOC文件 创新公司开发的声音文件格式,由文件头 块和音频数据块组成。
音乐是符号化的声音。
多媒体技术及应用数字音频技术02
2.1 数字音频基础
二、声音的数字化 1.声音信号的类型 模拟信号(自然界、物理) 数字信号(计算机) 2.声音数字化过程
模拟信号
采样
量化
编码
数字信号
模拟信号
A/D ADC D/A DAC
数字信号
多媒体技术及应用数字音频技术02
2.1 数字音频基础
霍夫曼编码、算术编码、行程编码 ②有损压缩
波形编码--PCM、DPCM、ADPCM 子带编码、矢量量化
参数编码--LPC 混合编码--MPLPC、CELP
多媒体技术及应用数字音频技术02
2.2 数字音频压缩标准
二、音频压缩技术标准
分类
电话语 音质量
调幅广 播质量 高保真 立体声
标准 G.711 G.721 G.723 G.728
多媒体技术及应用数字 音频技术02
2020/11/14
多媒体技术及应用数字音频技术02
第二章 数字音频技术
2.1 数字音频基础 2.2 数字音频压缩标准 2.3 声卡与电声设备 2.4 MIDI与音乐合成 2.5 音频编辑软件 2.6 语音识别技术 本章小结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2章音频信息的获取和处理本章要点1.数字化音频的获取与处理基本概念,模拟音频与数字音频的区别。
数字音频采样和量化的基本原理,以及数字音频的文件格式和音频信号的特点。
2.音频卡的工作原理、功能和分类。
3.音频编码的原理、标准以及编码解码的基本方法。
4.音乐合成和MIDI的接口规范,以及MIDI在多媒体技术中的应用成原理及其分类。
第2章音频信息的获取和处理2.1 数字音频基础2.2 音频卡的工作原理2.3 音频编码基础和标准2.4 音频合成和MIDI规范2.1 数字音频基础1、数字化音频的获取与处理基本概念2、模拟音频与数字音频的区别3、数字音频采样和量化的基本原理4、数字音频的文件格式5、音频信号的特点。
常见到的音频信号•电话音频,调幅,调频无线电广播,高保真立体声音频,通常用带宽来衡量其音质数字激光唱盘(CD)FMAM电话10 20 50 200 3400 7K 15K 20K音频信号的属性音频信号有三种属性——音调、音色、音幅(音强)–响度:人耳对声音强度与频率的主观感觉,与声强(音量)不同,声强是一个客观物理量,表示声波在单位时间内通过单位面积的声能量。
–音调(在音乐上音调叫音高)人耳对声音调子高低的主观感觉取决于声音频率,频率越高,音调也越高,音调与频率成对数关系,频率增加一倍,增加一个倍频程,音乐上叫提高了八度–音色由声音的波形或它的频谱结构决定,它是个复杂感觉,无法定量表示信号的获取•获取法:利用声音获取硬件得到声源发生的声音•合成法:通过一种专门定义的语音去驱动一台预制的语音或音乐合成器。
•多媒体计算机中三类声音:①语音②音乐③效果声(sound effects )如刮风、下雨等话筒 放大 滤波 采样 保持 A/D 接口 微机采样脉冲音频信号的处理A/D转换后进行数据压缩存储或传输硬件(DSP)软件音频信号的回放微机接口D/A 滤波压放功放音箱作用:D A过程中会引入量化噪声2.1 数字音频基础1、数字化音频的获取与处理基本概念2、模拟音频与数字音频的区别3、数字音频采样和量化的基本原理4、数字音频的文件格式5、音频信号的特点。
模拟音频•声音——机械振动在弹性介质中传播的机械波。
振动越强,声音越大。
•模拟音频——将机械波转换成电信号记录在介质中。
播放时再将电信号还原。
以模拟电压的形式表示声音的强弱。
幅度越大,声音越强。
数字音频•数字音频——声音信号以一系列数字的形式表示。
在数字音频中,数字声音是一个数据序列。
它是由模拟声音经采样、量化和编码后得到的,各种数字以不同的命令体现。
音频数字化把模拟音频信号转换成有限个数字表示的离散序列,即实现音频数字化。
它涉及到音频的抽样、量化和编码。
在数字音频中,用数字来表示音频幅度时,只能把无穷多个电压幅度用有限个数字表示。
即把某一幅度范围内的电压用一个数字表示,这称之为量化。
当把模拟声音变成数字声音时,每隔一个时间间隔在摸拟声音波形上取一个幅度值,这称之为抽样。
该时间间隔称为抽样周期(其倒数称为采样频率)。
音频数字化2.1 数字音频基础1、数字化音频的获取与处理基本概念2、模拟音频与数字音频的区别3、数字音频采样和量化的基本原理4、数字音频的文件格式5、音频信号的特点。
采样采样——将连续的声波信号x(t)按一定的时间间隔(T)取值,得到离散的信号序列x(nT)T——采样周期1/T——采样频率x(nT)——离散信号序列采样定理采样定理——当连续信号x(t)的频谱为x(f),以采样间隔T采样得到离散信号x(nT),如果满足:当|f|≧fc时,T≤1/2fc 或fc≤1/2T则可以由离散信号x(nT)完全确定连续信号x(t)。
当采样频率等于f=1/2T时,称f N为奈魁斯特频率。
Nfc——信号的高端截止频率。
采样频率常用的音频采样率有:8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz。
采样与混叠若采样频率小于f N ,离散信号x nT)不能唯一地确定x (t )。
这时离散信号频谱是连续信号频谱折叠而成,即X (f )是一个周期函数,周期位2fc ,X T (f )仍是一个周期函数,只是由X (f )分段叠加而成。
其直观结果是频谱发生混叠,声音听起来发闷。
∑∑+∞-∞=+∞-∞=+=+=m c m T m f f X T m f X f X )2()()(采样与混叠思考题:设音频信号的高频截至频率为7KHz,抽样频率为6KHz,问:0.5KHz信号中混有哪些频率的信号?01234567KHz采样与混叠思考题:设音频信号的高频截至频率为7KHz,抽样频率为6KHz,问:0.5KHz信号中混有哪些频率的信号?01234567KHz抽样与混叠思考题:设音频信号的高频截至频率为7KHz,抽样频率为6KHz,问:0.5KHz信号中混有哪些频率的信号?01234567KHz量化为了把抽样序列x(nT)存入计算机,必须将采样值量化一个有限个幅度值的集合x(nT),即将取值连续地采样变成取值离散的采样称为量化:–用二进制数字表示量化后的样值。
–用B位二进制可以表示2B个不同的量化电平。
–存储数字音频信号的比特率为:I=B.fs(b/s)其中:fs是抽样率(抽样/秒)B是每个样值的比特数(比特/抽样)量化过程量化抽样的过程:先将整个幅度划分成为有限个小幅度 (量化阶距) 的集合,把落入某个阶距内的样值归为一类,并赋予相同的量化值。
如果量化值是均匀分布的,我们称之为均匀量化。
设△为量化阶距,量化器的最大范围是X max ,则:∆=22X B max 对于小于∆+)21(i ,而大于∆-)21(i 的样值, 均规定为相同的量化值 ∆i 。
抽样值)(ˆnT x与未量化样值)(nT x 的关系是: )()()(ˆn e nT x nT x+= )(n e 是量化误差(量化噪声),-≤≤∆∆22e n ()量化噪声的特点量化噪声的特点:语音信号是一个复杂信号,若量化阶距足够小,那么量化噪声与输入信号不相关,即0)]()([=+m n e n x E m 为任意值量化噪声是平稳白噪声过程,其均值为0,且量化噪声之间不相关,即2)]()([e m n e n e E σ=+ 0=m eσ是量误差)(n e 的均方差 =0 其它对于阶距为△的均匀量化器,量化噪声的幅度分布是均匀的,量化误差与阶距的关系是:p e e ()=1∆-≤≤∆∆22e n () =0 其它量化性能评价定义信号与量化噪声功率比为信噪比:)]([)]([2222n E n x E SNR e e x ==σσ 假设量化器量化范围是m ax 2X (m ax X 为峰值)。
量化器位数是B ,则均为量化器的阶距△为:B X 22m ax =∆ 按上述噪声具有均匀幅度分布的假设,则:e B xe B xX SNR X σσσσ22222222123232==⋅==⋅∆max max ()()量化性能评价信噪比用分贝表示:]log[20677.4]log[10)(m ax 22σσσxe xX B dB SNR -+==假设输入信号均方差x σ的四倍刚好是m ax X ,即 x X σ4m ax =,则上式变为: 2776)(⋅-=B dB SNR 我们常用此公式近似计算量化器的信噪比,如: B=6 SNR(dB)=28.85B=8 SNR(dB)=40.89量化器每增加一位编码,信噪比增大6dB 。
2.1.3 数字音频的文件格式2.1 数字音频基础1、数字化音频的获取与处理基本概念2、模拟音频与数字音频的区别3、数字音频采样和量化的基本原理4、数字音频的文件格式5、音频信号的特点。
存储声音的文件格式主要有:WA V 文件、VOC 文件、MIDI 文件等1、WAV文件WAV格式的文件又称为波形文件,是用不同的采样率对声音的模拟波形进行采样得到的一系列离散的采样点.以不同的量化位数(8位或16位)把这些采样点的值转换成二进制数得到的。
WAV是数字音频技术中最常用的格式.它还原的音质较好,但所需存储空间较大。
对采样频率的规定•单声道:11.025K,8bit;•双声道:44.1K,左右多为22.05K,每声道8bit,每个语音采样值为16bit,高8位放左声道数据,低8位放右声道数据。
文件的存储容量Wav文件的字节数/秒=采样频率×量化位数×声道数/8问:采样频率为44.1kHz,量化位数16bit,立体声,录制10秒的数据量是多少?S = 44.1×1000×10×16×2/8= 1764000(byte)=1764kB2、VOC文件VOC文件是新加坡创新公司Creative 在1989年秋COMDEX上展示的声霸卡Sound Blaster Card软件开发工具包SBK。
每个VOC文件由文件头块(header block)和音频数据块(data block)两部分组成。
文件头块主要对文件类型、版本号及标志进行说明,指出数据块的起始地址长度及采样率偏移地址内容00-13H文件类型14-15H从VOC文件开始到数据块的编移量16-17H VOC文件版本号18-19H VOC文件标志1AH VOC文件的数据块标志1B-1DH数据块长度音频数据块由性质不同的子块组合而成:语音数据子块、静音标志子块、ASCII码字符子块、循环重交子块、终止子块、用于立体声音响的扩展子块音频数据块定义数据子程序长度功能01B(字节)终止块17B+?语音数据25B+?语音数据37B静音46B标志56B+?ASCII字符66B+循环重交74B循环结束87B+?扩展块SBK提供了VOC文件的详细的格式和一些驱动程序接口,可以完成以下工作:1)在同一声音文件中使用不同采样率,以控制声音质量和磁盘存储空间;2)在同一声音文件中使用不同的压缩技术,如Silence Packing技术;3)在同一语音文件中存放单声道和立体声语音数据;4)对语音文件的一部份循环;5)嵌入一个用户宣言的倒程来控制语音输出。
3、MIDI文件MIDI(musical instrument digital interface,乐器数字接口),它是由世界上主要电子乐器制造厂商建立起来的一个通信标准,并于1988午正式提交给MIDI制造商协会,成为数字音乐的一个国际标准。
MIDI标准规定了电子乐器与计算机连接的电缆硬件以及电子乐器之间、乐器与计算机之间传送数据的通信协议等规范。
MIDI 标准使不同厂家生产的电子合成乐器可以互相发送和接收音乐数据。
MIDI文件记录的是一系列指令而不是数字化后的波形数据,所以它占用存储空间比wav文件要小很多。