数字音频文件格式与接口标准

合集下载

数字音频作业及其答案[试题]

第一次作业：1:、声音可分为两种：纯音和复合音，平常人们说话的声音属于哪一种？语音的频率范围是多少？音频通常包括哪几种声音信号？其频率范围是多少？2、请说明音频信号数字化的三个步骤？3、如何理解“量化是信号数字化过程中重要的一步，而这一过程又是引入噪声的主要根源”这句话的含义？通过哪些途径可以减小量化误差？4对双极性信号若采用均匀量化，则量化信噪比SNR与量化比特数之间的关系为：SNR=6.02xN+1.76dB，试分析此式对实际量化与编码的指导意义？5:、A/D、D/A转换器的技术指标有哪些？答：1:人们说话的声音为复合音，语言的频率范围为300HZ-3000HZ。

音频暴多语音、音乐、效果声等声音信号，频率范围为20HZ-20KHZ。

2：1取样：对连续信号按一定的时间间隔取样。

奈奎斯特取样定理认为，只要取样频率大于等于信号中所包含的最高频率的两倍，则可以根据其取样完全恢复出原始信号，这相当于当信号是最高频率时，每一周期至少要采取两个点。

但这只是理论上的定理，在实际操作中，人们用混叠波形，从而使取得的信号更接近原始信号。

2量化：取样的离散音频要转化为计算机能够表示的数据范围，这个过程称为量化。

量化的等级取决于量化精度，也就是用多少位二进制数来表示一个音频数据。

一般有8位，12位或16位。

量化精度越高，声音的保真度越高。

以8位的举例稍微说明一下其中的原理。

若一台计算机能够接收八位二进制数据，则相当于能够接受256个十进制的数，即有256个电平数，用这些数来代表模拟信号的电平，可以有256种，但是实际上采样后的某一时刻信号的电平不一定和256个电平某一个相等，此时只能用最接近的数字代码表示取样信号电平。

3编码：对音频信号取样并量化成二进制，但实际上就是对音频信号进行编码，但用不同的取样频率和不同的量化位数记录声音，在单位时间中，所需存贮空间是不一样的。

波形声音的主要参数包括：取样频率.量化位数.声道数.压缩编码方案和数码率等，未压缩前，波形声音的码率计算公式为：波形声音的码率=取样频率*量化位数*声道数/8。

数字音频信息及处理

声音升调后，速度加快，播放时间将缩短
数字音频处理
goldwave
12、制作科幻视频中机器人说话的效果效果/机械化，频率的数值越大，制作的声音效果越尖利
数字音频处理
goldwave
13、消除人说话的声音单击减少人声按钮或效果/立体声/减少人声
14、音频合成把若干个声音素材按照某种方式叠加在一起，是声音编辑最有力的手段 EG：为一段解说词配上背景音乐. 素材：解说词、音乐打开解说词，查看时间，复制全部声音到剪贴板
打开音乐，并把某个乐段设置为选区，将要把语音合成在这个选区中，选区的时间长度要稍大于语音的时间长度单击音量定形按钮， , 显示调整画面，将白色线段两端往下拖
goldwave
数字音频处理
数字音频处理
goldwave
将选区的开始位置向右移动一点，单击混音按钮，将音量滑块调整单击确定按钮，保存
goldwave
10、声道变换
编辑/声道/左、右声道，识别当前声道的方法是：选区背景为深兰色是当前声道，可进行各种编辑操作，黑色背景的选区是不可编辑的声道。注意：在单独一个声道进行的删除操作，剪切操作将改变该声道的时间长度，使两个声道的时间长度不等，导致声音不同步
11、改变说话的声音效果/多普勒效应
音频信息的数字化
采样定理指出：
对一个频率在0～ fc 内的连续信号进行采样，当采样
频率为 fs ≥2 fc
时，由采样信号 xs(nTs )能无失
真地恢复为原来信号x(t) 。采样：在时间轴上对信号数字化。采样的三个标准频率分别为： 44.1KHz，22.05KHz和11.025KHz。一般采样频率是自然声频率的两倍。

数字音频接口技术

专业用途和民用用途在软件上的唯一区别就是子码中的通道状态块的不同。两者有不同的定义。除此之外，并没有其它不同的地方。
2.数字音频接口数据结构
数字音频接口是一种单线单向串行传输数字音频数据的接口。它能够传输两个声道的数字音频数据、相关的控制信息，有一些检测错误能力。一个声音样本附带有一位控制信息，这些控制信息汇集成一个控制块。信号是双相调制的，可以从信号中恢复时钟。引导符用来区分块边界和每一个声音样本。
a）帧、子帧和块的结构音频数据放在一个被称为子帧（Sub-frames）有结构里。包含一个4位的引导符，4位的辅助数据，20位的音频数据。三位分别称为合法标记、用户位、通道状态。另外还有一个校验位。引导符标识子帧的开始。按照子帧的数据容量，音频样本最大可达到24位，这点非常令人激动，只要把时钟频率加倍，我们就能够通过数字音频接口传输24位96kHz的数字音频信号。在音频样本大于20位时，数据同时占据辅助和音频数据域。在音频样本小于等于20位时，数据存放在音频数据域中，辅导数据可用于其它应用方面，例如语音数据。音频数据在子帧中是最低有效位在先，最高有效位在后。合法标记位，表示此音频样本是正确的，没有包含错误，适合作数模转换。如果音频样本有错，例如CD唱片上的不可恢复的缺陷，CD-DSP无法进行纠错，它将把此音频样本标记为含有错误，留待以后的电路部分作适当的处理。用户位没有定义，可由用户随意使用。通道状态位包含有重要信息。通道状态块由192位组成，每个音频样本附带一位通道状态位，左右声道的通道状态块是独立的。每192帧通道状态块更新一次。校验位为偶校验位，可检出子帧中奇数个错。
c）专业用途、民用用途
3、媒介接口（Media Interface）
数字音频信号是通过特定的传输媒介传送的，常见的有同轴电缆、Toslink光纤、AT&T光纤、平衡线等。

数字音频知识

数字音频知识AES/EBU：实时立体声数字音频信号格式。

在相应设备之间进行传送。

这种格式是AudioEngineeringSociety/EuropeanBroadcastUnion(录音师协会/欧洲广播系统联盟)的缩写。

这种数字格式亦由这两个组织联合制定的。

AES/EBU是由平衡XLR口输出，其他方面同S/PDIF格式相似。

automatedmixing：自动混音。

将各轨的音量、立体声声像位置、或各轨的其它参数如均衡(EQ)值等同乐曲信息放置在一起。

播放时这些信息将控制各轨完成自动混音过程。

一些录音程序可通过屏幕上一些可编辑的多段音量/声像包络来实现自动混音。

另外一种方法是用鼠标拖动显示屏上的推子或旋钮并进行录音，播放时音量/声像会随着推子或旋钮的变化而变化。

另外音量和声像的变化也可以通过将其所对应的控制器信息录入音序器中来实现自动混音。

backup：备份。

虽然硬盘存储被认为是非常可靠的存储方式，但是存于硬盘上的数据很可能会在不经意间毁于一旦。

在以PC为基础的录音系统中，将文件从一个硬盘备份到另一个硬盘就象用WINDOWS 的drag-copy（拖动复制）一样简单。

另外一些录音机可将数据备份到DAT的两个立体声轨上。

需要时，可将所备份的声音数据从DAT 带上恢复回来。

crossfade：淡入/淡出技术。

特别用在前期制作中的一种技术。

这种技术可使一个声音片段平缓地过渡到另一个声音片段。

有些录音机需要两轨来完成这一过程，一轨将声音进行淡出处理，同时另一轨将声音进行淡入处理。

有些则只需要一轨来完成一个声音片段淡出的同时另一个声音片段淡入的过程。

这时控制程序将产生一个新的文件，包含了两个声音片段的混合过渡情况。

很多控制程序还允许用户选择选择第一个声音片段淡出及第二个声音片段淡入的曲线类型。

当选择的曲线为等幂指数曲线时，可保证整体音量在淡入/淡出的过程中没有明显的变化，即声音过渡在听觉上比较自然一些。

DSP：数字信号处理，即一个对音频信号进行处理并使音频信号产生变化的过程。

数字音频技术基础

27
音频的基础知识
MIDI基本简介
MIDI仅仅是一个通信标准，它是由电子乐器制造商们建立起来的，用以确定电脑音乐程序、合成器和其他电子音响的设备互相交换信息与控制信号的方法。 MIDI系统实际就是一个作曲、配器、电子模拟的演奏系统。从一个MIDI设备转送到另一个MIDI设备上去的数据就是MIDI信息。MIDI数据不是数字的
25
音频的基础知识
音频文件格式简介
*.MID、*.RMI、*.CMF、*.RCP 这些文件格式属于MIDI文件范畴，这类文件主要应用于计算机音乐创作，用户可以通过专业的音频创作软件实现谱曲，
或直接通过声卡MIDI接口将外部音序器演奏的乐曲输入到计算
机中完成音乐创作 MOD MOD的结构类似于MIDI，是一种类似于波表的音乐格式，
•音频信号的数字处理
（2）量化
采样只是在时间上实现了离散化。其音频脉冲信号的幅度仍然是模拟的，因此，还必须对幅度进行离散化处理，这个过程称为量化。
量化的过程如下：
16
音频的基础知识
•音频信号的数字处理
（3）编码
编码：采样和量化之后的音频信号还必需转换为数字编码脉冲才是数字信号，这一转换过程称为编码。最简
杂波不会积累
12
音频的基础知识
音频信号的A/D和D/A变换：
• A/D变换模拟信号变换成数字信号
• D/A变换数字信号转换为模拟信号
2).声音数字化过程
模拟信号
采样
量化
A/D ADC D/A DAC
编码
数字信号
模拟信号
声音是如何数字化的呢？
数字信号
图1-10 模拟信号的数字处理过程
13

常见的数字音频格式常见的声音格式有哪些

常见的数字音频格式常见的声音格式有哪些1.WAV格式，是微软公司开发的一种声音文件格式，也叫波形声音文件，是最早的数字音频格式，被Window平台及其程序广泛支持。

WAV格式支持许多压缩算法，支持多种音频位数、采样频率和声道，采用44.1kHz的采样频率，16位量化位数，跟CD一样，对存储空间需求太大不便于交流和传播。

2.MIDI是MuicalIntrumentDigitalInterface的缩写，又称作乐器数字接口，是数字音乐/电子合成乐器的统一国际标准。

它定义了计算机音乐程序、数字合成器及电子设备交换音乐信号的方式，规定了不同厂家的电子乐器与计算机连接的电缆和硬件及设备间数据传输的协议，可以模拟多种乐器的声音。

MIDI文件就是MIDI格式的文件，在MIDI文件中存储的是一些指令。

把这些指令发送给声卡，由声卡按照指令将声音合成出来。

midi是乐器数字接口的意思，向合成器发送音乐指令，便可以生成音乐信号。

我们知道，声音有四大特性，音高，音长，音强，音色。

向midi合成器发送用何种乐器演奏（音色），音高，持续时间（音长），音量大小等指令，电子乐器便可以发出所要求的。

3.大家都很熟悉CD这种音乐格式了，扩展名CDA，其取样频率为44.1kHz，16位量化位数，跟WAV一样，但CD存储采用了音轨的形式，又叫“红皮书”格式，记录的是波形流，是一种近似无损的格式。

4.MP3全称是MPEG-1AudioLayer3，它在1992年合并至MPEG规范中。

MP3能够以高音质、低采样率对数字音频文件进行压缩。

换句话说，音频文件(主要是大型文件，比如WAV文件）能够在音质丢失很小的情况下(人耳根本无法察觉这种音质损失)把文件压缩到更小的程度。

5.MP3Pro是由瑞典Coding科技公司开发的，其中包含了两大技术：一是来自于Coding科技公司所特有的解码技术，二是由MP3的专利持有者法国汤姆森多媒体公司和德国Fraunhofer集成电路协会共同研究的一项译码技术。

数字音频文件格式与接口标准

数字音频文件格式与接口标准
无损压缩音频格式的特点 1、压缩比决定无损压缩文件所占存储空间 FLAC的压缩比为58.70%，而APE的压缩比那么要更高一些，为 55.50%，都能压缩到接近源文件一半大小 2、编码速度考验用户的耐心，速度快者优 3、FLAC与APE都能兼容所有系统平台 4、自我纠错能力 FLAC的会以静音方式代替有损局部，APE以爆音方式代替有损局部压缩算法的根本过程： Interchannel Decorrelation ：信道相关性利用 X=(L+R)/2 Y=L-R Prediction：预测 Rise 编码:使用较少的数位来表示小的数目
数字音频文件格式与接口标准
无损压缩音频格式的特点 1、压缩比决定无损压缩文件所占存储空间 FLAC的压缩比为58.70%，而APE的压缩比那么要更高一些，为 55.50%，都能压缩到接近源文件一半大小 2、编码速度考验用户的耐心，速度快者优 FLAC与APE的编码速度都相差无几，这是因为两者的压缩技术是开源的，开发者可以借鉴两者在编码上的不同优势进行开发 3、平台的支持决定普及度 FLAC与APE在这方面都能够兼容所有系统平台 4、自我纠错能力 FLAC的会以静音方式代替有损局部，APE以爆音方式代替有损局部
数字音频文件格式与接口标准
数字音频接口标准多声道数字音频接口标准 MADI〔Multichannel Audio Digital Interface〕由Sony、SSL 和Neve联合开发，作为AES 3的延伸，定义为AES 10标准适用于在同轴电缆或光缆上进行以线性表示的，取样频率范围在32kHz~48kHz，分辨率达每通道24比特，可以在50米的距离内通过一根带有BNC端口的电缆串行传输56个通道的线性量化〔PCM〕音频数据

广电设备用数字音频接口考核试卷

A.数据压缩
B.多路复用
C.信号调制
D.数据加密
12.数字音频接口在传输过程中，哪些因素可能导致信号失真？（）
A.采样频率不匹配
B.量化误差
C.传输介质损耗
D.时钟偏移
13.以下哪些接口支持多通道数字音频传输？（）
A. MADI
B. ADAT
C. AES/EBU
D. S/PDIF
14.数字音频接口的同步方式包括以下哪些？（）
10.为了提高数字音频接口的抗干扰能力，常采用____传输方式。
四、判断题（本题共10小题，每题1分，共10分，正确的请在答题括号中画√，错误的画×）
1. AES/EBU接口标准是由AES和IEC共同制定的。（）
2.数字音频接口的采样频率越高，音质越好。（）
3. S/PDIF接口只能使用同轴电缆进行传输。（）
3.同轴电缆、光纤
4.动态范围、信噪比
5. ADC（模拟-数字转换器）
6. 192000
7.采样频率、量化位数
8. S/PDIF
9. Mbps
10.差分
四、判断题
1. ×
2. √
3. ×
4. ×
5. ×
6. √
7. √
8. ×
9. ×
10. ×
五、主观题（参考）
1.数字音频接口在广播电视设备中用于高质量音频信号的传输，确保音质不受损失，适用于远程直播、后期制作等，其重要性在于保证音频质量，提高工作效率。
A. AES/EBU
B. S/PDIF
C. MADI
D. ADAT
16.以下哪个单位用于描述数字音频接口的传输速率？（）
A. kHz
B. MHz

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

数字音频文件格式与接口标准
数字音频接口标准数据结构主要结构是子帧、帧和块，两个前后相连的子帧组成一个帧， 192个帧组成一个块子帧（Sub-frames）结构里包含 4位的引导符、4位的辅助数据、20位的音频数据使用一条传输导线，信号的调制方法为双相标记编码，传输信号中融合了时钟信号和音轨开始标记、资料辨认信息和时间等数据信号，这种方法能够减小直流分量，并且可以从数据中恢复时钟成份
数字音频文件格式与接口标准
WAV音频文件使用RIFF（Resource Interchange File Format 资源交换文件）的格式描述，由文件头和波形音频文件数据块组成
文件头包括标志符、语音特征值、声道特征以及PCM格式类型标志等；数据块是由数据子块标记、数据子块长度和波形音频数据 3个数据子块组成
WAV音频文件的特点 1、简单的编/解码几乎直接存储来自模/数转换器(AD需要占用较大的音频传输和存储空间
数字音频文件格式与接口标准
无损压缩音频文件
无损压缩是在保证不损失源文件所有码率的前提下，将音频文件压缩的更小
1、APE 格式能够做到真正无损，同时其开放源码的特性，虽然压缩比远低于其他音频格式，但是突出的性能和快速的压缩速度任然得到广泛的应用 2、FLAC 格式编码算法相当成熟，已经通过了严格的测试，源码完全开放，而且兼容几乎所有的操作系统平台
数字音频文件格式与接口标准
MPEG音频文件 ---- .MP1/.MP2/.MP3 有损压缩音频文件格式，分别具有4∶1、6∶1 ~ 8∶1和10∶1 ~ 12∶1的压缩比采用ABR可变编码速率加差值参数的压缩方式，在指定的文件大小内，以每50帧（30帧约1秒）为一段，低频和不敏感频率使用相对低的比特流量，高频和大动态表现时使用高比特流量，可以让整体音频都能达到接近CD听觉感受的音质要求 MP3格式文件播放，必须有相应的数字解码播放系统，通过专门的软件进行解码，再还原成波形声音信号播放输出
数字音频文件格式与接口标准
数字音频接口标准
多声道数字音频接口标准 MADI采用异步工作方式，音频信号的时钟和数据分开传输，每个通道包含32个比特，其中24个比特分配给音频或由音频/非音频标记定义的其他数据，另有4个比特用来表示二通道接口的有效位（V）、用户数据位（U）、状态数据位（C）和奇偶校验位（P）另4个比特用于模式确认 MADI光纤信号传输带宽是125M，用光纤来传输信号，没有压缩，音质更好
数字音频文件格式与接口标准
无损压缩音频格式的特点 1、压缩比决定无损压缩文件所占存储空间 FLAC的压缩比为58.70%，而APE的压缩比则要更高一些，为 55.50%，都能压缩到接近源文件一半大小 2、编码速度考验用户的耐心，速度快者优 3、FLAC与APE都能兼容所有系统平台 4、自我纠错能力 FLAC的会以静音方式代替有损部分，APE以爆音方式代替有损部分压缩算法的基本过程： Interchannel Decorrelation ：信道相关性利用 X=(L+R)/2 Y=L-R Prediction：预测 Rise 编码:使用较少的数位来表示小的数目
数字音频文件格式与接口标准
数字音频接口标准多声道数字音频接口标准 MADI（Multichannel Audio Digital Interface）由Sony、SSL 和Neve联合开发，作为AES 3的延伸，定义为AES 10标准适用于在同轴电缆或光缆上进行以线性表示的，取样频率范围在32kHz~48kHz，分辨率达每通道24比特，可以在50米的距离内通过一根带有BNC端口的电缆串行传输56个通道的线性量化（PCM）音频数据
数字音频文件格式与接口标准
RealAudio音频文件 ---- .RA/.RM/.RAM Real Networks公司采用了“音频流”技术开发的流媒体音频（Streaming Audio）文件格式，具有压缩率高、生成文件较小的优点，用来传输近乎CD音质的音频数据
RealAudio音频文件在传输过程中，内容数据被分割处理，将
原来的音频分割成多个带有顺序标记的小数据包，每段信号流都具有与其相关的优化比特率经过网络的实时传递后，在接收处将重新按顺序组织这些数据包以提供播放
数字音频文件格式与接口标准
数字音频接口标准音频接口是在传输音频信号的时候使用的接口，包括模拟方式和数字方式的 AES/EBU标准为专业用途制定的单线单向传输数字音频数据串行通信接口，硬件方面，采用平衡方式传输，通过一条三芯XLR电缆传输两个声道交织的数字音频信号，包括DATA、BCK、LRCK，DATA 是交替传输的左右声道数据，BCK是位时钟，LRCK是左右声道标记时钟，用来识别DATA信号中左右声道数据，配SLR卡侬接口，阻抗110欧姆
数字音频文件格式与接口标准
数字音频接口标准 SPDIF标准 SONY和philips公司联合制定的为民用用途制定的数字音频数据串行通信接口在硬件方面，采用单端方式传输，信号幅度为0.5Vp-p，常用的信号线为75欧姆同轴数码线数据结构采用与专业接口相同的信号数据形式，由于音源数字传输信号的幅度有限，传输距离与声音数据的抗干扰性与同步性不高
声音媒体技术
四、数字音频文件格式与接口标准
数字音频文件格式与接口标准
数字化音频格式的出现，是为了满足复制、存储、传输的需求
常用的数字音频格式主要有：WAV文件、VOC文件和MP3文件等
WAV文件
WAV文件又称波形文件，来源于对声音模拟波形的采样 WAV格式支持多种音频位数、采样频率和声道，是PC机上最为流行的声音文件格式，但其文件尺寸较大，多用于存储简短的声音片断 WAV文件的存储量计算存储量（KB）= （采样频率KHZ×采样位数bit ×声道数×时间秒）/8
数字音频文件格式与接口标准
无损压缩音频格式的特点 1、压缩比决定无损压缩文件所占存储空间 FLAC的压缩比为58.70%，而APE的压缩比则要更高一些，为 55.50%，都能压缩到接近源文件一半大小 2、编码速度考验用户的耐心，速度快者优 FLAC与APE的编码速度都相差无几，这是因为两者的压缩技术是开源的，开发者可以借鉴两者在编码上的不同优势进行开发 3、平台的支持决定普及度 FLAC与APE在这方面都能够兼容所有系统平台 4、自我纠错能力 FLAC的会以静音方式代替有损部分，APE以爆音方式代替有损部分