音频、视频技术基础习题3

音频、视频技术基础习题3
音频、视频技术基础习题3

《音频、视频技术基础》习题3

一、单项选择题

1.压缩编码技术,就是指用某种方法使数字化信息的()降低的技术。

A、采样率

B、传输速率

C、数据量

D、编码率

2.()决定了声音的动态范围。

A、声音大小

B、量化位数大小

C、采样频率

D、压缩技术

3.人类听觉的声音频率是()。

A、0~20Hz

B、20Hz~20KHz

C、20Hz~340Hz

D、20KHz以上

4.人类接受的信息约70%来自于()。

A、阅读

B、听觉

C、视觉

D、触觉

5.Premiere Pro中输出视频的快捷键是()。

A、ctrl+Alt+M

B、Shift+M

C、ctrl+shift+M

D、ctrl+M

6.构成视频信息的基本单元是()。

A、帧

B、画面

C、幅

D、像素

7.关于声音数字化技术中的量化位数叙述正确的是()。

A、量化位数是指一秒种内对声波模拟信号采样的次数

B、量化位数是指每个采样点十进制数据的位数

C、量化位数是指每个采样点十六进制数据的位数

D、量化位数是指每个采样点二进制数据的位数

8.一般来说,要求声音的质量越高,则()。

A、量化级数越低采样频率越高

B、量化级数越低采样频率越低

C、量化级数越高采样频率越低

D、量化级数越高采样频率越高

9.波形文件是采集各种声音的机械振动而得到的数字文件,其后缀是()。

A、wav

B、mpga

C、mp3

D、voc

10.超声波的频率范围是()。

A、高于20KHz

B、低于20Hz

C、低于20KHz

D、高于20Hz,低于20KHz

11.以下软件中不是声音编辑软件的是()。

A、Windows“录音机”

B、Winamp

C、SoundForge

D、Cool Edit Pro

12.用()软件可以将自己需要的VCD片段从VCD光盘中截取出来。

A、超级解霸

B、PowerPoint

C、ACDsee

D、画图

13.DVD采用的视频压缩标准是()。

A、DVI

B、MPEG-1

C、MPEG-2

D、JPEG

14.()将音乐以1:10甚至1:12的压缩率压缩成较小的file。

A、Mp3

B、MPEG-1

C、MPEG-2

D、JPEG

二、多项选择题

1.声音质量的主观评价主要有()几方面。

A、清晰度和丰满度

B、亲切感和平衡感

C、亮度和回响

D、环境感和响度

2.下列音频格式中,()是音频信号的压缩格式。

A、wav

B、voc

C、rm

D、mp3

3.MPEG视频压缩标准包括()。

A、MPEG-1、MPEG-2

B、MPEG-4

C、MPEG-7

D、MPEG-21

4.数字音频文件的格式有()。

A、WAVE文件

B、MP3文件

C、WMA文件

D、MIDI文件

5.可用于移动接受的数字声广播是()。

A、阿斯特拉卫星数字声音广播(ADR)

B、数字音频广播(DAB)

C、数字卫星广播(DSR)

D、世广卫星数字声广播(WorlDspace)

6.设计声音压缩编码系统需要考虑的因素有()。

A、输入声音信号的特点

B、传输速率及存储容量的限制

C、输出重构声音的质量要求

D、系统的可实现性及代价

三、判断题

1.采样频率越高,则经过离散数字化的声波越接近其原始的波形。()

2.波形编码其目的是重建音频,以保持原始音频的特性。主要用于保密通话。(

3.声音通过话筒等转化装置后转化为数字音频信号。()

4.电影院一般使用8个声道,高级影院会使用16个声道。()

5.对应25帧/秒,一分钟内可以传输的画面有1500幅图画。()

6.Cool Edit里,淡入效果是指最初音量很小甚至无声,最终音量相对较大的淡

入、渐强的效果。()

7.在录音开始后,应先录制一段空白声音,用于降噪时的噪音采样。()

8.量化位数越低,表现力越强,数据量也越来越大。()

9.Cool Edit制成的音频文件可以直接压缩为mp3格式。()

四、填空题

1.调幅广播质量音频信号的频率范围是_____。

2.线性量化的量化误差最大值_____。

3.声音按频率可分为3种:次声波、_____和_____。

4._____标准正式名称是:通用的图像和声音压缩标准。

5.Cool Edit中_____效果不仅可以模拟各种房间效果,还能模拟空中回声、隧

道、从后方发出等效果。

6.在视频中,一幅幅单独的图像称为_____,而每秒钟连续播放的帧数称为

_____,单位是帧/秒。

7.所谓电视制式,实际上是一种电视显示的_____,不同的制式对视频信号的解

码处理方式、色彩处理方式以及屏幕扫描频率的要求都有所不同。

8.听觉激励器是一种_____。

9.基本卷积码的优点是_____。

10.图示均衡器采用_____技术。

五、简答题

1.解释波形编码、参数编码以及混合编码的原理。

2.简述Cool Edit的主要功能。

《音频、视频技术基础》习题3答案

一、单项选择题题号

12345678答案D B B C D A D D 题号91011121314答案A A B A C A 二、多项选择题题号123456答案ABC D CD ABC D ABC D BD ABC D 三、判断题题号123456789答案T F F T T T T F T 四、填空题1. 50~7000Hz 2. 量化台阶/23. 可听声波 超声波4. MPEG-2

5. 延时

6. 帧、帧率

7. 标准

8. 谐波发生器

9. 纠错能力强10. 恒定Q 值技术五、简答题、管路敷设技术保护层防腐跨接地线弯曲半径标高等,要求技术交底。管线敷设技术中包含线槽、管架等多项方式,为解决高中电压回路交叉时,应采用金属隔板进行隔开处理;同一线槽内,强电回路须同时切断习题电源,线缆敷设完毕,要进行检查和检测处理。、电气课件中调试编写复杂设备与装置高中资料试卷调试方案,编写重要设备高中资料试卷试验方案以及系统启动方案;对整套启高中资料试卷技术问题,作为调试人员,需要在事前掌握图纸资料、设备制造厂家出具高中资料试卷试验报告与相关技术资料,并且了解现场设备高中资料试卷布置情案。

、电气设备调试高中资料试卷技术卷工况进行自动处理,尤其要避免错误高中资料试卷保护装置动作,并且拒绝动作,来避免不必要高中资料试卷突装置高中资料试卷调试技术是指发电机一变压器组在发生内部故障时,需要进行外部电源高中资料试卷切除从而采用高中资料试卷主要保护装置。

1、答案:

波形编码是利用采样和量化过程来表示音频信号的波形,使编码后的音频

信号与原始信号的波形尽可能匹配。主要根据人耳的听觉特性进行量化,以达到压缩数据的目的。

参数编码是将音频信号以某种模型来表示,利用特征提取的方法抽取必要

的模型参数和激励信号的信息,并对这些信息编码,最后在输出端合成原始信号。其目的是重建音频,保持原始音频的特性。

混合编码是在参数编码方法基础上,引用波形编码准则优化激励源信号的

一种方案,可以在较低的码率上得到较高的音质。

2. 可以同时处理多达128路音频信号,并且可以对每一信号单独进行编辑处理,加入不同的音效或特效,不但能处理多种声音格式,还能直接从CD或VCD中

摘录声音,处理后的声音可以以各种格式输出。

数字视音频技术

1)英文缩写的中文全称 BD(Blu-ray Disc蓝光光盘) HD(High Defination高解析度) DVD(Digital Video Disc数字视频光盘) CD (COMPACT DISC激光唱片) EVD(Enhanced Versatile Disk增强型多媒体盘片系统) DTS-HD(数字影院系统) HDMI(High Definition Multimedia Interface高清晰多媒体接口) 2) 欣赏音乐的主要内容 旋律,乐器,低中高频率成分,立体声空间感,乐器层次解析度,和声,情感抒发 3) 9C消费电子产品制造商:索尼,飞利浦,松下,日立,LG,先锋,三星,夏普,汤普森 4) 美国7大制片商 华纳,20世纪福克斯,迪斯尼,米高梅(索尼)华纳,环球,派拉蒙,梦工厂(东芝) 5) 消费类电子产品和影音制造业在国家经济发展中的地位和战略 消费类电子和影音制造的销售已经超过了家具,汽车等产品,成为国家经济增长的一个重要推动力.随着中国经济的快速发展,中国的经济发展进入了一个新的关键时期,而从扩大内需来看,家电产品,或者说消费电子产品,已经成为了其中的一个重要的方面,消费结构变化,消费品质提升.第一,我们继续支持和鼓励家电企业扩展消费类电子产品的销售,特别是要在农村市场销售方面的拓展;第二,通过商务部掌握的市场信息,向工商企业提供第一手的市场需求;第三,要鼓励中国的家电生产和销售企业走出去,走出国门,走向世界;第四,就是要维护公平竞争秩序,促进工商业共同发展。 6) CBHD标准的中文含义?那些技术专利属于中国公司? 中国蓝光高清光盘,物理格式中的调制编码部分;音视频压缩,导航系统以及版权保护系统方面的专利是中国公司和国外公司共有. 7) 多媒体系统包括哪六个基本形式? 感觉形式;机器表示;交互技术;存储技术;传输媒介;传输媒体的操作软件 8) 当今社会的3大基本资源?能源,材料,信息 9) 多媒体技术处理的6个对象?文本,图形,图像,动画,声音,视频 10) 商业上的高清和全高清的平板显示器的分辨率各为多少? 商业高清HD:1366x768标清数字节目商业全高清FullHD:1920x1080高清节目11) 高清(倍线)DVD播放机的主要功能是什么/ 二维分辨率升频,提升DVD视频讯号至高清息层次,还设有Dual PureCinemaProfressive Scan,对影像扫描率加倍,形成稳定清晰的影院式效果。 12) WiFi:802.11b标准, 载波频率为 2.4GHz 数码传输频率为11Mps带宽可高达 5.5Mbps通讯距离为76~122米 13) CMMB代表China Mobile Multimedia Broadcasting (中国移动多媒体广播) 其信号传输过程为利用大功率S波段卫星信号覆盖全国,利用地面增补转发器同频同时同内容转发卫星信号补点覆盖卫星信号盲区,利用无线移动通信网络构建回传通道,从而组成单向广播和双向交互相结合的移动多媒体广播网络。 14) 模拟声信号在采样量化中的量化精度决定了音响系统的什么特性?决定信噪比 15) 模拟声信号在采样量化中的采样频率过低会影响音响系统的什么特性? 还原后的模拟声音将失去原声中的高频成分 16) DSD数字音响标准主要是哪些公司提出的? Direct Stream Digital 索尼和飞利浦 17) PCM,MIDI,DSD,SACD的英文全称是什么? PCM数字音频文件Pulse Code Modulation MIDI乐器数字接口Musical Instrument Digital Interface DSD 直接数据流Direct Stream Digital

音频、视频技术基础习题3

《音频、视频技术基础》习题3 一、单项选择题 1.压缩编码技术,就是指用某种方法使数字化信息的()降低的技术。 A、采样率 B、传输速率 C、数据量 D、编码率 2.()决定了声音的动态范围。 A、声音大小 B、量化位数大小 C、采样频率 D、压缩技术 3.人类听觉的声音频率是()。 A、0~20Hz B、20Hz~20KHz C、20Hz~340Hz D、20KHz以上 4.人类接受的信息约70%来自于()。 A、阅读 B、听觉 C、视觉 D、触觉 5.Premiere Pro中输出视频的快捷键是()。 A、ctrl+Alt+M B、Shift+M C、ctrl+shift+M D、ctrl+M 6.构成视频信息的基本单元是()。 A、帧

B、画面 C、幅 D、像素 7.关于声音数字化技术中的量化位数叙述正确的是()。 A、量化位数是指一秒种内对声波模拟信号采样的次数 B、量化位数是指每个采样点十进制数据的位数 C、量化位数是指每个采样点十六进制数据的位数 D、量化位数是指每个采样点二进制数据的位数 8.一般来说,要求声音的质量越高,则()。 A、量化级数越低采样频率越高 B、量化级数越低采样频率越低 C、量化级数越高采样频率越低 D、量化级数越高采样频率越高 9.波形文件是采集各种声音的机械振动而得到的数字文件,其后缀是()。 A、wav B、mpga C、mp3 D、voc 10.超声波的频率范围是()。 A、高于20KHz B、低于20Hz C、低于20KHz D、高于20Hz,低于20KHz 11.以下软件中不是声音编辑软件的是()。 A、Windows“录音机” B、Winamp C、SoundForge D、Cool Edit Pro 12.用()软件可以将自己需要的VCD片段从VCD光盘中截取出来。 A、超级解霸

数字音视频技术考核内容

数字音视频技术考核内容 1、声波基本要素:振幅、频率、频谱 2、彩色三要素:亮度、色调、饱和度 3、音视频输入有设备哪些? 话筒、摄像机等 4、音视频模/数(A/D)数/模(D/A)转换的设备有哪些? 非线性编辑卡、数字录像机等。 5、数字音视频节目存储介质: 磁带、光盘、磁盘等 6、模拟音频信号波形的振幅反映了是什么、频率反映了是什么? 用信号的幅度值来模拟音量的高低,音量高,信号的幅度值就大。 用信号的频率模拟音调的高低,音调高,信号的频率就高。 模拟信号具有直观、形象的特点。 7、视频分量YUV的意义及数字化格式(比例)? 用Y:U:V来表示YUV三分量的采样比例,则数字视频的采样格式分别 有4:2:0 ,4:1:1、4:2:2和4:4:4多种 8、音频信号的冗余度有哪些? 1、 时域冗余:: (1)、幅度分布的非均匀性(2)、样值间的相关性 (3)、周期之间的相关性(4)、基音之间的相关性(5)、静止系数(6)、长时自相关函数 2、 频域冗余: (1)、长时功率谱密度的非均匀性。(2)、语音特有的短时功率谱密度。 3、 听觉冗余: ①人的听觉具有掩蔽效应。②人耳对不同频段的声音的敏感程度不同,通常对低频段较之高频段更敏感。③人耳对音频信号的相位变化不敏感 9、视频信号具有的特点: 、直观性:人眼视觉所获得的视频信息具有直观的特点,与语音信 1、直观性: 息相比,由于视频信息给人的印象更生动、更深刻、更具体、更直接,所以视频信息交流的效果也就更好。这是视频通信的魅力所在,例如电视、电影。 、确定性:“百闻不如一见”,即视频信息是确定无疑的,是什么 2、确定性: 就是什么,不易与其他内容相混淆,能保证信息传递的准确性。而语音则由于方言、多义等原因可能会导致不同的含义。 、高效性:由于人眼视觉是一个高度复杂的并行信息处理系统,它 3、高效性: 能并行快速地观察一幅幅图像的细节,因此,它获取视频信息的效率要

音视频技术基本知识一

https://www.360docs.net/doc/0611392548.html, 音视频技术基本知识一 网易视频云是网易倾力打造的一款基于云计算的分布式多媒体处理集群和专业音视频技术,为客户提供稳定流畅、低时延、高并发的视频直播、录制、存储、转码及点播等音视频的PaaS服务。在线教育、远程医疗、娱乐秀场、在线金融等各行业及企业用户只需经过简单的开发即可打造在线音视频平台。现在,网易视频云总结网络上的知识,与大家分享一下音视频技术基本知识。 与画质、音质等有关的术语 这些术语术语包括帧大小、帧速率、比特率及采样率等。 1、帧 一般来说,帧是影像常用的最小单位,简单的说就是组成一段视频的一幅幅图片。电影的播放连续的帧播放所产生的,现在大多数视频也类似,下面说说帧速率和帧大小。 帧速率,有的转换器也叫帧率,或者是每秒帧数一类的,这可以理解为每一秒的播放中有多少张图片,一般来说,我们的眼睛在看到东西时,那些东西的影像会在眼睛中停留大约十六分之一秒,也就是视频中只要每秒超过15帧,人眼就会认为画面是连续不断的,事实上早期的手绘动画就是每秒播放15张以上的图片做出来的。但这只是一般情况,当视频中有较快的动作时,帧速率过小,动作的画面跳跃感就会很严重,有明显的失真感。因此帧速率最好在24帧及以上,这24帧是电影的帧速率。 帧大小,有的转换器也叫画面大小或屏幕大小等,是组成视频的每一帧的大小,直观表现为转换出来的视频的分辨率的大小。一般来说,软件都会预置几个分辨率,一般为320×240、480×320、640×360、800×480、960×540、1280×720及1920×1080等,当然很多转换器提供自定义选项,这里,不得改变视频长宽比例。一般根据所需要想要在什么设备上播放来选择分辨率,如果是转换到普通手机、PSP等设备上,视频分辨率选择与设备分辨率相同,否则某些设备可能会播放不流畅,设备分辨率的大小一般都可以在中关村在线上查到。 2、比特率 比特率,又叫码率或数据速率,是指每秒传输的视频数据量的大小,音视频中的比特率,是指由模拟信号转换为数字信号的采样率;采样率越高,还原后的音质和画质就越好;音视频文件的体积就越大,对系统配置的要求也越高。 在音频中,1M以上比特率的音乐一般只能在正版CD中找到,500K到1M的是以APE、FLAC等为扩展名的无损压缩的音频格式,一般的MP3是在96K到320K之间。目前,对大多数人而言,对一般人而言192K就足够了。 在视频中,蓝光高清的比特率一般在40M以上,DVD一般在5M以上,VCD一般是在1M 以上。(这些均是指正版原盘,即未经视频压缩的版本)。常见的视频文件中,1080P的码率一般在2到5M之间,720P的一般在1到3M,其他分辨率的多在一M一下。 视频文件的比特率与帧大小、帧速率直接相关,一般帧越大、速率越高,比特率也就越大。当然某些转换器也可以强制调低比特率,但这样一般都会导致画面失真,如产生色块、色位不正、出现锯齿等情况。

录音技术基础知识

录音技术基础知识基本录音/多轨录音 无论是盒式磁带录音机、数码多轨录音机、硬盘录音机,还是其它录音媒体,其录音过程大致相同,目的都是将声音获取到缩混带上。 做此工作,录音工程师采用两个步骤: 1、多轨录音——各种乐器和人声的录音与叠加录音的过程,每种录音都有各 自的“音轨”。 2、多轨缩混——将这些多轨内容同步录在一组立体声轨上(“母带录音”),可 以用某种播放系统如CD播放机或磁带卡座等进行再制作。 录音基础/多轨录音 多轨录音指多种乐器或人声的互相“叠加”,以便在播放任意一种音色时,同时听到其它的音色。有的录音设备具备将不同乐器录在每个“轨”上的能力。多轨录音好比将16个盒带录音机的磁带并列在一起。就成为16轨磁带(实际32轨,因为盒式磁带是立体声,有两个轨),从而具备了每轨录制不同乐器的潜力。 换言之,假如您为一个鼓手、一个贝司和一个伴奏吉他手弹奏的曲子录音,用一台多轨录音机将每种乐器录在各自轨上。由于是一起演奏的曲子,音符要互相合拍,播放时,听起来仍好象几个乐手在一起演奏一般。如果您要在歌曲中加入一个主音吉他,既然每个乐器都录在各自音频上,就要先播放前三个轨,使吉他手在第四轨上录制主音吉他时,能与其它乐器“合拍”。这个过程就叫叠加。 按传统方式,录音师要先录制“节奏轨”,包括:鼓、贝司、伴奏吉他、键盘以及一个将被替换的主音人声,所有都录在一起。下一步,录音师开始做叠加,加入其它节奏,主声部,背景人声,所有其它乐器,最后录制主音人声。而现代

录音方式通常是一次制作一个轨,按排序的乐器、鼓的循环,或者人声开始录音。 关键点是最终你的乐器必须被同时录制在一起。一旦完成后,混音过程才能开始。 录音基础/多轨缩混 缩混的目的是将你所录制的轨道缩到两个轨道(立体声)上或一个轨(单声)上。这样就可以在传统的播放系统如卡带或CD播放机上今昔播放了。 按传统方法,多轨录音机连在多通道的调音台上,这样每一个轨在调音面板上都可以被单独进行处理了。换句话说,多轨录音机的每一个输出都连接到调音台的每一个输入通道上,从那里再进行合并,成为单一的立体声输出。这个立体声的输出可以连接到母带处理机上录制立体声信号。 在合并许多通道到两个通道时,调音台还处理其它一些重要工作,如: -调节乐器的频率内容,一般称为EQ。 -给乐器增加效果,如混响,回声或合唱。 -调节每一轨的音量,保证不会有单独的乐器音量太过于大或者小。 如今,多轨录音机,多通道调调音台,均衡和效果器上的所有功能都可以集中在一个装置上。而且还可以用光盘刻录机、数码录音机或硬盘作为母带处理机。当然重要的是您的曲子中的所有的乐器都被录音、加工、缩混最后成为一种媒介而被大众听到。 一般连接端子 输入端子 在开始录音之前,你需要将乐器或者是话筒连接到录音机或调音台的输入部分。可能你会注意到有一些不同的连接类型,如:RCA型(在家用的立体声设备上也可

音视频基础知识考核题

网络音视频基础知识考核题 1.以下哪一项不是视频文件封装格式?C a)AVI b)MP4 c)AVC d)MPEG-TS 2.以下哪一项不是音视频编码格式?B a)Window Media Video Codec 9 b)MPEG-PS c)HE-AAC d)MPEG-2 3.以下哪一项为Flash Media Encoder录制文件格式?D a)MP4 b)M4V c)MOV d)F4V 4.Adobe Flash Player不支持以下哪种音视频格式?D a)MP4:AVC+AAC b)3GP:AVC+AMR-NB c)FLV:H263+MP3 d)MOV: AVC+AAC 5.Apple手持终端(iphone,ipod,ipad)本地播放器支持以下哪种视频编码?B a)H.264+MP3 b)H.264+AAC c)OnVP6+MP3 d)H.263+AAC 6.以下哪一项不属于H.264视频编码标准框架(Profile)?D a)Baseline Profile b)Main Profile c)High Profile d)MEI Profile 7.视频关键帧又称?A a)I Frame b) B Frame c)P Frame d) A Frame 8.如果设置视频编码帧速率为29.97fps,需要每秒2个关键帧,则每隔多少帧需设置一个 关键帧?A a)10 b)15 c)20 d)30 9.以下哪套编码设置是Flash Media Encoder不支持的?D a)H.264+MP3,350K+32K,15fps,22050,320x240 b)H.264+MP3,350K+32K,15fps,22050,320x240 H.264+MP3,500K+64K,25fps,44100,480x320 c)H.264+MP3,500K+64K,25fps,44100,480x320 H.264+MP3,800K+64K,25fps,44100,640x480 d)ONVP6+MP3,300K+32K,12fps,22050,480x320 ONVP6+MP3,400K+32K,12fps,22050,320x240 ONVP6+MP3,500K+32K,12fps,22050,240x180

《数字音视频处理技术》教学大纲

《数字音视频处理技术》教学大纲《数字音视频处理技术》教学大纲课程名称:数字音视频处理技术 学时:64 学分:3 课程性质:专业选修课 考核方式:考查 )专业学生开课对象:计算机科学与技术(师范 一. 教学目的与要求 《数字音视频处理技术》是计算机科学与技术(师范)专业的一门应用性较强的专业选修课程。 随着多媒体技术日益成熟,使用数字音视频处理技术来处理各种媒体在师范生以后的工作过程中显 得十分重要。 本课程的目的和要求是: 1. 使学生了解数字音视频技术的基本概念,掌握数字音视频技术的基本原理,具备一定的理论 知识; 2. 使学生掌握专业音视频软件的使用方法,能够进行音视频的采集与编辑操作,并能进行典型 的艺术特效处理。 4. 培养学生的审美能力、艺术创造能力和多媒体技术的实际应用能力。本课程总授课64学时,在第六学期开设,为考查课程,其中理论教学为32学时,实践教学为

32学时。 二. 课程内容及学时分配 章节内容学时 第一章数字音视频处理技术的产生与发展 2 第二章音频技术概述 2 第三章音频处理 8 第四章视频技术概述 2 第五章视频处理 12 第六章音视频处理技术综合应用 6 实验一音视频软件的安装与基本操作 2 实验二音频采集与编辑 4 实验三数字音频特效与合成 6 实验四视频采集与编辑 4 实验五数字视频特效 8 实验六音视频处理技术综合应用 8 合计 64 第一部分理论教学第一章数字音视频处理技术的产生与发展(2学时) 主要内容: 1. 数字音视频处理技术的基本概念; 2. 数字音视频处理技术的产生与发展过程; 3. 数字音视 频处理的主要研究内容;4. 数字音视频处理的软硬件环境。要求: 1. 了解数字音视频处理技术的基本概念、产生与发展过程; 2. 了解数字音视频处理的技术概况和主要研究内容; 3. 了解数字音视频处理的软硬件环境要求; 4. 了解常见的音视频处理软件及其功能特点。

音频、视频压缩有哪些技术标准

音频、视频压缩有哪些技术标准? 视频压缩技术有:MPEG-4、H263、H263+、H264等 MPEG-4视频编码技术介绍 MPEG是“Moving Picture Experts Group”的简称,在它之前的标准叫做JPEG,即“Joint Photographic Experts Group”。当人们用到常见的“.jpg”格式时,实际上正在使用JPEG的标准。JPEG规范了现代视频压缩的基础,而MPEG把JPEG 标准扩展到了运动图象。 MPEG-4视频编码标准支持MPEG-1、MPEG-2中的大多数功能,它包含了H.263的核心设计,并增加了优先特性和各种各样创造性的新特性。它提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码,同时也支持基于内容的图像编码。采纳了基于对象(Object-Based)的编码、基于模型(Model-based)的编码等第二代编码技术是MPEG-4标准的主要特征。 MPEG4与MPEG1、MPEG2的比较 从上表可以看出,MPEG1和MPEG2主要应用于固定媒体,比如 VCD 和 DVD ,而对于网络传输,MPEG4具有无可比拟的优势。 H.263/H.263+/H.264视频编码技术介绍 1.H.263视频编码标准 1.H.263是最早用于低码率视频编码的ITU-T标准,随后出现的第二 版(H.263+)及H.263++增加了许多选项,使其具有更广泛的适用性。 H.263是ITU-T为低于64kb/s的窄带通信信道制定的视频编码标准。 它是在H.261基础上发展起来的,其标准输入图像格式可以是

S-QCIF、QCIF、CIF、4CIF或者16CIF的彩色4∶2∶0亚取样图像。 H.263与H.261相比采用了半象素的运动补偿,并增加了4种有效的 压缩编码模式。 2.H.263+视频压缩标准 1.ITU-T在H.263发布后又修订发布了H.263标准的版本2,非正式 地命名为H.263+标准。它在保证原H.263标准核心句法和语义不变 的基础上,增加了若干选项以提高压缩效率或改善某方面的功能。原 H.263标准限制了其应用的图像输入格式,仅允许5种视频源格式。 H.263+标准允许更大范围的图像输入格式,自定义图像的尺寸,从而 拓宽了标准使用的范围,使之可以处理基于视窗的计算机图像、更高 帧频的图像序列及宽屏图像。为提高压缩效率,H.263+采用先进的帧 内编码模式;增强的PB-帧模式改进了H.263的不足,增强了帧间预 测的效果;去块效应滤波器不仅提高了压缩效率,而且提供重建图像 的主观质量。为适应网络传输,H.263+增加了时间分级、信噪比和空 间分级,对在噪声信道和存在大量包丢失的网络中传送视频信号很有 意义;另外,片结构模式、参考帧选择模式增强了视频传输的抗误码 能力。 3.H.264视频压缩标准 1.H.264是由ISO/IEC与ITU-T组成的联合视频组(JVT)制定的新一 代视频压缩编码标准。对信道时延的适应性较强,既可工作于低时延 模式以满足实时业务,如会议电视等;又可工作于无时延限制的场合, 如视频存储等。 2.提高网络适应性,采用“网络友好”的结构和语法,加强对误码和 丢包的处理,提高解码器的差错恢复能力。 3.在编/解码器中采用复杂度可分级设计,在图像质量和编码处理之 间可分级,以适应不同复杂度的应用。 4.相对于先期的视频压缩标准,H.264引入了很多先进的技术,包括 4×4整数变换、空域内的帧内预测、1/4象素精度的运动估计、多参 考帧与多种大小块的帧间预测技术等。新技术带来了较高的压缩比, 同时大大提高了算法的复杂度。 G.7xx系列典型语音压缩标准介绍 G.7xx 是一组 ITU-T 标准,用于视频压缩和解压过程。它主要用于电话方面。在电话学中,有两个主要的算法,分别定义在 mu-law 算法(美国使用)和 a-law 算法(欧洲及世界其他国家使用),两者都是对数关系,但对于计算机的处理来说,后者的设计更为简单。 国际电信联盟G系列典型语音压缩标准的参数比较:

数字音视频技术试卷

数字音频技术期末考试试卷 一.选择(每题2分,共20分) 1.可闻声的频率范围(C) A.20~2000HZ B.200~20000HZ C.20~20000HZ D.200~2000HZ 2.下面哪一种相加混色产生的色彩是错误的(B) A红色+绿色=黄色B红色+蓝色=橙色 C蓝色+绿色=青色D红色+绿色+蓝色=白色。 3.不是数字图像的格式的是(D) A.JPG B. GIF C. TIFF D. WAVE 4.在音频数字化的过程中,对模拟语音信号处理的步骤依次为(C) A.抽样编码量化 B 量化抽样编码 C. 抽样量化编码D量化编码抽样 5.将声音转变为数字化信息,又将数字化信息变换为声音的设备是(A) A.声卡B.音响 C. 音箱D.PCI卡 6.不属于国际上常用的视频制式的是(D) A.PAL制B.NTSC制C.SECAM制D.MPEG 7.数字音频采样和量化过程所用的主要硬件是(C) A.数字编码器B.数字解码器 C.模拟到数字的转换器(A/D转换器)D.数字到模拟的转换器(D/A转换器) 8.信息接受者在没有接收到完整的信息前就能处理那些已经接受到的信息一边接收,一边处理的方式叫(B)

A.多媒体技术B.流媒体技术C.云技术D.动态处理技术 9.影响声音质量的因素不包括(D) A.声道数目B.采样频率C.量化位数D.存储介质 10.我们常用的VCD,DVD采用的视频压缩编码国际标准是(A)A.MPEGB.PLAC.NTSCD.JPEG 二.填空(每空一分,共20分) 1.音质四要素:音量音调音色音品 2.室内声的组成:直达声前期反射声混响声 3.电声器件包括:传声器和扬声器 4.色彩三要素:亮度色调饱和度 5.彩色摄像机包括:单管式彩色摄像机和三片式CCD彩色摄像机 6.数字视音频存储技术包括:磁存储技术光存储技术半导体存储技术磁光盘存储技术 7.混色的方法有:相减混色和相加混色 三.简答题(每题六分,共30分) 1.什么是相干波?什么是驻波? 答:具有相同频率和固定相位差的两列波为相干波。 驻波是频率相同、传播方向相反的平面波的迭加形成的干涉现象 2.什么是非线性失真? 非线性失真:当输入扬声器中为单一频率信号时,扬声器输出声信号中含有其倍频成份,这一失真现象称为非线性失真。 3.数字音频格式有哪些?

音频基本知识

音频基本知识 第一部分 模拟声音-数字声音原理 第二部分 音频压缩编码 第三部分 和弦铃声格式 第四部分 单声道、立体声和环绕声 第五部分 3D环绕声技术 第六部分数字音频格式和数字音频接口 第一部分 模拟声音-数字声音原理 一、模拟声音数字化原理 声音是通过空气传播的一种连续的波,叫声波。声音的强弱体现在声波压力的大小上,音调的高低体现在声音的频率上。声音用电表示时,声音信号在时间和幅度上都是连续的模拟信号。 图1 模拟声音数字化的过程 声音进入计算机的第一步就是数字化,数字化实际上就是采样和量化。连续时间的离散

化通过采样来实现。 声音数字化需要回答两个问题:①每秒钟需要采集多少个声音样本,也就是采样频率(f s)是多少,②每个声音样本的位数(bit per sample,bps)应该是多少,也就是量化精度。 ?采样频率 采样频率的高低是根据奈奎斯特理论(Nyquist theory)和声音信号本身的最高频率决定的。奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍,这样才能把以数字表达的声音还原成原来的声音。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k 次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。电话话音的信号频率约为3.4 kHz,采样频率就选为8 kHz。 ?量化精度 光有频率信息是不够的,我们还必须纪录声音的幅度。量化位数越高,能表示的幅度的等级数越多。例如,每个声音样本用3bit表示,测得的声音样本值是在0~8的范围里。我们常见的CD位16bit的采样精度,即音量等级有2的16次方个。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多。 ?压缩编码 经过采样、量化得到的PCM数据就是数字音频信号了,可直接在计算机中传输和存储。但是这些数据的体积太庞大了!为了便于存储和传输,就需要进一步压缩,就出现了各种压缩算法,将PCM转换为MP3,AAC,WMA等格式。 常见的用于语音(Voice)的编码有:EVRC (Enhanced Variable Rate Coder) 增强型可变速率编码,AMR、ADPCM、G.723.1、G.729等。常见的用于音频(Audio)的编码有:MP3、AAC、AAC+、WMA等 二、问题 1、为什么要使用音频压缩技术? 我们可以拿一个未压缩的CD文件(PCM音频流)和一个MP3文件作一下对比: PCM音频:一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码CD文件,它的数据速率则为 44.1K×16×2 =1411.2 Kbps,这个参数也被称为数据带宽。将码率除以8 bit,就可以得到这个CD的数据速率,即176.4KB/s。这表示存储一秒钟PCM编码的音频信号,需要176.4KB的空间。 MP3音频:将这个WAV文件压缩成普通的MP3,44.1KHz,128Kbps的码率,它的数据速率为128Kbps/8=16KB/s。如下表所示: 比特率 存1秒音频数据所占空间 CD(线性PCM) 1411.2 Kbps 176.4KB MP3 128Kbps 16KB AAC 96Kbps 12KB mp3PRO 64Kbps 8KB 表1 相同音质下各种音乐大小对比 2、频率与采样率的关系 采样率表示了每秒对原始信号采样的次数,我们常见到的音频文件采样率多为44.1KHz,这意味着什么呢?假设我们有2段正弦波信号,分别为20Hz和20KHz,长度均为一秒钟,以对应我们能听到的最低频和最高频,分别对这两段信号进行40KHz的采样,我们可以得到一个什么样的结果呢?结果是:20Hz的信号每次振动被采样了40K/20=2000次,而20K的信号每次振动只有2次采样。显然,在相同的采样率下,记录低频的信息远比高频

数字音视频技术 课程 实验报告

太原理工大学现代科技学院 数字音视频技术课程实验报告 专业班级信息17-2 学号2017100888 姓名张智斌 指导教师贾海蓉

实验名称 用Cool Edit Pro 音频软件完成音乐制作 同组人 专业班级 学号 姓名 成绩 一.实验目的: (1)掌握Cool Edit Pro 音频软件的功能,比如:编辑,剪辑,特效。 (2)理解音频软件中的去噪的意义。 (3)会利用插件制作特效,比如延时,双音和娃娃音等。 (4)会用 Cool Edit Pro 音频软件制作完整的个性音乐。 二.实验原理 1. Cool Edit 的特点 (1)比较直观,可以通过观察声音波形对素材进行编辑,比如剪切、 复制、粘贴。 (2)通过调整波形幅度变化制作淡入、淡出的效果。 (3)可以进行频率均衡,补偿频率上的缺失。它提供了多频及参量均衡。 (4)能进行效果处理。提供了混响、延时、回声、合唱、颤音、高音激励、娃娃音等效果。 (5)变调及变速。变调可以保持原速度下任意的升降调或上滑、下滑自由变调;变速可以做到整体声音无极自由变速。 (6)可以进行降噪处理。选出需要进行降噪的部分,采用频谱分析进行针对性处理。 (7)多轨编辑最大轨道数为64 轨,可同时使用也可选用。每-轨使用时,可以进行双声道录制,故而扩展为128 轨。 2、Cool Edit 软件的常用功能的介绍 (1)颠倒 该功能将音频信号波形的上半周和下半周互换。如果想要产生反相效果, 只要把左右声 道之一做颠倒处理, 再将两声道同时放音就可以了。 (2)反相 该功能将波形或被选中的波形的开头和结尾颠倒。做如此处理后, 会出现类似反音的效果。 (3)静音处理 如果声音文件在信号间有断断续续的杂音,或者明 显看出波形上有一条线上面夹杂着小幅 度的波形,就可以判断它是静音。可以单击波形缩放按钮使波形文件放大,然后选定需要处理的部分,执行菜单中的Silence 命令来删除杂音,被处理过的波形文件时间长度不发生变化。 … … …… …… ………………… …装 …… …… …… …… … …… …… …… 订… …… ……………………………… …线 …… …… …… …… … ………………

音频压缩

音频压缩技术指的是对原始数字音频信号流(PCM编码)运用适当的数字信号 处理技术,在不损失有用信息量,或所引入损失可忽略的条件下,降低(压缩)其码率,也称为压缩编码。它必须具有相应的逆变换,称为解压缩或解码。音频信号在通过一个编解码系统后可能引入大量的噪声和一定的失真。 、音频压缩算法的主要分类及典型代表 一般来讲,可以将音频压缩技术分为无损(lossless)压缩及有损(lossy)压缩两大类,而按照压缩方案的不同,又可将其划分为时域压缩、变换压缩、子带压缩,以及多种技术相互融合的混合压缩等等。各种不同的压缩技术,其算法的复杂程度(包括时间复杂度和空间复杂度)、音频质量、算法效率(即压缩比例),以及编解码延时等都有很大的不同。各种压缩技术的应用场合也因之而各不相同。 (1)时域压缩(或称为波形编码)技术是指直接针对音频PCM码流的样值 进行处理,通过静音检测、非线性量化、差分等手段对码流进行压缩。此类压缩技术的共同特点是算法复杂度低,声音质量一般,压缩比小(CD音质> 400kbps),编解码延时最短(相对其它技术)。此类压缩技术一般多用于语音压缩,低码率应用(源信号带宽小)的场合。时域压缩技术主要包括G.711、ADPCM、LPC、CELP,以及在这些技术上发展起来的块压扩技术如NICAM、子带ADPCM (SB-ADPCM)技术如G.721、G.722、Apt-X等。 (2)子带压缩技术是以子带编码理论为基础的一种编码方法。子带编码理论最早是由Crochiere等于1976年提出的。其基本思想是将信号分解为若干子频带内的分量之和,然后对各子带分量根据其不同的分布特性采取不同的压缩策略以降低码率。通常的子带压缩技术和下面介绍的变换压缩技术都是根据人对声音信号的感知模型(心理声学模型),通过对信号频谱的分析来决定子带样值或频域样值的量化阶数和其它参数选择的,因此又可称为感知型(Perceptual)压缩编码。这两种压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。一般来讲,子带编码的复杂度要略低于变换编码,编码延时也相对较短。 由于在子带压缩技术中主要应用了心理声学中的声音掩蔽模型,因而在对信号进行压缩时引入了大量的量化噪声。然而,根据人类的听觉掩蔽曲线,在解码后,这些噪声被有用的声音信号掩蔽掉了,人耳无法察觉;同时由于子带分析的运用,各频带内的噪声将被限制在频带内,不会对其它频带的信号产生影响。因而在编码时各子带的量化阶数不同,采用了动态比特分配技术,这也正是此类技术压缩效率高的主要原因。在一定的码率条件下,此类技术可以达到“完全透明”的声音质量(EBU音质标准)。 子带压缩技术目前广泛应用于数字声音节目的存储与制作和数字化广播中。典型的代表有著名的MPEG-1层Ⅰ、层Ⅱ(MUSICAM),以及用于Philips DCC 中的PASC(Precision Adaptive Subband Coding,精确自适应子带编码)等。

《数字视音频技术》期末上级试题

《数字视音频技术》期末考试 1、考试形式:机试 2、考试时间:第14周,具体时间另行通知 3、考试题目:在以下试题中抽取3道(易(20分)、中(35分)、难(45分)各一道)。每人的题号由程序自动抽取,不得擅自更改,否则不计算成绩。如完成部分操作则计算部分成绩。 4、试题上交时需注意事项: (1)建立一个文件夹(以自己的学号+姓名命名,如“200927240201孙中立”),文件夹中包含3个子文件夹,子文件夹的名称为所抽取试题的题号(如某生抽取试题题号为4、15、28,则3个子文件夹的名称分别为“4”、“15”、“28”),将所抽取试题的素材及工程文件等依次对应放入相应的文件夹。 (2)每个工程编辑完成后,除按要求保存外,还需输出成视频文件。(要求输出为windows media格式,采用PAL来源512kbps码率) (3)上交前确保每个题目的文件都保存无误。

附:考试题目 难度:易(1~10) 1、改变素材的播放速率,使其按照150%的速率播放,课本P157。 2、课本P191,转场效果。 3、课本P207,思考与练习10题。 4、课本P207,思考与练习11题。 5、课本P231,例10.5。 6、课本P233,例10.6。 7、利用关键帧,制作音频淡入淡出效果。 8、建立一个垂直滚动字幕,字幕内容为自己的专业、学号、姓名。要求从下往上滚动,在屏幕外开始和结束。 9、P288,例12.1。 10、利用图1将图2、图3合成为图4效果。 图1 图2 图3 图4 难度:中(11~23) 11、课本P203,制作画中画效果

12、课本P205,制作“旋涡状”自定义转场效果 13、课本P212,实例——展开的画卷 14、课本P213,实例——工艺纸扇 15、课本P215,实例——飘零的落叶 16、课本P218,思考与练习11题。 17、课本P234,例10.7。 18、课本P236,例10.8 19、课本P238,例10.9 20、课本P239,例10.10 21、课本P240,例10.11,制作马赛克效果。 22、课本P296,例12.2,制作变形滚动字幕。 23、课本P298,例12.3,用字幕制作遮罩效果。 难度:难(24~35) 24、课本P179,实例——夕阳下的回忆 25、课本P183,实例——教学片的制作 26、课本P193,实例——美丽的张家界 27、课本P243,例10.12,旋转的地球。 28、课本P249,思考与练习10题。 29、课本P249,思考与练习12题。 30、课本P249,思考与练习13题。 31、课本P300,思考与练习13题。 32、课本P300,思考与练习14题。 33、实验五:视频特效的运用,实例四——将人物身上的毛衣由草绿色改变为红色,而不影响图像中其它物体的颜色。

视频音频编码知识

audio。AAC(Advanced Audio Coder)区别于ac3,mp3(全称MPEG1 Layer3,可不是MPEG3的缩写哦)等等,aac是Mp4官方指定的mp4音频规格。和video一样,她也有两个profile: - LC-AAC (Low Complexity) 也被叫做MAIN @ Level 2 - HE-AAC (High Efficiency) 也被叫做AAC SBR/AAC+/aacplus 再次抛开技术性的数据,HE比LC更高级一些,允许你在相同音质下已更低的bitrate编码。 帧间压缩。 其次,时间相关性的统计分析:统计的结果表明,在间隔1~2帧的图像中,各像素只有10%以下的点,其亮度差值变化超过2%,而色度差值的变化只有1%以下。 采用的压缩方法: 分组:把几帧图像分为一组(GOP),为防止运动变化,帧数不宜取多。 1.定义帧:将每组内各帧图像定义为三种类型,即I帧、B帧和P帧; 2.预测帧:以I帧做为基础帧,以I帧预测P帧,再由I帧和P帧预测B帧; 3.数据传输:最后将I帧数据与预测的差值信息进行存储和传输。 I帧:帧内编码帧 I帧特点: 1.它是一个全帧压缩编码帧。它将全帧图像信息进行JPEG压缩编码及传输; 2.解码时仅用I帧的数据就可重构完整图像; 3.I帧描述了图像背景和运动主体的详情; 4.I帧不需要参考其他画面而生成; 5.I帧是P帧和B帧的参考帧(其质量直接影响到同组中以后各帧的质量); 6.I帧是帧组GOP的基础帧(第一帧),在一组中只有一个I帧; 7.I帧不需要考虑运动矢量;

8.I帧所占数据的信息量比较大。 P帧:前向预测编码帧。 P帧的预测与重构:P帧是以I帧为参考帧,在I帧中找出P帧“某点”的预测值和运动矢量,取预测差值和运动矢量一起传送。在接收端根据运动矢量从I帧中找出P帧“某点”的预测值并与差值相加以得到P帧“某点”样值,从而可得到完整的P帧。 P帧特点: 1.P帧是I帧后面相隔1~2帧的编码帧; 2.P帧采用运动补偿的方法传送它与前面的I或P帧的差值及运动矢量(预测误差); 3.解码时必须将I帧中的预测值与预测误差求和后才能重构完整的P帧图像; 4.P帧属于前向预测的帧间编码。它只参考前面最靠近它的I帧或P帧; 5.P帧可以是其后面P帧的参考帧,也可以是其前后的B帧的参考帧; 6.由于P帧是参考帧,它可能造成解码错误的扩散; 7.由于是差值传送,P帧的压缩比较高。 B帧:双向预测内插编码帧。 B帧的预测与重构 B帧以前面的I或P帧和后面的P帧为参考帧,“找出”B帧“某点”的预测值和两个运动矢量,并取预测差值和运动矢量传送。接收端根据运动矢量在两个参考帧中“找出(算出)”预测值并与差值求和,得到B帧“某点”样值,从而可得到完整的B帧。 B帧特点 1.B帧是由前面的I或P帧和后面的P帧来进行预测的; 2.B帧传送的是它与前面的I或P帧和后面的P帧之间的预测误差及运动矢量; 3.B帧是双向预测编码帧; 4.B帧压缩比最高,因为它只反映丙参考帧间运动主体的变化情况,预测比较准确; 5.B帧不是参考帧,不会造成解码错误的扩散。

视频音频封装基础知识

视频/ 音频/ 封装的基本知识 1.分辨率 由于现在的高清视频全部是数字方式,由若干象素构成图象,一幅图象的水平象素乘以垂直象素,就表示为分辨率,比如分辨率为1920×1080,图象的水平方向每行有1920 个象素,垂直方向上每列1080 个象素。分辨率越高,构成图象的象素越多,包含的图象信息越丰富,图象越清晰,所以分辨率是高清的重要指标。 2.隔行和逐行 隔行和逐行是电视系统显示图像的方法。隔行就是每一幅画面被分割为两场,每一场包含了一幅画面中所有的奇数行或者偶数行,通常是先扫描奇数行得到第一场,然后扫描偶数行得到第二场。由于视觉暂留效应,人眼将会看到平滑的运动而不是闪动的半幅的图像。但是这时会有几乎不会被注意到的闪烁出现,使得人眼容易疲劳。逐行每次显示整个图象,由于目前的平板电视绝大多数是逐行显示方式,不管电视信号如何,电视机都可以选择无闪烁的逐行显示。 4.码率 码率是单位时间传送的数据量, 高清视频常用的单位是Mbps。通俗一点的理解就是原始片源制作数字格式的高清视频文件的取样率,码率越高,单位象素上包含的信息量越多,文件就越接近原始文件,清晰度越高。 5.编码方式: 目前高清主流的视频编码格式有MPEG2、H264,VC-1。 MPEG2是DVD采用的视频编码格式,广泛用于DVD和电视信号传输。用于1080i 高清电视信号传输,需要12-20Mbps带宽,占用大量带宽,技术较老,压缩比不高。中国和美国的部分高清节目在使用MPEG2,欧洲已基本换用H264。Blu-ray早期部分节目使用过MPEG2,目前已全部换为H264和VC1。MPEG2压缩比低,对机器的要求最低,硬加速也最完善,只要你的机器不要太古董,都可以放得动。 H264是由ITU-T和ISO/IEC两大国际组织制定,H264在两大组织内分别表述为H264、MPEG-4 Part 10、ISO/IEC 14496-10、MPEG-4 AVC这4种名称,我们习惯使用其最

凌阳音频压缩算法--SPCE061A单片机教材书

第7章 凌阳音频压缩算法 7.1 背景介绍 7.1.1 音频的概述(特点、分类) 我们所说的音频是指频率在20 Hz~20 kHz的声音信号,分为:波形声音、语音和音乐三种,其中波形声音就是自然界中所有的声音,是声音数字化的基础。语音也可以表示为波形声音,但波形声音表示不出语言、语音学的内涵。语音是对讲话声音的一次抽象。是语言的载体,是人类社会特有的一种信息系统,是社会交际工具的符号。音乐与语音相比更规范一些,是符号化了的声音。但音乐不能对所有的声音进行符号化。乐谱是符号化声音的符号组,表示比单个符号更复杂的声音信息内容。 7.1.2 数字音频的采样和量化 将模拟的(连续的)声音波形数字元化(离散化),以便利数字计算机进行处理的过程,主要包括采样和量化两个方面。 数字音频的质量取决于:采样频率和量化位数这两个重要参数。此外,声道的数目、相应的音频设备也是影响音频质量的原因。 7.1.3 音频格式的介绍 音频文件通常分为两类:声音文件和MIDI文件 (1)声音文件:指的是通过声音录入设备录制的原始声音,直接记录了真实声音的二进制采样数据,通常文件较大; (2)MIDI文件:它是一种音乐演奏指令序列,相当于乐谱,可以利用声音输出设备或与计算机相连的电子乐器进行演奏,由于不包含声音数据,其文件尺寸较小。 1)声音文件的格式 WAVE文件——*.WAV WAVE文件使用三个参数来表示声音,它们是:采样位数、采样频率和声道数。在计算机中采样位数一般有8位和16位两种,而采样频率一般有11025Hz(11KHz),22050Hz(22KHz)、44100Hz(44KHz)三种。我们以单声道为例,则一般WAVE文件的比特率可达到88K~704Kbps。具体介绍如下: (1) WAVE格式是Microsoft公司开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范;

相关文档
最新文档