多媒体通信技术-2016新颖复习题

多媒体考试复习题

简答题或是概念题

1. 媒体的概念及分类。

答：媒体(medium)是指信息传递和存储的最基本的技术和手段，即信息的载体。

媒体可划分为5大类：(1) 感觉媒体（perception medium）

是指人类通过感觉器官直接产生感觉（感知信息容）的一类媒体。

这类媒体包括：声音、文字、图像、气味、冷热等。

(2) 表示媒体（representation medium）是指用于数据交换的编码表示。

这类媒体包括：图像编码、文本编码、声音编码等。

其目的是为了能有效地加工、处理、存储和传输感觉媒体。

(3) 显示媒体（presentation medium）是指进行信息输入和输出的媒体。

输入媒体包括：链盘、鼠标、摄像头、话筒、扫描仪、触摸屏等；

输出媒体包括：显示屏、打印机、扬声器等。

(4) 存储媒体（storage medium）是指进行信息存储的媒体。

这类媒体包括：硬盘、光盘、软盘、磁带、ROM、RAM等。

(5) 传输媒体（transmission medium）是指承载信息，将信息进行传输的媒体。这类媒体包括：双绞线、同轴电缆、光缆、无线电链路等。

“多媒体”通常是指感觉媒体的组合，即声音、文字、图像、数据等各种媒体的组合。

2.多媒体通信系统是如何构成的，简述其主要特征。

在物理结构上，多媒体通信系统是由若干个多媒体通信终端、多媒体服务器经过通信网络连接构成的系统。

特征：（1）集成性可处理、存储和传输容上相互关联的多媒体信息。（2）交互性用户与系统通信过程中具有完全的交互控制能力。（3）同步性使得多媒体信息（文字、图形、声音、图像等）在终端上以时空同步方式工作。

第二章

听阈：人耳能听到的声音的声压，1Hz时为2×10-5Pa。

痛阈：人耳感到疼痛的声压，20Pa。

1等响曲线

人耳对声音响度的感觉与声压级和频率有关，将人耳在听到不同频率纯音(正弦波)时，对所有具有相同音量感的声压用一条曲线表示后得到的曲线族，称为等响曲线。

2听觉的掩蔽效应

由于第一个声音的存在而使第二个声音提高听阈的现象称为掩蔽。当人耳听到符合声音时，若存在响度较高的声音频率分量，那么人耳对响度较低的声音频率分量就不易察觉到了，这种生理现象称为掩蔽效应。

4视觉惰性

当一个景物突然出现在眼前时，需经过一定的时间才能形成一个稳定的主观亮度感觉；同样当一个实际景物从眼前消失后，所看到的印象都不会立即消失，还会暂留一段时间，由此可见人眼亮度感觉的建立与消失都滞后于实际的光刺激，而且此过程是逐步的，这样一种现象就是视觉惰性。

5闪烁（或临界闪烁频率）

如果观察者观察到一个具有周期性的光脉冲，当其重复频率不够高时，便会产生一明一暗的感觉，这种感觉就是闪烁，但当重复频率足够高时，闪烁感觉将消失，随之看到的是一个恒定的亮点。临界闪烁频率就是指闪烁感觉刚刚消失时的频率。

它与脉冲亮度有关，脉冲的亮度越高，临界闪烁频率也相应地增高。

6帧间插和帧间预测

帧间预测是指由前一帧或前几帧图像来预测当前图像，与帧预测相同，仅对误差信号进行编码.

活动图像的帧间插编码是在系统发送端每隔一段时间丢弃一帧或几帧图像，而在接收端再利用图像的帧间相关性将丢弃的帧通过插恢复出来，以防止帧率下降引起闪烁和动作不连续。

3.音频信息编码方法有哪几种？说明各自的特点。

音频信息的编码技术通常分为三类：波形编码、参量编码和混合编码。其中，波形编码和参量编码是两种基本类型。波形编码：基于对语言信号波形的数字化处理，试图使处理后重建的语音信号波形与原语音信号波形保持一致，优点:具实现简单、有适应性强、语音质量好等优点，但压缩程度不高，实现的码速率也较高。在对信号带宽要求不太严格的通信中得到应用，而对频率资源相对紧的移动通信则不合适。

参量编码:通过构造一个人发声的模型，以发声机制的模型作为基础，用一套模拟声带频谱特性的滤波器系数和若干声源参数来描述这个模型，在发送端从模拟语音信号中提取各个特征参量并进行量化编码。特点：可实现低速率语音编码，比特率可压缩到2～9.6kbit/s 之间。缺点：重建信号的波形同原语音信号的波形有相当大的差别，语音质量较差，清晰度满足要求但自然度较低，难以分辨处讲话者；其次是电路实现复杂度高。

混合编码特点：混合编码将波形编码和参量编码组合起来，克服了原有波形编码和参量编码的弱点，结合各自的长处，试图保持波形编码的高质量和参量编码的低速率。

4.简述子带编码的优越性及原理。

子带编码：子带编码是首先将输入信号分割成几个不同的频带分量，然后再分别进行编码，这类编码方式称为频域编码。在子带编码中，用带通滤波器将语声频带分割为若干个子带，每个子带经过调制将各子带变成低通型信号。这样就可使抽样速率降低到各子带频宽的两倍。

优点是：(1)、通过对不同的子带合理分配比特数，可以很好的控制各个子带的量化电平数和在重建信号时的量化误差方差值，可以获得更好的主观听音质量。(2)各个子带相互隔开，使各个子带量化噪声相互独立互不影响，量化噪声被束缚在各自的子带。输入电平比较低的子带信号不会被其他子带的量化噪声所淹没。(3)子带划分的结果使各个子带采样频率降低。

5简述感知编码的基本原理：感知编码利用人耳听觉的心理声学特性。掩蔽特性和时域特性。人耳对音频信号的幅度、频率和时间的分辨能力是有限的，凡是人耳感觉不到的成分都不经行编码和传送，对感觉到的部分经行编码时，也允许有较大的量化失真，只要这个失真是在人耳感觉不到的听阈一下即可，感知编码是建立在人类听觉系统的心理学基础上的，只记录那些能够被人耳感觉道德声音，从而达到压缩目的，理论基础——闻域、临界频段和掩蔽效应。

6.MPEG-1采样频率32kHz，44.1或者48。编码器的输出围32～384kbit/s，

MPEG-2扩展到8～640。采样频率为16kHz，22.05，和24。两种标准，MPEG-2 BC和MPEG-2 AAC（感知编码，模块化编码）常见音频文件格式WA V,AIF,AIFF,AU,SND,VQF,VOC,MP1,MP2MP3,RA/RM/RAM,CMF,CDS,MOD,MIDI,RMI.

7.彩色视觉三个术语，亮度，色度，饱和度。

8.对比度公式C＝L（max）/L（min）最大亮度比上最小亮度

9.二维取样定理，亚取样

二维取样定理:一个模拟信号f(x, y)的傅氏频谱为F(μ,ν)，如果其水平方向的截止频率为Um，而垂直方向的截止频率为Vm，那么只要水平和垂直方向的取样频率分别为U0≥2Um和V0≥2Vm（水平间隔Δx≤1/(2Um），垂直间隔Δy≤1/(2Vm),就可以精确地恢复出原图像，这就是二维取样定理。

亚取样：当取样频率小于奈奎斯特取样频率时，通常称其为亚抽样。

10.量化误差的影响：

量化误差所造成图像质量下降的主要原因有斜率过载、颗粒噪声、边缘忙乱和伪轮廓四种：

斜率过载发生在图像灰度急剧变化的边界，正是由于此处灰度变化太大，即使使用最大的量化

值，仍无法反映期间的变化，因此使图像轮廓变得模糊。

颗粒噪声出现在图像灰度变化很小的区域，这时最小的量化间隔仍不足以反映其缓慢的变化过

程，因此可能会在两个最小量化电平之间出现来回振荡的局面，造成解码后所恢复的图像中其

灰度平坦区域出现颗粒状的细斑。

边缘忙乱是指在变化不太快的边缘出现闪烁不定的现象。这是由于原始图像中存在噪声，它造

成不同图像帧之间在同一像素位置产生的量化噪声不同，从而引起缓慢变化的边缘出现这种不

确定的现象。

伪轮廓发生在图像亮度缓慢变化的区域，此时预测误差较小，但实际系统中所采用量化间隔过

大，则会在图像亮度缓慢增加或减小的区域，出现这种伪轮廓的现象。

11.电视系统组成：

12.为什么彩色电视系统不直接传送R 、G 、B 信号，而传送Y 、U 、V 信号？

由于彩色电视系统是在黑白电视系统的基础上发展起来的，当时已有数以千计的黑白电视机和

黑白电视台，需要考虑广大消费者和各电视台的利益，所以彩色电视系统的设计应考虑与已有

的黑白电视系统兼容问题，因此在彩色电视系统中所传输的不是红绿蓝三个基色分量，而是传

输1个亮度分量和2个色差分量，它们与红绿蓝三个基色分量(R,G ,B ）呈矩阵变换关系，因而

在系统发射端要利用变换矩阵将红绿三个基色分量变换为1个亮度分量和2个色差分量，然后

传送。

13.简述逐行扫描与隔行扫描的关系

逐行扫描的行频是隔行扫描的2倍，隔行扫描中场频是帧频的2倍。

逐行扫描是指电子束按一行接一行的规律，从上到下的对整个一幅（帧）画面进行扫描的方式。

隔行扫描：为了减小图像信号所占用的带宽，可以通过降低场频来实现，但随之又会带来闪烁

的问题，而降低扫描行数，又会使图像的清晰度下降。为了解决这一矛盾，人们采用隔行扫描

方式。

第四章

1.图像的信息量公式

这样符号Si 所携带的信息量I(Si)可以用下式表示：

)(log ))(/1(log )(22i i i S p S p S I -==也叫自信息量单位为bit

2.信息压缩的必要性多媒体信息存在数据量大、数据流具有突发性和码速可变性三大特征。

如果一幅图像中代表其亮度、色彩和饱和度的各项分量的带宽分别为4MHz 、1.3MHz 和0.5MHz ，

那么根据取样定理的规定，只要当取样频率大于或等于原信号的最高频率的2倍时，才能从取

样信号中无失真地恢复原信号。若取等号，并且每个取样值用8bit 表示，由此可以计算出一幅

图像的数据量：（4+1.3+0.5）×2×8=92.8Mbit/s显然，数据量非常大，很难直接进行保存，因此必须对图像数据进行压缩以适应传输和存储的要求

3.压缩比:压缩过程中输入数据量与输出数据量之比，设原图像的平均码长为L,压缩后图像的平均码长为Lc，则压缩比为C=L/Lc

冗余度

)

编码效率R

)

(

4.Huffman编码

1、排序：按符号出现的概率从大到小进行排列。

2、赋值：对最后的两个符号进行赋值，概率大的赋“1”，概率小的赋“0”（反之也成立）。

3、合并：将上述最后的两个符号出现概率相加合成一个概率。

4、重新排序：将合成后的概率与其它符号概率一起进行重新排序（从大到小）。然后重复步骤2的容，直至最后只剩下两个概率为止。

5、码字分配：从最后一步开始反向进行码字分配，对最后两个概率中较大的赋“1”。对较小的赋“0”（与第二过程中的规定相同）。从而形成一个码字。如下图中虚线所示的方向。

假设某符号集X中包含6个符号：S1,S2,┈S6，各自出现的概率为

X= ?

2.0

试求其哈夫曼编码及其编码效率。

解：1、哈夫曼编码

在图4-6中给出了哈夫曼编码过程，其中设两个符号中较大的为”1”，较小的为”0”.编码结果如表4-1所示。

2、编码效率

根据式（4-5）可求出信源熵：

∑=-=612)

(log )()(i i i S S p x H =

2.0log 2.0(2-19.0log 19.02+18

.0log 18.02+17.0log 17.02+15.0log 15.02+11.0log 11.02?+

）=2.56

利用式（4-17）可求出平均码长：

)(61i i i S p l L ?=

∑= =0.2×2+0.19×2+0.18×3+0.17×3+0.15×3+0.11×3=2.61

哈夫曼编码的编码效率 61

.256.2)(==L x H η =98.08% 5.游程编码

当图像不太复杂时，往往存在着灰度或颜色相同的图像子块。由于图像编码是按顺序对每个相素进行编码的，因而会存在多行的数据具有相同数值的情况，这样可只保留连续相同像素值和像素点数目。这种方法就是游程编码。这里所说的“游程”是指连续串的延续长度。已知一个二值序列001……，根据游程编码规则，可知其游程序列为21133121……

6.算术编码

在进行编码过程中，随着信息的不断出现，子区间按下列规律减小。

新子区间左端=

前子区间左端+当前子区间左端×前子区间长度

新子区间长度=前子区间长度×当前子区间长度

例4-2已知二进制信源分布??

????????434110

，

如果要传输的数据序列为1011，试写出算术编码过程。解：

（1）已知小概率事件q=1/4,大概率事件p=1-q=3/4

（2）设C为子区间左端起点，L为子区间的长度。根据题意，符号“0”的子区间为[0,1/4)，可见C=0, L=1/4;符号“1”的子区间为[1/4,1)，C=1/4 , L= 3/4;

（3）编码计算过程

步骤符号 C L

① 1 1/4 3/4

2 0 1/4+0×3/4=1/4 3/4×1/4=3/16

3 1 1/4+1/4×3/16=19/6

4 3/16×3/4=9/64

4 1 19/64+1/4×9/64=85/256 9/64×3/4=27/256

子区间左端起点C= (85/256)d =(0.01010101)b 子区间长度L= (27/256)d =(0.00011011)b

子区间右端M=(85/256+27/256)d=(7/16)d =(0.0111)b 子区间：[0.01010101，0.0111)

编码的结果应位于区间的头尾之间的取值0.011。算术编码011 占三位

原码1011 占四位

7.预测编码

帧预测，帧间预测

帧预测编码是针对一幅图像以减小其空间相关度来实现数字压缩的。通常采用差分脉冲编码调制(DPCM)来实现。优点是方法简单，易于硬件实现。

帧间预测是指由前一帧或前几帧图像来预测当前图像，与帧预测相同，仅对误差信号进行编码。帧间预测分为前向预测、后向预测和双向预测

8.图像信息处理方法：图像变化、图像增强、图像复原、图像压缩和图像重建。

9.图像增强技术：灰度级修正法和图像平滑、图像锐化。

灰度级修正

在灰度级修正过程中，不改变像素点的位置，而只改变像素点的灰度值。由此可见这是一种点运算。图像平滑

经过图像平滑处理可以减小图像噪声，其处理可以在空间域来完成，也可以在频域完成。

图像锐化的作用是突出图像中的细节或者增强被模糊了的细节，使模糊图像变得清晰。

JPEG是英文Joint Photographic Experts Group的缩写，即联合图像专家组。四种运行模式基于DPCM的无损压缩算法，基于DCT的有损压缩算法基于DCT的顺序编码模式，基于DCT的累进编码模式，基于DCT的分层编码模式。

第五章

1.视频采集卡：视频卡，音频卡，VGA与TV转换卡，图形加速卡，SCSI接口卡，光盘接口卡。

2.CD-ROM光盘库（CD-ROM Jukebox）是一种带有自动换盘机构（机械手）的光盘网络共享设备。光盘库一般配置有1~12台CD-ROM驱动器，可容纳100~600片CD- ROM光盘。用户访问光盘库时，自动换盘机构首先将CD-ROM驱动器中光盘取出并放置到盘架上的指定位置，然后再从盘架中取出所需的CD-ROM光盘并送入CD-ROM驱动器中。由于自动换盘机构的换盘时间通常在秒量级，因此光盘库的访问速度较低。

3.存储区域网络(SAN )（storage area network）实现高速光纤网络

通过单独的高速光纤网络将存储设备和局域网上的服务器群连接起来，数据的存取通过存储区域网在服务器和海量存储设备间进行高速传输。SAN是一种可满足海量数据存储、大量的I/O吞吐量和高端应用需求的网络式存储技术。应用计算机通过标准的网络连接到SAN的存储设备上。

存储区域网络(SAN)由四部分组成盆终端用户、服务器群、存储系统和光纤通道。

4.多媒体数据库（MMDB:multimedia database）是由若干个多媒体对像所构成的集合，这些多媒体数据对像是按某种特定的方式组织起来并为其他的具体应用共享。多媒体数据管理系统（MMDBMS:management system）

5.超媒体的组成:节点、链和网络是超媒体的基本构成要素.

超媒体系统由著作子系统、浏览子系统和支持子系统组成。

多媒体的同步类型分为上层同步、中层同步和底层同步。

媒体同步的四层参考模型