多媒体技术基础课程课外实践题目讲解

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

多媒体技术基础课程课外实践题目

一、香农-范诺编码

有一幅40个像素的组成的灰度图像，灰度共有5级，分别用符号A 、B 、C 、D 、E 表示。40个像素中出现灰度A 的像素有15个，出现灰度B 的像素有7个，出现灰度C 的像素有7个，出现灰度D 的像素有6个，出现灰度E 的像素有5个。（1）对5个符号用香农-范诺算法进行编码。（2）计算该图像可能获得的压缩比的实际值。解：（1）、

E 0 1 0 1 0 1 0 1

（2）、按照这种方法进行编码需要的总位数为30+14+14+18+15=91，实际的压缩比为120:91≈1.32:1

二、霍夫曼编码

1.有一幅40个像素的组成的灰度图像，灰度共有5级，分别用符号

A、B、C、D、E表示。40个像素中出现灰度A的像素有15个，出现灰度B的像素有7个，出现灰度C的像素有7个，出现灰度D的像素有6个，出现灰度E的像素有5个。（1）对5个符号用霍夫曼算法进行编码。（2）计算该图像可能获得的压缩比的实际值。

2.字母A,B,C,D,E已被编码，相应的出现概率如下：

p(A)=0.16,p(B)=0.51,p(C)=0.09,p(D)=0.13, p(E)=0.11，求霍夫曼编码及平均码长。

解：1.每个符号在图像中出现的次数如表2-1，霍夫曼编码如图2-2。

表2-1

图2-2

(1)用霍夫曼算法对5个符号A 、B 、C 、D 、E 进行编码分别为0、100、101、110、111；

（2）按照常规编码算法，5个符号至少要用3位组成的代码表示，编码40个像素需要40×3=120（位）；而实际使用的总位数为15+21+21+18+15=90（位）。因此，压缩比的实际值为120 : 90 ≈ 1.33。 2.符号的霍夫曼编码如图2-2-1：

图2-2-1

符号A 、B 、C 、D 、E 的霍夫曼编码分别为100、0、111、101、110；

A(15) B(7) E(5)

D(6) C(7) 1

1 0 1

B(0.51)

1) A(0.16)

C(0.09)

E(0.11) D(0.13) 0

0 1 0 1

平均码长=3×0.16+1×0.51+3×0.13+3×0.11+3×0.09=1.98

三、算术编码

已知信源概率如上表，输入01 11 11 00 10，求编码输出是多少？

已知信源概率分布如上表，输出值为0.134，求译码消息是多少？解：1.

编码输出为0.4658

译码消息为01，00，11，10

四、词典编码中的LZ77算法

待编码的数据流，用LZ77算法对数据流进行编码。

解：LZ77算法的编码过程如表4-1：

表4-1

五、词典编码中的LZSS算法

待编码的数据流，用LZSS算法对数据流进行编码。

解：LZSS算法的编码过程如表5-1：

表5-1

六、词典编码中的LZ78算法

LZ78算法的译码消息为(0，A)(0，E)(1，C)(3，E)(4，A)(2，E) ，

求编码字符流。（要列出词典）

解：

表6-1

编码字符流为：AEACACEACEAEE

七、词典编码中的LZW算法

1.待编码的数据流，用LZW算法对数据流进行编码。(要求列出词典)

2.译码消息为：1 2 2 4 7 3，用LZW算法对其进行译码，写出编码字符流与词典。

解：1. LZW算法的编码如表7-1：

表7-1

2. LZW算法的编码如表7-2：

表7-2

八、音频文件的数据量的计算方法

1.用44.1kHz采样频率采样，每个样本使用16位采样精度存储，则录制一分钟的立体声节目，音频WAV文件的存储量？

2.使用22.05kHz的采样频率和8位采样精度，录制一分钟调幅音频的WAV文件存储量？

解：1. WAV文件的存储量是44100×16×2÷8×60=10.584MB/min 2．WAV文件的存储量是22050×8×1÷8×60=1.323MB/min

九、子带编码（SBC）

写出子带编码的基本思想和工作流程。

答：基本思想：使用一组带通滤波器把输入声音信号的频带分成若干个连续的频段，每个频段称为子带。对每个子带中的声音信号采用单独的编码方案去编码。在信道上传送时，将每个子带的代码复合起来。在接收端译码时，将每个子带的代码单独译码，然后把它们组合起来，还原成原来的声音信号。

工作流程：首先用一组带通滤波器将输入信号分成若干子带信号，然后将这些子带信号通过频率搬移变成基带信号，再对它们分别进行采样，量化编码后再将子带的信码合路成一个总信码传输到接收端。量化编码可以采用PCM、DPCM等方式。在接收端，把总信码分成各子带信码，再进行插值，频率搬移到原来的位置，带通滤波然后相加得到重建信号。各子带的带宽可以是相同的也可以是不相同的，相同的称为等带宽子带编码，不同的称为变带宽子带编码。等带宽子带

编码的优点是便于硬件实现。变带宽编码中，常用的子带划分方法是令各子带的宽度随频率的增加而增加。也就是低频子带宽度较窄，高频宽度较大。这种划分方法不仅和语音信号的功率相匹配，也和语音信号的可懂度或清晰度随频率变化的关系相匹配。语音信号频带中具有相同带宽的子带对语音可懂度的影响不同，低频的影响大一些，高频的影响小一些。在等带宽分割时，对不同子带分配不同的比特数，等带宽编码也能获得比较好的重建语音质量。

十、真彩色、伪彩色与直接色

写出三种色彩的定义与差别？并例举三种色彩分别应用到哪些图像中。

答：三种色彩的定义分别为：

真彩色：真彩色是指图像中的每个像素值都分成R、G、B三个基色分量，每个基色分量直接决定其基色的强度，这样产生的色彩称为真彩色。

伪彩色：伪彩色（Pseudo-color）图像的每个像素值实际上是一个索引值或代码，该代码值作为色彩查找表CLUT（Color Look-Up Table）中某一项的入口地址，根据该地址可查找出包含实际R、G、B的强度值。这种用查找映射的方法产生的色彩称为伪彩色。

直接色：(direct color)每个像素值分成R，G，B分量，每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度，用变换后得到的R，G，B强度值产生的彩色称为直接色。它的特点是对每个基色进行变换。