多媒体技术基础课程课外实践题目讲解

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多媒体技术基础课程课外实践题目

一、香农-范诺编码

有一幅40个像素的组成的灰度图像,灰度共有5级,分别用符号A 、B 、C 、D 、E 表示。40个像素中出现灰度A 的像素有15个,出现灰度B 的像素有7个,出现灰度C 的像素有7个,出现灰度D 的像素有6个,出现灰度E 的像素有5个。(1)对5个符号用香农-范诺算法进行编码。(2)计算该图像可能获得的压缩比的实际值。 解:(1)、

A

B

C

D

E 0 1 0 1 0 1 0 1

(2)、按照这种方法进行编码需要的总位数为30+14+14+18+15=91,实际的压缩比为120:91≈1.32:1

二、霍夫曼编码

1.有一幅40个像素的组成的灰度图像,灰度共有5级,分别用符号

A、B、C、D、E表示。40个像素中出现灰度A的像素有15个,出现灰度B的像素有7个,出现灰度C的像素有7个,出现灰度D的像素有6个,出现灰度E的像素有5个。(1)对5个符号用霍夫曼算法进行编码。(2)计算该图像可能获得的压缩比的实际值。

2.字母A,B,C,D,E已被编码,相应的出现概率如下:

p(A)=0.16,p(B)=0.51,p(C)=0.09,p(D)=0.13, p(E)=0.11,求霍夫曼编码及平均码长。

解:1.每个符号在图像中出现的次数如表2-1,霍夫曼编码如图2-2。

表2-1

图2-2

(1)用霍夫曼算法对5个符号A 、B 、C 、D 、E 进行编码分别为0、100、101、110、111;

(2)按照常规编码算法,5个符号至少要用3位组成的代码表示,编码40个像素需要40×3=120(位);而实际使用的总位数为15+21+21+18+15=90(位)。因此,压缩比的实际值为120 : 90 ≈ 1.33。 2.符号的霍夫曼编码如图2-2-1:

图2-2-1

符号A 、B 、C 、D 、E 的霍夫曼编码分别为100、0、111、101、110;

A(15) B(7) E(5)

D(6) C(7) 1

1

1 0 1

B(0.51)

1) A(0.16)

C(0.09)

E(0.11) D(0.13) 0

1

1

0 1 0 1

平均码长=3×0.16+1×0.51+3×0.13+3×0.11+3×0.09=1.98

三、算术编码

1

已知信源概率如上表,输入01 11 11 00 10,求编码输出是多少?

2.

已知信源概率分布如上表,输出值为0.134,求译码消息是多少?解:1.

编码输出为0.4658

2.

译码消息为01,00,11,10

四、词典编码中的LZ77算法

待编码的数据流,用LZ77算法对数据流进行编码。

解:LZ77算法的编码过程如表4-1:

表4-1

五、词典编码中的LZSS算法

待编码的数据流,用LZSS算法对数据流进行编码。

解:LZSS算法的编码过程如表5-1:

表5-1

六、词典编码中的LZ78算法

LZ78算法的译码消息为(0,A)(0,E)(1,C)(3,E)(4,A)(2,E) ,

求编码字符流。(要列出词典)

解:

表6-1

编码字符流为:AEACACEACEAEE

七、词典编码中的LZW算法

1.待编码的数据流,用LZW算法对数据流进行编码。(要求列出词典)

2.译码消息为:1 2 2 4 7 3,用LZW算法对其进行译码,写出编码字符流与词典。

解:1. LZW算法的编码如表7-1:

表7-1

2. LZW算法的编码如表7-2:

表7-2

八、音频文件的数据量的计算方法

1.用44.1kHz采样频率采样,每个样本使用16位采样精度存储,则录制一分钟的立体声节目,音频WAV文件的存储量?

2.使用22.05kHz的采样频率和8位采样精度,录制一分钟调幅音频的WAV文件存储量?

解:1. WAV文件的存储量是44100×16×2÷8×60=10.584MB/min 2.WAV文件的存储量是22050×8×1÷8×60=1.323MB/min

九、子带编码(SBC)

写出子带编码的基本思想和工作流程。

答:基本思想:使用一组带通滤波器把输入声音信号的频带分成若干个连续的频段,每个频段称为子带。对每个子带中的声音信号采用单独的编码方案去编码。在信道上传送时,将每个子带的代码复合起来。在接收端译码时,将每个子带的代码单独译码,然后把它们组合起来,还原成原来的声音信号。

工作流程:首先用一组带通滤波器将输入信号分成若干子带信号,然后将这些子带信号通过频率搬移变成基带信号,再对它们分别进行采样,量化编码后再将子带的信码合路成一个总信码传输到接收端。量化编码可以采用PCM、DPCM等方式。在接收端,把总信码分成各子带信码,再进行插值,频率搬移到原来的位置,带通滤波然后相加得到重建信号。各子带的带宽可以是相同的也可以是不相同的,相同的称为等带宽子带编码,不同的称为变带宽子带编码。等带宽子带

编码的优点是便于硬件实现。变带宽编码中,常用的子带划分方法是令各子带的宽度随频率的增加而增加。也就是低频子带宽度较窄,高频宽度较大。这种划分方法不仅和语音信号的功率相匹配,也和语音信号的可懂度或清晰度随频率变化的关系相匹配。语音信号频带中具有相同带宽的子带对语音可懂度的影响不同,低频的影响大一些,高频的影响小一些。在等带宽分割时,对不同子带分配不同的比特数,等带宽编码也能获得比较好的重建语音质量。

十、真彩色、伪彩色与直接色

写出三种色彩的定义与差别?并例举三种色彩分别应用到哪些图像中。

答:三种色彩的定义分别为:

真彩色:真彩色是指图像中的每个像素值都分成R、G、B三个基色分量,每个基色分量直接决定其基色的强度,这样产生的色彩称为真彩色。

伪彩色:伪彩色(Pseudo-color)图像的每个像素值实际上是一个索引值或代码,该代码值作为色彩查找表CLUT(Color Look-Up Table)中某一项的入口地址,根据该地址可查找出包含实际R、G、B的强度值。这种用查找映射的方法产生的色彩称为伪彩色。

直接色:(direct color)每个像素值分成R,G,B分量,每个分量作为单独的索引值对它做变换。也就是通过相应的彩色变换表找出基色强度,用变换后得到的R,G,B强度值产生的彩色称为直接色。它的特点是对每个基色进行变换。

相关文档
最新文档