无损压缩 中南大学 多媒体技术导论

合集下载

《多媒体技术》 第二讲 多媒体数据压缩技术(第1—2节)课堂笔记及练习题

《多媒体技术》 第二讲 多媒体数据压缩技术(第1—2节)课堂笔记及练习题

多媒体技术第二讲多媒体数据压缩技术(第1—2节)课堂笔记及练习题主题:第二讲多媒体数据压缩技术(第1—2节)学习时间: 4月4日--4月10日内容:第二讲多媒体数据压缩技术第一节多媒体数据和信息转换一、多媒体间的信息转换为了便于交流信息,需要对不同的媒体信息进行转换。

下表是部分媒体之间说明:*易**较困难***很困难二、多媒体数据文件格式多媒体文件的格式很多,下表介绍常用文件格式的特点和应用场合。

三、多媒体数据的信息冗余多媒体计算机系统主要采用数字化方式,对声音、文字、图形、图像、视频等媒体进行处理。

数字化处理的主要问题是巨大的数据量。

一般来说,多媒体数据中存在以下种类的数据冗余:1)空间冗余:一些相关性的成像结构在数字化图像中就表现为空间冗余。

2)时间冗余:两幅相邻的图像之间有较大的相关性,这反映为时间冗余。

3)信息熵冗余(编码冗余):信息熵是指一组数据所携带的信息量。

如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余,这种冗余称为信息熵冗余。

4)结构冗余:有些图像从大域上看存在着非常强的纹理结构,例如布纹图像和草席图像,我们说它们在结构上存在冗余。

5)知识冗余:有许多图像的理解与某些基础知识有较大的相关性。

这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。

6)视觉冗余:人类视觉系统对于图像场的任何变化,并不是都能感知的。

这类冗余我们称为视觉冗余。

7)其他冗余:例如由图像的空间非定常特性所带来的冗余。

以上所讲的是多媒体数据的信息冗余。

设法去掉信号数据中的冗余,就是数据压缩。

第二节常用的数据压缩技术一、数据压缩编码方法1)根据解码后数据与原始数据是否完全一致来进行分类:① 可逆编码(无失真编码),如Huffman编码、算术编码、行程长度编码等。

② 不可逆编码(有失真编码),常用的有变换编码和预测编码。

2)根据压缩的原理进行划分:① 预测编码:它是利用空间中相邻数据的相关性,利用过去和现在出现过的点的数据情况来预测未来点的数据。

多媒体技术基础(数据压缩、标准、音频、图像)作业及答案

多媒体技术基础(数据压缩、标准、音频、图像)作业及答案

第二章作业作业总体要求:1.认真独立的完成2.让文件名重新命名为自己的学号,然后通过http://10.66.4.241提交。

一.选择题1.下列说法中不正确的是【B】。

A.有损压缩法会减少信息量B.有损压缩法可以无失真地恢复原始数据C.有损压缩法是有损压缩D.有损压缩法的压缩比一般都比较大2.下列属于无损压缩的是【B 】。

A.WA VE文件压缩成MP3文件 B.TXT文件压缩成RAR文件C. BMP文件压缩成JPEG文件D.A VI文件压缩成RM文件3.图像序列中的两幅相邻图像,后一幅图像与前一幅图像之间有较大的相关,这是【 D 】。

A. 空间冗余B.时间冗余C.信息熵冗余D.视觉冗余4.衡量数据压缩技术性能好坏的主要指标是【C】。

(1)压缩比(2)算法复杂度(3)恢复效果(4)标准化A. (1)(3)B. (1)(2)(3)C. (1)(3)(4)D.全部5.MPEG标准不包括下列哪些部分【C 】。

A.MPEG视频B.MPEG音频C.MPEG系统D.MPEG编码6.下列属于静态图像编码和压缩标准的是【B 】。

A.JPEG B.MPEG-1C.MPEG-2 D.MPEG-47.声音信号是声波振幅随时间变化的【A 】信号.A.模拟B.数字C.无规律D.有规律8.在数字视频信息获取与处理过程中,下述顺序正确的是【A 】。

A.采样、A/D变换、压缩、存储、解压缩、D/A变换B.采样、D/A变换、压缩、存储、解压缩、A/D变换C.采样、压缩、A/D变换、存储、解压缩、D/A变换D.采样、压缩、D/A变换、存储、解压缩、A/D变换9.一般来说,表示声音的质量越高,则【C 】A.量化位数越多和采样频率越低B.量化位数越少和采样频率越低C.量化位数越多和采样频率越高D.量化位数越少和采样频率越高10.5分钟双声道、16位采样位数、44.1kHZ采样频率声音的不压缩数据量是【 B 】。

A. 48.47MBB. 50.47MBC. 105.84MBD. 25.23MB11.下列采集的波形声音【 D 】的质量最好。

教育部办公厅关于公布“新世纪网络课程建设工程”第一、二批项目验收结果的通知

教育部办公厅关于公布“新世纪网络课程建设工程”第一、二批项目验收结果的通知

教育部办公厅关于公布“新世纪网络课程建设工程”第一、二批项目验收结果的通知文章属性•【制定机关】教育部•【公布日期】2003.11.03•【文号】教高厅函[2003]16号•【施行日期】2003.11.03•【效力等级】部门规范性文件•【时效性】现行有效•【主题分类】高等教育正文教育部办公厅关于公布“新世纪网络课程建设工程”第一、二批项目验收结果的通知(教高厅函[2003]16号)有关高等学校,教育部现代远程教育资源建设委员会办公室,高等教育出版社:为贯彻第三次全国教育工作会议精神,落实《面向21世纪教育振兴行动计划》,加快现代远程教育工程资源建设步伐,我部自2000年5月启动了“新世纪网络课程建设工程”。

本工程共分三批实施,立项321个。

为了加强对项目的管理和检查,积极推进项目成果的推广应用,我部于2003年4月和7月对其中的第一、二批共277个项目进行了验收。

现将第一、二批通过验收的项目予以公布。

“新世纪网络课程建设工程”是一项投入大、要求高、涉及面广的工作。

共有83所高校参与第一、二批项目,先后从事开发的教师和技术人员多达3380多人。

自从这两批项目正式立项以来,有关高校积极组织力量进行开发,相关的研究取得了很大的进展。

从验收情况看,通过此工程的实施,我国网络教学资源建设的整体水平有了明显的提高,对支撑现代远程教育工程的开展、推动教育信息化建设都起到了积极的作用。

项目取得了预期的成果。

希望各高校认真总结此次项目开发的经验,不断提高网络课程的研发水平,积极推广应用此次项目的成果,避免低水平的重复开发,使学校的网络教学资源建设上升到一个新水平,促进学校的信息化建设开展。

由于种种原因,此两批项目中仍有一部分未能按期通过验收,希望这些项目的主管学校加强管理、充实力量,落实政策支持项目的配套资金,保证项目的开发工作顺利进行。

开发工作结束后,仍按原程序提请验收。

附件:“新世纪网络课程建设工程”第一、二批通过验收项目名单教育部办公厅二○○三年十一月三日附件。

多媒体的关键技术

多媒体的关键技术
高档的创作工具用于影视系统的动 画制作及特技效果,中档的用于培训、 教育和娱乐节目制作,低档的用于商业 简介、家庭学习材料的编辑。
多媒体数据库技术
多媒体信息是结构型的,致使传统 的关系数据库已不适用于多媒体的信息 管理,需要从下面四个方面研究数据库
1).多媒体数据模型 2).媒体数据压缩和解压缩的模式 3).多媒体数据管理及存取方法 4).用户界面
超文本/超媒体技术
超文本是一种新颖的文本信息管理 技术,它提供的方法是建立各种媒体信 息之间的网状链接结构,这种结构由节 点组成。
对超文本进行管理使用的系统称为 超文本系统。也即浏览器,或称为导航 图。
若超文本中的节点的数据不仅可以 是文本,还可以是图像、动画、音频、 视频,则称为超媒体。
多媒体应用开发技术
宽带综合业务数字网(B-ISDN)是 解决多媒体数据的传输问题的一个比较 完整的方法,其中ATM(异步传送模式) 是近年来在研究和开发上的一个重要成 果。
1.7 虚拟现实技术
虚拟现实的定义可归纳为:利用计 算机技术生成的一个逼真的视觉、听觉 触觉及嗅觉等的感觉世界,用户可以用 人的自然技能对这个生成的虚拟实体进 行交互考察。
组网技术
多媒体的关键技术
1.1 视频音频数据压缩/解压缩技术 1.2 多媒体专用芯片技术 1.3 大容量信息存储技术 1.4 多媒体输入与输出技术 1.5 多媒体软件技术 1.6 多媒体通信技术 1.7 虚拟现实技术
1.1 视频音频数据压缩/解压缩技术
研制MPC需要解决的关键问题之一 是要使计算机能适时地综合处理声、文 图信息。
选用合适的数据压缩技术,有可能 将字符数据量压缩到原来的1/2左右,语 音数据量压缩到原来的1/2-1/10,图像 数据量压缩到原来的1/2-1/60。

01_Introduction_no CV

01_Introduction_no CV

多媒体的定义
狭义多媒体的概念包含几层含义:
媒体的表示形式 处理多种媒体的硬件设备 存储信息的实体
•多种感官作用 •多种仪器设备 •多学科交汇 •多领域应用
•多种信息和码流一体化 •设备控制一体化 •具有实时交互控制环境
多 媒 体
人和客观世界 之间的中介
多媒体技术
利用计算机技术将多种媒体综合一体的技术,使 之建立起逻辑连接,并对它们获取、压缩编码、 编辑、加工处理、存储和展示。 多媒体技术就是把声音、文字、图像、视频等多 种媒体和计算机集成在一起的技术。 学科交叉:数字化信息处理技术、音频处理技术、 图像和视频处理技术、计算机软件和硬件技术、 人工智能和模式识别技术、通信和网络技术等。
课时安排
共48(32+16)学时,其中
授课:30学时(15次) 复习:2学时(1次) 上机实验: 16学时(5次)
考核方式
上机实验
25%
平时成绩(考勤+作业/练习)
5%
期末考试
70%
主要内容
多媒体技术概述 音频处理技术 图像处理技术 视频处理技术 光盘存储系统 基于内容多媒体信息组织与检索 多媒体数据压缩与编码
Audio, Speech & Language Processing @ Northwestern Polytechnical University
多媒体技术导论
Fundamentals of Multimedia Technologies
西北工业大学 计算机学院 陕西省语音图像信息处理重点实验室 音频、语音与语言处理研究组
1.2多媒体技术 的发展与趋势
1.2多媒体技术的发展与趋势
未来的主要发展趋势
分布式、网络化、协同工作的多媒体系统。

多媒体技术复习题及参考答案

多媒体技术复习题及参考答案

中南大学现代远程教育课程考试复习题及参考答案《多媒体技术》一、选择题1. 多媒体计算机中的媒体信息是指( ) 。

⑴数字、文字⑵声音、图形⑶动画、视频⑷图像A ⑴B ⑵C ⑶D 全部2. 多媒体技术的主要特性有( )。

(1)多样性(2)集成性(3)交互性(4)可扩充性A(1) B(1)、(2) C(1)(2)(3) D 全部3. 目前音频卡具备以下哪些功能()。

⑴录制和回放数字音频文件⑵混音⑶语音特征识别⑷实时解/压缩数字音频文件A ⑴⑶⑷B ⑴⑵⑷C ⑵⑶⑷D 全部4.在多媒体计算机中常用的图像输入设备是()。

(1)数码照相机(2)彩色扫描仪(3)视频卡(4)彩色摄像机A (1)B (1)(2)C (1)(2)(3)D 全部5. 视频卡的种类很多,主要包括()。

(1)视频捕获卡(2)电影卡(3)电视卡(4)视频转换卡A (1)B (1)(2)C (1)(2)(3)D 全部6. 以PAL制25帧/秒为例,已知一帧彩色静态图像(RGB)的分辨率为256x256,每一种颜色用8bit表示,则该视频每秒钟的数据量为()。

A 256 x 256 x 16 x 25 bpsB 512 x 512 x 3 x 8 x 25 bpsC 256 x 256 x 3 x 8 x 25 bpsD 512 x 512 x 3 x 16 x 25 bps7. 全电视信号主要由()组成。

A 图像信号、同步信号、消隐信号。

B 图像信号、亮度信号、色度信号。

C 图像信号、复合同步信号、复合消隐信号。

D 亮度信号、复合同步信号、复合色度信号。

8. 在视频信号实时处理技术中,如果电视扫描的正程时间为52.2ms,分辨率为512 x 512 ,这意味着处理每个像素的时间近似为()。

A 0.1msB 0.2msC 0.8msD 0.4ms9. 下列哪种说法是正确的()。

A 信息量等于数据量与冗余量之和。

B 信息量等于信息熵与数据量之差。

多媒体技术及应用课后答案(付先平)

一、选择题1. 下列选项不属于感觉媒体的是: D 。

A. 音乐B. 香味C. 鸟鸣D. 乐谱2. 下列选项属于表示媒体的是: DA. 照片B.显示器C.纸张D.条形码3. 下列选项属于显示媒体的是: BA.图片B.扬声器C.声音D.语言编码4. 下列选项属于传输媒体的是: AA.磁带B.照片C.扬声器D.打印机5. 下列选项属于传输媒体的是: CA. 光盘B. 照片C. 光缆D. 键盘6. 能直接作用于人们的感觉器官,从而能使人产生直接感觉的媒体是: AA. 感觉媒体B.表示媒体C. 显示媒体D. 传输媒体7. 为了传送感觉媒体而人为研究出来的媒体称为: BA. 感觉媒体B.表示媒体C. 显示媒体D. 传输媒体8. 语言编码,电报码,条形码和乐谱等属于: BA. 感觉媒体B.表示媒体C. 显示媒体D. 传输媒体9. 下列不属于多媒体的基本特性的是: DA. 多样性B. 交互性C. 集成性D. 主动性10. 下列不属于多媒体技术的研究内容的是: DA. 图像处理B.质量服务C. 用户界面D. 软件工程11. 对人类视觉系统反应最敏感的是: AA. 亮度B. 红色C. 绿色D. 蓝色12. 色彩的三要素不包括: CA. 亮度B. 色相C.色性D. 纯度13. 下面 C 代表色彩的冷暖倾向。

A. 亮度B. 色相C.色性D.色调14. 在可见光谱中,亮度最高的颜色是: DA.白色B.黑色C.紫色D.黄色15. 在可见光谱中,亮度最低的颜色是: CA.白色B.黑色C.紫色D.黄色16. 物体颜色的 D 取决于该物体表面选择性反射光辐射能力。

A. 亮度B. 色相C. 色性D.饱和度17. 下列颜色,是互补色的一对是: BA. 红色与紫色B. 绿色与红色C. 绿色与黄色D. 蓝色与绿色18. 下列颜色模型,属于相加色的是: AA. RGB颜色模型B. CMYK颜色模型C. Lab颜色模型D.HSB颜色模型19. 下列颜色模型,属于相减色的是: BA. RGB颜色模型B. CMYK颜色模型C. Lab颜色模型D.HSB颜色模型20. CMYK颜色模型中的“K”代表: CA. 紫色B. 蓝色C. 黑色D. 青色21. 一个色系能够显示或打印的颜色范围称为: DA. 颜色深度B. 显示深度C. 颜色区域D. 色域22.下列颜色模型中,具有最宽色域的是: CA. RGBB. CMYKC. LabD. HSB23.下列颜色模型中,具有最窄色域的是: BA. RGBB. CMYKC. LabD. HSB24.下列颜色模型中,属于视频图像的颜色模型是: AA. YUVB. CMYKC. LabD. HSB25.YUV颜色模型应用于 A 制彩色电视。

数字媒体技术导论试卷2 参考答案(丁向民)

盐城师范学院考试试卷2**** - **** 学年第*学期信息科学与技术学院数字媒体技术专业《数字媒体技术导论》试卷班级学号姓名一、单选题(本大题30空,每题1分,共30分)1、电子计算机问世至今,不管机器如何推陈出新,依然保有“存储程序”的概念,最早提出这种概念的是。

A. 巴贝奇B. 冯.诺伊曼C. 帕斯卡D. 贝尔2、最少需要位二进制表示任一四位长的十进制数。

A. 10B. 14C. 13D. 163、下列两个二进制数进行算术加运算,+111= 。

A. B. C. D.4、在计算机硬件技术指标中,度量存储器空间大小的基本单位是。

A.字节(Byte)B.二进位(Bit)C.字(Word)D.双字(Double Word)5、存储一个48×48点的汉字字形码需要的字节数是。

A.384 B.144 C.256 D.2886、病毒产生的原因是。

A.用户程序错误B.计算机硬件故障C.人为制造D.计算机系统软件有错误7、目前,度量处理器CPU时钟频率的单位是。

A. MTPS B.GHz C. GB D. Mbps8、计算机的存储器采用多级方式是为了。

A.减少主机箱的体积 B.解决容量、价格、速度三者之间的矛盾C.保存大量数据方便 D.操作方便9、计算机的应用非常广泛,教学管理系统属于。

A.科学计算方面的计算机应用B.过程控制方面的计算机应用C.数据处理方面的计算机应用D.辅助设计方面的计算机应用10、下列设备中,完全属于输出设备的一组是。

A.喷墨打印机,显示器,键盘 B.激光打印机,键盘,鼠标C.键盘,鼠标器,扫描仪 D.打印机,绘图仪,显示器11、磁盘上的磁道是。

A.一组记录密度不同的同心圆B.一组记录密度相同的同心圆C.一组记录密度不同的阿基米德螺旋线D.一组记录密度相同的阿基米德螺旋线12、ROM中的信息是。

A.由生产厂家预先写入的B.在安装系统时定入的C.根据用户需求不同,由用户随时写入的D.由程序临时存入的13、计算机的系统总线是计算机各部件间传递信息的公共通道,它分。

大学艺术概论论文范文3篇(最新)

摘要:多媒体艺术是当代信息科学技术与艺术相互结合的产物,经历了从模仿到原创、从局部到整体、从单一到多元化的发展过程,正在步入全面快速发展的新阶段。

未来多媒体艺术的发展会在艺术本身的创新、政策的支持、技术的革新、相关领域推动等动力的推动下,朝着技术、思想和观念维度上的不断进步。

关键词:多媒体;艺术;概论多媒体艺术是当代信息科学技术与艺术相互结合的产物,经历了从模仿到原创、从局部到整体、从单一到多元化的发展过程,正在步入全面快速发展的新阶段。

未来多媒体艺术的发展会在艺术本身的创新、政策的支持、技术的革新、相关领域推动等动力的推动下,朝着技术、思想和观念维度上的不断进步。

一、多媒体艺术具有主动传播的功能艺术家都需要将自己的艺术观念和作品及时的进行展示和交流,过去这可能是绝大多数艺术家们,特别是年轻艺术家和不知名艺术家,遇到的最大问题。

他们有想法,有作品,但缺乏与观众沟通的机会。

如今互联网的迅猛发展,使得远程传输多媒体艺术作品成为现实。

借助于数码技术能够非常方便地编辑制作数码图像(包括数码绘画、数码摄影和数码录像),艺术家完成的艺术作品可通过网络发布。

他们可在现场讲解自己的作品,将作品迅速推介给全世界的艺术爱好者,不必再为寻找发行渠道或展示、表演场所而为难。

同时音频和视频技术的发展,使人们能够独自在家里看电影、听音乐。

艺术家可以在网上随心所欲的表演并直接推销其艺术作品,声情并茂。

二、多媒体艺术提升互动的界面在传统艺术形式中观众往往是很被动,给什么就接受什么。

或许观众会有喜欢和拒绝的感受,但与作品本身却无关。

现在网络多媒体艺术打破了传统的定式在特定地点和时间中的展出作品方式,任何一个人,不管在什么地方,只要他必备了上网条件与交流手段,就可以参与到作品的互动过程中。

欣赏者可以根据自己的理解和喜好,对艺术作品进行修改,创造出符合自己审美趣味和理想的、新的艺术版本。

这种互动性其实是更好地体现了艺术对每一个人的作用和个体性,同样的一张画给不同的人看,看到的内容会有千差万别;同一曲音乐在不同的人听来,肯定也会有完全不同的感受,这种新的艺术版本不再只是存在于欣赏者意识中的审美经验,而是经过欣赏者的再创造转化为现实的艺术作品。

多媒体计算机技术-5

JPEG标准综合了多年来图像压缩编码的研究成果,是一 种集大成的算法。
该标准规定了两种工作方式,即顺序方式和渐进方式;还 规定了三种级别的编码算法,即基本系统(Baseline system)、扩展系统(Extended system)和无失真系统 (Lossless coding)。
顺序方式
图像被分割为成行成列的四方小块,编 码时由左而右,由上而下地逐行逐列对每个 小块进行运算,直到所有小块都被编码为止。 每个小块的编码都是一次完成。解码时按编 码顺序逐块解码,也是一次完成。
基于小波变换的极低码率 视频编码技术
目前极低码率的视频编码方法有很多种, 其中基于小波的极低码率编码技术已经得 到很好的发展并已在实际应用中发挥重要 的作用。已开发的基于小波的视频编码芯 片的最高压缩比可达350︰1,甚至更高。
基于小波变换的极低码率 视频编码技术
传统的视频压缩算法通常都是用预测编码来减少 帧间冗余度,采用二维的DCT变换减少帧内冗余 度,采用熵编码减少统计冗余度。在常规的块匹 配运动补偿中,将图像分割成多个不重叠的块, 经搜索每个块赋予一个运动矢量。
然而建立在IP协议之上的互联网及其他的包交换 网络只能提供尽力而为的服务,没有一个完备的 服务质量保证机制。在发生阻塞时,各种排队时 延和数据包丢失可能导致视频和音频质量的极度 下降。
概述
在网络上进行视频传输必须考虑两个问题:
信号处理的问题。对于图像和视频信号的压缩 来说,高效的算法是任何一个好的系统设计的 核心问题。
位移向量D
相关性增大,差值信号减小,
运动物体的帧间位移
从而提高压缩比。
第K帧
运动估计
所谓运动估计就是使用于帧间编码方式时,通过 参考图像产生对被压缩图像的估计。 运动估计的准确程度对帧间编码的压缩效果非常 重要。如果估计做得好,那么被压缩图像与估计 图像相减后得到的数据量就很小。运动估计以宏 块为单位进行,计算被压缩图像与参考图像的对 应位置上的宏块间的位置偏移。这种位置偏移是 以运动向量来描述的,一个运动向量代表水平和 垂直两个方向上 动态图像的特点 运动图象压缩技术的发展 MPEG标准概述 MPEG-1标准 MPEG-2标准
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


15
3.4.1 数据压缩概述
2. 多媒体数据的冗余 空间冗余 例: 图像中的“A”是一个规则物体。光的亮度、 饱和度及颜色都一样,因此,数据A有很大的冗余。
A
多媒体技术 第7-9讲
16
3.4.1 数据压缩概述
2. 多媒体数据的冗余
时间冗余 例:图像序列
F1 A A F2
多媒体技术 第7-9讲
17
3.4.1 数据压缩概述
2. 多媒体数据的冗余
结构冗余
图像有非常强的纹理结构, 图像的象素值存在着明显的 分布模式。
多媒体技术 第7-9讲
18
3.4.1 数据压缩概述
2. 多媒体数据的冗余 知识冗余 图像的理解与某些基础知识有 关。 例:人脸的图像有同样的结构: 嘴的上方有鼻子,鼻子上方有眼睛, 鼻子在中线上…… 知识冗余是模型编码主要利用 的特性。
多媒体技术 第7-9讲
19
3.4.1 数据压缩概述
2. 多媒体数据的冗余

统计冗余:编码中各种符号出现的频率不同,
如果每一种符号用相同的存储位数,也会产生 冗余,这种冗余叫统计冗余。

信息熵冗余:图像中平均每个像素使用的比特
数大于该图像的信息熵,则图像中存在冗余, 这种冗余称为信息熵冗余。

其他的冗余
多媒体技术 第7-9讲
14
3.4.1 数据压缩概述
2. 多媒体数据的冗余

信息量与数据量的关系可由下式给出: I = D - du (I,D,du分别为信息量、数据量与冗余量。 冗余量du是指D中的数据冗余。) 数据冗余的类别: 空间冗余、时间冗余、信息冗余、结构冗余、 知识冗余 等
多媒体技术 第7-9讲
对于以上数据量,在1.44MB的软盘中能存放约5幅静 态图像。若用速率(64kbps)的电话线传输,一幅静态图 像约需要传送38秒 。
多媒体技术 第7-9讲
9
3.4.1 数据压缩概述
②动态视频:一幅中等分辨率24位真彩色的位图图像
(640×480,24位/像素),典型参数为: a.图像分辨率:640×480
多媒体技术 第7-9讲
31
香农-范诺算法
Shannon-Fano的树是根据旨在定义一个有效的代码表的规 范而建立的。实际的算法很简单:
1. 对于一个给定的符号列表:制定概率相应的列表或频率计 数,使每个符号的相对发生频率已知。
2. 排序:根据频率的符号列表,最常出现的符号在左边,最 少出现的符号在右边。 3. 清单分为两部分:使左边部分的总频率和尽可能接近右边 部分的总频率和。 4. 该列表的左半边分配二进制数字 0,右半边是分配的数字1。 这意味着,在第一半符号代都是将所有从0开始,第二半 的代码都从1开始。 5. 对左、右半部分递归应用步骤3和4,细分群体,并添加位 的代码,直到每个符号已成为一个相应的代码树的叶。
(1)
(2)
以压缩前后文件大小和数据率作比较,其 比值为压缩率。
多媒体技术 第7-9讲
23
3.4.2 数据压缩分类

根据图像质量有无损失,数据压缩可分为两种 类型 无损压缩 指解压缩 还原得到 的数据与 原始数据 完全相同
有损压缩
指解压缩还 原得到的数 据与原始数 据不完全相 同
多媒体技术 第7-9讲
多媒体技术 第7-9讲
28
信息熵与信息量
如果要选择的数是63,则其过程如下: 1.大于/小于 32? 大 2.大于/小于 32+16=48? 大 3.大于/小于 48+8=56? 大 4.大于/小于 56+4=60? 大 5.大于/小于 60+2=62? 大 6.大于/小于 62+1=63

每提问一次都会得到1比特的信息量。因此,在64 个数中选定某一数所需的信息量是
log264=6(bits)
多媒体技术 第7-9讲
29
信息熵与信息量
设从N个数中选任意一个数X的概率为 P(x),假 定选定任意一个数的概率都相等,P(x)= 1/N, 因此定义信息量 I(x) =log2N

= -log2(1/N)
= -log2P(x)
=I[P(x)]
信息量:指从N 个相等的可能 事件中选出一 个事件所需要 的信息度量和 含量。
7
3.4.1 数据压缩概述
(1)声音
具有CD音乐激光唱盘音质的波形声音的典型参数: ① 采样频率44.1KHz ② 量化位数:16位 ③ 立体声声道数:2 ④ 数据量:约0.17MB/秒 注:数据量=(采样频率×量化位数×声道数)/8 根据上面公式可以计算出以上数据量所需的存取时间: 在650MB的光盘中存放时间约1小时。
第三章 多媒体 数据处理与数据压缩
学习目标
A B C
了解并掌握音频编码的主要技术 掌握音频和视频播放器的制作 掌握数据压缩的主要算法
D
了解数据编码及数据压缩的相 关标准
多媒体技术 第7-9讲
2
目 录
3.1 音频编码技术 3.2 音频播放器制作
3.3 视频播放器制作
3.4 数据压缩基础
多媒体技术 第7-9讲
多媒体技术 第7-9讲
27
信息熵与信息量


信息量:指从N个相等的可能事件中选出一个事 件所需要的信息度量和含量。 信息熵:指一组数据所带的信息量,平均信息量 就是信息熵(entropy)。
例如:从64个数中选出某一个数。可先问“是否大于 32?”消除半数的可能,这样只要6次就可选出某数。 如果要选择的数是35,则过程如下: 1.大于/小于 32? 大 2.大于/小于 32+16=48? 小 3.大于/小于 48-8=40? 小 4.大于/小于 40-4=36? 小 5.大于/小于 36-2=34? 大 6.大于/小于 34+1=35 等
符 号 出现的次数 概率 A 15 15/40 B 7 7/40 C 7 7/40 D 6 6/40 E 5 5/40
对于上例,S=(A,B,C,D,E) H(S)=15/40 * log2(40/15)+ 7/40 * log2(40/7) +……+ 5/40 * log2(40/5)=2.196 这就是说每个符号用2.196位表示,40个象素需用87.84位。
多媒体技术 第7-9讲
20
3.4.2 数据压缩分类


数据压缩与解压缩
压缩的目的是为了最有效的利用存储、通信和计 算资源

压缩:去掉信号数据的冗余性,也称为数据编码 解压缩:压缩的逆过程,称为数据解码

按照压缩和解压缩算法耗费的代价不同,可把多 媒体应用分为对称应用和非对称应用。

对称应用中:编码和解码的代价基本相同 非对称应用中:解码比编码过程耗费的代价要小
多媒体技术 第7-9讲



能性
1. 感官的生理局限性

听觉局限性:听觉具有掩蔽性;对不同频段的 声音敏感程度不同;对语音信号的相位变化不 敏感 224 颜色 (16,777,216色)
视觉局限性:视觉具有掩蔽性,对图像的某些 变化不敏感;视觉的色彩分辨力有限
多媒体技术 第7-9讲
6
3.4.1 数据压缩概述
一、 数据压缩的必要性




多媒体应用中涉及的媒体有文字、图形、图 像、音频、动画、视频等 图形文件的数据量与图形内容和及文件格式 有关 动画的数据量与数据的制作格式有关(矢量、 点阵) 绝大部分的图像、音频、视频的数据量都非 常大
多媒体技术 第7-9讲
多媒体技术 第7-9讲
11
3.4.1 数据压缩概述

因此,在多媒体应用中,存在着存储和传输两 个问题。 随着计算机技术的快速发展,存储介质的容量、 传输速率,以及系统和网络的传输速率都有了 大幅度提高,但是多媒体应用的需求也在发展。 单纯的硬件技术无法满足应用需求,媒体数据 的压缩是最终的解决方案。 压缩:把媒体的数据量变小。
24
数据压缩技术
无损压缩 哈夫曼编码 行程编码 算术编码 变换编码 预测编码 运动补偿
有损压缩 面向频域 滤波 子采样 比特分配 子带编码 量化 子波变换(Wavelet) 矢量量化
多媒体技术 第7-9讲
面向重要性
混合编码 JPEG MPEG H.261
词典编码
标量量化
25
3.4.3 无损数据压缩
b.图像颜色数:16,777,216(=224)
c.颜色深度(位):24 d.数据量为:约0.9MB 对于以上数据量,若用 NTSC 制式( 30 帧 / 秒)播放 动态视频,需要约27MB/秒的视频传输速度,在650MB的 光盘中存放时间约24秒。
多媒体技术 第7-9讲
10
3.4.1 数据压缩概述
多媒体技术 第7-9讲
8
3.4.1 数据压缩概述
(2)图像
①静态图像:一幅中等分辨率的位图图像(640×480, 256色),典型参数为: a. 图像分辨率:640×480 b. 图像颜色数:256(=28) c. 颜色深度(位):8 d. 数据量为:约0.3MB 注:数据量=(垂直分辨率×水平分辨率×颜色深度)/8
主要介绍目前用得最多和技术最成熟的无 损压缩编码技术,包括: 霍夫曼编码 算术编码 RLE编码 词典编码
A
B C D
多媒体技术 第7-9讲
26
香农-范诺(Shannon-Fano)算法
信源(消息集) X={x1,…,xn}
编码器
编码输出集
Z={z1,…,zn}
符号集Am={a1,…,am}
熵(Entropy)的概念 熵是信息量的度量方法,它表示某一事件出现的消息 越多,事件发生的可能性就越小,数学上就是概率越小。 某个事件的信息量用 表示,其中Pi为第i个事 件的概率,0<Pi1。
相关文档
最新文档