多媒体信息的数据压缩
多媒体关键技术

多媒体信息处理的关键技术1)多媒体数据压缩技术2)多媒体数据存储技术3)集成电路制作技术4)多媒体数据库技术5)虚拟现实技术多媒体信息处理的关键技术1) 多媒体数据压缩技术为了快速传输数据、提高处理速度和节省存储空间,一些压缩算法和压缩手段已经标准化和模块化,被写入芯片中。
数据压缩的条件●数据冗余度(重复数据、可忽略数据)●人类不敏感因素例如:人类对某些频率的音频信号不敏感,人眼对亮度比较敏感,而对边缘的强烈变化并不敏感。
●信息传输与存储数据有损压缩数据无损压缩数据存储数据传输数据解压缩数据解压缩多媒体信息处理的关键技术数据压缩算法无损压缩有损压缩●无损压缩编码——压缩数据还原后,与原始数据一致,无损失。
●有损压缩编码——压缩后再还原的数据有损失。
多媒体信息处理的关键技术2) 多媒体数据存储技术存储技术逐步走向成熟,光盘存储器从单一品种的CD-ROM 存储器发展到CD-R、CD-RW、DVD-R、DVD-RW存储器等。
多媒体信息处理的关键技术3) 集成电路制作技术具有强大数据压缩运算能力的大规模集成电路是解决数据压缩等大量计算问题的硬件保证,为多媒体技术的发展创造了有利的条件。
多媒体信息处理的关键技术4) 多媒体数据库技术多媒体数据库、面向对象的数据库以及智能化多媒体数据库的发展越来越迅速,它们将进一步发展或取代传统的关系数据库。
多媒体信息处理的关键技术5) 虚拟现实技术虚拟现实技术是一种能够创建和体验虚拟世界的计算机仿真技术,它利用计算机生成一种交互式的三维动态视景,其实体行为的仿真系统能够使用户沉浸到该环境中。
《多媒体技术》 第二讲 多媒体数据压缩技术(第1—2节)课堂笔记及练习题

多媒体技术第二讲多媒体数据压缩技术(第1—2节)课堂笔记及练习题主题:第二讲多媒体数据压缩技术(第1—2节)学习时间: 4月4日--4月10日内容:第二讲多媒体数据压缩技术第一节多媒体数据和信息转换一、多媒体间的信息转换为了便于交流信息,需要对不同的媒体信息进行转换。
下表是部分媒体之间说明:*易**较困难***很困难二、多媒体数据文件格式多媒体文件的格式很多,下表介绍常用文件格式的特点和应用场合。
三、多媒体数据的信息冗余多媒体计算机系统主要采用数字化方式,对声音、文字、图形、图像、视频等媒体进行处理。
数字化处理的主要问题是巨大的数据量。
一般来说,多媒体数据中存在以下种类的数据冗余:1)空间冗余:一些相关性的成像结构在数字化图像中就表现为空间冗余。
2)时间冗余:两幅相邻的图像之间有较大的相关性,这反映为时间冗余。
3)信息熵冗余(编码冗余):信息熵是指一组数据所携带的信息量。
如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余,这种冗余称为信息熵冗余。
4)结构冗余:有些图像从大域上看存在着非常强的纹理结构,例如布纹图像和草席图像,我们说它们在结构上存在冗余。
5)知识冗余:有许多图像的理解与某些基础知识有较大的相关性。
这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。
6)视觉冗余:人类视觉系统对于图像场的任何变化,并不是都能感知的。
这类冗余我们称为视觉冗余。
7)其他冗余:例如由图像的空间非定常特性所带来的冗余。
以上所讲的是多媒体数据的信息冗余。
设法去掉信号数据中的冗余,就是数据压缩。
第二节常用的数据压缩技术一、数据压缩编码方法1)根据解码后数据与原始数据是否完全一致来进行分类:① 可逆编码(无失真编码),如Huffman编码、算术编码、行程长度编码等。
② 不可逆编码(有失真编码),常用的有变换编码和预测编码。
2)根据压缩的原理进行划分:① 预测编码:它是利用空间中相邻数据的相关性,利用过去和现在出现过的点的数据情况来预测未来点的数据。
多媒体信息处理的关键技术

多媒体信息处理的关键技术7.1.3 多媒体信息处理的关键技术1.多媒体数据压缩/解压缩技术多媒体数据压缩技术是多媒体技术中的核心技术。
随着多媒体技术在计算机以及网络中的广泛应用,多媒体信息中的图像、视频、音频信号都必须进行数字化处理,才能应用到计算机和网络上。
但是这些多媒体信息数字化后的数据量非常庞大,给多媒体信息的存储、传输、处理带来了极大的压力。
因此,必须对数据进行压缩编码。
2.多媒体数据存储技术如何实现多媒体大容量信息的存储是多媒体技术的关键。
目前海量存储设备有磁带机、光盘机、硬盘机、存储卡等。
3.多媒体专用芯片技术专用芯片是多媒体计算机硬件的关键器件。
为了实现音频、视频信号的快速压缩、解压缩和播放处理,需要大量的快速计算,而且图像的绘制、生成、合并、特殊效果等处理也需要大量的计算。
多媒体计算机专用芯片可归纳为两种类型:一种是固定功能的芯片;另一种是可编程的数字信号处理器(DSP)芯片。
专用芯片可用于多媒体信息的综合处理,如图像的特效、图形的生成和绘制、提高音频信号处理速度等。
7.1.4 多媒体计算机系统的构成1. 多媒体计算机系统多媒体计算机系统是指能综合处理多媒体信息,使信息之间能建立联系,并具有交互性的完整的计算机系统。
多媒体计算机与其他具有声音、影像播放功能的电视机、录像机等家用电器的根本区别在于多媒体计算机具有信息集成、交互等特有的功能。
多媒体计算机系统一般由多媒体硬件系统和多媒体软件系统组成。
按照MPC的标准,多媒体计算机包含5个基本单元:主机、CD-ROM驱动器、声卡、音箱和Windows操作系统。
MPC4要求在普通微机的基础上增加以下四类软、硬件设备,以便将PC机升级成MPC。
2.多媒体计算机的硬件系统从处理的流程来看,一个功能较齐全的多媒体计算机系统包括输入设备、计算机主机、输出设备、存储设备几个部分(见图7.1)。
除了普通PC的部件之外,多媒体计算机最基本的硬件是音频卡(Audio Card,简称声卡)、CD-ROM和视频卡(Video Card)3.多媒体计算机的软件系统多媒体软件系统按功能可分为系统软件和应用软件。
第6讲-多媒体数据压缩编码方法

0
1
A 0
0 1 C
1 0 D 1 E
B
这幅图像的熵为: H(S)=(15/39) log2(39/15) + (7/39)log2(39/7) + (7/39)log2(39/7) + (6/39)log2(39/6) +(5/39)log2(39/5) = 2.1859 这说明每个符号可用2.1859位表示,39个象素需用85.25位。 编码中以N表示编码器输出码字的平均码长,用熵值衡量是 否最佳编码,即:当N>>H(S)有冗余,不是最佳;N< H(S),不 可能;N≈H(S)(N稍大于H(S)),是最佳编码。
S=(A,B,C,D,E) 符号 出现的次数(Pi) A 15(0.3846) B 7(0.1795) C 6(0.1538) D 6(0.1538) E 5(0.1282)
log2(1/pi) 1.38 2.48 2.70 2.70 2.96
分配的代码 需要位数 0 15 100 21 101 18 110 18 111 15
• 离散信源
S1, S2 , ..., Sn X p(S ), p(S ), ..., p(S ), 2 n 1
p ( Si ) 1
i 1
n
• 图像的信息熵
H ( X ) p( Si ) I ( Si ) p( Si ) log 2 p( Si ) 1
第6讲 多媒体数据压缩 和信息编码
内 容 提 要
多媒体数据压缩基本特征和方法
图像统计特性
无损数据压缩编码方法 有损数据压缩编码方法
多媒体数据压缩基本特征和方法
1.数据压缩的处理过程:
编码过程:对原始数据进行压缩,便于存储和传输。 解码过程:对压缩数据进行解压,恢复成可用数据。
多媒体数据压缩技术浅析

多煤体数据压缩技术浅析
李国彬 张艳丽 (坟宁工程技术大学职业技术学院 辽宁阜新
, ) 23000
摘 要: 随着多媒体技术的不断发展, 计算机领域的信息可以用文字、声音、图象等多种媒体来表示。但在诸多媒体中, 记录图象 信息所需的数据量尤为庞大, 要求数据传输率也很高。 如果不对数据进行有效的压缩就难以得到实际的应用。本文主要对多媒体信息 中声音、图像方面的压缩技术进行了讨论。 关键词: 多媒体 数据压缩 压缩方法 数字化 中图分类号: T P 3 7 文献标识码: A 文章编号: 1672一 3791(2007)04(b 卜0011一 01 作为信息社会进步的标志, 办公自 动化已 成为当前国际上飞速发展的一门综合电子、 通信、文秘和行政等多学科和技术的新兴学 科。而数据压缩技术作为多媒体技术的关键 技术之一, 在处理企业办公自 动化系 统中 的声 音、视频等多媒体信息中发挥着重要作用。 由于数字化的多媒体信息尤其是数字视频、 音频信号的数据量特别庞大, 如果不对其进行 有效的压缩就难以得到实际的应用。因此, 数 据压缩技术已成为当今数字通信、广播、存
(2 非均匀脉冲编码调制, ) 可分为林 律压缩
于对声音或者图 像所表达的意思产生误解, 但 1 数据压缩 简介 可大大提高压缩比。 数据压缩技术就是通过减少计算机中 所存 1. 3 评价数 据压缩的 标准 储数据或者通信传播中 数据的冗余度, 达到增 从实际应用来说, 数据压缩可从两方面来 大数据密度, 最终使数据的存储空间 减少的技 衡量: 数据压缩速度和数据压缩率。当 数据压 术。数据压缩在文件存储和分布式系统领域 缩应用干网络传输时, 主要考虑速度快慢。当 有着十分广泛的应用。数据压缩也代表着尺 数据压缩应用于数据存储中, 主要考虑压缩率, 寸煤介容量的增大和网 络带宽的扩展。数据 即压缩后数据的大小。当然这两方面是相辅相 压缩就是将字符串的一种表示方式转换为另一 成的。常用的评价标准有冗余度、 平均源信息 种表示方式, 新的表示方式包含相同的 信息量, 长度、压缩率等。对干一种编码方 式是否为 较 但是长度比原来的方式尽可能的短。 好的编码, 主要看该编码的冗余度是否最小。 , 数 缩与编码 .1 据压
多媒体数据压缩基本原理

2.数据压缩的可能性
这是一张800*600像素24位的位图: 800*600*24/8/1024/1024=1.37MB 一个结构的体积是:100*100*24/8/1024/1024=0.02MB 这就是压缩过程中常见的冗余
3.数据冗余
● 冗余基本概念 冗余 —— 信息所具有的各种性质中多余的无用空间 冗余度 —— 多余的无用空间的程度
● 冗余分类
信息中数据冗余的现象比较普遍,数据冗余的种类 也不尽相同。
3.数据冗余
结构冗余
数字图像中具有规则 纹理的表面、大面积相互 重叠的相同图案、规则有 序排列的图形等结构都存 在数据冗余。
3.数据冗余
空间冗余 规则物体的表面具有
物理相关性,将其表面数 字化后表现为数据冗余。
3.数据冗余
多媒体数据压缩基本原理
1.为什么要进行数据压缩?
一张800万像素色彩位数为24位的位图的体积?
8000000*24/8/1024/1024=22.8MB
思考一个问题?
16GB的手机全部用来放图像,可以放多少张?
16*1024/22.8=718张
压缩
数据压的目的是在传送和处理信息时,尽量减少数据量。
224色
28色
视觉冗余
人的视觉敏感度有一 定限度,图像色彩、亮度、 层次、轮廓的微小变化一 般不容易察觉,这就产生 了视觉冗余。
编码冗余、知识冗余、 时间冗余等
4.数据压缩是怎么实现的?
• 编码 • 词典编码的想法是企图查找正在压缩的字符序
列是否在以前输入的数据中出现过,然后用已 经出现过的字符串替代重复的部分,它的输出 仅仅是指向早期出现过的字符串的“指针”。
编码是解决数据存储与传送问题的钥匙。
多媒体数据压缩基本原理
数据冗余的类别
1 空间冗余
这是图像数据中经常存在的 一种冗余。在同一幅图像中, 规则物体和规则背景的表面 物理特性具有相关性,这些 相关的光成像结构在数字化 图像中就表现为数据冗余。
多媒体技术与应用
多媒体数据压缩基本原理 1.1 多媒体数据压缩的必要性和可能性 1.2 数据冗余的基本概念与种类 1.3 图像压缩预处理技术 1.4 量化及其质量 1.5 数据压缩算法综合评价指标
1.1 多媒体数据压缩的必要性和可能性
数据压缩的必要性——数据量大
多媒体信息数据巨大是多媒体计算机系统所面 临的最大难题之一。在各种媒体信息中,视频信息数 据量最大,其次是音频信号,因此,为了处理和传输 多媒体信息不仅需要很大的存储容量,而且要有很高 的传输速度.
标量量化的量化特性采用阶梯形函数的 形式。图2.2给出了几种均匀量化器的量化特 性
y
yi+1
yi
xi xi+1
x
y x
y x
(a)中平型
(b)中升型
死区 (c)具有死区的中平型
图2.2 均匀量化特性
图中量化器的特性都是对称的,且
yi1 yi xi1 xi
(i 1,2,, N 1) (i 1,2,, N 1)
6 知识冗余
由图像记录方式与人对图像的知识之 间的差异所产生的冗余称为知识冗余。 例如 人脸的图像就有固定的结构,鼻子位于脸的
中线上,上方是眼睛,下方是嘴等
又如 建筑物的门和窗的形状、位置、大小比例 等,这些规律的结构可由先验知识和背景知识得到。
常用的多媒体信息压缩标准
常用的多媒体信息压缩标准多媒体信息压缩标准可以说是当今信息时代的重要技术之一,它已经成为存储和传输信息的重要手段之一。
以下是一些常用的多媒体信息压缩标准:一、JPEG/JFIF(Joint Photographic Experts Group,联合图像专家组)JPEG,JFIF是一种多用途的压缩图像标准,主要用于储存、传送、显示静止图像,比如网络上的照片,或者是文档里的图片。
它通过将图像分成多个“分量”,并压缩每个分量,以达到高压缩比的目的,具有容量小、压缩效率高的优势。
二、MPEG(Moving Picture Experts Group,移动图像专家组)MPEG是一种多媒体信息的有损压缩标准,主要用于储存、传送、显示流式多媒体数据,比如摄像机拍摄的电影和视频、电视节目、CD、DVD等。
它通过重构可用的信息,运用时域、频域的基本信号处理原理,将时变的信号转化为静态的信号,从而达到小体积大容量的目的。
三、MP3(MPEG 1 Audio Layer 3)MP3是一种音频压缩和解压缩标准,也是目前最流行的音频压缩编码格式。
主要用于电脑音频压缩、传输,支持从大到小的编码,可以让大的算法文件快速压缩成可以存储的规模。
MP3的压缩比率可以达到接近90%,它能够将大型音频文件压缩至原来的10%,同样保持良好的声音质量。
四、AAC(Advanced Audio Coding)AAC是一种无损和有损数字音频压缩编码标准,由MPEG建立。
它是基于MPEG2标准,保留了MPEG-1的声音质量,同时拥有更低的流量和码率,并保留原始音乐原样,特别适合多媒体应用程序,最好的兼容性,可以支持多种格式,包括球形、块形、和总线形。
五、ASF(Advanced Systems Format)ASF是一种微软研发的媒体封装格式,用于存储多媒体数据,主要用来封装文本、视频以及其他的数据流,而且它不依赖于特定的流格式,可以支持的流格式类型丰富,可以容纳不同的文件类型,内容几乎不受损坏。
多媒体数据压缩
多媒体数据压缩多媒体数据压缩1. 介绍多媒体数据压缩是一种广泛应用于图片、音频和视频等多媒体文件的技术。
由于多媒体文件通常包含大量的数据,压缩技术能够减小文件的存储空间和传输带宽要求,提高数据的传输速率和存储效率。
本文将介绍多媒体数据压缩的原理和常用的压缩算法。
2. 图片压缩2.1 无损压缩无损压缩是指在压缩过程中不丢失任何原始数据的压缩方法。
其中最常用的无损压缩算法是GIF和PNG格式。
GIF格式通过限制颜色数量和使用LZW编码来实现数据压缩,而PNG格式则使用DEFLATE算法对图片数据进行压缩。
2.2 有损压缩有损压缩是指在压缩过程中会有一定的信息丢失的压缩方法。
最常用的有损压缩算法是JPEG格式。
JPEG格式通过使用离散余弦变换(DCT)将图像从时域转换到频域,并通过量化和哈夫曼编码来减小数据量。
压缩的程度可以通过调整量化表的精度来控制。
3. 音频压缩3.1 无损压缩无损压缩在音频领域并不常见,因为音频文件通常比较大,无损压缩往往无法达到很高的压缩比。
其中一个常用的无损压缩算法是FLAC格式。
FLAC格式通过使用线性预测和残差编码来减小数据的大小,保持音频的质量不变。
3.2 有损压缩有损压缩在音频领域非常常见,因为人耳对音频的感知有一定的容忍度。
最常用的有损压缩算法是MP3格式。
MP3格式通过使用MDCT变换将音频从时域转换到频域,并通过子带编码和声学模型来减小数据量。
压缩的程度可以通过调整比特率来控制。
4. 视频压缩4.1 无损压缩无损压缩在视频领域并不常见,因为视频文件通常非常大,无损压缩往往无法达到很高的压缩比。
其中一个常用的无损压缩算法是HuffYUV格式。
HuffYUV格式通过使用无损哈夫曼编码来减小数据的大小,保持视频的质量不变。
4.2 有损压缩有损压缩在视频领域非常常见,因为视频的冗余性很高,有很多可以被压缩的信息。
最常用的有损压缩算法是H.264和HEVC格式。
H.264和HEVC格式通过使用运动估计和帧间预测等技术来减小数据量。
多媒体信息处理与压缩技术研究
多媒体信息处理与压缩技术研究随着科技的发展,多媒体技术的应用越来越广泛。
多媒体信息处理与压缩技术是在传输和存储大量多媒体数据时必不可少的一项技术。
本文将重点讨论多媒体信息处理与压缩技术的研究现状、应用领域以及未来发展趋势。
多媒体信息处理是指对多媒体数据进行分析、处理和提取特征的过程。
多媒体数据通常包括图像、音频、视频等各种形式,这些数据特点不仅包括其本身的内容,还包括数据的空间、时间和频域特性。
多媒体信息处理需要借助计算机技术和算法,对多媒体数据进行分析、编码和解码,以实现数据的存储、传输和展示。
多媒体信息处理的关键技术之一是压缩技术。
在存储和传输大量的多媒体数据时,压缩技术可以有效地减少数据的存储空间和传输带宽。
常见的多媒体数据压缩技术有无损压缩和有损压缩两种。
无损压缩技术通过对数据的编码和解码过程进行优化,以保证压缩后的数据与原始数据完全一致。
而有损压缩技术则在压缩过程中丢弃部分不重要的数据,以牺牲一定的数据质量换取更高的压缩比率。
多媒体信息处理与压缩技术在许多领域有重要的应用。
在互联网和移动通信领域,大量的多媒体数据需要进行传输和展示,如音视频文件、图片等。
压缩技术可以有效减少数据的传输时间和带宽占用,提高用户体验。
在医学影像领域,多媒体信息处理可以辅助医生对病情进行诊断和治疗,如CT扫描、MRI等。
在娱乐产业中,多媒体信息处理可以用于制作音视频剪辑、特效处理等,提升作品的质量和观赏性。
当前,多媒体信息处理与压缩技术仍面临许多挑战和未解决的问题。
首先,随着高清晰度、超高清晰度和全景视频等新媒体格式的快速发展,如何实现更高效的压缩和传输,是一个迫切需要解决的问题。
其次,多媒体信息处理技术的算法优化和硬件设备的升级,也是当前需要关注和努力解决的问题。
此外,随着互联网的普及和网络带宽的提高,如何更好地保护多媒体数据的安全和隐私,也是多媒体信息处理与压缩技术研究亟需关注的问题。
未来,多媒体信息处理与压缩技术的发展趋势将主要体现在以下几个方面。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1) 将给定符号按照其频率从大到小排序。对上面的例子,应该得到:
a - 16 b-7 c-6 d-6 e-5 2) 将序列分成上下两部分,使得上部频率总和尽可能接近下部频率总和。我们有:
a - 16 b-7 ----------------c-6 d-6 e-5 3) 我们把第二步中划分出的上部作为二叉树的左子树,记 0,下部作为二叉树的右子树,记 1。 4) 分别对左右子树重复 2 3 两步,直到所有的符号都成为二叉树的树叶为止。现在我们有如下的二 叉树: 根(root) 0 | 1 +------+------+ 0 | 1 0 | 1 +-----+-----+ +---+----+ | | | | a b c | 0 | 1 +-----+-----+ | | d e
(4)、LZW编码 LZW(Lempel-Ziv-Welch)压缩使用 字典库查找方案。它读入待压缩的数据 并与一个字典库(库开始是空的)中的字 符串对比,如有匹配的字符串,则输出 该字符串数据在字典库中的位置索引, 否则将该字符串插入字典中。 许多商品压缩软件如ARJ、PKZIR、 ZOO、LHA等都采用了设方法。 另外,.GIF 和.TIF 格式的图形 文件也是按这一文件存储的。
1.5.2 数据压缩方法
压缩处理一般是由两个过程组成: 一是编码过程,即将原始数据经过编码 进行压缩,以便存储与传输;二是解码 过程,此过程对编码数据进行解码,还 原为可以使用的数据。 数据压缩可分为两种类型:一种叫 做无损压缩,另一种叫做有损压缩。 无损压缩 有损压缩 混合压缩
什么是熵
数据压缩不仅起源于 40 年代由 Claude Shannon 首创的信息论,而且其基本原理即信息究竟能被压缩 到多小,至今依然遵循信息论中的一条定理,这条定 理借用了热力学中的名词“熵”( Entropy )来表示一条 信息中真正需要编码的信息量: 考虑用 0 和 1 组成的二进制数码为含有 n 个符号的某 条信息编码,假设符号 Fn 在整条信息中重复出现的概 率为 Pn,则该符号的熵也即表示该符号所需的位数位 为: En = - log2( Pn )整条信息的熵也即表示整条信息所需 的位数为:E = ∑En
编码 通过模型,我们已经确定了对某一个符号该用多少位 二进制数进行编码。现在的问题是,如何设计一种编 码方案,使其尽量精确地用模型计算出来的位数表示 某个符号。 最先被考虑的问题是,如果对 a 用 3 个二进制位就可 以表示,而对 b 用 4 个二进制位就可以表示,那么, 在解码时,面对一连串的二进制流,我怎么知道哪三 个位是 a,哪四个位是 b 呢?所以,必须设计出一种编 码方式,使得解码程序可以方便地分离每个字符的编 码部分。于是有了一种叫“前缀编码”的技术。该技 术的主导思想是,任何一个字符的编码,都不是另一 个字符编码的前缀。反过来说就是,任何一个字符的 编码,都不是由另一个字符的编码加上若干位 0 或 1 组成。看一下前缀编码的一个最简单的例子
真正的压缩程序中使用的大多是一种叫“自适应模 型”的东西。自适应模型可以说是一台具有学习功能 的自动机。他在信息被输入之前对信息内容一无所知 并假定每个字符的出现概率均等,随着字符不断被输 入和编码,他统计并纪录已经出现过的字符的概率并 将这些概率应用于对后续字符的编码。也就是说,自 适应模型在压缩开始时压缩效果并不理想,但随着压 缩的进行,他会越来越接近字符概率的准确值,并达 到理想的压缩效果。自适应模型还可以适应输入信息 中字符分布的突然变化,可以适应不同的文件中的字 符分布而不需要保存概率表。
空间冗余
一幅图像表面上各采样点的颜色之 间往往存在着空间连贯性,基于离散像 素采样来表示物体表面颜色的像素存储 方式可利用空间连贯性,达到减少数据 量的目的。 例如,在静态图像中有一块表面颜 色均匀的区域,在此区域中所有点的光 强和色彩以及饱和度都是相同的,因此 数据有很大的空间冗余。
时间冗余
运动图像一般为位于一时间轴区间 的一组连续画面,其中的相邻帧往往包 含相同的背景和移动物体,只不过移动 物体所在的空间位置略有不同,所以后 一帧的数据与前一帧的数据有许多共同 的地方,这种共同性是由于相邻帧记录 了相邻时刻的同一场景画面,所以称为 时间冗余。 同理,语音数据中也存在着时间冗 余。
(1)、行程编码(RLE) RLE 编码是将数据流中连续出现的 字符用单一记号表示。 例如,字符串AAABCDDDDDDDDBBBBB 可以压缩为3ABC8D5B 。 RLE编码简单直观,编码/解码速度 快,因此许多图形和视频文件,如.BMP .TIFF及AVI等格式文件的压缩均采用此 方法.
(3)、算术编码 其方法是将被编码的信源消息表示 成实数轴0-1之间的一个间隔,消息越 长,编码表示它的间隔就越小,表示这 一间隔所需的二进制位数就越多。 该方法实现较为复杂,常与其它有 损压缩结合使用,并在图像数据压缩标 准(如JPEG)中扮演重要角色。
举个例子,对下面这条只出现了 a b c 三个字符的字符 串: aabbaccbaa 字符串长度为 10,字符 a b c 分别出现了 5 3 2 次, 则 a b c 在信息中出现的概率分别为 0.5 0.3 0.2,他 们的熵分别为: Ea = -log2(0.5) = 1Eb = -log2(0.3) = 1.737Ec = log2(0.2) = 2.322整条信息的熵也即表达整个字符串需 要的位数为: E = Ea * 5 + Eb * 3 + Ec * 2 = 14.855 位回想一下如果 用计算机中常用的 ASCII 编码,表示上面的字符串我 们需要整整 80 位呢!现在知道信息为什么能被压缩而 不丢失原有的信息内容了吧。简单地讲,用较少的位 数表示较频繁出现的符号,这就是数据压缩的基本准 则。
a-0
b - 100
c - 101
d - 110
e - 111
对例子中信息的编码为: cabcedeacacdeddaaabaababaaabbacdebaceada101 0 100 101 111 110 111 0 101 0 101 ...... 码长共 88 位。这比使用 Shannon-Fano 编码要更短一点。 让我们回顾一下熵的知识,使用我们在第二章学到的计算方法,上面的 例子中,每个字符的熵为: Ea = - log2(16 / 40) = 1.322 Eb = - log2( 7 / 40) = 2.515 Ec = - log2( 6 / 40) = 2.737 Ed = - log2( 6 / 40) = 2.737 Ee = - log2( 5 / 40) = 3.000 信息的熵为: 也就是说,表示该条信息最少需要 86.601 位。我们看到,Shannon-Fano 编码和 Huffman 编码都已经比较接近该信息的熵值了。
视觉冗余
人类的视觉系统对图像场的敏感度 是非均匀的。但是,在记录原始的图像 数据时,通常假定视觉系统近似线性的 和均匀的,对视觉敏感和不敏感的部分 同等对待,从而产生比理想编码(即把 视觉敏感和不敏感的部分区分开来的编 码)更多的数据,这就是视觉冗余。
数字压缩技术三个重要指标
1、信息存储量之比 2、压缩的算法 3、恢复效果 大 简单 好
A0 B 10 C 110 D 1110 E 11110 有了上面的码表,你一定可以轻松地从下面这串二进制流中分辨出真正 的信息内容了: 符号 编码 1110010101110110111100010 - DABBDCEAAB
无损压缩
无损压缩常用在原始数据的存档, 如文本数据、程序以及珍贵的图片和图 像等。 其原理是统计压缩数据中的冗余 (重复的数据)部分。常用的有: RLE (run length encoding)行程编码 Huffman 编码 算术编码 LZW (lempel-ziv-welch)编码
于是我们得到了此信息的编码表: a - 00 b - 01 c - 10 d - 110 e - 111 可以将例子中的信息编码为: cabcedeacacdeddaaabaababaaabbacdebaceada10 00 01 10 111 110 111 00 10 00 10 ...... 码长共 91 位。考虑用 ASCII 码表示上述信息需要 8 * 40 = 240 位,我们确 实实现了数据压缩
Shannon-Fano 编码 进入 Huffman 先生构造的神奇二叉树之前,我们先来 看一下它的前身,由 Claude Shannon 和 R.M.Fano 两 人提出的 Shannon-Fano 编码。 讨论之前,我们假定要编码字符的出现概率已经由某 一模型统计出来,例如,对下面这串出现了五种字符 的信息( 40 个字符长 ): cabcedeacacdeddaaabaababaaabbacdebaceada 五 种字符的出现次数分别:a - 16,b - 7,c - 6,d - 6, e - 5。 Shannon-Fano 编码的核心仍然是构造二叉树,构造的 方式非常简单:
根(root) 0 | | | 1 0 | 1 +------+----------------+ +---------+-----------+
|
a |
0
|
1
| | c
0|Leabharlann |1+-------+------+ b d
+-------+-------+ e
由此,我们可以建立和 Shannon-Fano 编码略微不同的编码表:
1.5 多媒体数据压缩技术
1.5.1 多媒体数据的冗余类型 1.5.2 数据压缩方法
1.5.3 视频编码的国际标准
1.5.1 多媒体数据的冗余类型
图像数据表示中存在着大量的冗 余,图像数据压缩技术就是利用图像 数据的冗余性来减少图像数据量的方 法。常见图像数据冗余类型如下: 1. 空间冗余 2. 时间冗余 3. 视觉冗余