多媒体图像压缩的技术
《多媒体技术》 第二讲 多媒体数据压缩技术(第1—2节)课堂笔记及练习题

多媒体技术第二讲多媒体数据压缩技术(第1—2节)课堂笔记及练习题主题:第二讲多媒体数据压缩技术(第1—2节)学习时间: 4月4日--4月10日内容:第二讲多媒体数据压缩技术第一节多媒体数据和信息转换一、多媒体间的信息转换为了便于交流信息,需要对不同的媒体信息进行转换。
下表是部分媒体之间说明:*易**较困难***很困难二、多媒体数据文件格式多媒体文件的格式很多,下表介绍常用文件格式的特点和应用场合。
三、多媒体数据的信息冗余多媒体计算机系统主要采用数字化方式,对声音、文字、图形、图像、视频等媒体进行处理。
数字化处理的主要问题是巨大的数据量。
一般来说,多媒体数据中存在以下种类的数据冗余:1)空间冗余:一些相关性的成像结构在数字化图像中就表现为空间冗余。
2)时间冗余:两幅相邻的图像之间有较大的相关性,这反映为时间冗余。
3)信息熵冗余(编码冗余):信息熵是指一组数据所携带的信息量。
如果图像中平均每个像素使用的比特数大于该图像的信息熵,则图像中存在冗余,这种冗余称为信息熵冗余。
4)结构冗余:有些图像从大域上看存在着非常强的纹理结构,例如布纹图像和草席图像,我们说它们在结构上存在冗余。
5)知识冗余:有许多图像的理解与某些基础知识有较大的相关性。
这类规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。
6)视觉冗余:人类视觉系统对于图像场的任何变化,并不是都能感知的。
这类冗余我们称为视觉冗余。
7)其他冗余:例如由图像的空间非定常特性所带来的冗余。
以上所讲的是多媒体数据的信息冗余。
设法去掉信号数据中的冗余,就是数据压缩。
第二节常用的数据压缩技术一、数据压缩编码方法1)根据解码后数据与原始数据是否完全一致来进行分类:① 可逆编码(无失真编码),如Huffman编码、算术编码、行程长度编码等。
② 不可逆编码(有失真编码),常用的有变换编码和预测编码。
2)根据压缩的原理进行划分:① 预测编码:它是利用空间中相邻数据的相关性,利用过去和现在出现过的点的数据情况来预测未来点的数据。
多媒体数据常用压缩标准

MPEG(Motion Picture Experts Group )标准是ISO/IEC委员会针对全活动视频 的压缩标准系列,包含MPEG-1、MPEG-2 、MPEG-4、MPEG-7、MPEG-21等。
MPEG-1:适用于传输速率为1.5Mbps的数字电视标
准,91年提出草案,93年8月公布
JPEG确定的图像压缩标准的目标是:
编码器应该可由用户设置参数,以便用 户在压缩比和图像质量之间权衡折衷
标准可适用任意类连续色调的数字静止 图像,不限制图像的景像内容
计算复杂度适中,只需一定能力的CPU 就可实现,而不要求很高档的计算机,复 杂的软件本身要易于操作
定义了两种基本压缩编码算法和4种编码 模式
MPEG-2:适用于传输速率为10Mbps 的数字电视标
准,93年提出草案,94年11月公布
MPEG-3:适用于传输速率为40Mbps 的数 字电视标
准,已被MPEG-2取代
MPEG-4:1999年12月公布的多媒体应用标准
MPEG-7:多媒体内容描述接口标准,98年提出,2001
年完成并公布
MPEG-21:正式名称是Multimedia Framework(多媒体
终形成清晰的图像。
下面是顺序模式和渐进模式的示意图
顺序模式 渐进模式
无失真编码模式 采用一维或二维的空间域
DPCM和熵编码。由于输入图像已经是数字化 的,经过空间域的DPCM之后,预测误差值也 是一个离散量,因此可以不再量化而实现无失 真编码。
分层编码模式 这是对一幅原始图像的空间
分辨率,分成多个分辨率进行“锥形”的编码方 法,水平(垂直)方向分辨率的下降 以2的倍数因子改变,先对分辨率最 低的一层图像进行编码,然后将经 过内插的该层图像作为下一层图像 的预测值,再对预测误差进行编码,
多媒体压缩技术

多媒体压缩技术在当今数字化的时代,多媒体信息如音频、视频、图像等在我们的生活中无处不在。
从在线视频播放到手机中的照片存储,从远程会议到虚拟现实体验,多媒体数据的生成和传播呈爆炸式增长。
然而,大量的多媒体数据需要占用巨大的存储空间和传输带宽,这给存储设备和网络带来了沉重的负担。
为了解决这个问题,多媒体压缩技术应运而生,它就像是一位神奇的魔法师,能够在不损失太多质量的前提下,将庞大的多媒体数据变得小巧玲珑。
多媒体压缩技术的基本原理其实并不复杂,就像是我们收拾行李时把衣物尽可能紧凑地叠放起来,以节省空间。
在多媒体世界里,数据也可以通过各种巧妙的方式被“压缩”。
首先,让我们来谈谈图像压缩。
图像是由一个个像素点组成的,每个像素点都包含了颜色和亮度等信息。
在图像压缩中,有一种常见的方法叫做无损压缩。
无损压缩就像是把一个拼图完整地放进一个小盒子里,虽然盒子变小了,但拼图的每一块都还在,没有任何缺失。
比如说,行程编码就是一种无损压缩方法。
它通过记录相同像素值连续出现的次数来减少数据量。
假设一幅图像中有一大片蓝色区域,使用行程编码就可以只记录“蓝色,连续出现 100 个像素”,而不是逐个记录每个蓝色像素的信息。
除了无损压缩,还有有损压缩。
有损压缩就像是为了把更多的衣服塞进箱子,稍微牺牲一些不太重要的衣物。
在图像有损压缩中,JPEG格式是非常常见的。
它会根据人眼对颜色和细节的敏感度,去除一些不太容易被察觉的信息。
比如,人眼对亮度的变化比较敏感,但对颜色的细微差别不那么敏感,JPEG 压缩就会更多地保留亮度信息,而对颜色信息进行较大程度的压缩。
接下来是视频压缩。
视频本质上是一系列快速播放的图像帧。
视频压缩不仅要考虑每一帧图像的压缩,还要利用帧与帧之间的相似性。
比如,在一段视频中,如果背景几乎不变,只有人物在移动,那么就不需要对每一帧的背景都进行完整的记录,只需要记录第一帧的背景,后续帧只记录人物移动的变化部分。
这种方法被称为帧间压缩。
多媒体技术JPEG图像压缩标准

34
基于DPCM的无损编码模式
主要采用了三邻域二维预测编码和熵编码
无失真编码器
预测器
熵编码器
源图像数据 表说明 DPCM预测编码框图
压缩的图像数据
35
基于DPCM的无损编码模式
主要采用了三邻域二维预测编码和熵编码
减去预测值,得到一个差值,差值不量化,直接进行熵 编码(哈夫曼或者算术编码) 保证无失真地恢复原始 图像
选择值 预测 0 1 2 3 选择值 预测 a+b-c a+(bc)/2 b+(ac)/2 (a+c)/2
c a
b X
非预测 4 a 5 b c 6 7
36
基于DCT的渐进的编码模式
基本思想
此模式与顺序模式编码步骤基本一致,不同之处在 于递增模式每个图像分量的编码要经过多次扫描才 完成。第一次扫描只进行一次粗糙的压缩,然后根 据此数据先重建一幅质量低的图像,以后的扫描再 作较细的扫描,使重建图像质量不断提高,直到满 意为止
离散余弦变换(DCT)
1 Y00 = N
邋
N- 1 N- 1
X ij
i= 0 i= 0
DC 系数
12
基于DCT的顺序编码模式
缺省的量化方式
Y Q ( x, y) = IntegerRound[Y ( x, y) / Q( x, y)]
13
基于DCT的顺序编码模式
缺省的量化方式
Y Q ( x, 根据心理视觉加权函数得到的 量化表: y) = IntegerRound[Y ( x, y) / Q( x, y)] 量化:DCT变换系数除以量化步长,四舍五入取整
颜色空间转换不包含在JPEG算法中
浅淡多媒体的压缩技术

浅淡多媒体的压缩技术媒体是人与人之间实现信息交流的中介,也就是信息的载体,简称媒介。
多媒体就是多重媒体的意思,可以理解为直接作用于人感官的文字、图形、图像、动画、声音和视频等各种媒体的统称,即多种信息载体的表现形式和传递方式。
课本上它的定义是融合两种或两种以上媒体的人-机交互式信息交流和传播媒体。
本文将详细介绍多媒体的压缩和编码。
多媒体数据之所以能够压缩,是因为视频、图像、声音这些媒体具有很大的压缩力。
以目前常用的位图格式的图像存储方式为例,在这种形式的图像数据中,像素与像素之间无论在行方向还是在列方向都具有很大的相关性,因而整体上数据的冗余度很大;在允许一定限度失真的前提下,能对图像数据进行很大程度的压缩。
1.多媒体技术的社会需求社会需求是促进多媒体技术产生和发展的重要因素。
可以说,包括计算机本身在内,一切科学技术的发展都离不开社会需求这一重要条件。
社会需求随着人类文明的发展而不断增长,刺激着各个领域中的科学技术不断地进步和发展。
早在20世纪80年代初期,人们开始不满足于计算机对文字进行单一形式的处理和进行数学运算,希望计算机能做更多的事情,要求计算机在多领域、多学科处理多种信息。
这种越来越迫切的需求,造就了一门全新的技术—多媒体技术。
1.1图形和图像处理的需求图形和图像是人们辨别事物最直接和最形象的形式,很多难以理解和描述的问题用图形或图像表示,就能或得一目了然的效果。
1.2大容量数据存储的需要随着计算机处理范围的扩大,被处理的媒体种类不断增加,信息量加大,如何保存和处理大量的信息,成为多媒体技术需要解决的有一个问题。
1.3音频信号和视频信号处理的需求使用计算机处理并重放音频信号和视频信号,是人们对计算机技术提出的新要求。
计算机与使用者之间的操作层面叫做界面,它是计算机与人类沟通的重要渠道。
1.4信息交换的需求在现代社会中,信息是至关重要的。
为了满足人们对信息流动和交换的渴求,计算机被连接在一起,形成网络,互相之间进行信息传递和交换。
图像压缩毕业论文

图像压缩毕业论文图像压缩毕业论文图像压缩作为计算机图形学中的重要研究方向,在现代社会中具有广泛的应用。
本篇毕业论文旨在探讨图像压缩的原理、方法和应用,并对其在实际应用中的优缺点进行分析和比较。
一、图像压缩的原理图像压缩是通过减少图像数据的冗余性来减小图像文件的大小,从而实现存储和传输的效率提升。
其原理主要包括两个方面:无损压缩和有损压缩。
1. 无损压缩:无损压缩是指在压缩过程中不丢失任何图像信息,即压缩后的图像与原始图像完全一致。
常见的无损压缩算法有Run Length Encoding (RLE)、Lempel-Ziv-Welch (LZW) 等。
无损压缩适用于对图像质量要求较高的场景,如医学图像、卫星图像等。
2. 有损压缩:有损压缩是指在压缩过程中会有一定的信息丢失,但在人眼感知上不明显。
有损压缩可以通过去除图像中的冗余信息、降低色彩精度等方式来实现。
常见的有损压缩算法有JPEG、GIF等。
有损压缩适用于对图像质量要求相对较低的场景,如网页图片、社交媒体图片等。
二、图像压缩的方法图像压缩的方法主要包括基于变换的压缩方法和基于预测的压缩方法。
1. 基于变换的压缩方法:基于变换的压缩方法是将图像转换到另一个表示域,通过对表示域的系数进行编码来实现压缩。
其中最常用的方法是离散余弦变换(Discrete Cosine Transform,DCT)。
DCT将图像从空间域转换到频率域,通过保留重要的低频系数,去除高频噪声,从而实现图像压缩。
2. 基于预测的压缩方法:基于预测的压缩方法是通过对图像的像素进行预测来减小冗余信息。
其中最常用的方法是差分编码(Differential Coding)和运动补偿(Motion Compensation)。
差分编码通过计算像素与其邻域像素之间的差异来进行编码,而运动补偿则是利用图像序列中的运动信息来进行编码,从而实现图像压缩。
三、图像压缩的应用图像压缩在现代社会中有着广泛的应用,涉及到许多领域。
多媒体数据压缩编码技术概述

多媒体数据压缩编码技术概述多媒体数据压缩编码技术是一种通过减少或去除冗余数据来减小多媒体文件的存储空间或传输带宽的过程。
这些技术广泛应用于图像、音频和视频等各种形式的多媒体数据。
下面将对多媒体数据压缩编码技术的主要方法进行概述。
1. 无损压缩编码:无损压缩编码技术可以将多媒体数据压缩到较小的大小,而不会丢失原始数据。
该技术通过利用多媒体数据中的冗余和统计特性来实现压缩效果。
其中,哈夫曼编码、算术编码和Lempel-Ziv编码等是常用的无损压缩编码方法。
2. 有损压缩编码:有损压缩编码技术可以在一定程度上丢失原始数据,并将其转换为较小的文件大小。
这种压缩方法适用于某些多媒体数据,如音频和视频等,因为人类的感知系统对这些数据中的一些细微变化不太敏感。
有损压缩编码方法包括离散余弦变换(DCT)、小波变换、运动补偿和预测编码等。
3. 基于上下文的压缩编码:这种压缩编码技术利用多媒体数据内部的上下文信息来实现更高的压缩效果。
上下文信息包括像素点的位置、颜色和周围像素点的关系等。
基于上下文的编码方法有助于提高压缩比,并减少信号的失真。
包括了一些流行的基于上下文的压缩编码算法,如JPEG(图像)、MP3(音频)和H.264/AVC(视频)。
4. 神经网络压缩编码:近年来,神经网络技术在多媒体数据压缩编码领域取得了显著的进展。
这些技术利用深度学习的方法来学习多媒体数据中的复杂模式,并使用这些模式进行压缩编码。
神经网络压缩编码方法通常能够在保持较高视觉和听觉质量的同时,实现更高的压缩比。
综上所述,多媒体数据压缩编码技术是一种通过减少或去除冗余数据来减小多媒体文件的存储空间或传输带宽的过程。
该技术涵盖了无损压缩编码、有损压缩编码、基于上下文的压缩编码和神经网络压缩编码等方法。
这些技术在多媒体数据领域发挥着重要的作用,帮助人们有效地处理和传输大量的多媒体数据。
5. 图像压缩编码技术:图像压缩编码技术是多媒体数据压缩编码中的一个重要领域。
多媒体数据压缩基本原理

数据冗余的类别
1 空间冗余
这是图像数据中经常存在的 一种冗余。在同一幅图像中, 规则物体和规则背景的表面 物理特性具有相关性,这些 相关的光成像结构在数字化 图像中就表现为数据冗余。
多媒体技术与应用
多媒体数据压缩基本原理 1.1 多媒体数据压缩的必要性和可能性 1.2 数据冗余的基本概念与种类 1.3 图像压缩预处理技术 1.4 量化及其质量 1.5 数据压缩算法综合评价指标
1.1 多媒体数据压缩的必要性和可能性
数据压缩的必要性——数据量大
多媒体信息数据巨大是多媒体计算机系统所面 临的最大难题之一。在各种媒体信息中,视频信息数 据量最大,其次是音频信号,因此,为了处理和传输 多媒体信息不仅需要很大的存储容量,而且要有很高 的传输速度.
标量量化的量化特性采用阶梯形函数的 形式。图2.2给出了几种均匀量化器的量化特 性
y
yi+1
yi
xi xi+1
x
y x
y x
(a)中平型
(b)中升型
死区 (c)具有死区的中平型
图2.2 均匀量化特性
图中量化器的特性都是对称的,且
yi1 yi xi1 xi
(i 1,2,, N 1) (i 1,2,, N 1)
6 知识冗余
由图像记录方式与人对图像的知识之 间的差异所产生的冗余称为知识冗余。 例如 人脸的图像就有固定的结构,鼻子位于脸的
中线上,上方是眼睛,下方是嘴等
又如 建筑物的门和窗的形状、位置、大小比例 等,这些规律的结构可由先验知识和背景知识得到。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• PEG利用了人眼的心理和生理特征及其局限性来
对彩色的、单色的和多灰度连续色调的、静态图 像的、数字图像的压缩,因此它非常适合不太复 杂的以及一般来源于真实景物的图像。它定义了 两种基本的压缩算法:一种是基于有失真的压缩 算法,另一种是基于空间线性预测技术(DPCM)无 失真的压缩算法。为了满足各种需要,它制定了 四种工作模式:无失真压缩、基于DCT的顺序工 作方式、累进工作方式和分层工作方式。
对数字图像进行压缩通常利用两个 基本原理
• (1) 数字图像的相关性。在图像的同一行相邻像素
之间、活动图像的相邻帧的对应像素之间往往存 在很强的相关性,去除或减少这些相关性,也就 去除或减少图像信息中的冗余度,即实现了对数 字图像的压缩。(2) 人的视觉心理特征。人的视觉 对于边缘急剧变化不敏感(视觉掩盖效应),对颜 色分辨力弱,利用这些特征可以在相应部分适当 降低编码精度,而使人从视觉上并不感觉到图像 质量的下降,从而达到对数字图像压缩的目的。
四、JPEG图像压缩算法
• 1..JPEG压缩过程
JPEG压缩分四个步骤实现: 1.颜色模式转换及采样; 2.DCT变换; 3.量 化; 4.编码。 2.1.颜色模式转换及采样 RGB色彩系统是我 们最常用的表示颜色的方式。JPEG采用的是 YCbCr色彩系统。想要用JPEG基本压缩法处理全 彩色图像,得先把RGB颜色模式图像数据,转换 为YCbCr颜色模式的数据。Y代表亮度,Cb和Cr则 代表色度、饱和度。通过下列计算公式可完成数 据转换。
• 通常数据压缩技术可分为无损压缩(又叫冗余压缩)和有损
压缩(又叫熵压缩)两大类。无损压缩就是把数据中的冗余 去掉或减少,但这些冗余量是可以重新插入到数据中的, 因而不会产生失真。该方法一般用于文本数据的压缩,它 可以保证完全地恢复原始数据;其缺点是压缩比小(其压 缩比一般为2:1至5:1)。有损压缩是对熵进行压缩,因 而存在一定程度的失真;它主要用于对声音、图像、动态 视频等数据进行压缩,压缩比较高(其压缩比一般高达20: 1以上。最新被称为“E—igen—ID”的压缩技术可将基因 数据压缩1.5亿倍)。对于多媒体图像采用的有损压缩的 标准有静态图像压缩标准(JPEG标准,即 ‘JointPhotographicExpertGroup’标准)和动态图像压缩标 准(MPEG标准,即‘MovingPictureExpertGroup’标准)。
编码压缩方法有许多种,从不同的 角度出发有不同的分类方法,比如 从信息论角度出发可分 为两大类:
• (1)冗余度压缩方法,也称无损压缩,信息保持编码或熵编码。具体讲
就是解码图像和压缩 编码前的图像严格相同,没有失真,从数学上讲 是一种可逆运算。(2)信息量压缩方法,也称有损压缩,失真度编码或 熵压缩编码。也就是讲解码图像和原始图像是有差别的,允许有一定 的失真。应用在多媒体中的图像压缩编码方法,从压缩编码算法原理 上可以分类为:(1)无损压缩编码种类 •哈夫曼编码 •算术编码 •行程编 码 •Lempel zev编码(2)有损压缩编码种类 •预测编码:DPCM,运动补 偿 •频率域方法:正文变换编码(如DCT),子带编码 •空间域方法:统 计分块编码 •模型方法:分形编码,模型基编码 •基于重要性:滤波, 子采样,比特分配,矢量量化(3)混合编码 •JBIG,H261,JPEG, MPEG等技术标准衡量一个压缩编码方法优劣的重要指标 (1)压缩比要 高,有几倍、几十倍,也有几百乃至几千倍; (2)压缩与解压缩要快, 算法要简单,硬件实现容易; (3)解压缩的图像质量要好。
• 当然,接收器必须能支持MIDI放音。与传
送合成的信号相比,分别传送独唱信号和 MIDI数据要节省大量的带宽。其它的节目 类型同样可以作类似的规定。MPEG一7标 准又叫多媒体内容描述接口标准。图像可 以用色彩、纹理、形状、运动等参数来描 述,MPEG一7标准是依靠众多的参数对图 像与声音实现分类,并对它们的数据库实 现查询。
• MPEG标准的发展经历了MPEG—I,MPEG一2、MPEG一4、
MPEG-7、MPEG一21等不同层次。在MPEG的不同标准中, 每—个标准都是建立在前面的标准之上的,并与前面的标 准向后的兼容。目前在图像压缩中,应用得较多的是 MPEG一4标准,MPEG-是在MPEG-2基础上作了很大的扩 充,主要目标是多媒体应用。在MPEG一2标准中,我们的 观念是单幅图像,而且包含了一幅图像的全部元素。在 MPEG一4标准下,我们的观念变为多图像元素,其中的 每—个多图像元素都是独立编码处理的。该标准包含了为 接收器所用的指令,告诉接收器如何构成最CT变换的全称是离散余弦变换(Discrete Cosine Transform),是指将一组光强数据转换成频率数据,以便得知强度变 化的情形。若对高频的数据做些修饰,再转回原来形式的数据时,显 然与原始数据有些差异,但是人类的眼睛却是不容易辨认出来。 压 缩时,将原始图像数据分成8*8数据单元矩阵,例如亮度值的第一个 矩阵内容如下: JPEG将整个亮度矩阵与色度Cb矩阵,饱和度Cr矩 阵,视为一个基本单元称作MCU。每个MCU所包含的矩阵数量不得超 过10个。例如,行和列采样的比例皆为4:2:2,则每个MCU将包含四 个亮度矩阵,一个色度矩阵及一个饱和度矩阵。 当图像数据分成一 个8*8矩阵后,还必须将每个数值减去128,然后一一代入DCT变换公 式中,即可达到DCT变换的目的。图像数据值必须减去128,是因为 DCT转换公式所接受的数字范围是在-128到+127之间。
• MPEG用于活动影像的压缩。MPEG标准具体包三部分内容:(1)MPEG
视频、(2)MPEG音频、(3)MP系统(视频和音频的同步)。MPEG视频是 标准的核心分,它采用了帧内和帧间相结合的压缩方法,以离散余变 换(DCT)和运动补偿两项技术为基础,在图像质量基不变的情况下, MPEG可把图像压缩至1/100或更MPEG音频压缩算法则是根据人耳屏 蔽滤波功能。利用音响心理学的基本原理,即“某些频率的音响在重 放其频率的音频时听不到”这样一个特性,将那些人耳完全不到或基 本上听到的多余音频信号压缩掉,最后使音频号的压缩比达到8:1或 更高,音质逼真,与CD唱片可媲美。按照MPEG标准,MPEG数据流 包含系统层和压层数据。系统层含有定时信号,图像和声音的同步、 多分配等信息。压缩层包含经压缩后的实际的图像和声数据,该数据 流将视频、音频信号复合及同步后,其数据输率为1.5MB/s。其中 压缩图像数据传输率为1.2M压缩声音传输率为0.2MB/s。
三、压缩原理
• 由于图像数据之间存在着一定的冗余,所以使得数据的压
缩成为可能。信息论的创始人Shannon提出把数据看作是 信息和冗余度(redundancy)的组合。所谓冗余度,是由 于一副图像的各像素之间存在着很大的相关性,可利用一 些编码的方法删去它们,从而达到减少冗余压缩数据的目 的。为了去掉数据中的冗余,常常要考虑信号源的统计特 性,或建立信号源的统计模型。图像的冗余包括以下几种: (1) 空间冗余:像素点之间的相关性。 (2) 时间冗余:活 动图像的两个连续帧之间的冗余。 (3) 信息熵冗余:单位 信息量大于其熵。 (4) 结构冗余:图像的区域上存在非常 强的纹理结构。 (5) 知识冗余:有固定的结构,如人的头 像。 (6) 视觉冗余:某些图像的失真是人眼不易觉察的。
二、多媒体数据压缩技术的实现方 法
• 目前多媒体压缩技术的实现方法已有近百种,其中基于信源理论编码
的压缩方法、离散余弦变换(DCT)和小波分解技术压缩算法的研究更 具有代表性。小波技术突破了传统压缩方法的局限性,引入了局部和 全局相关去冗余的新思想,具有较大的潜力,因此近几年来吸引了众 多的研究者。在小波压缩技术中,一幅图像可以被分解为若干个叫做 “小片”的区域;在每个小片中,图像经滤波后被分解成若干个低频 与高频分量。低频分量可以用不同的分辨率进行量化,即图像的低频 部分需要许多的二进制位,以改善图像重构时的信噪比。低频元素采 用精细量化,高频分量可以量化得比较粗糙,因为你不太容易看到变 化区域的噪声与误差。此外,碎片技术已经作为一种压缩方法被提出, 这种技术依靠实际图形的重复特性。用碎片技术压缩图像时需要占用 大量的计算机资源,但可以获得很好的结果。借助于从DNA序列研究 中发展出来的模式识别技术,能减少通过WAN链路的流量,最多时的 压缩比率能达到90%,从而为网络传送图像和声音提供更大的压缩比, 减轻风络负荷,更好地实现网络信息传播。
• Y=0.2990R+0.5870G+0.1140B
Cb=-0.1687R-0.3313G+0.5000B+128 Cr=0.5000R-0.4187G-0.0813B+128 人类的眼晴对低频的数据比对高频的数据具有更 高的敏感度,事实上,人类的眼睛对亮度的改变 也比对色彩的改变要敏感得多,也就是说Y成份的 数据是比较重要的。既然Cb成份和Cr成份的数据 比较相对不重要,就可以只取部分数据来处理。 以增加压缩的比例。JPEG通常有两种采样方式: YUV411和YUV422,它们所代表的意义是Y、Cb和 Cr三个成份的资料取样比例。
组合。早期的数据压缩之所以成为信息论的一部分是因为它涉及冗余度问题。 而数据之所以能够被压缩是因为其中存在各种各样的冗余;其中有时间冗余 性、空间冗余性、信息熵冗余、先验知识冗余、其它冗余等。时间冗余是语 音和序列图像中常见的冗余,运动图像中前后两帧间就存在很强的相关性, 利用帧间运动补兴就可以将图像数据的速率大大压缩。语音也是这样。尤其 是浊音段,在相当长的时间内(几到几十毫秒)语音信号都表现出很强的周期 性,可以利用线性预测的方法得到较高的压缩比。空间冗余是用来表示图像 数据中存在的某种空间上的规则性,如大面积的均匀背景中就有很大的空间 冗余性。信息熵冗余是指在信源的符号表示过程中由于未遵循信息论意义下 最优编码而造成的冗余性,这种冗余性可以通过熵编码来进行压缩,经常使 用的如Huff-man编码。先验知识冗余是指数据的理解与先验知识有相当大的 关系,如当收信方知道一个单词的前几个字母为administrato时,立刻就可以 猜到最后一个字母为r,那么在这种情况下,最后一个字母就不带任何信息量 了,这就是一种先验知识冗余。其它冗余是指那些主观无法感受到的信息等 带来的冗余。