图像压缩综述

图像压缩综述
图像压缩综述

图像压缩综述

摘要:随着信息时代的不断发展,数字图像处理技术得到了广泛的应用,而作为数字图像处理技术的重要组成部分——数字图像压缩,也得到了迅猛的发展。本文从数字图像压缩的概念、发展历史、图像压缩的必要性和可能性、图像压缩标准、图像压缩基本方法和图像压缩效果评价等方面进行了综述。

引言

在当前这个信息化社会中,新信息技术革命使人类被日益增多的多媒体信息所包围。多媒体信息主要是由图像、文本和声音三大元素组成。图像作为其主要元素之一,发挥着越来越重要的作用。而传输和存储图像需要占用大量的数据空间,这严重影响了传输速率和实时处理量,极大地制约了图像通信的发展。其中,数据量最大的是数字视频数据。未经处理的数字视频信息需要消耗巨大的存储资源,以主流高清视频为例,在分辨率为1280×720,帧率为30帧每秒的视频应用中,存储一分钟的视频信息,需要约18.5G(以常4:2:0视频,每像素12比特)比特存储空间,一部120分钟高清电影约需要2225G比特的存储空间。可见未经处理的视频信息量非常大,为了满足存储和传输需求,视频信息的压缩是十分必要的。在同等的通信容量下,如果图像数据可以压缩之后再传输,就可以使传输的数据量变得很小,也就能够增加通信能力。因此图像压缩编码技术受到了越来越多的关注及广泛的应用。如数码相机、USB摄像头、可视电话、视频点播、视频会议系统、数字监控系统等等,都使用到了图像或视频的压缩技术。

数字图像压缩是以尽可能少的比特数代表图像或图像中所包含的信息量的技术,图像通过压缩处理去掉其中的数据冗余、符号冗余、视觉冗余等各种冗余信息,提高传输速率,节省存储空间。

1图像压缩的发展历史

自1948年提出的电视信号数字化设想后, 即开始了图像压缩的研究,到现在已有60多年的历史。20世纪五六十年代的图像压缩编码主要集中在预测编码、哈夫曼编码等技术的研究,还不成熟。1969年在美国召开的第一届“图像编码会议”,标志着图像编码作为一门独立学科的诞生。到了七八十年代,图像压缩技术的主要成果体现在变换编码技术上, 矢量量化编码技术也有较大的发展。80年代末,小波变换理论、分形理论、人工神经网络理论、视觉仿真理论建立,人们开始突破传统的信源编码理论, 图像压缩编码向着更高的压缩率和更好的压缩质量的方向发展,进入了一个崭新的发展时期。

2图像压缩的可能性

图像之所以能够进行压缩有以下几个方面的原因:

一是原始图像数据是高度相关的,存在很大的数据冗余。如图像内相邻像素之间的空间冗余度、系列图像前后帧之间的时间冗余度、多光谱遥感图像各频谱间的频率域冗余度等,它们造成了大量的比特数浪费,消除这些冗余就可以节约码字,大大减少数据量,达到数据压

缩的目的。

二是信源符号出现的概率不同,若用相同码长表示不同出现概率的符号,就会造成符号冗余度。如果采用可变长编码技术,对出现概率高的符号用短码字,对出现概率低的符号用长码字表示,就可以消除符号冗余度,从而节约码字。

三是人眼具有视觉冗余,允许图像编码有一定的失真。人类视觉系统(HVS)是有缺陷的,人眼对于某些失真不敏感难以察觉。在许多场合中,并不要求经压缩及复原以后的图像和原始图像完全相同,可以允许有少量的失真,只要这些失真并不被人眼所察觉即可。这就为压缩比的提高提供了十分有利的条件,这种有失真的编码称为限失真编码。在多数应用中,人眼往

往是图像信息的最终接受者,图像编码方法如果能充分利用人眼的视觉特性,就可以在保证复原图像主观质量较好的前提下取得较高的压缩比。

四是还可以利用先验知识来实现图像编码,降低知识冗余度。例如,在可视电话中,编码对象可为人的头和肩等,这时可利用对编码对象的先验知识为编码对象建立模型,通过提取模型参数,对参数进行编码而不对图像直接进行编码,可以达到非常高的压缩比。

3图像压缩编码标准

国际标准化协会(ISO)、国际电子学委员会(IEC)、国际电信协会(ITU)等国际组织,于90年代领导制定了许多重要的多媒体数据压缩标准如JPEG、H.261、H.263、H.264、HEVC、MPEG 一1、MPEG一2、MPEG一4等等。这些标准已在数字电视、多媒体领域得到广泛应用。[1]目前国际主流的视频编码国际标准主要有两大系列,分别为H.26X系列和MPEG系列。H.26X系列包括H.261[2]、H.262[3]、H.263[4]、H.263+[5]、H.263++[6]和H.264[7]、 H.265。其制定者为国际电信联盟电信标准化部门(ITU-T: International Telecommunication

Union-Telecommunication Standardization Sector)。MPEG系列包括MPEG-1[8]、MPEG-2[9]、MPEG-4[10]以及正在制定中的MPEG-H[11]。其制定者为国际标准化组织(ISO: International Organization forStandardization)和国际电工委(IEC:International Electronics Committee)下属的运动图像专家组(MPEG: Moving Picture Experts Group)。

为了推动视频编码技术的发展,两大标准组织共同制定了H.262和H.264/AVC标准。目前,为适应视频技术发展的趋势,两大组织再一次合作,共同开发新一代高性能视频编码标准HEVC(High Efficiency Video Coding)。

下图为两大系列标准的发展历史图。

图3-1 H.26X系列发展图

图3-2 MPEG系列发展图

不同的视频标准有不同的社会需求背景,同时所面向的应用也有所不同。下表所示为各编码标准面向应用情况[12]。

表3-3编码标准面向应用

除了两大国际标准以外,还有我国自主知识产权的AVS编码标准。AVS标准的制定是为了适应我国信息产业快速崛起崛起而提出的,随着我国在视频编码技术研发方面的不断积累,相信其影响力将会不断的增强。

4图像压缩方法

如下图为图像压缩系统的一般模型

图4-1 图像压缩系统的一般模型

4.1压缩方法的分类

研究图像压缩方法实际是研究图像压缩的算法(或者称为“编码’),随着研究的不断深入,出现了多种压缩(“编码’)方法。显然,各种编码方法的并存是十分必要的。图像压缩编码可以有多种分类方法:

①以恢复的图像与原图像关系分:无失真编码和限失真编码。

②以使用方法的原理分:基于图像统计特性、基于人眼视觉特性和基于图像特性提取编码。

③以图像的光学特性分:静止图像、慢速图像和实时图像编码。

④以采用的基本理论不同分:变换法和分形法编码。

4.2压缩方法算法

4.2.1 空间法

空间域图像压缩可以有六种形式,其中包括脉冲编码调制、预测编码、差分脉冲码调制、Delta 调制、内插编码及比特平面编码这六种方法。空间域图像压缩的主要特点有:

(1)脉冲编码调制

这种压缩方法可接受的图片质量是由每像3比特量化值,压缩比C=2.6至C=1.0,颤动法可以用来改进图像的质量,全然没有利用人的视觉特性。

(2)预测编码

预测编码的理论基础是现代统计学和控制论。预测编码是根据某一模型利用以往的样本值,对于新样本值进行预测,然后将样本的实际值与其预测值相减得到一个误差值,对这一误差值进行编码,如果模型足够好且样本序列在时间上的相关性较强,那么误差信号的幅度将远小于原始信号,从而可以用较少的数据类对其差值量化得到较大的数据压缩结果。利用预测编码的方法压缩图像数据的空间和时间冗余性,这种方法直观、简捷、易于实现,它的不足在于压缩能力有限。现在常用的一种线性预测编码方法是差分脉冲编码调制DPCM (differential pulse codemodulation)[13]

线性预测形式如下:S’(n1,n2)=c1s(n1—1,n2—1)+ c2s(n1—1,n2)+c3s(n1一1,n2+ 1)+c4s(n1,n2—1)。最佳线性预测选择系数使均方误差最小:min E((s一s’)T(s一S’))预测法通常不利用人的视觉系统的特性,对于8比特的规范形式运用两维预测所获得的压缩比约为4:1。若预测参量以适当方式与数据自适应,则预测法便为自适应的。例如,一局部性测量可以定义,则预测参量在每一显著的变化时可以被修正。用自适应修正,压缩比可以增加百分之一到二十左右。预测的特例是差分脉冲编码调制。

(3)差分脉冲编码调制

脉冲编码调制可获得压缩比为2.5:1,自主适应脉冲编码调制可使压缩比达3.5:1。(4)Delta调制

用这种方法所获得的压缩比虽然不高,但方法相当简单。

(5)内插编码

最通用的内插方法是零阶和一阶内插器,它能获得大约4:1的压缩比。高阶多项式或样条函数也能使用,但是其计算复杂性不能证明其结果的有效性,再则是未利用人的视觉系统的性质。

(6)比特平面编码

用比特平面编码法在未涉及人的视觉系统特性时可以获得平均压缩比约为4:1。

4.2.2变换编码

变换编码先对图像进行某种函数变换,从一种表示空间变换到另一种表示空间,然后在变换后的域上,对变换后信号进行编码。目前在图像压缩中经常使用的变换有:

(1)Karhunen-Loeve变换(KLT)。它是一种最优变换。KLT可以有效地去除原始数据的相关性,从而实现高效压缩。但是由于KLT变换的核不是固定的,是随原始数据而变的,并且不存在快速算法,限制了它在实际上的应用,一般常作为其他方法的参照。

(2)离散余弦变换(DCT)。

对于像素间呈现高度相关的典型图像,DCT的性能与KLT的性能没有实质的区别。DCT的

快速实现算法也已经实现。与Walsh-Hadamard变换相比,DCT具有更强的信息集中能力,并且易于软硬件的实现,正是由于这些优点,DCT已经成为当前图像压缩中应用最广泛的技术。(3)Walsh-Hadamard变换(WHT)。与DCT相比,WHT的压缩方面的性能要逊色许多,但

由于实现起来算法简单,且具有简洁的去相关能力,以及特别有利于硬件实现,使得WHT 也成为一种比较流行的算法。

(4)小波变换。

小波变换把图像分解成逼近图像和细节图像之和,它们分别代表图像的不同结构,然后采用快速算法(Mallat) 进行压缩,可以获得很高的压缩比。基于小波变换的图像压缩算法首先使用某种小波基函数将图像作小波变换,再根据4个通道的不同情况,分别量化编码,比如对低频频段(LL)采用较多的量化级别,而对中间频段(LH,RH)采用较少量化级别,对高频频段(HH)采用很少几个量化级别,这样根据重构时对复原信号的重要程度分别对待的方式可以有效地提高压缩比而又不产生明显的失真。小波变换在静态图像压缩中的作用已经得到公认,为JPEG2000标准所采纳。小波变换应用于图像压缩时,本质上是对原始图像的小波系数进行重组处理,然后用处理后的小波系数恢复图像,在实际的信号压缩标准中(如JPEG2000),一般采用支集长度为9和7的双正交小波,该方法容错性比较好,因此更适合实际的应用。

目前3个最高等级的小波图像编码分别是嵌入式小波零树图像编码(EZW),分层树中分配样本图像编码(SPIHT)和可扩展图像压缩编码(EBCOT)。

1.EZW算法

EZW算法中采用的零树结构充分利用了不同尺度间小波系数的相似特性,有效地剔除了对高频小波系数的编码,极大的提高了小波系数的编码效率。EZW算法以极低的复杂度获得了高效的压缩性能,产生的码流还具有嵌入的特性,支持渐进传输,因此EZW算法在小波图像编码史上就有里程碑式的意义。

零树小波编码基于三个关键的思想:(1)用小波变换去相关;(2)利用小波变换的内在自相似性在各级之间预测重要信息的位置;(3)用自适应算法编码进行无损压缩。

一个零树的数据结构可以定义如下:一个小波系数x,对于一个给定的阈值T,如果|x|

EZW算法使用了四个符号进行编码:零树根、孤立零点、正重要值、负重要值。孤立零

点表示当前系数值是不重要的,但它的子孙中至少有一个是重要的。正/负重要值表示当前系数是一个正/负的重要值。通过这四个符号,各子带按一定顺序对小波系数进行扫描,对小波系数进行判断,并将相应的符号放入一个表中,从而形成了一个符号表。

在EZW编/解码过程中,始终保持着两个列表:主表和副表。主表包括编码中的不重要的集合或系数,其输出信息起到了恢复各重要值的空间位置的作用;而副表包括编码中的有效信息,输出为各重要系数的二进制值。编码分为主通、副通两个过程。在主通过程中,在给定阈值下,主表进行扫描编码,若为重要系数,则将其幅值加入副表,然后将该系数在数组中置为零,这样当阈值减小时,该系数不会影响新零树的出现;在副通过程中,对副表中的重要系数进行细化,细化过程相当于比特平面的编码过程。

零树结构和SAQ相结合构成的编码器的工作过程可以概括如下:首先给出初始化阈值,进行第一次主扫描,若是重要系数,则将其幅值加入副表,然后将该系数在数组中置为零;接下来进行第一次副扫描,细化重要值的表示。更新阈值,进行新一轮主扫描,对已经发现的重要小波系数的位置不再扫描;主扫描结束,进入副扫描,对原已发现的重要值和新发现的重要值进行细化处理。重复上述过程,直到满足要求为止。

EZW的编码思想是不断扫描变换后的图像,生成多棵零树来对图像进行编码。由于编码时它形成多棵零树,因而需要多次扫描图像,造成效率很低。而在一颗零树中包含的元素越多,则越有利于数据压缩,在EZW算法中存在这样的树间冗余。人们通过对小波系数的分析发现,在同一子带中相邻元素间有一定的相关性,尤其在高频子带中存在大量的幅值很低的系数,所以可以通过子带的集合把这种大量的系数组织到一起,达到数据压缩的目的,而EZW 算法并没有充分利用这种相关性。在EZW算法的基础上,许多学者又进行了深入的研究,并提出了一些更为高效的小波图像编码方法,这类编码器被统称为“零树编码器”。

2.EBCOT算法

EBCOT算法包括嵌入式块编码和分层装配两个结构。嵌入式块编码是EBCOT的基础,其输出的码流不仅包含块信息,而且也包含附加信息。

EBCOT将待编码的小波图像分成尺寸相对较小的独立编码子块,对每个子块进行独立编码得到嵌入式码流,进而对块间的码流进行组织以进一步提高压缩性能,它的编码过程如下:

①将原始图像进行小波变换,得到小波图像以降低图像数据的相关性;

②把小波图像分成许多较小的编码子块Bj,Bj是独立压缩编码的主体,通过对Bj的独立优化编码,可充分利用块内数据冗余,获取较高的压缩性能;

③将位平面进一步细分为“分数位平面”以获取更多的可截取点,并对这些截取点进行优化,达到更好的可嵌入性;

④设置专门的“第二层编码”,组织相互独立的块码流,从而提供功能上的丰富性。

在EBCOT算法中,最小编码单位是编码子块,简称“码块”,用字母Bj表示,码块的分割是在图像经小波变换后得到的子带图像中进行。

编码前需把小波图像中各个子带图像tbj分割成码快Bj(j=1,2,?,q),分割完成的编码子块应互不交叉,同时编码子块不跨越子带边界,而且除边缘码块外其余的码块形状与大小均需相同。一般,编码子块的形状取正方形,大小为2n×2n像素。

量化是有损压缩的基础,通过量化处理可以进一步提高图像压缩倍数,这种压缩倍数的提高是以牺牲重构图像质量为代价。EBCOT算法中量化产生的编码是嵌入式的,它包含两重含义:①分辨层渐进编码,即优先保留低分辨率系数,然后逐步加入高分辨率细节系数;②质量层渐进编码,即在同一码块内先保留系数的高位比特。对于每个子带图像,用户根据视觉特性或者编码比特率控制的要求选择合适的量化步长,将子带中的小波系数进行量化,量化过程会产生量化误差。

最终的压缩数据由各个编码块的码流组成。每一个编码块都在一个固定的分辨率上,所

以这种简单的封包形式具有“分辨率可伸缩性”。同时,因为每一个编码块只影响图像的一个区域,所以此封包形式还具有一定的“空间可伸缩性”, 这样,如果对一个空间域上的图像感兴趣,就可以把感兴趣图像所在的编码块识别出来,然后进行相应的处理。尽管有些封包格式中每一个编码块都是嵌入式表示的,但是它并不具有“失真率可伸缩性”。为了解决这一问题,EBCOT算法中引入了“质量层”的概念,每一个质量层Qi由不同编码块的一部分码流组成。需要强调的是,一些编码块在某一层中可以为空。这样,由“质量层结构”构成的码流形式具有失真率可伸缩性,编码后的压缩数据就具有渐进传输的性质了。

3.SPIHT算法

SPIHT算法继承了EZW算法的三个主要思想:①把小波系数按照幅值排序编码传输,同时解码器也按同样的算法,以实现从执行中复制编码的排序信息;②细化重要系数的位平面传输;③利用小波系数不同尺度同一方向的系数间的自相似性。

SPIHT 算法同样利用了树的结构,并且对重要的树集合进行进一步的分割,目的是使更多不重要系数包含在同一个集合里,从而提高压缩效率。

在SPIHT 算法中,使用了如下的集合定义:其中Z(i,j)为系数x(i,j)及其所有后代节点的集合,D(i,j)是系数x(i,j)的所有后代节点集合,O(i,j)是系数x(i,j)的直接后代节点的集合,L(i,j)是系数x(i,j)除去直接后代的其它所有后代节点的集合,集合分割策略为:

Z(i,j)=x(i,j)+D(i,j)①

D(i,j)=O(i,j)+L(i,j) ②

L(i,j)=ΣD(i,j),(k,j)③

SPIHT 算法通过初始化、分类扫描、细化扫描和阈值更新四个子过程来完成图像的编码,过程中使用了三个链表来记录相关信息:不重要系数链表、不重要集合链表以及重要系数链表。

初始化就是把整个系数矩阵分成了树头节点x(i,j)(放入不重要系数链表)和剩余集合D(i,j)(放入不重要集合链表)。分类扫描就是从以上的所有x(i,j)和D(i,j)中找出重要系数并放入重要系数链表中,以供细化处理,在这个过程中就用到了集合分割策略,不断地对重要集合进行分割,直到找出所有的重要系数,并放入重要系数链表中。细化扫描,就是对重要系数链表中的每一项(除了在当前阈值进入重要系数链表的系数)。在阈值为2n 时,输出它的第n个位平面的值。阈值更新,就是将n减1,即阈值减半,然后又重复进行分类扫描和细化扫描,直到编码结束,或达到目标码率,停止编码。

(5)子带编码

子带编码属于分析-综合类的编码技术。子带编码的基本思想是,在编码端,将图像信号在频率域分裂成若干子带(subband),而后对各个子带用与其统计特性相适合的编码器及比特分配方案进行数据压缩;在解码端,将分别解码后的各子带信号再综合成重建图像。子带编码有三方面的优点。

①一个子带内的编码噪声(失真)不会扩散到其他子带,所以,图像经过子带编码后,其能量较弱的高频细节仍能较好地保持。

②可以根据视觉特性控制编码噪声的频谱,使之适应人眼对不同频带噪声的敏感程度,将编码比特数在各个子带之间合理分配,有利于提高图像的主观质量。

③子带编码由于其本身具备的频率分裂特性,非常适合于分辨率可分级、质量可分级的图像编码,也非常适合嵌入式的码流结构。除了通过专门设计的正交镜像滤波器实现的经典子带编码方法之外,小波变换是目前使用最多的子带编码方法。早期的综合高频编码、塔型编码也属于子带编码的范畴。

4.2.3 统计编码

统计编码又称熵编码,它是对于有不同概率的事件分配以不同长度的码字,对概率大的事件分配以短的码字,从而使平均码字最短。统计编码实现事件出现的概率与码字长度的最佳匹配。典型的统计编码法有哈夫曼编码(huffman)、算术编码和行程编码等。

(1) Hufman编码

无失真编码方法中,Hufman编码是一种较有效的编码方法。Huffman编码是一种长度不均匀的,平均码率可以接近信息熵值的一种编码。它的编码思想是:对于出现概率大的信息,采用字短的码,对于出现概率低的信息采用字长的码,以达到缩短平均码长,从而实现数据的压缩。Huffman编码小变字长编码方法是最佳的,其码字平均长度很接近信息符号的熵值。Huffman编码的最高压缩效率可达到8:1。

(2)算术编码

算术编码完全抛弃了用特殊字符代替输入字符的思想。在算术编码中,输入的字符信息

用0 到1 之间的是数进行编码,它用到两个基本的参数:符号的频率及其编码间隔。对

于输入的字符信息,算术编码后形成一个唯一的浮点数。算术编码的特点是①算术编

码在自适应模式下,不必预先统计符号概率②当信源个符号的概率比较接近时,算

术编码的效率优于哈夫曼编码③算术编码的实现比哈夫曼编码复杂一些。

(3)行程(Run—Length)编码

在一个逐行存储的图像中,具有相同灰度值的一些像素组成的序列称为一个行程。在编码时,对于每个行程只存储一个灰度值的码,再紧跟着存储这个行程的长度。这种按照行程进行的编码被称为行程编码(Run Length Encoding)。行程编码是相对简单的一种编码,是指一行扫描的像素中,比较相邻像素的幅度(如:亮度),当幅度有显著变化时,就说有一个行程存在。随终点位置标记方法不同,行程编码可分为“行程终点编码”和“行程长度编码”。行程编码对于仅包含很少几个灰度级的图像,特别是二值图像,比较有效。

4.2.4合成高系统

合成高系统的产生和发展经过了近三十年的历史,这一方法的重要性是它导致了第二代数据压缩技术的进展。在过去没有很好发展的直接原因是由于其计算量大而又使电脑存储量大,而在上世纪八十年代以来由于电脑速度猛增,使得这一方法的实现和普及得到令人满意的程度。它同现代一些方法相比,它能获得很高的压缩比。同时它为发展第二代图像编码压缩技术提供一条有益,而且十分有效的新途径。国际上许多研究都是基于把一幅图片分解成低频成份和高频成份两部份,它是直接或间接地利用合成高系统分别进行编码压缩,然后进行综合,获得原始图像的很高系统的压缩性能。合成高系统用的信息序列以下述方式来选择。原始图片分成两部份:低通图片没有很锐的围线而给出一般的面积亮度,高通图片含有很锐的边缘信息,根据两维抽样定理,低通图片可由很少的样本表示。这些样本是说明规范形式的低通信息的样本。边缘检测可用梯度算子或拉普拉斯算子来实现。非线性运算—取门限是对高通图片执行的,以确定是否边缘点是重要的。于是,这一方法是成为无损信息的。最后,每一个选择的边缘点的位置和幅值被编码。这些变量是说明高通图片的迅息。两维重建滤波,其特性唯一地用于低通图片的低能滤波来确定,同时用于综合从边缘信息来的高频分量。合成高系统精巧地利用了视觉系统的特性。利用横向禁止现象在早期处理级考虑视觉系统的性能。因而,它允许降低较大的剩余度。在合成高系统中,门限的正确利用是十分重要的。这样可以获得很高的压缩比及良好的图像质量。若门限选得太低,虽然图像质量很好,但压缩比很小。反之,若门限选择得太高,图像质量差,但压缩比很大。在压缩比和图像质量之间的折衷方法目前还没有,可以运用经验方法来获得很好的结果。指向性分解法是合成高系统的细化,在那里提取边缘和对边缘编码可以运用指向性滤波器。

4.2.5 分形编码法

分形法是基于物质的自相似性,在编码时将信号分解为若干分形子图,然后每一个子图

像对应一个迭代函数,子图像以迭代函数存储,迭代函数越简单,压缩比也就越大。同样解码时只要调出每一个子图像对应的迭代函数反复迭代,就可以恢复出原来的子图像,从而得到原始图像。基于IFS的分形法编码压缩过程应包括以下步骤:

①将原图预分割成若干分形子图,使每一子图具有一定的分形结构。目前这一步需要采用图像处理、计算机视觉和模式识别的技术,经过反复试凑才能完成。

②对每一子图提取IFS 代码。即将子图置于计算机屏幕上,采用伸缩、平移、旋转或仿射手段,对子图进行压缩,获得一组仿射变换参量,便可得到该子图的IFS 代码。

③对IFS 代码采用经典的编码方法进行编码。

④译码形成IFS 代码。

⑤由IFS 代码,利用随机迭代法获取相应的重构子图。

⑥把各重构子图拼成恢复图像。对于一定的整体与局部存在明显相似性或仿射性的分形图像类,这种方法可以取得很高的压缩比。

随着分形图像压缩技术的发展,越来越多的算法被提出,基于分形的不同特征,可以分成以下几种主要的分形图像编码方法。

1.尺码编码方法

尺码编码方法是基于分形几何中利用小尺度度量不规则曲线长度的方法,类似于传统的亚取样和内插方法,其主要不同之处在于尺度编码方法中引入了分形的思想,尺度随着图像各个组成部分复杂性的不同而改变。

2.迭代函数系统方法

迭代函数系统方法是目前研究最多、应用最广泛的一种分形压缩技术,它是一种人机交互的拼贴技术,它基于自然界图像中普遍存在的整体和局部自相关的特点,寻找这种自相关映射关系的表达式,即仿射变换,并通过存储比原图像数据量小的仿射系数,来达到压缩的目的。如果寻得的仿射变换简单而有效,那么迭代函数系统就可以达到极高的压缩比。

3.A-E-Jacquin的分形方案

A-E-Jacquin的分形方案是一种全自动的基于块的分形图像压缩方案,它也是一个寻找映射关系的过程,但寻找的对象域是将图像分割成块之后的局部与局部的关系。在此方案中还有一部分冗余度可以去除,而且其解码图像中存在着明显的方块效应。

4.2.5神经网络

人工神经网络在图像压缩中的应用越来越引起人们的注意,和一些传统的压缩方法相比,人工神经网络技术具有良好的容错性、自组织性和自适应性,因此在图像压缩过程中,不必借助于某种预先确定的数据编码算法,神经网络能根据图像本身的信息特点,自主地完成图像编码和压缩。

目前,在图像压缩中,使用较多的是三层BP(Back2Propagation) 网络,如图所示。将图像先分成n个小块,对应于输入的n个神经元,压缩后的数据对应于隐含层m个神经元,m≤n。通过BP 训练算法,调整网络权重,使重建图像尽可能地相似于原始图像,经过训练后BP 神经网络便可直接用来进行数据压缩。BP 网络用于数据压缩类似于图像的KL变换。但是,目前人工神经网络的工作原理还不清楚,神经网络的图像编码方法的研究目前仅处于一个初级阶段,需要解决的问题还很多,如完善人工神经网络的理论体系,弄清楚神经网络的工作原理,找到适合图像数据高效压缩,充分利用视觉信息处理机制的神经网络模型和学习算法。

图4-2 三层BP网络

5复原图像质量的性能评价

复原图像质量是评价图像压缩编码方法的最为重要的标准之一,它包括两方面的含义:一方面是图像的逼真度,即复原图像与原始图像的偏离程度;另一方面是图像的可懂度,即图像能向人或机器提供特征信息的能力。对于限失真编码,原图像与复原图像之间存在着差异,差异的大小意味着恢复图像的质量不相同。但是,由于人的视觉冗余度的原因,则对有些差异的灵敏度较低,这就产生了两种判别标准:一种是客观判别标准,它建立在原始图像与复原图像之间的误差上;另一种是主观评价标准,通过用人的肉眼对图像打分而得到。

5.1 主观评价

主观评价采用平均判分MOS(Mean Option Score)或多维计分等方法进行测试,所评价出的图像质量不仅与图像本身特征有关,也与观察者特性以及观察者的环境条件有关。组织一群足够多(至少应有20名)的观察者(包括一般观众及专业人员),通过观察来评定图像的质量。观察者将复原图像与原图像相对比,比较损伤程度,可参照表1.1,给评定的图像打上一定的质量等级,最后用平均的方法得到图像的分数。这样的评分虽然很花时间,但比较符合实际。

表5.1

5.2 客观评价

对图像质量进行定量描述是一个比较复杂的问题,进展比较缓慢,一方面是因为人们还没有充分了解视觉感知的过程和方法;另一方面是由于图像是多维信号,很难用确定的几个统计参数来表示其特征。彩色图像由于量纲数增多,而且必须满足人眼对彩色的视觉感知,因此对彩色图像逼真度进行定量表示是一个更加复杂的问题。目前应用得较多的是对灰度级图像逼真度的定量表示。一个合理的尺度应该与图像的主观测试结果相吻合或密切相关,要求便于计算分析而且简单易行。设原始的二维灰度图像为A=f(i,j)。i=1,2,,N;j=1,2,,,M,经压缩复原后的图像为A’=f’(i,j)。可以用以下几种指标来评价图像的质量。

可以看出,以上的评价完全取决于原始图像与重建图像每个像素上灰度值的误差,这种评价在主观感觉上也有一定的参考意义。常用的客观评价指标为PSNR,一般,当PSNR超过30dB时,人的主观感觉很难找出其差异。主观评价与客观评价之间有一定的联系,但不能完全等同。客观评价比较方便,很具有说服力。由于主观评价很直观,比较符合人的视觉效果及实际,故在制定国际标准时常被采用。

总结

图像压缩技术研究了几十年,取得了很大的成绩,但还有许多不足,值得我们进一步研究。小波图像压缩和分形图像压缩是当前研究的热点,但二者也有各自的缺点,在今后工作中,应与人眼视觉特性相结合。总之, 图像压缩是一个非常有发展前途的研究领域, 这一领域的突破对于我们的信息生活和通信事业的发展具有深远的影响。

参考文献:

[1] D Henriksson,A Cervin,K—E Arz6n.Truetime:Simulation of control loops under sharedcomputerresources.In Proceedings of the 1 5th IFACW orld Congress on Automatic Control, Barcelona,Spain,2002.

[2] ITU-TRecommendation H.261. Video codec for audio-visual services at

P64kbit/s[S].1993.

[3] ITU-TRecommendation H.262. Information technology—generic coding of moving pictures and associated audio information: Video[S]. 1995.

[4] ITU-TRecommendation H.263. Video coding for low bit rate communication[S]. 1996.

[5] ITU-TRecommendation H.263.Version 2.Video coding for low bit rate communication[S]. 1998.

[6] ITU-TRecommendation H.263 Version 3.Video coding for low bit rate communication[S]. 2000.

[7] ITU-T Recommendation H.264.Advanced video coding for generic audiovisual services[S]. 2005.

[8] ISO/https://www.360docs.net/doc/5b17844348.html,rmation technology--coding of moving pictures and associated audio for digital storage media at up to about 1.5Mbits/s[S]. 1993.

[9] ISO/https://www.360docs.net/doc/5b17844348.html,rmation technology--generic coding of moving pictures and associated audio information--Part2: Video[S]. 1995.

[10] ISO/https://www.360docs.net/doc/5b17844348.html,rmation technology–-coding of audio-visual objects-Part 10: Advanced video coding(AVC)[S]. 2003.

[11] ITU-T Q6/16and ISO/IEC JTC1/SC29/WG11. Terms of Reference of the Joint Collaborative Team on Video Coding Standard Development, VCEG-AM90[R]. Kyoto:VCEG of ITU-T,January,2010.

[12] 张春田,苏育挺,张静. 数字图像压缩编码[M]. 北京:清华大学出版社,2006.

[13]Y Ji,H Chizeck,X Feng.Sta-bility and control ofdiscrete—time jump linear systems. Control—Theory and Advanced Applica—tions,1991,7(2):247—270.

图像压缩标准知多少

电子科技 2004年第7期(总第178期) 61 图像压缩标准知多少 徐庆征,镇桂勤 (西安通信学院二系,陕西 西安 710106) 摘 要 介绍了一些典型的静止图像压缩标准和活动图像压缩标准,并分析了各自的技术特点及其应用场合。 关键词 图像压缩;JPEG ;H.26x ;MPEG4 中图分类号 TN919.8 图像通信直观生动,包含极其丰富的信息,是人们传递信息的重要媒介。同时,巨大的数据量也给图像的采集、存储、处理和传输带来了极大的困难,严重影响了图像媒体成为主要媒体,因此,压缩数字图像信号的数码率就成为图像通信和图像信号处理领域的首要任务,受到全世界科技工作者的关注。 20世纪80年代以来,国际标准化组织(ISO)和国际电信联盟(ITU)组织了一批专家,开展了大量细致、全面的工作,陆续制定了一系列有关图像通信方面建议和标准,极大地推动了图像编码技术的发展与应用。这些标准可以归为两种类型:静止图像压缩标准和活动图像压缩标准(包括ITU-T 制定的H.263系列和ISO 制定的MPEG-x 系列)。 1 静止图像压缩编码标准 1.1 JBIG 标准 1988年,ISO 和ITU-T 成立了“联合二值图像专家组”(Joint Binary Image Expert Group ,JBIG), 1991年10月提出了ITU-T T.82标准。这一标准确定了具有逐层、逐层兼容顺序和单层顺序3种模式的编码方法,并提出了获得任意低分辨率图像的方法。 1.2 JPEG 标准 收稿日期: 2004-04-21 1986年底,ISO 和ITU-T 成立了联合图像专家小组(Joint Photographic Experts Group ,JPEG),该小组近年来一直致力于静止图像压缩算法的标准化工作。1991年3月正式提出ISO CD10918号建议草案“连续色调静止图像的数字压缩编码”(通常简称为JPEG 标准),这是第一个适用于连续色调、多级灰度、彩色或黑白静止图像的国际标准。 JPEG 标准提供了一种无损编码的模式和3种有损编码模式(基于DCT 的顺序模式、基于DCT 的渐进模式、层次模式)。所有符合JPEG 的 遍解码器都必须支持基准模式,其他模式可作为选择项根据不同的应用目的来取舍。基准模式编解码框图如图1所示。 尽管JPEG 建议主要是应用于静止图像的编码技术,但是在某些场合也可将它应用于视频编辑系统。此时JPEG 把视频序列中的每一帧当作一幅静止图像来处理,这就是所谓的Motion JPEG 的处理方法。 1.3 JPEG-LS 标准 JPEG 组织从1994年开始征集新的无损/近无损(简称JPEG-LS)算法提案,并于1998年2月作 图1 JPEG 基准模式遍解码框图

图像压缩编码方法

图像压缩编码方法综述 概述: 近年来, 随着数字化信息时代的到来和多媒体计算机技术的发展, 使得人 们所面对的各种数据量剧增, 数据压缩技术的研究受到人们越来越多的重视。 图像压缩编码就是在满足一定保真度和图像质量的前提下,对图像数据进行变换、编码和压缩,去除多余的数据以减少表示数字图像时需要的数据量,便于 图像的存储和传输。即以较少的数据量有损或无损地表示原来的像素矩阵的技术,也称图像编码。 图像压缩编码原理: 图像数据的压缩机理来自两个方面:一是利用图像中存在大量冗余度可供压缩;二是利用人眼的视觉特性。 图像数据的冗余度又可以分为空间冗余、时间冗余、结构冗余、知识冗余 和视觉冗余几个方面。 空间冗余:在一幅图像中规则的物体和规则的背景具有很强的相关性。 时间冗余:电视图像序列中相邻两幅图像之间有较大的相关性。 结构冗余和知识冗余:图像从大面积上看常存在有纹理结构,称之为结构 冗余。 视觉冗余:人眼的视觉系统对于图像的感知是非均匀和非线性的,对图像 的变化并不都能察觉出来。 人眼的视觉特性: 亮度辨别阈值:当景物的亮度在背景亮度基础上增加很少时,人眼是辨别 不出的,只有当亮度增加到某一数值时,人眼才能感觉其亮度有变化。人眼刚 刚能察觉的亮度变化值称为亮度辨别阈值。 视觉阈值:视觉阈值是指干扰或失真刚好可以被察觉的门限值,低于它就 察觉不出来,高于它才看得出来,这是一个统计值。 空间分辨力:空间分辨力是指对一幅图像相邻像素的灰度和细节的分辨力,视觉对于不同图像内容的分辨力不同。 掩盖效应:“掩盖效应”是指人眼对图像中量化误差的敏感程度,与图像 信号变化的剧烈程度有关。 图像压缩编码的分类: 根据编码过程中是否存在信息损耗可将图像编码分为: 无损压缩:又称为可逆编码(Reversible Coding),解压缩时可完全回复原始数据而不引起任何失真; 有损压缩:又称不可逆压缩(Non-Reversible Coding),不能完全恢复原始数据,一定的失真换来可观的压缩比。 根据编码原理可以将图像编码分为: 熵编码:熵编码是编码过程中按熵原理不丢失任何信息的编码。熵编码基

0016算法笔记——【动态规划】图像压缩问题

0016算法笔记——【动态规划】图像压缩问题 1、问题描述: 在计算机中,常用像素点的灰度值序列{p1,p1,……p n}表示图像。其中整数p i,1<=i<=n,表示像素点i的灰度值。通常灰度值的范围是0~255。因此最多需要8位表示一个像素。 压缩的原理就是把序列{p1,p1,……pn}进行设断点,将其分割成一段一段的。分段的过程就是要找出断点,让一段里面的像素的最大灰度值比较小,那么这一段像素(本来需要8位)就可以用较少的位(比如7位)来表示,从而减少存储空间。 b代表bits,l代表length,分段是,b[i]表示每段一个像素点需要的最少存储空间(少于8位才有意义),l[i]表示每段里面有多少个像素点,s[i]表示从0到i压缩为一共占多少存储空间。 如果限制l[i]<=255,则需要8位来表示l[i]。而b[i]<=8,需要3位表示b[i]。所以每段所需的存储空间为l[i]*b[i]+11位。假设将原图像分成 m段,那么需要位的存储空间。 图像压缩问题就是要确定像素序列{p1,p1,……pn}的最优分段,使得依此分段所需的存储空间最小。 2、最优子结构性质

设l[i],b[i],1<=i<=m是{p1,p1,……p n}的一个最优分段,则l[1],b[1]是{p1,……,p l[1]}的一个最优分段,且l[i],b[i],2<=i<=m是{p l[1]+1,……,p n}的一个最优分段。即图像压缩问题满足最优子结构性质。 3、递推关系 设s[i],1<=i<=n是像素序列{p1,p1,……p i}的最优分段所需的存储位数,则s[i]为前i-k个的存储位数加上后k个的存储空间。由最优子结构性质可得: ,式中 4、构造最优解 数组l[i],b[i]记录了最优分段所需的信息最优分段的最后一段的段长度和像素位数分别存储在l[n]和b[n]中,其前一段的段长度和像素位数存储于l[n-l[n]]和b[n-l[n]]中,依此类推,可在O(n)时间内构造最优解。 算法具体实现代码如下: [cpp]view plain copy 1.//3d7 动态规划图像压缩问题 2.#include "stdafx.h" 3.#include https://www.360docs.net/doc/5b17844348.html,ing namespace std; 5.

JPEG2000图像压缩算法标准剖析

JPEG2000图像压缩算法标准 摘要:JPEG2000是为适应不断发展的图像压缩应用而出现的新的静止图像压缩标准。本文介绍了JPEG2000图像编码系统的实现过程, 对其中采用的基本算法和关键技术进行了描述,介绍了这一新标准的特点及应用场合,并对其性能进行了分析。 关键词:JPEG2000;图像压缩;基本原理;感兴趣区域 引言 随着多媒体技术的不断运用,图像压缩要求更高的性能和新的特征。为了满足静止图像在特殊领域编码的需求,JPEG2000作为一个新的标准处于不断的发展中。它不仅希望提供优于现行标准的失真率和个人图像压缩性能,而且还可以提供一些现行标准不能有效地实现甚至在很多情况下完全无法实现的功能和特性。这种新的标准更加注重图像的可伸缩表述。所以就可以在任意给定的分辨率级别上来提供一个低质量的图像恢复,或者在要求的分辨率和信噪比的情况下提取图像的部分区域。 1.JPEG2000的基本介绍及优势 相信大家对JPEG这种图像格式都非常熟悉,在我们日常所接触的图像中,绝大多数都是JPEG格式的。JPEG的全称为Joint Photographic Experts Group,它是一个在国际标准组织(ISO)下从事静态图像压缩标准制定的委员会,它制定出了第一套国际静态图像压缩标准:ISO 10918-1,俗称JPEG。由于相对于BMP等格式而言,品质相差无己的JPEG格式能让图像文件“苗条”很多,无论是传送还是保存都非常方便,因此JPEG格式在推出后大受欢迎。随着网络的发展,JPEG的应用更加广泛,目前网站上80%的图像都采用JPEG格式。 但是,随着多媒体应用领域的快速增长,传统JPEG压缩技术已无法满足人们对数字化多媒体图像资料的要求:网上JPEG图像只能一行一行地下载,直到全部下载完毕,才可以看到整个图像,如果只对图像的局部感兴趣也只能将整个图片载下来再处理;JPEG格式的图像文件体积仍然嫌大;JPEG格式属于有损压缩,当被压缩的图像上有大片近似颜色时,会出现马赛克现象;同样由于有损压缩的原因,许多对图像质量要求较高的应用JPEG无法胜任。 JPEG2000是为21世纪准备的压缩标准,它采用改进的压缩技术来提供更高的解像度,其伸缩能力可以为一个文件提供从无损到有损的多种画质和解像选择。JPEG2000被认为是互联网和无线接入应用的理想影像编码解决方案。 “高压缩、低比特速率”是JPEG2000的目标。在压缩率相同的情况下,JPEG2000的信噪比将比JPEG提高30%左右。JPEG2000拥有5种层次的编码形式:彩色静态画面采用的JPEG 编码、2值图像采用的JBIG、低压缩率图像采用JPEGLS等,成为应对各种图像的通用编码方式。在编码算法上,JPEG2000采用离散小波变换(DWT)和bit plain算术编码(MQ coder)。此外,JPEG2000还能根据用户的线路速度以及利用方式(是在个人电脑上观看还是在PDA上观看),以不同的分辨率及压缩率发送图像。 JPEG2000的制定始于1997年3月,但因为无法很快确定算法,因此耽误了不少时间,直到2000年 3 月,规定基本编码系统的最终协议草案才出台。目前JPEG2000已由ISO和

图像压缩编码实验报告

图像压缩编码实验报告 一、实验目的 1.了解有关数字图像压缩的基本概念,了解几种常用的图像压缩编码方式; 2.进一步熟悉JPEG编码与离散余弦变换(DCT)变换的原理及含义; 3.掌握编程实现离散余弦变换(DCT)变换及JPEG编码的方法; 4.对重建图像的质量进行评价。 二、实验原理 1、图像压缩基本概念及原理 图像压缩主要目的是为了节省存储空间,增加传输速度。图像压缩的理想标准是信息丢失最少,压缩比例最大。不损失图像质量的压缩称为无损压缩,无损压缩不可能达到很高的压缩比;损失图像质量的压缩称为有损压缩,高的压缩比是以牺牲图像质量为代价的。压缩的实现方法是对图像重新进行编码,希望用更少的数据表示图像。应用在多媒体中的图像压缩编码方法,从压缩编码算法原理上可以分为以下3类: (1)无损压缩编码种类 哈夫曼(Huffman)编码,算术编码,行程(RLE)编码,Lempel zev编码。(2)有损压缩编码种类 预测编码,DPCM,运动补偿; 频率域方法:正交变换编码(如DCT),子带编码; 空间域方法:统计分块编码; 模型方法:分形编码,模型基编码; 基于重要性:滤波,子采样,比特分配,向量量化; (3)混合编码 JBIG,H.261,JPEG,MPEG等技术标准。 2、JPEG 压缩编码原理 JPEG是一个应用广泛的静态图像数据压缩标准,其中包含两种压缩算法(DCT和DPCM),并考虑了人眼的视觉特性,在量化和无损压缩编码方面综合权衡,达到较大的压缩比(25:1以上)。JPEG既适用于灰度图像也适用于彩色图像。其中最常用的是基于DCT变换的顺序式模式,又称为基本系统。JPEG 的压缩编码大致分

多媒体图像压缩技术

多媒体图像压缩技术 2010级电子信息科学与技术刘小辉2010271022 摘要:随着计算机多媒体技术的不断发展,人们期望更高性能的图像压缩技术的出现。图像压缩是用最少的数据量来表示尽可能多的原图像的信息。多媒体数据压缩技术是现代网络发展的关键性技术之一。由于图像和声音信号中存在各种各样的冗余,为数据压缩提供了可能。数据压缩技术有无损压缩缩和有损压缩两大类,这些压缩技术又各有不同的标准。 Abstract:With the ever-growing multimedia technology, people are looking for ward to new image compression technologies with better performances. Image compression with the least amount of data is represented as much information of original image .Multimedia data compression technology is the modern network development of the key technology of. Because of the image and sound signal in the presence of various kinds of redundancy, compression of data is possible. Data compression technology of lossless and lossy compression two categories, these compression techniques and different standards. 关键字(Keyword):多媒体数据压缩技术(Multimedia data compression technology) 无损压缩和有损压缩(Lossless and lossy compression) 图像和声音信号(The image and sound signal) 最少的数据量(The least amount of data) 随着计算机多媒体技术和通信技术的日益发展,以及网络的迅速普及,图像数据信息以

浅析图像压缩编码方法

Computer Knowledge and Technology 电脑知识 与技术第6卷第23期(2010年8月)浅析图像压缩编码方法 徐飞 (闽西职业技术学院,福建龙岩364021) 摘要:该文描述了图像压缩编码的概念,原理以及主要分类,介绍了目前常见的三种图像压缩编码方法的原理,特点以及简单讨论了其中两种方法的MATLAB 代码实现。 关键词:图像压缩编码;编码原理;编码分类;编码方法;MATLAB 中图分类号:TP301文献标识码:A 文章编号:1009-3044(2010)23-6584-03 Analysis of the Image Compression Coding Method XU Fei (Minxi Vocational &Technical College,Longyan 364021,China) Abstract:This paper is mainly about the concept,principle and classification of image compression coding,introduces the concepts and characteristic of three kinds of image compression coding methods that are common used,and discusses how to using matlab to accomplish the two common methods which mentions in the front. Key words:image compression coding;coding principle;coding classification;coding method;MATLAB 现代社会是信息社会,随着信息技术的发展,图像信息被广泛应用于多媒体通信、计算机系统和网络中。因为对图像的要求越来越高,图像信息量也越来越大,所以在传输之前需要进行信息处理,必须采用合适的方法对其进行压缩,因此有必要对图像压缩编码方法进行研究。 1图像压缩编码 1.1概述 图像压缩编码就是在满足一定保真度和图像质量的前提下,对图像数据进行变换、编码和压缩,去除多余的数据以减少表示数字图像时需要的数据量,便于图像的存储和传输。即以较少的数据量有损或无损地表示原来的像素矩阵的技术,也称图像编码。 1.2图像压缩编码原理 图像数据的压缩机理来自两个方面:一是利用图像中存在大量冗余度可供压缩;二是利用人眼的视觉特性。 1.2.1图像数据的冗余度 1)空间冗余: 在一幅图像中规则的物体和规则的背景具有很强的相关性。 2)时间冗余:电视图像序列中相邻两幅图像之间有较大的相关性。 3)结构冗余和知识冗余: 图像从大面积上看常存在有纹理结构,称之为结构冗余。 4)视觉冗余:人眼的视觉系统对于图像的感知是非均匀和非线性的,对图像的变化并不都能察觉出来。 1.2.2人眼的视觉特性 1)亮度辨别阈值:当景物的亮度在背景亮度基础上增加很少时,人眼是辨别不出的,只有当亮度增加到某一数值时,人眼才能感觉其亮度有变化。人眼刚刚能察觉的亮度变化值称为亮度辨别阈值。 2)视觉阈值:视觉阈值是指干扰或失真刚好可以被察觉的门限值,低于它就察觉不出来,高于它才看得出来,这是一个统计值。3)空间分辨力:空间分辨力是指对一幅图像相邻像素的灰度和细节的分辨力,视觉对于不同图像内容的分辨力不同。 4)掩盖效应:“掩盖效应”是指人眼对图像中量化误差的敏感程度,与图像信号变化的剧烈程度有关。 1.3图像压缩编码的分类 根据编码过程中是否存在信息损耗可将图像编码分为: 1)无损压缩:又称为可逆编码(Reversible Coding),解压缩时可完全回复原始数据而不引起任何失真; 2)有损压缩:又称不可逆压缩(Non-Reversible Coding),不能完全恢复原始数据,一定的失真换来可观的压缩比。 根据编码原理可以将图像编码分为: 1)熵编码:熵编码是编码过程中按熵原理不丢失任何信息的编码。熵编码基本原理是给出现概率大的信息符号赋予短码字,出收稿日期:2010-06-10 作者简介;徐飞(1982-),男,福建龙岩人,闽西职业技术学院,助教,理学学士,主要研究方向为数字图象,软件开发,软件测试。ISSN 1009-3044Computer Knowledge and Technology 电脑知识与技术Vol.6,No.23,August 2010,pp.6584-6586,6589E-mail:eduf@https://www.360docs.net/doc/5b17844348.html, https://www.360docs.net/doc/5b17844348.html, Tel:+86-551-56909635690964

图像压缩与编码

实验项目3、图像压缩与编码 一、实验目的 (1)理解图像压缩编码的基本原理; (2)掌握用程序代码实现DCT变换编码; (3)掌握用程序代码实现游程编码。 二、实验原理及知识点 1、图像压缩编码 图像信号经过数字化后,数据量相当大,很难直接进行保存。为了提高信道利用率和在有限的信道容量下传输更多的图像信息,必须对图像进行压缩编码。 图像压缩技术标准一般可分为如下几种:JPEG压缩(JPEG Compression)、JPEG 2000 、H.26X标准(H.26X standards)以及MPEG标准(MPEG standards)。数字压缩技术的性能指标包括:压缩比、平均码字长度、编码效率、冗余度。 从信息论角度分,可以将图像的压缩编码方法分为无失真压缩编码和有限失真编码。前者主要包括Huffman编码、算术编码和游程编码;后者主要包括预测编码、变换编码和矢量量化编码以及运动检测和运动补偿技术。 图像数据压缩的目的是在满足一定图像质量的条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量,在信息论中称为信源编码。图像压缩是通过删除图像数据中冗余的或者不必要的部分来减小图像数据量的技术,压缩过程就是编码过程,解压缩过程就是解码过程。 2、游程编码 某些图像特别是计算机生成的图像往往包含许多颜色相同的块,在这些块中,许多连续的扫描行或者同一扫描行上有许多连续的像素都具有相同的颜色值。在这些情况下就不需要存储每一个像素的颜色值,而是仅仅存储一个像素值以及具有相同颜色的像素数目,将这种编码方法称为游程(或行程)编码,连续的具有相同颜色值的所有像素构成一个行程。 在对图像数据进行编码时,沿一定方向排列的具有相同灰度值的像素可看成是连续符号,用字串代替这些连续符号,可大幅度减少数据量。游程编码记录方式有两种:①逐行记录每个游程的终点列号:②逐行记录每个游程的长度 3、DCT变换编码 变换编码是在变换域进行图像压缩的一种技术。图1显示了一个典型的变换编码系统。 压缩 图像输入图 像N×N 图1 变换编码系统 在变换编码系统中,如果正变换采用DCT变换就称为DCT变换(离散余弦变换)编码系统。DCT用于把一幅图像映射为一组变换系数,然后对系数进行量化和编码。对于大多数的正常图像来说,多数系数具有较小的数值且可以被粗略地量化(或者完全抛弃),而产生的图像失真较小。

浅析动态图像采集压缩技术

浅析动态图像采集压缩技术 【摘要】在互联网飞速发展和广泛普及的今天,在实战中的具体功能、实际威力以及真实效果,使决策者和科技人员获得动态和感性的认识,有身临其境之感。在工业上,需要对一些多变的、有毒的、人类不宜久留的场合进行监测。在医疗上,则需要一些高级专家对异地的病人进行诊断和治疗,这些都是基于高保真实时准动态图像采集压缩和远程传输技术的综合实现。 1 系统设计思想 本系统的设计目标是基于互联网实现远程站点之间的高保真准动态图像的实时传输。整个系统贯彻如下设计思想:发送站点和接收站点都具有对图像质量的控制功能,以适应互联网传输率不稳定的情况;对图像采用多种类型的压缩技术,以适应不同的图像分辨率和环境要求;在互联网信道传输率较差时,能够启动自适应功能。 2 系统设计中的关键技术和优化策略 2.1 视频采集技术分析和选择 为了实时视频采集,需要安装相应的视频采集设备。即视频采集卡和摄像头等。并需要安装相应的驱动软件来支持这些设备的运行。 实际运行过程表明,上述分析是正确的。本系统设计中采用了overlay模式。这一选择对稳定性起到了较好的优化作用。 2.2 视频压缩、解压缩技术的优选和优化 针对视频应用中可能遇到的各种情况,本系统的压缩、解压缩模块设计采用三种压缩方案,使用时可以从中选择一种,以适应不同环境和不同需求。 一是国际通用的高压缩比方案H.263,该方案压缩比高,但图像质量较差,适用于网络传输性能较差的情况,该方案大体符合现场图像的处理要求。二是图像压缩质量最好、算法最先进的MPEG-4方案,该方案图像质量好,但压缩比较低,适用于网络传输性能良好的情况。三是在H.263的基础上作了较大幅度修改和优化的TH.263方案,该方案在压缩比与H.263相近的情况下,图像质量有明显改善。TH.263方案是在对H.263深入分析基础上实施的。通过分析H.263的整个系统程序,得到其设计思想如下:首先将采集到的原始图像划分成8×8的宏块,然后判断此帧是不是关键帧。如果是关键帧,则对每个宏块作DCT (Discrete Cosine Transform)变换,对变换后的视频数据采用视觉能够接受的量化比量化,量化后许多高频分量将变成零,为了最大限度提高压缩编码效果,采用Z形扫描技术将其重新组合,然后对组合串做行程编码,最后对得到的结果进行哈夫曼编码;如果是非关键帧,则对每个宏块先进行运动矢量的计算,然后

图像压缩技术的综述

题目:图像压缩技术的综述 学生姓名:徐欢学号: 系别:计算机与信息学院专业:计算机科学与技术 入学年份:年月 导师姓名:陈蕴谷职称学位:讲师硕士研究生 导师所在单位:中国科学院合肥物质研究院 完成时间年月 .引言 随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。 图像数据是用来表示图像信息的,如果不同的方法为表示相同的信息使用了不同的数据量,那么使用较多数据量的方法中,有些数据必然代表了无用的信息,或者是重复的表示了其他数据表示的信息,前者成为数据冗余,后者成为不相干信息。图像压缩编码的主要目的,就是通过删除冗余的或者是不相干的信息,以尽可能地的数码率来存储和传输数字图像数据。 图像压缩编码技术可以追溯到年提出的电视信号数字化,到今天已经有多年的历史了。在此期间出现了很多种图像压缩编码方法,特别是到了年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。本文对当前最为广泛使用的图像压缩算法进行综述,讨论了它们的优缺点以及发展前景。 图像编码基础 图像编码压缩是指在满足一定图像质量的条件下,用尽可能少的数据量来表示图像。编码技术比较系统的研究始于信息论,从此理论出发可以得到数据压缩的两种基本途径。一种是联合信源的冗余度也寓于信源间的相关性之中,去除他

图像压缩编码

Discussion on Wavelet B ases Selection for Digital Image Compression H AN Fang2f ang,XU Shuang,ZHENG De2zhong (College o f Electric Engineering,Yanshan Univer sity,Qinhuangdao Hebei066004,China) Abstract: This paper studies the selection of optimal wavelet bases.The merits of biorthog onal spline wavelets are dis2 cussed and dem onstrated.C ontinuity of spline derivatives assures wavelets sm ooth and symmetry of biorthog onal wavelets makes the filters have linear phase.Those features can reduce distortion and guarantee the reconstructed images quality. K ey w ords: Optimal wavelet bases;Image com pression;S pline wavelets;Biorthog onal wavelets 关于数字图像压缩中小波基选择问题的探讨① 韩芳芳,徐 爽,郑德忠 (燕山大学,电气工程学院,河北 秦皇岛 066004) 摘要:针对数字图像压缩编码中最优小波基的选择问题,论证了双正交样条小波基的优点,并对其进行了推导。样条小波的导数连续性保证了小波基的光滑性,双正交对偶小波的对称性使得滤波器具有线性相位,可减小失真,保证重构图像的质量。 关键词:最优小波基;图像压缩;样条小波;双正交小波 中图分类号:T N919 文献标识码:A 文章编号:1004-1699(2004)01-0154-04 图像是人类感知信息的重要途径之一。然而图像经过采样及量化编码后数据量巨大,给传输与存储带来很多困难,因而需要对图像数据进行有效的压缩。在F ourier分析基础上发展起来的小波分析,提供了一种自适应的时域和频域同时局部化的分析方法,通过伸缩和平移等运算功能进行多尺度细化分析,能够有效地从信号中提取信息。小波分析用于数字图像压缩,压缩比高,压缩速度快,压缩后信号与图像的特征不变,且在传递过程中可以抗干扰。因此小波分析成为数字图像处理及压缩编码的有力工具。 如何选择最优小波基是图像压缩编码中所面临的一个棘手问题。对于图像信号而言,一方面要对巨大的数据量进行有效压缩,另一方面,要保持重建图像的质量满足视觉要求。小波基的选择存在一些标准,如平滑性、逼近精度、支撑大小和滤波频率等,如何最佳的组合这些特征是一个难点所在。 1 小波基的选择问题 如何最合理、快速的选择小波基,目前这方面的研究并无定论。在小波基的选择中,一般较为看重以下几方面: 平滑性与消失矩。消失矩表明了小波变换后的能量集中程度,消失矩阶数很大时,精细尺度下的高频部分数值有许多是小得可以忽略的(奇异点除外)[1]。从重构图像质量角度而言,平滑性的影响要 2004年3月 传 感 技 术 学 报 第1期 ①收稿日期:2003211210 作者简介:韩芳芳(1978-)女,硕士研究生,主要研究方向为视频信号压缩编码; 徐 爽(1978-)女,硕士研究生,主要研究方向为信号处理与语音编码; 郑德忠(1952-)男,教授,博士生导师,河北省人工智能学会副理事长,中国电子协会高级会员,主要从事信号 处理和先进控制等方面的研究工作,已在国内外发表论文50余篇。qhdzdz@https://www.360docs.net/doc/5b17844348.html,.

图像压缩(JPEG)编码算法及压缩过程的实现

秋风,秋雨,秋天的景色 ?博客园 ?首页 ?博问 ?闪存 ?新随笔 ?联系 ?订阅 ?管理 随笔- 234 文章- 0 评论- 22 图象压缩(JPEG)编码算法及压缩过程的实现转 图象压缩(JPEG)编码算法及压缩过程的实现 摘要 本文首先介绍了静态图像压缩(JPEG)编码算法的基本原理、压缩的实现过程及其重要过程的离散余弦变换(DCT)算法的实现原理及软件实现的例程,其次着重介绍了压缩过程中的DCT、量化和编码三个重要步骤的实现原理。 关键词:图像压缩有损压缩 JPEG 离散余弦变换 DCT 量化 第一章图像压缩编码的综述 1.1 图象压缩的目的和方法 图象的数字化表示使得图象信号可以高质量地传输,并便于图像的检索、分析、处理和存储。但是数字图像的表示需要大量的数据,必须进行数据的压缩。即使采用多种方法对数据进行了压缩,其数据量仍然巨大,对传输介质、传输方法和存储介质的要求较高。因此图象压缩编码技术的研究显得特别有意义,也正

是由于图象压缩编码技术及传输技术的不断发展、更新,推动了现代多媒体技术应用的迅速发展。 1.1.1 图象压缩的目的 图象采样后,如果对之进行简单的8bit量化和PCM编码,其数据量是 巨大的。以CIF(Common Intermediate Format)格式的彩色视频信号为例,若采样速率为25帧/秒,采样样点的Y、U、V分量均为8bit量化,则一秒钟的数据量为: 352×288×3×8×25=60.83Mbit 要传输或存储这样大的数据量是非常困难的,必需对其进行压缩编码,在满足实际需要的前提下,尽量减少要传输或存储的数据量。 虽然数字图象的数据量巨大,但图象数据是高度相关的。一幅图象的内部相邻象素之间,相邻行之间的视频序列中相邻图象之间有大量冗余信息—空间相关性和时间相关性,可以使用各种方法尽量去除这些冗余信息,减少图象的数据量。 除了时间冗余和空间冗余外,在一般的图象数据中还存在信息熵冗余、结构冗余、知识冗余和视觉冗余。各种冗余就是压缩图象数据的出发点。图象编码的目的就在于采用各种方法去除冗余,以尽量少的数据量来表示个重建图象。 1.1.2图象压缩的几种方法 1.统计和字典的压缩方法 常规程序和计算机熵的数据对于那些基于利用统计变种的压缩,效果很好,这些统计变种表现在单个符号的频率以及符号或短语字符串的频率等方面,而基于字典的系统实际山就是假扮统计程序。可是遗憾的是,这类压缩对于连续色调图象的作用并不很好。 这些程序的主要问题产生于这样的一个事实:照片图象的象素广泛地分布在整个范围。如果将图象中的彩色用频率分布画出,那么频率分布图中,没有我们在统计压缩的成功的情况下所看到的“尖峰”状,实际上,如果延长这个分布图,那么从类似于电视那样的生活图象源中得出的分布图会趋于平展。这意味着,每个象素代码彼此是大约相同的出现机会,决定不存在挖掘熵差的任何机会。 基于字典的压缩程序的运行也有类似的问题,基于扫描照片的图象决定没有任何类型的数据特征以产生相同的短语的多次出现。例如,一个栅格化的图象,

图像压缩综述

图像压缩综述 摘要:随着信息时代的不断发展,数字图像处理技术得到了广泛的应用,而作为数字图像处理技术的重要组成部分——数字图像压缩,也得到了迅猛的发展。本文从数字图像压缩的概念、发展历史、图像压缩的必要性和可能性、图像压缩标准、图像压缩基本方法和图像压缩效果评价等方面进行了综述。 引言 在当前这个信息化社会中,新信息技术革命使人类被日益增多的多媒体信息所包围。多媒体信息主要是由图像、文本和声音三大元素组成。图像作为其主要元素之一,发挥着越来越重要的作用。而传输和存储图像需要占用大量的数据空间,这严重影响了传输速率和实时处理量,极大地制约了图像通信的发展。其中,数据量最大的是数字视频数据。未经处理的数字视频信息需要消耗巨大的存储资源,以主流高清视频为例,在分辨率为1280×720,帧率为30帧每秒的视频应用中,存储一分钟的视频信息,需要约18.5G(以常4:2:0视频,每像素12比特)比特存储空间,一部120分钟高清电影约需要2225G比特的存储空间。可见未经处理的视频信息量非常大,为了满足存储和传输需求,视频信息的压缩是十分必要的。在同等的通信容量下,如果图像数据可以压缩之后再传输,就可以使传输的数据量变得很小,也就能够增加通信能力。因此图像压缩编码技术受到了越来越多的关注及广泛的应用。如数码相机、USB摄像头、可视电话、视频点播、视频会议系统、数字监控系统等等,都使用到了图像或视频的压缩技术。 数字图像压缩是以尽可能少的比特数代表图像或图像中所包含的信息量的技术,图像通过压缩处理去掉其中的数据冗余、符号冗余、视觉冗余等各种冗余信息,提高传输速率,节省存储空间。 1图像压缩的发展历史 自1948年提出的电视信号数字化设想后, 即开始了图像压缩的研究,到现在已有60多年的历史。20世纪五六十年代的图像压缩编码主要集中在预测编码、哈夫曼编码等技术的研究,还不成熟。1969年在美国召开的第一届“图像编码会议”,标志着图像编码作为一门独立学科的诞生。到了七八十年代,图像压缩技术的主要成果体现在变换编码技术上, 矢量量化编码技术也有较大的发展。80年代末,小波变换理论、分形理论、人工神经网络理论、视觉仿真理论建立,人们开始突破传统的信源编码理论, 图像压缩编码向着更高的压缩率和更好的压缩质量的方向发展,进入了一个崭新的发展时期。 2图像压缩的可能性 图像之所以能够进行压缩有以下几个方面的原因: 一是原始图像数据是高度相关的,存在很大的数据冗余。如图像内相邻像素之间的空间冗余度、系列图像前后帧之间的时间冗余度、多光谱遥感图像各频谱间的频率域冗余度等,它们造成了大量的比特数浪费,消除这些冗余就可以节约码字,大大减少数据量,达到数据压 缩的目的。 二是信源符号出现的概率不同,若用相同码长表示不同出现概率的符号,就会造成符号冗余度。如果采用可变长编码技术,对出现概率高的符号用短码字,对出现概率低的符号用长码字表示,就可以消除符号冗余度,从而节约码字。 三是人眼具有视觉冗余,允许图像编码有一定的失真。人类视觉系统(HVS)是有缺陷的,人眼对于某些失真不敏感难以察觉。在许多场合中,并不要求经压缩及复原以后的图像和原始图像完全相同,可以允许有少量的失真,只要这些失真并不被人眼所察觉即可。这就为压缩比的提高提供了十分有利的条件,这种有失真的编码称为限失真编码。在多数应用中,人眼往

图像压缩编码的方法概述

图像压缩编码的方法概述摘要:在图像压缩的领域,存在各种各样的压缩方法。不 同的压缩编码方法在压缩比、压缩速度等方面各不相同。本文从压缩方法分类、压缩原理等方面分析了人工神经网络压缩、正交变换等压缩编码方法的实现与效果。 关键词:图像压缩;编码;方法 图像压缩编码一般可以大致分为三个步骤。输入的原始图像首先需要经过映射变换,之后还需经过量化器以及熵编码器的处理最终成为码流输出。 一、图像压缩方法的分类 1.按照原始信息和压缩解码后的信息的相近程度分为以下两类:(1)无失真编码又称无损编码。它要求经过编解码处理后恢复出的图像和原图完全一样,编码过程不丢失任何信息。如果对已量化的信号进行编码,必须注意到量化所产生的失真是不可逆的。所以我们这里所说的无失真是对已量化的信号而言的。特点在于信息无失真,但压缩比有限。(2)限失真编码中会损失部分信息,但此种方法以忽略人的视觉不敏感的次要信息的方法来得到高的压缩比。图像的失真怎么度量,至今没有一个很好的评判标准。在由人眼主观判读的情况下,唯有人眼是对图像质量的最有利评判者。但是人眼视觉机理到现在为止仍为被完全掌握,所以我们很难得到一个和主观评价十分相符的客观标准。目前用的最多的仍是均方误差。这个失真度量标准并不好,之所以广泛应用,是因为方便。

2.按照图像压缩的方法原理可分为以下三类:(1)在图像编码过程中映射变换模块所做的工作是对编码图像进行预测,之后将预测差输出供量化编码,而在接受端将量化的预测差与预测值相加以恢复原图,则这种编码方法称为预测编码。预测编码中,我们只对新的信息进行编码。并且是利用去除邻近像素之间的相关性和冗余性的方法来达到压缩的目的。(2)若压缩编码中的映射变换模块用某种形式的正交变换来代替,则我们把这种方式的编码方法称为变换编码。在变换编码中常用的变换方法有很多,我们主要用到的有离散余弦变换(DCT),离散傅立叶变换(DFT)和离散小波变换(DWT)等。(3)混合编码,LZW算法以及近些年来的一些新的压缩编码方法,最主要的有分形编码算法、小波变换压缩算法、基于模型的压缩算法等。 3.按照压缩对象来分,我们可将图像压缩方法分为静止图像压缩和运动图像压缩。它们所采用的压缩编码标准有所不同,对于静止图像压缩而言,采用的是JPEG、JPEG2000标准;而对运动的图像进行压缩时,我们则采用的是、、、MPEG-1、MPEG-2、MPEG-4、MPEG-7等。 二、常用的图像压缩方法 图像压缩方法至研究开始至今,已经有将近70年的发展了,随着科技的不断发展和人们越来越高的期望和要求,使得图像压缩技术也在不断的发展着,不断的进步着,各种各样的方法层出不穷,争对不同的要求我们可以选择不同的方法对图像进行压缩,以达到

图像压缩研究

记录:云端与存储信息记录材料 2019年4月 第20卷第4期 164 的支持下才可以顺利完成数据存储的综合管理服务,完善数据访问功能,提高数据存储效率。 三是,数据服务层分析。云存储技术具有安全性、便捷性、可用性以及数据访问性等诸多特点,数据服务层作为关键的组成部分,可以为不同用户提供专业性服务,满足不同用户的服务需求,促进行业的有效发展。 四是,用户访问层分析。一般情况下,用户访问层主要涵盖了W E B 端和W A P 端这两种类型,这两种类型在使用阶段有着不同的需求,所以访问手段存在一定差别性,但是都可以保证数据信息的安全性,因此,具有重要意义。 3 基于Web的云存储技术简要分析 Web 作为一种网站服务器,可以向浏览器等Web 客户端提供文档,方便用户浏览信息数据和下载信息数据[3]。但是在科学技术发展迅速的背景下,网络系统中黑客出入频繁,导致数据被盗取的问题频繁发生,严重影响到数据的安全性。因此,企业需要积极使用基于Web 的云存储技术,以下就对这些技术进行简要分析。 对云存储系统的结构进行细致分析,可以详细了解到云存储系统的访问层中涵盖了WEB 端和WAP 端这两种不同的类型,无论是哪一种类型,都是目前云存储技术的主要形式,发挥着重要的作用。WEB 端作为一个访问终端,是基于WEB 的云存储技术的基础,在使用阶段具有无可比拟的优势,具体体现在以下两点:一方面,基于Web 的云存储技术处理效率和传输速度都非常快,能够为人们数据使用提供便利性,有效提高数据传输的效率。另一方面,基于Web 的云存储技术可以进行数据共享、数据快速检索、数据自动被动、多数据文件共同上传与下载等多项工作,具有操作便利等一系列优势,有效节省了工作人员的工作 效率[4]。 随着我国科学技术的迅速发展,我国已经步入了互联网时代,人们依托互联网技术可以随时随地浏览信息,为人们带来了诸多方便。在此种情况下,诸多WEB 服务器应运而生,且做到了业务的跨媒介联通,如,智能手机客户端、移动电话等中都融入了云存储服务系统,让人们浏览信息不再受到时间、地点等多种因素的影响,且可以随时进行网上购物、阅览时事、查看天气预报等多项工作,不仅丰富了人们的业余生活,为人们带来诸多乐趣;还实现了云存储服务业务的拓展,因此,云存储技术使用范围在不断扩大。4 总语 总而言之,云存储技术作为一种新兴的网络存储技术,有效的解决了存储空间的浪费等问题,充分提高了存储率,降低企业运营成本。面对此种情况,企业要想提高工作效率,就需要在Web 服务器中合理使用云存储技术,明确云存储技术及其系统架构,充分做到合理应用,从根本上提高数据存储量,满足时代发展需求。【参考文献】 [1]曾新洲.基于Openstack 的云计算技术与应用专业Web 云盘设计与实现[J].电脑知识与技术,2018,14(20):265-267.[2]周威.对基于Web 的云存储技术的几点探讨[J].电脑迷,2016(4):161. [3]徐岩,万曙静,乔丽娟,等.基于Hadoop 的数字迎新系统的设计与实现[J].电子测试,2017(20):56-57. [4]钟小军,杨磊,黄莉旋,等.农村综合信息服务平台云存储技术研究与应用[J].广东农业科学,2015,42(3):170-176,182. 1 引言 在日常生活中,人们想要以最高效的方法完成某件事情,同样对于计算机而言,想要以最少的空间存储足够多的数据,因此人们想到数据压缩,通俗的讲,数据压缩就是用最少最简单的符号表达最丰富多彩的信息内容,从而达到节约大量空间存储的效果。对于图像而言,亦是如此。例如,揠苗助长这个成语就和数据压缩有关,它用四个汉字描述了一个将近200字的故事,因此数据压缩与我们日常生活息息相关。2 图像压缩的可能性 图像分为位图和矢量图,无论哪一种图像形式都需要较大的存储空间。例如,存储一幅由100直线条组成的矢量图形,需要存储构成图形的线条信息,即需要记录线条的线型线宽和颜色,而且每条直线有起点坐标和终点坐标,图像压缩研究 张路园,陈玉红,魏明月 (河北农业大学理工学院 河北 沧州 061100) 【摘要】随着计算机时代的发展,人们可以利用多媒体计算机存储图像、听音频、做文件等等,因此计算机需要存储大量的数据信息,人们往往希望用最少的存储空间来存储更多的数据信息,利用数据压缩可以实现把一些冗余去掉。图像作为数据信息的一部分,在计算机中有着不可替代的存储形式,论文介绍了图像压缩标准JPEG 和改进后的JPEG2000标准以及动态图像压缩各个标准MPEG 的特点。压缩之后的解压图像往往希望失真较小,使人眼很难分辨与原图像的差别。压缩就是以最少的符号空间来表述更加丰富多彩的内容,这种思想在日常生活领域得到了广泛的应用。【关键词】标准;图像存储;图像处理;图像编码 【中图分类号】TP33 【文献标识码】A 【文章编号】1009-5624(2019)04-0164-02

相关文档
最新文档