基于DCT和DWT的遥感图像压缩算法比较_严俊雄

基于DCT和DWT的遥感图像压缩算法比较_严俊雄
基于DCT和DWT的遥感图像压缩算法比较_严俊雄

第8卷 第19期 2008年10月1671-1819(2008)18-5439-07

科 学 技 术 与 工 程

Sc ience T echno l ogy and Eng i nee ri ng

V ol 18 N o 119 O ct . 2008Z 2008 Sci 1T ech 1Engng 1

基于DCT 和D W T 的遥感图像压缩算法比较

严俊雄

1,2

王 文1

李子扬

2,3

李 安1

陈 勃

1

(中国科学院对地观测与数字地球科学中心,北京100086;中国科学院研究生院2,北京100080;中国科学院光电研究院3,北京100080)

摘 要 由于遥感图像具有数据量大、分辨率高、覆盖范围广、纹理复杂、细节多、灰度变化大、目标小、空间相关性较差等特点,很难对其进行高比例压缩。因此遥感图像的及时显示、共享与数据传输问题,一直是遥感数据存储、处理与分析过程中存在的技术瓶颈。另一方面,在目前网络带宽有限的情况下,这也为G IS(地理信息系统)信息的实时动态应用造成了困难。因此,图像压缩在遥感数据存储、传输与共享等应用上有很重要的作用。探讨应用在遥感领域的DCT (JPEG )和D W T (JPEG 2000,EC W,M R SI D )算法,然后采用基于这些算法的技术工具比较压缩重建后图像的质量。最后,针对不同的遥感应用提出了一些建议。

关键词 DCT D W T 遥感图像 图像压缩中图法分类号 TP75111; 文献标志码 A

2008年6月19日收到 中国科学院知识创新工程青年人才领域

前沿项目资助

第一作者简介:严俊雄(1983)),男,中国科学院对地观测与数学地球科学中心研究生,研究方向:遥感卫星数据处理,E-m ai:l j xy -an@rs gs 1ac 1cn 。

所有图像压缩技术都是通过降低数据冗余度来达到压缩的目的。图像压缩分为无损压缩和有损压缩。无损压缩是指数据经过压缩后信息不受损失,还能完全恢复到压缩前的原样。有损压缩允许压缩过程中损失一定的信息,虽然不能完全恢复图像,但是所损失的部分应对原始图像的影响较小,但却提高了压缩比。根据编码理论,图像压缩又可分为概率统计编码、预测编码,变换编码等。常用的霍夫曼编码、算术编码、游程编码和LZ W 编码就都属于概率统计编码。由于这些编码都是基于图像的统计特性,因此压缩高冗余图像可以获得高压缩比,低冗余图像则对应低压缩比。预测编码则首先预测目标值,然后根据预测值与实际值的差进行量化和编码,最后在接收端解码,根据预测值和解码值重建图像。DPC M (D ifferentia l Pu lse Code M odu lation),作为最重要的预测编码方法,易于硬件实现,在许多领域得到了广泛的应用。它的最大的

弱点是降低了抗误码能力,容易造成误码扩散现象。

随着近年来数学方法与工具的发展,变换编码获得了长足的发展,成为了最有效的压缩方法之一。变换编码的基本思想是从频域(变换域)的角度减小数据相关性,通过正交变换将数据从相关性很强的空间域变换到相关性较弱的变换域,并通过保留方差较大的变换系数,舍弃方差较小的变换系数来实现压缩。常用的变换有K I 变换、DCT 变换、DST 变换、DFT 变换及D WT 变换等。作为最成熟的技术,DCT (D iscrete Cosi n e Transfo r m ,离散余弦变换)在很多领域得到了广泛应用。而D W T (D is -creteW ave letT ransfor m ,离散小波变换)因为其显著的特点也引起了越来越多的注意,许多学者进行了深入的研究。一系列基于DCT 和D W T 的压缩算法和工具涌现出来。本文主要讨论并比较基于DCT 和DWT 的压缩算法。

另外,基于自相似性和尺度变化无限性的分形图像压缩方法能获得相当高的压缩比和很好的压缩效果,具有很大的潜力。但这项技术还不够成熟,在图像压缩领域还不占主导地位。

1 遥感图像压缩的分类

遥感图像压缩可分为星上无损压缩、星上有损

压缩和地面遥感数据压缩。其中为了最大限度地保存传感器所获取的目标信息,星上压缩一般采用无损压缩方法,但当信息量大到无损压缩难以满足要求时,也考虑失真量较小的有损压缩,即高保真压缩方法。另外,为了适应遥感数据采样率较高的特点,星上压缩的实时性要求较高,因而要求压缩方法计算简单、硬件复杂度低。在法国SPOT-1/2/4遥感卫星采用的就是DPC M 编码技术,压缩比为4:3,SP OT -5采用的则是DC T 压缩算法,压缩比约为3:1[1]

本文主要围绕地面遥感图像压缩算法进行讨论。高分辨率的遥感图像一般超过几百兆,这就要求压缩算法具有较大的压缩比,因此一般来说有损压缩和准无损压缩更适用于地面遥感图像的压缩。所谓准无损压缩就是在辐射畸变方面,原始图像与解压后的重建(恢复)图像之间,其同名像元的灰度标准差应小于图像的量化噪声。而在几何畸变方面,点位的精度应在传感器成像系统的畸变差之内。这样既能满足一定的压缩比,又能确保不丢失宝贵的图像信息。在遥感应用中,经常是对某一个地区和某几个地区感兴趣,可以对感兴趣区域进行相应需求的压缩。由于如前所述的遥感图像特征,只靠去除空间冗余很难获得较高的压缩比。

2 基于DCT 和D W T 的遥感图像压缩

211 基于DCT 的JPEG 标准

作为最常用变换编码技术,DCT 是将图像子块从空间域转换到频率域,然后按低频到高频的顺序重排。由于图像频谱从低到高逐渐衰减,可以在一定量化等级下进行舍弃,从而达到压缩的目的。这种变换在信息压缩能力和计算复杂性之间提供了一种很好的平衡

[2]

。基于DCT 的JPEG 标准是由

CC I TT(国际电报电话咨询委员会)和ISO (国际标准化组织)两个组织联合组建的图片专家组(Joint Pho tog raphic Experts Group)在1991年建立并通过的第一个适用于连续色调静止图像压缩的国际标准。JPEG 压缩很好地利用了人眼对图像不同视觉

信息敏感度不同的特性,其核心的离散余弦变换算

法是将空间域的图像变换为频率域的图像后对不同频率域的图像采用不同的量化步长,从而达到保留视觉敏感信息、丢弃视觉不敏感信息的效果。在压缩过程中,图像被细分为8*8的像素块,这些像素块进行从左到右、从上到下的处理(DCT 计算、量化和变长编码分配)。JPEG 是一种对称的压缩,这就是说,压缩和解压的时间基本相同。另外,JPEG 易于硬件实现,因此在图像压缩领域使用最为普遍。Jussi Lar mm i [3]

等认为,当压缩比小于10:1时,以DCT 为基础的JPEG 图像压缩对几何特征不产生明显影响。但是,随着通信技术和网络的发展,这样的压缩率远远不能满足多媒体通讯的需要。最大的问题就是在大压缩比的情况下出现的严重/方块效应0和/边缘效应0。图1中的a 图所示为一幅遥感图像的子区原图像,b 图为使用JPEG 压缩比为20:1的压缩图像。可以看到,压缩后的图像与原图相比有很严重的灰度损失和/方块效应0。

从DCT 的基本原理来看,它在遥感领域的应用不是很有效,有一定的局限性:DCT 编码和解码过程要求大量的二维变换,DCT 压缩的前提是表征图像信息的能量能够集中在变换域内,它才能分离出图像的高频和低频信息,然后对图像的高频部分进图1 (a)原图像 (b)JPEG 压缩后的图像,压缩

比为:20B 1(放大两倍)

行压缩达到压缩图像数据的目的。而高频信息恰恰表征的就是纹理等细节信息,因此,DCT 处理过程很容易造成图像纹理信息的丢失,易产生/方块效应0。虽然很多基于DCT 的算法通过改进企图摒弃这些缺点,而且也有一定的效果,但却又引起别的问题,压缩效果都不是很理想。212 基于D W T 的遥感图像压缩基本原理

目前由多尺度、时频分析、金字塔算法等发展

5440科 学 技 术 与 工 程8卷

起来的小波分析理论成为了遥感图像压缩、处理和分析最有用的工具

[4,5,6]

。小波变换的基本思想是

将信号展开成一族基函数之加权和,即用一族函数来表示或逼近信号或函数,这一族函数是通过基本函数的平移和伸缩得到的。小波变换用于图像编码的基本思想就是对图像进行多分辨率分解,分解成不同空间、不同频率的子图像,然后再对子图像进行系数编码。系数编码是小波变换压缩的核心,其实质是对系数的量化压缩。D W T 能够实现能量的集中,这一点大大改善了压缩质量。选择适合人类视觉系统的小波基函数,也能改善压缩图像的主观效果。基于DWT 的遥感图像压缩步骤是:遥感数据首先被分解,把纹理复杂性作为区域重要性的衡量标准,然后为重要区域进行标码确保重建的图像质量。通过为平坦区(非重要区域)进行矢量编码来达到压缩的目的。基于D WT 的图像压缩编码与解码过程如图2

所示。

图2 基于D W T 的图像压缩编码与解码过程

基于DWT 的图像压缩的主要优点如下:(1)具有较高的压缩比;(2)可以压缩非常大的图像;(3)可以多种分辨率显示影像数据;(4)采用选择性的解压技术能够解压用户需要浏览的整个压缩图像的一部分,解压速度快,可以快速地打开和浏览大的图像;(5)可实现即时、无缝、多分辨率的大量图像浏览,无需等待、无需分块处理、无需软件代理。(6)小波分解和重构算法是循环使用的,易于硬件实现。但是,诸如SPI H T (Set Partition i n g i n H ierar -ch ical Trees)、EZ W (Em bedded Zerotree W ave let)等算法在进行具有复杂纹理、小目标和灰度值变化较

大的遥感图像压缩时还是比较容易损失高频信息。而高频信息恰恰就是目标的边缘和细节信息。目前,在遥感图像压缩应用领域,基于二维离散小波变换的算法比较常用,如J PEG2000、EC W 和MRSI D 等。

J PEG 2000是由联合图像专家组制定的新的国际标准,它是对JPEG 的根本性改进标准。J PEG2000支持有损压缩和无损压缩的兼容,其无损压缩比大约为2:1。JPEG 2000之所以相对于JPEG 标准有了很大的技术飞跃,就是因为它放弃了JPEG 所采用的以离散余弦变换算法为主的区块编码方式,而改用以离散小波变换算法为主的多解析编码方式。JPEG2000以Dav i d Taubm an 的EBC OT

[7]

(Em bedded B lock Coding w ith Opti m ized Truncati o n)算法为基础。EBC OT 编码的主要思想是把嵌入码块编码方法与码块位流的最佳截断方法结合在一起,使重构图像的失真最小。EBC OT 编码算法引入了一个/质量层(quality layers)0的概念,图像的最终码块位流以质量层的形式组织,从而使压缩码流具有了渐进传输、随机访问等优良的特性,也就是说它不需要把整个图像放入内存中就可以浏览和解码数据。在低比特率情况下,JPEG 2000比JPEG 在性能上提升了许多,保持了图像的高保真度

[8]

可以预见,JPEG2000标准将逐渐取代JPEG 标准成为实际的I nter net 图像标准,这也将大大促进遥感图像的共享。图3是一系列经过JPEG2000压缩后遥感图像的子区图,其压缩比分别为117:1、20:1、

30:1,其中117:1是在无损压缩情况下的比率。从视觉效果的结果来看,无损压缩后的图像与原图像几乎没有任何差异。随着压缩比的增加,图像质量越来越模糊,某些图像信息消失(地物损失)。当压缩比为40:1的时候,图像上黑色区域上的公路(白线)消失了大部分。这便是图像压缩后明显的地物目标的损失。

EC W 是增强压缩小波(Enhanced Co m pressed W avelet)的缩写,在遥感压缩领域非常流行。EC W 由澳大利亚E arth Resource M app i n g 公司开发。一般来说,基于D WT 的算法处理过程消耗大量的CP U 与系统内存,并且需要把中间结果存放在硬盘

544119期严俊雄,等:基于DCT 和DW T 的遥感图像压缩算法比较

图3 JPEG2000压缩图像(放大两倍)

上,这样就限制了图像压缩数据的速度和大小。EC W 技术则在离散小波变换和反变换过程上取得了重大突破。它不需要存储中间数据及回调,可以充分利用CPU 的一二级缓存进行过程处理。因此,它对压缩的图像没有限制,可压缩灰度、RGB 以及多波段影像数据,支持GB 、TB 量级的数据压缩,支持各种分辨率。由于EC W 是离散小波局部变换,它在图像内的任一处都具有一致的分辨率和很好的质量。且压缩、解压速度非常快。EC W 技术可压缩超过10TB 大小的数据

[8]

,可以根据不同的源图

像类型选择最适合的子算法。一般来说,如果图像的内容为草地或者沙漠这样的单一地物时,实际的压缩比会比预定压缩比要大;而当图像内容包含大量不同种类的地物时,压缩比会被限定在某个范围内以保证压缩图像的质量。图4为EC W 压缩图像。

MRSI D (M ult-i reso l u ti o n Sea m less I m age D ata -base)是基于离散小波变换的多分辨率无缝影像数据库,由美国LosA la mos 实验室开发。MRSI D 利用D WT 技术对图像进行压缩,内部采用局部变换和多分辨率的金字塔存储结构。MRS I D 支持大压缩比,可根据图像内容和色彩深度调整压缩比,实际压缩

比更加准确。在保证图像的视觉质量前提下,灰度图像压缩比可达15~20:1,彩色图像压缩比可达30~50:1。MRSI D 的优势在于,它通过局部变换,使得图像内部任何一部分都具有一致的分辨率和较好的图像质量。图5为MRS I D 压缩图像(图片中出现的十字叉为压缩软件产生的水印,不影响视觉效果)。图6为分别采用JPEG 、JPEG2000、EC W 和MRSI D 压缩后图像效果的比较图。

为了对上述三种算法的实际效果及效率进行比较,选取一景SPOT -5图像的子区图像作为实验数据,其分辨率为215米,图像大小约为460M 。首先利用各种压缩软件将图像从TI F 格式压缩成不同格式的数据(分别为j2、ec w 和si d 格式),然后再重建图像为T I F 格式进行比较。所有的操作都在不同的预定压缩比下,压缩比分别为2,3,4,5,8,10,12,15,20,30,40,50,60,80及100。实验的硬件环境为:联想PC(312G H z CPU 和1G 内存)。采用的软件分别为ER MAPPER 711(包含J PEG2000和EC W 工具)、Geo Express 610Tria l (包含J PEG2000和MRSI D 工具)

图4 EC W 压缩图像(放大两倍)

5442科 学 技 术 与 工 程8卷

压缩比

实际压缩比压缩时间P S NR

J2000E C W M R S I D 231331121002c45d2c26d5c29d451796343137242818621 331831831002c23d2c13d5c28d431403240164352817391 451141741002c24d2c1d5c28d411076038176152815188 551051451002c7d1c53d5c28d391638237132962813900 881571981001c43d1c32d5c27d361419334172542718307 10913914101001c27d1c21d5c26d351234933198752715864 1210171112121001c19d1c15d5c26d341284732192142712295 1510181315151001c13d1c4d5c26d331304732103522618911 2014191719201001c8d5c3d5c26d311945030196652616279 30201625143010057d47d5c26d301309629165862516721 40281732194010051d46d5c26d291122528185282419240 50331639195010052d44d5c25d281236628124652412795 60411047126010044d45d5c25d271556027180312316996 80571662198010040d42d5c24d261355427120862311313 1006711781710010038d41d5c25d251495126183682212903

图7实验结果图

有损压缩肯定会造成信息损失,但如何衡量压缩图像的质量呢?目前用于评价遥感图像质量的标准有许多种,N II R S(N ational I m agery I nterpre-t ab ility Rati n g Scale美国国家图像解译度分级标准)作为一种定量的主观图像质量标准,将用户的任务需求同遥感图像质量联系起来,是目前西方情报机

5443

19期严俊雄,等:基于DCT和DW T的遥感图像压缩算法比较

构广为使用的一种图像质量标准[9]

。但是,考虑到

地物目标的不确定性,仅从三个方面来比较压缩技术:压缩时间、实际压缩的比率及PSNR 值。

PSNR 计算公式如下:PSNR =10l g

A

2

1

NM

E N i=1E

M

j=1

[f (i ,j )-f c

(i ,j)]

2

其中:f (i ,j)是原图像第i 行、j 列的像素灰度值,f '(i ,j)是重建后图像第i 行、j 列的像素灰度值,A 是f (i ,j )的最大值,M 、N 分别为图像的像素行、

列数。

从上面的实验结果来看,在低压缩比的情况

下,MRSI D 压缩时间约为EC W 和J PEG2000压缩时

图10 PS N R 值比较图

间的两倍,高压缩比情况下约为5倍。从视觉效果来看,EC W 算法在高压缩比情况下的效果更好。J PEG2000、EC W 更适合遥感数据的实时显示、动态发布和网络传输。MRSI D 压缩的实际压缩比与预订压缩比更加吻合,图像质量也较好,因此,MRSI D 可用于遥感图像数据的存储、归档和管理。另外,这三种压缩算法的PSNR 值,在低压缩比下差异较大,而随着压缩比的增加,PS NR 值的差异越来越小。另外,由于GeoExpress 软件为试用版,在产生压缩图像时有一定的水印,因此图像的PSNR 值有一定的影响。但从视觉效果来看整幅图像的质量还是相当不错的。

3 结论

本文主要探讨基于DCT 及DWT 的图像压缩算法在遥感图像领域的应用。基于DCT 的压缩算法在遥感数据分析等方面有一定的局限性(例如JPEG 只能压缩小于64K @64K 的图像

[10]

,图像质量随压

缩倍数增加而下降较快等),但针对存档浏览图等不需对图像细节进行分析的应用还是比较实用的。而基于D W T 的压缩算法能够获得更好的图像质量,JPEG2000压缩速度和重建后的图像质量都不

错,支持无损压缩,且为国际标准,可以成为网络传输的格式标准。MRSI D 算法压缩比准确,图像恢复

5444科 学 技 术 与 工 程

8卷

质量好,适用于遥感数据的存储、归档、管理及影像数据库领域。EC W 技术压缩速度快,压缩图像质量好,对硬件要求低,且有成熟的控件、插件、开发包,便于进行系统集成与开发,可以满足遥感数据在地面传输、存储、归档、实时显示、动态发布等各种应用的需要,必将促进和推动遥感图像数据在地理信息系统的应用。

参 考 文 献

1 王明远1空间遥感数据压缩编码技术的发展1中国航天1

2003;6

2 Gon z alez R C,W ood s R E 1D igit al i m age p rocess i ng ,second ed i ti on 1B eiji ng :Publi sh i ngH ouse of E l ectrics Industry ,20043

J u ssi L ,

Tapan i S 1

I m age co m p ress i on by t he J PEG algo -rit hm 1Photogra mm etri c &Re m ot e S ensi ng ,

1995;

61(10):

1261)1266

4 M allat S G 1A t heory for m ulti resol u tion si gnal deco m pos iti on :

t h e

w avelet rep res en tati on .I EEE Trans Patt ern Anal ysis and M achine In -telli gence ,1989;(11):674)693

5 W ervett o S D ,Ra m chand ran K,Orc h ard M T 1I m age cod i ng based

on a m orph ol og i ca l rep resen tati on ofw avel et data 1I EEE Trans on I m-age Proces s i ng ,1999;8(9):161)174

6 谢 岩,陈圣波1基于小波变换的遥感影像压缩编码1吉林大学学报(地球科学版),2004;34:159)164

7 M ary li ne D S C,Lars son M 1J PEG2000,

t h e next m illenn i u m co m-

p ress i on s t andard f or still i m ages 1I EEE I CM CS p 99,1999;131)1328 ER M apper Ltd 1I m age co m press i on:EC W J PEG2000SDK 1E arth

Resou rce M app i ng ,2006

9 Sh iH W 1A re mote sen si ng i m age qu alit y st andard ori en ti ng to u ser p s m i ss i on requ i re men ts )))NII RS 1Spacecraft Recovery &Re m ote Sen si ng ,2003;24(3):30)35

10 孙水发,张华熊,仇佩亮1J PEG2000)))新的静止图像压缩标准1计算机辅助设计与图形学学报,2003;15(11)

Co mparison of A l gorithm s Based on DCT and D W T

i n Rem ote Sensi ng Im age Co mpression

YAN Jun-x iong 1,2

,WANG W en 1

,LI Z-i yang 2,3

,LI An 1

,C H EN Bo

1

(Cen ter f or Earth Observation and D i gitalE arth ,Ch i nese Acad e my of Sciences 1,B eiji ng 100086,P 1R 1C h i na ;

G raduate Un i versity of t he Ch i neseA cad e my of Sci en ces 2,Beiji ng ,P 1R 1Ch i na ,100080;A cade m y of Opto -E l ectron i cs ,C hinese A cade m y of S ci ences 3,Beijing ,P 1R 1Ch i n a ,100080)

[Abstract] Due to t h e spec i a l characteristi c s such as large size ,high -reso l u ti o n ,w ide coverage ,s m all targets ,co m p l e x texture ,m ore deta ils ,and poor spatial corre lation ,re m ote sensi n g i m age can not be easily co m pressed a t a high ratio 1It is difficult to share and trans m it the i m age data i n ti m e as w ell as d isp l a y 1Th is is so -ca lled /techno -l o g ica l bo ttleneck 0ex isti n g in data arch i v i n g and data ana lysis 1On the o ther hand ,the ne t w ork bandw i d th is too li m ited to ach ieve a dyna m ic and rea-l ti m e G I S Infor m ation app lication 1So i m age co mpressi o n p l a ys an i n creasi n g ly i m portant role i n re m o te sensing data share 1Th is paper m a i n l y d iscusses the algorith m s and techniques based on DCT (JPEG )and D WT (JPEG2000,EC W and MRSI D )in re m ote sensi n g i m age co mpressi o n ,and then co m pare t h e quality of co m pressed i m ages by using these a l g orit h m s or techn i q ues 1Fina lly ,suggesti o n is g i v en to select a su itable algorith m or technique for re m o te sensi n g data app lications 1

[Key words] DCT D W T re m ote sensing i m age i m age co m pressi o n

544519期严俊雄,等:基于DCT 和DW T 的遥感图像压缩算法比较

图像压缩算法的分析与研究本科毕业设计论文

图像压缩算法的分析与研究本科毕业设计论文 河南理工大学 本科毕业设计 图像压缩算法的分析与研究 摘? 要 随着多媒体技术和通讯技术的不断发展, 多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求, 也给现有的有限带宽以严峻的考验, 特别是具有庞大数据量的数字图像通信, 更难以传输和存储, 极大地制约了图像通信的发展, 因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩, 可以减轻图像存储和传输的负担, 使图像在网络上实现快速传输和实时处理。 本文主要介绍数字图像处理的发展概况,图像压缩处理的原理和特点,对多种压缩编码方法进行描述和比较,详细讨论了Huffman编码的图像压缩处理的原理和应用。 关键词:图像处理,图像压缩,压缩算法,图像编码,霍夫曼编码

Abstract With the developing of multimedia technology and communication technology, multimedia entertainment, information, information highway have kept on data storage and transmission put forward higher requirements, but also to the limited bandwidth available to a severe test, especially with large data amount of digital image communication, more difficult to transport and storage, greatly restricted the development of image communication, image compression techniques are therefore more and more attention. The purpose of image compression is to exhaust the original image less the larger the bytes and transmission, and requires better quality of reconstructed images. Use of image compression, image storage

图像压缩算法论文

算法论文 基于huffman编码的图像压缩技术 姓名:康凯 学院:计算机学院 专业:网络工程1102 学号:201126680208 摘要 随着多媒体技术和通讯技术的不断发展, 多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求, 也给现有的有限带宽以严峻的考验, 特别是具有庞大数据量的数字图像通信, 更难以传输和存储, 极大地制约了图像通信的发展, 因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩, 可以减轻图像存储和传输的负担, 使图像在网络上实现快速传输和实时处理。 本文主要介绍数字图像处理的发展概况,图像压缩处理的原理和特点,对多种压缩编码方法进行描述和比较,详细讨论了Huffman编码的图像压缩处理的原理和应用。 关键词:图像处理,图像压缩,压缩算法,图像编码,霍夫曼编码 Abstract With the developing of multimedia technology and communication technology, multimedia entertainment, information, information highway have kept on data storage and transmission put forward higher requirements, but also to the limited bandwidth available to a severe test, especially with large data amount of digital image communication, more difficult to transport and storage, greatly restricted the development of image communication, image compression techniques are therefore more and more attention. The purpose of image compression is to exhaust the original image less the larger the bytes and transmission, and requires better quality of

JPEG图像压缩算法及其实现

多媒体技术及应用 JPEG图像压缩算法及其实现 罗群书 0411102班 2011211684

一、JEPG压缩算法(标准) (一)JPEG压缩标准 JPEG(Joint Photographic Experts Group)是一个由ISO/IEC JTC1/SC2/WG8和CCITT VIII/NIC于1986年底联合组成的一个专家组,负责制定静态的数字图像数据压缩编码标准。迄今为止,该组织已经指定了3个静止图像编码标准,分别为JPEG、JPEG-LS和JPEG2000。这个专家组于1991年前后指定完毕第一个静止图像压缩标准JPEG标准,并且成为国际上通用的标准。JPEG标准是一个适用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。 JPEG专家组开发了两种基本的静止图像压缩算法,一种是采用以离散余弦变换(Discrete Cosine Transform, DCT)为基础的有损压缩算法,另一种是采用以预测技术为基础的无损压缩算法。使用无损压缩算法时,其压缩比比较低,但可保证图像不失真。使用有损压缩算法时,其算法实现较为复杂,但其压缩比大,按25:1压缩后还原得到的图像与原始图像相比较,非图像专家难于找出它们之间的区别,因此得到了广泛的应用。 JPEG有4种工作模式,分别为顺序编码,渐近编码,无失真编码和分层编码,他们有各自的应用场合,其中基于顺序编码工作模式的JPEG压缩系统也称为基本系统,该系统采用单遍扫描完成一个图像分量的编码,扫描次序从左到右、从上到下,基本系统要求图像像素的各个色彩分量都是8bit,并可通过量化线性地改变DCT系统的量化结果来调整图像质量和压缩比。下面介绍图像压缩采用基于DCT的顺序模式有损压缩算法,该算法下的JPEG压缩为基本系统。 (二)JPEG压缩基本系统编码器 JPEG压缩是有损压缩,它利用了人的视觉系统的特性,将量化和无损压缩编码相结合来去掉视觉的冗余信息和数据本身的冗余信息。基于基本系统的JPEG压缩编码器框图如图1所示,该编码器是对单个图像分量的处理,对于多个分量的图像,则首先应将图像多分量按照一定顺序和比例组成若干个最小压缩单元(MCU),然后同样按该编码器对每个MCU各个分量进行独立编码处理,最终图像压缩数据将由多个MCU压缩数据组成。 图1 JPEG压缩编码器结构框图

JPEG2000图像压缩算法标准剖析

JPEG2000图像压缩算法标准 摘要:JPEG2000是为适应不断发展的图像压缩应用而出现的新的静止图像压缩标准。本文介绍了JPEG2000图像编码系统的实现过程, 对其中采用的基本算法和关键技术进行了描述,介绍了这一新标准的特点及应用场合,并对其性能进行了分析。 关键词:JPEG2000;图像压缩;基本原理;感兴趣区域 引言 随着多媒体技术的不断运用,图像压缩要求更高的性能和新的特征。为了满足静止图像在特殊领域编码的需求,JPEG2000作为一个新的标准处于不断的发展中。它不仅希望提供优于现行标准的失真率和个人图像压缩性能,而且还可以提供一些现行标准不能有效地实现甚至在很多情况下完全无法实现的功能和特性。这种新的标准更加注重图像的可伸缩表述。所以就可以在任意给定的分辨率级别上来提供一个低质量的图像恢复,或者在要求的分辨率和信噪比的情况下提取图像的部分区域。 1.JPEG2000的基本介绍及优势 相信大家对JPEG这种图像格式都非常熟悉,在我们日常所接触的图像中,绝大多数都是JPEG格式的。JPEG的全称为Joint Photographic Experts Group,它是一个在国际标准组织(ISO)下从事静态图像压缩标准制定的委员会,它制定出了第一套国际静态图像压缩标准:ISO 10918-1,俗称JPEG。由于相对于BMP等格式而言,品质相差无己的JPEG格式能让图像文件“苗条”很多,无论是传送还是保存都非常方便,因此JPEG格式在推出后大受欢迎。随着网络的发展,JPEG的应用更加广泛,目前网站上80%的图像都采用JPEG格式。 但是,随着多媒体应用领域的快速增长,传统JPEG压缩技术已无法满足人们对数字化多媒体图像资料的要求:网上JPEG图像只能一行一行地下载,直到全部下载完毕,才可以看到整个图像,如果只对图像的局部感兴趣也只能将整个图片载下来再处理;JPEG格式的图像文件体积仍然嫌大;JPEG格式属于有损压缩,当被压缩的图像上有大片近似颜色时,会出现马赛克现象;同样由于有损压缩的原因,许多对图像质量要求较高的应用JPEG无法胜任。 JPEG2000是为21世纪准备的压缩标准,它采用改进的压缩技术来提供更高的解像度,其伸缩能力可以为一个文件提供从无损到有损的多种画质和解像选择。JPEG2000被认为是互联网和无线接入应用的理想影像编码解决方案。 “高压缩、低比特速率”是JPEG2000的目标。在压缩率相同的情况下,JPEG2000的信噪比将比JPEG提高30%左右。JPEG2000拥有5种层次的编码形式:彩色静态画面采用的JPEG 编码、2值图像采用的JBIG、低压缩率图像采用JPEGLS等,成为应对各种图像的通用编码方式。在编码算法上,JPEG2000采用离散小波变换(DWT)和bit plain算术编码(MQ coder)。此外,JPEG2000还能根据用户的线路速度以及利用方式(是在个人电脑上观看还是在PDA上观看),以不同的分辨率及压缩率发送图像。 JPEG2000的制定始于1997年3月,但因为无法很快确定算法,因此耽误了不少时间,直到2000年 3 月,规定基本编码系统的最终协议草案才出台。目前JPEG2000已由ISO和

图像压缩算法

《算法设计与分析》课程报告 姓名:文亮 学号:201322220254 学院:信息与软件工程学院 老师:屈老师;王老师

算法实现与应用——《算法设计与分析》课程报告 一. 基本要求 1. 题目: 图像压缩 2. 问题描述 掌握基于DCT 变换的图像压缩的基本原理及其实现步骤;对同一幅原 始图像进行压缩,进一步掌握DCT 和图像压缩。 3. 算法基本思想 图像数据压缩的目的是在满足一定图像质量的条件下,用尽可能少的比特数来表示原始图像,以提高图像传输的效率和减少图像存储的容量,在信息论中称为信源编码。图像压缩是通过删除图像数据中冗余的或者不必要的部分来减小图像数据量的技术,压缩过程就是编码过程,解压缩过程就是解码过程。压缩技术分为无损压缩和有损压缩两大类,前者在解码时可以精确地恢复原图像,没有任何损失;后者在解码时只能近似原图像,不能无失真地恢复原图像。 假设有一个无记忆的信源,它产生的消息为{}N ≤≤i a i 1,其出现的概率是已知的,记为()i a p 。则其信息量定义为: ()()i i a p a log -=I 由此可见一个消息出现的可能性越小,其信息量就越多,其出现对信息的贡献量越大,反之亦然。 信源的平均信息量称为“熵”(entropy ),可以表示为: ()()[]()()∑∑==-=?=H N i i i N i i i a p a p a p I a p 1 1 log 对上式取以2为底的对数时,单位为比特(bits ): ()()∑=-=H N i i i a p a p 1log 根据香农(Shannon )无噪声编码定理,对于熵为H 的信号源,对其进行无

图像压缩算法性能的测试与分析工具

图像压缩算法性能的测试与分析工具1 蔡正兴,张虹 中国矿业大学计算机科学与技术学院,江苏徐州 (221008) 摘要:本文研究了图像压缩算法性能的评价方法,提出了图像压缩算法性能的测试算法,包括横向比较测试和纵向分解测试,并在此基础上设计并实现了压缩算法性能的测试与分析工具。该工具能够测试和分析压缩算法的性能,并自动生成各种分析图表,为用户提供了方便,具有较大的实用价值。为了提高评价的效率、准确性和全面性,文中提出了测试图像的选择方法和测试结果的分析方法,具有一定的理论意义。 关键词:压缩性能,测试方法,分析方法,图像选择方法 1. 引言 近年来,图像压缩得到快速发展[1],各种算法层出不穷,比如有损的压缩算法可以在低失真的条件下达到高压缩比[2,3],而无损的压缩算法则可以保证重建图像的无失真[4]。因此在实际应用中得知各种压缩算法的性能及特点是必要的。在评价图像压缩算法性能时主要考虑压缩比、重建质量、时间复杂度、空间复杂度和实现代价这几个方面[5],其中较为重要的是压缩比、重建质量和时间复杂度。为了计算这些压缩性能指标,常常使用一些工具软件,比如在图像处理领域广泛使用的MATLAB系列软件,它提供了大量的内置函数[6],操作方便,功能强大,但它不是评价图像压缩算法性能的专业工具,需要进行二次开发,不能有效的分析和评价压缩性能。其次,利用性能指标来评价压缩方法,尽管方便快捷,但还不能反映图像压缩算法的全部特点。例如,在考虑变换编码系统的失真性质时,一般采用MSE(均方误差),有时利用MSE计算得到的重建质量很好,但视觉效果却不好,这是因为MSE对图像中的失真显著性不敏感[7],可见,性能指标仅仅是对压缩算法进行宏观上的评价,无法评价每个过程对压缩性能的影响。再次,在评价压缩性能时,不可避免地要使用测试图像,用户在选择测试图像时带有随机性,不利于全面地评价压缩方法。针对这些不足,本文设计了图像压缩算法性能的测试与分析工具——AutoTA。AutoTA的目标是自动地对图像压缩算法进行测试与分析,并生成各种分析图表,全面的评价图像压缩算法的性能。AutoTA具有广泛的应用前景,科研人员利用AutoTA可横向比较各种压缩算法的性能,也可纵向分析压缩算法的特点;工程技术人员也可以根据AutoTA的测试结果,在实际应用中选择合适的图像压缩算法。 2. 压缩算法性能指标 压缩性能指标是评价压缩算法的重要方面,也是AutoTA分析图像压缩算法性能的重要依据,下面将描述相关的性能指标。 2.1压缩比 压缩比是指压缩过程中输入数据量和输出数据量之比,反映了图像压缩算法的压缩性能,当压缩比小于1时为正压缩,当压缩比大于1时为负压缩。压缩比的计算公式为: 1本课题得到国家自然科学基金项目(编号:60372102)、教育部博士点基金项目(编号:20030290011)、软件新技术国家重点实验室课题(编号:A200309)资助。

图像压缩(JPEG)编码算法及压缩过程的实现

秋风,秋雨,秋天的景色 ?博客园 ?首页 ?博问 ?闪存 ?新随笔 ?联系 ?订阅 ?管理 随笔- 234 文章- 0 评论- 22 图象压缩(JPEG)编码算法及压缩过程的实现转 图象压缩(JPEG)编码算法及压缩过程的实现 摘要 本文首先介绍了静态图像压缩(JPEG)编码算法的基本原理、压缩的实现过程及其重要过程的离散余弦变换(DCT)算法的实现原理及软件实现的例程,其次着重介绍了压缩过程中的DCT、量化和编码三个重要步骤的实现原理。 关键词:图像压缩有损压缩 JPEG 离散余弦变换 DCT 量化 第一章图像压缩编码的综述 1.1 图象压缩的目的和方法 图象的数字化表示使得图象信号可以高质量地传输,并便于图像的检索、分析、处理和存储。但是数字图像的表示需要大量的数据,必须进行数据的压缩。即使采用多种方法对数据进行了压缩,其数据量仍然巨大,对传输介质、传输方法和存储介质的要求较高。因此图象压缩编码技术的研究显得特别有意义,也正

是由于图象压缩编码技术及传输技术的不断发展、更新,推动了现代多媒体技术应用的迅速发展。 1.1.1 图象压缩的目的 图象采样后,如果对之进行简单的8bit量化和PCM编码,其数据量是 巨大的。以CIF(Common Intermediate Format)格式的彩色视频信号为例,若采样速率为25帧/秒,采样样点的Y、U、V分量均为8bit量化,则一秒钟的数据量为: 352×288×3×8×25=60.83Mbit 要传输或存储这样大的数据量是非常困难的,必需对其进行压缩编码,在满足实际需要的前提下,尽量减少要传输或存储的数据量。 虽然数字图象的数据量巨大,但图象数据是高度相关的。一幅图象的内部相邻象素之间,相邻行之间的视频序列中相邻图象之间有大量冗余信息—空间相关性和时间相关性,可以使用各种方法尽量去除这些冗余信息,减少图象的数据量。 除了时间冗余和空间冗余外,在一般的图象数据中还存在信息熵冗余、结构冗余、知识冗余和视觉冗余。各种冗余就是压缩图象数据的出发点。图象编码的目的就在于采用各种方法去除冗余,以尽量少的数据量来表示个重建图象。 1.1.2图象压缩的几种方法 1.统计和字典的压缩方法 常规程序和计算机熵的数据对于那些基于利用统计变种的压缩,效果很好,这些统计变种表现在单个符号的频率以及符号或短语字符串的频率等方面,而基于字典的系统实际山就是假扮统计程序。可是遗憾的是,这类压缩对于连续色调图象的作用并不很好。 这些程序的主要问题产生于这样的一个事实:照片图象的象素广泛地分布在整个范围。如果将图象中的彩色用频率分布画出,那么频率分布图中,没有我们在统计压缩的成功的情况下所看到的“尖峰”状,实际上,如果延长这个分布图,那么从类似于电视那样的生活图象源中得出的分布图会趋于平展。这意味着,每个象素代码彼此是大约相同的出现机会,决定不存在挖掘熵差的任何机会。 基于字典的压缩程序的运行也有类似的问题,基于扫描照片的图象决定没有任何类型的数据特征以产生相同的短语的多次出现。例如,一个栅格化的图象,

PNG图像的压缩算法

PNG图像格式的压缩算法 便携式网络图形(Portable Network Graphics)简称为PNG,它是一种无损压缩的位图图形格式,其含有以下几种特性: 1、支持256色调色板技术以产生小体积文件 2、支持最高48位真彩色图像以及16位灰度图像 3、支持阿尔法通道(Alpha Channel,表示图片的透明度和半透明度)的透明/半透明 性 4、支持图像亮度的伽马校正(Gamma校准,用来针对影片或是影像系统里对于光线的 辉度 (luminance) 或是三色刺激值 (tristimulus values)所进行非线性的运算或 反运算)信息 5、使用了无损压缩的算法 6、使用了循环冗余校验(CRC,用来检测或校验数据传输或者保存后可能出现的错误) 防止文件出错 一、 PNG格式的文件结构 PNG定义了两种类型的数据块:一种是PNG文件必须包含、读写软件也都必须要支持的关键块(critical chunk);另一种叫做辅助块(ancillary chunks),PNG允许软件忽略它不认识的附加块。这种基于数据块的设计,允许PNG格式在扩展时仍能保持与旧版本兼容。 关键数据块中有4个标准数据块: 1、文件头数据块IHDR(header chunk):包含有图像基本信息,作为第一个数据块出现 并只出现一次。 2、调色板数据块PLTE(palette chunk):必须放在图像数据块之前。 3、图像数据块IDAT(image data chunk):存储实际图像数据。PNG数据允许包含多个 连续的图像数据块。 4、图像结束数据IEND(image trailer chunk):放在文件尾部,表示PNG数据流结束 二、PNG格式文件的压缩算法 PNG格式文件采用的是从LZ77派生的一个称为DEFLATE的非专利无失真式压缩算法,这个算法对图像里的直线进行预测然后存储颜色差值,这使得PNG经常能获得比原始图像更大的压缩率。

图像无损压缩算法综述

图像无损压缩算法综述 【摘要】本文介绍了常见的图像无损压缩方法:静态及动态霍夫曼(Huffman)编码算法、算术编码算法、LZW ( lanpel-ziv-velch)编码及其改进算法、行程编码(又称游程编码,RLE)及改进自适应游程编码算法、费诺-香农编码算法和一种改进的编码方法。简要分析了各种算法的优缺点。 【关键词】霍夫曼算术编码 LZW 行程编码费诺-香农编码 1 前言 随着技术的不断发展,多媒体技术和通讯技术等对信息数据的存储和传输也提出了更高的要求,给现有的有限带宽带来更严峻的考验,尤其是具有庞大数据量的数字图像通信。存储和传输的高难度极大地制约了图像通信的发展,因此对图像信息压缩技术的研究受到了越来越多的关注。压缩数据量是图像压缩的首要目的,但保证压缩后图像的质量也是非常重要的,无损压缩是指能精确恢复原始图像数据的压缩方法,其在编码压缩过程中没有图像信号的损失。本文介绍了常见的无损压缩方法:静态及动态霍夫曼(Huffman)编码算法、算术编码算法、LZW ( lanpel-ziv-velch)编码及其改进算法、行程编码(又称游程编码,RLE)及改进自适应游程编码算法、费诺-香农编码算法和一种改进的编码方法。 2 常见图像无损压缩算法 2.1 霍夫曼算法 Huffman算法是一种用于数据压缩的算法,由D.A.Huffman最先提出。它完全依据字符出现概率来构造平均长度最短的编码,有时称之为最佳编码,一般叫做Huffman编码。频繁使用的数据用较短的代码代替,较少使用的数据用较长的代码代替,每个数据的代码各不相同。这些代码都是二进制码,且码的长度是可变的。 2.1.1 静态霍夫曼编码 步骤:

JEPG压缩算法

一、JEPG压缩算法(标准) (一)JPEG压缩标准 JPEG(Joint Photographic Experts Group)是一个由ISO/IEC JTC1/SC2/WG8和CCITT VIII/NIC于1986年底联合组成的一个专家组,负责制定静态的数字图像数据压缩编码标准。迄今为止,该组织已经指定了3个静止图像编码标准,分别为JPEG、JPEG-LS和JPEG2000。这个专家组于1991年前后指定完毕第一个静止图像压缩标准JPEG标准,并且成为国际上通用的标准。JPEG标准是一个适用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。 JPEG专家组开发了两种基本的静止图像压缩算法,一种是采用以离散余弦变换(Discrete Cosine Transform, DCT)为基础的有损压缩算法,另一种是采用以预测技术为基础的无损压缩算法。使用无损压缩算法时,其压缩比比较低,但可保证图像不失真。使用有损压缩算法时,其算法实现较为复杂,但其压缩比大,按25:1压缩后还原得到的图像与原始图像相比较,非图像专家难于找出它们之间的区别,因此得到了广泛的应用。 JPEG有4种工作模式,分别为顺序编码,渐近编码,无失真编码和分层编码,他们有各自的应用场合,其中基于顺序编码工作模式的JPEG压缩系统也称为基本系统,该系统采用单遍扫描完成一个图像分量的编码,扫描次序从左到右、从上到下,基本系统要求图像像素的各个色彩分量都是8bit,并可通过量化线性地改变DCT系统的量化结果来调整图像质量和压缩比。下面介绍图像压缩采用基于DCT的顺序模式有损压缩算法,该算法下的JPEG压缩为基本系统。 (二)JPEG压缩基本系统编码器 JPEG压缩是有损压缩,它利用了人的视觉系统的特性,将量化和无损压缩编码相结合来去掉视觉的冗余信息和数据本身的冗余信息。基于基本系统的JPEG压缩编码器框图如图1所示,该编码器是对单个图像分量的处理,对于多个分量的图像,则首先应将图像多分量按照一定顺序和比例组成若干个最小压缩单元(MCU),然后同样按该编码器对每个MCU各个分量进行独立编码处理,最终图像压缩数据将由多个MCU压缩数据组成。

bmp图像压缩算法详细解析

问题:将一张bmp图像的灰度值压缩存储到一个中间文件,然后利用中间文件还原这张图片。 初一看,这应该是两个程序吧,一个压缩程序一个解压程序。那就先压缩好喽,恩,压缩...可是要怎么读取它的灰度值呀?文件里不会只保存它的灰度值吧,点开属性,发现这是一张256*192的图片,如果图片文件里只有灰度值,那么大小应该是256*192 B,而实际大小是50230字节。。可见还有其它信息,根据经验,应该还有一个对图像的描述信息吧,这样那些图像显示程序才能知道以怎样的方式去显示它,毕竟不是所有的bmp图片都是灰度图片。额,只好求助百度了.............经过整理,我把bmp图像编码格式发到下面。 BMP文件被分成4个部分:位图文件头(Bitmap File Header)、位图信息(BitmapInfoHeader)、颜色表(Color Map)和位图数据(即图像数据,Data Bits或Data Body) 第1部分为位图文件头BITMAPFILEHEADER,是一个结构体类型,该结构的长度是固定的,为14个字节。其定义如下: typedef struct tagBITMAPFILEHEADER { WORD bfType; 位图文件类型,必须是0x424D,即字符串“BM” DWORD bfSize; 位图文件大小,包括这14个字节。 WORD bfReserved1; Windows保留字,暂不用。 WORD bfReserved2; Windows保留字,暂不用。 DWORD bfOffBits; 从文件头到实际的位图数据的偏移字节数 } BITMAPFILEHEADER, FAR *LPBITMAPFILEHEADER, *PBITMAPFILEHEADER; 第2部分为位图信息头BITMAPINFOHEADER,也是一个结构体类型的数据结构,该结构的长度也是固定的,为40个字节(WORD为无符号16位整数,DWORD为无符号32位整数,LONG为32位整数)。其定义如下: typedef struct tagBITMAPINFOHEADER { DWORD biSize; 本结构的长度,为40个字节。 LONG biWidth; 位图的宽度,以像素为单位。 LONG biHeight; 位图的高度,以像素为单位. WORD biPlanes; 目标设备的级别,必须是1。 WORD biBitCount 每个像素所占的位数(bit),其值必须为1(黑白图像)、4(16色图)8 (256色)、24(真彩色图),新的BMP格式支持32位色。 DWORD biCompression; 位图压缩类型,有效的值为BI_RGB(未经压缩)、BI_RLE8、BI_RLE4、BI_BITFILEDS(均为Windows定义常量)。这里只讨论未经压缩的情况,即biCompression=BI_RGB。

图像压缩技术的综述

题目:图像压缩技术的综述 学生姓名:徐欢学号:070110117 系别:计算机与信息学院专业:计算机科学与技术 入学年份:2010年9月 导师姓名:陈蕴谷职称/学位:讲师/硕士研究生 导师所在单位:中国科学院合肥物质研究院 完成时间:2014年4月 1.引言 随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。 图像数据是用来表示图像信息的,如果不同的方法为表示相同的信息使用了不同的数据量,那么使用较多数据量的方法中,有些数据必然代表了无用的信息,或者是重复的表示了其他数据表示的信息,前者成为数据冗余,后者成为不相干信息。图像压缩编码的主要目的,就是通过删除冗余的或者是不相干的信息,以尽可能地的数码率来存储和传输数字图像数据。 图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有50多年的历史了。在此期间出现了很多种图像压缩编码方法,特别是到了80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。本文对当前最为广泛使用的图像压缩算法进行综述,讨论了它们的优缺点以及发展前景。 图像编码基础 图像编码压缩是指在满足一定图像质量的条件下,用尽可能少的数据量来表示图像。编码技术比较系统的研究始于Shannon信息论,从此理论出发可以得到数据压缩的两种基本途径。一种是联合信源的冗余度也寓于信源间的相关性之

图像压缩综述

图像压缩综述 摘要:随着信息时代的不断发展,数字图像处理技术得到了广泛的应用,而作为数字图像处理技术的重要组成部分——数字图像压缩,也得到了迅猛的发展。本文从数字图像压缩的概念、发展历史、图像压缩的必要性和可能性、图像压缩标准、图像压缩基本方法和图像压缩效果评价等方面进行了综述。 引言 在当前这个信息化社会中,新信息技术革命使人类被日益增多的多媒体信息所包围。多媒体信息主要是由图像、文本和声音三大元素组成。图像作为其主要元素之一,发挥着越来越重要的作用。而传输和存储图像需要占用大量的数据空间,这严重影响了传输速率和实时处理量,极大地制约了图像通信的发展。其中,数据量最大的是数字视频数据。未经处理的数字视频信息需要消耗巨大的存储资源,以主流高清视频为例,在分辨率为1280×720,帧率为30帧每秒的视频应用中,存储一分钟的视频信息,需要约18.5G(以常4:2:0视频,每像素12比特)比特存储空间,一部120分钟高清电影约需要2225G比特的存储空间。可见未经处理的视频信息量非常大,为了满足存储和传输需求,视频信息的压缩是十分必要的。在同等的通信容量下,如果图像数据可以压缩之后再传输,就可以使传输的数据量变得很小,也就能够增加通信能力。因此图像压缩编码技术受到了越来越多的关注及广泛的应用。如数码相机、USB摄像头、可视电话、视频点播、视频会议系统、数字监控系统等等,都使用到了图像或视频的压缩技术。 数字图像压缩是以尽可能少的比特数代表图像或图像中所包含的信息量的技术,图像通过压缩处理去掉其中的数据冗余、符号冗余、视觉冗余等各种冗余信息,提高传输速率,节省存储空间。 1图像压缩的发展历史 自1948年提出的电视信号数字化设想后, 即开始了图像压缩的研究,到现在已有60多年的历史。20世纪五六十年代的图像压缩编码主要集中在预测编码、哈夫曼编码等技术的研究,还不成熟。1969年在美国召开的第一届“图像编码会议”,标志着图像编码作为一门独立学科的诞生。到了七八十年代,图像压缩技术的主要成果体现在变换编码技术上, 矢量量化编码技术也有较大的发展。80年代末,小波变换理论、分形理论、人工神经网络理论、视觉仿真理论建立,人们开始突破传统的信源编码理论, 图像压缩编码向着更高的压缩率和更好的压缩质量的方向发展,进入了一个崭新的发展时期。 2图像压缩的可能性 图像之所以能够进行压缩有以下几个方面的原因: 一是原始图像数据是高度相关的,存在很大的数据冗余。如图像内相邻像素之间的空间冗余度、系列图像前后帧之间的时间冗余度、多光谱遥感图像各频谱间的频率域冗余度等,它们造成了大量的比特数浪费,消除这些冗余就可以节约码字,大大减少数据量,达到数据压 缩的目的。 二是信源符号出现的概率不同,若用相同码长表示不同出现概率的符号,就会造成符号冗余度。如果采用可变长编码技术,对出现概率高的符号用短码字,对出现概率低的符号用长码字表示,就可以消除符号冗余度,从而节约码字。 三是人眼具有视觉冗余,允许图像编码有一定的失真。人类视觉系统(HVS)是有缺陷的,人眼对于某些失真不敏感难以察觉。在许多场合中,并不要求经压缩及复原以后的图像和原始图像完全相同,可以允许有少量的失真,只要这些失真并不被人眼所察觉即可。这就为压缩比的提高提供了十分有利的条件,这种有失真的编码称为限失真编码。在多数应用中,人眼往

JPEG图像压缩算法基本介绍

JPEG图像压缩算法基本介绍 JPEG压缩算法可以用失真的压缩方式来处理图像,但失真的程度却是肉眼所无法辩认的。这也就是为什么JPEG会有如此满意的压缩比例的原因。 下面主要讨论,JPEG基本压缩法。 一、图像压缩算法之JPEG压缩过程 JPEG压缩分四个步骤实现: 1.颜色模式转换及采样; 2.DCT变换; 3.量化; 4.编码。 二、图像压缩算法具体操作 1、图像压缩算法之颜色模式转换及采样 RGB色彩系统是我们最常用的表示颜色的方式。JPEG采用的是YCbCr色彩系统。想要用JPEG基本压缩法处理全彩色图像,得先把RGB颜色模式图像数据,转换为YCbCr颜色模式的数据。Y代表亮度,Cb和Cr则代表色度、饱和度。通过下列计算公式可完成数据转换。 Y=0.2990R+0.5870G+0.1140B Cb=-0.1687R-0.3313G+0.5000B+128 Cr=0.5000R-0.4187G-0.0813B+128 人类的眼晴对低频的数据比对高频的数据具有更高的敏感度,事实上,人类的眼睛对亮度的改变也比对色彩的改变要敏感得多,也就是说Y成份的数据是比较重要的。既然Cb成份和Cr成份的数据比较相对不重要,就可以只取部分数据来处理。以增加压缩的比例。JPEG 通常有两种采样方式:YUV411和YUV422,它们所代表的意义是Y、Cb和Cr三个成份的数据取样比例。 2、图像压缩算法之DCT变换

DCT变换的全称是离散余弦变换(Discrete Cosine Transform),是指将一组光强数据转换成频率数据,以便得知强度变化的情形。若对高频的数据做些修饰,再转回原来形式的数据时,显然与原始数据有些差异,但是人类的眼睛却是不容易辨认出来。 压缩时,将原始图像数据分成8*8数据单元矩阵,例如亮度值的第一个矩阵内容如下: JPEG将整个亮度矩阵与色度Cb矩阵,饱和度Cr矩阵,视为一个基本单元称作MCU。每个MCU所包含的矩阵数量不得超过10个。例如,行和列采样的比例皆为4:2:2,则每个MCU将包含四个亮度矩阵,一个色度矩阵及一个饱和度矩阵。 当图像数据分成一个8*8矩阵后,还必须将每个数值减去128,然后一一代入DCT变换公式中,即可达到DCT变换的目的。图像数据值必须减去128,是因为DCT转换公式所接受的数字范围是在-128到+127之间。 DCT变换公式: x,y代表图像数据矩阵内某个数值的坐标位置 f(x,y)代表图像数据矩阵内的数个数值 u,v代表DCT变换后矩阵内某个数值的坐标位置 F(u,v)代表DCT变换后矩阵内的某个数值 u=0 且v=0 c(u)c(v)=1/1.414 u>0 或v>0 c(u)c(v)=1 经过DCT变换后的矩阵数据自然数为频率系数,这些系数以F(0,0)的值最大,称为DC,其余的63个频率系数则多半是一些接近于0的正负浮点数,一概称之为AC。 3、图像压缩算法之量化 图像数据转换为频率系数后,还得接受一项量化程序,才能进入编码阶段。 量化阶段需要两个8*8矩阵数据,一个是专门处理亮度的频率系数,另一个则是针对色度的频率系数,将频率系数除以量化矩阵的值,取得与商数最近的整数,即完成量化。

相关文档
最新文档