活动图像压缩标准H263

活动图像压缩标准H263
活动图像压缩标准H263

数字电视课程论文题目活动图像压缩标准H.263

专业

学号

学生

日期2014年3月28 日

活动图像压缩标准H.263

摘要:图像压缩的主要目的是为了解决电视信号经数字编码后面临的海量数据存储于传输问题,本文介绍了图像压缩的理论基础和视频图像压缩的研究概况以及方法,并着重介绍了活动图像压缩标准H.263及其基本算法,并做了总结和展望。

关键词:图像压缩、H.263

1 图像压缩的原因及原理

电视信号经数字编码以后,面临的最大难题之一是海量数据存储与传输的问题,以我国数字高清晰度电视格式为例,亮度信号抽样频率为74.25MH,两个色差信号为37.125MHz,采用10比特量化,串行比特率高达l.485Gb/s。从理论(PCM)上讲每1Hz信道带宽能传输的最高比特率是2b/s,因此标准清晰度电视要求信道提供135MHz的带宽,是模拟电视信号带宽的二十几倍,而高清晰度电视要求的信道的带宽则更宽。如果不经压缩编码处理,现有的频率资源仅能传输几套标清电视节目。显然,这是人们无法容忍的,所以必需对图像进行压缩编码处理才能充分利用频率资源。这就好像将牛奶中的水分去掉(压缩)制成奶粉,在需要时将水倒进去(解码)又做成牛奶一样。

近年来,多媒体技术迅猛发展,视频压缩编码技术的应用越来越广。视频压缩的理论依据主要在两个方面,一方面是视频信号中存在大量的冗余,如:(1)时间冗余:活动图像的两个连续帧之间的冗余。

(2)空间冗余:像素点之间的相关性。

(3)信息熵冗余:单位信息量大于其熵。(4)知识冗余。

(4)结构冗余:图像的区域上存在非常强的纹理结构。

(5)知识冗余:有固定的结构,如人的头像。

(6)视觉冗余:某些图像的失真是人眼不易觉察的。

视频压缩实质上就是通过减少这些冗余来降低存储和传送视频信息所需要的比特数。

另一方面,根据人眼的视觉特性,如果在对图像质量要求不是特别严格,允许重建图像有一定限度失真的情况下,数据压缩的可能性更大,而且压缩的比例也更大。对数字图像进行压缩通常利用两个基本原理:

(1) 数字图像的相关性。在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也就去除或减少图像信息中的冗余度,即实现了对数字图像的压缩。

(2) 人的视觉心理特征。人的视觉对于边缘急剧变化不敏感(视觉掩盖效应),对

颜色分辨力弱,利用这些特征可以在相应部分适当降低编码精度,而使人从视觉上并不感觉到图像质量的下降,从而达到对数字图像压缩的目的。

2 图像压缩发展概况

近十年来,视频图像编码技术得到了迅速的发展和广泛的应用,并且日益成熟,其标志是几个视频图像编码国际标准的制定,即ITU关于电视电话/会议电视的视频编码标准H.261、H.263等,以及ISO/IEC关于活动图像的编码标准MPEG—1、MPEG—2、MPEG—4等。这些标准的图像编码算法融合了各种性能优良的传统图像编码方法,是对传统编码技术的总结,代表了目前图像编码的发展水平。

(1)MPEG标准

MPEG压缩技术是目前视频压缩的重要技术之一。MPEG标准有:MPEG—1标准、MPEG—2标准、MPEG—4标准MPEG—7标准、MPEG—21标准。(2)H.26x标准

H.26x标准侧重于视频信息的数据压缩效率,以适合该系统在特定的位速率下传输,其主要应用目标是可视电话和会议电视。

H.261是国际电话电报咨询委员会(CCITT)于1990年通过的标准。主要针对综合业务数字网ISDN上传输会议电视、可视电话等低码率的多媒体领域,它不仅利用帧内编码,同时也利用帧间编码,所以压缩比高于JPEG。当今应用广泛的MPEG系列标准中的MPEG—1及MPEG屯的视频编码算法实际上是在H.261基础上的重要发展和改进。

H.263是ITU—T为低于64kb/s的窄带通信信道制定的极低码率视频编码标准,是在H.261的基础上发展起来的,是综合应用帧间预测去除时间冗余度和DCT变换编码去除空间冗余度的混合编码算法。应用范围有:普通电话线的可视电话、无线视频通信、互联网视频会议、远程监控、远程操作、远程工作等。

3 H.263视频压缩编解码技术

3.1 H.263标准的编码框架

H.263标准采用离散余弦变换(DCT)、运动估计、运动补偿和可变长编码(VLC)为核心的混合型编码技术。利用离散余弦变换减小空间冗余度;采用帧间预测减小时间冗余度;在传输中,利用可变长编码技术。H.263输出码流的语法结构可分为图像层、块组层、宏块层、块层四个层;有I帧(帧内帧)、P帧(预测帧)两种帧类型;有帧内编码(INTRA)、帧间编码(INTER)两种宏块编码模式,H.263的编码框图如图3.1所示:

图3.1 H.263标准编码框图

原始视频信号进入编码器后,被分割成16×16像素的宏块,通过“帧内/

帧间”选择开关切换每个宏块的编码类型。通过“编码控制”单元对图像层、块组层、宏块层、块层进行编码。

采用帧内编码方式的帧称为I帧。当采用帧内编码时,直接对原始数据进行DCT变换,然后将DCT系数量化重排,经VLC熵编码形成码流,其中一路码流又经反量化器、DCT反变换形成恢复后的图像,直接存入帧存储器,用于下一步的运动估计。

采用帧间编码方式的帧称为P帧。当采用帧间编码时,原始数据先与经运动补偿后的预测图像相减,产生残差图像,接着对残差图像的数据进行DCT变换和量化,再加上运动估计得到的运动矢量一起形成压缩码流。与帧内编码对应,一路码流也经反量化、DCT,反变换后与运动补偿后的预测图像相加,形成恢复后的图像,送入帧存储器,用于下一步的运动估计。

3.2 图像格式

(1)标准图像格式

H.263标准支持多种图像格式,除了H.261中的CIF和QCIF图像格式外,还增加另外三种图像格式Sub—QCIF、4CIF、16CIF,从而使H.263具有更广泛的应用范围。

按照“彩色电视信号的编码标准”,图像被编码为一个亮度信号Y和两个色度信号U、V。H.263支持5种标准图像格式,每种图像均采用YUV4:2:0的图像采样格式。在像素正交排列的每种图像中,亮度和色度采样各不相同,如表3.1所示。

表3.1 H.263的图像格式

图像格式亮度分量色度分量

列数行数列数行数

Sub-QCIF 128 96 64 48

QCIF 176 144 88 72

CIF 352 288 176 144

4CIF 704 576 352 288

16CIF 1408 1152 704 576

(2)图像采样格式

由于人眼对色度信号的分辨率比亮度信号低,在视频采样中,一般色度信号的采样率比亮度信号的采样率低一倍。YUV4:2:0格式是H.263压缩标准的缺省视频格式,其亮度和色度采样位置如图3.2所示。若每幅图像的亮度采样为y行,且每行x个采样,则每幅图像的色度采样为y/2行,且每行x/2个采样。

亮度采样值,即像素点位置

色度采样值

图3.2 YUV图像4:2:0采样格式

3.3 图像分块和编码顺序

目前的视频编码标准基本上都是基于块来操作的,把块作为基本编码单元。

H.263和H.261中对图像的分块定义是相同的,图3.3以QCIF格式为例说明了

H.263标准的编码分层结构。由图可见,一幅176×144的图像被分成9个块组,块组编号由0至8,每个块组被分成n 个16×16大小的宏块,宏块编号由0至10。每个宏块分别对应于4个8×8大小的亮度块和2个8×8的色度块,宏块是H.263标准编码处理的一个基本单元。

对于不同格式的图像,每帧图像包含的块组数不同,每个块组包含的宏块数也不同。

图3.4给出Sub-QCIF 、QCIF 、CIF 格式图像的块组编码顺序。CIF 、QCIF 和Sub-QCIF 格式的图像,每个块组包含1行宏块;4CIF 格式的图像,每个块组包含2行宏块;16CIF 格式的图像,每个块组包含4行宏块。

176列图像层

块层

宏块层

块组层

图3.3 H.263图像分层结构

×16行

CIF 格式

×16行

QCIF 格式×16行

Sub-QCIF 格式

图3.4 CIF 、QCIF 和Sub-QCIF 格式图像的块组编码顺序

3.4 H.263视频编码的基本算法 3.

4.1离散余弦变化(DCT)

变换编码能够消除图像数据空间相关性,使图像数据在变换域上最大限度地不相关。尽管变换本身并不带来数据压缩,但由于变换后系数之间的相关性明显降低,图像的大部分能量只集中到少数几个变换系数上,采用适当的量化和熵编码可以有效地压缩图像的数据量。在常用的数据压缩变换编码中,除了所选择的变换方法能很好地与图像信号的特性匹配外,还应从失真度、实现的复杂度以及编码比特率等多方面来综合考虑。

K-L(Karhunen~ Loeve)变换是最佳线性变换方案,它是用数据本身的相关矩阵对角化后构成的。这种变换将产生完全不相关的变换系数。如果图像数据是高度相关的,经过K-L 变换,变换后的系数将出现多个零值,并且一些非零系数的值也会很小。K-L 变换的变换矩阵是由图像数据本身求得的,不同的图像数据有不同的变换矩阵,如此就造成反变换矩阵的不唯一性,而且构造K-L 变换矩阵的计算量很大,因而它不是一种实用的变换方法。尽管如此,K-L 变换毕竟是线性换压缩编码方法的最佳方案之一,通常作为其它线性变换用来比较的基准。

离散傅立叶变换曾被认为是一种合适的变换,因为它有固定的基函数组,可以用FFT 算法对它做快速运算,包括正向和反向运算。尤其重要的是,普通图

像经DFT 变换后能量主要集中于低频区域。离散余弦变换(DCT ,Discrete Cosine Transform)与DFT 相比较能量更加集中,而且不会牺牲其它方面的质量,具有快速算法,容易根据人类视觉的频率分析机理,即视觉心理闭值来控制变换系数的量化噪声。DCT 实际上是源于DFT ,但DCT 省去了复数运算,故运算量和数据量都较小,而且不用传送基矢量。DCT 的频谱畸变比DFT 小。而且从统计特性来看,由于DCT 更接近KLT ,变换效率就高于DFT 。

除了DFT 和DCT ,人们还提出了许多其它的变换,如离散正弦(DST)变换、哈达玛(Hadamard)变换、哈尔(Haar)变换、沃尔什(Walsh)变换等,但从计算效率和能量集中这两方面来看,DCT 仍被看作是最佳选择。对大多数图像信源来说,在诸多变换编码方法中,DCT 变换是最接近K-L 变换的方法,故称之为次最优变换方法。目前,DCT 被诸多图像编码国际标准所采用来作为其编码的主要环节,如MPEG-1,MPEG-2, H.261, H.263,也用在基于对象的MPEG-4中来减少MB 系数的空间相关性,这些MB 包含于检测到的任意形状对象的归整方块里。

在基于像块的视频编码算法中,视频帧的每个8×8像块的64个像素值被DCT 变换成垂直和水平的空间频率系数,它的二维8×8DCT 由式(3-1)给出:

()()77

00

1(21)(21)F(u,v)=C C (,)cos cos 41616x y x u y v u v f x y ππ==++????

????????∑∑ (3-1) 其中,F(u,v)表示在变换域(u,v)点的变换系数,(,)f x y 是空间域(,)x y 点的原始像素值。

(

)()(

)()0C C 10C C 1

u u u v v v ==

====当时,否则当时,否则

当u=v=0时,可由式(3.1)到得像块的平均值,也就是DC(直流)系数。如果对应像块是帧内编码,那么点(0,0)所对应的就是NITRA DC 系数,余下的63个系数称为AC(交流)系数。DCT 逆变换由式(3-2)给出:

()()77001(21)(21)(,)=C C F(u,v)cos cos 41616x y x u y v f x y u v ππ==++????

????????∑∑ (3-2) 8×8像块的2维DCT 、量化及其逆过程中的数据变化如图3.5所示。

图3.5 DCT、量化及其逆过程中的数据变化

从图3.5中可清晰看出,变换后块中系数的分布是很不一致的,默认模式下数量很少的较大系数值分布在像块左上角(幅度最大的系数是帧内DC系数),较小的系数分别分布于其它部分。因此,DCT变换明显减少了像块的空间冗余,减小了原始像素间的相关性,像块的能量集中在左上方位,这部分是原始采样像块较低频率的分布范围。由于人类视觉系统对低阶DCT系数更为敏感,像块编码算法充分利用了这种敏感性,它对重要的DC系数进行的编码比其余63个AC 系数更精确。H. 263标准中,每个DC系数分配固定的8bit码字,而对于AC系数则进行VLC编码。

另外,从图3.5的逆DCT像块数据分布规律看到,整个块中的数据,行不变而列变,即表明只有垂直方向的空间频率,水平方向的空间频率为零,这就和图2.10中逆量化后的DCT系数分布很吻合,所以说DCT变换系数的空间分布频率特性跟人眼的视觉特性很匹配,这样就可以利用人类视觉系统的生理和心理特点来得到较好的编码效果。

3.4.2量化

基于像块的视频压缩编码器,其量化主要是对变换系数的量化。由于量化器控制着编码效率和重构视频序列的质量,因此它是编码器中最重要的处理环节。如果量化过程是基于人类对亮度和色度的敏感性,那么编码效率和解码视频质量可以得到显著提高。实验观察表明,没有必要将视频信息的全部数值精确地传给解码器以获得很的质量。于此,采用量化器来缩小编码器提供的可能信号范围。在视频编码中,有多种视频量化技术,每个样本独立量化的过程叫标量(scalar)量化;相反,对一组信号样本或矢量进行量化称为矢量(vector)量化。

一个块经过DCT变换后,形成一个大幅度系数集中在低频区域,而高频系数都比较小,量化后许多高频系数为零,从而达到了压缩的目的。量化后的码字与量化前的DCT系数有差距,但是由于人眼对低频分量部分比较敏感,而对高频分量不太敏感,所以如果量化值取的适当,不仅画面能让人接受,同时更能提高压缩比率。一般讲来,量化因子越小,画面越好,但是压缩出来的码字却会越多。

量化器将DCT变换的系数值映射成缩减值,以减少对像块编码的比特数。由于逆量化不能再恢复原始精确的像素值,所以量化是有损处理。因此量化在提高编码效率的同时引入了质量降级,调整量化器是调整输出码率的有效方法。下面给出H.263编解码器所采用的量化与逆量化公式,其中COF是将被量化的变换系数,LEVEL是量化后系数的绝对值,COF’是逆量化后重构的变换系数,Q p 被称为量化等级或量化因子,2×Q p是量化步长。

1)量化

·INTRA DC系数

LEVEL=COF/8

·INTRA AC系数

LEVEL=|COF|/(2×Qp)

·INTER系数

LEVEL=(|CoF|-Q p)/(2×Qp)

2)逆量化

·INTRA DC系数INTER系数

COF’ = LEVEL×8

·INTRA AC系数或

|CoF’|=0 LEVEL=0

|CoF’|=2Q p×LEVEL+Q p LEVEL≠0 Q p为奇数

|CoF’|=2Q p×LEVEL+Q p-1 LEVEL≠0 Q p为偶数

对DCT、量化、逆量化、逆DCT过程更直观准确的理解可以参照图3.5中数据的

前后变化。

3.4.3可变长(VLC)编码

块在经过DCT变换后,低频部分的非零系数大多数集中在矩阵的左上角,而高频部分的零系数基本上都集中在矩阵的右下角。经过量化后,大部分高频系数变为0。对经过量化后的系数要重新编排,目的是为了增加连续的“0”系数的个数,就是游程长度,方法是按照Z字形的式样编排,具体编码顺序如图3.6所示。这样就可以把一个8×8的矩阵变成一个l×64的矢量,频率较低的系数放在矢量的顶部。

DC值

AC系数结束

图3.6 Zigzag扫描示意图

经过Zigzag扫描后,对1×64的一维矢量进行游程编码,H.263采用(LAST,RUN,LEVEL)的三元组进行描述,其中LAST是最后一个非零系数的说明。LAST 为“0”表示块中还有更多的非零系数,“1”表示这是块中的最后一个非零系数。编码系数之前的连续0的个数用(RUN)来说明,而编码系数的非零值用(LEVEL)来说明。(LAST,RUN,LEVEL)的剩余组合被编码在一个长度为22比特的码字中,包括7比特的ESCAPE,1比特的LAST,6比特的RUN和8比特的LEVEL。用这个22比特的码字来对VLC编码表中没有列出的组合进行编码。

变长编码是一种无失真编码方法,信息论中已经证明,“若码字长度严格按照所对应的信息符号出现的概率大小相反的顺序排列,则平均码字长度一定小于其它任何符号顺序排列方式,即编码是最佳的”。其物理概念也十分清楚:对概率(每秒出现次数)大的信息符号用短码表示,对概率小的信息符号用长码,则平均码长是最短的。根据该定理。Huffman于1952年提出了一种最佳编码方法,被称为Huffman编码方法。由于其码字长不固定,也称变长编码法,即VLC(Variable Length Coding)。下面举例说明这种方法。

0.20

0.010.100.15

0.170.18

0.19

出现概

信源符号a 1a 7

a 6a 5a 4a 3a 2码

字码长110000

00010010100111024

43332000001111110

0.11

0.110.61

0.390.350.26

图3.7 Huffman 编码举例

量化AC 系数的特点是1×64矢量中包含有许多,“0”系数,并且许多,“0”是连续的,因此使用非常简单和直观的游程长度编码(RLE)对它们进行编码。H.263采用Zigzag 扫描结合游程编码。因为大部分优T 系数被量化为0,而大部分非零系数又集中在左上角,这样Z 形扫描后出现连续为零的机会很高。因此能达到较高的压缩比率,节省了码字。

4 小结

伴随着科技的进步,视频技术取得飞速发展。同时,视频图像的编码和传输技术面临巨大的挑战。视频流的数据量大,网络带宽不足都制约着视频技术的发展,本文针对视频技术所面临的问题,简单介绍了H.263视频压缩标准的优势和特点,研究了其实现原理。

5 参考文献

[1] 姚庆栋,徐孟侠等.图像编码基础(修订版).浙江:浙江大学出版社,2002. [2] 姜秀华,张永辉,章文辉,朱伟.数字电视原理与应用(M).北京.人民邮电出版

社.2003.

[3] 王冰.浅谈数字电视技术的发展.卫星电视与宽带多媒体.2008,(6):20-22. [4] 王剑雄.数字电视广播系统中MPEG 标准流的复用与解复用研究:(硕士学位论

文).河北:河北工业大学,2006.

[5] 霍云.浅谈图像压缩编码的方法与标准.有线电视技术2005,第8期.

图像压缩标准知多少

电子科技 2004年第7期(总第178期) 61 图像压缩标准知多少 徐庆征,镇桂勤 (西安通信学院二系,陕西 西安 710106) 摘 要 介绍了一些典型的静止图像压缩标准和活动图像压缩标准,并分析了各自的技术特点及其应用场合。 关键词 图像压缩;JPEG ;H.26x ;MPEG4 中图分类号 TN919.8 图像通信直观生动,包含极其丰富的信息,是人们传递信息的重要媒介。同时,巨大的数据量也给图像的采集、存储、处理和传输带来了极大的困难,严重影响了图像媒体成为主要媒体,因此,压缩数字图像信号的数码率就成为图像通信和图像信号处理领域的首要任务,受到全世界科技工作者的关注。 20世纪80年代以来,国际标准化组织(ISO)和国际电信联盟(ITU)组织了一批专家,开展了大量细致、全面的工作,陆续制定了一系列有关图像通信方面建议和标准,极大地推动了图像编码技术的发展与应用。这些标准可以归为两种类型:静止图像压缩标准和活动图像压缩标准(包括ITU-T 制定的H.263系列和ISO 制定的MPEG-x 系列)。 1 静止图像压缩编码标准 1.1 JBIG 标准 1988年,ISO 和ITU-T 成立了“联合二值图像专家组”(Joint Binary Image Expert Group ,JBIG), 1991年10月提出了ITU-T T.82标准。这一标准确定了具有逐层、逐层兼容顺序和单层顺序3种模式的编码方法,并提出了获得任意低分辨率图像的方法。 1.2 JPEG 标准 收稿日期: 2004-04-21 1986年底,ISO 和ITU-T 成立了联合图像专家小组(Joint Photographic Experts Group ,JPEG),该小组近年来一直致力于静止图像压缩算法的标准化工作。1991年3月正式提出ISO CD10918号建议草案“连续色调静止图像的数字压缩编码”(通常简称为JPEG 标准),这是第一个适用于连续色调、多级灰度、彩色或黑白静止图像的国际标准。 JPEG 标准提供了一种无损编码的模式和3种有损编码模式(基于DCT 的顺序模式、基于DCT 的渐进模式、层次模式)。所有符合JPEG 的 遍解码器都必须支持基准模式,其他模式可作为选择项根据不同的应用目的来取舍。基准模式编解码框图如图1所示。 尽管JPEG 建议主要是应用于静止图像的编码技术,但是在某些场合也可将它应用于视频编辑系统。此时JPEG 把视频序列中的每一帧当作一幅静止图像来处理,这就是所谓的Motion JPEG 的处理方法。 1.3 JPEG-LS 标准 JPEG 组织从1994年开始征集新的无损/近无损(简称JPEG-LS)算法提案,并于1998年2月作 图1 JPEG 基准模式遍解码框图

数字图像压缩技术

数字图像压缩技术 二、JPEG压缩 负责开发静止图像压缩标准的“联合图片专家组”(JointPhotographicExpertGroup,简称JPEG),于1989年1月形成 了基于自适合DCT的JPEG技术规范的第一个草案,其后多次修改,至1991年形成ISO10918国际标准草案,并在一年后成为国际标准,简称JPEG标准。 1.JPEG压缩原理及特点 JPEG算法中首先对图像实行分块处理,一般分成互不重叠的大小的块,再对每一块实行二维离散余弦变换(DCT)。变换后的系数基本不相关,且系数矩阵的能量集中在低频区,根据量化表实行量化,量化的结果 保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag扫描重新组织,然后实行哈夫曼编码。JPEG的特点如下: 优点:(1)形成了国际标准;(2)具有中端和高端比特率上的良好 图像质量。 缺点:(1)因为对图像实行分块,在高压缩比时产生严重的方块效应;(2)系数实行量化,是有损压缩;(3)压缩比不高,小于502。 JPEG压缩图像出现方块效应的原因是:一般情况下图像信号是高度非平稳的,很难用Gauss过程来刻画,并且图像中的一些突变结构例如 边缘信息远比图像平稳性重要,用余弦基作图像信号的非线性逼近其 结果不是最优的3。 2.JPEG压缩的研究状况及其前景2 针对JPEG在高压缩比情况下,产生方块效应,解压图像较差,近年 来提出了很多改进方法,最有效的是下面的两种方法: (1)DCT零树编码

DCT零树编码把DCT块中的系数组成log2N个子带,然后用零树编码方案实行编码。在相同压缩比的情况下,其PSNR的值比EZW高。但在高压缩比的情况下,方块效应仍是DCT零树编码的致命弱点。 (2)层式DCT零树编码 此算法对图像作的DCT变换,将低频块集中起来,做反DCT变换;对新得到的图像做相同变换,如此下去,直到满足要求为止。然后对层式DCT变换及零树排列过的系数实行零树编码。 JPEG压缩的一个最大问题就是在高压缩比时产生严重的方块效应,所以在今后的研究中,应重点解决DCT变换产生的方块效应,同时考虑与人眼视觉特性相结合实行压缩。 三、JEPG2000压缩 JPEG2000是由ISO/IECJTCISC29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了余弦变换。2000年3月的东京会议,确定了彩色静态图像的新一代编码方式—JPEG2000图像压缩标准的编码算法。 1.JPEG2000压缩原理及特点 JPEG2000编解码系统的编码器和解码器的框图如图1所示4。 编码过程主要分为以下几个过程:预处理、核心处理和位流组织。预处理部分包括对图像分片、直流电平(DC)位移和分量变换。核心处理部分由离散小波变换、量化和熵编码组成。位流组织部分则包括区域划分、码块、层和包的组织。 JPEG2000格式的图像压缩比,可在现在的JPEG基础上再提升 10%~30%,而且压缩后的图像显得更加细腻平滑。对于当前的JPEG标准,在同一个压缩码流中不能同时提供有损和无损压缩,而在 JPEG2000系统中,通过选择参数,能够对图像实行有损和无损压缩。现在网络上的JPEG图像下载时是按“块”传输的,而JPEG2000格式

图像压缩原理

1、为什么要对图像数据进行压缩?其压缩原理是什么? 答:(1)数字图像如果不进行压缩,数据量是比较大的,例如一幅分辨率为1024×768的静态真彩色图像,其数据量为1024×768×24=2.25(MB)。这无疑对图像的存储、处理、传送带来很大的困难。事实上,在图像像素之间,无论在行方向还是列方向,都存在一定的相关性。也就是说,在一般图像中都存在很大的相关性,即冗余度。静态图像数据的冗余包括:空间冗余、时间冗余、结构冗余、知识冗余和视觉冗余、图像区域的相同性冗余、纹理的统计冗余等。图像压缩编码技术就是利用图像数据固有的冗余性和相干性,将一个大的图像数据文件转换为较小的同性质的文件。 (2)其压缩原理: 空间冗余、时间冗余、结构冗余、和视觉冗余。 2、图像压缩编码的目的是什么?目前有哪些编码方法? 答:(1)视频经过数字化处理后易于加密、抗干扰能力强、可再生中继等诸多优点,但是由于数字化的视频数据量十分巨大,不利于传输和存储。若不经压缩,数字视频传输所需的高传输率和数字视频存储所需的巨大容量,将成为推广数字电视视频通信的最大障碍,这就是进行视频压缩编码的目的。 (2)目前主要是预测编码,变换编码,和统计编码三种编码方法。 3、某信号源共有7个符号,概率分别为0.2,0.18,0.1,0.15,0.07,0.05,0.25,试进行霍夫曼编码,并解释是否进

行了压缩,压缩比为多少? 0000 0001 000 00 111 110 10 0.05 0.07 0.1 0.2 0.18 0.15 0.25 0.05×4+0.07×4+0.1×3+0.2×2+0.18×3+0.15×3+0.25×2=2.67

JPEG2000图像压缩算法标准剖析

JPEG2000图像压缩算法标准 摘要:JPEG2000是为适应不断发展的图像压缩应用而出现的新的静止图像压缩标准。本文介绍了JPEG2000图像编码系统的实现过程, 对其中采用的基本算法和关键技术进行了描述,介绍了这一新标准的特点及应用场合,并对其性能进行了分析。 关键词:JPEG2000;图像压缩;基本原理;感兴趣区域 引言 随着多媒体技术的不断运用,图像压缩要求更高的性能和新的特征。为了满足静止图像在特殊领域编码的需求,JPEG2000作为一个新的标准处于不断的发展中。它不仅希望提供优于现行标准的失真率和个人图像压缩性能,而且还可以提供一些现行标准不能有效地实现甚至在很多情况下完全无法实现的功能和特性。这种新的标准更加注重图像的可伸缩表述。所以就可以在任意给定的分辨率级别上来提供一个低质量的图像恢复,或者在要求的分辨率和信噪比的情况下提取图像的部分区域。 1.JPEG2000的基本介绍及优势 相信大家对JPEG这种图像格式都非常熟悉,在我们日常所接触的图像中,绝大多数都是JPEG格式的。JPEG的全称为Joint Photographic Experts Group,它是一个在国际标准组织(ISO)下从事静态图像压缩标准制定的委员会,它制定出了第一套国际静态图像压缩标准:ISO 10918-1,俗称JPEG。由于相对于BMP等格式而言,品质相差无己的JPEG格式能让图像文件“苗条”很多,无论是传送还是保存都非常方便,因此JPEG格式在推出后大受欢迎。随着网络的发展,JPEG的应用更加广泛,目前网站上80%的图像都采用JPEG格式。 但是,随着多媒体应用领域的快速增长,传统JPEG压缩技术已无法满足人们对数字化多媒体图像资料的要求:网上JPEG图像只能一行一行地下载,直到全部下载完毕,才可以看到整个图像,如果只对图像的局部感兴趣也只能将整个图片载下来再处理;JPEG格式的图像文件体积仍然嫌大;JPEG格式属于有损压缩,当被压缩的图像上有大片近似颜色时,会出现马赛克现象;同样由于有损压缩的原因,许多对图像质量要求较高的应用JPEG无法胜任。 JPEG2000是为21世纪准备的压缩标准,它采用改进的压缩技术来提供更高的解像度,其伸缩能力可以为一个文件提供从无损到有损的多种画质和解像选择。JPEG2000被认为是互联网和无线接入应用的理想影像编码解决方案。 “高压缩、低比特速率”是JPEG2000的目标。在压缩率相同的情况下,JPEG2000的信噪比将比JPEG提高30%左右。JPEG2000拥有5种层次的编码形式:彩色静态画面采用的JPEG 编码、2值图像采用的JBIG、低压缩率图像采用JPEGLS等,成为应对各种图像的通用编码方式。在编码算法上,JPEG2000采用离散小波变换(DWT)和bit plain算术编码(MQ coder)。此外,JPEG2000还能根据用户的线路速度以及利用方式(是在个人电脑上观看还是在PDA上观看),以不同的分辨率及压缩率发送图像。 JPEG2000的制定始于1997年3月,但因为无法很快确定算法,因此耽误了不少时间,直到2000年 3 月,规定基本编码系统的最终协议草案才出台。目前JPEG2000已由ISO和

图像压缩技术介绍.

图像压缩技术介绍 由于图像和视频本身的数据量非常大,给存储和传输带来了很多不便,所以图 像压缩和视频压缩得到了非常广泛的应用。比如数码相机、USB摄像头、可视电话 、视频点播、视频会议系统、数字监控系统等等,都使用到了图像或视频的压缩技术。 常用的图像的压缩方法有以下几种: 1、行程长度编码(RLE) 行程长度编码(run-length encoding)是压缩一个文件最简单的方法之一。 它的做法就是把一系列的重复值(例如图象像素的灰度值)用一个单独的值再加上 一个计数值来取代。比如有这样一个字母序列aabbbccccccccdddddd它的行程长度编码就是2a3b8c6d。这种方法实现起来很容易,而且对于具有长重复值的串的压缩编码很有效。例如对于有大面积的连续阴影或者颜色相同的图象,使用这种方法压 缩效果很好。很多位图文件格式都用行程长度编码,例如TIFF,PCX,GEM等。 2、LZW编码 这是三个发明人名字的缩写(Lempel,Ziv,Welch),其原理是将每一个字节的值都要与下一个字节的值配成一个字符对,并为每个字符对设定一个代码。当同 样的一个字符对再度出现时,就用代号代替这一字符对,然后再以这个代号与下个 字符配对。 LZW编码原理的一个重要特征是,代码不仅仅能取代一串同值的数据,也能够代替一串不同值的数据。在图像数据中若有某些不同值的数据经常重复出现,也能找到 一个代号来取代这些数据串。在此方面,LZW压缩原理是优于RLE的。 3、霍夫曼编码 霍夫曼编码(Huffman encoding)是通过用不固定长度的编码代替原始数据来实现的。霍夫曼编码最初是为了对文本文件进行压缩而建立的,迄今已经有很多变体。它的基本思路是出现频率越高的值,其对应的编码长度越短,反之出现频率越 低的值,其对应的编码长度越长。 霍夫曼编码很少能达到8∶1的压缩比,此外它还有以下两个不足:①它必须精确地统计出原始文件中每个值的出现频率,如果没有这个精确统计,压缩的效果就 会大打折扣,甚至根本达不到压缩的效果。霍夫曼编码通常要经过两遍操作,第一 遍进行统计,第二遍产生编码,所以编码的过程是比较慢的。另外由于各种长度的 编码的译码过程也是比较复杂的,因此解压缩的过程也比较慢。②它对于位的增 删比较敏感。由于霍夫曼编码的所有位都是合在一起的而不考虑字节分位,因此增 加一位或者减少一位都会使译码结果面目全非。 4、预测及内插编码

基于JPEG标准的静态图像压缩算法概述

基于JPEG标准的静态图像压缩算法概述 张元伟1,刘彦隆2 太原理工大学信息学院,太原(030024) E-mail: zyw7457@https://www.360docs.net/doc/673140385.html, 摘要:本文主要论述了基本JPEG标准的编码方法。其中包括采样、离散余弦变换、量化和熵编码等几个主要步骤,最后,用Visual C++编程实现把一幅BMP格式的图像转换为JPEG 格式图像,进一步显示JPEG标准在图像压缩中的优越性。 关键词:JPEG标准;采样;离散余弦变换;量化;熵编码 中图分类号:TN919 1.引言 随着多媒体技术的快速发展,静态图像的应用越来越广泛,但存在一个主要问题就是数据量过于庞大。例如,一张A4(210mm×297mm)幅面的照片,若用中等分辨率(300dpi)的扫描仪按真彩色扫描,其数据量共有(300×210/25.4)×(300×297/25.4)个像素,每个像素占3个字节,其数据量为26M字节。这样大容量的图像信息会给存储器的存储容量、通信干线信道的带宽以及计算机的处理速度增加了极大的压力。因此,图像必须进行压缩。2.图像编码压缩算法 JPEG[1]是“联合图像专家小组”(Joint Photographic Experts Group)的简称,是由ISO和CCITT于1986年底联合制定的连续色调的静止图像压缩标准。它是一个适用范围广泛的通用标准,不仅适用于静止图像的压缩,也适用于电视图像序列的帧内图像的压缩。1992年正式成为国际标准(ISO10918)。 JPEG算法流程如图1所示。 JPEG压缩算法基本过程可分为如下几个步骤实现。 ●颜色模式转化及取样。 ●离散余弦变换(DCT)。

图像压缩技术文档

J P E G 标准是由国际标准化组织ISO和国际电话电报咨询委员会CCITT为静止图像所建立的第一个国际数字图像压缩标准,它是一个适用范围很广的通用标准,既可以用于灰度图像,又可以用于彩色图像,可以支持各种应用。例如在计算机技术中,基于JPEG 有损压缩的数字水印算法,和嵌入式系统中的JPEG 分层压缩等。在JPEG 各类图像压缩算法中,基于离散余弦变换的图像压缩编码过程称为基本顺序过程,它应用于绝大多数图像压缩场合,并且它能在图像的压缩操作中获得较高的压缩比,并且重构图像与源图像的视觉效果基本相同。 基本原理 基于DCT 顺序型工作模式的JPEG 压缩算法系统的编码器与解码器的结构如图1 所示,量化编码是在进行了二元D C T 的系数量化后,且熵编码部分使用Huffman 编码方法。 图1 系统结构图 1 色彩变换与部分数据取样 色彩变换将计算机屏幕显示使用的RGB 色彩数据按照(1 )式给定的关系,转换成JPEG

中使用的YCbCr 数据,其中Y 是颜色的亮度,CbCr 是色调。 Y=0.2999R+0.5870G+0.1140B Cb = -0.1687R-0.3313G+0.5000B+128 (1) Cr = 0.5000R-0.4187G-0.0813B+128 在取样部分,考虑到人眼对图像的亮度变化敏感,而对颜色的变化迟钝。因此,对反映颜色变化的色调信息只取其部分数据进行处理。本文的JPEG 格式采用的部分取样方式为Yuv411,即每取4 个Y 数据,只取一个Cb 数据和一个Cr 数据。因此,原数据在尚未编码时,已获得50% 的压缩。 2 利用DCT 对空间频率的变换 离散余弦变换(DCT)实现将一组光强数据转换成频率数据。在压缩时,将源图像数据分成8*8 像素构成的像块的集合。经过零偏置将每一取样值从0~255 转为-128~+127,再做DCT 处理。DCT 将每个数据单元的值转换为64 个DCT 系数Svu,其中S00 称为直流系数,其余63 个系数称为交流系数。解压缩是正向变换的反过程。D C T 和IDCT 分别由公式(2)和公式(3)实现。 770 01(21)(21)(,)()()(,)cos cos 41616i j i u j v F u v C u C v f i j ππ==++????=????????∑∑ (2) 7700 1(21)(21)(,)()()(,)cos cos 422u v x u y v f i j C u C v F u v N N ππ==++????=????????∑∑ (3) 上式中(),()C u C v = (当u ,v=0时) (),()1C u C v = (其他情况) 3 量化和熵编码 直流分量和各交流分量可用不同量化间隔量化,低频分量量化得细,高频分量量化得粗。Y 、U 、V 也可用不同的量化表,Y 细量化,U 、V 粗量化。JPEG 规范中,Y 数据和Cb 、Cr 数据各有一个8 × 8 的推荐量化表,根据具体要求可以构造专用的量化表,但量化过程和逆量化过程应使用同样的量化表。量化是在图像文件品质与压缩比例之间做一选择的重要过程,而这也就是JPEG 所谓的失真压缩方式。经量化处理后的数据,应用平均压缩比最高的Huffman 码进行熵编码。 经过上述过程后可得到压缩图像。

Matlab的图像压缩技术

Matlab的图像压缩技术 一.目的要求 掌握Matlab图像图像压缩技术原理和方法。理解有损压缩和无损压缩的概念,了解几种常用的图像压缩编码方式,利用matlab进行图像压缩算法验证。二.实验内容 1、观察颜色映像矩阵的元素 >> hot(8) ans = 0.3333 0 0 0.6667 0 0 1.0000 0 0 1.0000 0.3333 0 1.0000 0.6667 0 1.0000 1.0000 0 1.0000 1.0000 0.5000 1.0000 1.0000 1.0000 数据显示第一行是1/3红色,最后一行是白色。 2、pcolor显示颜色映像 >> n=16; >> colormap(jet(n)); >> pcolor([1:n+1;1:n+1]); >> title('Using Pcolor to Display a Color )Map'); 图2 显示颜色映像

3、colorbar显示当当前坐标轴的颜色映像>> [x,y,z]=peaks; >> mesh(x,y,z); >> colormap(hsv); >> axis([-3 3 -3 3 -6 8]); >> colorbar; 图3 显示当前坐标轴的颜色映像4、图像格式转换 g=rgb2gray(I); g=rgb2gray(I); >> imshow(g),colorbar; 图4-1 原图像saturn.png

图4-2转换后的图像 5、求解图像的二唯傅里叶频谱 I=imread('cameraman.tif'); >> imshow(I) >> J=fftshift(fft2(I)); >> figure; >> imshow(log(abs(J)),[8,10]) 图5-1 原图像cameraman.png

图像压缩技术的综述

题目:图像压缩技术的综述 学生姓名:徐欢学号:070110117 系别:计算机与信息学院专业:计算机科学与技术 入学年份:2010年9月 导师姓名:陈蕴谷职称/学位:讲师/硕士研究生 导师所在单位:中国科学院合肥物质研究院 完成时间:2014年4月 1.引言 随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,也给现有的有限带宽以严峻的考验,特别是具有庞大数据量的数字图像通信,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。 图像数据是用来表示图像信息的,如果不同的方法为表示相同的信息使用了不同的数据量,那么使用较多数据量的方法中,有些数据必然代表了无用的信息,或者是重复的表示了其他数据表示的信息,前者成为数据冗余,后者成为不相干信息。图像压缩编码的主要目的,就是通过删除冗余的或者是不相干的信息,以尽可能地的数码率来存储和传输数字图像数据。 图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有50多年的历史了。在此期间出现了很多种图像压缩编码方法,特别是到了80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。本文对当前最为广泛使用的图像压缩算法进行综述,讨论了它们的优缺点以及发展前景。 图像编码基础 图像编码压缩是指在满足一定图像质量的条件下,用尽可能少的数据量来表示图像。编码技术比较系统的研究始于Shannon信息论,从此理论出发可以得到数据压缩的两种基本途径。一种是联合信源的冗余度也寓于信源间的相关性之

图像压缩

摘要 多媒体技术和网络与移动通信的飞速发展激发了人们进行视频信息交流的需求,推动了图像通信和数字视频技术的全面发展。图像和视频信号数字化可以避免远距离传输的累积失真,数字化存储可以高保真还原,并且容易借助计算机进行灵活处理和管理。而传输和存储图像需要占用大量的数据空间,这严重影响了传输速率和实时处理量,极大地制约了图像通信的发展。因此,图像压缩编码技术受到了越来越多的关注及应用。 本文在分析视频特点的基础上主要从图像压缩的概念、原理、发展现状等方面进行介绍。并且详细介绍了图像压缩技术的分类方便及几种常用的图像压缩编码方法。主要介绍了行程长度编码(RLE)、LZW编码、霍夫曼编码、预测及内插编码、矢量量化编码、分形编码及小波变换编码 1.引言 在当前这个信息化社会中,新信息技术革命使人类被日益增多的多媒体信息所包围。多媒体信息主要是由图像、文本和声音三大元素组成。图像作为其主要元素之一,发挥着越来越重要的作用。而传输和存储图像需要占用大量的数据空间,这严重影响了传输速率和实时处理量,极大地制约了图像通信的发展。在同等的通信容量下,如果图像数据可以压缩之后再传输,就可以使传输的数据量变得很小,也就能够增加通信能力。因此图像压缩编码技术受到了越来越多的关注及广泛的应用。如数码相机、USB摄像头、可视电话、视频点播、视频会议系统、数字监控系统等等,都使用到了图像或视频的压缩技术。 2.图像压缩的概念及原理 图像可以按其内容的运动状态分成静止图像和活动图像两大类。活动图像又称运动图像,沿用电视技术的术语,一般称其为视频。视频是指一组图像在时间轴上的有序排列,它是由一系列的二维空域(平面)图像沿时间轴所排成的序列,用以描写景物的状态和变化的过程。

图像压缩技术的发展现状与趋势

图像压缩技术的发展现状与趋势 耿玉静1 赵华2 1燕山大学信息科学与工程学院 河北秦皇岛 (066004) 2河北师范大学电子系 河北保定 (071003) E-mail: gyjlunwen@https://www.360docs.net/doc/673140385.html, 摘要文章简要论述了图像和视频压缩技术的研究状况,就目前国际上正在研究的压缩标准和方法作了介绍,并对图像和视频压缩技术的发展趋势和前景进行了初步探讨。 关键词图像压缩,视频编码,视频对象,压缩标准 1.图像压缩的可行性 图像编码压缩的目的是对要处理的图像源数据按一定的规则进行变换和组合[1],从而达到以尽量少的比特数来表征图像,同时尽可能好的复原图像的质量,使它符合预定应用场合的要求。图像数据之所以可以进行压缩,是因为有以下几个方面的原因:组成图像的各像素之间,无论在行方向还是列方向都存在一定的相关性,即原始图像数据是高度相关的,应用某种编码方法提取或减少这些相关性,便可达到压缩数据的目的;从信息论看,描述图像信源的数据是由有效信息量和冗余量两部分组成的,去除冗余量能够节省传输和存储中的开销,同时又不损害图像信源的有效信息量;有些场合允许图像编码有一定的失真,也是图像可以压缩的一个重要原因。 2.图像压缩的分类 图像压缩编码的方法目前有很多种,出发点不同其分类亦有差异。以信息保真度为出发点,可以分为两大类:一类是冗余度压缩法。如著名的哈夫曼编码、香农编码、游程编码等,其特征是压缩比较低(一般不超过8:1),但不丢失任何数据,可以严格恢复原图像,实现编/解码的互逆,故又称可逆编码或无损压缩。另一类是熵压缩法。如预测编码、变换编码、统计编码等,由于在压缩过程中要丢失一些人眼所不敏感的图像信息,且所丢失的信息不可恢复,即图像还原后与压缩前不完全一致,故又称有损压缩。以具体编码技术为出发点,可以分为:预测编码、变换编码、统计编码、轮廓编码、模型编码等。 3.图像压缩技术的现状 20世纪80年代后,ISO、IEC和ITU陆续制定了各种数据压缩与通信的标准与建议。 3.1静止图像压缩标准:JPEG标准&JPEG 2000 标准 3.1.1 JPEG 标准 JPEG 全名为Joint Photographic Experts Group,是一个在国际标准组织(ISO)下从事静止图像压缩标准制定的委员会。JPEG标准从1986年正式开始制订,1988年决定采用以图像质量最好的ADCT(Adaptive Discrete Cosine Transform)方式为基础的算法作标准[2],于1991年3月提出10918号标准[3]“连续色调静止图像的数字压缩编码”,即JPEG标准[4,5]。它在较低的计算复杂度下,能提供较高的压缩比与保真度。 - 1 -

静态影像压缩介绍

靜態影像壓縮介紹 (作者吳和弟) 前言 顧名思義,靜態影像(still image)即是指靜止不動的單張影像圖片,例如一張彩色圖片。而有靜態就會有動態,動態影像 (motion image)則是連續性的動作,例如電視與電影畫面等。本文將只針對靜態影像壓縮(still image compression)技術作一概略性的介紹。 影像壓縮的優點 通常一般我們所見的單張彩色靜態影像,它是由很多一個點一個點的像素(pixel) 所組成,而每一個像素主要由R(紅)、G(綠 )、B(藍 )三原色所構成,每一個原色用一個字元(byte)來表示。例如:欲儲存一張長 512 pixel 、寬 512 pixel 的彩色圖片需要的記憶體為: 512 x 512 x 3 bytes = 768 kbytes 由上例中可以看出:未經壓縮的影像在儲存時,會佔用非常大量的儲存空間,且未經壓縮的影像資料透過通訊網路傳送時,所需的傳輸時間也將相對地拉長。為解決上述的問題,使用者如能將影像予以壓縮,即可達到減少儲存空間、縮短傳輸時間的雙重效能。 靜態影像壓縮的國際標準 由於有感於靜態影像壓縮需要一個大家可以共同遵循的國際標準,因此由國際標準組織 (International Standardization Organization; ISO) 與國際電報電話諮詢委員會(Consultative Committee on International Telegraph and Telephone; CCITT) 兩邊人員共同成立聯合影像專家群(Joint Photographic Expert Group; JPEG ) ,他們共同制定了一個稱為JPEG 的靜態影像壓縮之國際標準。JPEG 的分類 JPEG 根據壓縮技術的不同,而把靜態影像壓縮的方式分為兩種,一種是有失真模式 (Information Loss),另一種是無失真模式(Information Lossless)。茲將此兩種壓縮模式分述如下: 1. 有失真模式: ?採用離散餘弦轉換 (Discrete Cosine Transform; DCT) 的技術。 ?經過壓縮與解壓縮還原之後的影像會有失真產生,幸好人的眼睛對於少許失真不易察覺。 ?壓縮率高,壓縮 30 倍仍能獲得高品質。 ?應用於一般圖片、多媒體。 ?應用廣泛,目前的應用絕大部份都是採用此種模式。 2. 無失真模式: ?採用差值訊號編碼 (Differential Pulse Code Modulation;

数字图像压缩技术的研究现状与展望

图像压缩技术的现状和展望 一.前言介绍 随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,具有庞大数据量的数字图像通信对现有的有限带宽以严峻的考验,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。 本文通过介绍其发展历程及其基本原理和其现阶段的应用,对图像压缩编码技术进行了系统性概述,最后对其前景作了总体上的展望。 二.图像压缩编码技术的发展历程 图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有60多年的历史了。在此期间出现了很多种图像压缩编码方法,特别是到了80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。 三.JPEG压缩 负责开发静止图像压缩标准的“联合图片专家组”(Joint Photographic Expert Group,简称JPEG),于1989年1月形成了基于自适应DCT的JPEG技术规范的第一个草案,其后多次修改,至1991年形成ISO10918国际标准草案,并在一年后成为国际标准,简称JPEG标准。 1.JPEG 压缩原理 JPEG 算法中首先对图像进行分块处理,一般分成互不重叠的大小的块,再对每一块进行二维离散余弦变换(DCT)。变换后的系数基本不相关,且系数矩阵的能量集中在低频区,根据量化表进行量化,量化的结果保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag 扫描重新组织,然后进行哈夫曼编码。 2. JPEG压缩的研究状况及其前景

图像压缩综述

图像压缩综述 摘要:随着信息时代的不断发展,数字图像处理技术得到了广泛的应用,而作为数字图像处理技术的重要组成部分——数字图像压缩,也得到了迅猛的发展。本文从数字图像压缩的概念、发展历史、图像压缩的必要性和可能性、图像压缩标准、图像压缩基本方法和图像压缩效果评价等方面进行了综述。 引言 在当前这个信息化社会中,新信息技术革命使人类被日益增多的多媒体信息所包围。多媒体信息主要是由图像、文本和声音三大元素组成。图像作为其主要元素之一,发挥着越来越重要的作用。而传输和存储图像需要占用大量的数据空间,这严重影响了传输速率和实时处理量,极大地制约了图像通信的发展。其中,数据量最大的是数字视频数据。未经处理的数字视频信息需要消耗巨大的存储资源,以主流高清视频为例,在分辨率为1280×720,帧率为30帧每秒的视频应用中,存储一分钟的视频信息,需要约18.5G(以常4:2:0视频,每像素12比特)比特存储空间,一部120分钟高清电影约需要2225G比特的存储空间。可见未经处理的视频信息量非常大,为了满足存储和传输需求,视频信息的压缩是十分必要的。在同等的通信容量下,如果图像数据可以压缩之后再传输,就可以使传输的数据量变得很小,也就能够增加通信能力。因此图像压缩编码技术受到了越来越多的关注及广泛的应用。如数码相机、USB摄像头、可视电话、视频点播、视频会议系统、数字监控系统等等,都使用到了图像或视频的压缩技术。 数字图像压缩是以尽可能少的比特数代表图像或图像中所包含的信息量的技术,图像通过压缩处理去掉其中的数据冗余、符号冗余、视觉冗余等各种冗余信息,提高传输速率,节省存储空间。 1图像压缩的发展历史 自1948年提出的电视信号数字化设想后, 即开始了图像压缩的研究,到现在已有60多年的历史。20世纪五六十年代的图像压缩编码主要集中在预测编码、哈夫曼编码等技术的研究,还不成熟。1969年在美国召开的第一届“图像编码会议”,标志着图像编码作为一门独立学科的诞生。到了七八十年代,图像压缩技术的主要成果体现在变换编码技术上, 矢量量化编码技术也有较大的发展。80年代末,小波变换理论、分形理论、人工神经网络理论、视觉仿真理论建立,人们开始突破传统的信源编码理论, 图像压缩编码向着更高的压缩率和更好的压缩质量的方向发展,进入了一个崭新的发展时期。 2图像压缩的可能性 图像之所以能够进行压缩有以下几个方面的原因: 一是原始图像数据是高度相关的,存在很大的数据冗余。如图像内相邻像素之间的空间冗余度、系列图像前后帧之间的时间冗余度、多光谱遥感图像各频谱间的频率域冗余度等,它们造成了大量的比特数浪费,消除这些冗余就可以节约码字,大大减少数据量,达到数据压 缩的目的。 二是信源符号出现的概率不同,若用相同码长表示不同出现概率的符号,就会造成符号冗余度。如果采用可变长编码技术,对出现概率高的符号用短码字,对出现概率低的符号用长码字表示,就可以消除符号冗余度,从而节约码字。 三是人眼具有视觉冗余,允许图像编码有一定的失真。人类视觉系统(HVS)是有缺陷的,人眼对于某些失真不敏感难以察觉。在许多场合中,并不要求经压缩及复原以后的图像和原始图像完全相同,可以允许有少量的失真,只要这些失真并不被人眼所察觉即可。这就为压缩比的提高提供了十分有利的条件,这种有失真的编码称为限失真编码。在多数应用中,人眼往

图像编解码技术及应用

图像编解码技术及应用 1.图像编解码技术概论: 在当前的图像压缩领域中常用的技术有: BMP、EPS、GIF、JPG、PDF、PIC、PNG、PSD、TIF。上述技术间的差异主要存在于图像编解码的算法不同,通过对算法的研究可以使我们更加容易的理解图像压缩的原理。 位图格式(BMP)是在DOS时代就出现的一种元老级文件格式,因此它是DOS和WINDOWS操作系统上的标准的WINGDOWS点阵图像格式,以此文件格式存储时,采用一种非破坏性的RLE压缩,不会省略任何图像的细部信息。 EPS是最常见的线条稿共享文件格式,它是以PostScript语言为开发基础,所以EPS文件能够同时兼容矢量和点阵图形,所有的排版或图像处理软件如PageMaker或Illustrator等,都提供了读入或置入EPS格式文件的能力,而且RGB和CMYK对象也可以保有各自的原始的色彩模式。 GIF应该是在网络上最常见的一种压缩文件格式,它的英文全名Graphic Interchange format,当初研发的目的是为了最小化电缆上的传输,因此能采用LZW方式进行压缩,但可显示的颜色范围只局限于256索引色,目前所采用 的GIF图形共有两种格式:87a和89a,常见于网页上建议的小动画制作,其中GIF89a还可提供透明色效果,点阵图形,灰度图形或者索引颜色模式皆可存储为此种文件格式 JPG跟GIF一样为网络上最常见道的图像格式,其英文正式名称为Joint Photographic Experts Group,它是以全彩模式进行显示色彩,是目前最有效率的一种压缩格式,常用于照片或连续色调的显示,而且没有GIF去掉图像细 部信息的缺点,但需要注意的是此类图像需要自行设置压缩程度,在打开时JPG 图像会自动解压缩,不过要注意的是JPG采用的压缩是破坏性的压缩,因此会在一定程度上减损图像本身的品质。

图像压缩方法综述

图像压缩方法综述 陈清早 (电信科学技术研究院PT1400158) 摘要:图像压缩编码技术就是对要处理的图像数据按一定的规则进行变换和组合,从而达到以尽可能少的数据流(代码)来表示尽可能多的数据信息。由于图像数据量的庞大,在存储、传输、处理时非常困难,因此图像数据的压缩就显得非常重要。图像压缩分为无损图像压缩和有损图像压缩或者分为变换编码、统计编码。在这里,我们简单的介绍几种几种图像压缩编码的方法,如:DCT编码、DWT编码、哈夫曼(Huffman)编码和算术编码。 关键字:图像压缩;DCT压缩编码;DWT压缩编码;哈夫曼编码;算术编码 1引言 在随着计算机与数字通信技术的迅速发展,特别是网络和多媒体技术的兴起,大数据量的图像信息会给存储器的存储容量、通信信道的带宽以及计算机的处理速度增加极大的压力。为了解决这个问题,必须进行压缩处理。图像数据之所以能被压缩,就是因为数据中存在着冗余。图像数据的冗余主要表现为:图像中相邻像素间的相关性引起的空间冗余;图像序列中不同帧之间存在相关性引起的时间冗余;不同彩色平面或频谱带的相关性引起的频谱冗余。数据压缩的目的就是通过去除这些数据冗余来减少表示数据所需的比特数。信息时代带来了“信息爆炸”,使数据量大增,无论传输或存储都需要对数据进行有效的压缩。因此图像数据的压缩就显得非常重要。 在此,我们主要介绍变换编码的DCT编码和DWT编码和统计编码的哈夫曼(Huffman)编码和算术编码。 2变换编码 变换编码是将空域中描述的图像数据经过某种正交变换转换到另一个变换域(频率域)中进行描述,变换后的结果是一批变换系数,然后对这些变换系数进行编码处理,从而达到压缩图像数据的目的。主要的变换编码有DCT编码和DWT编码 1.1DCT编码 DCT编码属于正交变换编码方式,用于去除图像数据的空间冗余。变换编码就是将图像光强矩阵(时域信号)变换到系数空间(频域信号)上进行处理的方法。在空间上具有强相关的信号,反映在频域上是在某些特定的区域内能量常常被集中在一起,或者是系数矩阵的分布具有某些规律。我们可以利用这些规律在频域上减少量化比特数,达到压缩的目的。也就是说,图像变换本身并不能压缩数据,但变换后图像大部分能量集中到了少数几个变换系数上,再采用适当的量化和熵编码便可以有效地压缩图像。量化是对经过DCT变换后的频率系数进行量化,其目的是减小非“0”系数的幅度以及增加“0”值系数的数目,它是图像质量下降的最主要原因。 图像经DCT变换以后,DCT系数之间的相关性就会变小。而且大部分能量集中在少数的系数上,因此,DCT变换在图像压缩中非常有用,是有损图像压缩国际标准JPEG的核心。从原理上讲可以对整幅图像进行DCT变换,但由于图像各部位上细节的丰富程度不同,这种整体处理的方式效果不好。为此,发送者首先将输入图像分解为8*8或16*16块,然后再对每个图像块进行二维DCT变换,接着再对DCT系数进行量化、编码和传输;接收者通过对量化的DCT系数进行解码,并对每个图像块进行的二维DCT反变换。最后将操作完成后所有的块拼接起来构成一幅单一的图像。对于一般的图像而言,大多数DCT系数值都接近于0,所以去掉这些系数不会对重建图像的质量产生较大影响。因此,利用DCT进行图像压缩确实可以节约大量的存储空间。 由于图像可看成二维数据矩阵,所以在图像编码中多采用二维正交变换方式,然而其正交变换的计算量太大,所以在实用中变换编码并不是对整幅图像进行变换和编码,而是将图像分成若

活动图像压缩标准H263

数字电视课程论文题目活动图像压缩标准H.263 专业 学号 学生 日期2014年3月28 日

活动图像压缩标准H.263 摘要:图像压缩的主要目的是为了解决电视信号经数字编码后面临的海量数据存储于传输问题,本文介绍了图像压缩的理论基础和视频图像压缩的研究概况以及方法,并着重介绍了活动图像压缩标准H.263及其基本算法,并做了总结和展望。 关键词:图像压缩、H.263 1 图像压缩的原因及原理 电视信号经数字编码以后,面临的最大难题之一是海量数据存储与传输的问题,以我国数字高清晰度电视格式为例,亮度信号抽样频率为74.25MH,两个色差信号为37.125MHz,采用10比特量化,串行比特率高达l.485Gb/s。从理论(PCM)上讲每1Hz信道带宽能传输的最高比特率是2b/s,因此标准清晰度电视要求信道提供135MHz的带宽,是模拟电视信号带宽的二十几倍,而高清晰度电视要求的信道的带宽则更宽。如果不经压缩编码处理,现有的频率资源仅能传输几套标清电视节目。显然,这是人们无法容忍的,所以必需对图像进行压缩编码处理才能充分利用频率资源。这就好像将牛奶中的水分去掉(压缩)制成奶粉,在需要时将水倒进去(解码)又做成牛奶一样。 近年来,多媒体技术迅猛发展,视频压缩编码技术的应用越来越广。视频压缩的理论依据主要在两个方面,一方面是视频信号中存在大量的冗余,如:(1)时间冗余:活动图像的两个连续帧之间的冗余。 (2)空间冗余:像素点之间的相关性。 (3)信息熵冗余:单位信息量大于其熵。(4)知识冗余。 (4)结构冗余:图像的区域上存在非常强的纹理结构。 (5)知识冗余:有固定的结构,如人的头像。 (6)视觉冗余:某些图像的失真是人眼不易觉察的。 视频压缩实质上就是通过减少这些冗余来降低存储和传送视频信息所需要的比特数。 另一方面,根据人眼的视觉特性,如果在对图像质量要求不是特别严格,允许重建图像有一定限度失真的情况下,数据压缩的可能性更大,而且压缩的比例也更大。对数字图像进行压缩通常利用两个基本原理: (1) 数字图像的相关性。在图像的同一行相邻像素之间、活动图像的相邻帧的对应像素之间往往存在很强的相关性,去除或减少这些相关性,也就去除或减少图像信息中的冗余度,即实现了对数字图像的压缩。 (2) 人的视觉心理特征。人的视觉对于边缘急剧变化不敏感(视觉掩盖效应),对

JPEG图像压缩算法及其实现

一、JEPG压缩算法(标准) (一)JPEG压缩标准 JPEG(Joint Photographic Experts Group)是一个由ISO/IEC JTC1/SC2/WG8和CCITT VIII/NIC于1986年底联合组成的一个专家组,负责制定静态的数字图像数据压缩编码标准。迄今为止,该组织已经指定了3个静止图像编码标准,分别为JPEG、JPEG-LS和JPEG2000。这个专家组于1991年前后指定完毕第一个静止图像压缩标准JPEG标准,并且成为国际上通用的标准。JPEG标准是一个适用范围很广的静态图像数据压缩标准,既可用于灰度图像又可用于彩色图像。 JPEG专家组开发了两种基本的静止图像压缩算法,一种是采用以离散余弦变换(Discrete Cosine Transform, DCT)为基础的有损压缩算法,另一种是采用以预测技术为基础的无损压缩算法。使用无损压缩算法时,其压缩比比较低,但可保证图像不失真。使用有损压缩算法时,其算法实现较为复杂,但其压缩比大,按25:1压缩后还原得到的图像与原始图像相比较,非图像专家难于找出它们之间的区别,因此得到了广泛的应用。 JPEG有4种工作模式,分别为顺序编码,渐近编码,无失真编码和分层编码,他们有各自的应用场合,其中基于顺序编码工作模式的JPEG压缩系统也称为基本系统,该系统采用单遍扫描完成一个图像分量的编码,扫描次序从左到右、从上到下,基本系统要求图像像素的各个色彩分量都是8bit,并可通过量化线性地改变DCT系统的量化结果来调整图像质量和压缩比。下面介绍图像压缩采用基于DCT的顺序模式有损压缩算法,该算法下的JPEG压缩为基本系统。 (二)JPEG压缩基本系统编码器 JPEG压缩是有损压缩,它利用了人的视觉系统的特性,将量化和无损压缩编码相结合来去掉视觉的冗余信息和数据本身的冗余信息。基于基本系统的JPEG压缩编码器框图如图1所示,该编码器是对单个图像分量的处理,对于多个分量的图像,则首先应将图像多分量按照一定顺序和比例组成若干个最小压缩单元(MCU),然后同样按该编码器对每个MCU各个分量进行独立编码处理,最终图像压缩数据将由多个MCU压缩数据组成。 图1 JPEG压缩编码器结构框图

相关文档
最新文档