JPEG图像压缩过程PPT
合集下载
图像压缩英文ppt

0.587 0.114 R 0 Y 0.299 Cb 0.169 0.334 0.500 G 128 Cr 0.500 0.419 0.081 B 128
Predictive Coding
DPCM
To remove mutual redundancy between seccessive pixels and encode only the new information
NTU, GICE, MD531, DISP Lab An Introduction to Image Compression Wei-Yi Wei
Outline
Image Compression Fundamentals
General Image Storage System Color Space
Reduce correlation between pixels
Karhunen-Loeve Transform Discrete Cosine Transform Discrete Wavelet Transform Differential Pulse Code Modulation Differential Coding
Subband Coding
DWT (Discrete Wavelet Transform)
To divide the spectrum of an image into the lowpass and the highpass components, DWT is a famous example. JPEG 2000 is a 2-dimension DWT based image compression standard.
数字图像处理图像压缩ppt课件

图像熵值
6
H Pxi log2 Pxi i 1 0.4log2 0.4 0.3log2 0.3 2 0.1log2 0.1
0.06log2 0.06 0.04log2 0.04
2.14bit
平均码长 N与H接近,N H
第七章 图像压缩
7.2 基础知识 7.2.1 数据冗余
• 数据冗余旳概念
数据是用来表达信息旳。假如不同旳措施为表 达给定量旳信息使用了不同旳数据量,那么使用 较多数据量旳措施中,有些数据必然是代表了无 用旳信息,或者是反复地表达了其他数据已表达 旳信息,这就是数据冗余旳概念。
第七章 图像压缩
7.2.1 数据冗余
元素
xi
x1
x2 x3 x4
x5
x6
概率 P(xi) 0.4 0.3 0.1 0.1 0.06 0.04
编码 wi 1 00 011 0100 01010 01011
第七章 图像压缩
x1 0.4
0.4
x2 0.3
0.3
x3 0.1
0.1
x4 0.1
0.1 (0100)
x5 0.06 (01010) 0.1(0101)
例如:原图像数据:234 223 231 238 235 压缩后数据:234 -11 8 7 -3
第七章 图像压缩
7.2.1 数据冗余
• 什么是心理视觉冗余?
这是因为眼睛对全部视觉信息感受旳敏捷度 不同。在正常视觉处理过程中多种信息旳相对主 要程度不同。 有些信息在一般旳视觉过程中与另 外某些信息相比并不那么主要,这些信息被以为 是心理视觉冗余旳,清除这些信息并不会明显降 低图像质量。
• 三种基本旳数据冗余
编码冗余 像素间冗余 心理视觉冗余
6
H Pxi log2 Pxi i 1 0.4log2 0.4 0.3log2 0.3 2 0.1log2 0.1
0.06log2 0.06 0.04log2 0.04
2.14bit
平均码长 N与H接近,N H
第七章 图像压缩
7.2 基础知识 7.2.1 数据冗余
• 数据冗余旳概念
数据是用来表达信息旳。假如不同旳措施为表 达给定量旳信息使用了不同旳数据量,那么使用 较多数据量旳措施中,有些数据必然是代表了无 用旳信息,或者是反复地表达了其他数据已表达 旳信息,这就是数据冗余旳概念。
第七章 图像压缩
7.2.1 数据冗余
元素
xi
x1
x2 x3 x4
x5
x6
概率 P(xi) 0.4 0.3 0.1 0.1 0.06 0.04
编码 wi 1 00 011 0100 01010 01011
第七章 图像压缩
x1 0.4
0.4
x2 0.3
0.3
x3 0.1
0.1
x4 0.1
0.1 (0100)
x5 0.06 (01010) 0.1(0101)
例如:原图像数据:234 223 231 238 235 压缩后数据:234 -11 8 7 -3
第七章 图像压缩
7.2.1 数据冗余
• 什么是心理视觉冗余?
这是因为眼睛对全部视觉信息感受旳敏捷度 不同。在正常视觉处理过程中多种信息旳相对主 要程度不同。 有些信息在一般旳视觉过程中与另 外某些信息相比并不那么主要,这些信息被以为 是心理视觉冗余旳,清除这些信息并不会明显降 低图像质量。
• 三种基本旳数据冗余
编码冗余 像素间冗余 心理视觉冗余
几种图像压缩算法 PPT课件

原算 法的难易程度,亦即完成压缩所需要的时 间与空间开销或硬件实现的复杂性。 压缩的方法主要有以下几种(见图 3.3)。
无损编码可以完全恢复原始图像而不 引入失真,它利用数据的统计特性来进行 数据压缩,解压缩后的还原图像与原始图 像完全一致。有损编码不能完全恢复原始 数据,而是利用人的视觉特性使解压缩后 的图像和原来一样。把上述方法结合起来 即为混合方法。
5、 交流系数的编码
量化AC系数的特点是1×64矢量中包含有 许多“0”系数,并且许多“0”是连续的,因 此使用非常简单和直观的游程长度编码 (RLE)对它们进行编码。 JPEG使用了1个 字节的高4位来表示连续“0”的个数,而使 用它的低4位来表示编码下一个非“0”系数 所需要的位数,跟在它后面的是量化AC系 数的数值。
JPEG编码
二、JPEG算法的主要计算步骤 JPEG压缩编码算 法的主要计算步骤如下:
(1)正向离散余弦变换(FDCT)。 (2)量化(Quantization)。 (3)Z字形编码(Zigzag Scan)。 (4)使用差分脉冲编码调制(Differential Pulse Code
3.行程长度编码
编码实例(16色bmp数据):
5个
第一行:24 24 24 30 60 40 09 22…46…46
第二行:64 65 67 88 88 88 88 … 90 78
00 00:表示该行图像数据已结束
00 01:表示整个图像结束
00 02:用来转义后面两个字节,即表示其后的两个字 节分别表示下一个像素从当前位置开始的水平与垂直 位移
7、组成位数据流
JPEG编码的最后一个步骤是把各种标记代 码和编码后的图像数据组成一帧一帧的数 据,这样做的目的是为了便于传输、存储 和译码器进行译码,这样的组织的数据通 常称为JPEG位数据流(JPEG bitstream)。
无损编码可以完全恢复原始图像而不 引入失真,它利用数据的统计特性来进行 数据压缩,解压缩后的还原图像与原始图 像完全一致。有损编码不能完全恢复原始 数据,而是利用人的视觉特性使解压缩后 的图像和原来一样。把上述方法结合起来 即为混合方法。
5、 交流系数的编码
量化AC系数的特点是1×64矢量中包含有 许多“0”系数,并且许多“0”是连续的,因 此使用非常简单和直观的游程长度编码 (RLE)对它们进行编码。 JPEG使用了1个 字节的高4位来表示连续“0”的个数,而使 用它的低4位来表示编码下一个非“0”系数 所需要的位数,跟在它后面的是量化AC系 数的数值。
JPEG编码
二、JPEG算法的主要计算步骤 JPEG压缩编码算 法的主要计算步骤如下:
(1)正向离散余弦变换(FDCT)。 (2)量化(Quantization)。 (3)Z字形编码(Zigzag Scan)。 (4)使用差分脉冲编码调制(Differential Pulse Code
3.行程长度编码
编码实例(16色bmp数据):
5个
第一行:24 24 24 30 60 40 09 22…46…46
第二行:64 65 67 88 88 88 88 … 90 78
00 00:表示该行图像数据已结束
00 01:表示整个图像结束
00 02:用来转义后面两个字节,即表示其后的两个字 节分别表示下一个像素从当前位置开始的水平与垂直 位移
7、组成位数据流
JPEG编码的最后一个步骤是把各种标记代 码和编码后的图像数据组成一帧一帧的数 据,这样做的目的是为了便于传输、存储 和译码器进行译码,这样的组织的数据通 常称为JPEG位数据流(JPEG bitstream)。
JPEG图像压缩编码原理及格式

图像灰度级gray(x,y)
JPEG中的余弦变换
对pic2进行DCT:
pic2
DCT:高频系数很小
JPEG中的余弦变换
pic3:
pic3
图像灰度级gray(x,y)
JPEG中的余弦变换
对pic3进行DCT:
pic3
DCT:高频系数较大一些
JPEG中的余弦变换
在JPEG进行余弦变换后,由8x8像素图像块获 得8x8个频域系数C(u,v),如果存储64个频域系 数,则图像数据并不能压缩。
(DCT系数x1000)
DCT:高频系数很小
JPEG中的余弦变换
对pic0进行DCT:
pic0
DCT:高频系数很小
JPEG中的余弦变换
pic1:
pic1
图像灰度级gray(x,y)
JPEG中的余弦变换
对pic1进行DCT:
pic1
DCT:高频系数很小
JPEG中的余弦变换
pic2:
pic2
0
0
0
0
0
0
2
0
0
0
ห้องสมุดไป่ตู้
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
{74,33,31,-1,-2,-1,2,-2,-2,2,0,0,……,0};
由于大量的0连续排列,可以用“行程编码(Run Length Coding)”方法节约存贮空间。
静态图象压缩标准JPEG

图片1 图片1 Bmp 格式(900K) 格式(900K
图片2 图片2 JPEG格式(40K JPEG格式(40K)
你能分辨哪一幅是Bmp格式,哪一幅是JPEG格式吗? 你能分辨哪一幅是Bmp格式,哪一幅是JPEG格式吗?
为什么会有如此大的差距呢?
JPEG采用了图象压缩的技术 采用了图象压缩的技术 采用了图象压缩
(3).量化处理 (3).量化处理
输入: 输入:对FDCT输出的DCT系数进行量化处 理 关键:找最小量化失真(误差)的量化器。 关键 作用:在一定主观保真度图象质量前提下, 作用 丢掉那些对视觉影响不大的信息,通过量化 可调节数据压缩比。 输出:DC系数(直流)和AC系数(交流)
JPEG采用线性均匀量化器,定义 为对64个DCT系数除以量化步长,再四舍 五入取整。 F (u,v) = Integer Round [F(u,v) / Q(u,v)] Q(u,v):量化器步长,是量化表的元素。
本节重点内容
JPEG标准的基本系统中压缩过程有哪几 步,以及各步的工作原理是什么?
2.3.1 JPEG标准的主要内容 JPEG标准的主要内容
JPEG标准选定ADCT作为静态图象压缩 的标准化算法 本标准有两大分类。
第一类方式以DCT为基础 缺点:含有量化过程、非可逆 优点:变换系数较少,还原质量高 第二类方式以二维空间DPCM为基础 缺点:压缩率低 优点:可完全复原
(4).熵编码 (4).熵编码
为了进一步压缩数据,需对DC码和AC行 程编码的码字再做基于统计特性的熵编 码。 JPEG建议的熵编码是Huffman编码和自 适应二进制编码。 输入:DC码和AC行程编码的码字。 输出:压缩后的数据。
熵编码可分成两步进行 (1)先把DC码和形成编码转换成中间符 号序列。 (2)然后给这些符号赋予变长码字。
静态图像压缩标准JPEG

JPEG已成为数字图像处理的国际标 准,被广泛应用于各种操作系统、软 件和硬件平台。
02
JPEG压缩算法原理
离散余弦变换(DCT)
离散余弦变换(DCT)是一种将图像从空间域变换到频域的算法,通过将图像分解 为余弦函数的和,实现图像数据的压缩。
DCT将图像分为8x8的块,对每个块进行DCT变换,将每个像素点的灰度值转换 为一系列余弦函数的系数,保留主要的低频分量,去除次要的细节分量,达到压 缩的目的。
2
JPEG压缩算法能够有效地去除图像中的冗余信息, 减小图像文件大小,同时保持较高的图像质量。
3
在数字相机中,JPEG压缩技术广泛应用于各种型 号和品牌的相机中,成为存储图像的默认格式之 一。
网络传输中的JPEG图像压缩
01
在网络传输中,由于带宽限制 和传输效率的需求,需要对图 像进行压缩以减小传输时间和 数据量。
逐行采样(Progressive mode)
图像从粗糙到精细的顺序进行采样,先输出低分辨率的图像,然后逐渐增加分辨率。
顺序采样(Sequential mode)
图像按照像素的顺序逐行进行采样,每一行都采样一次。
分层采样(Tiled mode)
将图像分成若干个小的区域,每个区域独立进行采样。
量化表(Quantization Table)
静态图像压缩标准JPEG
• JPEG标准概述 • JPEG压缩算法原理 • JPEG标准的主要技术参数 • JPEG标准与其他图像压缩标准的比较 • JPEG标准的应用案例
01
JPEG标准概述
JPEG标准的发展历程
01
02
03
1986年
JPEG标准第一版发布,支 持基本压缩算法。
02
JPEG压缩算法原理
离散余弦变换(DCT)
离散余弦变换(DCT)是一种将图像从空间域变换到频域的算法,通过将图像分解 为余弦函数的和,实现图像数据的压缩。
DCT将图像分为8x8的块,对每个块进行DCT变换,将每个像素点的灰度值转换 为一系列余弦函数的系数,保留主要的低频分量,去除次要的细节分量,达到压 缩的目的。
2
JPEG压缩算法能够有效地去除图像中的冗余信息, 减小图像文件大小,同时保持较高的图像质量。
3
在数字相机中,JPEG压缩技术广泛应用于各种型 号和品牌的相机中,成为存储图像的默认格式之 一。
网络传输中的JPEG图像压缩
01
在网络传输中,由于带宽限制 和传输效率的需求,需要对图 像进行压缩以减小传输时间和 数据量。
逐行采样(Progressive mode)
图像从粗糙到精细的顺序进行采样,先输出低分辨率的图像,然后逐渐增加分辨率。
顺序采样(Sequential mode)
图像按照像素的顺序逐行进行采样,每一行都采样一次。
分层采样(Tiled mode)
将图像分成若干个小的区域,每个区域独立进行采样。
量化表(Quantization Table)
静态图像压缩标准JPEG
• JPEG标准概述 • JPEG压缩算法原理 • JPEG标准的主要技术参数 • JPEG标准与其他图像压缩标准的比较 • JPEG标准的应用案例
01
JPEG标准概述
JPEG标准的发展历程
01
02
03
1986年
JPEG标准第一版发布,支 持基本压缩算法。
第11章 静态图像压缩标准JPEG
多媒体技术基础与应用
DCT变换频率域的理解
多媒体技术基础与应用
JPEG的量化
DCT变换的作用是使空间域的能量重新分布, 降低图像的相关性。DCT变换本身并不能达到数 据压缩的作用,而要实现图像压缩,就要选择适 当的比特分配方案和量化方法。 量化的作用是在保证主观图像质量的前提下, 丢掉那些对视觉效果影响不大的信息。量化是一 种降低精度的过程,所以是有损的。
多媒体技术基础与应用
RG体技术基础与应用
各分量的采样
颜色空间的转换后,然后进行各分量的采样,其
目的是使采集到的图像数据有所减少。也就是减 少色度的成份(称为"缩减采样"或"色度采样"。 在JPEG上这种缩减取样的比例可以是4:4:4(无 缩减取样),4:2:2(即Y取4个8×8的宏块, CbCr各取2个8×8的宏块)。
相邻的子块DC系数的差值可用公式 表示为:
多媒体技术基础与应用
交流系数(AC)编码与Z形扫描
频率矩阵中有63个元素是交流(AC)系 数,可采用行程编码进行压缩。需要考虑 的问题是:这63个系数应该按照怎么样的 顺序排列?为了保证低频分量先出现,高 频分量后出现,这63个元素采用了“之” 字型(Zig-Zag)的排列方法,称之为Z形扫描。
多媒体技术基础与应用
JPEG2000图像不同压缩示例
多媒体技术基础与应用
支持“感兴趣区域”
多媒体技术基础与应用
多媒体技术基础与应用
熵编码
量化仅生成了DCT系数的一种有效的离 散表示,实际传输前,还须对其进行比特 流编码,产生用于传输的数字比特流。简 单的编码方法是采用定长码,即每个量化 值以同样数目的比特表示,但这种方法的 效率较低。而采用熵编码可以提高编码效 率。熵编码中使用较多的一种是霍夫曼编 码。
DCT变换频率域的理解
多媒体技术基础与应用
JPEG的量化
DCT变换的作用是使空间域的能量重新分布, 降低图像的相关性。DCT变换本身并不能达到数 据压缩的作用,而要实现图像压缩,就要选择适 当的比特分配方案和量化方法。 量化的作用是在保证主观图像质量的前提下, 丢掉那些对视觉效果影响不大的信息。量化是一 种降低精度的过程,所以是有损的。
多媒体技术基础与应用
RG体技术基础与应用
各分量的采样
颜色空间的转换后,然后进行各分量的采样,其
目的是使采集到的图像数据有所减少。也就是减 少色度的成份(称为"缩减采样"或"色度采样"。 在JPEG上这种缩减取样的比例可以是4:4:4(无 缩减取样),4:2:2(即Y取4个8×8的宏块, CbCr各取2个8×8的宏块)。
相邻的子块DC系数的差值可用公式 表示为:
多媒体技术基础与应用
交流系数(AC)编码与Z形扫描
频率矩阵中有63个元素是交流(AC)系 数,可采用行程编码进行压缩。需要考虑 的问题是:这63个系数应该按照怎么样的 顺序排列?为了保证低频分量先出现,高 频分量后出现,这63个元素采用了“之” 字型(Zig-Zag)的排列方法,称之为Z形扫描。
多媒体技术基础与应用
JPEG2000图像不同压缩示例
多媒体技术基础与应用
支持“感兴趣区域”
多媒体技术基础与应用
多媒体技术基础与应用
熵编码
量化仅生成了DCT系数的一种有效的离 散表示,实际传输前,还须对其进行比特 流编码,产生用于传输的数字比特流。简 单的编码方法是采用定长码,即每个量化 值以同样数目的比特表示,但这种方法的 效率较低。而采用熵编码可以提高编码效 率。熵编码中使用较多的一种是霍夫曼编 码。
图像压缩原理资料课件
三维立体图像压缩
总结词
三维立体图像提供了更真实的视觉体验,但其数据量巨大,对压缩技术提出了更高的要求。
详细描述
三维立体图像的压缩需要同时考虑空间和深度信息,目前主要采用基于深度学习的方法进行压缩,同时还需要解 决如何保留立体感的问题。
人工智能辅助的图像压缩
总结词
人工智能技术的发展为图像压缩提供了新的思路和方法。
图像压缩的应用
数字电视广播
数字电视广播需要传输大量的视频数 据,图像压缩技术可以有效减少数据 量,提高传输效率和图像质量。
数字电视广播采用MPEG、H.264等图 像压缩标准,实现高效的数据压缩和 传输,满足大规模广播覆盖的需求。
互联网图像传
在互联网上传输图像时,由于带宽限制和网络拥堵,需要采 用图像压缩技术来减小图像文件的大小,加快传输速度。
常见的互联网图像传输格式包括JPEG、PNG等,这些格式采 用不同的压缩算法,以在保证图像质量的前提下尽可能减小 文件大小。
医学影像存储与传
医学影像如CT、MRI等包含大量的数据信息,直接存储和传输成本较高,因此需 要采用图像压缩技术进行压缩。
医学影像压缩对于远程诊断、会诊和医学教育等方面具有重要意义,可以降低存 储成本、加快传输速度并提高图像质量。
有损压缩
有损压缩会丢失一些数据,但压 缩率较高,常用的算法有JPEG、 MPEG等。
图像压缩标准
01
02
03
JPEG
主要用于静态图像压缩, 广泛应用于网络传输和数 字相机等领域。
JPEG2000
相对于JPEG有更高的压缩 比和更好的图像质量,尤 其在处理医学图像和遥感 图像方面有优势。
MPEG
主要用于视频压缩,包括 MPEG-1、MPEG-2、 MPEG-4等,广泛应用于 音视频存储、传输和播放 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我们给出具体的数据来对比一下。图Clouds.bmp,原图大小为640*480, 256色。用工具SEA(version1.3)将其分别转成24位色BMP、24位色JPEG、 GIF(只能转成256色)压缩格式、24位色TIFF压缩格式、24位色TGA压缩格式。得 到的文件大小(以字节为单位)分别为:921,654 17,707 177,152 923,044 768,136。可见JPEG比其它几种压缩比要高得多,而图象质量都差不多(JPEG处 理的颜色只有真彩和灰度图)。
(3)无损模式:基于DPCM,保证解码后完全精确恢复到原图像采样值; (4)层次模式:图像在多个空间分辨率中进行编码,可以根据需要只对低分辨率数 据做解码,放弃高分辨率信息;
在实际应用中,JPEG图像编码算法使用的大多是离散余弦变换、Huffman编码、 顺序编码模式。这样的方式,被人们称为JPEG的基本系统。这里介绍的JPEG编码 算法的流程,也是针对基本系统而言。基本系统的JPEG压缩编码算法一共分为11个 步骤:颜色模式转换、采样、分块、离散余弦变换(DCT)、Zigzag 扫描排序、量 化、DC系数的差分脉冲调制编码、DC系数的中间格式计算、AC系数的游程长度编 码、AC系数的中间格式计算、熵编码。下面,将一一介绍这11个步骤的详细原理和 计算过程。
取样比例一般是4:1:1或者4:2:2(4:1:1含义就是:在2x2的单元中,本应分
别有4个Y,4个U,4个V值,用12个字节进行存储。经过4:1:1采样处理后,每个单元
(1)有损的离散余弦变换DCT(Discrete Cosine Transform) (2)无损的预测压缩技术; 熵编码方法:
(1)Huffman编码; (2)算术编码; 编码模式:
(1)基于DCT的顺序模式:编码、解码通过一次扫描完成; (2)基于DCT的渐进模式:编码、解码需要多次扫描完成,扫描效果由粗到精,逐 级递增;
图像压缩技术(压缩算法)分析
基于离散余弦变换的JPEG图像压缩算法分析
第二组:吕昌伟 司庆龙 赵 甜 冯明洋
图像压缩技术(压缩算法)分析
Q1:为什么要进行图像压缩处理?
图像数据量举例: 【存储】对于每秒25帧,分辨率为512X512,每一个像素用8比特来表示的视频图像 视频图像数据量:512X512X8X25bit/s≈150Mbit/s≈19Mbyte/s≈70,000MB/hr 家用VCD存储容量:650M,74Min 对照70G/hr 大约需要压缩100倍
图像压缩技术(压缩算法)分析
四、JPEG图像压缩过程分析
JPEG压缩的编解码互逆过程:
四、JPEG图像压缩过程分析 1、颜色模式转换
图像压缩技术(压缩算法)分析
JPEG采用的是YCrCb颜色空间,而BMP采用的是RGB颜色空间,要想对BMP
图片进行压缩,首先需要进行颜色空间的转换。YCrCb颜色空间中,Y代表亮度,
一般来说,C 值 (包括 Cb Cr) 应该是一个有符号的数字, 但这里通过加上128,使其
变为8位的无符号整数,从而方便数据的存储和计算。
R = Y+1.402(Cr-128)
G = Y-0.34414(Cb-128)-0.71414(Cr-128)
B = Y+1.772(Cb-128) 2、采样
图像压缩技术(压缩算法)分析
三、图像压缩编码的分类 1、从图像信息角度对编码分类
信息保持编码(依据香农的信息论) 保真度编码(允许失真度不同,根据它的应用场合不同) 特征抽取
2、从图像编码方法对编码分类 平均信息方法:利用图像的统计特征分配码字长度,达到压缩目的, 如Huffman,S-F等 预测方法:图像信息在空间上具有一些冗余性(可利用一维的预测编码) 时间上(可以利用时间冗余性 针尖预测) 变换方法:小波变换 离散余弦变换方法 频带编码 阈值编码 多维技术 自适应方法 像素编码: 行程编码 等值线编码 位平面编码等 其它 :混合编码 二值/图形编码 彩色图像编码 矢量量化 金字塔编码 基于知识的编码
研究发现,人眼对亮度变换的敏感度要比对色彩变换的敏感度高出很多。因此,
我们可以认为Y分量要比Cb,Cr分量重要的多。在BMP图片中,RGB三个分量各采用
一个字节进行采样,也就是我们常听到的RGB888的模式;而JPEG图片中,通常采
用两种采样方式:YUV411和YUV422,它们所代表的意义是Y,Cb,Cr三个分量的数据
正是由于JPEG的高压缩比,使得它广泛地应用于多媒体和网络程序中,例如 HTML语法中选用的图象格式之一就是JPEG(另一种是GIF)。这是显然的,因为 网络的带宽非常宝贵,选用一种高压缩比的文件格式是十分必要的。
四、JPEG图像基础
图像压缩技术(压缩算法)分析
JPEG专家组开发了两种基本的压缩算法、两种熵编码方法、四种编码模式。 压缩算法:
Cr,Cb则代表色度和饱和度(也有人将Cb,Cr两者统称为色度),三者通常以Y,U,V来表
示,即用U代表Cb,用V代表Cr。RGB和YCrCb之间的转换关系如下所示:
Y = 0.299R+0.587G+0.114B
Cb = -0.1687R-0.3313G+0.5B+128
Cr = 0.5R-0.418G-0.0813B+128
图像压缩技术(压缩算法)分析
四、JPEG图像基础
JPEG是联合图象专家组(Joint Picture Expert Group)的英文缩写,是国际标 准化组织(ISO)和CCITT联合制定的静态图象的压缩编码标准。
与相同图象质量的其它常用文件格式(如GIF,TIFF,PCX)相比,JPEG是目 前静态图象中压缩比最高的。
【传输】 Cable ATM Mobil communication (移动通信网络)
1.5-10Mbs 最大可达34Mbs
10Kbs-量减少图像数据的尺寸,以便于传输、存储、 管理、处理和应用。
Q2:为什么图像可以压缩?(有没有压缩的可行性?)
1、图像中的数据冗余:空间冗余 时间冗余 信息熵冗余 结构冗余 知识冗余 视觉冗余 其它冗余 2、图像在一些情况下允许一定程度的失真
(3)无损模式:基于DPCM,保证解码后完全精确恢复到原图像采样值; (4)层次模式:图像在多个空间分辨率中进行编码,可以根据需要只对低分辨率数 据做解码,放弃高分辨率信息;
在实际应用中,JPEG图像编码算法使用的大多是离散余弦变换、Huffman编码、 顺序编码模式。这样的方式,被人们称为JPEG的基本系统。这里介绍的JPEG编码 算法的流程,也是针对基本系统而言。基本系统的JPEG压缩编码算法一共分为11个 步骤:颜色模式转换、采样、分块、离散余弦变换(DCT)、Zigzag 扫描排序、量 化、DC系数的差分脉冲调制编码、DC系数的中间格式计算、AC系数的游程长度编 码、AC系数的中间格式计算、熵编码。下面,将一一介绍这11个步骤的详细原理和 计算过程。
取样比例一般是4:1:1或者4:2:2(4:1:1含义就是:在2x2的单元中,本应分
别有4个Y,4个U,4个V值,用12个字节进行存储。经过4:1:1采样处理后,每个单元
(1)有损的离散余弦变换DCT(Discrete Cosine Transform) (2)无损的预测压缩技术; 熵编码方法:
(1)Huffman编码; (2)算术编码; 编码模式:
(1)基于DCT的顺序模式:编码、解码通过一次扫描完成; (2)基于DCT的渐进模式:编码、解码需要多次扫描完成,扫描效果由粗到精,逐 级递增;
图像压缩技术(压缩算法)分析
基于离散余弦变换的JPEG图像压缩算法分析
第二组:吕昌伟 司庆龙 赵 甜 冯明洋
图像压缩技术(压缩算法)分析
Q1:为什么要进行图像压缩处理?
图像数据量举例: 【存储】对于每秒25帧,分辨率为512X512,每一个像素用8比特来表示的视频图像 视频图像数据量:512X512X8X25bit/s≈150Mbit/s≈19Mbyte/s≈70,000MB/hr 家用VCD存储容量:650M,74Min 对照70G/hr 大约需要压缩100倍
图像压缩技术(压缩算法)分析
四、JPEG图像压缩过程分析
JPEG压缩的编解码互逆过程:
四、JPEG图像压缩过程分析 1、颜色模式转换
图像压缩技术(压缩算法)分析
JPEG采用的是YCrCb颜色空间,而BMP采用的是RGB颜色空间,要想对BMP
图片进行压缩,首先需要进行颜色空间的转换。YCrCb颜色空间中,Y代表亮度,
一般来说,C 值 (包括 Cb Cr) 应该是一个有符号的数字, 但这里通过加上128,使其
变为8位的无符号整数,从而方便数据的存储和计算。
R = Y+1.402(Cr-128)
G = Y-0.34414(Cb-128)-0.71414(Cr-128)
B = Y+1.772(Cb-128) 2、采样
图像压缩技术(压缩算法)分析
三、图像压缩编码的分类 1、从图像信息角度对编码分类
信息保持编码(依据香农的信息论) 保真度编码(允许失真度不同,根据它的应用场合不同) 特征抽取
2、从图像编码方法对编码分类 平均信息方法:利用图像的统计特征分配码字长度,达到压缩目的, 如Huffman,S-F等 预测方法:图像信息在空间上具有一些冗余性(可利用一维的预测编码) 时间上(可以利用时间冗余性 针尖预测) 变换方法:小波变换 离散余弦变换方法 频带编码 阈值编码 多维技术 自适应方法 像素编码: 行程编码 等值线编码 位平面编码等 其它 :混合编码 二值/图形编码 彩色图像编码 矢量量化 金字塔编码 基于知识的编码
研究发现,人眼对亮度变换的敏感度要比对色彩变换的敏感度高出很多。因此,
我们可以认为Y分量要比Cb,Cr分量重要的多。在BMP图片中,RGB三个分量各采用
一个字节进行采样,也就是我们常听到的RGB888的模式;而JPEG图片中,通常采
用两种采样方式:YUV411和YUV422,它们所代表的意义是Y,Cb,Cr三个分量的数据
正是由于JPEG的高压缩比,使得它广泛地应用于多媒体和网络程序中,例如 HTML语法中选用的图象格式之一就是JPEG(另一种是GIF)。这是显然的,因为 网络的带宽非常宝贵,选用一种高压缩比的文件格式是十分必要的。
四、JPEG图像基础
图像压缩技术(压缩算法)分析
JPEG专家组开发了两种基本的压缩算法、两种熵编码方法、四种编码模式。 压缩算法:
Cr,Cb则代表色度和饱和度(也有人将Cb,Cr两者统称为色度),三者通常以Y,U,V来表
示,即用U代表Cb,用V代表Cr。RGB和YCrCb之间的转换关系如下所示:
Y = 0.299R+0.587G+0.114B
Cb = -0.1687R-0.3313G+0.5B+128
Cr = 0.5R-0.418G-0.0813B+128
图像压缩技术(压缩算法)分析
四、JPEG图像基础
JPEG是联合图象专家组(Joint Picture Expert Group)的英文缩写,是国际标 准化组织(ISO)和CCITT联合制定的静态图象的压缩编码标准。
与相同图象质量的其它常用文件格式(如GIF,TIFF,PCX)相比,JPEG是目 前静态图象中压缩比最高的。
【传输】 Cable ATM Mobil communication (移动通信网络)
1.5-10Mbs 最大可达34Mbs
10Kbs-量减少图像数据的尺寸,以便于传输、存储、 管理、处理和应用。
Q2:为什么图像可以压缩?(有没有压缩的可行性?)
1、图像中的数据冗余:空间冗余 时间冗余 信息熵冗余 结构冗余 知识冗余 视觉冗余 其它冗余 2、图像在一些情况下允许一定程度的失真