第八章 图像压缩
数字图像处理_第八章_图像压缩

数字图像处理
Chapter 8 Image Compression
8.1 基础 8.1.2 像素间冗
余
先看右边 两幅图a,b,c,d,而 e,f为相关系数→45 间隔联系。
数字图像处理
Chapter 8 Image Compression
8.1 基础
8.1.2 像素间冗余 如上页图示:
(n)
H ( z)
H ( z) P(a j )log P(a j )
j 1 J
Z P(a1 ), P(a2 ) P(a j )
J
以信源的熵(或不确定度),是观察单个信源输出得到的平 均信息量。
数字图像处理
Chapter 8 Image Compression
8.3 信息论要素 8.3.2 信息信道(信道)
数字图像处理
Chapter 8 Image Compression
8.1 基础 8.1.3 心理视觉冗余 例8.3通过量化进行压缩。
数字图像处理
Chapter 8 Image Compression
8.1 基础 8.1.3 心理视觉冗余 IGS量化方法:为减少颗粒状纹路用相邻像素灰度的低 位产生—随机数,加到当前像素。 IGS量化过程:
数字图像处理
Chapter 8 Image Compression
8.3 信息论要素
8.3 信息论要素
显示一幅图像究竟需多大的数据量? 8.3.1 测量信息 信息的产生可以被模拟为一个概率过程,发生概率为P (E)的随机事件E包含。
I ( E ) log 1 log P( E ) 的信息, T ( E ) 也叫自信息,底 P( E )
8.1 基础
图像压缩原理

图像压缩原理
图像压缩原理是通过减少图像数据的存储量来实现的。
具体来说,图像压缩原理涉及到以下几个方面。
1. 去除冗余信息:图像中通常存在大量冗余信息,例如连续相同颜色的像素或者相似颜色的像素。
通过将这些冗余信息进行去除或者压缩,可以达到减少图像存储量的目的。
2. 空间域压缩:在空间域压缩中,通过减少像素的数量或者减少像素的位数来减少图像文件的大小。
一种常见的空间域压缩算法是基于四色彩色的量化压缩方法,通过降低每个像素颜色的位数来减少存储空间。
3. 频域压缩:频域压缩是将图像从空间域转换为频域,利用图像在频域中的特性来进行压缩。
其中一种常见的频域压缩方法是基于离散余弦变换(DCT)的压缩方法,它将图像转换为频域信号,并利用频域信号中较小的系数来表示图像。
4. 熵编码:熵编码是一种无损压缩方法,通过对图像数据进行统计分析,利用出现频率较高的数据用较短的码字表示,从而减少图像文件的存储大小。
综上所述,图像压缩通过去除冗余信息、空间域压缩、频域压缩和熵编码等方法来减少图像数据的存储量。
这些方法可以单独应用,也可以结合使用,以达到更好的压缩效果。
第8章 图像压缩(1)

SNRms
x 0 y 0 M 1 N 1 x 0 y 0
ˆ f ( x, y) 2
2
[ fˆ ( x, y) f ( x, y)]
主观保真度准则:
8.2 图像压缩模型
信源 编码 信道 编码 编码器 信道 信道 解码 信源 解码 解码器
图8.5 一个常用的图像压缩系统模型
则,各信源符号自信息量:
I (a) 1.152,I (b) 2, I (c) 2.4739 I (d ) 3.0589 ,
信源熵
H ( X ) 0.45*1.152 0.25* 2 0.18* 2.4739 0.12 * 3.0589 1.8308
用例8.5第二种编码方法 ,平均码长为1.85,大于信源熵
如果找到一个非零值,则解码器只需简单地在校验字指出的位置补充码字比特.解码的 二进制h3h5h6h7就能从纠正后的码字中提取出来.
8.3 信息理论基础与熵编码
信息理论是图像编码的主要理论依据之一,它给出无失真编码所需比特数的下限, 为逼近这些下限提出了一系列熵编码算法.
(1) 离散信源的熵表示:
设一个离散信源X: x1 , x2 ,, x N ) ( 其概率分布: { p1 , p2 ,, p N } 满足
数据中存在信息冗余,就有可能对图像数据量进行压缩,针对数据冗余的类型 不同,可以有多种不同的数据压缩方法.
8.1 图像压缩基础
编码冗余: 图像灰度可用不同的编码表示
若用[0,1]内的一个随机变量rk 表示图像的灰度级, 则每个灰度级rk出现的概率为 : n pr (rk ) k k 0,1, 2,..., L 1 n
平均码长大于信源的熵
第八章__JPEG2000压缩标准简介

8.1 JPEG2000 简介 8.2 JPEG 2000的核心编码系统 8.3 RO I 编码
8.4 JPEG2000与JPEG的比较
参考:David S. Taubman; Michael W. Marcellin ,JPEG2000 图像压缩基础、标准和实践,电子工业出版社,2004
8.1.2 JPEG 2000标准的组织结构
JPEG2000 标准可分为7大部分:
PART 1 ,J PEG2000 图像编码系统, 是JPEG2000 标准的核
心系统;
PART 2 ,扩展系统,在核心系统上,添加了一些功能;
PART 3 ,运动JPEG2000 ,针对运动图像提出的解决方案;
正变换: 精确式:根据人眼对RGB三种颜色分量的感知特性, 设各颜色的权重为: ,满足 R 0.299, G 0.587, B 0.114
R G B 1
0.5 Cb (B Y ) 1B 0.5 Cr (R Y ) 1R 近似式:
则: Y R R G G B B
0.587 0.114 R Y 0.299 0. 5 Cb 0.168736 0.331264 G Cr B 0 . 5 0 . 418688 0 . 081312
一、图像分块与拼接
不需要将图像强制分成8×8的小块。
为了降低对内存的需求和方便压缩域中可能的分块处理, 可以将图像分割成若干互不重叠的矩形块(tile)。
分块的大小任意,可以整个图像是一个块,也可以一个像素是一
个块。 一般分成64×64~1024×1024大小的方块,边缘部分的块可能小一 些,而且不一定是方的。
第八章 图像压缩

数据压缩指减少表示给定信息量所需的数据量;
图像压缩所解决的问题是尽量减少表示数字图像时所需的数据量;
压缩率:
CR
n1 n2
相对数据冗余:
RD
1 1
CR
在数字图像压缩中,可以确定三种基本的数据冗余: 编码冗余、像 素间冗余和心理视觉冗余.
数据中存在信息冗余,就有可能对图像数据量进行压缩,针对数据冗 余的类型不同,可以有多种不同的数据压缩方法.
信源熵
H (X ) 1/ 2 *11/ 4 * 2 1/ 8*3 1/ 8*3 1.75
a,b,c,d用码字00,01,10,11来编码
lavg 1/ 2 * 2 1/ 4 * 2 1/ 8 * 2 1/ 8 * 2 2
a,b,c,d分别用码字0,10,110,111来编码
由于人眼对所有视觉信息感受的灵敏度的不同,因 此,在正常的视觉处理过程中,各种信息的相对重要 程度不同。那些不重要的信息称为心理视觉冗余.
消除视觉冗余会导致一定量的信息丢失,这一过程常 称为”量化”
例8.3 通过量化进行压缩 出现假轮廓
(a)256个灰度级的原图像 (b)均匀量化为16个灰度级 (c)用IGS量化为16个灰度级
其平均码长lavg满足 H(X)≤lavg <H(X)+1
由此可以看出,信源的熵是作无失真二元变长字编码时 平均码长的下限,这中变字长的统计编码又称为熵编码
离散、有记忆信源的无失真编码定理
设单符号、离散、有记忆信源的熵为H(z/v),若用二元码 对其作变字长、非延续编码,一定可以找到一种编码方
式,其平均码长lavg满足 H(z/v)≤lavg <H(z/v)+1
8.3信息论要素
图像压缩

图像数据的冗余主要表现为:图像中相邻像素
间的相关性引起的空间冗余;图像序列中不同帧之 间存在相关性引起的时间冗余;不同彩色平面或频 谱带的相关性引起的频谱冗余。数据压缩的目的就 是通过去除这些数据冗余来减少表示数据所需的比 特数。
图像压缩方法的介绍:有损压缩和无损压缩。
无损压缩又称冗余度压缩,信息保持编码或熵编码,是 一种可逆编码方法。该方法利用数据统计冗余度压缩,解码 时可完全恢复,但压缩率受到数据统计冗余度理论限制。常 见的无损压缩方法如下。
Huffman编码
无损压缩
算术编码 行程编码 LZW编码
有损压缩,又称信息量压缩,失真度编码或熵压缩 编码。该方法利用了人类视觉和听觉对某些频率成 分不敏感特性,允许压缩过程中损失一定的信息。 解码时,丢掉一些数据不会影响对声音或者图像的 理解。常见的有损压缩方法如下。
有损压缩
预测编码 变换编码 小波编码 分形编码 基于模型的编码
物体基编码
语义基编码
霍夫曼编码(Huffman coding)
1.根据给定数据集中霍夫曼(D.A. Huffman)在 1952年提出和描述的“从下到上”的熵编码方 法 2.各元素所出现的频率来压缩数据的一种统计 压缩编码方法。这些元素(如字母)出现的次数 越多,其编码的位数就越少 3.广泛用在JPEG, MPEG, H.26X等各种信息编码 标准中
行程编Байду номын сангаас:
一幅图像中对具有相同像素的颜色值 只存储具有相同颜色的像素数目或者存储一 个像素的颜色值,以及具有相同颜色值的行 数。
预测编码:
分析信号的相关性,利用已处理的信 号预测待处理的信号,得到预测值;然后 仅对真实值与预测值之间的差值信号进行 编码处理和传输,达到压缩的目的并能够 正确恢复。
第8章 图像压缩

数据压缩:减少表示给定信息量所需的数据量。 表示相同信息的数据集合n1和n2
相对数据冗余RD可以定义为:
压缩率CR定义为
当n2=n1,CR=1,RD=0,表示n1不包含冗余 数据。 当n2«n1时,CR→∞,RD→1,表示显著的压 缩和大量的冗余数据。 当n2»n1时, CR →0, RD →∞,数据扩展 (不希望) 一般, CR 和RD分别在开区间(0,∞)和(-∞,1) 内取值。 比如n1/n2=10,相应的冗余度为0.9,这表示
8.2.2 信道编码器和解码器 通过向信源编码数据中插入预制的冗余数 据来减少信道噪声的影响。 Hammning编码的基本思想,向被编码数据中 加入足够的位数以确保可用的码字间变化的 位数最小。 例如,将3位冗余码加到4位字上,则所有的一 位错误都可以检测出来并得到纠正 。
为了将汉明(Hamming)编码结果进行解 码,信道解码器必须为先前设立的偶校验的 各个位字段进行奇校验并检查译码值。一位 错误由一个非零奇偶校验字c4c2c1给出:
数据冗余包括: 编码冗余、像素间冗余和心理视觉冗余。
8.1.1 编码冗余
表达每个像素所需的平均比特数为:
其中,l(rk)是灰度值rk值的比特数,rk出现的概率为pr(rk)
使用m比特自然二进制编码表示图像的灰度级 ,则Lavg=m比特。
变长编码:用尽量少的比特数表达尽可能多的灰度级 以实现数据的压缩。
霍夫曼编码
这个编码的平均长度为: Lavg=(0.4)(1)+(0.3)(2)+(0.1)(3)+(0.1)(4) +(0.06)(5)+(0.04)(5)=2.2比特/符号
图像压缩原理

图像压缩原理图像压缩是一种将图像文件的大小减小的技术,它可以通过减少图像文件的存储空间来节省存储和传输成本。
图像压缩可以分为有损压缩和无损压缩两种类型。
有损压缩是在图像文件中去除一些细节信息,以减小文件大小,而无损压缩则是在不损失图像质量的情况下减小文件大小。
图像压缩技术在数字图像处理中起着非常重要的作用,它不仅可以减小文件大小,还可以提高图像传输的速度和效率。
图像压缩的原理主要包括了空间域压缩和频域压缩两种方法。
空间域压缩是指在像素级别上对图像进行压缩,而频域压缩是指在频率域上对图像进行压缩。
下面将分别介绍这两种压缩原理。
空间域压缩是最常见的图像压缩方法之一,它主要通过减少图像中像素的数量来减小文件大小。
在空间域压缩中,最常见的方法是通过减少图像的分辨率来实现。
分辨率是指图像中像素的数量,减小分辨率意味着减少图像中像素的数量,从而减小文件大小。
另外,空间域压缩还可以通过图像的子采样和量化来实现。
子采样是指在图像中隔行或隔列地去除像素,从而减小文件大小,而量化则是指将图像中的像素值近似为较小的值,也可以减小文件大小。
频域压缩是另一种常见的图像压缩方法,它主要是通过将图像转换到频率域上进行压缩。
在频域压缩中,最常见的方法是使用离散余弦变换(DCT)来将图像转换到频率域上,然后再对频率域上的系数进行量化和编码来实现压缩。
DCT是一种将图像转换到频率域上的数学变换方法,它可以将图像分解为不同频率的分量,从而可以更好地利用图像的频率信息来进行压缩。
除了空间域压缩和频域压缩外,图像压缩还可以通过预测编码、熵编码和字典编码等方法来实现。
预测编码是指利用图像中像素之间的相关性来进行压缩,而熵编码和字典编码则是利用信息论和数据压缩理论来进行压缩。
总的来说,图像压缩是一种非常重要的图像处理技术,它可以通过不同的方法来减小图像文件的大小,从而节省存储和传输成本。
空间域压缩和频域压缩是图像压缩的两种主要方法,它们可以通过减少图像的分辨率、子采样、量化、DCT变换等方法来实现压缩。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)“第一代”编码技术
三大经典编码方法
“熵值编码” “预测编码” “变换编码”
“熵值编码”
(概率匹配编码) 主要针对无记忆信源,根据信息码字出 现概率的分布特征,寻找概率与码字长 度间的最优匹配,从而进行压缩编码, 又称为统计编码。 游程编码、Huffman编码和算术编码等 多种。 熵值编码是信息编码的基础,也是各种 实用算法的一个基本组成部分。
图像压缩编码方案),只能用于特定图像场景(如人
的头肩像场景)的压缩。
算法的复杂度
算法的复杂度即指完成图像压缩和解压缩所需的
运算量和硬件实现该算法的难易程度。优秀的压缩算 法要求有较高的压缩比,压缩和解压缩快,算法简单 ,易于硬件实现,还要求解压缩后的图像质量较好。 选用编码方法时一定要考虑图像信源本身的统计特性
从本质上来说就是一种“混合编码”方 案,它在不同阶段根据图像的不同特征 将变换编码、预测编码、无误差编码等 各种方案的优势综合利用起来。 关键是识别图像的特征。 多种方案的复用缩标准JPEG、MPEG等在设计中就 利用了这种思路。
(2)第二代编码技术
“变换编码”
进行某种正交变换来消除像素间的相关性。 可分为最佳变换编码,如K-L变换,以及次 优变换编码,如离散余弦变换(DCT)等。 在实施时,辅助以区域变换编码、门限变换 编码。 基于离散余弦变换的静止图像压缩标准jpeg 和运动图像压缩标准mpeg等一系列标准。
“自适应编码”
3. 编码方法的分类
由压缩恢复的图像与原始图像的差别
“可逆压缩”:编码的数据可完全恢复出原始图 像 “熵编码”(Entropy Coding), “无失真编 码”、“无误差编码”(Error Free Coding) 、无噪声编码”(Noiseless)、“冗 余度压缩 ”(Redundancy Reduction)、 “数据紧缩”( DATA Compaction Lossless Bit-Preserving)。 “不可逆压缩”: “有失真编码”(lossy Coding),采用这类编码方法,由编码数据恢复 的图像与原始图像有区别,图像编码产生的误差 与编码的方法以及压缩比等因素有关。
PCM 预测 编码 编码 算法
固定 固定
自适应 自适应
离散余弦变换 变换编 码
统计 编码 付立叶变换 LZW Huffman编码
KL变换
斜变换
沃尔什 哈达马 小波变换
Harr变换
算术编码
游程编码
方块 静态图像 编码
比特平面 帧内预测
抖动
逐渐浮现 逐层内插
视频 图像
运动估计 帧间编码 内插
帧间预测
运动补偿
3.心理视觉冗余
人类的视觉系统对于图像场的注意是非均匀和非线 性的,特别是视觉系统并不是对于图像场的任何变 化都能感知,即眼睛并不是对所有信息都有相同的 敏感度,有些信息在通常的视觉感觉过程中与另外 一些信息相比来说并不那么重要,这些信息可认为 是心理视觉冗余的,去除这些信息并不会明显地降 低所感受到的图像的质量。 心理视觉冗余的存在是与人观察图像的方式有关的, 人在观察图像时主要是寻找某些比较明显的目标特 征,而不是定量地分析图像中每个像素的亮度,或 至少不是对每个像素等同地分析,人通过在脑子里 分析这些特征并与先验知识结合以完成对图像的解 释过程,由于每个人所具有的先验知识不同,对同 一幅图像的心理视觉冗余也就因人而异。 动态图像的视觉延迟现象
、多媒体系统的适应能力、应用环境以及技术标准。
8.3 信息论要素
Cr= n1/ n2
冗余量 Rd 可表示为:
Rd=1-1/Cr
数据冗余的类型
编码冗余 像素间冗余 心理视觉冗余
1、编码冗余(信息熵冗余)
“码本”是表示一组信息或一组事件的一系列 符号(如字母、数字等)。其中对每个信息或 事件所赋予的符号成为“码字”,每个码字含 有的基本符号的个数称为“码长”。 设l(rk)为码字rk的码长,在二进制表示时称为 “比特数(bits)”,Pr(rk)为码字的出现概率。 若编码系统共有L种不同的码字,则系统可获得 的平均比特数为: L 1
0.16 0.08
0.21 0.03 0.19
011 100
101 110 111
3 3
3 3 3 3
1100 1101
1110 111100 111101
4 4
4 6 6 3.78
1100 1101
01 111100 10
4 4
2 6 2 2.8
2、像素间冗余
像素的灰度级和颜色之间具 有相关性,随机场模型 (1)空间冗余:规则物体和规 则背景的表面物理特性具有相 关性。 (2)时间冗余:序列图像
第八章 图像压缩 Image compression
图像编码
Image Coding
压缩目的 基本原理 基本方法 图像编码标准
减少数据量:存储量、传输时间
例1:一般彩色电视信号,YIQ色空间中各分量的带宽 分别为4.2MHz、1.5MHz、0.5MHz,采样原理, 采样频率>=2倍原始信号频率,量化为8bit,1秒 钟的数据量为(4.2+1.5+0.5)*2*8=99.2MBits, 约为100Mbits/S。 HDTV数据量约为1.2GBits/S, 彩色静止图像:3*1024*1024*8=3MB,
码字以二进制形式表示,比特(bit)
D((101),(110))=2
汉明:将3个比特位的冗余加到4比特的码字上,任意 两个正确码字间的距离为3,可发现和校正错误。
2. 图像编码压缩要研究的主要内容
信源压缩方法
信源模型有关 编码模型
逼真度准则或失真度准则
平方误差准则 基于主观感受的逼真度准则
1/ 2
原图像编码每个像素平均所需bit数 / 压缩后像素平均所需bit数
主观保真度准则
尽管客观保真度准则提供了一种简单方便的信息损 失的方法,但是很多解压图像最终是供人观看的,有 时单用某一个或几个解析式来度量图像品质,甚至得 到与主观评估相反的结果,这样就造成采用这些解析 公式得到的定量的逼真度的可信度低,造成逼真度不 能从理论上完满解决的根本原因在于人眼视觉感知得 到的信息传输到神经系统的处理、判别过程不清楚, 而这又涉及到生物物理学、生物化学以及生态光学等 领域的成就,至今还不能提供这一过程的满意回答 (这也是当今计算机视觉的一个前沿课题,目前正在 研究发展中)。
2 [ g ( x , y ) f ( x , y )] x 0 y 0
N 1 N 1
(2)均方根信噪比:
( SNR) rms
(3)压缩比=
N 1 N 1 2 g ( x, y ) x 0 y 0 N 1 N 1 [ g ( x, y ) f ( x, y )]2 x 0 y 0
空间冗余
时间冗余
(3)结构冗余:纹理结构有些图像存在较强的纹理
结构,如墙纸、草席等图像,称之存在结构冗余
(4)知识冗余:人脸的固定结构。有许多图像的理
解与某些基础知识有相当大的相关性,例如人脸的图 像有固定的结构,比如说嘴的上方有鼻子,鼻子的上 方有眼睛,鼻子位于正脸图像的中线上等等,这类规 律性的结构可由先验知识和背景知识得到,称此类冗 余为知识冗余。
8.2 图像压缩模型
编码器
图像 采集
图像 显示或 存储
信源 编码
信道 编码
图 像 通信
信源 解码
信道 解码
解码器
1. 基本概念
信源
需要传输或存储的原始信息称为“信源”。包括 语音、图像、视频等信息源。 “信源编码”的主要任务是利用一定的编码方法 降低数码率,即比特率。 信息传输的通路; 信息在传输中要增加可靠性、抗干扰能力,就要 进行“信道编码”,此时要进行奇偶校验等检测, 需要增加比特数。抗干扰能力越强,增加的比特 数就越多。
的大体上的优劣,而对“内行”人即具有图像处理经验的人来 说,更多的是注意图像中细节的退化程度,所以这种主观评估 法应使“外行”和“内行”分开进行。
主观保真度准则标准
评分 评价 说明
1
2 3 4 5 6
极好
好 可用
图像质量非常好,和希望的一样好
图像质量高,观看舒服,有干扰但不 影响观看
图像质量可接受,有干扰但不太影响 观看 勉强可 图像质量差,干扰有些影响观看,希 以 望改进 差 图像质量很差,干扰严重妨碍观看 不能用 图像质量极差,不能使用
rk r0=0 r1=1/7 r2=2/7 pr(rk) 0.02 0.25 0.06 编码1 000 001 010 L1(rk) 3 3 3 编码2 00 01 10 L2 (rk) 2 2 2 编码3 111101 00 1110 L3 (rk) 6 2 4
r3=3/7 r4=4/7
r5=5/7 r6=6/7 r7=1 平均码长
要充分利用人的视觉生理、心理特征和图 像信源的各种特征,实现从“波形”编码 到“模型”编码的转变,以便获得更高压 缩比。 向量量化编码、基于分形的编码、基于模 型的编码、基于区域分割的编码、基于神 经网络的编码以及识别编码和基于知识的 编码等。
(3)过渡编码技术
充分利用人类视觉特性的“多分辨率编码” 方法,如子带编码、金字塔形编码和基于 小波变换的编码。 这类方法原理上仍属于线性处理,属于 “波形”编码,可归入经典编码方法,但 它们又紧密结合人类视觉系统的特性,因 此可以被看作是“第一代”编码技术向 “第二代”编码技术过渡的桥梁。