分形图像压缩

分形图像压缩
分形图像压缩

扭曲、

d = ln3 / ln2 = 1.58496

用类似的方法可以求得科和曲线的维数d = ln4 / ln3。需要指出,这种维数称为相似维数,它适用于有严格自相似的分形集合。

分形维数的定义还有许多种,它门之间不仅有性质上的差别,而且对同一形态算出的维数也可能不同。在许多定义中,豪斯多夫维数在理论上可能是最重要的,可惜这种维数的计算十分困难,目前还无法用来描述自然界的复杂形态。

建立了分形维数的概念,就可以理解为什么用传统的几何方法去度量不列颠海岸线或者科和曲线的长度时,得不到准确结果。对待这些曲线,要先计算其分形维数,只有在相同维数下度量才有意义。

2 分形图象压缩

2.1 收缩仿射变换(Contractive Affine Transformation)

如果1个平面图形上的各点经过线性变换

后,图形上各点的距离比原有的距离要小,那么就称这种变换是收缩仿射变换。这个变换的a,b,…,f是变换矩阵的系数。比如,一个变换为:

用它对图2.1(a)的图F各点进行变换,变换后得到W(F)(见图2.1(b))。其形状与原图形F相似,但各点的距离缩短。显然,如果对一个图形反复施加收缩仿射变换,即对W(F)再行变换得到W2(F),对W2(F)又施行变换得到W3(F)……,其迭代的结果将使原来图形收缩为一个点。

2.2 迭代函数系统(Iterated Function System)

人们把若干个收缩仿射变换的组合称为迭代函数系统(IFS),即:

当然,上面各个变换W的系数应保证W是收缩仿射变换。

分形几何学中有一个定理:每一个迭代函数系统都定义了一个唯一的分形图形,这个分形图形称为该迭代函数系统的吸收子(attractor)。这个定理称为收缩影射不动点原理。最典型的例子是一片蕨子叶却所对应的迭代函数系统:

它所定义的蕨子叶如图2.2所示。从这个例子可看出,要产生一个复杂的图形需要得数据并不多。蕨子叶对应的迭代函数系统只有24个系数。如果以8比特代表一个系数,那么192比特就可以代表一片蕨子叶。可见压缩比是很大的。分形图象压缩的提出者之一邦利斯曾经扬言,他实现过10000:1的压缩。是否夸大不得而知,但分形压缩很有潜力却是无疑的。

2.3 采用迭代函数系统的图像压缩方法

从蕨子叶的例子可看出,迭代函数系统用不多的系数就可以代表一幅图像,从而得到很大的压缩比。但在实用时,如何寻找一的图像的迭代函数系统呢?目前有两个办法;一是基于图像的自相似性,直接计算迭代函数系统各收缩仿射变换的系数、二是把图像分割成教小的部分,然后从迭代函数系统库中查找这些小部分所对应的迭代函数系统。前一种方法适合于那些自相似性很强的图形。此处以谢尔品斯基垫为例加以说明。图2.3(a)是一个谢尔品斯基垫,可以看出,整个垫子是由上、左下、右下3个较小的垫子组成。每个较小的垫子是由原来的垫子经收缩仿射变换得来的。如果能分别找出把原图形变成3个小图形的收缩放射变换,那么,整个迭代函数系统就定下来了。

设原来垫子3各顶点的坐标分别为(x1,y1),(x2,y2),(x3,y3)。变换所得小垫子的3个顶点坐标为(x'1,y'1),(x'2,y'2),(x'3,y'3)。图2.3(b)表示的是把原电子变为上面小垫子的坐标。把W1的变换式:

展开:

有图像。

对程序开发人员,迭代系统公司还有POEM Colorbox Ⅲ和POEM Videobox等软件,前者使开发人员能够在微软视窗下把FIF文件集成到普通应用软件内,后者则可对MS-DOS上运行的应用软件中的图像进行压缩或解压。

4 分形图像压缩有待研究的问题

分形图像压缩是有失真的,失真量大小与压缩比密切相关。尽管分形图像压缩有巨大的潜力,但要把这种潜力释放出来,还有许多问题有待进一步的研究,主要表现在:

* 普遍性问题。对于一定的整体与局部存在明显相似性或仿射性的分形图像类,分形图像压缩方法的压缩比极高,但难以期望在很低的失真条件下,对一切分形图像压缩都具有极高的压缩比,只能在压缩比与失真度之间加以平衡。

* 就目前分形压缩技术而言,其编码时间比较长。因此,需要开发编码时间短、效率高的分形压缩算法。

* 理论上,有关自动压缩原理与算法,失真测度或相似性准则等有待继续深入研究。

* 实用化编码方法与硬件实现。

总之,分形理论用于图像压缩之所以有效,是因为自然界中普遍存在着分形物体,它们表面上具有非常复杂的统计特性和视觉特性,但信息量却很少,可用几条简单的确定规则迭代出来。传统的建立于信息论之上的图像压缩技术几乎不能压缩这类图像。而使用分形编码,只需对少数几条变换规则进行编码,即可以获得非常高的压缩比。但另一方面,由于自然界的景物千差万别,因此分形压缩尚有许多问题有待人们深入研究。

分形图像压缩

扭曲、

d = ln3 / ln2 = 1.58496 用类似的方法可以求得科和曲线的维数d = ln4 / ln3。需要指出,这种维数称为相似维数,它适用于有严格自相似的分形集合。 分形维数的定义还有许多种,它门之间不仅有性质上的差别,而且对同一形态算出的维数也可能不同。在许多定义中,豪斯多夫维数在理论上可能是最重要的,可惜这种维数的计算十分困难,目前还无法用来描述自然界的复杂形态。 建立了分形维数的概念,就可以理解为什么用传统的几何方法去度量不列颠海岸线或者科和曲线的长度时,得不到准确结果。对待这些曲线,要先计算其分形维数,只有在相同维数下度量才有意义。 2 分形图象压缩 2.1 收缩仿射变换(Contractive Affine Transformation) 如果1个平面图形上的各点经过线性变换 后,图形上各点的距离比原有的距离要小,那么就称这种变换是收缩仿射变换。这个变换的a,b,…,f是变换矩阵的系数。比如,一个变换为: 用它对图2.1(a)的图F各点进行变换,变换后得到W(F)(见图2.1(b))。其形状与原图形F相似,但各点的距离缩短。显然,如果对一个图形反复施加收缩仿射变换,即对W(F)再行变换得到W2(F),对W2(F)又施行变换得到W3(F)……,其迭代的结果将使原来图形收缩为一个点。 2.2 迭代函数系统(Iterated Function System) 人们把若干个收缩仿射变换的组合称为迭代函数系统(IFS),即:

当然,上面各个变换W的系数应保证W是收缩仿射变换。 分形几何学中有一个定理:每一个迭代函数系统都定义了一个唯一的分形图形,这个分形图形称为该迭代函数系统的吸收子(attractor)。这个定理称为收缩影射不动点原理。最典型的例子是一片蕨子叶却所对应的迭代函数系统: 它所定义的蕨子叶如图2.2所示。从这个例子可看出,要产生一个复杂的图形需要得数据并不多。蕨子叶对应的迭代函数系统只有24个系数。如果以8比特代表一个系数,那么192比特就可以代表一片蕨子叶。可见压缩比是很大的。分形图象压缩的提出者之一邦利斯曾经扬言,他实现过10000:1的压缩。是否夸大不得而知,但分形压缩很有潜力却是无疑的。 2.3 采用迭代函数系统的图像压缩方法 从蕨子叶的例子可看出,迭代函数系统用不多的系数就可以代表一幅图像,从而得到很大的压缩比。但在实用时,如何寻找一的图像的迭代函数系统呢?目前有两个办法;一是基于图像的自相似性,直接计算迭代函数系统各收缩仿射变换的系数、二是把图像分割成教小的部分,然后从迭代函数系统库中查找这些小部分所对应的迭代函数系统。前一种方法适合于那些自相似性很强的图形。此处以谢尔品斯基垫为例加以说明。图2.3(a)是一个谢尔品斯基垫,可以看出,整个垫子是由上、左下、右下3个较小的垫子组成。每个较小的垫子是由原来的垫子经收缩仿射变换得来的。如果能分别找出把原图形变成3个小图形的收缩放射变换,那么,整个迭代函数系统就定下来了。 设原来垫子3各顶点的坐标分别为(x1,y1),(x2,y2),(x3,y3)。变换所得小垫子的3个顶点坐标为(x'1,y'1),(x'2,y'2),(x'3,y'3)。图2.3(b)表示的是把原电子变为上面小垫子的坐标。把W1的变换式: 展开:

插值法在图像处理中的运用要点

插值方法在图像处理中的应用 作者: 专业姓名学号 控制工程陈龙斌 控制工程陈少峰 控制工程殷文龙 摘要 本文介绍了插值方法在图像处理中的应用。介绍了典型的最近邻插值、双线性插值、双三次插值、双信道插值、分形插值的原理。以分形插值为重点,在图像放大领域用MATLAB进行仿真,并与其它方法的结果做了比对。指出了各种方法的利弊,期待更进一步的研究拓展新的算法以及改进现有算法。

一、引言 人类通过感觉器官从客观世界获取信息,而其中一半以上的信息都是通过视觉获得的。图像作为人类视觉信息传递的主要媒介,具有声音、语言、文字等形式无法比拟的优势,给人以具体、直观的物体形象。在数字化信息时代,图像处理已经成为重要的数据处理类型。数字图像比之传统的模拟图像处理有着不可比拟的优势。一般采用计算机处理或者硬件处理,处理的内容丰富,精度高,变通能力强,可进行非线性处理。但是处理速度就会有所不足。图像处理的主要内容有:几何处理、算术处理、图像增强、图像复原、图像重建、图像编码、图像识别、图像理解等。以上这些图像处理大体上可分为图像的像质改善、图像分析和图像重建三大部分。 日常生活中,越来越多的领域需要高分辨率图像,采用图像插值技术来提高数字图像的分辨率和清晰度,从软件方面进行改进就具有十分重要的实用价值。多媒体通信在现代网络传输中扮演重要角色,因此插值放大提高图像分辨率是一个非常重要的问题。此外,图像变换被广泛用于遥感图像的几何校正、医学成像以及电影、电视和媒体广告等影像特技处理中。在进行图像的一些几何变换时,通常都会出现输出像素坐标和输入栅格不重合的现象,也必须要用到图像插值。图像插值是图像处理中图像重采样过程中的重要组成部分,而重采样过程广泛应用于改善图像质量、进行有损压缩等,因而研究图像插值具有十分重要的理论意义和实用价值。 图像插值是一个数据再生过程。由原始图像数据再生出具有更高分辨率的图像数据。分为图像内插值和图像间插值。前者指将一幅较低分辨率的图像再生出一幅较高分辨率的图像。后者指在若干幅图像之间再生出几幅新的图像。插值过程就是确定某个函数在两个采样点之间的数值时采用的运算过程.通常是利用曲线拟合的方法进行插值算法,通过离散的输入采样点建立一个连续函数,用这个重建的函数求出任意位置处的函数值,这个过程可看作是采样的逆过程。 20世纪40年代末,香农提出了信息论,根据采样定理,若对采样值用sinc函数进行插值,则可准确地恢复原函数,于是sinc函数被接受为插值函数,也称为理想插值函数。理想插值函数有两个缺点: (1)它虽然对带限信号可以进行无错插值,但实际中带限信号只是一小部分信号。 (2)sinc函数的支撑是无限的,而没有函数既是带限的,又是紧支撑的。 为了解决这个问题,经典的办法是刚窗函数截断sinc函数,这个窗函数必须在0剑l 之间为正数,在l到2之间为负数。sinc函数对应的是无限冲激响应,不适于有限冲激相应来进行局部插值。对数字图像来说,对图像进行插值也称为图像的重采样。它分为两个步骤:将离散图像插值为连续图像以及对插值结果图像进行采样。 经典的图像插值算法是利用邻近像素点灰度值的加权平均值来计算未知像素点处的灰度值,而这种加权平均一般表现表现为信号的离散采样值与插值基函数之间的二维卷积。这种基于模型的加权平均的图像插值方法统称为线性方法。经典的插值方法有:最近邻域法,双线性插值,双三次B样条插值,双三次样条插值,sinc函数等。线性方法,它们一个共同点就是,所有这些基函数均是低通滤波器,对数据中的高频信息都具有滤除和抑制效应,因

分形插值算法和MATLAB实验

一,分形插值算法 ——分形图的递归算法1,分形的定义 分形(Fractal)一词,是法国人B.B.Mandelbrot 创造出来的,其原意包含了不规则、支离破碎等意思。Mandelbrot 基于对不规则的几何对象长期地、系统地研究,于1973 年提出了分维数和分形几何的设想。分形几何是一门以非规则几何形状为研究对象的几何学,用以描述自然界中普遍存在着的不规则对象。分形几何有其显明的特征,一是自相似性;分形作为一个数学集合, 其内部具有精细结构, 即在所有比例尺度上其组成部分应包含整体, 而且彼此是相似的。其定义有如下两种描述: 定义 1如果一个集合在欧式空间中的 Hausdorff 维数H D 恒大于其拓扑维数 r D ,则称该集合为分形集,简称分形。 定义 2组成部分以某种方式与整体相似的形体叫分形。 对于定义 1 的理解需要一定的数学基础,不仅要知道什么是Hausdorff 维数,而且要知道什么是拓扑维数,看起来很抽象,也不容易推广。定义 2 比较笼统的说明了自然界中的物质只要局部和局部或者局部和整体之间存在自相似性,那么这个物质就是分形。正是这一比较“模糊”的概念被人们普遍接受,同时也促进了分形的发展。 根据自相似性的程度,分形可分为有规分形和无规分形。有规分形是指具有严格的自相似的分形,比如,三分康托集,Koch 曲线。无规分形是指具有统计意义上的自相似性的分形,比如,曲折的海岸线,漂浮的云等。本文主要研究有规分形。

2. 分形图的递归算法 2.1 三分康托集 1883 年,德国数学家康托(G.Cantor)提出了如今广为人知的三分康托集。三分康托集是很容易构造的,然而,它却显示出许多最典型的分形特征。它是从单位区间出发,再由这个区间不断地去掉部分子区间的过程构造出来的(如图2.1)。 其详细构造过程是:第一步,把闭区间[0,1]平均分为三段,去掉中间的 1/3 部分段,则只剩下两个闭区间[0,1/3]和[2/3,1]。第二步,再将剩下的两个闭区间各自平均分为三段,同样去掉中间的区间段,这时剩下四段闭区间:[0,1/9],[2/9,1/3],[2/3,7/9]和[8/9,1]。第三步,重复删除每个小区间中间的 1/3 段。如此不断的分割下去,最后剩下的各个小区间段就构成了三分康托集。三分康托集的 Hausdorff 维数是0.6309。 图2.2 三分康托集的构造过程

数字图像压缩技术的研究现状与展望

图像压缩技术的现状和展望 一.前言介绍 随着多媒体技术和通讯技术的不断发展,多媒体娱乐、信息高速公路等不断对信息数据的存储和传输提出了更高的要求,具有庞大数据量的数字图像通信对现有的有限带宽以严峻的考验,更难以传输和存储,极大地制约了图像通信的发展,因此图像压缩技术受到了越来越多的关注。图像压缩的目的就是把原来较大的图像用尽量少的字节表示和传输,并且要求复原图像有较好的质量。利用图像压缩,可以减轻图像存储和传输的负担,使图像在网络上实现快速传输和实时处理。 本文通过介绍其发展历程及其基本原理和其现阶段的应用,对图像压缩编码技术进行了系统性概述,最后对其前景作了总体上的展望。 二.图像压缩编码技术的发展历程 图像压缩编码技术可以追溯到1948年提出的电视信号数字化,到今天已经有60多年的历史了。在此期间出现了很多种图像压缩编码方法,特别是到了80年代后期以后,由于小波变换理论,分形理论,人工神经网络理论,视觉仿真理论的建立,图像压缩技术得到了前所未有的发展,其中分形图像压缩和小波图像压缩是当前研究的热点。 三.JPEG压缩 负责开发静止图像压缩标准的“联合图片专家组”(Joint Photographic Expert Group,简称JPEG),于1989年1月形成了基于自适应DCT的JPEG技术规范的第一个草案,其后多次修改,至1991年形成ISO10918国际标准草案,并在一年后成为国际标准,简称JPEG标准。 1.JPEG 压缩原理 JPEG 算法中首先对图像进行分块处理,一般分成互不重叠的大小的块,再对每一块进行二维离散余弦变换(DCT)。变换后的系数基本不相关,且系数矩阵的能量集中在低频区,根据量化表进行量化,量化的结果保留了低频部分的系数,去掉了高频部分的系数。量化后的系数按zigzag 扫描重新组织,然后进行哈夫曼编码。 2. JPEG压缩的研究状况及其前景

分形图像编码(英文)

FRACTAL IMAGE CODING Po-kai Chen,Lizabeth Li pokai@https://www.360docs.net/doc/365901582.html,,lizli@https://www.360docs.net/doc/365901582.html, 1.INTRODUCTION Fractal coding employs an unconventional method of rep-resenting the original image with a series of transforma-tions that map image blocks to smaller,similar blocks within the image.When recursively iterated on any ini-tial image,the contractive transformations produce a se-quence of images that will converge to an approximation of the original [1,2]. The mappings considered in this paper are discrete,contractive block transformations involving either spatial contraction or the transformation of pixel values and lo-cations,explored in section 2.The bulk of the encoding time is spent ?nding block transformations that produce the lowest mean square error.To improve coding ef?-ciency and time,in section 3,we classify certain types of blocks in order to reduce the number of allowable trans-formations performed on those blocks.After encoding,the transformations with the least root mean square er-ror are transmitted using a method we describe in section 4.On the decoder end,the application of these trans-formations on an initial image will reach convergence in roughly 4iterations.Section 5contains sample im-ages and results,including rate-distortion curves com-pared with JPEG and JPEG-2000.We present our con-cluding remarks in section 6. 2.BLOCK MAPPING AND PROCESSING 2.1.Image Partitions The ?rst step in encoding the image involves partitioning the image into non-overlapping B x B pixel blocks called range blocks.For each range block,we search a pool of 2B x 2B domain blocks from the original M x M im-age for the most optimally similar domain block.These domain blocks are generated by sliding a 2B x 2B win-dow across the original image,with spacing 1<δ1in order to speed up the algorithm. Another parameter imposed by our algorithm on the search for domain blocks is the allowable search dis-tance.In order to decrease encoding time,we also limit the search distance for domain blocks so that the algo-rithm does not search through the entire image for a min-imal distortion domain block.In the event that a suitable domain block cannot be found that produces a root mean square error below an error threshold,we split the B x B range parent block into four B/2x B/2child blocks,and rerun the search,searching for domain blocks that are now B x B in size.Child blocks are especially useful in capturing more detail in complex parts of an image,while parent blocks represent an ef?cient way of encod-ing areas of uniform pixel value.Fig.1represents the partitioning and mapping explained above. Fig.1.Parent and child block partitioning and mapping. 1

数字图像压缩编码

数字图像处理 ——图像压缩编码概述 数据编码的目的各异,信息保密、信息的压缩存储与传输等。数据压缩是以较少的数据量表示信源以原始形式所代表的信息,其目的在于节省存储空间、传输时间、信号频带或发送能量等。这些概念对于静态的文字、图像,动态的音频、视频都适用。 各种数据压缩的方法不尽相同,但是系统的组成框架如图1所示 图1 图中信源编码主要解决压缩的有效性问题,而信道编码主要解决编码的可靠性问题。从原理上看,压缩主要依靠前者,而后者是可靠实现压缩过程的可靠保证。 若信源编码的熵大于信源的实际熵,则信源中的数据一定存在冗余度。冗余数据的去除并不会减少信息量。一般图像中存在着以下数据冗余因素:编码冗余;像素间的相关性形成的冗余;视觉特性和显示设备引起的冗余。 常用的图像压缩技术指标:图像熵与平均码长;图像冗余度与编码效率;压缩比;客观评价(信噪比);主观评价(参与测试组的全体组员的平均判分)。 传统数据压缩方法的分类:无损压缩包括统计编码(Huffman编码,Shannon编码,游程编码,算术编码等)和轮廓编码;有损压缩包括预测编码(脉冲编码调制PCM,Differential PCM,AdaptiveDPCM等)、变换编码(DFT,DCT,KLT,WHT,小波变换等)和混合编码。 统计编码是根据信源的概率分布特性,分配具有惟一可译性的可变长码字,降低平均码字长度,以提高信息的传输速度,节省存储空间。其基本原理是在信号概率分布情况已知的基础上,概率大的信号对应的码字短,概率小的信号对应的码字长,这样就降低了平均码字长度。 Huffman(哈夫曼)编码算法如下①将图像的灰度等级按概率大小进行升序排序。②在灰度级集合中取两个最小概率相加,合成一个概率。③新合成的概率与其他的概率成员组成新的概率集合。④在新的概率集合中,仍然按照步骤②~③的规则,直至新的概率集合中只有一个概率为1的成员。这样的归并过程可以用二叉树描述。⑤从根节点按前缀码的编码规则进行二进制编码。优点:实现Huffman编码的基础是统计源数据集中各信号的概率分布。Huffman编码在无失真的编码方法中效率优于其他编码方法,是一种最佳变长码,其平均码长接近于熵值。

图像压缩综述

图像压缩综述 摘要:随着信息时代的不断发展,数字图像处理技术得到了广泛的应用,而作为数字图像处理技术的重要组成部分——数字图像压缩,也得到了迅猛的发展。本文从数字图像压缩的概念、发展历史、图像压缩的必要性和可能性、图像压缩标准、图像压缩基本方法和图像压缩效果评价等方面进行了综述。 引言 在当前这个信息化社会中,新信息技术革命使人类被日益增多的多媒体信息所包围。多媒体信息主要是由图像、文本和声音三大元素组成。图像作为其主要元素之一,发挥着越来越重要的作用。而传输和存储图像需要占用大量的数据空间,这严重影响了传输速率和实时处理量,极大地制约了图像通信的发展。其中,数据量最大的是数字视频数据。未经处理的数字视频信息需要消耗巨大的存储资源,以主流高清视频为例,在分辨率为1280×720,帧率为30帧每秒的视频应用中,存储一分钟的视频信息,需要约18.5G(以常4:2:0视频,每像素12比特)比特存储空间,一部120分钟高清电影约需要2225G比特的存储空间。可见未经处理的视频信息量非常大,为了满足存储和传输需求,视频信息的压缩是十分必要的。在同等的通信容量下,如果图像数据可以压缩之后再传输,就可以使传输的数据量变得很小,也就能够增加通信能力。因此图像压缩编码技术受到了越来越多的关注及广泛的应用。如数码相机、USB摄像头、可视电话、视频点播、视频会议系统、数字监控系统等等,都使用到了图像或视频的压缩技术。 数字图像压缩是以尽可能少的比特数代表图像或图像中所包含的信息量的技术,图像通过压缩处理去掉其中的数据冗余、符号冗余、视觉冗余等各种冗余信息,提高传输速率,节省存储空间。 1图像压缩的发展历史 自1948年提出的电视信号数字化设想后, 即开始了图像压缩的研究,到现在已有60多年的历史。20世纪五六十年代的图像压缩编码主要集中在预测编码、哈夫曼编码等技术的研究,还不成熟。1969年在美国召开的第一届“图像编码会议”,标志着图像编码作为一门独立学科的诞生。到了七八十年代,图像压缩技术的主要成果体现在变换编码技术上, 矢量量化编码技术也有较大的发展。80年代末,小波变换理论、分形理论、人工神经网络理论、视觉仿真理论建立,人们开始突破传统的信源编码理论, 图像压缩编码向着更高的压缩率和更好的压缩质量的方向发展,进入了一个崭新的发展时期。 2图像压缩的可能性 图像之所以能够进行压缩有以下几个方面的原因: 一是原始图像数据是高度相关的,存在很大的数据冗余。如图像内相邻像素之间的空间冗余度、系列图像前后帧之间的时间冗余度、多光谱遥感图像各频谱间的频率域冗余度等,它们造成了大量的比特数浪费,消除这些冗余就可以节约码字,大大减少数据量,达到数据压 缩的目的。 二是信源符号出现的概率不同,若用相同码长表示不同出现概率的符号,就会造成符号冗余度。如果采用可变长编码技术,对出现概率高的符号用短码字,对出现概率低的符号用长码字表示,就可以消除符号冗余度,从而节约码字。 三是人眼具有视觉冗余,允许图像编码有一定的失真。人类视觉系统(HVS)是有缺陷的,人眼对于某些失真不敏感难以察觉。在许多场合中,并不要求经压缩及复原以后的图像和原始图像完全相同,可以允许有少量的失真,只要这些失真并不被人眼所察觉即可。这就为压缩比的提高提供了十分有利的条件,这种有失真的编码称为限失真编码。在多数应用中,人眼往

图像编码、处理、识别技术综述

图像编码、处理、识别技术综述 摘要:随着科技水平的发展和生活质量的提高,在生产生活中,实时处理图像技术被应用得越来越广泛,数字图像处理技术涉及信息科学、计算机科学数学、物理学及生物学,应用于生活中的各个领域。图形识别技术也越来越多地渗透到我们的日常生活中,详细叙述了图像处理、编码和识别技术,展望图像处理技术在现实生活种的重要性。 关键词:科技,图像处理,图像识别 1、图像编码技术 1.1图像编码基础 图像编码压缩是指在满足一定图像质量的条件下,用尽可能少的数据量来表示图像。编码技术比较系统的研究始于Shannon信息论,从此理论出发可以得到数据压缩的两种基本途径。一种是设法改变信源的概率分布,使其尽可能地非均匀,再用最佳编码方法使平均码长逼近信源熵。使用此途径的压缩方法其效率一般以其熵为上界,压缩比饱和于10:1,如Huffman编码、算术编码、行程编码等。另一种是联合信源的冗余度也寓于信源间的相关性之中,去除它们之间的相关性,使之成为或基本成为不相关信源,如预测编码、变换域编码、混合编码等,但也大都受信息熵的约束。总体上可以概括为熵编码,预测编码,变换编码,也称为三大经典编码方法。 随着人们对传统压缩编码方法的深入研究和应用,逐渐发现了这些传统方法的许多缺点。如高压缩比时恢复图像会出现方块效应,人眼视觉系统(HVS)的特性不易被引入到算法中等。为了克服这些缺点,1985年M.Kunl等人提出了第2代图像压缩编码的概念。经过近20年的发展,在这一框架下,人们提出了几种新的编码方法:分形编码、小波变换编码和基于模型的编码方法等。于是,对数据压缩技术的研究就突破了传统Shannon理论的框架,使得压缩效率得以极大提高。 1.2图像编码基本原理 数字图像的冗余主要表现为一下几种形式:空间冗余,时间冗余,视觉冗余,信息熵冗余,结构冗余和知识冗余。图像数据的这些冗余信息为图像压缩编码提供了依据。图像编码的目的就是充分利用图像中存在的各种冗余信息,特别时空间冗余,时间冗余以及视觉冗余,以尽量少的比特数来表示图像。利用各种冗余信息,压缩编码技术能够很好地解决在将模拟信号转换为数字信号后所产生的带宽需求增加的问题,它是使数字信号走上实用化的关键技术之

分形图像压缩的算法

大学本科学生毕业设计 —分形图像压缩的算法 二零一二年六月 中文摘要 分形图像编码方法是近十年来诞生并发展起来的一种新型图像压缩方法,它将图像编码为一组收缩映射,由这组收缩映射的不动点近似待编码对象。借助自

可变换性特征有效地消除了图像表达上的数据冗余,具有编码效率高、与分辨率无关、解码算法简单等潜在优势,已成为当今国际上图像编码领域中令人瞩目的研究方向。 本课题旨在以分块迭代函数系统为基础,研究分形图像编码的理论、方法和实现技术,探讨其工作机理,评价其能力,弥补其缺陷,设计并实现高效的图像压缩/解压算法,为多媒体智能软件系统提供有效的工具。 本文阐述了分形理论应用在图像压缩领域的基本原理和实现该算法的关键技术,介绍了具有代表性的各种图像压缩的新方法,阐明了各个方法的优劣,最后简要总结了分形图像压缩的改进方法以及未来的发展趋势 关键词:图像压缩,分形,算法

ABSTRACT Fractal image coding, which is also called attractor image coding, is a emergent method of image compression during the last decade. It codes images as contraction maps of which the fixed points approximate to the images. Redundancy in images are efficiently exploited via the self-transformability on the blockwise basis. Owing to its high compression ratio, good image quality, and resolution-independence of the decoded image, fractal image coding has been attracting much attention, and being considered to be promising in the realm of image compression This paper aims at giving a compreheresearch on the theory, methodology, and implementation techniques of fractal image coding under the iterated function systems, developing a set of efficient coding/decoding algorithms to support multimedia software applications. This paper expounds the basic principle of the application of fractal in the image compression field theory and key technology of this

图像处理指导书————数字图像压缩

实验四数字图像压缩 一.实验目的 1.理解有损压缩和无损压缩的概念; 2.理解图像压缩的主要原则和目的; 3.了解几种常用的图像压缩编码方式。 4.利用MATLAB程序进行图像压缩。 一.实验原理 1.图像压缩原理 图像压缩主要目的是为了节省存储空间,增加传输速度。图像压缩的理想标准是信息丢失最少,压缩比例最大。不损失图像质量的压缩称为无损压缩,无损压缩不可能达到很高的压缩比;损失图像质量的压缩称为有损压缩,高的压缩比是以牺牲图像质量为代价的。压缩的实现方法是对图像重新进行编码,希望用更少的数据表示图像。 信息的冗余量有许多种,如空间冗余,时间冗余,结构冗余,知识冗余,视觉冗余等,数据压缩实质上是减少这些冗余量。高效编码的主要方法是尽可能去除图像中的冗余成分,从而以最小的码元包含最大的图像信息。 编码压缩方法有许多种,从不同的角度出发有不同的分类方法,从信息论角度出发可分为两大类。 (1)冗余度压缩方法,也称无损压缩、信息保持编码或嫡编码。具体说就是解码图像和压缩编码前的图像严格相同,没有失真,从数学上讲是一种可逆运算。 (2)信息量压缩方法,也称有损压缩、失真度编码或烟压缩编码。也就是说解码图像和原始图像是有差别的,允许有一定的失真。 应用在多媒体中的图像压缩编码方法,从压缩编码算法原理上可以分为以下3类:(1)无损压缩编码种类 哈夫曼(Huffman)编码,算术编码,行程(RLE)编码,Lempel zev编码。 (2)有损压缩编码种类 预测编码,DPCM,运动补偿; 频率域方法:正交变换编码(如DCT),子带编码; 空间域方法:统计分块编码; 模型方法:分形编码,模型基编码; 基于重要性:滤波,子采样,比特分配,向量量化;

分形图像压缩的应用与方法1

分形图像压缩的应用与方法 摘要:本文首先大体上介绍了分形的概念和发展历史,然后着重开始讨论分形的图像压缩技术,给出了图像压缩的一些概念包括了优缺点,因为要查找图形内自相似部分而导致压缩时间过长, 但是解压缩过程却非常快,过长的压缩时间使得分形压缩不可能应用于实时压缩。其次从多个角度讨论了分形图像压缩的方法,比如采用迭代函数系统的图像压缩方法。 关键字:分形;图像压缩;迭代函数系统; 正文: 1.分形的概念和发展 1.1分形的概念[1] 分形理论是当今世界十分活跃的新理论。作为前沿学科的分形理论认为,大自然是分形构成的。大千世界,对称、均衡的对象和状态是少数和暂时的,而不对称、不均衡的对象和状态才是多数和长期的,分形几何是描述大自然的几何学。作为人类探索复杂事物的新的认知方法,分形对于一切涉及组织结构和形态发生的领域,均有实际应用意义,并在石油勘探、地震预测、城市建设、癌症研究、经济分析等方面取得了不少突破性的进展。分形的概念是美籍数学家曼德布罗特(B.B.Mandelbrot)率先提出的。1967年他在美国《科学》杂志上发表了题为《英国的海岸线有多长?》的著名论文。 分形,是以非整数维形式充填空间的形态特征。分形可以说是来自于一种思维上的理论存在。1973年,曼德勃罗(B.B.Mandelbrot)在法兰西学院讲课时,首次提出了分维和分形几何的设想。分形(Fractal)一词,是曼德勃罗创造出来的,其原意具有不规则、支离破碎等意义,分形几何学是一门以非规则几何形态为研究对象的几何学。由于不规则现象在自然界是普遍存在的,因此分形几何又称为描述大自然的几何学。分形几何建立以后,很快就引起了许多学科的关注,这是由于它不仅在理论上,而且在实用上都具有重要价值。 曼德勃罗曾经为分形下过两个定义: 1.满足下式条件 Dim(A)>dim(A)的集合A,称为分形集。其中,Dim(A)为集合A的Hausdoff维数(或分维数),dim(A)为其拓扑维数。一般说来,Dim(A)不是整数,而是分数。 2.部分与整体以某种形式相似的形,称为分形。 然而,经过理论和应用的检验,人们发现这两个定义很难包括分形如此丰富的内容。实际上,对于什么是分形,到目前为止还不能给出一个确切的定义,正如生物学中对“生命” 也没有严格明确的定义一样,人们通常是列出生命体的一系列特性来加以说明。对分形的定义也可同样的处理。 数学上的分形有以下几个特点: (1)具有无限精细的结构; (2)比例自相似性; (3)一般它的分数维大于它的拓扑维数; (4)可以由非常简单的方法定义,并由递归、迭代产生等。

基于像素采样的分形图像编码算法

计 算 机 系 统 应 用 https://www.360docs.net/doc/365901582.html, 2013 年 第22卷 第 12 期 136软件技术·算法 Software Technique ·Algorithm 基于像素采样的分形图像编码算法① 苏兆宝1, 周 敏1, 郑红婵1, 李晓珺2 1(西北工业大学 理学院, 西安 710129) 2 (辽宁大学 数学院, 沈阳 110036) 摘 要: 分形图像编码是一种基于自然图像局部自相似性的有效压缩算法技术. 但是, 基本的分形编码算法是耗时的, 由于在基本编码算法中值域块要在庞大的定义域块库中搜索最佳的匹配块. 为了减少编码时间, 该文提出了基于像素采样的分形编码方案. 该方案既不需要复杂的理论分析, 也不需要改变现有的分形编码、解码过程, 因此能够以直接的方式引进其他的块速的编码算法. 计算机仿真显示, 在PSNR 降低的情况下, 编码的匹配搜索时间大幅度减少, 同时解码图像的主观质量并没有很大程度上明显降低. 关键词: 分形; 分形编码; 像素采样 Fractal Image Encoding Based on Pixel Sampling SU Zhao-Bao 1, ZHOU Min 1, ZHENG Hong-Chan 1, LI Xiao-Jun 2 1(school of Science, Northwestern Polytechnical University, Xi’an 710129, China) 2 (Mathematics Institutec, Liaoning University, Shengyang 110036, China) Abstract : Fractal image coding is an novel and an developed potential image compression technique based on the local self-similarities within real world images. However, the baseline fractal image coding is time consuming due to the best matching search between range blocks and numerous domain blocks. In order to reduce encoding times, the paper proposed an improved scheme for fractal image coding based on pixel sampling. The improved scheme not only does not need any complex theoretical analysis, but also does not need to change the existing fractal decoding procedure; thus it can bring in other fast fractal image encoding algorithms in a straightforward manner. Computer simulations on a set of standard images show that match searching time can be reduced substantially and the subject image quality remain unchanged basically, while the PSNR being decreased slightly. Key words : fractal; fractal encoding; pixels sampling 信息是现代社会的主要特征, 其主要载体有声音, 文字, 图像等. 与其他的信息载体相比, 图像表示信息不仅在于其直观性强, 信息量大, 而且还具有在存储和传输过程中保真度高, 更直观, 更生动, 更易于进行数学处理等优点. 但是, 当前大量图像信息数据的存储, 处理, 传输与当前有限的存储资源记忆和数据的传输能力形成了难以调和的矛盾. 为了突破这一瓶颈, 实现具有更高压缩比, 更好压缩效果的图像压缩处理技术[1]对图像进行压缩已经成为非常重要的研究课题. 经过几十年的发展, 人们提出了诸多图像压 ① 收稿时间:2013-05-18;收到修改稿时间:2013-06-21 缩的算法. 八十年代中期, Barnsley 和他的合作者[2]提出了将分形思想应用于图像压缩并率先提出了利用迭代函数系统和拼贴定理对图像进行压缩, 开辟了一条与以往的图像压缩完全不同的思路, 为图像压缩领域注入了新的活力. 九十年代初, Jacquin [3]提出自动分形编码以来, 分形图像压缩以其新颖的压缩思想, 高压缩比, 解码速度快, 与分辨率无关等优点, 吸引了国内外众多知名学者的广泛关注, 被公认为图像压缩领域最有前途的算法之一. 短短的十几年间, 分形编码算法的研究取得了长足的发展[4].

对分形图像压缩编码方法的探讨

对分形图像压缩编码方法的探讨 王芳 赵德平 李井永 (沈阳建筑大学职业技术学院 辽宁辽阳 111000) [摘 要]分形图像压缩编码是图像压缩领域中一种全新的编码算法,具有潜在的高压缩比、高信噪比以及任意尺度上的精细放大等特性。本文论述了分形图像压缩的背景、编码方法、改进方法和发展趋势。 [关键词]分形;图像压缩;编码 Abstract:The fractal image compression coding is a bran-new coding in image compression,and the features of which are potential high compression ratio,the high singal-to-noise and the fine enlargement in any scale,etc. This article elaborates the background of fractal image compression coding, the coding,the improved method and the development trend of the code. Key words:Fractal; Image Compression; Coding 分形图像压缩编码是图像压缩领域中一种全新的编码算法。该算法采用图像内部块与块之间的自相似特性进行编码。由于其具有潜在的高压缩比、高信噪比以及任意尺度上的精细放大等特性而得到了有关科研人员的高度重视和深入研究,并且在卫星图像、档案数据、指纹、头像以及视频等方面的应用越来越多。 分形图像压缩的特点在于图像是作为一个图像算子的不动点隐含描述,与图像的伸缩和像素点的多少无关。因此,分形代码可以还原成任何分辨率的图像,在任何标尺上产生细节。这种与分辨率无关的特性至少在两个方面是有用的。首先,根据代码的自相似性而做的人工细节与对象图片的全局相对兼容,它们比仅根据像素复制或插入的图像更自然。第二,这种性质可以用做图像的增强工具,一个粗略的低分辨率的图像可以用分形编码在更大的分辨率以达到增强的效果。 一、分形图像压缩背景 分形理论经历了萌芽(1919年以前)、形成与发展(1919-1975年)以及不断完善和广泛应用(1975年以后)三个阶段。 目前,分形理论与计算机技术结合后迅速发展,已经成为一门跨学科、非线性并且相当活跃的学科。其理论研究和应用已经深入到人类活动的方方面面,并取得了令入瞩目的成果。 分形学使人们对自然界和人类社会的认识提高到一个崭新的高度。例如,曾使网络性能模型的研究人员感到震惊的是“以太网数据传输具有自相似的本性”,这是由Bellcore和Boston大学的研究人员发现的。结果证明,Internet网络上数据的传输服从分形特征,不要期望网上的数据流光滑输出,由统计多路技术或异步传递模式转换的合并也不会有光滑输出的数据流。这样流量控制就要重新考虑了,这为网络的合理设计与管理提供了理论上的依据。 另外,用分形方法在计算机上可实现模拟自然景物、动画制作、建筑物配景等,在影视制作中能生成奇峰异谷、独特场景,产生新奇美丽的景色。 1988年Barnsley采用迭代函数系统IFS和递归迭代函数系统RIFS方法,对几幅图像进行压缩编码,获得了高达10000:1的压缩比。微软电子百科全书就是完全用分形编码方法把大量多媒体数据压缩到600MB以内的。在海湾战争中,美军使用了分形技术,用于军事地图的缩放、攻击目标的匹配追踪等。 1989年Jacquin在计算机上成功地实现了自适应块状编码方法。这种方法经过不断改进,现在已经开始用于一次写入、多次读 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 种评估涉及到学校的每一个部门,也涉及到每一个人。专家组进校后,每一个部门、每一个人,因此,必须广泛深入地发动群众。迎评工作学院是基础,部门是关键,必须两轮驱动才能形成合力,创造一种全校上下集中精力抓评估,一心一意谋发展,认认真真促整改的良好局面。 (七)注重集中评估而忽视长效机制的建立。一些高校评估过后就撤销评估办,认为万事大吉,其实评估是以提高教学质量、办人民满意的教育为目的,它的价值在于促进改革、加强建设、加快发展,评估的最大受益者是广大学生。五年一轮回的评估很有必要。当然对于周期长短,要不要设“免检产品”可以探讨。但是建立教学评估的长效机制,采取对高校提高教育教学质量进行监控的长效措施,确保教学质量的稳步提高,尤为重要。现在有不少学校教学评估后纷纷建立了评估督导中心等常设机构,对教学质量常抓不懈,这就是很好的做法。 四、如何正确认识评估工作 上述现状的出现并不令人奇怪,无论是主观的还是客观的原因,归结为一点就是许多人对评估工作缺乏正确的认识。那么该如何正确认识评估工作呢? 首先,无论是高等院校的领导层,还是一般教职工,不要把评估工作当成上级主管部门分派的任务,要把评估当成关系自身生死存亡的大事。当然领导层的认识最重要,高等院校如同一个经营单位,经营的不好自然会被淘汰。 第二,要把评估当成是对本院校以前所有工作的一个总结并改进的机会,要贯彻“以评促建”的精神,要通过评估对自身的工作有较大的促进。评估其实是一个契机。如果不在评估中认识到自身的不足和问题所在的深层次原因,即使通过了评估,最终还是会被激烈的竞争淘汰。 第三,不要认为评估是可以一蹴而就的工作,要脚踏实地认认真真,有组织、有计划地去做。资料是一天天积累起来的,习惯是一天天养成的。评估评的是已经发生的历史,对大量的资料进行整理、提炼信息已属不易,要改变不良习惯更是难上加难。评估不是评估期间的事,而是从评估开始一直到永远我们该怎么做的大事。 第四,要认识到评估工作其实是对高校基础管理水平的一个检验,要认识到高校更需要管理。现在的高校不是传统意义上的象牙塔,在市场经济的冲击下,人心浮动,管理起来更不容易。所以,评估其实是要求高校的管理层如何抓好管理,评估的指标不过是管理效果的表现形式罢了。 最后,提高管理水平工作是高校持续健康发展的保障。高等院校作为培养社会所需要的、高素质人才的组织,更离不开管理。高校评估就是对高校管理水平的检验,从学校定位与发展思路的把握,到专业设置、科研成果、教学质量控制,以及管理队伍的建设、规章制度的完善,最终到培养的学生所表现的素质、能力等,无不是管理水平的具体体现。通过评估,可以使高校在自身定位与发展上能准确把握市场和社会的需求方向,避免在高校发展中的迷惘;通过专业的人力资源管理,可以充分调动广大教职员工的积极性,将个人目标同高校发展目标有机结合起来,做到吸引人、用好人、留住人,发挥每一个人的最大潜力;通过合理的组织结构设计,使日常管理规范化,避免各部门职能重叠或空缺,避免扯皮、责任不清和多头指挥等情况;建设独特的高校文化,弘扬正气,增强教职员工的凝聚力,避免高校内非正式组织的负面影响。一所高校要长期健康发展,一定要重视管理,不断提高管理水平。评估是一个非常好的契机,我们必须对自身的管理进行深刻的反思。 参考文献: [1]王奇峰.抓住评估契机提高高校管理水平[J].北京政法职业学院学报, 2006(2). [2]周济.在第二次全国普通高等学校本科教学工作会议上的讲话[A]. https://www.360docs.net/doc/365901582.html,. [3]李进才.正确理解和把握评估指标体系,切实搞好本科教学工作水平评估 [A].在2006本科教学工作水平评估研讨班上的讲话. [4]赵立涛.走出本科教学工作水平评估的误区[J].中国高等教育,2006 (11). 作者简介:吕京(1971-),男,绵阳师范学院外国语学院副院长,评建办主任,华东师范大学博士生,研究方向:英语课程与教学、比较教育学。尹国杰(1970-),男,绵阳师范学院外国语学院讲师,评建秘书,研究方向:英语 课程论。 收稿日期:2007-1-4