毕业设计(论文)-基于颜色特征的图像检索方法研究与实现

毕业设计(论文)-基于颜色特征的图像检索方法研究与实现
毕业设计(论文)-基于颜色特征的图像检索方法研究与实现

本科毕业论文

(科研训练、毕业设计)

题目:基于颜色特征的图像检索

方法研究与实现

姓名:

学院:信息科学与技术

系:计算机

专业:计算机

年级:2004

学号:04120074

指导教师(校内):职称:教授

指导教师(校外)职称:

年月日

基于颜色特征的图像检索方法研究与实现

【摘要】本文介绍了一个基于改进的加权颜色直方图的图象检索系统。

本系统通过将基于改进的加权的局域颜色直方图的图像检索方法和全局直方图的图像检索方法相结合,提高查全率和查准率。其中,基于分块局域直方图的检索方法利用了图像中间部分的重要性,将图像平均划分成3×3个子块,取中间一块的图像,计算其与参考位图相应位置的颜色特征距离,再计算原图的颜色直方图与参考位图的颜色特征距离,分别赋予权值后得出的值就是图像之间内容的相似程度。本文引入欧氏距离的相似性度量方法实现图像检索。实验表明,该方法具有较好的查全率和查准率。

【关键字】图像检索,颜色特征,颜色直方图,相似性度量方法

CONTENT-BASED IMAGE RETRIEV AL SYSTEM

LEARN AND REALIZATION

ABSTRACT

This image retrieval system is based on a improved weighted color histogram.

With combining the improved image retrieval algorithem of based on the weighted

central-block color histogram and the image retrieval algorithem of overall histogram, the recall rate and the rate of search is improved . Using the importance of the image of the middle part, the retrieval method based on the block local histogram divide a picture into an average o f 3 × 3

sub-blocks. Choose the middle one , calculate the colour feature distance between the middle block of original image and the middle block of reference image .Then calculate the colour feature distance between the original image and reference image. Weighted with fixed value , we can get the similarity between them. We introduce the Euclidean distance measurement methods to achieve similar image retrieval.

The experiments show that the method has a better recall rate and the rate of search. Keywords: Image Retrieval, features of color,color histogram, similar methods of measurement

目录

摘要--------------------------------------------------------------I ABSTRACT----------------------------------------------------------II

第一章绪论-------------------------------------------------------1

1.1 课题研究的目的和意义---------------------------------------1 1.2 图像检索系统的关键技术----------------------------------------

1.3 国内外研究现状---------------------------------------------

1.4 本文所作的主要工作-----------------------------------------

第二章基于颜色特征的图像检索--------------------------------------

2.1 颜色模型---------------------------------------------------

2.1.1 RGB模型

2.1.2 HSV模型

2.1.3 CMY 模型

2.1.4 L*a*b模型

2.2 颜色特征的提取与表达-----------------------------------

2.2.1全局颜色直方图

2.2.2基于分块颜色直方图法

2.2.3累加直方图

2.2.4局部累加直方图

2.3 图像特征的相似性匹配---------------------------------------

2.3.1直方图相交法

2.3.2欧式距离方法

2.3.3模糊方法

第三章图像检索系统的设计-----------------------------------------

3.1 系统设计

3.1.1算法分析

3.2 系统的实现

3.3 一个图像检索实例

第一章绪论

1.1 课题研究的目的和意义

随着多媒体技术的快速发展,计算机硬件技术的不断更新,以图片、图表、动画和视频为形式的信息发布量日益庞大,随之出现了大量庞大的不同内容的图像信息库。数字图像的应用包括国防军事、工业制造、医疗卫生、新闻媒体、大众娱乐等各方面。人们在工作生活中越来越多地接触到大量的各种各样的图像信息。

首先,在科学计算、可视化、工程制图及其他众多的应用领域如数字图书馆、天气预报、知识产权保护、天气预报、医疗图像管理、犯罪预防、军事观察和地球资源观察系统、宇宙探测、交通检测等领域,每天都有数量非常巨大的图像信息在不断产生与使用。

其次,随着Internet的发展,网络的应用和发展对社会各个领域产生了巨大影响,特别是WEB的兴起,网络上传输的信息正以指数级增长。作为一种全新的媒体和公共资源,越来

越多的图像信息出现在Web站点上,但是它们都是无序、无索引的,在这样的环境下寻找感兴趣的资料是非常耗时的。因此,人们对信息检索工具和系统的依赖将会日益增加。

面对信息量如此巨大的图像信息,热门迫切需要一种有效的检索方法。传统的图像检索技术是基于文本索引的图像检索,通过用文本描述图像的语义,然后再这些图像文本标注基础上应用成熟的文本搜索算法,为用户搜索预期的图像。虽然检索比较准确而且速度很快,但是随着图像数据库规模的增大(如数十万以上),这种检索消耗的时间大大增加,而且人工标注具有主观性和不确定性。鉴于上述因素,人们提出了一种新的图像检索技术--基于图像内容的检索CBIR(contented-based image retrieval),它不需要用户的参与,而利用图像自身的特征,如颜色、纹理、形状等特征来进行检索,具有较强的客观性。基于内容的图像检索是一种实用性很强的技术,有着广阔的前景,涉及到社会和生活的方方面面。

1.2 图像检索系统的关键技术

目前,对于通用的静止图像检索,用于检索的特征主要有颜色(Color)、纹理(Texture)、形状(Shape)等,其中颜色、纹理、形状应用尤为普遍;活动视频检索脱胎于序列图像分析中的技术。本文主要研究对静止图像检索,其中数据库是专用的图像库。

对于目标图像和检索图像进行颜色空间转换、亮度图像的边缘提取和二值分割、提取目标区域的颜色特征。颜色内容包含两个一般的概念,一个对应于全局颜色分布,一个对应于局部颜色信息。按照全局颜色分布来索引图像可以通过计算每种颜色的像素的个数并构造颜色灰度直方图来实现,这对检索具有相似的总体颜色内容的图像是一个很好的途径。局部颜色信息是指局部相似的颜色区域,它考虑了颜色的分类与一些初级的几何特征。比如Smith 等提出了颜色集合(color set)方法来抽取空间局部颜色信息并提供颜色区域的有效索引。

运用颜色直方图进行检索有如下三种方式:

(1)指明颜色组成--该法需要用户对图像中的颜色非常敏感,而且使用起来也不方便,检索

的查准率和查全率并不高,因此暂时不做进一步开发。

(2)指明一幅示例图像--通过与用户确定的图像的颜色直方图的相似性匹配得到查询结果,这是该课题研究方法的根本。

(3)指明图像中一个子图--分割图像为各个小块,然后利用选择小块来确定图像中感兴趣的对象的轮廓,通过建立更复杂的颜色关系(如颜色对方法)来查询图像,该方法是进一步优化检索的一个设想。

在颜色空间选取方面,最常用的颜色空间是RGB 颜色空间。通常,人们采用欧氏距离来刻画两种颜色之间的差异,RGB 空间存在的一个严重问题是其中所计算出来的两种颜色之间的距离无法正确表征人们实际所感知到的这两种颜色之间的真实差异。

HSI 空间比较直观并且符合人的视觉特性。HSI 颜色模型有两个重要的特点作为基础。首先,I 分量与彩色信息无关,其次H 和S 分量与人感受彩色的方式紧密相连,其中H 分量尤其影响人类的视觉判断。这些特点使得HSI 模型非常适合基于人视觉系统对彩色感知特性的图像处理。

得到图像特征的统计直方图后,不同图像间的特征匹配可借助计算直方图间的距离来进行。一般意义上直方图匹配方法有直方图相交法,直方图匹配法,欧氏距离法,中心矩法,累积直方图匹配法共6种。本文重点讨论欧氏距离法,并将其作为系统编程实现的主要方法。

所以,颜色特征的图像检索关键技术路径如图一:

图1-1 颜色特征的图像检索关键技术路径

颜色颜色空

相似度量

特征表达

颜色空间

1.3 国内外研究现状

基于内容的图像检索技术开始于上世纪90年代初期,目前已有十几年历史,是当前研究的热点,许多著名杂志如IEEE Trans. On PAMI 、IEEE Trans. On Image processing 等纷纷设专刊介绍该领域研究的最新成果,著名的国际会议如:IEEE conference of CVPR 、 ACM conference on multimedia等纷纷设立专题交流最新的研究成果。各大研究机构和公司都推出了他们的系统,在商用领域,IBM 首先研制出了QBIC系统;在学术研究领域,MIT的Photobook系统,新加坡国立大学的CORE系统,美国哥伦比亚大学的VisualSEEK系统,加利福尼亚大学Santa Barbara分校的Netra、伊利诺依大学的MARS、CMU的Infomedia以及哥伦比亚大学的VideoQ等。下面主要介绍这些系统概况:

1.QBIC系统

IBM Almaden研究中心研究开发的,是基于内容检索系统的典型代表。QBIC系统允许使用例子图像、用户构建的草图和图画、选择的颜色和纹理模式、镜头和目标运动和其他图形信息等,对大型图像和视频数据库进行查询。

2.Photobook系统

MIT的媒体实验室在1994年开发研制的。图像在装入时按人脸、形状或纹理特性自动分类,图像根据类别通过显著语义特征压缩编码。

3.CORE系统

新加坡国立大学开发的一个基于内容的检索机。其显著技术特色包括: 多种特征提取方法、多种基于内容检索方法、使用自组织神经网络对复杂特征度量、建立基于内容索引的新方法以及对多媒体信息进行模糊检索的新技术。

4.VisualSEEK系统

美国哥伦比亚大学图像和高级电视实验室开发的。它实现了互联网上的"基于内容"的图

像/视频检索系统,提供了一套工具供人们在Web上搜索和检索图像和视频。

1.4 本文所作的主要工作

从图一的技术路径分析,结合设计要求,我们需要对要素工作具体化,目的是使系统试验简单高效而不失代表性。如下:

颜色空间选取——面向硬件的RGB空间和面向视觉的HSI 空间;

颜色特征的表达——全局直方图,全局累加直方图,局部累加直方图;

相似性度量——欧氏距离计算方法。

第二章基于颜色特征的图像检索

图像是通过颜色表现出来的,颜色是图像最重要的属性。所以,对于基于内容的图像检索来说图像采取哪种颜色表示方式就显得尤为重要。本章的主要任务是分析不同的颜色空间表示方式以及适合于图像检索系统的颜色空间。

2.1颜色模型

图像是通过颜色表现出来的,颜色是彩色图像的最显著的特征,与其它特征相比,颜色特征具有非常稳定,对于旋转、平移、尺度变化都不敏感,表现出很强的鲁棒性,又由于颜色特征计算简单,因此基于颜色的查询成为现有基于内容的图像检索系统中应用最基本的方法。而如何选取合适的颜色特征,以及对颜色特征如何进行有效的抽取将关系到最终的颜色特征的相似性比较和检索的效果。

颜色模型是指某个三维颜色空间中的一个可见光子集,它包含某个颜色域的所有颜色。颜色模型的用途是在某个颜色域内方便的指定颜色。由于每一个颜色域都是可见光的子集,所以任何一个颜色模型都无法包含所有的可见光。

常见的颜色模型包括RGB(红、绿、蓝);HSV(色调、饱和度、亮度);CMYK(青、洋红、黄、黑);以及CIE组织的L*a*b等。

2.1.1 RGB模型

面向硬设备的最常用颜色模型是RGB模型。在RGB模型中,所有颜色都可看作是3个基本颜色,即红(R,red),绿(G,green)和蓝(B,blue)的不同组合。将这三种颜色成分分别人为地分成0到255共256个等级,0表示没有刺激量,255表示刺激量达到最大值。R、G、B均为255时表示白光,均为0时表示黑色。这样,我们就能表示出256×256×256(约1600万)种颜色。

如图2-1所示,采用三维直角坐标系,红、绿、蓝为原色,各个原色混合在一起产生复合色。绝大部分的可见光谱可以用红、绿、蓝R(、G、B)三色光按不同比例和强度的混合来表示。在颜色重叠的位置,产生青色、洋红和黄色。因为RGB颜色合成产生白色,它们也称为加色。将所有颜色加在一起产生白色,也就是说,所有光被反射回眼睛。加色用于光照、视频和显示器。

RGB颜色模型通常采用单位立方体来表示,在正方体的主对角线上,各原色的强度相等,产生由暗到明的白色,也就是不同的灰度值。(0,0,0)为黑色,(l,1,1)为白色。正方体的其它六个角点分别为红、黄、绿、青、蓝和品红,需要注意的一点是,RGB颜色模型所覆盖的颜色域取决于显示设备荧光点的颜色特征,是与硬件相关的。在显示屏上显示颜色定义时,

往往采用这种模式。图像如用于电视、幻灯片、网络、多媒体,一般使用RGB模式。

图2-1 RGB颜色模型

虽然RGB彩色模型被广泛应用于CRT设备显示彩色图像,但它并不是一个均匀视觉的颜色空间,不符合人对颜色的感知心理,而且,RGB颜色空间上的距离并不代表人眼视觉上的颜色知觉差异。但在对彩色图像进行特征提取时,需要用数量来描述颜色的差别,因此需要用另一种符合人的视觉心理的视觉彩色模型来表示颜色。

2.1.2 HSV模型

HSv空间是一种符合人类视觉感知特征的颜色空间,特别适合于人类肉眼对颜色的识别,因此被广泛应用于计算机视觉领域[25]。它把彩色信号表示为三种属性:色调H(Hue)、饱和度S(Saturation)和亮度V(value),其中亮度又称LightneSS或Intensity,所以HSV空间还有HLS和HIS这两种叫法。

HSV模型的色调H表示从一个物体反射过来的或透过物体的光的波长,更一般地说,色调是由颜色名称来辨别的,如红、橙、黄、绿等,它用角度-180~180或O~360来度量。亮度V是颜色的明暗程度,通常用百分比度量,O%为最暗的黑色,而100%为最亮的白色。饱和度S指颜色的深浅程度,即在纯色中包含的白色光的成份。例如同样是红色,也会因颜色浓度不同而分为深红色、粉红色和浅红色。饱和度S也用百分比来度量,从浓度最小的O%到浓度完全饱和的100%。色调H和饱和度S分量合起来定义了颜色的色度(Chromatieity)特性。HSV 颜色模型用Munsell三维空间坐标系统表示,其示意图如图2-2所示。

2-2 HSV颜色模型

Munsen颜色空间具有以下己经被人的眼睛所证实的特点:

1.坐标之间的心理感知独立性(PereeptualIndependenee),即人可以独立感知各颜色分量的变化。

2.线性伸缩性(LinearSealability),人眼可感知的颜色差异与HSV颜色分量的相应值上的欧几里德距离(EuelideanDIStanee)是成比例的。因为HSV颜色空间根据色调H的值来区分不同的颜色,因此在HSV的三个分量中,H分量是尤为重要的,它可以很好地模拟人类对颜色的识别和记忆过程。

2.1.3CMY模型

以红、绿、蓝的补色青(eyan)、品红(Magenta)、黄(Yellow)为原色构成的CMY颜色模型,常用于从白光中滤去某种颜色,又被称为减性原色系统。CMY颜色模型对应的直角坐标系的子空间与RGB颜色模型所对应的子空间几乎完全相同。差别仅在于前者的原点为白,而后者的原点为黑。前者是定义在白色中减去某种颜色来定义一种颜色,而后者是通过从黑色中加入颜色来定义一种颜色。CMY模型以打印在纸张上油墨的光线吸收特性为基础,当白光照射到半透明油墨上时,部分光谱被吸收,部分被反射回眼睛。理论上,青(Cyna)、品红(Magenta)、和黄(Yelolw)色素能够合成吸收所有的颜色并产生黑色。因为所有打印油墨都会包含一些杂质,这三种油墨实际上产生一种土灰色,必须与黑色(K)油墨混合才能产生真正的黑色。将这

些油墨混合产生颜色称为四色印刷。减色(CMY)和加色(RGB)是互补色,每对减色产生一种加色,反之亦然。如图2-3所示。

2-3 CMY颜色模型

2.1.4L*a*b模型

L*a*b颜色模型是在1931年国际照明委员会(CIE)制定的颜色度量国际标准的基础上建立的。1976年,这种模型被重新修订并命名为CIE L*a*b。L*a*b颜色设计为与设备无关,不管使用什么设备创建或输出图像,这种颜色模型产生的颜色都保持一致。L*a*b颜色由亮度或光亮度分量(L)和两个色度分量组成:即a分量(从绿到红)和b分量(从蓝到黄)。

2.2颜色特征的提取与表达

1991年Swain和Ballard首次提出了基于颜色直方图的特征表示,其核心思想是在一定的颜色空间中对图像中各种颜色出现的频数进行统计。具体做法是,在给定的颜色空间基础上,统计每种颜色分量的像素数占图像总像素数的比例,从而得到图像各种颜色分量的比例分布—直方图,最后把直方图作为图像的颜色特征进行图像检索。由于图像的颜色直方图具有尺度不变性和旋转不变性,因此被广泛采用。

颜色直方图是颜色信息的函数,它表示图像中具有同颜色级别的像素的个数,其横坐标是颜色级别,纵坐标是颜色出现的频率(像素的个数)。但是,直方图也存在着缺陷。首先,颜色直方图只包含了图像中某一颜色值出现的频数,而丢失了像素点所在的位置信息。而且,虽然对任意一幅图像都能唯一的给出与它对应的直方图,但不同的图像却有可能具有相同的

直方图特征,也就是直方图与图像之间并非一一对应的,而是一对多的关系。这些缺点都会影响直方图特征检索的有效性。

2.2.1 全局颜色直方图

全局直方图是一种经常被采用的颜色特征,已在很多图像检索系统中得到应用。设C(x,y)为RGB空间一幅彩色图像,其颜色直方图的定义为:

其中,M、N为图像C(x,y)垂直和水平方向上的像素数目,并简称为

图像的高和宽;而k为变换空间的颜色数。

2.2.2 基于分块颜色直方图法

采用的分块方法是把图像分成单独的N×N块,并且图像分块太大则失去分块的意义,不能充分包含颜色的分布信息,分块太小则会增加检索过程的计算量。经试验比较分析,对二维空间进行3×3划分是较有效的划分方案。

2.2.3累加直方图

当图像中的特征并不能取遍所有可取值时,统计直方图中会出现一些零值。这些零值的出现会对计算直方图的相交带来很大影响,从而使得算出的匹配值并不能正确的反映两图间的颜色差别。

累加直方图是以颜色作为横坐标,从坐标原点到该颜色的所有颜色的像素出现的频数为纵坐标绘出的图形。这样图像的累加直方图向量H可以定义为:

表示C1~Ck种颜色的像素的累加频数:

我们已经计算出图像的一般直方图,可以方便地计算图像累加直方图。这样,最后得到的累加直方图特征向量为:

2.2.4局部累加直方图

在HSI空间里,H=0基本对应红色,H=pi/3基本对应黄色,H=2pi/3基本对应绿色。这样在H轴上黄色与红色间,黄色与绿色间距相等。但从人的视觉感知来讲,黄色与红色间,黄色与绿色间本无所谓哪两个更相似。这表明色度信号的分布从视觉意义上讲,并不满足累加直方图应用的前提。所以,对色彩比较复杂的自然景物图像,一般累加直方图算法在检索中就会将不同色度的信号混淆起来。

另外,一幅图像的颜色一般非常多,尤其是真彩色图像,因此直方图矢量的维数会非常高。如果能采用局部累加后降维,则计算量要少得多。

系统设计中,我们采用Pi/3为区间的长度,将H轴共分成6个不重叠的局部区间[60k, 60(k+1)],k=0,1,…5,通过分别计算每个局部区间的累加直方图进行检索。

上述方法都保留了颜色在图像中出现的概率信息,但也丢失了很多颜色的空间信息,因此不同的图像有可能具有相同颜色特征表示。许多人提出了颜色索引的改进方法---局部颜色特征索引。从划分局部区域的角度来说可分为:基于固定块的图像分割、基于手工的区域分割、采用交互的半自动的区域分割以及一些自动的颜色分割方法。局部区域中的颜色信息可以表示为平均颜色、主颜色、颜色直方图和二进制颜色集等来表示。设计系统中暂不做讨论。

2.3图像特征的相似性匹配

在基于文本的检索方法中采用的是文本的精确匹配,而基于内容的图像检索则是通过计算查询图像和图像库中候选图像之间在视觉特征上的相似度匹配进行。因此,定义一个合适的视觉特征相似度度量方法对检索的效果有很大的影响。视觉特征大豆可以表示成向量的形式,常用的相似度方法也是向量空间模型,即将视觉特征看作是向量空间中的点,通过计算两个点直接的接近程度来衡量图像特征间的相似度。常见的方法有:直方图相交法、直方图欧氏距离、直方图余弦距离、二值集hammimg距离、直方图二次距离度量、二值集二次距离、直方图Mahalanobis距离。以下只简要介绍系统中常用的直方图的交、直方图欧氏距离两种距离度量方法。

2.3.1直方图相交法

度量直方图距离的一种经典方法就是直方图相交法。直方图的相交是指两个直方图在每个bin(维度)中共有的像素数量。具体做法是,根据颜色索引检索出查询图像的颜色直方图,将其与图像库中的每一图像的直方图取交集,根据交集的值来选出最佳匹配图像。

在直方图相交法中,令H Q(K)和H R(K)分别为查询图像Q和数据库图像R的特征统计直方图,则二者之间的匹配值为:

直方图交集方法能对两幅图像进行详细的比较,然而对于许多合成的图像,如商标等,它们有大量的一致颜色,三维直方图只有几个域的值很高,而其它许多域的颜色信息变化有限。因而,对于这样的图像进行过细的比较是不必要的。又由于在扫描图像时容易产生一些噪音,所以这种过细的比较容易产生错误的结果。

2.3.2欧氏距离方法

我们可以利用欧基里德距离公式(Euclidean Distance )来计算距离。对于两个 N 维直方图x,y ,两者的欧氏距离可以表示如下:

)()()

(...)

()

(),(2

2

222

112

y x y x y x y x y x y x d T n n --=-++-+-=

此距离公式虽然简单,但是与特定的颜色分布无关,因此我们可以引入相关权值A,这里A 是一个N N ?维矩阵,此时距离公式可以表述如下:

)()(),(2y x A y x y x d T --=

为了简化计算,将直方图x,y 规范化使其满足:

1

1,0∑∑==≤≤i

i i

i i i y x y x 且

矩阵],[ij a A =,权ij a 表示颜色i 与颜色j 之间的相似度。若取z=x-y ,则有

Az z d

z z

T

i i

i

=≤≤-=∑2

,11,0,取定了距离公式后,我们需要确定A 的取值,且要保证

此矩阵A 能够使02≥d ,我们用ij d 表示颜色i 与颜色j 在RGB 颜色空间的距离。

取)(max ),/1(max max ij ij ij ij d d d d a =-=其中,。

有∑∑∑-=-==ij

ij

ij

ij j i j i ij j i T d d z z z z d d z z Az z d max max 2/)()/1(

因为∑∑==-==i

i

ij i T i d H z Hz z d d z ][,0.)/1(,0max 2其中,则.

2.3.3模糊方法

1965年,Zadeh 提出了他著名的模糊集理论,从此创建了一个新的学科——模糊数学。 模糊集理论是对传统集合理论的一种推广,在传统集合理论中,一个元素或者属于一个集合,或者不属于一个集合;而对于模糊集来说,每一个元素都是以一定的程度属于某个集合,也可以同时以不同的程度属于几个集合。对人们现实生活中大量使用的一些含义确定但又不准确的语言表达,比如“今天天气很热”、“车速过高,需要适当踩刹车”等,用模糊数学可以很好的表达。

第三章图像检索系统的设计

3.1系统设计

3.1.1算法分析

颜色直方图存在一定的缺陷,同样的一个对象在不同的背景中得到的两幅图片,它们的颜色直方图可能有很大的差别,在计算相似度时认为不相似(特别是对象在图像中所占的比例很少时)。一般来说,处于图像中间的部分对图像起着重要的作用,而四周仅仅是图像背景。因此,本文采用的全局颜色直方图与较简易的分块关键直方图相结合的方法设计方法。将图像平均分成九块,因此取图像正中部分以获取分块关键直方图信息,并给这一部分像素分配较大的权值。如图3-1。

图3-1(a) 图3-1(b)

这种基于位置划分的改进颜色直方图建立步骤为:

(1)根据上面提出的分块方法,计算图像中心区域的关键颜色直方图H1

(2)计算整幅图像的颜色直方图H2,新的颜色直方图可以表示为:

H = 4 × H2 /9 + 6 × H1

这样取值的目的是突出了图像中间位置像素的重要性而弱化了背景区域像素,这就达到了不同位置的像素根据重要性分配不同权值的目的。

3.1.2系统结构框图

系统的整个业务流程可以用如下框图表示:用户待查图像内容

特征分析抽取按相似度排列

的检索结果集

特征信息标引

特征匹配特征信

息抽取

特征信息

标引

特征信

息索引

图像

数据

图像

索引

计算相似度

图像检索

图3-2基于彩色特征的图像检索系统业务流程

我们

(1)颜色空间内特征提取

对图像数据进行特征提取,提取用户感兴趣的、适合检索要求的特征。颜色空间实现为RGB。对于图像全局的特征表达为全局颜色直方图,对于图像局部的特征表达为局部累计直方图。

(2)图像匹配

在选取了特征之后,需要选择或寻找适当的判别准则,从而判断出待识别的图像的特征与数据库中的哪些图像的特征最接近。该系统使用的相似度量方法为欧氏距离法。

(3)结果输出

将满足一定相似性条件的一组候选结果按相似度大小排列后返回给用户。

3.2 系统性能分析

本次设计在XP系统下使用 Visual C++6.0 作为开发环境,图像库下载了J.Z.Wang的SIMPLIcity系统测试库,从该库的1000幅图片中抽取100张图片作为测试库,根据欧式距离升序排列前16个样本。该系统的实现,没有采用数据库的形式,直接以文件夹的形式调用图像库。

图3-3 检索结果

查全率和查准率是基于内容的图像检索系统性能的两个重要的指标。查全率是检索结果中相关的图像与图像库中总的相关图像的比,它反映了系统检索相关图像的能力。查准率检索结果中相关的图像与显示给用户的图像数目,它反映了系统拒绝无关图像的能力。查全率和查准率可以通过下面的式子表示:

查全率 = n/N

图像识别技术的研究现状论文

图像识别技术研究现状综述 简介: 图像识别是指图形刺激作用于感觉器官,人们辨认出它是经验过的某一图形的过程,也叫图像再认。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。图像识别技术是以图像的主要特征为基础的,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。对于熟悉的图形,由于掌握了它的主要特征,就会把它当作一个单元来识别,而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫做组块,每一个组块是同时被感知的。图像在人类的感知中扮演着非常重要的角色,人类随时随处都要接触图像。随着数字图像技术的发展和实际应用的需要,出现了另一类问题,就是不要求其结果输出是一幅完整的图像,而是将经过图像处理后的图像,再经过分割和描述提取有效的特征,进而加以判决分类,这就是近20年来发展起来的一门新兴技术科学一图像识别。它以研究某些对象或过程的分类与描述为主要内容,以研制能够自动处理某些信息的机器视觉系统,代替传统的人工完成分类和辨识的任务为目的。 图像识别的发展大致经历了三个阶段:文字识别、图像处理和识别及物体识别:文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,并从印刷文字识别到手写文字识别,应用非常广泛,并且已经研制了许多专用设备。图像处理和识别的研究,是从1965年开始的。过去人们主要是对照相技术、光学技术的研究,而现在则是利用计算技术、通过计算机来完成。计算机图像处理不但可以消除图像的失真、噪声,同时还可以进行图像的增强与复原,然后进行图像的判读、解析与识别,如航空照片的解析、遥感图像的处理与识别等,其用途之广,不胜枚举。物体识别也就是对三维世界的认识,它是和机器人研究有着密切关系的一个领域,在图像处理上没有特殊的难点,但必须知道距离信息,并且必须将环境模型化。在自动化技术已从体力劳动向部分智力劳动自动化发展的今天,尽管机器人的研究非常盛行,还只限于视觉能够观察到的场景。进入80年代,随着计算机和信息科学的发展,计算机视觉、人工智能的研究已成为新的动向 图像识别与图像处理的关系: 在研究图像时,首先要对获得的图像信息进行预处理(前处理)以滤去干扰、噪声,作几何、彩色校正等,以提供一个满足要求的图像。图像处理包括图像编码,图像增强、图像压缩、图像复原、图像分割等。对于图像处理来说,输入是图像,输出(即经过处理后的结果)也是图像。图像处理主要用来解决两个问题:一是判断图像中有无需要的信息;二是确定这些信息是什么。图像识别是指对上述处理后的图像进行分类,确定类别名称,它可以在分割的基础上选择需要提取的特征,并对某些参数进行测量,再提取这些特征,然后根据测量结果做出分类。为了更好地识别图像,还要对整个图像做结构上的分析,对图像进行描述,以便对图像的主要信息做一个好的解释,并通过许多对象相互间的结构关系对图像加深理解,以便更好帮助和识别。故图像识别是在上述分割后的每个部分中,找出它的形状及纹理特征,以便对图像进行分类,并对整个图像做结构上的分析。因而对图像识别环节来说,输入是图像(经过上述处理后的图像),输出是类别和图像的结构分析,而结构分析的结果则

基于颜色直方图的图像检索(实验分析)

基于颜色直方图的图像检索 作者:吴亚平学号:200812017081203009 1.概述 在过去的十几年间,有许多知名机构都对图像检索系统进行了深入的研究,病开发出了相应的检索系统,例如IBM Almaden研究中心研制的QBIC系统,Virage公司研发的VIRAGE系统,麻省理工大学多媒体实验室研发的Photobook系统,哥伦比亚大学研发的VisualSeek系统,斯坦福大学研发的WBIIS系统,U.C.伯克利分校研发的Blobworld系统等等。 这些检索系统的基本特征都是基于图像像素值的特征提取相应的规则图像,例如形状、颜色、纹理等,并以此为依据对图像进行比较检索,在这篇论文中,系统采用了基于颜色特征提取的检索。基于直方图在两个颜色空间对图像特征进行判定检索。这两个颜色空间是RGB和HSV。通过对两副图像对应的RGB和HSV 值计算其距离,依据距离的远近来判断相似性,这种方法简单易行,由于丢弃了图像的形状、颜色、纹理等信息,判定的计算量相对较小。当然这也导致了两副图像之间的判定没有实际的语义上的关联,也就是说,距离相近的图像并不一定有事实上的相应联系。但是,经过试验的判定,这种基于直方图的图像检索系统能够为图片检索提供相对精确的检索结果。 2.相关知识 2.1. RGB颜色空间 RGB颜色模型中每种颜色都是由红绿蓝三种颜色组成。这种颜色模型在许多CRT显示器和彩色光栅图形设备中被广泛使用。这三种颜色被认为是其他颜色的

添加剂,对于所需要的颜色通过对这三种颜色进行不同的比例进行相加即可得到。RGB模型可以用如下的颜色坐标系表示。注意从(0,0,0)到(1,1,1)的对角线,白色代表了灰阶,RGB色彩模式俯视从白色开始的。 2.2. HSV颜色空间(也称HIS颜色空间) HSV字母分别代表了色度(Hue),饱和度(Saturation),色调。上面的锥形图说明HSV的颜色模型。Value代表了颜色的强度,他是从图像信息中分离出来,可以表示相关信息的部分。色度和饱和度代表了颜色在人眼中的生理特征。色度与红色等颜色从0到1的表示不同,色度是从红色通过黄,绿,青,蓝,洋红色,再回到红色。饱和度的区分是从0 到 1,他通过值大小来影响颜色的饱和度。对于色调,也是从0到1,随着他的增大,图像的颜色就会越来越亮。

图像局部特征点检测算法综述

图像局部特征点检测算法综述 研究图像特征检测已经有一段时间了,图像特征检测的方法很多,又加上各种算法的变形,所以难以在短时间内全面的了解,只是对主流的特征检测算法的原理进行了学习。总体来说,图像特征可以包括颜色特征、纹理特等、形状特征以及局部特征点等。其中局部特点具有很好的稳定性,不容易受外界环境的干扰,本篇文章也是对这方面知识的一个总结。 本篇文章现在(2015/1/30)只是以初稿的形式,列出了主体的框架,后面还有许多地方需要增加与修改,例如2013年新出现的基于非线性尺度空间的KAZE特征提取方法以及它的改进AKATE等。在应用方面,后面会增一些具有实际代码的例子,尤其是基于特征点的搜索与运动目标跟踪方面。 1. 局部特征点 图像特征提取是图像分析与图像识别的前提,它是将高维的图像数据进行简化表达最有效的方式,从一幅图像的M×N×3的数据矩阵中,我们看不出任何信息,所以我们必须根据这些数据提取出图像中的关键信息,一些基本元件以及它们的关系。 局部特征点是图像特征的局部表达,它只能反正图像上具有的局部特殊性,所以它只适合于对图像进行匹配,检索等应用。对于图像理解则不太适合。而后者更关心一些全局特征,如颜色分布,纹理特征,主要物体的形状等。全局特征容易受到环境的干扰,光照,旋转,噪声等不利因素都会影响全局特征。相比而言,局部特征点,往往对应着图像中的一些线条交叉,明暗变化的结构中,受到的干扰也少。 而斑点与角点是两类局部特征点。斑点通常是指与周围有着颜色和灰度差别的区域,如草原上的一棵树或一栋房子。它是一个区域,所以它比角点的噪能力要强,稳定性要好。而角点则是图像中一边物体的拐角或者线条之间的交叉部分。 2. 斑点检测原理与举例 2.1 LoG与DoH 斑点检测的方法主要包括利用高斯拉普拉斯算子检测的方法(LOG),以及利用像素点Hessian矩阵(二阶微分)及其行列式值的方法(DOH)。 LoG的方法已经在斑点检测这入篇文章里作了详细的描述。因为二维高斯函数的拉普拉斯核很像一个斑点,所以可以利用卷积来求出图像中的斑点状的结构。 DoH方法就是利用图像点二阶微分Hessian矩阵:

4-基于内容的图像检索

研究生课程 数字图像处理Digital Image Processing 彭宇新 北京大学计算机科学技术研究所E_mail:pengyuxin@https://www.360docs.net/doc/b23666440.html,

基于内容的图像检索 ●为什么需要基于内容的图像检索? ●查询方式,查询demo,现有系统简介●具体内容 ?特征提取 ?相似度匹配 ?相关反馈 ?索引结构 ●MPEG-7介绍:性能评价等 ●思考的几个问题?

为什么需要基于内容的图像检索? ●当前图像内容的特征 ?海量的图像内容出现 人类已有的:历史、地理、军事、医学… 每天新增的:数码相机、互联网?图像内容的特征:没有索引、目录或摘要 ?怎样找到需要的图像?

●基于文字描述的图像检索 ?丰富的图像内容很难用文字来全面描述 ?文字的选取因人而异,带有很大的主观性 ?耗费大量的人力和时间 ●结论:对于海量的图像,基于人工标注文字的检索已不可能 ●问题:目前搜索引擎提供的基于文字的图像检索,能够解决问题吗?解决得好吗?为什么需要基于内容的图像检索?

●为什么需要基于内容的图像检索(CBIR)? ?提供图像的检索功能 ?不需要人手工标注,计算机自动分析和检索,节省人力和时间 ?使海量图像的管理和索引成为可能 ?存在的问题: 人类高级语义特征与计算机底层特征表示的矛盾 查询方式问题 为什么需要基于内容的图像检索?

基于内容的图像检索 ●为什么需要基于内容的图像检索? ●查询方式,查询demo,现有系统简介●具体内容 ?特征提取 ?相似度匹配 ?相关反馈 ?索引结构 ●MPEG-7介绍:性能评价等 ●思考的几个问题?

文献检索与应用(第3次)

第3次作业 一、填空题(本大题共10 分,共 5小题,每小题2分) 1.客户端 / 服务器模式简称为 ______ 。 2.情报的属性包括 ______ 。 https://www.360docs.net/doc/b23666440.html,KI 期刊数据库属于 ______ 次文献。 4.要查找“气门温度场”课题的相关文献,检索式是______ 。 5.著录是 ______ 。 二、名词解释题(本大题共25 分,共 5小题,每小题5分) 1.文献 2.截词检索 3.报道性文摘 4.学位论文 5.会议文献 三、简答题(本大题共30 分,共 5小题,每小题6分) 1.简述电子期刊的概念及常用的外文电子期刊系统。 2.简述印刷型文献 , 并举例说明 3.简述多元搜索引擎 4.简述人工语言和自然语言的概念 , 并对两者进行简单比较 . 5.简述专利的时效性 四、论述题(本大题共35 分,共 5小题,每小题7分) 1.论述信息、知识、情报三者之间的关系 . 2.现有毕业论文的题目定为“国内外印刷技术的发展现状及趋势分析” , 论文初步拟定包括以下 3 部分内容 : 汽车行业的发展现状 ; 汽车行业的应用现状 ; 汽车行业的发展趋势 . 请制订一个文献检索策略 . 3.现有毕业论文的题目定为“国内外焊接技术的发展现状及趋势分析” , 论文初步拟定包括以下 3 部分内容 : 汽车行业的发展现状 ; 汽车行业的应用现状 ; 汽车行业的发展趋势 . 请制订一个文献检索策略 . 4. 现有毕业论文的题目定为“国内外网络教育的发展现状及趋势分析”,请制订 一个文献检索策略。 5.现有毕业论文的题目定为“国内外材料行业的发展现状及趋势分析” , 论文初步拟定包括以下 3 部分内容 : 材料行业的发展现状 , 材料行业的应用现状 , 材料行业的发展趋势 . 请制订一个文献检索策略 . 答案: 一、填空题( 10 分,共 5题,每小题2分)

基于matlab的图像预处理技术研究文献综述

毕业设计文献综述 题目:基于matlab的图像预处理技术研究 专业:电子信息工程 1前言部分 众所周知,MATLAB在数值计算、数据处理、自动控制、图像、信号处理、神经网络、优化计算、模糊逻辑、小波分析等众多领域有着广泛的用途,特别是MATLAB的图像处理和分析工具箱支持索引图像、RGB 图像、灰度图像、二进制图像,并能操作*.bmp、*.jpg、*.tif等多种图像格式文件如。果能灵活地运用MATLAB提供的图像处理分析函数及工具箱,会大大简化具体的编程工作,充分体现在图像处理和分析中的优越性。 图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。视觉是人类从大自然中获取信息的最主要的手段。拒统计,在人类获取的信息中,视觉信息约占60%,听觉信息约占20%,其他方式加起来才约占20%。由此可见,视觉信息对人类非常重要。同时,图像又是人类获取视觉信息的主要途径,是人类能体验的最重要、最丰富、信息量最大的信息源。通常,客观事物在空间上都是三维的(3D)的,但是从客观景物获得的图像却是属于二维(2D)平面的。 图像存在方式多种多样,可以是可视的或者非可视的,抽象的或者实际的,适于计算机处理的和不适于计算机处理的。 图像处理它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在 1964 年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动

主要电力设备故障图像特征及识别方法研究改

摘要 摘要内容 伴随着我国电网规模的日益加大,各类变电设备的运作状态是促使其安全高效运行的最为主要的因素之一。对于各类变电设备的在线状态监测系统的推广越来越发普及。研究基于图像特征的电力设备自动故障识别具有重要意义。 本文对各类主要电力设备,研究各类变电设备故障识别分类及相应故障的图像特征,以及基于红外与紫外图像特征的故障识别方法。对于紫外放电成像技术图像的处理与特征提取,本文从紫外成像技术的基本原理出发,在讲解紫外放电图片特性的基础上,对紫外放电图像使用灰度化预处理,以及应用中值滤波等方法对图像进行降噪。并通过canny算子边缘检测计算紫外光斑面积判断是否发生放电故障。针对红外故障图像,本文在红外成像原理的基础上,对红外图像进行超像素分割及HSV空间颜色提取,对应用卷积神经网络对红外故障图像故障区域检测进行理论上的研究。 关键词:红外成像紫外成像图像处理

ABSTRACT With the increasing scale of China's power grid, the operation of various types of substation equipment is one of the most important factors to promote the safe and efficient operation. The popularization of the on-line condition monitoring system for all kinds of transformer equipment is becoming more and more popular. Research on image feature based automatic fault recognition of power equipment is of great significance. In this paper, various types of main power equipment, the study of various types of substation equipment fault identification and classification of image features, as well as infrared and ultraviolet image features based on fault identification method. For ultraviolet discharge imaging technique to image processing and feature extraction, this paper from the basic principle of UV imaging technology of on the explanation of the ultraviolet discharge picture characteristics based and discharge on the UV image using grayscale preprocessing and application of median filtering method of image in noise reduction. And through the Canny operator edge detection to determine whether the area of the UV spot to determine whether the discharge fault. Aiming at the

图像处理技术的研究现状和发展趋势

图像处理技术的研究现状和发展趋势 庄振帅 数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理都发挥了巨大的作用。数字图像处理取得的另一个巨大成就是在医学上获得的成果。1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置,也就是我们通常所说的CT(Computer Tomograph)。CT的基本方法是根据人的头部截面的投影,经计算机处理来重建截面图像,称为图像重建。1975年EMI公司又成功研制出全身用的CT 装置,获得了人体各个部位鲜明清晰的断层图像。1979年,这项无损伤诊断技术获得了诺贝尔奖,说明它对人类作出了划时代的贡献。与此同时,图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就,属于这些领域的有航空航天、生物医学过程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等,使图像处理成为一门引人注目、前景远大的新型学科。随着图像处理技术的深入发展,从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向

图象视觉特征的提取与表示

第1章图像视觉特征的提取和表示 1.1引言 图像视觉特征的提取和表示是将图像的视觉信息转化成计算机能够识别和处理的定量形式的过程,是基于视觉内容的图像分类与检索的关键技术,因此,图像视觉特征的提取和表示一直是图像内容分析领域中一个非常活跃的课题。 图像底层视觉特征一定程度上能够反映图像的内容,可以描述图像所表达的意义,因此,研究图像底层视觉特征是实现图像分类与检索的第一步。一般来说,随着具体应用的不同,选用的底层特征也应有所不同,在特定的具体应用中,不同底层视觉特征的选取及不同的描述方式,对图像分类与检索的性能有很大的影响。通常认为,一种良好的图像视觉特征的提取和表示应满足以下几个要求: (1)提取简单,时间和空间复杂度低。 (2)区分能力强,对图像视觉内容相似的图像其特征描述之间也应相近,反之,对于视觉内容不相似的图像其特征描述之间应有一定的差别。 (3)与人的视觉感知相近,对人的视觉感觉相近的图像其特征描述之间也相近,对人的视觉感知有差别的图像其特征描述之间也有一定的差别。 (4)抗干扰能力强,鲁棒性好,对图像大小,方向不敏感,具有几何平移,旋转不变性。 本章重点讨论当前比较成熟的特征提取方法,在此基础上选取合适的特征提取方法,用于图像分类与检索系统的特征提取模块。接下来,将依次介绍颜色,纹理,形状等特征的提取和表示方法,最后对各种特征的特点加以比较。 1.2颜色特征的提取和表示 颜色是图像视觉信息的一个重要特征,是图像分类与检索中最为广泛应用的特征之一。一般来说同一类别的图像之间颜色信息具有一定的相似性,不同类别的图像,其颜色信息具有一定的差异。相对几何特征而言,颜色特征稳定性好,有对大小、方向不敏感等特点。因此,颜色特征的提取受到极大重视并得到深入研究。本章首先介绍几种常用的颜色空间模型,然后介绍各种颜色特征提取和表示方法。

基于内容的图像检索系统报告

第六届浙江省大学生电子商务竞赛 作品名称:基于内容的网络商品图像检 索系统 作品类别:技术类 2011年3月13日

目录 第1章项目背景 (3) 第2章关键技术介绍 (6) 第3章系统分析与设计 (8) 3.1需求分析 (8) 3.1.1功能性需求分析 (8) 3.1.2非功能性需求分析 (8) 3.2系统设计 (10) 3.2.1 总体结构设计 (10) 3.2.2 功能模块设计 (11) 3.2.3 检索流程设计 (12) 3.2.4数据存储设计 (14) 3.2.5 算法设计 (17) 第4章系统实现 (25) 4.1 数据采集模块 (25) 4.2 数据检索模块 (28) 4.3 数据显示模块 (29) 4.4 数据推送模块 (34) 第5章盈利模式与市场营销推广策略 (36) 5.1目标市场 (36) 5.2盈利模式 (36) 5.3 系统推广策略 (37) 第6章财务分析 (41) 6.1搜索系统建设成本 (41) 6.2搜索引擎运行维护成本 (41) 6.3搜索系统宣传推广成本 (42) 第7章风险及对策 (43)

7.1市场风险及对策 (43) 7.2技术风险及对策 (43) 7.3项目风险及对策 (44) 7.4竞争风险及对策 (44) 第8章创新点 (45) 第9章总结 (46) 【参考文献】 (47)

第1章项目背景 随着计算机软硬件和互联网技术的飞速发展,多媒体数据的数量以惊人的速度增长。各行各业有越来越多的信息通过图像的形式进行表达,这些图像中包含了大量有用的信息。但是这些图像松散的分布在世界各地,缺少有效的组织,难以达到资源共享的目的。因此如何利用如此众多的图像信息并从中定位感兴趣的图像,是对图像信息的查询技术提出的重大挑战。 早在1951年,信息检索(Information Retrieval)这一术语就被Calvin M oores描述为使用户的信息需求能够变为最终的有用信息的过程。当然,他当时指的是文本格式的文件检索。但他的描述却揭示了信息检索系统的实质:帮助用户具体定位相关信息。 在1970年以后,随着数据库管理和计算机视觉两个领域的飞速发展,图像检索技术(Image Retrieval)的研究成为热点。由于图像检索在这两个领域的不同应用,所以它们采用的研究方法也各自有所侧重。数据库管理领域的研究采用基于文本的图像检索方法,而计算机视觉领域则偏重于基于视觉的图像检索。 基于文本的图像检索(text-based image retrieval),主要在数据库领域中进行研究,它的一个典型框架是,首先对图像用文本进行注解(关键字),然后用基于文本的数据库管理系统(DBMS)来进行图像关键字检索,诸如数据模型、多维度索引、查询评价等的研究进展均是沿着这一领域所作的。但是,基于文本的图像检索存在很大困难,尤其是图像的数据量非常大的时候,其一,手工对图像进行注释所需的工作量太大;其二,许多图像很难用文字的方式进行描述;其三,不同的人对同一幅图像的理解不一样,即使同一个人对同一幅图像在不同环境下理解也不完全相同,这样使得对图像的描述不唯一,造成检索结果的千差万别;其四,由于世界上存在许多语种,采用不同的语言文字对图像进行描述而建立的索引在应用中造成了一定的阻碍。因此基于文本方式的图像检索存在很大的局限性。 90年代初期,随着大规模数字图像库的出现,上述的问题变得越来越尖锐。为克服这些问题,基于内容的图像检索技术(content-based image retrieval)应运而生。区别于原有系统中对图像进行人工标注的做法,基于内容的检索技术

基于颜色特征的图像检索算法的实现

目录 摘要 (1) 关键字 (1) 1绪论 (1) 1.1 基于内容的图像检索的概念 (1) 1.2 基于内容的图像检索的发展历史 (1) 1.3 基于内容的图像检索的特点和主要应用 (1) 1.4 基于内容的图像检索的关键技术 (2) 1.5 国内外研究现状 (3) 1.5.1 国外研究现状 (3) 1.5.2 国内研究现状 (4) 2 基于颜色特征的图像检索方法 (4) 2.1 颜色度量体系 (4) 2.2 颜色空间 (5) 2.2.1 RGB颜色空间 (5) 2.2.2 HSV颜色空间 (5) 2.2.3 CMY颜色空间 (6) 3 颜色特征的表达 (7) 3.1 颜色直方图 (7) 3.2 累加直方图 (8) 4 图像特征的相似性匹配 (9) 4.1 距离度量方法 (9) 4.2直方图的交集的方法 (9) 4.3 欧式距离法 (9) 5 图像检索算法实现 (10) 5.1程序开发运行环境 (10) 5.2 程序检索逻辑 (10) 5.3 算法具体实现 (11) 5.4 实例演示 (14) 6 全文总结与展望 (15) 6.1 全文总结 (15) 6.2 展望 (15) 致谢 (15) 参考文献 (16) 英文摘要 (16)

基于颜色特征的图像检索算法的实现 摘要:文章介绍了一种基于颜色特征的图像检索技术的算法并给出了程序实现。首先介绍了基于内容的图像检索技术、发展历史及基于内容的图像检索技术的特点和主要应用,并在此基础上探讨了该领域所用到的一些关键技术。文章着重探讨了图像的颜色空间、图像特征提取及图像相似性度量等内容,并利用matlab技术实现了一个简单图像检索的程序。文章最后则对当前基于内容图像检索技术研究热点和今后的发展方向进行简单的阐述。 关键字:基于内容的图像检索;颜色特征;颜色直方图;相似度度量方法 1 绪论 1.1 基于内容的图像检索的概念 基于内容的图像检索[1](Content Based Image Retrieval, CBIR)是一项从图像数据库中找出与检索式内容相似的图像的检索技术。它利用从图像中自动抽取出来的底层特征,如颜色、纹理、轮廓和形状等特征,进行计算和比较,检索出符合用户需求的结果图像集。目前图像检索系统技术实现的基础是对底层特征信息的计算和比较,也即是“视觉相似”。 1.2 基于内容的图像检索的发展历史 图像检索技术的发展[2]可以分为两个阶段,第一阶段始于70年代,当时的图像检索是通过人工的标注来实现的,随着计算机技术和通信网技术的发展,特别是因特网的快速发展,图像数据的容量越来越大了,这种“以关键字找图”的方法越来越不适应检索技术的发展了。由于图像内容的丰富内涵以及人们对图像内容进行抽象时的主观性不同的人对同一幅图像有不同的理解,这就引入了主观多义,不利于检索。为了克服文本标注检索的弊端,90年代研究者提出了基于内容的图像检索,其方法是:根据图像的颜色特征、纹理特征、形状特征以及空间关系等作为索引,计算查询图像和目标图像之间的相似距离,然后按相似度匹配进行检索,这种技术很大程度地利用了人们的视觉客观特性,避免不同人对图像主观理解的不同而达不到理想的搜索效果。从研究方向的层面来看,基于内容的图像检索可分为三层:第一层是根据图像的底层特性来进行检索,如颜色、纹理,形状等等,涉及图像信息处理、图像分析和相似性匹配技术;第二层是基于图像对象语义,如图像中实体及实体之间的拓扑关系的检索,对象级检索技术建立在下层特征基础上,并引入了对象模型库、对象识别和人工智能等图像理解技术;第三层是基于图像的抽象属性如行为语义,情感语义和场景语义的推理学习来进行检索。需要用到知识库和更加有效的人工智能和神经网络技术。这三个层次由低到高,与人的认知接近,下一个层次通常包含了比上一个层次更高级的语义,更高层的语义往往通过较低层的语义推理获得。尽管经过了多年的研究,较为成熟的基于内容的图像检索技术目前仍处于底层水平,由于底层研究是上层研究的基础,为了给上层建立准确、有效的图像特征提取方法,底层的研究仍在不断的发展。 1.3 基于内容的图像检索的特点和主要应用 基于内容的图像检索技术有以下特点[3]: 一是它突破了传统的基于表达式检索的局限,从媒体内容中提取信息线索。

图像特征提取及识别过程

摘要 纹理特征是一种重要的视觉线索,是图像中普遍存在而又难以描述的特征。纹理分类与分割是图像处理领域一个经久不衰的热点研究领域,纹理特征提取作为纹理分类与分割的首要问题,一直是人们关注的焦点,各种纹理特征提取方法层出不穷。 本文在广泛文献调研的基础上,回顾了纹理特征提取方法的发展历程,分析了其研究现状,对纹理特征提取方法进行了较为全面的综述和分类,最后重点研究了基于灰度共生矩阵的图像纹理提取方法,研究如何有效地提取图像纹理特征来对图像进行描述,通过特征值来对图像进行识别。 灰度共生矩阵是一种简单有效的图像纹理特征描述方法,该方法的优势在于:它能利用了图像中像素相对位置的空间信息更加准确地描述图像的纹理,本文就是利用图像灰度共生矩阵的这一特性,从该矩阵中提取相应的统计参量作为纹理特征来实现对图像的识别。 关键字:灰度共生矩阵,纹理特征提取,图像识别

ABSTRACT Texture is a kind of important visual clues in images , it is widespread but cannot easy to be described . Texture classification and segmentation is a enduring popular research field in image processing area. Texture feature extraction has been the focus of attention,due to its priority to texture classification and image segmentation. all sorts of texture feature extraction methods has been emerged in endlessly. On the basis of extensive literature investigation, we review the texture feature extraction methods, analyze the development of the research status of the texture feature extraction methods and make a comprehensive review of its classification . Finally ,based on gray symbiotic matrix image problem extraction methods,we research how to effectively extract image texture feature described by the image characteristic value to image recognition. Graylevel co-occurrence matrix is a simple and effective image texture description method.This method's advantage is: it can use the image pixels relative positions of the spatial information more to accurately describe the texture image.This paper use the graylevel co-occurrence matrix of the properties to extract statistics from the matrix corresponding as texture feature parameters to realize image recognition. KEY WORDS: graylevel co-occurrence matrix, texture feature extraction, image recognition

数字图像处理技术的现状及其发展方向(笔记)

数字图像处理技术的现状及其发展方向 一、数字图像处理历史发展 数字图像处理(Digital Image Processing)将图像信号转换成数字信号并利用计算机对其进行处理。 1.起源于20世纪20年代。 2.数字图像处理作为一门学科形成于20世纪60年代初期,美国喷气推进实验室(JPL)推动了数字图像处理这门学科的诞生。 3.1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置即CT(Computer Tomograph),1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。 4.从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展,人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论。 二、数字图像处理的主要特点 1.目前数字图像处理的信息大多是二维信息,处理信息量很大,对计算机的计算速度、存储容量等要求较高。 2.数字图像处理占用的频带较宽,在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本也高,这就对频带压缩技术提出了更高的要求。 3.数字图像中各个像素是不独立的,其相关性大。因此,图像处理中信息压缩的潜力很大。 4.由于图像是三维景物的二维投影,一幅图像本身不具备复现三维景物的全部几何信息的能力,要分析和理解三维景物必须作合适的假定或附加新的测量。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。 5.一方面,数字图像处理后的图像一般是给人观察和评价的,因此受人的因素影响较大,作为图像质量的评价还有待进一步深入的研究;另一方面,计算机视觉是模仿人的视觉,人的感知机理必然影响着计算机视觉的研究,这些都是心理学和神经心理学正在着力研究的课题。 三、数字图像处理的优点 1.再现性好;图像的存储、传输或复制等一系列变换操作不会导致图像质量的退化。 2.处理精度高;可将一幅模拟图像数字化为任意大小的二维数组,现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高。 3.适用面宽;图像可以来自多种信息源,图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像组合而成,因而均可用计算机来处理。 4.灵活性高;数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。 四、数字图像处理过程及其主要进展 常见的数字图像处理有:图像的采集、数字化、编码、增强、恢复、变换、

图像特征提取matlab程序

%直接帧间差分,计算阈值并进行二值化处理(效果不好) clc; clear; Im1 = double(imread('lena.TIF')); %读取背景图片 Im2 = double(imread('lena.TIF'); %读取当前图片 [X Y Z] = size(Im2); %当前图片的各维度值 DIma = zeros(X,Y); for i = 1:X for j = 1:Y DIma(i,j) =Im1(i,j) - Im2(i,j); %计算过帧间差分值 end end figure,imshow(uint8(DIma)) %显示差分图像 title('DIma') med = median(DIma); %计算二值化阈值:差值图像中值 mad = abs(mean(DIma) - med); %中值绝对差 T = mean(med + 3*1.4826*mad) %初始阈值 Th =5*T; %调整阈值 BW = DIma <= Th; %根据阈值对图像进行二值化处理 figure,imshow(BW) %se = strel('disk',2); %膨胀处理 %BW = imopen(BW,se); %figure,imshow(BW) %title('BW') [XX YY] = find(BW==0); %寻找有效像素点的最大边框 handle = rectangle('Position',[min(YY),min(XX) ,max(YY)-min(YY),max(XX)-min(XX)]); set(handle,'EdgeColor',[0 0 0]); hei = max(XX)-min(XX); %边框高度 mark = min(YY)+1; while mark < max(YY)-1 %从边框左边开始到右边物质循环,寻找各个人体边缘 left = 0;right = 0; for j = mark:max(YY)-1 ynum = 0; for i = min(XX)+1 : max(XX)-1 if BW(i,j) == 0; ynum = ynum + 1;

数字图像处理技术的研究现状与发展方向

数字图像处理技术的研究现状与发展方向 孔大力崔洋 (山东水利职业学院,山东日照276826) 摘要:随着计算机技术的不断发展,数字图像处理技术的应用领域越来越广泛。本文主要对数字图像处理技术的方法、优点、数字图像处理的传统领域及热门领域及其未来的发展等进行相关的讨论。 关键词:数字图像处理;特征提取;分割;检索 引言 图像是指物体的描述信息,数字图像是一个物体的数字表示,图像处理则是对图像信息进行加工以满足人的视觉心理和应用需求的行为。数字图像处理是指利用计算机或其他数字设备对图像信息进行各种加工和处理,它是一门新兴的应用学科,其发展速度异常迅速,应用领域极为广泛。 数字图像处理的早期应用是对宇宙飞船发回的图像所进行的各种处理。到了70年代,图像处理技术的应用迅速从宇航领域扩展到生物医学、信息科学、资源环境科学、天文学、物理学、工业、农业、国防、教育、艺术等各个领域与行业,对经济、军事、文化及人们的日常生活产生重大的影响。 数字图像处理技术发展速度快、应用范围广的主要原因有两个。最初由于数字图像处理的数据量非常庞大,而计算机运行处理速度相对较慢,这就限制了数字图像处理的发展。现在计算机的计算能力迅速提高,运行速度大大提高,价格迅速下降,图像处理设备从中、小型计算机迅速过渡到个人计算机,为图像处理在各个领域的应用准备了条件。第二个原因是由于视觉是人类感知外部世界最重要的手段。据统计,在人类获取的信息中,视觉信息占60%,而图像正是人类获取信息的主要途径,因此,和视觉紧密相关的数字图像处理技术的潜在应用范围自然十分广阔。 1数字图像处理的目的 一般而言,对图像进行加工和分析主要有以下三方面的目的[1]: (1)提高图像的视感质量,以达到赏心悦目的目的。如去除图像中的噪声,改变图像中的亮度和颜色,增强图像中的某些成分与抑制某些成分,对图像进行几何变换等,从而改善图像的质量,以达到或真实的、或清晰的、或色彩丰富的、或意想不到的艺术效果。 (2)提取图像中所包含的某些特征或特殊信息,以便于计算机进行分析,例如,常用做模式识别和计算机视觉的预处理等。这些特征包含很多方面,如频域特性、灰度/颜色特性、边界/区域特性、纹理特性、形状/拓扑特性以及关系结构等。 (3)对图像数据进行变换、编码和压缩,以便于图像的存储和传输。 2数字图像处理的方法 数字图像处理按处理方法分,主要有以下三类,即图像到图像的处理、图像到数据的处理和数据到图像的处理[2]。 (1)图像到图像。图像到图像的处理,其输入和输出均为图像。这种处理技术主要有图像增强、图像复原和图像编码。 首先,各类图像系统中图像的传送和转换中,总要造成图像的某些降质。第一类解决方法不考虑图像降质的原因,只将图像中感兴趣的特征有选择地突出,衰减次要信息,提高图像的可读性,增强图像中某些特征,使处理后的图像更适合人眼观察和机器分析。这类方法就是图像增强。例如,对图像的灰度值进行修正,可以增强图像的对比度;对图像进行平滑,可以抑制混入图像的噪声;利用锐化技

基于颜色特征的图像检索

基于颜色特征的图像检索

摘要 随着多媒体及网络技术的发展,互联网中的图像等多媒体信息的数量在迅速增加。如何在庞大的多媒体数据资源海洋中搜索到自己所需要的图像,随之成为一个函待解决的问题。近年来基于内容的图像检索技术己经成为了研究的热点,该技术具有传统文本检索方式所无法比拟的优越性,目前已被应用于多媒体通信、生物识别、知识产权保护等方面,具有广阔的发展前景。 本课题设计了基于颜色特征的图像检索系统,该系统主要包括两个关键步骤:颜色特征的提取和相似度匹配。本文中首先采用应用广泛的HSV颜色空间来表示图像的颜色特征,对颜色分量进行非等间隔量化形成特征矢量;然后用欧式距离度量函数进行图像的相似性匹配;最后在MATLAB平台下编程实现了基于颜色特征的检索系统。根据用户输入的样本图像与图像库中的图像进行特征匹配,找出与样本图像距离比较小的若干幅图像,并按照图像之间的距离由小到大的顺序显示给用户。 关键词:图像检索;直方图;颜色特征;MATLAB I

ABSTRACT With the development of multimedia technology, In Internet the number of images and other multimedia information in the rapidly increasing. How to locate the useful image in the vast multi-media is a great technology problem. In recent years, Content-based image retrieval has become a research focus, the technology has the superiority which the traditional text retrieval methods can not match.It has been widely used in multimedia communications, biometrics, intellectual property protection and so on, and has broad prospeets for development. This topic is designed based Color Image Retrieval System, which includes two key steps: color feature extraction and similarity matching. In this article was first used widely HSV color space to represent color feature image. We carried out color components quantification of non-interval to form feature vector; Then use the Euclidean distance metric function to match the similarity function of the image. Finally, this system should be implemented under the platform of the MATLAB by programming. Under user input sample image to conduct feature matching with image which in library images. In this system, It also can identify the images that have a short distance to the sample images, And in accordance with the distance between the images displayed to the user in the order from small to big. Keywords:Image Retrieval;Histogram Algorithm;Color Features;MATLAB II

相关文档
最新文档