基于颜色直方图的图像检索_开题报告

南京邮电大学毕业设计(论文)开题报告

题目基于颜色直方图的图像检索系统的设计与实现

学生姓名班级学号专业

提纲(开题报告2000字以上):

1. 对指导教师下达的课题任务的学习与理解

2. 阅读文献资料进行调研的综述

3. 根据任务书的任务及文献调研结果,初步拟定的执行(实施)方案(含具体进度计划)

1.对指导教师下达的课题任务的学习与理解

从20世纪70年代开始,图像检索的技术就已经开始。传统的文本检索技术,是通过关键字式的提问查询,可以检索的关键字有图像名称、图像尺寸、压缩类型、作者、年代等图像标引。到90年代以后,多媒体信息迅速膨胀,全世界的数字图像的容量以惊人的速度增长,这些图像分布在世界各地,它们都是无序、无索引的。要检索靠传统技术全部都要人工标注,而人工标太主观,不确定,不同人,不同语种,对同一幅图像的理解不同,标注描述就会千差万别。而且随着数据库数以万计地增加,人们寻找资料变得非常耗时,造成资源无法有效利用。因此人们提出了一种新的对图像内容语义的检索技术——基于图像内容的检索CBIR (Contented-Based Image Retrieval),它不需要用户的参与,而利用图像自身的特征,如颜色、纹理、形状等特征来进行检索,具有较强的客观性。

基于内容图像的检索CBIR主要依据图像的画面内容特征和主题对象特征来进行检索。由图像分析软件对输入的图像先进行图像分析,根据图像自身所包含的颜色(灰度)、纹理、形状、空间关系等特征以及这些特征的组合,自动抽取特征,在将输入图像存入图像库的同时将其相应的特征向量也存入与图像库相连的特征库。在进行检索图像时,对每一幅给定的查询图,进行图像分析,并提取图像特征向量,利用基于这些特征定义的特征度量函数计算或评价特征之间的相似性,将该图像的特征向量和特征库中的特征向量进行匹配,根据匹配的结果搜索图像库中将最相似的一些检索结果就可以提取出所需要的检索图,返回给用户。CBIR的目的不是去理解或识别图像目标,它所关注的是能否基于内容快速发现信息,旨在对视觉信息提供强有力的描述,实现视觉信息的结构化,在用户可以接受的响应时间内从图像库中查询到符合要求的图像,最终达到用户对这些视觉信息内容自由访问的目标。

在图像的形状、颜色、纹理等特征中,颜色特征是最显著、最可靠、最稳定的视觉特征,是人识别图像的主要感知特征。相对于几何特征而言,颜色对图像中子对象的大小和方向的变化都不敏感,具有相当强的鲁棒性。同时,在许多情况下,颜色又是描述一幅图像最简便而有效的特征。人们对于一幅图像的印象,往往从图像中颜色的空间分布开始。所有这些都促使颜色成为基于内容的图像检索所采取的主要手段之一。

颜色直方图所描述的是不同色彩在整幅图像中所占的比例,而并不关心每种色彩所处的空间位置,即无法描述图像中的对象或物体。颜色直方图特别适于描述那些难以进行自动分割的图像。直方图中的数值都是统计而来,描述了该图像中关于颜色的数量特征,可以反映图像颜色的统计分布和基本色调;包含了该图像中某一颜色值出现的频数,而丢失了某象素所在的空间位置信息。颜色直方图可以是基于不同的颜色空间和坐标系。最常用的颜色空间是RGB颜色空间,原因在于大部分的数字图像都是用这种颜色空间表达的。然而,RGB空间结构并不符合人们对颜色相似性的主观判断。因此,有人提出了基于HSV空间、Luv空间和Lab空间的颜色直方图,因为它们更接近于人们对颜色的主观认识。其中HSV空间是直方图最常用的颜色空间。它的三个分量分别代表色彩(Hue)、饱和度(Saturation)和值(Value)。

本课题研究的重点是:1、数学模型。数学模型是CBIR系统的核心,它决定了CBIR所能支持的查询类型和检索性能。建立的数学模型要充分反映图像对象的内容,反映与领域无关的和能够有效存储的物理特性及逻辑特征。2、颜色直方图特征提取。特征提取是基于内容的图像检索的基础。特征提取算法应简单易用,且具有自动提取的功能,所选择的特征应尽可能表达原始图像的信息,同时可以借助一些先进的数学工具来提取图像特征。3、检索技术。在对图像的检索中,最主要的方式是相似性检索。即在图像数据库中找到与给定图像最为相似的一幅。它的一般做法是提取出图像的特征建立特征库。由于图像特征一般都是高维的矢量数据,所以这时图像检索就转化为对空间数据库中高维数的近邻检索问题。为了能够高效的进行数据特征索引,从而实现图像信息的检索,目前对索引技术的研究主要集中在降低索引维数和建立良好的索引方法上。

本课题研究实现的目标是:1. 设计颜色直方图特征提取算法;2. 设计和建立特征数据库;

3.设计与实现检索匹配算法;

4. 交互界面设计与实现,并应用编程语言(VC++)设计并实现基于颜色直方图的图像检索系统,并形成相关文档。

2.阅读文献资料进行调研的综述

1、基于内容的图像检索(CBIR)

所谓基于内容图像的检索是指由图像分析软件对输入的图像先进行图像分析,根据图像中物体或区域的颜色(color)、形状(shape)或纹理(texture)等特征以及这些特征的组合,自动抽取特征,在将输入图像存入图像库的同时将其相应的特征向量也存入与图像库相连的特征库。在进行检索图像时,对每一幅给定的查询图,进行图像分析,并提取图像特征向量。将该图像的特征向量和特征库中的特征向量进行匹配,根据匹配的结果到图像库中搜索就可以提取出所需要的检索图。

基于内容的图像检索是一个逐步求精的过程,大致可以经过以下几个步骤:

(1)特征提取。对图像数据进行自动或半自动的特征提取,提取用户感兴趣的、适合检索要求的特征。特征提取可以是全局性的,如整幅图像,也可能是针对某个目标,如图像中的子区域等。

(2)图像匹配。在选取了特征之后,需要选择或寻找适当的判别准则,从而判断出待识别的图像的特征与数据库中的哪些图像的特征最接近。常用的度量准则是距离度量法。

(3)结果输出。将满足一定相似性条件的一组候选结果按相似度大小排列后返回给用户。

(4).特征调整。对系统返回的结果可通过浏览来挑选,直至找到满意的结果,或从候选结果中选择一个示例,经过特征调整,形成一个新的查询。

2、颜色的度量体系

颜色度量体系(color system),也叫做颜色制或者叫做颜色体制,实际上就是人们组织和表示颜色的方法。组织和表示颜色的方法主要有两种:一种是颜色模型,一种是编目系统。颜色模型是用简单方法描述所有颜色的一套规则和定义。颜色空间是颜色模型最普通的例子,RGB、CIE XYZ、CIE LAB、CMYK等。

3、特征特征与颜色提取

颜色特征与图像中的物体或场景十分相关,它定义明确,抽取容易,对图像本身的尺寸、方向、视觉的依赖性较小,具有尺度不变性、旋转不变性和位置不变性等特点,对图像的描述最简便而有效,在图像的各种特征中最显著、可靠和稳定,是人识别图像的主要感知特征。

颜色的特征表达首先依赖于所选用的颜色模型,不同的颜色模型,不同的具体应用,要与

之适应的颜色模型,最好选择与人的感觉相一致的颜色空间。然后采用一定的量化方法将颜色特征表达为向量的形式,最后定义一种相似度(距离)标准用来衡量不同图像之间在颜色上的相似性,进行相似度比较。颜色特征的表达方式有多种,一般常用的表示为颜色直方图、二值颜色集、模糊颜色直方图等。特征提取是图像分析和识别的基础。特征提取的方法是决定图像检索系统效率的关键。

4、颜色直方图

颜色直方图是颜色信息的函数,其核心思想是在一定的颜色空间中对图像各种颜色出现的频数进行统计,颜色直方图描述的是不同色彩在整幅图像中所占的比例,而并不关心每种色彩所处的空间位置,即图像的对象或物体。它的优点就在于它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。

颜色直方图可以基于不同的颜色空间和坐标系,最常用的是RGB 颜色空间,因为大部分的数字图像都是用RGB 颜色空间表达的。基于RGB 颜色空间表示时,彩色图像的直方图可以用R 、G 、B 三个单色的直方图或联合分布直方图来表示。用三个单色直方图表示时,各个直方图表示的是图像在这种颜色分量的统计分布,总共有三个不同的概率分布。而彩色图像用一个RGB 颜色直方图表示时,其统计的是不同颜色出现的频数,以色彩作为横坐标,纵坐标为色彩出现的频数。

在RGB 颜色空间中,颜色直方图可以看成是一个离散函数,即

(),k n H k n

= (0,1,...,1k L =-) 其中,k 表示图像的特征取值,L 表示特征可取值的个数,凡表示图像中具体征值为k 的像素个数,n 表示图像像素的总个数。

3. 根据任务书的任务及文献调研结果,初步拟定的执行(实施)方案(含具体进度计划)

第十二周~第十四周:熟悉目标任务,完成开题报告。

第十五周~第十七周:查找资料,初步了解认知基于图像内容的检索CBIR 的基本原理、颜色直方图和相关算法的基本概念、检索匹配的基本知识学习。

第十八周~下学期第三周:理解颜色特征提取方法及相似性度量方法。

第四周~第五周:比较各种算法的优缺点并选择最佳的算法,完成翻译任务。

第六周~第九周:根据算法理论写出程序,进行仿真和分析。

第十周~第十二周:撰写论文并完成相关文档。

第十三周~第十五周:准备答辩。

4. 参考文献

【1】何清法“基于内容的图像分析与检索关键技术的研究”,中科院计算所博士论文,2001

【2】曹奎。基于颜色的图像检索技术研究。华中科技大学博士论文。2002

【3】M Flickner,Harpreet Sawhney,Wayne Niblack,Jonathan Ashley. Query by image and video content: The QBIC system. IEEE Computer,Volume: 28,Issue: 9,Sept.1995,pp23—32。

【4】庄越报. 智能多媒体信息分析与检索的研究[D].浙江大学博士论文.1998.

【5】李鹏杰,杨树元.一种基于内容的图像检索系统ImageHunter[J].微机计算机应用.2001,(5):139-141. 【6】王绍棣.基于内容特征的图像和视频检索系统[J].计算机工程与应用. 2001,(7):113-117.

【7】徐杰,施鹏飞。基于内容的图像检索技术[A]。中国图像图形学报。2003.9:978页。

【8】(美)[A.S.潘迪]AbhijitS.Pandya,(美)[R.B.梅西]RobertB.Macy著;徐勇等译.“神经网络模式识别及其实现”,北京:电子工业出版社,1999.6.

【9】庄越挺,潘云鹤.基于内容的图像检索综述,模式识别与人工智能,1999年6月第12卷第2期,pp. 170-177

【10】白雪生、徐光佑、史元春.基于内容检索的一种中间表达机制.软件学报,1999年4月第10卷第4期,pp. 400-405

指导教师批

阅意见

指导教师(签名):2013年月日

相关文档
最新文档