基于多维直方图的图像检索

合集下载

计算机视觉中的图像检索技术研究

计算机视觉中的图像检索技术研究

计算机视觉中的图像检索技术研究随着计算机视觉技术的不断发展,计算机可以进行越来越多的视觉任务。

其中,图像检索技术是其中的一项重要任务。

图像检索是指在海量图像库中根据用户需求去检索相关图片并返回给用户。

这项技术的广泛应用领域包括图像管理、广告推荐、视频安全、人脸识别等等。

本文将针对计算机视觉中的图像检索技术进行深入研究。

一、图像检索方法1. 颜色直方图法颜色直方图法是图像检索中应用最多的方法之一。

该方法通过提取不同像素点的颜色信息,将图像转换成色彩直方图进行匹配。

其适用于图片的颜色特征较为明显且颜色信息丰富的应用场景。

例如,旅游景点图片搜索。

2. SIFT特征法SIFT特征法是一种基于局部空间不变特征的图像检索方法。

该方法将图像转换成多幅小尺度和旋转方向尺度的特征点,并通过关键点的描述子进行特征匹配。

该方法可广泛应用于复杂场景下目标检测与跟踪的应用场景中,例如人脸识别等。

3. 深度学习法深度学习法是最新发展而应用范围较为广泛的检索方法之一。

该方法通过建立神经网络进行图像的特征提取,并将特征映射到低维空间中,然后通过低维空间的向量进行特征匹配。

该方法应用广泛,例如基于深度学习的目标检测与跟踪,基于深度学习的图像分类与识别等。

二、图像检索领域的发展趋势1. 结合人工智能图像检索技术的发展趋势之一是结合人工智能的发展。

人工智能技术能够模拟人类的视觉判断和决策能力,实现更加准确和高质量的图像搜索。

这将使检索结果更加贴合用户需求,为用户提供更加便利和高效的服务。

2. 基于云计算的图像检索近年来,云计算技术得到广泛应用。

云计算技术可以有效地解决海量数据的存储和处理问题。

基于云计算的图像检索将会成为图像检索领域的趋势发展方向。

云计算技术可以加快数据的处理速度和检索速度,实现更加高效的图像搜索。

3. 与其他技术的深度融合在图像检索领域,与其他技术的深度融合也是非常重要的。

例如,在图像检索技术的基础上,通过机器学习技术训练模型,可以帮助图像检索技术更加准确和高效。

基于内容图像检索中的一种动态多维索引方法

基于内容图像检索中的一种动态多维索引方法
Xu Huan 1 Lin Kunhui1 Zhou Changle2 1 ( Software Department of Xiamen University, Xiamen , Fujian 361005 ) 2 ( Information Science and Technology Department of Xiamen University, Xiamen , Fujian 361005 )
tree 。实验表明 , 随着数据量和维数的增多 , ESR- tree 的性能明显优于 SR- tree 和 X- tree 。
关键词 基于内容检索 多维索引 超球体 超矩形 文献标识码 A 中图分类号 TP391
文章编号 1002- 8331- ( 2006 ) 23- 0161- 04
A Dynamic Multi- dimension Index Method in Content- based Image Retr ieval
基于内容图像检索中的一种动态多维索引方法

1 2
焕1
林坤辉 1
周昌乐 2
( 厦门大学软件学院 , 福建厦门 361005 )
E- mail: jploxh@126.com
( 厦门大学信息科学与技术学院 , 福建厦门 361005 )


多维索引技术是基于内容检索的图像数据库的关键技术。 SR- tree 和 X- tree 是目前比较成熟有效的多维索引
针对srtree这一特点我们利用xtree中超节点减少重叠的思想设计了一种新的索引结构esrtree即extendedsrtreeesrtree是利用xtree的设计思想来扩展srtree并改进了插入和分裂算法在esrtree中通过引入超级节点使得新的索引结构充分利用了srtree和xtree两者的优点弥补了srtree的不足极大地减少了区域重叠新的分裂算法能尽可能地产生无重叠分裂有效提高了多维索引的性能

基于网络图像算法的图像检索技术研究

基于网络图像算法的图像检索技术研究

基于网络图像算法的图像检索技术研究随着社会的不断进步和科技的不断发展,图像检索技术已经成为了一个非常重要的领域。

而其中最为重要的技术之一,就是基于网络图像算法的图像检索技术。

本文将从以下几个方面,对基于网络图像算法的图像检索技术进行详细的研究。

一、基本原理基于网络图像算法的图像检索技术,是指通过计算机技术,将一张图片的特征信息通过网络传输,并在巨大的图片数据库中进行快速搜索的技术。

其中最为关键的一环,就是将图片的特征信息转化为数字化的数据,从而实现方便的网络传输和计算。

在基于网络图像算法的图像检索技术中,主要通过以下两种方法,将图片的特征信息进行数字化处理:1. 颜色直方图颜色直方图是一种常用的图像特征提取方法,它通过统计一幅图片中每种颜色出现的次数,来生成一个对应该图片的颜色直方图。

这样生成的颜色直方图,可以在网络上传输和计算时,很方便地转化为数字化的数据。

同时它对相似性的特征可以进行较好的提取,提高整个图像检索技术的准确度。

2. 小波变换小波变换是一种多尺度的分析方法,它可以用来分析一幅图像的局部细节特征。

通过进行小波分析,我们可以得到特定频率下的图像局部特征,并将其转化为数字化的数据。

这样的数据可以用来进行数字信号处理、语音信号处理、图像压缩和特征提取等方面的工作。

二、优劣分析基于网络图像算法的图像检索技术,相对于传统的图像检索技术,具有以下优点:1. 准确度较高基于网络图像算法的图像检索技术,能够对一张图片的特征信息进行非常精确的提取和分析。

如上文所述,可以通过颜色直方图和小波变换等方法,提取出图片的各项特征,并将其进行数字化处理,从而实现精准的图像搜索和检索。

2. 响应速度较快基于网络图像算法的图像检索技术,能够快速地对一张图片的各项特征进行处理和分析。

这样,即使是在海量的图片数据库中进行搜索,其响应速度也非常快,能够在短时间内给出搜索结果。

然而,基于网络图像算法的图像检索技术也存在以下问题:1. 需要大量的计算资源在进行图像的特征提取和数字化处理时,需要消耗大量的计算资源。

基于图像特征的多媒体检索与识别技术研究

基于图像特征的多媒体检索与识别技术研究

基于图像特征的多媒体检索与识别技术研究随着互联网的普及和数字化媒体的快速发展,多媒体数据的数量呈现爆炸式增长的趋势,如何快速准确地对大规模多媒体数据进行检索与识别成为一个迫切的问题。

基于图像特征的多媒体检索与识别技术应运而生,它通过分析和提取图像中的特征,通过特征匹配、聚类和分类等算法,实现对多媒体数据的有效检索和识别。

基于图像特征的多媒体检索与识别技术主要包括图像特征提取和图像特征匹配两个方面。

首先,图像特征提取是指从原始图像中提取出具有一定表示能力的特征向量,这个特征向量能够描述图像的某个属性或者特征。

常见的图像特征包括颜色、纹理、形状和局部特征等。

其中,颜色特征是最基本的特征之一,通过提取图像中的颜色直方图或颜色矩阵等统计特征,可以描述图像的整体颜色分布。

纹理特征则是通过提取图像中的纹理结构,如灰度共生矩阵、小波变换和Gabor滤波器等方法来描述图像的纹理特性。

形状特征可以通过提取图像的轮廓或者利用形状描述子来反映图像的形状信息。

局部特征则是通过提取图像中局部区域的特征,如SIFT、SURF和ORB等算法,来准确地描述图像的局部特征。

这些特征提取方法可以单独使用,也可以组合使用,根据具体的应用需求进行选择。

其次,图像特征匹配是指将查询图像中提取出的特征与数据库中的特征进行匹配,找出与之最相似的图像。

常用的图像特征匹配方法包括基于相似性度量的欧氏距离、余弦相似度和汉明距离等,以及基于特征向量的聚类和分类算法,如K均值聚类和支持向量机等。

通过这些方法,可以实现对大规模多媒体数据库的高效检索和识别。

基于图像特征的多媒体检索与识别技术在许多领域都有广泛的应用。

首先,在图像检索方面,它可以帮助用户通过输入一个查询图像,快速地找到数据库中与之相似的图像。

例如,用户可以通过拍摄一个物体的照片,然后利用基于图像特征的检索技术,找到与该物体相似的其他照片,从而获取更多相关信息。

这在旅游景点的识别、商品搜索、医学图像分析和电子图书馆等领域都有很大的应用潜力。

基于极坐标直方图的图像检索算法

基于极坐标直方图的图像检索算法
ห้องสมุดไป่ตู้
后取相邻 点的曲率 也较大的点所对 应的曲率最大点作为起始点, 如 果相邻点的曲率 也相 同则再 比较相邻 点的相邻点曲率 , 直到找 出较 大 的相邻 点为止 。
2 1 2 央 点 的 提 取 ..
由于轮廓点 p ) (坐标是由 ) ) f f 和 i 共同决定的, 因此, 只要分
别找出x )y ) ( 、(上的尖点, i f 将其合并即得到轮廓P 上的尖点。
其 中h 步长 , 为 即计 算 曲 率 所 用 到 的相 邻 像 素 点 数 。
( 1 )
曲线上 的二 阶导数近似等于该 点的 曲率 , ( 上的第 i 设 f ) 点的
曲率 为 p, 则有 :
2 、形状描述符 的构 造
P 一)2( f ) 去 一 ) ( ] f + +
首先计算 f (上各点的曲率绝对值gf' (和 f ) ) ( 具体计算如下: ) 在
数值分析 中, 对于离散函数X= f ,, ( =1 . 为等距点 , 2. . 由插值原理得 :
, 、
1 , ,


” l 【 厅一 x) x + J ( a f J2(+ ( J f J 一 i i
算法分析
篱 基于极坐标直方图的图像检索算法
任 璐
( 西学 院 安徽 六安 27 1) 皖 302
摘 要 : 出 了一种新 的基 于极 坐标 直 方 图的轮 廓 形状 描述 与 图像 检 索 算法 。 取轮 廓 中能 够反 映轮廓 形 状 特征 的 尖点和 均 匀采样 点 ; 提 提 分别 将 两类特征 点 向轮廓 质心 引向量得 到 两个特征 向量 集 ; 最后利 用 两个特 征 向量 集得 到 的 两类极 坐标 直方 图构造 目标形 状描述 符 。 实验 结果表 明 , 该 算 法 不 仅 能 够很 好 的描 述 相 关形 状 的轮 廓 特 征 , 而且 其特 征 描 述 具 有 尺度 、 旋转 、 移 不 变性 , 时提 高 了图像 检 索 的准 确 率 和 查 全率 。 平 同

基于多媒体融合的图像检索的技术

基于多媒体融合的图像检索的技术

用 户。 3 基 于语音识别的图像检 索方法与实践 . 基于 多媒体 融合 的图像检 索技术主要分为两大模块 :语音识
别模块和图像检 索模块。在文献中采用的是手动 图像标注的方式 进行语音识 别对数字图像进行检 索, 这种方法有一定的创造性 , 但 是运用起来工作 量繁重尤其是对海量的图像数据。针对此问题本 文介绍一种图像语义 自动标注 的图像检 索系统 ,如 图 2所示为本 文将介绍的基于多媒体融合的图像检索系统流程图。
es 8 ̄1 .m m9 6 பைடு நூலகம் c 5 30
技术与科教创新
基于 多媒体 融合的图像检索 的技术
陆伟 艳 ( 广西民族师范学院 广 西崇左 5 2 0 3 2 0)
摘 要: 基于 多媒体融合 的图像检 索技 术是 目前研 究的热点。该文分析 了并 总结基 于 多媒 体融合的 图像检 索的概念 ,综述基 于多媒体 融合 的图像检 索的方法和相关的技术 。最后 简单介 绍一种 新的基于语音识别的 图像检索的方法 以及 实践 。 关键词:多媒 体融合 ;图像 检 索;语言识别 ;模式识 别
【 作者简介】陆伟艳 (9o_ 18- )壮族,女,桂林电子科技大学硕士,讲师; 研究方向:信息与信号处理与移动通信系统网络
1 .引言
随着多媒体 技术和 网组的迅速发展 ,以及 3 G、4 G移动通信 系统的发展 ,移动通信从语 音业务过渡到移动 宽带业务的发展 出 现 了移动多媒体 广播业务。多媒体信息的数据从 以前的紧缺 飞速 的增 ,并随着人们 目益需求的不断增加而迅速增加 。图像信 息的 应用 日益广泛 ,人们对图像数据 的查询需要 日益增长 ,对规模越 来越 大 的图像 数据库进行 有效的管理就成 为迫切 需要解决 的问

基于Lab颜色空间及环形直方图的图像检索

基于Lab颜色空间及环形直方图的图像检索
* , , , , , , , + , , , , , , , -
1. Lab颜色空间简介 基于颜色的检索算法, 常用的颜色空间有 Munsell 颜色 空间、 CIE颜色空间、 YUV颜色空间 、 HSV 颜色空间等 。其中 CIE Lab颜色空间, 因为其具有感知上的均匀性, 与人们对颜 色的感知非常接近, 所以我们也称其为均匀颜色空间, 即视 觉上近似的两种颜色在Lab空间上位置相邻。它还具有欧式 距离不变性, 即视觉上差异较小的两种颜色在 Lab空间上的 欧式距离较小,而视觉上差异较大的两种颜色对应的欧式 在Lab颜色空间内实现基于颜色的图像 距离也较大。因此, 检索具有一定的意义。 该空间由亮度通道 L、 红绿颜色通道 a、 蓝黄颜色通道 b 组成。亮度通道L表示颜色的明暗程度, 主要受光源强弱影 响, 所以在检索中, 该分量将不计算在内。a通道表示从红色 至绿色的范围, b通道表示从蓝色至黄色的范围。 a和b的值域 127], 其中, a=127就是红色, 渐渐过渡到-128, 就 都是[-128, 变成绿色。 同样道理, b=+127是黄色, -128是蓝色。 所有的颜 色就是由这三个分量组合而成。现有的基于Lab空间的图像 检索算法[1, 3], 采用将a, b通道混合在一起的色度直方图来
本文主要探讨基于颜色特征的检索, 在以后的研究中, 可以再加入纹理, 形状等多个特征, 并且加入感兴趣区域 。 对于待检索图像,我们想要的可能只是里面的某个区域或 某个对象, 这时候可以给用户选择权, 让用户用鼠标选取一 个矩形区域作为感兴趣区域,然后以感兴趣区域作为待检 则可以不 索对象, 忽略其他区域。如果对整幅图都感兴趣, 选。结合了感兴趣区域可以使检索的结果更接近用户的预 期。在检索系统的设计上, 可以采用特征权重动态设定, 即 让用户自己设定每个特征的所占的比重 。比如用户想要的 是与待检索图片纹理接近的图片,就可以提高纹理特征的 比重, 如果想要颜色接近的, 则提高颜色特征的比重 。这样 将使检索结果更接近用户的预期, 达到更好的检索效果。

一种新型的基于能量直方图的图像检索算法研究

一种新型的基于能量直方图的图像检索算法研究

一种新型的基于能量直方图的图像检索算法研究近年来,图像检索技术在数字图像处理领域中得到广泛应用。

传统的图像检索方法主要基于图像的像素值匹配,计算机将像素点比对,实现图像间的相似性比较。

这种方法只适用于简单的图片,对于复杂的图像如自然景观等,由于像素值变化细微,其检索效果较为有限。

为此,研究人员提出了能量方向图方法,该方法通过对梯度的计算关注图像的边缘,从而改善了传统方法的不足。

但在大规模数据的情况下,计算能量方向图的时间复杂度较高,难以满足实际应用需求。

为此,本文提出一种新型的基于能量直方图的图像检索算法,旨在提高图像检索的效率和精度。

一、算法设计该算法主要包括四部分:图像预处理、能量直方图生成、相似度计算、结果排序。

具体分为以下步骤:1、图像预处理对图像进行重新采样,并将其转换为灰度图像。

为防止算法受到孔洞影响,可以使用膨胀或中值滤波等方法对图像进行平滑处理。

2、能量直方图生成将灰度图像转换为梯度图像,并将其划分为若干个子区域。

在每个子区域中,统计各个梯度方向的能量值,得到能量直方图。

因此,一个图像可以表示为多个子区域的能量直方图集合。

3、相似度计算将要检索的图像与数据库中的图像进行比较,计算它们之间的相似度。

相似度可以通过计算不同子区域的能量直方图之间的欧式距离得到。

此外,可以使用离散余弦变换(DCT)来对相似度进行优化。

4、结果排序按照相似度的大小,对比结果进行排序,从而得到与要检索的图像最相似的图像。

二、算法实现根据算法设计,我们使用MATLAB编程语言实现了该算法。

实验使用的图像数据库包括1000张图像,它们涵盖了不同的场景、主题和颜色。

在实验中我们使用了3个子区域,并对每个子区域使用了8个梯度方向。

为了评估算法的性能,我们采用了标准的ROC曲线和检索精度等实验指标。

三、实验结果与分析通过实验结果可以看出,该算法的效果较为稳定且准确。

在1000张不同的图像中,随机检索20张图像,算法的成功率达到了90%以上,且用时较短,可满足实际应用的需求。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3 多维直方图
在上一部分中介绍的关于颜色直方图的改进都是结合全 局空间信息而进行的,虽然这些改进能够得到比颜色直方图更 有效的结果,但是这些方法对两个图像之间相似的含义将牺牲 一定的灵活性, 例如 Stricker 提出的方法在当图像中的对象不能 进行明显的转换时将会被打乱, Hsu 提出的方法不能适应颜色 区域的任意旋转和平移。 本文提出的方法在保留了颜色直方图健壮性的同时增加 了额外图像数据信息,我们通过选择一组图像像素特征来构建 多维直方图,多维直方图中每个条目包含被一个由特征的值组 成的特定组合来描绘图像的像素数量。例如,结合颜色信息的 渐变程度来考虑多维直方图,一个在图像中指定的像素有一个 颜色(从0到 ncolor - 1)和一个渐变程度(从0到 ngradient - 1) ,针 对颜色和渐变程度的多维直方图将有 ncolor × ngradient 个条目, 每 个条目对应一个特定的颜色和一个特定的渐变程度,保存这个 条目中的数值是图像中像素的数量、颜色以及渐变程度。 更确切的说,给定一个有 k 个特征的组,第 m 个特征有 nm 个可能值,我们就可以构建一个多维直方图。一个多维直方 图就是一个 k 维的矢量,使得多维直方图中的每个矢量都包含 由一个 k 元特征值所描绘的图像的像素数量,这个多维直方图
有效的,但是在面对大型图像数据库的时候其局限性就越发明 显。这是因为颜色直方图只记录图像的颜色信息,不同的图像 可以具有相同的颜色信息,这有可能导致在大型数据库中进行 图像检索时返回极不满意的结果,如图 1 所示:
频文件 的方法。对于不断增长的用户群体对图像检索的需求,
[2]
手动输入图像关键字对图像进行检索的方法既不灵活也不快 速,所以必须实现完全自动化的基于图像内容的图像检索。 在本文中我们所关注的基于图像内容的方法是基于实例 的图像检索,用户向系统提出一个图像查询的请求并且得到相 似图像的结果。大部分图像检索系统的运行都分为三个阶段: � 特征提取 - 对图像数据进行特征提取,提取用户感兴趣 的、适合检索要求的特征。特征提取可以是全局性的,如 整幅图像, 也可能是针对某个目标, 如图像中的子区域等。 � 图像匹配 - 在选取了特征之后, 需要选择或寻找适当的判 别准则,从而判断出待识别的图像的特征与数据库中的哪 些图像的特征最接近。 � 结果输出 - 将满足一定相似性条件的一组候选结果按相 似度大小排列后返回给用户。 构建颜色直方图是特征提取阶段使用的最广泛方法之一,例如 IBM 公司的 QBIC 系统[4]、Virage 的 VIR 引擎[1]等。颜色直方图 之所以会最流行,是因为其计算量小并且对于图像中对象的移 动和相机的角度的容忍度高。颜色直方图在小型图像数据库是 图 1 具有相似颜色直方图的不同图像 为了满足在大型数据库中进行图像检索的需求,本文提出 了一个基于多维直方图的特征提取方法,这种方法是通过创建 一组图像像素特征来实现的,该方法是通过一个对图像像素特 征进行特定组合的方式来对图像中的像素进行计数,多维直方 图可以像颜色直方图一样采用相同的方式来进行比较。 第二部分将简单介绍最近的图像特征提取的研究成果; 第三部分将提出多维直方图; 第四部分将介绍实验配置并且展示在大型数据库中通过 多维直方图来进行图像检索的性能; 最后,将对多维直方图进行简要总结。
Key words color histogram, local pixel, image database, image retrieve, mutli-dimensional
1 简介
大部分的应用程序实现图像检索的方法都是基于图像内 容的, 场景中断检测分析方法就是属于此类检索图像文件 和视
[1]
[19] [15]
中使用该方法的结果是不
的大小是
(n:每个特征的所有值的可能组合
的数量) ,正如一个颜色直方图接近于颜色像素的密度,一个多 维直方图接近于几个像素特征的组合密度。 3.1 图像特征的选取 本文所要选取的图像特征是根据经验得来的,它们的时间 复杂度呈线性增长的,并且它们自己之间是并行的。这些图像 特征如下: � 颜色 - 本文使用标准的 RGB 颜色空间,注意任何可以用 于颜色直方图的改进(如更好的颜色空间)都可以使用在 多维颜色直方图上。 � 边缘密度 - 本文对像素 (j, k) 的边缘密度的定义是围绕像 素(j, k)的邻域内的边缘像素的比例。图像边缘的表示是通 过一个标准方法[12]来计算得来的。 � 纹理 - 本文对像素 (j, k) 的纹理的定义是在像素 (j, k) 的邻 域内强度超过一个固定值的所有像素的数量。这个定义与 在 Engelson[3] 中用于位置识别所使用的纹理特征是相似 的。 � 渐变幅值 - 渐变幅值是一个测量值, 测量的是像素强度发 生最大的变化的速率。像素(j, k)的渐变幅值是通过一个标 准方法[8]来计算得来的。 � 等级 - 本文对像素 (j, k) 的等级定义的是在像素 (j, k) 的邻
[10]
提出了一种获得颜色空间相关性的方法,他
们的方法是引入颜色相关图以及相关空间数据分析的相关图, 一对给定的颜色(i, j)和一个距离 k 的颜色相关图包含了颜色 i 中
域内小于像素 (j, k) 强度的所有像素的数量。这个特征 被 Zabih
[22]
的1440张图像、Corel 所使用的1005张图像的数据库、用数据相 机拍摄的图像。 研究人员所使用的大部分测量都是评估图像检索的性能, 例如 precision[17]和 percentile[20],但这些测试都依赖于所测试数 据库的图像数量。本文认为图像检索的性能应该独立于数据库 中图像的数量,通常情况下用户愿意通过手动来浏览一定数量 的图像检索结果,这个检索结果的数量近似于在网络上基于文 本内容的检索结果数量,它不大可能因为数据库的大小而改变, 因为它是用户的耐心是有限的,我们称这个数量值为用户度。 一个好的性能测量应该是在一个特定的范围内判断检索结果。 我们选择了52对图片,这些图片包含了对相同场景不同视 角的图片等,在每一对图片中,一个图片被作为检索的对象, 另外一个作为正确的检索结果。进行52次检索,在52个检索结 果中,正确结果所占的百分比在信息检索知识领域被称 为 Recall[17],检索结果如图 3 所示: (CH 为颜色直方图)
将图像分为5个重叠的区域并且计算每个图
像的前三个力矩,他们在 HSV 颜色空间中计算每个颜色通道的 力矩,靠近图像边界的像素则采用较小的权重。两个区域之间 的距离是三个力矩的每一个差值的加权总和;两个图像之间的 距离是当图像发生0,90,180或270度的旋转时中心区域之间的 距离总和加上该区域到其他图像中相对应区域的最小距离。因 为区域的重叠性,他们的方法对图像的小旋转和平移是不敏感 的,他们测试所使用的数据库包含了11000张图像,但是他们的 算法性能的展示仅仅使用了3次图像检索测试。 Huang et al.
基于多维直方图的图像检索
摘 要
颜色直方图之所以会被广泛用于基于图像内容的图像检索, 是因为其本身的有效性和健壮性, 但是一个颜色直方图仅仅记录了
一个图像的整体色彩组成,所以具有不同外观的图像可以拥有相同的颜色直方图,这个问题在大型图像数据库中就显得更加重要了。 本 文提出了另外一种颜色直方图, 称之为多维直方图, 多维直方图不仅具有图像本身所具有的颜色直方图信息还包含了图像像素特征数据。 对于不同的图像,我们提取出该图像的颜色直方图信息和图像像素数据来构建一个多维直方图, 并在一个拥有大量图片的数据库中进行 图像检索来测试多维直方图的性能。
Abstract Color Histograms are widely used for content-based image retrieval due to their effective and robustness. However, a color histogram only records an image's overall color composition, so images with very different appearances can have similar color histograms, and this problem is especially critical in large image databases. In this paper we propose an alternative to color histograms called a Mutli-dimensional histogram, this histogram not only includes the color histogram of the image but also contains image pixel features data. To the number of different images, we create a mutli-dimensional histogram by selecting the information of color histogram and the data of image pixel, then, we evaluate the performance of mutli-dimensional histogram by image retrievalling in a database with a large number of images.
2.1 颜色直方图 一个颜色直方图是是一个矢量,这个矢量每个条目存储的 是给定图像颜色的像素数目。 在对所有图像构建直方图之前先按照比例对所有图像的 像素进行缩放,使得所有图像具有相同的像素数目,并且图像 的颜色被映射成离散的含有 N 种颜色的颜色空间,一般情况都 是使用 RGB 颜色空间的标准。 颜色直方图的构建计算简便、结果有效,并且颜色直方图 不涉及给定颜色的像素空间信息,这就对图像的旋转和平移有 很好的兼容性,此外,相机视角选取也不会对颜色直方图有影 响,所以颜色直方图被广泛用于基于图像内容的图像检索中, 在小型图像数据库[4]中, 通过构建颜色直方图来进行图像检索的 方法被证明是有效的,但是因为颜色直方图仅仅记录图像的颜 色信息,不同外观的图像就可以具有相近的颜色直方图,所以 在存储成千上万图像的大型数据库 能让人满意的。 2.2 其他特征提取方法 有研究人员提出了对颜色直方图特征关于像素空间信息 的改进。Hsu et al.[9]尝试去获得图像中不同颜色的空间排列, 通 过使用最大化的熵将一个图像分成多个矩形区域,每个区域主 要都是一种颜色,两个图像之间的相似性等价于相同颜色区域 的重叠程度,Hsu 从一个含有260张图像的数据库中取得图像检 索结果从而表明他们的方法可以取得比通过颜色直方图更好的 效果,但是 Hsu 并没有给出系统的运行时间,似乎 Hsu 的算法 需要大量的计算,此外 Hsu 的算法会受到图像中对象方向和位 置的影响。 Stricker et al.
相关文档
最新文档