图像检索技术综述

合集下载

图像识别技术论文

图像识别技术论文

图像识别技术论文随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。

小编整理了图像识别技术论文,欢迎阅读!图像识别技术论文篇一图像识别技术研究综述摘要:随着图像处理技术的迅速发展,图像识别技术的应用领域越来越广泛。

图像识别是利用计算机对图像进行处理、分析和理解,由于图像在成像时受到外部环境的影响,使得图像具有特殊性,复杂性。

基于图像处理技术进一步探讨图像识别技术及其应用前景。

关键词:图像处理;图像识别;成像中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)10-2446-02图像是客观景物在人脑中形成的影像,是人类最重要的信息源,它是通过各种观测系统从客观世界中获得,具有直观性和易理解性。

随着计算机技术、多媒体技术、人工智能技术的迅速发展,图像处理技术的应用也越来越广泛,并在科学研究、教育管理、医疗卫生、军事等领域已取得的一定的成绩。

图像处理正显著地改变着人们的生活方式和生产手段,比如人们可以借助于图像处理技术欣赏月球的景色、交通管理中的车牌照识别系统、机器人领域中的计算机视觉等,在这些应用中,都离不开图像处理和识别技术。

图像处理是指用计算机对图像进行处理,着重强调图像与图像之间进行的交换,主要目标是对图像进行加工以改善图像的视觉效果并为后期的图像识别大基础[1]。

图像识别是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。

但是由于获取的图像本事具有复杂性和特殊性,使得图像处理和识别技术成为研究热点。

1 图像处理技术图像处理(image processing)利用计算机对图像进行分析,以达到所需的结果。

图像处理可分为模拟图像处理和数字图像图像处理,而图像处理一般指数字图像处理。

这种处理大多数是依赖于软件实现的。

其目的是去除干扰、噪声,将原始图像编程适于计算机进行特征提取的形式,主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。

基于多媒体融合的图像检索的技术

基于多媒体融合的图像检索的技术

用 户。 3 基 于语音识别的图像检 索方法与实践 . 基于 多媒体 融合 的图像检 索技术主要分为两大模块 :语音识
别模块和图像检 索模块。在文献中采用的是手动 图像标注的方式 进行语音识 别对数字图像进行检 索, 这种方法有一定的创造性 , 但 是运用起来工作 量繁重尤其是对海量的图像数据。针对此问题本 文介绍一种图像语义 自动标注 的图像检 索系统 ,如 图 2所示为本 文将介绍的基于多媒体融合的图像检索系统流程图。
es 8 ̄1 .m m9 6 பைடு நூலகம் c 5 30
技术与科教创新
基于 多媒体 融合的图像检索 的技术
陆伟 艳 ( 广西民族师范学院 广 西崇左 5 2 0 3 2 0)
摘 要: 基于 多媒体融合 的图像检 索技 术是 目前研 究的热点。该文分析 了并 总结基 于 多媒 体融合的 图像检 索的概念 ,综述基 于多媒体 融合 的图像检 索的方法和相关的技术 。最后 简单介 绍一种 新的基于语音识别的 图像检索的方法 以及 实践 。 关键词:多媒 体融合 ;图像 检 索;语言识别 ;模式识 别
【 作者简介】陆伟艳 (9o_ 18- )壮族,女,桂林电子科技大学硕士,讲师; 研究方向:信息与信号处理与移动通信系统网络
1 .引言
随着多媒体 技术和 网组的迅速发展 ,以及 3 G、4 G移动通信 系统的发展 ,移动通信从语 音业务过渡到移动 宽带业务的发展 出 现 了移动多媒体 广播业务。多媒体信息的数据从 以前的紧缺 飞速 的增 ,并随着人们 目益需求的不断增加而迅速增加 。图像信 息的 应用 日益广泛 ,人们对图像数据 的查询需要 日益增长 ,对规模越 来越 大 的图像 数据库进行 有效的管理就成 为迫切 需要解决 的问

自动图像标注技术综述

自动图像标注技术综述

自动图像标注技术综述摘要现代,有越来越多旳图片可以运用。

然而,一般顾客怎样找到一张需要旳图片仍然是一种非常具有挑战性旳任务。

在过去旳23年中,出现了大量关注图像检索领域旳研究者。

一般,在这个领域中旳研究者重要关注基于内容旳图像检索。

然而近来旳研究表明在基于内容旳图像检索和人类对于图像语义旳理解之间仍然存在非常大旳偏差。

因此,在这个领域旳研究逐渐转变成处理低层图像特性和高层语义特性之间旳鸿沟。

桥接语义鸿沟旳一般通过自动图像注释(AIA)措施,这种措施使用机器学习技术提取语义特性。

本文中,重要关注图像检索并且提供有关自动图像标注技术旳综述,分析了多种AIA措施旳特点,包括特性提取以及语义学习,并且详细描述了重要旳措施。

在结论中展示了多种AIA措施,并且提供了未来旳研究方向。

1 绪言得益于数字技术旳长足发展,现代社会发明并存储了大量旳视觉数据。

目前,视觉数据已经像文字数据同样常见,因此急需一种高效旳工具对数据进行检索。

在过去旳23年中,研究者对图像检索(IR)技术进行了大量旳研究。

一般来说,IR研究可以被分为三种重要措施。

第一种措施是老式旳基于文本旳标注。

在这种措施中,图像通过人类手工标注并且使用与老式文本检索相似旳方式进行检索[9,10,15,16]。

然而,在现实中,不也许对巨量旳图像数据进行手工标注。

并且,人工标注愈加主观和模糊。

第二种措施重要是基于内容旳图像检索(CBIR),这种措施通过低层旳内容特性例如:颜色、形状、纹理[11-13,41-47]对图像进行自动索引以及检索。

然而近来旳研究表明,在低层次旳内容特性和人类用于理解图像旳语义概念之间存在着巨大旳鸿沟。

此外,由于需要顾客提供检索使用旳图像,CBIR系统不适合一般顾客进行图像检索。

第三种图像检索旳措施是自动图像标注(AIA),这样可以通过文本检索[17-40,115,116]旳方式来进行图像检索。

AIA技术旳重要思想是从大量旳图像样本中自动获取语义概念模型,并且使用这个标注图像。

图片搜索调研报告

图片搜索调研报告

图片搜索调研报告图片搜索调研报告一、背景介绍随着互联网的飞速发展,图片搜索技术逐渐成熟并广泛应用于各个领域。

图片搜索主要通过图像特征的提取和匹配来实现,可以实现通过图片来搜索相关的信息和内容。

本次调研旨在了解当前图片搜索技术的应用情况及发展趋势,以期对相关领域的研究和应用提供参考。

二、调研方法本次调研主要采用了文献综述和互联网搜索的方式进行。

首先,通过查阅相关领域的文献和研究报告,了解了当前图片搜索技术的基本原理和方法;其次,通过互联网搜索和社交媒体等渠道,了解了图片搜索在各个领域的应用情况和发展趋势。

三、调研结果1. 图片搜索技术的基本原理和方法图片搜索技术主要通过从图片中提取特征,并将这些特征与数据库中的图片进行匹配,以实现搜索的功能。

目前常用的图片特征提取方法有颜色直方图、纹理特征、形状特征和深度学习等。

而匹配方法则有欧氏距离、余弦相似度、汉明码等。

2. 图片搜索的应用领域图片搜索技术不仅在传统的图像检索领域得到了广泛应用,还在多个领域拓展了新的应用。

其中,商业领域的电子商务平台通过图片搜索技术可以实现商品搜索、相似款式搜索等功能,提高用户的购物体验;在医学领域,通过图片搜索技术可以帮助医生进行疾病诊断和肿瘤检测等;在社交媒体领域,图片搜索技术可以用于图片版权保护和信息搜集;在公安犯罪侦查中,图片搜索技术可以帮助警方追踪嫌疑人。

3. 图片搜索技术的发展趋势随着深度学习的发展,基于卷积神经网络的图片搜索技术得到了快速发展。

通过深度学习算法,可以实现更精准和高效的图片搜索。

此外,利用大数据和云计算等技术,可以提高图片搜索的效率和准确性。

此外,结合虚拟现实技术,将图片搜索应用于虚拟现实领域,可以为用户提供更加沉浸式的体验。

四、调研总结通过本次调研,我们对目前图片搜索技术的应用情况和发展趋势有了更深入的了解。

图片搜索技术在商业、医学、社交媒体和公安等领域均有广泛的应用,且随着深度学习和虚拟现实技术的发展,图片搜索技术有望进一步提高准确性和效率。

SAR图像目标检测研究综述

SAR图像目标检测研究综述

2、基于时域的方法:这类方法主要通过滑动窗口等方式,对SAR图像进行时域 分析。这类方法可以更好地抑制斑点噪声,但是计算复杂度较高。
三、典型SAR图像目标检测方法 介绍
1、基于SWT(Sliding Window Technique)的方法:这是一种常用的时域分 析方法,通过在SAR图像上滑动一个窗口,对窗口内的像素进行统计和阈值判 断,以检测目标。
1、传统方法
基于滤波的方法是SAR图像目标检测的常用方法之一。该方法主要通过滤波器 对图像进行平滑处理,以减小图像的噪声和干扰,然后利用图像的统计特征进 行目标检测。基于边缘的方法则通过检测图像边缘来提取目标信息。该方法主 要利用图像边缘的突
变特性来识别目标,但容易受到噪声干扰。小波变换是一种有效的信号处理方 法,在SAR图像目标检测中主要用于提取图像的多尺度特征,提高目标的识别 精度。
另外,如何将SAR图像目标检测与其他图像处理任务(如图像分割、目标跟踪 等)相结合,进一步提高SAR图像的应用价值,也是未来的一个研究方向。
总之,SAR图像目标检测是一个富有挑战性和应用价值的研究领域。未来的研 究应不断探索和创新,结合新的技术和方法,进一步提高SAR图像目标检测的 性能和鲁棒性,为实际应用提供更为可靠的解决方案。
4、训练策略调整:我们采用了分阶段训练的方法。首先,我们使用大量的无 标签数据进行预训练,以增强网络对SAR图像背景和噪声的适应性。然后,我 们使用有标签数据进行微调,以使网络能够更准确地检测和识别舰船目标。
5、后处理改进:在目标检测任务中,后处理是关键的一部分。我们提出了一 种新的非极大值抑制(NMS)策略,该策略考虑到了SAR图像中舰船目标的空 间关系和形状特征。此外,我们还引入了一种新的目标标签修正算法,以解决 因SAR图像的分辨率和角度问题导致的目标识别错误。

计算机图像处理中的图像检索与图像分类算法

计算机图像处理中的图像检索与图像分类算法

计算机图像处理中的图像检索与图像分类算法计算机图像处理是计算机科学领域中的一个重要分支,主要涉及到对图像进行获取、处理、分析和理解等方面的工作。

在这个过程中,图像检索和图像分类算法是两个关键的研究方向。

本文将介绍计算机图像处理中的图像检索与图像分类算法的原理和应用。

一、图像检索算法图像检索算法旨在根据用户输入的查询信息,从一个大规模的图像数据库中找到与查询图像相似的图像。

图像检索算法主要分为两种类型:基于内容的图像检索和基于上下文的图像检索。

1. 基于内容的图像检索基于内容的图像检索算法是利用图像中的视觉特征进行相似性匹配。

常见的视觉特征包括颜色、纹理、形状等。

其中,颜色直方图是一种常用的描述颜色特征的方法。

通过计算图像的颜色直方图,并与数据库中的图像逐一比较,可以得到相似度最高的图像。

2. 基于上下文的图像检索基于上下文的图像检索算法是通过图像中的语义信息进行相似性匹配。

它利用图像的语义标签或者图像的文本描述进行检索。

例如,给定一张含有"夏天风景"的图像作为查询图像,算法将从数据库中检索出与夏天风景相关的图像。

二、图像分类算法图像分类算法是将图像归类到不同的类别中,常见的算法包括支持向量机(SVM)、卷积神经网络(CNN)等。

1. 支持向量机(SVM)支持向量机是一种常用的机器学习算法,可以用于图像分类。

它通过将图像映射到高维空间中,构造一个最优的超平面,从而实现不同类别图像的分离。

2. 卷积神经网络(CNN)卷积神经网络是一种深度学习算法,目前在图像分类领域取得了巨大的成功。

它通过多层卷积、池化和全连接等操作,在学习过程中自动学习图像的特征,并将图像分类到不同的类别中。

三、算法应用图像检索与图像分类算法在许多领域中都有广泛的应用。

1. 视频监控在视频监控领域,图像检索算法可以帮助快速检索并定位目标人物或物体。

通过将待检索图像与监控视频中的图像进行比对,可以准确地找到所需的信息。

图像搜索的基本原理和流程

图像搜索的基本原理和流程

图像搜索的基本原理和流程一、图像搜索概述1.定义(1)图像搜索的目的(2)应用场景①电子商务②社交媒体③安全监控2.图像搜索的类型(1)基于内容的图像搜索(CBIR)(2)文字标签搜索(3)反向图像搜索二、图像搜索的基本原理1.图像特征提取(1)颜色特征①颜色直方图②颜色矩(2)纹理特征①Gabor过滤器②灰度共生矩阵(3)形状特征①边缘检测②形状描述子2.特征表示(1)特征向量①向量维度②特征归一化(2)特征编码①量化方法②词袋模型三、图像搜索流程1.图像上传(1)用户界面①上传按钮②拖拽上传(2)图像格式支持①JPEG②PNG2.图像预处理(1)图像缩放①调整分辨率②统一尺寸(2)图像去噪①中值滤波②高斯滤波3.特征提取(1)应用特征提取算法①SIFT②SURF③ORB4.特征匹配(1)匹配算法①K近邻搜索(KNN)②FLANN(2)相似度计算①欧氏距离②余弦相似度5.搜索结果返回(1)排序结果①根据相似度排序②显示数量限制(2)结果展示①图像缩略图②详细信息链接四、图像搜索优化1.提高搜索效率(1)特征压缩①主成分分析(PCA)②量化编码(2)建立索引①KD树②LSH(局部敏感哈希)2.提升搜索准确性(1)结合深度学习①卷积神经网络(CNN)②特征迁移学习(2)用户反馈机制①搜索结果反馈②用户行为分析五、图像搜索的挑战1.图像多样性(1)视角变化(2)光照变化2.数据隐私问题(1)用户图像保护(2)法律合规性。

网络信息检索中的图像检索技术

网络信息检索中的图像检索技术

彩直方 图进行检索 的方法有许多 。 如: 比例直方图法 、 累加直方图
色彩 直 方 图还 不 能 为 像 素 在 图 像 中 的 位 置提 供 线 索 . 为 了尽
基 于 文 本 的 检 索 是 搜 索 引 擎 将 网站 、网 页 的 内 容 索 引 为 一 法 等 。
倒 排 文 档 将 关 键 字 映 射 为 网 站 或 网 页 的 地 址 图像 信 息 基 于 文 可 能 少 地 丢 失 信 息 。 提 出 了局 部 色彩 方 法 。局 部 色 彩 的 索 引对 象
要 由人 工 完 整 地 标 注 网络 上 的所 有 图 像 . 不 但 费时 费 力 . 而 且 往 索 的 准 确 性 和效 率 基 于 形 状 的 检 索 不 仅 包 括 传 统 意 义 的 基 于
往 是 不 准确 或 不 完 整 的 ; 其次 , 不 同 用 户 对 于 同 一 张 图像 的 看 法 二 维 形 状 的 检 索 。 还包括三维形状的检索 。 不尽 相 同, 导致对 图像 的标注没 有一个统 一标准 ; 再次, 这 种 方 法 将 注 意力 局 限 在 图 像 的 著 录 特 征 . 即文字描述上 , 不 能 充 分 揭 示 和 描 述 图像 中 有 代 表 性 的 画 面 内 容 特 征 所 以 基 于 内容 的 图 像 检 索 技 术 应 用 而 生 1 基 于 内容 的 图像 检 索技 术
中 图 像 信 息 的需 求 尤 为 大 量 .而 当 前 主 要 以文 本 方 式 进 行 检 索

图, 它 是 红 光 图 像 的 灰 度 值 和蓝 光 图像 的灰 度 值 的 函数 。 利 用 色
的 技 术 已 不 能 满 足人 们对 信息 的需 求
系列的关键字 . 当用户输入相应关键 字后 . 系 统 根 据 数 据 库 中 的
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

收稿日期:2002208210

基金项目:ISN国家重点实验室资助;北京大学视觉和听觉信息处理国家实验室资助作者简介:石 军(19752),男,西安电子科技大学博士研究生.

图像检索技术综述石 军,常义林(西安电子科技大学综合业务网国家重点实验室,陕西西安 710071)

摘要:图像检索是很多研究中的关键技术,图像检索是一种近似检索,与检索文本相比,检索图像要困难得多.根据不同的图像索引对现有的各种图像检索技术进行了分析和比较,包括基于注释的图像检索、基于特征的图像检索以及基于知识的图像检索,提出了图像检索技术的发展趋势和研究方向.

关键词:图像检索;图像索引;注释;特征;知识中图分类号:TP311113 文献标识码:A 文章编号:100122400(2003)0420486206

OverviewofimageretrievalSHIJun,CHANGYi2lin(NationalKeyLab.ofIntegratedServiceNetworks,XidianUniv.,Xi′an 710071,China)

Abstract: Implementationofimageretrievalisbasedonanunderlyingindex.Conventionaltechniquesforretrievingtextualandnumericaldatabasedonsimplecomparisonsarenolongeradequateforimages,sincethedigitizedrepresentationofanimagedoesnotconveyitssemanticcontent.Thispaperpresentsthecurrentstateoftheartinimageretrieval.Wefirstexamtheindexingtechniquesforvisualcontentandinformationcontentforimageretrieval.Next,wereviewrecentstudiesofimageretrievalfromthepointofviewofimageindexes.Thecurrentchallengesandfeaturetrendsforimageretrievalarealsogiven.KeyWords: imageretrieval;imageindex;annotation;feature;knowledge

图像检索就是根据对图像内容的描述,在目标图像集合中找到具有指定特征或包含指定内容的图像[1].

图像的内容可以分为两类:视觉内容和信息内容.视觉内容对应图像的物理表示,如颜色、形状、纹理等.信息内容对应图像的语义,如主题、人物、场景等.为了检索图像,首先要描述图像的内容,对图像的内容进行形式化表示,即建立图像索引.建立图像索引要用到图像处理、计算机视觉、人工智能、数据库等技术.由于图像内容的复杂性和人类的认知主观性,建立高效、通用的图像索引是一项很困难的工作.目前,视觉内容的索引一般可以通过特征提取得到,语义信息的索引则往往要通过人机交互的方式才能得到.

1 图像索引索引是一种元数据,也就是用于说明数据的数据.索引是构造数据解释机制,实现数据统一理解的关键.建立图像索引的过程就是对图像内容进行形式化描述的过程.需要解决以下几个问题:首先,图像数据是非结构化的,为了建立颜色、形状、纹理等视觉内容的索引,需要构造相应的数据模型.随着图像处理和计算机视觉技术的发展,这个问题已经基本得到了解决.针对图像中的各种视觉内容,已经建立了很多清晰实用的数据模型,

如基于颜色的直方图、色矩、色集;基于形状的傅里叶描述符、代数不变矩;基于纹理的共生矩阵、小波变换等.

其次,图像的内容往往受到主观因素的影响,与人的经验、知识、心理都有关系,因此很难准确全面地描述图像的内容.目前的各个图像检索系统中缺乏统一的描述方案,限制了数据的共享和交换,在互联网环境下,这个问

2003年8月第30卷 第4期 西安电子科技大学学报(自然科学版)JOURNAL OF XIDIAN UNIVERSITY Aug.2003Vol.30 No.4题更加突出.为了解决这个问题,MPEG专家组正在制定一个多媒体内容描述方案———MPEG27标准.MPEG27将对多媒体的内容进行标准化的描述,并将该描述与所描述的内容相联系,以实现快速有效的检索.再则,尽管图像中包含了丰富的信息内容,但在物理层次上,图像数据只是二维像素阵列.为了自动建立信息内容的索引,需要实现从物理内容到信息内容的映射,完成这一过程要综合图像处理、图像理解、人工智能等技术,目前还处于起步阶段.建立信息内容的索引一般要通过人机交互的方式.

根据建立索引的方式和索引的内容不同,可以把图像索引分为3类:基于注释的索引、基于特征的索引和基于知识的索引[2].基于注释的索引也称为高级索引,它是对图像的信息内容建立的定性索引.基于特征

的索引又称为低级索引,它是对图像的视觉内容建立的量化索引.基于注释的索引一般是手工方式生成的,

基于特征的索引则可以在图像模型的引导下通过特征提取的方式自动生成.基于知识的索引是针对某个应用领域建立的索引,首先建立该领域知识的逻辑模型,然后对图像进行特征提取和分析,将结果与模型匹配.

一旦确定了匹配关系,就可以把模型所包含的语义信息赋给相应的图像.这种索引方式实质上是以领域知识为中介,实现视觉内容到信息内容的映射,提高系统处理信息内容的能力.

2 基于注释的图像检索基于注释图像检索是在注释索引的基础上实现的.图像注释就是描述图像内容的文本信息,分为语句注释和关键字注释.语句注释可以详细描述图像的内容,但随意性较大,相同的图像内容在不同情况下可能会得到相差很多的注释结果.关键字注释就是用一组预先定义的关键字描述图像的内容,比较规范,但不够灵活,难以充分表达图像的内容.由于自然语言理解技术的限制,在图像检索系统中多使用关键字注释.

基于注释的图像检索早在20世纪70年代就出现了,最初是在关系数据库中加入描述图像内容的字段,

并在图像的存储路径和这些字段之间建立联系,然后利用数据库的查询功能实现图像检索[3].

早期的检索系统都使用自行定义的关键字和注释结构,缺少描述图像的统一方案,数据的共享程度低.

随着互联网和多媒体的发展,检索图像的环境发生了很大的变化,数据的共享和交换成为一个迫切的要求.

为了在互联网环境下用一致的方式检索不同的数据源,需要创建一种简单通用的元数据模型.1995年3月在都柏林召开的第一届元数据研讨会上产生了一个简单的元数据集———都柏林核心元数据集(DublinCore

ElementSet),简称都柏林核心(DublinCore).DublinCore具有简洁、易于理解、可扩展的特性.它的内核是一个很小的应用集合,并规定了可供选择的数据内容和数据格式.经过几年来的发展,DublinCore从内容到形式都大大丰富了.不仅能描述网络资源,而且可以很好地应用在大多数的电子资源描述中.此外,万维网协会W3C还制定了资源描述框架RDF.RDF采用可扩展标识语言XML作为处理和交换元数据的通用语法结构体系,是一个能够对结构化的元数据进行编码、交换和再利用的体系框架,使不同的用户能够在这一框架下定义它们自己的元数据.这些元数据模型为在互联网环境下对图像进行一致的描述提供了可能[1].

基于注释的图像检索可以充分利用图像中丰富的信息内容,与人类认知图像的方式相一致,因而检索的准确率比较高.但是,由于目前计算机技术的局限,完全自动的图像注释无法实现,因此目前的图像注释多采用手工完成,存在着以下不足:⑴注释图像的工作量太大;⑵由于人的认知主观性,造成了注释结果的模糊性.

到了20世纪90年代,由于图像数据的迅速增加,这两个问题越发突出.为此,出现了基于特征的图像检索.由于系统能够根据图像的视觉内容自动建立特征索引,因此基于特征的图像检索具有较高的速度,适用于海量的图像集合.

3 基于特征的图像检索基于特征的图像检索是在特征索引的基础上实现的.图像中包含信息内容和视觉内容,虽然目前图像处理技术不能自动识别信息内容,但是可以自动识别视觉内容.根据图像的视觉内容建立特征索引,基于这些特征索引即可实现基于特征的图像检索.与基于注释的检索不同,基于特征的检索可以自动进行,减少了手工操作的工作量,当图像数量很大时,这一点尤为重要.可用于特征索引的视觉内容包括颜色、形状、纹理等[4].

784第4期 石 军等:图像检索技术综述311 基于颜色特征的检索在图像检索中最常用的物理特征是颜色,这是因为颜色比较直观,并且对图像的位置和大小的变化具有较好的鲁棒性.

最常见的颜色表达式是直方图[13],直方图反映了各种颜色在图像中的分布情况.图像的直方图是一个

一维的离散函数:H(k)=nk/n,k=0,1,…,L-1,其中L是颜色空间的量化数目,nk是具有第k种颜色的像素个数,n是像素总数.为了度量直方图的相似性,可以采用直方图相交法[5],令Hq(k)和Hd(k)分别为查

询图像Q和范例图像D的直方图,则它们之间的相似度为

P(Q,D)=∑L-1k=0min[HQ(k),HD(k)]∑L-1k=0HQ(k) . 当某个颜色分量值没有在图像中出现时,直方图中会产生零值,用欧氏距离度量直方图的相似度时,对直方图中的每个颜色分量平等对待,没有考虑颜色间的相似性,不符合人类的视觉感觉,这种情况会对直方图交叉法的精确度带来影响[7].为了解决这个问题,文献[8]提出了累计直方图.累计直方图也是一个一维的

离散函数:I(k)=

K

i=0ni/n,k=0,1,…,L-1,式中参数的含义与直方图表达式中相同.累计直方图减少

了直方图中的零值,使颜色分量之间的距离与它们之间的相似程度成正比.

除了直方图之外,还有其他形式的颜色表达式.文献[6]在分析已有的基于颜色的图像检索方法的基础上,提出了一种新的基于颜色的图像检索算法,该方法对每个图像单独进行颜色量化,计算其颜色直方图并排序,根据颜色在图像中出现的频率和图像中各种颜色的对比强度确定图像之间的相似度.

312 基于纹理特征的检索纹理是指图像中所具有的局部不规则而宏观有规律的特性.以往纹理多用于模式识别和计算机视觉,近年来在图像检索中也得到了广泛的应用.纹理对图像灰度变化的特征进行量化,与对象的位置、走向、大小、形状有关,与平均灰度级无关.纹理分为随机纹理和模式纹理.随机纹理用统计性质表征,如灰度级的标准偏差或自相关宽度;而模式纹理可通过抽取某些度量进行进一步表征.

纹理特征的一个有效表达方法是共生矩阵[7],共生矩阵可以表示出两个特定灰度的像素在相距(Δ

相关文档
最新文档