图像检索研究综述

合集下载

cv研究方向及综述

cv研究方向及综述

cv研究方向及综述
计算机视觉(CV)是一个涉及多个子领域的学科,包括图像分类、目标检测、图像分割、目标跟踪、图像去噪、图像增强、风格化、三维重建、图像检索等。

1.图像分类:多类别图像分类、细粒度图像分类、多标签图像分类、实
例级图像分类、无监督图像分类等。

2.目标检测:吴恩达机器学习object location目标定位,关键在于将全
连接层改为卷积层。

3.图像分割:使用深度学习进行图像分割,包括全卷积像素标记网络,
编码器-解码器体系结构,多尺度以及基于金字塔的方法,递归网络,视觉注意模型以及对抗中的生成模型等。

4.目标跟踪:基于滤波理论、运动模型、特征匹配等多种方法的混合跟
踪算法研究,以及基于深度学习的目标跟踪算法研究。

5.图像去噪:比较研究不同深度学习技术对去噪效果的影响,包括加白
噪声图像的CNN、用于真实噪声图像的CNN、用于盲噪声去噪的CNN和用于混合噪声图像的CNN等。

6.图像增强:通过对图像进行变换、滤波、增强等操作,改善图像的视
觉效果或者提取更多的信息,例如超分辨率技术。

7.风格化:通过将一种艺术风格应用到图像上,改变其视觉效果。

8.三维重建:从二维图像中恢复三维场景的过程。

9.图像检索:基于内容的图像检索(CBIR),通过提取图像的特征,
进行相似度匹配,实现图像的检索。

总的来说,CV是一个充满活力的领域,涉及的研究方向非常广泛。

随着深度学习技术的发展,CV领域的研究和应用也取得了很大的进展。

内容的图像检索

内容的图像检索

技术市场1.引言基于内容特征的图像检索(Content-Based Image Re-trieval,CBIR)不同于传统的检索手段,直接以图像自身的属性,如颜色、纹理、形状等反映图像内容并与图像存储在一起的各种量化特征作为检索参数,使用的是基于相似性度量的示例查询(Query By Example)方法,具有传统的文本检索技术无法比拟的优越性。

目前,基于内容的图像检索技术已成为检索技术研究的热点。

2.基于内容的图像检索技术CBIR采用视觉特征描述方法,比较通用、有效的对图像的检索是基于图像的颜色、纹理、形状以及图像中子图像等特征,主要包括:①纹理检索,检索具有相似纹理的图像。

②颜色检索,检索与用户指定颜色相似的图像。

③形状检索,用户选择形状或勾勒草图,利用形状特征或匹配主要边界进行检索。

2.1基于纹理检索纹理是指某种基本结构元素在图中有规律的表现,这种基本的结构元素在大小、灰度和空间关系上自然呈现周期性或者随机性;在视觉上表现为粒度、取向及重复性。

为了定量地描述纹理,需要研究纹理本身可能具有的特征。

多年来,人们建立了许多纹理分析方法。

根据纹理的不同表现,处理的方法可以分为四类:基于结构的方法、统计的方法、频谱分析的方法和模型匹配方法。

然而,由于纹理的复杂表现,基于纹理进行检索所需要的纹理分割是困难的事,另外还缺少稳健的纹理模型以及直观性。

2.2基于颜色检索色彩是图像的重要特征之一,具有对图像旋转、平移、尺度变化、甚至各种形变都不敏感的特点,是基于内容的图像索引中应用最广泛的特征。

颜色特征一般采用Swain和Ballard 所提出的颜色直方图来描述。

2.3基于形状检索和颜色、纹理相比,形状特征显得更为直观,而且便于交互描述。

一幅图像中物体的形状,代表着高层信息。

通过边沿检测、细化和收缩等算法可以提取出物体的轮廓,轮廓仍旧保留了物体的主要信息。

基于形状检索基本上是从形状的轮廓特征和形状的区域特征来建立图像的索引。

基于内容的图像检索技术综述

基于内容的图像检索技术综述
郑浩 华 广 东广州 华 南理 工 大 学计 算机科 学 与工 程 学院
矩阵 分析法 、马 尔可夫分 析法 、多 R鹰 向回 9 1MRSA R 模型以及 遗传算法 等。 - T mu a等从人类感知心理 学的角度提 出 a r (I)基 于颜 色特 征 的检 索 纹理的 6种视觉特性 :粗纹度、对比 度、 颜色特 征是 图像最 直观而 叫 硅的特 征,一 啦采 用直方 图来描述 。颜 色直 方 方向性 线性 度 ,规则 度和粗糙 度。 该 纹理特 征表示 具有 实际 的视觉意 义 ,可 圈是 表示 图像 中颜 色 "巾 的 一种 方法 以 为 图像检 索提 供更 好的 用 户交 互性 。 它的横轴 表示 颜 色等缎 .纵轴表 示扯 某 同时 ,南于 纹理 很少 能提 供 语义 信息 , 个颤色等级 上具有该颜 色的溆素在 整幅 描述 比较 困难 。因此通 常作 为检索过 程 图像 中所 占的比侧 ,直方 图颜 邑空 间巾 的 辅助 手 殴或 者和其 他特 征 结合 使 用 的每一个刻度表示了颜色空 间中的一种颜 冉 对纹理的榆索都采用示例查询( ey 殳 qu r 色 。采用直 方图 计算圈像 问的 十 似性 比 日 B x mI ) y E a J 方式。用户给 出示例的垒部 l e 较简 单 ,但 它不能 反映 图像中 对象的 空 或部 甜区域 特 征 ,从而 找到 类 似图 像 间特 征 直方 图交叉的丰 似性 度量最 早 目 是 由 S i 和 Bald 于 1 9 年 提 出 的 , wan l a 91 另外 为 丁缩 小纹理 的查找范 围 ,还可 所有的基于直方图的{ 似性度量都是基于 以考察纹 理的 颜 色特 征, 以便把检 索空 目 间缩 小刊 某个 颜色范 围。 选种 概念 的 ,改进的 度量 包括 直 方圈的 ( 4)基于图像 的语 义特征的 检索 累加 测量 ,以 致在 直方圈的 相似性 度盛 现行的商用系统通常采用关系型数据 时加八窀 间位置信息和基于区域的颜 邑查 库 ,这些 系统 巾图 像的属性 包括 图像来 询。颜 色的检索 一般 应用于 色彩较 为丰 源 拍摄时 间和地 点、蝶 介类 型,分辨 富 的 自然 圈最的检 索中 。 率 、输 八设 备、压缩 方式 以及与 图片相 ( } 基 于 形 状 特 征 的 检 索 ! 和颜 色 纹 理相 比 形状特 征 显得 关的注 释信息 ,注 释信息 对于 用户来说 是非 常 自然 的描述 ,这些特 征 都属于 图 更 为直观 .f 且便 于 交互描 述 。 同时 . 像的 语 义特征 。 般 的 图 豫 ,很 少 是 单颜 色 或 单纹 理 目前图像检索的 主要障碍是难以描述 的 ,昕以 用颜 色或纹 理进 行描 述时 .往 斟像 的语 义信息 ,在此 背景 F提出 了一 往需 要甜匠域 ,这就 必然 要求颜 色或纹 种根据相关图像的语义和图像之间的语丑 理特 征与 形状 特征相 结合 。所 以形状特 关 系.反映 I的 图像语 义的方 法。 围像 g l 征庄 图像 检索过程 中显得十分 必要 之间的语 义关 系通过语 义链表 示, 多种 采用 眩特征进行检索时 ,J 通过勾 f = j 类 型的语 殳链构 成基于语 义链 的图像 网 勒圈像的形状 或轮 廓.从圈缴库中检索出 二 形状粪似的图像;基 ]此特征的检索方法 络 。基 ]语 义链 的推理 规则主要 用干辅 二 助 智能 图像检索 ,基 于语义的 图像检 索 有两种:1分割 图像经过边缘提取后 , ) 得到 方法 和传统方 法相比具 有以下特点 : 目标图像的轮廓线.针对这种轮廓线进行 1】检索 结果 不是孤立 的图像列 表. 的形状特 捡素。2 直接针对图形寻找适 ) 而 是基于语 义的相 关图像或 图像碎片的聚 当的矢量特征 用于检索算法 但处理这种 合 { 结构化枪索更为复杂. 需做 更多的预处理 。 2 )用p可以根据 语义链确定的路径 【 3 1基干 纹理特征的检索 湖 览图 像 ,并进 行推 理 。 纹理是 所有事 物表 面固有 的 一种特 现阶段 ,基千语义的 We b图像检索 性 ,也是 图像检索 中一 个重要 而 叉难以 方法已经在情启 网格和知识网格 平台得到 , 描述 的特 性。 图像可 以看成是 同纹理 实现 ,正 交的语义空 间进 一步提 高 r翻 区域的组 合 .纹 理通 常定 义为 图像 的 某 像检 索的效果 和智能 性。 种局部性 质 ,或是对 局部 域 中像素之 间关 系的一种 度量 。纹理 特征可 阳来 甜 图像中的空间信息进行 一定程度的定量描 下转 摹 1 6 页 2 述。纹 理统计特 征分 析方 法主要有 共生 图像帻索 。

基于深度卷积特征的细粒度图像分类研究综述

基于深度卷积特征的细粒度图像分类研究综述

基于深度卷积特征的细粒度图像分类研究综述一、本文概述随着技术的迅速发展,细粒度图像分类已成为计算机视觉领域的一个重要研究方向。

细粒度图像分类旨在区分具有细微差异的不同类别,如不同种类的鸟类、汽车型号等。

由于这些类别之间的差异往往非常细微,传统的图像分类方法往往难以取得理想的效果。

因此,研究基于深度卷积特征的细粒度图像分类方法具有重要的理论价值和实际应用意义。

本文旨在对基于深度卷积特征的细粒度图像分类方法进行全面的综述。

我们将介绍细粒度图像分类的研究背景和意义,阐述细粒度图像分类所面临的挑战和难点。

我们将重点介绍深度卷积特征在细粒度图像分类中的应用,包括卷积神经网络的基本原理、深度卷积特征的提取方法以及基于深度卷积特征的细粒度图像分类模型。

同时,我们还将对近年来提出的代表性方法进行详细介绍和比较,分析它们的优缺点和适用范围。

本文还将探讨细粒度图像分类领域的未来发展趋势,包括多模态数据融合、弱监督学习、迁移学习等方向的研究进展。

我们将对全文进行总结,并指出当前研究中存在的问题和不足,为未来的研究提供参考和借鉴。

通过本文的综述,我们希望能够为读者提供一个全面、深入的视角,了解基于深度卷积特征的细粒度图像分类方法的研究现状和发展趋势,为该领域的进一步研究提供有益的参考和启示。

二、深度卷积神经网络基础深度卷积神经网络(Deep Convolutional Neural Networks,DCNNs)是近年来计算机视觉领域取得重大突破的关键技术之一。

其强大的特征提取和分类能力,使得DCNNs在图像分类、目标检测、图像分割等多个子领域中都取得了显著的成果。

而细粒度图像分类,作为一种特殊且具有挑战性的图像分类任务,也从DCNNs的发展中受益良多。

深度卷积神经网络的基本结构包括卷积层、池化层和全连接层。

卷积层负责通过卷积运算,提取图像中的局部特征;池化层则负责对卷积层提取的特征进行下采样,以减少特征图的维度和计算量;全连接层则负责将前面层提取的特征进行整合,形成最终的分类结果。

基于内容的图像检索技术综述

基于内容的图像检索技术综述

摘要:简要介绍亍无线局域网的相关技术,分析了现阶段无线局域网面临的主要安
全问题,并有针对性地提出了相应的安全保障措施。
关键词:无线局域网;网络安全技术;IEEE 802.1l
中图分类号:7rP393.08
文献标识码:A
l 无线局域网络简介
信号的军盖范围,使wLAN移动性得到极大提高。
1.1无线局域网络的概念
等优点,冈此发展迅速。但由于无线局域网是基于空间进行传
达到随时随地接人局域网络的境界。
பைடு நூலகம்
播,因此传播方式具有开放性,这使无线局域网的安全设计方案
摘要:介绍了基于内容图像检索系统的基本组成,以及颜色、纹理、形状、多特征综合 等主要的图像特征提取方法,并根据查准率、查全率进行了评价。
关键词:图像检索;查准率;查全率
中图分类号:G252.7,
文献标识码:A
有关图像检索的研究是从20世纪70年代开始的,主要是 幅标准样例图像来进行特fiF提取,然后由系统在特征库中查找
661.
科技情报开发与经济
SCI-TECH INFORMATION DEVELOPMENT&ECONOMY
2009年第19卷第28期
文章编号:1005-6033(2009)3.¥-0101--02
收稿日期:2009—07—15
无线局域网应用安全的研究
刘云峰
(山两工程职业技术学院.山西太原,030000)
(4)颜色相关图(ColorCorrelogram)。颜色相关网反映了不同 颜色对,即像素对之间的空间相关性,也可简化为相同颜色的像 素间的空间关系。其主要是用像素对相对于距离的分布来表达 图像信息,其特征范围相对较小,计算简便,检索效果比颜色直 方图和颜色聚合向量更好。 1.2纹理特征

图像识别中的特征选择方法综述(四)

图像识别中的特征选择方法综述(四)

图像识别中的特征选择方法综述引言:图像识别是近年来备受关注的研究领域。

随着计算机视觉的快速发展,图像识别技术已经被广泛应用于各个领域,如医学影像分析、安防监控和自动驾驶等。

在图像识别中,特征选择是一个关键的步骤,它能够从海量的数据中选取具有代表性的特征,提高图像识别的准确性与效率。

本文将综述当前常用的图像识别中的特征选择方法。

一、传统特征选择方法尺度不变特征变换(SIFT)SIFT是一种基于局部特征的图像描述子,它能够提取图像中的关键点,并计算这些关键点的特征描述子。

SIFT特征具有尺度不变性和旋转不变性等优点,在目标识别和图像匹配中得到了广泛应用。

主成分分析(PCA)PCA是一种常用的线性降维方法,它通过对数据集中的特征进行正交变换,将原始特征转化为新的低维特征。

PCA可以实现特征的压缩和去冗余,有利于减少特征维度,提高分类准确率。

线性判别分析(LDA)LDA是一种监督学习算法,它通过最大化类内散度和最小化类间散度的方式,选择最具判别能力的特征。

LDA能够有效地提高分类器的准确性,并且在数据具有类别信息的情况下表现优异。

相关性分析(RFA)RFA是一种基于相关性的特征选择方法,它通过计算特征与目标变量之间的相关性,选择与目标变量相关性较高的特征。

RFA能够剔除掉与目标变量相关性较低的无用特征,提高分类器的性能。

二、基于深度学习的特征选择方法卷积神经网络(CNN)CNN是一种基于深度学习的图像识别模型,它能够自动学习图像的特征表示。

通过多层卷积和池化操作,CNN能够提取图像中的局部特征和全局特征,并进行融合,从而得到更具有判别性的图像特征。

循环神经网络(RNN)RNN是一种递归神经网络,具有记忆功能。

在图像识别中,RNN能够利用上下文信息,捕捉图像中的时序特征,识别出时序相关的物体以及它们之间的关系。

注意力机制(Attention)注意力机制是一种能够对图像中不同部分产生不同权重的方法。

通过学习图像中的关注重点,注意力机制能够选择具有重要性的特征,提高图像识别的性能。

数据挖掘-图像检索

数据挖掘-图像检索

11
检索技术
基于颜色特征
(1)颜色空间(也称彩色模型或彩色系统)
(2)颜色特征表示 (3)颜色相似度匹配算法
12
检索技术
颜色空间
颜色空间根据其用途可以分为两大类,一是面向硬件设备的颜色 空间,一是面向感知或者颜色分析应用的颜色空间。 RGB CMY或CMYK HSI HSV:比HSI模型更与人类对颜色的感知接近 均匀颜色空间模型:MTM,LUV和Lab
6
CBIR
图像层次模型
7
CBIR
目前,对于通用的静止图像检索,用于检索的特征主要有颜 色(Colour)、纹理(Texture)、草图(Sketch)、形状 (Shape)等,其中颜色、形状、纹理等应用尤为普遍。
8
CBIR
9
CBIR
多维度图像模型
10
检索技术
基于不同特征的图像检索技术
(1)基于颜色特征 (2)基于纹理特征 (3)基于形状特征
其中k = 0, 1, …, 5 而g(i, j)是位于(i, j)的像素强度值。
33
检索技术
然后,对于每个像素,分别计算它在水平和垂直方向上互 不重叠的窗口之间的平均强度差。
其中对于每个像素,能使E 值达到最大(无论方向)的k 值用
来设置最佳尺寸。最后,粗糙度可以通过计算整幅图像中
SkbestyxS2),(=best的平均值来得到,表达为
基于内容的图像检索技术
史景利 2110230207
1
目 录
一、概述 二、C-BIR检索技术 三、关联规则挖掘算法
四、应用
2
概 述
图像检索
1.基于文本的图像检索
基于文本的图像检索TBIR(Text-based Image Retrieval )利用 文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、

基于内容的图像检索技术研究的开题报告

基于内容的图像检索技术研究的开题报告

基于内容的图像检索技术研究的开题报告一、研究背景及意义随着网络技术的迅猛发展,互联网上的图像数据呈爆炸式增长。

如何高效地对这些图像数据进行管理和检索是当前研究的热点问题之一。

传统的基于文本的图像检索方式存在局限性,对于一些没有明确描述文本信息的图像,这种检索方式显得比较无力。

因此,基于图像内容的检索技术逐渐被人们所重视。

基于内容的图像检索技术是指通过图像内容(如颜色、纹理、形状等特征)来实现对图像的检索。

该技术可应用于图像数据库、图像信息系统、多媒体检索等领域。

通过该技术,用户可以更加方便快捷地获取所需图像,大大提高了效率和准确度。

目前,基于内容的图像检索技术已经取得了很大的进展,但是仍存在一些挑战。

首先,图像内容表达方式仍有限,需要对多种表达方式进行综合,提高检索精度。

其次,大规模图像数据的搜索复杂度较高,如何实现高效的搜索算法需要进一步研究。

因此,本课题旨在通过对基于内容的图像检索技术进行深入研究,提高其检索精度和效率。

二、研究内容和方法本研究的主要内容包括以下几个方面:1、基于内容的图像检索技术综述:分析目前基于内容的图像检索技术的研究现状和发展趋势,总结其优缺点。

2、图像特征提取与描述:研究不同的特征提取和描述方法,包括颜色直方图、纹理特征、形状特征等,并探讨不同特征之间的关系。

3、相似度度量方法:分析相似性度量方法的优缺点,探讨不同度量方法在不同特征下的适用性和稳定性,提出一种基于多种相似度度量方法结合的综合度量方法。

4、基于内容的图像检索系统设计与实现:基于以上内容,设计并实现一个基于内容的图像检索系统。

本研究将主要采用文献综述和实验研究方法。

文献综述主要是通过查阅国内外相关的文献和实验资料,对基于内容的图像检索技术进行分析和总结;实验研究主要是通过实验验证,对不同方法的优劣进行评估,为检索系统的搭建提供理论与实践依据。

三、预期成果本研究的预期成果包括以下几个方面:1、基于内容的图像检索技术综述:对目前基于内容的图像检索技术的研究现状和发展趋势进行深入的分析和总结。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

A SurveyofImageRetrieval
ShaoFubo1,HuangJing2
(1.CRRC,Beijing 100161,China;2.QingdaoUniversityofScience&Technology,Qingdao 266100,China)
Abstract:Withtherapiddevelopmentand wideapplication ofdigitalmultimediainformation technology,moreand more informationiscarriedbyimagesindailylife.Efficientandaccurateretrievaltechnologyofdigitalimagesisgettingmoreandmore attention.Thispaperdescribesthebackgroundanddevelopmentprocessofimageretrieval,andbrieflyintroducestheimportant algorithmsincontent-basedimageretrievaltechnology.Itpointsouttheshortcomingsandfutureresearchdirectionsofimage retrievaltechnology. Keywords:imageretrieval;deeplearning;developmentprocess;researchdirection
第 15期
邵福波,等:图像检索研究综述
·81·
图检索研究综述
邵福波1,黄 静2
(1.中国中车股份有限公司博士后科研工作站,北京 100161;2.青岛科技大学,山东 青岛 266100)
摘要:随着数字多媒体信息技术的快速发展和广泛应用,图像在日常生活中携带的信息越来越丰富,高效准确的数字图像检索技术越来 越受到重视。本文描述了图像检索的背景以及发展历程,并对基于内容的图像检索技术中的重要算法进行了简单的介绍,指出了目前 图像检索技术中存在的不足和未来研究方向。 关键词:图像检索;深度学习;发展历程;研究方向 中图分类号:TP391.41 文献标识码:A 文章编号:1008-021X(2019)15-081-02
90年代以后,出现了基于内容的图像检索(content-based imageretrieval,CBIR)技术,它是对图像的内容,如图像的颜色、 纹理、形状等低层特征进行分析和查询的图像检索技术。通过 对图像的视觉内容进行数学描述来提取图像特征,这些低层特 征的数学描述能够反映图像本身的视觉内容。图像特征的相 似度度量是在对图像特征提取的基础上,按照某种相似度计算 方法进行相似度计算(比如欧式距离),通过对相似度结果进行 排序,检索到 用 户 所 需 的 图 像。 CBIR检 索 系 统 利 用 了 计 算 机 快速计算的 能 力,自 动 对 图 像 内 容 进 行 特 征 提 取 和 相 似 度 度
1 图像检索的发展历程
自 20世纪 70年代,人们就开始了对图像检索的研究,当时 主要 是 基 于 文 本 的 图 像 检 索 (text-basedimageretrieval, TBIR),利用文本来描述图像的特征,然后借助文本匹配进行图 像的检索。目前基于文本的检索技术已经发展成熟,如 Page- Rank方法、概率方法、位置方法、摘要方法、分类或聚类方法、词 性标注法等[1]。TBIR的特点是快速精准,但存在以下缺点:首 先,文本标注图像 不 能 全 面 地 反 映 图 像 本 身 的 重 要 信 息,图 像 的丰富内容使得 文 字 描 述 显 得 较 为 匮 乏;其 次,海 量 的 图 像 造 成人工标注工作量大,需要耗费大量的人力和时间;最后,文字 的标识带有很大的主观性,再加上人们对图像资源的管理要求 也越来越高,虽网 络 上 日 新 月 异 的 各 类 图 像 的 检 索需求。
量,既得到了图像的视觉特征,又克服了文本标注的缺陷,大大 提高了检索效果,其 特 点 是 全 局 特 征 的 运 算 速 度 较 快、实 现 简 单。除此之外,检索系统还可以通过相关反馈机制动态调整低 层特征的提取方式和相似度度量算法来优化检索过程,得到更 加接近人类视觉感知的检索结果[2],这种利用图像的全局特征 进行图像检索的思想直到 2003年都一直处于主导地位[3]。
在 2004年,Lowe[4]提出了完善的尺度不变特征变换(scale -invariantfeaturetransform,SIFT),于是,以 SIFT为代表的局部 特征描述符逐渐兴起,局部特征描述符解决了全局描述符对亮 度、变换、遮挡等不变性差的问题,随后出现了依赖于 BoW 模型 的词典学习算法、FV算法、VLAD算法等[3],利用编码的思想, 在有效的局部特征的基础上采用聚类等算法来获得图像的整 体表达。为了克服基于简单视觉特征的图像检索方法的不足, 人们 提 出 了 基 于 语 义 的 图 像 检 索 (semantic-basedimage retrieval,SBIR)技术,与 CBIR不同的是,SBIR是基于文字的查 询,包含了自然语言处理和传统的图像检索技术[5-6]。SBIR是 解决“语义鸿沟”的重要方法及思路,它不仅考虑了低层视觉特 征,而且考虑了图像的高层特征,如空间关系、场景和情感等方 面的图像信息。近年来,随着深度学习理论的发展以及计算机 性能的快速提升,出现了利用神经网络进行特征提取的图像检 索算法。在 2012年,Krizhevsky等[7]在 ImageNetLSVRC大赛上 利用 AlexNet取得了最高的准确率,随后兴起了一些基于深度 学习的图像检索算法,广泛应用于图像检索、图像分类、目标识 别以及图像语义分割等领域。在深度学习算法中尤其是卷积 神经网络的检索效果最为突出,它利用多个卷积层和池化层的 组合得到图像的视觉特征,并与反馈及分类技术相结合实现了 较好的检索结果。卷积神经网络缺点是提取出来的特征向量 没有记录图像的 空 间 位 置 信 息,以 人 脸 识 别 为 例,当 人 的 五 官 的位置错误排列时,卷积神经网络依然会认为图像是一张正常 的人脸。在 2017年,深度学习之父 GeoffreyHinton[8]在神经网 络的基础上 研 究 出 了 胶 囊 网 络,它 克 服 了 卷 积 神 经 网 络 的 缺 点,不仅记录了图 像 的 整 体 信 息,还 记 录 了 图 像 局 部 特 征 之 间
随着数码设备的普及以及网络技术的飞速发展,图像在人 们日常生活中的 重 要 性 日 益 增 加,大 量 的 图 像、视 频 数 据 在 医 学影像、数字 图 书 馆、工 业 产 权、遥 感 系 统 等 许 多 领 域 得 到 应 用,从而产生了对可以有效检索多媒体数据系统的需求。而图 像检索实现了对图像库的有效查询和管理,它是指从大规模图 像数据库中检索出与文本查询或视觉查询相关的图像。因此, 从大量的数字图像中快速准确地检索到用户所需图像的研究 成为一个有意义且急需解决的课题。
相关文档
最新文档