基于内容的图像检索-2016年

合集下载

基于内容的图像检索

基于内容的图像检索

基于内容的图像检索
基于内容的图像检索(Content-Based Image Retrieval, CBIR),也称为内容视觉检索,是一种能够从图像库中自动找到和用户提供的图像或者用户视觉描述相似的图像的技术。

它可以利用图像中存在的特征和类别,进行快速准确的信息检索。

基于内容的图像检索的原理是,首先将图像进行处理,形成和其中的特性相关的特征向量,然后将提取到的特征向量传入到模型中,计算和检索图像之间的相似性,从而进行图像内容检索。

基于内容的图像检索技术有很多优势,包括精确性和可处理信息量大等特点。

相比于表面检索技术,基于内容的图像检索技术不仅可以检索出更高质量的图像,还可更好地提高搜索效率。

此外,基于内容的图像检索技术还可以根据不同的图像特征,进行更加详细和准确的检索,从而实现更快的检索速度。

基于内容的图像检索技术的典型应用是基于用户上传的图像或口头描述,进行图像模糊检索或类似图像检索,从而使用户能够快速检索到自己想要的内容信息。

同时,基于内容的图像检索技术还可以用于商业图像检索、监控视频搜索等多种不同的任务。

总的来说,基于内容的图像检索是一种发展很快的技术,它已经被广泛应用在信息检索、图像检索、人工智能等方面。

它能
够提高信息检索的准确性和效率,为用户提供快速、准确、全面的搜索服务。

国科发火〔2016〕32号---国家重点支持的高新技术领域

国科发火〔2016〕32号---国家重点支持的高新技术领域

国科发火〔2016〕32号---国家重点支持的高新技术领域附件国家重点支持的高新技术领域一、电子信息二、生物与新医药三、航空航天四、新材料五、高技术服务六、新能源与节能七、资源与环境八、先进制造与自动化一、电子信息(一)软件1. 基础软件服务器/客户端操作系统;通用及专用数据库管理系统;软件生命周期的开发、测试、运行、运维等支撑技术,以及各种接口软件和工具包/组、软件生成、软件封装、软件系统管理、软件定义网络、虚拟化软件、云服务等支撑技术;中间件软件开发技术等。

2. 嵌入式软件嵌入式图形用户界面技术;嵌入式数据库管理技术;嵌入式网络技术;嵌入式软件平台技术;嵌入式软件开发环境构建技术;嵌入式支撑软件生成技术;嵌入式专用资源管理技术;嵌入式系统整体解决方案设计技术;嵌入式设备间互联技术;嵌入式应用软件开发技术等。

3. 计算机辅助设计与辅助工程管理软件用于工程规划、工程管理/产品设计、开发、生产制造等的软件工作平台或软件工具支撑技术;面向行业的产品数据分析和管理软件;基于计算机协同工作的辅助设计软件;快速成型的产品设计和制造软件;专用计算机辅助工程管理/产品开发工具支撑技术;产品全生命周期管理(PLM)系统软件;计算机辅助工程(CAE)相关软件;分布式控制系统(DCS)、数据采集与监视控制系统(SCADA)、执行制造系统(MES)技术等。

4. 中文及多语种处理软件中文、外文及少数民族文字的识别、处理、编码转换与翻译技术;语音识别与合成技术;文字手写/语音应用技术;多语种应用支撑技术;字体设计与生成技术;字库管理技术;支撑古文字、少数民族文字研究的相关技术;支撑书法及绘画研究的相关技术;语言、音乐和电声信号的处理技术;支撑文物器物、文物建筑研究的相关技术;支撑文物基础资源的信息采集、转换、记录、保存的相关技术等。

5. 图形和图像处理软件基于内容的图形图像检索及管理软件;基于海量图像数据的服务软件;多通道用户界面技术;静态图像、动态图像、视频图像及影视画面的处理技术;人机交互技术;裸眼3D内容制作技术;3D图像处理技术;3D模型原创性鉴定技术;遥感图像处理与分析技术;虚拟现实与现实增强技术;复杂公式图表智能识别转换技术;位图矢量化技术和工程文件智能化分层管理技术;实现2D动画和3D动画的自主切换和交互技术等。

基于内容的图像检索系统设计

基于内容的图像检索系统设计

基于内容的图像检索系统设计摘要:随着多媒体技术的发展,传统的基于文本的信息检索技术已经不能满足需求,基于内容的图像检索技术成为当今的研究热点。

图像的特征提取,相似性匹配是基于内容图像检索系统设计的关键技术。

本研究在对图像检索关键技术研究的基础上,利用Visual Basic程序设计语言和Access数据库实现图像数据库的建立和检索。

结果显示,所设计的基于内容的图像检索系统可以有效地利用图像的颜色、纹理特征从图像数据库中检索出相似的图像。

关键词:颜色;特征提取;纹理;基于内容图像检索1 图像数据库的建立Access是由微软发布的关联式数据库管理系统,常被小型企业、大公司的部门和开发人员专门用来制作处理桌面系统。

具有存储方式简单,界面友好,处理多种数据信息,支持广泛,易于扩张等特点。

因此,本研究利用access来建立小型的图像数据库。

Data控件是Visual Basic提供的用来执行大部分数据库访问操作。

能自动处理一些事件包括空记录集,添加新纪录,编辑和更新现有纪录,处理某些类型的错误。

图像数据是图像元灰度值的纪录,以行列数据矩阵表示,一般信息量比较大。

直接读取图像的信息存入数据库中,不但增加了数据库的容量,而且增加了计算机的负担。

经研究发现,建立图像地址库,可有效提高计算机的计算效率。

当需要提取图像时,再根据图像的地址,对图像进行检索,平时,只需对图像的基本信息进行管理。

数据库的基本功能包括:增加删除图像、图像统计、图像的显示等。

2 关键技术问题基于内容图像检索系统的5个基本组成部分中,用户接口和图像查询模块由Visual Basic编程实现。

要求用户接口界面直观易懂、交互性较好,图像查询模块能提供多种查询方式。

有效的特征提取和特征匹配技术对图像检索系统的实现至关重要。

要求一方面降低数据处理量,另一方面提高匹配精度。

2.1 图像特征提取2.1.1 直方图特征颜色的模型有RGB、HIS、YUV模型等。

基于内容的图像检索技术

基于内容的图像检索技术

D S IG N N WS []6技术专题图像技术随着信息社会的到来和Int er ne t 技术的普及,人们越来越频繁地接触到图像和视频信息。

同时,每天还有大量信息在不断产生,如卫星、医疗、安全等方面。

因此,对这些信息地有效组织、管理和检索便成为需要解决的问题。

传统数据库检索采用基于关键词的检索方式,早期图像数据库如K odak Pi c t ur e Ec ha nge Syst e m(K PX )、t he Pr essL i nk L i br ar y 和t he T i m e A r chi v e C oll ect ion 沿袭了这种检索方式,采用描述性文本进行检索。

但一般来说,这种检索技术往往不能满足人们的需要。

由于图像息的内容具有丰富的内涵,在许多情况下仅用几个关键词难以充分描述,而且作为关键词图像特征的选取也有很大主观性。

于是,基于内容检索(Cont e nt B a se d Iage Ret r ie v al,C B I R )技术应运而生。

它区别于传统的检索手段,融合了图像理解技术,从而可以提供一种从巨大容量的图像库中,根据人们提出的要求进行有效检索的方法。

在基于内容的图像检索中,较常用关键技术包括从颜色、形状、纹理、空间关系、对象特征进行检索。

基于颜色特征的图像信息检索人类在对环境和物体的感知中,颜色往往起着十分重要的作用。

在许多情况下(特别是对于自然景物来说),颜色是描述一幅图像最简便而有效的特征。

颜色内容包含两个一般的概念,一个对应于全局颜色分布,一个对应于局部颜色信息。

按照全局颜色分布来索引图像可通过计算每种颜色的像素个数,并构造出颜色直方图来实现,这对检索具有相似总体颜色内容的图像是一个很好的途径。

局部颜色信息是指局部相似的颜色区域,考虑了颜色的分类与一些初级的几何特征。

颜色直方图是最常用的颜色特征表示方法。

直方图的值反映了图像的统计特征,包括平均值、标准偏差、中间值和像素个数,颜色集中的地方峰值较高。

基于内容的图像检索技术综述

基于内容的图像检索技术综述
郑浩 华 广 东广州 华 南理 工 大 学计 算机科 学 与工 程 学院
矩阵 分析法 、马 尔可夫分 析法 、多 R鹰 向回 9 1MRSA R 模型以及 遗传算法 等。 - T mu a等从人类感知心理 学的角度提 出 a r (I)基 于颜 色特 征 的检 索 纹理的 6种视觉特性 :粗纹度、对比 度、 颜色特 征是 图像最 直观而 叫 硅的特 征,一 啦采 用直方 图来描述 。颜 色直 方 方向性 线性 度 ,规则 度和粗糙 度。 该 纹理特 征表示 具有 实际 的视觉意 义 ,可 圈是 表示 图像 中颜 色 "巾 的 一种 方法 以 为 图像检 索提 供更 好的 用 户交 互性 。 它的横轴 表示 颜 色等缎 .纵轴表 示扯 某 同时 ,南于 纹理 很少 能提 供 语义 信息 , 个颤色等级 上具有该颜 色的溆素在 整幅 描述 比较 困难 。因此通 常作 为检索过 程 图像 中所 占的比侧 ,直方 图颜 邑空 间巾 的 辅助 手 殴或 者和其 他特 征 结合 使 用 的每一个刻度表示了颜色空 间中的一种颜 冉 对纹理的榆索都采用示例查询( ey 殳 qu r 色 。采用直 方图 计算圈像 问的 十 似性 比 日 B x mI ) y E a J 方式。用户给 出示例的垒部 l e 较简 单 ,但 它不能 反映 图像中 对象的 空 或部 甜区域 特 征 ,从而 找到 类 似图 像 间特 征 直方 图交叉的丰 似性 度量最 早 目 是 由 S i 和 Bald 于 1 9 年 提 出 的 , wan l a 91 另外 为 丁缩 小纹理 的查找范 围 ,还可 所有的基于直方图的{ 似性度量都是基于 以考察纹 理的 颜 色特 征, 以便把检 索空 目 间缩 小刊 某个 颜色范 围。 选种 概念 的 ,改进的 度量 包括 直 方圈的 ( 4)基于图像 的语 义特征的 检索 累加 测量 ,以 致在 直方圈的 相似性 度盛 现行的商用系统通常采用关系型数据 时加八窀 间位置信息和基于区域的颜 邑查 库 ,这些 系统 巾图 像的属性 包括 图像来 询。颜 色的检索 一般 应用于 色彩较 为丰 源 拍摄时 间和地 点、蝶 介类 型,分辨 富 的 自然 圈最的检 索中 。 率 、输 八设 备、压缩 方式 以及与 图片相 ( } 基 于 形 状 特 征 的 检 索 ! 和颜 色 纹 理相 比 形状特 征 显得 关的注 释信息 ,注 释信息 对于 用户来说 是非 常 自然 的描述 ,这些特 征 都属于 图 更 为直观 .f 且便 于 交互描 述 。 同时 . 像的 语 义特征 。 般 的 图 豫 ,很 少 是 单颜 色 或 单纹 理 目前图像检索的 主要障碍是难以描述 的 ,昕以 用颜 色或纹 理进 行描 述时 .往 斟像 的语 义信息 ,在此 背景 F提出 了一 往需 要甜匠域 ,这就 必然 要求颜 色或纹 种根据相关图像的语义和图像之间的语丑 理特 征与 形状 特征相 结合 。所 以形状特 关 系.反映 I的 图像语 义的方 法。 围像 g l 征庄 图像 检索过程 中显得十分 必要 之间的语 义关 系通过语 义链表 示, 多种 采用 眩特征进行检索时 ,J 通过勾 f = j 类 型的语 殳链构 成基于语 义链 的图像 网 勒圈像的形状 或轮 廓.从圈缴库中检索出 二 形状粪似的图像;基 ]此特征的检索方法 络 。基 ]语 义链 的推理 规则主要 用干辅 二 助 智能 图像检索 ,基 于语义的 图像检 索 有两种:1分割 图像经过边缘提取后 , ) 得到 方法 和传统方 法相比具 有以下特点 : 目标图像的轮廓线.针对这种轮廓线进行 1】检索 结果 不是孤立 的图像列 表. 的形状特 捡素。2 直接针对图形寻找适 ) 而 是基于语 义的相 关图像或 图像碎片的聚 当的矢量特征 用于检索算法 但处理这种 合 { 结构化枪索更为复杂. 需做 更多的预处理 。 2 )用p可以根据 语义链确定的路径 【 3 1基干 纹理特征的检索 湖 览图 像 ,并进 行推 理 。 纹理是 所有事 物表 面固有 的 一种特 现阶段 ,基千语义的 We b图像检索 性 ,也是 图像检索 中一 个重要 而 叉难以 方法已经在情启 网格和知识网格 平台得到 , 描述 的特 性。 图像可 以看成是 同纹理 实现 ,正 交的语义空 间进 一步提 高 r翻 区域的组 合 .纹 理通 常定 义为 图像 的 某 像检 索的效果 和智能 性。 种局部性 质 ,或是对 局部 域 中像素之 间关 系的一种 度量 。纹理 特征可 阳来 甜 图像中的空间信息进行 一定程度的定量描 下转 摹 1 6 页 2 述。纹 理统计特 征分 析方 法主要有 共生 图像帻索 。

【信息检索技术习题答案(2016版)】

【信息检索技术习题答案(2016版)】

答案******************************* 一 ********************************************填空1.数值型文字型(字符)语音型图像型2.原料成品3.信息4.自然人为5.数据文本声音图像6.语义差异传递载体7.外表整体内容8.收集传输加工储存(存储)9.信息形式信息内容10.内在的信息需要外在刺激11.标题词单元词叙词关键词12.线性结构非线性结构树形结构网状结构13.数据预处理索引生成查询处理检索14.信息需求信息集合15.出发点依据16.人工赋予自动生成名词解释1.数据:是指记载下来的事实,是客观实体属性的值,它是由原始事实组成的。

2.信息加工:是指对获取的信息进行判别、筛选、分类、排序、分析、计算和研究等一系列过程,使收集到的信息成为对我们有用的信息资源。

3.信息组织:即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。

4.检索标识:就是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用于文献标引和检索提问的约定语言。

5.信息检索:可以从广义和狭义两个角度理解。

广义的信息检索是指将信息按一定方式组织和存储起来,并根据用户的需要找出相关信息的过程,其中包括存与取两个方面。

狭义的信息检索仅指信息查找过程。

6.信息检索系统:是指按某种方式、方法建立起来的用于检索信息的一种有层次的体系,是表征有序的信息特征的集合体。

7.检索效果:是指利用检索系统(或工具)开展检索服务时所产生的有效结果。

简答题1.简述了解用户信息需求的作用答:用户信息需求是信息系统发展的动力,也是制定信息政策的出发点和依据。

了解用户需求的特点、心理规律、查询行为及需求方式,有助于系统制订合理的信息搜集方针和信息资源的合理布局,从而提高服务效益和质量。

基于内容的图像检索技术概述

基于内容的图像检索技术概述

色 量 化 方 法 并 在此 基 础上 提 出 了 一 种基 于 颜 色 一 空 间 特 征 的 检 索 方法 。 文献【】 出一种通过提取颜 色特征 、 7中提 灰度特征 , 获取 图像物 体 的形状 和空间特征 , 使检索结果 不受 图像大小 、 旋转和轻微的光 照变 化 的 影 响 , 显 改 善 了检 索 结 果 。 明 () 2颜色相关 图。 颜色相 关图是用颜色对相对于距 离的分布来 描述信 息 , 不但 刻画了某 一种颜 色的像 素数量 占整个图像的 比例 , 还反映 了像素对的空间相 关性 , 以及局部像素分布和总体像素分布 的相 关 性 , 且 特 征 范 围小 , 果 好 , 点 是 计 算量 太 大 。 并 效 缺 () 3颜色矩 。 色矩  ̄Sr k r rn o 颜 tti e和O e g 所提 出, 颜色直方 图 c 在 的基础上计算 出每个颜色通 的均值 、 方差 、 偏差 , 来替代颜色的分布 表示颜色特征 , 需对 特征进行量化 , 理简单 。 无 处
形 状 图像检 索技 术 的 主要 方 法 , 论 了性 能 评 价 方 法 , 指 出 了应 用方 向 。 讨 并 关键 词 : B R 颜 色 纹理 形状 性 能评价 方 法 C I

中 图分 类号 : P 9 .1 文 献 标 识 码 : T31 4 A
文章 编号 :0 79 1(0 20 - 190 10 —4 62 1) 1 5 -2 0Leabharlann 22纹理 特征 检 索 .
纹 理 是 图像 中一 个 重 要 而 又难 以描 述 的特 性 , 习惯 上 将 图像 在 局 部 区域 内呈 现 不 规 则 性 , 而在 整 体 上 却 表 现 出某 种 规 律 性 的 特 性 称为纹理 。 描述 纹理特征 的术语有粗糙度 、 比度 、 对 方向性 、 线性度 、 规 则 度 、 略 度 ) 。 述 纹 理 特 征 的 方 法 有 统 计 法 、 型 法 、 析 粗 等 描 模 分 法、 频谱法 。 () 1统计法 。 用于分析像 木纹、 沙地 、 草坪 等细致而不规则 的物 体 , 图像有 关纹理 属性的统计分析出发 , 从 根据纹理 的空间灰度 级 相关性 , 构造出一个基于图像像素间方向和距离的共生矩 阵, 并提 取 出特 征 与 参 数 间 的 关 系 。 () 2结构法 。 用于分析像 布料的 印刷 图案 或砖瓦等排列 比较 规 则的图案, 找出纹理基元 , 去探求纹理 构成 的结构规律 , 根据纹理基 元及其排列 规则来描述特 征与参数间的关系 。 () 3模型法 。 用一些 成熟的 图像模型 来描 述纹理 , I r o 模  ̄ Mak v 型 、 rca模 型 、 尔 科 夫 随 便 机 场 、 回 归模 型 等 , 过 少 量 的参 F atl 马 子 通 数来描述纹 理特征 。 () 4频谱法 。 主要借 助于频率特性来描述纹理 ,H a o变换 、 ?G b r  ̄ 小 波变换法 , 但是计算速度慢。 纹理特 征检索 的具 体过程 是先提取 纹 理特征 , 据特征对图像进行分割和分类 , 户一旦选中相近的纹 依 用 理形式 , 系统则要求用户适 当调整纹理 特征 , 如对 比度 “ 再暗一些 ” , 从 而 返 回 更 精 确 的检 索 结 果 。

简述基于内容的图像检索技术

简述基于内容的图像检索技术

简述基于内容的图像检索技术基于内容的图像检索技术是一种利用图像的视觉特征,通过计算机技术进行图像匹配和相似度计算,从而实现高效的图像检索。

它可以帮助用户快速地查找到需要的图片,也可以为图像分析和计算机视觉领域的研究提供支持。

本文将详细介绍基于内容的图像检索技术。

一、图像特征提取图像特征提取是基于内容的图像检索技术的核心步骤,其目的是从图像中提取出代表其内容的特征。

常用的特征提取方法包括颜色特征、纹理特征、形状特征、边缘特征等。

其中,颜色特征是最为常用的特征之一,它可以通过统计图像中各像素的颜色分布来提取颜色特征。

二、相似度计算相似度计算是基于内容的图像检索技术的关键步骤,其目的是计算待查询图像和数据库中图像之间的相似度。

常用的相似度计算方法包括欧氏距离、余弦相似度、汉明距离等。

其中,余弦相似度是最为常用的相似度计算方法之一,它可以用于计算图像之间的相似度。

三、图像检索算法基于内容的图像检索技术采用不同的算法进行图像检索,其中最常用的算法包括基于特征的检索算法和基于深度学习的检索算法。

基于特征的检索算法主要利用图像的视觉特征进行相似度计算和图像匹配,例如SIFT、SURF等算法。

基于深度学习的检索算法则是利用深度神经网络对图像进行特征提取和相似度计算,例如基于卷积神经网络的图像检索算法。

四、图像检索应用基于内容的图像检索技术在许多应用领域都得到了广泛的应用。

例如在电商领域,可以利用图像检索技术实现商品搜索和推荐;在娱乐领域,可以利用图像检索技术实现图像搜索引擎和相册管理;在医学领域,可以利用图像检索技术实现医学图像检索和诊断等。

五、图像检索的挑战基于内容的图像检索技术还面临着一些挑战。

其中最主要的挑战是图像的复杂性和多样性。

不同的图像可能存在着相同的特征,而相似的图像可能存在着不同的特征。

此外,图像的噪声、失真等因素也会影响图像检索的效果。

六、总结基于内容的图像检索技术是一种通过计算机技术实现高效的图像检索的方法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

相关反馈:特征权重调整
以图像检索为例,每幅图像都对应着特征空间中一 个N维特征向量,而检索开始时特征空间每一维度 上的权重都是相等的。 在相关反馈中,检查所有反馈正例和负例的特征向 量:假设所有反馈正例在某个维度上的值相差很大 ,则说明这个维度和用户查询的关系并不密切,因 此可以降低该维度上的权重; 反之,如果所有正例在某个维度上的值非常接近, 则说明该维度很好地反映了查询中的某个特点,因 此应该提高该维度的权重。
相关反馈例子
1st iteration
Display
User Feedback
Feedback to system Estimation & Display selection Display
2nd iteration
User Feedback
相关反馈参数调整
Similarity Wi * Dis tan ce(Queryi Im agei )
Video
Audio the common representation space across modalities
multi-modal Data with respect to one concept, topic or event (earthquake here)
三大鸿沟(2):异构鸿沟 (heterogeneous gap) 共享子空间的学习:从异构空间到同构空间, 在同构空间中模态互补与关联建立
Image Retrieval:From Wikipedia, the free encyclopedia.
An image retrieval system is a computer system for browsing, searching and retrieving images from a large database of digital images. Most traditional and common methods of image retrieval utilize some method of adding metadata such as captioning, keywords, or descriptions to the images so that retrieval can be performed over the annotation words. Manual image annotation is time-consuming, laborious and expensive; to address this, there has been a large amount of research done on automatic image annotation. Additionally, the increase in social web applications and the semantic web have inspired the development of several web-based image annotation tools. Another method of image retrieval is content-based image retrieval (CBIR), which aims at avoiding the use of textual descriptions and instead retrieves images based on their visual similarity to a user-supplied query image or user-specified image features.
语义概念及属性
区别特征子集
• 物种形状 • 栖息环境 •P …. TF*IDF n-Gram POS ...
文本 特征
实验发现:NUS-WIDE图像集中提取的颜色、方向和小波等特征中,仅有53% 是区别性特征;NewsGroup文档集中提取的主题文本特征中,不足16%的文本 单词是区别性单词
图像检索:相关反馈

在检索中为了在底层特征空间和语义空间之间建 立对应关系,相关反馈机制被使用,这一技术可 分为两类:

利用反馈信息修改查询向量使其向相关检索 对象的分布中心移动,即逐步改变查询向量

调整距离度量公式中各特征分量的权值,即
特征权重调整,改变特征权重
相关反馈:查询向量优化
根据用户反馈信息来调整查询点,使之更加接近 理想查询点,再用调整后的查询点去重新计算检 索结果。在每次相关反馈中,用户都会提交一些 他所认为的与查询相关或者不相关的例子(文本 或图像),称为反馈正例和反馈负例。 查询向量优化算法的具体做法是移动查询点,使 之更加靠近反馈正例在特征空间中所对应的点, 同时远离反馈负例所对应的点,通过这种方式来 接近理想查询点。大量实验结果表明,采用优化 后的查询点重新计算的检索结果明显优于前一次 的查询结果。
Sky, Building, Tree, Persons... 人脑所感知的
捕获的外界客观世界
计算机所看到的: 灰度矩阵->特征
From pixels to concepts:
How?
三大鸿沟(1):语义鸿沟 (semantic gap)
GIST特征维度:960
1000
HoG特征维度:3360
1000
图像检索:相关反馈
C. T. Yu, W. S. Luk, T. Y. Cheung. A Statistical Model for Relevance Feedback in Information Retrieval. Journal of the ACM, 23(2):273-286, 1976 Yong Rui, Thomas S. Huang, Michael Ortega, and Sharad Mehrotra, Relevance Feedback: A Power Tool in Interactive Content-Based Image Retrieval, IEEE Trans. on Circuits and Systems for Video Technology , 8(5):644-655,1998
三大鸿沟(1):语义鸿沟 (semantic gap)
底层视觉特征难以反映高层语义,如何从底层特征出发,学习 高层语义?
语义鸿沟 狗 天空 树木 草地
视觉内容相似 (如颜色、纹理和形状) 高层内容各异 (如概念和对象)
三大鸿沟(1):语义鸿沟 (semantic gap)
从感知视觉数据出发,定义和提取良好特征,进行语义概念学习
发展脉络 Large scale media resources available Social media contents shifted from text to image/video Research on integrating data, users and social networks Multi-source, multi-task fusion and crossmedia
The lion (Panthera leo) is one of the four big cats in the genus Panthera and a member of the family Felidae. With some males exceeding 250 kg in weight, it is the second-largest living cat after the tiger. Wild lions currently exist in sub-Saharan Africa and in Asia (where an endangered remnant population resides in Gir Forest National Park in India) while other types of lions have disappeared from North Africa and Southwest Asia in historic times
像素特征维度 1000*1000=100万
100万个像素点
树木、森林、草地
How
颜色直方图特征维度:768
三大鸿沟(1):语义鸿沟 (semantic gap)
如何从高维异构特征中提取区别性特征, 用于进行语义 学习
Wiki中跨媒体词条 高维异构特征
视觉 全局特征
Color Texture Shape ….
异构 空间
视觉信息 听觉信息
同构 空间
三大鸿沟(2):异构鸿沟 (heterogeneous gap)
本质上是充分利用异构特征之间的丰富关联,建立媒 体间的各种相关性,实现媒体跨越。 媒体数据共生关联、网页链接关联、检索行为反馈关联
跨越 跨越 跨越
图像 音频 标签
跨越
图像 标签
网页 图像 标签
图像检索理论和方法
浙江大学计算机学院吴飞 2016年
发展脉络 Text-based to content-based image retrieval Auto to interactive search Mono media to multi-modal data
Intra-content analysis to use of external knowledge and resource
三大鸿沟(2):异构鸿沟 (heterogeneous gap)
不同类型数据相互协同起来反映高层语义,如何度 量不同类型数据之间的相似性?
三大鸿沟(2):异构鸿沟 (heterogeneous gap)
挖掘不同类型数据之间的关联,映射生成共享空间 ,在特征子空间进行异构特征的度量。
相关文档
最新文档