跨媒体分析与检索 - 首页-中国计算机学会信息网

合集下载

信息检索第4讲 选题与检索策略构建-4-课题概念分析与扩展

信息检索第4讲 选题与检索策略构建-4-课题概念分析与扩展

产品
云、网站
这些词怎么想到的,有什么规律和工具?
CopyRight@上海大学图书馆
14
概念分析-概念扩展-How
A. 同一概念扩展法
同一事物的学名、俗名、商化钠,NaCl
金针菇
冬菇,金针蘑,金钱菇,白金针菇
同一事物的简称、全称、音译和意译
简称 全称
音译 意译
www world wide web
第4讲 选题与检索策略构建
CopyRight@上海大学图书馆
4. 课题概念分析与扩展
CopyRight@上海大学图书馆
概念分析-概念提取-Why
检索过程是语词的匹配过程。汉语与英语等拼音语言不同,
无分隔。目前绝大部系统无语义检索功能,自动切分效果不 理想,实现自然语言检索还有很长的路要走。
内塔尼亚胡说的确实在理
例:我国商业银行效率结构的研究
主要概念:商业银行,效率,结构 辅助概念:我国,研究 禁用词: 的
例:关于只读光盘的研制与开发
主要概念:只读,光盘 辅助概念:研制,开发 禁用词: 关于,与
例:网络舆情监测平台研究
主要概念:网络,舆情,监测,平台 辅助概念:研究
CAD computer aided design
internet
因特网 互联网
motor
马达 电动机
laser
镭射 激光器
沪 上海
Shanghai
Euclid
欧几里得
欧几里德、欧基里得、
欧几理得、欧氏几何
CopyRight@上海大学图书馆
15
概念分析-概念扩展-How
A. 同一概念扩展法
同一事物名称的反义词

基于深度典型相关性分析的跨媒体语义检索

基于深度典型相关性分析的跨媒体语义检索

基于深度典型相关性分析的跨媒体语义检索王述;史忠植【期刊名称】《中国科学技术大学学报》【年(卷),期】2018(048)004【摘要】基于典型相关性分析的跨媒体检索是一种将不同媒体特征通过相关性分析映射到同构的最大相关子空间,并在子空间中完成跨媒体数据间的相似性比较和检索的方法.典型相关性分析(canonical correlation analysis,CCA)是一种线性模型,并不能很好地挖掘跨媒体数据中的复杂相关关系.为此针对深度典型相关性分析(deep CCA,DCCA)的结构进行改进,使用隐含狄利克雷分布(latent Dirichlet allocation,LDA)发现文本语义信息并学习语义映射,提出了跨媒体深度相关性学习模型(cross-media correlation learning with deep canonical correlation analysis,CMC-DCCA)以及跨媒体语义相关性检索方法(cross-media semantic correlation retrieval,CMSCR).在维基百科文本图像数据集上的实验证明,CMC-DCCA模型能够较好地挖掘跨媒体数据中的复杂相关关系,CMSCR在跨媒体检索中具有较好的性能.【总页数】9页(P322-330)【作者】王述;史忠植【作者单位】中国科学院计算技术研究所智能信息处理重点实验室,北京100190;中国科学院大学工程科学学院,北京100049;中国科学院计算技术研究所智能信息处理重点实验室,北京100190【正文语种】中文【中图分类】TP391【相关文献】1.基于深度学习的数字图书馆跨媒体语义检索方法研究 [J], 彭欣2.基于语义相关性与拓扑关系的跨媒体检索算法 [J], 代刚;张鸿3.基于潜语义主题加强的跨媒体检索算法 [J], 黄育;张鸿4.基于不同模态语义匹配的跨媒体检索 [J], 陈祥;于治楼5.基于Tag-rank和典型相关性分析的在线商品跨媒体检索研究 [J], 李广丽;陈婧琳;刘斌;殷依;张红斌因版权原因,仅展示原文概要,查看原文内容请购买。

信息检索与利用--课程报告范例

信息检索与利用--课程报告范例

信息检索与利用课程报告(中文部分)(参考样本)周×班,选课表序号:×,学号:××,姓名:×××拟研究题目:网络群体性事件与网络舆论监督一、题目分析:近几年来,中国的网民人数随着不断上升的网络普及率也急剧增加,截至08年底,我国的网络普及率达到22.6%,首次超过世界平均水平的21.9%,网民人数也达到了2.98亿。

而如此众多的网民人数也导致了越来越多的网络事件的发生,从比较早期的“虐猫事件”,到后来震惊中外的“铜须事件”,从轰轰烈烈的“华南虎照”到年初引起众怒的“躲猫猫”,甚至由于魔兽世界开服问题所引发的“贾君鹏事件”,如今网络舆论监督也逐渐成为焦点话题。

本课题拟了解有关网络信息、网络舆论对网络事件的监督。

二、检索策略制定:1、选择检索数据库:cnki数据资源系统(期刊库)2、检索表达式:1.网络监督信息自由 2.网络舆论监督 3.网络群体事件3、检索结果:1)进入cnki数据资源系统检索界面→点击期刊,通过关键词精确匹配进行简单检索,其结果是:网络监督命中741条;信息自由259条;网络舆论监督108条;网络群体事件31条。

2)进入cnki数据资源系统检索界面→点击期刊→条件限定(选择全部期刊,以关键词网络监督;限定年度范围:2011-2013)→点击检索→命中记录344条;若条件限定(选择核心期刊,以关键词网络监督;限定年度范围:2011-2013)→点击检索→命中记录67条。

3)进入cnki数据资源系统检索界面→点击期刊→条件限定(关键词:网络舆论监督and信息自由;年度不限)→点击检索→命中记录0条;若条件限定(关键词:网络舆论监督or信息自由;年度不限)→点击检索→命中记录10000条;若条件限定(关键词:网络舆论监督not信息自由;年度不限)→点击检索→命中记录741条。

网络监督、信息自由、网络舆论监督、网络群体事件四个关键词的组配请自己完成。

第7章 跨语言信息检索技术

第7章 跨语言信息检索技术
混合方法是综合利用上面各种技术的优缺点以期望获 得更佳的检索效果。此种方法中应用最广泛的资源组合是 将双语字典和一些单语资源,例如单语体本WordNet、单 语语料库等结合,利用字典进行翻译知识的抽取,利用单 语资源进行翻译消歧。
机读字典 三者单独作用均能够达 到单语言检索的90% 统计字典 单语言检索
原因三
多数商用的机器翻译系统只返 回一个最优翻译结果,不提供 可供选择的翻译列表。
3)基于语料库的查询翻译方法
基于平行语料库的方法
平行语料库依据对其程度又可分为篇章对齐、段落对 齐、句子对齐和词对齐,一般来说对齐的粒度越小, 对齐的精度越高,查询翻译效果就越好。
基于可比语料库的方法
使用可比语料库最著名的方法就是相似性叙词表。有 学者利用一个瑞典语新闻语料库和英语新闻语料库, 构建双语可比语料库,从中提取出双语的相似性主题 词表信息并且用于查询翻译中。试验结果显示此种方 法所获得的检索性能是单语言信息检索性能的一半左 右。
模型一
共现模型(Co-occurence Model)
模型二
名词短语翻译模型(Noun Phrase Translation Model)
模型三
依存翻译模型(Dependency Translation Model)
模型一 模型二 模型三
共现模型(Co-occurence Model) 名词短语翻译模型(Noun Phrase Translation Model) 依存翻译模型(Dependency Translation Model)
受控词汇检索的 不足之处
用受控词汇表中的检索词来标识每一篇文档 第一点 通常是手工完成的,其使用范围受到很大的 局限。
培训用户学会有效地使用受控词汇来构建查 询条件是一件非常困难的工作。

计算机信息检索的策略和方法

计算机信息检索的策略和方法

计算机信息检索的方法与策略1. 计算机信息检索过程中的相关概念(1)数据库:数据库是“至少由一个文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合”。

通俗地说,数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。

数据库是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源,也是信息检索的重要资料来源。

根据载体的不同,数据库可分为:联机数据库(online-database),光盘数据库(CD-ROM-database)和网络数据库(networked-database)三种。

(2)检索界面:指在进行计算机检索时,检索者与计算机交互对话的界面。

(3)检索方式:以检索过程的繁简程度或从何入手来区分的不同检索过程。

在数据库中往往设有初级检索/简单检索/基本检索(单途径检索);高级检索(多途径组合检索);专业检索(构造检索式);按类检索;按刊检索(刊物查询、刊名导航),篇目检索/论文查询;引文检索等方式供选择。

(4)检索途径:又叫检索入口、检索项,也有的数据库称之为检索字段。

指输入的检索条件所查询的数据区域。

不同数据库所设的途径并不相同。

一般都设有篇名、作者、关键词、全文等途径。

(5)检索词:检索词是检索者给出的字、词、字符或短语,用于查找含有它(它们)的记录。

(6)排序:指检索结果输出时的排列顺序。

输出结果按相关度排序时,则检索结果按检索词在检索字段中发现的频度由高到低依次排列。

无相关度时,输出结果则按文献的出版日期逆序排列或随机排列。

(7)二次检索:指在前一次检索结果的基础上,进一步限定检索条件所进行的再次检索。

二次检索可以多次使用,逐步缩小检索范围。

(8)限制条件:在检索对象的时间、文献类型、语种、同义词等方面做限制,与检索途径配合使用,以精化检索结果。

(9)检索词匹配:指输入的检索词在数据库的可检索字段值中的位置关系。

一般表示为前方一致、后方一致、完全一致(精确匹配)、任意一致(模糊匹配)等。

智能跨媒体信息搜索与分析

智能跨媒体信息搜索与分析

智能跨媒体信息搜索与分析第一章:引言随着信息技术的快速发展和普及,大量的跨媒体信息被不断生产和传播,如何高效准确地搜索和分析这些信息,成为了智能信息检索与分析领域研究的热点之一。

智能跨媒体信息搜索与分析是指通过计算机技术对不同媒体格式的信息(如文本、图像、视频、音频等)进行跨媒体检索与分析,以提供更加智能化、个性化的搜索服务,解决用户在不同场景下获取信息的需求。

本文将从技术、应用、发展动态等方面对智能跨媒体信息搜索与分析进行深入分析。

第二章:技术基础智能跨媒体信息搜索与分析的实现依赖于多种技术,包括自然语言处理、机器学习、图像识别、声音识别、大数据分析等。

其中,自然语言处理技术是智能跨媒体信息搜索与分析的核心之一。

自然语言处理技术可以对人类语言进行识别、解析、生成和理解,从而实现文本信息的自动分类、摘要、翻译和重点提取等。

在图像识别方面,计算机可以通过训练神经网络,对图像进行识别和分类。

在声音识别方面,计算机可以通过语音辨识技术对不同语言进行识别和转换。

大数据分析技术则能够帮助计算机处理各种媒体格式的数据并进行分析,提供更准确、可靠的搜索结果。

第三章:应用场景智能跨媒体信息搜索与分析技术的应用场景十分广泛。

一方面,它可以帮助个人在日常生活中快速获取信息,如通过语音识别技术获取天气信息、交通信息等;通过图像识别技术快速查询菜单;通过自然语言处理技术搜索新闻信息等。

另一方面,企业可通过智能跨媒体信息搜索与分析技术分析市场数据、舆情数据等,帮助企业做出更准确的决策。

在医疗领域,智能跨媒体信息搜索与分析技术可用于帮助医生诊断和治疗疾病。

第四章:国内外发展动态目前,全球范围内的搜索引擎公司都在积极探索采用智能跨媒体信息搜索与分析技术提供更加人性化、个性化的服务。

如谷歌在2015年推出的Google Now能够根据用户的搜索习惯、定位等信息,提供个性化信息服务。

另外,国内的搜索引擎公司,例如百度、搜狗、360搜索等,也在不断加大在智能跨媒体信息搜索与分析技术研究和实践上的投入。

信息检索与分析第3-5章

信息检索与分析第3-5章

4.查找数值、公式、规格、条例、专业知识
• 查考数值、公式、规格、条例、专业知识的数据库主要有: • 1)中国科学数据库(http:// /) 由中国科学院创建。内容涵盖了多种学科,提供了大量具有重要 科学价值和实用意义的科学数据和资料。 • 2)贝尔斯坦/盖墨林化学数据库Beilstein/Gemlin Cross Fire • 3)物质的物理化学参数数据库 (/CUU/Constants/index. html)。 • 4)化学元素周期表(/chemistry/webelements/) 查找此类信息的印刷本参考工具书宜采用手册、表册。手册也有叫 “指南”、“便览”、“须知”、“大全”;包括综合性《读者百科 词典》、《世界知识手册》等和专科性《农业技术实用手册》、《世 界经济手册》等。此外,还有表册,如《常用数学公式大全》、《电 子学数据表与公式手册》。
• • • • • • 1.分类查询 2.关键词查询 3.多次查找 4.按照地域查询 5.查询最新信息 6.其它搜索技巧
1.Google高级检索技巧
• 1)短语检索 • 2)字段限定检索 (1) 限定网站 【实例】输入“金庸 site:”搜索中文教育科研网站() 上所有包含“金庸”的页面。 (2) 限定网页 【实例】输入“inurl:midi 沧海一声笑”查找MIDI曲“沧海一声 笑”。
(3)使用字段限定
• ① intitle title是网页的标题, intitle: A指所有搜索结果的title中都要包含“关键词A”。 • ② site site是限定在某类站点或某个网站内搜索。 例如“论坛搜索引擎 site: ”,是在sowang这个网站内搜索 “论坛搜索引擎”的网页。 • ③ filetype filetype是限定文件类型。 用法是“关键词A filetype:文件格式后缀名”。 如“个人年终总结 filetype:doc”,搜索结果全都是word文件的个人年 终总结。 • ④ inurl url就是地址栏里的域名等。 inurl常见的使用方式是“关键词A inurl:英文字符B”。 例如“搜索引擎 inurl:ssyq ”,是检索在url中含有ssyq的网页中关于 “搜索引擎”的信息。

westlaw 使用说明

westlaw 使用说明
主体部分包括两个板块先简要介绍了westlaw常用的5种检索方法再针对用户最常检索的几种资料包括法学期刊文章成文法判例法律新闻和词典用具体的检索实例讲述如何利用westlaw迅速准确的进行检索并对结果进行有效分析利用
Westlaw 用户使用手册
关于该使用手册
该使用手册是根据中国大陆地区 Westlaw 用户的检索需求和习惯制作的。主体部分包括两个板块,先简要介绍了 Westlaw 常用的 5 种检索方法,再针对用户最常检索的几种资料,包括法学期刊文章,成文法,判例,法律新闻和词典, 用具体的检索实例讲述如何利用 Westlaw 迅速准确的进行检索,并对结果进行有效分析利用。结尾的附录部分还精心 整理了 60 多个推荐数据库,建议用户使用。
常用资料检索详述 ......................................................................................................................27
期刊文章检索 ........................................................................................................................................................ 27 成文法检索............................................................................................................................................................ 29 判例检索 ............................................................................................................................................................... 31 新闻检索 ............................................................................................................................................................... 33 使用布莱克法律词典 ............................................................................................................................................. 35
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

根据媒体之间存在的各种联系,从一种媒体跨越到 互信息之间也存在广泛与深层的交叉关联。
另一种媒体。
这些交叉关联使得互联网数据呈现跨媒体特
尤为重要的是,互联网信息存在着广泛且错综 性,即互联网上的网页文字、多媒体数据和用户交 复杂的四种交叉关联[1]:(1)互联网网页之间的 互信息之间存在着或强或弱的内容跨越和语义关联
音调
语音 跨
语义
视频目录 对象 场景


实现被检索资源的综合、归纳和过滤 以及有助于个性化搜索。
人脑认知的跨媒体特性
语义联系
语义联系
语义
语义联系
视频 图形
语义
现代认知科学的相关研究表明, 人对外界的感知呈现出跨媒体特性[4], 即人对外界事物的了解,是通过视
图像
视觉特征 人脸 事件
文本
人名 地名 动词 主题 段落
其次,跨媒体检索要支持同构多媒体数据在语 义上的跨越。所谓同构多媒体数据,即指相同类型 的多媒体数据,如两幅图像互为同构多媒体数据。 由于不同概念之间有着复杂的关联,相应地,虽然 同构多媒体数据表达方式一致,但 是它们所蕴含的
语义联系却错综复杂。如何挖掘同构多媒体数据之 间的语义关联信息是跨媒体研究的又一重要内容。 以不同的文本数据对象为例,它们虽然表达形式一 致,但是所蕴含的语义关联却有可能是相反、相 近、相同或者其它。跨媒体研究就是要根据同构多 媒体数据在特征空间内错综复杂的分布找到它们之 间的潜在的语义关联,从而完成语义的跨越。比如 仅仅在文本的特征空间,“稻谷”和“午饭”这两 个文本对象所描述的内容属于不同概念,而在语义 层面,二者却有明显的关联。跨媒体研究则要根据 全体文本对象在特征空间的分布,挖掘出同构多媒 体数据之间这种固有的语义关联,从而方便对这些 多媒体数据的检索和利用。
不但可以丰富计算机的服务,更是计算机功能的一 标注训练数据集上学习得到所标注对象与文本数据
种延伸。
的共生模型,进而计算语义关键字在未标注数据中
出现的概率,先后出现了Co-occurrence、Translation
从多媒体检索到跨媒体检索
和ALIP等方法。与语义标注中所处理对象是相对闭 合集合不同,图像语义标注的研究重点转向了互联
频、3D模型和动画等多媒体资源出现了如下新特 息之间的交叉关联:基于社会化计算Web2.0的应
点(如图1):(1)多种类型媒体数据混合并存; 用产生了用户提供的大量标注、评价和日志等隐性
(2)媒体数据组织结构复杂;(3)不同类型媒体 和显性交互信息,这些交互信息存在复杂关联;
数据从不同侧面表达同一语义;(4)检索中需要 (4)互联网网页、不同类型多媒体数据和用户交
从图像和音频等媒体数据中提取出来的视觉和 听觉等特征量纲不同,存在异构性。要实现“跨 媒体检索”,需要解决如何度量异构特征相似性 问题。
最近,一些研究通过典型相关性分析(Canonical Correlation Analysis,CCA)挖掘异构数据在特征 上潜在的统计关系,从而生成包含了不同类型数 据的同构子空间实现异构数据相似性度量,并在 特征降维后能最大程度地保持原始异构数据的相 关性。
大量不同类型的媒体信息可被便捷利用;计算机网 反馈机制。相关反馈技术分为基于机器学习、反馈
络技术和数据库技术的发展,则可使人们更加方便 定制、用户驱动、基于概率模型和基于图像区域等
地传输和管理这些多媒体资源;人工智能技术的进 几类。基于机器学习的相关反馈是研究热点,是为
步,则为跨媒体智能化提供了坚实技术保障。近年 了解决用户在相关反馈过程中标注为“正样本”和
术的发展 ,除了视觉和听觉信息外,未来计算机 然存在“语义鸿沟”。
的输入输出可以扩展到触觉、味觉等更多感知类
互联网上多媒体数据存在大量伴随文本以及用
型,届时计算机跨媒体系统含义将更加丰富。由于 户标注信息,从中提取能反映多媒体数据语义的精
符合人类感知和思维系统的工作过程,跨媒体研究 确标注单词成为近年来研究热点。基本思路是从已
首先,跨媒体检索要支持检索过程中在数据 类型上的跨越。这里所谓异构多媒体数据,即指不 同类型的多媒体数据,如图像与音频数据就互为异 构多媒体数据。如给定一副图像、一则文本和一段 音频数据,虽然它们对信息的表现形式各异,底层 特征也不同。但是,异构多媒体数据却可以在语义 层面统一起来:如老虎的图像、老虎习性的描述性 文字和老虎吼叫的音频数据虽然表达形式各异,却 在语义层面共同表达了老虎这一概念。传统的单一 媒体相关技术忽略了异构多媒体数据在语义上的共 性,因此不能有效处理异构多媒体数据共存的复杂 多媒体数据,也无法有效跨越语义鸿沟。作为单一 媒体技术在理论和功能上的延伸,跨媒体技术将异 构多媒体数据统一理解分析;图像、文本、音频、 视频等异构多媒体数据在语义层面的共性得以彰显 利用,这不但更符合人类的思维方式,而且也便于 对异构多媒体数据的统一管理,以方便用户对其使 用与信息的传递。
音频 动画
觉、听觉、触觉、味觉等多种感觉器 官获得并形成认识的。后续研究表 明,人脑生理组织结构决定了其对外 界事物的认知过程是通过对多种感知 信息进行融合理解后完成的,同时提
图1 海量资源中心跨媒体数据表现形式
供听觉和视觉信息的大脑会产生更明
23
专题
第 7 卷 第 2 期 2011 年 2 月
为了解决早期基于文本的多媒体检索费时费 网大规模图像标注、标注不一致以及标注扩展等问
力、主观差异性大的问题,20世纪90年代提出了基 题:研究认为互联网本身就是良好的图像标注训练
于内容的多媒体检索方法,其基本思路是通过视 集,可结合关键词检索和图像样例检索,对检索结
觉、听觉或者几何特征以及例子来计算被检索对象 果的伴随文本进行主题聚类,最终得到图像标注单 和用户查询之间的相似度[2, 7]。可以说,基于内容的 词。另外,与对整幅图像进行文本标注不同,实现
也有一些观点认为,许多类型数据的分布并 不是线性的,而是非线性的流形结构。基于这个理 论,国内外研究者提出了多种流形学习的方法[6]。同 时,多媒体数据中局部特征提取也成为众多学者关 注热点问题。受自然语言理解中通过“词袋”(Bag of Words)表示文档的启发,“视觉单词(visual words)”以及“视觉文法(Visual Grammar)”被 提出来表达图像和视频数据。该方法一般对图像和 视频等提取SFIT(Scale-invariant feature transform) 局部特征,将其量化或聚类后的结果作为视觉单 词,以反映离散数据点之间存在的关联。随着计算 机视觉领域中图像分割技术取得的较大进展,对图 像中的对象进行识别,构建视觉单词和视觉文法, 实现图像解译也成为一类主流研究,出现了能较好 实现对象、场景和图像之间复杂关系建模的随机文 法以及强于数据推理的条件随机场方法。
数据
……
用户
关联
社会网络
个性化
……
检索行为 查询 点击 浏览 标注 评价
道。另一方面,计算机软硬件相关技 术的发展是跨媒体研究的基础,又 图2 网络资源、用户和检索行为之间的关联示意图
直接促成了跨媒体研究进一步深入:各种多媒体数
在检索过程中为了克服“语义鸿沟”,在底层
据采集设备、交互设备、海量存储设备出现,使得 特征空间和高层语义空间之间建立映射关系和相关
传统的单一类型搜索引擎利用互联网文档所包 含的文本信息和链接属性来检索相关网页,通过多 媒体视听觉底层特征和样例,以及相关反馈技术实 现基于内容的多媒体检索。这些方法忽略了媒体之 间存在的关联特性,难以实现不同类型媒体数据的 统一检索。为了满足人们对这些多媒体数据检索的 需求,需要研究一种新的检索方法,使可以检索到 相似主题、不同类型的多媒体对象。例如提交一幅 小鸟的图像,除了可检索到各种相似的鸟类图像, 还可以检索到鸟儿动听的叫声。这种新的检索方式 能够处理和查询不同类型的多媒体数据,极大地扩 展了人们获取多媒体信息的途径和范围。这类“跨 媒体检索”手段需要达到如下要求 : [10]
最后,跨媒体检索也要支持异构多媒体数据 在语义上的跨越。对异构多媒体数据在语义上的跨 越,目的是找到异构多媒体数据之间错综复杂的语 义关联,这是对前面所述两项研究的综合。比如老 虎的叫声和灰狼的图像,它们既不是同一类多媒体 数据(二者类型分别属于 音频和图像),表达的语 义也不相同(二者语义分别属于老虎和灰狼)。但 是考虑到老虎和灰狼同属食肉动物,这两个多媒体 数据之间又有一定的语义关联。这种异构多媒体数 据的语义关联挖掘,传统的单媒体研究并没有涉 及。因此这一研究内容是跨媒体研究对传统单一媒 体研究的进一步延伸和拓展。
多媒体检索的内容在提出时指的是“底层特征(如 图像和 视频中对象、人物和地名等实体信息标注也
视觉或听觉等特征)”或“检索样例”,而非语义 是极有意义的研究方向,如美国卡耐基梅隆大学的
内容。
人脸标注“Name It”研究[5]。应该承认,由于“一
24
第 7 卷 第 2 期 2011 年 2 月
幅画胜过千言字”,实现多媒体数据所蕴含丰富语 义的精确标注,仍然面临巨大挑战。
为了反映跨媒体数据中存在的交叉关联等复杂 关系,矩阵、张量和图等形式下数据结构被使用[8],
由于其能描述复杂对象各组成部分之间的拓扑结 构,并能阐明关于表示的假设,使得计算效率被 有效提高而成为研究热点,如何实现矩阵、张量和 图等复杂结构处理是实现跨媒体理解要解决的关键 问题。
第 7 卷 第 2 期 2011 年 2 月
跨媒体分析与检索
关键词:跨媒体 搜索引擎 语义标注 海量信息
吴 飞 杨 易 庄越挺 浙江大学
引言
图像、音频和视频等不同类型多媒体数据以及其包 含前景/背景、音乐/语音和镜头/关键帧等结构化对
互联网中所包含的网页文字、图像、音频、视 象之间的交叉关联;(3)用户检索过程中交互信
交叉关联:网页之内或者网页之间所包含的链接、 (如图2)。
相关文档
最新文档