多媒体数据基于内容检索综述
基于内容的视频检索关键技术探究

第1 7期
基于 内容的视频检索关键技术探究
柴旭 清 ’ 崔 红志 吕 佳 。 (. 1河南师 范大 学 网络 中心 河 南 新 乡 4 3 0 2新 乡学 院 河 南 5 0 7;. 3新 乡医学 院 图书馆 河南 新 乡 4 3 0 ) 。 5 0 3 新乡 4 07 ; 3 0 0
输
出 结 果
如下
AF t ID(= )
二
 ̄ s(, , ,x , 1 b(x Yc f ,t ) f ) (y 一 )
图 1 基 于 内容 的 视 频检 索
如上 图所 示 , 先 要构 造 视 频 结 构 , 视 频 序 列 分 割 为 镜 头 , 在 首 将 并 镜 头 内选 择 关 键 帧 . 是实 现 一 个 高 效 的 基 于 内 容 的 视 频 检 索 系 统 的 这 基 础 和关 键 。然 后 提取 镜 头 的特 征 以 及 关 键 帧 的 视 觉 特 征 , 为 一 种 作 检 索机 制 存 人 视 频 数据 库 。 后 根 据 用 户 提 交 的 查 询按 照 一 定 的特 征 最 进 行视 频 检 索 。 检 索 结果 按 相 似 程 度 提 交 给 用 户 。特 征 的 提 取 和 检 将 索算 法 的优 劣 决 定 了整 个 检索 系 统 的 效 率 和 性 能 。
对 于 运 动 较 多 的镜 头 . 一 两 个 关 键 帧 又无 法充 分 描述 。 有人 依 据 帧 用
1 基 于 内容 的视 频 检 索 技 术综 述
序 列 间 的 显 著 变化 来 选 取 多 个 关 键 帧 。 们 计算 前 一 个 关 键 帧 与 剩余 他 帧之间的差值 , 如果 差 值 大 于 某 一 个 阈值 则 再选 取 一个 关 键 帧 。这 种
基于模式识别的视频内容分析技术综述

基于模式识别的视频内容分析技术综述随着互联网和数码媒体的快速发展,视频资源的数量和规模不断增长。
然而,由于视频数据本身的多样性和复杂性,直接利用人力进行视频内容分析变得困难且低效。
因此,基于模式识别的视频内容分析技术应运而生,其通过利用计算机视觉、模式识别和机器学习等相关领域的方法与技术,实现对视频内容的自动分析与理解。
本文将对基于模式识别的视频内容分析技术进行综述,探讨其应用领域、关键技术以及挑战与未来发展方向。
一、视频内容分析的应用领域基于模式识别的视频内容分析技术已广泛应用于各个领域,包括视频监控、视频搜索与检索、视频目标识别与跟踪、视频内容理解与解释等。
其中,视频监控是最早应用该技术的领域之一。
通过使用模式识别算法,可以实现对监控视频中的异常情况、目标物体和行为的检测与分析。
视频搜索与检索则是基于视频内容的相关性进行检索,利用模式识别技术将视频内容与用户查询进行匹配,提供相关的搜索结果。
视频目标识别与跟踪则是利用模式识别技术对视频中的目标物体进行检测、识别与跟踪,常用于智能交通、视频安防等领域。
此外,视频内容理解与解释是基于模式识别的视频分析的一个重要研究方向,旨在实现对视频内容的高层次理解与解释,如视频语义理解、情感分析等。
二、视频内容分析的关键技术基于模式识别的视频内容分析技术的核心是计算机视觉、模式识别和机器学习等相关领域的技术,下面将介绍其中的一些关键技术。
1. 视频特征提取与表示视频特征提取是视频内容分析的首要任务,通过将视频的低层次视觉特征转换为高层次的语义特征,实现对视频内容的理解。
常用的视频特征包括颜色特征、纹理特征、形状特征等。
视频特征的表示方式有多种,如Bag of Visual Words模型、时空金字塔模型等。
2. 视频目标检测与识别视频目标检测与识别是视频内容分析的重要任务,其目标是检测和识别视频中的目标物体。
常用的方法包括基于深度学习的目标检测方法,如Faster R-CNN、SSD等。
我国云计算在图书馆领域应用研究成果综述——基于CNKI的计量分析

我国云计算在图书馆领域应用硏究成果综述**本文系天津社会科学院青年课题“地方社科院图书馆新型智库建设分析”(项目编号:20YQN-08)研究成果之一。
基于CNKI 的计量分析柏艺莹(天津社会科学院图书馆,天津300191)[摘要]大数据时代,图书馆数字化资源建设是图书馆长期发展的需求。
云计算新兴技术的 应用,是现代数字化资源建设的重要推动力。
以我国有关云计算在图书馆领域应用的研究成果 为对象,利用文献计量学的方法,从文献总体特征、作者合著现象、高频关键词耦合现象3个方面 进行计量分析,以期揭示我国云计算技术在图书馆领域应用研究成果的现状、焦点以及未来发展 方向。
[关键词]云计算数字图书馆计量分析[分类号JG252.8大型计算机于20世纪80年代一次巨大变革 后,客户端-服务器服务形式也同时岀现,云计算 技术产生是对于信息技术软件领域又一次重大的 创新。
大数据时代,云计算的应用激发出信息技 术的创新与革命,并对计算机、传媒、通信等现有 网络格局产生深刻影响。
图书馆作为满足公众知 识信息资源获取的重要平台,实现图书馆数字化 信息管理以及完善图书馆服务功能,是云计算进 入图书馆领域的价值体现。
目前,学术界对云计 算并没有确切而完整的定义,结合云计算的功能特征,笔者在此处借鉴美国国家标准与技术研究 院(NIST )定义:云计算是一种按使用量付费的模 式,这种模式提供可用、便捷、按需的网络访问资 源,进入可配置的计算资源共享池(资源包括网 络、服务器、存储、应用软件及服务),这些资源能 够被快速提供,只需投入很少的管理工作或与服 务供应商进行很少的交互叭云计算应用于图书 馆服务过程中,对图书馆服务模式产生较大影 响戮相关主题领域研究成果较为丰富,并且有学 者开展持续性研究,而大数据环境驱动下,云计算 在图书馆领域的应用研究成为了学术界关注的焦 点之一。
因此,借助文献计量学分析方法对其研 究现状进行探究,具有重要的理论意义和实际价 值。
基于内容的图像检索技术概述

色 量 化 方 法 并 在此 基 础上 提 出 了 一 种基 于 颜 色 一 空 间 特 征 的 检 索 方法 。 文献【】 出一种通过提取颜 色特征 、 7中提 灰度特征 , 获取 图像物 体 的形状 和空间特征 , 使检索结果 不受 图像大小 、 旋转和轻微的光 照变 化 的 影 响 , 显 改 善 了检 索 结 果 。 明 () 2颜色相关 图。 颜色相 关图是用颜色对相对于距 离的分布来 描述信 息 , 不但 刻画了某 一种颜 色的像 素数量 占整个图像的 比例 , 还反映 了像素对的空间相 关性 , 以及局部像素分布和总体像素分布 的相 关 性 , 且 特 征 范 围小 , 果 好 , 点 是 计 算量 太 大 。 并 效 缺 () 3颜色矩 。 色矩  ̄Sr k r rn o 颜 tti e和O e g 所提 出, 颜色直方 图 c 在 的基础上计算 出每个颜色通 的均值 、 方差 、 偏差 , 来替代颜色的分布 表示颜色特征 , 需对 特征进行量化 , 理简单 。 无 处
形 状 图像检 索技 术 的 主要 方 法 , 论 了性 能 评 价 方 法 , 指 出 了应 用方 向 。 讨 并 关键 词 : B R 颜 色 纹理 形状 性 能评价 方 法 C I
.
中 图分 类号 : P 9 .1 文 献 标 识 码 : T31 4 A
文章 编号 :0 79 1(0 20 - 190 10 —4 62 1) 1 5 -2 0Leabharlann 22纹理 特征 检 索 .
纹 理 是 图像 中一 个 重 要 而 又难 以描 述 的特 性 , 习惯 上 将 图像 在 局 部 区域 内呈 现 不 规 则 性 , 而在 整 体 上 却 表 现 出某 种 规 律 性 的 特 性 称为纹理 。 描述 纹理特征 的术语有粗糙度 、 比度 、 对 方向性 、 线性度 、 规 则 度 、 略 度 ) 。 述 纹 理 特 征 的 方 法 有 统 计 法 、 型 法 、 析 粗 等 描 模 分 法、 频谱法 。 () 1统计法 。 用于分析像 木纹、 沙地 、 草坪 等细致而不规则 的物 体 , 图像有 关纹理 属性的统计分析出发 , 从 根据纹理 的空间灰度 级 相关性 , 构造出一个基于图像像素间方向和距离的共生矩 阵, 并提 取 出特 征 与 参 数 间 的 关 系 。 () 2结构法 。 用于分析像 布料的 印刷 图案 或砖瓦等排列 比较 规 则的图案, 找出纹理基元 , 去探求纹理 构成 的结构规律 , 根据纹理基 元及其排列 规则来描述特 征与参数间的关系 。 () 3模型法 。 用一些 成熟的 图像模型 来描 述纹理 , I r o 模  ̄ Mak v 型 、 rca模 型 、 尔 科 夫 随 便 机 场 、 回 归模 型 等 , 过 少 量 的参 F atl 马 子 通 数来描述纹 理特征 。 () 4频谱法 。 主要借 助于频率特性来描述纹理 ,H a o变换 、 ?G b r  ̄ 小 波变换法 , 但是计算速度慢。 纹理特 征检索 的具 体过程 是先提取 纹 理特征 , 据特征对图像进行分割和分类 , 户一旦选中相近的纹 依 用 理形式 , 系统则要求用户适 当调整纹理 特征 , 如对 比度 “ 再暗一些 ” , 从 而 返 回 更 精 确 的检 索 结 果 。
基于语义的视频检索关键技术综述

El cr n c S i e to i c.& Te h /Aug 5. 2 2 c. .1 01
基 于 语 义 的 视 频检 索 关键 技 术综 述
孔英会 ,刘淑荣 ,张少 明,范启跃
( 华北 电力 大学 电气 与电子工程学 院,河北 保定
随着 多媒体 视频数 据在 捕获 、 存储 、 传播 方 面取 得 的重 大技 术进 步 , 人们 可 以方便 快 捷 地 获得 大 量 的数 字视 频 , 且 出现 新 的视频 应 用 。如 何 从 网络 数 据 资 并 源 中 , 现对含 有 丰 富时 空 信 息 的视 频 数 据检 索 成 为 实
ge . is
K e wo d s ma t a ; sma tcvd o r tiv l lw-e e e t rs; h g ・e e e n i o c p y rs e n i g s ih lv ls ma t c n e t c
摘 要
0 10 ) 70 3
随 着 大 量 视 频 的 出现 ,视 频 内容 检 索是 当今 多媒 体 应 用 的一 个重 要 研 究 方 向 。 现 有 的 视 频 检 索 技 术 多是
基 于低 层 特 征 ,这 些低 层特 征 与 高层 语 义概 念 相 差 较 多 ,严 重 影 响 了视 频 内容 检 索 系统 的 实 用 性 。 由 于低 层 特 征 和 高
t e a y t m. Th a ewe n lw—e e e tr sa d h g e n isi i iutt arw , S o t xr c e i r v ls se e g p b t e o lv lf aue n ih s ma t s df c l o n ro c f O h w o e ta ts —
数据挖掘中的软计算方法及应用综述-最新范文

数据挖掘中的软计算方法及应用综述1在过去的数十年中,随着计算机软件和硬件的发展,我们产生和收集数据的能力已经迅速提高。
许多领域的大量数据集中或分布的存储在数据库中[1][2],这些领域包括商业、金融投资业、生产制造业、医疗卫生、科学研究,以及全球信息系统的万维网。
数据存储量的增长速度是惊人的。
大量的、未加工的数据很难直接产生效益。
这些数据的真正价值在于从中找出有用的信息以供决策支持。
在许多领域,数据分析都采用传统的手工处理方法。
一些分析软件在统计技术的帮助下可将数据汇总,并生成报表。
随着数据量和多维数据的进一步增加,高达109的数据库和103的多维数据库已越来越普遍。
没有强有力的工具,理解它们已经远远超出了人的能力。
所有这些显示我们需要智能的数据分析工具,从大量的数据中发现有用的知识。
数据挖掘技术应运而生。
数据挖掘就是指从数据库中发现知识的过程。
包括存储和处理数据,选择处理大量数据集的算法、解释结果、使结果可视化。
整个过程中支持人机交互的模式[3]。
数据挖掘从许多交叉学科中得到发展,并有很好的前景。
这些学科包括数据库技术、机器学习、人工智能、模式识别、统计学、模糊推理、专家系统、数据可视化、空间数据分析和高性能计算等。
数据挖掘综合以上领域的理论、算法和方法,已成功应用在超市、金融、银行[4]、生产企业[5]和电信,并有很好的表现。
软计算是能够处理现实环境中一种或多种复杂信息的方法集合。
软计算的指导原则是开发利用那些不精确性、不确定性和部分真实数据的容忍技术,以获得易处理、鲁棒性好、低求解成本和更好地与实际融合的性能。
通常,软计算试图寻找对精确的或不精确表述问题的近似解[6]。
它是创建计算智能系统的有效工具。
软计算包括模糊集、神经网络、遗传算法和粗集理论。
2数据挖掘中的软计算方法目前,已有多种软计算方法被应用于数据挖掘系统中,来处理一些具有挑战性的问题。
软计算方法主要包括模糊逻辑、神经网络、遗传算法和粗糙集等。
搜索引擎技术、现状、以及未来发展趋势的文献综述(可编辑优质文档)

搜索引擎技术、现状、以及未来发展趋势的文献综述(可编辑优质文档)(可以直接使用,可编辑完整版资料,欢迎下载)搜索引擎技术、现状、以及未来发展趋势的文献综述[摘要]随着最近10年中国互联网的快速发展,互联网已经彻底改变了人们的生活方式,而在互联网的发展过程中,搜索引擎发挥了巨大的推动作用。
本文对搜索引擎的发展历史,采用的技术,发展现状,出现的问题以及未来发展方向进行了综述,让读者对搜索引擎有个宏观的了解。
[关键词]搜索引擎,汉语分词,调查报告[正文]一、搜索引擎概述搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。
从使用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。
二、搜索引擎的重要发展历程1. 1990年,Montreal的McGill University三名学生(Alan Emtage、Peter Deutsch、Bill Wheelan)发明Archie(Archie FAQ),成为所有搜索引擎的祖先。
2. 1993年,MIT Matthew Gray的World wide Web Wanderer,是世界上第一个Spider 程序。
3.1994年4月,杨致远和David Filo共同创办了Yahoo!。
4.1995年,一种新的搜索引擎形式出现了——元搜索引擎(Meta Search Engine),即Washington大学硕士生 Eric Selberg 和 Oren Etzioni 发明的 Metacrawler。
5.1996年8月,sohu公司成立。
6.1998年,Google成立。
7. 2000年1月,两位北大校友,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士后)在北京中关村创立了百度(Baidu)公司。
社交媒体虚假信息检测研究综述

社交媒体虚假信息检测研究综述目录一、内容概述 (2)1. 研究背景 (3)2. 研究意义 (4)3. 文献综述目的与结构 (5)二、社交媒体虚假信息检测方法 (7)1. 基于内容的检测方法 (9)1.1 文本特征提取 (10)1.2 模型构建与优化 (11)2. 基于社交网络结构的检测方法 (12)2.1 社交网络分析 (13)2.2 网络拓扑特征提取 (14)3. 基于机器学习的检测方法 (16)3.1 传统机器学习算法 (17)3.2 深度学习算法 (18)4. 综合多种方法的混合检测方法 (20)三、社交媒体虚假信息检测技术进展 (21)1. 信息抽取与实体识别技术 (23)2. 情感分析与观点挖掘技术 (24)3. 图像识别与视频分析技术 (25)4. 多模态信息融合技术 (26)四、评估指标与评价方法 (28)1. 准确率 (29)2. 召回率 (30)五、案例分析 (31)1. 案例选择与数据来源 (32)2. 实验设计与方法 (33)3. 检测结果与分析 (34)4. 对比与讨论 (35)六、未来研究方向与挑战 (36)1. 提高检测准确性 (38)2. 降低计算复杂度 (39)3. 跨语言与跨平台检测 (40)4. 隐私保护与伦理问题 (41)七、结论 (43)1. 研究成果总结 (44)2. 现有研究的不足 (45)3. 对未来研究的展望 (46)一、内容概述随着互联网和社交媒体的普及,信息传播速度日益加快,其中虚假信息的传播也愈发严重。
为了应对这一挑战,社交媒体虚假信息检测研究成为了学术界和工业界共同关注的焦点。
本文将对近年来社交媒体虚假信息检测的研究进行综述,以期为相关领域的研究提供参考。
基于统计方法的虚假信息检测。
这类方法主要利用机器学习和数据挖掘技术对文本、图片、视频等多模态数据进行特征提取和模型训练,以实现虚假信息的自动识别。
基于词袋模型的文本分类方法、基于卷积神经网络的图像识别方法等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
£ \/
第4期(总第76期) №1(Serial№76) 情报探索 Information Research 2000年1 2月
Dec.2000
多媒体数据基于内容检索综述 黄 蕾 (南开大学国际商学院图书馆学系 天津300071) 摘要试对多媒体数据基于内容检索的概念、特点、类型、系统结构、检索过程、实际应用 厦有待研 究的关键技术等方面进行综合论述
和字符型为主。而在多媒体数据库中集成图像、视频、 音频等非格式化信息,它们具有数据量太、信息不定 长、结构复杂等特点 每一种媒体数据都有一些难“用 字符和数字符号描述的内容线索.如图像中某一对象 的形状、颜色和纹理,视频中的运动,声音的音调等。当 用户要利用这些线索对数据进行检索时,首先要将其 人工转化为文本或关键词形式 这种转换带有一定的 主观性,且极其费时 因而仅仅基于关键诃的检索已不 能满足用户的检索要求。数据库及其它信息系统不仅 要艟对图像、视频和声音等媒体进行存储以及基于关 键字的检索,而且要耐多媒体数据内容进行自动语义 分析、表达和检索。基于内容的检索正是这样一种应运 而生的多媒体数据库检索方法= 1暮于内窖检索的概念 基于内容的检索(CBR,即Content Based Re trievaD是多媒体数据库信息检索中的一门新兴的技 术。它是指从多媒体数据中直接提取出对象的语义、特 征(如图像的颜色、纹理、形状.视频中的镜头、场景、镜 头的运动,声音的音色、音调、响度等),然后根据这些 线索从大量存储在数据库中的媒体进行查找,检索出 具有相似特性的媒体数据来 CBR能从大型分布数据 库(索)中、以用户可以接受的响应时间,查询到所要求 的信息。它不需要理解或识别媒体中的对象,所关注的 是基于内容.并快速地发现信息。 2基于内窖检索的特点 (1) 综合性学科为基础:基于内容检索属于多媒 体韵综合集成技术:它利用图像处理、模式识别、计算 机视觉、图像理解等学科中的 些方法作为部分基础 技术,从认知科学、用户模型、图像处理、模式识别、知 识库系统、计算机图形学、数据库管理系统.“及信息 检索等领域中获得启发,引人新的媒体数据表示和数 据模型.产生出有效、可靠的查询处理算法和可砚化查 询接口,以及与领域无关的检索技术和系统结构 (2)客观性:从媒体内容中提取信息线索 基于内 容的检索突破了传统的基于表达式检索的局限.它直 接对图像、视频、音频内容进行分析,抽取媒体语义和 视觉、听觉等特征,利用这些内容特征建立索目f,并进 行检索。由于突破了传统的基于文字表达符的局限.避 免了用字符标识图像的转化过程,从而太大提高了检 索过程的效率和适应性。 (3)相似性比较:基于内容的检索是一种近似匹 配 由于对内容的表示不是一种精确描述+因此,CBR 采用相似性匹配的方法逐步求精.以获得查询结果,即 不断减小查询结果的范围,直到定位于要求的目标,这 是一个迭代过程。这一点与常规数据库检索中的精确 匹配方法不同。 (4)交互性查拽:CBR系统充分发挥人和计算机 各自的长处,利用人对于物体的内容特征比较敏感、而 计算机善于从大量数据中标识对象和从事重复性的工 作,把交互操作引人到查询过程中。 ( )直观的查询方式= (6)大型数据库(集)的快速检索。 3基于内容检索的系统结构 完整的CBR系统一般由两个子系统掏成,即数据 库生成子系统和查询子系统 每个子系统由相应的功 能模块和部件组成 (1)对象标识:为用户提供种工具,以皇自动或 半自动(需用户部分干预)的方式对静志图像 视频镜 头的代表帧等媒体中用户感兴趣的区域(静态对象)及
维普资讯 http://www.cqvip.com 第4期(总第76期) 黄蕾:多媒体数据基于内容检索综述 45 视频序列中的动态对象进行标识,“便针对对象进行 特征提取、描述和查询。如果进行整体内容的检索,则 可利用全局特征,而不用对象标识功能。对象标识是可 选的。 (2)特征提取:对视频、图像等多媒体数据自动或 半自动地提取用户感兴趣的、适台检索要求的特征。特 征提取可以是全局性的.如针对整幅图像和视频镜头, 也可以是针对某十对象的,如图像中的子区域、视频中 的运动对象等。 (3)数据库:数据库由媒体库 特征库和知识库组 成。媒体库包含多媒体数据,如图像、视频、音频、文本 等:特征库包含用户输^的客观特征和预处理自动提 取的内容特征{知识库包含领域知识和通用知识,其中 的知识表达可以更换.“适应不同领域的应用要求 (4)用户查询和浏览接口:主要以示例查询(QBE) 和模糊描述等可视查询形式向用户提供查询接口。查 询允许针对对象、整件图像、视频镜头 及任意特征的 组台形式来进行。由于多媒体数据的视觉和听觉特性, 不仅查询时需要通过浏览确定查询要求,而且查询后 返回的结果也需要浏览.尤其是视频浏览。 (5)检索(匹配)目i擎 检索是利用特征之问的距离 函数来进行相似性匹配.模仿人类的认知过程.近似得 到数据库的认知排序.对于不同媒体的数据类型,具有 各自不同的相似性测度算法.在检索(匹配)引擎中包 括一个较为有效、可靠的相似性测度函数集; (6)索目i/过滤器:检索 【擎通过索引/过滤机制来 达到快速搜索的目的,从而可以应用于大型多嫫体数 据集中 过滤器作用于全部数据,过穗出的数据集台再 用高维特征匹配来检索。索引用于低维特征.可以利用 R树. 加快检索。 4基于内客的查询和检索过程 基于内容的查询和授索是一十逐步求精的过程. 检索经历了一十特征调整、重新匹配的循环过程。 (1)初始查询说明:用户查找一十对象时,最初可 以用QBE或查询语言来形成一十查询 系统提取该示 例的特征或把查询描述映射为具体的特征矢量 (2)相似性匹配:将查询特征与特征库中的特征按 照一定的匹配算法进行相似匹配。 (3)相似度排列:满足一定相似性条件的一组候选 结果,按相似度大小排列后返回绐用户。 (4)特征调整 对系统返回的查询结果,用户可以 通过浏览米挑选.直至得到满意的结果.或者从候选结 果中选择一1、示例.经过特征橱整后,形成一个新的查 询。 5基于内客检索的类型 (1)图像查询:主要依据图像的颜色、纹理、形状特 征, 及图像中子图像(目标,又嚣对象)的特征进行检 索。其中有: a颜色查询。 b.纹理查询 c.形状查询:利用形状特征(区域、主轴方向、矩、 偏心率、圆形率、正切角等)或匹配主要边界进行检索。 d.图像对象查询:对图像中所包含的静态子对泉 进行查询。查询条件可以综台利用颜色、纹理,形状特 征、逻辑特征和客观属性等 (2)视频浏览和检索:视频数据巨大的数据量和丰 富的表现内容不是几十关键诃所能包含的。视频检索 就是在大量的视频数据中找到所需要的视频片断。基 于内容的视频检索是指,用户可 指出其所想要的镜 头的一些特点.如该镜头的颜色主色调、运动特点等, 根据这些要求由计算机查找出相应的视频镜头,并反 馈给用户做进一步的选择。其用途非常广泛.如各类体 育节目的检索、卫星云图变化情况的检索等。 视频可用场景、镜头、帧来描述 基于关键帧的检 索对代表视频镜头的关键帧进行检索。关键帧是一幅 幅图像,可以采用与图像检索相似的方法。一旦检索到 目标关键帧,用户就可以利用播放来观看它所代表的 视频片断。 (3)声音查询 利用声学的和主观的特性进行查 询。声音的一些感知特性.如音调、哺度、音色等,它们 与音频信号的测量属性非常接近,因此,可在音频数据 库中记录这些特征,并利用这些特征进行示例和指定 特征值查询。 (4)图形查询:基于空间的结束关系进行查询。包 括: a点查询查:找某坐标处的目标 b.线查询查 找线状目标两侧的目标 例如查找 公路两侧的建筑。 c.区域查询:查找某区域内的图形目标 d.关联查询:利用两十或多十图形对泉之间的空 间和拓扑关系来查询。空间约束关系可以为方向、部 接、包含等。 (5)文本查询:心往文本资料的检索是利用关键词 标引,采用传统的数据库技术米实现管理和检索。然 而,由于关键词标引工作量大,而且标 I同用户的检索 概念可能不一致,导致查准率和查全率低。因此,需采 用直接对文本进行任意词和字的检索 根据实现方法 的不同,其检索拄术丹为串搜索、串匹配和全文检索, 以字和词“及它们的逻辑组合为条件进行查询。 以上查询类型并不一定同时用于某一应用。对于 个具体应用来说,可能只需要其中的几种查询,或利 用以上查询类型作为基本操作来构造复合的查询。
维普资讯 http://www.cqvip.com 情报探索 2000阜】2月 6基于内容检索的应用 基于内容的多媒体信息检索是一项实用的高技 术,有着广阔的应用前景 目前主要应用于以下几个方 面 将基于内容检索引擎嵌^到常规效据库管理系统 中,以实现多媒体数据的检索;在信息检索系统中 对 专用领域的视频、图像和文档库进行检索;对[nternet 上包含在Web信息网中HTML页面上的多媒体数据 进行基于内容检索等 早期的全文信息捡索、罪犯头像的识别和管理 指 纹的识别和管理都是基于内容检索的一些尝试 现在 这种技术将扩展到任何媒体和更广泛的领域 例如,艺 术画廊和博物馆管理、建筑与工程设计、地理资源遥感 与管理、地理信息系统 商标及版权数据库管理、数字 视频图书馆、Www信息蒯览、多媒体CAI应用、多媒 体出版、电子会议、远程教学 远程医疗、天气预报、服 装设计、军事指挥系统等方面 目前,国际上对基于内容的检索技术进行了根多 实际性的研究.取得了许多成果,一些原型系统已发布 在Internet网上。例如,IBM公司的QBIC(Query By ImageContent)系统、Visua[SEEk系统等 7有待研究的关键技术 对于多媒体基于内容的检索研究虽已取得许多成 果 推出了一些原型系统,某些技术已用于商用数据库 及信息检索系统中。然而,还有许多问题需要进一步 深^研究。 (1)数据模型:数据摸型是CBR系统的核心.模型 决定CBR支持的查询类型和检索能力 建立的数据摸 型要能够充分反映媒体对象的内容,反映与领域无关 的和能够有效存储的物理特征及逻辑特征。 (2)特征提取和语义获取:需要易用的能对原始特 征进行抽取的自动工具和获取逻辑特征的半自动工 具t用于开发大型、实用的多媒体信息检索系统 另外. 还需要新的特征表示方法,如基于分形或小渡的特征 数学表示。 (3)基于内容的编码:现在我们使用的媒体.其格 式和编码投有考虑到内容,只是针对颜色、象素、样值 来编码一因此,从这些数据中抽取内容特征非常困难。 如果我们在对媒体数据编码表示时就考虑剐媒体的内 容.即媒体包古其表示内容的信息.那,厶 对这些数据 的内容进行检索就台更有效与准确。目前这方面的工 作已经取得很大的进展。例如即将成为国际标准的基 于内容的编码标准MPEG一4和多媒体数据内容表示 国际标准MPEG一7。 (4)查询说明模式 对于特定类型的查询,该领域 专家可能宁愿需要一种功能丰富的复杂的图形接El, 以支持多种形式的查询类型=而非正式和普通用户可 能宁愿用自然语言来i兑明查询 从映射自然语言查询 到通用查询类型仍然需要进一步研究。 (5)索引和性能:研究适台于大型多媒体库检索的 索引结构和过滤器,靖短系统的响应时问,提高查询效 率。 (6)集成查询:用基于内容的查询补充和扩展已存 在的数据库查询及信息存取方法=应用系统应能把日 期、价格等客观属性与内容特征 姐颜色、纹理和形状 等结台在一起集成查询。 (7)扩展性和灵活性 系统的体系结构应该支持更 新与扩充新的特征表示和新的匹配/相似性度量算法, 以使系统查询及检索的性能和功能不断增强 参考文献 1梁永垒,邓隆兴,多媒体数据存储 计算机世界, 1998(37) 2李国辉,王辰,薛峰.几种典型的基于内容检索系 统.计算机世界.1998(20) 3李国辉.胡晓峰.基于内容的检索.计算机世界. 1998(2O) 4曹莉华,胡跷峰,李目辉基于视频内容的检索. 计算机世界.1998(2∞ 5熊华.李国辉MPEG一4对基于内容应用的支持. 计算机世界.1998(20) 6胡晓峰一李国辉.多媒体系统 北京:人民邮电出 版杜,1997 7顾君忠.多媒体信息技术及其应用.沈阳:辽宁科 学技术出版社.1997 8杨学良多媒体计算机技术及其应用.北京:电子 工业出版社 t996 9郑庆华.李人厚,胡峻.多媒体数据库的主要问题、 研究内容与实现方法计算机工程与应用.1998 (1).1~4