基于内容的多媒体检索技术

合集下载

多媒体信息的检索名词解释

多媒体信息的检索名词解释

多媒体信息的检索名词解释随着信息技术的迅猛发展,多媒体信息的检索在当今社会中变得愈发重要。

多媒体信息是指以多种媒体形式表达的信息,包括文字、图像、音频、视频等。

它涵盖了各种不同类型的媒体资源,如图书、图片、音乐、电影等。

然而,由于多媒体信息的特殊性,它具有相对较高的复杂性和难度,因此需要合适的方法和工具进行检索。

一、多媒体信息检索多媒体信息检索(Multimedia Information Retrieval,简称MIR)是指通过计算机和相关的算法,从大量的多媒体数据中,按照用户的需求检索出相对应的信息的过程。

多媒体信息检索系统的目标是提供一种能够根据用户需求快速而精确地获取多媒体数据的方法和工具。

这样的系统可以帮助用户在海量的信息资源中快速找到他们所需的信息。

二、多媒体信息检索的特点多媒体信息检索相比传统的文本检索具有一些独特的特点。

1. 多样性:多媒体信息包含了各种不同类型的媒体,用户可以通过多种方式进行查询和检索。

例如,用户可以输入关键词、上传图片或音频等方式进行检索。

2. 复杂性:多媒体数据的内容和结构非常复杂。

图像、音频和视频等媒体资源无法像文本那样直接用关键字进行搜索。

因此,多媒体信息检索需要借助计算机视觉、音频处理、机器学习等领域的技术,对多媒体数据进行处理和分析。

3. 主观性:多媒体信息的理解和感知往往是主观的。

同样一张图片、一段音频或视频,在不同的人眼里可能有不同的解释和感受。

这增加了多媒体信息检索的难度。

4. 大规模:随着信息爆炸时代的到来,多媒体信息的数量越来越庞大。

有效地处理和管理这些大规模的多媒体数据成为了一个巨大的挑战。

三、多媒体信息检索的方法多媒体信息检索的方法主要包括内容分析、特征提取、索引建立、用户查询和相似度计算等步骤。

1. 内容分析:多媒体信息检索的第一步是对多媒体数据进行内容分析。

内容分析通过运用计算机视觉、音频处理和自然语言处理等技术,将多媒体数据转化为计算机能够理解和处理的形式,以便进一步的分析和检索。

现代多媒体技术及应用 (10)

现代多媒体技术及应用 (10)

为何应用数据库?
因为数据库为共享的稳定数据提供了安全和有保障的存储介质。如 果用户不需要数据在其作用范围外持久存储,数据库就不用为此类用户提 供增值服务。反之,如果用户要求数据在某个程序或应用的作用范围之外 存在,则数据库无疑是维护这些持久数据的合适之地。但是仅要维护持久 数据并不意味着非用数据库管理系统不可。为判断数据库是否合适,我们 还必须看被管理的数据是否有结构。联系和约束。 决定用文件系统还是用数据库,必须考虑所存储的数据以及这些数据 是如何使用的。数据库管理系统提供查询数据库的功能,从而找到相关联 的数据项,查询的简单性取决于可用的数据库操纵语言、使用的逻辑数据 库结构和存储数据项的粒度。
本章内容提要
F多媒体数据库 F多媒体数据库基于内容检索
本章教学要求:本章内容是对多媒体数据库技术作一简要介
绍,拓展专业视野。通过学习多媒体数据库及基于内容检索, 了解多媒体数据库的存储问题,管理及体系结构等知识。
本章问题设计: 什么是多媒体数据库?多媒体数据库主要存在
的问题或需要解决的问题?基于内容查询是指什么?
查询多媒体元素:传统数据库模型主要针对的是整数、实数、定长字符等 规范数据。数据库的设计者必须把真实世界抽象为规范数据,这要求设计 者具有一定的技巧,而且在有些情况下,这项工作会特别的困难。即使抽 象完成了,抽象得到的结果往往会损、声音、动态视频等多媒体信息引人计算机之后,可以表达的信息
数据库的种类?
分布式数据库、多媒体数据库系统、实时数据库、容错数据库、安全 数据库和混合数据库 1分布式数据库管理系统 分布式数据库系统并非单纯意味着数据是分布的。分布式数据库的定 义也意味着它结合了知识、动作,以及对组成分布式计算机系统的分布式 部件的控制。
2实时数据库管理系统 实时数据库系统并不单是一个速度快的系统。实时是指操作系统和与 其交互的现实世界之间的时态交互。实时控制系统可能是集中式、分布式 或混合式的。实时系统的显著特征是它在操作的各方面都用到时间。

1多媒体内容分析与检索介绍

1多媒体内容分析与检索介绍
29
网上多媒体数据与现实的关系
30
30
网上多媒体数据-事件结构化表示
结构化:怎么理解??








31
31
网上多媒体数据-事件结构化表示
32
32
4. 多媒体技术简介
33
多媒体技术简介
术语“多媒体”的理解 研究问题与技术 典型应用 多媒体技术的技术内涵
34
术语 “multimedia”的理解
12
多媒体应用之图片检索
13
13
创意推动的多媒体产业
100多年前,福特公司的创始人亨利·福特先生到处跑去问 客户:“您需要一个什么样的更好的交通工具?”几乎所 有人的答案都是:“我要一匹更快的马”。
14
创意推动的多媒体产业
15
创意推动的多媒体产业
微博
16
微信
创意推动的多媒体产业
17
创意推动的多媒体产业
,年轻人通过非常重要的信息网络联络彼此,24小时不间断!在过去,如果你想组织 一场抗议游行,必须到不同的地方,像大学、研究所这类地方散播信息。但是,之后 ,脸谱消除了这些障碍,在脸谱上,人们都是彼此的朋友。这样,如果你有2000个朋 友,我有2000个朋友,这2000个朋友各有2000个朋友,这样信息就非常非常迅速地传 播了。
35
术语 “multimedia”的理解
Media can be classified with respect to different criteria
Perception
How do human perceive information in a computer environment?

基于XML的多媒体信息检索

基于XML的多媒体信息检索

B sdIf mai e i a, B R , 两 种 方 法分 别使 用并 不 能 达 到 理 想 的 检 索 结 果 。本 文介 绍 了基 于 X L的 图像 ae no t nR te l I ) 但 r o rv C M
检 索 系统 的 系统 结构 和 实现 框 架 , 合 X 结 ML文 档详 细介 绍 了 国 内 外有 关 文 本与 内容 结 合 的研 究 方 法 。
维普资讯

情 报 检 索 ・
基 于 XML 的多媒体 信息检 索
M u tm e a Re r e a s d o li di tiv lBa e n XM L

龙 泉
陆 伟
武汉 407) 3 02
( 汉 大 学信 息 资源 研 究 中心 武
因 为这 些 领域 的 图像 在 某 些 特 征 上 容 易 识 别 。 目前 存 在 大 量 有 关 基 于 内容 的 图像 检索 的方 法 , 们根 据 图 像 的各 种 视 觉 特 它 征 对 图像 进 行检 索 , 在 不 断 的 改进 中 , J n i u 并 如 u d g S n等 人 提 n 出 的 对 颜 色 直 方 图 作 出 改 进 的 考 虑 到 空 问 特 征 的 颜 色 直 方
关 键 词 多媒 体检 索 TBI CBI XML R R
1 多媒体检 索概 述
随着 计算 机技 术 的发 展 , 特 网 的 不 断 普 及 , 上 数 据 量 因 网 和数据 种类 的不 断 增 多 , 媒 体 技 术 、 多 网络 技 术 和 信 息 数 字 化 处 理 等高新 技 术 的 飞 速 发 展 , 得 因 特 网上 的 多 媒 体 数 量 激 使
通 过 基 于文 本 的 图像 检索 与基 于 内容 的 图 像 检 索 相 结 合 , 索 检

基于多媒体数据挖掘的多通道检索技术

基于多媒体数据挖掘的多通道检索技术
① c=const ( );
需用户对检索结果作相关反馈。系统根据用户的反 馈信息作语义上下文分析,在此基础上再进行基于
内容的检索,如此反复,直至找到满意的结果。
3 多通道检索流程图
图3 所表示的检索过程如下[6. 7 1.
② L,E {扫描多媒体数据库, 生成一元数据项
频集及其支持度};
③ C2 =apriori-gen传); 1 , *利用Aprior 算法的函 数apriori-gen(L1 ),由L, 候选集C2 ; 产生 */ ④L2 {c ECz/c.support>minsupp}; "⑤ S=build-change(L2) ;
在多通道检索中的应用做了探析。
图I 多媒体数据挖掘过程
1 多媒体数据挖掘过程
多媒体数据挖掘是指基于多媒体的内容特征 c ,以及这些特征的相关语义,从大型多媒体集 M
2 多媒体信息多通道检索体系结构
信息的发布形式已由单一的文本发展为由文 本、图像、视频、音频甚至 3D 模型等多种模态数 据构成的有机集合。面对丰富而又复杂的多媒体信 息, 用户需要一种准确、友好、 灵活的检索方式与 多媒体信息之间进行交互,面向多媒体信息的多通 道检索系统的出现不失为解决这一问题的好途径。 如图2 所示,多通道检索系统主要由存储子系 统和查询子系统组成。存储系统首先对多媒体信息 进行预处理,提取多媒体信息中不同对象间的链接 关系,存人存储子系统中相应的数据库中。同时, 建立交叉参照知识库, 作为检索的语义基础1 5Ja
多媒体数据的关联规则, 是在相关的多媒体对 象集中,找出一组关联规则,显示一组对象或特征 的模式或相互关系的发生频率, 一个典型的关联规
则 [a.“1 X-4Y ,c% 其 : X和Y是 组 是 ,: 9 [s% ], 中 一

浅谈基于LUCENE的多媒体文件检索系统的设计

浅谈基于LUCENE的多媒体文件检索系统的设计

浅谈基于LUCENE的多媒体文件检索系统的设计摘要:本文通过研究对lucene框架及核心算法进行分析研究的基础上,通过插件的机制抽取多媒体文件中的标示性文本信息,利用lucene对标示性文本进行索引构建及检索,在.net平台及c#语言开发环境下设计并完成了一个多媒体文件的检索系统。

关键词:多媒体文件检索系统搜索引擎 lucene计算机互联网技术的飞速发展,使得网页以及各种文本数字信息急剧增长,想要在海量的数据中便捷、迅速地搜索到所需要的信息将变得越来越困难。

现在常用的搜索引擎软件主要用信息检索技术来解决搜索的问题。

同时,随着多媒体技术的发展,大量的信息主要以非文本形式的多媒体文件形式存在。

对于如何有效地检索这些庞大数量的多媒体文件具有重要的应用价值。

搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。

一、lucene简介lucene是apache软件基金会jakarta项目组的一个子项目,也是一个开放源代码的搜索引擎工具包。

它不是一个完整的搜索引擎,而是一个全文索引工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能,提供完整的查询和索引及部分文本分析功能。

初使用lucene的使用者常错误地把它认为是一个可以马上使用的应用程序,即一个文件检索程序,或者是一个web网络爬虫,以及一个web站点搜索引擎[1],然而这些都不是它的实质。

lucene 实际上是一个开发工具包的软件库,而非具备完整特性的搜索应用程序。

纵然使得它只关注于自身的索引和搜索技术,并且非常好地完成这些程序。

lucene让你的应用程序处理业务规则,而把复杂的索引和搜索实现掩盖起来,只提供简单易用的api。

为了帮助理解,可以把lucene当作层,应用程序位于它之上。

现今,大量的应用都是利用lucene对文本进行检索,而很少用来对多媒体文件进行检索。

基于内容的图像检索技术精选全文

基于内容的图像检索技术精选全文
颜色特征描述方法 直方图法、累积直方图法、局部累积直方图法、颜 色布局法、中心矩法等。
颜色特征
欧几里德距离法 欧几里德距离通过特征向量差值的均方差反映了图 像之间的差异,用欧几里德距离公式计算图像x和y 的距离如下:D(X ,Y ) (xk yk )2 优点:是简便易行,有清晰的物理意义,即距离小, 匹配好,说明2个特征之间的相似度大
mn (t) 2m/2 (2m t n)
假设图像的轮廓函数为f(t),它的小波变换系数为:
Cmn f (t) mn (t)dt
利用小波变换系数可以重建的公式,它如下所示:
m0
f (t)
cmn mn (t)
cmn mn (t)
mm0 1 n
m n
小波变换
假设尺度函数为,把它和小波变换重建公式相结合
傅立叶形状描述符
傅立叶形状描述符(Fourier Descriptor)的基本思 想是用物体边界形状特征函数的傅立叶变换来描述 形状。傅立叶变换通过把敏感的直接表示转换到频 域获得物体的一般特征,频域特征不容易被微小的 变化和噪声所影响。
傅立叶形状描述符
边界的离散傅立叶变换表达可以作为定量描述形状 边界的特征参数的基础。假设在平面上有一由个点 组成的数字化边界,其中的每个点可以用坐标来表 示。从任意一个起点开始,以逆时针方向沿着边界 移动,这样可以得到一系列坐标点。将平面与复平 面重合,其中实部轴与轴重合,虚部轴与轴重合, 这样边界上的每个点的坐标就可以用复数的形式来 表示,从而边界就可以表示成坐标组成的一个复数 序列。
图像检索技术的发展
图像检索技术的发展两个阶段:
✓ 基于文本的图像检索 70年代,研究者们在对图像进行文本标注的基 础上,对图像进行基于关键字的检索。

基于媒体特征的多媒体信息检索技术的研究

基于媒体特征的多媒体信息检索技术的研究

【 摘
要 】 本 文 讨 论 了基 于媒 体特 征 的 多媒 体 信 息检 索的 关键 技 术 , 述 了媒 体 各 种 不 同特 征 的检 索技 术 . 对 基 于 : 论 并
媒 体特 征 检 索技 术 的常 用算 法进 行 详 细 的 论 述 。
【 关键 词 】 媒 体 特征 ; 征 提 取 ; 似 性 匹配 : 特 相
图 像进 行 检 索 .主 要有 针 对 图像 边 缘 轮廓 线 进 行 的 检索 和 针对 ( )提取 媒 体 特 征 的方 法 多种 多 样 以 图像 的 特 征提 取 为 图 形 矢量 特 征进 行 的检 索 两种 方 法 最 常用 的 形 状描 述 是 傅立 3 例 , 以提 取颜 色 特 征 、 理特 征 、 状 特 征 、 廓 特 征等 可 纹 形 轮 叶 描述 和 小 变矩 两种 ( )适合 于 对各 型数 据 库 的高 速检 索 .尤其 是 中大 型 数 据 4 ( ) 用颜 色特 征 、 理 特征 和形 状特 征 进行 综 合检 索 4利 纹 库。 以直 方 图作 为 颜 色特 征 .只能 表示 出图 像 中 各种 颜 色 信息 3 基 于媒 体 特 征 的检 索 技 术 的 统计 分 布 , 不能 表示 所 包 含 的各 种颜 色的 空问 分 布信 息 通 而
1 言 引
基 于颜 色 特征 的 检索 主 要 采 用直 接示 例检 索 法 和 以颜 色 为 随着 计算 机信 息 技术 和存储 技 术 的 快速 发 展 和 互 联 网 技术 主 色 调 检索 法 两种 方式 直 接 示 例检 索 法 是 由用 户 给 出具 体 的
与通 信 技 术 的逐 步 完善 . 媒 体 信息 作 为 一种 内 容丰 富 、 现 直 示 例 图像 .系统 通 过提 取 示 例 图像 的颜 色特 征 与 图 像库 中图 像 多 表 观 的媒体 . 已经 应 用 在备 类 领 域 . 别是 多 媒 体 信 息 在互 联 网上 的颜 色特 征 进行 相 似性 近 似 匹配 . 特 以得 到颜 色 相似 的图 像 而基 得 以迅速 呈 现 .人 们 越 来越 多 地 通 过互 联 网接 触 到 和应 用 各 种 于 图 像 的颜 色主 色调 检 索 法 是根 据 用 户 给 出图 像 的一 个 或 几个 各 样 的多 媒 体 信息 。 同时 随着 计 算机 处 理 能力 的 提 高 . 利用 计 算 主 色调 . 这 些 主色 调 作为 检 索 的 主要 特 征进 行 相 似 性 匹配 . 将 以 机 来 分析 、 模拟 运 动 信息 受 到越 来 越 多 的注 意 。 何 在 海量 的 媒 检索 图像 库 中具 有类 似 主 色调 的 图像 如 体 信 息 中在需 要 时 检 测 出 来 .是 近 年来 网络 信 息 处理 已经 面 f } 缶 ( ) 于 纹 理特 征 的检 索 技 术 2基 的” 颈“ 已 成 为 国 内外 研 究热 点 . 瓶 . 目前对 多 媒 体 信 包的检 测 方 纹 理特 征是 描 述 图像 的 一个 重 要 特征 .图 像 的纹 理 特 征在 法 有 很多 种 .本文 主 要 根据 多 媒 体 信息 的媒 体 特 征来 研 究 其 检 局 部 区域 内 可能 是不 规 则 的 .但 在 整 个 图像 区 域 内一 般 具 有某 测技术。 种 特殊 的 规律 性 . 也是 基 于 特征 检 索 的一 条 主要 线 索 纹 理特 这 2 基 于媒 体 特征 的 检 索 及特 点 征 主要 由纹 理 的 均匀 度 、 比 度和 方 向 性 三个 特 征量 表 示 . 理 对 纹 基 于 体 特 征 的检 索 是一 种 信息 检 索技 术 .是 对 媒 体 对 象 的均 匀 度 主要 反 映 了图 像纹 理 的 尺寸 .对 比度 反 映 了图像 纹 理 的 特 征及 上下 文 语 义环 境 所 进 行 的检 索 这 种检 索 技 术 根 据 用 的清 晰 度 . 而方 向主要 反 映 了实 体 是 否有 规 则 的方 向性 。 分析 纹 户 的要 求 . 够 从 多媒 体信 息数 据 库 中查 询 到 符 合 条 件 的信 息 . 理 特 征 的方 法 大致 有 统 计方 法 、 方法 和 结构 方 法等 三 种 能 谱 其 主 要任 务 是 根据 媒 体特 征 采 用 近 似匹 配 的方 法 快 速 发 现 信 息 () 3 基于 形 状特 征 的检 索 技术 所 在 数据 库 中 的 目标 位置 .并 不需 要 对 媒体 信息 进 行 理 解 和描 形 状 特 征是 描述 图像 中 物体 本质 特 征 之一 同 一 物体 可 能 述 。基 于 媒体 特 征 的捡 索 系统 既能 对 以 文本 信 息 为 代 表 的 离 散 有 用 多 种不 同的颜 色 来描 绘 的 , 形 状特 征 却 是一 致 的 . 但 因此 很 媒体 进 行 检索 . 能 对 以图像 、 也 声音 为 代 表 的连 续 媒 体 的 特 征进 多 检 索过 程 可 能是 针对 图像 的形 状 . 而不 是针 对 图像 的 颜 色 对 行 检索 。 形 状 特 征分 析 的基 础是 对 图 像 的边 缘 线 条特 征 的 提 取 .边 缘 线 基 于媒 体特 征 检 索 的特 点 是 ! 条 特 征 是图 像分 割 的重 要 依 据 .图像 边 缘线 条 特 征 提取 的 好坏 ( ) 多 媒 体 信息 的 特征 进 行分 类 , 接对 图像 、 频 、 1 针对 直 视 音 频进 行 分 析 . 中抽 取 有用 或 需 求特 征 从 ( ) 据 库 中 多 媒体 信 息和 用 户提 交 的 检索 内容 . 2数 在经 过 转 变 后进 行 相似 性 匹配 . 而不 是 对 原始 数 据 的直 接 比对 直 接 影 响到 形状 特 征 的提 取 一 个 好 的边 缘 线 条 特 征 的提 取过 程 必 须 与滤 波器 配 合使 用 . 个 封 闭 的 图像 具有 许 多 特 征 . 区 一 如 域、 主轴 方 向 、 、 心 率 、 形率 和正 切 角 等 。基 于形 状 特 征
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于内容的多媒体检索技术
摘要:
基于内容检索是多媒体研究中的新兴热点,会逐渐在很多领域中得到广泛的应用,
本文主要介绍了基于内容的多媒体信息检索的概念、特点、查询和检索过程、基于内
容的检索、基于视频的检索以及基于内容的多媒体信息检索的研究方向。
关键词:基于内容的检索;多媒体;图像检索;视频检索
1. 引言
多媒体技术和Internet的发展将人们带入巨大的多媒体信息海洋,并进一步导致
了超大型多媒体信息库的产生,光凭关键词是很难做到对多媒体信息的描述和检索的,
这就需要有一种针对多媒体的有效的检索方式。如何有效的帮助人们快速、准确地找
到所需要的多媒体信息,成了多媒体信息库所要解决的核心问题。
2. 多媒体检索技术原理与方法
多多媒体检索是一种基于内容特征的检索(CBR:content-based retrieval)。所谓
基于内容的检索是对媒体对象的内容及上下文语义环境进行检索,如图像中的颜色、
纹理、形状,视频中的镜头、场景、镜头的运动,声音中的音调、响度、音色等。基
于内容的检索突破了传统的基于文本检索技术的局限,直接对图像、视频、音频内容
进行分析,抽取特征和语义,利用这些内容特征建立索引并进行检索。在这一检索过
程中,它主要以图像处理、模式识别、计算机视觉、图像理解等学科中的一些方法为
部分基础技术,是多种技术的合成。
与传统的信息检索相比,CBR有如下特点:
(1)相似性检索:CBR采用一种近似匹配(或局部匹配)的方法和技术逐步求精
来获得查询和检索结果,摒弃了传统的精确匹配技术,避免了因采用传统检索方法所
带来的不确定性。
(2)直接从内容中提取信息线索:CBR直接对文本、图像、视频、音频进行分析,
从中抽取内容特征,然后利用这些内容特征建立索引并进行检索。
(3)满足用户多层次的检索要求:CBR检索系统通常由媒体库、特征库和知识库
组成。媒体库包含多媒体数据,如文本、图像、音频、视频等;特征库包含用户输入
的特征和预处理自动提取的内容特征;知识库包含领域知识和通用知识,其中的知识
表达可以更换,以适应各种不同领域的应用要求。
(4)大型数据库(集)的快速检索:CBR往往拥有数量巨大、种类繁多的多媒体数据
库,能够实现对多媒体信息的快速检索。
基于内容的检索体系通常如下图所示:

Figure 1基于内容的检索体系
2.1基于内容的静态图像检索

基于内容的图像检索必须要对图像进行基于内容的识别和解释,特征提取在图像
检索中占有重要地位。图像检索所用到的基本特征有颜色、纹理、形状、图像的语义
等等。
2.2颜色检索
颜色是描述一幅图像最直观、有效的特征,由于颜色具有一定的稳定性,所以是基
于内容的图像检索中应用最广泛的特征。对颜色进行检索主要是利用颜色空间直方图
进行匹配。颜色数据在查询时,颜色特征的提取主要有互补颜色空间直方图、直方图
交叉法、直方图距离比较法、二次型距离算法等。采用基于颜色分布的匹配将获得更
接近于被检索内容的视觉效果。
2.3纹理检索
纹理是描述图像的另一重要特征,图像的纹理特征主要包括粗糙性、规则性、线
条相似性、凸凹性、方向性和对比度。常用的检索方法有共生矩阵均值方差法、频谱
分析和结构方法以及基于视觉模型的多分辨率分析、随机场模型等。纹理检索在图像
分析和识别中起着重要的作用,它被广泛应用于气象云图、卫星遥测
图像等。
2.4形状检索
形状是描述图像的本质特征之一,可用面积、离心率、圆形度、形状矩、曲率、
分形维等全局和局部特征来表示,基于形状的检索对象可以分为基于二维形状和基于
三维形状的检索。形状检索的基础是图像边缘的提取,常用检索方法有针对图像边缘
轮廓线进行的检索和针对图形矢量特征进行的检索。
2.5基于内容的视频检索
视频又称动态图像,通常包含了动画和影像,是一组序列图像按时间顺序的连续
表现,其表示与图像序列、时间关系都有关。帧、镜头和场景是视频信息的基本组成
部分,在视频播放中,多个图形按先后顺序快速而连续地出现和消失,而这些单个的
图形就是组成视频的最小单元———帧,其中对动态画面起到变化、转折和决定作用
的称为关键帧;镜头表示通过摄像机的移动操作形成一个事件或连续的动作,它由一
系列连续的帧组成;场景包含了多个镜头的组合,完整的视频是由一个或多个场景组
成的。基于内容的视频检索就是要通过对视频数据中所包含的视觉内容进行分析和特
征提取,查找到符合要求的相似内容片段。因此,其处理技术包括视频结构的分析、
视频数据的自动索引和视频聚类。
2.6基于内容的音频检索
音频是另外一种重要的媒体。音频可以分为三种类型:波形声音、语音、音乐。
波形声音是将模拟声音数字化后得到的数字音频信号,它可以代表语音、音乐、自然
界和合成的声响;语音具有字词、语法等语素,语音经过识别可以转换为文本,文本
也是语音的一种脚本形式;音乐具有节奏、旋律或和声等要素,是人声和乐器音响等
配合所构成的一种声音,可以用乐谱来表示。音频信息检索可以分为基于语音技术的
检索、音频检索和音乐检索。语音检索是以语音为中心的检索,采用语音识别等处理
技术;音频检索是以波形声音为对象,用声学特征来检索;音乐检索是以音乐为中心
的检索,利用音乐的音符和旋律等音乐特性来检索。
3. 应用前景
基于内容的多媒体检索技术的日益成熟不仅将创造出巨大的社会价值,而且将改
变人们的生活方式。因为它与传统数据库技术相结合,可以方便地实现海量多媒体数
据的存储和管理,与传统Web搜索引擎技术相结合,它可以用来检索HTML网页中
丰富的多媒体信息。基于内容的多媒体检索技术将会在以下领域中得到广泛应用:多
媒体数据库、知识产权保护、数字图书馆、数字档案馆、网络多媒体搜索引擎、交互
电视、艺术收藏和博物馆管理、遥感和地球资源管理、远程教育、远程医疗、远程购
物、天气预报、多媒体编辑(个人电子新闻业务、媒体写作)以及军事指挥系统等等。
多媒体信息检索技术的应用使多媒体信息检索系统、多媒体数据库,可视信息系统、
多媒体信息自动获取和索引系统等应用逐渐变为现实。
4. 结语
基于内容的多媒体检索是一个新兴的研究领域,在国内外仍处于研究、探索阶段,
因此在基于内容的检索领域中仍然存在许多问题。这些问题主要包括多媒体特征的描
述和特征的自动提取、多媒体的同步技术、匹配和结构的选择问题, 以及按多相似性
特征为基础的索引、查询和检索等。作为一个新兴的研究领域,同时由于其检索对象
和范围的多样性,基于内容的多媒体检索还要解决多种检索手段相结合的问题, 以提
高检索效率。此外,更好地理解检索内容以及使检索性能更接近人类视觉的特征,也
是未来研究中需要解决的问题。
参考文献:
[1] 基于内容的多媒体检索的研究现状和应用前景(张宁)
[2] 用文本检索方法实现基于内容的图像检索(黄斌,杨世洪,吴钦章)
[3] 基于内容的多媒体信息检索(黄丽娟)
[4] 基于内容的多媒体检索和索引的研究(罗菁,王雅)

相关文档
最新文档