数字图书馆中基于内容的多媒体检索技术研究
数字图书馆中基于内容的多媒体检索

w na g t e w aa g gt N A G t e ( ) / a f Sa = a fn , e n t WA F N s t ; 获 a / 取 检 索 状 态
i w nagtt) / f( afnSa f/ e 假设检索成功 w nag ae= a ag eWA F N Pp r ) / afnP prw r n, t N A G ae ( ; 获取 论 f g / 文信息 w n n Sm= afn. t N A G u ( )/ A 检 索 命 中 af g u w nag e a g WA F N sm ; ̄ / 数 量
2 MP G7标 准概 述 E
MP G E 7旨在解决对 多媒体信息描述 的标准问题。 其关键 是要定义一种描 述视 听信 息内容 的格式 , 只有 解决 了多媒体 信 息的规范化描述之后 ,才能更好地 实现 多媒体信 息的搜 寻。可见 , E 7 是信 息压 缩标 准 , 用于各种类型多媒 MP G 不 是 体信息描述 的标 准 , 如静止 图像 、 图形 、D模 型 、 3 音频 、 视频 等, 以及关于这些 视听信息在一个多媒体表达 中如何结合 的 等信 息 。它 是 建 立 在 对 象 分 割 与 特 征 提 取 之 上 的 , 是 它 仅 但 限于对 多媒体信息 的内容描述 , 并不考虑特征提取 和搜 索引 擎 是 如何 进 行 的 。
体 实现 , 望 了基 于 内容 的 多媒 体 检 索技 术在 数 字 图 书馆 中的 应 用价 值 。 展
【 关键词】 字图书馆 数
【 类 号] 2 0 6 分 G 5, 7
1 基 于 内容 的检 索
在传统 的基于关键词或 文本 的检索方法 巾, 对于多媒 体 信 息的检索都是基于文本描 述的 ,H B对多媒体信 息添加文本 说明。这种方法主要 是对含有多媒体信 息的网站和网页进行 分析 ,对 多媒体信息 的物理特征 和内容特征进行著 录和标 引, 把它们 转换成文本信 息或者添 J 文本说 明 , J 口 建立 标注数 据库 , 检索时主要在此数据库 中进行布尔匹配 。 图像 、 而 视频 包含 的信息 丰 富, 文本描述有时不能恰如其分地反 映其 中 的 内容 , 户也不能对 查询要求用 文字合理描述 , 用 导致检索 出的结果往往不能很好地符合用户 的需求。鉴于此 , 基于 内 容 的检索技术成为人们研究 的热点。 基于 内容的检索是一种新型 的多媒体检索技术。其主要 方法是依据 多媒体 内容的底层特征作为多媒体信息的索引 , 计算查询示 例和 目标 媒体对象的特征相似距离 , 按相似度匹 配进行 检索 。它是根据媒 体和媒体对 象的 内容及 下文 联 系 , 大规模 多媒 体数据库 中进 行检索 , 在 主要是 利用媒体 对 象的语 义 、 视觉 和听觉特征来进行检索 。它突破 了传统的基 于文本 检索技术 的局 限, 直接对 图像 、 视频 、 音频 内容进行分 析、 抽取特征 , 利用这些 内容特征建立索引并进行检索 , 使得 检索更加接近媒体对象。如利用图像r 的颜 色 、 I t 纹理 、 形状 , 视频中的镜头 、 场景 、 头 的运 动 , 镜 声音 中 的音 调 、 响度 、 色 音 等。它的研究 目标是提供在 没有人类参与的情况下能 自动识
多媒体数据库及基于内容检索

多媒体数据库及基于内容检索在当今数字化信息爆炸的时代,多媒体数据如图片、音频、视频等在我们的日常生活和工作中无处不在。
为了有效地管理和利用这些海量的多媒体信息,多媒体数据库应运而生。
同时,基于内容的检索技术也成为了从多媒体数据库中快速准确获取所需信息的关键手段。
多媒体数据库是一种能够存储、管理和处理多媒体数据的数据库系统。
与传统的关系型数据库不同,多媒体数据库需要处理的数据类型更为复杂多样,包括图像、音频、视频、文本等。
这些数据不仅具有大容量、高维度的特点,还存在着语义丰富、结构复杂等问题。
因此,多媒体数据库在数据模型、存储结构、索引机制等方面都有着独特的设计和实现方式。
在数据模型方面,多媒体数据库通常采用面向对象的数据模型或者扩展的关系模型来描述多媒体数据的复杂结构和语义关系。
例如,对于图像数据,可以将其表示为对象,包含图像的属性(如分辨率、色彩模式等)、图像的内容特征(如颜色直方图、纹理特征等)以及与其他数据的关联关系。
存储结构方面,由于多媒体数据的大容量特点,传统的磁盘存储方式可能无法满足性能要求。
因此,多媒体数据库常常采用分布式存储、缓存技术、数据压缩等手段来提高数据的存储和访问效率。
索引机制对于多媒体数据库的性能至关重要。
针对不同类型的多媒体数据,需要设计专门的索引结构。
例如,对于图像数据,可以基于颜色、形状、纹理等特征建立索引;对于音频数据,可以基于频率、时长、节奏等特征建立索引;对于视频数据,可以基于关键帧、镜头切换、运动轨迹等特征建立索引。
基于内容的检索是多媒体数据库中的核心技术之一,它允许用户根据多媒体数据的内容特征而非仅仅是元数据(如文件名、创建时间等)来进行检索。
基于内容检索的基本思想是首先对多媒体数据进行特征提取,然后将提取的特征与用户输入的查询特征进行匹配,从而找到相关的多媒体数据。
在特征提取方面,需要根据不同类型的多媒体数据采用不同的方法。
对于图像数据,可以提取颜色、形状、纹理等特征;对于音频数据,可以提取频谱、音色、节奏等特征;对于视频数据,可以提取关键帧特征、镜头特征、运动特征等。
数字图书馆的基于内容图像检索系统研究

【 摘 要】 针对数 字图书馆的数 字图像检索问题, 文章给 出了数 字图书馆构 ̄, - gq 内容的图片检 索数据库 生成子 系统和数据
.
库 查询 子 系统 实现 方 案 , 讨 了检 索 的 原理 和 方 法 , 究 了数 字 图像 特 征 的提 取 典 型 算 法 。 索的 网络 协议 标 准 采 用 M P G一 研 探 研 检 E 7 究结 果表 明本 系统 具 有 一 定 的理 论 价 值 和 实 用价 值 ,
理、 保存 、 检索问题已凸现出来 , 作为信息 资源的聚宝箍和集散 地的数字化图书馆正 日益吸引着各方人士的关 注。 从 图书馆的信息数据 库的角度来看 .普通的数据库 已升
级 为 多 媒体 数 据 库 。 传 统 的 图 书 馆 基 于 义本 和数 据 的 检 索 方 式 已不 适 应 对 多 媒体 数 据 进 行 检索 .必 须在 原 有 数 据 库 的 基 础 上增 加多 媒 体 数 据 类 型 。本文 主 要 针 对 图像 数据 的特 点 . 给
出基 于 内容 的 静 止 数 字 图 像 检 索方 法 。并在 原 有 数 据 库 的基
图 1 数 据 库 生 成 子 系 统
( ) 字 图 像 数 据库 壹 询 子 系 统 二 数 数 字 图像 数 据 库 查 询 于 系 统 结 构 框 图 如 图 2所 示 .其 工 作 原 理 是 :片 户通 过查 询 接 口 的友 好 的图 形 用 户 界 面 向 检 索 j 系统 提 供 数 字 图像 特征 ,检 索 引 擎 利 用 数 字 图 像 数 据 的 相 似 性 测 度 算 法 , 拟 人 的认 知 过 程 , 似 得 到数 据 库 的排 队 , 模 近 检 索 引 擎 通 过 索 引过 滤器 达 到 快 速 的 目的 ,从 而 时 以检 索 到 数 据库 中 的数 据 图 像 数 据 。
多媒体信息检索技术的研究

多媒体信息检索技术的研究一、多媒体信息检索技术概述多媒体信息检索技术(Multimedia Retrieval Technology)是指对多媒体数据进行分析、处理和检索的技术手段。
多媒体指的是丰富多彩的数字化信息形式,包括图像、音频和视频等形式。
多媒体信息检索技术的研究目的是为了使用户能够更加方便、快捷地获取和利用多媒体信息资源,以促进信息化时代信息的利用和传递。
二、多媒体信息检索技术分类多媒体信息检索技术主要包括以下三个方面:1.文本-图像检索技术文本-图像检索技术是指在通过用户输入关键词的方式检索图像时,系统能够自动从大量的图像数据集合中找到与用户输入的关键词有关的图像,并将其返回给用户。
该技术是应用最广泛的多媒体信息检索技术之一。
2.音频检索技术音频检索技术是指通过音频信号的频谱分析、信号处理等手段,从大量的音频数据中自动检索出与用户需求相关的音频文件。
音频检索技术在音乐、语音辨识等领域具有重要应用。
3.视频检索技术视频检索技术是指对视频数据进行处理和分析,以便用户可以更便捷地获取和利用视频信息资源。
视频检索技术在视频监控、影视、教育等领域得到广泛应用。
三、多媒体信息检索技术研究进展1.图像特征提取图像特征提取是图像检索中的核心技术,其目的是提取图像的关键特征点,使得对于同一个主题的图像拥有相似的特征点。
近年来,图像特征提取技术得到了广泛的应用,在图像分类、目标识别等领域发挥了重要作用。
2.音频信号处理音频检索技术在音乐、广告等领域得到广泛的应用。
音频信号处理是其中的核心技术,其主要目的是将音频文件转换成数字信号,并进行降噪、去除干扰等处理,以提高检索的准确性。
3.视频内容分析视频检索技术中的重要技术之一是视频内容分析,其目的是对视频进行分析,提取出其中的重要内容,以实现更加精确地检索。
近年来,随着视频检索技术的不断发展,视频内容分析技术也得到了广泛的应用。
四、多媒体信息检索技术应用案例1.搜索引擎搜索引擎是多媒体信息检索技术最成功的应用之一。
国内多媒体信息检索研究进展

年 份 2 0 0 0 l 2 0 0 1 l 2 0 0 2 I 2 0 0 3 I 2 0 0 4 I 2 0 0 5 I 2 0 0 6 l 2 0 0 7 I 2 0 0 8 l 2 0 0 9 l 2 0 1 0 l 鲥
研讨会。而多媒体搜索检索联合会( A s s o c i a t i o n f o r M u l t i m e d i a S e a r c h a n d R e t i r e v a 1 )则 是 针对 可搜 索 MI R图书馆 的研 究 进行 的研讨 。 由于笔 者水 平 的 局限 , 本文主要介绍国内多媒体信息检索研究进
摘
广东广州 5 1 0 0 0 0 )
要: 根 据对 2 0 0 0年以来 国内多媒 体信息检 索进行文献计量统计, 从基于 文本 的、 基于 内容的 、 基 于 XML的 多媒 体
信息检 索以及数 字图书馆 MI R 四个方面分析 了目前 国 内MI R 研究现状 , 简单 比较三种检 索的优缺点 并提 出建议 。 关键词 : 多媒 体信息检 索; 数 字图书馆 ; 研 究 中图分类号 : G2 5 2 . 7 ; T P 3 9 1 . 3 文献标识码 : A
于对图像 、 视频、 音频进行根据特征的相似度搜索 为重点 的计算机视觉算 法。而我们 目前 比较常用 的 M I R系统 则是 产生 于 2 0世 纪 9 0年 代 的
Q B I C、 V i r a g e和 We b S e e k系 统 。
峰。2 缓慢发展阶段( 2 0 0 6 — 2 0 1 0年) , 多媒体信息 检索应用范围越来越广 ,学者对于多媒体信息检
数字图书馆音视频资源信息检索技术研究

数 字图书馆 音视频资源信息检索技 术研 究
文/ 胡 琥 宇
给 出个性化 的满足用户需求的检索 内容 。
文 中首先探 讨 了数 字 图 书馆 资源检 索技 术 的现 状 ,接 着就 全 文 检 索技 术、基 于 内容 的检 索技 术 、智 能信 息检 索技 术 进行 了探 讨 ,在 分析 了数 字 图 书馆 检 索发 展 存在 的问题 后对 基 于 内容 的音 频 检 索和 视频 检 索 实现 进 行 了发 展 分析 ,这 一研 究对 于进 一步提 高 当前 的数字 图书馆 的建设 具有
这一背景 ,对 当前数字 图书馆 的检索 技术现状 及存在的发展 问题进行 了简要 的分析 ,进 而提 系统通过 匹配用户输入检索词与数据库 中的特 传统 所用 的检 索方 法 主要是 以书名、 关 征来处理查询 ,之后将结果反馈给用户。 出了音视频检索技术 ,这一研究对于进一 步提 键词为索引来进行检索 ,检索对象主要是文本 文献 ,而数字化 图书馆的馆藏资源主要是 以多 5 音视 频 技 术 小 结 高当前的数字图书馆的建设具有一定的意义 。 媒体文件为主 ,以作者 、关键词为索 引的检索
2资源检索技术 的现状概述
技术无法正确检测到多媒体文件 的内容 。如有 5 . 1优 势 段 视频 ,名称 是 2 0 1 2年政 府工 作报告 ,但 基 于 内容 的检索 技术是 一种 超越传 统检 2 . 1 全 文 检 索技 术 是报 告 中有 一段是 2 0 1 1 年 的政府 工作 回顾 , 索 技术的先进 技术 , 它不再仅仅 以关键词作为 若我们想要寻找这个片段 时,根据关键词进行 全文 检 索是 指在 检索 时 ,检 索范 围扩 大 检索时 ,是无法搜到包含此信息的视频的。 检索依据 ,而是通 过对音频 、视频 、图像等多 到文章 中的每一个词汇 , 以字或词为检索单位 , 媒体 文件进行分析 、特征提取 ,并对这些特征
数字图书馆多模态检索关键技术研究与应用

数字图书馆多模态检索关键技术研究与应用随着数字化时代的快速发展,图书馆逐渐从传统的纸质资源向数字媒体资源转变。
数字图书馆的建设与发展,已经成为当今图书馆事业的重要发展方向。
而多模态检索技术在数字图书馆中的研究与应用,被广泛关注和探讨。
数字图书馆的特点在于其多媒体资源的呈现形式。
传统的图书馆仅仅是以文字作为信息载体,而数字图书馆则拥有丰富多样的媒体资源,如文本、图像、音频、视频等。
多模态检索技术的研究旨在从这些多媒体资源中提取有效信息,实现准确、高效的检索。
多模态检索技术的关键在于多媒体信息的特征提取和融合。
传统的文本检索技术主要侧重于利用关键词匹配的方式进行检索,而在多模态检索中,需要将图像、音频等非文本信息转化成可供计算机处理的数值特征。
图像特征提取可通过提取颜色、纹理、形状等特征进行,而音频特征可通过提取频率、振幅等特征进行。
提取到的多媒体特征需要进一步融合,以实现多模态信息的一体化表示和处理。
多模态检索技术的应用涉及到多个领域。
在数字图书馆中,多模态检索技术可以提供更加方便、快捷的信息检索体验。
用户无需仅仅依靠关键词进行文本检索,而可以通过输入图像或音频等多媒体信息,实现更加精确和准确的检索结果。
此外,多模态检索技术还在教育领域、医疗领域、文化传承等方面发挥着重要作用。
例如,在教育领域,学生可以通过拍摄一幅图像或录制一段音频,直接获取相关课程资料和学习资源。
然而,多模态检索技术在应用中也面临着一些挑战和问题。
首先,多模态信息的特征提取和融合仍然是一个复杂而困难的问题。
由于非文本信息的多样性和复杂性,有效的特征提取方法仍需进一步深入研究和改进。
此外,由于不同媒体之间的异构性,多模态信息的融合方法也需要根据场景需求进行定制化设计。
此外,多模态检索技术在隐私保护方面也需要重视。
由于多模态信息携带了更加丰富和敏感的个人隐私,如人脸、声音等特征,如何在保护用户隐私的前提下,实现多模态信息的有效检索和利用,是一个亟待解决的问题。
基于内容的多媒体信息检索在数字图书馆中的应用

1 引 言
统 、 识科学 、 户模型 、 认 用 图像 处 理 、 式 识 别 、 据 模 数 库 管 理 系 统 以及 信 息 检 索 等 领 域 的 知识 和 先 进 技
术 。 基本 思 想是 以信息 和 信息 对象 的 内容语 义 、 其 特 还包 括 大 量 的 图形 、 图像 、 声音 、 画 、 动 视频 等 数字 化 征 及 上 下 文联 系 为 依 据 进 行 检 索 。 B 的信 息 类 型 CR
l rre ,n po t u te xsig p o lms n d v lp n t n S a t efeil ma a e n ma e i ais d ins b a p t h e it rb e a d e eo me t r d,O s o f t y n e e v n g a d k
fl d ' l m n n e fte m lmei noma o e d出 a l rr s ul eeo e ta d u so ut daifr t n o t i l i ai .  ̄ p h i i fh b e
K e r sc ne t l me i; fr t n rt v ;d gtl l rr;p l ain y wo d :o tn; t dai omai er e ii i aya pi t mu i n o i a b c o
引, 存储 于特 征 库 中 ; 检 索 时 , 户 只需 把 自己对 在 用 图像 的模 糊 印象描 述 出来 . 就可 以通过 多次 的近 似 匹
配 , 大容量 图像 库 中查 询 到所需 图像 。 在
在 过去几 年里 . 人们 已经 提 出 了许 多不 同的基 于
基 于 内容 的信 息 检 索 (ot tB sd R tea 内容的 图像 信息检索 系统 . 中最有名 的是 I M 开发 C ne ae e i 1 n rv ) 其 B 简 称 C R, 一种 新 型 的检 索 方式 , 融 合 了知 识 系 的基 于 内容 的图像信 息检索 系统 Q I 该 系统允许 用 B 是 它 B C.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字图书馆中基于内容的多媒体检索技术研究
摘要:数字图书馆的迅猛发展使得多媒体信息资源的组织与管理成为数字图书馆发展的一个关键性问题,而多媒体信息检索技术也就成为数字图书馆中的核心技术,因而在数字图书馆中引入基于内容的多媒体检索技术成为了必要。
关键词:数字图书馆;信息检索;基于内容的多媒体检索
1 基于内容的多媒体检索原理
传统的多媒体检索技术,主要是通过对多媒体进行人工分析,对多媒体物理特征和内容特征进行文字著录或标引,建立类似于文本文献的标引著录数据库,并通过检索这些数据库以获得多媒体编号,进而利用这些编号索取实际多媒体。
这种检索技术存在不足:①特征不具有代表性,带有主观性;②人工处理速度慢;③特征信息得不到充分利用;④结果信息提取慢。
基于此原因有必要研究基于内容特征的检索(CBR,Content-Based Retrieval ) ,克服传统检索方法的不足,提高多媒体检索效率。
CBR是指直接根据描述媒体对象内容的各种特征(如图像颜色,纹理,形状等)进行检索,它能从数据库中查找到具有指定特征或含有特定内容的图像(包括视频片段),区别于传统的基于关键字的检索手段,融合了多媒体理解、模式识别等技术。
一般说来,基于内容的图像信息检索主要是根据图像的颜色、纹理、形状开展;而对视频信息检索主要通过对视频分割、视频聚类、关键帧抽取、运
动特性抽取、最后完成视频检索。
数字图书馆拥有海量多媒体信息资源,只有充分利用基于内容的多媒体检索技术,才能挖掘海量资源库中的信息资源,为广大读者服务。
2 基于内容的多媒体检索分类及检索方法
根据检索对象的不同,基于内容的多媒体检索又可以分为基于内容的文本检索、基于内容的图像检索、基于内容的视频检索和基于内容的音频检索四种检索。
2.1 文本检索
基于内容的文本检索是涉及文档内容查询的检索技术。
其检索模型的构造是基于内容文本信息检索的核心技术,包含3个方面的内容:文档与用户查询的表示、查询匹配策略和匹配结果的相关度表示。
典型的文本检索模型又分为布尔模型、向量空间模型和概率模型3种。
2.1.1 布尔模型(Boolean Model)
该模型将文档中的特征简单地表示成二元变量,某特征词出现则为1,否则标识为0。
文档的相似度则基于布尔量进行计算。
该模型有点是简单、速度快,缺点是不够精确,不能反映不同“项目”对一个文档的重要程度的差异。
后来陆续有学者针对布尔模型不足,提出
改进算法即扩展的布尔模型。
2.1.2 向量空间模型(Vector Space Model,VSM)
该模型也称为词袋(Bag of Words,BOW)表示法,该表示法有一个关键假设,即文章中词条出现的先后次序是无关紧要的,个特征词
对应特征空间的一维,将文本表示成欧氏空间的一个向量。
该模型思想是将文档D(Document)看作是由一定代表性的特征项组成;而特征项t(Term)是指出现在文档中能够代表文档性质的基本语言单(如字、词等),也就是通常所指的检索词。
这样一个文档D就可以表示为D(t-1,t-2,…,t-n),t-i(I=1,2,…n
2.1.3 概率模型(Probablistic Model)
该模型考虑词项、文档之间的内在关联,依据关联信息计算文档类别归属大小,据此推算文档类别。
布尔模型和向量空间模型都将文档表示词条视为相互独立的项,忽略了表示词条间的关联性。
概率模型则考虑到词条、文档间的内在联系,利用词条间和词条与文档之间的概率依赖性进行信息检索。
其中二值独立检索模型(BIR)是一种实现简单且效果很好的概率检索模型。
概率推理网络是一种新型的检索模型,它模拟人脑的推理思维模式,将文档内容与用户查询匹配的过程转化为一个从文档到查询的推理过程。
2.2 图像检索
基于内容的图像信息检索主要根据图像的特征进行,一般地,图像特征包括:①图像的画面内容特征(如图像颜色分布、纹理结构、形状等) ;②图像的主题对象特征(如图像所描述的人、车、建筑等) ;
③图像的著录特征(如作者、时间、地点等) ;④图像的移动和组合特征(如影象中的场景) 。
目前对图像内容检索研究比较多的是基于图像的颜色、纹理、形状等特征开展的,下面重点论述此三方面的检
索。
2.2.1 基于颜色特征的图像检索
颜色是一种重要的视觉信息属性,在图像索引与检索中是一种很有用的特征。
相对于其他特征,颜色特征非常稳定,具有对旋转、平移、尺度变化、各种形变不敏感特性,而且颜色特征计算简单。
因此,颜色特征成为现有检索系统中应用最广泛的特征。
较早从事颜色特征进行图像检索的方法是直方图,通过统计各不同灰度值的图像像素数
量,达到对图像的信息描述。
2.2.2 基于纹理特征的图像检索
纹理描述了图像或图像区域所对应的景物的表面性质。
包括表面结构组织及其与周围环境关系的许多重要信息,纹理特征是一种统计特征,具有旋转不变性,并具有较强的抗噪音能力。
一般地,体现图像纹理特征的具体指标有均匀度、对比度、方向,其中均匀度反映纹理的尺寸,对比度反映纹理清晰度,方向反映实体是否有规则的方向性。
2.2.3 基于形状特征的图像检索
基于形状检索基本上是从形状的轮廓特征和形状的区域特征来建立图像的索引,主要有形状轮廓特征和形状区域特征两重描述。
形状轮廓特征主要包括:直线段描述、样条拟合曲线、傅立叶描述子、内角直方图、高斯参数曲线等。
而形状区域特征主要包括:形状的无
关矩、区域的面积、形状的纵横比等。
2.3 视频检索
视频检索实际上属于图像的检索。
视频除了具有一般静态图像的特征外,还具有动态性,如镜头运动的变化、运动目标的大小变化、视频目标的运动轨迹等,所以视频又称动态图像,是一组图像按时间的有序连续表现,它的表示与图像序列、时间关系有关。
视频数据可用幕、场景、镜头、帧等描述。
视频序列主要有镜头组成;镜头由一系列连续的帧组成;帧是一幅静态的图像,是组成视频的最小单位;场景含有多个镜头;幕是由一系列的相关场景组成,表示以完整的事件。
视频检索的前提是需要利用可视化特征视频数据建立有效的索引。
2.4 音频检索
音频就是对声音数字化后得到的结果。
音频一般采用音量、音调、音强、带宽、音长和音色等属性来描述。
其中音量、音调、音强、带宽和音长等属性易于通过技术手段进行量化建模,而对音色的处理却相对复杂,对其进行分析和捕捉较为困难。
音频检索同视频检索相类似,音频特征随时间而动态变化,分析时计算不同时间段的声波信号的波形,并将波形的均值、方差和自相关系数等记录在波形数据库中。
对音频数据进行采样、帧抽取后,运用方差分析等统计方法对音调、音量、音强等音频特征进行量化,并在音频数据库中记录这些量化值,形成索引树,在检索时可以利用这些特征进行示例和指定特征查询。
参考文献:
[1] 黄如花,王梅,黄晓斌.数字图书馆原理与技术[M].武汉:武汉
大学出版社,2005.
[2] 吴玉萍.基于文本的多媒体检索与基于内容的多媒体检索的比较
[J].信息科学.2007(5).
[3] 管计锁,梁胜利.数字图书馆的信息检索技术[J].图书馆理论与
实践.2001(4).
[4] 翟中文.基于内容的多媒体信息检索技术研究[J].河南图书馆
学刊.2005(25).
[5] 罗德勇,明海.数字图书馆中基于内容的多媒体检索研究[J].情报检索.2003(1).
[6] 徐建华.一种新型的多媒体检索技术—基于内容的检索[J].情
报学报.2000(19).
[7] 黄蕾.多媒体数据基于内容检索综述[J].情报探索.2000(4).
[8] 李敏.论数字图书馆的信息检索技术[J].津图学刊.2003(3).
[9] 徐建华.一种新型的多媒体检索技术——基于内容的检索[J].情报学报.2000(19).
[10] 杨慕莲,张芳芳.论数字图书馆中的多媒体信息系统的构建
[J].咸宁学院学报.2004(5).
[11] 黄蕾.多媒体数据基于内容检索综述[J].情报探索.2000(4).
Research on Multimedia Retrieval Based on Content in Digital Library
Abstract:With the rapid development of Digital Library,the organization and management of multimedia resources becomes the critical problems,and the retrieval technology ofmultimedia resources becomes the core technology of Digital Library.As a result,it is necessary to introduce and use the content-based information retrieval ofmultimedia resources.
Key Words: Digital Library;Information Retrieval;Content-Based Multimedia Retrieval。