多媒体元数据研究
多媒体数据语义建模与检索

信息发布 , 以及设备和 固定 资产等进行全面管理 的系统。本文对媒 体资产 管理 中的视频数据的结构化分析 、 镜头关键帧检 测、 场景 聚类与场景
f ) 头 关 键 帧 2镜
个镜 头的关键帧就是反 映该镜 头中主要信息 内容 的一帧或几 帧 图像 , 用关键帧来代表镜 头。 在存储容量有限时 , 可以通过仅存储关 键 帧达到数据压 缩的效果 : 另外用关键 帧代表镜头 . 对视 频可以用基 于 图像 的技术进行检索 由于场景 中 目标 的运动 或拍摄时摄像机本身 的变焦或摇镜头等 操作 . 一个镜头通常要用几幅关键 帧。关键帧应提供一个 内容尽量丰 富的概要 . 不同的帧 图像 比类似 的帧图像携带更 多的信息 . 以当要 所 提取 多幅关键帧时 . 主要考虑它们 之间的不相似性 提取镜头关键帧 的一种方法是从镜头中选取相关 度最小 的 k 帧作为关键帧。 () 3 镜头聚类 镜头 聚类的方法有基于模 式分类和针对特定 视频类型进行聚类 两种 方式 基于模式分类的方法可利用特征对模式进行分类 . 镜头聚 类需 要提取关键帧 的特征 .并把关键帧用对应 的特征空 间点表示 . 通 过将 特征空 间点聚集成团 . 然后再将 它们 映射 回原空 间以得到分类结 果【 ” 。 比较典 型的视频节 目包括新闻、 体育 、 故事片 、 广告 。可以针对某 类特定视频节 目的特点 .利用该类视频节 目专 门的领域知识或结构知 识建立模型并帮助进行镜头聚类 对 于新闻报道 . 每 晴节的关键帧有 固定组成 : 播音员头像 、 播音员名字 、 新闻摘要 图标和台标。这个关键帧 模 型就包含了一组相互间有一定空间关系 的区域模型 建立模型后 . 可 以采用模板匹配和直方 图匹配法检测某帧画面是否符合该模型目 。 () 4 场景转换 图和多层树
数字视频资源元数据及描述

(源载体)
第四,视音频资源著录层次包括集合层、个 体层以及分析层。以单个视频文件或无层次的实 体视频资源为单位编制个体层记录。为了满足用 户深度检索和利用视频资源的需求,适当地以个 体层视频中析出的片段、场景、镜头为单位编制 分析层记录。此外,有选择地为系列视频资源编 制集合层记录,以便全面地揭示一种视频资源的 全貌。
《数字资源元数据规范》的特点 第一,适用范围不局限于视频资源,还包括音 频资源、图像资源以及视音频数据库。 第二,根据实际文化发展中心及分中心的实际 需求和资源特点,《数字资源元数据规范》明确规 定按集合层、个体层以及分析层三层次设计元数据 方案,揭示数字资源(含数字视频资源)。
2.《中央电视台音像资料编目细则》
2005年,中央电视台音像资料馆落成后,参考 《都柏林核心元素元数据集》和《广播电视音像资 料编目规范:第2部分广播资料》制定了《中央电 视台音像资料编目细则》,由题名、主题、描述、 责任者、出版者、版权、语种、日期、类型、格式 、时空覆盖范围、来源以及关联这12个元素构成, 并设置了67个修饰词。
图1:图书馆自行策划、出品、制作的视频
韩国国立中央图书馆的数字图书馆创建了多媒体中心。 在多媒体中心设立了视频拍摄室和视频制作室。
二、我国视音频资源元数据发展现状
1. 广电总局《广播电视音像资料编目规范 第1部分:电视资料》
2004年,国家广播电影电视总局发布的 GY/T 202.1-2004《广播电视音像资料编目规 范 第1部分:电视资料》行业标准在节目层 复用了15个DC元素,并设置了97个修饰词。
4. 文化部文化发展中心的《数字资源 元数据规范》
2013年6月-2014年6月,北京大学信息管理系 主持的“数字资源元数据标准规范、交换标准规 范及著录规则”是“国家公共文化数字支撑平台 数字资源标准规范”项目的子课题之一,其研究 成果由《数字资源元数据规范》和《数字资源编 目规则》两部分构成。
多媒体积件管理库的开发与应用

多媒体积件管理库的开发与应用多媒体素材管理库是一种集中存储、管理和共享多媒体素材的系统。
它可以用于创建、组织和维护多媒体内容和元数据,提供与其他应用程序的互操作性和支持多种数据格式。
本文将介绍多媒体素材管理库的开发和应用,包括其概述、架构、组件以及为什么需要使用它,以及它对于媒体产业的重要性。
一、概述多媒体素材管理库可以管理各种类型的数字多媒体,包括音频、视频、图像和文本。
它具有以下特点:1. 集成性:多媒体管理库可以集成多种数字媒体文件格式、多种元数据格式以及多种使用场景。
2. 可扩展性:多媒体管理库可以支持添加新的媒体格式、新的元数据格式和新的功能等,从而提高了其可扩展性以满足新的需求。
3. 共享性:多媒体管理库可以支持多个用户共同管理和协作各种媒体资源,实现资源共享和协同工作。
4. 安全性:多媒体管理库可以通过权限管理保证数据的安全性,使得只有授权用户才能对特定资源进行操作。
5. 自动索引和分类:多媒体管理库可以通过自动化算法对媒体资源进行索引和分类,减少人工干预,提高工作效率。
二、架构多媒体素材管理库的系统架构包括以下组件:1. 存储组件:存储组件用于存储所有的数字媒体文件,包括音频、视频、图像和文本等。
2. 索引组件:索引组件用于对存储的媒体文件进行索引和分类,以实现快速查找和检索。
3. 元数据组件:元数据组件用于存储和管理每个媒体资源的各种元数据信息,例如名称、描述、作者等。
4. 检索组件:检索组件用于向用户提供搜索和检索功能,让用户可以快速找到所需要的媒体资源。
5. 安全管理组件:安全管理组件用于对用户进行身份验证和授权管理,保证只有授权用户能够对资源进行访问和操作。
6. 协作组件:协作组件用于实现多用户的协同工作,例如共享媒体资源、版本控制、讨论与评价等。
三、组件1. 存储组件存储组件用于存储所有的数字媒体文件,包括音频、视频、图像和文本等。
存储组件可以采用分布式存储技术,将文件存储在多台服务器上,从而提高存储容量和数据可靠性。
多媒体数据库技术

8.2 多媒体数据模型
• 目前,建立多媒体数据模型的方法大多是在关系 数据模型和面向对象数据模型基础上进行改进。 主要方法有如下两种: • ● 扩展现有关系数据库管理系统(RDBMS),用于 支持类似于二进制对象的各种多媒体对象。将 RDBMS从基本的二进制对象扩展到继承和类这一 概念。 • ● 转变为发展成熟的面向对象数据库,以支持 SQL语言。将数据库和应用软件转变为面向对象 的数据并使用面向对象的语言,如C++,或使用 对象的SQL来开发。
01.04.2019
28
• (4) 关系模型不能进行具有某种复杂度的长 周期事务处理,例如需要对被多个用户访 问的分布式多媒体对象进行更新操作。 • 所以,为了能在多媒体数据库中使用关系 数据模型,必须对关系数据库进行必要的 扩充和改进。
01.04.2019
29
8.2.3面向对象模型
• 20世纪90年代以来,面向对象模型是另一 种表达多媒体数据库的主要方法,许多多 媒体应用中的数据管理都建立在面向对象 模型上。
01.04.2019 21
Å Ä ¸ î Ê À ½ ç
ß ¼ Â Ó ë Î ï À í Ê ý ¾ Ý Ä £ Ð Í
CDM
Ö Ê Ï µ Ê À ç RW ½
LDM LDM LDM
PDM PDM PDM
CDM CDM
¯ ³ ¼ É à Ã ¶ ½ Ì å ¸ Å Ä î Ê ý Ý Ä ¾ £ Ð Í MCDM
01.04.2019
30
• 面向对象数据库模型类的概念对多媒体数 据特别有用。一旦定义了类,所有类中的 对象就被赋予了类的属性。类定义在应用 软件的开发速度上也有着明显的优势,并 且有利于为开发和维护复杂多媒体应用软 件提供更完善的功能及更广泛的对象性能。 此外,对象数据库的功能,如消息传递、 可扩展性、支持分层结构,对于多媒体系 统来说也都是非常重要的。
国标t26760-2011

国标t26760-2011
t26760-2011是中国标准化管理委员会发布的《多媒体技术》标准,全面规范了多媒体技术在相关应用中的答覆规范。
它所涵盖的内容包
括多媒体术语、表示、接口、开发环境、多媒体文档的采集和元数据
的捕获、以及多媒体内容的处理、分发和消费等一系列要素。
t26760-2011将多媒体分为音频和视频两种类型,并给出了各类型的处理步骤,标准规定多媒体内容的技术实现应从采集、转换、编码、存储、访问、播放和传输等各过程入手。
其中,音频多媒体内容应按
照信号模型分别作出理解、特征提取、编码录制等操作;而视频多媒体,应运用自动摘要技术、标签方案、描述语言处理等方法做好处理
和编码。
t26760-2011还提出了多媒体元数据的捕获,规定应作出必
要的描述,以便于让多媒体内容的使用者可以追溯其的原始信息,并
能以不同的方式来搜索或查询信息。
t26760-2011涉及到的多媒体技术,旨在给多媒体内容的创作、发布以及应用进程提供更加高效的技术保障,完善整个多媒体信息的管理。
有效地实施t26760-2011,不仅可以提升多媒体内容经营的效率,
提高多媒体信息产品的发展水平,还可以使研发和应用者、使用者在多媒体内容创作、使用、检索及其他功能上获得明显的积极效果。
基于UGC图片元数据的目的地形象感知以北京为例

基于UGC图片元数据的目的地形象感知以北京为例一、本文概述随着互联网的快速发展,用户生成内容(UGC)已经成为人们获取和分享信息的重要途径。
在旅游领域,UGC图片作为一种直观、生动的信息载体,对于塑造和感知目的地形象起着至关重要的作用。
这些图片不仅包含了丰富的视觉信息,还通过元数据(如标题、描述、标签等)传达了拍摄者的意图和情感。
因此,研究基于UGC图片元数据的目的地形象感知,对于提升旅游目的地的知名度和吸引力具有重要意义。
本文以北京为例,探讨了如何利用UGC图片元数据来感知和分析目的地形象。
我们对UGC图片进行了收集和整理,提取了其中的元数据信息。
然后,通过文本挖掘和图像识别等技术手段,对这些元数据进行了深入分析和挖掘。
在此基础上,我们总结了北京在UGC图片中的形象特征,包括自然景观、历史文化、现代都市等多个方面。
我们还探讨了不同拍摄者(如游客、当地居民、专业摄影师等)对目的地形象的感知差异及其原因。
本文的研究不仅有助于我们更深入地理解UGC图片在目的地形象感知中的作用,还为旅游目的地管理和营销提供了有益的参考。
通过分析UGC图片元数据,旅游目的地可以更好地把握游客的需求和兴趣点,制定更加精准的营销策略。
本文的研究方法和结论也为其他领域的信息分析和形象感知研究提供了一定的借鉴和启示。
二、文献综述随着互联网的快速发展,用户生成内容(UGC)在塑造和传达目的地形象方面扮演着日益重要的角色。
UGC,主要包括用户发布的图片、视频、文字评论等,不仅数量庞大,而且形式多样,为用户提供了丰富的信息来源,同时也为目的地形象研究提供了新的视角。
在目的地形象感知领域,早期的研究主要关注传统媒体如旅游指南、广告等如何塑造和传播目的地形象。
然而,随着社交媒体和UGC 的兴起,越来越多的学者开始关注UGC在目的地形象感知中的作用。
这些研究普遍认为,UGC能够真实反映游客对目的地的感知和体验,为目的地管理者提供了宝贵的市场情报和形象塑造建议。
国家图书馆关于中文Metadata标准的研究与制订

国家图书馆关于中文Metadata标准的研究与制订孙蓓欣陈华明随着数字图书馆的进展,元数据的研究日益受到重视。
国家图书馆在开展多项数字图书馆研制项目的进程中,关注国外此项研究与利用的有关情况,并开始了中文元数据标准的研究与制定工作。
一、数字图书馆元数据工作回顾信息技术的高度发展,给传统的图书馆界提出了新的挑战。
中文文献资源的共建共享已经成为信息界和图书馆界共同关心的话题,近年来,随着中国数字图书馆研究与开发的不断深入,数字化信息资源急剧增加,中国国家图书馆也在数字资源元数据的研究方面做了一些有益的尝试。
自20世纪90年代中期以来,国家图书馆一直致力于数字图书馆的研究和建设,近十年来,我们所开展的一些数字图书馆项目在元数据的创建和应用方面取得了丰富的经验,其中包括:SGML 的图书馆应用、基于特征的多媒体信息检索系统、中国数字图书馆演示系统、知识网络——数字图书馆系统工程、中国试验型数字图书馆、拓片数据库的研制以及中国数字图书馆网站的部分资源。
上面列出的项目包括但不仅限于元数据的创建和应用,下面,我简单地介绍一下这些项目所涉及的元数据应用的情况。
1. 文化部科研项目《SGML的图书馆应用》该项目是1997年文化部立项的科研项目,与北京大学计算机研究所合作开发。
国家图书馆现代文津信息技术研究中心参照国外利用SGML的情况,开发了基于SGML的图书馆应用系统,使用户可以通过Internet的WWW浏览器直接存取SGML应用系统的数据。
系统于1998年2月开始在我馆提供给用户使用,取得了良好的效果。
2.基于特征的多媒体信息检索系统的研究该项目是中国科学院技术研究所与国家图书馆的合作项目,列入1996年国家863攻关计划,现已通过技术鉴定。
项目主要研究基于内容特征的图像信息检索,实现按照图像的纹理、颜色、形状等特征对图像信息进行检索;研究中文信息的全文检索,利用相关检索机制,提高检索效率;研究信息存储管理方法,实现跨平台的客户端检索。
元数据参考模型CIDOC-CRM与OAIS

两个重要的元数据参考模型——CIDOC CRM与OAIS1、基于本体的概念参考模型CIDOC CRM(Conceptual Reference Model)CIDOC面向对象的概念参考模型的研究机构是ICOM/CIDOC Documentation Stadards Group,2000年9月,在CIDOC CRM SIG和ISO/TC46/SC4/WG9的共同努力下,CIDOC CRM 开始向国际标准发展,到2006年9月,被吸收为ISO 21127国际标准。
CIDOC概念参考模型表述了一个“文化遗产信息本体”的概念,也就是为文化遗产文档中描述的模糊和明确的概念与关系提供了定义和规范的架构。
“本体”就是用来描述概念、实体及它们之间关系的表现形式的概念模型。
CIDOC CRM提供一个通用并且可扩展的语义框架,使任何文化遗产信息都能用该框架描述,从而推动文化遗产信息的共享共识。
该概念模型的研究者准备使该模型成为领域专家和开发者阐述信息系统需求的通用语言,并且能够作为构建概念模型的准则指南。
通过这种方式,可以为不同的文化遗产信息资源提供必需的“语义连接”。
CIDOC CRM定义的结构是一个树型结构,第一层中的元素是树的根节点。
在该概念模型中的每一个元素都是一个类,除了根节点上的类,其余类都是由别的类派生出来的,并且部分类具有多重继承的特性,表9中用灰色底纹标出的元素就是与多重继承相关的类。
附表1 CIDOC 概念参考模型CIDOC CRM除了定义84个实体,还定义了141个属性,即对每一个实体都定义了与其他实体之间的关系,使实体实现了语义上的关联。
例如:E1 CRM Entity的属性定义P1 is identified by(identifies):E41 Appellation属性名称:P1被标识(标识)这里表示:E1 CRM实体用E41称呼来标识P2 has type(is type of):E55 Type属性名称:P2拥有类型(是其类型)这里表示:E55 Type是E1 CRM实体的类型P3 has note:E62 String属性名称:P3拥有注释这里表示:E62字符串是E1 CRM实体的注释其余关系在这里就不详细阐述了,相关文献可参考Definition of the CIDOC。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
---- 通常情况下,商标是二维图像,包含文本、图画或图片 以及象征性的颜色。二维商标可以分为三类:文字商标 (仅仅包含文字,适合用文本注释来描述)、图案商标(仅 仅包含图形或象征性标志,需要形状描述)、组合形式的 商标(包含字符和图形)。
4.3 MPEG-7的“推”应用
---- 特征(Feature) 指数据的特性。特征本身不能比较,而要 用有意义的特征表示(描述子)和它的实例(描述值)。如图 像的颜色、语音的声调、音频的旋律等。
---- 描述子(Descriptor,D) 是特征的表示。它定义特征表示 的句法和语义,可以赋予描述值。一个特征可能有多个 描述子,如颜色特征可能的描述子有:颜色直方图、频 率分量的平均值、运动的场描述、标题文本等。
MPEG-1:存储和回放
MPEG-1制定于1993年,是针对1.5Mbps以下数 据传输率的数字存储媒介运动图像及其伴音编码 的国际标准,主要用于在CD-ROM上存储同步和 彩色运动视频信号。
MPEG-2:数字电视
MPEG-2出台于1995年,它是针对HDTV和DVD 等制定的3Mbps~10Mbps的运动图像及其伴音的 编码标准。它的出现使得基于CD-ROM的交互式 电视和数字电视成为了可能。
---- 面向消费者的选择技术可以用于个人化视听节目的应 用。在收集与个人相关的新闻节目方面,这甚至可以做 到比典型的VOD更进一步。例如,一个面向内容生产商 的选择技术可以在片段和镜头级从数据库中收集原始资 料。
“推”应用
2).个人化电视服务
-- 在广播领域,内容的描述可以辅助广播数据的选择,所选择的 广播数据形式可以是即时的或以后要观看的,或录像形式的。 对于个人化广播,提供给用户的数据可以按照用户自己的喜 好来对广播流进行过滤,其形式可以是自动方式的,例如根 据地理位置、年龄、性别或以前的选择行为自动选择,或是 半自动方式(基于预定的设置)。结合NVOD(准视频点播)服务, 可以基于关键帧实现步进/后退操作,加速节目的表现。对于 未来的广播服务,与节目中特定事件相关的交互功能也很重 要。
“拉”应用
6).通过听觉事件进行电影场景检索
---- 许多视觉场景是与声音事件相关的。例如在喜剧电影或 电视场景中,人们可以通过记忆的对话和台词来检索电 影的场景。另外,还可以通过明显的声音事件来检索, 例如通过观众的欢呼声和解说员的解说词检索足球进球 的场景,通过爆炸声检索战斗和破坏场景等。音轨中的 听觉事件也同样具有这样的检索能力。该应用利用语音 的描述和声音效果的描述来实现检索。
---- 描ቤተ መጻሕፍቲ ባይዱ值(Descriptor Value) 是描述子的实例。描述值与描 述模式结合,形成描述。
----
描述模式(Description Scheme,DS) 说明其成员之间的关 系结构和语义。成员可以是描述子和描述模式。DS和D 的区别是:D仅仅包含基本的数据类型,不引用其他D或 DS。如对于影片,时间结构化为场景和镜头,在场景级 包括一些文本描述子,在镜头级包含颜色、运动和一些 音频描述子。
---- 描述(Description) 一个描述由一个描述模式(结构)和一组 描述值组成。
---- 编码的描述(Coded Description) 是对已完成编码的描述, 满足诸如压缩效率、差错恢复和随机存取的相关要求。
---- 描述定义语言(Description Definition Language,DDL) 是一种允许产生新的描述模式和描述子的语言,允许扩 展和修改现有的描述机制。
---- (2) 描述数据的听觉化
---- 类似视觉数据的要求。
---- (3) 听觉数据格式
---- 数字音频(如MPEG-1音频、CD)、模拟音频(如录音带介质)、 MIDI(包括一般的MIDI和Karaoke格式)、基于模型的音频、产品数 据。
---- (4) 听觉数据类
---- 声音轨迹(自然音频场景)、音乐、原子声音效果(如掌声)、语音、符 号音频表示(MIDI、SNHC音频)、混音信息(包括效果)。
MPEG-7对视觉数据的描述
MPEG-7具体对视觉方面的描述子和描述模式有以下方面的要求:
(1) 特征类型
---- 视觉描述允许以下特征(与查询中使用的信息类型有关):颜色、视觉 对象、纹理、轮廓(草图)、形状、静止和动态图像、体积、空间关系 (相对于图像和图像序列中的对象空间和拓扑关系,这个关系是空间 合成关系)、运动(如视频镜头中的运动,用于利用时间合成信息来检 索等方面)、变形(如对象的弯曲)、视觉对象的源和它的特性(如源对 象、源事件、源属性、事件、事件属性等)、模型(如MPEG-4 SNHC)。
(2) 利用描述进行数据可视化
---- MPEG-7数据描述应该容许被索引数据或多或少地粗略可视化。
(3) 可视数据的格式
---- 支持以下可视数据格式:数字视频和电影(例如MPEG- 1/2/4)、模拟 视频和电影、电子形式的静态图像(如JPEG)或纸上的图像、图形、 3D模型以及与视频关联的编辑数据。
多媒体元数据研究
1、多媒体资源
Audio Visual Metadata ECHO (European Chronicles On-line,欧洲编
年史在线) MEPG-7
MPEG-21
VRA Core Categories EAD(编码文档描述)
2、数字图像资源
MOA (the Making of American) 2 数字图像 元数据
MPEG-4:基于对象的存取
MPEG-4于1999年成为国际标准。它和MPEG-1 和MPEG-2的重点在于编码效率上不同的是, MPEG-4的目标是提出一种新的方式来传输、访 问和操作数字视听数据。MPEG-4计划为多种通 讯规范提供一种普遍的技术解决方案,最终消除 它们之间的差别。与MPEG-1和MPEG-2的另一点 不同是,MPEG-1和MPEG-2是基于帧的规范,而 MPEG-4则是基于对象的规范。
---- 相似的与音乐销售有关的应用是把可选择的音乐库扩 展到用户家里。人们可以容易地访问在线数据库,用基 于内容的方式(结合歌手名、风格、歌名、创作年代等), 查找感兴趣的歌曲和音乐作品,并付费下载。
“拉”应用
4).声音效果库
---- 对于要使用大容量声音效果数据库的艺术家和声音设计 人员,常规的数据库管理和搜索方法是不够的。一个声 音设计人员要求从声音效果库中选择出要求的声音效果, 其选择方式可能是由设计人员提供原型化的声音和音频 特征,甚至可以发出类似要查找的声音,通过拟声方式 查询。
- 5).历史语音数据库
---- 可以通过口头关键词、关键事件、说话人、地点、日期, 或以上属性的组合来搜索历史数据库中的音频录音和视 听演讲。这种应用也可以辅助教育或新闻业应用。例如, 用户说一句关键词:I have a dream, 系统把语音转换为 文本关键词,查找出马丁·路德金的录音和演讲文本。
----
为了更好地理解这些术语,请参看图1。图中解释了
MPEG-7在实际系统中的位置。圆角框表示处理工具,矩 形框表示静态元素,阴影部分包含MPEG-7标准的规范元 素:DDL提供建立描述模式的机制,然后将描述模式作 为基础,产生一个描述。
MPEG-7的范围
下图是MPEG-7处理链的一种高度抽象示意图,用于解释 MPEG-7的范围。它包括特征抽取(分析)、描述本身和搜 索引擎(应用)。
4.2 MPEG-7的“拉”应用
1).视频数据库的存储和检索 ---- 电视和电影档案中保存有大量的各种格式的多媒体资
料,如数字、模拟磁带和胶片、CD等,这些资料不一定 有描述信息(元数据),即使有也大都是简单的文本描述, 它们以专用的格式存储在数据库中,因此,需要按照国 际标准格式进行存储和交换。另外,要对大量旧的模拟 视听资料进行数字化,在数字化和压缩阶段,可以在数 据库中使其包含基于内容的索引特征。对于新的视听媒 体,在视频生产的各个阶段可以把描述信息附加在视频 流上,从而极大地提高了用手工进行有限词汇注释的质 量和生产率。
与以上的“拉”应用相反,下面的“推”应用 类似于广播和Web广播。“推”应用用到“选择” 和“过滤”,而不是“索引”和“检索”,因此 有非常不同的要求。通常它们涉及到流描述,而 不是存储在数据库中的静态描述。
“推”应用
1).用户代理驱动的媒体选择和过滤
--- - 过滤与搜索正好相反。搜索涉及“拉”信息,而过滤 意味着“推”信息。搜索请求“包含”那些信息,而过 滤“排斥”指定的数据,但二者都从相同的元信息中获 得好处。广播媒体这种形式正向WWW转移,使WWW 这种典型的 “拉”媒体同时具有广播的能力。
“拉”应用
2).专业媒体制作方面的图片和视频提交
---- 演播室需要向电视频道提交适当的视频,另外还需要 编辑一段库中的视频,如编辑记录片和广告片等。
---- 在这个应用中,用户是专业性的。演播人员可以基于 元数据和视频片段来提交一个完整的视频,可以基于客 观特性和主观特性来查询出想要的视频片段并用于编辑。 查询也可以作用于分布数据库,以获得视觉、版权和价 格信息,以及源视频资料的技术质量数据。
CDL数字图像元数据
Dig35 NISO/CLIR/RLG的图像技术元数据
4、MPEG系列标准(1、2、4、7、21)
MPEG是专门从事多媒体音、视频压缩技术标 准制定的国际组织,成员包括来自近30个国家、200 多个公司的400多位专家。该组织自1988年以来, 已经制定了一系列国际标准,其中MPEG-1、 MPEG-2已为人们所熟知,它们为VCD、DVD及数 字电视等产业的发展奠定了基础。目前正在制定的 MPEG-4、MPEG-7和MPEG-21将为多媒体数据压 缩和基于内容检索的数据库应用提供一个更为通用的 平台,必将对下一代视、音频系统和网络应用产生深 远的影响。