DC元数据的历史、现状及最新发展

合集下载

2008版与2006版DC元数据术语比较分析

2008版与2006版DC元数据术语比较分析

学术论丛2008版与2006版DC 元数据术语比较分析芦姗中央财经大学图书馆北京100081摘要:在现代数字图书馆建设中,DC 元数据作为描述资源的规范,正在发挥不可替代的作用。

本文通过对2008版与2006版DC 元数据术语进行比较,分析出2008版元数据术语的新变化,包括新增、删减的元素,概念定义上的改变等。

从而,归纳出2008版DC 元数据术语变化的内容、特点以及意义、作用,可以帮助使用者更好的掌握2008版DC 元数据术语。

关键词:DC 元数据术语比较分析变化特点1.引言元数据,英文名为“metadata ”,最早出现于计算机信息技术领域,目前已经在多个专业领域,如图书情报、博物馆及档案等领域中得到广泛应用。

【1】2008版DC 元数据术语【2】是关于DCMI 支持的所有元数据术语的详细说明,包括元素、元素限定、编码体系和词汇术语。

DCMI 在2008年1月14日做了更新,初看下来,术语的增减是其次的,重要在于,这一文档在整体上与抽象模型更加接近与契合了。

2.2008版与2006版DC 元数据术语的差异比较与2006版DC 元数据术语【3】相比较,2008版改变较大,进一步扩充了术语的内容,不仅定义和语义描述更加规范,元数据术语的数量也大量增加了,并对术语的分类做了更为明确的划分,从而使用元数据术语描述资源更加方便、准确。

具体的变化有以下几方面内容:2.1新增加的内容2.1.1新增加的最小属性集定义2008版在原有的最小属性集基础上,新增加了定义域、值域、从属于、实例和版本5个属性,从而对术语的定义描述更加符合现实的需要,也更加贴近实际,表达清晰、明确。

2.1.2新增的分类类别在原有DCMI 类型词表的基础上,新增了22个分类类别,从而可以更加准确的划分资源类型,同样保留了06版的DC MI 类型词表中的12个分类类别术语,以保持新旧版本的衔接与一致性,便于用户的使用和维护。

2.1.3新增的编码体系2008版新增了两个编码体系,分别是IS O639-3和RFC4646,保留了原有的IS O639-2和RFC3066,对原先的2个编码体系进行了扩充,并逐步替代原有的两个编码体系。

浅议DC元数据在数字化图书馆中的应用

浅议DC元数据在数字化图书馆中的应用

创建者
出版者 权限
Dt a t e
T p ye
日期
类型
Ds ii 说明 Cn iu r ecpo r tn otbt r o 其他责任名 Fr a o t m
L nu g agae R lj e tn 8o 语种 关联
格式
Ietir 标识符 dnie f
发学位论文 的电子化 , 其作为将来数字化图书馆 的重要组成部分 。但 将
网络信 息资源 的存储 、 获取 、 使用和传输与传统信息资源又有很大不 同, 如何在浩如烟海 的网络信息空 间中高效 、迅速地做 到信息 的共享和变 换, 如何为 电子化的网络资 源提供 有效 的信息 组织方式 , 当今信息 网 是 络发展 的一 个热点 。 针对这一现象 , 许多元数据研究项 目纷纷 出现。 多 众
林核心数据( u l C r )V A核心类 目( R t C t o ) 艺术作品 D bn o 、R i e V Ac a gy、 er 著录类 目( a g e f t D s p o  ̄ rs f n 、 E C C t o so h ec t n f ok oA )R A H著录单 元 er i re i r i o 集合( E C e ete) 。而众 多的元数据研究项 目中, 图书馆界 R A He m n st l 等 在 和情 报界 影 响最 大 、应 用 最为 , 泛 的就是 D (' l 0 M t a C E b nc ) e d t ui a a
( u l C r) D bi o  ̄ n e L数据应 用的 实例 。 分析 了 D C元数 据开发应 用中存在 的问题 , 出了元 提
数 据 开发 的 几 点 建议 。
关键词 : C 元数据 ; D; 数字 图书馆 中图分类号 : 2 07 G 5. 6 文献标识码 : A

DC 元数据———组织网络信息资源的有效工具

DC 元数据———组织网络信息资源的有效工具

DC元数据———组织网络信息资源的有效工具张云瑾(福建师范大学社会历史学院,福建福州350007)摘要:DC元数据是一个用于描述网络信息资源的元数据核心集。

本文介绍了DC产生的背景、组成元素、描述方法以及实践应用情况。

关键词:都柏林核心;DC元数据;网络信息资源组织中图分类号:G250.73;G254.36 一、DC元数据产生的背景元数据是关于数据的结构化数据,其作用在于对信息资源进行描述和限定,以便人们高效地选择和利用。

“元数据”一词译自英文单词“Metadata”,是近几年随着网络信息海量增长才频繁出现于学术书刊中的词汇,但是关于元数据的理念并不是新出现的,在图书情报部门应用多年的、根据AACR2、IS BD等规则编制的卡片式目录、书本式目录以及根据M ARC格式编制的机读记录都是元数据。

它们在对图书、报刊等传统信息资源的组织方面发挥了重要作用。

然而,随着计算机技术、通信技术的飞速发展,因特网上的信息资源急速增长,传统的元数据格式结构复杂,需要受过专业训练的人员才会编制,而面对汹涌而来的网络信息潮单靠有限的专业人员进行整序、组织无异于杯水车薪,无济于事,因而形成了网络信息资源日益丰富而真正需要它的人却日益难于查找矛盾。

虽然采用G oogle、Y ahoo、新浪等搜索引擎进行检索可以查到部分信息,但是这些搜索引擎是通过自动搜索程序来抓取网页信息,然后以自动抽字(词)做索引的方式建立数据库的,因此检索效率低下,检索结果要么动辄几千甚至上万条,要么答非所问。

例如,想检索有关金门岛的资料,在Y ahoo、新浪等搜索引擎中输入”金门”二字,检索结果中除了提供有关金门岛的资料外,还出现了大量的有关”铝合金门窗”、”五金门锁”等与检索要求风马牛不相及的资料。

这样就极大地增加了检索人员甄别所需资料的时间。

为了解决网络信息资源检索的困难,1995年3月,在美国俄亥俄州的都柏林召开了第一届元数据研讨会,会议由OC LC(联机图书馆中心)和NCS A(美国超级计算机应用中心)主持。

MARC和DC的产生与发展

MARC和DC的产生与发展


1996年4月在英国Warwick召开的第二次DC会议继续 了第一届会议的丰硕成果,就如何应用DC元数据的问题 进行了议题广泛的讨论,最后聚焦到在应用中不可避免的 语法和结构问题,认识到DC元数据与其它各种元数据描 述的数据记录必须有一个一致的结构单元实现各种功能需 求,于是提出了Warwick框架作为元数据应用的一般 “容器”和概念框架,对后来数字图书馆体系结构的研究 设计和W3C提出的资源描述框架(RDF)都产生了重要影 响。英国图书馆信息网络办公室(UKOLN: The UK Office for Library and Information Networking)作为这次会议的主办者之一对DC的发展 开始倾注大量的心血,以后数年的实践可以看出它对DC 的贡献和影响不在OCLC之下。
DC元数据的特点
1) 简单性:DC只有15个元素,且都具有一个能够普遍理 解的语义,数据元素的含义易学易记,非编目人员也能很 快学会使用。 2) 灵活性:DC即可以用于规范的资源描述领域,也可以 用于非专业领域。具有可修饰性:DC在互操作的原则下, 允许在15个元素的基础上增加新的元素和修饰词;可重 复性:它规定所有元素都是可以重复的,解决了多著者和 多版本等重复因素的著录问题;可扩展性:DC的多个框 架,是可以扩展的,允许在原有的基础上加上更精确的语 义及结构,对信息资源进行更详细的描述。 3) 国际通用性:DC已经成为一种国际范围内的适用于资 源发现系统的元数据标准。
DC的不足
1)字段定义的模糊性。DC由于没有建立规则和过程来控制 数据元素的内容,只考虑著录上的弹性空间,字段定义相 对简练。容易造成对字段定义的不同理解,直接影响了 DC的使用频率。 2)互通性。DC对每一项具体著录没有做出规定,完全是根 据网页制作者对DC的理解,并视著录特点扩展所要著录 的项目。但当通用的著录项目扩展到一定程度时,资料彼 此间的互通性可能随之降低,跨系统的解读能力和资料运 用的精确性下降,从而造成资料检索利用上的困扰。 3)限定词的制定使其复杂化。为了让标引的对象更加明确, 并提高检准率和检全率,DC致力于限定词著录控制表的 研究。这样做一定程度上可以解决上述问题,但也相对增 加了著录者的负担,发展到一定程度时,著录者恐怕也会 像著录MARC一样,要进行相当的训练并严格遵循大量 的规则才能完成资料的著录。

2005年以来我国DC元数据研究综述

2005年以来我国DC元数据研究综述

数 字 图 书馆 、 C 元数 据在 其 他 学科 领 域 中 的 应 用  ̄ 4 A 面 对 2 0 年 以 来 我 国 DC元 数 据 的研 究 文 献 进 行 了综 述 ,并 总 结 出 D -- 05 我 国 D 元 数 据 的 研 究特 点 和研 究 趋 势 。 C
【 关键词 】 DC元数据 ; DS元数据 ; MO 元数据标 准; 网络信 息资源编 目
ili a , e p lao f CMe dti o e bet Ia o u e CMe dtrs rh hrc rt sn srn hn. t b r t pi t no D t a t rujc .tl ms pt t a e c a t ii dtt dnC ia alr y h a c i a an h s s s s u h D a a e a c a e sc a i e i
2 8 l 6

1 5
0 005 1 7 3 0l2 4 7O3
0 656 04 1
0l 19 62
9 1 O
l l
网 络 资 源 知 识 组 织
RDR删 L
4 3

l4 0 17 0
lO l
00 3 1 . 0 4 l 00 2 5 32 8
笔 者 通 过 C KI 国 期 刊 全 文 数 据 库 检 索 到 20 N 中 0 5年 以 来 我 国 DC元 数 据 的 研 究 文 献 共 有 13篇 , 及 “ 书 情 报 1 涉 图
与数字 图书馆 ” “ 、 计算 机软件及 计算机应 用 ” “ 、 互联 网技
术 ” “ 闻 与 传 媒 ”、 金 融 ” “自动 化 技 术 ”、 电 信 技 、 新 “ 、 “ 术 ” 个 学 科 领 域 , 别 有 4 、5 6 2 12 2篇 。 去重 筛 选 七 分 53、、、、、 后剩 下 9 3篇 。通 过 对 文 献 的统 计 分 析 , 出表 1 得 。

MARC、DC、MODS、FRBR等文献编目元数据比较

MARC、DC、MODS、FRBR等文献编目元数据比较


于复杂 。在 O L C C和美 国国家高速电情应用 中心联合 助研 讨会 中产生 的都柏林 核心集 ( ul oe 简称 D ) D bi C r, n C 有替 代
示 和 有 效 地 报 道 文 献 的外 形 特 征 与 内 容 特 征 ,指 导 『 是 蒯读 C MA C的 基 本 功 能 。 R N R MA C最 大 的 价值 在 于 标 准 化 而适 于
的字 段 ) 少 , 此 真 正 用 作 索 引 的 字段 并 不 多 。 新 的研 究 很 因 最
统计 ,0 8 %的书 目记录只使用了 3 6个字段或子字段 。②技术
过 时 。 格 式 设计 所 依 赖 的 是 以磁 带 为主 要 存 储 介 质 的 技 术 , 在 目前 各 种 集 成 系 统 的 技 术 实 现 中早 已 采 用 了关 系 数 据 库 技 术 , 其 他 更 为 先进 的 拿 文 索 引 、 向对 象 技 术 甚 至 X 及 面 ML
技术 ( 在与其他数据格式进行 数据 交换时 ) 等。③著录规则不
统 一 , 义 含 糊 。不 同 国 家地 区 不不 同 版 本 的 MA C 即 使 能 语 1 l R ,
互 操作 , 操作 起来也很 困难 。④ 字段 、 子亨段标 识和结构 复

国机读格 式 C MA C, N MA C为依据 , N R 以 U R 它的通信格 式与
国 际 标 准 化 组 织 制 定 的 “ 献 目录 信 息 交 换 用 磁 带 格 式 ” 文

I0 2 0 ( 一 种 交 换 MA C记 录 的 标 准 格 式 ) S 7 9 是 R 的规 定 致 , 已 成 为 我 文 献 处 理 工 作 者 的 必 备 工 具 。科 学 地 揭 现

DC 元数据年度进展(2007)

DC 元数据年度进展(2007)

DC元数据年度进展(2007)刘炜上海图书馆kevenlw@摘要都柏林元数据2007年年会以“元数据应用纲要的理论与实践”为主题,总结了一年来所取得的进展,讨论了DCMI在组织架构和运作方式上的一些变化,特别宣告了DCMI将与新加坡国家图书馆局合作进行公司化运作。

在元数据标准规范方面提出了被称为“新加坡框架”元数据应用规范。

这个规范遵照刚刚修订完善、正式发布的“DC元数据抽象模型”,规定了一整套元数据方案所应包含的五类文档,其中必备的“领域模型”和“元素集描述”要求以较为严格的机读形式编码(如UML和XML/RDF),以保证元数据应用系统的各项形式化约束具有严格的一致性和延续性。

虽然在描述规范细节方面此次会议并没有推出进一步规范,甚至没有达成一致意见,但“新加坡框架”的提出无疑将成为DC元数据应用推广历程中的一个重要的里程碑。

关键词:DC元数据进展综述DC-2007一.年会概况2007年度的“都柏林核心(DC)与元数据应用国际研讨会”于8月27日至31日在新加坡洲际大饭店(InterContinental Singapore) 顺利举行,一共有来自33个国家和地区的近两百名代表参加了会议。

这是继东京(2001)、佛罗伦萨(2002)、西雅图(2003)、上海(2004)、马德里(2005)、墨西哥曼萨利尼(2006)之后的第七届以“元数据国际研讨会”冠名的会议,作为都柏林核心元数据的系列会议,这已经是第十五次了[1]。

本次会议的主题是“元数据应用纲要的理论与实践(Application Profile: Theory and Practice)”,经过数年的研究、实践和标准化工作的推动,本次会议在元数据应用纲要的形式化方面取得突破性进展,提出了一整套以DC元数据抽象模型为基础的元数据形式化方案,被归纳为“新加坡框架(Singapore Framework)”,为下一阶段开发元数据软件工具,以及编制可用性和互操作性强的元数据方案提供了一个统一的模型和编码基础,有望使元数据应用长期滞后于实践需求的状况得到根本性的改善。

DCupdate

DCupdate
– Timely, stable and dependable documents and specifications – Community support
From: Makx Dekkers’ presentation on DC2002
进展
• Application Profile的使用规范 • Abstract Model的提出 • Metadata Registry
“记录”与“值”
• 一条DCMI元数据记录是一条或多条描述的 集合,这些描述是关于一个或多个相关资 源的,这些资源根据某个DCMI置标指南实 例 化 ( 这 些 置 标 指 南 有 : XHTML meta tags, XML, RDF/XML, 等等) • 一个DCMI元数据值是物理的或者概念的实 体,当描述一个资源时,这个实体就成为 该资源的属性。
元素(属性) 元素(属性)向上兼容 非预设( 非预设(Uninformed) ) 忽略任何不属于DC元数 忽略任何不属于 元数 据元素集的属性。 据元素集的属性。 值向上兼容 使用URI值(如果存在) 值 如果存在) 使用 或字串值作为新字串 值。
预设( 预设(Informed) )
递归地解决子属性关系, 递归地解决子属性关系, 用相关描述或字串值的知 直到DC元数据元素集 识来构造新的字串值。 直到 元数据元素集 识来构造新的字串值。 15个属性中的一个。 个属性中的一个。 个属性中的一个 否则就忽略。 否则就忽略。
Board of Trustees
Executive Director Managing Director
Directorate Advisory Board
Usage Board DCMI Subscribers
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• DC普及率超过现有各种元数据 • DC在现有元数据系统中处于主导地位:DC元数据具有较强的
义描述的主导标准格式 • DC的描述对象定义为“类文献对象”(DLO,Document Like Object) • DC确定的发展原则
简单性原则 易用性原则 可扩展ห้องสมุดไป่ตู้原则
内在性原则
最小元素集,核心集
方便描述文档,实现资 源发现之间的互操作 DC为核心元素集合,可 以扩展为描述各领域资 源的元数据方案
– 1996年9月第3次会议—都柏林 • 重点讨论了DC应用于网络图像的问题,包括图像的特点,图像 描述的具体需求、图像描述方法等,针对图像的需求,增加了 “Description”,”Right Mangement”两个元素,元素增加 至15个
DC系列会议及主要成果
• 1997年3月第4次会议—澳大利亚堪培拉
– 提出了三类“堪培拉限定词”,即对DC元数据元素可以从取值的 语种(Language)、模式体系(scheme)和进一步修饰元数据的 属性类型(Type)三个方面进行限定和扩展。
• 1997年10月第5次会议—芬兰赫尔辛基
– 最终成果芬兰终结(Finnish finish),对DC的非限定版DCMES最 终确立,DC走上标准化的道路。
– 在讨论relation元素的语义时提出了重要的“一对一”原则,即每 个资源都应该有一条单独的元数据描述,而每一条元数据描述包含 的元素必须与一个单独的资源相关联。
– 讨论了采用RDF结构表示资源、资源属性和属性值的问题
DC系列会议及主要成果
• 1998年11月第6次会议—华盛顿
– 建立开放、有序的动作机制(基于工作组的动作方式),提出使DC 成为多项国际、国家标准的目标
西班牙马德里:将使用不同词汇表的团体连接起来,如 DC,LOM的一套元 素和属性,
墨西哥:主题:Metadata for Knowledge and Learning 新加坡:Application Profiles and their Application in Practice 德国柏林:Metadata for Semantic and Social Applications 韩国汉城:Semantic Interoperability of Linked Data 美国匹兹堡:Making Metadata Work Harder
– DC元数据工作会议(workshop)定为年会形式,每个专门的问题积 聚了足够感兴趣的人群即可以成立工作组
• 1999年10月第7次会议—德国法兰克福
– 固定DC工作组的发展,共享应用实践,促进DC支持不同元数据系 统间的互操作
• 2000年10月第8次会议—加拿大渥太华 – 美国国家标准Z39.50经过投票程序,进入CEN/ISSS标准程序,提 用应用纲要(Application Profile)形式解决元数据的领域应用问 题
/workshops/
提纲
• DC历史 • DC发展现状 • DC最新发展 • DC-2011会议概述
DC发展现状
• DC元数据是DCMI(Dublic Core Metadata Initiative) 通过一定的组织形式和程序进行活动的成果
• 不只是简单的十五个元素的集合,而是包括词表、编码 规范、模型、流程、工作文件等一系列文档的标准规范 体系
– 目的:建立一套元数据集合以描述网络资源,使非图书馆专业人员能 够了解和使用著录格式来描述网上资源
– 导致了1995年3月第一届DC会议的召开。在52位来自各领域专家的见 证下,诞生了包括13个元素的DC元数据最初形式,由于召开地点在美 国俄亥俄州的首府都柏林市 ,元数据标准最初得名。
DC元数据元素的最初名称
Subject Title
Form Identifier
Author Publisher OtherAgent Date ObjectType
Relation Source Language coverage
/workshops/dc1/
DC历史
• DC来自于图书馆文献与电子文献管理的结合 • 定位于“电子文献”或者” 网络文档”的描述,努力成为这个交叉领域语
以揭示自身的内容属性 为主,外部属性为辅
可选择性 可重复性 可修改性
句法独立原则
DC元数据集中的任何元素 都是可选的
DC元数据集中的任何元素 都是可重复的
可以对元素集中的任何元 素进行“修饰”或限定, 但不能扩大或改变元素的 基本语义。
DC元数据的元素可以以多 种方式编码
DC历史
• DC系列会议及主要成果
DC元数据的历史、现状及最新发展
提纲
• DC历史 • DC发展现状 • DC最新发展 • DC-2011会议概述
提纲
• DC历史 • DC发展现状 • DC最新发展 • DC-2011会议概述
DC历史
• DC(Dublic Core)元数据的产生背景
– 1995年3月,由OCLC和NCSA联合发起,52位来自图书馆界,电脑网络 界专家共同研究产生
– 1996年4月第2次会议—英国Warwick • 聚焦语法和结构问题,DC元数据与其它各种元数据描述的数据 记录必须有一个一致的结构单元实现各种功能需求,提出了 Warwick框架,即作为元数据应用的一般“容器”概念框架, 为后来W3C提出的RDF产生了重要影响,第一、二次会议奠定了 DC元数据的理论基础
• 2001-:开始公开征文的国际会议,
DC-2001
DC-2002 DC-2003
DC-2004 DC-2005
DC-2006 DC-2007 DC-2008 DC-2009 DC-2010
DC系列会议及主题
日本东京:第一届经过公正征文的国际会议,Providing machineunderstandable data on the Web,Semantic Web 意大利佛罗伦萨:关于e-communities元数据,支持多样性和驱同 美国华盛顿:各工作组正式提出或修改各自的章程,提出Abstract Model 对各类应用纲要进行规范 中国上海:主题:不同语言和文化的元数据
相关文档
最新文档