RDA和语义网

合集下载

语义网

语义网

1.1什么是语义网微软公司董事长比尔·盖茨那幢坐落在西雅图,被喻为未来生活预言的科技住宅无疑是当今世界上最现代化的豪华住宅,堪称是智能建筑的经典之作。

豪宅内共铺设各种电缆52英里,房子内所有的电器设备相互连接成了一个智能网络。

主人在回家途中便可在车内利用计算机遥控家中的浴缸自动放水并调温,作好一切迎接准备。

房屋装有气象感知器,可以根据各项气象指标,控制室内的温度和通风情况。

走进大厅时,空调系统会将室温调整至你感觉最舒适的温度,音响系统也会针对你的喜好播放音乐,灯光系统自动调整照明颜色与强度,就连墙上的LCD显示屏,也会自动显示你喜爱的世界名画或播放你上次只看到一半的影片。

在住宅各处随意走动时,地板能在6英寸的范围内跟踪到人的足迹,在有人经过时自动打开照明,离去时自动关闭。

每个房间的温度、照明、音响等等都将随不同的设定自动调整。

就算是在水池中,也会从池底“冒”出如影随形的音乐。

尤其有意思的是,比尔·盖茨非常喜欢车道旁边一棵140岁的老枫树,所以就通过专门的监视系统对其进行24小时的全方位监控﹐一旦监视系统发现它有任何干燥的迹象,灌溉系统就会启动。

人们不禁要问,是什么尖端的科技系统使得盖茨先生的豪宅拥有如此高的智能化水平?要等到哪一个世纪才能让这样现代化的住宅走入寻常百姓家?你可能不曾想到,通过扩展今天的万维网(即WWW,是World Wide Web的简称)就完全可以使这一梦想变为现实。

这种扩展后的万维网称为语义网(Semantic Web)。

语义网的概念由万维网的发明者、现任万维网联盟(即W3C,是World Wide Web Consortium的简称)主任提姆·伯纳丝·李(Tim Berners-Lee)于1998年首次提出。

在他看来,“语义网(Semantic Web)并非是另外一个独立的Web,而是现在的Web的一个延伸。

在其中,所有的信息都具有定义完好的含义,更利于人与机器之间的合作。

语义网概念及技术综述

语义网概念及技术综述

语义网概念及技术综述语义网(Semantic Web)是一种由 W3C(World Wide Web Consortium)推广的,基于 XML(eXtensible Markup Language)和 RDF(Resource Description Framework)等技术的网络,它旨在增强网络信息的语义表达和机器可读性,从而使得计算机能够更好地理解和处理网络信息。

一、语义网的概念语义网是一种以“数据”为中心的网络,它通过使用 XML、RDF 等技术,将网络信息以机器可读的方式进行组织和表达。

与传统的 Web 相比,语义网更加强调信息的结构和含义,而不是简单的文本表现形式。

因此,语义网被认为是 Web 的一个重要发展阶段,是实现智能 Web 的关键步骤。

二、语义网的技术1.XMLXML 是构建语义网的基础技术之一,它是一种用于描述数据的标记语言。

XML 可以用来表示数据结构,并且可以很好地与 HTML、HTTP 等现有网络技术集成。

通过 XML,我们可以将数据以机器可读的方式进行组织和表达,从而使得计算机可以更好地处理和理解数据。

2.RDFRDF 是另一种构建语义网的关键技术,它是一种用于描述资源及其关系的模型。

RDF 将每个资源视为一个三元组,包括主体、属性和值三个部分。

通过这种方式,我们可以将网络信息以一种通用的、机器可读的方式进行描述和组织,从而实现数据的共享和重用。

3.RDFSRDFS 是 RDF 的扩展,它增加了一些新的概念和规则,例如类、子类关系、属性限制等。

这些概念和规则可以帮助我们更好地描述和组织数据,并且可以用于构建更加复杂的语义网应用。

4.OWLOWL 是另一种基于 RDF 的语言,它提供了更加丰富的概念和规则,例如类、属性、关系等。

OWL 提供了三种不同的表达层次,分别是 OWL Lite、OWL DL 和OWL Full,以满足不同应用场景的需求。

OWL 可以用于描述更加复杂的概念和关系,并且可以用于构建更加高级的语义网应用。

语义网技术的发展与应用

语义网技术的发展与应用

语义网技术的发展与应用随着互联网的普及与数据的爆炸式增长,我们越来越需要一种更加高效、准确、智能的方式来处理和利用数据。

而语义网技术就是能够满足这种需求的一种新型数据处理技术。

本文将从语义网技术的定义、发展历程以及其应用前景三个方面来展开论述。

一、语义网技术的定义语义网技术,即语义网(Semantic Web),是一种基于网络的、带有语义的数据处理技术。

它能让机器理解文字和语言,并对其进行推理和应用,从而赋予数据更多的深层次的含义和价值。

语义网技术的核心是对于不同类型的信息进行统一整合、归纳和处理,以达到复杂、多样性数据间的自动化共享和交流。

二、语义网技术的发展历程语义网技术的历史可以追溯到英国人蒂姆·伯纳斯·李(Tim Berners-Lee)在1989年提出“万维网”(World Wide Web)的想法。

他最初创意是为了方便科学研究者之间的信息交流,而在此基础上,李提出了语义网的概念,即将现有的万维网变成一个更加智能化的平台,以减少数据匮乏、信息无效的情况。

20世纪90年代,随着万维网上的信息爆炸式增长,语义网技术逐渐得到了人们的重视。

在2001年,万维网联盟(W3C)发布了语义网指导方针,正式确立了语义网技术的标准化。

此后,每年W3C都会发布新的语义网推荐规范,不断完善和拓展语义网的功能和应用范畴。

三、语义网技术的应用前景语义网技术的应用前景非常广泛,可以用于企业管理、电子商务、智能家居、医疗健康、金融投资、灾害预警等多个领域。

以下是具体的几个应用实例:1.企业管理:语义网技术可以建立起一个完整、集成的企业数据体系,实现对企业内部数据和知识的有效管理与共享。

2.电子商务:语义网技术可以将产品和服务的信息进行语义化,方便消费者搜索和比较,提高电子商务的效率。

3.智能家居:语义网技术可以将家居设备和服务进行互联化,实现智能化的管理和控制,提升家庭生活质量和安全性。

4.医疗健康:语义网技术可以整合医学知识和患者数据,实现个性化的医疗服务和健康管理。

基于Hadoop的语义网搜索引擎研究

基于Hadoop的语义网搜索引擎研究

基于Hadoop的语义网搜索引擎研究随着互联网技术的不断发展,人们对于信息获取和检索的需求也变得越来越高。

在这样的背景下,搜索引擎成为了人们最为依赖的工具之一。

然而,在传统的搜索引擎模式中,我们往往需要输入一些关键词才能获得相关的搜索结果。

这种搜索引擎方式存在的一个缺陷就是可能存在歧义和误解,甚至出现信息断层的情况。

为了解决这个问题,研究人员开始探索基于语义的搜索引擎,而基于Hadoop的语义网搜索引擎就是其中的一种。

Hadoop是一种分布式处理大数据集的开源框架,它能够快速地处理大量数据。

在语义网的领域中,Hadoop可以被用来处理RDF (Resource Description Framework)数据,即资源描述框架。

RDF数据是语义网中的基础,它由三元组(主语、谓语、宾语)组成,描述了实体之间的关系。

然而,RDF数据也存在着一些问题,比如存储空间占用大、查询速度较慢等。

Hadoop框架的出现为这些问题提供了一个解决方案。

基于Hadoop的语义网搜索引擎的核心思想是将RDF数据存储在分布式的Hadoop集群中,然后通过MapReduce算法搜索相关的资源。

MapReduce算法是一种适用于大规模数据处理的分布式计算模型,它能够对大规模的数据集进行并行计算。

这种模型的特点是任务分解、数据本地化和容错性。

以百度、谷歌等搜索引擎为例,它们一般对于关键词进行匹配,然后通过信息检索技术(如PageRank算法)给出搜索结果。

而基于Hadoop的语义网搜索引擎则根据资源之间的关系进行搜索,并尽可能地匹配用户提供的查询条件。

这种搜索方式可以减少非相关信息的出现,提高搜索结果的质量。

由于语义网 (Semantic Web) 是一个非常具有前途的领域,Google、IBM、Microsoft等公司都已经开始涉足该领域。

而基于Hadoop的语义网搜索引擎正是这个领域的一个代表。

在这个搜索引擎中,用户可以根据自己的需求很容易地找到相关的资源,而不需要指定一些特定的关键字。

语义数据模型名词解释

语义数据模型名词解释

语义数据模型是一种用于表示和处理数据的模型,它强调数据之间的语义关系,即数据的含义和关联。

这种模型有助于更好地理解数据,使计算机系统能够更智能地处理和分析信息。

以下是对语义数据模型中一些关键名词的解释:1. 语义(Semantic):语义是指词语、符号或数据的含义。

在语义数据模型中,强调数据的语义是关键,以确保数据不仅仅是存储的一堆字节,而且有实际的含义和理解。

2. 数据模型(Data Model):数据模型是对数据组织、存储和操作的一种抽象描述。

语义数据模型定义了数据的结构、关系和语义,以更好地反映现实世界中的概念和关联。

3. 三元组(Triple):语义数据模型通常使用三元组的结构来表示数据,其中包含了主语(Subject)、谓语(Predicate)和宾语(Object)。

这种结构可以表示主语和宾语之间的关系,而谓语则描述了这种关系的性质。

4. RDF(Resource Description Framework):RDF是语义数据模型的一种标准表示方法,用于描述网络上的资源。

RDF使用三元组来表示资源之间的关系,其中资源通过统一资源标识符(URI)进行标识。

5. OWL(Web Ontology Language):OWL是一种用于表示本体的语言,本体是一种形式化的共享知识的方式。

在语义数据模型中,本体被用于定义实体之间的关系,以及对实体属性和行为的约束。

6. SPARQL(SPARQL Protocol and RDF Query Language):SPARQL是一种用于查询RDF数据的标准查询语言。

通过SPARQL,可以从语义数据模型中检索出符合一定条件的数据,实现对语义数据的灵活查询。

7. 本体(Ontology):在语义数据模型中,本体是对领域中概念和关系的形式化描述。

它定义了领域内实体之间的关系,有助于更好地理解和组织数据。

8. 语义网(Semantic Web):语义网是一种建立在语义数据模型基础上的网络,旨在使信息更容易被理解和共享。

关联数据驱动下的数字图书馆参考咨询服务模式研究

关联数据驱动下的数字图书馆参考咨询服务模式研究
图 1 传统参考咨询服务模式框架
数据层收集数字图书馆馆藏资源。目前随着图 书馆联盟建设的持续发展,参考咨询服务的基础也 是图书馆联盟中各图书馆数字馆藏资源的集合,包 括电子图书、论文期刊、国家标准和行业标准、专利 说明、地方文献数据和特色资源等。
表示层则将馆藏资源建立为不同的索引数据 库,例 如,地 方 文 献 数 据 库、期 刊 数 据 库、专 利 数 据 库等。
2019年第 5期
杭 哲,李芙蓉:关联数据驱动下的数字图书馆参考咨询服务模式研究
大都是半结构化或非结构化的数据资源,用传统的 关系型数据库无法支持存取。但是关联数据技术支 持所有类型 的 数 据 的 存 储 与 关 联,可 以 将 这 些 “没 有关联”的 数 据 资 源 链 接 起 来。 由 此 可 见,关 联 数 据在参考咨询服务中占据着举足轻重的地位,新模 式下主要有以下特点:提供数据存储及连接机制;实 现数据网络的布局,增强人机可读性;提高异构的子 模块间的协调工作;通过对虚拟咨询日志统一归档, 实现问题与信息资源的有效互联,同时进一步挖掘 用户行为[13]。 4 传统虚拟参考咨询服务模式
综上所述,目前国外早一步地将关联数据技术 应用于实际,而国内的研究还停留在技术本身的设 想与展望,故而笔者认为应该将关联数据技术应用 在虚拟咨询服务中,在现有模式中进行调整与应用。 3 关联数据
关联数据是语义网的关键之一,使用资源描述 框架(RDF)作为数据的模型,运用统一的资源标识 符(URI)作为数据的标识,通过 HTTP协议调整规 范“数据”,然后进行数据发布。关联数据技术相较 于传统数据库技术,在数据整合和语义化方面独具 优势,具有机读性的特点。现在图书馆的知识库中
50
自图书馆关联数据孵化小组[5]成立以来,许多 图书馆将 MARC数据、规范记录、主题等数据以关 联数据的形式加以发布。2013年,三圆石公司发布 Callimachus关联数据管理系统,支持使用关联数据 进行导航、可视化、构建应用程序等操作[6]。Makela 汇集 BookSampo关联数据集,此数据集用于研究跨 域文化遗产以及回答相关文学领域问题[7]。HuJY 结合医院内部数据和生命科学领域的开放数据建立 关联数据集,提供癌症治疗选择算法,用于从历史病 例中找出类似病例[8]。

语义网的建立和应用研究

语义网的建立和应用研究随着互联网不断发展,我们面对的信息量越来越大,查询信息也变得越来越困难。

传统的搜索引擎仅可以通过关键词匹配的方式帮助我们查询相关信息,而这种方式往往会出现误导答案或者信息带有多种解释等问题。

如何使机器能够理解并正确处理人类的语言,是一个不断探索和研究的领域。

在这个领域中,语义网的建立和应用研究扮演着至关重要的角色。

一、语义网的概念和发展语义网,是一种用于描述和标注不同资源之间语义关系的技术体系。

其核心思想是将数据内容转换为“语义”,以便机器可以理解和处理。

语义网以传统的XML 技术为基础,通过RDF、OWL等技术,将数据和语义相结合,创造出一种新的互联网体系结构,从而实现全球互联的语义互操作。

语义网的发展可以追溯到1998年,著名计算机学家Tim Berners-Lee提出了Web 3.0的概念,该概念正式标志着语义网的诞生。

随着技术的不断演进,语义网逐渐成为人们能够实现语义互通的有效方式。

而目前,语义网的相关技术和应用已经被广泛应用于各个领域,成为迈向智能互联技术的重要一环。

二、语义网的构成和技术语义网由RDF、OWL等技术构成。

其中,RDF是语义网的基础技术,通过将各种数据转换成通用对象进行编码和描述,实现了统一的数据表示标准。

而OWL 是一种描述和定义概念的技术,其目的是更加精确地定义资源的基本特征、性质、行为等。

需要注意的是,语义网并不仅仅局限于RDF和OWL等技术,而是涵盖了更广泛的一些标准和技术,如SPARQL等查询语言,SKOS等知识组织体系等。

三、语义网的应用领域(1)智能搜索传统的搜索引擎只能依赖关键词进行文本匹配,结果往往出现精度和可信度不够高的情况。

而语义搜索技术,可以实现对于自然语言的理解和抽取关键语义的能力,从而更加精确地响应用户请求,提高搜索结果的质量。

(2)知识图谱知识图谱是指一种将实体、属性、关系以及它们之间的关联关系整合在一起形成的知识库。

语义网络表示法


A-Member-of:直观含义“是……的一员”, 即表示一个事物是另一个事物的成员,反映 了个体与集件(类或集合)之间的关系。
Instance-Of:关系用来建立AKO关系的逆关系, 表示一个事物是另一个事物的实例。
类属关系
属性关系
属性关系一般是指事物和其属性之间的关系。一 个类的对象一般都有一个以上的属性,而每个属 性又有一个值。属性和值组合成特性。
John
ISA
Huma
Giving-Events
Giver
ISA
G1
Object
Receiptor
ISA
Mary
Book1
ISA
Book
逻辑关系的表示:
合取与析取
1. 合取 在语义网络中,如不加标志,就意味着
连接之间的关系是合取关系。 2. 析取
在语义网络中,为与合取关系相区别,析 取关系可以加上析取界限,并标记DIS。当合取 关系嵌套在析取关系之内时,如果合取关系不 被标注就会引起误解。
例如:香港回归之后,澳门也会回归了。
位置关系
位置关系是指不同事物在位置方面的关 系。 常用的位置关系:
Located-on:一物在另一物之上。 Located-at:一物在何位置。 Located-under: 一物在另一物之下。 Located-inside: 一物在另一物之中。 Located-outside: 一物在另一物之外。
AKO
WEDGE SHAPE
ISA
WEDGE19
TRIANGULAR
BLOCK
AKO
BRICK ISA
SHAPE
RECTANGLUAR
BRICK12
1. 值继承

如何在网站上使用语义网技术

如何在网站上使用语义网技术随着互联网的不断发展,人们对信息的处理和理解越来越重视。

语义网技术就是解决这一问题的有效方式之一。

本文将从什么是语义网技术、语义网技术的优点以及如何在网站上使用语义网技术三个方面展开。

一、什么是语义网技术语义网技术是一种基于语义(即意义)的互联网技术,它通过对数据和信息进行深层次的语义分析,将其转化为计算机能够理解的格式,实现人类和计算机之间的无缝交互。

它具有多个方面的优势,其中最为突出的优势是为大众提供了更为精准、高效的信息交互和搜索方式。

语义网技术的实现主要依赖于两个方面:RDF(Resource Description Framework)语言和OWL(Web Ontology Language)语言。

RDF是一种表达元数据的语言,它可以将数据以图形的形式描述出来。

而OWL则是用来描述资源的语言。

通过这两种语言的灵活应用,语义网技术在互联网领域的应用越来越广泛。

二、语义网技术的优点1. 信息精准度高在很多情况下,我们需要搜索的信息非常复杂,其所涉及到的领域、细节都非常繁琐。

传统的搜索方式很难保证搜索结果的准确性和完整性,而语义网技术则通过对信息的深入分析和理解,使搜索结果更加精准、全面。

2. 数据物化程度高语义网技术融合了白话文与计算机语言,将人类的知识体系转变成计算机可读、可操作的数据,解决了传统的搜索方式所遇到的“信息连通性”和“信息可访问性”问题。

3. 信息互通性高语义网技术采用通用的标准描述语言,可以使得各种数据资源之间实现无缝连接和交互。

这将大大提高各种数据的流通性及价值,并且为各行业提供方便的数据查询和分析方式。

三、如何在网站上使用语义网技术1. 通过RDF和OWL语言进行数据处理和管理开发人员可以通过RDF和OWL语言的引入,实现对数据的统一处理、描述和管理。

在处理过程中,需要合理规划数据结构,明确数据来源和使用范畴,确保语义网技术的稳健性和可操作性。

语义化人名规范文档建设研究

摘要构建语义人名规范文档不仅能达到唯一识别责任者的目的,还能成为网络环境下被其他资源调用的语义数据。

当前的语义网技术为网络环境下的规范控制提供了解决思路。

文章在调研国内外语义规范控制研究成果的基础上,提出何为语义规范文档,以及构建语义化人名规范文档面临的主要问题及解决方案,包括多种人名标识符共存和它们的互操作问题,人的附加描述属性问题,以及人的语义描述规范问题。

关键词语义规范文档关联数据人名规范引用本文格式陈辰,王璐,郝晓雪,等.语义化人名规范文档建设研究[J].图书馆论坛,2018(7):89-95.A Preliminary Research on the Construction of Semantic NameAuthority Files CHEN Chen ,WANG Lu ,HAO Xiaoxue ,WANG Kaiyan ,WANG XuefengAbstract Semantic name authority files could not only identify proper persons ,but also be retrieved by other network resources.This paper makes an analysis of the limitations of traditional authority files ,and proposes that the semantic web technology could be a solution for the authority control in the network environment.On the basis of foreign andhome researches onsemantic normativecontrol,itmakes clear thedefinitionof semanticauthority files ,the problems they faces ,especially the coexistence and interoperability of multiple names ,and the normsfor human additional attribute description and human semantic description.It also provides some possible solutions.Keywords semantic authority file ;linked data ;name authority语义化人名规范文档建设研究*陈辰,王璐,郝晓雪,王凯艳,王雪峰*本文系河北省社科基金项目“科研人员人名规范控制方法研究”(项目编号:HB17TQ011)研究成果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

RDA和语义网李恺2012-9-29 19:57:56 来源:《数字图书馆论坛》(京)2010年12期【英文标题】RDA and the Semantic Web【作者简介】李恺(1985-),首都图书馆馆员。

通讯地址:首都图书馆采编中心100022。

E-mail:Islanderee@首都图书馆北京 100022【内容提要】文章首先回顾了在新环境下传统图书馆编目工作面对的挑战和批评,以及近年来图书馆编目界在关联数据领域展开的工作,然后讨论了RDA对于语义网技术和理念的实践,尤其表现在它采用了FR家族模型以及作为数据元素集制定了相关的词汇表,最后文章讨论了RDA在实践语义网当中所遇到的问题,包括外部环境的支持以及MARC格式对编目工作变革的可能阻碍。

The paper reviews the problems and challenges of traditional library catalog as well as some libraries' involvement in Open Linked Data Movement in recent years. How RDA realizes the principles of semantic web and linked data is discussed, especially in terms of its application of FR-family models and the development of RDA vocabularies. Difficulties of RDA'spractices of the principles of semantic web are mentioned, namely, lacking supports from the library community and MARC format as an obstacle to this process.【关键词】RDA/AACR2/FRBR/关联数据/编目RDA/AACR2/FRBR/Linked data/Library catalog1 对传统图书馆编目的批评自世纪之交以来,人们对于传统图书馆编目工作的批评就不绝于耳。

批评主要来自于以下几方面:首先,计算机的运算能力持续增强,真正使用计算机来处理图书馆数据对于图书馆愈发重要。

当前图书馆使用的编目体系(AACR2和MARC格式)发源于卡片目录时代,MARC格式出现的目的之一就是通过计算机为人类读者生产卡片目录。

所以虽然MARC自称是一种“机读”的数据格式,当前的图书馆编目主要是面对人类读者的,难以被计算机处理。

这一方面表现在,图书馆编目数据是通过记录的形式来表达的,各个不同的元素被混合在同一条记录中。

当前,其他社区如果想利用图书馆的编目数据,要把图书馆的书目记录分解为不同元素的数据,而由于图书馆数据在语义上的缺陷,这个过程格外困难。

正如Jason Thomale的评论,图书馆数据本质上是一种“标记语言”,从中获取信息不但需要我们理解MARC字段的结构,还需要我们理解编目规则所规定的暗含的结构[1]。

同时,图书馆的数据库结构也难以利用来自外部的数据,降低了图书馆编目工作的效率。

另一方面,记录的形式也让单个元素的数据几乎不可能得到再利用。

其结果就Jan Hanneman所说,图书馆数据被隔绝在当前总体的数据交换过程之外[2]。

另一方面,图书馆的编目规则在功能上也是高度模糊。

AACR2是一个涵盖多种功能的元数据标准,它既规定数据内容的选取,也规定数据的呈现。

而且长久以来,AACR2和MARC 21一直被共同使用,这让图书馆编目的体系更加“庞大”,而难以进行必要的改进。

其次,当前的编目实践没办法很好地表达关系。

这一方面受制于MARC格式的平面结构,另一方面在AACR2中,关系也只是相对比较不重要的一方面。

而且,正如上文所说,这些关系的表达仍然主要是面对人类读者的。

正是在如上的背景下,语义网进入了图书馆目录的改革者的视野。

2 语义网及关联数据2.1语义网20世纪90年代初,英国的网络工程师Tim Berners-Lee(李爵士)在当时刚刚出现的互联网上开创了万维网(World Wide Web)服务。

在万维网中,各种信息被“超文本”相互连接并被读者获取。

万维网得以实现,主要依赖如下三个技术:统一资源标识符URI(Uniformed Resources Identifier),用于识别并且访问网络以及其他各处的资源;超文本标记语言HTML(Hyper Text Markup Language),用于标记网页内容;以及超文本传输协议HTTP(Hyper Text Transfer Protocol)用于传输数据。

李爵士把这种形态的万维网看做是“文档的网络”:万维网中的内容虽然通过超链接相连,但是因为HTML语言只能标记数据呈现的方式,却不能标记数据本身的意义,这样页面上的信息虽然能够为人类使用者所理解,但是没办法被计算机理解和处理。

这正是李爵士所设想的“语义网”——试图解决的问题[3]。

李爵士在2000年第一次绘制了语义网堆栈(Semantic Web Stack),这张永远处于beta版的图展示了各种相关的技术是如何被组织起来编织语义网的(如图1所示)。

在语义网中,XML语言代替了HTML语言。

XML相对于HTML的优点在于,它允许用户使用自己定义的标签来标识文本的内容,这可以解决文本标记语言缺乏语义的问题。

而资源及其关系则通过RDF模型(Resource Description Framework)来表达。

RDF使用“主语—谓语—宾语”的三元组来定义资源以及资源之间的关系。

每个三元组都能且只能表达一个关系。

图1李爵士在2000年绘制的语义网堆栈①在每一个三元组中,资源通过URI来标识。

一方面,URI所具有的唯一性不但可以消除语言的歧义和多语言的问题,实现“元数据的国际化”;而且,使用HTTP URI可以让资源识别和获取这两个步骤结合在一起。

在RDF之上是本体。

它通过界定一个领域内的概念以及这些概念之间的关系,来确定一个大多数人都能接受的知识领域的模型,方便机器进行推理,也方便某个领域的知识能够得到重复利用。

2.2关联数据关联数据是语义网的一个重要应用。

维基百科把关联数据定义为“通过网络上可参引的URI(dereferenceable URI)来揭示、分享和连接数据的方法”。

[4]李爵士在2006年提出了关联数据的四原则[5]:使用URI作为事物的名称使用HTTP URI让人们能够查看这些名称当有人查看这些名称,提供有用的信息,使用标准(RDF、 SPARQL)包含指向其他URI的链接,这样它们能够探索更多的事物W3C语义网教育和推广工作组(W3C Semantic Web Education and Outreach)的关联开放数据社区项目(Linking Open Data)是关联数据最有名的实践之一。

这个项目“通过在网络上用RDF模型出版多种开放数据集,并且通过在不同数据源的数据对象之间建立RDF 连接,来建立数据共用(data commons),扩展网络。

”[6]围绕这个项目形成的社区近年来蓬勃发展,许多大型机构,比如BBC和维基百科,都已经发布自己的数据集,并且把它们的数据集和已经存在的数据集相连,加入到这个运动中。

图2展示了截至2009年9月已经加入开放数据云的数据集。

如图2所示,图书馆是开放关联数据项目的重要参与者。

瑞典国家图书馆、匈牙利国家图书馆和德国国家图书馆都已经通过关联数据发布各自的图书馆目录或者规范数据。

大英图书馆在今年8月通过RDF/XML形式开放其数据集。

OCLC和美国国会图书馆也已经分别把其国家虚拟规范文档(VIAF)和SKOS化的美国国会图书馆主题词表(LCSH)发布为关联数据[7]。

2010年5月,W3C图书馆关联数据孵化小组(W3C Library Linked Data Incubator Group)成立,其目的是“通过聚集在图书馆社区内外参与语义网活动的人(重点在关联数据),推进现有的活动,并且确定未来的合作轨迹,帮助增进网络上图书馆数据的全球互操作。

”其主要活动包括收集图书馆和相关部门实践语义网技术的案例以及探索实施关联数据的相关问题,以应对图书馆内涵和外延的转变[8]。

图书馆领域对关联数据活动的积极的参与和实践,说明图书馆界已经意识到,传统的图书馆数据的生产和流通方式已经不足以满足当下的需求。

而语义网可以让图书馆数据和外部数据互操作,大大增加图书馆编目工作的效率。

因而它正是那艘带领我们“到达彼岸”的船。

而新的编目规则RDA则是这个过程中的重要一步。

图2截至2010年9月的开放关联数据云图②3 RDA在语义网的实现3.1过程1997年,在多伦多召开了“AACR原则和未来发展国际会议”(International Conference on the Principles & Future Development of AACR),这次会议使用了已经接近完成的FRBR模型中的理念,对在图书馆编目工作中占统治地位的英美编目条例(AACR)的原则、内容和载体、规则的逻辑结构等问题进行了讨论。

这个会议开启了编目规则转变的过程。

1998年,书目记录的功能需求(FRBR)正式出版。

FRBR模型采用实体-关系模型(Entity-Relationship Model),从使用者的角度分析了书目数据中的各个实体及其属性和关系。

李爵士认为,实体—关系模型和RDF模型在结构上相似,其中的许多概念都可以直接导向语义网的模型[9]。

因此,FRBR模型一个最大的意义就在于,传统编目实践借助这个模型有机会脱离既有的框架,迈向语义网的时代。

IFLA进行的后继研究把关注点从书目数据进一步扩展到人名规范数据和主题规范数据。

随着FRBR模型在编目界占据了统治地位,人们开始陆续用这个模型来修订编目原则和规则。

在编目原则的部分,2009年出版的《国际编目原则声明》取代了《巴黎声明》。

而2004年,AACR原则委员会(COP)任命Tom Delsey为AACR3的主编,开始新编目规则的修订工作[10]。

随后,为了强调新规则和传统规则之间的断裂,新规则被转而命名为资源的描述和检索(Resource Description & Access),也就是现在所知的RDA。

[11]经过几年的工作,在2010年6月,RDA的正式文本在RDA Toolkit上正式发布,进行公开测试。

根据国会图书馆公布的RDA测试时间表③,2010年10月到12月,测试者将正式生产RDA测试数据;2011年1月到4月,美国RDA测试协调委员会(US RDA Test Coordinating Committee)将分析测试结果,并向美国三家国家图书馆提交报告,RDA最后的命运将在明年由这三家国家图书馆来决定。

相关文档
最新文档