语义网
语义网

1.1什么是语义网微软公司董事长比尔·盖茨那幢坐落在西雅图,被喻为未来生活预言的科技住宅无疑是当今世界上最现代化的豪华住宅,堪称是智能建筑的经典之作。
豪宅内共铺设各种电缆52英里,房子内所有的电器设备相互连接成了一个智能网络。
主人在回家途中便可在车内利用计算机遥控家中的浴缸自动放水并调温,作好一切迎接准备。
房屋装有气象感知器,可以根据各项气象指标,控制室内的温度和通风情况。
走进大厅时,空调系统会将室温调整至你感觉最舒适的温度,音响系统也会针对你的喜好播放音乐,灯光系统自动调整照明颜色与强度,就连墙上的LCD显示屏,也会自动显示你喜爱的世界名画或播放你上次只看到一半的影片。
在住宅各处随意走动时,地板能在6英寸的范围内跟踪到人的足迹,在有人经过时自动打开照明,离去时自动关闭。
每个房间的温度、照明、音响等等都将随不同的设定自动调整。
就算是在水池中,也会从池底“冒”出如影随形的音乐。
尤其有意思的是,比尔·盖茨非常喜欢车道旁边一棵140岁的老枫树,所以就通过专门的监视系统对其进行24小时的全方位监控﹐一旦监视系统发现它有任何干燥的迹象,灌溉系统就会启动。
人们不禁要问,是什么尖端的科技系统使得盖茨先生的豪宅拥有如此高的智能化水平?要等到哪一个世纪才能让这样现代化的住宅走入寻常百姓家?你可能不曾想到,通过扩展今天的万维网(即WWW,是World Wide Web的简称)就完全可以使这一梦想变为现实。
这种扩展后的万维网称为语义网(Semantic Web)。
语义网的概念由万维网的发明者、现任万维网联盟(即W3C,是World Wide Web Consortium的简称)主任提姆·伯纳丝·李(Tim Berners-Lee)于1998年首次提出。
在他看来,“语义网(Semantic Web)并非是另外一个独立的Web,而是现在的Web的一个延伸。
在其中,所有的信息都具有定义完好的含义,更利于人与机器之间的合作。
语义网数据库

语义网数据库随着计算机技术的不断进步,互联网所蕴藏的数据量不断增长,这也给基于语义的数据处理提供了更为广阔的空间。
而语义网数据库作为语义处理的基石,对于整个语义处理领域来说,都是至关重要的。
一、什么是语义网数据库?语义网数据库(Semantic Web Database),简称SWDB,是指采用适于在语义网体系结构中应用的语义技术来构建、存储和检索数据的数据库。
它不仅提供标准的数据存储和查询功能,而且通过利用语义表示和推理技术进一步加强了数据的语义化表达和查询处理能力,从而提高了数据处理的效率和准确度。
语义网数据库通常分为RDF数据库和OWL数据库两种类型。
其中RDF数据库主要是用来存储RDF(Resource Description Framework)三元组形式的语义数据,而OWL数据库则是专门用来存储基于OWL(Web Ontology Language)的本体数据。
二、语义网数据库的特点1. 数据语义化语义网数据库的最大特点就是强调对数据进行语义化处理。
通过将数据以RDF(Resource Description Framework)形式进行存储和查询,可以使数据间存在更为精细的联系,从而使数据间的关系更加清晰易懂。
2. 可扩展性由于语义网数据库采用的是基于RDF和OWL语义标准的方式进行数据处理和存储,因此与其他数据库相比,语义网数据库更容易实现数据的可扩展性。
同时,由于这些标准都是开放式的,所以语义网数据库能够与其他工具和技术进行很好的集成。
3. 语义推理借助于OWL语义标准的支持,语义网数据库还可以通过对数据进行推理,完成更为复杂的语义处理任务。
例如,在传统的关系型数据库中,如果要寻找父母为“王氏家族”的所有人的出生日期,需进行多次子查询。
但在语义网数据库中,则可以利用OWL 多属性定义和推理算法,直接找到与“王氏家族”相关的所有人及其属性。
三、语义网数据库的应用场景1. 知识图谱知识图谱是语义网技术的一个重要应用领域。
语义网中的本体构建与推理研究

语义网中的本体构建与推理研究随着互联网技术的不断发展,人们在网络上获取信息变得越来越容易,然而,这些信息往往是海量的、杂乱无章的,并不便于机器自动处理。
因此,我们需要一种能够理解信息含义的方式,来帮助我们更好地处理这些信息。
这就是语义网的基本思想。
语义网(Semantic Web)的核心是充分地使用信息的语义,通过构建本体(Ontology)、推理等手段来实现Web资源的高效利用和共享。
本体是语义网的基石本体是语义网中的核心概念。
顾名思义,本体就是用于描述实体及其关联关系的模型。
它是对某一领域中实体、概念、属性和关系等的描述,以及这些描述之间的约束、规则等。
本体的目的是消除不同人、不同组织、不同机器对同一概念的不同解释,为不同使用者提供一个一致的、标准的基础。
因此,本体的构建关系到语义网的推广和应用。
本体构建的方法本体构建的方法可以大致分为三大类:手工构建法、半自动化构建和自动化构建。
手工构建是最早出现的一种本体构建方式。
其优点在于可以高度抽象地描述概念,缺点在于速度慢、成本高。
半自动化构建则是在手工构建的基础上,在人工干预的情况下涉及到自动化工具,优点在于缩短了构建时间。
自动化构建是一种基于机器学习的方法,具有时间成本低、可扩展性好等优点。
本体推理的方法本体推理是指通过基于本体知识的逻辑推断,从本体中出发,再结合外部实例数据,推导出新的知识或结论,从而完善和扩展本体的过程。
本体推理的方法可以大致分为逻辑推理和规则推理。
逻辑推理是利用逻辑形式化地表示本体知识,然后进行逻辑推理的过程。
逻辑推理需要对本体进行形式化表示,从而使推理结果是形式化规则所允许的。
规则推理是指利用基于规则或规则表示的推理方法,利用规则的强特定性来完成推理任务。
本体构建和推理的应用完善的本体和推理技术可以帮助我们更好地利用和共享网络信息。
下面分别介绍几个应用。
1. 语义搜索语义搜索可以从网络数据中精确提取用户所需信息。
在语义搜索中,可以利用本体中的概念间关系,由搜索关键词推断出更适合用户需求的结果,从而不必对搜索结果进行手工筛选。
语义网概念及技术综述

语义网概念及技术综述语义网(Semantic Web)是一种由 W3C(World Wide Web Consortium)推广的,基于 XML(eXtensible Markup Language)和 RDF(Resource Description Framework)等技术的网络,它旨在增强网络信息的语义表达和机器可读性,从而使得计算机能够更好地理解和处理网络信息。
一、语义网的概念语义网是一种以“数据”为中心的网络,它通过使用 XML、RDF 等技术,将网络信息以机器可读的方式进行组织和表达。
与传统的 Web 相比,语义网更加强调信息的结构和含义,而不是简单的文本表现形式。
因此,语义网被认为是 Web 的一个重要发展阶段,是实现智能 Web 的关键步骤。
二、语义网的技术1.XMLXML 是构建语义网的基础技术之一,它是一种用于描述数据的标记语言。
XML 可以用来表示数据结构,并且可以很好地与 HTML、HTTP 等现有网络技术集成。
通过 XML,我们可以将数据以机器可读的方式进行组织和表达,从而使得计算机可以更好地处理和理解数据。
2.RDFRDF 是另一种构建语义网的关键技术,它是一种用于描述资源及其关系的模型。
RDF 将每个资源视为一个三元组,包括主体、属性和值三个部分。
通过这种方式,我们可以将网络信息以一种通用的、机器可读的方式进行描述和组织,从而实现数据的共享和重用。
3.RDFSRDFS 是 RDF 的扩展,它增加了一些新的概念和规则,例如类、子类关系、属性限制等。
这些概念和规则可以帮助我们更好地描述和组织数据,并且可以用于构建更加复杂的语义网应用。
4.OWLOWL 是另一种基于 RDF 的语言,它提供了更加丰富的概念和规则,例如类、属性、关系等。
OWL 提供了三种不同的表达层次,分别是 OWL Lite、OWL DL 和OWL Full,以满足不同应用场景的需求。
OWL 可以用于描述更加复杂的概念和关系,并且可以用于构建更加高级的语义网应用。
语义网

语义网1.概念语义网是Semantic Web的中文名称。
语义网就是能够根据语义进行判断的网络。
简单地说,语义网是一种能理解人类语言的智能网络,它不但能够理解人类的语言,而且还可以使人与电脑之间的交流变得像人与人之间交流一样轻松。
添加了更多的用于描述属性和类型的词汇,例如类型之间的不相交性(disjointness),基数(cardinality),等价性,属性的更丰富的类型,属性特征(例如对称性,symmetry),以及枚举类型(enumerated classes).2.基本特征(1)语义网不同于现在WWW,它是现有WWW的扩展与延伸;(2) 现有的WWW是面向文档而语义网则面向文档所表示的数据;(3) 语义网将更利于计算机“理解与处理”,并将具有一定的判断、推理能力。
虽然语义网给我们展示了WWW的美好前景以及由此而带来的互联网的革命,但语义网的实现仍面临着巨大的挑战:(1)内容的可获取性,即基于Ontology而构建的语义网网页目前还很少;(2)本体的开发和演化,包括用于所有领域的核心本体的开发、开发过程中的方法及技术支持、本体的演化及标注和版本控制问题;(3)内容的可扩展性,即有了语义网的内容以后,如何以可扩展的方式来管理它,包括如何组织、存储和查找等;(4)多语种支持;(5)本体语言的标准化。
3.语义网与万维网的区别语义网“不同于现存的万维网,其数据主要供人类使用,新一代WWW中将提供也能为计算机所处理的数据,这将使得大量的智能服务成为可能”;语义网研究活动的目标是“开发一系列计算机可理解和处理的表达语义信息的语言和技术,以支持网络环境下广泛有效的自动推理”。
目前我们所使用的万维网,实际上是一个存储和共享图像、文本的媒介,电脑所能看到的只是一堆文字或图像,对其内容无法进行识别。
万维网中的信息,如果要让电脑进行处理的话,就必须首先将这些信息加工成计算机可以理解的原始信息后才能进行处理,这是相当麻烦的事情。
知识图谱与语义网

知识图谱与语义网随着互联网的快速发展,数据量以及信息的复杂度越来越高,要获取有用的信息变得越来越困难。
在巨量数据的情况下,传统的检索方式已经难以满足用户的需求,必须借助新的技术和工具来处理数据并快速获取信息。
知识图谱和语义网在解决这个问题上起着至关重要的作用。
一、什么是语义网?语义网是一种以图像为基础的网络模型,该模型旨在让计算机理解人类语言中的语义。
语义网络的核心思想是为互联网上的数据提供更多的上下文信息,从而让机器更好地理解数据。
在传统的万维网中,每个页面都是一个独立的实体,而在语义网中,每个页面都被分类和链接,这些链接以声明的方式提供上下文信息。
这些链接通常被称为RDF链接,表示资源描述框架。
通过这些链接,计算机可以更好地理解数据,并自动提供更多的信息和解释。
二、什么是知识图谱?知识图谱可以被视为一种高效的数据组织结构,目的是从大量的数据中提取有用的知识和信息。
它的核心思想是为每种类型的实体定义一个结构,并将实体之间的关系映射到图谱中。
知识图谱是一个由实体和关系组成的图形。
它提供了一种可视化方式,使机器能够更好地理解实体及其关系。
例如,在Google 搜索中,知识图谱可以为用户提供更多的上下文信息,提供与用户搜索相关的知识和信息。
三、知识图谱和语义网的区别和联系虽然知识图谱和语义网的概念相似,但它们有一些本质差别。
知识图谱是一种更具体化和可视化的实例,它提供了一种可视化方式,使我们更好地理解数学实体及其之间的关系。
另一方面,语义网是概念上更通用和抽象的,它旨在不同的语言和数据源之间建立联系。
尽管如此,知识图谱和语义网之间存在联系和相互关联。
知识图谱本身不可能从头开始构建,因为这个过程需要对语义知识的抽象理解。
要获得这些知识,需要依赖于语义网技术,并从不同数据源中提取数据。
四、未来展望知识图谱和语义网都是一种能够帮助我们更好地处理和理解世界的技术。
随着数据量和复杂度的增加,这些技术将变得更加重要。
语义网技术的发展与应用

语义网技术的发展与应用随着互联网的普及与数据的爆炸式增长,我们越来越需要一种更加高效、准确、智能的方式来处理和利用数据。
而语义网技术就是能够满足这种需求的一种新型数据处理技术。
本文将从语义网技术的定义、发展历程以及其应用前景三个方面来展开论述。
一、语义网技术的定义语义网技术,即语义网(Semantic Web),是一种基于网络的、带有语义的数据处理技术。
它能让机器理解文字和语言,并对其进行推理和应用,从而赋予数据更多的深层次的含义和价值。
语义网技术的核心是对于不同类型的信息进行统一整合、归纳和处理,以达到复杂、多样性数据间的自动化共享和交流。
二、语义网技术的发展历程语义网技术的历史可以追溯到英国人蒂姆·伯纳斯·李(Tim Berners-Lee)在1989年提出“万维网”(World Wide Web)的想法。
他最初创意是为了方便科学研究者之间的信息交流,而在此基础上,李提出了语义网的概念,即将现有的万维网变成一个更加智能化的平台,以减少数据匮乏、信息无效的情况。
20世纪90年代,随着万维网上的信息爆炸式增长,语义网技术逐渐得到了人们的重视。
在2001年,万维网联盟(W3C)发布了语义网指导方针,正式确立了语义网技术的标准化。
此后,每年W3C都会发布新的语义网推荐规范,不断完善和拓展语义网的功能和应用范畴。
三、语义网技术的应用前景语义网技术的应用前景非常广泛,可以用于企业管理、电子商务、智能家居、医疗健康、金融投资、灾害预警等多个领域。
以下是具体的几个应用实例:1.企业管理:语义网技术可以建立起一个完整、集成的企业数据体系,实现对企业内部数据和知识的有效管理与共享。
2.电子商务:语义网技术可以将产品和服务的信息进行语义化,方便消费者搜索和比较,提高电子商务的效率。
3.智能家居:语义网技术可以将家居设备和服务进行互联化,实现智能化的管理和控制,提升家庭生活质量和安全性。
4.医疗健康:语义网技术可以整合医学知识和患者数据,实现个性化的医疗服务和健康管理。
语义网技术在物联网中的应用与发展前景

语义网技术在物联网中的应用与发展前景摘要:物联网的快速发展为人们的生活带来了极大的便利和改变。
然而,由于物联网中的设备和传感器产生的数据庞大且多样化,如何有效地管理和利用这些数据成为一项巨大的挑战。
语义网技术作为一种用于描述和管理数据的方法,可以通过提供语义信息帮助解决这一挑战。
本文将探讨语义网技术在物联网中的应用,并展望其未来的发展前景。
1. 物联网简介物联网即“物联网”,是由无线传感器、嵌入式系统、云计算等技术组成的一种网络,通过物理世界和信息世界的融合,实现对物体的感知、交互和远程控制。
物联网的核心是数据交换和互联互通,通过物联网技术,各种智能设备可以实现互联互通,形成一个高度智能化的网络。
2. 物联网中的数据管理挑战物联网中的设备和传感器产生的数据庞大且多样化,如何有效地管理和利用这些数据成为一项重要的任务。
目前,物联网中数据管理存在以下挑战:a. 数据量大:物联网中的设备和传感器产生的数据量非常巨大,传统的数据库管理系统无法满足对这些数据的处理需求。
b. 数据多样:物联网中的数据具有多样性,涵盖了不同领域和不同类型的数据,如传感器数据、图像数据、文本数据等。
c. 数据带有语义:物联网中的数据并不仅仅是原始数据,还包含了丰富的语义信息,如数据的含义、关系等。
d. 数据的集成和共享:物联网中数据来自不同的设备和传感器,如何将这些异构的数据进行集成和共享是一个难题。
3. 语义网技术简介语义网技术是一种用于描述和管理数据的方法,它强调语义信息的添加和利用。
语义网技术的核心是RDF(Resource Description Framework),它是一种用于表示资源和资源之间关系的标准语言。
通过RDF,可以对数据进行语义建模和描述,并以图形的形式来表示数据和关系。
4. 语义网技术在物联网中的应用语义网技术在物联网中有很多应用,以下是几个典型的例子:a. 数据整合和集成:语义网技术可以帮助解决物联网中数据异构的问题,通过对数据进行语义建模和描述,可以将来自不同设备和传感器的数据进行整合和集成,为用户提供统一的视图和接口。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【转载】自Tim Berners-Lee于1998年提出了语义网(the Semantic Web)的概念之后,就一直成为人们讨论与研究的热点。
当前国际上关于语义网的研究刚刚处于起步阶段,而我国对语义网的研究不论是从标准规范、系统试验、研究深度,还是从规模层次、具体应用方面都相对落后。
另人欣慰的是,我国学者已经认识到了语义网及其相关技术对未来互联网发展的影响,并开始着手研究语义网及其相关的关键技术与应用。
本文将从以下四个方面对我国语义网研究作综合述评: (1)基本情况,对当前国内语义网的研究情况做一总体介绍;(2)体系结构,即对语义网体系结构研究的情况;(3)关键技术,讨论对 RDF(Resource Description Framework,即资源描述框架)和Ontology(本体或本体论)的研究情况;(4)试验与应用,即当前针对语义网或利用其中的关键技术所做的具体试验与应用。
最后,在对以上四个方面的情况进行综合述评的基础上总结当前国内语义网研究的特点和存在的主要问题并指出今后主要的研究方向与重点。
1 基本概况当前对语义网的概念还没有形成统一的定义,对语义网的理解表述不一。
如语义网是“第三代Web,其目标是实现机器自动处理信息,它提供诸如信息代理、搜索代理、信息过滤等智能服务”[1];语义网“不同于现存的万维网,其数据主要供人类使用,新一代WWW中将提供也能为计算机所处理的数据,这将使得大量的智能服务成为可能”[2];语义网研究活动的目标是“开发一系列计算机可理解和处理的表达语义信息的语言和技术,以支持网络环境下广泛有效的自动推理”[3]。
语义网的创始人Tim Berners-Lee对语义网的定义如下:“语义网是一个网,它包含了文档或文档的一部分,描述了事物间的明显关系,且包含语义信息,以利于机器的自动处理”[4]。
尽管对语义网的理解与描述不同,但仍能从这些描述与理解中看出语义网的一些基本特征:(1)语义网不同于现在WWW,它是现有WWW的扩展与延伸;(2) 现有的WWW是面向文档而语义网则面向文档所表示的数据;(3) 语义网将更利于计算机“理解与处理”,并将具有一定的判断、推理能力。
语义网的实现依赖于三大关键技术:XML、RDF和Ontology。
本文将在第3小节对它们进行讨论。
虽然语义网给我们展示了WWW的美好前景以及由此而带来的互联网的革命,但语义网的实现仍面临着巨大的挑战[2]: (1)内容的可获取性,即基于Ontology 而构建的语义网网页目前还很少;(2)本体的开发和演化,包括用于所有领域的核心本体的开发、开发过程中的方法及技术支持、本体的演化及标注和版本控制问题;(3)内容的可扩展性,即有了语义网的内容以后,如何以可扩展的方式来管理它,包括如何组织、存储和查找等;(4)多语种支持;(5)本体语言的标准化。
虽然与国外相比我国对语义网的研究相对落后,但从1999年至2004年4月发表的论文来看, (1)论文数量逐年递增。
2002年发表相关论文22篇,分别是2000年(6篇)和2001年(4篇)年论文数量的3.7倍和5.5倍,2003年发表论文38篇,是2002年的1.7倍,这说明随着时间的推移,对语义网的研究已经引起了我国学者的高度重视;(2)研究内容越来越广泛而深入,大致可分为三个层次:第一层次,即对语义网及其关键技术的描述与介绍,主要包括语义网的含义[2][5][6][7]、体系结构[8][9]、关键技术(RDF、Ontology) [10][11][12][13][14][15][16][17][18][19]、面临的挑战等[2];第二层次是关于语义网及其关键技术对相关学科或研究领域的影响与启示,包括信息管理[20][21][22][23]、信息检索[3][20][24][25][26][27][28][29][30][31][32][33][34]、知识库系统[35][36][37][38]、数字图书馆[39][40][41][42]、数据挖掘[43]、电子商务[44][45]、机器翻译[46]、智能代理[47][48][49]、需求分析[50][51]、元数据描述与交换[52][53][54]、网络信息资源和知识的表达[55][56]等;第三个层次则是针对语义网及其关键技术所做的具体试验与应用,包括RDF的应用与存储[57][58]、基于RDF/XML的搜索引擎的设计与实现[59]、语义网的试探性实现[60][61][62][63][64]、Ontology的构建[65][66][67][68][69][70]、基于Ontology的查询系统设计[71][72]、Ontology在图书服务网络、知识图书馆和数字图书馆中的应用[73][74][75]、Ontology与主题词表相结合实现对元数据的查询[76]等。
2 体系结构Berners-Lee于2000年提出了语义网的体系结构(见图一),并对此做了简单的介绍。
该体系结构共有七层,自下而上其各层功能逐渐增强。
图一语义网体系结构第一层:Unicode和URI。
Unicode是一个字符集,这个字符集中所有字符都用两个字节表示,可以表示65536个字符,基本上包括了世界上所有语言的字符。
数据格式采用Unicode的好处就是它支持世界上所有主要语言的混合,并且可以同时进行检索。
URI(Uniform Resource Identifier),即统一资源定位符,用于唯一标识网络上的一个概念或资源。
在语义网体系结构中,该层是整个语义网的基础,其中Unicode负责处理资源的编码,URI负责资源的标识[77]。
第二层:XML+NS+xmlschema。
XML是一个精简的SGML,它综合了SGML的丰富功能与HTML的易用性,它允许用户在文档中加入任意的结构,而无需说明这些结构的含意。
NS (Name Space)即命名空间,由URI索引确定,目的是为了避免不同的应用使用同样的字符描述不同的事物。
XML Schema是DTD(Document Data Type)的替代品,它本身采用XML语法,但比DTD更加灵活,提供更多的数据类型,能更好地为有效的XML文档服务并提供数据校验机制[21]。
正是由于XML灵活的结构性、由URI索引的NS而带来的数据可确定性以及XML Schema所提供的多种数据类型及检验机制,使其成为语义网体系结构的重要组成部分。
该层负责从语法上表示数据的内容和结构,通过使用标准的语言将网络信息的表现形式、数据结构和内容分离[55]。
第三层:RDF+rdfschema。
RDF是一种描述WWW上的信息资源的一种语言,其目标是建立一种供多种元数据标准共存的框架。
该框架能充分利用各种元数据的优势,进行基于Web 的数据交换和再利用。
RDF解决的是如何采用XML标准语法无二义性地描述资源对象的问题,使得所描述的资源的元数据信息成为机器可理解的信息。
如果把 XML看作为一种标准化的元数据语法规范的话,那么RDF 就可以看作为一种标准化的元数据语义描述规范。
Rdfschema使用一种机器可以理解的体系来定义描述资源的词汇,其目的是提供词汇嵌入的机制或框架,在该框架下多种词汇可以集成在一起实现对Web资源的描述[55]。
第四层:Ontology vocabulary。
该层是在RDF(S)基础上定义的概念及其关系的抽象描述,用于描述应用领域的知识[78],描述各类资源及资源之间的关系[77],实现对词汇表的扩展。
在这一层,用户不仅可以定义概念而且可以定义概念之间丰富的关系[60]。
第五至七层:Logic、Proof、Trust。
Logic负责提供公理和推理规则,而Logic一旦建立,便可以通过逻辑推理对资源、资源之间的关系以及推理结果进行验证,证明其有效性。
通过Proof交换以及数字签名,建立一定的信任关系,从而证明语义网输出的可靠性以及其是否符合用户的要求。
语义网的体系结构正在建设中,当前国际范围内对此体系结构的研究还没有形成一个另人满意的严密的逻辑描述与理论体系,我国学者对该体系结构也只是在国外研究的基础上做简要的介绍,还没有形成系统的阐述。
3 关键技术语义网的实现需要三大关键技术的支持:XML、RDF和Ontology。
XML(eXtensible Marked Language,即可扩展标记语言)可以让信息提供者根据需要,自行定义标记及属性名,从而使XML文件的结构可以复杂到任意程度。
它具有良好的数据存储格式和可扩展性、高度结构化以及便于网络传输等优点,再加上其特有的NS机制及XML Schema所支持的多种数据类型与校验机制,使其成为语义网的关键技术之一。
目前关于语义网关键技术的讨论主要集中在RDF和Ontology身上。
3.1 RDFRDF是W3C组织推荐使用的用来描述资源及其之间关系的语言规范,具有简单、易扩展、开放性、易交换和易综合等特点[79]。
值得注意的是,RDF 只定义了资源的描述方式,却没有定义用哪些数据描述资源。
RDF由三个部分组成:RDF Data Model、RDF Schema和RDF Syntax[80]。
RDF Data Model提供了一个简单但功能强大的模型,通过资源、属性及其相应值来描述特定资源。
模型定义为:(1)它包含一系列的节点 N;(2)它包含一系列属性类 P;(3)每一属性都有一定的取值V;(4)模型是一个三元组:{节点,属性类,节点或原始值V};(5)每一个Data Model 可以看成是由节点和弧构成的有向图。
模型中所有被描述的资源以及用来描述资源的属性值都可以看成是“节点”(Node)。
由资源节点、属性类和属性值组成的一个三元组叫做RDF Statement (或RDF陈述)。
在模型中,陈述既可以作为资源节点,同时也可以作为值节点出现,所以一个模型中的节点有时不止一个。
这时,用来描述资源节点的值节点本身还具有属性类和值,并可以继续细化。
RDF Schema 使用一种机器可以理解的体系来定义描述资源的词汇,其功能就像一个字典,可以将其理解为大纲或规范[80]。
RDF Schema的作用是:(1)定义资源以及属性的类别;(2)定义属性所应用的资源类以及属性值的类型;(3)定义上述类别声明的语法;(4)申明一些由其它机构或组织定义的元数据标准的属性类。
RDF Schema 定义了三个核心类:rdf:Resource、rdfs:Property、rdfs:Class;五个核心属性:rdf:type、rdfs:subClassOf、rdfs:seeAlso、rdfs:subPropertyOf、rdfs:isDefinedBy;四个核心约束:rdfs:ConstrantResource、rdfs:range、rdfs:ConstraintProperty、rdfs:domain。