语义网

【转载】自Tim Berners-Lee于1998年提出了语义网(the Semantic Web)的概念之后，就一直成为人们讨论与研究的热点。当前国际上关于语义网的研究刚刚处于起步阶段，而我国对语义网的研究不论是从标准规范、系统试验、研究深度，还是从规模层次、具体应用方面都相对落后。另人欣慰的是，我国学者已经认识到了语义网及其相关技术对未来互联网发展的影响，并开始着手研究语义网及其相关的关键技术与应用。本文将从以下四个方面对我国语义网研究作综合述评： (1)基本情况，对当前国内语义网的研究情况做一总体介绍；(2)体系结构，即对语义网体系结构研究的情况；(3)关键技术，讨论对 RDF(Resource Description Framework，即资源描述框架)和Ontology(本体或本体论)的研究情况；(4)试验与应用，即当前针对语义网或利用其中的关键技术所做的具体试验与应用。最后，在对以上四个方面的情况进行综合述评的基础上总结当前国内语义网研究的特点和存在的主要问题并指出今后主要的研究方向与重点。

1 基本概况

当前对语义网的概念还没有形成统一的定义，对语义网的理解表述不一。如语义网是“第三代Web，其目标是实现机器自动处理信息，它提供诸如信息代理、搜索代理、信息过滤等智能服务”[1]；语义网“不同于现存的万维网，其数据主要供人类使用，新一代WWW中将提供也能为计算机所处理的数据，这将使得大量的智能服务成为可能”[2]；语义网研究活动的目标是“开发一系列计算机可理解和处理的表达语义信息的语言和技术，以支持网络环境下广泛有效的自动推理”[3]。语义网的创始人Tim Berners-Lee对语义网的定义如下：“语义网是一个网，它包含了文档或文档的一部分，描述了事物间的明显关系，且包含语义信息，以利于机器的自动处理”［4］。尽管对语义网的理解与描述不同，但仍能从这些描述与理解中看出语义网的一些基本特征：(1)语义网不同于现在WWW，它是现有WWW的扩展与延伸；(2) 现有的WWW是面向文档而语义网则面向文档所表示的数据；(3) 语义网将更利于计算机“理解与处理”，并将具有一定的判断、推理能力。

语义网的实现依赖于三大关键技术：XML、RDF和Ontology。本文将在第3小节对它们进行讨论。

虽然语义网给我们展示了WWW的美好前景以及由此而带来的互联网的革命，但语义网的实现仍面临着巨大的挑战［2］： (1)内容的可获取性，即基于Ontology 而构建的语义网网页目前还很少；(2)本体的开发和演化，包括用于所有领域的核心本体的开发、开发过程中的方法及技术支持、本体的演化及标注和版本控制问题；(3)内容的可扩展性，即有了语义网的内容以后，如何以可扩展的方式来管理它，包括如何组织、存储和查找等；(4)多语种支持；(5)本体语言的标准化。虽然与国外相比我国对语义网的研究相对落后，但从1999年至2004年4月发表的论文来看， (1)论文数量逐年递增。2002年发表相关论文22篇，分别是2000年(6篇)和2001年(4篇)年论文数量的3.7倍和5.5倍，2003年发表论文38篇，是2002年的1.7倍，这说明随着时间的推移，对语义网的研究已经引起了我国学者的高度重视；(2)研究内容越来越广泛而深入，大致可分为三个层次：第一层次，即对语义网及其关键技术的描述与介绍，主要包括语义网的含义[2][5][6][7]、体系结构[8][9]、关键技术(RDF、Ontology) [10][11][12][13][14][15][16][17][18][19]、面临的挑战等[2]；

第二层次是关于语义网及其关键技术对相关学科或研究领域的影响与启示，包括信息管理[20][21][22][23]、信息检索［3］［20］［24］［25］［26］［27］［28］［29］[30][31][32][33][34]、知识库系统［35］［36］［37］［38］、数字图书馆[39][40][41][42]、数据挖掘［43］、电子商务［44］［45］、机器翻译［46］、智能代理［47］[48][49]、需求分析［50］［51］、元数据描述与交换［52］［53］［54］、网络信息资源和知识的表达［55］[56]等；

第三个层次则是针对语义网及其关键技术所做的具体试验与应用，包括RDF的应用与存储［57］［58］、基于RDF/XML的搜索引擎的设计与实现［59］、语义网的试探性实现［60］[61][62][63][64]、Ontology的构建［65］[66][67][68][69][70]、基于Ontology的查询系统设计［71］[72]、Ontology在图书服务网络、知识图书馆和数字图书馆中的应用［73］［74］［75］、Ontology与主题词表相结合实现对元数据的查询［76］等。

2 体系结构

Berners-Lee于2000年提出了语义网的体系结构(见图一)，并对此做了简单的介绍。该体系结构共有七层，自下而上其各层功能逐渐增强。

图一语义网体系结构

第一层：Unicode和URI。Unicode是一个字符集，这个字符集中所有字符都用两个字节表示，可以表示65536个字符，基本上包括了世界上所有语言的字符。数据格式采用Unicode的好处就是它支持世界上所有主要语言的混合，并且可以同时进行检索。URI(Uniform Resource Identifier)，即统一资源定位符，用于唯一标识网络上的一个概念或资源。在语义网体系结构中，该层是整个语义网的基础，其中Unicode负责处理资源的编码，URI负责资源的标识［77］。

第二层：XML+NS+xmlschema。 XML是一个精简的SGML，它综合了SGML

的丰富功能与HTML的易用性，它允许用户在文档中加入任意的结构，而无需说明这些结构的含意。NS (Name Space)即命名空间，由URI索引确定，目的是为了避免不同的应用使用同样的字符描述不同的事物。XML Schema是DTD(Document Data Type)的替代品，它本身采用XML语法，但比DTD更加灵活，提供更多的数据类型，能更好地为有效的XML文档服务并提供数据校验机制［21］。正是由于XML灵活的结构性、由URI索引的NS而带来的数据可确定性以及XML Schema所提供的多种数据类型及检验机制，使其成为语义网体系结构的重要组成部分。该层负责从语法上表示数据的内容和结构，通过使用标准的语言将网络信息的表现形式、数据结构和内容分离［55］。

第三层：RDF+rdfschema。RDF是一种描述WWW上的信息资源的一种语言，其目标是建立一种供多种元数据标准共存的框架。该框架能充分利用各种元数据的优势，进行基于Web 的数据交换和再利用。RDF解决的是如何采用XML标准语法无二义性地描述资源对象的问题，使得所描述的资源的元数据信息成为机器可理解的信息。如果把 XML看作为一种标准化的元数据语法规范的话，那么RDF 就可以看作为一种标准化的元数据语义描述规范。Rdfschema使用一种机器可以理解的体系来定义描述资源的词汇，其目的是提供词汇嵌入的机制或框架，在该框架下多种词汇可以集成在一起实现对Web资源的描述［55］。

第四层：Ontology vocabulary。该层是在RDF(S)基础上定义的概念及其关系的抽象描述，用于描述应用领域的知识［78］，描述各类资源及资源之间的关系［77］，实现对词汇表的扩展。在这一层，用户不仅可以定义概念而且可以定义概念之间丰富的关系［60］。

第五至七层：Logic、Proof、Trust。Logic负责提供公理和推理规则，而Logic一旦建立，便可以通过逻辑推理对资源、资源之间的关系以及推理结果进行验证，证明其有效性。通过Proof交换以及数字签名，建立一定的信任关系，从而证明语义网输出的可靠性以及其是否符合用户的要求。

语义网的体系结构正在建设中，当前国际范围内对此体系结构的研究还没有形成一个另人满意的严密的逻辑描述与理论体系，我国学者对该体系结构也只是在国外研究的基础上做简要的介绍，还没有形成系统的阐述。

3 关键技术

语义网的实现需要三大关键技术的支持：XML、RDF和Ontology。

XML(eXtensible Marked Language，即可扩展标记语言)可以让信息提供者根据需要，自行定义标记及属性名，从而使XML文件的结构可以复杂到任意程度。它具有良好的数据存储格式和可扩展性、高度结构化以及便于网络传输等优点，再加上其特有的NS机制及XML Schema所支持的多种数据类型与校验机制，使其成为语义网的关键技术之一。目前关于语义网关键技术的讨论主要集中在RDF

和Ontology身上。

3.1 RDF

RDF是W3C组织推荐使用的用来描述资源及其之间关系的语言规范，具有简单、易扩展、开放性、易交换和易综合等特点［79］。值得注意的是,RDF 只定义了资源的描述方式，却没有定义用哪些数据描述资源。RDF由三个部分组成：RDF Data Model、RDF Schema和RDF Syntax［80］。

RDF Data Model提供了一个简单但功能强大的模型，通过资源、属性及其相应值来描述特定资源。模型定义为：

(1)它包含一系列的节点 N；

(2)它包含一系列属性类 P；

(3)每一属性都有一定的取值V；

(4)模型是一个三元组：{节点，属性类，节点或原始值V}；

(5)每一个Data Model 可以看成是由节点和弧构成的有向图。

模型中所有被描述的资源以及用来描述资源的属性值都可以看成是“节点”(Node)。由资源节点、属性类和属性值组成的一个三元组叫做RDF Statement (或RDF陈述)。在模型中，陈述既可以作为资源节点，同时也可以作为值节点出现，所以一个模型中的节点有时不止一个。这时，用来描述资源节点的值节点本身还具有属性类和值，并可以继续细化。

RDF Schema 使用一种机器可以理解的体系来定义描述资源的词汇，其功能就像一个字典，可以将其理解为大纲或规范［80］。RDF Schema的作用是：

(1)定义资源以及属性的类别；

(2)定义属性所应用的资源类以及属性值的类型；

(3)定义上述类别声明的语法；

(4)申明一些由其它机构或组织定义的元数据标准的属性类。

RDF Schema 定义了

三个核心类：rdf:Resource、rdfs:Property、rdfs:Class；

五个核心属性：rdf:type、rdfs:subClassOf、rdfs:seeAlso、

rdfs:subPropertyOf、rdfs:isDefinedBy；

四个核心约束：rdfs:ConstrantResource、rdfs:range、

rdfs:ConstraintProperty、rdfs:domain。［60］

RDF Syntax构造了一个完整的语法体系以利于计算机的自动处理，它以XML为其宿主语言，通过XML语法实现对各种元数据的集成。

3.2 Ontology

Ontology (本体或本体论)，原本是一个哲学上的概念，用于研究客观世界本质。目前Ontology已经被广泛应用到包括计算机科学、电子工程、远程教育、电子商务、智能检索、数据挖掘等在内的诸多领域。它是一份正式定义名词之间关系的文档或文件。一般Web上的Ontology包括分类和一套推理规则。分类，用于定义对象的类别及其之间的关系；推理规则，则提供进一步的功能，完成语义网的关键目标即“机器可理解”。本体的最终目标是“精确地表示那些隐含(或不明确的)信息”［25］。

当前对本体的理解仍没有形成统一的定义，如本体是共享概念模型的形式化规范说明，通过概念之间的关系来描述概念的语义［26］；本体是对概念化对象的明确表示和描述［27］；本体是关于领域的显式的、形式化的共享概念化规范［82］等等。但斯坦福大学的Gruber给出的定义得到了许多同行的认可，即“本体是概念化的显示规范”［82］。概念化(Conceptualization)被定义为：C = ,其中C 表示概念化对象，D表示一个域，W是该领域中相关事物状态的集合，Rc是域空间上的概念关系的集合。规范(Specification)是为了形成对领域内概念、知识及概念间关系的统一的认识与理解，以利于共享与重用。

本体需要某种语言来对概念化进行描述，按照表示和描述的形式化的程度不同，可以将本体分为完全非形式化本体、半非形式化本体、半形式化本体和严格形式化的本体［27］。有许多语言可用于表示Ontology，其中一些语言是基于XML 语法并用于语义网的，如XOL(Xml- based Ontology exchange Language)，SHOE(Simple HTML Ontology Language)，OML(Ontology Markup Language)以及由W3C组织创建的RDF与RDF Schema(RDFS)。还有建立在RDF与RDFS之上的、较为完善的Ontology语言DAML(DARPA Agent Markup Language)、OIL和DAML+OIL。XOL是一种基于XML语法和OKBC语义的本体交换语言。它由美国生物信息学术

团体设计，用于其领域的一组异构软件系统间本体定义的交换，它以 Ontolingua 和OML作为基础，融合了OKBC的高层表达方式和OML的语法。当前还没有支持XOL本体开发的工具，但由于它采用XML语法，可以采用XML编辑器来创建XOL 文件。SHOE由马里兰大学开发，它将机器可读的语义知识与HTML文档或其他Web 文档相结合，允许直接在WWW的基础上设计和应用本体。近来SHOE的语法已转向XML，它使得代理(Agents)能够收集有意义的Web页面和文档的信息，改善搜索机制和知识收集。 OML由Washington大学开发，部分基于SHOE。它有四个层次：OML核心层(与语言的逻辑层相关)；简单OML(直接映射RDF和 RDFS)、简化OML和标准OML［2］。

RDF是W3C推荐的一种信息描述方式，目的是克服XML的语义限制，提供一种简单的模式来表示各种类型的资源。在RDF的基础上，RDFS建立了一些基本的模型限制。RDF具有较强的表达能力，但仍存在一些不足，如RDF没有定义推理和公理的机制、它没有说明包含特性以及没有版本控制等［10］。

OIL建立在RDF之上，其主要优势在于以描述逻辑为基础，提供形式化语义的推理。OIL综合了三方面的技术：框架系统、描述逻辑和基于XML与RDF语法的Web语言。框架系统采用了一种类似于面向对象的方法对数据建模，提供建模原语；描述逻辑用规范化的方法表达结构化知识以及查询和推理；基于XML

和 RDF语法的Web语言为OIL提供语言元素。OIL的数据对象主要包括：类定义、

槽定义(slot definition)以及公理定义(axiom)。类定义包括定义类型、类层次关系和槽约束或属性约束；槽定义定义实体间的二元关系，包括有原语 slot-def, domain, rang, inverse, subslot-of等；公理定义由定义该本体内的一些附加规则，如类之间外延的关系有不相交、覆盖、相交、等价等［83］。

DAML由DARPA(美国国防部高级计划研究署)主持开发，力图溶入包括RDF、OIL等的优点，它与OIL一样建立在RDF之上，以描述逻辑为基础。其主要目

标是开发一个旨在以机器可读的方式表示语义关系、并与当前及未来技术相容的语言，尤其是开发出一套工具与技术，使得Agent(代理)程序可以识别与理解

信息源，并在Agent程序之间实现基于语义的互操作。DAML的最早版本为

DAML-ONT，但后来与OIL紧密结合形成了DAML +OIL。 DAML+OIL是由美国和欧盟在DAML背景下共同开发的，它与OIL有着相同的目标，是目前应用最广的本体语言。它是RDF(S)基础上的扩展，具备充分的表达能力(如唯一性、传递性、逆反性、等价等)，具有一定的推理能力，完全确定了语义网中知识表示语言的整体框架。

国内关于Ontology的研究比较广泛也比较深入，相关论文也较多。大多是在对Ontology的定义、基本含义以及本体语言进行简要介绍的基础上，就Ontology在相关学科领域的影响、应用及其构造进行探讨与论述。讨论相对较

多的主要有本体论与信息检索［3］［20］［24］［25］［26］［27］［28］［29］、本体论与数字图书馆［39］［40］［41］［74］［75］、本体论与信息管理[20]［21］，此外还包括知识库系统［35］、数据挖掘［43］、电子商务［44］、机器翻译［46］、需求分析［50］［51］等。

4 试验与应用

我国学者除了对语义网进行了系统介绍以外，还就语义网及其关键技术做了一些有益的试验与应用研究，从其所用的技术来看大致可分为三类：语义网架构及其实现、RDF技术的应用、Ontology的应用与构建。

文献［60］在概述语义网基本技术的基础上，设计了一个面向企业门户网站的语义网体系结构SPortal；提出了页面代理的概念及其作用与功能；设计了语义网查询语言 CDQL。该文对SPortal的总体结构与各功能模块做了详细的介绍，是国内在语义网构架方面所做的非常有益的一次尝试，其所提出的页面代理、设计的语义网查询语言CDQL对于国内语义网的开发有着重要的参考价值。

在RDF技术的应用方面，文献［52］［53］分别从XML/RDF的特点入手，讨论了基于XML/RDF的MARC和DC元数据描述技术，并给出了具体的描述实例；文献［57］通过一个采用RDF语法的DC元数据实例，展示了RDF的具体应用；文献［58］讨论了RDF在关系数据库中的存储问题；文献［59］阐述了如何利用RDF/XML技术进行自动更新的搜索引擎的设计与实现；文献［65］在对RDF(S)进行了简要介绍的基础上，详细讨论了一种利用RDF建立Ontology的方法，并给出了相应的RDF(S)示例；文献［81］提出了一个基于XML的新型RDF查询语言----XRQL，构建了一个以XRQL为查询语言的RDF引擎(NSRE)的体系结构，并简要探讨了相关的实现技术。

在Ontology应用方面，文献［65］介绍了如何使用RDF(S)表示Ontology中的对象模型，分析了如何在RDF(S)中表示本体论中的公理，通过举例说明了如

何利用RDF技术进行Ontology的构建；文献［71］介绍了一个基于Ontology的企业职工能力查询系统，在构造企业本体模型的基础上给出了相应的查询算法；文

献［73］从图书服务实例出发，在三个层次上分析了Ontology的开发思路和方法，着重就基于RDFS的简单Ontology开发，基于OWL的有复杂语义信息的Ontology 设计，以及为Web服务增加语义功能的DAML-S规范的分析应用等方面做了有益的探讨；文献［74］在对本体论思想进行了简要介绍的基础上，提出了利用本体理论和方法建立知识图书馆中知识的划分、分类和组织模型，从而方便知识的面向主题的存放和智能检索等问题；文献［75］［84］分别就Ontology在数字图书馆中的应用以及如何利用Ontology构建知识门户进行了详细了阐述。

5 特点分析

我国对语义网的研究具有以下几个特点：

(1)近年来关于语义网研究的论文数量骤增，说明语义网作为未来互联网

的发展趋势已引起了我国学者的高度重视。

(2)各论文的参考文献基本上全部为外文文献，表明我国语义网的研究处

于起步阶段。

(3)对语义网的研究具有一定的层次性，从基本介绍到理论探讨，由理论

探讨到实际试验与应用，逐层递进，体现了一定的层次性。

(4)对语义网的研究主要集中于对本体的讨论上，包括本体的基本涵义、

形式化表示、本体的构建、本体语言以及基于本体的各种理论探讨与试验应用。这一方面是因为语义网体系结构中第五至第七层(Logic、Proof、Trust)还正在构建之中，另一方面也在于Ontology是语义网的核心，是当前语义网研究的症结所在。它不仅是形成对资源、知识等的统一认识的基础，也是支持推理机制的计算机可“理解与处理”的基础。

6 结束语

我国对语义网的研究虽然取得了一定的进展，但仍存在一定的缺点与不足：(1)理论研究不足，大多是在简要介绍语义网及其相关技术的基础上做进一步的

论述，而对语义网的体系结构、方法原则、构建方略等论述较少；(2)从论文的参考文献来看，对语义网的研究还没有形成自己的专业特色与体系；(3)对于本体的编制与构建只是做一些初步的尝试与试验，更不用说相应的编制规范与标准；(4)对国外最新的理论研究成果与实践应用跟踪不够。

因此，今后主要的研究方向与重点问题包括：(1)语义网基础理论研究，包括语义网体系结构、指导原则、建设方法等；(2)语义网的实际应用，建立符合语义网构想的WWW页面或网站；(3)本体的编制规范与标准，用以指导中文网络本体的构建；(4)本体的实际应用研究，建立具有一定实用价值的词汇集 (Vocabulary)及推理机制；(5)对Logic、Proof、Trust各层的研究；(6)对于国外最新理论研究成果与实际应用的及时介绍与讨论等等。

参考文献：

1 杨晓青，陈家训．语义网．计算机应用研究， 2002；（6）

2 刘柏嵩．基于知识的语义网：概念、技术及挑战．中国图书馆学报，2003；（2）

3 张晓林．Semantic Web与基于语义的网络信息检索．情报学报，2002；（4）

4 李卫华．语义网上本体与智能信息Agent的集成研究．计算机工程与应用，2002；（16）

5 白同强，刘磊．语义网的研究与展望．吉林大学学报(信息科学版)，2004；(2)

6 梁翎．语义网络：新一代的Web应用．中国信息导报，2004；（3）

7 朱礼军，陶兰，黄赤．语义万维网的概念、方法及应用．计算机工程与应用，2004；(3)

8 李卫华．语义网及层次结构．计算机系统应用，2002；(7)

9 潘小进，林子禹，张月强，贺春．语义网的标记语言和体系结构．计算机工程，2003；（5）

10 张平，郭金庚．语义网描述语言分析．电脑开发与应用，2003；（4）

11 刘柏嵩，高济．基于RDF的异构信息语义集成研究．情报学报，2002；(6)

12 王洪伟，吴家春，蒋馥．基于描述逻辑的本体模型研究．系统工程，2003；

(3)

13 李景，马文峰．作为知识组织手段的ontology及一些基本问题．图书馆学、信息科学、资料工作， 2003；（4）

14 谢储晖，郭达志．本体的研究现状及其应用．福建电脑，2003；（12）

15 史耀馨．RDF文档解析器及查询语言的实现．计算机应用，2003；（12）

16 高茂庭，王正欧．Ontology及其应用．计算机应用，2003；(12)

17 李守丽，廖乐健，幺敬国，曹树贵．CRL:对语义网上的Ontology表示语言DAML+OIL的一种扩充方案．计算机工程与应用，2003；(23)

18 程变爱．试论资源描述框架（RDF）：一种极具生命力的元数据携带工具．现代图书情报技术， 2000；（6）

19 朱慧．万维网的元数据结构RDF．江苏图书馆学报，2002；（1）

20 常春．Ontology在信息管理领域的研究背景．现代图书情报技术，2003；（6）

21 毛军．基于RDF的叙词表研究．情报学报，2003；（2）

22 李志华，冯斌．语义网对比三层网络架构的体系结构模型的研究．江南大学学报(自然科学版)，2003；(5)

23 刘柏嵩．基于本体的信息系统引论．情报理论与实践，2003；(5)

24 许珏．本体论与信息检索．中国信息导报，2004；（3）

25 寥明宏．本体论与信息检索．计算机工程，2000；（2）

26 邓志鸿，唐世渭，杨冬青，张铭．基于XML的本体表示和检索技术的研究．计算机工程与应用， 2002；（3）

27 武成岗，焦文品，田启家，史志植．基于本体论和多主体的信息检索服务器．计算机研究与发展，2001；（6）

28 韩毅．基于检索相关性与转移的本体论检索系统．情报科学，2003；（2）

29 董慧．基于本体论和数字图书馆的信息检索．情报学报，2003；（6）

30 朱振元，朱承．语义网中的对象技术．计算机工程，2002；（4）

31 王昕，熊光楞．基于本体的设计原理信息提取．计算机辅助设计与图形学学报，2002（5）

32 廖乐健，曹元大，李新颖．基于Ontology的信息抽取．计算机工程与应用，2002；（23）

33 张红君，黄英，张帆．语义网技术及其对图书情报检索的影响．中华医学图书情报杂志．2003；（6）

34 郑清文，傅欣．元数据在网络信息资源组织中的应用研究．图书情报工作，2003；（10）

35 余以胜，张玉峰．基于本体论的知识库系统研究．情报杂志，2003；（6）

36 何杭军，龚丽霞，陆汝占．语义网知识表示的评价标准．计算机工程，2002；（6）

37 刘炎禄，俞勇．面向语义网的知识表示框架．上海交通大学学报，2002；（9）

38 谭赛璐，朱礼．基于本体论的知识表示模式及其必要性．中国远程教育，2002；（10）

39 刘柏嵩．一种面向语义网的数字图书馆框架．大学图书馆学报，2003；(1)

40 刘柏嵩．基于本体的数字图书馆信息过滤研究．上海交通大学学报，2003；（S1）

41 王丽华．基于语义网的数字图书馆关键技术．情报杂志，2004；（4）

42 邓志鸿，唐世渭，杨冬青．基于本体的多Agent分布式数字图书馆资源信息发现服务模型之研究．计算机工程 2002（6）

43 邢平平，施鹏飞，赵奕．基于本体论的数据挖掘方法．计算机工程，2001；（5）

44 许卓明，王霞，张艳丽．本体技术及其在B2B电子商务信息集成中的应用．计算机应用研究，2003；（2）

45 陈鹤杰，孟祥武．应用于电子商务的语义网核心语言分析．计算机应用研究，2004；（1）

46 王小捷，钟义信．基于Ontology的英汉机器翻译研究．中文信息学报，2000；（5）

47 瞿晓静．试论基于语义网的智能代理．情报杂志，2004；（1）

48 李浩，,沈琦．Semantic Web与Agent的共生及融合．微机发展．2003；（11）

49 李晶，林乐，陈恩红，王进．基于语义网的agent系统模型．计算机应用与软件，2003；（12）

50 陆汝钤，金芝，陈刚．面向本体的需求分析．软件学报，2000；（8）

51 金芝．基于本体的需求自动获取．计算机学报，2000；（5）

52 黄伟红，张福炎．基于XML/RDF的MARC元数据描述技术．情报学报，2000；（4）

53 任瑞娟，濮德敏，苗军民，米佳．基于XML/RDF的DC元数据描述技术．情报杂志，2002；（9）

54 徐少平，吴信才，潘德锋．基于RDF的空间元数据描述与资源发现．计算机与现代化，2003；(7)

55 田稷．语义网与网络信息和知识的表达．情报杂志，2003；（6）

56 齐从谦，张殿东，王敏．语义网与高校信息化建设．华中科技大学学报(自然科学版) ，2003；（S1）

57 宓永迪，夏勇．资源描述框架（RDF）的应用．文献信息组织与利用 2001；（2）

58 韩亚洪，许卓明．怎样在关系数据库中存储RDF．计算机与现代化，2002；（11）

59 袁勇智．一个基于RDF/XML自动更新的搜索引擎的设计及实现．业图书情报学刊，2003；(4)

60 廖乐健，曹元大，幺敬国，李守丽．一个语义网架构及其实现．计算机工程与应用，2003；（15）

61 林春梅，金鑫，何跃．基于RDF构建语义本体模型．计算机应用与软件，2002；（6）

62 金毅，俞勇，张卓，赵彦．一个基于语义万维网的应用平台．上海交通大学学报，2003；(6)

63 郭鸣，李善平，董金祥，付相君．基于本体论及语义网的产品信息模型研究．浙江大学学报(工学版)，2004；（1）

64 李浩，沈琦．一个语义网系统的设计与实现．北京理工大学学报，2004；（2）

65 杨晓青，陈家训．一种利用RDF（S）建立本体论的方法．计算机应用研究，2002；（4）

66 万捷，腾至阳．本体论在基于内容信息检索中的应用．计算机工程，2003；（4）

67 周武.，金远平．构建XML本体信息研究．微机发展，2003；(10)

68 马坚，楼宇波，张亮．基于本体的XML Schema生成方法．计算机工程与应用，2003；（11）

69 刘芳，姚莉，王长缨，张维明．基于语义网的案例表示和CBR系统结构研究．计算机应用，2004；（1）

70 张哲．利用本体和主题词表的集成构造RDF模式．微机发展，2004；(3)

71 寥明宏．一个基于本体论的职工能力查询系统．计算机应用研究，1999；（12）

72 徐振宁，宋阔益，张维明，李勇，李由．基于本体的语义信息查询系统的研究与实现．计算机工程，2002；（12）

73 陈文彬．Ontology在图书服务网络中的应用．现代图书情报技术，2003；（6）

74 邓凯，吴家春，王洪伟．本体论在知识图书馆中的应用初探．情报科学，2003；（3）

75 楼向英．Ontology：概念及其在数字图书馆中的应用．图书馆杂志，2002；（11）

76 张哲．利用本体和主题词表的集成查询元数据．情报杂志，2004；（4）

77 邓志鸿，唐世渭，杨冬青．面向语义集成：本体在Web信息集成中的研究进展．计算机应用，2002；（1）

78 姚绍文，余江，周明天．面向语义网的逻辑描述原语扩展．电子学报，2002；（12）

79 罗威．RDF：Web数据集成的元数据解决方案．情报学报，2003；（2）

80 姜恩波．RDF原理、结构初探．现代图书情报技术，2001；（5）

81 欧阳晔，姜浩，潘顺．XRQL：基于XML的新型RDF查询语言．微机发展，2003；（4）

82 耿方萍，朱祥华．基于本体的网络资源表示研究．计算机应用，2003；（4）

83 潘小进，林子禹，张月强，贺春辉．语义网的标记语言和体系结构．计算机工程，2003；（4）

84 李景，钱平，苏晓鹭．构建基于Ontology的知识门户．数字图书馆，2004；（2）

摘要：简要介绍了语义Web的起源、概念、思想、架构、特征、目的和未来面临的挑战，对深入了解语义Web，有一定的参考作用。

关键词：Web；语义Web；本体

1 第一代Web

WWW （World Wide Web），又称万维网，简记为Web，是构建在Internet 上采用浏览器/服务器网络计算模式，访问遍布在Internet计算机上所有链接文件。1989年，在日内瓦欧洲粒子物理实验室工作的Berners-Lee发明了最初的Web。第一代Web发明了超文本格式，把分布在网上的文件链接在一起。这样用户只要在图形界面上点击鼠标，就能从一个网页跳到另一个网页，使得通过互联网浏览文档成为可能，这时的Web以HTML语言、URL和HTTP 等技术为标志，以静态页面的平台形式来展现信息。

2 第二代Web

第二代Web以动态HTML语言、Java script、VB script、ActiveX、API、CGI等技术为标志。它允许用户通过交互查询数据库并将数据库中符合要求的结果动态地生成页面，展示给用户。这极大增强了Web处理大规模数据的能力。Web由一个展示信息的平台真正变成了信息处理的平台，极大促进人们的信息交流与共享。

3 第三代Web

Web是一个庞大的知识库，Web已经成为人类获取信息和得到服务的主要渠道之一。但是Web并非已经尽善尽美，仍然存在很多尚待解决的问题。

3.1Web信息无法被自动处理。当前的Web无论是静态的HTML网页，还是动态生成的网页，其目的都是供人阅读。以往的Web技术都忽略了计算机的处理作用，计算机在其中主要扮演了展现信息的作用，而没有理解和处理Web信息的能力。

3.2Web信息无法被有效利用。面对Web庞大的知识库，对信息的有效利用提出了巨大挑战。基于传统技术的搜索引擎已经无法应对Web这个日益庞大的知识库。以最强大的搜索引擎Google来说，它目前能搜索80亿之多的Web 页面，但这仅仅占整个Web规模的25％～30％，也就是说还有大量的信息无法被搜索到。同时，由于计算机无法精确识别Web上的内容，当前搜索引擎返回的结果中，存在许多垃圾信息，搜索结果和质量并不令人满意。

由此可见，现在的Web只是定位和展示信息的作用，对信息的内容并不关心。而事实上，人们真正关心的是信息的内容。只有对信息内容的含义进行描述，才能实现智能化的Web服务。为此，Berners-Lee在2000年又提出了语义网。所谓“语义”，就是文本的含义。“语义Web”，就是能够根据语义进行判断的网络。简单地说，语义Web是一种能理解人类语言的智能网络，被人们称为第三代Web。在语义网环境下，Web上定义和链接的数据不仅能显示，而且可以被机器自动处理、集成和重用。只有当数据不仅可以被人而且可以被机器自动地共享和处理的时候，Web的潜力才发挥到极致。

根据Berners-Lee的设想，语义网是由一种分层的体系结构构成，如图1所示。这是一个功能逐层增强的层次化结构，由七个层次构成。

（1）URI和Unicode。URI是Web的核心概念之一，它能够唯一地标识Web

上的任意一个资源，其思想是在需要的时候通过链接引用资源，因此不需要对资源进行拷贝或集中管理。Unicode是一种新的字符编码标准，它支持世界上所有的语言。无论在什么平台上，无论在什么程序中，无论使用什么语言，每个字符都对应于一个唯一的Unicode编码值。因此，它是语义网多语种支持的基础。

（2）XML、名称空间（NS）和XML Schema。XML提供文档结构化的语法，实现了文档结构与文档表现形式的分离，根据不同的目的同一个文档可以有不同的表现形式。XML名称空间是名称的一个集合，用于文档元素和属性名有效性的验证，由URI引用来标识。XML Schema是约束XML文档结构的语言。（3）RDF（S）。XML实现了文档结构化，但文档信息并不包含任何语义。RDF 数据模型提供简单的语义，RDF属性可以看作是资源的属性，同时又表达了资源之间的关系，因此RDF数据模型对应于传统的属性二值对，又类似于ER图。RDF Schema为RDF模型提供了一个基本的类型系统，其目的就是定义资源的属性，定义被描述资源的类，并对类和关系的可能组合进行约束，同时提供约束违例的检测机制。

（4）本体层。虽然RDF（S）能够定义对象的属性和类，并且还提供了类的泛化等简单语义，但它不能明确表达描述属性或类的术语的含义及术语间的关系。本体层就是要提供一个能明确的形式化语言，以准确定义术语语义及术语间关系。（5）逻辑、证明和信任。除了本体层定义的术语关系和推理规则外，还需要有一个功能强大的逻辑语言来实现推理。证明语言允许服务代理在向客户代理发送断言的同时将推理路径也发送给客户代理。这样应用程序只需要包含一个普通的验证引擎就可以确定断言的真假。但是，证明语言只能根据Web上已有的信息对断言给出逻辑证明，它并不能保证Web上所有的信息都为“真”。因此，软件代理还需要使用数字签名和加密技术用来确保Web信息的可信任性。

（6）数字签名和加密。数字签名简单地说就是一段数据加密块，机器和软件代理可以用它来唯一地验证某个信息是否由特定的可信任的来源提供。它是实现Web信任的关键技术。公共密钥加密算法是数字签名的基础。

语义Web最大优点是可让计算机具有对网络空间所储存的数据，进行智能评估的能力。这样，计算机就可以像人脑一样“理解”信息的含义，完成“智能代理”的功能。使用语义Web 搜索引擎搜索的结果比Web更为精确。

语义Web提供了一种崭新的信息描述和知识表达的手段，而要在语义层次上实现信息的互操作，就需要对信息涵义的理解达成一致。语义Web采用了本

体（ontology）的思想，本体描述的是具有共识的、概念化的事物，它对实现语义层次上的知识共享、知识重用发挥着核心作用。

语义Web具有一些基本特征：a.语义Web不同于现有Web，它是现有Web的扩展与延伸；b.现有的Web面向文档，而语义Web则面向文档所表示的内容和语义（独立于表示的语法）；c.语义Web将更利于计算机“理解与处理”，并将具有一定的判断推理能力。

语义Web的目标是让Web上的信息能够被机器理解，从而实现Web信息的自动处理，以适应Web信息资源的快速增长，更好地实现人和计算机的交互与合作。近年来，无论在国际上，还是在国内，人们对语义Web及其关键技术和应用的研究正在如火如荼，语义Web的支撑软件与应用开发日益受到重视，语义Web被看作是新一代的信息基础设施，被人们称为第三代Web。

语义Web汲取人工智能、哲学和逻辑学等学科的研究成果，试图对Web 上的信息和获取方式进行重大改进，解决目前Web存在的问题。虽然语义Web 未来的发展难以预测，但人类应该对所有的可能做出努力。也许正如语义网领域内的一种说法，就算人类只能解决1%的问题，随着Web的普遍使用，也将会给社会带来巨大的效益。我们期待着语义网的美好明天将会早日到来。

趋势分析之语义网

趋势分析之语义网近几年来，语义网越来越频繁地出现在IT报道中，PowerSet、Twine、SearchMonkey、Hakia等一批语义网产品也陆续推出。早在2010年，Google就已经收购了语义网公司Metaweb。对于这次收购Google产品管理主管杰克·门泽尔(Jack Menzel)发文称，该公司可以处理许多搜索请求，但Metaweb的信息可以使其处理更多搜索请求，“通过推出搜索答案等功能，我们才刚刚开始将我们对互联网的理解用于改进搜索体验”，但对于部分搜索仍然无能为力，“例如，‘美国西海岸地区学费低于3万美元的大学’或‘年龄超过40岁且获得过至少一次奥斯卡奖的演员’，这些问题都很难回答。我们之所以收购Metaweb，是因为我们相信，整合Metaweb的技术将使我们能提供更好的答案”。这表明语义网技术经过近10年的研究与发展，已经走出实验室进入工程实践阶段。语义网热度变化图语义网（Semantic Web）是一种智能网络，它不但能够理解词语和概念，而且还能够理解它们之间的逻辑关系，可以使交流变得更有效率和价值。语义网实际上是对未来网络的一个设想，现在与Web 3.0这一概念结合在一起，作为3.0网络时代的特征之一。语义网这一概念是由万维网联盟的蒂姆·伯纳斯-李（Tim Berners-Lee）在1998年提出的一个概念，实际上是基于很多现有技术的，也依赖于后来和text-and-markup与知识表现的综合。其渊源甚至可以追溯到20世纪60年代末期的Collins、Quillian、Loftus等人的研究，还有之后70年代初Simon、Schamk、Minsky等人陆续提出的一些理论上的成果。其中Simon在进行自然语言理解的应用研究时提出了语义网络（Semantic Network，不是现在的Semantic Web）的概念。下面我们用Trend analysis分析语义网领域内的研究热点。（点击链接即可进入https://https://www.360docs.net/doc/4417361826.html,/topic/trend?query=Semantic%20Web）

语义网技术

语义网技术是当前互联网技术研究的热点之一。目前大多数页面中的使用的文字信息不便于机器自动处理，只适合人们自己阅读理解，解决可自动处理的数据和信息方面发展较慢的问题，在网络上信息量剧增、人们迫切需要计算机分担知识整理这一压力的今天，成为信息检索的一个难题。本文首先建构了一种形式化的本体描述方法，并给出了标准化的定义，主要针对在本体层定义的基础上对逻辑层展开了基础研究，对于本体概念进行逻辑推理，通过本体中关系的属性，推理出隐含在本体概念间的关系。在本文的定义中本体包含五个基本的建模元语，概念，关系，函数，公理，实例，通过本体的五个建模元语构建本体，给出本体的形式化的规范定义，本体描述中的四种特殊关系有继承关系，部分关系，实例关系和属性关系，关系的各种属性是进行本体推理的逻辑依据，有传递性属性，关系继承性，反向关系继承性，逆属性，对称性属性，反身性属性，等价性属性等等，依据这些属性的逻辑性，可以推理出所要的查找。本文利用属性的逻辑推理机制采用树搜索的查找检索方式查找出隐含在概念之间的逻辑关系是本文所要进行的主要工作，这样可以判断出概念之间是否存在一些给定判断的关系，或者一个概念和什么概念存在给定的关系，再或者两个概念间都存在什么关系等等都是我们用推理检索所要实现的判断。摘要语义网技术是当前互联网技术研究的热点之一。目前大多数页面中所使用的文字信息不便于机器自动处理，只适合人们自己阅读理解，解决可自动处理的数据和信息方面发展较慢的问题，在网络上信息量剧增、人们迫切需要计算机分担知识整理这一压力的今

天，成为信息检索的一个难题，本文中对本体层概念的推理就是为了探索计算机理解语义所做的一个尝试。语义网的体系结构向我们说明了语义网中各个层次的功能和特征，语义网的研究是阶段性的，首先解决syntax(语法)层面的问题，也就是xml，然后是解决(数据层)基本资源描述问题，也就是rdf,然后是(本体层)对资源间关系的形式化描述，就是owl，damloil，这三步已经基本告罄，当然，基于rdf 或者owl的数据挖掘和ontology管理(如合并，映射，进化)按TIMBERNERS-LEE的构想，这个工作大概到2008左右可以完成，在商业上，很快就会在知识管理，数据挖掘，数据集成方面出现一些企业。目前亟待发展的是LogicLayer(逻辑层)，这方面在国内外的期刊著作中还少有提到，接下来的工作就应该是对于owlbased的数据进行推理和查询了，当前的推理方法主要是针对本体而言的，而本体的概念是在某个特定领域范围内的，而且在知识库中推理和查询是紧密的结合在一起的，相辅相成的，查询的同时必然存在着推理，而这里的推理就必须要建立在一定的逻辑模型的基础上，所以推理的方法就是基于逻辑模型的逻辑推理，可采用逻辑推理的方法。本体中推理的重点在于推理结论的正确性、完备性，若是不能保证推理的正确性，则语义网的引入就不但没有给网络资源的查询带来便利，反而阻碍了网络的发展，而且还要保证推理的完备，不遗漏应有的推理结果。本体推理的难点在于推理的高效性、资源利用率，若推理虽能达到正确性，完备性的目的而浪费了大量的时间和资源，则语义网也不能达到预期的效果，所以推理方法的使用及其效果是语义网成功的关

人工智能报告分析

江苏大学《人工智能》报告设计题目人工智能报告学生姓名叶澔鹏指导老师赵跃华学院计算机科学与通信工程学院专业班级信息安全1202班学号 3120604053 完成时间2015年10月25日

摘要：知识处理是人工智能这一科学领域的关键问题。本文对知识处理的核心问题之——识的表示进行了全面的综述,目前流行的知识表达方式不下十种，在此只介绍一阶谓词逻辑、产生式、语义网络、框架、混合等目前最常用的知识表示方法。并对其进行了优缺点分析及简单对比。最后对知识表示的发展趋向作出了展望。关键词：知识人工智能（AI）知识表达式一阶谓词逻辑产生式语义网络框架一．知识的概念知识（Knowledge）是人们在改造客观世界的实践中形成的对客观事物（包括自然的和人造的）及其规律的认识，包括对事物的现象、本质、状态、关系、联系和运动等的认识。经过人的思维整理过的信息、数据、形象、意象、价值标准以及社会的其他符号产物，不仅包括科学技术知识----知识中最重要的部分，还包括人文社会科学的知识、商业活动、日常生活和工作中的经验和知识，人们获取、运用和创造知识的知识，以及面临问题做出判断和提出解决方法的知识。知识是把有关的信息关联在一起，形成的关于客观世界某种规律性认识的动态信息结构。知识=事实+规则+概念事实就是指人类对客观世界、客观事物的状态、属性、特征的描述，以及对事物之间关系的描述。规则是指能表达在前提和结论之间的因果关系的一种形式；概念主要指事实的含义、规则、语义、说明等。 (1) 知识只有相对正确的特性。常言道：实践出真理。只是源于人们生活、学习与工作的实践，知识是人们在信息社会中各种实践经验的汇集、智慧的概括与积累。只是爱源于人们对客观世界运动规律的正确认识，是从感知认识上升成为理性认识的高级思维劳动过程的结晶，故相应于一定的客观环境与条件下，只是无疑是正确的。然而当客观环境与条件发生改变时，知识的正确性就接受检验，必

语义网本体

Part2：创建本体本次所创建的本体是一个植物(plant)本体，所用的工具是Protege4.3。首先根据植物的分类来建立本体的Schema层，按照不同的分类方式可以有不同的分类例如可以分为花（flower）、草(grass)和树(tree)三类。花又可以分为蔷薇科（Rosaceae ）、十字花科（cruciferae）、百合科（liliaceae）。草又可以分为草坪草（turfgrass）、孔雀草（maidenhair）、千日草（One thousand days grass）。树又可以分为乔木（arbor）、灌木(shrub)。所建的Schema层如下图1所示。图1 植物本体的Schema层构建图 2、添加属性，属性包括对象属性和数据属性。所添加的对象属性有：颜色、枯萎季节、茂盛季节开花时间、开花时长，其定义域均设置为Plant。添加的数据属性有：根茎的长度。具体的添加如下图2所示。（1）对象属性添加图（2）数据属性添加图图2 植物本体的属性构建图

3、添加相应的实例。为百合科添加实例：百合花（greenish lily flower ）为乔木添加实例：雪松和杨树，为草坪草添加实例：马蹄金草（The horseshoe golden grass ）具体的实例图如下图3所示。图3 具体实例添加图 4、定义公理，例如可以对其定义灌木为丛生状态比较矮小。则需要添加对象属性丛生状态（Cluster_State）和子属性主要丛生状态(Main_Cluster_State)，然后添加分类：Type，包括short and small和tall。对草坪草定义为：主要丛生状态是short and small。对乔木添加定义：主要丛生状态是tall。在Plant类下面添加叶子(leaf)，然后添加对象属性is_part_of，给leaf定义为：叶子是树叶的一部分。对草坪草的具体的定义效果如下图4所示。图4 草坪草定义效果图

语义检索

在数字图书馆中，信息检索存在明显不足。在文献的组织与描述上,简单将关键词作为描述文献的基本元素,文献之间没有关联,是相互独立的、无结构的集合。在检索操作上,通常是基于关键词的无结构查询,难以反映词语间各种语义联系, 查询能力有限,误检率和漏检率很高,检索结果的真实相关度较低；计算查询和文档之间的相似度的方法也有局限。在用户交互界面上，用户的检索意图难以被机器理解，采用自然语言输入的检索关键词与机器的交互存在障碍。现有数字图书馆信息资源检索存在资源表示语义贫乏和检索手段语义贫乏、查准率低下等问题，语义网技术的出现，为数字图书馆的发展注入了新的活力，为信息检索质量的提高带来了新的生机。运用语义网技术，使解决信息检索中现存的问题，完善信息检索流程成为了可能。3.1 数字图书馆信息检索模型目前数字图书馆的信息检索主要借助于目录、索引、关键词方法来实现, 或者要求了解检索对象数据结构等, 对用户提供的关键词的准确性要求较高，基于语法结构进行检索, 却不能处理复杂语义关系,常常检索出大量相关度很差的文献。图3.1 数字图书馆信息检索模型用户通过检索界面，输入关键词，文本操作系统对用户的关键词进行简单的语法层次的处理整合，与数字图书馆资源进行匹配检索，最终将检索的结果，再通过用户界面返回给用户。而数字图书资源，专业数据库等都是数字图书馆信息检索的范畴，这些数字化的知识资源主要以数据库形态分布于全球互联网的数千个站点,这种以数据库形式存放的信息资源,通常是电子化了的一次文献,包括元数据、摘要或者是全文,也可以是全文链接的地址。 24 基于语义网的数字图书馆信息检索模型研究 3.2 基于语义网的数字图书馆信息检索模型的设计思想数字图书馆信息检索系统存在诸多问题。查询服务智能化水平低，无法对用户请求进行语义分析；信息资源的共享程度低，仅仅采用题名、文摘或全文中出现的关键词标识文献内容，难以揭示文献资料所反映的知识信息，易形成信息孤岛；对用户输入的关键词进行句法匹配，查准率不高；片面追求查全率，返回大量无关结果等。这些问题最终造成用户的真正检索意图难以实现。人们希望有突破性的信息检索技术出现，能够支持更为强大的信息检索功能，具备理解语义和自动扩展、联想的能力，并为用户提供个性化服务。在这样的需求下，本节深入探讨了现存问题的解决方法，结合语义网技术，提出了以下基于语义网的数字图书馆信息检索模型的设计思想。3.2.1 机器理解与人机交互人们通过信息的交流和沟通，表达一定的思想、意思和内容，因此，自然语言和表达的信息中蕴含着丰富的语义。尤其是自然语言中，一词多义、一义多词现象十分常见，在不同的语境中，同样的词汇还可以表达出不同的意义。在人与人的交流中，近义词、反义词、词语的词性、语法结构等帮助人们在特定的语言环境中理解语言表达的确切含义，而计算机要做到这点却有难度。随着网络的不断发展，网络信息充斥着人们的视野。如何在浩如烟海的信息资源中，以最短的时间查找出相关资源，成为人们所关注的问题之一。通常，检索系统总会返回相关度不高，甚至完全无关的信息，而有些相关的信息却往往被遗漏了。一方面，检索工具没能把已经存在的、对用户有价值的信息检索出来，另一方面，信息资源没有很好的被归纳，提炼成知识。利用语义网技术，将语义丰富的描述信息和资源关联起来，通过机器理解和人机交互，对信息资源进行深层次的分析和挖掘。从本质上讲，人机交互是认知的过程，主要通过系统建模、形式化语言描述等信息技术，最终实现和应用人机交互系统。3.2.2 语义知识与描述逻辑从语义学的角度讲，语义是语言形式表达的内容，是思维的体现者，是客观事物在人们头脑中的反映[72]。人们在进行信息交流和沟通时，通过词语、符号来表达思想。当人们看到

人工智能(部分习题答案)..知识讲解

人工智能(部分习题答案)..

1.什么是人类智能？它有哪些特征或特点？定义：人类所具有的智力和行为能力。特点：主要体现为感知能力、记忆与思维能力、归纳与演绎能力、学习能力以及行为能力。 2.人工智能是何时、何地、怎样诞生的？解：人工智能于1956年夏季在美国Dartmouth大学诞生。此时此地举办的关于用机器模拟人类智能问题的研讨会，第一次使用“人工智能”这一术语，标志着人工智能学科的诞生。 3.什么是人工智能？它的研究目标是？定义：用机器模拟人类智能。研究目标：用计算机模仿人脑思维活动，解决复杂问题；从实用的观点来看，以知识为对象，研究知识的获取、知识的表示方法和知识的使用。 4.人工智能的发展经历了哪几个阶段？解：第一阶段：孕育期（1956年以前）；第二阶段：人工智能基础技术的研究和形成（1956~1970年）；第三阶段：发展和实用化阶段（1971~1980年）；第四阶段：知识工程和专家系统（1980年至今）。 5.人工智能研究的基本内容有哪些？解：知识的获取、表示和使用。 6.人工智能有哪些主要研究领域？解：问题求解、专家系统、机器学习、模式识别、自动定论证明、自动程序设计、自然语言理解、机器人学、人工神经网络和智能检索等。 7.人工智能有哪几个主要学派？各自的特点是什么？主要学派：符号主义和联结主义。特点：符号主义认为人类智能的基本单元是符号，认识过程就是符号表示下的符号计算，从而思维就是符号计算；联结主义认为人类智能的基本单元是神经元，认识过程是由神经元构成的网络的信息传递，这种传递是并行分布进行的。 8.人工智能的近期发展趋势有哪些？解：专家系统、机器人学、人工神经网络和智能检索。 9.什么是以符号处理为核心的方法？它有什么特征？解：通过符号处理来模拟人类求解问题的心理过程。特征：基于数学逻辑对知识进行表示和推理。 11.什么是以网络连接为主的连接机制方法？它有什么特征？解：用硬件模拟人类神经网络，实现人类智能在机器上的模拟。特征：研究神经网络。 1.请写出用一阶谓词逻辑表示法表示知识的步骤。步骤：（1）定义谓词及个体，确定每个谓词及个体的确切含义；（2）根据所要表达的事物或概念，为每个谓词中的变元赋予特定的值；（3）根据所要表达的知识的语义用适当的联接符号将各个谓词联接起来，形成谓词公式。 2.设有下列语句，请用相应的谓词公式把它们表示出来：（1）有的人喜欢梅花，有的人喜欢菊花，有的人既喜欢梅花又喜欢菊花。解：定义谓词如下： Like(x,y)：x喜欢y。 Club(x)：x是梅花。 Human(x)：x是人。 Mum(x)：x是菊花。 “有的人喜欢梅花”可表达为：(?x)(Human(x)∧Like(x,Club(x))) “有的人喜欢菊花”可表达为：(?x)(Human(x)∧Like(x,Mum(x))) “有的人既喜欢梅花又喜欢菊花”可表达为：(?x)(Human(x)∧Like(x,Club(x))∧ Like(x,Mum(x))) （1）他每天下午都去玩足球。解：定义谓词如下： PlayFootball(x)：x玩足球。 Day(x)：x是某一天。则语句可表达为：(?x)(D(x)→PlayFootball(Ta)) （2）太原市的夏天既干燥又炎热。解：定义谓词如下：

语义搜索的分类

语义搜索的分类一．按语义搜索引擎服务内容的分类语义搜索引擎从人们头脑中的概念到在搜索领域占据一席之地经历不少坎坷。语义网出现后，语义搜索迎来了高速发展的机遇期。虽然语义搜索服务内容主要集中在传统搜索引擎不擅长的语义网搜索方面。不过语义搜索引擎也试图拓展服务范围，提供比传统搜索引擎更全面的服务。语义搜索引擎的服务内容主要包括以下几个方面：知识型搜索服务、生活型搜索服务、语义工具服务等。 (1)知识型搜索方面，主要针对语义网知识信息资源。其中包括： ①词典型搜索服务。一种形式是如同使用电子词典一样，通过关键词直接查询与关键词对应的概念。这些概念由语义搜索引擎索引的本体文件中提取。另一种形式则是对在线百科全书的搜索服务，如PowerSet，这一点与传统搜索引擎近似，但语义搜索引擎在信息的组织上远胜于传统搜索引擎。 ②语义网文档(SWD)的查询服务。用户可以通过语义搜索引擎查询所需的语义网文档和相关的语义网文档。Falcons 为统一资源标识符(URI)定义的语义网对象和内容提供基于关键词的检索方式。Swoogle 从互联网上抽取由RDF 格式编制的语义网文档(SWDs)，并提供搜索语义网本体、语义网例证数据和语义网术语等服务。 ③领域知识查询。部分语义搜索引擎提供了针对某个或某几个专业门类的信息检索服务，用户可以选择自己所需相关信息。Cognition 以搜索法律、卫生和宗教领域为主。个别语义搜索引擎提供针对特定领域的多媒体语义搜索服务，如Falcon-S 对足球图片的搜索服务。不过多媒体语义搜索面临与传统多媒体搜索相似的困境，缺乏有效的语义标注。对多媒体信息的辨别和分类能力仍有待提高。 (2)生活型搜索方面，语义搜索引擎在传统搜索引擎力所不及的诸方面发展迅速。 ①社会网络搜索。部分语义搜索引擎提供社会网络搜索功能，这种功能可以实现通过姓名、著作、所在单位等信息中的一条或几条，查询与这些信息有关联的更多信息，如我国的ArnetMiner。 ②资讯搜索。目前语义化的网络搜索服务能够更有针对性，更准确地为用户提供新闻资讯。Koru就是这方面的代表。 (3)语义工具服务。这是语义搜索引擎所属的研究机构的一个较为独特的方面，和传统搜索引擎提供的桌面搜索等工具不同，语义搜索引擎提供的语义工具一般不是对语义搜索功能的直接移植，而是对文档的相似性、标注等进行处理用的。这些工具可以为语义搜索引擎的索引对象进行前期数据加工，同时也供科研使用。理论上讲语义搜索引擎能够提供包括普通网络文档检索在内的所有类型网络文档搜索服务，但是由于语义搜索引擎对网页的索引方式不同，微处理器需要比传统搜索更长的时间才能分析完一个页面，因此很多语义搜索网站只能扫描到外部网站的二级页面，这样将难以满足用户全网络搜索的需求。二．按语义搜索引擎服务模式分类语义搜索引擎高速发展的阶段正值传统搜索引擎发展的平台期，虽然语义搜索引擎暂时尚不具备传统搜索引擎的市场竞争力，但是它们却可以很容易地借鉴传统搜索引擎的成

语义网主要应用技术与研究趋势_吴玥

2012年第2期 Computer CD Software and Applications 信息技术应用研究 — 41 — 语义网主要应用技术与研究趋势吴玥（苏州大学计算机科学与技术学院，江苏苏州 215006）摘要：我国企业多数已经实现了网络办公自动化，为企业的经营管理创造了优越的环境。但随着销售业务的增长，企业经营管理的范围逐渐扩大，其内部网络面临的运营难题更加明显，网络知识管理是当前企业存在的最大困难。语义网络技术的运用方便了知识管理系统的构建与操控，促进了企业知识管理效率的提升。针对这一点，本文主要分析了语义网应用的相关技术，对未来研究趋势进行总结。关键词：语义网；应用技术；知识管理；趋势中图分类号：TP391.1 文献标识码：A 文章编号：1007-9599（2012）02-0041-02 The Main Application Technology and Research Trends of Semantic Web Wu Yue (School of Computer Science&Technology,Soochow University,Suzhou 215006,China) Abstract:Our country enterprise majority already realize the network office automation,enterprise management to create a favorable environment.But as the sales growth,gradually expanding the scope of business management of enterprise,its internal network operator facing the problem is more apparent,network knowledge management is the current enterprise is the most difficult.Semantic network technology is convenient to use the knowledge management system's construction and operation,promote the enterprise to improve the efficiency of knowledge management.In view of this,this article mainly analyzes the semantic web technologies,the future research trends are summarized. Keywords:Semantic network;Application technology;Knowledge management;Trend 语义网是对未来计算机网络的一种假设，通过相匹配的网络语言对文件信息详细描述，最终判断不同文档之间的内在关系。简言之，语义网就是能参照语义完成判断的网络。企业在经营管理中引进语义网有助于数据信息的挖掘，对数据库潜在的信息资源充分利用，以创造更大的经济收益。一、传统互联网知识管理的不足互联网用于企业经营管理初期，加快了国内行业经济的改革进步，促进了企业自动化操控模式的升级。然而，当企业经营范围不断扩大之后，企业面临的网络管理问题也更加显著。如：业务增多、产品增多、客户增多等，企业网络每天需要处理的文件信息不计其数，基于传统互联网的知识管理系统也会遇到多种问题。（一）检索问题。互联网检索是十分重要的功能，如图一。用户在互联网上检索某一项资源时，常用的方法是通过关键词搜寻，未能考虑到语义对资源搜索的重要性。这种检索模式下则会遇到许多难题，如：对同义词检索会出现多余的无关资源，尽管用户在互联网上可以查找到许多与关键词相关的信息，但多数是无用的。图一互联网信息检索（二）集成问题。信息集成是网络系统按照统一的标准、编码、程序等，对整个系统存储的资源集成处理，然后实现信息资源的共享。企业互联网信息集成依旧采用人工处理，这是由于网络的自动代理软件不能处理文本代表的常识知识，信息集成问题将制约着互联网功能的持续发挥。（三）维护问题。对于企业知识管理系统而言，其采用的文档大部分是半结构化数据，这种数据的维护管理难度较大。现有的互联网在文档维护方面缺乏先进的软件工具，对于文档信息的处理也会遇到不少错误。知识管理中的数据库资源错误会给企业经营造成误导，且带来巨大的经济损失。二、语义网应用的相关技术互联网研发对语义网应用研究的最终目标是“开发各种各样计算机可理解和处理的表达语义信息的语言和技术，让语义网络的功能得到最大发挥” 。因此，结合语义网络的功能特点、结构形式、信息储存等情况，用户需掌握各种语义网应用技术。就目前而言，语义网主要的应用技术包括：（一）编码技术。编码是计算机网络运行的重要元素，通过编码之后才能让程序信号及时传递。语义网编码技术就是通过编码处理将知识内容表达出来，这一过程能够把不同的知识编码为某个数据结构，从而方便了用户对数据的检索。编码技术要用到各种知识表达方法，如：一阶谓词逻辑表示法、产生式表示法、框表示法、语义网络表示法等等。（二）框架技术。框架技术本质上就是对语义网进行层次划分，将网络结构分层不同的层面。语义网框架技术应用要借助语义 Web 模型，经过长期研究，我们把语义网体系结构分为7个层面，如图二。每个层面在语义网运行时都可发挥对应的功能，促进了语义网程序操控的稳定进行。层面框架的分析，可以掌握语义网体系中各层的功能强弱。图二语义网的体系结构

人工智能化(部分习题答案解析)

语义网基础教程

第一章概述 1.1万维网现状万维网改变了人类彼此交流的方式和商业创作的方式。发达社会正在向知识经济和知识社会转型，而万维网处于这场革命的核心位置。这种发展使得人们对计算机的看法也发生了变化。起初，计算机仅仅用作数值计算，而现在则主要用于信息处理，典型的应用包括数据库，文档处理和游戏等等。眼下，人们对计算机关注的焦点正在经历新的转变，将其视作信息高速公路的入口。绝大部分现有的网络内容适合于人工处理。即使是从数据库自动生成的网络内容，通常也会丢弃原有的结构信息。目前万维网的典型应用方式是，人们在网上查找和使用信息、搜索和联系其他人、浏览网上商店的目录并且填表格订购商品等等。现有软件工具没有很好的支持这些应用。除了建立文件间联系的链接之处，最优价值和必不可少的工具是搜索引擎。基础关键词的搜索引擎，比如Alta Vista、Yahoo，Google等，是使用现有万维网的主要工具。毫无疑问，加入没有这些搜索引擎，万维网不会取得现在这么大的成功。然而，搜索引擎的使用也存在一些严重过的问题： ●高匹配、低精度。即使搜到了主要相关页面，但它们与同时搜到的28758 个低相关或不相关页面混在一起，检索的效果就很差。太多和太少一样令人不满意。 ●低匹配或无匹配。有时用户得不到任何搜索结果，或者漏掉了一些重要的相关页面。虽然对于现在的搜索引擎来说，这种情况发生的频率不高，但确实会出现。 ●检索结果对词汇高度敏感。使用最初填写的关键词往往不能得到想要的结果，因为祥光的文档里使用了与检索关键词不一样的术语。这当然令人不满意，因为语义相似的查询理应返回相似的结果。 ●检索结果是单一的网页。如果所需要的信息分布在不同的文档中，则用户必须给出多个查询来收集相关的页面，然后自己提取这些页面中的相关信息并组织成一个整体有趣的是，尽管搜索引擎技术在发展，但主要的困难还是上述几条，技术的发展速度似乎落后于网上内容量的增长速度。此外，即使搜索是成功的，用户仍必须自己浏览搜索到的文档，从中提取所需的信息，也就是说，对极其耗时的信息检索本身，搜索引擎并没有提供更多支持。因此，用信息检索来描述搜索引擎为用户提供的功能，是不确切的；用信息定位可能更加合适。另外，由于现有网络搜索的结果不易直接被其他软件进一步处理，因此搜索引擎的应用往往是孤立的。目前，为网络用户提供更大支持的主要障碍在于，网上内容的含义不是机器可解读的。当然，有一些工具能够检索文档、把它们分割成更小的部分、检查拼写并统计词频等等。可是，一旦牵涉到解释句子含义和提取对用户有用的信息，现有的软件能力就有限了。举一个简单的例子。对现有技术而言，一下俩个句子的含义是难以区分的：我是一个计算机科学的教授。你不妨认为，我是一个计算机科学的教授。

语义网络及其应用实例浅析

语义网络及其应用实例浅析姓名：景飞班级： 3005 学号：3113003029

摘要：本文从语义网络的实际应用为出发点，首先介绍了语义网络的基本概念，随后通过列举如何将其应用于家族人物关系的模型建立以及如何建立基于特征的零件知识语义网络两个实例，来说明语义网络在实际建模中的实用性和便捷性，以此说明语义网络的未来发展空间还很大，将其用在智能控制领域会有很大成果。关键词：语义网络家族人物关系模型零件知识语义网络一、语义网络概述语义网络是一种出现较早的知识表达形式，并在人工智能中得到了比较广泛的应用。语义网络最早是1968年奎廉(Quillian)在他的博士论文中作为人类联想记忆的一个显式心理学模型提出的，认为记忆是由概念间的联系来是实现的，他主张处理问句时，将语义放在首位。当时的语义网络主要应用于自然语言理解系统中，表示事物之间的关系。由于其强大和直观的表示能力，不久就广泛应用于人工智能研究和应用开发的许多领域。1972年，西蒙正式提出语义网络的概念，讨论了它和一阶谓词的关系，并将语义网络应用到了自然语言理解的研究中。语义网络采用网络形式表示人类的知识，其表示由词法部分、结构部分、过程部分和语义部分四部分组成。一个语义网络是一个带标示的有向图。其中，带有标识的结点表示问题领域中的物体、概念、时间、动作或者态势。在语义网络知识表示中，结点一般划分为实例节点和类节点两种类型。结点之间带有标识的有向弧标识结点之间的语义联系，是语义网络组织知识的关键。因为语义网络表示知识的实质是知识的图解表示，所以这种表示法容易把各种事物有机地联系起来，它特别适于表达关系知识。语义网络通过对于个体间的联系追溯到有关个体的节点，实现对知识的直接存取，能比较正确地反映人类对客观事物的本质认识。应用语义网络使得知识表示更为直观，便于理解。语义网络的特征包括以下几个方面的内容： 1、重要的相关性得意明确表示； 2、相关事实可以从直接相连的节点推导出来，不必遍历整个庞大的知识库； 3、能够利用“IS-A”和“Subset”链在语义网络中建立属性继承的层次关系； 4、易于对继承的属性进行演绎； 5、能够利用少量基本概念的几号建立状态和动作的描述。下面我们通过一些简单语义网络表示知识的实例来进一步说明如何通过语义网络来实现知识的表示。

基于语义的搜索引擎

该搜索引擎使搜索引擎的工作不再拘泥于用户输入的关键词，而是能够对这些关键词进行语义计算。通过在语义的层面上把文档中关键词和其映射的概念进行关联，对文档信息所蕴含的语义信息进行充分挖掘，同时把用户的检索要求转换成相应的语义表示。过去这几年对于搜索引擎营销者来说是激动人心的（或者说有些骇人，如果你不那么能够接受变化的话）。谷歌引入了一系列新技术和系统来优化其已非常出色的搜索算法，它的竞争者如必应，苹果，微软，甚至是Facebook也引进或升级了对应的系统来优化它们的用户搜索体验。而这些优化的核心目标则是解决计算机与人工智能历史上最困难的问题之一：对自然语言的获取与理解。虽然机器非常擅长程序性和逻辑性的任务（如解数学方程或识别物体数据特征），但是它们难以辨析那些仅有母语使用者才能凭直觉感受到的微妙差异。举个例子，对我们来说「最近的汉堡店在哪里」和「我想吃汉堡」两句话传达了相似的意图，但是对于基本的机器而言，两者差距甚大：第一句话是对特定信息的检索，与说话者的想法无关；第二句话传达了一个明确的欲望，与信息索取无关。过去几年中，谷歌致力于打破不同语言间的隔阂并且解决其机器算法所面临的问题。但是这一努力的终极目标是什么呢：谷歌是否想要完全地理解人类思维所传达的意图和微妙语义呢？或者说这只是其技术发展中的一次探索？而这些优化的核心目标则是解决计算机与人工智能历史上最困难的问题之一：对自然语言的获取与理解。虽然机器非常擅长程序性和逻辑性的任务（如解数学方程或识别物体数据特征），但是它们难以辨析那些仅有母语使用者才能凭直觉感受到的微妙差异。举个例子，对我们来说「最近的汉堡店在哪里」和「我想吃汉堡」两句话传达了相似的意图，但是对于基本的机器而言，两者差距甚大：第一句话是对特定信息的检索，与说话者的想法无关；第

基于语义WEB服务的E-Learning技术与应用研究

河南省基础与前沿技术研究计划项目申请书项目名称：基于语义WEB服务的E-Learning 技术与应用研究申请者：所在单位（签章）：主管部门：河南省教育厅联系电话：电子信箱：通讯地址：邮政编码：申请日期：2006 年09 月28 日河南省科学技术厅制

填报说明 1．“申请书”用于申请河南省基础与前沿技术研究项目，由申请者负责填写。填写前请先查阅有关河南省基础与前沿技术研究项目申请办法及规定。申请书各项内容，要逐条认真填写，表达要明确、严谨，实事求是。外来语要同时用原文和中文表达，第一次出现的缩写词，须注明全称。 2．封面右上角“申报号”按照河南省科学技术厅分配的编号填写；“项目类别”栏由申请者填写, 申请项目属基础研究的此栏为“A”,属应用基础研究的为“B”，属前沿技术的为“C”。“学科名称”及“学科代码”请根据申报项目所属学科，按最新国家标准“学科分类与代码表”，填至三级学科分支。 3．基础研究是指以认识自然现象、探索自然规律为目的，不直接考虑应用目标的研究活动；应用基础研究是指有广泛应用前景，但以获取新原理、新知识、新方法为主要目的的研究；前沿技术是指有产业化前景以获取具有当代国际国内前沿的新工艺、新技术、新方法为主要目的研究；“项目名称”应确切反映研究内容和范围，最多不超过25个汉字（包括标点符号）；“申请者”是指申请项目实际主持人。 4．在读（含在职）研究生和申请单位的兼职科研人员不得作为申请者提出申请，但可作为项目组成员参加研究。 5．申请者和项目组中具有高级专业技术职务的主要成员申请（含参加）的项目数，连同在研的省级以上基础研究项目数, 不得超过两项。同一项目组研究内容相近的项目，只允许报送一个项目。 6．不具有副高以上专业技术职务或硕士以上学位的申请者，须有两名具有正高专业技术职务的同行专家推荐。

语义网的发展及其可用工具

语义网的发展及其可用工具语义网的发展及其可用工具美国阿尔法股权管理公司（Alpha Eqiuty Mangement）高级国际资产分析师Vince Fioramonti在2001年突然意识到，由于有价值的投资信息在网络上将会越来越多，今后越来越多的厂商将根据信息的重要性和关联性提供可搜集和解译这些信息的软件。语义网络将成为企业发展的利器Fioramonti称：“我曾经拥有一支专门为公司搜集和分析金融信息的分析团队。不过，他们的处理速度极为缓慢，得出的结论往往也过于主观，甚至有时会前后矛盾。”第二年，Fioramonti改用Autonomy集团的语义平台——智能数据操作层（IDOL）来自动处理各种形式的数字化信息。他们在部署中遇到了一个障碍：IDOL仅提供了常用的语义算法。Fioramonti称，阿尔法股权管理公司为此不得不组建了一个由程序员和金融分析师组成的团队，专门研发适用于金融学的算法和元数据。由于耗资过于巨大，公司最后放弃了这一项目。阿尔法股权管理公司在2008年迎来了新的契机，当时他们参加了汤森路透的机器可读新闻（Machine Readable News）服务。该服务可从3000多名路透社记者，以及网络报纸和博客等第三方资源那里收集、分析网络新闻。然后，根据影响力（如果公众对公司或产品的印象）、关联性和新颖性，对这些材料进行分析和评分。这些结果会源源不断的提供给客户，包括公共关系和营销人员、使用自动化“黑匣子交易（black

box trading）”系统的股票交易商、为长期投资决策收集整理数据的基金经理。Fioramonti称该服务每月收费并不便宜。据估计，实时数据更新的成本每月在15000至50000英镑之间。不过，对于阿尔法股权管理公司来说，该服务确实物有所值。他称，这些信息不仅帮助提升了公司的资产收益，还帮助公司击败了许多竞争对手。阿尔法股权管理公司的经历并不是唯一的案例。无论公司决定建造一个类似的内部系统，还是决定雇用服务提供商，通常都要花费巨资才能利用语义网技术。如果所搜索和分析的信息包括有针对特定商业领域的行话、概念和缩略语信息，那么同样可以实现。以下我们将为大家介绍一下那些能够帮助进行商业部署和利用语义网基础的工具，以及要想发挥这一技术的潜能还需要哪些东西。关键标准根据Tim Berners-Lee提出的概念，语义网的核心是联合搜索（Federated Search）。其可搜索引擎、代理或应用询问网络上成千上万个信息源，发现并在语义上分析相关内容，准确检索用户寻找的产品、答案或信息。尽管联合搜索正逐渐流行起来，特别是出现在了Windows7上，但是要在整个网络上广泛普及还有很长的路要走。为了有效的推动联合搜索，万维网联盟（W3C）制定了几个关键标准，定义了基本的语义基础设施。它们包括：•简单协议与RDF查询语言（SPARQL），其定义了用于查询和访问数据的标准语言。•资源描述框架（RDF）和RDF模式（RDFS），其规范了在语义本体（又称为词汇表）中如何陈述和组织信息。•网络本体语言（OWL），其对本体论和部分RDFS原理进行了详细陈述。目前这些标准的最终

各种各样的知识表示方法及其应用

各种各样的知识表示方法及其应用众所周知，知识是一个比较普遍的概念，在生活中有着各种各样的表现形式，而如何把知识表示出来，也就是把知识提取这一过程就显得异常重要了。每一种知识可能要采取不同的知识表示方法才能更加有效。而且知识有可能只有一部分是我们所需要的，可以利用的，因此只有选择好一个知识表示方法，才能剔除不需要的东西，而留下精华。在人工智能课程的学习中,我已经学到了许多知识表示方法,而通过这次读书活动,我学到了更多的知识表示方法以及相同方法的不同表现形式,现在做出如下比较与总结。由于书中的知识表示方法在表达和分析上都跟其他书上介绍的都有区别，因此我把它们进行了比较分析。把与书上不同的观点罗列出来，并且对相似的观点进行比较，从中收获很大。与书中相似相似的方法: 第一、语义网络法语义网络是1968年Quilian在研究人类联想记忆时提出的心理学模型，认为记忆是由概念间的联系来实现的。1972年，Simmons首先将语义网络表示法用于自然语言理解系统。语义网络的结构：语义网络是知识的一种图解表示，它由节点和弧线或链线组成。节点用于表示实体、概念和情况等，弧线用于表示节点间的关系。组成部分词法部分决定表示词汇表中允许有哪些符号，它涉及各个节点和弧线。结构部分叙述符号排列的约束条件，指定各弧线连接的节点对。过程部分说明访问过程，这些过程能用来建立和修正描述，以及回答相关问题。语义部分确定与描述相关的(联想)意义的方法即确定有关节点的排列及其占有物和对应弧线。书本上讲述的语义网络法可以用来表示事实;表示事实间的关系;表示比较复杂的知识。而书上所讲的应用似乎不够完全,除了用来表示简单的事实、表示占有关系和其它情况之外它还能选择语义基元（试图用一组基元来表示知识，以便简化表示，并可用简单的知识来表示更复杂的知识。）语义网络法可以分成二元语义网络的表示(Representation of Two-Element Semantic Network)和多元语义网络的表示（Representation of Multi-Element Semantic Network）语义网络法可以与谓词逻辑等效，用语义网络表示谓词逻辑法中的各种连词及量化，具体表示如下 1.合取：多元关系可以被转换成一组二元关系的合取，从而可以用语义网络