基于关系数据库的技术转移领域本体自动构建方法研究

基于关系数据库的技术转移领域本体自动构建方法研究
基于关系数据库的技术转移领域本体自动构建方法研究

本体构建方法

本文通过借鉴其他领域本体的构建方法,尤其是苏格兰爱丁堡大学的企业本体的建立过程,首先尝试着一步步建立起自己的本体模型,并且经过反复迭代的过程,不断的进行排错和修改,直至本体模型初具雏形。 然后在遵循本体建立准则的基础上,通过抽象总结出一套领域本体的知识工程构建方法。 领域本体构建过程 3.1确定本体的领域与范围 本体是否包含了足够的信息来回答这些问题?问题的答案是否需要特定的细化程度或需要一个特定领域的表示。 3.2列举领域中重要的术语、概念。 在领域本体创建的初始阶段,尽可能列举出系统想要陈述的或要向用户解释的所有概念。这上面的概念和术语是需要声明或解释的。而不必在意所要表达的概念之间的意思是否重叠,也不要考虑这些概念到底用何种方式(类、属性还是实例)来表达。 3.3建立本体框架。 上一步骤中已经产生了领域中大量的概念,但却是一张毫无组织结构的词汇表,这时需要按照一定的逻辑规则把它们进行分组,形成不同的工作领域,在同一工作领域的概念,其相关性应该比较强。另外,对其中的每一个概念的重要性要进行评估,选出关键性术语,摒弃那些不必要或者超出领域范围的概念,尽可能准确而精简的表达出领域的知识。从而形成一个领域知识的框架体系,得到领域本体的框架结构。 上述Step 2和Step 3并非是绝对的顺序,这两个步骤往往也可以颠倒过来进行,有时会先列举出领域中的术语和概念,然后从概念中抽象出本体框架;也可以先产生本体框架,再按照框架列举出领域的术语。至于如何具体进行,应该根据开发人员对领域的认识程度,如果领域内已经存在非常清晰的框架或

者认识已经很深刻,则可以直接产生框架。当然,这两个步骤也可以交叉进行。 3. 4设计元本体,重用已有的本体,定义领域中概念及概念之间的关系。 为了描述各个概念,利用术语对概念进行标识,并对其含义进行定义,在这一步定义时先采用自然语言进行定义。为了定义一个概念,设计了元本体。一个概念可以采用元本体中定义的元概念进行定义,或采用在本体中已经被定义的概念进行定义,或重用已有的本体。 元本体是指本体的本体,其术语用于定义本体中的概念,如实体、关系、角色等。它可以说是更高层次的本体,是领域内概念的抽象。在设计元本体时,尽量做到领域无关性,并且包含的元概念数目尽可能的少。 UNSPS C、DMOZ、Ontolingua 的本体文库和DAML 的本体文库等,可以导入倒本体开发系统中。本体被表达的形式通常并不重要,因为许多知识表示系统能够导入和导出本体。即使某个知识表示系统不能直接使用某种形式的本体,将本体从一种形式到另一种形式通常也不难实现。 除了概念,还要定义概念之间的关系。这些关系不仅仅涉及同工作领域的概念,不同工作领域的概念也可以相关,只是这些关系总是属于某一个工作领域。 定义类(class)及类的层次体系。创建的概念中,很大一部分属于类,而对类的层次的定义有以下3种方法: (1)自上向下法(top-down): 先定义领域中综合的、概括性的概念,然后逐步细化、说明。 (2)自下向上法(bottom-up): 先定义具体的、特殊的概念,最底层、最细小的类的定义开始,然后对这些概念泛化成综合性的概念。

基于Jena的本体构建方法研究-计算机工程

—59— 基于Jena 的本体构建方法研究 向 阳,王 敏,马 强 (同济大学电子信息与工程学院,上海 200092 ) 摘 要:针对本体构建中构造方法不清晰、本体描述语言不统一、可用工具较少的难题,在Jena 的基础上提出了基于Jena 的本体构建方法。该方法由描述类、描述属性、将属性关联到类、定义实例和加入本体维护元数据5个步骤组成,有效地解决了本体构建中的难题。最后以一个实例验证了该方法的有效性。 关键词:本体;本体构建;Jena Research on Jena-based Ontology Building XIANG Yang, WANG Min, MA Qiang (School of Electronic Information and Engineering, Tongji University, Shanghai 200092) 【Abstract 】There are a lot of difficulties in the ontology building such as the unclear building methods, ununified ontology languages, lack of tools.To solve these problems, this paper presents an ontology building method with Jena. The method is composed of 5 parts: class description, property description, link of property and class, individual creation, ontology metadata adding. The validity of the method is proved with an instance. 【Key words 】ontology; ontology building; Jena 计 算 机 工 程Computer Engineering 第33卷 第14期 Vol.33 No.14 2007年7月 July 2007 ·软件技术与数据库· 文章编号:1000—3428(2007)14—0059—03 文献标识码:A 中图分类号:TP311 本体是对领域中的概念及概念之间联系的显式描述。具 体地说,就是要描述一个领域需要哪些概念,概念由哪些属性标识,属性又具有什么约束,概念对应于哪些实例。 在本体的构建中也存在一些问题:本体构造方法定义不清晰;本体构造语言繁多,不同语言构造出来的本体交互性弱;本体构建工具少,目前可供使用的有斯坦福大学的Protégé和HP 公司的Jena 等。本文在Jena 基础上,提出了OWL 本体构建方法。 1 Jena 体系结构 1.1 Jena 的接口功能 Jena 是HP 公司开发的一个基于Java 的开放源代码语义网工具包,为解析RDF 、RDFS 和OWL 本体提供了一个编程环境及一个基于规则的推理引擎[1]。语义网标准的核心是作为通用数据结构的RDF 图[1]。Jena 将RDF 图作为其核心的接口。Jena 有以下几个主要功能[2]: (1)RDF API(主要是com.hp.hpl.jena.rdf.model 包)。可将RDF 模型视为一组RDFstatements 集合。 (2)RDQL 查询语言(主要是com.hp.hpl.jena.rdql 包)。对RDF 数据的查询语言,可以伴随关系数据库存储一起使用以实现查询优化。 (3)推理子系统(主要是com.hp.hpl.jena.reasoner 包)。包括基于RDFS 、OWL 等规则集的推理,也可自己建立规则。 (4)内存存储和永久性存储 (主要是com.hp.hpl.jena.db)。 Jena 提供了基于内存暂时存储的RDF 模型方法, 目前仅支持MySQL 、Oracle 和PostgreSQL 的数据存储。 (5)本体子系统(主要是com.hp.hpl.jena.ontology 包)。 Jena 对OWL 、DAML+OIL 和RDFS 提供不同的接口支持。 1.2 Jena 的接口结构 Jena 主要由API ,SPI 组成。用户编程只需使用API 。SPI 为Jena 提供核心数据结构。Jena 库由包来管理,Jena API 以 接口方式定义。经常用到包的有: (1)com.hp.hpl.jena.rdf.model 包,可创建和操纵RDF 图,是本体API 的基础。结构如图1所示[3]。 图1 rdf.model 包主要接口函数 (2)com.hp.hpl.jena.ontology 包。为操纵基于RDF 的本体提供了抽象接口和实现,结构如图2所示。 图2 ontology 包的主要接口函数 基金项目:国家自然科学基金资助项目(70371054) 作者简介:向 阳(1962-),男,教授、博士生导师,主研方向:语义网,本体,Web 挖掘;王 敏、马 强,硕士研究生 收稿日期:2006-07-25 E-mail :drxigyang@https://www.360docs.net/doc/d211385700.html,

中医药领域本体研究概述

中医药领域本体研究概述 【关键词】本体构建;中医药;综述 本体(Ontology)自20世纪90年代引入计算机人工智能领域后,在计算机及相关领域迅速形成一个研究热点。作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,将在人工智能、知识工程、图书情报等领域具有重要的作用和广阔的应用前景。笔者从中医药领域本体构建、基于本体的中医药语言系统和应用系统三方面对中医药本体研究进行概述,并结合发展现状对其进行展望。 1 本体与本体构建 1.1 本体的概念 本体是源于哲学的一个概念,原指对世界上客观存在物的系统描述,即存在论,后衍生到语言、信息、知识系统等领域,被定义为“概念化的明确的规范说明”。目前,关于本体的定义有很多种说法,但不外有两层含义:一是哲学领域的存在,是本体论的研究对象;二是延伸到特定领域之中,指某套概念及其相互之间关系的形式化表达,包括概念化、规范化、形式化和共享4个特征[1]。 从本体的内涵上看,综合不同学者的认识,本体大都被认为是信息、知识的底层构架工具,用于组织较高层次的知识抽象,是领域知识概念化、形式化的说明,也可以是特定领域内“人机交流”的语义基础,即提供概念与概念之间关系的共识。按照领域依赖程度,本体可以分为顶层、领域、任务和应用本体4类;按照主题可分为知识表示本体、通用本体、领域本体、术语本体和任务本体。中医药本体主要用于描述中医领域知识的专门本体,是专业性本体,一般属于领域本体和知识表示本体。 1.2 本体构建工具与描述语言 在本体构建方面,一是利用已有的叙词表或术语词典进行改造;二是利用现有信息和领域专家从头做起,而以后者较常用。目前已经得到公认的方法包括Bemeras法(KACTUS法)、SENSUS法、“骨架”法、企业建模法(TOVE法)、Methontology法等。Gruber[2]于1995年提出了本体构建的五条规则(明确性和客观性、完全性、一致性、最大单调可扩展性、最小承诺),但本体工程构建方法尚处于相对不成熟阶段。本体的构建工具也有很多,包括protégé、WebOnto、Ontolingua、OntoEdit、Ontosaurus、OntoEdit、IBM Ontology Management System等,其中,protégé 是斯坦福大学开发的使用较为广泛的构建工具之一,目前已有4.0版本。

基于Wiki的本体构建方法

第30卷第8期通化师范学院学报Vol.30№8 2009年8月JOURNAL OF T ONGHUA TEACHERS COLLEGE Aug.2009 基于W iki的本体构建方法 于江涛,毛慧珍 (通化师范学院计算机科学系,吉林通化134002) 摘 要:该文提出一种本体构造环境方案,在W iki pedia的基础上加入本体构造用户接口,降低用户构造本体的门槛,使用户在建立概念的同时创建本体.系统以OWL本体形式存储、管理和共享知识,还可以以系统已有概念为字典,对相关本体领域相关文本进行本体学习,自动建立本体. 关键词:本体构建;W iki;用户驱动;本体学习 中图分类号:TP311 文献标志码:A 文章编号:1008-7974(2009)08-0019-02 收稿日期:2009-06-01 作者简介:于江涛(1969-),男,硕士,通化师范学院计算机科学系副教授. 1 引言 本体(Ont ol ogy)是当前人工智能研究领域的热点,是解决知识工程中一些问题的有效方法.它的优势体现在可以用于不同领域内的人之间的交流和知识共享,可用于语义网进行语义判断,还可对知识进行管理.本体的构建是本体应用的前提,一直是个烦琐的过程.传统上为了保证本体的正确性,领域本体的构建都需要领域专家的参与.然而仅靠少数领域专家的参与难以实现领域本体构建的繁重任务[1],更不用说实现本体工程. 仅有少部分人来构建本体,主要存在两个问题:①本体的创建过程不在其用户的完全控制之内,一旦被发现有错误,发现者往往不能自已修改,而要求助于少部分人的本体建造者;②本体使用者不能抓住本体的重要性质,本体不能更好的满足用户的需要.因此,在允许少量误差前提下,我们需要更快捷的方法得到大范围的领域本体.这便需要降低本体产生和维护工具的使用门槛,使更多人的参与进来. 本文提出了基于W iki技术的本体构建方法,用户可以通过模仿自然语言中词汇的出现过程来完成本体的建立,就像任何人都能发明一个自然语言中的词汇,任何人都可以依靠W iki技术建立自己的本体.经过一次次的修改最终成为最完善和满足用户需要的本体.该方法以OWL本体来存储概念,在W iki pedia的基础上加入本体构件的用户接口,用户在建立概念的同时就建立了本体. 2 基于W iki的本体构造方法 设计界面类似于Platypus W iki(Platypus W iki 是一个Sem antic W iki W iki W eb工程[2]),但提供更丰富的OWL Full抽象语法,需要用自然语言的名称,以期不需要高的应用门槛.当使用W iki 建立一个新的概念(C lass)时,会提示记录父类(subC lass O f),当然也可以新建父类.如果其父类已经存在就取其父类的属性(Property)来指导该类属性的建立.继而对属性建立dom ain,range等等.同时对概念给出解释性自然语言描述,最终产生OWL交换语法描述和解析树.OWL本体可供修改和共享. 虽然任何人都可以对概念或者本体进行修改甚至删除,但W iki引入版本控制概念,所以任何版本的信息都会被保存下来.引入用户投票机制,让相关概念的使用者以自己的评价权重对已有本体进行评价,得到评价最高的本体作为相关概念的系统推荐本体.本体的评价高低又反过来决定其作者的评价权重. 当系统的本体规模足够大时,可以依托这些本体作为基本概念的字典,对欲建立的某新概念,指定相关领域网站,利用网络爬虫抽取与之链接网站中的文本,从相关文本中抽取对概念的描述语句,不断进行本体学习,自动建立相关概念的本体.该本体的准确性虽然略低,但可以作为用户建立相关本体时的参考,有指导作用,至少可以减少欲建立该本体的用户的工作量.当前在本体自动构建方面做的比较好的是Ont o W are Pr oject的text2ont o,它以WordNet 为字典,利用text m ining从大量文本资源中得到相关概念的描述信息,自动建立出该领域的本体[3,4]. ? 9 1 ?

Jena_中文教程_本体API(经典)

Jena 简介 一般来说,我们在Protege这样的编辑器里构建了本体,就会想在应用程序里使用它,这就需要一些开发接口。用程序操作本体是很必要的,因为在很多情况下,我们要自动生成本体,靠人手通过Protege创建所有本体是不现实的。Jena 是HP公司开发的这样一套API,似乎HP公司在本体这方面走得很靠前,其他大公司还在观望吗? 可以这样说,Jena对应用程序就像Protege对我们,我们使用Protege操作本体,应用程序则是使用Jena来做同样的工作,当然这些应用程序还是得由我们来编写。其实Protege本身也是在Jena的基础上开发的,你看如果Protege 的console里报异常的话,多半会和Jena有关。最近出了一个Protege OWL API,相当于对Jena的包装,据说使用起来更方便,这个API就是Protege 的OWL Plugin所使用的,相信作者经过OWL Plugin的开发以后,说这些话是有一定依据的。 题目是说用Jena处理OWL,其实Jena当然不只能处理OWL,就像Protege 除了能处理OWL外还能处理RDF(S)一样。Jena最基本的使用是处理RDF(S),但毕竟OWL已经成为W3C的推荐标准,所以对它的支持也是大势所趋。 好了,现在来点实际的,怎样用Jena读我们用Protege创建的OWL本体呢,假设你有一个OWL本体文件(.owl),里面定义了动物类 (https://www.360docs.net/doc/d211385700.html,/ont/Animal,注意这并不是一个实际存在的URL,不要试图去访问它),并且它有一些实例,现在看如下代码: OntModel m = ModelFactory.createOntologyModel(); File myFile = ...; m.read(new FileInputStream(myFile), ""); ResIterator iter = m.listSubjectsWithProperty(RDF.type, m.getResource("http:// https://www.360docs.net/doc/d211385700.html,/ont/Animal")); while (iter.hasNext()) { Resource animal = (Resource) iter.next(); System.out.println(animal.getLocalName()); } 和操作RDF(S)不同,com.hp.hpl.jena.ontology.OntModel是专门处理本体(Ontology)的,它是com.hp.hpl.jena.rdf.model.Model的子接口,具有Model的全部功能,同时还有一些Model没有的功能,例如listClasses()、listObjectProperties(),因为只有在本体里才有“类”和“属性”的概念。

Protege基础教程

本体构建Protege基础教程 写在前面的话 Ontology,即本体,来源于哲学领域,但自从被图书情报领域专家运用于图书情报领域,便在此领域得到大家的一致认可,各种基于本体的研究论文也层出不穷,但Protege4.0以上版本较之Protege3.X版本,界面功能发生了很大变化,以前其他学者出的学习教程已经并不适合初入本体领域的学者,而Protege官方说明又是全英文解释,给初学者更是带来了很大不便,由此,本人这篇本体构建Protege基础教程应运而生,衷心希望可以给其他学者学习本体构建工具以及以后进行基于本体构建领域的研究工作带来便利。在此,特别感谢唐门的GGJJ在我学习运用Protege过程中给了我很多的理论支持,使我在这个学习过程中思维更加清晰。 ——soonfy 学习软件,首先还是看软件版本,本人演示的是Protege4.1版本,与Protege4.0版本以上的版本界面都较为相似,版本是4.0以上的学者,都可以借鉴。另外,本文档主要是界面介绍及逻辑推理,至于本体构建中的个体关联、实体查询请关注下期文档。

一、界面介绍 1、打开Protege软件。如图1所示。 图1 在图1中,方框1 Create new OWL ontology:新建OWL本体; Open OWL ontology:打开一个OWl本体; Open OWL ontology from URI:通过通用资源标识符(URI)打开一个OWL本体; Open from the TONES repository:从TONES库打开OWL本体。 方框2 Open recent:最近打开的OWL本体路径。

本体理论与领域本体的构建

第二章本体理论与领域本体的构建 2.1 本体理论 2.1.1 本体的基本概念 本体论(Ontology)的概念最初起源于哲学领域,是形而上学理论研究的一个分支,与认识论相对。认识论研究人类知识的本质和来源,即研究主观认知,而本体论研究的则是客观存在。Ontology一方面研究存在的本质,另一方面研究客体对象的理论定义,即整个现实世界的基本特征。现在哲学领域较多翻译为“本体论”。经过多年的演进,到今天,经过人们对“本体”这一概念的重新理解和定位,本体的理论与方法早已被信息领域采用,用于知识的组织、表示、共享和重用。 本体在计算机学科的使用可以追溯到上个世纪80年代,Alxenader在1986年发表的文章被视为本体在计算机领域获得不同于哲学领域的新的研究的起点。随后Ontolgoy在人工智能领域界获得稳步的发展,并被逐渐赋予了新的含义[8-9]。1991年,在人工智能领域,Neches等人最早给出Ontology定义,Neches认为[10]“An ontology defines the basic terms and relations comprising the vocabulary of a topic area,as well as the rules for combining termsand relations to define extensions to the vocabulary.”即“一个本体给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规则定义这些词汇的外延规则。”本体定义了组成主题领域的词汇表的基本术语及其关系,以及结合这些术语和关系来定义词汇表外延的规则[11]。1993年美国斯坦福大学知识系统实验室(Knowledge System Laborary,简称KSL)的Gruber给出了本体在信息科学领域被广泛接受的定义:“An ontology is an explicit specification of a conceptualization”[12]。即“本体是概念化的明确的规范化说明”。这也是最著名并被引用最为广泛的定义。1995年Guarino和Giaretta 将本体定义为[13]“本体是概念化的明确部分的说明一种逻辑语言的模型。”这个定义与Gruber的理解有异曲同工之妙。随后在1997年W.N.Borst对Gruber的定义进行了引申,提出了“本体是共享概念模型的形式化规范说明”,以及1998年J.Studer的“本体是共享概念模型的明确的形式化的规范说明”。 本体的定义随着时间的推移也在进行着不断的变化发展,为明确起见,现将本体发展史中较有代表性的定义列表如下: 表2.1 本体发展史中的定义列表时间/提出人定义 1991/Neches 一个本体给出构成相关领域词汇的基本术语 和关系,以及利用这些术语和关系构成的规

医学文献领域本体的构建及其关键技术分析

医学文献领域本体的构建及其关键技术分析 本文以构建医学文献领域本体模型为例,阐述了构建医学情报领域本体的基本方法、流程框架和使用工具,并对本体构建过程存在的几个关键问题进行了分析,为医学情报领域本体的建设进行了可借鉴的尝试。 本体(ontology)源于哲学范畴,指的是客观存在的一个系统的解释和说明。1993 年Gruber 为本体下了这样的定义,即“本体是概念模型的明确的规范说明”,后来Studer 等对前人的定义进行深入研究后给出了另一个定义:“本体是共享概念模型的明确形式化规范说明”[ ]。虽然诸多学者对本体概念的定义描述到目前为止还没有达成共识,但是这些概念都包涵了本体的四个共性特征,即:概念化、明确、形式化和共享。“概念化”指的是通过抽象出客观世界中一些现象的相关概念而得到概述模型;“明确”指所使用的概念及使用这些概念的约束都有明确的定义;“形式化”指本体是计算机可读的(即能被计算机处理的);“共享”指本体中体现的是共同的认可和知识,反映的是相关领域中公认的概念集,即本体针对的是社会范畴而非个体之间的共识[ ]。 同时,N.Guarino 提出将本体划分为顶级本体(top-level ontology)、领域本体(domain ontology )、任务本体(task ontology)和应用本体(application ontology )[ ]。领域本体是指描述特定领域中的概念以及概念之间的关系,是用于描述指定领域知识的一种专门本体。它给出了领域实体概念及其相互关系,是领域话动以及该领域所具有特 性和规律的一种形式化描述[ ]。一个领域本体包括一套关于某一领域概念的规范而清晰的描述,称为类(classes)或概念(Concepts);描述了有关概念的各种特征的属性(properties)和属性插件(slots),还包括属性插件的限制条件(restrictions)和分面(facets),以及一系列与某个类相关的实例(这些实例组成了一个知识库)。类是本体的核心,它描述了某一领域的概念。属性插件描述了类的属性和实例[ ]。目前,本体模型的研究已经进入了一个新阶段,许多研究领域都在建立自己标准的本体。 1 学科领域常用本体构建方法和建设工具 1.1 学科领域常用本体的构建方法由于本体工程到目前为止仍处于探索阶段,领域本体的建设还处于探索期,构建过程中存在着很多问题。中科院的李景博士在《本体理论及在农业文献检索系统中的应用研究-以花卉学本体建模为例》中对目前常见的7种本体构建方法的成熟性进行了排序,即七步法、METHONTOLOGY 法> IDEFS 法>TOVE 法> 骨架法> SENSUS 法、KACTUS 法。本文大部分过程借鉴了七步法的思路和流程。 1.2 学科领域本体常用建设工具到目前为止,已经出现了许多本体建设工具。根据这些工具所支持的本体描述语言,大致可以分为2类。第1类包括Ontolingua,OntoSaurus,WebOnto 等。这3个工具的共同点是,都基于某种特定的语言,并在一定程度上支持多种基于AI的本体描述语。第2类包括Protégé系列、Web0DE、OntoEdit、Oi1Ed等。这些工具最大的特点是独立于特定的语言,可以导入/导出多种基于Web的本体描述语言格式(如XML、RDF(S)、DAML+OIL等)。它们都是基于组件的结构,很容易通过添加新的模块来提供更多的功能,具有良好的可扩展性[ ]。 本文之所以选择Protégé作为构建工具,是因为Protégé与其他本体创建工具相比,有很多其独特的优势:①Protégé作为开源工具,目前拥有最多注册用户;②不断有新的版本推出; ③可扩展性好;④以多种方式存储本体、互操作性强;⑤图形化的用户界面,简单友好;⑥支持DAML+OIL,OWL,RDF,RDFS等本体表示语言。正是这些优点,使得Protégé成为各种领域本体构建的首选工具。

Protege新手入门(基础篇)

此新手入门对应protege3.1.x版本。通过制作一个简单的动物本体,来使大家了解protege 建立owl的基础用法。 步骤1 建立新的项目。打开protege,然后会出现对话框,点击Create New Project...,出现Create New Project对话框后,选择OWL Flies(.owl or .rdf)后,点击Finish,而不选Next。 步骤2 建立类。protege的主页面中会出现,OWL Classes(OWL类),Properties(属性),Forms(表单),Individuals(个体),Metedata(元类)这几个标签。我们选择OWL Classes 来编辑。在Asserted Hierarchy(添加阶层)中,会有所有类的超类owl:Thing上点击Asserted Hierarchy旁边的Create subclass或者在OWL:Thing,点击右键选择Create subclass。会出现protege自动定义名为Class_1的类。在右边的CLASS EDITOR(类编辑

器)的Name选项中,输入Animal来替换自动定义的名字。(建议使用英文,因为下面会用到OWLViz来生成关系图,中文的话会容易出现问题。)

步骤3 建立Animal的子类,在Animal点击上右键,选择Create subclass,并按照上述方法将其名字变为Herbivore(素食动物)。 步骤4然后按照上面的方法,建立OWL:Thing的另一个子类Plant(植物),然后建立Plant的子类Tree(树)。状态如下图

本体构建方法

本体构建方法 本文通过借鉴其他领域本体的构建方法,尤其是苏格兰爱丁堡大学的企业本体的建立过程,首先尝试着一步步建立起自己的本体模型,并且经过反复迭代的过程,不断的进行排错和修改,直至本体模型初具雏形。然后在遵循本体建立准则的基础上,通过抽象总结出一套领域本体的知识工程构建方法。 领域本体构建过程 3.1 确定本体的领域与范围 首先要明确构建的本体将覆盖的专业领域、应将本体的目的、作用以及它的系统开发,维护和应用对象,这些对于领域本体的建立过程中有着很大的关系,所以应当在开发本体前注意。对于特定的专业领域的一些特殊的表达法和特定的详细内容等的注释,应当明确。另外能力问(competency questions)是由一系列基于该本体的知识库系统应该能回答出的问题组成(Gruninger和Fox,1995),能力问题被用来检验该本体是否合适:本体是否包含了足够的信息来回答这些问题?问题的答案是否需要特定的细化程度或需要一个特定领域的表示。 3.2 列举领域中重要的术语、概念。 在领域本体创建的初始阶段,尽可能列举出系统想要陈述的或要向用户解释的所有概念。这上面的概念和术语是需要声明或解释的。而不必在意所要表达的概念之间的意思是否重叠,也不要考虑这些概念到底用何种方式(类、属性还是实例)来表达。 3.3 建立本体框架。 上一步骤中已经产生了领域中大量的概念,但却是一张毫无组织结构的词汇表,这时需要按照一定的逻辑规则把它们进行分组,形成不同的工作领域,在同一工作领域的概念,其相关性应该比较强。另外,对其中的每一个概念的重要性要进行评估,选出关键性术语,摒弃那些不必要或者超出领域范围的概念,尽可能准确而精简的表达出领域的知识。从而形成一个领域知识的框架体系,得到领域本体的框架结构。 上述Step 2和Step 3并非是绝对的顺序,这两个步骤往往也可以颠倒过来进行,有时会先列举出领域中的术语和概念,然后从概念中抽象出本体框架;也可以先产生本体框架,再按照框架列举出领域的术语。至于如何具体进行,应该根据开发人员对领域的认识程度,如果领域内已经存在非常清晰的框架或者认识已经很深刻,则可以直接产生框架。当然,这两个步骤也可以交叉进行。 3. 4 设计元本体,重用已有的本体,定义领域中概念及概念之间的关系。 为了描述各个概念,利用术语对概念进行标识,并对其含义进行定义,在这一步定义时先采用自然语言进行定义。为了定义一个概念,设计了元本体。一个概念可以采用元本体中定义的元概念进行定义,或采用在本体中已经被定义的概念进行定义,或重用已有的本体。 元本体是指本体的本体,其术语用于定义本体中的概念,如实体、关系、角色等。它可以说是更高层次的本体,是领域内概念的抽象。在设计元本体时,尽量做到领域无关性,并且包含的元概念数目尽可能的少。目前,web上有许多可重用的本体资源库。重用已有的本体,既可以减少开发的工作量,又能增强与其它使用该本体的系统的交互能力。目前有许多本体可以通过internet获得,许多现成的本体,例如:UNSPSC、DMOZ、Ontolingua 的本体文库和DAML 的本体文库等,可以导入倒本体开发系统中。本体被表达的形式通常并不重要,因为许多知识表示系统能够导入和导出本体。即使某个知识表示系统不能直接使用某种形式的本体,将本体从一种形式到另一种形式通常也不难实现。 除了概念,还要定义概念之间的关系。这些关系不仅仅涉及同工作领域的概念,不同工作领域的概念也可以相关,只是这些关系总是属于某一个工作领域。 定义类(class)及类的层次体系。创建的概念中,很大一部分属于类,而对类的层次的定义有以下3种方法: (1) 自上向下法(top-down):先定义领域中综合的、概括性的概念,然后逐步细化、说明。 (2) 自下向上法(bottom-up):先定义具体的、特殊的概念,最底层、最细小的类的定义开始,然后对这些概念泛化成综合性的概念。

Protege-OWL教程笔记

Protege-OWL教程笔记 首先介绍了本体,本体是用来描述某个领域的知识的。本题描述了该领域内个概念和概念间的关系。不同的本体语言提供不同的特征。最新出现的本体语言是W3C推出的OWL。它有丰富的操作符,如and,or和negation。它基于的逻辑允许它能够定义概念或描述概念。复杂的概念能建立在简单的概念定义之上。而且,这个逻辑模型允许使用推理机检查本体中的statement和定义是否具有一致性,也能识别哪个概念符合哪个定义。推理机有助于维护层次结构。这在处理有多个父类的类时非常有用。 然后介绍了OWL的三个子语言:OWL-Lite,OWL-DL,OWL-Full。它们的表达能力由弱到强。OWL-Lite的语法最简单。OWL-DL比OWL-Lite的表达能力强,它基于描述逻辑,能够自动计算层次分类和检测到本体中的不一致。OWL-Full的表达能力最强,但是推理能力就相对较弱。 接下来介绍了个体,属性,类三个概念。用了大量的图来帮助理解概念。 1.个体用URI标识。 2.类是个体的集合。类可以组成一个由父类和子类构成的层次结构图(也称为taxonomy)。类也称为概念(concept)。 Protege-OWL使用了一个叫English Prose Tooltip Generator的工具来显示类的描述信息。可以指明两个类是不相交(disjoint)的。 3.属性是一个二元关系。它分为: 函数属性(Functional Property)——通过这个属性只能连接一个个体。hasBirthMother 反函数属性(Inverse Functional Property)——即这个属性的反属性是函数属性,也就是对于一个给定的个体,只有最多一个个体能通过该属性连接那个个体。isBirthMotherOf 传递属性(Transitive Property)——hasAncestor 对称属性(Symmetric Property)——hasSibling,如果一个属性是对称的那么它就不能是函数属性。 还可以将属性分为: 对象属性(Object Property)——连接两个个体。 数据类型属性(Datatype Property)——连接个体和XML Schema数据类型值或rdf literal,该属性不能为传递的,对称的,反函数的。 标注属性(Annotation Property)——用来对类,属性,个体和本体添加信息(元数据)。OWL-DL 对标注属性作出了如下限制:(1)标注属性的filler只能为,literal或URI或个体。(2)标注属性

领域本体构建方法的研究

龙源期刊网 https://www.360docs.net/doc/d211385700.html, 领域本体构建方法的研究 作者:殷美 来源:《电脑知识与技术》2012年第24期 摘要:介绍了国外一些著名的领域本体构建方法及本体构建中存在的问题;介绍了软件工程中螺旋开发模型。通过借鉴其它领域本体的构建方法及螺旋开发模型,提出了一种新的工程化的领域本体构建方法并通过构建高校教务管理领域本体检验其有效性。 关键词:本体;构建方法;螺旋模型 中图分类号:TP391文献标识码:A文章编号:1009-3044(2012)24-5913-04 Research on Domain Ontology Building Method YIN Mei ( Institute of Information Engineering, Lianyungang Technical College, Lianyungang 222000, China) Abstract: This paper introduces the basic concept of the domain ontology, domain ontology construction method and some problems in Constructing Ontology; introduced the software engineering spiral development model. Through drawing lessons from the other domain ontology construction method and a spiral development model, put forward a kind of new project of domain ontology construction meth od. Key words: ontology; construction method; spiral model 1本体构建方法 本体原本是哲学上的一个概念,主要探讨现实世界的基本特征。近年来,人工智能、语义web相关领域的学者也开始将本体论的观念用在知识表达上,使其成为一种能在语义和知识层次上描述信息系统的概念模型的建模工具。目前Ontology已经被广泛应用到包括计算机科 学、电子商务、数据挖掘、智能检索等在内的诸多领域。特别是做为语义Web的关键技术之一,本体及其相关技术已成为研究热点。领域本体描述的是特定领域(医学、地理、生物等)中的概念及概念之间的关系。 本体的构建主要有三种模式:一是人工模式,由领域专家借助工具完成本体构建;二是半自动模式,基于大量领域数据,在领域专家的协助下完成本体构建;三是自动模式,运用数据挖掘、人工智能等方法,基于大量的领域数据完成本体构建。上述三种模式各有优劣,人工模式代价较大,所构建的本体灵活性不足;自动模式构建的本体实施难度较大、准确性不高;而

Protege构建本体笔记

Protégé构建本体 13种OWL语言 OWL可以分为三种子语言:OWL-Lite,OWL-DL,OWL-Full。子语言的特征是由它的描述能力来分类的。其中,OWL-Lite描述能力最弱,OWL-Full描述能力最强,OWL-DL 的能力属于中间,同时,OWL-Full可以视为是OWL-DL的一个扩展。 1.1O WL-Lite 在语法上,OWL-Lite是最简单的语言。一般用于只有一个简单的类层次和定义的约束比较简单的情况。比如,根据一个现有的百科全书建立的本体。 1.2O WL-DL OWL-DL是建立在描述逻辑基础上的的,描述能力比OWL-Lite强得多。描述逻辑是第一顺序逻辑的决定性部分,可以进行自动推理。因此,可以自动的计算分类层次,并且检查本体的一致性。 1.3O WL-Full OWL-Full的表达能力是最强的。OWL-Full可以适用于需要很强的表达能力的情况。 2OWL本体的组成 OWL本体由个体、关联和类组成,三者分别和实例(Instances)、扩展连接点(Slot)、类(Classes)相通信。 2.1个体(Individuals) 个体就是在领域中,我们所感兴趣的物体。Protégé和OWL之间有一个显著的区别,就是OWL没有独立名字假定(Unique Name Assumption, UNA)。这意味着两个不同的名字可以指向同一个个体。个体就是我们常说的实例,个体可以被理解为“类的实例”。 2.2关联(Properties) 关联指的是两个个体之间的二元关系,比如,一个关联可以把两个个体连接在一起。 例:关联hasSibling,因为Matthew和Gemma是两兄弟,就可以通过hasSibling这个关系把Matthew和Gemma连在了一起, 关联也可以只有一个参数,如使某种功能化的关联,如transitive(传递)或symmetric (对称)。 在Protégé中,关联基本和扩展连接点(Slot)的意思是一致的。在描述逻辑中,扩展连接点是一个角色,在UML中是关系,也可以是指向其他物体的概念。在GRAIL(另一种本体语言)和其他的形式化语言中,也被称作属性。 2.3类(Classes) OWL类是一组包含了个体的集合。它是通过使用形式化的数学语言,精确描述类成员的特性。比如,类Cat包括了特定领域中所有包括“猫”的类。类由超类(superclass)和子类(subclass)的层次结构分类构成,也被称作taxonomy。子类是超类的细化,子类可以继承超类的性质,也就是说,超类的条件是形成子类的必要条件。同时超类-子类关系式OWL-DL的关键特性之一,这可以为推理机自动调用。 同时,概念(concept)一词也类中也时有出现,类是表述概念的基础。 建立一个OWL类,就是建立一个说明类的环境的描述,这个环境首先必须满足描述此类的一个个体成员的要求。 3OWL本体的构建 3.1建立类 3.1.1一个类层次(class hierarchy)也被称之为一个分类法(taxonomy)。

领域本体知识库总结

领域本体知识库 目录 1、数据、信息和知识的层次关系 (2) 2、本体定义 (2) 3、领域本体定义 (2) 4、构建领域本体的准则 (3) 5、构建本体的技术方法 (3) 6、领域本体的构建 (4) 6.1、领域本体的构建步骤 (4) 6.2、领域本体的知识工程构建方法 (4) 6.3、领域本体开发流程 (4) 6.4、本体开发流程 (5) 7、本体开发工具 (6) 8、领域本体的查询推理 (7) 9、领域本体的存储 (7)

1、数据、信息和知识的层次关系 图1 数据、信息和知识的层次关系2、本体定义 3、领域本体定义

4、构建领域本体的准则 5、构建本体的技术方法 (1)本体形式化描述语言的选择(2)本体开发工具的选择 (3)确立本体构建方法 (4)领域知识的搜集

6、领域本体的构建 6.1、领域本体的构建步骤 (1)确定本体的专业领域和范畴(2)列出本体中的重要术语(3)建立目标本体的概念结构(4)定义属性 (5)创建类的实例 6.2、领域本体的知识工程构建方法(1)确定本体的领域与范围 (2)列举领域中重要的术语、概念(3)建立本体框架 (4)对领域本体编码、形式化 6.3、领域本体开发流程

6.4、本体开发流程(1)定义类和类层次

(2)定义类的属性及属性约束 类的属性定义主要包括对象属性和数据属性。 对象属性用于描述类的个体实例之间的关系。 数据属性用于描述类的个体数值特征,不同属性有不同取值类型,一般包括文本、数值、日期等多种类型。 定义属性时还须定义其属性约束,包括定义域、值域、属性类型等。 (3)创建实例 7、本体开发工具 本体开发工具采用开源的Protégé软件,用W3C推荐的OWL(ontology web language)语言作为本体描述语言。

protege构建本体教程

via The Prot eg e platform supports two main ways of modeling ontologies the Prot eg e-Frames and Prot eg e-OWL editors (我们使用的是后者) 1.什么是本体(Ontologie) Ontologies are used to capture knowledge about some domain of in terest. 本体是用来获得你所感兴趣的领域的知识; 2.OWL On tologies The most rece nt developme nt in sta ndard on tology Ian guages is OWL from the World Wide Web Con sortium (W3C) 由w3c从斯坦福大学的本体语言发展而来的。 3.OWL On tologies 的组成 OWL Ontologies与基于Prot eg e frame的本体语言在组成上比较 相似,但是从专业术语上来描述时他们又有着细微的不同。OWL Ontologies是由个体(Individuals),属性(Properties),类(Classes 组成,大致对应于Protege frame 的Instances, Slots , Classes. 3.1 Individuals (个体) 指的是在域(domain)中我们感兴趣的对象。类中的一个实例。 In dividuals必须明确的声明彼此之间是否相同。不同的名字可能指 的是相同的Individuals。 3.2 Properties (属性) 指的是Individuals上二元关系,他连接着两个Individuals。如:小 三的父亲叫大三。其中,“的父亲叫”就连接着小三和大三两个

相关文档
最新文档