本体研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
The Modeling Primitive of Ontology
• 本体包含5个基本的建模元语(Modeling Primitive)或说是5个要素: • 类/概念(classes/concepts):概念的含义很广泛,可以指任何事物, 如工作描述、功能、行为、策略和推理过程等等。 • 关系(relations):关系代表了在领域中概念之间的交互作用。形式 上定义为n 维笛卡儿乘积的子集: R : C1 ×C2×⋯×Cn 。如:子 类关系( subclass-of) 。 • 函数(functions):函数是一类特殊的关系。在这种关系中前n - 1 个 元素可以惟一决定第n 个元素。形式化的定义如下: F : C1 ×C2 ×⋯×Cn-1 →Cn 。例如Mother-of 关系就是一个函数,其中Motherof ( x , y) 表示y 是x 的母亲,显然x 可以惟一确定他的母亲y 。 • 公理(axioms):公理代表永真断言,比如概念乙属于概念甲的范围。 • 实例(instances):实例代表元素。
•
(1) 本体可以在不同的建模方法、范式、语言和软件工具之间进行翻译和映射, 以实现不同系统之间的互操作和继承。 (2) 从功能上来讲,本体和数据库有些相似。但是本体比数据库表达的知识丰 富得多。首先,定义本体的语言,在词法和语义上都比数据库所能表示的信 息丰富得多;最重要的,本体提供的是一个领域严谨丰富的理论,而不单单 是一个存放数据的结构。 (3) 本体是领域内重要实体、属性、过程及其相互关系形式化描述的基础。这 种形式化的描述可成为软件系统中可重用和共享的组件。
The Concept of Ontology
•
•
• •
其中,Studer对本体的定义包含了4 层含义:概念模型、明确化、 形式化和共享。 1.概念模型(conceptualization) 通过抽象出客观世界中一些现象的相关概念而得到的模型,其表 示的含义独立于具体的环境状态 2.明确化(explicit) 所使用的概念及使用这些概念的约束都有明确的定义 3.形式化(formal) 本体是计算机可读的。 4.共享(share) 本体中体现的是共同认可的知识,反映的是相关领域中公认的概 念集,它所针对的是团体而不是个体。
The Concept of Ontology
知识工程界认为本体是一种engineering artifact(工程人造物)。 尽管本体论的研究日益成熟,但“本体究竟是什么”仍是一个争论中 的话题。随着对本体认识和研究的深入,本体的定义描述一直在不断 的变化发展中: – 1991/Neches等:给出构成相关领域词汇的基本术语和关系,以 及利用这些术语和关系构成的规定这些词汇外延的规则的定义; 该定义只是给出了建立一个本体的基本要素; – 1993/Gruber:概念模型的明确的规范说明;该定义得到人们的 广泛人认可; – 1997/Borst:共享概念模型的形式化规范说明; – 1998/Studer:共享概念模型的明确的形式化规范说明; – 1999/William和Austin:本体是用于描述或表达某一领域知识的 一组概念或术语,可用于组织知识库较高层次的知识抽象,也可 用来描述特定领域的知识; – 1999/Chandrasekaran等人:认为本体是属于人工智能领域中的 内容理论,它研究特定领域知识的对象分类、对象属性和对象间 的关系,为领域知识的描述提供术语。
The Characteristic of Ontology
(4) 本体可以为知识库的构建提供一个基本的结构。既可以描述简单 事实及抽象概念-它们主要描述的是事物或概念的各个组成部分以及 这些组成部分之间的静态联系;本体也可以描述事物或概念的运动和 变化。应用本体,知识库就可以运用这类结构去表达现实世界中浩如 烟海的知识和常识,这点在中科院陆汝钤研究员建立的Pangu知识库 中得到了很好的体现。 (5) 对于知识管理系统来说,本体就是一个正式的词汇表。本体可以 将对象知识的概念和相互间的关系进行较为精确的定义。在这样一系 列概念的支持下进行知识搜索、知识积累、知识共享的效率将大大提 高,真正意义上的知识重用和知识共享也能成为现实。 (6) 本体适合表示抽象的描述。本体的使用可以帮助我们清楚地理解 特定领域的相关元素、关系和概念,让知识表达更加准确便捷,帮助 人们进行更好的决策。 本体在语义Web 和其它很多领域都有着广泛的应用。本体的最大 贡献在于它可以将某个或多个特定领域的概念和术语规范化,为其在 该领域或领域之间的实际应用提供便利。
• 具体描述本体的方法很多,按照表示和描述的形式化的程度不同,可 以将本体分为:完全非形式化本体、半非形式化本体、半形式化本体 和严格形式化的本体。 • 自然语言、框架、语义网络或逻辑语言等都可以用来描述本体。本体 建模语言大致可分为两类:传统的本体建模语言和面向Web的本体建 模语言。他们之间的区别在于面向Web的建模语言语法一般采用XML 作为语法基础,常用于表达Web信息的语义。 • 传统的本体建模语言有KIF、Ontolingua、Cycl、OKBC、OCML、 Frame Logic和LOOM等。 • 面向Web的建模语言有XOL、SHOE、OML和OWL等。 • 目前使用最普遍的方法是Ontolingua 、CycL 和Loom 等。
The Purpose of Ontology
明确的本体可以支持:
• • • • • • • • 在人们之间共享理解 工具间的互操作性 系统工程 可重用性 定义主题词表和概念 扮演数学在物理中所扮演的角色(内容理论) 定义必要的充足的概念和“方法” 共同的知识理论
3
本体的构成 需要哪些要素?
What constituted the ontology?
The Classification of Ontology
• 顶层本体 描述的是最普通的概念及概念之间的关系,如 空间、时间、事件、行为等等,与具体的应用无关,其他 种类的Ontologies 都是该类Ontologies 的特例。 • 领域本体描述的是特定领域(医药、汽车等) 中的概念及概 念之间的关系。 • 任务本体 描述的是特定任务或行为中的概念及概念之间 的关系。
The Classification of Ontology
• 比较著名的分类方法是Guarino 于1997年提出的以详细程 度和领域依赖度两个维度作为对本体进行划分。 • 详细程度高的称为参考(reference)本体;详细程度低的 称为共享(share)本体。 • 按照领域依赖程度,又可将本体分为顶级(top-level)本 体、领域(domain)本体、任务(task)本体和应用 (application)本体等4类。
本体是什么?
What is ontology?
The Concept of Ontology
• 本体论(Ontology)和本体(ontology)在英文中的表示并不完全一 样,它们一个用大写的“O”开头,另一个用小写的“o”开头。本体 论这个术语诞生于17世纪,派生于希腊语的onto和logia,是一个哲学 的分支。从哲学上来说,本体论是研究客观事物存在的本质,所以本 体论在哲学上的真正内涵是对世界上任何领域内的真实存在所做出的 客观描述。对本体论的理解,人们不存在什么疑问。但是对本体的理 解,哲学界和计算机科学界存在着不同的观点。 • 在哲学界,本体作为表述哲学理论的术语,是指形成现象的根本实体。 • 近十多年来,本体论的研究日益成熟,也已经远远超过了哲学的范畴, 和信息技术、知识工程及人工智能都有着密切的关系。尤其本体论最 近在Web上的应用直接导致了语义Web的诞生,企图解决Web信息共 享中的语义问题,给Web带来了勃勃生机和无限遐想。
The Concept of Ontology
• 从以上不同研究者的定义,可以看出本体涉及到的概念为: 术语(词汇)、术语关系、规则、概念化、形式化的规格 说明、领域知识、表达和共享。
• 其实,本体就是通过对于概念、术语及其相互关系的规范 化描述,勾画出某一领域的基本知识体系和描述语言。 • 如果进行类比的话,可以看到,很多人工产品都有很强的 本体的味道,比如:术语表、术语学、字典、百科全书、 知识库、数据库模式。
The Purpose of Ontology
• Ontology的目标是捕获相关的领域的知识,提供对该领域知识的共同 理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上 给出这些词汇(术语)和词汇之间相互关系的明确定义。 • 开发可重用的本体以推进共享和重用是本体研究的一个重要目标。 • 知识共享:不同的系统描述领域的时候使用不同的概念和术语。所以 很难从一个系统中提取知识运用到另一个系统中。 • 开发支持构建、合并和翻译本体的工具是研究的另一个目标。
The Modeling Primitive of Ontology
• 在实际的应用中,不一定要严格地按照上述5 类元语来构造Ontology。同时概念之间的关系 也不仅限于上面列出的4 种基本关系,可以根 据特定领域的具体情况定义相应的关系,以满 足应用的需要。
The Description of Ontology
• 应用本体描述的是依赖于特定领域和任务的概念及概念之 间的关系。
The Classification of Ontology
• 1999年,Perez和Benjamins在分析和研究了各种本体分 类法的基础上,归纳出10种本体: • 知识表示本体、普通本体、顶级本体、元(核心)本体、 领域本体、语言本体、任务本体、领域-任务本体、方法 本体和应用本体。 • 这种分类法是对Guarino提出的分类方法的扩充和细化, 但划分的界限较为模糊,10种本体之间有交叉,层次不够 清晰。 • 2005年,又有学者提出按照是否具备逻辑推理功能,把本 体分为:轻量级本体,中级本体和重量级本体。
2
为什么要研究本体
What is thestic of Ontology
• 当前的计算机正在从单一的设备向进行信息交换和事务处理的世界范围网络 转变。因此,支持数据、信息和知识的交换、重用和共享成了当今计算机技 术要迫切面临的任务。 我们之所以在知识工程、自然语言处理、信息检索系统、智能信息集成和知 识管理、信息交换和软件工程等等领域研究和发展本体,是因为本体有以下 突出的特点:
本体构建 基础研究
An Ontology-based System
Introduction
“本体论” (Ontology)原是哲学研究中发展出来的 一个概念,是用来研究客观事物存在的本质和组成。本体 可以用来表示事物的本质和组织。哲学家们用它来回答如 “什么是本质”、“所有事物的一般特征是什么”等一些 基本的问题。本体论在哲学定义上的主要特点在于本体论 是关于世界某个方面的一个特定的分类体系,这个体系不 依赖任何特定的语言。近年来,随着信息科学的飞速发展, 本体论受到众多研究人员的关注,已成为计算机领域重要 研究方向之一。目前,本体已经被广泛应用于知识工程、 数字图书馆、软件复用、信息检索、多智能体系统、系统 建模、异构信息集成、语义Web等领域。
The Classification of Ontology
• 目前被广泛使用的本体有如下5 个: • Wordnet:Wordnet 是基于心理语言规则的英文词典,它以synsets 为单位组织信息。所谓synsets 是在特定的上下文环境中可互换的同 义词的集合。 • Framenet:Framenet 也是英文词典,采用称为Frame Semantics 的 描述框架, 提供很强的语义分析能力, 目前发展为FramenetII。 • GUM:支持多语种处理,包含基本的概念及独立于各种具体语言的 概念组织方式。 • ENSUS:为机器翻译提供概念结构,包括7 万多个概念。 • Mikrokmos:Mikromos也支持多语种处理,采用一种语言中立的中间 语言TMR 来表示知识。