OWL本体存储技术研究
基于关系数据库的OWL本体存储工具的设计

基于关系数据库的OWL本体存储工具的设计本体表示语言OWL(Web Ontology Language)是一种用于定义概念和条目的语言,被广泛地应用于语义网络、智能搜索、自动化推理等领域。
基于关系数据库的OWL本体存储工具,是一种重要的本体存储解决方案。
本文将介绍基于关系数据库的OWL本体存储工具的设计思路,并通过实例说明其应用场景和技术优势。
一、设计思路基于关系数据库的OWL本体存储工具是指将OWL本体存储到关系数据库中,然后通过数据库的方式实现本体的存储、查询和推理等操作。
其设计思路包含以下几个方面:1.本体模型设计:设计合适的本体模型,保证实体和关系的准确性和完整性。
2.本体存储方案设计:将本体存储到关系数据库中,需要设计合适的表结构和索引等。
3.本体查询方案设计:通过模糊查询、准确查询、范围查询等方式,实现对本体的快速检索。
4.本体推理方案设计:通过推理机制,实现可信度判断、自动分类、扩展知识库等功能。
二、实例说明假设有一个医疗本体,包含以下概念和关系:(1)疾病:包括心脑血管疾病、呼吸系统疾病、消化系统疾病等;(2)症状:包括头痛、咳嗽、腹痛等;(3)治疗:包括用药、手术等;(4)医生:包括内科医生、外科医生等。
在关系型数据库中,可以使用4个表表示上述概念和关系:1. 疾病表:包括疾病ID、名称、描述等字段;2. 症状表:包括症状ID、名称、描述等字段;3.治疗表:包括治疗ID、名称、描述等字段;4.医生表:包括医生ID、名称、职称等字段。
通过这种方式,可以实现简单的本体存储和查询。
例如,查询患有头痛的病人的疾病和治疗方案,可以通过如下SQL语句实现:SELECT DISTINCT , FROM disease d, symptom s, treatment t, patient pWHERE p.symptom = s.IDAND s.related_disease = d.IDAND d.related_treatment = t.IDAND = 'headache'三、技术优势与传统的本体存储方式相比,基于关系数据库的OWL本体存储工具具有以下技术优势:1.数据结构灵活:使用关系数据库存储OWL本体,可以灵活地设计表结构和索引等,使得本体的存储更加高效。
本体存储技术研究

本体存储技术研究
鲍文;李冠宇
【期刊名称】《计算机技术与发展》
【年(卷),期】2008(018)001
【摘要】Ontology是对一个特定领域中重要概念的共享的形式化的描述,由于具有明确性和共享性,它可以作为领域内不同主体之间进行交流的语义基础;更进一步的,Ontology可以帮助机器理解文档表达的语义信息.语义网络是Ontology的一个重要应用场景,Ontology用来描述网络资源的语义,从而使机器具有自动管理网络信息的能力.那么巨大的数据规模是语义网络环境下Ontology数据存储管理面临的一个突出问题,所以介绍了本体存储的方法、存储模式及几种典型的本体存储管理系统.讨论了当前本体存储模式的问题并展望了未来的发展方向.
【总页数】5页(P146-150)
【作者】鲍文;李冠宇
【作者单位】大连海事大学,计算机科学与技术学院,辽宁,大连,116026;大连理工大学,管理学院,辽宁,大连,116024
【正文语种】中文
【中图分类】TP18
【相关文献】
1.本体存储技术研究 [J], 乐超;王晓军
2.OWL本体存储技术研究 [J], 常万军;任广伟
3.基于NoSQL的物联网数据本体模型存储技术研究与实现 [J], 唐洪奎;张程;刘骥
4.以中医药本体知识库为基础的开放存取资源的知识元数据提取与存储技术研究[J], 夏书剑;秦延斌
5.RDB中基于RDFS的语义本体存储技术研究 [J], 张辉;张珍
因版权原因,仅展示原文概要,查看原文内容请购买。
OWL本体在关系数据库中的存储方法研究

OWL 本体在关系数据库中的存储方法研究【摘要】本文给出了OWL 本体的形式化定义,对OWL 语言的抽象语法、相应的语义按照表格的方式予以说明。
本章的核心内容是OWL 本体在关系型数据库中的存储方法,设计了映射转化后的关系数据库中的基本表的结构,最后对OWL 语言中的类、数据类型属性、对象属性和个体的映射规则进行了规范说明。
【关键词】OWL 本体关系数据库存储方法1OWL 本体的形式化定义一个本体的形式化定义为{I,OP,OPE,DP,DPE,C CE, DT, DR, a, It, F},可以看出,一个本体包括以下部分:I表示个体的集合,集合中的每个个体都可能是一个抽象或具体域个体;0P表示一个对象属性;OPE表示一个对象属性的表达式;DP表示数据属性;DPE表示数据属性的表达式;C表示一个类;CE表示一个类的表达式;DT表示一个数据类型;DR 表示数据范围;a 表示一个个体;It 表示文本;F表示约束面。
OWL本体的完全语法规则(即OWL抽象语法以及对应的语义)包括键公理、类描述、类描述公理、对象属性公理、数据属性公理、断言。
1.1类描述OWL 本体的类描述语法规则如图1 所示。
1.2类描述公理OWL 本体的类描述公理语法规则如图2 所示。
1.3对象属性描述公理OWL 本体的对象属性描述公理语法规则如图3 所示。
1.4断言OWL 本体的断言公理语法规则如图4 所示。
2本体在关系数据库中的存储规则将OWL 本体存储在关系型数据库中,即将OWL 本体转化成关系型数据库中的表。
将本体转化为关系型数据库可以分为两部分来看,外层表示将本体转化为关系型数据库。
其中,本体是源,关系数据库是目标;在内层,本体模型按预先设计好的规则映射成为关系模型。
这一过程中,本体和本体模型保持一致,关系模型和关系型数据库保持一致,而映射按照预先设计好的规则对应转化这一动作。
在现有的映射转化方法基础上,得到改进的映射转化方法,关系型数据库中的主要表结构如图5 所示。
从关系数据库学习OWL本体的方法

从关系数据库学习OWL本体的方法摘要:提出了一种从关系数据库半自动学习OWL本体的方法。
该方法在形式化表示关系数据库模式和OWL本体的基础上,遵循从关系数据库模式到OWL本体的一组通用映射方法和规则,并基于Java 2平台实现了原型工具OntoLearner。
利用OntoLearner进行的典型案例研究表明了该方法的有效性。
关键词:本体学习;关系数据库模式;本体工程;OWL;语义Web 本体是语义Web的关键使能技术。
使用现有本体编辑器手工开发本体是一项冗长而繁琐的工作,极易导致知识获取的瓶颈,所以本体学习[1]技术应运而生。
它极大地简化了本体的构建,满足了语义Web对于快速简便构造本体的需求,在语义Web中起到了杠杆的作用。
关系数据库是基于Web的数据密集型应用的主要信息源,数据库模式中隐含着领域知识。
因此,从关系数据库学习出的OWL本体更适合于数据密集型Web应用的需要。
本文在形式化表示关系数据库模式和OWL本体的基础上,介绍了一种从关系数据库半自动学习OWL本体的方法,设计出一套通用的映射方法和规则,并基于Java 2平台实现了原型工具OntoLearner。
1 关系数据库模式关系数据库模型是以集合论中的关系(relation)概念为基础发展起来的数据模型[2]。
为了便于形式化描述本体学习方法中的映射规则,这里给出了关系数据库模式的形式化定义(符合3NF)。
定义1:一个关系数据库模式S=(L,pkey,unique,notnull,fkey,subof,fdependency)是七元组,其中: 2 OWL本体本体是一组描述某领域内概念及其属性以及概念间关系的词汇和公理的集合。
W3C在2004年2月发布了标准化的Web 本体语言OWL[3]。
这里给出OWL DL本体的形式化定义。
定义3:一个OWL DL本体O=(Cept,Axiom)是二元组,其中: (1)标识符集Cept=CID∪DPID∪OPID∪DTID是一个有限集,由两两不相交的集合组成:①一个类(class)标识符集CID;②一个数据类型属性(datatype property)标识符集DPID;③一个对象属性(object property)标识符集OPID;④一个数据类型(data type)标识符集DTID,每个数据类型标识符是OWL 本体中使用的预定义XML Schema数据类型标识符。
OWL本体关系数据库存储模式设计

O WL本 体 关 系数 据 库 存 储 模 式 设 计
陶 皖 , 红 燕 姚
( 安徽 工程科技 学院 计 算机科 学与 工程 系, 安徽 芜湖 2 10 ) 4 0 0
摘 要 : 体合 理有效 的存储 是保 证本 体共享 利用 的前提 , 本 现有 的关 系数据 库本 体存储 模式 在存储 O WL本体 后 会 出现 查
征的属性 、 概念之 间的关 系、 概念和属性之间的约束 来
1 本 体 的关 系数 据 库 存 储 模 式
本体可 以在平面 文件 ( a fe 、 l l f t i ) 数据库 等 中来存 储 。这里重点讨论本 体的关 系数据库 存储 问题 , 由于
维普资讯
第 l 7卷 第 2期 20 0 7年 2月
计 算 机 技 术 与 发 展
C MPUTER O TECHNOIOGY . AND DEVEIOPN E .  ̄ NT
V( . 7 NO 2 ) 1 1 . Fe 2 b. 007
l u rn noo y soa dx t r yc re t tlg trgeme xs&e o 州 . eo dyo tlg tr esh mai eine co dn t S c n l noo yso a c e dsg da cr ig OW L noo yc a atrsi g s o o tlg h r ce t i c.
idct ta h trg n iae h tteso a emeh di i pe Th u r ts d t o ssm l. eq ey etha mv ta h e r v l fiin y i n ra e . lteee pant a h sp e h tt rt e a fce c sice sd Al h s x li h tt e d e i e d i i esbe sn e g sfa il. Ke r s OW L no wy;eain l aa ae;tr esh ma ywo d : o tk rlt a tbs so a e o d g c
OWL本体存储技术研究

C mp t c ne n eh o g , H n nMeh ncl n l tcl n i ei ol e o ue S i c d cn l y e a c aiaa d e r aE g er gC l g ,Xi i g 5 0 2 C i ) r e a T o E ci n n e n a 3 0 , h a xn 4 n
前 广 泛使 用 的 垂 直 模 式 在 各 方 面 的 性 能 都 更 优 越 , 且 也 适 宜 于 存 储 大 规 模 本 体 。 而
关键词 : 网络 本 体 语 言 ; 资 源 描 述 框 架 ; 本 体 ; 存 储 ; 关 系 数 据 库
中图法分 类号 : P 1 T31
文献 标识 码 : A
pe diulrso a c m aus xtnsv y n n c a t r ges he ede e iel ow. I sa s e ti a n age s al t l gy ti lo f a n s vi g lr —c eon o o .
Байду номын сангаас
Ke r s OW L; R y wo d : DF; o t l g ; so a e r l t n d tb s noo y tr g ; ea i aa a e o
(.Colg f mp tr ce c n fr t n Guz o ies y Guy n 5 2 5 Chn ;2 1 l eo Co ue in ea dI o mai , e S n o ih uUnv ri , t ia g5 0 5 , ia .De at n f pr me t o
b s h stx a i h rs a c i g e ce c n et r x a d f n t n I a r u ei rf n t n i a h a p c a ep r a e i t i t sa hg e e r h n f in y a d b t p n e h i e e n u c i . t smo e s p ro u ci n e c s e t h t e - o h o tn h
OWL本体之间概念相似度计算研究的开题报告

OWL本体之间概念相似度计算研究的开题报告
一、研究背景
现代信息技术快速发展,促进了语义Web的建设,语义Web通过Ontology规范和描述了知识和概念之间的关系,为机器自动推理提供了一种强有力的基础。
然而,大量的本体与知识库在语义Web上的广泛应用,使得概念的相似性计算显得越来越重要。
概念相似度计算是自然语言处理中的一个重要问题,它可以应用于对概念语义信息的挖掘、文本分类、问答系统中关键词选择、网络信息检索中的筛选等多种领域。
OWL(Web Ontology Language)本体是语义Web中常用的本体描述语言,本体之间概念的相似度计算可以为语义搜索、本体匹配和数据集成等多个方面提供支持。
二、研究目的
本研究的目标是设计一种有效的OWL本体之间的概念相似度计算方法,使其能够支持本体匹配、语义搜索和数据集成等应用。
三、研究内容
1. OWL本体描述语言的研究
OWL是一种本体描述语言,本研究将深入学习OWL语法、本体结构和知识表示等相关内容,为后续计算概念相似度做好准备。
2. 概念相似度计算算法研究
研究传统的基于词汇重叠的概念相似度计算方法,如路径长度、信息系数等,并对其进行改进和创新,提高其对语义信息的准确性和鲁棒性。
3. 基于OWL本体的相似度计算系统设计与实现
设计和实现基于OWL本体的概念相似度计算系统,包括本体的读取与解析、概念节点的分析和计算以及结果的展示等模块。
四、研究意义
本研究可以为语义Web的建设提供强有力的支持,为本体匹配、语义搜索和数据集成等多个领域提供基础技术支撑。
此外,在自然语言处理领域中,本研究也为相关技术的发展提供了参考和借鉴。
本体研究的内容本体研究内容主要有三方面本体基础研究

(5)分布式本体库(Large Scale Knowledge Management)
当本体数据量很大,或者特殊原因不得不把本体库存储在不同的服
务器上,如何实现分布式,以及如何进行分布式本体检索。
(6)本体库数据持久化(Database Technologies for the
(search)六种模型:
语义网搜索引擎(Semantic Web search engines) 语义网浏览工具(navigation tools)
语义网知识库(Semantic Web repositories)
RDF 收集器(specialized RDF data collections) 本体标注检索模型(ontology annotation)
2 本体库研究 (1)本体建库,本体建模(Ontology Construction,Ontology Engineering)
本体库构建的方法论:如 IDEF-5、Skeletal Methodology(骨架法)、 TOVE(企业建模法)、METHONTOLOGY以及Cyclic Acquisition Process方 法等等。
领域本体检索模型
(2)本体可视化(Ontology Visualization)
本体可视化按照可视化结果分类,可以分为三类: 本体动态图形可视化、本体静态图形可视化和本体静 态文字可视化。 (3)本体推理(Ontology Reasoning , Ontology
Entailment)
本体推理的实质是根据规则对原始本体库 (asserted)进行逻辑推理生成新的三元组,从而形成
Semantic Web)
这个方向研究怎么样用传统DataBase对本体库做数据持久。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0引言语义Web(semantic web)作为当前万维网的扩展,通过结构化和形式化的方法,以表示Web上的资源,使得计算机程序能够对网络资源进行分析和推理[1-2]。
语义网作为下一代万维网,目前成为全球领域的研究热点。
尤其随着W3C(world wide web consortium)的一些语义网相关标准,如资源描述框架(resource description framework,RDF)、RDFS、网络本体语言(web ontology language,OWL)等的制定,越来越多的人利用这些标准和技术,去开发基于Semantic Web的应用系统。
在语义网体系的各类技术中,本体是最重要的支撑技术[3],语义网的发展加速了本体的研究。
随着最新本体语言OWL 的出现,越来越多的人利用OWL语言开发基于本体的知识系统,使用本体语言描述某个领域的知识,利用本体工具开发特定领域的知识系统[4]。
在这些知识系统中,本体提供了知识库构建的基本结构,是整个系统的骨架和核心。
OWL本体作为一种全新的数据组织形式,选择合适的存储介质和合理的存储模式对其进行有效存储,是当前人们十分关注的问题,也是开发语义本体知识系统的各类技术中最为关键的基础性支撑技术[5-6]。
1本体存储介质在本体的存储技术中,存储介质的选择是研究人员首先需要关注的。
目前已知的本体存储介质,也是人们经常选择的存储介质有内存、文件、关系数据库等3种方式。
1.1内存存储方法用内存法存储本体是将本体数据以一定的结构形式直接存储在计算机的主存中,然后在计算机主存中进行数据查询等各种数据操作。
这种方法具有较高的运行效率,但囿于物理条件的限制,内存存储方法只能存储很少量的数据,而且记忆能力很差。
1.2文件存储方法文件存储的方法简单可行,适宜常久存储,很多本体相关工具都支持用文件格式存储的本体进行存取。
但是这种方法收稿日期:2010-08-23;修订日期:2010-12-21。
效率很低,而且存储规模有限。
当OWL本体数据文件很大时,要把握OWL本体数据全局的结构,必须反复扫描OWL本体文件,进行大量数据存取工作,严重影响了系统的效率。
有时为了保证本体系统的并发性,还需建立一定的并发控制机制[7]。
早期的一些本体工具是基于文件系统实现的,这些工具主要用来编辑和建立本体,并不是为大规模本体数据的存储和查询管理服务的,例如Onto,Prot与本体中类的属性相对应,对于类的多种数据类型属性可以通过数据库表中相关列的唯一性和主键设置来对应,本体类之间子类-超类的关系可以用数据表中主、外键的设置来对应。
他们之间数据类型的对应关系也可以用类似xsd:integer与数据库中INT/INTEGER对应关系一样一一对应起来。
3.2设计方案本体的最基本的概念就是资源。
OWL使用URI(uniform resource identifier)来标识资源,这与RDF模型的三元组(Sub-ject、Object和Predicate)完成可以建立相对应的关系[15]。
如果文字可以作为Predicate,而且文字可以作为是一种特殊的资源,那么就允许我们把文字和本体中的URI一起当作资源,存储在一张数据表中,这样Predicate为相同文字的各个三元组就能共享相同的Web本体资源。
三元组也是本体的一个基本概念,用一个数据表来表示RDF基本模型的。
从理论上讲,有这两个数据表就可以完全存储本体信息。
但为使本体存储的结构更加清晰,并提高数据查询的效率和结构的稳定性,本文专门建立了一些数据表来存放一些常用信息。
在数据表的建立过程中有一个原则须共同遵守,就是本体的类作为数据表存储时,一般都要把他们属性名对应的列设置为数据表的主键。
如果数据表的主键已经存在,则将须设为主键的列设置为唯一列。
采用如下措施把本体实例存储到关系数据库的数据表中:(1)建立数据表分别将subClassOf,subPropertyOf,domain 和range等函数属性的定义域存储起来。
(2)本体中,经常出现父子关系的类,因此需要将这种隶属关系的实例存储在一张数据表中。
假若若OWL本体中类c 和类d存在subClassOf(c,d)关系,他们对应的数据表分别为tab-lec和tabled,则在将在tablec中添加一个与tabled的主键同名的列。
用此列作为tablec的主键和引用数据表tabled的外键。
(3)本体存储中,类与类之间出现互逆关系也是需要我们需要考虑的。
假设若OWL本体中类d和类e与类c之间各一对互逆的对象属性,他们对应的存储数据表分别为tabled、tab-lee和tablec。
我们将tablec设置为联系表,在tablec中添加两个分别与tabled和tablee的主键名相同的列,用此列作为数据表tablec中的复合主键和引用数据表tabled和tablee的外键。
(4)将OWL中有许多如sameAs等用来描述等价的类、性质和实例存储在数据表中。
(5)将OWL中使用objectProperty等来刻画属性特性的类存储在数据表中。
(6)将OWL中使用allValuesFrom等用于属性取值的推理的所有类可以存储到属性约束表中。
以后如果OWL语言又引入了其它的对属性约束的描述,在此数据表中添加相关记录即可,从而减轻程序设计人员修改存储模式的压力。
(7)将OWL中如allDifferent等用来描述资源间的二元关系但使用频率又比较低的类全部存储到一张二元关系的数据表。
同(6)一样,这种存储办法也可以减轻程序设计人员修改存储模式的压力。
3.3实验3.3.1实验环境和实验数据我们选择的实验环境硬件为CPU P41.7GHz,1024M内存和80G硬盘,软件采用Windows XP系统和Mysql数据库,编程语言为Java(JDK1.6)。
本体测试框架采用比较著名的关于高等学校的领域本体LUBM。
这里我们选择LUBM(l,0)作为实验数据。
3.3.2实验方法在现有的存储模式中,除垂直模式外,其它存储模式的表结构都不稳定,在实际应用中具有很大的局限性。
所以,实验只比较本文的存储模式和垂直模式性能方面的不同。
在LUBM (l,0)中,分别对3个本体文件、9个本体文件和16个本体文件使用7个具体的查询进行性能测试:(1)类person的所有子类(2)属性subPropertyOf的所有子属性(3)实例Undergraduatestudent63的属性takesCourse的值是什么(4)图(Undergraduatestudent63takesCourse?x)(?x type Course)(5)属性teacherof的range是什么(6)属性advisor的domain是什么(7)Faculty的所有实例3.3.3实验结果取5次连续100次查询的所需平进行比较,以ms作为时间单位。
得到用垂直模式和本文模式进行前6个查询的时间对比如图1、图2和图3所示,将3类本体文件进行查询7得到的时间对比如图4所示。
由时间对比图可以看出,对于相同数量的本体文件和相关的查询条件,本文设计的混和存储模式的查询时间要比垂直模式的查询时间短,说明本文实现的混合存储模式查询性能更好;从图4还可以看出,当本体数量增加时,对于相同的查询,本文的存储模式时间增长速度慢于垂直模式的查询时间增长速度,说明用本文设计的存储大规模本体具有更好的扩展性。
4结束语对本体的存储介质进行了分析研究,特别是对关系数据库4种存储模式进行深入研究分析后,提出了一种结构清楚,查询效率比较高,扩展性比较好的混合存储模式来实现OWL 本体的存储,用OWL测试框架LUBM[24]进行了实验测试。
实验表明本文设计的基于关系数据库的混合存储模式在本体知识的查询效率和扩展性等方面都具有很强的优越性。
特别是当数据量增大时,本文设计的存储模式的性能优势体现的更为明显,说明对于大规模本体的存储来说,该模式也是可行。
参考文献:[1]贾琦,郭绍忠,丁志芳.基于本体的元数据管理系统的研究[J].计算机工程与设计,2009,30(1):199-202.[2]徐立广,金芝,易利军.一个本体语言及本体构造工具的设计[J].计算机工程与应用,2006,42(25):74-79.[3]白伟华,朱嘉贤.语义网中基于Web资源本体的数据中介服务[J].计算机工程与设计,2010,31(11):2654-2658.[4]朱勤斯,虞慧群.一种基于语义网技术和本体的数据集成方法[J].华东理工大学学报(自然科学版),2009,34(1):199-215. [5]史一民,李冠宇,刘宁.语义网服务中本体服务综述[J].计算机工程与设计,2008,29(23):5976-5980.[6]何召卫,陈俊亮.基于本体关系匹配的信息抽取[J].计算机工程,2007,33(21):207-209.[7]李勇,李跃龙.基于关系数据库存储OWL本体的方法研究[J].计算机工程与科学,2008,30(7):105-107.[8]陈光仪,陈德智.RDFS本体在关系数据库中的存储研究[J].计算机与数字工程,2008,36(12):188-190.[9]汤庸.高级数据库技术与应用[M].北京:高等教育出版社,2008:16-59.[10]陈布伟,李冠宇,张俊,等.基于语义网规则语言的推理框架设计[J].计机工程与设计,2010,31(4):847-853.[11]郗君甫.基于本体的关系数据库关键词语义查询扩展方法[J].燕山大学学报,2010,34(3):231-236.[12]李曼,王琰.基于关系数据库的大规模本体存储的存储模式研究[J].华中科技大学学报(自然科学版),2005,33(增刊):217-220.[13]许卓明,黄永菁.从OWL本体到关系数据库模式的转换[J].河海大学学报(自然科学版),2006,34(1):95-99.[14]唐富年.一种关系数据库模式到本体映射的失效检测方法[J].计算机科学,2010,37(3):170-174.[15]杜小勇,李曼,王珊.本体学习研究综述[J].软件学报,2006,17(9):1837-1847.(上接第2892页)。