基于Wiki的本体构建方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第30卷第8期通化师范学院学报Vol.30№8 2009年8月JOURNAL OF T ONGHUA TEACHERS COLLEGE Aug.2009

基于W iki的本体构建方法

于江涛,毛慧珍

(通化师范学院计算机科学系,吉林通化134002)

摘 要:该文提出一种本体构造环境方案,在W iki pedia的基础上加入本体构造用户接口,降低用户构造本体的门槛,使用户在建立概念的同时创建本体.系统以OWL本体形式存储、管理和共享知识,还可以以系统已有概念为字典,对相关本体领域相关文本进行本体学习,自动建立本体.

关键词:本体构建;W iki;用户驱动;本体学习

中图分类号:TP311 文献标志码:A 文章编号:1008-7974(2009)08-0019-02

收稿日期:2009-06-01

作者简介:于江涛(1969-),男,硕士,通化师范学院计算机科学系副教授.

1 引言

本体(Ont ol ogy)是当前人工智能研究领域的热点,是解决知识工程中一些问题的有效方法.它的优势体现在可以用于不同领域内的人之间的交流和知识共享,可用于语义网进行语义判断,还可对知识进行管理.本体的构建是本体应用的前提,一直是个烦琐的过程.传统上为了保证本体的正确性,领域本体的构建都需要领域专家的参与.然而仅靠少数领域专家的参与难以实现领域本体构建的繁重任务[1],更不用说实现本体工程.

仅有少部分人来构建本体,主要存在两个问题:①本体的创建过程不在其用户的完全控制之内,一旦被发现有错误,发现者往往不能自已修改,而要求助于少部分人的本体建造者;②本体使用者不能抓住本体的重要性质,本体不能更好的满足用户的需要.因此,在允许少量误差前提下,我们需要更快捷的方法得到大范围的领域本体.这便需要降低本体产生和维护工具的使用门槛,使更多人的参与进来.

本文提出了基于W iki技术的本体构建方法,用户可以通过模仿自然语言中词汇的出现过程来完成本体的建立,就像任何人都能发明一个自然语言中的词汇,任何人都可以依靠W iki技术建立自己的本体.经过一次次的修改最终成为最完善和满足用户需要的本体.该方法以OWL本体来存储概念,在W iki pedia的基础上加入本体构件的用户接口,用户在建立概念的同时就建立了本体.

2 基于W iki的本体构造方法

设计界面类似于Platypus W iki(Platypus W iki 是一个Sem antic W iki W iki W eb工程[2]),但提供更丰富的OWL Full抽象语法,需要用自然语言的名称,以期不需要高的应用门槛.当使用W iki 建立一个新的概念(C lass)时,会提示记录父类(subC lass O f),当然也可以新建父类.如果其父类已经存在就取其父类的属性(Property)来指导该类属性的建立.继而对属性建立dom ain,range等等.同时对概念给出解释性自然语言描述,最终产生OWL交换语法描述和解析树.OWL本体可供修改和共享.

虽然任何人都可以对概念或者本体进行修改甚至删除,但W iki引入版本控制概念,所以任何版本的信息都会被保存下来.引入用户投票机制,让相关概念的使用者以自己的评价权重对已有本体进行评价,得到评价最高的本体作为相关概念的系统推荐本体.本体的评价高低又反过来决定其作者的评价权重.

当系统的本体规模足够大时,可以依托这些本体作为基本概念的字典,对欲建立的某新概念,指定相关领域网站,利用网络爬虫抽取与之链接网站中的文本,从相关文本中抽取对概念的描述语句,不断进行本体学习,自动建立相关概念的本体.该本体的准确性虽然略低,但可以作为用户建立相关本体时的参考,有指导作用,至少可以减少欲建立该本体的用户的工作量.当前在本体自动构建方面做的比较好的是Ont o W are Pr oject的text2ont o,它以WordNet 为字典,利用text m ining从大量文本资源中得到相关概念的描述信息,自动建立出该领域的本体[3,4].

9

1

但上述方法也是存在严重缺陷的,正如文献[5]所说,相关文本的作者往往假设你拥有和他同样的知识背景,也就是说文本中有隐藏的语义信息存在,所以仅仅从这些文本中依据字典查找信息,得到的是不完全的甚至片面的信息,解决这个问题的好方法是:有一些低层的概念能支撑作者假设你拥有的知识背景,建立一个拥有大量低层本体的并具有一定推理能力的本体库.另外因为text2ont o以Word Net为字典,所以text2ont o并不能对中文的信息进行利用,并且WordNet仅为结构化良好的字典,并不以OWL本体形式存储概念,所以不具有推理能力.如果以具有推理的本体库为字典,将会有更好的本体自动构建效果.所以本文建立一个本体构造收集系统,并以已有的本体库作为字典,用类似text2ont o的text m ining 方法创建本体原形作为用户使用系统建立新本体.这样可以得到利用已有的OWL本体形式存储的概念作为字典对海量文本数据进行数据挖掘得到相关领域本体的方法(如图1所示)

.

图1 本体的自动构建过程

3 结论

本体是人们公认的知识表示形式,也是未来语义网的核心.但如今仍然是寥寥几个领域专家能参与本体的构建过程.笔者依托W iki技术,提出一种用户不需要很高门槛便能轻松掌握本体构建和维护的方法.

参考文献:

[1]Hepp M.,Bachlechner D.,Si or paes K.Ont o W iki:Community-driven Ont ol ogy Engineering and Ont ol ogy U sage Based on W ikis[C].I n: Pr oceedings of the2005I nternati onal Sy mposium on W ikis(W ikiSy m2005),San D iego,Calif ornia,Oct ober2005.

[2]Ca mpanini S.E.,Castagna P.,Tazz oli R.PlatypusW iki:a Se mantic W ikiW ikiW eb[C].I n:Pr oceedings of Se mantic W eb App licati ons and Pers pectives(S WAP)-1st Italian Semantic W eb Workshop,2004.

[3]Sabina Jeschke,Christian Thom sen.Collaborative Working Envir onment f or V irtual and Re mote Experi m ents in Nanoscience and Nanotechnol o2 gies[C].I n:Pr oceedings of the I nternati onal Conference on Machine Learning,Amman,Jordan,2006.

[4]Bao J.,Honavar V.Collaborative Ont ol ogy Building with a multi-agent based ont ol ogy building envir onment[C].I n:Pr oceedings of the3rd

I nternati onalWorkshop on Evaluati on of Ont ol ogy-based Tools(EON2004),H ir oshi m a,Japan,2004.

[5]Christ opher B re wster,Yorick W ilks.Ont ol ogies,Taxonom ies,Thesauri:Learning fr om Text[C].I n:Pr oceedings the U se of Computati onal L inguistics in the Extracti on of Key word I nfor mati on fr om D igital L ibrary ContentWorkshop,Kings College,London,UK,2004.

(责任编辑:王前)

An Approach of On tology Bu ild i n g Ba sed on W i k i

Y U J iang-tao,MAO Hui-zhen

(D epart m ent of Co m puter and Science,Tonghua N or m al U n iversity,Tonghua,J ilin134002,China)

Abstract:Ont ol ogies are the backbone of the Se mantic W eb.Creati on and maintenance of ont ol ogies,however,are difficult.Only a flacon ofW eb users(Domain Experts)can take part in the p r ocess of building domain ont ol ogies.W e show a p lan of ont ol ogy devel opment envir onment,adding user interfaces of ont ol ogy building t o W iki pedia,reducing entry barriers f or the partici pati on of users in the creati on and mainte2 nance of ont ol ogies.The syste m st ores,manages and shares knowledge with OWL ont ol ogies.Given e2 nough ont ol ogy in syste m as the dicti onary,we even can aut omatically create ont ol ogies using ont ol ogy learning.

Key words:ont ol ogy building;W iki;user-driven;ont ol ogy learning

2

相关文档
最新文档