基于ontology的语义检索模型架构

合集下载

基于Ontology的业务过程知识需求建模

基于Ontology的业务过程知识需求建模

维普资讯
建萍


基于 O t oy no g 的业务过程知识需求建模 l
6 3
基 于 Onoo y的 业务 过程 知 识 需 求 建模 tlg
卞建 萍 , 谢 强
( 南京航空航天大学 计算机应用研究所 , 江苏 南京 2 0 1) 10 6
摘要 : 企业人 员在 业 务过 程 中如何 获得 所 需的知 识 , 当前 企 业 中存在 的 一 个 重要 问题 。在 分 析 是
图 l 企 业 知 识 集 成框 架
由 图 1 以看 出 , 可 每个 概念 是 对不 同的知 识源 进行 描 述 , 体 层 实 际 上 对 多 个 知 识 源 进 行 了描 本
述 。这样做的好处是概念之 间的关 系实际上体 现
了知识 源之 间 的关 系 , 于业务 过程 中进 行快 捷 的 便
搜索关联知识源 , 提高工作效率 。
1 2 知 识 源 的 Onoo y描 述 . tlg
个扩展的工作流元模型和相应的知识流建模方法, 主要从知 识流 的 角度 通 过 5类 知 识 流 单 元 来 对 组
织 知识传 递 和重用 、 员 间的协 作 与交 流进行 系统 人 地 表示 。本文 在分 析 企 业 知识 Onooy集 成 的 基 tl g 础上 , 了业务 过 程 知 识 建 模 的 需 要 , 出知 识 包 为 提
收稿 日期 :0 6—0 20 5—3 0
保 存 的知识 。知识 源基 表 中保 存 了知 识源 类 别 、 路 径 、 务 器 名 称 等信 息 。根 据 知 识 源 的类 别 , 服 对应 的知识 源基 表 中进 行 不 同的处 理 : 如果 概 念 的知识
源是以文本形式存储的 , 则直接保存对应的文档路 径; 如果 是 以数 据 库 形 式 存 储 的 , 保 存 对应 数 据 则 库 服务 器名 、 据 库 名 称 、 户 帐号 及 密 码 等 。R 数 用

基于Ontology的Multi-Agent信息检索系统模型研究

基于Ontology的Multi-Agent信息检索系统模型研究
维普资讯
《 农业网络信息》08 20 年第4期 研 究与开 发
基 于 Onoo y的 Mu iA e t tlg l g n 信息检 索 系统 t — 模 型 研 究
孙 倩 ,苗 良
( 山东农 业 大学 信息 科 学与 工程 学院 ,山东 泰 安 2 11) 708
K e wor :no main rtiv ; Onoo y; Mu t y dsI r t ere a f o l tlg li -Ag n et
1 引言
网络 已经 成 为 当今 人 们 获 取 知 识 的 主 要 来 源 ,但
2 O t oy简介 no g l
本 体 是 一 个 源 于 哲 学 的 概 念 ,即 “ 客 观 存 在 物 对 的系统 描述 ” ,后 被 人 工 智 能 界 引 入 ,最 早 将 本 体 定 义 为 “ 出构 成 相 关 领 域 词 汇 的 基 本 术 语 和 关 系 ,以 给 及 利 用 这 些 术 语 和关 系 构 成 的 规 定 这 些 词 汇 外 延 的规 则 的定义 ” 。后 来 越 来 越 多 的 人 研 究 本 体 ,给 出 了许
I r e o i rv h s is ,wih o tlg n lt- g n e h oo y lt- g n no main r tiv y tm de a e n o d rt mp o e ti sue t noo y a d mu i a e ttc n lg ,a mu i a e ti fr to ere a s se mo lb s d l o noo sp owa d n p cfc f n t n fe c o o e ta e e p an d b x mpes The mo e a mp o e te ef— n o tlg i utfr r ,a d s e ii u ci s o a h c mp n n x li e y e a l . y o r d lc n i rv h fi ce c fi o main rt e a , n a r al e h e d fte a piain. in y o n r to er v l a d c ng e ty me tt en e so h p lc to f i

基于知网的词汇语义相似度计算1

基于知网的词汇语义相似度计算1

我们的工作主要包括: 1. 研究《知网》中知识描述语言的语法,了解其描述一个词义所用的多个义 原之间的关系,区分其在词语相似度计算中所起的作用;我们采用一种更
1 *
+
本项研究受国家重点基础研究计划(973)支持,项目编号是 G1998030507-4 和 G1998030510。 北京大学计算语言学研究所 & 中国科学院计算技术研究所 E-mail: liuqun@ Institute of Computational Linguistics, Peking University & Institute of Computing Technology, Chinese Academy of Science 中国科学院计算技术研究所 E-mail: lisujian@ Institute of Computing Technology, Chinese Academy of Sciences
基于《知网》的词汇语义相似度计算1 Word Similarity Computing Based on How-net
刘群* ﹑李素建+
Qun LIU , Sujian LI
摘要
词义相似度计算在很多领域中都有广泛的应用,例如信息检索、信息抽取、文 本分类、词义排歧、基于实例的机器翻译等等。词义相似度计算的两种基本方 法是基于世界知识(Ontology)或某种分类体系(Taxonomy)的方法和基于统 计的上下文向量空间模型方法。这两种方法各有优缺点。 《知网》是一部比较详尽的语义知识词典,受到了人们普遍的重视。不过,由 于《知网》中对于一个词的语义采用的是一种多维的知识表示形式,这给词语 相似度的计算带来了麻烦。这一点与 WordNet 和《同义词词林》不同。在 WordNet 和《同义词词林》中,所有同类的语义项(WordNet 的 synset 或《同 义词词林》的词群)构成一个树状结构,要计算语义项之间的距离,只要计算 树状结构中相应结点的距离即可。而在《知网》中词汇语义相似度的计算存在 以下问题: 1. 2. 每一个词的语义描述由多个义原组成; 词语的语义描述中各个义原并不是平等的,它们之间有着复杂的关系,通 过一种专门的知识描述的词汇语义相似度计算

基于ontology的语义检索模型架构

基于ontology的语义检索模型架构
性。 以上三个方 面的发展都面对了一个类似的问题 , 即对某 个领域进行通 用概念上 的描 述 , 就是 要 回答 : 也 某个领域 内
在图书情报领域 , 本体 的作用表现在 / 反映词汇的语 义 3 1 : 映射关系和语义 限制 ; 对基于某个知识组织体系 的信息 资源 进行结构化组织 ;表 示信息 内容与 知识 组织体 系之间 的链 接; 利用多种模式表现 和理解 信息集合 ; 支持跨语 种检索 和 糟能检索等。
【 类 号]P 9 . 分 T 31 3
目前的互联网信息检索方式 ,大致可 以归为 以下几种 : 对于非结构化 的大量异构资源的检索来说 , 主要是基 于关键 词 如雅
虎 )而对 于结构 化的信息资源 ( ; 比如数字期刊 、 文献数据库 等) ,主要是基于相应 的数据模式的深层次网络资源检索『 l 1 。 目 前所普遍采用 的全文检索技术 , 是将用户的查 询请求 和全 文 中的每一个词进 行匹配 , 不考虑查询请求 的语义 , 虽然保 证 了查全率 , 但是查准率却很 低 ; 而深层 网络资源检索又需 要用 户了解查询请求和系统中数据 的格式 , 无法用 自然语言 表达需求 , 也无法处理复杂语义关系。 当前 ,e 信息资源呈现爆 炸式增长趋势 , wb 用户对 于信息 检索 的要求也越来越高 , 传统 的各种信息检索技术 已经很难 满足这种要求 。未来 的互联 网作为人类 的信息库 、 知识库 , 应 该支持用户以 自然语 言的方式表达检索请求 , 并且具备理解
自然语言理解 问题和 具有基于语义的推理机制, 因此成为改进传统信息检 索方式的 良好 工具。本文就运 用本体理论 . 在对 目前的各种研 究进行 了调 查以后 , 区别了几个关键的容易混淆的概念 , 然后提 出了一个基于 0 t0 的、 e no 1 w b环境

基于ontology的语义检索模型架构

基于ontology的语义检索模型架构

下几种 : 对于非结构化的大量异构资源的检索来说 , 主要是基于关键索 ( 雅 虎 ) 而 对 于结 构 化 的信 如 ; 息资 源 ( 比如 数 字 期 刊 , 文献 数 据 库 等 ) 主要 是 基 , 于相 应 的 数 据模 式 的 深 层 次 网络 资 源 检 索 … 。 目 前所 普遍 采用 的全 文 检 索技 术 , 将 用 户 的查 询 请 是 求 和全文 中的每一 个 词 进行 匹配 , 考 虑 查 询请 求 不 的语 义 , 然保 证 了查 全 率 , 是 查 准率 却 很 低 ; 虽 但 而 深层 网络 资源 检索 又需要 用户 了解查 询请 求和 系统 中数 据 的格式 , 法用 自然语 言表 达需求 , 无 也无 法处
m ent .
[ yWod ] o to sm ni r r v n t a l g aeu dr adn s utr m dl Ke rs no g e a t e ea a r u g n e tn i l y c t l i ul a n s g t cue oe r
引 言
e e ,t e te r n c n lg f n oo ,whc e eo sf m e d f o l d eEn i e r g a d Ar f i ne — v r h h oy a d t h oo yo tlg e o y ih d v lp o f l so w e g g n e n n t ca I tl r i Kn i i l i l e c ,h v h i t t r e s a d u d r tn au a ln a e,a el a e i g w t e n t rb e . i n e a e t e a l y o p o s n n esa d n t r a g g g b i c l u s w l s d a n i s ma i p o lms l h c T e eo e noo e o sa g o o li d a cn a i o a i o ai n r t e a .Un e e r s a c n c re t h r fr ,o tlg b c me o d to n a v n i g t d t n n r t er v y r i l f m o i 1 d rt e e r h o u rn h

基于Ontology的个性化智能知识检索模型

基于Ontology的个性化智能知识检索模型

O toy no g 起源于 哲学 , l 指的是 客观 存在 的系统 解释 , 研究 的是 客观 现实的 抽象本 质 。在 信 息科学 中 , no g O tl y是 共 享概 念 模 型 o 的显 式的形 式 化规 范说 明 。 概 念 模 型 的 是客 观 世 界 中 一 ] 指 些 事 物或现 象的相 关慨 念的抽 象模 型 , 是人 们对 这 些 事 物或 现 象 的本质 通过 认识 活动所 形成的 认识 结 果 ; 显式 的 所 使用 的概 指 念的类 型 以及概 念使用 上的约 束都 有 明确 的 定义 ;形 式化 精 指 确的 数学描 述 , 述 的 程 度能 达 到计 算 机 可读 的水 平 ; 共 享 描 。 指 O tl y 映 的是 领域 中共 同认 可的 知 识 , no g 反 o 而不 是 某 些个 人的 知 识 。概 括地说 , no g 是 领 域 内不 同 主体 ( 、 器 、 件 系 统 O tl y o 人 机 软 等) 间进 行交流 ( 之 对话 、 互操 作 、 享等 ) 共 的语义 基 础 , no g 确 O toy l 定领 域 内共 同认 可 的词 汇 , 并以机 器 可处 理 的万 式给 出这 些词 汇 ( 术语 ) 和词 汇间 相 互关 系的 明确定 义 , 供对 领 域知 识 的 共 同理 提
搜 索 引擎 系统
信 恩孤 岛 。检 索返 回的结果 只包 含 被检 索词 的 文档 , 而不 涉 及 与其 相关 的信 息。 d 检索 结果缺 乏知 识。 同一 主题 的 相 关信 息 , 往 分布 在多 . 往
ltre 上 海量的 信 恩 仍 以 指数 级 的 速 度 增长 , 信 息 的有 nen t 给
要在 不 同独 立搜 索引擎 的检 索结 果 中挑 选所 需 要 的 内容 , 因而 对

Ontology在语义信息检索中的使用

Ontology在语义信息检索中的使用

1 】 。在信 息 目前 实用化 的信 息检 索系统 主要 基于人 工分 类 目 馆 的 系统 结构 、信 息 描述 、信 息检 索 相关 [ 录或关 键 词匹配 ,前 者对海 量信 息资 源 的揭 示效 率不 检 索方 面 ,本体 论可 以提 供语义 的知 识组织 系统 是一 高 ,深度 有 限 ;后者 在信 息 的语义 和语用 的揭示 上 有 个 特点 .另一 特点表 现在 开发 和使用 对象 方面 。本体
o nooyt edgmli ayf l,noma o te a i atua do eifr ao ra i t nadrtea f tlg t i b r e ifr t nr r v lnprc l a nt o t nog z i e i l o o h i lr i d i ei i rn h nm i n ao n rv
Vo .8 11 ,No 1 .2 De. 0 6 c 2 0
Ono g 在语义信息检索中的使用 tl y o
尹 皎 .郑 军
( 州学 院 ,浙 江 临海 台 370) 10 0

要 :介 绍 了 Onoo y ( 体 论)和 语 叉 网 的概 念 ,探 讨 了本 体 论 可 被数 字 图 书馆 领 域 特 别是 信 息检 索领 域 利 用 , t g 本 l
服 务 于数 字 图书 馆 的 信 息 组 织 与 检 索方 式 。 在 检 索 方 面, 字 图书 馆储 藏 的 多为 多媒 体 的信 息, 至 是 多语 种 的 。 体 数 甚 本
论 也 可 以是 多语 种 的。 以对 多语 种 的 语 义检 索提 供 基 础 条件 。 可
关 键 词 :Ono g ; 语 艾 网 ;信 息检 索 ; tly o

基于Ontology的语义查询分析研究

基于Ontology的语义查询分析研究
( .ntueo o adA t t n L nvri f cec n ehoo , aj g 10 7 hn ; 1Istt f mm n uo i ,P A U iesyo i eadTc nlg N ni 0 ,C ia i C ma o t S n y n21
2 R cnasac tf om, aj gA tlr A ae yo eP A, a n 1 12, hn . eo ni neSa o N ni rl y cd m fh L N mig2 13 C ia s fR n ie t
第 8卷第 4期
20 0 8年 1 2月
南京师范大学学报 ( 工程技术版 )
J U N L FN NIGN R A NV R IY E GN E IGA DT C N L G DSO ) O R A A J O M LU IE S ( N IE RN N E H O O YE I N O N T
似度算法 , 通过对用户输入关键字词义特性 和本体实例之 间语义关联强弱的分析 , 提高了用户输入关键字 到本体概念映射 的完 整性 和准确率 , 保证了用户查询和检索语 言在语义上 的一致性 , 提升 了查询的满意度.
[ 键 词 ] 本体 , 关 查询分析 , , 检索 语义 信息
[ 中图分类号]T 0 [ P3 1 文献标识码 ]A [ 文章编号 ]6 219 ( 0 8 0 -0 30 17 .2 2 2 0 )40 6 -5
4 A tlr C lmao t om , 3 6 ro f h L N nig 1 2 hn . rl y ol t nSa R o ie i i t f 7 6 6Topo eP A, aj 1 ,C ia t n 2 13 5 C m a E p r na C ne N nigA m o madC l g f h L N nig20 4 ,C ia . o bt xei t e t me l r,aj r yC m e t n
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

在 图书情 报 领域 , 本体 的作 用 表现 在 : 映词 汇 反 的语义 映射 关 系和语 义 限制 :对基 于某 个 知识 组 织 体 系 的信息 资源进 行结 构化 组 织 :表示 信 息 内容 与 知 识组 织体 系之 间的链 接 ;利 用多 种模 式 表现 和理
件 工 程领 域 , 随 着 日益 庞提上 日程 。 面向对 象技术 的兴起 , 使 得 软件工 程研 究领域 也开始 认识 到领 域建 模 (o d.
m i o eig 的重 要性 。 anm d l ) n
以上 3 方面的发展都 面对 了一 个类似 的问题 . 个 即对某个领域 进行 通用概念上 的描述 。 就是要 回答 : 也
l 本体相 关理 论
11 本 体 论 的 起 源 .
在 图书 情报 领域 .本体 被 描述 为一 套关 于某 个
领 域 的术语 词表 及术语 含 义的 规范 说 明 .可 以类 似 地 理解 为一个 主题 词 表和一 个关 系集 .以方便 知识
的表达和 交流 。
本体 论 ( nooy ) 生 于 1 O tl  ̄ 诞 g 7世纪 . 源 于对万 起 物本 源 的追 问。哲 学上 的本 体论 是关 于 “ 在 ” 存 的学 问, 即世界 本质上 存在 什么 事物 ( 实体 ) 或 。
本体常应用于知识工程领 域 . 于知识的表达 、 用 共
享 和推理 ; 在人工智 能领域 , 体也成 为重 要 的技术 , 本 成 为 智 能化代 理和机 器学 习 等 的工具 :而伯 纳斯 李
( i e rL e 于 2 0 Tm B me- e ) 0 0年提 出的语 义 网 , 其关键 的 语 义理解功能也是建立在本体技术 的基础 之上的。
将本 体 (noo y 与叙 词表 、 义 网络 、 义检 索和概 念 空 间等 几个 容 易混 淆 的概念 进 行 比较 , o t1g ) 语 语
目前 网络 信息 检索 方式 ,大致 可 以归为 以下 几 种 : 于 非结 构化 的大量 异构 资 源 的检索 来说 , 要 对 主 是 基 于关 键词 的搜 索 引 擎 ( gol、 度 等 ) 如 og 百 e 技术 和 分类 主题 检 索 ( 雅虎 ) 而 对 于 结 构 化 的信 息 资 如 ; 源( 如数 字期 刊 、 献数 据库 等 ) 主 要是基 于相 应 的 文 ,
义是 :本 体 是对 共享概 念模 型 的形式 化 的 明确 的描 “ 述” 。这一 定义说 明本体有 4 个方 面的特 征(tdr : Su e) ●明确性 : 本体所 使 用 的概念 及其 上 位类 . 以及 限制 条件 都应该 预先 得到 明确定义 和说 明 :
当前 , b信 息资源 呈现 爆 炸式增 长趋 势 . We 用户 对信 息检 索 的要求也 越来 越高 ,传统 的 各种信 息检
索技 术 已经很难 满足 这种 要 求 。未来 的 因特 网作 为 人 类 的信息 库 、 知识 库 . 该支 持 用户 以 自然语 言 的 应
方 式表 达检 索请 求 , 且具 备 理解 语义 和 自动扩 展 、 并 联 想 的能力 . 支持 问答式 、 话 式 的智 能化检索 。 对
针对 这一 问题 ,本 体 的理 论 和相关 技术 成为 近
●形式 化 : 本体 的表示 形式 应该 是机 器 可读 的 : ●共 享性 : 在一 个 本 体 中 , 识所 表 达 的观 点 、 知
观念 应该具 有共性 , 为整 个领 域 的群体 所接 受 的 : 是 ●概念 化 : 又称 “ 概念模 型 ” 指 本体 是对 客 观世 . 界 中的某 些现 象的抽 象模 式 .该模 式 定义 了现象 间
数据 模式 的深 层次 网络 资源 检索 。 目前 普遍 采用 的
全 文检索 技术 .是将 用 户 的查 询请 求和 全文 中的 每

某个领域 内 , 本质上存在哪些对象 、 过程 、 和关系 : 属性
对象之 间有何联系。这正是本体论所研究的 内容。
1 . 本 体 的 概 念 和 应 用 领 域 2
在人 工智 能领 域 . 了减 少 “ 识工 程 ” k o 1 为 知 (n w . e g n i eig 中构 建 知识 库 的 代价 . d ee gn r ) e n 出现 了知 识 的复用 技术 。 通过 复用 . 系统开 发者 可 以在 已有 知识 基 础上更 加专 注 于几个 特 定领 域 的知识构建 。 同时 . 数 据库 管理 系统 ( B S 研 究 领域也 发 现 , 期数据 DM ) 早
的相关概 念 。
年 来在人 工 智能 、知 识工 程 和信息 检索 等领 域 的研
究 热点 。 文提 出一个 基 于 o t oy 本 体 ) 本 no g ( l 的检索 系 统 的结构 模 型 ,分 析其 在支 持 自然 语言 的理解 和语 义 层面 的智 能化检索 中 的功 能 。
维普资讯
第 1 O期 ( 18期 ) 总 0
情 报 探 索
20 0 6年 1 0月
基于 o tlg 的语义检索模型架构 no y o
焦 玉英 张 璐
40 7 ) 3 0 2 ( 汉 大 学信 息 管理 学 院 湖 北 武
摘 要
提 出了一个基 于 o tlg noo y的语 义检 索 系统的 结构模 型。 关键 词 本 体 语 义检 索 自然语 言理解 结构模 型
个 词进 行 匹配 . 考虑 查 询请 求 的语 义 , 然保证 不 虽
了查 全率 , 但是 查准 率却 很低 ; 深层 网络 资 源检索 而 又 需要 用 户 了解 查询 请 求 和 系统 中数 据 的格 式 . 无
法用 自然语 言表达 需求 . 也无 法处 理复 杂语义关 系。
斯坦福大学 的 T G u e(9 3 最早提 出本体的定 ・ rb r1 9 ) 义, 其后不 少人对其进行 了修 改。目前最广为接受的定
相关文档
最新文档