基于ontology的语义检索模型架构
基于ontology的语义检索模型架构

在 图书情 报 领域 , 本体 的作 用 表现 在 : 映词 汇 反 的语义 映射 关 系和语 义 限制 :对基 于某 个 知识 组 织 体 系 的信息 资源进 行结 构化 组 织 :表示 信 息 内容 与 知 识组 织体 系之 间的链 接 ;利 用多 种模 式 表现 和理
件 工 程领 域 , 随 着 日益 庞提上 日程 。 面向对 象技术 的兴起 , 使 得 软件工 程研 究领域 也开始 认识 到领 域建 模 (o d.
m i o eig 的重 要性 。 anm d l ) n
以上 3 方面的发展都 面对 了一 个类似 的问题 . 个 即对某个领域 进行 通用概念上 的描述 。 就是要 回答 : 也
l 本体相 关理 论
11 本 体 论 的 起 源 .
在 图书 情报 领域 .本体 被 描述 为一 套关 于某 个
领 域 的术语 词表 及术语 含 义的 规范 说 明 .可 以类 似 地 理解 为一个 主题 词 表和一 个关 系集 .以方便 知识
的表达和 交流 。
本体 论 ( nooy ) 生 于 1 O tl  ̄ 诞 g 7世纪 . 源 于对万 起 物本 源 的追 问。哲 学上 的本 体论 是关 于 “ 在 ” 存 的学 问, 即世界 本质上 存在 什么 事物 ( 实体 ) 或 。
本体常应用于知识工程领 域 . 于知识的表达 、 用 共
享 和推理 ; 在人工智 能领域 , 体也成 为重 要 的技术 , 本 成 为 智 能化代 理和机 器学 习 等 的工具 :而伯 纳斯 李
( i e rL e 于 2 0 Tm B me- e ) 0 0年提 出的语 义 网 , 其关键 的 语 义理解功能也是建立在本体技术 的基础 之上的。
基于Ontology的Multi-Agent信息检索系统模型研究

《 农业网络信息》08 20 年第4期 研 究与开 发
基 于 Onoo y的 Mu iA e t tlg l g n 信息检 索 系统 t — 模 型 研 究
孙 倩 ,苗 良
( 山东农 业 大学 信息 科 学与 工程 学院 ,山东 泰 安 2 11) 708
K e wor :no main rtiv ; Onoo y; Mu t y dsI r t ere a f o l tlg li -Ag n et
1 引言
网络 已经 成 为 当今 人 们 获 取 知 识 的 主 要 来 源 ,但
2 O t oy简介 no g l
本 体 是 一 个 源 于 哲 学 的 概 念 ,即 “ 客 观 存 在 物 对 的系统 描述 ” ,后 被 人 工 智 能 界 引 入 ,最 早 将 本 体 定 义 为 “ 出构 成 相 关 领 域 词 汇 的 基 本 术 语 和 关 系 ,以 给 及 利 用 这 些 术 语 和关 系 构 成 的 规 定 这 些 词 汇 外 延 的规 则 的定义 ” 。后 来 越 来 越 多 的 人 研 究 本 体 ,给 出 了许
I r e o i rv h s is ,wih o tlg n lt- g n e h oo y lt- g n no main r tiv y tm de a e n o d rt mp o e ti sue t noo y a d mu i a e ttc n lg ,a mu i a e ti fr to ere a s se mo lb s d l o noo sp owa d n p cfc f n t n fe c o o e ta e e p an d b x mpes The mo e a mp o e te ef— n o tlg i utfr r ,a d s e ii u ci s o a h c mp n n x li e y e a l . y o r d lc n i rv h fi ce c fi o main rt e a , n a r al e h e d fte a piain. in y o n r to er v l a d c ng e ty me tt en e so h p lc to f i
语义网

【转载】自Tim Berners-Lee于1998年提出了语义网(the Semantic Web)的概念之后,就一直成为人们讨论与研究的热点。
当前国际上关于语义网的研究刚刚处于起步阶段,而我国对语义网的研究不论是从标准规范、系统试验、研究深度,还是从规模层次、具体应用方面都相对落后。
另人欣慰的是,我国学者已经认识到了语义网及其相关技术对未来互联网发展的影响,并开始着手研究语义网及其相关的关键技术与应用。
本文将从以下四个方面对我国语义网研究作综合述评: (1)基本情况,对当前国内语义网的研究情况做一总体介绍;(2)体系结构,即对语义网体系结构研究的情况;(3)关键技术,讨论对 RDF(Resource Description Framework,即资源描述框架)和Ontology(本体或本体论)的研究情况;(4)试验与应用,即当前针对语义网或利用其中的关键技术所做的具体试验与应用。
最后,在对以上四个方面的情况进行综合述评的基础上总结当前国内语义网研究的特点和存在的主要问题并指出今后主要的研究方向与重点。
1 基本概况当前对语义网的概念还没有形成统一的定义,对语义网的理解表述不一。
如语义网是“第三代Web,其目标是实现机器自动处理信息,它提供诸如信息代理、搜索代理、信息过滤等智能服务”[1];语义网“不同于现存的万维网,其数据主要供人类使用,新一代WWW中将提供也能为计算机所处理的数据,这将使得大量的智能服务成为可能”[2];语义网研究活动的目标是“开发一系列计算机可理解和处理的表达语义信息的语言和技术,以支持网络环境下广泛有效的自动推理”[3]。
语义网的创始人Tim Berners-Lee对语义网的定义如下:“语义网是一个网,它包含了文档或文档的一部分,描述了事物间的明显关系,且包含语义信息,以利于机器的自动处理”[4]。
尽管对语义网的理解与描述不同,但仍能从这些描述与理解中看出语义网的一些基本特征:(1)语义网不同于现在WWW,它是现有WWW的扩展与延伸;(2) 现有的WWW是面向文档而语义网则面向文档所表示的数据;(3) 语义网将更利于计算机“理解与处理”,并将具有一定的判断、推理能力。
基于ontology的语义检索模型架构

下几种 : 对于非结构化的大量异构资源的检索来说 , 主要是基于关键索 ( 雅 虎 ) 而 对 于结 构 化 的信 如 ; 息资 源 ( 比如 数 字 期 刊 , 文献 数 据 库 等 ) 主要 是 基 , 于相 应 的 数 据模 式 的 深 层 次 网络 资 源 检 索 … 。 目 前所 普遍 采用 的全 文 检 索技 术 , 将 用 户 的查 询 请 是 求 和全文 中的每一 个 词 进行 匹配 , 考 虑 查 询请 求 不 的语 义 , 然保 证 了查 全 率 , 是 查 准率 却 很 低 ; 虽 但 而 深层 网络 资源 检索 又需要 用户 了解查 询请 求和 系统 中数 据 的格式 , 法用 自然语 言表 达需求 , 无 也无 法处
m ent .
[ yWod ] o to sm ni r r v n t a l g aeu dr adn s utr m dl Ke rs no g e a t e ea a r u g n e tn i l y c t l i ul a n s g t cue oe r
引 言
e e ,t e te r n c n lg f n oo ,whc e eo sf m e d f o l d eEn i e r g a d Ar f i ne — v r h h oy a d t h oo yo tlg e o y ih d v lp o f l so w e g g n e n n t ca I tl r i Kn i i l i l e c ,h v h i t t r e s a d u d r tn au a ln a e,a el a e i g w t e n t rb e . i n e a e t e a l y o p o s n n esa d n t r a g g g b i c l u s w l s d a n i s ma i p o lms l h c T e eo e noo e o sa g o o li d a cn a i o a i o ai n r t e a .Un e e r s a c n c re t h r fr ,o tlg b c me o d to n a v n i g t d t n n r t er v y r i l f m o i 1 d rt e e r h o u rn h
自然语言处理及计算语言学相关术语中英对译表三_计算机英语词汇

multilingual processing system 多语讯息处理系统multilingual translation 多语翻译multimedia 多媒体multi-media communication 多媒体通讯multiple inheritance 多重继承multistate logic 多态逻辑mutation 语音转换mutual exclusion 互斥mutual information 相互讯息nativist position 语法天生假说natural language 自然语言natural language processing (nlp) 自然语言处理natural language understanding 自然语言理解negation 否定negative sentence 否定句neologism 新词语nested structure 崁套结构network 网络neural network 类神经网络neurolinguistics 神经语言学neutralization 中立化n-gram n-连词n-gram modeling n-连词模型nlp (natural language processing) 自然语言处理node 节点nominalization 名物化nonce 暂用的non-finite 非限定non-finite clause 非限定式子句non-monotonic reasoning 非单调推理normal distribution 常态分布noun 名词noun phrase 名词组np (noun phrase) completeness 名词组完全性object 宾语{语言学}/对象{信息科学}object oriented programming 对象导向程序设计[面向对向的程序设计]official language 官方语言one-place predicate 一元述语on-line dictionary 线上查询词典 [联机词点]onomatopoeia 拟声词onset 节首音ontogeny 个体发生ontology 本体论open set 开放集operand 操作数 [操作对象]optimization 最佳化 [最优化]overgeneralization 过度概化overgeneration 过度衍生paradigmatic relation 聚合关系paralanguage 附语言parallel construction 并列结构parallel corpus 平行语料库parallel distributed processing (pdp) 平行分布处理paraphrase 转述 [释意;意译;同意互训]parole 言语parser 剖析器 [句法剖析程序]parsing 剖析part of speech (pos) 词类particle 语助词part-of relation part-of 关系part-of-speech tagging 词类标注pattern recognition 型样识别p-c (predicate-complement) insertion 述补中插pdp (parallel distributed processing) 平行分布处理perception 知觉perceptron 感觉器 [感知器]perceptual strategy 感知策略performative 行为句periphrasis 用独立词表达perlocutionary 语效性的permutation 移位petri net grammar petri 网语法philology 语文学phone 语音phoneme 音素phonemic analysis 因素分析phonemic stratum 音素层phonetics 语音学phonogram 音标phonology 声韵学 [音位学;广义语音学] phonotactics 音位排列理论phrasal verb 词组动词 [短语动词]phrase 词组 [短语]phrase marker 词组标记 [短语标记]pitch 音调pitch contour 调形变化pivot grammar 枢轴语法pivotal construction 承轴结构plausibility function 可能性函数pm (phrase marker) 词组标记 [短语标记] polysemy 多义性pos-tagging 词类标记postposition 方位词pp (preposition phrase) attachment 介词依附pragmatics 语用学precedence grammar 优先级语法precision 精确度predicate 述词predicate calculus 述词计算predicate logic 述词逻辑 [谓词逻辑]predicate-argument structure 述词论元结构prefix 前缀premodification 前置修饰preposition 介词prescriptive linguistics 规定语言学 [规范语言学] presentative sentence 引介句presupposition 前提principle of compositionality 语意合成性原理privative 二元对立的probabilistic parser 概率句法剖析程序problem solving 解决问题program 程序programming language 程序设计语言 [程序设计语言] proofreading system 校对系统proper name 专有名词prosody 节律prototype 原型pseudo-cleft sentence 准分裂句psycholinguistics 心理语言学punctuation 标点符号pushdown automata 下推自动机pushdown transducer 下推转换器qualification 后置修饰quantification 量化quantifier 范域词quantitative linguistics 计量语言学question answering system 问答系统queue 队列radical 字根 [词干;词根;部首;偏旁]radix of tuple 元组数基random access 随机存取rationalism 理性论rationalist (position) 理性论立场 [唯理论观点]reading laboratory 阅读实验室real time 实时real time control 实时控制 [实时控制]recursive transition network 递归转移网络reduplication 重叠词 [重复]reference 指涉referent 指称对象referential indices 指针referring expression 指涉词 [指示短语]register 缓存器[寄存器]{信息科学}/调高{语音学}/语言的场合层级{社会语言学}regular language 正规语言 [正则语言]relational database 关系型数据库 [关系数据库]relative clause 关系子句relaxation method 松弛法relevance 相关性restricted logic grammar 受限逻辑语法resumptive pronouns 复指代词retroactive inhibition 逆抑制rewriting rule 重写规则rheme 述位rhetorical structure 修辞结构rhetorics 修辞学robust 强健性robust processing 强健性处理robustness 强健性schema 基朴school grammar 教学语法scope 范域 [作用域;范围]script 脚本search mechanism 检索机制search space 检索空间searching route 检索路径 [搜索路径]second order predicate 二阶述词segmentation 分词segmentation marker 分段标志selectional restriction 选择限制semantic field 语意场semantic frame 语意架构semantic network 语意网络semantic representation 语意表征 [语义表示] semantic representation language 语意表征语言semantic restriction 语意限制semantic structure 语意结构semantics 语意学sememe 意素semiotics 符号学sender 发送者sensorimotor stage 感觉运动期sensory information 感官讯息 [感觉信息]sentence 句子sentence generator 句子产生器 [句子生成程序]sentence pattern 句型separation of homonyms 同音词区分sequence 序列serial order learning 顺序学习serial verb construction 连动结构set oriented semantic network 集合导向型语意网络 [面向集合型语意网络]sgml (standard generalized markup language) 结构化通用标记语言shift-reduce parsing 替换简化式剖析short term memory 短程记忆sign 信号signal processing technology 信号处理技术simple word 单纯词situation 情境situation semantics 情境语意学situational type 情境类型social context 社会环境sociolinguistics 社会语言学software engineering 软件工程 [软件工程]sort 排序speaker-independent speech recognition 非特定语者语音识别spectrum 频谱speech 口语speech act assignment 言语行为指定speech continuum 言语连续体speech disorder 语言失序 [言语缺失]speech recognition 语音辨识speech retrieval 语音检索speech situation 言谈情境 [言语情境]speech synthesis 语音合成speech translation system 语音翻译系统speech understanding system 语音理解系统spreading activation model 扩散激发模型standard deviation 标准差standard generalized markup language 标准通用标示语言start-bound complement 接头词state of affairs algebra 事态代数state transition diagram 状态转移图statement kernel 句核static attribute list 静态属性表statistical analysis 统计分析statistical linguistics 统计语言学statistical significance 统计意义stem 词干stimulus-response theory 刺激反应理论stochastic approach to parsing 概率式句法剖析 [句法剖析的随机方法]stop 爆破音stratificational grammar 阶层语法 [层级语法]string 字符串[串;字符串]string manipulation language 字符串操作语言string matching 字符串匹配 [字符串]structural ambiguity 结构歧义structural linguistics 结构语言学structural relation 结构关系structural transfer 结构转换structuralism 结构主义structure 结构structure sharing representation 结构共享表征subcategorization 次类划分 [下位范畴化] subjunctive 假设的sublanguage 子语言subordinate 从属关系subordinate clause 从属子句 [从句;子句] subordination 从属substitution rule 代换规则 [置换规则] substrate 底层语言suffix 后缀superordinate 上位的superstratum 上层语言suppletion 异型[不规则词型变化] suprasegmental 超音段的syllabification 音节划分syllable 音节syllable structure constraint 音节结构限制symbolization and verbalization 符号化与字句化synchronic 同步的synonym 同义词syntactic category 句法类别syntactic constituent 句法成分syntactic rule 语法规律 [句法规则]syntactic semantics 句法语意学syntagm 句段syntagmatic 组合关系 [结构段的;组合的] syntax 句法systemic grammar 系统语法tag 标记target language 目标语言 [目标语言]task sharing 课题分享 [任务共享] tautology 套套逻辑 [恒真式;重言式;同义反复] taxonomical hierarchy 分类阶层 [分类层次] telescopic compound 套装合并template 模板temporal inference 循序推理 [时序推理] temporal logic 时间逻辑 [时序逻辑] temporal marker 时貌标记tense 时态terminology 术语text 文本text analyzing 文本分析text coherence 文本一致性text generation 文本生成 [篇章生成]text linguistics 文本语言学text planning 文本规划text proofreading 文本校对text retrieval 文本检索text structure 文本结构 [篇章结构]text summarization 文本自动摘要 [篇章摘要] text understanding 文本理解text-to-speech 文本转语音thematic role 题旨角色thematic structure 题旨结构theorem 定理thesaurus 同义词辞典theta role 题旨角色theta-grid 题旨网格token 实类 [标记项]tone 音调tone language 音调语言tone sandhi 连调变换top-down 由上而下 [自顶向下]topic 主题topicalization 主题化 [话题化]trace 痕迹trace theory 痕迹理论training 训练transaction 异动 [处理单位]transcription 转写 [抄写;速记翻译]transducer 转换器transfer 转移transfer approach 转换方法transfer framework 转换框架transformation 变形 [转换]transformational grammar 变形语法 [转换语法] transitional state term set 转移状态项集合transitivity 及物性translation 翻译translation equivalence 翻译等值性translation memory 翻译记忆transparency 透明性tree 树状结构 [树]tree adjoining grammar 树形加接语法 [树连接语法] treebank 树图数据库[语法关系树库]trigram 三连词t-score t-数turing machine 杜林机 [图灵机]turing test 杜林测试 [图灵试验]type 类型type/token node 标记类型/实类节点type-feature structure 类型特征结构typology 类型学ultimate constituent 终端成分unbounded dependency 无界限依存underlying form 基底型式underlying structure 基底结构unification 连并 [合一]unification-based grammar 连并为本的语法 [基于合一的语法] universal grammar 普遍性语法universal instantiation 普遍例式universal quantifier 全称范域词unknown word 未知词 [未定义词]unrestricted grammar 非限制型语法usage flag 使用旗标user interface 使用者界面 [用户界面]valence grammar 结合价语法valence theory 结合价理论valency 结合价variance 变异数 [方差]verb 动词verb phrase 动词组 [动词短语]verb resultative compound 动补复合词verbal association 词语联想verbal phrase 动词组verbal production 言语生成vernacular 本地话v-o construction (verb-object) 动宾结构vocabulary 字汇vocabulary entry 词条vocal track 声道vocative 呼格voice recognition 声音辨识 [语音识别]vowel 元音vowel harmony 元音和谐 [元音和谐]waveform 波形weak verb 弱化动词whorfian hypothesis whorfian 假说word 词word frequency 词频word frequency distribution 词频分布word order 词序word segmentation 分词word segmentation standard for chinese 中文分词规范word segmentation unit 分词单位 [切词单位]word set 词集working memory 工作记忆 [工作存储区]world knowledge 世界知识writing system 书写系统x-bar theory x标杠理论 ["x"阶理论]zipf's law 利夫规律 [齐普夫定律]。
基于Ontology的个性化智能知识检索模型

O toy no g 起源于 哲学 , l 指的是 客观 存在 的系统 解释 , 研究 的是 客观 现实的 抽象本 质 。在 信 息科学 中 , no g O tl y是 共 享概 念 模 型 o 的显 式的形 式 化规 范说 明 。 概 念 模 型 的 是客 观 世 界 中 一 ] 指 些 事 物或现 象的相 关慨 念的抽 象模 型 , 是人 们对 这 些 事 物或 现 象 的本质 通过 认识 活动所 形成的 认识 结 果 ; 显式 的 所 使用 的概 指 念的类 型 以及概 念使用 上的约 束都 有 明确 的 定义 ;形 式化 精 指 确的 数学描 述 , 述 的 程 度能 达 到计 算 机 可读 的水 平 ; 共 享 描 。 指 O tl y 映 的是 领域 中共 同认 可的 知 识 , no g 反 o 而不 是 某 些个 人的 知 识 。概 括地说 , no g 是 领 域 内不 同 主体 ( 、 器 、 件 系 统 O tl y o 人 机 软 等) 间进 行交流 ( 之 对话 、 互操 作 、 享等 ) 共 的语义 基 础 , no g 确 O toy l 定领 域 内共 同认 可 的词 汇 , 并以机 器 可处 理 的万 式给 出这 些词 汇 ( 术语 ) 和词 汇间 相 互关 系的 明确定 义 , 供对 领 域知 识 的 共 同理 提
搜 索 引擎 系统
信 恩孤 岛 。检 索返 回的结果 只包 含 被检 索词 的 文档 , 而不 涉 及 与其 相关 的信 息。 d 检索 结果缺 乏知 识。 同一 主题 的 相 关信 息 , 往 分布 在多 . 往
ltre 上 海量的 信 恩 仍 以 指数 级 的 速 度 增长 , 信 息 的有 nen t 给
要在 不 同独 立搜 索引擎 的检 索结 果 中挑 选所 需 要 的 内容 , 因而 对
Ontology在语义信息检索中的使用
1 】 。在信 息 目前 实用化 的信 息检 索系统 主要 基于人 工分 类 目 馆 的 系统 结构 、信 息 描述 、信 息检 索 相关 [ 录或关 键 词匹配 ,前 者对海 量信 息资 源 的揭 示效 率不 检 索方 面 ,本体 论可 以提 供语义 的知 识组织 系统 是一 高 ,深度 有 限 ;后者 在信 息 的语义 和语用 的揭示 上 有 个 特点 .另一 特点表 现在 开发 和使用 对象 方面 。本体
o nooyt edgmli ayf l,noma o te a i atua do eifr ao ra i t nadrtea f tlg t i b r e ifr t nr r v lnprc l a nt o t nog z i e i l o o h i lr i d i ei i rn h nm i n ao n rv
Vo .8 11 ,No 1 .2 De. 0 6 c 2 0
Ono g 在语义信息检索中的使用 tl y o
尹 皎 .郑 军
( 州学 院 ,浙 江 临海 台 370) 10 0
摘
要 :介 绍 了 Onoo y ( 体 论)和 语 叉 网 的概 念 ,探 讨 了本 体 论 可 被数 字 图 书馆 领 域 特 别是 信 息检 索领 域 利 用 , t g 本 l
服 务 于数 字 图书 馆 的 信 息 组 织 与 检 索方 式 。 在 检 索 方 面, 字 图书 馆储 藏 的 多为 多媒 体 的信 息, 至 是 多语 种 的 。 体 数 甚 本
论 也 可 以是 多语 种 的。 以对 多语 种 的 语 义检 索提 供 基 础 条件 。 可
关 键 词 :Ono g ; 语 艾 网 ;信 息检 索 ; tly o
基于Ontology的语义查询分析研究
2 R cnasac tf om, aj gA tlr A ae yo eP A, a n 1 12, hn . eo ni neSa o N ni rl y cd m fh L N mig2 13 C ia s fR n ie t
第 8卷第 4期
20 0 8年 1 2月
南京师范大学学报 ( 工程技术版 )
J U N L FN NIGN R A NV R IY E GN E IGA DT C N L G DSO ) O R A A J O M LU IE S ( N IE RN N E H O O YE I N O N T
似度算法 , 通过对用户输入关键字词义特性 和本体实例之 间语义关联强弱的分析 , 提高了用户输入关键字 到本体概念映射 的完 整性 和准确率 , 保证了用户查询和检索语 言在语义上 的一致性 , 提升 了查询的满意度.
[ 键 词 ] 本体 , 关 查询分析 , , 检索 语义 信息
[ 中图分类号]T 0 [ P3 1 文献标识码 ]A [ 文章编号 ]6 219 ( 0 8 0 -0 30 17 .2 2 2 0 )40 6 -5
4 A tlr C lmao t om , 3 6 ro f h L N nig 1 2 hn . rl y ol t nSa R o ie i i t f 7 6 6Topo eP A, aj 1 ,C ia t n 2 13 5 C m a E p r na C ne N nigA m o madC l g f h L N nig20 4 ,C ia . o bt xei t e t me l r,aj r yC m e t n
基于本体语义信息检索及其在过程教学管理系统中应用
浅谈基于本体的语义信息检索及其在过程教学管理系统中的应用摘要:本文主要在对语义网和本体技术进行了解的基础上,构建了基于本体的语言信息检索框架:主要包括问题构建模块、文档处理模块、用户查询模块以及信息检索模块。
尝试应用在在基于数据挖掘的过程教学管理系统中。
关键词:语义;本体;信息检索;过程教学管理中图分类号:tp311伴随着计算机的不断发展和技术领域深入的研究,发现利用语义检索可以加快访问速度和准确性,因此基于本体的语义信息检索技术得到了不断地发展。
通过对国内外的检索技术的了解,其主要包括全文检索、数据检索、ontology检索等多种检索方式。
而现在重点研究的技术是ontology检索技术,它是在语义上的一种模型技术。
研究过程中发现本体本身具有非常好的概念层次,乃至在概念之间建立起来的非常丰富复杂语义联系的能力。
理解本体的含义在语义检索中也是非常重要的。
在一定的领域里,本体可以形成相应的知识体系。
1 语义网和本体技术1.1 语义网及其体系结构语义网的基础是人工智能技术与xml技术紧密的结合,它的运作步骤是将传统的信息数据加以处理,并且将其添加各类辅助的标签、备注和一部分数据的关联信息等,其中涉及了xml语言的语义标注技术及标签类别定义[1]。
1.2 本体描述语言及编辑工具2 解析信息检索框架(1)第一模块:构建模块。
本体构建部分是语义检索的基础,是框架中的资源存储核心。
模块的功能就是确保资源的一致性和完好性,随着领域知识的不断变化和发展,将领域本体库进行不断的更新和补充,来保证领域本体库中资源相关概念的新鲜度。
(2)第二模块:文档处理模块。
文档处理模块其主要功能为语义标注和构建索引。
工作流程是将领域资源文档中的相应的概念和实体与领域本体进行匹配,并且进行语义的标注。
将标注后的领域本体采用高速算法进行排序。
并建立索引库。
(3)第三模块:用户查询模块。
用户查询模块的主要功能是将用户的查询信息进行查理,根据不同用户的要求将查询信息进行相应的扩展。
基于Ontology的个性化语义检索系统研究
图书 馆数 字 化 技 术平 台
●翁畅 平 ,沈 娟 (徽 学管 学 , 肥 20 ) 安 大 理 院 合 3 3 09
基于 O toy n l 的个Fra bibliotek化语义检索系统研究 og
[ 键 词] O toy 个性化 ;语义检索 ; 关 no g; l 命名 实 体 ;用 户兴 趣 模 型 [ 摘 要] 在 分析 现 有 基 于关键 词 检 索 的 常 用检 索 工 具 诸 多缺 陷 的 基 础 上 ,通 过
()未 解 决 好 “ 义 多 词 ” 问题 。基 于 关 键 词 匹 2 一
()“ 念模 型 ” 1 概 ,指 通过 抽 象 出客 观 世 界 中一 些 现 象 的相 关 概念 而 得 到 的模 型 ; () 所 使 用 的概 念 以 及使 用 这 些 概念 的约 束 都 有 2
明确 的定 义 ;
2 Onoo y技 术 的 引入 tlg
个 性 化 语 义 检 索 系统 的 基 本 框 架 ,阐 述 基
于 Onoo y个 性 化 语 义检 索 系统 的 工 作 流 tlg
程 和 各 组 成 部 分 功 能 ,并 对 该 检 索 系统 实
现 的 关键技 术作 出分析 。
[ 中图分 类 号 ]G 5 34 [ 献标 志 码 ]A 文
i s 和 实 例 ( s ne) 这 5种元 素表 达 O toy o ) a t i t cs na n l 中 og 的知识 ,使 其 具 有 逻辑 推 理 和语 义识 别 功 能 ,帮 助 检
() “ 1 忠实 表 达 ” 问题 。 大 多 数 检 索 服 务 界 面 … 由分类 目录 或检 索 框 组成 ,单 调 统 一 ,用 户 很 难 通 过 若 干个 关 键 词或 关 键 词 串 忠实 地 表 达他 所 真 正 需 要 检 索 的 内容 。表 达 困难 导致 检 索 困难 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在图书情报领域 , 本体 的作用表现在 / 反映词汇的语 义 3 1 : 映射关系和语义 限制 ; 对基于某个知识组织体系 的信息 资源 进行结构化组织 ;表 示信息 内容与 知识 组织体 系之间 的链 接; 利用多种模式表现 和理解 信息集合 ; 支持跨语 种检索 和 糟能检索等。
【 类 号]P 9 . 分 T 31 3
目前的互联网信息检索方式 ,大致可 以归为 以下几种 : 对于非结构化 的大量异构资源的检索来说 , 主要是基 于关键 词 如雅
虎 )而对 于结构 化的信息资源 ( ; 比如数字期刊 、 文献数据库 等) ,主要是基于相应 的数据模式的深层次网络资源检索『 l 1 。 目 前所普遍采用 的全文检索技术 , 是将用户的查 询请求 和全 文 中的每一个词进 行匹配 , 不考虑查询请求 的语义 , 虽然保 证 了查全率 , 但是查准率却很 低 ; 而深层 网络资源检索又需 要用 户了解查询请求和系统中数据 的格式 , 无法用 自然语言 表达需求 , 也无法处理复杂语义关系。 当前 ,e 信息资源呈现爆 炸式增长趋势 , wb 用户对 于信息 检索 的要求也越来越高 , 传统 的各种信息检索技术 已经很难 满足这种要求 。未来 的互联 网作为人类 的信息库 、 知识库 , 应 该支持用户以 自然语 言的方式表达检索请求 , 并且具备理解
自然语言理解 问题和 具有基于语义的推理机制, 因此成为改进传统信息检 索方式的 良好 工具。本文就运 用本体理论 . 在对 目前的各种研 究进行 了调 查以后 , 区别了几个关键的容易混淆的概念 , 然后提 出了一个基于 0 t0 的、 e no 1 w b环境
下的语义检 索 系统的结构模型。 【 关键词】 本体 语 义检 索 自然语言理解 结构模型
【 摘 要】 前的 wb 目 e 信息检 索 中, 着 索效率低 下的 问题 , 难满足普 通用户基 于 自然语 言的检 索要求 。 存在 检 很 也
不具备 语 义 推 理 能 力 , 法 实现 智 能 化 的检 索。 而 源 于知 识 工程 和 人 工 智 能领 域 的 本体 理 论 和技 术 , 够 很 好 地 处 理 无 能
础 之 上 的② 。
1 本体 相关理论
1 本 . 体论的起源 1
本体论 ( n0 g① 诞生于 1世纪 , 源于对万物本 源的 0 tl ) ) 0r 7 起 追问 。哲学上的本体论是关于“ 存在” 的学问 , 即世界本质上 存在什么事物 ( 或实体 ) 。 在人工智能领域 , 了减少“ 为 知识工程” ko l g ni (nwe eeg— d neig 中构建知识库的代价 , er ) n 出现 了知识的复用技术。通过 复用 , 系统开发者可 以在 已有知识基础上 更加专 注于几个特 定领域的知识构建。同时 , 数据库 管理系统( B ) D MS 研究领域 也发 现 , 早期数据 库的概念模 型是 专门化的 , 导致 了数据库 的不一致性 , 使得数据集成和共享变得非常困难 。另外 , 在软 件工程领 域 , 伴随着 日益庞大和 复杂的应用 , 程序维护和重 用性 的问题提上 口程。面向对象技术的兴起 , 使得软件工程 研究领域也 开始认识到领域建模 (o anm d l g dm i 0 en )的重要 i
语义和 自动扩展 、 联想 的能力 , 更能够支持问答式 、 对话式 的 智能化检索 。 针对这 一问题 。 本体的理论 和相关技术成 为近年来在人 工智能 、 知识工程和信息检索等领域的研究 热点。笔者提 出 个基于叽tl y o g的检索系统 的结构模型 , o 分析其在支持 自然 语言的理解 和语义层面的智能化检索中的功能。
维普资讯
图书馆学刊
2 0 年第 6 06 期
| USH UG U AN X U E KA N O . 2 06 r N 6. 0
基子 o tl ̄ noo ;的语 义检 索模 型架构
焦玉英 张 璐
( 武汉大学信息管理学院, 湖北 武汉 4本体 与几个常用概念 的比较
在研究 当前有关本体和语义检索 的各种文献 的过程中 , 发现了许 多相似 的容易混同的概念 ,比如本体 和叙词表 , 本 体与语义 网络 , 本体 、 语义检索和概念空间 , 基于0tl y no g 的检 o 索与基于概念的检索 。不同的文献 在使用这些概念 时会 产生 些混乱 , 在此稍作解释分析 。
一
不少人对其进行了修改 。目前最广为接受的定义是 :本体是 “ 对共享概念模 型的形式化的明确的描 述” 。这一定义说 明本 体有四个 方面的特征(t e : 明确性 : S dr ① u ) 本体所使用 的概念 及其上位类 。以及 限制条件都应该预先 得到 明确 定义和说 明 。②形式化 : 的表示形式应该是机器可读 的。③共享 本体 性: 在一个 本体 中, 知识所表达 的观点 、 观念 应该具有共 性 , 是为整个领域的群体所接受的。 ④概念化 : 又称“ 概念模型” , 指本体是对客观世界 中的某些现象的抽象模式 , 该模式定义 了现象间 的相关概念 。 在 图书情 报领域 , 体被描 述为 一套 关于某 个领 域 的 本 术语词 表及术语 含义 的规范说 明 , 以类 似地 理解 为一个 可 主题词 表和一个 关系 集 , 以方便 知识 的表 达 和交 流 。 本体 常应用于知识工程领域 , 于知识 的表达 、 用 共享 和 推理 ; 在人工智能领域 , 本体也成为重要 的技术 , 成为智能化 代理和机器学 习等 的工具 ;而Tm B me— e于2 0 年提 出 i e rL e 0 0 的语 义网, 其关键 的语 义理解功能也是建立在本体技术 的基