一种基于本体论的智能搜索Agent
基于本体论的信息检索技术研究

基于本体论的信息检索技术研究随着互联网的快速发展,信息检索成为人们获取信息的主要方式之一。
然而,传统的文本搜索技术在处理信息检索过程中存在一些问题,如结果精度低、关键词表述不全面等。
因此,人们开始探索新的信息检索技术,其中基于本体论的信息检索技术引起了广泛关注。
什么是本体论?本体论是一种描述知识、概念之间关系的形式化语言,用于描述知识组成的领域,并以图形化方式展示出这些实体之间的关系。
本体论是人工智能领域的一部分,主要应用于知识表示、信息集成、语义网等方面。
基于本体论的信息检索技术是什么?基于本体论的信息检索技术主要是通过构建本体来优化文本检索的过程。
在传统的文本搜索技术中,检索结果是基于词频和文档相似度来确定的,而在基于本体论的信息检索技术中,检索结果不仅仅基于关键词匹配,还考虑了实体之间的语义关系和关键词的上下文含义等。
基于本体论的信息检索技术如何实现?基于本体论的信息检索技术主要包括以下几个步骤:一、构建本体构建本体是基于本体论的信息检索技术的第一步。
在本体的构建过程中,需要将领域内的实体描述清楚,并定义它们之间的概念、属性和关系等。
构建本体的目的是将领域内的知识体系化,以实现对文本信息的更准确的表示和检索。
二、语义标注语义标注指的是在文本中标注实体、概念和属性等信息,以便计算机能够识别文本中实体之间的语义关系。
语义标注技术可分为基于规则和基于机器学习的方法。
三、概念扩展概念扩展是指将与搜索关键词相关的实体和概念扩展到领域本体中。
这个过程是基于本体的,可以通过本体中定义的属性和关系来进行实体的扩展。
四、查询扩展查询扩展是指用检索系统自动生成的语义关联词条来扩展查询词。
通过查询扩展,可以从查询感兴趣的实体或者名称扩展到它们的近义词、关联词,准确地提取相关文本信息。
五、检索结果排序在基于本体论的信息检索技术中,检索结果的排序是根据查询词和扩展后的查询词与领域本体中实体或者概念之间的相关度来进行的,从而提高了搜索结果的准确性。
基于本体的语义信息检索研究共3篇

基于本体的语义信息检索研究共3篇基于本体的语义信息检索研究1随着互联网规模的不断扩大和人们对信息获取的需求不断增加,信息检索技术的研究和发展日益受到重视。
传统的文本检索方法主要关注于词汇的匹配,然而,随着语义网络的不断发展,人们更加关注语义信息检索。
基于本体的语义信息检索即是基于本体技术实现的语义信息检索。
本体是描述认识领域概念、属性和关系的模型,常常用于知识表示和语义信息的处理和检索。
基于本体的语义信息检索有别于传统的文本检索方法,它采用了语义计算技术将词汇转换为概念,然后利用本体进行语义匹配,从而实现精准的检索结果。
与传统的文本检索方法相比,基于本体的语义信息检索具有一些显著的优点:第一,实现了概念级别的检索。
传统的文本检索方法是基于关键字的匹配,而基于本体的语义信息检索是基于概念的匹配,搜索面更加广泛,可以进行满足需求的细粒度检索。
第二,提高了检索结果的准确性。
基于本体的语义信息检索不仅可以检索到与查询意图高度相关的信息,还可以同时检索到与查询意图相关但表述方式不同的信息,大大提高了检索结果的准确性。
第三,自动化程度高,能够自动地对查询语句进行语义分析和语义推理。
这一点在处理语言表述多样化的查询时尤为重要,规避了传统文本检索方法因语言多样化而给检索过程带来的不便。
基于本体的语义信息检索技术已经在多个领域得到了广泛的应用,如谷歌、百度等搜索引擎遵循这种检索模式,通过本体挖掘信息的关联性和语义,实现了搜索引擎的智能化。
此外,基于本体的语义信息检索还被应用于知识管理、智能问答系统、智能推荐等多个领域。
尽管基于本体的语义信息检索在理论和实践中取得了许多进展,但它仍面临着一些挑战:第一,本体的建立需要大量的领域知识和专业技能,光靠静态地建立本体往往难以适应快速变化的环境。
为此,研究者可以动态调整本体,将人工干预和自动学习相结合。
第二,理解查询语句需要具备高度的自然语言处理能力,而现有自然语言处理技术的表现通常无法让人满意。
智能体与对抗搜索

第一类:环境独立于智能体本身的变化情况的信息 第二类:智能体的行动如何影响环境的信息
这些关于环境如何变化的知识就是模型
基于目标的智能体(1)
Agent State How the world evolves What the world is like now Environment What it will be like if I do action A Sensors
基于效用的智能体(1)
Agent State How the world evolves What my action do What the world is like now Environment What it will be like if I do action A How happy I will be in such a state Sensors
什么是Agent? (2)
对于智能的不同观点
思维法则:强调逻辑推理,得到正确的推论 理性行动:理性的行为
强调行动:推理是为了得到合理的行为 正确推论 + 正确行动 没有明确是正确的事情时,同样需要行动 反射式行为是不需要推理的
什么是Agent? (3)
理性行为的含义
1 当目标互相矛盾时,只有其中的一些可以达到, 效用函数可进行适当的妥协。 2 当智能体存在若干目标,但是没有一个确定能够 达到时,效用函数就依据目标的重要程度来估计目 标达到的可能性。
Condition-action rules
What action I should do now
Actuators
基于模型的反射型智能体(2)
基于Agent的专业文献智能搜索系统的设计

基于Agent的专业文献智能搜索系统的设计
孙铁利;孙英娟;田丽君
【期刊名称】《东北师大学报:自然科学版》
【年(卷),期】2003(35)4
【摘要】给出了一种对专业文献进行搜索的新方法.通过建立初始学科库对各学科文献进行统计、特征提取,并以此为基础系统,通过自学习不断更新学科库,判断是否有新的交叉学科产生.应用这种方法,系统能够按照用户输入的搜索词和所属学科,智能地更新相关学科库,并快速搜索到相应学科的文献.
【总页数】5页(P19-23)
【关键词】特征提取;智能搜索;匹配
【作者】孙铁利;孙英娟;田丽君
【作者单位】东北师范大学计算机科学系;东北师范大学图书馆
【正文语种】中文
【中图分类】TP311
【相关文献】
1.基于智能Agent个性化化学专业信息检索系统的设计水 [J], 李有明
2.多Agent协作的智能搜索引擎系统的设计与实现 [J], 郭琳
3.面向智能Agent的元搜索系统的设计与实现 [J], 李四明;陶兰;王保迎
4.基于Agent的面向用户的智能信息搜索系统的设计 [J], 严彩梅
5.安徽省科技文献共建共享平台——基于智能Agent个性化信息检索服务系统设计 [J], 范文
因版权原因,仅展示原文概要,查看原文内容请购买。
基于Agent的门户网站个性化搜索的研究

一曩 国攮塞 萎匮 . 直
搜索 投羹; 获得 妁 3, 0 O 祭 嘣僳 雌 大 2 0, 0 董 2 0
图 1 G ol oge中以“ 搜索引擎” 为关键宇的返回结果
实际上 , 同的用户 在性别 、 龄 、 业 、 历 层次 、 不 年 职 学
兴趣爱好 等方面都不尽 相 同 , 以 同一 个关 键词 对他 们 所 的含义往往不一样 , 而通过 相 同关键 词所 获得 的检 索结 果 也无 法 反 映 出用 户 的 真 正 需 求 。一 个 商 人 在 检 索 “ C 的时候 , 脑海里 的 V V” 他 C只是 V nueC p a( etr ail 风险 t 投 资) 医生 检 索 “ C ; V ”的时 候考 虑 的往 往 是 V t n C i mi a ( 他命 c ; I 维 ) 而 T行业技 术人 员所关 心的 V C是高 级语 言开发 工具 。用 户输 入关键 词 的时候 , 所表 达 的需 要 他 往往是 明确 的 , 但是 目前 的搜索 引擎 只是 简单 的将所 有 结果返 回。当用 户看 到数量庞大的与 自己需 要无关 的网 页, 心情一定轻松不起来 。此时 , 用户需要 花费 巨大 的力 气 才能 在其中挑 选出 自己所需 的内容 。 为此 , 为满足不 同兴趣 和 背景 的用户 提供 需要 的搜 索服务应运而生 。也 就是说 , 索 引擎不 能一 味地 仅仅 搜 从关键 词中提供返 回结果 , 而要 根据 用户 的使 用行 为 、 习 惯、 爱好和特点 , 向用户提供满足其个性 化需求 的一 种信 息服务 , 这就是个性化搜索 。 二 门户 网站个性化搜 索的需求
司, 门户 网站技 术先进 、 号召力强 、 资源丰富 , 成为 网络 中 的支 柱 , 与广大 网民的生活息息相关 , 也一直 为业 内人 士 所密 切关注 。 与传统搜索引擎 相 比 , 门户 网站个 性化 搜索 具有 自 己独特的优势 。首先 , 在全球金融危机 的影响下 , 不少 中 小 型 I 企业 和网站 纷纷 倒 闭, 门户 网站 实力 雄 厚 , , I ’ 而 运 营较 为稳定 , 充当个性化搜索 的领 头羊 。其 次 。 能 不管 在 网络迅猛 发展的阶段 , 还是在互联 网的寒 冬 , 门户 网站 的 用户数 量都 比较稳 定 , 利于开 展个 性化 搜索 。如果用 有 户数 量不大 , 者用 户群不稳定 , 或 是不利于开 展个性化 搜 索 的。再 次 , 门户网站不但技术力量强 大 , 且 自身就 具 而 备 了海量 信息 , 中大部分是动态 网页 , 其 而检 索动态 网页 直 是传统搜索 引擎 的难题 。因此 , 门户 网站 的站 内个 性化搜 索 , 具有无 可 比拟的优势 。 三 基于 A et 术的门户网站个性化搜 索系统 gn 技 1 .个性 化搜 索 的主 流技 术。个性 化 搜索 需要 涉 及 的领 域 比较多 , 自然语 言 、 工智能 、 据挖 掘等 。不 如 人 数 同的研究 人员对个性 化搜 索从 不 同的方 向进行 了研 究 , 其 中也 产生了很多技术 , 目前 主要有 O t oy技术 、 no g l 元搜 索 引擎技术和 A et gn 技术 。 O to ( no g 存在论 , ly 本体论 ) 建立 在语 言学基 础上 , 用 于帮 助搜 索引擎识 别用 户表 达 的意思 。但 是 , 户 的表 用 达能力 和方式 千差 万 别 , 兼之 语 言学 界对 “ 词 多义 ” 一 、 “ 同形异义 ” 等问题也没有很好 的解 决方案 , 得 O t[ 使 no — o gr 以真正识别用户真正 表达的意思 。 ) 难 元 搜索引擎根据客户端 的软件跟踪用户 的行为获取 用户 的兴 趣 , 同时调用 多个搜索引擎 为之服务 , 并 将过 滤 后 的信息 返 回给用 户 。但 是 , 知名 的搜 索 引擎也并 不愿 意被程 序员调用 , 以免增加 自己搜索 服务 器 的负担 。因 此, 这种完全依赖他 人的办法可靠性不 高。 A e t智 能代理 ) 人工 智能领 域 和 网络技术 相结 gn( 是 合 的产 物。从 2 0世 纪 6 0年代 起 , 传统 的人工 智能 技术 开始致力 于对 知识表达 、 智能推理 、 器学习 等领域 的研 机 究, 这些研究成果在 计算 机软 件 中的应 用使 得软 件有 了 定 程度上的主动性 , 在 自主判 断 和行 为选择 上有 了 并 定 的智能性 。美 国麻省 理工 大学 较早 地实 现 了 A et gn 技术 , 此后逐 渐应 用 到了各 个领 域。A et 有 自主性 、 gn 具 社会 性 、 主动性 、 习性 、 学 智能性等独特 的优点 , 对于万 维 网这种信息量 巨大 而结 构杂 乱无 章的 网络 环境 , 该技 术 成 为处理万维 网信息 的有效途径。 综合分析可 知 , 应采 用 A et 术 构建 门户 网站 个 gn 技 性化 搜索系统 。 2 基 于 A et . gn 的门户 网站个性 化搜索 系统。为 了在 门户 网站 中建立使 用简便 、 检索质 量较 高 的个性 化搜 索
基于本体的知识库个性化检索方法研究

基于本体的知识库个性化检索方法研究杨涛;彭如香;李营那【期刊名称】《电脑知识与技术》【年(卷),期】2014(000)007【摘要】There are two major problems in semantics-based knowledge services.One problem is search results only consider the query string, but not actual conditions. The other problem is computer can hardly understand the request what user asked. To solve the problems, authors proposed anontology-based personalized knowledge retrieval method. The method usesontology-based knowledge servicedescription, provides personalization information represent and capture model,andexecute the knowledge service with personalization information. Experimentations indicate this method can identify the user ’s potential request, remark-ably improve the quality of knowledge retrieval.%在使用本体技术构建知识资源检索系统的研发过程中,常会遇到检索结果同检索者本身实际情况不符,以及计算机难以理解用户实际需求的问题。
为此,我们提出了一种基于本体的知识库个性化检索方法,将知识服务的本体构建、服务定义的过程同用户的个性化信息有机结合起来,并在服务执行的使用用户个性化信息来优化执行结果。
基于本体的Web智能信息Agent

基于本体的Web智能信息Agent
罗清磊;章文;李卫华
【期刊名称】《广东工业大学学报》
【年(卷),期】2004(021)003
【摘要】简单介绍了目前传统信息搜集工具的不足,讨论了智能信息Agent的优势和特点.介绍本体新技术及其重要作用,并将本体引入到智能信息Agent中,建立了一个基于本体的智能信息Agent实例.
【总页数】5页(P57-60,78)
【作者】罗清磊;章文;李卫华
【作者单位】广东工业大学,计算机学院,广东,广州,510090;广东工业大学,计算机学院,广东,广州,510090;广东工业大学,计算机学院,广东,广州,510090
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于Web数据挖掘的个性化信息智能Agent挖掘系统模型 [J], 张莉
2.基于智能Agent的Web信息检索 [J], 宋文军;江楠
3.基于Agent的Web信息挖掘与智能化检索机制 [J], 姚汝贤
4.语义Web上本体与智能信息Agent的集成研究 [J], 李卫华
5.基于移动Agent的Web信息智能过滤算法及其实现 [J], 史豪斌;韦铁;李伟华;王万诚
因版权原因,仅展示原文概要,查看原文内容请购买。
agent组件原理

agent组件原理Agent组件是一种在计算机系统中常用的软件模块,它具有自主决策和执行任务的能力。
本文将介绍Agent组件的原理及其在不同领域的应用。
Agent组件的原理基于人工智能和机器学习的技术,通过对大量数据的学习和分析,使得Agent能够根据不同的情境做出智能决策。
Agent组件通常包括以下几个主要部分:感知、知识表示与推理、决策和执行。
首先是感知部分。
Agent通过各种传感器来感知外部环境的信息。
这些传感器可以是摄像头、麦克风、温度传感器等。
感知部分的任务是将传感器获取的信息转化为计算机可处理的数据。
接下来是知识表示与推理部分。
Agent需要将感知到的信息进行处理和表示,以便进行推理和决策。
知识表示可以采用符号逻辑、本体论等方式,将信息转化为计算机可识别的形式。
而推理则是根据已有的知识和规则,对感知到的信息进行推理和判断。
然后是决策部分。
Agent基于推理的结果,根据预先定义的目标和约束,做出决策。
决策可以是选择一个行动或者是选择一个策略。
决策的过程通常是基于一定的评估指标和算法,以最大化预期收益或者最小化风险。
最后是执行部分。
Agent根据决策做出相应的行动。
执行部分通常包括与外部环境的交互,例如控制机器人的运动、发送指令给其他设备等。
执行部分的目标是将决策转化为实际的操作,并通过与外部环境的交互来实现。
Agent组件的应用非常广泛。
在智能交通系统中,Agent可以通过感知交通情况、分析交通数据,做出智能的交通调度和路线规划。
在智能家居系统中,Agent可以通过感知家庭环境的信息,控制家电设备的开关和调节。
在金融领域,Agent可以通过分析市场数据和投资策略,做出智能的投资决策。
Agent组件的原理和应用不仅可以帮助人们提高工作效率,提供更好的生活体验,还可以在一些复杂的领域中发挥重要作用。
例如,在医疗领域,Agent可以通过分析患者的病历和症状,辅助医生进行诊断和治疗决策。
在工业生产中,Agent可以通过感知生产线的状态,实现智能的生产调度和质量控制。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
时,本体论中还应包含关于同义词的描述。这样,相同的概念用不同的术语表达就不会造成
重复和错误。 (2)分析网页所属本体
设q,D2,人,q分别是知识领域DI,D2,人,见对应的本体论,领域概念(术语)集 正=concept(Oj)(其中1≤i≤n)。函数concept(Df)定义为:从领域q对应的本体论Q 中求出该领域的概念术语集(包括同义词)。函数relation(q)定义为:从本体论q中求出
若f巧I=lconcept(OT,j)I≤u,则停』卜划分,否则重复上述过程,可以得到对应于d个领域的
用户最感兴趣的d个本体(次本体)。 接下来,对要浏览的网页page,的内容进行语义网络匹配。针对每一个与该网页相关
的本体q(次本体D毛),首先求出与关键词直接相关的术语对象集合衄a
page/的关
键词key/∈Z,说明该网页与本体q相关,这样得到所有与之相关的本体q(次本体D乃)。
page,叠皿
else
page/与领域ql,皿2,人巩相关;
S
Step2。
对与本体论谚相关的s个网页,计算全局兴趣度kt雠st(Q)=∑tntrj,将
』霉l
Interest(O,)豹僵进行排穿,褥到最感兴趣的d个领域;
Step3.
if阮l=leoneept(O≠)l>ll(驻为阂值)then根据函数hie粼h甄q)求次本体
1011
文检索进行关键词匹配把该网页查出来,但是这又导致了信息量“过载”的问题。 其次,在人类的自然语言中,随着时间、地域或领域的改变,同一概念可以用不同的语
言表现形式来表达。例如,计算机和电脑,厕所和洗手间。因此,对同一概念的检索,不同
的用户可能使用不同的关键词来查询,但是搜索引擎却不一定能明白这一点。 最后,现有传统搜索引擎基本上都采用“一个搜索适用于所有用户”的搜索模式,即不 同的人使用相同的关键词得到的结果是相同的,这是由于传统的搜索引擎没有考虑人的地 域、性别、年龄等方面的差别,它无法处理随用户不同而变化的个性化知识。造成这种局面 的主要原因是搜索引擎缺乏知识处理能力和理解能力,对要浏览的信息仅仅采用机械的关键 词匹配米实现。
定义形式,一个简单的例子:一个标准的,具有各种特定的类及其包含关系的层次就是一个
本体‘5・翻。 我们可以采用如上同样的方法将用户的兴趣集中到d个领域中的某个层次(即次领域
DM)。具体划分到领域的哪一层,可以由用户指定的阈值U来决定。设函数hierarchy(q) 求得本体论Df中包含的次本体,即次本体DZl,DZ2,人,D瓦分别对应于次领域 DMfl,DM加人DM腑(其中1
record web pages browsed by users,classify these pages by
Ontology
thus induce domains in which
users are
really interesting,and in process of retrieving pages,the Agent not
标题进行分析,得到用户关心的领域;在应用阶段,对任意给出的网页,计算兴趣度和置信 度函数,从而判断用户对该网页是否有兴趣。
(1)本体论 本体论是用来描述或表达某一领域知识的一组概念或术语【21。在本体论中,概念化对象
1012
c可以定义为【3】:C=<D,W,R>,其中D是一个领域,W是该领域中相关的事物状态(state ofaffairs)的集合,R是领域空间<D,w>上概念关系(conceptual relation)的集合。从这个定义 来看,一个领域的本体论必须包含领域中的概念、概念的定义以及各个概念之间的关系,同
根据DMfl,DM』2,……,DM腑.t2…-" ……、…E,…~L~1度加g,的大小对它们进行排序,
从中找到最人的频度值,即可定义为该网页的相关度。
3.3置信度函数 搜索出的网页还存在一个置信度的问题,即我们要考虑浏览的网页最近有无更新,网页 的内容是否真实可靠。 定义3置信度函数
Conf,=厂(‘,Q,),其中,‘为布尔量,表示网页有无更新,函数
1014
3.唾结果处理 根据计算出的网页的兴趣度和置信度,我们设定期望度函数Exp,来判定该网页是否是
用户所希望浏览的。
定义4期望度Expf=p(Degree(pagefExp,的值越大,说明霹更的级别越赢,显示熬位置
就越靠前。再根据用户设定的曰均浏览蕈,以分钟域小时为单位截取出一定数量的网页,排
else
go
to Step6;
Step4.
求概念术语集巧=concept(D毛)和语义网络集relation(D毛),对与次本体p乃
』;1
示对应于本体论Oj的全局兴趣度。将求得的Interest(O,)的值由大到小排序,并按照用户设 定的兴趣范围人小截取其中最大的d个值,就得到用户最感兴趣的d个领域。
用I正l=Iconcept(p)I表示领域Dj中概念的数目,对给定的阂值u,若kl>u,表明此
领域的范围过大。以此来过滤网页可能仍然会导致无关页面太多,浏览效率降低,必须将用 户的兴趣范围再具体化。本体可以分层,在知识共享的环境下,本体论指的是代表性词汇的
s
f≤d)。用函数concept(D瓦)求出该次领域的概念术语集
1013
巧=concept(OT,j),用函数relation(D乃)求出次本体D乃中的概念关系构成的语义网络 集。・设有r个页面与次本体D乃相关,则全局兴趣度Interest(D乃)=∑Intrh,求得最大
h=l
Interest。戤对应的次本体即为该本体论中用户最关心的。对次本体。乃的概念术语集巧,
造成了关注信息种类的差别,人们希望出现一种针对个人兴趣的智能型搜索引擎。
传统搜索引擎的局限性
我们可能都碰到过这样的麻烦:当你在网上查询一些信息时,所返回的很多网页都是无 用的东西,你没有时间和精力来一一浏览搜索引擎查到的每一个网页。这是因为传统的搜索 引擎通常采用全文检索的技术,从理论上说,只要网页上出现了某个关键词,就能够使用全
内容不出现在该领域的本体论中,就可以认为该网页与这一领域无关【41。即劬,芒互卜
page,诺B,这里1≤f≤n。经过这一步,过滤掉一些不相关的领域,得到所有与该网
页有关的领域D,l,D,2,人,巩,其中keys∈乙,‘≤0≤%。 设s为与本体论q相关的网页数目,则可以令Interest(q)=∑Intrj,Interest(O_f)表
Q,=g(H,,,)反应了网页的知名度。’,,是布尔量,表明该网页是否为知名网页,t为网页
的日均流量大小。
设集合A={q,a2,人,口。>为静态网址集,其中al,a2,人,a。是一些包含很多链接的站 点,或是日均浏览量较大的网页。对将要浏览的网页page,,如果页面地址不出现在集合A
中,即pagej萑A,说明它不是知名网页。
information
hard work.In this paper, help
users
personalized
intellectual retrieved Agent based
Agent
call
on
Ontology,which
call
find
information
and
that they
need.This
An intellectual retrieved Agent based
on
Ontology
Jinjin
Chen
Jinhua Zheng
Institute of Information Engineering,Xiangtan University 4 1 1 1 05
E・mail:ejj_may@yahoo.corn.ca
由概念关系构成的语义网络集14】o高速缓存中的网页集合P={pagel,page2,人,page。), key』为网页标题中所给出的关键词,1≤J≤m。
定义1对于任意网页p秽,,兴趣度函数II屿=g(t/,hj),其中0为浏览次数,hj为
浏览时间。 我们知道,任一网页标题中的关键词是对该网页最核心内容的概括,如果这些最核心的
啦=酬0,坳/)∈relati。n(q),l≤f≤t),t椭page/相关的本体数目。然后检索整
个网页,统计被检索网页中出现在集合吣中的元素的频度加g,=∑W,×所,,其中,m,
是元素的出现次数,w,是权值。户叼,反应了该网页与本体q(次本体DL)中的NRNN
的近似匹配程度。
定义2相关度Degree(page,)=max(freq,)
3.设计思想
传统引擎的局限性限制了资源的更有效的获取,针对上述问题,论文提出了一种基于本 体论的智能搜索Agent的模型。该系统应用本体论分析每个用户所关注的领域(即本体)是 什么,再根据用户所关心的领域为他们提供经过筛选的网页,从而达到个性化服务和提高效 率的目的。
3.1
Agent技术
威心{{}}
一种基于本体论的智能搜索Agent
陈晋进郑金华 湘潭大学信息工程学院(411105)
E-mail:cjj_may@yahoo.corn.ca
摘要:互联网为各种主题提供了大量信息,然而,它的动态及分布特性使得检索特定信息成为一项艰 巨的任务。本文提出了一种基于本体论设计的个性化智能搜索Agent,旨在帮助互联网用户快速准确地找 到符合自己需求的信息。该Agent能自动跟踪记录用户浏览过的网页,利用本体论知识对网页进行归类, 由此推算出用户真正感兴趣的领域。并且在考虑用户兴趣的同时,也保证了网页内容的真实可靠性。 关键词:本体论搜索引擎agent
控用户对某一页面的访问次数和停留时间,并根据这些动作做出相应的反应。 3.2兴趣度函数
对于一个网页而言,人们一般在阅读标题后就可以判断是否对其感兴趣。这是因为标题 言简意赅地表达了网页的核心内容,通过对标题的学习,再结合网页内容,可以把一个网页 归纳到某一本体论中去。具体分为两个步骤:在训练阶段,对用户浏览过的一定数量的网页