基于知识库系统的智能搜索引擎研究
从文献线索提供到知识挖掘的跨越——对信息检索智能化的展望

方式 , 因而往往会出现要么输 出的无关信息太 多 , 要 么查 不到任何信息 的现象 。换 句话 说 , 当前 的基于 语 法的信 息查询 , 其查准率很低 。 在信 息集成环 境下 , 们需要 实现 跨 主题资源 人 的互操 作 , 以解决信息 集合 和需求 集合 的 匹配与选 择, 达到最大限度地满 足用户 的信息需 求的 目的 。
识表示实 际也隐含着 知识 的运用 , 知识表 示 和知识
库是知识 运用的基础 , 同时也与 知识 的获取 密切相
关。
知识库类似于数 据库 , 以知识 库技术包 括知 所 识的组织 、 理、 管 维护 、 优化 等技 术。对 知识库的操 作要靠 知识 库管 理系统 的支 持。知识库 系统 , 概 从 念来讲 , 可以泛指 所有包 含知识库 的计 算机系统 它
其 处理 主题概念 、 标识之 间 的各种 联系 和 因果关 系 的局 限性 , 它们只能从 文献标 引的字符形式 , 而无法
速检索出信息源 , 使机 器能准 确地 理解用 户的要 也 求, 所提供 的结果 比较令 人满 意。
12 能对 异 构 信 息 源 的 数据 进 行 自动 标 引 、 配 和 . 匹
整 合
从 文献 的知识 内容来 提供 信息 , 户获取 的往往 是 用 文献线索 , 而不是真正需要 的实用信息 。 目前 的信息查询主要 是按 主题 或关 键词 进行查
询 的。这种查询方式是一种严格 的语法 匹配的查询
区别于传统检索 , 能检 索能用 集成技 术对异 智
构信息源的数据进行 自动标引 、 匹配和整合 , 允许用 户对不 同资源进行统 一 的查询 , 用户 在对 多异构信 息源进行访 问时 , 象使 用一个大数据库 一样 , 就 用统
基于推理控制策略的智能型电力搜索引擎的研究

词, 搜索引擎根据关键 词对 网站索引数据库进行检 索, 然后返回显示检索结果。这种方式具有一定的 局限性 。这种方式把用户的搜索要求限定于用关键 词进行表达 , 搜索引擎不能理解 自然语句, 用户很难 准确的把检索内容用关键词来表述清楚。另一种就 是 目录式搜索引擎 , 主要 以人工方式搜索信息 , 再由 人工方式查看信息后 , 形成信息摘要。因为加入人 的智能, 所以, 信息准确 , 导航质量高。缺点是需要 大量人工进行搜索编制 , 成本 比较高 , 而且数据库很
是 自然语言处理技术使搜索更加智能化 , 信息更加 容易找到, 给用户带来了极大 的便利。为了更好地 实现电力资源的共享 , 开发性能 良好的电力资源搜 索引擎是其有效途径 。
浏器 览
网 查已网 重 数 询对 据 库 站 编索
J 器J配录据数 务 , 记 的 引库 . 匹
第2 7卷第 6 期
Vo . 7, o 6 12 N .
西 华 大 学 学 报 (自 然 科 学 版 )
Ju n lo h aUnv ri ・ N trlS in e o r a fXiu iest y aua ce c
20 0 8年 1 1月
No . 0 8 v2 0
文章编号 :6 319 2 0 )60 3 -4 17 — x( 08 0 -040 5
S p
匙
l ’
We b站 点
.
1 传 统搜 索 引擎
搜 索引 擎 的 基 本 组 成 … 如 图 1所 示 。前 端 是 人机交互的界面 , 由网 络 浏 览 器 和 We 务 器 组 b服 成, 用户通 过 浏 览 器 输 入 搜 索 内容 , 后 通 过 We 然 b
智能知识库的搭建原型

智能知识库的搭建原型全文共四篇示例,供读者参考第一篇示例:智能知识库是一种用于帮助人类处理海量信息的工具,通过搭建智能知识库,人们可以更加高效地获取、管理和利用各种信息资源。
在当今信息爆炸的时代,搭建一个高效的智能知识库已经变得尤为重要。
本文将介绍如何搭建一个智能知识库的原型,以帮助读者了解这一过程。
一、需求分析在开始搭建智能知识库之前,首先需要进行需求分析,明确知识库的功能和服务对象。
智能知识库可以用于企业知识管理、在线问答系统、智能客服等领域,不同的应用场景需要不同的功能特点。
在需求分析阶段,我们需要明确以下几个方面的问题:1. 服务对象:智能知识库的主要服务对象是谁?是企业内部员工、外部客户、还是公众用户?不同的服务对象需要不同的知识库功能。
2. 知识类型:知识库需要管理哪些类型的知识?是文字文档、图片、视频,还是结构化数据?不同类型的知识需要不同的存储和检索方式。
3. 智能化程度:知识库是否需要具备智能的功能,比如自动问答、推荐系统等?具备这些功能可以提高用户体验,但也需要更多的技术支持。
4. 安全性要求:知识库中可能包含敏感信息,因此安全性是一个重要考虑因素。
需要明确知识库的安全需求,包括数据加密、权限管理等。
通过以上需求分析,我们可以确定知识库的功能和设计方案,为后续的搭建工作奠定基础。
二、架构设计在搭建智能知识库时,一个合理的架构设计是至关重要的。
一个好的架构设计可以提高系统的性能、可维护性和扩展性。
智能知识库的架构设计一般包括以下几个方面:1. 数据存储:智能知识库需要存储大量的知识数据,包括文本、图片、视频等多种类型的数据。
合适的数据存储方案是至关重要的。
一般来说,可以选择传统的数据库存储或者分布式存储系统。
2. 知识管理:知识库中的知识需要进行分类、标记和检索,方便用户查找和使用。
需要设计合适的知识管理系统,包括知识分类、标签管理等功能。
4. 用户接口:智能知识库的用户接口应该简洁、直观,方便用户查找和使用知识。
知识产权行业智能化检索与知识产权保护方案

知识产权行业智能化检索与知识产权保护方案第一章知识产权行业智能化检索概述 (2)1.1 检索技术发展背景 (2)1.2 检索系统架构与功能 (3)第二章知识产权检索系统设计 (3)2.1 系统需求分析 (3)2.2 系统模块设计 (4)2.3 系统功能优化 (5)第三章知识产权检索算法与应用 (5)3.1 关键算法介绍 (5)3.1.1 概述 (5)3.1.2 文本相似度计算 (6)3.1.3 语义分析 (6)3.1.4 深度学习 (6)3.2 算法在实际检索中的应用 (6)3.2.1 文本相似度计算在检索中的应用 (6)3.2.2 语义分析在检索中的应用 (6)3.2.3 深度学习在检索中的应用 (6)3.3 算法优化与改进 (7)3.3.1 文本相似度计算优化 (7)3.3.2 语义分析优化 (7)3.3.3 深度学习优化 (7)第四章知识产权数据库建设与管理 (7)4.1 数据库构建策略 (7)4.2 数据库维护与更新 (8)4.3 数据库安全性保障 (8)第五章知识产权检索效果评价 (9)5.1 检索效果评价指标 (9)5.2 检索效果评估方法 (9)5.3 检索效果改进策略 (10)第六章知识产权保护策略 (10)6.1 知识产权保护法律法规 (10)6.1.1 法律法规概述 (10)6.1.2 法律法规的主要内容 (10)6.1.3 法律法规的实施与监督 (10)6.2 知识产权保护措施 (11)6.2.1 技术措施 (11)6.2.2 管理措施 (11)6.2.3 法律措施 (11)6.3 知识产权保护国际合作 (11)6.3.1 国际知识产权保护体系 (11)6.3.2 国际知识产权保护措施 (11)6.3.3 我国在国际知识产权保护中的地位与作用 (12)第七章知识产权侵权监测与预警 (12)7.1 侵权监测技术与方法 (12)7.1.1 技术概述 (12)7.1.2 侵权监测技术 (12)7.1.3 侵权监测方法 (12)7.2 侵权预警系统设计 (12)7.2.1 系统概述 (12)7.2.2 设计原则 (13)7.2.3 系统架构 (13)7.2.4 功能模块 (13)7.3 侵权应对策略 (13)7.3.1 法律途径 (13)7.3.2 协商途径 (13)7.3.3 技术手段 (14)第八章知识产权保护技术创新与应用 (14)8.1 知识产权保护技术发展 (14)8.2 技术在知识产权保护中的应用 (14)8.3 技术创新与知识产权保护 (15)第九章知识产权行业智能化检索案例分析 (15)9.1 检索案例介绍 (15)9.2 检索效果分析 (15)9.3 检索策略优化 (16)第十章知识产权行业智能化检索与保护发展趋势 (16)10.1 行业发展趋势分析 (16)10.2 技术发展展望 (17)10.3 未来挑战与机遇 (17)第一章知识产权行业智能化检索概述1.1 检索技术发展背景科学技术的飞速发展,知识产权在促进创新和经济发展中的作用日益凸显。
基于知识图谱的数据挖掘与知识发现

基于知识图谱的数据挖掘与知识发现在当今信息爆炸式增长的时代,如何从庞杂的数据中挖掘出有价值的信息并进行知识发现成为了一个重要的课题。
传统的数据挖掘技术往往依赖于统计学和机器学习等方法,但这些方法在处理复杂的领域知识时存在一定的局限性。
而基于知识图谱的数据挖掘与知识发现则可以通过构建结构化的知识库,将数据语义化,从而提高信息的准确性和可用性。
本文将介绍基于知识图谱的数据挖掘与知识发现的原理、应用和未来发展趋势。
一、基于知识图谱的数据挖掘原理知识图谱是一种以图为基础的知识表示方法,它通过在图中定义实体、属性和关系,将事物之间的关系可视化表示。
基于知识图谱的数据挖掘与知识发现是在这个基础上,通过对知识图谱的拓展、更新和分析,从中发现隐藏在数据中的规律和知识。
具体而言,基于知识图谱的数据挖掘可以分为以下几个步骤:1. 知识图谱构建:建立一个包含实体、属性和关系的知识图谱,可以通过人工标注或者自动化方法从各种数据源中提取。
2. 数据预处理:对原始数据进行清洗、融合和转换,使得数据能够符合知识图谱的规范要求,并且去除冗余和噪声。
3. 知识图谱拓展:利用数据挖掘技术,从外部数据源或者已有的知识图谱中,不断扩充和完善知识图谱的内容。
4. 知识图谱分析:通过图算法和数据挖掘方法,对知识图谱进行结构化分析、关系抽取、实体识别等操作,从中发现隐藏在数据中的模式和规律。
5. 知识发现与推理:通过对知识图谱的分析和推理,挖掘出其中的知识,形成新的洞见和发现。
二、基于知识图谱的数据挖掘与知识发现应用1. 智能搜索和问答系统:基于知识图谱的数据挖掘可以帮助搜索引擎和问答系统更准确地回答用户的问题,提供更有价值的搜索结果。
2. 专家推荐和匹配:在专业领域中,基于知识图谱的数据挖掘可以帮助找到与专家相关的文献、论文和项目,并进行专家推荐和匹配。
3. 金融风控和反欺诈:基于知识图谱的数据挖掘可以将金融机构的客户信息、交易记录以及外部数据进行综合分析,提高风险控制和反欺诈能力。
知识管理系统模型研究

知识管理系统模型研究知识管理是指对于企业内部的知识资源进行有效的搜集、整合、传播和利用,以提高企业的生产力、竞争力和创造力。
为了更好地实现知识管理的目标,需要建立一套完整的知识管理系统模型。
1. 搜索引擎搜索引擎是知识管理系统中不可或缺的组成部分。
通过搜索引擎,企业可以快速地查找到所需的信息和知识,从而提高工作效率和效益。
搜索引擎需要具备以下特点:(1)满足用户需求:搜索引擎需要根据用户的搜索关键词,快速地查找到相关的信息和知识。
(2)高效准确:搜索引擎需要具备高效准确的搜索能力,以便快速地返回搜索结果。
(3)易用性强:搜索引擎需要简单易用,用户可以轻松地使用它来查找信息和知识。
2. 知识分类和组织为了更好地管理企业的知识库,需要对知识进行分类和组织。
知识分类的目的是为了使企业的知识库更加有序,便于查找和使用。
知识组织的目的是为了将相关的知识整合在一起,便于进行综合利用。
知识分类和组织需要考虑以下因素:(1)应用领域:知识分类和组织需要根据不同的应用领域进行划分,以便快速地找到所需的知识。
(3)关联性和综合性:知识分类和组织需要考虑知识之间的关联性和综合性,将相关知识整合在一起,便于进行综合利用。
3. 知识流程管理知识流程管理是指对知识在不同阶段的管理过程。
它包括知识的创建、获取、共享、传递、应用和评价等多个环节。
知识流程管理需要考虑以下因素:(1)知识的来源:需要确定知识是从内部还是外部获取的,并建立相应的渠道和机制。
(2)知识共享和传递:需要将知识共享给需要的人员,以便更好地利用知识。
(3)知识应用和评价:知识需要得到有效的应用和评价,以便更好地指导实践活动。
4. 知识安全和保护知识管理系统需要对知识的安全性和保护性进行有效的管理,以确保知识的保密性、完整性和可用性。
知识安全和保护需要考虑以下因素:(1)知识的分类和权限:需要根据知识的分类和权限进行访问限制,确保知识只能被授权的人员访问。
(2)知识的备份和恢复:需要对知识进行备份和恢复,以确保知识不会因为系统故障或人为因素造成的数据丢失。
Autonomy智能搜索引擎

Autonomy基本简介近年来,非结构化信息的使用范围发生了大幅度的增长,这些信息的形式包括文档、电子邮件、电话录音以及多媒体内容。
企业中现在有超过 85% 的信息都是非结构化信息,这些“人性化”的信息对于计算机而言非常难于理解和使用。
而基于语义的计算能够解决这一问题。
基于语义计算技术使计算机能够理解各段信息之间的联系,进而执行复杂的分析操作,而这一切都是自动且实时进行的。
技术特点基于语义计算技术与包括关键词搜索在内的传统方法有何不同?基于语义计算技术的能力远远超出了诸如关键词搜索这些只能进行数据查找与检索的传统方法。
举例而言,关键词搜索引擎不能理解信息的含义,因此这些产品只能用于找出带某个字词的文档。
然而由于无法理解含义,所以那些使用了不同字词但主题却相同(即有相关性)的文档将被忽略。
而那些主题与用户期望搜索的内容完全不同的文档却经常被返回,从而使得用户必须修改查询方式来适应这种搜索引擎。
除此之外,基于语义的计算还能提供关键词搜索引擎无法提供的许多功能,例如自动形成超链接以及聚类。
举例而言,自动形成超链接可以向用户提供众多在语境上与原有的文档相互联系的文档、服务和产品,这就要求计算机能够完全理解原有文档的含义。
与此类似,要使计算机能够自动收集、分析并组织信息,就必须赋予其提取语义的能力。
只有拥有基于语义计算技术的系统才能做到这一点。
应用方面基于语义计算技术为现代企业带来了一系列新的战略性应用。
其中包括:高级企业搜索:基于语义计算技术不仅能找出其他技术(包括关键词搜索以及关系数据库)无法发现,占企业信息总量 85% 的内容,同时还能理解它们的含义。
因此,用户能够查看之前甚至认为并不存在的相关信息,从而以实时的方式对其进行操作。
知识管理:基于语义计算技术使企业能够自动地通过语境理解客户与员工感兴趣的方面,他们的行为,以及与各种类型的信息之间进行的交流。
这样,企业就能够通过利用其员工所拥有的重要知识、经验以及专业技能来形成协作。
基于大模型的知识库问答

基于大模型的知识库问答摘要:一、引言1.介绍大模型知识库问答的研究背景和意义2.说明本文的主要内容和结构二、大模型知识库问答概述1.大模型的概念和特点2.知识库问答的定义和应用场景3.大模型知识库问答的优势和挑战三、大模型知识库问答的关键技术1.知识表示与存储2.问题理解和答案生成3.知识融合与推理四、大模型知识库问答的实践与应用1.应用领域和案例分析2.现有系统和工具介绍3.发展趋势和前景展望五、总结与展望1.总结大模型知识库问答的研究成果和进展2.指出当前存在的问题和挑战3.对未来研究的展望和建议正文:一、引言随着互联网和人工智能技术的快速发展,越来越多的知识和信息被数字化并存储在各种知识库中。
如何高效地从这些知识库中获取和利用有价值的信息,成为了学术界和产业界关注的焦点问题。
大模型知识库问答正是解决这一问题的关键技术之一。
本文将介绍大模型知识库问答的研究背景和意义,以及相关技术和应用现状,并对未来的研究方向进行展望。
二、大模型知识库问答概述1.大模型的概念和特点大模型是指采用大规模数据集进行训练的深度学习模型,具有参数规模大、模型结构复杂等特点。
近年来,大模型已经在自然语言处理、计算机视觉等领域取得了显著的成果。
2.知识库问答的定义和应用场景知识库问答是一种从知识库中检索和生成答案的技术,旨在解决传统搜索引擎无法有效回答复杂问题的问题。
知识库问答广泛应用于智能客服、智能问答、智能推荐等领域。
3.大模型知识库问答的优势和挑战与传统知识库问答方法相比,大模型知识库问答具有更好的泛化能力和表达能力,能够处理更复杂的问题。
然而,大模型知识库问答也面临着知识表示和推理等方面的挑战。
三、大模型知识库问答的关键技术1.知识表示与存储为了提高知识库的利用率,需要对知识进行有效的表示和存储。
目前,常用的知识表示方法包括关系表示、实体表示等。
2.问题理解和答案生成大模型知识库问答的关键技术之一是理解用户提出的问题并生成合适的答案。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
龙源期刊网 http://www.qikan.com.cn
基于知识库系统的智能搜索引擎研究
作者:胡风华 王磊
来源:《中国新技术新产品》2011年第18期
摘要:本文对智能化搜索引擎进行了分析及综合评价.在此基础上,着重讨论了知识库系统
以及它在智能搜索引擎中的应用。
关键词:搜索引擎;知识库系统
中图分类号:TP18文献标识码:B
1 引言
随着互联网网站页面的激增和用户队伍的不断壮大,搜索引擎越来越成为人们上网浏览时
的重要工具,用以在浩瀚的网站页面的海洋中迅速地找到自己所需的信息。从用户的角度来
看,当前的搜索引擎主要存在信息检索质量不高、检索方式单一、个性化服务问题、搜索引擎
对信息的标引深度不够、信息收集与检索的分离等几个方面的不足。
2 智能搜索引擎功能特点
智能搜索引擎的人机接口和网络蜘蛛高度智能化,可跨平台工作、处理多种混合文档、支
持多种语言搜索,并能根据用户的兴趣、爱好、特性、定题需求,不断实时推荐、推送相关的
信息、知识,定制个性化页面等,表现出较大的智能性、主动性、交互性、人性化特征。使其
用户范围从具有良好信息检索素质的专业人士,扩展为无任何检索技能背景的普通用户。
2.1 智能型的自然语言技术
智能型的自然语言技术包括"自然语言搜索"和"动态关联词、联想词提示"技术。内建完整
的"布尔逻辑运算组合"的搜索条件和"邻近搜索"功能,配合"智能型快速响应模式",有效提高
搜索速度和精确度。用户可灵活选择欲搜索的数据库,配合"中文同音"、"中英文近似概念"、
简繁转换"、通配字符搜索"、词组搜索"和"多字段平行检索"等多项智能搜索功能,从而更加高
效、便捷获取有用信息。
2.2 灵活的检索机制
提供多重模板设计功能,可按照用户自身需求轻松修改搜索结果的显示画面;并可依据不
同的搜索方式,套用可获得不同的搜索结果的模板文件。提供"机动权值排序机制"、"阶层式
分类目录"、"动态关联词、联想词提示"等功能,向用户提供更友好的搜索界面,增加搜索结
果的适用性。
龙源期刊网 http://www.qikan.com.cn
2.3 强大的索引功能
采用"多线式资料获取机制"、 "平行索引模式"、 "动态文件分析技术"及"实时差异式索引
更新技术"等多种功能,有效提高文件与数据库的索引速度,大幅降低索引等候时间和更新周
期。提供"多重索引数据库"架构及"群组式分类目录"功能,缩短资料索引时间,灵活整合文档
资料。
3知识库系统的原理
3.1 知识的定义
知识是人类对客观世界的认识,通常知识是先由底层数据经过分类、归纳、综合等处理过
程而得到的上层信息,这种信息再经过解释、比较、推理得到我们所获取的知识,这种过程主要
是在语义的层面来进行的。
3.2 知识的类型:过程型知识、描述型知识和元知识。
3.3 知识的表示
知识表示是指知识在计算机内部的存储和组织,是数据结构和解释过程的结合。数据结构
用于知识的形式化描述,而解释过程则用来说明知识的现实含义。知识的表示方法主要有一阶
谓词逻辑表示法、产生式表示法、语义网络表示法和面向对象的知识表示方法等。
3.3.1 一阶谓词逻辑表示法
谓词的一般形式为P(x1,x2,…,xn),其中,P是谓词;x1,x2,…,xn是个体(常量、变元或函数)。
谓词逻辑适用于表示事物的状态、属性、概念等事实性的知识,也可以用来表示事物间确定的
因果关系,即规则。例如:"书在课桌上"可以描述成:ON(book,desk)。谓词逻辑是一种形式语言,是
目前能够表达人类思维活动的一种最精确的语言,它与人类的自然语言比较接近,因此一阶谓词
逻辑表示方法是最早使用的一种知识表示方法。它具有简单、自然、精确、灵活、容易实现等
优点。
3.3.2 产生式表示法
产生式表示法又称为产生式规则表示法它是依据人类大脑记忆模式中各种知识之间的大量
存在的因果关系,以"IF-THEN"的形式,即产生式规则表示出来的。它的基本结构包括前提和结
论两部分:前提(IF部分)描述状态,结论(THEN部分)描述在状态存在的条件下所做的某些动作:
前提状态→结论动作或 IF状态THEN动作
龙源期刊网 http://www.qikan.com.cn
整个产生式的含义是:如果前提被满足,则可推出结论或执行所规定的操作。产生式表示法
具有自然性好,便于推理的优点,且有利于对知识的增加、删除和修改。另外,产生式表示法既可
以表示确定性知识,又可以表示不确定性知识;既有利于表示启发式知识,又可方便地表示过程性
知识;既可表示领域知识,又可表示元知识。但是产生式表示法不能表达具有结构性的知识,工作
效率不高;而且在求解复杂问题时容易引起组合爆炸。
3.3.3 语义网络表示法
语义网络是一种通过概念及其语义关系来表示知识的一种网络图。一个语义网络就是一个
带有标志的有向图。其中,有向图的节点表示各种事物、概念、动作、状态、属性等;有向弧表
示它所连接的节点间的某种语义联系,每个节点可以包含若干个属性。语义网络表示法具有灵
活、自然、易于实现、善于表示结构性知识等优点。语义网络表示法的局限性主要表现在它对
知识表示的非严格性,这使得有可能存在二义性,而且存在知识处理的复杂性。
3.3.4 面向对象的知识表示方法
按照面向对象方法学的观点,一个对象的形式可定义为四元组〈对象〉::=(ID,DS,MS,MI)。
其中ID代表对象标志符,DS代表数据结构,MS代表方法集合,MI代表消息接口。这种方法可以
将知识抽象为对象的内部状态和静态特征属性进行封装和隐藏,而知识的处理方法表示为对内
部状态和特征属性的操作,并由消息接口与外界发生联系。
3.4 知识库
知识库是关于某一领域的陈述性知识、过程性知识和策略性知识的集合。知识库中不但包
含了大量的简单事实,还包含了规则、过程型知识和策略性知识。从存储知识的角度来看,以描
述型方法来存储和管理知识的机构叫做知识库。从使用知识的角度来看,知识库是由知识和知
识处理机构组成。
3.5 知识库系统
3.5.1 知识库系统的体系结构
知识库系统包括知识的获得、利用和管理三个方面。知识库、推理机及存贮器是知识库系
统的三个组成要素。知识库系统的核心组成部分是知识库和推理机构。
3.5.2 推理机构
利用知识,解释输入的数据或事实,推导出用户所需的结论;并根据要求,说明得出结论的依据,
用于进行这种推理控制的模块称为推理机构。推理机构应具备以下四个功能:
(1)知识库中新知识的获取功能。
龙源期刊网 http://www.qikan.com.cn
(2)推理机构与知识库相互独立功能。
(3)知识库中信息交换及知识扩充功能。
(4)知识库与待解决问题之间的协调功能。
4 基于知识库系统的智能搜索引擎
目前的搜索引擎具有关键词检索和目录查询的缺点,为了克服这些缺点,应该采用自然语
言理解技术来进行自然语言智能答询。这样就可以将信息检索从目前基于关键词的层面提高到
基于知识(或概念)的层面,对知识有一定的理解与处理能力,可以实现分词技术、同义词技术、
概念搜索、短语识别以及机器翻译技术等。下面就是当前智能搜索引擎基于知识库系统所采用
的一些自然语言理解技术。
4.1 智能分词技术
关键词查询的前提是将查询条件分解成若干关键词。对英文而言,一个单词就是一个词,但
中文词之间的关系却复杂得多,主要问题是中文词与词之间没有界定符,需要人为切分,但人为的
切分有很大的灵活性和操作性,往往容易产生词义失真。
4.2 同义词处理
汉语词语之间复杂性的另一个方面是同义词的问题,同一个词组往往有许多不同的意思,处
理同义词的一种方法是在语义知识库中人工构造同义词表,对专用领域的搜索引擎,这种方法是
非常有效的。
4.3 短语识别技术
用短语描述查询请求的情况很常见,但是因为汉语词组的复杂性,所以在中文搜索引擎中,我
们不能象英文词组一样简单的将中文短语分离成词组。
4.4 智能搜索代理技术
以提供主动服务为主的智能搜索代理技术,能够将信息主动推送到用户面前,免去了用户被
动搜索的困扰。搜索的是活动窗口而不是某一个关键词的主导概念,增强了相关性提供的链接
除网络信息外,还包括客户端的本地内容、相关社区中的同类用户及相关内容的百科全书、参
考资料等。
结束语
龙源期刊网 http://www.qikan.com.cn
智能化搜索引擎能够实现信息服务的人性化、高效化,为用户检索互联网信息提供了极大
的便利。在应用需求和相关科学技术的推动下,智能搜索引擎技术正逐步发展起来,它将会越
来越好地为人们的生活服务。
参考文献
[1]殷雪松,徐斌.WWW网络搜索引擎介绍.大学图书馆学报,1998.
[2]吴丹.搜索引擎的智能化研究[J].情报理论与实践,2002.
[3]李研,陈新中.基于web挖掘的智能门户搜索引擎的研究[J].计算机工程与应用,2002.
[4]张兴华.智能搜索引擎的机理,实现技术及发展趋势[J].现代情报,2003.
[5]沈一栋.知识工程[M].北京:科学出版社,1992.