中文智能搜索引擎技术及其对数字图书馆的影响

合集下载

数字图书馆个性化中文检索技术的研究与实现

数字图书馆个性化中文检索技术的研究与实现

设 当前用 户为u,检 索词 为tk i i 。
信 息等 在内 的各种W b e 数据 ,应用 数据挖 掘方 法发 现有用 的知 识来 帮助 人们 从 W 中提 取知识 ,改 进站点 设计 ,更好 的开 展服 务。 w
Wb 据 挖 掘分 为Wb 用 记 录挖 掘 、Wb 构 挖 掘 、W b e数 e使 e结 e 内容 挖 掘 三
户u百分 比为 f kik w,/ W, +i2 .+ i1) j f : k (llW, 一 .W, 0 ,文档 d的相关 查询权 , , j
值 为W ( l j W, /iIW,/ i2 . ・jl/ i1 ;4 E, )= jlf,+j2f。 +- W, Of,0 )利用 上面 的检 d … 索过 滤算 法计 算W t,j;若W t。 j≥a ( ̄d) l ( d) ,转 5 h :否 则转2 ( :a ; 注 为系统 预先 设定 的过 滤阀值 ) ;5 )检索 用户 是否 曾用tk 索 ,若 是 ,取tk 应 i检 i对 的检 索 历史 记 录 ,检索 d是 否在 检索 结 果集 中 ,若 不是 ,转 6 j ;否 则转 7 ; 6 )查 看d是 否在 浏览 历史 库 中,若不 在 ,标记 为未 读信 息 ,若在 ,标记 为 j 已读信 息 ,加 入 结 果集 PR R ̄P R (j (i j) R ,PR R U d,wU,d) ,转 8 )检查 ;7



预据 个数 网 网 性理 处 化
I 索志析I l志理 检日分 同管
}索配 检匹
检} 索 擎

。 ) ■二
用 建 户模
2个 性化倌 . 囊帕 童义 |捡
i )能缓解 数字 圈书 馆 “ 息 过载 ”和用 户 “ 信 资源 迷 向 ”的问题 。2 ) 可 以更好地满 足用 户对数 字 圈书馆 个性他 信息 的需求 3 )数字 图书馆 的信 息资源 得到有 效 的利 用 论和技术 1 I

大数据时代数字图书馆面临的机遇和挑战

大数据时代数字图书馆面临的机遇和挑战

大数据时代数字图书馆面临的机遇和挑战大数据时代的到来,给数字图书馆带来了前所未有的机遇和挑战。

数字图书馆作为传统图书馆的延伸和拓展,在数字化、信息化的浪潮中正面临着前所未有的变革,同时也面临着前所未有的机遇和挑战。

一、机遇1. 大数据技术的应用大数据技术的应用将为数字图书馆带来巨大的机遇。

大数据技术可以对图书馆所收集到的海量数据进行分析和挖掘,从而发现用户的阅读偏好和需求,优化图书馆的资源配置和服务内容,提升用户体验和满意度。

数字图书馆可以利用大数据技术进行用户画像分析,从而为用户提供个性化的阅读推荐和服务。

这将有助于数字图书馆更好地满足用户的阅读需求,提高用户的使用频率和忠诚度。

2. 面向全球用户大数据时代的数字图书馆可以通过互联网和移动设备面向全球用户提供服务。

数字图书馆可以将自己的资源和服务向全球用户开放,实现数字化的资源共享和交流。

这将有助于数字图书馆拓展用户群体,吸引更多的读者,增加图书馆的知名度和影响力。

数字图书馆也可以通过大数据技术了解全球用户的阅读偏好和需求,及时调整自己的服务内容和战略,提高自己的竞争力。

3. 信息资源的多样性和丰富性在大数据时代,数字图书馆可以通过各种渠道获取丰富多样的信息资源。

数字图书馆可以依托互联网、社交媒体、开放式课程平台等多种渠道获取信息资源,并将这些资源进行整合和共享,为用户提供更加多样化和丰富化的信息服务。

数字图书馆不仅可以收集各类数字图书、期刊和论文,还可以收集各类数字影音资料、大数据文献和开放式课程资源等,为用户提供更加全面的信息服务,满足用户对于不同类型信息的需求。

二、挑战1. 信息安全和隐私保护数字图书馆在大数据时代面临着信息安全和隐私保护的挑战。

随着数字图书馆收集的数据越来越多,信息安全的隐患也越来越多。

数字图书馆需要加强对数据的安全保护,建立完善的信息安全体系和数据备份机制,防范各种网络攻击和数据泄露风险。

数字图书馆也要加强用户信息的隐私保护,保护用户个人信息不被泄露和滥用,建立用户信息保护和权益保障机制,增强用户的信任和安全感。

大数据时代数字图书馆面临的机遇和挑战

大数据时代数字图书馆面临的机遇和挑战

大数据时代数字图书馆面临的机遇和挑战随着信息技术的迅猛发展和互联网的普及,数字图书馆已成为现代社会中不可或缺的资源。

在大数据时代,数字图书馆面临着新的机遇和挑战。

本文将就大数据时代数字图书馆所面临的机遇和挑战进行探讨。

一、机遇1. 数据资源丰富大数据时代,数字资源的丰富和多样化是数字图书馆面临的一大机遇。

通过数字化技术,数字图书馆可以收集、存储和管理各种类型的数字资源,包括电子书籍、期刊论文、音视频资料等。

这些丰富的数字资源为用户提供了更多元化的信息和知识,为数字图书馆的发展提供了新的动力。

2. 数据分析技术提升大数据时代的另一大机遇是数据分析技术的提升。

随着数据采集和处理技术的不断进步,数字图书馆可以通过数据挖掘、机器学习等技术有效地分析和利用大数据资源,为用户提供更加精准的信息检索和个性化的服务。

这为数字图书馆提供了更多的服务扩展和优化的可能性。

3. 服务创新和个性化大数据时代,数字图书馆可以通过数据分析技术,为用户提供更加个性化的服务。

通过分析用户的历史借阅记录、浏览偏好等数据,数字图书馆可以为用户推荐更为符合其兴趣和需求的资源,从而提高用户体验和满意度。

数字图书馆还可以利用大数据技术开展更多的创新服务,如数据可视化展示、数字资源共享平台等,丰富图书馆的数字资源和服务内容。

二、挑战1. 数据隐私和安全问题大数据时代,数字图书馆面临的首要挑战是数据隐私和安全问题。

数字图书馆在收集、存储和处理大量用户数据的必须保证用户数据的隐私安全,合法合规地使用和保护用户的个人信息。

数字图书馆需要加强数据安全管理和技术保障,建立健全的数据安全制度和机制,保护用户的隐私权益。

2. 数据管理和利用大数据时代,数字图书馆需要面对的挑战之一是如何有效地管理和利用大量的数字资源。

数字图书馆需要建立完善的数据管理体系和载体,包括数据存储、备份、检索和共享等方面的技术和机制,确保数字资源的安全和可持续使用。

数字图书馆还需要加强数据标准化和整合,提高数字资源的质量和价值。

图书馆数字化转型对读者信息需求的影响

图书馆数字化转型对读者信息需求的影响

图书馆数字化转型对读者信息需求的影响摘要:随着科技的迅猛发展和互联网的普及,图书馆数字化转型不可忽视。

数字化转型为图书馆带来了更多便利和创新的机遇,使得读者能够随时随地获取所需信息,并获得丰富多样的资源选择。

为了满足读者的信息需求,图书馆需要建设数字化图书资源、优化网络检索工具、推广数字化服务,并利用数据分析技术进行个性化推荐。

通过这些策略,图书馆可以更好地满足读者的信息需求,提供更好的服务。

关键词:图书馆;数字化转型;读者;信息需求;影响分析引言:随着科技的快速发展和互联网的普及,数字化转型已经成为各行业的重要任务,图书馆也不例外。

传统的纸质图书已经无法满足人们多样化的需求,数字资源的优点逐渐被人们所认可和接受,数字化转型也已经实现了图书资源的数字化存储和电子阅览室的开设,提供了更加便利的借阅和阅读体验。

在此背景下,读者的信息需求也发生了巨大的变化。

1.图书馆数字化转型的背景随着互联网的普及和快速发展,人们获取信息的方式发生了根本性的变化。

传统的纸质图书已经难以满足人们多样化的需求,而数字资源具有信息获取和传播的速度快、容量大、便于存储和共享等优点,逐渐成为人们获取知识的主要渠道。

目前的数字化技术,已实现图书资源的数字化存储、数字图书馆的建设、电子阅览室的开设等,为读者提供更加便利的借阅和阅读体验。

此外,数字化转型已推动图书馆与其他文化机构的合作,共享数字资源,提供更加全面的信息服务。

随着社会信息化的进程,传统的图书馆发展面临一系列挑战,包括空间不足、藏书管理困难、读者需求多样化等。

数字化转型可以有效解决这些问题,使图书馆适应时代变化。

2.图书馆数字化转型的现状目前,许多图书馆已经启动了数字化转型,并实现了馆藏资源的数字化,包括电子图书、数字期刊、电子报纸等的建设和推广,读者可以通过图书馆网站或移动设备随时随地访问和借阅数字资源。

此外,图书馆还推出了数字化借阅服务和在线阅读平台,读者可以在线阅读图书馆馆藏的电子书籍和期刊。

图书馆的阅读与人工智能

图书馆的阅读与人工智能

图书馆的阅读与人工智能随着人工智能技术的快速发展,图书馆的阅读方式也正在经历着巨大的改变。

人工智能技术的应用不仅提供了更高效的图书馆管理系统,还为读者提供了更个性化的阅读体验。

本文将探讨人工智能在图书馆阅读中的应用,以及其带来的影响和挑战。

一、智能检索系统随着传统图书馆由纸质图书向数字化转型,图书馆数量庞大的数据库使得读者难以快速找到自己需要的图书。

而基于人工智能的智能检索系统,通过自然语言处理及机器学习等技术,能够更准确地理解读者的需求,并提供相关的图书推荐。

通过智能检索系统,读者可以更快速地找到所需图书,大大提高了阅读效率。

二、个性化推荐人工智能技术能够深入分析读者的阅读习惯、兴趣爱好和阅读水平,从而为读者提供个性化的图书推荐。

利用人工智能的个性化推荐系统,图书馆可以根据读者的阅读历史和偏好为其推荐符合其口味的图书。

这种个性化的推荐不仅提高了读者对图书馆资源的满意度,也拓宽了读者的阅读广度,让他们有机会接触到更多的不同题材和类型的图书。

三、智能学习辅助人工智能技术在图书馆的阅读中还可以提供智能学习辅助功能。

例如,利用人工智能技术,图书馆可以为读者提供自动摘要、关键词提取、重点标记等功能,帮助读者更快速地理解和消化阅读材料。

此外,配合虚拟助手等技术,图书馆还可以提供对图书内容的语音解读,使得对阅读有障碍的读者也能方便地获取知识。

四、挑战与展望虽然人工智能技术为图书馆的阅读带来了诸多便利,但也面临一些挑战。

首先,个人隐私问题是一个需要重视的问题。

人工智能需要获取大量的个人数据才能提供个性化的推荐,而如何保护读者的隐私成为一项重要的任务。

其次,人工智能技术的应用还需要大量的数据支持,而不同图书馆的数据质量和数量存在较大差异,这对于实际应用产生了一定的限制。

此外,人工智能无法完全替代人类,阅读的乐趣和思考的过程无法完全由人工智能取代。

未来,随着人工智能技术的进一步发展,图书馆的阅读方式将会继续改变。

计算机技术在数字图书馆上的应用

计算机技术在数字图书馆上的应用

计算机技术在数字图书馆上的应用数字图书馆是利用计算机技术来构建和维护的一种数字化的,可访问的图书馆服务。

它可以让用户在网络上查找和浏览数字资源,如电子书,期刊文章,报纸文章,学术论文,音乐和视频等。

1. 数字化处理和管理:数字图书馆中的文献资料通常都是通过数字化技术进行处理,在数字化文献库中存储和管理。

数字化文献化的好处是可以提高文献的可读性,方便用户进行搜索和浏览。

数字化处理使得文献转换为数字信号,在计算机中可以方便地存储、检索和传输。

2.信息检索:数字图书馆使用计算机技术来帮助用户查找他们所需要的信息。

搜索引擎将用户输入的关键词与存储在数字库中的文档对比,然后将与关键词相关的文献列出来。

搜索引擎产生的搜索结果是基于关键词匹配的,但是计算机技术也可以提供更高级的搜索功能,例如,根据时间或者作者等定向搜索。

3. 元数据和知识组织:元数据是关于数字资源的描述性信息,包括作者,标题,主题,摘要等。

元数据的存在使得文献库中的资源可以更容易地被理解和搜索。

计算机技术在为元数据管理和组织方面非常重要。

这可以帮助数字图书馆更好地组织和管理所有的数字资源,并确保这些资源可以被用户和计算机系统更好地处理和利用。

4. 可挖掘性:可挖掘性是指数字库中的资料可以被计算机系统进一步分析,整理和利用。

计算机技术可以实现自动提取元数据和分析文献,从而根据具体需求,快速实现文献的分析和处理。

5.数字出版物:计算机技术使数字图书馆能够快速出版数字出版物并流通给读者。

这种数字化出版方式消除了物理传递的限制,使得文献可以快速且广泛地传递到所有需要它的地方。

总之,计算机技术在数字图书馆的应用非常广泛,使得数字化文献库的构建和维护成为可能。

人工智能技术在数字图书馆中的应用

人工智能技术在数字图书馆中的应用

人工智能技术在数字图书馆中的应用随着信息技术的飞速发展,数字图书馆已经成为传统图书馆向数字化方向转型的重要部分。

现代人们的信息需求越来越广泛,数字图书馆通过在线资源的数字化存储、管理和分享,在满足读者需求的同时也进一步提高了知识的传播效率。

而“人工智能技术”则是数字图书馆向智能化方向转型的重要途径。

一. 人工智能技术在数字图书馆中的应用1. 自然语言处理技术自然语言处理技术(NLP)可帮助提高搜索引擎的精确度和速度,改进数字图书馆的检索效率。

它可以分析图书馆中存储的文本并自动标记关键词,利用这些关键词引导用户能够更快地找到自己所需的信息。

此外,NLP技术还可以帮助提高文档的自动分类和归档能力,读者可以更快地查找到内容相关的文献。

2. 数据挖掘和机器学习技术数据挖掘和机器学习技术可以帮助数字图书馆自动化地对大量数据进行分析,甄别出有价值的信息,并基于这些信息提供可靠的推荐服务,精细匹配用户的阅读兴趣,提供更符合用户需求的阅读材料或推荐具有较高参考价值的相关文献。

3. 虚拟助手聊天机器人虚拟助手聊天机器人是一种基于自然语言处理技术、机器学习和语言理解的智能交互系统。

数字图书馆可以与用户在所有时间对话,这种交互方式增加了人机互动的效果,消除了时空限制的阻碍,大大方便了读者的信息查询体验。

二. 人工智能技术在数字图书馆中的意义1. 提高检索效率人工智能技术可以感知读者的需求,进行智能化的分类和搜索,使得查找图书馆资源变得非常高效。

阅读者们可以用更少的时间、更少的步骤找到符合需求的文献。

2. 提供更个性化的服务人工智能技术有助于数字图书馆提供更个性化的服务。

通过深入了解读者阅读喜好和阅读习惯,数字图书馆可以根据用户的个人需求推荐更加适合他们的阅读材料,提高了读者的阅读体验。

3. 提高数字图书馆的内容可访问性数字图书馆提供了各大图书馆海量的文献资源,但是有许多旧的数字化文献因为表现形式、格式等问题,难以被普通读者所访问到。

搜索引擎在高校图书馆信息服务中的应用

搜索引擎在高校图书馆信息服务中的应用

行扩 展 。但如 果扩 展不 适 当会 极大地 降 它 在 一 步 步 深入 人 们 的生 活 ,改 变 人们 的 低 了检 索查准 率 ,因此 一般 的系统对 关 生活 ,互 联 网经济 也进 入 了 “ 索力经 搜
三 、数据提交程序 的原理
每 个 学 生 , 教 师 在 申请 加 入 校 园 键 词 的 扩 展 都 是 很 谨 慎 的 。 所 以 对 关 键 济 ”的时代 。因此许多公司 内部,学校 内
也 不 停 地 在 网络 上 生 产 出 数 之 不 尽 的 新 各个 主机 内部 的信息,其中可 能包含 了个
3 中文分词技术 . 分 词 技 术 就 是 搜 索 引 擎 针 对 用 户
信 息 ,整 个 网络 正在 堆积 成一个 超 级大 人隐私,以及一些个人重要信息[。
型 数 据 库 。 如 何 在 浩 瀚 如 海 的 信 息空 间
而 能 更 进 一 步 的 促进 网络 资源 的共 享 , 更 加 有 效 地 利 用校 园 网络 。
七 、结 语
等 , 而 是 用 户 的 主 机 I , I , 文 件 存 放 统 的 查 全 率 , 一 般 的 系 统 都 对 关 键 词 进 P D 的路径等等 。
互 联 网在 2 世 纪 得 到 了 飞速 的发 展 , l
息 记 录 。检 索 代 理 ( g n ) , 提 供 查 询 键 词提 取 , 关键 词 拓 展 。 Ae t 服 务 , 对 返 回 给 用 户 的 结 果 进 行 排 序 等
处理 。
索 。分 布 信 息 检 索 的 目标 就 是 按 照 一 致
1 问 题 分 类 :对 不 同 类 型 的 问 题 , .
服 端 程 序 进 行 信 息 的采 集 。 当 然 ,采 集 有 用 的关键 字 。并不 是在 问题 中 的每 个 络环境中,对搜 索引擎 的评价 ,用户界面
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2.4 信息服务的主动性
用户只要提出请求,智能引擎就能站在用户的角度,主 动获得相关信息。智能搜索引擎具有主动性,可以在任何 特定的时候(如用户最关心的信息发生某种变化的时候) 用各种方法与用户取得联系,这些方法包括电子邮件、电
·101·
话、传真、移动电话等。智能搜索引擎还可根据用户特定 时刻的位置信息,选择恰当的方法跟用户通信。
1 智能搜索引擎简介
智能搜索引擎是结合了人工智能技术的新一代搜索引 擎。由于它将信息检索从目前基于关键词层面提高到基于 知识(或概念)层面,对知识有一定的理解与处理能力,能 够实现分词技术、同义词技术、概念搜索、短语识别以及 机器翻译技术等。 智能搜索引擎具有信息服务的智能化、人 性化特征,允许用户用自然语言进行信息检索,为他们提 供更方便、更确切的搜索服务。
[摘 要] 本文引入了人工智能与搜索引擎结合的产物——智能搜索引擎,并重点介绍了中文智能搜索引擎 的特性、技术实现、发展现状以及对图书馆行业产生的重要影响。 [关键词] 智能搜索引擎 自然语言理解 人机交互界面 以网对网 数字图书馆 [中图分类号] G250.7 [文献标识码] B [Abstract] This article introduced the product-intelligent engine, which the artificial intelligence and the search engine unify. It introduced with emphasis the characteristic, the technical realization, and the development present situation of Chinese intelligent engine, as well as the influence, which produces to the library profession. [Key words] Intelligent search engine; Natural language understanding; Man-machine interactive contact surface; Net to net; Digital library
随着因特网的飞速发展,网上信息正在成指数级增长。 如何有效地获得人们需要的信息,成为一个很重要的问题。 由于传统的引擎不能适应信息技术的高速发展,新一代自 动搜索引擎的关键技术应运而生,人们提出了一种新的合 作计算模型和人机交互方式,将计算机变成一个智能、主 动和个性化的合作者——将人工智能技术引入信息检索中。 它带有明显的智能特征,因此被称为智能搜索引擎。
2 中文智能搜索引擎的特性 2.1 人机接口的智能化
智能搜索引擎属于第三代搜索引擎,它除了能提供传 统的快速检索、相关度排序等功能外,还能提供用户角色 登记、用户兴趣自动识别、内容的语义理解、智能信息过 滤和推送等功能。中文智能搜索引擎可以通过自然语言和 用户交互。它采用诸如语义网络等智能技术,通过汉语分 词、句法分析以及统计理论有效地理解用户的请求,甚至 能体会出用户的弦外之音,从而最大程度地满足用户的需
工构造同义词库、蕴含词库等辅助词库。另一种方法是从 语料库中自动取得同义词关系,给出一个查询的关键词, 搜索引擎能主动“联想”到与其同义或意义相近的词,提 高信息匹配的准确度。对专用领域的搜索引擎,这种方法 是非常有效的。
3.2 人机交互界面技术
人机界面技术的不同,往往使得搜索引擎表现出不同 的 特 点 。当 前 搜 索 引 擎 涉 及 的 人 机 界 面 技 术 主 要 有 4 类:搜 索请求提交技术、搜索结果表现技术、搜索向导技术、搜 索行为分析技术。
3 中文智能搜索引擎的关键技术及实现
要想真正实现如上所述的智能搜索引擎,还有大量的 工作要做。一种比较实际的做法是将智能技术跟传统搜索 引擎结合,逐步实现智能化。下面就是搜索引擎向智能化 迈进的过程中所涉及的关键技术。
3.1 自然语言理解技术
对自然语言的理解是中文智能搜索引擎关键技术。理 解的困难主要来自意义和功能两个方面,实际上就是歧义 的问题。汉语的语音、语调、轻重音及停顿等,一经书面 表达就可能产生歧义;中文词与词之间没有界定,在进行 分词时很容易产生歧义;汉语虚词多,组词灵活,字在词 中的位置的变化也可能产生歧义。同时,由于搜索引擎所 面对的网络信息不仅数量巨大而且是动态的,给知识表达、 组织、存取和更新都带来了困难。 自然语言的理解是将信息检索从目前基于关键词层面 提高到基于知识(或概念)层面,对知识有一定的理解与 处理能力,能够实现分词技术、同义词技术、概念搜索、短 语识别以及机器翻译技术等。其技术包括机器翻译技术、 语义网络技术、汉语分词技术、短语识别技术、同义词处 理技术等。 3.1.1 汉语分词技术 我们知道,关键词查询的前提是将查询条件分解成若 干关键词,同时以一些关键词表示文档。对英文而言,一 个单词就是一个词。但中文就没有这么简单,主要问题是 中文词与词之间没有界定符,需要人为切分。此外,汉语 中存在大量的歧义现象, 对几个字分词可能有好多种理解。 因此,可以根据语料库进行总结,获得每个词的出现概率 以及词与词的关联信息,再使用正向和逆向最大匹配法进 行细切分,排除歧义,提高分词的准确性。 3.1.2 短语识别技术 关键词查询要将查询条件分解成若干关键词,但这些 关键词并不是孤立的,它们联合起来作为一个短语共同表 述一个完整的含义。短语识别技术就是利用词与词之间的 特定搭配和汉语语法规则,有效地兼顾关键词与它们之间 的关系,从而合理地分词,更加准确地表述查询请求和文 档信息。用短语描述查询请求的情况很常见。譬如查询条 件“北京的大学生”,“北京”和“大学生”存在一定的关 系,但如果不将“北京”和“大学生”联合起来作为一个 短语查询,则除了选出关于“北京的大学生”的文档之外, 还将查出有关“北京”和“大学”的文档。因此,短语识 别也是智能化引擎所关注的一项技术。 3.1.3 处理同义词技术 处理同义词的一种方法是人工构造同义词表,利用人
3.3 以网对网的技术
这里的第一个网络,是人的认知网络,它实际上就是 一个巨大的知识库或概念图,包括概念以及概念之间的种 种 关 系 ,称 为 知 识 库 ,我 们 又 称 之 为 I n n e r n e t。在 计 算 机 上 实现时,这个网络的知识表示方法为语法网络。第二个网 络是因特网,它的信息是搜索引擎要检索和查询的对象, 称为信息库。 3.3.1 知识库 知识库是实现智能搜索的基础和核心。它 如同人脑知识的增长一样,也处于一种自增长自循环的状 态。知识库的丰富程度也同样决定着检索程度的高低。知 识库可以对信息进行接受、判断、提取、分析和概括之后 形成自己的知识,然后保存,成为下一次分析、概括的依 据和基础,这样它就始终处于一种自增长、自循环的状态。 3.3.2 信息库 信息库就是因特网,是一个巨大的、非结 构化而且处于不停变化的信息空间。信息库可以起到两方 面的作用:一是知识库存在和发展的空间,知识库所做的 其实就是对信息库的判断、提取、分析和概括。第二,是 用户所要检索的内容,智能搜索引擎所做的就是通过知识 库把用户的问题提高到知识(概念)的层面,然后利用这 个知识(概念)检索信息库。 3.3.3 二者结合 要做到智能搜索,还必须考虑知识库和 信息库结合的问题,这样才能实现对语义的准确理解,这 是以网对网技术的关键。要使两个核心有机结合,就要做 到以下3点:(1)语义分析,分析用户语言的具体含义。它应 该实现以下几个功能:分词;处理同义词;根据知识库分 析关键词,明确概念和语义,确定用户真正用意;具备一 定程度的知识库。 (2)知识管理,实现知识库的自增长。知 识库增长的基础是对信息库的概括和提取,然后是对知识 库的扩充。 (3)知识检索。知识检索是实现智能搜索的最后 一环,通过前面语义分析结果,明确用户用意,对信息库 进行知识(概念)层次的检索,再给出准确答案及相关问 题进行解答。
4 中文智能搜索引擎发展状况
目前,中文智能搜索引擎开发已经引起了越来越多国 人的关注,也吸引了越来越多的有识之士加入其中,开发
·102·
出了很多有代表性的中文智能搜索引擎。 世界上第一个中文智能搜索引擎为悠游。它于1997年 5 月 投 入 使 用 ,是 以 香 港 中 文 大 学 科 研 成 果 为 基 础 、专 为 中 文设计开发的产品。除具备以西文为基础的搜索引擎的优 点外,还由于融入了计算机人工智能技术,可自动分析中 文网页进行分词处理,并自动提取关键词,建立以关键词 为基础的查询数据库,因而降低了系统开销,大大提高了 查询效率。它充分考虑到中文语句的表达结构以及丰富多 样的词语表达,通过“口语化的提问,智能化的结果”来 满足广大用户的各种查询需求,极大地方便了全球各地采 用不同中文系统的用户。 大连尤里软件开发有限公司于2000年5月推出了全球 中文智能搜索引擎——尤里卡中文智能搜索引擎。它通过 识别用户的自然语言,帮助用户在最短的时间得到最详细、 最准确的答案,为网络用户提供空前的方便和快捷。 孙悟空中文智能搜索引擎是ChinaRen开发并拥有自主 版权的产品。该引擎是目前技术最先进、速度最快的搜索 引擎之一,能按照用户的需求,搜索大陆和港澳台的大部 分中文网站。孙悟空中文智能搜索引擎不仅可用传统的关 键词搜索方式,而且采用了提问式搜索,这是 ChinaRen 研 究并实现的一种智能中文处理技术。通过该技术,用户可 以通过直接提出问题的方式搜索想要找的内容,这样不仅 更符合中国用户平时的习惯,而且准确率更高。
2.3 个性化搜索
中文智能搜索引擎可将搜索建立在个性化的搜索环境 之下,通过观察用户的行为了解用户的兴趣爱好,同时根 据用户的评价调整自己的行为,并对搜索结果进行合理的 解释,使得个性化搜索更符合每个用户的需求,而不仅仅 是准确。智能搜索引擎有效的分类可为用户提供个性化的 服务,允许用户为自己定制起始页面,选择感兴趣的内容 和经常使用的服务放在该页面中。
求。显然,基于自然语言理解技术的搜索引擎,同用户使 用自然语言进行交谈,查询的结果更加准确。
相关文档
最新文档