网络信息检索技术的现状及发展趋势

合集下载

新一代信息技术导论第2章.权责对等—信息素养与社会责任

新一代信息技术导论第2章.权责对等—信息素养与社会责任

信息从业人员行为规范
遵守信息法律法规、自觉抵制不良信息、批 判与抵制不道德的信息行为、信息行为不损害他 人的利益、不随意发布信息等
2.3.3 人工智能治理
深度学习 跨界融合 人机协同
群智开放 自主操控
通用目的性 算法黑箱性 数据依赖性
专业化、多元化、敏捷化、全球化
伦理
人工智能治理
一项复杂的系统工程,既需要明确治 理原则目标、理清治理主体,又需要提出 切实有效的治理措施
信息检索的发展
7.自然语言与人工语言检索并用 自然语言检索是指用自然语言作为提问输入和对话接口的检索方式。作为最终用户,不必考虑如何表
达自己的提问,不必学习一套烦琐的命令、格式或代码,就能得到检索结果,但是这种方法不能完全取代 人工语言检索。人工语言检索的最大优点是用它标引的数据库检索效率(查全率和查准率)相当高,这是 自然语言检索所不能比拟的。因此,这两种检索方式将在并存中为用户提供更多的选择。
区别于其他伦理的明显特征
3.多元性

定义
指在信息社会中,信息来源于不同的 信息主体,导致信息犹如汪洋大海,不仅 量大而且种类多,传播渠道也很丰富

2.3.2 信息从业人员的行为规范
行为规范
社会群体或个人在参与社会活动中所遵循 的各种规则、准则的总称,是社会认可和人们 普遍接受的具有一般约束力的行为标准
狭义
根据特定需要应用科学的方法采用专门的工具,从大量 信息中迅速、准确、相对无遗漏地获取所需信息(文献) 的过程。
信息检索与信息 搜索的区别
2.2.2 信息检索类型
1.内容和对象
① 文献检索 ② 数据检索 ③ 事实检索
信息资源 检索
2.组织方式
① 全文检索 ② 超文本检索 ③ 超媒体检索

(网络信息检索)第10章多媒体信息检索

(网络信息检索)第10章多媒体信息检索
网络信息检索 第10章 多媒体信息检索
多媒体信息检索概述 多媒体信息检索技术 多媒体信息检索系统 多媒体信息检索的应用 多媒体信息检索的挑战与未来发展
目录
01
多媒体信息检索概述
多媒体信息检索是指利用计算机技术,对图像、音频、视频等多媒体数据进行索引、检索和分类的过程。
多媒体信息检索具有多样性、交互性和实时性等特点,能够提供更加丰富、直观和生动的信息检索体验。
利用计算机视觉技术,提取图像中的特征,如颜色、纹理、形状等,为后续的图像检索提供依据。
01
基于内容的图像检索
利用图像的颜色、纹理、形状等特征进行相似度匹配,实现图像检索。
02
基于语义的图像检索
通过图像中的语义信息,如物体、场景、人脸等,进行图像检索。
图像检索技术
基于语义的音频检索
通过音频中的语义信息,如语音、音乐、环境音等,进行音频检索。
基于语义的多媒体信息检索系统通过理解多媒体数据的语义信息进行检索。
总结词
该系统利用自然语言处理技术,对图像、视频和音频中的文字、标签等信息进行语义分析,建立语义索引,实现基于语义的多媒体信息检索。
详细描述
基于语义的多媒体信息检索系统
基于深度学习的多媒体信息检索系统利用深度神经网络进行特征提取和语义理解。
隐私保护
在多媒体信息检索过程中,涉及到用户上传的多媒体内容和个人信息,需要采取措施保护用户隐私。
要点一
要点二
信息安全
确保多媒体信息在存储、传输和处理过程中的安全,防止数据泄露和被非法获取。
隐私保护与信息安全问题
谢谢观看
03
sius,扰,扰ano,间的, but,osd切实
01
. unsubscribe

信息检索文献综述

信息检索文献综述

信息检索文献综述前言:关于信息检索技术的文献综述,一、信息检索技术现状,信息检索技术综述,信息检索技术实现了把信息检索从基于关键词层面提高到知识层面,从传统的基于关键词的检索到吸引广大研究者眼球的语义检索,传统的基于关键词信息检索,语义检索是把信息检索与人工智能技术、自然语言处理技术相结合的检索技术,它从语义理解的角度分析信息对象和检索者的检索请求,提高了检索性能,语义检索技术将有一个长期深入研究的过程。

关于信息检索技术的文献综述一、信息检索技术现状【1】梁鸿雁,信息检索技术综述,2010(9),软件导刊,35~37,在现有研究的基础上,信息检索技术实现了把信息检索从基于关键词层面提高到知识层面。

从传统的基于关键词的检索到吸引广大研究者眼球的语义检索。

实现了把信息检索从基于关键词层面提高到知识层面。

传统的基于关键词信息检索,已取得了很大的成功,但是它不能从根本上表达用户的查询请求。

语义检索是把信息检索与人工智能技术、自然语言处理技术相结合的检索技术,它从语义理解的角度分析信息对象和检索者的检索请求,提高了检索性能。

但由于自然语言理解和人工智能等领域的局限,语义检索技术将有一个长期深入研究的过程。

二、信息检索技术类型及方法【1】赵阳,浅谈信息检索技术,2012年11月,科技创新与应用,45,介绍了当今比较热门的两种信息检索技术:第一,智能检索或知识检索传统的全文检索技术基于关键词匹配进行检索,智能检索利用分词词典、同义词典,同音词典等改善检索效果,还可在知识层面或者概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。

第二,知识挖掘,目前主要指文本挖掘技术的发展,目的是帮助人们更好的发现、组织、表示信息、提取知识,以满足信息检索的高层次需要。

【2】孙广维,多媒体信息检索技术的研究,2012,6 ,吉林建筑工程学院学报,79~81,作者提出传统的多媒体检索方法处理比较简单,有的仅通过多媒体的外部属性和简单的文字描述进行检索,还脱离不了文本、数值和关键词的检索范畴,对图像、音频、视频信息则只有浏览或查看功能,缺乏多媒体本质特征的描述,在多媒体数据库中集成了图像、视频、音频等非文本信息,这样我们就可以用图像、音频、视频信息方便的进行检索。

信息检索教学在网络环境下的现状及改革建议的论文

信息检索教学在网络环境下的现状及改革建议的论文

信息检索教学在网络环境下的现状及改革建议的论文信息检索教学在网络环境下的现状及改革建议的论文在当前竞争日常激烈的信息化社会中,如何着手来加强现代化的信息教育,大力培养学生的创新意识,已经成为了当前教育的重要问题,高校的文献检索课程也正是为了更好满足这一需要而存在的。

文献检索能力可以有助于学生自学能力的培养,因为在文献检索的过程中,也可以培养学生的批判性思维和解决问题的能力。

随着互联网越来越发达,信息资源也就更加多载体化,这一切都迫切需要对目前的信息检索课程教学进行改革,以适应社会发展的要求。

1文献教学课程的改革目标文献检索课程本质上是一种较为重要的科学方法课程,其重点就在于传播文献检索的技巧技能,以及对图书馆资源进行有效利用方面的知识。

伴随着当前信息化浪潮的到来,文献检索课程迫切需要转变以往的教学方式,重点培养学生的创新思维能力,增强学生获取信息的能力,来满足社会对于高级检测人员的需求。

1.1加强学生的信息概念信息概念主要是指人们对于信息需求所产生的自我意识,本质上是人们要从信息的角度来观察、感受所有的行为状况,进而来有效地对信息进行利用的能力。

有意识地来培养学生的信息能力,可以帮助他们从各个方面来找到有价值的信息,提高他们的信息意识,帮助学生更加了解信息的内涵。

1.2增强学生的信息获取能力在当前的高校中,随着数字化图书馆的建设,学生已经可以在图书馆中获得海量的信息资源,学生也可以有针对性地选择各种不同的信息载体来制定有效的信息检索策略。

学生需要积极地把自身所学到的理论知识应用到实际的检索过程中,以便可以高效率地找到自己需要的信息,信息的获取需要学生具备完整的信息工具使用能力、筛选信息的能力、多线程同时处理各种信息的能力[1].2当前的信息检索教学现状2.1教学内容严重脱节当前使用的信息检索教材内容严重滞后于时代的发展,教材的主要内容仍旧处于数据库理论方面的旧知识,很少涉及目前迫切需要的信息安全意识、网络道德培养等方面的内容,这样的教材现状也就从根本上使得学生的信息意识不高、信息观念较为淡薄,这样的教材培养出来的学生自然也就达不到信息化社会的需要。

网络环境下信息检索的方法与技巧.

网络环境下信息检索的方法与技巧.

参考工具书是根据一定的需 要汇集有关方面资料,并按特 定方式编排,以供读者检索事 实性和数据性信息的图书。根 据所收录的内容及所具备的功 能,参考工具书可分为:字典、 词典,百科全书,年鉴,名录 等类型。
1、字典、词典
字典、词典是我们最熟悉、最常 使用的工具书。字典、词典的种类 很多,图书馆收藏有不少印刷型的 字典、词典,如辞海、英汉词典等 等。随着Internet的快速发展,网 上也涌现出了越来越多的字、词典 检索网站,数百种字词典在网上可 免费获得
1、手工信息检索:通过人脑的思维判断从书本式
的检索工具(《全国报刊索引》、《中国生物学文 摘》)中查找出自己所需要的信息。 2、联机信息检索:利用终端设备,通过国际通讯 网络和计算机检索系统连接,远距离地从国际联机 检索系统的数据库中检索出所需信息。最著名的国 际联机检索服务系统有美国的DIALOG,ORBIT和欧 洲的ESA-IRS等。 3、光盘信息检索:光盘检索是指利用光盘数据库 检索文献信息。目前的光盘检索有两种形式:—种 是利用自己购买的光盘版的数据库进行检索;另一 种是在联网环境下利用网络版的光盘数据库进行检 索。我们工大图书馆就订购了许多光盘数据库,如:
网上年鉴类站点主要有:
(1) 中华人民共和国统计局:设有统计数据、统计信息、 统计分析等栏目,可查到我国各行各业的最新统计数 据,还可链接到我国各省、市和国务院所属部委、直 属机构的网站(/ ) (2) 中国网 -- 中国统计数据:该网站提供了 2000-2004 年 工 业、投资、国内外贸易、物价、进出口、金融财政 等方面的及时、可靠、权威的中国宏观经济月度统计 资料,所有资料都来自中国国家统计局。 (/ch-company/index.h (3)浙江统计信息网:该网站设有浙江省情、统计数据、 统计信息、统计公布、统计法规等栏目,有地区生产 总值、工业、农业国内贸易、财政金融、物价、居民 家 庭 收 入 等 方 面 的 最 新 统 计 数 据 。 (/)

信息检索的现状和趋势

信息检索的现状和趋势

信息检索的现状和趋势
信息检索是指用户通过信息系统(如搜索引擎、数字图书馆等)来查找和获得所需要的信息的过程。

目前,随着互联网的普及和信息科技的不断发展,信息检索正面临着以下的现状和趋势:
1. 大数据时代:随着数据量的不断增加,与之相关的问题也愈发复杂,包括如何高效地存储、管理和处理这些数据,以及如何准确地提取有价值的信息。

2. 智能化:信息检索领域正朝着智能化方向发展,涉及机器学习、自然语言处理等技术,可以帮助用户更快更准地找到所需要的信息。

3. 面向普通用户:越来越多的人开始使用互联网和数字设备,他们对信息检索的需求也越来越强,因此信息检索的技术和服务需要更加贴近普通用户的需要。

4. 社交化:人们越来越倾向于通过社交网络和社交媒体来获取信息。

因此,信息检索技术需要将社交化的元素纳入其中,并结合社交网络中的人际关系等信息来提供更为个性化和精准的检索服务。

5. 面向多语言和多媒体:随着跨国公司和跨国组织的不断涌现,信息检索不仅要面对多种语言的问题,还要面对多媒体内容的问题,这也成为信息检索技术需求的重要部分。

综上所述,信息检索技术正以智能化、社交化、便于使用为主要趋势,同时还需要结合大数据、多语言、多媒体等特点来满足用户的需求。

信息检索技术在大学计算机教学中的应用实践

信息检索技术在大学计算机教学中的应用实践

信息检索技术在大学计算机教学中的应用实践1.信息检索技术的定义与分类:信息检索技术是指从大量信息资源中,根据用户需求,采用一定的检索策略和算法,快速、准确地获取相关信息的技术。

根据信息检索的载体类型,可以分为传统文献检索和数字信息检索;根据检索方式,可以分为目录式检索、全文式检索和集合式检索等。

2.信息检索技术的发展:信息检索技术起源于20世纪初,随着计算机技术的不断发展,逐渐形成了基于计算机的信息检索技术。

在互联网普及的背景下,信息检索技术得到了空前的发展,涌现出了许多高效、智能的检索方法和技术。

3.信息检索技术在大学计算机教学中的意义:信息检索技术在大学计算机教学中具有重要作用,可以帮助学生提高信息素养,掌握信息获取的方法和技巧,培养独立思考和创新能力,提高学术研究和实际应用能力。

4.信息检索技术在大学计算机教学中的应用:(1)教学资源检索:教师和学生可以通过信息检索技术,快速找到所需的教学资源,如教材、课件、学术论文等。

(2)学术研究检索:学生可以利用信息检索技术,对相关领域的学术研究进行深入挖掘,提高学术创新能力。

(3)实践项目检索:教师和学生可以通过信息检索技术,查找相关的实践项目案例,为课程设计和实践操作提供参考。

(4)技术动态检索:教师和学生可以及时了解计算机领域的最新技术动态,紧跟行业发展趋势。

5.信息检索技术在大学计算机教学中的实践策略:(1)加强信息检索基础教育:在计算机教学中,加强信息检索基础知识的教育,使学生了解信息检索的基本原理和方法。

(2)培养信息检索技能:通过课程实践、实验操作等方式,培养学生运用信息检索技术解决问题的能力。

(3)提高信息检索素养:引导学生树立正确的信息观念,提高信息检索道德和法律意识,培养良好的信息检索习惯。

(4)融入信息技术教育:将信息检索技术融入计算机课程教学,提高学生的信息技术应用能力。

6.信息检索技术在大学计算机教学中的挑战与对策:(1)信息过载:针对信息过载问题,教师和学生应掌握有效的信息筛选和评估方法,提高信息检索的准确性。

信息检索技术在互联网搜索中的应用

信息检索技术在互联网搜索中的应用

信息检索技术在互联网搜索中的应用互联网的快速发展使得我们可以在网上轻松获取各种信息。

但是因为信息的爆炸性和网络的匿名性,我们不得不在浩如烟海的信息中寻找出自己所需要的资料。

然而,人工的搜索难免会有误判和疏漏,而信息检索技术则是一种有效的方法来处理这些问题。

信息检索技术是一种处理和组织信息的技术。

它通过分析和处理信息来帮助用户快速找到他们需要的信息。

这种技术可以应用于各种各样的工作中,例如智能客服、搜索引擎、大数据分析等。

在这篇文章中,我们将重点分析信息检索技术在互联网搜索中的应用。

一、信息检索技术信息检索技术是一种基于自然语言处理和数据挖掘的技术。

它通过处理和解释用户的搜索词汇,帮助用户找到他们所需要的信息。

信息检索技术通常是通过搜索索引来实现的。

搜索索引是一种包含搜索引擎所找到的网页的数据库。

通过搜索索引,搜索引擎可以从海量数据中快速查询用户所需要的信息。

信息检索技术的核心是分词、索引和排序。

分词指的是将用户的搜索词汇拆分成各个单词。

这个过程是通过自然语言处理技术来实现的。

分词的目的是让搜索引擎能够更好地理解用户的搜索词,从而更准确地匹配信息。

索引是将搜索引擎所搜集到的网页和内容分门别类地存放在数据库中。

这样,当用户使用搜索引擎进行搜索时,搜索引擎可以更快速地找到用户所需要的信息。

排序是将搜索引擎所找到的所有网页按照用户的需求按照相关性、可信度、时间等多个指标进行排序。

通过排序,搜索引擎可以帮助用户更快地找到他们所需要的信息。

二、信息检索技术在搜索引擎中的应用信息检索技术的应用非常广泛,其中最常见的就是搜索引擎。

搜索引擎是一种通过搜索索引来帮助用户查找互联网上信息的工具。

搜索引擎利用信息检索技术帮助用户快速地找到他们所需要的信息。

在搜索引擎中,信息检索技术负责将用户的搜索关键词拆分成各个单词,并将这些单词与搜索索引中的内容进行匹配。

通过匹配,搜索引擎可以找到与用户的搜索词相关的网页。

然后,搜索引擎会通过排序来显示与用户需求相关的信息。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

网络信息检索技术的现状及发展趋势摘要1990年以前,网络信息检索的现状与发展没有任何人能够检索互联网上的信息。

应该说,所有的网络信息检索工具都是从1990年的Alan Emtage等人发明的Archie开始的,虽然它当时只可以实现简单意义上的FTP文件检索。

随着World Wide Web的出现和发展,基于网页的信息检索工具出现并迅速发展起来。

1995年基于网络信息检索工具本身的检索工具元搜索引擎由美国华盛顿大学的Eric Selberg 等发明。

伴随着网络技术的发展,网络信息检索工具也取得了十足的发展,那么这些检索工具的现状和发展趋势如何呢?本文将试作以探讨。

关键词网络;信息;检索;发展近年来,互联网得到了迅速的发展,网上信息资源愈来愈庞大,且信息具有量大、分散、异构等特性,因此,传统的Web信息检索工具开始暴露出它性能低下的一面,具体体现在现有的信息检索工具对用户的要求常常是找出了几千甚至上万条记录,根本无法从中再细找,或者找到的内容和要找的内容不是一个专业领域的,造成信息无效的现象。

但随着人们信息意识的增强,对信息内容及信息服务的需求也在不断的演变和发展,对获取信息的专业化、实效性等方面有了新的要求。

如何针对专业领域中特定的用户群为他们提供专业的、度身量造的信息服务,使用户在尽可能短的时间内有效的找到最需要的信息内容是大家普遍关注的一个问题。

本文利用网格计算、集群系统、XML等技术设计了一个基于网格的面向专业内容的Web信息检索体系结构,它能将地理位置分散的、异构的信息按地区按专业内容从逻辑上进行合理的组织和管理,为用户快速、有效地获取自己所需要的信息提供了一种方法。

一、基于网页的网络信息检索工具的现状和发展趋势(一)现状网页是因特网的最主要的组成部份,也是人们获取网络信息的最主要的来源,为了方便人们在大量繁杂的网页中找寻自己需要的信息,这类检索工具发展的最快。

一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目录两种。

网页搜索引擎是通过“网络蜘蛛”等网页自动搜寻软件搜索到网页,然后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络可访问的数据库,供人们检索网络信息的检索工具。

网络目录则是和搜索引擎完全不同,它不会将整个网络中每个网站的所有页面都放进去,而是由专业人员谨慎地选择网站的首页,将其放入相应的类目中。

网络目录的信息量要比搜索引擎少得多,再加上不同的网络目录分类标准有些混乱,不便人们使用,因此虽然它标引质量比较高,利用它的人还是要比利用搜索引擎的人少的多。

但是由于网络信息的复杂性和网络检索技术的限制,这类检索工具也有着明显的不足。

(1)随着网页数量的迅猛增加,人工无法对其进行有效的分类、索引和利用。

网络用户面对的是数量巨大的未组织信息,简单的关键词搜索,返回的信息数量之大,让用户无法承受。

(2)信息有用性评价困难。

一些站点在网页中大量重复某些关键字,使得容易被某些著名的搜索引擎选中,以期借此提高站点的地位,但事实上却可能没有提供任何对用户有价值的信息。

(3)网络信息日新月异的变更,人们总是期望挑出最新的信息。

然而网络信息时刻变动,实时搜索几乎不可能,就是刚刚浏览过的网页,也随时都有更新、过期、删除的可能。

(二)发展趋势网络信息检索工具的发展主要体现在进一步改进、完善检索工具和检索技术,以提高检索服务质量,改变网络信息检索不尽如意的地方。

主要体现在以下几个方面:1网络检索工具开发提供商之间合作越来越紧密过去一般网络检索工具提供商只依靠自己建立的数据库来提供检索服务,检索范围有限,而现在某些著名的搜索引擎在购买其他公司的数据库或者技术内核,有的与其他搜索引擎建立伙伴关系,以便用户使用。

比如著名雅虎现在采用的是Google的搜索内核,网易也曾经使用Google的搜索内核技术来丰富自己的搜索引擎数据库,硅谷动力、广州视窗、新浪、搜狐、Chinaren、21cn、263、Tom等搜索引擎使用融合了百度的搜索内核技术等等。

2信息检索工具专业化及服务内容深化一些检索工具已经不再盲目追求加大收录和标引量,而更加注重突出专业特色。

在lycos搜索引擎目录中,我们可以看到商业搜索引擎、IT搜索引擎、人才搜索引擎、金融搜索引擎、医学搜索引擎等专业化的网络信息检索纷纷出现,信息检索工具的专业化已经成为一种不可逆转的趋势。

信息检索服务商将服务更加深化:Google推出了网页引文查询服务,通过它可以查看自己所要查询的资料被其他网站引用的情况,从而使用户更好的把握网页信息的质量;2003年8月,第三代中文搜索引擎慧聪问世,它则集“广泛的地域搜索”、“强大的行业搜索”、“完美的MP3、Flash搜索”众多搜索功能为一体,还开发了“针对内容的相关性查询”和“符合汉语特性的模糊查询”,可以实现汉语拼音查询和同音词纠错。

3网络信息工具智能化的发展趋势(1)信息检索工具的智能化首先是网络蜘蛛的智能化。

针对网络信息的动态更替性,网络蜘蛛通过启发式学习采取最有效的搜索策略,选择最佳时机获取从Internet上自动收集、整理的信息。

网络蜘蛛能在网络的任何地方工作,能尽可能地挖掘和获得信息。

网络蜘蛛还要有网页跟踪监测功能,如果网页出现更新、删除等情况要及时在数据库中更新。

网络蜘蛛具有跨平台工作和处理多种混合文档结构的能力。

(2)其次是检索软件的智能化。

现在主要有智能搜索引擎、智能浏览器、智能代理。

这些网络检索工具都非常重视开发实现基于自然语言形式的输入,检索者可以将自己的检索提问以及所习惯的短语、词组甚至句子等自然语言的形式输入,智能化的检索软件将能够自动分析,而后形成检索策略进行检索。

比如现在的百度搜索可以在你输入关键词以后,不断提供一些相近的关键词供你选择,直至找到你所需要的结果。

Google则借助于机器翻译技术,将一种自然语言转变成另外一种自然语言,使用户能够使用母语搜索非母语的网页,并以母语浏览搜索结果。

尤里卡、问一问、和国外的ASK Jeeves则通过语义技术和检索技术的结合,可是实现检索工具对搜索词在语义层次上的理解,为用户提供最准确地检索服务。

二、基于FTP文件的搜索工具。

(一)现状如前所述,搜索引擎的雏形以及最早的搜索引擎都是基于FTP文件搜索的。

最早的FTP搜索引擎是基于文本显示的Archie。

后来由于WEB的出现,FTP搜索引擎发展受到了一定的影响。

直到基于WEB的FTP搜索引擎出现,它才越来越多受到人们的欢迎,用户量也在迅速上升,重要性也日渐显现出来。

FTP搜索引擎的功能是搜集匿名FTP服务器提供的目录列表并向用户提供文件信息的查询服务。

目前,国内做的最好的、规模最大的当属天网FTP文件搜索引擎,现在可以搜索2400万个文件(数据来源于天网主页),2002年时的统计日访问量是40万次,这在世界FTP搜索引擎界也算是一个佼佼者。

另外国内还有清华9#搜索引擎、西安交大思源搜索、华南木棉搜索引擎、网络指南针、中科大天狼搜索引擎以及南京理工的“一网打尽”搜索引擎等等,国外的有、、、和等,其中是目前国外最先进的,支持包括站点快照和文件分类等新兴功能,而且文件数据量非常大。

近几年来,虽然FTP搜索引擎技术发展的很快,但相对WWW搜索引擎而言,FTP搜索引擎为数不多,技术上也还不十分成熟,还有很多需要改进的地方:(1)FTP搜索引擎的收录数量还比较少,搜索引擎的规模和质量还是要取决于其维护的信息量。

据统计,全球匿名FTP服务提供的文件条目已经有数亿条,即便是目前规模最大的,据陈华、李晓明2002年7月份统计也只有209,698,206 个文件。

(2)检索功能还不完善。

检索功能是一个搜索引擎最重要的部分,有很多搜索引擎还不能支持“and”和“or”等简单的布尔检索,使得数据库中的文件不能被检索到。

(3)FTP服务器本身特点决定了FTP搜索引擎弱点,即由于FTP服务器有开放时间、有的还限制IP地址、有的限制登陆的用户量、不同的服务器设立的联接端口号并不相同等决定了其搜索到的结果有一部分是不能访问的,大大降低了用户的满意度。

(二)发展趋势正如前文所述,FTP文件搜索引擎技术还不是很成熟,但其发展非常迅速,其发展趋势主要表现在以下几个方面:(1)检索功能日益丰富。

天网FTP文件搜索引擎现在可以实现以文件大小、文件的上传日期、以及网段(比如说是华北网、华东网等)等多个条件的高级检索来限制检索结果;增加了检索方式(规则表达检索、准确检索、浏览、对大小写敏感与否等等),限制主机(是edu还是gov或者com等),文件类型以及文件大小、日期等功能。

(2)检索服务的个性化。

现在FTP搜索引擎研究者已经开始注意这一方面,天网ftp搜索引擎已经有了很多可以个性化的选项:可以设置用户不同偏好的排序方式,可以设定国外文件优先还是本国文件优先,对于国外用户是不是应该国外文件优先,是FTP上文件优先还是WWW上的文件优先,是选择中文的还是英文的等等。

则是可以完成更丰富的个性化设置,比如说可以选择一个主机提供一个结果、设置语言、搜索的文件大小设置、是否亮度显示搜索关键词、设置使用者语言、以及键盘快捷键等等。

三、基于网络检索工具的检索技术的现状和发展趋势。

(一)现状随着网上信息资源的膨胀发展,一种搜索引擎,无论它多么完善都不可能满足一个人所有的检索需求。

如果遇到文献普查、专题查询、新闻调查与溯源、软件及MP3下载地址搜索等情况,人们就更需要使用多种搜索引擎来比较、筛选和相互印证。

为解决逐一登陆各搜索引擎,在各搜索引擎中分别多次输入同一检索请求(检索字串)等烦琐操作,基于网络检索工具的检索工具产生了。

目前这列检索工具只要有两种:集成搜索引擎和元搜索引擎。

所谓集成搜索引擎是在一个检索界面上链接若干种独立的搜索引擎,检索时,一次检索输入,可以指定搜索引擎也可以要求多个引擎同时检索,搜索结果由各搜索引擎分别以不同页面提交的网络检索工具,其实是利用网站链接技术形成的搜索引擎集合。

集成搜索引擎制作与维护技术简单,可随时对所链接的搜索引擎进行增删调整和及时更新,尤其大规模专业(如FLASH、MP3等)搜索引擎集成链接,深受特定用户群欢迎。

如国内天网搜霸和百度搜霸,国外比较著名的有“搜索之家”(/)、“网际瑞士军刀”(/~free/search1.htm)等。

另一个是元搜索引擎,用户只需递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。

国外比较著名的元搜索引擎有Vivisimo、EZ2WWW、Kartoo、SurfWax、Fazzle(以上五个为2002年度的最佳元搜索引擎)等。

目前国内现在还没有见到真正意义上的元搜索引擎。

相关文档
最新文档