网络信息检索及其检索工具
第七章 Internet 信息检索工具—搜索引擎

(4)用户接口
供用户输入查询,显示匹配结果。 用户接口的设计和实现使用人机交互的 理论和方法,以充分适应人类的思维习 惯。
4、搜索引擎的主要任务
(1) 信息搜集 各个搜索引擎都派出绰号为蜘蛛(Spider)或机 器人(Robots)的“网页搜索软件”,在各网 页中爬行,访问网络中公开区域的每一个站点 并记录其网址,将它们带回搜索引擎,从而创 建出一个详尽的网络目录。由于网络文档的不 断变化,机器人也不断地把以前已经分类组织 的目录更新。
第七章 Internet 信息检索工 具—搜索引擎
7.1搜索引擎基本理论
1、什么是搜索引擎?
简单地说,所谓搜索引擎,就是采用信息自 动跟踪标引等技术、建立在因特网上专门提 供网络信息资源导航服务检索工具。 它能够通过Internet 接受用户的查询指令 ,并向用户提供符合其查询要求的信息资源 网址。
5、搜索引擎的种类
检索型搜索引擎:它使用自动索引软件来发现、收集并标引网 页,建立数据库,并以Web形式让用户找到所需信息资源。比 较著名的有:息系统地分门归类,经过人工 整理后形成庞大而有序的分类目录体系,用户可以在目录体系 的导引下通过逐级浏览,发现、检索到有关的信息。雅虎就是 以卓越的分类目录型导航服务而称誉全球,典型的分类目录搜 索引擎如Yahoo ( /) 混合型搜索引擎:它兼有检索型和目录型两种方式。如:新浪、 搜狐、网易、中华等门户网站。 多元搜索引擎:也称为集合型搜索引擎。它是将多个搜索引擎 集成在一起,通过统一的检索界面进行网络信息多元搜索 的 检索工具。按照工作方式的不同可分为并行处理式和串行处理 式两大类。著名的有: Meta crawler、Dogpile、Mamma和万 维搜索(Http:///)等。
引号 引号( “ ” )的作用是,括在其中的多个词 被当作一个短语来检索。绝大部分主要搜索引 擎都支持短语检索,找到含有与短语词序和意 义完全相同的页面。例如,检索式 “ electronic magazine ” ,表示把 electronic magazine 当作一个短语来搜索。 如果不加引号,搜索引擎就会把两词之间的空 格按“与”处理,查出包含 electronic 和 magazine 的页面,结果应与用户要求的主题 内容相去甚远。
第六讲 09秋 网络信息资源检索工具

搜索引擎
常用或有发展前景的搜索引擎类型:
• 图像搜索型
图像搜索引擎是面向因特网上嵌入式图像或被链接的图像,通常 要实现以下功能:允许用关键词搜索图像内容、日期和制作人;能通过 颜色、形状和其他形式上的属性进行搜索;把图像作为搜索结果的一部 分显示。 图像搜索引擎通过显示一张略图、图像的URL、存放图像的站点 的URL以及有关图像的某些信息的方式显示搜索结果。
• 常用中文搜索引擎 • 常用英文搜索引擎 • 元引擎
搜索引擎
• 常用中文搜索引擎
• 搜狐 • 雅虎中国• 新浪• • 天网* * * * *
• • • • • •
常用英文搜索引擎 Yahoo! * Google * Excite * Hotbot * Lycos *
搜索引擎 *
• • 搜狐 网址 : 1).搜狐是由爱特信公司(ITC )1998年2月在北京推 出,正式向互联网用户提供服务的,其提供一个详 尽的Web分类目录,采用树型结构 • 其检索界面分为:简单检索(关键字查询)和高级 检索两种形式 • 对检索资源类型按网站、网页、类目、新闻 网址 等五种类型划分 • 默认状态下是逻辑与的关系 对检索结果根据分类类目及网站信息与关键字串的相 关程度来排序
系统检索软件接受用户提交的检索提问后,按照本系统 的句法规定对用户输入的字符串、运算符、标识符、空格等 进行识别和判定后,代理用户在数据库中检索,并对检索进 行评估比较,按与检索结果的相关程度排序后提供给用户。
搜索引擎
• 搜集 判断 标引 分类
主题 加工 数据库
目录索引库 创建 检索界面 Web页面导航
搜索引擎 *
• • 5) 新浪 URL 1998年12月底推出新浪中文网站8个大类) • 可分为网站、网页、新闻标题、新闻全文、图片、 软件检索 • 特点:1)在关键词查询的反馈结果中,在同一页面上 包含网站、网页、新闻标题、新闻全文、图片、软 件、商品等各类信息的综合搜索结果,使用户得到 最全面的信息 分类目录内容比较新,如XML、JSP、蓝牙等建立类目 较快 提供相关检索功能 具有中文网址搜索功能• 第二代搜索引擎 搜狗 ?• 第三代搜索引擎
网络信息检索工具——搜索引擎.ppt

14
利用Google进行专题信息检索
1 简单专题信息检索及目录检索 接受一项简单专题,最直截了当就是在搜索框内输入一个 关 键 词 , 然 后 点 击 下 面 的 “ Google 搜 索 ” 按 钮 ( 或 者 直 接 回 车),结果就出来了。 如果对查询的领域熟悉,只想寻找某些专题网站,首先考虑 用目录检索。目录分类明确,则网站专题信息集中,剔除了大 量不相关的信息。不过对查找中文信息,Google的中文目录太 少只有非常普通简单的类目,可能很难满足需求(中文目录 “/Top/World/Chinese_Simplified/” )。
搜索器、分析器、索引器、检索器和用户接口。
同检索数据库一样,利用搜索工具检索,也需要用户能 够将自己的检索需求编制成合适的检索策略,并且需要 一定的检索技巧。
搜索引擎采用的检索词和信息标识词匹配运算的主要方 法有:布尔逻辑检索、截词检索、限制检索、加权检索、 词位置检索和全文检索等。
2019-8-17
感谢你的观看
2
搜索引擎分类
检索型搜索引擎:它使用自动索引软件来发现、收集并标 引网页,建立数据库,并以Web形式让用户找到所需信息 资源。比较著名的有:引擎将信息系统地分门归类,经过 人工整理后形成庞大而有序的分类目录体系,用户可以在 目录体系的导引下通过逐级浏览,发现、检索到有关的信 息。雅虎就是以卓越的分类目录型导航服务而称誉全球。
-横向相关查询: 当用户找到某个感兴趣的网页,搜索引擎提供查询内容近似的其 他网页的功能(不限于同一网站)。一般是在信息条目后面给出 “Similar Pages”或“More results like this”链接。 -除上述功能外,现在搜索引擎都纷纷开始提供分类搜索,如新 闻搜索、图象搜索、新闻组搜索、Flash搜索等等。
Internet网络信息检索技巧

搜索引擎分类
检索型搜索引擎:它使用自动索引软件来发现、收集并标 引网页,建立数据库,并以Web形式让用户找到所需信息 资源。比较著名的有: A信息系统地分门归类,经过 人工整理后形成庞大而有序的分类目录体系,用户可以在 目录体系的导引下通过逐级浏览,发现、检索到有关的信 息。雅虎就是以卓越的分类目录型导航服务而称誉全球。 混合型搜索引擎:它兼有检索型和目录型两种方式。如: 新浪、搜狐、网易、中华等门户网站。 多元搜索引擎:也称为集合型搜索引擎。它是将多个搜索 引擎集成在一起,通过统一的检索界面进行网络信息多元 搜索 的检索工具。
3.5其他用法类似的限定检索
参阅英文Google大全。
()
Yahoo是因特网上历史最悠久、用户数最多的综合型、混 合型搜索引擎,是分类式搜索引擎的典范。它拥有10余种 语言版本,且各版本的内容互不相同。 如果用户的检索词在Yahoo !中查询不到结果,它会自动 将查询转交给Google搜索引擎做进一步的检索。 Yahoo!支持词语检索和“+‖ 和“–‖限制检索等,它还提 供日期限定、URL和题名限制检索等。“+‖限定关键字串 一定要出现在结果中; “–‖限定关键字串一定不要出现在 结果中。
利用Google进行专题信息检索
1 简单专题信息检索及目录检索 接受一项简单专题,最直截了当就是在搜索框内输入一个 关键词,然后点击下面的“ Google 搜索”按钮(或者直接回 车),结果就出来了。 如果对查询的领域熟悉,只想寻找某些专题网站,首先考虑 用目录检索。目录分类明确,则网站专题信息集中,剔除了大 量不相关的信息。不过对查找中文信息,Google的中文目录太 少只有非常普通简单的类目,可能很难满足需求(中文目录 “/Top/World/Chinese_Simplified/”) 。
网络信息资源检索4

第四章 Internet信息检索 1 2 3 4 网络信息检索的一般方法 网络信息检索工具 相关网络信息检索技术 搜索引擎及其原理
1 网络信息检索的一般方法
1.1 浏览
1.2 通过网络资源指南来查找信息 1.3 利用搜索引擎进行信息检索
1.1 浏览
(1)偶然发现。
这是在因特网上发现、检索信息的原始方法。
等功能。
2 网络信息检索工具
网络信息检索工具是指在因特网上提 供信息检索服务的计算机系统,其检索的 对象是存在于因特网信息空间中各种类型 的网络信息资源。
近来具一般是由自动索引程序、 数据库和检索代理软件组成的。
自动索引程序
即在日常的网络阅读、漫游过程中,意外发现一些
有用信息。这种方式的目的性不是很强,其不可预 见性、偶然性使检索过程具有某种探索宝藏的意味, 也许会充满乐趣,但也可能一无所获。
(2)顺“链”而行。
指用户在阅读超文本文档时,利用文档中的链接从一网
页转向另一相关网页。有些类似于传统文献检索中的“追溯 检索”,即根据文献后所附的参考文献目录去追溯相关文献, 一轮一轮地不断扩大检索范围。这种方式可以在很短的时间 内获得大量相关信息,但也有可能在“顺链而行”中偏离了
3、提供检索服务 用户输入关键词进行检索,搜索引擎从 索引数据库中找到匹配该关键词的网页;为 了用户便于判断,除了网页标题和URL外, 还会提供一段来自网页的摘要以及其他信息。
第三章网络信息检索工具

第三章网络信息检索工具【知识框架】信息检索的一般流程网络经贸信息资源的概念与类型网络资源查询方法及检索工具▪按检索机制分:目录型(Subject directory, catalogue)索引型:搜索引擎(Search Engine)混合型(Hybrid tools)▪按检索内容分:综合型专题型特殊型▪按包含检索工具数量分:单一型(Singular search tools)集合型(Collective search tools):元搜索引擎(Metasearch Engine或Megasearch Engine 目录型检索工具(Subject directory catalogue)搜索引擎(Search Engine)▪单一搜索引擎▪集成搜索引擎检索工具的工具——指南类检索工具和元搜索引擎▪(一)网络资源指南(Resource Guide)也称学科门户SIG▪(二)元搜索引擎集合式搜索引擎、索引式搜索引擎▪(三)手工检索工具的“工具书指南”、网址簿网络版参考咨询工具(Reference Tools)智能搜索代理和搜索软件补充教材第二章:检索工具与语言检索策略【主要内容】1、信息资源检索的一般流程分析问题▪问题分类▪分析已知和欲知信息▪分析需求主题▪广泛利用文献▪选择检索范围选择检索工具▪熟悉各种检索工具从检索工具中查找所需信息获取原文2、网络信息资源的概念和类型1)按传输方式分:●WWW●FTP●Usenet/Newsgroup●LISTSERV/Mailing List●Telnet●Gopher●WAIS2)按内容加工一次加工信息▪网上图书、期刊、报纸、专利、政府出版物、会议资料等 二次加工信息▪文摘索引数据库、搜索引擎、网站导航等三次加工信息▪百科全书、手册指南等参考型网站3)格式与后缀3、网络检索工具的分类按检索机制分:▪目录型(Subject directory, catalogue)▪索引型:搜索引擎(Search Engine)▪混合型(Hybrid tools)按包含检索工具数量分:▪单一型(Singular search tools)▪集合型(Collective search tools):元搜索引擎(Metasearch Engine或Megasearch Engine4、目录型检索工具(Subject directory catalogue)1)网络资源目录这是一种独立型检索工具,网站自身包含可检索的数据库。
信息检索工具与方法概述

张龙飞 080905238信息检索工具与方法概述信息社会给人们带来了浩如烟海的信息,令人们享受不尽,同时也感到无所适从。
如何从泛滥的信息大潮中获有价值的东西,成了人们面临的迫切问题。
因此,信息检索能力的高低,绝顶了人们发展的潜力。
传统的教育模式注重书本知识的输入,不注意培养独立工作的能力和获取知识的技术和手段,结果培养出的人很难适应社会的发展。
面对信息社会的挑战,现代教育应该发展人们的综合水平,提高技术手段的培养。
因此,必需掌握最新的技术-----信息检索。
以下是根据我个人的了解对信息检索技术进行的阐述和概括。
信息检索是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。
即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻。
那么,我们为什么要进行检索工作呢?在科研开发领域里,重复劳动在世界各国都不同程度地存在。
据统计,美国每年由于重复研究所造成的损失,约占全年研究经费的38%,达20亿美元之巨。
日本有关化学化工方面的研究课题与国外重复的,大学占40%、民间占47%、国家研究机构占40%,平均重复率在40%以上;我国的重复率则更高。
在这么多的信息之中要找到不重复而又有效的信息内容就必需进行检索。
要进行信息检索首先要有检索工具。
检索工具是指用以报导、存贮和查找文献线索的工具。
它是附有检索标识的某一范围文献条目的集合,是二次文献。
一般说来,检索工具应具备以下五个条件:①明确的收录范围;②有完整明了的文献特征标识;③每条文献条目中必须包含有多个有检索意义的文献特征标识,并标明供检索用的标识;④全部条目科学地、按照一定规则组织成为一个有机整体;⑤有索引部分,提供多种必要的检索途径。
目前可供人们使用的检索工具有很多,不同的检索工具各有特点,可以满足不同的信息检索的需求。
检索工具有不同的分类方法,按加工文献和处理信息的手段不同可分为:手工检索工具和机械检索工具;按照出版形式不同可分为:期刊式检索工具,单卷式检索工具,卡片式检索工具,胶卷式检索工具;按照载体形式不同可分为:书本式检索工具,磁带式检索工具,卡片式、缩微式、胶卷式检索工具。
网络检索

与运算示意图
A
computer
B
virus
作用: 缩小 作用: 检索范围, 检索范围, 提高检准率
A
* B
逻辑“ 逻辑“或”
or”、 或逗号表示, 用“or 、“+”或逗号表示,在网络搜索引擎中 或逗号表示 习惯用逗号代替。 习惯用逗号代替。 可描述概念间的并列关系和相关关系,主要用来组 配同义词或相关词 同义词或相关词等。 同义词或相关词 • 含义:检出文献中包含有被其连接的任意一个词 或词组。 作用:扩大检索范围,提高查全率。
搜索引擎大全() 搜索引擎大全()
• 第一代:以网络、网页的数量 多少为标准,结果不 第一代:以网络、 多少为标准, 按相关性排序,代表为Lycos,Lycos是搜索引擎中 按相关性排序,代表为 ,Lycos是搜索引擎中 的元老,是最早提供信息搜索服务的网站之一。 的元老,是最早提供信息搜索服务的网站之一。 • 第二代:以检索结果的质量为目标,检索思想、方 第二代:以检索结果的质量为目标,检索思想、 法发生转变,检索结果排序并进行超链分析, 法发生转变,检索结果排序并进行超链分析动性和整合性强、 第三代: 信息分布化等特点. 互动搜索 分类导航 查询精确 / 中搜 • 第四代:更具个性化、智能化 集成各类搜索引擎功 能,具有定位技术。
• ③ 少用或不用对课题检索意义不大的词汇 1.词义泛指度过大的词,如: “展望”——趋势、现状、动态等 “应用”——作用、利用、用途等 还有如“开发”、“研究”、“方法”等。 2.词义延伸过多的词,如: “制造”——生产、加工等 “提炼”——提取、精炼、回收、利用等
• ④ 避免使用多义词(使用短语、多个检索词, 或其它的词语代替)。 如“java”、“海绵”(海洋里多孔动物、泡沫 java” 海绵” 海洋里多孔动物、 塑料) 塑料) • ⑤注意检索词的同义词、近义词、可替代词、 简缩写 如:维他命+维生素;交大+北京交通大学 维他命+维生素;交大+ ⑥检索词的主题关联与简练
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘要进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。
与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。
网络信息资源的迅猛增长,使人们获得有用信息越来越困难,网络检索工具应运而生,文章介绍了网络信息检索工具的类型和功能,提出了检索工具的发展趋势。
关键字:网络信息检索;检索工具;因特网;web资源检索目录摘要 (I)1 信息检索的定义 (1)2网络信息检索简介 (1)2.1网络信息检索定义 (1)2.2 网络信息检索的原理 (1)2.3网络信息检索与传统信息检索的区别 (2)2.4网络信息检索技巧 (2)3网络信息检索工具类型 (3)3.1非web资源检索工具 (3)3.2web资源检索工具 (3)4网络信息检索工具的功能 (4)5网络信息检索展望 (5)5.1网络信息检索的展望 (5)5.2网络信息检索工具展望 (5)参考文献 (6)浅谈网络信息检索及其检索工具1 信息检索的定义什麽是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。
因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。
而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。
我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。
信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。
人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。
2网络信息检索简介随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。
Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。
2.1网络信息检索定义网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。
2.2 网络信息检索的原理网络信息检索工具是网络信息检索技术的实物体现。
目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。
(1)布尔逻辑模型——这是一种简单而常用的严格匹配模型。
用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。
标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。
利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。
(2)模糊逻辑模型——它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。
(3)概率模型——它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。
2.3网络信息检索与传统信息检索的区别检索方式网络信息检索传统信息检索比较方面检索时间快慢检索指标查全率高查准率高检索费用相对低相对高(信息使用费、服务费、通讯费)信息内容范围数字化、多媒体信息纸制文献信息检索信息质量查全率高查准率高2.4网络信息检索技巧目前常用的信息检索方法有两种:一种是利用搜索引擎进行关键词、主题词或自然语言检索。
最著名的搜索引擎有AltaVista、Excite、HotBot、Info seek等;另一种是按主题分类指南进行检索,如Yahoo ! 就是按主题组织资源、逐次分类,供读者按需查词的;有的检索工具两种方式可以随时切换使用, 如Info seek。
相比之下, 前者信息的获取太杂乱, 鱼龙混杂, 精确度太低, 需通过多次筛选才能找到所需信息。
而后者的信息组织系统性较强,精确度较高。
但主要问题在于获取率较低且很难反映信息之间的关联性。
由此可见, 两种方法各有利弊, 读者要根据检索的目的来挑选和使用检索工具,同时要学习一些提高检索效果的方法和技巧。
(l) 检索关键词具体化;(2) 运用词组检索;(3) 巧用Boolean逻辑词:AND、OR 和NOT。
3网络信息检索工具类型网络信息检索工具是指在因特网上提供信息检索服务的计算机系统,其检索的对象是存在于因特网信息空间中各种类型的网络信息资源。
按检索资源的类型,可分为两大类:即非web资源检索工具和web资源检索工具。
3.1非web资源检索工具非web 资源检索工具是以 FTP、Telnet、Gopher等为检索对象。
(1)FTP类的检索工具这是一种实时的联机检索工具,用户首先要登陆到对方的计算机,登陆后即可以进行文献搜索及文献传输有关的操作。
使用 FTP(文件传输协议)几乎可以传输任何类型的正文文件、二进制文件、图像文件、声音文件、数据压缩文件等。
在这类检索工具中,Archie是最常用的。
Archie是自动标题检索软件,它借助于 FTP来访问。
用户只需告诉其要检索文件名的有关信息便可获得文件所在的主机名、路径。
与一般检索工具不同的是,它不用主题来实现相应的检索,而只能根据文件名和目录名进行检索。
它是获取免费软件和共享软件资源不可缺少的工具。
(2)Telnet 类的检索工具它指的是借助远程登陆在网络通信协议的支持下,在远程计算机上登陆,使自己的计算机暂时成为远程计算机的终端,进而可以实时访问,使用远程计算机中对外开放的资源。
使用Telnet协议进行远程登陆时需要满足以下条件:本地计算机上必须装有包含Telnet协议的客户程序;必须知道远程主机的IP地址或域名;必须知道登录标识与口令。
(3)基于菜单式的检索工具----GopherGopher是一种交互式、菜单式信息查询软件,它将各种信息资源加以分类,再用菜单的形式显示给用户。
目前通过Gopher可以进行以下类型信息查询:文本文件信息查询、 Telnet信息查询、电话簿查询、专有格式文件查询。
3.2web资源检索工具web信息资源是指建立在超文本、超媒体技术基础上,集文本、图形、图像、声音为一体,并以直观的图形用户界面展现和提供信息的网络资源形式,与之对应的 web 检索工具多种多样,大体分为三类:搜索引擎、目录型检索工具、多元搜索引擎。
(1)搜索引擎搜索引擎使用自动索引软件来发现、收集并标引网页 ,建立数据库;以 Web形式提供给用户一个检索界面,供用户输入检索关键词、词组或短语等检索项;代替用户在数据库中找出与提问匹配的记录 , 并返回结果且按相关度排序输出。
使用此类工具的检索方法被称为“关键词搜索”,可以在主页查询,也可以在类目下查询。
此类检索工具的优点是信息量大且新 , 速度快;缺点是准确性较差。
著名的搜索引擎如Meta Vista、Excite、天网、悠游等。
根据其逻辑功能的不同,可分为:搜索器、分析器、索引器、检索器、用户接口。
(2)目录型检索工具它是按照某种分类体系编制的一种可供检索的等级结构式目录。
分类方法以学科分类为主,也有采用图书分类方法的。
使用此类工具的检索方法被称为“分类搜索”,这是一种“自顶向下、逐步细化”的搜索方法。
自顶开始,每一层都分布有若干“链接点”,选择其中一个,就可沿此分支进入下一层,直到出现所需目标。
此类检索工具的优点是检索质量较高,缺点是检索到的信息数量有限,且新颖性不够。
有代表性的目录型检索工具如 Y ahoo、G alaxy、Lycos、网易、263 等。
现在,搜索引擎和目录型检索工具逐渐整合在一起,以增强检索能力。
(3)多元搜索引擎多元搜索引擎是将多个搜索引擎集成在一起,并提供一个统一的检索界面 , 且将一个检索提问同时发送给多个搜索引擎,同时检索多个数据库,再经过聚合、去重之后输出检索结果。
其优点是省时,缺点是由于不同搜索引擎的检索机制、所支持的检索算法、对提问式的解读等均不相同,导致检索结果的准确性差。
常用的多元搜索引擎有DOGPI LE、INFEREN等。
4网络信息检索工具的功能网络检索工具产生和发展的历史虽然不长,但它的功能却非常强大,关键词检索(Keyword)是最基本功能,包括以下几个方面:(1)布尔逻辑检索布尔检索在网络信息资源检索中使用的相当广泛,常用的布尔逻辑算符有 3 种: 逻辑或(运算符为 OR/ or ,有时也可用“|”符号表示)、逻辑与(运算符为 AND/ and ,有时也可用“&”、“+ ”号表示)、逻辑非(运算符为NOT/ not,有时也可用“!”、“-”号表示)。
(2)词组检索词组检索是将一个词组作为一个独立运算单元,进行严格匹配以提高检索的精度和准确度。
词组检索是一般数据库中最常用的方法,是通过使用逗号、双引号和括号进行检索。
(3)字段检索字段检索是一种用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的手段,多以字段限定方式实现。
(4)截词检索为提高查全率而设计,绝大多数网络检索都支持这一功能,有的是自动截词 , 有的是有条件的截词,尤其在西文检索工具中更是广泛使用。
(5)位置检索位置检索是指允许指定 2 个单词之间的词序和词距的检索。
词序指单词之间前后顺序 , 词距指 2 个单词之间间隔单词数。
其操作符多为“NEAR”。
(6)概念检索概念检索是指使用某一检索提问词进行检索时 , 能同时对该词的同义词、近义词、广义词、狭义词同样进行检索 , 以达到扩大检索 , 避免漏检的目的。
5网络信息检索展望5.1网络信息检索的展望人类已经进入了信息社会,信息社会化与社会信息化是当今重要的时代特征。
信息检索作为传递、搜索信息的手段发展愈来愈快。
如果不懂得信息检索,要在浩如烟海的各种信息中寻找自己需要的信息,就如同大海捞针一般困难,掌握了信息检索的方法和技巧,就可以使信息的查询过程更有条理性、计划性,避繁就简,事半功倍。
所以,我们应充分利用信息资源,避免重复劳动。
科学研究具有继承和创造两重性,纵观科学技术发展史,积累、继承和借鉴前人的研究成果是科技发展的重要前提。
更新自身知识积累,适应社会发展需要。
在信息社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求。