搜索引擎的检索方法与技巧

合集下载

搜索引擎的使用方法和技巧

搜索引擎的使用方法和技巧

百度搜索引擎的使用方法和技巧学生姓名:学院:信息技术学院专业:信管(电)班级:学号:指导教师:完成日期: 2015年3月28日辽东学院Eastern Liaoning University一、简单搜索1. 关键词搜索只要在搜索框中输入关键词,并按一下“搜索”,百度就会自动找出相关的网站和资料。

百度会寻找所有符合您全部查询条件的资料,并把最相关的网站或资料排在前列。

小技巧:输入关键词后,直接按键盘上的回车键(即Enter健),百度也会自动找出相关的网站或资料。

关键词,就是您输入搜索框中的文字,也就是您命令百度寻找的东西。

可以是任何中文、英文、数字,或中文英文数字的混合体。

可以命令百度寻找任何内容,所以关键词的内容可以是:人名、网站、新闻、小说、软件、游戏、星座、工作、购物、论文、、、例如:可以搜索[windows]、[918]、[F-1赛车]。

可以输入一个关键词,也可以输入两个、三个、四个,您甚至可以输入一句话。

例如:可以搜索[博客]、[原创爱情文学]、[知音,不需多言,要用心去交流;友谊,不能言表,要用心去品尝。

悠悠将用真诚,尊敬和大家来建立真正的友谊]。

注意:多个关键词之间必须留一个空格。

2. 准确的关键词百度搜索引擎严谨认真,要求一字不差。

例如:分别输入 [舒淇] 和 [舒琪] ,搜索结果是不同的。

分别输入 [电脑] 和 [计算机] ,搜索结果也是不同的。

因此,如果您对搜索结果不满意,建议检查输入文字有无错误,并换用不同的关键词搜索。

3. 输入两个关键词搜索输入多个关键词搜索,可以获得更精确更丰富的搜索结果。

例如,搜索[悠悠情未老],可以找到几千篇资料。

而搜索[悠悠情未老],则只有严格含有“悠悠情未老”连续5个字的网页才能被找出来,不但找到的资料只有几十篇,资料的准确性也比前者差得多。

因此,当你要查的关键词较为长时,建议将它拆成几个关键词来搜索,词与词之间用空格隔开。

多数情况下,输入两个关键词搜索,就已经有很好的搜索结果。

第四章 搜索引擎

第四章 搜索引擎
优点:返回结果信息量更大,更全 缺点:用户要做过多筛选
本章内容
一、搜索引擎的概述 二、搜索引擎的检索方法和技巧(重点) 三、常用的搜索引擎简介 四、如何能有效检索 五、搜索引擎目前存在的问题和未来趋势
二、搜索引擎的检索方法和技巧※
(一)搜索引擎的检索方法 1、单词检索 2、词组检索 3、布尔逻辑检索 4、截词检索 5、限定检索 6、字母大小写 7、名词检索 8、检索结果的显示
强制搜索
如果要对忽略的关键字进行强制搜索,则需要在该关键 字前加上明文的“+”号。 比如:搜索关于www起源的一些历史资料搜索:则我们可 以用下面的检索式进行搜索:
+www +的历史 internet
另一个强制搜索的方法是把上述的关键字用英文双引号 引起来。 例如上面的够访问超过10亿的中文网页.
首本检索
布尔逻辑算法 在结果中检索 相关搜索 错别字提示 汉语拼音提示
检索结果
检索结果 标题 文件格式 摘要 网查信息 针对教育网站搜索(),专门 有大学搜索()
(二)谷歌(http:)
特点:具有界面简洁、检索精确度高、质量高等优 点
概况
Sergey Brin
Larry Page
概况
Google名字的由来: Googol表示10的100次幂, 这一术语体现了公司整合网上海量信息的远 大目标。
三、常用的搜索引擎简介(一)() (二)Google() (三)北大天网() (四)雅虎 (中文版: .cn
英文版:)
高级检索
Intitle
把搜索范围限 定在网页标题 中,“intitle:” 和后面的关键 词之间不要有 空格。 如:intitle:周杰伦
高级检索
site: 搜索范围限定在特定站点中,可以提高查询效

搜索引擎的使用方法及技巧

搜索引擎的使用方法及技巧

搜索引擎的使用方法及技巧搜索引擎是我们在互联网上进行信息检索的重要工具,它可以帮助我们快速找到我们所需的信息。

但是,有时候我们可能会遇到搜索结果过多、无关或者不准确的问题。

以下是一些搜索引擎的使用方法和技巧,希望可以帮助大家更加高效地使用搜索引擎。

1.使用关键词:在搜索引擎的搜索框中输入与你想要搜索的内容相关的关键词。

关键词可以是一个单词或者是一个短语,尽量使用最相关的关键词来缩小搜索范围。

2.使用引号:如果你想搜索一个完整的短语,可以使用引号将短语括起来。

这样搜索引擎会将完整的短语作为一个整体进行匹配搜索,提高搜索结果的准确性。

3.使用排除词:在搜索中使用减号来排除一些和搜索无关的内容。

例如,如果你搜索“苹果”,但是你不想看到与“苹果手机”相关的结果,你可以搜索“苹果 -手机”,减号后面的词将被排除在搜索结果之外。

4.使用站点限制:如果你只想在某个特定网站上进行搜索,可以在搜索关键词后面加上“site:网址”,这样搜索引擎将只搜索该网站下的相关内容。

5.使用高级搜索功能:大多数搜索引擎都提供了高级搜索功能,你可以通过设置特定条件来缩小搜索范围。

例如,你可以限制搜索结果的时间范围、文件类型、语言等等。

6.使用相关搜索:如果你在搜索中找不到你所需要的信息,可以试试看下方的“相关搜索”功能。

搜索引擎会根据你的搜索内容提供一些类似或者相关的搜索建议,可能会帮助你找到更相关的结果。

7.使用尽可能多的关键词:如果你想要获得更精确的搜索结果,可以尽量使用更多的关键词。

不过要注意关键词之间的关联性,使用太多无关的关键词可能会导致搜索结果不准确。

8.阅读搜索结果摘要:当你得到一些搜索结果时,不要仅仅看标题就下结论。

通常,搜索结果下方会有摘要或者描述,你可以通过阅读摘要来更好地判断该搜索结果是否与你的需求相关。

9.使用图像搜索:有时候我们可能无法准确描述我们所需要的图片,这时可以使用搜索引擎的图像搜索功能。

你可以通过上传一张图片或者提供一段图片的URL来进行搜索,搜索引擎会找到与该图片相关的内容。

熟练使用网络搜索引擎的方法与技巧(四)

熟练使用网络搜索引擎的方法与技巧(四)

熟练使用网络搜索引擎的方法与技巧随着互联网的发展,网络搜索引擎成为我们获取信息的重要渠道之一。

无论是工作学习还是生活娱乐,我们常常需要通过搜索引擎查找相关的内容。

然而,即使是常用的搜索引擎,许多人对其使用方法和技巧仍不甚了解,导致搜索结果效率低下。

因此,熟练使用网络搜索引擎的方法与技巧对于提高我们的工作效率和信息获取能力非常重要。

一、熟悉搜索引擎的基本操作在使用搜索引擎之前,我们需要熟悉搜索引擎的基本操作。

首先,在搜索框内输入关键词,关键词的选择是获取准确搜索结果的基础。

其次,利用搜索引擎提供的筛选功能来精确检索所需内容。

例如,在搜索结果页面,我们可以通过时间筛选、地点筛选等方式缩小搜索范围。

此外,我们还可以利用搜索引擎提供的语法操作来限定关键词之间的关系,如双引号将多个单词固定为一个短语进行搜索。

熟悉这些基本操作,有助于我们更加高效地搜索所需信息。

二、善用搜索引擎的高级搜索功能除了基本操作外,搜索引擎还提供了一些高级搜索功能,能够进一步提高搜索效率。

其中一个重要的工具是使用逻辑运算符。

通过在关键词之间加入“与”、“或”、“非”等运算符,我们可以指定搜索结果必须包含或排除某个关键词,帮助我们更加精确地找到所需信息。

此外,搜索引擎还支持搜索特定网站或特定文件类型的功能。

通过在搜索内容后加上“site:”或“filetype:”等限定词,我们可以在特定网站或特定文件类型中搜索目标信息。

这些高级搜索功能的应用,可以大大提高我们搜索引擎的利用效率。

三、了解搜索结果的排名规则在使用搜索引擎时,了解搜索结果的排名规则也是非常重要的。

搜索引擎通过一系列算法来确定搜索结果的排名顺序,而排名靠前的结果通常是最相关的。

然而,某些网站可能通过一些手段操纵搜索结果,将自己的网站排名靠前,而与搜索关键词无关的内容也会被排到前面。

因此,我们需要学会识别和过滤这些操纵搜索结果的网站,以获取更准确、更有质量的信息。

四、全面评估搜索结果的可信度除了排名靠前的结果外,搜索引擎结果中还可能存在质量参差不齐的信息。

搜索引擎的使用方法和技巧

搜索引擎的使用方法和技巧

百度搜索引擎的使用方法和技巧学生姓名:学院:信息技术学院专业:信管(电)班级:学号:指导教师:完成日期: 2015年3月28日辽东学院Eastern Liaoning University一、简单搜索1. 关键词搜索只要在搜索框中输入关键词,并按一下“搜索”,百度就会自动找出相关的网站和资料。

百度会寻找所有符合您全部查询条件的资料,并把最相关的网站或资料排在前列。

小技巧:输入关键词后,直接按键盘上的回车键(即Enter健),百度也会自动找出相关的网站或资料。

关键词,就是您输入搜索框中的文字,也就是您命令百度寻找的东西。

可以是任何中文、英文、数字,或中文英文数字的混合体。

可以命令百度寻找任何内容,所以关键词的内容可以是:人名、网站、新闻、小说、软件、游戏、星座、工作、购物、论文、、、例如:可以搜索[windows]、[918]、[F-1赛车]。

可以输入一个关键词,也可以输入两个、三个、四个,您甚至可以输入一句话。

例如:可以搜索[博客]、[原创爱情文学]、[知音,不需多言,要用心去交流;友谊,不能言表,要用心去品尝。

悠悠将用真诚,尊敬和大家来建立真正的友谊]。

注意:多个关键词之间必须留一个空格。

2. 准确的关键词百度搜索引擎严谨认真,要求一字不差。

例如:分别输入 [舒淇] 和 [舒琪] ,搜索结果是不同的。

分别输入 [电脑] 和 [计算机] ,搜索结果也是不同的。

因此,如果您对搜索结果不满意,建议检查输入文字有无错误,并换用不同的关键词搜索。

3. 输入两个关键词搜索输入多个关键词搜索,可以获得更精确更丰富的搜索结果。

例如,搜索[悠悠情未老],可以找到几千篇资料。

而搜索[悠悠情未老],则只有严格含有“悠悠情未老”连续5个字的网页才能被找出来,不但找到的资料只有几十篇,资料的准确性也比前者差得多。

因此,当你要查的关键词较为长时,建议将它拆成几个关键词来搜索,词与词之间用空格隔开。

多数情况下,输入两个关键词搜索,就已经有很好的搜索结果。

网络搜索引擎的技巧与使用方法

网络搜索引擎的技巧与使用方法

网络搜索引擎的技巧与使用方法引言网络搜索引擎是我们在日常生活中必不可少的工具之一,它为我们提供了丰富多样的信息资源。

然而,在使用的过程中,我们经常会遇到信息过载、搜索结果不准确等问题。

本文将介绍一些网络搜索引擎的技巧与使用方法,帮助读者能更高效地利用搜索引擎获得所需信息。

第一章搜索引擎的基本原理和工作方式搜索引擎是一种通过关键词来搜索互联网上相关信息的工具。

其工作原理主要分为三个步骤:采集、建立索引和检索。

首先,搜索引擎会利用机器人不断爬取互联网上的网页。

然后,通过分析网页的内容、标题、链接等信息,构建一个庞大的索引数据库。

最后,当用户输入关键词进行搜索时,搜索引擎会根据索引数据库返回与关键词相关的网页列表。

第二章关键词的选择与优化在使用搜索引擎时,选择合适的关键词是非常重要的。

首先,关键词应该具有代表性,能够准确描述所需信息的内容。

其次,关键词还应该具有唯一性,避免与其他内容混淆。

此外,为了得到更准确的搜索结果,可以利用搜索引擎提供的高级搜索功能,如范围搜索、排除搜索等。

第三章搜索语法的运用除了关键词的选择外,搜索语法的运用也可以帮助用户更快地找到所需的信息。

在搜索引擎中,常用的搜索语法包括布尔运算符、引号搜索、通配符等。

例如,使用AND、OR、NOT等布尔运算符可以对搜索结果进行逻辑组合;使用双引号可以精确搜索包含特定词组的网页;使用星号等通配符可以快速扩展搜索范围。

第四章高级搜索技巧的使用除了基本的搜索语法外,搜索引擎还提供了一些高级搜索技巧,帮助用户进一步优化搜索结果。

其中一项重要的技巧是利用搜索引擎的筛选功能。

搜索引擎通常会提供一系列的筛选选项,如时间、地点、文件类型等。

通过选择合适的筛选条件,用户可以更好地满足自己的需求。

此外,用户还可以使用专业的搜索引擎,如学术搜索引擎、图片搜索引擎等,以获得更专业的搜索结果。

第五章信息评估与来源验证在使用搜索引擎获得信息后,评估信息的可靠性和来源的真实性也是十分重要的。

教你使用搜索引擎查找学习资料

教你使用搜索引擎查找学习资料

教你使用搜索引擎查找学习资料简介在当今信息爆炸的时代,学习资料丰富多样,但是如何高效地利用搜索引擎来查找所需的学习资料是很多人关注的问题。

本文将介绍一些使用搜索引擎来查找学习资料的技巧和方法,帮助您快速、准确地找到所需的学习资料。

选择合适的搜索引擎在开始之前,首先要选择一个合适的搜索引擎。

目前使用最广泛的搜索引擎是谷歌和百度,它们的搜索效果和覆盖范围都非常广泛。

除了这两个大型搜索引擎之外,还有一些专业的学术搜索引擎,如Google Scholar、CNKI等,可以根据自己的需求选择合适的搜索引擎。

使用关键词进行搜索关键词是搜索引擎检索学习资料的重要工具。

选择合适的关键词可以提高搜索结果的准确性和相关性。

以下是一些建议帮助您选择合适的关键词:•使用具体的关键词:尽量使用具体的关键词来描述您所需要的学习资料,避免使用太过模糊的词语。

•使用短语或者括号:如果您要搜索的内容是一个短语或者一个专有名词,可以用双引号或者括号来表示,这样可以让搜索引擎更加准确地搜索到相关的内容。

•使用排除词:如果您要排除一些不相关的内容,可以在关键词前面加上减号“-”来表示,这样可以过滤掉与排除词相关的搜索结果。

使用高级搜索选项大多数搜索引擎提供了高级搜索选项,可以帮助我们更加精确地搜索所需的学习资料。

以下是一些常见的高级搜索选项:•文件类型:您可以指定搜索结果只包含特定的文件类型,比如PDF、PPT等,这样可以更快地找到所需的学习资料。

•时间范围:您可以指定搜索结果只包含在一定时间范围内发布或更新的学习资料,这样可以获取到最新的学习资料。

•网站限定:您可以指定搜索引擎只搜索特定网站内的内容,比如您可以在搜索结果中排除社交媒体网站,只搜索学术网站。

查找学习资料的技巧除了选择合适的搜索引擎和使用关键词进行搜索外,还有一些技巧可以帮助我们更好地查找学习资料:•使用引号:如果您要搜索的内容是一个短语或者一个专有名词,可以使用引号将其包裹起来,这样可以让搜索引擎更好地理解您的搜索意图。

搜索引擎的检索方法与技巧

搜索引擎的检索方法与技巧

搜索引擎的检索方法与技巧
引擎技巧是可以帮助我们更有效率地信息的方法,可以从简单的关键词、更复杂的组合查询到更复杂的检索方法,有效地定位到结果,以节省
时间,提高检索效率。

下面介绍几种引擎检索方法与技巧。

1、完整词组:使用完整词组来定位相关结果,可以有效避免结果中
返回的非想要的相关内容,多数引擎都支持“单引号”包围定位完整词组,比如“data mining”(data mining)就是data mining这个词组内容,
它会在结果中列出包含这两个词的内容,而不是data和mining两个单词
的内容。

2、相关词:相关词技巧可以有效检索出相关联的结果,比如如果你
要“水平对比”,你可以使用相关词技巧“水平”、“比较”、“对照”
等等词组,这样可以更好地找到想要的结果。

3、通配符:通配符技巧可以使用特殊符号*,?来代替一段字符来相
关的结果,比如使用“data*mining”来
datamining,dataengineering,dataanalysis等词组,使用
“data?mining”来datamining,dataamining,databmining等词组。

4、精确:精确技巧可以使用多个词紧凑组合完成精确,比如使用“data+mining”来data mining这个精确词组。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2017/10/15
14
检索器和用户接口
• 3.检索器
– 检索器的功能是根据用户的查询在索引库中快速检出文档, 进行文档与查询的相关度评价,对将要输出的结果进行排 序,并实现某种用户相关性反馈机制。 – 检索器常用的信息检索模型有集合理论模型、代数模型、 概率模型和混合模型四种。
• 4.用户接口
– 用户接口的作用是输入用户查询、显示查询结果、提供用 户相关性反馈机制。主要的目的是方便用户使用搜索引擎, 高效率、多方式地从搜索引擎中得到有效、及时的信息。 用户接口的设计和实现使用人机交互的理论和方法,以充 分适应人类的思维习惯。
2017/10/15 25


网 站
2017/10/15
26
二、Google功能与特色
100亿个网页 支持多达132种语言,包括简体中文和繁体中文; 提供搜索引擎功能,没有花里胡哨的累赘; 速度极快,据说有8000多台服务器,200多条T3级 宽带; 专利网页级别技术PageRank能够提供高命中率的 搜索结果; 搜索结果摘录查询网页的部分具体内容,而不仅 仅是网站简介; 智能化的“手气不错”功能,提供可能最符合要 27
2017/10/15
2
中国搜索引擎用户规模和使用率
2017/10/15
3
搜索引擎的用户感受
2017/10/15
4
2017/10/15
5
搜索引擎的应用现状
• 从用户使用的角度,国外的调查发现:
– 网上搜索信息的人很少考虑如何找到他们所需要 的信息,因此搜索信息时象动物猎食般盲目; – 只有18%的用户表示总能在网上搜索到需要的信 息。68%的用户说他们对搜索引擎很失望; – 平均每个搜搜者在12分钟的徒劳搜索后就感到恼 火和受挫。 – 46%的人只会用同一个关键词搜啊搜啊,而且是 在同一个搜索引擎。
2017/10/15
15
Google爬虫
搜索引擎示意
网页
Google工作电脑
Google服务器
Google存储系统
2017/10/15
16

1、Google简介

2、Goolge功能与特色 3、网页搜索技巧 4、其它特色服务与功能略解
2017/10/15
17
一、Google简介
Google是一个搜索引擎,由两个斯坦福大 学博士生Larry Page与Sergey Brin于1998年 9月发明,Google Inc. 于1999年创立。 2000年7月份,Google替代Inktomi成为 Yahoo公司的搜索引擎,同年9月份, Google成为中国网易公司的搜索引擎。98 年至今,Google已经获得30多项业界大奖。
2017/10/15
12
主要技术
• 一个搜索引擎由搜索器、索引器、检索器 和用户接口等四个部分组成。 • 搜索器
– 搜索器的功能是在互联网中漫游,发现和搜 集信息。它常常是一个计算机程序,日夜不 停地运行。它要尽可能多、尽可能快地搜集 各种类型的新信息,同时因为互联网上的信 息更新很快,所以还要定期更新已经搜集过 的旧信息,以避免死连接和无效连接。
通配符、大小写、句子 • • 不支持通配符,如“*”、“?” 英文字符大小不分

词组或句子作关键词须加引号
2017/10/15
30
搜索所有网页
2017/10/15
31
2017/10/15
32
2017/10/15
33
找到最相关的网页
2017/10/15
34
2017/10/15
35
搜索设置
简单命令搜索
可以在使用偏好中设置 “firewall” filtype:pdf “firewall” date:2005/05/28 直接输入关键词 intitle:或allintitle: allintext: allinurl: allinanchor: "firewall" “Firewall” site: related:/index.shtml link: 39
2017/10/15
11
分类
– 3.元搜索引擎:这类搜索引擎没有自己的数 据,而是将用户的查询请求同时向多个搜索 引擎递交,将返回的结果进行重复排除、重 新排序等处理后,作为自己的结果返回给用 户。服务方式为面向网页的全文检索。这类 搜索引擎的优点是返回结果的信息量更大、 更全,缺点是不能够充分使用所使用搜索引 擎的功能,用户需要做更多的筛选。这类搜 索引擎的代表是WebCrawler、InfoMarket等。
47
2017/10/15
48
4.2
简单运算
邮政区号
手机归属地
名词概念定义
2017/10/15
49
4.3
2017/10/15
50
2017/10/15
51
2017/10/15
52
输入检索词
2017/10/15
53
4.5
找什么
在哪儿
/maps
2017/10/15 54
3.搜索实例
1)何谓“冬虫夏草” 简单界面 直接输入 点击手气 不错
2017/10/15
40
3.搜索实例
2)“松香毛有毒” 简单界面 直接输入 点击手气 不错
2017/10/15
41
3.搜索实例
3) 查 找 元 数 据 规 范 文 档 资 料
2017/10/15
42
3.搜索实例
4) 查 找 虚 拟 参 考 咨 询 课 件
8
值得推荐的几个中文搜索引擎
• 全文搜索
– 衡量搜索引擎的指标:
• • • • 查全率 查准率 速度 哪个重要?
– Google:
(需要出国访问权限)
• 新浪使用了它的全文搜索引擎服务 • 说明:这是2004年4月的情形,各大门户网站使用的搜索引擎服 务经常会变化,留意Powered by…
2017/10/15
10
搜索引擎分类
– 2.机器人搜索引擎:由一个称为蜘蛛(Spider)的 机器人程序以某种策略自动地在互联网中搜集和发 现信息,由索引器为搜集到的信息建立索引,由检 索器根据用户的查询输入检索索引库,并将查询结 果返回给用户。服务方式是面向网页的全文检索服 务。该类搜索引擎的优点是信息量大、更新及时、 毋需人工干预,缺点是返回信息过多,有很多无关 信息,用户必须从结果中进行筛选。这类搜索引擎 的代表是:AltaVista、Northern Light、Excite、 Infoseek、Inktomi、FAST、Lycos、Google;国内代 表为:"天网"、悠游、OpenFind等。
2017/10/15
7
什么是搜索引擎

2017/10/15
搜索引擎其实也是一个网站,只不 过该网站专门为你提供信息“检索”服 务 搜索引擎是指根据一定的策略、运用 特定的计算机程序从互联网上搜集信息, 在对信息进行组织和处理后,为用户提 供检索服务,将用户检索相关的信息展 示给用户的系统。 搜索引擎包括全文索引、目录索引、元 搜索引擎、垂直搜索引擎、集合式搜索 引擎、门户搜索引擎与免费链接列表等。
2017/10/15
18
2017/10/15
19
2017/10/15
20
2017/10/15
21
2017/10/15
22



文 网 站
2017/10/15
/
23
Google英文网站服务项目
2017/10/15
24


网 站

2017/10/15
Google常用工具
2017/10/15
28
三、网页搜索技巧
1、简单搜索
“+”或空格表示逻辑“与”操作(A、B同 时有) “-”表示逻辑“非”操作,减号前留一空 格
(A -B)
其它小技巧 ……… “ OR”表示逻辑“或”操作( A或B只要其 一) OR 要大写
2017/10/15 29
2017/10/15
55
2017/10/15
56
2017/10/15
57
4.6
2017/10/15
58
2017/10/15
59
免费浏 览图书 内容目 次,交 费后可 阅读全 文,直 接链接
3
四、其它主要特色服务与功能略解
网页搜索特色
Print
BETA
其它:分类目录、新闻、论坛、专家咨询…..略
2017/10/15 44
4.1
/schhp?hl=zh-CN
2017/10/15 45
2017/10/15
462017/10/15– :2017/10/15
9
搜索引擎的分类及原理
• 按照信息搜集方法和服务提供方式的不同, 搜索引擎系统可以分为三大类:
– 1.目录式搜索引擎:以人工方式或半自动方 式搜集信息,由编辑员查看信息之后,人工 形成信息摘要,并将信息置于事先确定的分 类框架中。信息大多面向网站,提供目录浏 览服务和直接检索服务。该类搜索引擎因为 加入了人的智能,所以信息准确、导航质量 高,缺点是需要人工介入、维护量大、信息 量少、信息更新不及时。这类搜索引擎的代 表是:Yahoo、LookSmart、Open Directory、 Go Guide等。
2017/10/15
13
索引器
• 2.索引器
– 索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项, 用于表示文档以及生成文档库的索引表。 – 索引项有客观索引项和内容索引项两种:客观项与文档的语意内 容无关,如作者名、URL、更新时间、编码、长度、链接流行度 (Link Popularity)等等;内容索引项是用来反映文档内容的,如 关键词及其权重、短语、单字等等。内容索引项可以分为单索引 项和多索引项(或称短语索引项)两种。单索引项对于英文来讲 是英语单词,比较容易提取,因为单词之间有天然的分隔符(空 格);对于中文等连续书写的语言,必须进行词语的切分
相关文档
最新文档