搜索引擎
搜索引擎的工作原理

搜索引擎的工作原理搜索引擎是一种用于在互联网上搜索信息的工具,它能够根据用户输入的关键词,在互联网上找到相关的网页、文件或者其他资源。
搜索引擎的工作原理可以分为以下几个步骤:1. 网页抓取:搜索引擎会通过网络爬虫程序自动抓取互联网上的网页内容。
网络爬虫会按照一定的规则遍历互联网上的链接,将抓取到的网页保存下来。
2. 网页索引:抓取到的网页内容会被搜索引擎进行索引处理。
索引是一个包含了大量关键词和网页相关信息的数据库。
搜索引擎会将网页的标题、正文、链接等信息提取出来,并建立索引以便后续的检索。
3. 关键词处理:当用户输入关键词进行搜索时,搜索引擎会对关键词进行处理。
这个过程包括去除停用词(如“的”、“是”等无实际意义的词语)、同义词处理、词干提取等。
关键词处理的目的是将用户输入的关键词转化为更准确的搜索条件。
4. 检索排序:搜索引擎会根据索引中的信息,将包含用户关键词的网页进行排序。
排序算法会综合考虑网页的相关性、权威性、页面质量等因素,以确定搜索结果的排序。
5. 结果展示:搜索引擎将排序后的搜索结果展示给用户。
通常,搜索引擎会将搜索结果分为多个页面,每一个页面显示若干个搜索结果。
用户可以通过翻页或者点击相关链接来查看更多的搜索结果。
6. 搜索反馈:搜索引擎会根据用户的行为和反馈信息来优化搜索结果。
例如,用户点击某个搜索结果的次数越多,搜索引擎就会认为该结果与用户的搜索意图更相关,将其排名提高。
除了以上的基本工作流程,搜索引擎还会应用一些技术来提高搜索效果,例如:1. 自然语言处理:搜索引擎会利用自然语言处理技术来理解用户的搜索意图,从而提供更准确的搜索结果。
例如,用户输入“天气如何”时,搜索引擎可以理解用户想要获取天气信息,并直接显示相关的天气预报。
2. 图象搜索:搜索引擎可以通过图象识别技术,让用户直接上传图片进行搜索。
搜索引擎会分析图片的内容,并找到与之相关的网页或者其他资源。
3. 语音搜索:搜索引擎可以通过语音识别技术,实现用户通过语音输入关键词进行搜索。
搜索引擎百科

搜索引擎百科搜索引擎是互联网时代的重要工具,它们通过收集、整理和展示网页信息,帮助用户高效地查找需要的内容。
本文将介绍搜索引擎的定义、发展历程、工作原理以及对社会的影响。
一、定义搜索引擎是一种互联网技术,通过建立全球性的网络索引库,实现对互联网上信息的搜索、索引和呈现。
搜索引擎的目标是根据用户提供的关键词,展示与之相关的网页。
二、发展历程1. 早期搜索引擎早期的搜索引擎如Archie、Gopher等,主要用于检索FTP和存档文件。
随着互联网的迅速发展,研究人员迎来了一个新的挑战,即如何有效地搜索和组织海量互联网信息。
2. 首批商业搜索引擎1990年代中后期,一些商业搜索引擎如AltaVista、Yahoo!等相继出现。
它们通过机器人抓取网页内容,并建立索引库,用户可以通过关键词搜索获取信息。
3. 谷歌的崛起1998年,谷歌成立,通过创新的PageRank算法,提供了更准确和高效的搜索结果。
谷歌的成功经验在于不仅仅关注关键词匹配度,还注重网页的权威性和链接质量,提供更有价值的搜索结果。
4. 移动搜索的兴起随着智能手机的普及,移动搜索成为新的趋势。
谷歌、百度等搜索引擎都推出了移动搜索应用,为用户提供随时随地的信息检索能力。
三、工作原理1. 爬虫抓取搜索引擎使用网络爬虫,也称为蜘蛛或机器人,自动访问网页并抓取页面内容。
爬虫根据链接关系进行遍历,将抓取到的页面存储到索引库中。
2. 索引建立搜索引擎通过建立索引,将抓取到的网页内容进行组织和存储。
索引通常包括网页标题、URL、正文内容等关键信息,以方便后续的搜索和检索。
3. 检索与排序当用户输入关键词进行搜索时,搜索引擎会根据建立好的索引库进行匹配,并根据一定的排序算法,将相关度较高的网页展示给用户。
常用的排序算法包括PageRank、TF-IDF等。
四、对社会的影响1. 信息检索便利搜索引擎解决了信息过载的问题,使得用户能够快速地找到所需信息。
无论是学术研究、生活服务还是娱乐信息,都可以通过搜索引擎轻松获取。
常见的搜索引擎有哪些分类

常见的搜索引擎有哪些分类搜索引擎简单理解,就是网络环境中的信息检索系统,即能够在网上发现新网页并抓取文件的程序。
依托于多种技术,一般包括爬虫、索引、检索和排序等,为信息检索用户提供快速、高相关性的信息服务。
国内常见的搜索引擎有百度、360、搜狗等,国外的有谷歌、必应等。
根据不同的工作方式,主流的搜索引擎可被分为三种:全文搜索引擎、目录搜索引擎、元搜索引擎、垂直搜索引擎。
1、全文索引型全文搜索引擎,国内是著名的百度搜索引擎。
国内著名的有百度(Baidu)国外则是Google。
它们从互联网提取各个网站的信息(以网页的文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。
2、目录索引型目录索引虽然有搜索引擎功能,但严格意义上不能称为真正的搜索引擎。
用户完全不需要依靠关键词(Keywords)查询,只是按照分类目录找到所需要的信息。
目录索引中,国内具代表性就是新浪、搜狐、网易分类目录和Yahoo网站雅虎。
其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。
3、元数据索引型元搜索引擎接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户,著名的元搜索引擎有360搜索、infoSpace、Dogpile、VIsisimo等,在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
4、垂直索引型垂直搜索引擎适用于有明确搜索意图情况下进行检索。
例如,用户购买机票、火车票、汽车票时,或想要浏览网络视频资源时,都可以直接选用行业内专用搜索引擎,以准确、迅速获得相关信息。
搜索引擎名词解释

搜索引擎名词解释搜索引擎是一种用于帮助用户在互联网上查找特定信息的计算机程序。
用户通过输入关键词或短语,搜索引擎会在其索引中查找与该关键词相关的网页、图片、视频和其他在线资源,并将结果以列表或排名的方式展示给用户。
以下是一些与搜索引擎相关的名词解释:1. 搜索引擎算法:搜索引擎算法是用于决定特定搜索查询的结果排名的一组规则和计算方法。
搜索引擎公司会保密其算法的具体细节,以避免滥用和操纵。
2. 搜索引擎优化(SEO):搜索引擎优化是一系列技术和策略,旨在提高网站在搜索引擎的排名和可见性。
SEO包括关键词研究、网站结构优化、内容优化、链接建设等活动。
3. 搜索引擎广告(SEA):搜索引擎广告是一种广告形式,通过在搜索结果页面上以有偿方式展示广告,帮助企业推广产品和服务。
常见的搜索引擎广告平台有Google AdWords和百度推广。
4. 网络爬虫:网络爬虫是搜索引擎算法中的核心部分,用于浏览互联网上的网页并将其存储到搜索引擎的数据库中。
网络爬虫会按照事先设定的规则和指令自动访问网站,并提取页面“标题”、“描述”和关键词等信息。
5. 自然搜索结果:自然搜索结果也被称为有机搜索结果,是通过搜索引擎算法根据网页的相关性和权威性来排名的结果。
自然搜索结果不需要付费,是根据搜索引擎认为最合适的内容来展示给用户。
6. 人工智能搜索:人工智能搜索引擎是利用机器学习和自然语言处理等人工智能技术来改进搜索结果的搜索引擎。
通过分析用户的搜索历史和行为,人工智能搜索引擎可以为用户提供更个性化和准确的搜索结果。
7. 垂直搜索引擎:垂直搜索引擎是指针对特定领域或行业的搜索引擎,例如电商搜索引擎、旅游搜索引擎等。
相比于通用搜索引擎,垂直搜索引擎提供更专业和精准的搜索结果。
8. 元搜索引擎:元搜索引擎是一种同时查询多个其他搜索引擎并将结果整合展示给用户的搜索引擎。
元搜索引擎可以提供更全面的搜索结果,并帮助用户节省时间,避免在不同搜索引擎之间来回切换。
《认识搜索引擎》课件

语义搜索
语义搜索是指搜索引擎能够理解自然语言,对用户输入的语义进行深入分析和理 解,从而提供更加准确和相关的搜索结果。例如,当用户输入一个较为复杂的查 询语句时,语义搜索能够理解用户的意图,并返回与该意图相关的搜索结果。
语义搜索的发展将进一步推动搜索引擎的自然语言处理技术,使用户能够更加自 然地表达自己的需求,提高搜索结果的准确性和相关性。
多模态搜索
多模态搜索是指搜索引擎能够接受多种媒体数据(如文本、图像、音频、视频等)作为输入,并返回与该输入相关的多种媒 体数据作为结果。例如,用户可以上传一张图片或一段视频进行搜索,搜索引擎将返回与该图片或视频相关的文本、图片、 视频等结果。
多模态搜索的发展将进一步拓宽搜索引擎的应用场景,使用户能够更加方便地获取多种媒体数据的信息,提高信息获取的多 样性和丰富性。
结果筛选
查看搜索结果的相关性
01
根据搜索结果与查询主题的相关程度,筛选出最符合需求的网
页或信息。
查看搜索结果的权威性
02
选择来自权威网站或知名媒体的结果,以获取更可靠的信息。
使用搜索结果的高级筛选功能
03
利用搜索引擎提供的高级筛选功能,如过滤不相关的结果、按
时间排序等,提高筛选效率。
04
搜索引擎的未来展望
反垃圾信息法
垃圾信息泛滥
搜索引擎作为信息传播的重要平 台,容易受到垃圾信息的侵扰, 影响用户体验和搜索引擎的正常
运营。
反垃圾信息法规
各国政府纷纷出台反垃圾信息法 规,要求搜索引擎采取有效措施
防止垃圾信息的传播。
反垃圾技术发展
随着技术的发展,搜索引擎应不 断加强反垃圾技术的研究和应用 ,提高垃圾信息的识别和过滤能 力,为用户提供更加纯净的搜索
搜索引擎的基本原理

搜索引擎的基本原理搜索引擎是一种能够帮助用户在互联网上找到所需信息的工具,它的基本原理是通过对互联网上的信息进行收集、整理和索引,然后根据用户输入的关键词进行匹配和排序,最终呈现给用户相关的搜索结果。
搜索引擎的基本原理涉及到信息检索、网页抓取、索引建立和搜索算法等方面。
首先,搜索引擎通过网络爬虫程序对互联网上的网页进行抓取和收集。
网络爬虫会按照一定的规则和算法,自动地访问和抓取网页上的内容,然后将这些内容存储到搜索引擎的数据库中。
这一过程需要考虑网页的质量、更新频率、页面结构等因素,以确保搜索引擎能够及时、全面地收集到互联网上的信息。
其次,搜索引擎会对收集到的网页内容进行索引建立。
索引是搜索引擎的重要组成部分,它是对网页内容的一种结构化存储和组织方式,能够快速地找到和定位到用户所需的信息。
索引建立的过程包括对网页内容进行分词、去除停用词、建立倒排索引等操作,以便于后续的搜索和匹配。
接着,搜索引擎会根据用户输入的关键词进行搜索和匹配。
搜索引擎的搜索算法会根据用户输入的关键词,在索引中找到相关的网页内容,并根据一定的排序算法对搜索结果进行排序。
搜索算法通常会考虑网页的相关性、权重、链接结构、用户行为等因素,以提供用户最相关和最有用的搜索结果。
最后,搜索引擎会将排序好的搜索结果呈现给用户。
用户可以通过搜索引擎的界面,查看搜索结果并点击进入相关的网页。
搜索引擎还会提供一些辅助功能,如相关搜索、搜索建议、筛选和排序等,以帮助用户更快地找到所需的信息。
总的来说,搜索引擎的基本原理包括网页抓取、索引建立、搜索算法和搜索结果呈现等方面。
通过这些基本原理,搜索引擎能够高效地帮助用户在互联网上找到所需的信息,成为人们日常生活和工作中不可或缺的工具。
常用的17大搜索引擎

常用的十七大学术搜索引擎1、/Google学术搜索滤掉了普通搜索结果中大量的垃圾信息,排列出文章的不同版本以及被其它文章的引用次数。
略显不足的是,它搜索出来的结果没有按照权威度(譬如影响因子、引用次数)依次排列,在中国搜索出来的,前几页可能大部分为中文的一些期刊的文章。
2、Scirus是目前互联网上最全面、综合性最强的科技文献搜索引擎之一,由Elsevier科学出版社开发,用于搜索期刊和专利,效果很不错!Scirus覆盖的学科范围包括:农业与生物学,天文学,生物科学,化学与化工,计算机科学,地球与行星科学,经济、金融与管理科学,工程、能源与技术,环境科学,语言学,法学,生命科学,材料科学,数学,医学,神经系统科学,药理学,物理学,心理学,社会与行为科学,社会学等。
3、/BASE是德国比勒费尔德(Bielefeld)大学图书馆开发的一个多学科的学术搜索引擎,提供对全球异构学术资源的集成检索服务。
它整合了德国比勒费尔德大学图书馆的图书馆目录和大约160 个开放资源(超过200 万个文档)的数据。
4、http://www.vascoda.de/Vascoda是一个交叉学科门户网站的原型,它注重特定主题的聚合,集成了图书馆的收藏、文献数据库和附加的学术内容。
5、/与google比较了一下发现,能搜索到一些google搜索不到的好东东。
它界面简洁,功能强大,速度快,YAHOO、网易都采用了它的搜索技术。
6、Google在同一水平的搜索引擎。
是推出的,Web result部分是基于Google 的,所以保证和Google在同一水平,另外增加了Amazon的在书本内搜索的功能和个性化功能:主要是可以记录你的搜索历史。
现在还是Beta,不过试用后感觉很好,向大家推荐一试,不过缺憾是现在书本内搜索没有中文内容。
7、严格意义上讲不是搜索引擎,是连接搜索引擎和网络用户的信息立交桥。
新一代的搜索引擎应运而生,Ixquick meta-search正是目前最具光芒的新星。
搜索引擎的分类

搜索引擎的分类1、全文索引型全文搜索引擎,国内是著名的百度搜索引擎。
国内著名的有百度(Baidu)国外则是Google。
它们从互联网提取各个网站的信息(以网页的文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。
从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。
2、目录索引型目录索引虽然有搜索引擎功能,但严格意义上不能称为真正的搜索引擎。
用户完全不需要依靠关键词(Keywords)查询,只是按照分类目录找到所需要的信息。
目录索引中,国内具代表性就是新浪、搜狐、网易分类目录和Yahoo网站雅虎。
其他著名的还有Open Direct ory Project(DMOZ)、LookSmart、About等。
3、元数据索引型元搜索引擎接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户,著名的元搜索引擎有360搜索、infoSpace、D ogpile、VIsisimo等,在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
4、垂直索引型垂直搜索引擎适用于有明确搜索意图情况下进行检索。
例如,用户购买机票、火车票、汽车票时,或想要浏览网络视频资源时,都可以直接选用行业内专用搜索引擎,以准确、迅速获得相关信息。
5、互动式索引型互动式搜索引擎,在用户输入一个查询词时,尝试理解用户可能的查询意图,智能展开多组相关的主题,引导用户更快速准确定位自己所关注的内容。
比如:搜狗搜索是搜狐公司强力打造的全球首个第三代互动式搜索引擎。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
搜索引擎可分为三种
• 目录式搜索引擎(网站): 雅虎、搜狐、网易 • 目录索引搜索引擎的使用
Yahoo! 的创建原理以主题为基础,分类主题目 录是其最大的特点,作为目录型搜索工具的典 范, Yahoo! 在主题分类、目录结构方面具有代 表性。它将网络资源按内容分为 14 个大类,每 个总类下又链接多个小类,逐级链接,最后与 网页、新闻组等相连接。用户可以借助高质量的主
检索语法
• • • • • • 小李立即在Google 、Yahoo中分别用: 海口 -大学 -医院 海口 NOT大学 NOT医院 果不出所料,返回的记录已减少了很多! 然而,Google仍然有46300项之多,。 怎么办呢?
检索语法
•
• 看来仅仅依靠逻辑“非”功能是远远不能达 到预期目标的,小李不得不调整检索关键词。 经过仔细分析,他觉得向国外公司的同 行介绍的内容应该为海口的一般性的介绍,使 用“海口”和“概况”这两个关键词也许更切 合提问主题。 赶紧试试看! 小李立即在Goggled中输入: 海口 概况 结果怎么样呢?
网络资源查询
原来,小李自以为很简单,他在 Google搜索引擎中使用“海口” 提问关键词进行了检索,结果怎 样呢?返回的结果约有1450000 条,上百万呢! 小李简直不敢相信自己的眼睛。 他想,再试试“Yahoo”吧。他 仍然利用“海口”这一提问关键 词在Yahoo!中进行搜索,结果会 使他满意吗
逻辑或
检索式 A OR B 检索式 A + B
• 逻辑“或”是并列概念关系的一种组配,通常 用运算符为“OR”或“+”表示,能够扩大检索 结果,运算结果是阴影部分 • 例:周恩来OR周总理 • 少年 or 儿童 • 至少要有一个出现在记录中
A
B
逻辑与
检索式A AND B A * B
是具有概念交叉关系和限定关系的 一种组配。可缩小检索范围,提高查 准率。 如:①感冒 AND 咳嗽 ②大学生 AND 心理障碍 ③市场经济 AND 诚信(有“市 场经济”同时有“诚信”,运算结果 是阴影部分)。 表明结果必须同时含有A和B才为命中, 指必须出现在同一个记录中。
学会利用搜索引擎
比方说,我们到了大型的图书馆, 往往有一种不知所措的感觉。 目的明确的去学习,即先知道要学
什么,然后有目的的去寻找答案,这 种新的方式看上去才更加有效率。我
们不妨把这称为“即学式”,相应的, 旧的称为“预学式”。
学会利用搜索引擎
不过,“即学式”的实施是有前提的。首先, 要求学习者拥有一个包罗万象的信息库,以供随 时抽取各种目的信息;其次,是需要一个强劲的 信息检索工具,以便高效率的从信息库中提取信 息。很明显, Internet可以充当那个海量的信息库,而 搜索引擎—— 则正是寻找光明之火的绝好工具。“公 欲善其事,必先利其器”。Internet 只有一个, 而搜索引擎则有N 个。不同的搜索引擎,搜索结 果不尽相同。
1、分析检索课题、选择概念表达词
(1)注意选择同义词和相关词
《跨国公司经营管理研究》 跨国公司的同义词有: 跨国企业 跨国经营 国际化经营等
《论中国特色的社会保障制度》
• 社会保障的相关词是: • 社会保险 • 社会救助 • 社会福利等
(2)注意适当控制检索词的内涵与外延
例: 《跨国公司经营管理研究》 如以跨国公司和经营管理作为检索词, 将会漏掉一些文章,因为有些文献题名对 跨国公司经营管理的表述并没有“经营管 理”一词。像 跨国公司的营销管理、 跨国公司的质量管理、 跨国公司的财务管理、 跨国公司的不动产管理、 跨国公司的流动资产管理等等, 所以“管理”一词,则可保证最大限度的 查全率。
A and B或 A*B
提示:
搜索引擎在收录内容、检索功能等方面各有千 秋,使用者应仔细阅读系统帮助文件,根据 自己的特定检索需求合理地选择搜索引擎。 • 命令式检索 使用特定的操作命令来实施检索,一般每个 系统都有自己特定的指令系统。 每个搜索引擎提供的检索功能和检索特性是 不一样的,同一种检索功能在每个搜索引擎中表 达方式和使用方法也是不尽相同的。(确切地知 晓每一种搜索引擎的检索功能与特性,无需死记 硬背。只要在使用时,查看帮助信息便是了)。
三注意使用“同义词”
• 往往同一件事情或事物,不同作者喜欢用不同 的词来表达,这就造成了庞大的同义词,如果 偏偏你头脑中的“同义词”不是那么全,造成 漏检就不足为怪了。例:
• 艾滋病——艾滋病、爱滋病 • 碳纤维——碳纤维、炭纤维
提示
大多数的搜索引擎都是采用相 关度来对检索结果进行排序的, 最终结果都是与提问关键词相关 程序最大的命中记录排在前。所 以,仔细查阅前10-20个记录, 可以基本满足需求。
题分类目录,选择自己所需要的主题类目,通过点击超 级链接进入各层,从而找到需要的信息。 “雅虎中国”()提供了一份细蜜、 层次丰富的中文网站分类目录。
全文搜索引擎
• 全文搜索引擎是名副其实的搜索引擎,国外互联网上提取的各个网站 的信息,以网页文字为主,搜索出与用户查询 条件相匹配的记录,然后按一定的排列顺序将 结果返回给用户,因此他们是真正的搜索引擎。
例如:跳迪斯科
• “跳” “迪” “斯” “科”
•
“跳”
“迪斯科”
谁说牛奶不如果汁好喝
理解了搜索引擎的分词,了解 了用“眼镜”很可能搜索不到 “眼镜蛇”,用“海参”很可 能搜索不到“海参崴”,用 “异性”很可能搜不到“相异 性”,搜索者就可以更有效地 选择关键词了。
关键词的分析必须保证三点 一是注意专业性:
分析提问内容时,需细化提问内容的主题, 提取多个符合提问内容的关键词,这样,可以 获得较有效的检索结果。小李第一次搜索失败 的原因正是在于使用了“海口"这样一个太宽 泛的提问关键词。
什么是关键词?
• 关键词,就是您输入搜索框中的文字,也就是 您命令搜索引擎寻找的东西。 您可以命令搜索引擎寻找任何内容,所 以关键词的内容可以是:人名、网站、新闻、 小说、软件、游戏、星座、工作、购物、论 文„„ 而那些对文献主题无实质意义的词汇,如 冠词、介词、连词、某些副词以及某些形容词 均不能做关键词。(禁用词表)
A A
C B B
逻辑非
检索式A NOT B A - B
• 表达检索词间的排除关系。可缩小检索范围,提 高查准率,运算结果是阴影部分。 • 例:①学生NOT小学生 ②微量元素 NOT 锌 ③能源 NOT 核能
A
B
布尔逻辑算符
• 查询时用的 () + -* ? ! 均为半角!
含义
逻辑“与”(逻辑“乘”), 表示为 A and B 或 A * B 逻辑“或”(逻辑“加”), 表示为 A or B 或 A + B 逻辑“非”(逻辑 “减”),表示为 A not B 或 A-B 执行顺序为: NOT, AND, OR
• 内容----关键词---表达式
网络信息检索
小李可能也意识到返回的结果与他 想得到的结果之间的巨大差距,他 仔细查阅了这些返回的结果,发现 其中含有大量的大学院校、医院等 众多不需要的信息。于是,他利用 这两个搜索引擎提供的布尔逻辑功 能进行检索。
布尔逻辑
在检索中,检索提问涉及的概念往往 不止一个,而是同一个概念涉及多个同 义词或相关词,为了准确表达检索提问, 必须使用逻辑算符将不同的检索词组配 起来。常用布尔检索。
学会利用搜索引擎
记得1996年夏季的时候,当我第一次接触Internet, 便被扑面而来的魔力征服了。那种天涯咫尺的感觉,真 是妙不可言。在经历了疯狂的WWW冲浪和如痴如醉的BBS 沉迷之后,我意识到Internet对我影响至深的还是学习 方式的变迁。 如何来描述这种变迁呢? • 当社会处于初级阶段,,人们靠口传身授、背诵记 忆,尚能从容地进行知识的传授、吸收和应用。这种学 习方式造就了很多“才高八斗,学富五车”的大才子。 但是,随着社会的发展和进步,现在的世界早就不是 “四书五经”的年代了,仅靠“皓首穷经,博闻强记” 一类的古老的方式已无法有效地吸收所需要的知识信息 了。 • 人们确实非常需要一种在较短的时间内获得较多、较全、 较新的知识或信息的工具。
学会利用搜索引擎
•
老鸟和菜鸟的区别,往往只是在于会不会 利用资源,搜索引擎是很重要的手段。别看很 多老鸟好像从来不提问题,而且还能回答新人 的问题,好像他们什么都懂似的,其实他们并 没那么厉害,只不过完全可以通过自己的搜索 找到答案,所以不需要提问……有搜索高手说, 所谓搜索,就是“在正确的地方使用正确的工 具和正确的方法寻找正确的内容”。
• 我们了解常规搜索方式,但每个人都会搜索出 不同结果,为什么?核心问题在于关键词选择 不同。 • 在当今互联网上,你永远不会愁你找不到东西, 而是东西太多,你无法找到你需要的东西,因 此搜索效率便成为最重要的一环,搜索效率直 接关系到搜索的关键词的选择。
中文分词
• 中文搜索引擎,跟英文搜索引擎最大的区别是分词。因 为英文的单词与单词之间是天然分隔的,而中文是按句 写的,字与字之间是没有间隔的。
字段限定检索技术(field limit) 限定检索:为了提高检索的查准率,缩小 检索的范围 ,将检索词限定在特定的字段 中进行检索。限定字段通常包括:
– – – – – – – – – – – – – 题名 作者 机构 关键词 主题词 分类号 出版社 出处(刊名、卷期) 文摘 URL 主机 域名 Usenet新闻组
但是我们可以根据需要 用括号改变执行顺序。
例:政治经济学 and 于光远 政治经济学*于光远 表示检索出来的文献既含“政治经济 学”同时又含“于光远” 的文献。
A
B
A
B
A or B或 A+B
例:政治经济学 or 于光远 政治经济学 + 于光远 表示含有“政治经济学” 、“于光远” 、 “政治经济学”和“于光远” 均为命中文 献。