Internet技术与应用搜索引擎
IE浏览器的使用与搜索引擎

2、由主页进入其他网页
网页是通过链接的方法进入其它页 面的,我们把它称为“超级链接”, 当我们移动鼠标箭头,如果光标改变 为手形,则此点为“超级链接”的 入口,也称为“链接热点”。
3、收藏夹的使用
对于我们常去的网站或自己特别喜欢的 网页,总是希望能收藏起来,IE浏览器为 我们提供的网页收藏夹就可以实现,它 还可以在不连接Internet的情况下,在 Internet浏览器中浏览,这种方式又称 “脱机浏览” 。
三、如何启动IE浏览器
启动IE浏览器的方法有三种:
四、IE浏览器的窗口组成
1、标题栏:显示浏览器当前正在访问网页 的 标题。 2、菜单栏:包含了在使用浏览器浏览时, 能选择的各项命令。 3、工具栏:包括一些常用的按钮,如前后 翻页键、停止键、刷新键等 。 4、地址栏:可输入要浏览的网页地址 。 5、网页区:显示当前正在访问网页的内容。 6、状态栏:显示浏览器下载网页的实际工 作状态。
二、搜索引擎的概念
搜索引擎是一个具有搜索、储存信 息并能对信息进行分类的程序。有 了它,我们可以在不知道网站地址 的情况下查找信息,它包括信息搜 集、信息整理和用户查询三部分 。
搜索引擎工作原理
Web-S
自动程序
输入关搜索结果页
Web-S
从因特网上抓取网页,建立索引数据库
收藏夹的使用步骤:
收藏夹使用第一步:进入到你所需要的网站, 点击 “收藏” 菜单,并选择“添加到收藏 夹”。 第二步:在打开的窗口中,你可以修改网站名 称,如果不修改,只要点击“确定”按钮就可 以了。 第三步:下一次使用的时候,打开浏览器,然 后打开“收藏”菜单,点击收藏的名称即可。
4、IE浏览器的属性设置
第七章 Internet 信息检索工具—搜索引擎

(4)用户接口
供用户输入查询,显示匹配结果。 用户接口的设计和实现使用人机交互的 理论和方法,以充分适应人类的思维习 惯。
4、搜索引擎的主要任务
(1) 信息搜集 各个搜索引擎都派出绰号为蜘蛛(Spider)或机 器人(Robots)的“网页搜索软件”,在各网 页中爬行,访问网络中公开区域的每一个站点 并记录其网址,将它们带回搜索引擎,从而创 建出一个详尽的网络目录。由于网络文档的不 断变化,机器人也不断地把以前已经分类组织 的目录更新。
第七章 Internet 信息检索工 具—搜索引擎
7.1搜索引擎基本理论
1、什么是搜索引擎?
简单地说,所谓搜索引擎,就是采用信息自 动跟踪标引等技术、建立在因特网上专门提 供网络信息资源导航服务检索工具。 它能够通过Internet 接受用户的查询指令 ,并向用户提供符合其查询要求的信息资源 网址。
5、搜索引擎的种类
检索型搜索引擎:它使用自动索引软件来发现、收集并标引网 页,建立数据库,并以Web形式让用户找到所需信息资源。比 较著名的有:息系统地分门归类,经过人工 整理后形成庞大而有序的分类目录体系,用户可以在目录体系 的导引下通过逐级浏览,发现、检索到有关的信息。雅虎就是 以卓越的分类目录型导航服务而称誉全球,典型的分类目录搜 索引擎如Yahoo ( /) 混合型搜索引擎:它兼有检索型和目录型两种方式。如:新浪、 搜狐、网易、中华等门户网站。 多元搜索引擎:也称为集合型搜索引擎。它是将多个搜索引擎 集成在一起,通过统一的检索界面进行网络信息多元搜索 的 检索工具。按照工作方式的不同可分为并行处理式和串行处理 式两大类。著名的有: Meta crawler、Dogpile、Mamma和万 维搜索(Http:///)等。
引号 引号( “ ” )的作用是,括在其中的多个词 被当作一个短语来检索。绝大部分主要搜索引 擎都支持短语检索,找到含有与短语词序和意 义完全相同的页面。例如,检索式 “ electronic magazine ” ,表示把 electronic magazine 当作一个短语来搜索。 如果不加引号,搜索引擎就会把两词之间的空 格按“与”处理,查出包含 electronic 和 magazine 的页面,结果应与用户要求的主题 内容相去甚远。
网络信息检索工具——搜索引擎.ppt

14
利用Google进行专题信息检索
1 简单专题信息检索及目录检索 接受一项简单专题,最直截了当就是在搜索框内输入一个 关 键 词 , 然 后 点 击 下 面 的 “ Google 搜 索 ” 按 钮 ( 或 者 直 接 回 车),结果就出来了。 如果对查询的领域熟悉,只想寻找某些专题网站,首先考虑 用目录检索。目录分类明确,则网站专题信息集中,剔除了大 量不相关的信息。不过对查找中文信息,Google的中文目录太 少只有非常普通简单的类目,可能很难满足需求(中文目录 “/Top/World/Chinese_Simplified/” )。
搜索器、分析器、索引器、检索器和用户接口。
同检索数据库一样,利用搜索工具检索,也需要用户能 够将自己的检索需求编制成合适的检索策略,并且需要 一定的检索技巧。
搜索引擎采用的检索词和信息标识词匹配运算的主要方 法有:布尔逻辑检索、截词检索、限制检索、加权检索、 词位置检索和全文检索等。
2019-8-17
感谢你的观看
2
搜索引擎分类
检索型搜索引擎:它使用自动索引软件来发现、收集并标 引网页,建立数据库,并以Web形式让用户找到所需信息 资源。比较著名的有:引擎将信息系统地分门归类,经过 人工整理后形成庞大而有序的分类目录体系,用户可以在 目录体系的导引下通过逐级浏览,发现、检索到有关的信 息。雅虎就是以卓越的分类目录型导航服务而称誉全球。
-横向相关查询: 当用户找到某个感兴趣的网页,搜索引擎提供查询内容近似的其 他网页的功能(不限于同一网站)。一般是在信息条目后面给出 “Similar Pages”或“More results like this”链接。 -除上述功能外,现在搜索引擎都纷纷开始提供分类搜索,如新 闻搜索、图象搜索、新闻组搜索、Flash搜索等等。
Internet网络信息检索技巧

搜索引擎分类
检索型搜索引擎:它使用自动索引软件来发现、收集并标 引网页,建立数据库,并以Web形式让用户找到所需信息 资源。比较著名的有: A信息系统地分门归类,经过 人工整理后形成庞大而有序的分类目录体系,用户可以在 目录体系的导引下通过逐级浏览,发现、检索到有关的信 息。雅虎就是以卓越的分类目录型导航服务而称誉全球。 混合型搜索引擎:它兼有检索型和目录型两种方式。如: 新浪、搜狐、网易、中华等门户网站。 多元搜索引擎:也称为集合型搜索引擎。它是将多个搜索 引擎集成在一起,通过统一的检索界面进行网络信息多元 搜索 的检索工具。
3.5其他用法类似的限定检索
参阅英文Google大全。
()
Yahoo是因特网上历史最悠久、用户数最多的综合型、混 合型搜索引擎,是分类式搜索引擎的典范。它拥有10余种 语言版本,且各版本的内容互不相同。 如果用户的检索词在Yahoo !中查询不到结果,它会自动 将查询转交给Google搜索引擎做进一步的检索。 Yahoo!支持词语检索和“+‖ 和“–‖限制检索等,它还提 供日期限定、URL和题名限制检索等。“+‖限定关键字串 一定要出现在结果中; “–‖限定关键字串一定不要出现在 结果中。
利用Google进行专题信息检索
1 简单专题信息检索及目录检索 接受一项简单专题,最直截了当就是在搜索框内输入一个 关键词,然后点击下面的“ Google 搜索”按钮(或者直接回 车),结果就出来了。 如果对查询的领域熟悉,只想寻找某些专题网站,首先考虑 用目录检索。目录分类明确,则网站专题信息集中,剔除了大 量不相关的信息。不过对查找中文信息,Google的中文目录太 少只有非常普通简单的类目,可能很难满足需求(中文目录 “/Top/World/Chinese_Simplified/”) 。
实验1 IE浏览器与网络搜索引擎的使用

第 12 页
第8页
计算机网络应用基础实验指导
实验 1 IE 浏览器与网络搜索引擎的使用
图 1-11 Google 英文网站
(3)第一个研究型搜索引擎 Northern Light,在搜索引擎领域获得了 许多奖项,网址为:。 第 1 步 登录 Northern Light 站点,了解 Northern Light 与一般的搜索 引擎的区别。 第 2 步 认识了解 Northern Light 主页上的“Custom Search Folders”按 钮的功能。 (4)目录浏览型搜索引擎的首创者—Yahoo!,Yahoo!是由华裔明星 杨致远创建的,Netscape Navigator 直接引用 Yahoo!作为其浏览器的 Internet 网络搜索引擎,网址为:。如图 1-12 所示; 第 1 步 使用 Yahoo!搜索引擎进行 Yellow Pages 检索练习。 第 2 步 了解 Yahoo!组织、整理网络资源的技术。
图 1-14 新浪搜索引擎主页
(4)悠游 悠游是历史最为悠久的中文搜索引擎,悠游智能化的 Robot 系统能
够分秒不停地寻找 Internet 上新的中英文网页,并把这些资源进行自 动识别、分类更新,其主页地址为 。 (5)其它中文综合型搜索引擎 网易,网址为: 若比邻,网址为: 9633 北极星,网址为: 长春藤,网址为: 天网,网址为:
图 1-4 “内容”选项卡
图 1-5“程序”选项卡
第六步:选择“高级”选项卡,可以设置与 IE 浏览信息的方式。
主要完成 IE 对网页浏览的特殊控制。如图 1-6 所示
2. 浏览网页
图 1-6 “高级”选项卡
⑴ 浏览 Web 页
第4页
计算机网络应用基础实验指导
internet第05章2搜索引擎

2、使用搜索引擎
2.3 检索功能 ❖ 布尔逻辑检索 ❖ 精确匹配——双引号 ❖ 限定词检索
13
2.3.1布尔逻辑检索
❖ 逻辑“与”(and):“同时包含”关系 。 ❖ 逻辑“或”(or) :“分别包含”关系。 ❖ 逻辑“非”(not) :“排除其他”关系。 几乎所有的搜索引擎都具有布尔逻辑功能。
• 搜索引擎并不真正搜索互联网,它搜索的 实际上是预先整理好的网页索引数据库。
• 搜索引擎不能真正理解网页上的内容,它 只能机械的匹配网页上的文字。
5
1、搜索引擎 (Search Engine)介绍
❖ 1.2、历史 ❖ 最早现代意义上的搜索引擎出现于1994年7
月。Michael Mauldin 创建的Lycos。 ❖ 同年四月,yahoo门户网站诞生,使网络搜索
28
Filetype示例
29
30
3.5 Google其它特色示例
❖ 计算器 ❖ 类似网页 ❖ 网页快照 ❖ 缩略图
31
计算器功能
32
计算器功能
33
类似网页
34
网页快照
❖ Google 在访问网站时,会将看过的网页复制一份网 页快照,以备在找不到原来的网页时使用。单击 “网页快照”时,您将看到 Google 将该网页编入 索引时的页面。Google 依据这些快照来分析网页是 否符合您的需求。
9
一、搜索引擎 (Search Engine)介绍
❖ 1.4.3元搜索引擎: 通过一个统一用户界面帮助用户在多个搜索引擎 中选择和利用合适的(甚至是同时利用若干个)搜 索引擎来实现检索操作,是对分布于网络的多种 检索工具的全局控制机制。
❖ MetaCrawler() ❖ Dogpile() ❖ Mamma() ❖ 万纬()
初中信息技术教案《搜索、、Internet信息
初中信息技术教案《搜索、整理Internet信息》一、教学目标1. 让学生掌握使用搜索引擎查找信息的基本方法。
2. 培养学生整理和归纳网络信息的能力。
3. 提高学生利用信息技术解决实际问题的能力。
二、教学内容1. 搜索引擎的使用方法。
2. 网络信息的整理与归纳。
三、教学重点与难点1. 教学重点:搜索引擎的使用方法,网络信息的整理与归纳。
2. 教学难点:如何快速准确地使用搜索引擎找到所需信息,以及如何对找到的信息进行整理和归纳。
四、教学方法1. 任务驱动法:通过设置具体的任务,引导学生学会使用搜索引擎和整理网络信息。
2. 案例教学法:通过分析实际案例,让学生了解如何有效地查找和利用网络信息。
五、教学准备1. 教师准备:收集相关案例,制作PPT。
2. 学生准备:了解搜索引擎的基本功能。
六、教学过程1. 导入新课:通过一个生活中的实例,引出本节课的主题——搜索、整理Internet信息。
2. 讲解与演示:讲解搜索引擎的使用方法,演示如何快速准确地找到所需信息。
3. 实践操作:学生分组进行实践,使用搜索引擎查找指定信息。
4. 总结与讲解:讲解网络信息的整理与归纳方法,引导学生学会对找到的信息进行分类、筛选和总结。
5. 练习与拓展:布置一道课后练习题,让学生结合所学内容,独立完成一个搜索与整理信息的任务。
七、教学反思本节课结束后,教师应认真反思教学效果,包括学生的参与度、理解程度和操作能力等方面。
针对存在的问题,及时调整教学方法,以提高教学效果。
八、课后作业1. 复习本节课所学内容,总结搜索引擎的使用方法和网络信息的整理与归纳技巧。
2. 完成课后练习题,独立完成一个搜索与整理信息的任务。
九、评价与反馈1. 课堂表现评价:观察学生在课堂上的参与程度、提问回答情况等,给予及时的表扬和鼓励。
2. 课后作业评价:检查学生完成作业的质量,对学生的学习成果给予肯定和指导。
3. 学生互评:鼓励学生之间相互评价,共同提高。
Internete及其应用第二章练习题(2)
《Internet及其应用》第二章练习题(3)一、单选题1.下面( )服务Internet上没有。
A)网上商店B)网上图书馆C)网上桑拿浴D)网上医院2.WWW起源于( )。
A)美国国防部B)美国科学基金会C)欧洲粒子物理实验室D)英国剑桥大学3.以下哪一项不属于因特网服务?( )A)Gopher B)WAIS C)EMS D)Archie4.Sun中国公司网站上提供了Sun全球各公司的链接网址,其中 表示SUN( )公司的网站。
A)中国B)美国C)奥地利D)匈牙利C/ISI的保罗.莫卡佩特里斯,发明一种转换系统,使我们可以使用自己熟悉的语言,让电脑把这种语言转换成电脑能懂的数学式的IP地址,这个系统被称作( )。
A)“域名换换系统” B)“域名与IP转换系统”C)“IP转换系统” D)“域名系统”(DNS)6..HTML的正式名称是( )。
A)主页制作语言B)超文本标识语言C)WWW编程语言D)JAVA语言7.IP地址是一串很难记忆的数字,于是人们发明了( ),给主机赋予一个用字母代表的名字,并进行IP地址与名字之间的转换工作。
A)DNS域名系统B)WINDOWS NT系统C)UNIX系统D)数据库系统[A]8.因特网是一个( )。
A)大型网络B)国际购物C)电脑软件D)网络的集合9.在浏览WEB网的过程中,如果你发现自己喜欢的网页并希望以后多次访问,应当使用的方法是为这个页面( )。
A)建立地址簿B)建立浏览C)用笔抄写到笔记本上D)放到收藏夹中10.如果想把一文件传送给别人,而对方又没有FTP服务器,最好的办法是使用( )。
A)E-mail B)Gopher C)WWW D)WAIS11.超文本之所以称之为超文本,是因为这因为它里面包含有( )。
A)图形B)声音C)与其它文本链接的文本D)电影12.下面是一些因特网上常见的文件类型,请指出哪个文件类型一般代表WWW页面文件?( )A)htm或html B)txt或text C)gif或jpeg D)wav或au13.超级链接可以是文件中的( ),以下哪项有错?A)一个词B)一个词组C)一种颜色D)一幅图像14.IP地址由一组( )的二进制数字组成。
搜索引擎—利用Internet搜索资源(教学设计)
情感态度与价值观:❖陶冶学生的情操,激发学生的爱国热情。
❖培养学生的自学能力,并在实际问题解决的过程中锻炼学生综合、分析、判断等高层次思维技能。
❖培养学生的审美观念。
过程(教学或学习过程)教师:任务呈现→指导、咨询→考察学习情况↓↓↓交流评价讨论学生:接受任务→利用网络自主协作学习→反馈→利用素材完成任务1、创设情境,模拟小时吃饭情景,提出问题1——饭是否可以抛在空中直接吃?2、课堂活动一:学生活动,讨论问题1。
学生讨论的结果要说明理由(20分钟)A、按就近原则分组,全班分成6小组,小组讨论。
(10分钟)B、每组选派代表说出他们讨论结果。
C、自愿发言3、教师针对学生讨论的答案,说出他的观点,并播放一段从Internet中搜索的有关“神六”的两名宇航员在太空中吃饭的生活情境,通过问题1引入本单元内容。
4、教师介绍单元任务。
(5分钟)5、课堂活动二:提问学生神七发射时间、地点及其他们通过什么方式知道。
(20分钟)组织学生讨论。
预计学生讨论结果:电视、别人告诉、网络、书籍等6、⑴、如果学生有提到网络,老师小结后直接进入第7步。
⑵、如果学生没有提到网络,教师补充此方式小结后再进入第七步。
7、布置家庭作业1A、学生课后自己学习课本单元所有内容,标注自己认为重要的内容。
B、思考单元内容问题。
8、布置学生课堂活动二:小组讨论如何从网上获取资源(讨论)(30分钟)将全班学生分10组,有意识将平时网络知识丰富的学生分成每组小组长。
任务:A、小组每位学生讨论自己回家预习了什么?B、小组成员讨论网上怎么样获取资源,讲述自己准备怎么样用因特网获取资源?C、小组确定一个目标,然后根据小组的目标提出自己的设想?。
internet技术及应 搜索引擎续
2 搜索关键词的提炼
• 学会从复杂搜索意图中提炼出最具代表性和指示性 的关键词对提高搜索效率至关重要,这方面的技巧 或者说经验是所有其他搜索技巧的基础。 • 选择搜索关键词的原则是,首先确定所要达到的目 标,即确定要找的到底是资料性的文档?还是某种 产品或服务?然后再分析这些信息都有些什么共性, 以及区别于其他同类信息的特性,最后从这些方向 性的概念中提炼出此类信息最具代表性的关键词。 如果这一步做好了,往往就能迅速的定位要找的东 西,而且多数时候根本不需要用到其他更复杂的搜 索技巧。
地图
查找周边
国学
网络导航
1、什么是网络导航 2、网络导航的作用 3、常用网络导航网址
什么是网络导航
• 网站导航并不像网站地图那样有一般的 表现形式和比较统一的内容,网站导航 实际上并不是一个非常确定的功能或者 手段,而是一个通称,凡是有助于方便 用户浏览网站信息、获取网站服务,并 且在整个过程中不至迷失、在发现问题 时可以及时找到在线帮助的所有形式都 是网站导航系统 2 内容 3 功能 4 界面 5 定位
结果
• 查全率,相关度,检索深度,google占 优,尤其是英文的搜索
内容
• Google,月更新,网页42亿以上,图片 4亿以上,覆盖世界各地 • Biadu,周更新,中文网页3亿以上, flash5万以上,全球最大中文数据库 • 覆盖范围主要:中国内地,港澳台,新 加坡,部分北美,欧洲
*网页更新速度。取决于新网页的发现,和死链(指无 法访问网页)的及时删除。结果中大量的死链和过时 信息的链接,将会降低用户体验。 *搜索服务的相应时间,也就是用户提交检索后得到结 果返回的等待时间,一般要低于一秒即可。
*搜索服务的系统稳定性。
搜索引擎比较
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.10 搜索引擎—分类
按类型分
WEB搜索引擎 FTP 搜索引擎 学术搜索引擎 blog搜索引擎 新闻搜索引擎
1.10 搜索引擎—元搜索引擎
一次搜索多个搜索引擎,并将结果返回给 用户。有的直接按来源引擎排列搜索结果, 有的则按自定的规则将结果重新排列组合。
优点:能同时搜索多个搜索引擎,能在一 定程度上提高查询的广度。
Google() Google是在国外很受欢迎的搜索引擎,界 面简洁,以搜索结果的准确性著称,它的 网页快照和图片搜索也很有特色。
网站所有者主动向搜索引擎提交网址,然后搜索 引擎在一定时间内派出spider程序搜集有关信息 加入数据库。(天网)
1.10 搜索引擎—搜索引擎的原理
检索与排序技术(索引器和检索器) 超链分析技术 索引信息检索 全文检索
用户接口
1.10 搜索引擎—搜索引擎的原理
索引器: 是理解搜索器所搜索的信息,从中抽取出索引 项,用于表示文档以及生成文档库的索引表。
InfoSeek
InfoSeek() InfoSeek是一个高效的搜索引擎,它的特
点是:搜索精度高,查到的节点一般都与用户 的要求相符。其搜索结果按照相关程度依 次显示。每一个结果显示该HTML文件的标 题、摘要、大小。
Lycos
Lycos ( ) Lycos是最老资格的搜索引擎之一,只要能给出
Internet的定义,历史、现状、功能 Internet技术基础
计算网络基础 TCP/IP协议的基本知识,常用术语 接入Internet的方式
常见的网络应用及其工具软件简介
网络浏览,EMAIL,FTP,P2P等等 搜索引擎的使用 网页的制作,网络服务器的搭建
典型Internet网络系统组建与维护 Internet网络安全基础
INTERNET技术与应用
课程简介
目的:
学会使用Internet进行信息交流和资料查询,为 今后工作和学习打下基础。
了解Internet技术的基本原理
学分: 选修课、2学分 学时: 理论30学时,10次课,
上机20小时,分5次,每次4小时。 学习方法:听课看书上机上网实践提引擎: / 搜狐搜狗搜索:/ 雅虎:/ 新浪:/ 网易 :/ TOM搜索: / 北大天网搜索引擎: /
一般资料 古汉语(诗词)资料 产品或服务
搜索引擎/目录索引 Google AllTheWeb InfoSeek/WebCRawler等 Yahoo/Overture
搜索引擎/目录索引 Google (有独到之处) 搜狐、新浪(质量高)、 网易(较全)
1.10 搜索引擎—通用搜索引擎简介
Yahoo InfoSeek Lycos Webcraw擎的定义和分类 搜索引擎的原理 常用搜索引擎 GOOGLE使用指南 常见专业数据库简介
1.10 搜索引擎—网络信息检索工具
已经知道地址时直接访问。 不知道地址的时,需借助检索工具
➢ 搜索引擎 ➢ 网络资源指南(门户) ➢ 专门数据库
1.10 搜索引擎
搜索引擎(Search Engine)的定义
1.10 搜索引擎—搜索引擎的原理
说明
搜索引擎并不真正搜索互联网,它搜索的实际上 是预先整理好的网页索引数据库。
搜索引擎也不能真正理解网页上的内容,它只能 机械的匹配网页上的文字
1.10 搜索引擎—分类
按照原理
关键词搜索引擎 主题分类指南(directory search engine) 元搜索引擎(meta-search engine)
1.10 搜索引擎—搜索引擎的原理
搜索引擎的原理
1. 从互联网上抓取网页 2. 建立索引数据库 3. 在索引数据库中搜索排序
从互联网抓取网页
建立索引数据库
检索排序
1.10 搜索引擎—搜索引擎系统流程
1.10搜索引擎—搜索引擎的原理
信息收集功能(搜索器)
定期搜索,派出spider程序对一定范围内的网站 进行检索,发现新的或更新后的网站会自动提取 网站信息加入数据库。
网上搜索信息的人很少考虑如何找到他们 所需要的信息,因此搜索信息很盲目;
只有18%的用户表示总能在网上搜索到需要 的信息。68%的用户说他们对搜索引擎很失 望;
平均每个搜索者在12分钟的徒劳搜索后就 感到恼火和受挫。
46%的人只会用同一个关键词搜啊搜啊,而 且是在同一个搜索引擎。
1.10 搜索引擎—如何有效地搜索
国外英文常用搜索引擎
Google — 以搜索精度高、速度快成为最受欢迎的搜 索引擎。 Fast/AllTheWeb — 总部位于挪威的搜索引擎后起之 秀,风头直逼google。 AltaVista — 曾经的搜索引擎巨人,目前仍被认为 是最好的搜索引擎之一。 Overture — 最著名的搜索引擎广告商,竞价排名的 始作俑者,也是全文搜索引擎。 Lycos — 发源于西班牙的搜索引擎,网络遍布世界 各地。 HotBot — 隶属于Lycos Networks,搜索结果来自其 他搜索引擎及目录索引。
1.10 搜索引擎—垂直搜索引擎
即专业或专用搜索引擎,它专门用来检索 某一主题范围或某一类型信息,追求专业性 与服务深度是它的特点。
垂直搜索引擎不但可保证此领域信息的收 录齐全与更新及时,而且检索深度和分类细 化远远优于综合搜索引擎。
1.10 搜索引擎—垂直搜索引擎举例
找工作的搜索引擎:/ google学术搜索:/ google图书搜索:/ 比价购物搜索引擎:
1.10 搜索引擎—搜索引擎的原理
检索器
检索器的功能是根据用户的查询在索引库中快速检出文档, 进行文档与查询的相关度评价,对将要输出的结果进行排 序,并实现某种用户相关性反馈机制。
检索器常用的信息检索模型有集合理论模型、代数模型、 概率模型和混合模型四种。
用户接口
用户接口的作用是输入用户查询、显示查询结果、提供用 户相关性反馈机制。主要的目的是方便用户使用搜索引擎, 高效率、多方式地从搜索引擎中得到有效、及时的信息。 用户接口的设计和实现使用人机交互的理论和方法,以充 分适应人类的思维习惯
是指通过网络搜索软件或网站登陆等方式, 将互联网上大量网站的页面收集到本地, 经过加工处理而建库,从而能够对用户提 出的各种查询作出响应,提供用户所需的 信息
1.10 搜索引擎—简介
分类目录型 是按目录分类的网站链接列表。如 Yahoo雅虎、新浪等。
搜索(网页)型 利用关键字进行匹配方法进行网页定 位。
Yahoo
Yahoo!()
Yahoo!是目前最常用的引擎之一,是Internet引擎的"元老"。 Yahoo!的使用很简单,可以直接输入查找关键字,也可以先 选分类主题进行分类查询 ,它将返回三种信息:
1. 满足查询条件的Yahoo目录(用户可以利用它们进行交叉 引用); 2. 满足条件的实际站点; 3. 更广泛的含有页面索引的Yahoo!目录,是一种更 广泛的 交叉引用。
缺点:有时候并不能对一个搜索引擎全部 查完,有时候也会漏掉一些重要信息。
1.10 搜索引擎—搜索引擎发展史
产生:1990年-Archie-蒙特利尔大学的 Alan Emtage开发的ftp搜索系统。
1993年10月 ALIWEB系统:网站自己提交索 引信息。(yahoo)
1993年底 基于spider的搜索引擎出现 1994年4月 yahoo:自附简介信息,效率高;
Webcrawler
Webcrawler() Webcrawler 是一个杰出的搜索引擎 ,它
提供事先分好类的19个主题,实现了基于主 题的搜索。 Webcrawler号称支持"自然语言搜索",所以 可以输入像"highest mountain in the world(世界上最高的山)"这样的查询条件。
索引项:分为客观索引项和内容索引项两种
客观项:与文档的语意内容无关,如作者名、 URL、更新时间、编码、长度、链接流行度 (Link Popularity)等等;
内容索引项是用来反映文档内容的。如关键词 及其权重、短语、单字等等。内容索引项可以 分为单索引项(单词)和多索引项(或称短语 索引项)两种。
题搜索
1.10 搜索引擎—搜索引擎发展史
1997年,天网ftp搜索、主题搜索 1998年,google:pagerank、动态摘要、
网页快照等。 1999年,Fast/AllTheWeb:利用ODP自动分
类 2001年,Teo擎
WebCrawler:支持全文检索
1.10 搜索引擎—搜索引擎发展史
1994年7月,Lycos:网页自动摘要 1995年,元搜索引擎Metacrawler 1995年12月,Altavista:自然语言搜索,
高级搜索语法(AND、NOT、OR) 1997年,天网:教育网优势、ftp搜索、主
/ / 博客与RSS搜索引擎: http://so.bloБайду номын сангаас/ 人脉搜索引擎: / 论坛搜索引擎:/
1.10 搜索引擎—使用现状
是世界上最大的、也是最好的网站分类目录,已 经被世界各国400多个网站选做默认搜索引擎。 它用一颗小星星推荐各个目录下最好的网站,使 初学者不会被太多的网站弄迷途。
search
search() search属于元搜索 引擎,它收集了800多种专业搜索引擎和数据库。
当你进入大主题“新闻媒体”搜索,它把搜索结 果分为头条新闻、商业新闻、体育新闻、等,如 果再进入小主题“科技新闻”搜索,那么它可以 同时搜索CNET、PC World、ZDNet、、 TechWeb这5个著名的科技新闻网站,足够保证 你得到最全最新的科技新闻。
Ask
Ask ( )Ask是一个支持自 然提问的搜索引擎,当你遇到一些属于事 实型、原理型的问题时,使用Ask是最方便 的。例如:“美国历任总统中就任时年纪 最轻的是谁?”、“飞机是哪一年发明 的?”它都会给你答案的。