第7章 网络信息资源的检索与利用
第七章 Internet 信息检索工具—搜索引擎

(4)用户接口
供用户输入查询,显示匹配结果。 用户接口的设计和实现使用人机交互的 理论和方法,以充分适应人类的思维习 惯。
4、搜索引擎的主要任务
(1) 信息搜集 各个搜索引擎都派出绰号为蜘蛛(Spider)或机 器人(Robots)的“网页搜索软件”,在各网 页中爬行,访问网络中公开区域的每一个站点 并记录其网址,将它们带回搜索引擎,从而创 建出一个详尽的网络目录。由于网络文档的不 断变化,机器人也不断地把以前已经分类组织 的目录更新。
第七章 Internet 信息检索工 具—搜索引擎
7.1搜索引擎基本理论
1、什么是搜索引擎?
简单地说,所谓搜索引擎,就是采用信息自 动跟踪标引等技术、建立在因特网上专门提 供网络信息资源导航服务检索工具。 它能够通过Internet 接受用户的查询指令 ,并向用户提供符合其查询要求的信息资源 网址。
5、搜索引擎的种类
检索型搜索引擎:它使用自动索引软件来发现、收集并标引网 页,建立数据库,并以Web形式让用户找到所需信息资源。比 较著名的有:息系统地分门归类,经过人工 整理后形成庞大而有序的分类目录体系,用户可以在目录体系 的导引下通过逐级浏览,发现、检索到有关的信息。雅虎就是 以卓越的分类目录型导航服务而称誉全球,典型的分类目录搜 索引擎如Yahoo ( /) 混合型搜索引擎:它兼有检索型和目录型两种方式。如:新浪、 搜狐、网易、中华等门户网站。 多元搜索引擎:也称为集合型搜索引擎。它是将多个搜索引擎 集成在一起,通过统一的检索界面进行网络信息多元搜索 的 检索工具。按照工作方式的不同可分为并行处理式和串行处理 式两大类。著名的有: Meta crawler、Dogpile、Mamma和万 维搜索(Http:///)等。
引号 引号( “ ” )的作用是,括在其中的多个词 被当作一个短语来检索。绝大部分主要搜索引 擎都支持短语检索,找到含有与短语词序和意 义完全相同的页面。例如,检索式 “ electronic magazine ” ,表示把 electronic magazine 当作一个短语来搜索。 如果不加引号,搜索引擎就会把两词之间的空 格按“与”处理,查出包含 electronic 和 magazine 的页面,结果应与用户要求的主题 内容相去甚远。
最新网络资源的检索与利用

并且每天使用最多的也是互联网,而不是图书馆的资 源。
简介
这种现象说明:除了图书馆自有商业资源及其 他共享资源之外,教学科研人员和学生更频繁地利 用互联网,来获取互联网上对科研教学和学习具有 重要参考价值的文献。
也就是说,从事教学科研和学习活动所需 要参考的文献来自于图书馆自有资源、互联网 等多个方面。
网络信息资源的类型
按所采用的网络传输协议可分为:
WWW网络资源:因特网信息资源的主流,它使用http协议, 使用简单,功能强大,能方便迅速的浏览和传递分布于网络 各处的文字、图象、声音和多媒体超文本信息。 FTP信息资源:它使用ftp协议,该协议主要用于连网计算机 之间传输文件。FTP相当于在网络上两个主机之间复制文件。 目前仍是发布、传递软件和文件的主要方法。 TELNET信息资源:telnet是远程登陆协议。telnet信息资 源包括硬件资源和软件资源。许多机构都提供远程登录的信 息系统,如图书馆的公共目录系统,信息服务机构的综合信 息系统等。 用户服务组资源:包括新闻组,电子邮件组等。这些电子通 信组形式所传递和交流的信息资源是网络上最自由、最具有 开放性的资源。news
信息共享程度高 由于信息存储形式及其数据机构具有通用性、开
放性和标准化的特点,在网络环境下,时间和空间范围得到了最大限度 的延伸和扩展。用户同时可以共享同一份信息资源。
网络信息资源的特点
ห้องสมุดไป่ตู้
信息数量巨大而庞杂:因特网是一个基于TCP/IP协议联接各国、各
机构数十万个计算机网络,集各种信息资源为一体的信息资源网,由于 政府、机构、企业、个人都可以在网上发布信息,因此成为海量的、庞 杂的信息源。
信息类型多、范围广网络信息无所不包,而且类型丰富多样,覆盖
网络信息资源检索与利用笔记

网络信息资源检索与利用1网络信息资源检索概述信息是人类认识客观世界与改造客观世界的媒介,是人类社会延续与发展的纽带,是人类交流的工具。
1.1.1信息与信息资源1)信息的概念信息,是指用来表现事情特征的一种普遍形式,并非事物本身,是事情自身显示其存在方式和运动状态的表象。
信息的两个重要层次是从客体出发的本体论层次和从主体出发的认识论层次。
2)信息资源的概念物质、能源、信息被称为当今人类社会发展的三大支柱。
信息资源是指所有可利用的信息的集合。
3)信息资源的构成信息的内容信息内容的表达和组织方式信息表达所依附的载体和传递的媒介1.1.2信息资源的类型1)信息资源类型的主要区分通常依据信息表达形式和所依附的载体来区别信息资源类型1.口语信息资源2.体语信息资源3.实物信息资源4.文献信息资源2)文献信息资源的类型⏹按照记录方式和记录载体材料的不同划分⏹按照信息被加工的层次划分⏹按照信息出版的形式划分⏹按照信息资源的组织形式和管理系统划分⏹按照服务方式和传播手段划分1.1.3网络信息资源及相关知识1)网络信息资源的理解网络信息资源是表现形式、服务方式和传播手段综合一体的产物。
网络信息资源是将文字、图像、声音、动画等多种形式的信息,以数字化形式存储,并借助计算机与网络通信设备发布、收集、组织、存储、传递、检索和利用的信息资源。
2)网络信息资源的特点a.信息内容的表达与组织方式的不同b.信息表述所依附的媒介物的不同3)Internet 的功能和应用①电子邮件(E-mail)②远程登录(Telnet)③文件传输(FTP)④WWW信息服务系统⑤WAIS服务系统,即广域信息服务系统(Wide Area Information Server)⑥Gopher信息检索系统4)网络信息资源的种类按信息存取方式划分①邮件型②电话型③公告牌型④广播型⑤图书馆型⑥书目型按网络信息资源的层次划分a.指示信息b.信息单元c.文献d.信息资源e.信息系统5)网络信息资源的分布(一)大学、科研院所站点所发布和提供的信息资源(二)公司、企业站点所发布和提供的信息资源(三)专业信息服务机构点所发布和提供的信息资源(四)政府机构所发布和提供的信息资源(五)商业网站所发布和提供的信息资源1.2信息检索及发展1.2.1信息检索概述1)信息检索的含义信息检索是用户根据特定的需求,借助某种检索工具,采用一定的检索策略和方法,从待检的信息源或信息集合中查找出所需信息的过程。
互联网信息资源检索与利用

互联网信息资源的检索与利用学院:经济与政治学院专业:思想政治教育(社会管理方向)年级:2013级班级:13级思政2班学号:1305030540060姓名:张旭时间:2015年5月5日一、上课内容(一)第一课1. 计算机网络基础知识讲了互联网,全称国际互联网(Internetwork,internet,因特网),始于1969年的美国,是全球性的网络。
互联网的入口,网址、IP地址的基本概念,检索关键字,用户终端等我国互联网的诞生,互联网的发展现状,中国互联网络信息中心(CNNIC),互联网发展趋势图,网络拓扑连接情况,局域网/城域网布布局图,世界光缆布局图,互联网监管部门--中国互联网络信息中心,互联网的范畴。
2.网络信息资源概述讲了互联网使用现状及开课的目的,互联网信息资源的概念,互联网信息资源的种类,互联网信息资源的特点,3.网络信息检索工具(搜索引擎)主要讲了搜索引擎的定义,搜索引擎的工作原理及组成,搜索引擎的分类,搜索引擎的使用方法和检索规则。
4.综合性搜索引擎谷歌搜索,Google检索规则,查询类搜索,高级搜索,Google Scholar(学术搜索),百度搜索,百度名称由来,百度的搜索功能,百度搜索技巧:intitle搜索范围限定在网页标题,site搜索范围限定在特定站点中,inurl搜索范围限定在url链接中,减号“-”不含特定查询词,加号“+”包含特定查询词,filetype搜索范围限定在指定文档格式中,百度高级搜索页面。
文档搜索,百度预测,搜狗搜索,Yahoo!,元搜索引擎,(二)第二课教室被考试评卷占用,推后补上。
(三)第三课主要讲了百度公司简介,百度的来源,海量的搜索结果,百度快照,相关搜索,错别字提示,英汉互译词典,计算器和度量衡转换,专业文档搜索,股票、火车和飞机航班查询,百度高级搜索语法,搜索范围限定在网页标题中-intitle,搜索范围限定在特定站点中-site,搜索范围限定在url链接中-inurl,精确匹配—双引号和书名号,搜索结果中不含特定查询词-减号,个性设置,天气查询,货币换算,搜索框提示,关闭搜索框提示功能,恢复浏览器的搜索框历史提示功能。
网络信息资源检索与利用 知识点

第一章1、情报定义:情报室人们用来解决特定问题所需要的,经过激活过程活化了的,具有使用价值的知识或信息。
2、文献定义:文献是记录知识的一切载体,即用文字、图形、符号或者声频等技术手段记录知识的物质载体。
或固化在物质载体上的知识。
文献具有三个属性即文献的知识性、记录性、物质性。
3、信息、知识、情报和文献的关系信息是物质存在的方式、形态和运动规律的表征,人脑对物质属性的感知形成信息,信息是起源,是基础;文献是信息、知识、情报的存储载体和重要的传播工具,信息知识和情报的内容只有记录在物质载体上才能构成文献;文献通过传递、应用于理论和实践又会产生新信息。
4、文献信息源文献信息也称文献资源,是用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。
5、文献信息源类型按照信息源的载体类型划分:印刷型缩微型声像型电子型按照信息源的加工程度划分:1)零次文献:零次文献是指尚未经过系统整理形成正式文献的零散资料或最原始的记录,如书信、手稿、笔记等。
2)一次文献:一次文献又称原始文献,是作者对自己研究的成果或创造性活动成果的直接记录。
一般是指公开出版的著作,期刊论文、科技报告、会议文献、学位论文、专利文献等。
3)二次文献:二次文献是将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。
二次文献包括目录、文摘、索引等,它们是二次文献的核心。
4)三次文献:三次文献是通过二次文献提供的线索,对某一范围的一次文献进行分析、综合研究、归纳、整理等深加工所生成的文献,包括素萍,百科全书、报告、年鉴、手册、字典等。
6、信息检索:广义上说信息检索是指将信息按照一定的方式组织和储蓄起来。
并根据信息用户的需求查找出相关信息的过程。
7、著录:是根据一定的规则,对文献的内容和形式特征进行分析、选择和记录的过程。
8、标引:1)按照标引的的工作方式分类:分为人工标引、计算机辅助标引、自动标引。
《信息检索与利用》练习题

绪论1.信息、知识、文献的概念及相互关系是什么?2.信息环境问题主要体现在哪些方面?3.信息素质的内涵包括哪些内容?4.按文献的载体形式、出版形式可分别将文献分为哪几种类型?5.按文献的加工程度可将文献分为哪几种类型?它们之间的关系是什么?第2章信息检索原理1.文献的外部特征和内容特征分别有哪些?2.检索方法及各自的优缺点有哪些?3.常用的检索技术有哪些?4.简述布尔逻辑算符AND、OR和NOT在编制检索提问式中的作用。
5.请为检索课题“航空或航天发动机的设计和制造”编制检索式。
6.在一个具有1000篇文献的检索系统中检索某课题,用一特定检索策略查该课题时输出文献60篇。
经分析评估,发现该系统中共有该课题相关文献50篇,检出的文献中实际相关文献只有30篇,求查全率、查准率。
第3章馆藏信息资源利用1. 你是如何认识数字图书馆时代的馆藏资源的?2. 请做排序:TP3/2;I247.5/123;I247.5/55;TP316/4;O13/5;TM925/44;G252.7/178;TP39/3。
3. 谈谈你对数字图书馆的认识。
4. 请检索你在图书馆近一年的借阅历史。
5. 请检索丁元霖主编的《商品流通企业会计》在中国国家图书馆是否有收藏,收藏在哪些书库?第4章国内主要中文数据库1.试比较分析中国知网(CNKI)、万方数据知识服务平台、维普资讯网中“中文期刊数据库”的异同点。
2.查找你所在单位人员撰写的你所学学科专业的硕士论文或博士论文3篇。
3.用检索实例说明中国知网(CNKI)标准检索、高级检索、专业检索、引文检索、学者检索的检索方法。
4.查找洗衣机方面的中国专利2项。
简述检索方法和步骤。
5.查找参考文献写作规范的国家标准。
第5章常用国外全文数据库1.结合你所学专业列出你所熟悉的外文电子图书数据库,并简述其检索方法。
2.简述你所学专业的常用外文电子期刊数据库有哪几种,并以其中一个数据库说明其检索方法。
3.简述ProQuest学位论文数据库检索方法。
实验一《网络信息资源检索与利用》

应用学院文献检索实验报告(一)实验名称《网络信息资源检索与利用》实验姓名蔡鑫实验日期2011 年10 月10 日学号200813120123 专业班级通信0881 实验地点 E 513指导老师陈多评分一.实验目的及要求1.培养利用网络的兴趣,熟悉网络信息环境,提升信息素养,了解网络可以解决什么问题,认识网络与生活密不可分。
2.熟悉WWW信息资源的主要检索方法。
3.掌握提高查全率和查准率的方法。
4.掌握一种文献管理软件(如endnote)的使用。
5.掌握搜索引擎的检索技术。
6.利用搜索引擎查找本专业的国内学会网站或研究机构,了解学术动态。
7.利用搜索引擎查找本专业或相关专业的国内企业网站,了解其新产品信息。
8.搜索本专业(或本行业)的相关新闻1条。
9.查找本专业国际会议的举办消息。
二.实验内容熟悉本校图书馆主页内容1.登陆湖南工程学院图书馆网站。
2.利用图书馆网站上的公共检索系统中的“书刊检索”查看我院图书馆收藏的2007年出版的《操作系统》有几种,分别记录书名、出版社和出版年。
共有27种3.找所学专业中文核心期刊有哪些?列出刊名及主办单位、出版社地址。
4.到图书馆网站的“本地资源”、“网络资源”、“试用资源”栏目中体验各特色数据库的功能特点。
5.建立一个文献管理数据库,并把前几个实验下载的文献加载到文献管理数据库中。
6.通过中国国家图书馆的联机公共目录查询系统检索宋鸿兵编著的《货币战争》一书,记录国家图书馆共有几册该书,分别收藏在哪些书库或借阅室。
国家图书馆共有7册7.通过百度百科检索“三聚氰胺”的定义。
8.登陆中国知识产权局网站,检索以“湖南工程学院”为申请人的专利,记录专利总数,并记录其中一项专利的专利名称、专利号和发明人。
专利总数:959.用百度进行检索, 搜索“大学生毕业就业指导”的PPT结果有多少个? (用时多少秒)45100个用时:0.00110.用百度在高校网站下找“高校教学评估”方面的消息,找到相关网页约多少篇,用时多少秒,并用百度在高校网站下找“高校教学评估”消息精确检索,找到相关网页约多少篇,用时多少秒。
《网络信息资源检索》课件

合法获取和使用
在使用网络信息资源时,应通过合法途径获取和 使用,避免使用盗版或非法获取的资源。
05
网络信息资源检索的发展趋势
个性化信息检索服务
总结词
个性化信息检索服务是一种基于用户兴趣和需求的信息检索方式,通过分析用户的历史搜索记录、兴趣偏好等信 息,为用户提供更加精准、个性化的搜索结果。
详细描述
信息排序
检索结果通常会按照相关度、时 间顺序等标准进行排序,以便用 户快速找到所需的信息。
02
网络信息资源检索工具
搜索引擎
搜索引擎定义
搜索引擎是一种网络信息资源检索工具,通过爬取互联网上的网 页信息,建立索引数据库,为用户提供关键词检索服务。
搜索引擎分类
搜索引擎可分为全文搜索引擎、元搜索引擎、垂直搜索引擎等类型 ,每种类型都有其特点和适用场景。
3
常用网络资源目录
常用的网络资源目录包括Yahoo目录、Open Directory等。
03
网络信息资源检索技巧
关键词选择与提炼
01
关键词是检索过程中最关键的要素,选择恰当的关 键词能够提高检索的准确性和效率。
02
关键词的提炼需要从信息主题、内容、特征等方面 进行提炼,以突出信息的核心内容。
03
常用特种文献数据库
常用的特种文献数据库包括万方数据、维普资讯、中国知网等。
网络资源目录
1 2
网络资源目录定义
网络资源目录是指将互联网上的各类资源进行分 类和整理,形成一个层次结构化的目录体系,方 便用户进行查找和检索。
网络资源目录特点
网络资源目录具有高度的组织性和分类性,能够 提供全面、系统的互联网资源检索服务。
图书馆资源
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
INTERNET上的信息资源
• 4、以电子出版方式在网上定期出版的各类
电子期刊。 • 5、可以远程阅读电子图书的虚拟图书馆或 电子图书馆。 • 6、供免费下载的软件资源。
INTERNET上的信息资源
• 按资源的功能特性来分: • 1、商业类资源: • 2、专业技术类资源 • 3、管理类资源
信息资源的特性
IP地址
• B类:地址的最高端前两个二进制们为10,
前两个字节组表示网络标识,后两个字节 组为主机标识,共有16384个网络,每个网 络大 约有65000台主机。 • 地址范围:128.0.0.1 - 191.255.255.254 • 主要用于中等规模的网络,它的特点是网络数与
主机数大致相同
IP地址
搜索引擎
--INTERNET信息资源检索
什么是INTERNET
• INTERNET:通常称之为因特网。 • 是一个以TCP、IP网络协议联接全球 计算机网络 •
• •
的数据通信网。 是一个集各个领域、各个机构的信息资源为一体, 供上网用户共享的信息资源网。 是全世界靠TCP/IP协议连接起来的所有计算机及 其各级网络的统称。 是一个供全人类共享的信息平台。它提供了创建、 浏览、访问、搜索、阅读、交流信息等各种信息 服务。内容涉及的广泛,包括自然科学、社会科 学、体育、娱乐等各个方面。
类型范围;专业范围
搜索引擎的检索技术
• 1、确定好关键词: • 搜索引擎一般用自由词作为检索用关键
词。目标专题的相关术语、关键词,专业 研究机构的名称、地理位置、作者姓名、 产品名称、专利编号等都可以作为关键词。 • 好的引擎允许直接采用自然语言中的字 (检索到字)、词或整个句子作提问式检 索。
搜索引擎的检索技术
网页中出现了检索词或符合表达式要求的 情况即算检索出结果。 • 它充分利用了关键词的属性。
网络信息检索策略
• 1、了解网络信息资源 • 2、选择恰当的网络检索工具 • 3、使用相应的检索方式
搜索引擎的选择
• 1、搜索速度 • 2、返回的信息量 • 3、信息相关度 • 4、易用性 • 5、稳定性 • 6、搜索范围:地域范围;语言范围;网站
• • •
INTERNET的形成与发展
• 1975年ARPA从实验性网络转入应用性网络。并由
• •
美国国防部通讯署进行管理。ARPA改名为DARPA。 1976年,ARPANET通过卫星联到欧州,向社会扩 展。 1979年,DARPA成立了一个正式的INTERNET控 制和通讯委员会(ICCB) 在此同时,日本国家的DDX-1网络,英国的EPSS 网络,法国CYCLADES网络纷纷成立。 1980年TCP/IP正式问世。
搜索引擎的检索方式
• 1、分类目录检索 • 2、关键词检索(全文检索)
分类目录检索
• 将信息按内容等特征进行分门别类,利用
超文本超媒体的技术进行检索。 • 这种检索非常简单,用户只要用鼠标进行 点击即可得到所需的网页。 • 但是这种检索结果粗糙,查准率很低。
关键词检索
• 它是一种基于网页的全文检索技术。只要
•
搜索引擎
• 除上述三大类引擎外,还有以下几种非主流形式: • 1、集合式搜索引擎:如HotBot在2002年底推出的引擎。该引擎
类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索, 而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引 擎更确切些。 2、门户搜索引擎:如AOL Search、MSN Search等虽然提供搜索 服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来 自其他引擎。 3、免费链接列表(Free For All Links,简称FFA):这类网站一 般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模 比起Yahoo等目录索引来要小得多。 • 由于上述网站都为用户提供搜索查询服务,为方便起见,我们通 常将其统称为搜索引擎。
网络基本知识
• DN(域名):是INTERNET主机的一种
字符型标识。
网络基本知识
• DNS(域名系统):将DN翻译成IP地址。
网络基本知识
• TCP/IP:传输控制协议和网际协议。 • TCP:传输层协议 • IP:网络层协议
INTERNET主要功能
• • • • • • • • • •
INTERNET的功能主要有: 传递信息和检索信息两个主面。 功能具体表现为: 一、WWW 二、EMAIL 三、NEWS GROUP 四、FTP 五、TELNET 六、BBS 七、QQ
• 看IP地 第一个字节组的十进制数: • 若为1-126,则为A类。 • 若为128-191,则为B类 • 若为192-223,则为C类 • 若为224-239,则为D类 • 若为240-254,则为E类
子网
• 子网是一个多网络环境中的网络。 • 将一个网络划分成多个子网,要求每个子
网使用不同的网络标识IP。
子网掩码
• 子网掩码是一个32位的地址,它用于屏蔽IP地址
的一部分,区别IP地址中哪些位表示逻辑的网络/ 子网数,并说明IP地址是在本地网上还是在远程 网上。 表示方法: 凡是IP地址的网络和子网标识部分,用二进制1 表示。 凡是IP地址的主机标识部分,用二进制数0表示。 用点和十进制数书写。
• • • •
网络基本知识
• IP地址:是INTERNET主机的一种数字型 • 标识。由32位二进制数表示,每八
位为一组,共四组。 • INTERNET委员会将IP地址为分五类:A、B、 C、D、E
IP地址
• A类:地址的最高端二进制位为O,第一个字节
• •
组表示网络标识,后三个字节组表示主机标识。 共有126个网络。每个网络大约1700万台主机。 地址范围:1.0.0.1-126.255.255.254 主要用于拥有大量主机的网络,它的特点是网络 数目少,而拥有主机数量多。
于识别相应主机。 • 通常用于已知的多点传递或者组的寻址。
IP地址
• E类地址:高端前四个二进制位为1111。主
要用于实验用。
IP地址
• 目前IP地址资源比较紧张,亚太区的分配权
在APNIC(亚太地区网络信息中心,设在日 本东京)手中。 • 我国申请到的IP地址大多是C类地址。
如何判断IP地址
• 1、信息显示多媒体化。 • 2、信息处理数字化。 • 3、信息检索超媒体化。 • 4、信息来源全球性。 • 5、信息传递即时性。 • 6、信息共享开放性。
如何上INTERNET
• • • • • • •
•
上网必备条件 1、硬件条件:PC机,MODEM 2、软件条件: 操作系统 INTERNET工具软件和应用软件 3、接入的方式 : 普通电话上网、ISDN上网、ADSL上网、宽带上 网、DDN专线上网、无线上网 不同的方式代表不同的技术,也需配务不同的 MODEM(调制解调器)。
• C类:地址最高端 前三个二进制位为110,
前三个字节组表示网络标识,后一个字节 组为主机标识。共有200万个网络,每个网 络有254台主机。 • 地址范围:192.0.0.1-223.255.255.254 • 主要用于小型局域网,它的特点是网络数 多,而主机少。
IP地址
• D类:高端前四个二进制位为1110,其余用
QQ信息等网上资源,如何组织好这些信息, 并能将它们检索出来加以利用,成了衡量 一个国家信息化水平的一个标志。
• 网络信息的组织和检索工具:搜索引擎
搜索引擎的分类
• 搜索引擎按其工作方式主要可分为三种,
分别是: • 全文搜索引擎(Full Text Search Engine)、 • 目录索引类搜索引擎(Search Index/Directory) • 元搜索引擎(Meta Search Engine)。
获取INTERNET电子信息资源的 方式
• 通过浏览器访问INTERNET:WWW IE • 通过EMAIL获取信息 • 以网络交流的方式获取电子信息资源: • 实时交谈
• • •
网络电话和网络视频会议系统 网络寻呼 电子公告版、电子新闻、电子报刊、电子论坛
搜索引擎
• 面对浩如烟海的网站、电子邮件、FTP文件、
•
•
INTERNET的开成与发展
• 1978年-1994年,中国与INTERNET开始接触。主
• •
要是通过拔号方式使用INTERNET的EMAIL服务。 1986年,北京计算机应用技术研究所与德国尔斯 鲁厄大学合作开发CANET。 1990-94年,中国大规模与INTERNET连接。相继 完成了四个大型的广域网: 中科院的中科院网 教育系统的中国教育科研网 邮电部的中国公用网 电子部的金桥网
INTERNET的形成和发展
• 1968年美国国防部成立高级研究计划署ARPA,
与其它军事部门合作开发军用实验网络ARPANET。 旨在实现以政府机构、科研、军事等内容为主的 网上资源共离,研究一种可行的与设备无关、独 立于电话线路之外的全国性数据通信技术。 1969年,ARPANET开始投入运行。 1970年,ARPA研究出NCP协议,奠定了 TCP/IP协议的基础。
• 2、逻辑运算: • 逻辑与: • 逻辑或: • 逻辑非: • 位置算符:NEAR。如;ALTAVIST
• •
A搜索引擎中要求两检索词必须距离在10个词 以内。 通配符:* 附:位置算符和通配符一般用于英文检索系统
搜索引擎的检索技术
• 引号:将向个词作为一个词组进行检索。
所有词均有检索意义。 • 忽略词:一些常用的词,在检索中不具 有检索意义。要求它具有检索意义时,须 用引号引起来。
全文搜索引擎
• 全文搜索引擎是名副其实的搜索引擎,国外具代表性的有
Google、Fast/AllTheWeb、AltaVista、Inktomi、Te提取的各个网站的信息(以网页文字为主)而 建立的数据库中,检索与用户查询条件匹配的相关记录, 然后按一定的排列顺序将结果返回给用户,因此他们是真 正的搜索引擎。 从搜索结果来源的角度,全文搜索引擎又可细分为两 种,一种是拥有自己的检索程序(Indexer),俗称“蜘 蛛”(Spider)程序或“机器人”(Robot)程序,并自 建网页数据库,搜索结果直接从自身的数据库中调用,如 上面提到的7家引擎;另一种则是租用其他引擎的数据库, 并按自定的格式排列搜索结果,如Lycos