14网络资源检索与利用
北大14秋季《网络信息资源检索利用》作业答案

作业ID: 106051.经史子集【第三章第一节】“经史子集”:是是我国古代读书人对经典的分类法,是中国古籍按内容区分的四大部类。
经,是指儒家经典和阐释儒家经典的著作.史,是指历史著作.子,是指传统学术中的"杂学",主要包括诸子、兵书、数术、方挤、佛教、道教等类别的典籍.集,是指文学及文学评论作品.2.类书【第三章第四节】类书是在搜集大量文献资料的基础上,分门别类整理成为类似今天百科全书式的工具书;3.鼓励独立完成作业,严惩抄袭。
手册是汇集一般资料或专业知识的参考书,是一种便于浏览、翻检的记事的小册子,是介绍一般性的或某种专业知识的简明摘要书。
4.年鉴【第六章第二节】是一种全面记述事业的年度发展,系统汇集年度重要时事文献信息,逐年编辑、连续出版的资料工具书。
5.影响因子【第五章第二节】是美国ISI(科学信息研究所)的JCR(期刊引证报告)中的一项数据。
即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。
6.一次文献、二次文献、三次文献的联系与区别。
【第一章第一节】一次文献:又称原始文献,是情报学中的一种主要文献,指以作者本人的工作经验、观察或者实际研究成果为依据而创作的具有一定发明创造和一定新见解的原始文献,如期刊论文、研究报告、专利说明书、会议论文、学位论文、技术标准等。
二次文献:是对一次文献进行加工整理后产生的一类文献,如书目、题录、简介、文摘等检索工具。
三次文献:是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为“情报研究”的成果,如综述、专题述评、学科年度总结、进展报告、数据手册等。
一般来说,零次文献是一次文献的基础和素材,一次文献是经常使用的最基本的文献,是检索的对象,二次文献是对一次文献的简化和整理,是检索的主要手段和工具。
三次文献是对零次文献和一次文献的高度浓缩,是情报研究的成果。
7.循环衍生法的具体内容【第一章第三节】所谓循环衍生法,是通过对一个词的定义、语素、语境(上下文)进行分析而获得具有同义或相关关系的衍生语词,再通过对衍生语词进行反复检索尝试来确保检索词的全面与准确8.百科全书的特点【第四章第四节】简单地概括:概述知识条目化,条目编排词典化概述知识条目化,包含:(1)百科全书的内容是对知识体系中的知识点进行总结性概述。
第二章-网络信息资源的检索与利用 第二,三节

A.互联网上的国内期刊信息
• 查找国内期刊,可以从以下站点入手: • 一、中国期刊网: • 二、维普科技期刊网: 或 / • 三、万方数据资源系统的数字化期刊: /qikan/ind ex.jsp • 四、学科导航信息
●
图片搜索
二.常用网络信息资源的检索
• • • • • • • 1. 网络检索--- 图书 2. 网络检索----期刊 3. 网络检索----报纸 4. 网络检索----人物,机构 等信息 5. 网络检索----专利, 标准, 科技报告, 统计数据等信息
怎样查找互联网上的图书信息?
网络信息资源 检索﹠利 用
• 网络信息资源与常用中英文搜索引擎
• 常用网络信息资源的检索利用(学术) • 网络信息资源的检索策略与技巧
第二节
• 常用网络信息资源的检索利用(学术)
一.重要的学术搜索简介
二.常用网络信息资源的检索利用
一.重要的学术搜索简介
• 1. Google scholar(Google学术搜索 ) • 2. Scirus(科学搜索)是目前网上最全面、 综合性最强的科技文献搜索引擎之一 • 3.一些专业专题搜索引擎。
•
Directory of Open Access Journals
• DOAJ( Directory of Open Access Journals)由 由Lund University建立,它提供有质量控制的可 免费获取的网上电子期刊资源,它的目标是建成一 个无学科、无语言限制的综合性的科学期刊系统, 方便科研人员使用,并可提升期刊的显示度。 • 目前该网站已收集了482种期刊,并把这些期刊分 成了15个大类,53个小类,其中包括农业、生命科 学、化学、数学、物理、天文学、工程技术、环境 科学DOAJ( Directory of Open Access Journals 、社会科学等。
网络信息检索与利用参考试题与答案

网络信息检索与利用一、名词解释题:网络信息资源:是将文字、图像、声音、动画等各种形式的信息,以数字化形式存储并借助计算机与网络通讯设置发布,收集、组织、存储、传递、检索和利用信息资源。
www:信息检索数据库:是至少有一个文档组成并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。
联机检索:指用户利用计算机联合通过通讯网络与世界各地的信息检索系统联机,从检索系统的数据库中查找出所需信息的过程。
它允许用户以智能机对话,联机会话,这样交互的方式直接访问检索系统及数据库、检索是实时在线进行。
查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。
查准率:是指检出文献中合乎需要的文献的数量占检出文献的全部数量。
关键词:关键词又称自由词,它属于自言语言范畴。
关键词是直接来自文献本身,能够反映文献主题概念,具有实际检索意义的词语。
以搜索引擎为代表的基于关键词的检索工具能够利用全文索引技术。
布尔逻辑检索:又称布尔代数是指使用,and,or,not等运用符,查找含有某种词语特定主配形式的网页。
搜索引擎:是一个可以用文件名查找文件的系统。
元搜索引擎:是一种基于搜索引擎的网络检索工具。
它是将多个搜索引擎集合在一起,通过一个统一的检索界面接收并处理用户的查询提问。
在进行检索时调用一个或者多个独立搜索引擎的数据库。
桌面元搜索引擎:顾名思义,桌面元搜索引擎不是通过网上调用方式在线使用,而是直接在用户的计算机上进行,相当于用户自己拥有一个元搜索引擎,所以称之为桌面元搜索引擎。
All-in-One式元搜索引擎:又称搜索引擎元目录,它将主要的搜索引擎集中起来,并按类型或检索问题等编排组织成目录帮助导引用户根据检索需求来选择适用的搜索引擎。
联合书目数据库:联合目录是揭示报道若干个文献收藏单位的文献入藏情况,汇总若干个单位馆藏的书目信息的目录。
参考信息:是指人名、地名、机构、事件、统计数据等一类数据,事实信息,是人们的工作研究和日常生活中经常要查考、引用的信息。
网络信息资源检索与利用 知识点

第一章1、情报定义:情报室人们用来解决特定问题所需要的,经过激活过程活化了的,具有使用价值的知识或信息。
2、文献定义:文献是记录知识的一切载体,即用文字、图形、符号或者声频等技术手段记录知识的物质载体。
或固化在物质载体上的知识。
文献具有三个属性即文献的知识性、记录性、物质性。
3、信息、知识、情报和文献的关系信息是物质存在的方式、形态和运动规律的表征,人脑对物质属性的感知形成信息,信息是起源,是基础;文献是信息、知识、情报的存储载体和重要的传播工具,信息知识和情报的内容只有记录在物质载体上才能构成文献;文献通过传递、应用于理论和实践又会产生新信息。
4、文献信息源文献信息也称文献资源,是用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。
5、文献信息源类型按照信息源的载体类型划分:印刷型缩微型声像型电子型按照信息源的加工程度划分:1)零次文献:零次文献是指尚未经过系统整理形成正式文献的零散资料或最原始的记录,如书信、手稿、笔记等。
2)一次文献:一次文献又称原始文献,是作者对自己研究的成果或创造性活动成果的直接记录。
一般是指公开出版的著作,期刊论文、科技报告、会议文献、学位论文、专利文献等。
3)二次文献:二次文献是将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。
二次文献包括目录、文摘、索引等,它们是二次文献的核心。
4)三次文献:三次文献是通过二次文献提供的线索,对某一范围的一次文献进行分析、综合研究、归纳、整理等深加工所生成的文献,包括素萍,百科全书、报告、年鉴、手册、字典等。
6、信息检索:广义上说信息检索是指将信息按照一定的方式组织和储蓄起来。
并根据信息用户的需求查找出相关信息的过程。
7、著录:是根据一定的规则,对文献的内容和形式特征进行分析、选择和记录的过程。
8、标引:1)按照标引的的工作方式分类:分为人工标引、计算机辅助标引、自动标引。
《网络信息资源检索与利用》课内实验二.doc

实验结果:
一.请分别针对网络资源目录使用的分类方法进行举例。
主题分类法:如yahoo
学科分类法:如sohu的社会科学分类
图书分类法:如中国图书馆图书分类法
c.其他
6.如果你是小王的话,在无法找到自己所需资源时你会向他人求助吗?()
a.会(请做第7题)
b.不会(请做第8题)
7.如果会的话,你会通过哪些途径向别人求助?
8.为什么不向别人求助?()
a.不知道如何向别人求助
b.不相信别人能够帮你解决问题
9.你有向别人求助的经历吗?是通过何种途径求助的?求助的效果如何?
6.相关检索词智能推荐技术。在用户第一次检索后,会提示相关的检索词,帮助用户查找更相关的结果,统计表明可以促进检索量提升10-20%。
7.运用多线程技术、高效的搜索算法、稳定的UNIX平台、短检索的响应时间(一个检索的平均响应时间小于0.5秒)
3.智能相关度算法。采用了基于内容和基于超链分析相结合的方法进行相关度评价,能够客观分析网页所包含的信息,从而最大限度保证了检索结果相关性。
4.检索结果能标示丰富的网页属性(如标题、网址、时间、大小、编码、摘要等),并突出用户的查询串)。可在上次检索结果中继续检索,逐步缩小查找范围,直至达到最小、最准确的结果集。利于用户更加方便地在海量信息中找到自己真正感兴趣的内容。
《网络信息资源检索与利用》课程实验第2次实验报告
实验内容及基本要求:
实验项目名称:网络搜索引擎的应用
实验类型:验证
每组人数:1
实验内录使用的分类方法进行举例。
网络信息资源的检索利用

/patft/index.html
欧洲专利 /
九. 论文预印本的检索
中国预印本服务系统 /eprint/index.jsp 中国科技论文在线 中国科技论文网 中国科技论文网 美国能源部“科技信息办公室” 美国能源部“科技信息办公室”的预印本 服务网“ 服务网“E-print Network” /
国家科技图书文献中心 美国国家科技信息服务处(NTIS)
/search/advanced.aspx DOE Information Bridge /bridge 可以检索并获得美国能源部(Department of Energy)提供的研究与发展报告全文,内容涉及物 理、化学、材料、生物、环境、能源等领域。
/search/advanced
Wiley InterScience 电子期刊库(文摘免费) 电子期刊库(文摘免费) /search/allsearch
/ 包含1872种期刊,300多万篇论文。
Scitation平台各学会协会期刊数据库
包含32个学会(协会)的电子期刊共170多种期刊,180多万篇 论文。
美国会计协会(AAA)15种,美国声学学会(ASA)7种,美国医学物理协会(AAPM)1种 ,美国物理教师协会(AAPT)2种,美国天文学会(AAS)1种,美国直升机学会(AHS)1 种,美国工业卫生协会(AIHA)9种,美国物理协会(AIP)19种,美国物理学会(APS)7 种,美国土木工程师学会(ASCE)31种,美国机械工程师学会(ASME)23种,美国真空学 会(AVS)5种,美国地震工程研究所(EERI)1种,美国电化学学会(ECS)4种,美国环境 与工程地球物理学会(EEGS)2种,国际人类前沿科学计划(HFSP)1种,国际衍射数据中 心(ICDD)1种,IEEE计算机学会(IEEE CS)1种,英国工程技术协会(IET)36种,美国 噪声控制工程学会(INCE)1种,美国影像科学与技术学会(IS&T)2种,美国激光学会( LIA)1种,俄罗斯科学院(MAIK)1种,国家标准与技术研究院(NIST)1种,加拿大物理 文集(PEP)1种,美国工业和应用数学学会(SIAM)14种,国际信息显示学会(SID)2种 ,勘探地球物理学家协会(SEG)4种,流变学学会(SR)2种,国际光学工程学会(SPIE) 8种,轮胎学会(TS)1种,科学技术虚拟期刊(VJST)5种。
网络信息的检索与利用~

第一章1.信息检索(information retrieval)是指将新鲜一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程.全称又叫信息存储于检索(information storage and retrieval).狭义的信息检索则仅指从信息集合中找出所需信息的过程.信息检索的分类:A根据检索手段的不同,可分为:手工检索、光盘检索、联机检索和网络检索。
(网络检索式信息检索的发展方向,因而本书以网络检索为主)。
B根据检索对象形式的不同,可分为:①文献信息检索:是以文献(包括题录、文摘和全文)为检索对象的检索。
②数值型信息检索:是以数值或数据为对象的一种检索,包括文献中的某一数据、公式、图表,以及某一物质的化学分子式等,数据检索分为数值型和费数值型。
③事实型信息检索:是以某一客观事实为检索对象,查找某一事物发生的时间地点及过程的检索,其检索结果主要是客观事实或为说明事实而提供的相关资料。
2.检索语言是把信息的存储与检索联系起来,把标引人员与用户联系起来,以便取得共同理解,实现交流的语言. 目前使用的检索语言包括:人工语言(分为主题语言和分类语言)和自然语言(可以为那些不懂人工语言的网络用户提供极大的便利).3.数据库是“至少由一个文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合”. (通俗)数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。
数据库是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源,也是信息检索的重要资料来源.根据载体不同可分为:联机数据库(online database),光盘数据库(CD-ROM database)和网络数据库(networked database).根据内容与功能可划分为:指南数据库(directory database),交易(执行)数据库(transactional database),全文数据库(full text database),书目数据库(bibliographic database),字(词)典数据库(dictionary database),数值数据库(numeric database)与统计数据库(statistical database)和图像数据库(image database).4.检索词是用户或检索人员给出的字,词,字符或短语,用于查找含有它们的记录.检索式也称检索提问表达式,是要求系统执行的检索语句.检索策略是就一个问题检索一个或多个数据库所输入的全部检索式的集合,是为满足信息需求所制定的一系列检索式.5.查全率(recall ratio)与查准率(precision ratio)是检索质量的两个重要的评价指标.查全率是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例.查准率是指检出文献中合乎需要的文献数量占文献全部数量的比例.6.布尔逻辑检索的主要运算符是:①逻辑”与”,用AND(或*)表示.②逻辑”或”,用OR(或+)表示.③逻辑”非”,用NOT(AND NOT,BUT NOT)(或-)表示.7.邻近检索:又称位置算符检索,文献记录中词语的相对次序或位置不同,所表达的意思可能不同,而同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样.位置算符检索是用一些特定的算符来表达检索词与检索词之间的关系,并且可以不依赖叙词表而直接使用, ,BDS拥有的国内信息库主要有:中国国防科技信息、中国军工报、网上新闻库、国防科技成果综合推广库、现代军事、中国工程院士学术报告、国防科技简讯、国内成果交流库、国防科技报告中文馆藏库、国防科技中文文摘库、中国经济信息库、中国科技期刊题录库、中国专利文摘库。
网络免费学术资源的检索与利用

c) 作者付费,读者免费。
开放获取期刊举例1
Directory of Open Access Journals是由瑞典兰 德大学图书馆整理的一份开放期刊目录。该项 服务涵盖了免费的、可获取全文的、高质量的 科学和学术期刊(This service covers free, full text, quality controlled scientific and scholarly journals)。 他们的目标是涵盖所有学科和语言的开放期刊, 目前一共有1332种开放期刊被收录到了该目录 中,其中的278种可以进行文章检索。
收入该库中的论文可以受到同行随时随地 的评论,论文作者也可以对这种评论进行反驳。 论文作者在将论文提交e-print arXiv的同时, 也可以将论文提交学术期刊正式发表,论文一 旦在某种期刊上发表,在e-print arXiv相应论 文记录中将会加入文献正式发表期刊的卷期信 息。
中科院理论物理研究所镜像站点 / / 美国主站点:/
网络免费学术资源的 检索与利用
思考:除了图书馆资源之 外,还有哪些可利用的学 术资源,怎样找到它们呢?
提 纲
什么是网络免费学术资源 网络免费学术资源的检索 与利用技巧
什么是网络免费学术资源?
网络免费学术资源是指在互
联网上可以免费获得的具有学术 研究价值的社会科学或自然科学 领域的电子资源。
网络免费学术资源的 检索与利用技巧
检索示例
• 例如:检索网络免费期刊文献 • 检索工具:Google • 检索式: • 1. “Open Access journals” • 2. “Free Full Text” • 3. “Frcess journals” 提高查准率
开放获取资源的几种获取途径
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2011.11
12
4.1.4搜索引擎的使用(以google为例) 一. 检索
回顾前面所讲的计算机检索技术,用布尔算符和精确检索 在google中完成下列检索题: 1.同时包含两部电影“大魔术师”和“龙门飞甲”的网页 2.包含以上任一部电影的网页 3.查找导演张艺谋,但网页中不要出现大红灯笼高高挂这部 影片 4.查找论文:Minimum cost design of welded structures
4
搜索引擎工作原理图
2011.11 5
四.输出结果排序原则
位置词频法:检索词出现的位置和词频 链接:网页被其他网页或网站链接的次数 付费:根据网页拥有者付费的多少来决定其网页出现的 位置
相关链接
竞价排名:企业可向搜索引擎公司购买该项 服务,通过注册一定数量的关键词,使其网 页推广信息率先出现在相应的搜索结果中
2011.11
34
4.2 网络信息的识别与评价
4.2.1 网络信息的特点
1.数量巨大,增长迅速:自2003年开始,中国的网页规模基本保持翻 番增长,2010年网页数量达到600亿个,年增长率78.6%。——来自 《第27次中国互联网络发展状况统计报告》 2.内容丰富,形式多样: 3.信息发布自由,信息资源良莠不齐:发布信息的可以是政府机关、 公司、学校、个人等 4.传播范围广泛:只要有internet的地方,都可看到发布的信息,截 止到2010年底,中国网民数已达到4.57亿,手机网民数达超亿。 5.网络信息具有一定的交互性:可上传、可下载;web2.0;微博;博 客
2011.11
26
2011.11
27
高级检索
2011.11
28
搜索结果
图书
专利
在参考文献 中找到
链接到机 构库中的 原文
文章,通 常可看到 摘要或全 文
2011.11
29
Scirus:由爱思唯尔科学公司(Elsevier
Science)于2001年4月
2011.11
16
逻辑“与” 精确检索 逻辑“或” 逻辑“非”
filetype: site:
Intitle: Intext: inurl: link:
2011.11
17
搜索策略
• 选择合适的关键词
- 因为大部分搜索引擎都是全文搜索(对每个字进行匹配),所 以,输入的每个检索词都很重要 - 如果搜索不到,有可能是关键词不太合适(注意:别输错别 字),应及时改变,尽量使用大家常用的说法 - 使用描述性语言,尽可能简洁,不要使用一些诸如:所有、他的 之类无关紧要的词
第四章 网络资源检索及利用
2011.11
1
主要内容:
4.1 认识搜索引擎
4.1.1 搜索引擎的概念及工作原理 4.1.2 搜索引擎的类型及特点 4.1.3 搜索引擎的发展 4.1.4 搜索引擎的使用(以google为例) 4.1.5 科技搜索引擎举例:google scholar、scirus
4.2 网络信息的识别与评价
2011.11
13
基本语法:
1)布尔逻辑: 逻辑“与”: AND, and ,空格
如: 大魔术师 AND 龙门飞甲 大魔术师 and 龙门飞甲 大魔术师 龙门飞甲
逻辑“或”: OR, | (注:不可以用小写的or,否则被忽略)
如: 大魔术师 OR 龙门飞甲 大魔术师 | 龙门飞甲
逻辑“非”: -
(注:-前面有空格,后面没有空格;不用NOT或not, 否则被作为检索的一部分)
2011.11
24
4.1.4搜索引擎的使用(以google为例) 二.其他使用
大部分搜索引擎都为我们提供了除检索网页之外的其他功能,如 google:
2011.11
25
4.1.5学术搜索引擎举例
学术搜索引擎对网上的信息进行了过滤,更适合搜索学术文章. Scholar google: 2004年11月18日,Google公司宣布针对科学
2011.11
10
4.1.3搜索引擎发展中的“第一”
World wide Web Wanderer是来自麻省的世界上第一个robot程序, 主要用来测万维网的规模,后来也可抓取URL。1993年 Excite,第一个基于概念分析的“智能”搜索引擎,来源于6个斯坦福大 学学生的“在搜索中对字词关系进行分析”的想法。1993年 Yahoo 是1994年斯坦福大学的两名博士生杨致远和David Filo共同创 办的网站,后来成为第一个目录式搜索门户(引擎) WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引 擎,在它之前,用户只能通过URL和摘要进行搜索。1994年,华盛顿 大学的学生Brian Pinkerton Lycos是第一个在搜索结果中使用了网页自动摘要的搜索引擎。1994 年,卡内基·梅隆大学(Carnegie Mellon University) 的两名学生
2011.11
30
/
2011.11
31
高级搜索
——看起来更接 近于专业数据库
2011.11
32
检索结果
2011.11
33
小练习
利用scholar google查找下列信息
1.检索在《北京工业大学学报》上发表的论文,之后在CNKI期刊数 据库中进行同样的查找,请在检索方法、检索结果等方面对两者进 行对比,从而深入了解网络信息和数据库商业信息各自的特点和优 缺点 2. 查找斯蒂芬·霍金关于宇宙的论著 3.查找国内外关于治理“堰塞湖”方法的文献
2011.11
3
三. 工作原理
简单地说主要包括以下几个步骤: 1. 网页信息搜索:搜索程序自动到www上抓取网页 2. 网页信息处理:主要是针对网页上的信息(主要是文字)创 建索引,便于检索 3. 接受用户查询请求:在索引数据库中进行检索 4. 输出检索结果:检索结果按一定原则排序后显示
2011.11
2011.11
19
・ 使用网站导航
2011.11
20
• 使用搜索引擎提供的快捷搜索
2011.11
21
•
使用搜索引擎提供的快捷搜索
2011.11
22
提示:网站上的帮助文件对掌握搜索引擎(之前学习的 数据库也一样)的检索方法很有帮助
2011.11
23
小练习
1. 比较中国大陆、香港、澳门以及台湾 地区的媒体对徐克执导的电影《龙门飞甲》的相关报道 2.利用网络特色搜索检索:1加仑相当于多少升?人民币对韩元的汇率是 多少? 3. 在题目中搜索有关“占领华尔街”的相关信息 4.查找“artificial intelligence”方面格式为pdf的文章 5.查找一首八十年代的包含 “大公鸡叫天亮”歌词的儿歌,下载mp3格式 的完整歌曲
如: 张艺谋 –大红灯笼高高挂
14
2011.11
2)嵌套检索:
例如:(大红灯笼高高挂 OR 菊豆) AND 张艺谋
3)短语搜索:
例如:" to be or not to be " "Minimum cost design of welded structures"
4)通配符: *
例如:beijing * university
1日推出。Scirus是专为搜索高度相关的科学信息而设计的搜索引擎。 在起始阶段,Scirus涵盖了Elsevier公司自己的信息数据库如 ScienceDirect,“生物医疗网络”(BioMedNet)和“化学网 络”(Chemweb)等,以及网上免费提供的科学信息。随后,Elsevier 公司又与其它提供科学信息的公司进行合作,邀请它们将其所有的数 据库纳入Scirus可以搜索到的范围之内,从而使Scirus能够精确地找 到普通搜索引擎所找不到的免费或者访问受限的科学信息资源。
4.2.1 网络信息的特点 4.2.2 网络信息的识别 4.2.3 网络信息的评价
4.3 常用网络免费学术资源介绍
2011.11
2
4.1 认识搜索引擎
4.1.1搜索引擎的概念及工作原理
一.概念:(Search Engine) ——万维网环境中的信息检索系统。 ——指自动从因特网搜集信息,经过一定整理以后,提供 给用户进行查询的系统。(来自维基百科) 二.组成:WWW服务器;自动搜索程序(如spider、 crawler、robot,抓取网页信息);索引数据库;检索程 序(用来处理用户的检索请求)
2011.11 7
4.1.2搜索引擎的类型及特点
形形色色的搜索引擎
2011.11
8
根据组织信息的方式
类型 特点 典型
目录式分类搜 将信息进行归类,适合那些希望了解某 Yahoo、Sohu、 一方面信息但又没有明确目的的用户; Open Directory 索引擎 查准率较高,查全率较低(严格意义上讲不 是真正的搜索引擎) 全文搜索引擎 能够对网页的层次结构,重复链接比较多 智能搜索引擎 建立了知识库,引擎根据已有的知识库 FSA、Eloise、 来理解检索词的意义并以此产生联想, FAQFinder (专 用搜索引擎) 从而找出相关的网站或网页
9
2011.11
根据搜索范围
类型 独立搜索引擎 特点 有自己的数据库,搜索 时只检索自己的数据 库,并作出相应的反馈 调用独立搜索引擎的引 擎 典型 Yahoo、sohu、新浪、 网易等 C4、Dogpile、 MetaFind 、 SavvySearch 、 MetaCrawler
元搜索引擎 (Metasearch Engines)
2011.11
11
Metacrawler是世界第一个元搜索引擎。1995年,Washington大学 的两名硕士生 AltaVista是第一个实现高级搜索语法的搜索引擎(如AND、 OR、 NOT等)。1995年 Northernlight是第一个支持对搜索结果进行简单的自动分类的搜索 引擎。1997 年 Google在车库中诞生,成为现在世界上最大、应用最广的搜索引擎。 1998年,斯坦福大学学生,拉里-佩奇,谢尔盖-布林(2006年4月, Google宣布其中文名称“谷歌”,这是Go中文搜索引擎。 2000年,李彦宏和徐勇