文献检索复习资料

合集下载

文献检索复习资料

文献检索复习资料

1.信息的定义:信息——就是生物体以及具有一定功能的机器,通过感觉器官和相应的设备与外界进行交换的一切内容。

2.信息的功能:a.信息是人类和一切生物赖以生存的基本要素b.信息是一切知识的来源c.信息是人类思维的材料和结果d.信息是决策的依据e.信息是一切有效管理的前提f.信息是人类一切实践活动的指南3.信息社会的主要特征:a.知识和信息成为信息社会的重要资源和财富。

b.人类社会发展的三要素的物质、能源、信息的关系发生了明显的改变。

c.科学和技术的研究开发日益成为经济的重要基础。

d.信息技术在人类社会中的作用越来越明显。

e.信息产业在知识经济中扮演重要角色。

4.信息检索的概念广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程,所以它的全称又叫“信息的存储与检索。

(1)信息存储过程,即搜集、筛选、整理、积累现有信息,将信息按一定方式组织和存储起来,形成检索工具或系统。

(2)信息检索过程,即利用信息检索工具或系统查找所需要的信息。

5.狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查询。

6.信息检索的意义与作用①是打开知识宝库的钥匙。

②是科研工作的前提和基础。

③减少投入,减少消费,提高效率。

④拓宽视野,开阔思路,提高信息素质和创新能力。

⑤减少语言障碍,最大限度地获得有用信息。

⑥促进国民信息素质,强化科技创新能力。

7.检索效果:是指在检索过程中满足检索者检索信息的全面性和准确性的程度,理想的检索结果是无遗漏、无误差地检索出检索者所需的所有文献。

评价标准判定一个检索系统的优劣,主要从质量、费用和时间三方面来衡量。

因此,对信息检索的效果评价,应该从这三个方面进行。

8. 质量标准主要通过具体的指标进行评价。

评价指标是衡量检索系统性能和检索效果的标准,一般包括查全率、查准率、漏检率、误检率等四项指标。

查全率和查准率是判定检索效果的主要标准,而后两者相对来说要次要些。

文献检索复习资料加答案

文献检索复习资料加答案

1、布尔逻辑符号、通配符、()、“”的含义?答案:布尔逻辑符号:AND,OR,NOT。

通配符:*任何字符组、包括空字符;?任意一字符;$零或一个字符;():优先级高,先执行。

“”:一个字段11、熟悉Spring link数据库、EBSCO数据库、Emerald数据库。

基本能用这三个外文数据库进行外文检索。

P66.58.7316、能按要求写出检索式或根据检索式写出其含义。

P23、36eg:1、(k=(cad+cam)+t=雷达)*r=机械-k=模具2、题名='流体#力学'and(作者=钱伟长not 机构=清华大学)1.算符有:关键词算符k。

题名算符t。

文摘算符r,这三项也叫做检索项限制符。

布尔逻辑算符*、+、-。

这个检索式表示的意思是:检索含有关键字“cad”或者“cam”但不含关键词“模具”或者题名中含有“雷达”的并且文摘中含有“机械”的文献。

2.检索词完整性限制符:''.关键词位置限制符:#。

布尔逻辑算符。

检索项限制符:题名、作者、机构。

这个检索式表示的意思是:检索钱伟长没在清华大学期间发表的题名中含有作为一个整体的关键词“流体力学”的文献,并且“流体”二字必须在“力学”的前面,顺序不能颠倒。

3.计算机+电脑-病毒4.医药学*西安1.“+”或运算“-”非运算“*”检索时的通配符17、请写出你如何利用图书馆资源搜集资料进行论文写作?18、我们图书馆有哪些英语学习方面的电子资源可供同学使用?请列举出来,并简要说明这些电子资源能给你的英语学习带来哪些便利?(1)访问我们学校的电子图书馆网页/main/index.asp(2)选择页面上的“电子资源”-(3)中文电子资源中的链接:外研社外语资料库(本地镜像)19、你经常光顾哪些网站?这些网站给你的学习和生活提供了哪些便利和资源?20、自动化技术、计算机技术有哪些核心期刊?请用CNKI和重庆维普两个数据库的期刊导航进行查询,并简单比较检索结果是否一致。

文献检索复习提纲(精选5篇)

文献检索复习提纲(精选5篇)

文献检索复习提纲(精选5篇)第一篇:文献检索复习提纲《文献检索》复习提纲一、文献信息概述1、文献是记录有知识的一切载体。

文献的构成要素:知识信息、负载知识信息的载体。

文献的本质属性:知识性、传递性、动态性。

2、依据文献的加工程度,文献可分为哪些类型,每种类型的含义是什么?答:根据文献的加工程度划分,文献可分为:零次文献、一次文献、二次文献、三次文献。

零次文献是指未以公开形式出版或未经正式渠道流通的文献,如文章草稿、私人笔记等;一次文献是作者以生产或研究成果为依据而创作的原始文献,如期刊论文、学位论文、专著等;二次文献是指将无序的一次文献进行收集、整理、著录,并以规定的格式编制成,为便于管理和查找文献的工具,即检索工具。

如目录、题录或索引、文摘等;三次文献是指在利用二次文献的基础上,对一次文献的内容经阅读研究,浓缩提炼而编写成的文献,如专题综述、百科全书、年鉴、指南等。

(参见教材第11页)3、我国早在三四千年以前的殷商时代就有了最早的图书—甲骨文。

图书及期刊的特点:(教材第9页)。

4、图书、期刊、报纸、专利文献、标准文献、会议文献、学位论文、科技报告的文献类别代码分别是什么?答:图书:M ;期刊:J;报纸:N;专利文献:P;标准文献:S;会议文献:C;学位论文:D;科技报告:R5、结合实际谈一谈培养大学生文献信息检索技能的重要性和必要性。

答案要点:(1)开发智力资源,推动社会发展;(2)继承前人成果,避免重复研究;(3)提高自学能力,培养创新人才;(4)节省科研时间,提高工作效率。

[ 要求:在论述的过程中应结合知识经济、学习型社会、素质教育等方面的实际,表达观点应理论与实际紧密结合,条理清晰,自圆其说。

切忌仅答要点。

]二、文献信息检索的基本原理1、简述文献信息检索的原理。

答:信息检索的实质是信息用户的需求和一定的信息集合的比较和选择的过程,即匹配的过程。

包括两个过程:(1)存储过程:标引员广泛收集信息,形成检索标识,把这些标识按一定方法组织成形成各种检索系统,即信息源的形成过程。

文献检索复习资料

文献检索复习资料

文献检索复习资料学习要点第一章绪论信息、知识、文献及其关系文献的类型及特点第二章信息检索基础知识文献检索基本概念检索工具检索策略和方法(构造检索式)效果评价--查全率、查准率第三章图书馆利用图书馆的概念、类型文献的分类(中国图书馆分类法)索书号高校图书馆的资源与服务联机公共目录的概念、类型(具体目录的使用)第四章数据库检索数据库的概念、检索的特点我校数据库概况期刊数据库检索示例—CNKI中国学术期刊网络出版总库、维普科技期刊全文数据库电子图书数据库的检索与利用报纸数据库的检索与利用学位论文、会议论文的检索与利用外文数据库的检索与利用第五章Internet检索工具搜索引擎概述(概念、发展、系统组成、工作原理、分类)搜索引擎的检索功能搜索引擎的使用(百度、google)第六章工具书的使用工具书的概念、类型、结构各类工具书举要基本知识信息、知识、文献及其三者的关系信息检索的概念与类型等检索工具的概念、类型和作用计算机信息检索过程中的一些概念信息检索效果评价--查全率、查准率图书分类法(中国图书分类法)索书号工具书检索的基本方法构造检索表达式布尔逻辑表达式截词表达式基本检索高级检索熟练使用的书目查询系统CALIS联合目录我馆书目查询系统熟练使用的数据库中国知网(维普)中文科技期刊数据库万方数据资源系统读秀学术搜索应了解的外文数据库EbrarySage检索中文发表的有关溺爱对儿童心理的影响的相关研究文献(1)该课题检索的文献类型应包括哪些?(2)可以利用哪些数据库进行该课题检索?(3)如何构造该课题的检索式?(1)图书、期刊、会议文献、学位论文等(2)读秀学术搜索、中国期刊网、万方数据资源系统等(3)溺爱and(儿童or孩子)and 心理1.1 文献信息检索的重要意义信息时代到来的一个重要标志就是信息量的急剧增长,使人们深陷信息的汪洋大海之中。

如何在这无边无际的信息海洋中进行捕捞,就成为信息素养诸多要素中最具决定性的能力。

文献检索复习资料准确

文献检索复习资料准确

1.信息、知识、情报1.1信息.信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。

信息就是事物发出的信息,是事物运动的状态与方式的反映。

1。

2情报。

情报是知识或信息经传递并起作用的部分,即运用一定的形式,传递给特定用户,并产生效用的知识或信息。

情报具有三个要素:知识性、传递性、效用(益)性。

1。

3知识。

是人类对信息、对客观事物规律的认识,它是人们在社会实践中积累起来的经验。

人们对事物由表及里、由现象到本质、由感性到理性的认识深化,便形成了知识.从信息的观念看,知识来源于信息,是信息内容的组成部分。

简而言之,知识是理性化、优化和系统化了的信息。

特点:传递性、加工性、存储性、时效性。

2.文献2。

1定义。

文献是指用文字、图像、符号、声频、视频等技术手段记录在一切载体材料上的人类知识。

我国国家标准《文献著录总则》将文献定义为:记录有知识的一切载体。

从这个定义可以看出,知识、载体和记录是构成文献的三个要素。

现代科技文献的特征主要反映在三个方面:◆数量巨大◆分布离散◆更新加快2。

2类型。

文献的类型是多样的。

◆按文献的信息内容特征划分有:事实型信息和分析信息;客观信息和主观信息。

◆按文献的媒体形式划分有:书本型资料,也称印刷型:非书资料,包括缩微型、声像型和机读型。

◆按对文献信息内容加工的深浅不同,可将文献划分成四个结构层次:一次文献、二次文献、三次文献和零次文献。

◆按文献的出版形式划分,科技文献方面可以分为:科技图书、科技期刊和特种文献◆按文献的媒体形式分有:印刷型,缩微型,声像型,机读型3.三者之间的关系(重点)世界是物质的,物质运动产生信息;各种信息经过人们系统化的加工处理,便转化成为知识;信息知识经过专门化的加工处理转化成为情报。

信息、知识与情报应用于实践,解决实践中存在的问题,创造出物质财富或精神财富。

这时,信息、知识与情报便转化为生产力,同时产生新的信息,新的信息又不断产生新的知识与情报,形成一个无限循环的转化过程。

文献检索复习资料

文献检索复习资料

第一章网络信息概述一. 基本概念1信息狭义:信号和消息广义:是物质的存在方式和运动方式的体现,是物质的一种客观存在,它反映了物质客体及其相互作用、相互联系过程中表现出来的种种状态与特征。

2 知识按照表述方法可以分为两类:显性知识和隐性知识显性知识,又称可编码的知识,是记录于一定物质载体上的知识,可以看得见,摸得着的,可以通过正常的语言方式传播的知识。

以文字、语言、图像的形式保存下来,如专利、商标、计划、软件设计报告等等。

显性知识是可以编码和表述的,有载体的。

隐性知识又可称为不可编码的知识,是存储在人们大脑里的经历、经验、技巧、体会、感悟、智能等尚未公开的秘密知识,就是你看不见、摸不着,只可意会不可言传,难以直接交流和表达出来的知识。

隐性知识的特点是不易被认识到、不易衡量其价值、不易被其他人所理解和掌握3文献是记录有知识的一切载体。

精确描述:凡是用文字、图形、代码、符号、音频、视频等方式记载在一定载体上的每一件记录,均称为“文献”。

构成文献要素有三,知识、记录与载体方式。

4情报是人们在一定时间内为一定目的而传递的有使用价值的知识或信息。

钱学森:“情报是激活了的知识”情报是对特定的人而言的,对需要它的人而言是情报,对不需要的人而言它只是信息与知识。

知识与信息转化为情报必须经过传递、只有将特定的知识与信息传递到特定需要的人那里,它们才能成为情报。

传递是情报的一个基本特征。

二. 网络信息的特性1 性质客观性寄附性传递性共享性衍生性时效性2 特点数量大来源广语种多多媒体传播快跨国界内容杂更新快三. 网络信息的资源1 知识信息网站教育和科技部门网站,如:学校、科研单位、学术团体、政府部门等。

2 文献信息网站出版和收藏文献网站。

有数字图书馆,如:超星、书生之家等;数字平台,如:中国知网、万方、维普等。

四. 网络信息的检索主要信息网站种类:政府网站(.gov)免费教育机构(.edu)科研部门(.ac)商业网站(.com)收费社会组织(.org)互联网络(.net)五.图书馆印刷型文献:图书、期刊、工具书、报纸电子型文献:随书光盘、电子期刊数据库、电子图书及其他数据库1. 按文献内容性质划分(不同加工深度)零次文献(Zeroth Litterature) 是指非正式出版或非正式渠道交流的文献,未公开于社会,只为个人或某一团体所用。

文献检索总复习材料

文献检索总复习材料

第一章科技信息检索概述1、信息就是客观世界一切事物存在和运动所发出的各种信号和消息。

2、情报是知识或信息经传递并起作用的部分,即运用一定的形式,传递给特定用户,并产生效用的知识或信息。

情报具有三个要素:知识性、传递性、效用性。

3、信息与情报的关系:信息是关于一切事物(物质的、精神的)运动状态和运动方式的反映;情报是对搜集到的信息经过整序、分析与深化认识之后得出的解决特定问题的知识。

信息可以告诉我们已经或将要发生的事态,而我们及时作出反应的能力则来自于对搜集到的信息进行分析研究所得到的可用于决策的情报。

4、知识是人们在改造世界的实践中所获得的认识和经验的总和,是对客观世界物质形态和运动规律的认识。

知识是理性化、优化和系统化了的信息。

5、文献是指用文字、图像、符号、声频、视频等技术手段记录在一切载体材料上的人类知识。

6、存储信息、传递信息是文献的主要功能。

知识是文献的实质内容,载体是文献的外在形式,而记录是联系知识与载体的手段。

7、科技文献:文献记录的知识内容属于科技范围。

8、文献信息:以文献形式被记录的信息。

特点:记录下的信息;受到人工符号制约;相对固化;人类的反应;自然界信息可以转换为文献信息。

9、信息、知识、文献之间的关系:事物发出信息;信息经人脑加工变为知识;知识被记录形成文献;文献经过传递、应用于理论与实践产生新的信息。

10、信息、知识、情报、文献:信息是事物本质属性的反应;知识来源于信息,是理性化、优化、系统化的信息;情报是解决特定问题所需的特定知识与信息;文献是信息、知识、情报的载体。

11、信息检索(文献检索):是指将信息按一定的方式组织和储存起来,并根据信息用户的需要找出相关信息的过程。

这是广义的信息检索。

狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需信息的过程,相当于信息查询。

12、数据检索:是将观察或实验得到的数据经过筛选、分析、整理和鉴定,以一定的顺序存贮在某种载体上,然后采用适当的方法或手段从中找出符合用户所需的数据的过程。

文献检索复习题

文献检索复习题

文献检索复习题
1. 文献检索的定义是什么?
2. 简述文献检索的基本原则。

3. 列举至少三种常见的文献检索工具。

4. 描述文献检索的基本步骤。

5. 解释什么是关键词检索,并给出一个例子。

6. 什么是布尔逻辑检索,它包括哪些基本运算符?
7. 描述文献检索中的高级检索功能。

8. 什么是文献的引文检索,它有何作用?
9. 简述文献检索中的主题检索与分类检索的区别。

10. 列举至少两种文献检索的辅助工具。

11. 什么是文献的全文检索,它与摘要检索有何不同?
12. 描述文献检索结果的评估标准。

13. 简述如何进行文献检索的优化。

14. 什么是文献的交叉检索,它在研究中有何意义?
15. 举例说明如何利用文献检索工具进行学术研究。

16. 描述文献检索中常见的问题及其解决方法。

17. 什么是文献的追溯检索,它在学术研究中的作用是什么?
18. 简述文献检索中的数据挖掘技术。

19. 列举至少三种文献检索的策略。

20. 描述文献检索中的信息筛选和评估过程。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

文献检索复习要点—Jinying第一章绪论信息、知识、情报及三者关系;文献,文献按载体划分,文献按出版形式划分,文献级次(各级次的概念、代表文献及异同);ISBN和ISSN(概念、组成及检验方法)信息含义:是客观事物本质特征千差万别的反映。

是物质存在方式、形态或运动状态的反映。

(P3-P4)知识的概念:是人类通过信息对自然界,人类社会及思维方式与运动规律的认识与概括,是人的大脑通过思维重新组合和系统化了的信息,是信息中最有价值的部分。

情报的定义:为了解决一个特定问题从一定文献资料中提取或经过传递获得的知识。

情报的三个基本属性:知识性传递性针对性信息,知识,情报之间的关系从信息,知识和情报的定义可以看出,信息无处不在,信息的范围很大,信息中被人们认识的部分成为知识,而知识中被人们用来解决问题的部分成为情报,因此信息,知识和情报的关系是前者包含后者的关系。

ISBN:(P8) 概念:即国际标准书号,它是由10位数字组成,共分4段,其间用“—”相连,组成:1组号2出版社号3书序号4校验码算法:用1分别乘ISBN前12位中的奇数位,用3乘以偶数位,所得结果之和除以10可得,值的范围为0—9文献的含义:记录有知识的一切载体,包含知识内容、信息符号、载体材料、记录方式四个基本要素(P5)文献按载体划分:1印刷型2缩微型3视听型4电子型(P5-P6)文献按出版形式划分:1.图书2.连续出版物(期刊、报纸)3.会议文献4.学位论文5.科技报告6.专利文献7.标准文献8.政府出版物9.产品样本10.技术档案(P7-P11)文献级次:人类开发、利用文献的先后顺序。

(P6-P7)1零次文献:非正式出版物或非正式渠道的最原始的文献。

如日记、手稿、个人通信、口头言论2.一次文献:依据作者本人的研究或研制成果创作的文献。

如图书、期刊论文、会议论文3二次文献:按一定的方法对一次文献进行整理加工,使之有序化而形成的文献。

如目录、索引、文摘4三次文献:围绕某个专题或出于特定目的,根据二次文献提供的线索,选用大量一次文献的内容,进过筛选分析综合和浓缩等深度加工而形成的文献。

如进展报告、教科书、字典、百科全书各级次异同:从零次文献、一次文献、二次文献到三次文献,它是一个由分散到集中,由无序到有序,由博而略的对知识信息进行不同层次的加工过程。

它们所包含的信息的质和量是不同的,对于改善人们的知识结构所起的作用也是不同的。

零次和一次文献是最基本的信息源,是文献信息检索和利用的主要对象;二次文献是对一次文献的集中提炼和有序化,它是文献信息检索的工具;三次文献是把分散的零次文献、一次文献、二次文献,按照专题或者只是的门类进行综合分析加工而成的成果,是高度浓缩的文献信息,在内容上具有综合性,在功效上具有参考性。

ISSN:(P9) 概念:国际标准连续出版物编号,由8为数字组成,分2段,每段4位数字,中间用“—”隔开,组成:前7为是刊名代号,末位是计算机校验位。

算法:前7位按顺序分别乘以8、7、6、5、4、3、2,将这些乘积之和再加上校验号,如果能被11整除,则正确。

第二章文献检索基础知识信息检索;信息检索的类型;图书的四大常用检索点;检索语言的基本种类;图书在版编目(并列书名、数据检索项);最早的图书分类法;四库全书、全球使用最广的分类法;《中图法》(基于22大类的分类;排架的方法);文献的内外部特征;文献检索的方法;文献检索的程序(从检索程序入手,就一个检索课题如何利用纸本文献、数据库、网络资源全面搜集资料);查全率和查准率(概念及计算方法)信息检索概念:是指把文献按一定方式组织和存储起来,并针对用户的需要找出所需文献的过程。

包括信息组织和信息检索两个过程。

狭义的文献检索,即后一个过程---信息检索。

(P12) 信息检索的类型:按照检索对象的不同,可分为:文献检索、数据检索和事实检索按照检索方式的不同,可分为:手工检索和计算机检索(p13)图书的四大常用检索点:1书名(题名)2作者3主题词4分类号(p19)印刷格式中看出检索语言的种类:1分类语言2主题语言。

分类语言按事物的学科属性或知识属性集中,主题检索语言按特定的事物、问题、现象,即以主题为中心集中(p19)图书在版编目:并列(丛)书名的标识符为“=”;检索数据的排印次序为:书名检索点、作者检索点、主题词、分类号。

各类检索点用罗马数字加下圆点排序。

各类之间留一个汉字空。

除分来号外,同类检索点用阿拉伯数字圈码排序。

分类号不止一个时,各个分类号之间留一个汉字空,但不用任何数字或符号排序。

书名、作者检索点采用简略著录法,即仅著录书名、作者姓名的首字。

其后用“…”表示。

最早的图书分类法:西汉刘向父子的《七略》(p20)四库全书分类体系:“经、史、子、集”四部分类体系《四库全书》即是四部分类体系实践应用中的一个典范。

(P20)全球使用最广的分类法:《杜威十进分类法》(p21)22大类:A马列毛邓B哲学C社会科学总论D政治法律E军事F经济G文化、科学、教育、体育H语言、文字I文学J艺术K历史地理N自然科学总论O数理科学和化学P天文学、地球科学Q生物科学R医药卫生S农业科学T工业技术U交通运输V航空航天X环境科学、劳动保护科学,Z综合性图书(p23)排架的方法:1排序(1)按基本大类排(2)如基本大类同,由2级类目排列,以此类推2.书签(索书号)(老师补充的笔记)文献文献检索的方法:1常用法(顺查、倒查、抽查)2追溯法(从已有的文献后所列的参考文献着手,逐一追查原文,再从这些原文后所附的参考文献逐一检索,获得一批相关文献的方法)3循环法(常用法和追溯法结合:既要利用一般检索工具书刊,又要利用文献后附的参考文献进行追溯,分期分段的交替使用)(p27)文献的内外部特征:检索途径分为以文献内容特征进行检索的两大主流检索途径(分类途径和主题途径)和以文献外部特征进行检索的基本途径(如:责任者、文献名、文献原有序号、文种、发表时间、出版单位等)两大类。

文献检索程序:1分析待查项目,明确主题概念2选择检索工具3确定检索途径和检索标志4查找文献线索,索取原文(p30)查全率:即命中率、检全率、召回率,指系统实施检索时检出的与某一检索提问相关的信息资源数与检索系统中与该问题相关的实有信息资源总数之比。

查全率= 检出相关信息资源量/系统相关信息总量*100% (p31)查准率:即检索精度、检准率、相关率,指系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总数之比。

查准率=检出相关信息资源量/检出信息总量*100% (p31)第三章计算机信息检索基础知识计算机检索经历四个阶段;学会提炼检索词;布尔检索及逻辑组配;检索策略(概念、扩检、缩检,检索课题的分析)计算机检索发展阶段:1脱机检索阶段(巨型机阶段):主要用于科学领域2联机检索阶段(单向联机):以电话联机为主,成本高,开始商业化应用。

3光盘检索:存储作用4网络检索:以TCP/IP协议为主。

(P34)布尔检索与逻辑组配:1.或(OR)运算符,也可用“+”代替。

A或B或C;A OR B OR C; A+B+C 扩大检索范围。

Eg:A=100,B=30,则A+B<=1302.与(AND)运算符,也可用“*”代替。

缩小检索范围,提高准确率。

3.非(NOT)运算符,也可用“—”代替。

缩小检索范围。

(P39)检索策略:概念广义的检索策略是为实现检索目标而制定的全盘计划或方案,指导整个检索过程。

狭义上的检索策略是指检索式,检索式是用来表达用户提问的逻辑表达式,是对多个检索词之间的相互关系和检索顺序做出的某种安排,是整个检索策略的综合体现。

(P50)扩检:一般将设置的检索范围太小,命中文献不多,需要扩大检索范围的方法称为扩检。

(P55)缩检:将设置的检索范围太大,命中文献太多,需要减少检索范围的方法称为缩检。

(P55)第四章互联网信息检索的基础知识IP、DN、URL(三者的概念、组成及在检索中的运用);搜索引擎的概念;按信息搜集方法和服务提供方式,搜索引擎可分为那几类,每种类型的定义,优缺点是什么,每类的代表搜索引擎有哪些;搜索引擎的系统结构;布尔检索技术在搜索引擎中的应用;site,inurl,intitle,filetype 等检索语法的使用;网页快照的概念和使用;精确检索、二次检索、网页快照、高级检索等实际检索的应用;熟悉百度和GOOGLE的基本检索和高级检索、百度的文库和文档、GOOGLE的学术搜索引擎IP:互联网协议地址,每台正式入网的计算机都有一个唯一的ip地址,这个ip地址由4个字节共32位数字串组成,这4个字节用小数点分隔。

每个字节的取值范围是0~255。

(P63) DN:域名,是用字符串的组合来表示ip地址,适当的选择域名中的字符串可以使域名有一定的可读性。

只有作为服务器的计算机才需要DN。

结构:一般由2~5段字符组成,采用层次结构,每一层次构成一个子域名,各子域名之间以圆点分隔,形如:主机名.三级域名.二级域名.顶级域名。

( P64)(补充:顶级域名:1按组织管理的层次结构划分,如net表示网络提供商,org表示非盈利组织,com表示工商企业。

2以国别地理区域划分,如cn中国,jp是日本,un是英国) URL:统一资源定位器,是用于互联网中按照统一方式来指明和定位一个WWW资源的地址,由协议方式、主机的ip地址、端口、路径、文件名构成。

书写形式为“协议://IP地址(或域名):[端口]/路径/文件名”。

( P65)搜索引擎:就是互联网上的一种网站。

又称搜索机器,是网上的导航工具,是一种搜索WWW 信息的软件(P66)(补充:搜索引擎工作程序:1信息采集和储存2索引数据库的建立3检索界面的建立4检索结果的相关性处理)按信息搜集方法和服务提供方式,搜索引擎可分为三大类:(P71-P75)1目录式搜索引擎。

全称是分类目录式搜索引擎,常又被称为主题指南、专题指南、列表查询引擎、站点导航系统等。

优点:信息准确,导航质量高。

缺点:需要人工介入,维护量大,信息量少,信息更新不及时。

典型代表:YAHOO,新浪分类目录。

2机器人搜索引擎。

也称作全文检索型搜索引擎,有些文献中谈到的独立搜索引擎主要是这一类。

优点:信息量大,更新及时,无需人工干预。

缺点:返回信息过多,可能有很多无关信息。

典型代表:Google,百度,北大天网。

3元搜索引擎。

也称多元搜索引擎,这类搜索引擎本身没有存放网页信息的数据库,靠集成多个独立搜索引擎运行。

优点:可以同时获得多个源搜索引擎的结果,信息量大且全。

缺点:在信息来源和技术方面都存在一定的限制,对检索结果的控制能力较低。

典型代表:Dogpile搜索引擎的系统结构:1.搜索器、2.索引器与索引数据库、3.检索器、4.用户接口(P77)基本检索语法:1布尔检索2范畴检索(1)Site:按网域搜索。

相关文档
最新文档