计算机信息检索的策略和方法

计算机信息检索的策略和方法
计算机信息检索的策略和方法

2.4计算机信息检索的方法与策略

2.4.1计算机信息检索过程中的相关概念

(1)数据库:数据库是“至少由一个文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合”。通俗地说,数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合。数据库是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源,也是信息检索的重要资料来源。

根据载体的不同,数据库可分为:联机数据库(online-database),光盘数据库(CD-ROM-database)和网络数据库(networked-database)三种。

(2)检索界面:指在进行计算机检索时,检索者与计算机交互对话的界面。

(3)检索方式:以检索过程的繁简程度或从何入手来区分的不同检索过程。在数据库中往往设有初级检索/简单检索/基本检索(单途径检索);高级检索(多途径组合检索);专业检索(构造检索式);按类检索;按刊检索(刊物查询、刊名导航),篇目检索/论文查询;引文检索等方式供选择。

(4)检索途径:又叫检索入口、检索项,也有的数据库称之为检索字段。指输入的检索条件所查询的数据区域。不同数据库所设的途径并不相同。一般都设有篇名、作者、关键词、全文等途径。

(5)检索词:检索词是检索者给出的字、词、字符或短语,用于查找含有它(它们)的记录。

(6)排序:指检索结果输出时的排列顺序。输出结果按相关度排序时,则检索结果按检索词在检索字段中发现的频度由高到低依次排列。无相关度时,输出结果则按文献的出版日期逆序排列或随机排列。

(7)二次检索:指在前一次检索结果的基础上,进一步限定检索条件所进行的再次检索。二次检索可以多次使用,逐步缩小检索范围。

(8)限制条件:在检索对象的时间、文献类型、语种、同义词等方面做限制,与检索途径配合使用,以精化检索结果。

(9)检索词匹配:指输入的检索词在数据库的可检索字段值中的位置关系。一般表示为前方一致、后方一致、完全一致(精确匹配)、任意一致(模糊匹配)等。

2.4.2 信息检索方法

为了迅速、准确地查找所需要的文献信息,必须了解和掌握一定的检索方法。常用的检索方法有下列三种:

(1)常用法

利用检索工具或检索系统来查找文献的方法,这是文献检索中最常用的一种检索方法。常用法又可以分为顺查法、倒查法和抽查法三种。

①顺查法

这是一种由远及近的检索方法, 从课题分析所得出的该课题研究的起始年代起, 由远及近地进行逐年查找。顺查法有较高的查全率。用顺查法逐年检出的文献可以在一定程度上反映出该课题研究发展的全过程。但是这种方法耗时费力, 效率较低。

②倒查法

倒查法与顺查法正相反, 是利用选定的检索工具, 由近及远地逐年逐卷地进行查找。根据课题需求获取近期文献, 即以“查准”为主时, 最好采用倒查法。对于一些新的研究课题可以采用倒查法, 这样比顺查法节省时间, 效率较高。

③抽查法

抽查法是在课题研究所处的发展高峰期的若干年中进行查找。抽查法往往是用来解决要求快速检索的课题。抽查法有较高的检索效率,但使用这种方法的前提是必须事先了解课题研究发展的历史背景。

(2)回溯法

回溯法又称追溯法、引文法,是利用文献末所附的参考文献或引用文献,由近及远地进行追踪查找。这种检索方法,可以从已经掌握的一篇最新文献入手,查找到它所引用的文献,再依据这些查出的文献,查找到它们所引用的文献。如此反复,即可获得大量的文献信息。通过追溯法所获得的文献,有助于对论文的主题背景和立论依据等内容有更深的理解。但由于是由近及远追溯,年代越远与原文关系越少。

(3)循环法

实际上就是常用法与回溯法的结合,即先利用检索工具查找出一批有用的文献,然后利用这些文献所附的参考文献或原文中涉及的重要线索进行追溯查找。通过对已有的相关文献的主题分析,提出新的检索项,再利用检索工具检索,如此循环(分段)使用常用法和追溯法进行检索,直到检索结果满足检索提问需要为止。

在检索实践中,要根据检索课题的具体目的和要求,有针对性地采用适当的检索方法。

2.4.3检索策略的含义和作用

信息需求产生之后,如何在茫茫的信息海洋中查找需要的信息?利用哪些信息检索系统?检索提问怎么设计?才能得到好的检索效果,信息检索策略对于解决这些问题具有重要的意义。

所谓检索策略,即在分析检索课题内容实质基础上,选择检索系统、检索途径、确定检索词及其相互间的逻辑关系等的信息检索方案。信息检索策略的实质是对检索过程的科学规划,其中关键在于构造能够确切表达信息需求的检索式。依据信息检索手段,可以分为手工检索策略和计算机检索策略。

影响检索效果的因素有很多,但对于己经建成的信息检索系统而言,检索策略的优劣则是非常重要的因素。正确的检索策略会优化检索过程,有助于取得最佳的检索效果。

2.4.4检索表达式

检索表达式是检索策略的具体体现之一,简称检索式。检索式一般由检索词和各种逻辑运算符组成。具体来说,它是用检索系统规定的各种算符将检索词之间的逻辑关系、位置关系等连接起来,构成的计算机可以识别和执行的检索命令式。检索式构造的优劣关系到检索策略的成败。

检索表达式主要有逻辑表达式、截词表达式等,其中,最为常用的是逻辑表达式。

2.4.4.1逻辑表达式

逻辑表达式是指利用布尔逻辑算符,对检索词的关系进行表达,又称布尔逻辑表达式。布尔逻辑是目前计算机检索最简单、最基本的匹配模式,也是计算机检索领域广泛采用的逻辑表达方式。布尔算符有“逻辑与”(“AND”)、“逻辑或”(“OR”)、“逻辑非”(“NOT”)等。

(1)逻辑“与”:表示它所连接的两个检索词必须同时出现在结果中,逻辑检索式可写为:A AND B。也有些数据库中用“*”或其他符号表示。例如,要查找关于“计算机检索”方面的信息,检索需求可以表述为:“计算机AND检索”。目前,在一些数据库(如中国期刊网)中提供的二次检索,实质上也是逻辑“与”的运算。逻辑“与”的检索能增强检索的专指性,使检索范围缩小。

A AND

B A OR B A NOT B

图2—1 布尔逻辑算符示意图

(2)逻辑“或”:表示它所连接的两个检索词中任意一个出现在结果中就满足检索条件,检索式可写为:A OR B。在一些中文数据库中,用“+”表示逻辑“或”。例如,想检索关于“计算机”的信息,可以表达为:计算机+电脑。逻辑“或”主要用于表达检索词的近义词、同义词、全称和缩写等,以便全面、完整地表达相关的概念。

(3)逻辑“非”:表示它所连接的两个检索词中,应从第一个概念中排除第二个概念,检索式可写为:A NOT B。在一些中文数据库中用“-”表示逻辑“非”。例如,想查找关于“研究生教育”的资料,但要求不包括在职研究生,可以将检索式写为:“(研究生*教育)-在职研究生”或“研究生-在职研究生*教育”。逻辑“非”表示具有不包含某种概念关系的一组组配,用来缩小检索范围。但在实际检索中要慎重使用。

逻辑表达式在实际检索过程中,易于理解,便于使用。例如,想检索“中国高等教育的发展趋势”,用逻辑表达式可写成:中国*高等教育*发展趋势。表示要求查找的文献的相应字段中同时包含“中国”、“高等教育”、“趋势”这三个词,而排列形式不限。

以上逻辑运算符中,其运算优先级顺序为“非”、“与”、“或”,但是可以用括号改变它们之间的运算顺序。还要注意的就是对于同一个逻辑运算式来说,不同的运算顺序有不同的运算结果。

2.4.4.2截词检索表达式

截词检索表达式指在检索式中用专门符号(截词符号)表示检索词的某一部分,检索词允许有部分变化,检索词的不变部分加上由截词符号所代表的任何变化形式所构成的词汇都是合法检索词。截词检索表达式在西方语言检索中应用比较广泛,在中文信息检索中也有一定的应用。采用截词检索表达式,既能防止漏检,又能节省时间,是提高检索效率的有力措施。不同检索系统采用的截词符不完全相同,一般常采用“?”、“*”等。

截词方式有多种,按截断的位置来分,截词有前截断、中间截断、后截断等;按截断的字符数量来分,可分为有限截断和无限截断两种。

后截词,又称右截词、前方一致,允许检索词尾部有若干变化形式。例如检索式“Comput?”将检出包含Computer、Computing、Computed、Computerization等词汇的结果。检索式“交际?”,表示检索以“交际”打头的信息,可以检索出“交际艺术”、“交际语言”、“交际行为”等。

中间截词,允许检索词中间有若干变化形式,例如“wom * n”就可同时检索到含有woman 和women的结果。

前截词,又称左截词、后方一致,允许检索词的前端有若干变化形式,例如检索“*physics”就可检得包含physics、astrophysics、biophysics、chemicophysics等词的结果。

截词检索表达式在使用时,一定要合理使用,截断部分要适当,不要截得太短,以免增加检索噪音,查出很多无关的文献。

2.4.5检索策略的构造步骤

信息检索策略的构造一般包括分析用户信息需求、选择检索系统、确定检索用词、构造检索式、分析检索结果等。具体过程如下:

分析信息需求,明确检索要求选择检索系统选择检索途径和方法,确定检索词或检索式实施信息检索获取原始文献。

(1)分析信息需求(检索课题),明确检索要求

这是人们进行信息检索的出发点,不同类型的检索课题,信息需求的范围和程度也不尽相同。在这一环节中,要明确检索目的,明确检索课题内容涉及的主要学科范围和相关概念。在分析课题的基础上,要清楚自己检索信息的类型,是查文献,或是查事实,还是查数据,以及要求查找文献信息的时间范围、学科范围等。通过以上分析,对检索需求作出全面的认识。

(2)选择检索系统

在手工检索中选择相应的工具书,在计算机检索中主要是利用数据库,包括搜索引擎。依据对信息需求的分析,选择与检索课题相符、收录信息质量较高、检索功能比较完善的信息检索系统。检索系统的选择要求我们对目前可利用的检索系统有一个大概的了解,如检索系统收录的信息所涉及的学科领域、收录的文献信息类型、时间范围、检索途径和检索方法、检索费用等等。

(3)选择检索途径和检索方法,确定检索词或检索式

检索系统选定后,要对检索途径和方法做出判别和选择。大部分数据库可以提供篇名、作者、主题词、关键词以及全文检索等途径,而且还能利用多种途径的组配进行复合检索。

检索词的确定是建立在检索课题概念分析的基础上,有时,检索课题会包含较复杂的主题内容,应明确组成课题内容的直接概念和相关概念,通过一定的逻辑组配或其它方式形成一定的复合概念或概念关系来表达信息需求。

(4)实施信息检索

确定了检索词或检索式之后,即可开始实质性检索。在实施检索的过程中根据已得到的检索结果的情况,可以调整检索词、检索式、检索途径和检索方法等,也可以充分利用信息检索系统提供的缩检和扩检功能,完善检索结果,直至达到满意的效果。

(5)获取原始文献

使用的信息检索系统类型不同,原始文献的获取方式也不尽相同。比如,利用图书馆公共联机目录查询系统,可以了解馆藏图书的基本信息,以借阅或复制的方式获取原始信息;利用有关全文数据库,可以直接打印或下载原文;利用网络搜索引擎,除一些收费的信息不可直接得到外,搜索引擎的检索结果大部分都可以在网上直接获取。

信息检索技术书中答案

《信息检索技术》书后习题及参考答案(部分) 第1章绪论 【综合练习】 一、填空题 1.文献是信息的主要载体,根据对信息的加工层次可将文献分为_________文献、__________文献、___________文献和___________文献。 2.追溯法是指利用已经掌握的文献末尾所列的__________,进行逐一地追溯查找_________的一种最简便的扩大情报来源的方法。 3.用规范化词语来表达文献信息__________的词汇叫主题词。主题途径是按照文献信息的主题内容进行检索的途径,利用能代表文献内容的主题词、关键词、叙词、并按字顺序列实现检索。 4.计算机信息检索过程实际上是将___________与____________进行对比匹配的过程。 5.无论是手工检索还是计算机检索,都是一个经过仔细地思考并通过实践逐步完善查找方法的过程。检索过程通常包含以下几个步骤_________、__________、__________、__________、_________。 6.检索工具按信息加工的手段可以分文__________、____________、___________。 7.《中国图书馆图书分类法》共分___________个基本部类,下分________个大类。 8.索引包括4个基本要素:索引源、___________、___________、和出处指引系统。 答案1.零次,一次,二次,三次 2.参考文献,引文 3.内容特征 4.检索提问词,文献记录标引词 5.分析课题,选择检索工具,确定检索途径及检索式,进行检索,获取原文 6.手工检索工具,机械检索工具,计算机检索工具 7.五,22 8.索引款目,编排方法 二、判断题 1.在检索信息时,使用逻辑符“AND”可以缩小收缩范围。() 2.逆查法是由近及远地查找,顺着时间的顺序利用检索工具进行文献信息检索的方法。() 3.按编制方法划分,信息检索工具可以分为:手工检索工具、机械检索工具、计算机检索工具。() 4.请判断下面图书的国际标准书号的格式是否正确。ISBN:978-030-26151-X。() 5.文献的专利号、报告号、合同号、标准号、索取号、国际标准书号、刊号属于文献的内部特征。 6.二次检索是指在第一次检索结果不符合要求时,重新选择检索条件再次进行检索。 答案1.√2.×3.×4.√5.√6.× 三、选择题(单选或多选)

《信息检索与利用》期末复习1

《信息检索与利用》期末复习 试题题型 一、填空题(每空3分,共15分) 二、选择题(每题3分,共30分) 三、判断题(每题3分,共30分) 四、简答题(共25分) 1.(12分) 2.(13分) 复习题 第一章信息资源检索基础知识 一、填空题 1.___________________________是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息 2.___________________________是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。知识 3.___________________________是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。情报 4.___________________________是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。文献 5.___________________________是指在国内外学术或非学术会议上发表的论文或报告。会议文献 6.___________________________是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。学位论文 7.___________________________是对文献内容和形式特征进行选择和记录的过程。著录8.___________________________是指特定的数值型数据为对象的检索。数据检索 9.___________________________是指以特定的事实为目标的检索。事实检索 10.事实与数据检索工具主要依靠各类___________________________完成各种数据或事实的查询。参考工具书 11.按照结构原理,信息检索语言可以分为_____________________、____________________、

中国科学院大学计算机领域信息检索期末考试答案

域信息检索与利用实用技巧 任课老师:李玲 试题专用纸 1、简答题:您在学习和研究过程中遇到下列问题时,常用哪些方法来解决? (10题,3分/小题,共30分) (1)查找期刊时,您常用的方法? 答: 中文期刊一般用:中国知网、万方数据库、维普数据库等; 外文期刊一般用:ACM、IEEE、Elsevier ScienceDirect、SpringerLink、Science Online 、Taylor & Francis Online Journals 、Cambridge Journal等; 可通过国科大图书馆进入上述网站首页,输入所需检索的期刊信息,如期刊名 称、作者、发表年份等信息进行查询。 (2)查找中国科学院学位论文时,您常用的方法? 答: 进入“中国科学院大学”首页→点击右下方“图书馆”→点击进入“中科院学位论文数据库”→进入检索界面,输入所需检索的论文信息,如:论文名称、作者、指导老师等。 (3)查找各国专利以及专利的被引用情况时, 您常用的方法? 答:进入国家知识产权局官网“https://www.360docs.net/doc/3617842623.html,”,输入所需检索专利的发明名称、申请号、申请人(三者至少必填其一)进行检索,查看专利被引用情况。 (4)查找SCI期刊的影响因子,您常用的方法? 答:通过国科大图书馆点击“ISI-SCIE”进入web of science平台查询界面,输入期刊的关键词、作者等信息,可通过“AND”进行多个关键词组合以缩小查询范围。 (5)查找标准文献时,有哪些注意事项? 答:合理选择标准数据库(如中文期刊会议类检索工具选用CNKI、维普、万方等,查询专利选用国家知识产权局等数据库); 注意文献的发表时间(如利用CNKI科技类期刊数据库查询只能查询1994年之后发表的文献,维普中文科技期刊库可查询1984年之后发表的文献) 使用多个精确的关键字组合,以减小检索范围。 (6)文献管理时,您常用的方法? 答:使用EndNote文献管理工具,进行分类管理方便后期查询。

计算机信息检索重点

信息检索 数据(Data):泛指所有描述事物的形貌、特性、状态或任何其他属性的数字、文字或符号。一般指原始,未处理过的数据。 信息(Information):1. 物质存在的一种方式。一般指数据、消息中所包含的意义。可以使消息中所描述的事件的不定性减少。 2. 是事物运动的状态与方式的反映。 知识(Knowledge):A、是在改造世界的实践中所获得的认识和经验的总和。 B、是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的 有组织的陈述。提供某种经过思考的判断和某种实验的结果。 (信息是知识的原材料,知识是信息加工的抽象化产物。) 情报(Information):钱学森:“情报是活化了的、激活了的知识”。可以理解为是指传递着的有特定效用的知识或信息。 三要素:知识性、传递性、效用性 文献(Literature):记录有知识的一切载体。 三要素:载体(文献的外部形式,它是知识的包装或运载方式,常称之为媒体(media)。)、知识(反映了文献的信息内容。)、记录(信息的一种人工编码,通过人工、机械以及声、光、电、磁等各种技 术手段生成多种包含知识信息内容的符号,以一定的形态出现,形成各种媒体的文献类型。) 文献对人类文明进步具有重大意义:知识的积累、传播与创造研究成果的确认与评价 信息环境及其认识:信息环境的变化,20世纪90年代中期前,书本时期-----手工检索,缩微时期-----缩微检 索,20世纪90年代后期,光盘时期-----单机检索,网络初期-----联机 检索 21世纪,网络兴盛-----网络检索 第一章信息检索原理 一、信息检索的含义(掌握) 广义:信息检索包括信息的存储过程和查找过程;狭义:仅指信息的查找。 二、信息检索的类型 (一、)以检索内容划分(重点) 1.文献信息检索 凡是利用目录、文摘或索引等二次信息查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息以及这些信息的出处和收藏单位等,都属于文献信息检索范畴。其检索的结果是文献信息 2.数据信息检索(Data Retrieval) 凡是利用参考工具书、数据库等检索工具检索包含在文献中的某一数据、参数、公式或化学分子式等,统称为数据信息检索。其检索结果为数据信息。 3.事实信息检索(Fact Retrieval) 凡是利用百科全书等检索工具从存储事实的信息系统中查找出特定事实的过程称为事实信息检索。其检索结果是基本事实。 文献信息检索是一种相关性的检索,检索的结果是文献线索,还必须进一步查找才能检索到有关的一次信息;数据与事实信息检索是一种确定性检索,检索的结果是可供用户直接利用的信息。一般情况下,文献信息检索通过二次信息来实现,而数据与事实信息检索则通过三次信息来完成。 (二、)以信息存储和检索的方式和技术划分(掌握) 1.手工检索(Manual Retrieval) 手工检索简称“手检”,是指人们通过手工的方式来存储和检索信息。其使用的检索工具主要是书本型、卡

计算机检索的步骤和方法

计算机检索的步调和办法 令狐采学 一、明确检索要求和检索目标 计算机检索的第一步准备工作是明确检索要求和检索目标。 明确检索要求就是要搞清楚本课题属于什么学科,所需文献的类型及语种,查找文献的年代,所需文献的最佳篇数,允许支配的检索用度。这些要求对选择数据库、构造检索战略都是十分重要的。确定检索目标也是进行计算机信息检索前应搞清楚的准备工作。例如:如果属于开题调研,则应尽可能地检索出与之相关的全部文献,即要求较高的查全率;以便充分地做好开题的准备工作;如果属于探索性、开创性的课题,则只需要查出一些启发性的文献,对查准率和查全率要求都不一定有很高的要求。 二、课题阐发 1. 课题概念的阐发办法 阐发课题就是阐发出课题所涉及的主要概念,并找出能代表这些概念的若干个词或词组,进而阐发概念之间的上、下、左、右关系。对新学科、交叉学科和边沿学科的课题,则要搞清楚这些概念之间的关系。概念阐发的结果应以概念组为单位的词或词组的形式列出,以便下一步制订检索战略时使用。 2. 隐含概念的阐发办法 有些课题的实质性内容往往很难从课题的名称上反应出来,课题所隐含的概念和相关的内容需要从课题所属的专业角度作深入阐发,

才干提炼出能够确切反应课题内容的检索概念。例如:"社会包管"包含"养老保险"、"失业保险"、"医疗保险"和"社会救济"等概念,如果要检索社会包管方面的文献,应该析出上述概念,才干包管文献的查全率。 3. 核心概念的选取 有些检索词中已经含有的某些概念,在概念阐发中应予以排除。例如:课题"公司劳动奖励、职工培训和养老保险制度管理的理论和实践",如果把"劳动奖励","职工培训","养老保险","公司","制度","管理"六个概念全部组配起来,则会造成年夜量文献漏检。实际上,劳动力资源管理已经包含了劳动奖励、职工培训和养老保险三个方面,并且,劳动力管理必定是针对该三个方面而言的。因此,本课题只须采取"劳动力资源"和"管理"这两个实质概念即可。为了提高文献的查准率,应该从相应的规范词表中选择所需的检索词。并且在确定检索词时,除要考虑反应主题概念的同义词、近义词等相关的检索词外,还要注意选择被选用检索词的缩写词和不合拼法的词,以避免漏检有关的文献。 三、检索词的扩展、选择和处理 目前的计算机信息检索系统,还不具备智能思考的能力,还不会对所输入的检索词以及涉及的所有词进行自动、全面的检索,因此,必须在概念阐发的基础上列出与概念有关的词,从中做出选择,并利用截词等办法对检索词予以归并。 1.相同概念的检索词的扩展 扩展相同概念的检索词的办法一般有同义词办法、主题词表办法和

信息检索答案

信息检索答案 题型一 1、信息素养或素质的具体内容有那些? 信息素质是指用户在利用以计算机及其网络技术为代表的现代科学技术进行知识学习、成长的过程中,逐步形成的主动参与信息活动、自觉应用信息技术的意识、态度、理念及具备的获取、识别、加工、处理、传递、创造信息的能力和利用信息去解决实践问题的能力。它包括强烈的信息意识、系统化的信息理念、综合信息能力等内容。 2、信息、知识、情报、文献的概念?文献的组成要素? 信息的概念:1、信息是人们根据一定目的和需要,把从自然现象和社会现象中搜集的原始材料进行加工、处理,找出其中关系而形成的对象实体。 2、信息是有一定含义的、经过加工处理的、对决策有价值的的数据,即信息=数据+处理 3、信息是人们对数据进行系统组织、整理和分析,使其产生相关性,但没有与特定用户行动相关性的实体对象,信息可以被数字化。 知识的概念:知识是指人们在认识世界、改造世界中所获得的认知,包括通过阅读、学习等方式的认知和通过自己或他人的历练所积累的一切经验的总和。 情报的概念:是被人们所利用的信息、被人们感受并可交流的信息。 文献的概念:是记录有知识的一切载体。 文献的组成要素:不但包括现代图书馆的全部馆藏,同时也包括了档案馆、博物馆、声像馆和情报中心收藏的全部馆藏。 3、信息、信息资源包括那些类型?1)信息的类型:从产生信息的客体的性质来分,可分为自然信息(瞬时发生的声、光、热、电、形形色色的天气变化、缓慢的地壳运动、天体演化……)、生物信息(生物为繁衍生存而表现出来的各种形态和行为,如遗传信息、生物体内信息交流、动物种群内的信息交流)、机器信息(自动控制系统)和(人类)社会信息。以信息所 依附的载体为依据,可分为文献信 息、口头信息、电子信息、生物信息 等 信息资源类型:根据存储媒介不同, 信息资源可以划分为印刷型信息资 源、电子信息资源、数字信息资源和 多媒体信息资源。 4、文献有那些类型?将文献划分成 这些类型的依据是什么? 1)根据载体材料、存储技术、和传 递方式划分 可划分为:印刷型、缩微型、试听型 和机读型文献信息源 2)根据加工程度的不同划分 可分为:一次文献信息源、二次文献 信息源、和三次文献信息源 3)根据文献信息源的内容划分 可以分为:图书、期刊、报纸、科技 报告、政府出版物、会议文献、专利 文献、学位论文、标准文献、档案文 献、产品样本 5、数据库的类型?网络资源有那些 特点? 数据库的类型:联机数据库和光盘数 据库、网络数据库 网络资源有那些特点:数量庞大、增 长迅速;内容丰富、形式多样;变化 频繁、价值不一;结构复杂、分布广 泛;信息分散、无序等 6、何为“核心期刊“?本专业的核心 期刊有那些? 核心期刊定义是 :在某一学科中 ,少 数期刊覆盖了该学科的大部分文献 , 而多数期刊仅包含该学科的少量文 献 ,这少数期刊就是该学科的核心期 刊。 本专业的核心期刊有:《政治与法 律》、《环球法律评论》、《当代法学》、 《法学》 7、什么是信息检索?类型有哪些? 定义:是通过一定的方法和手段将用 户的提问特征与数据源所采用的特 征标志进行对比,然后将二者相一致 或比较一致的信息提取出来供用户 使用的过程。 类型:文献检索、数据检索、事实检 索 8、简述信息检索的原理。 信息检索的实质是一个匹配过程,也 就是信息用户需求的主题概念或检 索表达式同一定信息系统的系统语 言相匹配的过程,如果两者匹配,则 所需信息被检中,否则检索失败。 9、什么是计算机信息检索系统?它 由几个部分组成? 计算机信息检索系统:是利用计算机 和一定的通信设备查找所需信息的 检索方式,检索的系统就是人的设计 操作和计算机自动化处理相结合的 系统。 组成部分:光盘检索系统、联机检索 系统、网络检索系统 10、计算机信息检索技术包括哪些? 布尔检索、向量空间检索、模糊集合 检索、概率检索、全文检索,发展到 超文本检索并向着智能化方向发展。 11、从外表特征和内容特征来看,检 索语言的类型各有哪些?不同特征 各举一简单的检索式。 描述信息外部特征的检索语言包括 题名(书名、刊名、篇名)、著者姓 名\单位名称、出版事项、代码\序号 (如专利号、报告号、标准号)等, 其作为检索标志直接明了,使用时较 为简单。 描述信息内容特征的检索语言包括 分类语言和主题语言,主题语言又可 分为关键词语言、单元词语言、标题 词语言和叙词语言。 12、为什么要创建检索语言,它有哪 些类型?比较分类语言和主题语言 的优缺点。 1)检索语言是指用于描述信息系统 中信息的内容特征及外部特征和表 达用户信息提问的一种专门语言,目 的是为了便于检索文献。 2)类型:按检索语言是否受控可分 为人工语言和自然语言,按检索时的 组配实施状况可分为先组式和后组 式检索语言,按描述信息特征的不同 可分为描述信息外部特征的检索语 言和描述文献内容特征的检索语言。 13、信息(文献)检索的方法与途径, 详细论述检索步骤? 1、分析研究课题,明确检索要求: 分析课题的主要内容、确定课题的文 献类型、确定检索时间范围、分析用 户的检索评价要求 2、选择检索工具:根据检索课题的 要求,选择最能满足检索要求的检索 工具书,不同的资料类型就应该选用 不同的数据库 3、确定检索策略:确定检索途径、 制定检索策略 4、调整检索方案:确定了具体的检 索方法之后,就要利用所用数据库, 在一定的年代范围内具体查找,以获 得文献线索。用户对每次检索结果在 作出判断,并对检索策略做出相应的 修改和调整,知道得到满意的结果 5、获取原文:利用全文数据库直接 获取,利用文献传递系统获取、利用 文摘数据库的原文服务、利用OPAC 检索系统,进行馆际互借。 14、什么是文献线索?列举以上不同 文献类型(期刊论文、会议论文、图 书、标准等)的线索。 文献线索:文献检索的概念有狭义和 广义之分。 狭义的检索(Retrieval)是指依据一 定的方法,从已经组织好的大量有关 文献集合中,查找并获取特定的相关 文献的过程。这里的文献集合,不是 通常所指的文献本身,而是关于文献 的信息或文献的线索。如果真正要获 取文献中所记录的信息,那么还要依 据检索所取得的文献线索索取原文。 广义的检索包括信息的存储和检索 两个过程(Storage and Retrieval)。信息 存储是指工作人员将大量无序的信 息集中起来,根据信息源的外表特征 和内容特征,经过整理、分类、浓缩、 标引等处理,使其系统化、有序化, 并按一定的技术要求建成一个具有 检索功能的工具或检索系统,供人们 检索和利用。而检索是指运用编制好 的检索工具或检索系统,查找出满足 用户要求的特定信息。 15、简述“超星电子图书馆”、“书生之 家数字图书馆”、“中国学术期刊全文 数据库”、“维普中文科技期刊数据库” 和“万方数字化期刊”收藏资源的特 点 1)、超星电子图书馆:收录的电子图 书内容丰富,包括经典理论、哲学、 社科、经济、语言文字、文学、数理 化、生物、工业技术、计算机等50 余个学科门类,现拥有中文电子图书 80万种,论文300万篇,全文总量4

计算机信息检索实验报告(6个)

实验一网上中文搜索引擎及其使用 一、实验心得 在电脑已经成为生活必备品的现在,日常搜索是一件很平常的事情。俗话说,天天百度知识丰富。当然,我国国内主要的搜索引擎除了百度,还有谷歌、雅虎、搜狗、网易、新浪。 一般来说,百度和谷歌是最多人用的。不同的搜索引擎,不同的搜索方法,得到搜索结果的速度和准确度也不一样。所以我觉得学习计算机信息检索的主要目的就是更好地提高自己搜索的速度和准确度。 在这次实验当中,我们主要学习和掌握以下搜索技巧的运用。「“”」的基本用法、「+」或「空格」的基本用法、「+」的基本用法、「-」的基本用法、「OR」的基本用法、「site」的基本用法、「inurl」的基本用法、「intitle」的基本用法、「filetype」的基本用法。比起以前直接把整个问题打上去然后从网页中寻找满意的答案,灵活使用这些搜索技巧可以更快地找到准确率高的答案。这些技巧在现实生活中具有高度的可操作性和便捷性。 二、实验结果 (一)请使用Google或百度搜索引擎完成以下知识测验:(请将检索结果复制到题干之后,并把所有有关的网页都下载到你的作业文件夹中,以作为本作业评分的依据。) 1.谁根据小仲马的《茶花女》改编了同名歌剧( B ) https://www.360docs.net/doc/3617842623.html,/b/7602599.html A.奥斯汀 B.威尔第 C.福楼拜 2."生存还是死亡,这是一个问题。"出自莎士比亚的哪部作品?( A )https://www.360docs.net/doc/3617842623.html,/question/25934693.html A.《哈姆雷特》 B.《李尔王》 C.《麦克白》 3."侦探福尔摩斯"第一次出现是在下列哪部作品中: ( A ) https://www.360docs.net/doc/3617842623.html,/question/1306083005651.html A.《血字的研究》 B.《东方快车谋杀案》 C.《尼罗河上的惨案》 D.《难逃一生》 4.李清照词中名句"寻寻觅觅,冷冷清清,凄凄惨惨戚戚"的词牌名是: ( D ) https://www.360docs.net/doc/3617842623.html,/wenda/thread?tid=7c29ad4f072df739&hl=cn A.醉花阴 B.一剪梅 C.如梦令 D.声声慢 (二)请在网上寻找如下列图片。 1.寻找如下图所示世界名画《蒙娜丽莎》的指定图片和介绍她被偷的文章 提示:可试用以下检索词:Mona Lisa Louvre museum stolen 蒙娜丽莎 500岁蒙娜丽莎被偷卢浮宫 图片网址: https://www.360docs.net/doc/3617842623.html,/i?ct=503316480&z=0&tn=baiduimagedetail&word=Mo na+Lisa+Louvre+museum+stolen&in=31376&cl=2&lm=-1&pn=10&rn=1&di=101230 20660&ln=1&fr=&ic=0&s=&se=&sme=0&tab=&width=&height=&face=0&fb=0 文章地址:https://www.360docs.net/doc/3617842623.html,/hualang-1534-7665506.shtml

中国知网等文献检索的一般方法

文献检索一般方法 同学们: 可能你们目前接触到的文献并不多,但以后你的作业和设计很大一部分要求自己查阅文献,期刊,论文来解决(比如说:微生物学,微生物工程工艺原理,酶工程,白酒工艺学,啤酒工艺学,食品安全学,白酒勾兑等)。在四川理工学院我们检索文献的方式不外乎在图书馆找纸质档案和网络检索两种,因为我们通常使用的文献都要求是近三年核心期刊发表的文章,因为只有这些才能反映某个领域目前发展的现状,所以我们一般都偏向于跟新更快的网络搜索,其中又以知网和超星使用最多。下面简单介绍文献检索的一般方法,希望能给大家的学习,包括实验室学习带来一点帮助,有不明白的地方请直接联系我。 1、检索课题名称(中英文) 计算机在中学物理中的应用 The application of computer to physics in middle school 2、分析研究课题 随着计算机技术的不断发展,计算机在教育中的作用愈发突出。在中学物理教育 中,同样可以引入计算的先进技术,改进教育方法,提高教学效率。如今,计算机在 中学物理中的应用主要体现在以下几个方面: 1)计算机技术在课件制作中的应用。 2)计算机在实验仿真中的应用。 3)计算机在教学数据处理中的应用。 根据以上分析,本课题主要是根据计算机在中学物理教学中的几个应用进行相关 材料的查找。 3、检索策略 3.1 检索工具 1)利用“中国知网”查找有关硕士、博士论文。 2)利用“中国期刊全文数据库”查找相关期刊论文。 3)利用“维普科技期刊数据库”查找相关期刊论文。 4)利用“超星数字图书馆”查找相关图书。 5)利用“SpringLink”查找相关论文。

信息检索 期刊检索上机练习 试题及答案

1、通过中国知网CNKI硕士学士论文全文数据库(电子期刊)高级检索功能检索作者为 倪梅,署名单位为西南交通大学的论文。 请问: (1)请列出检索结果。(列出文章篇名) 李安电影编码分析 (2)说出布尔逻辑关系。 A AND B ( A*B ) 倪梅*西南交通大学 (3)该论文摘要部分内容是什么 李安是当今享誉世界的华人电影工作者,他导演的电影获得过各类国际电影节大奖,他也是唯一获得美国奥斯卡金像奖的华人导演。他的电影涉及中西题材,表现出不同文化相互融合;他既能将中国传统文化融入到故事情节中,又能照顾不同层面的观众群体;他的电影能兼顾中国文化与西方文化、艺术性与商业性、传统与现代之间的平衡。本论文将应用斯图亚特.霍尔的“编码/解码”理论的编码理论部分主要以电影《卧虎藏龙》为例对李安电影进行编码分析。本论文主要分四部分展开论述:第一章为绪论,主要包括问题的提出和目前研究状况分析。第二章是李安的文化身份分析,主要分析李安的文化历程、文化身份、文化立场等三个方面。霍尔在“编码/解码”理论中还指出意义的建构要受多种因素的影响,这一章的论述是后面章节编码分析的基础。第三章是李安电影编码分析,重点以电影《卧虎藏龙》为例进行分析,理论依据是“编码/解码”编码者对信息的编码要受自身社会地位、知识框架结构等因素的影响。从该理论还可知,在不同文化的主导性话语结构内,编码者对相同信息的不同编码也将影响解码立场。第四章主要从强化解码者的主导性解码立场来研.. 检索类别:CNKI使用——高级检索 用“AND”或“*”表示。可用来表示其所连接的两个检索项的交叉部分,也即交集部分。如果用AND连接检索词A和检索词B,则检索式为:A AND B (或A*B):表示让系统检索同时包含检索词A和检索词B的信息集合C 学习目标: (1)、掌握通过cnki检索、学位论文的方法和步骤; (2)、掌握与cnki相关的pdf阅读器、caj阅读器的下载、安装和使用; (3)、掌握多个条件的高级组合检索; (4)、体会检索课题所体现的布尔逻辑关系。 2、在中国知网中通过期刊大全导航网站(中国学术文献网络出版总库)查询《电影文学》这种期刊,并在此期刊中检索作者为倪梅的论文。 (1)请列出检索论文题目?

《网络信息检索与利用》实习报告

网络信息检索与利用 实 习 报 告 学院 班级: 姓名 学号: 1、利用CNKI检索该课题:关于海南国际旅游岛制度建设方面的文献。 抽取检索词:海南国际旅游岛制度体制 构建检索式:SU=(海南and 国际旅游岛)AND SU=( 制度or 体制)

检索过程请截图示意 : 检索结果(保留3条切合的题录 [1] 孟建力. 海南国际旅游岛旅客购物离岛免税制度研究[D]. 海南大学,2011 [2] 钱新梅. 海南国际旅游岛离岛免税购物法律制度研究[D]. 海南大学,2012 [3] 邹立刚. 海南国际旅游岛购物制度及其完善[J]. 海南大学学报(人文社会科学版),2011 2、利用万方数据库检索该课题:关于大学英语四级和六级方面的学位论文。

抽取检索词:大学英语四级大学英语六级 构建检索式:SU=(“大学英语四级”)or(“大学英语六级”) 检索过程请截图示意: 检索结果(保留3条切合的题录) [1] 陈建蕊.基于语料库的大学英语四级与六级作文中的态错误分析[D].河北师范大学,2011. [2] 黄萍.大学英语六级考试成功通过者考试策略个案研究[D].扬州大学,2011. [3] 宋艳.英语专业四级与大学英语六级听力理解难度对比研究[D].西南交通大学,2010.

3、利用维普数据库查找对袁行霈主编的《中国地域文化通览》各省、自治区、直辖市分卷的书评。 检索过程请截图示意: 检索结果(保留3条切合的题录)

[1]李建平[1,2],地域文化研究的重要收获--评《中国地域文化通览·广西卷》.沿海企业与科技,2014,(1) [2]容本镇,从远古到近代:文化铸造民族自信——评《中国地域文化通览·广西卷》.当代广西,2014,(18) [3]陈文华,地域文化的上乘之作——评《中国地域文化通览·湖北卷》.江汉论坛,2015,0(5)

计算机信息检索02139自考资料

第一章信息检索概述 1.信息检索:指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 2.根据检索手段的不同,信息检索可以分为手工检索、光盘检索、联机检索和网络检索。 3.信息检索的基本原理 通过对大量的、分散无序的文献信息是进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。 4.信息检索语言 信息检索语言是人们在加工、存储和检索信息时用来描述信息内容和信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。 5.五个信息检索阶段:手工检索、机械信息检索、脱机批处理检索、联机检索、网络信息检索,后三 者统称为计算机信息检索。 6.与手工检索相比,计算机信息检索的特点表现在: (1)速度快、效率高,仅几分钟就可以从成千上万条记录中找到所需信息; (2)检索范围广,可以迅速而方便地浏览相关学科或主题的所有数据库中的记录,在 网络中,几乎每一台个人计算机都可以成为信息源; (3)检索不受时空的限制,只要拥有相应的软件和硬件设备,就可以在任何地方借助 光盘和通信网络查询所需信息。 7.信息检索的模型:就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻译和 抽象,表述为某种数学公式,再经过演绎、推断、解释和实际校验,反过来指导信息检索实践。 信息检索的三个经典模型是:布尔模型、向量空间模型和概率模型。 8.信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。 9.信息检索系统是信息检索所用的硬件资源、系统软件以及信息资源集合的总和。 10.数据库由字段、记录和文档构成。 11.根据载体的不同,数据库可分为:联机数据库、光盘数据库和网络数据库三种。 12.信息检索系统评价的核心是检索性能评价。 13.检索性能评价:根据一定的评价指标对实施信息检索活动所取得的成果进行客观科学评价,以进一 步完善检索工作的过程。 评价检索效果的最主要的指标:查全率和查准率。 14.查全率 查全率是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。 15.查准率 查准率是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。 第二章网络信息检索的方法与技术 1.布尔逻辑检索的主要运算符 布尔逻辑检索的主要运算符有:逻辑与(“AND”)、逻辑或(“OR”)、逻辑非(“NOT”)。 它们分别代表的含义是:(1)逻辑“与”。表示检索结果中必须包含所有的检索词;(2)逻辑“或”。表示检索结果中只要包含任何一个检索词即可;(3)逻辑非。表示检索结果中一定不能出现“NOT”后面的检索词。 2.邻近检索 邻近检索是用一些特定的算符来表达检索词与检索词之间的顺序和词间距的检索。 3.短语检索:短语用“”表示,检索出与“”内形式完全相同的短语,以提高检索的精度和准确度, 因而也有人称之为“精确检索” 4.截词检索 是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符一般用“?”或“*”表示,但不同的数据库中有所差别。 常用的截词检索方法有前截词、中间截词和后截词。 5.在信息检索过程中,为了提高查全率或查准率,需要将检索范围限制在特定的字段中,即字段限制 检索。 6.模糊检索:模糊检索是指使用某一检索词进行检索时,能同时对该词的同义词、近义词、上位词、 下位词进行检索,以达到扩大检索范围、避免漏检的目的。

网络信息检索与利用参考试题与答案

网络信息检索与利用 一、名词解释题: 网络信息资源:是将文字、图像、声音、动画等各种形式的信息,以数字化形式存储并借助计算机与网络通讯设置发布,收集、组织、存储、传递、检索和利用信息资源。 www: 信息检索 数据库:是至少有一个文档组成并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。 联机检索:指用户利用计算机联合通过通讯网络与世界各地的信息检索系统联机,从检索系统的数据库中查找出所需信息的过程。它允许用户以智能机对话,联机会话,这样交互的方式直接访问检索系统及数据库、检索是实时在线进行。 查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例。 查准率:是指检出文献中合乎需要的文献的数量占检出文献的全部数量。 关键词:关键词又称自由词,它属于自言语言范畴。关键词是直接来自文献本身,能够反映文献主题概念,具有实际检索意义的词语。以搜索引擎为代表的基于关键词的检索工具能够利用全文索引技术。 布尔逻辑检索:又称布尔代数是指使用,and,or,not等运用符,查找含有某种词语特定主配形式的网页。 搜索引擎:是一个可以用文件名查找文件的系统。 元搜索引擎:是一种基于搜索引擎的网络检索工具。它是将多个搜索引擎集合在一起,通过一个统一的检索界面接收并处理用户的查询提问。在进行检索时调用一个或者多个独立搜索引擎的数据库。 桌面元搜索引擎:顾名思义,桌面元搜索引擎不是通过网上调用方式在线使用,而是直接在用户的计算机上进行,相当于用户自己拥有一个元搜索引擎,所以称之为桌面元搜索引擎。All-in-One式元搜索引擎:又称搜索引擎元目录,它将主要的搜索引擎集中起来,并按类型或检索问题等编排组织成目录帮助导引用户根据检索需求来选择适用的搜索引擎。 联合书目数据库:联合目录是揭示报道若干个文献收藏单位的文献入藏情况,汇总若干个单位馆藏的书目信息的目录。 参考信息:是指人名、地名、机构、事件、统计数据等一类数据,事实信息,是人们的工作研究和日常生活中经常要查考、引用的信息。 二、简答题和论述题: 1.网络信息资源的种类分哪几种? 答:可分为五种:1.web信息资源。其中有www有关的重要概念:(1)超文本传输协议HTTP (2)超文本标记语言HTML(3)通用资源定位程序URL(4)主页(home page)(5)链接(link)(6)浏览器 2.Telnet:是通过远程登录后,可以访问共享的远程系统中的资源。 3.FTP信息资源,是因特网适用的文件传输协议。 4.用户组信息资源,是有一组对某一个特定主题有共同兴趣的网络用户组成的电子论坛。 5.RSS信息资源,它是一种用于共享新闻

常用网上信息检索方法综述

常用网上信息检索方法综述 学生姓名:常** 专业:信号与信息处理学号:201520601001 教师:黄文清老师

摘要 因特网的普及和发展给人们带来了空前丰富的信息资源,越来越多的用户利用网络阅读和查询所需信息,网上阅读和检索已成为人们获取信息的重要途径。如何认识和利用浩瀚如海的网络信息,快速查找并准确获取所需资源,需要掌握一定的网络检索方法和技巧以便捷地对互联网进行检索查询,提高搜索的命中率。 关键词:因特网;信息资源;检索方法

ABSTRACT The popularity of the Internet and development brings unprecedented rich information resources, more and more users use the network reading and required information query, online reading and retrieval has become an important way of access to information. Such as how to understand and use the vast sea of network information, quick search and accurately obtain the resources needed, need to master certain network retrieval methods and techniques to conveniently Internet search queries, improve search hits. Keywords: Internet, Information resources, Retrieval methods

网络信息检索与利用

陕西师范大学网络教育学院试卷 课程名称:网络信息检索与利用 课程代码:G152112 考试说明: 一、作文(本大题共1小题,每小题100分,共100分) 1.《网络信息检索与利用》是我院行政管理专业高中起点专科开设的专业必修课,本门课程采用考查方式进行考核。请完成以下两份作业,作为期末考查成绩。 作业一、请从以下题目中选择5个问题进行回答。 1)你如何认识"信息爆炸”和"信息污染”? 2)网络信息的主要传播渠道有哪些?如何判断网络信息的价值? 3)通过本课学习,你对“学会学习”有何新的认识与体会? 4)请联系实际,试述学习信息检索与利用知识在你学习生活中有何帮助? 5)结合信息时代特征,谈谈掌握信息检索与利用知识在读书治学和创新能力培养 中的作用。 6)谈谈你如何理解知识经济时代的学习观、生存观。 7)为什么说“学习和掌握现代信息检索技术”是21世纪人们信息生存的必备技能? 8)简述图书、杂志和报纸的内容特点和主要功用。 9)简述事实数据库的概念及主要类型。

10)说明信息检索的步骤。 11)试述网络信息资源的定义及分类。 12)举例说明布尔逻辑运算中“逻辑与”和“逻辑或”的检索特点。 13)简述信息检索的原理。 14)谈谈你对网络信息资源类型和作用的认识: 15)从信息内容看有几类搜索引擎?各具什么特点并举例说明。 16)请说明一次文献、二次文献和三次文献的特点和功用。 17)为什么说搜索引擎是检索WWW上的专用工具?搜索引擎的功能有哪些? 18)简述搜索引擎的原理。 19)请用中文检索工具检索1篇所学专业的文献,作简要分析和写出检索步骤。 20)以检索所学专业的某本图书为例,说明“超星数字图书馆”的使用方法。 21)请用中文检索工具检索1篇所学专业的文献,并作简要分析和写出检索步骤。 22)请用我校图书馆的CNKI数字图书馆“中国期刊全文数据库”检索所学专业的 1 篇论文,并写出文献外部(表)特征和检索的过程。 23)请用中国学位论文数据库系统检索1篇与所学专业有关的论文,并写出文献外部特征和简要的检索步骤。 24)请用百度或谷歌等搜索引擎检索有关“阿波罗登月计划”的文献信息,并写出文献外部特征和简要的检索步骤。 25 )在信息时代你如何鉴别信息的真伪? 作业二、请从以下题目中选择一个话题进行论述。 1 )美国图书馆协会和教育传播与技术协会在其出版的《信息力量:创建学习的伙伴》一书中

计算机信息检索复习资料

计算机信息检索复习知识点 第一章 1、人类生活的3个基本要素是材料、能源和信息。(单选) 2、信息是指应用文字、数据或信号等形式,通过一定的传输和处理,来表达各种相互联系的客观事务在运动中所具有的特征性内容夫人总称。(名词) 3、信息的特征有:客观性、动态性、相对性、依存性、可传递性。(多选) 4、共享性是指同一内容的信息可以在同一时间里被多个信息用户使用。 5、信息的功能有哪些?(简答) (1)信息是感知世界的中介;(2)信息是管理决策的依据;(3)信息是科学研究的必要条件;(4)信息是社会发展的资源; 6、信息的类型有哪些?(论述) (1)按信息的表达形式划分,可以分为 ①文献信息②声像信息③电子信息 (2)按信息的应用范围划分,可分为 ①白色信息②灰色信息③黑色信息 (3)按信息的加工层次划分 ①一次信息②二次信息③三次信息 7、信息需要:所谓信息需要,就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题而产生的对信息的需要。(名词) 8、信息需求的特征有哪些?广泛性、社会性、发展性、多样性(多选) 9、现代信息技术的基础是微电子技术(单选) 10、数据库是指为满足多个用户的多种应用需要,按一定的数据模型在计算机中组织、存储和使用的相互联系的数据集合。(名词、单选) 11、通信系统的基本组成包括信源和:信宿、变换器、反应器、信道、噪声源 12、信号的接收者称为信宿 13、信息传输的通道称为信道 14、信号在传输过程中受到的干扰称为噪声 15、数据库简称DB 16、数据库的四种基本操作是:检索、更新、删除、插入 17、数据库的特点有哪些?(简答)(1)数据共享;(2)面向全组织的数据结构化;(3)数据独立性;(4)可控数据冗余度;(5)统一数据控制功能。 18、数据结构化有利于实现数据共享 19、数据库管理系统可以提供哪些方面的数据控制功能:安全性、完整性、并发控制、数据恢复 20、构成数据库的三个主要层次是:文档、字段、记录 21、记录的基本单元是:字段 22、文档的基本单元是记录 23、一个文档中你好,认识一下!包含大量的记录 24、检索系统提供的数据库相关文档组成包括的文件数是3个 25、顺排文档:按记录的存取号的大小顺序存入全部记录,它相当于印刷型检索工具的正文部分。 26、倒排文档:把记录中的可检字段抽出,包括单元词、多元词,按某种顺序重新加以组织后得到的一种文档。 27、倒排文档只包括记录的标识、信息的数量及信息存取号。 28、存储了数据库所有记录的特征标识的是倒排文档 29、数据库文档中便于随机存取,实现非顺序存储结构的文件是索引文档 30、传统的检索对象主要是文献型的信息源 31、传统的检索对象的存储介质是纸张 32、对超文本、超媒体信息资源实施的检索是超维检索 第二章 1、计算机信息检索经历了哪几个主要发展阶段?(简答)(1)脱机批处理检索阶段;(2)脱机检索阶段;(3)光盘检索阶段;(4)网络化检索阶段 2、计算机信息检索必备的条件是物质和人员 3、计算机检索的类型有哪些?(论述) 计算机信息检索的类型可以通过检索的内容、信息出版的时间和检索工作的方式加以划分 1根据计算机信息检索的内容划分,检索可以分为 (1)数据检索;(2)事实检索;(3)文献检索 2根据被检索信息出版的时间划分,可分为:(1)定题信息检索;(2)回溯性信息检索 3根据计算机检索工作的方式划分,可分为:脱机检索系统;(2)联机检索系统 4、事实检索的对象是事实 5、检索结果能够满足用户需要的文献线索或文献全文的是文献检索 6、回溯性信息检索:根据用户提供某一段时间范围内的文献信息的检索方法 7、计算机批处理的信息检索系统称为脱机检索系统 8、用户以联机会话方式直接访问系统及其数据库的信息检索系统称为联机检索系统 9、信息检索系统:是指按照某种方式、方法见利起来的供读者检索信息的一种有层次的体系,是表征有序的信息特征的集合体。 10、信息检索系统的职能有:报道职能、存储职能、检索职能 11、信息数据库可以划分为:参考数据库、源数据库、混合型数据库 12、参考数据库:是指用户从中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库 13、源数据库:能够直接为用户提供原始资料或具体数据的一类数据库。 14、信息系统的构成模式是什么?(简答) (1)信息数据的选择、处理、录入和维护子系统;(2)词表和标引子系统;(3)检索子系统;(4)系统----用户接口子系统统 15、信息检索系统的存储结构有:印刷存储、微缩存储、磁存储、半导体存储、光存储 16、信息存储的逻辑结构有:线性结构、非线性结构、树形结构、网形结构 17、数据元素按一定顺序构成一个有限序列的信息存储结构称为:线性结构 18、非线性结构中最常用的的是树形结构和网形结构 19、将信息用二进制表示称为编码 20、计算机处理信息的最小单位是一位二进制数 21、两级存储器是指主存储器和辅助存储器 22、信息检索的概念起源自文献信息检索 23、对信息进行主题分析,提取代表该信息的特征的过程称为标引 24、自动抽词标引:利用计算机直接从信息正文、标题或文摘中抽出能表达信息主题的关键词作为标引词,并自动生成 关键词索引或倒排文档。 25、对一本书或一篇文章所做的扼要摘述称为文摘 26、利用计算机自动编制文摘称为自动文摘 27、在信息检索自动化处理中,常用的运算是排序 28、常用的自动排序的方法有选择排序和快速排序 29、存储区域网简称为SAN 30、目前大多数中小企业见利网络环境的协议基础是 TCP/IP 31、信息检索系统的组织:为了控制信息的流速和流向、数 量和质量等,把传递中的杂乱无序的信息整理为系统有序状 态的活动。 32、信息检索系统的组织目的是什么?(简答) (1)减少社会信息流的混乱程度; (2)提高信息系统的质量和价值; (3)建立信息检索系统与用户的联系; (4)节省社会信息活动的总成本。 33、信息检索系统的组织的要求有哪些 (1)信息内容有序化; (2)信息流向明确化; (3)信息流速适度化; (4)信息质量最优化。 34、信息检索系统组织方法:是指对每一信息的各种外表特 征和内容特征进行描述并确定其标识,然后按一定方式或规 则将其内容组织起来以供检索的方法 35、信息检索系统的传统组织方法有哪些? (1)分类组织法;(2)主题组织法;(3)字顺组织法;(4) 号码组织法;(5)自然组织法 36、进行网络信息资源组织的方式主要有:文件组织方式、 主题树组织方式、超文本组织方式、超媒体组织方式、元数 据组织法 37、以文件为单位共享和传输信息的组织方式称为文件组织 方式; 38、超文本的信息组织方法是非线性; 39、元数据又称描述数据; 40、对初选信息的鉴别、筛选和删除称为优化; 41、优化选择的方法有:比较法、分析法、核查法、引用摘 录法、专家评估法 42、检索语言:检索信息所使用的人工语言; 43、登录在类表、词表中的所有标识称为词汇 44、检索语言的作用有哪些?(简答) (1)对信息内容进行主题分析;(2)便于将标引、检索用 的标识符进行相符性比较,保证检索和标引的一致性;(3) 保证检索结果和检索要求的一致性;(4)保证信息存储集中 化和系统化 45分类语言的基础是科学分类 46主题语言是使用词语标识的一类信息检索语言,称为主题 法 47、把主题词按照一种便于检索的方式编排起来,称为主题 词 48、关键词:从信息的题名、摘要和内容中抽取出来的,能 够表达信息主题内容的具有检索意义的关键性词汇。 49、叙词:是指从自然语言中优选出来并经过规范化处理的 名词术语,属于后组式语言的一种,是采用表示单元概念的 规范化语词的组合来对信息主题或内容进行描述的标识系 统。 50、叙词的特点:专指性、直观性、多维检索、适应性、网 络结构 51、按照学科体系进行系统排列的语言称为分类语言 52、按照主题词的字顺序列排列的语言称为主题语言 53、计算机信息检索是指利用计算机存储信息和检索信息 54、进入检索的入口称为检索途径 55、按学科分类体系查找信息的途径称为分类检索 56、利用信息主题内容进行检索的途径称为主题检索 57、选择实现检索计划的具体方法和手段是选择检索方法 58、利用检索系统查找信息的方法称为工具法 59、信息检索策略:将课题的提问及其检索词与检索系统的 收录内容、编排特点相匹配而确定的检索方案或程序。 60、检索效果:是指信息系统检索信息的有效程度,反映了 信息系统的检索能力 61、查全率:检索出的相关信息量与信息系统中的相关信息 量之比 62、查准率:检索出的相关信息量和检索出的信息总量之比。 63、衡量检索效果的相对合理指标是差准率和查全率 第三章 1、布尔逻辑检索:是指通过标准的布尔逻辑关系词来表达检 索词与检索词之间逻辑关系的检索方法。 2、布尔逻辑运算符有:逻辑与、逻辑或、逻辑非 3、INTERNET上信息出传输的主要方式是FTP 4、检索者将检索词在他认为合适的地方截断称为截词 5、限制检索:在检索系统中,使用缩小和限定检索范围的方 法称为限制检索 6、邻近检索:通过专门符号来规定检索词在结果中的相对位 置 7、中级检索技术包括哪些内容? (1)加权检索技术;(2)自然语言检索技术;(3)相关信 息反馈检索技术;(4)模糊检索技术;(5)概念检索技术。 8、自然语言处理应用领域之一是信息检索 9、概念层次网络简称HNC 10、自然语言处理技术可以分为机器翻译、语义处理以及人 机会话 11、搜索引擎用到的自然语言处理技术是机器翻译与语义处 理 12、实现只能搜获的过程主要分为:语义处理、知识管理、 知识检索 13、从用户角度看,用户可以分为最终用户和职业用户 14、信息检索发展史上的突破是应用了自然语言检索 15、智能代理资源管理器的基本结构是:适配器、引擎、知 识、库、视图 16、智能代理信息检索系统的特点有哪些?(论述) (1)智能代理侧重于面向用户。 (2)智能代理主要借助知识库、数据库,并参考用户需求习 惯和一段时期内的偏好,推断用户提问的真实意图,提高检 索的专指性。 (3)智能代理采用机器学习、用户框架模型、推理机制主动 协助用户查找信息。 (4)智能代理不仅是关键字的匹配,而且是基于概念和知识 的检索。 (5)智能代理能不断了解用户需求的变化,并根据用户的反 馈信息及时修正检索目标策略。 (6)智能代理能分离发送请求和接收结果,使它们异步进行。 (7)智能代理能使用户按照个人的兴趣爱好进行信息分类。 17人们进行信息检索时总是期望获得较高的查全率和查准率 18对信息进行采集、标引、存储、处理,最后形成信息集合 体 19、通过模拟自然进化过程搜索最优解的方法称为遗传算法 20、搜索引擎和挖掘引擎处理的都是字串和文本 21、数据挖掘也称知识发现 22、聚类:按照事物的某些属性,把事物聚集成类,使类间 的相似性尽量小,类内相似性尽量大 23、一种很有效的预测模型技术是神经元网络 第四章 1.INTERNET起源于ARPANET 2、我国的四大互联网络是:中国科技网、中国教育科研网、 中国公用互联网、中国公用经济信息网 3、INTERNET提供的基本信息服务有:电子邮件、文件传输、 远程登陆、电子公告板、网络新闻组 4、可以在异地主机上登陆注册的服务是TELNET 5、通过专用电缆与INTERNET主干网直接连接在一起的称 为专线连接 6、综合业务数字网简称ISDN 7、非对称数字用户环路简称ADSL 8、网络信息资源主要类型是联机检索系信息资源和网络信 息资源 9、联机检索信息资源的主要表现形式是联机数据库 10、文件传输协议是FTP 11、网络信息资源进行组织的主要方式有:文件方式、主题 树方式、超文本方式、数据库方式、超媒体方式、元数据方 式。 12、元数据:就是关于数据的数据,是对数据内容的描述。 13、元数据的作用有哪些?(论述) (1)描述数据的内容、质量和特征,以及数据所适用的范围。 (2)管理和存储大量科学数据 (3)提供一种对数据进行检索、查询的方法 (4)帮助数据的使用者更好的了解和使用数据。 (5)促进数据共享 (6)为数据交换和数据传输提供辅助信息 (7)元数据是数据发挥其作用的一个必要条件 (8)维护科研成果,维护在数据方面的投资。 14、DC的特点有:简易性、通用性、兼容性、灵活的可扩展 性 15、知识产权:是公民和法人对在科学和文学等领域内创造 的精神财富以及智力成果依法享有权利的总称。 16、INTERNET上每位用户都有的帐号称为域名 17、数据库开发主要是开发书目数据库、文摘数据库和全文 数据库 18、开发网络信息资源的一个重要途径是制作知识导航库 19、数字图书馆开发利用网络信息资源的一种主要形式是馆 际互借 20、网络信息资源开发利用中的知识产权保护策略是什么? (简答) (1)加强开发利用网络信息资源的立法工作 (2)加强国际交流,逐步与国际接轨; (3)建立和完善知识产权集体管理制度 (4)使用技术手段防止侵权 (5)重视解决网络信息知识产权保护的两个基本原则,即网 络发表权问题和复制权问题。 第五章 1、中国期刊网全文数据库检索系统是基于INTERNET 2、专业检索的具体步骤是: (1)通过单击页面右上角的状态栏,即可进入专业检索条件 界面; (2)选择检索范围 (3)填写检索条件 3、二次检索:通过简单检索、高级检索及专业检索,在这些 检索结果上还可以继续进行操作。 4、二次检索的操作方式有:并且、或者、不包含 5、保存题录中最大保存记录数为50 6、向导式检索的检索操作顺序是由上到下 7、中共高等教育文献保障体系简称CALIS 8、中文社科报刊数据库检索方法的具体步骤是什么?(论述) (1)系统进入、检索途径的选择和结果的输出 (2)主题词、题名和著者检索途径 (3)分类号检索途径 (4)人名检索途径 (5)刊名检索途径 (6)检索结果的显示、标记、打印和保存 (7)索引词列表的使用方法 (8)历次检索策略的选用 9、最重要的统计工具和学术分析及评价工具是SCI 10、普通检索中检索来源文献的途径可分为:主题词、著者、 来源出版物、著者地址 11、执行检索后命中的记录在屏幕上显示的格式是简单格 式 12、联机公共检索目录简称OPAC 第六章 1、产权主要有哪几种:动产权、不动产权、知识产权 2、著作权:也叫版权,是指文学、艺术、科学作品的作者, 对其创作的作品,依照法律享有的专有权利。 3、以法律的形式保护发明人在一定期限内享有对其发明的专 利权称为专利权 4、专利的特征有:排他性、地域性、时效性 5、专利的类型有:发明专利、实用新型专利、外观设计专利、 集成电路布图设计 6、国内检索专利信息的网站有哪些? (1)中国知识产权网; (2)中华人民共和国知识产权局 (3)中国专利信息网 (4)中国专利信息检索系统 (5)中国专利文摘数据库 (6)中国香港特别行政区知识产权署 7、美国专利与商标办公室简称USPTO 8、对专业人员根据其专业学术水平而授予的一种称号称为 学位 9、学位论文分为哪几种类型?(简答) 一类是理论研究型的,作者通常在搜集、阅读了大量资料之 后,依据前人提出的论点和结论,再通过自己的深入研究或 大量实验,进一步提出自己的新论点和新假说。另一类是调 研综述型的,作者主要以前人关于某一主题领域的科研课题 做出概括性的总结,提出自己独特的论点和新见解。 10、会议文献:是指在各种学术会议上宣读的论文、产生的 记录及发言、论述、总结等形式的文献。 11、会议文献按照出版时间的先后分为:会前文献、会中文 献、会后文献 12、科技报告:对科学、技术研究结果的报告或研究进展的 记录 13、美国政府的四大科技报告分别是:PB报告、AD报告、 NASA报告、DOE报告 14、标准文献:按照规定程序编制并经过一个工人的权威机 构批准的,供在一定范围内广泛而多次使用,包括一整套在 特定活动领域必须执行的规格、定额、规划、要求的技术文 件。 15、标准文献主要分为:国际标准、区域标准、国家标准、 专业标准、行业标准、基础标准 第七章 1、目前INTERNET网络资源主流是网络信息资源 2、网络信息检索的主要特点是什么?(简答) (1)交互式作业方式 (2)用户透明度 (3)信息检索空间的拓宽 (4)友好的用户界面且操作方便 3、网络检索工具共有的特点是交互式作业 4、网络信息检索工具的类型有哪些? (1)按照检索机制划分可分为: 1、分类目录检索工具; 2、搜索引擎检索工具; 3、混合型检 索工具\(2)按照检索的内容划分可分为1、综合型检索工具; 2、特殊型检索工具; 3、多元检索工具; 4、万维网和非万维 网检索工具 5、能够利用多个检索工具进行网络信息查询的检索工具称 为:多元检索工具 6、网络信息检索工具按照检索机制划分可分为:分类目录检 索工具、搜索引擎检索工具、混合型检索工具 7、搜索引擎按照信息内容组织方式划分为按检索词检索和 按分类检索 8、分类目录型检索工具的典型网站是:YAHOO 9、目前网络上适用最多的引擎的检索形式是按检索词检索 10、搜索引擎使用最多的分类是按照主题 11、搜索引擎主要由三个部分构成,分别是:搜索软件、索 引软件、检索软件 12搜索软件,通常称为机器人 13、检索软件决定搜索引擎的检索功能和返回结果的相关性 14机器人是一种计算机的程序 15、在遍历算法中,一般用到的两种方式是深度优先和广度 优先 16、内容索引项可以分为单索引项和多索引项 17、索引技术可以使用集中式索引算法或分布式索引算法 18、输入接口可以分类两种,分别是简单接口和高级接口 19、ALTA VISTA是常用的单个搜索引擎 20、EXCITE提供基本检索和高级检索 21、检索式中,专有名词的首字母必须大写 22、EXCITE突出特点是采用了概念检索 23、EXCITE特有的功能是范例检索 24、便于用户在各个搜索引擎间进行灵活快捷的切换的引擎 称为多元搜索引擎 25、用户的浏览器和多元搜索引擎系统交互的界面称为用户 接口 26、多元搜索引擎实际上是一种网络查询接口工具 27、功能较强的多元搜索引擎一般采用的处理方式是并行和 串行 28、查询操作大多仅支持简单的布尔逻辑操作 29、多元搜索引擎一般可分为并行处理和串行处理 30、常用多元搜索引擎又:MAMMA、SEARCH、 METACRA WLER、ASK JEEVES、PROFUSION 31、提高搜索结果准确性的方法主要有哪些?(简答) (1)运用引擎的词组检索、字段检索和邻接算符等控制检索 的范围 (2)使用有些搜索引擎的REFINE功能 (3)可以使用概念检索和相似页检索 32、基于链接评价的搜索引擎的优秀代表是GOOGLE 33、搜索引擎的研究发展方向是:智能化搜索、个性化搜索、 结构化搜索、垂直化专业领域搜索、本土化搜索 34、结构化搜索:是指充分利用XML等技术使信息结构化, 同时使查询结构化,从而使搜索的准确度大大提高。 35、搜索引擎的发展新趋势是垂直搜索引擎 第八章 1、联机检索系统包括的三个部分是:检索终端、通信网络、 联机检索中心 2、系统拥有的各种数据库称为联机数据库 3、联机系统中数据库的选择方法有:数据库类型、收录范围、 文档结构、记录内容、更新周期 4、DIALOG的特点有哪些?(简答) (1)拥有最多的数据库;(2)拥有的用户数量最多;(3)服 务项目较多;(4)检索模式较多 5、世界上规模最大的综合性商业联机检索系统是DIALOG 6、DIALOG的检索模式有:菜单式检索、命令式检索、目标 检索、WWW检索 7、DIALOG的八种服务方式都是什么?(论述) (1)回溯性检索。利用回溯性检索,系统能够保证满足用户 查全某一课题或者领域方面的文献需要 (2)定题信息检索。DIALOG系统的数据库根据文献信息内 容更新周期或者根据用户检索要求,定期的向用户提供所需 的信息。 (3)商界链接服务。它是系统为满足用户的商业信息需求而 提供的一种菜单式信息检索服务。 (4)电子邮件服务。它是DIALOG系统提供的电子邮件传 递服务。 (5)原文订购服务。它是DIALOG系统提供的联机文献订 购服务 (6)多文档检索服务。它允许用户使用一个检索策略同时检 索多个数据库,而没有必要每检索一个数据库就重复输入检 索指令。 (7)DIALINDEX。它是DIALOG系统为用户提供的数据 库选择工具。 (8)其他服务。DIALOG还提供图像输出服务、报表生成服 务、光盘检索服务、通信软件和图像处理软件服务以及各种 培训服务。 8、DIALOG系统中,检索字段分为基本检索字段和辅助检 索字段 9、保证获得满意检索结果的前提是正确选择数据库 10、选择数据库应该遵循的原则有:内容原则、范围原则、 时效原则、费用原则 11、获取检索结果通常采用的方式有:联机显示、脱机打印、 订购原始文献

相关文档
最新文档