《信息检索导论》课后习题答案
信息检索题库+答案(终极版)

信息检索题库+答案(终极版)四川师范大学信息检索课后作业1.(第1章?单选)联合国教科文组织分别于2003年和2005年召开了以(A)为主题的世界性大会,并发布了《布拉格宣言》和《亚历山大宣言》。
A、信息素养B、信息安全C、信息检索D、信息评价2.(第1章?多选)信息素养的基本构成具体包括(ABCD)A、信息知识B、信息意识C、信息能力D、信息伦理3.(第1章?多选)信息意识具体包括(ABCD)。
A、充分认识到信息在学习、工作和生活中的重要作用,遇到问题时首先应该想到通过信息的获取和利用来解决所遇到的问题;B、对信息具有敏锐的感知力和洞察力,能高效、快速识别有价值的信息,善于从所获取的信息中找出解决问题的思路、线索或方案;C、对信息具有积极的内在需求,善于根据社会需要主动发现自身的信息需求;D、具有通过获取信息强化自身学习能力的想法和观念,遇到不懂的东西能积极主动的通过获取信息找寻答案。
4.(第1章?多选)关于信息素养教育,下列说法正确的是(ABCD)。
A、信息素养教育的第一个层次是拓展视野,使人们知道这个世界上原来还有这么多信息资源。
B、信息素养教育的第二个层次是训练信息获取能力,使人们知道如何获取所需要的信息。
C、信息素养教育的第三个层次是培养信息利用能力,使人们具有敏锐的信息意识和利用信息解决问题的能力。
D、信息素养教育的目标是培养终身学习能力,而信息素养教育自身也是一个终身学习的过程,信息素养教育与终身学习能力是一个相互促进、螺旋提升的关系。
5.(第1章?多选)信息素养是指:基于(ABC),通过确定、检索、获取、评价、管理、应用信息解决所遇到的问题并以此重构自身知识体系的综合能力和基本素质。
A、信息意识B、信息知识C、信息伦理D、信息评价6.(第1章?多选)2000年1月18日,美国大学与研究图书馆协会(ACRL)标准委员会审议通过了《高等教育信息素养能力标准》,其中包含5项标准和22项具体指标。
信息检索题库-答案(终极版)分析

信息检索题库-答案(终极版)分析四川师范大学信息检索课后作业1.(第1章•单选)联合国教科文组织分别于2003年和2005年召开了以(A)为主题的世界性大会,并发布了《布拉格宣言》和《亚历山大宣言》。
A、信息素养B、信息安全C、信息检索D、信息评价2.(第1章•多选)信息素养的基本构成具体包括(ABCD)A、信息知识B、信息意识C、信息能力D、信息伦理3.(第1章•多选)信息意识具体包括(ABCD)。
A、充分认识到信息在学习、工作和生活中的重要作用,遇到问题时首先应该想到通过信息的获取和利用来解决所遇到的问题;B、对信息具有敏锐的感知力和洞察力,能高效、快速识别有价值的信息,善于从所获取的信息中找出解决问题的思路、线索或方案;C、对信息具有积极的内在需求,善于根据社会需要主动发现自身的信息需求;D、具有通过获取信息强化自身学习能力的想法和观念,遇到不懂的东西能积极主信息评价6.(第1章•多选)2000年1月18日,美国大学与研究图书馆协会(ACRL)标准委员会审议通过了《高等教育信息素养能力标准》,其中包含5项标准和22项具体指标。
下列属于5项标准的是(ABCD)。
A、具有信息素养的学生能够确定所需信息的性质和范围B、具有信息素养的学生能够有效和高效地获取所需信息C、具有信息素养的学生能评价信息及其来源并将选取的信息整合入其知识基础和价值体系中D、具有信息素养的学生,不论是个人或作为小组成员,都能够有效地利用信息达到特定的目的7.(第1章•单选)"information literacy "一般翻译为(B)。
A、信息检索B、信息素养C、信息安全D、信息评价8.(第1章•单选)(D)是指在信息的生产、存储、获取、传播和利用等信息活动各个环节中,用来规范相关主体之间相互关系的法律关系和道德规范的总称。
A、信息知识B、信息能力C、信息意识D、信息伦理9.(第1章•单选)(C)是指人类对信息需求的自我意识,是人类在信息活动中产生的认识、观念和需求的总和。
信息检索答案

1、信息素养或素质的具体内容有那些?答:信息素质是指用户在利用以计算机及其网络技术为代表的现代科学技术进行知识学习、成长的过程中,逐步形成的制动参与信息活动、自觉应用信息技术的意识、态度、理念及具备的获取、识别、加工、处理、传递、创造信息的能力和利用信息去解决实践问题的能力。
它包括强烈的信息意识、系统化的信息理念、综合信息能力等内容。
2、信息、知识、情报、文献的概念?文献的组成要素?答:信息的概念:1、信息是人们根据一定目的和需要,把从自然现象和社会现象中搜集的原始材料进行加工、处理,找出其中关系而形成的对象实体。
2、信息是有一定含义的、经过加工处理的、对决策有价值的的数据,即信息=数据+处理3、信息是人们对数据进行系统组织、整理和分析,使其产生相关性,但没有与特定用户行动相关性的实体对象,信息可以被数字化。
知识的概念:知识是指人们在认识世界、改造世界中所获得的认知,包括通过阅读、学习等方式的认知和通过自己或他人的历练所积累的一切经验的总结。
情报的概念:是被人们所利用的信息、被人们感受并可交流的信息。
文献的概念:是记录有知识的一切载体。
文献的组成要素:不但包括现代图书馆的全部馆藏,同时也包括了档案馆、博物馆、声像馆和情报中心收藏的全部馆藏。
3、信息、信息资源包括那些类型?答:1)信息的类型:从产生信息的客体的性质来分,可分为自然信息(瞬时发生的声、光、热、电、形形色色的天气变化、缓慢的地壳运动、天体演化……)、生物信息(生物为繁衍生存而表现出来的各种形态和行为,如遗传信息、生物体内信息交流、动物种群内的信息交流)、机器信息(自动控制系统)和(人类)社会信息。
以信息所依附的载体为依据,可分为文献信息、口头信息、电子信息、生物信息等2)信息资源类型:根据存储媒介不同,信息资源可以划分为印刷型信息资源、电子信息资源、数字信息资源和多媒体信息资源。
4、文献有那些类型?将文献划分成这些类型的依据是什么?答:1)根据载体材料、存储技术、和传递方式划分可划分为:印刷型、缩微型、试听型和机读型文献信息源2)根据加工程度的不同划分可分为:一次文献信息源、二次文献信息源、和三次文献信息源3)根据文献信息源的内容划分可以分为:图书、期刊、报纸、科技报告、政府出版物、会议文献、专利文献、学位论文、标准文献、档案文献、产品样本5、信息(文献)检索的方法与途径,详细论述检索步骤?答:1、分析研究课题,明确检索要求:分析课题的主要内容、确定课题的文献类型、确定检索时间范围、分析用户的检索评价要求2、选择检索工具:根据检索课题的要求,选择最能满足检索要求的检索工具书,不同的资料类型就应该选用不同的数据库3、确定检索策略:确定检索途径、制定检索策略4、调整检索方案:确定了具体的检索方法之后,就要利用所用数据库,在一定的年代范围内具体查找,以获得文献线索。
《信息检索技术》书中答案

《信息检索技术》书后习题及参考答案(部分)第1章绪论【综合练习】一、填空题1.文献是信息的主要载体,根据对信息的加工层次可将文献分为_________文献、__________文献、___________文献和___________文献。
2.追溯法是指利用已经掌握的文献末尾所列的__________,进行逐一地追溯查找_________的一种最简便的扩大情报来源的方法。
3.用规范化词语来表达文献信息__________的词汇叫主题词。
主题途径是按照文献信息的主题内容进行检索的途径,利用能代表文献内容的主题词、关键词、叙词、并按字顺序列实现检索。
4.计算机信息检索过程实际上是将___________与____________进行对比匹配的过程。
5.无论是手工检索还是计算机检索,都是一个经过仔细地思考并通过实践逐步完善查找方法的过程。
检索过程通常包含以下几个步骤_________、__________、__________、__________、_________。
6.检索工具按信息加工的手段可以分文__________、____________、___________。
7.《中国图书馆图书分类法》共分___________个基本部类,下分________个大类。
8.索引包括4个基本要素:索引源、___________、___________、和出处指引系统。
答案1.零次,一次,二次,三次2.参考文献,引文3.内容特征4.检索提问词,文献记录标引词5.分析课题,选择检索工具,确定检索途径及检索式,进行检索,获取原文6.手工检索工具,机械检索工具,计算机检索工具7.五,228.索引款目,编排方法二、判断题1.在检索信息时,使用逻辑符“AND”可以缩小收缩范围。
()2.逆查法是由近及远地查找,顺着时间的顺序利用检索工具进行文献信息检索的方法。
()3.按编制方法划分,信息检索工具可以分为:手工检索工具、机械检索工具、计算机检索工具。
信息检索题目(含答案)

信息检索题目(含答案)2013 年(秋)《信息检索》练习单选题(每题 1 分,共 45 题, 45 分)1.计算机中使用的0 与 1 的二进制代码是(C)A.自然信息B.生物信息C.机器信息D.人类信息2.以下( B)不是信息的基本要素。
A.载体B.数据库C.信源D.信宿3.国际标准书号中地区号为7,代表其是(B)出版社出版的图书。
A.美国B.中国大陆C.俄语系国家D.法语系4.以下( D)不是信息的特征。
A.共享性B.价值型C.时效性D.不可扩充性5.( A )使用的是http 协议。
A.WWW 网络资源B.FTP 信息资源C.TELNET 信息资源D.用户服务组资源6.( B )使用的是ftp 协议。
A.WWW 网络资源B.FTP 信息资源C.TELNET 信息资源D.用户服务组资源7.分类法用( A )作为文献内容标识和检索标识。
A.分类号B.词语C.阿拉伯数字D.英文字母8.主题法用( A )做描述文献主题的标识和检索标识。
正确答案: BA.分类号B.词语C.阿拉伯数字D.英文字母9.关键词语言属于( B )正确答案: AA.自然语言B.标题词语言C.叙词语言D.分类语言10.以下族性检索功能最强的是(A)A.分类途径B.文献名途径C.著者途径D.主题途径11.(D )是从参考文献着手来查找文献的方法。
A.顺查法B.倒查法C.抽查法12.一个截词符代表多个字符指的是(D)正确答案: CA.后截词B.中截词C.无限截词D.有限截词13.在布尔逻辑检索技术中,用(B)表示在检索结果中只需包含A 或者B 即可。
正确答案: DA. A not BB. A and BC.A-BD. A or B14.( B )之前,必须输入一个空格。
正确答案: CA.与运算B.或运算C.非运算D.异或运算15.ISBN 中最后一个数字代表(C)。
正确答案: DA.地区码B.出版社代码C.书序号D.校验码16.( B )属于文献的外表特征。
信息检索题目(含答案)概述

A.分类号
B.词语
C.阿拉伯数字
D.英文字母
8.主题法用(A)做描述文献主题的标识和检索标识。
正确答案:B
A.分类号
B.词语
C.阿拉伯数字
D.英文字母
9.关键词语言属于(B)
正确答案:A
A.自然语言
B.标题词语言
C.叙词语言
D.分类语言
10.以下族性检索功能最强的是(A)
A.分类途径
B.文献名途径
C.著者途径
D.主题途径
11.(D)是从参考文献着手来查找文献的方法。
A.顺查法
B.倒查法
C.抽查法
D.追溯法
12.一个截词符代表多个字符指的是(D)
正确答案:C
A.后截词
B.中截词
C.无限截词
D.有限截词
13.在布尔逻辑检索技术中,用(B)表示在检索结果中只需包含A或者B即可。
正确答案:C
A.书名
B.主题词
C.丛书名
D.出版社
37.在我校图书馆的OPAC中查询“《傲慢与偏见》”应该选择检索途径:(A)
A.书名
Bபைடு நூலகம்主题词
C.丛书名
D.责任者
38.下面哪一项不是工具书的共同特性(A)
A.必读性
B.概括性
C.查考性
D.易检性
39.我国现存最大的类书是:(A)
A.《古今图书集成》】
A.专利文献
B.学位论文
C.会议文献
D.目录
20.下列哪种属于三次文献(A)
正确答案:C
A.标准文献
B.学位论文
C.综述
D.目录
21.CJFD是(D)。
信息检索课后答案

作业习题《信息检索》思考题及参考答案(根据新编教学大纲内容选答)第一讲信息检索基础知识1.简述大学图书馆的地位和作用。
大学图书馆是大学的文献信息中心,是为教学和科研服务的学术性机构,是学校信息化和社会信息化的重要基地。
高等学校图书馆的工作是学校教学和科学研究工作的重要组成部分。
现代化的大学图书馆与学校高水平的教师队伍、先进的教学实验设备,共称为现代化大学的三大支柱。
大学图书馆既是是学校的文献信息中心又是学习资源中心,是培养人才的重要基地,是自学深造的场所,是学生构建合理知识结构的第二课堂。
2.简述信息、知识、文献的概念及相互关系。
答:信息的概念:一般来说,信息是指与客观事物相联系,反映客观事物的运动状态,通过一定的物质载体被发出、传递和感受,对接受对象的思维产生影响并用来指导接受对象的行为的一种描述。
从本质上说,信息是反映现实世界的运动、发展和变化状态及规律的信号与消息。
知识的概念:知识是人类通过信息对自然界、人类社会以及思维方式与运动规律的认识和掌握,是人的大脑通过思维重新组合的系统化的信息的集合。
知识是人类在改造客观世界的实际中所获得的认识和经验的总和,是信息的一部分,是一种特定的人类信息。
文献的概念:文献是记录有知识的一切物质载体。
具体地说是用文字、图形、符号、声频、视频等技术手段记录人类知识的一切物质载体。
信息、知识和文献之间的关系是:信息是事物发出的消息,信息经过人脑加工形成知识。
只有将自然现象和社会现象的信息经过加工,上升为对自然和社会发展客观规律的认识,这种再生信息才构成知识。
知识信息被记录在载体上就形成文献。
3.何谓信息资源?网络信息资源有何特点?所谓信息资源,就是信息的来源。
各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源。
网络信息资源具有数量大、类型多、多媒体、非规范、跨时间、跨地域、跨行业、多语种等特点。
正式出版物和非正式信息交流交织在一起,使传统的人类信息交流链的格局被打破,各方在网络上既可以是信息的生产者、发布者,也可以是传播者和使用者,对学术交流环境和信息利用产生了深刻的影响。
信息检索练习题及答案(五篇范文)

信息检索练习题及答案(五篇范文)第一篇:信息检索练习题及答案《信息检索》练习题第一章练习一、名词解释1.信息——是世界上一切事物的状态和特征的反映,是用文字、数据或信号等形式,通过一定的传递和处理,来表现各种相互联系客观事物在运动变化中所具有特征内容的总称。
2.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。
3.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。
二、填空题1.信号只是信息的(),信息是信号所载荷的()。
载体、内容2.现实的信息资源依据传递信息的载体和表述方式的不同,可以划分为(),(),(),(),()。
口语信息资源、体语信息资源、文献信息资源、实物信息资源、网络信息资源3.口语信息资源、体语信息资源和实物信息资源,通过计算机技术的转化,成为(),如果有长期开发的价值,往往会转化成()。
网络信息资源、文献信息资源4.()是记录有信息和知识的一切有形载体,是将知识用文字、符号、图像、音频、视频等方式记录在一定的固态物质载体的结合体。
文献5.期刊按内容和性质划分,可以分为(),(),()。
学术性期刊、检索性期刊、其他类型期刊6.()是指未经出版发行的或未以公开形式进入社会交流的最原始的文献。
零次文献三、判断题1.情报只是一类专门的信息,是信息的一个子集。
()2.网络信息资源也称虚拟信息资源,是指以数字化形式记录的,以多媒体形式表达的,存储在网络计算机磁介质、光介质以及各类通讯介质上的。
()3.机读型文献是以磁性材料为存储介质,采用计算机技术、磁性存储技术、激光技术,以键盘输入、文件拷贝、刻录或光学扫描等方法作为记录手段,通过计算机处理而产生的一种新的文献。
()4.缩微型文献是以印刷型文献为母本,以感光材料为载体,采用光学缩微技术将文字或图像记录存储在感光材料上而形成的文献。
()5.声像型文献是一种以磁性和光学材料为载体,将声音和图像记录存储在磁性或光学材料上的非文字形式的文献。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《信息组织与检索》作业答案第一章布尔检索习题1-2考虑如下几篇文档:文档1 breakthrough drug for schizophrenia文档2 new schizophrenia drug文档3 new approach for treatment of schizophrenia文档4 new hopes for schizophrenia patientsa. 画出文档集对应的词项—文档矩阵;b. 画出该文档集的倒排索引(参考图1-3中的例子)。
Term-Documentmatrix:1 2 3 4approach 0 0 1 0breakthrough 1 0 0 0drug 1 1 0 0for 1 0 1 1hopes 0 0 0 1new 0 1 1 1of 0 0 1 0patients 0 0 0 1schizophrenia 1 1 1 1treatment 0 0 1 0Inverted Index:approach -> 3breakthrough ->1drug ->1->2for ->1->3->4hopes ->4new ->2->3->4of ->3patients ->4schizophrenia ->1->2->3->4treatment >3注意:倒排索引中的词表(dictionary)和每个词项的倒排列表(posting list)需要排序,便于查找。
这里我们暂不考虑词的正规化处理(如hopes->hope)。
补充习题1写出AND查询的伪代码面向过程风格的伪代码:给定两个指针p1和p2,分别指向两倒排列表list1和list2(链表实现)的首元素;令docId(p1)表示p1所指向的元素的docId查询结果存放在answer列表里。
这里应用了“化归”思想(将新问题转化归为旧问题来解决)。
这里,比较两排序列表的首元素,排除较小的docId(不可能有匹配)后,我们构造出新的剩余列表,再次进行两列表的首元素的比较。
While p1 != null AND p2 != nullIf p1->docId==p2->docId //对两(剩余)列表的首元素进行比较insert(answer, p1);p1=p1->next;//构造新的剩余列表,迭代执行p2=p2->next;//Else if p1->docId < p2->docIdp1=p1->next;//p1->docId不可能有匹配;构造新的剩余列表Elsep2=p2->next;//p2->docId不可能有匹配;构造新的剩余列表End●面向对象风格的伪代码:注:为一个数据结构(对象)定义方法,通过方法操作自己的内部数据(List对象里隐含包含了一个成员变量,它是真正的链表或变长数组)。
While list1.currentItem() != null AND list2.currentItem() != nullIf list1.currentItem().getDocId() == list2.currentItem().getDocId()answer.insert(list1.currentItem());list1.moveToNext();list2.moveToNext();Else if list1.currentItem().getDocId() < list2.currentItem().getDocId() list1.moveToNext();Elselist2.moveToNext();End习题1-10写出OR查询的伪代码●面向过程风格的伪代码:给定两个指针p1和p2,分别指向两倒排列表list1和list2(链表实现)的首元素;令docId(p1)表示p1所指向的元素的docId;查询结果存放在answer列表里。
While p1 != null AND p2 != nullIf p1->docId == p2->docIdinsert(answer, p1);p1=p1->next;p2=p2->next;//构造新的剩余列表,迭代执行Else if p1->docId < p2->docIdinsert(answer, p1);p1=p1->next;//构造新的剩余列表,迭代执行Elseinsert(answer, p2);p2=p2->next;//构造新的剩余列表,迭代执行EndWhile p1 != null//条件为真时,加入list1的剩余元素(此时list2已遍历到结尾)insert(answer, p1);p1=p1->next;ENDWhile p2 != null//条件为真时,加入list2的剩余元素(此时list1已遍历到结尾)insert(answer, p2);p2=p1->next;END面向对象风格的伪代码:While list1.currentItem() != null AND list2.currentItem() != null If list1.currentItem().getDocId() == list2.currentItem().getDocId() answer.insert(list1.currentItem());list1.moveToNext();list2.moveToNext();Else if list1.currentItem().getDocId() < list2.currentItem().getDocId() answer.insert(list1.currentItem());list1.moveToNext();Elseanswer.insert(list2.currentItem());list2.moveToNext();EndWhile list1.currentItem() != nullanswer.insert(list1.currentItem());list1.moveToNext();ENDWhile list2.currentItem() != nullanswer.insert(list2.currentItem());list2.moveToNext();END补充习题2若一个文集有1000篇文档,有40篇是关于信管专业建设的。
我的信息需求是了解信管专业的专业建设情况,用某搜索引擎在这个文集上搜索,查询词为“信管”,搜出100篇包含“信管”的文档,这其中有20篇是信管专业建设方面的,其它80篇是关于信管的其它情况。
请问该查询的正确率和召回率是多少正确率=20/100=0.2召回率=20/40=0.5第二章词项词典及倒排记录表习题2-1a.在布尔检索系统中,进行词干还原从不降低正确率。
错;相当于扩充出同一个词干表示的多个词,会降低正确率。
b.在布尔检索系统中,进行词干还原从不降低召回率。
对。
c. 词干还原会增加词项词典的大小。
错。
d. 词干还原应该在构建索引时调用,而不应在查询处理时调用。
错;应同时做才能保证索引中和查询词的匹配。
习题2-2请给出如下单词的归一化形式(归一化形式也可以是词本身)。
a. ’Cos -> cosb. Shi’ite -> shiite('是隔音号)c. cont’d ->contd(contd. 可表示contained 包括;continued 继续)d. Hawai’i ->hawaiie. O’Rourke ->orourke习题2-3如下词经过Porter词干还原工具处理后会输出同样的结果,你认为哪对(几对)词不应该输出同样的结果?为什么?a. abandon/abandonmentb. absorbency/absorbentc. marketing/marketsd. university/universee. volume/volumes按Porter词干还原算法,这几组词都可以被还原为相应的词干。
但是这里问的是哪些组做词干还原不合适,原因是某组的两个词虽然来源于同一个词干,但是它们的意思不同,如果做词干还原处理会降低正确率。
c组不做词干还原。
marketing表示营销,market表示市场。
d组不做词干还原。
university表示大学,universe表示宇宙。
习题2-6对于两个词组成的查询,其中一个词(项)的倒排记录表包含下面16个文档ID:[4,6,10,12,14,16,18,20,22,32,47,81,120,122,157,180]而另一个词(项)对应的倒排记录表仅仅包含一个文档ID:[47]请分别采用如下两种策略进行倒排记录表合并并计算所需要的比较次数,同时简要地说明计算的正确性。
a.使用标准的倒排记录表。
比较:(4,47), (6,47), (10,47), (12,47), (14,47), (16,47), (18,47), (20,47), (22,47),(32,47), (47,47)。
共比较11次。
b.使用倒排记录表+跳表的方式,跳表指针设在P1/2处(P是列表长度)。
P=16。
也就说第一个列表的跳表指针往后跳4个元素。
下图蓝色表示安装了跳表指针的元素,其中120跳到180上。
[4,6,10,12,14,16,18,20,22,32,47,81,120,122,157,180]比较:(4,47), (14,47), (22,47), (120,47), (32,47), (47,47)。
共比较6次。
习题2-9下面给出的是一个位置索引的一部分,格式为:词项: 文档1: (位置1, 位置2, …); 文档2: (位置1, 位置2, …);angels: 2: (36,174,252,651); 4: (12,22,102,432); 7: (17);fools:2: (1,17,74,222); 4: (8,78,108,458); 7: (3,13,23,193);fear:2: (87,704,722,901); 4: (13,43,113,433); 7: (18,328,528);in:2:(3,37,76,444,851); 4: (10,20,110,470,500); 7: (5,15,25,195); rush:2:(2,66,194,321,702); 4: (9,69,149,429,569); 7: (4,14,404); to:2:(47,86,234,999); 4: (14,24,774,944); 7: (199,319,599,709); tread:2: (57,94,333); 4: (15,35,155); 7: (20,320);where:2: (67,124,393,1001); 4: (11,41,101,421,431); 7: (16,36,736);那么哪些文档和以下的查询匹配?其中引号内的每个表达式都是一个短语查询。