(整理)信息资源检索与应用-课后习题答案.

(整理)信息资源检索与应用-课后习题答案.
(整理)信息资源检索与应用-课后习题答案.

参考答案

第1章

一、选择题

1. A

2. D

3. C

4. D

5. B

二、填空题

1. 印刷型缩微型视听型

2. 信息内容信息内容以及与信息内容相关的信息技术、人员和设施

3. 一次信息资源信息

4. 存贮密度大、体积小

5. 文献检索数据检索

6. 直接检索间接检索

三、问答题

1.

(1)图书:大部分科技图书均可以提供某一科学领域的较为全面的知识或研究成果,作者通过对相关的技术、经验等进行归纳,可以使读者对于某一学科领域具有一个全面的了解。

(2)期刊:期刊又称为杂志,是指具有固定名称,并定期出版的连续性出版物。除了传统意义上的期刊外,目前在互联网中有大量的电子期刊。

(3)科技报告:科技报告又称为技术报告,是指研究人员对某一专题进行研究的过程中根据进展情况撰写的正式的报告。

(4)会议文献:是指在各种学术会议上提交并讨论的学术论文。

(5)专利文献:是指将科技信息和法律信息融为一体的,具有明显的知识产权特征的文献资料。

(6)学位论文:是指高等学校或研究机构的毕业生为取得某种学位而撰写并提交的学术论文,是与学位制度相关的学术论文,分为博士论文、硕士论文和学士论文。

(7)标准文献:是指人们在进行科学研究和产品生产过程中所遵循的共同的技术依据和原则,是经过权威机构验证和批准的标准化工作成果。

(8)政府出版物:又称官方出版物,是指各国政府部门和所属机构出版发行的文献,其内容比较丰富,一般可以分为行政性出版物和科技性出版物两类。

(9)产品资料:是指厂商为推销自己的产品而印发的宣传性出版物,一般包括产品样本、说明书、产品目录和厂商介绍等。

(10)报纸:报纸以报道新闻和评论为主,信息量大、实时性强、且传播面比较广,具有很好的通俗性,是重要的社会舆论工具和信息源。

2. 广义的信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找

出有关的信息过程,所以它的全称又叫“信息的存储与检索。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。

3.

(1)调查研究,立足创新;

(2)拓宽知识面,改善知识结构;

(3)启迪创造性思维;

(4)提高自学和独立工作能力。

第2章

一.选择题

1. A

2. C

3. D

4. A

5. C

二.填空题

1. 整个检索系统使用效果服务质量

2. 语词题词语言单元词语言叙词语言关键词语言

3. 循环查找法分段查找法

4. 表征有序的信息特征

5. 加工整理编辑

三.问答题

1. 信息检索的基本原理是:通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。其中存储是为了检索,而检索又必须先进行存储。

2. 检索语言是用来描述文献内容特征、外表特征和表达情报提问的一种人工语言。检索语言的种类很多,按其构成原理一般可分为分类语言(又称分类法)、主题语言、代码语言和引文语言四种。其中,分类语言又有体系分类语言、组配分类语言和混合分类语言的区别。主题语言又有标题词语言、单元词语言、叙词语言和关键词语言的区别。按其包括的学科范围,检索语言又可分为综合性语言和专业性语言。按其标识的使用方法,还可以分为先组式检索语言(文献标识在编表时就固定组配好)和后组式检索语言(文献在检索时才组配起来)。

3. 在检索文献信息时,要根据具体要求来选择不同的检索方法,以达到省时省力和查全的目的。主要的检索方法有一下几种:直接查找法、间接查找法、引文追溯法和综合法。

4. 进行信息检索,无论是用手工检索方法还是用计算机检索方法,其检索程序都是一样的,一般来说都有以下几个基本程序:分析课题、制定检索策略,选择检索工具,确定检索途径,选择检索方法,查找信息线索,索取原始文献。以上六个步骤只是检索文献的一般程序,并非每个检索课题都要经过以上几个步骤,有的由于对检索课题和所需检索工具比较熟悉,则可跨越几个步骤,直接从有关书刊中获取文献。当研究人员花了很长时间仍查不到所需文献时,可以求助于图书馆的参考咨询人员。在规模较大的图书馆,一般都有专职的参考咨询,检索服务人员,他们的认为就是向读者介绍文献的查找方法,帮助读者解决文献检索中存在的困难和

问题。

5. 目前可供人们使用的检索工具有很多,不同的检索工具各有特点,可以满足不同的信息检索的需求。检索工具有不同的分类方法:按加工文献和处理信息的手段不同可分为:手工检索工具和机械检索工具。按照载体形式不同可分为:书本式检索工具,磁带式检索工具,卡片式、缩微式、胶卷式检索工具。按照著录格式的不同可将检索工具分为以下四种类型:目录型检索工具,题录型检索工具,文献型检索工具,索引型检索工具。

6. 检索工具的基本功能是存贮和检索文献,主要体现在四个方面:一是根据学科和主题集中文献。避免了直接检索的分散性、盲目性和偶然性,从而提高了文献的查全率和查准率。二是缩短了检索过程,节省了查找时间。检索者不必去阅读大量分散的原始文献,只需反映原文状况的具体著录事项,因而提高了检索速度和效率。三是便于按分类或主题等不同的检索途径,灵活地从多个角度进行检索。四是有助于消除语言文字障碍。

四、上机操作题

确定使用哪种检索工具,查看使用说明,根据查找课题的学科(计算机学科和数学学科中的遗传算法),对照目录表或分类表,检索相关文献。或利用主题、著者、机构等已知条件,查阅相应的辅助索引,再利用索引提供的文献线索,检索到所需的正文内容,直至获取原始文献。

第3章

一、选择题

1. C

2. B

3. D

4. D

5. B

二、填空题

1. 信息内容、物质载体信息符号

2. 图书、期刊、会议录

3. 正表、附表、说明和索引

4. 《汉语主题词表》,《中国分类主题词表》,《美国国会图书馆主题词表》

5. 硬件、软件、数据库

6. 一次文献

7. 《中国标准化年鉴》、《中国国家标准汇编》、《国家标准和部标准目录》、《中国国家标准文献数据库》

8. 绝密、秘密、非密级限制发行、解密、非密公开

9. 学士论文、硕士论文、博士论文

10. 关键词题目索引,著者人名索引

三、问答题

1.

(1)文献信息检索是获取知识的捷径。掌握文献信息检索方法与技能,可以帮助人们快、准、全地获取所需知识,最大限度地节省查找时间,使文献信息得以充分的利用。

(2)文献信息检索是科学研究的向导。要进行有价值的科学研究,必须依赖文献检索,全

面获取相关文献信息,及时了解各学科领域出现的新问题、新观点,以确定的研究起点和研究目标。

(3)文献信息检索是终身教育的基础。科技的迅速发展使知识的总量呈指数增长,而知识的陈旧速度也明显加快,这就要求人们具有终身教育的能力,这种能力在很大程度上就是获取新知识的能力,就是对新知识的敏感力和接受力,因而必须掌握文献信息检索的方法。

2. 主要的检索途径有四种:

(1)笔画检索。《全书》各卷均有\"条目汉字笔画索引\",供不熟悉汉语拼音或不熟悉个别汉字读音的读者使用。

(2)音序检索。《全书》虽分类分卷出版,但每一学科(一卷或数卷)所有条目则按汉语拼音字母顺序排列,是检索的直接入口处.

(3)分类检索。《全书》各卷正文前均有\"条目分类目录\"和介绍本学科内容的总论文章,供从学科分类角度检索条目。

(4)内容检索。《全书》各卷末均附\"条目内容索引\",这是全卷条目和条目内容的主题分析索引,它将全部条目以及条目释文中隐含的知识主题(如人物、著作、流派、专有名词术语等)集中起来按音序排列,注明出处。利用该索引既可查到某一条目,也可查找隐藏于某一条目中的内容。《全书》还设有一些辅助检索途径,如\"条目外文索引\"\"彩图插页目录\"\"参考书目\"\"外国人名译名对照表\"等。《全书》设有《总索引》一卷。该索引将73卷中所有条目标题集中,统一按汉语拼音字母顺序并辅之以汉字笔画、起笔笔形顺序排列。条目标题后注明所在的卷名和页码。利用《总索引》可以查找《全书》中的任一条目.

3. 主要可以分两大类,一类为图书馆或文献收藏单位的馆藏书目也叫图书馆目录(Catalog)和另一类书目可称为非藏书目录,主要有国家书目(收集一个国家所出版的图书)、出版社书目、书商书目及各种各样的推荐书目等. 另外,书目还可以从载体来分。亦可以把它们分成两大类,机读目录(Machine Readable Catalog,简称MARC)和非机读目录。

4.

(1)类目与主题完全对应的关系。

(2)一个类目包含多个主题。

(3)一个主题包含多个类目。

5.

(1)IEEE/IEE Electronic Library 《IEL全文数据库》。

(2)SDOS《Elsevier Science电子期刊全文数据库》。

(3)Springer Link 《Springer全文电子期刊》。

(4)Kluwer Online Journals 《Kluwer电子期刊》。

(5)WorldSciNet。

(6)ACM Digital Library。

(7)ASCE 电子期刊。

(8)ASME 电子期刊。

(9)UMI Dissertation等。

6.

(1)美国《科学引文索引》SCI。

(2)美国《工程索引》EI。

(3)美国《化学文摘》(Chemical Abstracts,CA。CA报道的化学化工文献量占全世界化学化工文献总量的98% 左右,是当今世界上最负盛名、收录最全、应用最为广泛的查找化学化工文献大型检索工具。

(4)英国《科学文摘》(Science Abstracts,SA;或INSPEC)

——《物理文摘》(Section A- Physics Abstracts,PA);

——《电子与电气文摘》(Section B- Electrical Engineering & Electronics Abstracts,EEA);

——《计算机与控制文摘》(Section C- Computers and Control Abstracts,CCA);

——《信息技术》(Information Technology,IT)。

(5)俄罗斯《文摘杂志》(Abstract Journals,AJ)或РЖ(共220余卷),被称为世界三大综合检索统。

(6)日本《科学技术文献速报》(Corrent Bulletin on Science Technology,CBST;为印刷本,共12分册)。现扩充为大型数据库日本科学技术情报中心(Japan Information Center Science and Technology,JICST)。被称为世界三大综合检索系统。

7. 是科学引文索引数据库;引文索引是基于论文之间引证与被引证的联系而建立的,文献之间的这种引证与被引证关系在很大程度上反映了作者的研究思路以及研究之间的内在联系;SCI是世界范围内最权威的科技文献的引文工具。

8. 《中国学位论文题录数据库》网络版,学位论文全文库(万方),CALIS 学位论文库,中国优秀博硕士学位论文题录数据库,网上大学图书馆主页的联机公共检索目录等.

四、上机操作题

1. 参考步骤:

(1)按照超星图书馆的网址进入超星图书馆。

(2)在超星图书馆的各搜索项中输入所要搜索的书名或作者名等。

(3)点击“搜索”按钮。

(4)在搜索结果中查找是否有所要查找的书籍,若没有再进行二级搜索。

2. 参考步骤:下面以搜索“城市建设中的雕塑艺术”为例作解答:

(1)进入广东工业大学的图书管首页(http://202.116.140.6/webaLibrary/)如图A-1所示。

图A-1 广东工业大学图书管首页

(2)点击“中国期刊网”,直接进入“中国期刊网”首页,如图A-2所示。

图A-2 中国期刊网

(3)在“搜索项”中选择“题名&关键词&摘要”,在“检索词”一栏输入“城市建设”,时间选择从2000年到2006年,范围是:全部期刊;“匹配”项选择“模糊”,其他默认,好了可以点击“检索”开始搜索了。其检索结果如图A-3所示。

图A-3 搜索结果

(4)在搜索结果中,再来进行二级搜索,在搜索词一栏中输入“雕塑艺术”,选择“在结果中检索”项,如图A-4所示。

图A-4 二级检索

(5)点击“检索”,其检索结果如图A-5所示,完成搜索。

图A-5 二级检索结果

第4章

一、选择题

1. D

2. B

二、填空题

1. 书目、索引、百科全书、年鉴、指南、名录、图册

2. 《汉语大字典》、《汉语大词典》、《韦氏三版新国际英语词典》

3. 《中国统计年鉴》、《中国人口统计年鉴》

4. 综合性百科全书、专业性百科全书、国际性、地域性、宗教性

三、问答题

1. 人们在日常工作、学习等方面遇到各种各样的疑难问题,需要尽快地找到答案,如对某概念、缩写词或其他符号的含义不清楚,想核实某份资料等,都可利用工具书解决问题、得到答案。工具书是提供事实与数据的信息源,熟悉并善于利用他们来解决问题是非常重要的。

2.

(1)资料简明详实、及时、精练可靠。

(2)以年为限连续出版,资料具有连续性,借助它可了解有关事务发生、发展的趋势,能更新不便经常修订的巨型出版物,例如百科全书年鉴。

(3)具有索引功能。多数年鉴注明资料的来源,读者可据此迅速地查到原文。

(4)通常提供名录性人物传记资料。

(5)可供读者浏览。

3.

(1)综合性。

(2)国别或地区性的。

(3)专业或职业性的。

每类通常又可以分为回溯性和当代人物性两种。此外,在词典、百科全书、年鉴、手册等工具书都可查到人物传记。

四、上机操作题

1. 百科全书检索。

检索课题:人物名称,阿格纽(Agnew,Spiro T(heodore))

检索方法:《简明不列颠百科全书》

(1)《简明不列颠百科全书》第十册是全书的索引,分“条目标题汉字笔画索引”和“条目标题外文与汉文对照索引”。可以先通过这两个索引来进行条目检索。

(2)通过索引的条目检索,检索结果同为“1—65”,即第一卷,第65页。

(3)在第一卷,第65页有该人物的图像和文字简介:

阿格纽(Agnew,Spiro T(heodore))(1918.11.9-)美国第三十九界副总统。巴尔的摩大学毕业。1947年起当律师。1962年任巴尔的摩县长,1967年任马里兰州州长。1968年被题名为副总统候选人。由于犯有敲诈、受贿、逃避所得税等罪行,1973年辞去副总统职务,罚款一万美元。

2. 名录检索。

检索课题:上海自然博物馆内高级专家名单

检索方法:《上海高级专家名录》第一卷

《上海高级专家名录》是汇集、介绍全上海各类高级专业技术人员个人情况的大型人名词典。该工具书按笔画顺序、分系统排列单位名称,卷末附有姓名、单位名称索引。全书共四卷。

在该书的目录中,按系统寻找“科技系统”内有“上海自然博物馆”类目。

在155页上,上海自然博物馆条目下,详细列有各专家的名单和生平简介。

也可以在人名索引中检索。按人名的姓的拼音顺序检索,然后按指引的页码就可以检索到该人物的具体情况。

第5章

一、选择题

1. D

2. C

二、填空题

1. 批处理、联机检索、网络系统

2. 人机接口、信息通道、存储检索用计算机

3. 联机信息检索系统、光盘信息检索系统、网络化信息检索系统

4. 用来存贮声音信息的激光唱盘、数字

5. 数据、硬件

三、问答题

1. 计算机信息检索就是指人们在计算机检索网络或者终端上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息,然后再由终端设备显示和

打印的过程。

2. 计算机信息检索系统的分为联机信息检索系统、光盘信息检索系统、网络化信息检索系统。

a. 联机检索系统就是由一台主机带多个终端的信息检索系统。这种系统具有分时的操作能力。能够使许多相互独立的终端同时进行检索。

b. 光盘检索是光盘数据库与微机结合,将信息存贮在光盘(主要是CD-ROM)等载体上,采用微型计算机进行检索。

c. 网络化信息检索是指用户使用自己的计算机通过电信系统与网络相连获取信息的一种检索方式,网络化信息检索系统与联机信息检索系统所不同的是用户和服务器之间是同等关系而不是主从关系,在遵守共同的通信协议的前提下同一个客户可以访问多个服务器,一个服务器也可被多个客户访问。

区别:使用联机检索可直接利用国内外大量规范化的专业数据库进行科技信息、经济信息以及商业信息的检索,迅速地检索到相关的信息,由于检索分辨率高,有较高的查全率和查准率。但联机费用较高,需要较高和较熟练的检索技术。

使用光盘信息检索最大的好处是:用户可以反复进行检索、筛选直至达到最佳检索效果为止,而不必担心检索时间过常,花费大量费用,光盘检索操作方便,凡是有电脑操作知识的人,都能够通过光盘检索获得自己所需要的信息。与联机检索和网络化相比,光盘内容的更新时间稍长一点。

使用网络化信息检索,信息资源丰富,可以得到最新的大量数据、动态以及多媒体技术信息,是目前人们最乐意接受的检索方式,通过网络人们不仅能得到自己所需要的文学、体育、娱乐、商品、企业等等大量的全新的信息;还可以免费得到很多科技、经济、商业等方面信息;还可以通过注册的形式,进入多个专业联机数据库进行检索,可检索到各个方面的综合性信息,通讯费用也低,但检索速度慢,查全率和查准率底下,检索效果差,信息污染也没有得到应有控制。

3.

(1)《中文科技期刊数据库》

(2)《中国学术期刊》(光盘版)

(3)《中文社科报刊篇名数据库》

(4)《中国科学引文数据库》

(5)《复印报刊资料》系列光盘数据库

(6)《计算机应用文献数据库》

(7)《中国企业、公司及产品数据库》(CECDB)

(8)《中国贸易与投资指南》(China Trade & Investment Guide)

(9)《中国专利数据库》

(10)《中国适用技术成果数据库》

(11)《人民日报》索引光盘

(12)《中国法律法规数据库》

4.

(1)DIALOG美国DIALOG是世界上处于领导地位的国际性联机检索服务系统,始

建于1966年,于1972年开始商业性经营,提供综合性联机信息。

(2)OCLC OCLC全称为Online Computer Library Center,即图书馆联机计算机中心,总部在美国俄亥俄州都伯林,是世界上最大的提供文献信息服务的机构之一。

(3)Ei Village的全称是Engineering Information Village,即工程索引村。Ei Village 是美国工程信息公司(Engineering Information,Ei)的产品。该公司建于1884年,是世界上最早的工程文献机构,其总部在美国纽约曼哈顿,现已加入荷兰Elsevier Science 公司。

Ei Village是一个基于Web方式的工程信息联机服务中心,它力图将世界上所有重要的工程信息汇集成在一起,并实现一步到位的桌面服务。它所能提供的信息资源有著名的《工程索引》及其他40多个数据库,包括专利和标准以及产品目录,这些资源分布在世界各地的1600个网络站点。

四、上机操作题

1. 第一步:先进入《中国期刊网》界面如图A-6所示。

图A-6

第二步:选择需要进入的数据库,如图A-7所示。

图A-7

第三步:输入相关的关键词以及年份,点击检索;如查找“信息集成技术”,如图A-8所示。

图A-8

第四步:查看相关的论文,如图A-9所示。

图A-9

第6章

一、选择题

1. D

2. A

3. B

4. C

5. A

二、填空题

1. 基于人工建立的搜索引擎,基于Internet搜索软件产生的Web索引,元搜索引擎

2. 网络信息资源

3. 限制检索,标题、链接、URL

4. 元搜索引擎(Metasearch Engine),“元搜索技术”,元搜索引擎

5. FTPSearch,Cbuyer

6. 快速查询,完全查询

7. 逻辑“与”、逻辑“或”和逻辑“非”

三、问答题

1.

(1)无序性;

(2)开放性;

(3)动态性;

(4)多样性;

(5)容量大;

(6)用户广;

(7)互动强。

2.

(1)按信息存取方式分:电话型,邮件型,揭示板型,广播型,图书馆型,书目型。

(2)按对应的印刷型信息资源分:a,联机联合目录;c网络电子书刊;d在网上直接传播的数字化信息。

(3)按信息交流的方式分:非正式出版信息;半正式出版信息;正式出版信息。

(4)按信息交流过程分:稳定的信息资隙;不稳定的信息资源。

3.

(1)信息检索空间的拓宽。

(2)交互式作业方式。

(3)用户界面友好且操作方便。

4.

(1)通过网络资源指南来查找信息。

(2)浏览,而浏览又有两种方式:顺链而行和偶然发现。

(3)利用搜索引擎。

(4)检索策略。

5. 高级搜索技术一般用于搜索引擎的高级检索,即所谓的“advanced search”。

其检索技术有:

(1)布尔逻辑算符(Boolean)。

(2)位置算符。

(3)优先算符。

(4)限定查找的起止日期。

(5)控制检索结果的排序。

6.

(1)搜索标题:格式:title: text或他t:test (注:text指文本文字)功能:检索网页标题中含有指定字或词组的页面。

(2)搜索网站:格式:domain: domain name 或host: name 或site: domain name 功能:检索词必须出现在域名、主机名或主机地址中。

(3)搜索URL:格式:url:text或u:text 功能:检索整个URL中含有指定的字或词组的所有页面。

(4)搜索链接:格式:link:URL 功能:检索与指定URL相链接的所有页面。

(5)搜索图片、图像:格式:image:文件名功能:检索含有指定文件名图像的所有网页。

(6)搜索多媒体信息:格式:media:text 功能:检索文件的名字中含有指定文字的多媒体信息。

7. 中文搜索引擎有:新浪,网易,搜狐,263,北大天网,统一搜索,Google,天极网等。

英文搜索引擎有:Google ,AltaVista,Teoma,AllTheWeb,Ask Jeeves,Northern Light ,HotBot,WiseNut,Lycos,Excite等。

8.

(1)ERIC数据库。

(2)AskERIC。

(3)EDRS。

(4)ERIC/AE。

(5)国外大学信息资料的查询

9. 专业性全文数据库有国研网数据库、万方数据库、中国资讯行数据库、中国经济信息网、法律事务应用系统。

国研网数据库:中国知名的大型经济类专业网站。经济决策平台--“国务院发展研究中心信息网”。

万方数据库:是国内最大的数字资源库系统,由中国科技信息研究所直属的万方数据公司开发,最重要的5个镜像系统,分别为科技信息系统、学位论文数据库、数字化期刊、学术会议数据库、商务信息系统。

中国资讯行数据库:是香港专门收集、处理及传播中国商业信息的高科技企业。其拥有一个庞大的中国商业资讯资料库,中国资讯提供三大类内容:商业资料库、财经资讯网、新闻频道。

中国经济信息网:是国家信息中心组建的、以提供经济信息为主要业务的专业性信息服务网络。

法律事务应用系统:司法和行政部门提供,主要包括包括中国法律数据库、中国法规规章库、地方法规规章库、中国司法解释库等10个数据库。

四、上机操作题

1. 信息资源检索:访问中国教育科研网CERNET,进行以下操作:

(1)请打开中国教育科研网,并下载其首页页面。

(2)请找出CERNET上新疆有几所大学可以上网,并下载其首页页面。

(3)请从CERNET上的上海交大船舶数字图书馆找到如下Flash影片,并把它下载保存到文件夹内。

【操作步骤提示】:

①用搜索引擎找到中国教育科研网的网址。

②在“中国高校”栏目中找到新疆各高校的网页,查询其馆藏电子资源情况。

③此作业全部完成后,将作业文件夹中保存的全部文件,通过局域网作业提交系统,传输到实验室服务器中,作为评分依据。

2. 【操作步骤提示】:

①打开IE浏览器,在地址栏中输入百度或Google搜索引擎的网址。

②在搜索引擎对话框中反复输入恰当的检索词,搜索给定的目标文献。

③点击IE浏览器文件菜单上的“另存为…”命令,将该页面下载到作业文件夹中保存。

3. 步骤如下:

请登录方正数字图书馆,首先从网上下载安装方正浏览器,然后在线浏览指定的图书,下载其封面页和目录页,保存在文件夹中。

指定图书:毛泽东思想概论,网络世界与精神家园,人生光明面,孩子自我成长的秘密:幼儿心理健康教育的研究与实践,新编行政管理学,西方社会思想史。

第7章

一、选择题

1. D

2. A

3. C

4. D

5. D

二、填空题

1. 内容相同相近的

2. 信息分析研究思维和认识的

3. 述评性报告

4. 作者的观点实践经验

5. 科技文献

三、问答题

1. 收集到的信息资料,必须进行整理,才能成为便于使用的系统信息资料。整理的步骤如下:初步分类和筛选,阅读和鉴别,信息资料的序化。初步分类就是按专题需要涉及的类目予以集中,使内容相同或相近的资料集中在一起,把不同内容的资料按类目分开。在划分的过程中要对每份资料进行粗略的浏览,将价值不大的资料删除出去,将有用的资料按类集中以便阅读整理。在阅读信息资料的过程中要进行鉴别,通过对信息的鉴别,判断其可靠性、先进性和适用性。收集到的各种信息资料,经浏览筛选、阅读鉴别以后,还要作进一步的序化。序化分为两个方面:一是对资料进行外形加工整理,二是对资料内容进行加工整理。

2. 专家调查法也称特尔菲法,是美国兰德公司首先采用的方法。这种方法的特点是:研究结论是由一批专家各自充分思考,在不受特定因素影响、自由发表和反复修改意见的基础上形成的,可以较好地保证结论的客观性和正确性。特尔菲法的应用范围很广,主要用于预测研究,但也可以用于技术评价、产品评价等。由于此法本质上是建立在有关专家根据其知识和经验,并对研究对象进行判断的基础上,因此特别适合于信息资料和数据较少情况下的预测,以及其他方法难以进行的评价和预测。

3. 综述写作的基本步骤包括:选题,收集资料,整理资料和写作。选题要从实际出发,具有明确的目的性,在理论或实践上有一定意义。文献资料是撰写文献综述的物质基础,选定综述的题材后要大量的搜集和阅读有关的中文和外文文献,文献越多,就越好些,综述的质量就越高。综述不是众多文献资料的堆积,而是作者在阅读了一定量的资料的基础上,根据资料的重要程度进行细读,抓住其主要观点和结论,对掌握的资料进行分析、综合,先列出提纲,写出各级的大小标题,然后将观点相同的资料分别归入有关问题,并排好顺序。然后根据写作提纲,逐项将内容展开,并注意观点与内容的一致。

4. 写作文摘一定要客观、如实,不要删去与自己观点不同的内容或随意加入自己的观点、乱加解释或评论等;要着重摘录新观点、新理论、新技术或新方法等,同时还要注意作者反复强调的内容和观点;文摘不要用第一人称,用非人称报道。动词应一般采用主动态置于主语附近;因标题与文摘为一个整体,标题中的信息不应在文摘中重复。文摘不能摘录“引文”;文摘摘要要紧扣主题,不要节外生枝、旁征博引。凡属一般性叙述、文章的背景、本学科内公知公用的内容,一概不摘;文摘书写时要有语法和逻辑,指示性文摘篇幅较短,一般不分段;但报道性文摘较长,可分段叙述;文摘要文字简洁,表达明确,通俗易懂。而不应使用含糊不清、意义不明确的代名词(这个、那个)、数词(大多数、若干与大概等);另外,文摘还要采用规

范化的名词术语,商品名及学名等。

5. 学术期刊根据其主办单位的级别也可分为国家级、省级、地市级等。一般来讲,主办单位的级别愈高,其刊物的档次愈高,对论文的水平要求愈高。除此之外,学术期刊还有核心期刊和非核心期刊之分。所谓核心期刊是指本学科中刊载专业学术论文量(率)大,引用量(率)及文摘量(率)、利用量(率)高,被专家公认为代表该学科或该领域发展水平和方向的少数一些期刊。真正的核心期刊并非具有“行政”上的效力,而具有“学术”上的权威性。

四、上机操作题

1. 打开CAB文摘光盘数据库,查看使用说明,在检索提示FIND下输入检索式:

#1 fireblight

#2 (apple?or malus) in de

#3 (pear? or pyrus) in de

#4 #2 or #3

#5 #1 and #4

#6 la=english

#7 #5 and #6

firelight and (((apple? or malus) in de)or ((pear? or pyrus) in de)) and (la=english)。

输出检索结果(可以用SPIRS系统的输出指令show、print、download来进行)。退出系统:按F10后再按QUIT即可。

2. 检索方法:先综述后具体;先主要后次要,先简单后复杂,先中文后英文,建立系统化的思路;建一个检索过程记录文件。

设定检索词:高校毕业生就业形势未来几年就业形势世界大学生就业形势

检索思路:我国现状——世界形势——分析原因——未来趋势——相关政策

主要检索范围:使用google,baidu等搜索引擎,在使用搜索引擎的基础上,查找一些专业网站,如:北京大学生就业网,中华人才网,北京就业网;各类电子类期刊、杂志(大学生就业指导,北工就业咨询报等)、书籍;向有关人士(毕分办的老师,选修就业指导课的同学,大四的学生)咨询学习;参加一些校内外的招聘咨询会和相关讲座。

最后,根据综述写作要求和步骤,写出一篇《大学生就业形势》的文章。

国科大信息检索作业

国科大2013年秋季《现代信息检索》第一次作业(第一章到第五章) 以下每题10分,共计100分。 1、习题1-4 a.时间复杂度O(x+y)。因为倒排记录表记录的文档号是按照从小到大排列的,在扫描Brutus对应的倒排表的时指针指向文档 号为x,扫描Caesar对应的倒排记录表的指针对应的文档号为y,如果xy,caesar指针后移。 b.时间复杂度是O(N),N是全部的文档数。因为结果集的大小取决于文档数N,而不是倒排记录表的长度。 2、习题1-7 对于原始的查询,按照倒排记录表的长度从小到大查询会节省查询复杂度 (tangerine OR trees) = O(46653+316812)=O(363465) (marmalade OR skies) = O(107913+271658) = O(379571) (kaleidoscope OR eyes) = O(46653+87009) = O(300321) 即顺序为:(kaleidoscope OR eyes) AND (tangerine OR trees)AND(marmalade OR skies) 3、习题1-10 UNION(p1,p2) answer ←{ } while p1!=NIL and p2!=NIL do if docID(p1)=docID(p2) then ADD(answer,docID(p1)) p1<- next(p1) p2<-next(p2) else if docID(p1)

(整理)信息资源检索与应用-课后习题答案.

参考答案 第1章 一、选择题 1. A 2. D 3. C 4. D 5. B 二、填空题 1. 印刷型缩微型视听型 2. 信息内容信息内容以及与信息内容相关的信息技术、人员和设施 3. 一次信息资源信息 4. 存贮密度大、体积小 5. 文献检索数据检索 6. 直接检索间接检索 三、问答题 1. (1)图书:大部分科技图书均可以提供某一科学领域的较为全面的知识或研究成果,作者通过对相关的技术、经验等进行归纳,可以使读者对于某一学科领域具有一个全面的了解。 (2)期刊:期刊又称为杂志,是指具有固定名称,并定期出版的连续性出版物。除了传统意义上的期刊外,目前在互联网中有大量的电子期刊。 (3)科技报告:科技报告又称为技术报告,是指研究人员对某一专题进行研究的过程中根据进展情况撰写的正式的报告。 (4)会议文献:是指在各种学术会议上提交并讨论的学术论文。 (5)专利文献:是指将科技信息和法律信息融为一体的,具有明显的知识产权特征的文献资料。 (6)学位论文:是指高等学校或研究机构的毕业生为取得某种学位而撰写并提交的学术论文,是与学位制度相关的学术论文,分为博士论文、硕士论文和学士论文。 (7)标准文献:是指人们在进行科学研究和产品生产过程中所遵循的共同的技术依据和原则,是经过权威机构验证和批准的标准化工作成果。 (8)政府出版物:又称官方出版物,是指各国政府部门和所属机构出版发行的文献,其内容比较丰富,一般可以分为行政性出版物和科技性出版物两类。 (9)产品资料:是指厂商为推销自己的产品而印发的宣传性出版物,一般包括产品样本、说明书、产品目录和厂商介绍等。 (10)报纸:报纸以报道新闻和评论为主,信息量大、实时性强、且传播面比较广,具有很好的通俗性,是重要的社会舆论工具和信息源。 2. 广义的信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找

信息检索题库+参考答案(终极版)

四川师范大学信息检索课后作业 1.(第1章?单选)联合国教科文组织分别于2003年和2005年召开了以(A)为主题的世界性大会,并发布了《布拉格宣言》和《亚历山大宣言》。 A、信息素养 B、信息安全 C、信息检索 D、信息评价 2.(第1章?多选)信息素养的基本构成具体包括(ABCD) A、信息知识 B、信息意识 C、信息能力 D、信息伦理 3.(第1章?多选)信息意识具体包括(ABCD)。 A、充分认识到信息在学习、工作和生活中的重要作用,遇到问题时首先应该想到通过信息的获取 4.(第1 A、 B、C、D、 5.(第1 A、 6.(第1《高 ABCD)。A、 7.(第1 A、 8.(第1 A、信息知识 B、信息能力 C、信息意识 D、信息伦理 9.(第1章?单选)(C)是指人类对信息需求的自我意识,是人类在信息活动中产生的认识、观念和需求的总和。 A、信息知识 B、信息能力 C、信息意识 D、信息伦理 10.(第1章?判断)以“走向具有信息素养的社会”为主题的《布拉格宣言》认为,作为一种适应社会的基本能力和参与社会的先决条件,信息素养能够确定、检索、评估、组织和有效地生产、使用和交流信息,并解决所遇到的问题,是终身学习的一种基本人权。√ 11.(第1章?判断)作为信息素养的基本构成,信息知识、信息意识、信息能力和信息伦理四个要素相辅相成、不可分割。其中,信息意识是先导,信息知识是基础,信息能力是核心,信息伦理是保障,四个要素共同构成了一个统一的整体。√ 12.(第1章?判断)2005年北京高教学会图书馆工作研究会提出了《北京地区高校信息素质能力指

标体系》。这个指标体系从信息意识、信息知识、信息能力、信息伦理四个方面提出了高校学生应具有的信息素养要求,具体由7个一级指标,19个二级指标,61个三级指标组成。√ 13.(第1章?判断)以“信息社会在行动:信息素养与终身学习”为主题的《亚历山大宣言》指出,信息素养和终身学习是信息社会的灯塔,照亮了通向发展、繁荣和自由的道路。-------T 14.(第1章?判断)信息素养是终身学习的核心。------T 15.(第1章?判断)信息检索能力也就是确定信息的能力,即把遇到的问题转换为具体信息需求的能力。------F 16.(第1章?判断)信息素养教育的目标是培养终身学习能力。具体而言,就是能够想到而且能够做到通过获取和利用信息解决所遇到的问题,并且能够把所获取的信息融入自身的知识结构,把获取信息的过程和经历内化为自身的学习能力。------T 17.(第2章?多选)信息的属性包括(ABCD) A、 *18.(第 A、 19.(第 A、 20.(第 A、 21.(第 A、 22.(第 A、 23.(第 有(AD A、、使用 24.(第 A、 25.(第 A、 26.(第 A、 27.(第 A、 28.(第2章?多选)网络检索系统的特点是(ABC)。 A、资料丰富 B、检索方便 C、费用低廉 D、资源共享 29.(第2章?多选)使用逻辑“或”是为了(AC)。 A、提高查全率 B、提高查准率 C、扩大检索范围 D、缩小检索范围 30.(第2章?多选)截词检索中,常用的截词符号有(CD)。 A、+ B、- C、* D、? 31.(第2章?多选)下列哪种情况下检索人员需要修改检索策略(AB)。 A、检索结果中无关信息量过多 B、检索结果中输出的信息量太少 C、网速太慢,检索过程中需要的时间过长 D、检索结果文献大部分比较陈旧 32.(第2章?多选)影响检索效果的因素主要来自两个方面(CD)。 A、查全率 B、查准率 C、检索系统本身 D、检索人员的检索水平

网络信息检索试题及答案(DOC)

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有( C )特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含( B ): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?( A ) A. 文摘 B. 会议文献 C. 辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于( A )。 A. 零次文献 B. 一次文献 C. 二次文献 D. 三次文献 9、下列选项中哪一项属于“国内统一刊号”(C )。 A. ISBN 7-04-014623-1 B. ISSN 0254-4164 C. CN 11-2127/TP D. 0254-4164/TP 10、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( C )参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL] .(2001-12-19) [2002-04- 15]. http:∥www. ….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( B )参考文献的著录条目描述。 昂温G,昂温P S .外国出版史[M]. 陈生铮,译. 北京:中国书籍出版社, 2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》 E、《机械工业出版社2012年图书征订目录》 F、《计算机科学技术百科全书》 G、《计算机工程与应用》 H、《网络营销》 I、《NASA报告》。 J、《博士论文:论网络时代的商务模

网络信息资源检索与利用第二次作业

《网络信息资源检索与利用》课程实验第2次实验报告 实验内容及基本要求: 实验项目名称:网络搜索引擎的应用 实验类型:验证 每组人数:1 实验内容及要求: 1.请分别针对网络资源目录使用的分类方法进行举例。 2.在 yahoo 的分类目录中找到一条路径指向网站论文: https://www.360docs.net/doc/0e3556968.html,/Summer98/koumoutsakos.pdf。 3.在新浪网的分类目录中找到一条路径指向学校的网站:https://www.360docs.net/doc/0e3556968.html, 4.在 sohu 的分类目录中找到一条路径指向网页:https://www.360docs.net/doc/0e3556968.html,/newbook/ 5.请指出 yahoo,sina,sohu 的分类目录之间的异同和优劣(500 字以内) 6.请了解 google 和 baidu 在进行关键词检索中语法的异同,并说明这两者在针对某一主题进 行检索时检索结果的差异以及对检索意图理解准确度的差异。 实验结果: 1.请分别针对网络资源目录使用的分类方法进行举例。 (1)主题分类法 (2)学科分类法 (3)图书分类法 (4)分面组配法 2.在 yahoo 的分类目录中找到一条路径指向网站论文: https://www.360docs.net/doc/0e3556968.html,/Summer98/koumoutsakos.pdf。

3. 在新浪网的分类目录中找到一条路径指向学校的网站:https://www.360docs.net/doc/0e3556968.html, 4. 在 sohu 的分类目录中找到一条路径指向网页:https://www.360docs.net/doc/0e3556968.html,/newbook/ 5. 请指出 yahoo,sina,sohu 的分类目录之间的异同和优劣(500 字以内)

信息检索考试题库

一、单项选择题 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 知识是指人类对客观世界的认识。知识可分为(C) A.有用知识和无用知识 B.基础知识和高级知识 C.感性知识和理性知识 D.理论知识和实践知识 文献按载体形式可分为:印刷型、缩微型、声像型和(D)A.甲骨型 B金石型 C.电脑型 D.机读型 信息检索系统的功能为:报道文献信息、存储文献信息和(B) A.揭示文献信息 B.检索文献信息 C.宣传文献信息 D.介绍文献信息 检索系统的结构由几个部分组成:编辑使用说明、索引、附录、词表和(D) A.目次 B.题录 C.附图 D.正文(主文档) 为便于计算机识别记录的各个字段,每个字段都设有字段标识符,下列哪个字段的标识叙述是正确的(A) 是题名的标识符 是关键词的标识符 是摘要的标识符 是著者的标识符 以下不是布尔逻辑算符的是(B) B.Near 布尔逻辑算符通常的运算顺序是(A) A.有括号时,括号内的先执行;无括号时 NOT > AND > OR B.有括号时,括号内的先执行;无括号时 NOT > OR >AND C.有括号时,括号内的先执行;无括号时 AND >NOT > OR D.有括号时,括号内的先执行;无括号时 AND > OR > NOT 限定词“in”是为了缩小检索范围,提高检索速度和命中率的。下列检索表述式正确的是(B) A.“信息in OCLC” B.信息in AB” C. 信息in CNKI” D.信息in Calis” 我国高校与公共图书馆的文献资料,一般采用的分类法分类的是(A) A.《中国图书馆图书分类法》 B.《国际十进分类法》 C.《人大法》 E.《科图法》 信息检索的方法有追溯法、综合法和(C) A.须查法 B.倒查法 C.工具法 D.抽查法 CNKI数据库的全文数据输出文件的格式为(D) 和TXT 和VIP 和PDF 和PDF 超星电子图书提供快速检索和高级检索两种检索方式,利用快速检索可以按图书的单项模糊查询,这些单项包括(A) A.书名、作者、索书号和出版日期 B.书名、作者、索书号和出版社 C.书名、作者、分类号和出版社 D.书名、版本、索书号和出版社 读秀知识库是由海量全文数据及元数据组成的超大型 数据库。其提供的中文图书有(B) 万种 万种 万种 D400万种 SCienCe DireCt数据库收录2000多种期刊,其中被ISI 收录期刊种类为(C) SD数据库常用字段中“TITLE-ABSTR-KEY”字段是表示: ( D ) A.题名-作者-关键词 B.题名--作者-摘要 C.作者- 摘要-关键词 D.题名-摘要-关键词 Dialog数据库于1972年正式开始提供商用联机服务, 是世界上最大、历史最悠久的联机检索系统。目前数据 库有( A ) 多种 多种 多种 多种 网络信息资源的一次出版信息包括:网上图书、期刊、 报纸、专利、政府出版物和( D ) A.电子邮件 B.新闻 C.博客 D.会议资料 Google检索框中的两个关键词之间用空格隔开则默认 的连接是( A ) A.“AND”(“与”运算) B.“OR”(“或“运算) C.“NOT”(“非”运算) D.“W”(位置运算) 下列哪个是Google指定文件类型检索(B) A.检索词site: B.检索词filetype: C.检索词insite: D.检索词innurl 百度搜索中能实现精确匹配查询的是(C) A.单引号‘’ B.中括号[] C.双引号“” D.逗号 下列开哪个开放存取学术资源利用平台的名称是正确 的(D) :中图链接服务 : OA资源一站式检索服务平台 :开放存取期刊仓库 J – GATE:开放存取期刊门户 论文摘要的文字必须十分简炼,内容亦需充分概括,字 数一般不超过论文字数的( B ) A.6%, %, %, % 制定检索策略首先要弄清用户的提问要求,并确定要查 找的文献学科范围、类型、文种和(C) A.地点 B.样式 C.时间 D.方位 搜索引擎的由哪几个部分组成(A) A.搜索器、索引器、检索器和用户接口 B.搜索器、编辑器、检索器和用户接口 C.搜索器、索引器、整理器和用户接口 D.查询器、索引器、检索器和用户接口 下列文献哪个“参考文献”的格式著录是正确的(D) A.[1]刘付芬. 黄银安,青少年网瘾对家庭经济危害的 分析及对策,《消费导刊》,2010年第8期,25-28页 B.(1)刘付芬. 黄银安,青少年网瘾对家庭经济危害 的分析及对策,消费导刊,2010(8):25-28 C.<1>刘付芬, 黄银安.青少年网瘾对家庭经济危害的 分析及对策.消费导刊,2010(8):25-28 D.[1] 刘付芬, 黄银安.青少年网瘾对家庭经济危害 的分析及对策.消费导刊,2010(8):25-28 每个被收录的网页,在百度上都存有一个纯文本的备 份,称为:(C) A.百度文档 B.百度相似搜索 C.百度快照 D.百度百科 在百度中如果在特定站点“新浪网中搜索关于“公司治 理”方面的文献信息的检索式为:(B) A. 公司治理intitle:公司治理site: 公司治理inurl: 公司治理filetype:开放存取期刊门户”的网址为:(C) 文献综述的写作步骤包括:选题、查阅文献资料、加 工处理,拟定提纲,撰写成文,反复修改和(A) A.定稿成文 B.定题名称 C.定稿打印 D.定稿腾写 判断一篇文献综述质量高下的分界线是:(D) A.评论 B.综合归纳 C.总结 D.描述 二、多项选择题 (在每小题的备选答案中,可能有一个或多个正确的答 案,请将其代码分别填在题干的括号内,多选、少选、 错选、均无分。) 信息是事物存在的方式和运动状态及其规律的表征,是 事物的一种普遍属性。信息的特征有(A、B、C、D、E) A.客观性 B.时效性 C.传递性 D、共享性 E.中介性 以信息所依附的载体为依据,信息可分为(A、C、D) A.文献信息 B.自然信息 C.口头信息 D.电子信息 E.社会信息 文献是记录有知识的一切载体。构成文献的要素为(A、 B、D、E) A.知识、信息内容 B.信息符号 C.信息类型 D.载体材料 E.记录方式 文献按出版形式区分,可分为十大文献情报源,除图书、 期刊和报纸外下列哪些文献属于十大文献情报源(C、D、 E) A.研究报告 B.宣传手册 C.会议文献 D.政府出版物 E.专利文献 下列属于四大科技报告的有(B、C、D、E) 报告 报告 报告 报告 报告 下列属于零次文献的有(A、B、C、D) A.书信 B.手稿 C.记录 D.笔记 E.研究报告 下列属于一次文献的有(B、C、E) A.论文手稿

中国科学院大学现代信息检索课后习题答案

《信息检索导论》课后练习答案 王斌 最后更新日期 2013/9/28 第一章布尔检索 习题1-1 [*] 画出下列文档集所对应的倒排索引(参考图1-3中的例子)。 文档 1 new home sales top forecasts 文档 2 home sales rise in july 文档 3 increase in home sales in july 文档 4 july new home sales rise 习题1-2 [*] 考虑如下几篇文档: 文档1 breakthrough drug for schizophrenia 文档2 new schizophrenia drug 文档3 new approach for treatment of schizophrenia 文档4 new hopes for schizophrenia patients a. 画出文档集对应的词项—文档矩阵; 解答: breakthrough 1 0 0 0 drug 1 1 0 0 for 1 0 1 1 hopes 0 0 0 1 new 0 1 1 1

patients 0 0 0 1 schizophrenia 1 1 1 1 treatment 0 0 1 0 b. 画出该文档集的倒排索引(参考图 1-3中的例子)。 解答:参考a。 习题1-3 [*] 对于习题1-2中的文档集,如果给定如下查询,那么返回的结果是什么? a.schizophrenia AND drug 解答:{文档1,文档2} b.for AND NOT (drug OR approach) 解答:{文档4} 习题1-4 [*] 对于如下查询,能否仍然在O(x+y)次完成?其中x和y分别是Brutus和Caesar所对应的倒排记录表长度。如果不能的话,那么我们能达到的时间复杂度是多少? a.Brutus AND NOT Caesar b.Brutus OR NOT Caesar 解答: a.可以在O(x+y)次完成。通过集合的减操作即可。具体做法参考习题1-11。 b.不能。不可以在O(x+y)次完成。因为NOT Caesar的倒排记录表需要提取其他所有词项对应的倒 排记录表。所以需要遍历几乎全体倒排记录表,于是时间复杂度即为所有倒排记录表的长度的和 N,即O(N) 或者说O(x+N-y)。 习题1-5 [*] 将倒排记录表合并算法推广到任意布尔查询表达式,其时间复杂度是多少?比如,对于查询 c.(Brutus OR Caesar) AND NOT (Antony OR Cleopatra) 我们能在线性时间完成合并吗?这里的线性是针对什么来说的?我们还能对此加以改进吗? 解答:时间复杂度为O(qN),其中q为表达式中词项的个数,N为所有倒排记录表长度之和。也就是说可以在词项个数q及所有倒排记录表长度N的线性时间完成合并。由于任意布尔表达式处理算法复杂度的上界为O(N),所以上述复杂度无法进一步改进。 习题1-6 [**] 假定我们使用分配律来改写有关AND和OR的查询表达式。 a. 通过分配律将习题1-5中的查询写成析取式; 12 b. 改写之后的查询的处理过程比原始查询处理过程的效率高还是低? c. 上述结果对任何查询通用还是依赖于文档集的容和词本身? 解答: a. 析取式为:(Brutus And Not Anthony And Not Cleopatra) OR (Caesar AND NOT Anthony AND NOT Cleopatra) b. 这里的析取式处理比前面的合取式更有效。这是因为这里先进行AND操作(括号),得到的倒排记录表都不大, 再进行OR操作效率就不会很低。而前面需要先进行OR操作,得到的中间倒排记录表会更大一些。 c. 上述结果不一定对,比如两个罕见词A和B构成的查询 (A OR B) AND NOT(HONG OR KONG),假设HONG KONG一 起出现很频繁。此时合取方式可能处理起来更高效。如果在析取式中仅有词项的非操作时,b中结果 不对。 习题 1-7 [*] 请推荐如下查询的处理次序。 d. (tangerine OR trees) AND (marmalade OR skies) AND (kaleidoscope OR eyes)

文献资源检索与利用考题及答案

2016年新疆专业技术人员继续教育《文献资源检索与利用》考试题与参考答案 1 一、单选题(每题3分,共30分) 1.The Engineering Index(工程索引)数据最早回溯至()年,综合了工程索引(Engineering Index)和工程会议录(Engineering Meetings) ,为全球最全面的工程领域参考数据库。(A) A.1884 B.1882 C.1888 D.1886 2.下列不属于事实和数值型数据库的特点的是()。(B) A.检索方式没有统一模式 B.通过文献之间的引证关系,揭示科学研究的进程和发展 C.涉及的学科范围、应用领域非常广泛 D.对数据可靠性、客观性要求高 3.下列哪一项不是文献检索的原则?()。(A) A.全 B.精 C.快 D.准 4.下列哪一种数据库不属于综合性数据库?(C) A.书目(目次)数据库 B.文摘数据库 C.全文数据库 D.引文数据库 5.OECD 数据库是由()出品的一个在线图书馆。(A) A.经济合作发展组织 B.商业及公司资源中心 C.名人传记资料中心 D.跨国企业财务经营组织 6.科研人员的工作时间分配中占比重最大的是()。(D) A.思考时间 B.编写报告 C.科学实验 D.查阅文献 7.()是国内最大的在线图书馆。(B) A.读秀 B.中国数字图书馆 C.E书时空 D.全景中文图书 8.下列哪一项不是国内的会议文献数据库?(B) A.万方会议论文数据库 B.学术会议目录数据库

C.中国期刊网的会议论文全文数据库 D.国家科技文献中心(NSTL) 9.联合国统计数据库从()年开始提供免费检索。(C) A.2002年 B.2003年 C.2005年 D.2004年 10.下列哪一项不是文献检索技术比较通用的检索功能?()(A) A.模糊检索 B.简单检索 C.二次检索 D.复杂检索 二、多选题(每题4分,共40分) 11.综合性数据库分为哪几种类型?(ABD) A.书目(目次)数据库 B.引文数据库 C.全文数据库 D.文摘数据库 12.事实、数值型数据库的纸本资源作为其重要补充,来源于(ABC)。 A.年鉴、皮书 B.百科全书、手册、指南等事实型检索工具 C.行业研究报告 D.全球全文期刊 13.网上免费的西文电子学术期刊有哪些?(ACD) A.PloS科学公共图书馆(The Public Library f Science ,简称PLoS ) B.Peridicals Archive nline(典藏学术期刊全文数据库) C.DOAJ 开放获取期刊目录 D.BioMed Central(简称BMC ,生物医学中心) 14.33 BvD系列数据库下分设哪些子库?(ABCD) A.亚太企业分析库 B.全球保险公司分析库和全球并购交易分析库 C.各国宏观经济指标宝典 D.全球上市公司分析库与银行与金融机构分析库 15.国家统计局数据库提供()、()、专题、关键词4种查询方式。(BD) A.分段 B.整表 C.摘要 D.指标 16.文献检索的基本方法包括()。(ABD) A.追溯法 B.综合法 C.分段法 D.直接法 17.英国科学文摘数据库收录的主要内容有()(ABCD) A.计算机科学、控制技术 B.理论及应用物理、电气和电子工程 C.通讯与信息技术 D.生产和制造工程 18.学术资料来源于()(ABCD) A.图书馆链接 B.open Acess网站

网络信息资源检索利用作业及答案

作业ID: 69924 1. 检索词A和B是并列关系,表示同时包含检索词A和B 的布尔逻辑检索符是()鼓励独立完成作业,严禁抄袭!! A. A. 逻辑“与” B. B. 逻辑“或” C. C. 逻辑“非” D. D. 逻辑“亦或” 正确答案:A 2. 中国历史上第一部系统地分析字形、解释字义的字书是() A. A. 《辞源》 B. B. 《尔雅》 C. C. 《说文解字》

D. D. 《汉语大字典》 正确答案:C 3. 下列哪个不属于十三经 A. A. 《周易》 B. B. 《孟子》 C. C. 《新元史》 D. D. 《尔雅》 正确答案:C 4. 查考1911~1949年间国内出版图书的总结性书目的工具书是() A. A. 《中国国家书目》 B. B. 《中国古籍善本书目》 C. C. 《民国时期总书目》 正确答案:C

5. 下列逻辑运算次序最优先的是 A. A. 逻辑“与” B. B. 逻辑“非” C. C. 放入符号“()”(半角)中 D. D. 逻辑“或” 正确答案:C 6.年鉴容纳内容的基本单元是 A. A. 栏目 B. B. 条目 C. C. 纪事 D. D. 标题 正确答案:A 7. 在年鉴标题制作的技术方法上,一般遵循-----------原则

A. A. 中心词前置 B. B. 中心词后置 C. C. 中心词倒置 正确答案:A 8. 工具书 正确答案: 工具书是一种汇集、编著或译述的材料,按特定的方法加以编排,以供解疑释难时查考之用的图书。 9. 相关度 正确答案: 所谓“相关度”,是指检索结果与输入的检索语词在内容上关联的疏密程度,由计算机根据词语主题关联分析技术自动处理完成。

信息检索试题

《信息检索》课程考核作业 姓名周伟院系机械与材料工程学院班级A1032 学号23 一、名词解释(每题2.5分,共10分) 1、文献 有历史意义或研究价值的书籍 2、期刊 期刊又称杂志,是指有固定名称,用卷、期或者年、季、月顺序编号,按照一定周期出版的成册连续出版物 3、电子图书 电子图书又称e-book,是指以数字代码方式将图、文、声、像等信息存储在磁、光、电介质上,通过计算机或类似设备使用,并可复制发行的大众传播体。 4、搜索引擎 搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。 二、填空题(10分) 1、你的借书卡限借7 册图书,借期30 天,到期提前续借天数是10 天,预约到书保留天数 3 天。 2、九江学院图书馆共有24 本作者是“郭敬明”的纸质图书。 3、《小时代2.0虚铜时代》的馆藏地是社科借阅室一(主馆111)社科图书阅览室二(主馆307),索书号是247.57/21560,本书的提要文摘是笑的对话与内故事以经济飞速发展的上海这座风光而时尚的城市为背景,讲述了林萧、南湘、顾里、唐宛如四个从小感情深厚、有着不同价值观和人生观的女生,先后所经历

的友情、爱情,乃至亲情的巨大转变,是一部当下时尚年轻人生活的真实写照。在一个宿舍朝夕相处的四个女生,开始了找工作实习的忙碌生活,面对巨大生存压力,在看似平静的校园生活相继发生着让她们措手不及、不知如何面对、抉择的事情。作者在书中,采用全新的叙述笔调,加入大量时尚元素,随处可见轻松搞容,时而让人捧腹大笑,时而令人扼腕叹息。 三、简答题(每题5分,共10分) 1. 简述文献检索的步骤 答1、根据需要确定检索范围;2、熟悉和利用现有的对口工具书;3、查阅凡例和熟悉排检法,检索出所需资料;4、摘录和复制资料;5、整理资料。 2. 检索一本图书,除了作者途径外,还有哪些主要途径? 答:还有书名,主题,关键字,部分内容等检索途径。 四、实践操作题(30分) 1、请从九江学院图书馆电子资源中检索与你姓名相同或相似的作者所著书籍。 a、你所检索的数据库依次是:超星 b、你使用的检索词是:周伟 c、在检索结果中任选一本图书,记录下书名、作者、出版社、第50页第一段文字内容。《转变观念换种生活》周伟线装书籍 思想中有太多的负面东西,就像电脑中有太多的信息垃 圾没有被及时清除一样,使电脑的运行速度减慢甚至死机。 所以,我们要改变自己的行为,创造成功,首先就要清除 心灵积留的负面信念,建立积极正面的信念。 我们要想拥有正确的行为,就要在头脑中具备正确的思 想,没有正确的思想,就没有正确的行为。佛家说有正念 才能行正道,才能结正果,是一样的道理。 人们做任何事还必须首先都是从一种想祛、一个念头开 始,从而激发出自身的潜能,爆发出强大的行动力,才能 达成种种期望的结果。你的行为众远无祛超脱你的思想。

《信息检索与利用》期末复习1

《信息检索与利用》期末复习 试题题型 一、填空题(每空3分,共15分) 二、选择题(每题3分,共30分) 三、判断题(每题3分,共30分) 四、简答题(共25分) 1.(12分) 2.(13分) 复习题 第一章信息资源检索基础知识 一、填空题 1.___________________________是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息 2.___________________________是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。知识 3.___________________________是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。情报 4.___________________________是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。文献 5.___________________________是指在国内外学术或非学术会议上发表的论文或报告。会议文献 6.___________________________是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。学位论文 7.___________________________是对文献内容和形式特征进行选择和记录的过程。著录8.___________________________是指特定的数值型数据为对象的检索。数据检索 9.___________________________是指以特定的事实为目标的检索。事实检索 10.事实与数据检索工具主要依靠各类___________________________完成各种数据或事实的查询。参考工具书 11.按照结构原理,信息检索语言可以分为_____________________、____________________、

信息检索试题

信息检索试题 单项选择题: 1、以下各项属于二次信息的是(A ) A、索引 B、期刊 C、学位论文 D、百科全书 2、下列文献中属于一次信息的是( A ) A、专利说明书 B、百科全书 C、目录 D、综述 3、年鉴属于下列哪一类别( D ) A、零次信息 B、一次信息 C、二次信息 D、三次信息 4、( C )是出版周期最短的定期连续出版物。 A、图书 B、期刊 C、报纸 D、学位论文 5、为了有效地存储和传播知识,人类利用各种( C )来记录信息。 A、知识 B、文献 C、载体 D、视听资料 6、报道范围主要为能源方面的科技报告为(D )。 A、AD B、PB C、NASA D、DOE 7、了解各个国家政治、经济、科技发展政策的重要信息源是( B ) A、科技报告 B、政府出版物 C、标准文献 D、档案文献 8、利用截词技术检索“?英语考试”,以下检索结果正确的是(D ) A、英语四级考试 B、英语考试成绩 C、英语考试报名 D、六级英语考试 9、我国最早的分类法是( B) A、《中经新簿》 B、《七略》 C、《四库全书总目》 D、《隋书经籍志》 10、《四级英语阅读与完型填空》这本图书的分类号是( D )。 A、G636.33 B、G216.2 C、I247.4 D、H319 11、按照《中国图书馆分类法》,《新编六级英语阅读解析》这本书应属于哪个类目(A )。 A、H大类 B、I大类 C、T大类 D、O大类 12、《信息检索》这本书的分类号为G252.7,这是按照( B )分类。 A、科图法 B、中图法 C、杜威分类法 D、刘国钧分类法 13、布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是(A ) A、检索出除了中年教师以外的在职人员的数据

信息检索导论-王斌-第三次课后作业(13-21)

信息检索导论第三次课后作业 1、习题13-2 答:(i)贝努利模型:三个文档具有相同的模型表示 (ii)多项式模型:文档1和文档2相同,文档3与它们都不同。文档1和文档2中“Lodon”都出现了两次,文档3中只出现了一次。 2、习题13-5

3、习题14-6 在图14-14 中,3 个向量→a、→b及→c中哪一个满足:(i) 采用内积计算的情况下与→x最近?(ii) 采用余弦相似度计算的情况下与→x最近?(iii) 采用欧氏距离计算的情况下与→x最近?

4、习题15-1一个数据集里支持向量的最小数目是多少(此时的数据集每个类别中都包含实例)? 答:一个数据集里支持向量的最小数目是2个。因为SVM分类模型希望得到在特征空间上间隔最大的分类器,即对于距离超平面最近的实例点,也希望能有足够的确信度将其分开,确定这样的超平面需要的支持向量最小数目是2个。5、习题16-5 K-均值算法的两个停止条件为:(i) 文档的分配不再改变;(ii) 簇质心不再改变。请问这两个条件是否等价? 答:这两个停止条件是等价的。当连续两次迭代之后,若文档的分配不再改变,则据此计算出的簇质心也不会再改变;当簇质心不再改变的时候,则K-均值算法计算出的文档的分配也就不再改变。

6、习题17-7 a. 考虑在一个两种语言组成的文档集上进行2-均值聚类,你预期的结果是什么? b. 当使用HAC 算法时,预期的结果是否仍然一样? 答:a.预期的结果:文档根据语言的大致分成两类。 b.预期的结果不一样。HAC是自底向上的聚类方法,最开始的时候每一篇文档都是一个簇,然后不断对簇进行两两合并,直到所有文档都聚为一簇。层次聚类不需要实现确定簇的数据,如果要按照不同的语言将文档进行分类,则需要在层次结构中某处进行截断,在合适的位置截断也可以将文档大致分为两类。 7、习题18-11假定有一个文档集合,其中每篇文档可以是英文或者是西班牙文。整个文档集如图18-4所示。图18-5 给出了与图18-4 相关的英语和西班牙语的术语表。当然,该术语表只用于帮助理解,对检索系统来说是不可见的。 答:(1)词项-文档矩阵: d1 d2 d3 d4 d5 d6 hello 1 0 0 0 0 1

信息资源检索答案(完整)

1111111111111111111111 试题1 单项选择题 (5.0分得分:5.0 难度:基本题) 不同的数据库系统的字段代码是有所不同的,其中题名的常见表述有 正确答案学生答案 TI AU KW AB 试题2 判断题 (5.0分得分:5.0 难度:水平题) 期刊是有固定名称,有一定的出版规律,标有刊期序号的一种论章成册的出版物。 正确答案学生答案真 假 试题3 单项选择题 (5.0分得分:5.0 难度:基本题) 在进行信息检索的过程中,公式“(检索出的相关信息量/检索出的信息总量)×100%”计算的是: 正确答案学生答案查准率 查全率漏检率误检率 试题4 单项选择题 (5.0分得分:5.0 难度:基本题) 信息侵权主要包括侵犯______________和侵犯个人隐私权等。 正确答案学生答案社会隐私权 著作权知识产权人权 试题5 多项选择题 (5.0分得分:5.0 难度:难度题) 下列哪些语句能被检索式“information N/2 retrieval”命中()

正确答案学生答案―information retrieval‖ ―retrieval information‖ ―information computer aided retrieval‖ ―retrieval of education information‖ 试题6 单项选择题 (5.0分得分:5.0 难度:基本题) 按照信息的载体类型,可将信息资源划分为:______、缩微型、声像型、电子型和多媒体。 正确答案学生答案印刷型 书本型视频型音频型 试题7 多项选择题 (5.0分得分:0.0 难度:难度题) 以下类型的文献属于三次文献的是() 正确答案学生答案目录 词典 百科全书科技报告 试题8 判断题 (5.0分得分:5.0 难度:水平题) 信息可以记载在印刷纸本中,也可以存储在声、光、电、磁等介质中,如磁带、光盘、硬盘等。 正确答案学生答案真 假 试题9 多项选择题 (5.0分得分:5.0 难度:难度题) Chun,Lu,and https://www.360docs.net/doc/0e3556968.html,n,“Dynamic Analysis of Clamped Laminated Curved Panels.”Composite Structures 30.4(1995):375-388. 这是一篇期刊论文描述(著录)的书写格式,其中包含的信息包括了()。 正确答案学生答案书名

《信息检索导论》课后习题答案

《信息组织与检索》作业答案 第一章布尔检索 习题1-2 考虑如下几篇文档: 文档1 breakthrough drug for schizophrenia 文档2 new schizophrenia drug 文档3 new approach for treatment of schizophrenia 文档4 new hopes for schizophrenia patients a. 画出文档集对应的词项—文档矩阵; b. 画出该文档集的倒排索引(参考图1-3中的例子)。 Term-Documentmatrix: 1234 approach0010 breakthrough1000 drug1100 for1011 hopes0001 new0111 of0010 patients0001 schizophrenia1111 treatment0010 Inverted Index: approach -> 3 breakthrough ->1 drug ->1->2 for ->1->3->4 hopes ->4 new ->2->3->4 of ->3 patients ->4 schizophrenia ->1->2->3->4 treatment >3 注意:倒排索引中的词表(dictionary)和每个词项的倒排列表(posting list)需要排序,便

于查找。这里我们暂不考虑词的正规化处理(如hopes->hope)。 补充习题1 写出AND查询的伪代码 ●面向过程风格的伪代码: 给定两个指针p1和p2,分别指向两倒排列表list1和list2(链表实现)的首元素;令docId(p1)表示p1所指向的元素的docId查询结果存放在answer列表里。 这里应用了“化归”思想(将新问题转化归为旧问题来解决)。这里,比较两排序列表的首元素,排除较小的docId(不可能有匹配)后,我们构造出新的剩余列表,再次进行两列表的首元素的比较。 While p1 != null AND p2 != null If p1->docId==p2->docId //对两(剩余)列表的首元素进行比较 insert(answer, p1); p1=p1->next;//构造新的剩余列表,迭代执行 p2=p2->next;// Else if p1->docId < p2->docId p1=p1->next;//p1->docId不可能有匹配;构造新的剩余列表 Else p2=p2->next;//p2->docId不可能有匹配;构造新的剩余列表 End ●面向对象风格的伪代码: 注:为一个数据结构(对象)定义方法,通过方法操作自己的内部数据(List对象里隐含包含了一个成员变量,它是真正的链表或变长数组)。 While list1.currentItem() != null AND list2.currentItem() != null If list1.currentItem().getDocId() == list2.currentItem().getDocId() answer.insert(list1.currentItem()); list1.moveToNext(); list2.moveToNext(); Else if list1.currentItem().getDocId() < list2.currentItem().getDocId() list1.moveToNext(); Else list2.moveToNext(); End

相关文档
最新文档