信息存储与检索

信息存储与检索
信息存储与检索

第一章

1.信息的涵义:

申农(信息论创始人):用于消除随机不确定性的东西(信源、信宿)

广义信息是物质、能量存在和运动状态的表征.

狭义信息是人类社会共享的一切知识、学问以及从客观现象中提炼出来的各种消息的总和,即现代信息

2.资源的涵义

资源是一切被人类开发和利用的客观存在。

3.信息资源的涵义

狭义指文献资源或数据资源,抑或各种媒介和形式的信息的集合,包括文字、声像、印刷品、电子信息、数据库等。这都是限于信息的本身。

广义信息资源是信息活动中各种要素的总称。这既包含了信息本身,也包括了与信息相关的人员、设备、技术和资金等各种资源

(1)原始数据与信息的区别

原始数据经过加工处理变为信息

(2)信息与信息资源的区别

经过加工、可被利用的信息称为信息资源。 information resource为复数时,常指信息及与信息有关的设备、人员等集合,是经过人类选取、组织、序化的有用信息的集合。

(1)信息资源是信息的集体;

(2)信息资源是经过人类选择、获取的有用信息的集合;

(3)信息资源是经过人类组织序化的信息的集合。

4.信息的基本性质

(1)信息是内容是客观的(2)信息的形式是主观的(3)信息是一切物质的基本属性

5.与信息有关的概念

(1)知识。

是对客观事物规律性认识,是系统化和精炼化的信息

知识的三种存在方式:大脑、实物、文献

知识的七个特征:①不可替代性②不可相加性③不可逆性④不可磨损性⑤不可分性⑥可共享性⑦无限增值性

知识分类:①事实知识(Know What)②原理知识( Know why)③技能知识( Know how)④人力知识( Know who)⑤时间知识( Know When)⑥空间知识( Know Where)⑦数量知识( Know Quantity )

(2)文献。是记录知识的一切载体,即用文字、图形、符号、或声视频等记录方式在一定介质上所生成的物质成果

文献的三要素:记录、知识、载体

文献的功能:①存储功能②传递功能③认识功能

(3)情报。指为一定目的而搜集和传递的有特定效用的知识

情报的基本属性:传递性、效用性

6.信息资源的基本特征

(1)普遍性(2)传递性(3)时效性(4)价值性(5)可转换性(6)可利用性(7)可共享性

7.按性质划分

(1)自然信息资源(2)社会信息资源

按信息包含范围划分

(1)广义信息资源(2)狭义信息资源

按信息资源的载体

(1)印刷型信息资源(2)微缩型信息资源(3)声像性信息资源(4)电子型信息资源

按内容

(1)文献型信息资源(2)数据型信息资源(3)多媒体信息资源

按保密程度

(1)公开性信息资源(2)半公开性信息资源(3)非公开性信息资源

按表现形式

(1)文字性信息(2)图像性信息(3)数值数据性信息(4)语音性信息

按信息资源的加工程度

(1)一次信息(2)二次信息(3)三次信息

按传输方式

(1)网络信息资源(2)非网络信息资源

按数据资源信息的生产途径和发布范围分

(1)商用电子资源(2)网络公开学术资源(3)特色信息资源

8.信息素质教育

信息素质教育:

是从各种信息资源中检索、评价使用信息的能力。是培养信息意识的一条重要的途径。

9.电子信息资源含义与特点

(1)、存储形式多样化,文本、超文本、多媒体、超媒体(2)、资源数字化(3)、交流程度高(4)、提高利用率(5)、内容丰富(6)、载体容量大

10.网络信息资源的类型

按照网络传输协议不同分

(1)Web信息资源:通过HTTP在网上传输

(2)Telnet信息资源:基于网络通讯协议

(3)FTP信息资源:通过FTP协议可完成完整的文件拷贝

(4)用户服务组信息资源:由一组对某一特定主题有共同兴趣的网络用户组成的电子论坛。

(5)Gopher信息资源:Gopher是一种基于菜单的网络服务,允许用户以一种简单的、一致的方式快速找到并访问所需的网络资源。

按信息传播交流过程分

(1)稳定的电子信息资源(2)不稳定的电子信息资源

按网络信息资源的表现形式分

(1)电子图书型(2)电子期刊型(3)电子报纸型

(4)联机系统与联机数据库(5)数字图书馆

按照存取方式分

(1)邮件型(2)电话型(3)揭示板型(4)广播型

(5)图书馆型(6)书目型(7)交互型

按电子数据库内容分

(1)参考数据库(2)源数据库(3)混合型数据库

(1)参考数据库指导用户到另一个信息源中获取原文或其他细节的数据库。分为:书目数据库和指南数据库

指南数据库(REERRENCE DATABASES)也称指示性数据库,是指存储关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有关信息获取更详细的信息的一类数据库。

如产品目录、机构名录、研发项目、基金项目等数据库均属于此类型。

(2)源数据库(source databases):

直接提供原始资料和具体数据的数据库

全文数据库数值数据库科学技术数据统计数据库

文本-数值数据库公司信息库产品市场数据库术语数据库

汉语主题词数据库图象数据库建筑图纸数据库

(3)混合型数据库

磁媒体数据库光盘数据库多媒体数据库

11.网络信息资源的特征

(1)、信息内容丰富(2)、信息变化频繁(3)、信息结构复杂(4)、格式多样化(5)、信息价值不一

网络信息资源的发展变化

(1)、网络信息资源数量规模的急剧增大(2)、信息资源内容趋于规范

网络信息资源的评价

(1)资源内容评价指标①数据库的规模②数据库的范围③数据库的质量控制④数据库的实效性

(2)信息组织管理的评价指标①信息收集方法②信息更新周期③信息管理方式(3)信息检索功能的评价指标①布尔逻辑检索②精确检索③截词检索

(4)检索结果评价指标①结果满意度②相关性排序③显示内容形式

印刷型信息资源的特点

(1)实用性:携带、书写、保存方便

(2)直观性:阅读不需借助计算机等工具。

(3)不可替代性:以纸质为载体的艺术作品的不可替代性

(4)增值性:质文献作为收藏品的不可替代性

按文献的加工深度划分

零次文献:指未经公开交流的最原始的文献。如论文手稿、新闻稿、未审核的工程图纸、实验记录、会议记录。

特点:内容庞杂,来源真实,成熟度差

一次文献:以著者本人的研究成果为依据而形成,并在社会上公开交流或发表的文献。如期刊论文、研究报告、预印本、会议论文、专利说明书、学位论文、技术标准等。

特点:零散、无序、难获取

第一,创造性;第二,原始性;第三,多样性;

二次文献:是把分散、无组织一次文献进行收集、加工、整理压缩而形成的并能按期外部特征提供查找线索的文献形式。如目录、题录、文摘、索引等

特点:

第一,集中性;第二,工具性;第三,系统性;

三次文献:利用二次文献对一次文献进行综合、归纳和分析的基础上而形成的述评性、综述性文献形式。

特点:

第一,综合性;第二,针对性;第三,科学性;

12.其他载体文献信息资源

印刷型文献信息资源特点:存储密度小、占据空间大、阅读携带方便

微缩型文献信息资源特点:存储密度小、占据空间大、阅读携带方便

声像型文献信息资源特点:直观、形象

电子型文献信息资源特点:存储密度高、存取快、数据可修改、删除、更新

第二章

1.信息存储与检索概念

(1).广义信息检索:指将信息按有序的方式组织和贮存,并根据用户的需求查找出有关信息的过程。包括存入和输出两个方面。

(2).狭义的信息检索:单指查寻信息的过程,即从信息集合之中查寻出所需要的符合要求的信息的过程。

(3).信息存储:是按主题词表或分类表及使用原则对原始信息资源进行处理,形成信息特征标识,为检索提供整序(即提供检索途径的)的信息集合的过程。(4).信息存储与检索的基本原理:查询语言(检索提问)和系统标识语言所进行的“相符性比较”与“匹配运算”。

(5).直接检索:直接从信息源或信息文献载体中获取信息

(6).间接检索:通过检索工具指引来获取所需信息。

(7)、信息检索通常包括4种类型:

一是关于文献的检索;二是关于某事实或事项的知识检索;三是关于数值或数据的情报检索;四是关于图象信息的信息检索。

2.信息存储

(1).信息的印刷存储

特点:直观易读、携带方便。缺点:存储信息密度低、存储传输慢,难以长期保存

(2).信息的微缩存储

特点:容量大、密度高,忠实于信息原件、不出差错;成本低、保存时间长(3).信息的磁存储

(1)磁存储的特点

能存储一切可转换成电信号信息。文字、声、像;可长久保存、重复使用、可擦写;可同时进行多路信息存储,并保证信息之间的时间和位相关系;存储频带宽广;可高速存储高频信息慢速播放或慢速存入低频信息快速播放

(2)磁存储类型

计算机磁带硬盘软盘光盘温盘

(4),半导体存储

是采用集成化的技术将存储单元电路及其外围电路直接置放在半导体芯片上支撑的。

(5),光盘存储

特点:信息存储密度高

价格低

方便存取、方便与计算机连接

显示信息种类多

坚固耐用,存储寿命长

计算机的存取技术与设备

网络存储

3.按检索活动的执行主体

手工检索

利用人工信息存取系统检索信息的活动,如各类纸质书目、索引、文摘、卡片

检索过程:人工的手翻、眼看、大脑分析和判断

优点:①不需要辅助设备,适应性好②成本低,检索工具可长期无限制使用③检索前随时获得反馈信息,及时修改检索策略④可以把几种检索工具进行对比参照。缺点:①费时费力②检索工具提供检索点有限,主题专深文献

按检索工具类型

(1)目录与题录检索

(2)文摘检索

(3)字典型检索

(4)交互式检索

(5)索引检索

按照检索方式划分

有先组式索引和后组式索引。

按照索引所包括的对象划分

有综合索引和专门索引

依据索引标题词的性质划分

有揭示信息资源内容特征的主题索引、分类索引、关键词索引、分子式索引、结构式索引;

有揭示信息资源形式特征的题名索引、人名索引、物名索引、代码索引、引文索引。

依据索引标题词的排序方式划分

有按照标题词字顺组织的主题索引、题名索引、人名索引、关键词索引、语词索引等;

有按照文献代码组织的报告号索引、合同号索引、标准号索引等;

有按其它排序方式组织的网络信息自动索引、重量索引、速度索引、专用索引等4.主题索引优缺点

(1)能把属于不同学科、不同知识体系中论述的同一主题的资源集中标引出来,届时资料比较深入、广泛。

(2)查考文献资料时,需要正确选取主题词,否则难以准确查到

5.关键词索引自然语言检索标识;自然语言多指关键词,直接从文献篇名、正文或文摘中抽取,未经优选和规范化

自然语言检索优点

(1)不受词表控制,能及时检索到最新概念的各类文献

(2)可任意选取专指性强的语言,提高查准率

(3)非受控词具有数量大的特点,比叙词表大2~3个数量级。

(4)避免在标引人员和用户之间造成不必要的交流障碍

自然语言检索缺点

(1)不规范,存在大量同义词、多义词和含义模糊现象。

(2)没有显示词语之间的关系

规范语言检索标识。

6.组配索引

1 按组配方式

(1)先组式检索语言

指检索前,检索词已被预先组配好的一种检索语言

分为定组型和散组型编制检索语言词表的时已经预先固定组配

(2)后组式检索语言指表达文献信息主题的标识,在编制检索语言词表和标引文献的时候,都不预先固定组配,而是在检索进行时根据检索的实际需要,按照组配规则临时进行组配的检索语言

先后组式检索语言评价

(1)先组式有利于提高检索词的专指度,减少标引到每个词的文献数量,减少和避免假组配,从而有利于查准率

(2)先组式的词在数量上是有限的,不能适应各种角度和深度的符合概念检索(3)后组式便于各种角度和深度的检索,有利于查准率的提高,但有可能出现假组配,致使误检的增多。

7.文摘与索引的异同点:文摘是指对一篇文献内容所作的简略、准确的摘录 , 一般不包含有对原文补充、解释或评论

共同点都以论文、文章、报告为主要报道对象

不同点:1)索引报道文献的外表特征为主,文摘报道文献的内容特征为主2)从形式上,索引一般没有摘录,文摘没有原文评价

3)文摘很少收录综合性的文献,按分类编排,不按主题和著者。

4)文摘比索引报到时间慢,文摘比索引少。

5)索引告诉读者文章位置,没有论文的内容,是否有价值。

第三章

1.计算机检索技术的发展

(1)脱机检索

(2)联机检索

(3)国际联机检索实现了人类情报资源的共享。

优点:信息量大、快速、方便,数据库内容更新快

(4)单机光盘检索

(5)光盘网络检索

(6)Web信息资源检索

逻辑运算符的优先顺序为NOT、AND、OR,如果要改变运算顺序需要用“()”

2.提问检索式构造

句子切分 词汇剔除 概念替换 概念限定与补充 组合式检索式

3.信息检索一般方法(4) 排除、限定和合取法

①排除法:对查找对象的产生和存在的状态在时间和空间上加以外在否定。

排除法可在时间或空间上可极大地收缩检索范围。如要查中国网络资源建设的文章,确定1994年以前Internet未进入中国,则可排除1994年以前的报刊资料。

②限定法:指对查找对象在时间和空间上加以内在的肯定。排除的结果必然是限定,反之亦然

③合取法:如果把不同资料中涉及所需信息的记载都截取下来,汇集在一起,再经过去粗取精、去伪存真地加工,构成一个完整的答案。

善于跨种类地综合利用各种类、各文种的参考工具书,注意比较它们各自的特点,有步骤、按次序地进行查找;

不仅利用二次文献,而且利用一次文献和三次文献;

不仅要利用文字资料,还要注意利用图象资料;

不仅要利用电子信息,也要考虑缩微资料、印刷品和档案材料;

不仅要注意参考工具书的正文,还要充分利用其附录。

4.选择检索方法的原则

①如果检索工具缺藏或根本没有,研究课题涉及面又不大,对查全率不作较高要求,可采用由近及远追溯法。追溯的起点最好是所附参考文献较多的论文及论著还有一些信息研究成果如“评述”、“综述”等。

②如果检索工具齐备,研究课题涉及的范围大,则应采用常用法或综合法查找。

③如果研究课题属于新兴学科或知识更新快的学科,可采用倒查法。

④如果研究课题对查全率作特别要求,如开题查新,一般可采用顺查法。

⑤如果已经掌握了课题发展的规律、特点,一般可采用抽查法。

5.计算机检索常用法

(1).菜单检索:

用户不必记忆复杂的指令,只需在系统给出的菜单中选择项目来完成各项操作缺点:检索步骤多,且检索精确度不及指令检索

(2). 指令检索:

又称命令检索,是一种依靠各种指令来完成操作的检索方法。

(3). 浏览式检索:

用于网络信息资源的超文本或超媒体查询

(4). 提问—回答式检索

目标明确,技术规范,检索速度快,查全率和查准率高,可广泛用于

光盘数据库和搜索引擎。

基本查询、二次检索、词组检索、索引词典检索、高级检索、综合检索

6. 信息检索的意义和作用:

(1)有利于培养具有获取最新信息和自我知识更新能力的复合型、开拓性人才(2)有利于节省科研时间,提高科研效率。

可把我们引导到超越教学大纲的更多的知识范围中去

(3)有利于为决策提供科学依据

(4)有利于减少重复劳动,提高科研成功率,避免走弯路。

第四章

1.计算机信息检索技术的特征:

(1)速度快、效率高

(2)检所范围广

(3)不受时空限制

(4)数据更新频率高

(5)辅助功能完善

2.计算机信息检索系统的组成

计算机信息检索系统:

(1)信息源

(2)信息组织管理

(3) 系统功能

(4) 用户接口

(5) 系统支持技术

(1) 硬件部分指以计算机主机为中心的一系列及其设备,包括主机、外围设备记忆与数据处理或数据传送有关的其他设备

(2) 软件设备信息检索系统中的有关程序和各种文件资料的总称。操作系统、数据库管理、汇编、文件管理、词表管理、回溯、通讯管理、总控程序等软件由

系统维护软件与检索软件构成。系统维护软件,如数据库管理程序、词表管理程序等,其作用是保障检索系统的高效运转。检索软件是用户与系统的界面,用户通过检索软件进行检索,检索软件功能的强弱直接影响着检索效果。

(3) 机读数据库是将数据按照一定格式存储在计算机内的数据的

仓库,即存储在计算机内的相关数据的集合。系统拥有的各种数据库成为联机数据库,由系统本身自建或有数据库生产者提供。为了节省空存储的空间并便于随机存取,系统要建立主文档的索引文档,指明每条记录的存储地址按提供的内容网络信息资源可分为:

(1)参考型数据库。指引用户到另一信息源以获得原文或其他细节的一类数据库。包括各种书目数据库和引文数据库。这种数据库具有参考和评价的功能,多用于查新、开题。如:SCI、EI、维普的中文期刊数据库

(2)全文数据库。指存储文献全文或其中主要部分的数据库。如新闻消息全文库、法律法规全文库、博硕论文全文库等。

(3)事实型数据库。直接提供事实或数值的数据库。如:万方的企业产品数据库、彼得森大学指南等。

(4)电子图书。计算机利用计算机检索并下载阅读的图书。如:书生之家、超星数字图书馆、各种数字图书馆等。

(5)电子期刊。直接在网上就可以检索和阅读的期刊。如:万方数字化期刊,中国期刊网全文数据库,science online等

(6)电子报纸。如:人民日报的网络版。

(7)其它类型。如电子公告版(bbs),网络论坛、新闻等

按是否收费网络数据库可分为

(1)商业数据库:内容系统、丰富、全面。图书馆通过购买获得的都是商业数据库,如:Ei Village、《中国期刊网全文数据库》。

(2)免费数据库:逊于商业数据库。一般是由政府部门开发,提供相关信息;或是暂未成熟收费的商业数据库。

第五章

1.联机检索系统的基本结构

包括检索终端、通信网和联机检索中心三部分。

检索终端(硬件):显示器、键盘、打印机、电传终端等微机终端

通信网:公用电话网、专用数据通讯网、公用数据网

联机检索中心:中央计算机、联机数据库、检索与管理软件以相应的检索服务体制组成

(1)检索范围广

(2)数据库种类多

(3)检索效率高

(4)检索效果好

(5)具有灵活的服务方式和输出方式

2.国际联机检索特点

(1)检索速度快,一般课题均可以几分钟之内完成联机过程。

(2)资源丰富,四大情报检索系统具有丰富的情报源。

(3)可及时得到最新信息。一些大型数据库更新速度极为迅速,如CA、BA等均

是每周更新,联机数据库的信息至少比书本式工具书快一至两个月。

国际联机检索缺点

(1)集中式的管理使主机负担重,一旦出现故障,整个网络瘫痪。

(2)在信息组织上,联机检索是普通文本,以线性方式组织

(3)不能像Internet共享网络中的各个资源.

(4)联机系统需要专业知识,费用较高。

3.匹配模式

模式选项分为两种:模糊匹配和精确匹配。

“模糊匹配”的结果范围通常情况下会比“精确匹配”的结果范围大些。如果要检索的是一个生僻词,建议使用“模糊匹配”检索篇名、作者、关键词、中文摘要、中文刊名以及篇名/关键词/摘要这些字段支持匹配模式选择。

4.联机信息检索与网络信息检索比较

(1)联机信息检索与网络信息检索的相似之处

①检索实质相同

②逻辑组织大体相同

③提供检索的逻辑组配手段相似

④检索入口相同

(2)联机信息检索与网络信息检索的差异

①标引所依据的语言不同

②系统界面设计不同

③信息组织方式不同

5.联机信息检索与网络信息检索效益比较

1. 联机信息检索的优势和缺陷

优势:

(1)联机存取系统在信息数量上的优势

(2)联机存取系统在信息质量上的优势

(3)联机存取系统在检索效率上的优势

缺陷:

(1)联机信息检索费用昂贵

(2)联机信息检索需要一定的检索技巧

2.基于Internet的网络信息检索的优势和缺陷

优势:

(1)检索费用低

(2)用户界面友好

(3)信息内容和形式新颖多样、原文可获得性高

缺陷:

网络上免费提供的信息质量、时效性和可靠性还不能得到充分的保证

由于缺乏必要的管理和法律制约,Internet上的信息资源开发与服务还存在着各种问题,如网络安全、有害与违法信息的传播、版权保护、信息资源的管理和组织、网络信息检索的检索低等问题。

6.网络环境下联机信息检索发展策略

1 联入Internet

2 改善用户界面

3 调整收费制度

信息存储与检索复习资料

一、名词解释 1. 主题标引:是在主题分析的基础上,依据一定的主题词表或主题标引规则,赋予信息资源语词标识的过程。 2. INTERNET(因特网):泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络。 3.顺查法:就是以课题研究的起始年限为出发点,利用选定的检索工具如书目、索引、文摘又远及近的逐年查找。 4.三次文献: 是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为“情报研究”的成果 5.文献信息资源:文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源。 6. 倒查法:一种逆时间顺序由近而远地查找信息的方法. 7. 一次文献:即原始文献。它是作者以生产或科研为依据而创作的原始文献。如专著、期刊论文、学位论文等。 8. 检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等。它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言。 9. 手工检索:是由检索者通过卡片式或书本式的目录、题录、文摘、索引等检索工具查找文献线索的过程。 10. 信息检索语言:信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言。 11. 特种文献:特种文献是指出版发行和获取途径都比较特殊的科技文献。特种文献一般包括会议文献、科技报告、专利文献、学位论文、标准文献等。 12.间接检索法:利用一定检索工具进行文献检索 13. 专利:有三层含义:一指受专利法保护的发明,二是指专利权,三指专利说明书等专利文献。这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体体现。 14.搜索引擎:是一种 Web 上应用的软件系统,它以一定的策略在 Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务。用户可以通过主题浏览和关键词检索的方式搜索所需信息。 15. 技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有保密性和内部使用的特点。 16. 索引:根据标题法的原理,将类目及其注释改成标题形式,按字顺排列,并注明相应的分类号。这样不仅可方便查表,而且还可将分类表中因为按学科分类而被分散的同一事物不同方面的类目集中,使分类法在某种程度上兼有主题法的性能。 17.抽查法:针对研究课题发展的特点,选择有关的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。 18. 回溯检索:又叫追溯法,是以某一篇文献末尾所附的参考文献为依据,由近及远进行逐一追踪的查找方法. 19. 循环检索:先利用检索工具查出一批有用文献,然后再利用这些文献末尾所附参考文献的线索进行追溯查找. 20. 追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法。 21. 分类标引:对档案给予分类号标识的过程。 22. 目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。 1.信息——是世界上一切事物的状态和特征的反映,是用文字、数据或信号等形式,通过一定的传递和处理,来表现各种相互联系客观事物在运动变化中所具有特征内容的总称。 2.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。 3.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。 1.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 2.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。 3.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化。1.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识的原始来源和属性的数据库。 1.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。 2.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。 3.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。

信息存储与检索期期末试卷A

淮安信息职业技术学院2007~2008学年度第二学期 《 信息存储与检索 》期末试卷(A 卷) 考试班级:650514 1、模型、碑刻属于哪类信息资源( )。 A .口语信息资源 B. 体语信息资源 C.实物信息资源 D.文献信息资源 2、期刊、报纸属于哪种文献类型( )。 A . 图书 B. 工具书 C.连续出版物 D.特种文献 3、甲乙二人各有一条信息,二人交流后,每人拥有两条信息,说明信息具有( )。 A 客观性 B 相对性 C 依存性 D 共享性 4、查找特定类型的文件的高级搜索语法命令为( )。 A :filetype B :intitle C :site D :inurl 5、手册属于哪类检索工具书的范畴( )。 A.检索性工具书 B.参考性工具书 C.词语性工具书 D.图录性工具书 6、在没有检索工具或检索工具不齐备的情况下,我们可以使用( )。 A . 直接检索法 B. 抽查法 C.回溯检索法 D.循环检索法 7、下列各项属于类书的是( )。 A .《永乐大典》和《资治通鉴》 B. 《永乐大典》和《古今图书集成》 C. 《四库全书》和《古今图书集成》 D. 《天下郡国利病书》和《四库全书》 8、关于全文型(索引型)搜索引擎信息采集和索引机制,错误的说法是( )。 A. 采用网页采集机器人robot ,循着超链接不停采集访问到的页面 B. 网页采集机器人可以采集到所有的页面 C. 自动提取网页中的关键词建立索引 D. 网页的更新有一定的周期,有时候存储的网页信息已经过时 9、分类搜索引擎的典型代表是( ) 。 A .Google B .Baidu C .Yahoo! D .Search 系部 : 班 级: 学 号: 姓名 :

网络信息检索试题及答案(DOC)

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有( C )特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含( B ): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?( A ) A. 文摘 B. 会议文献 C. 辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于( A )。 A. 零次文献 B. 一次文献 C. 二次文献 D. 三次文献 9、下列选项中哪一项属于“国内统一刊号”(C )。 A. ISBN 7-04-014623-1 B. ISSN 0254-4164 C. CN 11-2127/TP D. 0254-4164/TP 10、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( C )参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL] .(2001-12-19) [2002-04- 15]. http:∥www. ….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( B )参考文献的著录条目描述。 昂温G,昂温P S .外国出版史[M]. 陈生铮,译. 北京:中国书籍出版社, 2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》 E、《机械工业出版社2012年图书征订目录》 F、《计算机科学技术百科全书》 G、《计算机工程与应用》 H、《网络营销》 I、《NASA报告》。 J、《博士论文:论网络时代的商务模

信息存储与检索课堂笔记

第1章信息检索概论 1.信息的定义: 从认识论出发,我国大多数学者认为: 信息具有物质属性,是物质的一种存在形式,它以物质的属性或运动状态为内容,并且总是借助于一定的物质载体传输或存储。 2.信息的特征: (1)传递性 (2)时效性 (3)共享性 (4)客观性 其他的特性还有开发性、存储性、价值的不定性、变换性、可伪性等。 3. 信息检索(Information Retrieval) 定义: 广义概念——是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,故全称:“信息存储与检索(Information Storage and Retrieval ) 。 狭义概念——仅指上述过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。 4.信息检索的基本步骤 课题分析,明确检索范围 选择检索系统和检索工具 确定检索点和检索途径 构造检索式 选定检索方法 索取原始文献 5.计算机检索的发展历程 计算机检索是在计算机技术和通信技术发展的基础上建立起来的。它产生于20世纪50年代,发展于80年代中期,90年代后随着国际互联网技术的发展而进入了一个崭新的时期。发展历程大致可以概括为: 手工信息检索阶段(1954之前) 脱机信息检索阶段(1954/1964) 联机信息检索阶段(1965/1971) 光盘信息检索阶段(1972/1994) 网络信息检索阶段(1995年至今) 6.知识的定义 人们通过实践对客观事物及其运动过程和规律的认识。在这里,知识作广义的理解,包括消息、情况、事实、数据。 知识可分为理性知识和感性知识。理性知识,是对客观事物的本质和规律性的认识,是经过思维、逻辑加工的知识,构成知识体系;感性知识,是对客观事物的描述和对现象、事实的感知,是未经逻辑加工的知识。 知识的分类 知识按不同标准可作如下分类:

信息存储与检索B卷

济南大学继续教育学院信息存储与检索试卷(B) 学年:学期: 年级:专业:学习形式:层次: (本试题满分100分,时间90分钟) 一.选择题(每题2分,共20分) 1.《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是()。 A、G636.33 B、G216.2 C、I247.4 D、H319 2.布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是() A、检索出除了中年教师以外的在职人员的数据 B、中年教师的数据 C、中年和教师的数据 D、在职人员的数据 3.()是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比 率。 A、查全率 B、查准率 C、误检率 D、漏检率 4.布尔逻辑检索中检索符号“OR”的主要作用在于()。 A、提高查准率 B、提高查全率 C、排除不必要信息 D、减少文献输出量 5.根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定 的方法编排,并指明出处,为用户提供文献线索的一种检索工具是()。 A、目录 B、题录 C、索引 D、文摘 6.文献按载体形式可分为:印刷型、缩微型、声像型和() A、甲骨型 B、金石型 C、电脑型 D、机读型 7.信息检索系统的功能为:报道文献信息、存储文献信息和() A、揭示文献信息 B、检索文献信息 C、宣传文献信息 D、介绍文献信息 8.知识是指人类对客观世界的认识。知识可分为() A、有用知识和无用知识 B、基础知识和高级知识 C、感性知识和理性知识 D、理论知识和实践知识 9.检索系统的结构由几个部分组成:编辑使用说明、索引、附录、词表和() A、目次 B、题录 C、附图 D、正文(主文档) 10.为便于计算机识别记录的各个字段,每个字段都设有字段标识符,下列哪个字段的 标识叙述是正确的() A、TI是题名的标识符 B、AB是关键词的标识符 C、AU是摘要的标识符 D、AF是著者的标识符 二.多选题(每题2分,共20分) 1.信息检索的常用途径有:主题词、关键词、顺序号、引文和() A.题录 B.作者 C.全文 D.题名 E.分类 2.工具法查找文献信息资源的方法可分为() A.顺查法 B.调查法 C.抽查法 D.倒查法 E.取样法 3.常见的索引有以下几种() A.分类索引 B.主题索引 C.著者索引 D.编号索引 E.引文索引 4.信息检索效果评价标准为(A、D、E) A.查全率 B.错误率 C.准确率 D.查准率 E.漏检率 5.查找中文会议论文全文资料,可利用下列哪些数据库进行查找。() A.国研网 https://www.360docs.net/doc/3b10709520.html,KI C.维普科技期刊全文数据库 D.人大复印资料 E.万方数据资源 6.用户在超星电子图书馆中可享受的服务为() A.下载图书 B.添加个人书签 C.发表评论 D.讨论 E.标注 7.Elsevier数据库(国外站点)SDOL主页的菜单栏内容:Home,Browse,Search和() A.My Alert B.My settings C.Help D.Tools E.Alert 8.SD数据库的期刊浏览提供的浏览方式为() A.依刊/书名字母顺序浏览 B.依文章的篇名字母顺序浏览 C.依期刊/图书内容所属学科主题分类浏览 D.个人定制内容浏览 第 1 页共2 页

情报检索试题及答案

一、单项选择题(共20题,1分/题,共20分) 1. 刘志强.我国农业生态环境可持续发展评价及对策[J].农业系统科学与综合研究,200l,17(3):24-26该参考文献的17(3):24-26的含义应该是: a.17卷3页24-26行 b. 17卷3页24-26行 c. 17卷3期24-26页 d. 17期3部分24-26页 2. ISSN0023-1231.是_____ a. 国际标准书号 b.国际标准刊号 c.图书分类号 d. 标准号 (国际标准书号:ISBN) 3. 查找某一年的新闻、事件、数据和统计资料,应该用___ __类参考工具书。 a.百科全书 b.手册 c.年鉴 d.统计资料 4. 在以下列出的搜索引擎中哪一种是专门搜索学协会数据库资源的搜索引擎? a. Google scholar b.Google book search c.Scirus d. Scitopia 5. 用google在华中科技大学的网站内进行站内搜索应使用: a. link: b. related: c. site: d. info: 6. 在ELSVIER SCIENCE DIRECT数据库中使用哪个符号表示精确检索: a. “” b.() c.[ ] d.{ } 7.可以检索color或者colour的最常用检索式是: a. 输入:color或者colour b. 输入:color and colour c. 输入:color*colour d.输入:colo?r 8. 我馆购买的下列名称的检索工具中,目前不能用来检索学位论文的是: a. CNKI b. 维普 c. Proquest d. 万方 9. 用维普《中文科技期刊数据库》查询刊物《图书情报知识》的关于数字图书馆的文献,检索式为: a. K=数字图书馆*图书情报知识 b. K=数字图书馆+J=图书情报知识 c. K=数字图书馆*J=图书情报知识 d. K=数字图书馆*A=图书情报知识 10. 某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论 文总数得出的结果是: a.影响因子b.立即影响指数c.H指数d.Eigenfactor 11. 用IEEE检索系统检索computer programming方面的论文,限定computer和programming 词序一定但间隔至多不能超过2个单词,则检索式应该是: https://www.360docs.net/doc/3b10709520.html,puter 2w Programming https://www.360docs.net/doc/3b10709520.html,puter NEAR/2 Programming https://www.360docs.net/doc/3b10709520.html,puter w2 Programming d. .Computer ONEAR/2 Programming 12.下面哪个出版社不是新成立的纯OA出版社?

文献检索复习题(名解-简答)

文献检索复习题(名解-简答)

文献检索复习题 一、名词解释 1.二次文献信息:二次文献也称二级文献,它是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储,使之系统化,以便于检索利用。 2.学科化服务:指图书馆设专人与某一学科专业作为对口单位建立联系,在院系、学科专业与图书馆之间架起一座桥梁,相互沟通,为用户主动地,有针对性的收集和提供文献信息的服务。 3.网络电子图书:以电子图书形式发行,以互联网为流通渠道,以数字内容为流通介质,以网上交易为主要支付手段的图书。 4.专利文献:是实行专利制度的国家、地区及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。 5.引文分析法:引文分析法,就是利用各种数学及统计学的方法进行比较、归纳、抽象、概括等的逻辑方法,对科学期刊、论文、著者等分析对象的引用和被引用现象进行分析,以揭示其数量特征和内在规律的一种信息计量研究方法。

6.书目数据库:是指存储某些或某一个领域的二次文献书目数据的一类数据库。 7.个性化导读服务:又称阅读指导服务,是图书馆针对各类型读者,采取各种措施主动诱导读者的阅读行为,提高其阅读意识,阅读能力和阅读效益的一种教育活动。 8.双词频控制检索:指对一个检索项中的两检索词分别实行词频控制,也就是一个检索项使用了两次词频控制。是针对单项双词组合检索而设置的。 9.专利法:专利法是确认发明人(或其权利继受人)对其发明享有专有权,规定专利权人的权利和义务的法 10.网络信息资源:网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。具体的说是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。 11.参考数据库:指为用户提供信息线索的数据库,它可以指引用户获取原始信息。参考数据库包括书目数据库(Bibliographic Database)和指南数据库(Referral Database)。

《信息检索与利用》期末复习1

《信息检索与利用》期末复习 试题题型 一、填空题(每空3分,共15分) 二、选择题(每题3分,共30分) 三、判断题(每题3分,共30分) 四、简答题(共25分) 1.(12分) 2.(13分) 复习题 第一章信息资源检索基础知识 一、填空题 1.___________________________是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。信息 2.___________________________是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。知识 3.___________________________是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。情报 4.___________________________是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。文献 5.___________________________是指在国内外学术或非学术会议上发表的论文或报告。会议文献 6.___________________________是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。学位论文 7.___________________________是对文献内容和形式特征进行选择和记录的过程。著录8.___________________________是指特定的数值型数据为对象的检索。数据检索 9.___________________________是指以特定的事实为目标的检索。事实检索 10.事实与数据检索工具主要依靠各类___________________________完成各种数据或事实的查询。参考工具书 11.按照结构原理,信息检索语言可以分为_____________________、____________________、

信息存储与检索

第一章 1.信息的涵义: 申农(信息论创始人):用于消除随机不确定性的东西(信源、信宿) 广义信息是物质、能量存在和运动状态的表征. 狭义信息是人类社会共享的一切知识、学问以及从客观现象中提炼出来的各种消息的总和,即现代信息 2.资源的涵义 资源是一切被人类开发和利用的客观存在。 3.信息资源的涵义 狭义指文献资源或数据资源,抑或各种媒介和形式的信息的集合,包括文字、声像、印刷品、电子信息、数据库等。这都是限于信息的本身。 广义信息资源是信息活动中各种要素的总称。这既包含了信息本身,也包括了与信息相关的人员、设备、技术和资金等各种资源 (1)原始数据与信息的区别 原始数据经过加工处理变为信息 (2)信息与信息资源的区别 经过加工、可被利用的信息称为信息资源。 information resource为复数时,常指信息及与信息有关的设备、人员等集合,是经过人类选取、组织、序化的有用信息的集合。 (1)信息资源是信息的集体; (2)信息资源是经过人类选择、获取的有用信息的集合; (3)信息资源是经过人类组织序化的信息的集合。 4.信息的基本性质 (1)信息是内容是客观的(2)信息的形式是主观的(3)信息是一切物质的基本属性 5.与信息有关的概念 (1)知识。 是对客观事物规律性认识,是系统化和精炼化的信息 知识的三种存在方式:大脑、实物、文献 知识的七个特征:①不可替代性②不可相加性③不可逆性④不可磨损性⑤不可分性⑥可共享性⑦无限增值性 知识分类:①事实知识(Know What)②原理知识( Know why)③技能知识( Know how)④人力知识( Know who)⑤时间知识( Know When)⑥空间知识( Know Where)⑦数量知识( Know Quantity ) (2)文献。是记录知识的一切载体,即用文字、图形、符号、或声视频等记录方式在一定介质上所生成的物质成果 文献的三要素:记录、知识、载体 文献的功能:①存储功能②传递功能③认识功能 (3)情报。指为一定目的而搜集和传递的有特定效用的知识 情报的基本属性:传递性、效用性 6.信息资源的基本特征 (1)普遍性(2)传递性(3)时效性(4)价值性(5)可转换性(6)可利用性(7)可共享性

信息检索题目(含答案)

2013年(秋)《信息检索》练习 单选题(每题1分,共45题,45分) 1.计算机中使用的0与1的二进制代码是(C) A.自然信息 B.生物信息 C.机器信息 D.人类信息 2.以下(B)不是信息的基本要素。 A.载体 B.数据库 C.信源 D.信宿 3.国际标准书号中地区号为7,代表其是(B)出版的图书。 A.美国 B.中国大陆 C.俄语系国家 D.法语系 4.以下(D)不是信息的特征。 A.共享性 B.价值型 C.时效性 D.不可扩充性 5.(A)使用的是http协议。 A.WWW网络资源 B.FTP信息资源 C.TELNET信息资源 D.用户服务组资源 6.(B)使用的是ftp协议。 A.WWW网络资源 B.FTP信息资源 C.TELNET信息资源 D.用户服务组资源 7.分类法用(A)作为文献容标识和检索标识。 A.分类号 B.词语 C.阿拉伯数字 D.英文字母

8.主题法用(A)做描述文献主题的标识和检索标识。 正确答案:B A.分类号 B.词语 C.阿拉伯数字 D.英文字母 9.关键词语言属于(B) 正确答案:A A.自然语言 B.标题词语言 C.叙词语言 D.分类语言 10.以下族性检索功能最强的是(A) A.分类途径 B.文献名途径 C.著者途径 D.主题途径 11.(D)是从参考文献着手来查找文献的方法。 A.顺查法 B.倒查法 C.抽查法 D.追溯法 12.一个截词符代表多个字符指的是(D) 正确答案:C A.后截词 B.中截词 C.无限截词 D.有限截词 13.在布尔逻辑检索技术中,用(B)表示在检索结果中只需包含A或者B即可。正确答案:D A. A not B B. A and B C. A - B D. A or B 14.(B)之前,必须输入一个空格。 正确答案:C A.与运算 B.或运算

信息存储与检索 考试必看

一、填空 1、信息资源的特征:共享性、时效性、智能性、无限性和有线性并存、增值性及物质、 资源的一般特征。 2、纸质文件按文献加工深度划分:一次文献、二次文献、三次文献、零次文献。 3、索引款目的构成:索引标题、说明语、地址参考项。 4、多媒体存取技术的核心是:媒体数据库技术。 5、网络信息检索工具有:字典型查询工具、索引型查询工具、交互式检索工具。 6、按系统存取的信息特征划分:文献存取系统、事实存取系统、数值存取系统、图像 存取系统。 7、按检索工具划分:关键词检索工具、分类目录、混合型检索工具。 8、纸质文献资源的四个基本要素:信息内容、载体材料、记录符号和记录方式。 9、按检索系统的工作方式划分:脱机存取、联机存取、光盘存取、因特网存取。 10、文献存取系统包括:书目、全本和超文本。 11、存取系统的检索效果指标:检全率、检准率、检新率。 12、多元性检索工具: 13、中文搜索引擎:谷歌、百度、雅虎、中国搜索、搜狗搜索等。(三个可) 14、多媒体信息存取系统的特征:信息载体的多样性、交互性、实时性、集成性。 二、名称解释: 1、电子信息资源是以数字化形式把文字、图像、声音、动画等多种形式的信息存储在 光、磁盘等非印刷型介质上,并以光信号、电信号的形式传输,通过相应的计算机和其他外部设备再现出来的信息资源。 2、索引是存取信息资源“地址”或“出处”的表示系统,是信息存储与检索的基本形 式。其基本功能是指示知识点在正文或文献款目中得位置。 3、标准文献狭义指按规定程序制订,经公认权威机构(主管机关)批准的一整套在特定 范围(领域)内必须执行的规格、规则、技术要求等规范性文献,简称标准。广义指与标准化工作有关的一切文献。 4、网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。具体的说是指 所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。 5、智能检索以文献和检索词的相关度为基础,综合考查文献的重要性等指标,对检索 结果进行排序,以提供更高的检索效率。它是由智能计算机技术与全文检索技术综合发展起来的一种新型检索技术。 6、视频存取技术是近几年来在数字通信、电视和电子计算机技术三者相结合的基础上 发展起来的一种新型的信息存取技术,分为广播式和交互式两种。 7、题名索引是将信息资源的题名特征(书名、刊名、篇名)作为索引标题词所编制的 索引系统。 8、目录是书籍正文前所载的目次,是揭示和报道图书的工具目录是记录图书的书名、 著者、出版与收藏等情况,按照一定的次序编排而成,为反映馆范、指导阅读、检索图书的工具。 9、检索语言是根据信息检索的需要而创制的,能够唯一地表达各种概括文献信息内容 的概念,能够显示概念之间的相互关系,并便于进行系统排列,便于将标引语言和检索用语进行相符性比较的人工语言。 10、信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。一般是通过信息存取系统实现的,通常包括四种

信息存储与检索复习资料答案

信息存储与检索复习资料答案

一、单项选择题 1. 以下哪个数据库提供同名作者检索功能:(D ) A.万方数据库 B.中国期刊全文数据库 C.复印报刊资料全文数据库 D.中文科技期刊全文数据库 2. _______提供一次文献的线索。(B)A.文摘、索引等B.图书C.百科全书D.手册 3. 以下属于特种文献的是( B)。A.图书 B.科技报告 C.报纸D.期刊 4. 用主题词检索只可以检索出对应的() 5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权 6. 利用分类途径进行检索,其检索标识为( C )A.主题词B.关键词C.分类号D.分子式 7. 在一般的著录格式中可以通过_______来判断该文献为会议文献( C ) A.Journal B.Report C.Conference D.Patent 8. 下列选项中,不属于信息能力的有( B ) A.鉴别B.传递 C.评价 D.有效利用 9. 从狭义上说专利文献就是指(专利注明书) 10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这

个按钮的作用是什么?(D) A.测试你当天的手气B.提供最相关的一组检索结果列表 C.提供最相关的一个检索结果的链接 D.直接跳转到系统认为是最相关的页面 11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况(D) A、Citation Index; B、Corporate Index; C、Permuterm Subject Index; D、Source Index; 12. 文献信息检索的全过程包括文献信息的______两个过程( C ) A.存贮和检索 B.存贮和编排 C.标引和编排 D.存贮和标引 13. 利用分类途径进行检索,其检索标识为( C )。A.主题词 B.关键词 C.分类号 D.分子式 14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找?( C. ) A.中文科技期刊全文数据库 B.复印报刊资料全文数据库 C. 超星数字图书馆 D.万方数据资源系统 15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好?(C) A.关键词摘要intitle:知识管理 B.论文知识管理PDF C.学术论文知识管理 D.学术论文intitle:知识管理

(完整版)文献信息检索试题及答案

文献信息检索 一、填空题 1、文献的级次分为零次文献、一次文献、二次文献、三次文献。 2、按内容可将计算机检索系统的数据库类型分为:文献书目型数据库、事实型数据库、数值型数据库和全文型数据库。 4、我国标准可分为国家标准、部标准和企业标准三大类。 5、在实际检索中,文献的检索方法主要有:直查法、追溯法、工具法和综合法。 6、信息检索常用的方法有:引文追溯法、工具法和循环法。 7. 构成文献的三要素是知识、载体和记录。 8. 标准文献的主体是标准。 9. 期刊论文的文献出处包括期刊名称、年卷期和起止页码。 10. 所需信息被检出程度的信息量指标为查全率。 二、选择题 1. 文献是记录有知识的( A ) A 载体 B 纸张 C 光盘 D 磁盘 2. 下列哪种文献属于一次文献( A ) A 期刊论文 B 百科全书 C 综述 D 文摘 3. 下列哪种文献属于二次文献( D ) A 专利文献 B 学位论文 C 会议文献 D 目录 4. 下列哪种文献属于三次文献( C ) A 标准文献 B 学位论文 C 综述 D 文摘 5. 下列选项中属于连续出版物类型的选项有( C ) A 图书 B 学位论文 C 科技期刊 D 会议文献 6. 下列选项中属于特种文献类型的有( D ) A 报纸 B 图书 C 科技期刊 D 标准文献 7. 纸质信息源的载体是( D ) A 光盘 B 缩微平片 C 感光材料 D 纸张

8. 以刊载新闻和评论为主的文献是( B ) A 图书 B 报纸 C 期刊 D 会议文献 9. 使用分类语言对信息进行描述和标引,主要是可以把( B )的信息集中在一起。 A 同一作者 B 同一学科 C 同一主题 D A+B+C 10.《中国图书馆分类法》(简称《中图法》)将图书分成( A ) A 5大部分22个大类 B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 11.《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。 A S类目 B Q类目 C T 类目 D R类目 12. 利用文献末尾所附参考文献进行检索的 方法是( C ) A 倒查法 B 顺查法 C 引文追溯法 D 抽查法 13. 至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为( A ) A 数据库 B 记录 C 字段 D 文档 14. 广义的信息检索包含两个过程( B ) A 检索与利用 B 存储与检索 C 存储与利用 D 检索与报道 15. 狭义的专利文献是指( C ) A 专利公报 B 专利目录 C 专利说明书 D 专利索引 三、判断题 1. 1948年,美国数学家、信息论的创始人维纳在题为《通讯的数学理论》的论文中指出:“信息是用来消除随机不定性的东西”。 ( × ) 2. 从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。(×)----从文献检索的角度来看,一次文献是检索的对象,二次文献是用于检索的主要手段和工具。 3. 《中国图书馆分类法》是按知识门类的学科体系的逻辑次序进行分类。(√)

复习题(有答案)

复习题 一、名词解释及简答 信息的概念及特征 文献及分类 情报、信息、知识、文献的关系 目录 追溯法 文献信息资源 ISBN和ISSN的组成及组成部分的含义 《全国报刊索引》 信息检索的含义及分类(广义的信息检索) 信息检索语言 信息检索的基本原理 布尔逻辑运算中的各种符号的含意 图书馆各种数据库的检索途径 计算机检索系统的构成 计算机信息检索常用的检索技术 四大权威检索数据库是哪些? 专利及分类 试比较分类语言与主题词语言 按信息加工形式分,信息源分为一次文献、二次文献和三次文献,请简述它们及其之间的关系 什么是查全率和查准率?影响查全率和查准率的因素有哪些? 常用的布尔逻辑算符有几种?并简述各自的作用 文献综述 学位论文的含义及分类 参考文献的著录格式 1. 知识: 知识是人们通过实践对客观事物及其运动过程和规律的认识。主观知识、客观知识。

2. 检索工具:检索工具是指用以报导、存贮和查找文献线索的工具。它是附有检索标识的某一围文献条目的集合,是二次文献。 3. 信息检索:广义的,包括信息的存储和检索两个过程,信息存储——指工作人员将大量无序的信息集中起来,根据信息源的外表特征和容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。 信息检索——指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。狭义信息检索:仅指信息的检索过程。从某一信息集合中找出所需的信息的过程,即信息查询。 4. 信息:信息是人们通过感觉器官与外界进行交换的一切容。 1. 知识:知识是人们通过实践对客观事物及其运动过程和规律的认识。主观知识、客观知识 2. 信息:信息是人们通过感觉器官与外界进行交换的一切容。 3. 信息检索:广义的,包括信息的存储和检索两个过程,信息存储——指工作人员将大量无序的信息集中起来,根据信息源的外表特征和容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。 4. 检索工具:检索工具是指用以报导、存贮和查找文献线索的工具。它是附有检索标识的某一围文献条目的集合,是二次文献。 5. 查全率:查全率=[检出相关文献量/文献库相关文献总量]×100% 查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。 5.信息存储:是指通过多种形式记录和排序信息的过程。它包含三层含义:一是将所采集的信息按照一定规则记录在相应的信息载体上;二是将这些载体按照一定的特征和容性质组织成系统有序的、可供自己或者他人检索的集合体;三是应用计算机等先进的技术和手段,提高信息存储的效率和信息利用水平。 6信息检索:是指从以任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的方法与过程。 7.数据仓库:Data Warehouse,是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。

信息存储与检索练习题

信息存储与检索练习题 二、问答题 1.简述信息、资源的概念。 信息:是生物以及具有自动控制系统的机器通过感觉器官或者细胞组织,或者具有类似功能的设备部件与外界进行交流的一切内容。 资源的涵义:资源可分为两个范畴,一是自然界赋予的自然资源;二是人类社会中人的劳动创造的各种资源。资源是一切可被人类开发和利用的客观存在。 2.简述信息资源的概念及特征。 信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据。 共享性这是信息资源区别于物质资源的根本属性之一。一般来说,信息资源可同时为众多的使用者享用,也可被不同时期的使用者使用,同一条信息可以同时为不同领域的人服务、满足不同的需要。而不象物质资源那样具有排他性,即特定的物质资源只能被某些国家、地区或某些群体、甚至个人占有和消耗。当然,一些人可控制或保密的信息,不具有这一特性。 时效性:一般来说,信息资源的时效性,是由事物运动变化的规律决定的。因此,信息资源能否转化为生产力,取决于收集、加工和利用信息是否适时,只有时机适宜,才能发挥最佳效益。 智能性:信息资源是人类按照一定次序开发与组织起来的信息,是人类脑力劳动的产物。 无限性与有限性并存 增值性即对信息资源的投入和使用,不但可以使自然资源、人力资源、资本资源增值,同时信息资源可以一次投入、多次开发利用,并不断产生新的信息使其自身增值。 3.简述电子信息资源含义。 含义:电子信息资源书是以数字化形式(即二进制代码0、1),把文字、图像、声音动画等,多种形式的信息存储在光、磁等非印刷型介质上,以光信号、电信号的形式传输,并通过相应的计算机和其他外部设备再现出来的信息资源。 4.什么是信息检索信息检索的类型有哪些 信息检索的概念:通过一定的方法和手段将用户的提问特征与数据源所采用的特征标志进行对比,然后将二者相一致或比较一致的信息提取出来供用户使用的过程。 类型:文献检索数据检索事实检索 5.简述信息存储与检索原理。 信息检索的全称形式或广义的信息检索,它既包括采用多种形式记录信息、排序信息的信息存储过程,也包括通过一定的设备、采用一定的手段与技巧从信息系统中快速、准确地搜寻所需信息的方法与过程。 信息存储与检索的基本原理:查询语言(检索提问)和系统标识语言所进行的“相符性比较”与“匹配运算”。 6.简述信息存储与检索类型。 一是关于文献的检索;二是关于某事实或事项的知识检索;三是关于数

信息储存与检索考点归纳

1. 信息检索的原理: 从下图可以看出,信息存储和信息检索有两个交汇处:一个是直接的,即表达信息主题内容的词语与表达需求主题内容的词语之间进行对比的交汇;另一个是间接的,即通过检索语言进行沟通,确保把存储用词和检索用词都统一到同一个检索语言体系中(对于自然语言检索系统来说,不存在存储与检索的间接交汇处)。 2.信息检索系统的物理结构一般包括硬件 软件 数据库3个部分。 信息检索系统的逻辑结构 3.信息检索的研究内容包括以下几个方面:(1)信息检索理论研究(2)信息检索方法研究 (3)信息检索技术研究(4)信息检索语言研究(5)信息检索系统研究 (6)信息检索服务研究(7)信息检索评价研究。 4. 任何检索策略都包括3 个部分:文档表示 查询表示 匹配函数。 5..信息检索模型到底是什么?其描述如下: 信息检索模型是一个四元组/D ,Q ,F ,R(qi, dj)/: (1)D 是文档集中的一组文档逻辑视图(表示),称为文档的表示; (2)Q 是一组用户信息需求的逻辑视图(表示),这种视图(表示)称之为查询; 信息资源信息搜集需求分析信息需求信 息用户信息分析信息表达词语 转 换需求表达词语转换数据库 检索结检 索语言 信息存储过 信息检索过 图1-1 广义信息检索的基本 词语子系统 匹配子系统 采选子系统 标引子系统 交互子系统 数据库 用户群 信息源 查询子系统 图1-9 信息检索系统逻辑结构

(3)F 是一种机制,用于构建文档表示,查询及它们之间关系的模型; (4)R(qi, dj)是排序函数,该函数输出一个与查询qi ∈Q 和文档表示dj ∈D 有关的实数,这样就在文档之间根据查询qi 定义了一个顺序。 6经典模型: 布尔模型 向量模型 概率模型。 7对于布尔模型而言,标引词权值变量都是二值的,即wi,j ∈{0, 1},查询q 是一个常规的布尔表达式。用qdnf 表示查询q 的析取范式,qcc 表示qdnf 的任意合取分量。文档dj 和查询q 的相似度可以定义为: . 8.布尔模型优缺点:优点: 一是实现起来比较容易,速度快,计算的代价相对较少; 二是查询语言表达简单,用户可以使用任意复杂的查询表达式,故得到广泛的应用. 缺点;1布尔逻辑式的构造不易全面反映用户的需求。 2匹配标准存在某些不合理的地方。 3检索结果不能按照用户定义的重要性排序输出。 9.( t1 and t2) or ( t3 not t4) 或者qj = ( t1 ∧ t2) ∨ ( t3 t4)。 10.计算机信息检索的基本原理仍是“匹配运算”,但是却不同于手工检索的“匹配运算”方式。 计算机匹配过程中,需要将检索提问式转化成计算机可以识别的形式,并且要使用系统中特定的检索指令、检索词和检索策略,由计算机自动对数据库中各文档记录进行查找。当检索标示、检索策略与数据库中的信息标示关系一致时,即为命中,将结果输出给用户。 11.逻辑提问式即为Q=A*B*C*D. 表展开法是将每个逻辑提问式转换成一个展开表, 如果有N 个提问式就可做N 个展开表。每个检索词对应表中的一行。其一般格式如下: 展开表的生成,根据算法描述的顺序方向划分为两大部分:前处理部分和后处理部分。 前处理部分,也叫正向扫描处理部分。按照逻辑提问式各项因子出现的先后顺序从左到右依次处理。 前处理算法描述: 地址是指该行所在展开表中的地址; 匹配成功时转向地址AFD ,给出一旦在检索词与文献记录中标引词匹配成功时,下一步应该处理的提问检索词在提问表中的地址; 匹配不成功时转向NFD 地址,给出一旦检索词与标引词匹配失败时应该转向展开表中的地址; “层级值” 栏表示当前检索词在提问式中的层次级别;

相关文档
最新文档