存储与检索复习题
信息存储与检索B卷答案

信息存储与检索试卷(B)答案
一.选择题(每题2分,共20分)
DADCC DBCDA
二.多选题(每题2分,共20分)
1、BDE
2、ACD
3、ABCE
4、ADE
5、BE
6、ABC
7、BE
8、ACD
9、BCD 10、BDE
三.判断题(每题2分,共20分)
×√×××√×√×√
四.名词解释(每题5分,共20分)
1.相关度优先:和查询的条件内容最相关的文献优先排在前面。
2.查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量
信息检索系统检出相关文献能力的尺度,可用下面的公式表示:
查全率=(检出相关文献量/系统中相关文献总量)*100%
3.同句检索是要求参加检索运算的两个词必须在同一自然句中出现,其先后顺
序不受限制。
4.跨库检索:可同时检索多个平台上的多种资源,输入一个检索式,便可以看
到多个数据库的查询结果。
五.问答题(每题10分,共20分)
1.文献检索工具的作用是什么?
文献检索工具是用于报道、存贮和查找文献线索的工具,它通过对文献特征的描述,并按一定的科学方法排列、提供多种检索途径,使我们能从文献的汪洋大海里找到特定的文献
2.信息检索的类型按检索对象分为哪些种类?
按检索对象的内容区分:
(1)文献检索(文献检索是以文献作为检索对象,查找含有用户所需信息内容。
信息存储与检索练习题

信息存储与检索练习题二、问答题1.简述信息、资源的概念。
信息:是生物以及具有自动控制系统的机器通过感觉器官或者细胞组织,或者具有类似功能的设备部件与外界进行交流的一切内容。
资源的涵义:资源可分为两个范畴,一是自然界赋予的自然资源;二是人类社会中人的劳动创造的各种资源。
资源是一切可被人类开发和利用的客观存在。
2.简述信息资源的概念及特征。
信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据。
共享性这是信息资源区别于物质资源的根本属性之一。
一般来说,信息资源可同时为众多的使用者享用,也可被不同时期的使用者使用,同一条信息可以同时为不同领域的人服务、满足不同的需要。
而不象物质资源那样具有排他性,即特定的物质资源只能被某些国家、地区或某些群体、甚至个人占有和消耗。
当然,一些人可控制或保密的信息,不具有这一特性。
时效性:一般来说,信息资源的时效性,是由事物运动变化的规律决定的。
因此,信息资源能否转化为生产力,取决于收集、加工和利用信息是否适时,只有时机适宜,才能发挥最佳效益。
智能性:信息资源是人类按照一定次序开发与组织起来的信息,是人类脑力劳动的产物。
无限性与有限性并存增值性即对信息资源的投入和使用,不但可以使自然资源、人力资源、资本资源增值,同时信息资源可以一次投入、多次开发利用,并不断产生新的信息使其自身增值。
3.简述电子信息资源含义。
含义:电子信息资源书是以数字化形式(即二进制代码0、1),把文字、图像、声音动画等,多种形式的信息存储在光、磁等非印刷型介质上,以光信号、电信号的形式传输,并通过相应的计算机和其他外部设备再现出来的信息资源。
4.什么是信息检索信息检索的类型有哪些信息检索的概念:通过一定的方法和手段将用户的提问特征与数据源所采用的特征标志进行对比,然后将二者相一致或比较一致的信息提取出来供用户使用的过程。
类型:文献检索数据检索事实检索5.简述信息存储与检索原理。
信息存储与检索复习资料答案

一、单项选择题1. 以下哪个数据库提供同名作者检索功能:〔D〕A.万方数据库B.中国期刊全文数据库C.复印报刊资料全文数据库D.中文科技期刊全文数据库2. _______提供一次文献的线索.〔B〕A.文摘、索引等B.图书C.百科全书D.手册3. 以下属于特种文献的是〔 B〕. A.图书 B.科技报告 C.报纸D.期刊4. 用主题词检索只可以检索出对应的〔〕5. 我国制定专利法的主要目的就是为了保护发明创造的〔D〕A.著作权 B.发明权 C.发现权 D.专利权6. 利用分类途径进行检索,其检索标识为〔C〕A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献〔C〕A.Journal B.Report C.Conference D.Patent8. 下列选项中,不属于信息能力的有〔 B〕A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指〔专利注明书〕10. Google搜索引擎的首页面上有一个"手气不错"的按钮,这个按钮的作用是什么?〔D〕A.测试你当天的手气B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的 D.直接跳转到系统认为是最相关的页面11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况〔D〕A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程〔C〕A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为〔C〕.A.主题词 B.关键词 C.分类号D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名与其他信息,应在下列哪个数据库中查找?〔C.〕A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好?〔C〕A.关键词摘要intitle:知识管理B.论文知识管理PDFC.学术论文知识管理D.学术论文intitle:知识管理16.在中国知网提供的检索服务中,〔检索词扩展〕起到扩展检索的作用.17. 下列哪种语言不属于规范化语言______〔B〕A.分类语言B.叙词语言C.关键词语言D.标题词语言18. 数据库检索中,布尔逻辑检索的逻辑关系中A OR B 又可以表示成〔A〕A.A+B B.A-B C.A*B D.B OR A19. 下列哪些不属于主题途径?〔D〕A.标题B.关键词C.摘要D.ISBN20. 《中华人民共和国专利法》开始实施的时间是〔B〕A.1984年4月l日B.1985年4月1日C.1990年9月7日D.1987年1月1日21. 赵一.科技成果向现实生产力转化.科学学研究,1996,14〔2〕:33-38是< A >A.期刊论文B.专著C.书目D.论文集22. 在检索式中,下列哪一个不能为提高检索的查全率而起到扩展检索范围的作用.〔D〕A.逻辑或B.截词检索C.位置运算符W D.逻辑与23. 在中文网络数据库中,能查到企业名录的是哪一个?〔C〕A.中国知网B.维普中文科技期刊数据库C.万方数据库D.超星数字图书馆24.读者阅读万方资源数据库的全文,需要安装的阅读器是〔PDF〕25. 检索最新的学术动态方面的信息,最好用哪种检索工具书?〔A〕A.手册 B.年鉴 C.期刊 D.书目26. 根据"Anon D..Biomedical applications of nanoscale devices[J].Materials Technology, 2004, 19<2>: 118-119."的著录特点,可以判断,该文献属于〔A〕.A.期刊论文B.图书C.科技报告D.会议论文27. 哪种不属于常规检索方法〔D〕A.直接检索法B.顺查法C.抽查法D.引文法28.根据"林福宗.多媒体技术基础[M].:清华大学,2006."的著录特点,可以判断,该文献属于〔B〕.A.期刊论文B.图书C.科技报告D.会议论文29. 世界三大检索刊物是指SCI<科学引文索引>、EI<工程索引>、ISTP<科技会议录索引>30. 检索2009年中国房地产方面的统计信息,最好用哪种检索工具书?〔A〕 A.年鉴B.手册C.书目D.百科全书31. 课题"查找王安石的相关资料"应用____〔B〕A.分类途径B.主题途径C.作者途径D.高级途径32.在《科学引文索引》中,下列哪个索引能提供从著者单位名称检索文献〔〕33. 查找中文科技期刊全文文献的数据库有〔维普〕二、名词解释1. 主题标引:是依据一定的主题词表或主题标引规则,赋予信息资源语词标识的过程.具体而言,主题标引是在主题分析的基础上,以一定的词表或标引规则作为依据,将信息资源中具有检索意义的特征转换成相应的主题词,并将其组织成表达信息资源内容特征的标识的过程.2. INTERNET〔因特网〕:泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络.3. 顺查法:就是以课题研究的起始年限为出发点,利用选定的检索工具如书目、索引、文摘又远与近的逐年查找.4. 三次文献:是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为"情报研究"的成果5. 文献信息资源:文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源.6. 倒查法:一种逆时间顺序由近而远地查找信息的方法.7. 一次文献:即原始文献.它是作者以生产或科研为依据而创作的原始文献.如专著、期刊论文、学位论文等.8. 检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等.它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言.9. 手工检索:是由检索者通过卡片式或书本式的目录、题录、文摘、索引等检索工具查找文献线索的过程.10. 信息检索语言:信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言.11. 特种文献:特种文献是指和获取途径都比较特殊的科技文献.特种文献一般包括会议文献、科技报告、专利文献、学位论文、标准文献等.12. 间接检索法:利用一定检索工具进行文献检索13. 专利:有三层含义:一指受专利法保护的发明,二是指专利权,三指专利说明书等专利文献.这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体体现.14. 搜索引擎:是一种 Web 上应用的软件系统,它以一定的策略在 Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务.用户可以通过主题浏览和关键词检索的方式搜索所需信息.15. 技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有##性和内部使用的特点.16. 索引:根据标题法的原理,将类目与其注释改成标题形式,按字顺排列,并注明相应的分类号.这样不仅可方便查表,而且还可将分类表中因为按学科分类而被分散的同一事物不同方面的类目集中,使分类法在某种程度上兼有主题法的性能.17. 抽查法:针对研究课题发展的特点,选择有关的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法.18. 回溯检索:又叫追溯法,是以某一篇文献末尾所附的参考文献为依据,由近与远进行逐一追踪的查找方法.19. 循环检索:先利用检索工具查出一批有用文献,然后再利用这些文献末尾所附参考文献的线索进行追溯查找.20. 追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法.21. 分类标引:对档案给予分类号标识的过程.22. 目录:是图书、期刊或其他单位出版物外表特征的揭示与报道.它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉与书中的章节或期刊中具体的文章.23. 竞争情报:竞争情报是20世纪80年代在国际上迅速发展起来的一种信息业务,是关于竞争环境、竞争对手和竞争策略的情报研究.三、简答题1. 光盘检索与手工检索相比有哪些优势?使用光盘检索系统,可免除联机检索系统所必须使用的电讯设备,节省了电讯费和联机系统使用费,还可免除由通信线路传输过程中所造成的失误光盘系统向用户随盘提供相当于联机信息检索系统功能的软件,并提供菜单驱动与命令驱动两种方式光盘存贮容量大,耐用,复制费用低可以把文本,图形,图像,声音与动态形象结合在一起如果光盘数据库量不够多,则信息资源就显得有限,购买大量光盘数据库,又要受到经费限制在信息需求的适时性上,光盘检索不如联机检索系统,因为光盘只能定期提供数据库费用大手工检索的优势〔1〕手工检索能了解标引规则,按规则进行各项的著录,便于检索者根据文献标引规则查阅相关文献.〔2〕手工检索能了解各类检索刊的收录范围、专业覆盖面、特点和编制要点,检索回溯期长,可以提高查全率和查准率.〔3〕手工检索灵活性高、费用低.〔4〕手工检索也便于检索策略的制定和修改,所得到的文献信息一般能符合检索者的信息要求,并且手工检索过程中发现问题,可以与时地修改和提出.手工检索过程中,直接查找任务的是人,在查找过程中,人的思维一直起着主导作用.检索者可以在检索过程中,结合检索的结果不断明确自己的信息需求和不断地修改自己的检索提问.检索提问标识与检索系统中文献特征标识的组配完全可以做到内容、概念和形式上的一致,而无须严格的字面的组配.因此,检索到的文献信息一般能符合检索者的信息要求.〔5〕在载体内容的直观性方面,手工检索也优越于计算机检索.利用手工检索工具,人们无须借助任何转换设备便可一目了然地判读具体文献的描述内容,也能够比较准确地了解其全部.而计算机检索则不然,必须借助于相应的读取工具,如计算机、光盘阅读器等,才能得以判读.手工检索的缺憾:<1> 检索速度慢 <2 >检索受时空的限制 <3> 检索受馆藏资源的限制 <4> 更新周期长 <5> 检索途径少2. 信息的特征有哪些?答:普遍性、无限性、传递性、可知性与可贮性、动态性、共享性3. 简述联机检索的基本原理.信息用户利用终端设备,通过通讯网络与世界各地的信息检索系统联机,进行人机对话,从检索系统的数据库中查找出用户所需信息的全过程.一个典型的计算机信息系统,能完成数据收集,分析,加工处理,存储,传递通信和检索信息的全过程.4. 信息的概念是什么?信息有哪些特征?广义的信息概念:即信息是事物运动的状态和方式,也叫本体论信息狭义的信息概念:即信息是认识主体对事物运动状态和方式的反映,也叫认识论信息信息具有如下几个特征:普遍性、无限性、传递性、可知性与可贮性、动态性、共享性5. 检索系统必备四大要素是什么?答:检索文档〔数据库〕、检索设备〔检索硬件与通讯设施〕、系统规则、相关人员、.6. 简述信息检索语言的功能.信息检索语言是沟通信息存储和信息检索的桥梁;对信息组织人员来说,它是表达信息主题内容,形成标识并赖以组织信息的依据;对信息检索人员来说,它是表达检索需求的依据.7. 简述信息检索的作用.答:全面掌握必要信息;提高信息利用效率;提高信息素质;具有一定经济性.8. 简述信息检索原理〔可以用图描述〕.9. 简述网络信息资源的特点.<1>信息量大,有污染.在Internet上的信息资源数量究竟有多少,谁也说不清楚,因为它是世界上联系在网络上的所有主机里存储的信息总和.有人估计,在Internet上每天发布的新信息约有14万件,它的信息量是过去任何一种存储信息方法所无法比拟的.但同时也产生了信息的污染,任何人只要同网络相联系,就既是网上的信息使用者,也是信息生产者.这就使网上存在有大量信息的同时也产生了一定的垃圾,出现了信息污染.当我们在检索时,往往会出现许多无关的信息,而信息的真伪是需要鉴别的.<2>信息共享性好,更新快.Internet上的信息共享性最好,只要在网上的任何一个主机上发表信息,在全世界范围内都能看到.许多聪明的商家充分利用这一特点在网上大做广告,树立企业形象,推销产品.Internet网络信息的另一特点是新陈代谢快,可以说Internet网络信息资源要比其他信息资源更新得快.<3>信息源分散无序.Internet上的信息源是在每个独立的计算机服务器上,使网上的信息源呈现出分散、无政府状态.用户无法判断网上有多少同自己需求有关的信息,给用户的信息检索带来一定的困难.<4>信息商品化.刚刚利用Internet查询信息时,你可能会感到网上的大量信息在利用时都不需要付费,只要付少量的通讯费就可以了.但只要细心观察就会发现,免费信息多数都是具有一定宣传作用的,真正有用的信息多数是要付费的,可以说Internet上的网络信息具有一定的商品化.10. 什么是检索策略?以Google搜索引擎为例,论述检索策略的优化方法.检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以与查找步骤等.检索策略考虑得是否周全,直接影响文献的查全率和查准率.优化方法略11. 简述信息检索的本质.答:本质就是提问标识语文献标识的对比和匹配.12. 举例说明什么是一次文献、二次文献、三次文献.一次文献指以作者本人的研究成果为依据而创作的原始文献,如期刊论文、研究报告、专利说明书、会议论文等.二次文献是对一次文献进行加工整理后产生的一类方面,如书目、题录、简介、文摘等检索工具.三次文献是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为"情报研究"的成果,如综述、专题述评、学科年度总结、进展报告、数据手册等.13. 如果要查找有关"转基因生物和细胞与其制备方法"方面的中外文文献,如何查找?请写出具体的检索步骤.1、分析课题,明确检索要求;2、选择检索系统:要考虑文献类型3、选择检索途径4、选择检索方法5、查找文献线索6、获取原始文献14. 简述文献检索步骤答:明确信息检索需求、选择检索系统、确定检索词、构造检索表达式、实施检索策略并分析结果、检索策略的修改与完善15. 影响查全率和查准率的因素有哪些?查全率:R=检出的相关信息量/检索系统中相关信息总量使用泛指性较强的检索语言<如上位类、上位主题词>能提高查全率,但查准率下降.使用专指性较强的检索语言<如下位类、下位主题词>能提高查准率,但查全率下降主要从以下几个方面考虑:选词、选择数据库是否全面;时间,文献类型16. 信息检索系统都包含哪些子系统?答:文献信息选择子系统;检索语言和名称规范子系统;标引著录子系统;查询子系统;交互子系统;匹配子系统.17. 简述信息检索的特征.答:相关性;不确定性;逻辑性.18. 信息检索智能化主要体现在哪些方面?答:检索技术智能化;检索结果处理智能化;检索服务智能化.19. 某同学在检索一个课题时,第一次检索的结果有200条文献,你建议一下她采用何种方式来缩小检索范围?增加文献的检准率,减少文献的检全率第一,变逻辑或为逻辑非,增加"and"的检索词第二,限定文献的类别,〔如该文献是医学方面的,就将其限定在医学这个大类下〕第三,或变模糊检索为精确检索第四,增加其他的限度,这就要看你自己的,如有没有年限现在啊,作者之类20. 什么是检索策略?计算机检索策略的制定一般经过哪几个步骤?检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以与查找步骤等.检索策略考虑得是否周全,直接影响文献的查全率和查准率.检索步骤〔1〕弄清信息需求,明确检索目的〔2〕选择数据库,确定检索途径〔3〕确定课题的概念组面和检索标识21. 简述专利的新颖性、创造性与实用性的含义,并说明中国保护的专利有哪几种类型?专利的新颖性,是指申请日前没有同样的发明或者实用新型在国内外出版物上公开发表过、在国内公开使用过或者以其他方式为公众所知,也没有同样的发明或者实用新型由他人向国务院专利行政部门提出过申请并且记载在申请日以后公布的专利申请文件中. 专利的创造性:是指在有新颖性的情况下,不同的技术之间实际上是没有产生意想不到的技术效果,简单说,就是两者之间的差异不明显,而且效果无进步. 专利的实用性:指该理论或者观点的提出对实践的知道程度. 中国保护的专利类型有3种类型,分别是:发明专利、实用新型专利和外观设计专利.22. 什么是信息检索查全率和查准率?两者之间的关系如何?查全率<Recall Ratio> 当用户要全面检索某一信息库时,检出的成功度可用检出的所有相关信息在信息库所有相关信息中所占的比例来表示.这种对信息库检索全面性的测量指标即为查全率.查全率与系统能够检索出的相关文献能力有关.可定义为:查全率 =<检出的相关信息数/信息库中相关信息总数>×100%查准率<Precision Ratio> 当用户要对检索到的结果进行分析时,检出的相关信息数在所有检出信息中所占的比例往往成了较重要的评判指标.这种对检索结果中的相关信息的测量指标即为查准率.也有称为信号噪声比<signal-to-noise ratio>.查准率与检索出的相关信息数有关.可定义为:查准率 =<检出的相关信息数 /检出的信息总数>×100%查全率和查准率必须结合使用,单独使用两者中的任何一个都不能全面说明检索效果的好坏.若检出 1 篇相关信息,必能达到100% 的查准率,但查全率却会非常低;同样,若检出的信息数等于库##息的总量 a + b + c + d ,则必能获得 100% 的查全率,但很显然查准率必定也低得可怜.查全率和查准率是评价检索效果好坏的指标,而漏检率和误检率则是测量检索误差的指标.23. 影响信息检索效果的因素有哪些?<1> 影响查全率的因素从文献存储来看,主要有:文献库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一致;标引人员遗漏了原文的重要概念或用词不当等.此外,从情报检索来看,主要有:检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟练和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等.<2> 影响查准率的因素主要有:索引词不能准确描述文献主题和检索要求;组配规则不严密;选词与词间关系不正确;标引过于详尽;组配错误;检索时所用检索词〔或检索式〕专指度不够,检索面宽于检索要求;检索系统不具备逻辑"非"功能和反馈功能;检索式中允许容纳的词数量有限;截词部位不当,检索式中使用逻辑"或"不当等等.实际上,影响检索效果的因素是非常复杂的.根据国外有关专家所做的实验表明,查全率与查准率是呈互逆关系的.要想做到查全,势必会要对检索范围和限制逐步放宽,则结果是会把很多不相关的文献也带进来,影响了查准率.企图使查全率和查准率都同时提高,不是很容易的.强调一方面,忽视另一方面,也是不妥当的zx.应当根据具体课题的要求,合理调节查全率和查准率,保证检索效果.24. 信息检索的方法有哪几种?从检索手段看,信息检索分为: 手工信息检索机械信息检索计算机信息检索25. 什么是信息检索漏检率和误检率,二者之间的关系如何?误检率为检出的结果中,不相关信息占检出信息的比例.这种对检索结果中不相关信息数的测定即为误检率.可定义为:误检率 =<检出的非相关信息数/检出的信息总数>× 100%漏检率为系统未检索出的相关信息占库中相关信息总数的比例.这种对检索结果中不包含系统中存在的相关信息数的测定即为漏检率.可定义为:漏检率 =<未检出的相关信息数/信息库中相关信息总数>× 100%其实,查全率和漏检率是互补的;而查准率和误检率也是互补关系.即:查全率 + 漏检率 = 1 ;查准率 + 误检率 = 1 .漏检率和误检率则是测量检索误差的指标.26. 试比较分类语言与主题词语言分类语言是运用概念划分的原理,以分类号为标识,将各种概念按学科性质加以划分和排列,用以分门别类地、系统地组织信息的一种检索语言,它又可以分为体系分类语言和组配分类语言以与混合分类语言.主题语言是直接以表达主题内容的语词作为检索标识,以字顺为主要检索途径的标引和检索信息的语言.主题语言是一种描述性语言,它使用自然语言中的词语或规范化的词语来描述文献所论述或研究的事物概念,具有较强的直观性、专指性和灵活性.。
信息存储与检索复习资料答案

一、单项选择题1. 以下哪个数据库提供同名作者检索功能:(D )A.万方数据库 B.中国期刊全文数据库C.复印报刊资料全文数据库 D.中文科技期刊全文数据库2. _______提供一次文献的线索。
( B ) A.文摘、索引等 B.图书 C.百科全书 D.手册3. 以下属于特种文献的是( B )。
A.图书B.科技报告C.报纸 D.期刊4. 用主题词检索只可以检索出对应的()5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权~6. 利用分类途径进行检索,其检索标识为( C ) A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献( C )A. Journal B. Report C. Conference D. Patent8. 下列选项中,不属于信息能力的有( B ) A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指(专利注明书)10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这个按钮的作用是什么( D )A.测试你当天的手气 B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的链接D.直接跳转到系统认为是最相关的页面…11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况( D )A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程( C )A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为( C )。
A.主题词 B.关键词 C.分类号 D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找( C. )A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统…15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好( C )A.关键词摘要 intitle: 知识管理B.论文知识管理 PDFC.学术论文知识管理D.学术论文 intitle:知识管理16. 在中国知网提供的检索服务中,(检索词扩展)起到扩展检索的作用。
信息存储与检索作业1【精选】

《信息存储与检索》作业1一、选择题1.最早的网络搜索引擎是( )A. Yahoo B .Excite C. ArchieD .Google2. 近几年,有不少拉美国家发生了人畜被蜂类伤害致死的事件,这种蜂类被称为“杀人蜂”。
你知道“杀人蜂”是非洲蜂与什么蜂杂交后的品种吗?( )A 、美洲蜂B 、欧洲蜂C 、亚洲蜂D 、澳洲蜂3.Google 公司于2004年8月首次公开募股(IPO)的发行价为每股___美元,2006年10月宣布以__亿美元的股票收购著名视频网站YouTobe ( )A .75;15.5 B. 85;16.5 C. 95;16 D. 105;16.84.请问被苏轼赞为“诗中有画,画中有诗”的人是谁?( )A.曾巩B.韩愈C.林和靖D.王维5.“我思故我在”,是____ ____的名言,这句话说明思想的重要性。
人类的认知是不断进步的,随着人们不断的认识到新的事物思想也在不断转变A.帕斯卡尔B.伏尔泰C.笛卡儿D.孟德斯鸠6.中国互联网络信息中心(CNNIC)是在信息产业部的授权和领导下的,得到国际互联网络管理机构认可的、中立的、非盈利性的服务和管理机构,行使国家互联网络信息中心的职责,属于国家事业单位。
CNNIC 在行政上受___ ____的领导。
A. 信息产业部 B. 国务院信息化办公室C. 中国互联网络协会D. 中国科学院计算机网络信息中心7.1998年5月4日,江泽民总书记在庆祝北大建校100周年大会上向全社会宣告:“为了实现现代化,我国要有若干所具有世界先进水平的一流大学。
”为贯彻落实党中央科教兴国的战略和江泽民同志的号召,教育部决定在实施“面向21世纪教育振兴行动计划”中,重点支持北京大学、清华大学等部分高等学校创建世界一流大学和高水平大学,简称“985”工程。
请问现在985工程院校数总计多少_______所,湖北有____ ___所入选。
A. 39;2B.38;4C. 34;4D. 34;28.“解百纳”一直被认为是一种高档红酒,“解百纳”干红是三种优质葡萄酿制而成,请问下列葡萄中哪种葡萄不是酿制"解百纳"的原料? ()A.赤霞珠B.品丽珠C.蛇龙珠D.绛霞珠9.我国最早的图书馆学专业教育机构创立于___年,它是___ __ 创始人_____A. 1920 武昌文华大学图书馆学专修科 韦棣华B. 1922 武汉大学图书馆学专修科 杜定友C.1927 南京金陵大学图书馆学系 韦棣华D.1947 北京大学中国语言文学系图书馆学 杜定友10.手机135****1310和IP 地址 218.65.96.5的归属地分别是哪里?( )A. 武汉 郑州B.武汉 南昌C. 广州 武汉D.广州 太原4 11 201628陈登恪, 人称“登老”,唐宋小说专家。
2011-2012学年信息存储与检索期末考试(B)

阅卷须知:阅卷用红色墨水笔书写,得分用阿拉伯数字写在每小题题号前,用正分表示,不得分则在题号前写0;大题得分登录在对应题号前的得分栏内并签名;统一命题的课程应集体阅卷,流水作业;阅卷后要进行复核,发现漏评、漏记或总分统计错误应及时更正;对评定分数或统分记录进行修改时,修改人必须签名。
一、填空题(每空2分,共40分)1.信息资源的基本特征有______________、时效性、_____________、无限性与有限性并存和增值性。
2.信息存取由__________________和_______________________两部分组成。
3.索引款目一般由:_________________、说明语和___________________。
4.全文数据库中的文档通常由_________________和_______________组成。
5.构造提问检索式的基本要素是____________、布尔逻辑算符、_____________和截词算符等。
6.一个真正的元搜索引擎由3部分组成:检索请求提交机制、_________________和________________。
7.中国专利局发行的专利文献包括:____________、专利公报和___________等。
8.影响数字声音波形质量的主要因素有三个:____________、采样精度和__________。
9.多媒体信息标引,按标引入口点的不同将这些标引方式划分为三大类:_______________、以内容分析为主的标引方法和_______________________。
10.基于内容的图像检索技术的关键在于__________________,以及在图像特征基础上进行的_____________________,这些方法与技术融合了计算机图形处理、模式识别、数据库等多门学科关键技术。
二、问答题(每小题4分,共20分)请说出下面DIALOG系统中基本索引字段的后缀和前缀的含义1、Computer/ti2、Information retrieval/ab3、au=Johnson4、dt=review5、py=2000三、简答题(第1、2、4、5小题各5分,第3、6小题各6分;共32分)1.简单叙述信息检索的步骤。
信息存储与检索练习题[1][1]
![信息存储与检索练习题[1][1]](https://img.taocdn.com/s3/m/ec6f5e2b941ea76e59fa046c.png)
信息存储与检索练习题一、名词解释1.信息2.资源3.信息资源4.信息检索5.检索词p776.提问检索式p777.零次文献p248.一次文献p239.二次文献p2310.三次文献p2311.关键词索引p5712.主题索引p5613.顺查法p8514.逆查法p8615.抽查法p8616.追溯法p8617.综合法p8618.Web信息资源p919.Gopher信息资源p1020.FTP信息资源p921.Telnet信息资源p922.搜索引擎p19323.科技报告p249二、问答题1.简述信息、资源的概念。
信息:是生物以及具有自动控制系统的机器通过感觉器官或者细胞组织,或者具有类似功能的设备部件与外界进行交流的一切内容。
资源的涵义:资源可分为两个范畴,一是自然界赋予的自然资源;二是人类社会中人的劳动创造的各种资源。
资源是一切可被人类开发和利用的客观存在。
2.简述信息资源的概念及特征。
信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字、声音、图像、数据。
共享性这是信息资源区别于物质资源的根本属性之一。
一般来说,信息资源可同时为众多的使用者享用,也可被不同时期的使用者使用,同一条信息可以同时为不同领域的人服务、满足不同的需要。
而不象物质资源那样具有排他性,即特定的物质资源只能被某些国家、地区或某些群体、甚至个人占有和消耗。
当然,一些人可控制或保密的信息,不具有这一特性。
时效性:一般来说,信息资源的时效性,是由事物运动变化的规律决定的。
因此,信息资源能否转化为生产力,取决于收集、加工和利用信息是否适时,只有时机适宜,才能发挥最佳效益。
智能性:信息资源是人类按照一定次序开发与组织起来的信息,是人类脑力劳动的产物。
无限性与有限性并存增值性即对信息资源的投入和使用,不但可以使自然资源、人力资源、资本资源增值,同时信息资源可以一次投入、多次开发利用,并不断产生新的信息使其自身增值。
3.简述电子信息资源含义。
《信息存储与检索》模拟考试题一

《信息存储与检索》模拟考试题一(开卷)考试时间 90 分钟试卷编号姓名学号班级一. 选择题(每题3分,共30分)1. ISBN 7-302-02372-7是A 标准号B 专利号C 国际标准刊号D 国际标准书号2. 检索时所谓的“关键词”是()A 规范词B 受控词C 主题词D 非规范词3. 记录在非正式传播媒体上未经任何加工处理的信息是A 零次信息B 一次信息C 二次信息D 三次信息4.检索出具有同一词干的所有形式的词,应使用()A 复数形式B 概念词C 同义词D 截词符5.在整个数据库中查找含有特定信息的过程,称之为A 检索B 指令C 标引D 分类6.当检索词必须紧挨着,且词序可变时,应使用算符A (1W)B (W) 或()C (N)D ?7. 使用OR算符组配检索词,对检索结果将有怎样的影响A 没有影响B 增加检索结果C 减少检索结果D 提高查准率8.下面的表达中,哪一个是不正确的A 所有的书目型数据库都含有文摘B 所有全文型数据库都含有文献来源C 有些数据库含有图形D 数据库可以含有不止一种类型的数据9.数据库中的每一条记录,其各项属性被称为()A 字段B 文档C 记录D 指令10.书目型数据库总含有A 文献的全文B 文献出处C 作者和地址D 表格数据二、填空题(每空2分,共20分)1.题录一般以内容是独立的文献单元作为著录的基本单位,著录项通常包括:著者、__________和来源出处。
2.文献的三要素是:知识、载体和_______。
3.描述文献内容特征的语言有分类语言和___________。
4.SCI可以提供论文被______检索和论文被引用检索。
5.信息的组织可分为按照内容特征和按_________特征组织两种方式。
6.TN912.2是________的分类号。
7.三大索引包括_______、EI和ISTP。
8.目前我国生产制作学位论文全文数据库的两家以盈利为目的的公司是_______________和_______________。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、信息检索就是对信息项进行表示、存储、组织与存取的全过程。
信息存储是指将有用信息按照一定方式组织和存放起来,信息检索是指当用户需要这些信息时,再把它们从存放的地方查找和提取出来。
2、信息检索的原理:参见书上图1-1理解
3、信息检索的一致性匹配机理:提取机理、表示机理、比较机理、判断机理、选择机理。
4、信息检索的类型:(1)按照检索对象的性质分为文献检索、数值检索、事实检索;(2)按照计算机检索技术分为脱机检索、联机检索、光盘检索、网络检索。
5、在手工检索阶段,人们常用的概念是检索工具,在计算机检索阶段,人们使用数据库,在网络检索阶段。
人们使用搜索引擎。
6、信息检索系统物理结构组成,逻辑结构的组成和原理。
7、信息检索产生于美国,其发展经历了起步期(以单词检索为特征)、成长期(以脱机检索为特征)、发展期(以联机检索为主)、成熟期(检索转向个人终端)、开放期(以网络检索为主)。
8、信息检索的趋势:跨语言检索、多媒体检索、信息检索可视化、信息检索智能化、信息检索个性化、信息检索多样化。
第二章:
1、检索策略一般都包含文档集的逻辑表示、查询的表示、相似性匹配及其排序三个要素。
2、经典的检索模型:布尔模型、向量空间模型、概率模型。
要求了解三种模型的思想和原理,重点掌握矢量模型的计算过程。
3、TF-IDF加权策略:对特征项计算权重的方法,该策略由簇内相似性和簇间不相似性两种效果来衡量。
4、将文本内容中的信息与文档结构信息结合起来进行检索的模型叫做结构化检索模型。
包括费重叠链表模型、邻近节点模型、平坦模型(扁平浏览模型)、结构导向模型、超文本模型。
第三章:
1、记录是作为一个单位来处理的有关数据的集合,它是对某一实体的属性进行描述的结果。
常见的书目记录是MARC记录结构,不同的国家有不同的记录格式,但为了进行不同机构间的目录交换,机读目录必须在物理结构、内容标识符、内容数据方面做到统一。
2、对文本信息进行检索的主要技术是顺排文档和倒排文档。
顺排文档检索方法主要有表展开法和逻辑树法两种,其中表展开法的处理过程是
3、倒排表是面向单词的一种索引数据结构,包括单词表和事件表(置入表)组成,了解倒排表和后缀数组的区别。
4、签名文件的生成和检索过程要掌握。
5、其他一些文本检索技术主要有:布尔检索、截词检索、限制检索、加权检索等。
6、文本聚类是利用同类文档相似度大、不同文档相似度小的原理对文本信息进行有效组织和分类的技术。
7、信息熵表示文本信息量的大小,用公式E=∑Pi*log2Pi计算。
8、文本聚类的方法主要有等级聚类法、动态聚类法和启发式聚类法。
9、全文检索的技术指标:索引膨胀系数、检索速度。
全文检索包括邻接检索、同句检索、同字段检索、同记录检索等方式。
第四章:
1、多媒体对象的表示和存储是尤为重要的,数据建模既要体现多媒体数据的特性又要保证在这种数据上的各种操作的灵活可靠。
2、多媒体一词含义很多,但在计算机领域中主要有两层含义:一是指信息的物理载体,二是指信息的表现或传播形式。
多媒体的关键特征主要有:多样性、集成性、交互性、实时性和互补性。
3、多媒体数据模型要能揭示多媒体数据的内容特征和语义特征,因此一个完整的多媒体数据模型要能描述多媒体的三种层次:应用层、信息员层、数据元层,多个数据元组成信息元,多个信息元组成应用中的信息集合。
目前常用的多媒体数据模型是HCM层次模型。
4、图像数据模型中物理特征主要有颜色、纹理、形状、轮廓等视觉信息,音频数据模型的底层特征主要有音强、音色、音调、响度、过零率、带宽等,视频数据模型主要分为帧、镜头、场景和故事情节四个层次。
5、数据压缩是以一定的质量损失为容限,按照某种方法从给定的信息源中推出简化的数据表述,通过减少信号空间容量,使信号能安排到给定的信息集或样本中。
多媒体数据之所以能够被压缩是因为原始的多媒体数据存在很大的冗余。
6、多媒体压缩的基本要求:可还原、压缩比高、重现质量好、成本低、实时性好。
7、多媒体压缩的分类:(1)有损压缩和无损压缩;(2)预测编码、变换编码、统计编码、分析-合成编码、混合编码。
8、图像、音频、视频的压缩标准
9、基于内容的多媒体检索就是从媒体数据中提取特定的信息线索,然
后根据这些线索从大量的多媒体数据库中找寻需要的多媒体信息。
10、多媒体信息检索系统的结构:数据插入子系统、信息查询子系统、媒体处理子系统、多媒体数据库。
第五章:
1、Web资源检索方法主要有三种:基于超文本/超媒体的浏览方式、基于目录的信息查询、基于搜索引擎的信息检索。
2、Web信息组织主要包括:超文本、标记语言
(SGML/HTML/XML)、超文本传输协议、超文本浏览器。
3、元数据是关于数据的组织、数据域及其关系的信息,简言之就是关于数据的数据主要包含四种元数据类型。
4、搜索引擎的概念、功能、组成结构、原理和类型,
第六章:
1、并行信息检索和分布式信息检索是信息检索理论与应用的提高,并行处理是指把计算机任务划分为更小的子任务,然后利用多个处理器处理同一个任务的不同子任务,各处理器采用并行工作方式,从而提高检索效率。
2、根据指令流和数据流的不同将计算机分为四种体系结构:SISD、SIMD、MISD、MIMD。
3、并行检索技术分为数据并行和功能并行。
在数据并行技术中,利用倒排表进行并行检索又分为数据集(文档集)分割和项分割两种,其中文档集分割又分为物理文档分割和逻辑文档分割,了解两者之间的区别与联系。
4、分布式检索主要是指在分布式的环境中,利用分布式计算机和移动代理技术从大量的、异构的信息资源中检索出对用户有用信息的过程,分布式检索典型的特征就是具有异构性。
一个简单的分布式信息检索系统由多个数据集服务器和一个和多个代理处理器两大部分组成。
5、分布式检索模式:基于元搜索引擎的分布式检索、基于Z39.50的分布式检索、基于XML的分布式检索、基于Web服务的分布式渐叟。
6、数据集选择就是指怎样选择最合适的信息资源库的子集,并保证这些子集可能包含与提问式相关的文献的数量最大。
7、异构数据库是指结构相异的数据库,这里的异构包含系统级异构和语义级异构。
8、跨库检索是指以多个异构数据库的数据源为对象的检索。
第七章:
1、人工智能与自然语言检索是信息检索发展的前沿领域,也是信息检索发展的主要趋势和方向。
人工智能检索技术主要包括专家系统、数据挖掘、知识发现和信息抽取。
2、自然语言从用户角度讲就是用自然语句作为提问的输入,这就涉及到文本的语言结构和语义分析等技术,将信息处理深入到了文本的内容,而非仅仅是依据文本中提取的索引词的信息。
所以自然语言处理设计语言学、心理学、认知学、人工智能等多领域学科。
2、自然语言理解的层次包括六个方面:语音学、词形学、词汇学、句法、语义学、语用学。
第八章:
1、用户界面是信息检索者与信息检索系统之家的交流媒介,包含两层含义:一是系统给用户的视觉呈现,二是用户使用计算机检索系统的综合操作环境。
2、用户类型按照用户使用计算机的频度分为新手用户、平均用户、专家用户、偶然用户四种。
3、用户检索行为是指用户为获取所需信息,在与计算机交互过程中的一系列身体活动和心理活动,从本质上说用户检索行为时一种试验和探索的过程。
4、构成信息检索的主要因素有:用户行为、检索任务、系统性能、检索结果。
5、用户界面设计的原则和种类。
7、人机交互的一个重要方面就是用户界面技术的评价方法,除了查准率和查全率外,还有其他一些标准如用户学习系统的时间、实现基准任务所需的时间、出错率和界面使用的一致性等。
8、信息可视化的含义及作用。
第九章:
1、信息检索评价就是指运用科学的方法,按照设定的检索指标体系对信息检索结果进行评价的过程。
2、信息检索评价的内容包括资源的收录状况、数据的质量、检索的功能与效率、系统的功能及检索结果的反馈。
3、相关性是指信息检索的结果具有不确定性,不像数据检索一样具有精确性,他只能检索与用户提问最接近的文档。
4、相关性概念具有关系、直觉、多维和动态的特点。
5、信息检索的系统性能指标通常包含查全率、查准率和响应时间三个主要要素。
】
6、信息检索系统的评价指标体系包含:系统性能指标、系统效益指标、费用/效果指标、费用/效益指标等。
7、信息检索评价的过程与方法:确定评价对象及目标、选择评价方式、设计评价方案、实施评价方案。
8、经典的检索评价实验:MEDLARS系统评价实验、SMART检索实验等。
9、信息检索评价实验平台:TREC。