信息检索习题汇总及答案
信息检索考试题汇总附答案

4.国际标准书号的英文简称ISBN,新版国际标准书号2007年正一、单项选择题(从下列各题四个备选答案中选出一个正确答案,式实施,国际标准书号由10位升至13位。
(√)并将其代号写在答题纸相应位置处。
每题2分,共30分) 5.检索效果的评价指标主要有查全率和漏检率。
(×) 1._C_是题录型检索工具 1.NSTL 是(国家科技图书文献中心)的简称。
A.CABIB.中国学术期刊文摘C.全国报刊索引(自然版)D.经济纵2.(信息检索系统)是指由一定的设备和信息集合构成,具有一横定存储、检索与传送技术设备,提供一定的存贮与检索方法及检2.浏览超星数字图书馆,应首先安装__D_____. 索服务功能的工作系统。
体系分类表通常由(类目表、标记符号、说明和注释、类目索3.世界上第一大联机检索系统是_A_。
引)4个部分组成。
A.DIALOG系统B.OBRIT系统C.OCLC系统D.STN系统 4.正式出版的中文期刊在检索工具和数据库中一般著录有国际4.利用baidu搜索信息时,要将检索范围限制在网页标题中,应标准刊号(ISSN)和国内统一刊号(CN)。
该使用的语法是___B_______。
5. A.site:B.intitle:C.inurl:: (JournalofAnalyticalChemistry)。
5.国际农业和生物科学中心英文名称的简称为_A。
6.CASHL是指(中国高校人文社会科学文献中心),其英文全称是ChinaAcademicSocialSciencesandHumanitiesLibrary,是全6.信息检索根据检索对象不同,一般分为___C___________。
国性的、唯一的人文社科外文期刊收藏和服务中心。
2002年开始A.二次检索、高级检索B.分类检索、主题检索规划建设,2004年3月15日正式启动 C.数据检索、事实检索、文献检索D.计算机检索、手工检索 7.电子期刊,指以(数字或称电子)形式出版发行的期刊,英文7.国际上评价期刊最有影响力的一个指标是___A_____。
信息检索试题及答案

《信息检索》课程考查试题一、单选题(6题*10分/题=60分)1.请标出文献:马品仲. 大型天文望远镜研究. 中国的空间科学技术,1993,13(5)P6-14,ISSN1000-758X 属于哪种文献类型____C________。
A、图书B、科技报告C、期刊D、报纸2.常用的检索系统有_______D_____。
A、目录检索系统B、文摘检索系统C、全文检索系统D、以上都是3.可以将信息检索的一般步骤归纳为_____A_____五个步骤。
A、界定问题、选择信息源、制定策略并实施检索、评价信息、分析和利用信息B、选择信息源、界定问题、制定策略并实施检索、评价信息、分析和利用信息C、制定策略并实施检索、界定问题、选择信息源、评价信息、分析和利用信息D、选择信息源、界定问题、制定策略并实施检索、评价信息、分析和利用信息4.需要着手写一篇有关商业智能系统研究现状的报告,应着重查询以下____D_______个信息源。
A、网页B、报纸C、杂志D、各类文献数据库5.常用的网络免费学术资源有______D______。
A、虚拟图书馆B、开放获取资源C、免费专利资源D、以上都是6.Science Citation Index与其他文献检索刊物不同之处在于_______B____。
A、它具有团体索引B、它具有引文索引C、它可以了解某著者发表论文情况D、它可以了解科研的最新动态二、判断题(8题*5分/题=40分)1.信息检索过程是一个检索的操作过程,如选择数据库、确定关键词、构造检索式等。
错2.对于要求一定深度、研究性的信息问题,应主要检索搜索引擎检索网络信息源。
错3.选择信息源是信息检索的第一步。
错4.信息检索无时不有、无处不在。
对5.图书是各类信息源中最具时效性的一种。
错6.期刊文献、会议文献和学位论文都是一次文献。
对7.在Ei Compendex数据库中,提供的检索结果排序方式只有“Publication year”一种方式。
信息检索练习题答案

一、单项选择题1、分类途径是按照文献所属的学科分类,利用(C)进行检索的途径。
A学科名称B专业名称C分类号及分类名D以上均可2、利用文献后所附参考文献进行检索的方法叫(A )。
A.追溯法B.直接法C.抽查法D.综合法3、逻辑算符包括(D)算符。
A.逻辑与B.逻辑或C.逻辑非D.以上三项4、机检效果与检索人员的素质有着密切的关系。
人员的素质主要包括(D )。
A.对检索策略的掌握程度B.对数据库的掌握程度C.对检索语言的掌握程度D.以上三项5.最早的网络搜索引擎是(A)A. Yahoo B .Excite C. Archie D .Google6、我国最早的图书馆学专业教育机构创立于___年,它是__A____ 创始人_____A. 1920 武昌文华大学图书馆学专修科韦棣华B. 1922 武汉大学图书馆学专修科杜定友C.1927 南京金陵大学图书馆学系韦棣华D.1947 北京大学中国语言文学系图书馆学杜定友7、“我思故我在”,是____C____的名言,这句话说明思想的重要性。
人类的认知是不断进步的,随着人们不断的认识到新的事物思想也在不断转变A.帕斯卡尔B.伏尔泰C.笛卡儿D.孟德斯鸠8、Google和Baidu在其高级搜索中都提供特定格式文件的搜索,他们分别支持几种文件格式(D)A. 6 4 B .6 5 C.6 6 D. 6 79、4 中国互联网络信息中心(CNNIC)是在信息产业部的授权和领导下的,得到国际互联网络管理机构认可的,中立的,非盈利性的服务和管理机构,行使国家互联网络信息中心的职责,属于国家事业单位。
CNNIC在行政上受____A___的领导。
A. 信息产业部;B. 国务院信息化办公室;C. 中国互联网络协会;D. 中国科学院计算机网络信息中心;10、2003年12月1日是第16个“世界艾滋病日”,到目前为止,中国已有84万艾滋病病毒感染者,其中艾滋病病人8万名。
请问艾滋病的医学全名是什么?(C)A 、先天性免疫缺陷综合症B 、获得性免疫缺陷综合症C 、人类免疫缺陷综合症D 、动物免疫缺陷综合症11、1999年被列入“世界文化遗产”的大足石刻现有唐宋时期的摩崖造像75处,雕像共___C_____余尊。
信息检索总复习题参考答案

一、单选题(共60题选30题,每题1分共30分)1.下列属于布尔逻辑算符的是(D)。
A、与B、或C、非D、以上都是2、信息素养的核心是(C).A、信息意识;B、信息知识;C、信息能力;D、信息道德3、20世纪70年代,联合国教科文组织提出:人类要向着( B )发展.A、终身学习;B、学习型社会;C、创新发展;D、信息素质4.参考文献的标准著录格式是( A )。
A、著者篇名来源出处;B、篇名著者来源出处5.请标出文献:马品仲. 大型天文望远镜研究. 中国的空间科学技术,1993,13(5)P6-14,ISSN1000-758X 属于哪种文献类型( C )。
A、图书;B、科技报告;C、期刊;D、报纸6.常用的检索系统有( D )。
A、目录检索系统B、文摘检索系统C、全文检索系统D、以上都是7、哪一种布尔逻辑运算符用于交叉概念或限定关系的组配?( A )。
A.逻辑与()B.逻辑或(OR)C.逻辑非(NOT)D.逻辑与和逻辑非8、根据国家相关标准,文献的定义是指“记录有关( C )的一切载体。
”A.情报B.信息. C.知识D.数据9、( D )是指通过文献信息资料的主题内容进行检索的途径。
A.题名检索途径B.作者检索途径C.分类检索途径D.主题检索途径10、搜索含有“data bank”的PDF文件,正确的检索式为:( A)A."data bank" filetype:pdf B.data and bank and pdf11、从文献的( B )角度区分,可将文献分为印刷型、电子型文献。
A.内容公开次数B.载体类型. C.出版类型D.公开程度12、按照出版时间的先后,应将各个级别的文献排列成( C)A.三次文献、二次文献、一次文献B.一次文献、三次文献、二次文献C.一次文献、二次文献、三次文献D.二次文献、三次文献、一次文献13、利用文献后面所附的参考文献进行检索的方法称为( A )。
信息检索各章节习题及答案

第一讲一、单选题1、ISBN 978-7-302-20062-8是( D )。
A.强制标准文献的编号 B.国际连续出版物标准刊号C.图书分类号 D.国际标准书号2、一篇论文列出的参考文献如下:郑义.房屋建组外墙渗水成因与防治[J].科技资讯,2005(35):184—185.其中的(35):184—185应该是(A)。
A.35期184—185页 B.35卷184—185期C.35卷184—185页 D.35期184页185行3、下列选项中不属于特种文献类型的有( B )。
A.学位论文 B.图书C.科技报告 D.标准文献4、1、文献是记录有知识的( A)。
A. 载体B. 纸张C. 光盘D. 磁盘5、中国国家标准的代码是(A)A. GBB. CBC. ZGD. CG二、填空题1、情报的三个属性(知识性)、(传递性)、(效益性)。
2、填空题:文献按起加工深度不同,可以划分为(零次信息)、(一次信息)、(二次信息)、(三次信息)。
3、(核心期刊)是指少数刊载某一学科大量高质量专业论文的期刊。
三、判断题1、从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。
( 1)2、在众多的信息源中,期刊是最重要的信息源。
(1)3、连续出版物主要包括期刊、报纸、年度出版物等。
( 1)四、简答题1、常用的特种文献有哪些?答:科技报告、会议文献、政府出版物、专利文献、标准文献、公司产品资料、学位论文、档案资料等2、我国信息系统结构。
答:图书馆系统(高校图书馆、公共图书馆、科学研究系统图书馆)、科技信息服务系统、档案系统、专利系统、标准系统3、信息道德主要内容。
答:信息道德是指在信息领域中用以规范人们相互关系的思想观念与行为准则。
信息道德主要包括:1)遵守信息法律、法规,尊重知识产权,保护个人隐私;2)保守商业秘密,维护信息安全;3)不制作、传播和消费不良信息;4)不制作和传播病毒等有害的东西;5)不窃取和盗用非法的信息;6)不非法进入他人的系统;7)不利用信息能力进行计算机犯罪等。
《文献信息检索》习题答案--文献信息检索(答案)

【文献信息检索】习题答案一、单项选择题1、文献是记录有知识的〔A〕A.载体B.纸张C.光盘D.磁盘2、如果需要检索某位作者的文献被引用的情况,应该使用〔C〕检索。
A.分类索引B.作者索引C.引文索引D.主题索引3、以下哪种文献属于二次文献( D.)A.专利文献B.学位论文C.会议文献D.目录4、纸质信息源的载体是〔D〕A.光盘B.缩微平片C.感光材料D.纸张5、【中国图书馆分类法】〔简称【中图法】〕将图书分成( A.)A.5大局部22个大类B.5大局部26个大类C.6大局部22个大类D.6大局部26个大类6、利用文献末尾所附参考文献进行检索的方法是〔C〕A.倒查法B.顺查法C.引文追溯法D.抽查法7、广义的信息检索包含两个过程〔B〕A.检索与利用B.存储与检索C.存储与利用D.检索与报道8、中国国家标准的代码是〔A〕A.GB. B.CB.C.ZGD.CG9、( D )是报道文献出版或收藏信息为主要功能的工具。
A.题录B.索引C.文摘D.目录10、逻辑运算符包括〔D〕A.逻辑与B.逻辑或C.逻辑非D.A,B和C11、记录是对某一实体的全部属性进行描述的结果,在全文数据库中一条记录相当于〔C〕,在书目数据库中,一条记录相当于〔〕A.一条文摘,一篇完整的文献B.一条文摘,一条题录C.一篇完整的文献,一条题录或文摘D.一条题录,一条文摘12、【中国学术期刊全文数据库】提供的文献内容特征检索途径有〔B〕A.机构B.篇名/关键词/摘要C.中文刊名D.作者13、根据反映新内容的程度从大到小,以下文献类型的排序正确的选项是:〔A〕A.会议论文,科技期刊,科技报告,科技图书B.科技图书,科技期刊,科技报告,会议论文C.科技报告,会议论文,科技图书,科技期刊D.以上都不对14、【中国科研机构数据库】、【中国科技名人数据库】属于:〔B〕A.书目数据库B.指南数据库C.全文数据库D.数值数据库15、以下检索工具中,主要收录化学与化工类文献的是:〔D〕A.SCIB.OCLCC.EID.CA16、国内的专利可以通过哪个数据库检索?〔B〕A.超星数字图书馆B.万方数据C.学术期刊网D.EI17、提供检索式/命令行检索的好处在于:〔C〕A.容易记忆,容易编写B.文本形式,容易理解C.可以保存成功的检索,以便再次检索D.以上都不对18、逻辑“与〞算符是用来组配( D.)。
《信息检索》复习题附答案绝对正确!!
《信息检索》课理论考试复习题一、选择题:A1、从对文献的生产加工与组织层次来看,文献可以分成一次文献、二次文献和三次文献。
一次文献主要有(A)A、专著、报纸、期刊B、书目、索引、文摘C、百科全书、年鉴、手册2、《中图法》共分为五个基本部类,( B )个大类。
A、二十五B、二十二C、二十八3、按照《中图法》的分类原则,文学类和哲学、宗教类分别用汉语拼音字母(C )表示。
A、G、HB、E、DC、I、B4、根据主题词表所规定的以反映文献内容的主题词为标志,从主题的角度检索文献资料的途径是(C)A、著者途径B、文献名途径C、主题途径5、著录一批相关的图书或报刊文献的基本特征,按照一定次序编排而成的揭示和报道文献的工具书是( B )A、文摘B、书目C、索引6、按照文献的知识内容及所属学科性质而分类和检索文献信息的途径是(A)A、分类途径B、主题途径C、著者途径7、信息检索中,以课题起始年代为起点,按时间顺序由远而近逐期查找文献的方法是( C )A、倒查法B、追溯法C、顺查法8、在各种大型电子全文图书系统中,国内影响较大的主要有( B)A、人大复印资料数据库B、超星数字图书馆C、学位论文数据库9、美国《科学引文索引》是最具权威的国际性检索系统之一,简称是(A )A、SCIB、SSCIC、EI10、目前世界上最大的连续动态更新的中国期全文数据库是( B)A、维普中文期刊数据库B、CNKI中国学术期刊数据库C、万方数字化期刊数据库11、集各种类型工具书之大成,被称为“工具书之王”的工具书是( C )A、类书B、年鉴C、百科全书12、汇集某一学科或多学科的文献信息资料,按照特定的体例和排检方法编排,专供人们查阅、征引或解决疑难问题的一种专门文献是( A )A、工具书B、标准文献C、专利文献13、联机检索分为( B )联机检索和检索结果与反馈3个阶段。
A、简单检索B、检索准备C、高级检索14、内容比较成熟、资料比较系统、有完整定型的装帧形式的出版物是( C )A、技术报告B、政府出版物C、图书15、按信息检索的手段划分的信息检索类型是( C )A、数据检索B、计算机信息检索C、事实检索B1、美国《科学引文索引》是最具权威的国际性检索系统之一,简称是:( C )A.SSCI B.CSSCI C.SCI通2、本馆电子图书系统有( B )。
信息检索练习题及答案(五篇范文)
信息检索练习题及答案(五篇范文)第一篇:信息检索练习题及答案《信息检索》练习题第一章练习一、名词解释1.信息——是世界上一切事物的状态和特征的反映,是用文字、数据或信号等形式,通过一定的传递和处理,来表现各种相互联系客观事物在运动变化中所具有特征内容的总称。
2.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。
3.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。
二、填空题1.信号只是信息的(),信息是信号所载荷的()。
载体、内容2.现实的信息资源依据传递信息的载体和表述方式的不同,可以划分为(),(),(),(),()。
口语信息资源、体语信息资源、文献信息资源、实物信息资源、网络信息资源3.口语信息资源、体语信息资源和实物信息资源,通过计算机技术的转化,成为(),如果有长期开发的价值,往往会转化成()。
网络信息资源、文献信息资源4.()是记录有信息和知识的一切有形载体,是将知识用文字、符号、图像、音频、视频等方式记录在一定的固态物质载体的结合体。
文献5.期刊按内容和性质划分,可以分为(),(),()。
学术性期刊、检索性期刊、其他类型期刊6.()是指未经出版发行的或未以公开形式进入社会交流的最原始的文献。
零次文献三、判断题1.情报只是一类专门的信息,是信息的一个子集。
()2.网络信息资源也称虚拟信息资源,是指以数字化形式记录的,以多媒体形式表达的,存储在网络计算机磁介质、光介质以及各类通讯介质上的。
()3.机读型文献是以磁性材料为存储介质,采用计算机技术、磁性存储技术、激光技术,以键盘输入、文件拷贝、刻录或光学扫描等方法作为记录手段,通过计算机处理而产生的一种新的文献。
()4.缩微型文献是以印刷型文献为母本,以感光材料为载体,采用光学缩微技术将文字或图像记录存储在感光材料上而形成的文献。
()5.声像型文献是一种以磁性和光学材料为载体,将声音和图像记录存储在磁性或光学材料上的非文字形式的文献。
信息检索与利用练习题及答案
第一章概说综合练习一、填空题1、文献信息资源,在载体形式上,包括纸质文献和电子资源。
2、一次文献是依据整理本人的研究或研制成果创作的文献,即通常所说的“原始文献”、“第一手资源”。
一次文献在形态上具有多样性,在内容上具有原创性,在出处上具有分散性。
3、二次文献是按一定的方法对一次文献进行整理加工,以使之有序化而形成的文献,主要包括目录、索引、文摘等。
二次文献通常又被称为“检索性文献”、“线索性文献”。
4、三次文献是对大量相关文献进行综合分析而形成的评述研究性文献,如综述、述评等。
三次文献在内容上具有综合性,在功效上具有参考性。
5、传统的文献检索工具体系由印刷版工具书构成。
6、电子化的检索工具是以数据库的形式出现的,数据库类型有数值型数据库、事实型数据库、文献型数据库。
7、部首法首创于东汉时期著名学者许慎的《说文解字》。
8、在现有的电子版检索工具中,检索词主要有两大类:字段词和任意词以数值型数据库、事实型数据库和书目数据库出现的电子版检索工具,检索词是字段词。
以全文数据库出现的电子版检索工具,检索词可以是“任意词”。
9、“循环衍生法”包括定义衍生法、语素衍生法、语境衍生法。
10、现有的中文电子版检索工具一般都设有高级检索功能,较多地使用的检索技术是布尔逻辑检索、截词检索和位置检索,体现出的检索特点是组配检索、模糊检索和限定检索。
11、逻辑“与”(and)符号表示为“*”。
表示“同时包含”关系。
逻辑“或”(or)符号表示为“+”。
表示“分别包含”关系。
逻辑“非”(not)符号表示为“-”。
表示“排除其他”关系。
12、中文检索引擎的检索方式主要有两种:一是分类方式,二是关键词方式。
13、文献信息资源的引证标注有3种情况:注释、引文出处、参考文献。
14、文后参考文献著录的国家标准是1987年5月《文后参考文献著录规则》15、文后参考文献列表可以采用“顺序编码制”,也可以采用“著者——出版年制”。
16、《中国学术期刑(光盘版)检索与评价数据规范》(CAJ-CD规范)用单字母方式标识纸张型参考文献类型,如专著—M、论文集—C、报纸文章—N 、期刊文章—J、学位论文—D、报告—R;用双字母方式标识电子型参考文献和非纸张型载体的电子文献,如数据库—DB,磁带—MT、光盘—CD、联机网络—OL 。
信息检索习题及答案
注意:1、通读教材,根据页码提示完成以下题目。
2、最后一次上机课在线测试,范围不超出如下题目。
第一章一、单项选择1、报道范围主要为能源方面的科技报告为〔D〕。
A、ADB、PBC、NASAD、DOE{第7页}2、〔C〕是出版周期最短的定期连续出版物。
A、图书B、期刊C、报纸D、学位论文{第6页}3、〔A〕是高校或科研机构的毕业生为获取学位而撰写的。
A、学位论文B、科技报告C、会议文献D、档案文献{第6页}4、了解各个国家政治、经济、科技开展政策的重要信息源是〔B 〕A、科技报告B、政府出版物C、标准文献D、档案文献{第8页}5、年鉴属于以下哪一类别〔D〕A、零次信息B、一次信息C、二次信息D、三次信息{第7页}〔一次信息:图书、期刊论文、科技报告、会议论文、专利说明书及科技日记、杂记、实践记录〕6、以下哪种文献属于一次文献〔A 〕。
A、图书B、百科全书C、综述D、文摘{第4页}7、以下文献中属于一次信息的是〔A 〕A、专利说明书B、百科全书C、目录D、综述{第4页}8、以下各项属于二次信息的是〔A〕A、索引B、期刊C、学位论文D、百科全书{第4页}〔二次信息;目录、题录、文摘、索引、书目对一次信息有指引和报道作用〕二、多项选择9、二次信息主要包括〔〕等。
A、手册B、年鉴C、目录D、题录{第4页}10、信息的属性包括〔〕A、客观性B、时效性C、传递性D、共享性{第3页}11、信息素质的内涵主要包括〔〕。
A、信息意识素质B、信息能力素质C、信息道德素质D、信息职业素质{第9页}12、以下类型的信息属于三次信息的是〔〕。
A、目录B、词典C、百科全书D、科技报告{第4页}附加:I)信息道德标准信息行为,主要包括〔〕。
A、不制作、传播、消费不良信息B、不侵犯他人的知识产权、商业秘密、隐私权C、恰当使用与合理开发信息技术D、私下交易个人信息〔第10页〕II)根据信息的载体和表达方式的不同,信息源可分为〔〕。
A、语言信息源B、二次信息C、实物信息源D、文献信息源〔第4页〕III)文献的根本要素有〔〕。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、填空题 1.数据的记载方式主要有 数值型_、文字型、_语音型、_图像型。
2.数据与信息的关系可看作是 原料_和_成品_的关系。 3.信息分析过程是将数据转换为_信息_的过程。 4.信号分为_信息_信号和_人为_信号。 5.信息一般表现为_数据_、文本_、_声音、_图像_等形态。 6.一般认为,信息由_语义_、_差异_、_传递_、_载体_等要素构成。 7.信息的加工按加工对象的不同可分为对_外表_信息的描述,对_整体_信息的描述,如文摘对_内容_信息的描述。 8.信息管理的过程包括信息_收集_、信息_传输_、信息加工_、信息储存_。 9.信息加工包括_信息形式的变换和_信息内容的处理。 》 10.信息动机的形成原因有_内在的信息需要_和_外在刺激_。
11.主题语言包括_标题词_、_单元词_、_叙词_、_关键词_。 12.在信息存储的结构中,基本的逻辑结构有_线性结构_、_非线性结构、_树形结构_、网状结构。 13.总体上,信息检索系统可分为_数据预处理_、_索引生成_、_查询处理、_检索_。 二、名词解释 1. 数据:是指记载下来的事实,是客观实体属性的值,它是由原始事实组成的。 2.信息加工:是指对获取的信息进行判别、筛选、分类、排序、分析、计算和研究等一系列过程,使收集到的信息成为对我们有用的信息资源。 3.信息组织:即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。 4.检索标识:就是为沟通文献标引与文献检索而编制的人工语言,也是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道,是用于文献标引和检索提问的约定语言。 5.信息检索:可以从广义和狭义两个角度理解。广义的信息检索是指将信息按一定方式组织和存储起来,并根据用户的需要找出相关信息的过程,其中包括存与取两个方面。狭义的信息检索仅指信息查找过程。 - 6.信息检索系统:是指按某种方式、方法建立起来的用于检索信息的一种有层次的体系,是表征有序的
信息特征的集合体。 7.检索效果:是指利用检索系统(或工具)开展检索服务时所产生的有效结果。 三、简答题 1.简述了解用户信息需求的作用 答:用户信息需求是信息系统发展的动力,也是制定信息政策的出发点和依据。了解用户需求的特点、心理规律、查询行为及需求方式,有助于系统制订合理的信息搜集方针和信息资源的合理布局,从而提高服务效益和质量。 2.简述影响信息动机向信息行为转化的主要因素 答:(1)信息动机强度 (2)认知能力 (3)抱负水平 3.简述信息需要的特点 答:(1)信息需要的广泛性 (2)信息需要的社会性 (3)信息需要的发展性 (4)信息需要的多样性 【 4.简述信息检索系统的构成模式
答:(1)信息数据的选择、处理、录入、维护子系统 (2)词表和标引子系统 (3)检索子系统 (4)系统-用户接口子系统 8.简述信息检索系统的流程 系统可分为数据预处理、索引生成、查询处理和检索四个部分。 四、论述题 1.有人说,信息加工是一个体系,你如何理解,请着重从“体系”这个角度加以说明 答:(1)加工的方式、方法多种多样。 (2)加工的方式、方法相互之间有关联,从不同角度对信息进行加工的。 (3)加工过程有其内在联系,构成一个完整的系统。 < (4)整个加工体系会随着时间的变化,信息数量的变化,载体的变化和技术的变化而不断变化和完
善。 (5)信息的加工按其加工对象的不同可分为对外表信息的描述与加工,对整体信息的描述与加工,还有对内容信息的描述与加工。 2.请探讨一下信息加工的层次性 根据信息加工特点,信息加工分为6个层次: ①外表信息的加工是描述性的,给用户提供的是信息的线索; ②整体信息的加工是概述性的,给用户提供的是信息的内容特点; ③内容信息的加工要深入信息内部,对有用的信息给予揭示标引,使读者利用信息有据可查; ④精粹信息的加工是通过比较鉴别的方法,选取价值高的整体或局部信息,给用户直接提供信息的精华,满足用户对实质性信息的要求; ⑤深度信息的加工是研究性和评价性的,解决信息的优劣和有关信息的有效组合问题,给用户以启迪和决策依据; ⑥相关信息的加工是信息的外延和扩展,使有关信息根据一定关系进行链接,给用户检索和直接利用的方便。 % ******************************* 二 ********************************************
一、填空题 1.数据库的定义功能主要是对数据库的结构进行描述,这些定义都保存数据字典 中。 2.数据库系统提供了两种机制来支持完整性约束:第一种是完整性 定义机制,第二种是完整性_验证约束机制_。 3.数据库的三级模式是指_外模式_、_内模式_、_模式_。 4.对文献数据库而言,加工深度表现为_题录_、_文摘_、_全文 三个层次。 5.标引工作可分为_人工标引_、_计算机辅助标引_、_自动标引 三种方式。 6.信息检索过程实际上是将检索提问式与文献记录标引词进行_对比匹配_的过程。 7.为提高检索效率,计算机检索系统从_概念相关性_、_位置相关性_等方面对检索提问实行技术处理。 8.用向量模型计算机向量时,一般采用向量的_夹角余弦_来表示。 9.'
10.通常,智能信息检索系统由_知识库_、_文本处理_、_智能接口_三部分组成。 二、名词解释
1.数据模型:是描述数据、数据联系、数据操作、数据语义以及一致性约束的概念工具的集合。 2.著录:就是对信息外部特征进行分析、选择与记录的过程。 3.标引:就是指对信息内容特征进行分析,赋予信息以检索标识的过程。 4.词位检索:是以数据库原始记录中的检索词之间的特定位置关系为对象的运算,又称全文检索、邻近检索。 三、简答题 1.什么是倒排文档为什么要使用倒排文档 答:倒排文档是将主文档中的可检字段抽出,按某种顺序重新排列起来所形成的一种文档。 按表达文献内容特征的主题词排列的文档称为基本索引文档;按表达文献外部特征排列的文档称为辅助索引文档。在实施检索时,必须和顺排文档配合使用。倒排文档类似于检索工具中的辅助索引。 : 2.简述布尔模型及其优缺点
答:布尔模型是最简单的信息检索模型。这种模型的理论基础是集合论。 布尔模型最大的优点是理论简单、使用方便。 缺点是:(1)它只能给出精确匹配的结果;(2)检索结果有可能因查询词在大量文档中出现而数量太多;(3)由于找不到与查询词完全匹配的文档而使结果太少。 3.简述向量空间模型及其优点 答:向量空间模型是一种简便、高效的文本表示模型,其理论基础是代数学。 向量空间模型最主要的优点在于:(1)该模型的权重计算方法能够提高系统的检索性能;(2)模型中使用的部分匹配方法能检索出与用户的查询输入条件“近似”的文档; (3)在模型中可以根据检索出的结果与查询条件的相关程度对结果进行排序。另外,向量空间模型计算简单,检索速度快。 4.简述“网播”的信息推送方式 答:(1)频道式推送 (2)邮件式推送 (3)网页式推送 (4)专用式推送 ` 5.简述智能信息检索的系统结构
答:智能信息检索系统是由知识库、文本处理和智能接口三部分组成。 6.简述智能信息检索的主要方法 答:(1)统计方法 (2)文本分析方法 (3)人工智能方法 (4)语料库方法 7.有哪些种类的加权检索各有哪些特征 加权检索把量化思想引入定性检索之中,是改善和提高检索效果的一种重要手段。分标引加权和检索加权; 检索加权是指检索者在给出检索词的同时,并为每个检索词赋予权值,以区分每个检索词在检索中的重要程度。通过加权,明确了各检索词的重要程度,使检索更有针对性,并且能依据权值的大小,对命中记录的重要性进行排序 词频加权检索是根据检索词在记录中出现的频次来计算命中记录的权和,依据命中记录权和数从大到小排列,最后由阈值控制输出命中结果。 与检索词加权检索不同的是,词的权值是由数据库记录中的词频决定,不是由检索者指定,不需人工干预,减轻了检索者的负担。 词频加权检索方法应建立在对全文数据库和文摘数据库基础之上,否则词频加权将失去意义。 … 简单词频加权检索:指检索时累计检索词在记录中出现的次数来决定记录的权值,然后累计该记录每个
检索词权值之和来决定该记录是否为命中记录。 相对词频加权检索:是将每一个检索词在本文中频率和在整个数据库中的频率综合考虑,进行加权检索的方法。 标引加权检索是指在对文献进行标引时,根据每个标引词在文献中的重要程度不同,为它们附上不同的权值,检索时通过对检索词的标引权值相加来筛选命中记录。 四、论述题 1.扩展的检索技术很多,请从提高可是查准率和查全率两个角度探讨一下扩展的检索技术。循此思路。你还有什么新的解决方法 2.如何理解布尔逻辑表达式的逆波兰转换 3.请用实例说明信息推送的实际应用 ******************************* 四 ****************************************** 一、填空题 1.全文检索主要研究对整个文档信息的_表示_、_存储_、_组织_、_访问_。 2."
3.全文检索的中心环节是_文件内容表达_、_信息查询的获得_、_相关信息的匹配_。 4.按检索对象来区分,全文检索可分为_基于文本_和_基于Web _两种类型;根据索引库中索引元素
的不同,全文检索可分为_基于字表_的全文检索和_基于词表_的全文检索。 5.基于理解的分词系统通常包括_分词子系统_、_句法语义子系统_、_总控部分_等三个部分 6.自动标引又分为_自动主题标引_、_自动分类标引_。 7.自动标引的方法主要有_统计标引法_、概率标引法_、_句法分析法_、_语义分析法、_人工智能法_。 8.一个自动标引系统通常包括文本输入_、_词典_、_抽词_、_知识库_、_综合与转换_、_输出_等六个子系统。 9.文本有_词频_、_标题_、_位置、_句法结构_、_线索词_、_指示性短语 等新课程形式特征,这些特征是自动摘录的依据。 10.汉字全文检索系统主要包括两方面的核心技术,一是如何建立和维护全文检索的_索引数据库_,二是如何提供快速有效的_检索机制_。 11.索引数据库一般由一个变长的_主文件_和一个在索引文件控制下的_倒排文件_组成。 12.全文检索索引数据库的生成包括_数据准备_、_文本预处理_、_数据加载 三个步骤。 二、:
三、名词解释 1.全文检索 自动标引 主题词标引 自动文摘
四、简答题 1.简述全文检索的优缺点 2.简述基于字符串匹配分词方法的一般模型 3.简述单汉字标引法及其优缺点 4.简述主题词标引的基本思路 5.简述主题词标引的实现 6.简述自动标引的基本流程 7.简述词索引的全文检索系统的索引算法 8.。