信息检索系统导论期末考试题库

合集下载

信息检索期末考试题

信息检索期末考试题

2012-2013第二学期《文献信息检索与利用》考核试题姓名:许诺学号: 20112801320188学院:应用科技学院年级: 2011级专业:财务管理任课老师:符思嘉成绩:一、自拟一道与本专业有关课题进行检索,至少应包括两个以上的主题。

(注意:自拟的题目不能与其它同学重复,如有重复将做不及格处理。

)(60分)检索课题名称:关于房地产企业的财务管理创新的探讨(如:“数字化图书馆信息管理软件开发与研究”)1、使用CNKI数据平台与课题密切相关的期刊论文、学位论文、会议论文。

(20分)检索途径或方法: CNKI数据库文献的高级检索 (1)检索词:房地产企业、财务管理 (4)检索式: KY=房地产企业*财务管理 (4)按此方法检出的文献记录数: 226 (1)录入后的检索式或检索框截图: (1)根据检出的文献完成以下操作:(1)选1条期刊论文记录,按参考文献中的标准著录格式填入下行中:郑艳霞.房地产企业财务管理的风险防范[J].金融经济,2008,(18):154-155.(3)该条文献的摘要页面:(2)写出1条学位论文记录,按参考文献中的标准著录格式填入下行中:鲍晶.八治建设集团内部重组方案设计[D].兰州:兰州大学,2011.(3)该条文献的摘要页面:(3)写出1条会议论文记录,按参考文献中的标准著录格式填入下行中:王娅捷,康玲,艾利刚.经营性物业抵押贷款评估产品分析[A].中国房地产估价师与房地产经纪人学会2012年年会—市场变动与估价、经济行业持续发展论文集(C).2012. (3) 该条文献的摘要页面:2、使用万方数据平台,检出该课题的期刊论文和学位论文(20分)检索途径或方法:万方数据库跨库检索中的高级检索(2)检索词:房地产企业、财务管理 (4)检索式:题名或关键词:(“房地产企业”)*题名或关键词:(“财务管理”)*Date-2013 (4)按此方法检出的文献记录数:期刊论文(197)学位论文(26) (2)录入后的检索式或检索框截图:(2)根据检出的文献完成以下操作:(1)选出1条期刊论文记录,按参考文献中的标准著录格式填入下行中:戴健敏.浅谈房地产企业的财务管理[J].科技咨询导报,2007,(16):162.(3)该条文献的摘要页面:(2)选出1条学位论文,按参考文献中的标准著录格式填入下行中:张振媚.房地产企业税收筹划[D].北京:首都经济贸易大学,2010.(3)该条文献的摘要页面:3、使用Google搜索引擎检索该课题相关的PPT或PDF文献。

信息检索试题及答案

信息检索试题及答案

信息检索试题及答案一、选择题(每题2分,共10分)1. 信息检索的英文缩写是()。

A. IRB. ITC. ISD. AI答案:A2. 以下哪个不是信息检索的类型?A. 文本检索B. 图像检索C. 声音检索D. 视频检索答案:D3. 以下哪个是全文检索系统?A. Google ScholarB. PubMedC. IEEE XploreD. All of the above答案:D4. 布尔逻辑中,“与”操作的符号是()。

A. ANDB. ORC. NOTD. XOR答案:A5. 以下哪个不是信息检索的评估指标?A. 查准率B. 查全率C. 准确率D. 召回率答案:C二、填空题(每题2分,共10分)1. 信息检索的目的是帮助用户从大量信息中找到______的信息。

答案:相关2. 信息检索系统通常包括______、索引和检索接口三个主要部分。

答案:数据库3. 在信息检索中,______是一种将用户查询与文档内容进行匹配的方法。

答案:关键词4. 信息检索的效率可以通过______和查全率两个指标来衡量。

答案:查准率5. 信息检索的发展历程可以分为手工检索、______和网络检索三个阶段。

答案:自动化检索三、简答题(每题5分,共20分)1. 简述信息检索的基本过程。

答案:信息检索的基本过程包括信息需求分析、选择检索工具、制定检索策略、执行检索操作、评估检索结果和调整检索策略。

2. 什么是信息检索中的查准率和查全率?答案:查准率是指检索出的相关文档占检索出的所有文档的比例,查全率是指检索出的相关文档占所有相关文档的比例。

3. 列举三种常见的信息检索技术。

答案:常见的信息检索技术包括全文检索、关键词检索和分类检索。

4. 信息检索在日常生活中有哪些应用?答案:信息检索在日常生活中的应用包括学术研究、市场调查、新闻报道、个人兴趣探索等。

四、论述题(每题10分,共20分)1. 论述信息检索在学术研究中的重要性。

《信息检索》期末考试试题库

《信息检索》期末考试试题库

提示:期末考试题库内容一、填空1.在许多数据库中,都有“二次检索”功能,“二次检索”指:在前一次检索基础上再检索。

2.在google搜索引擎检索关键词为短语DA TA OUTPUT,将检索短语写成“DA TAOUTPUT”。

3.清华同方数据库默认的检索方式是多库检索。

4.数据库的类型:网络数据库、联机数据库和光盘数据库。

5.描述信息内容特征的检索语言包括分类语言和主题语言,主题语言又可分为关键词语言、单元词语言、标题词语言和叙词语言。

6.检索工具有多种索引,可以提供多种检索途径,一般来讲,检索途径可以分为以下四种:分类途径、主题途径、著者途径和其他途径。

7.按信息的存储媒体和技术手段来分,检索的手段有两种:手工检索和计算机检索。

8.信息检索常用的方法有:工具法、引文追溯法和循环法。

9.专利有三层含义新颖性、创造性和实用性。

10.标准文献的主体是标准。

11.期刊论文的文献出处包括期刊名称、年卷期和起止页码。

12.文件ABC.001.TXT的后缀名是TXT 。

文件类型是文本文件。

13.多数网页采用HTML编写,这里的HTML指的是:超文本标识语言。

14.按文献的相对利用率来划分,可以把文献分为核心文献、相关文献、边缘文献。

15.检索工具具有两个方面的职能:存储职能、检索职能。

16.将文献作者的姓名按字顺排列编制而成的索引称为:作者索引。

17.利用原始文献所附的参考文献,追踪查找参考文献的原文的检索方法称为追溯法,又称为引文法。

18.当检索关键词具有多个同义词和近义词时,容易造成漏检,使得查全率较低。

19.手稿、私人笔记等属于零次文献,辞典、手册等属于三次_文献。

20.狭义的信息检索就是指信息的_检索____过程。

21.按照检索对象的不同,信息检索可分为数据检索、事实检索和文献检索。

22.按信息检索的技术划分,信息检索有(全文本检索)、(多媒体检索)、超文本信息检索、(超媒体信息检索)。

按信息检索的手段划分,可分为(手工信息检索)、(计算机信息检索)。

2020年信息检索导论期末考试试题

2020年信息检索导论期末考试试题

试题专用纸课程名称: 信息检索导论学生姓名:学号:培养单位:分数:一、选择题(单选,每题2分,共20分)1.关于布尔检索,以下说法正确的是()A)在布尔检索系统中,进行词干还原从不降低正确率B)在布尔检索系统中,进行词干还原从不降低召回率C)词干还原会增加词项词典的大小D)词干还原应该在构建索引时调用,而不应在查询处理时调用2.关于倒排索引,以下说法错误的是()A)词典的开销通常小于倒排记录表的开销B)倒排索引中往往会存储词项的频率C)词典中存储的都是词D)倒排索引可以加快搜索的速度3.关于向量空间模型的特点,下面说法不正确的是()A)支持部分匹配和近似匹配,结果可以排序B)理论上不够严谨,往往基于直觉的经验性公式C)词项之间的独立性假设与实际不符D)应用于检索问题时,效果不如概率检索模型4.关于tf-idf,以下说法不正确的是()A)一个罕见词的idf往往很高B)idf的大小是无限的C)词项的tf-idf权重可以超过1D)词项t在所有文档中出现,则权重取值很小5.关于隐式相关反馈,下面说法错误的是()A)不需要用户显式参与,减轻用户负担B)对行为分析有较高要求C)一定能提升检索准确率D)某些情况下需要增加额外设备6.SVM中的正则化因子(也称为惩罚因子)是指()A)交叉验证的次数B) 用到的核函数C)分类准确性和模型复杂度之间的权衡D) Lagrange乘子7.把一个连接的Web网络看作一个蝴蝶结结构,其中20%的页面为IN,60%页面在SCC区域,20%的页面为OUT。

假设从3个起始页面开始爬取网页,目标是尽可能多地访问此Web中的页面。

请问从下面哪一个选项中选取三个网页作为初始种子网页能爬取最多的网页?()A) 从IN、OUT各选一页B) SCC选一页,IN选两页C) SCC选两页,IN选一页D) 从IN中选三页8.关于聚类结果评价的外部准则,不包括以下哪种方法()A)兰迪指数(Rand Index)B) 残差平方和(RSS)C)归一化互信息(NMI)D) 纯度(Purity)9.假设有两个Web搜索引擎A和B,现从各自索引中随机均匀地生成大量网页。

信息检索课期末复习题

信息检索课期末复习题

信息检索课期末复习题第一篇:信息检索课期末复习题信息检索课期末复习题第1章绪论1.信息素质的概念。

(P2)2.信息素质的四要素分别是什么?(P3)第3章信息与信息资源1.信息的含义。

(P33)2.信息的特征。

(P3-34)3.文献的概念。

(P35)4.文献信息资源的分类方法:按载体形式划分、按出版类型划分、按加工层次划分。

其中重点理解一次文献、二次文献、三次文献是什么。

第4章信息检索基础1.印刷型信息检索系统的类型及格式(P47)2.计算机信息检索系统的构成。

(P48)3.检索效果的评价指标中查全率和查准率是如何计算的?它们之间是什么关系?(P52)如何提高查全率(P60)?如何提高查准率?(P60)4.认真学习4.2信息检索的基本步骤这一节的内容,能够知道面对一个具体的检索课题需要设计经过怎样的检索流程?(P53-P61)5.检索点是什么?反应文献信息内容特征的检索点有哪些?反应文献外表特征的检索点有哪些?分类和主题检索点又有什么特点?6.看图表了解中图法是如何具体分类的?7.在计算机检索系统中的基本检索算符有哪些?(P71)重点掌握逻辑算符、字段限制算符、短语检索的表示方法,能够根据检索意图编制相应的检索式。

第5章国内学术信息资源检索结合实习作业复习本部分的内容1.广工图书馆网站上查找电子图书的数据库有哪些?KI、万方和维普分别可以查询哪些类型的文献?(期刊论文、会议论文、学位论文、专利文献、标准文献等)3.专利这个词有哪三层含义?(P109)4.中国专利有哪几种类型?保护时间分别多长?怎样从专利号中辨别不同类型的专利?5.授予专利权的条件是什么?6.专利有哪三种审查制度?我国的专利分别采用哪种审查制度?7.知道检索全世界专利文献的共同方法是利用国家专利分类表,了解国际专利分类号的组成。

(P113)8.结合实习,了解可通过哪些数据库或网站获取专利文献或标准文献?9.我国标准化法把标准分为哪四级?认识国家标准编号的组成。

信息检索课期末考试试题库(复习题)

信息检索课期末考试试题库(复习题)

信息检索课期末考试试题库(复习题)一、单项选择题在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。

错选、多选或未选均无分。

知识是指人类对客观世界的认识。

知识可分为(C)A.有用知识和无用知识B.基础知识和高级知识C.感性知识和理性知识D.理论知识和实践知识文献按载体形式可分为:印刷型、缩微型、声像型和(D)A.甲骨型B金石型C.电脑型D.机读型信息检索系统的功能为:报道文献信息、存储文献信息和(B)A.揭示文献信息B.检索文献信息C.宣传文献信息D.介绍文献信息检索系统的结构由几个部分组成:编辑使用说明、索引、附录、词表和(D)A.目次B.题录C.附图D.正文(主文档)为便于计算机识别记录的各个字段,每个字段都设有字段标识符,下列哪个字段的标识叙述是正确的(A)A.TI是题名的标识符B.AB是关键词的标识符C.AU是摘要的标识符D.AF是著者的标识符以下不是布尔逻辑算符的是(B)A.ANDB.NearC.ORD.NOT布尔逻辑算符通常的运算顺序是(A)A.有括号时,括号内的先执行;无括号时 NOT > AND > ORB.有括号时,括号内的先执行;无括号时 NOT > OR >ANDC.有括号时,括号内的先执行;无括号时 AND >NOT > ORD.有括号时,括号内的先执行;无括号时 AND > OR > NOT限定词“in”是为了缩小检索范围,提高检索速度和命中率的。

下列检索表述式正确的是(B)A.“信息in OCLC”B.信息in AB”C. 信息in CNKI”D.信息in Calis”我国高校与公共图书馆的文献资料,一般采用的分类法分类的是(A)A.《中国图书馆图书分类法》B.《国际十进分类法》C.《人大法》E.《科图法》信息检索的方法有追溯法、综合法和(C)A.须查法B.倒查法C.工具法D.抽查法CNKI数据库的全文数据输出文件的格式为(D)A.VIP和TXTB.CAJ和VIPC.PPT和PDFD.CAJ和PDF超星电子图书提供快速检索和高级检索两种检索方式,利用快速检索可以按图书的单项模糊查询,这些单项包括(A)A.书名、作者、索书号和出版日期B.书名、作者、索书号和出版社C.书名、作者、分类号和出版社D.书名、版本、索书号和出版社读秀知识库是由海量全文数据及元数据组成的超大型数据库。

信息检索考题及答案

信息检索考题及答案

一、单选1、报道范围主要为能源方面的科技报告为(D、DOE).2、(C报纸)是出版周期最短的定期连续出版物。

3、(A学术论文)是高校或科研机构的毕业生为获取学位而撰写的。

4、了解各个国家政治、经济、科技发展政策的重要信息源是(B政府出版物)5、年鉴属于下列哪一类别(D三次信息)6、下列哪种文献属于一次文献(A图书)。

7、下列文献中属于一次信息的是(A专利说明书)8、以下各项属于二次信息的是(A索引)21、(D 漏检率)是指未检出的相关信息量与检索系统中实际与课题相关的信息总量的比率。

22、《四级英语阅读与完型填空》这本图书在中图法体系中的分类号可能是(D、H319 )。

23、布尔逻辑表达式:在职人员NOT(中年AND教师)的检索结果是(A检索出除了中年教师以外的在职人员的数据)24、布尔逻辑检索中检索符号“OR”的主要作用在于(B提高查全率).25、根据一定的需要,将特定范围内的某些文献中的有关知识单元或款目按照一定的方法编排,并指明出处,为用户提供文献线索的一种检索工具是(C索引)。

26、将存储于数据库中的整本书、整篇文章中的任意内容查找出来的检索是(A全文检索)27、截词检索中,“?"和“*”的主要区别在于(A 字符数量的不同)。

28、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(C* )表示无限限检索。

29、尽管不同的检索系统对截词符的定义不尽相同,一般而言,多数用(A?)表示有限检索。

30、利用截词技术检索“?ake”,以下检索结果正确的是(D take)31、利用图书末尾所附参考文献进行检索的方法是(D追溯法)。

32、位置运算符号(W)和(N)的主要区别在于(D 检索词是否出现在同一文献中)。

33、我国最早的分类法是(B 《七略》)34、要查找吴敬琏所发表的文章,首选途径为(C责任者途径)。

I)主题较复杂、研究范围较大、研究时间较久的科研课题适用的检索方法为(A顺查法)II)《科学引文索引》是基于(B追溯法)检索方法而编制出来的检索工具:III)下列检索工具哪个不属于事实数据检索工具(A词典):IV)按检索手段分,搜索引擎属于(C网络检索工具)64、Adobe Reader可以阅读(D、PDF )格式文件.65、ISBN是(A国际标准刊号)的缩写。

信息检索期末考试题

信息检索期末考试题

信息检索期末考试题一、单项选择题(每题2分,共20分)1. 信息检索的目的是()。

A. 存储信息B. 检索信息C. 传递信息D. 创造信息2. 以下哪个不是信息检索的类型()。

A. 布尔检索B. 模糊检索C. 精确检索D. 随机检索3. 在信息检索中,“AND”操作符的作用是()。

A. 逻辑或B. 逻辑与C. 逻辑非D. 逻辑异或4. 信息检索中的“关键词”是指()。

A. 与主题无关的词汇B. 与主题相关的词汇C. 任意词汇D. 专有名词5. 以下哪个数据库不是全文数据库()。

A. PubMedB. Web of ScienceC. Google ScholarD. JSTOR6. 在信息检索中,使用“*”符号的作用是()。

A. 表示精确匹配B. 表示任意字符的零次或多次出现C. 表示任意字符的一次出现D. 表示词组的开始或结束7. 信息检索中的“截词检索”是指()。

A. 检索词的精确匹配B. 检索词的前缀匹配C. 检索词的后缀匹配D. 检索词的中间匹配8. 以下哪个不是信息检索的步骤()。

A. 需求分析B. 选择检索工具C. 制定检索策略D. 撰写检索报告9. 在信息检索中,“OR”操作符的作用是()。

A. 逻辑与B. 逻辑或C. 逻辑非D. 逻辑异或10. 以下哪个不是信息检索的效果评价指标()。

A. 召回率B. 准确率C. 相关性D. 速度二、多项选择题(每题3分,共15分)1. 信息检索的基本原则包括()。

A. 相关性原则B. 经济性原则C. 系统性原则D. 可扩展性原则2. 信息检索中的“布尔逻辑”包括()。

A. ANDB. ORC. NOTD. NEAR3. 信息检索中的“字段检索”可能包括()。

A. 标题字段B. 作者字段C. 关键词字段D. 摘要字段4. 信息检索中的“高级检索”功能通常包括()。

A. 精确检索B. 模糊检索C. 截词检索D. 限定检索5. 信息检索中,提高检索效果的方法可能包括()。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息检索系统导论期末考试题库一、选择题1.下列哪项不属于信息检索的关键技术?(B )A.信息抽取B.文本挖掘C.自动文摘D.链接分析2.TREC测试集主要包括3个部分,下列选项中不是TREC测试集的一部分的是:(C )A.主题B.文档集合C.关键词D.相关性判断3.对向量空间模型、布尔模型及概率模型的表述有误的一项是:(D )A.向量空间模型与布尔模型相比具有较大的优势B.向量空间模型无法揭示索引项之间的关系,因而向量空间模型在理论上还是不够完善C.布尔模型是最早提出的信息检索模型D.概率模型也称二值独立检索模型。

它是在向量空间模型的基础上为解决检索中存在的一些不确定性而引入的。

4 利用文献后面所附的参考文献进行检索的方法称为(A )A.追溯法B.直接法C.抽查法D.综合法5、逻辑“与”运算符是用来组配()A.不同检索概念,用于扩大检索范围B.相近检索概念,扩大检索范围C.不同检索概念,用于缩小检索范围D.相近检索概念,缩小检索范围6、在《中国学术期刊全文数据库》中,不可以进行()检索A.逻辑与B.逻辑或C.逻辑非D.位置7、若想在《中国学术期刊全文数据库》中提高检索结果的查准率,可使用()A.在结果中检索B.优先算符C.或者D.位置检索9、下列检索式中,哪一种属于逻辑“与”?( B )A.室内装饰+室外装饰B.音乐﹡教学C.神雕侠侣–电视剧D.火星︱金星10、下列不属于查询构造方法的是:()A 分类查询B 单一词查询C 布尔查询D 上下文查询11、PageRank算法的理论基础是随机冲浪模型,该模型描述了网络用户对网页的访问行为。

下列不属于用户访问行为特点的是:()A 用户选择的起始网页是固定的B 用户会从起始网页含有的超链接中随机选择一个页面继续浏览C 当用户沿着超链接前进了一定数量的网页后,可能会对本主题厌倦,这时用户会重新随机选择一个网页进行浏览D 用户会重复以上的过程若干次12、信息过滤系统是应用信息过滤技术处理信息的应用系统,下列对其特点的说法错误的是:()A 信息过滤系统是针对无结构的或半结构化的数据设计的信息系统,这与传统的数据库应用有着本质的区别B 信息过滤系统只处理文本信息C 信息过滤系统一般处理的数据为输入信息流D 信息过滤系统要包含一组对用户过滤需求的描述13、《中国学术期刊全文数据库》提供的文献内容特征检索途径有()A.机构B.篇名/关键词/摘要C.中文刊名D.作者14、维护倒排文件通常需要的操作有( D )文档或文档集合。

A .插入 B. 插入和删除 C. 删除 D. 插入、删除、更新15、单一查询是指由一个()构成的查询。

()A 单词 B. 单词或词语 C. 词语 D. 单词或句子16、下面哪项不是863信息检索评测采用的评价指标( D )A: MAP B:R-Precision C:P@10 D:MRP16、下面那一项不是容易引起歧义的符号( D )A :句号B :撇号C :连字符D :分号17、下列哪一种符号可以用来构成合成词()A 句点B 撇号C 连字符D 其它符号18、下面哪一项不是信息检索按照理论基础的不同划分的模型( D )A:布尔模型 B :向量空间模型 C :概率模型 D :统计语言模型19、下面哪种算法属于著名的集合选择算法?(B )A. KMPB. CORIC. BMD. BF20、下列说法正确的是()A.形态还原就是词干还原,即去除屈折型语言的词尾形态变化,将其还原为词的原形B.系统检索出来的相关文档位置越靠前(排序(rank )值越小),MRR 就可能越高C.概率模型可以采用相关反馈原理,可开发出理论上更为坚实的方法D.向量空间模型是最早提出的信息检索模型21、下面关于平均排序倒数(MRR )计算公式正确的是()n r a n k q M R R A n q ∑==11..∑==r i i r M R R B 1i 1..个相关文档位置第 )(1111..L r MRR C β-=)(1)(11..11L R M MRR D ββ--= 22、在信息检索模型中,()是最早提出的信息检索模型()A 向量空间模型B 概率模型C 扩展模糊集合模型D 布尔模型47、知网是一个以英语和汉语的词语所代表的概念为抽象对象,以(A )为基本单位,掲示概念之间以及概念属性之间的关系为基本内容的常识知识库A字节B字段C词D比特23、关于向量空间模型的优点中,说法错误的是:(D )A 检索结果的相关性排序B 可以控制输出结果的数量C 能够进行相关性反馈D 揭示了索引项之间的关系24、下列选项中不属于信息检索模型的是(D)A:布尔模型B:向量空间模型C:概率模型D:实数型25、准确率与召回率的表达式分别为(A)A.相关文档数与检出文档数的比值,系统检出的相关文档数与实际相关文档数的比值B. 系统检出的相关文档数与实际相关文档数的比值,相关文档数与检出文档数的比值C.检出文档数与相关文档数的比值,相关文档数与检出文档数的比值D.相关文档数与检出文档数的比值, 检出文档数与相关文档数的比值26、下列不属于查询构造方法的是(C )A.单一词查询B上下文查询C相邻词查询D布尔查询27、查询处理技术中有单一查询、下文查询,D 三种查询扩展方法A、短语查询B、相邻词查询C、反馈查询D、布尔查询28、TREC测试集主要包括文档集合②主题③相关性判断④企业检索任务()A①②B①③C①②③D①②③④29、按照顺序表述文献检索常用的五个步骤是(D )A.明确要求和分析课题,选择检索系统,获取原文,确定检索途径和检索策略,实施检索以及调整检索策略B. 明确要求和分析课题,获取原文,确定检索途径和检索策略,实施检索以及调整检索策略选择检索系统C. 明确要求和分析课题,实施检索以及调整检索策略选择检索系统,获取原文,确定检索途径和检索策略D. 明确要求和分析课题,选择检索系统,确定检索途径和检索策略,实施检索以及调整检索策略,获取原文30、万方数据库使用布尔逻辑算符and / or / not .其中A and B 表示(A )A:查找包括A和B的文献,B;查找A与B其中之一的文献,C:查找有A无B的文献。

31、具有概念交叉限定关系的两个检索词之间应该使用(C )A.逻辑或B.逻辑非C.逻辑与D.优先32、具有相近含义的同义词或同族词在构成检索策略时应该使用(A )运算符予以组配。

A.逻辑与B.逻辑或C.逻辑非D.位置33.关于万方数据资源的说法中,正确的是( A )A:以科技信息为主,涵盖经济,金融,人文信息B:以经济信息为主,涵盖科技,金融,人文信息C:以金融信息为主,涵盖人文,经济,科技信息D:以人文信息为主,涵盖金融,经济,科技信息34、在Lucene中建立索引的主要步骤不包括( )A 文档解析B 内容分析C 得出结论D 生成索引35、下列哪项属于典型的基于划分的聚类方法()A k–means算法B 朴素贝叶斯算法C 决策树算法D 统计学方法36、下列哪项不属于信息过滤中应用的统计模型( )A 向量空间模型B 布尔模型C 语言模型D 相关性模型37、下列属于信息检索中的关键技术的是()A 信息融合B 信息抽取C 处理多源信息D 话题检测与跟踪38、下列属于信息检索中的基础研究课题是()A 文本挖掘B 对抗式信息检索B 数字图书馆 D 基因信息检索39属于向量空间模型的缺点的是()A 检测结果的相关性排序B 可控制输出的结果和数量C 能够进行相关性反馈D 认为索引项相互独立,未能结实词语间关系40、下列不属于文本操作技术中的断词操作技术的是()A 句点B 撇号C 连字符D 未登录词识别41、信息检索系统需要事先做一些准备工作,这两项准备工作是(B)A 信息的采集与分类B 信息的采集与加工C信息的分类与标引 D 信息的分类与摘要42、信息检索的处理对象是(C)A 结构化信息B信息集合C非结构化信息D相关信息43、下面不属于基于语言模型的检索模型的是(D)A、查询相似度模型B、统计翻译模型C、风险最小化模型D、隐性语义索引模型44、试图通过统计学和概率论对自然语言进行建模,从而获取自然语言中的规律和特性,以解决语言信息处理中的特定问题。

属于下列的哪种的模型(A)A、统计语言模型B、扩展布尔模型C、概率模型D、向量空间模型45、下列选项中不属于文本操作技术的中文词法分析的是(A)A、断词B、最大匹配法C、歧义词切分D、未登录词识别46、利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止的检索方法是(A )A、倒查法B、顺查法C、追溯法D、抽查法47、下列那一个不是衡量一个语料的指标(A)A 准确率B标注的一致性C错误率D标注规范48、只知道某书的ISBN,应选择那种检索途径(D)A 分类检索B主题检索C著者检索D信息代码途径49、Google是那种类型的检索引擎(C)A 关键词型B目录型C集合型D专用型50、下列哪项不是web搜索引擎系统的子系统(D)A:web数据集系统B:网页预处理系统C:检索结果排序系统D:阅读理解系统51、TREC测试集主要包括几个部分(B)A 1个B 3个C 4 个D 5个52、信息检索的概念是(B)A 是指用来实现信息检索功能的计算机软件系统。

B 是指从非结构化的信息集合中找出与用户需求相关的信息。

C 信息检索是一门多学科的交叉的应用技术学科。

D 信息检索是利用各类媒体处理技术对信息进行加工,找出一定的机构。

53、一般来说,关键词出现在文献的不同字段表达的相关性不同,以表达的相关性从强到弱排序如下:( )A. 关键词>标题>文摘>正文B. 关键词>文摘>正文>标题C. 标题>关键词>文摘>正文D. 正文>文摘>关键词>标题54、信息检索模型按照理论基础的不同可划分为布尔模型、()、概率模型以及基础知识的模型。

(B )A、统计模型B、向量空间模型C、全文模型D、数据模型55、统计语言模型试图通过统计学和对自然语言进行建模,从而获得自然语言中的规律和特性。

(A )A 、概率论B、布尔模型C、高等数学D、向量56、面向用户的测度方法包括覆盖率、新颖率、相对查全率、(C )。

A、时间效率B、空间效率C、召回率负担D、出错率57、中文检索系统主要有两种检索方案:基于字的检索和(C )。

A、基于句子的检索B、基于文章的检索C、基于词的检索D、基于符号的检索58、信息检索的对象包括文字、(A )、音频、视频等。

A、图片B、文档C、网页D、数据59、下面不属于基于语言模型的检索模型的是(D)A、查询相似度模型B、统计翻译模型C、风险最小化模型D、隐性语义索引模型60、下列有关召回率与准确率正确的是(A )A、准确率为检索的相关文档数与检出文档数的比值。

相关文档
最新文档