信息检索中“相关性”的概念、类型及其不确定性

信息检索中“相关性”的概念、类型及其不确定性
信息检索中“相关性”的概念、类型及其不确定性

文献信息检索的含义

、文献信息检索的含义、分类、检索语言 1、文献信息检索: 文献检索含义 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索,这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻。 计算机信息检索,是指以计算机技术为手段,通过光盘和联机等现代检索方式进行信息检索的方法。 一次文献 (primary document):是指作者以本人的研究成果为基本素材而创作或撰写的文献,不管创作时是否参考或引用了他人的著作,也不管该文献以何种物质形式出现,均属一次文献。 二次文献 (secondary document):是指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性文献。检索工具书和网上检索引擎是典型的二次文献。 三次文献 (tertiary document):是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的产物。如大百科全书、辞典等。

零次文献 它是指未经过任何加工的原始文献,如实验记录、手稿、原始录音、原始录像、谈话记录等。零次文献在原始文献的保存、原始数据的核对、原始构思的核定(权利人)等方面有着重要的作用。 用检索标识与文献的存储标识相比,如果能够取得一致,就叫"匹配",就可得到"命中文献"。 2、文献检索语言 文献检索语言是一种人工语言,用于各种检索工具的编制和使用、并为检索系统提供一种统一的、作为基准的、用于信息交流的一种符号化或语词化的专用语言。检索语言按原理可分为3大类: (1)、分类语言 它是将表达文献信息内容和检索课题的大量概念,按其所属的学科性质进行分类和排列,成为基本反映通常科学知识分类体系的逻辑系统,并用号码(分类号)来表示概念及其在系统中的位置,甚至还表示概念与概念之间关系的检索语言。 (2)、主题语言 是指经过控制的,表达文献信息内容的语词。主题词需规范,主题词表是主题词语言的体现,词表中的词作为文献内容的标识和查找文献的依据 (3)、关键词语言 指从文献内容中抽出来的关键的词,这些词作为文献内容的标识和查找目录索引的依据关键词不需要规范化,也不需要关键词表作为标

信息检索作业上答案

姓名:莫英学号:109207010031系:管理工程系 班级:人力资源管理1班 1、在中国知识基础设施工程(CNKI)系列资源库的中国期刊全文数据库中检索篇名为《聚合硫酸铁的制备》发表在《四川师范大学学报》上的论文。(6`) 1)给出检索策略。 2)给出该文的题录信息。 答:1)、检索策略:检索条件:(题名=中英文扩展(聚合硫酸铁的制备)) 并且(文献来源=四川师范大学学报) (精确匹配) 检索方式:跨库检索;检索到:1条记录 数据库:中国学术期刊网络出版总库,中国学术辑刊全文数据库; 2)、题录信息:DataType: 1 Title-题名:聚合硫酸铁的制备 Author-作者:向群 Year-年: 1997 PubTime-发表时间: 1997-01-28 Keyword-关键词:聚合硫酸铁,酸度,催化剂 Summary-摘要:本文介绍了聚合硫酸铁的制备原理和方法,对制备方法中的催化剂选择作了一定的讨论. Period-期: 01 SrcDatabase-来源数据库:期刊

DOI-DOI: CNKI:SUN:SCSD.0.1997-01-016 Organ-机构:四川轻化工学院 link-连接: https://www.360docs.net/doc/5017474250.html,/grid2008/brief/detailj.aspx?filename=SCSD701 .016&dbname=CJFQ1997 2、检索有关“社保基金进入资本市场风险和收益”的研究文献。要求在CNKI中的《中国优秀硕博士学位论文全文数据库》、《中国期刊全文数据库》检索,无时间范围限制,检索词提示:“社保基金”、“资本市场”、“风险”、“收益”。请在跨库检索中选择相应的数据库后,确定检索词出现的字段及其组配关系,使检索结果不至于过少,要求写出该检索式。(6`) 答:检索策略:检索条件:(((( (主题=中英文扩展(社保基金进入资本市场风险和收益)或者主题=中英文扩展(社保基金)))或者(主题=中英文扩展(社保基金进入资本市场风险和收益)或者主题=中英文扩展(资本市场)))或者(主题=中英文扩展(社保基金进入资本市场风险和收益)或者主题=中英文扩展(风险)))或者(主题=中英文扩展(社保基金进入资本市场风险和收益)或者主题=中英文扩展(收益))) (精确匹配) 检索方式:跨库检索;检索到:800700条记录 数据库:中国学术期刊网络出版总库,中国博士学位论文全文数据库,中国优秀硕士学位论文全文数据库; 3、在中国知识基础设施工程(CNKI)系列资源库中找出作者“陈

信息检索相关性

近十年我国信息检索相关性研究现状分析——基于共词分析的视角 摘要:相关性是信息检索领域的核心研究的内容之一,对其进行深入研究将有助于提高信息检索的效率,推动信息检索的研究。本文将通过共词分析的方法,利用知识图谱对其进行可视化分析研究。 关键词:信息检索;相关性;共词分析 前言 相关性一直以来都是信息检索领域的核心研究内容之一,其概念的起源可以追溯到17世纪的早期图书馆用户认识到查找相关信息的问题。但由于客观原因,相关性只是作为一种朦胧意识停留在人们头脑中,直到20世纪20年代少数学者Lotka(1926)、Zipf(1949)、Urquhart (1959)、Price(1965)才陆续从各个领域开始了相关性的研究工作。在信息科学界Saracevic 认为Bradford是最先使用相关性一词的学者。其在20世纪30年代发表的《文献的混沌状态》一文中首次提出“主题相关”的概念。而此后关于“相关性”的探讨并未引起学界更大范围的关注。直到1958年国际科学信息会议(ICSI)的召开,相关性(Relevance)才作为信息科学领域的一个重要概念被学术界认可。至此“相关性”逐渐成为信息科学尤其是信息检索领域经久不衰的研究课题,甚至知识交流学派的代表人物Saracevic认为信息科学之所以成为独立学科,而不再隶属于图书馆学或文献学的原因就在于它开展了相关性的研究也在于相关性能够解释科学交流中的诸多问题。足见“相关性”在信息科学中的重要地位。当前,各国学者已对信息检索的相关性问题展开了深入研究,本文将通过共词分析法,使用知识图谱对其进行可视化处理分析。 1.信息检索相关性基本概念 对信息检索相关性基本概念方面的研究工作始于20世纪50年代末,各国学者借助数学工具及各种概念提取方法从各个角度对“相关性”的含义及内容进行了深入剖析。而相关性的基本概念研究以1976年为边界经历了前后两个阶段第一阶段1959-1976的主要成果有Maron和Kuhns利用概率论定义相关性的概念,提出相关性并非只是简单的是/非选择问题。Rees认为相关性受文档所包含的信息概念的影响,认为相关信息是对用户原来所具备的知识而言有用的信息Goffman和Newill把相关性当成连接有效性的一种测度,并试图用数学方法证明相关性(Relevance)与关联性(Relation)之间具有等价关系。Saracevic 则建议从文档、词与文献引用等各种文献特征上来定义检索的相关性。Cooper利用数理逻辑给相关性做了一个明确的定义。Wilson则在Cooper研究的基础上对数理逻辑相关性描述做了进一步扩充,并将“情境相关性”的概念首次引入到相关性的研究中,这些成果成为第二阶段研究工作的基础。在第二阶段,1977年至今,由于相关性各领域研究成果的相继出现,使相关性的概念描述也呈现出许多新的时代特征。首先是从面向用户及认知方法的观点重新审视相关性,认为相关性是个多维的认知概念,在很大程度上依赖于用户个人对信息的理解以及信息需求的情境。相关性是一个动态的概念它依赖于信息与用户某一特定时间所需信息之间关系质量的评价,以用户的观点来看,相关性是个复杂的、系统的、可测度的概念。其次是一些学者试图给信息检索定义一个逻辑模型来理解相关性概念这项工作由Rijsbergen开创之后又吸引了众多学者的参与。 2.信息检索相关性共词分析 2.1数据收集处理 本文研究的数据收集是以中国知网(cnki)中文数据库中的期刊文献为基础,期刊来源为SCI、EI、CSSCI,以“信息检索”并含“相关性”作为主题进行检索,检索年限为2004年至2013年,共检索文献95篇。对其关键词进行统计分析,共有关键词202个,对其进行词频统计,将词频超过2次的关键词作为高频关键词,共有高频关键词42个(表1),本文的数据分析将基于这些高频关键词。

信息检索试题及答案

《信息检索》课程考查试题 一、单选题(6题*10分/题=60分) 1.请标出文献:马品仲. 大型天文望远镜研究. 中国的空间科学技术,1993,13(5)P6-14,ISSN1000-758X 属于哪种文献类型____C________。 A、图书 B、科技报告 C、期刊 D、报纸 2.常用的检索系统有_______D_____。 A、目录检索系统 B、文摘检索系统 C、全文检索系统 D、以上都是 3.可以将信息检索的一般步骤归纳为_____A_____五个步骤。 A、界定问题、选择信息源、制定策略并实施检索、评价信息、分析和利用信息 B、选择信息源、界定问题、制定策略并实施检索、评价信息、分析和利用信息 C、制定策略并实施检索、界定问题、选择信息源、评价信息、分析和利用信息 D、选择信息源、界定问题、制定策略并实施检索、评价信息、分析和利用信息 4.需要着手写一篇有关商业智能系统研究现状的报告,应着重查询以下____D_______个信息源。 A、网页 B、报纸 C、杂志 D、各类文献数据库 5.常用的网络免费学术资源有______D______。 A、虚拟图书馆 B、开放获取资源 C、免费专利资源 D、以上都是6.Science Citation Index与其他文献检索刊物不同之处在于_______B____。 A、它具有团体索引 B、它具有引文索引 C、它可以了解某著者发表论文情况 D、它可以了解科研的最新动态 二、判断题(8题*5分/题=40分) 1.信息检索过程是一个检索的操作过程,如选择数据库、确定关键词、构造检索式等。错2.对于要求一定深度、研究性的信息问题,应主要检索搜索引擎检索网络信息源。错3.选择信息源是信息检索的第一步。错 4.信息检索无时不有、无处不在。对 5.图书是各类信息源中最具时效性的一种。错 6.期刊文献、会议文献和学位论文都是一次文献。对 7.在Ei Compendex数据库中,提供的检索结果排序方式只有“Publication year”一种方式。错 8.随着数字技术的飞速发展,电子型文献将越来越受欢迎,印刷型文献慢慢就没有用武之地了。错 (本答案已被确认)

信息检索复习整理概述

一、什么是信息(Information)? 在西方英文中information一词有情报、资料、消息、报道之意,我国大陆曾译为情报或信息,后经国家有关部门核准,统一译成“信息”。在我国台湾、香港地区,该词被译为“资讯”。 信息是被反映物的属性再现,信息的属性在于表现它物。也就是说,信息不是事物的本身,而是由事物发出的消息、情报、指令、数据、信号中所包含的内容,是对客观世界中各种事物发出的特征、变化及其相互联系的最新反映。一切事物包括自然界和人类社会都会产生信息。一个完整的信息过程,包括信息的传递、接收、贮存、加工和利用。 2、信息具有以下特征: 1)普遍性 (2)时效性:信息在一定的时间内是有效的信息,在此时间之外就是无效信息。而且任何信息从信源传播到信宿都需要经过一定的时间,都有其时滞性。 (3)传递性 (4)可转换性:信息是可以由一种形态转换成另一种形态。信息一般有4种形态:数据、文本、声音、图像。这4种形态可以相互转化,例如,照片被传送到计算机,就把v图像转化成了数字。 (5)可再生性 (6)共享性:同一信源可以供给多个信宿,因此信息是可以共享的,且不因共享而减少(7)可识别性:信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别。不同的信息源有不同的识别方法。(8)可存储性:信息是可以通过各种方法存储的。 二、信息检索 广义:将信息按一定的方式组织和存储起来,并根据用户需要找出相关文献的过程。其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。取即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程。 狭义:仅仅指信息查找的过程。即取的环节。 三、信息检索的发展 1、第一阶段:完全手工检索阶段 2、第二阶段:半机械检索系统-机电、光电检索系统的发展阶段 3、第三阶段:计算机检索系统的发展阶段 4、第四阶段:基于Internet 的网络化检索系统阶段 信息资源的分类: 1、信息源可分为自然信息源和社会信息源。 2、按信息资源所依附的载体划分(不用全背) (1)体裁信息资源:以人体为载体并能为他人识别的信息资源。按其表述方式又可分为口语信息源和体语信息源。口语信息源是人类以口头方式表述但未被记录下来的口语信息,如:谈话、讲课、讲演、讨论、唱歌等。体语信息源是以人的体态为载体表述出来的信息资源,如:表情、手势、姿态等方式表述的体语信息。 (2)实物信息资源:以实物为载体的信息资源。又分为自然实物信息源与人工实物信息源。如:化石、产品、样品等。 (3)文献信息资源:以文字、图形、符号、声频、视频等发生记录在各种载体上的知识和信息资源。 (4)网络信息资源:以网络为纽带连接起来的信息资源和以网络为主要交流、传递、存储

(完整版)文献信息检索试题及答案

文献信息检索 一、填空题 1、文献的级次分为零次文献、一次文献、二次文献、三次文献。 2、按内容可将计算机检索系统的数据库类型分为:文献书目型数据库、事实型数据库、数值型数据库和全文型数据库。 4、我国标准可分为国家标准、部标准和企业标准三大类。 5、在实际检索中,文献的检索方法主要有:直查法、追溯法、工具法和综合法。 6、信息检索常用的方法有:引文追溯法、工具法和循环法。 7. 构成文献的三要素是知识、载体和记录。 8. 标准文献的主体是标准。 9. 期刊论文的文献出处包括期刊名称、年卷期和起止页码。 10. 所需信息被检出程度的信息量指标为查全率。 二、选择题 1. 文献是记录有知识的( A ) A 载体 B 纸张 C 光盘 D 磁盘 2. 下列哪种文献属于一次文献( A ) A 期刊论文 B 百科全书 C 综述 D 文摘 3. 下列哪种文献属于二次文献( D ) A 专利文献 B 学位论文 C 会议文献 D 目录 4. 下列哪种文献属于三次文献( C ) A 标准文献 B 学位论文 C 综述 D 文摘 5. 下列选项中属于连续出版物类型的选项有( C ) A 图书 B 学位论文 C 科技期刊 D 会议文献 6. 下列选项中属于特种文献类型的有( D ) A 报纸 B 图书 C 科技期刊 D 标准文献 7. 纸质信息源的载体是( D ) A 光盘 B 缩微平片 C 感光材料 D 纸张

8. 以刊载新闻和评论为主的文献是( B ) A 图书 B 报纸 C 期刊 D 会议文献 9. 使用分类语言对信息进行描述和标引,主要是可以把( B )的信息集中在一起。 A 同一作者 B 同一学科 C 同一主题 D A+B+C 10.《中国图书馆分类法》(简称《中图法》)将图书分成( A ) A 5大部分22个大类 B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 11.《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。 A S类目 B Q类目 C T 类目 D R类目 12. 利用文献末尾所附参考文献进行检索的 方法是( C ) A 倒查法 B 顺查法 C 引文追溯法 D 抽查法 13. 至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为( A ) A 数据库 B 记录 C 字段 D 文档 14. 广义的信息检索包含两个过程( B ) A 检索与利用 B 存储与检索 C 存储与利用 D 检索与报道 15. 狭义的专利文献是指( C ) A 专利公报 B 专利目录 C 专利说明书 D 专利索引 三、判断题 1. 1948年,美国数学家、信息论的创始人维纳在题为《通讯的数学理论》的论文中指出:“信息是用来消除随机不定性的东西”。 ( × ) 2. 从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。(×)----从文献检索的角度来看,一次文献是检索的对象,二次文献是用于检索的主要手段和工具。 3. 《中国图书馆分类法》是按知识门类的学科体系的逻辑次序进行分类。(√)

信息检索中的相关性研究_马芳

88888888888888888888888888888888888888888 科技情报开发与经济 SCI -TECH INFORMATION DEVELOPMENT &ECONOMY 2009年第19卷第14期 Considerations about the Sustainable Development of Local Literature Work HE Wei-bing ABSTRACT :This paper expounds the concepts and connotations of the sustainable development and the local literature , points out some shortages existing in the current local literature work ,and puts forward some assumptions of realizing the sustainable development of the local literature work . KEY WORDS :library ;local literature work ;sustainable development [3]熊焰.地(市)县公共图书馆地方文献资源建设和利用研究[J ] .中国图书馆学报,2002(6):81.[4]黄桂凤.图书馆的地方文献资源开发利用[J ].图书馆杂志,2007(4):25. [5]贾立菲.谈地方文献的开发与利用[J ].中国图书馆学报,2006(6):104. [6]潘志强.区县图书馆地方文献工作探讨[J ].图书馆杂志,2007(8):46.(责任编辑:王永胜)──────────────── 第一作者简介:贺卫兵,男,1966年12月生,1988年毕业于江西大学(现为南昌大学)历史系,馆员,现任萍乡市图书馆副馆长,江西省萍乡市安源区昭萍西路2号,337000. 当数据检索的精确性被信息检索的不确定性所代替后,用 户的查询与检出文档的关系也就由匹配关系变为相关关系,因此相关性这一概念就突显出来,成了信息检索中的核心领域。相关性是信息检索乃至情报学中的一个重要的、关键的概念,这在中外的有关研究者中已经得到了共识。 1“相关性”的概说 信息检索本身就是一种相关性检索,而不是确定性检索,它不直接回答用户所提问题本身,而只是提供与解决问题有关的文献信息。在信息检索中,相关性主要是指检索系统针对用户的信息需求从文档集合中检出的文档与用户需求之间的一种匹配关系。检索相关性问题远比定义复杂得多,人们在决策过程中产生了信息需求,其中一部分是对数据的需求,而更多的是对某个主题文献的需求,而后者所对应的是一种相关性检索而非前者的确定性检索。 信息检索中相关性的研究主要有两个分支:一是以Mooers ,Taube ,Perry ,Salton 等为代表的来自计算机科学界,他们的研究主要围绕信息检索系统展开,包括系统的分析、设计、检索算法以及性能评估等,尤其是表征用户信息需求的查询表达式与文档的匹配算法和模型是核心的研究内容,他们被称为系统中心 学派。另一个是来自图书情报界, 他们的研究重点是用户或者检索中介在检索过程中的认知、交互以及情境等层面,被称为用户中心学派。因此,相关性概念也可以从这两个研究分支来划分:面向系统的相关性和面向用户的相关性。 (1)系统相关性学派。面向系统的相关性也称系统观的相关性,它包括两个方面:一是用户提交的查询与信息检索系统对该查询分析理解后形成的系统执行的检索表达式之间的匹配关系;二是检索出的文档与系统执行的检索表达式之间的匹配关系。 面向系统的相关性是查询表达式与文档内容的一致性匹配,是文档所涵盖的内容对查询表达式的适合程度,它的着眼点 主要是信息检索交互模型中的文档库、 检索表达式、匹配过程和检索输出。这种相关性明确定义了信息检索以及信息检索系统研究与发展的目标,简单明了,易于操作。 (2)用户相关性学派。面向用户的相关性主要研究用户以及用户或者检索中介与系统之间的关系,这种相关性是主观的、模 糊的。一方面, 人们对检索系统检索出的结果与用户的特定查询可以有多种“相关”方式;另一方面,不同的用户对同一检索结果的相关性判断存在差异。不同的用户对同一真实信息需求的感觉会有差异;同一用户就同一真实信息需求向不同信息检索系统所发出的查询会有一定程度的差异。 2相关性的影响因素 检索系统的工作过程包含存储和检索两个互逆的过程。检 索是存储的逆过程,对检索过程的分析,可以发现影响检索相关性的因素主要有: 文章编号:1005-6033(2009)14-0089-02 收稿日期:2009-03-10 信息检索中的相关性研究 马芳 (中山大学资讯管理系,广东广州,510275) 摘要:在信息检索中,相关性是一个关键性的概念。从相关性的动态、多维的内涵出 发,介绍了在信息检索中相关性的学派、影响因素及评价,总结了提高信息检索相关性的措施。关键词:信息检索;系统相关性;用户相关性中图分类号:G354文献标识码:A 89

1.临床信息检索基本概念

1 、下列哪一个不是一次文献()* A.期刊论文 B.专利文献 C.综述 D.专题著作 2 、人类第一台计算机ENIAC诞生于()年,在美国宾夕弗尼亚大学试制成功* A.1942 B.1944 C.1946 D.1948 3 、下列哪些是关于诊断的副主题词()* A.Diagnosis B.Radiography C.Prevention and contro D.Etiolog 4 、 WWW是()的缩写,它是近几年来迅速崛起的一种Internet服务方式* A.World –Wide Wait B.Website of World Wide C.World Wide Web D.World Wais Web 5 、提供文献线索的检索工具()* A.核心期刊现刊浏览 B.MEDLINE ,CBMdisc 等 C.参考文献 D.图书分类法

6 、PubMed由下列哪个机构编制的()* A.Yahoo B.NIH (National Institute of Health) C.NLM(National Library of Medicine) D.WHO(World Health Organization) 7 、关于文献的定义,国家标准局发布的《文献著作总则》作了这样的界定:“文献:()”* A.有关信息的记录 B.记录信息的载体 C.记录情报的一切载体 D.记录有知识的一切载体 8 、在 Medline光盘检索中,国际标准连续出版物号的代码是()* A.ISSB B.ISLC C.ISLB D.ISSN 9 、在机检中 , 缩小检索范围的方式有()* A.用 AND 连接检索词 B.用 NOT 连接检索词 C.用 OR 连接检索词 D.A和B都正确 10 、主题词与副主题词组配,可以提高检索的()* A.专指性 B.综合性 C.直观性 D.广义性

网络信息检索试题及答案

第一部分 1、一条及时的信息可能使濒临破产的企业起死回生,一条过时的信息可能分文不值,甚至是企业丧失难得的发展机遇,造成严重后果,这说明信息具有()特征。 A、差异性 B、传递性 C、时效性 D、共享性 2、培养学生养成良好的信息素养,主要从四个方面进行,其中不包含(): A、信息意识 B、信息心理 C、信息能力 D、信息道德 3、哈佛大学经济学专业学生能够依据图书馆中哪些极为平常、完全公开的图书资料,撰写出核专家都感到惊异的“制造核弹的方法”的报告,反映出良好的信息素养是()。 A、获取知识的捷径 B、科学研究的向导 C、终身教育的基础 D、创新知识的源泉 4、按照信息处理的级别来划分,可以将信息分为零次、一次、二次和三次信息,下面()是一次信息的别称。 A、灰色信息 B、原始信息 C、检索性信息 D、参考性信息 5、“便于保存传递、但需要借助阅读机阅读”是以感光材料记录文字及相关信息的()信息载体类型的特点。 A、印刷型 B、电子型 C、声像型 D、微缩型 6、谈谈你对“信息”的理解。 特征:客观性和普遍性、差异性、传递性、时效性、可转换性、共享性。 7、下列文献哪个是二次文献?( A ) A. 文摘 B. 会议文献 C. 辞典 D.百科全书 8、“文章草稿”、“私人笔记”及“会议记录”属于( A )。 A. 零次文献 B. 一次文献 C. 二次文献 D. 三次文献 9、下列选项中哪一项属于“国内统一刊号”(C )。 A. ISBN 7-04-014623-1 B. ISSN 0254-4164 C. CN 11-2127/TP D. 0254-4164/TP 10、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( C )参考文献的著录条目描述。 萧钰.出版业信息化迈入快车道[EB/OL] .(2001-12-19) [2002-04- 15]. http:∥www. ….htm. A、标准文献 B、期刊(杂志) C、电子文献 D、会议文献 11、根据国标GB/T 7714-2005规定,下面的横线上的信息是对( B )参考文献的著录条目描述。 昂温G,昂温P S .外国出版史[M]. 陈生铮,译. 北京:中国书籍出版社, 2001:15-20 A、期刊(J) B、图书 C、科技报告(R) D、会议文献(Z) 12、下面哪些资料属于三次信息?(ACFLOP) A、《2009年山东省统计年鉴》 B、美国《工程索引》 C、《新华字典》 D、《新华文摘》 E、《机械工业出版社2012年图书征订目录》 F、《计算机科学技术百科全书》 G、《计算机工程与应用》 H、《网络营销》 I、《NASA报告》。 J、《博士论文:论网络时代的商务模

文献检索期末复习题

1. 请解释信息、知识、文献的概念,并简述三者之间的关系 信息是客观事物属性和运动状态的外在表现。知识是人们对客观事物存在和运动规律的认识。文献是记录知识的一切载体。 信息是生产知识的原料,知识是被人类系统化后的信息,文献是存储传递知识和信息的载体。信息大于知识,信息可分为正确信息和虚假信息、有用信息和无用信息,而知识是在实践中获取并经过实践检验的正确、有用的信息。信息是起源,是基础;知识是系统化了的信息。在信息时代,源于众多复杂客体的大量信息,只有借助于现代化的信息手段,并通过掌握现代信息科学技术的认知主体,才能真正转化为知识。 2. 在数据库检索中,当检出的文献数量较少时,分析其可能原因,以及采用何种对应措施,才能增大文献信息的检出量?(至少列举5种情况) 原因:检索词拼写错误;遗漏重要同义词或者隐含概念;位置算符和字段算符使用过多;没有使用截词算符;使用过多的逻辑“与”,过于严格。 措施:扩大检索范围,增加文献信息的检出量。(1)减少“与”算符,以OR加入相关检索词(2)在词干相同的单词后使用截词符(?)(3)修正错误的检索词(4)补充足够的同义词(5)去除已有的字段和位置算符限制 3. 试举例说明链入网页、链出网页和锚文本。 在Page1中建立一个指向Page2的链接,需要在Page1的HTML代码中加入“点击打开网页Page2”,用户在Page1中打开这个链接,就可以打开网页Page2。Page1是Page2的链入网页,Page2是Page1的链出网页,而在Page1中的蓝色超文本就是锚文本。 4.信息检索和文献检索是不同的两个概念。区别及联系。 信息检索的实质是将用户的检索提问标识和检索系统中的信息特征标识进行比对,匹配,两者一致或者信息特征标识包含检索提问标识,则具有该标识的信息就从检索系统中输出,输出的信息就是检索命中的信息。 区别:信息检索主要是通过文献检索实现的,文献检索是信息检索一个重要的组成部分。联系:文献是一切情报知识信息的载体,所以情报知识信息不可能超越文献这一载体而存在。因此,信息检索一般也不可能超越作为信息载体的文献。 5.IP地址和域名地址 Internet是基于TCP/IP协议的网络。网络中的每一个节点都必须有一个唯一的地址,用来保障通信的准确无误。它就是网络位置的唯一标识,即IP地址。IP地址一般用十进制数字表

2019年第一次信息检索课作业及答案

2013年第一次信息检索课作业 一、文献检索课基础知识练习题 1.具有相近含义的同义词或同族词在构成检索策略时应该使用( B )算符予以组配。 A.逻辑“与” B.逻辑“或” C.逻辑“非” D.位置 2.若想排除某概念,以缩小检索范围,可使用(B)算符。 A.逻辑“与” B.逻辑“非” C.逻辑“或” D.位置 3.当某些检索词词干相同、词义相近,但词尾有变化时,可采用( B )方法表示。 A.逻辑“与” B.截词 C.位置算符 D.字段限定 4.切分课题“当前商业银行经营体系的特点”的概念,并用布尔逻辑算符构成检索策略。(无需扩展概念,无需使用英语) 商业银行 AND 经营体系 AND 特点 5.切分课题“当前数理统计模型研究的趋势”的概念,并用布尔逻辑算符构成检索策略。(无需扩展概念,无需使用英语) 数理统计模型 AND 趋势 二、Google搜索引擎练习题 1.用Google的“手气不错”功能,,选择检索下面国家某所大学的网站,写出该大学的名称及其主页的网址。 (1)英国的大学。(2)美国的大学。(3)加拿大的大学。(4)澳大利亚的大学。(5)新加坡的大学。(6)香港大学 牛津大学;.uk/ 2. Google学术搜索引擎练习 (1) 请写出Google学术搜索网址。 (2) 利用Google学术搜索引擎,检索《僧帽牡蛎三倍体的研究》从维普或CNKI数据库中写出该文献前两篇引文的作者,并写出CNKI数据库用户名与密码。 第一篇:曾志南; 陈木; 林琪; 陈朴贤; 刘伟斌 第二篇:赵荣涛; 何建瑜; 刘慧慧 用户名:db0185 密码:dlscxy 3.李阳是著名的英语教育专家,请用google检索标题中包含“疯狂英语”的中国商业类网站的文献,并写出有效的检索式。 李阳or疯狂英语 4.采用google的高级语法(filetype:pdf),搜索有关“信息检索”方面的doc\pdf\ppt格式的文献,给出检索式。

情报检索试题及答案

一、单项选择题(共20题,1分/题,共20分) 1. 刘志强.我国农业生态环境可持续发展评价及对策[J].农业系统科学与综合研究,200l,17(3):24-26该参考文献的17(3):24-26的含义应该是: a.17卷3页24-26行 b. 17卷3页24-26行 c. 17卷3期24-26页 d. 17期3部分24-26页 2. ISSN0023-1231.是_____ a. 国际标准书号 b.国际标准刊号 c.图书分类号 d. 标准号 3. 查找某一年的新闻、事件、数据和统计资料,应该用___ __类参考工具书。 a.百科全书 b.手册 c.年鉴 d.统计资料 4. 在以下列出的搜索引擎中哪一种是专门搜索学协会数据库资源的搜索引擎? a. Google scholar b.Google book search c.Scirus d. Scitopia 5. 用google在华中科技大学的网站内进行站内搜索应使用: a. link: b. related: c. site: d. info: 6. 在ELSVIER SCIENCE DIRECT数据库中使用哪个符号表示精确检索: a. “” b.() c.[ ] d.{ } 7.可以检索color或者colour的最常用检索式是: a. 输入:color或者colour b. 输入:color and colour c. 输入:color*colour d.输入:colo?r 8. 我馆购买的下列名称的检索工具中,目前不能用来检索学位论文的是: a. CNKI b. 维普 c. Proquest d. 万方 9. 用维普《中文科技期刊数据库》查询刊物《图书情报知识》的关于数字图书馆的文献,检索式为: a. K=数字图书馆*图书情报知识 b. K=数字图书馆+J=图书情报知识 c. K=数字图书馆*J=图书情报知识 d. K=数字图书馆*A=图书情报知识 10. 某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论 文总数得出的结果是: a.影响因子b.立即影响指数c.H指数d.Eigenfactor 11. 用IEEE检索系统检索computer programming方面的论文,限定computer和programming 词序一定但间隔至多不能超过2个单词,则检索式应该是: https://www.360docs.net/doc/5017474250.html,puter 2w Programming https://www.360docs.net/doc/5017474250.html,puter NEAR/2 Programming https://www.360docs.net/doc/5017474250.html,puter w2 Programming d. .Computer ONEAR/2 Programming 12.下面哪个出版社不是新成立的纯OA出版社? a.Biomed b.Plos c.Springer d.Highwire Press 13.下面哪个不是OA期刊目录站点? a.DOAJ b.Open J-gate c.Socolar d.EMbase 第14-20题从下面选项中选择最合适的唯一检索工具,不得复选,多选: A. 维普《中文科技期刊数据库》 B. CNKI的硕士学位论文数据库 C Web of Science D. 馆藏书目查询系统 E. 中国标准信息服务网 F. JCR G. PQDT 14.用___G__检索原文“GB 2760 食品添加剂使用卫生标准”。 15.用__A___检索参考文献原文:孙莹.家庭生命价值观教育与大学生生命价值观的相关研究 [D].西南大学 16. 使用__D____检索我校图书馆书库是否有数学教学参考书以便借阅。 17. 用___F__检索某文章列出的参考文献:陈维民.中俄合作开发西伯利亚及远东能源资源

电子科技大学15春《信息检索》在线作业2满分答案

电子科技大学15春《信息检索》在线作业2满分答案 15春《信息检索》在线作业2 单选题 一、单选题(共 20 道试题,共 100 分。) 1. 由清华大学、清华同方发起的并建于1999年6月的以实现全社会知识资源传播共享与增值利用为目标的信息化的建设项目是 A. 维普信息资源系统 B. 万方数据资源系统 C. 人大复印资料 D. 中国知网 -----------------选择:D 2. 需要了解2000年以来我国GDP的增长率,该检索属于: A. 文献信息检索 B. 数据信息检索 C. 事实信息检索 D. 其他检索 -----------------选择:B 3. WEBOFSCIENCE的检索方式不包括: A. 简单检索 B. 分类检索 C. 全文检索 D. 通用检索 -----------------选择:B 4. 使用WEBOFSCIENCE进行检索,限制检索词在同一个字段的检索命令为 A. AND B. OR C. SAME D. WITH -----------------选择:C 5. 搜索含有"databank"的PDF文件,正确的检索式为: A. “data bank"+filetype:pdf B. data and bank and pdf C. data+bank+pdf D. data+bank+file:pdf -----------------选择:A 6. 手工信息检索的方法中,哪两种属于常用的方法? A. 顺查法和倒查法 B. 顺查法和循环法 C. 倒查法和追溯法 D. 循环法和追溯法

-----------------选择:A 7. 维普数据检索系统包括以下哪个数据库: A. 中文科技期刊数据库 B. 中国科技经济新闻数据库 C. 中国企业及产品广告数据库 D. 以上都是 -----------------选择:D 8. 只知道某书的ISBN,应选择哪种检索途径? A. 分类途径 B. 主题途径 C. 著者途径 D. 信息代码途径 -----------------选择:D 9. 下列哪个检索系统提供了美国四大报告的检索? A. NTIS数据库 B. OCLC FIRST SEARCH C. 中国科技成果库 D. 维普数据 -----------------选择:A 10. 信息的以下哪一种特性与物质相较差异最大?关于1+1的理论 A. 时效性 B. 共享性 C. 可塑性 D. 传递性 -----------------选择:B 11. 科技会议录索引指的是下列哪一个检索工具: A. SCI B. ISTP C. SSCI D. WM -----------------选择:B 12. 通过科学的方法,将分散无序的一次信息进行加工、整理,使之成为系统有序的信息 A. 一次信息 B. 二次信息 C. 三次信息 D. 零次信息 -----------------选择:B 13. Google搜索引擎中可以默认以下哪个逻辑运算符? A. “+” B. “-” C. “*” D. “/” -----------------选择:A

信息检索知识点92382

信息检索考点整理 1.信息检索的概念 广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程; 而狭义的信息检索仅指有序化信息的检索查找。 2.信息检索的原理 就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。 3.为什么说信息存储和检索是两个不可分割的有机体 检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。检索过程是存储过程的逆过程。因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。 4.信息检索的方法 (1)顺查法

(2)倒查法 (3)抽查法 (4)追溯法 (5)循环法 5.信息检索的途径 (1)内部特征途径 a)分类途径 b)主题途径 (2)外部特征途径 a)题名途径 b)着者途径 c)文献编号途径 d)目录检索途径 e)机构检索法 f)引文检索途径 6.布尔模型的优缺点 优点:(1)简单,形式简洁,易于理解; (2)可操作性强,应用广泛; (3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念; (4)能处理结构化提问。

文献检索试题和答案

文献检索课习题卷答案 一、不定项选择题(共50分,每题1分,少选多选均不给分) 1.信息是“用来消除不确定性的东西”,是那个科学家提出来的( D.申农) 2.现代社会中,人们把( B.信息、物质、能量)称为构成世界的三大要素 3.以下属于一次信息资源的是:( B.学位论文) 4. 属于一次信息资源的有(A 会议记录 B 专着 C 专利说明书 D 研究报告) 5. 关于文献,下列说法错误的是( CD )。 A 文献记录的是显性知识 B 检索工具书都属于二次文献 C 文献可以没有载体 D 文献记录的是隐性知识 6. 关于文献,下列说法正确的是:( A 私人笔记属于零次文献 B 学位论文属于一次文献C 百科全书属于三次文献 ) 7. 关于信息资源,下列说法错误的是( A )。 A. 信息资源同时只能被一个使用者所利用 B. 信息资源必须依赖一定的载体才能体现出来 C. 从某种意义上讲,信息资源的价值取决于信息的时效性 D. 信息资源的扩散速度与传递技术的发展成正比 8.推广优秀职员的营销经验使公司业绩大提高,职员经验交流说明了信息具有(C.共享性) 9.关于信息的特征,下列说法正确的是( D.信息需要依附于一定的载体形态) 10.下列叙述中,其中( D )是错误的。 A. 信息可以被多个信息接收者接收并且多次使用 B. 信息具有时效性特征 C. 同一个信息可以依附于不同的载体 D. 获取了一个信息后,它的价值永远存在 11.信息素养的核心是( C.信息能力) 12.关于检索语言,下列说法正确的是( C 中国图书馆图书分类法属于体系分类语言)13.图书的外部特征有( A、着者 B、价格 C、书名 D、出版社) 14.以下检索途径,哪些是反映信息外部特征的(A 题名途径 B 着者途径 C 代码途径) 15.《中国图书馆图书分类法》(简称《中图法》)将图书分成(A. 5大部类,22个基本大类) 16.按照中国图书分类法,下列分类号排序正确的是(C F123、、F13 ) 17.长篇小说《射雕英雄传》的分类号为(A ) 18.根据《中图法》的分类标准,鲁迅《朝花夕拾》的分类号是( B. ) 19.巴金长篇小说《家》的分类号为( A ) 20.利用文献后所附参考文献进行检索的方法叫( A.追溯法)。 21.利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止的检索方法是( B. 倒查法)22.逻辑算符包括( ABCD )算符。 A.逻辑“与” B.逻辑“或” C.逻辑“非” D.以上三项 23.关于布尔逻辑检索,下列说法正确的是( BD ) B.多个检索词间使用“逻辑与”匹配可以缩小检索范围 D多个检索词间使用“逻辑非”匹配可以缩小检索范围 24.布尔逻辑检索算符有(A and C not D or) 25.二次检索指的是( C 在检索结果中运用“与、或、非”进行再限制检索) 26.在维普中文期刊全文数据库中“在检索结果中”检索相当于( B 逻辑“与”)

4文献检索的原理方法与步骤1

重点:文献检索的方法步骤 难点:文献检索原理 授课内容:第四章文献信息检索原理及方法步骤 4.1 检索原理 文献检索包含文献的存储与检索两个部分,对用户而言,后者更为重要。只有经过组织有序的信息集合体才能提供检索的途径,才有用于检索的功能。文献的编排、组织与检索查询有对应的关系,因此了解一个文献系统的组织方式也就找到了检索的根本方法。 ⑴检索点:每件信息都包含有其内部及外部特征(即信息的属性),文献与课题的主要特征信息可以用来作为检索的出发点和匹配依据,它们称作检索点(access point),这些检索点包括分类、主题、著者、题名、机构名称、代码等。 ⑵检索手段:检索是通过检索工具(系统)和检索方式方法来实现的。无论是用手工检索书本式的工具,还是用计算机检索数据库获取文献资料,都有分类、主题、代码等多种检索途径。 ⑶检索系统:包含网络条件、技术设备(存储服务器、计算机)及文献信息集合体(数据库)。 检索系统按存储的媒体和技术手段来分,检索系统有两种:手工检索工具(印刷型的检索性刊物与参考工具书)和计算机检索系统(各种数据库)。

文献存储和检索原理:是使用户的课题提问标识与检索系统中的信息特征标引标识尽相一致地选择与匹配。如图1—3: 图6—1 信息用户的需求和信息集合的比较与选择,即匹配的过程。从用户需求出发,对一定的信息集合(系统)采用一定的技术手段,根据一定的线索与准则指出(命中)相关信息。 各种检索系统的检索原理基本相同。简单地讲,就是检索提问标识与存储在检索工具中的标引标识进行比较,两者一致或信息标引的标识包含着检索提问标识,具有该标识的信息就从检索工具输出,输出的信息就是检索命中的信息。 信息检索的全过程包括存储和检索两个过程。存储过程就是按照检索语言(主题词表或分类表)及其使用原则对原始信息进行处理,形成信息特征标识,为检索提供经过整序(即形成检索途径)的信息集合的过程。具体来说,信息的存储包括对信息的著录、标引以及编排正文和所附索引等。所谓信息的著录是按照一定的规则对信息的外表特征和内 容特征加以简单明确的表述。信息的标引是就信息的内容按一定的分类表或主题词表给出分类号或主题词。检索过程则是按照同样的分类表(或主题词表)及组配原则分析课题,形成检索提问标识,根据存储所提供的检索途径,从信息集合中查获与检索提问标识相符的信息特征标识的过程。因此

相关文档
最新文档