信息检索重点复习1

合集下载

信息检索复习重点1

信息检索复习重点1

信息检索第二章信息用户一、用户信息需求的概念1、概念:是指人们在实践活动过程为解决遇到的各种问题而产生的信息不足感与求足感2、主要特点:广泛性、社会性、发展性、多样性、主观性、客观性二、用户信息需求的基本类型1、按信息的属性分自然信息需求:对客观存在的自然物信息的不足感与求足感,强调物质属性社会信息需求:生活中的信息需求、职业活动中的信息需求、个体社会化的信息需求2、按信息需求的目标分主题需求:战略性信息需求、战术性信息需求、工作性(经营性)信息需求已知资料需求:信息查对需求3、按信息需求的表现形态分(沃格特)新信息需要:需要能及时获得、迅速传递的最新信息,强调及时性片断性信息需求:某一理论、方法、事件等的片断信息,以解决具体问题,强调准确性完整性信息需求:对特定相关信息的系统把握,强调全面性三、用户信息需求状态(Mizzaro)1、客观信息需求(Real Information Need,RIN):用户解决某特定问题所需要的信息2、意识到的信息需求(Perceived Information Need,PIN):户在问题及外界刺激下所感知到的信息需求3、表达出来的信息需求(Request):用户在一定条件下对意识到的信息用自然语言表达出来的信息需求4、信息提问(query):用户用所选择信息检索系统的检索语言相对应的语法形式描述的信息需求四、用户需求提问1.需求提问的类型划分1)、从提问的规定性上分类明确性提问:问题初始条件与目标状态清楚不确定性提问:问题初始条件或目标状态不清楚2)、从功能上分类认知性提问:咨询提问和评价提问非认知性提问2.需求提问的结构分析主题分析:描述用户信息需求的内容范畴。

包括主题概念、学科范围外部要求:描述用户信息需求的基本规定。

包括:目标:反映需求的目标状态规模:反映需求的数量指标类型:反映需求的信息形式其它:反映需求的其它要求(如年代、语种等)3.需求提问质量的评价标准相关度(pertinence/relevance):与解决问题的相关性准确度(accuracy):提问能否用一定规则准确地固定下来特定性(specificity):有关某一特定事物或主题的特殊要求4.需求提问的反馈调节反馈调节的内容:明确主题范畴、目的与动机、查寻者个人特征、预计或可接受的回答(数量要求,信息类型,语种,时间分布,等)•信息检索基本原理(检索过程,行为模型)▲一、信息检索过程1、概念狭义:从特定信息源中找出符合特定需要的信息单元基本环节概念形式的逻辑过程操作形式的技术过程广义:是从信息需求开始到信息利用结束的全过程2、信息检索的逻辑过程信息标引过程信息检索式的形成信息匹配查找3、信息检索的技术过程信息标引与标引结果的组织检索式及其制定检索匹配过程获取原始信息4、检索过程的基本假定信息单元内容可明确客观地判断且唯一表达用户信息需求也可明确客观地判断且唯一描述只要采用相同的检索语言体系和描述规则,可明确客观地判断标引式与检索式的一致性,并由此判断信息单元与信息需求的一致性5、检索过程的形式化描述信息检索过程可形式化描述为四维数组S={I,Q,F,R(ij,q)}匹配函数为实际检索过程匹配函数设K为检索状态值,则关于q检出信息集二、检索过程的用户信息状态潜在信息需求(Real Information Need) :K[I]=K[D]-K[S]意识到的信息需求(Perceived Information Need)设特定主体对特定潜在需求的意识转化系数为λ1,则有K1*I+=λ1K*I+提问(Request & Query)设特定用户对意识到信息需求准确表达系数为λ2,则有K2*I+= λ2k1*I+使用(Useness)设特定用户对检索结果信息的吸收系数为λ3,则有ΔI= λ3k2*I+当λ1λ2λ3=1时,K[D] =K[S+ΔS] 完全信息决策过程当0<λ1λ2λ3<1时,K[D] >K[S+ΔS] 有限信息决策过程当λ1λ2λ3=0时,K[S] =K[S+ΔS],零信息决策过程决策者以自身的主观知识和经验足以确定其操作要素,即K[S] =K[D]信息需求无法识别,即λ1=0信息查找过程中止,即λ2=0信息理解失败或没有新信息内容,即λ3=0▲三、信息检索行为模型信息检索行为的内涵是指在明确的信息需求基础上以各种方式获取所需信息过程所表现出来的行为信息检索行为模型对用户信息检索过程中的行为模式以某种形式表达出来的结构框架1、Dervin模型三要素模型状态(situation)特定时空中问题提出的背景差距(gap)个体认识上的不确定性使用或帮助(use/help or outcome)问题解决后获得的结果2、Ellis模型开始(starting)联接(chaining)浏览(browsing)跟踪(monitoring)区分(differentiating)采集(extracting)证实(verifying)结束(ending)3、Kuhlthau模型开始(initiation)选择(selection)探查(exploration)形成(formulation)收集(collection)结束(closure)4、Wilson模型基本主张信息需求并不信息检索行为的唯一动力,而是心理、认知与情感三方面的综合体信息获取过程中可能会遭遇各种不同背景下的干扰或障碍几个模型1981年模型及修正模型1996年模型四、信息检索的相关性原理1.相关(relevance)研究的历史性回顾1958年,ICSI(科学信息国际会议)上B.C. Vickery首次提出相关性概念60年代,研究相关性的定义、类型、相关性判断的各种可能影响因素70年代,试图建立相关性理论框架80年代,在相关研究中引入认知模型2.相关的几种典型定义1967年Cuadra与Katter的定义(系统相关)相关是信息条件叙述(即输入系统之检索问题)和文献内容间的一致性,亦即文献涵盖的内容对信息条件叙述的适合程度1971年Cooper的定义(逻辑相关)“一句子和信息需求相关的必要条件是其所属文献(以存储的句子表达)必须包含构成信息需求的最小前提组(minimal premise set)。

信息检索重点复习资料

信息检索重点复习资料

信息检索重点复习资料第一章信息检索概述信息检索(IR):将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。

信息素养:人们在解答问题时利用信息的技术和技能。

信息检索与文献检索的主要区别:文献检索是以获取文献信息为目的的检索,信息检索是收集,组织,存储一定范畴的信息,并根据用户需求查询文献中的信息或知识单元,比文献检索更深入。

信息检索的分类:1、根据检索手段不同可分为1)手工检索2)光盘检索3)联机检索4)网络检索2根据检索对象形式不同可分为文本检索、数值检索、音频与视频检索。

信息检索的原理:通过对大量的分散无序的文献信息进行收集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储和检索这两个过程所采用的特征标识达到一致,以便有效的获得和利用信息源。

存储是检索的基础,检索是存储的目的。

信息检索语言是人们在加工、存储和检索信息时用来描述信息内容喝信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。

信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。

其物理结构:是信息检索所用的硬件资源、系统软件以及信息资源集合(数据库)的总和。

信息检索语言的主要目的:把存储和检索联系起来,把标引人员和用户联系起来,以便取得共同理解,实现交流。

信息检索的历史:最早的信息检索主要依靠信息分类。

1手工检索2机械信息检索。

3脱机批处理检索是计算机初期使用的一种检索系统 4联机检索 5光盘检索 6 网络信息检索后四者统称为计算机信息检索信息检索的三个经典模型:1布尔模型 2向量空间模型 3概率模型 1浏览型模型:扁平式模型、结构导向模型、超文本模型2检索型模型:结构化模型、基于内容的检索型模型。

信息检索模型是信息检索的核心。

信息检索系统:是具有信息存储和信息查询功能的一类服务设施。

信息检索系统按功能划分5种类型:文献检索系统DRS、数据库管理系统DBMS、自动问答系统QAS、管理信息系统MIS、决策支持系统DSS. 信息检索物理结构1计算机硬件2软件3数据库信息检索的逻辑结构是指系统所包括的功能模块或子系统及其相互关系。

(完整版)信息检索考试重点

(完整版)信息检索考试重点
2、利用从《中文期刊全文数据库》、《中国知网》、《维普科技期刊全文数据库》等查出 10 篇以上专业文章,写出 1500 字以上的综述。 答: 新经济学 新经济时代的到来与传统经济理论的缺陷 当今世界经济发展进入了一个新时代, 这就是知识经济与可持续发展经济的新时代。

hing at a time and All things in their being are good for somethin
(二)
1、什么是检索工具?它的主要作用是什么? 答:检索工具是用来存储、报道和检索一次文献的工具,属于二次文献。 主要作用:报导作用、累计作用、查询作用、选择作用。 2、目录、题录、索引、文摘、文献指南各有那种类型? 答:目录可以分为国家目录、馆藏目录、联合目录、出版社与书商目录和专题目录。 题录的类型一般都是用代号表示。 索引类型可分为篇目索引和内容索引 文摘按其内容的详简程度可以分为指示性文摘和报道性文摘;按其适用对象可以分为一 般性文摘和倾向性文摘;按内容性质可以分为综合性文摘和专业性文摘。 文献指南主要介绍该科学和专题的主要文献类型。 3、什么是参考工具书?它有哪些主要作用? 答:参考工具书是根据一定的社会需要,广泛汇集某一范围的知识材料,按一定方式加以 编排,专供人们解释疑惑的特定类型的出版物。 作用:查字词、查事项、查人物、查机构、查产品、查物名、查地名、查年代、查数据。 4、字典和词典、百科全书、年鉴、名录、图录有哪些主要类型? 答:字典类型一般分为两种:○1 详解词典○2 专门词典。 词典从语种文别角度分为:○1 单语言辞典○2 多语言辞典。 从词量规模角度:○1 大型词典○2 中型词典○3 小型词典。 从收录内容角度:○1 百科全书○2 语文词典○3 专门词典。 百科全书分为两种类型:一类是概括人类一切门类知识,包括哲学、社会科学、自然科学 和应用科学等所有门类知识的综合性百科全书。另一类是指内容只收内容某一学科或某个 门类、某个专业的知识信息的专科性百科全书。 年鉴类型分为综合性年鉴、专业性年鉴、统计性年鉴。 名录类型分为人名录、地名录、物名录、机构名录。 图录类型分为地图录、科学技术用图集、历史图谱、文物图谱及人物图录。 (三)

【云南大学】信息检索期末复习重点

【云南大学】信息检索期末复习重点

【云南大学】信息检索期末复习重点第一篇:【云南大学】信息检索期末复习重点云南大学信息检索重点第一章一、检索策略定义:在处理信息需求提问实质的基础上确定检索途径、检索词语并明确各词语之间的逻辑关系,查找步骤、系统输出顺序等方面的科学安排,与检索效果密切相关。

二、检全率与检准率1.检全率及其影响:检全率=(检出的相关信息数/信息库中相关信息总数)x100%2.检准率及其影响:检准率=(检出的相关信息数/检出的信息总数)x100% 影响检出文献的检索效果的质量。

三、检索模型1.布尔检索模型(1)定义:布尔检索模型采用布尔代数和集合论的方法,用布尔表达式表达用户提问,通过对文献表示与提问式的逻辑运算来检索文献。

(2)优点:简单、易理解、易实现、能处理结构化提问(3)缺点:A.布尔检索式的非友善性,即构建一个好的检索式是不容易的。

尤其是对复杂的检索课题,不易套用布尔检索模型。

B.易造成零输出或过量输出。

检索输出完全依赖布尔提问式与系统倒排挡中的文献匹配情况,输出量较难控制。

C.无差别的组配元,不能区分各组配元的重要程度。

D.匹配标准存在某些不合理的地方。

由于匹配标准是有或无,因此,对于文献中表因此的数量没有评判,都一视同仁。

E.检索结果不能按照重要性排序输出。

2.向量检索模型(1)定义:向量检索是以向量的方式确定检索内容的方法,系统中的每一篇文献和每个提问均用等长的向量表示。

(2)优点:A.采用自动标引技术维文献提供标引词B.改变了布尔检索非“1”即“0”的简单判断,标引词和文献的相关程度可在【0,1】闭区间中取值,使标引和检索者都可比较灵活地定义组配元(标引词)与文献的关系深度,改变了布尔检索模型僵化的特点。

C.由于以其相似的程度作为检索的标准,可从量的角度判断文献命中与否,从而使检索更趋于合理。

D.检索结果可按提问的相关度排序输出便于用户通过相关反馈技术修正提问,控制检索量。

E.布尔模型的逻辑关系依然可以使用,保留了直观性和方便性。

信息检索知识点

信息检索知识点

信息检索知识点 Revised by Liu Jing on January 12, 2021信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。

2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。

3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。

存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。

检索过程是存储过程的逆过程。

因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。

4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)着者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。

缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。

信息检索重点

信息检索重点

1.信息检索(information retrieval) 定义(1)广义的信息检索:是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关的信息的过程和技术。

所以它的全称又叫信息存储与检索(information storage and retrieval).(2)狭义的信息检索:指广义的信息检索的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们的所说的信息查寻。

(information search)2.检索工具定义:检索工具是人们用来存储、报道和查找文献的工具。

因此,它具有存储和检索的功能。

存储是把分散、无序的文献,采用一定的检索语言使其集中,组织起来,成为有规律的检索系统,变成检索工具。

检索是人们按照有关检索语言,采用一定的方法和途径,检出自己所需的文献。

3.检索策略的定义陈光祚:所谓检索策略就是在弄清用户情报需求实质的前提下,选择检索途径、检索用词以及明确各词之间逻辑关系和查找步骤的科学安排。

赖茂生:所谓检索策赂,是指为实现检索目的而制定的全盘计划和方案,是对整个检索过程的谋划和指导。

4.信息资源:是人类存储与载体(包括人脑)上的已知或未知的可利用的信息。

信息中的载体信息和主体信息是使信息资源的最基本的组成部分。

填空一.检索工具的功能(1)报道功能。

(2)标识功能。

(3)辅助检索功能。

二.检索工具的类型1 按检索方法划分检索工具可以划分为手工检索和机械检索工具两大类型,机械检索工具主要是指计算机检索。

2 按收录范围划分检索工具可分为综合性检索工具、专业性检索工具、单一性检索工具3种。

综合性检索工具收录范围广,涉及多门学科。

专业性检索工具收录的范围仅限于某一学科领域。

单一性检索工具只收录某一特种类型的文献,但学科范围可广可窄。

3 按出版形式划分检索工具又可分为书本式、卡片式、磁带式和缩微制品等形式,书本式又包括书刊式、单卷式和附录式3种。

4 按收录文献的对象和揭示方式来划分⑴目录目录是一批图书或其他单独出版的资料的系统化记载及内容的揭示。

信息检索复习知识点

信息检索复习知识点1.信息(Information)信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。

* 信息的属性——客观存在性* 信息的作用——消除不确定性* 信息的形式——数据、消息等事实2.各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源3. 信息用户Information User信息的使用者即是信息用户。

使用的情况可以包括需要信息、接受信息和利用信息。

4. 信息需求Information Demand人们在社会实践活动中,为了解决各种实际问题,会产生对信息的需要,这种需要可表现为对信息的必要感和不满足感。

我们把意识到的信息需要定义为信息需求5. 信息检索Information Retrieval对信息用户而言,信息检索就是根据各自的目的和要求,选择恰当的信息资源,采用适当的检索手段、检索技术、检索方法,对所需要的信息进行查找、筛选和索取的过程或活动。

6. 信息素质:人们能够敏锐地察觉信息需求,并能进行相应的信息检索、评估以及有效利用所需信息的水平。

* 信息意识* 信息能力* 信息道德7. 信息社会是以知识和信息为基础从而促进社会高速发展的一种社会形态。

8. 经济领域的特征a.劳动力结构出现根本性的变化,从事信息职业的人数与其它部门职业的人数相比已占绝对优势;b.在国民经济总产值中,信息经济所创产值与其它经济部门所创产值相比已占绝对优势;c.能源消耗少,污染得以控制;d.知识成为社会发展的巨大资源。

9. 社会、文化、生活方面的特征10.社会观念上的特征11当代信息环境特征描述* 信息超载严重信息超载又称信息泛滥或信息爆炸。

它是指在信息时代,伴随着科学技术的迅速发展,出现的数据爆炸、信息平庸化以及噪音化趋势,人们无法根据自己的需要和当前的信息能力选择并消化自己所需要的信息。

* 信息失衡明显所谓信息失衡是对由于各国经济水平、科技水平和其它多种相关因素的影响,不同国家、不同地区以及不同阶层的人群在信息占有水平以及利用程度上存在极大差距的描述。

信息检索复习要点

1、文献:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。

这种附着在各种载体上的记录统称为文献。

2、文献由四要素构成,即文献信息、文献载体、符号系统和记录方法。

3、信息、知识和文献三者之间的关系:由信息、知识和文献的概念可知,三者之间是密切相关的。

信息是物质存在的方式、形式和运动规律的表征。

人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社会实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。

如此循环,不断创新,形成各种各样的新知识,从而推动人类社会前进。

由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。

4、具有信息素质的人主要具有以下几个方面的能力:(1)运用信息工具;(2)获取信息;(3)处理信息;(4)生成信息;(5)创造信息;(6)信息增效;(7)信息协作;(8)信息免疫。

5、信息资源的构成可从不同的层次和角度来划分:一、按照信息的出版和加工划分:1 图书;2 报刊;3 会议文献;4 专利文献;5 科技报告;6 学位论文;7 技术档案;8 产品资料;9 标准文献;10 政府出版物。

二、按照信息加工层次划分:按信息加工程度可将信息分为一次文献、二次文献、三次文献。

(1)一次文献即以作者本人的生产与科研工作成果为依据而撰写并已公开发行进入社会流通使用的原始文献。

例如专著、学术论文、科技报告、会议论文、专利文献、学位论文等;(2)二次文献即将大量、分散、无序的一次文献收集起来。

按照一定的方法进行整理、浓缩和加工,使之系统化而形成各种目录、索引和文摘,即编制成具有多种检索途径的检索工具。

二次文献又称为检索性文献;(3)三次文献即根据一定的目的和需求,在大量利用一次、二次文献的基础上,对有关知识进行综合、分析、提炼、重组而再生的信息资源。

信息检索复习资料

信息检索复习资料一、名词解释1.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。

2.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。

3.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

4.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。

5.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词某一部分允许有一定词形变化。

6.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识原始来源和属性的数据库。

7.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。

8.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。

9.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。

10.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。

11.电子报纸—多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。

12.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。

13.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。

信息检索复习要点

信息检索复习要点复习要点:1.如何查找纸本原⽂,必备信息是什么,刊名等同于什么刊名等同于ISSN号,必备的信息是,⽂章题⽬、期刊名称或是ISSN号,年/卷/期。

先查找有⽆电⼦全⽂。

⾕歌搜索、SFX全⽂搜索系统、先查本馆纸本期刊⽬录,获取论⽂全⽂中的查询本馆纸本期刊⽬录,联合⽬录。

2.哪些数据库有⾃动截词功能?EI3.中⽂科技期刊数据库、SCI和EI数据库的精确检索是如何实现的中⽂:可选择限定检索学科领域可选择逻辑算符可选择跨库检索的其他检索⽅式可选择匹配度⼆次检索其他限制条件EI:精炼检索结果位置:检索结果显⽰页左侧Refine Search的⼯具栏添加⼀个检索词的⼆次检索(Add a term )优化和调整检索结果(限定(Limit to)按钮或排除(Exclude)按钮:作者、作者机构、规范词、分类类名、国家、⽂献类型、语种、出版年、刊名、出版者等限定字段4.数据库检索结果的排序⽅式CNKI:主题发表时间被引下载EI:相关度和时间系统提供5种排序⽅式(按相关度、出版年代、作者字顺、刊名字顺和出版者字顺)5.主要的全⽂数据库CNKI、维普、万⽅:中⽂期刊全⽂数据库。

EBSCO、ScinceDirect、SpringerLinker:外⽂全⽂数据库。

6.Web ofScience数据库中包含有哪些数据库?SCIE/SSCI/A&HCL/CPCI-S(ISTP)/ CPCI-SSH7.查全查准率如何实现?提⾼查全率(扩⼤检索结果)的⽅法选择较⼤字段:如摘要、主题、全⽂、任意字段等尽量多⽤同义词、近义词、反义词、缩写词、上下位类词(增加逻辑或关系)减少逻辑与关系(限制条件)采⽤模糊匹配功能扩⼤检索年限使⽤截词符(*?$)提⾼查准率(缩⼩检索结果)的⽅法选择较⼩字段:如篇名(题名)、题名或关键词字段尽量增加核⼼检索词:从内容中挖掘核⼼词使⽤词位检索采⽤精确匹配/精确短语功能采⽤“AND”或“NOT”算符连接检索词或进⾏⼆次检索。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

信息检索与利用重点复习1. 按物质载体和记录形式划分,信息可分为印刷型、缩微型、声像型、机读型和手写型。

2. 文献是指“记录有知识的一切载体”,情报是“作为交流对象的有用知识”3. 内容、符号系统、物质载体、记录方式是构成文献的四个基本要素。

4. 按出版形式和内容的不同,信息可分为图书、期刊、报纸和特种信息。

特种信息也叫做灰色信息,包括:专利信息、学位论文、标准信息、会议信息、科技报告、政府出版物、产品样本资料和档案。

5. ISBN是国际标准书号,由13位数字组成,分成四段:组号(国家、区域、语言的代号);出版者号;书序号;检验码。

ISSN号是国际标准出版物号,由8位数字组成,分两段:分序号、校验码。

6. 图书按用途可分为3种类型:阅读用书,参考工具书,检索用书7. 按检索方法划分,检索工具可分为手工检索工具、计算机和网络检索工具。

8. 知识产权范围主要包括专利权、著作权和商标权9. 知识产权具有两大功能:保持功能和公开功能10. 广义的检索包括信息的存储和检索两个过程。

11. 检索方法分为常规法、引文法(追溯法和检索引文法)和交替法三种12. 检索途径可以分为主题途径、分类途径、责任者/著者途径、号码及其它途径13. 手工检索工具中的著录项目在数据库中称为字段,字段的集合称为记录。

14. 文献数据库内英文段码Abstract对应的中文段码名称是文摘。

Keyword对应的中文段码名称是关键词。

15. 按国际上通用的分类法,数据库分为参考数据库、源数据库和混合型数据库。

16. 中国现行主要的图书分类方法是《中国图书馆分类法》,它属于体系分类语言。

17. 《中图法》第四版将图书分为5部,22大类,L.M.W.Y没有,计算机属于TP类, 属于二级类目。

18. 索书号主要由分类号和著者号组成。

19. 在因特网中,政府机构和商业组织的二级域名分别是GOV、COM。

域名.hk所指的国家或地区是香港;.org 的含义是非营利组织.20. 公告号为8510961的专利是发明专利,专利号为200420011414.6的专利是实用新型专利;申请号为99322746.5的专利是外观设计专利。

21. 在标准号GB/T 19557.8-2004中,其中GB/T是推荐标准代号,2004是颁布年代。

22. IPC是国际专利分类号,其作用是提供从分类途径查找专利。

23. 根据搜索引擎的数据检索机制可将搜索引擎划分为主题型搜索引擎和分类型搜索引擎两种24.学位论文的开题一般包括选题、资料搜集、撰写开题报告、文献综述四部分内容。

25.词典是汇集词语,解释概念、词义和用法,并按一定的方法编排,供查检的参考工具。

26.会议文献是指通过召开学术会议而产生的文献,包括会前文献、会中文献和会后文献等三种。

27.按照多数国家的学位制度,学位论文包括学士学位论文、硕士学位论文和博士学位论文三种类型。

28.年鉴可以检索历年的统计数据,它汇集了一年内的社会科学和自然科学等领域的重大事件,重要时事文献、科学技术的新进展和统计数据,并附有大量图表和插图。

29.《四库全书》是中国历史上最大的一部官修百科全书,它分为经、史、子、集四部。

30.全文数据库属于源数据库,是将全文以机读版的形式存储起来,并可与相应的软件配合提供文中检索和全文输出的数据库。

31.超星数字图书馆收录的文献类型是电子图书32.计算机检索统中对词组进行检索采用的符号是“”33.搜索含有“data bank”的PDF文件,正确的检索式为:“data bank”+filetype: pdf。

34.如果需要检索某位作者的文摘被引用的情况,应该检索:引文索引。

35.授予专利的时候给出的编号是专利号。

36.“GB/T2007-2006摩托车和轻便摩托车发动机最大钮跨区各最大镜功率测量方法”表示的文献类型是:中国国家推荐性标准。

37.用google或者百度进行检索的时候,输入“intitle: 清华大学”,检索结果是:网页标题含有“清华大学”。

38.用google或者百度进行检索的时候,想检索中文教育科研网上举办的演讲会,应该输入:演讲会Site: edu.cn。

39.分类目录的职能是集中同一学科门类的文献。

40.列可检索国外学位论文的数据库是ProQuest(PQDD)41.查代古代的统计资料,可得用政书、类书等,查找现代的统计资料,可利用年鉴、手册、统计资料和统计网站。

42.信息检索根据检索对象的不同,可分为数据检索、事实检索、文献检索三种。

43.现代网络信息检索系统基本具备快速检索或简单检索、高级检索、分类导航等多项检索功能44.学术论文一般分为三个部分:前置部分、主体部分和附录部分。

45.会议信息是定期或不定期出版物,反映了某一学科或专业领域的最新成果;学术水平高,专业性强;数量庞大、内容丰富46.我国技术标准主要分为国家标准、企业标准、行业标准、地方标准。

47.计算机检索中常用的布尔逻辑算符是逻辑与(and)、逻辑非(not)、逻辑或(or)。

需要检索词A和检索词B都出现在被检出的文献记录中,这时需要使用的逻辑算符是逻辑与(and)。

48.著名的英语百科全书A、B、C是指:A 美国百科全书(Encyclopodia Americana);B 不列颠百科全书,又称大英百科全书(Encyclopaedia Britainnica);C 科里尔百科全书(Collier’s Encyclopodia)49.专利文献的特点是:报道最新产品和技术、文献各类繁多,免费公开;格式复杂50.科技报告最早源于第二次世界大战结束时美国收集的战败国、日本等国的最尖端的科技研究中试报告。

51.截词检索相当于用逻辑“或”扩展检索的范围,可以提高检索的查全率。

52.综述因附有大量参考文献,所以是三次文献。

53.输入检索词“Comp?ter”可以检出包含有Computer Compater Competer等词之一的文献54.报纸是一种定期连续出版物。

55.一般来说,精确检索可以提高信息检索的查准率,但是可能会降低信息检索的查全率。

56.人民日报图文数据检索系统是世界十大报纸之一《人民日报》的大型网上信息发布平台,也是互联网上最大的中文新闻网站之一。

57.信息检索中,查全率和查准率之间往往存在互逆关系,所以在检索中要求高查准率时,查全率往往会降低,反之亦然。

58.中国期刊全文数据库中检索一篇名为《撰写文献综述的技巧和方法》的论文的被引用情况,应该选择的检索项是“题名”。

59.追溯法是利用论文所附参考文献为起点,进行前期文献收集的检索方法。

60.学位论文是经过专业导师指导,由有一定权威的同行专家、学者审查的原始研究成果,是具有一定独创性的一次文献。

61.全文搜索引擎代表性的有Google、AltaVista、百度(Baidu)等等。

62.ISO、IEC和IEEE是国际上最有影响的标准组织63.超星电子图书数据采用PDG格式,首次检索,需先下载并安装最新版本的“超星阅读器”(SSreader)才能阅读图书全文。

64.《中国大百科全书》按学科分卷陆续出版,内容突出中国,并注重第三世界,自然科学和工程技术方面的内容所占比重较大,达到50%以上65. WWW信息资源是建立在超文本、超媒体技术以及超文本传输协议HTTP(Hyper Text Transfer Protocol)的基础上的,它集文本、图形、图像、声音为一体,并以直观的图形用户截面展现和提供信息的网络资源形式66.用搜索引擎google检索专利和期刊的全文比用中国国家知识产权专利数据库、《中文科技期刊数据库》等数据库的查全率和查准率都要低。

67.“中文科技期刊数据库”由重庆维普资迅有限公司研制,收录了1989年以来国内出版发行的12000余种期刊,核心期刊1800多种,基本覆盖了国内公开出版的具有学术价值的科技期刊。

68.在许多数据库中,都有“二次检索”功能,“二次检索”指:在前一次检索基础上再检索。

69.百度、Google,都不区分英文字母大小写70.简述如何利用超星数字图书馆下载全文的过程答:利用超星数字图书馆下载全文的过程如下:1)进入超星数字图书馆 2)下载并安装超星阅读器 3)确定检索方式4)输入字段进行检索 5)获取并下载全文71. 在“M=废水*利用*(循环和合理)*C=(T+S)”的检索式中包括了几种检索符号,哪几种?答:上述检索式中包括四种检索符号:布尔逻辑运算符、字段揭示算符及限制算符、括号72. 请将下列书目信息改写成标准格式的文后参考文献1)刘莲花:《房地产抵押若干法律问题探讨》,载《法学评论》,1999年第2期,43-44页2)袁庆寿牛德林主编《中国边疆经济发展概略》,黑龙江人民出版社,1993年版,第132页3)石庆伟、孙浩。

“白发浪潮”提前到来“银色住宅”应对不及,人民日报,2003年02月08日第五版答:[1] 刘莲花.房地产抵押若干法律问题探讨[J].法学评论,1999(2):43-44.[2] 袁庆寿,牛德林.中国边疆经济发展概略[M].哈尔滨:黑龙江人民出版社,1993:132.[3] 石庆伟,孙浩.“白发浪潮”提前到来“银色住宅”应对不及[N].人民日报,2003-02-08(5).73. 什么是检索工具,你将如何鉴别和评价检索工具?答:检索工具是人们用来存储、报道和查找各类信息的工具。

要鉴别和评价检索工具总体上从以下5个方面进行:1)信息收录范围与信息质量 2)著录的详略 3)著录、标引的质量4)信息报道的时效 5)检索功能74.简述信息检索和分析利用的步骤答:信息检索和分析利用的步骤如下:1)分析课题 2)选择检索工具 3)选择检索途径 4)拟订检索式 5)实施检索6)筛选文献 7)索取原文 8)定性定量分析 9)得出结论,形成情报。

相关文档
最新文档