专业文献检索第三章课件

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三章文献信息检索基本原理及方法

3.1.1 文献信息检索的基本含义

一、文献信息检索的基本含义

检索”即“查找”之意。信息检索,是将信息按照一定的方式组织、存储起来,并针对用户的需要查找所需信息的过程。因此信息检索包含了信息的存储和检索两个不可分的部分。我们通常所说的信息检索是指狭义的信息检索,即从检索工具和检索系统中查找所需信息的过程及其所采取的一系列方法和策略。

3.1.2 文献信息检索的类型

按检索手段:(1)手工检索:依靠手工操作来完成检索过程,所用文献一般是以纸张为载体。

(2机械检索:主要是指利用计算机进行文献信息检索,也称作计算机信息检索,所用的文献多以非纸张为载体,

手工检索和计算机检索的关系:手检是基础,机检是发展方向。

信息检索发展历史:信息检索作为一门技能,其历史可以追溯到图书目录和文摘、索引产生的时代。19世纪30年代——手工检索逐渐成熟,以印刷型文献为检索对象。最近50年——计算机信息检索。

手工检索阶段:公元前26年,我国第一步综合性的书目检索工具《七略》问世,它是以当时诸子百家的学术分类思想为基础,以汉代天禄阁的藏书为对象,按“部次甲乙”来组织文献典籍,这也是世界上第一部书本式的文献检索工具。近现代,利用图书馆馆藏书目工具为读者提供查找图书、期刊或事实信息。如卡片目录。还有各种书本式的目录、文摘、索引等检索工具。

手工检索阶段的主要特点是:

⏹遵循既定的标引规则来著录各项的内容;

⏹以印刷型文献(如图书、期刊、会议、专利、标准、学位论文等)为主要检索对象;

⏹以各类文摘、题录和目录性工具书为主要的检索工具;

⏹检索方法简单、灵活;

⏹检索策略便于修改,检索过程可及时发现问题,及时修改和补充;

⏹检索效率比较低,费时费力,且查全率较低;

⏹进行复杂问题的多途径检索时,需要反复查找许多检索工具;

⏹用户主要是专业技术研究人员。

3.1.2 文献信息检索的类型

按检索要求划分:

相关性检索——是系统不直接回答用户所提出的技术问题本身,而是只提供与之相关的文献供用户参考。

确定性检索——是以数据或事实为检索对象,系统要直接问答用户提出的技术问题,即直接提供用户需要的确切的数据或事实。

文献信息检索的类型

根据检索对象划分

●书目检索:是以文献线索为检索对象的文献检索,即检索检索系统存储的是以二次文献为对象(目录、索引、文摘)

的信息,他们是文献信息的外部特征与内容特征的描述集合体,信息用户通过检索,获取的是原文的“替代物”。用户通过检索获得的是与检索课题有关的一系列文献线索,然后再通过阅读决定取舍。

●全文检索:是以文献所含的全部信息作为检索内容的文献检索,即检索系统提供的是整篇文章或整部图书的全部内

容,检索时可以查找到原文以及有关的句、段、接、章等文字,并可进行各种频率统计和内容分析。全文检索主要

是用自然语言表达检索课题。较适用于某些参考价值大的典据性文献。全文检索是当前计算机检索的发展方向之一。

数据信息检索:数据信息是指检索系统中存储的是数值型数据,如科学技术常数、各种统计数据等,信息用户可用通过检索获得的经过核实、整理的数值信息再做定量分析。

事实信息检索:又称事项检索。是指系以事实为检索内容的情报检索,其检索对象包括事实、概念、思想、知识、人物的基本信息等内容,事实检索也是一种确定性检索,,用户获得的是有关某一事物的具体答案。

3.2 文献信息检索原理

文献信息检索的基本原理:就是用户根据课题需要,将代表需要查找的检索提问标识与文献库中所存储的文献特征标识进行比较,当文献库中所存储的文献特征标识与检索提问标识相一致,或文献特征标识包含了检索提问标识时,那么具有这些特征的标识就被检出,即是命中的结果。 信息存储与检索原理流程图

)

检索语言的定义:检索语言是从自然语言精选出来的一整套词汇、符号,用以对文献内容和信息特征进行概括和规范。它

检索语言须具备三个基本要素:

1. 有一套专用字符来构建词汇;

2. 有一定数量的基本词汇用来表达基本概念;

3. 有一套专用语法规则,用严格的句法手段和词法对词汇进行控制,以准确表达各种各样的概念。

一种较好的检索语言应具有对多种检索要求的广泛适应性,保证有较高的查全率和查准率;具有对多种学科和多种信息类型的适应性;具有与其他检索语言的兼容性和国际通用性。 检索语言的分类划分

匹配

输出

分类语言:是指以数字、字母或数字与字母结合作为基本字符,以基本类目为基本词汇,以类目的从属关系来表达概念

间相互关系的一类检索语言。

分类原理:分类是对知识概念的划分。分类语言是用分类号来表达学科体系的各种概念,将各种知识要领按学科性质进

行分类和系统排列。即以学科分类为基础,按照概念划分的原理,将知识分门别类地按一定的逻辑次序,从总到分,从具

体到一般,从简单到复杂、进行层层划分,层层隶属,形成一个严格有序、层次分明的知识门类体系,以便从知识分类的角度按学科、分专业地集中信息,揭示各类信息在内容上的联系与区别,提供从 学科分类角度检索信息的途径。 检索语言

主题语言:是一种描述概念性语言,它用语词直接表达文献的主题,这些语词就是表达主题概念的标识。将这些作标识的语词按字顺序排列并使用参照系统来间接表达各种概念之

又称标题词语言,是最早使用的一种主题词语言,以标题词作为表达文献内容和检索依据、完全先组式规范化的检索语言。 标题词主标题词和副标题词。 利用标题词语言编制的检索工具质量较好,组配固定,不易混乱,有较好通用性、直接性和专指性。可通过“见”和“参见”扩大检索范围,提高查全率。 缺点是系统性差,内容相关的分散在多处,灵活性差,不能任意组配检索。

相关文档
最新文档