文献检索的基本原理

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
含有检索词A和检 索词B中的任何一 个即算命中
A or B 或 A+B A
检索出的记录含有检 索词A或者检索词B
B
2 逻辑“或”
作用
扩大检索范围,防止漏检,提高查全率。
举例
检索“计算机” 方面的文献信息。 计算机 or 电脑
使用的注意事项
如果检索词涉及表达整体概念,要针对具体 情况分别列出每个表达部分概念的检索词,否则 将出现漏检。
计算机与通信学院 陈多
索书号:C53/126-2:4
C53代表分类号 126代表种次号
2代表第二版
4代表第四辑丛书
四、主题检索语言
标题词:是从文献的题目、正文或摘要中抽选出来,经 过规范化处理的词或词组,先组式语言。 叙 词(单元词):叙词语言是以规范化科学名词为基 础的一种主题法检索语言,叙词是主题词表中的所有正式 主题词可以根据需要将它们组配起来,用以表达复杂的概 念。是后组式语言,可自由灵活组配。 关键词:未经规范化处理,直接从文献题名、原文或文 摘中选取的能反映原文主题内容的自由词汇
2.2.1
检索系统
检索系统是根据特定需要利用一 定的检索设备,从整理加工并存贮 在某种载体上的文献集合中检索出 所需情报的系统。 它根据检索设备和载体的不同, 可以分为手工检索系统和计算机检 索系统。
手工检索系统由手工检索设备 (如书本式目录、文摘、索引、卡 片柜等)、检索语言、文献库等构 成。 特点:它使用方便,成本低廉, 但检索效率和响应时间均较差。
未限定检索词之间的位置关系,会影响某些课 题的查准率并容易造成误检。为了弥补其不足, 一般检索系统都提供文中自由词检索功能,也 称全文检索功能 。 所谓全文检索是利用文献记录中任何有实义 的关键词、词组或字符串作为检索词,词与词 之间的位置关系可以用位置运算符来表达。位 置运算符的使用,进一步强化了对概念的限制, 比布尔逻辑运算符更能表达复杂的概念,并避 免AND逻辑组配产生的词义含糊或误检。
TP368.6 网络计算机(NC)
分类号越长,表示的学科范围越窄。为了 醒目和方便读写,分类号中的数字部分由 左至右每隔3位加一个圆点“.”,如 G252.7、TP317.1,TN919.8
索书号
又称索取号,是图书馆藏书排架用的编码,是
文献外借和馆藏清点的主要依据。 一般由分行排列的几组号码组成,常被印书脊 下方的书标上。 一个索书号只能代表一种书。
叙词语言的体现形式是叙词表。国内外
常用的叙词表主要有我国许多文摘检索 刊物使用的《汉语主题词表》,英国《 科学文摘》使用的《INSPEC叙词表》, 美国《工程索引》使用的《Ei叙词表》 以及美国《政府报告和索引》使用的《 NTIS叙词表》等。
主题词与关键词的关系
计算机与通信学院 陈多
2.4 文献检索的技术
第2讲 文献检索的基本原理
2.0 文献检索的基本概念 2.1文献检索的原理、类型 2.2文献检索系统和检索工具 2.3文献检索语言 2.4文献检索技术 2.5文献检索方法、途径和步骤 2.6文献检索过程与策略
2.0
文献检索的基本概念
信息检索的定义
广义概念:将信息按一定的方
式组织和存储起来,并根据信 息用户的需要找出有关的信息 过程,故全称:“信息的存储 与检索”。
二、 检索语言的分类 检索语言可分为描述外表特征和描述 内容特征的检索语言。 描述外表特征的检索语言有书名、著者、 机构、号码; 描述内容特征的检索语言有分类语言和 主题语言。
分类语言
用分类号表达各种概念,将 各种概念按学科性质进行分类和 系统排列。
世界上比较著名的分类法有:《国际专 利分类表》(IPC)、《杜威十进分类法》 (DDC)、《美国国会图书馆图书分类法》 (LC)。 我国在图书情报系统广泛采用的有《中 国图书馆图书分类法》(简称中图法)和 《中国科学院图书馆图书分类法》(简称 科图法)。
3 逻辑“非”
运算符:NOT 或 -
一种排斥关系的组配,用来从原来的检索范围中排 除不需要的概念。 表达式:
A not B 或 A-B A
适用于排除含有某个 指定检索词的记录
B
检索出的记录含 有检索词A,但同 时不含检索词B
3 逻辑“非”
作用
缩小检索范围,增强检索的准确性。但使用不当, 易排除有用文献信息,从而导致漏检
(一)按著录方式划分: 1.目录型 2.题录型 3.文摘型 4.全文型
1.目录型
目录型检索工具是以整本图书或期刊
的外部特征为报道对象。
报道内容: 图书:书名/著者//出版地:出版者,出版时间
期刊: 刊名/编著
出版地:出版者,创刊年
2.题录型
题录型检索工具是以书刊中的某
篇文献(或章节)的外部特征为报 道对象 报道内容: 文献篇名/著者//刊名 出版年、 月(卷、期)、页码
印刷型(书本式、卡片式)
缩微型 电子型:
联机型(磁性载体、计算机及通信网 络) 光盘型(光盘、计算机及光驱) 网络型 (Internet、网络数据库)

2.3 检索语言
一、检索语言的概念 检索语言是信息检索系统存储与 检索所使用的共同语言。 检索语言是一种人工语言,用于 各种检索工具的编制和使用,并为检 索系统提供统一的、作为基准的、用 于信息交流的符号化或语词化的的和 语言。
图2.1
文献检索的原理
2.1.2 信息检索的类型 根据信息检索或查找的内容可划分为文献 检索、事实检索和数据检索。 根据信息检索手段可划分为手工检索和计 算机检索。
文献检索(Document Retrieval) 是以文献为检索对象,从已存贮的 文献库中查找出特定文献的过程。 例如“关于计算机控制系统 有些什么参考文献?”这就需要我 们根据课题要求,按照一定的检索 标识(如主题词、分类号等),从 所收藏的文献中查出所需要的文献。
检出同时含有检 索词A和检索词B 的记录
2 逻辑“与”
作用
缩小检索范围,提高查准率。
举例
检索“人口控制”或者“控制人口”方面的文 献信息。 人口 and 控制
2 逻辑“或”
运算符:OR 或 +
用于检索词并列关系(同义词、近义词)的组配, 实现检索词概念范围的并集。 表达式: 在文献记录中只要
位置 逻辑 布尔 逻辑
截词
常用检索算符
字段 限制 其他
加权
2.4.1 布尔逻辑检索技术
布尔逻辑检索技术就是利用布尔逻辑算符进行
检索项的逻辑组配,用以表达检索者的提问概 念。 布尔逻辑算符指规定检索词之间相互关系的运 算符号,在检索表达式中起着逻辑组配的作用
检索词
简 单
检索词
组 配
复杂概念的 检索式
《中图法》使用字母与数 字相结合的混合号码,基本 采用层累制编号法。将人类 的文献分为五个基本部类, 22个基本大类。
五大部类是:
1 、马列主义、毛泽东思想 2 、哲学 3 、社会科学 4、自然科学 5、综合性图书
http://www.ztflh.com
基本大类
A 马克思主义、列宁主义、 毛泽东思想、邓小平理论 B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N O P Q R S T U V X Z 自然科学总论 数理科学和化学 天文学、地球科学 生物科学 医药、卫生 农业科学 工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
举例
检索有关协议方面的文献信息,但不包括TCP/IP。 协议 not TCP/IP
使用的注意事项
两个关系紧密的检索词不宜用not
2.4.1 布尔逻辑检索技术
优先级运算
()>NOT>AND>OR
优先级高 优先级低
词位置检索(positional operator) — 位置运算符
利用布尔逻辑算符对检索词进行逻辑组配时,
检索工具的作用: 1、文献高度集中; 2、提高检索速度; 3、提供有规律的检索; 4、消除语言障碍.
检索工具的分类
1.按加工文献和处理信息的手段不同可分为:手 工检索工具和机械检索工具; 2.按收录范围分,有综合性、专题性(《计算机 应用文摘》)和专业性(《移动云计算文 摘》); 3.按著录方式分,有目录型、题录型(索引型)、 文摘型和全文型; 4.按出版方式分,有印刷型(卡片型、书刊型)、 缩微型和电子型(联机数据库型、软盘型、光 盘型)。
数据检索(Data Retrieval)是以数据 为检索对象,从已收藏数据资料中查找出特 定数据的过程。
例如:查喜马拉雅山有多高,杭州六和塔建于 何年等。
事实检索(Fact Retrieval)即通过对 存贮的文献中已有的基本事实,或对数据进 行处理(逻辑推理)后得出新的(即未直接 存入或所藏文献中没有的)事实过程。
为了提高检索的广度和准确度,常常需要对
检索词之间的位置关系加以限定。 全文检索的运算方式,不同的检索系统有不 同的规定,主要差别有两点: 规定的位置算符不同; 位置算符的职能和使用范围不同。
2.4.2下面介绍几种数据库经常使用的位置运 算符:
其中T 工业技术的二级类目采用两个字母标识:
T 工业技术 TB 一般工业技术 TD 矿业工程 TE 石油、天然气工业 TF 冶金工业 TG 金属学、金属工艺 TH 机械、仪表工业 TJ 武器工业 TK 动力工程
TL TM TN TP TQ TS TU TV
原子能技术 电工技术 无线电电子学、电信技术 自动化技术、计算技术 化学工业 轻工业、手工业 建筑科学 水利工程
信息检索的定义
狭义概念:仅指上述过程的后
半部分,即从信息集合中找出 所需要的信息的过程,相当于 人们通常所说的信息查寻 (Information Search)
文献检索:文献信息的存储、文
献检索两个过程。 情报检索模型即是“匹配”模型。 目的:为了解决特定的文献需求 和满足用户的需要。
2.1文献检索的原理、类型和方式
以局域网(LAN)类为例,列出中图法的各Leabharlann Baidu 类目:
T 工业技术
TP 自动化、计算机技术
TP3 计算技术、计算机技术 计算机的应用 TP393 计算机网络
TP39
TP393.1
局域网(LAN)
例如要查找“网络计算机(NC)”方面的文献:
TP3 计算技术、 计算机技术
TP36
微型计算机
根据“TP368.6”这一 类号,查找图书馆馆 藏分类目录,就能检 索到有关“网络计算 机(NC)”的馆藏文 献。
3.文摘型
报道对象与题录相同,但对文献内容揭
示的程度较题录更深入更具体,增加了 文献的摘要 文摘按其内容特征可分: 指示性文摘、报道性文摘、指示—报 道性文摘
4.全文型
报道对象与题录相同,但增加了
文献的全文 按载体不同: 全文数据库(中文、外文) 期刊等印刷型
(二)按载体方式划分
例如:本学年成绩优秀的学生有多少,某同 类产品中,那种牌号的销量最大。
数据和事实检索是要检索出包含在文 献中的具体情报; 文献检索则是要检索出包含所需要情报 的文献。 文献检索是最典型和最重要也是最常用
的情报检索
手工检索 即用人工来处理和查找所 需信息的检索方式。 计算机检索利用计算机和一定的通 信设备所查找所需信息的检索方式。

计算机检索系统主要由计算机检索设 备(联机检索设备、光盘检索设备、 微机检索设备、缩微品机检设备等)、 检索语言、文献库等构成。 特点:检索效率高,响应速度快等特 点,但是成本和检索费用较高。 在我国,这两种检索系统将在很 长一段时期内并存使用,相互补充 。
2.2.2
信息检索工具
检索工具的定义 检索工具是人们用来存储、报道和查 找文献的工具,它具有存储和检索的功能。 4个基本条件: (1)能够详细著录文献的外部特征和内容 特征 (2)具有即定的检索标识 (3)全部文献必须根据标识,系统科学地 排列成为一个有机地整体 (4)能够提供多种检索途经
检索词
2.4.1 布尔逻辑检索技术
常用的布尔逻辑运算符:

逻辑“与(AND)” 逻辑“或(OR)” 逻辑“非(NOT)”
1 逻辑“与”
运算符:AND 或 *
用于交叉概念或限定关系的组配,实现检索词概 念范围的交集。 表达式:
A and B 或 A*B A B
And两侧的检索 词必须同时出现 在检索字段中
相关文档
最新文档