信息检索 第二章检索语言

合集下载

信息检索的基本知识

信息检索的基本知识

⑵信息检索系统的类型 〔续〕
④索引型检索系统: 索引是根据一定的需要,把特定范围内的
某些重要文献中的有关款目或知识单元,书 名、刊名、人名、地名、语词等,按照一 定的方法编排,并指明出处,为读者提供 文献线索的一种检索系统。
索引不仅广泛存在于各种书刊等文献 中,而且更多见于作为辅助检索系统而附 在不同类型的检索工具之后,为检索工具 提供了更多的检索途径。
信息的存储过程就是按照主题词表或 分类表及使用原那么对原始信息资源
一、信息检索原理〔续〕
2、信息检索系统〔续〕
一、信息检索原理〔续〕
⑵信息检索系统的类型
按信息处理手段划分有 ①手工检索系统。又称传统检索系统 是使用人工来查找信息的检索系统。 其主要类型有各种书本式的目录、题 录、文摘和各种参考工具书等。优点: 方便、灵活、 断准确。缺点:检索速 度太慢
2、信息检索系统〔续〕
按著录和标引方式划分 ④文摘型检索系统是以简练的文字将文献
资料的主要内容准确、扼要地摘录下来, 并按照一定的著录规那么和编排方式系统 地组织起来的检索 工具。 主要包括:报道性文摘
指示性文摘 如:美国的?化学文摘?英国的?科学文摘〉
中国的〈中国数学文摘〉〈海洋文摘〉
2、信息检索系统〔续〕
按著录和标引方式划分
⑤全文型检索系统 全文检索是指在文献资料的标题、目录、作
者、内容中检索 指定的字符串。 全文检索系统是指将文章 中所有的文字处理序列 都作为检索对象进行索引,并根据需要找出包含 有欲检索词的文献的系统。
作用:它能提供快捷的数据管理工具和数据 查询手段,帮助人们进行了大量文献数据的整理 和管理工作,使人们能够快速、方便地查到想要 的任何信息。
第二章 信息检索的根本知识

信息检索基础知识

信息检索基础知识

TP 自动化技术、计算技术
3 计算技术、计算机
31
计算机软件
316
操作系统
.1
分时操作系统
.2
实时操作系统
.7
Windows操作系统
39
计算机的应用
… F25 物资经济 F250 物资经济理论 F252 物资流通
… F5 交通运输经济 F50 交通运输经济理论
… F53 铁路运输经济 F54 陆路、公路运输经济
匹配有其匹配标准,这里涉及到两者一致性、 相关度等问题,按一定的标准筛选出符合要求的 信息。
精选ppt
3
信息检索一般过程
信息源
信息分析、 著录、标引
信息的表示
用户
检索语言
用户需求分析
数据库 匹配过程
输出检索结果 精选ppt
检索表达式
4
信息检索的过程往往需要一个评价反馈途径,多次比较匹配, 以获得最终的检索结果。其图示如下:
9
责任者 及其单位
中图分类号 文献标示码
关键词
正文
精选ppt
题名 摘要
10
分类语言
也属于主题语言。分类语言是按学科范畴划分而构成的一 种语言体系,它集中反映学科的系统性、反映它们的相关、 从属、派生等关系,从总体到局部分层、分面展开,形成 分类体系。由类目号码及名称作为检索语言,构成分类类 目表,如前述图书分类表、专利分类表用的都是分类语言 。
13
……
主题语言
包括:关键词语言、单元词语言、标题词语言、叙词语言等,它们有不同 的主题词表。主题词表达概念本身,在主题词表中通过参照系统来指示词 汇之间的关系。如”交通运输”、“国际物流”。主题语言分为规范主题语

第2章--信息检索PPT课件

第2章--信息检索PPT课件

经济
文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
S
T U V X Z
农业科学
工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
《中国图书馆分类法》
中国图书馆分类法分类表共分22个大类,再分17个 二级目录,医药卫生属于R大类。 《中图法》采用汉语拼音字母和阿拉伯数字组成的 混合制号码作类目标识,用一个字母标记一个基本
的问题;
另一方面是特定原始文献的查找,即在查找特定
的文献线索后,找出原始文献的过程。
第一节 信息检索基础
一、信息检索概念
(二)信息检索的意义和作用 信息检索 有助于知识更新 ,有助于同学们扩大视野 ,了解和把握有关学科中出现的新思想、新观点与 新知识。掌握信息检索技术是快速、准确地获取和 利用最新信息的有效途径。 信息检索有助于科学研究,了解和把握有关学科的 起源和发展过程。 有助于独立自主地解决自己在学习、生活和工作中 所遇到的疑难问题。 是接受终身教育的必要手段。 节省时间,提高效率。
第二节 信息检索语言
二、检索语言的种类
(一)分类检索语言 分类检索语言又称分类法,是用分类号(字母、数 字或它们的组合)来表达各种概念的,并将各种概 念按学科性质进行分类和系统排列的信息检索语言。 它以树状结构的形式,按知识门类的逻辑次序反映事物 的从属、派生关系,构成具有上位类和下位类隶属、同 位类并列的概念等级体系。 能较好体现概念的族性关系,从学科专业的角度检索资 料,比较方便,扩大、缩小检索范围方便。
(一)按信息检索的对象划分
数据信息检索 利用数据库、工具书等以数值或数据为对象的检 索,也称为数值检索。检索包含分子式、分子量 、公式 、图表等特定数据的信息。

第2章 检索语言

第2章 检索语言
传统意义上的检索语言,是应文献信息的加工、存贮和 检索的共同需要而编制的专门语言,它是表达概括文献信息 内容的概念及相互关系的一种概念标识系统。

广义上的检索语言,指信息检索过程中涉及的人工语言 和自然语言。

人工语言是根据一定的规则人为编制而成的检索语言,有严格的使用规则,可用 于表述文献主要内容,建立信息检索系统。 自然语言是人类交流时使用的语言,不受任何限制,未经加工和规范。




2.1 2.2 2.3 2.4 2.5 2.6
检索语言概述 检索语言的理论基础 分类检索语言 主题检索语言 分类主题一体化检索语言 网络信息检索语言
2.1 检索语言基本知识

2.1.1 检索语言概述 2.1.2 检索语言的功能 2.1.3 检索语言的类型
2.1.1 检索语言概述
3.代表类事物特征的一套代码;
世界常见的检索语言主要有:



《杜威十进制分类法》 《国际十进制分类法》 《冒号分类法》 《中国图书馆分类法》 《中国人民大学图书馆分类法》 《汉语主题词表》
2.1.2检索语言所具备的功能




(1) 对文献的信息内容及其外表特征加以规范化 的标引; (2) 对内容相同及相关的文献信息加以集中或揭 示其相关性; (3) 可使文献信息的存贮集中化、系统化、组织 化,便于检索者按一定的排列次序进行有序化检 索; (4) 便于将标引用语和检索用语进行相符性比较。

狭义上的检索语言,仅指根据信息检索的需要,按照一 定的规则对自然语言进行规范,并专门用于信息标引和用户 检索的人工语言。

2.1.1 检索语言概述
检索语言又称情报语言、情报存储与检索语 言、文献语言、索引语言、标引语言、标示系 统等。 1.从自然语言中精选出来并加以规范化的词汇;

第二章信息检索语言

第二章信息检索语言

分面组配分类法
地区分面 E1 中国 E2 朝鲜 E3 韩国 E4 日本 …… 体裁分面 D1 诗歌 D2 戏剧 D3 小说 D4 散文 …… 时代分面 C1 古代 C2 近代 C3现代 C4当代 ……
• 著名的分类表: 著名的分类表:
杜威十进分类法》 国际十进分类法》 《 杜威十进分类法 》 、 《 国际十进分类法 》 、 美国国会图书馆图书分类法》 《美国国会图书馆图书分类法》、《中国图 书馆图书分类法》 书馆图书分类法》、《中国科学院图书馆图 书分类法》 书分类法》、《中国人民大学图书馆图书分 类法》 国际专利分类法》 类法》、 《国际专利分类法》等。
• 优点: 优点:
组配准确,标引能力强;结构完备, 组配准确,标引能力强;结构完备,词汇控制严格 适合多途径检索,检索效率高; 适合多途径检索,检索效率高;对检索系统的适应性高
• 缺点: 缺点:
词表编制和管理的难度大;标引难度大。 词表编制和管理的难度大;标引难度大。
叙词语言的词汇控制
• • • • • • 词量控制 词类控制 词形控制 词义控制 词间关系控制 先组度控制


表达信息 组织信息
2.检索语言的组成要素 检索语言的组成要素 – 字符 – 基本词汇 – 语法规则 3.检索语言的特点:严密性、可控性、系统性 检索语言的特点: 检索语言的特点 严密性、可控性、
4.检索语言的类型 检索语言的类型
• 内容特征语言
– 分类语言 – 主题语言
• 外部特征语言
– 名称语言 – 著者语言 – 序号语言
关键词语言
• 关键词:是指从文献信息的题名、摘要或正文中抽取出来 关键词:是指从文献信息的题名、
能揭示信息内容特征的词语。 能揭示信息内容特征的词语。

信息检索电子课件

信息检索电子课件

信息检索语言 主题 语言 描写文献 内容特征 分类 语言
单元词语言 标题词语言 关键词语言 叙词语言 体系分类语言 组配分类语言 混合分类语言 Return
表2-1 《中图法》结构示意图
基本大类 简表 详表
A 马克思主义、列宁主义 毛泽东思想、 邓小平理论 B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 U1 综合运输 S 农业科学 U2 铁路运输 T 工业技术 U4 公路运输 U 交通运输 U6 水路运输 V 航空、航天 [U8] 航空运输 X 环境科学、安全科学 Z 综合性图书
工具书概述
第二节
第三节
中文工具书举要
网络工具书
Return
第一节
工具书概述
一、工具书的定义与性质
工具书的定义 工具书的性质
二、工具书的类型
三、工具书综合利用要领
Return
第二节
一、中文检索工具书
目录
中文工具书举要
索引
文摘
二 、中文参考工具书
词语与学科知识检索工具——辞书与百科全书 年度统计资料与统计数据的检索工具——年鉴 数据规格、技术方法的检索工具——手册 人物、机构和地域信息检索工具——名录 实、历法和历史沿革信息的检索工具——表谱 图像信息检索工具——图录 Return
J-D J-E J-F
J-G
经济政治与法律辑
经济、商贸、金融、保险、政论、党建、外交、军事、法律
J-H
教育与社会科学综合辑

第二章 信息检索的基本知识


应用举例:
利用《中图法》在《全国报刊索引》中查找 有关“建筑抗震设计”方面的相关文献。 第一步:分析课题,按学科属性属于“T工业技术” 中的“TU建筑科学”大类。 第二步:查《中图法》确定分类号为:T工业技 术—TU建筑科学—TU3建筑结构—TU352.11抗震结 构。 第三步:根据《全国报刊索引》(科技版)的分 类目录给出的TU3建筑结构的页次,得到相关文献。 第四步:根据的出处索取原始文献。
第二章 信息检索的基本知识
主要内容
1.信息检索概述 2.信息检索原理及检索语言 3.信息检索系统与检索工具 4.信息检索的一般程序
2.1 信息检索概述
2.1.1信息检索的含义
信息检索(Information Retrieval)是指 将信息按一定的方式组织和存储起来,并根据用 户的需要找出有关信息的过程,又叫信息储存与 检索(Information storage and Retrieval), 这是广义的信息检索,如图2-1所示。狭义的信息 检索则是仅指该过程的后半部分,即从信息集合 中找出所需信息的过程。
内容特征 标题词 主题语言 关键词 叙词 描述文献外表特征的检索语言,例如篇名、著者姓名、文 献号等作为文献标识与检索依据直接明了,使用时较为简单。 而文献内容特征的语言,也就是分类语言和主题语言的原理和 使用方法是下面主要介绍的内容。
一条中文书目记录:
题名: 信息检索 作者: 徐天秀 出版项:北京:科学出版社,2006 页码: 320页 价格: CNY23.00 主题: 情报检索 索取号: G252.7/101 内容提要:本书是一本工具型书籍,提供的信息检索学科 范围广,内容尽量以最新版本为主,是一本适用性强的学 习信息检索方法和技巧的专著,尤其是本书配制的多媒体 光盘,为本课程的学习提供了便捷。 分类: G252.7

文献检索,信息检索(2)第二章 信息检索原理

优点:可以检索到某学科或专业的所有文献,有较高 的查全率。
缺点:常常落后于当前研究现状,分类表相对呆板的 学科关系,使得确定前沿概念、跨学科概念或非常具 体概念的分类,较困难。用户差异性。
分类语言
中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类法
基本部类 马列毛邓 哲学
(2)多概念课题
并列概念课题,如“新闻宣传研究”
“计算机在人文社会科学方面的应用” 上位类分类方法,如“灰色系统理论”
应用性课题,如“计算机在人口预测方面的应用”、
2.主题语言
是直接以代表信息内容特征和科学概念的概 念词作为检索标识,并按字顺组织的一种检索语 言。 是以表达文献主 是从文献的内容 是从文献的题目
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,
将检索提问式转换成逻辑表达式,限定检索
词在记录中必须存在的条件或不能出现的条 件。凡符合布尔逻辑所规定的条件的文献, 既为命中文献。
布尔逻辑运算符
————————————
1、逻辑“或” 2、逻辑“与” 3、逻辑“非”
2、逻辑“与”
————————————————
Chinese AND litera0,000 网络100,000,000) 用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B 其意义为检索记录中必须同时含有检索词A和B 的文献,才算命中文献。
4、记录级
检索词在数据库的同一记录中。
(C)—citation
表示两侧的检索词(或检索项)必须出现在同一记录中,词
序不限,中间词数量不限,其作用与布尔逻辑算符AND相同。

信息检索教程 教学课件 冯惠玲 王立清 著 第二章 检索语言

检索需要而创制的人工语言,又称情报语 言、情报存储与检索语言、文献语言、文 献工作语言、索引语言、标引语言、标引 符号、标识系统等。
二、检索语言的基础
(一)概念逻辑 概念逻辑,是一种科学思维方法,通
过明确各种概念及其相互关系而揭示事物 的本质属性及各种事物之间的联系与区别。
(二)知识分类
知识分类包括事物分类和学科分类。 它是对千差万别的事物作系统研究的重要 方法,是对各种事物之间的区别和联系从 本质上、原理上进行揭示的重要手段,对 信息的系统化具有重要的价值。
(一)《汉语主题词表》 《汉语主题词表》是我国第一部大型的
综合性的叙词表,由中国科技信息研究所 和北京图书馆负责主持,1975年开始编制, 1980年正式出版。
(二)《中国分类主题词表》
《中国分类主题词表》是在《中图法》 编委会主持下,经全国40个单位160位专家 学者的共同努力,历时8年编制而成的,于 1994年6月正式出版。
教材其余课件及动画素材请查阅在线教务辅导网 在线教务辅导网: QQ:349134187 或者直接输入下面地址:
第二章 检索语言
第一节 检索语言的概念和基础
一、检索语言的概念 传统意义上的检索语言仅指根据信息
第四节 主题检索语言
一、主题检索语言概述
主题检索语言又称主题法。它采用语 词直接作为文献主题标识,按字顺排列主 题标识,提供各种检索词语的途径。
(一)主题检索语言的类型
1.标题词语言 2.单元词语言 3.叙词语言 4.关键词语.直观性好 3.灵活性强
二、标题词法和单元词法
(一)关键词法的原理和特点
关键词法是适应目录索引编制过程自 动化的需要而产生的,出现比较早,广泛 使用却是近二三十年的事。

第二章 信息检索基本方法与基本技术


2. 主题检索语言
• 标题词:经规范化处理的词或词组,先组式
语言
• 叙 词(单元词):经规范化处理的词或词
组,后组式语言,可自由灵活组配
• 关键词:未经规范化处理,直接从文献题名、
原文或文摘中选取的能反映原文主题内容的自 由词汇
二、检索工具
定义:检索工具是人们用来存储、报道和查找 文献的工具,它具有存储和检索的功能。
点击预约书刊可预约该书 预约图书:选定所需图书,输入证号、密码,执行预约 点击机读格式可查看该书的MARC信息
高级查询
• 在题名、著者、丛书名、主题词、出版社、 ISBN(书)、ISSN(刊)、索取号、起始年 代中填入自己确定的内容,其余的可以不填 写;选定语种(17种)和文献类型,然后进 行检索。 • 结果可检索到所需文献的题名、著者、出版 信息、索取号 • 查看选中图书的相关信息
图书馆信息查询系统
•书目查询 •读信者息 •新书通报:一个月内到馆的新书、馆藏 地,并可查看新书 •订购征询 •信息发布:预约到书列表、超期罚款、 超期催还、委托借阅到书列表
如何利用计算机进行检索
书刊查询
读者信息查询
图书馆主页的功能
信息发布功能:
图书馆最新服务动态、电子 资源试用等均及时在主页上发布。
一、信息检索原理
信息检索的原理(示意图)
存 储
特征化
表示
查 询
特征化
表示
信息 集合
选择与匹配
需求 集合
二、信息检索类型
手工检索 计算机检索 文献信息检索
• 信息检索(内容)
• 信息检索(工具手段)
数据信息检索
事实信息检索
第二节 信息检索语言与工具
一、信息检索语言
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.3分类检索语言分类检索语言:又称分类法,是将许多类目根据一定的原则组织起来,通过标记符号(分类号)来代表各级类目和固定器先后顺序的分类体系。

体系分类法:基于概念的划分与概括,以学科分类为基础,把概括文献内容与事实的各种类目组成一个层层隶属、详细列举的等级结构体系。

组配分类法:基于概念的可分析性和可综合性,将一个复杂的文献主题概念用若干个表达简单概念的标识组配来表达的一种文献分类法。

一、体系分类法(一)结构分为微观结构和宏观结构。

微观结构指分类法中类目的构成结构。

按照类目之间关系建立起来的类目集合称为类目体系。

类目体系的建立涉及到。

1、类目的划分是把一个类目分成若干小类,从而揭示类目外延的逻辑方法。

类目划分的标准有分类标准、内容标准、形式标准。

类目划分的过程通常是由大到小、由属到种、有整体到部分、由总论到各论、有全面到各方面。

2、引用次序在体系分类法中表现为分类标准的使用次序。

合理的引用次序应满足逻辑性原则、符合检所需要原则、表达性原则。

3、类目的排列直接影响到分类法的质量应体现出系统性、整体性、等级性、逻辑性、连续性、一致性。

4、类名的确定类名的作用是表达类目含义应坚持科学性、确切性、简洁性。

5、类目之间相关关系的处理分类法是依赖于类目之间的相关关系建立起来的。

类目之间的基本关系有从属关系(类目体系中母类与子类的关系,构成分类法类目的纵向排列)、并列关系(在分类法中体现为同位类)、交替关系(使用类目和交替类目之间的关系)、相关关系(在分类法中体现为相关类目)。

宏观结构是按功能分体系分类法的结构。

有以下四部分组成。

1、类目体系按照类目之间关系建立起来的类目集合。

由主表和复分表组成。

主表是由基本部类、基本大类、简表、详表逐级展开而成的类目表。

复分表是供主表有关类目进一步细分用的类目表,有通用复分表和专用复分表两种。

2、标记系统是分类语言所有标记符号的集合。

分类语言的标记符号即分类号,有单纯式号码和混合式号码两种。

标记制度是由标记符号构成分类标记的基本方法,可分为顺序制、层累制、混合制、分面标记制。

为了增强标记符号的容纳性、表达性、简明性,采用了一些特殊的标记方法,有八分法、双位法、借号法、组配法、空号法。

①顺序制:对全部类目不分等级给予顺序号码的编号方法。

优点:号码简短明了、便于排检、容纳性强。

缺点:表达性、助记性差。

②层累制:一种分类号位数与类目等级相对应的标记制度。

优点:表达性、助记性强,便于扩检和缩检,便于文献排架和目录组织。

缺点:简短性差。

③混合制:将顺序制与层累制结合起来使用的一种标记制度。

④分面标记制:一种显示类目组配结构的标记制度。

优点:表达性、灵活性强。

缺点:号码成分复杂,冗长难记,标记的排序能力差。

①八分法:用1-8来标记同位类,当同位类超过8个时,不用9,而用91、92 (98)来标记。

是解决同位类超过10个时的一种方法。

②双位法:当同位类超过18个时,直接用双位数表示一次划分。

是解决号码扩充问题。

③借号法:灵活借用上位类或下位类号码的配号方法。

被借的号码常是8或9。

④组配法:将两个表示简单概念的类号用组配符号组合成一个符合类号。

用来表示分类表中没有列出的复杂概念。

⑤空号法:为了适应新类目的增加而采用的一种预留一定数量空号码的编号方法。

空号也有可能是原有类目被删除或调整而出现的。

3、说明与注释是对分类表结构及使用方法的揭示,主要包括编制说明、大类说明、类目注释。

4、类目索引从类目名称子顺查找相应分类号的类表辅助工具。

分为直接索引、相关索引、主题分类对照索引。

(二)特点优点:1、按学科专业属性构建类目体系,形成按学科专业集中文献的知识概念系统,直接满足用户从学科专业出发检索课题的需求,查全率较高。

2、采用等级列举式的概念标识系统来揭示概念之间的相互关系,便于用户“触类旁通”“层层深入”的查找学科专业的信息;便于用户通过一定类目下的浏览查到相关领域的信息。

3、采用分类号作为主题标识,不受语种限制。

缺点:1、修订不便,无法及时增加反映新知识主题的类目。

2、分类表不可能永无止境的细分下去,遇到主题狭窄的文献,难以找到相应的类目和分类号。

3、体系分类法采用先组定组式标识,难以进行组配检索,检索途径单一,检索效率不高。

4、采用分类号作为主题标识,缺乏直观性。

5、按学科专业属性集中文献信息以及线性的分类体系,难以反映客观实际中多维的知识空间结构。

(三)主要体系分类法介绍《中国图书馆分类法》其标记制度采用阿拉伯数字与拉丁字母相结合的混合号码制。

基本上遵循层累制。

《杜威十进分类法》依据培根的知识分类思想,被称为倒转培根法。

采用纯阿拉伯数字作为标记符号,基本上遵循层累制。

二、组配分类法(一)组配分类表组配分类表是由编制说明、基本类表、分面类表和分面公式以及通用辅表组成,它的建立主要采用了分面分析法。

分面分析法是将整个知识领域或某一知识领域按其不同属性分解为若干个分面,每个分面再分解为若干个亚面,每个亚面再分为更小的子面,面内列出所属各子目的一种编制分类表的方法。

在组配分类表的编制过程中,需要考虑到分面的引用次序与排列次序,标记符号与标记制度等方面的问题。

1、分面的引用次序与排列次序①分面的引用次序:组配表达主题概念时,各分面被引用的先后次序,即各分面中有关类目的组配次序。

②分面的排列次序:组配分类表中各分面以及分面内各类目的排列先后顺序。

2、标记符号与标记制度①分面标记制:用分面符号把类目分成若干段,使每一段的号码代表主题的一个方面,以实现类目组配结构的一种标记制度。

②回归标记制:将分类表中位于前面的分面类目号码直接加在位于后面的分面类目号码之后,组配表达复杂主题概念的标记制度。

(二)特点优点:1、通过简单主题概念的组配,一方面可简化分类表,缩小类表体积;另一方面能表达各种复杂主题概念和专深主题概念;并且能够揭示主题概念之间的相互关系。

2、可以对信息所表达的主题概念进行多方面标引,实现多途径检索。

3、可以较为及时的增补新的主题概念,类表修订灵活方便。

缺点:1、类目体系不如分类法直观。

2、标引和检索有一定难度,使用不太方便,非专业人员使用难度较大。

3、不适合图书馆、资料室组织文献分类排架。

(三)主要组配分类法介绍最早提出分面组配思想的是比利时的奥特莱。

系统的分面分配理论是由印度图书馆学家阮冈纳赞提出,在其专著《图书分类导论》中有系统阐述。

《冒号分类法》是阮冈纳赞编制的一部分面分类法。

提出了五个基本范畴的理论,依次为:本体、物质、动力、空间、时间。

创立了分面标记制度,广泛采用八分法、双位法。

《冒号分类法》的优点:①标记表达性强。

②类表简练、容纳性强、适应性好。

③易于揭示复杂主题。

④对今天的知识组织产生了一定的影响。

缺点:①类目体系不够直观②标记符号种类繁杂、规则繁多③使用起来比较复杂。

虽然在理论上对分类语言的发展做出了巨大贡献,但在实践中没有得到广泛应用。

2.4主题检索语言主题检索语言:又称主体法,采用语词直接作为文献主题标识,按字顺排列主题标识,提供各种检索词语的途径。

从描述事物特性角度出发,按文献所论述的事物(即主题)集中文献,用规范化的名词术语标引和表达文献主题概念,用参照系统显示事物概念主题词之间的关系。

主题检索语言与分类检索语言的相同点:①表现文献内容特征的检索语言②描述和揭示的对象是各种各样的文献③都是建立在概念逻辑、知识分类、术语学基础之上。

一、类型:标题词语言、单元词语言、叙词语言、关键词语言二、特点:主体法是直接使用语词标识的检索语言,能较好的按事物集中文献,便于从事物出发检索文献。

优点:1、专指性高:主题语言以规范化的名词术语为基础,着眼于事物及事物的各个方面。

任何一个语词标识都能表达一个或大或小,不受学科影响,基本上是独立完整的事物概念。

2、直观性好:①直接采用主题词做标识,可直呼其名,依名查检,易读易记易理解②主题标识按字顺排列,更突显了其直接优点。

3、灵活性强:①主题语言根据需要对主题词进行灵活组配,特别适合计算机的逻辑检索功能。

②主题语言对于从事物出发的比较狭小的检索提问,以及关于新学科新事物新概念的检索提问,检索效果特别好。

缺点:由于按字顺排列,同一学科的文献易被分散在别处,族性检索不及分类检索语言。

三、标题词语言标题词:从自然语言中选取的,未经规范化处理的,表示事物概念的词、词组、短语。

标题词语言:一种先组定组式语言,选择标题词作为文献内容的标识和检索依据,具体表现为标题词表的利用,标题词按字顺排列,词间关系用参照系统显示。

优点:①词表直接用事物名称列举出表达事物的主题,直观性强②采用先组定组式方法,词表中标题结构固定,含义明确③用参照系统显示主题之间的关系。

缺点:①采用先组定组式方法,标题词表检索途径单一,无法实现多途径检索②词表一般收词量大并且专指度相对不足,修订量大。

标题词一般分为主标题和副标题两级,通过其固定组配来构成检索标识,所反映的主题概念有限,无法实现多途径多因素检索。

目前已较少使用。

典型的标题词表有《工程标题词表》。

四、单元词语言单元词:又称元词,从自然语言中选取,经过规范化处理,表达主题概念最小的最基本的字面上不能再分的名词术语。

单元词语言:是一种后组式语言,选择单元词作为文献标识与检索的依据,在标引时不组配单元词,在检索时才对单元词下的文献号进行组配。

优点:①通过单元词的组配可表达大量专指概念和新概念,适应性强②不存在词序问题,每一个单元词都可作为检索入口;通过对单元词的增减,可自由扩大缩小改变检索范围③词表体积较小,编制修订工作量较小。

缺点:①单元词的字面分拆和字面组配容易造成语义失真②缺乏完善的参照系统,难以满足族性检索的需要③直观性系统性较差。

单元词语言目前已发展成叙词语言。

五、关键词语言关键词语言:直接从原文的标题摘要全文中抽选出来,具有实质意义的,未经规范化处理的自然语言词汇,是信息存储和检索依据的一种检索语言。

是适应目录索引编制过程自动化的需要而产生的。

原理:运用关键词语言编制的关键词索引,其关键词按字顺排列构成索引款目,所抽选的关键词都可以作为标引词在索引中进行轮排,作为检索入口词进行检索。

优点:①直观性强。

直接采用自然语言进行标引和检索,直观性强符合普通用户的检索习惯②检索途径多。

关键词法采用轮排方式,可实现多途径检索③标引简单。

关键词法使用计算机直接抽词进行标引,节省人力,对人员水平要求低④表达事物概念直接准确,不受词表控制,能及时反映新事物新概念。

缺点:①不揭示关键词之间的等级关系和相关关系,容易导致漏检影响查全率②难以进行族性检索③关键词采用机械抽词和轮排,可能导致不少关键词款目失去检索作用而徒增篇幅。

关键词语言只有与计算机相结合才能发挥其独特优势。

并通过编制禁用词表和关键词表的方式,提高关键词抽取的准确性和对词间关系的控制,提高检索效率。

相关文档
最新文档