第四章-主题法
文献检索课件

自然语言与受控语言
自然语言:书面语言----关键词 优势:可以减少概念间转换产生的误差。检索入口词多,操作简单、 方便、灵活,适用范围广。 劣势:选词不规范,词量过大,影响主题的集中,查准率降低;不 能控制多义词,使相关主题内容的文献分散,查全率降低。不能反映概 念间的各种对应关系与隐含关系。 受控语言:对语义、句法进行控制,是一种规范化的人工语言。-----分 类号、主题词 优势:文献描述和表达概念具有唯一性、专指性,便于提高查准率; 标引时可以集中相关文献,提高查全率;能显示概念间的各种关系,有 利于及时调整检索策略。 劣势:存在标引难度大、速度慢、词汇更新滞后、对标引和检索人 员要求过高。
主题词、副主题词组配
MESH目前有82个副主题词与2万多个主题词组配。副主题词的使用有严 格的限制。 副主题词(Subheadings)又称限定词,与主题词进行组配,对某一主题 词的概念进行限定或复分,使主题词具有更高的专指性。 如:诊断(Diagnosis,DI)、药物治疗(Drug Therapy,DT)。 有关中医的副主题词有:按摩疗法, 气功疗法, 穴位疗法, 针灸疗法, 中西 医结合疗法, 中医病机, 中医药疗法, 中药疗法, 中医疗法。 在检索中,主题词与副主题词的组配(主题词/副主题词)须有逻辑关 系。 如:阿司匹林治疗感冒 阿司匹林/治疗应用;感冒/药物疗法。
主题组织语言:主题法组织语言是一种描述性语言,
用语词直接表达文献的主题。这些语词按字顺排列成 主题词表,以此作为标引检索的工具。如:《美国医 学主题词表》(Medical Subject Headings, MESH)、 中医药学主题词表
第四讲_主题法与主题标引(新)

第四讲主题法与主题标引一、主题法的概念所谓主题法就是直接以表达文献的语词作为检索标识,以字顺为主要检索途径,并通过参照系统等方法揭示词间关系的标引和检索文献的方法。
所谓主题,通常指文献论述的对象,包括事物、问题、现象等。
而经过选择,用来表达文献主题的语词,称为主题词。
――《文献分类法主题法导论》/马张华,候汉清编著,北京图书馆出版社,1999.7二、主题法的特征:目前各国采用的主题法存在多种形式,但一般都具有如下特征:1.都是以特定的事物、问题、现象,即主题为中心集中图书资料的。
主题法不象分类法那样需要受学科体系的限制,而是直接从主题对象的角度揭示图书资料的。
2.都是以语词作为检索标识的。
3.都是以字顺方式作为主要检索途径的。
虽然根据揭示词义关系的需要,主题法也采用范畴、词族等方式组织主题词,但字顺方式始终是它的主要排检依据。
4.一般都是通过详尽的参照系统等方式揭示主题词之间的关系的。
为克服字顺排列不能揭示主题词之间联系的局限,主题法发展了完备的参照系统,并备有词族索引、范畴索引、轮排索引等多种辅助索引,从而在主题词之间建立起充分的语义联系。
5.主要是用来处理文献资料、编制各类检索工具及检索系统的。
分类法通常用以组织文献排架和组织分类检索工具;主题法则一般不用于组织图书,只广泛用于组织各种检索工具,不仅可以利用它编制各类供手检使用的书目索引,也可以用来建立计算机检索系统,进行机械检索。
三、主题法的类型主题法的类型可以有许多不同的划分方法,按照主题词的选词方式,习惯上可以分为标题法、元词法、叙词法、关键词法;按照其使用时组配的先后,则可以分为先组式主题法和后组式主题法。
1.标题法标题法是最早出现的一种主题法类型。
它是一种以标题词作为文献主题标识的标引和检索的主题法。
所谓标题词,亦称标题,是指经过规范化处理的,用来标引文献的词或词组,通常为比较定型的事物名称。
标题法是一种在手工检索工具的基础上发展起来的,采用列举方式的主题法。
信息检索名词解释

1)信息检索(information retrieval) 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
所以,它的全称又叫信息存储与检索(information storage and retrieval), 这是广义的信息检索。
狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。
相当于我们所说的信息查询(information search)。
2)零次文献:也叫灰色文献,未经公开发表或未交流于社会的文献。
如私人笔记,设计草图、实验记录、文章草稿、会议记录、书信文书、以及档案等。
其主要特点是内容新颖,但不成熟,不公开交流,难以获得。
3)一次文献(Primary Document): 以著者本人的研究或研制成果为依据而创作或撰写的文献,习惯上称做原始文献。
如期刊论文、科技报告、专利说明书、会议论文、学位论文等。
体现创作性。
其主要特点是内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大、分散。
4)二次文献(Secondary Document):就是检索工具。
是将大量分散的无组织的一次文献经浓缩,整序的加工整理,编辑成目录、题录、文摘、索引等检索工具或数据库。
如文摘,目录、索引等。
它有存贮、检索、报道的功能。
体现高度的浓缩性。
其主要功能是检索、通报、控制一次文献,帮助人们在较少时间内获得较多的文献信息。
二次文献具有汇集性、工具性、综合性、交流性等特点。
5)三次文献(Tertiary Document):在一、二次文献的基础上,经过综合分析而编写出来的文献,如专题述评、动态综述、学科年度总结,进展报告以及数据手册、百科全书等参考工具书。
三次文献是情报研究的产物和成果。
具有很强的的综合性。
总之,一次文献(创造性),二次文献(有序化),三次文献(高度浓缩,提炼,再创造)。
6)以上四个级别的文献中,零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不作为我们利用的文献类型。
信息组织知识

知识要点第一章绪论1、什么是信息组织?(理解)信息组织:对信息资源对象进行收集、加工、整合、存储使之有序化、系统化的过程。
2、信息组织的发展阶段——按组织对象划分(理解)按组织对象划分信息组织经历了三个阶段:文献组织阶段、信息组织阶段、知识组织阶段文献组织阶段——组织对象:传统文献实体,不涉及文献内容本身。
信息组织阶段——组织对象:从广度上,以纸质信息为中心转向以电子媒介信息为中心;从深度上,除了对文献实体进行组织,还要深入信息内容。
知识组织阶段——组织对象:从显性知识扩展到隐性知识。
知识组织直接给用户提供直观的、可操作的系统化知识。
不再局限于利用片面的信息来满足用户的需求,而是对用户的需求系统分析,向用户提供全面、完善的解决方案。
按职能划分信息组织经历了三个阶段(补充):清册职能时期查检职能时期组织职能时期3、网络信息组织的基本方法(掌握)①文件方式•一般用于局域网内的非结构化信息组织。
•优点:通过FTP协议进行传输,简单方便•缺点:以文件为单位共享和传输信息会使网络负载越来越大②自由文本方式•主要用于全文数据库的组织•对非结构化的文本信息进行组织和处理的方式•能够完整地反映出一次文献的全貌•通过计算机自动进行文献信息的处理和组织,支持全文检索。
③数据库方式•一般用于结构化/规范化信息组织。
•优点:最小存取单位是字段,从而大大降低网络数据传输的负载。
•缺点:对非结构化信息处理难度大•数据库方式是当前普遍使用的网络信息资源的组织方式。
④主页方式•网页一般通过HTML语言规则将文本、图像、声音、视频等各种类型的信息集合在一起。
⑤超文本方式⑥主题树方式•主题树方式是一种可供检索和查询的等级式主题目录。
它以人工方式或半自动方式搜集信息,然后将信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织。
•主题树方式不太适合大型的综合性的网络信息资源系统,而较适合专题指引库的建立。
⑦搜索引擎方式⑧指引库方式• 指引库,也称导航库。
信息组织重点

第一章1. 什么是信息组织?P1信息组织,亦称为信息资源组织,是根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、标引、处理,使其成为有序化集合的过程。
2. 数据数据是原生态的,即未经过处理的。
信息则是经过人类处理的数据。
3. 检索工具的类型 P6按照系统中所用的标识是否进行控制,检索工具可以分为受控检索系统与自然语言检索系统两种。
按照系统中标识组配的特点,检索系统可以分为先组式和后组式两种。
4. 检索语言检索语言是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称为情报检索语言。
5. 信息组织的研究领域总体上包括三个层次。
a) 理论层面:研究信息组织的基本规律和理论基础,为规范层面和方法层面提供理论指导。
b) 规范层面:研究信息组织的基本规律和理论基础,为规范层面和方法层面提供理论指导。
c) 方法层面:指信息资源组织技术方法,包括操作的技术方法、信息组织的管理、具体标引规则、描述规则等。
其作用是按照信息资源组织的要求进行操作、实现信息资源系统的组织。
第二章1.检全率亦称查全率、命中率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检索系统中与该提问相关的实有信息资源总量之比。
2.检准率亦称查准率、相关率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检出的信息资源总量之比。
3.对词汇的控制通常包括:①同义控制;②词义控制;③词间关系控制;④还包括词量控制,词组选择和使用的控制,以及专指度控制等。
4.常用的相关因素包括:引用关系、链接关系、用户需求。
5.相容关系是指至少有一部分外延相同的概念之间的关系,包括:①同一关系;②包含关系;③交叉关系。
6.不相容关系是指不存在共有外延的概念之间的关系,包括:①矛盾关系;②反对关系;③并列关系。
第三章1.信息描述的含义:是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质资源形态等进行分析、选择、记录的活动。
第四章 教学策略

维恩图案例
大树
1、生长在土壤里; 2、需要阳光和水分; 3、植株高大; 4、茎粗、很硬; 5、有根、茎、叶; 6、有的会开花、结果、有种子; 7、多年生、寿命长
大树和小树
小草
1、生长在土壤里; 2、需要阳光和水分; 3、植株矮小; 4、茎细、较软; 5、有根、茎、叶; 6、有的会开花、结果、有种子; 7、一般一年生、寿命短
(四)小组合作学习教学组织的一般流程
小组合作学习模式实质上是一种团体的探 究性学习,小组合作学习教学组织的一般 流程如下:
小组合作学习教学组织的一般流程
1.班级授课
为合作学习的准备,主要为复习回顾、新课导入、学 习目标明确、确立合作内容,然后预测合作的可行性 以及必要性,确保合作有价值、学习小组任务的分配 等。 组内异质合作,4-8人组成,课前完成分组,要确保组 间同质,以利组间公平竞争与评价。 学生根据合作内容和合作伙伴的特长,制定好合作计 划,对每个小组内各成员都要明确分工,每个学生都 要明确自己在小组内的任务,协调合作,确保合作有 序不乱。 协调互动,组内要有实质性合作与交流。达到预期效 果,获取科学知识,体验与人合作的乐趣。 汇报总结合作的结果,共同探讨出科学的结论。重视 对学习小组成果的评价,特别关注个体对小组学习成 果的贡献以及与这一小组成果评价的关系。
用问题表示的气泡图
冬天树有什 么变化?
冬天的池 塘发上什 么变化?
怎么知道
冬天来了?
冬天动物 发生什么 变化?
在冬天大 堤发生什 么变化?
冬天的天 气怎样?
气泡图案例
双泡图——对比关系
特有的特性 共有的特性
动手做一做:
试画一个网球和篮球的双泡图
3、概念图的种类
信息组织的两种重要方法——分类法与主题法——尤世民 2014103565

分类法与主题法一、分类法分类系统分为聚类和归类两个子系统:聚类是指按照信息资源的特点和使用需要,通过区分和类聚建立起类目体系的过程;归类是指依据建立的分类体系进行类分信息资源的过程。
聚类的结果是建立科学、合理的、类目体系,如各种文献分类法等,聚类是归类的前提条件,是分类组织的重要依据和工具;而归类系统则是聚类系统的具体应用,它体现了聚类过程的实际存在意义。
信息资源分类法的类型按照编制方式分为:等级列举式、分面组配式、列举——组配式。
(一)等级列举组配式等级列举式分类法是一种将所有的类目组织成一个等级系统,并且采用尽量列举的方式编制的分类法。
类目体系组成一个树状结构,按照划分的层次,列举详细类目,以缩格表示类目等级关系,最后形成一个等级链。
常见的有《杜威十进制分类法》(DDC)、《中图法》等。
(1)杜威十进分类法(Dewey Decimal Classification,DDC)杜威十进分类法是广为全球各地图书馆使用的分类法。
这个分类系统最早在1873年时Melvil Dewey有此分类构想,而于1876年正式出版。
负责DDC出版的是Forest Press,而它于1988年成为OCLC下的一个部门。
DDC已被全球超过135个国家的图书馆使用,并且被翻译逾30种语言,包括阿拉伯文、中文、法文、希腊文、希伯来文、意大利文、波斯文、俄文、西班牙文及土耳其文等。
在美国,有95%的公共图书馆及学校图书馆、25%的学院及大学图书馆及20%的专门图书馆使用DDC。
此外,DDC更能用来组织网际网络上的各种资源。
杜威十进制图书分类法于1876年首次发表,历经22次的大改版后,内容已有相当程度的修改与扩充。
最新的版本为2004年版。
该分类法以三位数字代表分类码,共可分为10个大分类、100个中分类及1000个小分类。
除了三位数分类外,一般会有两位数字的附加码,以代表不同的地区、时间、材料或其他特性的论述,分类码与附加码之间则以小数点“.”隔开。
信息检索第四章 工具书概述

第四章工具书概述4.1工具书及其概念1、检索工具概述(1)检索工具的定义、特点检索工具是指用以存储、报道和检索文献的工具。
因此,它具有存储和检索的功能。
一般必须具备四个条件:①必须详细著录文献的外部特征和内容特征;②必须具有既定的检索标识,如主题词、分类号、著者姓名和文献序号等;③必须根据标识的顺序,系统地、科学地排列文献,使其成为一个有机的整体;④能够提供多种检索途径。
(2)什么是工具书?(定义见课件)2、工具书的特点:工具书的功用:它以其高密度的知识性、高精度的资料性、高效率的检索性和高频率的查考性成为人们学习和工作必备的工具。
总的来说它的功用是:指示读书门径,解决疑难问题,提供参考文献,节省时间精力。
3、工具书的类型:(1)检索工具的类型根据不同的划分标准可以分为不同的类型。
按收录的范围分:综合性、专业性、单一性型;按出版与载体形式分:印刷型(又分期刊、单卷和附录)、卡片型、磁带型、光盘型和缩微型;按著录方式分:目录、题录、文摘(这是最常见的划分方式);按检索方式分:手检、机检;按编著方式分:书目、索引、文摘、辞书、年鉴、百科全书。
在这里,为了便于掌握应用,我们依据检索工具的出版形式、汇编内容和所完成的检索类型,把检索工具书分成两大类型:提供知识的参考性工具书和提供文献线索的检索性工具书。
(2)参考工具书及类型:参考性工具书包括辞书、类书、政书、百科全书、年鉴、手册、表谱、图录、名录等。
(3)检索工具书及类型:检索性工具书包括书目、索引、文摘等。
(4)参考工具书与检索工具书的区别:二者既有联系又有区别:内容都是知识的高度浓缩和积累,但检索性工具书是对文献的特征做简赅(gāi该)的记载,属于二次文献的范畴,而参考性工具书则主要对知识进行精要的说明,属于三次文献的范畴;二者多是以纸张为载体的出版物,但前者多为期刊形式,出版周期短,及时性较强,而后者主要是图书形式或年鉴一类连续出版型的,出版周期长,稳定性较强;二者都是以供人查寻为目的,但前者提供的情报只是有关文献的线索,必须根据这些线索再查原谅,而后者提供的情势是具体的事实和数据,检索的结果可以直接利用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
到置标题:美洲野猪,成化石的;化学,有机; 化学,无机;地图,统计学的;知识,社会 学的。 自由浮动短语标题: [Personal name] in fietion,drama,poetry, etc.小说、戏剧、诗歌中的某人 [Topic or place] in literature 文学作品中的某论题或某地 [Topic or place] in art 艺术作品某论题或某地 [Name of river] Watershed 某河流分水界
• ⑴规定语词形体,当一个汉字存在几种形体,如 繁简体、异体或未正式公布的简体时,一律以通 行的字体为标准,如,储液池(正式叙词),贮 液池(非正式在外文名词术语更为通 行时,也可直接选用。例如:FORTRAN语言、 BASIC语言、A射线、BCS理论,数字在汉表中 视具体情况,有两种形式一是汉字形式,二是阿 拉伯数字形式,但同一概念只能选用一种形式表 达。 四氧化三铁、铀235、135照相机等
• ⑶规定标点符号的用法,一般只在必要时使用括 号、连线、小圆点等符号,其他标点符号除特殊 情况外,概不使用。如:静态分析(经济学)、 发射管(电子)、九.一八事变、气体—固体界 面等均为正式主题词 • ⑷规定词序,收入词表的复合词一般均采用自然 语序,不使用倒置形式。例如用院校图书馆不用 图书馆,院校;用控制计算机不用计算机,控制。 倒置形式在必要时可作为非叙词收入词表,用于 指向相应叙词。
• ④对一词组以组配表达产生二义性时,可适当选 用词组,如:工业橡胶一词,以工业与橡胶组配, 可以工业橡胶和橡胶工业两种意义,一般直接选 用 • ⑤专有名词一般可直接选用,不与分解,例如广 州图书馆,北京大学 • ⑵不选用词组作叙词的规则 • ①可分解为两个或多个交叉关系的语词的复合词, 如:生物遗传学可分解为 生物学 和遗传学两个 表示交叉关系的语词,喷气式垂直降落飞机可分 解为喷气式飞机和垂直起落飞机两个表示交叉关 系的语词,不应直接选用
• ⑵叙词语言对其他检索语言原理方法的吸收 • 叙词语言在继承和发扬元词语言的积极因素基础 上,还吸收并综合了多种检索语言的原理和方法, 主要表现为: • ①采用了分面组配分类语言的概念组配来取代单 元词语言的字面组配 • ②适当采用标题语言的预先组配,选用必要的词 组,放弃元词语言的标识单元性原则 • ③采用标题语言和单元语言对语词实行严格控制 的方法,以保证概念表达的唯一性
• ⑤有科学术语与文献类型名称组成的复合词,如 计算机词典、固体物理书目等
• 二、词形控制和词义控制 • 1、词形控制 • 自然语言中存在大量涵义相同或大致相同,但字 面形式不同的语词。在叙词语言中,则要通过词 形控制,消除这种现象。因为,这种现象的存在, 会降低叙词检索系统的检全率,也会给叙词的字 顺排检带来不便。所以,叙词语言对叙词形式必 须进行严格控制。汉表词形控制的主要内容有:
• 2、词汇类型 • 叙词表选词以名词为主,必要时也收入少量形容 词。按照反映事物概念数量的不同,收入词表的 语词可以分为普通名词和专有名词两种。普通名 词是叙词表的基本构成成分,其选词范围包括: ⑴表示具体事物的名词术语,如商品、信息资源、 汽车、车床、电子计算机、细菌、水稻、原子、 反应堆、图书馆、宇宙、海洋等 • ⑵表示事物材料的名词术语,如塑料、橡胶、人 造纤维、感光材料等。 • ⑶表示事物性质、现象、状态、过程等方面的名 词术语,如导电性、耐用性、失真、老化、土壤 熟化、日冕、船舶过载、腐蚀等
• ②由事物与其方面,包括材料、属性、操作等的 概念构成的复合词,一般应予以分解,如水电站 设计,用水电站+设计;水稻生长习性,用 水稻 +生长习性 • ③由事物与其部分构成的复合词,一般用表示事 物整体的词与表示部分的词表示。如:车床润滑 系统,用车床+润滑系统,飞机座舱用飞机+座舱 • ④由专有名词如国家名、地区名、时代名、人名 的与其他主题概念组成的复合词,如中国石油工 业,李白诗歌创作。但是由专有名词与其他词组 成的专门名词除外,如弗洛伊德误差、阿贝尔扩 张等应直接选入。
• • • •
特征: 1、直接以词语为检索标识 2、以字顺为主要检索途径。 3、以特定的事物、问题、现象,即以主题 为中心集中信息资源。 • 4、往往通过详尽的参照系统等方式揭示主 题词之间的关系。 • 5、主题法在信息资源组织中的作用,主要 是用来处理信息资源、编制各种检索工具 及检索系统。
• 字顺主题索引实例(3种方式) • ⑴根据藏书类目的类名编制的,而不是根据该 类目所收录的每种藏书做成的 • 《郭沫若文集》主题索引款目为 • 文学-作品综合集-中国-现代-别集 I217.2 • 《矛盾文集》主题索引款目为 • 文学-作品综合集-中国-现代-别集 I217.2 • ⑵根据每种藏书编制的,但著录的也是分类号, 仍是指向整个类目 • 《郭沫若文集》主题索引款目为 • 郭沫若-文学-作品综合集 I217.2 • 《矛盾文集》主题索引款目为 • 矛盾-文学-作品综合集 I217.2
第二节 叙词语言的词汇控制
• 一、词汇选择 • 为了保证词汇的选择质量,叙词表对词汇选择原则以及 词汇的类型、范围都有明确的规定 • 1、词汇选词原则(大的框框) • 为了保证词汇选择的质量,汉语叙词的选择一般遵守下 述原则 • ⑴叙词的选择,应依据标引和检索的实际需要,并考虑 学科或专业领域的现状及发展。选定的词汇,应是在文 献检索中有一定使用频率、并能汇集一定文献量的名词 术语。对于表达新事物、新学科的语词,应根据其现实 需要,结合其发展情况,加以选用。
• • • •
表示特定事物的专有名词 ⑴地名,如广东省、中国、亚洲、泰山等 ⑵民族名和语言名,如汉族、壮族、英语、俄语 ⑶时代或年代名,如明代(1368-1644)、二十 一世纪、1997等 • ⑷人名,如孙中山、李时珍 • ⑸机构、会议等名称,如北京大学、中央电视台、 联合国、奥林匹克运动会 • ⑹产品名称,如F-16战斗机,南京长江大桥
• 3、叙词法,也叫叙词语言,国内亦称主题词,是从自 然语言中精选出来的、经过严格处理的语词作为文献主 题标识,通过组配方式表达文献主题的主题法类型,通 过规范化处理的,以基本概念为基础的表达文献主题的 词或词组。是对单元词语言的直接继承,但克服了单元 词语言的不足,吸收并综合了多种标引语言的原理和方 法,是能结合计算机使用的后组式语言,是目前主要的 受控语言。
• ④采用并进一步完善了标题语言的参照系统 • ⑤采用等级列举式分类语言的原理编制叙词分 类索引(范畴索引)和等级索引(词族索引), 甚至引入等级列举式分类表实现分类主题一体 化 • ⑥采用关键词语言的轮排方法,编制轮排索引 • 教材上有表
• ⑶叙词的概念组配类型 • ①交叉组配 • “心理学”和 “教育学”组配表达“教育心 理学” • “电视机”和“录像机”组配表达“电视录 像机” • “水生动物”和“哺乳动物”组配表达“水 生哺乳动物” • ②方面组配 • “汽车”和“发动机”组配表达“汽车发动 机”
4 5 6 7 064 055 076
8
9 029
标引
0 1 010 040
2 3 002
4 5 6 024 055
7 8 007
9 039
• ⑵元词法的特点: • ①词表体积小(没有先组词)②标引专指度高(通过灵 活组配形式表达主题)③便于从不同主题角度检索(以 每个元词作为检索入口)④适合对专指主题进行标引 • ⑶元词语言的不足
• 如:Culture in literature • 文学作品中的文化 • Horses in art • 艺术作品中的马
• 2、元词法,也叫单元词法、元词语言 • ⑴元词法的后组使用方式
主题
0 1 2 030 021
分类
3 4 033
5 6 035 055
7 8 007
9 019
0
1
2 3 002
• ⑺历史事件名称,如辛亥革命、海湾战争、 第二次世界大战等 • ⑻法规、条约名称,如中华人民共和国教 育法、中日和平友好条约(1978)等 • ⑼文献名称,如《资本论》《红楼梦》等
• 3、先组词的选择 ⑴应该选用词组(先组词)作叙词的规则 ①词表涉及领域中使用频率较高的常用词组, 一般直接收入词表,如化学工业、高等教育,国 际贸易政策、情报检索语言、数据处理等,均直 接选入 • ②一组词分解后其单词的含义会发生变化,产生 二义性时,直接选用词组,如燃料电池、全面战 争二词分解后,燃料、全面二词的含义发生变化, 应直接选入。 • ③凡有词组分解后其中的一方失去意义,没有实 际检索价值,应直接选用词组。如回溯检索、台 面二极管二词分解后,回溯、台面两词没有实际 检索意义,应直接选入
• ⑷表示研究方法、工艺、加工技术、操作等方面 的名词术语,如调查、总结、铸铁、热处理、爆 炸成型、抽样调查、有限元法、质量管理、经济 核算等。 • ⑸表示学科门类、技术部门、理论、定理等的名 词术语,如哲学、伦理学、生物学、图书馆学、 经济学、遥感技术、水利工程、对立统一规律、 万有引力定律等。 • ⑹表示文献类型的名词术语,如词典、年鉴、百 科全书、期刊、索引等 • ⑺某些具有构词功能的词,如台式、小型、多用 途等
• ⑶根据每种藏书编制的,著录的是索书号,即 指向类目中具体的藏书 • 《郭沫若文集》主题索引款目为 • 郭沫若-文学-作品综合集 I217.2/G815 • 《矛盾文集》主题索引款目为 • 矛盾-文学-作品综合集 I217.2/M378 • (不是主题目录,没有每种藏书基本编目数据, 花费人力和经费较少,与主题目录相比,其主 题检索功能相差不少)
• ⑵选择的语词应该念明确,一词一义,符合科学 性、通用性的特点,适宜于准确地表达文献主题 和检索提问。对于自然语言中的同形异义词、多 义词一般不予选入,在确实需要时,应通过限定 的方法加以使用。 • ⑶语词的选择应符合叙词概念组配的特点,要求 既能发挥组配的优越性,又能兼顾词汇的专指性, 在收入单词的同时也收入一定数量的具有造词功 能的词和词组。 • ⑷选定的语词应符合汉语的构词特点,在词形上 符合语词标识的要求,并尽量选用便于字面成族 的词。