信息组织的两种重要方法——分类法与主题法——尤世民 2014103565

信息组织的两种重要方法——分类法与主题法——尤世民  2014103565
信息组织的两种重要方法——分类法与主题法——尤世民  2014103565

分类法与主题法

一、分类法

分类系统分为聚类和归类两个子系统:聚类是指按照信息资源的特点和使用需要,通过区分和类聚建立起类目体系的过程;归类是指依据建立的分类体系进行类分信息资源的过程。聚类的结果是建立科学、合理的、类目体系,如各种文献分类法等,聚类是归类的前提条件,是分类组织的重要依据和工具;而归类系统则是聚类系统的具体应用,它体现了聚类过程的实际存在意义。

信息资源分类法的类型按照编制方式分为:等级列举式、分面组配式、列举——组配式。

(一)等级列举组配式

等级列举式分类法是一种将所有的类目组织成一个等级系统,并且采用尽量列举的方式编制的分类法。类目体系组成一个树状结构,按照划分的层次,列举详细类目,以缩格表示类目等级关系,最后形成一个等级链。常见的有《杜威十进制分类法》(DDC)、《中图法》等。

(1)杜威十进分类法(Dewey Decimal Classification,DDC)

杜威十进分类法是广为全球各地图书馆使用的分类法。这个分类系统最早在1873年时Melvil Dewey有此分类构想,而于1876年正式出版。负责DDC出版的是Forest Press,而它于1988年成为OCLC下的一个部门。

DDC已被全球超过135个国家的图书馆使用,并且被翻译逾30种语言,包括阿拉伯文、中文、法文、希腊文、希伯来文、意大利文、波斯文、俄文、西班牙文及土耳其文等。在美国,有95%的公共图书馆及学校图书馆、25%的学院及大学图书馆及20%的专门图书馆使用DDC。此外,DDC更能用来组织网际网络上的各种资源。

杜威十进制图书分类法于1876年首次发表,历经22次的大改版后,内容已有相当程度的修改与扩充。最新的版本为2004年版。该分类法以三位数字代表分类码,共可分为10个大分类、100个中分类及1000个小分类。除了三位数分类外,一般会有两位数字的附加码,以代表不同的地区、时间、材料或其他特性的论述,分类码与附加码之间则以小数点“.”隔开。例如330 表经济学+ .9 表地区别论述+ .04 表欧洲= 330.94 表欧洲经济学。

10大分类编辑

000 -计算机科学、资讯与总类

100 -哲学与心理学

200 -宗教

300 -社会科学

400 -语言

500 -科学(指自然科学)

600 -技术应用科学

700 -艺术与休闲

800 -文学

900 -历史、地理与传记

(2)中图法

《中图法》即中国图书分类办法,就广义而言,包括《中国人民大学图书馆图书分类法》、《中国科学院图书分类法》、《中国图书馆图书分类法》、台湾赖永祥仿十进分类法(所谓“中国图书分类法”)、《国际图书集成分类法》。就狭义而言,《中图法》是《中国图书馆图书分类法》的简称,是我国目前通用的分类图书的工具,读者掌握了这部分类法的有关知识,便能迅速、有效地查寻全国各图书馆的馆藏。

根据图书资料的特点,按照从总到分,从一般到具体的编制原则,确定分类体系,在五个基本部类的基础上,组成二十二个大类。《中图法》的标记符号采用汉语拼音字母与阿拉伯数字相结合的混合号码。即用一个字母表示一个大类,以字母的顺序反映大类的序列。字母后用数字表示大类以下类目的划分。数字的编号使用小数制。现将五个基本部类及下设的二十二个大类列表如下:

等级列举式分类法的特点为:分类结构显示直观,易于把握,便于使用;类目体系展开比较系统,并可作适当等级调整;标记简明,适于分类排架,适于组织分类检索工具。其缺陷在于:揭示专门主体能力差,具有一定的凝固性,不便于调整检索途径和多角度检索,无法根据科学发展自动生成新类,不能保持与科学同步;篇幅较大,管理要求较高。

(二)分面组配式分类法

分面组配式分类法是指在类目之间完全采用分面结构,将文献的内容分析为若干因素,从分面寻找相应的类号,并按照一定的次序将其排列组配成一个完整的分类号的分类法。最常用的分面组配分类法是冒号分类法(CC)和布里斯书目分类法(BC2)。

分类法的基本思想就是将事物分面,任何复合主题都可以分解为基本概念,同时,也可以通过相应的基本概念组合加以表达。分析——综合的原则贯穿分面分类法的始终,分面(组面)就是按照某种分类特征产生出来的一组分面类目。分面的依据主要是主题的范畴体系,分类学家对主题范畴的理解不尽相同。根据阮冈赞的范畴理论,范畴包括五个方面:(1)本体:表示事物对象或事物种类,例如,社会心理学和心理学中的人,宗教中的基督教、佛教等。

(2)物质:表示与主题对象有关的材料、载体等,例如音乐类中的乐器、图书馆类中的期刊等。

(3)动力或动因:涉及方面比较多,诸如形态、功能、问题、方法、操作、处理以及技术等,例如,经济类的出口、进口,语言学类中的语法等。

(4)空间、时间:在不同的基本类下,同一概念因情况变化,可归入不同范畴,例如,期刊在图书馆中归入物质,在目录学类中即是本体。

另外,我国还有一种常用的中文范畴理论引用次序进行分面,具体为:(1)主体因素;(2)通用因素;(3)位置因素;(4)时间因素;(5)文献类型因素。

分面组配法由分面类表、使用说明、大纲及索引组成,其中分面类表是具体,使用说明、

大纲及索引是其重要组成部分。每个大类由若干组面(范畴)构成分面公式,每一组面还可以由细分的亚面构成。如物质范畴还可以分为物质、物质性质、物质方法等;亚面下面还可以细分为类目。组面、亚面、类目系统排列,形成分类体系。

例如,冒号分类法中规定的42个大类,其中艺术大类分为建筑、雕塑、绘画、音乐、舞蹈、戏剧等基本类。雕塑又分为风格、形象、材料、技巧等组面;风格再分为亚洲风格、欧洲风格等许多种亚面。

大类内排列顺序按照每个大类的分面公式进行,每个大类的分面公式在同一分类法中遵循同一引用次序。

分面组配式分类法的表现形式为:类表中按范畴列出各种基本概念(组面),分别配以相应号码,据主题分析,选择基本概念及标识号码,将标识组合、排序(先后次序按照分面公式)。

例如,冒号分类法中“2图书馆学”类的分面公式为2[P];[M];[E];[2P],表示其组配次序为:图书馆类型面/资料面/操作面/学科面/时间面。“大学图书馆中的期刊流通工作”这一文献主题,用冒号分类法的类号是234;46:6。从类号可以看出它由三个组面组配而成,其中“2”表示图书馆学,“34”表示大学图书馆,“;46”表示期刊,“:6”表示流通工作。

分面组配法的特点为:标引专指,可以通过概念组配,表达复合主题;标记表达性强,便于调整标记次序,多途径检索,易于适应科学的新发展;类目篇幅较小,便于管理和修订。其不足为:分面类表体系不够直观;检索工具中的类目是组配而成的,类目分布不均衡;标引难度较高,专业素质要求较高;分面标记成分复杂,号码冗长,不宜用于排架。

(三)列举——组配式分类法

列举——组配式分类法是上述两种编制方法的结合,是一种在详尽类表的基础上,广泛采用多种组配式的分类法,亦称半分面分类法。

其特点为:以列举式列表为基础,有一定的直观性,广泛采用组配方式,可以达到分面类表同等标引水平;管理列表工作量大,组配符号标记复杂、冗长。该分类法当前以《国际十进分类法》(UDC)和俄国的《图书馆书目分类法》为代表。

二、主题法

主题法是指直接以表达主题内容的词语做检索标识、以字顺为主要检索途径,并通过参照系统等方法揭示词间关系的标引和检索信息资源的方法。主题法是信息资源的主题整序方

法,是主题标引语言的统称。其中,主题词是主题法的主体,主题标引是主题法在信息组织中的应用,因而,各种各样的主题词表是主题法发展演化的主体。

在我国,主题词表的发展在其数量上十分可观。例如,《中国中医药学主题词表》、《中国档案主题词表》、《中国分类主题词表》、《教育主题词表》、《汉语主题词表》、《大气科学主题词表》、《广州市人大公文主题词表》、《电力主题词表》、《烟草行业公文主题词表》、《军用主题词表》、《国家汉语主题词表》、《数学汉语主题词表》、《物理汉语主题词表》等。

以《中国档案主题词表》为例,该表由前言、说明、主表、范畴索引组成。前言介绍编制目的、过程,适用范围及收词数量;说明阐述选词原则、范围、结构体例及使用的一般方法等。主表亦称字顺表,是正文部分,共收录主题词27288条,其中正式主题词22759条,非正式主题词4529条。非正式主题词是主题词的同义词和准同义词,用来指引和查找正式主题词。词条款目按汉语拼音顺序并结合汉字字形排列。款目结构包括汉语拼音、款目主题词、注释、词间关系、范畴号,但没有英文译词。主表不分为社会科学和自然科学两大部分,而是作为一个整体,也未把组织机构、人名、行政区划名、地理区域等从主表中抽出另编附表。范畴索引亦称分类索引,即将全部主题词按概念属性划分成若干大小类目排列编制而成,与主表间由范畴号加以联系。分类类目最多设3级,是以《中国档案分类法》为基础并结合主题词词目属性而设置的。此外,主表前还设有“主表拼音音节索引”和“词目首字笔划检字表”,以便从不同角度去查寻主题词。

国内国外采用的主题法类型很多,一般都具有以下特征:

(1)直接选用自然语言中的词语进行标引和检索,而不是像分类法那样采用一种抽象的号码系统作为检索标识。

(2)以字顺为主要检索途径,通用性强。虽然主题法往往也采用按范畴、词族等方式组织主题词,但字顺方式始终是它的主要排检依据。我国的主题检索系统通常是根据汉字特点,按照拼音或笔画笔顺进行排检的;在采用机检系统的情况中,一般可以直接输入语词,由计算机进行查找,不必如使用分类法那样,必须预先了解主题词之间关系,因而通用性好。

(3)以特定事物、问题、现象即主题为中心集中信息资源。分类法由于受学科体系的限制,从不同学科角度研究同一对象的信息资源是分散在各知识门类中的,主题法则没有这一限制,而是直接从主题对象的角度揭示图书资料,这一特性是由语词标识和字顺排列决定的。以论述茶的文献为例,在分类法中,关于茶的种植、茶的焙制、茶的贸易等主题,一般应按学科分别归入农业科学、工业技术、经济等不同科学部门,而在主题法中,通过语词标

识和字顺排列,可以直接在“茶”这一主题下集中予以揭示。

(4)通过详尽的参照系统等方式揭示主题词之间的关系。

按照字顺排列不能必然揭示主题概念之间的联系,为了克服这一局限,主题法发展了完备的参照系统,通过在主题词下设置用、代、属、分、参等多种参照项,建立起“隐蔽的分类体系”。同时,一些系统还备有词族索引、范畴索引、轮排索引等多种辅助索引,通过各种形式的结合,在主题词之间建立起充分的语义联系。当然各种主题系统中对词间关系的揭示状况是不平衡的,就整体而言,其对主题之间关系的揭示不如分类法。

按照选词方法划分,主题法可以分为标题法、元词法、叙词法、关键词法四种。

(一)标题法

标题法是最早的主题法,是一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。其中,标题词是指经过词汇控制,用来标引文献的词或词组,通常是比较定型的事物名称,如图书分类法、信息组织、信息科学等。标题法的依据是标题表,目前最常用的是1909年诞生的《美国国会图书馆标题表》。

标题法的优点是:采用列举式词表,形式直观;采用定组式标题,结构固定,含义明确;按照词表列举的的标题和副标题进行标引,操作简便;通过参照方式对词汇进行控制,并揭示标题的相关性。

不足:由于采用列举方式,往往造成收词量巨大、专指度相对不足、修订量大等问题;采用定组式标题,无法从多角度多因素检索。

(二)元词法

元词,是指用来标引文献主题的、最基本的、字面上不能再分的语词。如马克思、图书馆等,元词法是以元词作为主题标识,通过字面组配的方式表达文献主题的主题法。复合主题通常是通过对元词的组配进行。如“塑料隔音板”需要“塑料”“隔音”“板”3个单元词组合。

元词法优点:词表体积小;标引专指度高;便于从不同角度检索;适合对专指主题进行标引。

不足:直接性差;不适宜用于查找基本单元主题的文献,如“经济”、“科技”等主题;采用字面组配方法,在与语义分解不一致时,容易产生误差;早期的元词法不建立参照系统,不利于相关资料的查找。

(三)叙词法

叙词,国内常称为主题词,是指经过规范化处理的、以基本概念为基础的表达文献主题

的词和词组。叙词法是以从自然语言中精炼出来的,经过严格处理的语词作为文献主题标识,通过概念组配的方式表达文献主题的主题法类型。叙词法以叙词表为依据,国外叙词表数量超过千种,国内超过130多种,目前常用的《汉语主题词表》。

叙词法与元词法的异同:

相同点:将分面分类中的组配引入主题法

差异:以概念组配取代元词法的字面组配,二者有本质区别,集体表现为:

(1)对语词单位的要求不同

概念组配要求词汇单位既能组配表达概念,又能独立表达概念,且在两种情况下概念表达应该一致,组配结果应该表达一个概念,因此,概念组配不要求一定是单词,也可是词组字面组配强调词汇单位的单元性,需是最小的单词,不能是词组,且单词独立表达概念的能力差,不能保证组配结果概念唯一性。例如,“隧道二极管”“雪崩二极管”“信息用户”均由于组配后表达的概念与拆分前表达的概念完全不同,而不能用于简单的字面组配。

(2)组配的原则方法不同

概念组配本质上是概念分析的基础上进行概念组合,因此,交叉是符合概念逻辑的组配即:组配结果所要表达的概念同参与组配的概念之间是有逻辑交叉关系的,具有上下位关系(种属或者整分关系)字面组配只进行语词的拆分和组合,符合语词规则,但不一定有概念逻辑关系偶尔有两者重合的时候,但属偶然,并非原理本身所致。

字面组配与概念组配实例分析:脑肿瘤、河北梆子、香蕉苹果、熊猫蚊香。

字面组配:

“脑肿瘤”--“脑肿瘤”-无误差

“河北梆子”--“河北梆子”-用“河北”检索有误差

“香蕉苹果”--“香蕉苹果”-用两个单词检索误差大

“熊猫蚊香”--“熊猫蚊香”-用单个词检索易产生歧义

概念组配:

“脑+肿瘤”-“脑肿瘤”

“河北地方剧+梆子”-“河北梆子”

“香蕉味水果+苹果”-“香蕉苹果”

“熊猫牌商标+蚊香”-“熊猫蚊香”

结字面组配只有与概念组配偶尔重合时误差小,因此概念组配在检准率上高于字面组配。

叙词法优点:结构完备,词汇控制严格;组配准确,标引能力强;检索效率高,可灵活组配,多途径检索;检索系统适应能力强,可同时适应手检和机检。

不足:词表编制和管理的难度大,需花费较多人力、物力;文献标引须在概念分析基础上进行,难度大,要求高。

(四)关键词法

关键词是指出现在文献中,并能反映主题的重要语词,一般是具有实质意义的语词(入口词)。关键词法是指将文献原有的,能描述其主题概念的那些具有实质意义的词抽出,不加规范化或只作少量的规范化处理,按字顺排列,以提供检索途径的方法。

关键词与单元词不同的是,单元词的同义词和近义词是经过优选的,关键词保持用词原状,甚至对同一词的单复数和变格等词形变化不加统一而保持原状;同义词、近义词、一个词的不同形态并存;所有的关键词都是平等的,全部按字顺排列;若干关键词结合构成一条索引款目;全部关键词在检索系统中却彼此孤立,无任何联系。

关键词法的优点:标引无需主题分析和查看词表,简便易行;标引和索引易实现自动化,保证信息更新的及时性;自然语词的使用,表现直观、专指。

不足:自然语词的采用,规范化程度低,易造成漏检;关键词法不显示等级关系和相关关系,不易族性检索;由于检索系统编制效率的需要,关键词多限于文献中抽取。特别是标题中,由于部分文献标题不能充分反映文献主题而发生漏检。

课堂发言记录:

一、第一次课堂讨论“图书馆是什么”、“图书馆的公共特征”、“图书馆的社会职能”、“美国公共图书馆的运行模式”“图书馆的类型”

图书馆,是搜集、整理、收藏图书资料以供人阅览、参考,为一定社会的政治、经济和文化服务的科学、教育、文化机构。公共图书馆内收藏学科广泛,读者成份多样。由国家中央或地方政府管理、资助和支持的、免费为社会公众服务的图书馆。它可以是为一般群众服务,也可以是为某一特定读者如儿童、工人、农民等服务的。它是人类社会文明发展的产物,向所有居民开放,机构来源于地方行政机构的税收,其设立和经营必须有法律依据。图书馆有保存人类文化遗产、开发信息资源、参与社会教育等职能。

我国图书馆主要分为四类:

(1)文化系统的公共图书馆。包括国家图书馆;省、市,自治区图书馆;区(市)、

县图书馆及文化馆图书室;儿童图书馆;乡镇街道图书室等。

(2)教育系统的学校图书馆。包括高等学校、专科学校图书馆;中小学图书馆(室)等。(3)科学院系统图书馆及科研机构图书馆。包括科学院及其分院图书馆;政府部门、各部所属研究机构的专业图书馆;机关团体图书馆(室)等。

(4)工会系统的工会图书馆。包括厂矿、企业等所属工会图书馆(室)等;工矿企业的技术图书情报图。

以上问题在参考所给文献,网上信息中很容易找到答案,意见很快就能同意,也没有太多讨论兴趣。讨论的时候比较关注的是图书馆未来的发展。虽然作为图书馆专业的学生,主观意愿还是图书馆在社会中所处的地位越来越重,能提供的工作机会越来越多,但面对现实,不得不承认信息技术对图书馆行业的冲击是非常巨大的,图书馆失去了信息中心的地位,传统图书馆必然面临一定的衰落。

这不是图书馆行业自己独有的问题,而是整个出版印刷面临的问题。从本质上讲,信息技术的进步带来的是信息载体的革新。纵观人类历史的发展,每一种新的信息载体的出现对原有载体都造成了毁灭性的打击,纸张的出现使得金器、简帛等原始载体退出历史舞台,同样,信息技术的出现对纸张的冲击也必然是巨大的。因而在未来的发展过程中,纸质书籍必然也会逐步退出历史舞台,由于数字资源存储传播的方便性,用户可以不经图书馆获得自己所需知识。图书馆面对这样的挑战,必须要走在时代的前面,在我看来,图书馆应该着手于数据中心的建设。对于馆藏图书,只需保存两套经过校订的可信的版本作为凭证,在借阅使用方面只要电子版就好。目前鉴于经济、技术原因,电子终端不能完全普及,但随着时代的进步,在不久的未来,实现起来应该并不困难。

第二次讨论:

拿到第二次的讨论材料,便到百度,知网、万方数据库等数据库进行检索,很快就发现了老师的文章,看到文章里的概括,确实很难概括的比这个更好,所以很快就可以找到答案,就是老师文章里的观点,其实发现这篇文章后,就很难讨论下去了。

印象深的是这篇文章,布什丰富的知识,长远的眼确实值得敬佩,这种人是现象级的,他们的出现是人类文明的幸运。

相关主题
相关文档
最新文档