信息组织知识
信息组织复习资料

第一章一.信息组织的含义信息组织,即信息序化或信息整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用与信息的有效流通和组合。
序是事物的一种结构形式,是指事物或系统的各个结构要素之间的相互关系以与这种关系在时间和空间中的表现。
二.信息组织在信息资源建设中的地位与作用1.信息资源建设的基本内容与环节包括信息的采集,组织,开发和利用。
信息组织在其中属于关键因素,处于关节点的地位。
现在社会信息的基本特征是庞杂性和分散性,人们对信息需求的特点是专业的高度选择性,内容的精良性,时间的紧迫性。
2.信息组织是一个信息增值过程。
3.信息组织是信息生命周期管理思想的最积极,最活跃的因素,做好信息组织工作,会促进信息流通,发挥信息效用,使信息流形成良性循环,使信息在时间上更快速的传播。
4.信息组织是信息检索利用的基础。
三.信息组织的发展阶段1.清册职能时间:它主要通过对信息的记录和登载,如同“信息账房先生”,告诉人们有什么信息而已。
2.查检职能时期:信息组织活动不仅告诉人们有什么信息,而且告诉人们怎样找到信息。
3.组织职能时期:利用计算机技术,通信技术和网络技术已经不满足告诉人们有什么信息和怎样找到信息。
它不仅可以告诉人们我们这里有什么信息,而且还可以告诉人们其他地方有什么信息。
人们还可以知道什么信息适合于自己,可以多途径多角度地查检信息。
四.信息组织的理论基础系统论,耗散结构理论和协同论使信息组织有了理论基础。
五.信息组织的方法基础语言学,逻辑学,知识分类是信息组织的方法基础。
要把庞杂分散的信息组织成有序优化的整体,就必须建立符号系统,但都和自然语言一样,有着共同特征:有语词,有词汇,有语法,这就是信息组织的语言学基础。
知识分类是一门研究知识体系结构的学问。
六.信息组织的基本方法信息的外在特征和内容特征,它们是信息组织的基本对象和管理依据。
信息组织重点

第一章1. 什么是信息组织?P1信息组织,亦称为信息资源组织,是根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、标引、处理,使其成为有序化集合的过程。
2. 数据数据是原生态的,即未经过处理的。
信息则是经过人类处理的数据。
3. 检索工具的类型 P6按照系统中所用的标识是否进行控制,检索工具可以分为受控检索系统与自然语言检索系统两种。
按照系统中标识组配的特点,检索系统可以分为先组式和后组式两种。
4. 检索语言检索语言是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称为情报检索语言。
5. 信息组织的研究领域总体上包括三个层次。
a) 理论层面:研究信息组织的基本规律和理论基础,为规范层面和方法层面提供理论指导。
b) 规范层面:研究信息组织的基本规律和理论基础,为规范层面和方法层面提供理论指导。
c) 方法层面:指信息资源组织技术方法,包括操作的技术方法、信息组织的管理、具体标引规则、描述规则等。
其作用是按照信息资源组织的要求进行操作、实现信息资源系统的组织。
第二章1.检全率亦称查全率、命中率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检索系统中与该提问相关的实有信息资源总量之比。
2.检准率亦称查准率、相关率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检出的信息资源总量之比。
3.对词汇的控制通常包括:①同义控制;②词义控制;③词间关系控制;④还包括词量控制,词组选择和使用的控制,以及专指度控制等。
4.常用的相关因素包括:引用关系、链接关系、用户需求。
5.相容关系是指至少有一部分外延相同的概念之间的关系,包括:①同一关系;②包含关系;③交叉关系。
6.不相容关系是指不存在共有外延的概念之间的关系,包括:①矛盾关系;②反对关系;③并列关系。
第三章1.信息描述的含义:是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质资源形态等进行分析、选择、记录的活动。
信息组织知识点汇总

信息组织知识点汇总Happy First, written on the morning of August 16, 2022信息组织知识点汇总第一章第一节、信息组织的必要性1.信息组织:根据信息检索的需要;以文本及各种类型的信息资源为对象;通过对其内容特征等的分析、选择、标引、处理;使其有序化并以适当方式加以提供的活动..2.信息检索:根据检索需要;从检索系统中检出相应信息资源的过程..3.信息资源:通常指一切以记录形式存在的信息载体;只是比较而言;更侧重于对新型媒体形式的强调..可以是图书、期刊、报纸、论文;也可以是网络上的电子资源4. 信息组织与信息检索有什么关系1信息组织是信息检索的基础和前提;只有对信息资源进行处理和有序化信息系统之后;才能准确有效查找相关信息资源;2信息检索则是信息组织出发点与归宿;用户的检索需要是组织信息的主要依据..第二节、信息组织的形式和检索途径1.文献组织的基本排列方式:一般有两种基本排列方式;其一为:固定排列法和按一定意义的次序排列..固定排列法;如档案、博物馆的收藏、光盘、录音带、缩微品..按一定意义的次序排列;如图书、期刊等2. 按照检索工具的对象和特点;可以分为文献目录、索引、机读数据库、网络搜索引擎四种类型..3. 按照标识特征;检索工具可以分哪两种基本类型1以信息资源的外部特征形式特征为检索依据;提供以信息资源形式特征为标识检索途径..常见的信息资源形式特征有责任者名即作者和与资源形成相关的人或机构;如译者、改编者、修订者等、题名、机构名、标准书号、专利号、文献登录号或顺序号等..2以信息资源的主题内容特征为检索依据;提供从资源内容进行检索的途径;主要有分类法、主题法..4.按照系统中所用的标识是否进行控制;检索工具可以分为受控检索系统与自然语言检索系统..5.按照系统中标识组配的特点;检索系统可以分为先组式和后组式两种..6.检索工具还可以按照采用的形式;分为卡片式、书本式、缩微式、电子方式等..第三节.信息组织的处理方式和研究内容1. 检索语言:一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统;也称情报检索语言..2.知识组织系统:知识组织系统通常指经过组织的知识结构表达的工具;它试图包含组织信息和促进知识管理的各种类型的词表;其范围从传统的地名表、同义表;到新型的知识组织工具..3.信息处理的基本做法:领会1描述信息资源;以便识别与确认它;主要方法是着录、编写题录和资源形式特征的描述;2浓缩信息资源内容;主要方法是编写内容提要或文摘;供用户了解、选择和判断信息资源;3提供检索点..主要方法是确定特定资源的标索特征或标识与可检信息..信息资源的检索点有代表其内容特征和形式特征的各种标识;如题名、责任者、分类号、主题词或关键词等4.信息组织活动的内容:领会信息组织活动包括两个基本方面:1信息组织的操作..指根据信息资源的内容和特征;对信息资源进行描述、标引、并将其组织进相应系统的过程..2信息资源的组织规范..这是根据信息组织的需要;按照信息资源的特点预先确定的规则和方法系统;是进行信息组织操作的依据..第二章信息组织原理第一节对信息组织的要求1. 检全率:是指一次检索中检出的与提问相关的信息资源数量占系统中所有与提问相关的信息资源数量的比例;检全率=检出的相关信息资源量/系统中相关信息资源总量子数×100%2.检准率;是指检出的相关信息资源的数量;占检出的全部信息资源数量的比例..检准率=检出的相关信息资源数/检出的信息资源总数×100%3. 简述对信息组织的要求..领会1检全率..略2检准率..略3检索速度和系统的及时性..检索速度是指用户从实施检索到得到结果化费的时间;它是衡量系统检索速度与使用效果的重要参数..它与系统响应检索的能力、检全率、检准率、资源组织的全理性等因素有关..系统的及时性是指检索工具处理信息和提供信息所用时间较短;能快速纳入、处理和提供信息..4系统易用性..是指标引人员使用检索系统描述、标引资源是否方便和易用;用户使用系统的简易性、方便性与获取信息的容易程度..系统易用性是系统性能的主要因素;决定系统设计改进和发展方向..5检索的成本效益..是指检索系统的成本和效益之比..检索成本包括系统设备费、标引处理费、检索运行费;检索效益指检索系统创造经济效益和社会效益..好的检索系统是低成本高效益的系统..第二节信息组织中的控制与规范1. 句法控制的方法主要有哪些句法控制是根据信息资源标引和检索的需要;按照一定的组词造句规则;对检索词的组合方式做出的规定..常见的句法措施有确定引用次序、使用辅助符号和句式转换..1引用次序;是指复合主题标引和检索时;各个主题因素的组合次序..在分类法中引用次序是指类目划分标准使用的先后次序或各主题分面在组配时的先后次序;在主题法中是指字顺检索系统中主标题与各级子标题组合的次序..2辅助符号;是揭示主题概念之间的关系意义、进行检索操作的符号..常见的有:关系符号:是一种用于揭示词语组配中形成的关系类型的符号;通过对组配中关系类型的表达;对标引词进行控制;说明组配性质并有一定的排序功能..联系符号:是一种揭示同一文献主题之间联系强度的符号;可以防止主题词之间出现误组配..职能符号:是一种表示主题标识在组配中的句法职能的符号;可以明确一个标识串句子中各主题因素的施动-受动作用;明确法含义;提高检准率..3句式转换;是为了使检索句子各个有意义的词素能成为检索入口字;通过对语句中词语位置的变动来增加检索点..常见的有:轮排转换;将检索语句中每个有意义的词依次排在检索入口;其他词在保持相对位置的情况下移动..链式转换;以逐次折卸句子链环的方法;将每个有检索意义的的词语依次排在检索入口..分析转换;在一个检索词句中;每次抽取少量的词组配成标题;依次把每个有检索意义的词排在检索位置上..2. 词汇控制的范围是什么领会词汇控制:即根据标引和检索的需要;对自然语言中的的词汇进行优选、规范、揭示相关性的过程..2词汇控制的主要措施包括:同义控制:是对字面形式不同而含义相同的词进行控制;使检索系统中一个概念只有一个词语表达..包括对同义词、准同义词及部分专指词与泛指词进行的控制..同义控制常用的方法是在几个词中选取一个作为规范词;在规范词和非规范词之间建立用代参照;便于用户从非规范词找到规范词..同义控制的作用是可以克服一义多词的自然语言现象;把相同内容或特征的信息资源集中在一起..如:自行车代脚踏车单车词义控制:是对同形异义词和语义含糊的词进行控制;使词义明确;一个词语只表示一个概念;以控制一词多义现象..词义控制常用的方法是在词后加限义词;在词下增加含义注释和范围注释.. 疲劳生理;疲劳心理词间关系控制:是揭示词汇之间的等级、等同、相关关系;使之成为语义相关的系统..在主题法中词间关系控制采用设置参照、倒置标题、主标题-副标题以及编制词汇索引系统;如词族索引、范畴索引、轮排索引等..分类语言主要通过类目体系显示词语间的从属、并列、相关关系;用类目参照显示语词概念的横向联系..3.相关因素控制的主要内容领会常用的相关控制包括引用关系、链接关系和用户需求等..①引用关系:这是科学文献中通过相互引用建立的一种关系;通过它;可以根据相互引证关系;提示文献之间内容上的联系..②链接关系:是基于超文本链接技术建立的对象之间的联系..③用户需求:信息组织是为用户服务的;因此用户的检索需求是信息组织的目标和判断信息组织使用效果的重要指标..第三节规范控制的依据1.概念之间的关系类型..①同一关系:“自行车”与“脚踏车”、“电子计算机”与“电脑”..②包含关系:“哺乳动物”与“熊猫”、“图书馆”与“公共图书馆”..③交叉关系:“妇女”与“科学家”、“中等教育”与“业余教育”..④矛盾关系: “核国家”与“非核国家”..两者之和等于上位概念“国家”..“脊椎动物”与“无脊椎动物”⑤反对关系: 中医学与西医学 ..两者之和小于上位概念“医学”..“无产阶级”与“资产阶级”、“有机肥料”与“无机肥料”⑥并列关系:“人造棉”与“锦纶”、“维纶”、“腈纶”2.知识分类:根据知识组织的不同对象和层次;现有的知识组织体系包括:科学分类体系、学科分类体系、事物分类体系、行业分类体系等..见P24-25页表3.阐述文献保证原则和用户保证原则..文献保证原则:亦称文献根据;指信息资源组织应根据信息资源类型、数量等因素进行相应控制..信息检索系统处理的对象是各种类型信息资源;因此要有效进行信息描述及主题内容的组织和提示;离不开对信息资源的内容、特征以及分布状况等的了解..信息资源的数量、特点;往往是影响检索语言详略程序、确定类目或标识设置的重要依据..用户保证原则:指根据用户需要进行描述控制和词汇控制..检索系统是为用户服务的;各种控制和组织措施如不符合用户的检索要求和使用习惯;必然会影响其使用效果..因此对信息检索系统在进行规范控制时;应当有意识地从用户的使用需要出发..4.信息资源组织对分类的借鉴..信息资源组织以知识分类为基础;可以较好的揭示各个领域知识之间的关系和规律性;及时反映各知识领域的进展..可以包括多种层次和方面;如:①作为信息资源分类的基础;用于建立合理的信息组织的结构..②作为基础类目门类的设置依据..③作为主题系统中范畴处理的依据..④作为专门领域下具体类目的设置依据..⑤作为类目之间关系、词间关系处理的依据等..第三章信息描述第一节、信息描述的含义1.信息描述的信含义:亦称信息资源描述;是指根据信息组织和检索的需要;对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动..2.元数据:是关于数据的数据;或关于数据的结构化的数据..其作用主要包括:①识别:确认并对要进行组织的信息资源进行个别化描述;使用户能识别该组织的资源对象..②定位:提供信息资源位置的信息;以便供用户访问时使用..③检索;通过在描述数据中提供检索点;方便用户对资源的检索和利用..④选择;通过记录信息资源的各种特征;供用户对信息资源的使用价值进行判断;并作出选择..3.信息描述的主要标准:① ISBD是国际标准书目着录的英文缩写;由国际图联IFLA1969年制定的供各类信息资源描述用的国际标准..②文献着录总则我国于1983年7月发表的全国文献着录总则..③DC:是都柏林元素集的简称;1995年3月在美国小镇都柏林创建的元数据描述方法;是对网络资源描述最着名、最有代表性的标准..第二节信息资源描述项目、标识和描述级次1.信息描述项目:亦称着录项目;是用以揭示文献内容和特征的记录事项..2.基本描述项目的内容:我国国家标准文献着录总则规定基本描述项目分为9个大项目;依次为:题名和责任者项目;版本项;文献特殊细节项;出版发行项;载体形式项;丛编项;附注项;文献标准编号及有关记载项;提要项..都柏林核心集分15个大项:题名;创作者;主题;描述;出版者;参与者;日期;资源类型;格式;资源标识;来源;语言;关联;覆盖范围;权限管理..3.掌握文献着录格式;描述各项目内容:如下图:图:文献着录格式4.着录详略级次参见P41图3-3;图3-4;图3-5简要级次:仅记录主要项目的级次;一般为小型文献单位;基本级次:记录主要项目的同时;记录部分选择项目..最常见详细级次:记录主要项目和全部选择项目上..适合国家书或集中编目使用..描述信息源:又称着录信息源、着录根据;指进行信息资源描述时描述信息的来源和出处..第三节检索点和规范文档1.检索点是指检索信息资源使用的题名、责任者、分类号、主题词等供检索使用的各种数据..2.标目的含义及作用..标目即手检系统中的检索点;是记录中用来作为排检依据的资特征..标目有两个作用:①作为排检的依据;确定一款目在检索系统中的位置;供检索查找..②决定款目的性质;供组织相应检索工具使用..3. 参照法的含义和类型..参照法是指引用户从检索工具中的一个标目或款目去查找另一个标目或款目的方法;其作用是指引检索系统中检索对象之间的联系;说明检索系统的编制和使用方法..分为:①单纯参照;又称直接参照;从不用作标目的标识去查找用作标目的标识..②相关参照;又称兼互参照;从一个使用的标目去参考另一条或几条相关标目的参考..③一般参照;又称普通参照;是提供关于一定编目事项的说明;介绍用户使用系统的方法..4. 名称规范文档:是一种对描述记录中的名称标目进行规范控制的工具..其处理的范围;包括人名、机构团体名、着作题名等.. P455.题名检索点的选择方法:P43①文献描述中着录的正题名一般直接选作标目..② 适当选择副题名和附注项中的合辑题名作标目..③ 并列题名在我国中文手工检索工具中一般不选作标目..④ 一文献的题名检索点一般不宜超过两个;但题名分析款目不受此限制;可根据需要设置..6. 个人责任者检索点的选择方法:①描述记录中第一责任者、两人合着中的第二个责任者名称均可以作标目..但3人以上合着时只以第一责任者名称作标目..②如可能;文献责任者中记录的其他责任方式的责任者亦可选择作为标目..③附注项着录的责任者;以及其他有关责任者;一般不作标目;但在必要时;着名学者或着名着作的责任者也可作标目..④以书名命名的编写组不作检索点、临时性写作团体如无检索价值;也不做检索点..⑤丛书综合款目的责任者选择与单书相同;分散着录时;单书作者可选为第一责任者..如果编者为出版社则不编制责任者综合款目..当分析出来的材料的责任者与原书责任者不同时;应选其为分析款目的责任者检索点..⑥一文献责任者检索点的数量一般不超过4个为宜..7.规范文档:是信息组织的一种需要;它是对元数据记录的标目进行控制、跟踪、维护工具..包括名称规范档、主题规范档等.. 其中;名称规范控制是根据确定标目的需要;规定统一使用名称的活动;范围包括人名、团体名、题名等..规范控制的作用是:1有利于以统一的方式加以记录..2以规范、通用的形式加以记录..3方便标引和检索..4有助于实现国际书目共享..第四节计算机编码1.MARC-Machine readable cataloging;机读编目格式是根据文献特点和文献机构之间信息交换的需要建立的标准化的计算机可读形式..MARC中一个编目记录的结构四个部分2.分隔符:P52页分隔符用于分隔不同数据集合;分为字段分隔符和记录分隔符两种..字段分隔符以“”表示;用于标志字段结尾..记录分隔符用于标志记录的结束;以“”表示..3.计算机编码的作用..P501用以显示..2提供检索点..3可以对数据进行一体化处理;促进资源共享..第四章信息描述工作第一节信息描述工作概述1.信息描述工作:依据描述规则;对信息资源的特征进行分析、选择、记录的操作过程..2. 元数据在检索系统中的作用:向用户提供信息资源的目录学信息;供使用者确认信息资源;进行选择元数据的各种特征也是进行组织和检索的依据;是建立检索工具的基础和前提3.信息描述工作的方式类型分类依据工作方式类型描述的资源对象文献编目、档案编目、博物馆藏品编目、网络资源编目操作的设备条件手工编目、机读编目、联机编目处理方式原始编目、复制编目编目过程的组织形式集中编目、共享编目4.在版编目:是集中编目的形式之一;是指在文献出版过程中进行编目;使编目数据得以与文献一起提供;方便文献机构使用..5.大规模的信息资源描述网络——书目机构Bibliographic Utility的出现..这些机构将联机环境、网络环境与信息描述的形式结合;同时结合采用集中编目和协作编目的方式;为有关文献单位提供书目资源和服务..OCLCOnline Computer Library Center;为全美国和国外进行书目服务的机构RLINResearch Library Information Network;该网络开始于1967年;是一个为美国研究图书馆服务的系统UTLASUniversity of Toronto Library Automation System;该系统最早为多伦多大学图书馆的自动化系统;目前已扩大成兼为其他图书馆服务的系统中国高等教育文献保障体系CALIS;管理中心设置在北京大学图书馆;是我国高等学校信息资源的联机编目网络..6.元数据工作的规范要求如下:P58准确:对信息资源的描述应真实反映其内容特征..规范:信息资源的描述应严格遵守相应的描述规范;并在可能时依据相关的规范文档或控制词表..完备:描述项目应比较完备;使得可以从信息资源的各种特征出发进行检索操作..7.信息描述工作程序1查重:就是确定某一信息资源是否已经收入系统..作用:避免不必要的重复劳动;保证对信息资源描述和处理的一致性..2描述:描述操作通常应根据描述规范进行;规范化是信息资源描述的发展方向..3标引:分析信息资源的内容属性特征及相关的外表属性;并用特定的语言表达分析出的属性或特征;从而赋予其检索标识的过程..在此处主要指分类标引、主题标引..4复核:包括检查描述项目是否完备;准确;分类标引、主题标引的结果是否符合系统的要求等..8.Connexion元数据的创建方式:①对已有的记录修改完善..②克隆clone相关记录;进行修改..③创建新元数据记录..第二节信息描述方法1.文献着录总则对题名的分类..P67 ;各种题名书上的例子要知道1正题名:单纯题名、交替题名、合订题名..2并列题名:又称平行题名;对照题名;指见于书名页;与正题名语种不同的题名..3副题名:为解释或从属于正题名的另一题名;应记录于题名之后;以“:”为标识..4说明题名文字..2.责任者的类型和责任方式..责任者说明由责任者和责任方式组成..责任者指对信息资源的生产负有责任的个人或团体..个人责任者可以是一人或多人;集体责任者可以则指机构团体、会议活动等.. 责任方式表示责任者对文献所作的贡献类型..传统文献通常有着、编、改编、执笔、口述、译、注、点校、作词、作曲、绘等多种形式..3. 载体形态项、的含义和类型..载体形态项是一个记录文献物质形态特征的项目..包括:数量、图、尺寸或开本、附件等.. 文献特殊细节项是为某些特殊类型文献特征的着录设置的项目..如:连续出版物的卷、期、起讫、地图比例尺、投影法等;主要用于记录个别重要文献特征..4. 关联项的类型.P71关联..主要用于表达一信息资源与其他信息资源的联系..有七种类型:1部分、全部关联..2版本关联..3格式转换关联..4参照关联..5替代关联..6附属关联..7一致关联..5.检索排检项的类型..检索排检项通过对检索点的提示;供手工检索系统编制使用..通常包括四个方面:文献题名、责任者名、主题词、分类号..6. 传统文献着录总则与都柏林核心集的特点和异同..同:1完备的描述项目2都对描述的等级、标识以及规范的使用作出相应的规定3都具有比较强的扩充性、兼容性异:1针对传统文献描述和识别的需要设置2对传统资源特征的描述项目的设置详尽;针对网络资源的描述项目相对比较概括3各描述项目有明确规定的次序和等级4对描述的表达有严格要求5采用人工标识;适合专业文献单位使用;是一个以文献专业人员为处理主体的描述规范.. 第五章分类法第一节分类法概述1.分类:是指依据事物的属性或特征加以区分和类聚;并将区分的结果按照一定的次序进行组织的活动..分类是人类思维的基本形式;是认识世界的基本方法..2. 信息资源分类:根据信息资源的内容属性和其他特征;将资源分门别类地、系统地组织和揭示的方法..3. 信息资源分类一般具有以下特征:1按照信息资源内容特征的相互关系加以组织;使得信息资源成为一个根据其远近亲疏组织而成的具有等级性、次第性的系统..2一般是从一定的角度出发组织信息资源的按学科集中;按主题分散..3以一定标记符号作为排序工具..4一般通过类目索引提供从字顺角度查找类目的途径..4. 对信息资源进行分类的作用意义1进行资源组织..2建立分类检索工具..3分类统计..4兼容工具..5. 分类法是一种从主题内容角度组织和揭示信息资源的方法;是分类方法在信息资源组织中的应用..6. 分类法的类型以及各类型的典型代表信息资源分类法按照其编制方式;通常可以区分为:①等级列举式分类法..美国的杜威十进分类法Dewey Decimal Classification;简称杜威法或DDC美国国会图书馆图书分类法Library of Congress Classification;简称国会法或LCC 我国的中国图书馆分类法简称中图法等..②分面组配式分类法..冒号分类法Colon Classification;简称CC布立斯书目分类法二版 Bliss Bibliographic Classification;简称BC2③列举组配式分类法..国际十进分类法Universal Decimal Classification;简称UDC俄国的图书馆书目分类法7. 等级列举式分类法的特点、不足..特点:①从一定的角度出发有层次地揭示信息资源;类目展开比较系统;②分类结构显示直观;易于把握、便于使用;③标记简明;号码单纯;适于分类排架;也可以用于组织分类检索工具..不足:①揭示专门主题能力差;往往无法满足确切分类的需要;不能充分揭示现代文献中大量存在的细小专深主题;。
信息组织考核知识点

信息组织考核知识点本文依据高等教育自学考试北京市指定教材《信息组织(第2版)》叶继元2015年版和信息组织(课程代码02117)自学考试大纲编写。
作者分析历年真题整理出了考核知识点并标记了重点,供大家参考。
1.信息组织概述1.1.信息组织的概念★★信息组织是以用户需求为导向,依据信息体自身的属性特征,信息工作者或用户按照一定的原则、方法和技术,将杂乱无章的信息整理成为有序的信息集合的活动和过程。
1.2.信息组织的内容★1.信息筛选(甄别有用信息,剔除无用信息)2.信息分析(对信息的内外部特征进行细化、挖掘、加工整理并归类)3.信息描述与揭示(对信息资源的部分主题内容、形式特征及物质形态等描述维度进行分析、选择、记录的过程)4.信息序化与存储(按照一定的格式和顺序存储在特定的载体中)1.3.按信息的认识层次(事物运动状态)划分★从人类对信息的认识层次上看,由于人类具有感受力,能够感知事物运动状态及其变化方式,由此获得的信息为语法信息:由于人类具有理解力,能够领悟事物运动状态及其变化方式的逻辑含义,由此获得的信息为语义信息;又由于人类具有明确的目的性,能够判断事物运动状态及其变化方式的效用,由此获得的信息为语用信息。
对这三种信息进行组织,便产生了信息组织的基本方法。
1.语法信息组织(研究语言符号之间的形式范畴的结构规则,如:字顺法、代码法、地序法、时序法)2.语义信息组织(研究信息的内容特征的组织方法,如:分类法、主题法)3.语用信息组织(研究环境与使用者的不同而不断变化的信息群,如:权重值信息组织法、概率组织法)1.4.计算机应用信息组织的特点★1)宏观上的主要特点是信息组织的技术化、社会化、产业化和标准化2)微观上的主要特,点是对分类法的改造、主题法的发展、分类主题一体化、自然语言检索系统的兴起及对自动标引和分类的探讨1.5.网络下数字信息组织的特点★这一阶段的主要特点是:在以计算机、现代通信技术为代表的信息技术的推动下,传统的信息组织方法不断创新和完善,向自动化方向发展。
信息组织考点

名词解释1、信息组织:也称为信息资源组织,是根据使用的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等进行分析、选择、处理、序化,并以适当的方式加以提供的活动。
2、检索语言:是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称为情报检索语言。
3、检全率:亦称查全率、命中率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检索系统中与该提问相关的实有信息资源总量之比。
(检全率=检出相关信息资源量/系统相关信息资源总量*100%)4、检准率:亦称查准率、相关率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检索出的信息资源总量之比。
(检准率=检出相关信息资源量/检出信息资源总量*100%)5、词汇控制:指根据信息资源标引和检索的需要,对自然语言中的词汇进行选择、规范并揭示其相关性的过程。
6、句法控制:指根据信息资源标引和检索的需要,通过一定的组词造句的规则,对检索语词的组合方式作出规定。
7、引用次序:亦称为组配次序,指复合主题标引和检索时,各个主题因素的组合次序。
8、概念:是表达事物对象的特有属性或本质属性的思维方式,是检索系统交流的内容。
概念包括内涵和外延,内涵是指概念的定义,即所反映的对象的本质属性的总和;外延是指具有该属性的事物对象,即概念所包括的范围。
9、文献保证原则:亦称文献根据,指信息资源组织应根据信息资源类型、数量等因素进行相应控制。
10、用户保证原则:用户保证,是指根据用户需要进行描述控制和词汇控制。
11、信息描述:亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。
12、元数据:所谓元数据是关于数据的的数据,或关于数据的结构化的数据。
13、检索点:指检索信息资源所使用的提名、责任者、分类号、主题词等各种供检索使用的数据。
14、标目:即手检索系统中的检索点,是记录中用来作为排检依据的资源特征。
信息组织学复习资料

信息组织学复习资料第一篇:信息组织学复习资料第2章信息组织概述1.λ信息组织的内涵信息组织(information organization)就是人们根据信息本身特点,运用适宜的工具和方法,依据一定的标准或规则,对其进行加工整理,排列组合,使之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能,以满足人们信息需求的过程和活动。
λ从层次上看,信息组织包括了序化和优化两个层次,序化是基础,优化是延伸。
2.信息组织要素λ属性与序、规范和操作是信息组织的两对基本要素,是信息组织进行的依据,信息组织学科体系就是建立在这些要素之上。
(1)属性λ属性反映了信息的本质特征事物的属性总体上可以分为外在属性和内在属性,在信息组织工作中,外在属性称为外表特征,内在属性称为内容特征。
λλ信息组织的过程就是按照事物属性之间的同一性、包容性、交叉性和排斥性等关系对信息实施序化的过程。
(2)序λ序是事物的一种结构形式,是指事物或系统的各个结构要素之间的相互关系以及这种关系在在时空中的表现,即事物发展中的时间序列及排列组合、聚类状态、结构层次等空间序列。
(3)规范λ有序无序是针对一定参照系而言的,这个参照系就是规范。
信息组织规范主要包括:λ①基本术语规范;②有关信息技术规范(信息交换格式、程序设计与数据库语言、网络标准与协议等);③信息组织技术规范(如信息描述规则、信息代码、信息标引规则和信息组织成果编排规则等);④其他相关规范。
(4)操作λ操作指根据信息资源的内容和特征,对信息资源进行描述、标引,并将其组织进相应系统的过程。
λ这一操作一般是依据一定的信息资源描述处理的规范,对信息资源的特征和内容进行分析、归纳、选择、记录,并在此基础上将其组织进信息资源集合和检索工具。
3.信息描述规范λ描述项目规范:如题名、责任者、出版社、关键词等传统文献著录时基本描述项目分为9个大项。
依次为:题名和责任者项目;版本项;文献特殊细节项;出版发行项;载体形态项;丛编项;附注项;文献标准编号及有关记载项;提要项。
信息组织知识点

信息组织1.信息组织:根据信息检索的需要,以各种类型的信息资源为对象,运用适宜的工具和方法,依据一定的标准和规则,通过对信息外在特征和内容特征的表征和排序,实现无序信息流向有序信息流的转换,从而使信息集合达到科学组合,保证用户对信息的有效获取和利用。
2.信息组织的层次:有序化、优化(重组)3.信息组织的功能:基本功能:全面揭示和再现信息的外在特征和内容特征,科学反映和描述信息的特色。
增值优化功能:信息单元、数据依据逻辑方法再现和重组的过程是一个序化增值过程。
目标功能:减少信息间的相互干扰,控制信息的运动方向,有效地将信息组织起来,形成一定的成果。
社会功能:通过信息合理而规范的组织,能有效控制信息流向,从而实现一定的社会目标。
4.信息组织的要求:内容有序化、流向明确化、流速适度化、数量精简化、质量最优化5.信息组织方法:1. 以信息资源的外部特征为检索依据,提供从资源外在形式进行检索的途径。
描述法(著录、编目)2. 以表达信息资源主题内容的标识为依据,提供从资源内容角度进行检索的途径。
分类法和主体法6.信息组织的内容:(按活动类型分)信息选择、信息分析、信息描述和揭示、信息储存(按层次分)描述报道、有序化并控制、揭示开发、浓缩增值、聚集重组7.信息组织的成果:目录、索引、数据库、搜索引擎8.目录:著录一批相关的文献,按一定的次序编排而成的一种登记、报道和宣传文献实体和虚拟信息的检索工具。
包括文献收藏目录和书目9.索引:索引是将原始文献中某些重要的或有意义的信息,如书名、刊名、篇名、主题、人名、地名等分别摘录出来,进行标引,再按一定方式编排,并注明出处,以供检索的工具。
信息组织描述法1.2.信息描述:根据信息组织的目的和信息检索的要求,按照一定的信息管理规则和技术标准,将存在于某一物理载体上的信息资源的形式特征和部分内容特征进行全面描述并给予记录的过程。
3.描述性编目(Descriptive Cataloguing):是对文献的外部特征进行识别、分析、选择,并予以记录成为款目,继而将款目按一定顺序组织成为目录或书目的过程。
信息组织知识点汇总

知识点汇总第一章1、信息组织得定义以用户需求为导向,依据信息体自身得属性特征,信息工作者或用户按照一定得原则、方法与技术,将杂乱无章得信息整理成为有序得信息集合得活动与过程。
2、信息组织得原理基本原理:如果有若干自然状态得无序信息资料,将这些信息资料按照某种属性特征排列成一个序列,并且需要使用信息资料得用户能将自己得需求转换成相应得信息资料属性特征,并在排列后得信息资料序列中找到自己所需要得信息资料。
信息组织由信息著录标引(信息描述揭示)与信息序化两个工作环节组成。
3、信息组织得内容一般而言,信息组织包括四项内容。
1、信息筛选(甄别有用信息,剔除无用信息)2、信息分析(对信息得内外部特征进行细化、挖掘、加工整理并归类)3、信息描述与揭示(对信息资源得部分主题内容、形式特征及物质形态等描述维度进行分析、选择、记录得过程)4、信息整序与存储(按照一定得格式与顺序存储在特定得载体中)4、信息组织得类型按信息得认识层次划分,信息组织有三种类型1、语法信息组织(研究语言符号之间得形式范畴得结构规则,如:字顺法、代码法、地序法、时序法)2、语义信息组织(研究信息得内容特征得组织方法,如:分类法、主题法)3、语用信息组织(研究环境与使用者得不同而不断变化得信息群,如:权重值信息组织法、概率组织法)5信息组织得作用控制整序提升品质传播利用节约成本第二章1、熵(entropy)最早就是热力学上得一个符号,就是一种测量在动力学方面不能做功得能量综述。
熵指得就是混乱得程度,负熵就是物质系统有序化、组织化、复杂化状态得一种量度。
香农第一次将“熵”引入到信息论中,在信息论中,“熵”可以用作某件事不确定度得量度。
信息量越大,体系结构越规则,功能越完善,熵就越小。
利用熵得概念,可以从理论上研究信息得计量、传递、变换、存储等活动。
学术界目前普遍接受得观点就是“信息即负熵”。
2、逻辑学原理在信息组织中得应用概念之间得关系(图略):相容关系同一关系:就是指有相同外延得两个概念之间得关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
知识要点第一章绪论1、什么是信息组织?(理解)信息组织:对信息资源对象进行收集、加工、整合、存储使之有序化、系统化的过程。
2、信息组织的发展阶段——按组织对象划分(理解)按组织对象划分信息组织经历了三个阶段:文献组织阶段、信息组织阶段、知识组织阶段文献组织阶段——组织对象:传统文献实体,不涉及文献内容本身。
信息组织阶段——组织对象:从广度上,以纸质信息为中心转向以电子媒介信息为中心;从深度上,除了对文献实体进行组织,还要深入信息内容。
知识组织阶段——组织对象:从显性知识扩展到隐性知识。
知识组织直接给用户提供直观的、可操作的系统化知识。
不再局限于利用片面的信息来满足用户的需求,而是对用户的需求系统分析,向用户提供全面、完善的解决方案。
按职能划分信息组织经历了三个阶段(补充):清册职能时期查检职能时期组织职能时期3、网络信息组织的基本方法(掌握)①文件方式•一般用于局域网内的非结构化信息组织。
•优点:通过FTP协议进行传输,简单方便•缺点:以文件为单位共享和传输信息会使网络负载越来越大②自由文本方式•主要用于全文数据库的组织•对非结构化的文本信息进行组织和处理的方式•能够完整地反映出一次文献的全貌•通过计算机自动进行文献信息的处理和组织,支持全文检索。
③数据库方式•一般用于结构化/规范化信息组织。
•优点:最小存取单位是字段,从而大大降低网络数据传输的负载。
•缺点:对非结构化信息处理难度大•数据库方式是当前普遍使用的网络信息资源的组织方式。
④主页方式•网页一般通过HTML语言规则将文本、图像、声音、视频等各种类型的信息集合在一起。
⑤超文本方式⑥主题树方式•主题树方式是一种可供检索和查询的等级式主题目录。
它以人工方式或半自动方式搜集信息,然后将信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织。
•主题树方式不太适合大型的综合性的网络信息资源系统,而较适合专题指引库的建立。
⑦搜索引擎方式⑧指引库方式• 指引库,也称导航库。
它并不存储各种实际的信息资源,只存放有关主题的数据库或服务器的地址等信息,可指引用户到特定的地址获取所需的信息。
5、信息的外表特征、内容特征分别包括哪些?(理解)外表特征:与信息内容无关的特征,如题目、作者、出处、作者工作单位、专利号等 内容特征:信息所涉及的中心事物和学科属性 ,如分类号、主题词、关键词、摘要等。
6、什么是标引语言?什么是自然语言?什么是受控语言?自然语言区别于受控语言的特点有哪些?(理解)标引语言:是表达文献主题概念和文献需求主题概念的简明性、单义性和关联性概念标识系统,是根据标引和检索需要而编制的人工语言。
• 也叫“情报语言”、“索引语言”、“检索语言” • 揭示信息的中心主题和内容特征 • 信息标引的依据• 用于将检索用语和标引用语进行匹配 • 对自然语言进行规范化处理后的人工语言标引语言实际上是检索者与组织者之间的一种“约定”自然语言:文献作者所使用的书面语言受控语言:词汇及语法都受到各种控制的人工语言。
7、标引包括哪些类型?自然语言标引包括模糊对应外表特征内容特征精确对应信 息哪些方法?(理解)几个重要概念(补)•自然语言标引:采用自然语言作为信息记录主题内容检索标识的标引。
自然语言标引的方法:1.关键词法2.文本检索3.自由标引4.自然语言入口词检索8、索取号及其构成(掌握)索取号:是信息服务机构赋予每一种信息资源的唯一号码。
它反映每种信息资源的具体存放位置。
索取号由两部分组成:分类号和书次号(书次号通常采用“种次号”或“著者号”)。
“种次号”是依照同类信息资源到信息服务机构的先后次序编制的顺序号或流水号;“著者号”是依照著者姓名的音、形等特征编制的号码。
9、信息存储介质(理解)存储介质—纸张、磁盘、磁带、缩微胶片、光盘等10、信息存取系统的类型(理解)信息检索系统的类型•按照信息源类型划分:文献型、事实型、数值型、图像型•按照工作方式和存取介质:手工、单机、联机、光盘、网络信息检索系统的结构信息检索系统一般包括五个子系统:•选择子系统•标引子系统•词表子系统•检索子系统•交互子系统11、衡量检索效率的指标(理解)衡量检索效率的指标主要有:•查全率(漏检率)•查准率(误检率)第二章分类法(重点)1、什么是分类法?包括哪些类型(即构成原理)?(理解)分类组织法:根据概念的划分与概括原理,按照事先规定好的学科专业体系或事物范畴,根据某一特性将信息分门别类的组织成系统,以便于用户按照学科专业或事物范畴途径查询特定信息的信息组织法。
•分类法使用分类号来标识类目,分类号可反映类目在分类体系中的位置和排列次序。
分类语言的构成原理:1)等级体系分类法2)分面组配分类法3)等级体系—分面组配分类法(也即混合分类法)2、什么是体系分类法?其主要代表有哪些?(理解)含义:类目按等级层层展开,并详尽列举的文献分类法☐特点•将表达事物的概念(类目)按照知识分类与逻辑关系进行纵向从属、横向并列的方式编排成概念等级体系;•是一种先组式定组型标引语言,其类目与类号标识都是在编制分类表时事先确定或大部分确定好的;•按照学科专业和事物范畴区分和集中文献;•标识符号既可以用于组织分类目录与索引,也可用于排书上架;•采用数字和字母作为标识,便于国际标准化。
☐种类•《中国图书馆分类法》(简称《中图法》)•《中国科学院图书馆分类法》(简称《科图法》)•《杜威十进分类法》(简称DDC)•《国际十进分类法》(简称UDC)•《美国国会图书馆图书分类法》(简称LDC)☐局限性(补充)•列举类目与无限增长的科学知识不相适应;•类目体系的单向线性结构与概念多向成族的网状结构不相适应;•分类标识的概括性与信息源主题的专指性不相适应;•号码标识的有限性与知识单元的无限性不相适应;•文献单元标引与知识单元检索不相适应。
3、什么是组配式分类法?其主要代表有哪些?(掌握)分面:一组性质相同的概念因素分面组配分类法含义:依据概念的分析与综合原理,将概括信息内容与事物的主题概念分成若干个“分面”,通过各分面内类目之间的组配来表达信息内容的分类法,也叫分面分类法、范畴分类法。
即一个复杂主题概念可以用若干个简单概念标识的组配来表达构成:包括分面分析、分面引用次序和分面标记制度三大关键理论和技术。
种类:《冒号分类法》(简称CC)《布利斯书目分类法》(简称BC)缺点:类表结构和标记方法复杂,类目体系欠直观4、什么是体系-组配式分类法?其主要代表有哪些?(理解)含义:是一种在体系分类法的基础上,引入分面分析和组配技术而形成的分类法结构模式,亦称半分面分类法。
☐背景:全分面组配分类法很少被使用,分面分析和组配技术更多的是被体系分类法吸收,用来改善体系分类法的性能。
☐特点:1)按照学科专业或事物范畴设置基本大类;2)通过设置各种分面辅助复分表提供分面组配技术与概念标识。
☐种类:•《国际十进分类法》(简称UDC)•《俄国图书馆书目分类法》5、分类法中基本标记符号包括哪些类型?(掌握)分类法的标记符号也称分类号、类号,是类目的代号。
基本符号:单纯数字单纯字母数字、字母混合辅助符号(根据分类法的功能而定)6、常用标记制度包括哪些?(掌握)①层累标记制•又称等级标记制,是一种类号的位数与类目等级相适应的层次分明的标记制度。
它常用一位号码表示一个大类,再加一位号码表示其下位类(二级类),以号码的层层累加表示类目的层层划分。
•《中图法》基本采用层累标记制②混合标记制•一种结合采用顺序制和层累制的标记方式。
包括层累-顺序制和顺序一层累制•《科图法》采用的是顺序一层累制。
分类号的前两位数字采用顺序制,用于标识基本大类和二级、三级类目;两位数字后,用小圆点隔开,其后基本使用层累标记制。
③分面标记制又称分段标记制,是用若干节段符号的组合来表达主题概念的标记制度。
它能显示类目的组配关系。
例如:“20世纪90年代中国儿童图书馆图书分类工作”的类号为2 ,61;43 :51 . 41‘ N9。
④顺序标记制按照类目在分类体系中的次序,顺序配以号码,号码只表示类目的次序,不显示类目的等级或其他关系。
7、《中图法》、《科图法》、《DDC》、《UDC》分别采用什么标记符号和标记制度?(掌握)《中图法》采用拉丁字母与阿拉伯数字相结合的混合号码制作为标记符号,基本采用层累标记制。
《科图法》采用单纯数字号码作为标记符号,号码分为两部分:第一部分采用整数顺序制,第二部分基本上采用小数层累制,简而言之,采用混合标记制。
杜威十进分类法(DDC):DDC是以阿拉伯数字作为基本的分类标记符号的,并采用层累制。
国际十进分类法(UDC):UDC 与DDC一样,采用单纯阿拉伯数字作为标记符号。
基本采用层累制,第三章主题法(重点)1、什么是主题法?(理解)主题法是指用语词作为概念标识,将概念标识进行字顺排列,并用参照系统等方法间接显示概念之间相互关系的信息组织方法。
2、主题法有什么特点?(掌握)1.以主题为中心集中信息2.直接用自然语词(主题词)作为存取标识3.主要按字顺排列4.用参照系统显示主题词之间的关系3、主题法包括哪些类型?(掌握)标题法:用规范化语词—标题词来表达主题概念元词法(单元词法):用规范化语词—单元词的字面组配来表达主题概念叙词法(主题词法):用规范化语词—叙词的概念组配来表达主题概念关键词法:直接以文献中的自然语词—关键词来表达主题概念4、主题法参照系统的构成(理解)Y 用项符号:表示该主题是正式主题词D 代项符号:表示该主题是非正式主题词F 分项符号:表示该主题是“显像管”的下位主题词S 属项符号:表示该主题是“显像管”的上位主题词C 参项符号:表示该主题是“显像管”的相关主题词5、几种代表性主题法中哪些是自然语言,哪些是人工语言?(理解)标题法、元词法、叙词法为人工语言;而关键词法则为自然语言6、主题法和分类法的比较(掌握)①揭示对象不同主题法揭示文献论述的主题事物(“是什么”);分类法揭示的是文献内容的学科属性(“属什么”)。
②使用标识不同主题法直接用词语表示文献主题;分类法则以抽象的“分类号”表示文献主题。
③排列方式不同主题法按词语字顺排列,如同词典,易学易查;分类法按分类号排列,系统性较强,但不熟悉有关分类表则难以有效地利用。
④用途不同主题法较适合于对单篇文献的组织和检索,且更适于计算机组织和检索;分类法则比较适合于图书或文集的组织和检索。
7、什么是范畴索引、词族索引?(理解)范畴索引,又称分类索引,是将叙词和非正式叙词按所属学科或范畴编制的词汇分类索引。
词族索引,也称等级索引,是将字顺表中具有等级关系的叙词按属分等级构成词族,并按各词族的族首词字顺排列的词汇索引。
8、什么是后控制,对网络信息资源组织的作用?(掌握)后控制主要是通过后控词表来实现的。