[4]情报学概论-信息组织
第二节 信息组织

信息自组织存在范围从小到网上聊天室,大到
全球信息系统。以网上聊天室为例,参予者能 够有机会充分表达他们的感情,最初谈论的主 要内容可能是零乱的,但随着文字交流的进行, 人与人之间会产生一种默契、协同,从而产生 关于某一主题的较一致的看法。从另一侧面看, 这一过程就是信息的自组织。
第二节
信息组织概述
耗散结构理论比较成功地解释了复杂系统在远离平 衡态时出现耗散结构这一自然现象,并得到广泛的 应用。它已在解释和分析流体、激光器、电子回路、 化学反应、生命体等复杂系统中出现的耗散结构方 面获得了很多有意义的结果,并且正在用耗散结构 理论研究一些新的现象。诸如核反应过程,生态系 统中的人口分布,环境保护,交通运输和城市发展 等,都可当作远离平衡态的复杂系统来研究。这方 面的工作也取得了一定的进展。
2).系统科学理论 系统科学是“老三论”和“新三论” 的总称,是
现代科学研究共同的一般方法论
主张把事物、对象看作一个系统进行整体来研究他
的要素、结构和功能的相互联系,通过信息的传递 和反馈来实现系统之间的联系,达到有目的的控制
系统的发展,获得最优化效果。
信息论
耗散结构理论 老三论 新三论 协同论 突变论
协同论
德国的哈肯1976年提出的协同论认为系统通过内部 子系统的协同产生有序。 协同论认为,千差万别的系统,尽管其属性不同, 但在整个环境中,各个系统间存在着相互影响而又 相互合作的关系。其中也包括通常的社会现象,如 不同单位间的相互配合与协作,部门间关系的协调, 企业间相互竞争的作用,以及系统中的相互干扰和
信息自组织是指作为信息系统组成要素的信息,由 于人与人之间、人与系统其它要素之间存在的相关 性、协同性或默契性而形成特定结构、功能的过程, 也就是信息系统无须外界指令而能自行组织信息、 自我走向有序化和优化的过程。它是根据系统自身 运动变化规律和特定条件而自发形成的。
《信息组织》学习笔记

信息组织第一部分信息组织的基本原理一.熟悉和掌握1.信息组织:信息组织是为了方便人们检索、获取信息而将庞杂、无序的信息进行系统化和有序化的过程。
信息组织的内容包括信息收集与选择、信息分析与揭示、信息描述与加工、信息整理与存储。
对信息的描述与揭示以及序化是信息组织的中心内容。
2.信息标引:信息标引就是对信息内容进行分析并充分而有效地予以揭示。
从学科属性揭示信息内容就是分类标引,从主题特征揭示信息内容就是主题标引。
3.信息组织方法:(1)按组织对象分:文献实体组织与信息内容组织文献实体组织的对象是文献,这里的文献指的是传统的信息资源类型,主要指印刷型的出版物,如图书、期刊、会议论文、科技报告等。
文献实体组织是把这些文献及其著录和标引记录组织成一个有序的系统,如图书的分类排架系统、分类目录、主题目录等。
信息组织的本质是信息内容的组织。
(2)按信息组织的层次分:语法信息组织、语义信息组织与语用信息组织语法信息组织是以信息的形式特征为依据组织信息的方法,如字顺组织法等。
语义信息组织是以信息内容或本质特征为依据组织信息的方法,分类组织法、主题组织法就属这一层次。
语用信息组织是以信息的效用特征为依据组织信息的方法,如根据信息的权值、概率等组织信息的方法。
对于科学信息来说,最本质的是语义信息组织法。
4.常用信息组织方法*(1)分类组织法:根据某一特定的分类体系和逻辑结构组织信息的方法。
以内部特征为主。
分类组织法建立了信息的层级和关联体系,便于浏览检索。
(2)主题组织法:通过揭示信息主题特征并有序组织的方法。
主题法通过建立主题概念的范畴、族系和关联关系,显示信息的结构体系。
主题组织法根据所使用的主题检索语言又分为标题法、单元词法、叙词法、关键词法和自然语言组织法。
本体组织法也是。
(3)集成组织法:每种信息组织方法都有其特有的功用,有些组织方法功能是互补的,如将多种方法结合起来使用会达到更好的效果。
如分类主题一体化的组织方法、规范组织方法与自然语言组织法的结合等。
信息组织知识点汇总

信息组织知识点汇总Happy First, written on the morning of August 16, 2022信息组织知识点汇总第一章第一节、信息组织的必要性1.信息组织:根据信息检索的需要;以文本及各种类型的信息资源为对象;通过对其内容特征等的分析、选择、标引、处理;使其有序化并以适当方式加以提供的活动..2.信息检索:根据检索需要;从检索系统中检出相应信息资源的过程..3.信息资源:通常指一切以记录形式存在的信息载体;只是比较而言;更侧重于对新型媒体形式的强调..可以是图书、期刊、报纸、论文;也可以是网络上的电子资源4. 信息组织与信息检索有什么关系1信息组织是信息检索的基础和前提;只有对信息资源进行处理和有序化信息系统之后;才能准确有效查找相关信息资源;2信息检索则是信息组织出发点与归宿;用户的检索需要是组织信息的主要依据..第二节、信息组织的形式和检索途径1.文献组织的基本排列方式:一般有两种基本排列方式;其一为:固定排列法和按一定意义的次序排列..固定排列法;如档案、博物馆的收藏、光盘、录音带、缩微品..按一定意义的次序排列;如图书、期刊等2. 按照检索工具的对象和特点;可以分为文献目录、索引、机读数据库、网络搜索引擎四种类型..3. 按照标识特征;检索工具可以分哪两种基本类型1以信息资源的外部特征形式特征为检索依据;提供以信息资源形式特征为标识检索途径..常见的信息资源形式特征有责任者名即作者和与资源形成相关的人或机构;如译者、改编者、修订者等、题名、机构名、标准书号、专利号、文献登录号或顺序号等..2以信息资源的主题内容特征为检索依据;提供从资源内容进行检索的途径;主要有分类法、主题法..4.按照系统中所用的标识是否进行控制;检索工具可以分为受控检索系统与自然语言检索系统..5.按照系统中标识组配的特点;检索系统可以分为先组式和后组式两种..6.检索工具还可以按照采用的形式;分为卡片式、书本式、缩微式、电子方式等..第三节.信息组织的处理方式和研究内容1. 检索语言:一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统;也称情报检索语言..2.知识组织系统:知识组织系统通常指经过组织的知识结构表达的工具;它试图包含组织信息和促进知识管理的各种类型的词表;其范围从传统的地名表、同义表;到新型的知识组织工具..3.信息处理的基本做法:领会1描述信息资源;以便识别与确认它;主要方法是着录、编写题录和资源形式特征的描述;2浓缩信息资源内容;主要方法是编写内容提要或文摘;供用户了解、选择和判断信息资源;3提供检索点..主要方法是确定特定资源的标索特征或标识与可检信息..信息资源的检索点有代表其内容特征和形式特征的各种标识;如题名、责任者、分类号、主题词或关键词等4.信息组织活动的内容:领会信息组织活动包括两个基本方面:1信息组织的操作..指根据信息资源的内容和特征;对信息资源进行描述、标引、并将其组织进相应系统的过程..2信息资源的组织规范..这是根据信息组织的需要;按照信息资源的特点预先确定的规则和方法系统;是进行信息组织操作的依据..第二章信息组织原理第一节对信息组织的要求1. 检全率:是指一次检索中检出的与提问相关的信息资源数量占系统中所有与提问相关的信息资源数量的比例;检全率=检出的相关信息资源量/系统中相关信息资源总量子数×100%2.检准率;是指检出的相关信息资源的数量;占检出的全部信息资源数量的比例..检准率=检出的相关信息资源数/检出的信息资源总数×100%3. 简述对信息组织的要求..领会1检全率..略2检准率..略3检索速度和系统的及时性..检索速度是指用户从实施检索到得到结果化费的时间;它是衡量系统检索速度与使用效果的重要参数..它与系统响应检索的能力、检全率、检准率、资源组织的全理性等因素有关..系统的及时性是指检索工具处理信息和提供信息所用时间较短;能快速纳入、处理和提供信息..4系统易用性..是指标引人员使用检索系统描述、标引资源是否方便和易用;用户使用系统的简易性、方便性与获取信息的容易程度..系统易用性是系统性能的主要因素;决定系统设计改进和发展方向..5检索的成本效益..是指检索系统的成本和效益之比..检索成本包括系统设备费、标引处理费、检索运行费;检索效益指检索系统创造经济效益和社会效益..好的检索系统是低成本高效益的系统..第二节信息组织中的控制与规范1. 句法控制的方法主要有哪些句法控制是根据信息资源标引和检索的需要;按照一定的组词造句规则;对检索词的组合方式做出的规定..常见的句法措施有确定引用次序、使用辅助符号和句式转换..1引用次序;是指复合主题标引和检索时;各个主题因素的组合次序..在分类法中引用次序是指类目划分标准使用的先后次序或各主题分面在组配时的先后次序;在主题法中是指字顺检索系统中主标题与各级子标题组合的次序..2辅助符号;是揭示主题概念之间的关系意义、进行检索操作的符号..常见的有:关系符号:是一种用于揭示词语组配中形成的关系类型的符号;通过对组配中关系类型的表达;对标引词进行控制;说明组配性质并有一定的排序功能..联系符号:是一种揭示同一文献主题之间联系强度的符号;可以防止主题词之间出现误组配..职能符号:是一种表示主题标识在组配中的句法职能的符号;可以明确一个标识串句子中各主题因素的施动-受动作用;明确法含义;提高检准率..3句式转换;是为了使检索句子各个有意义的词素能成为检索入口字;通过对语句中词语位置的变动来增加检索点..常见的有:轮排转换;将检索语句中每个有意义的词依次排在检索入口;其他词在保持相对位置的情况下移动..链式转换;以逐次折卸句子链环的方法;将每个有检索意义的的词语依次排在检索入口..分析转换;在一个检索词句中;每次抽取少量的词组配成标题;依次把每个有检索意义的词排在检索位置上..2. 词汇控制的范围是什么领会词汇控制:即根据标引和检索的需要;对自然语言中的的词汇进行优选、规范、揭示相关性的过程..2词汇控制的主要措施包括:同义控制:是对字面形式不同而含义相同的词进行控制;使检索系统中一个概念只有一个词语表达..包括对同义词、准同义词及部分专指词与泛指词进行的控制..同义控制常用的方法是在几个词中选取一个作为规范词;在规范词和非规范词之间建立用代参照;便于用户从非规范词找到规范词..同义控制的作用是可以克服一义多词的自然语言现象;把相同内容或特征的信息资源集中在一起..如:自行车代脚踏车单车词义控制:是对同形异义词和语义含糊的词进行控制;使词义明确;一个词语只表示一个概念;以控制一词多义现象..词义控制常用的方法是在词后加限义词;在词下增加含义注释和范围注释.. 疲劳生理;疲劳心理词间关系控制:是揭示词汇之间的等级、等同、相关关系;使之成为语义相关的系统..在主题法中词间关系控制采用设置参照、倒置标题、主标题-副标题以及编制词汇索引系统;如词族索引、范畴索引、轮排索引等..分类语言主要通过类目体系显示词语间的从属、并列、相关关系;用类目参照显示语词概念的横向联系..3.相关因素控制的主要内容领会常用的相关控制包括引用关系、链接关系和用户需求等..①引用关系:这是科学文献中通过相互引用建立的一种关系;通过它;可以根据相互引证关系;提示文献之间内容上的联系..②链接关系:是基于超文本链接技术建立的对象之间的联系..③用户需求:信息组织是为用户服务的;因此用户的检索需求是信息组织的目标和判断信息组织使用效果的重要指标..第三节规范控制的依据1.概念之间的关系类型..①同一关系:“自行车”与“脚踏车”、“电子计算机”与“电脑”..②包含关系:“哺乳动物”与“熊猫”、“图书馆”与“公共图书馆”..③交叉关系:“妇女”与“科学家”、“中等教育”与“业余教育”..④矛盾关系: “核国家”与“非核国家”..两者之和等于上位概念“国家”..“脊椎动物”与“无脊椎动物”⑤反对关系: 中医学与西医学 ..两者之和小于上位概念“医学”..“无产阶级”与“资产阶级”、“有机肥料”与“无机肥料”⑥并列关系:“人造棉”与“锦纶”、“维纶”、“腈纶”2.知识分类:根据知识组织的不同对象和层次;现有的知识组织体系包括:科学分类体系、学科分类体系、事物分类体系、行业分类体系等..见P24-25页表3.阐述文献保证原则和用户保证原则..文献保证原则:亦称文献根据;指信息资源组织应根据信息资源类型、数量等因素进行相应控制..信息检索系统处理的对象是各种类型信息资源;因此要有效进行信息描述及主题内容的组织和提示;离不开对信息资源的内容、特征以及分布状况等的了解..信息资源的数量、特点;往往是影响检索语言详略程序、确定类目或标识设置的重要依据..用户保证原则:指根据用户需要进行描述控制和词汇控制..检索系统是为用户服务的;各种控制和组织措施如不符合用户的检索要求和使用习惯;必然会影响其使用效果..因此对信息检索系统在进行规范控制时;应当有意识地从用户的使用需要出发..4.信息资源组织对分类的借鉴..信息资源组织以知识分类为基础;可以较好的揭示各个领域知识之间的关系和规律性;及时反映各知识领域的进展..可以包括多种层次和方面;如:①作为信息资源分类的基础;用于建立合理的信息组织的结构..②作为基础类目门类的设置依据..③作为主题系统中范畴处理的依据..④作为专门领域下具体类目的设置依据..⑤作为类目之间关系、词间关系处理的依据等..第三章信息描述第一节、信息描述的含义1.信息描述的信含义:亦称信息资源描述;是指根据信息组织和检索的需要;对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动..2.元数据:是关于数据的数据;或关于数据的结构化的数据..其作用主要包括:①识别:确认并对要进行组织的信息资源进行个别化描述;使用户能识别该组织的资源对象..②定位:提供信息资源位置的信息;以便供用户访问时使用..③检索;通过在描述数据中提供检索点;方便用户对资源的检索和利用..④选择;通过记录信息资源的各种特征;供用户对信息资源的使用价值进行判断;并作出选择..3.信息描述的主要标准:① ISBD是国际标准书目着录的英文缩写;由国际图联IFLA1969年制定的供各类信息资源描述用的国际标准..②文献着录总则我国于1983年7月发表的全国文献着录总则..③DC:是都柏林元素集的简称;1995年3月在美国小镇都柏林创建的元数据描述方法;是对网络资源描述最着名、最有代表性的标准..第二节信息资源描述项目、标识和描述级次1.信息描述项目:亦称着录项目;是用以揭示文献内容和特征的记录事项..2.基本描述项目的内容:我国国家标准文献着录总则规定基本描述项目分为9个大项目;依次为:题名和责任者项目;版本项;文献特殊细节项;出版发行项;载体形式项;丛编项;附注项;文献标准编号及有关记载项;提要项..都柏林核心集分15个大项:题名;创作者;主题;描述;出版者;参与者;日期;资源类型;格式;资源标识;来源;语言;关联;覆盖范围;权限管理..3.掌握文献着录格式;描述各项目内容:如下图:图:文献着录格式4.着录详略级次参见P41图3-3;图3-4;图3-5简要级次:仅记录主要项目的级次;一般为小型文献单位;基本级次:记录主要项目的同时;记录部分选择项目..最常见详细级次:记录主要项目和全部选择项目上..适合国家书或集中编目使用..描述信息源:又称着录信息源、着录根据;指进行信息资源描述时描述信息的来源和出处..第三节检索点和规范文档1.检索点是指检索信息资源使用的题名、责任者、分类号、主题词等供检索使用的各种数据..2.标目的含义及作用..标目即手检系统中的检索点;是记录中用来作为排检依据的资特征..标目有两个作用:①作为排检的依据;确定一款目在检索系统中的位置;供检索查找..②决定款目的性质;供组织相应检索工具使用..3. 参照法的含义和类型..参照法是指引用户从检索工具中的一个标目或款目去查找另一个标目或款目的方法;其作用是指引检索系统中检索对象之间的联系;说明检索系统的编制和使用方法..分为:①单纯参照;又称直接参照;从不用作标目的标识去查找用作标目的标识..②相关参照;又称兼互参照;从一个使用的标目去参考另一条或几条相关标目的参考..③一般参照;又称普通参照;是提供关于一定编目事项的说明;介绍用户使用系统的方法..4. 名称规范文档:是一种对描述记录中的名称标目进行规范控制的工具..其处理的范围;包括人名、机构团体名、着作题名等.. P455.题名检索点的选择方法:P43①文献描述中着录的正题名一般直接选作标目..② 适当选择副题名和附注项中的合辑题名作标目..③ 并列题名在我国中文手工检索工具中一般不选作标目..④ 一文献的题名检索点一般不宜超过两个;但题名分析款目不受此限制;可根据需要设置..6. 个人责任者检索点的选择方法:①描述记录中第一责任者、两人合着中的第二个责任者名称均可以作标目..但3人以上合着时只以第一责任者名称作标目..②如可能;文献责任者中记录的其他责任方式的责任者亦可选择作为标目..③附注项着录的责任者;以及其他有关责任者;一般不作标目;但在必要时;着名学者或着名着作的责任者也可作标目..④以书名命名的编写组不作检索点、临时性写作团体如无检索价值;也不做检索点..⑤丛书综合款目的责任者选择与单书相同;分散着录时;单书作者可选为第一责任者..如果编者为出版社则不编制责任者综合款目..当分析出来的材料的责任者与原书责任者不同时;应选其为分析款目的责任者检索点..⑥一文献责任者检索点的数量一般不超过4个为宜..7.规范文档:是信息组织的一种需要;它是对元数据记录的标目进行控制、跟踪、维护工具..包括名称规范档、主题规范档等.. 其中;名称规范控制是根据确定标目的需要;规定统一使用名称的活动;范围包括人名、团体名、题名等..规范控制的作用是:1有利于以统一的方式加以记录..2以规范、通用的形式加以记录..3方便标引和检索..4有助于实现国际书目共享..第四节计算机编码1.MARC-Machine readable cataloging;机读编目格式是根据文献特点和文献机构之间信息交换的需要建立的标准化的计算机可读形式..MARC中一个编目记录的结构四个部分2.分隔符:P52页分隔符用于分隔不同数据集合;分为字段分隔符和记录分隔符两种..字段分隔符以“”表示;用于标志字段结尾..记录分隔符用于标志记录的结束;以“”表示..3.计算机编码的作用..P501用以显示..2提供检索点..3可以对数据进行一体化处理;促进资源共享..第四章信息描述工作第一节信息描述工作概述1.信息描述工作:依据描述规则;对信息资源的特征进行分析、选择、记录的操作过程..2. 元数据在检索系统中的作用:向用户提供信息资源的目录学信息;供使用者确认信息资源;进行选择元数据的各种特征也是进行组织和检索的依据;是建立检索工具的基础和前提3.信息描述工作的方式类型分类依据工作方式类型描述的资源对象文献编目、档案编目、博物馆藏品编目、网络资源编目操作的设备条件手工编目、机读编目、联机编目处理方式原始编目、复制编目编目过程的组织形式集中编目、共享编目4.在版编目:是集中编目的形式之一;是指在文献出版过程中进行编目;使编目数据得以与文献一起提供;方便文献机构使用..5.大规模的信息资源描述网络——书目机构Bibliographic Utility的出现..这些机构将联机环境、网络环境与信息描述的形式结合;同时结合采用集中编目和协作编目的方式;为有关文献单位提供书目资源和服务..OCLCOnline Computer Library Center;为全美国和国外进行书目服务的机构RLINResearch Library Information Network;该网络开始于1967年;是一个为美国研究图书馆服务的系统UTLASUniversity of Toronto Library Automation System;该系统最早为多伦多大学图书馆的自动化系统;目前已扩大成兼为其他图书馆服务的系统中国高等教育文献保障体系CALIS;管理中心设置在北京大学图书馆;是我国高等学校信息资源的联机编目网络..6.元数据工作的规范要求如下:P58准确:对信息资源的描述应真实反映其内容特征..规范:信息资源的描述应严格遵守相应的描述规范;并在可能时依据相关的规范文档或控制词表..完备:描述项目应比较完备;使得可以从信息资源的各种特征出发进行检索操作..7.信息描述工作程序1查重:就是确定某一信息资源是否已经收入系统..作用:避免不必要的重复劳动;保证对信息资源描述和处理的一致性..2描述:描述操作通常应根据描述规范进行;规范化是信息资源描述的发展方向..3标引:分析信息资源的内容属性特征及相关的外表属性;并用特定的语言表达分析出的属性或特征;从而赋予其检索标识的过程..在此处主要指分类标引、主题标引..4复核:包括检查描述项目是否完备;准确;分类标引、主题标引的结果是否符合系统的要求等..8.Connexion元数据的创建方式:①对已有的记录修改完善..②克隆clone相关记录;进行修改..③创建新元数据记录..第二节信息描述方法1.文献着录总则对题名的分类..P67 ;各种题名书上的例子要知道1正题名:单纯题名、交替题名、合订题名..2并列题名:又称平行题名;对照题名;指见于书名页;与正题名语种不同的题名..3副题名:为解释或从属于正题名的另一题名;应记录于题名之后;以“:”为标识..4说明题名文字..2.责任者的类型和责任方式..责任者说明由责任者和责任方式组成..责任者指对信息资源的生产负有责任的个人或团体..个人责任者可以是一人或多人;集体责任者可以则指机构团体、会议活动等.. 责任方式表示责任者对文献所作的贡献类型..传统文献通常有着、编、改编、执笔、口述、译、注、点校、作词、作曲、绘等多种形式..3. 载体形态项、的含义和类型..载体形态项是一个记录文献物质形态特征的项目..包括:数量、图、尺寸或开本、附件等.. 文献特殊细节项是为某些特殊类型文献特征的着录设置的项目..如:连续出版物的卷、期、起讫、地图比例尺、投影法等;主要用于记录个别重要文献特征..4. 关联项的类型.P71关联..主要用于表达一信息资源与其他信息资源的联系..有七种类型:1部分、全部关联..2版本关联..3格式转换关联..4参照关联..5替代关联..6附属关联..7一致关联..5.检索排检项的类型..检索排检项通过对检索点的提示;供手工检索系统编制使用..通常包括四个方面:文献题名、责任者名、主题词、分类号..6. 传统文献着录总则与都柏林核心集的特点和异同..同:1完备的描述项目2都对描述的等级、标识以及规范的使用作出相应的规定3都具有比较强的扩充性、兼容性异:1针对传统文献描述和识别的需要设置2对传统资源特征的描述项目的设置详尽;针对网络资源的描述项目相对比较概括3各描述项目有明确规定的次序和等级4对描述的表达有严格要求5采用人工标识;适合专业文献单位使用;是一个以文献专业人员为处理主体的描述规范.. 第五章分类法第一节分类法概述1.分类:是指依据事物的属性或特征加以区分和类聚;并将区分的结果按照一定的次序进行组织的活动..分类是人类思维的基本形式;是认识世界的基本方法..2. 信息资源分类:根据信息资源的内容属性和其他特征;将资源分门别类地、系统地组织和揭示的方法..3. 信息资源分类一般具有以下特征:1按照信息资源内容特征的相互关系加以组织;使得信息资源成为一个根据其远近亲疏组织而成的具有等级性、次第性的系统..2一般是从一定的角度出发组织信息资源的按学科集中;按主题分散..3以一定标记符号作为排序工具..4一般通过类目索引提供从字顺角度查找类目的途径..4. 对信息资源进行分类的作用意义1进行资源组织..2建立分类检索工具..3分类统计..4兼容工具..5. 分类法是一种从主题内容角度组织和揭示信息资源的方法;是分类方法在信息资源组织中的应用..6. 分类法的类型以及各类型的典型代表信息资源分类法按照其编制方式;通常可以区分为:①等级列举式分类法..美国的杜威十进分类法Dewey Decimal Classification;简称杜威法或DDC美国国会图书馆图书分类法Library of Congress Classification;简称国会法或LCC 我国的中国图书馆分类法简称中图法等..②分面组配式分类法..冒号分类法Colon Classification;简称CC布立斯书目分类法二版 Bliss Bibliographic Classification;简称BC2③列举组配式分类法..国际十进分类法Universal Decimal Classification;简称UDC俄国的图书馆书目分类法7. 等级列举式分类法的特点、不足..特点:①从一定的角度出发有层次地揭示信息资源;类目展开比较系统;②分类结构显示直观;易于把握、便于使用;③标记简明;号码单纯;适于分类排架;也可以用于组织分类检索工具..不足:①揭示专门主题能力差;往往无法满足确切分类的需要;不能充分揭示现代文献中大量存在的细小专深主题;。
笔记3—《信息组织》01

《信息组织》总结笔记information organization2013年9月30日第一章 导言第一节 信息组织的必要性1、人类社会由信息社会向知识社会迈进,信息资源开发利用受到重视;2、信息资源特点:数量大、种类多、来源广;信息资源数量的急剧增加。
3、无序的信息资源加剧信息增长与使用的矛盾。
——信息超载,知识缺乏4、原始信息只有将其有效的组织,按特定需要集中和揭示,才能产生价值。
信息组织:为了有效开发利用信息资源,对信息资源加以控制和处理。
5、信息组织,也称为信息资源组织,是根据使用的需要,以信息资源为对象,通过对其内容特征等进行分析、处理等,并以适当的方式加以提供的活动。
6、数据:一般是指经过直接观察获得的对客观对象的记述。
(原生态,未经处理的) 信息:经过人类处理的数据,是供交流共享的知识。
7、社会信息的传播形式有:口头方式、传统的出版方式、电子方式等;以记录形式进行信息交流,能够克服直接交流的时空局限;8、信息资源一词与文献含义接近,通常是指一切以记录形式存在的信息载体; 信息资源基本类型:图书、期刊、报纸、论文、标准、档案等;信息资源存在形式:印刷型、缩微型、视听型、机读型、光盘型、非实体型(如网络);9、信息组织就其组织和揭示的层次而言,可以是直接以信息资源的存在形式为处理对象,例如直接以图书、期刊、网站等为处理单元;也可以以期刊、报刊、网站中的个体为处理单元;还可以选择其中的信息成分作为处理单元。
10、信息组织的目的:是根据使用需要建立起信息资源收藏系统和检索工具,以便利信息资源的开发利用。
它是为了检索利用的需要对信息资源进行组织,与信息检索密切相关。
11、信息检索系统,包括信息组织和检索两方面。
信息资源————→信息特征————→标引记录————→信息分析 词汇 控制 排档控制语言或规则提问分析 词汇 控制 匹配用户提问————→信息特征————→ 提问档 ————→(1)信息组织是依据信息资源的主题内容或特征,将无序的信息资源组织为有序集合的过程。
《信息组织》复习

信息组织复习第一章1•信息组织、检索语言的基本概念。
信息组织:亦称信息资源组织,是根据使用的需要,以信息资源为对象,通过对其内容特征进行分析、选择、处理、序化,并提供的活动。
检索语言:是一种由表达信息资源主题概念及英相互关系的词汇及规则组成的人工语言系统,也称情报检索语言匕2•信息组织与信息检索的关系。
信息组织是信息检索的基础和前提。
信息检索是信息组织的岀发点和归宿。
两者既有区别,又相互依存.相互作用、互为因果。
3•根据对象与特点划分,检索工具有哪些类型。
检索工具类型有:文献目录、索引、机读数据库、网络搜索引擎*4•两种基本检索途径及其特点。
1 •以信息资源的外部特征为检索依据,进行检索的途径。
特点:迅速.确切地查找特左文献,必须预先掌握相应的数据。
2•以信息资源的主题内容为依据,进行检索的途径。
主要有分类法和主题法。
特点:不必事先了解相应的数据,可直接从主题内容查找;但不如前一种方法直接和准确。
第二章1•检全率、检准率的基本概念。
检全率=(检出相关文献数/系统相关文献总数)*100%o检准率二(检出相关文献数/检出文献总数)*100%o2•信息组织中规范控制包括:描述控制、词汇控制、句法控制。
第三、四章1 •信息描述、元数据.检索点.MARC格式.计算机标识语言的基本概念。
信息描述:亦称信息资源描述,是根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择.记录的活动•元数据:是关于数据的数据,或关于数据的结构化的数据。
MARC格式:是机读编目格式的简称,是根据文献特点和文献机构之间信息交换的需要建立的标准化的讣算机可读形式。
计算机标识语言:是一种利用特泄的文本句法描述信息资源的语言,目的是用来界左文献的结构成分以作为未来计算机处理之用。
第五章第一节1•信息资源分类、等级列举式分类法、分而组配式分类法的基本概念。
信息资源分类法分:等级列举式.分而组配式、列举组配式。
《信息学概论》第3章 信息组织、存储与检索

3.1 信息组织概述
3.1.3 信息组织的研究内容
20
信息组织的研究领域包括三个层次:理论层面、规范层面和 操作层面。
理论层面:研究信息组织的基本规律和理论基础,为规范
层面和方法层面提供理论依据,指导信息组织的实施。
规范层面:为信息组织的操作实现建立描述规范、检索语
言和标记语言。
操作层面:在理论层面的指导下,遵循规范层面规定的规
信息流向明确。根据用户信息活动特征和信息环境的变化适 当调整信息流动的方向。 信息流速适度。不适当的信息流速对人的决策效率会有负面 影响。
3. 信息组织的目的
降低社会信息流的混乱程度;提高信息产品的质量和价值; 建立信息产品与用户的关联;节省社会信息活动的总成本。
3.1 信息组织概述
3.1.2 信息组织的理论与方法 1. 信息组织的理论基础 (1) 系统科学理论
7
Ilya Prigogine 1969。耗散结构理论主要讨论一个系统从混 沌向有序转化的机理、条件和规律,研究耗散结构的性质及 其形成、稳定和演化的规律。它指出,一个远离平衡态的开 放系统,当某个变量变化到一定的临界值时,会通过涨落发 生突变,即发生非平衡相变。原来的混沌无序状态就有可能 转变为一种空间、时间、功能有序的新状态。这种在远离平 衡态的非线性区形成的宏观有序结构,需要与外界不断交换 物质和能量才能保持一定的稳定性,或不再因外界的微小扰 动而消失。这种需要耗散物质和能量才能维持其有序性的结 构称为耗散结构。
3.1 信息组织概述
14
信息学研究信息系统由旧结构不断演变为新结构这一过程的 规律性,而协同理论正是以不同学科中现象复杂多样但宏观 质变行为却遵从共同规律的系统为研究对象。这就提供了运 用协同理论方法研究信息学问题的可能性。这种研究的优越 性还在于,信息系统是随时间变化的动态的开放系统,其内 部存在着众多相互作用的子系统,运用协同理论无需从微观 上具体掌握其中每一个子系统的细节,使用少量序参量就可 以表征系统的宏观特性(有序度),进而可以用序参量方程 描述系统由旧结构向新结构转变的复杂过程。
信息组织考点
名词解释1、信息组织:也称为信息资源组织,是根据使用的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等进行分析、选择、处理、序化,并以适当的方式加以提供的活动。
2、检索语言:是一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,国内亦称为情报检索语言。
3、检全率:亦称查全率、命中率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检索系统中与该提问相关的实有信息资源总量之比。
(检全率=检出相关信息资源量/系统相关信息资源总量*100%)4、检准率:亦称查准率、相关率,指系统实施检索时检出的与某一检索提问相关的信息资源量与检索出的信息资源总量之比。
(检准率=检出相关信息资源量/检出信息资源总量*100%)5、词汇控制:指根据信息资源标引和检索的需要,对自然语言中的词汇进行选择、规范并揭示其相关性的过程。
6、句法控制:指根据信息资源标引和检索的需要,通过一定的组词造句的规则,对检索语词的组合方式作出规定。
7、引用次序:亦称为组配次序,指复合主题标引和检索时,各个主题因素的组合次序。
8、概念:是表达事物对象的特有属性或本质属性的思维方式,是检索系统交流的内容。
概念包括内涵和外延,内涵是指概念的定义,即所反映的对象的本质属性的总和;外延是指具有该属性的事物对象,即概念所包括的范围。
9、文献保证原则:亦称文献根据,指信息资源组织应根据信息资源类型、数量等因素进行相应控制。
10、用户保证原则:用户保证,是指根据用户需要进行描述控制和词汇控制。
11、信息描述:亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。
12、元数据:所谓元数据是关于数据的的数据,或关于数据的结构化的数据。
13、检索点:指检索信息资源所使用的提名、责任者、分类号、主题词等各种供检索使用的数据。
14、标目:即手检索系统中的检索点,是记录中用来作为排检依据的资源特征。
信息组织考试重点
一、信息组织概述信息组织:根据信息检索与获取的需要;采用一定的规则技术与方法;对信息进行揭示与序化的过程..核心内容是对信息的描述、揭示与序化..知识分类:包括学科分类和事物分类;能将客观世界千差万别的事物以及各种学科根据当代科学认识的最新成就构成一个严密的、有科学认识意义的体系..类目:类是指具有某种共同属性特征的事物的集合;在文献分类法中称为类目;是构成分类法的基本单元;其中表示类目的名称叫做类名;类目的代号称为分类号..文献分类标准:又称文献分类根据;是指划分某类文献所依据的某种属性特征..一般文献分类均以文献的学科属性为主要标准;而以文献的其他属性为辅助标准..这些属性包括文献类型、载体形态、时代、地狱或使用对象等..选用何种分类标准以及分类标准的应用次序直接影响分类体系的结构与分类表的质量..文献分类:依据一定的分类体系文献分类法;根据文献的内容属性和其他特征;对文献分门别类的、系统地组织与揭示的方法..列举信息组织的常用法方法:1.分类组织法:是根据某一特定的分类体系和逻辑结构组织信息的方法..其原理是按照一定的知识概念体系的梳妆等级结构或分面结构组织信息;从而使信息按学科、专业或组面等逻辑顺序排列;形成信息的逻辑分类整序体系..2.主题组织法:直接以表示文献主题的语词做标识;提供字顺检索途径;并主要采用参照系统揭示词间关系的标引和检索文献的方法..3.集成组织法:将多种信息组织方法结合起来使用的方法;如分类主题一体化组织方法..简述分类法的主要类型1.体系分类法是直接体现知识分类的等级制概念的标志系统;主要依据概念的划分与概括的原理;将概括文献信息内容及外表特征的概念进行逻辑分类和系统排列;并赋予类号的方式建立起来概念;是一种将类目层层划分、等级分明的标记系统..2.组配分类法主要依据概念的分析与综合原理;将文献、信息、事物的主题概念组成“知识大纲-分面-亚面-类目”的结构;按照一定的组配规则;通过各个分面类目之间组配来表达文献主题的一种分类法..冒号分类法、布里斯书目分类法是典型代表..3.体系-组配分类法是介于体系分类法与组配分类法之间的一种分类法..基本上是体系分类法大量采用分面组配方法的结果;具有直观性较强、较强的文献主题概念的组配功能;如果国际十进分类法..简述确定分类标准及其运用次序的依据1.符合读者的检索要求与检索特点..不仅要适应不同职业、文化层次的用户的检索需求与特点;还要按照用户而不同需求集中有关文献..检索需求的不同为我们确定分类标准及运用次序提供了参考依据..2.按照学科、专业分类的一般依据..3.基本遵守概念的划分规则;但有时可不受其限制..划分后子项外延之和等于其母项;划分后子项必须是相互排斥的;每次划分必须按照同一标准进行;划分必须逐级进行..当需要突出某类文献时;也可以不严格遵守“换分必须逐级进行的规则”..简述主题法的含义及其特征主题法是一种直接用规范化语词作为概念标识、按子顺序列组织、并用参照系统等方法间接显示概念之间相互关系的揭示文献主题内容的方法..有标题法、叙词法、关键词法三种类型;其基本特征是:1.用自然语言中的名词术语经过规范化后直接作为文献主题标识;直观性强;2.用字顺序列作检索标识;易于使用;3.按文献主题集中文献;特性检索功能强;适合于从事物出发按专题进行特定文献的检索;4.通过参照系统揭示主题之间的相互关系;建立词与词之间的语义关系;5.由于主题法是按文献的主题集中文献;对于文献的学科专业属性和范畴的揭示不如分类法;系统性较差..依据构成原理划分;主题法有哪些类型1.标题法..标题表是一部标题词典;他将概念用规范化的自然语言构成先组标题作为文献主题的标识;以字顺进行排列;并对标题建立词间关系的参照系统;是最早的一种主题语言..2.叙词法..又称主题词法;是一种从自然语言中精选出来、以概念组配为基础、经过严格的词汇控制而发展起来的知识语义网;一方面通过词间关系建立特定的概念;另一方面通过范畴表、词族索引为每一个概念在知识语义体系中定位..3.关键词法..从文献题名、摘要或正文中;由人工或自动抽出能够表达文献主题;并具有检索意义的词语作为主题标志;并按字顺组织成索引;提供检索途径的方法..同时为适应检所编制自动化的需求而产生生的一种主题语言;直接诶用自然语言中未加控制或制作少量控制的语词表达主题概念..二、体系分类法启用交替类目的方法是:若交替类目与使用类目为同一事物;启用的具体方法为:去掉交替类目的交替符号;删除该类下的注释“宜入XXX”..将原使用类目加上“”;并在该类下加“如XXX”的注释..如果原使用类目下有细目;则要通过仿分形式将其移至启用的交替类目中..多重列类法指在建立类目体系时;对某个类目同时采用几种分类标准;分别建立几组平行子目的方法..其类目所体现的内容是相互交叉的..标记制度的基本类型:一层累标记制又称等级标记值;是一种类号位数与类目等级相适应的标记制度..一般用一个或两个数字或一个字母标记一个大类;再加一位数字或字母标记二级类目;如此层层累加;以表示类目的层层划分..其优点是:分类号能够体现类目的等级关系;表达性强;便于扩大与缩小检索范围..缺点是:类目越细;类号越长;影响号码的简短性;当同位类超过10个时;在采用阿拉伯数字的情况下;难以按等级编号.. 中图法、DDC杜威十进分类法二顺序标记制不按类目等级、只按类目的先后次序分配号码的标记制度..只能反映类目的先后次序;不显示类表的结构特点;从类号上无法判断类目之间的存在关系..其优点是:配号方法简便;类号比较简短;容纳性强..缺点是类号不能体现类目之间的相互关系;表达性与助记性差..三混和标记制将层累制与顺序制结合的标记制度;其基本形式为:顺序--层累制和层累--顺序制..科图法四分面标记制又称分段标记制;是用分面符号将类号分成若干段;每一段代表主题的一个方面;以显示类目组配结构的一种标记制度几种特殊的标记方法双位制..又称百位法;用不带0的双位数字表示各个同位类;共容纳81个同位类;增强了类列的容纳性..借号法..是采用层累标记制时;为增强类列的容纳性而借用下级类类号、上级类类号或同级类类号的一种方法..八分法:又称“扩九法”;是为了适应类列不断扩充而采用的一种编号方法..空号法..为了适应新类目的增加而采用的一种预留一定数量空号码的编号方法对应编号法:对具有相同区分标准的类目;使其相应部分的号码趋于一致;以增强标记符号易记性的一种编号方法..字母标记法..在数字号码后面面增加字母或文字;以实现类列无限容纳性复分表含义:又称附表;辅助表;是文献分类法的重要组成部分;是将主表中按相同标准划分类所产生的一系列相同子目;从主表中抽出来并配以特定号码;单独编列成表;供主表有关类目做进一步复分用的类目表..复分表类型:1.通用复分表..2.专类复分表..3.类目仿分:邻近类目仿分:仿一般性问题或一般着作分..仿全部类表分..4.主类号组配:组配号一般用“:”前后分类号的次序可以调换;即轮排..中图法复分组号加“0”的规则:a、社会科学各类中;凡具有概括性地区的类目;如再依其他标准细分时;组号须在主类号后加“0”再复分;b、社会科学各类中的各级上位类;如再依其他标准细分时;组号须在主类号后加“0”再复分;凡上下位类采用的是非层累制编号法;则无需加“0”;c、在社会科学各类中;凡属越级仿分的;应在复分号码前加“0”;d、仿“一般性问题分”但以下两种情形不加“0”..第一;如果是“一般性问题”仿“一般性问题”分;实际就是临近类目仿分;不加“0”;第二;类目表中有关类目仿“一般性问题”所属子目分时;不加“0”;直接将仿分号码加在有关类目之后..三、组配分类法CC类表结构的五种基本范畴:本体personality P ;逗号物质matter M ;分号能量 energy E :冒号空间 space S . 句点时间 time T 倒逗号分面公式:即分面的组配次序与标记符号;亦即组面公式..依据具体性递减的原则确定次序..组配分类法的标记制度分面标记制:又称分段标记制或多维标记制;是用分面符号把类号分成若干段;是每一段的号码代表主题的一个方面;以显示类目组配结构的一种标记制度回溯标记制:又称回归标记制;是通过直接将分类表的类号与位于其前的组面的类号组合;以表达一个复杂概念的一种标记制度叙词法叙词法:是从自然语言中精选出来、经过严格的词汇控制、以概念组配为基础表达文献主题的主题法类型..叙词法的基本原理是概念组配..概念组配:是建立在概念逻辑关系的基础上;以概念的分析与综合为手段;以揭示概念的本质为目标;利用检索语言中已有的若干概念;组合起来表达一个新的专指概念的方法..本质上是在概念分析的基础上进行概念的综合;其组配的结果所表达的概念与参加组配的概念在逻辑上是有联系的..概念组配是叙词法的基本原理;其类型有:交叉组配:使用两个或多个具有交叉关系的叙词进行组配;组配所表达的概念就是交叉的部分;是参与组配概念的种概念..方面组配:又称限定组配;将表示某一事物的叙词与表示事物某一方面、某一属性的叙词组合起来表达一个新专指概念的组配方法..联结组配:是表示两个概念之间一定联系的组配方法;直接是参加组配概念的某种联系;而不形成新概念;如事物与事物之间的比较关系、影响关系、应用关系等..简述词间关系的种类:1、等同关系;是指正式叙词与非正式叙词之间的关系;是对含义完全相同或相近而词性不同的词所进行规范处理的一种手段2、等级关系;又称属分关系、属种关系与族系关系;是指不同专指度的上位叙词与下位叙词之间的关系1属种关系 2整体与部分关系3、相关关系;是指叙词之间除等同关系、等级关系之外比较密切的关系四、分类主题一体化词表分类主题一体化词表的原理:1.两者均采用了概念逻辑的原理:概念的划分与概括、概念的分析与综合2.都采用了分类的方法:主题法在建立词间关系时用到分类法;是一个隐蔽的分类体系3.基本构件相同:本质上都是对主题的标识;只是形式上不同..分类法以分类号做标志;而主题法以语词为标识..通过一定的方式可以进行转换..4.两者有机结合实现优势互补:即可以进行分类标引又可以进行主题标引;可以在一个检索系统中同时完成主题检索和分类检索;可以集中进行分类表和叙词表的管理..复分表的类型:通用复分表、专类复分表、类目仿分、主类号组配类目注释类型:类目内容注释、类目关系注释、类目沿革注释、列类依据与类目编列方法注释、分类方法注释五、国内外其他主要分类法科图法的标记符号与标记制度:科图法采用阿拉伯数字单纯号码作为标记符号;其标记制度为混合标记制..人大法的标记符号与标记制度:人大法标记符号采用阿拉伯数字..用一位数字或两位数字后加小圆点表示大类..在标记制度上;人大法严格采用层累制;以数字的位数表示类目的等级;每一位类号代表一类;如遇双位数字表示一类;则在后面加注小圆点“·”中档法的宏观结构:由编制说明、中华人民共和国档案分类表、新民主主义档案分类表、民国档案分类表、清代档案分类表组成;均有主表和辅助表组成..杜威十进分类法DDC标记符号与标记制度:DDC采用阿拉伯数字作为标记符号也有少数类目采用拉丁字母或其他符号作为标记符号的一部分;并按照小数值的顺序来排列..DDC基本上采用以阿拉伯数字为标记符号的小数十进制层累标记制..国际十进分类法UDC标记符号与标记制度:UDC类目采取阿拉伯数字作为分类号码;有时也采用字母法;为了醒目和帮助记忆;其类号通常每隔3位加一圆点“.”..UDC基本上采用小数层累制作为标记制度;分类号码的极位体现类目的等级..美国国会图书馆图书分类法LCC的标记符号与标记制度:LCC采用的是英文字母与阿拉伯数字混合的标记符号..LCC基本上采用顺序标记制;类号不能显示类目间的等级关系;只能通过其顺序判断类目的前后位置..类目的等级用字体和缩格来显示.. 分类法的网络版:主要指在英特网上获取、使用、更新的分类法版本;既不同于光盘版的单机版也不同于光盘版的网络版Webdewey的主界面:是在网上获取使用与更新的DDC分类法版本;主界面为:检索界面:提供检索栏、快速使用帮助、大类与复分表的链接..可进行一个条件的简单检索;也提供布尔逻辑的组配检索浏览界面:提供浏览输入框、浏览路径、快速使用帮助、大类与复分表的链接..可从DDC分类号、DSDC相关索引、国会图书馆标题词表等途径进行浏览..中分表网络版主界面浏览窗口:“类目-主题词互对应体系“的浏览窗口和超链接的多窗口..检索窗口:可输入检索词、选择检索方式;进行一体化检索..辅助性窗口:具有辅助功能的窗口..八、网络信息资源的组织网络叙词表的类型1.按网络叙词表的格式分:静态的文本格式叙词表、静态HTML格式叙词表、动态HTML格式叙词表、动态HTML格式叙词表、RDF格式叙词表、XML 格式叙词表和其他相关格式叙词表..2.按涉及的学科专业:专科性网络叙词表..综合性网络叙词表3、按应用于信息系统的方式分:a独立于系统的叙词表; B嵌入检索系统的叙词表..4.按其宏观结构划分:a.仅有字顺的叙词表..b同时拥有字顺表和分类表的叙词表..c建立了辅助表的叙词表知识组织系统:KOS是对人类知识结构进行表达和有组织的阐述的各种语义工具的统称;包括分类法、叙词表、语义网络、概念本体;以及其他情报检索语言与标引语言..分为三大类型:词单词汇、字典、地名表、规范文档、术语表分类与大致归类分类法、知识分类表、大致归类类表、标题表关联组织本体、语义网络、概念地图、叙词表十、文献标引的基本规则与方法文献标引方式:整体标引:概括揭示文献基本主题内容的标引;只揭示有检索意义的整体性主题;“浅表引”..全面标引:对文献论及的所有主题概念;依据各自的学科属性逐一进行标引的方式;深标引..重点标引:多个主题或因素的文献;只选择对用户有检索、参考价值的部分予以标引的方式..综合标引:是针对丛书、多卷书、论文集、会议录及连续出版物等类型的文献;以其整套文献的主题为单位进行的一种整体标引方式..分散标引:以丛书、多卷书等整套书的每一种书或每一卷书为单元所进行的标引方式..互见标引:主要用于分类标引;对已标引的文献从另一个学科或角度进行标引的方式..分析标引:在整体标引的基础上;进一步将文献中的部分内容析出;对其所属学科内容进行标引的方式;亦称为补充标引..文献分类基本规则的基本内容1.必须以文献内容的学科或专业属性为主要标准;以其他特征为辅助标准..2.必须体现分类法的系统性和逻辑性..3.必须符合专指性要求;归入最切合其内容的类..4.必须符合实用性要求;归入到用途最大的类..5.并必须遵守分类的一致性原则..同类型或同性质;以及相同主题文献前后归类一致..不能仅凭文献题名篇名的意义进行归类;还必须对文献主题进行周密分析..文献改编1.原则:“在基本不影响用户检索的前提下;把文献改编的工作量降到最低”;凡是可不改编的文献都不改、可改可不改的文献都不改、凡是能通过改目录解决的都不改编文献;只有必须改的才分轻重缓急有计划的改编文献的策略..2.文献改编的程序与组织:1熟悉新版分类法2制定使用本与制定改编计划相结合3确定改编本4逐类改编3. 文献改编的方法:1彻底改编:利用新版分类法的使用本;对本馆书架上的文献及其目录中的分类记录进行重新分编;使之与新编文献的分类排架及分类目录相一致..其优点是能够保持分类目录和分类排架的科学性;便于用户检索与利用图书;缺点是工作量大..2改组分类目录不改分类排架:只修改其目录中的分类号;不对排架号进行修改;被改编文献依旧排在原处..3部分改编:对文献目录中的分类号全部改编;对书架上的文献进行部分改编..部分改编的范围是新版分类法中类目位置关系改变了的类目所对应的文献;新版中新增加细的类目所对应的文献则不用改编..4新、旧分类排架与分类目录并存的方法:采用旧版分类法分辨的文献不改编;启用新版分类法分编新书;分别建立各自的分类排架体系与检索系统..中文文献主题标引引用次序:A主体因素A1研究对象;A2材料;A3方法;A4过程;A5条件等——B通用因素——C空间因素——D时间因素——E文献类型因素选定标引词的优先顺序:1.首先选用最专指的标引词2.没有合适的专指词时;应选择最直接、最相关的若干主题词进行组配3.若果采用组配不能达到标引文献主题的要求时;应选用最直接的上位词进行标引..4.上位词不合适;选用最相关的主题词进行靠词标引5.对比较重要而且标引频率较高的一些主题概念;使用增词标引..6.如果某主题的重要程度还不足以作为新增词或有关专用名称;可采用自由词标引主题词组配规则:当此表中没有与文献主题概念直接相对应的专指主题词时;应优先选用两个或两个以上相关的主题词进行组配标引..应注意以下几点:1主题词组配原则上应是概念组配..2.参与组配的主题词必须是与文献主题概念关系最密切、最接近的主题词.3.组配的结果必须概念清除、准确;避免模糊性和多义性..十一、各类型文献与各学科文献标引方法多主题文献标引方法:并列关系主题文献的标引方法:上位类——重点——互见从属关系主题文献的标引方法:大主题——小为重则小应用关系主题文献的标引方法:论述一种理论、方法、工艺、材料、设备、产品等在某一主题或学科方面的应用的文献;归入到应用的主题或学科所属类目论述一种理论、方法、工艺、材料、设备、产品等在多个主题方面应用的文献;按理论、学科等本身的学科属性归类..某一事物或学科应用到另一事物或学科;而产生交叉学科主题的文献;一般归入应用到领域中的有关类目影响关系主题文献的标引方法一多对一;入受..一个主题或多个主题影响另一主题的文献;归入受影响的主题类目..一对多;入一.. 一个主题对多个主题产生影响的文献;一般按产生影响的主题归类..因果关系主题文献的标引方法:一对一;入结果..一对多;入原因..比较关系主题文献的标引方法:重点或赞同可互见——多则入概括性类目工具书的标引方法:1、参考工具书的标引方法综合性参考工具书;归入综合性图书的有关各类..专科性参考工具书;按其学科属性归入有关各类;并依总论复分表分..社会科学、自然科学综合性工具书除外..2、检索工具书的标引方法:综合性的目录、文摘、索引;归入综合性图书类的相应类目..专科性的目录、索引、文摘;也入综合性图书类..组配编号法..入有关各类;则用总论复分表号码:“—7”专书索引;随原书归入相应类目;但马列索引;入马列大类..3、语言工具书标引方法:除专科性词典入有关各科外;其他语言工具书集中归入语言学有关各类..十二、信息组织环境的变化与发展趋势信息组织的发展趋势1.信息组织工具的网络化传统知识组织体系为适应网络环境的要求;逐渐实现电子化、网络化..知识组织工具的网络化是指提供web化的检索界面与系统化的资料内容..2.信息组织结构可视化可视化是图形可视化工具方式显示知识组织系统的结构;可视化工具主要包括概念图、思维导图、语义网络、思维地图等..3.信息组织系统间的互操作互操作是“不同系统平台或编程语言间交换和共享数据的能力”;发展趋势是将多类型、多语种的知识组织体系整合在一起;实现异地跨系统的浏览和检索..4.内容揭示与标引的深入化知识元形成文献-知识元抽取-知识元链接-新的知识单元组成知识成果的过程5.信息组织方法的综合利用数字图书馆或网络信息组织中需要多种知识组织系统;才能满足用户多样化需求..。
名词解释信息组织
名词解释信息组织
嘿,你知道什么是信息组织吗?信息组织啊,就好像是给一堆杂乱无章的拼图碎片找到它们合适的位置,让它们拼成一幅完整又清晰的画面!比如说,你有一堆各种各样的书,乱七八糟地堆在一起(就像我以前的书桌那样!),这时候信息组织就发挥作用啦!它会把这些书按照类别呀、作者呀等等进行分类整理,让你能一下子就找到你想要的那本书。
信息组织可不只是简单的分类哦!它还像是一个神奇的指挥家,能把海量的信息有序地排列起来。
想象一下,一个巨大的图书馆,里面有成千上万本书(哇塞,那可真是书的海洋呀!),如果没有信息组织,你怎么能快速找到你需要的知识呢?它让这些信息变得有规律、有系统,就像给信息搭建了一个舒适的家。
再打个比方,信息组织就如同给一条混乱的街道画上清晰的交通标线(你想想那种混乱不堪的路口!),让信息的流通更加顺畅。
它能帮助我们在信息的海洋中不迷失方向,快速准确地找到我们想要的宝藏。
咱就说,在这个信息爆炸的时代,信息组织是不是超级重要啊?没有它,我们不就像无头苍蝇一样乱撞啦?我们的生活、学习、工作,哪一个能离开信息组织呀!所以呀,要好好重视信息组织,让它为我们的生活增添更多的便利和效率。
信息组织,就是这么神奇又不可或缺!。
信息组织概述PPT课件
❖ 信息是负熵(申农《信息论》) .
13
什么是知识?
❖知识是能够指导思考、行为和交流 的正确和真实的观察、经验和过程 的总结。知识包含真理和信念,观 点和概念,判断和预期,方法和诀 窍等内容,也可以理解为用于解决 问题的结构化信息。
.
14
Worlds of Knowledge
(from Popper’s Objective Knowledge) ❖ World 1 is the physical world
❖ “Information is commonly used to denote some population of objects to which some significant probability of being usefully informative in the future has been attributed.” -- Buckland, 1991.
但却处于一种无法获取自己所需信息的尴尬
局面,反而造成信息使用率的不断下降。奈
斯比特认为:失去控制和无组织的信息在信息
社会不再构成资源,相反,它成为信息工作
者的敌人。现在人们正面临着信息多而乱与
人们接收信息的有限性、信息需要的特定性
之间的矛盾。
.
3
信息组织的原因—信息无序
❖ 信息的无序状态可以从两个角度来认识:
.
25
信息组织的目标功能
减少社会信息流的混乱程度。有效减除或减少杂乱无关 信息的干扰,使信息特征得到充分显示
准确控制信息流的流速与方向,使其在适当的时候以适当的方 式传递给适当的人。
建立信息产品与用户的联系。即根据用户需要设立各种检索点,
构建利用渠道,建立用户和资源之间的联系;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
环境模型 "an archive, consisting of an organization of people and systems, that has accepted the responsibility to preserve information and make it available for a Designated Community." OAIS 信息模型
信息组织
刘志辉 科学计量与评价研究中心 2015-10-20
查询
检索结果
标引 匹配 信息资源
相关性反馈
信息检索系统
Description
大纲
信息资源描述技术 信息资源标引技术 信息资源封装技术
信息组织
体系分类法:DDC(Dewey Decimal Classification)
分类组织法
Is created by
1 信息资源描述技术
1.3 FRBR
Work Work Expression Manifestation Has as subject Has as subject Item Person Corporate Body Concept Has as subject Object Event Place
FRBR : MODS : SGML : XML :
RDF
:
Resource Description Framework
1 信息资源描述技术
1.3 FRBR
书目记录功能需求(Functional Requirement for Bibliographic Records) using the data to find materials that correspond to the user’s stated search criteria (e.g., in the context of a search for all documents on a given subject, or a search for a recording issued under a particular title); using the data retrieved to identify an entity (e.g., to confirm that the document described in a record corresponds to the document sought by the user, or to distinguish between two texts or recordings that have the same title); using the data to select an entity that is appropriate to the user’s needs (e.g., to select a text in a language the user understands, or to choose a version of a computer program that is compatible with the hardware and operating system available to the user); using the data in order to acquire or obtain access to the entity described (e.g., to place a purchase order for a publication, to submit a request for the loan of a copy of a book in a library’s collection, or to access online an electronic document stored on a remote computer).
1 信息资源描述技术
1.3 FRBR
书目记录功能需求(Functional Requirement for Bibliographic Records)
Group1 智力或艺术产品: Work Expression Manifestation Item
Group2 责任人: Person Corporate Body
2 信息资源标引技术
2.5 Semantic Web
3 信息资源封装技术
3.1 非内容封装
仅包含信息资源对象的访问信息,提供对这些资源对象的目录级指引和链接,并不把 这些资源对象物理地存在到一起。 电子出版物标准(Electronic Publication, EPub) 元数据编码与传输标准(Metadata Encoding and Transmission Standard, METS)
功能模型
OAIS 环境模型
-
Producer
OAIS archive
Consumer
Management
OAIS 信息模型
-
OAIS 功能模型
-
推荐阅读
[1]V.Bush. As We May Think [2]真溱,等.信息组织技术发展现状与趋势[A].情报学进展[M].国防工业出版社 [3] Eileen Svenonius. The Intellectual Foundation of Information Organization
示例
1 信息资源描述技术
1.2 信息资源元数据技术
从信息资源的外部特征中选取需要描述的元素,并对这些元素的名称、标签 、语义、格式等进行设定的相关标准规范与技术。
MARC 1960s CCF 1984 MARC II(LCMARC) 1968 USMARC 1983 TEI 1987 EAD 1993 DC 1995 FRBR 1998 MODS 2002
2 信息资源标引技术
2.1 分类模式
重点在于揭示概念间的等级关系,目前应用最广、发展最为成熟的信息组织体系,包 括标题表、范畴表、分类表、层级表、Folksonomy等。
主要由主表、标记符号、复分表、类目注释系统和类目索引构成; 利用术语间的等级关系描述知识结构框架,不易于知识更新;
《杜威十进分类法》(DDC) 《国际十进分类法》(UDC) 《美国国会图书馆分类法》(LCC) 《冒号分类法》 《中国图书馆图书分类法》 《中国科学院图书馆图书分类法》
MAchine Readable Cataloging Common Communication Format Text Encoding Initiative Encoded Archival Description Dublin Core Functional Requirements for Bibliographic Records Metadata Object Description Schema Standard Generalized Markup Language Extensible Markup Language
《国际标准书目著录》(International Standard Bibliographic Description,ISBD)
《英美编目条例》 1967:Anglo – American Cataloging Rules ,AACR
1978:AACR2 2005:AACR3:RDA(Resources Description and Access)) 中国 ISBD=>GB/T3792 《文献著录》系列国家标准 AACR=>《西文文献著录条例》
组配分类法:CC(Colon Classification) 体系-组配分类法:UDC(Universal Decimal Classification) 标题法:LCSH(Library of Congress Subject Headings)
信息组织
主题组织法
单元词法 叙词法:汉语主题词表 关键词法
Weaklystructured
Synonym Rings Authority Files Term List Glossaries/Dictionaries Gazetteers Pick lists
强调概念 定义与理解,接近自然语言, 不涉及语义关系 Controlled Language
Natural Language
2 信息资源标引技术
2.2 关联组织模式
重点在于揭示概念间的各种关系,除等同、等级、相关关系外,还包括整部、蕴含、 因果等语义关系,以及一定的规则和推理,包括叙词表、概念地图、语义网、本体等。
传统关联组织模式又被称为主题法;
包括:标题法、元词法、叙词法、关键词法; 分类法主题法一体化趋势:分面叙词表、分类主题词表、集成词表 《美国国会图书馆标题法》(LCSH) 《美国医学标题法》(MeSH ) 《国防科学技术主题词典》 《汉语主题词表》
元数据
索引文摘法 本 体 语义网
索引法 文摘法
信息组织
编 目
信息资源描述技术 外部特征描述与转录
元数据 分类模式
信息组织
信息资源标引技术
关联组织
内容特征概念及其相互关系描述与揭示 信息资源封装技术 已描述分散资源的整合与长期保存
1 信息资源描述技术
1.1 信息资源编目技术
以特定顺序记录或转录信息资源元数据元素的相关标准规范与技术。
语 义 层
MARC I 1966
合并 CANMARC CWMARC 1992
MARC21 1997
UNIMARC 1977 Z39.2 1971 ISO2709 1977 GB/T2901 1981
语 法 层
HTML 1993 XML 1998 RDF 2004
SGML 1985
MARC : CCF TEI EAD DC : : : :