《信息组织》知识点汇总
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《信息组织》知识点汇总
第一章第一节、信息组织的必要性
1.信息组织:根据信息检索的需要,以文本及各种类型的信息资源为对象,通过对其内容特征等的分析、选择、
标引、处理,使其有序化并以适当方式加以提供的活动。
2.信息组织的目的:是根据使用需要建立起信息资源收藏系统和检索工具,以便信息资源开发和利用。作为一种为
了检索利用的需要对信息资源进行有序化组织的活动,它是与信息检索活动密切联系的。
3.信息检索:根据检索需要,从检索系统中检出相应信息资源的过程。
3.信息资源:通常指一切以记录形式存在的信息载体,只是比较而言,更侧重于对新型媒体形式的强调。(可以是图书、期刊、报纸、论文,也可以是网络上的电子资源)
4. 信息组织与信息检索有什么关系?
(1)信息组织是信息检索的基础和前提,只有对信息资源进行处理和有序化信息系统之后,才能准确有效查找相关信息资源;
(2)信息检索则是信息组织出发点与归宿,用户的检索需要是组织信息的主要依据。
第二节、信息组织的形式和检索途径
1.文献组织的基本排列方式:
一般有两种基本排列方式,其一为:(固定排列法)和(按一定意义的次序排列。)
(固定排列法,如档案、博物馆的收藏、光盘、录音带、缩微品。
按一定意义的次序排列,如图书、期刊等)
2. 按照检索工具的对象和特点,可以分为(文献目录)、(索引)、(机读数据库)、(网络搜索引擎)四种类型。
3. 按照标识特征,检索工具可以分哪两种基本类型?
(1)以信息资源的外部特征(形式特征)为检索依据,提供以信息资源形式特征为标识检索途径。常见的信息资源形式特征有责任者名(即作者和与资源形成相关的人或机构,如译者、改编者、修订者等)、题名、机构名、标准书号、专利号、文献登录号(或顺序号)等。
(2)以信息资源的主题内容特征为检索依据,提供从资源内容进行检索的途径,主要有(分类法)、(主题法)。
4.按照系统中所用的标识是否进行控制,检索工具可以分为(受控检索系统)与(自然语言检索系统)。
5.按照系统中标识组配的特点,检索系统可以分为(先组式和后组式两种)。
6.检索工具还可以按照采用的形式,分为卡片式、书本式、缩微式、电子方式等。
第三节.信息组织的处理方式和研究内容
1. 检索语言:一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,也称情报检索语言。
2.知识组织系统:知识组织系统通常指经过组织的知识结构表达的工具,它试图包含组织信息和促进知识管理的各种类型的词表,其范围从传统的地名表、同义表,到新型的知识组织工具。
3.信息处理的基本做法:(领会)
1)描述信息资源。以便识别与确认它,主要方法是著录、编写题录和资源形式特征的描述;
2)浓缩信息资源内容。主要方法是编写内容提要或文摘,供用户了解、选择和判断信息资源;
3)提供检索点。主要方法是确定特定资源的标索特征(或标识)与可检信息。信息资源的检索点有代表其内容特征和形式特征的各种标识,如题名、责任者、分类号、主题词或关键词等
4.信息组织活动的内容:(领会)
信息组织活动包括两个基本方面:
(1)信息组织的操作。指根据信息资源的内容和特征,对信息资源进行描述、标引、并将其组织进相应系统的过程。(2)信息资源的组织规范。这是根据信息组织的需要,按照信息资源的特点预先确定的规则和方法系统,是进行信息组织操作的依据。
第二章信息组织原理第一节对信息组织的要求
1、信息组织的主要目的是为了有效地检索和利用。一般认为下述因素是一个信息组织系统必须考虑的重要因素:(1)检全率(2)检准率(3)检索速度和系统的及时性(4)系统的易用性(5)检索的成本效益
1. 检全率:检全率亦称查全率、命中率,是指一次检索中检出的与提问相关的信息资源数量占系统中所有与提问相关的信息资源数量的比例,
检全率=检出的相关信息资源量/系统中相关信息资源总量子数×100%
2.检准率;检准率亦称查准率、相关率,是指检出的相关信息资源的数量,占检出的全部信息资源数量的比例。
检准率=检出的相关信息资源数/检出的信息资源总数×100%
3. 简述对信息组织的要求。(领会)
(3)检索速度和系统的及时性。检索速度是指用户从实施检索到得到结果化费的时间,它是衡量系统检索速度与使用效果的重要参数。它与系统响应检索的能力、检全率、检准率、资源组织的全理性等因素有关。系统的及时性是指检索工具处理信息和提供信息所用时间较短,能快速纳入、处理和提供信息。
(4)系统易用性。是指标引人员使用检索系统描述、标引资源是否方便和易用;用户使用系统的简易性、方便性与获取信息的容易程度。系统易用性是系统性能的主要因素,决定系统设计改进和发展方向。
(5)检索的成本效益。是指检索系统的成本和效益之比。检索成本包括系统设备费、标引处理费、检索运行费;检索效益指检索系统创造经济效益和社会效益。好的检索系统是低成本高效益的系统。
4描述控制:描述记录一般概要记录下一资源各种基本特征的数据,可以以浓缩的方式集中反映资源的特征和内容。(1)描述项目的控制:根据资源特点选择具有组织和揭示价值的资源特征作为描述的项目。描述项目应该充分反映信息资源的基本特征和数据。
(2)描述文字的控制:规定描述信息资源时所采用的文字,应当准确、精炼、统一、规范。
(3)描述级别的控制:规定对信息资源进行描述的详略程度。应根据不同的使用对象和需求、信息资源的特点、设备条件加以确定。
(4)描述格式的控制:包括各种描述项目的次序、描述的标识、描述项目的表达形式等。对此做统一规定的目的是方便不同类型信息系统之间的交流。
第二节信息组织中的控制与规范
1. 句法控制的方法主要有哪些?
句法控制是根据信息资源标引和检索的需要,按照一定的组词造句规则,对检索词的组合方式做出的规定。常见的句法措施有确定引用次序、使用辅助符号和句式转换。
(1)引用次序,是指复合主题标引和检索时,各个主题因素的组合次序。在分类法中引用次序是指类目划分标准使用的先后次序或各主题分面在组配时的先后次序;在主题法中是指字顺检索系统中主标题与各级子标题组合的次序。(2)辅助符号,是揭示主题概念之间的关系意义、进行检索操作的符号。常见的有:
关系符号:是一种用于揭示词语组配中形成的关系类型的符号,通过对组配中关系类型的表达,对标引词进行控制,说明组配性质并有一定的排序功能。
联系符号:是一种揭示同一文献主题之间联系强度的符号,可以防止主题词之间出现误组配。
职能符号:是一种表示主题标识在组配中的句法职能的符号,可以明确一个标识串(句子)中各主题因素的施动-受动作用,明确法含义,提高检准率。
(3)句式转换,是为了使检索句子各个有意义的词素能成为检索入口字,通过对语句中词语位置的变动来增加检索点。常见的有:
轮排转换,将检索语句中每个有意义的词依次排在检索入口,其他词在保持相对位置的情况下移动。
链式转换,以逐次折卸句子链环的方法,将每个有检索意义的的词语依次排在检索入口。
分析转换,在一个检索词句中,每次抽取少量的词组配成标题,依次把每个有检索意义的词排在检索位置上。
2. 词汇控制的范围是什么?(领会)
词汇控制:即根据标引和检索的需要,对自然语言中的的词汇进行优选、规范、揭示相关性的过程。
(2)词汇控制的主要措施包括:
同义控制:是对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达。包括对同义词、准同义词及部分专指词与泛指词进行的控制。同义控制常用的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立用代参照,便于用户从非规范词找到规范词。同义控制的作用是可以克服一义多词的自然语言现象,把相同内容或特征的信息资源集中在一起。如:自行车代脚踏车单车
词义控制:是对同形异义词和语义含糊的词进行控制,使词义明确,一个词语只表示一个概念,以控制一词多义现象。词义控制常用的方法是在词后加限义词,在词下增加含义注释和范围注释。疲劳(生理);疲劳(心理)词间关系控制:是揭示词汇之间的等级、等同、相关关系,使之成为语义相关的系统。在主题法中词间关系控制采用设置参照、倒置标题、主标题-副标题以及编制词汇索引系统,如词族索引、范畴索引、轮排索引等。分类语言主要通过类目体系显示词语间的从属、并列、相关关系,用类目参照显示语词概念的横向联系。
3.相关因素控制的主要内容(领会)
常用的相关控制包括引用关系、链接关系和用户需求等。