中国农业大学_839信息管理与情报学基础_《信息管理概论》柯平 笔记

中国农业大学_839信息管理与情报学基础_《信息管理概论》柯平 笔记
中国农业大学_839信息管理与情报学基础_《信息管理概论》柯平 笔记

信息管理概论笔记

1.信息管理学——The Introduction To Information Management

2.信息管理——Information Management

3.国际标准书号——International Standard Book Number

第一章.信息与信息管理

数据、信息、知识和情报是信息与信息管理领域的起点和基石,同时这些概念和它们所代表的外延之间又存在着极为紧密的天然的联系。

1.数据(data)—未经整理的、可被判读的数字、文字、符号、图像、声音、样本等

信息(information)—在特定情况下经过整理的、表达一定意义的数字、文字、符号、

图像、声音、信号等

知识(knowledge)—在信息这一原材料的基础上形成的见解、认识

情报—被已知的需求者所寻求的知识或信息

数据、信息和知识之间的关系:不能简单理解为相交或不相交,相关或不相关,三者具有独立内涵和典型的外延所指,是转化过程的递进链,是加工组织程度的等级链,是价值量的等级链。

2.信息的性质和特征—⑴信息存在的普遍性和客观性

⑵信息产生的广延性和无限性

⑶信息在时间和空间上的传递性—信息产生于事物的存在和运动,但信息可以独立与其

发生源而相对独立,可以由其他物质载体携带在事件或空间中传递。

⑷信息对物质载体的独立性和依附性

⑸信息对认识主体的相对性—由于人们的观察能力、认识能力、理解能力和目的不同,

他们从同一事物中获得的信息量也不同,即使他们的这些能力和目的完全相同,但他

们在观察事物时,选择的角度不同,侧面不一样,它们所获得的有关同一事物的信息

肯定也不同。

3.分类:⑴按信息的性质—语法信息、语义信息和语用信息

⑵按信息的内容—经济信息、科技信息、政治信息、文化信息、政策法规信息、娱乐信息

⑶按信息的流通渠道—正式信息、非正式信息

⑷按信息的记录方式—语声信息、图像信息、文字信息、数字信息、计算信息

分类目的:为了认识信息的性质和特征,以便描述信息和处理信息。无论从什么样的角度进行划分,不同种类的信息之间并没有绝对的界限,彼此之间互有交叉重叠。尤其是我们从内容角度对信息的

划分更是如此。

4.信息流与物质能量流一样,在其运动过程中要经历相同的阶段和过程。

物质、能量与反映它们存在和运动的信息是一一对应的,有多少种物质和能量及其在各不同方向的运动,就有多少种信息与之对应。

5.社会信息化—指人类社会发展过程中的一种特定现象,在这种现象出现时,人类对信息的依赖程度越来越高,而对物质和能源的依赖程度则相对降低。

社会信息化层次:⑴通过自动控制、知识密集而实现的生产工具信息化;

⑵通过对生产行业、部门以至整个国民经济的自动化控制而实现的社会生产力系统信息

化;

⑶通过通信系统、咨询产业以及其它设施而实现的社会生活信息化

社会信息化的进程是一个由内圆到外圆逐步渗透扩散、发展的演变过程。

[注:1992年,克林顿提出“信息高速公路”计划]

6.信息管理的实质—人类综合采用技术的、经济的、政策的、法律的、人文的方法和手段对信息流(包括非正

规渠道和正规渠道中的信息流)进行控制,以提高信息利用效率、最大限度地实现信息效

用价值为目的的一种活动。

7.信息管理是一个非常综合性的领域,其理论方法涉及计算机科学、信息科学、图书馆学、情报学、社会学、管理学、经济学、法学、心理学、伦理学等众多的学科。

围绕信息管理的理论与实践已经形成了许多独立的学科领域,如信息组织、信息检索、信息系统、信息用户、信息经济、信息市场、信息法学等等,它们从不同的侧面研究和解决社会信息流的控制问题,形成了各具特色、相互补充的学科群。

8.信息管理的历史沿革:

⑴传统管理阶段—这一阶段以信息源管理为核心,以图书馆产生和长期存在为象征,同时也包含档案管理

和其他文献资料管理。

早期的图书和档案的社会机构是“同源”的。随着社会经济、科技和文化发展,文献记录的类型大量增加图书馆作为最初的文献收藏机构,逐渐与档案馆分流,成为知识和文献收集、整理和提供利用的社会信息交流中心机构,即形成了独立意义的图书馆。

[标志:图书馆的存在和管理]

⑵技术管理阶段—这一阶段以信息流的控制为核心,以计算机为工具,以自动化信息处理和信息系统建造为主要工作内容。

计算机具有科学计算功能和信息(数据)处理功能。

计算机发明研制不到10年就被应用于图书馆的文献信息加工和管理,目的是要提高文献信息加工处理和查找效率,实现对文献信息流的控制。

技术管理阶段着眼于用计算机技术处理信息并对信息流进行控制,技术因素占主导地位,技术专家唱主角。

⑶资源管理阶段(Information Resource Management)—取代过去单纯以信息技术(Information

Technology)进行信息管理,主张对信息资源要运用技术、经济人文的手段,进行统筹规划全面管理,即管理特征是自上而下的集中式的可控的个性化的实时的管理。

特征:资源管理阶段不能把信息资源整合的问题简单看做一个专业或技术性层面的问题,而是一个综合治理的问题,应当在政府统一规划和统筹规划协调下组织实施。

资源管理阶段信息资源管理着眼于对人类信息过程的综合性、全方位的控制和协调,这一新概念的提出基于两个原因:

①技术管理阶段纯粹的技术手段不能实现对信息的有效控制和利用,因而提出信息资源管理这一新兴

的管理模式;

②当代社会经济发展使得信息成为一种重要的资源的背景下,迫切需要从经济的角度思考问题。

信息资源管理的局限性:①仅关注显在知识尤其是记录性信息的管理而忽略了对另一类十分重要的知识

——隐性知识的管理,从而大大限制了其管理范围和信息管理效能的发挥

②仅仅关注人类智力劳动的最终成果——记录型信息,对获得这一成果的学习与创

新过程却视而不见,因而无法将信息的吸收与创造(生产)过程纳入管理范畴,

不能实现全方位的信息管理。

③仅仅关注将信息提供给利用者,而对利用者其需求信息的根本原因重视不够,致

使它难以将信息升华为知识,从而限制了信息效用价值的实现。

④仅仅关注信息在组织内部的免费流动,未能将信息看做一种资产,以资产管理的

方式来管理和运作信息,从而忽视了信息的增值问题,影响了组织对信息的评价。

⑷知识管理阶段(Knowledge Management)—在组织中构建一个人文与技术兼备的知识系统,让组织中的

信息与知识通过获得、创造、分享、整合、记录、存取、更新等过程,达到知识不断创新的最终目的,并回馈到知识系统内;个人与组织的知识得以永不间断的积累,从系统的角度进行思考,这将成为系统的智慧资本,有助于企业做出正确的决策,因应市场的变迁。

知识管理简单地说就是对企业的知识资源进行管理的过程,如果对知识进行搜集和整理,如何使每一个员工都最大限度的贡献出其积累的知识,是企业实现知识的共享,就是企业进行信息,进行知识管理的主要目标,知识管理要求企业实现知识的共享,运用集体的智慧,提高企业应变和创新能力,是企业能够对外部要求做出快速反应,并利用所掌握的知识资源预测外部市场的发展方向及其变化。

第二章信息管理的基本原理

?信息管理原理: 信息管理活动本身所具有的普遍的规律。

?本章将从信息管理活动的角度,研究信息源与信息组织、信息流与信息管理、信息宿与信息使用,和信息资源开发与利用。

?本章搞清楚:

信息源、信息流、信息产品

信息组织的概念

信息资源开发利用的概念

2.1信息源与信息组织

(1)概念

顾名思义,即信息的源头。

信息源:产生信息、获得信息的来源。

事物、人、组织等都可以产生信息,故都可以成为信息源。

研究信息源的主要目的——便于信息的采集。

1.信息源

(2)分类

按照不同标准,可以将信息源分为多种类型。

①以组织边界来区分,可分为

内部信息源——来自组织内部,一般较可靠;

外部信息源——从外边收集或购买而来。

②以信息的运动形式来区分,可分为

静态信息源、动态信息源。

③以应用领域来区分,可分为

科技信息源、经济信息源、文化信息源、政治信息源等。

1.信息源

下面是几种常见的信息源:

(1)个人信息源

也称口头信息源(通过口头交流获取)。

特点:及时快捷;主观随意;强化感知;瞬时性。

(2)组织机构信息源

组织机构是各级各类信息集中和发布信息的重要地点和源泉。

权威性——准确、可靠

垄断性——有时不对外公开自己拥有的信息,仅为该机构内部享用。

(3)文献信息源

现代社会最常用、最重要的信息源。

文献——记录有知识的一切载体。

物质载体有:印刷性文献、缩微性文献、声像文献、机读性文献。

特点:

系统性——知识型,富含智力性劳动;

稳定性——已固化,可稳定地传播;

易用性——使用者不受时空、方式限制;

可控性——便于管理和控制;

时滞性——编制需花费一定时间(可与新颖性对应)

4)数据库信息源

数据库具有一定方式和结构,含有大量相关数据,利用计算机技术来管理和维护。

特点:便于管理、查询、共享、更新等。

(5)实物信息源

一切自然物、人工制品、及事物发生的现场,均可视为实物信息源。

特点:

直观性——实物最为直观、生动、形象

真实性——事物是实实在在的,从中可获得第一手完整可靠的消息

隐蔽性——往往需要仔细观察和分析,才能剖析出本质属性

零散性——实物的时空分布散乱、混杂,无规律可循

第三章信息管理的组织与方法

1 信息管理的组织

1.信息管理机构

从事信息管理业务、实施信息资源的管理,都需要相应的组织机构或部门。政府、企业无一例外。

信息管理机构,即信息资源管理的主体单位。

讨论2个问题:

信息职能部门、信息管理组织体系

(1)信息职能部门

a. 信息使用部门

从用户需求角度,将信息用于分析研究、解决问题、管理决策等。

b. 信息供应部门

作为信息源提供的场所。对某个单位,有内部和外部信息。

c. 信息处理部门

使用各种方法、技术、工具对原始数据进行处理。

d. 信息咨询部门

帮助用户利用相关信息。

e. 信息管理部门

负责协调各信息有关部门的工作,保证信息资源有效的开发利用。(视为核心部门)

(2)信息管理组织体系

①信息主管部门

关于企业中的信息机构与其他部门间的关系,有两种基本模式:

a.水平式:信息部门与其他部门并列,受企业最高管理层领导。(需要有最高管理层领导分管和协调)

b.垂直式:把信息部门置于整个管理层次的顶层。

(有利于信息化或信息战略实施)

随着企业对实施信息管理的重视程度提高,逐渐分离出一个独立的直属部门——信息主管部门,其领导人就是信息主管(CIO)。

CIO通常由企业的副总经理或副总裁兼任。

(2)信息管理组织体系

①信息主管部门

关于企业中的信息机构与其他部门间的关系,有两种基本模式:

a.水平式:信息部门与其他部门并列,受企业最高管理层领导。(需要有最高管理层领导分管和协调)

b.垂直式:把信息部门置于整个管理层次的顶层。

(有利于信息化或信息战略实施)

随着企业对实施信息管理的重视程度提高,逐渐分离出一个独立的直属部门——信息主管部门,其领导人就是信息主管(CIO)。

CIO通常由企业的副总经理或副总裁兼任。

2.信息主管(CIO)

(1)概念与起源

信息主管,Chief Information Officer,CIO。

也译作总信息师、信息总监。

定义(美国权威的CIO杂志):

CIO是负责一个公司(企业)的信息技术和系统的所有领域的高级官员。

·知识结构:技术和业务;

·任务:指导公司IT利用,监督技术的获取、实施,立足于战略;

·地位:通常归公司执行主管(CEO)领导,常在最高领导层拥有一席之地。

2.信息主管(CIO)

(1)概念与起源

CIO起源:

CIO概念最早出现于20世纪70年代末80年代初

CIO职位出现于80年代中期(政府、企业)

1984,美首先出现政府CIO,紧接着美、加出现信息部长/大臣。后来CIO引入企业。

有人对世界500家大企业调查,40%的设有CIO;

日本有21%的企业设有CIO。

(2)CIO的职责和角色

基本职责有三个方面:

一、从公司全局角度,考虑信息工作的发展规划,服务于公司发展目标。

二、熟悉公司各业务部门信息流的关系,综合协调各部门的信息工作。

三、能够数据处理、网络通信、计算机处理等方面的工作统筹安排。

进一步说明:CIO是全面负责信息工作的主管;统管整个组织的信息资源的最高负责人,也是信息管理专家。

第四章信息获取

了解各种信息源及其特点,掌握信息评价的一般指标,能有效进行信息评价及其选择,掌握信息获取效率的一般指标,熟悉信息获取的途径和方法。

1.信息的获取和搜集是信息管理的首要环节,施展开信息服务的物质基础。

信息管理学将信息源和信息的获取作为主要的研究对象之一。

2.信息源—人们在科研活动、生产经营活动、文化活动和其他一切活动中所产生的成果和各种原始记录,以及对这些成果的原始记录加工整理所得的成品(如数据库、文摘索引杂志等等)都是借以获得信息的源泉,简称信息源。

3.信息源的划分:传播方式→⑴按性质—口传信息源(智力信息)、文献信息源(记录型信息)、实物信息

⑵按时间—先导信息源、即时信息源、滞后信息源

⑶按加工—零次信息、一次信息、二次信息、三次信息

4.从便于对信息进行管理的角度将信息划分:

⑴记录型信息—按物质载体:印刷型、微缩型、计算机阅读型、网络型、视听资料

按内容、性质和加工:一次信息—凡是在科研、生产、经营、文化及其他各类活动中

产生的原始信息,称为一次信息。如期刊论文、研究报告、

市场调查报告、专利说明书及各种网络信息;

二次信息—是对一次信息进行加工整理后产生的一类信息,如书目、

题录、简介、文摘等形式的检索工具。二次信息的重要作用,不仅

在于报道,更重要的是为查找一次信息提供线索;

三次信息—在一、二次信息的基础上,经过分析、综合而产生的信息。

人们常把这类信息称为信息分析研究的成果,如综述、述评、学科

年度总结、文献指南、书目等;

⑵实物信息源

⑶智力型信息源—由人脑存储

⑷零次信息源—是人们通过直接交流获得的信息,是信息客体的内容直接作用于人的感觉(包括听、视、

嗅、味、触觉)的结果。零次信息具有直接性、及时性、新颖性、随机性、非存储性等

典型特征。

5.有价值的信息—有价值的信息是在特定的问题和状态中被利用并有效发挥其功能的信息,是实现某种目标所需要的知识,是进行决策和选择所必需的资料。必须具备及时性、准确性、综合性、获取简易性、经济性等特性。以及如下6个条件:⑴能及时地以适当的方式提供解决问题所需要的依据;⑵信息符合用户需求的内容;

⑶信息的可信赖程度高;⑷信息具有综合性;⑸信息容易获取(既不是用特殊手段或极少数人才能获取);⑹信息的费用与目标吻合。

6.信息的评价:⑴直接评价法:局限性—第一、对各指标的评分带有极大的主观性,完全取决于信息工作者

个人对信息源的认识和了解。

第二、信息源的价值只有在实际利用中的真正动态,因而不能正确

反映信息源的价值。

第三、上述五项指标也还是不能够完备的。

⑵间接评价法:间接评价法是通过信息用户来评价信息源。以调查表的方式调查用户对信息源

的需求和利用情况,然后由信息工作者对调查所得到的数据进行统计分析和对

比,对信息源的价值作出评定。这种方法的特点是需要信息用户密切配合,工

作量较大,但评价效果较为客观。

评价指标—①评分平均值:m

R m i aij j ∑==1[注:j R —信息源j 的平均评分

m ——被调查人数 ij a —被调查人i 给信息源j 的评分] ②评分比重:

∑∑∑====m

i ij n j m i ij i a a p 1

11[注:j p —信息源j 的评分比重 n ——信息源数

ij a —被调查人i 给信息源j 的评分

m ——被调查人数] ③最高评分频度:m

m p 'max =[注:max p —最高评分频度 m ′——给最高评分的被调查者数

m ——被调查人数] ④平均名次指数:m

C M m

i ij

j ∑==1[注:j M —信息源j 的平均名次 ij C —被调查i 给信息源j 的评分排队名次

m ——被调查人数]

交叉检验—一般把从各个方面获得同一信息,并进行比较评价的方法叫做“交叉检验”。由于信息的比较也是相应的信息源的比较,所以经常注意各种信息源的特点及各自携带的信息、可靠性水平等方面的评价数据,是非常有益的。

7.信息获取的效率指标:

⑴采全率(Recall )—用来衡量切题信息搜集的完整程度,指某一信息系统(信息库)所含的全部切题性信

息(对该系统全体用户而言)在当时系统内外所有切题信息中所占的比例:

R

r P = [注:P —采全率

r —该信息系统中切题的信息

R —当时系统内外全部切题的信息]

⑵采准率(Precision )—用来衡量信息搜集的针对性,指某一信息系统(信息库)所含的全部切题信息(对该系统全体用户而言)在当时该系统所有信息中所占的比例:

Q

r E = [注:E —采准率

r —该系统中切题的信息

Q —系统内所有的信息]

⑶及时率——用来衡量信息搜集的速度,即在最短的时间内完成信息搜集过程的能力。它由搜集过程的每一环节(从信息的产生到其被输入到信息库)所花费的总时间来计算:

∑==n

i i

t T 1

⑷费用率(Cost )—用来衡量信息搜集的资金效率,指用于信息库中单位信息的费用的最低能力。它取决于搜集过程的组织、各环节的技术装备及其他因素:

G

F C = [注:C —单位信息的费用率

F —年度搜集信息的总花费

G —年搜集到的信息量]

⑸劳动耗费率—指信息系统搜集到的单位信息所消耗的最低劳动量,可用搜集过程所有环节的劳动消耗总数来计算:

∑==n

i i

l L 1 [注:L —搜集信息的工作量

i l —单位信息在每一环节中的劳动消耗率]

该指标取决于信息搜集过程的难度、条件、效率等方面的因素。

8.信息搜集的原则:⑴针对性

⑵系统性

⑶预见性—在信息搜集中不仅要充分注意现存的信息源和信息渠道,还要着眼未来,预见可

能产生的新的信息源和信息渠道

⑷科学性—需要经常采用科学方法研究信息源的分布规律,选择和确定信息密度大,信息含量多的信息源

⑸计划性

9.信息搜集的方法与途径:

⑴采购—包括订购、现购、邮购、委托代购等具体方式

⑵调查—包括访谈,对实物、现场的实地考察搜集(如现场调查、访问、发放问卷、样品搜集等等)

⑶交换—利用本系统所拥有的信息源(如出版物等)与其他单位进行交换、互相调剂、互相补充、扩大信

息来源。交换的信息源多属于内部资料、非卖品,不能通过采购或其他方式获得,只有通过交换

取得。

⑷索取—可以通过通讯联系或直接派人联系取得

⑸检索—即以手工方式或计算机方式从各种不同的数据库和信息系统中查寻所需要的信息

第五章信息组织

1.信息组织(Information Retrieval)—亦称信息整序,是利用一定的规则、方法和技术对信息的外部特征和内部特征进行解释和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。

信息的内容特征就是信息包含的内容,它可以由关键词、主题词或者其他知识单元表达。信息组织的基本对象就是信息的外部特征和内容特征。

2.目录系统——Catalogue

关键词——keyworld

摘要——abstract

3.信息组织的基本内容:

⑴信息选择→目的:从采集到的、处于无序状态的信息流中甄别出有用的信息,剔除无用的信息,它是整个

信息组织过程的第一步。

⑵信息分析—信息分析就是按照一定的逻辑关系从语用、语义和语法上对选择过的信息内、外表特征进行细

化、挖掘、加工整理并归类的信息活动。

[地位:它是信息描述与揭示的前提和基础,直接影响着信息组织的质量]

⑶信息描述与信息揭示—

①著录:在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。

著录的结果是款目,它是反映文献内容和形式特征的著录项目的组合。

所谓标目,是从文献内容和形式的某一特征指引排检线索的著录项目。

文献著录标准化是指在国家或国际范围内,对文献著录的原则、内容、格式等作出具有一定约束力的规范。著录的标准化有利于提高目录的质量,生产机读目录,便于通过使用计算机实现编目和

检索的网络化,从而进一步促进文献的交流和充分利用。

[注:国际标准书目著录—International Standard Bibliographic Description 简称ISBD 国际图书馆协会联合会—International Federation of Library Association 简称IFLA

英美编目条例第2版—Anglo-American Cataloging Rules:2 简称AACR2]

②标引:指分析文献的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从

而赋予文献检索标识的过程。

标引语言是表达文献主题概念和检索需求主题概念的简明性、单义性和关联性的概念标识系统,

是根据标引和检索需要而编制的人工语言。从用途来讲,标引语言又称检索语言、索引语言;相对

于自然语言,标引语言又称受控语言、规范语言

文献标引过程一般包括两个环节:a.主题分析 b.转换标示

标引的类型:一。根据构成原理—分类语言、主题语言、代码语言

[分类语言和主题语言是最主要的两类标引语言]

二.按标识组合时间的前后—先组式语言、后组式语言、散组式语言

[标引的种类最主要的是分类标引和主题标引]

信息描述的作用:⑴识别(Recognization)—确认并对要进行组织的信息资源进行个别化描述,使用户

能识别被组织的资源对象。

⑵定位(Postioning)—提供信息资源位置的信息,以便用户访问时使用。它可以是传统

文献集合中信息资源的排列位置,也可以是数据库中的位置。在网

络环境下,则主要为信息资源在网络中的地址,从而可以方便用户

访问资源。

⑶检索(Search/Retrieval)—通过在描述数据中提供检索点,便于用户对资源的检索和

利用。传统检索系统一般需要在描述记录的基础上确定检索

点,组织相应的检索工具,提供各种基本的检索途径;在电

子检索系统中,一般可以利用描述数据和各种特征进行检

索。

⑷选择—通过记录信息资源的特征,诸如主题、作者、类型、物理形式、层次和日期等,

供用户对信息资源的使用价值进行判断,决定是否使用该资源。

[元数据(metadata):元数据是关于数据的数据,关于信息的信息,或者描述数据的数据。它是专门用来描述数据的特征和属性,也是描述和组织信息资源、发现信息资源的语言和工具。

信息描述的结果,是获得描述记录亦即元数据,用作信息资源的代替无组织检索系统。

元数据可以代表信息资源用来组织目录、索引、数据库、搜索引擎等检索系统]

⑷信息贮存—信息贮存是将经过加工整理序化后的信息按照一定的格式与顺序存贮在特定的载体中的一种

信息活动。

信息存储的目的是为了便于信息管理者和信息用户快速的、准确地识别、定位和检索信息。

[地位:信息贮存于各种检索工具中意味着信息组织过程的终结,也即意味着信息检索的开始。]4信息组织的特性:⑴信息组织的渗透性—指信息组织存在于各种信息揭示、存储和检索活动之中。

⑵信息组织的依附性—指信息组织无法独立存在,它要以信息的识别、揭示等活动为前提。

⑶信息组织的增效性—指信息组织可以增加信息传播、检索、利用的效率,是其他信息加工活

动和利用组织的保障。

5.信息组织的原则:⑴客观性原则

⑵系统性原则

⑶目的性原则—信息组织、信息检索和信息传播具有趋于融合的发展态势

⑷现代化原则

6.信息组织的理论基础:

信息组织的最基础理论是语言学、逻辑学和知识分类。

逻辑学是关于思维规律的科学。

信息组织的直接目的是建立信息检索语言,各种信息检索语言都建立在概念逻辑和科学分类基础上。

信息组织的最终成果是建立不同类型的信息系统,因此系统论、耗撒结构理论、协同学理论和自组织理论等也被广泛的应用于信息组织。

[自组织:凡是能够不再借助于外部控制而实现从无序到有序的转变,并维持稳定有序状态的系统,就成为自组织系统。

自组织与系统是密不可分的,自组织是指系统无需外接指令而能够自行组织、自行创生、自行演化,即自主地从无序走向有序。

信息自组织是指作为信息系统组织要素的信息,由于人与人之间、人与系统其他要素之间存在的相关性、协同性或默契性而形成特定结构与功能的过程,也就是信息系统无需外接指令而能自行组织信息,自我走向有序化和优化的过程。

自组织系统与信息系统相比,虽然目的与结构一致,但是人在其中的地位和作用不同。信息组织一定需要人的能动性和目的性去干预和指挥;信息自组织过程中,个人或许带有私人目的,但作为总体的人们是在没有外部指令或者说处于被动状态下,而信息的演化、信息之间的相干与有序化是自主地进行的]

7.网络信息资源描述的相关标准:

⑴MARC(Machine Readable Catalogue)标准:MARC起源于美国国会图书馆于1965年1月提出的“标准

机器可读目录记录款式的建议”。

MARC主要特点:①共包括001~999个字段,其中999字段为用户自定义的字段

②字段内容著录详尽,字段下又设子字段以及重复字段

③字段作用强化,可检索的字段多

④每条MARC记录可分为头标区、目次区、数据区

典型MARC标准:①USMARC(美国国会图书馆机读目录通信格式)

②UNIMARC(国际机读目录通信格式)

③CNMARC(中国机读目录格式)

⑵都柏林核心集(Dublin Core Element Set):由OCLC等组织于1995年提出,1996年12月最终定型。

主要特点:①简单易懂

②运用灵活

③国际通用

④可扩展性

8.信息组织的分类:

⑴文献型信息组织—文献信息都是一定的知识记录在一定的物质载体上的信息形态。每一份文献信息都有

它的外部特征和内容特征。

[注:外部特征指文献的书名、著者、出版者、出版地、版次、刊期、引文及各种编号等。按照文献的外部特征来组织信息,各种因用法、索引法、目录法用得较多,它们主要用于按已知文献的某

些特定要素来查找文献。按文献的内容特征来组织信息,常用的是分类法、主题法、文摘法等,

它们主要用于未知信息的查找,有着更明确的选择意义。传统的图书目录学主要以文献为单位来

组织信息,而信息学则更深入到以文献的每一信息知识单元来组织信息。]

分类:①分类组织法—文献分类是根据文献所反映的内容性质、形式题材和用户用途,分门别类地

系统组织文献的一种方法。文献的体系分类法是以科学分类为基础,运用概

念划分的方法,按照知识门类的逻辑关系,从总到分,从一般到具体,层层

划分逐级展开的层累制号码表示的组织文献的方法。根据这种方法编排的目

录称为分类目录。

分类与归类是互逆的过程,是一个事物的两个方面。

②主题组织法—以语言为基础,用表达概念的词或词组来揭示文献内容的一种方法。

划分:a.标题法 b.单元词法 c.关键词法 d.叙词法

③引用组织法—科学文献的显著特点之一,是作者一般都在文章最后附上所引用的各种参考文献。

科学引文索引—Science Citation Index 简称SCI

④文献型信息的宏观组织

⑵网络信息组织—主题法、分类法仍然是网络信息组织从语义角度的基本组织方法,引用法则是网络环境

下主题树方法和超媒体方法的思想基础。

特点:①信息组织的对象从各种类型的数据发展到更加丰富多彩的信息、信息链,甚至知识;

②信息组织的范围从文献内外部特征深入到信息单元、知识单元;

③信息组织的结果从静态的文本格式发展到动态的多模式连接;

④信息组织的形式从数据结构发展到知识表示,即要求信息组织的透明化、易用性;

⑤信息组织的技术从手工单一发展到半自动化、自动化、智能化,即要求信息组织的标准化、兼容化

划分:①文件方式—文件是计算机保存处理结果的基本单位,很自然的成为网络信息资源组织的一

种方式,也是一种较为古老的信息组织方式。

优点:a.简单方便 b.是贮存非结构化信息的天然单位

缺点:a.难以平衡网络负载与文件数量的关系

b.对结构化信息组织显得软弱无力

c.文件本身可看作信息单元,需要作为对象来管理

地位:文件方式常作为网络信息资源管理的辅助形式,作为其他信息组织方式的补充。

②数据库方式—所谓数据库组织方式,是将所有已获得的网络信息资源以固定的记录格式存

储,用户通过关键词及其相关组配查询,就可以找到所需要的信息线索(及相

关站点链接),并通过信息线索直接连接到相应的网络信息资源。

地位:数据库处理海量信息的能力和优势,使之成为组织网络环境中堆积如山的信息资

源的重要方式

③主题树方式—所谓主题树组织方式,就是将信息资源按照某种事先确定的概念体系结构,分

门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直至

找到所需要的信息线索(即相关站点链接),并通过信息线索直接找到相应的

网络信息资源

④超媒体方式

[对超媒体集中精华的解释:用超媒体方式来组织网络信息资源,就是将网上所能获得的各种媒体(文本、图像、声音、视频、文件、网页、超文本连接网、数据库等)的

相关信息资源利用超文本技术有机地编织在一起。每一个媒体信息为一个节点(node)

或基本单位(unit),节点间以链路(link)相连,将信息资源组织为某种网状结构,

用户可以从任意节点开始,自由跳转,浏览和查询信息。]

9.知识组织(descriptiue definition)—狭义的知识组织是指文献的分类、标引、编目、文摘、索引等一系

列整序。广义的知识组织是针对知识的两要素进行的,是知识因子

的有序化和知识关联的网络化。

特征:⑴自动化—在无人干预的情况下按规定的

⑵集成化(integration)—集成是内部互相联系、融合为一个整体或一体化。集成的技术基础信

息基础(以数字化和网络化为标准的),信息集成服务提升服务能力的

主要服务形式,信息集成和系统集成的发展促进了信息集成的变革。

⑶智能化—指对象具备灵敏准确的感知功能、正确的思维与判断功能,行使有效的执行功能。

知识表示—所谓知识表示,是指把知识客体中的知识因子和知识关联表示出来,以便人们识别和理解知识。

知识表示是知识组织的基础与前提,任何知识组织方法都要建立在知识表示的基础上。知识表示

有主观知识的表示和客观知识的表示两种。

知识组织技术与方法—⑴分类法和主题法是客观知识组织的基本工具

⑵数据仓库和知识挖掘(knowledge mining/discovery)是主体知识组织的工具

[数据仓库的特征在于面向主题、集成性、稳定性和时变性]

第六章信息检索(Information Retrieval)

1.1950年,穆尔斯首次提出信息检索。

2.信息检索—

定义:我们认为信息检索是根据特定的需求,运用某种检索工具,按照一定的方法,从大量文献中查出所需的资料或信息的过程。

通常将满足信息用户的信息需求而建立的,存储经过加工了的信息集合,拥有特定的存储、检索

与传送的技术装备,提供一定存储与检索方法及检索服务功能的一种相对独立的服务实体(包括

人和检索工作单位),统称为信息检索系统(Information Retrieval Sydtem 简称IRS)。

[人、检索工具(包括设备)和信息资料是信息检索系统的三个基本要素]

划分:⑴按存储和检索的内容划分:

①文献检索—回答的是诸如“关于铁路大桥有哪些文献”之类的问题

②数据检索—回答诸如“世界上最长的铁路大桥有多长”之类的问题。(数据型)

③事实检索—回答诸如“世界上最长的铁路大桥是哪条”之类的问题。(非数据型)

⑵按检索系统中信息的组织方式划分:

①全文检索

②多媒体检索

③超媒体检索

⑶按检索性质划分:

①定期检索—又称为SDI检索

②回溯检索—也称为追溯检索

⑷按检索要求划分:

①强相关检索—强调查准率

②弱相关检索—强调查全率

信息检索需满足的特性:

⑴信息检索的相关性—信息检索系统针对用户的查询,从文档中检出的文档与查询之间的一种匹配

关系

⑵信息检索的不确定性—语言本身的特性决定了在标引和检索词的选用中都存在不确定性。

⑶信息检索的逻辑性——信息检索作为信息管理的核心,具有非常强的逻辑性。在检索语言方面,

检索词作为检索语言的典据性文本,其自身编排具有很强的逻辑性;在检索策略的研究方

面逻辑性表现的更为明显。

2.信息检索的四个发展历程:

⑴手工检索阶段(1876-1954)—信息检索源于参考查询、文摘索引工作,较正式的参考工作是由美国图

书馆和高校图书馆与19世纪下半期发展,到20世纪40年代,咨询工作

的内容又进一步,包括事实性咨询、文摘、专题文献检索提供文献代译。

检索从此成为一项独立的用户服务

⑵脱机批量处理检索阶段—1954年美国海军机械实验中心使用IBM701型号系统,701初步形成了计算机情

报检索系统,这也预示计算机检索系统为代表的信息检索自动化时代的到来,单

纯的手工检索和机械检索都或多或少显露出各自的缺点,因此极有必要发展出一

相关主题
相关文档
最新文档