信息描述与揭示

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

主题
MARC著录的优缺点
序号
MARC优点
1 著录信息丰富
2 实现规范控制
3 方便访问,便于计算机处理
4 便于实现资源共享
5 有专门机构进行维护和修订
6 提高图书馆工作效率
MARC缺点 编目人员的高要求性 MARC格式著录单元的限制 MARC的标识系统的难阅读性 对多媒体信息描述不够 使用环境和范围的限制 FRBR(书目记录的功能需求)对MARC 的冲击
子》《汉斯和格莱特》等。
接上表 字段 333 606 606 690 690 701 702 801 801
905
920 920 998
字段内容
$a: 外国文学爱好者、青年读者及相关读者。
$a: 英语 $A: ying yu $x: 汉语 $x: 对照读物
$a: 童话 $A: tong hua $j: 作品集 $y: 德国 $z: 近代
源自文库
MARC记录基本格式
记录头标区
位于每个记录的起始位置,是对一条记录 的总体说明,由24个字符组成固定长,为 计算机处理提供基本参数,概括了该记录 各方面的特点,供计算机识别该记录使用。 该区没有指示符和子字段代码。
可变长字段 由两部分构成:控制字段和数据字段
S T
W O
地址目次区 由计算机系统自动生成,每个目次区 款目项共12个字符位,可分为3个部 分:字段标识符、字段长度、字段起 始字符位置。
01 主题分析
在了解和确定文献的内容属性及帮助揭示内容的 某些外表属性(如文献类型)之后将这些属性概 括为主题并用自然语言表述,同时分析主题概念 之间或主题概念因素之间的结构关系
02 转换标识
用专门的主题概念或主题概念因素之 间的结构关系
信息标引就是用特定检索标识揭示文献内容。
2 标引语言
标引语言是表达文献主题概念和检索需求主题概念的简明性、单义性和关联性的概念标识系
统,是根据索引和检索需要而编制的一种专用语言或标识系统。
先祖式语言:指标识在编表时(标引前)就已经组合好,标引和检索时 不必或
减少进行组配的标引语言,如主题法中的标题法就属于这种类型。
按照标识组合 时间先后
后祖式语言:指标识主要供组配使用,而且标引时不将标识符组配在一起,到
检索时才将标识组配起来的标引语言,如主题法中的单元词法、序词法就属于 这种类型。
统,是根据索引和检索需要而编制的一种专用语言或标识系统。从用途来说,但这种语言用于标引 和索引编制工作时,称为标引语言;当应用于信息检索工作时,又称检索语言、索引语言。
按照信息组织 的思想方法
分类语言:用分类号表达主题概念,依据知识分类将主题概念组织、排列类目体 系,主要以类目体系的自身结构显示概念之间关系的标引语言。以学科、专业为 中心的系统性是其主要特点。可细分为体系分类语言、组配分类语言、体系—
散组式语言:指标识主要供组配使用,而且标引时就要将表达主题概念的若干个
标识组配在一起的标引语言。
2 标引语言
标引语言是表达文献主题概念和检索需求主题概念的简明性、单义性和关联性的概念标识系
统,是根据索引和检索需要而编制的一种专用语言或标识系统。从
按照标识的规 范和受控程度
受控语言:指信息组织的标识词汇以及信息检索的索引词汇在使用前经过优选和
PA R T
小结
谢谢观看
献分检索标识(分类号)的过程。
主题标引:指对文献进行主题分析,用主题语言(主题法)表达分析出的主题,赋
予文献主题检索标识(标题词、序词等)的过程。
5.3.2 机读目录著录(MARC)
PA R T
在全球的发展概述
美国MARC
MARC (Machine Readable Catalogue)是“机器可读目录”,是以代码形式结构和特定结构记录 在计算机存储载体上的,可用计算机识别与阅读的目录。
$a: H319.4:I516.88 $v: 4
中图分类号
$a: H319.4:I $v: 5
$a: 格林 $A: ge lin $f: (1786-1859) $4: 著
$a: 章艳 $A: zhang yan $4: 译
$a: CN $b: DUFL $c: 20170518
$a: CN $b: SUL $c: 20170627
规范化处理,并且整个语言经常处于某权威机构或检索系统的管理之下。又称为规 范化语言。
自然语言:指标引词汇和索引词汇直接来自所处理的文献本身,使用前未经优选和
规范化处理。
3 信息标引的类型 信息标引的类型取决于表达文献内容的标引语言的种类,因此信息标引主要分为分类标引和主
题标引两种类型。
分类标引:指文献进行主题分析,用特定的分类语言表达分析出的主题,赋予文
文献语种
$a: CN $b: 110000
出版国
$a: y z 000fy
$a: r
$a: 格林童话精选 $A: ge lin tong hua jing xuan $d: = Grimm fairy tales $f: (
德 )雅各布?格林, (德) 威廉?格林著 $g: 章艳译 $z: eng
$a: 北京 $c: 中译出版社 $d: 2017
$b: SD12000001391798-
800 $d: H319.4:I516.88 $e: 4744 $f: 3 $r: CNY22.00
$a: 221400 $z: 1
$a: 214010 $z: 1
$a: Error:parameter Length is bigger than Str.length()!
5.3信息的描 述与揭示
讲解人:杨柳
5.3.1 信息标引
PA R T
1 标引的基本概念
信息标引,是指分析信息想象的内容属性(特征)及相关外表属性,并用特定语言表达分
析出的属性或特征,作为信息存储和检索依据的处理过程。它是在对文献信息对象分析基础环节
上发展起来的,故又称为文献标引。
信息标引过程环节
记录终止符 ASCII的控制字符1D(十六进制), 紧跟最后一个数据字段的字段终止符 后,是一个MARC记录的最后字符, 表示该MARC记录的结束。
记录头标区 地址目次区 可变长字段 记录终止符
图4.1MARC逻辑结构图
字段 001 005 010 099 100 101 102 105 106
$a: 173页 $d: 23cm
$a: 双语名著无障碍阅读丛书 $A: shuang yu ming zhu wu zhang ai yue du cong
shu $i: 经典集锦
$a: 《格林童话》原名《儿童与家庭童话集》,第一辑出版于1812年,包含了86篇
故事,本书收录了格林兄弟15则最著名的童话故事,包括《灰姑娘》《渔夫和他的妻
—组配分类语言。
主题语言:是一种由受控语言的自然语言语词直接表达主题概念,按语词字顺序排 列主题概念主要用参照显示概念之间关系的标引语言。以事物为中心的直接性是 其主要特点。可进一步划分为标题语言、单元词语言、序词语言、关键词语言。
2 标引语言
标引语言是表达文献主题概念和检索需求主题概念的简明性、单义性和关联性的概念标识系
MARC标准的国际化
1973年,国际标准化组织讲MARCII规定为国际标准(ISO 2709) 1977年,国际图联(IFLA)推出UNIMARC 1984年,联合国教科文组织(UNESOO)推出CCF(Common Communication
Format,公共交换格式) 1992年,中国正式推出CN-MARC
200
210 215
225
330
字段内容
01h0554830
控制号
20170627175647.0
处理时间
$a: 978-7-5001-5002-2 $d: CNY22.00
国际标准书号ISDN
$a: CAL 012017079395
$a: 20170220d2017 em y0chiy50 ea
$a: chi $a: eng $c: ger
相关文档
最新文档