经典:第3章-信息著录和标引
第三章 计算机检索基础知识

算机的输入输出装置进行检索,用磁带作存储介质,一般为 连续的顺序检索方式。检索部门把许多用户的检索提问汇总
到一起,进行批量检索,然后把检索结果通知各个用户,用
户不直接接触计算机。
联机检索(on-line retrieval)
60年代末,由于计算机软硬件技术的不断提高,出现了一台主机带 多个终端的联机信息检索系统。联机检索是用户利用终端设备,通 过通信网络或通信线路与检索系统联机,进行“人机对话”,从检 索中心的数据库及时查找所需要的文献信息过程。 80年代,发达国家的一些计算机信息联机检索系统,通过卫星通信
注意:这是一种可以不依赖主题词表而直接使用自由词进行检索的技术方法。不同的检 索系统其位置算符的表示方法不尽相同。
截词检索
截词检索就是把检索词截断,取其中的一部分,在加
上截词符号一起进行检索。
• 主要用于检索词的单复数、词性的词尾变化、词根相同的一类词, 以及同一词的拼法变异等。 • 从本质上说,截词算符是一种逻辑“或”的关系。
对信息内容特征进行标引和对信息外部特征进行著录,形成 一条信息题录,并根据信息内容作出摘要,然后将上述检索标识 与著录项目一并填入工作单,就完成了数据库建设的“数据前处 理”工作。
数据库及其编排结构
• 数据库的类型
• 数据库的构成 • 数据库的记录格式 • 数据库的编排结构
数据库的类型
按照信息处理层次划分:
A AND B:检索词A和检索词B同时出现在一条记录中。 • 其作用是缩小检索范围,提高查准率。
例如:查有关“人口控制”的文献,检索式可写成: 人口 AND 控制
逻辑或(OR)
A OR B:记录中出现检索词A或检索词B或两词同时出现 在一条记录中。 • 其作用是扩大检索范围,提高查全率。
作业:查询资料什么是著录和标引,并自行制作一份著录标引,可以是手工著录标引,也可以是机读著录标引。

作业:查询资料什么是著录,什么是标引,并自行制作一份著录标引,可以是手工著录标引,也可以是机读著录标引。
一.什么是著录1.定义在组织检索系统时,对具体信息的各种形式特征、内容特征及物质形态等进行分析、选择和记录的过程。
通常意义上讲的著录就是指,按照某种标准化的格式和要求(如MARC),对文献的某些被规定的特征进行描述(如责任者、题名、出版社等),形成一条一条的信息描述项,最后著录的结果就是一条关于该信息资源的书目数据记录。
2.著录的基本要求(1)准确化:著录的结果要全面、客观、准确地揭示信息资源的内容特征和形式特征;(2)规范化:要求信息著录坚持标准化著录原则,按照统一的著录项目、著录格式、标识符号等进行著录。
3.著录的作用揭示、组织、检索4.信息著录的标准(1)著录法:关于如何进行著录的具体规定和具体做法。
通常包括著录原则、适用范围、著录项目、著录格式、著录来源、著录文字、标识符号以及各个著录项目的具体细则规定。
(2)常用标准英-美编目条例第2版》(AACR2)、《国际标准书目著录》(International Standard Bibliographic Description)…中国的《文献著录总则》(GB3972.1-83)、《西文文献著录条例》、《连续出版物著录规则》(GB3792.3-85)…MARC、USMARC、CNMARC5.著录格式(1)普通图书卡片式款目著录格式正题名=并列题名:副题名及说明题名文字〔文献类型标识〕/第一责任者;其他责任者.·-版次及其它版本形式/与本版有关的责任者· -文献特殊细节·-出版发行地:出版发行者,出版发行日期(印刷地:印刷者,印刷日期)页数及卷册数:图;尺寸或开本+附件·-(丛编名/责任者,国际标准连续出版物编号;丛编编号·附属丛编)附注国际标准书号;中国标准书号(装订):获得方式提要Ⅰ. 题名Ⅱ.责任者Ⅲ. 主题词Ⅳ.分类号实例乱世佳人=Gone with the wind/(美)米切尔(Mitchell,M.著;黄怀仁,朱攸若译.·-杭州:浙江文艺出版社,1991.41034页;20cm本书另有译名:飘ISBN 7-5339-0367-6:¥10.70Ⅰ. 乱…Ⅱ. ①米…②Mitchell③黄…④朱…Ⅲ.长篇小说Ⅳ.I712.45(2)连续出版物卡片式款目著录格式正题名.分册标识,分册题名=并列题名.并列分册题名:其他题名信息/第一责任者,其他责任者.-版本.-卷期年月标识.-出版地:出版者,出版年.-文献数量;其他形态细节;尺寸+附件.-(丛刊题名;丛刊标识)出版周期附注其他题名分类号主题词ISSN=识别题名6.主要类型信息著录就是按照某种规则揭示某一信息资源的主要特征,给出信息资源的缩影。
《信息组织学》考试复习大纲(详细)

第一章1、信息采集:是指根据特定的目标和要求,将分散在不同时空域的有关信息,通过特定的手段和措施采掘和汇聚的过程。
它涉及一切信息工作中的信息采集活动,包括企业和其他组织的管理者们为了实现决策、管理和控制等目标所进行的信息采集。
2、信息采集渠道:①大众传播媒体②文献③政府机构④合作伙伴⑤消费者⑥信息中介结构3、信息采集方法:问卷调查、访谈、实验研究、文献收集4、信息组织与信息检索的关系:信息检索是根据特定的需求,运用某种检索工具,按照一定的方法,从大量的信息中查找出所需信息的过程。
对信息检索进行完整描述,一般必须包括信息组织和检索两个方面。
在信息检索系统中,信息组织是依据信息资源的主题内容和特征,将无序的信息组织成有序集合。
信息组织是信息检索的基础和前提。
信息组织根据用户需要,以信息资源的一定单元为处理对象,依据预先制定的规范,对其特征加以记录,并进行标引和必要的记录,然后将这些信息记录,按照规定的方式输入检索系统。
第二章1、信息组织:就是人们根据信息本身特点,运用适宜的工具和方法,依据一定的标准或规则,对其进行加工整理,排列组合,使之有序化、系统化、规律化、高级化,增强信息对象的表现效能和运用效能,以满足人们信息需求的过程和活动。
2、信息组织基本内容:按照信息组织的活动类型分“信息选择、信息分析、信息描述与揭示、信息存储”按照信息组织的流程分“信息的筛选和鉴别、信息的分类和排序、信息的著录和标引、信息的编目和组织、信息的分析和研究”3、信息描述与揭示方法:一是著录,主要描述文献信息的形式特征;二是标引,主要揭示文献信息的内容特征。
4、信息组织的类型:信息组织可归为语法信息组织、语义信息组织和语用信息组织三大类型。
从广义上看,信息采集阶段的信息组织主要是一种语用信息组织;信息组织阶段的信息组织属综合型信息组织;信息检索和开发阶段的信息组织则属于优化型语用信息组织。
5、一次信息、二次信息、三次信息:一次信息是人们研究或创造性成果的直接记录,一般指公开出版的图书、期刊论文、研究报告、会议文献、学位论文、专利说明书、网上未经过处理的电子化信息等。
信息著录法

1999年美国与加拿大MARC排除相异性联合推出 MARC21。2001年大英图书馆也宣布采用 MARC21。 由于各国不同的机读编目格式造成书目记录共享障 碍,为了方便不同格式之间的数据转换,国际图联 (IFLA)在1977年推出UNIБайду номын сангаасARC: Universal MARC Format格式。
UNIMARC完全符合国际标准ISO2709的各项规 定,分为头标区、目次区、数据区三个区。 UNIMARC基本保持了MARCII的结构,项目设 置与内容安排大部分相同,通过改进,可容纳各种 类型文献,作为国际机读书目数据交换格式为多国 使用。
CNMARC是中国机读目录(China MachineReadable),用于中国国家书目机构同其他国家 书目机构及中国国内图书馆与情报部门之间,以标 准的计算机可读形式交换书目信息。
著录——指在编制文献目录时,对文献内容和形 式特征进行分析、选择和记录的过程。 文献信息编目工作主要可以分为两大步骤:第一 步是文献信息著录,第二步是目录组织。著录是 编目工作的基础,目录的质量在很大程度上由著 录的质量决定。 款目——指依据一定的规则和方法,对文献特征 与编目业务信息所做的记录。 其表现形式是反映文献内容特征和形式特征的著 录项目的组合,包括描述项目、检索点(标目)、 编目业务注记三部分信息。款目是组成传统目录 的基本要素。
· 传统著录法
传统著录法是相对于MARC(机读目录)著录法 和元数据(DC等)著录法而言的,是指按照《国 际标准书目著录》(ISBD)等标准和规则的要 求统一进行规范化的著录,著录方式是手工操作 或利用计算机进行分项著录,形成规范的卡片目 录,然后由手工编排各款目的著录法。 传统著录法的原理对于理解MARC著录法和以 DC为代表的元数据著录法有着很重要的意义。
全国自考《信息资源管理》真题及答案

全国自考《信息资源管理》真题及答案总分:100分题量:29题一、单选题(共20题,共40分)1.信息按照一定逻辑从低向高运动就构成了A.信息过程B.信息传播C.信息检索D.信息服务正确答案:A本题解析:暂无解析2.一次信息、二次信息、三次信息等的划分依据是A.言息记录方式B.信息存储介质C.信息加工处理深度D.信息应用领域正确答案:C本题解析:暂无解析3.信息资源规划是对组织管理或经营活动所需信息,从产生、获取到处理、传输及利用进行全面规划,不涉及A.业务分析B.数据架构分析C.建立数据标准D.系统设计与开发正确答案:D本题解析:暂无解析4.下列对应于技术实现层面的信息化规划是A.企业资源规划B.信息资源规划C.信息化项目规划D.信息化战略规划正确答案:C本题解析:暂无解析5.公司信息化存在的最大问题是公司分散的、独立运行的事务处理系统较多,应用系统之间缺乏数据交换与信息共享,即所谓A..IT黑洞B.信息孤岛C.IT项目泥潭D.信息污染正确答案:B本题解析:暂无解析6.信息系统的重要组成部分是人,对人员管理的重点在于人员组织机构建设、培训和A.各种文化建设B.各种制度建设C.各种文档建设D.各种标准建设正确答案:B本题解析:暂无解析7.系统集成实现的关键在于解决系统之间的互联性和A.方便性B.快捷性C.能动性D.互操作性正确答案:C本题解析:暂无解析8.为了减少意外事件引起的对信息系统的损害,首先要制定应付突发事件的A.规章制度B.审查措施C.跟踪计划D.应急计划正确答案:D本题解析:暂无解析9.信息用户的人类个体或群体的三方面特征分别是拥有信息需求、具备利用信息的能力和A.具有接受信息服务的行动B.具有实现信息需求的思想C.具有接受信息服务的思路D.具有实现信息需求的方法正确答案:A本题解析:暂无解析10.信息著录和标引的主要依据是A.数据B.元数据C.数据库D.数据结构正确答案:B本题解析:暂无解析11.对与某一研究对象相关的各种来源、各种内容的信息,按特定的目的进行归纳汇集而形成完整的、系统的信息集合的信息分析方法是A.综合法B.对比法C.相关法D.因果法正确答案:A本题解析:暂无解析12.制定信息资源管理标准的对象的内涵是A.实践经验B.重复性事物C.统一性D.最佳秩序正确答案:B本题解析:暂无解析13.系统标准化对象的整体及其相关要素有目的、有计划地制定和贯彻一个标准系统的标准化方法称为A.组合B.综合C.程序化D.简化正确答案:B本题解析:暂无解析14.1SO按专业性质设立技术委员会(TC)和若干分技术委员会(SC),TC和SC的成员分别为P成员和O成员。
第3章 信息著录和标引解剖

3.4.2.3 主题词组配标引的形式
3.5.1 自动标引概述
3.5.2 自动标引的原理
3.5 自
3.5.3.1 统计标引法
动
标
3.5.3
3.5.3.2 语言分析标引法
引
自动标引方法 3.5.3.3 人工智能标引法(略)
3.5.3.4.自动赋词标引法
3.5.4 自动分类
3.5.4.1 自动归类 3.5.4.2 自动聚类
3.1 信息著录的含义和标准
• 3.1.1 信息著录的含义和作用
• 著录:在组织检索系统时,对具体信息的各种形式特征、内容 特征及物质形态等进行分析、选择和记录的过程。
• 款目/记录:按照一定的方法和规则对某一信息的内容和特征所 作的描绘结果。
– 在逻辑上代表该信息。 – 款目由一条条著录项目组成。 – 著录项目是用于揭示信息内容和形式特征的记录事项。
与 元 数
3.2.2
元数据的作用
都柏林核心元数据 DC
内容描述 外形描述 知识产权
据
元数据
修饰词的含义
DC的修饰词 类型:元素修饰词和编码
DC实例
体系修饰词
其他元数据规范
DC与MARC的比较
3.3
信 息 标 引
3.3.1 含义与质量 控制
3.3.1.1 含义 3.3.1.2 标引的不同方式 3.3.1.3 质量控制
• 常用著录标准:
《英-美编目条例 第2版》(AACR2)、《国际标准书目著录》 (International Standard Bibliographic Description)… 中国的《文献著录总则》(GB3972.1-83)、《西文文献著 录条例》、《连续出版物著录规则》 (GB3792.3-85)… MARC、USMARC、CNMARC
文献检索(第三章)

社 会 科 学
自 然 科 学
(2)主题途径 主题途径
这是通过文献资料的内容主题进行检索的途径,主 题途径依据的是各种主题索引或关键词索引,主题索引 或关键词索引按检索词的字顺排列,检索者只要根据课 题确定了检索词(主题词或关键词),便可以像查字典那 样,按照字顺去逐一查找,从检索词下的索引款目,找到 所需文献的线索。 主题途径检索文献关键在于分析课题,提炼主题 概念,运用词语来表达主题概念。对于主题索引,需 要把自拟的语词同相应的词表核对。主题途径是一种 主要的检索途径。
五 文献信息检索的方法
1.常用法
常用法又称直接法,是指直接利用检索工具(系 统)检索文献信息的方法,这是文献检索中最常用的 一种方法。它又分为顺查法,倒查法和抽查法。
1.1 顺查法
顺查法指按照时间的顺序,由远及近地利用检索 系统进行文献信息检索的方法。这种方法能收集到某 一课题的系统文献,它使用于较大课题的文献检索。 例如,已知某课题的起始年代,现在需要了解其发展 的全过程,就可以用顺查法从最初的年代开始,逐渐 向近期查找。优点是漏检,误检率低,但劳动量较 大。
(1)基本部类:如中图法分五大类部:马列毛邓;哲学; 社会科学;自然科学;综合性图书。 (2)基本大类:构成分类表的第一级类目。中图法为22个 基本大类。 (3)简表:由基本大类与由其直接展开的一、二类目所形 成的类目表。 (4)详表:由简表展开的各种不同登记的类目所组成的类 目表,是文献分类的真正依据。
OPAC :是指以计算机编码形式存贮在计算机 系统内,供读者通过终端设备进行联机检索的 图书馆目录,即书目数据库的一种形式。
2.题录(bibliography 、bibliographic、citation)
题录是单篇文献外表特征的揭示和报导,即对某一文献外部特 征的描述,由一组著录项目构成一条文献记录。 题录的著录项目一般有著者,篇名及出处等,常以一个内容上 独立的文献单元(如一篇文章,图书中的一部分,有时也可以是整 本出版物)为基本著录单位。题录在揭示文献内容的深度方面,比 目录深入,但又比文摘简单。 示例1:
信息检索教程第3章 信息著录和标引

Thank You!
32
9
第3章 信息著录和标引
中文文献的著录主要采用的是CNMARC,以共享我 国图书馆和信息部门的中文书目记录;西文文献的著录则 采用USMARC,以共享国外权威的西文书目记录。这里 重点介绍CNMARC。
CNMARC 记录
记录头 标区
地址目 次区
数据字 段区
记录分 隔符
注:各字段数据元素及其标准详细情况参见教材P47-51
影响标引质量的因素 标引深度 专指度 一致性
16
第3章 信息著录和标引
3.3.2 信息标引的步骤
信息标引的步骤包括主题分析和概念转换,也就是先 要对文献的内容进行分析,明确文献的主要内容和主题概 念,然后用分类法或主题法将其充分、准确地表达出来。
3.3.2.1 主题分析
1. 主题类型和结构
(1)单主题和多主题 (2) 显性主题和隐性主题
普通高等教育”十一五”国家级规划教材
信息检索教程
王立清 主编
第3章 信息著录和标引
本章要点
信息著录和标引是使 信息序化的过程。它通过 揭示信息的内在以及外在 特征,将分散无序的信息 重组,规范控制信息流向, 以便用户有效利用。
●介绍信息著录和标引的含义 与作用
●叙述信息著录和标引的发展 ●介绍元数据的定义与作用 ●比较机读目录MARC和都柏林
26
第3章 信息著录和标引
统计标引法
3.5.2 自动标 语言分析标 引方法 引法
词频统计法 加权标引法 n-Gram标引法 统计学习标引法
句法分析标引法 语义分析标引法
人工智能标 JAKS标引法、WorldViews标引
引法
法和MedIndEx标引法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.1 信息著录的含义和标准
• 3.1.1 信息著录的含义和作用
• 著录:在组织检索系统时,对具体信息的各种形式特征、内容 特征及物质形态等进行分析、选择和记录的过程。
• 款目/记录:按照一定的方法和规则对某一信息的内容和特征所 作的描绘结果。
– 在逻辑上代表该信息。 – 款目由一条条著录项目组成。 – 著录项目是用于揭示信息内容和形式特征的记录事项。
著
义及作
作用
录用
的
含
3.1.2.1 什么是著录法
义
著录标准的发展(略)
和
3.1.2
标
标准
准
3.1.2.2
著录项目 著录项目的特点
《文献著录总则》 著录等级
著录格式
3.2
机 读 目 录
3.2.1 机读目录
机读目录概述:概念、产生与发展
格式特点
头标区
CNMARC的记录结构 MARC的发展
目次区 数据区 实例
11
3.1 信息著录的含义和标准
• 3.1.1 信息著录的含义和作用
著录的作用
文本
揭示
组织
检索
• 3.1.2 信息著录的标准
3.1 (续)
• 著录法:关于如何进行著录的具体规定和具体做法。 通常包括著录原则、适用范围、著录项目、著录格式、 著录来源、著录文字、标识符号以及各个著录项目的 具体细则规定。
与 元 数
3.2.2
元数据的作用
都柏林核心元数据 DC
内容描述 外形描述 知识产权
据
元数据
修饰词的含义
DC的修饰词 类型:元素修饰词和编码
DC实例
体系修饰词
其他元数据规范
DC与MARC的比较
3.3
信 息 标 引
3.3.1 含义与质量 控制
3.3.1.1 含义 3.3.1.2 标引的不同方式 3.3.1.3 质量控制
• 常用著录标准:
《英-美编目条例 第2版》(AACR2)、《国际标准书目著录》 (International Standard Bibliographic Description)… 中国的《文献著录总则》(GB3972.1-83)、《西文文献著 录条例》、《连续出版物著录规则》 (GB3792.3-85)… MARC、USMARC、CNMARC ……
第3章 信息著录和标引
信息组织与检索
1
本章主要内容:
3.1 信息著录的含义和标准 3.2 机读目录与元数据 3.3 信息标引的含义与步骤 3.4 分类标引与主题标引 3.5 自动标引
huangyinghy2@
2
3.1
3.1.1 含 关键词:著录、对象、款目、基本要求、
13
• 3.1.2 信息著录的标准
– 3.1.2.2 《文献著录总则》
《国际标准书目著录》(即ISBD)
《文献著录总则》(GB3972.1-83)
《普通图书著录规则》 《档案著录规则》 《连续出版物著录规则》 《非书资料著录规则》 《地图资料著录规则》 《古籍著录规则》
905 __ $a JUSTLib $d TP317.1/N28
10
3.1 信息著录的含义和标准
• 3.1.1 信息著录的含义和作用
• 著录的基本要求: – 准确化:著录的结果要全面、客观、准确地揭示信息 资源的内容特征和形式特征; – 规范化:要求信息著录坚持标准化著录原则,按照统 一的著录项目、著录格式、标识符号等进行著录。
3.4.2.3 主题词组配标引的形式
3.5.1 自动标引概述
3.5.2 自动标引的原理
3.5 自
3.5.3.1 统计标引法
动
标
3.5.3
3.5.3.2 语言分析标引法
引
自动标引方法 3.5.3.3 人工智能标引法(略)
3.5.3.4.自动赋词标引法
3.5.4 自动分类
3.5.4.1 自动归类 3.5.4.2 自动聚类
8
一条著录记录的实例:
注:(以下“_”表示空格)
000 01103nam 2200313 4500 (头标区) 001 0000212192 005 20020703085900.0 010 __ $a 7-111-09692-4 $d CNY58.00 (含光盘) 010 __ $a 7-980007-34-4 $b 光盘 100 __ $a 20020524d2002 emky0chiy0121 ea 101 1_ $a chi $c eng 102 __ $a CN $b 110000 105 __ $a a z 000yy 106 __ $a r 200 1_ $a 中文Office XP专家 $A zhong wenO ffice XP zhuan jia $f (美) StepHen L. Nelson, Julia Kelly $g 智慧东方工作室译 210 __ $a 北京 $c 机械工业出版社 $d 2002
的
主题的类型与结构
含 义
3.3.2.1 主题分析
主题分析的方法
与
3.3.2 3.3.2.2 概念转换
步
步骤
骤
3.4
分
类 标 引
3.4.1 分类标引
3.4.1.1 基本原则(5个原则) 3.4.1.2 不同类型主题的分类标引的规则
与
主
题
3.4.2.1 选词规则
标 3.4.2
引
主题标引 3.4.2.2 组配规则
9
215 __ $a 532页 $c 图 $d 24cm $e 光盘1片 314 __ $a 责任者规范汉译姓:尼尔森 314 __ $a 责任者规范汉译姓:凯莉 454 _1 $1 2001 $a Office XP: The complete reference $1 701 1 $a Nelson, $b StepHen L. $1 701 1 $a Kelly, $b Julia 606 0_ $a 软件包 $A ruan jian bao 610 0_ $a Office XP $A Office XP 690 __ $a TP317.1 $v 4 701 _1 $a 尼尔森, $A ni er sen, $b S. L. $g (Nelson, StepHen L.) 701 _1 $a 凯莉, $A kai li, $b J. $g (Kelly, Julia) 712 02 $a 智慧东方工作室 $A zhi hui dong fang gong zuo shi $4 译 801 _0 $a CN $b XMU $c 20020527 801 _2 $a CN $b JUSTLib $c 20020701