二、检索标识系统
信息检索的基本知识

⑵信息检索系统的类型 〔续〕
④索引型检索系统: 索引是根据一定的需要,把特定范围内的
某些重要文献中的有关款目或知识单元,书 名、刊名、人名、地名、语词等,按照一 定的方法编排,并指明出处,为读者提供 文献线索的一种检索系统。
索引不仅广泛存在于各种书刊等文献 中,而且更多见于作为辅助检索系统而附 在不同类型的检索工具之后,为检索工具 提供了更多的检索途径。
信息的存储过程就是按照主题词表或 分类表及使用原那么对原始信息资源
一、信息检索原理〔续〕
2、信息检索系统〔续〕
一、信息检索原理〔续〕
⑵信息检索系统的类型
按信息处理手段划分有 ①手工检索系统。又称传统检索系统 是使用人工来查找信息的检索系统。 其主要类型有各种书本式的目录、题 录、文摘和各种参考工具书等。优点: 方便、灵活、 断准确。缺点:检索速 度太慢
2、信息检索系统〔续〕
按著录和标引方式划分 ④文摘型检索系统是以简练的文字将文献
资料的主要内容准确、扼要地摘录下来, 并按照一定的著录规那么和编排方式系统 地组织起来的检索 工具。 主要包括:报道性文摘
指示性文摘 如:美国的?化学文摘?英国的?科学文摘〉
中国的〈中国数学文摘〉〈海洋文摘〉
2、信息检索系统〔续〕
按著录和标引方式划分
⑤全文型检索系统 全文检索是指在文献资料的标题、目录、作
者、内容中检索 指定的字符串。 全文检索系统是指将文章 中所有的文字处理序列 都作为检索对象进行索引,并根据需要找出包含 有欲检索词的文献的系统。
作用:它能提供快捷的数据管理工具和数据 查询手段,帮助人们进行了大量文献数据的整理 和管理工作,使人们能够快速、方便地查到想要 的任何信息。
第二章 信息检索的根本知识
第二章 计算机检索系统

2.
3.
4. 检索速度:手检较慢;机检较快。计算机能存 储大量的信息和数据,处理速度快,运算准确、 可靠性高,检索所用的时间可以用分、秒计算。 5. 检索要求:手检需要掌握专业知识、外语知识、 检索工具知识;机检需要掌握专业知识、外语 知识、机检系统知识。 6. 查全查准率:计算机检索系统采用了逻辑运算 和限制检索等功能,使各类检索词之间能够灵 活组培,能满足多元检索的要求,查准率和查 全率都远远超过手工检索。 7. 综合效率:手检较低;机检较高。
(二)计算机检索系统的类型
1.联机信息检索系统。 ~是由一台主机带多个终端的信息检索系统。 通过采用实时操作技术,用户可以使用终端设备直接与计算机 对话,计算机对用户的提问能及时处理、即刻回答。用户还可 以通过浏览有关信息,随时修改提问,直至得到满意的结果。 2.光盘信息检索系统。 光盘数据库从1985年问世以来便很快占领市 场,并得到日益广泛的应用。
第二章 计算机检索系统
第一节 第二节 第三节 第四节 第五节
计算机检索概述 数据库及其种类 计算机检索技术 国际联机检索 光盘检索系统
第一节 计算机检索概述
一、 计算机检索发展历史
经过40多年的研究和实践,机检在理论和应用上都取得了重大发 展,其历史发展过程经历了以下几个阶段— 20世纪50年代末到60年代末,国外研制和建立了许多信息检索系 统。工作方式为传统的批处理检索方式,这一阶段数据存取能力及通信能
(1)二次文献数据库 是对一次文献进行加工、压缩的派生性数据,如书目、 索引、文摘型数据库等。数据来源于期刊论文、会议论 文、图书、报纸等各种一次文献,是我国当前文献检索 的主要机读数据源。二次文献数据库主要有两种类型:
检索基础知识

主题词的表现形式
标题词:表述信息主题内容的规范化词(先组式 主题法) 元词:标引信息主题的词语是字面上不能再分的 基本词语(后组式主题法) 叙词:表述信息主题内容的规范化词(后组式主 题法) 关键词:表述信息主题内容的非规范化词(后组 式主题法)
三、检索系统
(一)文献检索系统定义 是指按某种方式、方法建立起来的供文 献信息用户查检文献信息及原始文献的一 种有层次的体系,是表征有序的信息特征 的集合体。(包括各种手工检索工具和各类 计算机检索系统)
元(如一篇文章,图书中的一部分,有时也可以是整本出版物)为基本著录单位。
示例1:
3. 文摘 ( abstract )——更有利于用户判断检索结果 的准确性。
文摘是指对一份文献(或称一个文献单元)的内容所做的简略、 准确的描述,文摘的著录项目除了著者,篇名及出处等外,还有表 示文献内容特征的摘要。
4. 索引 ( index )
检索工具的著录对象
目录:单位出版物 题录:单位出版物中的单篇文献 文摘:单位出版物中的单篇文献 索引:单位出版物或单篇文献中的知识单 元
手工信息检索工具的著录项目
目录: 注项 题录: 文摘: 索引: 出版物名称--编著者--出版项—附 题目/著者//出处 题目/著者//出处、文摘 知识单元---顺序号(或页码)
五、检索步骤
分析检索课题,明确检索要求 选择检索工具,确定检索途径 确定检索标识,确定检索运算 构筑检索提问,获取初步结果 调整检索策略,获取所需信息
六、检索效果的评价及其优化
检索效果评价的意义—— (1) 提高检索效率 (2) 改善系统性能
检索效果评价的指标
文献检索-第二章__文献检索基本知识

Z——综合性图书
O 数理科学和化学 (一级类目) O1 数学 (二级类目) O3 力学 O4 物理学 O6 化学 O61 无机化学(三级类目) O611 化学元素与无机化合物 (四级类目)
图书馆图书的排架与查询:
图书是按索书号排列在书架上的 图书查询先确定索书号 索书号:由图书分类号和书次号组成;分类号在上,书 次号在下。
⑶事实检索
事实检索以特定客观事实为检索对象,检索结果是某一具体 的、客观存在的事实。 如:查找“前事不忘、后事之师”最早的出处。
信息检索的类型
按照检索方式的不同,分为手工检索和计算机检索。
手工检索:用人工来处理和查找所需信息的检索过程。主要 依靠印刷型的二次文献,如文摘、目录等。
计算机检索:利用计算机和一定的通信设备查找所需的信息。 如联机检索和网络检索。
(2)主题途径
从文献中抽选出来的,代表文献内容实质词 汇——主题词,包括关键词、标题词、叙词等作 为检索标识,进行文献检索的一种途径。
(3)著者途径
根据已知文献著者(作者)的姓名来查找 文献的途径。
(4)名称途径
根据文献的名称来查找文献的途径。如: “书名目录”、“刊名目录”。
(5)序号途径
以文献的编号为特征编排和检索文献的途 径。如:“专利号索引”、“报告号索引”等。
(6)其他途径
有些检索工具还附有一些特殊索引,可提 供从特殊途径查找所需文献的线索。如《CA 》中的分子式途径、环结构式途径等。
3、文献的检索步骤
(1)分析研究待查课题
检索的目的是什么? 课题属于什么学科专业? 需要什么类型的文献?(中文,外文文献) 所需文献的年代范围等 另外,还需要了解与检索课题相关的专业背景知 识、有关的专业名词、术语等。
二、计算机信息检索

文献型数据库
文献型数据库又叫书目型数据库, 记录文档中主要存入的是原始文献 的书目。包括原始文献的篇名、作者 、文献出处、文摘、关键词,以及主 要用于查询各种文献资料的书目性 线索、文摘等。
数值型数据库
数值型数据库的记录包括各种调查 数据或统计数据。它是一种以自然数 值形式表示、计算机可读的数据集合, 这些数据是从文献中分析、概括、提 取出来,或以调研、观测及统计工作 中直接获得的数据。
数据库
数据库是计算机信息检索的重要组成部分。 它是以二进制代码形式在计算机存贮设备上 (如磁带、磁盘和光盘等)合理存放的相关 数据的信息集合,通常由存贮信息记录及其 索引的若干文档组成。
目前,大多数计算机信息检索系统都存有 四种类型的数据库:
–
文献型数据库
–
数值型数据库
–
词典型数据库
–
全文型数据库
国际联机信息检索的优点
检索范围广 数据库种类多、数量大 检索速度快 检索途径多,检索效果好 具有灵活的服务方式和输出方式 检索全面
世界著名的国际联机检索系统
DIALOG系统
DIALOG系统又称DIALOG对话系统,因研究 人机对话检索方式而得名。它是目前世界上 最大的国际联机检索系统,也是我国信息用 户使用最多的系统。1963年系统创建初期, 曾是美国洛克希德导弹和空间公司下属的一 个情报科学实验室。1972年,DIALOG系统开 始成为国际联机检索系统,正式对外开展联 机文献检索服务业务。
一是传统信息检索向全文文本、多媒体、多
载体、多原理等新型信息检索发展,在深度上 提高信息检索和信息组织能力,如探索自动抽 词、自动索引、自动检索、自动文摘、自动翻 译等;
二是信息资源的网络化和分布化,面向 Internet 中浩瀚无垠的资源,在广度上提高 管理和组织信息的能力。
医学文献检索复习题与标准答案

医学文献检索复习题与标准答案医学文献检索复习题1.文献是记录有知识的一切载体。
2.情报的三个基本属性是:传递性、知识性、效用性。
3.信息素养包括:信息意识、信息能力、信心道德。
4.文献按载体划分为书写型、印刷型、缩微型、视听型四种类型。
5.ISBN的中文名称是国际标准书号;国际标准刊号的英文简称是 ISSN 。
6.正式公开出版的期刊有、、三个。
7.文献按容的加工层次分为一次文献、二次文献、三次文献。
8.按文献的加工层次分,《中国临床保健杂志》为一次文献。
9.按文献的加工层次分,《中华核医学与分子影像杂志》为二次文献。
10.按文献的加工层次分,《全国新书目》为三次文献。
11.按文献的加工层次分,《中国医院管理年鉴》为二次文献。
12.《生物医药大辞典》属于二次文献。
13.我校图书馆的图书一般按照《中图法》进行分类组织。
14.《中国图书馆分类法》分为 5 大部类, 22 个基本大类,每个大类用一个大写字母表示,其中医药卫生类用字母 R 表示,文学类用表示。
临床医学的分类号是 R4 ,预防医学的分类号是 R1 ,科学的分类号是 R5 ,妇产科学的分类号是 R71 。
15.R72儿科学属于二级类目,R56属于三级类目,R563属于五级类目。
16.图书馆藏书的索书号由分类号和两部分成。
17.读者用来检索查询图书馆书目数据的网络系统称为文献检索系统。
18.信息检索语言是信息检索系统存储与检索共同遵循的一种专用语言,按规程度分为规划语言、非规划语言。
19.引文索引是指以为检索标识的检索系统。
20.常用的主题词表有《》、《》、《》。
21.在Medline中检索为 David Saliven Crawford 的作者的文献,作者应处理为。
22.根据容的详略程度,文摘分为指示性文摘和报道性文摘两类。
23.反映文献检索效果的最重要的两个指标是查全率和查准率。
24.数据库最小的记录单元是字段。
25.数据库主要有事实数据库、数值数据库、书目数据库、全文数据库、超文本型数据库五类。
信息检索基础知识2

2.1.2.5图录类工具书
图录类工具书是以图形、图像、符号等为 主体,附以简略的文字说明,以反映各种 事物、人物的空间特征和形象特征的工具 书。它包括地图、历史图录、文物图录、 人物图录、艺术图录、科技图像等。地图 是地球表面自然和社会现象在平面图上的 缩影,以反映各种事物和景象的地理分布 及其在空间与时间上的相互制约、内在联 系和发展动态。历史图录是以图形、图像 等揭示历史人物和事物的工具书。
2.1.2.4表谱类工具书
表谱类工具书是以表格或其他较为整齐的形式, 记录史实、时间、地理等资料,并附以简略的文 字说明,以反映史实和时间。主要包括年表、历 表和专门性历史表谱3种类型。年表是按年代顺 序编制,专供查考历史年代、历史纪元及历史大 事的检索工具。如《中华人民共和国大事记》等。 历表是一种把不同历法的历日按一定的次序汇编 在一起,以相互对照的表格,提供查找和换算不 同历法的年、月、日的工具书。专门性历史表谱 主要用于查考人物、职官、地理和数据等专题资 料,如《中西回史日历》等。
2.1.3 机械检索工具
机械检索工具是手工检索工具向计算机检 索系统过渡的中间检索工具。它主要包括 两种类型:机电检索工具(如打孔机)和光电 检索工具(如缩微机)。机械检索工具利用机 械装置改进信息资源的存储和检索方式, 但是只能对某一固定存储形式的信息资源 进行特定检索,过分依赖于设备,检索操 作复杂,成本很高,并且检索质量和效率 也不理想。所以很快被计算机检索系统所 取代。
联机检索系统
联机检索系统主要有以下四种服务方式: (1)回溯检索(RS,Retrospective Search) 是用户对检索系统中积累多年的文献信息数据库进行检索,查找一定 时间范围内或特定时间以前的文献信息的一种联机检索方式。通过 RS进行专题检索或情报调研,可全面系统地了解有关文献信息的线 索。 (2)定题检索(SDI,Selective Dissemination of Information) 是指在回溯检索的基础上,定期从文献数据库中检索出回溯检索日之 后出现的新的文献信息的一种联机检索方式。 (3)联机订购 联机检索的结果通常是一些文摘或题录形式的二次文献。联机检索系 统可以为用户提供原始文献的联机订购服务。 (4)电子邮件 联机检索系统为用户提供E-mail和电子邮政的功能 。
信息检索

信息检索的种类
按照检索对象,把信息检索分为: 文献检索 数据检索 事实检索
文献检索
• 是指查找用户所需文献的线索或者原文的检索。 如查找某一主题的相关文献,对某研究课题立项 的文献查新,或从事新产品开发时需要查找有关 最新研究动态等。 • 文献检索是一种相关性检索 文献检索是一种相关性检索,检索结果是某一专 题的文献线索(文摘、题录),一般要经过阅读文摘 后才能决定取舍。文献检索主要是利用二次文献 进行,如各种载体形式的目录、题录、文摘、索 引等。文献检索是信息检索中最基本、最重要的 类型。 文献检索是信息检索的核心和和主体部分,是 最常用的一种检索。文献检索分为数目检索和全 文检索。其目标是检索出原始文献或原始文献的 替代品。
全文检索系统
CNKI 附加的资源
CNKI的期刊导航
核心期刊导航
外语类的核心刊
检索系统小结
全文检索系统
用户提问
目录检索系统
馆藏信息
收藏地
全文
文摘检索系统
来源信息
三、检索语言
• 检索语言基础知识 • 检索语言的分类 • 检索运算符
检索语言
信息检索语言是用来描述信息的内容特 征和形式特征以及表达信息用户的语言。 它是根据文献信息的存储和检索的需要而 编制的一种人工语言,又称检索标识。它 把信息的存储与检索联系起来使信息的标 引者和检索者取得共同理解,从而实现检 索目的。是沟通信息存储和信息检索的桥 梁和纽带,也是信息用户获取所需信息全 过程得以顺利实现的保证。
汽车用燃料、润滑料类 (U473)
信息检索概念
信息检索(information retrieval): 是按照一定 方式从信息集合中或数据库中查找所需信息 的具体过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
答疑解惑
1.《文献检索》对计算机知识有什么要求,与 计算机类课程的关系
2.文献检索与一般上网的区别
上网
网络信息 资源检索
与利用
文献检索
3.本课程考试及学习难度 4. 网上的信息哪些真实有效? 5.怎样找书 6.怎样找学术科技论文 7.怎样找一家公司的注册信息 8.怎样找某人的信息/ 9.怎样找黑客软件 10.怎样找外文资料 11.怎样找中外文音乐、电影、图书 12.怎样找心理学方面的资料 13.怎样检索特定的文件
⑤较接近自然语言,所以较易与自然语言结合使用。
示例: /wxjs/flat/ast/t sing/bjjc/wxxxjs/wxxxjs_00.htm
思考:检索系统中的关键词、题名、主题词、 摘要、全文等字段限定检索有什么区别?
示例:《汉语主题词表》节选 A 爱克斯射线(非主题题词)
哪些是外部特征? 哪些是内部特征?
哪些是外部特征? 哪些是内部特征?
用户
检索标识系统 /检索语言
信息/文献
检索标识系统 /检索语言
信息管理者
假如将来龙泉校区搬迁至航空港,两边图书资料如何合 并?
• 检索标识系统的功能 • 1.保证标引的一致性\通用性 • 2.保证检索提问与文献标引的一致性 • 3.保证检索结果与要求的一致性 • 4.揭示相同内容或相关信息间的相关性,并集中揭
自然语言的构成:词汇、语法、标点符号
检索语言:词汇(精选性)、语法(编排规则 与含义)、标识符号。(字母、数字、标点 符号及组合编排。
2.语言表达概念,概念间有相互关系,检索 语言也要反映这种逻辑关系:
(1)等同关系 A b
(2)从属关系 A b
(3)相关关系(交叉关系) b A
(4)矛盾关系 A B
… B 边际效用学派
… C 采矿
… D 电动机(主题词)
… F 发电机(主题词)
… G
… H 海洋学(上级主题词)
… 海洋地质学(下级主题词)
I ...... X Y Z
示例:《汉语主题词表》节选
Bianji xiaoyong xuepai 边际效用学派 Marginal utility school D 边际学派
•
2.3主题法标识系统 使用语词标识的一类情报检索语言,亦称主题法。
其基本的、共同的特点是:
①用自然语言中的名词术语经过规范化后直接作为 文献主题标识,直观性好;
②按字顺序列排列标识,检索者较易使用;
③具有按文献主题(文献所论述的事物)集中文献 情报的功能,对有关某一事物的检索效率较高;
④用参照系统及其他方法间接显示文献主题概念之 间的关系;其系统性不及分类检索语言,对一学 科或一专业文献作全面、系统的检索比较困难;
(5)对立关系 A C B
检索标识系统的类型
按检索语言的结构原理可划分如下:
描述文献外部特征
题名 责任者(著者、译者、编者等) 文献代码(ISBN、ISSN、ISRC) 引用文献 出版地、单位、日期
体系分类语言
检索标识系统
分类语言 组配分类语言 混合分类语言 单元词
描述文献内部特征 主题语言 标题词 叙词 关键词
• 《汉语主题词表》
《汉语主题词表》是通用的汉语叙词 表,分为自然科学和社会科学两个部分。 自然科学部分在1996年作了修订,它有5个 分册,共收录8万多主题词条目,包括正式 和非正式主题词。它有主表和附表组成。
《INSPEC叙词表》
《INSPEC叙词表》(INSPEC Thesaurus)是《科学文摘》(Science Abstracts)检索工具配套使用的规范词表, 它由英国电气工程师协会编辑出版,书本 型词表的全表分为:字顺表和等级表两部 分。
/view.do?id=516 2. 《中国科学院图书馆图书分类法(第三版)》
(简称:科图法);
/ReadNews.asp?NewsID=504
思考:
1.信息学或信息检索图书在《中图法》中归 到哪类?
2.心理学专业的一些图书、参考资料在《中 图法》中归到哪类?
边际主义 F 奥地利学派
剑桥学派 洛桑学派 数理学派
S 庸俗资产阶级政治经济学 经济学派
Z 政治经济学 C 费边社会主义
凯恩斯主义 瑞典学派 新古典学派 新剑桥学派
以上各种主题法标识系统理论上可依情况自编各种 词表也可使用现成词表,一般可对现成词表进行 改进
参照项D ,"代"项, 作用是指引相应的非正式主题词, 参照项F ,"分"项, 作用是指引所含的下位主题词, 参照项S ,"属"项 作用是指引所从属的上位主题词, 参照项Z ,"族"项,作用是指引所从属的族首词, 参照项C ,"参"项,作用是指引有语义关系的相关词, 参照项Y, "用"项,作用是指引相应的正式主题词。
3.你所学专业相关的图书资料在《中图法》 中归到哪类?
3.《四库全书总目》 /page/cbc4bfe2c8abcae 9d7dcc4bfc分类法简介 1.《杜威十进制分类法》 2.《国际十进分类法》 3.《美国国会图书馆分类法》 4.《冒号分类法》
检索中经常碰到的常见检索项,如题名、主 题、关键词、分类号、ISSN号、ISBN号、 ISRC号等是什么意思,这些内容是怎么来 的。
检索标识系统(检索语言)
1检索标识系统概述
1.1检索标识系统的定义
定义:从自然语言中精选出来的并加以规范化 的一套词汇符号,用于对文献的内容特征以 及外部特征及相互关系进行概括的标识体系。 也称情报检索语言/检索语言
示报道
• 5.对大量信息系统化、有序化从多个角度揭示信息
• 2.2分类标识系统 2.3.1体系分类法的原理及结构 2.3.2我国主要的分类法介绍 1。《中国图书馆分类法(第四版)》(简称:中图
法)。
http://210.41.233.144:8080/opac/cls_browsing .php
/tsghelp/ShowArticle.asp?ArticleID= 97