第二章 信息检索方法

合集下载

第2章--信息检索PPT课件

第2章--信息检索PPT课件

经济
文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
S
T U V X Z
农业科学
工业技术 交通运输 航空、航天 环境科学、安全科学 综合性图书
《中国图书馆分类法》
中国图书馆分类法分类表共分22个大类,再分17个 二级目录,医药卫生属于R大类。 《中图法》采用汉语拼音字母和阿拉伯数字组成的 混合制号码作类目标识,用一个字母标记一个基本
的问题;
另一方面是特定原始文献的查找,即在查找特定
的文献线索后,找出原始文献的过程。
第一节 信息检索基础
一、信息检索概念
(二)信息检索的意义和作用 信息检索 有助于知识更新 ,有助于同学们扩大视野 ,了解和把握有关学科中出现的新思想、新观点与 新知识。掌握信息检索技术是快速、准确地获取和 利用最新信息的有效途径。 信息检索有助于科学研究,了解和把握有关学科的 起源和发展过程。 有助于独立自主地解决自己在学习、生活和工作中 所遇到的疑难问题。 是接受终身教育的必要手段。 节省时间,提高效率。
第二节 信息检索语言
二、检索语言的种类
(一)分类检索语言 分类检索语言又称分类法,是用分类号(字母、数 字或它们的组合)来表达各种概念的,并将各种概 念按学科性质进行分类和系统排列的信息检索语言。 它以树状结构的形式,按知识门类的逻辑次序反映事物 的从属、派生关系,构成具有上位类和下位类隶属、同 位类并列的概念等级体系。 能较好体现概念的族性关系,从学科专业的角度检索资 料,比较方便,扩大、缩小检索范围方便。
(一)按信息检索的对象划分
数据信息检索 利用数据库、工具书等以数值或数据为对象的检 索,也称为数值检索。检索包含分子式、分子量 、公式 、图表等特定数据的信息。

第二章 文献信息检索基本知识(2).概要

第二章 文献信息检索基本知识(2).概要
(大学生or本科生or研究生)-(大专生or高职生) and 就业
(2)截词检索表达式
用截词符号“*”、“?”或“$”加在检索词 的前后或中间,以检索一组概念相关或同一词根 的词。 按截断的位置可分为:
前截断、中间截断、后截断 按截断的字符数量可分为: 有限截断(?)、无限截断(*)
如:输入检索式“Comput*”,将检出包含 Computer、Computing、Computed、 Computerization 等词汇的结果。
第二章 信息检索基础知识
2.3 文献信息检索的工具
1、文献信息检索工具概述 检索工具是将大量分散无序的文献资料经过加 工整理,按照一定的规则和方法编制起来,用来 报道、存储和查找文献的工具,是附有检索标识
的某一范围文献条目的集合。
传统的检索工具是人们利用手工方法编制的
工具书,有字典、词典、目录、百科全书、名录、 类书、政书、表谱、图录等。这些工具书是人们
题录示例
(3)索引(引得) 索引是将书刊内容中所论及的篇名、语词、主 题等项目,按照一定的排检方法加以编制,注明出 处,供读者查检使用的检索工具。 索引与目录的根本区别就在于著录的对象不同, 目录所著录的是一个完整的出版单位,索引所著录 的则是完整的出版物的某一部分、某一观点、某一 知识单元,提高文献检索的深度和检索效率。
完全一致(精确匹配)、任意一致(模糊匹配)
等。
讨论1: 我馆书目查询系统共有多少种检索方式?其基 本检索有多少个检索字段?
讨论2: “中国学术期刊网络出版总库”有哪些检索方式?

? ? 中国科技期刊数据库初级检索界面
2、 信息检索方法
(1)常用法 ①顺查法 ②倒查法 ③抽查法 (2)回溯法 (3)循环法

第二章 信息检索

第二章 信息检索

2.检索技巧和提示
(1) 广泛浏览数据库 进入数据库前,需阅读数据库的说明,包括:出版、结构(权威性),出版类 型(期刊、会议、报告、专利…),文献类型(全文、文摘、题录…),收集年限,使 用权限,文献版本,服务方式(光盘、联机、专线、镜象、出国),连接方式,帐 号、密码,咨询联系等。现在许多数据库被组织到信息服务中心的web网页 上,并提供了有关介绍,应当充分地利用它们。
(1)积木型 积木型检索策略的含义是:把检索课题剖析成若干个概念面,先分别 对这几个概念面进行检索;在每个概念面中尽可能全和多地列举相关词 、同义词、近义词,并用布尔算符OR连接成子检索式,然后再用布尔算 符AND把所有概念面的子检索式连接起来,构成一个总检索式。 优点是:能够提供较明确的检索逻辑过程,以后容易检索和理解,还可 部分或全部地用作保留检索。一般地,“积木型”策略用于较复杂的检 索课题。 • 如“肺癌”与“吸烟”可以分成两个概念面,这两个概念面的各种形式 的检索词有: cancer smoker(s) • • carcinoma lung(s) cancer smoking cigar
(二)截词检索
截词检索:是指在检索时使用词的一个局部(某些 位置上的字符被截去)进行检索匹配,并认为凡满足这 个词局部中的所有字符要求的记录,都为命中结果。 截词检索需要使用专门符号(截词符),以指定截词 的具体位置与截断字符的数量。 • 按照截词位置的不同,截词检索分为: 右截词、左截词和中间截词三种。 例如:检索式 “wom?n”可检索到含有woman、women的结果。 截词检索实际上是一种隐含“逻辑或”的运算,能提 高查全率,扩大检索结果,是防止漏检的有力手段。
第二部分事实与数据检索工具
讨论事实、数据资源检索,其检索的对象是大量的、 常用的那些具体的科学技术数据和事实,如物理量、 物质特性、参数、规格等技术数据以及价格、产量、 公司名录、人名录等商业、经济等各种实用信息。 它们的检索工具包括:百科全书、年鉴、手册、词 典、机构指南和人名录、书目及书目指南等参考工 具。

第二章 信息检索的基本方法

第二章 信息检索的基本方法

C93 管理学 C93-03 管理学方法论 F2 经济计划与管理 C93-05 与其他学科的关系 C93-06 学派及其研究 F20 国民经济管理 C93-09 管理学史 C931 管理技术与方法 C931.1 管理数学 C931.2 管理的方式方法 C931.3 管理工作、管理人员 C931.4 办公室工作 C931.6 管理信息系统 C931.9 管理工作自动化 C932 咨询学 C933 领导学 C934 决策学 C935 管理计划和控制 C936 管理组织学 C939 应用管理学
中国法律
D93/97
各国法律
D99
国际法
主要内容:法的理论(法学)- 法学与其他学科的关系、立法 理论、法制与民主、法的起源 与本质、法的历史类型、比较 法学、法学史、法律思想史、 主要内容:理论、国家法、宪 主要内容:国家法、宪法行政 法制史 法、行政法、财政法、金融法、 法、财政法、金融法、经济法、 经济法、土地法、劳动法、自 土地法、农业经济管理法、劳 主要内容: 国家法、宪法、行 然资源与环境保护法、合同法、 动法、自然资源与环境保护法、 政法、财政法、金融法、经济 婚姻法、商法、刑法、诉讼法、 主要内容:国际法理论、国家、 青少年法、军法、民法、婚姻 法、土地法、农业经济管理法、 司法制度、地方法制、中国法 领土、外交领事法、条约法、 法、商法(总论)、刑法、诉讼 劳动法、自然资源与环境保护 制史。 国际组织法、平时国际法、战 法、司法制度、犯罪学、刑事 法、军法、民法、婚姻法、商 时国际法、中立、国际经济法、 侦查学 、司法鉴定学 法、刑法、诉讼法、司法制度、 国际环境保护法、国际私法、 、法医学 地方法制、法制史。 国际刑法、国籍法、外层空间 法(宇宙法)、核法。

三、信息检索系统的组织(信息的序化)

文献信息检索ppt课件

文献信息检索ppt课件

和B的文献,才算命中文献。

3、逻辑“非”
————————————————
AB
用符号“not”或“-”,其逻辑表达式为: A not B 或 A-B
其意义为:检索记录中含有检索词A,但不能 含有检索词B的文献,才算命中文献。

逻辑提问式(布尔逻辑组配):
计算机检索的基本技术,主要通过逻辑运算 符(布尔算符)“与(and,*)”、“或 (or,+)”、 “非(not,-)”等将检索词连接 的提问式。
注意:优先级为not, and, or,用括号保证优 先权;运算符两侧必须各有一个空格(半角)。
实例:
膜法提取甘露醇中的微生物污染控制 (膜法+膜集成)*甘露醇*(细菌污染+微生物污 染)
写出以下检索词,并用上述布尔逻辑符写出检 索式:
固氮和固碳的生化机理或基因机制
(二)、位置算符
在检索词之间使用,规定算符两边的检索词出现 在记录中的的位置,以提高检准率。比如:如果 不用with位置算符,则词组可能被系统识别为逻辑 运算,protein disulfide isomerase(蛋白质二 硫键异构酶)可能被识别成“protein AND disulfide AND isomerase”。尤其是出现数字等 符号时不易识别成词组。
AB
用符号“or”或“+”表示,其逻辑表达式为:
A or B
或 A+B
其意义为检索记录中凡含有检索词A或检索词B,
或同时含有检索词A和B的,均为命中文献。
例:
2、逻辑“与”
————————————————
AB
用符号“and”或“*”表示,其逻辑表达式为:
A*B

文献检索,信息检索(2)第二章 信息检索原理

文献检索,信息检索(2)第二章  信息检索原理
优点:可以检索到某学科或专业的所有文献,有较高 的查全率。
缺点:常常落后于当前研究现状,分类表相对呆板的 学科关系,使得确定前沿概念、跨学科概念或非常具 体概念的分类,较困难。用户差异性。
分类语言
中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类法
基本部类 马列毛邓 哲学
(2)多概念课题
并列概念课题,如“新闻宣传研究”
“计算机在人文社会科学方面的应用” 上位类分类方法,如“灰色系统理论”
应用性课题,如“计算机在人口预测方面的应用”、
2.主题语言
是直接以代表信息内容特征和科学概念的概 念词作为检索标识,并按字顺组织的一种检索语 言。 是以表达文献主 是从文献的内容 是从文献的题目
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,
将检索提问式转换成逻辑表达式,限定检索
词在记录中必须存在的条件或不能出现的条 件。凡符合布尔逻辑所规定的条件的文献, 既为命中文献。
布尔逻辑运算符
————————————
1、逻辑“或” 2、逻辑“与” 3、逻辑“非”
2、逻辑“与”
————————————————
Chinese AND litera0,000 网络100,000,000) 用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B 其意义为检索记录中必须同时含有检索词A和B 的文献,才算命中文献。
4、记录级
检索词在数据库的同一记录中。
(C)—citation
表示两侧的检索词(或检索项)必须出现在同一记录中,词
序不限,中间词数量不限,其作用与布尔逻辑算符AND相同。

第二章 信息检索基本方法与基本技术

第二章  信息检索基本方法与基本技术

2. 主题检索语言
• 标题词:经规范化处理的词或词组,先组式
语言
• 叙 词(单元词):经规范化处理的词或词
组,后组式语言,可自由灵活组配
• 关键词:未经规范化处理,直接从文献题名、
原文或文摘中选取的能反映原文主题内容的自 由词汇
二、检索工具
定义:检索工具是人们用来存储、报道和查找 文献的工具,它具有存储和检索的功能。
点击预约书刊可预约该书 预约图书:选定所需图书,输入证号、密码,执行预约 点击机读格式可查看该书的MARC信息
高级查询
• 在题名、著者、丛书名、主题词、出版社、 ISBN(书)、ISSN(刊)、索取号、起始年 代中填入自己确定的内容,其余的可以不填 写;选定语种(17种)和文献类型,然后进 行检索。 • 结果可检索到所需文献的题名、著者、出版 信息、索取号 • 查看选中图书的相关信息
图书馆信息查询系统
•书目查询 •读信者息 •新书通报:一个月内到馆的新书、馆藏 地,并可查看新书 •订购征询 •信息发布:预约到书列表、超期罚款、 超期催还、委托借阅到书列表
如何利用计算机进行检索
书刊查询
读者信息查询
图书馆主页的功能
信息发布功能:
图书馆最新服务动态、电子 资源试用等均及时在主页上发布。
一、信息检索原理
信息检索的原理(示意图)
存 储
特征化
表示
查 询
特征化
表示
信息 集合
选择与匹配
需求 集合
二、信息检索类型
手工检索 计算机检索 文献信息检索
• 信息检索(内容)
• 信息检索(工具手段)
数据信息检索
事实信息检索
第二节 信息检索语言与工具
一、信息检索语言

信息检索教程(第二章)

信息检索教程(第二章)

4
(b)按收录文献出版形式分
●图书目录 ●期刊目录 ●会议论文目录 ●标准目录等。
(c)按物质形式划分
●卡片目录 ●书本目录 ●机读目录 ●联机公共检索目录等。
5
(2)图书馆目录、OPAC和联合目录概述
①图书馆目录
定义:它主要提供馆藏资源的检索,又叫馆藏目录,它反映
了一个图书馆的文献收藏情况,是一种重要的检索工具。
26
常用法示例
27
追溯法示例
28
2.3.2检索途径
29
30
1.分类途径
图书期刊分类法
世界三大图书分类法
《杜威十进分类法》(DDC)(Dewey decimal Classification ) 《国际十进分类法》(UDC)(Universal Decimal Classification) 《国会图书馆图书分类法》(LCC)(Library congress classification)
定义:所谓文献检索的方法,即查找文献的方法。有以下三种: 常用法:直接利用文献检索工具或检索系统来查找文献的方法,是 一种常规的科学检索方法。又称工具法或直接法。分为顺查法 、倒查法和抽查法。 追溯法:是一种跟踪查找法。它不利用检索工具只是利用文献(尤其 是评述性论文或专著) 后面所附的参考文献进行逐一地追踪查 找原文。又称引文法。 综合法:是常用法和追溯法的综合。利用检索工具或检索系统进行 常规检索,再利用文献后所附参考文献进行追溯检索,分期分 段交替使用这两种方法,直到满足要求为止。可以查得较全面 较准确,尤其适用于那些过去年代内文献较少的课题。称循环 法、分段法或交替法。
22
2.2.2检索工具的鉴别与评价
1.信息收录范围与信息质量
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
U447 桥梁安全与 事故
U448 各种桥型 U449 涵洞工程
图 2-4 《中图法》结构示意图 34
T类又可分为以下几类
TB 一般工业技术
TD 矿业技术
TE 石油、天然气工业
TF 冶金工业
TG 金属学、金属工艺
TH 机械、仪表工艺
TJ 武器工业
TK 动力工程
TL 原子能技术
TM 电工技术
TN 无线电电子学,电信技术
因此网络版(Ei CompendexWeb)信息更新最快,量 最大。
19
2.3 检索方法及检索途径
检索方法:
1.常规法: 所谓常规法就是利用常规检索工具查找有关文献
的方法 顺查法、倒查法、抽查法
2.引文法 就是查找参考文献或引用文献的方法。由远及近
地搜寻 ;由近及远地追溯
3.综合法 引文法和常规法结合
26
检索途径
1、主题途径 2、分类途径 3、责任者/刊名途径 4、号码途径
27
1、主题途径
主题途径是采用反映文献主题概念的 检索词作为检索入口的一种检索途径,也 是最常用、最重要的检索途径。
主题“是一组具有共性事物的总称, 用以表达文献所论述和研究的具体对象和 问题”,即文献的“中心内容”。
每种文献都包含着若干主题,研究或 阐述一个或多个问题。
4、全文型检索工具
特点:提供全文下载
wiley elsevier
13
(二)按所收信息的学科内容划分:
综合性检索工具
涉及多学科,收录范围广。
专科性检索工具
能够比较集中、迅速准确和全面地反映某学 科领域的最新发展状况和最前沿的科研水平。 详细完整的专业信息极具针对性。
14
二 、检索工具的选择
示类号,二级类目采用等级列类方法用双位制数字表示。排检时先按照
社 .2012.要找原文,使用____检索《土木工程CAD》。
A.中文科技期刊数据库 B.中国人民大学报刊全文数据库 C.国务院发展研究中心信息网 D.图书馆的馆藏查询
16
【例题】使用——检索CN200920135079.3一种土 木连锁建筑结构。
A.维普中文科技期刊数据库 B.图书馆馆藏查询 C.中国人民大学报刊全文数据库 D.中国国家知识产权局专利数据库 E.中国国家科技图书文献中心(NSTL)
按信息处理层次划分
索 引 数 据 库
书 目 数 据 库
文 摘 数 据 库
全 文 数 据 库
书学 目位 及论 图文 书数 全据 数 据 库期专 产 刊利 品 论数 数 文据 据 数库 库 据 库
按收录文献信 息的范围划分
综合性数据库
专业性数据库
文本数据库

网络数据库

声音数据库 单机数据库
联机数据库
Classification) 《国会图书馆图书分类法》(LCC)(Library congress
classification)
中国图书分类法: 《中国图书馆分类法》(中图法) 《中国科学院图书馆分类法》(科图法) 《中国人民大学图书馆分类法》(人大法)
32
《中图法》介绍
《中图法》——《中国图书馆分类法》,以学科来组织知 识,将全部知识领域划分为5个基本部类,22大类。
TP 自动化技术,计算机技术
TQ 化学工业
TS 轻工业、手工业
TU 建筑科学
TV 水利工程
35
《中图法》从大类到小类,层层展开,不断细分, 形成完整的知识体系。
例如: 关于红楼梦研究资料的分类为 I207.411 I 文学 I2 中国文学 I207 文学评论和研究 I207.4 小说研究 I207.41 古代小说研究 I207.411 《红楼梦》研究与评论
《The Whole Earth Catalog》、 《四库
全书总目提要》、《民国时期总书目》、《 中国国家书目》、《全国总书目》、《全国 新书目》。
联合目录主要有: CALIS联合目录和OCLC联 机目录。
CALIS(中国高等教育文献保障系统)提供以中 国高等教育数字图书馆为核心的中国高校图书馆 联合目录。
36
【例题】《哲学辞典》类号为:B-61 【例题】《法国的货币与银行 》的类号为:F825.65
37
【例题】
在图书馆公共查询系统中检索游记小说: I267.4
38
(2)专利分类法
专利分类法是根据专利的功能(效果)或其 用途所属的行业部分来分类,目前,世界上大 部分国家采用国际专利分类法(International Patent Classification,简称IPC)国 际专利分类法(简称IPC),IPC是世界上应用最 广泛的专利分类体系,覆盖了世界所有专利文 献的95%。
第二章 信息检索方法
1Байду номын сангаас
2.1 检索的概念及原理 2.2 检索工具概述 2.3 检索方法及检索途径 2.4 检索式的拟订 2.5 检索步骤
2
2.1 信息检索的概念
一、信息检索的基本概念
狭义:是指依据一定的方法,从已经组织好的大量 有关文献信息集合中,查找并获取特定的相关文献 信息的过程。 广义:将信息按照一定的方式组织和存储起来,并 根据用户的需求找出有关信息的过程。
28
主题途径的优缺点
通常适合特性检索,查准率高;不适合族 性检索,查全率低 【实例】主题词“C语言—程序设计”就比分 类号TP312表达得更准
希望专指度高时采用主题途径。
29
【获取主题词的技巧】在图书的版权页可以找 到在版编目里面的主题词和分类号码。或者 在图书馆的馆藏数据找到主题词。 【实例】版权页 样例如右图所 示
息 检
主题语言 叙词语言:自行车、脚踏车、单车——自行车
索 语
关键词语言 名称语言

代码语言
引文语言
24
检索途径
25
常用字段缩写: TI——Title 文章题目 AB——Abstract 文章摘要 KW——Key Word 关键词 AU——Author 作者 AF——Affiliation 作者单位 SO——Source 文章来源(刊名信息等) ISSN(ISBN)—— International standard Serial (book) Number PY——Publication year 出版年 LA——Language 语种
OCLC(联机计算机图书馆中心)是世界上最大的 提供网络文献信息服务和研究的机构。
10
3、文摘型检索工具
特点:具有摘要,提供文献的外表特征 和内容特征。如: 《中国生物学文摘》、美 国《化学文摘》 作用: 帮助读者快速判断文献内容,节省阅读时间 替代原文
11
图2-3 EI的一例文摘
12
30
2、分类途径
(1)图书期刊分类法 (2)专利分类法 (3)标准文献分类法 (4)分类途径的优缺点
31
(1)图书期刊分类法
世界三大图书分类法: 《杜威十进分类法》(DDC)(Dewey decimal Classification) 《国际十进分类法》(UDC)(Universal Decimal
五大部类分别为: 马列主义、毛泽东思想; 哲学; 社会科学; 自然科学; 综合性图书。
33
马列 哲学
社会 科学
自然 科学
综合
基本大类
简表
详表
A 马克思主义、列宁主义
毛泽东思想、 邓小平理论
B 哲学、宗教
C 社会科学总论
D 政治、法律
E 军事
F 经济
G 文化、科学、教育、体育
H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、安全科学 Z 综合性图书
20
思考:信息检索就是从一定的文献集合(即 检索系统)中查找出符合特定需要的文献, 那么这个过程是如何实现的呢?
21
存储 过程
一次 分析 信息
信息
特征
检索 检索 分析 检索
过程 课题
提问
标存引储信信息息与特征 输入
信 检索信息标所识
息 检
依据的规则 不一致


索 输出 索



语 言
标引 检索提问 检索
图2-2 《中国大百科全书》的一例索引
8
2、目录型检索工具
目录能反映一定历史时期科学文化发展的概貌
作用: 了解本学科的研究历史和研究现状。 通过各类书目,可查寻与研究课题密切相关的 事实和资料。
按收录的范围可分为:馆藏目录、出版社目录、国家 书目、联合目录。
9
各时期有代表性书目:
三、文献检索: 检索的结果是文献资料。查找相关文献的内容、出处、收藏单位等。如
系统地查找信息检索方面的相关文献(论文)
文献检索是信息检索的一种最基本的、最主要的形式。 4
2.2 检索工具概述
一、检索工具的定义及类型
检索工具是人们用来存储、报道和查找各类 信息的工具 。
5
数据库的类型
按收录的文献类型划分
考虑学科范围、信息类型和数据量 【例题】用____检索α-呋喃甲醇羧酸酯的合成、含有碳和氢元素的
化合物的英文综合学术性文献。 A.外文Elsevier数据库 B.外文农业类CAB文摘数据库 C.外文农业类AGRICOLA数据库 D.外文食品科技文摘数据库FSTA
15
了解收录的文献类型 【例题】已知参考文献:王涛.土木工程CAD.中国水利水电出版


标识
图2-4 信息检索原理图
22
检索语言是应文献信息的加工、存储和 检索的共同需要而编制的专门语言,是表达 一系列概括文献信息内容和检索课题内容的 概念及其相互关系的一种概念标识系统。
相关文档
最新文档