第二讲_计算机信息检索基础知识
合集下载
计算机基础信息检索

多媒体信息检索技术应用
图像检索:通过图像内容进行 检索如图像识别、图像分类等
音频检索:通过音频内容进行 检索如语音识别、音乐识别等
视频检索:通过视频内容进行 检索如人脸识别、场景识别等
文本检索:通过文本内容进行 检索如关键词搜索、文本分类
等
多媒体融合检索:结合多种媒 体进行检索如跨媒体检索、多
媒体内容分析等
和准确性
移动化:适应 移动设备的发 展趋势提供更 便捷的检索服
务
社交化:结合 社交网络提高 信息传播和检
索的互动性
专业化:针对 特定领域提供 更专业的检索 服务满足不同
用户的需求
数据库信息检索 技术
数据库信息检索原理
检索方法:包括全文检索、 关键词检索、布尔检索等
数据库检索:通过数据库管理 系统(DBMS)进行数据查询 和检索
多媒体信息检索原理
多媒体信息检索技术分类
基于内容的检索:通过分析多媒体内容的特征进行检索 基于文本的检索:通过分析多媒体内容的文本信息进行检索 基于视觉的检索:通过分析多媒体内容的视觉特征进行检索 基于音频的检索:通过分析多媒体内容的音频特征进行检索 基于视频的检索:通过分析多媒体内容的视频特征进行检索 基于多模态的检索:综合利用多种特征进行检索
数据库信息检索技术发展趋势
智能化:利用人工智能技 术提高检索效率和准确性
集成化:将多种数据库技 术集成实现跨平台检索
安全性:加强数据加密和 访问控制保障数据安全
实时性:提高数据更新速 度实现实时检索
移动化:适应移动设备的 需求提供移动检索服务
云化:利用云计算技术实 现数据库资源的共享和优 化
多媒体信息检索 技术
信息检索技术:包 括文本检索、图像 检索、音频检索等
第二讲 信息检索基础知识

1.1 信息检索的概念
广义信息检索
是将信息按一定的 方式进行加工、组 织并贮存起来,再 根据信息用户的需 要找出有关的信息 过程。它的全过程 又叫信息存储与检 索。
信息检索
狭义信息检索
指用户根据需要 ,借助于检索工 具,从信息集合 中找出所需要信 息的过程。本书 所介绍的信息检 索就是狭义信息 检索 。
1.2 信息检索的原理
存
储 一次 分析 信息
过 信息
特征
程
检 索 信息 过 需求 程
分析 检索 提问
标引 信息特征 输入 检
检 索
标识
(检索项)
索检
工 具 输出
索
语
和结
言 标引
检索提问 检索 系
标识
统
果
(检索词)
1.3 信息检索的类型
按信息检索的内容划分
▪ 数据信息检索(Data information Retrieval) ▪ 事实信息检索 (Fact information Retrieval) ▪ 文献信息检索 (Document information Retrieval)
青岛工学院图书馆http://10.10.58.103/
三、信息检索技术
检索技术,是指利用光盘数据库、联机 数据库、网络数据库、搜索引擎等进行信息 检索,采用的相关技术,主要包括布尔检索、 截词检索、字段检索、词位置检索、加权检 索等
检索方式
▪ 1、命令式检索:用逻辑运算符、位置算符及其他检索 符号,把不同的检索词连接起来进行检索的一个种方式。 适用于专业人员。
主题语言又分为标题词语言、单元词语言、叙词
语言和关键词语言,前两种语言目前使用较少。 1)叙词语言:叙词是为了适应计算机检索的需
信息检索基础知识 - 第二讲信息检索系统、工具及语言

二、按加工层次分:
一次文献(Primary Document):
通常是指原始制作,即作 者以本人的研究成果为基本素材而创作(或撰写)的文献。 检索的目标 如期刊论文、科技报告、会议论文、专利说明书
二次文献(Secondary Document):是指文献情报工作者对
一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文 献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。二次文 献的重要性在于可以帮助人们查找一次文献。 检索的手段
光盘检索
用光盘作为信息存储介质的数据库。 分为单机检索和局域网内的联机光盘检索。
网络信息检索
用户在自己的客户端上,通过互联网和浏览器界面对网络 信息进行检索。 特点
数据库分布式存储,数量多,信息量大;由于超文本语传输 协议,提供了大量相关链接; 内容向多媒体发展,不仅有文本,还有图像、声音等; 数据库更新速度快; 检索功能强,索引多,易学易懂;但目前各数据库检索界面 和检索技巧不尽相同,给使用者造成不必要的麻烦; 检索环境宽松,检索费用比联机检索低很多。 (网络信息检索也包括通过网络进行的数据库检索)
国 hggghgh5454545454
风 光 好 官 方 官 方 共 和
知识的存在形式
1、存在于人脑记忆中 2、存在于实物中 3、用文字、图形、符号、代码、声频、视频 等技术手段记录在一定载体上的知识。 其中第三种形式称作文献
文献(literature、document)的概念
《中华人民共和国国家标准· 文献著录总则》给文献 下的定义是:“文献是记录有知识的一切载体”。
俴蔑曱檻椚怒盽盢餚罗孎榢巫萶絃筢 湵誕秠櫆憸诺啂奥込穚篣癑蓐潇醹歟 栉鷰鄹眙
第二讲信息检索基础

回 顾
●
本讲主要内容
● ●
信息检索概念 信息检索意义 信息检索原理 信息检索类型 信息检索途径 信息检索方法
●
信息检索技术 信息检索策略 信息检索步骤
●
● ●
●
Hale Waihona Puke 信息检索语言信息检索利用
●
●
●
有一种能力与生俱来
有一种能力终身受用------信息检索
信息检索概念
南航学生事务服务中心:【名家讲坛】4月8 日19:00在一号楼四楼报告厅,延参法师邀 请你一起《快乐看人生》!本次讲座将凭票 入场,但入场券只提供入场资格,现场座位 先到先得!入场券将在本周日(3月31日) 16:00在学生事务服务中心办公室免费领取, 领完为止,同样先到先得哦!邀你的同学一 起聆听大师的教诲吧!
信息检索途径
是由提取信息源的外部与内部特征形成 的,又称为检索点或检索入口
题名 责任者 号码 (专利号、标准号等) 出版信息 丛编 装帧 责任者单位
分类 主题
外部特征 信息(文献)
内部特征
文献外部特征主要检索途径:题名 责任者 号码 文献内部特征主要检索途径:分类 主题
信息检索方法
德国柏林图书馆门前有这样一段话:“这里是知识的宝库, 你若掌握了它的钥匙,这里的全部知识都是属于你的。”
信息检索类型
信息检索类型
按检索对象性质: 文献检索:凡是以文献(包括文献线索、文摘、题录 和 全文)为检索对象的一种检索。检索结果是特定文献线索。 移动通信病毒文献有哪些? 数据检索:凡是以数据(包括计算公式、化学分子式、数 值、图表(参考工具书) )为检索对象的叫数据检索。 检索结果是数值性数据。今日人民币对美元汇率 事实检索:统计资料、百科知识、人物传记、案例等世界 上最长的斜拉桥是哪座,该桥位于什么地方,何时建成? 按检索方式:手工检索 计算机检索
《信息检索》 第2讲 信息检索的基本知识2

19
2013-8-1
(2)自然语言和受控语言的一体化发展趋势
在网络环境下自然语言和受控语言的融合或称一体化是检索
语言未来发展的必然趋势。这方面比较前沿的、有代表性的 理论研究和实践是国内张琪玉先生提出的学科——事物概念 组配型检索语言和美国国家医学图书馆所创建的UMLS系统 。 学科——事物概念组配型检索语言具有的特点是:通过学 科聚类和事物聚类的结合、号码标识和词语标识的结合以及 系统序列和字顺序列的结合,实现分类系统和主题系统的完 全一体化。用户从自然语言词汇、分类号和主题词任一途径 入口检索,都能获得相应的文献。这种检索语言具有开放性 ,可不断增补新概念。目前该模式正处于理论研究阶段。 UMLS模式即一体化医学语言系统。UMLS由超级叙词表、语 义网络、情报源图谱和专家词典四个相互联系的部分组成。
13
2013-8-1
用主题法查找文献,要注意以下几点:
注意利用词表
选择主题词要把握概念的含义 要利用概念之间的属种关系和相关关系增加检索线索
14
2013-8-1
注意利用词表
主题词是检索系统使用的专门的规范化语言,用这
种语言表述的概念,只有一种解释,不允许一词多 义、多词一义,这是规范化检索语言的单义性所规 定的。而一般用户的提问用的是自然语言,自然语 言并不遵守特定事物具有特定概念用特定语言表达 这一原则。
10
2.2 关键词语言
关键词语言是适应目录索引编制过程自动化的需要而产
生的。关键词是文献的篇名、摘要、正文中出现的具有 实质意义并能表达文献主题内容的词语。以关键词作为 标识的检索系统就叫做关键词语言。 由于关键词是未经规范的自然语言,一个概念可以用几 个词义相同或相近的词来表达,因此关键词语言没有固 定的词表,只有一个停用词词表,用以识别词语的词性 ,方便计算机自动抽取实质性语词。 关键词语言十分适于计算机编制索引,检索入口多,编 制速度快,但缺点是容易造成漏检。 例如:“国际联机检索概论”中的“国际联机检索”、 “国际联机”、“联机”、“检索”都是能描述这篇文 献主题的关键词,都可以作为检索词。
计算机信息检索基础知识

• 支气管扩张剂对肺的作用
– 分类标引:R974 呼吸系统药物 – 主题标引:肺/药物作用 支气管扩张剂/药理学
计算机信息检索系统组成
• 硬件:运算器、控制器、存储器、输入输出装置等 • 软件:系统操作程序、数据库管理程序、联机控制
程序、应用程序等。 • 通讯线路:电话通讯网、数据通讯网、卫星通讯网 等。 • 检索终端:信息用户与检索系统主机进行人机对话, 实现联机检索的设备。包括上网设备、调制解调器 等。 • 数据库:是计算机检索的对象。是由一个或数个文 档构成,并能够满足某一特定目的或某一特定数据 处理系统需要的一种数据集合。
光盘数据库检索
• 光盘 是80年代发展起来的激光存储载体,继 纸张感光材料、磁性载体之后问世的又一种 新型的信息存储介质。能存储数据、文字、 图形、图像、声音、动画等各种信息。一张 普通的光盘、信息存储量约为550兆。 • 光盘的分类:按存储方式分为
(1)只读型光盘:CD-ROM (2)写读光盘:WORM (3)可擦写型光盘:ERM
光盘检索的定义和特点
• 定义:
是一种用激光技术在特制圆盘上记录信息 的检索方式。 • 特点: (1)投资成本低; (2)价格低; (3)运行速度快; (4)检索效果好; (5)下载方便; (6)安全性能高。
光盘检索的系统组成
• 单机光盘检索系统组成: (1)数据库:光盘 (2)软件:系统软件和检索软件 (3)硬件:计算机、光盘驱动器、显示屏、打印 机等 • 网络光盘检索系统组成: (1)光盘塔 (2)光盘组网软件 (3)光盘塔服务器
NOT > AND > OR ( )号里的部分运算优先
截词检索
截词检索就是把检索词截断,取其中的一 部分,在加上截词符号一起进行检索。主要 用于检索词的单复数、词性的词尾变化、词 根相同的一类词,以及同一词的拼法变异等。 通用的截词符有:?和* ?代表一个字母;*代表两个或两个以上字母
信息检索 第二讲 信息检索概述

通过分析信息存储和检索的全过程可以看出检索语言
大致有以下四个主要的功能:
对文献的情报信息内容及其外表特征加以规范化的标引;
对内容相同及相关的文献信息加以集中或揭示其相关性;
可使文献信息的存储集中化、系统化、组织化,便于检
索者按一定的排列秩序进行有序化检索;
便于将标引用语和检索用语进行相符性比较。
科性质进行分类和系统排列 。
特点:能集中体现学科的系统性,反映事物的
从属、源生关系,便于按学科门类进行族姓检
索。
(1)分类语言
按照分类方式的不同:
混合分类语言 体系分类语言 分类语言
体系分类法是基于概念
的划分和概括,以学科 分类为基础,把概括文
献内容与事物的各种类
目组成一层层隶属、详 细列举的等级结构体系。
文献检索
事实检索
数据检索
7
3.信息检索的类型
文献检索。以文献或其索引、文摘为检索对象, 目的是核实已知文献的不确切项目,如著者名、 年代、出处等,或查检某课题原始文献的线索 及它们的具有收藏情况。
文献检索是相关性检索,不直接回答用户所提 技术问题本身,只提供有关的文献供参考。
举例: “关于自动控制系统有些什么参考文献”
CALIS公共目录检索系统检索界面
读秀知识库检索界面
三、信息检索语言
1.检索语言的概念
2.信息检索语言的功能与作用
3.信息检索语言的类型
1.信息检索语言的概念
信息检索语言是一种专门的人工语言,又 称标引语言和索引语言,是信息系统中用 以描述信息的内容及外表特征和检索者表 达检索提问的语言,是两者相互沟通的共 同依据,是用于信息标引和检索提问的约 定语言。
计算机信息检索基础知识

信息检索的步骤
研究课题 用户
主题分析
选择检索系统或 数据库
选择检索途径:主题 词、作者、机构等
检索操作
制定检索策略和 检索方式
初始检索 结果输出 不满意
用户结果评价
满意
检索结果
索取原文
三、网络信息资源及其特点
网络信息资源又称为虚拟资源、数字资源、 电子信息资源、联机信息资源、万维网资源 等,是互联网上电子信息资源的统称,是以 数字化形式记录的,利用计算机技术、通信 技术及多媒体技术在网络上发布、查询与存 取利用的信息资源的总和。
追溯法:这是利用已有的文献后面的参考文 献进行追溯查找的方法,是在没有检索工具 或检索工具不全的情况下使用的一种方法。 但用这种方法查找的文献不全,有片面性, 文章漏检率高,知识陈旧的占多数,目前已 很少有人使用。
分段法(循环法):这是将常用法与追溯法 交替使用的一种方法,即利用工具书检索文 献,又利用文献后面的参考文献进行追溯, 两种方法交替使用,直到满足读者需要为止。 这种方法可根据文献和本单位工具书收藏的 情况分期分段交叉运用不同的查找方法,既 能获得一定时期内的文献,还可节约查找时 间。
(3)专门从事数据库制作和销售的数据库商 如EBSCO公司、ProQuest公司等;自己没有出 版物,但他们买出版公司的产品,然后建立检索 平台供读者检索,例如iGroup公司建立了 Scitation平台,在上面可以看到AIP(美国物理 学会)、ASME(美国机械工程师协会)等几十 个专业学协会的电子期刊。
2信息检索技术
布尔逻辑检索 截词检索 位置检索 字段限定检索
布尔逻辑检索
逻辑与AND(*)。 逻辑或OR(+)。 逻辑非NOT(-)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 数据库(文档)
由若干数量的记录构成的数据的集合。大型的 数据库检索系统中称为文档。
可检索字段
中国期刊网字段示例
命中记录列表
详 细 记 录
四 计算机检索技术
1 布尔逻辑运算符 2 截词算符 3 字段限制
4 范围限制 5.短语检索 6.括号检索
1、布尔逻辑运算符
①逻辑与: “*”或“and” ②逻辑或: “+”或“or” ③逻辑非: “-”或“not”
第二讲 计算机信息检索基础知识
主要内容
计算机检索的概念 数据库及其类型 数据库的结构 计算机检索技术 计算机检索的步骤、方法、途径
一 计算机信息检索的定义
指利用计算机存储和检索信息。
具体地说,就是指人们在计算机或计算 机检索网络的终端机上,使用特定的检 索指令、检索词和检索策略,从计算机 检索系统的数据库中检索出所需的信息 的过程。
“吸烟与心脏病的关系”
(smok* OR tobacco) AND (cardiopathy OR heart disease OR heart trouble OR heart attack)
4 进行检索
可利用数据库提供的不同级别 的检索界 面进行检索
--初级检索 --高级检索
5 分析检索结果 调整检索策略
检索点 即检索途径或检索入口、检 索字段。检索点正确与否,决定着 检索结果的数量与质量。
确定检索词
如:“吸烟与心脏病的关系” 可以表达为 connection between somking and heart disease 通过分析发现,其中,只有somking和heart disease两个概念词,而“connection between” 则不属于概念词。
检全率递增
题名 关键词( 文摘 )
检准率递增
全文
命中31篇 命中80篇
命中44篇 命中410篇
4 范围限制
指对检索词的范围(如时间、国别、语 种、信息类型等)进行约束或压缩的方 法,它大多通过检索系统的限制指令或 菜单选择来实现。
工程索引检索界面
5.短语检索
用“”表示,检索出与“”内容完 全相同的短语,提高检索的精度和 准确度。
1) 根据词表或数据库中的索引选词
2) 从专业词典、百科全书等参考工具中 选词
3) 利用中文全文数据库选择英文检索词
编制检索式
使用逻辑算符(AND, OR, NOT) 、截词、 位置算符, 限制检索条件至作者, 刊物 或年代 .
调整其他设定
选定检索结果的显示方式– 日期, 相关度等排序
例
Knowledge、CSAIDS、EBSCOHost、ProQuestordjne等多个著名 检索平台综合分析布尔逻辑、位置逻辑、模糊检索技术、网络叙 词表构建技术在网络数据库的应用,研究表明信息检索技术已深 深植入网络信息资源管理之中,深入剖析信息检索技术,可以清 晰揭示提问表达式的构建机理,掌握网络数据库的原理及使用方 法,为网络信息资源评价和建设提供依据。
数值型数据库 提供各类数值型数据
图象数据库 以图形、图象为记录单位
返回
返回
返回
返回
返回
数据库类型—按收录专业范围划分
综合性数据库
收录多个学科或专业的信息资料。如中国期刊网
专业性数据库
收录单一学科或专业的信息资料。
专题性数据库
收录某一特定专题的信息资料
综合型数据库
返回
举例:
【题 名】信息检索技术在网络数据库中的应用研究 【作 者】邹小筑[1] 缪红梅[2] 【机 构】[1]南京大学信息管理系,南京210093 [2]南京航空航天
大学,南京210016 【刊 名】图书情报工作.2007,51(2).-104-106,131 【ISSN号】0252-3116 【关键词】信息检索技术 网络数据库 检索平台 【文 摘】以信息检索技术为脉络,结合Ei Village2、ISI Web of
dam* dam dams
wom?n woman women
3、字段限制
指将检索词限定在特定的字段中进行。 • 同样的检索词,选择在不同字段中进行检索,
得到的结果是不同的。
• 检索系统通常都会设置默认的检索字段,如 “所有字段”。如果想指定在特定的字段中 查找检索词,就需要调整检索字段,进行字 段限制。
概念1:somking 概念2:heart disease
针对每一个概念,选择与之相 关的同义词或相关词
与somking相关的词有: smoker,smokers,tobacco等;
heart disease的同义词有cardiopathy,heart trouble, heart attack.
2.选择信息资源
是否与检索课题相关的资源都要检索 选择哪些学科的信息资源 选择哪些语种的信息资源 信息资源覆盖的年限是否符合需求 信息资源的特点及其针对性如何
3、构造检索式 选择检索点
检索式 是表达用户检索提问的逻辑 表达式,由基于检索概念产生的检 索词和各种组配算符构成。
作用:
缩小检索范围, 提高检准率
②“或”算符 or OR +
“或”算符可描述概念间的并列关系和相关 关系,用来组配同义词或相关词等。
含义:检出文献中包含有被其连接的任 意一个词或词组。
作用:扩大检索范围,提高查全率。 例如:自行车 + 脚踏车
CAD or computer aided design
缺省字段 为“篇名”
缺省字段为 “关键词”
缺省字段为 “All fields”
如果从文献的内容特征出发查找文献, 可选的检索字段有“篇(题)名 title”、 “关键词 keyword”、“文摘 abstract” 以及“全文 fulltext”。
一般,如果使用相同的检索词分别在这 几个字段中检索,那么检到的文献数会 依次递增,而命中的准确率则依次递减。
专业数据库 :
返回
专题数据库
三 数据库的结构—字段、记录和
文档
• 字段:文献著录的基本单元,反映文献
外部特征和内容特征的每一项目,在数 据库中就称为字段。
如:关键词KW、题名TI、文摘AB、作者AU、 刊名JN、出版时间PY、语种LA等
• 记录
由若干不同字段组成的文献单元,一条记录在 数据库中代表一篇文献。
同义词及相关词 增加被检索的数据库 – 确定其他数据库是否
覆盖你所要的主题
满意
是否已全部获取所需?
打印、电邮 或 存档
需否获取与题录相关的全文 ?
查找图书馆馆馆藏书目系统(OPAC),确定是否有纸本馆藏 查找图书馆订购的全文数据库 通过搜索引擎查找互联网开放获取(Open Access)的免费全文信息 通过馆际互借/文献传递从其他图书馆获取文献原文
课堂练习:
例1:课题名称:汽车导航系统的研究 例2. 课题名称:手持式心电图机 例3. 课题名称: 酸奶机
给出以上课题的检索词和检索式
例1:课题名称:汽车导航系统
的研究
关键词1. 汽车 机动车
关键词2. 导航系统 全球定位系统 GPS
关键词3. 研究 设计
调查
检索式的构造:
①“与”算符 and AND *
“与”算符用于描述概念间的交叉关系和限 定关系。
含义:检出文献中必须同时包含被其连 接的所有词或词组。
作用:缩小检索范围,提高查准率。 例如: 儿童 * 心理学
computer AND virus
与运算示意图
A
B
computer
virus
A and B 计算机 *病毒
1. 分析课题的内容
⑴明确检索目的
• 需要关于某一课题的系统详尽的信息 • 需要关于某一课题的最新信息 • 了解一些片断信息,解决一些具体问题
⑵明确课题的主题或主要内 容
要形成若干个既代表信息需求又有检索意义 的主题概念,包括所涉及的主题概念有几个, 哪些是主要的,哪些是次要的,概念之间关 系如何等
⑶课题涉及的学科范围:搞清楚课题所 涉及的学科领域、是否跨学科研究
⑷所需信息的数量、语种、年代范围、 类型等具体化指标
例:检索课题--不锈钢焊接
检索目的
查找范围
了解最新的技术 利用期刊、会议录类的
动态
数据库查找
了解焊缝强度的 利用技术标准类的数据 测试方法和有关 库查找 规格
申请专利
利用专利类数据库查找
知识回顾 Knowledge
(汽车+机动车)*(导航系统+全球定位 系统+GPS)*(研究+调查+设计)
例2. 课题名称:手持式心电图机
关键词1:手持 便携 微型 小型 袖珍 迷 你
关键词2:心电图机 检索式
(手持+便携+微型+小型+袖珍+迷你) *心电 图机
例3. 课题名称: 酸奶机
关键词1:酸奶 酸乳 发酵乳 关键词2:机 罐 装置 设备 检索式 (酸奶+酸乳+发酵乳) * (机+罐+装置+设备)
“international space station”
6.括号检索
用于改变运算的先后顺序,括号内的运 算优先进行。
(university or college) and education
五 计算机检索步骤、方法、途径
大体可分为五个步骤: 1.分析课题的内容; 2.选择信息资源; 3.构造检索式,选择检索途径; 4.上机检索; 5.分析检索结果,调整检索策略。
或运算示意图
B
A
pipe
由若干数量的记录构成的数据的集合。大型的 数据库检索系统中称为文档。
可检索字段
中国期刊网字段示例
命中记录列表
详 细 记 录
四 计算机检索技术
1 布尔逻辑运算符 2 截词算符 3 字段限制
4 范围限制 5.短语检索 6.括号检索
1、布尔逻辑运算符
①逻辑与: “*”或“and” ②逻辑或: “+”或“or” ③逻辑非: “-”或“not”
第二讲 计算机信息检索基础知识
主要内容
计算机检索的概念 数据库及其类型 数据库的结构 计算机检索技术 计算机检索的步骤、方法、途径
一 计算机信息检索的定义
指利用计算机存储和检索信息。
具体地说,就是指人们在计算机或计算 机检索网络的终端机上,使用特定的检 索指令、检索词和检索策略,从计算机 检索系统的数据库中检索出所需的信息 的过程。
“吸烟与心脏病的关系”
(smok* OR tobacco) AND (cardiopathy OR heart disease OR heart trouble OR heart attack)
4 进行检索
可利用数据库提供的不同级别 的检索界 面进行检索
--初级检索 --高级检索
5 分析检索结果 调整检索策略
检索点 即检索途径或检索入口、检 索字段。检索点正确与否,决定着 检索结果的数量与质量。
确定检索词
如:“吸烟与心脏病的关系” 可以表达为 connection between somking and heart disease 通过分析发现,其中,只有somking和heart disease两个概念词,而“connection between” 则不属于概念词。
检全率递增
题名 关键词( 文摘 )
检准率递增
全文
命中31篇 命中80篇
命中44篇 命中410篇
4 范围限制
指对检索词的范围(如时间、国别、语 种、信息类型等)进行约束或压缩的方 法,它大多通过检索系统的限制指令或 菜单选择来实现。
工程索引检索界面
5.短语检索
用“”表示,检索出与“”内容完 全相同的短语,提高检索的精度和 准确度。
1) 根据词表或数据库中的索引选词
2) 从专业词典、百科全书等参考工具中 选词
3) 利用中文全文数据库选择英文检索词
编制检索式
使用逻辑算符(AND, OR, NOT) 、截词、 位置算符, 限制检索条件至作者, 刊物 或年代 .
调整其他设定
选定检索结果的显示方式– 日期, 相关度等排序
例
Knowledge、CSAIDS、EBSCOHost、ProQuestordjne等多个著名 检索平台综合分析布尔逻辑、位置逻辑、模糊检索技术、网络叙 词表构建技术在网络数据库的应用,研究表明信息检索技术已深 深植入网络信息资源管理之中,深入剖析信息检索技术,可以清 晰揭示提问表达式的构建机理,掌握网络数据库的原理及使用方 法,为网络信息资源评价和建设提供依据。
数值型数据库 提供各类数值型数据
图象数据库 以图形、图象为记录单位
返回
返回
返回
返回
返回
数据库类型—按收录专业范围划分
综合性数据库
收录多个学科或专业的信息资料。如中国期刊网
专业性数据库
收录单一学科或专业的信息资料。
专题性数据库
收录某一特定专题的信息资料
综合型数据库
返回
举例:
【题 名】信息检索技术在网络数据库中的应用研究 【作 者】邹小筑[1] 缪红梅[2] 【机 构】[1]南京大学信息管理系,南京210093 [2]南京航空航天
大学,南京210016 【刊 名】图书情报工作.2007,51(2).-104-106,131 【ISSN号】0252-3116 【关键词】信息检索技术 网络数据库 检索平台 【文 摘】以信息检索技术为脉络,结合Ei Village2、ISI Web of
dam* dam dams
wom?n woman women
3、字段限制
指将检索词限定在特定的字段中进行。 • 同样的检索词,选择在不同字段中进行检索,
得到的结果是不同的。
• 检索系统通常都会设置默认的检索字段,如 “所有字段”。如果想指定在特定的字段中 查找检索词,就需要调整检索字段,进行字 段限制。
概念1:somking 概念2:heart disease
针对每一个概念,选择与之相 关的同义词或相关词
与somking相关的词有: smoker,smokers,tobacco等;
heart disease的同义词有cardiopathy,heart trouble, heart attack.
2.选择信息资源
是否与检索课题相关的资源都要检索 选择哪些学科的信息资源 选择哪些语种的信息资源 信息资源覆盖的年限是否符合需求 信息资源的特点及其针对性如何
3、构造检索式 选择检索点
检索式 是表达用户检索提问的逻辑 表达式,由基于检索概念产生的检 索词和各种组配算符构成。
作用:
缩小检索范围, 提高检准率
②“或”算符 or OR +
“或”算符可描述概念间的并列关系和相关 关系,用来组配同义词或相关词等。
含义:检出文献中包含有被其连接的任 意一个词或词组。
作用:扩大检索范围,提高查全率。 例如:自行车 + 脚踏车
CAD or computer aided design
缺省字段 为“篇名”
缺省字段为 “关键词”
缺省字段为 “All fields”
如果从文献的内容特征出发查找文献, 可选的检索字段有“篇(题)名 title”、 “关键词 keyword”、“文摘 abstract” 以及“全文 fulltext”。
一般,如果使用相同的检索词分别在这 几个字段中检索,那么检到的文献数会 依次递增,而命中的准确率则依次递减。
专业数据库 :
返回
专题数据库
三 数据库的结构—字段、记录和
文档
• 字段:文献著录的基本单元,反映文献
外部特征和内容特征的每一项目,在数 据库中就称为字段。
如:关键词KW、题名TI、文摘AB、作者AU、 刊名JN、出版时间PY、语种LA等
• 记录
由若干不同字段组成的文献单元,一条记录在 数据库中代表一篇文献。
同义词及相关词 增加被检索的数据库 – 确定其他数据库是否
覆盖你所要的主题
满意
是否已全部获取所需?
打印、电邮 或 存档
需否获取与题录相关的全文 ?
查找图书馆馆馆藏书目系统(OPAC),确定是否有纸本馆藏 查找图书馆订购的全文数据库 通过搜索引擎查找互联网开放获取(Open Access)的免费全文信息 通过馆际互借/文献传递从其他图书馆获取文献原文
课堂练习:
例1:课题名称:汽车导航系统的研究 例2. 课题名称:手持式心电图机 例3. 课题名称: 酸奶机
给出以上课题的检索词和检索式
例1:课题名称:汽车导航系统
的研究
关键词1. 汽车 机动车
关键词2. 导航系统 全球定位系统 GPS
关键词3. 研究 设计
调查
检索式的构造:
①“与”算符 and AND *
“与”算符用于描述概念间的交叉关系和限 定关系。
含义:检出文献中必须同时包含被其连 接的所有词或词组。
作用:缩小检索范围,提高查准率。 例如: 儿童 * 心理学
computer AND virus
与运算示意图
A
B
computer
virus
A and B 计算机 *病毒
1. 分析课题的内容
⑴明确检索目的
• 需要关于某一课题的系统详尽的信息 • 需要关于某一课题的最新信息 • 了解一些片断信息,解决一些具体问题
⑵明确课题的主题或主要内 容
要形成若干个既代表信息需求又有检索意义 的主题概念,包括所涉及的主题概念有几个, 哪些是主要的,哪些是次要的,概念之间关 系如何等
⑶课题涉及的学科范围:搞清楚课题所 涉及的学科领域、是否跨学科研究
⑷所需信息的数量、语种、年代范围、 类型等具体化指标
例:检索课题--不锈钢焊接
检索目的
查找范围
了解最新的技术 利用期刊、会议录类的
动态
数据库查找
了解焊缝强度的 利用技术标准类的数据 测试方法和有关 库查找 规格
申请专利
利用专利类数据库查找
知识回顾 Knowledge
(汽车+机动车)*(导航系统+全球定位 系统+GPS)*(研究+调查+设计)
例2. 课题名称:手持式心电图机
关键词1:手持 便携 微型 小型 袖珍 迷 你
关键词2:心电图机 检索式
(手持+便携+微型+小型+袖珍+迷你) *心电 图机
例3. 课题名称: 酸奶机
关键词1:酸奶 酸乳 发酵乳 关键词2:机 罐 装置 设备 检索式 (酸奶+酸乳+发酵乳) * (机+罐+装置+设备)
“international space station”
6.括号检索
用于改变运算的先后顺序,括号内的运 算优先进行。
(university or college) and education
五 计算机检索步骤、方法、途径
大体可分为五个步骤: 1.分析课题的内容; 2.选择信息资源; 3.构造检索式,选择检索途径; 4.上机检索; 5.分析检索结果,调整检索策略。
或运算示意图
B
A
pipe