15信息检索第2章-21

合集下载

信息检索原理

信息检索原理
• 是以文献为检索对象的信息检索。也就是说文 献检索是以图书、期刊、资料、数据库中的篇章或 全书刊为检索对象的一种检索。 如:检索有关“花卉组织培养技术”的文献。 文献检索是一种相关性检索,检索结果不直接 回答用户提出的技术问题,只是提供与之相关的文 献信息供用户参考。
7
(2) 事实检索(Fact Retrieval) 是以事实为检索对象的一种检索,查找某一事物发生的时间、地点及过程。 如检索“日本松下电器公司近年来进行了那些新产品的开发研究”“IBM公司所在地、总裁是
2
1.信息检索的定义 狭义:是指根据特定课题的需要,运用科学的方法,在大量信息(文献)集合中查获所需信息( 文献)的过程。 是指从任何信息集合中查找所需信息的活动、过程与方法。 广义:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程, 其全称是信息存储与检索。 广义的信息检索包括信息存贮和信息检索两个部分,两者又往往合并称为“信息存贮与检索 ”。
息 处
原 始
贮理 信
过人 息
程员
检用








信息分析、著录
和标引
存入

检索语言

(主题词/分类号)
工 具

检索 检出 索
课题分析


6
3.信息检索的类型
以检索内容区分:
根据检索对象不同,信息检索可分为文献检索、事实检索和数据检索三种类型。 (1) 文献检索(Document Retrieval)
3
第2章 信息检索原理
2. 信息检索的一般原理
信息检索包括存储和检索两个过程。
信息检索过程的实质是将检索提问标 识与存储在检索系统(检索工具)中的检索

第二章 文献信息检索基本知识(2).概要

第二章 文献信息检索基本知识(2).概要
(大学生or本科生or研究生)-(大专生or高职生) and 就业
(2)截词检索表达式
用截词符号“*”、“?”或“$”加在检索词 的前后或中间,以检索一组概念相关或同一词根 的词。 按截断的位置可分为:
前截断、中间截断、后截断 按截断的字符数量可分为: 有限截断(?)、无限截断(*)
如:输入检索式“Comput*”,将检出包含 Computer、Computing、Computed、 Computerization 等词汇的结果。
第二章 信息检索基础知识
2.3 文献信息检索的工具
1、文献信息检索工具概述 检索工具是将大量分散无序的文献资料经过加 工整理,按照一定的规则和方法编制起来,用来 报道、存储和查找文献的工具,是附有检索标识
的某一范围文献条目的集合。
传统的检索工具是人们利用手工方法编制的
工具书,有字典、词典、目录、百科全书、名录、 类书、政书、表谱、图录等。这些工具书是人们
题录示例
(3)索引(引得) 索引是将书刊内容中所论及的篇名、语词、主 题等项目,按照一定的排检方法加以编制,注明出 处,供读者查检使用的检索工具。 索引与目录的根本区别就在于著录的对象不同, 目录所著录的是一个完整的出版单位,索引所著录 的则是完整的出版物的某一部分、某一观点、某一 知识单元,提高文献检索的深度和检索效率。
完全一致(精确匹配)、任意一致(模糊匹配)
等。
讨论1: 我馆书目查询系统共有多少种检索方式?其基 本检索有多少个检索字段?
讨论2: “中国学术期刊网络出版总库”有哪些检索方式?

? ? 中国科技期刊数据库初级检索界面
2、 信息检索方法
(1)常用法 ①顺查法 ②倒查法 ③抽查法 (2)回溯法 (3)循环法

信息检索课件第2章

信息检索课件第2章
学术评价与评估
信息检索还可以用于学术评价与评估,通过对学术论文的 发表数量、被引次数等指标进行统计和分析,评价研究者 的学术水平和影响力。
信息检索在商业领域的应用
市场调研与竞争情报
企业通过信息检索技术收集市场和竞争对手的信息,了解市场需求、 竞争态势和行业趋势,为制定营销策略和产品开发提供支持。
品牌监测与管理
信息检索课件第2章
contents
目录
• 信息检索概述 • 信息检索技术 • 信息检索系统 • 信息检索的实践应用 • 信息检索的伦理与法律问题
01 信息检索概述
信息检索的定义
信息检索是利用计算机和人工 手段,从大量信息中查找和获 取特定信息的过程。
信息检索涉及对信息资源的组 织、标识、评价和检索等方面。
信息检索的目的是为用户提供 准确、及时和有用的信息。
信息检索的原理
信息检索基于信息需求, 通过特定的检索方式,从 信息源中获取相关信息。
信息检索的原理包括信息 标引、信息存储和信息检 索三个主要环节。
信息标引是对信息进行分 类、主题分析等处理,以 便于信息存储和检索。
信息检索是根据用户的信息需 求,利用特定的检索工具和策 略,从信息源中获取相关信息 。
网络搜索引擎、学术搜索引擎、特定领域搜索引擎等。
基于检索技术的分类
基于关键词的检索、基于内容的检索、基于知识的检索等。
信息检索系统的评价
查全率
检索系统返回的相关结果数量 与总相关结果数量的比值。
查准率
检索系统返回的相关结果中, 真正相关的结果数量与返回的 相关结果数量的比值。
响应时间
检索系统对用户查询的响应时间 ,即从用户提交查询请求到检索 系统返回结果所需的时间。

第二章_信息检索基础之二

第二章_信息检索基础之二

检索表达式示例
字段代码与字段 名称对照
位臵检索
位臵检索又称邻近检索,主要是通过 检索式中的特定符号来规定检索词在结果 中出现的顺序和词间距。
例如检索“生物防治”的文献,若用 检索式“biological*control”检索,则 会将“抑制生物”(control biological) 的文献也查出来,这显然不是所需文献。

字段代码方式
在进行检索时,通常在检索式中加入字段代 码来限定检索字段。字段代码与检索词之间可用 后缀符“/”或前缀符连“=”接起来。各个系统的 字段代码和前缀后缀符号可能各有不同。有的系 统不分前缀后缀限定。 例如,美国专利局数据库的高级检索界面便使 用了字段限制代码,用户需用这些字段限制代码 构造检索式,在检索框中输入检索命令来进行检 索。
字段限制检索主要有两种方式:

菜单选择方式
在检索系统的界面上设臵的字段下拉菜单中 进行选择,在相应的检索框中输入检索词,就可 完成字段限制检索。目前大多数检索系统都设臵 了此种检索方式。 例如,在中国期刊全文数据库检索界面中, 可在其提供的字段下拉菜单中选择合适的字段名 称进行检索。
字段限制检索主要有两种方式:
字段限制检索
字段检索是限定检索词在记录中出现的字段范围, 检索时,计算机只对限定字段进行查找。 这种检索技术可以缩小检索范围,提高检索的准 确率。 一般而言,一条记录中主要用来表达文献内容 特征的字段称为基本索引字段,如题名、文摘、叙词、 自由词等。常用的基本索引字段及其代码如表所示。 表达文献外部特征的字段称为辅助索引字段,如著者、 机构名称、语种、刊名、来源、出版年等。常用的辅 助索引字段及其代码如表所示。
截词检索
有限截断比较精确,只检出用户需要的词汇,而无限 截断作用时必须注意词干不要太短,否则会检出许多无关 文献。 在中文数据库中作用最多的是后截断,即立脚前方一 致检索。例如,金盘书目系统的查询方式。 金

信息检索PPT第2章

信息检索PPT第2章
第2章 图书信息检索
目录
2.1 图书馆概述 2.2 图书信息检索 2.3 电子图书检索
2.1 图书馆概述
2.1.1 图书馆信息资源介绍 2.1.2 图书馆职能 2.1.3 图书馆的服务类型及项目
2.1.1 图书馆信息资源介绍
1.图书馆资源的类型 1)纸介质资源:图书、期刊、报纸等; 2)非纸介质资源:电子图书、电子期刊等各种数据 库、随书光盘、磁带、VCD、DVD及网上资源。
2.1.2 图书馆职能
1.文献资源保存职能 2.文献资源整序职能 3.文献资源传递职能 4.社会教育职能 5.开发信息产品职能 6.开展网络导航职能
2.1.3 图书馆的服务类型及项目
各级各类图书馆的情况不同、条件各异,提供的网上服 务也不尽相同,一般的服务主要: 1.馆藏数据检索 2.网络资源信息导航 3.参考咨询服务 4.网上电子图书馆、虚拟图书馆资源的利用
2.图书馆馆藏资源的选择和利用
1)《中国图书馆分类法》(简称《中图法》)
2)《中国科学院图书分类法》(简称《科图法》)
3)《中国人民大学图书馆图书分类法》(简称《人 大法》)
4)杜威十进分类法DDC(Dewey Decimal Classification,简称DC/DDC)
5)国际十进分类法UDC(Universal Decimal Classification)
2.2.2 图书信息检索的查询
现在图书收藏信息主要是通过查询各图书馆的书刊目 录检索系统(Online Public Access System,简称 OPAC),公共联机书目查询系统。它是利用计算机 终端来查询图书馆馆藏数据信息资源的一种现代化检 索方式。 1.馆藏目录的查询 2.联合目录的查询 3.其他途径

第二章 信息检索基础

第二章 信息检索基础

2014-5-26
18
数据检索以具有数量性质,并以数 值形式表示的数据为检索目的和对象, 检索的结果是经过测试、评价过的各种 数据。
数据文件组织方式不同,数据检索 的技术方法亦不同。对于顺序结构文件 ,常见方法有顺序检索、分块查找法、 两分检索等。
对于随机结构文件,常采用直接地 址法、杂凑(hash)法等。地理信息系 统中空间数据检索常涉及目标空间分布 范围(行政区域、地理范围或空间关系 等)及目标属性类型(地形高度、坡度 、土地利用现状等)两个方面的综合条 件。
根据研究文摘历史的专家弗西斯·威蒂( Francis J. Witty)介绍,一种用途类似于文摘 的工具首先出现在公元前两千年美索不达米亚 人用楔形文字写成的文献的陶制封套上。
我国最早带有内容摘要的图书目录是西 汉刘向、刘歆父子整理编撰的《别录》和《七 略》。古代使用文摘的人有学者、政治家,还 有教皇和僧侣。
第四阶段:网络检索阶段。
网络信息检索开始于20世纪90年代初。 1991年思维机等公司、明尼苏达大学、欧洲高 能粒子协会分别推出了因特网上的检索工具 WAIS、Gropher和WWW。
目前,WWW因其集文本、图像、声音等 多媒体信息于一体的巨大优点,已占信息服务 的主导地位。
在该阶段,系统大多采用分布式的网络化 管理,其信息资源的主要特点是:数字形式表 达、多媒体和多取复杂、 用户界面要求高等。
信息检索多语种化 多语种信息检索将依然是未来网络信息检索 的研究热点,现在对多语种信息检索的支持主 要体现在预先设定检索语言,
其检索结果也限制在预先设定的语言中 。而使用某一种语言直接进行多语种检索,提 供多语种的匹配结果将是多语种信息检索的下 一个方向。
这种单一检索界面的检索将在后台有一个多 语种词库,对用户提交某一语种的检索词自动 在词库中查找对应其他语种的检索词,再提交 给搜索引擎,以多语种检索结果输出给用户。 这种多语种、多信息检索需要机器翻译技术的 支持,并且需要对多语种检索得出的输出结果 相关度或重要性排序进行研究。

文献检索,信息检索(2)第二章 信息检索原理

文献检索,信息检索(2)第二章  信息检索原理
优点:可以检索到某学科或专业的所有文献,有较高 的查全率。
缺点:常常落后于当前研究现状,分类表相对呆板的 学科关系,使得确定前沿概念、跨学科概念或非常具 体概念的分类,较困难。用户差异性。
分类语言
中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类法
基本部类 马列毛邓 哲学
(2)多概念课题
并列概念课题,如“新闻宣传研究”
“计算机在人文社会科学方面的应用” 上位类分类方法,如“灰色系统理论”
应用性课题,如“计算机在人口预测方面的应用”、
2.主题语言
是直接以代表信息内容特征和科学概念的概 念词作为检索标识,并按字顺组织的一种检索语 言。 是以表达文献主 是从文献的内容 是从文献的题目
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,
将检索提问式转换成逻辑表达式,限定检索
词在记录中必须存在的条件或不能出现的条 件。凡符合布尔逻辑所规定的条件的文献, 既为命中文献。
布尔逻辑运算符
————————————
1、逻辑“或” 2、逻辑“与” 3、逻辑“非”
2、逻辑“与”
————————————————
Chinese AND litera0,000 网络100,000,000) 用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B 其意义为检索记录中必须同时含有检索词A和B 的文献,才算命中文献。
4、记录级
检索词在数据库的同一记录中。
(C)—citation
表示两侧的检索词(或检索项)必须出现在同一记录中,词
序不限,中间词数量不限,其作用与布尔逻辑算符AND相同。

第2章--信息检索PPT课件

第2章--信息检索PPT课件

信息(information)
是物质存在的一种方式,一般指数据、消息中
所包 含的意义。
普遍性、差异性、特征性 可传递性、可存储性
医学文献信息的作用
记录、保存、传递医学信息 科研和临床实践借鉴、交流的重要载体 评价科研水平与成果的主要依据 推动促进科研发展的资源动力
第一节 信息检索基础
信息 存储 收集 选择 著录 加工 标引 加工 存储 标识
存储与检 索系统进 行匹配
检索 语言
信息 检索 分析 需求 检索 提高 提供 标识
输出
检索 标识
信息检索原理示意图
信息的检索过程
用户利用检索工具获取所需信息的过程。
用户在分析待检内容范围的基础上,将检索需求
转换成检索提问标识,利用相应的检索系统,查
文献检索特殊意义
一是确定有无类似的研究成果,是否要立项?
二是参考其他文献,理清思路,搞清楚要做的研
究是什么?
三是取长补短,推陈出新,设立新论题,取得新
成果。
文献检索在课程设计、毕业设计、开题立项、成
果查新方面都具有重要作用。
第一节 信息检索基础
二、信息检索原理
信息检索系统由文献的存储和检索两个部分组成。
LOGO
第二章 信息检索
掌握信息检索的概念;
掌握信息检索的原理; 了解信息检索的类型,以及信息检索类型的几种 划分方法; 掌握检索语言的种类,及检索语言的作用; 掌握信息检索的方法、途径与步骤。
第一节 信息检索基础 一、信息检索概念
二、信息检索原理 三、信息检索的类型 第二节 信息检索语言 一、检索语言的定义和作用 二、检索语言的种类 第三节 信息检索的方法、途径与步骤 一、信息检索方法 二、信息检索途径 三、信息检索步骤与策略 四、检索效果的评价
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1) 学术搜索引擎简介
• 学术搜索引擎是以学术资源为索引对象的网络学术文 献检索工具,是为增强学术隐蔽网络(Academic Invisible Web, AIW)的存取而出现的。其检索的资源 即涵盖互联网上的免费学术资源。 • 学术搜索引擎致力于提高检索结果的相关性和针对性。 • 学术搜索引擎的用途:可帮助读者获取学术文献信息, 了解有关研究领域的概况,同时具有学术评价作用, 可发挥引文索引的功能,提供友好的学术探讨环境。
7
C 综合搜索引擎的专门化——专门搜索引擎
•搜狗(Sogou)(人物、音乐、购物、图片、地itu);
21
14
(4) 事实、数据信息的网络检索
1)通过浏览来检索事实和数据
A 偶然发现式 B 顺链而行式 2)通过网络指南来查找事实和数据 3)利用搜索引擎进行信息或图片检索 Http://labs.systemone.at/retrievr 4)利用网络型工具书进行检索
15
2.2 学术搜索引擎与学术搜索数据库
8
D 元搜索引擎 •元搜索引擎(matesearch)又称集合型搜索引 擎,将多个单一搜索引擎集成在一起,提供统一 的检索界面,将用户的检索提问一次搜索多个搜 索引擎,并将结果返回给用户。 E 后搜索引擎 •所谓后搜索引擎,就是对众多流行搜索引擎的 搜索结果进行归纳整理。 •作为全球最大的中介搜索引擎Ixquick (https://),最先提出了一种 所谓“后”搜索引擎的概念。
17
(3) 数字图书搜索 • 谷歌图书搜索:
①开放内容联盟(Open Content Alliance, 简称OCA): ②古腾堡工程()
4
(3) 网络信息检索工具
1)搜索引擎 A 水平门户——综合搜பைடு நூலகம்.com); •Google中文搜索引擎(); •Bing(必应)中文搜索引擎(); •搜狗搜索(); •腾讯搜搜(); •中搜(); •…………
6
B 垂直搜索引擎 垂直搜索引擎即专业或专用搜索引擎,它专门用来检索某 一主题范围或某一类型信息,追求专业性与服务深度是它的 特点。 常用垂直搜索引擎有: •找字网 (/) •豆丁网 (/) • MACD搜索引擎 () • SkyScanner ()
19
(3) 文献信息的网上订阅
• RSS:是一种描述和同步网 页内容的XML格式。 • 需要下载和安装一个RSS 阅读器,然后从具有 RSS 标志的RSS源订阅感兴趣 的内容。
常见的RSS源(地址)标识
20
2.4 文献原文的获取
A.首选本地资源 •高校图书馆、信息中心、资料室是获取原文的首选。 B.通过图书馆的文献传递与馆际互借服务获得原 文 •拓展了文献资源共享的范围,提高了文献尤其是外 文原文的保障能力和馆藏利用率。 C.通过网上的开放获取资源查找原始文献
16
(2) 主要学术搜索引 c)万方的ilib搜索() d)深度搜() e)期刊界() f)Socolar()
课程内容
• 1.信息存储与检索概述
• 2.网络信息资源的检索与文献线索的应用
• 3. EV平台与EI的检索 • 4.引文索引及其检索 • 5.中文文献检索平台及其数据库的检索
• 6.中文电子图书数据库的检索
• 7.经典外文检索平台及数据库的检索 • 8.特种文献的检索 • 9.文献的使用与学术论文写作
10
2)网络资源目录 •网络资源目录是由人工采集网上信息,然后按照一定分类 标准(如学科类型、主题等),建立网站分类目录,并将筛 选后的信息分门别类地放入各类目中供用户浏览。 •网络资源目录主要有以下几种类型: ⑴ 搜索引擎目录(目录索引): 如:新浪目录(/); ⑵ 开放目录(ODP): 如宁波数字图书馆的学术信息资源开放目录 (); ⑶ 专题网址:搜索引擎的专题网址
13
5)Ex Libris中外核心期刊查询系统 •可提供Web of Science(包括SCIE、SSCI和 A&HCI)、Ei Compendex、中国科技期刊引证 报告、中文核心期刊要目总览、中文社会科学引 文索引(CSSCI)、中国科学引文数据库核心库 等6种数据库或评价体系中已收录期刊的在线浏 览、检索、期刊影响因子链接等功能。 •例:。
3
(2) 网络信息资源的特点
• 网络信息资源是信息的巨大宝库,具有大数量、多类 型、多媒体、非规范、跨时间、跨地域、跨行业、多 语种、使用成本低、共享程度高等特点。 • 但缺乏有效的统一管理机制,网络信息安全和信息质 量是不均衡的。 • 网络信息分布和构成缺乏结构和组织,也增大了信息 资源管理和利用的难度 • 它极大地促进了人类信息资源的共享,但也带来了一 些意想不到的问题,如文化冲突、信息侵略、信息威 慑等。
2.1 2.2 2.3 2.4
网络信息资源的检索 学术搜索引擎与学术搜索数据库 互联网时代的世界图书馆与信息服务 文献原文的获取
2.1 网络信息资源的检索
(1) 网络信息资源的类型
• 按信息内容的表现形式和内容划分,网络信息资源可分为: 1)全文型信息 2)事实型信息 3)数值型信息 4)数据库类信息 5)微内容 6)其它类型 • 按所采用的网络传输协议,网络信息资源可分为: 1)WWW网络资源 2)FTP信息资源 3)TELNET信息资源 4)用户服务组资源
18
2.3 互联网时代的世界图书馆与信息服务
• 世界图书馆:是指具有广泛收藏的图书馆,即包 含一切存在的信息、有用的信息、所有图书、 所有作品(不论格式)乃至所有潜在作品的图 书馆。 • Lib3.0:Lib3.0=Web3.0+P2P(对等网) ⑴ 资源的有效共享。 ⑵ 智能化的情报检索和分析。 ⑶ 多种终端平台的兼容使用。
9
F 计算型引擎Wolfram Alpha • 2009年5月18日,由美国计算机科学家史蒂 芬· 沃尔弗拉姆(Stephen Wolfram)开发的一种 新型互联网搜索引擎——Wolfram Alpha (/)上线。 •通过这种引擎,人们获得的将不再是网上已有 的现成信息,而是经服务器计算生成的新信息, 即能帮助用户实现基于其输入的关键词或问题的 统计学工作。
11
3)信息门户 •信息门户包括学科信息门户、行业信息门户、政府 信息门户、商业信息门户、公司信息门户。 •例:中国医药网() • 例:赶集网
12
4)搜索软件(工具)
•该搜索引擎结合了传统搜索引擎的优点,采用多线 程快速检索技术,能准确查找各类网站、网页信息, 从而提高了上网效率、节省了搜索时间、降低了上 网费用。
5
(b) 国外英文常用搜索引擎 •Google:以搜索精度高、速度快成为最受欢迎的搜索 引擎,是目前搜索界的领军者。 •Fast/AllTheWeb:总部位于挪威的搜索引擎后起之秀, 风头直逼Google。 •AltaVista:曾经的搜索引擎巨人,目前仍被认为是最好 的搜索引擎之一。 •Overture:最著名的搜索引擎广告商,竞价排名的始作 俑者,也是全文搜索引擎。 •HotBot:隶属于Lycos Networks,搜索结果来自其他搜 索引擎及目录索引。
相关文档
最新文档