第一章 信息检索基础知识

合集下载

001-信息检索__第一章

001-信息检索__第一章
1.1.3 网络环境下的信息变化
1.1.3.1 因特网对信息的影响 1. 特网引发了信息新的出版形式——网络出版,形成了 新型的网络信息资源 2. 因特网使人类传统的信息交流方式发生了根本性的变 化 3. 特网推动了信息处理技术发展
1.1.3.2 网络环境下信息的新特点 1. 信息类型多样化 2. 信息的数量和内容都得到了极大的丰富 3. 信息在分布上呈现出明显的分散性 4. 信息共享程度提高
11
第1章 信息检索基础
1.2.4 信息检索的历程
信息检索的发展与人们信息需求的增长以及现代信息技 术的进程紧密相关。追溯时间发展的脉络,信息检索的发展 经历了手工检索阶段和计算机检索阶段: 1.2.4.1 手工检索 直接发源于图书馆的参考咨询工作和文摘索引工作。主 要检索工具是纸本工具书。 1.2.4.2 计算机检索 随着计算机技术和网络技术的发展,计算机检索经历了 脱机检索、联机检索、光盘检索和网络检索四个阶段。在当 今网络环境下,计算机检索将发挥更大的作用,更好地满足 人们日益增长的文献信息需求。
8
第1章 信息检索基础
1.2 信息检索 的原理和概念
1.2.1 信息检索的概念
信息检索从广义的角度讲,包含 信息存储和信息获取两个过程。 信息存储指通过对大量无序信息 的选择和收集著录和标引等方法,建 成各种各样的信息检索工具或信息检 索系统,使之成为有序化信息集合的 过程。 信息获取是存储的逆过程,其实 质是根据特定的需求,运用已组织好 的检索系统,将特定的信息查找出来。
22
第1章 信息检索基础
1.5.1.2 漏检率(Omission Factor)和误检率(Noise Factor) 漏检率指漏检相关文献信息量与检索系统中相关文献信 息总量的比率,它与查全率相对应。具体公式如下: 漏检率=[漏检相关文献信息量/检索系统中相关文献信息 总量]×100%=(c/a+c)×100% 误检率指误检(检出不相关)文献信息总量与检出文献 信息总量的比率,是衡量信息检索系统误检程度的尺度,与 查准率相对应。 误检率=[误检文献信息量/检出文献信息总量]×100%= (b/a+b)×100%

第一章检索基础知识-2介绍

第一章检索基础知识-2介绍
1.And,逻辑与 ,如:car and industry ,检中结果中必须同时含 有 car 和 industry 才符合要求。 运算符为And、*、&表示;检索时,命中信息同时含有两个概念,专指 性强.可以缩小检索范围,提高查准率。.( “SAME”,规定其前后连 接的两个词在检索记录中出现在同一句中,或同一个词组中 (keyword字段); 2.Or ,逻辑或, 如:college or university ,检中结果中 含有 college 或 university 任一个就符合检索要求. 运算符为 Or 、或“+”表示。检索时,命中信息包含所有关于逻辑A 或逻辑B或同时有A和B的,可以扩大检索范围,提高查全率。
3.文摘型(文摘有与正文等量的信息)
报道对象与题录相同,但对文献内容揭示的程度较题录更深入更具体, 增加了文献的摘要。文摘按其内容特征可分:指示性文摘,报道性文 摘,指示—报道性文摘。 示例: 【题 名】论政府招标采购图书的质量控制 【作 者】饶宗政;王刚; 骆瑛; 余敏; 【机 构】成都电子机械高等专科学校 【刊 名】大学图书馆学报.2012, (1).51- 54 【ISSN号】1002-1027 【C N 号】11-2952/G2 【关键词】政府招标;采购图书;质量控制; 【文 摘】政府招标采购图书的质量控制,一直是图书馆界关心的焦点 问题。在实践中,图书馆要认真拟定招标文件,把政府招标、签订合 同、图书采购、加工和验收等各个环节的质量控制指标都写进招标文 件中,使之成为合同双方共同遵守的法律文件,以此实现对政府招标 采购图书的有效质量控制。
三、分段法 又称循环法,交替法,综合法,即利用检索工具法 和追溯法交替使用的一种方法. 四、浏览法 指直接在一次文献中查找所需的文献,也称直接检索 法. 该方法带有盲目性,一般只作为对上述各种检索方 法的补充,主要用于查找新近发表的文献。 数据库一般都设置有“分类浏览导航”查询途径。

第一章信息检索理论基础课件

第一章信息检索理论基础课件

第一章 信息检索理论基础
主要知识点
(一)信息检索原理 (二)信息检索技术 (三)信息检索系统 (四)信息检索语言 (五)信息检索方法 (六)信息检索评价 (七)信息检索与数字图书馆
信息检索技术—信息检索常用技术
(1)布尔检索技术:它是利用布尔逻辑算符进行检索词 或代码的逻辑组配,是现代信息检索中最常使用的一种方法 。
信息存储(标引)过程

原始
信息特

信息特

文献
征提取

征标识
检索系统

信息
检索提

检索提

需求
问表达

问标识
标识匹配


信息检索过程
信息检索原理—信息检索及其发展
(1)信息检索(Information Retrieval)是“一种时间性的 通讯形式”,“在时间上从一个时刻通往一个较晚的时刻, 而在空间上可能还在同一地点” 。这一看法,揭示了信息 存储与获取两个环节是一种延时性的通讯形式。
(3)向量空间检索模型:向量检索是以向量的方式确定检 索内容的方法,系统中的每一篇文献和每个提问均用等长的向 量表示。如:文献集合中的第i篇文献用Di = ( T1, T2, T3, …, Tm ) 表示,其中T1, T2, T3, …, Tm为系统中所有标引词集合;提问集 合中的第j个提问用Qj = ( T1, T2, T3, …, Tm )表示;Tk表示文献向 量或提问向量中的第k个分量,即文献表示或提问式中所含的第 k个标引词或检索词。
按照狭义的理解,信息 是 信用 息来是消物除质不存定在性的的一东 西 种。 方按式照、广形义态的或理运解动, 又 状有 态两,种也认是识事:物从的本一体 意 种义 普上遍说属,性信,息一泛般指指一 切 数事 据物、运消动息的中状所态包和含运 动 的的 意方义式,。可从以认使识消论息的 意 中所义描上说述,事件信的息不是定关于 事 性物 减运少动。状态和运动方 式的反映。

信息检索课件 第1章 文献基础知识

信息检索课件 第1章 文献基础知识
第一章 文献基础知识
文献信息组织 ——Ⅱ. 基于内容特征
④ 国际专利分类法 (International Patent Classification, IPC )
国际专利分类法是国际上通用的专利文献分类法,通常缩写为IPC号,包括了 与发明创造有关全部技术领域。
包括:部、大类、小类、大组或小组。 部-SECTION(8个) 类号:用大写英文字母A-H表示 类名:概括指出该部范围的内容
版权页
目次页 第一章 文献基础知识
正文页
期 刊 : 实 体 文 献
第一章 文献基础知识
数据库:Science Online
期 刊 : 描 述 数 据
第一章 文献基础知识
Tips:DOI(数字对象标识符)
DOI I. 数字对象标识符 (DOI®) 是一种用于永久标识和交换数字环境中
知识产权的系统。 II. 输入唯一的 DOI 代码可快速查找特定记录
文献信息组织
请思考 如何实现文献有序化?
第一章 文献基础知识
文献信息组织 ——Ⅰ. 基于外部特征
外部特征是文献上标明的、显而易见的特征。一般包括题目、作者、作者单 位、代码(ISBN号、ISSN号、专利号、标准号、DOI)、出版社等。












第一章 文献基础知识
封面
期 刊 : 实 体 文 献
类号:小类类号+“1-3位数字”+“/”+“00”
类名:在小类范围内限定对检索有用的技术主题范围
例如:A41D 3/00 外套 ○ 小组-SUBGROUP
类号:小类类号+“1-3位数字”+“/”+非“00”的两位数字

第1章信息检索基础知识汇总

第1章信息检索基础知识汇总

网络信息检索方法 数据库资源检索方法 其他资源的检索方法 印刷型资源的检索方法
4、开设信息检索课的意义
借鉴前人成果,避免重复劳动 节省查找时间,提高科研效率 更新知识结构,提高获取知识能力 提高人们的生活质量
第一章 文献信息检索基础
第一节 信息、信息源、文献信息源 第二节 文献信息检索 第三节 文献信息检索语言与检索途径 第四节 文献信息检索的方法与步骤 第五节 文献信息服务系统
3 教材说明: 现代信息检索与利用/张秀红,郑益光主编.—
—北京:高等教育出版社,2010
教学参考书(G252.7/G354.4)
1.许征尼.信息素养与信息检索[M].合肥:中国科学技术大学 出版社 ,2010.01
2.潘燕桃. 信息检索通用教程[M]. 北京:高等教育出版社, 2009. 3.郭玉强,付先华,周和玉. 现代信息检索与利用[M]. 武汉:武
2008. 8.周元兴 .Google入门与实例教程[M].北京:电子工业出版社,
2007.
绪论
信息素质与信息素质教育
1、信息素质
• 信息素质:又称为信息素养,主要包括文化素养(知 识层面)、信息意识(意识层面)和信息技能(技术层 面)3个方面。 -----保罗.泽考斯基,1974年
最有影响的阐述:
• 一个具有信息素质的人,能够认识到精确和完 整的信息是作出合理决策的基础,能够确定对 信息的需求,形成基于信息需求的问题,确定 潜在的信息源,制定成功的检索方式,从包括 基于计算机的和其他的信息源获取信息、评价 信息,组织信息用于实际的应用,将新信息与 原有的知识体系进行配合,以及在批判性思考 和问题解决的过程中使用信息。
2020/3/5

第一章 检索基础知识

第一章  检索基础知识

文摘、引文数据库
中国科学引文索引(CSCD) 中国社会科学引文索引(CSSCI) 全国报刊索引 INSPEC数据库 欧美硕博论文数据库(PQDD 英文) OCLC
MathSciNet数据统(专利数据库) 读秀(通过读者自己文献传递) CNKI的中国专利全文数据库 网上的专利一般都是免费
零 次 文 献
指未经公开发表或未交流于社会的文献; 论文草稿、谈话记录、实验记录、书信……
1.3数字信息资源
1.3.1数字信息资源的概念 狭义地讲,可称电子资源,指一切以数字形式生产和 发行的信息资源。所谓数字形式,是以能被计算机识别 的,不同序列的“0”和“1”构成的形式。 数字资源中的信息,包括文字,图片,声音,动态图像 等,都是以数字代码方式存储在磁带,磁盘,光盘等介质 上,通过计算机输出设备和网络传送出去最终显示在用户 的计算机终端上。
化学专业 Wiley 数据库 ACS数据库 美国化学会志 数学专业 SIAM数据库 Global Science Press7种数学刊 Mathematical Reviews 物理专业 英国皇家物理学会IOP数据库 美国物理期刊(AIP\APS)
法学专业
westlaw international法律在线数据库 法律网站 LexisNexis学术大全 HeinOnline法律数据库 计算机专业 IEEE Computer Society数据库 ACM(2008年停订) 机械 ASME美国机械工程师学会全文数据库
(nN)表示两词间可插入0-n个词,词序可变。 如检索式:environment (2N) protection 检出结果包括: “environment protection” “environment of the protection ” “environment of water protection”等

信息检索第一章

信息检索第一章

会议文献的特征:(a)一般带有会议特征的词,如 Conference(会议)、Congress(大会、集会);(b)有主 办会议的机构特征,如Society(团体)、Association (协 会);(c)有会议文献类型的特征,如会前出版的Paper (论文),会后出版的Proceedings(会议录)等等。根据 这些特征,可以判定上述文献来源于会议文献。 • 如: Range-free localization using dynamic hop size computation in wireless sensor networks Tay, Jeffrey H.S. (Department of Computer Science, National University of Singapore); Chandrasekhar, Vijay R.; Seah, Winston K.G. Source: 2006 IEEE International Conference on Industrial Informatics, INDIN'06, 2006 IEEE International Conference on Industrial Informatics, INDIN'06, 2007, p 126-131
二、信息检索的作用
• 1.有利于减少课题的重复研究、提高科 研成功率 • 2.有助于节约时间、提高科研效率 • 3. 是科学决策的必要前提。 • 4.有利于培养复合性、开拓性人才
• • • •
1. 科研中--为科研开路 2 .生产中--新产品开发的向导 3 . 技术贸易中--引进技术的参谋 4 .针对大学生,还要学会利用文献跟踪学 术动态、寻找科研课题、撰写毕业论文、 科技论文,申请专利。

信息检索(第一章 )

信息检索(第一章 )

献总量的比率,它反映该系统文献库中实有的相关文献量
在多大程度上被检索出来。
检出相关文献量
查全率 =
×100%
文献库内相关文献总量
查准率指的是检出的相关文献量与检出文献总量的比率,
是衡量信息检索系统检出文献准确度的尺度。
检出的相关文献篇数
查准率 =
×100%
检出的全部文献篇数
3、提高信息检索效果的途径
1、逻辑“或”
—————————————————
A
B
用符号“or”或“+”表示,其逻辑表达式为: A or B 或 A+B
其意义为检索记录中凡含有检索词A或检索词B, 或同时含有检索词A和B的,均为命中文献。
2、逻辑“与”
————————————————
AB
用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B
3、代码语言
是用某种符号代码系统来标引信息特征、排列组织 和检索信息的语言。
第三节 检索技术
一、概念检索 二、布尔逻辑运算符组配检索 三、截词检索 四、字段限制检索 五、位置运算符 六、检索策略与效果
一、概念检索
检索标识是具体的检索词或词组, 每个检索词表达一个概念,具体检索 时,将检索词与数据库中的文献特征 标识进行类比,两者相同,则该记录 为命中文献。
截词检索在不同的计算机检索系统中规 定不同,请使用时注意。
四、字段限制检索
为了缩小检索范围,可利用字段代码来限制 检索词出现的字段,以提高检索速度和命中率。
如:rice in ti(表示只在题目字段中查找文献) rice in ab(只在文摘中查找) AU= Smith,J.C (查作者为Smith,J.C 的 文章) PY = 1998(只查1998年的文章) LA =Chinese (只查语种为中文的文献)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档