第一章 绪论(信息检索,符绍宏)
文献检索01--课程-课件

手工检索工具的类型
• 边缘性工具书:包括资料汇编、史书和 方志等
工具书结构和排检法 • 工具书的结构 一般由使用说明、目
次表、正文、索引和附录等几部分组成。
• 工具书的排检法 包括字顺法、类序 法、自然顺序法和字母法等。
• 计算机检索概述 ——历史和现状
– 视听资料:以磁性材料或感光材料为存储介质,通 过特殊的机械装置记录声音信息或图像信息而产生。 如:磁带、录像带、激光视盘等。
– 电子型:以磁性材料为存储介质,以键盘输入或光 学字符识别输入为记录手段,通过计算机处理产生。 如:磁盘、光盘等。
出版形式
• 图书——知识系统、全面、可靠 • 期刊——内容新颖、情报信息量大 • 科技报告 • 会议文献 • 政府出版物 • 专利文献 • 标准文献 • 学位论文 • 产品资料 • 技术档案
文献获取难易程度
• 白色文献:信息完全已知(已公开)、 较易获得的文献。
黑色文献:信息完全未知(未公开)、 极难获取的文献。
灰色文献:信息内容部分已知(公开)、 部分未知(未公开)的文献。
信息检索的原理、作用
• (1)原理:检索者将检索提问标识与存储在 检索工具或检索系统中的文献特征标识进行比 较,相一致的则从检索工具或检索系统中输出。
加工层次
• 一次文献即原始文献: 指基于作者本人的工作和科研成 果而创作的原始论文。 例:期刊论文、专利文献、科技报告、会议文献、 学会论文、专题著述等。
• 二次文献是对大量无序的一次文献的收集、加工、整理 而成的报道性、检索性的文献资料。 例:题录、书目、索引、文摘等。
• 三次文献是利用二次文献,并在其指导下对大量一次文 献进行综合分析研究,加以浓缩和提炼而写成的文献。 (参考文献的作用) 例:年鉴、进展、述评、综述、手册、指南等。
文献检索复习资料

文献检索复习要点—Jinying第一章绪论信息、知识、情报及三者关系;文献,文献按载体划分,文献按出版形式划分,文献级次(各级次的概念、代表文献及异同);ISBN和ISSN(概念、组成及检验方法)信息含义:是客观事物本质特征千差万别的反映。
是物质存在方式、形态或运动状态的反映。
(P3-P4)知识的概念:是人类通过信息对自然界,人类社会及思维方式与运动规律的认识与概括,是人的大脑通过思维重新组合和系统化了的信息,是信息中最有价值的部分。
情报的定义:为了解决一个特定问题从一定文献资料中提取或经过传递获得的知识。
情报的三个基本属性:知识性传递性针对性信息,知识,情报之间的关系从信息,知识和情报的定义可以看出,信息无处不在,信息的范围很大,信息中被人们认识的部分成为知识,而知识中被人们用来解决问题的部分成为情报,因此信息,知识和情报的关系是前者包含后者的关系。
ISBN:(P8) 概念:即国际标准书号,它是由10位数字组成,共分4段,其间用“—”相连,组成:1组号2出版社号3书序号4校验码算法:用1分别乘ISBN前12位中的奇数位,用3乘以偶数位,所得结果之和除以10可得,值的范围为0—9文献的含义:记录有知识的一切载体,包含知识内容、信息符号、载体材料、记录方式四个基本要素(P5)文献按载体划分:1印刷型2缩微型3视听型4电子型(P5-P6)文献按出版形式划分:1.图书2.连续出版物(期刊、报纸)3.会议文献4.学位论文5.科技报告6.专利文献7.标准文献8.政府出版物9.产品样本10.技术档案(P7-P11)文献级次:人类开发、利用文献的先后顺序。
(P6-P7)1零次文献:非正式出版物或非正式渠道的最原始的文献。
如日记、手稿、个人通信、口头言论2.一次文献:依据作者本人的研究或研制成果创作的文献。
如图书、期刊论文、会议论文3二次文献:按一定的方法对一次文献进行整理加工,使之有序化而形成的文献。
如目录、索引、文摘4三次文献:围绕某个专题或出于特定目的,根据二次文献提供的线索,选用大量一次文献的内容,进过筛选分析综合和浓缩等深度加工而形成的文献。
信息检索序

Electronic products Information Retrieval
教学大纲
扬州职大电子工程系 贾湛
一、教学目的
本课程是根据国家教育部的文件精神开设的高等 学校公共基础课,是一门培养学生情报意识、获取文 献信息能力的课程,也是不断提高自学能力和科研能 力的一门科学方法课。 1、最少的时间与精力来获取自己所要的信息。 2、看懂各种文献内容,了解各种文件格式。 3、判断信息的可靠性和使用价值。 4、整理加工所获信息,写论文,搞科研。
三、教学要求和考核方法
遵守课堂纪律,认真听讲。做必要的笔记。 (30%。(70%)
多问问题,积极讨论,多提改进意见。(加分)
最后成绩:优(90以上)良(80~90) 中(70~80)及格(60~70)不及格(60以下)
课件说明
本套课件是2009年开始制作的,当时就参考 了网上大量课件,制作时尽可能综合了这些课的优 点,并把自己的教学实践结合进去,力求内容准确 完整,前后知识点紧凑,系统性好。由于该课程随 时代变化很大,网上许多数据库不仅外观常变,而 且内部结构也有变化,于是几乎每年课件要修改。 至今六年来不停地修改,虽然具体的内容还会有很 大的变化,但核心内容基本定形。这也许可供网友 有一些有价值的参考件的所有资 料。
课件制作参考来源
北京交通大学出版社《信息检索》 系列课件 安徽工业大学《信息检索》教研组 系列课件 袁林 电子科技大学《信息检索》系列课件 青岛科技大学图书馆 科技信息检索 苏 健 标准文献检索方法 李明娟 江苏大学图书馆 标准文献及其检索 张胜光 网络信息检索 孙旭 知识产权出版社 专利信息分析与利用 还有许多课件制作时忘了记下编者,还有的找不 到编者的具体信息。
第一章信息检索理论基础课件

第一章 信息检索理论基础
主要知识点
(一)信息检索原理 (二)信息检索技术 (三)信息检索系统 (四)信息检索语言 (五)信息检索方法 (六)信息检索评价 (七)信息检索与数字图书馆
信息检索技术—信息检索常用技术
(1)布尔检索技术:它是利用布尔逻辑算符进行检索词 或代码的逻辑组配,是现代信息检索中最常使用的一种方法 。
信息存储(标引)过程
检
原始
信息特
索
信息特
检
文献
征提取
标
征标识
检索系统
索
信息
检索提
识
检索提
结
需求
问表达
系
问标识
标识匹配
果
统
信息检索过程
信息检索原理—信息检索及其发展
(1)信息检索(Information Retrieval)是“一种时间性的 通讯形式”,“在时间上从一个时刻通往一个较晚的时刻, 而在空间上可能还在同一地点” 。这一看法,揭示了信息 存储与获取两个环节是一种延时性的通讯形式。
(3)向量空间检索模型:向量检索是以向量的方式确定检 索内容的方法,系统中的每一篇文献和每个提问均用等长的向 量表示。如:文献集合中的第i篇文献用Di = ( T1, T2, T3, …, Tm ) 表示,其中T1, T2, T3, …, Tm为系统中所有标引词集合;提问集 合中的第j个提问用Qj = ( T1, T2, T3, …, Tm )表示;Tk表示文献向 量或提问向量中的第k个分量,即文献表示或提问式中所含的第 k个标引词或检索词。
按照狭义的理解,信息 是 信用 息来是消物除质不存定在性的的一东 西 种。 方按式照、广形义态的或理运解动, 又 状有 态两,种也认是识事:物从的本一体 意 种义 普上遍说属,性信,息一泛般指指一 切 数事 据物、运消动息的中状所态包和含运 动 的的 意方义式,。可从以认使识消论息的 意 中所义描上说述,事件信的息不是定关于 事 性物 减运少动。状态和运动方 式的反映。
信息检索 ppt 第1章 绪论

信息需求集合
当人们为完成某一任务时,经常觉得缺少的某些知识,即信 息需求。
匹配与选择
需要一种匹配机制。 匹配机制的主要功能:能够把信息需求集合与信息资源集合 依据某种相似性标准进行比较与判断,选择出符合用户需要 的信息。
第 1章 概
1.1 1.2 1.3 1.4 1.5 1.6
述Hale Waihona Puke 信息、知识、文献 信息的特征及类型 信息检索概念和原理 信息检索类型 信息检索的主要研究问题 信息检索的发展历史
信息检索类型
按检索内容不同
文献检索
以文摘、题录、全文 为检索对象。
数据检索
以数据为检索对象
事实检索
以事实、概念、思想、 知识等非数值信息为 检索对象
文献检索
以文献(包括文摘、题录或全文)为检索对象的 一类信息查询活动。是一种相关性检索,不直接回答 用户所提的问题本身,只是提供有关的文献供参考。 典型的文献检索
二次文献
(书目文献、索引、文摘)
是以一次文献为依据加工整理而形成的信息,是对一次信息的浓缩 或有序化产物。如:目录、文摘、索引等。 特点:为查找一次文献提供线索,具有系统性、工具性特点。
三次文献
对零次文献、一次文献、二次文献进行分析研究,加工提炼和概括 综合而形成的信息。如:综述、述评、进展报告、学科年度总结等。 特点:信息量大、综合性强、系统性好。
查找某出版社2008年出版图书的信息; 查找某公司在全球哪些地区设立了分公司、分公司地址、员工 数、主要负责人等。
数据检索
是指查找用户所需特定数据的检索。可以利用专门的数据 库进行检索。例如: 我国第五次人口普查中全国汉民族的人数。
狭义的信息检索仅指信息的查找,是指从信息集
信息检索知识点

信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进展相符性比较,但凡信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,那么具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体.检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进展标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进展标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进展比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法〔1〕顺查法〔2〕倒查法〔3〕抽查法〔4〕追溯法〔5〕循环法5.信息检索的途径〔1〕部特征途径a)分类途径b)主题途径〔2〕外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:〔1〕简单,形式简洁,易于理解;〔2〕可操作性强,应用广泛;〔3〕构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常准确的语义概念;〔4〕能处理构造化提问。
缺点:〔1〕表达用户复杂需求效果欠佳〔2〕准确匹配无法提供定量比较〔3〕匹配标准不尽合理〔4〕检索结果不易控制7.概率排序原那么:如果一个检索系统对用户的每个检索提问的反响是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
8.什么是计算机信息检索.所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那局部信息的过程。
信息检索黄如花笔记(重点)

视频信息检索
超文本及超媒体检索技术 超文本检索:就是把有关信息或资源通过超链接联系起来,检索时可以借助超链 接实现相关信息的阅读。 (不是一种检索技术,而是信息的组织方法与手段。它是一种信息管理技 术,或者说是一种电子文献形式,其特点之一是一反传统文本对信息的线性 与顺序记录方式,而是模仿人类联想式记忆思维,将相互关联的信息以网 状的结构加以存储和记录。)
信息检索语言 信息检索语言是人们加工、存储和检索信息时用来描述信息内容和信息需求的词汇
或符号及其使用规律构成的供标引和检索的工具。
信息检索的历史 手工检索 特点:操作简单,费用低廉、查准率高;但是效率低、查全率不能保证。
机械信息检索
特点:没有发展信息检索语言,只是采用单一方法对固定的存放形式进行检索的 工具,而且过分依赖设备,检索复杂、成本高、检索效率和质量不理想。
根据检索对象的角度(新的三分法) 文本检索
数值检索 音频与视频检索
信息检索的基本原理 通过对大量的、分散无序的文献信息进行收集、加工、组织、存储,建立各种各样 的检索系统,并通过一定方式和手段,是存储与检索这两个过程所采用的的特征标 识达到一致,以便有效地获得和利用信息源。其中,存储是检索的基础,检索是存 储的手段。 要完成匹配与选择要做好三个方面的工作 文献替代:将标识文献资源特征的元数据替代它所指代的资源,文献替代过程实 际上是对文献资源的外部特征和内特征进行描述的过程,这项工作也被称作著 录,著录的结果就是将原始文献制作成它的替代文献——二次文献。 文献整序:就是对替代文献进行标引,给出文献标识(如分类号,主题词等), 并对所有替代文献按其标识进行有规律的组织排序,形成可检索的信息信息资源 集合。 文献特征标识与检索提问标识的匹配:检索者在查找所需文献时,只要以该系统 所用的标识作为提问标识,与系统中的文献特征标识进行比较,并将文献特征标 识与提问标识一致的文献线索从系统中检出,检出的部分就是检索的结果。
信息检索(符绍宏)t

1.2.2 信息资源的分类
按照不同的标准可以将信息资源划分为不同的种类, 常见的划分标准及其类型有: • 按信息资源所依附的载体划分:体载信息资源、实物 信息资源、文献信息资源、电子信息资源四种类型
• 按信息资源传递的范围划分:公开信息资源、半公开 信息资源和非公开信息资源三种
• 按信息资源的加工程度划分:一次信息资源、二次信 息资源和三次信息资源
• • • • • •
信息检索技术的发展
目前信息检索技术正向两个方面发展,一是深度揭示 和组织信息;二是适应信息资源的多载体、网络化和 分布化特点,在广度上提高组织和检索信息的能力。 本单元主要介绍新的检索技术特点及原理: 全文检索技术的发展 :超文本信息检索、概念信息检 索 基于内容的多媒体检索技术的发展 自动标引:自动抽词标引、自动赋词标引;实现自动 标引的方法:词频统计标引法、概率标引法、句法分 析标引法、语义分析标引法、人工智能标引法 自动分类:自动聚类和自动归类
1.1.2 信息检索类型
• 根据不同的标准,信息检索可以划分为不同的类型。 按检索对象的内容区分:文献检索、数据检索及事实 检索。 按检索方式区分:手工信息检索(手检)和机器信息检 索(机检)两类。 按检索要求区分:强相关检索、弱相关检索 按检索的时间跨度区分:定题检索、回溯检索 按检索对象的形式区分:文本检索、多媒体检索 按检索对象的信息组织方式区分:全文检索、超文本 检索、超媒体检索 按检索途径的特点区分:常用法、回溯法、循环法
3.1.2 检索途径及其选择
文献信息的检索,必须依赖于检索前已经掌握的线索, 以及现有检索工具或系统的情况,有针对性地选择合 适的检索途径。通常可依据文献的特征,将信息检索 途径分为内容特征检索途径和外部特征检索途径。 本 单元主要介绍各种检索途径及其选择: • 内容特征检索途径:分类途径、主题途径和分类主题 途径三种 • 外部特征检索途径 :责任者途径 、题名途径、序号途 径、引文途径 等
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.1 .1 信息检索概念
• 信息检索(Information Retrieval)就是信息用户为处 理解决各种问题而查找、识别、获取相关的事实、数 据、知识的活动及过程。 • 随着信息检索理论的不断发展,人们对信息检索的认 识不断深入。国内外有关专家从不同的角度解释信息 检索,主要代表性观点有: –从时间性通讯的角度认识信息检索 –从信息处理的角度认识信息检索 –从信息检索过程的角度认识信息检索 –全息检索 –概念信息检索
1.1.2 信息检索类型
• • • • • •
• 根据不同的标准,信息检索可以划分为不同的类型。 按检索对象的内容区分:文献检索、数据检索及事实检索。 按检索方式区分:手工信息检索(手检)和机器信息检索 (机检)两类。 按检索要求区分:强相关检索、弱相关检索 按检索的时间跨度区分:定题检索、回溯检索 按检索对象的形式区分:文本检索、多媒体检索 按检索对象的信息组织方式区分:全文检索、超文本检索、 超媒体检索 按检索途径的特点区分:常用法、回溯法、循环法
第一章: 绪论
本章作为导论,主要对信息检索及其相关概念进行了简要 介绍,目的是使读者对信息、信息资源、信息需求、信息 检索等内容有初步了解,本章的重点内容有: • 信息检索 • 信息资源
• 信息检索需求
第一节: 信息检索
本节主要介绍信息检索的定义及概念渊源,并根据不 同的标准对信息检索的类型进行划分。本节知识点包 括:
1.1 .1 信息检索念(续)
• 上述观点是从理论角度对信息检索进行定义,但根据实际 检索工作的经验,信息检索有广义和狭义之分:
– 广义信息检索:信息检索是指将信息按一定的方式组织和存贮起 来,并根据用户的需要找出相关信息的过程。其中包括信息存储 与信息查找两部分。 – 狭义信息检索:即信息查找的过程