第一二章 信息资源基础知识 - 信息检索

合集下载

第一章信息检索基础知识

第一章信息检索基础知识

1)逻辑“与”:它用于两个或两个以上概念之间的相交 关系或限定关系运算,表示检索结果必须满足两个或两 个以上条件的单元集合。例如,查找“计算机控制啤洒 生产过程”课题的相关信息。则检索的文献记录中必须 同时含有 计算机、控制 、啤洒,才算命中,其检索式 为:计算机 与 控制 与 啤洒。或 计算机*控制*啤洒。
2)逻辑“或”:它用于两个或两个以上概念之间的并列 关系运算,表示检索结果必须满足两个以上条件之一的 单元集合。例如,查找国外有关电视机的资料,则检索 式为television+TV(television OR TV),检得的文献记录 中只要有television或TV、或者二者兼有均符合检索条件。
二.按信息的加工深度和结构等级
(1)零次文献:是指未经过任何加工的原始文献, 如实验记录、手稿等,零次文献是原始文献的保 存、原始数据的核对、原始构思的核定等方面有 着重要的作用。 (2)一次文献:是指作者以本人的研究成果为基 本素材而创作或撰写的文献如图书、期刊论文、 科技报告等。一次文献的论述一般都比较具体详 尽和系统。具有独创性 , 具有较高的理论和应用 价值。
一个记录
பைடு நூலகம்
3)文档
文档:由某一类型的若干条记录组成的信息集合称 之文档。它是数据库的基本形式,包括顺排文档 和倒排文档。 (1)顺排文档:指文档中的记录按序存放。记录 的存取按时间顺序进行。 (2)倒排文档:是将每篇文献记录中的标识抽取 出来 ,同时记录下该检索标识出现过的文献记 录号,再按先后顺序组织起来成为可以用作索引 的文档。
直接检索:指直接从信息源和文献载体中获取信息, 它是信息用户常用的检索方法,用这种方法检索时可以 明确判断检索到的信息是否符合需要,但很难广、快、 精、准地查到所需的全部信息。 间接检索:它把信息资料加上多种检索标志,并按 照这些标志把信息有效的组织起来,在检索时利用这些 标记可以查到所需信息的线索或信息本身。所以我们学 习信息检索的方法和技巧,主要指间接检索方法,掌握 使用检索工具和检索系统的技巧以提高检索的效率。

信息检索的基本知识

信息检索的基本知识

⑵信息检索系统的类型 〔续〕
④索引型检索系统: 索引是根据一定的需要,把特定范围内的
某些重要文献中的有关款目或知识单元,书 名、刊名、人名、地名、语词等,按照一 定的方法编排,并指明出处,为读者提供 文献线索的一种检索系统。
索引不仅广泛存在于各种书刊等文献 中,而且更多见于作为辅助检索系统而附 在不同类型的检索工具之后,为检索工具 提供了更多的检索途径。
信息的存储过程就是按照主题词表或 分类表及使用原那么对原始信息资源
一、信息检索原理〔续〕
2、信息检索系统〔续〕
一、信息检索原理〔续〕
⑵信息检索系统的类型
按信息处理手段划分有 ①手工检索系统。又称传统检索系统 是使用人工来查找信息的检索系统。 其主要类型有各种书本式的目录、题 录、文摘和各种参考工具书等。优点: 方便、灵活、 断准确。缺点:检索速 度太慢
2、信息检索系统〔续〕
按著录和标引方式划分 ④文摘型检索系统是以简练的文字将文献
资料的主要内容准确、扼要地摘录下来, 并按照一定的著录规那么和编排方式系统 地组织起来的检索 工具。 主要包括:报道性文摘
指示性文摘 如:美国的?化学文摘?英国的?科学文摘〉
中国的〈中国数学文摘〉〈海洋文摘〉
2、信息检索系统〔续〕
按著录和标引方式划分
⑤全文型检索系统 全文检索是指在文献资料的标题、目录、作
者、内容中检索 指定的字符串。 全文检索系统是指将文章 中所有的文字处理序列 都作为检索对象进行索引,并根据需要找出包含 有欲检索词的文献的系统。
作用:它能提供快捷的数据管理工具和数据 查询手段,帮助人们进行了大量文献数据的整理 和管理工作,使人们能够快速、方便地查到想要 的任何信息。
第二章 信息检索的根本知识

信息检索知识点

信息检索知识点

信息检索知识点信息检索是指从大规模的信息资源中,通过利用各种信息检索工具和技术,准确和高效地找到用户所需要的信息的过程。

信息检索技术在现代社会中扮演着重要的角色,它不仅广泛应用于互联网搜索引擎,还在图书馆、数据库、企业信息管理等领域发挥着重要作用。

本文将介绍信息检索的定义、关键概念和一些常用技术。

一、信息检索的定义和目标信息检索是指通过计算机等工具从大规模的信息资源中,按照用户的需求进行检索,提供相关性高、准确性好的信息结果。

它的目标是帮助用户快速地找到所需的信息,提升信息搜索效率和准确性。

二、关键概念1. 查询:用户提交的检索请求,通常由一系列关键词组成。

2. 检索词:查询中使用的关键字或关键词短语。

3. 检索结果:根据查询返回的与之相关的文档或信息。

4. 相关性:衡量检索结果与查询之间相关程度的指标,通常使用相关性排序算法进行排序。

5. 文档:信息资源的基本单位,可以是网页、文章、图片、音频等形式。

三、信息检索的主要技术1. 分词技术:将文本数据按照一定规则分割成有意义的词语,是信息检索的基础步骤。

2. 索引技术:将文档中的关键词与其所在位置进行索引,以提高检索效率和准确性。

3. 倒排索引:根据关键词构建索引表,记录关键词与文档之间的对应关系,常用于搜索引擎等场景。

4. 相似度计算:根据查询和文档的相似性,为检索结果进行排序。

5. 结果评估:通过评估检索结果的质量,改进检索算法和模型。

四、常用的信息检索模型1. 布尔模型:将查询和文档转化为布尔表达式,按照布尔运算进行检索。

2. 向量空间模型:用向量表示文档和查询,通过计算向量之间的相似度进行检索。

3. 概率检索模型:基于统计方法,利用概率模型进行信息检索。

五、信息检索的挑战和发展方向1. 大规模数据处理和存储:随着互联网的快速发展,信息资源呈指数级增长,如何高效地处理和存储大规模的数据成为了一个挑战。

2. 多语言检索:不同语言的信息检索在跨语言信息检索中面临很大的难度和挑战。

信息检索基础知识

信息检索基础知识

TP 自动化技术、计算技术
3 计算技术、计算机
31
计算机软件
316
操作系统
.1
分时操作系统
.2
实时操作系统
.7
Windows操作系统
39
计算机的应用
… F25 物资经济 F250 物资经济理论 F252 物资流通
… F5 交通运输经济 F50 交通运输经济理论
… F53 铁路运输经济 F54 陆路、公路运输经济
匹配有其匹配标准,这里涉及到两者一致性、 相关度等问题,按一定的标准筛选出符合要求的 信息。
精选ppt
3
信息检索一般过程
信息源
信息分析、 著录、标引
信息的表示
用户
检索语言
用户需求分析
数据库 匹配过程
输出检索结果 精选ppt
检索表达式
4
信息检索的过程往往需要一个评价反馈途径,多次比较匹配, 以获得最终的检索结果。其图示如下:
9
责任者 及其单位
中图分类号 文献标示码
关键词
正文
精选ppt
题名 摘要
10
分类语言
也属于主题语言。分类语言是按学科范畴划分而构成的一 种语言体系,它集中反映学科的系统性、反映它们的相关、 从属、派生等关系,从总体到局部分层、分面展开,形成 分类体系。由类目号码及名称作为检索语言,构成分类类 目表,如前述图书分类表、专利分类表用的都是分类语言 。
13
……
主题语言
包括:关键词语言、单元词语言、标题词语言、叙词语言等,它们有不同 的主题词表。主题词表达概念本身,在主题词表中通过参照系统来指示词 汇之间的关系。如”交通运输”、“国际物流”。主题语言分为规范主题语

信息检索知识点

信息检索知识点

信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找;2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息;3.为什么说信息存储和检索是两个不可分割的有机体检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的;存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较;检索过程是存储过程的逆过程;因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来;4.信息检索的方法1顺查法2倒查法3抽查法4追溯法5循环法5.信息检索的途径1内部特征途径a)分类途径b)主题途径2外部特征途径a)题名途径b)着者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:1简单,形式简洁,易于理解;2 可操作性强,应用广泛;3 构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;4 能处理结构化提问;缺点:1表达用户复杂需求效果欠佳2准确匹配无法提供定量比较3匹配标准不尽合理4检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的;8.什么是计算机信息检索所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程;实质上计算机信息系检索是利用计算机信息检索系统存储和查找信息的技术,是计算机硬件资源、系统软件、检索软件和数据库的综合;9.计算机信息检索的类型:(1)根据检索系统的工作方式,可分为:a.脱机信息检索脱机信息检索是利用单台计算机的输入装置进行检索的系统,用磁带作为存储介质,并且为连续的顺序检索方式,适合大批量的定题信息检索;b.联机信息检索联机信息检索是利用计算机终端设备,通过通信线路或网络,与世界上的信息检索系统相连,从信息检索系统的数据库中进行检索并获取信息的过程;联机检索模式是主从式,即为所有的工作都在主机上进行,主机负担重,一旦主机瘫痪,整个系统都将处于瘫痪状态,因此对主机的性能要求极高;c.光盘信息检索d.网络信息检索(2)根据信息的服务方式,可分为:a.定题检索定题检索是用户根据课题的要求,事先编写出逻辑检索提问式,并将存储在计算机的存储器中,每次系统加入新的信息,系统便会按检索要求,找出用户所需的资料,并把结果分给用户,用户能及时得到最新的文献信息;具有定期性、新颖性和批处理性的特点;b.回溯检索回溯检索是追溯查找过去的信息,让用户一次检索一段时间内与某一课题有关的信息;也可以查找最新的信息,可以适应多数用户的查询需要;c.日常检索10.计算机信息检索技术初级检索6个1)布尔逻辑检索2)位置限制检索3)短语检索4)截词检索5)字段限制检索6)区分大小写检索11.计算机信息检索技术高级检索6个1)加权检索2)自然语言检索3)相关信息反馈相似检索4)概念检索5)模糊检索6)聚类检索布尔逻辑检索(1)逻辑与用AND或表示检索式写作A AND B或A B(2)逻辑或用“OR”或“+”表示(3)逻辑非用NOT 或—表示 A NOT B A当中除去B所剩下的字段名称及缩写AB abstract TI title AU author JN journal nameLA language PY publication year SP source publication分类和聚类的异同相同点:基于“类”的思想进行检索;不同点:1分类基于分类法,其类目体系主要是先组式,有系统性的;类目与文献之间具有相对独立性;而聚类则先有文献后聚类,类的性质及整体类目体系完全由系统中的文献决定;2从类目形成过程看,分类是总到分,聚类由分到总;会构建检索式主要是积木型12.计算机信息检索策略含义狭义的计算机信息检索策略是指检索提问式的构建,即运用系统特定的检索技术,确定检索词之间的逻辑关系,形成表达用户信息需求的检索提问式;广义的计算机信息检索策略是指在分析检索课题的实质内容和明确检索目标的基础上,选择检索工具,确定检索途径与检索用词,以及检索词之间逻辑关系与查找步骤最佳方案的一系列科学安排;13.计算机信息检索策略类型即联机检索五原则(1)最专指面优先:从最专指的概念入手(2)最低登录量面优先(3)积木型重点掌握,会构建此检索式(4)引文珠型增长(5)逐次分馏14.网络信息资源的评价方法:(1) 定性评价法:是指按照一定的评价标准从主观角度对网络信息资源所做的优选和评估,主要有指标体系法和调查表法;(2) 定量评价法:国内外比较典型的定量评价方法有信息计量法、层次分析法和对应分析法等三种;(3) 综合评价法:是定性评价和定量评价相结合的一种方法,有包括分析法、模糊综合评价法等;(4) 分类方法:分为第三方评价法、用户评价法和网络计量法;15.搜索引擎的类型:(1) 按检索机制划分:检索型、目录型和混合型检索工具(2) 按检索内容划分:综合型、专题型和特殊型检索工具(3) 按包含检索工具数量划分:单独型和集合型检索工具(4) 按检索资料类型分:万维网检索工具和非万维网检索工具16.元搜索引擎的含义所谓元搜索引擎,是对分布于网络的多种检索工具的全局控制机制,它通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作;17.元搜索引擎的特点:(1) 虚拟索引数据库(2) 查全率高(3) 用户界面友好(4) 适宜二次加工(5) 扩展性好18.元搜索引擎的工作原理19.实现跨语言信息检索的方法:1提问式翻译方法2文献翻译方法唯一结果是源语言描述3提问式—文献翻译方法将查询语言提问式翻译成目标语言提问式,与目标语言描述的信息库进行匹配,检索相关信息,然后再把检索结果的全部或部分内容翻译成查询语言描述的信息; 检索结果一般选择部分翻译,这样工作量较小,容易提高翻译的效率和质量,部分翻译一般是对结果文本的前两行、文摘或文本中重要的词进行翻译,在重要词的翻译中,如何确定重要词是决定这种方法效果的关键;4中间语种翻译方法5非翻译方法20.语义网的应用(1)Web服务(2)智能信息检索(3)基于语义的网页搜索引擎(4)企业数据管理收录论文的两个层次(1)Compendex数据;数据的内容全面,主要包括:论文标题;作者;作者单位;英文文摘;论文所在期刊名称;卷,期;论文页码;分类码;主题词等等;其中:分类码;主题词需要专业人员单独给出;(2)Page One数据:数据内容主要包括:论文标题;作者;作者单位;论文所在期刊名称;卷,期;论文页码;少数数据带有英文文摘;不需要任何专业人员再做工作;数据和Page One数据的主要区别在于:数据中是否有分类码和主题词;有这两项内容的数据是Compendex数据,反之是Page One数据;有没有主题词和分类号是判断论文是否被Compendex数据正式收录的唯一标志;23.主题指南按字母顺序列出与分类表中类目名称相关的主题词,并注明相关的分类号,实际上是分类表的主题索引,是从分类途径检索文献的指南;便于不能确定分类号的读者实现从主题查到分类号,再由分类号查到文献所在页码;科学引文索引的编制结构及检索方法(1)引文索引(2)来源索引(3)机构索引(4)轮排主题索引25.如何决定收录期刊的数量和种类1“加菲尔德文献集中定律”——确定适宜的期刊数量该定律认为:在几万种科技期刊中,最重要的期刊即核心期刊不过一千种,甚至可能还不足500;因而,把收录期刊的范围定在3000种以内,足以把重要的科技文献包括在内;2“费用—效果原则”——用来选择每一种期刊,具体方法是“引用频率统计法”先计算一种期刊在一年内被引用的总次数,再计算其中每篇论文的平均引文章,其他因素对引文章的影响通过加某些修正系数来解决,引用频率越高,说明该刊质量越高;通过上述两个指标决定了收录期刊的数量和种类26.什么是专利这种受法律保护的发明就称专利;含义:专利权——法律受专利法保护的发明创造——专利技术专利说明书等专利文献——文献这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体表现;27.什么是同族专利同族专利指同一个发明为了在不同国家得到保护,而在这些国家分别申请的一系列内容相同或基本相同的专利;由于同族专利或相同专利都具有相同的优先权项,所以通过优先权项可以方便、快捷地检索出有关同一发明的全部相同专利或同族专利;28.专利的类型(1)发明专利(2)实用新型专利(3)外观设计专利(4)植物性专利(5)防卫性专利知识产权:工业产权和着作产权29.学位论文的文献价值:(1)较高价值的一次文献:写作不受篇幅限制,论述详尽:从研究背景、技术线路、实验方法到数据获取、分析结论论述翔实;(2)珍贵的信息资源价值:能集中反映所在单位的科研领域、学术活动、研究进展和最新成果,论文的使用者可以跟踪名校导师的科研进程;(3)综述性二次文献:对相应研究领域有系统深入的讨论和综述,拥有详尽的参考文献,可得到课题研究现状综述;(4)写作技巧的启发蓝本:通过对学位论文的阅读,可大致梳理出作者的写作思路和研究方法,学习学位论文的写作方法;30.信息检索评价方法(1)测试文档集合法(2)人机交互(3)用户体验日志分析法(4)自然观察法31.召回率:R=检索出的相关文献量/ 数据库中的全部相关文献x100%准确率:P=检索出的相关文献量/ 检出的文献总量x100%32.平均准确率并会计算平均准确率是一个通过所有相关文献测定系统绩效的单值指标;如果检索系统能快速返回所需的相关文献,并对被检文献进行等级排序,则该系统的性能较好;平均准确率是求各个相关文献准确率的平均值;因此平均准确率的计算只考虑相关文献的数量,而与检出文献的总量无关;。

信息检索基础完整篇

信息检索基础完整篇

第一章信息检索基础第一节信息资源概述一、信息含义:(1)广义信息定义为:信息是事物属性的表征。

(2)狭义的信息定义:信息是指系统传输和处理的对象。

二、知识1.概念:知识是人们通过实践对客观事物及运动过程和规律的认识。

人们在认识世界和改造世界的过程中,获得大量客观事物传递的信息,即感性认识或经验,通过大脑对这些感性认识进行加工处理,形成理性认识,即知识。

2.知识与信息的联系:知识形成的过程就是人脑对客观事物传来的信息进行加工的过程,信息包含了知识,知识是信息被认识了的那部分。

3.信息、知识、文献三者关系(1、信息是物质存在的方式、形式和运动规律的表征。

(2、人脑对事物属性的感知形成知识。

人们对信息集合加工、整理形成人类社会实践的知识。

知识是能够被人们所认识到的那一部分信息。

(3、知识被记录在载体上形成文献。

(4.、文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。

三、文献1、定义——文献是记录有知识的一切载体。

(文献著录总则中定义)它把人类知识用文字、符号、图形及声频、视频信号等方式记录在纸张、感光材料、磁性材料等载体上。

2、文献四要素——文献信息、文献载体、符号系统、记录方式是构成文献的四个基本要素。

四者缺一不可。

知识决定文献的内容,载体决定文献的形态,记录则是构成文献的手段。

四、信息资源定义——这种大量的客观存在的人们直接或间接开发利用的信息集合总称为信息资源。

五、信息素质1.定义:指从各种信息源中检索、评价和使用信息的能力,是信息社会劳动者必须掌握的终身技能。

2.具有信息素质的人应具备的能力:运用信息工具、获取信息、处理信息、生成信息、创造信息、信息增效、信息协作、信息免疫第二节信息资源的构成一、从文献的性质和出版形式划分主要划分为以下十种类型,即所谓的“十大情报源”。

1.科技图书:一般是对已发表的科研成果、生产技术和科学知识的概括和总结。

它通常是以一次文献为基本素材,经过作者的选择、分析、鉴别和归纳后重新组织写成的。

第1章_信息资源及检索基础知识

按信息的客体性质:自然信息、生物信息、社会信息 按信息的内容:经济信息、文化信息、科技信息、决策信 息、工业信息、军事信息 按信息的时间:预测信息、实时信息、反馈信息

2013-6-17 2
信息的特征*
(1)客观性(本质属性) 地震,海啸,花草树林的发芽、生长和枯萎,广播电 视、网络的新闻、广告等等发出的信息,不管你知道 不知道,感知不感知,它都是客观存在。 只要有物质存在,就有信息的存在——不以人们的意 志为转移的。它是现实世界中各种事物运动与状态的 反映,它可以被人们所感知、处理、存储和使用。它 的客观性还表现在反映客观世界变化的信息包含在各 种物质之中。
信息F5:照片中王进喜身后反应塔、所握手柄的架式和井架密度。 知识K3:以扶手栏杆和反应塔的直径相比,推断出油井的 直径是5 米;井架密度推断出油田的大致储量和产量。。 知识K4:圆柱体的体积计算公式为: 柱体积= 底面积× 高
情报T2: 南北400 公里的范围—— 大庆油田的规模 情报T3:推出大庆 油田的年产量约 为100万吨——大 庆油田的产量
不同的情报对应不同的用户:科技部门——科技情报(信息);决策部 门——决策情报(信息);军事情报;经济情报„„
● 在西语中信息和情报都是“information”,不加以区别。
● 原国家科委于1992年决定用“科技信息”取代“科技情报”。
2013-6-17 8
1.4 基本概念-文献
文献:以文字、图形、符号、声频、视频等方式记录有知识的一切载体 载体:具备记录和传播知识信息的物质材料。如甲骨、青铜器、纸介型 、 胶片,磁带,磁盘,光盘等。 记录:构成文献的重要手段 文献的基本要素: (1)信息内容—文献的核心。 (2)信息符号—揭示和表达知识和信息的标记符号。 (3)载体材料—承载文献信息符号的物质材料。 (4)记录方式—将包含信息内容的信息符号存储到载体材料上去的方法。 知识、文献、情报间的关系

信息检索笔记

第一章信息资源的概述一.传统信息资源的概述1.概念与特征2.类型:(1)一类文献:原始文献(2)二类文献:对一类文献的加工整理,报道揭示一类文献,提供的是一类文献的线索和地址(书目,索引,文献)(3)三类文献:来源于一类文献,有丰富的权威的资料,可以解决各种问题。

如:百科全书,字典,词典,手册,年鉴,名录二.数字信息资源1.与传统信息资源相比具有的特征:(1)以多媒体为内容特征(2)内容复杂多样(3)更新速度快,时效性强(4)利用不受时空限制(5)具备检索系统(6)具备全方位的动态的信息服务功能2.数字信息资源的类型:(1)按性质和功能划分:a)一次文献:原始文献b)二次文献:参考数据库,搜素引擎,网资,导航等。

c)三次文献:元搜素引擎(关于搜素引擎的搜素引擎)(2)按载体划分:光盘,网络数据库,联机检索系统(三)主要数字信息资源1.参考型数据库:包含各种数据信息的来源和属性的数据库。

包括:书目数据库,索引数据库,文献数据库2.全文数据库:收录有原始文献全文的数据库3.事实数据库;直接提供原始文献的数据库,分为数值数据库,指南数据库,术语数据库4.电子图书5电子报纸6.搜索引擎/分类指南7.网络学术资源学科导航:对各类信息资源进行筛选整理之后,按学科属性对其进行分类、组织。

第二章信息检索概述一.信息检索:信息检索就是利用一定的检索工具,运用一定的检索技术和方法查找信息的过程。

二.信息检索的原理1.利用计算机进行信息检索的前提和基础是信息的组织和贮存。

没有贮存就没有检索对象。

2.信息的组织与贮存就是数据库的建立过程。

在这一过程中,系统对收集到的信息进行概念分析(即找出能够表达主题的关键词),然后赋予其特征标识(这一过程也叫对信息内容进行标引),并按特定的编排方法将其组织起来,形成有序的具有可检性特征的数据库。

3.计算机进行信息检索的原理就是指用户和检索人员将能够表达其信息需求的检索式提交给检索系统,检索系统即自动将检索式与系统中的信息进行匹配,凡是信息特征标识和逻辑组配关系与用户检索式一致的,既未命中内容。

信息检索基础知识

文献加工困难,阅读不方便。
例如:缩微平片、缩微胶片等。
声像型:
定义: 也称视听型,是指通过特定设备,使用光、声、
磁、电等技术将信息转换为声音、图像、影视和动 画等形式,给人以直观、形象感受的知识载体。 (一种非文字形式的文献) 优点:
信息存储密度高,形象直观、生动、逼真。 缺点:
成本高,不易检索和更新。 例如:录音带、唱片等。
专著(原始文献)
•ISBN号*
期刊
定义:
期刊一般是指名称固定、开本一致的定期或不定期 出版的汇集许多个著者论文的连续出版物。(期刊上刊 登的论文大多数是原始文献)
按内容分:学术性期刊、通讯性期刊、述评性期刊等。
例如:
按时间长短分:周刊、月刊、双月刊、季刊、年刊等。
ISSN号*
报纸
定义:
报纸是以刊载新闻和时事评论为主的定期向公众发 行的印刷出版物。是大众传播的重要载体,具有反映和 引导社会舆论的功能。
广义:信息、信息生产者、信息技术和设备。
二、信息资源(文献)的类型
(一)按文献的载体不同划分: 1、手写型 2、印刷型 3、缩微型 4、声像型 5、电子型 6、多媒体型 (二)按文献的出版形式不同划分: 1、图书 2、期刊 3、报纸 4、会议文献 5、学位论文 6、科技报告 7、专利文献 8、标准文献 9、产品样本 10、档案 11、政府出版物 (三)按文献的加工程度不同划分: 1、零次文献 2、一次文献 3、二次文献 4、三次文献
知识固化在纸张上的一类文献。 优点:
便于阅读、传递,便于大量印刷,成本低。 缺点:
信息存储密度低、分量重,体积大,收藏空间大, 保存期短,管理困难。
例如:图书、期刊、报纸以及各种印刷材料。
缩微型:

信息检索基础知识介绍


原始文献 加工整理
提 问
数据库 存 储
检 索
输 出
检 索
三、信息检索的类型
(一)按检索对象和目的划分 1、数据检索
LOGO
是以数据为检索对象,检索的结果是经过测试、
评价过的各种数据、可直接用于分析和研究。
2、事实检索
是以具体事项为检索对象,检索结果是有关 某一事物的具体答案。
3、书目检索
以标题、作者、来源出处、专利号等为检索对象,
主题词语义参照系统
汉语拼音 Zà o shēng gān răo 符 英文 参照项 含义 噪声干扰 简称 英文全称 [56MB] 范畴分类号 正式主题词 号 简称 Zábō gān răo 汉语拼音 Noise jamming 英译名 用项 同义词(正 用 Y USE Use D 杂波干扰 Dià n zĭ duì kà ng 非正式款目主题词 杂波干扰 [56MB] 范畴分类号 式主题词 ) 瞄准式干扰 电子对抗* F · 通信对抗 代项 同义词 (非扫频干扰 代 Noise D jamming UF Used For 参 英译名 · · 通信干扰 关 阻塞式干扰 照 正式主题词 ) · · · 脉冲干扰 系 S 通信干扰 Y 噪声干扰 符 参照符号 关系词 · · · 欺骗性干扰 分项 狭义词 分 F NT Narrower Term 词 号 有源干扰 · · · 载波干扰 · · · 噪声干扰 属项 广义词 Z 电子对抗 属* S BT Broader Term · · · · 扫频干扰 C 连续波干扰 · · · · 阻塞式干扰 族项 族首词 族 Z TT Top Term 脉冲干扰 · · 通信抗干扰 调制干扰 参项 相关词 参 C RT Related Term
INFORMATION RETRIEVAL
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

北京,科學出版社 2001
本課程的學習目的及任務:
培養資訊意識 掌握資訊檢索技能 增強資訊綜合運用能力

考試方式: 標準試卷(A、B)

第一章 資訊資源概論
第一節 資訊資源基礎知識
一、資訊的概念與特徵
二、資訊與知識、情報、文獻的關係
三、資訊的表現形式與類型
一、資訊的概念與特徵
1.資訊的概念
資訊(masege):是文獻、資料、情報、 知識、數據以及消息、新聞的總稱 。 還可以理解為:信即信號,息即消息, 通過信號傳遞的消息。 我國《辭海》把資訊解釋為:資訊是指 對消息接受者來說預先不知道的報導。

2. 資訊的特徵
(1) 傳遞性: (2) 共用性:
(3) 依附性和可處理性:
(4) 時效性:也稱動態性,
三、按文獻的出版形式
1、圖書 2、期刊 3、專利 4、學位論文 5、會議文獻 6、科技報告 7、標準 8、政府出版物 9、產品資料 10、技術檔案或其他
1、圖書

圖書是正式出版且具有一定篇幅的非連續 性的,其內容往往是圍繞某一個題目進行 全面論述出版物。內容較成熟、全面、系 統、可靠。
每一種公開出版發行的
圖書,都有一個唯一的國 際標準書號,簡稱ISBN。
7—5011—2575— 9/G•966出版社號 書號 電腦校驗碼 中圖分類號
ISBN
2、期刊
期刊包括所有定期和不定期的連續出 版物。 特點是:數量大,品種多、內容豐富、 出版週期短,報導速度快,是科研人 員獲取最新資訊的主要來源。
按文獻的載體形式
2.縮微型 是以感光材料為載體,以照相複製方式, 將紙張文獻微縮複製在感光材料上而生成的文 獻,包括縮微膠捲和縮微膠片。具有體積小、 重量輕、存儲密度高的優點,但要借助縮微閱 讀器才能閱讀,不大方便,也不便於攜帶。
按文獻的載體形式
3.聲象型也稱視聽性文獻,是指以磁性材料或感 光材料為載體,採用錄音、錄相或攝影技術直 接記錄聲音資訊或圖像資訊而形成的文獻,包 括唱片、錄音帶、錄影帶、幻燈片、電影片等。 其特點是直觀、真切、傳遞速度快、存儲密度 高。
二、資訊與知識、情報、文獻的關係

知識 (knowledge) :是人類在改造客觀世界實 踐中所獲得的認識和經驗的總結。 情報(information) :是指那些被人們用來解決 特定問題所需要並進行交流的知識。 文獻(Literature) : 以文字、圖形、符號、聲 頻、視頻等手段記錄和傳播知識的載體。-記 錄有知識或資訊的一切載體。
本課要求:
1.瞭解資訊檢索基本知識,網上資訊特點、組織 方式,資訊檢索原理與技術。 2.掌握常用搜索引擎、網上資訊檢索技巧; 3.掌握下載網上資訊常用的流覽器使用方法 4.掌握國內重要資料庫 CNKI 、萬方、博碩論文 資料庫等檢索方法 5.熟悉三大索引 6.國外重要檢索資料庫介紹 EI、CA、聯機… 7.熟悉瞭解特種文獻資訊資料庫檢索方法 8.瞭解社科、農林、網上圖書、專業資訊中心網 站等 網上檢索方法。 9.瞭解國內外資訊服務機構等內容。
本課教材或參考書目

朱江嶺等 《網路資訊資源檢索與利用》北京: 海洋出版社,2007 參考書 目: 餘向春等,《化學化工資訊檢索與利用》大連 理工大學出版社 2005 科技資訊檢索 西南科技資訊中心 出版 2002 郝風素等編著,《資訊資源組織與檢索》,北 京:機械工業出版社,2005 朱江嶺等編著,《虛擬圖書館與網上資訊檢 索》,北京:海洋出版社,2005 徐天秀著譯,《 21世紀高等院校教材--資訊檢索》

二次文獻:
檢索工具,指將大量分散無序的一次文獻進
行加工整理後形成的檢索檔,包括目錄、題 錄、索引、摘要等等。
是檢索一次文獻的工具。
按內容的加工程度

三次文獻:
綜述性文獻,指對一次文獻和二次文獻進行
綜合、分析、評述等深度加工形成的文獻。
如學科進展綜述、專題述評、預測報告,以
及一些百科全書、年鑒、數據手冊、詞典等。 二、按內容的加工程度
零次文獻 一次文獻


二次文獻
三次文獻
按內容的加工程度

一次文獻:
原始文獻,指直接從研究或勞動實踐中產生
並經過適當的審查後正式發表公佈的文獻。
可以理解為:指原始的創作。 如期刊論文,科技報告,專利說明書,會議
論文,學位論文等。
為文獻檢索的目的。
按內容的加工程度
一、按文獻的載體形式 二、按文獻內容的加工程度 三、按文獻的出版形式

一、按文獻的載體形式
印刷型 縮微型 聲像型 電子型

按文獻的載體形式
1.印刷型 包括鉛印、油印、石印、膠印等。主要 以紙張為載體,它的優點是便於閱讀,便於流 傳;缺點是佔據空間大,整理和保存起來比較 困難。
資訊檢索課程
課程介紹

科技文獻檢索是一門全校性基礎課。通 過教學和實踐,使學生具備文獻資訊檢 索的基礎知識和理論框架,熟悉本專業 及相關專業文獻資訊資源;掌握通過多 種方式獲取和利用文獻資訊資源的基本 技能;學會用科學的方法進行文獻資訊 的收集、整理、加工和利用,提高學生 在學習和工作中的自學能力和獨立創新 能力。


經人腦加工被有序化
運用於實踐
事物運動產生資訊
知識 記 錄 在 載 體 上
情報
新的資訊
傳遞應用
文獻
圖1-1 資訊、知識、文獻和情報之間的關係
三、資訊的表現形式與類型
資訊資源 潛在資訊資源 現實資訊資源 載體資訊資源 實物資訊資源 文獻資訊資源 (網路資訊資源)
第二節 文獻資訊資源的類別
文獻資訊資源的類別:
按文獻的載體形式
4.電子型文獻又被稱作機讀型文獻,現在電子型文獻有 時也統稱為電子出版物。電子型文獻包括電子圖書、 電子期刊、電子新聞、各種聯機資訊庫和光碟資料庫 產品或軟碟、磁帶(電腦磁帶)等產品,近期又出現了 以網上原創作品為代表的只在網路中存在的虛擬文獻 (virtual document)資源。電子型文獻資料庫是電腦 資訊檢索的主要對象,其優點是體積小、檢索方便、 直觀生動,便於遠距離傳輸;缺點是需借助電腦閱讀, 不大方便,費用較高。(人類知識交流與生產的第四 次革命,1語言2文字3活字印刷術)
相关文档
最新文档