信息资源检索部分知识点
信息检索的基本知识

⑵信息检索系统的类型 〔续〕
④索引型检索系统: 索引是根据一定的需要,把特定范围内的
某些重要文献中的有关款目或知识单元,书 名、刊名、人名、地名、语词等,按照一 定的方法编排,并指明出处,为读者提供 文献线索的一种检索系统。
索引不仅广泛存在于各种书刊等文献 中,而且更多见于作为辅助检索系统而附 在不同类型的检索工具之后,为检索工具 提供了更多的检索途径。
信息的存储过程就是按照主题词表或 分类表及使用原那么对原始信息资源
一、信息检索原理〔续〕
2、信息检索系统〔续〕
一、信息检索原理〔续〕
⑵信息检索系统的类型
按信息处理手段划分有 ①手工检索系统。又称传统检索系统 是使用人工来查找信息的检索系统。 其主要类型有各种书本式的目录、题 录、文摘和各种参考工具书等。优点: 方便、灵活、 断准确。缺点:检索速 度太慢
2、信息检索系统〔续〕
按著录和标引方式划分 ④文摘型检索系统是以简练的文字将文献
资料的主要内容准确、扼要地摘录下来, 并按照一定的著录规那么和编排方式系统 地组织起来的检索 工具。 主要包括:报道性文摘
指示性文摘 如:美国的?化学文摘?英国的?科学文摘〉
中国的〈中国数学文摘〉〈海洋文摘〉
2、信息检索系统〔续〕
按著录和标引方式划分
⑤全文型检索系统 全文检索是指在文献资料的标题、目录、作
者、内容中检索 指定的字符串。 全文检索系统是指将文章 中所有的文字处理序列 都作为检索对象进行索引,并根据需要找出包含 有欲检索词的文献的系统。
作用:它能提供快捷的数据管理工具和数据 查询手段,帮助人们进行了大量文献数据的整理 和管理工作,使人们能够快速、方便地查到想要 的任何信息。
第二章 信息检索的根本知识
信息检索知识点

信息检索知识点信息检索是指从大规模的信息资源中,通过利用各种信息检索工具和技术,准确和高效地找到用户所需要的信息的过程。
信息检索技术在现代社会中扮演着重要的角色,它不仅广泛应用于互联网搜索引擎,还在图书馆、数据库、企业信息管理等领域发挥着重要作用。
本文将介绍信息检索的定义、关键概念和一些常用技术。
一、信息检索的定义和目标信息检索是指通过计算机等工具从大规模的信息资源中,按照用户的需求进行检索,提供相关性高、准确性好的信息结果。
它的目标是帮助用户快速地找到所需的信息,提升信息搜索效率和准确性。
二、关键概念1. 查询:用户提交的检索请求,通常由一系列关键词组成。
2. 检索词:查询中使用的关键字或关键词短语。
3. 检索结果:根据查询返回的与之相关的文档或信息。
4. 相关性:衡量检索结果与查询之间相关程度的指标,通常使用相关性排序算法进行排序。
5. 文档:信息资源的基本单位,可以是网页、文章、图片、音频等形式。
三、信息检索的主要技术1. 分词技术:将文本数据按照一定规则分割成有意义的词语,是信息检索的基础步骤。
2. 索引技术:将文档中的关键词与其所在位置进行索引,以提高检索效率和准确性。
3. 倒排索引:根据关键词构建索引表,记录关键词与文档之间的对应关系,常用于搜索引擎等场景。
4. 相似度计算:根据查询和文档的相似性,为检索结果进行排序。
5. 结果评估:通过评估检索结果的质量,改进检索算法和模型。
四、常用的信息检索模型1. 布尔模型:将查询和文档转化为布尔表达式,按照布尔运算进行检索。
2. 向量空间模型:用向量表示文档和查询,通过计算向量之间的相似度进行检索。
3. 概率检索模型:基于统计方法,利用概率模型进行信息检索。
五、信息检索的挑战和发展方向1. 大规模数据处理和存储:随着互联网的快速发展,信息资源呈指数级增长,如何高效地处理和存储大规模的数据成为了一个挑战。
2. 多语言检索:不同语言的信息检索在跨语言信息检索中面临很大的难度和挑战。
信息资源检索基础知识 检索基本原理

各种位置算符可以混合于一个检索式中,它们都隐含
有AND功能,由于不同的位置算符对两个词相对位置的要
求不同,在同一个检索式中若有两种以上的位置算符时,
应把要求严格的放在前面,从而提高查准率,节省查找时
间。运算符按照检索精度排序为:(W)>(nW)>(N)
>(nN)>(L)>(S)>(F)>(C)。位置检索对提高
② (L)算符
例如,“information system(L)system design”, 表示“system design”是“information system”的下一 级主题词。
15
信息资源检索基础知识
返回目录
2.1.1 传统的信息资源检索技术
3. 位置检索
除了上述介绍的词位置检索、同句检索和同字段检索 3个级别的位置检索外,还有一级位置检索叫做同记录检 索,它所用的位置算符为(C),(C)要求它两侧的检 索词同在一条数据库记录中出现。
18
信息资源检索基础知识
返回目录
2.1.1 传统的信息资源检索技术
4. 限制检索
➢ (2)限制符检索
限制符检索是使用AU(作者)、CS(作者单位)、 JN(刊物名称)、PY(出版年份)、LA(语言)等限制 符号从文献的外部特征方面限制检索范围和检索结果的一 种方法。限制符的用法与后缀符相同,而它的作用则与前 缀符相同。
句或者全文数据库的一个段落中出现,检索词的先后顺序 和插入词的个数不受限制。同句检索中用到的位置算符主 要是(S),是“Sentence”或“subfield”的缩写。
例如,“electronic(S)optical”,可以检索到题名 为“Cutting and Polishing Optical and Electronic Materials”的文献。
信息检索知识点

信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进展相符性比较,但凡信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,那么具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体.检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进展标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进展标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进展比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法〔1〕顺查法〔2〕倒查法〔3〕抽查法〔4〕追溯法〔5〕循环法5.信息检索的途径〔1〕部特征途径a)分类途径b)主题途径〔2〕外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:〔1〕简单,形式简洁,易于理解;〔2〕可操作性强,应用广泛;〔3〕构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常准确的语义概念;〔4〕能处理构造化提问。
缺点:〔1〕表达用户复杂需求效果欠佳〔2〕准确匹配无法提供定量比较〔3〕匹配标准不尽合理〔4〕检索结果不易控制7.概率排序原那么:如果一个检索系统对用户的每个检索提问的反响是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
8.什么是计算机信息检索.所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那局部信息的过程。
信息检索重点知识

信息:信息是事物存在的方式,运动状态及其特征的反映,是事物发出的信号,消息信息的特征:载体依附性无线共享性永不枯竭性开发增值性应用时效性存在普遍性知识:知识是信息的升华和结果,系统化理论化的的信息就称为就称为知识文献:用一定的方式记录在一定的载体上的知识都称之为文献信息源:个人为满足信息的需要而获得信息来源称之为信息源信息源类型:①个人信息源②组织机构信息源③实物型信息源④文献信息源⑤电子型信息源①及时、新颖、传递迅速、但带有主观随意性,久传易出错②内部信息源,共管理人员分析③直观性强,信息量大,有一定隐蔽性④当今数量最大,利用率最高的信息资源⑤内容广泛、使用简便信息资源:即作为资源的信息。
信息资源的构成要素: 信息生产者,信息,信息技术。
文献信息源分为:图书期刊学位论文科技报告专利文献标准文献产品样本会议文献政府出版物零次文献:未经出版发行或者未进入社会交流的最原始的文献一次文献:以作者本人取得的成果为依据而创作的作文报告等公开发表或出版的各种文献二次文献:按照特定的目的进行筛选,即所谓用一定的检索工具进行过加工的文献三次文献:根据二次文献提供的线索,选用大量一次文献的内容,经过筛选分类综合和浓缩而再度出版的文献信息素养DY:能认识到何时需要信息和有效的搜索评估和使用所需要信息的能力医学信息素养内容:信息意识信息知识信息能力信息道德(DY以医学信息获取、评价和利用等处理能力为核心)信息检索DY:信息检索包括信息储存和信息获取两个过程,信息的存储:根据信息的外表和内部特征,按照一定的组织编排,使之成为有序化信息集合的过程。
信息的获取:根据特定的需要,运用组织好的检索系统和工具,将特定信息找出来的过程。
信息检索的类型:文献检索事实检索数据检索信息检索原理:是通过对大量分散无序的文献信息进行收集,加工,组织,存储,建立各种各样的检索系统。
并通过一定量的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效的获取和利用信息源。
第1章_信息资源及检索基础知识

2013-6-17 2
信息的特征*
(1)客观性(本质属性) 地震,海啸,花草树林的发芽、生长和枯萎,广播电 视、网络的新闻、广告等等发出的信息,不管你知道 不知道,感知不感知,它都是客观存在。 只要有物质存在,就有信息的存在——不以人们的意 志为转移的。它是现实世界中各种事物运动与状态的 反映,它可以被人们所感知、处理、存储和使用。它 的客观性还表现在反映客观世界变化的信息包含在各 种物质之中。
信息F5:照片中王进喜身后反应塔、所握手柄的架式和井架密度。 知识K3:以扶手栏杆和反应塔的直径相比,推断出油井的 直径是5 米;井架密度推断出油田的大致储量和产量。。 知识K4:圆柱体的体积计算公式为: 柱体积= 底面积× 高
情报T2: 南北400 公里的范围—— 大庆油田的规模 情报T3:推出大庆 油田的年产量约 为100万吨——大 庆油田的产量
不同的情报对应不同的用户:科技部门——科技情报(信息);决策部 门——决策情报(信息);军事情报;经济情报„„
● 在西语中信息和情报都是“information”,不加以区别。
● 原国家科委于1992年决定用“科技信息”取代“科技情报”。
2013-6-17 8
1.4 基本概念-文献
文献:以文字、图形、符号、声频、视频等方式记录有知识的一切载体 载体:具备记录和传播知识信息的物质材料。如甲骨、青铜器、纸介型 、 胶片,磁带,磁盘,光盘等。 记录:构成文献的重要手段 文献的基本要素: (1)信息内容—文献的核心。 (2)信息符号—揭示和表达知识和信息的标记符号。 (3)载体材料—承载文献信息符号的物质材料。 (4)记录方式—将包含信息内容的信息符号存储到载体材料上去的方法。 知识、文献、情报间的关系
网络信息资源检索与利用 知识点

第一章1、情报定义:情报室人们用来解决特定问题所需要的,经过激活过程活化了的,具有使用价值的知识或信息。
2、文献定义:文献是记录知识的一切载体,即用文字、图形、符号或者声频等技术手段记录知识的物质载体。
或固化在物质载体上的知识。
文献具有三个属性即文献的知识性、记录性、物质性。
3、信息、知识、情报和文献的关系信息是物质存在的方式、形态和运动规律的表征,人脑对物质属性的感知形成信息,信息是起源,是基础;文献是信息、知识、情报的存储载体和重要的传播工具,信息知识和情报的内容只有记录在物质载体上才能构成文献;文献通过传递、应用于理论和实践又会产生新信息。
4、文献信息源文献信息也称文献资源,是用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。
5、文献信息源类型按照信息源的载体类型划分:印刷型缩微型声像型电子型按照信息源的加工程度划分:1)零次文献:零次文献是指尚未经过系统整理形成正式文献的零散资料或最原始的记录,如书信、手稿、笔记等。
2)一次文献:一次文献又称原始文献,是作者对自己研究的成果或创造性活动成果的直接记录。
一般是指公开出版的著作,期刊论文、科技报告、会议文献、学位论文、专利文献等。
3)二次文献:二次文献是将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。
二次文献包括目录、文摘、索引等,它们是二次文献的核心。
4)三次文献:三次文献是通过二次文献提供的线索,对某一范围的一次文献进行分析、综合研究、归纳、整理等深加工所生成的文献,包括素萍,百科全书、报告、年鉴、手册、字典等。
6、信息检索:广义上说信息检索是指将信息按照一定的方式组织和储蓄起来。
并根据信息用户的需求查找出相关信息的过程。
7、著录:是根据一定的规则,对文献的内容和形式特征进行分析、选择和记录的过程。
8、标引:1)按照标引的的工作方式分类:分为人工标引、计算机辅助标引、自动标引。
信息检索基础知识

例如:缩微平片、缩微胶片等。
声像型:
定义: 也称视听型,是指通过特定设备,使用光、声、
磁、电等技术将信息转换为声音、图像、影视和动 画等形式,给人以直观、形象感受的知识载体。 (一种非文字形式的文献) 优点:
信息存储密度高,形象直观、生动、逼真。 缺点:
成本高,不易检索和更新。 例如:录音带、唱片等。
专著(原始文献)
•ISBN号*
期刊
定义:
期刊一般是指名称固定、开本一致的定期或不定期 出版的汇集许多个著者论文的连续出版物。(期刊上刊 登的论文大多数是原始文献)
按内容分:学术性期刊、通讯性期刊、述评性期刊等。
例如:
按时间长短分:周刊、月刊、双月刊、季刊、年刊等。
ISSN号*
报纸
定义:
报纸是以刊载新闻和时事评论为主的定期向公众发 行的印刷出版物。是大众传播的重要载体,具有反映和 引导社会舆论的功能。
广义:信息、信息生产者、信息技术和设备。
二、信息资源(文献)的类型
(一)按文献的载体不同划分: 1、手写型 2、印刷型 3、缩微型 4、声像型 5、电子型 6、多媒体型 (二)按文献的出版形式不同划分: 1、图书 2、期刊 3、报纸 4、会议文献 5、学位论文 6、科技报告 7、专利文献 8、标准文献 9、产品样本 10、档案 11、政府出版物 (三)按文献的加工程度不同划分: 1、零次文献 2、一次文献 3、二次文献 4、三次文献
知识固化在纸张上的一类文献。 优点:
便于阅读、传递,便于大量印刷,成本低。 缺点:
信息存储密度低、分量重,体积大,收藏空间大, 保存期短,管理困难。
例如:图书、期刊、报纸以及各种印刷材料。
缩微型:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息资源检索部分知识点
据等。
事实检索:就是对特定的事件或事实的检索。
事实内容包括大量的科学事件和社会事件。
例如:我国建成最早的高速公路是哪条?何时建设?
概念检索:就是查找特定概念的含义、作用、原理或使用范围等解释性内容或说明。
最常见的概念检索是查找各种参考工具书,例如字词典、百科全书、名录、手册、指南等参考工具书。
4、经常使用的检索语言有哪些?主题检索包括哪几种检索?
答:检索语言:分类语言,主题语言(标题词、单元词、叙词、关键词),引文语言,代码语言。
书名、刊名、篇名等、著者名称、号码(如报告号、专利号、文献序号等)、文献类型。
主题检索:标题词、单元词、叙词、关键词
二章
1、计算机检索有哪些特点?
答:检索速度快,效益高;
检索功能强,数量大;
检索途径多,手段灵活;
检索范围广;
服务方式多。
2、数据库的类型有哪几种?
答:参考(文献书目型)数据库:是指包含各种数据、信息或知识的原始来源和属性的数据库;是机读的目录、索引和文摘检索工具,检索结果是文献的线索而非原文。
存储的是二次文献,包括文献的外部特征、题录、文摘和主题词等。
这类数据库占用很大的比例
全文数据库:存储的是原始文献的全文,如杂志论文、报纸新闻、法院案例等。
全文检索可直接获取原始资料,而不是书目检索时的线索,提高了用户的检索效率。
事实数据库:存储的是用来描述人物、机构、事物等信息的情况、过程、现象的事实数据。
数值数据库:主要包含的是数字数据,如各种统计数据、科学实验数据、科学测量数据等。
3、信息检索的方法和步骤?
4、答:信息检索的方法:检索方法是指查寻文献信息的具体方法。
选择科学有效的检索方法,对广、快、精、准地获取文献信息,提高检索效率,是非常重要的。
直査法:指直接从有关的一次文献中获取所需
信息的检索方法。
追溯法:指利用引文关系获取所需文献信息的检索方法。
工具法:利用检索工具或检索系统获取所需文献信息的检索方法。
顺查法、倒查法、抽查法综合法:又称循环法,是指直査法、追溯法、工具法综合运用的检索方法。
交替检索、分段检索、间隔检索。
1、分析课题,确定检索目标:明确检索的目的、课题分析(1)分析主题内容。
通过主题分析,形成检索需要的主题概念,以便确定检索途径。
(2)分析课题所涉及的内容及学科范围,以便确定有关检索标识(分类号)及选择合适的检索工具或检索文档。
(3)分析课题所需信息的类型,包括文献媒体、出版类型、所需文献量、年代范围、涉及语种、有关著者、机构等。
(4)确定课题对查新、查准和查全的指标要求。
2、选择检索词,制定检索策略
方法一:切分
以词为单位,对课题语句进行拆分
方法二:删除
去除禁用词及不具检索意义的词汇
方法三:置换
用含义明确的词汇替换原课题用语
方法四:增补
分析隐含概念,挖掘潜在的主题词
就是指计算机信息检索系统中用来表达检索提问的逻辑表达式,由检索词和各种运算符及系统规定的其它组配符构成。
合理运用逻辑运算符构造检索式。
符号的使用一定要正确、符合概念逻辑,并力求简洁、优化,还应注意运算符的优先级和括号的使用。
3、选择数据库或检索工具
⏹选择数据库根据检索目标,确定检索目的、涉及的学科范围和信息类型,选择合适的数据库。
⏹具体选择过程中还应考虑数据库的类型(参考、全文还是电子期刊)、内容(专利、标
准、会议)、收录的数据学科范围、数据库
的更新周期,收录文献的语种等因素。
⏹例如,要看全文就要选用全文数据库或电子
期刊;要查标准或专利就要选择标准库或专
利库
4、上机检索及调整检索策略:文献内容特征的检索途径包括:分类途径、主题途径(标题、关键词、主题词、文摘、全文)
表达文献外部特征的检索标识有:著者、著者单位、文献出处、专利号、报告号等。
5、输出和分析结果
⏹检索完成后,采用一定的输出方式(套录或
打印)和格式输出检索结果。
各个数据库提
供了多种输出格式,每种格式能得到的文献
内容特征和外表特征都不一样,一般情况
下,文献检索中篇名、作者、出处、文摘等
字段是不可缺少的,因为这些字段有一定的
参考意义。
⏹结束检索后,对结果进行分析,也是完整检
索过程中不可缺少的一步,有助于提高检索
质量。
三章
⏹熟悉“中国学术文献网络出版总库”平台的
检索方法
⏹你利用CNKI的数字出版平台关注的板块
和功能有哪些?
资源整合
⏹创建个人数字图书馆并对你的课题建立订
制服务。