信息检索知识点
信息检索基础知识考点整理

信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。
信息检索基础知识汇总

分类语言 (classification) 主题词(subject) 关键词(keyword)等
表述文献外表 特征的语言 检 索 语 言 表述文献内容 特征的语言
分类语言(classification)
将各种概念按学科性质进行分类和系统排列 的语言,具体体现为用分类号和类名来表达信息 的主题概念。 中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法
IPC国际专利分类法
中图分类法
《中图法》分 5个基本部类,将知识门类分为 “哲学”、“社会科学”、“自然科学”三大部 类。马克思主义、列宁主义、毛泽东思想是指导 我们思想的理论基础,作为一个基本部类,列于 首位。此外,考虑到图书本身的特点,对于一些 内容庞杂,类无专属,无法按某一学科内容性质 分类的图书,概括为“综合性图书”,作为一个 基本部类,置于最后。在此基础上扩展为 22个大 类。 标记符号采用拉丁字母与阿拉伯数字相结合的混 合号码制。
8 其它途径
检索途径的选择取决于两个方面:
一是课题的已知条件和课题的范围及检 索效率要求;
二是所选择的检索工具所能提供的检索 途径。
构造检索式
检索式是检索策略的逻辑表达式,是用来表达 用户检索提问的,由基于检索概念产生的检索词和 各种组配算符构成。
组配算符通常有布尔逻辑算符、截词符(通配 符)、位置算符、嵌套算符(优先算符)四种。
第三章
信息检索基础知识
知识要点
★ 信息检索概念及其分类 ★ 信息检索基本原理及检索语言 ★ 信息检索的基本步骤 ★ 检索效果及其评价
信息检索(information retrieval)概念
信息检索复习题

第一章绪论1.1 信息素养与信息教育信息素养,又称信息素质、信息能力,是一个综合性的整体概念,它是将信息意识、信息道德、信息需求动力、信息工具和信息源以及信息评估、吸收与利用有机结合而获得的一种综合能力。
1.2 信息的基本概念信息与知识、情报、文献的联系与区别:信息是指对各种事物的存在方式、运动状态和相互联系特征的一种表达和陈述,是自然界、人类生活和人类思维活动普遍存在的一切物质和事物的属性。
知识来源于信息,是信息的一部分。
是一种特定的人类信息,信息只有经过科学的系统的加工才能上升为知识。
情报是为了解决一个特定问题所需的知识,是激活了的知识,是知识经传递并起作用的部分。
有三个基本属性:知识性、传递性和效用性。
它虽然属于信息的范畴,但不是一般的信息,而是一种特定信息。
文献是记录有信息的一切载体,文献中蕴含着大量的知识和信息,这些知识、信息被用户利用时就转化为情报。
情报源于知识,知识源于信息,文献是信息、知识情报的主要载体形式。
1.3 信息源与信息媒体信息源,就是信息的来源,即人们在科研活动中、日常工作以及其他一切社会实践中所产生的成果和各种原始资料,以及对这些成果和原始资料加工整理而得到的成品等,是能为满足人们特定需要而产生信息的源泉。
按照其存在形式可分为三类:口头信息源、实物信息源和文献信息源。
一次信息媒体:即原始信息媒体或第一手资料,主要是指报道新发明、新创造、新知识、新技术的原始资料,以及直接记载的科研成果调查报告经验总结等,通常亦称原始文献、一次文献。
如期刊文献、会议文献、科技报告/研究报告、专利文献、学位论文、政府出版物、标准文献、科技档案、产品资料等。
第二章信息检索系统概述2.1信息检索系统类型计算机检索系统:其核心是数据库,它是由一个或多个文档构成的大量数据的集合。
按计算机检索系统所含信息资源内容的形式不同分为五种类型:1书目型数据库:存某个学科领域的二次文献信息(文摘或题录)的数据库,提供原始文献信息的梗概和线索。
信息检索基础知识

通识课课程图书类别
课程名称
思想道德与法治
中国近现代史纲要 马克思主义基本原理 毛泽东思想和中国特色社会主义理论体系
习近平新时代中国特色社会主义思想概论
形式与政策 大学生心理健康教育与安全教育 大学体育 大学英语 大学计算机 军事理论 军事技能 大学生国家安全教育 python程序设计 大学生创新创业教育 职业生涯与发展规划 就业指导 劳动教育 大学数学
查全率recall ratio:从检索系统中找到的相关结果量与检索系统中相关结 果量的比率。
查准率precision ratio:从检索系统中找到的相关结果量与找到结果总量 的比率。
漏检率、误检率、检索速度等
(1)逻辑“与”: 用AND(或*)表示) (2)逻辑“或”: 用OR(或+,或l)表示) (3)逻辑“非”: 用NOT(或-)表示
存储过程
分析 分析
文献信息 特征
标引著录
选用
题名:信息素养与信息检索 作者:周建芳
检索 语言
和
名称 规范
形成
文献信息 标识
形成
(标引词)
形成 检索提问
标识 (检索词)
输出 检索系统 (标识匹和类名来表达信息内容的主题概念, 并将各种概念按学科性质和逻辑层次结构进行 分类和系统排序的语言。(中国图书馆分类法)
统计分析,得出结论
调整检索方式
健康服务与管理 CNKI,VIP,万方……
主题检索 循环法 实施检索 查找信息 获取原始文献 定行定量分析 统计分析,得出结论
扩大检索范围: 1.使用布尔逻辑检索“或”“OR” 2.使用模糊检索 3.改为上位词 4.减少限制条件 5.使用多个检索数据库
信息检索基础知识

100%
信息检索效果的评价
评价指标:
漏检率
漏检率
漏检相关文献量 系统中相关文献总量
100%
误检率
误检率
误检文献量 检出文献总量
100%
影响检索效果的主要原因
信息系统组织结构、检索系统功能 问题
检索策略、检索方法问题
提高检索效果的措施
熟悉各种信息系统特征 认真分析课题需求 灵活掌握பைடு நூலகம்索方法和提高制定检索
What’s searching like? “Finding a needle in a haystack”
信息检索的定义
信息检索
➢ 广义的信息检索(信息的存储与查询) ➢ 狭义的信息检索
一个匹配( Match)过程 即用户使用检索语言对自己的信息需
求予以描述,并在一定的信息资源 系统中进行描述匹配的过程。
课题检索的类型:
➢ 查全型:开题报告、综述等 ➢ 查准型:在具体细微的专业问题方面的研究 ➢ 动态型:新技术、新理论的研究 ➢ 查新型:同类研究项目比较
信息检索效果的评价
评价指标: 查全率(检全率)
检全率
检出相关文献量 系统中相关文献总量
100%
查准率(检准率)
检准率
检出相关文献量 检出文献总量
策略的能力
信息检索的步骤
分析研究课题 制定检索需求描述 调整检索策略 索取原始文献
分析研究课题
明确以下问题:
➢ 分析客体的主要内容以及所涉及的知识点
➢ 明确所需要的文献种类、语种、年代以及 文献量。
➢ 明确对查新、查准、查全的指标要求以及 侧重点
确定所需要的文献应该具备的内外部特征。
分析研究课题
大一信息检索知识点总结

大一信息检索知识点总结信息检索是指通过计算机技术和各种检索方法,从大规模文献资源中快速、准确地获取用户所需信息的过程。
在大一学习信息管理与信息系统专业的过程中,我们需要了解一些关键的信息检索知识点。
本文将对大一信息检索的相关知识进行总结,帮助同学们更好地理解和掌握这一领域的基础知识。
一、信息检索的基本概念与原理(1)信息检索的定义:信息检索是指根据用户的需求,在文献、数据库和其他信息资源中寻找与之相符合的信息的过程。
(2)信息检索的基本原理:包括索引构建和检索处理两个阶段。
索引构建阶段将信息资源进行结构化整理,并建立相应的索引表;检索处理阶段通过用户提供的检索词,结合索引表,通过匹配算法找到与之相关的信息资源。
二、信息检索的关键技术(1)词项选择与权重计算:根据用户需求,选择合适的检索词,并使用权重计算方法为词项赋予合适的权重,提高检索效果。
(2)检索模型:包括布尔模型、向量空间模型和概率模型等不同的模型,用于描述检索系统中信息资源与用户需求之间的匹配关系。
(3)评价指标:用于评价检索系统的性能,常见的指标包括召回率、准确率以及F值等。
(4)查询扩展:通过对用户查询词进行扩展,提高检索系统的召回率和准确率。
三、信息检索的常用工具和技术(1)搜索引擎:如百度、谷歌等,通过互联网收集、分析并索引网页信息,为用户提供搜索服务。
(2)数据挖掘:通过对大规模数据进行模式识别和深入分析,挖掘其中有价值的信息,为决策提供支持。
(3)文献管理工具:如EndNote、NoteExpress等,用于管理、组织和检索学术文献。
(4)信息可视化技术:通过可视化手段,将海量的信息以直观的方式展示给用户,提高信息的理解和使用效率。
四、信息检索的应用领域(1)图书馆信息服务:包括文献检索、馆藏资源管理、读者咨询等。
(2)企业信息管理:包括企业知识管理、产品信息检索、竞争情报等。
(3)科学研究与学术交流:通过信息检索工具,快速获取相关领域的最新研究进展和学术成果。
信息检索mooc知识点梳理

信息检索mooc知识点梳理第一节认识信息素养1.1课程导入:从文献检索到信息素养1984年高校开课以来主要以纸质文献为主,命名为文献检索,随着互联网的开展,信息形式容的变化,开展到信息检索。
随着互联网的进一步开展,超越检索的阶段,上升到信息素养,信息素养是终身学习的核心。
获取和利用信息基于信息解决问题是本科的根本思路。
1.3信息素养的逻辑框架信息素养的六种能力:1.信息需求识别能力〔具体问题具体分析,知道有哪些信息,学会找攻略〕2.信息检索能力〔靠谱的搜索系统,万不得已不用综合类搜索引擎;搜索技巧,提高检索效率质量,高级搜索语法等〕3.信息获取能力4.信息评价能力〔对信息本身的评价,基于信息评价其他〕5.信息管理能力6.应用信息的能力。
三个根底:信息知识,信息伦理,信息意识。
信息知识是指与信息检索相关的根本概念;信息伦理是信息生产利用过程必须遵守的伦理要求;信息意识指人们对信息敏锐的感受力判断力洞察力。
知识重构:基于信息解决问题的时候能够将信息检索的结果,方法,思路,探究的过程融入到自己的知识体系和能力体系之中。
信息素养的定语:通过信息知识、意识、伦理来确定、获取、检索、管理、评价、应用信息来解决问题,重构知识体系的综合能力根本素质。
1.4信息素养与效率提升1.有助于摆脱传统思维方式的羁绊〔思维方式在变,效率也在提升〕2.有助于找到解决问题的方法〔查找攻略,提供线索和思路〕3.有助于找到更好的工具4.有助于整合资源1.6信息素养与终身学习斜杠青年:多重职业多重身份;两者关系:①信息素养的定义中蕴含着终身学习的理念〔知识体系的重构就是学习的过程〕②学习的过程本身也是不断解决问题的过程。
信息素养实现终身学习的重要条件。
1.8信息素养与探究精神信息素养与探究精神相辅相成确定信息检索信息获取信息评价信息管理信息应用信息信息素养是探究的根底第二节网络资源干货多2.1导言把遇到的问题转换为具体的信息需求〔识别信息需求的前提是知道有哪些信息〕2.2除了剁手,电商的另一种玩法如何快速了解知识?电商信息让我们方便快捷的获取信息在关键的时候想并恰当的利用电商信息〔电商网信息:信息丰富多种多样,贴近市场贴近实际,人性化〕2.3问答社区中的个体智慧巧用知乎解决问题〔突破常规方法〕特点:①围广问题答复多②答复有深度③彰显个体的智慧④表达了群体的力量⑤知识社交良性聚合PS:美国版“知乎〞quora2.4专业网络论坛,找到属于你的圈子论坛社区里面积累了大量的信息资源值得探索挖倔〔论坛社区:大家论坛、果壳网、沪江英语、大耳朵英语、经管之家、丁香园、小木虫〕2.5在线视频课程,终身学习的加油站充分利用互联网上的课程资源可以充分解决问题,通过互联网可以获取名校公开课〔爱课程,iTunesU,网易云,mooc〕2.6好用的APP,你不容错过手机APP成为获取信息的重要渠道〔得到,KEEP,下厨房,TED,领英〕2.7微信公众号,资源发现的重要入口〔高效率工具收罗,干货分享录,好玩的数学〕公众号特点〔①主题比拟明确②干货知识多③互动性比拟强〕如何找好的公众号〔知乎,积极探索,留意微信公众号推荐平台〕2.8网络文库,找到你需要的文档百度文库,豆丁网,道客巴巴,IT168〔注意带有知识产权的文档〕2.9网络百科,你的实用知识库随着互联网普及,知名的百科全书大都有了在线的版本。
知识点归纳 信息检索中的检索模型与推荐算法

知识点归纳信息检索中的检索模型与推荐算法信息检索中的检索模型与推荐算法信息检索是指从大量的信息库中检索出用户所需信息的过程。
在信息检索中,检索模型和推荐算法起着至关重要的作用,能够帮助用户高效地获取所需信息。
本文将对信息检索中的检索模型和推荐算法进行归纳总结,以期帮助读者更好地理解和应用这些知识点。
一、检索模型1. 布尔模型布尔模型是信息检索中最简单和最早的检索模型之一。
它将文档表示为布尔向量,其中每个维度表示文档中是否包含对应的关键词。
用户提交的查询也被表示为布尔向量,然后使用布尔运算(如与、或、非)来匹配查询和文档,以确定相关文档。
2. 向量空间模型向量空间模型是信息检索中广泛应用的一种模型。
它将文档和查询都表示为向量,其中向量的每个维度表示对应的关键词的权重。
通过计算文档向量和查询向量之间的相似度,可以确定相关文档。
常用的相似度计算方法包括余弦相似度和修正的余弦相似度。
3. 概率检索模型概率检索模型是一种基于统计概率的检索模型。
它考虑了查询出现在文档中的概率,以及查询和文档之间的相关性。
常见的概率检索模型包括布尔模型的扩展(如Okapi模型),以及基于语言模型的检索方法(如BM25模型)。
4. 语义检索模型语义检索模型是一种基于语义理解的检索模型。
它通过将查询和文档表示为语义向量,以捕捉词语之间的语义关系。
常用的语义检索模型包括基于词向量的方法(如word2vec模型)和基于句子向量的方法(如BERT模型)。
二、推荐算法1. 协同过滤推荐算法协同过滤是一种常用的推荐算法,根据用户的历史行为和其他用户的行为进行推荐。
它可以分为基于用户的协同过滤和基于物品的协同过滤。
基于用户的协同过滤根据用户的兴趣和行为推荐相似兴趣的其他用户喜欢的物品,而基于物品的协同过滤则根据用户的历史行为和物品的相似性推荐相似的物品。
2. 内容过滤推荐算法内容过滤是一种基于物品特征的推荐算法,根据物品的属性和用户的偏好进行推荐。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
8.什么是计算机信息检索?所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。
实质上计算机信息系检索是利用计算机信息检索系统存储和查找信息的技术,是计算机硬件资源、系统软件、检索软件和数据库的综合。
9.计算机信息检索的类型:(1)根据检索系统的工作方式,可分为:a).脱机信息检索脱机信息检索是利用单台计算机的输入装置进行检索的系统,用磁带作为存储介质,并且为连续的顺序检索方式,适合大批量的定题信息检索。
b).联机信息检索联机信息检索是利用计算机终端设备,通过通信线路或网络,与世界上的信息检索系统相连,从信息检索系统的数据库中进行检索并获取信息的过程。
联机检索模式是主从式,即为所有的工作都在主机上进行,主机负担重,一旦主机瘫痪,整个系统都将处于瘫痪状态,因此对主机的性能要求极高。
c).光盘信息检索d).网络信息检索(2)根据信息的服务方式,可分为:a).定题检索定题检索是用户根据课题的要求,事先编写出逻辑检索提问式,并将存储在计算机的存储器中,每次系统加入新的信息,系统便会按检索要求,找出用户所需的资料,并把结果分给用户,用户能及时得到最新的文献信息。
具有定期性、新颖性和批处理性的特点。
b).回溯检索回溯检索是追溯查找过去的信息,让用户一次检索一段时间内与某一课题有关的信息。
也可以查找最新的信息,可以适应多数用户的查询需要。
c).日常检索10.计算机信息检索技术初级检索6个1)布尔逻辑检索2)位置限制检索3)短语检索4)截词检索5)字段限制检索6)区分大小写检索11.计算机信息检索技术高级检索6个1)加权检索2)自然语言检索3)相关信息反馈(相似检索)4)概念检索5)模糊检索6)聚类检索布尔逻辑检索(1)逻辑与用AND或*表示检索式写作A AND B或A *B(2)逻辑或用“OR”或“+”表示(3)逻辑非用NOT 或—表示 A NOT B (A当中除去B所剩下的)字段名称及缩写AB abstract TI title AU author JN journal nameLA language PY publication year SP source publication分类和聚类的异同相同点:基于“类”的思想进行检索。
不同点:(1)分类基于分类法,其类目体系主要是先组式,有系统性的。
类目与文献之间具有相对独立性。
而聚类则先有文献后聚类,类的性质及整体类目体系完全由系统中的文献决定。
(2)从类目形成过程看,分类是总到分,聚类由分到总。
会构建检索式(主要是积木型)12.计算机信息检索策略含义狭义的计算机信息检索策略是指检索提问式的构建,即运用系统特定的检索技术,确定检索词之间的逻辑关系,形成表达用户信息需求的检索提问式。
广义的计算机信息检索策略是指在分析检索课题的实质内容和明确检索目标的基础上,选择检索工具,确定检索途径与检索用词,以及检索词之间逻辑关系与查找步骤最佳方案的一系列科学安排。
13.计算机信息检索策略类型(即联机检索五原则)(1)最专指面优先:从最专指的概念入手(2)最低登录量面优先(3)积木型(重点掌握,会构建此检索式)(4)引文珠型增长(5)逐次分馏14.网络信息资源的评价方法:(1) 定性评价法:是指按照一定的评价标准从主观角度对网络信息资源所做的优选和评估,主要有指标体系法和调查表法。
(2) 定量评价法:国内外比较典型的定量评价方法有信息计量法、层次分析法和对应分析法等三种。
(3) 综合评价法:是定性评价和定量评价相结合的一种方法,有包括分析法、模糊综合评价法等。
(4) 分类方法:分为第三方评价法、用户评价法和网络计量法。
15.搜索引擎的类型:(1) 按检索机制划分:检索型、目录型和混合型检索工具(2) 按检索内容划分:综合型、专题型和特殊型检索工具(3) 按包含检索工具数量划分:单独型和集合型检索工具(4) 按检索资料类型分:万维网检索工具和非万维网检索工具16.元搜索引擎的含义所谓元搜索引擎,是对分布于网络的多种检索工具的全局控制机制,它通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作。
17.元搜索引擎的特点:(1) 虚拟索引数据库(2) 查全率高(3) 用户界面友好(4) 适宜二次加工(5) 扩展性好18.元搜索引擎的工作原理19.实现跨语言信息检索的方法:(1)提问式翻译方法(2)文献翻译方法(唯一结果是源语言描述)(3)提问式—文献翻译方法(将查询语言提问式翻译成目标语言提问式,与目标语言描述的信息库进行匹配,检索相关信息,然后再把检索结果的全部或部分内容翻译成查询语言描述的信息。
检索结果一般选择部分翻译,这样工作量较小,容易提高翻译的效率和质量,部分翻译一般是对结果文本的前两行、文摘或文本中重要的词进行翻译,在重要词的翻译中,如何确定重要词是决定这种方法效果的关键。
(4)中间语种翻译方法(5)非翻译方法20.语义网的应用(1)Web服务(2)智能信息检索(3)基于语义的网页搜索引擎(4)企业数据管理21.Ei收录论文的两个层次(1)Compendex数据。
数据的内容全面,主要包括:论文标题;作者;作者单位;英文文摘;论文所在期刊名称;卷,期;论文页码;分类码;主题词等等。
其中:分类码;主题词需要专业人员单独给出。
(2)Page One数据:数据内容主要包括:论文标题;作者;作者单位;论文所在期刊名称;卷,期;论文页码;少数数据带有英文文摘。
不需要任何专业人员再做工作。
pendex数据和Page One数据的主要区别在于:数据中是否有分类码和主题词;有这两项内容的数据是Compendex数据,反之是Page One数据。
有没有主题词和分类号是判断论文是否被Compendex数据正式收录的唯一标志。
23.主题指南按字母顺序列出与分类表中类目名称相关的主题词,并注明相关的分类号,实际上是分类表的主题索引,是从分类途径检索文献的指南。
便于不能确定分类号的读者实现从主题查到分类号,再由分类号查到文献所在页码。
24.SCI(科学引文索引)的编制结构及检索方法(1)引文索引(2)来源索引(3)机构索引(4)轮排主题索引25.如何决定收录期刊的数量和种类?(1)“加菲尔德文献集中定律”——确定适宜的期刊数量该定律认为:在几万种科技期刊中,最重要的期刊(即核心期刊)不过一千种,甚至可能还不足500。
因而,把收录期刊的范围定在3000种以内,足以把重要的科技文献包括在内。
(2)“费用—效果原则”——用来选择每一种期刊,具体方法是“引用频率统计法”先计算一种期刊在一年内被引用的总次数,再计算其中每篇论文的平均引文章,其他因素对引文章的影响通过加某些修正系数来解决,引用频率越高,说明该刊质量越高。
通过上述两个指标决定了收录期刊的数量和种类26.什么是专利?这种受法律保护的发明就称专利。
含义:专利权——法律受专利法保护的发明创造——专利技术专利说明书等专利文献——文献这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体表现。
27.什么是同族专利?同族专利指同一个发明为了在不同国家得到保护,而在这些国家分别申请的一系列内容相同或基本相同的专利。
由于同族专利或相同专利都具有相同的优先权项,所以通过优先权项可以方便、快捷地检索出有关同一发明的全部相同专利或同族专利。
28.专利的类型(1)发明专利(2)实用新型专利(3)外观设计专利(4)植物性专利(5)防卫性专利知识产权:工业产权和著作产权29.学位论文的文献价值:(1)较高价值的一次文献:写作不受篇幅限制,论述详尽:从研究背景、技术线路、实验方法到数据获取、分析结论论述翔实。
(2)珍贵的信息资源价值:能集中反映所在单位的科研领域、学术活动、研究进展和最新成果,论文的使用者可以跟踪名校导师的科研进程。
(3)综述性二次文献:对相应研究领域有系统深入的讨论和综述,拥有详尽的参考文献,可得到课题研究现状综述。
(4)写作技巧的启发蓝本:通过对学位论文的阅读,可大致梳理出作者的写作思路和研究方法,学习学位论文的写作方法。
30.信息检索评价方法(1)测试文档集合法(2)人机交互(3)用户体验日志分析法(4)自然观察法31.召回率:R=(检索出的相关文献量/ 数据库中的全部相关文献)x100%准确率:P=(检索出的相关文献量/ 检出的文献总量)x100%32.平均准确率(并会计算)平均准确率是一个通过所有相关文献测定系统绩效的单值指标。
如果检索系统能快速返回所需的相关文献,并对被检文献进行等级排序,则该系统的性能较好。
平均准确率是求各个相关文献准确率的平均值。
因此平均准确率的计算只考虑相关文献的数量,而与检出文献的总量无关。