信息检索知识点
信息检索知识点

信息检索知识点信息检索是指从大规模的信息资源中,通过利用各种信息检索工具和技术,准确和高效地找到用户所需要的信息的过程。
信息检索技术在现代社会中扮演着重要的角色,它不仅广泛应用于互联网搜索引擎,还在图书馆、数据库、企业信息管理等领域发挥着重要作用。
本文将介绍信息检索的定义、关键概念和一些常用技术。
一、信息检索的定义和目标信息检索是指通过计算机等工具从大规模的信息资源中,按照用户的需求进行检索,提供相关性高、准确性好的信息结果。
它的目标是帮助用户快速地找到所需的信息,提升信息搜索效率和准确性。
二、关键概念1. 查询:用户提交的检索请求,通常由一系列关键词组成。
2. 检索词:查询中使用的关键字或关键词短语。
3. 检索结果:根据查询返回的与之相关的文档或信息。
4. 相关性:衡量检索结果与查询之间相关程度的指标,通常使用相关性排序算法进行排序。
5. 文档:信息资源的基本单位,可以是网页、文章、图片、音频等形式。
三、信息检索的主要技术1. 分词技术:将文本数据按照一定规则分割成有意义的词语,是信息检索的基础步骤。
2. 索引技术:将文档中的关键词与其所在位置进行索引,以提高检索效率和准确性。
3. 倒排索引:根据关键词构建索引表,记录关键词与文档之间的对应关系,常用于搜索引擎等场景。
4. 相似度计算:根据查询和文档的相似性,为检索结果进行排序。
5. 结果评估:通过评估检索结果的质量,改进检索算法和模型。
四、常用的信息检索模型1. 布尔模型:将查询和文档转化为布尔表达式,按照布尔运算进行检索。
2. 向量空间模型:用向量表示文档和查询,通过计算向量之间的相似度进行检索。
3. 概率检索模型:基于统计方法,利用概率模型进行信息检索。
五、信息检索的挑战和发展方向1. 大规模数据处理和存储:随着互联网的快速发展,信息资源呈指数级增长,如何高效地处理和存储大规模的数据成为了一个挑战。
2. 多语言检索:不同语言的信息检索在跨语言信息检索中面临很大的难度和挑战。
信息合格考知识点总结

信息合格考知识点总结信息合格考(Information Literacy Test)是一种用来测评人们信息素养水平的考试,旨在帮助人们提高信息获取、评估和利用的能力。
信息合格考知识点涉及到信息检索、信息可信度评估、学术写作、信息利用等方面的知识。
下面我将对这些知识点进行总结,以便考生能更好地备考。
一、信息检索1.检索工具信息检索是指通过各种渠道获取信息的过程。
在信息合格考中,考生需要掌握常见的检索工具,包括图书馆信息系统、各类数据库、搜索引擎等。
了解这些检索工具的特点和使用方法对于考生来说至关重要。
2.检索策略在进行信息检索之前,考生需要根据自己的信息需求制定检索策略。
这包括确定关键词、使用搜索运算符、筛选检索结果等。
了解如何进行有效的信息检索是信息素养的重要组成部分。
二、信息可信度评估1.可信度评估的要素在信息合格考中,考生需要了解如何评估信息的可信度。
这包括考虑信息的来源、发布者、内容、时效性等因素。
了解如何评估信息的可信度对于避免受到错误或误导性信息的影响至关重要。
2.信息伦理信息合格考还会涉及到信息伦理的知识点。
这包括版权、引用规范、信息共享的伦理问题等。
了解信息伦理对于考生来说同样至关重要。
三、学术写作1.文献引用在学术写作中,文献引用是非常重要的。
考生需要了解如何进行正确的文献引用,并掌握常见的引用格式。
这包括APA、MLA、Chicago等不同的引用风格。
2.学术诚信在信息合格考中,考生需要了解什么是学术诚信,避免剽窃、造假等违反学术规范的行为。
了解学术诚信对于提高信息素养水平至关重要。
四、信息利用1.信息组织对于获取到的大量信息,考生需要了解如何进行信息组织。
这包括制作笔记、制作概要、整理文献等。
了解信息组织对于提高信息利用能力非常重要。
2.知识传递在信息合格考中,考生还需要了解如何将获取到的信息传递给他人。
这包括制作PPT、写作报告、进行口头表达等。
了解知识传递对于信息利用能力的提高也是非常重要的。
信息检索知识点

信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找;2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息;3.为什么说信息存储和检索是两个不可分割的有机体检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的;存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较;检索过程是存储过程的逆过程;因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来;4.信息检索的方法1顺查法2倒查法3抽查法4追溯法5循环法5.信息检索的途径1内部特征途径a)分类途径b)主题途径2外部特征途径a)题名途径b)着者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:1简单,形式简洁,易于理解;2 可操作性强,应用广泛;3 构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;4 能处理结构化提问;缺点:1表达用户复杂需求效果欠佳2准确匹配无法提供定量比较3匹配标准不尽合理4检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的;8.什么是计算机信息检索所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程;实质上计算机信息系检索是利用计算机信息检索系统存储和查找信息的技术,是计算机硬件资源、系统软件、检索软件和数据库的综合;9.计算机信息检索的类型:(1)根据检索系统的工作方式,可分为:a.脱机信息检索脱机信息检索是利用单台计算机的输入装置进行检索的系统,用磁带作为存储介质,并且为连续的顺序检索方式,适合大批量的定题信息检索;b.联机信息检索联机信息检索是利用计算机终端设备,通过通信线路或网络,与世界上的信息检索系统相连,从信息检索系统的数据库中进行检索并获取信息的过程;联机检索模式是主从式,即为所有的工作都在主机上进行,主机负担重,一旦主机瘫痪,整个系统都将处于瘫痪状态,因此对主机的性能要求极高;c.光盘信息检索d.网络信息检索(2)根据信息的服务方式,可分为:a.定题检索定题检索是用户根据课题的要求,事先编写出逻辑检索提问式,并将存储在计算机的存储器中,每次系统加入新的信息,系统便会按检索要求,找出用户所需的资料,并把结果分给用户,用户能及时得到最新的文献信息;具有定期性、新颖性和批处理性的特点;b.回溯检索回溯检索是追溯查找过去的信息,让用户一次检索一段时间内与某一课题有关的信息;也可以查找最新的信息,可以适应多数用户的查询需要;c.日常检索10.计算机信息检索技术初级检索6个1)布尔逻辑检索2)位置限制检索3)短语检索4)截词检索5)字段限制检索6)区分大小写检索11.计算机信息检索技术高级检索6个1)加权检索2)自然语言检索3)相关信息反馈相似检索4)概念检索5)模糊检索6)聚类检索布尔逻辑检索(1)逻辑与用AND或表示检索式写作A AND B或A B(2)逻辑或用“OR”或“+”表示(3)逻辑非用NOT 或—表示 A NOT B A当中除去B所剩下的字段名称及缩写AB abstract TI title AU author JN journal nameLA language PY publication year SP source publication分类和聚类的异同相同点:基于“类”的思想进行检索;不同点:1分类基于分类法,其类目体系主要是先组式,有系统性的;类目与文献之间具有相对独立性;而聚类则先有文献后聚类,类的性质及整体类目体系完全由系统中的文献决定;2从类目形成过程看,分类是总到分,聚类由分到总;会构建检索式主要是积木型12.计算机信息检索策略含义狭义的计算机信息检索策略是指检索提问式的构建,即运用系统特定的检索技术,确定检索词之间的逻辑关系,形成表达用户信息需求的检索提问式;广义的计算机信息检索策略是指在分析检索课题的实质内容和明确检索目标的基础上,选择检索工具,确定检索途径与检索用词,以及检索词之间逻辑关系与查找步骤最佳方案的一系列科学安排;13.计算机信息检索策略类型即联机检索五原则(1)最专指面优先:从最专指的概念入手(2)最低登录量面优先(3)积木型重点掌握,会构建此检索式(4)引文珠型增长(5)逐次分馏14.网络信息资源的评价方法:(1) 定性评价法:是指按照一定的评价标准从主观角度对网络信息资源所做的优选和评估,主要有指标体系法和调查表法;(2) 定量评价法:国内外比较典型的定量评价方法有信息计量法、层次分析法和对应分析法等三种;(3) 综合评价法:是定性评价和定量评价相结合的一种方法,有包括分析法、模糊综合评价法等;(4) 分类方法:分为第三方评价法、用户评价法和网络计量法;15.搜索引擎的类型:(1) 按检索机制划分:检索型、目录型和混合型检索工具(2) 按检索内容划分:综合型、专题型和特殊型检索工具(3) 按包含检索工具数量划分:单独型和集合型检索工具(4) 按检索资料类型分:万维网检索工具和非万维网检索工具16.元搜索引擎的含义所谓元搜索引擎,是对分布于网络的多种检索工具的全局控制机制,它通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作;17.元搜索引擎的特点:(1) 虚拟索引数据库(2) 查全率高(3) 用户界面友好(4) 适宜二次加工(5) 扩展性好18.元搜索引擎的工作原理19.实现跨语言信息检索的方法:1提问式翻译方法2文献翻译方法唯一结果是源语言描述3提问式—文献翻译方法将查询语言提问式翻译成目标语言提问式,与目标语言描述的信息库进行匹配,检索相关信息,然后再把检索结果的全部或部分内容翻译成查询语言描述的信息; 检索结果一般选择部分翻译,这样工作量较小,容易提高翻译的效率和质量,部分翻译一般是对结果文本的前两行、文摘或文本中重要的词进行翻译,在重要词的翻译中,如何确定重要词是决定这种方法效果的关键;4中间语种翻译方法5非翻译方法20.语义网的应用(1)Web服务(2)智能信息检索(3)基于语义的网页搜索引擎(4)企业数据管理收录论文的两个层次(1)Compendex数据;数据的内容全面,主要包括:论文标题;作者;作者单位;英文文摘;论文所在期刊名称;卷,期;论文页码;分类码;主题词等等;其中:分类码;主题词需要专业人员单独给出;(2)Page One数据:数据内容主要包括:论文标题;作者;作者单位;论文所在期刊名称;卷,期;论文页码;少数数据带有英文文摘;不需要任何专业人员再做工作;数据和Page One数据的主要区别在于:数据中是否有分类码和主题词;有这两项内容的数据是Compendex数据,反之是Page One数据;有没有主题词和分类号是判断论文是否被Compendex数据正式收录的唯一标志;23.主题指南按字母顺序列出与分类表中类目名称相关的主题词,并注明相关的分类号,实际上是分类表的主题索引,是从分类途径检索文献的指南;便于不能确定分类号的读者实现从主题查到分类号,再由分类号查到文献所在页码;科学引文索引的编制结构及检索方法(1)引文索引(2)来源索引(3)机构索引(4)轮排主题索引25.如何决定收录期刊的数量和种类1“加菲尔德文献集中定律”——确定适宜的期刊数量该定律认为:在几万种科技期刊中,最重要的期刊即核心期刊不过一千种,甚至可能还不足500;因而,把收录期刊的范围定在3000种以内,足以把重要的科技文献包括在内;2“费用—效果原则”——用来选择每一种期刊,具体方法是“引用频率统计法”先计算一种期刊在一年内被引用的总次数,再计算其中每篇论文的平均引文章,其他因素对引文章的影响通过加某些修正系数来解决,引用频率越高,说明该刊质量越高;通过上述两个指标决定了收录期刊的数量和种类26.什么是专利这种受法律保护的发明就称专利;含义:专利权——法律受专利法保护的发明创造——专利技术专利说明书等专利文献——文献这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体表现;27.什么是同族专利同族专利指同一个发明为了在不同国家得到保护,而在这些国家分别申请的一系列内容相同或基本相同的专利;由于同族专利或相同专利都具有相同的优先权项,所以通过优先权项可以方便、快捷地检索出有关同一发明的全部相同专利或同族专利;28.专利的类型(1)发明专利(2)实用新型专利(3)外观设计专利(4)植物性专利(5)防卫性专利知识产权:工业产权和着作产权29.学位论文的文献价值:(1)较高价值的一次文献:写作不受篇幅限制,论述详尽:从研究背景、技术线路、实验方法到数据获取、分析结论论述翔实;(2)珍贵的信息资源价值:能集中反映所在单位的科研领域、学术活动、研究进展和最新成果,论文的使用者可以跟踪名校导师的科研进程;(3)综述性二次文献:对相应研究领域有系统深入的讨论和综述,拥有详尽的参考文献,可得到课题研究现状综述;(4)写作技巧的启发蓝本:通过对学位论文的阅读,可大致梳理出作者的写作思路和研究方法,学习学位论文的写作方法;30.信息检索评价方法(1)测试文档集合法(2)人机交互(3)用户体验日志分析法(4)自然观察法31.召回率:R=检索出的相关文献量/ 数据库中的全部相关文献x100%准确率:P=检索出的相关文献量/ 检出的文献总量x100%32.平均准确率并会计算平均准确率是一个通过所有相关文献测定系统绩效的单值指标;如果检索系统能快速返回所需的相关文献,并对被检文献进行等级排序,则该系统的性能较好;平均准确率是求各个相关文献准确率的平均值;因此平均准确率的计算只考虑相关文献的数量,而与检出文献的总量无关;。
信息检索初步知识点总结

信息检索初步知识点总结信息检索是指利用计算机系统来检索和获取文档或者信息资源的技术和方法。
在当今信息爆炸的时代,信息检索具有非常重要的意义。
信息检索系统可以帮助人们快速准确地获取所需要的信息资源,不仅可以提高工作和学习效率,还可以帮助人们更好地利用信息资源。
在信息检索中,有一些基本的知识点是非常重要的,下面我将对这些知识点进行总结。
1. 信息检索的概念和发展历史信息检索是指从信息库中按照一定的要求来搜索、检索信息的过程。
它主要是利用计算机技术来实现信息的存储、检索和利用。
信息检索的发展可以追溯到20世纪50年代,随着计算机技术的发展,信息检索技术也得到了很大的发展。
现代信息检索系统不仅能够实现文档的存储和检索,还可以实现自然语言处理、信息抽取、信息过滤等功能。
2. 信息检索的基本过程信息检索的基本过程包括信息需求分析、文档表示和查询处理、检索模型和算法、评价和反馈等几个方面。
其中,信息需求分析是整个信息检索过程的第一步,它包括对用户的信息需求进行分析和建模,确定用户的检索目标和检索词,为后续的检索准备工作做好准备。
文档表示和查询处理是指对文档和查询进行适当的表示和处理,以便计算机系统能够理解和利用。
检索模型和算法是指根据文档和查询的表示,计算出相关度得分,以确定文档的相关性。
最后,评价和反馈是指对检索结果进行评价和反馈,以优化检索系统的性能。
3. 信息检索的技术手段信息检索的技术手段主要包括文本索引技术、全文搜索技术、信息抽取技术、信息推荐技术等几个方面。
其中,文本索引技术是指将文档中的关键词进行索引,以便计算机系统能够快速地定位到相关的文档。
全文搜索技术是指利用全文索引进行搜索,可以实现对文档中所有内容的搜索。
信息抽取技术是指从文档中抽取出有用的信息,以便为用户提供更精确的搜索结果。
信息推荐技术是指根据用户的行为和偏好,为用户推荐相关的信息资源。
4. 信息检索的评价指标信息检索的评价指标主要包括召回率、准确率、F值、MAP值等几个方面。
信息检索考试大一下知识点

信息检索考试大一下知识点信息检索是指从大量的信息中快速找到满足特定需求的信息过程。
在大一下学期的信息检索考试中,通常会涉及以下几个知识点:一、信息检索基础概念1. 信息检索的定义和目的信息检索是指通过使用计算机技术,在海量信息中寻找到与用户需求相匹配的信息。
其目的是快速、准确地获取到用户所需的信息。
2. 检索模型和流程信息检索基于检索模型,常见的模型包括布尔模型、向量空间模型和概率模型。
检索流程一般包括问题建模、索引构建、查询处理和结果排序等步骤。
二、关键词检索1. 关键词的选择与组合在进行信息检索时,关键词的选择和组合非常重要。
关键词应该准确描述用户需求,并且能够尽可能覆盖相关领域的信息。
2. 布尔查询与逻辑运算符布尔查询是一种基础的检索方式,通过使用逻辑运算符(AND、OR、NOT)对关键词进行组合,从而获得符合用户需求的信息。
三、索引构建与检索技术1. 逆向索引逆向索引是一种常用的索引结构,它通过将文档中的每个单词与包含该单词的文档进行关联,实现了关键词到文档的快速定位。
2. 向量空间模型向量空间模型将文档和查询都表示为向量,在向量空间中进行计算,通过计算文档与查询之间的相似度来判断文档的相关性。
3. 布尔模型的实现与优化布尔模型的实现与优化涉及到倒排索引的构建与压缩、布尔运算的优化算法等方面的技术。
四、评价与改进1. 检索结果的评价对于检索系统的性能评价,一般使用准确率、召回率、F值等指标来衡量检索的有效性和完整性。
2. 改进方法与技术为了提升检索系统的性能,可以采用词干提取、查询扩展、排名算法优化等方式进行改进。
五、实际应用与发展趋势1. 商业搜索引擎与个性化推荐商业搜索引擎通过不断改进和优化信息检索技术,提供高效准确的搜索服务。
个性化推荐则基于用户的兴趣和行为,向用户推荐符合其需求的信息。
2. 大数据与信息检索随着大数据时代的到来,信息检索面临着处理海量数据的挑战。
如何有效地利用大数据技术来进行信息检索是当前的研究热点之一。
网络信息资源检索与利用 知识点

第一章1、情报定义:情报室人们用来解决特定问题所需要的,经过激活过程活化了的,具有使用价值的知识或信息。
2、文献定义:文献是记录知识的一切载体,即用文字、图形、符号或者声频等技术手段记录知识的物质载体。
或固化在物质载体上的知识。
文献具有三个属性即文献的知识性、记录性、物质性。
3、信息、知识、情报和文献的关系信息是物质存在的方式、形态和运动规律的表征,人脑对物质属性的感知形成信息,信息是起源,是基础;文献是信息、知识、情报的存储载体和重要的传播工具,信息知识和情报的内容只有记录在物质载体上才能构成文献;文献通过传递、应用于理论和实践又会产生新信息。
4、文献信息源文献信息也称文献资源,是用一定的记录手段将系统化的信息内容存储在各类载体上而形成的一类信息源。
5、文献信息源类型按照信息源的载体类型划分:印刷型缩微型声像型电子型按照信息源的加工程度划分:1)零次文献:零次文献是指尚未经过系统整理形成正式文献的零散资料或最原始的记录,如书信、手稿、笔记等。
2)一次文献:一次文献又称原始文献,是作者对自己研究的成果或创造性活动成果的直接记录。
一般是指公开出版的著作,期刊论文、科技报告、会议文献、学位论文、专利文献等。
3)二次文献:二次文献是将大量分散、无序的一次文献经过筛选、分析、整理,按其内容特征和外部特征进行提炼、浓缩,并按照一定的逻辑顺序和科学体系编制而成的系统化的文献。
二次文献包括目录、文摘、索引等,它们是二次文献的核心。
4)三次文献:三次文献是通过二次文献提供的线索,对某一范围的一次文献进行分析、综合研究、归纳、整理等深加工所生成的文献,包括素萍,百科全书、报告、年鉴、手册、字典等。
6、信息检索:广义上说信息检索是指将信息按照一定的方式组织和储蓄起来。
并根据信息用户的需求查找出相关信息的过程。
7、著录:是根据一定的规则,对文献的内容和形式特征进行分析、选择和记录的过程。
8、标引:1)按照标引的的工作方式分类:分为人工标引、计算机辅助标引、自动标引。
大一信息检索与利用考试知识点

大一信息检索与利用考试知识点信息检索与利用是信息科学与技术专业的一门重要课程,旨在培养学生对信息资源进行系统化检索和有效利用的能力。
本文将介绍大一信息检索与利用考试的相关知识点,帮助同学们更好地复习和备考。
一、信息检索基础知识1. 信息检索的定义和基本原理信息检索是指从大量信息中查找和获取所需信息的过程。
其基本原理包括信息需求分析、信息储存与组织、信息检索模型、检索评价等。
2. 关键词的选择和搜索策略在信息检索过程中,关键词的选择和搜索策略起着至关重要的作用。
学生需了解如何选择合适的关键词,并掌握常用的搜索策略,如布尔逻辑检索、通配符检索和短语检索等。
二、信息资源与检索1. 图书馆资源的检索与利用学生需熟悉图书馆资源的分类和编目规则,掌握常用图书馆资源的检索方法,如OPAC检索和图书馆数据库检索等。
2. 学术搜索引擎的使用学生需要了解学术搜索引擎的特点和使用方法,如Google学术、谷歌学术和百度学术等。
掌握高效的检索技巧,如使用引号搜索、高级搜索和文献引用等。
三、文献检索与阅读1. 文献检索的方法和工具学生需了解文献检索的常用方法和工具,如在线数据库检索、文献溯源和文献导航等。
可以根据具体需求选择合适的检索途径。
2. 文献综述的撰写和细节要求学生需要了解文献综述的撰写规范和细节要求,包括引言、方法、结果和讨论等部分的写作技巧和注意事项。
四、信息利用与知识管理1. 信息评估和筛选学生需要学会评估信息质量,判断信息的可信度和适用性,并掌握信息筛选和整理的方法,提高信息利用的效果。
2. 知识管理的基本理论和方法学生需了解知识管理的基本理论和方法,掌握知识管理工具的使用。
熟悉知识流程的各个环节,并学会运用相应的工具进行知识管理。
五、信息检索与利用的伦理问题1. 信息隐私和数据保护学生需了解信息检索与利用过程中产生的隐私问题和数据保护的重要性。
遵守信息伦理规范,保护用户隐私和信息安全。
2. 信息获取和版权保护学生需要了解信息获取的合法途径和版权保护的相关法律法规,学习在信息检索与利用过程中正确引用他人作品的方法和原则。
初中信息技术数据库与信息检索知识点梳理

初中信息技术数据库与信息检索知识点梳理在初中信息技术课程中,学习数据库与信息检索知识是非常重要的。
数据库是存储、组织和管理大量数据的工具,而信息检索是通过关键词检索数据库中的信息。
本文将对初中信息技术的数据库与信息检索知识点进行梳理,以帮助初中生更好地理解和掌握这些知识。
1. 数据库基础知识数据库是指按照一定的数据模型组织、存储和管理数据的集合。
以下是初中生应掌握的数据库基础知识点:(1)数据库的定义和作用:了解数据库的概念并知道数据库的作用,如存储数据、保护数据、提供数据访问等。
(2)数据表和字段:理解数据表的概念,明白字段是数据表中的列,用于存储不同类型的数据。
(3)主键和外键:了解主键的作用是唯一标识数据表中的一条记录,外键是关联两个数据表的字段。
(4)查询语言:掌握简单的查询语言,如使用SELECT语句从数据库中检索数据。
2. 关系型数据库关系型数据库是基于关系模型的数据库,是一种使用表格来表示和存储数据的数据库。
以下是初中生应了解的关系型数据库知识点:(1)关系型数据库的特点:了解关系型数据库具有的特点,如数据表具有固定的结构,支持事务处理等。
(2)关系型数据库的常见数据库管理系统:介绍一些常见的关系型数据库管理系统,如MySQL、Oracle等。
(3)SQL语句:了解SQL语句的基本语法,如创建表、插入数据、更新数据等。
3. 非关系型数据库非关系型数据库是指不遵循关系模型的数据库,通常用于存储大量的非结构化或半结构化数据。
以下是初中生应了解的非关系型数据库知识点:(1)非关系型数据库的特点:了解非关系型数据库的特点,如灵活的数据结构、高可伸缩性等。
(2)非关系型数据库的种类:介绍一些常见的非关系型数据库,如MongoDB、Redis等。
(3)NoSQL语句:了解一些NoSQL数据库的基本操作语句,如插入数据、查询数据等。
4. 信息检索基础知识信息检索是指通过关键词在数据库中搜索相关信息的过程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机检索1.信息素养(信息素质、信息能力):作为具有IL(information literacy)能力的人,必须能够充分地认识到何时需要信息,并有能力去有效地发现、检索、评价和利用所需要的信息,从而具有终身学习的能力,总能够为任何任务和决策找到所需信息。
2.信息检索广义:指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。
包括存储和检索两个过程。
狭义:从信息集合中找出所需信息的过程。
信息查找(Information Search,Information Seeking)2.1信息现状分析1)信息爆炸导致文献量急剧增加,内容相互渗透,语种增多;文献分布异常分散;文献寿命愈来愈段;2)由于条件限制,人们吸收和利用信息的能力并未得到相应的提高。
3.检索的作用1)促进智力资源的开发;2)协助管理者做出正确的决策;3)帮助科研人员借鉴前人的研究成果,避免重复劳动;4)信息检索是知识更新的手段。
4.数据库类型(1):作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合,以数据库的形式管理和利用。
自建数据库:馆藏目录(OPAC),本校学位论文数据库。
商业性数据库:数据库商、出版商和其他机构以商业化方式提供的各种电子资源,图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群。
免费数据库:开放获取资源、机构典藏和其他免费的网络资源。
5.数据库类型(2)从收录文献的内容分,有综合性数据库和专业性数据库之分;从收录文献的类型分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等;从提供文献的形式分,有全文数据库、文摘数据库、引文数据库;各数据库举例:专业数据库:Petroleum Abstract(PA)、EnCSciFinder Schoiar(CA) 综合性数据库:读秀、Scopus、EI、SCI特定文献类型,如图书、期刊、学位论文等:超星、EIsevier ScienceDirect、PQDT全文数据库:CNKI、维普、SPE摘要性数据库:EI、PA引文数据库:Web of Science、CSSCI(中文社会科学引文索引)6.Science Citation Index Expanded(SCI-E)是个什么样的数据库?它是ISI检索平台中Web of Science核心合集中的一个子库它是一个摘要型数据库它是一个引文数据库它是一个期刊数据库它收录的学科范围包括科学、技术的各学科7.查文献应该如何选择数据库?学科专业:有专业型数据库时,首选专业型数据库;数据量:选择数据量大的;文献类型:根据研究的需要。
如果仅需要某种文献,最好选择该类型的子库;检索功能:准确性高、易用、检索结果的处理能力;分析功能第三章信息资源的分类8.信息存贮载体:印刷型、缩微型、声像型、机读型9.根据加工程度划分零次文献:口头信息、未公开发表的文字资料(手稿、书信、笔记等);时效性强;大量而无序;一次文献:期刊论文、专利文献、科技报告、会议录等;研究人员最终索取的文献;二次文献:检索工具:如SCI、EI、CA、PubMed/Medline三次文献:选用大量有关的文章,经过综合、分析、研究而编写出来的文献;如:综述、评论、评述、进展、动态等;研究人员最终需要的文献。
科研人员与科学信息的获取和利用:研究人员的文献平台可以由二次文献作为入口,满足整体的需求;然后,通过这个入口来获取有用的高质量的全文期刊(一、三次文献)来满足纵深对的研究需要。
10.根据文献编辑出版的特征和范围划分(1)1)科技图书Books(Monograph,Anthology,Textbook,Reference book):内容系统成熟可靠,新颖性较差;学习,教育之用。
2)科技期刊Periodical (Journal,magazine,serial):数量大,覆盖面广,内容新颖,及时;交流,影响广泛,信息价值高。
3)报纸(Newspaper):出版周期更短;获取实事性、政策性信息。
4)政府出版物(Government Publications):源自官方、权威、可靠、价廉;可获取政策性、法规性及科技信息。
5)科技报告(Sci/Tech Report):反映前沿科技、内容新颖、有密级控制。
如:美国政府四大科技报告:PB,AD,NASA,DOE报告。
6)专利文献(Patent Document,Patent specification/bulletin/aids):类型有:专利说明书、专利公报、专利分类表、专利文摘等检索工具。
反映新的技术发明,是重要的技术、经济信息源。
7)会议文献(Conference paper,Proceedings):会议论文集,回忆录,会议资料等;反映最新成果,最新动向,高水平,前沿发展动态。
8)学位论文(Dissertations\Thesis);内容专深,非卖品,有较高学术参考价值。
9)标准文献(Standards):反映成熟技术,掌握技术政策,技术水平,可供研究新产品,改造老产品,改进工艺和操作水平是借鉴。
10)产品资料:形象、直观、新颖、可了解工业水平、产品发展、市场动态等。
11)广告(Advertisement):可及时把握竞争对手最新推出的产品品种,市场卖点。
准确掌握个地区市场的广告竞争态势。
12)技术档案和图纸:技术性,适用性,保密性。
11.检索语言:根据检索需求而编制的检索系统存储与检索共同使用的人工约定语言。
分类:体系分类语言、标题词语言、关键词语言、叙词语言。
12.检索途径:又称检索点,指利用信息的各种内外特征,作为检索出发点,从不同角度来检索信息。
有:分类(Classified):所属学科分类主题(Subject):所属主题内容、关键词著者(Author):团体著者(Corporate Author)名称,题目(Title)代码(Code)13.基本运算符(1)逻辑算符“与”:and 或*例:telecommut? and productiv?逻辑算符“或”:or 或+例:computer or microcomputer逻辑算符“非”:not 或—例:aspartame not beverage14.基本运算符(2):截词符用于解决一些词干相同、词义相近、但词尾或词头不一致的派生词(如有同一词根派生出的名词、动名词、动词、形容词、副词等),或名词的单、复数形式,或痛一次的英美不同拼写形式等词的一次输入。
PQD平台的截词符用?、*和$表示。
截词符?Nurse?—nursed/nurses ad—added/adult/adopt用于替换某个字词中间或结尾的任何一个字符,不能代表没有字符。
截词符* control*—control/controlled/controlling 代替0-10个字符截词符$ $5beat—Upbeat/offbeat/heartbeat 限定截词符用$n 表示,代替0-n个字符。
15.基本运算符(3):位置算符(P/n、N/n)用于限定词与词之间的位置关系,以提高查准率。
当检索词为词组形式时,或两个检索词之间可能被禁用词或标点符号隔开时,均应使用位置算符。
P/0 两个单词中间有一个空格或一个字符,在文献中出现的前后位置不能互换。
Polar P/0 embedded可检索到:polar-embedded或polar embeddedP/1 两个单词中间可能有0-1个单词,在文献中出现的前后位置不能互换。
位置算符P/n与位置算符N/n的用法近似,区别在于前后单词是可以互换的。
16.PQD检索词自动匹配在PQD中检索时,系统会自动匹配单词的单复数,英美拼写变体,形容词比较级最高级等形式。
17.短语检索:“”(双引号检索短语)在PQD中可把短语放在引号内进行精确短语检索,但这种检索方式不能自动匹配。
在PQD中,空格默认为逻辑算符and。
18.字段检索格式:字段名(检索词或检索式)AU(smith)and TI(food):检索标题含有food,作者含有smith 的文章。
多个字段检索时,字段与字段之间用逗号隔开AB,TI(food):检索标题含有food或者摘要含有food的文档。
PQD中,检索式常用限制字段为TI,AB,SU,IF。
PQD中的主题词(SU)字段是系统标引的独立字段。
19.检索策略:指为实现检索目标而制定的检索计划和方案。
检索式是检索策略的具体体现,是指计算机检索中用来表达用户检索提问的逻辑表达式,通常由检索词和各种逻辑算符、截词符、位置算符以及系统规定的其他连接符号等构成。
20.检索的基本步骤1)分析检索课题,明确检索要求,确定检索的主题内容、范围等2)确定检索概念3)选择表达概念的检索词选择所有不同的能够表达检索概念的词使用截词检索各种词尾变化的词使用位置算符指定词组或词间的相对位置关系4)使用逻辑算符组配检索概念,拟定检索表达式5)选择恰当的数据库6)上机检索21.获取全文的方法全文链接按钮、全文数据库、馆际互借、图书馆文献传递、免费全文网站、提供免费全文的期刊,作者E-mail联系或作者主页。
22.检索策略的优化方法(1)扩大命中文献量的方法1)选择其他同义词、相关词、上位词2)去掉一个不太重要的检索信息3)将限制严谨的位置算符改为较宽松的位置算符,或通过and 算符代替位置算符4)取消某些限制过严的后缀符、限制符等5)增加检索途径,将主题途径与非主题途径结合起来使用6)利用截词技术,检索所有相同词干的词7)用E指令扩词以核实拼写8)选择其他数据库进行检索23.检索策略的优化方法(2)缩小命中文献量的方法1)提高检索式的专指度,增加或换用下位词和专指度较强的词2)增加一个检索概念3)将检索式中的and算符改为位置算符;或将较宽松的位置算符改为更严谨的位置算符4)使用后缀限制,将检索词限制在基本索引的“重要”字段中,如规范词字段或题目字段5)用辅助索引的某些字段与主题索引组结合限制检索范围6)截词使用不当24.三大检索系统概况SCI(Science Citation Index)SCI-E(Science Citation Index Expanded)科学引文索引SSCI(Social Science Citation Index)社会科学引文索引A & HCI(Arts & Humanities Citation Index)艺术与人文引文索引CPCI(Conference Proceedings Citation Index)CPCI-S(Conference Proceedings Citation Index-Science)科学会议CPCI-SSH(Conference Proceedings Citation Index-Social Science Citation Index)社会科学与人文艺术会议EI(The Engineering Index)工程索引25.三大检索系统收录质量区别SCI最能反映基础学科研究水平和论文质量检索系统收录的科技期刊比较全面集中各学科高质量优秀论文的精粹成为世界科技密切注视的中心和焦点CPCI、EI这两个检索系统评定科技论文和科技期刊的质量标准相对要宽松CPCI是一种综合性的科技会议文献检索刊物,该检索工具收录包括自然科学、技术科学以及历史与哲学等,覆盖的学科范围广,收录会议文献齐全,而且检索途径多,出版速度快。