计算机复习信息检索

合集下载

计算机信息检索重点

计算机信息检索重点

信息检索数据(Data):泛指所有描述事物的形貌、特性、状态或任何其他属性的数字、文字或符号。

一般指原始,未处理过的数据。

信息(Information):1. 物质存在的一种方式。

一般指数据、消息中所包含的意义。

可以使消息中所描述的事件的不定性减少。

2. 是事物运动的状态与方式的反映。

知识(Knowledge):A、是在改造世界的实践中所获得的认识和经验的总和。

B、是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的有组织的陈述。

提供某种经过思考的判断和某种实验的结果。

(信息是知识的原材料,知识是信息加工的抽象化产物。

)情报(Information):钱学森:“情报是活化了的、激活了的知识”。

可以理解为是指传递着的有特定效用的知识或信息。

三要素:知识性、传递性、效用性文献(Literature):记录有知识的一切载体。

三要素:载体(文献的外部形式,它是知识的包装或运载方式,常称之为媒体(media)。

)、知识(反映了文献的信息内容。

)、记录(信息的一种人工编码,通过人工、机械以及声、光、电、磁等各种技术手段生成多种包含知识信息内容的符号,以一定的形态出现,形成各种媒体的文献类型。

)文献对人类文明进步具有重大意义:知识的积累、传播与创造研究成果的确认与评价信息环境及其认识:信息环境的变化,20世纪90年代中期前,书本时期-----手工检索,缩微时期-----缩微检索,20世纪90年代后期,光盘时期-----单机检索,网络初期-----联机检索21世纪,网络兴盛-----网络检索第一章信息检索原理一、信息检索的含义(掌握)广义:信息检索包括信息的存储过程和查找过程;狭义:仅指信息的查找。

二、信息检索的类型(一、)以检索内容划分(重点)1.文献信息检索凡是利用目录、文摘或索引等二次信息查找某一课题、某一著者、某一地域、某一机构、某一事物的有关信息以及这些信息的出处和收藏单位等,都属于文献信息检索范畴。

信息检索复习题

信息检索复习题

信息检索复习题第1章信息:狭义是指适用通信、存储或处理的形式来表示的知识或消息,即用语言、文字、数字、符号、图像、声音、情景、表情、状态等方式传达的内容。

信息资源是企业生产及管理过程中所涉及的一切文件、资料、图表和数据等信息的总称。

信息资源与企业的人力、财力、物力和自然资源一样同为企业的重要资源,而且是企业发展的战略资源。

文献:是记录知识的一切载体,是指将知识、信息、利用文字、符号、图像、音频等技术手段记录在一定的物质载体上。

文献的三个基本属性:即文献的知识性、记录性和物质性。

它具有储存知识、传递和交流信息的功能。

文献的类型:1、按照文献的载体形态来划分:分为印刷型、微缩型、声像型和电子型。

2、按文献的出版形式划分:分为图书、期刊、会议文献、科技报告、学位论文、技术标准、专利文献。

在正式出版图书封底都有一个ISBN叫国际标准书号。

在正式出版期刊封面都有一个ISSN叫国际标准编码。

特种文献又称丛刊,或不定期的连续出版物,是出版形式比较特殊的一种文献类型。

P5科技报告:记录某一科研项目调查、实验、研究的成果或进展情况的报告,又称研究报告、报告文献。

会议文献:在学术会议上宣读和交流的论文、报告及其他有关资料,会议文献多数以会议录的形式出现,特点:传递情报比较及时,内容新颖,专业型和针对性强,种类繁多,出版形式多样,会议文献分为:会前、会中和会后3中。

政府出版物:各国政府及其所属机构出版的,有官方性质的文献,又称官方出版物,是指有政府机关负责编辑印刷的,并通过各种渠道发送或出售的文字、图片、及磁带、软件等。

其他类型资料:包括产品样品、档案文献、灰色文献和视听资料等。

按照文献产生的次序与被加工整理的深度划分:可将文献分为零次文献、一次文献、二次文献、三次文献。

一次文献:是人们直接以自己的生产、科研、社会活动等实践经验为依据生产出来的文献,也称原始文献,其所记载的知识信息比较新颖、具体、详尽。

信息检索:是指信息按照一定的方式组织起来,并根据信息用户的需要找出有关信息过程和技术,狭义的信息检索是指信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程。

信息检索复习资料

信息检索复习资料

信息检索公选课复习资料1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。

2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。

3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。

4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。

5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。

6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。

7.著录是对文献内容和形式特征进行选择和记录的过程。

8.数据检索是指特定的数值型数据为对象的检索。

9.按信息的加工层次分类:(含义)一次文献:原始文献,图书、报纸、期刊、会议纪录、专利报告等二次文献:目录、题录、索引、文摘三次文献:论文丛集、综述、年鉴百科全书一次信息资源 (原始文献):以作者本人在生产和科研中所取得的成果为依据而创作的原始文献所传递的信息资源。

二次信息资源(检索工具):将分散的、无组织的一次信息资源,按一定的原则加工、整理、简化、组织成为系统的、便于查找利用的信息资源。

三次信息资源(参考性文献):在合理利用二次信息资源的基础上,选用一次信息资源的内容,根据一定的需要、目的进行分析、综合或浓缩重组而得到的信息。

二次信息资源与三次信息资源的区别:对象不同:二次信息资源以“篇”或“本”为单位进行加工;三次信息资源则归纳了较多的一次信息内容用途不同:二次信息资源为检索一次信息的工具;三次信息资源能直接提供检索答案.10. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。

11. 文献检索方法:指文献信息资源的一般检索方法,也是利用各种检索工具检索文献信息资料的最常用的方法。

信息检索复习资料(有答案版)

信息检索复习资料(有答案版)

1.请说明一次文献、二次文献和三次文献的特点和功用。

(1)一次文献(Primary Document):通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。

如期刊论文、科技报告、会议论文、专利说明书(2)二次文献(Secondary Document):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。

二次文献的重要性在于可以帮助人们查找一次文献。

如目录、题录、文摘、索引、各种书目数据库(3)三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。

包括综述研究和参考工具两类。

如综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目2.请说明题录目录文摘的特点以及区别(1)题录是揭示和报导单篇文献外表特征的工具。

特点:以单篇文献为著录对象(2)目录是系统积累和提供图书、期刊和其它单行本的名称、收藏单位和索取号等外表特征的揭示和报导的工具。

特点:以单位出版物为著录对象,反映馆藏情况,主要揭示文献外部特征(3)文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。

特点:带摘要的题录3. 布拉德伏特文献文献分散定律和期刊影响因子的概念(1)布拉德福文献分散定律:本专业文献的1/3刊登在本专业核心期刊上,另外的2/3则分散在其他的相关期刊和边缘期刊上。

如果将科技期刊按其刊载某专业论文数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2......的关系。

(2)期刊影响因子的概念是:某一种期刊在第三年得到的前两年的引文数与该刊前两年的总论文数之比。

4. 请阐述信息、知识、情报的概念,并分析它们三者之间的关系。

第二讲计算机信息检索基础知识

第二讲计算机信息检索基础知识

举例:
【题 名】信息检索技术在网络数据库中的应用研究 【作 者】邹小筑[1] 缪红梅[2] 【机 构】[1]南京大学信息管理系,南京210093 [2]南京航空航天
大学,南京210016 【刊 名】图书情报工作.2007,51(2).-104-106,131 【ISSN号】0252-3116 【关键词】信息检索技术 网络数据库 检索平台 【文 摘】以信息检索技术为脉络,结合Ei Village2、ISI Web of
Knowledge、CSAIDS、EBSCOHost、ProQuestordjne等多个著名 检索平台综合分析布尔逻辑、位置逻辑、模糊检索技术、网络叙 词表构建技术在网络数据库的应用,研究表明信息检索技术已深 深植入网络信息资源管理之中,深入剖析信息检索技术,可以清 晰揭示提问表达式的构建机理,掌握网络数据库的原理及使用方 法,为网络信息资源评价和建设提供依据。
2.选择信息资源
是否与检索课题相关的资源都要检索 选择哪些学科的信息资源 选择哪些语种的信息资源 信息资源覆盖的年限是否符合需求 信息资源的特点及其针对性如何
3、构造检索式 选择检索点
检索式 是表达用户检索提问的逻辑 表达式,由基于检索概念产生的检 索词和各种组配算符构成。
检索点 即检索途径或检索入口、检 索字段。检索点正确与否,决定着 检索结果的数量与质量。
3、字段限制
▪ 指将检索词限定在特定的字段中进行。
• 同样的检索词,选择在不同字段中进行检索, 得到的结果是不同的。
• 检索系统通常都会设置默认的检索字段,如 “所有字段”。如果想指定在特定的字段中 查找检索词,就需要调整检索字段,进行字 段限制。
缺省字段 为“篇名”
缺省字段为 “关键词”
缺省字段为 “All fields”

信息检索 复习资料

信息检索 复习资料

第一部分:基本常识1.文献按照出版形式可分为哪几种类型?举例。

图书、期刊、报纸、特种文献。

图书:专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等期刊:化学学报、煤炭学报、电工技术学报、高等教育研究、建筑工程与科学在CNKI 期刊全文数据库中检到共209条记录:国际城市规划、建筑结构学报、交通运输工程学报、建筑经济、土木工程学报、岩土工程学报、岩土力学、空间结构、地震工程与工程振动、中国给水排水、工程力学世界建筑工业建筑工程勘察中外建筑工程建设等。

报纸:人民日报特种文献:科技报告、会议文献、专利文献、学位论文、政府出版物、标准文献、产品资料、科技档案美国政府的四大报告1、国防部的AD报告2、商业部的PB报告3、国家航空及宇航局的NASA报告4、能源部的DOE报告。

2现代科技文献具有的特点哪些?答:(1)数量多、增长快, (2)出版形式多、文种多,(3)文献异常分散, (4)文献失效加快, (5)报道内容重复交叉, (6)文献总体质量下降3什么是核心文献、相关文献和边缘文献?答:核心文献通常是指与本学科发展水平、发展动向密切相关的一些文献。

如核心期刊等。

相关文献和边缘文献是指内容与学科的关系相对疏远一些的文献。

相关文献和边缘文献是本学科和其它学科相互渗透、互相结合的结果。

4 什么是文献?构成文献的有哪四个要素?答:文献的定义是记录有知识的一切载体称为文献。

构成文献的四要素是:知识内容,信息符号,载体材料,记录方式。

5 电子文献的主要类型和文件格式是什么?答:(1)按照载体的形态,电子文献可以有软磁盘(FD)、只读光盘(CD-ROM)、可擦写光盘(CD-RW )等之分;(2)按照文献的电子格式,电子文献有文本格式的txt文件、doc文件、pdf文件,图像格式的 gif文件、jpg文件以及标记文件格式的 html文件和xml文件之分;(3)按照出版周期和内容特点,电子文献可以有电子期刊,电子图书,电子报纸以及数据库等之分;(4)按照内容的性质和时效性,电子文献可以有论文文献和动态消息之分;(5)按照版权状况,电子文献又可分为有版权电子文献和无版权电子文献两类;(6)从文献信息利用的角度来看,可分为有版权的电子期刊、电子图书、报告的学术价值相对较高,而单篇论文和动态性的电子文献有时虽然没有注明版权,也有相当的参考价值。

信息检索复习题以及重点

信息检索复习题以及重点

信息检索复习题1、信息检索的步骤包括:界定问题、选择信息源、制定检索策略并实施检索、评价信息、分析利用信息五个步骤。

2、文献中ISBN、ISSN分别是指:国际标准书号、国际标准刊号。

3、文献按出版形式划分为哪几种?简述之。

答:按出版类型划分:图书、期刊、特种文献:(科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料、技术档案)4、给出“基于云计算的煤矿安全监测预警系统研究”一文的关键词。

煤矿监测预警云计算数据挖掘5、给出3种常用搜索引擎名称,什么情况下应该使用百度快照?答:百度、Google、360、搜狗搜索到的结果无法打开或打开速度很慢的情况下,可以使用百度快照。

6、利用百度搜索一份技术开发合同,应该在搜索框输入(技术开发合同 filetype:doc 或技术开发合同 filetype:ppt )。

(提示:技术开发合同的格式:doc或pdf)。

百度以“filetype:”来限制,后面是文档格式。

文档可以是pdf、doc、xls、ppt等。

首选gov(政府)、edu(教育)、org(非盈利性机构)、ac(学术类)网站;次选com(商业) net(网络)等7、CNKI中国知网主要收录哪些类型的全文学术文献?期刊文献,报纸,会议文献,国外学术文献,工具书,年鉴,专利,成果,标准文献,博士学位论文,硕士学位论文8、查找中文全文图书和期刊文献分别有哪几个数据库?中文全文数据库:CNKI中国知网.维普期刊资源整合服务平台.万方数据知识服务平台,读秀学术搜索9、学位论文有哪些特点?简述之。

4)学位论文(dissertation,thesis)指高等院校和科研机构的毕业生在获取相应学位时,必须提交的论文。

外部特征:著者、论文题名、颁发学位的机构名称、学位等级、授予年份等。

其主要辨识特征是学位名称,特征词:Ph,D,MS等。

从内容上看,学位论文具有以下四个特点:学术性,科学性,创造性,规范性10、依据GB/T7714-2005,分别给出图书、期刊和学位论文的著录格式,并各举一例。

信息检索复习题

信息检索复习题

第一章绪论1.1 信息素养与信息教育信息素养,又称信息素质、信息能力,是一个综合性的整体概念,它是将信息意识、信息道德、信息需求动力、信息工具和信息源以及信息评估、吸收与利用有机结合而获得的一种综合能力。

1.2 信息的基本概念信息与知识、情报、文献的联系与区别:信息是指对各种事物的存在方式、运动状态和相互联系特征的一种表达和陈述,是自然界、人类生活和人类思维活动普遍存在的一切物质和事物的属性。

知识来源于信息,是信息的一部分。

是一种特定的人类信息,信息只有经过科学的系统的加工才能上升为知识。

情报是为了解决一个特定问题所需的知识,是激活了的知识,是知识经传递并起作用的部分。

有三个基本属性:知识性、传递性和效用性。

它虽然属于信息的范畴,但不是一般的信息,而是一种特定信息。

文献是记录有信息的一切载体,文献中蕴含着大量的知识和信息,这些知识、信息被用户利用时就转化为情报。

情报源于知识,知识源于信息,文献是信息、知识情报的主要载体形式。

1.3 信息源与信息媒体信息源,就是信息的来源,即人们在科研活动中、日常工作以及其他一切社会实践中所产生的成果和各种原始资料,以及对这些成果和原始资料加工整理而得到的成品等,是能为满足人们特定需要而产生信息的源泉。

按照其存在形式可分为三类:口头信息源、实物信息源和文献信息源。

一次信息媒体:即原始信息媒体或第一手资料,主要是指报道新发明、新创造、新知识、新技术的原始资料,以及直接记载的科研成果调查报告经验总结等,通常亦称原始文献、一次文献。

如期刊文献、会议文献、科技报告/研究报告、专利文献、学位论文、政府出版物、标准文献、科技档案、产品资料等。

第二章信息检索系统概述2.1信息检索系统类型计算机检索系统:其核心是数据库,它是由一个或多个文档构成的大量数据的集合。

按计算机检索系统所含信息资源内容的形式不同分为五种类型:1书目型数据库:存某个学科领域的二次文献信息(文摘或题录)的数据库,提供原始文献信息的梗概和线索。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计算机复习信息检索
信息检索是指通过计算机技术,根据用户的需求,在大规模的信息
资源中准确、快速地找到相关的信息。

在当今信息爆炸的时代,信息
检索的重要性不言而喻。

本文将介绍信息检索的基本概念、技术和应用,并附带答案和解析。

一、信息检索概述
信息检索是指通过计算机对大规模信息资源进行全文检索、关键词
检索等方式,根据用户需求提供相关信息的过程。

其目标是提高检索
准确性和检索效率,帮助用户快速获取所需信息。

信息检索系统由信息资源、检索模型、检索方法和用户界面等组成。

其中,信息资源包括数据库、文档集合等;检索模型包括向量空间模型、布尔模型等;检索方法包括倒排索引、词频统计等;用户界面提
供检索接口供用户输入查询词,并显示检索结果。

信息检索的基本流程包括:用户输入查询词->检索系统进行查询处
理->检索系统返回相关文档。

二、信息检索技术
1. 关键词检索
关键词检索是最常见的信息检索方式,用户通过输入关键词,检索系统根据关键词在信息资源中进行匹配,并返回相关文档。

关键词
检索常用的算法有向量空间模型、TF-IDF算法等。

全文检索是指对文档集合中的全部文本进行检索,而不仅仅是关键词。

全文检索主要通过分词、建立倒排索引等技术来实现。

用户输
入的查询词可以是一个短语或一句话。

3. 自然语言查询
自然语言查询是指用户使用自然语言进行查询,而不是像关键词查询那样只输入几个词。

自然语言查询需要将用户的自然语言转化为
计算机可处理的查询语言,如SQL语句。

4. 语义检索
语义检索是一种基于语义理解的检索方法,通过对查询词的语义进行分析,实现更精准、准确的检索。

语义检索常用的技术有词义消歧、词向量模型等。

三、信息检索应用
1. 搜索引擎
搜索引擎是信息检索的最常见应用之一,在互联网上广泛使用。

搜索引擎通过爬虫程序对互联网进行爬取,建立庞大的索引库,并通
过用户输入的查询词返回相关页面。

2. 文献检索
在学术界和科研领域,文献检索是非常重要的工作。

研究人员通过文献检索系统获取相关的研究论文,以便进行进一步的研究和阅读。

图像检索是指通过计算机对图像进行分析和索引,实现图像的相似性匹配。

图像检索广泛应用于图像数据库、图像搜索引擎等领域。

4. 音视频检索
音视频检索是指根据音频或视频内容进行检索,如根据歌曲的歌词进行搜索、根据视频的关键帧进行匹配等。

音视频检索在音乐、广告等领域有广泛应用。

答案和解析:
1. 关键词检索的常用算法有向量空间模型、TF-IDF算法等。

答案解析:向量空间模型将文档和查询词都表示为向量,通过计算它们之间的相似度进行匹配。

TF-IDF算法通过词频和逆文档频率来衡量词的重要性。

2. 全文检索需要对文档集合进行分词,再建立倒排索引。

答案解析:分词将文本拆分成一个个词语或短语,便于后续的索引和匹配。

倒排索引是一种通过词语构建索引的方式,可以快速找到包含某个词语的文档。

3. 自然语言查询需要将用户的自然语言转化为计算机可处理的查询语言。

答案解析:自然语言查询需要通过自然语言处理或机器学习等技术将用户的自然语言转化为计算机可理解的形式,如SQL语句,再进行查询。

4. 语义检索可以通过词义消歧和词向量模型等技术实现。

答案解析:词义消歧是解决词义多义性问题的技术,通过上下文或语境来确定一个词的具体含义。

词向量模型是通过将词语映射到高维向量空间来表示词的语义信息。

以上是关于计算机复习信息检索的相关内容。

信息检索作为一项重要的技术,在各个领域有着广泛的应用,为用户提供准确、快速的信息查询服务。

我们需要了解信息检索的基本概念、技术和应用,以提高我们的搜索效率和准确性。

相关文档
最新文档