信息检索---名词解释

一、名词解释

信息检索:信息检索最普通的理解就是信息查找。它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。信息检索又叫做信息存储与检索(information storage and retri)。信息检索可以分为事实检索、数据检索、文献检索。

特性检索:也称强相关性检索,强调向用户提供高度对口的信息。强调检索的准确性,对检索结果的数量不作要求。

族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。

特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。

OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。

参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。

年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。

手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。

名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。

搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。

图书:论述或介绍某一领域知识的出版物。

期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。期刊论文内容新颖,报道速度快,信息含量大,是传递科技情报、交流学术思想最基本的文献形式。

学位论文:学位论文是指为申请硕士、博士等学位而提交的学术论文。学位论文的质量参差不齐,但都是就某一专题进行研究而作的总结,多数有一定的独创性。

连续出版物:具有统一题名、印有编号或年月顺序号、定期或不定期在无期限内连续出版、发行的出版物。包括期刊、报纸、年鉴连续出版的丛书和会议录等,但不包括在一个有期限内以连续分册形式出版的著作。

二、简答

1.信息、知识、情报和文献之间的关系。

信息是物质存在方式及其运动规律、特点的外在表现。它普遍地存在于自然界、社会界和思维界。

知识是人类对客观事物规律性的认识。人类通过实践,认识和掌握自然和社会运动形态及其规律,同时对在实践中积累起来的经验进行概括、总结、升华,形成知识。

情报是为解决某一特定问题所需要的知识。只有将特定的知识传递到特定需要的人,特定的知识才能成为情报。

文献是记录有知识的一切物质载体。具体讲,凡是用文字、图形、符号、声像等手段记录下来,印在纸上或摄在感光片上,录在唱片或录音带上,存储在计算机的磁带、磁盘或光盘等物质载体上的知识与信息统称为文献。

信息、情报和知识之间的逻辑关系为包含和被包含的关系。信息范围最大,其次为知识,情报则被信息和知识所包含。而文献是信息、知识、情报的具体体现。

3、手工式检索与计算机检索的区别。见下表:

4、常见的检索工具有哪些?

常用检索工具,是人们在长期检索实践中公认的著名检索工具。常用的检索工具可以分为手工检索工具和计算机检索工具。

手工检索工具,包括书目、索引、文摘等。如《化学文摘》、《工程索引》、《生物文摘》、《科学引文索引》、美国政府四大科技报告、《科学技术文献总报》、《人大复印资料》、《中国社会科学引文索引》等。

计算机检索工具包括数据库和搜索引擎等,主要有。超星数字图书馆、维普中文科技期刊全文库、方正数据库、CNKI、人大报刊复印资料全文库、中国重要报纸全文数据库、CSSCI中文社会科学引文索引、CSCD中国科学文献服务系统、ACS 美国化学学会电子刊 AIP APS 美国物理学会电子刊、ASME美国机械学会电子刊、ACM美国计算机学会电子刊、EBSCO全文数据库、Elsevier SD电子期刊、EI工程索引、Proquest农业全文库、Springer电子期刊、剑桥大学出版社电子期刊。Google、yahoo!、百度、网易、北大天网等。

5、计算机检索的原理。

计算机文献检索的机制与手工检索类似。计算机文献检索就是利用电子计算机查找文献。文献著录以一定的格式输入计算机,成为文献记录。经过计算机处理,将大量的文献记录以一定的结构存贮在磁带或磁盘上,生成文献数据库或文档。用户按一定的要求将检索词输入计算机内,由计算机对其进行处理,并与数据库或文档中的文献记录进行匹配运算。最后将检索结果按要求的格式输出。计算机检索包括存贮和检索两个方面。

6、数据库的类型有哪些?

一般来说,数据库按收录信息的性质分为文献型、数值型和事实型三大类。(1)按数据库的记录内容分

可以分为:书目数据库、全文数据库、混合数据库。

(2)按数据库记录信息的媒介分

可以分为:文字型数据库、语音型数据库(录音资料数据库)、影像型数据库(缩微资料数据库、录像资料数据库、影片资料数据库)和多媒体数据库。

(3)按数据库的存储介质分

可以分为:磁介质(磁带、磁盘等)数据库、光盘数据库。

(4)按数据库的运行方式分

可以分为:光盘数据库、联机数据库和网络数据库

(5)按文据库内容的学科专业范围分

可以分为:综合性数据库、多学科数据库、专题性数据库、专业性数据库

(6)按数据库的语种分

可以分为:多语种数据库、单语种数据库

(7)按文献数据库的建库方式或来源分

可以分为:自建数据库、共建数据库、引进数据库等。

信息检索

一、名词解释1知识:知识是人类对自然界、人类社会;2情报:情报是人们在一定的时间内为一定的目的而传;3文献:凡属于人类的知识,用文字、图形、符号、声;4核心期刊:是科技期刊中一类特定的期刊,指刊登某;5专利:专利是指国家以法律形式授予发明人或其权利;20.以下哪种检索刊物属于文摘型检索刊?(C国外;21.下面哪项工具是不属于书目检索范畴?(B《中;22.下列 一、名词解释 1知识:知识是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的过程。系统化、理论化的信息就称为知识。 2情报:情报是人们在一定的时间内为一定的目的而传递有使用价值的知识或信息。情报具有保密性、时效性、传递性的特点。 3文献:凡属于人类的知识,用文字、图形、符号、声频、视频等手段记录保存下来,并用以交流传播的一切物质形态的载体,统称为文献。 4核心期刊:是科技期刊中一类特定的期刊,指刊登某学科文献密度大、载文率、被引用率及利用率较高,深受本学科专家和读者关注的期刊。 5专利:专利是指国家以法律形式授予发明人或其权利继受人在法定期限内对其发明创造享有的专有权。录型检索工具)。 20.以下哪种检索刊物属于文摘型检索刊?( C国外医学) 21.下面哪项工具是不属于书目检索范畴?( B《中国期刊网全文专题数据库》)

22.下列哪项不是科技文献的特点?( C文献发表的时间缩短)[A.日益向多元化发展B.交流传播速度加快C.文献发表的时间缩短D.内容交叉渗透,分散重复] 23.通过文献后面列出的一系列参考文献条目的指引,来查找到那些参考文献的原文,这种检索方法属于(A追溯法)。[ 24.下面对查全率和查准率描述正确的是( D查准率和查全率之间存在互逆关系)。 25.20世纪(A 50年代)中期,我国开始出版医学索引刊物。 26.建国前,由于我国科学技术和科技情报工作非常落后,导致文献检索刊物出现较晚,种类少,直到( B 通过SCI引文索引,按著者姓名字顺来获得,下列所示选项为该著者的姓名,(A MA DL )符合SCI的著录规则。 68.《科学引文索引》与其他检索工具的不同之处是其具有( C引文索引)索引。 69.下面内容选自于SCI轮排主题索引,其中“■”表示( D来源文献为匿名著者)。 70.下列哪一项不是SCI提供的检索途径?(B分类途径) 71.穿孔卡片和光电检索系统属于以下哪种信息检索方式? (B机械检索) 72.世界上第一个计算机信息检索系统诞生于:( C .1954年) 73.下列哪项文献内容属于文献的内容特征:(D分类号)

信息检索 名词解释

一、名词解释 信息检索:信息检索最普通的理解就是信息查找。它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。信息检索又叫做信息存储与检索(information storage and retri)。信息检索可以分为事实检索、数据检索、文献检索。 特性检索:也称强相关性检索,强调向用户提供高度对口的信息。强调检索的准确性,对检索结果的数量不作要求。 族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。 特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。 OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。 手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。 名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。 搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。 图书:论述或介绍某一领域知识的出版物。 期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。期刊论文内容新颖,报道速度快,信息含量大,是传递科技情报、交流学术思想最基本的文献形式。 学位论文:学位论文是指为申请硕士、博士等学位而提交的学术论文。学位论文的质量参差不齐,但都是就某一专题进行研究而作的总结,多数有一定的独创性。 连续出版物:具有统一题名、印有编号或年月顺序号、定期或不定期在无期限内连续出版、发行的出版物。包括期刊、报纸、年鉴连续出版的丛书和会议录等,但不包括在一个有期限内以连续分册形式出版的着作。 ?二、简答 1.信息、知识、情报和文献之间的关系。

信息检索

信息检索 一、名词解释: 1.信息检索:狭义的信息检索概念是指在信息的海洋中选取符合需要的信息的过程称为信息检索。而如今发展为包括信息的储存、组织、查询、提取等多个工作过程,所以广义的信息检索又称为信息储存与检索。 2.CALIS:全称为中国高等教育文献保障系统(china academic library&information system),其联合目录数据库始建于1997年。其资源类型包括原文、图片、阴文、文摘、馆藏、相关文献等;育种覆盖中文、英语和日语。 3.引文索引:利用文献引证关系检索相关文献的索引。引文索引以某一文献(包括作者、题名、发表年份、出处等基本数据)作为标目,标目下著录引用或参考过该文献的全部文献及出处。它主要供用户从被引文献查找引用文献。 4.截词检索:截词检索是预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。尤其在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。 5.科技查新:科技查新是文献检索和情报调研相结合的情报研究工作,它以文献为基础,以文献检索和情报调研为手段,以检出结果为依据,通过综合分析,对查新项目的新颖性进行情报学审查,写出有依据、有分析、有对比、有结论的查新报告。 二、填空 1.文献按内容层次可分为:一次文献、二次文献和三次文献。 2.计算机信息技术中常用的检索技术是:布尔逻辑检索、截词检索、限制检索、词位检索。3.信息素质的内涵包括:信息意识、信息技能和信息道德。 4.SCI是什么的缩写:科学引文索引(science citation index)。 5.位置算符W:这个算符表示其两侧的检索词必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序不可以颠倒,3N:此算符两侧的检索词之间允许间隔最多3个其他词或字母,且两者词序可颠倒。 6.评价检索系统检索效果的常用指标是:查全率和查准率。 7.连续出版物的主要类型是:报纸、杂志、电子期刊。 三、简答 1.信息、知识、情报、文献之间的概念和关系。 答:信息是事物属性的再现,它在人类社会与自然界中无处不在,无时不有。信息不是事物本身,而是由事务发出的消息、指令、数据等所包含的内容; 知识是人类社会实践的总结,是人的主观世界对于客观世界的概括和如实反映; 情报是激活了、活化了的知识,是为特定目的服务的信息; 文献是记录有知识的一切载体。 信息、知识本身看不见,只能附着在载体上,如果与载体分离,他们就不容易被参考和利用。可以说,现代文献从其外延来看囊括了各种信息与知识载体。综上所述,当信息经过人脑重新组合和系统化后,成为知识和情报;而知识用一定的记录手段记录下来时,则成为文献。 2.布尔逻辑检索的运算符有哪些,各代表什么含义,举例说明。 答:常用的布尔逻辑算符有3种:AND-逻辑与,可用“*”表示、OR-逻辑或,可用“+”表示、NOT-逻辑非,可用“-”表示。假设有两个检索项A和B,他们的各种逻辑组配关系及检索结果如下: AND-与 A AND B或A*B 表示命中结果是A和B所相交的部分

计算机信息检索

一.名词解释 1.信息检索:广义来说,指将信息按照一定的方式组织和存储起来,并能根据信息用户的 需要找出其中相关信息的过程,包括“存”和“取”两个基本环节;狭义理解,一般只涉及“取”,信息检索也可称为“信息查询”或“信息查找”。 2.联机信息检索:指用户利用检索系统网络的终端设备,通过通信线路,运用一些特定的 指令和检索策略与世界上的信息检索系统,进行质检的人机对话,从检索系统的数据库中查找出用户所需要的特定信息,并将检索结果与过程下载,显示和打印出来的过程。 3.CBR:基于内容的检索,指根据多媒体对象的听、视觉特征及其中蕴含的内容和语义特 征进行检索,并希望能够借助于模式识别、语音识别、图像理解等相关领域的研究成果,对多媒体数据的听、视觉特征和语义特征进行自动(半自动)的分析、表达和组织。4.网络信息源:指所有以电子数据的形式把文字、图像、声音、动画等多种形式的信息存 贮在光、磁等非纸质介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。 5.搜索引擎:搜索引擎有广义与狭义之分。广义的搜索引擎泛指网络上提供信息检索服务 的攻击或系统。狭义的搜索引擎主要是指利用网络自动搜索软件对INTERNET(主要是WEB)网络资源进行收集、组织并提供检索服务的一类信息服务系统。 6.URL:统一资源定位符(Uniform Resource Locator,缩写为URL)是对可以从互联网上得到的 资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。 7. 顺排/倒排文档:文档的概念是指数据库内容的组织形式。一般地说,一个数据库至少 包括一个顺排文档和一个倒排文档。(1)顺排档,也称为主文档、引文文档,它是按记录存取号的大小顺序排列记录而成的文档。文档越是新,记录存入文档的时间越是晚,记录的存取号就越大。(2)倒排挡,是指把数据库中记录的一切可检字段或属性值(称检索标识,如著者,主题词等,不包括存取号)抽出,按某种顺序(字母或数字顺序)重新加以组织后得到的特征标识文档。 8 .检索语言:是应文献信息的加工、存储和检索的共同需要而编制的专门语言,是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。检索语言是用来描述信息源特征和进行检索的人工语言,可分为规范化语言(体系分类语言、主题词语言)和非规范化语言(自然语言)两类。 9.自然语言:索引词汇直接来自系统所处理的文献或提问本身,使用前未经过优选和规范化处理的一类检索语言。 10.超文本:是一个非线性的网状结构,它以结点为单位组织信息,在结点与结点间通过链接加以连接,构成表达特定内容的信息网络。 二.简答 1.简述一下因特网信息检索的特点 (1)检索范围大 (2)检索效率高 (3)检索工具强大 (4)信息冗余 2.搜索引擎的基本工作原理 搜索引擎的基本模式是:运行特定的网络搜索程序,定期地搜索Internet的各个站点,送回收集到的文献信息(包括Web页面和新闻组文章等),并利用索引软件对这些文献进行自动标引,加入集中管理的索引数据库;同时,在Internet上设立提供检索界面的Web站点,由用户输入提问检索式,通过特定的检索软件,查找其索引数据库,给出与

信息检索名词解释

一.名词解释 1,信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。 2,体系分类法:体系分类法是一种直接体现知识分类的等级概念标识系统,它对概括文献信息内容及其外表特征的概念进行逻辑分类(划分与概括)和系统排列而构成。它提供某学科、专业的集中文献。 3,关键词:是指从文献的标题、文摘以及正文中抽取的对表达文献主题起关键作用且具有检索意义的词语。关键词是标示文献关键主题内容。 4,TCP(传输控制协议):将文本分成包(数据包),再加上特别的信息,是数据可以准确无误地发送到接收方的计算机上。 5,IP(网际协议):在数据包上标有特别的信息(接收主机的IP地址)到目的地后,系统自动将IP地址去掉,再利用TCP检查数据包害是否完整,如有去损则要求发送方重新发送被丢损的数据包。 6,FTP(文件传输协议):它允许两台因特网主机相互传送/拷贝文件,可以把自己计算机上的某台计算机上的文件拷贝到自己的计算机上。 7,《馆藏目录》:图书馆或信息资料部门所收藏的全部书刊的统计目录。 8,《联合目录》:汇总某地区或若干地区甚至是全国图书馆或其他收藏单位所藏的全部书刊的统计目录。 9,信息检索:从大量的文献中查询与信息提问所指定的课题(对象)有关的文献,或者是包括用户所需事实与消息的文献过程。 10,搜索引擎:是一种利用网络自动搜索技术,对因特网各种资源进行收集和标引,建立网页数据库,并为检索者提供网络信息检索的工具。 二,选择题 1,b/(a+b)x100%=(D)(a值为检出的相关文献,b值为检出的不相关文献) A,查全率 B,漏检率 C,查准率 D,误检率 2,(B)研究人员对某一专题研究的过程中根据进展情况撰写的正式的报告。 A,会议文献 B,科技报告 C,期刊 D,学位论文 3,( C )是通过文章后面所附参考文献目录的线索查找所需信息的一种方法。 A,直接查找法 B,间接查找法 C,引文追溯法 D,综合法 4,下面不属于专利的三大特性的是(D) A,独占性 B,地域性 C,时效性 D,完整性 A,B,C,D 5,( B )是指各国政府部门及其设立的专门机构发表的文献。 A,会议论文 B,政府出版物 C,科技报告 D专门期刊出版物 6,下列不属于信息特征的是( A ) A,准确性 B,时效性 C,可传递性 D,实用性 7,下列那个数据库是开放式的数据库(B) A,万方数据B,超星C,维普D,ELSEVTER 8,多数网页采用HTNL编写,这里的HTNL指的是(B)A,超文本传输协议B,超文本标记语言C文件传输协议D统一建模语言9,超星图书采用了那种数字图书格式(D) A,PDFB,PPTC,CHMD,PDG 10,如果要检索2009年第六期的《地质研究》,在华东地区的那些大学图书馆有收藏,应该选择(B) A,全国报刊检索B,联合目录C,期刊目录D馆藏母驴

信息检索复习(名词解释)教案

1、同句检索是要求参加检索运算的两个词必须在同一自然句中出现,其先后顺序不受限制。 2、查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度,可用下面的公式表示: 查全率=(检出相关文献量/系统中相关文献总量)*100% 3、查准率:是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度,可用以下公式表示: 查准率=(检出相关文献量/检出文献总量)*100% 4、漏检率:是指漏检相关文献量与在检索系统中相关文献总量的比率,是衡量信息检索系统漏检文献的尺度,可用下面的公式表示: 漏检率=(漏检相关文献量/系统中相关文献总量)*100% 5、跨库检索:可同时检索多个平台上的多种资源,输入一个检索式,便可以看到多个数据库的查询结果。 6、单库检索:在选定的单一数据库中进行检索。 7、经典论文优先:被引用数比较多,或者文章发表在档次比较高的杂志上等经典的、有价值的文献优先排在前面。 8、相关度优先:和查询的条件内容最相关的文献优先排在前面。 9、最新论文优先:发表时间比较新的文献优先排在前面。 10、精确匹配:检索结果中包含与检索词完全相同的词语 11、模糊匹配:检索结果包含检索词或检索词中的词素 12、顺查法是根据有关课题的起始年代利用选定的检索工具由远及近的进行逐年查找。 13、倒查法从最新时间查找起,直到满足检索要求为止。 14、抽查法是针对有关学科的发展特点,抽查某些特定时期的文献信息。 15、二次检索是指在前一次检索结果的范围内,继续进行检索。 16、定题检索 SDI (selective dissemination of information)查找有关特定主题最新信息的检索。 17、回溯检索 RS (retrospective search)查找一段时期内有关特定主题信息的检索。 数据库的基本复习: 数据收录文献范围,有哪些数据库? 二、信息检索的原因 1、信息检索是获取知识的途径 2、信息检索是科学研究的向导 3、信息检索是终身教育的基础 信息检索语言与检索途径 (1)分类语言(2)主题语言(3)分类主题一体化语言(4)代码语言(5)引文语言 1、内容特征检索途径 (1)分类途径(2)主题途径(3)分类主题途径 2、外部特征检索途径 (1)责任者途径(2)题名途径(3)序号途径(4)引文途径 第二节事实数据信息的检索工具 一、字典、词典(辞典)二、百科全书三、手册四、年鉴五、名录 第三节文献检索工具简介 一、目录型检索工具;题录型检索工具;文摘型检索工具 第四节索引介绍 著者索引、主题索引(关键词索引)、分类索引、题名索引、其他索引

信息检索期末复习资料

信息检索 一.名词解释 1.索引(P150):索引是将书籍、期刊等文献所刊载的论文题目、作者,以及所讨论的或设计的学科主题、名词术语、所引用的参考文献等,根据一定的需要,经过分析分别摘录出来,注明其所在书刊的页码,按一定的原则和方法排列起来的一种检索工具。 2.回溯检查法:又称追溯法、引文法、引证法,是一种跟踪查找的方式。即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。通过回溯法所获得的文献有助于对课题的主题背景和立论依据等内容有更深的理解。该方法获得文献针对性强、数量较多,在没有检索工具或检索工具不齐备的情况下,利用此法能够获得一些所需要的文献资料。 3.可视化:将数据库中不可见的语义关系以图像的形式可视化显示,并表达用户检索过程。一个可视化的环境为用户展示更丰富、更直观的信息,一个透明的检索过程使检索更容易、更有效。它包括检索过程的可视化和检索结果的可视化。可视化信息检索技术缩短了用户理解信息的时间,提供了感觉和思考之间的有效反馈机制,它代表着信息检索的未来,将会取代以布尔逻辑为基础的、传统的信息检索系统。 4.自动标引:是指直接通过计算机的操作处理,自动实现赋予检索标志的活动。分为自动主题标引和自动分类标引,即根据计算机内信息(标题、摘要或全文),借助算法自动给出反应主题内容的标引词和自动分配分类号。 5.全文扫描:是以从文本文档中找出与查询表示的字符串完全一致的部分为目的,检索结果返回包含查询字符串的文本及其位置的检索技术。 6.查全率:查全率是指从检索系统检出的与某课题相关的文献信息数量与检索系统中实际与该课题相关的文献信息总量之比。对于数据库检索系统,查全率为检索出的款目数与数据库中满足用户检索式需求的款目数之比;而对于互联网信息检索系统来说,文献总量是很难计算的,甚至连估算都困难。在这里人为因素的影响比较大。相对查全率=(专业人员检出文献的数量数/全部实际检出文献集合并集中文献数量) *100% 7.图像信息抽取:是指从数字图像中抽取包括基于文本的特征(说明,注释等关键词)和视觉特征或底层特征(颜色,文理,形状等),作为图像的特征描述,支持信息检索。 8.信息过滤:是指根据一定的标准运用一定的工具从动态的网络信息流中选取用户需要的信息或剔除用户不需要的信息的方法和过程。信息过滤的依据是信息与用户信息需求的相关性。 9.逻辑算符:又称布尔逻辑算符,是利用布尔代数中的逻辑运算符来描述检索词之间的关系。逻辑算符的作用是把若干飞检索词或词组连接起来,构成一个检索式的基本框架,指定文献的检索词必须出现或不出现的条件。常见的有三种,逻辑与(AND或*)、逻辑或(OR或+)、逻辑非(NOT或-)。其功能是将代表单一概念的一些检索组配起来形成检索式,表达一个信息的整体概念。 10.元搜索引擎:通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的各种检索工具的全局控制机制。 二.分析判断题 1.从狭义角度讲,信息检索包括的过程。 情报的检索(工具)(从信息集合中找出信息的过程,相当于人们通常所说的信息查询);存储和检索;表示、存储、组织、存取 2.系统中的高频词在检索中所起的作用。 3.自动标引的含义。 自动标引是指直接通过计算机的操作处理,自动实现赋予检索标志的活动。分为自动主题表扬你和自动分类标引,即根据计算机内信息(标题、摘要或全文),借助算法自动给出反应主题内容的标引词和自动分配分类号。

信息检索名词解释

《信息检索》名词解释 [1] 信息 答:答案:信息是指应用文字、数据或信号等形式通过一定的传递和处理,来表现各种相互联系的客观事物在运动变化中所具有特征性的内容的总称。 [2] 信息检索 答:答案:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程。 [3] 文献 答案:文献就是用文字、图形、符号或声像、视频等技术手段记录知识信息的物质载体,或曰固化在物质载体上的知识信息。 [4] 检索语言 答:即情报检索语言,是根据信息检索的需要创造出来的一种人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。 [5] 检索工具 答案:检索工具是指用以报导、存贮和查找文献线索的工具。它是附有检索标识的某一范围文献条目的集合,是二次文献 [6] 数据检索 答案:数据检索是以数值或图表形式表示的数据为检索对象的信息检索。数据检索是一种确定性检索。 [7] 事实检索 答案:事实检索是以从文献中抽取的事项为检索内容的信息检索。其检索对象既包括非数值信息,也包括一些数据信息。事实检索是确定性检索。 [8] 索引 答案:索引是从正文各文献条目中选出的词或代码的顺序表。索引主要由检索标识和文献条目顺序号两部分组成。灵活掌握检索工具索引的使用,是学会使用检索工具的实质。 [9] 计算机信息检索

答:计算机信息检索是指利用计算机存储和检索信息。具体地说,就是指人们在计算机或网络终端上使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据 库中检索出所需的信息,然后再由终端设备显示、打印的过程。 [10] 联机检索系统 答:联机检索系统是由一台主机带多个终端的信息检索系统。这种系统具有分时的操作能力,能够使许多相互独立的终端同时进行检索。检索是以人机对话的方式进行的,用户在自己的终端上输入检索提问式,联机服务中心的计算机就可以立即处理用户的 请求,在数据库中查找符合用户提问的数据,并将检索结果回送至用户的检索终端上。用户可以随时修改检索提问,直至获得满意的结果,并可通过打印或传输立即得到检 索的最终结果。 [11] 光盘检索系统 答:光盘检索是指利用计算机设备对只读式光盘数据库(CD-ROM)进行检索。 [12] 网络检索系统答:答案:网络信息检索是指利用计算机设备和国际互联网(Internet)检索网上各服务器站点的信息。 [13] 搜索引擎 答:搜索引擎也被称为蜘蛛(Spiders)或爬虫(Crawlers),是一种能够通过Internet接受用户的查询指令,并向用户提供符合其查询要求的信息资源网址的系统。 [14] 标准文献 答:是按照规定程序编制并经过一个公认的权威机构(主要机关)批准的,供在一定范围内广泛而多次使用,包括一整套在特定活动领域必须执行的规格、定额、规划、 要求的技术文件。 [15] 专利文献 答:是指实行专利制度的国家及国际性专利组织在审批专利过程种产生的官方文件及其出版物的总称。 [16] 标准 答案:在一定的范围内获得最佳秩序,对活动或其结果规定共同的和重复使用的规则、导则或特性的文件,称为标准。 [17] 专利说明书

信息检索答案

信息检索答案 IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】

一、名词解释(5x4=20分) 1.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中,计算机会将所有含有相同部分标识的记录全部检索出来。截词符一般用“ ”或“*”表示,但不同的数据库中有所差别。 2.信息检索:信息检索(InformationRetrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。 3.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。 4.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。 5.引文索引:是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。 二、简答(5x6=30分) 1.查找国内外学位与会议论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。 (1)国内外的学位论文数据库包括索引与摘要数据库和全文数据库,如CALIS的《学位论文库》,万方数据资源系统《中国学位论文数据库》,CNKI的《优秀硕博士论文数据库》,美国博硕士论文库PQDD(ProQuestDigitalDissertations),美国学位论文网络数字图书馆 NDLTD(NetworkedDigitalLibraryofThesisandDissertations)等。

(2)会议论文数据库包括:会议论文索引与摘要,如CALIS会议论文数据库,万方数据资源系统《中国学术会议论文数据库》,OCLC会议数据库——《在会议上提交的文章索引》(PapersFirst),《会议出版物索引》(Proceedings),WebofKnowledge的会议录引文索引 CPCI(ConferenceProceedingsCitationIndex)。 2.布尔逻辑检索的主要运算符有哪些它们各代表什么含义请分别举一例说明。 布尔逻辑检索的主要运算符有“AND”、“NOT”、“OR”,它们分别代表逻辑与(表示检索结果中必须包含所有的检索词)、或(表示检索结果中只要包含任何一个检索词即可)和非(表示检索结果中一定不能出现“not”后面的检索词),如:美国AND社会保障,数字图书馆OR虚拟图书馆,玉米NOT甜玉米。 3.搜索引擎有哪些类型 搜索引擎按信息搜集方式分:有目录式搜索引擎和机器人搜索引擎;按照信息组织方式分:有网络资源指南与关键词搜索引擎;按学科范围与资源种类分,有综合性搜索引擎和专门性搜索引擎;按照功能和是否有自建索引库分,有独立搜索引擎和元搜索引擎。 4.电子图书有哪些特点 存储空间大(磁介质存储密度高、容量大,一张光盘甚至可以存上百部中外名着)、节省资源(不需消耗纸张等物质资源)、使用方便(借助于专门的软件便可使用,可以便捷地编辑和查找特定内容)、传播过程中的无独占性和无损坏性(可以同时供多人使用,可无失真地重复使用)。 5.网络信息选择的标准有哪些 权威性(网站及其建站机构的权威性和知名度)、内容(内容应当客观、切题、标题清楚、组织规范、逻辑性强、有明确的范围和边界、有足够的深度和广度、有自己的特色)、时效性(网站内容及其链接应当新颖、应明确地说明其创建和更新周期)、网页设计(应以合理的方式综合使用图像、声音和文字、界面的友好性、清晰直观)、适用性(应保证用户能用较短的时间、点击较少的链接找到所需信息)、用户对象(信息的专业化程度应能满足目标用户的特定需求)、访问次数或被链接次数(网络信息的被访问和被其他网页链接的次数)。 三、选择填空(5x5=25分) 1.检索法学论文,可用的检索工具有:cdehI cSSCI 2.下列中可用于查找机构信息的有:acdeh ’sInternationalDirectoryofPeriodicals ’sGradline 3.下列中可用于查找图书信息的有:acdfh

信息检索名词解释

信息检索名词解释 信息检索(Information retrieval,IR)是指从大规模数据集中 找出与用户需求相关的信息的过程。以下是一些与信息检索相关的重要名词解释: 1. 文档(Document):信息检索中的基本单位,可以是文本、图片、音频、视频等形式的数据。 2. 查询(Query):用户提出的一个或多个关键词或短语,用 于描述其信息需求。 3. 检索(Retrieval):在信息检索系统中,通过匹配查询和文 档之间的相关性,找出最相关的文档。 4. 相关性(Relevance):衡量查询和文档之间匹配程度的度量,用于判断文档是否与查询相关。 5. 评价(Evaluation):对信息检索系统性能进行定量和定性 评估的过程,通常通过与人工判定相关性的比较来衡量。 6. 召回率(Recall):信息检索系统检索到的相关文档数占所 有相关文档数的比例,衡量系统的查全性能。 7. 精确率(Precision):信息检索系统检索到的相关文档数占 所有检索到的文档数的比例,衡量系统的查准性能。 8. F-度量(F-Measure):综合考虑召回率和精确率的度量指

标,通过调和平均计算,可以较好地衡量系统的全面性和准确性。 9. 布尔模型(Boolean model):一种基本的信息检索模型,根据查询中的布尔运算符(AND、OR、NOT)对文档进行匹配。 10. 向量空间模型(Vector space model):一种常用的信息检索模型,将文档和查询表示为向量,在向量空间中计算它们之间的相似度。 11. 词语权重(Term weight):表示一个词语在文档中的重要性的权重,常用的计算方法有词频、逆文档频率等。 12. 倒排索引(Inverted index):一种常用的索引结构,以词语为关键字,记录词语出现在哪些文档中,加快检索速度。 13. 停用词(Stop word):在信息检索中,指那些对判定一个文档是否与查询相关没有帮助的常见词语,如“a”、“and”、“the”等。 14. 查询扩展(Query expansion):对查询进行修改或补充,以提高系统的召回率和精确率。 15. 排名(Ranking):根据文档与查询的相关性,将文档按照相关性从高到低进行排序,以提供给用户最有用的结果。

信息检索与利用名词解释

文献(document)指的是在存贮、检索、利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存贮有信息或数据的载体。以文字、图形、符号、声频、视频、电磁信号等手段记录和传播知识的载体就是文献。 检索策略 检索策略(Retrieval Strategy),是指为实现检索目标而制定的全盘计划或方案,是对整个检索过程的谋划与指导。 数据库 数据库(Database)是至少由一种文档组成的,能够满足某种特定目的或特定数据处理系统需要的数据集合。 通俗地讲,数据库就是按照一定方式存贮的相互关联的信息集合。 目录 目录(Catalog)是以完整的出版单元(如一种图书、一种期刊)为单位,按照一定次序编排的对文献信息进行描述和报道的工具,也称书目。 目录对文献的描述比较简单,每条记录的字段主要包括:文献题名、责任者、出版事项、分类号、主题词等。 禁用词 禁用词(STOP WORD )是指不表达实际意义的虚词,如冠词、介词、连词等。通常在检索系统生成索引的过程中会忽略这些虚词。 所以,检索时如关键词中间出现这些禁用词,会被检索系统忽略。 1. 信息检索 答:信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程,又叫信息储存与检索,这是广义的信息检索。狭义的信息检索则是仅指该过程的后半部分,即从信息集合中找出所需信息的过程。 2. 追溯法(引文法) 答:利用参考文献进行深入查找相关文献的方法。追溯法包括两种方法: 一种是利用原始文献所附的参考文献进行追溯;另一种是利用引文索引检索工具进行追溯。 3.三次文献 答:是在对有关的一次文献和二次文献进行分析研究的基础上,通过综合概括而编写出的文献,是文献信息研究的成果和产物,具有参考性和指导性。如教科书、综述、工具书、进 展、调查报告、标准等。 4. 目录答:是对图书、期刊或其他单独出版物特征的揭示和报道。目录以单位出版物为著录对象,一般只记录其外部特征。如题名、著者、出版事项、载体形态等。 5. 专利权 答:是指国家专利主管机关授予申请人在一定时间内享有的不准他人任意制造、使用或销售其专利产品或者使用其专利方法的权利。 1. 检索工具 答:是在一次文献的基础上,经过加工整理、编辑而成的二次文献, 用于存储和检索文献线索。 2. 一次文献(原始文献) 答:是以著者本人的研究或研制成果为依据而创作或撰写的文献,是在科学研究中需重点查找的文献。一次文献强调创造性,是对知识信息的第一次加工。常见的一次文献有:期刊论文、专利说明书、会议论文、学位论文、技术标准、报告等。 3. 题录答:是对单篇文献外表特征的揭示和报道,著录项目一般有篇名、著者、著者单位、文献来

医学信息检索名词解释

医学信息检索名词解释 医学信息检索名词解释 信息:信息指物质存在或运动方式与状态的表现形式或反映,是现实世界事物的反应,它提供了客观世界的消息、知识,是事物的一种普遍属性。 知识:是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。 情报:情报是人们以各种方式传递与交流的具有一定目的与时效的信息,是人们为一定目的搜集的有使用价值的知识或信息。 文献:文献是记录有知识的一切载体。 情报意识:是指人对信息敏锐的感受力、判断能力和洞察力。 信息素养:信息素养是指判断何时、何地需要信息,并有效地定位、获取、评价和利用信息的一系列能力的总和。 文献检索:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的`存储与检索”。 检索语言:是根据信息检索的需要创造出来的一种人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。 一次文献:指以作者本人的研究成果为依据而撰写并公开发表或出版的信息。 二次文献:是对一定范围、时间或类型的大量一次文献按其特征收集整理、压缩、加工,并按一定顺序组织编排、用于检索查找利用这些文献而编制的文献。如书目、索引、文摘、题录、简介等。 三次文献:三次文献是在充分利用二次文献的基础上对一次文献做出的系统整理和概括的论述,并加以分析综合编写而成的概括性文献。 期刊:由依法设立的期刊出版单位出版。 特种文献:是指出版发行和获取途径都比较特殊的科技文献。

检索途径:是指检索系统为用户提供的得到所需文献的路径。 主题词:是以自然语言为基础,以概念组配为基本原理,并经过规范化处理,表达主题的最小概念单元,作为信息存储和检索依据的一种检索语言。 分类途径:是指按照文献资料所属学科(专业)类别进行检索的途径,它所依据的是检索工具中的分类索引。 主题索引:也称主题途径。这是按照文献的主题内容查找文献的途径。 关键词:是出现在文献题名、文摘、正文中,能够表达文献主题,具有检索意义的语词。副主题词:指明主题词所论述主题的自然范畴或者通常发生的某一方面,对主题概念起限定作用的一类词汇。 目录:是书籍正文前所载的目次,是揭示和报道图书的工具目录是记录图书的书名、著者、出版与收藏等情况,按照一定的次序编排而成,为反映馆范、指导阅读、检索图书的工具。题录:是著录信息的一种简单方式,一般将文献的题名(也称为标题、题目)、作者、来源出处等简单信息进行著录,无内容摘要。 文摘:是简明、确切地记述原文献重要内容的语义连贯的短文。 查全率:是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。 查准率:是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。 数据库:是在计算机存储设备上按一定方式存储的相互关联的数据集合,是计算机信息检索的重要组成部分。 记录:是构成数据库的信息单元,每条记录都描述了一原始信息的外表和内容特征。字段:是记录的下级数据单位,用来描述实体的某一属性。 事实数据库:存储描述人物、机构、事物的等非文献信息源的数据库。

信息检索手册的名词解释

信息检索手册的名词解释 信息检索手册是一种专门用于帮助用户定位和获取所需信息的工具,广泛应用 于学术研究、商业情报和个人信息管理等领域。它通过收集、整理和索引各种信息资源,为用户提供方便快捷的检索服务,帮助用户更加高效地获取所需信息。 一、信息检索系统 信息检索系统是指由多个相互关联的组件组成的复杂系统,其目标是根据用户 的需求,从大量的信息资源中检索并返回相关信息。该系统通常包括以下几个核心组件: 1. 数据库:信息检索系统的核心是数据存储和管理,数据库是其中的关键组成 部分。数据库中存放着各种类型的信息资源,如文献、图书、图片和音视频等。 2. 检索引擎:检索引擎是信息检索系统的核心引擎,负责解析用户的检索请求,并根据事先建立的索引和检索算法,从数据库中找到与用户需求最相关的信息。 3. 用户接口:用户接口是用户与信息检索系统进行交互的界面。它可以是简单 的命令行界面、图形用户界面,甚至是自然语言交互界面,以满足不同用户的需求和技术水平。 4. 检索语言:检索语言是用户在信息检索系统中使用的语言,用于描述其需求。常见的检索语言包括自然语言、布尔逻辑和形式语言等。 二、索引和倒排索引 索引是信息检索系统中的重要组件,它用于加速检索过程并提高检索效率。索 引通过对数据库中的信息资源进行结构化的组织和分类,建立起一个快速的检索路径。

倒排索引是一种常用的索引结构,它将关键词与包含该关键词的文档进行关联,实现了从关键词到文档的快速定位。倒排索引包括两个主要的部分:词项表和文档清单。词项表记录了所有出现过的关键词,而文档清单则记录了包含该关键词的文档。 倒排索引在信息检索中起着重要的作用。通过该索引,用户可以根据关键词快 速找到与之相关的文档,实现了高效的信息检索。 三、信息过滤和推荐系统 信息过滤是信息检索领域的一个重要研究方向,旨在根据用户的兴趣和需求, 将用户感兴趣的信息从大量的信息资源中过滤出来。信息过滤系统通常根据用户的历史行为、偏好和兴趣模型等信息,采用各种算法和技术进行信息匹配和筛选,将符合用户需求的信息推送给用户。 推荐系统是一种特殊的信息过滤系统,它根据用户的个人兴趣和行为习惯,向 用户提供个性化的信息推荐。推荐系统多用于电商平台、社交媒体和视频网站等应用场景,帮助用户发现潜在的兴趣点和个性化的内容。 四、信息检索评价和性能指标 信息检索的性能评价是指对信息检索系统进行客观和主观的评估,以衡量其检 索质量和效率。常见的信息检索性能指标包括: 1. 召回率:召回率是指信息检索系统中成功检索到的相关文档数与全部相关文 档数的比例,用来衡量系统的查全率。 2. 精确率:精确率是指信息检索系统中检索到的相关文档数与全部检索到的文 档数的比例,用来衡量系统的查准率。 3. F1值:F1值是召回率和精确率的调和平均数,综合考虑了查全率和查准率 的表现。

信息检索技术的名词解释

信息检索技术的名词解释 信息检索技术是指通过各种方法和技术手段,从大量的信息中检索出与用户需 求相匹配的相关信息的过程。它是一个非常重要的领域,涉及到大数据、人工智能和计算机科学等多个学科的知识和技术。 在过去的几十年里,随着互联网和数字化技术的迅速发展,信息爆炸式增长已 经成为一个普遍的现象。人们在日常生活中面临着海量的信息,例如网络文章、新闻报道、社交媒体帖子等。而要从这些海量的信息中获取我们所需要的内容,就需要依赖信息检索技术。 信息检索技术的核心是建立一个可靠和高效的检索系统。这个系统通常包括以 下几个关键组成部分: 1. 数据采集和处理:在信息检索过程中,首先需要收集和处理大量的原始数据。例如,从互联网上爬取网页、抓取新闻报道或者采集社交媒体数据等。这些原始数据通常是非结构化的,需要经过处理和清洗,才能进一步应用于检索系统。 2. 索引技术:在检索系统中,数据通常会先经过索引处理。索引是一种用于快 速定位和访问数据的数据结构。常见的索引技术包括倒排索引、散列索引和B树等。通过建立索引,我们可以在大量的数据中快速地找到相关信息,提高检索的效率。 3. 检索模型和算法:在信息检索系统中,一个重要的任务是设计合适的检索模 型和算法,以实现用户需求和信息之间的匹配。目前常用的检索模型包括向量空间模型、概率模型和语言模型等。而为了提高检索的准确性和效率,各种优化算法也被广泛应用于信息检索中,例如PageRank算法和局部敏感哈希算法等。 4. 用户交互和评价:信息检索系统的最终目标是满足用户的需求。因此,用户 交互和评价是一个重要的组成部分。通过采集用户的反馈意见和评价指标,可以不断改进和优化检索系统,提供更好的用户体验。

计算机信息检索

计算机信息检索 一、名词解释 1、信息资源:广义信息资源是指信息和与操作信息有关的物理 设施、人力、机构、资金和运行机制等的总称。狭义的信息 资源是指信息本身极其载体的集合,也就是我们常说的信息 源。 2、信息检索:从广义上理解,信息检索是指将信息按一定方式 组织和储存起来,并根据信息用户的需要找出有关信息的过 程。所以它通常被称为“信息存储于检索”。狭义的信息检 索是指广义的信息检索的后半个过程,即从信息集合中找出 所需要信息的过程,相当于人们所说的信息查检等。 3、搜索引擎:是指以一定的策略搜集互联网上的信息,在对信 息进行和处理后,为用户提供检索服务的系统。 4、专利文献:是实行专利制度的国家,在接受申请和审批发明 过程中形成的有关出版物的总称。 5、科技报告:也称技术报告或研究报告,它是科学研究工作和 开发调查工作成果的记录或正式报告,这是一种典型的机关 团体出版物。 二、填空题 1.信息,物质和能量在客观世界中具有同等的重要性。 2.按信息检索的手段划分,信息检索可以分为传统信息检索和现 代信息检索。

3.常用的逻辑运算符有and,or和not。 4.文献的三要素是知识,记录,载体。 5.搜索引擎分为全文搜索引擎、目录索引搜索引擎和元搜索引 擎。 https://www.360docs.net/doc/d419171800.html,KI的中文全称是中国期刊网 7.在CNKI检索系统中,如果排序方式选择“日期”,则发表日 期最近的排在前面 8.检索“潜艇中的非潜艇”,表达式可以写为潜艇not核潜艇 9.计算机检索系统由硬件,软件和信息数据库三部分构成 10.检索“打印机驱动程序”,表达式可以写为打印机and驱动 三、简答题 1、信息指示及文献之间的关系(第10页) 2、全文型数据库的特点(第58页) 3、“超星电子图书管“收藏资源的特点(第152—154页) 4、“万字数字化期刊”收藏资源的特点(第121页) 5、SCI,EI,SSCI的含义(第162—167) (有时间的同学可以再看一下26页的文献级次、44页的文献分类、59页的internet信息常用获取方式)

信息检索与利用的名词解释

信息检索与利用的名词解释 信息检索与利用是指通过特定的工具和技术,从大量的信息中准确地获取所需的信息,并将其应用到实际问题中。在当今信息爆炸的时代,信息检索与利用成为了人们获取知识和解决问题的重要手段。本文将对与信息检索与利用相关的重要名词进行解释。 一、信息检索 信息检索是指通过各种信息存储介质和检索系统,根据用户需求,从大规模信息资源中查找并提供相关信息的过程。它包括了信息需求分析、检索策略制定、检索行为和结果评价等阶段。信息检索的目标是根据用户的需求,准确地找到相关的信息。 1. 查询 查询是用户通过检索系统输入的查找信息的指令或问题。查询可以是关键词、短语甚至一整个句子。合理构建查询是信息检索的关键,它决定了检索结果的准确性和全面性。 2. 检索系统 检索系统是用来存储和组织大量信息资源,并为用户提供检索服务的系统。它们通常由索引、搜索引擎、检索算法和用户接口等部分组成。常见的检索系统包括网络搜索引擎、图书馆信息系统和企业内部知识库等。 3. 信息过滤 信息过滤是通过自动化的方式,根据用户的兴趣和关注点,从大规模信息中筛选出符合用户需求的内容。信息过滤可以根据各种条件和规则进行,例如关键词、时间范围、作者等。它通过过滤无用信息,提供用户可能感兴趣的内容。

二、信息利用 信息利用是将检索到的信息应用到实际问题中解决问题或产生价值的过程。信息利用是信息检索的延伸和发展,它强调将获得的信息应用到实际场景中,以满足用户的具体需求。 1. 信息处理 信息处理是将获取的信息进行整理、分析和加工的过程。它包括信息的分类、筛选、归纳和汇总等操作,以便用户更好地理解和利用信息。 2. 知识发现 知识发现是通过对大规模信息的分析、挖掘和模式识别,从中发现新的知识和规律的过程。它利用数据挖掘、机器学习和人工智能等技术,从信息中抽取价值,用于决策支持和创新等领域。 3. 信息可视化 信息可视化是通过图表、图形和其他视觉化方式,将信息呈现给用户,以提高信息的理解和交流效果。信息可视化可以将复杂抽象的信息转化为易于理解和识别的形式,为用户提供更直观和高效的信息展示方式。 三、信息检索与利用的挑战和发展趋势 随着信息量的爆炸性增长和多样化的信息资源,信息检索与利用面临着一系列挑战和发展趋势。 1. 大数据 大数据时代带来了海量、多样和高维度的数据资源,对信息检索与利用提出了更高的要求。如何高效地处理大规模数据、发现其中的有用信息,成为了信息检索与利用的重要挑战。

相关文档
最新文档