计算机信息检索复习资料
信息检索_复习资料

信息检索_复习资料第1章文献信息概论 (1)1.1 信息时代与信息文化课 (1)1.2 文献信息的基本概念 (2)1.2.1.1信息的定义 (2)1.2.2 文献的级别和载体类型 (2)1.2.3 印刷型文献的出版类型 (3)1.4、国内文献信息系统包括: (6)1.4.4 文献信息的学科分布规律 (6)第2章信息检索原理 (6)2.1.1信息检索的定义和类型 (6)1.信息检索的定义 (6)1.2.3文献的内部特征和外部特征 (6)2.2.1信息检索的一般原理 (6)2.2.3 检索语言 (7)2.2. 信息检索系统 (8)2.2.1 书目检索系统的内容组成 (8) 2.2.2印刷型信息检索系统的类型 (8) 2.3文献信息检索的方法 (9)2.3.1文献信息检索方法的类型 (10) 2.5 信息检索语言 (10)2.5.2分类检索语言 (11)2.6 著者检索原理 (12)2.6.1 著者索引的排序方式 (12)第三章事实数据检索与参考工具概述 (13) 3.2事实与数据检索概述 (13)3.2参考工具书概述 (13)3.3综合性参考工具举要 (16)第四章图书报刊文献检索原理 (19)第一节书目及其作用和类型 (19)第二节查近现代图书和报刊的出版 (20)4.1 计算机情报检索概述 (25)4.1.2 计算机情报检索的必备条件 (25)4.1.3计算机情报检索与手工检索的比较 (25)4.2 文献信息数据库原理 (25)4.2.1 数据库的定义和类型 (26)4.2.2 数据库构成: (26)4.3.5 检索策略构成和调整方法 (27)第4章(国内外网络全文数据库) (29)4、2电子图书和书目数据库 (29)第1章文献信息概论1.1 信息时代与信息文化课文献课是知识时代培养学生终身所需的信息意识与获取文献信息能力的重要课程,是一门科学方法课。
在社会信息化的进程中,文献信息检索的意义日益变得重要:1、文献信息数量激增。
计算机复习信息检索

计算机复习信息检索信息检索是指通过计算机技术,根据用户的需求,在大规模的信息资源中准确、快速地找到相关的信息。
在当今信息爆炸的时代,信息检索的重要性不言而喻。
本文将介绍信息检索的基本概念、技术和应用,并附带答案和解析。
一、信息检索概述信息检索是指通过计算机对大规模信息资源进行全文检索、关键词检索等方式,根据用户需求提供相关信息的过程。
其目标是提高检索准确性和检索效率,帮助用户快速获取所需信息。
信息检索系统由信息资源、检索模型、检索方法和用户界面等组成。
其中,信息资源包括数据库、文档集合等;检索模型包括向量空间模型、布尔模型等;检索方法包括倒排索引、词频统计等;用户界面提供检索接口供用户输入查询词,并显示检索结果。
信息检索的基本流程包括:用户输入查询词->检索系统进行查询处理->检索系统返回相关文档。
二、信息检索技术1. 关键词检索关键词检索是最常见的信息检索方式,用户通过输入关键词,检索系统根据关键词在信息资源中进行匹配,并返回相关文档。
关键词检索常用的算法有向量空间模型、TF-IDF算法等。
全文检索是指对文档集合中的全部文本进行检索,而不仅仅是关键词。
全文检索主要通过分词、建立倒排索引等技术来实现。
用户输入的查询词可以是一个短语或一句话。
3. 自然语言查询自然语言查询是指用户使用自然语言进行查询,而不是像关键词查询那样只输入几个词。
自然语言查询需要将用户的自然语言转化为计算机可处理的查询语言,如SQL语句。
4. 语义检索语义检索是一种基于语义理解的检索方法,通过对查询词的语义进行分析,实现更精准、准确的检索。
语义检索常用的技术有词义消歧、词向量模型等。
三、信息检索应用1. 搜索引擎搜索引擎是信息检索的最常见应用之一,在互联网上广泛使用。
搜索引擎通过爬虫程序对互联网进行爬取,建立庞大的索引库,并通过用户输入的查询词返回相关页面。
2. 文献检索在学术界和科研领域,文献检索是非常重要的工作。
信息检索复习资料

信息检索公选课复习资料1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。
2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。
3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。
4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。
5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。
6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。
7.著录是对文献内容和形式特征进行选择和记录的过程。
8.数据检索是指特定的数值型数据为对象的检索。
9.按信息的加工层次分类:(含义)一次文献:原始文献,图书、报纸、期刊、会议纪录、专利报告等二次文献:目录、题录、索引、文摘三次文献:论文丛集、综述、年鉴百科全书一次信息资源 (原始文献):以作者本人在生产和科研中所取得的成果为依据而创作的原始文献所传递的信息资源。
二次信息资源(检索工具):将分散的、无组织的一次信息资源,按一定的原则加工、整理、简化、组织成为系统的、便于查找利用的信息资源。
三次信息资源(参考性文献):在合理利用二次信息资源的基础上,选用一次信息资源的内容,根据一定的需要、目的进行分析、综合或浓缩重组而得到的信息。
二次信息资源与三次信息资源的区别:对象不同:二次信息资源以“篇”或“本”为单位进行加工;三次信息资源则归纳了较多的一次信息内容用途不同:二次信息资源为检索一次信息的工具;三次信息资源能直接提供检索答案.10. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。
11. 文献检索方法:指文献信息资源的一般检索方法,也是利用各种检索工具检索文献信息资料的最常用的方法。
信息检索重点复习资料

信息检索重点复习资料第一章信息检索概述信息检索(IR):将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
信息素养:人们在解答问题时利用信息的技术和技能。
信息检索与文献检索的主要区别:文献检索是以获取文献信息为目的的检索,信息检索是收集,组织,存储一定范畴的信息,并根据用户需求查询文献中的信息或知识单元,比文献检索更深入。
信息检索的分类:1、根据检索手段不同可分为1)手工检索2)光盘检索3)联机检索4)网络检索2根据检索对象形式不同可分为文本检索、数值检索、音频与视频检索。
信息检索的原理:通过对大量的分散无序的文献信息进行收集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储和检索这两个过程所采用的特征标识达到一致,以便有效的获得和利用信息源。
存储是检索的基础,检索是存储的目的。
信息检索语言是人们在加工、存储和检索信息时用来描述信息内容喝信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。
信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。
其物理结构:是信息检索所用的硬件资源、系统软件以及信息资源集合(数据库)的总和。
信息检索语言的主要目的:把存储和检索联系起来,把标引人员和用户联系起来,以便取得共同理解,实现交流。
信息检索的历史:最早的信息检索主要依靠信息分类。
1手工检索2机械信息检索。
3脱机批处理检索是计算机初期使用的一种检索系统 4联机检索 5光盘检索 6 网络信息检索后四者统称为计算机信息检索信息检索的三个经典模型:1布尔模型 2向量空间模型 3概率模型 1浏览型模型:扁平式模型、结构导向模型、超文本模型2检索型模型:结构化模型、基于内容的检索型模型。
信息检索模型是信息检索的核心。
信息检索系统:是具有信息存储和信息查询功能的一类服务设施。
信息检索系统按功能划分5种类型:文献检索系统DRS、数据库管理系统DBMS、自动问答系统QAS、管理信息系统MIS、决策支持系统DSS. 信息检索物理结构1计算机硬件2软件3数据库信息检索的逻辑结构是指系统所包括的功能模块或子系统及其相互关系。
信息检索复习资料

信息检索复习资料A卷⼀、名词解释:1.信息资源 2.信息检索3.著录法4.关键词标引5.知识发现⼆、填空1.按组织⽅式分,信息检索有()、()、超媒体检索。
2.信息检索策略有两种⽅式即()和()。
3.表⽰主体的检索词有标题词、()、()关键词。
4.常⽤的逻辑运算符有:()、OR或+、()。
5.信息检索⼯具常⽤的排检⽅法有字序法、()。
6.中国特有的⼯具书是()、()。
三、问答1. 信息检索的研究内容有哪些?2. 数据库有哪些类型?3. 搜索引擎的类型有哪些?四、论述1、试例说明传统检索型⼯具书和参考型⼯具书的使⽤。
2、如何利⽤检索⼯具查找历史类⽂献?参考答案:⼀、名词解释(30%)1.信息资源。
是⼈类存储在载体(包括⼤脑)上的已知或未知的可利⽤的资源。
信息中的载体信息和主题信息资源的最基本的组成部分。
2.信息检索。
是从⼤量相关信息中利⽤⼈—机系统等各种⽅法加以有序识别与组织以便及时找出⽤户所需部分信息的过程。
3.著录法。
是对信息与⽂献的形式特征和内容特征进⾏分析、选择和记录的⽅法。
4.关键词标引。
使⽤⾮规范化的⾃然语⾔——关键词来表达⽂献或信息资源主题内容的过程。
5.知识发现。
是从数据中发现有⽤知识的整个过程,使多个步骤相互连接,反复进⾏⼈机交互的过程。
⼆、填空(20%)1.按组织⽅式分,信息检索有全⽂检索、超⽂本检索、超媒体检索。
2.信息检索策略有两种⽅式即⼿⼯检索策略和计算机检索策略。
3.表⽰主体的检索词有标题词、单元词、叙次、关键词。
4.常⽤的逻辑运算符有:AND或*, OR或+, NOT或-。
5.信息检索⼯具常⽤的排检⽅法有字序法、类序法。
6.中国特有的⼯具书是类书,政书。
三、问答(24%)1.信息检索的研究内容有哪些?检索理论研究、检索语⾔研究、数据库研究、著录法研究、检索系统研究、检索策略研究、检索服务研究。
2.数据库有哪些类型?传统数据库(情报数据库、图形数据库等);专门应⽤领域的数据库(统计数据库、⼯程数据库、空间数据库;新⼀代数据库(分布式数据库、多媒体数据库、⾯象对象数据库、实时数据库等)。
信息检索基础知识考点整理

信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。
(完整版)信息检索考试重点

新
hing at a time and All things in their being are good for somethin
(二)
1、什么是检索工具?它的主要作用是什么? 答:检索工具是用来存储、报道和检索一次文献的工具,属于二次文献。 主要作用:报导作用、累计作用、查询作用、选择作用。 2、目录、题录、索引、文摘、文献指南各有那种类型? 答:目录可以分为国家目录、馆藏目录、联合目录、出版社与书商目录和专题目录。 题录的类型一般都是用代号表示。 索引类型可分为篇目索引和内容索引 文摘按其内容的详简程度可以分为指示性文摘和报道性文摘;按其适用对象可以分为一 般性文摘和倾向性文摘;按内容性质可以分为综合性文摘和专业性文摘。 文献指南主要介绍该科学和专题的主要文献类型。 3、什么是参考工具书?它有哪些主要作用? 答:参考工具书是根据一定的社会需要,广泛汇集某一范围的知识材料,按一定方式加以 编排,专供人们解释疑惑的特定类型的出版物。 作用:查字词、查事项、查人物、查机构、查产品、查物名、查地名、查年代、查数据。 4、字典和词典、百科全书、年鉴、名录、图录有哪些主要类型? 答:字典类型一般分为两种:○1 详解词典○2 专门词典。 词典从语种文别角度分为:○1 单语言辞典○2 多语言辞典。 从词量规模角度:○1 大型词典○2 中型词典○3 小型词典。 从收录内容角度:○1 百科全书○2 语文词典○3 专门词典。 百科全书分为两种类型:一类是概括人类一切门类知识,包括哲学、社会科学、自然科学 和应用科学等所有门类知识的综合性百科全书。另一类是指内容只收内容某一学科或某个 门类、某个专业的知识信息的专科性百科全书。 年鉴类型分为综合性年鉴、专业性年鉴、统计性年鉴。 名录类型分为人名录、地名录、物名录、机构名录。 图录类型分为地图录、科学技术用图集、历史图谱、文物图谱及人物图录。 (三)
信息检索复习资料(有答案版)

1.请说明一次文献、二次文献和三次文献的特点和功用。
(1)一次文献(Primary Document):通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。
如期刊论文、科技报告、会议论文、专利说明书(2)二次文献(Secondary Document):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。
二次文献的重要性在于可以帮助人们查找一次文献。
如目录、题录、文摘、索引、各种书目数据库(3)三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。
包括综述研究和参考工具两类。
如综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目2.请说明题录目录文摘的特点以及区别(1)题录是揭示和报导单篇文献外表特征的工具。
特点:以单篇文献为著录对象(2)目录是系统积累和提供图书、期刊和其它单行本的名称、收藏单位和索取号等外表特征的揭示和报导的工具。
特点:以单位出版物为著录对象,反映馆藏情况,主要揭示文献外部特征(3)文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。
特点:带摘要的题录3. 布拉德伏特文献文献分散定律和期刊影响因子的概念(1)布拉德福文献分散定律:本专业文献的1/3刊登在本专业核心期刊上,另外的2/3则分散在其他的相关期刊和边缘期刊上。
如果将科技期刊按其刊载某专业论文数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2......的关系。
(2)期刊影响因子的概念是:某一种期刊在第三年得到的前两年的引文数与该刊前两年的总论文数之比。
4. 请阐述信息、知识、情报的概念,并分析它们三者之间的关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机信息检索复习知识点第一章1、人类生活的3个基本要素是材料、能源和信息。
(单选)2、信息是指应用文字、数据或信号等形式,通过一定的传输和处理,来表达各种相互联系的客观事务在运动中所具有的特征性内容夫人总称。
(名词)3、信息的特征有:客观性、动态性、相对性、依存性、可传递性。
(多选)4、共享性是指同一内容的信息可以在同一时间里被多个信息用户使用。
5、信息的功能有哪些?(简答)(1)信息是感知世界的中介;(2)信息是管理决策的依据;(3)信息是科学研究的必要条件;(4)信息是社会发展的资源;6、信息的类型有哪些?(论述)(1)按信息的表达形式划分,可以分为①文献信息②声像信息③电子信息(2)按信息的应用范围划分,可分为①白色信息②灰色信息③黑色信息(3)按信息的加工层次划分①一次信息②二次信息③三次信息7、信息需要:所谓信息需要,就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题而产生的对信息的需要。
(名词)8、信息需求的特征有哪些?广泛性、社会性、发展性、多样性(多选)9、现代信息技术的基础是微电子技术(单选)10、数据库是指为满足多个用户的多种应用需要,按一定的数据模型在计算机中组织、存储和使用的相互联系的数据集合。
(名词、单选)11、通信系统的基本组成包括信源和:信宿、变换器、反应器、信道、噪声源12、信号的接收者称为信宿13、信息传输的通道称为信道14、信号在传输过程中受到的干扰称为噪声15、数据库简称DB16、数据库的四种基本操作是:检索、更新、删除、插入17、数据库的特点有哪些?(简答)(1)数据共享;(2)面向全组织的数据结构化;(3)数据独立性;(4)可控数据冗余度;(5)统一数据控制功能。
18、数据结构化有利于实现数据共享19、数据库管理系统可以提供哪些方面的数据控制功能:安全性、完整性、并发控制、数据恢复20、构成数据库的三个主要层次是:文档、字段、记录21、记录的基本单元是:字段22、文档的基本单元是记录23、一个文档中你好,认识一下!包含大量的记录24、检索系统提供的数据库相关文档组成包括的文件数是3个25、顺排文档:按记录的存取号的大小顺序存入全部记录,它相当于印刷型检索工具的正文部分。
26、倒排文档:把记录中的可检字段抽出,包括单元词、多元词,按某种顺序重新加以组织后得到的一种文档。
27、倒排文档只包括记录的标识、信息的数量及信息存取号。
28、存储了数据库所有记录的特征标识的是倒排文档29、数据库文档中便于随机存取,实现非顺序存储结构的文件是索引文档30、传统的检索对象主要是文献型的信息源31、传统的检索对象的存储介质是纸张32、对超文本、超媒体信息资源实施的检索是超维检索第二章1、计算机信息检索经历了哪几个主要发展阶段?(简答)(1)脱机批处理检索阶段;(2)脱机检索阶段;(3)光盘检索阶段;(4)网络化检索阶段2、计算机信息检索必备的条件是物质和人员3、计算机检索的类型有哪些?(论述)计算机信息检索的类型可以通过检索的内容、信息出版的时间和检索工作的方式加以划分1根据计算机信息检索的内容划分,检索可以分为(1)数据检索;(2)事实检索;(3)文献检索2根据被检索信息出版的时间划分,可分为:(1)定题信息检索;(2)回溯性信息检索3根据计算机检索工作的方式划分,可分为:脱机检索系统;(2)联机检索系统4、事实检索的对象是事实5、检索结果能够满足用户需要的文献线索或文献全文的是文献检索6、回溯性信息检索:根据用户提供某一段时间范围内的文献信息的检索方法7、计算机批处理的信息检索系统称为脱机检索系统8、用户以联机会话方式直接访问系统及其数据库的信息检索系统称为联机检索系统9、信息检索系统:是指按照某种方式、方法见利起来的供读者检索信息的一种有层次的体系,是表征有序的信息特征的集合体。
10、信息检索系统的职能有:报道职能、存储职能、检索职能11、信息数据库可以划分为:参考数据库、源数据库、混合型数据库12、参考数据库:是指用户从中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库13、源数据库:能够直接为用户提供原始资料或具体数据的一类数据库。
14、信息系统的构成模式是什么?(简答)(1)信息数据的选择、处理、录入和维护子系统;(2)词表和标引子系统;(3)检索子系统;(4)系统----用户接口子系统统15、信息检索系统的存储结构有:印刷存储、微缩存储、磁存储、半导体存储、光存储16、信息存储的逻辑结构有:线性结构、非线性结构、树形结构、网形结构17、数据元素按一定顺序构成一个有限序列的信息存储结构称为:线性结构18、非线性结构中最常用的的是树形结构和网形结构19、将信息用二进制表示称为编码20、计算机处理信息的最小单位是一位二进制数21、两级存储器是指主存储器和辅助存储器22、信息检索的概念起源自文献信息检索23、对信息进行主题分析,提取代表该信息的特征的过程称为标引24、自动抽词标引:利用计算机直接从信息正文、标题或文摘中抽出能表达信息主题的关键词作为标引词,并自动生成关键词索引或倒排文档。
25、对一本书或一篇文章所做的扼要摘述称为文摘26、利用计算机自动编制文摘称为自动文摘27、在信息检索自动化处理中,常用的运算是排序28、常用的自动排序的方法有选择排序和快速排序29、存储区域网简称为SAN30、目前大多数中小企业见利网络环境的协议基础是TCP/IP31、信息检索系统的组织:为了控制信息的流速和流向、数量和质量等,把传递中的杂乱无序的信息整理为系统有序状态的活动。
32、信息检索系统的组织目的是什么?(简答)(1)减少社会信息流的混乱程度;(2)提高信息系统的质量和价值;(3)建立信息检索系统与用户的联系;(4)节省社会信息活动的总成本。
33、信息检索系统的组织的要求有哪些(1)信息内容有序化;(2)信息流向明确化;(3)信息流速适度化;(4)信息质量最优化。
34、信息检索系统组织方法:是指对每一信息的各种外表特征和内容特征进行描述并确定其标识,然后按一定方式或规则将其内容组织起来以供检索的方法35、信息检索系统的传统组织方法有哪些?(1)分类组织法;(2)主题组织法;(3)字顺组织法;(4)号码组织法;(5)自然组织法36、进行网络信息资源组织的方式主要有:文件组织方式、主题树组织方式、超文本组织方式、超媒体组织方式、元数据组织法37、以文件为单位共享和传输信息的组织方式称为文件组织方式;38、超文本的信息组织方法是非线性;39、元数据又称描述数据;40、对初选信息的鉴别、筛选和删除称为优化;41、优化选择的方法有:比较法、分析法、核查法、引用摘录法、专家评估法42、检索语言:检索信息所使用的人工语言;43、登录在类表、词表中的所有标识称为词汇44、检索语言的作用有哪些?(简答)(1)对信息内容进行主题分析;(2)便于将标引、检索用的标识符进行相符性比较,保证检索和标引的一致性;(3)保证检索结果和检索要求的一致性;(4)保证信息存储集中化和系统化45分类语言的基础是科学分类46主题语言是使用词语标识的一类信息检索语言,称为主题法47、把主题词按照一种便于检索的方式编排起来,称为主题词48、关键词:从信息的题名、摘要和内容中抽取出来的,能够表达信息主题内容的具有检索意义的关键性词汇。
49、叙词:是指从自然语言中优选出来并经过规范化处理的名词术语,属于后组式语言的一种,是采用表示单元概念的规范化语词的组合来对信息主题或内容进行描述的标识系统。
50、叙词的特点:专指性、直观性、多维检索、适应性、网络结构51、按照学科体系进行系统排列的语言称为分类语言52、按照主题词的字顺序列排列的语言称为主题语言53、计算机信息检索是指利用计算机存储信息和检索信息54、进入检索的入口称为检索途径55、按学科分类体系查找信息的途径称为分类检索56、利用信息主题内容进行检索的途径称为主题检索57、选择实现检索计划的具体方法和手段是选择检索方法58、利用检索系统查找信息的方法称为工具法59、信息检索策略:将课题的提问及其检索词与检索系统的收录内容、编排特点相匹配而确定的检索方案或程序。
60、检索效果:是指信息系统检索信息的有效程度,反映了信息系统的检索能力61、查全率:检索出的相关信息量与信息系统中的相关信息量之比62、查准率:检索出的相关信息量和检索出的信息总量之比。
63、衡量检索效果的相对合理指标是差准率和查全率第三章1、布尔逻辑检索:是指通过标准的布尔逻辑关系词来表达检索词与检索词之间逻辑关系的检索方法。
2、布尔逻辑运算符有:逻辑与、逻辑或、逻辑非3、INTERNET上信息出传输的主要方式是FTP4、检索者将检索词在他认为合适的地方截断称为截词5、限制检索:在检索系统中,使用缩小和限定检索范围的方法称为限制检索6、邻近检索:通过专门符号来规定检索词在结果中的相对位置7、中级检索技术包括哪些内容?(1)加权检索技术;(2)自然语言检索技术;(3)相关信息反馈检索技术;(4)模糊检索技术;(5)概念检索技术。
8、自然语言处理应用领域之一是信息检索9、概念层次网络简称HNC10、自然语言处理技术可以分为机器翻译、语义处理以及人机会话11、搜索引擎用到的自然语言处理技术是机器翻译与语义处理12、实现只能搜获的过程主要分为:语义处理、知识管理、知识检索13、从用户角度看,用户可以分为最终用户和职业用户14、信息检索发展史上的突破是应用了自然语言检索15、智能代理资源管理器的基本结构是:适配器、引擎、知识、库、视图16、智能代理信息检索系统的特点有哪些?(论述)(1)智能代理侧重于面向用户。
(2)智能代理主要借助知识库、数据库,并参考用户需求习惯和一段时期内的偏好,推断用户提问的真实意图,提高检索的专指性。
(3)智能代理采用机器学习、用户框架模型、推理机制主动协助用户查找信息。
(4)智能代理不仅是关键字的匹配,而且是基于概念和知识的检索。
(5)智能代理能不断了解用户需求的变化,并根据用户的反馈信息及时修正检索目标策略。
(6)智能代理能分离发送请求和接收结果,使它们异步进行。
(7)智能代理能使用户按照个人的兴趣爱好进行信息分类。
17人们进行信息检索时总是期望获得较高的查全率和查准率18对信息进行采集、标引、存储、处理,最后形成信息集合体19、通过模拟自然进化过程搜索最优解的方法称为遗传算法20、搜索引擎和挖掘引擎处理的都是字串和文本21、数据挖掘也称知识发现22、聚类:按照事物的某些属性,把事物聚集成类,使类间的相似性尽量小,类内相似性尽量大23、一种很有效的预测模型技术是神经元网络第四章1.INTERNET起源于ARPANET2、我国的四大互联网络是:中国科技网、中国教育科研网、中国公用互联网、中国公用经济信息网3、INTERNET提供的基本信息服务有:电子邮件、文件传输、远程登陆、电子公告板、网络新闻组4、可以在异地主机上登陆注册的服务是TELNET5、通过专用电缆与INTERNET主干网直接连接在一起的称为专线连接6、综合业务数字网简称ISDN7、非对称数字用户环路简称ADSL8、网络信息资源主要类型是联机检索系信息资源和网络信息资源9、联机检索信息资源的主要表现形式是联机数据库10、文件传输协议是FTP11、网络信息资源进行组织的主要方式有:文件方式、主题树方式、超文本方式、数据库方式、超媒体方式、元数据方式。