信息存储与检索 考试必看
信息存储与检索重点

内容的揭示深度和检索入口,并直接影响
到用户查询的检索方式和检索途径。其功
能是用系统规定的规范化词语描述用户的
检索询问,包括对用户询问进行概念分析
和概念转换两个过程,也包括按照系统的
既定规则制定检索策略和构建检索式。该
子系统完成对数据库的查找过程,并与交
互子系统共同完成信息检索系统的检索功
能。
19
《信息存储与检索》
22
2.2.1 布尔模型
❖定义 对于布尔模型而言,标引词权值变量都是二 值的,即wi,j∈{0, 1},查询q是一个常规的布尔表达 式。用qdnf表示查询q的析取范式,qcc表示qdnf的任意 合取分量。文档dj和查询q的相似度可以定义为:
sim(d
j
,
q)
1
0
如果qcc (qcc qdnf ) (ki , gi (d j ) gi (qcc )) 其它
现 实 的
(2)表示机理
信 息
需 求
(3)比较机理
输出检索结果 图1-2 信息检索的一致性匹配作用机理
(4)判断机理 (5)选择机理
5
《信息存储与检索》
1.1.2 信息检索的原理
1、提取机理:从现实的信息和现实的需求 中提取出能够揭示特定信息和特定需求的语 法特征和语义特征。可以归纳为内容特征和 形式特征。
交 互 子 系 统 用户群
词语子系统 查 询 子 系 统
数据库
匹配子系统
图1-9 信息检索系统逻辑结构
标
采
引
选
子
子
系
系
统
统
信息源
16
《信息存储与检索》
1.2.4 信息检索系统的逻辑结构
信息检索原理期末重点背诵知识点

信息检索1、信息检索概念:P12、信息检索的原理一整节内容要自己理解:P3-P4图1-1要掌握文献替代和文献整序的概念要掌握3、信息检索在历史上的不同表现:联机检索、光盘检索、网络检索的区别和特征:P6-P94、信息检索的模型概念:P95、布尔模型、向量空间模型、经典概率模型要理解并掌握各自的优缺点:P11-P126、信息检索系统的概念:P127、检索效果的评价指标:P15-P164个指标:查全率、查准率、漏检率、误检率掌握它们的含义并懂得计算8、网络检索的表达式:布尔逻辑检索、邻近检索、短语检索、截词检索的特点、区别和联系:P17-P219、信息检索的技巧要理解尤其是要掌握及时调整检索策略:P33-P3610、搜索引擎的概念:P3711、数据库知识,实验内容,特点12、引文的概念13、搜索引擎的分类:P40-41搜索引擎划分的类别以及元搜索引擎的概念要掌握12、CBR概念P11312、多媒体信息检索的原理和方法:P110-P114其中要重点理解基于内容的多媒体信息检索的检索形式(可以结合课件)13、专利的概念:P12514、专利的类型:P126(理解一下各类型的区别)15、专利文献的概念:P12716、专利文献的类型:P127(理解一下各类型的区别)17、灰色文献的概念:P14718、会议文献的概念:P15819、科技报告的概念:P16320、查新的概念:P20021、科技查新的作用:P201(每一个小标题后面要自己展开一段)关于上课讲的那几个数据库大家自己看一下PPT,掌握一下。
以上纯属个人观点题型:名词解释:5*4=20简答题:4*10=40论述题:2*20=40考试时间:1月8日上午:9:00—11:001.信息检索的概念(P1)信息检索有广义和狭义两重含义。
广义上说,信息检索是指将信息按照一定的方式组织和存储起来,并根据信息用户的需求查找相关信息的过程。
它包含信息存储和信息查找两个过程。
信息存储与检索考试必看

信息存储与检索考试必看一、填空1、信息资源的特征:共享性、时效性、智能性、无限性和有线性并存、增值性及物质、资源的一般特征。
2、纸质文件按文献加工深度划分:一次文献、二次文献、三次文献、零次文献。
3、索引款目的构成:索引标题、说明语、地址参考项。
4、多媒体存取技术的核心是:媒体数据库技术。
5、网络信息检索工具有:字典型查询工具、索引型查询工具、交互式检索工具。
6、按系统存取的信息特征划分:文献存取系统、事实存取系统、数值存取系统、图像存取系统。
7、按检索工具划分:关键词检索工具、分类目录、混合型检索工具。
8、纸质文献资源的四个基本要素:信息内容、载体材料、记录符号和记录方式。
9、按检索系统的工作方式划分:脱机存取、联机存取、光盘存取、因特网存取。
10、文献存取系统包括:书目、全本和超文本。
11、存取系统的检索效果指标:检全率、检准率、检新率。
12、多元性检索工具:13、中文搜索引擎:谷歌、百度、雅虎、中国搜索、搜狗搜索等。
(三个可)14、多媒体信息存取系统的特征:信息载体的多样性、交互性、实时性、集成性。
二、名称解释:1、电子信息资源是以数字化形式把文字、图像、声音、动画等多种形式的信息存储在光、磁盘等非印刷型介质上,并以光信号、电信号的形式传输,通过相应的计算机和其他外部设备再现出来的信息资源。
2、索引是存取信息资源“地址”或“出处”的表示系统,是信息存储与检索的基本形式。
其基本功能是指示知识点在正文或文献款目中得位置。
3、标准文献狭义指按规定程序制订,经公认权威机构(主管机关)批准的一整套在特定范围(领域)内必须执行的规格、规则、技术要求等规范性文献,简称标准。
广义指与标准化工作有关的一切文献。
4、网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。
具体的说是指所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。
信息检索考试重点

名词解释4*4’1.信息素质:个体在现实需求的驱动下,能有效地发现、获取、评价和利用信息。
2.信息检索广义的信息检索全称是“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
狭义的信息检索“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。
3.登记性目录(概念)也叫国家书目,它是出版物国家登记制度的产物,反映国家出版的全部图书,实际上也反映了一个国家的文化、科学和出版业的水平。
4.联合目录(概念)汇总若干个单位馆藏而形成的目录,是馆藏目录的放大。
5.年鉴(概念)年鉴是汇辑一年内的重要时事文献、学科进展,汇辑各种统计资料和重要信息,并按年度出版的连续性出版物。
6.OPAC(公共联机书目查询系统)利用计算机终端来查询基于图书馆局域网内的馆藏数据资源的一种现代化检索方式,通过联机查找为读者提供馆藏文献的线索。
7.引文索引(概念)根据美国科学信息研究所(Institute for Scientific Information,简称ISI)的定义:对于文献A和B:若文献B提到或引用了文献A,则A是B的引文。
这里,文献A被文献B 提到或引用,A是被引用文献或参考文献。
同时由于B引用了A,故B又称为引用文献。
8.垂直搜索引擎(概念)也被称为专业搜索引擎,或主题搜索引擎。
它专门收录某一方面、某一行业或某一主题内的信息,专为查询某一个学科或某一主题的信息提供检索服务,在解决某些实际查询问题的时候比综合搜索引擎更有效。
简答4*9’信息素质包含四个层面的含义:第一,用户有一定的信息需求,即在某个时候需要了解某方面信息。
第二,掌握了主要的信息源和信息工具的知识及技能。
第三,能够分析评价选择相关信息。
第四,利用信息的目的是为了有效地解决具体问题。
信息素质主要表现为信息理论素养和信息的实践能力,包括信息意识、信息知识、信息能力和信息道德等内容。
信息存储与检索复习资料答案

一、单项选择题1. 以下哪个数据库提供同名作者检索功能:(D )A.万方数据库 B.中国期刊全文数据库C.复印报刊资料全文数据库 D.中文科技期刊全文数据库2. _______提供一次文献的线索。
( B ) A.文摘、索引等 B.图书 C.百科全书 D.手册3. 以下属于特种文献的是( B )。
A.图书B.科技报告C.报纸 D.期刊4. 用主题词检索只可以检索出对应的()5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权~6. 利用分类途径进行检索,其检索标识为( C ) A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献( C )A. Journal B. Report C. Conference D. Patent8. 下列选项中,不属于信息能力的有( B ) A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指(专利注明书)10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这个按钮的作用是什么( D )A.测试你当天的手气 B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的链接D.直接跳转到系统认为是最相关的页面…11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况( D )A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程( C )A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为( C )。
A.主题词 B.关键词 C.分类号 D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找( C. )A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统…15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好( C )A.关键词摘要 intitle: 知识管理B.论文知识管理 PDFC.学术论文知识管理D.学术论文 intitle:知识管理16. 在中国知网提供的检索服务中,(检索词扩展)起到扩展检索的作用。
信息检索考试大一下知识点

信息检索考试大一下知识点信息检索是指从大量的信息中快速找到满足特定需求的信息过程。
在大一下学期的信息检索考试中,通常会涉及以下几个知识点:一、信息检索基础概念1. 信息检索的定义和目的信息检索是指通过使用计算机技术,在海量信息中寻找到与用户需求相匹配的信息。
其目的是快速、准确地获取到用户所需的信息。
2. 检索模型和流程信息检索基于检索模型,常见的模型包括布尔模型、向量空间模型和概率模型。
检索流程一般包括问题建模、索引构建、查询处理和结果排序等步骤。
二、关键词检索1. 关键词的选择与组合在进行信息检索时,关键词的选择和组合非常重要。
关键词应该准确描述用户需求,并且能够尽可能覆盖相关领域的信息。
2. 布尔查询与逻辑运算符布尔查询是一种基础的检索方式,通过使用逻辑运算符(AND、OR、NOT)对关键词进行组合,从而获得符合用户需求的信息。
三、索引构建与检索技术1. 逆向索引逆向索引是一种常用的索引结构,它通过将文档中的每个单词与包含该单词的文档进行关联,实现了关键词到文档的快速定位。
2. 向量空间模型向量空间模型将文档和查询都表示为向量,在向量空间中进行计算,通过计算文档与查询之间的相似度来判断文档的相关性。
3. 布尔模型的实现与优化布尔模型的实现与优化涉及到倒排索引的构建与压缩、布尔运算的优化算法等方面的技术。
四、评价与改进1. 检索结果的评价对于检索系统的性能评价,一般使用准确率、召回率、F值等指标来衡量检索的有效性和完整性。
2. 改进方法与技术为了提升检索系统的性能,可以采用词干提取、查询扩展、排名算法优化等方式进行改进。
五、实际应用与发展趋势1. 商业搜索引擎与个性化推荐商业搜索引擎通过不断改进和优化信息检索技术,提供高效准确的搜索服务。
个性化推荐则基于用户的兴趣和行为,向用户推荐符合其需求的信息。
2. 大数据与信息检索随着大数据时代的到来,信息检索面临着处理海量数据的挑战。
如何有效地利用大数据技术来进行信息检索是当前的研究热点之一。
信息存储与检索

信息存储与检索一. 填空题:1.信息存储与检索的对象是:(P1)(信息资源)。
2. 信息资源基本特征:(P4)( 1.共享性,2.时效性,3.智能型,4.无限性与有限性并存,5. 增值性)。
3. 信息资源按信息资源产生的先后和加工深度可划分为:一次信息资源,二次信息资源,三次信息资源。
4. 纸质文献资源的存储与组织的4个基本要素( P18):( 信息内容,载体材料,记录符号和记录方式)。
5. 信息存储与检索类型,按检索系统的工作方式划分(P45):脱机存取、联机存取、光盘存取、因特网存取。
6. 按文献的加工深度划分:(P23) ((1)一次文献,(2)二次文献,(3)三次文献,(4)零次文献)。
7. 索引款目的组成(P50):(索引标题词,说明语,和地址参照项)。
8. 多媒体存取技术的核心是:媒体数据库技术。
9. 从网络存取技术查询内容和功能来看,网络信息检索工具可分为3种类型(P73)(按查询内容和功能划分):( 字典型查询工具,索引型查询工具,交互式检索工具 )。
10. 计算机信息存取系统类型按系统存取的信息特征划分。
(P117)(文献存取系统,事实存取系统,数值存取系统,图像存取系统)。
11.存取系统的检索效果指标(P131):检全率、检准率、检新率。
12. 按检索机制划分检索工具(P196):( 关键词检索工具,分类目录,混合型检索工具)。
13. 文献存取系统包括(P117):书目(目录,题录,文摘)、全文和超文本。
14. 中文搜索引擎(P211):谷歌、百度、雅虎、中国搜索、搜狗搜索,爱问搜索引擎等。
(三个可)15. 多元性检索工具分类(P217):并行处理引擎,串行处理引擎和ALL_IN_ONE方式。
16.多媒体信息存取系统的特征(P304):信息载体的多样性、交互性、实时性、集成性。
17. 信息资源是经过人类主观或客观处理了的,并且能够被传播或传输的文字,声音,图像,数据。
二. 名称解释:1. 电子信息资源(P7):是以数字化形式(即二进制代码0,1)把文字、图像、声音、动画等多种形式的信息存储在光、磁等非印刷型介质上,并以光信号、电信号的形式传输,通过相应的计算机和其他外部设备再现出来的信息资源。
信息存储与检索复习资料PPT课件

❖ 人工采选:信息资源的采集和录入均由人工完成。
❖ 人机结合采选:人机合理分工——大量的采集任务可以通 过计算机的扫描、复制、链接、合并、格式转换等处理来完 成
❖ 自动采选:即在无人工干预的情况下由计算机自动完成。
22
可编辑
1.2.4 信息检索系统的逻辑结构
2.词语子系统 功能:对采用规范化词语的系统在标引和查询时所使
(1)目标 (2)功能 (3)资源 (4)设备 (5)方法 (6)人员 概括地说,信息检索系统就是专门进行信息的收集、处理、存
储、检索并满足用户信息需求的系统。
16
可编辑
1.2.2 信息检索系统的类型
见P9 (1)书本式检索系统。 (2)卡片式检索系统。 (3)机械式检索系统。 (4)缩微式检索系统。 (5)计算机检索系统。 (6)网络检索系统。
9
可编辑
1.1.2 信息检索的原理
5、课程内容安排 第一章 信息检索概述(教材第一章) 第二章 信息检索模型(教材第二章) 第三章 文本信息处理技术(涉及到本教材第三章) 第四章 文本信息存储技术(涉及到本教材第三章) 第五章 文本信息检索技术(涉及到本教材第三章) 第六章 Web信息存储与检索(教材第五章)
❖ 搜索器(Spider或Robot); ❖ 索引器(Indexer); ❖ 检索器(Searcher)。
从检索效率上讲,联机检索与光盘检索的检索效率比较高,与网络检 索(搜索引擎检索相比),它们的检索指令完备、检索功能强大、支持 多种检索技术,提供跨库检索手段,查全率和查准率都比较高。但搜索 引擎胜在用户界面友好、使用方便简单。
23
可编辑
1.2.4 信息检索系统的逻辑结构
3、信息标引子系统 功能:按照一定的词表,对信息赋予标引词,以表征信息的特征,形成信
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、填空
1、信息资源的特征:共享性、时效性、智能性、无限性和有线性并存、增值性及物质、
资源的一般特征。
2、纸质文件按文献加工深度划分:一次文献、二次文献、三次文献、零次文献。
3、索引款目的构成:索引标题、说明语、地址参考项。
4、多媒体存取技术的核心是:媒体数据库技术。
5、网络信息检索工具有:字典型查询工具、索引型查询工具、交互式检索工具。
6、按系统存取的信息特征划分:文献存取系统、事实存取系统、数值存取系统、图像
存取系统。
7、按检索工具划分:关键词检索工具、分类目录、混合型检索工具。
8、纸质文献资源的四个基本要素:信息内容、载体材料、记录符号和记录方式。
9、按检索系统的工作方式划分:脱机存取、联机存取、光盘存取、因特网存取。
10、文献存取系统包括:书目、全本和超文本。
11、存取系统的检索效果指标:检全率、检准率、检新率。
12、多元性检索工具:
13、中文搜索引擎:谷歌、百度、雅虎、中国搜索、搜狗搜索等。
(三个可)
14、多媒体信息存取系统的特征:信息载体的多样性、交互性、实时性、集成性。
二、名称解释:
1、电子信息资源是以数字化形式把文字、图像、声音、动画等多种形式的信息存储在
光、磁盘等非印刷型介质上,并以光信号、电信号的形式传输,通过相应的计算机和其他外部设备再现出来的信息资源。
2、索引是存取信息资源“地址”或“出处”的表示系统,是信息存储与检索的基本形
式。
其基本功能是指示知识点在正文或文献款目中得位置。
3、标准文献狭义指按规定程序制订,经公认权威机构(主管机关)批准的一整套在特定
范围(领域)内必须执行的规格、规则、技术要求等规范性文献,简称标准。
广义指与标准化工作有关的一切文献。
4、网络信息资源是指通过计算机网络可以利用的各种信息资源的总和。
具体的说是指
所有以电子数据形式把文字、图像、声音、动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。
5、智能检索以文献和检索词的相关度为基础,综合考查文献的重要性等指标,对检索
结果进行排序,以提供更高的检索效率。
它是由智能计算机技术与全文检索技术综合发展起来的一种新型检索技术。
6、视频存取技术是近几年来在数字通信、电视和电子计算机技术三者相结合的基础上
发展起来的一种新型的信息存取技术,分为广播式和交互式两种。
7、题名索引是将信息资源的题名特征(书名、刊名、篇名)作为索引标题词所编制的
索引系统。
8、目录是书籍正文前所载的目次,是揭示和报道图书的工具目录是记录图书的书名、
著者、出版与收藏等情况,按照一定的次序编排而成,为反映馆范、指导阅读、检索图书的工具。
9、检索语言是根据信息检索的需要而创制的,能够唯一地表达各种概括文献信息内容
的概念,能够显示概念之间的相互关系,并便于进行系统排列,便于将标引语言和检索用语进行相符性比较的人工语言。
10、信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
一般是通过信息存取系统实现的,通常包括四种
类型:关于文献的检索、关于某事实或事项的知识检索、关于数值或数据的情报检索、关于图像信息的信息检索。
11、顺排文档指将文档中的全部记录按照存取号从小到大依次存取信息,顺序号越小,记录存入数据库的时间越早,反之,存入的时间越晚。
也称为线性文档。
12、科技查新是文献检索和情报调研相结合的情报研究工作,它以文献为基础,以文献检索和情报调研为手段,以检出结果为依据,通过综合分析,对查新项目的新颖性进行情报学审查,写出有依据、有分析、有对比、有结论的查新报告。
也就是说查新是以通过检出文献的客观事实来对项目的新颖性做出结论。
三、简答
1、电子图书的特点:电子图书除了具备传统图书的外,还有以下几个特点:存储形式多样化、资源数字化、可交流程度高、方便利用、内容丰富、载体容量大。
2、网络信息选择标准即在进行信息检索时,网络信息选择的标准。
主要有以下几种:1)文献检索是以文献为检索对象的检索。
可分为全文检索和书目检索两种;2)数据检索是以数值或数据(包括数据、图表、公式等)为对象的检索;3)事实检索是以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检索。
3、搜索引擎的选择与比较:(选择和比较一种搜索引擎应考虑什么)1、速度(信息查询的速度、信息的更新速度即数据更新的频率)2 返回的信息量(这是衡量一个搜索引擎数据库内容大小的重要指标,如果它返回的有效信息量多,就说明这个站点收录的信息范围广,数据容量大,就能给用户提供更多的信息资源。
)3、信息相关度即检准率;
4、易用性(查询是否方便)
5、稳定性:好的搜索引擎站点,它的服务器和数据库应非常稳定,这样才能保证为用户提供安全可靠的查询服务。
4、任意6种网络技术名称:
5、信息检索基本步骤:(1)分析检索课题,明确检索需求;(2)制定检索策略;(3)选择检索系统与数据库;(4)确定检索词和检索途径,编制逻辑检索式;
(5)检索策略的调整。
6、文献信息资源类型:按加工情况分,可有一次文献、二次文献和三次文献;按载体
形式分,可有书写文献、印刷文献、缩微文献、音像文献、机读文献等;按内容的学科范围分,则有社科文献、科技文献等。
按文献表现形式特征有11类:图书、报刊、学位论文、会议资料、专利文献、科技报告、产品资料、科技档案、标准资料、政府出版物和网络文本。
7、网络信息资源特点:1、数量庞大、增长迅速;2、内容丰富、覆盖面广;3、表现
形式多样;4、分布的非均衡性;5、传输速度快; 6、共享程度高;7、交互性强;
8、使用成本低; 9、变化频繁、难测;10、质量良莠不齐。
8、计算机存取系统子系统有哪些?
答:主要有:输入子系统、处理子系统、存储子系统、传输子系统、输出子系统、控制子系统。
四、论述:独立型搜索引擎的工作机制.
信息搜集系统从一个或一组已知的URL 开始访问互联网,下载相关的网页信息及新的链接, 以一定的策略遍历新链接, 并读取新链接的信息内容, 将它们加入到本地数据库。
然后, 由分析索引模块对这些数据进行处理组织后, 形成索引数据库。
用户通过检索模块提交查询服务, 在搜索框中输入检索式, 系统就会自动
完成, 并按一定的排列方式返回检索结果
五、谈谈你对学习信息存储与检索课程理论知识的认识
答案可能不是很准确谅解!!!。