6.信息检索

合集下载

信息检索的原理

信息检索的原理

信息检索的原理
信息检索的原理是通过对大量文本语料进行分析和索引建立,以便在用户提出查询需求时能够快速地找到相关的文档或资源。

具体来说,信息检索的原理包括以下几个步骤:
1. 文本预处理:对原始文本进行分词、去除停用词、词干提取等处理,以减少噪音和冗余信息,并将文本转换为机器可理解的形式。

2. 建立索引:将预处理后的文本建立索引结构,例如倒排索引。

倒排索引是一种将词与其所在文档的映射关系存储起来的数据结构,可以快速地定位到包含特定词语的文档。

3. 查询处理:当用户提出查询请求时,系统会将查询语句进行与建立的索引进行匹配,例如找到包含所有查询词的文档。

查询可以采用布尔查询、向量空间模型、语义匹配等不同方法。

4. 相关度排序:根据查询结果的相关度对文档进行排序,以便用户能够优先查看最相关的文档。

排序可以使用向量空间模型中的余弦相似度、BM25等算法。

5. 结果展示:将排序后的结果展示给用户,通常包括一部分摘要或关键词高亮,以帮助用户快速浏览和判断文档的相关性。

信息检索的原理可以借助计算机算法的高效执行,为用户提供精确、快速和准确的结果。

不同的信息检索系统可能采用不同
的算法和技术,但核心思想是通过对文本的分析和索引建立,找到与用户查询相关的文档或资源。

信息检索名词解释与简答 答案

信息检索名词解释与简答 答案

●名词解释●信息检索●广义的信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术。

狭义的信息检索是指从信息集合中找到所需信息的过程。

●信息素养●信息素养是指判断何时、何地需要信息,并有效地定位、获取、评价和利用信息的一系列能力的总和。

●信息意识●信息意识又称信息观念,是人们对信息需求的自觉反映,即对信息的捕捉、分析、判断和吸收的敏感性。

●信息能力●是人们有效快速的获取、加工、存储、利用和传递信息的能力。

●信息道德●是指在整个信息活动中,信息创建者、信息服务提供者和信息使用者所必须要遵守的社会法律法规和行为准则。

●零次文献●是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等。

●一次文献●指以作者本人的研究成果为依据而撰写并公开发表或出版的信息。

●二次文献●是对一定范围、时间或类型的大量一次文献按其特征收集整理、压缩、加工,并按一定顺序组织编排、用于检索查找利用这些文献而编制的文献。

如书目、索引、文摘、题录、简介等。

●三次文献●三次文献是在充分利用二次文献的基础上对一次文献做出的系统整理和概括的论述,并加以分析综合编写而成的概括性文献。

●主题词●是以自然语言为基础,以概念组配为基本原理,并经过规范化处理,表达主题的最小概念单元,作为信息存储和检索依据的一种检索语言。

●关键词●关键词是出现在文献题名、文摘、正文中,能够表达文献主题,具有检索意义的语词。

●叙词●所谓叙词,是指从自然语言中优选出来并经过规范化处理的术语,又称主题词。

●查全率●查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。

●查全率=【检出相关文献量/文献库内相关文献总量】×100%●查准率●查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。

信息检索答案

信息检索答案

第一章(共58題)1.下列哪项工具书不是资料性工具书()。

DA.类书 B.百科全书 C.年鉴 D.索引2.下列哪项工具书是资料性工具书()。

CA.字典 B.书目 C.年鉴 D.索引3.检索工具的特点是()。

CA.完整性、分散性、查考性 B.综合性、参考性、易检性C.完整性、易检性、查考性 D.易检性、综合性、分散性4.下列哪项不是印刷版工具书的排检方法()。

BA.部首法 B.检索词 C.拼音法 D.笔画笔形法5.高级检索不包括的检索技术是()。

CA.截词检索 B.布尔逻辑检索 C.嵌入检索 D.位置检索6.布尔逻辑运算符中表示逻辑“与”的符号是()。

CA.+ B.- C. * D./7. 布尔逻辑运算符中表示逻辑“或”的符号是()。

AA.+ B.- C. * D./8. 布尔逻辑运算符中表示逻辑“非”的符号是()。

BA.+ B.- C. * D./9.高级检索的检索特点是()。

DA.组配检索、清晰检索、限定检索 B.清晰检索、限定检索、模糊检索C.组配检索、清晰检索、模糊检索 D.组配检索、模糊检索、限定检索10.“中国大学”这个检索词中,中间共嵌入了几个检索词()。

AA.3个 B.6个 C.9个 D.不确定11.WWW检索工具,主要检索WWW站点上的资源,通常称为搜索引擎,常用的搜索引擎有很多,下列哪个不是搜索引擎的网址()。

DA. B.C. D.12. 信息检索中的检索词可分为四类,下列哪一项不属于检索词的分类()。

DA.表示主题的检索词 B.表示作者的检索词C.表示分类的检索词 D.表示数据的检索词13.手册的基本特点是()。

DA.侧重揭示文献内部特征B.内容新颖,连续出版C.著录内容标明出处D.所收资料侧重基础知识,注重实用性14书目数据库主要提供的是()BA.一次文献B.二次文献C.三次文献D.零次文献15.索引数据库主要提供的是()BA.一次文献B.二次文献C.三次文献D.零次文献16.被称为“检索性文献”的文献是()BA.一次文献B.二次文献C.三次文献D.零次文献17.被称为“线索性文献”的文献是()BA.一次文献B.二次文献C.三次文献D.零次文献18.综述主要提供的是()CA.一次文献B.二次文献C.三次文献D.零次文献19.述评主要提供的是()CA.一次文献B.二次文献C.三次文献D.零次文献20.一次文献具有的特点是()AA.原创性 B.检索性 C.综合性 D.参考性21.二次文献具有的特点是()BA.原创性 B.检索性 C.综合性 D.参考性22.三次文献具有的特点是()DA.原创性 B.检索性 C.分散性 D.参考性23.被称为“参考性文献”的文献是()CA.一次文献B.二次文献C.三次文献D.零次文献24.被称为“研究文献的文献”的是()CA.一次文献B.二次文献C.三次文献D.零次文献25.被称为“原始文献”的文献是()AA.一次文献B.二次文献C.三次文献D.零次文献26.被称为“第一手资料”的文献是()AA.一次文献B.二次文献C.三次文献D.零次文献27.下列哪项是年鉴的基本特征:()BA.揭示文献内容出处B.连续出版C.以编年形式D.提供形象化资料28.供寻检、征引、辑佚历史文献之用的资料工具书称为()。

信息检索复习题--附答案-绝对正确

信息检索复习题--附答案-绝对正确

《信息检索》复习题--附答案-绝对正确!!(总9页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--《信息检索》课理论考试复习题一、选择题:A1、从对文献的生产加工与组织层次来看,文献可以分成一次文献、二次文献和三次文献。

一次文献主要有(A )A、专著、报纸、期刊B、书目、索引、文摘C、百科全书、年鉴、手册2、《中图法》共分为五个基本部类,( B )个大类。

A、二十五B、二十二C、二十八3、按照《中图法》的分类原则,文学类和哲学、宗教类分别用汉语拼音字母( C )表示。

A、G、HB、E、DC、I、B4、根据主题词表所规定的以反映文献内容的主题词为标志,从主题的角度检索文献资料的途径是( C)A、著者途径B、文献名途径C、主题途径5、著录一批相关的图书或报刊文献的基本特征,按照一定次序编排而成的揭示和报道文献的工具书是( B )A、文摘B、书目C、索引6、按照文献的知识内容及所属学科性质而分类和检索文献信息的途径是( A )A、分类途径B、主题途径C、著者途径7、信息检索中,以课题起始年代为起点,按时间顺序由远而近逐期查找文献的方法是( C )A、倒查法B、追溯法C、顺查法8、在各种大型电子全文图书系统中,国内影响较大的主要有( B)A、人大复印资料数据库B、超星数字图书馆C、学位论文数据库9、美国《科学引文索引》是最具权威的国际性检索系统之一,简称是(A )A、SCIB、SSCIC、EI10、目前世界上最大的连续动态更新的中国期全文数据库是( B)A、维普中文期刊数据库B、CNKI中国学术期刊数据库C、万方数字化期刊数据库11、集各种类型工具书之大成,被称为“工具书之王”的工具书是( C )A、类书B、年鉴C、百科全书12、汇集某一学科或多学科的文献信息资料,按照特定的体例和排检方法编排,专供人们查阅、征引或解决疑难问题的一种专门文献是( A )A、工具书B、标准文献C、专利文献13、联机检索分为( B )联机检索和检索结果与反馈3个阶段。

计算机信息检索基本原理及检索技术

计算机信息检索基本原理及检索技术

局限性
处理复杂语言现象的能 力有限,对某些专业领 域和特定语言的处理效 果有待提高。
机器学习与信息检索
概念
机器学习是人工智能的一个分支,通过训练让计算机自动学习并改进 检索算法。
应用
利用机器学习算法对大量数据进行训练和学习,自动提取特征并分类, 提高信息检索的准确性和效率。
优点
能够自动优化和改进信息检索算法,提高检索效果。
结果评价是对检索结果进行评估,判 断其是否满足用户的信息需求。
信息检索系统
信息检索系统是实现信息检索 的工具或平台,它能够从各种 信息源中获取、存储、组织和
检索信息。
常见的信息检索系统包括图 书馆信息系统、搜索引擎系 统、学术论文数据库等。
信息检索系统的性能和效果取 决于其信息组织方式、索引技 术、检索算法等多个因素。
信息检索过程
信息检索过程包括信息需求分析、信息源选择、 信息检索策略制定、信息检索实施和结果评价 等步骤。
信息需求分析是信息检索的前提,需 要明确用户的信息需求和信息类型。
信息源选择是根据信息需求选择合适 的检索工具或数据库。
信息检索策略制定是根据信息源的特 点和信息需求制定相应的检索策略。
信息检索实施是执行检索策略,从信 息源中获取相关信息。
解决信息隐私保护的方法包括立法保护、技术手 段如加密和匿名化等。
信息检索技术的未来发展
01
信息检索技术的发展趋势包括智能化、语义化、移动化和社交化等。
02
智能化技术如机器学习和人工智能动信息检索向更深层次的知识层面发展。
04
移动化和社交化的趋势将使信息检索更加个性化和社交化,提高用户 参与度和满意度。
语义鸿沟问题
01 语义鸿沟是指用户与信息之间的理解差距,导致 用户难以找到所需内容。

简述信息检索的意义

简述信息检索的意义

简述信息检索的意义
信息检索是指通过计算机系统来获取、组织和管理信息的过程。

在当今数字化时代,信息爆炸性增长,人们需要从海量的信息中迅速准确地找到所需的内容。

因此,信息检索在现代社会中具有重要的意义。

信息检索可以帮助人们快速获取所需的知识和信息。

通过搜索引擎等工具,人们可以在几秒钟内找到大量相关的信息,而不需要花费大量时间和精力去查找和筛选。

这对于学生做研究、专业人士获取最新的行业动态以及普通用户获取各种实用信息都非常有帮助。

信息检索有助于拓宽人们的视野和知识面。

通过搜索引擎,人们可以轻松地获取来自世界各地的新闻、观点和文化。

这样可以让人们了解不同的观点和文化,拓宽自己的思维和视野,促进跨文化交流和理解。

信息检索可以提高工作效率和生活质量。

对于研究人员、学者和专业人士来说,信息检索可以帮助他们更快地找到相关文献和研究成果,提高工作效率和研究质量。

对于普通用户来说,信息检索可以帮助他们解决生活中的各种问题,提高生活质量。

信息检索也有助于促进创新和发展。

通过访问各种在线资源和数据库,人们可以获取到最新的科技成果、市场动态和商业信息。

这为创新和创业提供了重要的参考和支持,有助于推动社会经济的发展
和进步。

总的来说,信息检索在现代社会中具有重要的意义。

它不仅可以帮助人们快速获取所需的知识和信息,而且可以拓宽人们的视野和知识面,提高工作效率和生活质量,促进创新和发展。

随着信息技术的不断进步和发展,信息检索在未来将发挥更加重要的作用,为人们带来更多便利和机遇。

信息检索参考的数据库

信息检索参考的数据库

信息检索参考的数据库信息检索是指从大量的数据中获取所需信息的过程。

在信息检索中,数据库是非常重要的工具,它存储了大量的数据,并且提供了快速、准确的检索功能。

本文将介绍一些常用的信息检索参考数据库。

1. Web of Science(科学引文索引)Web of Science是一个综合性的学术数据库,收录了各个学科领域的学术期刊、会议论文和专利等文献资源。

它提供了全面的引文索引功能,可以帮助研究人员追踪和评估学术研究的影响力和引用情况。

2. ScopusScopus是另一个广泛使用的学术数据库,涵盖了自然科学、社会科学、工程技术和医学等领域的文献资源。

它提供了全面的文献检索和引文分析功能,可以帮助研究人员发现关键的研究成果和领域动态。

3. PubMedPubMed是一个专门收录生命科学和医学文献的数据库,由美国国立卫生研究院(NIH)开发和维护。

它包括了各种生物医学文献,如期刊文章、会议论文、医学专著和博士学位论文等。

PubMed提供了强大的文献检索和过滤功能,可以帮助研究人员快速找到所需的文献资源。

4. IEEE XploreIEEE Xplore是一个涵盖了电子工程、计算机科学和信息技术等领域的学术数据库。

它收录了IEEE出版的期刊文章、会议论文、技术报告和标准等文献资源。

IEEE Xplore提供了强大的文献检索和下载功能,可以帮助研究人员及时获取最新的科研成果。

5. ACM Digital LibraryACM Digital Library是由ACM(Association for Computing Machinery)开发和维护的计算机科学和信息技术领域的学术数据库。

它收录了ACM出版的期刊文章、会议论文和技术报告等,涵盖了计算机科学的各个子领域。

ACM Digital Library提供了高效的文献检索和下载功能,可以帮助研究人员跟踪最新的研究进展。

6. CNKI(中国知网)CNKI是中国知识资源总库的核心数据库,涵盖了自然科学、社会科学、人文科学和工程技术等领域的学术文献资源。

信息检索ppt课件

信息检索ppt课件
及时获取有价值的信息。
06
信息检索的未来发展
语义网与信息检索
语义网技术的成熟发展为信息检索提供了新的机会和挑战。
语义网通过使用本体、词汇表和规则等,使信息具有明确的含义和上下文,从而提 高了信息检索的准确性和效率。
基于本体的信息检索利用语义网中的本体模型,能够实现更精确、更快速的信息检 索,为搜索引擎、问答系统和推荐系统等应用提供了新的解决方案。
个性化推荐
通过分析用户的购物历史和浏览行 为,电子商务平台可以运用信息检 索技术为用户提供个性化的商品推 荐。
信息检索在数字图书馆中的应用
文本检索
数字图书馆使用信息检索 技术,允许用户通过关键 词或主题词检索相关的图 书和文献资料。
图像检索
数字图书馆中的图像资源 丰富,信息检索技术可以 帮助用户根据图像内容进 行检索,提高查找效率。
跨语言信息检索与多媒体信息检索
随着全球化的加速和互联网的普及,跨 语言信息检索和多媒体信息检索成为研
究的热点问题。
跨语言信息检索主要解决不同语言间 的语义鸿沟问题,通过语言翻译、对齐 等技术,实现跨语言的信息检索和问答

多媒体信息检索主要针对图像、视频、 音频等多媒体数据进行信息检索和分析 ,通过使用图像识别、视频分析和音频 识别等技术,提高多媒体信息检索的准
确性和效率。
THANKS FOR WATCHING
感谢您的观看
01
02
03
04
文本处理技术
包括分词、词性标注、句法分 析、文本聚类等。
索引技术
包括倒排索引、B树索引、位 图索引等。
查询处理技术
包括查询扩展、查询优化、查 询执行等。
结果展示技术
包括排序算法、摘要生成、结 果反馈等。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(1)分析研究信息检索课题 明确信息检索课题所涉及的领域和范围; 明确所需信息的类型,包括文献媒体、出版类型、所

6.4.1 信息检索的步骤

(2) 选择信息检索工具 信息检索工具是人们为了充分、准确、有效地利用已
有的信息资源而加工编制的用来报道、揭示、存贮和查
找信息资源的卡片、表册、计算机信息系统和特定出 版 物。 指示线索型检索工具(二次文献) 提供具体信息的工具书(三次文献)
6.1信息检索的基本概念与原理
需求概述 或疑问式

信息组织和检索系统 游戏规则=主题 索引规则+辞典 (包括词汇表和 索引语言) 比较/匹配 信息或数据
检 索 流 程
规范化的 疑问式
概述的存贮
索引(描述性的、 受限制的)
信息的组织
组 织 流 程
存贮1:概述/ 搜索请求
存贮2:信 息的表示
潜在的相 关信息
处理各种不确定性的模型
将文献论述标引词所达到的程度用0和1之间的数值t
来表示,0为不相关,1为完全相关,t越大,则相关性
越高,被检1 手动信息检索阶段 正规的参考咨询工作是由美国的公共图书馆和大专院
校图书馆于19世纪下半叶首先发展起来的。“参考咨
6.4.1 信息检索的步骤
(5) 获取原始信息

判断文献的出版类型。根据文献出处中已有的信息,判断 其出版类型。 整理文献出处。将文献出处中有缩写语、有音译刊名的还 原成全称或原刊名。 根据出版类型在图书馆或信息机构查找馆藏目录或联合目 录确定馆藏,原则上说应该按“由近及远”的顺序逐步扩 大查找馆藏的范围。 尽可能多渠道、多方式地获取原始信息。

6.1.4 信息检索的模型

(2)向量空间检索模型 基本前提是将文献和查询用向量表示,这样将文献
与查询的匹配问题转化为一个关于向量空间的计算问
题 计算的结果是相似系数,将相似系数超过一定值的文 献作为检索结构输出
6.1.4 信息检索的模型

(3)概率检索模型 建立在相关性理论基础上,当文件按相关概率递减
6.4.1 信息检索的步骤

(3) 确定信息检索方法 每一种信息检索方法都有自己的特点,在实践中可以 根据信息检索要求选择使用或配合使用,以快速、准确 地完成信息检索任务,实现预期的目标。 常用的信息检索方法:
顺查法 倒查法 抽查法 追溯法
6.4.1 信息检索的步骤

(4) 掌握获取原始信息的线索 在获取信息线索时要仔细阅读,判断所检出的信息是 否符合检索的要求,不仅看篇名,还要阅读整个著录格 式,进行综合分析。
6.3.3 计算机信息检索的技术和方法
(2)光盘信息检索

特点: 使用光盘检索系统,可免除联机检索系统所必须使用的电讯设备, 节省了电讯费和联机系统使用费,还可免除由通信线路传输过程中 光盘系统向用户随盘提供相当于联机信息检索系统功能的软件,并 可以把文本、图形、图像、声音及动态形象结合在一起 如果光盘数据库量不够多,则信息资源就显得有限,购买大量光盘 数据库,又要受到经费限制 在信息需求的适时性上,光盘检索不如联机检索系统,因为光盘只 能定期提供 数据库费用大
展到综合信息管理和服务
一方面,新兴的机遇Web的搜索引擎系统得到日益广
泛的应用,另一方面,传统的联机检索系统、各类数
据库检索系统及其信息服务业务,也逐渐扩展、转移 到具有分布式网络结构特性的Web平台上
6.3 信息检索的技术与方法
6.3.1 手工信息检索的技术与方法
(1)手工信息检索工具
目录:图书或其他单独出版物规律化、系统化的记载 索引:把一种或多种书刊里的具体内容按一定的方式分别摘录, 并注明出处,以便检索的一种工具
6 信息检索
信息组织是指按照一定的规则来描述信息资源或信息 对象,以便于能被需要它们的人高效地利用。
信息检索则是指为了个人或他人的需要,去发现适当
的信息资源或信息对象。
信息组织和信息检索是一对互逆过程。
6.1信息检索的基本概念与原理

6.1.1 信息检索的涵义 满足信息用户的信息需求而建立的、存贮经过加工了 的信息集合,拥有特定的存贮、检索与传送的技术装 备,提供一定存贮与检索方法及检索服务功能的一种 相对独立的服务实体(包括人和检索工作单位),统称 为信息检索系统(Information Retrieval System,简称 IRS)。 信息检索系统的三个基本要素: 人、检索工具(包括设备)和信息资料
向量空间检索模型 ( Vector Retrieval Model,简称VRM )
概率检索模型 ( Probability Retrieval Model,简称PRM ) 模糊检索模型 ( Fuzzy Retrieval Model,简称FRM )
6.1.4 信息检索的模型
(1)布尔逻辑检索模型 是一种比较成熟、较为流行的检索技术。逻辑检索 的基础是逻辑运算 布尔逻辑运算符: 与(and / *)、或(or / +)、非(not / -) A and B(A*B): 同时含有A、B这两个检索词才能被 命中 A or B(A+B): 只要含有其中一个检索词或同时含 有两 个检索词都将被命中 A not B(A-B): 含有检索词A但不含有检索词B才 能被命中
6.3.2 机械信息检索的技术与方法
机电信息检索系统 继手检穿孔卡片之后,出现了机检穿孔卡片和选卡机。 这就形成了机电信息检索系统。 光电信息检索系统 主要是以缩微胶卷(片)检索方式出现的。缩微胶卷(片) ① 寻址检索方式 ② 编码检索方式

6.3.3计算机信息检索的技术和方法
(1)联机信息检索
息组织方式以线性为主,不够灵活;③联机检索不像Internet是面
向最终用户的,操作也没有后者方便。
6.3.3 计算机信息检索的技术和方法
联机信息检索系统的结构

联机信息检索的技术原理 一个典型的计算机信息系统,能完成数据收集、分析、加 工处理、存储、传递通信和检索信息的全过程。 联机信息检索的服务方式 a b c d 定题信息提供 专题回溯检索 联机订购原文 电子邮件
6.3.1手工信息检索的技术与方法
(3)手工信息检索方法

顺查法:一种以信息检索课题起始年代为起点,按时间顺序由远而 近地查找信息的方法。
倒查法:一种逆时间顺序由近而远地查找信息的方法。
抽查法:一种针对研究课题发展的特点,抓住学科发展迅速、发表 文献较多的年代进行查找的方法。 追溯法:又叫回溯法,是以某一篇文献末尾所附的参考文献为依据, 由近及远进行逐一追踪的查找方法。 循环法:先利用检索工具查出一批有用文献,然后再利用这些文献 末尾所附参考文献的线索进行追溯查找。

信息用户利用终端设备,通过通讯网络与世界各地的信息检索系统 联机,进行人机对话,从检索系统的数据库中查找出用户所需信息 的全过程。 优点:①检索速度快;②检索范围广而全面;③检索途径多、质量
高;④检索内容新、实时性强;⑤检索辅助功能完善、使用方便,
检索结果输出方式灵活、实用。 缺陷:①主机负担重,一旦出现故障,则整个网络都将瘫痪;②信
询工作”产生的标志是1876年召开的美国图书馆协会 第一届大会。1883年,波士顿公共图书馆首次设置了 专职参考馆员和参考阅览室;
6.2.1 手工信息检索阶段

20世纪初,多数图书馆成立了参考咨询部门,主要利 用图书馆的 书目工具来帮助读者查找图书、期刊或现成答案。
40年代进一步包括回答事实性咨询,编制书目、文摘,进行专题
原则排列时可以获得最大的检索性能。
基于对相关性的不同理解客建立不同的模型,由此可 导出不同的排序输出原则 相关性原理及排序原理是该模型的理论核心,有关概 率的计算及其数据来源是PRM的技术难点
6.1.4 信息检索的模型

(4)模糊检索模型 建立在模糊集合论、模糊逻辑及可能性理论基础上来
文摘:把文献资料的主要内容,由有一定水平和经验的编者将 其准确简要地摘录出来,并注明出处后,经分类排序而编制成 的检索工具
年鉴:以描述和统计的方式逐年提供某年度某一领域信息的工 具书
手册:汇集某一学科领域或业务部门专门知识的工具书
百科全书:荟萃一切门类或某一门类知识、以概要方式介绍为 主的多功能工具书
6.3.4 网络信息检索的技术与方法

特点:
信息量更大 需要处理各种不同的语言(大多是自然语言) 信息检索的范围更宽(多学科、多领域) 信息查询的时效性要求更高
网络信息检索模式有两层含义:
广义理解 狭义理解
6.4 信息检索的步骤与策略

6.4.1 信息检索的步骤
6.1.3 信息检索的基本原理

信息资 源集合 特征化 表示 特征化 表示 信息需 求集合
匹配与选择 图 6-2 信息检索的基本原理
(1)信息资源集合 (2)信息需求集合 (3)匹配与选择
6.1.4 信息检索的模型

布尔逻辑检索模型 ( Boolean Retrieval Model,简称BRM )
图6-1 信息检索系统体系结构
6.1.2 信息检索的类型与特性

按存贮和检索的内容划分 ① ③ 文献检索 事实检索 ①文本检索。
② 数据检索
②数值检索。
③音频与视频检索。
按检索系统中信息的组织方式划分
① 全文检索
② 多媒体检索 ③ 超媒体检索
6.1.2 信息检索的类型与特性

信息检索的特性 信息检索的相关性 信息检索时规定的一篇正文与表示信息提问的另 一篇正文的符合程度。相关性表明用户是否认为一文 献与一提问吻合。 信息检索的不确定性 标引的不确定性是指不同标引员在给同一篇信息 对象进行标引时会选用不同的标引词,即标引词选用 的不一致性。 信息检索的逻辑性 检索语言、检索策略
相关文档
最新文档