第六章 信息检索

合集下载

第六章 文献信息检索与利用

第六章 文献信息检索与利用

第六章文献信息检索与利用第一节文献信息检索基础知识随着科学技术日新月异地发展,人类步入了信息时代,人们交流、学习及生活的方式已随之发生了巨大的变化。

在这些变化中,我们时刻感受着文献信息资源的多元化利用及信息的多样化服务。

如今,文献信息资源已同物质资源、能源资源并列成为现代社会资源的三大支柱。

文献信息作为一种资源在社会生产和人类生活中起着越来越重要的作用,特别是对中小学生进一步拓展知识视野,有效地提升自我学习能力方面成为了一项必备的基本素养。

为了更好地掌握这项技能,从小学起就对学生进行信息教育,提高利用信息意识和获取信息技能,掌握文献信息的相关知识是很必要的。

一、文献信息检索概述1.文献信息检索的概念文献信息检索是从文献信息资源集合中找出所需文献信息的过程。

从广义上讲,文献信息检索包括两个过程:一是文献信息的存储过程。

存储是选择文献信息、按规范化语言文本揭示与描述文献信息内、外特征并使其有序化。

即对大量有关信息集中起来,并对信息的外表特征和内容特征进行著录、标引和组织,经过整理、分类、归纳等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。

二是文献信息检索过程。

检索是系统根用户提问按规范化语言进行概念转换,经逻辑匹配输出与提问相关的文献信息。

即是指运用编制好的检索工具或检索系统,查找出满足读者要求的特定信息。

狭义的检索是指依据一定的方法,从已经组织好的大量有关文献集合中,查找并获取特定的相关文献的过程。

综上所述,文献信息检索就是将文献信息按照一定的方式组织和存储起来,并能根据用户的需求,找出其相关文献信息的过程。

2.文献信息检索类型文献信息检索按不同的标准可以划分为不同的类型,下面介绍两种目前比较普遍的划分方法。

(1)按文献信息检索存储和检索内容划分。

按文献信息检索存储和检索内容划分:可分为文献型检索、事实型检索和数据型检索。

①文献型检索:是指利用文摘、题录、索引、目录等二次文献信息,查找文献线索和根据文献线索查找原始文献。

第六章__事实数据信息检索.

第六章__事实数据信息检索.

第二节 印刷型参考工具书简介
• 一、类型和作用
• (一)词、字典 • 词、字典是字、词或词语的某些成分、根据 一定编纂目的加以处理和编排,供人们查考的工 具书。就广义而言,词典分为语文词典和知识词 典(学科词典)两大类,前者词语的语言方面的 知识或本身的意义,后者提供词语的学科方面的 知识、即解释在专科领域内词语所代表的事物和 概念,作一定广度和深度的叙述。
• (四)手册
• 手册(Handbook, Manual)是一种便捷式参考书 (Ready Reference Book), 它的信息、知识密集,是些经常要查阅、 参考的资料和数据。手册内容及时修订,编排合理,使用 方便。科技手册是参考工具书中的一大门类,其内容广泛、 种类各异,。它有综合性手册和专业性手册之分,以专业 性为主。专业性手册包括:数据型手册、知识型手册、设 计手册以及产品手册等。数据型手册提供各种常数、参数、 计算公式、曲线、图表、图示、线路图等,是一种简明、 实用的检索工具。知识型手册以文字叙述为主, 阐述科学原 理、专业技术、物化性能等学科知识,也配有适当公式和 图表,它们既可检索,也可阅读。设计手册为科技人员、 专业设计人员提供所需知识和数据,是他们在工作中经常 使用的工具。产品手册具有产品说明书作用,介绍产品名 称 、 技 术 指 标 、 标 准 、 生 产 厂 商 等 。
• 类书与百科全书的区别
• 将类书视为古代百科全书未尝不可,但不能与现代百科全书相提 并论,正如西方现代百科全书与古代百科全书也远不是一回事了。 类书与百科全书相比,不同之处具体表现在下列方面: 一是编纂方式不同。类书是辑录原始资料,重在资料性,是原始 资料的汇集。百科全书是根据已有的资料进行加工整理,是对已有知 识的加工、整理和浓缩,反映了编纂者本人的知识水平。 二是编排方式不同。类书是根据原始资料分类进行编排,通过分 类编排反映原始资料之间的内部联系。百科全书则是以条目的字顺进 行编排,条目之间通过索引反映内部之间的联系。 三是内容有别。类书一般侧重于文史资料,而百科全书以反映人 类全部知识为己任,对自然科学方面的知识更为重视。 四是后期工作不同。类书编纂完成以后,一般很少进行补充或修 订。而百科全书有连续修订制度,一般每隔5到10年要进行一次全面 修订,保证知识的准确性。 此外,百科全书有完备的索引体系、部分条目有参考书目指引读 者进一步阅读等,也是类书不具备的。因此从根本上讲,类书与百科 全书不是同一种工具书。

第六章 计算机信息检索基础知识

第六章 计算机信息检索基础知识

25

2
二,计算机信息检索的基本概念
利用计算机,根据用户的提问, 利用计算机,根据用户的提问,在一 定时间内, 定时间内,从经过加工处理并已存储在计 算机存储介质内的信息集合中查出所需信 息的一种方式. 息的一种方式.
3
三,计算机信息检索系统构成
1,硬件 , 2,软件 , 系统软件和应用软件. 系统软件和应用软件. 3,数据库 , 数据库是至少由一种文档组成, 数据库是至少由一种文档组成, 能满足特定目的或特定数据处理系统 需要的数据集合. 需要的数据集合.
19
第二节 DIALOG联机检索命令 联机检索命令
一,BEGIN(或B)选库命令 ( )
?BEGIN 文挡名 ?B 文挡名 ?BEGIN 文挡号 ?B 文挡号
20
二,sf调文档命令 sf调文档命令
只在打开411 库时有效 只在打开 ? 8,12,63,72…… , , ,
21
三,SELECT(或S)选词命令 ( )
23
六,DISPLAY SETS (或DS)联 或 联 机显示命令
用于显示相应的检索结果, 用于显示相应的检索结果,具体指令格 式与TYPE相同 式与 相同
七,LOGOFF结束检索过程命令 结束检索过程命令
24
第三节 联机检索的一般步骤
1,分析信息需求; 2,选择系统及数据库; 3,确定检索途径; 4,选择检索项; 5,编制检索式; 6,上机检索; 7,输出检索结果; 8,退出联机检索系统
22
STEPS( SS) 四, SELECT STEPS(或SS)命令
SS computer? and image? S1 597 computer? S2 176 image? S3 105 computer? and image?

《信息检索教案》课件

《信息检索教案》课件

《信息检索教案》PPT课件第一章:信息检索概述1.1 信息检索的定义解释信息检索的概念和意义强调信息检索在学术研究和日常生活的重要性1.2 信息检索的类型介绍不同类型的信息检索方法,如手工检索、计算机检索等解释各种检索方法的优缺点和适用场景1.3 信息检索的流程介绍信息检索的基本步骤,如确定检索需求、选择检索工具等提供实用的检索技巧和策略,帮助学生更有效地获取信息第二章:检索工具与数据库2.1 检索工具的类型介绍不同类型的检索工具,如目录、索引、文摘等强调各种检索工具的特点和适用场景2.2 数据库的类型介绍不同类型的数据库,如文献数据库、全文数据库等解释各种数据库的优缺点和适用场景2.3 检索工具与数据库的选择提供选择检索工具和数据库的依据和方法强调选择合适的工具和数据库对信息检索的重要性第三章:网络信息检索3.1 搜索引擎的使用介绍搜索引擎的概念和原理讲解如何有效地使用搜索引擎进行信息检索3.2 学术搜索引擎的使用介绍学术搜索引擎的概念和特点讲解如何利用学术搜索引擎获取学术信息3.3 社交媒体与网络信息检索介绍社交媒体在信息检索中的应用强调社交媒体在获取实时信息和社交网络分析中的价值第四章:信息检索技巧与策略4.1 检索关键词的选择讲解如何选择合适的检索关键词提供关键词选择的方法和技巧4.2 布尔逻辑检索介绍布尔逻辑检索的概念和原理讲解如何运用布尔逻辑提高检索效果4.3 短语检索与位置算符介绍短语检索和位置算符的概念和用法强调短语检索和位置算符在精确检索中的重要性第五章:信息检索实践与应用5.1 学术研究中的应用讲解信息检索在学术研究中的重要性演示如何利用信息检索进行文献综述和实证研究5.2 日常生活中的应用讲解信息检索在日常生活中的应用案例强调信息检索对提高生活质量的重要性5.3 信息检索的道德与法律问题介绍信息检索中的道德和法律问题,如版权、隐私等强调信息检索时应注意的道德和法律规范第六章:特定信息类型的检索6.1 图像和多媒体信息的检索介绍如何检索图像和多媒体信息演示使用图像搜索引擎和多媒体数据库的技巧6.2 统计数据的检索讲解如何检索统计数据介绍使用政府统计网站和专业统计数据库的方法6.3 专利信息的检索介绍如何检索专利信息演示使用专利数据库进行检索的步骤和技巧第七章:信息评估与批判性思维7.1 信息评估的标准讲解评估信息质量的标准和原则强调批判性思维在信息评估中的重要性7.2 识别信息源的可靠性介绍如何识别和评估信息源的可靠性分析不同类型信息源的可信度和偏见7.3 信息批判性思维的实践讲解如何运用批判性思维分析信息演示通过信息检索进行批判性思维实践的案例第八章:信息素养与终身学习8.1 信息素养的概念解释信息素养的内涵和外延强调信息素养在现代社会的重要性8.2 培养信息素养的策略介绍培养个人信息素养的策略和方法强调终身学习在维持和提升信息素养中的作用8.3 信息素养的实践应用讲解信息素养在个人和专业生活中的应用演示如何利用信息素养解决实际问题第九章:信息检索的未来趋势9.1 与信息检索介绍在信息检索中的应用探讨如何改变信息检索的方式9.2 大数据与信息检索讲解大数据对信息检索的影响探讨大数据时代信息检索的新挑战和新机遇9.3 未来信息检索技术的发展趋势预测未来信息检索技术的发展方向强调终身学习的重要性以适应不断变化的技术环境第十章:综合实践与案例分析10.1 综合实践项目设计设计一个综合实践项目,要求学生应用所学信息检索技能提供项目实施步骤和评估标准10.2 案例分析与讨论提供几个案例分析,要求学生应用信息检索技能解决问题鼓励学生进行讨论,分享他们的思考和经验10.3 课程总结与展望总结整个课程的重点和难点展望信息检索领域的发展前景,鼓励学生持续学习和探索重点解析本文教案主要涵盖了信息检索的概述、检索工具与数据库的选择、网络信息检索、信息检索技巧与策略、信息检索实践与应用、特定信息类型的检索、信息评估与批判性思维、信息素养与终身学习、信息检索的未来趋势以及综合实践与案例分析等十个章节。

信息检索 ppt课件

信息检索 ppt课件

详细描述
社交网络信息检索技术主要针对社交网络中 海量、动态更新的信息进行处理和检索。特 点包括实时性、个性化和社会化等。同时, 也面临一些挑战,如信息过载、隐私保护等

案例四:社交网络信息检索技术实践分享
总结词
社交网络信息检索技术的创新与应用
详细描述
介绍一些创新性的社交网络信息检索技术,如基于内 容的推荐算法、情感分析技术等。同时,分享一些成 功应用案例,如微博搜索、微信小程序等,说明这些 技术在社交网络中的实际应用和效果。
云服务和移动化 借助云服务和移动通信技术,实 现信息检索服务的移动化和云端 化,方便用户随时随地获取信息 。
个性化推荐和定制化服务 通过数据分析和挖掘,实现个性 化推荐和定制化服务,满足用户 多样化的信息需求。
多模态信息检索 融合文本、图像、音频和视频等 多种类型的信息,实现多模态信 息检索,提高信息检索的全面性 和多样性。
04
信息检索的应用领域
搜索引擎
搜索结果相关性
提高搜索结果与用户查询的关联 度,减少无关信息的展现。
语义分析和理解
对用户查询进行深度解析,识别关 键词的语义,提高搜索的准确性。
实时更新
对互联网上的新信息进行实时跟踪 和更新,确保用户获取最新、最相 关的信息。
数字图书馆
资源数字化
将传统图书馆的资源进行数字化 处理,方便用户在线阅读和下载
关联规则挖掘
挖掘信息之间的关联规则,帮 助用户发现隐藏的信息需求。
信息检索的评价指标
查全率
评估检索系统找全满足用户需求的信息的能 力。
响应时间
评估检索系统响应用户请求的速度。
查准率
评估检索系统找准满足用户需求的信息的能 力。

信息检索课件

信息检索课件

02
信息检索基础
布尔模型
基于逻辑运算符的模型,将查询词与文档进行简单的匹配,常用 符号包括 AND、OR、NOT。
聚类分析
将相似的文档聚集成一类,根据文档之间的相似度 进行分类,有助于缩小检索范围。
决策树模型
基于决策树的分类模型,通过训练样本建立一棵决策树,用 于预测新样本的类别。
03
信息检索相关技术
语义理解能力不足
传统的信息检索技术主要基于关键词匹配,无法很好地理解用户的真 实意图,这在很大程度上影响了检索结果的准确性和相关性。
语义网的发展
语义网的概念和应用
语义网是一种基于XML技术的互联网应用,它可以将互联网 上的文档统一转化为计算机可读的格式,从而使得计算机能 够更好地理解文档内容,提高信息检索的准确性。
F1得分
• F1得分:是查准率和查全率的调和平 2 (查准率 查全率) / (查准率 + 查全率)。
平均倒数排名(MRR)
• MRR:是一种衡量排序效果的指标,将所有相关文档按照 排序位置的倒数平均值进行加权,再求和得到。公式为: MRR = 1 / (1/第一相关文档 + 1/第二相关文档 + ... + 1/ 第N个相关文档)。
文本预处理
01
02
03
文本清洗
去除文本中的标点符号、 停用词、拼写错误等冗余 信息,提高文本的可读性 和信息含量。
分词技术
将文本切分成词汇单元, 便于后续的词频统计和语 义分析。
词性标注
对词汇进行语法标注,有 助于理解词汇在句子中的 角色和语义。
倒排索引
基本原理
倒排索引是一种基于词汇 表的索引结构,每个词汇 对应一个包含该词汇的文 档列表。

(完整版)信息管理学基础马费成习题重点

(完整版)信息管理学基础马费成习题重点

信息管理学基础(马费成)习题重点(精品课程)可以有很多方式的,没有固定答案,但实际工作中,要考虑实际来选择。

归结起来,主要有以下几种途径:一是使用信息管理系统,如OA系统、档案管理系统、人事管理系统、ERP 系统等;二是利用网络平台,如局域网、门户网站、VPN网络;三是使用沟通交流平台,如BBS、电子邮件、新闻组等方式、企业qq、飞信、rss订阅等;四是将其编纂成内部刊物、出版物;五是其他方式,如利用宣传栏、宣传板宣传,甚至有的更强的在公司厕所也宣传。

第一章信息与信息管理一、教学目的掌握信息、信息管理等基本概念,了解信息的特征及分类,关注信息化对社会经济发展的重要作用,明确信息管理的内容及任务,掌握信息管理的沿革及发展。

二、教学内容1.信息、信息管理等基本概念2.信息特征、性质、分类3.信息化的内容特征及重要作用4.信息管理的对象、内容、目标和任务5.信息管理的沿革与发展三、本章重点1.信息、信息管理等基本概念2.信息化的层次、阶段(三个层次,四个阶段)3.信息管理的内容任务4.信息管理的发展历程【重要概念】信息知识负熵语法信息语用信息语义信息信息流社会信息化信息社会GII “三金”工程信息管理文件管理信息资源管理知识管理【简答】1、如何理解通讯领域信息的含义?2、简述数据、信息、知识之间的关系。

数据+背景=信息数据是载荷或记录物理信息的物质符号。

信息+经验=知识信息能够转化为知识的关键取决于信息接受者对信息的理解能力3、简述信息的特征和分类。

普遍性和客观性、广延性和无限性、共享性、时效性、不可变换性和不可组合性对物质载体的独立性、对认识主体的相对性、传递性分类:按性质划分:语法信息、语义信息、语用信息4、试分述信息管理四个典型阶段。

传统管理阶段:这一阶段以信息源的管理为核心,以图书馆为象征。

以文献为主要载体,以公益性服务为主要目标技术管理阶段:这一阶段以信息流的控制为核心,以计算机为工具,以自动化信息处理和信息系统建造为主要工作内容。

大学计算机基础复习题第6章信息检索与网络信息应用

大学计算机基础复习题第6章信息检索与网络信息应用

中国公用计算机互联网的简称是()A、CSTNETB、CHINAGBNETC、CERNETD、CHINANET[参考答案] D、CHINANET个人用户访问Internet最常用的方式是()A、公用电话网B、综合业务数据网C、DDN专线D、X.25网[参考答案] A、公用电话网如果使用IE浏览器访问IP地址为210.34.6.1的FTP服务器,则正确的URL地址是()A、http://210.34.6.1B、210.34.6.1C、ftp://210.34.6.1D、ftp:\\210.34.6.1[参考答案] C、ftp://210.34.6.1在Internet上,已分配的IP地址所对应的域名可以是()A、一个B、二个C、三个以内D、多个[参考答案] D、多个在TCP/IP参考模型中,应用层协议常用的有()A、telnet,ftp,smtp和httpB、telnet,ftp,smtp和tcpC、ip,ftp,smtp和httpD、ip,ftp,dns和http[参考答案] A、telnet,ftp,smtp和http在选择局域网的拓扑结构中,应考虑的主要不包括()A、费用低B、可靠性C、灵活性D、实时性[参考答案] D、实时性计算机网络是由多个互连的结点组成的,结点之间要做到有条不紊地交换数据,每个结点都必须遵守一些事先约定好的原则。

这些规则、约定与标准被称为网络协议(protocol)。

网络协议主要由以下三个要素组成()A、语义、语法与体系结构B、硬件、软件与数据C、语义、语法与时序D、体系结构、层次与语法[参考答案] C、语义、语法与时序在电子商务的概念模型中,不属于电子商务的构成要素是()A、互联网B、交易主体C、交易事务D、电子市场[参考答案] A、互联网在传统的IPv4中使用32比特位表示接入Internet设备的地址编码,那么在新兴的IPv6中使用()比特位表示接入设A、64B、128C、256D、512[参考答案] B、128当E-mail到达时,如果没有开机,那么邮件将()A、会自动保存入发信人的计算机中B、将被丢弃C、开机后对方会自动重新发送D、保存在服务商的E-mail服务器上[参考答案] D、保存在服务商的E-mail服务器上关于收发电子邮件,以下正确的叙述是()A、必须在固定的计算机上收/发邮件B、向对方发送邮件时,不要求对方开机C、一次只能发给一个接收者D、发送邮件无需填写对方邮件地址[参考答案] B、向对方发送邮件时,不要求对方开机下面关于网络防火墙的叙述中,正确的是()A、对计算机采取的防火措施B、主要用于解决计算机的使用者的安全问题C、用于预防计算机被火灾烧毁D、是Internet(因特网)与Intranet(内部网)之间所采取的一种安全措施[参考答案] D、是Internet(因特网)与Intranet(内部网)之间所采取的一种安全措施使计算机病毒传播范围最广的媒介是()A、U盘B、移动磁盘C、内部存储器D、互联网[参考答案] D、互联网下列有关电子邮件的说法中,正确的是()A、电子邮件的邮局一般在邮件接收方个人计算机中B、电子邮件是Internet提供的一项最基本的服务C、通过电子邮件可以向世界上的任何一个Internet用户发送信息D、电子邮件可发送的多媒体信息只有文字和图象[参考答案] B、电子邮件是Internet提供的一项最基本的服务计算机网络是计算机与()相结合的产物B、线路C、通信技术D、各种协议[参考答案] C、通信技术以下关于计算机网络的分类中,不属于按照覆盖范围分类的是()A、环型网B、局域网C、城域网D、广域网[参考答案] A、环型网有关TCP/IP的叙述中,正确的是()A、TCP/IP是一种用于局域网内的传输控制协议B、TCP/IP是一组支持异种计算机网络通信的协议族C、TCP/IP是资源定位符URL的组成部分D、TCP/IP是指TCP协议和IP地址[参考答案] B、TCP/IP是一组支持异种计算机网络通信的协议族在计算机网络中,通常把提供并管理共享资源的计算机称为()A、服务器B、工作站C、网关D、网桥[参考答案] A、服务器不能作为计算机网络传输介质的是()A、微波B、光纤C、光盘D、双绞线[参考答案] C、光盘在Internet上广泛使用的WWW是一种()A、浏览服务模式B、网络主机C、网络服务器D、网络模式[参考答案] A、浏览服务模式在Internet上用于收发电子邮件的协议是()A、TCP/IPB、IPX/SPXC、POP3/SMTPD、NetBEUI[参考答案] C、POP3/SMTP在IE地址栏输入的“/”中,http代表的是()A、协议B、主机D、资源[参考答案] A、协议在Internet中的IPv4地址由()位二进制数组成A、8B、16C、32D、64[参考答案] C、32用以太网形式构成的局域网,其拓扑结构为()A、环型B、总线型C、星型D、树型[参考答案] B、总线型下列针对信息资源特点的描述()是不对的A、是由数据堆砌而成B、稀缺性C、共享性D、驾驭性[参考答案] A、是由数据堆砌而成信息揭示的一般程序是()。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。


特性:

信息检索的相关性 相关性表明用户是否认为一文献与一提问吻合。 信息检索的不确定性 标引的不确定性是指不同标引员在给同一篇信 息对象进行标引时会选用不同的标引词,即标 引词选用的不一致性。检索词选用的不确定性 是指候选检索词集不止一个,检索过程具有试 探性。 信息检索的逻辑性


检索语言、检索策略(处理信息检索提问的逻 辑与查找步骤的科学安排)




(3)手工信息检索方法

顺查法:时间上,远近 查全率高 费时费力


倒查法:时间上,近远 查准率高 漏检率高
抽查法:学科的兴旺阶段 检索效率高
追溯法(引文法) : A.一次文献参考文献一次信息参考文献 …… 近远 B.一次文献引用越查文献越新
机械信息检索阶段

机械信息检索两种基本类型 机电信息检索系统 光电信息检索系统
机械信息检索并没有发展信息检索语言,只 是采用单一的方法对固定的存贮形式进行检 索,而且过分依赖于设备,检索复杂,成本 较高,检索效率和质量都不理想。

计算机信息检索系统三个阶段:

1971年以前建立的信息检索系统,是传统的批处 理检索方式。 1971年以后,产生并发展的联机信息检索系统, 如OCLC、Dialog在线数据库联机检索系统。
缺陷:①主机负担重,一旦出现故障,则整个网 络都将瘫痪;②信息组织方式以线性为主,不够 灵活;③联机检索不像Internet是面向最终用户 的,操作也没有后者方便。


由检索服务机构(联机存取中心) 、国际通讯 网络及终端三部分构成。
终端设备用于输入检索程序、显示检索过程、控
制打印检索结果。
通讯网络用于实现远程人机对话。



(2)选择检索工具,了解检索系统
信息检索工具是人们为了充分、准确、有效 地利用已有的信息资源而加工编制的用来报道、 揭示、存贮和查找信息资源的卡片、表册、计算 机信息系统和特定出版物。
(3)确定检索途经,选定检索方法 每一种信息检索方法都有自己的特点, 在实践中可以根据信息检索要求选择使用或 配合使用,以快速、准确地完成信息检索任 务,实现预期的目标。
6.3.3 计算机信息检索的技术与方法
(1) 信息用户利用终端设备,通过通讯网络与世界各 地的信息检索系统联机,进行人机对话,从检索 系统的数据库中查找出用户所需信息的全过程。

优点:①检索速度快;②检索范围广而全面;③ 检索途径多、质量高;④检索内容新、实时性强; ⑤检索辅助功能完善、使用方便,检索结果输出 方式灵活、实用。

我国联机存取服务始于1974年,比较有影响的联 机存取系统有: (1)万方数据资源系统 / (2)CNKI数据资源系统 (3)维普数据资讯系统
/
(2)光盘信息检索 特点: 光盘存贮容量大、耐用 检索成本低。一次购买可多次使用,节省了电讯 费和联机系统使用费。 操作简单,检索效果好。用户按提示或帮助功能 使用检索系统。 运行速度快。单机检索,不受线路影响。 安全性能高。只读光盘,一般局域网用户使用。

6.2.3 信息检索效率的评价

检索效率是指全、准、快、便、省(检全率、检准 率、检索速度、检索方便性、检索成本与效益), 最主要的是全和准。 在评价信息检索效率过程中,主要通过检全率、 检准率、漏检率和误检率四个评价指标进行评价, 其中重点是检全率和检准率。





检全率=检出的相关文献量/系统中的相关文 献总量 检准率=检出的相关文献量/检出的文献总量 漏检率=未检出的相关文献量/系统中的相关 文献总量 误检率=检出的非相关文献量/检出的文献总 量



如果光盘数据库量不够多,则信息资源就显得有 限,购买大量光盘数据库,又要受到经费限制 更新周期长。一般的光盘数据库更新要1个月或更 长,而网络数据库的更新周期一般是1周或更短。 检索时需不断换盘。一个大型数据库,一般都是 几张光盘,特别是全文数据库,如中国学术期刊 全文光盘数据库,每年都有一百多张光盘,检索 时需要不断更换光盘。
6.1.2 信息检索的类型与特性
文献信息检索
依检索结果内容 划分 信 息 检 索 类 型 依信息存储与 检索方式划分 计算机检索 数据信息检索 事实信息检索
手工检索


手工检索工具 主要指,如印刷版的《全国报刊索引》。 计算机检索系统 主要指,如《中国期刊全文数据库 》

数据信息和事实信息检索是确定性的检索, 检索结果可以直接利用。 文献信息检索是一种相关性检索,检索结 果是文献信息的线索,一般通过二次信息 来实现。 全文数据库:是一次信息和二次信息的综合 体。在检索结果中,有直接的全文链接。
6.1.3信息检索的模型

布尔逻辑检索模型 (BooleanRetrieval Model,简称BRM) 概率检索模型 (Probability Retrieval Model,简 称PRM) 向量空间检索模型 (Vector Retrieval Model,简称VRM) 模糊检索模型 (Fuzzy Retrieval Model ,简称FRM)

光盘检索系统的功能和指令与联机检索没有很大区别,但 更方便。

功能键:Help(帮助)、Index(索引)、History(查阅历史)、 Display(显示)、Print(打印)、Select Database(选择数 据库)、Format Window(格式窗)、Quit(退出)等
检索信息时可用单元词、多元词(短语)、数字及布尔运算 符和位置运算符把几个检索术语组配成一个提问逻辑式。 用户可以在任何时刻回顾其查找的历史,重新使用或修改 以前的任何提问。
扩大信息源 效率低 检全率低 漏检率高

循环法:先利用检索工具查出一批有用文献,然 后再利用这些文献末尾所附参考文献的线索进行 追溯查找。
6.3.2 机械信息检索的技术与方法

机电信息检索系统
继手检穿孔卡片之后,出现了机检穿孔卡片 和选卡机。这就形成了机电信息检索系统。

光电信息检索系统
主要是以缩微胶卷(片)检索方式出现的。缩微胶 卷 (片 ) ①寻址检索方式 ②编码检索方式



6.3 信息检索的发展历程
三个阶段



手工信息检索阶段 机械信息检索阶段 计算机信息检索阶段
手工信息检索阶段



信息检索起源于参考咨询工作,参考咨询工作产生的标志是 1876年召开的美国图书馆协会第一届大会。1883年,波士顿 公共图书馆首次设置了专职参考馆员和参考阅览室; 20世纪初,多数图书馆成立了参考咨询部门,主要利用图书 馆的书目工具来帮助读者查找图书、期刊或现成答案。逐渐 发展到从多种文献源中查找、分析、评价和重新组织信息; “索引”突破了以前的狭隘范畴,成为独立的检索工具; 40年代进一步包括回答事实性咨询,编制书目、文摘,进行 专题文献检索,提供文献代译等。“信息检索”从此成为一 项独立的用户服务工作,并逐渐从单纯的经验工作向专业化 方向发展。
检 全 100 率 % 80 R 60
40
20
20
40
60
80 100
检准率% P
检全率与检准率的互逆相互曲线
6.2.4 信息检索的程序
(1)分析检索课题,明确信息需求

明确信息检索课题所涉及的领域和范围; 明确所需信息的类型,包括文献媒体、出版类型、 所需文献量、年代范围、涉及的语种、有关著者 明确信息检索课题对查新、查准和查全的指标要 求。
从检索手段看,信息检索分为: 手工信息检索 机械信息检索 计算机信息检索
6.3.1 手工信息检索的技术与方法 (1)手工信息检索工具

手工信息检索工具主要是各种类型的工具书
工具书是根据一定的需要,比较完备地汇集某一 方面的资料,并按特定的方法加以编排,专供读 者查考检索有关知识、资料、事实的书籍。据工 具书的体例和功能,可分为检索型工具书、参考 性工具书、词语性工具书、表谱性工具书、图录 性工具书和边缘性工具书6种类型。
(4)实施检索策略,浏览初步结果 在获取信息线索时要仔细阅读,判断所检出的 信息是否符合检索的要求,不仅看篇名,还要阅读 整个著录格式,进行综合分析。
(5)调整检索策略,获取所需信息

判断文献的出版类型。根据文献出处中已有的信 息,判断其出版类型。 整理文献出处。将文献出处中有缩写语、有音译 刊名的还原成全称或原刊名。 根据出版类型在图书馆或信息机构查找馆藏目录 或联合目录确定馆藏,原则上说应该按“由近及 远”的顺序逐步扩大查找馆藏的范围。 尽可能多渠道、多方式地获取原始信息。

能够指示计算机执行查询与检索
6.2.2 信息检索策略

信息检索策略是针对检索提问、运用检索方法和 技术而设计的信息检索方案,其目的是要达到一 定的检准率和检全率。 常用信息检索策略包括:分块概念组配检索策略、 逐步组配检索策略、对偶组配检索策略、增长组 配检索策略等。


目前在以下三方面取得进展: (1)以检全为目标的检索策略的调节与控制; (2)以检准为目标的检索策略的调节与控制; (3)以最小投入为目标的检索策略的调节与控制。 对特定系统、特定数据以及某一类型课题的检索 策略的研究具体表现在以下两方面: (1)某一系统、某一数据库检索策略; (2)某一类型课题检索策略。
需求概述 或疑问式
信息组织和检索系统
游戏规则=主题 索引规则+辞典 (包括词汇表和 索引语言)
信息或数据
规范化的 疑问式 检 索 流 程 概述的存贮
索引(描述性的、 受限制的) 信息的组织 组 织 流 程
存贮1:概述 /搜索请求
比较/匹 配
存贮2:信 息的表示
潜在的相 关信息
相关文档
最新文档