信息检索原理及检索系统结构
信息检索的原理

信息检索的原理
信息检索的原理是通过对大量文本语料进行分析和索引建立,以便在用户提出查询需求时能够快速地找到相关的文档或资源。
具体来说,信息检索的原理包括以下几个步骤:
1. 文本预处理:对原始文本进行分词、去除停用词、词干提取等处理,以减少噪音和冗余信息,并将文本转换为机器可理解的形式。
2. 建立索引:将预处理后的文本建立索引结构,例如倒排索引。
倒排索引是一种将词与其所在文档的映射关系存储起来的数据结构,可以快速地定位到包含特定词语的文档。
3. 查询处理:当用户提出查询请求时,系统会将查询语句进行与建立的索引进行匹配,例如找到包含所有查询词的文档。
查询可以采用布尔查询、向量空间模型、语义匹配等不同方法。
4. 相关度排序:根据查询结果的相关度对文档进行排序,以便用户能够优先查看最相关的文档。
排序可以使用向量空间模型中的余弦相似度、BM25等算法。
5. 结果展示:将排序后的结果展示给用户,通常包括一部分摘要或关键词高亮,以帮助用户快速浏览和判断文档的相关性。
信息检索的原理可以借助计算机算法的高效执行,为用户提供精确、快速和准确的结果。
不同的信息检索系统可能采用不同
的算法和技术,但核心思想是通过对文本的分析和索引建立,找到与用户查询相关的文档或资源。
信息检索的基本知识

⑵信息检索系统的类型 〔续〕
④索引型检索系统: 索引是根据一定的需要,把特定范围内的
某些重要文献中的有关款目或知识单元,书 名、刊名、人名、地名、语词等,按照一 定的方法编排,并指明出处,为读者提供 文献线索的一种检索系统。
索引不仅广泛存在于各种书刊等文献 中,而且更多见于作为辅助检索系统而附 在不同类型的检索工具之后,为检索工具 提供了更多的检索途径。
信息的存储过程就是按照主题词表或 分类表及使用原那么对原始信息资源
一、信息检索原理〔续〕
2、信息检索系统〔续〕
一、信息检索原理〔续〕
⑵信息检索系统的类型
按信息处理手段划分有 ①手工检索系统。又称传统检索系统 是使用人工来查找信息的检索系统。 其主要类型有各种书本式的目录、题 录、文摘和各种参考工具书等。优点: 方便、灵活、 断准确。缺点:检索速 度太慢
2、信息检索系统〔续〕
按著录和标引方式划分 ④文摘型检索系统是以简练的文字将文献
资料的主要内容准确、扼要地摘录下来, 并按照一定的著录规那么和编排方式系统 地组织起来的检索 工具。 主要包括:报道性文摘
指示性文摘 如:美国的?化学文摘?英国的?科学文摘〉
中国的〈中国数学文摘〉〈海洋文摘〉
2、信息检索系统〔续〕
按著录和标引方式划分
⑤全文型检索系统 全文检索是指在文献资料的标题、目录、作
者、内容中检索 指定的字符串。 全文检索系统是指将文章 中所有的文字处理序列 都作为检索对象进行索引,并根据需要找出包含 有欲检索词的文献的系统。
作用:它能提供快捷的数据管理工具和数据 查询手段,帮助人们进行了大量文献数据的整理 和管理工作,使人们能够快速、方便地查到想要 的任何信息。
第二章 信息检索的根本知识
信息检索的基本原理与方法

它要求检索系统不仅能够从数据 (事实) 集合中查出原来存入的数据或事实,还能够从已有的
基本数据或事实中推导、演绎出新的数据或事实。
例如,该系统中存储有如下事实:①李明是A校的学生。②A 校的学生都学外语。如果该系统
(3)、光电检索:即把检索标识变成黑白点矩阵或条形码,存储在缩微胶片 (卷)上,利用光电效应, 通过检索机械进行查找。
(4)、计算机检索:即把情报及其检索标识转换成电子计算机可以 阅读的二进制编码,存储在磁性载体上,由计算机根据程序进 行查找与输出。根据检索者同计算机进行的不同通信方式,计 算机检索又可以分为脱机检索、联机检索及多机网络化检索等。
信息检索的意义和作用主要是能有效提高人们检索信息和利 用信息的效率。对大学生来说,文献信息检索是培养学生能 力的基本技能和方法之一,最主要的是自学能力、研究能力、 思维能力、表达能力和组织管理能力的培养,是科学研究不 可缺少的一项工作。
具体地说信息检索有下面三个方面的作用:
(1).信息检索是获取知识的捷径
检索标识是信息存储时,对信息内容进行分析提出能代表信息内容实 质的主题词、分类号或其它符号,硅藻土、通用塑料、工程塑料、特种 塑料等、聚氯乙烯、聚乙烯、聚丙烯、聚酰胺、聚酰亚胺、聚酯、玻璃 钢等都是检索标识。
检索时,将提问特征与检索标识进行对比匹配,若达到一致或部分一 致,即为所需信息。
2、信息检索的起源
(3).信息检索是终身教育的基础
学校培养学生的目标是学生的智能:包括自学能力、研究能力、思维能
力、表达能力和组织管理能力。
联合国教文组织提出,教育已扩大到一个人的整个一生,认为唯有全面
信息检索的原理方法

信息检索的原理方法信息检索是指通过计算机系统检索出用户所需的相关信息的过程。
其原理和方法主要包括查询处理、索引构建和排序三个方面。
一、查询处理查询处理是信息检索中的重要环节,主要包括查询的表示和查询的扩展两个步骤。
1. 查询的表示查询的表示是将用户输入的自然语言查询转化为计算机可以处理的结构化查询的过程。
常见的查询表示方法包括布尔查询、向量空间模型和逻辑查询等。
- 布尔查询:布尔查询根据布尔逻辑关系对查询词进行组合,主要通过AND、OR和NOT运算符来表达查询需求。
例如,查询“信息检索AND 方法”即表示要求检索出同时包含“信息检索”和“方法”两个词条的文档。
- 向量空间模型:向量空间模型将查询和文档表示为向量,通过计算查询向量与文档向量的相似度来确定文档的相关性。
常用的相似度计算方法有余弦相似度等。
- 逻辑查询:逻辑查询使用逻辑关系来表示查询需求,包括AND、OR和NOT等。
例如,查询“信息检索AND (原理OR 方法)”表示要求检索出同时包含“信息检索”和“原理”或者包含“信息检索”和“方法”的文档。
2. 查询的扩展查询的扩展是为了提高信息检索的效果,主要包括同义词扩展和查询拓展两种方式。
- 同义词扩展:同义词扩展通过将用户查询中的单词替换为其同义词或近义词,以便检索更多相关文档。
同义词的获取可以通过词库、词典、语义分析等方法来实现。
- 查询拓展:查询拓展是根据初始查询结果中的高相关文档中的词语来扩展查询,以改进检索效果。
常见的拓展方法包括基于词频和文档频率的扩展、基于共现关系的扩展等。
二、索引构建索引构建是信息检索的核心环节,主要包括文档预处理、词汇表构建和倒排索引构建三个步骤。
1. 文档预处理文档预处理是对原始文档进行处理,将其转化为计算机可处理的形式。
常见的预处理步骤包括文本分词、去除停用词、词干化和标准化等。
- 文本分词:文本分词是将原始文本划分为词语的过程。
常见的分词方法有基于规则的分词算法、统计模型分词算法等。
计算机信息检索基本原理及检索技术

局限性
处理复杂语言现象的能 力有限,对某些专业领 域和特定语言的处理效 果有待提高。
机器学习与信息检索
概念
机器学习是人工智能的一个分支,通过训练让计算机自动学习并改进 检索算法。
应用
利用机器学习算法对大量数据进行训练和学习,自动提取特征并分类, 提高信息检索的准确性和效率。
优点
能够自动优化和改进信息检索算法,提高检索效果。
结果评价是对检索结果进行评估,判 断其是否满足用户的信息需求。
信息检索系统
信息检索系统是实现信息检索 的工具或平台,它能够从各种 信息源中获取、存储、组织和
检索信息。
常见的信息检索系统包括图 书馆信息系统、搜索引擎系 统、学术论文数据库等。
信息检索系统的性能和效果取 决于其信息组织方式、索引技 术、检索算法等多个因素。
信息检索过程
信息检索过程包括信息需求分析、信息源选择、 信息检索策略制定、信息检索实施和结果评价 等步骤。
信息需求分析是信息检索的前提,需 要明确用户的信息需求和信息类型。
信息源选择是根据信息需求选择合适 的检索工具或数据库。
信息检索策略制定是根据信息源的特 点和信息需求制定相应的检索策略。
信息检索实施是执行检索策略,从信 息源中获取相关信息。
解决信息隐私保护的方法包括立法保护、技术手 段如加密和匿名化等。
信息检索技术的未来发展
01
信息检索技术的发展趋势包括智能化、语义化、移动化和社交化等。
02
智能化技术如机器学习和人工智能动信息检索向更深层次的知识层面发展。
04
移动化和社交化的趋势将使信息检索更加个性化和社交化,提高用户 参与度和满意度。
语义鸿沟问题
01 语义鸿沟是指用户与信息之间的理解差距,导致 用户难以找到所需内容。
文献检索,信息检索(2)第二章 信息检索原理

缺点:常常落后于当前研究现状,分类表相对呆板的 学科关系,使得确定前沿概念、跨学科概念或非常具 体概念的分类,较困难。用户差异性。
分类语言
中国图书馆图书分类法 美国国会图书馆分类法 杜威十进位分类法 IPC国际专利分类法
基本部类 马列毛邓 哲学
(2)多概念课题
并列概念课题,如“新闻宣传研究”
“计算机在人文社会科学方面的应用” 上位类分类方法,如“灰色系统理论”
应用性课题,如“计算机在人口预测方面的应用”、
2.主题语言
是直接以代表信息内容特征和科学概念的概 念词作为检索标识,并按字顺组织的一种检索语 言。 是以表达文献主 是从文献的内容 是从文献的题目
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,
将检索提问式转换成逻辑表达式,限定检索
词在记录中必须存在的条件或不能出现的条 件。凡符合布尔逻辑所规定的条件的文献, 既为命中文献。
布尔逻辑运算符
————————————
1、逻辑“或” 2、逻辑“与” 3、逻辑“非”
2、逻辑“与”
————————————————
Chinese AND litera0,000 网络100,000,000) 用符号“and”或“*”表示,其逻辑表达式为: A * B 或 A and B 其意义为检索记录中必须同时含有检索词A和B 的文献,才算命中文献。
4、记录级
检索词在数据库的同一记录中。
(C)—citation
表示两侧的检索词(或检索项)必须出现在同一记录中,词
序不限,中间词数量不限,其作用与布尔逻辑算符AND相同。
简述信息检索的原理
简述信息检索的原理
信息检索是一种通过计算机技术,在大规模的数据集中查找和提取相关信息的过程。
其原理可以简述为以下几个步骤:
1. 数据准备:信息检索需要先将待检索的数据集进行预处理,包括分词、去除停用词(如“的”、“是”等无实际意义的词)、
词干化(将不同形式的词汇转化为其原始形式)等操作,以便后续的索引构建和匹配计算。
2. 索引构建:在进行信息检索之前,需要先构建索引结构来加速搜索过程。
常见的索引结构包括倒排索引(Inverted Index),通过将每个单词(分好词的数据)与其出现的文档关联起来,快速找到包含某个单词的文档记录。
3. 查询处理:当用户输入一个查询请求时,首先需要对用户的查询进行处理,包括分词、去除停用词等操作,得到与索引一致的查询项。
4. 匹配计算:通过比较查询项和索引中的文档集合,计算出每个文档与查询的相关性得分。
这些得分可以使用不同的算法进行计算,如TF-IDF、BM25等,以便排序和筛选出与查询最
相关的文档。
5. 结果展示:将得分高的文档按照一定的规则进行排序,并通过界面将结果展示给用户。
常见的展示方式包括简单的列表显示、摘要展示以及更复杂的聚类、分类等。
6. 反馈和优化:根据用户的反馈和使用情况,可以通过对查询和结果的分析,进行相应的优化和改进。
这可能包括调整索引结构、改进查询处理流程、优化算法等。
综上所述,信息检索通过数据准备、索引构建、查询处理、匹配计算、结果展示等步骤,通过计算机技术快速准确地从大规模数据集中检索出相关的信息,以满足用户需求。
网络信息检索的原理及技术
检索过程
收集标引过程
分布式搜索引擎的一般结构
网络空间
用户
复制管理器 中介器 对象缓存
中介器
收集器
………… .
9.3.1网络信息的采集
• 定义:是实现网络信息检索的第一环节,其主要任
务是为网络信息资源库录入信息源。
• 广义上:网络信息采集包括网络信息检索系统的所
有信息采集和录入活动。
• 狭义上:是指网络搜索引擎的信息采集。
• 1.数据库组织方式:将所有获得的信息资源按照固定的记录格式存储组织,用户通过
关键字及其组配可以知道所需要的信息线索
• 2.超链接方式:把不定长的基本信息单元存放在节点上,这些基本信息单元可以使单个
字,句子,章节,文献,甚至是图像,音乐或者录像。
• 3.主页方式:通过各种频道栏目,根据网站定位的用户对象,需求的动态,一次信息等
重要的,所以它的PageRank值最高。
网页A级别=(1-系数)+系数×—网—页—1—级—别—
网页1链出个数
+ —网—页—2—级—别—...+—网—页—N—级—别—
网页2链出个数
网页N链出个数
9.7网络信息检索的研究热点
• 9.7.1 海量数据的存储与处理
A
Group
B
Group
C
Group
(1)海量数据的 磁盘列存储技术
(随便告诉大家元数据是元数据是一种二进制信息,用以对存储在公共语言 运行库可移植可执行文件 (PE) 或存储在内存中的程序进行描述)
MARC元数据的概念 MARC元数据:是利用计算机识读和处理的目录。MARC主要用
于图书馆管理软件中,采访、编目、典藏等环节都有重要的 作用,也方便馆际之间的数据交流,是统一文献著录规范。 我简练点叫它“英文机读目录格式” ,如果是“中国范”的 CNMARC就叫“中国机读目录格式”
信息检索的基本原理
信息检索的基本原理信息检索是指从大量的信息资源中找到用户所需的信息的过程。
它是一种通过计算机系统来获取相关信息的技术,也是现代信息社会中不可或缺的一部分。
信息检索的基本原理涉及到信息的组织、存储、检索和呈现等方面,下面我们来详细介绍一下信息检索的基本原理。
首先,信息检索的基本原理之一是信息的组织和存储。
在信息检索系统中,信息通常以文本的形式存在,因此需要对文本进行组织和存储。
这包括对文本进行索引、分类、标记等操作,以便于后续的检索和呈现。
索引是信息检索系统中非常重要的一环,它可以帮助用户快速地找到所需的信息。
同时,分类和标记可以帮助系统更好地理解和处理文本,提高检索的准确性和效率。
其次,信息检索的基本原理还包括检索和匹配。
检索是指用户通过检索词(关键词)来获取相关信息的过程,而匹配则是指系统根据用户的检索词和需求,从存储的信息资源中找到与之匹配的内容。
在信息检索系统中,通常会使用各种算法和技术来实现检索和匹配的功能,以提高检索的准确性和速度。
例如,常见的检索算法包括倒排索引、向量空间模型等,它们可以帮助系统更好地理解和处理用户的检索需求,从而提供更准确和相关的搜索结果。
另外,信息检索的基本原理还涉及到信息的呈现和推荐。
一旦系统找到了与用户需求匹配的信息,就需要将这些信息以合适的方式呈现给用户。
这包括对搜索结果的排序、摘要的生成、相关性的评估等操作,以提高用户对搜索结果的满意度。
同时,信息检索系统还可以通过推荐算法来向用户推荐相关的信息,帮助用户发现他们可能感兴趣但又不知道的信息资源,从而提高信息的利用率和用户体验。
总的来说,信息检索的基本原理涉及到信息的组织、存储、检索和呈现等方面。
通过对信息的组织和存储,系统可以更好地理解和处理文本;通过检索和匹配,系统可以帮助用户快速地找到所需的信息;通过信息的呈现和推荐,系统可以提高用户对搜索结果的满意度和信息的利用率。
信息检索技术的发展不仅可以帮助用户更方便地获取信息,也可以帮助组织更好地管理和利用信息资源,因此具有非常重要的意义。
信息检索原理
④限定检索技术
使用截词检索,简化了布尔逻辑检索中的逻辑 或功能,并没有改善布尔逻辑检索的性质。使用位 置逻辑检索,只能限制检索词之间的相对位置,不 能完全确定检索词在数据库记录中出现的字段位置, 特别在使用自由词进行全文检索时,需要用字段限 制查找的范围。常用的字段代码有标题( TI )、文 摘(AB)、叙词或受控词(DE或 CT)、标识词或自 由词(ID或 UT)、作者(AU)、语种(LA)、刊名 ( JN )、文献类型( DT )、年代( PY )等。这些限 制符在不同的系统有不同的表达形式和使用规则, 在进行字段限制检索时,应参阅系统及有关数据库 的的使用说明,避免产生检索误差。
②信息检索系统
信息检索系统是根据一定社会 需要和为达到特定的信息交流目的 而建立的一种有序化的信息资源集 合体。信息检索系统通常应是一个 拥有选择、整理、加工、存储、检 索信息的设备与方法,并能向用户 提供信息服务的多功能开放系统。
3、信息检索技术
①布尔逻辑检索技术
②位置逻辑检索技术 ③截词检索技术 ④限定检索技术
对虾 水产
养殖
②位置逻辑检索技术
位置逻辑检索持续术是以数据库原始记录中的检 索词之间的特定位置关系为对象的运算,又称全文检 索。它是一种可以不依赖叙词表而直接使用自由词进 行检索的一种技术。这种检索技术增强了选词的灵活 性,采用具有限定检索词之间位置关系功能的位置逻 辑符进行组配运算,可弥补布尔检索技术只是定性规 定参加运算的检索词在检索中的出现规律满足检索逻 辑即为命中结果,不考虑检索词词间关系是否符合需 求,而易造成误检的不足。在不同的检索系统中,位 置逻辑算符的种类和表达形式不完全相同,使用位置 逻辑检索技术时,注意所利用系统的使用规则。 在位置逻辑符中,常用的位置逻辑算符有(W)与 (nW)、(N)与(nN)、(S)、(F)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
河北大学管理学院信息管理工程系宛玲
2.6.1 计算机检索系统的物理结构
软件, 硬件 ,软件,数据库
河北大学管理学院信息管理工程系宛玲
2.6.2 计算机检索系统的逻辑结构
信息源选择与采集子系统 词表管理 子系统 标引子系统 用户接口子系统 提问处理子系统
• 是指存储某个领域的二次文献(如文摘、题录、目录等 是指存储某个领域的二次文献(如文摘、题录、 书目数据) 书目数据)的一类数据库
指南数据库(Referral database或Directory 指南数据库 或 database)
• 是指存储关于某些机构、人物、出版物、项目、程序、 是指存储关于某些机构、人物、出版物、项目、程序、 活动等对象的简要描述, 活动等对象的简要描述,指引用户从其他有关信息源获 取更详细的信息的一类数据库。 取更详细的信息的一类数据库。 河北大学管理学院信息管理工程系宛玲
河北大学管理学院信息管理工程系宛玲
2.4 印刷型检索工具的类型、结构
2.4.1 文献检索工具的一般结构 2.4.2 事实与数据检索工具的构成
河北大学管理学院信息管理工程系宛玲
2.4.1 文献检索工具的一般结构
河北大学管理学院信息管理工程系宛玲
2.4.1 文献检索工具的一般结构
文献检索工具的构成
河北大学管理学院信息管理工程系宛玲
作用
• 迅速、定期地把科技文献中最新的重要的部分报道出来 迅速、 • 尽可能完全地收录全世界出版的有关某一领域的文献以 备检索和利用。 备检索和利用。
类型
• 最新期刊目次页汇编 • 期刊论文题录 • 分类型题录性工具
河北大学管理学院信息管理工程系宛玲
2.3.4 事实与数据检索工具
河北大学管理学院信息管理工程系宛玲
2.3.1 文摘型检索工具
文摘
含义: 含义: 作用: 作用: 类型: 类型:
文摘款目的内容与格式
河北大学管理学院信息管理工程系宛玲
河北大学管理学院信息管理工程系宛玲
2.3.2 目录型检索工具
目录I 目录
含义: 含义:目录是按照某种明白易懂的顺序编列的文献 清单或清册, 清单或清册,通常以一个完整的出版单位或收藏单 位为著录的基本单位。 位为著录的基本单位。 作用:目录是进行出版物的登记、统计、 作用:目录是进行出版物的登记、统计、指导阅读 和科学管理图书资料的工具,也是“辨章学术. 和科学管理图书资料的工具,也是“辨章学术.考 镜源流” 镜源流”。 类型
全文数据库
这是一种存储文献全文或其中主要部分的源数据库
术语数据库
这是一种专门存储名词术语信息、 这是一种专门存储名词术语信息、词语信息以及术语工作和 语言规范工作成果的源数据库
图像数据库
这是一种用来存储各种图像或图形信息及有关文字说明资料 的源数据库
河北大学管理学院信息管理工程系宛玲
2.6 计算机检索系统的结构
河北大学管理学院信息管理工程系宛玲
2.1 信息检索的基本原理
河北大学管理学院信息管理工程系宛玲
2.2 信息检索系统基本类型及特点
(1)按信息处理手段(即文献信息的存贮和检索设备)分
手工信息检索:组织存储----检索
• 组织存储过程
–选择信息源——考虑根据什么? –分析标引描述——信息组织和信息描述课程内容 –检索工具的编制(后)
2.5.1 参考数据库系统 2.5.2 源数据库系统
河北大学管理学院信息管理工程系宛玲
2.5.1 参考数据库系统
参考数据库(Reference databases)是指引用 参考数据库 是指引用 户到另一信息源以获得原文或其他细节的一类 数据库。 数据库。
书目数据库( 书目数据库(Bibliographic databases) )
• 按职能划分,目录有出版发行目录、馆藏目录、资料来 按职能划分,目录有出版发行目录、馆藏目录、 源目录等
河北大学管理学院信息管理工程系宛玲
出版发行目录。包括登记性的国家书目和商业 出版发行目录。 性的出版商书商目录。 性的出版商书商目录。 馆藏目录。 馆藏目录。包括反映单个图书馆图书收藏情况 的图书馆藏书目录和反映某一地区或系统甚至 全国的图书收藏情况的联合目录。 全国的图书收藏情况的联合目录。 资料来源目录。 资料来源目录。是指附属于某一检索工具或检 索系统的“引用出版物目录” 有的亦称“ 索系统的“引用出版物目录”,有的亦称“资 料来源索引” 料来源索引”。
建库子系统
河北大学管理学院信息管理工程系宛玲
2.6.3 计算机检索系统内容结构
检索功能
系统介绍 正文
帮助
辅助功能
文献清单
河北大学管理学院信息管理工程系宛玲
本章思考题
1、叙述信息检索的基本原理 、 2、信息检索系统都包括哪些类型? 、信息检索系统都包括哪些类型? 3、文摘型检索工具的组成包括哪些? 、文摘型检索工具的组成包括哪些? 4、事实数据型检索工具的组成包括哪些? 、事实数据型检索工具的组成包括哪些?
信息检索—— 信息检索—— 2 信息检索原理与检索系 统结构
专业:信息管理与信息系统 专业: 河北大学管理学院
河北大学管理学院信息管理工程系宛玲
有了对信息检索的初步了解,本章我们将详细讲 述信息检索的基础理论。
2.1 2.2 2.3 2.4 2.5 2.6 信息检索的基本原理 信息检索系统基本类型及特点 印刷型检索工具的类型 印刷型检索工具的结构 计算机检索系统的类型 信息检索系统的结构
事实与数据检索工具用于各种事实或数据 的查询,如查找某一词的解释.某人、某事件、 的查询,如查找某一词的解释.某人、某事件、 某地名、某企业及其产品情况等. 某地名、某企业及其产品情况等.其结果是获 得直接的、可供参考的答案。 得直接的、可供参考的答案。常见的事实与数 据检索工具包括百科全书、传记资料、 据检索工具包括百科全书、传记资料、地理资 年鉴、机构指南、语文词典、 料、年鉴、机构指南、语文词典、统计资料等 几种类型。 几种类型。
河北大学管理学院信息管理工程系宛玲
河北大学管理学院信息管理工程系宛玲
2.3.3 题录型检索工具
题录
含义: 含义:题录是用来描述某一文献的外部特征并由一 组著录项目构成的一条文献记录, 组著录项目构成的一条文献记录,利用它可以相当 准确地鉴别一种出版物或其中的一部分。 准确地鉴别一种出版物或其中的一部分。 区别:题录通常以一个内容上独立的文献单元( 区别:题录通常以一个内容上独立的文献单元(如 一篇文章,图书中一部分, 一篇文章,图书中一部分,但有时也可以是整本出 版物)为基本著录单位, 版物)为基本著录单位,这是它与目录款目的主要 区别。 区别。两者的相同点是它们都只限于描述文献的外 部特征。 部特征。题录实质上是一种不含文摘正文的文摘款 在揭示文献内容的深度方面, 目。在揭示文献内容的深度方面,题录比目录做得 深入一些,但又比文摘款目浅。 深入一些,但又比文摘款目浅。
• 检索过程(图2-1)
穿孔卡片检索系统。
河北大学管理学院信息管理工程系宛玲
河北大学管理学院信息管理。 计算机检索系统。 网络检索系统。
河北大学管理学院信息管理工程系宛玲
2.3 各类型印刷型检索工具介绍
2.3.1 文摘型检索工具 2.3.2 目录型检索工具 2.3.3 题录型检索工具 2.3.4 事实与数据检索工具
编辑说明与凡例
文献分类表和主题词表
文摘部分
资料来源目录与附录
辅助索引
河北大学管理学院信息管理工程系宛玲
2.4.2 事实与数据检索工具的构成
事实与数据检索工具 编辑说明 正文 辅助索引 附录 书目与注释
河北大学管理学院信息管理工程系宛玲
2.5基于加工程度划分的计算机检索系 2.5基于加工程度划分的计算机检索系 统的类型
2.5.2 源数据库系统
数值数据库
这是一种专门提供以数值方式表示的数据的源数据库, 这是一种专门提供以数值方式表示的数据的源数据库,如统 计数据库、财务数据库等。 计数据库、财务数据库等。
文本-数值数据库 文本 数值数据库
这是一种能同时提供文本信息和数值数据的源数据库。 这是一种能同时提供文本信息和数值数据的源数据库。