计算机信息检索
计算机复习信息检索

计算机复习信息检索信息检索是指通过计算机技术,根据用户的需求,在大规模的信息资源中准确、快速地找到相关的信息。
在当今信息爆炸的时代,信息检索的重要性不言而喻。
本文将介绍信息检索的基本概念、技术和应用,并附带答案和解析。
一、信息检索概述信息检索是指通过计算机对大规模信息资源进行全文检索、关键词检索等方式,根据用户需求提供相关信息的过程。
其目标是提高检索准确性和检索效率,帮助用户快速获取所需信息。
信息检索系统由信息资源、检索模型、检索方法和用户界面等组成。
其中,信息资源包括数据库、文档集合等;检索模型包括向量空间模型、布尔模型等;检索方法包括倒排索引、词频统计等;用户界面提供检索接口供用户输入查询词,并显示检索结果。
信息检索的基本流程包括:用户输入查询词->检索系统进行查询处理->检索系统返回相关文档。
二、信息检索技术1. 关键词检索关键词检索是最常见的信息检索方式,用户通过输入关键词,检索系统根据关键词在信息资源中进行匹配,并返回相关文档。
关键词检索常用的算法有向量空间模型、TF-IDF算法等。
全文检索是指对文档集合中的全部文本进行检索,而不仅仅是关键词。
全文检索主要通过分词、建立倒排索引等技术来实现。
用户输入的查询词可以是一个短语或一句话。
3. 自然语言查询自然语言查询是指用户使用自然语言进行查询,而不是像关键词查询那样只输入几个词。
自然语言查询需要将用户的自然语言转化为计算机可处理的查询语言,如SQL语句。
4. 语义检索语义检索是一种基于语义理解的检索方法,通过对查询词的语义进行分析,实现更精准、准确的检索。
语义检索常用的技术有词义消歧、词向量模型等。
三、信息检索应用1. 搜索引擎搜索引擎是信息检索的最常见应用之一,在互联网上广泛使用。
搜索引擎通过爬虫程序对互联网进行爬取,建立庞大的索引库,并通过用户输入的查询词返回相关页面。
2. 文献检索在学术界和科研领域,文献检索是非常重要的工作。
计算机信息检索

中国科技信息研究所
中国科技信息研究所(ISTIC) 其网址是: 。 ISTIC是我国最大的一个科技信息服务 中心,向全国联机终端提供检索服务。
开发应用的数据库:
· 中国科技文献数据库(光盘) · 中国学位论文目录数据库(软盘、光盘) · 中国学术会议论文数据库(软盘、磁带、光盘、 联机检索) · 中国学术会议论文数据库(软盘、磁带、光盘、 联机检索) · 中国科技信息机构数据库(光盘、联机检索) · 西文文献目录数据库(联机检索) · 科技动态数据库(联机检索) · 科技声像资料联合目录数据库(软盘)
2.3国际互联网检索
2.3.1互联网检索特点 也称因特网,它具有全球性的分布结构、开放性的信 息环境及跨国界的信息流。互联网的检索可同时使用 网上多个主机,甚至所有主机的某种资源而并不需要 用户预先知道它们的具体地址。这就极大扩宽了其检 索的空间和信息量,包括各种文献信息资源及其指向 的网络页面。而传统的联机检索、光盘检索只局限在 对一台或几台主机上的特定数据库的检索。但在另一 方面,互联网信息庞杂,正式与非正式信息及其交流 渠道共存,信息缺乏有效的组织管理,因此很难用一 般意义上的查全、查准这些概念来衡量其检索。目还 没有一个对所有在线服务行之有效的简单检索模式。
2.1.2联机数据库的结构
数据库主要由“文档——记录——
字段”三个层次构成。
文档(File)
文档是数据库内容的基本组成形式。是由若干 个记录构成的信息集合。分顺排和倒排。 顺排:将数据库记录按记录号大小排列而成。 倒排:以记录的特征标识为排列依据,在后面列 出含此标识的记录号。 一个数据库一般含有一个顺排文档及数个倒排文 档。
中文数据库:
计算机基础信息检索

多媒体信息检索技术应用
图像检索:通过图像内容进行 检索如图像识别、图像分类等
音频检索:通过音频内容进行 检索如语音识别、音乐识别等
视频检索:通过视频内容进行 检索如人脸识别、场景识别等
文本检索:通过文本内容进行 检索如关键词搜索、文本分类
等
多媒体融合检索:结合多种媒 体进行检索如跨媒体检索、多
媒体内容分析等
和准确性
移动化:适应 移动设备的发 展趋势提供更 便捷的检索服
务
社交化:结合 社交网络提高 信息传播和检
索的互动性
专业化:针对 特定领域提供 更专业的检索 服务满足不同
用户的需求
数据库信息检索 技术
数据库信息检索原理
检索方法:包括全文检索、 关键词检索、布尔检索等
数据库检索:通过数据库管理 系统(DBMS)进行数据查询 和检索
多媒体信息检索原理
多媒体信息检索技术分类
基于内容的检索:通过分析多媒体内容的特征进行检索 基于文本的检索:通过分析多媒体内容的文本信息进行检索 基于视觉的检索:通过分析多媒体内容的视觉特征进行检索 基于音频的检索:通过分析多媒体内容的音频特征进行检索 基于视频的检索:通过分析多媒体内容的视频特征进行检索 基于多模态的检索:综合利用多种特征进行检索
数据库信息检索技术发展趋势
智能化:利用人工智能技 术提高检索效率和准确性
集成化:将多种数据库技 术集成实现跨平台检索
安全性:加强数据加密和 访问控制保障数据安全
实时性:提高数据更新速 度实现实时检索
移动化:适应移动设备的 需求提供移动检索服务
云化:利用云计算技术实 现数据库资源的共享和优 化
多媒体信息检索 技术
信息检索技术:包 括文本检索、图像 检索、音频检索等
计算机信息检索范文

计算机信息检索范文计算机信息检索是指从大规模的计算机存储系统中通过用户提交的查询请求,找到并提供与查询请求相关的信息的过程。
计算机信息检索广泛应用于各个领域,包括Web引擎、图书馆信息检索系统、企业知识管理系统等。
下面我将就计算机信息检索的基本原理和技术进行详细介绍。
首先,对于查询处理,信息检索系统需要对用户查询进行预处理,包括词法分析、语法分析和查询规范化等。
词法分析是将查询转换为单词的序列,这些单词被称为检索词。
语法分析是通过解析用户查询中的语法结构,构建查询的语法树。
查询规范化是将查询转换为一致的形式,以便进行后续的索引匹配。
其次,索引建立是信息检索系统的关键步骤。
索引是一个数据结构,用于快速定位与用户查询相关的文档。
常用的索引结构包括倒排索引和正排索引。
倒排索引是将单词与其出现的文档进行关联,方便通过单词查询与之相关的文档。
正排索引是将文档与其包含的单词进行关联,方便通过文档查询包含的单词。
索引建立过程包括分词、词干化、停用词过滤和权重计算等步骤。
分词是将文档拆分成单词的过程。
词干化是将单词转换为其基本形式,以避免不同形式的单词导致的检索问题。
停用词过滤是去除常见单词,如“的”、“是”等,这些单词对于检索相关性没有意义。
权重计算是根据单词在文档中出现的频率和重要性,对文档进行打分。
最后,文档匹配是根据用户查询与索引进行匹配,找到与查询最相关的文档。
常用的文档匹配算法包括向量空间模型、概率模型和语言模型等。
向量空间模型将查询和文档表示为向量,通过计算向量之间的相似度来确定文档与查询的相关性。
概率模型基于统计方法,使用概率模型来计算文档与查询的相关概率。
语言模型基于文档中的单词出现的概率分布,通过计算文档与查询的匹配度来确定文档与查询的相关性。
除了以上三个基本步骤,计算机信息检索还涉及到一些其他的技术,如查询扩展、结果排序和评估方法等。
查询扩展是通过分析用户查询和相关文档,自动生成扩展查询,以获取更准确的检索结果。
计算机信息检索

计算机信息检索在当今信息爆炸的时代,计算机信息检索成为了我们获取知识和信息的重要手段。
无论是在学术研究、工作还是日常生活中,我们都常常需要从海量的数据中迅速准确地找到所需的信息。
那么,究竟什么是计算机信息检索呢?简单来说,计算机信息检索就是利用计算机系统来查找和获取存储在数据库或网络中的信息。
它就像是一个超级智能的图书馆管理员,能够快速帮我们在庞大的信息库中找到我们想要的那本书或者那篇文章。
计算机信息检索的发展可以追溯到上世纪五六十年代。
早期的信息检索系统主要基于简单的关键词匹配,功能相对有限。
但随着计算机技术的不断进步,信息检索技术也得到了飞速发展。
如今,它已经成为了一个非常复杂和强大的领域,融合了数据库管理、自然语言处理、机器学习等多种技术。
计算机信息检索系统通常由以下几个部分组成:信息数据库、检索引擎、用户界面和检索策略。
信息数据库是存储各种信息的仓库,这些信息可以是文本、图像、音频、视频等多种形式。
检索引擎则是系统的核心,负责对用户的检索请求进行处理和分析,并在数据库中查找匹配的信息。
用户界面是用户与系统进行交互的窗口,它应该设计得简洁、直观,方便用户输入检索条件和查看检索结果。
检索策略则是用户为了获得准确检索结果而制定的一系列规则和方法。
在进行计算机信息检索时,我们首先需要明确自己的检索需求。
这就像是在出发旅行前要先确定目的地一样。
然后,我们选择合适的检索工具和数据库。
不同的数据库涵盖的信息范围和类型可能不同,比如有的侧重于学术文献,有的则更关注新闻资讯或商业数据。
接下来,我们要制定有效的检索表达式。
这可以是简单的关键词,也可以是更复杂的布尔逻辑表达式,比如“与”“或”“非”等操作符的组合。
例如,如果我们想查找关于“人工智能在医疗领域的应用”的信息,我们可以使用“人工智能”和“医疗”这两个关键词进行检索。
但如果我们想更精确地找到相关内容,可能会使用“(人工智能 AND 医疗)NOT机器人”这样的表达式,以排除一些不相关的结果。
简述计算机信息检索的主要途径

简述计算机信息检索的主要途径计算机信息检索是指通过计算机技术,对大量的信息进行存储、组织、检索和提取,以满足用户对信息的需求。
在信息爆炸的时代,计算机信息检索成为人们获取信息的主要途径之一。
本文将从不同的角度介绍计算机信息检索的主要途径。
一、网络搜索引擎网络搜索引擎是计算机信息检索的主要途径之一。
通过搜索引擎,用户可以在互联网上检索到各种形式的信息,如网页、新闻、图片、视频等。
目前,谷歌、百度、必应等搜索引擎已经成为人们日常生活中必不可少的工具之一。
用户可以通过输入关键词,搜索引擎会根据算法对互联网上的信息进行索引和排序,展示给用户最相关的结果。
二、数据库检索数据库是存储和管理大量结构化数据的系统,也是计算机信息检索的重要途径之一。
通过数据库管理系统,用户可以对数据库中的信息进行检索。
数据库检索可以是基于关键词的,也可以是基于结构化查询语言(SQL)的。
用户可以通过输入条件或者SQL语句,从数据库中提取所需的信息。
数据库检索通常用于企业、政府等组织的数据管理和决策支持系统中。
三、文献检索文献检索是学术界和科研人员进行科学研究的重要途径之一。
通过文献检索工具,如Google Scholar、万方数据库等,用户可以检索到全球范围内的学术论文、会议论文、专利等文献信息。
文献检索可以根据关键词、作者、期刊等多种检索方式进行。
文献检索工具提供了方便的界面和高效的搜索算法,帮助用户快速找到所需的文献信息。
四、专业知识库专业知识库是某一领域专家或组织对特定领域知识进行整理和归纳形成的数据库。
专业知识库通常包含了该领域的基本概念、原理、方法等内容,并提供了详细的参考资料和相关文献。
用户可以通过专业知识库快速获取到某一领域的专业知识和最新进展,以支持自己的工作和学习。
五、社交媒体搜索随着社交媒体的普及,社交媒体搜索成为了人们获取信息的重要途径之一。
通过社交媒体搜索引擎,如微博、微信等,用户可以检索到社交媒体平台上的各种信息,如动态、评论、话题等。
计算机信息检索技术
计算机信息检索技术在当今数字化和信息化的时代,计算机信息检索技术成为了我们获取知识和信息的重要手段。
无论是在学术研究、商业决策、日常生活还是在各类专业领域,它都发挥着不可或缺的作用。
计算机信息检索,简单来说,就是利用计算机系统从大量的信息资源中查找出符合用户需求的特定信息。
它基于一系列的技术和算法,能够快速、准确地处理和筛选海量的数据。
让我们先来了解一下计算机信息检索的基本流程。
首先,用户需要明确自己的信息需求,并将其转化为计算机能够理解的检索表达式。
这可能包括关键词、短语、逻辑运算符(如“与”“或”“非”)等的组合。
然后,计算机系统会对已有的信息数据库进行搜索。
这些数据库可以是各种类型的,比如图书馆的馆藏目录、学术期刊数据库、网络搜索引擎的索引等。
在搜索过程中,系统会根据预先设定的算法和规则,对数据库中的每条记录进行匹配和评估。
最后,系统将符合检索条件的结果返回给用户,并按照一定的排序方式进行展示,通常是根据相关性、权威性或其他特定的标准。
为了实现高效的信息检索,有许多关键的技术和方法被应用。
其中,索引技术是非常重要的一项。
就像一本书的目录一样,索引可以帮助计算机快速定位到可能包含相关信息的位置。
常见的索引类型包括倒排索引,它将词语与包含这些词语的文档建立关联,从而大大提高了检索的速度。
在信息检索中,文本分类和聚类技术也有着广泛的应用。
文本分类是将文本按照预先定义的类别进行划分,比如将新闻文章分为体育、娱乐、科技等类别。
聚类则是将相似的文本自动分组在一起,无需事先定义类别。
这两种技术都有助于用户更有针对性地浏览和筛选检索结果。
另外,信息检索的准确性和相关性评估也是至关重要的。
如何确定哪些结果与用户的需求最相关,这涉及到复杂的算法和模型。
例如,常见的基于向量空间模型的方法,将文本和检索表达式都表示为向量,通过计算向量之间的相似度来评估相关性。
随着技术的不断发展,智能化的信息检索技术也逐渐崭露头角。
第四章 计算机信息检索
(2)确定检索词之间的相互关系 并列关系 、交叉关系、排除关系等。 (3)选择相应的逻辑运算符链接检索词 大学生心理测试与智力测试: 大学生 AND (心理测试 OR 智力测试) 国外煤矿瓦斯检测与监测: 煤矿 AND (瓦斯检测 OR 瓦斯监测) NOT 中国
2.
截词符
也称统配符(wild card), 用来对检索词(干)进行扩 展。用“?”或“*”号表示。 (1)后方截词:可分为无限截词和有限截词 ①无限定性截词 是在一个词尾加一个 ? 号,表示在其后可添加任 意多个字符,这些字符都被作为检索词进行检索。 如:smok? 它将对若干词进行检索,包括:smoke, smoky, smoked, smoker, smokes, smokers, smoking, smokeless等等。
(1)后缀式 后缀式(suffix code), 是将字段代码放在检索 词之后,并用/号连接, 如: 后缀代码: /TI 表示 Title (篇名) /AB 表示 Abstract(文摘) /DE 表示 Descriptor (叙词,规范词) /ID 表示 Identifier (标识词,专用词) 如:electron/ti 表示electron一词须出现在篇名 字段, electron/ti,ab 表示electron 一词须出现在 篇名或文摘字段。
这里用A和B分别代表两个检索词,它们的逻辑关系由 下表和图说明。
三种逻辑关系(阴影部分为命中)
注:英文数据库通常用字母,中文数据库要用符号
布尔运算逻辑表达式的制定
布尔逻辑运算的优点在于它能将复杂的检索提问按 其概念组配的逻辑关系描述出来。布尔逻辑运算可 以组合在一起表达一个复杂的检索提问。具体的制 定如下: (1)提取检索词 如:“大学生心理测试与智力测试” 检索词为大学生、心理测试、智力测试; 如:“国外煤矿的瓦斯检测与监测” 检索词为煤矿、瓦斯检测、瓦斯监测
计算机的信息检索技术有哪些详解信息检索的基本原理与方法
计算机的信息检索技术有哪些详解信息检索的基本原理与方法信息检索是指通过计算机技术,从大量数据中快速找到所需信息的过程。
随着互联网的普及和信息爆炸的时代,信息检索技术的重要性日益突出。
本文将详解信息检索的基本原理与方法,以及常见的信息检索技术。
一、信息检索的基本原理信息检索的基本原理是通过索引和检索两个步骤实现的。
首先,在建立索引的阶段,将待检索的数据进行预处理,提取出关键词和相关信息,并建立索引文件。
索引文件包含了每个文档中所有的关键词及其所在位置的信息。
其次,在检索的阶段,用户输入检索词,系统根据索引文件快速定位到相关文档,并将其返回给用户。
二、信息检索的方法1. 布尔检索法布尔检索法是最早的信息检索方法之一,它通过逻辑运算符(例如AND、OR、NOT)将用户检索词与索引文件中的关键词进行匹配,从而找到满足要求的文档。
这种方法简单直接,但需要用户具有一定的逻辑思维能力。
2. 向量空间模型向量空间模型将文档表示为向量,并利用向量之间的相似度进行检索。
在该模型中,每个文档可以看作是一个向量,而检索词也可以转换为向量。
通过计算文档向量与检索向量之间的相似度,可以确定与用户需求最匹配的文档。
3. 概率检索模型概率检索模型基于信息检索的概率理论,利用检索词在文档中出现的概率和文档的相关性进行检索。
常见的概率模型包括贝叶斯模型和语言模型。
这种方法能够更准确地计算文档与检索词的相关性,提高检索结果的质量。
4. 自然语言处理技术自然语言处理技术在信息检索中起着重要的作用。
通过对自然语言的分析和理解,能够更好地理解用户查询的意图,并将其转化为机器可理解的形式。
常见的自然语言处理技术包括词法分析、句法分析和语义分析。
三、常见的信息检索技术1. 网页搜索技术网页搜索技术是信息检索中最常见的应用之一。
通过搜索引擎,用户可以快速找到互联网上的相关信息。
网页搜索技术常用的算法包括页面排名算法(例如PageRank算法)和关键词匹配算法(例如倒排索引)。
计算机信息检索
限制符: In (模糊限制) Heart in ti (篇名) 山西 in 地址 (ad) = (精确限制) LA = Chinese(语种) PY = 2009-2010(年限)
常见的基本索引字段
基本索引字段:反映文献的内容特征,这 些字段用于主题检索。
• 篇名 Title TI • 文摘 Abstract AB • 规范词 Descriptor DE
二.布尔逻辑检索 1.逻辑与:“AND”或“*”
定义:逻辑与是一种用于交叉概念或限定关系的 组配,检索结果必须同时满足逻辑算符前后所列的 条件。 作用:可缩小检索范围,提高查准率。 要求:运用时,把出现频率低的检索词置于“与” 的左端,可使否定答案尽早出现,节省机时。
A and B;A*B
A
B
Construction
光盘信息检索系统:数据存储在光盘(一种用激光记录 和读取信息的盘片),通过检索软件,利用计算机和光 盘驱动器进行检索。可形成光盘检索网络。
网络化(internet)信息检索系统:同联机检索系统的主 机和用户终端的主从关系不同,客户机和服务器是对等 的关系
四、计算机检索的发展
1954年 ,美国海军武器实验站图书馆在一台电子管计算机 上建立了世界上第一个计算机检索系统。 1950年代 末, IBM 公司利用一台IBM650计算机成功地编制出关键词索 引,并建立了世界上第一个定题情报检索(SDI,Selective Dissemination of information)系统,为用户定期检索和提 供一定主题的新到文献,并很快得到了推广应用。
3、逻辑“非”:NOT;not; 定义:表示两个概念的排除,即被检索文献在含 有检索词A而不含有检索词B时才被命中。
作用:用于排斥关系的组配,即从原来的检索范 围排除不需要的概念或影响检索结果的概念,提高 查准率。 注意:往往会把切题的文献给丢掉,运用时要非 常慎重。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本内容将在第4 章详细介绍) *位置检索技术——(本内容将在第4-7章详细介绍) 位置检索技术
文献信息数据库的类型
按数据库文献记载的详细度可分为—— 按数据库文献记载的详细度可分为 书目型数据库:二次文献数据库, 书目型数据库:二次文献数据库,仅提供 文献检索,读者根据其提供的线索查找文 文献检索, 献原文。 可以分为: 献原文。 可以分为:题录型 文摘型
文献信息数据库的类型
按数据库文献记载的详细度可分为—— 按数据库文献记载的详细度可分为 全文数据库
文献信息数据库的结构
文献数据库中常见的字段 段码 文献数据库中常见 字段和段码 字段
基本字段 题目Title TI 文摘abstract AB 题目 文摘 叙词Descriptor DE 叙词 辅助字 段 Author AU 作者 作者单位 Corporation Source CS JN 期刊名称 Journal 出版年份Publishing year PY 出版年份
*位置检索技术——
COMMUNICATION AND SATELLITE 结果:communication satellite ,satellite communication ,communication devices for satellite ;communication links without satellite ② (n W)算符(n WORD) 表示两个检索词中间可插入n个词,但它 们之间的顺序不可颠倒。
文献信息数据库类型
2. 源数据库: 是能直接提供原始资料或具体数据的数据库,用户不必再查 阅其他信息源可分为: 数值数据库(numeric databases) 如统计数据库、财务数据库 、科学技术数据库等 文本-数值数据库(textual-numeric databases)产品市场报告 数据库、 全文数据库(full-ological bank) 图像数据库(graphics databases) 3混合型数据库:多媒体数据库 数据库(multimedia databases) 数据库
(《文献情报术语国际标准》(ISO/DIS5217)
数据库是结构化的数据集合,至少由一种 数据库 文档组成并能够满足某种特定目的或特定数 据处理系统需要的数据集合 。 当数据库记录的对象为文献信息时,就 称为文献信息数据库 。 文献信息数据库
文献信息数据库的结构
一个数据库通常由一个主文档(Master File)和若 一个数据库通常由一个主文档(Master File)和若 主文档 干个索引文档或称倒排文档 倒排文档(Inverted File)组成 组成。 干个索引文档或称倒排文档(Inverted File)组成。 文档——是具有某种特征的全部记录的集合。 是具有某种特征的全部记录的集合。 文档 是具有某种特征的全部记录的集合 记录——是构成文档的基本单元,由各种反映文献 是构成文档的基本单元, 记录 是构成文档的基本单元 特征的字段组成。如一篇论文、一件专利、一本图书、 特征的字段组成。如一篇论文、一件专利、一本图书、 一个标准的相关信息都能够成为文挡中的一条记录。 一个标准的相关信息都能够成为文挡中的一条记录。 字段——是记录的基本组成元素。一条记录的常见 是记录的基本组成元素。 字段 是记录的基本组成元素 字段通常包含题名字段、著者字段、主题词字段、 字段通常包含题名字段、著者字段、主题词字段、文献 出处字段(如刊名等)多种字段。 出处字段(如刊名等)多种字段。
计算机检索的一般程序
确定检索途径 制订检索式(确定检索词、 制订检索式(确定检索词、编制检索式 )
应首先从相应的主题词表中选择所需的检索词,以便获得最佳 应首先从相应的主题词表中选择所需的检索词, 检索效果 没有确切表达课题内容的主题词时,可采用自由词检索。 没有确切表达课题内容的主题词时,可采用自由词检索 以课题核心概念为主,排除无关概念,把重复概念进行归并, 以课题核心概念为主,排除无关概念,把重复概念进行归并, 简化检索式,提高检索效果。 简化检索式,提高检索效果。
逻辑运算符的应用
例: 为检索课题”固氮和固炭的生化机理或基因机 制”编制检索策略. 固氮* 固炭* ( 生化+ 生物化学 + 基因) 练习: “航空或航天发动机的设计和制造”
*截词检索技术—— 截词检索技术——
截词检索是为扩大检索范围与增加检 索结果而采用的一种检索技术。 常件的截词符号及含义:
“*”可代表多个字符 “#”代表单个的字符 一个“?”或者“n?”代表0个到 9个额外的字符 。
*位置检索技术—— 位置检索技术
位置检索可要求检索词以用户所规定的相对位置出现。比 如:以词组形式表达的概念;彼此相邻的两个或两个以上的词;被 被 禁用词或特殊符号分隔的词以及化学分子式等。 禁用词或特殊符号分隔的词以及化学分子式等。位置算符是调 整检索策略的一种重要手段。 整检索策略的一种重要手段。 位置算符与AND 常用的位置算符及含义: ① (W)算符(WITH) 表示两个检索词紧挨着,词序不能颠倒, 中间不得插入其 他词、字母或代码,但允许有空格或标点符号,也可用()表 示。 例:COMMUNICATION(W)SATELLITE
AND (*)——表示由该符号连接的检索式的运
算结果为逻辑”与”。 OR (+)——表示由该符号连接的检索式的运 算结果为逻辑”或”。 NOT (-)——表示由该符号连接的检索式的运 算结果为逻辑”非”。
计算机检索基本技术
AND (*)——
布尔逻辑检索技术
连接不相容的主题概念(或不同字段) 检索结果同时出现连接的词 限定 缩小范围 提高准确率 OR (+)—— 连接同义词 同族词 相关词 检索结果至少含有其中一词或同时有 扩大检索范围 提高查全
文献信息数据库类型
书目数据库(bibliographic databases) 指存储 某个领域的二次文献(如文摘、题录、目录等书目 数据)的数据库,有时又称为二次文献数据库,或 简称文献数据库。例如,美国化学文摘数据库CA Search,中国机械工程文摘数据库,各国生产发行 的机读目录(MARC)等,即属于此类型。 指南数据库(reference databases) 指存储关于 某些机构、人物、出版物、项目、程序、活动等对 象的简要描述,指引用户从其他有关信息源获取更 详细的信息的一类数据库。亦称指示性数据库。例 如,各种机构名录数据库、人物传记数据库、产品 数据库、软件数据库、研究开发项目数据库、基金 数据库等,均属此类。
文献信息数据库的类型
按数据库所含信息的特征可分为—— 按数据库所含信息的特征可分为
1.参考数据库(reference databases) 参考数据库( 参考数据库 ) 参考数据库是指引用户到另一信息源以获 得原文或其他细节的一类数据库。 得原文或其他细节的一类数据库。它包括 书目数据库和指南数据库两种。 书目数据库和指南数据库两种。
计算机检索的一般程序
(1)分析检索课题,明确检索要求 (2)选择适当检索系统(数据库) (3)确定检索途径及检索词 (4)构建检索提问式 (5)上机检索并调整检索策略 (6)输出检索结果 (具体)
计算机检索的一般程序
主题分析 明确检索需求及检索目标 (1)检索信息的学科范围 ) (2)检索信息的类型 ) (3)检索的目的 ) 选择检索系统(数据库等) 选择检索系统(数据库等) (1)根据检索目的确定所需数据库的类型 ) (2)根据信息需求的内容、专业范围选择数据库 )根据信息需求的内容、 (3)根据记录来源选择数据库 ) (4)根据熟悉程度选择数据库 )
不仅提供文献的基本信息及线索,同时还提 不仅提供文献的基本信息及线索, 供原始文献本身的数据库。主要包括全文数据 供原始文献本身的数据库。 术语数据库、图像数据库等等。 库、术语数据库、图像数据库等等。 如:
文献信息数据库的类型
按数据库文献记载的详细度可分为—— 按数据库文献记载的详细度可分为
混合型数据库 指数据中的数据, 指数据中的数据,一部分只是提供参考数据库 中的信息(文献的基本情况及线索); );另一部 中的信息(文献的基本情况及线索);另一部 分则可以提供全文数据库中的信息( 分则可以提供全文数据库中的信息(原始文献 本身)。 本身)。 如:
计算机检索的一般程序
构建检索提问式:用户将自己的检索需求组 织成计算机检索系统能够识别和处理的 检索提问式并输入计算机. 计算机信息检索过程是检索词与标引比较 的过程.对于多概念主题(不相容),为了 满足检索需要,检索词需进行组配.
计算机检索基本技术
布尔逻辑检索技术
布尔检索技术是指利用布尔运算符连接各 个检索词,然后由计算机进行相应逻辑运算, 以检索出所需信息的方法。常用算符及含义:
信息检索与利用
第三章 文献信息数据库及计算机检索
学习要点及要求
了解文献信息数据库的类型、 了解文献信息数据库的类型、评价标准及 计算机信息检索的基本知识, 计算机信息检索的基本知识,掌握布尔逻辑检 索技术及搜索引擎Google Google的基本使用方法及 索技术及搜索引擎Google的基本使用方法及 其主要特点。 其主要特点。
主要特点 特点; 了解国际联机检索系统的主要特点;了解 检索效果评价的意义及其优化手段。 检索效果评价的意义及其优化手段。
目
1. 2. 3. 4. 5.
录
文献信息数据库 计算机信息检索基础 网上的信息检索及搜索引擎 国际联机检索简介 检索效果评价及其优化
1.
文献信息数据库
文献是记录一切人类知识信息的载体。 文献
检索需求类型 主题概念分析(注:是课题检索的重点和难点) 主题概念分析 检索目的(申报课题、开题报告、学术论文、成果查新、课 程论文、商业需求以及其它需求类型等) 文献类型(期刊论文、会议论文、科技报告、图书、专利、 标准、网站等) 结果形式(全文、文摘、题录、数值、事实等) 检索年限(如2000年以来的文献) 语种(中文、外文;英文、日文) 检索结果数量(100?50?)