计算机基础信息检索

合集下载

计算机基础信息检索

计算机基础信息检索

多媒体信息检索技术应用
图像检索:通过图像内容进行 检索如图像识别、图像分类等
音频检索:通过音频内容进行 检索如语音识别、音乐识别等
视频检索:通过视频内容进行 检索如人脸识别、场景识别等
文本检索:通过文本内容进行 检索如关键词搜索、文本分类

多媒体融合检索:结合多种媒 体进行检索如跨媒体检索、多
媒体内容分析等
和准确性
移动化:适应 移动设备的发 展趋势提供更 便捷的检索服

社交化:结合 社交网络提高 信息传播和检
索的互动性
专业化:针对 特定领域提供 更专业的检索 服务满足不同
用户的需求
数据库信息检索 技术
数据库信息检索原理
检索方法:包括全文检索、 关键词检索、布尔检索等
数据库检索:通过数据库管理 系统(DBMS)进行数据查询 和检索
多媒体信息检索原理
多媒体信息检索技术分类
基于内容的检索:通过分析多媒体内容的特征进行检索 基于文本的检索:通过分析多媒体内容的文本信息进行检索 基于视觉的检索:通过分析多媒体内容的视觉特征进行检索 基于音频的检索:通过分析多媒体内容的音频特征进行检索 基于视频的检索:通过分析多媒体内容的视频特征进行检索 基于多模态的检索:综合利用多种特征进行检索
数据库信息检索技术发展趋势
智能化:利用人工智能技 术提高检索效率和准确性
集成化:将多种数据库技 术集成实现跨平台检索
安全性:加强数据加密和 访问控制保障数据安全
实时性:提高数据更新速 度实现实时检索
移动化:适应移动设备的 需求提供移动检索服务
云化:利用云计算技术实 现数据库资源的共享和优 化
多媒体信息检索 技术
信息检索技术:包 括文本检索、图像 检索、音频检索等

信息检索计算机检索基础

信息检索计算机检索基础
插入0-n个词 词序可以颠倒
〔2〕同字段检索
(F)算符:“ Field〞的缩写
A (F) B表示A和B两个检索词必须在文献 记录同一字段内,如篇名字段、文摘字段、 叙词字段、自由词字段等
词序及两词间插入的词数不限
例 digital (F) computer / AB,
要求digital 和 computer 这两个词必 须同时出现在文摘字段〔AB〕中
参考数据库主要是二次文献数据库,它包括各种机读版 的文摘、索引、目录等,它的价值在于向情报用户指引一 次文献。
②源数据库:是指能够为用户提供所需的原始资料 或数据的数据库。
a.数值数据库; b.文本-数值数据库; c.全文数据库; d.术语数据; e.图像数据库
源数据库是能直接提供原始资料或具体数据的自 足性数据库,用户不必再查阅其他信息源。它的特点 在于它本身含有一次情报,即用户作为检索目的而要 求获取的数值、事实或文本。
按数据库包括的信息内容可分为参考数据库、元数据 库和混合数据库。
①参考数据库:包括书目数据库和指南数据库两类。
书目数据库是指村粗二次文献信息的数据库,如题录 数据库、文摘数据库、目录数据库等属于参考数据库。
指南数据库为事实数据库,是指存储机构、人物、地 名、产品、物质和材料的特性、时间等信息的数据库。
1词间位置检索b表示a和b两个检索词顺序不许颠倒两词之间不许插词只许空格或连字符号b表示a和b检索词之间允许插入0n个词b表示a和b两个检索词必须在文献记录同一字段内如篇名字段文摘字段叙词字段自由词字段等b表示a和b两个检索词必须在同一自然句中词序及两词间插入的词数不限表示和只要同时出现在文摘中的某一个句子中就算命中截词检索是计算机检索系统中应用非常普遍的一种技术

第六章 计算机信息检索基础知识

第六章 计算机信息检索基础知识

25

2
二,计算机信息检索的基本概念
利用计算机,根据用户的提问, 利用计算机,根据用户的提问,在一 定时间内, 定时间内,从经过加工处理并已存储在计 算机存储介质内的信息集合中查出所需信 息的一种方式. 息的一种方式.
3
三,计算机信息检索系统构成
1,硬件 , 2,软件 , 系统软件和应用软件. 系统软件和应用软件. 3,数据库 , 数据库是至少由一种文档组成, 数据库是至少由一种文档组成, 能满足特定目的或特定数据处理系统 需要的数据集合. 需要的数据集合.
19
第二节 DIALOG联机检索命令 联机检索命令
一,BEGIN(或B)选库命令 ( )
?BEGIN 文挡名 ?B 文挡名 ?BEGIN 文挡号 ?B 文挡号
20
二,sf调文档命令 sf调文档命令
只在打开411 库时有效 只在打开 ? 8,12,63,72…… , , ,
21
三,SELECT(或S)选词命令 ( )
23
六,DISPLAY SETS (或DS)联 或 联 机显示命令
用于显示相应的检索结果, 用于显示相应的检索结果,具体指令格 式与TYPE相同 式与 相同
七,LOGOFF结束检索过程命令 结束检索过程命令
24
第三节 联机检索的一般步骤
1,分析信息需求; 2,选择系统及数据库; 3,确定检索途径; 4,选择检索项; 5,编制检索式; 6,上机检索; 7,输出检索结果; 8,退出联机检索系统
22
STEPS( SS) 四, SELECT STEPS(或SS)命令
SS computer? and image? S1 597 computer? S2 176 image? S3 105 computer? and image?

《计算机基础》信息检索资料

《计算机基础》信息检索资料


纸质书刊、资料 件、信息存储数据库、 检索软件、联机数据库、 端、通讯网络、网络数

通讯网络
通讯网络
据库
检索方法较简单,检索
设备简单,检索费用 检索范围广泛,检索速度
优 直观,信息存储
较灵活、方便,及时性
低,检索技术容 易掌 快,检索功能强,及时性
点 与检索费用低
好,检索费用和速度均



缺 检索入口少、速 点 度慢、效率较低
天网除提供WWW主页检索外,还提供FTP站点搜索(“天网文件”),为 高级用户查找特定文件提供方便。同时,天网将FTP文件分为电影和动画片、 MP3音乐、程序下载及文档资源共4大类,用户可以像目录导航式搜索引擎那样 层层深入、查找自己需要的FTP文件。
8.5 常用搜索引擎使用介绍
2.使用方法
(1) 启动方法
更新不够及时
检索技术复杂,设备要求 高、检索费用昂贵。
8.3 网络检索系统
1. 用户如何在网络上找到信息?
解决之道:搜索引擎
2. 搜索引擎的分类:
目录(Directory,或 Catalog); 基于Robot的搜索引擎; 元搜索引擎 (用得较少)。
8.3.1 目录
目录:目录方式所使用的数据库是依靠专职编辑或志愿人员建立起来的。 目录的用户界面基本上都是分级结构。有两种使用方式:
当用户只知道需要检索的大致内容,而没有明确的关键词时,可以使用分类检 索。
【例8.1】:查找西 安交通大学的网页。
方法: • 从“网站分类”逐步查找
8.5 常用搜索引擎使用介绍
• 找到目的网页, 双击打开。其中 名称后面的@号 表示还有下一级 目录。
启动IE浏览器,在地址栏输入:

第二讲计算机信息检索基础知识

第二讲计算机信息检索基础知识

举例:
【题 名】信息检索技术在网络数据库中的应用研究 【作 者】邹小筑[1] 缪红梅[2] 【机 构】[1]南京大学信息管理系,南京210093 [2]南京航空航天
大学,南京210016 【刊 名】图书情报工作.2007,51(2).-104-106,131 【ISSN号】0252-3116 【关键词】信息检索技术 网络数据库 检索平台 【文 摘】以信息检索技术为脉络,结合Ei Village2、ISI Web of
Knowledge、CSAIDS、EBSCOHost、ProQuestordjne等多个著名 检索平台综合分析布尔逻辑、位置逻辑、模糊检索技术、网络叙 词表构建技术在网络数据库的应用,研究表明信息检索技术已深 深植入网络信息资源管理之中,深入剖析信息检索技术,可以清 晰揭示提问表达式的构建机理,掌握网络数据库的原理及使用方 法,为网络信息资源评价和建设提供依据。
2.选择信息资源
是否与检索课题相关的资源都要检索 选择哪些学科的信息资源 选择哪些语种的信息资源 信息资源覆盖的年限是否符合需求 信息资源的特点及其针对性如何
3、构造检索式 选择检索点
检索式 是表达用户检索提问的逻辑 表达式,由基于检索概念产生的检 索词和各种组配算符构成。
检索点 即检索途径或检索入口、检 索字段。检索点正确与否,决定着 检索结果的数量与质量。
3、字段限制
▪ 指将检索词限定在特定的字段中进行。
• 同样的检索词,选择在不同字段中进行检索, 得到的结果是不同的。
• 检索系统通常都会设置默认的检索字段,如 “所有字段”。如果想指定在特定的字段中 查找检索词,就需要调整检索字段,进行字 段限制。
缺省字段 为“篇名”
缺省字段为 “关键词”
缺省字段为 “All fields”

计算机信息检索基础知识

计算机信息检索基础知识
例如:利用DIALOG联机系统检索美国“化学文摘 (CA)”从1967至今的数据库,一般一个课题 只用3-4min左右,用光盘数据库检索也不超过 10-15min,但用手工检索《CA》的累积索引和 卷期索引,一个至少要花上几天的时间。
计算机检索特点
(2)检索途径多: 因为计算机检索系统 对数据库记录的许多字段都做了索引,有 的系统甚至对每个字段都做了索引,所以 这些字段均可作为检索入口。
c:未检出的相关文献量
提高查全率的方法
提高检索词的泛指度(热水器-燃气热 水器)
选全同义词、近义词(土豆-马铃薯) 多用截词符 减少使用逻辑“与”、逻辑“非”运算
符 增加使用逻辑“或”运算符 取消某些限制符 在多字段或全文中检索 采用分类号检索等
• 明确自己的情报需求和检索目的 即明确自己研 究的课题是攻关型的还是探索型的,对信息查找 的指标要求是查准、查全还是查新。同时还要弄 清所需文献信息的类型、文种、时间范围等。
(5)执行检索指令: 对数据库进行查找, 并输出检索结果。
(6)分析检索结果,完善检索表达式: • 重新确定检索词; • 选用“上位词”或 “下位词”: • 选用其他相关检索词; • 更换检索途径等,
如何计算?
查全率:
检出的相关文献量
R=---------------------×100%=
检索系统中相关文献总量
a ——×100% a+c
查准率:
检出的相关文献量
P=---------------------×100%=
检出的文献总量
a ———×100%
a+b
a:检出的相关文献量 b:检出的非相关文献
差集 A-B
A
非 NOT -

大学计算机基础10-信息检索基础

大学计算机基础10-信息检索基础

多学博见 和而不同
信息检索语言:信息存储与检索共同遵循 的规则 信息检索正是以信息的存储与检索之间的 相符性为基础的
无序信息 著录 信息特征 分析 检 索 语 言 信息特征 标识 检索提问 标识 排序 检 索 工 匹配 具 检 索 结 果
检索需求
检索提问
信息检索原理图
面向应用 服务专业 项目导向 关注过程
面向应用 服务专业 项目导向 关注过程
多学博见 和而不同
10.1.3 信息检索方法
信息检索方法:为实现检索计划或方案达到检索目 信息检索方法: 标而采取的具体操作方法或手段。 检索获取知识信息的方法:直接检索和间接检索。 检索获取知识信息的方法:直接检索和间接检索。 直接检索是通过浏览、阅读各种出版物上发表的文 直接检索是通过浏览、阅读各种出版物上发表的文 章、专利等获取所需要解有关学科或专题发展动态 的一种最简单的检索方法,研究者使用. 的一种最简单的检索方法,研究者使用.优点是能立 即明确判断所包含的知识信息是否具有针对性和实 用价值,不足较大的盲目性和偶然性,查全率较低。 间接检索是借助于各类检索工具或检索系统,从数 间接检索是借助于各类检索工具或检索系统,从数 量庞大的信息集合中,迅速、准确地查找特定课题 有关知识信息的常用检索方法,其优点是所获得知 识信息的全面性和准确性都较高。
面向应用 服务专业 项目导向 关注过程
多学博见 和而不同
10.2.1 印刷型信息检索工具
印刷型检索工具主要针对书籍、报纸、期 刊进行检索,不需要借助其它设备,具有 查阅方便、可靠性强的优点,但受出版时 间的限制,存在更新较慢。 常用的印刷型检索工具有: 1.书目、索引和文摘 1.书目、索引和文摘 2.百科全书 2.百科全书 3.年鉴、手册 3.年鉴、手册

计算机信息检索基础知识

计算机信息检索基础知识

信息检索的步骤
研究课题 用户
主题分析
选择检索系统或 数据库
选择检索途径:主题 词、作者、机构等
检索操作
制定检索策略和 检索方式
初始检索 结果输出 不满意
用户结果评价
满意
检索结果
索取原文
三、网络信息资源及其特点
网络信息资源又称为虚拟资源、数字资源、 电子信息资源、联机信息资源、万维网资源 等,是互联网上电子信息资源的统称,是以 数字化形式记录的,利用计算机技术、通信 技术及多媒体技术在网络上发布、查询与存 取利用的信息资源的总和。
追溯法:这是利用已有的文献后面的参考文 献进行追溯查找的方法,是在没有检索工具 或检索工具不全的情况下使用的一种方法。 但用这种方法查找的文献不全,有片面性, 文章漏检率高,知识陈旧的占多数,目前已 很少有人使用。
分段法(循环法):这是将常用法与追溯法 交替使用的一种方法,即利用工具书检索文 献,又利用文献后面的参考文献进行追溯, 两种方法交替使用,直到满足读者需要为止。 这种方法可根据文献和本单位工具书收藏的 情况分期分段交叉运用不同的查找方法,既 能获得一定时期内的文献,还可节约查找时 间。
(3)专门从事数据库制作和销售的数据库商 如EBSCO公司、ProQuest公司等;自己没有出 版物,但他们买出版公司的产品,然后建立检索 平台供读者检索,例如iGroup公司建立了 Scitation平台,在上面可以看到AIP(美国物理 学会)、ASME(美国机械工程师协会)等几十 个专业学协会的电子期刊。
2信息检索技术
布尔逻辑检索 截词检索 位置检索 字段限定检索
布尔逻辑检索
逻辑与AND(*)。 逻辑或OR(+)。 逻辑非NOT(-)。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
青岛大学公共计算. 机基础教学中心
第7章 信息检索
7.1 信息检索概述 7.1.2 信息检索的类型 1. 根据检索对象划分 根据检索对象的不同,信息检索分为文献检索、事实检索和数 据检索三种。 (1)文献检索。文献检索以文献为检索对象,查找含有用户 所需信息的文献。文献检索是一种相关性检索而非确定性检索 ,系统不直接回答用户所提出的问题本身,它提供的是与用户 信息需求相关文献的线索或原文。 (2)事实检索。事实检索以特定的事实为检索对象,是存储 有关课题(如机构、人物等)的指示性描述,或关于某一事件 发生的时间、地点、经过等信息,并将其查找出来的检索,属 于确定性检索。 (3)数据检索。数据检索以数据为检索对象,属于确定性检 索,它是将经过选择、整理、鉴定的数据存入数据库中,根据 需要查出可回答某一问题的数据的检索。例如,查找公式、数 据、图表、成分、性能等都属于数据检索的范畴。
第7章 信息检索
7.1 信息检索概述
7.1.1 信息检索的概念 信息检索(Information Retrieval)是指信息按一定的方
式组织和存储起来,并根据信息用户的需要找出有关 信息的过程和技术。信息检索的全称是信息存储与检 索(Information Storage Retrieval),其过程如图7.1所 示。20世纪50年代以前,信息的存储和传播主要是以 纸介质为载体,信息检索活动主要围绕着相关文献的 获取和利用展开,因此“文献检索”成为信息检索的 同义词而被广泛地使用。20世纪50年代以后,信息传 播与存储呈多元化发展,人们不再拘泥于载体研究信 息检索,开始更多地使用“情报检索”这一术语。近 年来,由于英文词汇“Information”既可以翻译为信 息,又可以翻译为情报,而汉语中信息一词要比情报 的含义更为丰富,因此人们更倾向于使用信息检索这 一术语。
青岛大学公共计算. 机基础教学中心
第7章 信息检索
7.1 信息检索概述
7.1.3 信息检索模型 2. 向量空间模型 向量空间模型是一种基于代数理论的检索模型。在向量空间模型中,一个
文档被描述成由一系列关键词组成的向量,每一个关键词都是这个向量空 间中的一维。同样道理,来自用户的查询也可以用向量来表示。当进行一 个查询时,向量空间模型将计算查询和文档表示之间的相似度,例如可以 用两个向量之间的欧氏距离或两个向量之间的余弦夹角表示二者之间的相 似度,然后对检出的文档按照相似度进行降序排列,以实现文档与查询项 的部分匹配,于是查询结果集中文档的排列顺序要合理的多。 与布尔检索模型相比,向量空间模型改善了检索性能,其部分匹配的策略 允许所检索的文档与查询条件相近似,同时还能够按照文档与查询的相似 度对文档进行排序。但在向量空间模型中,各索引项之间是互相独立的, 无法对文档中的索引项提供相关性信息,而在实际中,需要考虑各索引项 之间的相关性才能得到满意的查询结果。 向量空间模型适合一般的文档集的相似性排序,通过查询扩展或相关反馈 ,可以改善模型产生的结果集。向量空间模型与其他检索模型相比较,即 使不是最优的,其性能也相当好的,因此该模型是目前普遍采用的信息检 索模型。
青岛大学公共计算. 机基础教学中心
第7章 信息检索
7.1 信息检索概述
7.1.2 信息检索的类型 2. 按检索方式划分 按检索方式的不同,信息检索可以分为手工检索、机械检索和计算机检索
三种方式。 (1)手工检索。手工检索就是以人工的方式直接查找所需的信息,多利用
各种检索工具的印刷版来实现,例如印刷的目录、题录、文摘、索引等。 手工检索直观,不需要辅助设备,但速度慢、漏检严重。 (2)机械检索。机械检索也称机电式检索,是指运用打孔机、分类机及光 电感应设备等进行的检索。机械检索过分依赖设备,成本较高,检索效果 和质量都不太理想。 (3)计算机检索。计算机信息检索是将大量的文献资料或数据进行加工整 理,按一定格式存储在数据库中,利用计算机对数据库进行检索的信息检 索方式。与手工检索相比,计算机检索速度快、效率高、查全率高、不受 时空限制、检索结果输出方式多样。 除上述两种主要的分类方式外,信息检索还有另外多种分类方式。例如按 照检索对象的信息组织方式可以分为全文检索、超文本检索和超媒体检索 ;按照检索对象的形式可分为文本检索和多媒体检索;按照检索要求可分 为强相关检索和弱相关检索;按检索的时间跨度可分为定题检索和回溯检 索。
.
7.1 信息检索概述
第7章 信息检索
7.1.1 信息检索的概念
青岛大学公共计算. 机基础教学中心
第7章 信息检索
7.1 信息检索概述
7.1.1 信息检索的概念 信息检索包括两个层次的含义:广义的信息检索和狭义
的信息检索。广义的信息检索包括信息的存储和查找 两个过程,如图7.1所示的全部过程就是广义的信息检 索。信息的存储就是将大量无序的文献信息进行搜集 、整理、归类,采用规范的方法进行编排,编制出各 种检索系统。信息查找必须先有信息存储,而信息存 储就是为了更快捷地查找信息。信息查找则是信息存 储的逆向过程,是人们根据特定需要,运用已有的检 索系统,有序查询并找出符合要求的信息。狭义的信 息检索是指信息的查找过程,只包括图7.1中的后半部 分,本书中讨论 机基础教学中心
第7章 信息检索
7.1 信息检索概述 7.1.3 信息检索模型 1. 布尔检索模型 布尔检索模型是基于集合论和布尔代数的一种简单检索模型。 由于集合是一个相当直观的概念,所以布尔检索模型为信息检 索系统的普通用户提供了一种易于掌握的框架。在布尔检索模 型中,查询被描述为具有精确语义的布尔表达式。因为该模型 的简单性和易于表示的形式方法,在很长一段时间内都受到重 视。 然而,布尔检索模型的缺点也是相当明显的。首先,该模型的 检索策略是基于二值决策准则,即一个文档只被判别为相关的 或无关的,而没有任何等级变化,难以提高检索性能,因此布 尔检索模型主要用于实现数据检索模型,而不是信息检索模型 ;其次,这种方法将构造一个合适的查询的责任推到用户身上 ,用户必须详细规划自己的查询,其复杂程度不亚于编写程序 ,普通用户无法用布尔表达式描述他们的查询请求。于是一些 研究人员改进了布尔模型,提出了向量空间模型。
相关文档
最新文档