信息检索教程 教学课件 冯惠玲 王立清 著 第二章 检索语言

合集下载

信息检索通用教程教学课件ppt

信息检索通用教程教学课件ppt

1-3 基本方法
信息检索原理图
1-3 基本方法
2. 常用技术 布尔逻辑检索(Boolean Search) 截词检索(Truncation Search) 限制检索(Limitation Search) 位置检索(Position Search) 加权检索(Weight Search)
1-3 基本方法
原理原理信息存储与检索信息存储与检索信息检索信息检索信息的存储与检索之间的相符性信息的存储与检索之间的相符性113基本方法基本方法信息检索原理图信息检索原理图113基本方法基本方法常用技术常用技术布尔逻辑检索布尔逻辑检索booleansearchbooleansearch截词检索截词检索truncationsearchtruncationsearch限制检索限制检索limitationsearchlimitationsearch位置检索位置检索positionsearchpositionsearch加权检索加权检索weightsearchweightsearch基本方法基本方法常用技术常用技术布尔逻辑检索布尔逻辑检索booleansearchbooleansearch布尔逻辑算符图示布尔逻辑算符图示逻辑与逻辑非逻辑或逻辑异检索工具方法与步骤检索工具方法与步骤选择检索工具方法与途径实施检索过程评价检索结果修正调整检索策略分析检索问题13基本方法113基本方法基本方法检索工具方法与步骤检索工具方法与步骤11分析检索课题分析检索课题22选择检索工具方法与途径选择检索工具方法与途径33实施检索过程实施检索过程44修正或调整检索策略修正或调整检索策略bb11分析检索课题分析检索课题要查找的是什么类型的问题
书目、索引、 文摘等
各类字典、词 典、百科全书 等 类书、政书、 年鉴、手册、 名录、表谱、 图录等 丛书、总集、 资料汇编、综 述、方志等

《信息检索第二章》PPT课件

《信息检索第二章》PPT课件
– TCP是传输控制协议,处理由于路径不同及 其它可能原因造成的数据包颠倒、数据丢失、 数据失真等问题。
– IP是网际协议,利用路由算法解决路由选择 的问题。
精选ppt
17
Internet 的管理
• 2.IP地址: 是Internet上每台主机和用户终端的识别标 识。 IP地址在全球范围内都是唯一的。 IP 地址的表示:211.83.48.13
精选ppt
5
第二部分 考试说明与实施要求
• 考核的能力层次表述:
• 大纲在考核目标中,按照“识记”、“理解”、“应用” 三个能力层次规定其应达到能力层次要求。各能力层次为 递进等级关系,后者必须建立在前者的基础上,其含义是:
• 识记:能知道有关的名词、概念、知识的含义,并能正确 认识和表述,是低层次的要求。
• 3、阅读完每章教材后,认真完成老师布置的作业, 要求熟练掌握!并独立完成老师安排的4套复习模 拟题,注意答题技巧和答题方法。
精选ppt
9
考试大纲要求掌握的章节
• 第一章 因特网信息资源(8分) • 第二章 因特网信息检索概论(17分) • 第三章 搜索引擎(17分) • 第四章 目录型网络检索工具(14分) • 第五章 元搜索引擎(14分) • 第六章 多媒体信息检索(11分) • 第七、八章 学术信息的网上检索与获取(11分) • 第九章 参考信息的网上检索(8分)
• (二)、多项选择题
• 1、下列属于因特网信息资源的是( )。
• A.WWW信息资源
B.RSS信息资源
C. FTP信息资源
• D. 用户服务组信息资源 E.Telnet信息资源
• (三)、名词解释题
• 1、布尔逻辑检索
• (四)、简答题

检索语言课件

检索语言课件

3、标引工作程序 ⑴查重 ⑵主题分析 ⑶主题概念转换 ①主题概念直接转换 《中国文学史》主题概念:中国文学史 分类号 I209 主题词不能直接转换 《我国当代经济发展的宏观调整问题》 主题概念:中国经济宏观管理 分类号 F123.16主题词不干涉仪 分类号:TH744.13 主题词:射电干涉 《共产主义思想教育》 主题概念:共产主义思想教育 分类号:D648 主题词:共产主义思想教育
• 国家图书馆的做法 和轮排的效果一样 • 6060 @a农业建筑@x居住建筑@x建筑结 构@x结构设计 • 6060 @a居住建筑 • 6060 @a建筑结构 • 6060 @a结构设计
• 散组式语言的性能和它的检索标识是否分段轮 排有很大关系。如果能分段轮排,就会兼有先 组式语言和后组式语言的主要优点,如果检索 标识不轮排,它的优点和缺点就和先组式差不 多,只是概念表达能力有所提高。轮排就是把 每个标识轮流放在检索位置。 • ABCD ;BACD;CABD;DABC • 表达概念能力强,可多途径多角度检索 • 轮排不轮排也和检索系统有关系 • 6000 @a冶金工业废物@x废渣@x硫化物@x 废物综合利用
• • • • • •
以前老系统的做法 农业建筑-居住建筑-建筑结构-结构设计 居住建筑-农业建筑-建筑结构-结构设计 建筑结构-农业建筑-居住建筑-结构设计 农业建筑-居住建筑-建筑结构-结构设计 做轮排 提供多个检索途径
• 现在系统的做法 不用轮排 • 6060 @a农业建筑@x居住建筑@x建筑结构@x 结构设计
科学—自然科学—化学—有机化学
• • • • • • • • •
①同一关系 ②属性关系 ③整体与部分关系 ④全面与某一方面关系 ⑤交叉关系 ⑥并列关系 ⑦矛盾关系 ⑧对立关系 2、情报检索语言的知识分类

信息检索教程(第三版)PPT7

信息检索教程(第三版)PPT7
标引过程一旦完成,信息就进入某种形式的信息库,而标引 记录则进入二次信息数 据库,在二次信息数据库中,按便于检索的方式,对标引记录加 以组织。
信息检索系统的输入端是针对信息,而信息检索系统的输出端则是针对用户的提问。 实际上,系统输出端的操作步骤和输入端非常相似。
2-1
图 信 息 检 索 系 统
第六,多媒体数据库 :能把文字、数值、声音、图像等不同 信息存储在不同媒体上, 进行统一处理和管理的数据库。
目前,计算机检索系统是检索系统的主流。由于计算机检索系统具有速度快、效率 高,数据内容新、范围广、数量大,操作简便,在网络环境中检索不受时空限制等特 点, 已成为人们获取信息的主要手段之一。
2-1
图 信 息 检 索 原 理
2.1.2 信息检索的原理
1.文献检索 这是信息检索的主体部分,以特定的文献为检索对象,包括全文、文摘、题录等。文 献检索
是一种相关性检索,它不直接回答用户所提技术问题的本身,只提供有关的文献供 参考。 2.数据检索 以特定的数据为检索对象,包括统计数字、工程数据、图表、计算公式、化学结构式 等。数
实质上,信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异 同的比较与匹配,选取两者相符或部分相符的信息予以输出。无论手工检索还是计算 机检 索,其基本原理都是一样的。
也就是说,检索系统对所要存储的信息,按照其外部特征和 内容特征进行描述并赋 予特征标识,然后存入系统。
检索时,将所需信息的特征标识与所 存信息的特征标识进行比较。凡是两边标识一 致的,就将具有这些标识的信息从检索系统 中输出。
和信息管理领域的应用。1954年,美国海军兵器中心首先在IBM701型电子计 算机上成 功地建立了世界上第一个计算机文献检索系统,标志着人类开始步入利用计 算机进行信 息检索的新的历史时期。随着计算机技术和网络 技术的发展,计算机检索 经历了脱机检索、联机检索、光盘检索和网络检索四个阶段。

最新信息检索课件教学讲义ppt课件

最新信息检索课件教学讲义ppt课件
• 第一章 绪论 • 第二章 信息的相关知识 • 第三章 信息检索的基本知识 • 第四章 计算机信息资源检索 • 第五章 特种文献检索 • 实习
信息素养 • 信息素养:利用大量的信息工具及主要信息
源使问题得到解答的技术和技能。
本课程 的教学 目标
了解自己的信息需求 承认准确和完整的信息是制定明智决策的基础 能在信息需求的基础上系统阐述问题 能识别潜在的信息源、检索信息源,制定成功的检索策略 能利用以计算机为基础的信息技术和其它技术 具有评价信息的能力 能为实际应用而对信息进行组织 具有将新信息结合到现存的知识体现中的能力 能采用批判性思关的其它概念
§ 1.知识:人类对于客观世界的认识。 § 2.情报:人们搜集到的能为我们所用的新知
识或新信息。 § 3.文献:记录有知识的一切载体。
(人们在认识世界和改造世界的过程中,获得大量客观事物传递的信息,即感性 认识或经验,然后对这些感性认识通过大脑进行加工处理,形成理性认识。)
现实信息源
口头信息源 体语信息源 实物信息源 文献信息源等
非文献信息源
第二节 文献的基本知识
一、文献(信息源)类型
§ 文献(信息源)类型: 1.按文献载体形式分:印刷型
微缩型:存储量高达22.5万页/平片 声像型 电子型 2.按文献加工深度分: 零次, 一次, 二次, 三次文献。
§ 一次文献:
§ 二次文献: 20061128:太湖西区公路两侧植物物种多样 性的研究/[刊]/朱晓勇,胡海波,鲁小珍/南 京林业大学学报.2006.30(3):-85~88
u 一、概念 信息检索:信息存储&信息查找
信息标引和存储过程:对大量无
信息的需求分析和检索过程。分
序的信息资源进行标引处理,使

信息检索教程 第二章 检索语言

信息检索教程 第二章 检索语言
18
检索练习
• 利用网络资源,检索“格律诗”在中图法 中的分类号
19
检索练习
• 利用网络资源,检索“格律诗”在中图法 中的分类号
中国分类号查询
文学I——中国文学I2——诗歌I22——古代作品I222 ——格律诗(近体诗)I226.7
20
第2章 检索语言
2.3.3 组配分类法
2.3.3.1 组配分类表 组配分类表是由编制说明、基本类表、分面类表和分 面公式以及通用辅表组成。其建立主要采用了分面分析法。 分面分析法是将整个知识领域或某一知识领域按其不 同属性分解为若干个不同的分面,每个分面再分解为若干 个亚面,每个亚面还可分解为若干个更小的子面,面内列 出所属各子目的一种编制分类表的方法。 在组配分类表的编制过程中,需要考虑到分面的引用 次序与排列次序、标记符号与标记制度等方面的问题。
22
第2章 检索语言
2.4.1.1 主题检索语言的类型
1
标题词语言
2
3 4
单元词语言
叙词语言 关键词语言
23
第2章 检索语言
2.4.1.2 主题检索语言的特点
主题检索语言与分类检索语言相比,具有明显的优点: 1. 专指性高 2. 直观性好 3. 灵活性强
24
第2章 检索语言
2.4.2 标题词语言和单元词语言
28
主题检索注意事项
1.主题词的规范 2.如何提取主题词
29
1.主题词的规范
1)同义词的规范
(1) 对完全等同的同义词的规范 (2) 对近义词的规范 (3) 对学名和俗名的规范 (4) 对不同译名、简称与全称的规范
对不同译名、简称与全称只选择正式的一个词。
30
同义词的规范实例 【实例】“煤炭”与“煤”是同义词,都可以使用,但是只 能用“煤”作为主题词。术语“商品煤”,英文是 Commercial coal/salable coal,含义是作为商品出售 的煤,其同义词“销煤”,现在已经停止使用。术语“精 煤”,英文是cleaned coal,含义是煤经精选(干选或湿 选)后生产出来的、符合质量要求的产品,其同义词“洗 精煤”现在已经停止使用。 【实例】“如“实验”与“试验”、“天然资源”与“自然 资源” 这两组词汇,应该选择“实验”和“自然资源”作为主题词。

第2章计算机信息检索技术

第2章计算机信息检索技术

2 检索系统
system )是 指根据特定的信息需求而建立起来的一 种有关信息搜集、加工、存储和检索的 程序化系统,其主要目的是为人们提供 信息服务。
检索系统 ( retrieval
2.1 检索系统的功能模块
信息源选择与采集子系统——对通常的计算机 检索系统来说,信息选择与采集主要由人工完 成,但对于网络信息检索系统来说,则主要通 过网络搜索机器人Robot自动进行,并且可以定 期更新。 标引子系统——标引处理的类型:人工赋词标 引、机器标引、无标引(或全标引);标引要 求:不漏标(全面)、不错标(准确)、不滥 标(简练)。 建库子系统——工作流程主要包括数据录入、 错误检查与处理、数据格式转换、生成并定期 更新各种文档。
1.2
计算机信息检索
计算机信息检索是对信息进行收集、分类、 标引、著录,并加以有序化组织,将信息 储存到计算机存储信息系统中,编制出一 个信息检索系统或信息检索工具的过程。
计算机信息检索的基本原理
用户
输入 检索 需求 分析转换 处理需求 筛选
信息源 概念词典
录入
分类、词索引 文档预处理
控制词表
(1)文献检索Document Retrieval
根据检索(查找)对象的划分为 文献(信息)检索、事实检索和数据检索。 文献检索主要是利用二次文献进行 ,是信息检索中最基本、 最重要的类型。 例:系统收集有关“高强度预应力混凝土管桩承载性能”这就需 要我们根据课题要求,按照一定的检索标识(如主题词、分 类号等),从所收藏的文献中查出所需要的文献。
从狭义上讲,信息检索仅指后一部分。来自信息检索的本质是一个匹配的过程
即用户的信息需求和信息存储的信息集合进行比 较和选择的过程
信息存储和检索过程的基本原理

信息检索2章 PPT课件.ppt

信息检索2章 PPT课件.ppt
检索工具是人们用来存储和查找各类信息的工具。 1.按所收信息的学科内容划分: 综合性、专科和专题 2.按著录信息的特征划分 1)目录型检索工具 2)题录型检索工具 3)文摘型检索工具 4)索引型检索工具
• 目录型检索工具 • 一般以整本的图书、期刊等作为报道单元,仅著
录出版物的外表特征,不著录具体篇章。仅提供检 索线索,主要用于了解出版物的出版或收藏单位。
2.2.3.2检索工具的选择
4.考虑检索工具的检索功能 5.检索工具的检索费用 返回目次
2.3 检索方法及检索途径
2.3.1 检索方法 2.3.2 检索途径
2.3.1检索方法
1.常规法 利用常规检索工具查找有关文献。 分为顺查法、倒查法、时间抽样法
• 顺查法
• 以所检索课题研究的发生时间为检索起点,按 事件发生、发展的时序,由远及近,由旧到新的 顺序查找。
• 特点:所查得的文献较为系统全面,基本上可反 映某学科专业或某课题发展的全貌;缺点是费时 费力,工作量较大。一般在申请专利的查新调查 和新开课题时采用这种方法。
• 逆查法
• 与顺查法相反,由近及远,由新到旧的查找。
• 多用于查找新课题,在基本上获得所需信息时 即可终止检索。可保证文献信息的新颖性,也可 提高查准率。但由于这种方法不太关注历史渊源 和全面系统性,影响检索的全面性。
• 报道内容:文献篇名.著者.刊名.出版年,月 (卷,期),页码
• 实例:下
【实例】 在《中文科技期刊数据库》的期刊论文著录格式如下: 【题 名】 辽宁老工业基地振兴与发展中的生态产业研究 【作 者】 张军涛 【机 构】 东北财经大学公共管理学院,辽宁大连116025 【刊 名】 社会科学辑刊.2004(1).-74-78 【ISSN号】 1001-6198 【C N 号】 21-1012 【馆藏号】 80414X 【关键词】 生态产业 循环经济 环境—经济协调发展
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
检索需要而创制的人工语言,又称情报语 言、情报存储与检索语言、文献语言、文 献工作语言、索引语言、标引语言、标引 符号、标识系统等。
二、检索语言的基础
(一)概念逻辑 概念逻辑,是一种科学思维方法,通
过明确各种概念及其相互关系而揭示事物 的本质属性及各种事物之间的联系与区别。
(二)知识分类
知识分类包括事物分类和学科分类。 它是对千差万别的事物作系统研究的重要 方法,是对各种事物之间的区别和联系从 本质上、原理上进行揭示的重要手段,对 信息的系统化具有重要的价值。
(一)《汉语主题词表》 《汉语主题词表》是我国第一部大型的
综合性的叙词表,由中国科技信息研究所 和北京图书馆负责主持,1975年开始编制, 1980年正式出版。
(二)《中国分类主题词表》
《中国分类主题词表》是在《中图法》 编委会主持下,经全国40个单位160位专家 学者的共同努力,历时8年编制而成的,于 1994年6月正式出版。
教材其余课件及动画素材请查阅在线教务辅导网 在线教务辅导网: QQ:349134187 或者直接输入下面地址:
第二章 检索语言
第一节 检索语言的概念和基础
一、检索语言的概念 传统意义上的检索语言仅指根据信息
第四节 主题检索语言
一、主题检索语言概述
主题检索语言又称主题法。它采用语 词直接作为文献主题标识,按字顺排列主 题标识,提供各种检索词语的途径。
(一)主题检索语言的类型
1.标题词语言 2.单元词语言 3.叙词语言 4.关键词语.直观性好 3.灵活性强
二、标题词法和单元词法
(一)关键词法的原理和特点
关键词法是适应目录索引编制过程自 动化的需要而产生的,出现比较早,广泛 使用却是近二三十年的事。
(二)关键词法的类型
1.题内关键词索引题内关键词索引 2.题外关键词索引题外关键词索引 3.词对式关键词索引
四、叙词法
(一)叙词法一般原理 叙词法是以表示单元概念的规范化语
类是指具有共同属性的事物的集合, “物以类聚”是人们长期以来认识事物的 一种方法。文献分类是依据文献所载知识 信息的学科属性,对文献进行类别的划分, 并进一步根据文献信息内容之间的内在联 系,组织成科学的分类体系。
(一)分类检索语言的类型
1.体系分类法 2.组配分类法
(二)分类检索语言的特点
分类检索语言是信息管理领域经典的 检索语言之一,以1876年《杜威十进分类法》 的问世为标志,已走过了一个多世纪的历 程,形成了自成体系的一套信息组织和检 索方法。
词为基础,以概念组配为基本原理,对文 献主题进行描述的后组式检索语言。
(二)叙词表的编制
叙词表是叙词法的核心体现。目前, 国内的叙词表已有七八十种之多。常用的 有《汉语主题词表》、《化工汉语主题词 表》、《机械工程主题词表》、《电子技 术汉语主题词表》、《国防科学技术叙词 表》等。
五、主要主题词表介绍
三、自然语言的应用
随着计算机技术的发展、计算机信息 检索系统的广泛使用,自然语言在信息检 索领域的应用开始流行起来。
(一)概述
自然语言指不经加工和规范的语言, 自然语言直接取自文献本身,它包含词、 词组或句子,没有烦琐规则的约束,不添 加任何人工的色彩。
(二)后控词表
后控词表专门用于自然语言检索系统, 主要是在检索输出时对同义词以及语义句 法上的相关词进行控制,以实现自动扩检 和转换的功能,也有人称之为只供检索的 词表。
【思考题】
1.什么是检索语言? 2.怎样理解检索语言的基础是概念逻辑和知识
分类? 3.检索语言的功能有哪些? 4.检索语言可以分为哪些类型? 5.试述分类检索语言的特点和类型。
6.简述分类检索语言的结构。说明类目之间的 关系及表现形式。
第五节 检索语言的发展
一、网络环境下的分类语言
分类法比较全面和客观地反映了知识 全貌及其内在的逻辑联系,它体系结构的 系统性、标识符号的通用性以及族性检索 功能,是其他信息检索语言所不具备的, 也是无法取代的。
二、网络环境下的主题语言
主题法使用语词对信息进行揭示和组 织,直接用语词标识信息内容,可以较好 地满足用户的特性检索需求,主题语言在 网络环境下仍然是一种重要的检索语言。
二、分类检索语言结构
(一)类目 1.类目的划分 2.引用次序 3.类目的排列 4.类名的确定 5.类目之间相互关系的处理
(二)标记符号
1.顺序制 2.层累制 3.混合制 4.分面标记制
(三)说明与注释
说明与注释是对分类表结构及使用方 法的揭示,用它来进一步阐述分类法的编 制原理、特点和使用方法,明确类目之间 的关系,确定类目的性质和范围,确定类 分图书时的方法等。
(一)标题词法 标题词法是主题检索语言中使用最早
的一种类型。标题词是从自然语言中选取 的、经过规范化处理的、表示事物概念的 词、词组或短语。
(二)单元词法
单元词又称元词,是从自然语言中选 取,经过规范化处理,表达主题最小的、 最基本的、字面上不能再分的名词术语。
三、关键词法
关键词作为信息存储和检索依据的一 种检索语言,是直接从原文的标题、摘要 或全文中抽选出来的,具有实质意义的, 未经规范化处理的自然语言词汇。但在实 践中一般也要对关键词进行极少量的规范 化处理。
二、检索语言的分类
1.按描述文献的特征,可以分为描述文献外表特征 的检索语言和描述文献
2.按结构或原理,可分为分类语言、主题语言、代 码语言和引文语言
3.按信息标识的组合使用方法,可分为先组式语言 和后组式语言
4.按语言的规范程度,可分为人工语言和自然语言
第三节 分类检索语言
一、分类检索语言概述
第二节 检索语言的功能和分类
一、检索语言的功能
1.标引信息内容特征及某些外表特征,保证不同标 引人员表达信息的一致性
2.对内容相同及相关的文献信息加以集中或揭示其 相关性
3.使信息的存储集中化、系统化、组织化,便于检 索人员按照一定的排列次序进行有序化检索
4.便于将标引用语和检索用语进行相符性比较
相关文档
最新文档