第四章信息检索原理与检索语言

合集下载

信息检索之检索语言

信息检索之检索语言
② 文字型数据库是指以文字字符为主要记录内容的 数据库,包括书目型、事实型、百科全书型、词 库型和全文型数据库。这类数据库主要用于查找 相关文献信息。 ③ 数值型数据库包括来自科学研究,原始文献或者 调查研究的各种数值型或图表型数据库。这类数 据库主要用于查找确定对象的特定数值信息。
Hale Waihona Puke 数据库的成从使用者观 点观察,数据 库主要由“----记录-----字段----” 三个层次构成。
记录实例 作者: 赵少庆
篇名:信息技术对公共行政的影响论纲。
文章出处:国家行政管理学杂志,2005.12(5) : 345---347
内容摘要:社会信息化是当代社会的一种大趋势, 他正推动着公共行政现在化的进展。信息技术发展 对诸如行政人员、行政决策、行政组织、行政方法、 行政公文、行政管理模式等公共行政管理要素和过 程产生着深远影响。
检索语言是应文献信息的加工、存储和 检索的共同需要而编制的专门语言,是表 达一系列概括文献信息内容和检索课题内 容的概念及其相互关系的一种概念标识系 统。
什么是分类语言?
分类语言也称分类法。用分类号和相应的分类 款目来表达各种概念,以学科体系为基础将各 种概念按学科性质和逻辑层次结构进行分类和 系统排序,能反映事物的从属派生关系,便于 按学科门类进行族性检索。按照分类方式的不 同,分类语言又分为体系分类语言、组配分类 语言和混合分类语言。
布尔逻辑运算:逻辑非
1:组配方式:A NOT B, A-- B表示。检索结果 即为再还有概念A的文献中,排除同时含有B的 概念。 2:作用:排除无关概念,用来缩小检索范围, 提高查准率。 3:实例:ands NOT hearing 检索含有“aids” 的数据,排除含有”hearing”的文献。

信息检索

信息检索

2、 报刊 报刊是一种以印刷形式或其它形式逐次刊行的,通常 有数字或年月日顺序编号的,并打算无限期地连续出 版下去的出版物。 报刊特点:数量大、品种多、内容丰富多样;出版周 期短,报道速度较快;发行、流通广泛、连续性强, 伴随着相应的学科领域发展而发展。 在检索工具的文摘中,往往有卷、期、页的标志(如 Vol. 10, No. 2, 201-209 )
信息检索(Information Retrieval):是指将信息按一 定的方式组织、存储起来,并根据用户的需要找出有 关信息的过程。它的全称又叫做“信息存储与检索” (Information Storage and Retrieval),这是广义的 信息检索。狭义的信息检索仅指该过程的后半部分, 从信息集合中找出所需信息的过程。
4、一、二、三次文献之间的关系 一次文献带有创造性;二次文献是在一次文献基础上 形成的,具有选择性、浓缩性;三次文献是在一、二 次文献基础上经过分析、提炼、总结形成的,具有概 括性。从一次文献到三次文献,是一个由分散到集中、 由无序到有序的过程。
三、按信息的表现形式划分
1、 文献型信息源 存储语言文字形式信息的各种载体的集合。 2、 非文献型信息源 数值型信息源、 声像型信息源、 多媒体信息源、 实物及口头信息源。
三、文献
1.文献的含义 在《文献情报术语国际标准(草案)》 (ISO/DIS5127)中对文献是这样定义的,即“为 了把人类知识传播开来和继承下去,人们用文字、 图形、符号、声频、视频等手段将其记录下来,或 写在纸上,或晒在蓝图上,或摄制在感光片上,或 录到唱片上,或存储在磁盘上。这种附着在各种载 体上的记录统称为文献”。 在《信息与文献术语》(GB/T4894— 2009)中对文献是这样定义的,即“文献,在 文献工作过程中作为一个单位的记录信息或实物对 象”。这里文献工作指的是为了存储、分类检索、 利用或传递而对记录信息所进行的连续和系统的汇 编和处理。

信息检索概论思考题答案

信息检索概论思考题答案

第一章信息检索概论思考题:1.什么是信息?简述信息的特点和分类?我们认为,信息是事物或事物之间不确定性的量度,即负熵。

掌握的信息越多,所需认识的事情的确定性就会越少。

信息由信源,信宿和信道(载体)构成。

信息的特点:(1)客观真实性:客观、真实是信息的最重要的本质特性(2)普遍性:信息是物质的普遍属性,物质是具有普遍性,所以信息也拥有该特性(3)针对性:信息的作用和价值可以随着接受者的不同而不同(4)传递性:过程:信息源(信息的发出者)——>编码—>信道(载体)—>译码—>信宿(信息的接收者)信息源:是信息的发出者信宿:是信息的接收者信息的传播是双向的,多维的。

信息源和信宿是相对的,也是可以相互转换的。

信道:就是在传播过程中,编码经过的物理通道(5)时效性:指信息发出、接收到利用的时间间隔及效率,也包括信息的本身更新速度。

客观物质不断的变化,反映事务的运动状态和运动方式的信息也会发展变化一般而言,随着时间的推移,信息的价值会逐渐减少也有反例:如考古信息(恐龙、古钱币),年代越久,使用价值越大衡量信息的时效性参数不只是时间参数,还有地理环境(6)可转换性:信息可以从一种形态转换成另一种形态(7)可处理性(可识别性):可以通过人们的感觉器官所感知,也可以通过仪表、器械来检测进而予以识别。

(8)可共享性:指同一内容的信息可以在同一时间里被若干个用户使用,此时信息载体本身的信息量不会被磨损、消失信息的类型:(1)按信息表现形式划分,可分为文字信息,图象信息,数值数据信息,语音信息。

▪文字信息:文字是人们为了实现信息交流、通信联系所创造的一种约定的形象符号。

▪图象信息:图象(形)是一种视角信息,它比文本信息直接,易于理解。

如,一幅画、一部电影。

▪数值数据信息:数值数据是“信息的数字形式”或“数字化的信息形式”。

▪语音信息:人讲话实际是大脑的某种编码形式的信息转换成的语言信息的输出,是一种最普遍的信息表现形式。

信息检索语言

信息检索语言

中图法分类简表
(/view.do?id=516)
A B C D E F G H I J K 马克思主义、列宁主义、毛泽东思想、邓小平理论 哲学、宗教 社会科学总论 政治、法律 军事 经济 文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
中国情报检索语言之近代阶段的特点
①从分类体系来看,冲破了四部分类法的束缚,提出了 新的分类理论,能尽量建立在科学的基础之上,为新 旧书籍、中外图书的统一分类开辟了可行的途径; ②从类目设臵与标记制度来看,比较简单、科学、准确、 便于利用,是中国图书分类法史上的一次重大变革; ③从类分表的结构来看,分类法已经形成为一个完整的 系统,并且有一定的科学理论作为其指导依据及一 定的使用范围作为其实践基础; ④从编制技术上看,既继承了古代分类法的优良传统与 经验,更吸收了国外的先进技术,具有科学性;
信息检索语言的类型
分类语言
分类语言是用分类号和相应分类款目来表达 各种概念的,它以学科体系为基础将各种概 念按学科性质和逻辑层次结构进行分类和系 统排序。分类语言能反映事物的从属派生关 系,便于按学科门类进行族性检索。按照分 类方式的不同,分类语言又分为体系分类语 言、组配分类语言和混合分类语言。
中国情报检索语言之近代阶段的特点(续)
⑤受杜威分类法带来的局限与影响,在类目体系的确立 上表现有机械、呆板、生硬的一面; ⑥对分类法理论中的一些重大问题与实践中出现的情 况未能展开充分的讨论并科学的加以解决,从而在 实际操作中各行其是,影响了图书分类法理论研究 的整体性进展; 在主题法方面:我国近代图书馆的主题编目技术也是于 20世纪初由西方传入的。继而从30年代到50年代, 我国虽然有三、四部中文标题表问世,但是都未能 得到实际的应用。

信息检索电子课件

信息检索电子课件

信息检索语言 主题 语言 描写文献 内容特征 分类 语言
单元词语言 标题词语言 关键词语言 叙词语言 体系分类语言 组配分类语言 混合分类语言 Return
表2-1 《中图法》结构示意图
基本大类 简表 详表
A 马克思主义、列宁主义 毛泽东思想、 邓小平理论 B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 U1 综合运输 S 农业科学 U2 铁路运输 T 工业技术 U4 公路运输 U 交通运输 U6 水路运输 V 航空、航天 [U8] 航空运输 X 环境科学、安全科学 Z 综合性图书
工具书概述
第二节
第三节
中文工具书举要
网络工具书
Return
第一节
工具书概述
一、工具书的定义与性质
工具书的定义 工具书的性质
二、工具书的类型
三、工具书综合利用要领
Return
第二节
一、中文检索工具书
目录
中文工具书举要
索引
文摘
二 、中文参考工具书
词语与学科知识检索工具——辞书与百科全书 年度统计资料与统计数据的检索工具——年鉴 数据规格、技术方法的检索工具——手册 人物、机构和地域信息检索工具——名录 实、历法和历史沿革信息的检索工具——表谱 图像信息检索工具——图录 Return
J-D J-E J-F
J-G
经济政治与法律辑
经济、商贸、金融、保险、政论、党建、外交、军事、法律
J-H
教育与社会科学综合辑

信息检索复习题

信息检索复习题

第一章绪论1.1 信息素养与信息教育信息素养,又称信息素质、信息能力,是一个综合性的整体概念,它是将信息意识、信息道德、信息需求动力、信息工具和信息源以及信息评估、吸收与利用有机结合而获得的一种综合能力。

1.2 信息的基本概念信息与知识、情报、文献的联系与区别:信息是指对各种事物的存在方式、运动状态和相互联系特征的一种表达和陈述,是自然界、人类生活和人类思维活动普遍存在的一切物质和事物的属性。

知识来源于信息,是信息的一部分。

是一种特定的人类信息,信息只有经过科学的系统的加工才能上升为知识。

情报是为了解决一个特定问题所需的知识,是激活了的知识,是知识经传递并起作用的部分。

有三个基本属性:知识性、传递性和效用性。

它虽然属于信息的范畴,但不是一般的信息,而是一种特定信息。

文献是记录有信息的一切载体,文献中蕴含着大量的知识和信息,这些知识、信息被用户利用时就转化为情报。

情报源于知识,知识源于信息,文献是信息、知识情报的主要载体形式。

1.3 信息源与信息媒体信息源,就是信息的来源,即人们在科研活动中、日常工作以及其他一切社会实践中所产生的成果和各种原始资料,以及对这些成果和原始资料加工整理而得到的成品等,是能为满足人们特定需要而产生信息的源泉。

按照其存在形式可分为三类:口头信息源、实物信息源和文献信息源。

一次信息媒体:即原始信息媒体或第一手资料,主要是指报道新发明、新创造、新知识、新技术的原始资料,以及直接记载的科研成果调查报告经验总结等,通常亦称原始文献、一次文献。

如期刊文献、会议文献、科技报告/研究报告、专利文献、学位论文、政府出版物、标准文献、科技档案、产品资料等。

第二章信息检索系统概述2.1信息检索系统类型计算机检索系统:其核心是数据库,它是由一个或多个文档构成的大量数据的集合。

按计算机检索系统所含信息资源内容的形式不同分为五种类型:1书目型数据库:存某个学科领域的二次文献信息(文摘或题录)的数据库,提供原始文献信息的梗概和线索。

信息检索原理

信息检索原理

④限定检索技术
使用截词检索,简化了布尔逻辑检索中的逻辑 或功能,并没有改善布尔逻辑检索的性质。使用位 置逻辑检索,只能限制检索词之间的相对位置,不 能完全确定检索词在数据库记录中出现的字段位置, 特别在使用自由词进行全文检索时,需要用字段限 制查找的范围。常用的字段代码有标题( TI )、文 摘(AB)、叙词或受控词(DE或 CT)、标识词或自 由词(ID或 UT)、作者(AU)、语种(LA)、刊名 ( JN )、文献类型( DT )、年代( PY )等。这些限 制符在不同的系统有不同的表达形式和使用规则, 在进行字段限制检索时,应参阅系统及有关数据库 的的使用说明,避免产生检索误差。
②信息检索系统
信息检索系统是根据一定社会 需要和为达到特定的信息交流目的 而建立的一种有序化的信息资源集 合体。信息检索系统通常应是一个 拥有选择、整理、加工、存储、检 索信息的设备与方法,并能向用户 提供信息服务的多功能开放系统。
3、信息检索技术
①布尔逻辑检索技术
②位置逻辑检索技术 ③截词检索技术 ④限定检索技术
对虾 水产
养殖
②位置逻辑检索技术
位置逻辑检索持续术是以数据库原始记录中的检 索词之间的特定位置关系为对象的运算,又称全文检 索。它是一种可以不依赖叙词表而直接使用自由词进 行检索的一种技术。这种检索技术增强了选词的灵活 性,采用具有限定检索词之间位置关系功能的位置逻 辑符进行组配运算,可弥补布尔检索技术只是定性规 定参加运算的检索词在检索中的出现规律满足检索逻 辑即为命中结果,不考虑检索词词间关系是否符合需 求,而易造成误检的不足。在不同的检索系统中,位 置逻辑算符的种类和表达形式不完全相同,使用位置 逻辑检索技术时,注意所利用系统的使用规则。 在位置逻辑符中,常用的位置逻辑算符有(W)与 (nW)、(N)与(nN)、(S)、(F)。

信息检索考试学习资料

信息检索考试学习资料

第二章信息与信息资源第一节信息、知识、情报和文献一、信息、知识、情报和文献的1、信息信息是客观存在的事物现象,是生物体或具有一定功能的机器可以感知的客观事物发出的一切有意义的信号和信息。

2、知识知识就是人类认识的成果或结晶,知识也就是信息,是信息的高级形式。

3、情报情报是指用不同的方法和手段,在有效的时间内所获得的有针对性和有价值的知识。

4、文献人们用文字、图形、符号、声频和视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或设置在感光胶片上,或录制在胶片上,或存储在磁带、磁盘上。

这种附着在各种载体上的知识,统称为文献。

文献就是记录有知识的一切载体。

5、信息社会建立在以知识生产、分配、加工和利用基础的新型社会。

第二节信息资源的类型一、按出版形式分1、图书2、期刊3、科技报告4、会议文献5、学位论文6、专利文献7、标准文献8、技术档案9、产品资料10、政府出版物二、按加工内容的深度分1、零次文献未经公开发表或未交流的文献2、一次文献是指以作者本人的研究成果为依据而创作的原始文献。

如学术报告、报刊论文、科研报告、学位论文、档案资料、会议论文等。

3、二次文献二次文献是对具有信息检索价值的一次文献进行搜集、整理、加工、提炼,按一定顺序组织起来的文献。

主要包括书目、索引、文摘、题录等。

是用来报道和检索一次文献的检索工具或检索系统。

4、三次文献是指利用二次文献,搜集大量一次文献进行研究,经过系统整理综合分析而撰写出来的文献。

主要包括综述、年鉴、词典、手册等。

第三章信息检索第一节信息检索概述一、信息检索的定义广义的讲,信息检索就是将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。

它包括信息存储和检索两个过程。

狭义的讲,信息检索是从信息集合中找出所需要的过程,即信息的检索过程。

二、信息检索原理信息检索的基本原理就是将信息存储和检索两个过程中的存储特征标识和检索提问标识进行对比,二者匹配达到一致,即可获取符合条件的信息。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 检索原理与检索语言
第四章信息检索原理与检索语言
一、 计算机信息检索概述(分为存储和检 索两个部分)
计算机信息检索系统是信息检索所用 的硬件资源(如计算机,网络)、系统软 件(如windows系列软件)以及信息资源 数据库的总和,它能存储大量的信息,并 对信息条目分类、编目或编制索引;并进 行检索。)
电讯技术
TP3计算机
TP33电子数字计算机
TP自动化技术 TP6射流技术
TP34电子模拟计算机
计算技术
TP7遥感技术
TP35混合电子计算机
TQ化学工业 TP8运动技术
TP36小型、微型、台式计算机
TS轻工业、手工业
TP38其他计算机
TU建筑科学 TV水利工程
第四章信息检索原理与检索T语P言39计算机应用
D 政治、法律
E 军事
F 经济 G 文化、科学、教育、体育
社会科学
H 语言、文字
I 文学
J 艺术
K 历史、地理
第四章信息检索原理与检索语言
N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、安全科学
进行相符性比较等。是标引文
献的依据,检索文献的条件,
是沟通情报人员与用户思想的
桥梁。
第四章信息检索原理与检索语言
3、检索语言的类型 按文献内容特征 1 主题法语言 (较准确,具体到点)
标题词语言 关键词语言 单元词语言 叙词语言
2 分类语言 (较全面,具体到面) 体系分类语言 组配分类语言 混合分类语言
TN0 一般性问题
TN40 一般性问题
TN1 真空电工技术
TN42 微模组件
TN2 光电技术、激光技术 TN43 半导体集成电路
TN3 半导体技术 TN4 微电子学、集成电路 TN6 电子元件、组件 TN7 基本电子电路
第四章信息检索原理与检索语言
其特点如下:1)服务针对性强, 能根据检索课题提供专门服务;2) 定期向用户分发结果,保证用户 总能及时了解最新情况;3)保证 数据库中的资料能全面、准确地 满足用户要求。
第四章信息检索原理与检索语言
2 回溯性情报服务:也称为RS (Retrospective Searching),通常是针对 某一课题,对情报数据库进行若干年的回 溯性检索。检索内容不一定要最新。适于 课题调研、对某一问题作全面了解、编制 专题资料等。 3 问答式检索服务:(Question and Answering Service)是一种实时性检索服 务。用户当场,随时提问,随时得到结果。
三 计算机信息检索中常用的服务方式 计算机信息检索系统输出检索结果并
向用户提供的过程叫信息提供。根据用户 的要求,可有多种提供方式。 1定题情报服务:即SDI服务(Selective Dissemination of Information。常用的服 务方式。
过程一般是:用户需求――编写检索 提问式――存贮在计算机中――每隔 一段时间让计算机将其调出――对新 记录进行检索――最后将命中的记录 输出并提供给相应的用户――保证他 们及时了解研究课题的最新情况。它 是一种追踪学科发展动态的有效方式。
Z 综合性图书
自然科学 综合类图书
第四章信息检索原理与检索语言
P20 一般性的问题
P21 普通测量学
地形测量学
P1 天文学
P22 大地测量学
P229海洋测量学
P2 测绘学
P23 摄影测量与遥感
P3 地球物理学 P25 专业测绘与工程测量
P P4气象学
P27 地籍学
P5地质学
P28 地图制图学 [P29]地图与地图集
TM0 一般性问题 TM1 电工基础理论 TM2 电工材料 TM3电机 TM4 变压器、变流器及电抗器 TM5 电器 TM 电工技术 TM6 发电、发电厂 TM7 输配电工程、电力网及电力系统 TM8高电压技术 TM91独立电源技术 TM92 电气化、电能应用 TM93 电器测量技术及仪器
第四章信息检索原理与检索语言
计算机信息检索的主要环节包括:
信息分析(确定输入系统的信息条目
的格式和内容,为建立索引作准
备)|
信息存储(建立信息库,以备检索)
信息检索(脱机检索和联机检索两种
方式
第四章信息检索原理与检索语言
二 、计算机检索系统的构成
1 计算机硬件:系统中采用的各种硬件设备的总称,包 括具有一定性能的计算机主机、外围设备以及与数据处理 或数据传输有关的其他设备。主机,是计算机检索系统的 中枢。外围设备包括外部存储器,输入输出设备如键盘、 光笔、鼠标、光学字符识别装置,显示终端、打印机等。 2 软件:系统中有关的程序和各种文件资料的总称,包 括系统软件(如操作系统,输入输出控制程序)和应用软 件。 3 数据库:“一组文件的集合”,
把它扩充为大型分类法。1975年正式出版了
《中图法》第一版。
特点:(1)《中图法》采用拉丁字母与阿拉伯数
字相结合的混合制标记符号,以拉丁字母标记
基本大类。 ( 2)分为五大部类,22基本大类。
属于五分法
第四章信息检索原理与检索语言
A 马克思主义、列宁主义、毛泽东思想、邓小平理论
B 哲学、宗教
C 社会科学总论
第四章信息检索原理与检索语言
四 计算机信息检索语言: 1 什么是检索语言:检索语言是检索 系统存贮与检索运用的共同语言。换 言之,描述信息系统中信息的内容特 征及外表特征和表达用户信息提问的 一种共同语言。
2 功能:简单明了而又比较专
指的描述文献的主题概念;容
易将概念进行系统排列;检索
时便于将标引用语和检索用语
4分类语言(P21):将各种概念按学科性质进 行分类和系统排列,并用分类号来表达各种 概念的一种先组式语言。从学科门类的角度, 强调面的作用,泛指度高,查全率高,满足 族性检索。
4.1《中图法》是为统一全国文献分类编目创造
条件而编制和发展的。1957年文化部主持编制
了《中小型法》,在此基础上一些图书馆陆续
P7海洋学
P9自然地理学
第四章信息检索原理与检索语言
TB一般工业技术
TD矿业工程
TE石油
TF冶金工业
TG金属学、金属工艺
TH机械、仪表工艺
TJ武器工业
Байду номын сангаас
TK动力工程
T
TL原子能技术 TM电工技术
TP1自动化基础理论 TP31程序设计
TN无线电电子学 TP2自动化技术及设备 TP32一般计算机和计算器
相关文档
最新文档