第1讲 信息检索概述
第一讲 信息检索 PPT课件

第一节 信息 知识 情报 文献
2.知识 知识是人类认识的成果或结晶,是系
统化信息的集合. 知识的属性:
意识性 信息性 实践性 规律性 继承性 渗透性
第一节 信息 知识 情报 文献
3.文献 知识借助于一定的语言形式或物化为某
种劳动产品的形式,就成为可以交流的 文献。 文献的三要素:知识、载体、纪录方式。 文献的属性:知识信息性、客观物质性、 人工纪录性、动态发展性等。 文字形式的文献变成数据形式即称之 为电子文献。
信息的重要性(二)
从知识层面上理解
知识经济建立在知识 材料、 消耗 不可 不可 利用与创新的基础上, 能源 性 共享 再生 知识创新需要大量的
信息做原料。
信息与材料、能源 被称为当今社会的三 大资源
信息
非消 耗性
可共 享
可再 生
二、信息意识和信息素质
信息意识:是人们对各种信息的自觉 心理反应。
第一节 信息 知识 情报 文献
4.情报 在英汉词典中,“information”可译
为“信息”,也可译为“情报”. 情报:人们在一定的时间内为了一定
的目的而传递的有使用价值的知识. 情报的属性:知识性、传递性、效用性。 情报交流:直接交流和间接交流
第一节 信息 知识 情报 文献
信息的重要性 从情报的层面上理解 1.信息决定战争的胜负 2.信息决定企业的兴衰 3.信息是领导决策的依据。
二、文献的出版类型
按出版类型文献划分以下十大类:
(1)图书 (2)期刊(3)会议文献 (4)科技报告 (5)专利文献 (6)学位论文(7)标准文献 (8)政府出版物(9)产品资料 (10)技术档案
二、文献的出版类型
1.科技图书(Sci-Tech book) 阅读类:科普读物、专著、文集等 工具类:百科全书、年鉴、手册、词典等。
第1章 信息及信息检索概述

1.2 信息素养与创新能力
1.2.1 信息素养的内涵
第
信 息 及 信 息 检 索 概 述
一 章
4. 信息道德 信息道德是指个人在信息活动中的道德情操及行为规范。包 括学习了解信息与信息技术相关的法律、道德伦理、经济法规, 摘取利用信息资源时能够合法、合情、合理地使用信息,并遵守 一些约定俗成的规则等。总之信息道德是对信息创造者、信息服 务机构和信息用户之间相互关系的行为规范进行约束之准则。
第
信 息 及 信 息 检 索 概 述
一 章
2003年9月20至23日,联合国教科文组织(UNESCO)和美国 图书情报学委员会(NCLIS)在捷克首都联合召开的信息素养专 家会议发布了布拉格宣言:走向具有信息素养的社会。 这次会议共有来自世界23个国家的40位代表讨论了信息素养 问题。会议认为如何使人们从Internet时代的信息和通信资源及 技术中受益是当今社会面临的重要挑战。
1.1.2 信息检索类型
第
信 息 及 信 息 检 索 概 述
一 章
1. 按检索对象划分 (2)事实检索(Fact Retrieval) 事实检索是指以某一客观事实为检索对象或对已有的数据进 行处理(逻辑推理)后得出新的事实过程,其检索结果是数值性 数据和相关的资料。
1.1 信息与信息检索的基本概念
1.2 信息素养与创新能力
1.2.1 信息素养的内涵
第
信 息 及 信 息 检 立大学图书馆馆长理事会对信息素养的 定义表述为:“能清楚地意识到何时需要信息,并能确定、评价、有 效利用信息以及利用各种形式交流信息的能力”。
1.2 信息素养与创新能力
1.2.1 信息素养的内涵
1.1.1 信息与信息检索的定义
第一章_信息检索概述

从这个故事学到什么?
• 不同的人解读不同,但有一点是肯定的: 信息影响我们正确的判断力。
• 根源在于作为大学毕业生的儿子“媒介素 养”出了问题。
• 爱因斯坦“我是抓住书的骨头,抛弃书的 皮毛。”
对比统计
• 我国83%的高校学生不知道本专业的主要信息的 出处,70%的学生不知道本专业信息的检索方法, 60%的学生不知道在网络上检索本专业的信息。
大学生的“媒介素养”问题
• 经济危机时代的一则故事:一个没文化, 听力差,视力弱的人使用了很多方法使得 自己的面包店越做越大,正在他生意红火 的时候,他刚大学毕业的儿子加入了父亲 的生意。奇怪的事情发生了……
• 光顾他面包店的人越来越少了,利润很快 下滑,父亲对儿子说:“你说的对啊!我 们正在面临经济萧条与危机。”儿子说: “我很高兴之前提醒过你。”
信息的构成六要素
• 信源(不了解信源就不可能了解信息的内涵) • 语言符号(文字、符号、编码等) • 载体(信息必须附着在一定的物质上) • 信道 • 信宿 • 介质(语言、载体、信道都属于信息传递
的媒介形式)
信息的特征
• 信息与载体的不可分 • 信息的客观性 • 信息的价值性 • 信息的时效性 • 信息的可扩充与可压缩性
国内学术界定义
• 李克东:应包含信息技术操作能力、对信 息内容的批判与理解能力以及对信息的有 效运用能力。
• 徐福荫: 技术学---处理能力 心理学---解决能力 社会学---交流能力 文化学---构建能力
信息素养的概念
• 对信息进行查找、识别、加工、理解、处 理、传递、利用、评价、管理和创造的知 识、能力与观念、情感、意识和心理等各 方面基本品质的总和。
信息素养的构成
• 由信息意识、信息知识、信息能力和信息 道德等四个要素构成。
第一讲 文献信息检索概述

信息源
文献信息源 口头信息源 体语(体态)信息源 实物(现场)信息源
文献信息检索的实例:
查找经典作家或权威人士对某一问题的论述。 某一丽词骈语的出处、古今纪年的换算、成语典 故。 查找某一事实、数据、知识单元。 在研究某一问题时,获得前人和他人已经具有的 成果。 网上搜索(专业资料可利用网络信学术信息资 源)。 …… 总之,学习生活和科学研究中的许许多 多的问题,都需要查找文献资料,才能获得准确 的答案。
人才观
知识型人才 能力型人才 创造型人才 各类人才的两个必备能力:自学 能力和研究能力。而这两个能力 在很大程度上取决于文献信息的 检索能力。
(二)终身教育的需要
终身教育:20世纪50年代末60年代初形成于欧洲 的一种教育思潮。观点与认识不一,较为普遍的 解释是“人们一生中所受到的培养的总合”。
信息意识 信息知识 信息资源 信息(检索)技能
教学内容:
第一讲 第二讲 第三讲 第四讲 第五讲 第六讲 第七讲 第八讲 第九讲 文献信息检索概述 ; 文献信息知识基础; 图书馆利用; 参考工具书的使用; 中文期刊论文的检索; 主要英文检索刊物概述; 电子文献信息资源概述; 网络信息与搜索引擎; 特种文献信息的检索。
直接检索和间接检索的优缺点及辨证关系:
直接检索的优点:(1)是一种比较原始的方式,符合人们的检索
习惯。(2)易于掌握文献的实质内容,可直接判断其情报内容是否符 合自己的需要。(3)简便易行,可及时获得最新情报。缺点:盲目性、 偶然性大,在现代文献量激增、高度分散背景下,无法查全资料,且费 时费力。 间接检索的优点:是由检索工具的特点决定的。检索工具一般是由 权威部门和专业人员来编制的,因而能够把分散在不同学科、不同语种、 不同类型和不同发表时间,但学科内容相同的文献分门别类的集中编排 在一起,从而使盲目的分散的检索变成了有目的的集中检索,避免了直 接检索的分散性、盲目性和偶然性,提高了检索效率,节约了检索时间。 所以间接检索被称为科学的检索方法。缺点:间接性,无法直接判断 文献内容是否符合需要;存在时差问题,不能获得最新信息。(时差: 指检索工具的出版时间与原始文献的出版时间之间的时间间隔。) 辨证关系:二者各具优缺点,且具互补性。检索实践中,应二者并用, 相互补充。
1信息检索概述武大黄如花 ppt课件

SCIENTIFIC SOLUTIONS
《中图法》等级分明的科学系统
O
一级类目
数、理、化
O1 O3 O4 O6 O7 …… 二级类目
数学 力学 物理 化学 晶体
O11 O12
O13 ……
三级类目
古典数学 初等数学 高等数学
O121 O122
O123 O124
四级类目
算术 初等代数 初等几何 三角 2020/12/12
信息检索的常用术语
• 检索词:用户输入的字、词、字符或短语 • 检索式:检索提问表达式 • 检索策略:是对查询的全面策划,在操作上主要指数据库的选择和检索
式的编制 • 前者选择数据库资源,后者实现检索目标 • 一般也直接将检索式视为搜索策略
2020/12/12
武汉大学信息管理学院 黄如花
SCIENTIFIC SOLUTIONS
武汉大学信息管理学院 黄如花
精品资料
SCIENTIFIC SOLUTIONS
• 你怎么称呼老师? • 如果老师最后没有总结一节课的重点的难点,你是
否会认为老师的教学方法需要改进? • 你所经历的课堂,是讲座式还是讨论式? • 教师的教鞭 • “不怕太阳晒,也不怕那风雨狂,只怕先生骂我笨,
没有学问无颜见爹娘 ……” • “太阳当空照,花儿对我笑,小鸟说早早早……”
1 信息检索的含义
• 广义的信息检索
• information storage • information retrieval
SCIENTIFIC SOLUTIONS
• 狭义的信息检索
• information retrieval
2020/12/12
武汉大学信息管理学院 黄如花
信息检索基础知识介绍

原始文献 加工整理
提 问
数据库 存 储
检 索
输 出
检 索
三、信息检索的类型
(一)按检索对象和目的划分 1、数据检索
LOGO
是以数据为检索对象,检索的结果是经过测试、
评价过的各种数据、可直接用于分析和研究。
2、事实检索
是以具体事项为检索对象,检索结果是有关 某一事物的具体答案。
3、书目检索
以标题、作者、来源出处、专利号等为检索对象,
主题词语义参照系统
汉语拼音 Zà o shēng gān răo 符 英文 参照项 含义 噪声干扰 简称 英文全称 [56MB] 范畴分类号 正式主题词 号 简称 Zábō gān răo 汉语拼音 Noise jamming 英译名 用项 同义词(正 用 Y USE Use D 杂波干扰 Dià n zĭ duì kà ng 非正式款目主题词 杂波干扰 [56MB] 范畴分类号 式主题词 ) 瞄准式干扰 电子对抗* F · 通信对抗 代项 同义词 (非扫频干扰 代 Noise D jamming UF Used For 参 英译名 · · 通信干扰 关 阻塞式干扰 照 正式主题词 ) · · · 脉冲干扰 系 S 通信干扰 Y 噪声干扰 符 参照符号 关系词 · · · 欺骗性干扰 分项 狭义词 分 F NT Narrower Term 词 号 有源干扰 · · · 载波干扰 · · · 噪声干扰 属项 广义词 Z 电子对抗 属* S BT Broader Term · · · · 扫频干扰 C 连续波干扰 · · · · 阻塞式干扰 族项 族首词 族 Z TT Top Term 脉冲干扰 · · 通信抗干扰 调制干扰 参项 相关词 参 C RT Related Term
INFORMATION RETRIEVAL
第一讲__信息检索概述

第一讲信息检索概述1 信息的概念文献的概念信息是对客观世界中各种事物的特征、变化及其相互联系的最新反映。
信息是有用的知识。
文献的概念:凡是人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统称为文献。
文献也可称为固化在一定载体上的知识。
或者更简单地说,文献就是记录下来的知识。
甲骨、竹简、纸本图书、期刊、录音带、录像带、CD-ROM、磁盘、磁带. (文献载体)2 从文献检索到信息检索(1)文献检索指从文献中检索你所需要的知识、信息。
(2)文献检索作为检索类型时,检索包含你所需知识、信息的文献。
信息检索是最近几年的提法,这种提法和网络信息的迅速发展有很大的关系,因为人们在使用网络信息资源时不知道或不关心它存储在哪里。
我们不关心它的存储载体,只关心其内容,所以网络信息资源又被称为虚拟信息资源。
当我们检索所需知识或信息的资源从文献信息资源扩散到网络信息资源时,文献检索也就顺理成章地发展到信息检索。
文献检索是以工作的对象而命名,信息检索则是以工作的目的而命名。
当然,信息检索从广义上还包括其它非文献信息的检索,比如储存于大脑或其它实物上的信息的获得。
本课程主要讲述文献信息和网络信息(本质上还可以理解为电子文献)的检索。
3 信息检索的类型与渠道信息检索就是从众多信息中查找并获取有用信息的过程。
早期一般认为,信息检索(information retrival――情报检索)包括三个方面:(1)数据检索(data retrieval)例如:1982年1月每盎司黄金的价格;世界上最长的隧道有几米?(2)事实检索(fact retrieval)例如:世界上最长的隧道是哪条?到目前为止,惠泱河先生发表了哪些著作?现任哈佛大学校长是谁?(3)文献检索(document retrieval)例如:关于张恨水的作品评论有哪些文献资料。
数据检索与事实检索是要检索出包含在文献中的信息本身,而这里的文献检索指的是要检索出包含你所需信息的文献。
信息检索概述

海大图书馆
面积
2.5万m2
馆藏册数
156万
现刊种类
3500种
北大图书馆
北京图书馆 美国国会图书馆
5.3万m2
17万m2 34万m2
600多万
980多万 8100多万
4000种
3万多种
分布离散
现代科学技术的发展及其相互渗透,许多新
兴学科、边缘学科、交叉学科不断涌现。 专利文献的重复率达65%,科技报告的重复 率甚者可达80%。会议上发表的论文,大约有40 %会在期刊上报导。
1
1.1 1.2 1.3 1.4 1.5 1.6
信息检索概述
信息及其在学术研究中作用 信息检索的概念及原理 数字信息资源检索技术 信息检索的步骤 检索效果的评价 科技查新概念及其检索方法
1.1
信息及其相关概念
1.1.1 信息的概念、基本属性和特征 1.1.2 文献的概念、社会功能和类型 1.1.3 信息(文献)在学术研究中的作用
要自如地去对付这样一种文献分布局面,就
需要我们在查询文献、信息时应用适当的方法、
技巧去有效地获得比较满意的结果。
更新加快
未来学家约翰·奈斯比特在其著作《大趋势》中用 数字来形容知识的快速增长:“人类知识的总和在17501900年间翻了一翻;1900-1950年间则在此基础上翻了 一翻;之后的翻番发生于1960-1965年,自此以后的估 计是人类知识至少每5年翻一番。到2020年,人类知识 将每73天翻一番!”可见,知识与信息频繁在更新换代。 终身学习,不断去跟踪、获取最新信息、知识、文 献,去创新,这对每个科技人员来说是至关重要的。
较权威的图书分类法有:中国图书馆分类法、美 国国会图书馆分类法、杜威十进分类法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
返回
信息的概念:从主观认识角度
信息是存储在人脑中的思想、观念、知识等形 态。 人们通过对客观世界的认识所形成的各种知识、 学问、消息等 。
返回
信息的概念
信 息 论 创 始 人 申 农 ( C.E.Shannon) 说 : “信息是能够用来消除不确定性的东西”。
问题:下面的论述是否为信息?
1)听说国际石油价格要涨; 2)国际石油价格现已涨到每桶70美元; 3)华盛顿是英国的总统;
问题:依据中图法,管理学所属大类是什么? 经济学所属大类是什么? 如下图:
返回
返回
返回
索书号又称排架号,它是每种图书在书库中所处位置的唯一标识, 也是图书排架、读者索书和藏书清点的标志和依据。
它由分类号和书次号两部分构成。
利用《中图法》分类的结果是使每种图书都获得一个分类号 (class number),但仅有一个分类号是不够的,因为同一类图 书可能有很多种,所以还有必要进行进一步区分。在分类的基础 上,再赋予每种图书一个书次号,共同组成图书的索书号(call number),如TP316/180。
返回
信息的几个相关概念
事实:人类思想和社会活动的客观映射 数据:事实数字化、编码化、序列化、结构化 信息:数据在信息媒介上的映射 知识:对信息加工、吸收、提取、评价的结果 情报:运用事实、数据、信息、知识而得出的有价值 的东西
如下图:
返回
情报
事实 数据、信息、知识等之间的关系
信息检索的概念和意义
返回
信息的特征
客观性 依附性(寄附性),如下图 传递性 共享性 衍生性(可加工性) 时效性 价值性(增值性)
返回
信息的分类:按表现形式分
文字信息 图像信息 数值数据信息 语音信息
返回
信息的分类:按出版类型分
1) 图书 2) 期刊 3) 政府出版物 4) 科技报告 5) 专利文献 6) 会议文献 7) 学位论文 8) 技术标准和规范 9) 产品样本说明书 10) 技术档案
返回
返回
返回
电子图书
返回
返回
返回
返回
返回
返回
返回
返回
返回
返回
返回
返回
返回
返回
引例3
在互联网上查找指定关于“管理学/成本会计/ 审计学”.doc类型的文件。
返回
返回
思考题
如何在互联网中查找自己任意指定的文件类型 (如docx文件,LRC文件、DLL文件等)?
返回
返回
信息的分类:按加工程度分
一次信息:人们研究或创造性活动成果的直接 记录。(图书、期刊、专利) 二次信息:对一次信息加工、整理而成的。 (目录、文献、索引) 三次信息:对一、二次信息综合、分析等深加 工的产物。(评论、进展报告、述评)
返回
信息的分类:按存储载体分
印刷型信息:可以直接阅读、携带方便;密度 小、占用空间大。 缩微型信息:便于保存、转移和传递,缩小文 献的体积。 声像型信息:直观、形象、生动、逼真。 电子型信息:信息容量大、出版周期短、检索 方便、易复制,可交互性强、低成本、高效益。
返回
返回
CNKI数据库 (中国知网)
返回
万方数据库
(中国科技信息研究所)
返回
返回
万方数据库
(中国科技信息研究所)
返回
维普数据库
(重庆维普)
返回
返回
引例2
找一本新出的关于“管理学”/“成本会计”的 电子图书。
返回
Springer数据库 (图书)
返回
返回
返回
返回
返回
超星电子图书
返回
信息素养
信息素养是指一个人利用信息工具的能力和获 取识别信息、加工处理信息、传递创造信息的 能力以及以独立学习的态度和方法将已获得的 信息用于信息问题的解决、进行创新性思维的 综合的信息能力 。
返回
结束
返回
第一讲 信息检索概述
一、信息的概念、特征与分类 二、信息的几个相关概念 三、信息检索的概念和意义 四、中图法
返回
信息的概念
信息是当代社会使用最多、最广、最频繁的词 汇之一 目前尚无公认的统一定义
返回
信息的概念:从自然界角度看
信息,既不是物质,也不是能量;它依附于自 然界客观事务而存在。 从这种意义看,信息比客观事物的属性更具有 一般性与普遍性。
广义:信息检索(Information Retrieval)是 指将信息按一定的方式组织和存储起来,并根 据信息用户的需要找出有关的信息的过程和技 术。 狭义:根据信息用户的需要找出有关的信息的 过程。 根据检索对象的不同,分为文献检索和数据检 索。
返回
信息检索的意义
有助于知识更新 有助于科学研究 有助于管理者做出正确的决策 解决个人其他方面的需求
返回
中图法
《中图法》是《中国图书馆图书分类法》的简 称,是我国目前通用的类分图书的工具。 国外图书分类方法:
– –
–
十进分类法 国际十进分类法 美国国会图书馆分类法
返回
国内图书分类方法:
–
–
–
中国图书馆分类法(中图法) 中国科学院图书馆分类法 中国人民大学图书馆图书分类法
返回
中图法的分类方法:根据图书资料的特点,按照从总到分, 从一般到具体的编制原则,确定分类体系,在五个基本部类 (“马列主义类” 、“哲学”、“社会科学”、“自然科学” 和“综合性图 书” )的基础上,组成二十二个大类。《中图法》的标记符 号采用汉语拼音字母与阿拉伯数字相结合的混合号码。即用 一个字母表示一个大类,以字母的顺序反映大类的序列。字 母后用数字表示大类以下类目的划分。
第1讲 信息检索概述
引例1
写一篇关于“成本会计” / “基础会计”(或 “管理学”等 )前沿问题的文章;
返回
EBSCO数据库
返回
点击“经济管理”
返回
EBSCO数据库
返回
返回
Emerald数据库
返回
返回
Springer数据库
返回
பைடு நூலகம்
返回
返回
返回
CNKI数据库 (中国知网)
返回
返回
返回
控制论创始人维纳( N.Weiner)认为:“信 息是人们在适应外部世界并且使这种适应反作 用于外部世界过程中,同外部世界进行交换的 内容的名称”。
返回
信息的概念
综上所述,信息是人类在认识和改造客观世界 中所依赖和使用的一种既非物质又非能量的东 西,它的表现形式可以是消息、信号、数据、 情报或知识;但是,信息又不仅存在于人类社 会,而是客观世界中一切物质的属性,它反映 的是物质之间的普遍联系。
返回
思考题
问题: 1、依据中图法,货币银行学所属大类是什么? 2、为什么会书名相同而索书号却不同?例如《钢铁 是怎样炼成的》有I512.45和TF5两种;又如《莫泊桑 短篇小说选》有I565.44和H319.4. 《钢铁是怎样炼成的》(文学作品) I512.45 《钢铁是怎样炼成的》(科技图书) TF5 《莫泊桑短篇小说选》(文学作品) I565.44 《莫泊桑短篇小说选》(中英文对照) H319.4