信息分析第九讲科学计量方法

合集下载

信息计量学

1. 文献计量学：是采用数学统计方法，对各类文献的诸计量特征进行统计分析，进而揭示、研究文献情报规律，文献情报科学管理以及科学发展趋势的一门学科。

2. 质量牵制原则：出版物的增长数量与其质量有关，不同质量的出版物有不同的出版速度；质量高的文献增长速度慢。

3. 文献老化：科学文献随着其年龄的增长，逐渐失去了作为科学情报源的价值，越来越少的被用户利用的过程。

4. 半衰期：某学科现在尚在被使用的全部文献中，较新的一半是在多长时间内发表的。

5. 普赖斯指数：指在某一领域内，出版年龄不超过5 年的被引证文献与被引证文献总数之比。

6. 文献耦合：是指引用文献通过参考文献建立起来的耦合，如果 A 、B 两篇文献共同引用了一篇或多篇相同的论文，则 A 、B 两篇论文的关系即为耦合关系，也叫文献合配。

7 文献信息流：文献所含情报的汇流称文献信息流。

8 文献老化：科技文献随着其"年龄"的增长，其内容日益变得陈旧过时，失去了作为科学情报源的价值，以及因此越来越少被科学工作者和专家们利用的过程。

9 科学生产率：个体科研人员在一定时期内所撰写的论文数量。

10 引文分析：利用各种方法对科学期刊、论文、著者等分析对象的引证和被引证现象进行分析，以揭示其特征和内在规律。

11 影响因子:即某期刊前两年发表的论文在统计当年的被引用总次数除以该期刊在前两年内发表的论文总数。

12 信息计量学：是以信息作为对象进行计量研究的学问，采用数学、统计学等定量方法，对信息基本循环图式所描述的社会化的信息交流过程中的信息组织，存储，分布，传递，相互引用和开发利用等进行定量描述和统计分析，以便揭示社会信息交流过程的数量特征和内在规律。

13 网络信息计量学是采用数学、统计学等定量分析方法，对网上信息的组织、存储、分布、传递、相互引证和开发利用等进行定量描述和统计分析，以揭示七数量特征和内资规律的一门新兴学科。

文献信息老化的主要度量指标有哪两个？两者有何异同？文献信息老化的主要度量指标是半衰期和普赖斯指数。

信息计量学方法的应用

信息计量学方法的应用一、信息计量学方法的应用（一）测定核心期刊期刊是最基本、最常用的一种信息存贮类型。

在期刊论文的实际分布中，存在着一种普遍现象，即对于某一特定学科或专业来说，少数几种期刊所含的相关信息量很大，多数期刊的信息量却很小。

我们将含有某专业、学科相关信息量很大的少数几种期刊，称为该专业、学科的核心期刊。

确定核心期刊，不仅可以满足信息单位科学管理的需要，缓解信息经费、馆藏等方面的问题，而且可以提高信息服务的效率和准确性、针对性。

因此，测定核心期刊是信息工作的一项重要任务。

信息计量学方法为测定某一专业、学科的核心期刊，提供了一套科学的方法，如布拉德福定律法及百分比补偿、累积百分比法、文摘法、流通率法与综合评价法。

加拿大学者A.波普曾用布拉德福图像分析法测定了信息学的核心期刊。

近年来，信息计量学方法已被广泛应用于化学、医学、农业、生物、海洋等多种学科的核心期刊的确定。

（二）指导信息收藏管理应用信息计量学方法指导信息收藏与管理，表现在以下几个方面：①制定信息采集策略，比如优先订购核心期刊，确定某一主题、专业的信息采集的适当比例等；②选择各类信息的最佳搜集方式，如根据用户要求的特点和经济、合理等因素，确定对某一类信息是采取订购、交换、复制或其他什么形式；③确定期刊收藏的最佳方案，即根据布氏定律与信息老化指数规律，从有关某一学科100％的期刊中选出P泥作为一个适当的比例加以收藏；④指导信息文献剔旧工作，即依据文献的载文量、引文量、流通数据、用户反馈数据、馆藏大小等因素，确定信息文献剔旧的合理方案，维护动态的最佳馆藏；⑤评价信息收藏工作，即根据信息用户占有率、信息利用率数据评价一个信息机构的信息收藏是否充分、合理、经济，是否能基本满足用户对信息的需求。

（三）测定检索工具的完整性检索工具的质量直接关系到检索效果，利用布氏定律，可以测定文摘、索引等书目类检索工具的完整性。

其具体作法是：①统计要校验的文摘或索引的实际款目数量和摘引的期刊数量；②根据从实际统计中得到的某学科期刊n和R（n）的一组数据，利用R（n）= Klogn，求出期刊总数（N= K）；再根据公式R（N）= KlogN求出该学科的论文总数；③通过实际值与理论计算值的比较，便能测定其完整性。

信息分析第八讲信息计量方法

前1000种期刊
78%引文条目
前2000种期刊
84%引文条目
540种期刊被引>1000
952种期刊被引>400
结论：被引文献高度集中于少数期刊中。
加氏定律主要内容：
对于整个自然科学而言，多学科的核心期刊总和不会超过1000种，甚至可能只有500种，则引文在期刊中的集中与分散程度因学科与专业而定。
中南大学开放式精品示范课堂
第八讲定量分析方法（四）信息计量学方法
我国竞争情报与知识管理研究现状
核心作者？热点研究领域？核心期刊？
主要研究机构？发展趋势？地区分布？
信息流特性
静态特性
动态特性
2020/2/1
静态特性：一定时间内信息在空间的分布性质
学科
地域分布类型
厅局级县处级中文
六、引文分析的主要研究内容
引文量的分析引文的各种分布特征的分析
引文量按被引作者的分布引文量按文献类型的分布引文量按年代的分布引文量按语种的分布引文量按国别的分布引文量按学科的分布引文量按期刊的分布
1、引文量分析
年份 2008 2009 2010 2011 2012 2013 2014
英文
科级俄文主任科员日文科员
图内书中科国
期刊
美国
外科
学位论文
日本
语种
儿英会科国议文献澳大利专亚利妇文献科
2020/2/1
4
动态特性：信息随时间的延续而增长老化的性质时间
2001
2003
2005
2007
2009
2011
2020/2/1
5
1、文献计量学 3、电脑（网络）计量学

信息计量学重点总结

信息计量学重点总结信息计量学概念：是应用数学和统计学方法对科学活动中的信息过程、信息现象和信息规律进行描述和研究的一门学科。

信息计量学主要内容：三个应用范围（核心期刊的测定、信息资源的管理、科学评价），四个方法（引文分析法、信息统计分析法、数学模型分析方法、计算机辅助分析方法），五个定律（增长规律、老化规律、集中与分散规律、著者分布规律、词频分布规律）第一章绪论“信息计量学”（原称“情报计量学”）名称最早是由德国学者布莱克特和西格尔以及昂托·纳克教授在1979年最先提出来的。

1923年，英国学者休姆首次使用了“统计书目学”术语，标志着信息计量这一学科的最早开始。

信息计量学与文献计量学和科学计量学之间的关系：相同之处表现在：研究对象方面，研究内容方面，研究方法方面差异：研究目的方面，研究对象方面，研究内容方面，研究方法方面信息计量学的发展趋势：(1)理论研究(2)规律研究(3)研究方法和手段(4)分支学科网络信息计量学(5)拓宽信息计量学的应用领域第二章信息计量学的理论基础掌握马太效应马太效应的结果——成功产生成功第三章科学信息的增长规律人物：普赖斯科学知识增长与科学文献增长的关系：(1)科学文献是科学知识的载体，是科学知识内容的客观记录；（2）科学知识的增长是科学信息增长的直接原因；（3）科学文献的数量增长情况直接反应科学知识增长的变化，所以科学文献的数量是衡量科学知识量的重要尺度之一；（4）科学文献作为科学知识主要的载体形式，它的变化情况可以作为直接反应科学发展的重要标志；（5）科学知识增长和科学文献增长具有同步性，其增长规律也具有很大的相似性。

科学信息增长模型：线性增长模型，指数增长模型，逻辑增长模型指数增长的数学模型：F(t)=ae bt(a>0,b>0) ,a为时间常数，统计的初始时刻（t=0）文献量；b为时间常数，即持续增长率。

指数增长模型中文献量的计算：文献量翻番时间（k=2）设t1,t2的信息总量为F(t1)、F(t2),且F(t2)=2 F(t1)，则有ae bt2 =ae bt1△T= t2- t1=ln2/b=0.6931 文献年增加量△F(t)=F(t)(eb-1) =(eb -1)aebt第四章科学信息的老化规律科学文献老化的测度指标：半衰期与普赖斯指数，两者的异同(概念、功能、数值、使用范围)巴尔顿—凯普勒老化方程（巴－凯方程）的标准公式：科学文献增长与科学文献老化的关系：（1）科学文献的增长和老化从不同方面阐释科学的进步（2）科学文献的增长是促成科学文献老化的重要因素（3）在学科的不同发展阶段科学文献增长和老化速度不同第五章科学信息的集中与分散规律创始人：布拉德福区域划分：如果将一定时间内的按某种学科载文量等级排列的期刊划分为三个区，使每个区所包含的相关论文数量相等，即恰好等于全部期刊发表的该学科文章总数的1/3，则可发现，第一区（核心区）所涉及的文章来自数量不多但效率最高的n 1种期刊；第二区（相关区）包括数量较大、效率中等的n 2种期刊；第三区（外围区）包括数量最大而效率最低的n 3种期刊。

《信息计量学概论》课件

《信息计量学概论》PPT 课件
欢迎来到《信息计量学概论》课件。本课程将介绍信息计量学的概念、历史、重要性、应用领域以及研究方法。让我们一起探索这个令人着迷的领域。
课程介绍
在这一部分，我们将介绍《信息计量学概论》课程的背景和目标，以及课程的结构和学习方法。
信息计量学的概念
了解信息计量学是什么以及它研究的是什么类型的信息。了解信息计量学的基本概念和定义。
信息计量学的历史
了解信息计量学的发展历程，从最早的信息计量研究到现代信息计量学的诞生。
信息计量学的重要性
探讨信息计量学在解决信息科学、数据分析和决策制定中的重要性。了解信息计量学对个人和组织的影响。
信息计量学的应用领域
探索信息计量学在不同领域的应用，包括社交媒体分析、网络数据挖掘和信息检索。
信息计量学的研究方法
了解信息计量学研究所使用的方法和工具，包括统计分析、数据可视化和机器学习技术。
课程总结
学生继续探索信息计量学的世界。

信息计量与科学计量

一、为什么区分“信息计量学”与“科学计量学和文献计量学”文献计量学、科学计量学和信息计量学这三个计量学科术语在国际上第一次正式并列是在1989年。

信息计量学在这之前是作为一个笼统的研究领域被包括在文献计量学和科学计量学之中。

真正被承认的时间是1987年在比利时召开的“文献计量学和信息检索的理论问题国际会议”上，其主要由英国著名的信息科学家布鲁尔斯提出来的。

在信息计量学正式提出以前，“文献计量学”和“科学计量学”术语时，一般作为同义语使用，二者界限相当模糊。

“信息计量学”术语在得到信息科学家及图书馆学家、科学学家承认以后，是否还能继续把文献计量学、科学计量学和信息计量学这三个术语当成同义语来使用呢。

对于这三门计量学科的界限是否还能继续模糊下去呢？对于这些疑问，信息计量学研究者比文献计量学和科学计量学的研究者更关心。

信息科学家布鲁克斯觉得，如果不能对这三门计量学科的联系和区别给予一个明确的回答，信息计量学术语就只能是感情上的而不能是科学上的。

对这三门计量学科的联系和区别的回答，有助于澄清过去对文献计量学和科学计量学的模糊解释事进一步明确这三门计量学科的联系和区别，也有助于它们各自的健康发展，充分发挥各自的研究特长。

二、“信息计量学”和“科学计量学”“文献计量学”的起源（一）文献计量学文献计量学历史可追溯到本世纪初欧洲和俄国学者对书目引文的统计分析,但其正式形成是以“文献计量学”术语的提出为标志。

1969年，美国目录学家阿伦·普里查德在一篇专门辨析“统计目录学”与文献计量学的文章中，明确提出用“文献计量学”取代含义模糊不清的传统“统计目录学”。

新创的术语立即受到图书馆学家和刚刚拥有“信息科学”称呼的信息科学家的普遍欢迎。

从此以后,两者在引文分析、文献失效或老化、布拉德福定律等共同关心的领域都进行了大量卓有成效的研究。

虽然西方图书馆学家和信息科学家在对文献计量学的研究中也产生了分歧，但在共同研究的10多年里都能保持求同存异、共同发展。

6.信息计量方法

3. 1934年，英国情报文献学家布拉德福(S．C．Bradford)研究了文献的集中与离散规律，提出了定量描述文献序性结构的经验定律，即布拉德福定律。
4. 1935年，美国语言学家齐普夫(G．K．Zipf)通过大量的统计分析工作，发现了文献中词频分布的规律，即齐普夫定律。
5.1958年起，贝尔纳(J．D．Bernal)、伯顿(R．E．Burton)和开普勒(R．W．Kebler)先后提．出了文献的“半衰期”概念，并用定量化的半衰期计算方法描述了文献的老化现象。
衡量科学生产力的一项指标
二、文献计量学方法的理论基础（一）洛特卡定律
数据源
美国《化学文摘》
1907～1916年10年累积索引中的部分作者，姓氏以字母A和B开头的6 891位作者。
分别列出发表过1篇、2篇，一直到346篇论文的人数。
德国奥尔巴赫《物理学史一览表》
包括了1900年前物理学领域内出现的1 325位物理学家及其论著，取其全部数据进行统计。
第一节信息计量学概述二、信息计量学的定义与范围
(三)医学信息计量的工具
3.中国生物医学文献数据库:中国医学科学院医学信息研究所开发研制的综合性卫生信息资源书目数据库。
收录了1978年以来1600多种中国医学期刊，以及汇编、会议论文的文献题录。
第一节信息计量学概述二、信息计量学的定义与范围
第一节信息计量学概述二、信息计量学的定义与范围
(一)、信息计量学的定义
信息计量学是应用数学和统计学方法对科学活动中的信息过程、信息现象和信息规律进行描述和研究的一本学科
包含以下几点： 1.信息计量学是一门独立的学科 2.信息计量学以数学和统计学等定量方法为研究手段 3.信息计量学的研究内容是信息过程、信息现象、信息规

信息分析方法ppt课件

15
完整版ppt课件 16
完整版ppt课件 17
完整版ppt课件 18
类别
定性分析法
定量分析法
方法举例
对比与类比分析推理综合抽象因果关系类
计量经济学模型方法、投入产出法
趋势外推类
回归分析法、时间序列分析法
变量变换类
主成分分析法、因子分析法、典型相关分析法
定性—定量转化类
特尔菲法、层次分析法、交叉影响法
13
20世纪60年代以后
完整版ppt课件
信息分析方法体系的逐渐形成是从20世纪60年代之后开始的。究其原因，有以下几个方面：
第一、随着科学技术和经济的不断发展和相互融合，社会的不断进步，信息分析领域与内容也随之扩大和深化。
第二、现代科学学科与方法的创立、发展和移植为信息分析方法体系的建立提供了条件。以信息论、控制论、系统论为代表的“旧三论”和以耗散结构理论、协同论、突变论为代表的“新三论”成为几乎适用于所有学科、领域的一般方法。
因此在我国对信息分析方法体系的研究还有待进一步深入。
11
完整版ppt课件
1、信息分析方法的历史发展
信息分析方法是随着信息分析工作实践的深入和展开逐步形成的。其发展历史大致可以分为两个阶段。
☆ 20世纪60年代前 ☆ 20世纪60年代以后
12
20世纪60年代前
完整版ppt课件
早期信息分析工作与科学研究密不可分，是直接为科研服务的。在从19世纪70年代到第二次世界大战的现代科学技术时期，由于科研人员不可能依靠自己的力量来完成科学信息的收集、整理、查阅工作，所以就有一部分专门人员来从事这一工作，对科学技术信息进行收集、整理、加工并提供服务。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

对象：科学研究本身（投入、产出、过程）；文献、事实、事件方法：数理统计+信息技术性质：定量研究目的：揭示科学活动数量上的规律性，为决策服务
典型的科学计量学问题和内容
资金：科研资金投入的最优化人才：科研人才培养、科研主体实力考察产出：科学绩效和科研评价学科：研究重点、发展趋势、学科之间的关系 (多学
中南大学开放式精品示范课堂
第九讲定量分析（五）科学计量学
知识学习要点
一. 科学计量学的定义二. 科学计量学的发展历史三. 科学计量学的作用四. 科学计量学的具体应用五. 科学计量学的局限性
一. 科学计量学的定义
科学计量学是一门运用数理统计和信息技术方法对科学活动的投入、产出和过程进行定量分析，从中找出科学活动规律性的一门科学学分支学科
尤金·加菲尔德：《科学引文索引》 1965年
布拉德福定律
如果将科学杂志按其刊载某个学科主题的论文数量，以递减顺序排列，就可以在所有这些杂志中区分出载文率最高的核心区和包含着与核心部分同等数量论文的随后几区，这时核心区和后继各区中所含的杂志数成1：a：a2…的关系。
洛特卡定律：
写2篇论文的作者大约是写1篇论文作者数量的 1/4，写3篇论文的作者数量大约是写1篇论文作者数量的1/9，写n篇论文的作者数量大约是写1篇论文作者数量的1/n2，所有写1篇论文的作者所占比例大约是60%。
Scientometrics的创刊1978年普赖斯奖的设立1984年
2. 引文分析发展迅速（数量、结构） 3. 数学模型广泛建立 4.ientometics（1978）
性质：国际性权威杂志主办：荷兰Elsevier科学出版公司、匈牙利科学院出版社主编：普赖斯（美国）、加菲尔德（美国）、布劳恩
科、跨学科、交叉学科）
四元素组合：科学研究的生产率、科技政策分析制定
应用数学方法解决实际问题有三个基本环节
1、将实际问题抽象为数学模型 2、求解数学模型 3、对数学模型的解作出解释和评价，形成原问题的解
实际问题
数学抽象
数学模型
有无解？
求解
实际问题的解
解释和评价
模型的解
举例：国家科研基金发放给什么年龄段的人？
指数越大，老化越快。自然科学>社会科学
论文间引证与被引证关系
《科学论文的网络》1965
施引方面：15篇ref/篇论文，引用n篇ref的论文几乎呈1/n2下降被引方面：被引次数越多的文献越少，且当n值较大时，被引
论文数量呈n2.5或n3.0递减
在某一年中，被引和施引之间存在一种平衡，即引文网络图。在网络图中，必然有密集分布的小条或小块。若研究清楚，就可绘制科学“地形图”。
fn=c/n2
齐夫定律
如果将一篇较长的文章中的每个词按其出现频次递减排列，并用自然数给这些词编上等级序号，出现频次最高的词为1级，其次为2….这样一直到D级，如果用f表示词在文章中出现的频次，用r表示词的等级序号，则有f. r = c
科学计量学的理论框架
《巴比伦以来的科学》，1961年，普赖斯在耶鲁大学系列讲座的讲演集。在第五讲中系统地阐述了科学增长的指数规律。
数学模型：针对或参照某种事物系统的特征或数量依存关系，采用数学语言，概括地或近似地表现出来的一种数学结构。
常用的数学模型：微积分方程、图论、几何模型等
常用的软件：SPSS、Bibexcel、Wordsmith Tool CiteSpace
对模型解的解释和评价
1、解释计量结果，要讲严密的逻辑 2、应遵循同类相比的原则，不可盲目比较 3、宏观的数据比较可靠 4、科学计量结果的解释非原问题的唯一解答
（匈牙利）、多勃罗夫（苏联）
刊登：科学学、科学交流、科学政策的定量研究
Scientometics（1978）
“我希望，新期刊的创办，将会产生一种控制论上的正反馈，并且帮助我们大家相互了解各自的研究工作。归根结底，期刊杂志与其说是让人看的，还不如说是为了让人发表文章的。我觉得，在我们这个无形学院范围内，应当形成一个大约二三百人的核心。”
科学领域内的文献是按指数增加的，每隔大约10-15年便增加1倍。每年增长约5%-10%
N=a0ebt
N: 科学期刊的逐年累积数量 t：以年为单位的时间变量 b: 期刊的连续增长率 a0：期刊统计初始的累计量
发现经过：《伦敦皇家学会哲学论坛》1949、新加坡《化学文摘》等30多种期刊验证文献量-时间的增长曲线
科学计量学之父— 德里克·普赖斯（1922-1983）
1. 发现科学增长指数规律 2. 提出论文间引证与被引证关系 3. 创立反映文献老化程度的普赖斯指数 4. 提出普赖斯定律 5. 发展其他经典定律 6. 担当Scientometrics编委
二. 科学计量的发展史
科学计量学的发展时期
1. Scientometrics的创刊和普赖斯奖的设立
科学计量学的理论框架
《小科学，大科学》1963年，普赖斯在布鲁克海文国家实验室作的讲演集。定量地描述科学的发展（三大经典定律、普赖斯定律、科学论文半衰期）。
普赖斯定律——高产作者：
撰写全部科学论文数量一半的杰出科学家人数等于全部科学工作者人数的平方根
普赖斯指数——文献老化程度：
某一知识领域内，年限不超过五年的文献的引文数量与引文总量之比。用以量度文献的老化速度和程度。
科学计量学的奠基时期
1、几个经典理论的发现
1926年洛特卡定律：作者分布规律 1934年布拉德福定律：文献集中与分散规律 1935年齐夫定律：词频分布规律
fn=c/n2 1：a：a2… f. r = c
2、两件奠基性大事
德里克·普赖斯：《巴比伦以来的科学》1961年《小科学，大科学》 1963年
二、科学计量的发展史
科学计量学的萌发时期
1、对科学家的统计
德堪多[瑞士]：《二百年来科学和科学家的历史》1873年高尔顿[英国]：《遗传天赋》1869年《英国科学家》1874年
2、对科学论文的统计
科尔、伊尔斯：《比较解剖学的历史》 1917年休姆[英国]：《国际科技文献目录》期刊时序分布 1923年