信息计量学课件03_第2章之1
合集下载
《信息计量学概论》课件

信息计量学的数学基础
概率论与数理统计
信息计量学中经常使用概率论和数理统计的方法来研 究信息的分布、变化和推断。
集合论
集合论是信息计量学中描述信息集合、集合关系和集 合变化的数学工具。
信息论
信息论是信息计量学的核心理论,用于研究信息的度 量、传递和变换。
信息计量学的信息源分析
信息源类型
信息计量学对各种信息源进行分类和 特征描述,包括文献、数据、图像等 。
VS
信息计量学还可以用于品牌管理和产 品定位方面,通过对品牌知名度和产 品定位进行分析和评估,可以了解品 牌竞争力和产品优劣势,为品牌管理 和产品定位提供科学依据。
05
信息计量学的未来发展
信息计量学与其他学科的交叉研究
计算机科学
信息计量学与计算机科学在 数据挖掘、算法设计等方面 有交叉,共同研究信息处理 和知识发现。
01
信息失真是指信息在传递过程中出现的偏差、错误或
损失,导致接收到的信息与原始信息不一致。
信息失真的原因
02 信息失真的原因有多种,如信号干扰、传输错误、媒
体损失等。
信息失真的度量
03
信息失真的度量可以采用相似度或相关性度量方法,
比较原始信息和接收到的信息的相似程度或相关性。
03
信息计量学的方法论
大数据时代的信息计量学研究
数据挖掘
利用大数据技术对海量数据进行挖掘和分析 ,发现隐藏在数据中的模式和关联。
语义网技术
研究如何将非结构化信息转化为结构化数据 ,提高信息检索和知识发现的效率。
数据可视化
利用可视化技术将复杂数据以直观方式呈现 ,帮助用户更好地理解和分析数据。
数据质量管理
研究如何提高数据质量,确保数据分析的准 确性和可靠性。
计量基础知识详解ppt课件

直到19世纪中叶清朝末期,米制正式传入 我国为止,两千多年的历代封建王朝的度量衡 制度,基本上是沿用了秦制。
西北铅锌冶炼厂维修车间
计量工作简史
1949年中华人民共和国成立后,设立度量衡处,负 责全国的度量衡统一管理工作。
1954年设立国家计量局。 1959年6月25日,国务院发布了《关于统一我国计 量制度的命令》,确定米制为我国基本计量制度。 1977年我国正式参加国际米制公约组织。 1984年2月27日国务院发布《关于在我国统一实行 法定计量单位的命令》。 1985年全国人大通过《中华人民共和国计量法》 1987年1月19日,国务院通过《中华人民共和国计 量法实施细则》。
计量基础知识
2、测量的方式:
根据结果的获得方式分:直接和间接测量; 直接测量:它是指直接从测量仪表的读数获
取被测量量值的方法。 间接测量:利用直接测量的量与被测量之间
的函数关系,间接得到被测量量值的测量方 法。
计量基础知识
3、计量和测量的关系 测量不具备,也不必具备计量所有的特点, 即准确性、一致性、溯源性及法制性。 计量是与测量结果置信度有关,是与不确定 度联系在一起的规范性测量。 计量属于测量,又严于测量。
单位名称和符号必须作为一个整体使用,不 得拆开。 [20℃_20摄氏度(正确)/摄氏20度(错误)] 单位名称和符号必须置于整个数值之后,一 般只能用一个单位表示一个量。 [20~30m(正确)/20m~30m(错误);1.7米(正 确)/1米7(错误)]
计量基础知识
⑵关于词头的规则 词头永远紧接单位,其间不得插入其他词。 [km2_平方千米(正确)/千平方米(错误)]
声学计量; 光学计量; 电离辐射计量;
计量基础知识
第二节 计量法相关内容 1、计量法的基本内容 计量立法宗旨 调整范围 计量单位制
西北铅锌冶炼厂维修车间
计量工作简史
1949年中华人民共和国成立后,设立度量衡处,负 责全国的度量衡统一管理工作。
1954年设立国家计量局。 1959年6月25日,国务院发布了《关于统一我国计 量制度的命令》,确定米制为我国基本计量制度。 1977年我国正式参加国际米制公约组织。 1984年2月27日国务院发布《关于在我国统一实行 法定计量单位的命令》。 1985年全国人大通过《中华人民共和国计量法》 1987年1月19日,国务院通过《中华人民共和国计 量法实施细则》。
计量基础知识
2、测量的方式:
根据结果的获得方式分:直接和间接测量; 直接测量:它是指直接从测量仪表的读数获
取被测量量值的方法。 间接测量:利用直接测量的量与被测量之间
的函数关系,间接得到被测量量值的测量方 法。
计量基础知识
3、计量和测量的关系 测量不具备,也不必具备计量所有的特点, 即准确性、一致性、溯源性及法制性。 计量是与测量结果置信度有关,是与不确定 度联系在一起的规范性测量。 计量属于测量,又严于测量。
单位名称和符号必须作为一个整体使用,不 得拆开。 [20℃_20摄氏度(正确)/摄氏20度(错误)] 单位名称和符号必须置于整个数值之后,一 般只能用一个单位表示一个量。 [20~30m(正确)/20m~30m(错误);1.7米(正 确)/1米7(错误)]
计量基础知识
⑵关于词头的规则 词头永远紧接单位,其间不得插入其他词。 [km2_平方千米(正确)/千平方米(错误)]
声学计量; 光学计量; 电离辐射计量;
计量基础知识
第二节 计量法相关内容 1、计量法的基本内容 计量立法宗旨 调整范围 计量单位制
信息计量学概论PPT课件

30
2.3.3 信息计量学与文献计量学
从信息计量学的概念和内容体系来看:
信息计量学与文献计量学彼此交叉渗透; 又有着不尽相同的地方:
➢ 研究对象不同 ➢ 研究范围不同 ➢ 任务和方法有区别
31
2.3.4 信息计量学与科学计量学
从研究目的来看 从研究对象和方法来看 信息计量学和科学计量学有很大的区别:
统计书目学
– 1923年 Hulme E.W. Statistical bibliography in relation to the growth of modern civilization. London,England,1923
文献计量学
– 1969年 Prichard A. Statistical bibliography or bibliometrics? Journal of Documentation,1969,25(4):348
会”(Committee on Informatics,FID/IM)
洛特卡 (Lottka)
布拉德福(Bradford):“专门学科的情报源” 1934年 英国《工程》杂志
齐普夫 (Zipf)
Science Since Babylon ( Yale Univ Pr,, 1961)
Little Science, Big Science (Columbia Univ Pr,1963)
1.2 信息计量学的产生背景
信息计量学是在传统文献计量学及科学计量学的 基础上扩展和演变而成的;
信息计量学是信息学发展的需要和必然产物; 信息计量学拥有一批杰出的学科带头人和骨干力量。
7
1.2信息计量学的形成与发展
(1)信息量化研究的前期实践
2.3.3 信息计量学与文献计量学
从信息计量学的概念和内容体系来看:
信息计量学与文献计量学彼此交叉渗透; 又有着不尽相同的地方:
➢ 研究对象不同 ➢ 研究范围不同 ➢ 任务和方法有区别
31
2.3.4 信息计量学与科学计量学
从研究目的来看 从研究对象和方法来看 信息计量学和科学计量学有很大的区别:
统计书目学
– 1923年 Hulme E.W. Statistical bibliography in relation to the growth of modern civilization. London,England,1923
文献计量学
– 1969年 Prichard A. Statistical bibliography or bibliometrics? Journal of Documentation,1969,25(4):348
会”(Committee on Informatics,FID/IM)
洛特卡 (Lottka)
布拉德福(Bradford):“专门学科的情报源” 1934年 英国《工程》杂志
齐普夫 (Zipf)
Science Since Babylon ( Yale Univ Pr,, 1961)
Little Science, Big Science (Columbia Univ Pr,1963)
1.2 信息计量学的产生背景
信息计量学是在传统文献计量学及科学计量学的 基础上扩展和演变而成的;
信息计量学是信息学发展的需要和必然产物; 信息计量学拥有一批杰出的学科带头人和骨干力量。
7
1.2信息计量学的形成与发展
(1)信息量化研究的前期实践
《信息计量学概论》课件

《信息计量学概论》PPT 课件
欢迎来到《信息计量学概论》课件。本课程将介绍信息计量学的概念、历史、 重要性、应用领域以及研究方法。让我们一起探索这个令人着迷的领域。
课程介绍
在这一部分,我们将介绍《信息计量学概论》课程的背景和目标,以及课程 的结构和学习方法。
信息计量学的概念
了解信息计量学是什么以及它研究的是什么类型的信息。了解信息计量学的基本概念和定义。
信息计量学的历史
了解信息计量学的发展历程,从最早的信息计量研究到现代信息计量学的诞 生。
信息计量学的重要性
探讨信息计量学在解决信息科学、数据分析和决策制定中的重要性。了解信息计量学对个人和组织的影 响。
信息计量学的应用领域
探索信息计量学在不同领域的应用,包括社交媒体分析、网络数据挖掘和信 息检索。
信息计量学的研究方法
了解信息计量学研究所使用的方法和工具,包括统计分析、数据可视化和机器学习技术。
课程总结
学生继续探索信息计量学的世界。
欢迎来到《信息计量学概论》课件。本课程将介绍信息计量学的概念、历史、 重要性、应用领域以及研究方法。让我们一起探索这个令人着迷的领域。
课程介绍
在这一部分,我们将介绍《信息计量学概论》课程的背景和目标,以及课程 的结构和学习方法。
信息计量学的概念
了解信息计量学是什么以及它研究的是什么类型的信息。了解信息计量学的基本概念和定义。
信息计量学的历史
了解信息计量学的发展历程,从最早的信息计量研究到现代信息计量学的诞 生。
信息计量学的重要性
探讨信息计量学在解决信息科学、数据分析和决策制定中的重要性。了解信息计量学对个人和组织的影 响。
信息计量学的应用领域
探索信息计量学在不同领域的应用,包括社交媒体分析、网络数据挖掘和信 息检索。
信息计量学的研究方法
了解信息计量学研究所使用的方法和工具,包括统计分析、数据可视化和机器学习技术。
课程总结
学生继续探索信息计量学的世界。
最新信息计量学课件03-第2章之1PPT课件

科学知识量翻番情况
其他原因:社会、教育、材料和加工技术等因素
11
2.1.3 反映科学发展的指标
科学文献数量的变化,是反映科学发展情况的 一个重要标志。
其他指标:
人员的数量 机构的数量 资金的数量
12
2.1.4 两个结论
1. 科学知识的增长与科学文献数量的增长并不 是完全等同的。
① 科学知识量的增长并不是科学文献增长的惟一 原因。
32
2.3.3.3重要指标的计算(II)
2. “翻倍时间 d”
d = ln2 / b ≈ 0.693 / b
“翻倍时间”与“持续增长率”成反比。
3. “增长到K倍所需的时间ΔT”
ΔT = lnK / b
33
2.3.4 指数增长模型分析(I)
1. 几何性质分析
F(t)
F(t)
F(t)=aebt
t b值不同
在指数增长模型中,b为常数;
r = ( F(t2) - F(t1) ) / F(t1)
r:年增长率( t2 – t1 =1年);
r = eb – 1 ≈ b
“年增长率”近似等于“持续增长率”。
例题:设某一时刻,某一学科的文献量为10000件, 文献年增长率为10%,那么10年以后的文献量是 多少?100年以后呢?
35
2.3.4 指数增长模型分析(III)
3. 成因分析
指数增长规律的成因:事物的增长速度与现存该事物 的数量成正比。
“指数增长规律”反映了事物“持续生产自我”的过程。 只有当事物的“持续增长率”为常数时,才满足“指数增
长规律” 。(其中,持续增长率=总量增加速度 / 总量)
科学文献指数增长的原因:科学文献的增长速度是 与现存的科学文献的数量成正比的。
信息计量学课件04第2章之文献信息增长规律

② 当t很大时,逻辑曲线趋向于一个固定值k;
此后不管经过多长时间,文献的累积量只能无限地 接近一个固定的数值,但永远不会越过这一极限。
③ 逻辑曲线的增长速度在拐点处开始趋缓;
逻辑增长曲线的拐点坐标为(lna/kb, k/2),最 大增长速度为bk2/4。
5
2.4.2 文献信息逻辑增长模型(IV)
10
2.5文献信息增长的其他数学模型
2.5.1 线性增长模型 2.5.2 分级滑动指数模型 2.5.3 其他模型
11
2.5.1 线性增长模型(I)
F(t) = a + bt
(a, b>0)
F(t): 时间t时的文献累积数,一般指t年的文献累积数;
b: 单位时间内的文献增长量,一般指年增长量;
F(t)= k / (1+ae-kbt)
(k, a, b>0)
F(t):t年的文献累积量;
k:当t→∞时文献的累积量,即文献累积量之最 大值;
a, b:条件参数
F(t)
B
y
A
0
T
t
4
2.4.2 文献信息逻辑增长模型(III)
主要特性:
① 当t较小时,逻辑曲线与指数曲线相似;
在曲线的最初阶段,科技文献是近似地按照指数规 律增长的。
20
2.5.2 分级滑动指数模型 (V)
表达式一: F(t) =
[ aebt ]λ (λ=1, ¾, ½,¼ ) ln(aebt) (λ=0 )
F(t):时刻t的文献累积量;
t:时间(一般以年为单位);
a, b:条件常数;
λ:质量等级指标
λ= 1 :起码是常规文献(实际代表了全部文献)
λ= 0:第一级(头等重要的)文献
此后不管经过多长时间,文献的累积量只能无限地 接近一个固定的数值,但永远不会越过这一极限。
③ 逻辑曲线的增长速度在拐点处开始趋缓;
逻辑增长曲线的拐点坐标为(lna/kb, k/2),最 大增长速度为bk2/4。
5
2.4.2 文献信息逻辑增长模型(IV)
10
2.5文献信息增长的其他数学模型
2.5.1 线性增长模型 2.5.2 分级滑动指数模型 2.5.3 其他模型
11
2.5.1 线性增长模型(I)
F(t) = a + bt
(a, b>0)
F(t): 时间t时的文献累积数,一般指t年的文献累积数;
b: 单位时间内的文献增长量,一般指年增长量;
F(t)= k / (1+ae-kbt)
(k, a, b>0)
F(t):t年的文献累积量;
k:当t→∞时文献的累积量,即文献累积量之最 大值;
a, b:条件参数
F(t)
B
y
A
0
T
t
4
2.4.2 文献信息逻辑增长模型(III)
主要特性:
① 当t较小时,逻辑曲线与指数曲线相似;
在曲线的最初阶段,科技文献是近似地按照指数规 律增长的。
20
2.5.2 分级滑动指数模型 (V)
表达式一: F(t) =
[ aebt ]λ (λ=1, ¾, ½,¼ ) ln(aebt) (λ=0 )
F(t):时刻t的文献累积量;
t:时间(一般以年为单位);
a, b:条件常数;
λ:质量等级指标
λ= 1 :起码是常规文献(实际代表了全部文献)
λ= 0:第一级(头等重要的)文献
2信息计量学的理论1

2. 检验数学模型方法
四、利用模型进行分析
1. 对过去历程的评价分析
1. 自身在过去各段不同的历史时期的比较分析 2. 不同的对象在过去历程中的比较分析
2. 对未来发展趋势的预测
1. 自身在未来一段时间发展趋势的预测 2. 不同对象在未来一段时间发展趋势的比较预测
2-.3 文献(信息)计量技术
一.文献数据收集方法
• • • • •
常用于统计: 1.词频统计 2.论文统计 3.著者统计 4.引文统计
齐普夫定律统计 布拉德福定律应用 洛特卡定律应用
• 2. 时序统计法(涉及时间序列的数据) • 常用于: • 1.文献量统计 统计文献量各年度 的变化 • 2.文献利用统计 逐年统计引文频率 或流通频率 • 3.其他统计 专利申请等 • 4.各种时间问题的比较研究
第二章 信息计量学的理论基础
1 信息计量的前提和本质
1.1信息计量学的基础
信息中非确定性因素常常是信息计量学研究 的对象(申农,1948 ) 信息的特性:计量/不可计量
(1)人类信息活动发展的历程
《周易· 系辞· 上》曰:“上古结绳而治,后世易之为书 契。” 《九家易》也说:“古者无文字,其为约誓之事, 事大大其绳,事小小其绳。结之多少随物众寡,各执以相 考,亦足以相治也。”
3、数据分组整理 1. 确定组数 2. 确定组距:a≤x1≤x2≤…≤xn≤b,则组距=(b-a) /K (K为组数) 3. 确定组界 4. 确定组中值:组中值=(上组距+下组距)/2 5. 统计样本数据的频次分布
三、建立数学模型
1. 建立模型的程序
1. 选择模型类型 经验方法 :负冥型 、指数型、线形型 2. 确定参数
3
B 齐普夫 (Zipf) 5
网络信息计量学PPT课件

1817 14 25 187 11
1381 9 10 67
306 23 69 51
1479 5 8
286 48 14 861 34 3 141 33 29 92
1659 11 7 374 47 8 38 914 7 464 47 30 9434
.
表14-3 中、美、法、英等7国国家图书馆网站被连接量的发展变化情况
16
.
2.2 网络信息计量学研究的发展趋势
存在问题
实证研究多于和先于理论研究 网络信息计量学研究对象具有不确定性、
实验结果的不可重复性。 网上引用与被引用关系变得十分复杂。
17
.
发展趋势
1. 信息计量的可操作性与有效性将消除和缓解 网络时代信息无序带来的知识积累与利用间 的矛盾激化,使各学科的社会功能得以实现。
1997年因特网上出现了以“cybermetrics”命 名的电子期刊和网上学术论坛,
15
.
(三)基本状况:
基于实证和应用的研究较多,而对理论方法 的研究较少,相关的理论和方法在许多方面 至今仍然没有成熟。
基于某一方面和专题的研究较多,而从整体 上进行综合分析的较少,缺乏系统的研究。
基于一般性的问题介绍较多,而对某一方面 的深入研究较少,目前还缺少具有普遍规律 意义的认识。
20
.
(一)网上日志文件数据库收集方法
1. 意义:有助于定制自己格式的日志文件, 保证其真实性和可靠性,并降低传递日志 文件所产生的网络流量,便于第三方机构 惊醒网站访问量的认证度量工作。
2. 具体方法和测度指标 (1)网站访问者的度量方法 (2)网站访问量指标的度量方法 (3)访问者特征的指标及度量的方法
T. C. Almind认为:网络信息计量学包括了 所有实用信息计量和其他计量方法对网络通信 有关问题的研究。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息计量学
—— 第二章 文献信息增长规律(1)
郑
重
zhengzhg@
2.1科学文献数量与科学发展
2.1.1 文献信息流及其特性 2.1.2 科学文献的增长 2.1.3 反映科学发展的指标
2.1.4 两个结论
2
2.1.1 文献信息流及其特性
文献信息流:具有一系列主题特征的科学文献的集合。
F(t)
400 300 200 100 t
32
2.3.3.3 重要指标的计算(I)
1. ―持续增长率 b‖ 与 “年增长率 r‖ b = ( dF(t) / dt ) / F(t)
b:持续增长率、连续增长率、增长系数; 在指数增长模型中,b为常数;
r = ( F(t2) - F(t1) ) / F(t1)
F(t)
400
300 200 100 t
30
2.3.3.2 Price的指数增长模型(II)
F(t) = aebt
F(t):时刻t的文献累积量;
(a>0,b>0)
t:时间(一般以年为单位);
a:条件常数,即统计的初始时刻(t=0)的文献量;
e:自然对数的底(e=2.7183……,有时可近似地
长作出了重要的贡献,并在许多交叉领域都取得了显著的 成就。
29
2.3.3.2 Price的指数增长模型(I)
―似乎没有理由怀疑任何正常的、日益增长的科学
领域内的文献是按指数增加的,每隔大约10年到 15年时间增加一倍”;“每年增长约5-7%”。 (Price,《巴比伦以来的科学》,1961)
普赖斯曲线
1.
①
科学知识的增长与科学文献数量的增长并不 是完全等同的。
科学知识量的增长并不是科学文献增长的惟一 原因。 科学文献数量并不是反映科学发展情况的惟一 标志。
②
2.
① ② ③
科学文献数量是最有效的科学指标。
绝大部分的人类科研活动及其成果都是以文献 方式来记录和贮存的,两者关系密切。 科学文献的数量巨大,且易于收集。 科学文献易于统计分类。
静态特性:在一定时间内科学文献在空间的分布性质。
布拉德福定律、齐普夫定律、洛特卡定律
动态特性:科学文献随时间的延续而增长和老化的性质。
文献信息增长规律、文献信息老化规律
―当前,已发表文章的增长、老化和离散规律,理
所当然地被视为标志科学文献发展的最根本的规 律。”([苏]米哈依洛夫)
8
2008-2009网络娱乐类应用用户对比
9
2.1.2 科学文献的增长(I)
随着时间的推延文献数量的增长情况。
实例:美国《化学文摘》的增长情况:
第一个100万篇 第二个100万篇 第三个100万篇 第四个100万篇 第五个100万篇
科学文献的增长(Growth of Scientific literature) :
(社会学观点)社会情报交流的影响与推动
―科学的发展同前一代人遗留下的知识量成比例。”
(恩格斯)
37
2.3.4 指数增长模型分析(IV)
4. 局限性分析
①
指数增长模型表示的是“文献累积量” (总量)与 时间(年)的关系,未能反映“非累积量”的变化 规律。
―如果按每年问世的出版物数量来判断科学文献的增长,
5
2009网络文学用户
CNNIC在本次调查中增加了网络文学应用的研究。调查结果显示,网络文 学用户规模达到1.62亿人,使用率为42.3%。
原因:
网络文学的开放性,使用户能够方便快捷的进行文字阅读, 网络文学传播的广泛性及分成的模式又刺激了作家的创作热情 网络文学受版权影响较大,盈利能力较其他互联网行业偏低,但网络文 学可以为网络游戏、电影、电视以及动漫等文化产业提供丰富的素材。从发
取为2); b:时间常数,即“持续增长率”(某一年文献的累 积增加量与前一年文献累积总数的比值)
31
2.3.3.2 Price的指数增长模型(III)
F(t) = aebt
(a>0,b>0)
F(t):时刻t的文献累积量; t:时间(一般以年为单位); a:条件常数,即统计的初始时刻(t=0)的文献量; e:自然对数的底(e=2.718……,可近似地取为2); b:时间常数,即“持续增长率”(某一年文献的累积增 加量与前一年文献累积总数的比值)
25
―指数增长规律”反映了事物“持续生产自我”
的过程。当一个量在一个既定的时间周期中, 其百分比增长是一个常量时,这个量就显示出 指数增长
只有当事物的“持续增长率”为常数时,才满
足“指数增长规律” 。
持续增长率=总量增加速度
/ 总量
26
2.3.3 文献信息指数增长模型
―知识能产生知识,就像金钱能生利息一样。”
术和设备来处理和利用文献情报。
在理论上,加强对文献增长规律的研究。
16
2.2.2文献信息增长规律的意义与内容
研究意义:
揭示科学发展的某些特点和规律。 可以预测文献增长的趋势,从而为科学情报工
作未来的发展提供决策依据。
主要内容:
理论研究:建立准确的数学模型及理论解释,以
进一步揭示科学文献的增长规律。 应用研究:运用文献增长规律指导实际情报工作 和情报管理;将文献数量指标用于度量知识,以 揭示科学发展规律等。
前的文献被忽略了,结果增长率的估计通常偏大。” (K. O. May, 1968)
④
指数增长模型只在一定的时间范围内有效,难以预 测较长时间之后的文献总量。
39
d = ln2 / b ≈ 0.693 / b
―翻倍时间”与“持续增长率”成反比。
3. ―增长到K倍所需的时间ΔT‖
ΔT = lnK / b
34
2.3.4 指数增长模型分析(I)
1. 几何性质分析
F(t) F(t)
F(t)=aebt
t b值不同 a值不同
b越大,曲线越陡;a值决定曲线的位置,不影
一生共发表论著240多件,主要有:《巴比伦以来的科学》(Science since Babylon, 1961);《小科学,大科学》(Little Science, Big Science, 1963) 《科学论文网络》(Networks of Scientific Papers, 1965)。 1976年,荣获国际技术史学会授予的达芬奇奖; 1981年,荣获国际科学社会研究学会授予的贝尔纳奖; 1983年,被遴选为瑞典皇家科学院国外院士。 在他去世后不久,《Scientometrics》设立“普赖斯 纪念奖”;美国耶鲁大学设立“普赖斯科学学奖”。 普赖斯为科学计量学和文献计量学的发展、为科学学的成
32年(1907—1938), 18年, 8年, 4.75年, 3.3年……
10
2.1.2 科学文献的增长(II)
科学知识量的急剧增长是科学文献激增的主要
原因
第一次翻番 第二次翻番 第三次翻番 第四次翻番 从公元初 一 1750年 从1750年 一 1900年 从1900年 一 1950年 从1950年 一 1960年
3
2008-2009网络游戏用户对比
4
2009年网络游戏用户规模持续增长,规模 达到2.65亿人,较2008年增长41.5%。值得关注 的是,网络游戏是所有互联网娱乐领域中唯一 使用率上升的服务,网民使用率从2008年的 62.8%提升至68.9%。 原因: 网页游戏在2009年得到了良好的发展 SNS游戏(社交类游戏)在2009年迅速崛起
r:年增长率( t2
– t1 =1年);
r = eb – 1 ≈ b
―年增长率”近似等于“持续增长率”。
例题:设某一时刻,某一学科的文献量为10000件,
文献年增长率为10%,那么10年以后的文献量是 多少?100年以后呢?
33
2.3.3.3重要指标的计算(II)
2. ―翻倍时间 d‖
那么它的进展甚至连几何性都不是,而仅仅是算术性 的。” ([苏]米哈依洛夫)
②
指数增长模型未考虑文献“老化”、“停刊”等问 题,与实际情况有出入。
38
2.3.4 指数增长模型分析(V)
4. 局限性分析
③
指数增长模型对“起始时间”很敏感,不同的统计 起点会得到不同的结果。
―在一个特定年度开始作累积曲线”,那么无疑这一年之
的比例、不同语种文献的比例…..
分类二:
非累积数(增量) 累积数(总量)
19
2009年第三季度中国电影市场研究报告
2007-2009年第三季度电影市场数据
20
21
22
23
24
2.3.2 指数函数及其特性
指数函数:自变量x在指数的位置上,y=a^x
(a>0,a不等于1) 性质比较单一, 当a>1时,函数是递增函数,且y>0; 当0<a<1时,函数是递减函数,且y>0. 幂函数:自变量x在底数的位置上,y=x^a(a 不等于1). a不等于1,但可正可负,取不同的 值,图像及性质是不一样的。
3. 成因分析
指数增长规律的成因:事物的增长速度与现存该事物
的数量成正比。
―指数增长规律”反映了事物“持续生产自我”的过程。 只有当事物的“持续增长率”为常数时,才满足“指数增
长规律” 。(其中,持续增长率=总量增加速度 / 总量)
科学文献指数增长的原因:科学文献的增长速度是
与现存的科学文献的数量成正比的。
17
2.3文献信息的指数增长规律
2.3.1 文献信息测度指标的分类 2.3.2 指数函数及其特性 2.3.3 文献信息指数增长模型
—— 第二章 文献信息增长规律(1)
郑
重
zhengzhg@
2.1科学文献数量与科学发展
2.1.1 文献信息流及其特性 2.1.2 科学文献的增长 2.1.3 反映科学发展的指标
2.1.4 两个结论
2
2.1.1 文献信息流及其特性
文献信息流:具有一系列主题特征的科学文献的集合。
F(t)
400 300 200 100 t
32
2.3.3.3 重要指标的计算(I)
1. ―持续增长率 b‖ 与 “年增长率 r‖ b = ( dF(t) / dt ) / F(t)
b:持续增长率、连续增长率、增长系数; 在指数增长模型中,b为常数;
r = ( F(t2) - F(t1) ) / F(t1)
F(t)
400
300 200 100 t
30
2.3.3.2 Price的指数增长模型(II)
F(t) = aebt
F(t):时刻t的文献累积量;
(a>0,b>0)
t:时间(一般以年为单位);
a:条件常数,即统计的初始时刻(t=0)的文献量;
e:自然对数的底(e=2.7183……,有时可近似地
长作出了重要的贡献,并在许多交叉领域都取得了显著的 成就。
29
2.3.3.2 Price的指数增长模型(I)
―似乎没有理由怀疑任何正常的、日益增长的科学
领域内的文献是按指数增加的,每隔大约10年到 15年时间增加一倍”;“每年增长约5-7%”。 (Price,《巴比伦以来的科学》,1961)
普赖斯曲线
1.
①
科学知识的增长与科学文献数量的增长并不 是完全等同的。
科学知识量的增长并不是科学文献增长的惟一 原因。 科学文献数量并不是反映科学发展情况的惟一 标志。
②
2.
① ② ③
科学文献数量是最有效的科学指标。
绝大部分的人类科研活动及其成果都是以文献 方式来记录和贮存的,两者关系密切。 科学文献的数量巨大,且易于收集。 科学文献易于统计分类。
静态特性:在一定时间内科学文献在空间的分布性质。
布拉德福定律、齐普夫定律、洛特卡定律
动态特性:科学文献随时间的延续而增长和老化的性质。
文献信息增长规律、文献信息老化规律
―当前,已发表文章的增长、老化和离散规律,理
所当然地被视为标志科学文献发展的最根本的规 律。”([苏]米哈依洛夫)
8
2008-2009网络娱乐类应用用户对比
9
2.1.2 科学文献的增长(I)
随着时间的推延文献数量的增长情况。
实例:美国《化学文摘》的增长情况:
第一个100万篇 第二个100万篇 第三个100万篇 第四个100万篇 第五个100万篇
科学文献的增长(Growth of Scientific literature) :
(社会学观点)社会情报交流的影响与推动
―科学的发展同前一代人遗留下的知识量成比例。”
(恩格斯)
37
2.3.4 指数增长模型分析(IV)
4. 局限性分析
①
指数增长模型表示的是“文献累积量” (总量)与 时间(年)的关系,未能反映“非累积量”的变化 规律。
―如果按每年问世的出版物数量来判断科学文献的增长,
5
2009网络文学用户
CNNIC在本次调查中增加了网络文学应用的研究。调查结果显示,网络文 学用户规模达到1.62亿人,使用率为42.3%。
原因:
网络文学的开放性,使用户能够方便快捷的进行文字阅读, 网络文学传播的广泛性及分成的模式又刺激了作家的创作热情 网络文学受版权影响较大,盈利能力较其他互联网行业偏低,但网络文 学可以为网络游戏、电影、电视以及动漫等文化产业提供丰富的素材。从发
取为2); b:时间常数,即“持续增长率”(某一年文献的累 积增加量与前一年文献累积总数的比值)
31
2.3.3.2 Price的指数增长模型(III)
F(t) = aebt
(a>0,b>0)
F(t):时刻t的文献累积量; t:时间(一般以年为单位); a:条件常数,即统计的初始时刻(t=0)的文献量; e:自然对数的底(e=2.718……,可近似地取为2); b:时间常数,即“持续增长率”(某一年文献的累积增 加量与前一年文献累积总数的比值)
25
―指数增长规律”反映了事物“持续生产自我”
的过程。当一个量在一个既定的时间周期中, 其百分比增长是一个常量时,这个量就显示出 指数增长
只有当事物的“持续增长率”为常数时,才满
足“指数增长规律” 。
持续增长率=总量增加速度
/ 总量
26
2.3.3 文献信息指数增长模型
―知识能产生知识,就像金钱能生利息一样。”
术和设备来处理和利用文献情报。
在理论上,加强对文献增长规律的研究。
16
2.2.2文献信息增长规律的意义与内容
研究意义:
揭示科学发展的某些特点和规律。 可以预测文献增长的趋势,从而为科学情报工
作未来的发展提供决策依据。
主要内容:
理论研究:建立准确的数学模型及理论解释,以
进一步揭示科学文献的增长规律。 应用研究:运用文献增长规律指导实际情报工作 和情报管理;将文献数量指标用于度量知识,以 揭示科学发展规律等。
前的文献被忽略了,结果增长率的估计通常偏大。” (K. O. May, 1968)
④
指数增长模型只在一定的时间范围内有效,难以预 测较长时间之后的文献总量。
39
d = ln2 / b ≈ 0.693 / b
―翻倍时间”与“持续增长率”成反比。
3. ―增长到K倍所需的时间ΔT‖
ΔT = lnK / b
34
2.3.4 指数增长模型分析(I)
1. 几何性质分析
F(t) F(t)
F(t)=aebt
t b值不同 a值不同
b越大,曲线越陡;a值决定曲线的位置,不影
一生共发表论著240多件,主要有:《巴比伦以来的科学》(Science since Babylon, 1961);《小科学,大科学》(Little Science, Big Science, 1963) 《科学论文网络》(Networks of Scientific Papers, 1965)。 1976年,荣获国际技术史学会授予的达芬奇奖; 1981年,荣获国际科学社会研究学会授予的贝尔纳奖; 1983年,被遴选为瑞典皇家科学院国外院士。 在他去世后不久,《Scientometrics》设立“普赖斯 纪念奖”;美国耶鲁大学设立“普赖斯科学学奖”。 普赖斯为科学计量学和文献计量学的发展、为科学学的成
32年(1907—1938), 18年, 8年, 4.75年, 3.3年……
10
2.1.2 科学文献的增长(II)
科学知识量的急剧增长是科学文献激增的主要
原因
第一次翻番 第二次翻番 第三次翻番 第四次翻番 从公元初 一 1750年 从1750年 一 1900年 从1900年 一 1950年 从1950年 一 1960年
3
2008-2009网络游戏用户对比
4
2009年网络游戏用户规模持续增长,规模 达到2.65亿人,较2008年增长41.5%。值得关注 的是,网络游戏是所有互联网娱乐领域中唯一 使用率上升的服务,网民使用率从2008年的 62.8%提升至68.9%。 原因: 网页游戏在2009年得到了良好的发展 SNS游戏(社交类游戏)在2009年迅速崛起
r:年增长率( t2
– t1 =1年);
r = eb – 1 ≈ b
―年增长率”近似等于“持续增长率”。
例题:设某一时刻,某一学科的文献量为10000件,
文献年增长率为10%,那么10年以后的文献量是 多少?100年以后呢?
33
2.3.3.3重要指标的计算(II)
2. ―翻倍时间 d‖
那么它的进展甚至连几何性都不是,而仅仅是算术性 的。” ([苏]米哈依洛夫)
②
指数增长模型未考虑文献“老化”、“停刊”等问 题,与实际情况有出入。
38
2.3.4 指数增长模型分析(V)
4. 局限性分析
③
指数增长模型对“起始时间”很敏感,不同的统计 起点会得到不同的结果。
―在一个特定年度开始作累积曲线”,那么无疑这一年之
的比例、不同语种文献的比例…..
分类二:
非累积数(增量) 累积数(总量)
19
2009年第三季度中国电影市场研究报告
2007-2009年第三季度电影市场数据
20
21
22
23
24
2.3.2 指数函数及其特性
指数函数:自变量x在指数的位置上,y=a^x
(a>0,a不等于1) 性质比较单一, 当a>1时,函数是递增函数,且y>0; 当0<a<1时,函数是递减函数,且y>0. 幂函数:自变量x在底数的位置上,y=x^a(a 不等于1). a不等于1,但可正可负,取不同的 值,图像及性质是不一样的。
3. 成因分析
指数增长规律的成因:事物的增长速度与现存该事物
的数量成正比。
―指数增长规律”反映了事物“持续生产自我”的过程。 只有当事物的“持续增长率”为常数时,才满足“指数增
长规律” 。(其中,持续增长率=总量增加速度 / 总量)
科学文献指数增长的原因:科学文献的增长速度是
与现存的科学文献的数量成正比的。
17
2.3文献信息的指数增长规律
2.3.1 文献信息测度指标的分类 2.3.2 指数函数及其特性 2.3.3 文献信息指数增长模型