文献计量学的方法69页PPT
合集下载
文献计量学方法(2)

2021年4月21日5时37
8
分
▪洛特卡定律及其应用
✓洛特卡定律是揭示文献著者与数量关系的基本定律,是为了 评价科学工作者的贡献,由洛特卡于1926年提出的。 ✓洛特卡定律的数学表达式为:
发表x篇论文的著者出现的频率(在所 统计的著者总数中所占的比例)
f(x)=C/X2 ≈0.6/X2
C为常数,C的极 限值为0.6079
2021年4月21日5时37
11
分
▪齐普夫定律的运用实例
❖ 电子邮件列表成员的相对价值。 按照齐普夫定律,这种网络的成员可以像齐普夫定律排列
单词那样来排序——按照你收件箱当中电子邮件的数量。每个 人所发的电子邮件都会给你收件箱的总“价值”贡献1/k,这 里的k是指每个人的排名。
2021年4月21日5时37
2021年4月21日5时37
21
பைடு நூலகம்
分
➢频数统计——一种规范性的操作,包括计数 和数据处理,需要通过大数量的统计反映统 计意义上的相关性。在内容分析中,最常用 的是词频统计。
➢结论汇总——在综合统计结果和定性分析的 基础上,得出某些结论性的看法,同时指出 所作的内容分析的适用范围或边界。
2021年4月21日5时37
2021年4月21日5时37 分
科学工作者发表 的论文数量
9
▪齐普夫定律及其应用
美国哈佛大学语言学教授齐普夫于1935年提出齐普夫定律: 在一篇足够长的文章(5000字以上)中,如果我们以单词词 频的高低进行等级排列(约定词频越高,则单词的等级越高), 词频最高的单词等级为1,次之为2,再次之为3,……,则词频 与等级之间存在着一次反比关系。
2021年4月21日5时37 分
文献计量学方法-PPT精品文档

内容分析法
补充
内容分析法(Content Analysis)是对 文献内容进行系统的定量分析的一种 专门方法,其目的一般是弄清或测度 文献中本质性的事实或趋势。
20世纪初,人们提出在一般性阅读文献获得理解 之外,采用半定量的统计方法对文献的内容进行 深入分析和解释。二战中,美国传播学家拉斯韦 尔等在进行战时军事和政治信息分析中,以德国 公开出版的报纸为分析对象,分析获取法西斯政 权重要军政机密情报,取得了出乎意料的成功, 使内容分析法显示出实际效果。60年代,前苏联 学者在社会科学研究中采用内容分析法。60年代 日本巧妙获取大庆油田的相关情报。
分 析 方 法
内容分析的 类 型
指定分析:统计分析指定的人、 事、物出现的频次。 归因分析:统计分析相关特征 贾尼斯(美国内容分析专家)划分法 的频次。如分析某人物时统计 实用内容分析——对某些主题词或特定的词汇进行统计分 其不诚实信息出现的次数。 断言分析:统计对某人、事、 析,并赋予不同的权重(如对不同的字体、版面位置、排 物作出反应的有关信息次数, 名顺序等),推断其出现的原因和可能的后果。对报纸、 以分析特定的主题(如对某项 新闻进行内容分析时,常属该类型。 政策的反应)。 语义内容分析——针对文字的语义内容,对特定词汇作统
半定量分析方法。 对大量样本进行特征识别的系统方 法,具有统计性。 可以揭示出隐性的内容。是一种从 公开资料中萃取秘密信息的方法。
确定目的 建立假设
选择样本
定义分析单元 制定分析框架 频数统计 检验假设
内容 分析 步骤 框图
结论汇总
确定目的——必须首先明确。 选择样本——力求样本信息量大,有 连续性,便于统计分析并尽可能是分 析人员所熟悉的。
应用: 主要体现在文献信息的搜集环节上。 也可用于研究某一学科发展的特点以及学科之间的交叉影响 和相互渗透关系,并以此确定某些新学科的生长点。
8文献计量学方法

2019/2/18
浙江传媒学院
9
《信息分析与 预 测 》课件
8.2 基本原理及其应用
8.2.1 布拉德福定律及其应用 8.2.2 洛特卡定律及其应用 8.2.3 齐普夫定律及其应用 8.2.4 引文分析及其应用
2019/2/18
浙江传媒学院
10
《信息分析与 预 测 》课件
8.2.1 布拉德福定律及其应用
2019/2/18 浙江传媒学院 13
《信息分析与 预 测 》课件
8.2.2 洛特卡定律及其应用
f ( x) C / x 0.6079 / x
其中1.2 3.8
该公式被称为广义的洛特卡定律。
二、应用
洛特卡定律在信息分析与预测中的应用是明显的,比如 我们可以利用它来预测著作数量与文献数量,从而便于搜集 信息、掌握文献信息流的变动规律、预测科学家数量的增长 和科学发展的规模及趋势等。 此外,在分析研究人口的分布状况和城市的比例结构等类 似的信息分析与预测工作中,洛特卡定律也有一定的应用。
2019/2/18 浙江传媒学院 14
《信息分析与 预 测 》课件
8.2.3 齐普夫定律及其应用
一、概念
齐普夫定律是揭示文献的词频分布规律的基本定律,由美 国哈佛大学语言学教授齐普夫于1935年提出的。 词频是指某一单词在文章中出现的次数。齐普夫经过大量 研究发现:在一篇足够长的文章中(5000字以上),如果我们 以单词词频的高低进行等级排列(约定词频越高,则单词的等 级越高),词频最高的单词等级为1,次之为2,再次之为 3,……则词频与等级之间存在着一次反比关系。这就是齐普 夫定律。用数学公式可表示为: f·r=C f表示某一单词的词频,r表示该单词的等级序号,C 为与样本有关的常数。
文献计量学期刊统计基本原理与方法期刊演示精品PPT课件

• 分析模型的确立,还基于分析指标的建立。分析指 标构成了对期刊进行分析的评价体系,确立一组能 够描述期刊特征的分析指标体系,对期刊进行计量 分析是非常重要的。
2006-08-21
中国民航大学 党亚茹
11
4 期刊统计分析内容
• 采用文献计量学方法对期刊进行分析,可 以对一组(如某一学科、某一国家、某一 团体、某一出版社)期刊进行分析,也可 以对一个个体期刊进行分析;可以以一年 数据为样本,也可以多年数据为样本。对 期刊的分析研究主要有两大类:期刊特征 分析和期刊影响分析。
8
• 在“万方数据——数字化期刊群”基础上 建设的“中国核心期刊遴选数据库”,不 但是中国科技信息研究所的“中国科技论 文统计与引文分析数据库”的源数据库, 并且在网上对所收录的6000余种学术技术 类自然科学期刊和理论研究类社会科学期 刊给出了期刊统计数字,编辑部人员和期 刊研究人员不但可以通过该数据库的数据 自行设计统计范围和内容,也可直接在网 上查阅到一些重要的期刊指标数据()。
2006-08-21
中国民航大学 党亚茹
9
2. 期刊统计分析的数据收集与规范
• 数据收集原则可以采用总体数据收集,也可以采 用随机抽样方式。从总体中获得的一部分数据称 为样本。由于文献统计研究不能直接观察,在收 集数据过程中,应适当控制误差,保持一定数量 的样本总量,样本量太小不能表现期刊发展的规 律;但一味考虑缩小误差,收集样本过大,则将 会导致收集数据的成本上升。数据收集好后,要 进行数据分组整理,经过数据的整理、数据的规 范和科学分类,展现出样本的规律性,然后才能 统计样本数据的频次分布。
14
2001—2005年25种基础医学类期刊栏目分布
期刊 名称
栏目类别
2006-08-21
中国民航大学 党亚茹
11
4 期刊统计分析内容
• 采用文献计量学方法对期刊进行分析,可 以对一组(如某一学科、某一国家、某一 团体、某一出版社)期刊进行分析,也可 以对一个个体期刊进行分析;可以以一年 数据为样本,也可以多年数据为样本。对 期刊的分析研究主要有两大类:期刊特征 分析和期刊影响分析。
8
• 在“万方数据——数字化期刊群”基础上 建设的“中国核心期刊遴选数据库”,不 但是中国科技信息研究所的“中国科技论 文统计与引文分析数据库”的源数据库, 并且在网上对所收录的6000余种学术技术 类自然科学期刊和理论研究类社会科学期 刊给出了期刊统计数字,编辑部人员和期 刊研究人员不但可以通过该数据库的数据 自行设计统计范围和内容,也可直接在网 上查阅到一些重要的期刊指标数据()。
2006-08-21
中国民航大学 党亚茹
9
2. 期刊统计分析的数据收集与规范
• 数据收集原则可以采用总体数据收集,也可以采 用随机抽样方式。从总体中获得的一部分数据称 为样本。由于文献统计研究不能直接观察,在收 集数据过程中,应适当控制误差,保持一定数量 的样本总量,样本量太小不能表现期刊发展的规 律;但一味考虑缩小误差,收集样本过大,则将 会导致收集数据的成本上升。数据收集好后,要 进行数据分组整理,经过数据的整理、数据的规 范和科学分类,展现出样本的规律性,然后才能 统计样本数据的频次分布。
14
2001—2005年25种基础医学类期刊栏目分布
期刊 名称
栏目类别
文献计量学方法图文

04
文献计量学在科学评价中的应用方式
文献计量指标
通过文献的被引频次、下载量、影响因子等 指标来衡量其学术价值。
学术期刊评价
利用文献计量学方法评估学术期刊的学术水 平和质量。
学科领域发展态势分析
通过文献计量学方法分析学科领域的研究热 点和发展趋势。
科研机构和学者评价
通过文献计量学方法对科研机构和学者的研 究成果进行评价。
文献计量学在科学评价中的作用
科学评价的基本原则
01
客观性原则
科学评价应以客观事实为基础,避 免主观臆断和偏见。
准确性原则
科学评价应准确反映研究对象的实 际情况,避免误导和错误。
03
02
全面性原则
科学评价应全面考虑研究对象的各 个方面,避免片面和偏颇。
可重复性原则
科学评价应具备可重复性,以便他 人验证和进一步研究。
跨文化比较研究
随着全球化的加速,跨文化比较研究成为文献计 量学的重要发展方向,有助于深入了解不同文化 背景下的学术发展状况和趋势。
文献计量学的未来展望
深化理论体系
未来文献计量学需要进一步深化和完善自身的理论体系, 明确核心概念、原理和方法,提高学科的严谨性和科学性 。
强化方法创新
随着研究问题的复杂化,文献计量学需要不断强化方法创 新,吸收借鉴其他学科的方法和技术,提高分析的准确性 和可靠性。
。
词频分析法
总结词
通过分析文献中词汇的现频率,揭示 学科领域的研究重点和发展趋势。
VS
详细描述
词频分析法是一种通过统计文献中词汇的 出现频率,来揭示学科领域的研究重点和 发展趋势的方法。这种方法可以帮助研究 者快速了解某一学科领域的热点话题和变 化趋势。
文献计量学在科学评价中的应用方式
文献计量指标
通过文献的被引频次、下载量、影响因子等 指标来衡量其学术价值。
学术期刊评价
利用文献计量学方法评估学术期刊的学术水 平和质量。
学科领域发展态势分析
通过文献计量学方法分析学科领域的研究热 点和发展趋势。
科研机构和学者评价
通过文献计量学方法对科研机构和学者的研 究成果进行评价。
文献计量学在科学评价中的作用
科学评价的基本原则
01
客观性原则
科学评价应以客观事实为基础,避 免主观臆断和偏见。
准确性原则
科学评价应准确反映研究对象的实 际情况,避免误导和错误。
03
02
全面性原则
科学评价应全面考虑研究对象的各 个方面,避免片面和偏颇。
可重复性原则
科学评价应具备可重复性,以便他 人验证和进一步研究。
跨文化比较研究
随着全球化的加速,跨文化比较研究成为文献计 量学的重要发展方向,有助于深入了解不同文化 背景下的学术发展状况和趋势。
文献计量学的未来展望
深化理论体系
未来文献计量学需要进一步深化和完善自身的理论体系, 明确核心概念、原理和方法,提高学科的严谨性和科学性 。
强化方法创新
随着研究问题的复杂化,文献计量学需要不断强化方法创 新,吸收借鉴其他学科的方法和技术,提高分析的准确性 和可靠性。
。
词频分析法
总结词
通过分析文献中词汇的现频率,揭示 学科领域的研究重点和发展趋势。
VS
详细描述
词频分析法是一种通过统计文献中词汇的 出现频率,来揭示学科领域的研究重点和 发展趋势的方法。这种方法可以帮助研究 者快速了解某一学科领域的热点话题和变 化趋势。
文献计量学方法

在情报学领域,文献计量学可以对大量的文献信息进行定量分析和评价,为决策者提供科学依据和参考 。
在科学学领域,文献计量学可以用来研究学科的发展趋势和学科结构,为科研人员提供有益的参考。此 外,文献计量学还可以应用于医学、经济学、教育学等领域。
02
文献检索与整理
文献检索的方法与技巧
明确研究主题和关键词
02
03
归纳比较法
逻辑分析法
将文献与已有研究进行比较,评 估其是否具有创新性和学术价值 。
通过对文献的逻辑结构、推理过 程进行分析,评估其学术价值和 可信度。
混合评价方法
综合评价法
将定量和定性评价方法结合起来,综合评价文献的学 术价值和影响力。
主成分分析法
通过数学变换将多个指标简化为少数几个主成分,以 更全面地反映文献的学术价值。
主题分析法
总结词
主题分析法是一种通过分析文献主题来研究学科领域发展动向和趋势的方法。
详细描述
主题分析法利用文献主题来分析学科领域的发展趋势和动态变化。通过对文献的主题内容进行分类、统计和分析 ,可以揭示学科领域的主要研究主题、热点和前沿领域等。
内容分析法
总结词
内容分析法是一种通过分析文献内容来研究 学科领域发展动向和趋势的方法。
文献计量学方法
2023-11-08
contents
目录
• 文献计量学概述 • 文献检索与整理 • 文献评价方法 • 文献计量学分析方法 • 文献计量学软件工具 • 文献计量学研究案例
01
文献计量学概述
文献计量学的定义
文献计量学是一门采用数学、统计学等计量方法研究文献信息的学科。它以文献为研究对象,通过对 文献的数量、分布、流动和利用情况进行定量分析,以揭示文献信息之间的相互联系和规律性。
在科学学领域,文献计量学可以用来研究学科的发展趋势和学科结构,为科研人员提供有益的参考。此 外,文献计量学还可以应用于医学、经济学、教育学等领域。
02
文献检索与整理
文献检索的方法与技巧
明确研究主题和关键词
02
03
归纳比较法
逻辑分析法
将文献与已有研究进行比较,评 估其是否具有创新性和学术价值 。
通过对文献的逻辑结构、推理过 程进行分析,评估其学术价值和 可信度。
混合评价方法
综合评价法
将定量和定性评价方法结合起来,综合评价文献的学 术价值和影响力。
主成分分析法
通过数学变换将多个指标简化为少数几个主成分,以 更全面地反映文献的学术价值。
主题分析法
总结词
主题分析法是一种通过分析文献主题来研究学科领域发展动向和趋势的方法。
详细描述
主题分析法利用文献主题来分析学科领域的发展趋势和动态变化。通过对文献的主题内容进行分类、统计和分析 ,可以揭示学科领域的主要研究主题、热点和前沿领域等。
内容分析法
总结词
内容分析法是一种通过分析文献内容来研究 学科领域发展动向和趋势的方法。
文献计量学方法
2023-11-08
contents
目录
• 文献计量学概述 • 文献检索与整理 • 文献评价方法 • 文献计量学分析方法 • 文献计量学软件工具 • 文献计量学研究案例
01
文献计量学概述
文献计量学的定义
文献计量学是一门采用数学、统计学等计量方法研究文献信息的学科。它以文献为研究对象,通过对 文献的数量、分布、流动和利用情况进行定量分析,以揭示文献信息之间的相互联系和规律性。
文献计量学PPT课件

计算机辅助的计量研究和应用
-- 大量\规范数据源 -- 数据处理和分析工具
网络信息计量学研究
a
4
第一部分 文献计量学基本规律
a
5
第一节 文献信息增长规律
一.文献增长的基本估计
增长年率 6%~8%
CA 发表100万篇文摘所用年数
1. 32年(1907~1938)
2. 18年
3. 8年
4. 4.75年
a
22
2. 情报老化与文献老化的区别
情报老化:情报的有效价值随时间流 逝而减少的现象,情报可能在相当长 的时间不会老化,而文献老化是针对 用户而言,因用户的使用习惯而造成。
a
23
3. 影响文献老化的因素
文献内容的变化:过时、错误、被普及、被替代 文献增长的影响:一些文献被引用日益减少并非 完全由于文献老化,而是由于文献的增长。 学科性质差异:基础性学科、以客观事实和经验 数据为主的学科(地质、植物)、应用性学科 学科发展阶段:初始和发展阶段、成熟阶段 用户需求:科技期刊、学位论文、科技报告、科 技图书
a
10
局限性
--科学文献并不总是按指数函数增长,还与 学科和统计时间有关。学科范围越广泛, 符合指数规律的时间越长;开始统计的时 间越晚,增长率值越大。
-- 指数增长曲线已有平缓趋势 -- 指数规律不能预测文献的未来增长趋势
a
11
反映历史,不能预测未来 对科学文献增长的机理研究不够 没有考虑停刊因素 没有考虑老化因素
a
15
普赖斯指出:科学发展的所有明显的指数 型终将成为逻辑型模型。 指数型是逻辑型的发展的初始阶段,而逻 辑型是指数型最终的发展趋势。 逻辑型曲线的局限性是导致科学发展的极 限论,增长率为零。
-- 大量\规范数据源 -- 数据处理和分析工具
网络信息计量学研究
a
4
第一部分 文献计量学基本规律
a
5
第一节 文献信息增长规律
一.文献增长的基本估计
增长年率 6%~8%
CA 发表100万篇文摘所用年数
1. 32年(1907~1938)
2. 18年
3. 8年
4. 4.75年
a
22
2. 情报老化与文献老化的区别
情报老化:情报的有效价值随时间流 逝而减少的现象,情报可能在相当长 的时间不会老化,而文献老化是针对 用户而言,因用户的使用习惯而造成。
a
23
3. 影响文献老化的因素
文献内容的变化:过时、错误、被普及、被替代 文献增长的影响:一些文献被引用日益减少并非 完全由于文献老化,而是由于文献的增长。 学科性质差异:基础性学科、以客观事实和经验 数据为主的学科(地质、植物)、应用性学科 学科发展阶段:初始和发展阶段、成熟阶段 用户需求:科技期刊、学位论文、科技报告、科 技图书
a
10
局限性
--科学文献并不总是按指数函数增长,还与 学科和统计时间有关。学科范围越广泛, 符合指数规律的时间越长;开始统计的时 间越晚,增长率值越大。
-- 指数增长曲线已有平缓趋势 -- 指数规律不能预测文献的未来增长趋势
a
11
反映历史,不能预测未来 对科学文献增长的机理研究不够 没有考虑停刊因素 没有考虑老化因素
a
15
普赖斯指出:科学发展的所有明显的指数 型终将成为逻辑型模型。 指数型是逻辑型的发展的初始阶段,而逻 辑型是指数型最终的发展趋势。 逻辑型曲线的局限性是导致科学发展的极 限论,增长率为零。
文献计量学培训课件.ppt

1. 维克利的修正式 n1 : ( n1 + n2 ) : (n1 + n2 + n3 ) : ……… = 1 : b : b2 ……….
2. 莱姆库勒对区域法的发展 F ( x ) = ln (1 + Bx ) / ln ( 1 + B ) 公式形式简单,单参数,便于应用。在确定 了参数B以后,只要知道论文的覆盖比例就 可以确定期刊的最低数量。
在情报研究中的应用
专利文献是科技发展的最敏感指标
精品课件
为技术引进提供决策依据
半导体扩散 技术专利数
日本 世界其他国家
1950 1954 1958 1962 1966 1970
精品课件
第二节 科技文献的老化规律
一、文献老化现象
1. 科技文献老化的概念
科技文献随时间的推移,使用频次逐渐减少的现象 美国,Gosnell,1944《大学图书馆藏书的老化率》: 在知识的累积过程中,一些知识及其载体会逐渐失 去其原有价值。 普赖斯:被引用数据,一篇文献平均寿命十年,对 老化进行了定量研究
2.模拟老化过程的数学模型
1)负指数模型 布鲁克斯的基本假设:科技文献的被引用数 量随时间推移的衰减过程近似服从负指数模 型,当文献达到被引用峰值后,便开始经历 文献老化的衰减过程,于是就可以得到拟合 度很高的负指数曲线
负指数模型的形式 C (t ) = Co e -bt = K e -
bt
观察SCI的引用数据表 概率密度函数 f ( x) = be -bx
精品课件
-bt
2)伯顿-开普勒公式 y = 1-- ( a/e x + b/ e 2x ) (a+b=1)
3)莫德列夫修正式 y = 1-- (a / e x-0.1 + b / e 2x-0.2 ) (a + b = 1)
2. 莱姆库勒对区域法的发展 F ( x ) = ln (1 + Bx ) / ln ( 1 + B ) 公式形式简单,单参数,便于应用。在确定 了参数B以后,只要知道论文的覆盖比例就 可以确定期刊的最低数量。
在情报研究中的应用
专利文献是科技发展的最敏感指标
精品课件
为技术引进提供决策依据
半导体扩散 技术专利数
日本 世界其他国家
1950 1954 1958 1962 1966 1970
精品课件
第二节 科技文献的老化规律
一、文献老化现象
1. 科技文献老化的概念
科技文献随时间的推移,使用频次逐渐减少的现象 美国,Gosnell,1944《大学图书馆藏书的老化率》: 在知识的累积过程中,一些知识及其载体会逐渐失 去其原有价值。 普赖斯:被引用数据,一篇文献平均寿命十年,对 老化进行了定量研究
2.模拟老化过程的数学模型
1)负指数模型 布鲁克斯的基本假设:科技文献的被引用数 量随时间推移的衰减过程近似服从负指数模 型,当文献达到被引用峰值后,便开始经历 文献老化的衰减过程,于是就可以得到拟合 度很高的负指数曲线
负指数模型的形式 C (t ) = Co e -bt = K e -
bt
观察SCI的引用数据表 概率密度函数 f ( x) = be -bx
精品课件
-bt
2)伯顿-开普勒公式 y = 1-- ( a/e x + b/ e 2x ) (a+b=1)
3)莫德列夫修正式 y = 1-- (a / e x-0.1 + b / e 2x-0.2 ) (a + b = 1)