文献计量统计操作步骤课件
合集下载
文献计量学方法-PPT精品文档

内容分析法
补充
内容分析法(Content Analysis)是对 文献内容进行系统的定量分析的一种 专门方法,其目的一般是弄清或测度 文献中本质性的事实或趋势。
20世纪初,人们提出在一般性阅读文献获得理解 之外,采用半定量的统计方法对文献的内容进行 深入分析和解释。二战中,美国传播学家拉斯韦 尔等在进行战时军事和政治信息分析中,以德国 公开出版的报纸为分析对象,分析获取法西斯政 权重要军政机密情报,取得了出乎意料的成功, 使内容分析法显示出实际效果。60年代,前苏联 学者在社会科学研究中采用内容分析法。60年代 日本巧妙获取大庆油田的相关情报。
分 析 方 法
内容分析的 类 型
指定分析:统计分析指定的人、 事、物出现的频次。 归因分析:统计分析相关特征 贾尼斯(美国内容分析专家)划分法 的频次。如分析某人物时统计 实用内容分析——对某些主题词或特定的词汇进行统计分 其不诚实信息出现的次数。 断言分析:统计对某人、事、 析,并赋予不同的权重(如对不同的字体、版面位置、排 物作出反应的有关信息次数, 名顺序等),推断其出现的原因和可能的后果。对报纸、 以分析特定的主题(如对某项 新闻进行内容分析时,常属该类型。 政策的反应)。 语义内容分析——针对文字的语义内容,对特定词汇作统
半定量分析方法。 对大量样本进行特征识别的系统方 法,具有统计性。 可以揭示出隐性的内容。是一种从 公开资料中萃取秘密信息的方法。
确定目的 建立假设
选择样本
定义分析单元 制定分析框架 频数统计 检验假设
内容 分析 步骤 框图
结论汇总
确定目的——必须首先明确。 选择样本——力求样本信息量大,有 连续性,便于统计分析并尽可能是分 析人员所熟悉的。
应用: 主要体现在文献信息的搜集环节上。 也可用于研究某一学科发展的特点以及学科之间的交叉影响 和相互渗透关系,并以此确定某些新学科的生长点。
文献计量学ppt课件

对于该研究,洛特卡引入了“科学生产 率”的概念来测量科研人员撰写科学论文 的能力。
.
科学生产率概念解读
科学生产力的概念
衡量一门学科的发展
这门学科中所发表的文献 研究者的著述规律及其与学术文献之间的数量关系
科学生产力
研究者在科学研究上表现出的能力和工作效果、通常用其生产的学 术文献的数量来衡量
.
洛特卡定律的基本内容(文字描述)
y(1) y(x) x2
•如果经统计得知某一学科领域内撰写1篇论文的作者数 量,那么就很容易计算出写过2篇、3篇…论文的作者数 量。 •写2篇论文的作者数量大约是写1篇论文作者数的1/4。 •写3篇论文的作者数量大约是写1篇论文作者数的1/9。 •写k篇论文的作者数量大约是写1篇论文作者数的?
科研工作者的集合,构成科学论文的“著 作群体”,与科学的发展密切相关;
该定律即以科研成果(科学论文)的数量 作为评价科研工作者对科学做出贡献的大 小。
.
洛特卡定律形成的背景
三、基本假设
1.假定著者科学文献量多少是衡量科学贡献 大小指标;
2.在一定条件下,该假设成立:每篇科学论 文对该学科的贡献的大小是一样的。
在此假定条件下,我们就可以通过科学论文 的数量来判断科学工作者对科学的贡献。
.
洛特卡定律形成的背景
19世纪末20世纪初,是科学发展史上的 一个黄金时期。物理学和化学领域取得了 革命性的进展,与之伴随的是文献领域科 研人员和文献量的骤升。洛特卡注意到了 这种情况,着手研究科研人员与其撰写的 论著间的数量关系。
洛特卡定律局限于指数(n)等于2的情形 Vlachy的发现
n等于2为一特例,n的取值要受到资料量的多寡、学科的性质 和发展程度等因素的影响。
.
科学生产率概念解读
科学生产力的概念
衡量一门学科的发展
这门学科中所发表的文献 研究者的著述规律及其与学术文献之间的数量关系
科学生产力
研究者在科学研究上表现出的能力和工作效果、通常用其生产的学 术文献的数量来衡量
.
洛特卡定律的基本内容(文字描述)
y(1) y(x) x2
•如果经统计得知某一学科领域内撰写1篇论文的作者数 量,那么就很容易计算出写过2篇、3篇…论文的作者数 量。 •写2篇论文的作者数量大约是写1篇论文作者数的1/4。 •写3篇论文的作者数量大约是写1篇论文作者数的1/9。 •写k篇论文的作者数量大约是写1篇论文作者数的?
科研工作者的集合,构成科学论文的“著 作群体”,与科学的发展密切相关;
该定律即以科研成果(科学论文)的数量 作为评价科研工作者对科学做出贡献的大 小。
.
洛特卡定律形成的背景
三、基本假设
1.假定著者科学文献量多少是衡量科学贡献 大小指标;
2.在一定条件下,该假设成立:每篇科学论 文对该学科的贡献的大小是一样的。
在此假定条件下,我们就可以通过科学论文 的数量来判断科学工作者对科学的贡献。
.
洛特卡定律形成的背景
19世纪末20世纪初,是科学发展史上的 一个黄金时期。物理学和化学领域取得了 革命性的进展,与之伴随的是文献领域科 研人员和文献量的骤升。洛特卡注意到了 这种情况,着手研究科研人员与其撰写的 论著间的数量关系。
洛特卡定律局限于指数(n)等于2的情形 Vlachy的发现
n等于2为一特例,n的取值要受到资料量的多寡、学科的性质 和发展程度等因素的影响。
文献计量学期刊统计基本原理与方法期刊演示精品PPT课件

• 分析模型的确立,还基于分析指标的建立。分析指 标构成了对期刊进行分析的评价体系,确立一组能 够描述期刊特征的分析指标体系,对期刊进行计量 分析是非常重要的。
2006-08-21
中国民航大学 党亚茹
11
4 期刊统计分析内容
• 采用文献计量学方法对期刊进行分析,可 以对一组(如某一学科、某一国家、某一 团体、某一出版社)期刊进行分析,也可 以对一个个体期刊进行分析;可以以一年 数据为样本,也可以多年数据为样本。对 期刊的分析研究主要有两大类:期刊特征 分析和期刊影响分析。
8
• 在“万方数据——数字化期刊群”基础上 建设的“中国核心期刊遴选数据库”,不 但是中国科技信息研究所的“中国科技论 文统计与引文分析数据库”的源数据库, 并且在网上对所收录的6000余种学术技术 类自然科学期刊和理论研究类社会科学期 刊给出了期刊统计数字,编辑部人员和期 刊研究人员不但可以通过该数据库的数据 自行设计统计范围和内容,也可直接在网 上查阅到一些重要的期刊指标数据()。
2006-08-21
中国民航大学 党亚茹
9
2. 期刊统计分析的数据收集与规范
• 数据收集原则可以采用总体数据收集,也可以采 用随机抽样方式。从总体中获得的一部分数据称 为样本。由于文献统计研究不能直接观察,在收 集数据过程中,应适当控制误差,保持一定数量 的样本总量,样本量太小不能表现期刊发展的规 律;但一味考虑缩小误差,收集样本过大,则将 会导致收集数据的成本上升。数据收集好后,要 进行数据分组整理,经过数据的整理、数据的规 范和科学分类,展现出样本的规律性,然后才能 统计样本数据的频次分布。
14
2001—2005年25种基础医学类期刊栏目分布
期刊 名称
栏目类别
2006-08-21
中国民航大学 党亚茹
11
4 期刊统计分析内容
• 采用文献计量学方法对期刊进行分析,可 以对一组(如某一学科、某一国家、某一 团体、某一出版社)期刊进行分析,也可 以对一个个体期刊进行分析;可以以一年 数据为样本,也可以多年数据为样本。对 期刊的分析研究主要有两大类:期刊特征 分析和期刊影响分析。
8
• 在“万方数据——数字化期刊群”基础上 建设的“中国核心期刊遴选数据库”,不 但是中国科技信息研究所的“中国科技论 文统计与引文分析数据库”的源数据库, 并且在网上对所收录的6000余种学术技术 类自然科学期刊和理论研究类社会科学期 刊给出了期刊统计数字,编辑部人员和期 刊研究人员不但可以通过该数据库的数据 自行设计统计范围和内容,也可直接在网 上查阅到一些重要的期刊指标数据()。
2006-08-21
中国民航大学 党亚茹
9
2. 期刊统计分析的数据收集与规范
• 数据收集原则可以采用总体数据收集,也可以采 用随机抽样方式。从总体中获得的一部分数据称 为样本。由于文献统计研究不能直接观察,在收 集数据过程中,应适当控制误差,保持一定数量 的样本总量,样本量太小不能表现期刊发展的规 律;但一味考虑缩小误差,收集样本过大,则将 会导致收集数据的成本上升。数据收集好后,要 进行数据分组整理,经过数据的整理、数据的规 范和科学分类,展现出样本的规律性,然后才能 统计样本数据的频次分布。
14
2001—2005年25种基础医学类期刊栏目分布
期刊 名称
栏目类别
文献计量学方法图文

04
文献计量学在科学评价中的应用方式
文献计量指标
通过文献的被引频次、下载量、影响因子等 指标来衡量其学术价值。
学术期刊评价
利用文献计量学方法评估学术期刊的学术水 平和质量。
学科领域发展态势分析
通过文献计量学方法分析学科领域的研究热 点和发展趋势。
科研机构和学者评价
通过文献计量学方法对科研机构和学者的研 究成果进行评价。
文献计量学在科学评价中的作用
科学评价的基本原则
01
客观性原则
科学评价应以客观事实为基础,避 免主观臆断和偏见。
准确性原则
科学评价应准确反映研究对象的实 际情况,避免误导和错误。
03
02
全面性原则
科学评价应全面考虑研究对象的各 个方面,避免片面和偏颇。
可重复性原则
科学评价应具备可重复性,以便他 人验证和进一步研究。
跨文化比较研究
随着全球化的加速,跨文化比较研究成为文献计 量学的重要发展方向,有助于深入了解不同文化 背景下的学术发展状况和趋势。
文献计量学的未来展望
深化理论体系
未来文献计量学需要进一步深化和完善自身的理论体系, 明确核心概念、原理和方法,提高学科的严谨性和科学性 。
强化方法创新
随着研究问题的复杂化,文献计量学需要不断强化方法创 新,吸收借鉴其他学科的方法和技术,提高分析的准确性 和可靠性。
。
词频分析法
总结词
通过分析文献中词汇的现频率,揭示 学科领域的研究重点和发展趋势。
VS
详细描述
词频分析法是一种通过统计文献中词汇的 出现频率,来揭示学科领域的研究重点和 发展趋势的方法。这种方法可以帮助研究 者快速了解某一学科领域的热点话题和变 化趋势。
文献计量学在科学评价中的应用方式
文献计量指标
通过文献的被引频次、下载量、影响因子等 指标来衡量其学术价值。
学术期刊评价
利用文献计量学方法评估学术期刊的学术水 平和质量。
学科领域发展态势分析
通过文献计量学方法分析学科领域的研究热 点和发展趋势。
科研机构和学者评价
通过文献计量学方法对科研机构和学者的研 究成果进行评价。
文献计量学在科学评价中的作用
科学评价的基本原则
01
客观性原则
科学评价应以客观事实为基础,避 免主观臆断和偏见。
准确性原则
科学评价应准确反映研究对象的实 际情况,避免误导和错误。
03
02
全面性原则
科学评价应全面考虑研究对象的各 个方面,避免片面和偏颇。
可重复性原则
科学评价应具备可重复性,以便他 人验证和进一步研究。
跨文化比较研究
随着全球化的加速,跨文化比较研究成为文献计 量学的重要发展方向,有助于深入了解不同文化 背景下的学术发展状况和趋势。
文献计量学的未来展望
深化理论体系
未来文献计量学需要进一步深化和完善自身的理论体系, 明确核心概念、原理和方法,提高学科的严谨性和科学性 。
强化方法创新
随着研究问题的复杂化,文献计量学需要不断强化方法创 新,吸收借鉴其他学科的方法和技术,提高分析的准确性 和可靠性。
。
词频分析法
总结词
通过分析文献中词汇的现频率,揭示 学科领域的研究重点和发展趋势。
VS
详细描述
词频分析法是一种通过统计文献中词汇的 出现频率,来揭示学科领域的研究重点和 发展趋势的方法。这种方法可以帮助研究 者快速了解某一学科领域的热点话题和变 化趋势。
文献计量统计操作步骤

选择代表年份的PY列分别拖入行标签和数值栏内,在 数值栏内选择计数项,得出不同年份发表的文献数量
成长趋势分析操作 step 3
分别将代表每篇文章作者数的NO.AU列,代表引用参 考文献数的NR列,代表页数的PG列,以及代表被引用 总次数的TC列拖入数值栏内求和项,得出不同年份发 表的文献各项参数指标
下载数据操作 step 7
下载数据操作 step 8
下载数据操作 step 9
下载数据操作 step 10
下载数据操作 step 11
下载数据操作 step 12
下载数据操作 EXCELL表格
添加数据操作注意
输出到EXCEL表格操作注意
BACK操作注意
第二步:数据预处理
作者文章总数统计操作 step 5
数据透视表分析:在第一行之上插入一行,填写标题 TAU→ Alt+D+P+F(计数项为TAU )
作者文章总数统计操作 step 6
将计算结果拷贝→选择性粘贴(数值)到新的sheet → 拷贝到原始数据表格的AU →删除第一行[Anon] →标题
第八步:成长趋势分析
主题(TOPIC)搜索
在WOS Search里,搜索TOPIC:
Enter one or more terms. Searches within article titles, keywords, and abstracts. Example: drink* AND water* ; drink* OR water* ; ‘drink* water*’ 不同单词之间可用and或or来连接;*在这里表示 后续内容可为任意。 如:(adsorption or sorption or biosorption) and dye*
成长趋势分析操作 step 3
分别将代表每篇文章作者数的NO.AU列,代表引用参 考文献数的NR列,代表页数的PG列,以及代表被引用 总次数的TC列拖入数值栏内求和项,得出不同年份发 表的文献各项参数指标
下载数据操作 step 7
下载数据操作 step 8
下载数据操作 step 9
下载数据操作 step 10
下载数据操作 step 11
下载数据操作 step 12
下载数据操作 EXCELL表格
添加数据操作注意
输出到EXCEL表格操作注意
BACK操作注意
第二步:数据预处理
作者文章总数统计操作 step 5
数据透视表分析:在第一行之上插入一行,填写标题 TAU→ Alt+D+P+F(计数项为TAU )
作者文章总数统计操作 step 6
将计算结果拷贝→选择性粘贴(数值)到新的sheet → 拷贝到原始数据表格的AU →删除第一行[Anon] →标题
第八步:成长趋势分析
主题(TOPIC)搜索
在WOS Search里,搜索TOPIC:
Enter one or more terms. Searches within article titles, keywords, and abstracts. Example: drink* AND water* ; drink* OR water* ; ‘drink* water*’ 不同单词之间可用and或or来连接;*在这里表示 后续内容可为任意。 如:(adsorption or sorption or biosorption) and dye*
文献计量学基础知识2-PPT精品文档

•参考文献链接
•相关记录链接
3. ISI的发展历程与知识链接
引文索引:不断发展
1997
1992
1989
SCI, 1963 SSCI, AHCI on CD Science Citation Index Current Contents THOMSON Scientific ISI Web Of Science ISI Web of Knowledge
• 另一种定义 若文献A将文献B作为参考文献,则文献A就 有了一篇参考文献B,而文献B则有了一篇引用 文献 (引文) A。
引文网络
1. 科学文献之间不是孤立的,而是相互联系、不
断延伸的系统。 2. 科学文献的相互引证反映了科学发展的客观规 律,体现了科学知识的累积性、连续性和继承 性及学科之间的交叉、渗透。 3. 通过引文网络向前可以追根溯源,向后可以跟 踪发展,是一种特殊形式的检索系统。 4. 科学文献的引用频率不是均衡的,引文网络的 稀疏与密集反映了引文分布的分散与集中规律。
• 知识服务是以信息知识的搜寻、组织、分 析、重组为基础,根据用户的问题和环境, 提出能够有效支持知识应用和知识创新的 服务。
互联网与知识链接
• 用户梦想的是一个覆盖全部学术信息资源 的信息系统,所有的信息互通互联,信息 获取简单准确。
快速获取信息的知识链接
• 知识链接的价值就在于通过连接,一 篇文章或其他检索到的信息资源可以 成为一个相关研究领域或研究方法的 门户。
2004 2019
ISI Web of Knowledge 3.0 ISI Web of Science 7.0 BIOSIS
1958
Current Contents Connect Derwent Innovations Index
文献计量学PPT课件

计算机辅助的计量研究和应用
-- 大量\规范数据源 -- 数据处理和分析工具
网络信息计量学研究
a
4
第一部分 文献计量学基本规律
a
5
第一节 文献信息增长规律
一.文献增长的基本估计
增长年率 6%~8%
CA 发表100万篇文摘所用年数
1. 32年(1907~1938)
2. 18年
3. 8年
4. 4.75年
a
22
2. 情报老化与文献老化的区别
情报老化:情报的有效价值随时间流 逝而减少的现象,情报可能在相当长 的时间不会老化,而文献老化是针对 用户而言,因用户的使用习惯而造成。
a
23
3. 影响文献老化的因素
文献内容的变化:过时、错误、被普及、被替代 文献增长的影响:一些文献被引用日益减少并非 完全由于文献老化,而是由于文献的增长。 学科性质差异:基础性学科、以客观事实和经验 数据为主的学科(地质、植物)、应用性学科 学科发展阶段:初始和发展阶段、成熟阶段 用户需求:科技期刊、学位论文、科技报告、科 技图书
a
10
局限性
--科学文献并不总是按指数函数增长,还与 学科和统计时间有关。学科范围越广泛, 符合指数规律的时间越长;开始统计的时 间越晚,增长率值越大。
-- 指数增长曲线已有平缓趋势 -- 指数规律不能预测文献的未来增长趋势
a
11
反映历史,不能预测未来 对科学文献增长的机理研究不够 没有考虑停刊因素 没有考虑老化因素
a
15
普赖斯指出:科学发展的所有明显的指数 型终将成为逻辑型模型。 指数型是逻辑型的发展的初始阶段,而逻 辑型是指数型最终的发展趋势。 逻辑型曲线的局限性是导致科学发展的极 限论,增长率为零。
-- 大量\规范数据源 -- 数据处理和分析工具
网络信息计量学研究
a
4
第一部分 文献计量学基本规律
a
5
第一节 文献信息增长规律
一.文献增长的基本估计
增长年率 6%~8%
CA 发表100万篇文摘所用年数
1. 32年(1907~1938)
2. 18年
3. 8年
4. 4.75年
a
22
2. 情报老化与文献老化的区别
情报老化:情报的有效价值随时间流 逝而减少的现象,情报可能在相当长 的时间不会老化,而文献老化是针对 用户而言,因用户的使用习惯而造成。
a
23
3. 影响文献老化的因素
文献内容的变化:过时、错误、被普及、被替代 文献增长的影响:一些文献被引用日益减少并非 完全由于文献老化,而是由于文献的增长。 学科性质差异:基础性学科、以客观事实和经验 数据为主的学科(地质、植物)、应用性学科 学科发展阶段:初始和发展阶段、成熟阶段 用户需求:科技期刊、学位论文、科技报告、科 技图书
a
10
局限性
--科学文献并不总是按指数函数增长,还与 学科和统计时间有关。学科范围越广泛, 符合指数规律的时间越长;开始统计的时 间越晚,增长率值越大。
-- 指数增长曲线已有平缓趋势 -- 指数规律不能预测文献的未来增长趋势
a
11
反映历史,不能预测未来 对科学文献增长的机理研究不够 没有考虑停刊因素 没有考虑老化因素
a
15
普赖斯指出:科学发展的所有明显的指数 型终将成为逻辑型模型。 指数型是逻辑型的发展的初始阶段,而逻 辑型是指数型最终的发展趋势。 逻辑型曲线的局限性是导致科学发展的极 限论,增长率为零。
文献计量可视化操作的步骤

文献计量可视化操作指南
一、数据收集
数据收集是文献计量可视化操作的第一步,主要包括选定主题,确定时间范围,以及选择数据来源。
可以通过学术搜索引擎,学科数据库,科研机构知识库等途径进行数据收集。
二、数据清洗
在收集数据之后,需要进行数据清洗,去除重复、无关或错误的记录。
清洗过程中需要注意保持数据的完整性,以避免影响后续分析的准确性。
三、选择合适的可视化工具
在选择可视化工具时,需要综合考虑工具的功能、操作难度、以及数据特性等因素。
可以选择常见的可视化软件,如Tableau, PowerBI, 或者开源的Seaborn等。
四、数据预处理
数据预处理包括数据格式化、数据转换等步骤,是可视化的基础。
需要将数据转换为适合可视化的形式,并保证数据的准确性和完整性。
五、可视化分析
可视化分析是文献计量可视化的核心步骤,主要包括对数据的探索性分析和解释性分析。
可以通过各种图表和图形来展示数据的分布、关联和趋势。
六、结果解读
在完成可视化分析后,需要对结果进行解读。
解读过程中需要结合专业知识,理解数据的深层含义,并从中提取出有用的信息。
七、知识整合
知识整合是将解读结果与已有知识进行整合的过程,旨在形成新的认识和理解。
整合过程中需要注意保持信息的完整性和准确性。
八、可视化呈现
最后一步是可视化呈现,即将整合后的知识以图表、图形等形式展示
出来。
呈现的结果需要清晰易懂,能够有效地传达信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
❖ 作者数目统计。运用分列及 “COUNTA”函数统计每
篇文章的作者数目。此举为后续的“成长趋势分析”和 作者相关分析做准备。复制AU列到新的sheet,在“数 据”菜单中点击按“分号”进行“分列”,然后用“筛 选”查找到所有有数据列,最后利用“全部”函数中的 COUNTA计数函数统计每一个记录的非空单元格数目 。
通讯作者统计操作 step 2
❖ 在RP列前插入一列B
第五步:统计作者文献量
❖统计通讯作者发表文章数量 ❖统计第一作者发表文章数量 ❖统计作者发表文章总数量
通讯作者统计操作 step 1
❖ 在原始数据OD中拷贝No.和RP二列到新的 sheet。
❖ 分列操作:选中RP列→“数据” → “分列 ”(按“分隔符号” 、“,”分列,然后点 击选“常规”列数据格式→ “完成”)。
❖ 消除空格。用ctrl+ F查找替代功能,将原始数据中 “,+空格”替换为“,”, “;+空格”替换为“;” ,以消除空格。此举为方便后续操作(如防止在国 家分析时,EXCEL会把“USA”与“ USA”识别为 两个不同的国家),在所有分析之前,我们应先对 空格进行处理。这一步极其重要。
❖ 将所有文献按年代顺序进行编号。对年份PY进行
文献类型统计操作 step 2
❖ 出现一个新sheet:在提示框“数据透视表字段列 表”中选择“DT”(=将DT拖入“行标签” ); 再据提示“请将数据项拖至此处”将DT拖入 “∑数值”。计算结果示例如下:
数据透视表操作页面
文献类型统计操作 step 3
❖ 新建一个sheet,命名为Da。将数据透视表内 容copy过去,计算各项比例。可按各项数目P 从大到小进行排序。结果示例如下:
文献类型统计操作 step 4
❖ 百分比有效位数处理
注意:后续数据分析中若涉及数据百分比则根 据需要同此操作,不再重述;
通常保留两位有效数字,使用工具“减少小数 位数”,可分批处理,如97.12352→97,再 1.184433→1.2,再0.338409→0.34等。
第四步:
使用语言,页数,参考文献数统计
因为我们通常分析的文章类型只有article一种,所以对 DT列可进行排序之后,删除除article外的所有文献所在
的行。 Ctrl + Shift + ↓可以选中光标所在行以后的全
部行。
第三步:文献类型统计
❖常见的文献类型有Article, Correction, Editorial Material, Letter, Note, Review等几种。我 们在原始表格OD中,对DT进 行数据透视表操作。
文献计量统计操作步骤
1. 下载数据 2. 数据预处理 3. 文献类型统计 4. 使用语言,页数,参考文献数统计
5. 成长趋势分析 6. 关键词分析 7. 研究领域及期刊分布分析
第一步:下载数据
进入:武汉大学图书馆→数据库→SCIE (Science Citation Index 1999-)
主题(TOPIC)搜索
排序,如从按Z→A降序排序得2006→1997,按A→Z则 按升序排序得1997 → 2006 。因为我们从WOS中所下载 的当年文献数据只是一部分,所以在分析的时候,通常 删去当年的文献不作分析。快捷步骤:选定年份PY列 查找1997,找到第一个1997其上面的所有行即为1996年 的文献,对其全选删除(鼠标右键+D)即可 。
❖ 有时也进行以下的预处理:
从原始数据库中删除意义不大的分析项目。新建一个 sheet,将OD的全部数据copy过来,将其命名为D。可 删除的列有:CA,SE,AB,EM,CR,PU,PI,PA ,J9,JI,PD,VL,IS,PN,SU,SI,BP,EP,AR ,DI,GA。之后所有的操作都对D进行。
下载数据操作 step 2
下载数据操作 step 3
下载数据操作 step 4
点击
下载数据操作 step 5
点此处
下载数据操作 step 6
下载数据操作 step 7
下载数据操作 step 8
下载数据操作 step 9
下载数据操作 step 10
下载数据操作 step 11
下载数据操作 step 12
下载数据操作 EXCELL表格
❖ 添加数据操作注意注意
第二步:数据预处理
❖ 保存好原始数据。在EXCEL里将其所在sheet命名 为OD(original data的缩写),方便我们在后续处 理工作中进行查找核对。
文献类型统计操作 step 1
❖ 在“数据”菜单选择“数据表和数据透视图” ; 指定待分析的数据源类型为:Microsoft Office Excel数据列表或数据库; 所需创建的报表类型选:数据透视表; 点击“完成”。
❖ 快捷键:Alt + D +P+F
Alt + D + P 页面
Alt + D + P + F 页面
不同单词之间可用and或or来连接;*在这里表示 后续内容可为任意。
如:(adsorption or sorption or biosorption) and dye*
SCI论文TOPIC一般格式
下载数据操作步骤
TOPIC: ‘drink* water*’
(2008.9.22.)
下载数据操作 step 1
在WOS Search里,搜索TOPIC:
Enter one or more terms. Searches within article titles, keywords, and abstracts. Example: drink* AND water* ; drink* OR water* ; ‘drink* water*’
❖ No.1 语言(LA) 同前“文章类型统计”操作,对LA进行数据 透视,所得新的sheet命名为LA。
❖ No.2 文章页数(PG) 同前“文章类型统计”操作,对PG进行数据 透视,所得新的sheet命名为PG。
❖ No.3 参考文献数(NR) 同前“文章类型统计”操作,对NR进行数据 透视, 所得新的sheet命名为NR。
篇文章的作者数目。此举为后续的“成长趋势分析”和 作者相关分析做准备。复制AU列到新的sheet,在“数 据”菜单中点击按“分号”进行“分列”,然后用“筛 选”查找到所有有数据列,最后利用“全部”函数中的 COUNTA计数函数统计每一个记录的非空单元格数目 。
通讯作者统计操作 step 2
❖ 在RP列前插入一列B
第五步:统计作者文献量
❖统计通讯作者发表文章数量 ❖统计第一作者发表文章数量 ❖统计作者发表文章总数量
通讯作者统计操作 step 1
❖ 在原始数据OD中拷贝No.和RP二列到新的 sheet。
❖ 分列操作:选中RP列→“数据” → “分列 ”(按“分隔符号” 、“,”分列,然后点 击选“常规”列数据格式→ “完成”)。
❖ 消除空格。用ctrl+ F查找替代功能,将原始数据中 “,+空格”替换为“,”, “;+空格”替换为“;” ,以消除空格。此举为方便后续操作(如防止在国 家分析时,EXCEL会把“USA”与“ USA”识别为 两个不同的国家),在所有分析之前,我们应先对 空格进行处理。这一步极其重要。
❖ 将所有文献按年代顺序进行编号。对年份PY进行
文献类型统计操作 step 2
❖ 出现一个新sheet:在提示框“数据透视表字段列 表”中选择“DT”(=将DT拖入“行标签” ); 再据提示“请将数据项拖至此处”将DT拖入 “∑数值”。计算结果示例如下:
数据透视表操作页面
文献类型统计操作 step 3
❖ 新建一个sheet,命名为Da。将数据透视表内 容copy过去,计算各项比例。可按各项数目P 从大到小进行排序。结果示例如下:
文献类型统计操作 step 4
❖ 百分比有效位数处理
注意:后续数据分析中若涉及数据百分比则根 据需要同此操作,不再重述;
通常保留两位有效数字,使用工具“减少小数 位数”,可分批处理,如97.12352→97,再 1.184433→1.2,再0.338409→0.34等。
第四步:
使用语言,页数,参考文献数统计
因为我们通常分析的文章类型只有article一种,所以对 DT列可进行排序之后,删除除article外的所有文献所在
的行。 Ctrl + Shift + ↓可以选中光标所在行以后的全
部行。
第三步:文献类型统计
❖常见的文献类型有Article, Correction, Editorial Material, Letter, Note, Review等几种。我 们在原始表格OD中,对DT进 行数据透视表操作。
文献计量统计操作步骤
1. 下载数据 2. 数据预处理 3. 文献类型统计 4. 使用语言,页数,参考文献数统计
5. 成长趋势分析 6. 关键词分析 7. 研究领域及期刊分布分析
第一步:下载数据
进入:武汉大学图书馆→数据库→SCIE (Science Citation Index 1999-)
主题(TOPIC)搜索
排序,如从按Z→A降序排序得2006→1997,按A→Z则 按升序排序得1997 → 2006 。因为我们从WOS中所下载 的当年文献数据只是一部分,所以在分析的时候,通常 删去当年的文献不作分析。快捷步骤:选定年份PY列 查找1997,找到第一个1997其上面的所有行即为1996年 的文献,对其全选删除(鼠标右键+D)即可 。
❖ 有时也进行以下的预处理:
从原始数据库中删除意义不大的分析项目。新建一个 sheet,将OD的全部数据copy过来,将其命名为D。可 删除的列有:CA,SE,AB,EM,CR,PU,PI,PA ,J9,JI,PD,VL,IS,PN,SU,SI,BP,EP,AR ,DI,GA。之后所有的操作都对D进行。
下载数据操作 step 2
下载数据操作 step 3
下载数据操作 step 4
点击
下载数据操作 step 5
点此处
下载数据操作 step 6
下载数据操作 step 7
下载数据操作 step 8
下载数据操作 step 9
下载数据操作 step 10
下载数据操作 step 11
下载数据操作 step 12
下载数据操作 EXCELL表格
❖ 添加数据操作注意注意
第二步:数据预处理
❖ 保存好原始数据。在EXCEL里将其所在sheet命名 为OD(original data的缩写),方便我们在后续处 理工作中进行查找核对。
文献类型统计操作 step 1
❖ 在“数据”菜单选择“数据表和数据透视图” ; 指定待分析的数据源类型为:Microsoft Office Excel数据列表或数据库; 所需创建的报表类型选:数据透视表; 点击“完成”。
❖ 快捷键:Alt + D +P+F
Alt + D + P 页面
Alt + D + P + F 页面
不同单词之间可用and或or来连接;*在这里表示 后续内容可为任意。
如:(adsorption or sorption or biosorption) and dye*
SCI论文TOPIC一般格式
下载数据操作步骤
TOPIC: ‘drink* water*’
(2008.9.22.)
下载数据操作 step 1
在WOS Search里,搜索TOPIC:
Enter one or more terms. Searches within article titles, keywords, and abstracts. Example: drink* AND water* ; drink* OR water* ; ‘drink* water*’
❖ No.1 语言(LA) 同前“文章类型统计”操作,对LA进行数据 透视,所得新的sheet命名为LA。
❖ No.2 文章页数(PG) 同前“文章类型统计”操作,对PG进行数据 透视,所得新的sheet命名为PG。
❖ No.3 参考文献数(NR) 同前“文章类型统计”操作,对NR进行数据 透视, 所得新的sheet命名为NR。