基于大数据的h指数及其衍生指数的分析研究-草稿

合集下载

万方 h指数

万方 h指数

万方 h指数万方数据库是中国知网旗下的学术资源平台,提供各领域学术论文、学位论文、会议论文、报告、专利等多种文献资源。

而h指数(h-index)则是衡量学者学术影响力的一种指标。

本文将介绍万方 h指数的概念、计算方法以及其在学术界的应用。

一、万方 h指数的概念h指数,即Hirsch指数,是由美国物理学家Jorge E. Hirsch于2005年提出的。

它旨在综合考虑学者的学术产出数量和影响力,用以衡量学者的学术水平和研究成果的影响力。

二、万方 h指数的计算方法万方 h指数的计算方法与通常的h指数计算方法相同。

假设一个学者的论文数量为N,其论文被引用次数按照从大到小排序后分别为c1、c2、...、cN。

那么,h指数就是指当第h篇论文的引用次数不少于h时,其余(N-h)篇论文的引用次数都不超过h。

简而言之,就是在引用次数和论文数量之间取一个平衡点。

例如,一个学者共发表了10篇论文,每篇论文的引用次数按照从大到小排序分别为18、10、9、7、6、5、4、2、1、0。

根据h指数的定义,该学者的h指数为5,因为有5篇论文的引用次数不低于5,其余5篇论文的引用次数都不超过5。

三、万方 h指数的应用万方 h指数作为衡量学者学术影响力的指标,被广泛运用在学术评价、科研竞争和学术交流等方面。

首先,万方 h指数可作为评估学者学术水平的指标。

在职称评定、科研项目评审等过程中,往往会参考学者的h指数。

较高的h指数意味着学者在某一领域内具有较强的学术影响力,对于评定学术成果的质量和学者的学术贡献起到了一定的参考作用。

其次,万方 h指数可用于科研竞争的评价。

在申请科研项目、参与学术会议等过程中,学者的h指数也是评审委员会的重要参考之一。

较高的h指数可以显示学者在过去的研究中的影响力,从而增加科研竞争的胜算。

此外,万方 h指数还可以作为学术交流的参考指标。

在学术会议、学术讲座等场合,参与者的h指数是衡量其学术地位和话语权的一个重要标志。

h指数、g指数、m指数和总被引量_解释说明

h指数、g指数、m指数和总被引量_解释说明

h指数、g指数、m指数和总被引量解释说明1. 引言1.1 概述在科学研究中,评估学术成就和影响力是一项重要任务。

为了量化一个学者的学术产出和引用情况,人们提出了一系列指数,其中包括h指数、g指数、m指数和总被引量。

这些指数是通过分析学者的论文发布数量和被引用次数等数据来衡量其学术影响力的工具。

1.2 文章结构本文主要围绕h指数、g指数、m指数和总被引量展开讨论。

首先对每个指数进行定义和计算方法的介绍,然后探讨它们的应用领域和意义。

接着我们将深入探讨每个指标存在的局限性和争议,并提供相关案例进行解释。

最后我们将总结各个指标的特点与适用范围。

1.3 目的本文旨在帮助读者更好地理解h指数、g指数、m指数和总被引量,明确其计算方法以及在评估学术成就和影响力方面的应用价值。

同时还将对这些指标存在的局限性和争议进行全面探讨,帮助读者更客观地看待这些评估学术影响力的指标,并在实际应用中进行权衡和判断。

通过本文的阅读,读者将对各个指标有更深入的理解,以便在评估学术成就和影响力时做出更准确、全面的判断。

2. H指数2.1 定义和计算方法H指数是评估学术作者影响力的一种指标。

它基于作者发表的论文以及这些论文被引用的次数来衡量。

具体而言,一个学者的H指数是指他/她的论文中,被引用次数大于等于该学者发表的所有论文数量的最大值。

计算H指数需要按照引用次数对所有文章进行降序排列,并找出其中最大的k 值,使得前k篇文章每篇至少被引用了k次。

这个k值就是该学者的H指数。

举个例子说明:假设一个学者共发表了8篇论文,并分别被引用了10、8、5、4、3、3、2和1次。

那么他/她的H指数为4,因为有4篇论文每篇被引用次数都不少于4次。

2.2 应用领域和意义H指数广泛应用于各个领域,特别是在科学研究和学术评价中起到了重要作用。

首先,H指数可以客观地评估一个研究人员或学术机构在某一领域内所取得的影响力和贡献。

相较于简单地依靠总被引量等单一指标,H指数更能反映出学者的长期学术影响力。

评价科学成就的新指标h指数的研究状况分析

评价科学成就的新指标h指数的研究状况分析

评价科学成就的新指标h指数的研究状况分析关键信息项:1、 h 指数的定义与计算方法:____________________________2、 h 指数的优势与局限性:____________________________3、 h 指数在不同学科领域的应用情况:____________________________4、 h 指数与其他评价指标的比较:____________________________5、影响 h 指数的因素:____________________________6、 h 指数的改进与拓展研究:____________________________7、基于 h 指数的科研评价体系的构建:____________________________11 h 指数的概念h 指数是由美国物理学家 Jorge E Hirsch 于 2005 年提出的一种用于评价科学家个人科研成就的指标。

它的定义是指一位科学家发表的 N 篇论文中有 h 篇论文每篇至少被引用了 h 次,而剩下的(N h)篇论文中每篇被引用的次数都小于 h 次。

111 h 指数的计算方法计算 h 指数的方法相对简单,可以通过相关的数据库和分析工具来实现。

通常,先统计某一科学家发表的所有论文的被引次数,然后按照被引次数从高到低进行排序,找出满足上述定义的 h 值。

12 h 指数的优势h 指数具有一些明显的优势。

它综合考虑了科学家的论文数量和质量,避免了单纯以论文数量或被引次数来评价的片面性。

同时,h 指数相对稳定,不易受到少数高被引论文或异常引用情况的过度影响。

121 h 指数的局限性然而,h 指数也存在一定的局限性。

例如,它对早期职业生涯的科学家不太友好,因为他们的发表数量和积累的引用可能较少。

此外,h 指数不能区分不同质量的引用,也无法反映论文的影响力随时间的变化。

21 h 指数在不同学科领域的应用h 指数在多个学科领域得到了广泛的应用。

我国h指数与其他指数的关系探究

我国h指数与其他指数的关系探究

一、引言没有科学的评价就没有科学的管理,没有科学的管理就没有科学的发展。

学术评价是各类评价中重要的一个内容,而被引分析又是学术评价中极其重要的一个衡量标准。

传统的被引分析指标有发文量、被引频次、篇均被引率、影响因子等,然而这些指标都仅仅是从学术作品“质”或“量”其中一方面入手比较。

2005年美国加州大学圣迭哥分校的物理学家乔治.赫希教授提出了一种定量评价科研人员学术成就的方法—h指数。

这个指数将学术成果的质与量有效地结合起来,创新地衡量了评价对象的高影响力论文数量与被引强度,使科研评价更加科学、合理。

随着研究的不断深入,关于h指数的性质越来越多地被探讨,传统的理论认为,h指数和发文量、总被引频次呈正相关关系,本文将深入从学者、期刊、大学三个方面对这个观点进行论证,另外h指数作为对影响因子的改进方式,本文进一步阐述了两者的关系及各自的优缺点。

二、研究目标与方法(一)研究目标:本文的研究目标是从国内学者、期刊、大学三方面论证h指数与发文量,总被引频次、影响因子三个指标的相关性。

(二)研究方法:1、文献研究法:通过网上文献和中国引文数据库的检索来获得相关的h指数数据的信息。

2、定量分析法:本文搜集了20组学者、期刊、大学三个层次上h指数和发文量、总被引频次的数据,通过回归分析的方法论证了这三个层面上h指数和发文量、总被引频次的相关关系。

另外从期刊层面上,对h指数和影响因子的关系进行了相关关系的论证及各自的适用性描述。

三、研究内容:随着科学技术的发展,科研成果越来越多,不同的学者、机构学术水平不一,影响力不一,成果的评价成为了人才聘任、资源分配、奖励政策等工作的基础。

2005年乔治.赫希教授提出了定量评价科研人员学术成就的方法—h指数,它在一定程度上弥补了先前提出的影响因子的缺陷,并被越来越广泛地运用。

(一)h指数及其他指标的概念1、h指数(h-index )是一个混合量化指标,最初是由美国加利福尼亚大学圣地亚哥分校的物理学家乔治·赫希(Jorge Hirsch)在2005年的时候提出来的,其目的是量化科研人员作为独立个体的研究成果。

基于h指数及其扩展指数的科研评价

基于h指数及其扩展指数的科研评价
鉴意 义。
【 关键词 ]h 指数 ;文献计量 学;科研 评价
DOI1 3 6 iS 1 0 : 0. 9 9 S n. 0 8—0 2 . 0 2. 7. 2 8 12 1 0 0 1
[ 中图分类 号]G 5. 2 ( 202 文献标识码 】A ( 5 文章编号 】10 — 81( 1) 7 O9 — 6 08 0 2 2 2 0 一 O2 0 0
力论文的篇数及载文期 刊的影 响因子等 ,容 易造成学术泡 沫等负面影响… 。
等 ,而 h 指数将论文数量 和论文质量 综合 考虑 ,对 被评 价
对象 的评估更为客观。 尽管 h 指数在学术 评价 中具 有诸 多优 势 ,但其 缺 陷也 是显而易见 的 。Gne 和金 碧辉 等对 此作 了较 为 全面 的总 l l z 结 3:①对从事科研时 间较 短的人员 不利 ,因为他 们 的论 文数量和被引次数相对 较低 , 自然 难 以获得 高 h指数 ;② 不利于论文数 量少而 被引频 次高 的科学 家 ;③h指 数是 一
李 萍 燕
( 东 药学院 图书馆 ,广 东 广 州 500 ) 广 10 21 年我 田 “8 95工程”第一期 3 所高校所发表的论文及其被 ;数据 ,根 据相 4 1
关指数 的定义,分 别统计计算 出各院校的 h指 数及其 G指数、w 指数 、A指 数、H( ) 数、R指数 、标准化 指数 ( , W, 2指 h G, H
[ 】嘲 ]Te a rvut Rs r Ea ao s a -I即adte ne i 既 wl a r0 “8 glr As b h p aa s e a h v u i b e O i 【n i x d I p ee l e e c l tn a d lh l d s m d l i pp sf 95 ni e d t e l e I - e

H指数及其衍生指数在高校教师学术评价中的研究

H指数及其衍生指数在高校教师学术评价中的研究
序列号( 对此没有严格限制 R o u s s e a u建 议 按 论 文 发 表 时 间 倒 序排列 ) , 当且 仅 当前 h 篇 论 文每 篇 论 文 的引 文数 至少 为 h , 同
引言
学 术 评 价 一 直 是 国 际 学 术 界 和 高 校 管 理 部 门 十 分 关 注
时第 h + l 篇论文 的引文数小于 h + l 时则科学 家 s的 h指 数 值 为 。例如 , H i m c h本人的 h指数是 4 9 , 这表示他 已发表
篇引文数至少为 h的论 文 , 同时其余 论文的引文数都小 于 h
时该科学家 h 指 数 的值 为 。随 后 R o u s s e a u在 H i r s c h 基 础
即第 ( g + 1 ) 序次论文对应 的累积引文数将小于 ( g + 1 ) 2 。将 论 文按 被引次数 由高 自低排序 , 将序号 平方 , 被引次数按 序号 层层累加 , 当序号平方等 于累计被引次数时 , 该序号则为 g 指 数 。如序号平 方不是恰好 等于而是小 于对应 的累计 被引次
回 溯分 析 和定 标 比超 等 。而我 国高 校 在 评 价 教 师 学 术水 平 的 过 程 中通 常 采用 的评 价方 式是 同行 评 议 法 、 文 献 计 量 分 析 法
的 h指数越高 , 则表明他的论 文影 响力越大 。 h指数 的优点是 明显 的, 它非常简单而且易于理解同时 又能兼顾 论文产 出的质量和数量 , 并且 它是动态 的 , 随着时 间的推移引用次数的增加 h指数会逐渐的上升 。 然而它的缺

2 . 其他衍 生指数
随着 对 h 指 数 的 深入 研 究 , 国 内外 学 者 提 出 了一 系 列 类 h指 数 , 也就 是 h指 数 的 衍 生指 数 , 弥 补 了 h指数 的局 限性 。 ( 1 ) g指 数 2 0 0 6年 , E g g h e在 分 析 h指 数 评 价 效 果 时 ,提 出 _ 『一 种 基 于学 者 以往 贡献 的 g 指数 , 主要 是 弥 补 h指 数 不能 很 好 反 映 高被 引论 文 的 缺 陷 提 出 的 。 g指数 定 义 为 , 论 文按 被 引次 数 排 序 后 相 对 排 前 的 累 积 被 引 至少 g 2次 的最 大 论 文 序 次 g , 亦

国内h指数研究的文献计量分析论文

国内h指数研究的文献计量分析论文

国内h指数研究的文献计量分析论文H指数(Hindex)是一个混合量化指标,可用于评估研究人员的学术产出数量与学术产出水平。

下面是小编为你带来的国内h指数研究的文献计量分析,欢迎阅读。

关键词:h指数;文献计量学;定量分析;CNKI摘要:文章以CNKI数据库为文献来源,运用文献计量学的方法,从文献年载量、作者、期刊和主题等方面对h指数研究论文进行综合分析,以此来了解h指数在我国的研究现状以及取得的成果,并对未来发展做出预测。

1 引言2005年8月,美国加州大学圣地亚哥分校物理系J.E.Hirsh教授提出了h指数[1],h指数是用来评价科学家个人的学术成就。

该指数将论文数量和质量有机地结合在一起。

因此,h指数一经提出,就受到了多个学科领域的广泛关注,Nature[2]和Science[3]相继进行了报道。

关于h指数的研究风起云涌,为了了解近几年国内h指数研究进展,笔者选择CNKI中国知网数据库,从文献年载量、作者、期刊和主题等方面进行定量分析。

2 数据来源和分析方法以CNKI中国知网为统计源,选取“主题”为检索字段,采用“h 指数”“h-指数”“h型指数”“Hirsch指数”进行逻辑“或者”组合进行高级检索,检索2005年至今的所有数据,检索时间为2013年11月21日,得出相关记录792篇,对检索命中的论文逐一进行核实,剔除重复、约稿、不相关的论文,最后查漏补缺,最终选出547篇,选用NoteExpress和Excel作为统计工具对数据进行统计分析。

3 数据分析3.1 文献年载量分析对某一领域的文献发表年代进行统计分析,可以从时间上了解该领域的现有状况和发展趋势。

通过检索、整理共得出h指数领域的文献547篇,统计数据见图1。

从图1可知,2005年国内首次出现关于h指数的报道,是来自“云中客”发表在《物理》上的h-指数[4],2006―2009年h指数文献呈现快速增长的趋图1 h指数论文年度数量分布表势,说明h指数受到了学者们的广泛和持续的关注,尤其是2009年文献量比前几年的总和还要多,增长突飞猛进,研究热度达到了高峰,h指数经过了4年的成长期,2010年以后开始退热,2010―2013年进入了它的成熟期,这符合文献增长的规律,接下来4年的文献既横向拓展,发掘交叉学科,又纵向深入,细化理论和应用。

基于h指数的OPAC数据分析及应用。——以南京航空航天大学图书馆为例

基于h指数的OPAC数据分析及应用。——以南京航空航天大学图书馆为例
2 h指 数 在 O A 数 据 分 析 中 的 意 义 P C
的信 息 , 掌握 读者 的阅读 倾 向以及 图 书 的借 阅状 况 ,
提 升服务 质量 , 展深层 次服 务工 作 。 开
h指 数 由美 国学 者 赫 希 ( rc . . 于 2 0 Hi h J E ) s 05
年提出, 最初 用 于评 价 科 学 家 成 就 。h是 指 科 学 家 发表 的 h篇论 文 每篇论 文 的被引 次数 至少 为 h1 。 _ j
表4各院系核心读者排名前5的数量本科生硕士生博士生院系核心读者数院系核心读者数院系核心读者数自动化学院19机电学院32机电学院20经济与管理学院航空宇18航空宇航学院能源与20航空宇航学院自动化19航学院16动力学院信息科学与11学院9机电学院15技术学院8能源与动力学院信息科学6理学院15自动化学院7与技术学院5从表4可见机电学院自动化学院航空宇航学院的核心读者最多其次是信息科学与技术学院能源与动力学院这几个学院正是我校实力最强的学院这说明这些学院的学生有较好的学习习惯能够积极利用图书馆的资源
于 图书 情报领 域 的学 术 研 究 水 平 的评 价 , 于 图 ]对
书情报 领域 的 期 刊评 价 , 是 未见 对 于借 阅数 据 ]但
分 析 的 评 价 。 国 内第 一 篇 关 于 h指 数 的 文 章 是
20 0 6年 1月发 表于 《 科学 观 察 》 也 谈 h指 数 的机 的《
关键 词 h指 数 图 书馆 OP AC 数 据
1 引 言
研究 _ , 有一 篇文 章是关 于 图 书馆 流 通数 据 的 1 ]仅 卜
文献 借 阅是 高 校图 书馆传 统读 者服 务 工作 中最
基本 、 主要 的 内容 之一 , 最 随着 自动 化技 术 在 示 例 , 有对 结果 进 行 , 没
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于h指数及扩展指数的探索性因子研究1杜湘1张国飞2(1昆明冶金高等专科学校图书馆,云南昆明6500332西南林业大学图书馆,云南昆明650224)摘要:首先,以Web of science平台的SCI数据库中收录的2010-2014年间收录的冶金科学领域全部论文的元数据作为研究对象,利用探索性因子分析的方法分析在大数据环境下发文数量、总被引次数、篇均被引次数、h指数、G指数、AR指数、R 指数、A指数、Ha指数之间的相关性,再综合分析高产作者和高被引作者评价的有效性和各指数之间的相关性。

关键词:h指数、G指数、AR指数、R指数、A指数、Ha指数,信息计量学,因子分析分类号:G250.252,G253Exploratory Factor Analysis on H-index and its Derivative IndexesDu Xiang1,Zhang Guo-fei2(1.Library,Kunming Metallurgy College,Kunming650033,China2.Library,Southwest Forestry University,Kunming650224,China)Abstract:Keyword:h-index,G-index,AR-index,R-index,A-index,Ha-index,Factor Analysis, H指数是由美国物理学家J.E.Hirsch[1]在2005年提出的用来测度科学家个人科研成绩的一个新指标,即当一个科学家发表的N篇论文中,若有h篇论文且被引用次数都≥h,其余(N-h)篇论文的被引次数都≤h,此h值就是该科学家的H指数[1-2];从H指数的定义来看,H指数均衡了科学家的论文质量和论文数量,有利于科研人员探索深层次科学问题的激情[2]。

它对高被引文章和低被引文章不敏感。

很多研究者修正或者改进h指数,诸如提出了各种衍生指数,比如g指数、A指数、R 指数、AR指数、Ha指数。

一、数据来源和研究方法本次研究以冶金科学为例,从WOS平台获取了被SCI-E收录的2010-2014年间发表的全部论文的元数据,共6752条。

匿名数据58条,最终得到6694篇论文。

针对作者重名现象,本研究采用作者加机构的组合方式尽可能消除作者重名的影响。

针对作者合著现象,本研究采取以第一作者为研究对象,对第二作者及后面作者都不在研究范围之内。

国内外学者已有针对h指数及其衍生指数之间相关性的研究,且取得了一定进展,但这些研究主要是基于小数据集的探索性研究,同时也没有考虑到不同指数序列中的表现。

为了深入分析h指数序列之间的同源关系,评估其在不同层次人才评价中的评价效果,本文在不考虑自引和合著分权的情况下,以2010-2014年SCI收录的1本课题是昆明冶金高等专科学校校级课题“”的成果冶金科学领域的论文作为研究对象,利用探索性因子分析的方法分析在大数据环境下h指数、发文量、篇均被引次数、g指数、A指数、R指数、AR指数、Ha指数之间的相关性,再从作者的发文量和被引次数角度来综合分析高产作者、高被引作者评价的有效性和各指数之间的相关性。

二、相关指标及计算本研究主要考察对象包括发文数量、总被引次数、篇均被引次数、h指数、G指数、AR指数、R指数、A指数、Ha指数。

见表1。

其中发文量主要是指以第一作者在2010-2014年发表且被SCI收录的论文数量。

总被引次数是指2010-2014年间发表且被SCI收录的论文被引用数之和。

H指数,在本文中,我们将H指数的计算表示为科研人员被引频次分布曲线与y=x 的直线的交接点X值(或Y值)(取整数)为该科研人员的H指数。

G指数,即将论文按被引次数由高到低排序,将序号平方,被引次数按顺序累加,当序号平方等于累计被引次数时,该序号则为G指数[3]。

如果序号平方不是恰好等于而是小于对应的累计被引次数,则最接近累计被引次数的序号即为G指数。

AR指数,就是H指数划定的核心论文内,每篇论文的被引次数除以发表年龄的商的总和,然后在开方。

A指数,是H指数划定的核心论文内论文被引用量的平均值。

R指数,H指数划定的核心论文内的论文的被引次数的和的平方根。

Ha指数,h值与h值除以总被引次数的商的和。

表1指标及其代码指标代码指标代码发文数量articles AR指数AR-index总被引次数total citation A指数A-index篇均被引次数Mean.citation R指数R-indexh指数h-index Ha指数Ha-indexG指数g-index三、同源性分析3.1整体因子分析从统计来看,冶金科学领域作者的发文量范围为l-18篇,平均发文1.7篇,由方差和标准差可以看出作者的发文情况相差不大,分布较平均,而平均被引次数为2.19次,从总被引次数的方差和标准差可以看出作者之间的被引情况相差较大,分布较分散。

h指标及类h指标的计算均以文献的被引情况为基础,由定义可以看出:当发表的单篇论文被引次数为0时,它对h指数和类h指数的贡献为0,故零不以引论文为分析对象。

排除零被引论文后,共获得3994篇论文,2922位(第一)作者数据。

用探索性因子分析2922位作者数据。

表2中,作者发文量均值提高到2.37篇,平均被引次数提高到4.70,篇均被引次数的均值提高到4.58,从各类指标的标准差可以看出其分布情况与整体情况,论文数量、h指数、Ha指数、AR指数、G指数的方差均小于l,说明这些指标分值相差较小。

其中尤以h指数均值最小,其标准差仅为0.4195,即各种指标分值相差比较小,不容易区分不同层次的作者。

A指数、R指数、总被引用次数、篇均被引次数的标准差较大,显示在样本数据中,这些指标分值相差较大,其中A指数标准差大于5.8,主要A指标的计算方式(总被引用次数除以h指数的值)造成的。

从上面分析可以看出各指标之间的分值存在较明显的差异性,因此通过探索性因子分析和探讨指标之间的内在关联性。

表2全部指标的均值与标准差指标均值标准差样本数论文数量 2.36610.74222922总被引次数 4.6992 6.22622922篇均被引次数 4.5790 5.62082922h指数 1.12250.41952922g指数 1.20470.72882922AR指数 1.59230.60432922A指数 4.8694 5.80702922R指数 2.2259 1.86352922Ha指数 1.58490.47602922通过SPSS检验,2922名作者各指标的KMO、Barlett球形检验和Sig的结果(分别为0.765、43778.7、0.000)显示,样本数据适合进行因子分析。

在因子分析设置中,以Unweighted least squares(未加权的最小二乘法)进行萃取,Promax转轴法取kappa=3进行斜交转轴(特征值>l,因子载荷值>0.1),经过因子分析,抽取出两个主要因子(我们分别命名为“质量指标”因子1和“数量指标”因子2),因子1可解释性为54.980%,因子2可解释性为33.343%,合计为88.323%(见表3和图1)。

构成因子1的指标有A指数、篇均被引用次数、被引用次数、AR指数;构成因子2的指标有Ha 指数、论文数量、h指数、g指数、R指数。

表3被引次数>0的作者数据的结构矩阵指标因子12A指数0.9890.168篇均被引用次数0.9720.069总被引用次数0.9400.115 AR指数0.8860.504R指数0.7510.780h指数0.2700.975g指数0.2270.821论文数量0.2210.889Ha指数0.2250.649图1被引次数>0作者的因子分析3.2高产作者普赖斯定律指出发文量超过一半的高产作者数等于作者总数的平方根,也即发文量排名前(292254)名的作者可被看作是本领域的高产作者。

本文将高产作者作为研究对象。

表4高产作者全部指标的均值与标准差指标均值标准差样本数论文数量 6.93 2.35945总被引次数34.577818.8613245篇均被引次数 6.5976 3.4826945h指数 3.17780.9603245g指数 4.6667 1.2060545AR指数 3.4318 1.0271545A指数10.2222 4.0333245R指数10.7556 4.317845Ha指数 3.280.9603945统计结果显示高产样本中的总被引次数平均为34.5778篇,标准差达到18.86132,篇均被引次数标准差仅为3.48,表明高产样本中的作者发文总被引次数相差比较大,样本中作者的影响力较高,且相互间区别较小。

与大数据量样本一致的是,h指数、Ha指数的标准差小于1,主要因为这二个指标的分值偏小,代表即使在高产作者群中,这二个指标的计算分值仍然相差不大,区分作者的能力较弱;同时R指数、A 指数的均值与标准差偏大,主要是因为它们的计算分值普遍较大,显示在高产作者中,这二个指标的评价得分范围较广,适用于划分不同的等级。

与整体统计结果不同的是在高产样本中,h指数计算分值的标准差增大了,这主要是高产作者的h指数普遍较大所导致的,从另一个角度可以说明h指数更适用于在高产作者中划分不同水平的作者。

为进一步探讨不同指标在评价高产作者时的情况,本研究对样本数据作探索性因子分析。

KMO、Barlett球形检验和Sig的结果(分别为0.727、747.550、0.00)显示,上述45个高产作者数据可以进行因子分析。

表5高产作者数据的结构矩阵指标因子12论文数量0.5170.133总被引次数0.7580.938篇均被引用次数0.3440.869h指数0.9590.412g指数0.8200.466AR指数0.3730.667A指数0.2300.909R指数0.9320.770Ha指数0.9550.358图2高产作者的因子分析采用和整体因子分析相同的方法可以从高产作者样本中抽取出两个主要的因子,萃取后前者可解释性为59.871%,后者可解释性为21.274%,合计为81.194%。

3.3高被引作者考虑发文量=1的被引次数变异性比较大以及普赖斯定律,所以本文以选择发文量≥2的且篇均被引用次数排名前(292254)名的作者为高被引作者,下面以将高产作者作为研究对象。

表6高被引作者全部指标的均值与标准差指标均值标准差样本数论文数量 2.852 1.23545总被引次数36.88921.85945篇均被引次数9.315 3.36145h指数 2.4630.86245g指数 2.852 1.23545AR指数 3.3510.95145A指数15.4638.97345R指数9.148 3.72345Ha指数 2.5340.85945统计结果显示高被引样本中的总被引次数平均上升为36.889篇,标准差达到21.859,表明高被引样本中的作者发文总被引次数相差比较大,样本中作者的影响力较高,且相互间区别较大。

相关文档
最新文档