CitNetExplorer——一款新的科学文献分析软件介绍与评价

CitNetExplorer——一款新的科学文献分析软件介绍与评价刘冬潇;许振亮;王春博;阎鑫

【摘要】CitNetExplorer是莱顿大学的Van Eck与Waltman及其团队研发的一款新的科学文献计量分析软件.本文首先介绍了CitNetExplorer的基本功能与主要界面,以及如何通过CitNetExplorer软件来构建文献引文网络,并梳理了CitNetExplorer在网络图谱可视化方面的一些功能优势;其次,通过应用举例来具体说明利用CitNetExplorer来分析科学文献引用关系的具体流程与步骤;最后,指出了其现有的不足及有待改进之处.

【期刊名称】《信息资源管理学报》

【年(卷),期】2016(000)002

【总页数】12页(P51-62)

【关键词】CitNetExplorer;引文网络;可视化;文献计量分析

【作者】刘冬潇;许振亮;王春博;阎鑫

【作者单位】内蒙古大学经济管理学院,呼和浩特,010020;内蒙古大学经济管理学院,呼和浩特,010020;内蒙古大学经济管理学院,呼和浩特,010020;内蒙古大学经济管理学院,呼和浩特,010020

【正文语种】中文

【中图分类】TP319

随着信息技术和科学计量学的发展,大数据挖掘技术已成为学者和各大公司研究的热点。在科学计量研究中,如何在海量的数据中挖掘有用的信息,并利用可视化研

究工具,创建清晰的知识图谱,已成为国内外学者正在研究的热点问题。在众多问题研究中,文献引用关系在科学文献检索中的应用是非常关键的。目前研究人员将研究的重点放在关于科学文献的作者共被引网络及关键词共现网络上。然而,文献计量网络中研究频率最高的是基于引用关系的,例如期刊、作者或者文献之间的共引关系网络或者书目耦合网络,而关于直接引文网络的研究在科学计量学的研究中相对少见。在直接引文网络的可视化研究中,Garfield和他的团队做出了重大贡献。Garfield强调了直接引文网络对于研究某个研究领域的历史与发展有重要价值,他将其称为引文编年图。Garfield也借此开发了一款软件叫做HistCite,可以用来构建和可视化基于Web of Science数据库的直接引文网络。荷兰莱顿大学的Van Eck与Waltman开发了CitNetExplorer,一款用来分析和可视化直接引用网络的软件。这是继VOSviewer之后开发的第二款科学文献计量分析软件,VOSviewer是一款主要用于科学文献计量网络分析的软件[1]。CitNetExplorer是citation network explorer的缩写,也是建立在Garfield关于引文编年图的研究基础之上。与HistCite相比,CitNetExplorer可以处理更大的引文网络,包括数百万文献和引用关系;并且,CitNetExplorer具有更加复杂的功能,例如深度探索引文网络,即允许用户将包含数百万文献的大型引文全网络深度探索提炼至不足一百篇文献的局部子网络,并且该过程紧紧围绕某个具体的研究主题。CitNetExplorer在用于研究领域科学文献的引文网络分析和可视化的前提下,还涉及到研究某个研究领域科学文献的演化情形。CitNetExplorer也可以用于基于引用关系的系统文献的检索。该工具可以充当基于引用关系的一些文献数据库中执行的信息检索功能的原型。CitNetExplorer的优势是它可以直接从Web of Science中输入引文网络,而且引文网络可以交互探索,例如可以通过某个网络的深度探索来识别那些具有密切联系的文献的聚类。

CitNetExplorer是由荷兰莱顿大学(Leiden University)科学技术研究中心(Centre

for Science and Technology Studies (CWTS))Nees Jan van Eck与Ludo Waltman领导的研究团队继VOSviewer之后研发的一款科学文献引文网络图谱

分析软件。为什么要选择使用CitNetExplorer软件,可以通过介绍CitNetExplorer的四个主要特点来解释。① CitNetExplorer可以分析某个研究领域随着时间推移的发展轨迹。CitNetExplorer可以将某个研究领域最重要的文献

可视化,并且显示这些文献之间的引用关系,表明这些文献之间的相互联系。

②CitNetExplorer可以识别某个研究主题中的文献,通过识别联系紧密的文献之

间的引用关系,来描绘该研究领域引文网络的特征。③CitNetExplorer可以探索

某个研究者的所有文献,它可以将某个研究者的文献引文网络可视化,并显示某个研究者的著作是如何影响其他研究者的文献的。④CitNetExplorer支持文献综述,即可以通过CitNetExplorer软件识别出某个特定文献的被引或施引文献群,从而

实现文献的系统化获取以便于综述[2]。

启动CitNetExplorer软件,可以得到图1所示的用户界面示意图。

2.1 主要菜单栏

CitNetExplorer的用户界面中的一级菜单栏主要有打开(Open)、保存(Save)、截

图(Screenshot)、选项(Options)、后退(Back)、前进(Forward)、全网络(Full network)、清除选择(Clear selection)、深度探索(Drill down)、扩展(Expand)、群组(Groups)、分析(Analysis)和帮助(Help)栏。

(1)打开(Open)。打开菜单栏的主要功能是读取从数据库中获取的数据。CitNetExplorer可以打开的文件有WoS下拉框中的WoS文件(Web of Science files)和CitNetExplorer下拉框中的文献文件(publications file)与引文文件(citations file),另外WoS下拉框中还有包括非匹配引文参考文献(Include non-matching cited references)下拉框,其参数选择为最小引文数(Minimum number of citations)框。

(2)保存(Save)。保存菜单主要用于保存可视化面板中的引文网络与文献。当要保存可视化面板中的现有网络时,点击保存菜单,弹出保存现有网络对话框,分别选择文献文件和引文文件的文件名,点击OK,现有的网络就保存成功了。但是当保存引文网络后再次打开它时,包含在可视化面板中的文献选择可能会改变了,为了避免这个问题,可以在选项菜单中用外部引文分值选项代替内部引文分值。而且,文献到群组的分配也丢失了,为了避免丢失可以使用群组菜单中的输出群组和输入群组选项。

(3)截图(Screenshot)。截图选项用于研究人员根据需要截取可视化面板中引文网络的图谱。

(4)选项(Options)。选项(Options)菜单栏中有二个二级菜单栏:引文分值(citation scores)、群组颜色(Group colors)。在引文分值下有四个选项:使用外部引文分值(Use external citation scores)、使用内部引文分值(Use internal citation scores) 、引文窗口长度(citation window scores)和精细计算引文(count citations fractionally)。外部引文分值表明某个文献所有的引文数量,通过计算某个书目数据库(例如:Web of Science)中所有文献的引用关系而得,也可以分析引文网络外部文献的引用关系。内部引文分值表明被分析的引文网络内部某个文献的引文数量,引文窗口长度框中默认值是1000,如果选择精细计算引文选项,每个被引文献外部的引文数量分别的引文的权重则为1,如果没有选择精细计算引文选项,每个引文的权重则为1。群组颜色下有三个选项:红色、绿色和蓝色。每个对应的数字选择范围都是整数0——255。

(5)后退(Back)。用于引文网络和核心文献等分析中子网络图谱的切换,类似于网页浏览器中的后退选项。

(6)前进(Forward)。前进菜单也用于引文网络和核心文献等分析过程中的子网络图谱的切换,类似于网页浏览器中的前进选项。

(7)全部网络(Full network)。在分析子网络时,使用全部网络选项可以恢复到初始的引文网络,即恢复到没有通过各种条件识别出的局部网络或者扩展后的网络。(8)清除选择(Clear selection)。清除选择选项主要用于清除可视化面板中对引文网络的一些操作,例如,可以清除网络中被标记或被选择的文献,也可以清除网络中分配的群组等。

(9)深度探索(Drill down)。该选项的主要功能就是局部深度分析引文网络。利用被标记或者被选择等选项来有条件地缩减引文网络中科学文献的数量,再对已经标记或者选择的文献进行深度地分析与探索。

(10)扩展(Expand)。扩展菜单栏主要用于现有网络的扩展。下拉框中的选项有四

个选项卡:文献(Publications)、最小引文链接数(Min. number of citation links)、最大距离(Max. distance)和加入中介文献(Add intermediate publications)。文

献的下拉框下包括三个参数选项:被引文献(Predecessors)、施引文献(Successors)和被引文献与施引文献(Predecessors and successors)。现有的网

络可以通过被引文献、施引文献和被引文献与施引文献同时来扩展。被现有网络中文献引用的文献就是被引文献,而施引文献则是引用了现有网络中文献的文献。为了包含在扩展中,被引文献或施引文献必须要有现有网络面板中文献的最小引文链接数,同样,为了包含在扩展中,最大距离就是现有网络面板中被引或施引文献与现有网络面板中文献之间的距离,最大距离为1只产生一个直接的被引和施引文献,最大距离为2能够产生二阶的被引和施引文献,以此往复。中介文献是存在

于一篇文献到另一篇文献的引文路径中的文献。例如,如果文献A引用文献B,

并且文献B引用文献C,那么文献B就是文献A和文献C之间的一个中介文献。(11)群组(Groups)。群组菜单栏中有七个选项:取消群组(Undo groups)、重建群组(Redo groups)、清除所有群组(Clear all groups)、分配文献到群组(Assign publications to group)、从群组中去除文献( Remove publications from

group)、输入群组(Import groups)和输出群组(Export groups)。共清除所有群

组选项中包含清除全部网络和清除现有网络两个选项卡。分配文献到群组选项中,选择要被分配到群组的文献时有多个选项,可以选择所有的文献,也可以选择标记了的文献,某个群组中的文献,甚至不在任何一个群组中的文献,或者现有网络中的文献等;分配到的群组也有两个选择,可以将文献分配到一个新的群组,也可以将文献分配到现有的群组。去除群组选项中的文献也是同样的道理,既可以去除所有文献,也可以去除已经选择或标记过的文献,还可以去除某个群组中的文献和现有网络中的文献。输入和输出群组时都可以选择输入全部网络或者现有网络。(12)分析(Analysis)。分析菜单栏中有五个选项:连接成分(Connected components)、聚类(Clustering)、核心文献(Core publications)、最短路径(Shortest path)和最长路径(Longest path)。连接成分选项中可以选择识别最大

的连接成分或者识别所有的连接成分。在识别所有的连接成分时,还可以设置最小成分的大小。在聚类菜单中,科学文献是根据它们的引用关系来聚类的。在引文网络中分配到同一聚类的文献联系更加紧密。分辨率参数决定聚类的细节水平,参数的值越大,聚类的数量就越大。在聚类菜单栏中,有聚类参数面板和优化参数面板。在聚类参数面板中,分辨率的默认值是1,最小聚类的大小默认值是10,但两者

都可以根据实际需要进行修改。聚类参数面板中还有一个选项就是合并小聚类,如果选择该选项,小聚类(文献的数量低于最小聚类的大小)将会尽可能地与其他聚类合并。如果不选择该选项,则小聚类将会被丢弃,并且它们中的文献将没有进行聚类分配。Waltman与Van Eck在早期的文章中对CitNetExplorer软件中聚类分

析采用的方法进行了详细的阐释[3],具体而言,文献聚类的算法公式如下:

其中,n代表引文网络中文献的数量,aij代表文献i与文献j的相关性,γ代表分辨参数,ui代表文献i所属的聚类。如果ui = uj,δ(ui, uj)=1,否则δ(ui, uj)=0。文献i与文献j的相关性:

其中,如果文献i引用了文献j,cij=1,否则cij=0。因此,如果文献i引用了文

献j,文献之间的相关性与引文网络中文献i引用的文献总数成反比。如果文献i

没有引用文献j,文献之间的相关性则等于0。公式(1)中分辨参数的值可以由用户自行选择。分辨参数的值越大,最终形成的聚类数量就越多。分辨参数的默认值是1。 CitNetExplorer软件中的聚类算法通常能够识别相对有限的较大聚类,也可

以识别更多较小的聚类。有时聚类会非常小,例如聚类中只包含一个或两个文献。因为在很多情况下,较小的聚类价值相对有限,所以CitNetExplorer允许用户指

定一个最小的聚类大小。那些太小的聚类可以被丢弃,或者与其他聚类合并。在优化参数面板中,随机启动的默认值是1,迭代的默认值是10,随机种子的默认值

是0,这三个参数也可以根据实际情况进行修改。不管是输入还是输出,核心文献就是至少与其他核心文献有一定最少数量的引文链接的文献。其中,最大引文链接选项的默认值是1,同时也可以选择将核心文献分配到新的群组或者现有的群组。最短路径和最长路径都用于识别被标记的文献。

(13)帮助(Help)。帮助菜单栏主要用于帮助用户更好地了解CitNetExplorer软件,有关于软件开发的介绍,用户手册和检查更新等。

2.2 主要面板

CitNetExplorer中有四个主要面板:现有网络面板(Current network panel)、选择参数面板(Selection parameters panel)、可视化面板(Visualization panel)和

信息面板(Information panel)。

(1)现有网络面板(Current network panel)。现有网络面板用于显示文献的总数和引文网络中引用关系的数量。当鼠标移动到某个文献时,一些书目信息将会显示在信息面板中。例如,作者:zahra,sa;题目Predictors and financial outcomes of corporate entrepreneurship: An exploratory study;来源:Journal of Business Venturing;年份:1991;引用分值:125。

(2)选择参数面板(Selection parameters panel)。选择参数面板有三个选项:选择(Selection)、文献(Publications)和加入中介文献(Add intermediate publications)。选择选项卡中有三种可以选择现有网络中文献的方法。第一种,

可以根据已经标记的关键文献来选择文献;第二种,可以选择在某个固定时期内的所有文献;第三种,可以选择所有被分配到固定群组的文献。文献选项卡中有四种方法可以用已经标记的文献在现有的网络中选择文献。一种可能的方法是在选择中只包括已经标记的文献;其他三种可能的方法是在选择中不仅包含已经标记的文献,而且包括被引文献、施引文献、或者同时包含被引文献与施引文献。被引文献是已经被标记文献引用的文献。施引文献就是引用已经被标记文献的文献。如果选择加入中介文献选项,包含在选择中的两个文献之间的中介文献也将会加入到选择中。

(3)可视化面板(Visualization panel)。可视化面板就是显示引文网络和文献的面板。在可视化面板中导入来自Web of Science中的数据文件,则会显示引文网络图谱。在引文网络中,每个圆圈代表一个文献,文献由第一作者的姓氏所标注。为了避免标签重叠,一些标签可能被隐藏了。默认情况下,可视化面板中只有40个引用频次最高的文献。某个文献的显示坐标中,其水平方向由它与其他文献的引用关系所决定,它的垂直方向由它的出版年份所决定。圆圈与圆圈之间的曲线代表引用关系。引用关系是向上的方向,被引的文献通常在引用的文献上方。可以使用鼠标轮或鼠标右键来放大引文网络,使用鼠标左键来滚动,同时可以选择性使用导航面板。可视化面板中还有文献列表。在文献列表中,可以根据作者名、文章题目、来源、首年、末年、最小引文分值、最大引文分值和群组等标签再次查询或者清除文献。输入上面提到的任何一个标签,下面列表中就会显示文献的信息,包括作者、题目、来源、年份和引文分值。既可以包括所有文献,也可以显示被选择文献或者被标记文献。在文献列表的最下方有四个选项卡:标记文献(Mark publication)、取消标记文献(Unmark publication)、标记所有文献(Mark all publications)和取消标记

所有文献(Unmark all publications)。

(4)信息面板(Information panel)。信息面板主要用于显示某个文献的详细信息。

当鼠标移动到可视化面板中的某个文献时,一些文献的信息将会显示在信息面板中。与其他知识图谱可视化分析软件相比,CitNetExplorer软件在引文网络中核心文

献分析、引文网络局部网络的深度探索和现有网络面板中引文网络的扩展研究方面有显著优势。

3.1 可直接处理原始数据

相比于其他软件如Ucinet,Citespace和Sci2等,CitNetExplorer软件在数据获取与准备阶段最显著的优势就是它不需要借助第三方,如Bibexcel等,来处理原

始数据,才能获得知识图谱分析软件能够读取的文件格式。例如,Sci2可以加载

多种数据格式(包括.xml、.net、.isi、.csv、.bib、.enw、.nsf等不同格式)[4],但是它还是无法直接处理从Web of Science中获取txt文件,需要经过一定的处理才能加载,而CitNetExplorer软件则可以直接导入从Web of Science中下载的

原始数据,即,可以直接加载原始数据的txt文档。这个优势极大地帮助研究者缩减数据获取和准备的时间,也极大地方便了研究者进行科研工作。

3.2 可深度探索和扩展引文网络

深度探索(Drill down)功能是CitNetExplorer软件的第二大优势。简单地说,深

度探索就是减少引文网络中已经选择文献的数量。当在可视化面板中形成科学文献的引用关系整体网络时,即使隐藏了重叠的标签,但还是有部分文献之间的引用关系由于标签过于紧凑而无法准确识别,此时则需要深度探索功能来深度分析局部子网络的引文网络。例如,在选择参数面板中务必选择基于被标记的文献,同时选中加入中介文献选项,在可视化面板中选择任意两个圆圈,两个科学文献就被标记了,选择面板中的参数也就更新了,被标记文献将用方块表示,被选择文献外围有红线圈住。此时点击深度探索菜单来深度分析包含某些数量文献的子网络,可视化面板

中的引文网络也就更新了。通过深度探索,可以更加仔细准确地识别科学文献的引用关系,尤其是引文网络中比较密集地区的科学文献,也可以深度探索被标记和被选择文献之间的子网络的引用关系。

和深度探索功能相反,CitNetExplorer软件的扩展功能就是增加引文网络中的文

献数量。这个功能可以通过点击扩展菜单栏,待弹出扩展现有网络对话框后,在文献选项中选择被引文献和施引文献(predecessors and successors)选项,将最小

引文链接设置为2,确认最大距离的值设置为1,同时务必取消选择加入中介文献选项,点击OK选项,现有的子网络被扩展了,扩展后的网络中就包含了网络中文献的被引文献和施引文献,有利于了解更多与研究主题相关的文献之间的引文关系。

3.3 可有条件地识别文献

相比于其他网络图谱可视化软件,CitNetExplorer软件可以有条件地识别文献。(1)可以通过识别某个引文网络中的连接成分、聚类或者核心系列来识别一系列相

关的科学文献。在分析菜单中,利用连接成分选项可以识别最大连接成分和所有连接成分。点击识别最大连接成分,则会根据引文网络中的科学文献来识别最大的一个连接成分,该成分包含的文献数量也会显示,同时这些被识别的文献将会被分配到一个群组中。聚类分析就是可以有条件地将引文网络中的文献分配到群组,并用不同的颜色表示每一个群组,同时,每一个群组与已经识别的总的群组中的其他群组是相对应的。而核心文献分析则是利用特定条件将引文链接在一定数值以上的文献识别出来,可以将他们分配到一个新的群组,也可以将他们分配到现有的群组中。这个识别的过程可以利用分析菜单中的核心文献对话框,最小引文链接数选项中设置引文链接数的大小来进行核心文献的识别。

(2)识别一系列被选择文献的被引文献(Predecessors)和施引文献(Successors)。

在扩展菜单中,可以选择被引文献、施引文献或者被引文献与施引文献选项来扩大可视化面板中的现有网络,这样研究人员就可以轻而易举地识别与现有网络面板中

的文献有被引或者施引关系的文献了。在这三个选项的使用过程中,可以通过选择最小引文链接数来决定加入被引和施引文献的数量,务必将最大距离的值设置为1,并取消选择加入中介文献选项。

(3)可以识别存在于两个被选择文献之间的引文路径中的科学文献。在分析菜单栏

中利用最短或者最长路径选项可以识别两个被选择文献之间的引文路径中的科学文献。在最长或者最短路径对话框中,可以将识别出的文献分配到一个新的群组,也可以将它们分配到现有的群组,点击OK选项后,多个最短或最长路径长度为某个值的引文文献被识别了,如果被分配到一个新的群组,那么可视化面板中的引文网络将被更新,识别出的文献被用一个新的颜色表示。

4.1 数据获取

CitNetExplorer的优势之一就是可以直接处理Web of Science中下载的数据,

本文将从如何在Web of Science中下载1971—2014年关于公司创业的文献开

始来举例说明CitNetExplorer软件的使用。打开Web of Science,将所有数据

库(All Databases)改成Web of ScienceTM核心集(Web of ScienceTM),根据

检索式TS =(“corporate entrepreneurship”),对Web of science进行主题

检索,时间跨度为1971—2014年,检索语言选择“English”,文献类型为“Article”,选择SCI-EXPANDED、SSCI、CPCI-S、CPCI-SSH四大数据库,下载文章数为430篇,数据的最后更新时间为2014年11月20日。为了将这些文

献的书目数据保存在一个文件夹中,选择保存为其他文件格式选项。在发送到文件夹对话框中,数目记录中选择记录1到430,在记录目录中选择保存所有记录和

引文参考文献选项,在文件格式中选择带有分隔符的文本(Tab-delimited(Win)),也可以选择纯文本格式。点击发送,数目数据就会下载在一个名为“savedrecs.txt”的文档,将其更名为“ce.txt”,并存放在一个便捷的位置。

4.2 构建文献引文网络

利用CitNetExplorer构建文献引文网络时,关键的步骤有以下几个:

(1)可视化图谱。如果是直接从Web of Science中下载下来的未经加工处理的原

始数据,在打开引文网络对话框中选择Web of Science文档,并取消选择未匹配引文参考文献,则被引文献中题目、摘要与关键词不包含创业的文献就不会包含在引文网络中。点击OK,公司创业文献的引文网络可视化图谱就出现了,如图2所示。

(2)可视化文献。在CitNetExplorer可视化面板中包含两个子面板,引文网络面板和文献面板。在引文网络面板中,每一个圆圈代表一个文献,每个文献都由第一作者的姓氏标注,例如图2中的burgelman,zahra等。和VOSviewer类似,为了避免标签的重叠,一些标签可能被隐藏了,默认情况下,只有40个引用频次最高的文献包含在可视化面板中。图中标签的排列是按照文献的引用和被引用关系、以及出版的年份决定的。一个文献的网络图中横坐标由它与其他文献的引用关系决定,其纵坐标由文献出版的年份决定。文献之间的曲线代表引用关系。引用关系的方向是向上的,也就是说被引的文献总是在引用的文献的上方。在现有网络面板中,显示文献的总数为430篇,引文链接总共有2184个,时间段为1971—2014年。

在信息面板中会显示文献的数目信息,例如:将光标放在zahra这个圆圈上,信

息面板中就会显示作者:zahra,sa;题目Predictors and financial outcomes of corporate entrepreneurship: An exploratory study来源:Journal of Business Venturing;年份:1991;引用分值:125。文献面板是关于文献信息

的详细记录,例如图3。

(3)文献的深度挖掘。CitNetExplorer一个很大的优势就是深度挖掘数据。得到以

上文献列表后,返回到引文网络标签,务必选中选择参数面板中的基于标记的文献选项,同时,务必选中加入中介文献。在可视化面板中点击1991年的‘zahra’

和2009年的‘hornsby’,这样一来两个文献就都被标记了。在选择参数面板中

基于现有的设置,如果文献是被标记文献或者中介文献,那么文献就被选定了。在选择面板中显示有10个文献被选择了,在这些文献中间有25个引用关系,如图4所示。被标记后可视化面板中已经被标记的文献由一个方块表示,代替了默认的圆圈。而已经选择的文献外部由红线圈定,如图5所示。点击深度探索菜单来向下探索包含了10个已经选择的文献的子网络,可视化面板中的引文网络图就更新了,现有网络面板中的数据显示也就更新了,如图6所示。

(4)引文网络的扩展。点击扩展按钮,出现了扩展现有网络对话框,务必选择被引文献与施引文献选项。被引文献就是现有子网络中至少被一定最小数量文献引用的文献。施引文献就是现有子网络中至少引用一定最小数量文献的文献。再将最小引文链接数设置为2,确认最大距离值设置为1,并且确认取消选择添加中介文献选项,点击OK选项来扩展现有的子网络。扩展之后,现有的子网络包含170篇文献,现有网络面板中的参数也会相应的更新,如图7所示。

(5)前进和后退。利用菜单栏中的后退菜单将当前的网络还原到以前的网络,就是只包含10个文献的网络,再次点击后退菜单,将网络还原到更早以前的网络,可以还原到最初的全部网络。菜单栏中的后退和前进菜单可以用于子网络之间的前进和后退,等同于网页浏览器中的前进和后退菜单。全部网络按钮可以用于将网络恢复到初始的网络,类似于网页浏览器中的主页键。点击清除选择按钮来取消选择所有被选择的文献和取消被标记的文献的标记。

(6)聚类分析。在聚类分析中,文献是根据他们的引用关系来聚类的。引文网络中被分配到同一聚类的文献互相具有更加亲密的联系。分辨率参数决定聚类程度的详细水平,参数值越大,可以获得的聚类的数量就越多。点击分析菜单栏中的聚类,弹出聚类对话框,设置分辨率参数为2,合并小的聚类。点击OK,可视化面板中更新出11个聚类,分别用不用的颜色表示,颜色相同的圆圈表示同一个聚类,如图8所示。在选择参数面板中,选择基于群组选项,检查群组1来选择已经被分

配到群组1中的122篇文献,点击深度探索菜单来深度分析包含这122个文献的子网络。深度分析之后,现有的子网络中包含122篇文献,可视化面板中的引文网络图和现有网络面板中的参数值都更新了,如图9所示。

(7)核心文献。在群组1引文网络图谱的基础上,点击分析菜单栏中的核心文献,弹出核心文献对话框,设置最小引文链接参数为4,点击OK按钮,出现99篇核心文献。其中的每一篇文献与其他核心文献至少有4个引用关系。在本例中,核心文献被分配到群组12,可视化面板中的引文网络更新了,如图10所示。在选择参数面板中,选择群组12 的99篇文献,点击深度探索按钮来深度分析包含了这99篇文献的子网络,如图11所示。

(8)最短/长路径。最短路径和最长路径是相似的。在可视化面板中,点击 1983年中的‘burgelman’和2009年中的‘hornsby’ 来标记这两个文献,再点击分析菜单中的最长路径,在最长路径对话框中,选中将最长路径文献分配到新群组13,点击OK按钮。多个长度为8的最长路径被识别了,这些路径中的文献被分配到群组13,可视化面板中的引文网络更新了。再选择参数面板,选中群组13来选择被分配到群组13的9篇文献,点击深度探索按钮来深度探索包含这9篇文献的子网络。点击可视化选项按钮,弹出可视化选项对话框,选中传递缩减(Transitive reduction)选项,得到最长路径图,如图12所示。一个引文网络的传递缩减中,只有当有必要保存网络结构的连接性时,引用关系才被保留。例如,如果A引用了B和C,B引用了C,那么A和C之间的引用关系是不包括在传递缩减中的,因为A和C是通过B而连接的。点击OK按钮后,可视化面板中显示有两条最长路径,这两条路径几乎完全是一致的。

(9)保存引文网络。点击两次后退按钮返回到包含112篇文献的子网络中,为了保存这个子网络,点击现有网络面板中的保存菜单,弹出保存现有网络对话框,选择‘publications.txt’作为文献文件的命名,选择‘citations.txt’作为引文文件的

名称,点击OK,引文网络就保存了。再一次打开引文网络的时候,点击打开菜单,弹出打开引文网络对话框,前往CiNetExplorer标签,选择文献文件

‘publications.txt’和引文文件‘citations.txt’,点击OK,这样一来引文网络就再次被打开了。在保存引文网络并再次打开它时,可视化面板中包含的文献选择可能发生了改变。为了避免这一点,使用选项对话框中的外部引文分值代替内部引文分值。同时,重新打开引文网络时文献到群组的分配丢失了。如果不想丢失这些信息的话,请使用群组菜单中的输出群组和输入群组选项。

基于以上分析可以看出,CitNetExplorer在科学文献引用关系分析上有很多创新

的功能,比如利用文献出版的年份和引用关系来确定网络中圆圈的位置、核心文献的分析、引文网络的局部深度探索等。但是在科学文献计量分析中,CitNetExplorer软件还是存在一些局限性。

(1)CitNetExplorer软件只能分析科学文献的引文网络,而不能从其他视角来分析,例如无法从关键词共现方面来分析引文网络。

(2)CitNetExplorer软件虽然能直接处理Web of Science中的原始数据,但还是

无法全面地处理其他大型数据库中的原始数据,例如Scopus, Google Scholar等。

(3)CitNetExplorer软件在绘制图谱时没有嵌入相关的网络结构分析算法,因而无

法显示链接的权重,也没有用标签的圆圈大小来表示文献节点的被引次数,进而无法直观地可视化出引文网络图谱中标签之间引用的次数和权重等。

【相关文献】

[1] Van Eck N J, Waltman L.Software survey: VOSviewer, a computer program for bibliometric mapping[J]. Scientometrics, 2010, (84): 523-538

[2] Van Eck, N J, Waltman L. Visualizing bibliometric networks[A]. Ding Y,Rousseau

R,Wolfram D ed. Measuring scholarly impact: Methods and

practice.Switzerland:Springer,2014:285-320

[3] Waltman L, Van Eck N J. A new methodology for constructing a publication-level classification system of science[J]. Journal of the American Society for Information Science and Technology, 2012,63(12):2378-2392

[4] 邱小花,李国俊,肖明.Sci2——一款新的知识图谱分析软件介绍与评价[J].图书馆杂志,2013(9):79-87

[5] Van Eck N J, Waltman L. CitNetExplorer: A new software tool for analyzing and visualizing citation networks[J]. Journal of Informetrics, 2014, 8(4):802-823

[6] Van Eck N J, Waltman L. Systematic retrieval of scientific literature based on citation relations: Introducing the CitNetExplorer tool[C]// Proceedings of the First Workshop on Bibliometric-enhanced Information Retrieval Co-located with 36th European Conference on Information Retrieval (ECIR 2014). Amsterdam, Netherland, 2014:13-20

[7] CitNetExplorer homepage[EB/OL].[2014-12-15]. http://www.citnetexplorer.nl/Home

[8] CitNetExplorer Get Started Manuel[EB/OL].[2014-12-

15].http://www.citnetexplorer.nl/getting-started

CitNetExplorer——一款新的科学文献分析软件介绍与评价

CitNetExplorer——一款新的科学文献分析软件介绍与评价刘冬潇;许振亮;王春博;阎鑫 【摘要】CitNetExplorer是莱顿大学的Van Eck与Waltman及其团队研发的一款新的科学文献计量分析软件.本文首先介绍了CitNetExplorer的基本功能与主要界面,以及如何通过CitNetExplorer软件来构建文献引文网络,并梳理了CitNetExplorer在网络图谱可视化方面的一些功能优势;其次,通过应用举例来具体说明利用CitNetExplorer来分析科学文献引用关系的具体流程与步骤;最后,指出了其现有的不足及有待改进之处. 【期刊名称】《信息资源管理学报》 【年(卷),期】2016(000)002 【总页数】12页(P51-62) 【关键词】CitNetExplorer;引文网络;可视化;文献计量分析 【作者】刘冬潇;许振亮;王春博;阎鑫 【作者单位】内蒙古大学经济管理学院,呼和浩特,010020;内蒙古大学经济管理学院,呼和浩特,010020;内蒙古大学经济管理学院,呼和浩特,010020;内蒙古大学经济管理学院,呼和浩特,010020 【正文语种】中文 【中图分类】TP319 随着信息技术和科学计量学的发展,大数据挖掘技术已成为学者和各大公司研究的热点。在科学计量研究中,如何在海量的数据中挖掘有用的信息,并利用可视化研

究工具,创建清晰的知识图谱,已成为国内外学者正在研究的热点问题。在众多问题研究中,文献引用关系在科学文献检索中的应用是非常关键的。目前研究人员将研究的重点放在关于科学文献的作者共被引网络及关键词共现网络上。然而,文献计量网络中研究频率最高的是基于引用关系的,例如期刊、作者或者文献之间的共引关系网络或者书目耦合网络,而关于直接引文网络的研究在科学计量学的研究中相对少见。在直接引文网络的可视化研究中,Garfield和他的团队做出了重大贡献。Garfield强调了直接引文网络对于研究某个研究领域的历史与发展有重要价值,他将其称为引文编年图。Garfield也借此开发了一款软件叫做HistCite,可以用来构建和可视化基于Web of Science数据库的直接引文网络。荷兰莱顿大学的Van Eck与Waltman开发了CitNetExplorer,一款用来分析和可视化直接引用网络的软件。这是继VOSviewer之后开发的第二款科学文献计量分析软件,VOSviewer是一款主要用于科学文献计量网络分析的软件[1]。CitNetExplorer是citation network explorer的缩写,也是建立在Garfield关于引文编年图的研究基础之上。与HistCite相比,CitNetExplorer可以处理更大的引文网络,包括数百万文献和引用关系;并且,CitNetExplorer具有更加复杂的功能,例如深度探索引文网络,即允许用户将包含数百万文献的大型引文全网络深度探索提炼至不足一百篇文献的局部子网络,并且该过程紧紧围绕某个具体的研究主题。CitNetExplorer在用于研究领域科学文献的引文网络分析和可视化的前提下,还涉及到研究某个研究领域科学文献的演化情形。CitNetExplorer也可以用于基于引用关系的系统文献的检索。该工具可以充当基于引用关系的一些文献数据库中执行的信息检索功能的原型。CitNetExplorer的优势是它可以直接从Web of Science中输入引文网络,而且引文网络可以交互探索,例如可以通过某个网络的深度探索来识别那些具有密切联系的文献的聚类。 CitNetExplorer是由荷兰莱顿大学(Leiden University)科学技术研究中心(Centre

第一作者和全部作者耦合在领域知识结构发现中的比较--基于硅纳米材料领域的实证分析

第一作者和全部作者耦合在领域知识结构发现中的比较--基于 硅纳米材料领域的实证分析 沈利华;李红;张辉 【摘要】作者耦合分析( ABCA)通过作者间引文的相关性可以用来发现研究领域的知识结构。以硅纳米材料领域为对象,利用文献计量学统计工具bibexcel和可视化分析软件VOSviewer,对作者耦合分析方法的两种网络---第一作者耦合网络和全部作者耦合网络,在发现领域研究热点和知识结构中的应用进行了实证研究和比较分析,从而发掘两种耦合网络在发掘领域知识结构方面各自不同的特点,为ABCA的研究发展提供一种新的视角。%Author bibliographic-coupling analysis ( ABCA) has been a tool for the study of the intellectual structure of research fields by analyzing the correlation of the author's citings. Taking the silicon nanomaterial field as an example, we compare first-author ABCA with all-author ABCA by bibliometric tool bibexcelland visualized analysis software VOSviewer. By applying the two analysis methods to ex-plore the research focus and intellectual structure of the research fields, we hope to find some features of the two methods respectively in exploring the intellectual structure of research fields, and provide a new perspective for the development of ABCA research. 【期刊名称】《情报杂志》 【年(卷),期】2014(000)004 【总页数】7页(P23-28,51)

相关主题
相关文档
最新文档