CSSCI 数据导入Bibexcel 实现共现矩阵的方法及实证研究

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

CSSCI数据导入Bibexcel实现共现矩阵的方法及实证研究

姜春林陈玉光

(大连理工大学21世纪发展研究中心辽宁大连 116024)

摘要:本文以针对Web of Knowledge开发的文献信息共现分析的应用软件——Bibexcel为研究对象,结合CSSCI数据库数据格式特点,解决了Bibexcel不能处理中文文献的瓶颈问题,实现了知识单元共现关系矩阵。并以CSSCI数据库中1998—2008年“信息可视化”引文数据为例,数据经过预处理后,由Bibexcel 构建其知识单元共现矩阵,利用Ucinet、Netdraw软件,实现了作者共现、关键词共现、引文共现的可视化分析。本研究扩展了Bibexcel的应用范围功能,为CSSCI数据的可视化研究提供了一种新的手段。

关键词:Bibexcel、CSSCI、共现矩阵、知识图谱、可视化

Transform CSSCI Data to Bibexcel data to Actualize Co-occurrence Matrix and A Case Study

JIANG Chun-lin, CHEN Yu-guang

(Center of the 21st Century Development and Research, Dalian University of Technology, Dalian 116024)

Abstract:This paper researchs on Bibexcel that developed for the co-occurrence analysis of literature information that come from Web of Knowledge, and combined with the characteristics of data formats in the CSSCI database, to resolve the bottleneck of co-occurrence of Chinese literature information which Bibexcel can not handle by itself. We actualized the co-occurrence matrix of knowledge unit relations. CSSCI database in 1998-2008 "Information Visualization" Citation data as an example, after data preprocessing, the knowledge unit co-occurrence matrix built by Bibexcel,then we use Ucinet, Netdraw softwares,to actualizes the authors cooperative network analysis、keywords cooccurrence analysis and cocitation analysis. This study extends the scope of application of Bibexcel, and provides a new means of visualization for CSSCI data.

Keywords:Bibexcel、CSSCI、Co-occurrence matrix、Knowledge map、visualization

1.引言

科技文献数据量的快速增长给我们的研究工作带来了极大便利,同时,文献数量的增长,也给文献的管理与分析利用带来了诸多的不便[1]。如何快速、准确地得到所需要的资源,并理解这些大量文献所表达的内容变得越来越困难。共现分析如共作者分析、共词分析、共引分析、共被引分析等以邻近联系法则和知识结构及映射为方法论基础,来发现研究对象之间的亲疏关系,挖掘隐含的或潜在的有用的知识,并揭示研究所代表的学科或主体的结构变化。基于共现分析的信息可视化技术能形象化地表达文献信息蕴含的内容,方便科研人员和情报人员挖掘文献集中所隐含的知识。

国外关于文献信息共现关系分析的应用软件已经比较成熟,如美国费城的德雷塞尔大学信息科学与技术学院的陈超美开发的基于JA V A平台的Citespace[2][3]系列应用软件;印第安纳州大学开发的大型网络分析、建模、和可视化的工具包Network Workbench Tool;大型社会网络分析软件Pajek;瑞典科学家佩尔松(persson)开发的科学计量学研究软件Bibexcel[4];美国斯坦福大学开发的社会科学统计软件包SPSS等等。其中这些软件有一个共性,即主要是针对Web of Science数据进行开发的。而对于从中文社会科学引文索引(CSSCI)数据库下载的中文文献数据,它们还不能直接进行处理。由于这些软件无法对CSSCI文献数据中的知识单元进行共现计算,从而也就很难对其进一步的知识可视化分析。

相对于处理英文文献信息共现分析软件的开发,处理中文数据库数据的软件相对匮乏,其中有不少学者做了一些研究,并开发出了一些通用软件。其中周春雷、王伟军等人用Delphi 6 编制了处理中国期刊网题录数据的软件,该软件功能主要是将数据导入Excel,仅限于相关题录数据的统计频次[5]。姜春林、杜维滨等人用Visual Basic 6.0语言开发了一款软件

Ccmatrix,用ADO技术连接Access自建数据库,处理统计来源文献题录数据和引文数据,实现了共现矩阵[6]。

针对处理CSSCI数据共现分析相关软件相对较少的现状,为了方便广大科研人员和情报人员对CSSCI数据库中的数据进行分析,本文尝试研究了CSSCI数据导入Bibexcel实现共现矩阵的方法。

2 Bibexcel软件简介

2.1 功能介绍

瑞典科学家佩尔松(persson)开发的文献计量学研究软件Bibexcel[7]用于帮助用户分析文献数据或者是文本类型格式的数据,实现引文分析。Bibexcel处理的数据来自集成在ISI Web of Knowledge平台上的数据库,包括Web of Science数据库、Derwent Innovation Index 数据库和Medline数据库等。Bibexcel除了对来源于上述数据库中数据的相关知识单元(作者、关键词、参考文献等)做频次分析和排序外,还实现了知识单元的共现关系矩阵。将产生的共现数据存入excel表格中,借助Ucinet、Netdraw可视化软件,做进一步的可视化分析。Bibexcel界面如图1所示。

图1 Bibexcel界面

2.2 Bibexcel在共现分析中的优势与不足

Bibexcel的强大功能在于知识单元的共现关系分析,对英文文献数据或专利数据的共现关系分析已经取得令人满意的结果。如栾春娟《专利计量研究国际前沿的计量分析》[7],对1995-2007年期间《科学计量学》出版的关于国际专利计量研究的论文和引文进行计量分析,通过Bibexecel处理,得到高被引作者共被引矩阵、高频关键词共现矩阵和高频次作者共现矩阵,再通过Ucinet绘制作者共被引网络图谱、高频关键词共现网络图谱和高产作者学术合作网络图谱。但是,在CSSCI文献数据库中,Bibexcel对中文献数据的分析存在着局限性,主要原因是在于Bibexcel不能直接处理CSSCI格式数据。

中文社会科学引文索引(CSSCI)作为我国社会人文科学主要文献信息查询与评价的重要工具,CSSCI提供来源文献、被引文献、优化检索等多种信息检索。该项目成果填补了我国社会科学引文索引的空白,达到了国内领先水平。从CSSCI下载某一领域的相关文献,并对其进行分析,不但可以科学合理、客观公正地评价人文社会科学研究的成果,而且对了解国内的研究现状和研究热点,因此具有非常重要的现实意义。

3 CSSCI文献数据共现矩阵的实现

3.1数据下载

确定某一研究领域后,进入CSSCI界面(),点击“包库用户入

相关文档
最新文档