基于复杂网络的社团结构分析_以四川大学蓝色星空为例

基于复杂网络的社团结构分析_以四川大学蓝色星空为例
基于复杂网络的社团结构分析_以四川大学蓝色星空为例

技术与市场

第16卷第12期2009年

1.引言

目前,国内对虚拟论坛的社区结构有一定的研究,张瑜通过实证分析证实了公社社会类型、科层社会类型和广场社会类型这三种类型的交往场域在BBS网络空间中的存在性,并分析了各类交往场域的特点,探讨了不同类型交往场域的形成机制。宫辉和徐渝利用社会网络矩阵分析法对网络虚拟社区中信息传播模式进行分析,概括出网络虚拟社区群体的基本特征。余兰则对大学生在BBS交往中的网络角色进行了研究。彭小川和毛晓丹运用社群图和矩阵法对网络社会群体进行了分析,概括出BBS群体的基本特征,并对群体中成员地位的形成、意见领袖的特点和群体内部人际交往的特征进行了探讨。王海明和韩瑞霞则在2004年发表了对国内BBS研究现状的述评文章。

从目前国内研究的情况看来,许多的研究已经开始使用社会网络的方法对论坛数据进行分析。尽管国内外学者作了大量研究,但是大部分都是从传播学、社会学以及心理学的某一角度进行研究,分析手段的限制使得大部分研究仍停留在定性阶段,所得到的结论说服力不强。因此,我们将采用复杂网络的方法,通过对蓝色星空数据进行研究和分析,包括两个阶段:1)建立复杂网络模型;2)对该模型进行分析,找出该网络的基本统计数据,包括度分布、聚集系数和平均路径长度等。

2.复杂网络

2.1网络定义

网络已成为各学科领域重要的分析工具和研究手段。网络是由许多节点与连接节点的边组成,其中节点代表系统中不同的个体,边则表示个体间的关系;两个节点之间具有特定的关系则连一条边,有边相连的两个节点被看作是相邻的。比如计算机网络可以看作是自主工作的计算机通过各种物理介质与通信协议相互连接得到的网络。

2.2复杂网络

网络模型包括规则网络、随机网络和复杂网络。随机网络首先由Erdos和Rényi引入,是概率方法与传统图论相结合的网络,着重于网络的随机性。而科学家们发现大量的真实系统的网络模型既不是随机网络,也不是规则网络,却是介于随机网络和规则网络之间的复杂网络。1998年Watts和Strogatz表明大量真实网络都具有小世界效应;1999年Barabasi和Albert指出许多现实世界中的大量网络具有无标度网络(scale-free)的特性——

—无尺度特征、脆弱性和抗毁性。无尺度特性刻画了复杂网络的不均匀复杂性,即大部分结点只有少数连接,少数结点拥有大量连接。脆弱性与抗毁性并存从另一方面反映无尺度特性。Albert等人的研究表明,无标度网络比随机网络具有更强的抗毁性,但是对于选择性攻击抗攻击能力较差,5%的核心结点被攻击,网络就基本瘫痪。

复杂网络的研究可以简单概括为三方面密切相关却又依次深入的内容:通过实证方法度量网络的统计性质;构建相应的网络模型来理解这些统计性质何以如此;在已知网络结构特征及其形成规则的基础上,预测网络系统的行为。

2.3复杂网络的主要统计参数

2.3.1度和度的分布

一个节点与其它节点相连的边数称为该节点的度,度是描述网络局部特性的基本参数。节点度分布是指网络中度为k的节点的概率p(k)随节点度k的变化规律。节点度的分布函数反映了网络系统的宏观统计特征,理论上利用度的分布可以计算出其它表征全局特征参数的量化行为。

2.3.2平均路径长度

网络中两个节点i和j之间的距离dij定义为连接这两个节点的最短路径上的边数。网络中任意两个节点之间的距离的最大值称为网络的直径,记为D,即

D=max

i,j

d ij

网络的平均路径长度L定义为任意两个节点之间的距离的平均值,即

L=1

1

2

N(N-1)

∑i≥j d ij其中,N为网络节点数。

2.3.3聚集系数C

在有N个节点的网络中,若第i个节点的度为k

i

,由这k i个邻

基于复杂网络的社团结构分析

——

—以四川大学蓝色星空为例

陈志翔

四川大学计算机学院成都610041

摘要:随着我国计算机和网络的普及,网络社团、尤其是BBS,在人们日常生活中发挥着巨大的作用,国内目前对BBS

的社团结构进行定量分析的研究不多。本文通过对基于四川大学蓝色星空ID间相互回帖关系所构建的复杂网络模型的

研究,构造仿真实验,找出该网络的基本统计数据。

关键词:复杂网络社团结构BBS网络建模

doi:10.3969/j.issn.1006-8554.2009.12.029

专题研究

41

TECHNOLOGY AND MARKET

Vol.16,No.12,2009

居节点构成的子网当中,实际存在的边E i 与这k i 个节点之间最多可能形成的边数k i (k i -1)/2的比值:C i =2E i /(k i (k i -1)),称为第i 个节点的聚集系数。整个网络的聚集系数C 定义为所有节点聚集系数的平均值,即

C=1N ∑

1

N C i

聚集系数反映网络的聚集程度,聚集程度的意义是指网络集团化的程度,即网络的内聚倾向。

3.建立模型3.1

建模方法

蓝色星空中每个ID 的主要行为包括:发帖、回复和浏览这三个方面。

1)节点生成:每个ID 最多只能代表一个节点,而只有当该ID 有回复的时候,才能生成一个节点,如果该ID 仅发表了帖子,而没有人回复,则该ID 不能作为节点。

2)边:在我们的模型中,边为带权的有向边,边由回复ID 节点指向发帖ID 节点。

因此2个节点间最多只能有2条边。当边初始生成时,其默认权值为1,代表该回复ID 回复了一次发帖ID 所发表的帖子。每回复一次,权值增加1,权值说明了两个ID 间的关系紧密程度。例如:下图的网络结构表示melody2发表帖子,并回复了rabildo 一次,rabildo 回复了melody2两次,zhouliwap 回复了melody2一次。

3.2

数据获取

我们选取了蓝色星空网站中访问量最大的“校园生活”板块,对09年10月的发帖、回帖情况进行数据获取并建模。共得到发帖与回帖3168篇,

其中节点数共有925个。3.3

网络拓扑图

根据我们建立的模型和获得的数据,我们得到以下的网络拓扑图(边的权值省略,采用NetDraw 软件绘制):

4.数据分析

根据我们所得到的网络拓扑图,采用NetDraw 分析得到,该网络的平均度为5.89,平均路径长度为16,聚集系数为0.13。该网络符合小世界网络的特点。说明学生在使用BBS 时,依然会形成小世界的特性。

5.总结与展望

本文阐述了目前国内对BBS 研究的基本现状,并介绍了复杂网络的基本概念。成功地将复杂网络工具引入对BBS 的分析和研究中,并成功地对蓝色星空上访问量最大的“校园生活”板块进行了建模和数据分析,得出该板块上同学的活动符合小世界网络的特点。

本文所做的研究是利用复杂网络工具进行BBS 建模的一次探索,虽然建立起了一个模型,但该模型仅覆盖了“校园生活”

板块一个月的数据,如果要对整个BBS 网站进行深入研究,需要基于整个论坛,对海量的数据进行建模,这将成为我们以后的研究方向。

参考文献:

[1]张瑜.BBS 网络空间的社会交往领域———

以水木社区的实证分析为例[J].青年研究,2007,(8):22-29.

[2]宫辉,徐渝.高校BBS 社群结构与信息传播的影响因素[J].西

安交通大学学报(社会科学版),2007,(1):93-96.

[3]余兰.大学生BBS 交往中的网络角色研究[D],2007,4.[4]彭小川,毛晓丹.BBS 群体特征的社会网络分析[J].青年研究,2004,(4):39-44.

[5]王海明,韩瑞霞.国内BBS 研究现状述评[J].兰州石化职业技

术学院学报,2004,(12):25-29.

[6]Watts D J,Strogatz S H.Collective dynamics of small-world networks [J].Nature,1998,393:440-442.

[7]Barab ási A L,Albert R.Emergence of scaling in random net -works [J].Science1999,(286):509-512.

[8]Borgatti,S.P.,M.G.Everett,and L.C.Freeman.1999.

UCINET 6.0Version 1.00.Natick:Analytic Technologies[M].

专题研究melody

rabi i do

zhoul i wap

42

相关主题
相关文档
最新文档