无标度网络模型构造实践报告

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

课题:无标度网络模型构造

姓名赵训

学号201026811130

班级实验班1001

一、源起

无标度网络(或称无尺度网络)的概念是随着对复杂网络的研究而出现的。

“网络”其实就是数学中图论研究的图,由一群顶点以及它们之间所连的边构成。在网络理论中则换一套说法,用“节点”代替“顶点”,用“连结”代替“边”。复杂网络的概念,是用来描述由大量节点以及这些节点之间错综复杂的联系所构成的网络。这样的网络会出现在简单网络中没有的特殊拓扑特性。

自二十世纪60年代开始,对复杂网络的研究主要集中在随机网络上。随机网络,又称随机图,是指通过随机过程制造出的复杂网络。最典型的随机网络是保罗·埃尔德什和阿尔弗雷德·雷尼提出的ER模型。ER模型是基于一种“自然”的构造方法:假设有个节点,并假设每对节点之间相连的

可能性都是常数。这样构造出的网络就是ER模型网络。科学家们最初使用这种模型来解释现实生活中的网络。

ER模型随机网络有一个重要特性,就是虽然节点之间的连接是随机形成的,但最后产生的网络的度分布是高度平等的。度分布是指节点的度的分布情况。在网络中,每个节点都与另外某些节点相连,这种连接的数目叫做这个节点的度。在网络中随机抽取一个节点,它的度是多少呢?这个概率分布就称为节点的度分布。

在一般的随机网络(如ER模型)中,大部分的节点的度都集中在某个特殊值附近,成钟形的泊松分布规律(见下图)。偏离这个特定值的概率呈指数性下降,远大于或远小于这个值的可能都是微乎其微的,就如一座城市中成年居民的身高大致的分布一样。然而在1998年,Albert-László Barab ási、Réka Albert等人合作进行一项描绘万维网的研究时,发现通过超链接与网页、文件所构成的万维网网络并不是如一般的随机网络一样,有着均匀的度分布。他们发现,万维网是由少数高连接性的页面串联起来的。

绝大多数(超过80%)的网页只有不超过4个超链接,但极少数页面(不到总页面数的万分之一)却拥有极多的链接,超过1000个,有一份文件甚至与超过200万个其他页面相连。与居民身高的例子作类比的话,就是说大多数的节点都是“矮个子”,而却又有极少数的身高百丈的“巨人”。Barab ási等人将其称为“无标度”网络。

随机网络的度(a)集中在某个平均值附近,而无标度网络的度分布(b)则遵守幂律分布

二、描述与定义

无标度网络的特性,在于其度分布没有一个特定的平均值指标,即大多数节点的度在此附近。在研究这个网络的度分布时,Barabási等人发现其遵守幂律分布(也称为帕累托分布),也就是说,随机抽取一个节点,它的度是自然数的概率:

也就是说的概率正比于的某个幂次(一般是负的,记为)。因此越大,的概率就越低。然而这个概率随增大而下降的“速度”是比较缓慢的:在一般的随机网络中,下降的速度是指数性的,而在无尺度网络中只是以多项式类的速度下降。

在现实中许多大规模的无尺度网络中,度分布的值介于2与3之间。在对数坐标系中,度分布将会是一条斜率介于-2至-3之间的直线。如下图中,横坐标为节点

的度,从一直到;纵坐标为找到这样的节点的概率从一直到。最高度数的节点有882条连接。所有的蓝点大致成一条直线分布(绿色的直线)。

200,000个节点的无标度网络的度分布(对数坐标)

仅仅是将度分布的幂律分布作为无标度网络的定义有其不够完善之处。由于幂律分布是方差可能无穷的高可变分布,对于度分布是同一个幂律分布的不同网络,其拓扑结构和特性可能存在巨大的差异。2005年,Lun Li和大卫·阿尔德森(David Alderson)等人在论文《迈向无标度图的理论》(Towards a Theory of Scale Free

Graphs)中提出了一种补充性的标度性测度。设为所有具有(依照幂律分布的)度分布的网络的集合,对于其中每一个网络

,定义度-度相关数:

其中表示中所有连接的集合。根据排序原理,如果度数大的点之间相互连接的话,那么会比较大。设为最大的,那么定义度-度相关系数:

度-度相关系数介于0与1之间。越靠近1,则称此网络“无尺度”的,

靠近0,则称是“富尺度”的。在此定义下,无尺度网络中的节点度数分布

特征体现了自相似的性质,而凸显了“无尺度”的特征,与富尺度网络之间有相当的差异。

三、例子

不少现实中的网络结构都属于无标度网络,或者有无标度的特性。以下是一些无标度网络的例子:

四、BA模型及其构造算法

Albert-László Barabási与Réka Albert在1999年的论文中提出了一个模型来解释复杂网络的无标度特性,称为BA模型。这个模型基于两个假设:

增长模式:不少现实网络是不断扩大不断增长而来的,例如互联网中新网页的诞生,人际网络中新朋友的加入,新的论文的发表,航空网络中新机场的建造等等。

优先连接模式:新的节点在加入时会倾向于与有更多连接的节点相连,例如新网页一般会有到知名的网络站点的连接,新加入社群的人会想与社群中的知名人士结识,新的论文倾向于引用已被广泛引用的著名文献,新机场会优先考虑建立与大机场之间的航线等等。

在这种假设下,BA模型的具体构造为:

1.增长:从一个较小的网络开始(这个网络有个节点,条边),逐步

加入新的节点,每次加入一个。

2.连接:假设原来的网络已经有个节点()。在某次新加入一个节点时,从这个新节点向原有的个节点连出个连结。

3.优先连接:连接方式为优先考虑高度数的节点。对于某个原有节点

(),将其在原网络中的度数记作,那么新节点与之相连的概率为:

这样,在经过次之后,得到的新网络有个节点,一共有条边。

分析BA模型网络的渐近度分布(当节点数量很大时的度分布)主要有连续场理论、主方程法和速率方程法。这三种方法得到的渐近结果都是相同的。2001年,Béla

Bollobás证明了在节点数量很大时,BA模型网络的度分布遵从的幂律分布。之后,其它的无标度网络模型也开始被提出。

有1000个节点的BA模型网络

相关文档
最新文档