万维网链接结构的复杂性分析

合集下载

《万维网概述》课件

《万维网概述》课件
大数据是指规模庞大、复 杂多样的数据集合,需要 新技术来处理、存储和分 析。
大数据的应用
大数据技术在金融、医疗、 营销等领域有着广泛的应 用,帮助人们从海量数据 中提取有价值的信息。
万维网在大数据 时代的应用
万维网在大数据时代的应 用包括数据挖掘、个性化 推荐和智能搜索等。
未来的趋势
1
万维网的未来
万维网将继续发展,越来越多的设
新兴技术对万维网的影响
2
备和物体将连接到互联网,形成更 智能、更便利的生活。
人工智能、大数据、物联网等新兴
技术将对万维网产生深远的影响和
变革。
3
人工智能技术在万维网中的
应用
人工智能技术将使万维网更加智能 和个性化,提供更精准的搜索结果 和推荐服务。
结语
万维网的发展从未止步,随着技术的进步和用户需求的变化,它将不断演化和创新。希望本课程 能够为您提供全面的了解和启发,谢谢!
搜索引擎
1
搜索引擎的定义
搜史
搜索引擎的发展经历了多个阶段,从最初的Yahoo到后来的Google,技术和算法 一直在不断创新。
3
搜索引擎的分类
搜索引擎可以根据运作方式分为蜘蛛型、目录型和社交媒体型等不同类型。
Web 2.0
Web 2.0的定义
网是指通过移 动设备(如手机、平板 电脑)访问互联网的方 式。
移动互联网的发展 历程
从2G到5G,移动互联网 的技术不断升级,数据 传输速度和可靠性有了 显著提升。
移动应用
移动应用是为移动设备 开发的软件,如社交媒 体应用、游戏等。
大数据时代下的万维网
大数据的定义
万维网的历史
万维网的起源可以追溯到20世纪60年代,但真正的爆发是在1990年代,由英国科学家蒂姆·伯纳斯 -李发明。从那以后,万维网经历了快速发展,成为了人类社会不可或缺的一部分。

复杂网络的分析及优化

复杂网络的分析及优化

复杂网络的分析及优化随着互联网的迅速发展,越来越多的数据在网络中传输,网络结构也越来越复杂。

如何分析和优化这些复杂的网络成为一个关键问题。

本文将介绍复杂网络的分析及优化方法,包括网络拓扑结构分析、网络连通性研究、网络优化算法等。

一、网络拓扑结构分析网络的拓扑结构是指网络中节点和边的分布规律。

通过对网络拓扑结构的分析可以了解网络的整体特征和局部特征,从而深刻地认识网络内部的相互关系。

1.1 度分布度是指一个节点的直接连接数,度分布是指网络中节点度数的频率分布。

通常情况下,度分布呈现长尾分布,即有少数节点的度数非常大,而大多数节点的度数较小。

度分布的形态对网络的性质和行为有很大影响,因此度分布是复杂网络拓扑结构分析的重要指标。

1.2 聚集系数聚集系数是指网络中三角形的数量与所有可能的三角形数量的比值。

聚集系数可以用来描述网络的密集程度和连通性。

在社交网络和生物网络中,聚集系数通常比较高,而在物理和技术网络中,聚集系数较低。

1.3 特征路径长度特征路径长度是指网络中任意两个节点之间的最短路径的平均数。

网络的特征路径长度反映了网络内部连接的紧密程度,对于描述物理网络和社交网络的距离关系非常有用。

二、网络连通性研究网络连通性是指在网络结构中通过节点和边互相连接所形成的整体连通性。

网络连通性是复杂网络中最重要和最基本的特性之一。

2.1 连通性分析连通性分析是指通过对网络中节点和边的连接性进行分析,确定网络的连通性。

在无向网络中,如果任意两个节点都可以通过路径相互连接,则该网络是连通的。

在有向网络中,如果所有节点都可以到达任意另一个节点,则该网络是强连通的。

2.2 最大连通子图最大连通子图是指网络中最大的连通子集,其中任意两个节点都可以通过路径相互连接。

最大连通子图是分析网络组成和功能的关键。

2.3 非连通子图非连通子图是指网络中不属于任何连通子图的节点或边。

非连通子图可以通过增加新的节点或边,改变网络的拓扑结构,从而使网络成为连通的。

复杂网络研究简介

复杂网络研究简介

∑d
i> j
ij
d12 = 1
d13 = 1 d 23 = 1
d14 = 2 d 24 = 1 d 34 = 2
d15 = 1 d 25 = 2 d 35 = 2 d 45 = 3
Total = 16 Average:
L = 16 / 10 = 1.6
聚类系数
• 一个网络的聚类系数 C满足:
0<C<1
规则网络
(a) 完全连接;
(b) 最近邻居连接;
(c) 星形连接
规则网络
... ...
(d) Lattice
(z) Layers
随机图理论
• 随机图论 - Erdös and Rényi (1960) • ER 随机图模型统治四十余年…… 直到今天 …… • 当今大量可获取的数据+高级计算工具,促使人们 重新考虑随机图模型及其方法
“图论之父”
看作4个节点,7条边的 图
路必须有起点和终点。 一次走完所有的桥,不重复,除起点与终点外,其余点必须有偶数 条边,所以七桥问题无解。 1875年, B 与 C 之间新建了一条桥解决了该问题!☺
Euler 对复杂网络的贡献
Euler 开启了数学图论,抽象为顶点与边的集 合 图论是网络研究的基础 网络结构是理解复杂世界的关键
电信网络
(Stephen G. Eick)
美国航空网
世界性的新闻组网络
(Naveen Jamal)
生物网络
人际关系网络
复杂网络概念
• • • • • • 结构复杂:节点数目巨大,网络结构呈现多种不同特征。 节点多样性:同一网络中可能有多种不同的节点。 连接多样性:节点之间的连接权重存在差异,且有可能存在方向性。 网络进化:表现在节点或连接的产生与消失。例如WWW,网页或链 接随时可能出现或断开,导致网络结构不断发生变化。 动力学复杂性:节点集可能属于非线性动力学系统,例如节点状态随 时间发生复杂变化。 多重复杂性融合:即以上多重复杂性相互影响,导致更为难以预料的 结果。例如,设计一个电力供应网络需要考虑此网络的进化过程,其 进化过程决定网络的拓扑结构。当两个节点之间频繁进行能量传输时, 他们之间的连接权重会随之增加,通过不断的学习与记忆逐步改善网 络性能。 复杂网络简而言之即呈现高度复杂性的网络。

万维网——精选推荐

万维网——精选推荐

万维⽹web⼀.什么是万维⽹(web)web(World Wide Web)即全球⼴域⽹,也称为万维⽹,它是⼀种基于超⽂本和HTTP的、全球性的、动态交互的、跨平台的分布式图形信息系统。

是建⽴在Internet上的⼀种⽹络服务,为浏览者在Internet上查找和浏览信息提供了图形化的、易于访问的直观界⾯,其中的⽂档及超级链接将Internet上的信息节点组织成⼀个互为关联的⽹状结构。

web和Internet并不等价,Internet早在上世纪50年代就已经出现,⽤于基本的⽂件交换,web在上世纪90年代才出现。

在书上给出了以下简单的定义: web:信息和⽤于访问信息的⽹络软件的基础设施 web页:包含或引⽤各种数据类型的⽂档 链接:两个web页之间的连接 ⽹站:⼀组相关的web页 web浏览器:获取并显⽰web页的软件⼯具 web服务器:响应web页请求的计算机 统⼀资源定位符(URL):说明web地址的标准⽅式 (以上是web常⽤的相关概念)以下是web⼀些相关简单应⽤:即时消息(IM):发送短消息的技术 可与发短信类⽐,QQ,wechat ⽅便,但是不安全,通过IM协议发送的消息并没有加密,可能会被中间点截获,未加密的电⼦邮件也同样不安全博客:写博客,就如这⼀篇cookie(购物车基于此实现) cookie是⼀种基于web的技术,存储浏览历史到本地计算机,增强了web的实⽤性,但是也有⼈反对web分析:⽹站使⽤情况的数据分析和采集HTML和CSS:超⽂本标记语⾔(HTML):⽤于创建web页的语⾔ HTML的全称为,是⼀种。

它包括⼀系列.通过这些标签可以将⽹络上的格式统⼀,使分散的资源连接为⼀个逻辑整体。

HTML⽂本是由HTML命令组成的描述性,HTML命令可以说明,、、、、等。

(这些蓝⾊的字就是链接)是⼀种组织信息的,它通过⽅法将⽂本中的⽂字、图表与其他相关联。

这些相互关联的信息媒体可能在同⼀⽂本中,也可能是其他⽂件,或是相距遥远的某台上的⽂件。

复杂网络的拓扑结构与稳定性分析

复杂网络的拓扑结构与稳定性分析

复杂网络的拓扑结构与稳定性分析随着互联网和社交媒体的迅速发展,人们对网络拓扑结构与稳定性的研究越来越重视。

本文将探讨复杂网络的拓扑结构及其对网络稳定性的影响,以及现有的稳定性分析方法。

首先,复杂网络的拓扑结构是指网络中节点之间的连接方式。

常见的拓扑结构包括随机网络、小世界网络和无标度网络。

随机网络是指节点之间的连接是以一定的概率随机发生的网络。

这种网络的特点是具有较短的平均路径长度和高度分散的度分布,但是缺乏明显的层次性结构。

随机网络对抗节点的随机故障具有一定的鲁棒性,但对于有选择性的攻击较为脆弱。

小世界网络是介于随机网络和规则网络之间的网络结构。

在小世界网络中,大部分节点通过短路径相连,同时还存在一些长路径连接。

这种结构使得小世界网络既能保持较小的平均路径长度,又具备较高的聚集系数和局部连通性。

小世界网络在信息传播和搜索方面有较好的性能,但容易受到蠕虫病毒等传播性攻击的影响。

无标度网络是指网络中只有少数几个节点具有极高的度数,而大部分节点的度数相对较低。

这种结构使得网络具有高度的鲁棒性和自组织性,能够抵御大规模随机故障和有选择性攻击。

然而,无标度网络对于扩展性缺乏鲁棒性,在攻击性扩张时容易导致网络崩溃。

其次,网络的稳定性是指网络在面对外部扰动时保持正常运行的能力。

网络的稳定性与其拓扑结构密切相关。

一般来说,网络具备更高的鲁棒性,意味着其稳定性更强。

稳定性分析方法有很多,其中比较常见的是基于拉普拉斯矩阵的方法。

拉普拉斯矩阵是研究网络稳定性的重要工具,可以通过网络的结构信息计算得到。

通过计算拉普拉斯矩阵的特征值和特征向量,可以得到网络的稳定性分析结果。

在稳定性分析中,通信矩阵和连接矩阵也是常用的工具。

通信矩阵用于描述网络中节点之间的信息传递过程,通过计算通信矩阵的特征值和特征向量,可以了解网络的传播能力和稳定性。

连接矩阵用于描述网络中节点之间的连接关系,通过计算连接矩阵的特征值和特征向量,可以了解网络的连通性和稳定性。

复杂网络模型分析

复杂网络模型分析

第1章引言自然界中存在的大量复杂系统都可以通过形形色色的网络加以描述。

一个典型的网络是由许多节点与连接两个节点之间的一些边组成的,其中节点用来代表真实系统中不同的个体,而边则用来表示个体间的关系,往往是两个节点之间具有某种特定的关系则连一条边,反之则不连边,有边相连的两个节点在网络中被看作是相邻的。

例如,神经系统可以看作大量神经细胞通过神经纤维相互连接形成的网络;计算机网络可以看作是自主工作的计算机通过通信介质如光缆、双绞线、同轴电缆等相互连接形成的网络。

类似的还有电力网络、社会关系网络、交通网络等等。

数学家和物理学家在考虑网络的时候,往往只关心节点之间有没有边相连,至于节点到底在什么位置,边是长还是短,是弯曲还是平直,有没有相交等等都是他们不在意的。

在这里,我们把网络不依赖于节点的具体位置和边的具体形态就能表现出来的性质叫做网络的拓扑性质,相应的结构叫做网络的拓扑结构。

那么,什么样的拓扑结构比较适合用来描述真实的系统呢?两百多年来,对这个问题的研究经历了三个阶段。

在最初的一百多年里,科学家们认为真实系统各因素之间的关系可以用一些规则的结构表示,例如二维平面上的欧几里德格网,它看起来像是格子体恤衫上的花纹;又或者最近邻环网,它总是会让你想到一群手牵着手围着篝火跳圆圈舞的姑娘。

到了二十世纪五十年代末,数学家们想出了一种新的构造网络的方法,在这种方法下,两个节点之间连边与否不再是确定的事情,而是根据一个概率决定。

数学家把这样生成的网络叫做随机网络,它在接下来的四十年里一直被很多科学家认为是描述真实系统最适宜的网络。

直到最近几年,由于计算机数据处理和运算能力的飞速发展,科学家们发现大量的真实网络既不是规则网络,也不是随机网络,而是具有与前两者皆不同的统计特征的网络。

这样的一些网络被科学家们叫做复杂网络(complex networks),对于它们的研究标志着第三阶段的到来。

遗憾的是,就目前而言,科学家们还没有给出复杂网络精确严格的定义,从这几年的研究来看,之所以称其为复杂网络,大致上包含以下几层意思:首先,它是大量真实复杂系统的拓扑抽象;其次,它至少在感觉上比规则网络和随机网络复杂,因为我们可以很容易地生成规则和随机网络,但就目前而言,还没有一种简单方法能够生成完全符合真实统计特征的网络;最后,由于复杂网络是大量复杂系统得以存在的拓扑基础,因此对它的研究被认为有助于理解“复杂系统之所以复杂”这一至关重要的问题。

PPT—复杂网络

PPT—复杂网络

随机图——节点42,边118
平均度为5.62,集聚系数为0.133。
ER模型
Erdös和Rényi (ER)最早提出随机网络 模型并进行了深入研究,他们是用概率统 计方法研究随机图统计特性的创始人。
给定N个节点,没有边,以概率p用边连接 任意一对节点,用这样的方法产生一随机 网络。
ER模型
小世界实验--- 六度分离
米尔格伦的实验过程是:他计划通过人传人的送信方式来统 计人与人之间的联系。
首先把信交给志愿者A,告诉他信最终要送给收信人S。如果 他不认识S,那么就送信到某个他认识的人B手里,理由是A认 为在他的交集圈里B是最可能认识S的。但是如果B也不认识S, 那么B同样把信送到他的一个朋友C手中,……,就这样一步 步最后信终于到达S那里。这样就从A到B到C到……最后到S连 成了一个链。斯坦利•米尔格伦就是通过对这个链做了统计后 做出了六度分离的结论。
性现实中的网络是由一个个较小的社团组成,而这些社团又可 以包括更小的社团。发现网络中的社团结构,对于了解网络结 构,分析网络特性都具有很重要的意义。
复杂网络研究内容
1)复杂网络模型 典型的复杂网络:随机网、小世界网、无标度网等; 实际网络及其分类。
2)网络的统计量及与网络结构的相关性 度分布的定义和意义,聚集性、连通性的统计量及其实际 意义等。
度(degree):节点 i 的度 ki 定义为与该节点连接的其他
节点的数目。
★ 直观上看,一个节点的度越大就意味着这个节点在
某种意义上越“重要”(“能力大”)。
网络的平均度:网络中所有节点的度和的平均值
dv
vV G
,记作<k>。
p
度分布函数p(k):随机选定节点的度恰好为k的概率

万维网局部结构研究与分析

万维网局部结构研究与分析

t e e s e we o lc h v te a o a tu t r , o h e e p r n t c mp t T a S g i c n e r f e o h w b t s i c l t a e h s me l c l sr cu e we d t x e me t o o u e r d in f a c P o l f e i i i i
te e we sts a d i d t r e n t r s p r mi e . h s b i , n f h e ewo k u ef l s e n a i Ke wo d : W WW , e st s b rph, t ,u efmi e y rs w bi e,u g a moi s p ra l s f i
பைடு நூலகம்
研 究 单 个 网 站 的 链 接 结 构 . 试 网 站 模 体 构 成情 况 , 后 分 析 测 然 他们 与 现在 成熟 的商业 搜索 引擎 所采 用 的排序 算 法之 间 的
联 系。
得 了 很 多 有 意 义的 成 果 . 我们 初步 看 清 了 万维 网的 轮 廓 。 使
如 果 将 网页 看 作 一 个 个 节 点 , 将 网 页 之 间 的单 向超 级 链 而 接 看 作 边 . 么 整个 万 维 网 就 可 以 当作 一 个 巨 大 的有 向 图来 处 那 理 。我 们 将 此 图称 为 We rp , b ga h 它是 稀 疏 连 接 的有 向图 , 以 可 用 来 刻 画 万维 网的 某 些 特 征 。 F l t s】 发 现 万 维 网 中存 在 幂 律 关 系 . 出某 一 网 页 a us t o o一 等 指
M A a - u Ti n h i
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

万维网链接结构的复杂性分析郭阳;刘展威;赵正旭【摘要】The World Wide Web(WWW) constitutes a massive complex network that is far beyond for a traditional random network model to describe its structure and behaviors. By analyzing the network link data, the relevant parameters and factors are established and computed by comparing theory with practice implication. It concludes that the WWW has the small world effect, the average shortest path of the WWW is about 15 hops, clusters are groupings of Web pages devoted to the same topic and then form scale-free networks.%对于凭借网页间链接结构所构成的超大规模复杂网络,万维网的链接结构并不符合传统的随机网络模型.为此,通过对万维网真实链接数据的提取及分析,计算并对比节点的度分布、平均路径长度及集群系数等相关网络指标.分析结果表明,万维网具有小世界效应,整个网络的平均路径长度约为15跳,具有相似主题的网页组成若干个集群,进而构成无标度网络.【期刊名称】《计算机工程》【年(卷),期】2011(037)023【总页数】3页(P105-106,109)【关键词】小世界效应;无标度网络;超链接分析;度分布;幂律【作者】郭阳;刘展威;赵正旭【作者单位】石家庄铁道大学信息科学与技术学院,石家庄050043;石家庄铁道大学信息科学与技术学院,石家庄050043;石家庄铁道大学信息科学与技术学院,石家庄050043【正文语种】中文【中图分类】TP3931 概述文献[1]揭示了复杂网络的小世界特性,文献[2]揭示了复杂网络的无标度性质。

这2篇文章所揭示的小世界特性和无标度性质,以及这些特性的产生机理和相应模型的建立,开创了复杂网络研究的新纪元。

万维网(World Wide Web, WWW)作为当今人类社会信息化的标志,其规模正以指数速度高速增长。

网络链接作为基本构成要素和最显著的特征,一直是国内外专家学者所广泛关注的对象。

本文就是以万维网的链接结构为研究对象,探讨万维网的小世界效应及无标度性质。

2 真实网络的统计特征最近几年,科学家们发现真实的网络既不是规则网络,也不是随机网络,而是具有与前两者都不同的统计特征的网络。

关于复杂网络拓扑结构性质的研究进展有很多,其诸多的统计特征中最重要的就是小世界特性和无标度特性。

2.1 小世界特性绝大部分复杂网络系统都具有小世界特性。

1999年的万维网大约包含10亿个网页,研究人员曾经通过设计一种软件对网页进行数据采集分析,结果发现万维网网页间的平均距离大约是19。

这就意味着在万维网上随机选取2个网页,不断点击网页上的超链接,最多点击 19次鼠标就能够链接到达目标网页,这就是万维网的小世界特性的一个体现。

2.2 无标度特性在随机网络中,任意2个节点都是随机连接的,其度分布函数是一个中间大两边小的泊松函数,峰值位于节点度 k的平均值处。

研究人员通过研究真实复杂网络后发现,度分布并不像预料的那样服从泊松分布,而是遵循某种幂律形式,这种幂律形式与泊松分布相比,随着节点度k的增大,分布函数P的衰减变得更为缓慢,大k值的节点数目明显增多。

这就说明真实网络节点的度服从幂律分布[3-4]。

这种节点度分布呈现幂律形式的特征称为无标度特性。

3 网络分析的统计性质度分布、平均路径长度和集群系数是网络分析的主要统计性质。

文献[1]提出的小世界网络模型就是企图建立一个既具有类似于随机图的较小的平均路径长度,又具有类似于规则网络的较大的集群系数的网络模型。

文献[2]提出的无标度网络模型则是基于许多实际网络的度分布具有幂律形式的事实。

下面对网络的统计性质给予说明[5-6]。

3.1 度与度分布网络中节点的度分布表示为k的分布函数P(k),代表任意选择的节点的度值正好等于k的概率,同时也可表示为网络中度值为k的节点数所占总节点数的比例。

针对一个网络模型,可以绘制出其度分布图形。

然而对于那些度值较大的节点体现出较强的波动性,难以计算其统计性质,因此度分布图一般绘制在对数标度上。

3.2 平均路径长度网络中连接节点i和j的最短路径上的边数称为这2个节点之间的距离,表示为Lij。

网络的平均路径长度L又称为特征路径长度,定义为Lij的平均值,也就是任意两节点间距离的平均值。

对于一个具有N个节点的网络系统而言,若其平均距离L不大于lnN的值,就有理由认为该网络系统具有小世界效应。

3.3 集群系数在社会关系网络中,一个人的2个朋友之间可能也互为朋友,这种现象充分体现了社会网络的集群特性。

假如网络中的节点i与该网络中的其他ki个节点相连,显然这些节点之间最多可能有ki (ki−1)/2条连线。

如果它们之间实际只存在Ei条连线,那么这ki个节点之间连线数Ei与最多可能存在的连线数之比就定义为节点i的集群系数Ci。

4 链接网络分析对所有网站甚至是所有特定类型的网站进行研究和分析是一个庞大的平行计算问题。

但为了有效地分析万维网的链接结构,本项研究利用 Pajek软件,结合万维网的真实链接数据,绘制出了一个拥有793个节点和4 878条边的万维网链接网络图,如图1所示。

图1 万维网的链接网络“小世界效应”是指一个网络同时具有较小的平均路径长度和较大的集群系数。

即:与相同规模的随机网络相比,小世界网络具有平均路径长度较小且集群系数较大的特性。

“无标度”分布也称为幂律分布,是指网络的度分布具有适当幂指数(通常为2≤γ≤3)的幂律形式。

该网络中绝大部分节点的度相对很低,但存在少量的度相对很高的节点。

为此,本项研究同时绘制了相同规模的基于ER模型以及 BA无标度模型的网络图以作对比,限于篇幅,网络图不再罗列。

4.1 相关指标的计算表1分别给出了3种网络的相关参数值,通过对比不难发现,从平均路径长度和直径角度来看,ER随机网络最大,BA无标度网络最小,而本文的研究对象万维网居于两者之间;从集群系数的角度来看,ER随机网络最小,BA无标度网络最大,万维网仍居于两者之间,较接近于BA模型。

上述结果与预期理论值十分相符,说明万维网具有明显的小世界效应。

表1 3种网络的相关参数指标4.2 度分布图2(a)给出了图1所示网络的度分布曲线。

分析可知:节点度不超过 20的节点占网络总结点数的 90%,节点的平均度为12.30。

图2(b)和图2(c)分别给出了ER 网络和BA网络的度分布曲线。

很显然,ER网络的度分布近似为Poisson分布,其形状在远离峰值<k>处呈指数下降;而BA网络的度分布符合幂律分布,其曲线比 Poisson分布曲线下降要缓慢得多,并且绝大部分的节点的度相对很低,但存在少量的度相对很高的节点。

仔细对比图 2(a)和图 2(c),会发现其曲线的走势十分相似。

图2 网络度分布曲线图 3绘制了万维网网络节点累计度分布曲线及拟合曲线。

从图中可以看出,大多数节点度都很小,只有极少数节点具有很高的度,这些节点一般在整个网络结构中居于核心地位。

从网络累计度分布曲线来看,该网络呈幂律分布的趋势。

对该曲线进行拟合后可以发现,累计度分布确实服从幂律分布曲线P(k)=7 612k−2.24,R2=0.959。

R2称为方程的确定系数,其值在[0,1]区间,越接近1,表明方程的变量k对P(k)的解释能力越强,曲线拟合的效果越好。

从拟合出的曲线和方程的确定系数来看,曲线拟合的效果很好。

图3 万维网累计度分布曲线及拟合曲线另外,幂律分布在对数坐标系中对应于一条直线,而指数分布在半对数坐标系中对应于一条直线,因此,分别采用对数坐标和半对数坐标,就可以很容易识别幂律和指数分布。

图4和图5分别给出了网络累计度在半对数坐标和双对数坐标下的分布曲线,从图中可以看到,在半对数坐标中,累计度分布不能近似看作直线。

在双对数坐标中,累计度分布可以近似看作直线,从这一角度可以说明万维网服从幂律分布,即万维网属于无标度网络。

图4 累计度在半对数坐标系中的分布图5 累计度在双对数坐标系中的分布5 结束语本文分析了万维网的链接结构,结合相关网络指标对其进行了复杂性分析。

结果表明,WWW链接网络具有较小的平均路径长度和较大的集群系数,符合“小世界效应”;该网络节点度的累计度分布曲线呈现幂律分布趋势,在双对数坐标系中也呈现出明显的幂律分布特征。

最后得出结论:万维网符合幂律分布,属于无标度网络,同时具有典型的小世界效应。

参考文献[1]Watts D J, Strogatz S H. Collective Dynamics of “Small-world”Networks[J]. Natu re, 1998, 393(6684): 440-442.[2]Barabasi A L, Albert R. Emergence of Scaling in Random Networks[J]. Science, 1999, 286(5439): 509-512.[3]Faloutsos M, Faloutsos P, Faloutsos C. On Power-law Relationships of the Internet Topology[C]//Proc. of SIGCOMM’99. N ew York, USA: ACM Press, 1999: 251-262.[4]Strogtz S H. Exploring Complex Networks[J]. Nature, 2001,410(6825): 268-276.[5]汪小帆, 李翔, 陈关荣. 复杂网络理论及其应用[M]. 北京:清华大学出版社, 2006.[6]关沫, 李波, 赵海. Internet的复杂网络统计规律研究与分析[J]. 计算机工程, 2008, 34(21): 92-94.。

相关文档
最新文档