复杂网络社区结构问题综述
大数据环境下复杂社会网络的社区发现方法研究综述

1 社 区 定 义
社 区本 身 只是 一 个 定 性 的 概 念 , 自提 出 之 日起 , 关 于
绕此课题开展 了深 入研 究 , 取 得 了 一 系 列 重 要 的 研 究 成 果 。当 前 , 对 社 区发 现 研 究 的 分 析 与 综 述 工 作 较 少 , 不 利
之 间 的联 系 信 息 。局 部 社 区 定 义 一 般 会 给 出 一 种 社 区 应
满 足 的条 件 或 约 束 , 据 此 找 出 网络 中能 够 满 足 该 条 件 的极
摘 要 : 社会化媒体 大数据环境 下的社 区发现研 究, 是社会 网络分析与挖掘领域的一个热门研 究方向, 已有众 多学者
提 出各 种研 究 方 法 , 但 对 当前 研 究工 作 的 进 展 分 析 相 对 较 少 。首 先 从 局 部 、 全局 、 节 点 相 似 度 3个 角度 讨 论 社 区的 定
社 区 发 现 的 重要 性 , 吸 引 了 国 内外 学 者 的广 泛 关 注 。斯 坦 连边相对稀疏 。
组( 团) , 同一 组 内 的 节 点 之 间 连 接 相 对 紧 密 , 组 与 组 之 间
当前对社区的定义 , 可 以 分 为 3类 : 基 于 局 部 的社 区
定义 、 基 于 全 局 的 社 区 定 义 与 基 于 结 构 相 似 度 的 社 区 定
义, 然 后 针 对 网络 的 大规 模 、 动态、 异 构 3个 特 性 , 分 别调 研 与 梳 理 国 内外 相 关 文 献 , 并从采取 的主要技 术、 数 据 建 模 方法、 可 处理 的 网络 规 模 、 网 络 时序 特征 4个 方 面 比较 与 总 结 其 中 的代 表 性 方 法 , 分 析 当前 的 学 术 思路 与 发 展 动 态 , 最 后 指 出该 研 究 领 域 存 在 的 挑 战 及 未 来 可 能 的 研 究 方 向 。
复杂网络的结构分析与模型研究

复杂网络的结构分析与模型研究随着信息技术的飞速发展和互联网的普及,网络已经成为人们不可分割的一部分。
然而,网络并不是简单的连通图,它更多的是一种复杂的拓扑结构。
而复杂网络的结构分析与模型研究正是在探究这种复杂的拓扑结构。
一、复杂网络的概念和分类复杂网络是一种由众多节点和边组成的图形结构,其在现实生活中的各种应用越来越广泛,如社交网络、交通网络、供应链网络等。
根据网络节点之间连接的方式,复杂网络可以分为以下四类:1. 随机网络。
随机网络是节点之间连接完全随机的网络,其中各节点的度数呈现高斯分布。
这种网络的特点是具有较小的聚类系数和较小的平均路径长度。
2. 规则网络。
规则网络是节点之间连接具有规则性的网络,其中各节点的度数相同,且该度数相同。
这种网络的特点是具有较大的聚类系数和较小的平均路径长度。
3. 小世界网络。
小世界网络在随机网络和规则网络之间,其中大部分节点连接在一起,但也有一部分节点连接到远离它们的其他节点。
这种网络的特点是具有较小的平均路径长度和较大的聚类系数。
4. 非线性网络。
非线性网络包括动力学网络和生物网络,在这些网络中,边的权重也具有非线性性质。
这种网络的特点是具有丰富的动力学行为,包括同步、混沌等。
二、复杂网络的结构分析复杂网络的结构分析主要是研究网络连接的拓扑结构,包括网络的度分布、聚类系数、平均路径长度等特征。
1. 度分布。
度分布是指节点在网络中的度数概率分布,它是复杂网络的基本特性之一。
在一个网络中,节点度数越大,其所占比例越小,表现出幂律分布。
2. 聚类系数。
聚类系数是指节点的邻居之间也彼此相连的概率,它描述了网络的局部结构。
在随机网络中,聚类系数很小,在规则网络中,聚类系数很大,而在小世界网络中,聚类系数介于二者之间。
3. 平均路径长度。
平均路径长度是指节点之间的平均最短路径长度,它是网络中任意两个节点间距离的度量。
在随机网络中,平均路径长度较大,在规则网络中平均路径长度较小,而在小世界网络中,平均路径长度介于二者之间。
网络社区研究综述——以2010、2011年相关研究为例

、
网络社 区的发展现状研究
目前 , 学界对 网络社 区的研究多集 中
在对 网络社 区信 息传播与传播影 响研究 、
对 网络社 区构成 的研 究及 网络社 区 的营 销研 究等方面 。
NSOD调查研 究 E R WWLI
网络 社 区研 究综 述
以 2 、 1 相 关研 究 为 例 2 1 年 00 0 1
。张 洁
【 摘
要 】网络社 区的 出现在一 定程度上提升 了网络的影响力。 同时, 网络社 区的研究工作也呈现 出不断深入 的趋 势。 对 本文 通过
发展脉络 文 献研 究
梳理 学界 、 业界对 网络社 区的研 究和 实践, 旨在呈现 网络社 区的发展 脉络及发展 中普遍 关注的 问题 , 分析 网络社 区的未来发展方向。
【 关键 词 】网络 社 区
互联 网时代 , 网络对人们 的影 响无 处 不在 。 与此 同时 , 们对 网络 的依赖程 度 人 也越来越 高 。 在这 种大 环境下 , 网络社 区
S S网站盛 行 的重要动 因 。 N 同时 , 众在 受 网络社 区中也达 到 了诸 如 自我个性 的展
参 与 的满 足 等需 要 。 镬 有 学 者 从 网络 社 还
的营销分 析 中提 出 了网络社 区在 网络 营 销 中的重要地 位 , 并提 出对网络社 区市 场
社 区的研 究正如 网络社 区的发展一样 , 一
显 示 , 区 网 站 ( 微 博 、 交 网 站 、B 社 如 社 BS
两 位毫不 相干 的人之 间都可 通过 一定 的
复杂网络中的节点分类与社区发现研究

复杂网络中的节点分类与社区发现研究一、引言网络结构的分析已经成为了最广泛研究的领域之一,特别是对于复杂网络的研究而言,“节点”和“社区”是研究的最基本问题之一。
本文将主要介绍复杂网络中节点分类和社区发现研究的相关概念、方法和应用。
二、复杂网络网络中包含大量的节点和边,我们将其中的节点表示为V={v1,v2,…,vn},边为E,当一条边连接了两个节点时,它们就存在一种关系,例如友情、物理接触、信息交流等等。
这些关系构成了网络的拓扑结构,而通常在现实生活中,网络的结构都是非常复杂的。
其中最显著的特点是具有高度的连通性、较高的聚类系数和多项式度分布性。
三、节点分类3.1 概念节点分类是通过解析网络中节点数量、类型、结构、属性等信息,将这些节点划分到不同的组中,从而为数据降维、特征提取、网络分析和可视化等应用提供了有力支持。
对于节点分类而言,最常用的方法就是贪心算法和模块性最优化算法。
(1) Node2Vec算法Node2Vec算法是一种基于深度学习的节点分类算法,其主要思想是利用节点的前后设置,学习节点嵌入的表征。
首先通过随机游走模型生成节点序列,然后通过负采样生成负样本,利用Skip-Gram模型训练生成词向量感知器,最终得到每个节点的表征向量。
(2)社区邻居划分算法社区邻居划分算法是一种基于社区最佳化搜索的节点分类方法,其主要思想是先划分所有节点成为不同的社区,然后通过计算每对社区块间的modularity值继续进行两两合并,直至达到最终的目标。
该方法具有精度高、可扩展、可适应性等特点,在多种应用中得到广泛的应用。
四、社区发现4.1 概念社区发现是一种根据网络的拓扑结构探测其内部隐含的社区组织结构的方法,它的基本思想是,将网络中的节点划分为几个有紧密联系的节点集合,以识别出每个集合中的“社区”;而不同的社区之间往往不会有过多联系。
社区发现方法主要分为聚类法、划分法和混合法三大类。
(1)基于谱的Clustering算法基于谱的Clustering算法是一种利用谱理论的社区发现算法,其核心思路是,通过网络的特征矩阵,求得其Laplacian特征向量,并对其进行聚类分析。
基于复杂网络的社交网络结构分析研究

基于复杂网络的社交网络结构分析研究社交网络已经成为现代人们生活中不可或缺的一部分,随着社交网络用户数量的不断增多,对社交网络的研究也日益重要。
复杂网络理论可以用来研究社交网络的结构和特性,从而更好地理解和优化社交网络服务。
本文将介绍基于复杂网络的社交网络结构分析研究的主要内容和方法。
一、社交网络的基本结构社交网络可以看作是由结点和边组成的图,其中每个结点代表一个用户,每条边代表两个用户之间的关系。
社交网络具有以下几种基本结构:1.星形结构星形结构是指以一个结点为中心,其他结点都与其相连的冗余结构。
这种结构容易形成在 Twitter 和 Instagram 等社交网络中,通常代表着受欢迎的用户。
2.圈子结构圈子结构是指多个用户之间形成一个封闭的小团体,圈子内部关系紧密,圈子之间的联系相对较少。
Facebook 就是一个典型的例子,用户可以加入不同的朋友圈,每个圈子内部关系相对独立。
3.小世界结构小世界结构是指社交网络中大部分用户都与自己认识的人有联系,但也存在少数的“跨世界联系”,从而形成小世界现象。
例如,在 LinkedIn 上,一个人可以通过朋友的联系链找到一个完全陌生的人。
二、社交网络的度分布度分布是指社交网络中每个结点的度数分布特征。
在一个社交网络中,具有较高度数的结点称为“中心节点”,而度数较低的结点则是“边缘节点”。
度分布直观地展示了社交网络中各个节点的连接特性,是社交网络关键结构的刻画。
在大多数社交网络中,度分布都呈现出具有幂律分布的特征,即高度数结点很少,而低度数结点数量则很大。
例如,在 Twitter 上,只有极少数的明星或名人拥有大量的粉丝,而绝大多数普通用户只有少数几个粉丝。
三、社交网络的聚集系数聚集系数用于衡量社交网络中群组之间联系紧密度的度量值。
聚集系数取值范围一般在 0 到 1 之间,表示一个社交网络中的群组联系越紧密,越容易形成一个聚集系数接近 1 的社群。
通过计算每个结点的聚集系数,并求取平均聚集系数,可以得到整个社交网络的聚集系数。
复杂网络结构

Rep. 424 (2006) 175-308 Newman, Barabasi, Watts, The Structure and Dynamics of Networks,
P(k) e pN ( pN )k ek k k
k!
k!
10000个顶点
p=0.0015
度分布
幂律分布——Power Law
P(k) k =-3
ln P(k) ln k
World Wide Web
Nodes: WWW documents Links: URL links 800 million documents (S. Lawrence, 1999)
Complex Systems and Networks, SCIENCE VOL 325 24 JULY 2009
CONTENTS
News
406 Ourselves and Our Interactions: The Ultimate Physics Problem? 407 Econophysics: Still Controversial AfterAll These Years 409 Counterterrorism’s New Tool: ‘Metanetwork’ Analysis 410 Investigating Networks: The Dark Side
Princeton University Press, 2006 S. N. Dorogovtsev and A. V. Goltsev Critical phenomena in complex
复杂网络的结构与功能分析研究

复杂网络的结构与功能分析研究随着信息技术的不断发展,互联网的普及和大数据的出现,人们对复杂网络的研究越来越深入。
复杂网络是由大量节点和连接组成的网络,其结构和功能极其复杂,涉及到数学、物理、计算机科学等多个领域。
分析复杂网络的结构和功能,已成为学术界和工业界的研究热点之一。
一、复杂网络的结构分析复杂网络的结构分析是研究整个网络的组成、节点之间的联系以及它们之间的作用,以便更好地了解和把握网络的特征和演化规律。
网络的结构可以用多个指标来衡量和描述,下面介绍几个经典的指标。
1.度分布度分布指的是每个节点在整个网络中所连接的其他节点数。
在复杂网络中,度分布往往呈现幂律分布。
这意味着只有极少数的节点具有非常高的度数,大部分节点都具有很小的度数。
这种分布方式在现实世界中也有很多应用,例如社交网络中的明星、政治家等。
2.聚集系数聚集系数是节点邻居之间实际连接数量与可能的最大连接数量之比。
它可以衡量节点的聚集程度和网络的紧密度。
在某些网络中,聚集系数很高,说明节点之间互相连通密切,形成了紧密的社区结构。
3.连通性连通性是评估整个网络的联通性。
在复杂网络中,很少有全局连通网络,多为分散的子图。
平均路径长度是一个衡量网络连通性的经典指标。
它指的是两个节点之间最短的路径长度的平均值。
较短的平均路径长度意味着网络中信息传播和交流的效率更高。
二、复杂网络的功能分析复杂网络的功能分析指的是网络对于某些特定目标或任务所具有的性能和效率。
如何对复杂网络的功能进行刻画和评估,也是近年来学术界和实践界广泛关注的主题。
1.差异性指标差异性指标被广泛应用于社交网络中。
用于衡量一个人在网络中的地位和影响力。
例如,对于用户而言,粉丝数量、关注数量等指标可以衡量用户的影响力,而对于微博或推特等社交平台而言,主题热度、点击率、转发率等指标可以反映话题的热门程度。
2.复杂性指标复杂性指标可以反映网络的一些高级特性,如拓扑结构、动态变化等。
例如,介数中心性可以衡量最短路径经过该节点的频率,可以用来探测网络拓扑结构;社区检测可以发现网络中独立的社区,可以用来研究节点之间的关系和作用。
复杂网络的结构分析及应用

复杂网络的结构分析及应用随着互联网的迅速发展,网络已经成为人类交流和信息传递的主要渠道之一。
而网络的结构也逐渐变得越来越复杂,这就需要我们对复杂网络的结构进行分析和研究,以更好地理解网络并应用于实际生活和工作中。
一、复杂网络的定义和结构复杂网络是由多个节点和链接构成的,节点表示网络中的个体或对象,链接表示它们之间的关系。
复杂网络的结构可以是完全随机的也可以是高度有组织的,网络结构的不同会对网络的性质和功能有着重要的影响。
例如,完全随机的网络结构拥有极低的聚类系数和较短的平均路径长度,这意味着节点之间很难形成短途和长途关系。
相反,高度有组织的网络结构,如小世界网络和无标度网络,具有较高的聚类系数和较短的平均路径长度,这使得节点之间能够形成短途和长途关系。
二、复杂网络的分析方法为了更好地理解和应用复杂网络,需要对网络的结构进行分析。
下面是几种对复杂网络结构分析的常用方法:1. 聚类系数(Coefficient of Clustering)聚类系数描述了网络中节点之间的聚集程度,通常用于描述小世界网络和社交网络中的社区结构。
2. 平均路径长度(Average Path Length)平均路径长度描述了网络中从一个节点到其他节点的平均最短路径长度,通常用于描述无标度网络中节点之间的联系。
3. 节点度数分布(Degree Distribution)节点度数分布描述了网络中节点度数的分布情况,通常用于描述无标度网络中节点的枢纽性质。
4. 中心性(Centrality)中心性描述了网络中节点的重要性程度,通常分为度中心性、接近中心性、介数中心性等。
以上各种分析方法都可以从不同的角度和维度上揭示网络结构的特征和规律,并为网络的应用提供有价值的参考和指导。
三、复杂网络的应用复杂网络在实际生活和工作中有着广泛的应用,下面是几个具体例子:1. 社交网络社交网络是人们在线上交流、分享和交友的主要平台之一。
通过对社交网络的结构分析,可以发现不同的社区结构、节点特性和联系方式等,从而更好地理解社交网络的功能和影响,为在线营销、舆情监测和社会分析提供数据支持。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这种划分的方法的缺陷是只能用于划分存在两个社团
结构的网络,并且必须事先知道该网络的两个社区的大小.
这些局限使得该算法很难应用于实际问题.
3.1.2
谱方法
其他复杂网络社区结构发现方法
除了上述两类方法外,还存在这些方法,例如:进化算
该方法通过分析网络的Laplace算子的特征向量完成分
割.
法,基于相似度的层次聚类算法,随机游走算法,结点聚类中
x
其中n:为社区i的结点数,rt为网络中的结点总数,d;为社区 i结点的度之和,D。如下:
K阶的矩阵(e。),其中元素e。表示
占√i)=玎南/
占。=e:“/d。
(2.5) (2.6) (2.7)
凡。L n:一l,z
网络中连接社区i和社区J中的节点的边在所有边中所占得
32
万方数据
Q值越大说明社区结构越明显. 现存的多种社区结构衡量的标准都各有优劣,目前还没
法进行结合来求解这一问题.
3.3.1
关系.如果这两个结点之间有边相连接,则L。=I,否则 L。=一1,该矩阵总有一个特征值为0,其对应的特征向量为 z=(I,1,…,1).可以证明,不为零的特征值所对应的的特 征向量的各元素中,同一个社区内的结点对应的元素是近似 相等的,这就是谱平分方法的理论基础.
中有较为详细的讨论.本文中不考虑社区重叠的问题,主要 采用Newman提出的结点集合的定义方式. 虽然人们从不同角度提出了多种关于网络社区结构的 定义,但目前还没有一个被人们广泛认可的统一的的定义. 2
2.1
一种改进的模块度函数Q
Newman等人给出的模块度函数Q存在一定缺陷,因此.
许多人都致力于Q函数的改善,文献[8]中结合社区结构的 最初定义,给出一种改进的模块度函数,我们称其为Q.
1.2
占(c)2而等沥
其中m为网络中总的边数.
(1.3)
一个网络的合理社区分割要满足社区内的连接率要大 于网络的平均连接率,而社区间的连接率要小于平均连接 室.
强社区和弱社区的定义
lqadieehi等人给出了强社区和弱社区的定义,引文[2]
1
社区定义
一些科研工作中们又从不同的角度提出了一些社区的
中,又在强社区和弱社区的基础上定义了最弱社区,并且对
其中F为结点i在社区c。内部的连接,^。.是结点i与社区c,
之间的连接.
Q=∑(elI_口:)=m一憎o
其中№【|表示矩阵z中所有的元素之和.
(2.1)
(4)改进的弱社区结构¨1:结合最弱社区的概念,对弱 社区作如下的改进,设c。,c:,…,c。是图G的社区,若有
V
模块度是现今被广泛认可的评价社区结构强弱的指标. 最近,一些科研工作者提出了模块度函数的一些缺陷,指出
2011年9月
阴山学刊
YINSHAN ACADEMIC JOURNAL
Sep.2011 V01.25 No.3
第25卷第3期
复杂网络社区结构问题综述
智 源,行
飞
(内蒙古大学数学科学学院,内蒙古呼和浩特010021)
摘
要:本文从社区的定义,社区结构评价指标,社区发现算法几个方面对复杂网络社区结构问题进行了
综述。对现有的几种对社区的定义进行了较详细的阐述,介绍了几种比较有代表性的评价指标,并对复杂网 络社区发现算法进行了分类总结,最后对复杂网络社区结构的发展做出展望。 关键词:复杂网络;社区结构;评价函数;算法 中图分类号:0242.21文献标识码:A文章编号:1004—1869(2011)03—0031一04
区同时是一个最弱社区.反之不成立. 1.3
的概念∞1
上式中,m为社区个数,G。为社区i中的结,£(一,一)为社区i内部连边的数量,L(一,y。)为社
区i中的结点与社区外部结点连边的数量.I—l为社区i的 结点个数. 模块密度D表示社区内部边与社区间的边之差与社区 结点总数之比.模块度密度这一衡量标准考虑到了社区总的 结点数,克服了模块度Q无法探测小社区的缺陷. 2.3
最近刘晋霞等人在文献[7]中结合了社区簇内密度、簇 间密度和平均密度,对模块度函数Q存在的缺陷进行改进,
提出了社区度的概念.社区度指标定义为:
C:上÷
C:.
C。。,
m鲁
(2.3)
题是很有研究价值的.
此外,还有关于社区的许多其他定义方式,在文献[3]
上式中m为社区的个数,n为整个网络的结点数,n, 为社区i 的结点个数,C。为社区i内部边的数量,C。为社区 i中的结 点与社区外的结点连边的数量. 2.4
(2)弱社区结构:G’中所有结点与G’内部顶点的边数 之和大于G’中所有顶点与G’所有外部结点的边数之和.
比例.设矩阵中对角线上各元素之和为Tre=∑e。(e。表示
网络中连接社区i内部各节点的边在所有边的数目中所占比
IE“’
∑七:“>∑∥
‘E“’
(1.5)
例),定义每行(或者列)中各元素之和为。.=∑eF它表
模块度函数只适用于结点数较多的社区探测,不能检测出复 杂网络中的小社区结构∞1.
i∈c々,F≥k。.(J≠k,J=l,2…m)
(1.7)
并且
∑州c。)>∑七:“(c。) …}
‘fit‘‘
(1.8)
2.2
模块密度D
针上述模块度函数的这一缺陷,李珍平提出模块密度D
即在满足最弱社区的基础上,如果满足社区内的所有结点在 社区内的度值之和大于所有结点在社区外的度值之和,则认 为这样的社区具有弱社区结构.如此定义的,弱社区结构满 足如下包含关系:若社区是一个强社区,那么该社区同时也 是一个弱社区和最弱社区.若社区是一个弱社区,那么该社
方法每一次分割都把网络分为两个社区,由于不能判断整个 网络应该分解为多少个社区,算法很难应用到实际的问题中
去. 3.1.3
该算法设计了交叉算子,用交叉个体一的一个社区传递 给交叉个体二来完成交叉操作.
其他基于优化的算法
由于这一算法在交叉过程中对父代个体破坏性较大,没 有考虑到结点之间的连接关系,因此算法设计了结点CV 值,对种群中的每个个体进行纠错计算. 近几年,科研工作者们在Tasgin遗传算法的基础上进行 了改进,这些改进主要针对该算法对结点间的连接关系考虑 较少的缺陷.例如陈盈晖等人在文献[9]中提出的算法,增 加了邻域搜索算子,根据网络的邻接矩阵将有连接关系的结 点调整到同一个社区.何东晓等人在文献[10]中提出的算 法中,采用了随机游走的初始化算法和基于聚类融合的多个 体交叉算子,更好的保存了上一代个体的优良性状.类似的
Kernighan—Lin算法
Kernighan—Lin算法是一种试探优化算法,它基于贪婪
量.因此,通过计算最小截集可以识别社区间连接,经过反复 识别并删除社区间连接,网络社区能够被逐渐分离开来.该 算法的效率取决于计算最小截集的时间按,目前最快的最小 截集计算方法需要O(mnlog(n2/m))时间…1
该算法的缺点是时间复杂度较大,为O(n3),因此无法
3
社区结构发现的算法
在这一部分将对复杂网络社区化问题的一些经典算法
进行简单介绍.目前存在的复杂网络社区划分方法大体上可 以分为两类…:基于优化的方法,启发式方法.
3.1
将其用于规模较大的复杂网路.
3.2.2
基于优化的算法
这一类方法将复杂网络社区划分问题看作是优化问题,
有一个被大家认可的统一的衡量社区结构的标准.
大的边.首先计算网络中所有边的介数,找到介数最高的边 并将其移除,直到每个结点都是一个退化的社区为止.这一 算法弥补了传统算法的不足,但是仍然存在不知道分解该在 哪一步终止的问题.为解决这一问题,Newman等人引进了模 块度的概念,来衡量社区划分质量的标准.模块度的定义将 在本文第四部分中进行详细阐述.
接较为稀疏.
">ko“,Vi∈G’
(1.4)
设图G的子图G。,其结点个数分别/7,和/7,;,那么子图内
其中,F和七●(i∈c’)分别是G’内各个结点的连接数和c’
收稿日期:2011一05—18 作者简介:智
源(1985一),女,内蒙古巴彦淖弥人,硕士研究生,研究方向:算法分析与设计。
3l
万方数据
内的结点和G’外的结点相连接的连接数.
对于一个有n个结点的无向图G的Laplace矩阵是一个
n×n维的对称矩阵,记为L.其中£的对角线上的元素L。表 示结点i的度,非对角线上元素£。表示结点i和结点,的连接
心度方法等等,本文采用单亲遗传算法来求解这一问题,下 面主要阐述目前存在的几种主要的进化算法. 近年来,基于智能计算也提出了一些复杂网络社区划分 的方法,如遗传算法的运用,还有一些将遗传算法与其他方
(2・4)
复杂网络社区问题评价指标
模块度函数Q
社区结构的几种定义都无法直接应用于复杂网络社区
虿=;。。导=÷;羔
D;=占。/8。。。
结构的探测中,无法评价算法求得社区结构的好坏.因此,
Girvan和Newman给出了模块度Q函数¨1,定量地描述社区 结构划分的优劣。 考虑网络的某种划分形式,即将网络划分为K个社区 5。,s:,…,S。定义一个K
系,这样就可以用顶点和边来刻画复杂系统。2002年,New—
最大的连接数为n;(n。一1)/2,子图外部最大连接数为n。(凡 一ni).定义子图S。的内部链接率:
蹦小志/7,ni/
。L
—l,二
其中S。。为子图S内部连边的数量. 外部连接率:
允√s)2而尚
其中s。为子图外部边数. 网络的平均连接率:
(1・2)
man提出了复杂网络的社区结构(Cmmunity Structure)的概 念,社区(Community)就是网络中结点的集合。社区中的结 点之间具有紧密的连接,而社区之间则为松散的连接。例 如,在社会网络中,社区可能表现为根据兴趣或背景而形成 的社会团体。在万维网中,社区可能就是讨论相关主题的一 些网站。 本文将从以下几个方面来对复杂网络社区划分问题进 行综述:一、社区的定义。二、社区结构划分的评价指标。 三、现有社区发现算法概述。四、总结和展望。