复杂网络重叠社团挖掘算法

合集下载

复杂网络中的社团发现算法对比和性能评估

复杂网络中的社团发现算法对比和性能评估

复杂网络中的社团发现算法对比和性能评估在复杂网络的研究中,社团发现算法对于揭示网络中隐含的组织结构和功能模块具有重要意义。

社团发现算法目的是将网络的节点划分为不同的社团或群集,使得同一个社团内的节点之间具有紧密的连接,而不同社团之间的连接则相对较弱。

本文将对几种常见的复杂网络社团发现算法进行对比和性能评估。

1. 强连通性算法强连通性算法主要关注网络中的强连通分量,即其中的节点之间互相可达。

常见的强连通性算法有Tarjan算法和Kosaraju算法。

这些算法适用于有向图和无向图,并且能够有效地识别网络中的全部强连通分量。

2. 谱聚类算法谱聚类算法是一种基于图谱理论的社团发现算法,通过将网络表示为拉普拉斯矩阵,使用特征值分解或近似方法提取主要特征向量,从而实现节点的划分。

常见的谱聚类算法包括拉普拉斯特征映射(LE)和归一化谱聚类(Ncut)。

谱聚类算法在复杂网络中表现出色,尤其在分割不规则形状的社团时效果较好。

3. 模块度优化算法模块度优化算法通过最大化网络的模块度指标,寻找网络中最优的社团划分。

常见的模块度优化算法有GN算法(Girvan-Newman)和Louvain算法。

这些算法通过迭代删除网络中的边或合并社团,以最大化模块度指标。

模块度优化算法具有较高的计算效率和准确性,广泛应用于实际网络的社团发现中。

4. 层次聚类算法层次聚类算法通过基于节点之间的相似度或距离构建层次化的社团结构。

常见的层次聚类算法有分裂和合并(Spectral Clustering,SC)和非重叠连通(Non-overlapping Connector,NC)算法。

这些算法通过自顶向下或自底向上的方式逐步划分或合并社团。

层次聚类算法能够全面地刻画网络中的社团结构,但在大规模网络上的计算复杂度较高。

5. 基于物理模型的算法基于物理模型的算法通过模拟物理过程来发现网络中的社团结构。

常见的基于物理模型的社团发现算法有模拟退火算法(Simulated Annealing,SA)和蚁群算法(Ant Colony Algorithm,ACA)。

基于复杂网络的重叠社团发现算法

基于复杂网络的重叠社团发现算法

基于复杂网络的重叠社团发现算法基于复杂网络的重叠社团发现算法复杂网络是由大量节点和连接组成的复杂结构,它不仅应用广泛,而且具有重要的理论价值。

在复杂网络中,社团是一组高度相互关联的节点,而重叠社团则是指存在相同节点的多个社团。

重叠社团发现是一种重要的网络分析技术,可以揭示网络中的隐藏关系,对于研究人类行为、社交网络、蛋白质互作网络等领域具有重要的应用价值。

基于复杂网络的重叠社团发现算法主要分为两种,一种是基于聚类的算法,即将网络划分为若干个社团,使得同一社团内的节点之间的连接强度较强,而不同社团之间的连接强度较弱。

但是,这种算法只适用于发现非重叠社团。

另一种是基于分解的算法,即将网络表示为若干个基本成分的加权组合,其中每一基本成分需要包含许多节点。

这种算法不仅能够发现非重叠社团,更能够发现重叠社团。

重叠社团发现算法的主要挑战是如何对同一节点在多个社团之间的属于度量。

为了解决这个问题,研究者们提出了许多新的算法。

其中比较流行的是Jaccard系数和模块度。

Jaccard系数是一个二元度量,它将两个社团之间的交集和并集相除。

模块度被认为是复杂网络重叠社团发现算法中最流行的指标之一。

它是一个用于度量网络内部的连接强度和社团之间的连接弱度的权重性度量。

在实际应用中,重叠社团发现算法具有广泛应用。

例如,在社交网络中,我们可以使用重叠社团发现算法来识别网络中的小圈子,进一步了解社交网络中的社群结构。

在生物学中,我们可以使用这种算法来识别蛋白质互作网络中的蛋白质复合物。

在多媒体数据分析中,我们可以使用这种算法来分析大规模图像数据的群体特征。

可见,重叠社团发现算法在各个领域具有广泛的应用前景。

总之,基于复杂网络的重叠社团发现算法是一项重要的研究课题,具有广泛的应用前景。

在未来,我们需要继续深入探索这种算法,加强其理论分析和实际研究,为推动科学技术进步做出积极贡献。

复杂网络中的社团发现算法研究与评估

复杂网络中的社团发现算法研究与评估

复杂网络中的社团发现算法研究与评估随着互联网的发展,网络已经成为人们交流与信息传播的重要平台之一。

复杂网络的研究正成为网络科学领域的一个热点问题。

在复杂网络中,社团结构的发现是一项重要的任务,其涉及到网络结构的分析和理解。

社团是指一群有相似特征或相互关联的节点的集合,在网络中具有较大的内部联系强度和较小的外部联系强度。

社团发现算法的目标是通过网络图的分析,将网络中的节点划分为不同的社团,以揭示网络结构的内在组织和功能。

在复杂网络中,社团结构的发现是一项具有挑战性的任务。

这是因为复杂网络往往具有大规模、高密度以及随机性等特点,使得社团划分变得复杂和困难。

在过去的几十年中,学术界提出了许多社团发现算法,包括基于图变换的方法、基于谱聚类的方法、基于模块度的方法等。

这些方法各有优劣,需要根据实际问题的特点选择合适的方法。

其中,基于图变换的方法是最常见的社团发现方法之一。

图变换是指将网络图转化为其他数学对象以便进行分析的过程。

常用的图变换方法有K-Means、谱聚类和层次聚类等。

这些方法通过将网络转化为矩阵或向量形式,并利用聚类算法将节点划分为不同的社团。

例如,K-Means算法适用于将节点基于相似度划分为不同的簇。

谱聚类则是通过图拉普拉斯矩阵的特征向量来实现社团发现。

除了基于图变换的方法,还有基于模块度的社团发现方法。

模块度是一种衡量网络社团性质的指标,用于评估社团划分的好坏。

基于模块度的方法通过优化模块度指标来实现社团发现。

例如,Louvain算法就是一种常用的基于模块度的社团发现算法。

该方法通过迭代优化社团的分布,使得社团之间的联系更强、社团内部的联系更弱,从而达到最大化模块度的目标。

评估社团发现算法的性能也是一项重要的任务。

常用的评估指标有模块度、归一化互信息、覆盖率等。

模块度用于评估社团内连接的强度与社团间连接的弱度,值越大表示社团结构划分得越好。

归一化互信息用于评估算法对真实社团结构的一致性,值越大表示算法发现的社团结构越接近真实结构。

复杂网络社团发现算法的研究及应用评估

复杂网络社团发现算法的研究及应用评估

复杂网络社团发现算法的研究及应用评估摘要:随着互联网的迅速发展和智能科技的日益普及,复杂网络的研究变得越来越重要。

其中,社团结构是复杂网络中一种普遍存在的特征,其对于网络的功能和特性具有重要影响。

因此,本文将深入探讨复杂网络社团发现算法的研究以及对其应用进行评估。

1. 引言复杂网络是由大量节点和连接所构成的网络结构,其具有较高的节点连接度和节点间的非线性相互作用。

在现实生活中,复杂网络广泛应用于社交网络、生物网络、信息网络等领域。

而社团结构则是复杂网络中的一种重要特征,指一组紧密相关的节点集合。

社团发现算法的研究旨在识别网络中的社团结构,以揭示网络的内在组织形式和功能机制。

2. 复杂网络社团发现算法的研究2.1 传统算法传统的复杂网络社团发现算法主要有基于聚类的方法、基于图分割的方法和基于优化的方法。

其中,聚类方法通过节点之间的相似性将网络划分为不同的社团;图分割方法则通过最小化社团间的连接权重来识别社团结构;优化方法则通过最大化社团内的连接权重和最小化社团间的连接权重来发现社团。

然而,这些传统算法存在着在处理大规模网络时效率低下、对网络噪声敏感等问题。

2.2 近期算法近年来,随着大数据与机器学习技术的不断发展,一些新兴的复杂网络社团发现算法也相继提出。

其中,基于模块度优化的算法使用了更精确的社团定义和评估指标,能够更好地发现网络的社团结构。

另外,基于机器学习的算法利用聚类或分类模型来发现社团,并通过训练模型来提高算法的准确性。

这些近期的算法在效率和准确性方面取得了较大的突破,但仍需进一步改进。

3. 复杂网络社团发现算法的应用评估为了评估复杂网络社团发现算法的性能和适用性,需要制定一组合理的指标。

常用的评估指标包括模块度、归一化互信息(NMI)、标准化互信息(SMI)等。

模块度衡量了发现的社团结构与真实社团结构之间的相似性,而NMI和SMI则衡量了社团发现结构与已知信息之间的相关性。

4. 算法的应用场景复杂网络社团发现算法在许多领域具有广泛的应用价值。

复杂网络的社群挖掘研究

复杂网络的社群挖掘研究

复杂网络的社群挖掘研究一、引言复杂网络是指具有复杂结构,异构性质和动态演化特点的网络模型。

随着计算机技术和社会信息化的发展,复杂网络出现在各个领域,并体现出了比简单网络更加丰富和复杂的特征。

社群挖掘是通过挖掘网络中节点间相似度和差异性的一种方法,可以将网络中的节点组织成若干个社群。

本文将试图从社群挖掘的角度出发,探讨如何对复杂网络进行社群挖掘研究。

二、复杂网络的社群挖掘1.社群挖掘的原理社群挖掘是通过挖掘网络中节点的相似度和差异性,将网络中的节点组织成若干个社群。

社群挖掘的原理可以有多种形式,例如基于结构的社群挖掘、基于模型的社群挖掘、基于演化的社群挖掘等。

其中,基于结构的社群挖掘是最为常见和基础的社群挖掘方法,其核心就是通过考虑节点之间的关系网络结构,将网络中的节点分成若干个社群。

2.复杂网络的社群挖掘方法复杂网络的社群挖掘方法与简单网络的社群挖掘方法是有一定区别的。

其主要表现在以下几个方面:(1)标准社群挖掘方法往往无法适应复杂网络的挖掘需求,需要针对特定问题设计特定的算法。

(2)复杂网络中的社群具有多层次、多关系、多尺度等特点,需要选择不同的社群挖掘算法以实现对多维度信息的精确提取。

(3)复杂网络中的社群之间存在覆盖和交叉重叠的现象,需要借助一些复杂的编码、退火、迭代等搜索算法以使挖掘结果更准确。

(4)为提高挖掘效率和准确性,需要在社群挖掘算法中引入一定的人工指导和先验知识。

三、复杂网络的社群挖掘实例现以物流运输网络为例,实现复杂网络的社群挖掘。

物流运输网络是典型的具备复杂网络特征的网络,其节点包括供应商、制造商、分销商、消费者等各类物流参与者。

它们之间的联系涉及采购、生产、运输、售后等多个环节,交易模式各异,且受到多种因素(如区域、环保、政策等)影响。

但无论是对于整体运输网络,还是对于每个参与者而言,都存在很大的社群性。

通过对物流运输网络的社群挖掘研究,可以开展以下三个方面的工作:(1)网络结构刻画:对物流运输网络的网络结构进行分析,包括节点数量、边数量、网络密度等特征。

复杂网络中的社团结构探测和应用研究

复杂网络中的社团结构探测和应用研究

复杂网络中的社团结构探测和应用研究随着人类社会的发展和科技的进步,人类之间的联系变得越来越复杂,网络的出现更是让人类社会变得紧密而复杂。

在网络中,每个节点代表着一个实体,节点之间的联系则代表着这些实体的关系。

如何解析这些关系并揭示网络中的规律,就成为了网络科学的一个重要研究课题。

社团结构探测是网络科学中的一个重要研究方向,它研究的是如何将一个大的网络划分为若干个较小的群体(即社团),每个社团内部的节点之间联系紧密,而不同社团之间节点之间联系相对松散。

社团结构探测在生物学、社交网络、传播学及其他领域都有重要应用。

一、社团结构探测算法在网络中,一个节点的度数代表着与该节点直接相连的节点数。

一个社团则可以定义为一个节点集合,该集合中的节点之间具有密集的联系,而这种联系则表现为社团内部节点的度数较大。

社团结构探测算法的目的就是找到这些社团,并将它们划分出来。

社团结构探测算法可以分为基于聚类的算法、基于模型的算法和基于优化的算法等几类。

1. 基于聚类的算法基于聚类的算法通常采用类似于K-Means的方法来划分社团。

最简单的算法是一种贪心算法,即从一个起始点出发,沿着连接的边逐步地把最邻近的节点加入社团中,直到一个社团被完全发现。

然后,在不同的起始点上重复这一过程,以便找到尽可能多的不同社团。

这种方法的缺陷在于其聚类的结果往往非常依赖于起始节点的选择,可能存在很大的随机性。

2. 基于模型的算法基于模型的算法则采用概率模型来对节点之间的联系进行描述,并根据模型来划分社团。

一个经典的基于模型的算法是层次化贝叶斯方法。

该方法首先假设网络中所有节点都分属于若干个社团之中,然后结合模型选择算法,寻找最优划分,将各个节点排成一颗树状结构。

最终,可以通过剪枝来决定社团的数量。

3. 基于优化的算法基于优化的算法则将社团划分问题转化为一个优化问题,并将寻找最优解的过程表示为一个涉及分割的图形优化问题。

经典的基于优化的算法包括模拟退火算法、遗传算法、贪心算法等。

复杂网络中的社团检测算法性能比较与优化

复杂网络中的社团检测算法性能比较与优化

复杂网络中的社团检测算法性能比较与优化在复杂网络中,社团检测是一项重要的任务,旨在发现网络中具有内在紧密联系的群组。

社团结构的发现对于理解和分析复杂网络的功能和特征至关重要。

随着网络规模和复杂性的不断增长,如何高效准确地检测社团结构成为了研究的关键问题。

本文将对复杂网络中的社团检测算法进行性能比较与优化。

首先,我们将介绍几种常用的社团检测算法,包括谱聚类算法、模块度优化算法和基于模型的算法。

谱聚类算法是一种基于图谱的方法,通过计算网络的特征向量来划分社团结构。

模块度优化算法是一种基于网络连接模式的方法,通过最大化网络的模块度来寻找社团结构。

基于模型的算法则是通过建立统计模型来描述网络中的社团结构。

接下来,我们将对这些算法进行性能比较。

首先是准确性的比较。

准确性是衡量社团检测算法的重要指标,即算法能否准确地划分网络中的社团结构。

我们可以通过比较算法的NMI(归一化互信息)和Rand指数来评估算法的准确性。

此外,我们还可以使用外部指标,如Ground Truth,来评估不同算法的准确性。

其次是算法的复杂性比较。

复杂性主要包括算法的时间复杂度和空间复杂度。

时间复杂度是指算法执行时间与问题规模之间的关系。

空间复杂度是指算法所需的内存空间与问题规模之间的关系。

在实际应用中,需要考虑到算法的效率和可扩展性。

在性能比较的基础上,我们可以根据不同算法的优缺点来进行算法的优化。

对于谱聚类算法,可以考虑使用近似算法来提高计算效率。

对于模块度优化算法,可以考虑结合局部搜索策略来增加算法的收敛速度。

对于基于模型的算法,可以考虑改进模型的参数估计方法以提高算法的准确性。

此外,我们还可以通过对算法进行集成和融合来提高社团检测的性能。

集成方法可以将多个算法的结果进行综合,从而得到更准确的社团结构。

融合方法可以将不同算法的优点进行组合,从而提高算法的鲁棒性和稳定性。

最后,我们将讨论社团检测算法在实际应用中的挑战和未来的研究方向。

复杂网络中的社团发现算法研究与应用

复杂网络中的社团发现算法研究与应用

复杂网络中的社团发现算法研究与应用复杂网络是由大量相互连接的节点组成的网络结构,它在许多领域中都有广泛的应用,如社交网络、生物网络和互联网等。

复杂网络中的社团发现算法是一种能够在网络中自动发现具有相似性和内部紧密连接的节点集合的方法。

本文将对复杂网络中的社团发现算法进行研究,并探讨其应用。

首先,我们来了解一下复杂网络中的社团是什么。

社团是由具有密切联系和相似功能的节点组成的集合,它们在网络中形成一个紧密连接的子图。

社团结构有助于我们理解网络中的组织结构、信息传播和功能模块等重要特征。

在复杂网络中,社团发现算法的目标是识别出具有明显结构和内部相似性的社团。

这些算法可以根据节点之间的连接模式、相似性指标和组合优化等方法来划分社团。

下面我们将介绍几种常见的社团发现算法和它们的应用。

第一种算法是基于模块度的社团发现算法。

模块度是一种衡量节点社团划分质量的指标,它计算了网络中实际连接与随机连接之间的差异。

基于模块度的算法可以将网络划分为多个社团,并最大化网络的模块度值。

这种算法在社交网络中的推荐系统、社团结构分析和信息传播研究中得到了广泛的应用。

第二种算法是基于谱聚类的社团发现算法。

谱聚类是一种基于图论和线性代数的聚类方法,它通过计算网络的特征值和特征向量来划分社团。

这种算法可以克服一些传统算法在处理大规模网络时的计算困难,被广泛应用于社交网络、生物网络和人工智能领域。

第三种算法是基于随机游走的社团发现算法。

这种算法利用节点之间的随机游走路径来发现社团结构。

它通过随机游走过程中的节点转移概率来判断节点之间的相似性和内部紧密连接程度。

基于随机游走的算法在生物学中的蛋白质相互作用网络分析和社交网络中的用户社区发现上具有重要的应用。

以上介绍的算法只是复杂网络中社团发现算法的一部分,每种算法都有其特点和适用场景。

在应用社团发现算法时,我们需要根据具体的研究目标和数据特征选择最合适的算法。

同时,我们还可以将不同的算法进行组合和改进,以提高社团发现的准确性和效果。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

- 1)
( 假定 nc = 2 时,Dc = 0)
对于一个给定网络 G 有 M 条边,N 个节点,P =
{ P1 ,P2 ,…,Pc} 对应网络的一个社团结构划分,mc 表 示其中任意一个社团 Pc 的边数,nc 表示社团 Pc 中有 边相连的节点个数。
划分密度总量: 对应整个社团结构的划分密度。
D
2 改进算法
2. 1 算法思想
原算法是先合并成树,然后根据划分密度 D 达 到最大断开。本文的思路是同时考虑边相似度从大 到小的顺序和扩展模块度 Q0 是否增大两个标准,最 后得到一个边的森林结构,然后还原成节点,从而得
到点聚类的重叠社团结构。 具体算法步骤如下: ( 1) 先计算所有相邻边对的相似度 S; ( 2) 按从大到小的顺序对 S 排序; ( 3) 按 S 从大到小的顺序合并边对,并同时计算
LYU Xiao-jun
( School of Computer,South China Normal University,Guangzhou 510631,China)
Abstract: A new overlapping communities detection algorithm based on links is proposed in this paper,which made the result better for using the extended modularity comparing the algorithm proposed by Ahn[1]. The algorithm can deal with small-scale non highly overlapping networks and obtains a good partition result. Key words: overlapping communities; extended modularity; non highly overlapping
| |
对于给定网络 G 中有公共节点 k 的相邻边 eik 和 ejk,节点 i 和它的邻居节点记为 n + ( i) ; 同理,节点 j 和它的邻居节点记为 n + ( j) 。
1. 2 划分密度
划分密度分量: 对应每个社团的划分密度。
Dc
=
nc (
mc - ( nc - 1) nc - 1) /2 - ( nc
以前,人们往往从节点的角度出发来进行社团挖 掘算法的研 究,但 是 重 叠 社 团 结 构 中 的“骑 墙 节 点 ” 可能会同时属于多个社团,所以从节点角度划分重叠 社团结构效果不是很理想。最近,Evans 等[5]和 Ahn 等[1]分别发 表 了 以 边 为 研 究 对 象 来 划 分 社 团,因 为 节点可能会 属 于 多 个 社 团,但 边 表 示 节 点 之 间 的 关 系,一般只能对应一种确定关系。这样以边为对象来 划分社团能更真实地反映节点在复杂网络中的角色。 但是 Ahn 等[1]提出的算法在小规模非高度重叠的网 络,如 Karate Club 网络、Email 网络中的划分效果并 不是很好,因此本文提出一种改进算法,实验结果表 明这种算法在小规模非高度重叠的网络中也能取得 与实际基本相符的社团划分结果。
0引言
复杂网络 一 般 指 节 点 众 多、连 接 关 系 复 杂 的 网 络,包括社会网络、电力网络、生物网络、新陈代谢网 络等。根据学者的研究,复杂网络一般都具有小世界 现象和幂律分布等统计特性,具体表现为网络中具有 社团结构。所谓社团结构是指整个网络可以由若干 个社团组成,社团之间的连接相对稀疏,社团内部的 连接相对稠密。本文研究的内容就是要从复杂网络 中检测出社团结构,从而更深刻地理解复杂网络的拓 扑特性。
3 实验结果及分析
本文算法是对文献[1]中算法的改进,故下面以 5 个经典的网络( Karate Club 网络、Dolphins 网络、American-College-Football 网络、Email 网络、Jazz-musician 网络) 就这两个算法的社团划分结果做对比。
表 1 实验结果对比
2013 年第 8 期 文章编号: 1006-2475( 2013) 08-0046-03
计算机与现代化 JISUANJI YU XIANDAIHUA
总第 216 期
复杂网络重叠社团挖掘算法
吕晓军
( 华南师范大学计算机学院,广东 广州 510631)
摘要: 针对 Ahn 等[1]提出的基于边划分的重叠社团挖掘算法,本文利用扩展模块度做了改进,得到一种新的以边为研究
社团结构可以分为非重叠社团结构和重叠社团 结构。非重叠社团结构是指社团之间互不重叠,每个 节点有且仅属于一个社团。非重叠社团结构把每个 节点严格地划分到某个社团中,而真实世界中这种硬 划分并不能真正反映节点和社团的实际关系,如社会 网络中的人属于多个集体、网络中的网页属于多个主 题等。把这种一个节点可以属于多个社团的节点叫 “骑墙节点”,具有这种“骑墙节点”的社团结构就叫 做重叠社团结构。重叠社团结构更符合真实网络的 社团组织规律,成为近几年社团发现研究的新热点。
络能取得较理想的划分结果,与实13 年第 8 期
但是本文算法所取得的结果中重叠节点过多,是以后 在进一步研究中需要解决的问题。
由于篇幅所限,本文仅列出空手道俱乐部( Karate Club) 用改进算法得出的社团划分结果:
cluster 1( 20) : 9,10,14,15,16,19,20,21,23,24, 25,26,27,28,29,30,31,32,33,34,
算法 网络
Ahn 算法
本文算法
Karate club
22 个社团 D = 0. 285 3 个社团 Q0 = 0. 388
Dolphins
65 个社团 D = 0. 316 4 个社团 Q0 = 0. 482
College football 158 个社团 D = 0. 550 7 个社团 Q0 = 0. 497
Q0 是否增加,如果增加或不变,则正式合并,否则放弃 合并。直到一轮扫描完毕;
( 4) 再次考虑还没合并的边对,按 S 的相似度从 大到小再次合并,并考虑 Q0 是否增加或不变;
( 5) 重复步骤( 4) ,直到所有边都用到或 Q0 开始 减小。
2. 2 算法主程序
void main( void) { / /主程序包含有 3 个模块 clock_t start,end; Read_Graph( ) ; / / --step 1: 从文件中读图 start = clock( ) ; Compute_ClusterForest( ) ; / / --Step 2: 计算并得到边的森 林结构,继而还原得到关于点的重叠社团结构 GetClusterResult( ) ; end = clock( ) ; Write_Result( ) ; / / --step 3: 输出并将点的社团结构写入 到文本文件中 printf( " 运行时间为: % . 3lf 秒 \ n" ,1. 0* ( end-start) / CLK _TCK) ; printf( " 程序运行完毕,按任意键退出. . . \ n" ) ; getch( ) ; }
示网络中节点集合; Auv 是邻接矩阵,当 u,v 有边相连 时为 1,否则为 0; ku,kv 表示节点 u,v 的度; kcu 表示节 点 u 在社团 c 中的内度; m 表示网络中边的总数。
1. 4 Ahn 算法思路
( 1) 计算所有相邻边对的相似度 S; ( 2) 按从大到小的顺序对 S 排序; ( 3) 按 S 从大到小的顺 序 合 并 边 对,如 果 S 相 同,则同时合并边对,直到合并成为一棵层次聚类树; ( 4) 根据划分密度总量 D 达到最大的标准来断 开得到的层次聚类树,从而得到基于边划分的重叠社 团结构。
cluster 2( 6) : 1,5,6,7,11,17, cluster 3( 18) : 1,2,3,4,8,9,10,12,13,14,18, 20,22,28,29,31,32,33,
4 结束语
尽管复杂网络的社团检测问题得到了大量的研 究,但还存在一些尚未解决的基本问题,如社团概念 虽然大量使用,但却缺少严格的数学定义; 大多数社 团检测算法虽然性能优越,但所需计算量却很大,尤 其是重叠社团检测算法的研究,其与实际社团结构更 相符,但也更复杂,尚存许多问题亟待解决。这说明 复杂网络中社团检测的研究还需要付出大量的努力。
1 基本概念及相关算法
给定一个无向无权的网络 G = ( V,E) ,V 表示网 络中节点的集合,E 表示边的集合。本文的目的就是 从给定网络中挖掘出以节点为元素的重叠社团结构。
由于是对 Ahn 等[1]提出的算法进行改进,所以 先介绍 Ahn 等在文献[1]中提到的两个重要定义,然 后介绍 重 叠 社 团 中 常 用 评 价 标 准 扩 展 模 块 度 的 概
参考文献: [1] Ahn Y Y,Bagrow J P,Lehmann S. Link communities re-
veal multiscale complexity in networks[J]. Nature,2010, 466( 7307) : 761-764. [2] Chen D,Shang M,Lv Z,et al. Detecting overlapping communities of weighted networks via a local algorithm[J]. Physica A: Statistical Mechanics and its Applications, 2010,389( 19) : 4177-4187. [3] 骆志刚,丁凡,蒋晓舟,等. 复杂网络社团发现算法研究 新进展[J]. 国防科技大学学报,2011,33( 1) : 47-52. [4] Shang M S,Chen D B,Zhou T. Detecting overlapping communities based on community cores in complex networks [J]. Chinese Physics Letters,2010,27( 5) : 264-267.
相关文档
最新文档