基于连边相似度的重叠社区发现算法研究施伟
基于代数连通性的复杂网络社区发现模型研究

基于代数连通性的复杂网络社区发现模型研究随着社交媒体和互联网的普及,人们越来越依赖于网络来进行社会交往和信息交换。
因此,对于复杂网络的研究和理解变得尤为重要。
其中一个重要的研究方向是社区发现模型,即在网络中识别出具有相似属性的节点集群。
这对于了解网络的结构和功能,以及预测节点行为和信息传播具有重要意义。
在这篇文章中,我们将介绍基于代数连通性的复杂网络社区发现模型研究。
社区发现的方法可以分为两类:基于密度的方法和基于代数的方法。
基于密度的方法类似于聚类算法,主要通过测量节点或边之间的距离和相似性来划分社区。
而基于代数的方法则是利用图的代数性质,如矩阵特征向量和特征值等来进行社区分析。
基于代数的方法中,代数连通性是一种重要的概念。
代数连通性是指网络中两个节点之间的路径上的那些节点可以被表示为一个矩阵的乘积,即这些节点是代数上连通的。
根据代数连通性的定义,可以将网络表达成一个矩阵,称为拉普拉斯矩阵。
该矩阵可以用来描述网络的代数结构,以及节点之间的关系。
基于代数连通性的社区发现模型中,最常用的方法是谱聚类。
该算法利用拉普拉斯矩阵的特征向量来将网络划分成不同的社区。
具体来说,谱聚类首先通过拉普拉斯矩阵的特征向量进行降维操作,然后将节点分配到聚类中心。
在分配节点时,谱聚类依据节点之间的相似性度量来实现。
然而,谱聚类方法也有其局限性。
首先,谱聚类对于大规模的网络来说计算效率较低,因为需要计算拉普拉斯矩阵的所有特征向量。
其次,谱聚类索要目前的大多数网络,社区结构较为稀疏或复杂。
因此,如何将谱聚类方法与其他新的算法相结合,以解决这些限制性问题是当前工作的重点。
目前,研究人员正在探索更加高效和精确的方法来进行复杂网络的社区发现。
例如,利用核矩阵方法来降低计算复杂度;利用传统的聚类算法,如K-means以及基于密度的算法,来辅助谱聚类;以及设计深度学习算法,来挖掘网络中潜在的与社区相关的特征。
在社区发现研究领域,基于代数连通性的方法是非常有前景的。
基于节点重要性与相似性的重叠社区发现算法

基于节点重要性与相似性的重叠社区发现算法
付饶;孟凡荣;邢艳
【期刊名称】《计算机工程》
【年(卷),期】2018(044)009
【摘要】在复杂网络中进行重叠社区发现时,现有模糊C均值算法(FCM)采用随机策略导致社区划分结果不一致.为此,提出一种新的重叠社区发现算法.引入节点重要性来量化复杂网络中节点的重要程度,根据节点重要性排序和节点间最短路径选取若干核心节点作为FCM初始的聚类中心节点,从而提高FCM的不稳定性.利用基于s-跳最短路径的节点相似度量方法得到信息更丰富的相似矩阵,以提高算法的准确率.采用谱聚类对相似矩阵处理得到节点的隶属度矩阵,并依据阈值分配各节点的社区归属.实验结果表明,该算法能够得到唯一的社区划分结果,且在Karate、Dolphins数据集上的NMI指标比GCE、INFOMAP和GOPRA等算法高8%以上.
【总页数】7页(P192-198)
【作者】付饶;孟凡荣;邢艳
【作者单位】中国矿业大学计算机科学与技术学院,江苏徐州221116;中国矿业大学计算机科学与技术学院,江苏徐州221116;中国矿业大学计算机科学与技术学院,江苏徐州221116
【正文语种】中文
【中图分类】TP301.6
【相关文献】
1.一种基于局部相似性的社区发现算法 [J], 吴钟刚;吕钊
2.基于Node2Vec的重叠社区发现算法 [J], 陈卓;姜鹏;袁玺明
3.基于节点重要性和局部扩展的重叠社区发现算法 [J], 郭峰;尤凯丽;李昕泽
4.基于SLPA优化的重叠社区发现算法 [J], 陈界全;王占全;李真;汤敏伟
5.基于节点重要性与相似性的标签传播算法 [J], 林天森;孙飞翔
因版权原因,仅展示原文概要,查看原文内容请购买。
FCM框架下的重叠社区发现算法

【 关键词 】 : 重叠社 区; 节点相似度 ; F C M
1引 言
义提 供约 束指 导 。
本 文 给 出 了社 交 网络 的两 个 性 质 并 结 合 六度 分
随着 F a c e b o o k 、 t w i t t e r与 新 浪 微 博 等 社 交 网络 服
务平 台的 成功 推广 , 关 于社 交 网络 的研 究 正 变得 日益 隔理 论构 造 出 了一 种新 的节 点相似 度 。 然 后针 对 F C M 重要 和 广 泛 。社 区结 构 是 这些 社 交 网络 的共 同特 性 , 的缺 陷提 出 改进 ,从 而 利用 该 改进 的 F C M框 架 实 现
所 谓 社 区 就 是 网络 中的“ 分组” , 组 内联 系 密 切 , 组 间 重 叠社 区发现 。该算法 利 用 了一种初 始类 簇 中心选 择 提 出 了一 种 新 的聚 类 中心 点 的 更 新 方案 , 并 在 联 系 稀疏 。在社 交 网络 中进 行 社 区发现 对 理解 它 的结 方法 , 构和 功 能特 性有 着深 刻 的理 论和 实 用价 值 。社 交 网络 计算 出节 点隶 属 度 之 后给 出 阈值 确 定 每 个 节 点 的类 不 同 于其 他 网 络 ,它 有着 一 些 独特 的现 象 和 基 本 理 标 从而 完成 重 叠 社 区发 现 , 本 文称 该 算法 为 s i mi l a i r t y
并且 使 社 区 内链 接 数 目最 多 , 而 社 区间 的链 接 数
目最少 。 重 叠 社 区发 现 目标 是 使 社 区 内的 链 接 数 目最 多
的相似 度 定义 。强弱 关系 理 论指 出了社 交 网络 中相似
性 传播 的一 种方 法 ( 通 过 邻 居) , 而 六 度 分 隔理 论 则 指 而使 社 区间链 接 数 目最 少 , 其 实链 接 是用 来体 现 节 点
【CN109949173A】基于传递相似度和聚类度的两阶段局部社区发现方法【专利】

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201910191365.X(22)申请日 2019.03.12(71)申请人 南京航空航天大学地址 211106 江苏省南京市江宁区将军大道29号(72)发明人 夏正友 刘赛赛 刘庆庆 (51)Int.Cl.G06Q 50/00(2012.01)G06F 16/953(2019.01)(54)发明名称基于传递相似度和聚类度的两阶段局部社区发现方法(57)摘要本发明涉及基于传递相似度和聚类度的两阶段局部社区发现方法,具体涉及一种基于传递相似度、局部聚类度与广度优先搜索的局部社区发现方法,包含核心社区检测和社区扩展两阶段。
在核心社区检测阶段,将给定节点和其最大局部聚类度的邻居节点加入社区中,并通过生成核心社区解决种子依赖性问题;本发明提出的传递相似性计算,同局部聚类度和搜索深度一起构成核心节点判定条件,解决了核心节点判断不准确问题;提出核心节点判定阈值和扩展节点并入社区阈值自动选取的方法,能够适应网络结构变化,自动选定不同阈值和停止遍历的条件,可以解决社区扩展结束条件确定难的问题。
权利要求书2页 说明书5页 附图1页CN 109949173 A 2019.06.28C N 109949173A1.基于传递相似度和聚类度的两阶段局部社区发现方法,其特征在于:包括以下步骤:步骤S1:读取网络数据集,生成网络图G;读取给定的节点Vu;步骤S2:初始化当前检测到的社区集合C、社区邻居队列N、节点传递相似度向量S、广度遍历深度向量Depth、节点权重W;步骤S3:根据节点局部聚类度LCC,将给定节点Vu及其具有最大LCC值的邻居节点加入C 中,更新N、S、Depth、W;步骤S4:遍历N中每一个节点Vi,将满足核心节点条件的节点Vi加入社区C中,并将其未在C和N中的邻居节点加入N中,当N中所有节点都遍历完成后,就生成了由核心节点组成的核心社区C;步骤S5:根据主关键字Depth值递增,此关键字S值递减顺序排序核心社区C;步骤S6:根据公式(6)计算核心社区C中所有节点的平均节点传递相似度Savg;步骤S7:遍历C中每个节点Vi,并将Vi的每个不在C和N中的节点加入N中;步骤S8:遍历N中每一个节点Vi,将满足扩展节点条件的节点Vi加入社区C中,并将其未在C和N中的邻居节点加入N中,当N中所有节点都遍历完成后,就生成了给定节点Vu所在的社区C;步骤S9:输出最终的社区划分结果C。
一种基于多维遗传算法的重叠社区发现方法

) 的研究发现, 一些社交网络中, 节点之间在社区间重叠 ( 图1
6 ] 部分的连接往往比社区内部的连接更加紧密 [ 。这一研究结
在很多社交网络中, 一个人往往同时属于多个群体或参与 多个话题, 这就提出了重叠社区发现的问题。现在的社区发现 算法都隐含一个共同的假设, 认为社区是网络节点集合的若干 子集, 每个子集内部节点之间的连接相对紧密, 而不同子集节
4 ] 点之间的连接相对稀疏 [ 。换句话说, 这意味着一对节点同
时属于的社区越多, 它们之间相连的可能性就越低。然而最近
现在有大量的社交网络如 F a c e b o o k 、 T w i t t e r 和新浪微博 等。在社交网络中, 人们可以通过社区相互联系和交换信息来 展示个人生活。社区结构的发现有助于捕获和跟踪网络的拓 扑结构、 揭示复杂系统内在的功能特性、 预测个体关系和行为 的演化趋势, 具有很强的应用价值。社区发现算法的研究得到 了研究人员的广泛关注, 很多经典算法如模块度、 介数等被提
1 相关工作
社区反映了网络中个体行为的局部聚集特征, 在社交网络 中存在大量的隐性或显性社区, 社区结构的研究成为近年来社
1 ~ 4 ] 交网络研究的一个趋势 [ 。
果与现有社区的认识形成了鲜明的对比, 目前已有的众多社区 发现算法均没有考虑此种结构的社区, 它们在算法中要么将社 区重叠部分分成单独的一个聚类, 要么将重叠部分的所有社区
, 2 王 琦1 ,温志平1
( 1 . 南京工程学院 计算机工程学院,南京 2 1 1 1 6 7 ; 2 . 南京大学 计算机科学与技术系,南京 2 1 0 0 9 3 ) 摘 要:社区结构的发现是社交网络分析研究的重要内容。与传统的重叠社区不同, 最近的研究表明某些真实 网络中在社区重叠部分要比社区内部节点间的连接更加密集, 而现有的算法没有考虑此类社区结构。基于遗传 算法, 提出了一种新颖的方法来发现此类社区划分。为了刻画节点属于多个社区的重叠现象, 首次将多维染色 体和均匀块交叉算子引入到社区发现算法中。通过实验证明, 提出的算法可以很好地发现社交网络中重叠和非 重叠的社区结构。 关键词:社团发现;重叠社团;多维染色体;从属网络 中图分类号:T P 3 9 3 文献标志码:A 文章编号:1 0 0 1 3 6 9 5 ( 2 0 1 6 ) 1 2 3 5 4 3 0 4 : 1 0 . 3 9 6 9 / j . i s s n . 1 0 0 1 3 6 9 5 . 2 0 1 6 . 1 2 . 0 0 6 d o i
一种新的重叠社区发现算法

区都具有 很 大的适 应度 , 则这 些节 点归属 于 多个社 区。考虑 到社 区之 间的 重 叠性 , 社 区相 似度 很 大的社 区合 将 并为 一个社 区。将 该算 法应 用到 Zca 空手道俱 乐部 网络 和 海豚社 会 网络 中, ahr y 实验 表 明该算 法 能 够很好 地 划
vs e o m n y S e h o n d s a dj n dten d i bg et tes ot o m nt.I te o e a ev r bg i tdc m u i ’ i b r o e , n ie o e t a i s fn s t h c m u i f h d d h e i i t n g o h w h g i e y n h t y
度 的社 区发现算法 , 中 N w a 其 e m n等人 提 出的 G N算法 是一
第2 9卷 第 3期 21 0 2年 3月
计 算 机 用 研 究
Ap lc t n Re e r h o mp t r p i ai s a c fCo u e s o
Vo _ 9 No 3 l2 . Ma . 2 1 t 02
一
种 新 的重 叠社 区发 现 算 法 木
d tc v r p ig c mmu i e .T i lo i m o k t e n d swi r a e t l y d ge s t e i i a o ee t e l p n o o a n t s h sag r h t o h o e t a g e tc n r i e r e a h n t lc mmu i e ,t e i t h at i nt s h n i
i e st n o f n s o ma y c mmu i e ,t e e o g d t e e a o t nt s h n i b ln e sv r lc mmu i e .Co s e n h v r p i g p o e y o o i t o nt s i n i r g t e o e l p n r p  ̄ fc mmu i ,i di a nt t y c mb n d c mmu i e i ra i lr is i t n o o ie o n t sw t g e t s a i e n o o e c mmu i .I a p id t i ag rtm n o t e Z c ay’ r t l b i h mi t nt y t p l h s l oi e h i t h a h r S Kaa e C u N t o k a d t e D l h n o il t r ,a d t e e p rme t n i ae i ag r h c n d vd v r p ig c mmu i e f — e w r n h o p i sS c a wo k n h x e Ne i n d c t s h s l o i m a ii eo el p n o i t t a n t sef i i
基于引力度扩展的重叠社区发现算法

Ov e r l a p p i n g c o mmu n i t y d e t e c t i o n a l g o r i t h m b a s e d o n e x p a n s i o n o f g r a v i t a t i o n a l d e g r e e
Ab s t r a c t : Th e o v e r l a p p i n g c o mmu n i t y t h a t t h e r e a r e a l o t o f o v e r l a p p i n g n o d e s d u r i n g c o mmu n i t i e s i n n e t wo r k s .To f i n d o v e r l a p —
g r e e .Th e a p p l i c a t i o n s t o s o me r e a l — wo r l d c o mp l e x n e t wo r k s t O e v a l u a t e t h e a l g o r i t h m ,a n d t h e e x p e r i me n t a l r e s u l t s d e mo n s t r a t e t h a t t h e a l g o r i t m h i s e f f i c i e n t f o r d e t e c t i n g o v e r l a p p i n g c o mm u n i t i e s i n c o mp l e x n e t wo r k s .
ma x i ma l g r a v i t a t i o n a l d e g r e e a n d a d d n o d e s t o e x p a n d t h e p a r t i a l c o mmu n i t y a c c o r d i n g t O t h e v a l u e o f c o mmu n i t y b e l o n g i n g d e —
基于边图的线性流重叠社区发现算法

基于边图的线性流重叠社区发现算法王斌;李强;盛津芳;孙泽军【摘要】重叠网络的社区发现是复杂网络研究中的重要问题.为了提高网络中重叠社区发现的时间效率,提出一种基于边图的线性流重叠社区发现算法LBSA.算法首先对于边图网络中的边进行随机的依次处理,完成节点的初步社区划分,再将其中重叠小社区合并到相似度最大的其他大社区中得到最终的社区.通过以上步骤,算法能够以接近线性的时间复杂度得到网络的重叠结构.从最终的实验结果来看,与其他算法相比,该算法能够在更短的时间有质量地发现网络中的重叠社区.【期刊名称】《计算机工程与应用》【年(卷),期】2019(055)002【总页数】7页(P60-66)【关键词】流式图;重叠社区发现;边聚类系数;边图;社区相似度【作者】王斌;李强;盛津芳;孙泽军【作者单位】中南大学信息科学与工程学院,长沙 410083;中南大学信息科学与工程学院,长沙 410083;中南大学信息科学与工程学院,长沙 410083;中南大学信息科学与工程学院,长沙 410083【正文语种】中文【中图分类】TP3911 引言在生物学,社会学以及网络分析等领域中,各复杂系统都可以抽象成为复杂网络[1-3]。
近些年对复杂网络研究中发现,它们普遍存在有稠密的节点聚集,也就是社区结构。
网络中的社区并没有严格的定义,一般认为社区内部节点连接更紧密,社区间节点连接更稀疏。
网络中的社区的发现,不仅对了解网络结构,分析网络特征,挖掘网络信息具有重要意义[4],而且具有广泛的应用前景[5]。
社区发现研究已经成为现代网络科学中最热门的课题之一[6]。
在传统的社区发现中,大多数研究关注于每个节点属于一个社区,而随着对更多网络如“Family”,“Foot-ball”等的研究过程中发现,每个节点可能属于多个社区,也就是网络中的社区存在有重叠结构。
目前提出了许多具有代表性的重叠社区发现算法,如基于节点的派系过滤算法(Clique Percolation Method,CPM)算法[7-9],通过定义派系k先发现网络中的全耦合网络,再将多个相互连通的小全耦合网络构成更大社团,该算法适合用于连接稠密的网络,但因需提前定义派系大小,并不适合用于现实网络中;基于边划分[10-12]的重叠社区发现算法,将原始网络转换为边图,原始网络中的边作为转换后边图中的节点,基于边图的社区划分使其边上的节点也划分到相应的社区,因每个节点有多条边,重叠的社区结构就可以被发现出来,但这类算法对于不同密度网络表现不同,同时这类算法会产生许多重叠小社区碎片;基于动力学的算法通过动态的过程发现网络中的社区结构,如基于标签传播的算法[13-14],基于同步的方法[15-16],基于距离动力学的方法[5]等,这类算法一般在不同的网络中都有较好的划分结果,但因为动态迭代过程其时间复杂度普遍较高。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
之间相似度的基础上提出了连边之间相似度的计算方法; 再按照相似度由小到大对边图删除边,构建出边图的
树状图。树状图的每一层对应网络的一个划分,采用划分密度函数来衡量划分的质量,以此寻找最优的划分。
最后将算法应用到 Zachary 空手道俱乐部网络中,并与 GN 算法进行对比,实验结果表明 EGN 算法能够很好地发
现实世界中许多复杂的系统都可以抽象为网络,如人际关 系网[1]、科学家合 作 网[2]、流 行 病 传 播 网[3]、蛋 白 质 相 互 合 作 网[4]等。这些网络具有复杂的内部结构,因此称为复杂网络。 通常复杂网络中用节点来表示个体,节点之间的连边表示个体 之间的关系。对于人际关系网来说,研究不同的人在社会上的 交际圈,可以概括出社会的组成,对社会的发展提供强有力的 参照。对于疾病传播网来说,研究疾病如何进行传播以及网络 结构本身具有的内在性质,对于控制疾病的传播具有很重要的 作用。因此复杂网络研究具有很重要的现实意义。近年来对 众多实际网络的研究发现,它们存在一个共同的特征,称为社 区结构。它是指网络由若干个群或团组成,每个群的内部节点 之间连接相 对 紧 密,而 不 同 群 之 间 节 点 的 连 接 比 较 稀 疏[5]。 社区发现近年来成为研究者所关注的焦点,发现社区的不同结 构,对于了解网络结构和分析网络特征具有重要意义。
现重叠社区。
关键词: 社区发现; 重叠社区; 相似度; 划分密度
中图分类号: TP393; TP301. 6
文献标志码: A
Hale Waihona Puke 文章编号: 1001-3695( 2013) 01-0221-03
doi: 10. 3969 / j. issn. 1001-3695. 2013. 01. 056
Overlapping communities detecting based on similarity of edge
连边相似度划分连边集的重叠社区发现算法 EGN。算法依据网络图的连边集进行划分,每一条边被划分到某个
特定的社区,而一个节点可以关联多条连边,因此节点可以被划分到不同的社区,从而发现重叠社区。EGN 算法
首先需要构造网络节点之间连边关系的边图; 然后根据边图中节点的关系计算网络图中连边的相似度,在节点
SHI Wei,FU He-gang,ZHANG Cheng
( College of Computer Science,Chongqing University,Chongqing 400044,China)
Abstract: To void GN alorithm’s problem and reduce the computational complexity,this paper proposed a new algorithm called EGN which based on the partition of edges in network. According to the partition of edges,each edge would be partitioned to an independent community,consequently nodes could be partitioned to multiple communities. It could detect the overlapping community in networks at last. Line graph would be constructed before using EGN algorithm which based on the relationship of nodes in network. And after that,the algorithm calculated the similarity of edges in network. It proposed the method of calculation of edge similarity which based on the similarity of node,and then constructed dendrogram of line graph in the whole process at last. Each layer of the dendrogram was related to the partition of networks. Through dividing the dendrogram in one layer,it detected the communities. It used a function of partition density to measure the capability of partition. At last,it applied this algorithm in the Zachary’s Karate Club network,and compared with GN algorithm. The results of experiment show that the EGN algorithm is able to detect overlapping communities very well. Key words: community detection; overlapping communities; similarity; partition density
第 30 卷第 1 期 2013 年 1 月
计算机应用研究 Application Research of Computers
Vol. 30 No. 1 Jan. 2013
基于连边相似度的重叠社区发现算法研究*
施 伟,傅鹤岗,张 程
( 重庆大学 计算机学院,重庆 400044)
摘 要: 针对 GN 算法在发现重叠社区时存在的不足,以及为了降低算法时间复杂度,提出一种基于网络图中