复杂网络社区挖掘_基于聚类融合的遗传算法
基于遗传算法模拟退火算法的聚类算法

基于遗传算法模拟退火算法的聚类算法聚类是一种无监督学习算法,用于将数据集分成不同的组或簇,使相似的数据点在同一组中。
聚类算法旨在找到数据集内的隐藏模式和结构。
遗传算法和模拟退火算法是两种常用的全局优化算法,可以帮助我们找到最优的聚类方案。
遗传算法(Genetic Algorithm, GA)是一种模拟自然界中生物遗传机制的优化算法。
它模拟了生物进化过程中的选择、交叉和变异等操作。
遗传算法的基本思想是通过不断迭代的方式,保留适应度(优良解)高的个体,并以此为基础进行选择、交叉和变异操作,最终找到全局最优解。
模拟退火算法(Simulated Annealing, SA)是一种基于物理退火过程的全局优化算法。
它模拟了物质冷却的退火过程,通过允许一定概率的“错误移动”以跳出局部最优解,最终找到全局最优解。
将遗传算法和模拟退火算法结合起来,可以得到一个更强大的聚类算法。
这种算法首先使用遗传算法对初始的聚类方案进行初始化,并通过适应度函数对每个个体进行评估。
然后,算法使用模拟退火算法对聚类方案进行迭代优化。
在每个温度阶段,通过改变个体之间的距离以及聚类之间的距离,尝试将方案从当前聚类状态迁移到下一个更优状态。
模拟退火算法中的退火过程可以通过控制温度参数来实现。
1.初始化种群:使用遗传算法随机生成初始的聚类方案。
每个个体表示一种可能的聚类方案。
2.计算适应度:对每个个体使用适应度函数进行评估。
适应度函数可以根据聚类方案的内聚性和分离性来定义,以及其他适应度指标。
3.遗传操作:使用遗传算法的选择、交叉和变异操作对个体进行优化。
4.模拟退火:使用模拟退火算法对个体进行迭代优化。
通过改变个体之间的距离以及聚类之间的距离,尝试将方案从当前聚类状态迁移到下一个更优状态。
退火过程可以通过控制温度参数来实现。
5.终止条件:当达到迭代次数的上限或找到满足适应度要求的聚类方案时,停止迭代。
6.输出最优解:返回适应度最高的聚类方案作为最优解。
复杂网络中的社区发现与挖掘算法研究

复杂网络中的社区发现与挖掘算法研究社区发现是在复杂网络中识别出密切相关的节点集合,这些节点之间存在着明显的紧密联系,而与其他节点相对疏远。
社区发现在许多领域具有广泛的应用,如社交网络分析、生物信息学、推荐系统等。
然而,由于复杂网络的规模庞大、结构复杂多样,社区发现成为一个具有挑战性的问题。
为了解决这一问题,学者们不断提出和改进各种社区发现与挖掘算法。
一种常见的社区发现算法是基于模块度(modularity)的方法。
这种方法通过计算网络中节点间的连接强度和预期连接强度的差值来评估社区结构的优劣程度。
其中,预期连接强度是通过随机图模型生成的网络来进行估计的。
通过最大化模块度函数,这种算法可以将网络划分为若干个社区。
然而,基于模块度的方法在处理大规模网络时,会面临计算时间复杂度高和结果稳定性差的问题。
为了克服这些问题,研究者们提出了一系列其他的社区发现算法。
例如,基于谱聚类的方法可以将网络转化为特征向量,然后通过聚类技术将节点划分为不同的社区。
这种方法能够有效克服基于模块度的方法的缺点,并且适用于大规模网络。
另外,还有基于聚类系数的方法、基于图表达的方法、基于双层重叠社区的方法等。
这些算法不仅提高了社区发现的效果,还拓宽了社区发现的研究领域。
除了社区发现算法,研究者们还提出了一些用于社区挖掘的工具和技术。
社区挖掘旨在从挖掘过程中发现新的模式和知识。
其中,一种常见的工具是关联规则挖掘。
关联规则挖掘通过挖掘出不同节点之间的关联关系,可以发现隐藏在复杂网络中的有意义的模式。
另外,社区挖掘还可以借助数据可视化技术,将复杂的网络结构以图形化的方式展示出来,增加了对社区结构的理解和挖掘。
随着社交媒体的普及和大数据技术的不断发展,社区发现与挖掘在社交网络分析中具有重要的应用。
通过社交网络分析,可以揭示出用户之间的相互关系、信息传播路径、社区结构等信息,为社交媒体平台的运营提供指导。
此外,社区发现与挖掘还可以应用于生物信息学领域,发现蛋白质相互作用网络中的功能模块,辅助研究者了解蛋白质的功能和相互关系。
复杂网络中的社区检测与演化规律

复杂网络中的社区检测与演化规律随着互联网时代的到来,我们进入了一个全新的信息时代,人类社会也正在发生着巨大的变化。
互联网创造了一种全新的社会网络结构,这种结构被称为复杂网络。
复杂网络中包含了网络节点之间的关系,这种关系可以用边来表示。
社区是复杂网络中一个非常重要的概念,它是由相互连接密集的一组节点组成的。
社区检测与演化规律已成为复杂网络研究的重点之一。
本文将对复杂网络中社区检测与演化规律进行探讨。
一、社区检测社区检测是指寻找复杂网络中的社区结构。
一般来说,社区是一个密集连接的网络子图,该子图内节点彼此之间的连通密度很高,而与该子图外的节点相连的连边数量相对较少。
社区检测可以帮助我们发现复杂网络中隐藏的规律和结构,它对于社交网络、生物网络等领域都有很大的应用价值。
社区检测方法主要有以下几种:1、基于谱分析的方法谱聚类是一种基于谱分析的社区检测方法,该方法首先对网络的拉普拉斯矩阵进行特征值分解,然后根据特征向量的信息将网络节点分成不同的社区。
谱聚类方法的好处是可以快速处理大规模网络,但其缺点是仅适用于一定规则的网络,对于一般的复杂网络效果不佳。
2、基于聚类的方法聚类是指将网络节点分组,并将同一组内的节点归为一类。
LPA算法(Label Propagation Algorithm)是一种基于聚类的社区检测方法,该算法依据节点之间的相似性,通过标签传递的方式来不断更新节点所处的分类,最终可以得到一个较好的社区结构。
LPA算法是一种快速有效的社区检测方法,但其缺点是对于噪声较大的网络效果不理想。
3、基于模块度的方法模块度是指在一个社区内部的连接密度与社区与外部世界的连接稀密程度之差。
因此,基于模块度的社区检测方法可以通过寻找最大化模块度的社区结构来检测社区。
Louvain算法是一种基于模块度的社区检测方法,该算法首先将网络中的节点分成许多小社区,然后将这些小社区合并成大社区。
Louvain算法是一种较为有效的社区检测算法,但其存在一个问题,即合并小社区时可能会错过潜在的大社区。
基于遗传算法的数据挖掘优化研究

基于遗传算法的数据挖掘优化研究随着人工智能和大数据的发展,数据挖掘在企业和研究领域中变得越来越重要。
为了提高数据挖掘的效果和精度,研究人员提出了各种算法和方法。
本文将介绍一种基于遗传算法的数据挖掘优化研究。
一、数据挖掘的意义和现状在大数据的时代,数据成为了企业和研究的重要资产和资源。
然而,如何从海量的数据中发掘出有用的信息和知识,成为了研究和应用领域中的难题。
数据挖掘作为一种从大规模数据中自动探测出潜在模式、规律、趋势和关联的技术,具有重要的意义和价值。
目前,数据挖掘已经被广泛应用于金融、医疗、教育、电子商务、物流等领域。
例如,在金融领域中,数据挖掘可以帮助银行对欺诈行为进行预测和监测;在医疗领域中,数据挖掘可以帮助医生对病人进行诊断和预测。
然而,数据挖掘存在一些问题和挑战。
首先,数据的质量和准确度对数据挖掘的结果有很大影响。
其次,数据挖掘需要处理的数据量大且复杂,运算成本高、时间复杂度高。
为了解决这些问题,研究人员提出了各种算法和技术。
二、遗传算法的原理和应用遗传算法(Genetic Algorithm,GA)是一种模拟自然进化过程的优化方法,是计算机智能领域中的一种有效的问题求解和优化工具。
遗传算法的主要特点是具有全局优化和并行搜索的能力,并且能够在搜索空间中寻找最优解。
遗传算法的核心思想是通过模拟自然进化过程,通过适应度函数的评估来找到问题的最优解。
遗传算法主要包含三个阶段:选择、交叉和变异。
首先,选择阶段通过适应度函数的评估,保留较优的个体。
其次,交叉阶段将较优的个体进行组合,生成新的个体。
最后,变异阶段在新个体中引入随机变化,以增加搜索空间。
遗传算法可以应用于很多领域的问题求解和优化,例如网络设计、图像识别和数据挖掘等。
在数据挖掘中,遗传算法可以应用于特征选择、聚类、分类等领域。
特别地,遗传算法可以优化数据挖掘模型的参数和结构,提高其预测精度和性能。
三、基于遗传算法的数据挖掘优化研究基于遗传算法的数据挖掘优化研究,是将遗传算法应用于数据挖掘领域的一种研究方法。
复杂网络中的社区发现算法及其应用

复杂网络中的社区发现算法及其应用复杂网络是由大量节点以及节点之间的连接关系构成的网络,在现实中广泛存在于许多领域,如社交网络、生物网络和互联网等。
社区发现是复杂网络研究的重要内容,目的是将网络中相互紧密连接的节点划分为具有相似特征或功能的社区。
社区发现算法是研究者们为了解复杂网络中的结构、功能和演化过程而提出的重要方法。
本文将介绍几种常见的社区发现算法及其应用。
一、模块度优化算法模块度是衡量网络社区结构好坏的重要指标,模块度优化算法就是通过最大化网络的模块度来寻找合适的社区划分。
常见的模块度优化算法有GN算法、Louvain算法和贪心算法等。
这些算法通过迭代地划分社区和优化社区内的连接关系来寻求最优解。
模块度优化算法在社交网络、组织结构分析、蛋白质相互作用网络等领域有广泛应用。
例如,在社交网络中,通过社区发现算法可以识别出不同的社区群体,有助于理解社交网络中的用户行为和信息传播规律,在推荐系统中起到重要作用。
二、基于节点相似性的算法基于节点相似性的社区发现算法认为在网络中相似的节点更可能属于同一个社区。
这类算法包括谱聚类、K均值算法和PSCAN算法等。
这些算法通过计算节点间的相似度来划分社区。
这类算法在生物网络、交通网络、图像分割等领域应用广泛。
例如,在生物网络中,通过基因的相似性来划分蛋白质相互作用网络的社区,可以帮助研究者理解蛋白质之间的功能和调控关系,从而推测未知蛋白质的功能。
三、基于概率生成模型的算法基于概率生成模型的社区发现算法通过建立模型来描述网络的生成过程,并利用模型参数推断网络的社区结构。
常见的算法有LDA、SBM等。
这些算法将网络看作是由不同社区生成的,根据模型参数的估计结果来划分社区。
这类算法在社交网络、金融网络等领域有广泛应用。
例如,在金融网络中,通过基于概率生成模型的社区发现算法可以划分出潜在的金融市场或子市场,有助于金融市场监管和风险预警。
总结起来,社区发现算法在复杂网络研究中扮演重要角色,有助于理解网络的结构和功能特征,为许多现实问题的解决提供了有力支持。
基于复杂网络的数据挖掘技术研究

基于复杂网络的数据挖掘技术研究随着网络技术的日益发展,人们在以前无法想象的领域找到了无限的可能,在现代社会的各种领域中,数据量巨大,并日益复杂。
数据挖掘,作为一种从大量数据中寻找未知关系和规律的技术手段,已经成为了信息时代中非常重要的一种应用。
而基于复杂网络的数据挖掘技术的研究,更是人们研究数据挖掘的重要方向之一。
一、复杂网络的概念我们先来了解一下什么是复杂网络,它是一种由大量节点(或者说顶点)和它们之间的复杂联系构成的网络。
这些节点可以是物体、人或者其他事物,而它们所之间的联系,则可以是关系、信号传递、交流交换等等。
这些节点和它们所之间的联系可以形成让人看到整个网络的拓扑结构,例如:环、网格和随机网络等等。
二、基于复杂网络的数据挖掘技术基于复杂网络的数据挖掘技术,是指通过复杂网络的结构和特征,在大量数据中寻找出未知关系和规律的方法。
这种方法不仅仅是寻找单节点的特征,而是将整个网络作为单位来分析,以寻找整个网络之间的关系,从而进行更加深入有效的数据挖掘。
1.节点的重要性网络中的节点有很多指标可以用来衡量它的重要性,例如度、介数、接近度等指标,通过这些指标可以找到节点在网络中的重要性位置。
一个节点的度越高,越能代表网络的重要性;如果一个节点的介数比较高的话,那么就代表着这个点在网络中有着比较大或者最短的关联链路;接近度则是表示节点和网络中其他节点之间的相似程度,越接近则表示关联程度越高。
2.网络中的集群我们在现实生活中或者是网络上都可以发现很多的集群组织,例如社交网络中的朋友圈,互联网中的论坛板块等等。
基于复杂网络的数据挖掘技术,也可以通过寻找网络中的集群,来发现网络内部更加深入的结构。
3.信息的传播一个内容具有吸引人的特质,往往会在网络中得到更广泛的传播。
基于复杂网络的数据挖掘技术,可以通过收集和分析网络上的文本信息,来研究关于某一事件、文化、商品等方面的信息传播规律,从而提高信息传播的效果。
三、应用与前景在现实生活和网络时代中,我们无法避免数据的收集和分析,而基于复杂网络的数据挖掘技术,可以让我们更好地掌握网络信息,挖掘出更为深入的内容,为我们所需要的广泛应用提供支持。
复杂网络中的社区检测算法与性能评估研究

复杂网络中的社区检测算法与性能评估研究复杂网络是由大量节点和连接组成的网络结构,其中节点之间的连接具有非常复杂的关系。
社区检测是一种用于分析复杂网络结构的方法,旨在识别网络中具有类似属性或密集连接的节点子集,这些子集被称为社区。
社区检测算法在图论、社会科学、生物网络等领域具有广泛的应用。
一、复杂网络社区检测算法社区检测算法旨在将网络中的节点分组成相互连接紧密且内部联系紧密的子集。
这些子集被认为是具有相似属性或功能的节点集合。
目前有许多社区检测算法可供选择,包括基于模块度的方法(如Louvain 算法、GN算法)、基于谱聚类的方法(如谱分割算法)、基于聚类的方法(如KMeans算法)、基于布谷鸟算法的方法等。
1. 基于模块度的方法模块度是一个用于度量网络分割质量的指标,它衡量了网络内部连接的紧密度与社区之间连接的稀疏性。
基于模块度的方法试图最大化网络的模块度值,以找到最优的社区划分结果。
Louvain算法属于这类方法,它通过不断优化节点的社区归属来提高模块度。
2. 基于谱聚类的方法谱聚类是一种基于线性代数的聚类算法,它利用网络的拉普拉斯矩阵特征向量来进行数据分割。
谱聚类方法通过对网络的特征值分解进行数据降维,然后再应用传统的聚类算法进行社区划分。
谱分割算法是谱聚类方法的一种典型代表。
3. 基于聚类的方法聚类算法是一种常用的无监督学习方法,它将相似的数据对象划分到同一个类别中。
在社区检测中,节点之间的相似度可以通过计算它们之间的距离或相似度指标来确定。
KMeans算法是一种经典的聚类算法,它将节点分配到K个不同的簇中,使得同一簇内的节点相似度最大,不同簇之间的相似度最小。
4. 基于布谷鸟算法的方法布谷鸟算法是一种基于自然界中鸟类觅食行为的优化算法,它模拟了鸟类在寻找食物过程中的搜索和觅食策略。
布谷鸟算法在社区检测中被用来寻找网络中的最佳社区划分方案。
它通过不断调整节点的社区划分来优化目标函数,使得网络的模块度得到最大化。
复杂网络中的社区发现算法及其应用

复杂网络中的社区发现算法及其应用一、引言复杂网络是指由多个节点和连接它们的边或者链组成的网络结构,它们通常是由自然界或者人工构建的系统所构成。
例如社交网络,物流网络,交通网络等,复杂网络在现实中应用广泛,而社区发现是其重要的研究领域之一。
社区发现是指在网络中发现数量较少但内部密切联系的子集,它们在某些方面显示出相对的内部一致性和跨度分离,由于社区结构的存在,网络在许多方面具有不同的行为特征和功能特征。
在社交网络中,社区是指具有相同兴趣、活动或者联系的人的子集。
在物流网络中,社区是指共享一些特定的物流资源或者共享某个交通运输方式的城市或地区等。
社区发现在许多领域都具有重要的应用,比如犯罪调查、恐怖主义分析、废柴疫情分析等。
如何高效地在复杂网络中寻找出社区结构是社区发现算法的核心问题。
二、社区发现算法社区发现算法是指在复杂网络中,通过一定的算法设计来寻找网络中存在的社区结构。
社区发现算法分为基于聚类和基于模块化的两大类。
前者是指将节点分为若干个群体,使得同一群体的节点之间关系密切。
聚类算法中,最常见的算法是k-means和层次聚类。
后者是基于网络拓扑结构的特征来刻画社区结构。
这类算法中最常见的是基于最大模块化(modularity-based)的算法。
以下将对这两类算法进行详细的介绍。
(一)、聚类算法1.k-means算法k-means算法是一种聚类分析的方法,其目标是将相似的对象划分为互不相交的k个簇,并使簇内之间的差异性最小化,而簇间之间的差异性最大化。
该算法可用于分辨噪声、找到一个点集的最优分组、刻画数据集中不同群体的特征等。
在社区发现中,k-means算法可以用来寻找相同兴趣爱好的人群等。
2.层次聚类算法层次聚类是指将所有观测数据首先看做是一组单独的簇,然后逐渐有收缩的方式合并这些簇到一个大的簇,直到得到一个包含所有对象的唯一簇为止。
因此,其层次性很强,对于不同的数据集,其结果也不同。
层次聚类常用于生物分子分类、文本分类等领域,同样也可以用于社区发现算法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
复杂网络, 社区结构, 遗传算法, 聚类融合, 局部搜索
10.3724/SP.J.1004.2010.01160
Community Mining in Complex Networks — Clustering Combination Based Genetic Algorithm
HE Dong-Xiao1, 2 ZHOU Xu1, 2 WANG Zuo1, 2 ZHOU Chun-Guang1, 2 WANG Zhe1, 2 JIN Di1, 2 Abstract Community mining has been the focus of many recent efforts on complex networks. In this paper, we propose a clustering combination based genetic algorithm (CCGA) for community mining in complex networks. The CCGA introduces clustering combination into the crossover operator and utilizes the clustering information of parent individuals to generate offspring, assisted by the local information of network topology. Thus, CCGA can be immune from the problems caused by traditional crossover operators that only exchange string blocks of different individuals but do not recombine their clustering contents. In order to make full use of clustering combination, a Markov random walk based population initializing method is proposed, which can provide us an initial population with individuals of certain clustering precision and high diversity. The population initializing method cooperates with the clustering combination based crossover operator, thus the search capability of CCGA is effectively strengthened. In addition, a local search strategy is used in the mutation operator, which makes the mutated node placed into the community to which most of its neighbors belong. Therefore, the specialized mutation operator allows the reduction of the searching space and thus speeds up the convergence of CCGA. The proposed CCGA is tested on both computer-generated and real-world networks, and is compared with current representative algorithms in community mining. Experimental results show the feasibility and validity of CCGA. Key words Complex network, community structure, genetic algorithm, clustering combination, local search
第 36 卷 第 8 期
2010 年 8 月
自 动 化 学 报
ACTA AUTOMATICA SINICA
Vol. 36, No. 8 August, 2010
复杂网络社区挖掘 — 基于聚类融合的遗传算法
何东晓 1, 2 周 栩 1, 2 王 佐 1, 2 周春光 1, 2 王 喆 1, 2 金 弟 1, 2Βιβλιοθήκη 收稿日期 2009-07-16
录用日期 2009-12-23
Manuscript received July 16, 2009; accepted December 23, 2009 国 家 高 技 术 研 究 发 展 计 划 (863 计 划) (2007AA04Z114, 2009AA02Z307), 国 家 自 然 科 学 基 金 (60873146, 60973092, 60903097), 计算与软件科学科技创新平台项目 (985 工程), 吉林大 学 “211 工程” 三期建设项目, 吉林省生物识别新技术重点实验室项目 (20082209) 资助 Supported by National High Technology Research and Development Program of China (863 Program) (2007AA04Z114, 2009AA02Z307), National Natural Science Foundation of China (60873146, 60973092, 60903097), Project of Science and Technology Innovation Platform of Computing and Software Science (985 Engineering), Project of the Third Extension of 211 Projects of Jilin University, and Project of Key Laboratory of Jilin Province for New Technique of Biological Recognition (20082209) 1. 吉林大学计算机科学与技术学院 长春 130012 2. 吉林大学符号 计算与知识工程教育部重点实验室 长春 130012 1. College of Computer Science and Technology, Jilin University, Changchun 130012 2. Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education, Jilin University, Changchun 130012
摘 要 针对当前研究复杂网络社区挖掘的热点问题, 提出了一种基于聚类融合的遗传算法用于复杂网络社区挖掘. 该算法 将聚类融合引入到交叉算子中, 利用父个体的聚类信息辅以网络拓扑结构的局部信息产生新个体, 避免了传统交叉算子单纯 交换字符块而忽略了聚类内容所带来的问题. 为使聚类融合的作用得以充分发挥, 本文提出了基于马尔科夫随机游走的初始 群体生成算法, 使初始群体中的个体具有一定聚类精度并有较强的多样性. 初始群体生成算法与基于聚类融合的交叉算子互 相配合, 有效地增强了算法的寻优能力. 此外, 算法将局部搜索机制用于变异算子, 通过迫使变异节点与其多数邻居在同一社 区内, 有针对性地缩小了搜索空间, 从而加快了算法收敛速度. 在计算机生成网络和真实世界网络上进行了测试, 并与当前具 有代表性的社区挖掘算法进行比较, 实验结果表明了该算法的可行性和有效性. 关键词
8期
何东晓等: 复杂网络社区挖掘 — 基于聚类融合的遗传算法
1161
社区和数据聚类 (Data clustering) 中的 “簇” 有相 似之处, 人们也将社区结构特性称为聚类特性. 目 前, 在生物网、 科技网和社会网中均观测到社区结构 的存在[8] . 复杂网络社区结构的发现对于复杂网络 的拓扑结构分析、功能分析和行为预测具有重要的 理论意义及实用价值, 已被广泛应用于恐怖组织识 别、 组织结构管理、 新陈代谢途径 (Pathway) 预测、 蛋白质相互作用网络分析、Web 社区挖掘、搜索引 擎等诸多领域[1, 4, 7, 9−10] . 由于复杂网络社区发现的重要理论意义和实际 应用价值, 众多科研工作者致力于社区挖掘算法 (也 称网络聚类算法) 的研究, 并提出了许多不同的社 区挖掘算法[4, 6−9, 11−21] . 按照文献 [10] 的观点, 依 据所采用的基本求解策略, 可将这些算法中的大多 数归纳为两大类: 基于启发式的算法和基于优化 的算法. 前者主要将社区挖掘问题转化为预定义 启发式规则的设计问题, 如著名的 Girvan-Newman (GN) 算法[4] 、基于标签传播 (Label propagation) 的算法[11−13] 、 基于相似度动力学特性 (Propinquity dynamics) 的算法[14] 等. 而后者是将社区挖掘问题 转化为优化问题, 通过最优化预定义的目标函数来 寻找复杂网络的社区结构, 如诸多以网络模块度作 为目标函数的优化算法[6, 15−21] . 然而, 最大化网络 模块度被认为是完全 NP 问题[8] , 无法通过穷举搜 索方法来实现. 遗传算法 (Genetic algorithm, GA) 作为一种解决 NP 难题的非常有效的方法, 可以在 保证求解质量的前提下极大地降低问题求解的时间 复杂度. 目前基于 GA 的社区挖掘算法[16−19] 存在 寻优能力不强和收敛速度慢的缺点, 这主要是由于 传统交叉算子难以用于复杂网络社区挖掘问题, 使 得这些方法或者不使用交叉算子[16] 或不能给出有 效的交叉算子[17−19] . 此外, 这类算法还普遍采用随 机生成初始群体和随机地、 无针对性地变异, 这也导 致了算法失效. 针对上述基于 GA 的社区挖掘算法的缺陷, 本 文提出一种基于聚类融合的遗传算法 (Clustering combination based genetic algorithm, CCGA) 来 探测网络社区结构. 该算法利用聚类融合[22] 实现 交叉操作, 避免了传统交叉算子忽视聚类内容而单 纯交换字符块所带来的问题, 并能够有效地将前一 代个体的优秀性状保留到下一代新个体中, 从而使 交叉算子的全局搜索能力得到充分发挥. 为使聚类 融合的作用得以充分发挥, 本文借鉴文献 [23] 中的 工作, 进而提出了基于马尔科夫随机游走的初始群 体生成算法. 该初始群体生成算法可产生多样性强、 具有一定聚类精度的初始个体, 很适合进行聚类融 合; 另外, 用该算法产生初始群体在一定程度上使 得初始解空间靠近了最优解空间, 从而可以加速算