一种基于粒子群算法的聚类算法

合集下载

基于混合粒子群优化算法的聚类分析

基于混合粒子群优化算法的聚类分析

C 均值聚类 算法 。新 算法在基 本粒子群 优化 的模 糊 C 均值 聚类算法 的基础 上结合 了遗传算 法的 交叉 、 一 一 变异 算子及混 沌优 化
算法 , 引入逃 逸算子 。仿 真结 果表 明, 算法有效 地避免 了通常聚 类方 法易 出现 的早 熟现 象 , 并 该 同时也 具有较 快的收敛速 度
YA G ujn. DE N J- ‘ i u NG u— n, T NG i Hi we 一 E . Z
( .S h o f daa dAr,S z ; 1 c o l i n t u h uUnv ri f in ea dT c n lg ,S z o 0 ,C ia o Me t S 1 5
Ab ta t u z me n ( C ) c s r ga o t cne s y e rp e c l p i m d t l o v re c eys w y sr c:F zyc a F M — l t i g r h a i a p di a o a o t u e n l i m a lb t n l mu a s c n eg n e r o l.A n ia o v l
和较 高 的 准 确 度 。
关键词 : 粒子 群优化 算法;遗 传算 法;混沌优 化; 聚类分析 ;逃 逸算子 中图法分 类号 : P 9 T3 1 文献标 识码 : A 文 章编号 :0072 2 0 ) 252 —4 10 —04(0 8 2 —800
Cl se n l ss a e n h b i a t l wam p i z t nag rtm u tra ay i b s d o y rdp ri es r o t c miai lo i o h
2 aut f o ue n fr t nS in e o twet iest,Ch n qn 0 7 5 hn ; .F c l o C mp tr dI omai ce c ,S uh sUnv ri y a n o y o g ig4 0 1 ,C ia

基于粒子群算法的K均值半监督聚类算法研究

基于粒子群算法的K均值半监督聚类算法研究
第 2 第 7期 7卷
21 0 0年 7月
计算 机应 用与软件
C mp trAp l ai n n ot a e o u e p i t s a d S f r c o w
Vo. 7 No 7 12 .
J1 0 0 u.2 1
基 于粒 子 群 算 法 的 K 均值 半监 督聚 类 算 法 研 究
oN EM I S S . UPERVI ED M EANS CLUS S K. TERI NG BASED oN PARTI CLE Sw ARM oPTI I ATI M S oN
G oC a gO u h nyH
(  ̄at etfC m ue Si c n e n l yDe O nvrt, ehu2 32 Sa dn , hn ) Dp r n o ptr c nea dTc oo , z IU i syD zo 5 03,hn og C ia m o e h g hL ei
na c ma a e n pua in mi n g me to po lto s f
息, 以帮助 聚类算法获得更好 的聚类效果。在实际应用 中 , 有监
0 引 言
半监督 聚类是近几年提 出的一种新 型聚类方 法 , 它综合 了
o t s t n s ac . h e l o i m a o g o l sei g a c rc e n a n mb ro It s n a a s t. p i a i e r h T e n w ag r h h s g t o d cu trn c u a iso u e fUC e t g d t es mi o t i Ke wo d y rs S mis p r ie l se ig I r v d K。 a s a g rtm C n r fma s o t z t n P ril w r p i z t n D — e ’u e vs d c u t r mp o e me n l o h n i e t o s p i a i a ce s a e mi o t m ot miai y o

基于粒子群优化算法的交通数据流聚类分析

基于粒子群优化算法的交通数据流聚类分析
测 , 且依 据密 度来判 断 聚类 。 并
第一作 者简 介 : 云伟 ( 9 3 ) 男 , 潘 18 一 , 山东 省聊 城市人 , 士研究 硕 生 。研究方 向: 智能交通控制 。E m i pnu w i9 3 6 .o 。 - al ayn e18 @13 ci : n
该算 法 分 为 联 机 和脱 机 两 个 部 分 。联 机 部 分 将接 受到 的每个 数 据元 素 映射 到 某个 网格 中 , 脱 而
进行聚类分析 , 并将粒子群优 化算 法引入聚 类过程 , 从而对数据 流聚 类分 析方 法进行 了改进 , 使数据 聚类 能够 根据本 身的 密 度极大值有序生成 , 强 了用 户对聚类过程 的控制 能力 。通过 昆明市实测交通数 据流进行 聚类分析 , 增 得到 了能够 反映交通状
况不 同特征 的聚类结果和动态的控制策略 , 并对 交通数据流 的相关研 究工作提供决策支持。
无 限的。我们称 这样 的数 据 形态 为数 据 流… 。数 据
挖掘技术是信息 技 术进 步 的结果 。数 据挖 掘技 术 的

法 , 数据 聚类 能够 根 据本 身 的密 度极 大值 有 序 生 使 成 , 决 了聚 类 生 成 顺 序 的不 确 定 性 问题 , 强 了 解 增
用 户对 聚 类 过 程 的 控 制 能力 。仿 真 结 果 验 证 了该
2 1 年 7月 1 1收到 00 23 昆明理工大学学术科技创新基金课题
( 0 0 C 3 ) 助 21Y 11资
D S em算 法 使 用 密 度 网 格 ( esyGi) .t a r D ni r 结 t d 构 , 一种 基 于密 度 和 网格 的聚 类 算法 。它着 力 解 是 决对 任意 形状 的数 据 流 聚类 问题 、 调 了孤 立点 探 强

一种基于粒子群的聚类算法

一种基于粒子群的聚类算法

Ke r s P rce wa pi zt n P O)K me i s loi m; e s ia zt n c s r g ywo d : a i r O t a o ( S ; - da g rh d ni i t l ai ;l t i t lS m mi i na t y t n ii o u en
C m u r n i ei d p lai s o p t gn r ga A pi t n 计算 机工 程与应 用 eE e n n c o

种基于粒子群 的聚类算法
姚 丽娟 , 可 , 罗 孟 颖 Y i a, UO K , NGYn AOLj n L eME ig u
t ni r o lx d et et o lxt s ih r E p rme tl eut h w a i lo i m a ih r i mo ec mp e u ot i c mp e i i g e ̄ x ei n a s l s o t t hsag r h h shg e o s h me y h r s h t t a c rc ,malr i o lxt, n r tbeo eal efr a c . c u a y s l mec mpe i a dmo esa l v rl p ro et y m ne
E gn eiga d pia o s2 1 , 8 1 ) 1 01 3 n iern n Ap l t n, 0 2 4 (3 : 5 -5 . ci
Ab t a t Af ra ay i g t e d s d a t g so i a ia i n s n i v n o a x mu o eK- d a sa g — sr c : t n lz n h ia v n a e fi t l t e s i e a d l c l e n i z o t ma i m f h me in l o t

基于粒子群的模糊聚类算法研究

基于粒子群的模糊聚类算法研究
第3 0卷 第 2期
21 年 O 月 02 3
佳 木 斯 大 学 学 报 ( 自 然 科 学 版 ) Junl f i s U i r t N trl c n eE io ) o ra o a i nv sy( a a S i c dt n J mu ei u e i
Vo .违反 ( )式和( ) 1 2 式给 出的约束 条件. 以 , 所 有必 要规 范位 置矩 阵. 首 先, 我们使所有矩阵中的消极元素变成为零. 如果 在一排所 有 的元 素矩 阵为 零 , 他们需 要 利用一 系列 在区间[ ,] O 1 的随机数重新编号 , 然后矩阵经过 以 下没有违反约束转化 :
22 8
佳 木 斯 大 学 学. ( 自 然 科 学 版 ) 报
): K
‘m ,
21 02年
( 1 1)
糊矩 阵 肛 相 同. 外 , 此 每个 微 粒 的速 度用 矩 阵 中 的
/和 c 7 , 描述 , 它们 的取 值范 围 [ ,] 我们 得 到相 一11 . 应 的基 于矩 阵运作 的更新 微粒 位 置和速 度 方程式 ,


2 3 4 5 6 数 据 集 (1 , , , , , ) n=1 2 3 4 5 6
图 4 六种数据集的平均 目 函数有效值 ( 标 p=1 , =04 ) 2 .5
3 聚类 问题优化处理
图 2 六 种 数 据 集 的 平 均 目标 函 数 有 效 僵 ( = B " =0 6) p , .

() 1
C ●
∑ =1 ‘ ,, n ’V =l …, 2
,0 l
() 2

0<∑ < V =1 , c () n _ , …, 『 2 3

基于粒子群优化的高斯核函数聚类算法

基于粒子群优化的高斯核函数聚类算法

1 概 述
聚 类 分 析 是根 据 数 据 属性 的特 征 相 似 性 ,按 照 特 定 的 准
征 的。一般来说 ,离聚类中心越近的样本点对聚类 中心周围 的统计特性越有效 , 因此引进高斯概率 分布 函数作为核 函数 :
则作模式分类的过程 。作为一种无监督的学习方法 ,它在数 据挖掘 、图像处理、模式识别 、空间遥感技术和特征提取等
a c r c l se n y Ga s e n l u c i n sm i iy me s r , n p e p t e cu t rn r c s y t e I S Ex e me tl e u t h w h t e c u a y c u tr g b u sk r e n t i l t a u e a d s e d u l se i g p o e sb P O. p r i f o r a h h i n a s l s o t a r s h t p o o e l o i m a r ae e c i g c p b lt n l se n c u a y wh c ss p ro h M e n i n l ss o i e e u n y fa r p s d ag rt h h sg e t rs a h n a a i y a d c u tr g a c r c , i h i u e rt t e C— a n a a y i fv d o f q e c me r i i i o r r
YU Jn QI e g , AN F n i
( e a o a r f d a c dC nr l n t z t nfr h mia P o es s Mii r f d c t n K yL b rt yo v n e o t dOpi ai e c l r c se , ns yo u a o , o A oa mi o o C t E i

基于粒子群优化的模糊聚类算法

基于粒子群优化的模糊聚类算法

Ab ta t n od rt v ro h ee t fF zy C— a sAlo t m u h a h o a p i n e s— sr c :I r e oo ec me te d fcso u z me n g r h s c ste lc lo tmaa d s n i i
Th x e me t h ws h t h ag rt m i orc , efce t n fs , a d n ra e t e o v re c e e p r n s o t a te lo h i i s c re t f in a d a t n i ce s s h c n eg n e i s e d. pe K e r s:d t n n y wo d aa mi ig; cu tra ay i l se n lss;P r ce S r Opi zto a t l wam tmiain i
聚类是 数 据挖 掘 中一 种 应 用 广 泛 的 方 法 , 通
确 的界 限 , 不具 有非此 即 彼 的性质 , 而模糊 聚 类算
过 对数 据对象 的合理 划分 来 发 现数 据集 的结构 特 征, 使得 以某种 度量 为标 准 的相 似性 ( 般 是基 于 一 距 离 的) 同一类 的对 象 之 间最 小化 , 不 同类 的 在 在 对 象之 间最大 化 . 过 聚类 , 们 能 够识 别 密集 和 通 人 稀 疏 的区域 , 而发 现全 局 的分 布模 式 , 从 以及数 据 属 性 问的关 系… . 在传 统 聚类 方 法 中 , 本 所属 的 样 分 类都是 唯 一 的 , 实 际上 大 多 数 事 物 间没 有 明 但
黄 贤英 , : 于粒 子群 优化 的模 糊 聚类 算 法 等 基 局最优 解 , 而 限制 了该 算 法应 用 _ . 子群 优 化 从 2粒 ] (at l sam ot i tn P O 算法 是 由 K n ey prc w l pi z i , S ) ie ' m ao end 和 E e at 19 br r 于 9 5年 提 出 的 , 一 种 基 于 群 体 智 h 是 能 的具 有全 局 寻 优 能 力 的启 发 式 搜 索 算 法 , 于 源 对 鸟群捕 食行 为 的 研究 . 子 群 优 化 广 泛 应 用 于 粒 函数 优化 、 糊系 统控 制 等 领域 . 是该 算 法 的 局 模 但 部搜 索 能力较 弱 _ . 3 J 本研 究提 出 了一种 基 于 粒 子群 优 化 算 法 的模 糊 聚 类 算 法 ( a i e S a —ae uz ls r g P rc w r bsd F z Cut n tl m y e i 对模 糊分 类定 义 的 目标 函数 为

一种采用粒子群优化的聚类算法

一种采用粒子群优化的聚类算法

1 引 言
聚类是对大量未知标注 的数据集 , 按数据 的内 在相 似性将数据集划分为多个类别 , 使类别 内的数 据相似度较大而类别间的数据相似度较小 , 是一种
无监督的模式识别问题 , 现在 已经在统计学 、 图像处 理、 机器学习 、 数据挖掘等领域得到了广泛的应用。 从分类的形式上看聚类主要 分为 : 基于划分 的 如 k en 、 于 层 次 的如 H c ]基 于 密 度 的如 - as 基 m A 、 D S A 基于 网格 的如 C IU 口 同时聚类主 BC N 、 LQ E 。
2T lc mmu iain n i e r gI si t, rF reE gn e n iest, ’n7 0 7 Chn .ee o n c t sE gn ei n t ue Ai oc n ie r gUnv ri Xia 7 , ia o n t i y 1 0
C mp tr gn eiga dA piain , 0 2 4 ( 0 :93 . o ue ier n p l t s2 1 , 8 1 )2 —3 En n c o
Ab t a t h a i o a l s r g a g r h a ema y s o to n s s c ss n i v i a au n un r sr c :T et d t n l u t i l o t msh v n h rc mi g , u h a e s i et i t l l ea d v l e - r i c e n i t o n i v a l o a n ma T e meh d t e e mi e t e n mb ra d l c t n o l se e t ri p o o e . o d t e r bet 1c 1 o mi i . h t o d t r n u e n a i fcu trc n e S r p s d Clu o y o h o o h
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第35卷第1期2009年3月延边大学学报(自然科学版)Journal of Yanbian University (Natural Science )Vol.35No.1Mar.2009收稿日期:2008-10-18作者简介:姜浩(1981—),男,硕士研究生,研究方向为粒子群算法.文章编号:100424353(2009)0120064204一种基于粒子群算法的聚类算法姜浩, 崔荣一(延边大学工学院计算机科学与技术系智能信息处理研究室,吉林延吉133002)摘要:提出一种基于粒子群算法的聚类算法,该算法利用粒子群算法随机搜索解空间的能力找到最优解.首先,将样本所属类号的组合作为粒子,构成种群,同时引入极小化误差平方和来指导种群进化的方向.其次,通过对全局极值的调整,搜索到全局最优值.最后,通过仿真实验的对比,验证了该算法在有效性和稳定性上要好于K 2means 算法.关键词:粒子群;聚类;极小化误差平方和中图分类号:TP301.6 文献标识码:AA Method of ClusteringB ased onthe P article Sw arm OptimizationJ IAN G Hao , CU I Rong 2yi(I ntelli gent I nf ormation Processing L ab.,De partment of Com puter Science and Technolog y ,College of Engineering ,Yanbian Universit y ,Yanj i 133002,China )Abstract :A clustering method based on the particle swarm optimization is provided ,using the ability of PSO algorithm which can search all of the solution space to find the optimum solution.Firstly ,the combination of the cluster number of the samples was taken as particles to consist a swarm.Meanwhile ,the evolution trend was used to modulate with the theory of the L MS error criterion.Secondly ,according to the modulating for global best ,the algorithm researched the global optimum.Finally ,the simulation results show that the new algorithm of proposed algorithm is more efficient and stable than K 2means algorithm.K ey w ords :particle swarm optimization ;clustering ;L MS error criterion0 引言聚类分析研究具有很长的历史,其重要性及与其他研究方向的交叉特性得到人们的肯定[1].聚类是数据挖掘、模式识别等研究方向的重要研究内容之一,在识别数据的内在结构方面具有极其重要的作用.聚类技术广泛应用于语音识别、字符识别、图像分割、机器视觉、数据压缩和文献信息检索等领域.聚类的另一主要应用是数据挖据(多关系数据挖掘)、时空数据库应用(GIS 等)、序列和一类数据分析等.此外,聚类还应用于统计科学.值得一提的是,聚类分析对生物学、心理学、考古学、地质学、地理学以及市场营销等研究也都有重要应用.粒子群优化(Particle Swarm Optimization ,PSO )算法是由Eberhart 和Kennedy [2]于1995年提出的一类基于群智能的随机优化算法.该算法模拟鸟群飞行觅食的行为,通过个体之间的集体协作和竞争来实现全局搜索,是一种基于群智能的演化计算技术.同遗传算法相比,虽然同是基于迭代的进化算法,但没有交叉和变异算子,群体在解空间中根据自身经历的最好位置,以及群体最优解来进行搜索.由于PSO 算法有着参数少, 第1期姜浩,等:一种基于粒子群算法的聚类算法易于实现,算法简单,具有良好的全局搜索能力等优点,被广泛应用于各个领域,如结构设计、函数优化、网络训练、模糊系统控制、电磁场以及任务调度等工程优化问题中.目前为止,已有很多结合粒子群算法的聚类分析方法[325],其关键结合点是如何构造种群以及如何评价.比较有代表性的思想是结合K2means 算法,将初始的聚类中心作为种群,然后根据中心进行聚类,再利用聚类的结果来评价种群的质量,最后依据粒子群算法的原理更新聚类中心.这种算法改进了K2means算法对初始中心敏感的问题.在文献[4]中提出了动态的聚类方法,以解决分类数目不确定的聚类问题.本文提出的算法与上述结合K2means算法的粒子群聚类不同,采用的方法是随机地分配每个样本的类号,将这些类号的组合作为一个粒子,再利用粒子群算法进行优化.所提出的算法实现简单,实验结果正确,稳定性良好.1 基本PSO算法基本PSO[6]中,粒子群由n个粒子组成,每个粒子的位置代表优化问题在d维搜索空间中潜在的解.在一个d维的目标搜索空间中,由这n个粒子组成一个群落,其中第i个粒子的位置为d维的向量X i=(X i1,X i2,…,X i d);第i个粒子的历史最优位置为P i=(P i1,P i2,…,P i d);整个群体迄今为止搜索到的最好的位置记为P g=(P g1,P g2,…,P g d);第i个粒子的“飞翔”速度也是一个d维的向量V i=(V i1,V i2,…,V i d),它决定粒子在搜索空间单位迭代次数的位移.粒子按式(1)和(2)来调整自己的位置:V ij(t+1)=w V ij(t)+r1c1(P ij- X ij(t))+r2c2(P g-X ij(t)),(1)X ij(t+1)=X ij(t)+V ij(t+1), 1≤i≤n,1≤j≤d.(2)其中c1和c2是非负数,称为加速度因子,通常取c1=c2=2;r1和r2为[0,1]内的随机数;w为惯性因子,一般在0.1到0.9之间取值.此外,粒子速度V i由最大速度V max所限制,即V i在[-V max, V max]内取值.PSO的基本算法步骤描述如下:Step1 初始化粒子群,即随机设定各粒子的初始位置和初始速度;Step2 计算每个粒子的适应值;Step3 对每个粒子,比较它的适应值和它经历过的最好位置的适应值;若更好,更新粒子当前最好位置P i d;Step4 对每个粒子的P i d进行比较,最好的位置如果优于P g d,则更新P g d的值为P i d;Step5 根据式(1)和式(2)更新粒子速度和位置;Step6 如果达到结束条件(一般为足够好的位置或最大迭代次数),则结束,否则转Step2.算法中的w,c1和c2是影响算法性能的重要参数.w值较大时,算法的全局搜索能力强;反之,局部搜索能力强.c1的值决定了粒子更新时受自身影响的程度,c2的值决定了整个种群对个体粒子的影响程度.2 聚类聚类是一个无监督的分类,它没有任何先验知识可用.聚类遵从的一般原则是:一个类簇内的实体是相似的,不同类簇的实体是不相似的;一个类簇是测试空间中点的会聚;同一类簇的任意两个点间的距离小于不同类簇的任意两个点间的距离;类簇可描述为一个包含密度相对高的点集的多维空间中的连通区域,它们借助包含密度相对较低的点集的区域与其他区域(类簇)相分离.聚类的形式描述如下:令U={P1,P2,…, P n}表示一个模式集合,P i表示第i个模式,i= {1,2,…,n};C tΑU,t=1,2,…,k,C t={P t1, P t2,…,P t w};proximity(P ms,P i r).其中,第1个下标表示模式所属的类,第2个下标表示某类中某一模式,函数proximity用来刻画模式的相似性距离.若诸类C t为聚类的结果,则诸C t需满足如下条件:∪k t=1C t=U,(3)对于ΠC m,C rΑU,C m≠C r,有C m∩C r= (仅限于刚性聚类);min(p roximity(P m u,P rv))> max(pro ximity(P m x,P m y)),(4)式(4)中参数满足如下条件:ΠP mu∈C m,ΠP rv∈C r,ΠC m,C rΑU并且C m≠C r;ΠP m x,P m y∈C m,ΠC mΑU.典型的聚类过程主要包括数据(或称之为样本或模式)准备,特征选择和特征提取,接近度计算,聚类(或分组),对聚类结果进行有效性评估等步骤.56延边大学学报(自然科学版)第35卷 3 基于粒子群的聚类算法Boer DP T 等人[7]在论述有关交叉熵对聚类的影响时,提出了一种有趣的方法.他们将样本的聚类看做是一种样本的组合形式,这种组合的结果要尽可能地使一组内的样本特征一致,不同组之间的差异尽可能的大.当样本数达到一定数量时,组合的数量十分庞大,要想枚举出每一种可能,几乎是做不到的.本文基于这种组合的思想,提出粒子群聚类算法(Particle Swarm Optimization Clustering ,PSOC ),首先将样本随机地分到某一类,即分配类号,再利用粒子群算法的全局搜索能力,对样本所属类别进行更新,得到最优解.最优解代表了最好的分类.在本文算法中,粒子群中的每个粒子为一种可能的划分,粒子的维数为样本的个数,每一维的值代表样本所划分的类.粒子构造为X i =(k 1,k 2…,k m ),0<k i ≤m ,其中m 为样本个数,k i 为第i 个样本所属的类.因此,一个群代表数据集的多个候选划分.粒子的适应值采用误差平方和函数:J c =6ki =16n ij =1X ij -mi2,(5)其中X ij 是属于第i 类的第j 个样本;n i 是第i 类所包含的样本个数;m i 是第i 类的中心,m i =1n i6x ∈X ix.(6)由于粒子群算法在运行过程中依靠全局极值和个体极值指导整个种群进化,所以很容易陷入局部最优.考虑到这种情况,本文采取以下方法避免局部最优的发生:每次迭代,对全局极值进行一次调整;借鉴极小化误差平方和算法[8]的思想,移动样本.按照如下公式计算样本移动的影响:P j =n jn j +1X -m j2,j ≠i ;n in i -1X -m j2,j =i.(7)公式(7)计算的是样本从第i 类移动到第j 类所带来的影响,首先用公式(7)中的第二个公式计算出类内P j 值最大的样本,然后对其进行更新,更新时按照公式(7)中的第一个公式,计算样本移动到其它类的情况时带来的影响大小,将此样本重新划分到P j 最小值所对应的类.本文的粒子群聚类算法描述如下:Step 1 初始化粒子群,即随机设定粒子的初始位置和初始速度,给样本划分类别;Step 2 计算每个粒子的适应值;Step 3 对每个粒子,比较它的适应值和它经历过的最好位置的适应值;若更好,更新当前最好位置P i d ;Step 4 对每个粒子的P i d 进行比较,最好的位置如果优于P g d ,则更新P g d 为P i d ;Step 5 对当前P gb 所代表的最优分类进行调整,以公式(7)计算的结果作为依据,从每个类内部选取一个样本进行调整;Step 6 根据式(1)和式(2)进化粒子速度和位置;Step 7 如果达到结束条件(一般为足够好的位置或最大迭代次数),则结束,否则转Step 2.4 实验结果与分析本文采用90个二维点作为待分类的数据集进行实验.实验数据分为3类,是线性可划分的.由于只为了证明算法的有效性与稳定性,本文采用了固定的类数.算法中的参数设置为:群体规模n =20,解空间d =90维,迭代次数为30次.惯性权重w 采用线性递减策略,范围是0.9~0.4;加速因子设置为c 1=c 2=2.结束条件为最大迭代次数.图1为90个二维样本点数据集,可以看出,它们拥有各自的团体.图2为PSOC 运行过程中的最优适应值的下降曲线.为了更好地说明算法的优点,与传统的K 2means 算法的运算结果进行了比较.本文的PSOC 算法同K 2means 算法一样得到了图3显示的良好的聚类结果.图1 数据集表1所记录的是两种算法的单次所用时间.从时间上来看,K 2means 略优于PSOC.为了说明本文算法在有效性和稳定性上的优势,重复运行66 第1期姜浩,等:一种基于粒子群算法的聚类算法100次算法,记录每次得到的聚类结果是否正确,即样本被划分到正确的分类(当95%以上的样本被正确划分即为正确结果).表2所显示的结果表明,PSOC 算法在稳定性上要明显优于K 2mean 算法,可以保证每次都能够得到正确的聚类结果.图2 最优值下降曲线表1 效率算法K 2means PSOC 运行时间/s0.91.48表2 有效性算法K 2means PSOC 正确率/%73100图3 划分结果5 结束语本文提出了一种基于粒子群算法的聚类算法,该算法利用PSO 算法的全局搜索能力对数据进行聚类.在聚类过程中以极小化误差平方和算法的思想,找到对改进分类影响最大的样本,将它重新分类,以此指导全局最优值进行更新,使种群整体向全局最优进化.多次独立实验表明,与传统的K 2means 算法相比,本文算法具有很好的稳定性.本文算法虽然有很好的稳定性,但是对于有噪声点的样本集合,是否也具有稳定的性能,仍需要进一步研究.同时,也要进一步研究粒子群算法的改进策略.本算法实现时,考虑的是分类数目确定的情况,对于分类数不确定的情况,算法是否能够很好地得到聚类结果也是下一步研究的重点.参考文献:[1] 孙吉贵,刘杰,赵连宇.聚类算法研究[J ].软件学报,2008,19(1):48261.[2] Eberhart R C ,Kennedy J.A New Optimizer UsingParticle Swarm Theory [C ]//Proceedings of the Sixth International Symposium on Micro Machine and Human Science.Piscataway ,USA :IEEE Serv 2ice Center ,1995:39243.[3] 杨勋,王汪晴.求解聚类问题的混合PSO 算法设计[J ].计算机工程与应用,2007,24(10):43245.[4] 张长胜,孙吉贵,杨凤芹,等.一种基于PSO 的动态聚类算法[J ].计算机研究与发展,2007,44(sup 2pl.):89293.[5] 陈曦,李春月,李峰,等.基于PSO 的模糊C 2均值聚类算法的图像分割[J ].计算机工程与应用,2008,44(18):1812185.[6] 杨维,李歧强.粒子群优化算法综述[J ].中国工程科学,2004,6(5):87294.[7] Boer DPT ,Kroese DP ,Mannor S ,et al.A Tutori 2al on the Cross 2Entropy Method[J ].Annals of Op 2erations Research ,2005,134(1):19267.[8] 杨光正,吴岷,张晓莉.模式识别[M ].北京:中国科学技术大学出版社,2007.76。

相关文档
最新文档