基于FCM和遗传算法的图像模糊聚类分析
遗传算法模糊聚类分析

第30卷第10期中国电机工程学报V ol.30 No.10 Apr.5, 20102010年4月5日Proceedings of the CSEE ©2010 Chin.Soc.for Elec.Eng. 119 文章编号:0258-8013 (2010) 10-0119-06 中图分类号:TM 86 文献标志码:A 学科分类号:470⋅40基于遗传算法的电网过电压分层模糊聚类识别杜林1,郭良峰1,司马文霞1,陈明英1,赵立进2 (1.输配电装备及系统安全与新技术国家重点实验室(重庆大学),重庆市沙坪坝区 400044;2.贵州电力试验研究院,贵州省贵阳市 550002)Hierarchical Fuzzy-clustering Classification of Overvoltagesin Power Systems Based on the Genetic AlgorithmDU Lin1, GUO Liang-feng1, SIMA Wen-xia1, CHEN Ming-ying1, ZHAO Li-jin2(1. State Key Laboratory of Power Transmission Equipment & System Security and New Technology (Chongqing University),Shapingba District, Chongqing 400044, China; 2. Guizhou Electric Power Test & Research Institute,Guiyang 550002, Guizhou Province, China)ABSTRACT: Overvoltage recognition is of great importance for the analysis of origins of overvoltages and the induced failures, the improvement of insulation coordination between the power transmission lines and the electrical apparatus.A method to obtain the characteristic quantities of overvoltages is proposed based on the energy distribution of wavelet transform.In view of the eigenvectors overlap, a hierarchical classification method for overvoltage recognition was applied.By constructing a multi-layer overvoltage classification tree, the eigenvector set was selected from different modules and different levels, forming the module-level structure, and constituting the best features of the layer. By introducing the genetic algorithm into fuzzy clustering, the problems were solved about the locality and sensitiveness of the initial condition in fuzzy C-means (FCM) clustering and the convergence rate was improved by combining the global search with the local search and employing the migration strategy. The method was applied to the pattern recognition classification for field overvoltages of the power system, and results show that the method can reduce the error rate of classification greatly, and is effective to recognize overvoltages.KEY WORDS: overvoltage; hierarchical classification; classification tree; genetic algorithm; fuzzy clustering摘要:过电压识别对过电压起因及故障分析,改进输电线路和变电站设备绝缘配合具有重要意义。
基于遗传算法的模糊聚类方法

收稿日期:2004205230.作者简介:许松荣(19792),男,硕士研究生;厦门,厦门大学计算机与信息工程学院(361005).E 2mail:xsr abc@基于遗传算法的模糊聚类方法许松荣(厦门大学计算机与信息工程学院,福建厦门361005)摘要:针对模糊c 2均值算法容易收敛于局部极小点的缺陷,将遗传算法应用于模糊c 2均值算法的优化计算中.算法采用实数编码,提高了试验精度.实验证明基于遗传算法的模糊聚类方法能够在一定程度上克服初值的影响,跳出局部极小点,在大样本的聚类方面有较大的优势.关 键 词:聚类;模糊c 2均值算法;遗传算法中图分类号:TP391 文献标识码:A 文章编号:167124512(2004)S120217203The fuzzy clustering method based on genetic arithmeticXu SongrongAbstr act:This paper applies genetic arithmetic to optimization of the fuzzy c 2mean arithmetic since the fuzzy c 2mean arithmetic has the limitation of converging to the local infinitesimal point.The arithmetic adopts the real code and thus increases the precision of the experiments.The experiments prove that the fuzzy c 2means arithmetic based on genetic arithmetic can overcome the influence of initial values and possess the predominance in the clustering of huge samples.Key words:clustering;fuzzy c 2mean arithmetic;genetic arithmeticXu Songr ong Postgraduate;Computer &Information Engineering College,Xiamen U niversity.Fujian,Xiamen 361005,China. 聚类[1]是根据数据的不同特征,将其划分为不同的数据类.聚类的目的是使得属于同一类别的个体之间的距离尽可能地小,而不同类别上的个体间的距离尽可能地大.聚类方法包括统计方法、机器学习方法、神经网络方法等.模糊聚类方法具有简便易行,聚类效果较好的优点,在实际应用中获得广泛的运用.但是普通的模糊聚类易于陷入局部极小点而不能搜索到全局的聚类中心.而遗传算法作为一种新型的进化优化算法,可以概率地在状态空间搜索最佳点,特别适合于非线性多峰值的函数优化问题.1 普通的模糊聚类方法模糊聚类是将样本空间X ={x 1,x 2,,,x n }的样本点分成c 类,任意一个样本点x i I X 几乎不可能被严格地划分给某一类,定义样本点x i 属于第j (1[j [c)类的程度w ij (0[w i j [1).样本空间X 的模糊聚类用模糊矩阵W =(w ij )描述,元素w ij 是矩阵W 的第i 行第j 列元素,代表第i 个样本点隶属于第j 类的隶属度.W 具有以下性质:w ij I [0,1];(1)E c j=1w ij =1;(2)0<E n i =1w ij <n.(3)为了计算各个样本点相对于聚类中心的隶属度,一般采用FCM 算法.定义目标函数:J m (W ,Z )=E ni =1E cj =1w ij d 2ij (x i ,z j ),Z =(z 1,z 2,,,z c ),其中z j 表示第j 类的聚类中心,d 2ij (x i ,z j )=+x i -z j +是样本点x i 到聚类中心z j 的欧氏距离.聚类即是求目标函数在式(1)~(3)约束下的第32卷增刊 华 中 科 技 大 学 学 报(自然科学版) Vol.32 Sup.2004年 10月J.Huazhong Univ.of Sci.&Tech.(Nature Science Edition)Oct.2004最小值.FCM 算法通过对目标函数的迭代优化来取得对样本集的模糊分类.具体算法参见文献[2].该算法对初值敏感,很大程度上依赖初始聚类中心的选择,当初始聚类中心严重偏离全局最优聚类中心时,用FCM 很可能陷入局部极小值.当聚类数目较大时,该缺点更为明显.2 基于遗传算法的模糊聚类方法遗传算法[3]是基于/优胜劣汰、适者生存0的一种高度并行、随机和自适应的全局优化算法.它从某一随机种群出发,按照一定的操作规则,根据每一个个体的适应度,存优去劣,引导搜索过程向最优解逼近.遗传算法不要求连续、可微等条件,具有较强的鲁棒性.对于所定义的目标函数,聚类问题即是求满足式(1)~(3)的W 和Z ,使得目标函数值最小,这实际上是一个优化的问题.用遗传算法求解,主要考虑以下因素[4]:染色体编码、个体适应度评价、遗传算子(选择算子、交叉算子、变异算子)以及遗传参数设置等.2.1 染色体编码方法设n 个样本被分成c 类:Z 1,Z 2,,,Z c ,模糊分类矩阵W =(w ij )共有n @c 个元素.这里采用实数编码方案[5,6].一个染色体可以被编码成为:[z 1z 2,z c w 11w 12,w 1c w 21w 22,w 2c ,w n 1w n 2,w nc ].2.2 始化群体的生成当聚类个数c 给定时,随机选取聚类中心并随机生成w ij 组成模糊矩阵W .2.3 适应度函数用适应度函数模拟自然选择,评价染色体的相对优劣程度,由此决定各种遗传操作.个体以J m (W ,Z )为目标函数值,J m (W ,Z )越小,个体的适应度就越高.取f i =1/J m (W ,Z )作为第i个个体的适应度,总的适应度为F =E cj =1f i ,平均适应度为 f =f i /F.2.4 选择选择操作建立在对个体的适应度评价的基础上,用来将父代中的优秀个体保存到下一代.常用的选择操作有轮赌盘选择、余数选择法、保留最佳个体等.这里采用期望值选择法.a .计算群体中每个个体在下一代生存的期望数目N i =f i / f .b .若某个个体被选中并要参与配对和交叉,则它在下一代的期望数目减去0.5;若不参与配对和交叉,则该个体的生存期望数目减去1.c .在上面两种情况中,若一个个体的期望值小于0,则该个体不参与选择.2.5 交叉交叉用于组合新个体,使子代继承父代优秀基因.a .对每个个体产生[0,1]的随机数r ,若r <p c ,则该个体参加交叉操作,选出交叉操作的一组染色体后进行随机配对.b .对每一对染色体X 、Y,产生(0,1)之间的随机数e.c .做如下交叉运算:X z e X +(1-e )Y,Y z e Y +(1-e)X.2.6 变异变异用来保持种群的多样性.这里变异操作分为两个部分.首先对染色体的前c 位基因进行变异操作.a .产生随机数r ,若p m <r ,则进行变异操作.b .产生随机正整数h (1[h [c/2).c .产生h 个随机正整数t 1,t 2,,,t h ,对第t i 位基因产生随机数,代替原来的基因.d .若前c 位发生重复,则对重复的基因再进行变异.然后对染色体第c 位后的基因(记做Z )进行变异操作.a .产生(0,1)之间的随机数A .b .产生nc 维随机向量V =[v 1v 2,v nc ],v i I [0,1].c .做变异Z z Z +A V.2.7 合法性检查遗传操作可能产生非法的个体,要对产生的非法个体进行修正.修正的规则如下:a .如果w ij >1或w ij <0,则w ij =0.5.b .如果E cj =1w ij >1,且所有w ij 都相同,则令w ij =1/c,j =1,2,,,c;否则,令w ik =max (w i 1,w i 2,,,w i c ),于是w ik =1-E c j =1,j X kw ij ,j =1,2,,,c.c .如果E cj =1w ij <1,且所有w ij 都相同,则令w ij =1/c,j =1,2,,,c;否则,令w ik =min (w i 1,w i 2,,,w ic ,于是w ik =1-E cj =1,j X kw ij ,218 华 中 科 技 大 学 学 报(自然科学版) 第32卷j =1,2,,,c.d .如果E ni =1w ij \n,则w ij z 0.5,i =1,2,,,n.3 实例应用基于遗传算法的模糊c 2均值算法对二维数据集进行聚类.图1(a)为聚类样本.初始种图1 聚类样本和聚类结果群300,最大进化世代数500,p c =0.2,p m =0.05.运算结果为J =2.619.聚类中心为(0.749,0.218)和(0.234,0.238).图1(b)为聚类结果.参考文献[1]张红云,刘向东,段晓东等.数据挖掘中聚类算法比较研究.计算机应用与软件,2003(2):5~6[2]李洪兴,汪培庄.模糊数学.北京:国防工业出版社,1994.[3]褚蕾蕾,陈绥阳,周 梦.计算智能的数学基础.北京:科学出版社,2002.[4]史忠植.知识发现.北京.清华大学出版社,2002.[5]张 维,潘福铮.一种基于遗传算法的模糊聚类.湖北大学学报,2002(2):101~104[6]王 敞,陈增强,袁著祉.基于遗传算法的K 均值分析.计算机科学,2003(2):162~164219增刊 许松荣:基于遗传算法的模糊聚类方法。
模糊聚类与遗传算法相结合的卫星云图云分类

模糊聚类与遗传算法相结合的卫星云图云分类
洪梅;张韧;万齐林;朱伟军
【期刊名称】《地球物理学进展》
【年(卷),期】2005(20)4
【摘要】针对模糊C均值聚类(FCM)方法存在的缺陷,提出运用遗传算法(GA)全局寻优与FCM局部寻优以及模糊减法聚类客观估算聚类数等优势互补的思想和途径进行卫星云图云分类判别.试验结果表明,综合方法(GA-FCM)的云分类效果明显优于单一的FCM和GA算法,可有效弥补FCM和GA算法在云分类中存在的不足,并可运用于实况云图中云类的客观、自动判别.
【总页数】6页(P1009-1014)
【关键词】模糊C均值聚类;遗传算法;减法聚类;云分类
【作者】洪梅;张韧;万齐林;朱伟军
【作者单位】解放军理工大学气象学院海洋与空间环境系;中国气象局广州热带海洋气象研究所;南京信息工程大学KLME暨大气科学博士后流动站
【正文语种】中文
【中图分类】P631
【相关文献】
1.卫星云图云分类的一种综合优化聚类方法 [J], 王继光;张韧;洪梅;纪飞
2.基于卫星云图的DBSCAN聚类云团分类方法 [J], 王猛;何丽莉;白洪涛;欧阳丹彤
3.云分类中逐个修改聚类和模糊聚类分类性能的对比研究 [J], 朱亚平;刘健文;白洁
4.基于模糊C均值聚类的云图样本修正与云类自动识别 [J], 王彦磊;张韧;孙照渤;牛生杰;万齐林;梁建茵
5.双光谱卫星云图的模糊推理云分类 [J], 张韧;王海俊;孙照渤;牛生杰;刘科峰因版权原因,仅展示原文概要,查看原文内容请购买。
基于FCM的图像分割

(1.3)
这里j,j=1到n,是(6.9)式的n个约束式的拉格朗日乘子。对 所有输入参量求导,使式(6.10)达到最小的必要条件为:
ci
m u ij x j j 1
n
u
j 1
n
m ij
(1.4)
和
u ij
1 d ij k 1 d kj
c 2 /( m 1)
验证:
以例4 中的605X604彩色图像按上文想法做了一次实验: 第一次分割:迭代了124次,目标函数值为323841617.672588 运算时间:100.739584s 第二次分割:迭代了006次,目标函数值为323841617.672279 运算时间: 7.078349s
观察二种分割结果,相差无几。(具体结果参见例4)
J (U , c1 ,...,cc , 1 ,...,n ) J (U , c1 ,...,cc ) j 1 j ( u ij 1)
n i 1 m 2 u ij d ij j ( u ij 1) i 1 j j 1 i 1 c n n c c
FCM算法的学习、 应用(图像分割)、 相关改进研究
1
本人工作:
1、什么是FCM算法 2、FCM算法怎么应用于图像分割 3、影响FCM算法的因素 4、自己对于FCM算法改进的思考
模糊C均值聚类算法
FCM算法是一种基于划分的聚类算法,它的思想就是使得被 划分到同一簇的对象之间相似度最大,而不同簇之间的相似度最 小。 模糊C均值算法是普通C均值算法的改进,普通C均值算法对 于数据的划分是硬性的,而FCM则是一种柔性的模糊划分。在介 绍FCM具体算法之前我们先介绍一些模糊集合的基本知识。
隶属度函数是表示一个对象x隶属于集合A的程度的函数,通常记做 μA(x),其自变量范围是所有可能属于集合A的对象(即集合A所在空间中 的所有点),取值范围是[0,1],即0<=1,μA(x)<=1。μA(x)=1表示x完全隶 属于集合A,相当于传统集合概念上的x∈A。一个定义在空间X={x}上的隶 属度函数就定义了一个模糊集合A,或者叫定义在论域X={x}上的模糊子 集 。对于有限个对象x1,x2,……,xn模糊集合 可以表示为:
基于遗传算法和遗传模糊聚类的混合聚类算法

rn n p c t n , 0 7,3 3 :6 - 6 . ig a d Ap l ai s 2 0 4 ( ) 1 4 1 5 i o
Ab ta t I r e o d n mial e h u e f cu tr c n e C a d h s pi l ls r s mp e we cn t c e sr c : n od r t y a c l g tte n mb r o lse e tr n te mo to t y ma cu t a l , o sr t a n w e u
基于遗传算法和遗传模糊聚类的混合聚类算法1652007433第一类第二类第三类第四类第五类第六类1012181113151719212223242526272829141620分类结果上接165页结论通过构造目标函数实现了模糊c均值算法的聚类数的动态确定同时利用内层的遗传模糊聚类算法可以找到对应类别数的全局最优聚类划分避免基本fcm易于陷入局部最优的弊端
厶为:
=
1 概 述
聚类 问题 是将一个 数据点集合 中的元 素按某种相 似程 度
的度 量 分 别 赋 予 不 同 的 类 别 标 号 。 模 糊 C一 值 聚 类 方 法 均
Z = d 2
( 1 )
(C 【 F M)】 被应用到 了很 多方面 , ・ 已经 例如图像处 理模糊 管理 决 策和数据预处理 。 并且 已经取得 了很好的效果。 但是 F M对 初 C 值非常敏感 , 不同的初始值 的选 取 , 会得到不 同的聚类结果 , 导
致 它 最 终 收 敛 到 局 部 最 优 解 。而 且 该算 法 需 要 确 定 聚类 数 目 ,
且 ∈l 1 p,】
C
2/ 1Y( ≤ )  ̄ j1 n =
在Matlab中使用模糊C均值聚类进行图像分析的技巧

在Matlab中使用模糊C均值聚类进行图像分析的技巧在图像分析领域,模糊C均值聚类(FCM)是一种常用的工具,它可以帮助我们发现图像中隐藏的信息和模式。
通过使用Matlab中的模糊逻辑工具箱,我们可以轻松地实现FCM算法,并进行图像分析。
本文将介绍在Matlab中使用FCM进行图像分析的技巧。
首先,让我们简要了解一下FCM算法。
FCM是一种基于聚类的图像分割方法,它将图像的像素分为不同的聚类,每个聚类代表一类像素。
与传统的C均值聚类算法不同,FCM允许像素属于多个聚类,因此能够更好地处理图像中的模糊边界。
在Matlab中使用FCM进行图像分析的第一步是加载图像。
可以使用imread函数将图像加载到Matlab的工作区中。
例如,我们可以加载一张名为“image.jpg”的图像:```matlabimage = imread('image.jpg');```加载图像后,可以使用imshow函数显示图像。
这可以帮助我们对图像有一个直观的了解:```matlabimshow(image);```接下来,我们需要将图像转换为灰度图像。
这是因为FCM算法通常用于灰度图像分析。
可以使用rgb2gray函数将彩色图像转换为灰度图像:```matlabgrayImage = rgb2gray(image);```在使用FCM算法之前,我们需要对图像进行预处理。
预处理的目的是消除图像中的噪声和不必要的细节,从而更好地提取图像中的特征。
常用的图像预处理方法包括平滑、锐化和边缘检测等。
Matlab中提供了许多图像预处理函数。
例如,可以使用imnoise函数向图像中添加高斯噪声:```matlabnoisyImage = imnoise(grayImage, 'gaussian', 0, 0.01);```还可以使用imfilter函数对图像进行平滑处理。
常见的平滑方法包括均值滤波和高斯滤波:```matlabsmoothImage = imfilter(noisyImage, fspecial('average', 3));```一旦完成预处理步骤,我们就可以使用模糊逻辑工具箱中的fcm函数执行FCM算法。
模糊聚类算法(FCM)

模糊聚类算法(FCM)伴随着模糊集理论的形成、发展和深化,RusPini率先提出模糊划分的概念。
以此为起点和基础,模糊聚类理论和⽅法迅速蓬勃发展起来。
针对不同的应⽤,⼈们提出了很多模糊聚类算法,⽐较典型的有基于相似性关系和模糊关系的⽅法、基于模糊等价关系的传递闭包⽅法、基于模糊图论的最⼤⽀撑树⽅法,以及基于数据集的凸分解、动态规划和难以辨别关系等⽅法。
然⽽,上述⽅法均不能适⽤于⼤数据量的情况,难以满⾜实时性要求较⾼的场合,因此实际应⽤并不⼴泛。
模糊聚类分析按照聚类过程的不同⼤致可以分为三⼤类:(1)基于模糊关系的分类法:其中包括谱系聚类算法(⼜称系统聚类法)、基于等价关系的聚类算法、基于相似关系的聚类算法和图论聚类算法等等。
它是研究⽐较早的⼀种⽅法,但是由于它不能适⽤于⼤数据量的情况,所以在实际中的应⽤并不⼴泛。
(2)基于⽬标函数的模糊聚类算法:该⽅法把聚类分析归结成⼀个带约束的⾮线性规划问题,通过优化求解获得数据集的最优模糊划分和聚类。
该⽅法设计简单、解决问题的范围⼴,还可以转化为优化问题⽽借助经典数学的⾮线性规划理论求解,并易于计算机实现。
因此,随着计算机的应⽤和发展,基于⽬标函数的模糊聚类算法成为新的研究热点。
(3)基于神经⽹络的模糊聚类算法:它是兴起⽐较晚的⼀种算法,主要是采⽤竞争学习算法来指导⽹络的聚类过程。
在介绍算法之前,先介绍下模糊集合的知识。
HCM聚类算法⾸先说明⾪属度函数的概念。
⾪属度函数是表⽰⼀个对象x ⾪属于集合A 的程度的函数,通常记做µA(x),其⾃变量范围是所有可能属于集合A 的对象(即集合A 所在空间中的所有点),取值范围是[0,1],即0<=µA(x),µA(x)<=1。
µA(x)=1 表⽰x 完全⾪属于集合A,相当于传统集合概念上的x∈A。
⼀个定义在空间X={x}上的⾪属度函数就定义了⼀个模糊集合A,或者叫定义在论域X={x}上的模糊⼦集A’。
基于模糊C均值的聚类分析

• U = initfcm(cluster_n, data_n); %初始 化模糊分割矩阵
%以下为主循环: • for i = 1:max_iter, • [U, center, obj_fcn(i)] =
stepfcm(data, U, cluster_n, expo); • if display, • fprintf('Iteration count = %d, obj.
基于模糊C均值的聚类分析
1 模糊c均值聚类(FCM)方法
模糊C均值聚类(FCM)方法是一种在已 知聚类数的情况下,利用隶属度函数和迭 代算法将有限的数据集分别聚类的方法。 其目标函数为:
式中, 为样本数; 为聚类数; 为第 个 样本相对于第 个聚类中心的隶属度; 为
第 个类别的聚类中心; 为样本到聚类 中心的欧式距离。聚类的结果使目标函 数 最小,因此,构造如下新的目标函 数:
(2)
这里 , =1,⋯ ,n,是等式的n个约束 式的拉格朗日乘子。对所有输入参量求 导,使式(1)达到最小的必要条件为:
(3)
(4)
由上述两个必要条件,模糊c均值聚类算 法是一个简单的迭代过程。在批处理方 式运行时,FCM采用下列步骤确定聚类中 心 和隶属矩阵 U:
步骤1 用值在0,1间的随机数初始 化隶属矩阵U,使其满足式(2)中的约束 条件。
1735.33; 2421.83; 2196.22; 535.62; 584.32; 2772.9; 2226.49; 1202.69;
2949.16 1692.62 1680.67 2802.88 172.78 2063.54 1449.58 1651.52 341.59 291.02
3244.44 1867.5 1575.78 3017.11 3084.49 3199.76 1641.58 1713.28 3076.62 3095.68
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数。对灰度—梯度共生矩阵进行归一化处理, 使其各元素之 和为 1。归一化处理可以通过下式来实现: H ( i j ) ̂ ( i j ) = H L -1
着广泛的应用前景和极为重要的意义, 例如, 在工业、 农业、 气 象预报等领域, 常用的图像模糊聚类分析算法是 FCM 算法, FCM 算法是一种动态聚类算法, 但是在实际应用中该算法是 局部搜索算法, 且对聚类中心的初值十分敏感。如果初值选 择不合适, 会收敛到局部极小点, 所以提出了一种结合 FCM 和 遗传算法对所提取的图像特征数据进行聚类分析, 它利用了 遗传算法的全局搜索的特点, 避免了陷入局部最优解, 实验表 明, 该方法具有很好的效果。 对于输入图像进行纹理分析, 通常是基于灰度共生矩阵 和灰度—梯度共生矩阵来提取图像的纹理特征。这样提取出 来的纹理特征维数非常大, 有可能存在冗余信息。因此, 对于 高维图像的纹理特征, 为了降低所提取图像纹理特征维数之 间的相关性, 需要消除图像纹理特征之间的依赖性, 需要对提
万方数据 修回日期: 20, 46 (35)
Computer Engineering and Applications 计算机工程与应用 是应用灰度共生矩阵进行纹理分析的主要参数, 并且对于图 像纹理特征来说这 5 个二次统计特征量的效果也是最常用的。 在计算每个参数特征时, 对不同方向 (0° , 45° , 90° , 135°) 计算参数的特征值, 并求其特征值在四个方向上的平均值, 这 样就抑制了方向分量, 使得所求的纹理特征与方向 θ 无关[4]。
1.2
灰度—梯度共生矩阵
图像的纹理特征分析既可以是灰度本身的信息, 又可以
1
纹理特征提取
图像的纹理一般指图像的像素灰度或者颜色的变化规
是灰度变化的梯度信息。图像的灰度是构成一幅图像的基 础, 图像的梯度是构成图像边缘轮廓的要素。图像的主要信 息是由图像的边缘轮廓提供的, 因此灰度—梯度共生矩阵纹 理分析方法是用灰度和梯度的综合信息提取纹理特征, 它考虑 了像素灰度与边缘梯度大小的联合统计分布。反应了图像中灰 度和梯度的分布规律, 同时也给出了各像素点与其邻域像素点 之 间 的 空 间 关 系 。 设 一 幅 m´m 灰 度 图 像 为
Computer Engineering and Applications 计算机工程与应用
2010, 46 (35)
173
基于 FCM 和遗传算法的图像模糊聚类分析
娄银霞 1, 程 铭 1, 文高进 2, 全惠云 1 LOU Yin-xia1, CHENG Ming1, WEN Gao-jin2, QUAN Hui-yun1
基金项目: 国家高技术研究发展计划 (863) (the National High-Tech Research and Development Plan of China under Grant No.2009AA01Z302) ; 深圳市科技计划资助项目 (No.SY200806300211A) 。 作者简介: 娄银霞 (1982-) , 女, 硕士研究生, 主要研究方向: 图像处理及人工智能; 程铭 (1985-) , 男, 硕士生, 主要研究方向: 计算机图形学, 图像处理; 文高进 (1978-) , 博士研究生, 主要研究方向: 计算机图形学, 模式识别; 全惠云 (1949-) , 男,教授, 主要研究方向: 计算算法与计算智能。 收稿日期: 2009-06-03
灰度级数目为 L g 。灰度—梯度共生矩阵定义如下:
{ H ( x y ) ; x = 0 1 L - 1 y = 0 1 L g - 1} H ( x y ) 定 义 为 集 合 : {(i j )|f (i j) = x G (i j ) = y ; i j = 0 1 m - 1} 中的元素数目, 即灰度为 x , 梯度为 y 的总像素个
{ f (i j); i = 0 1, m - 1 j = 0 1 m - 1} , 其灰度级数目为 L 。使用梯度算子可以得到该图像的梯度图像 { g (i j); i = 0 1, m - 1 j = 0 1 m - 1} 。将此梯度图像进
律, 习惯上, 把这种局部不规则而宏观有规律的特性称之为纹 理, 它通常是统计信息、 空间分布信息和结构信息的综合反 映。图像纹理特征是点空间结构关系的一种重要特征, 其反 映了图像本身的和固有的属性, 它是客观存在的, 在各类图像 中纹理现象几乎无处不在, 从多光谱遥感图像 (宏观) 到生物 细胞组织成像 (微观) , 从大自然中各种景物到人工制造的布 匹等生活中很多事物都有明显的纹理特征。图像的纹理特征 大量用于图像的分析和分类中, 同时在图像分割及图像数据 库检索等领域也得到广泛的应用。 纹理特征提取指的是通过一定的图像处理技术检测出纹 理基元, 建立模型, 从而对纹理进行定量或定性的描述。图像 纹理分析方法大体上可分为统计分析方法、 结构分析方法和 频谱分析方法。本文是基于灰度共生矩阵和灰度—梯度共生 矩阵来提取图像的纹理特征, 该方法主要从图像属性的统计 分析出发, 研究一对像元或多像元及其领域或属性的二阶统 计特性。
聚类分析也叫非监督分类, 是数理统计中的一种多元分 析方法, 聚类就是按照事物之间的相似性进行区分和分类的 过程, 分类的结果是使同一个类中的对象有很大的相似性, 而 不同类之间的对象有很大的相异性。聚类算法通常有传统聚 类算法和模糊聚类算法, 传统聚类算法也称为 “硬” 聚类算法, 即待聚类的每个对象都属于一个类 (K-Mean 算法) , 然而在客 观世界中, 聚类事物之间的界限有些是确切的, 有些是模糊 的、 不分明的, 例如, 在区分 “青年人” 和 “中年人” 的面貌相像程 度之间的界限是不分明的。模糊聚类是传统聚类思想的扩展, 通过使用隶属函数, 使得可以把每一个对象分配给所有的聚 类。不同于传统的聚类方法, 模糊聚类的结果是每个对象最 终可能属于多个聚类, 每个对象为每个聚类分配一个隶属度。 图像聚类分析是图像处理中重要的环节, 它在实际中有
行灰度级离散化, 设灰度级数目为 L g , 离散化间隔为 1/L g , 则 新的灰度级为[5]: g (i j ) - g min G ( i j ) = ( L g - 1) g max - g min
g min 和 g max 分别为梯度图像的最小值和最大值。经此变换 式中, {G(i j); i = 0 1, m - 1 j = 0 1 m - 1} , 后, 梯度图像为:
1.湖南师范大学 数学与计算机科学学院, 长沙 410081 2.中国科学院 深圳先进技术研究院, 广东 深圳 518055 1.College of Mathematics and Computer Science, Hunan Normal University, Changsha 410081, China 2.Shenzhen Institute of Advanced Technology, Chinese Academy of Sciences, Shenzhen, Guangdong 518055, China E-mail: louyinxia920@ LOU Yin-xia, CHENG Ming, WEN Gao-jin, et al.Image fuzzy clustering analysis based on FCM and genetic algorithms. Computer Engineering and Applications, 2010, 46 (35) : 173-176. Abstract: Cluster analysis has great importance and broad application prospects in the fields of pattern recognition and image monly used method of cluster analysis is the fuzzy C-means algorithm (FCM) .The FCM algorithm easily traps into local optimal solution.An algorithm combining FCM with genetic algorithms is introduced for image fuzzy clustering analysis.The input image texture features are extracted, and the dimension reduction of extracted feature vector is processed through principal component analysis, the image of the cluster analysis algorithm complexity is reduced and the accuracy of the results is improved.Image data of the fuzzy cluster is analyzed combined with genetic algorithm FCM.The experiment results show that this method can get a better clustering effect. Key words:fuzzy C-Means clustering; genetic algorithms; fuzzy clustering; clustering analysis 摘 要: 聚类分析在模式识别和图像处理领域中有着极为重要的意义和广泛的应用前景。常用的聚类分析的方法是模糊 C 均值
取的原始图像纹理特征空间采取降维处理, 即去除与分类目 标无关的或与其他特征量有较高相关性的冗余持征, 从而形 成最优特征子集。本文利用主成分分析法对纹理特征进行选 择, 最终得到一组最优纹理特征子集, 再用 FCM 和遗传算法相 结合的算法对最优纹理特征子集进行图像模糊聚类分析, 从 而提高图像模糊聚类分析的速度和精确度。