基于NaiveMIDEA算法的模糊分类系统
模糊c均值聚类算法

模糊c均值聚类算法C均值聚类算法(C-Means Clustering Algorithm)是一种常用的聚类算法,目的是将一组数据点分成若干个类群,使得同一类群内的数据点尽可能相似,不同类群之间的数据点尽可能不相似。
与K均值聚类算法相比,C均值聚类算法允许一个数据点属于多个类群。
C均值聚类算法的基本思想是随机选择一组初始聚类中心,然后通过迭代的方式将数据点分配到不同的类群,并调整聚类中心,直到满足停止条件。
算法的停止条件可以是固定的迭代次数,或者是聚类中心不再改变。
具体而言,C均值聚类算法的步骤如下:1.随机选择k个初始聚类中心,其中k是预先设定的类群数量。
2.根据欧氏距离或其他距离度量方法,计算每个数据点到每个聚类中心的距离。
3.将每个数据点分配到距离最近的聚类中心的类群。
4.根据聚类中心的分配情况,更新聚类中心的位置。
如果一个数据点属于多个类群,则根据各个类群的权重计算新的聚类中心位置。
5.重复步骤2到4,直到满足停止条件。
C均值聚类算法的优点是灵活性高,可以允许一个数据点属于多个类群。
这在一些应用场景中非常有用,例如一个商品可以属于多个类别。
然而,C均值聚类算法的缺点是计算复杂度较高,对初始聚类中心的选择敏感,以及类群数量k的确定比较困难。
为了解决C均值聚类算法的缺点,可以采用如下方法进行改进:1.使用聚类效度指标来评估聚类结果的好坏,并选择最优的聚类中心数量k。
2. 采用加速算法来减少计算复杂度,例如K-means++算法可以选择初始聚类中心,避免随机选择的可能不理想的情况。
3.对数据进行预处理,例如归一化或标准化,可以提高算法的收敛速度和聚类质量。
4.针对特定应用场景的需求,可以根据数据属性来调整聚类中心的权重计算方式,以适应特定的业务需求。
总结起来,C均值聚类算法是一种常用的聚类算法,与K均值聚类算法相比,它可以允许一个数据点属于多个类群。
然而,C均值聚类算法也存在一些缺点,例如计算复杂度高,对初始聚类中心的选择敏感等。
模糊c均值聚类算法的概念

模糊c均值聚类算法的概念
模糊C均值聚类算法(Fuzzy C-means clustering algorithm,简
称FCM)是一种基于模糊理论的聚类算法,用于将数据集划
分为若干个模糊的子集,每个子集代表一个聚类。
FCM算法的目标是最小化数据点与聚类中心之间的模糊距离。
模糊距离所描述的是一个数据点属于每个聚类的可能性,而不仅仅是属于一个特定聚类的二进制标识。
FCM算法的步骤如下:
1. 初始化聚类中心,可以随机选择数据点作为初始中心。
2. 根据初始聚类中心,计算每个数据点对于每个聚类中心的成员关系度(即属于每个聚类的可能性)。
3. 根据成员关系度更新聚类中心,计算每个聚类中心的坐标。
4. 重复步骤2和3,直到聚类中心不再发生变化或达到最大迭
代次数。
在每次迭代中,FCM算法根据每个数据点到聚类中心的距离
计算其模糊隶属度,按照隶属度对数据点进行聚类。
每个数据点隶属于每个聚类的可能性是在0到1之间连续变化的,表示了数据点与每个聚类之间的相似程度。
相比于传统的硬聚类算法,模糊C均值聚类算法允许数据点
属于多个聚类,更好地处理了数据点的模糊性,适用于数据集中存在重叠样本或不确定性较高的场景。
模糊 c 均值聚类算法

模糊 c 均值聚类算法模糊 c 均值聚类算法是一种常用的聚类算法,其特点是能够解决数据集中存在重叠现象的问题,适用于多类别分类和图像分割等领域。
本文将从算法原理、应用场景、优缺点等方面分析模糊c 均值聚类算法。
一、算法原理模糊 c 均值聚类算法与传统的聚类算法相似,都是通过对数据集进行聚类,使得同一类的数据样本具有相似的特征,不同类的数据样本具有不同的特征。
但是模糊c 均值聚类算法相对于传统的聚类算法而言,其对于数据集中存在重叠现象具有一定的优越性。
模糊 c 均值聚类算法的主要思想是:通过迭代计算,确定数据集的类别个数,并计算每个数据样本属于不同类别的概率值。
在此基础上,通过计算每个聚类中心的权值,并对每个数据样本属于不同类别的概率进行调整,以达到数据样本的合理分类。
二、应用场景模糊 c 均值聚类算法的应用范围较广,主要包括:1.多类别分类:在多类别分类中,不同的类别往往具有比较明显的特征区别,但是存在一些数据样本的特征存在重叠现象。
此时,模糊 c 均值聚类算法可以对这些数据样本进行合理分类。
2.图像分割:在图像分割过程中,一张图片包含了不同的对象,这些对象的特征往往具有一定的相似性。
模糊 c 均值聚类算法可以通过对这些相似的特征进行分类,实现对于图像的自动分割。
3.市场分析:在市场分析中,需要根据一定的统计规律,对市场中的产品进行分类。
模糊 c 均值聚类算法可以帮助市场研究人员实现对市场中产品的自动分析分类。
三、优缺点分析模糊 c 均值聚类算法相对于传统的聚类算法而言,其对于数据集中存在重叠现象具有一定的优越性,具体优缺点如下所示:1.优点:(1) 能够有效地解决重叠现象问题,在多类别数据分类和图像分割等领域具有比较好的应用前景。
(2) 通过迭代计算,能够实现对数据集的自动分类,自动化程度高。
2.缺点:(1) 算法的时间复杂度比较高,需要进行多次迭代计算,因此在数据量较大时,运算时间比较长。
(2) 模糊 c 均值聚类算法对于初始聚类中心的选择较为敏感,不同的聚类中心初始化可能会导致最终分类效果的不同。
基于自适应近邻信息的模糊C_均值聚类算法

第 32 卷第 7 期2024 年 4 月Vol.32 No.7Apr. 2024光学精密工程Optics and Precision Engineering基于自适应近邻信息的模糊C均值聚类算法高云龙1,李建鹏2,郑兴莘1,邵桂芳1,祝青园1,曹超3*(1.厦门大学萨本栋微米纳米科学技术研究院,福建厦门 361102;2.厦门大学自动化系,福建厦门 361102;3.自然资源部第三海洋研究所,福建厦门 361005)摘要:传统的模糊C均值算法直接基于原始数据进行聚类,数据的内在结构可能会被噪声、异常值或其他因素破坏,因此聚类性能会受到影响。
为提升FCM算法的鲁棒性,提出了一种基于自适应近邻信息的模糊C均值聚类算法。
近邻信息指的是一种基于数据点之间相似度的度量,每个数据点都可以看作其他数据点的近邻,但是不同数据点之间的相似度是不同的。
将样本点的近邻信息G X和类中心点的近邻信息G V融入基础FCM模型中,为聚类过程提供更多的数据结构信息,用于指导聚类算法中的簇划分过程,以提升算法的稳定性,并提出了3个迭代算法求解本文提出的聚类模型。
与其他先进聚类算法对比,在部分基准数据集上聚类性能有10%以上的提升,同时还从参数敏感性、收敛性、消融实验等方面对算法进行评价。
实验结果可以充分显示本文提出的聚类算法的可行性与有效性。
关键词:模糊C均值聚类;自适应近邻;算法鲁棒性;迭代算法中图分类号:TP394.1;TH691.9 文献标识码:A doi:10.37188/OPE.20243207.1045Fuzzy C-means clustering algorithm based onadaptive neighbors informationGAO Yunlong1,LI Jianpeng2,ZHENG Xingshen1,SHAO Guifang1,ZHU Qingyuan1,CAO Chao3*(1.Pen-Tung Sah Institute of Micro-Nano Science and Technology, Xiamen University,Xiamen 361102, China;2.Department of Automation, Xiamen University, Xiamen 361102, China;3.Third Institute of Oceanography, Ministry of Natural Resources, Xiamen 361005, China)* Corresponding author, E-mail: caochao@Abstract: Traditional FCM algorithms cluster based on raw data, risking distortion from noise, outliers, or other disruptions, which can degrade clustering outcomes. To bolster FCM's resilience, this study intro⁃duces a fuzzy C-means clustering algorithm that leverages adaptive neighbor information. This concept hinges on the similarity between data points, treating each point as a potential neighbor to others, albeit with varying degrees of similarity. By integrating the neighbor information of sample points, labeled G X, and that of cluster centers, labeled G V, into the standard FCM framework, the algorithm gains additional insights into data structure. This aids in steering the clustering process and enhances the algorithm's robust⁃文章编号1004-924X(2024)07-1045-14收稿日期:2023-08-28;修订日期:2023-10-11.基金项目:国家自然科学基金资助项目(No.42076058,No.52075461);福建省自然科学基金资助项目(No.2020J01713,第 32 卷光学精密工程ness. Three iterative methods are presented to implement this enhanced clustering model. When com⁃pared to leading clustering techniques, our approach demonstrates over a 10% improvement in cluster⁃ing efficacy on select benchmark datasets. It undergoes thorough evaluation across different dimen⁃sions, including parameter sensitivity, convergence rate, and through ablation studies, confirming its practicality and efficiency.Key words: fuzzy C-means clustering; adaptive neighbors; algorithm robustness; iterative algorithm1 引言作为一种无监督方法,聚类的基本任务是将数据点划分为不相交的簇,使得同一簇内数据点之间的相似度最大化,而不同簇之间数据点的相似度最小化。
基于HOG+SVM的图像分类系统的设计与实现

夺 ・ 夺 ・ 夺 ・ ÷ ・ ・ 夺 ・ 夺 ・ ( }・ ・ 夺 ・ 夺 ・ 夺 ・ ÷ ・ ・ ・ ・ 牵 ・ 夺 ・ 夺 ・ 夺 ・ 夺 ・ 夺 ・ 夺 ・ 夺 ・ ・ ・ 夺 ・ 夺 ・ 夺 - ・ ・ 夺 ・ 夺 ・ 夺 - 夺 ・ ÷ ・ 夺 ・ 夺 ・ ・ 毒 ・ 夺 ・ 夺 ・ 夺 - 夺 - ・ ÷ ・
姜 经纬 , 程传蕊
( 1 . 沈 阳航 空航 天大 学,辽宁 沈 阳 1 1 0 0 0 0 ; 2 . 漯河职业技 术学院 , 河 南 漯河 4 6 2 0 0 0 )
摘
要: 图像分 类在 工业 、 医疗、 勘测 、 驾驶等领域 都有较 高的 实用价值 , 通 过分析 图像 分 类技 术 , 采 用软件 工
作者简介 : 姜 经纬( 1 9 9 4一) , 男, 河 南漯 河人 , 在读本科生 , 主要从 事 图像识 别分类 方面的 学 习与研 究 ; 程 传蕊 ( 1 9 7 0一) , 女, 河 南漯河人 , 教授 , 主要从 事算法研 究。
第 2期
姜 经纬, 等: 基于 H O G+S V M 的图像 分类 系统的设计与 实现
Vo 1 . 1 6 No. 2 Ma r c h 2 01 7
2 0 1 7年 3月
d o i : 1 0 . 3 9 6 9 / j . i s s n . 1 6 7 1 —7 8 6 4 . 2 0 1 7 . 0 2 . 0 1 3
基于 H O G+S V M 的 图像 分 类 系统 的设 计 与 实现
一种基于模糊分类的Apriori优化算法

据 挖掘 问题 中的一个 重 要研 究 内容 。其基 本思 想是
逐 层迭 代寻 找频 繁项 集 。 目前 有很 多 产生 频繁 项 目
集 的算 法 , 些 算法 扫描 数 据 库 产 生 候选 项 目集 都 这
相 当耗 时 , 必 要对 方法 进 行 改进 。 有
好 的性 能 。但 是 由于 数 据 库 的规 模 通 常是 非 常 大 的, 每次 迭代 时产 生 巨 大 的候 选 集 对 时 间和 空 间 的
p e e s a o i z to a g rt r s nt n pt miai n lo i hm Ap i r ro i s d n u z c a sfc to ba e o fz y ls i ain. Th pr b e u i g n e v l i e o lms sn i tr a a p o c o qu n iy h p o e t diiin c n e e o ld mo t l a ug p ro ma c v r e d p r a h t a tf t e r p ry v so a b r s v e s o h y, nd h e e fr n e o e h a
来 的 巨大 性 能开销 。 以职称 考试 成 绩 为例 , 验证 了该 算 法 的有 效 性。
关 键词 : 数据 挖掘 ; 糊 分 类 ; 化 算法 模 优
D I 码 :0 3 6 / .sn 10 O 编 1 . 9 9 ji .0 2—2 7 . 0 0 0 .2 s 2 9 2 1 .4 0 5
检查 ” 法 大 幅 度 压 缩 了候 选 项 集 的大 小 , 着较 方 有
可 以帮助 制 定 决 策 , 营 销 策 略 等 , 就 是 关 联 规 如 这 则 ¨ 。最经 典 的 关 联 规 则 提 取 算 法 是 A r r pii算 o
模糊c均值聚类算法及应用

模糊c均值聚类算法及应用
模糊c均值聚类算法是一种常用的聚类算法,它可以将数据集中的数据分成若干个不同的类别,每个类别中的数据具有相似的特征。
与传统的c均值聚类算法不同的是,模糊c均值聚类算法允许数据点属于多个类别,这使得它在处理模糊数据时更加有效。
模糊c均值聚类算法的基本思想是将数据集中的每个数据点分配到不同的类别中,使得每个数据点到其所属类别的距离最小。
在模糊
c均值聚类算法中,每个数据点都有一个隶属度,表示它属于每个类别的程度。
这个隶属度是一个0到1之间的实数,表示数据点属于某个类别的概率。
模糊c均值聚类算法的应用非常广泛,例如在图像分割、模式识别、数据挖掘等领域都有着重要的应用。
在图像分割中,模糊c均值聚类算法可以将图像中的像素分成若干个不同的区域,每个区域中的像素具有相似的颜色和纹理特征。
在模式识别中,模糊c均值聚类算法可以将数据集中的数据分成不同的类别,从而实现对数据的分类和识别。
在数据挖掘中,模糊c均值聚类算法可以帮助我们发现数据集中的规律和模式,从而为我们提供更加准确的预测和决策。
模糊c均值聚类算法是一种非常重要的聚类算法,它可以帮助我们对数据进行分类和识别,从而为我们提供更加准确的预测和决策。
在未来的发展中,模糊c均值聚类算法将会得到更加广泛的应用,
为我们的生活和工作带来更多的便利和效益。
基于模糊识别方法的脉象信号分类识别

基于模糊识别方法的脉象信号分类识别
王燕;蔡吉飞;沈韶华;房瑞明;王平
【期刊名称】《北京印刷学院学报》
【年(卷),期】2014(000)006
【摘要】为了能够对脉象信号客观化、定量化的识别研究,采用模糊理论方法对
脉象信号进行分类识别,将脉象信号的指感描述和判定规则进行客观描述和定量化,确定脉象指感因素的模糊输入变量;根据脉象信号的提取特征和脉象分类确定输出模糊变量;根据脉象定义确定模糊推理规则,从而完成可信度表示的脉象分类。
得出采用模糊识别方法可以有效完成脉象信号分类识别的结论。
【总页数】5页(P52-56)
【作者】王燕;蔡吉飞;沈韶华;房瑞明;王平
【作者单位】北京印刷学院机电工程学院,北京102600;北京印刷学院机电工程学院,北京102600;北京印刷学院机电工程学院,北京102600;北京印刷学院机电工程学院,北京102600;北京印刷学院机电工程学院,北京102600
【正文语种】中文
【中图分类】R241.1;TN911.6
【相关文献】
1.基于一阶循环均值算法的VHF频段信号调制分类识别方法研究 [J], 杨发权;李赞;罗中良
2.基于softmax回归的通信信号循环谱的多分类识别方法 [J], 刘亚冲;唐智灵
3.基于神经网络的S模式信号分类识别方法研究 [J], 王苗苗;廖欣;李延军
4.基于神经网络的数字信号多分类识别方法 [J], 杨栩
5.基于深度学习的声信号分类识别方法 [J], 王鹏程;崔敏;王彦博;李剑;赵欣
因版权原因,仅展示原文概要,查看原文内容请购买。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
! ! = CN12一l352/N 实 验 室 科 学 LAB0RAT0RY SCIENCE 第16卷第2期2013年4月 Vo1.16 No.2 Apr.2013
基于Na ̄'ve MIDEA算法的模糊分类系统 高小霞,霍纬纲 (中国民航大学计算机科学与技术学院,天津 300300)
摘要:阐述了Naive MIDEA分布估计算法的相关内容及多目标优化问题中的一些基本概念,提出了基于 Naive MIDEA分布估计算法的模糊分类系统构建方法。通过在Iris,Pima,Wine三个标准数据集的仿真实验表 明,该方法比基于遗传算法的模糊分类器在准确率和解释性方面更有效。 关键词:分布估计算法;Na'fve MIDEA;模糊分类 中图分类号:TP301 文献标识码:B doi:10.3969/j.issn.1672—4305.2013.02.039
Fuzzy classification system based on Nai've MIDEA algorithm
GAO Xiao—xia,HUO Wei—gang (College of Computer Science and Technology,Civil Aviation University of China,Tianjin 300300, China)
Abstract:This paper elaborated the contents of Na'ive MIDEA estimation of distribution algorithm and the concepts of multi——objective evolutionary problem and proposed the fuzzy classification method based on Nai've MIDEA estimation of distribution algorithm.Fuzzy classification method based on Nai've MIDEA estimation of distribution algorithm is proposed.Simulation experiment on Iris,Pima,Wine benchmark datasets show that the proposed approach was effective than that based on genetic algo— rithm. Key words:estimation of distribution algorithm;Naive MIDEA;fuzzy classification
分布估计算法是在遗传算法的基础上发展起来 的一类优化算法…,结合了进化算法和统计学习的 知识,是当前进化计算领域的研究热点。在传统的 遗传算法中用种群表示优化问题的一组候选解,然 后将种群中的个体进行选择、交叉和变异等操作获 得下一代解并从中选择优秀的解,反复进行,实现种 群的进化。而在分布估计算法中每一代群体都用一 个概率分布来描述,然后对概率模型按照某种策略 随机采样产生新的群体,如此反复实现进化目的。 有文献指出分布估计算法能比遗传算法更加有效的 解决高维问题,降低时间复杂性 J。为此,本文利 用Na'fve MIDEA分布估计算法构建模糊分类系统。 1 Na'ive MIDEA分布估计算法概述 Na ̄'ve MIDEA分布估计算法的概率模型是一个 混合模型_3 J,构成混合模型的每一个组成部分都是 一个单变量概率模型,利用这种混合概率分布描述 的多目标Pareto最优解分布性较好。为了进一步提 高进化过程中群体的多样性,Na'fve MIDEA算法采 用了一种特殊的选择机制,详细描述见文献 。 1.1 Nai've MIDEA的概率模型 Naive MIDEA混合概率分布是k(k>1)个概 率分布的加权和,每个概率分布都是混合概率分布 的一个组成部分。混合概率模型表示如下: k一1 pmixture(z)=∑ P (z)其中Z=( 。,z ..zH)是
表示分布估计算法中所有随机变量的向量,JB 是混 合系数, 0,i E{0,1,…, 一1}且∑ 卢 = 1。混合系数 的设置有不同的方法,最普通的方 法就是设置 为第 个聚类在所有类别中所占的比 例。混合系数确定后下一步就是选择聚类算法,将 群体分为k个类别,每个聚类都用一个单变量概率 l一1 分布 (z)来表示:P (Z)=HP(Z ),在解决多
i=O 目标问题[4 时,这种混合概率分布可以将Pareto
最优边界划分为k个类别,每个类别都描述Pareto 高小霞,等:基于NaYve MIDEA算法的模糊分类系统 l l9 最优边界的一个不同的区域,因此从混合概率模型 抽取的下一代解能够很好的分布在Pareto最优边界 上,以保持群体的多样性。 1.2 UMDA概率模型 本文在利用NaYve MIDEA分布估计算法进行模 糊建模时,描述每个聚类的单变量概率分布为UM— DA(Univariate marginal distribution algorithm)概率模 型。 UMDA算法由德国学者Mtihlenbein在1996年 提出_6 。UMDA以一个概率向量p(x)=(p(x ), P( )…p(x ))描述每一代群体,其中i={1, 2….n}, ∈{0,1}。P( )表示对应的变量取值 为1的概率,新的群体通过对概率向量采样生成。 初始概率向量从一个中心概率开始即P( )= (0.5,...0.5),表示个体中所有变量取值为1的概 率均为0.5,依据此概率产生的初始群体可以均匀 分布在搜索空间,随着迭代次数的增加概率向量的 值逐渐收敛到0或1。算法基本过程如下: 第一步:以概率向量P( )=(0.5,…0.5)抽样 产生M个个体,组成初始群体D ,z=0。 第二步:判断终止条件,如果符合条件则终止算 法,否则继续执行。 第三步:利用某种选择机制从群体D 中选择 <M个优秀个体构成新的群体D ,依据D 估 计新的联合概率模型P ( ): p ( )=p(x l D )=HPf( 。) ∑8/x = I D ) 耳 — 一 其中 ,( 。= l D )={ 粪 。 第四步:从概率向量P ( )中采样 次,得到 新一代群体。返回第二步。 2以NaYve MIDEA构建模糊分类系统 2.1 多目标优化问题 多目标与单目标优化问题的不同之处在于多目 标优化问题中有多个目标需要同时优化,目标之间 没有先后顺序。通常这些目标是相互冲突的,因此 多目标优化问题解的优劣性不是仅取决于目标函数 值。在多目标优化问题求解的过程中不可能使所有 目标同时达到最优 J,所以优化的目的就是要找到 Pareto最优解集。 2.2问题的定义 对于由N个模糊规则组成的候选规则集,本文 的问题为从该规则集中选取若干规则构成模糊模型 5,并要满足下面的条件:最大化 (S),最小化 ,2(8),最小化,3(s),一般地不存在同时满足上述条 件的最优规则集构成的模糊模型,因此进化的目的 是搜索不被其它任何规则集所支配的Pareto最优 解。 如果规则集S 、S 满足以下三个条件:
-<L(S ),厂2(S ) (S ),,3(S )≥ (S口);且满足 fl(S )<fl(S ), (S )> (5 ), (S )> (.s )三个条件之一, 则规则集S 被规则集s 支配(s 优于S ,S <S口)。 2.3仿真研究 实验数据来自UCI机器学习数据集(http:// www.ics.uci.edu/~mlearn/),以FCM聚类算法对 原始数据进行模糊化处理 J,然后采用基于Apriori 原理的方法提取初始模糊规则集¨ ,再以NaYve MIDEA分布估计算法为搜索算法构建模糊模型验 证本文方法的有效性。变量及参数设置如表1所 示。实验环境:WinXP,CPU 3.0GHz,2.0GB内存, Visual C++。 表1参数设置 参数名称 参数取值 50 50 12 0 25/12 3
(1)以NaYve MIDEA构建模糊模型算法描述 输入:由 个候选模糊规则构成的模糊规则集; 输出:非支配解集,每个非支配解代表一个模糊 分类模型 步骤一:随机产生含 个个体的初始群体 P。,长度为n的每个个体上的基因位以概率0.5取 0或1。对P。中的每个个体计算其目标值。计数变 量t=0。 步骤二:计算每个个体的支配计数值。 步骤三:从群体P 中选择L#tnj个最优解构成 最优解集s 步骤四:从S 中选择ltnJ个最优解构成新的群 体P…。 步骤五:建立最优解集P…的混合概率分布 P (Z): ①以K均值算法将P…聚为K类:(co,
警七 120 实 验 室 科 学 C .,c ) ②依据c 构建单变量相关的UMDA联合概率模 n一1 型pi(z),P (z)=n P( ),i=(0,1,…k一1),
J=0 k一1 则pmix.,re(z)=∑卢 P‘(z),卢 =了1。
0 步骤六:基于混合概率分布P… (z)采样 。。
一Ltn/次加入新群体P : ①以平均概率从(c。,c ….,c )中选择一个 类别群体,基于该群体的联合概率分布抽取一个个 体并加入新群体P ②重复操作Ⅳ 一L nj次 步骤七:计数变量t= +1,如果t<T,算法转 步骤(2),否则输出群体P 中的所有非支配解构造 分类模型。 (2)仿真结果 图1至图3是利用Naive MIDEA分布估计算法 构建的模糊分类系统在训练集和测试集的实验结 果。图中横轴为每个分类模型的规则个数和模糊项 个数之和,纵轴为分类错误率。 0.8 … 十 训『练集 0・6 … 集jl 凳40 4【。 l 一 0.2 0 f f 2 4 6 8 10 模糊舰则个数与模制项个数之和 图1数据集Iris上的实验结果 0 8 0.6 壮 拙0 4 O.2 0 L 2 t 训练集 测试集 4 6 8 10 12 模糊规则个数 模糊项个数之和 图2数据集Wine上的实验结果 ・ 训练集 测试集 哥 4 6 8 10 12 14 模糊规则和I模糊项个数之和 图3数据集Pima上的实验结果 从实验结果图可以看出,利用Nai've MIDEA分 布估计算法构建的模糊模型在训练集和测试集的实 验结果随着模型中规则个数和模糊项个数的增加分 类错误率基本呈下将趋势,即分类错误率越低,解释 性越差。例如在Wine数据集上当规则个数和模糊 项个数之和增加到1 1时,在训练集和测试集上的分 类准确率最高。其它两个数据集上的实验结果也是 如此。 表2至表4列出了利用本文方法分别在Iris、 Wine和Pima三个数据集上得到的分类准确率和解 释性相对较高的四个模糊模型,所列内容包括模糊 模型在实验数据的训练集和测试集上的分类错误率 以及模型中包含的规则数目和总的模糊项数目,另 外,在表中也同时列出了Genetic算法所建模型在三 个数据集上5次实验的平均结果。 表2 Naive MIDEA和Genetic在Iris上的实验结果 训练集上 的错误率 0 03±O.009 测试集上 的错误率 O.07±0.005