系统聚类分析课程设计

合集下载

系统聚类分析

1.093
0.971 0.316 0.527 0.212 0.211 0.181 0.666 0.414
4 510.5
2 773.5 6 934.5 4 458 12 249 8 973 10 689 3 679.5 4 231.5
1 036.4
683.7 611.1 632.6 791.1 636.5 634.3 771.7 574.6
四（2）、最短距离聚类法
最短距离聚类法，是在原来的m×m距离矩阵找出“距离最小”的两个分类对象Gp和Gq，并将其归并为一新类Gr，然后按“距离最短”计算公式 d rk min{ d pk , d qk } (k p, q) 计算原来各类与新类之间的距离，这样就得到一个新的（m－1）阶的距离矩阵；再从新的距离矩阵中选出距离最小者dij，把Gi和Gj归并成新类；再计算各类与新类的距离，这样一直下去，直至各分类对象被归为一类为止。
(2)按新的分类结果重新计算距离矩阵（见103面），发现d57=0.85最小，故将第 5区与第7区并为一类，得到一个新的共7 类的暂时分类结果；
(3)按上面的方法依此类推。
图3.4.1 直接聚类谱系图
聚类谱系图（树形图）说明
（1）聚类谱系图显示的是一个一般的分类结构，不是一个特定的分类结果。（2）用户可设定“距离临界值”并根据设定的临界值进行分类。例如，如设定距离临界值”在1.78-3.10之间，则9个农业区可分为 3大类,即 {G1, G2, G8}, {G3,G4,G9}, {G5,G6,G7} （3）“距离临界值”的选取没有一个严格的标准，一般取距离跨度较大的两个值中间的值。
0 4.79 2.99 4.05 1.3 0.49
0 1.8 0 0.85 1.07 0 5.17 3.96 5.03 4.86 3.06 4.12 1.4

系统聚类报告

实验名称：系统聚类分析一、实验目的和要求通过上机操作，完成spss软件的系统聚类分析二、实验内容和步骤：系统聚类法：如图所示，依次点击图中黄色选项如图所示,进行以下操作点击statistics，进行以下操作点击plots，进行以下操作点击method,进行以下操作点击ok结果与分析Case Processing Summary aCasesValid MissingTotalNPercent NPercentNPercent 34100.0%0 0.0%34 100.0%a. Squared Euclidean Distance used上表为样本汇总表，由表中可得，样本的有效值个数为34，无样本缺失值。

上表表示为样本之间接近度程度，反映了样本之间相似性或相异性的矩阵，由于计算距离使用的是平方欧式距离，所以样本间距离越大，样本越相异Agglomeration ScheduleStage Cluster CombinedCoefficientsStage Cluster First Appears Next StageCluster 1Cluster 2Cluster 1Cluster 21 33 34 .194 0 0 62 7 14 .210 0 0 43 31 32 .229 0 0 124 7 8 .289 2 0 115 25 28 .325 0 0 126 4 33 .357 0 1 14 7 16 29 .372 0 0 118 3 19 .429 0 0 13 9 10 11 .438 0 0 17 10 18 21 .520 0 0 15 11 7 16 .538 4 7 13 122531.667532013 3 7 .748 8 11 1814 4 24 .786 6 0 2015 17 18 .819 0 10 2116 20 30 .920 0 0 2117 10 12 1.054 9 0 2318 3 13 1.104 13 0 2419 5 6 1.141 0 0 2220 4 25 1.205 14 12 2421 17 20 1.385 15 16 2222 5 17 1.663 19 21 2323 5 10 2.106 22 17 2624 3 4 2.408 18 20 2525 3 15 3.104 24 0 2626 3 5 5.019 25 23 3027 26 27 8.120 0 0 2928 2 22 8.220 0 0 2929 2 26 14.493 28 27 3030 2 3 20.724 29 26 3331 1 9 21.895 0 0 3232 1 23 54.558 31 0 3333 1 2 69.632 32 30 0上表为组之间聚类表，表的第2列和第三例表示聚合的类，第4列是表示聚合系数，是距离测定值。

聚类课程设计

聚类课程设计一、教学目标本课程的教学目标是使学生掌握聚类分析的基本概念、方法和应用。

通过本课程的学习，学生应能够理解聚类的目的和意义，熟悉聚类分析的基本算法，掌握聚类结果的解释和评估，并能够将聚类分析应用到实际问题中。

具体来说，知识目标包括：1.了解聚类分析的基本概念，如聚类、簇、距离度量等。

2.掌握常用的聚类算法，如 K-means、层次聚类、DBSCAN 等。

3.理解聚类分析的应用领域和实际意义。

技能目标包括：1.能够使用相关软件或编程语言实现聚类分析算法。

2.能够对聚类结果进行解释和评估，如确定合适的聚类个数、评估聚类质量等。

3.能够将聚类分析应用到实际问题中，如数据挖掘、图像处理等。

情感态度价值观目标包括：1.培养学生的数据分析能力和问题解决能力。

2.培养学生对数据的敏感性和批判性思维。

3.培养学生对聚类分析在实际应用中的认识和价值判断。

二、教学内容本课程的教学内容主要包括聚类分析的基本概念、方法和应用。

具体的教学大纲如下：1.引言：介绍聚类分析的背景和意义，概述本课程的主要内容和目标。

2.聚类分析的基本概念：介绍聚类、簇、距离度量等基本概念。

3.聚类算法：介绍 K-means、层次聚类、DBSCAN 等常用聚类算法。

4.聚类结果的解释和评估：讲解如何确定合适的聚类个数、评估聚类质量等。

5.聚类分析的应用：介绍聚类分析在数据挖掘、图像处理等领域的应用实例。

三、教学方法为了激发学生的学习兴趣和主动性，本课程将采用多种教学方法相结合的方式。

具体包括：1.讲授法：教师通过讲解和演示，向学生传授聚类分析的基本概念、方法和应用。

2.讨论法：学生进行小组讨论，促进学生之间的交流和思考。

3.案例分析法：通过分析实际案例，让学生了解聚类分析在实际问题中的应用。

4.实验法：安排实验课程，让学生亲手操作和实践聚类分析算法。

四、教学资源为了支持教学内容和教学方法的实施，丰富学生的学习体验，我们将准备以下教学资源：1.教材：选择一本关于聚类分析的教材，作为学生学习的主要参考资料。

第一节系统聚类分析

第五章聚类分析（一）教学目的通过本章的学习，对聚类分析从总体上有一个清晰地认识，理解聚类分析的基本思想和基本原理，掌握用聚类分析解决实际问题的能力。

（二）基本要求了解聚类分析的定义，种类及其应用范围，理解聚类分析的基本思想，掌握各类分析方法的主要步骤。

（三）教学要点1、聚类分析概述；2、系统聚类分析基本思想，主要步骤；3、动态聚类法基本思想，基本原理，主要步骤；4、模糊聚类分析基本思想，基本原理，主要步骤；5、图论聚类分析基本思想，基本原理。

（四）教学时数6课时（五）教学内容1、聚类分析概述2、系统聚类分析3、动态聚类法4、模糊聚类分析5、图论聚类分析统计分组或分类可以深化人们的认识。

实际应用中，有些情况下进行统计分组比较容易，分组标志确定了，分组也就得到了，但是，有些情况下进行统计分组却比较困难，特别是当客观事物性质变化没有明显标志时，用于确定分组的标志和组别就很难确定。

聚类分析实际上给我们提供了一种对于复杂问题如何分组的统计方法。

第一节聚类分析概述一、聚类分析的定义聚类分析是将样品或变量按照它们在性质上的亲疏程度进行分类的多元统计分析方法。

聚类分析时，用来描述样品或变量的亲疏程度通常有两个途径，一是把每个样品或变量看成是多维空间上的一个点，在多维坐标中，定义点与点，类和类之间的距离，用点与点间距离来描述样品或变量之间的亲疏程度；另一个是计算样品或变量的相似系数，用相似系数来描述样品或变量之间的亲疏程度。

二、聚类分析的种类（一）聚类分析按照分组理论依据的不同，可分为系统聚类法，动态聚类法，模糊聚类、图论聚类、聚类预报等多种聚类方法。

1、系统聚类分析法。

是在样品距离的基础上定义类与类的距离，首先将n个样品自成一类，然后每次将具有最小距离的两个类合并，合并后再重新计算类与类之间的距离，再并类，这个过程一直持续到所有的样品都归为一类为止。

这种聚类方法称为系统聚类法。

根据并类过程所做的样品并类过程图称为聚类谱系图。

r软件聚类分析课程设计

r软件聚类分析课程设计一、课程目标知识目标：1. 理解聚类分析的基本概念、原理及在R软件中的实现方法；2. 学会使用R软件进行数据预处理、聚类分析及结果解读；3. 掌握不同聚类算法（如K-means、层次聚类等）的优缺点及适用场景。

技能目标：1. 能够独立操作R软件进行聚类分析，并对结果进行可视化展示；2. 能够根据实际数据特点选择合适的聚类算法，调整相关参数，优化分析结果；3. 能够运用聚类分析结果对实际问题进行解释和阐述。

情感态度价值观目标：1. 培养学生对数据科学和R软件的兴趣，激发主动学习的热情；2. 培养学生的团队合作意识，学会在团队中分享、交流、协作；3. 培养学生严谨的科学态度，注重数据分析的客观性和准确性。

课程性质：本课程为高年级数据分析相关课程，旨在通过R软件聚类分析的学习，提高学生的数据分析能力，培养学生解决实际问题的能力。

学生特点：学生具备一定的统计学和R软件基础，对数据分析有一定了解，具备独立思考和解决问题的能力。

教学要求：结合学生特点和课程性质，注重理论与实践相结合，强调学生在实际操作中掌握聚类分析方法，并能应用于实际问题。

在教学过程中，关注学生的学习反馈，及时调整教学策略，确保课程目标的实现。

通过课程学习，使学生具备独立进行聚类分析的能力，为后续学习和工作打下坚实基础。

二、教学内容1. 聚类分析基本概念与原理- 聚类分析的分类及各自特点- 聚类分析的数学原理及算法流程2. R软件基础操作与数据预处理- R软件的基本操作与数据导入- 数据清洗、整理与转换3. 常用聚类算法及其R实现- K-means算法及其R实现- 层次聚类算法及其R实现- DBSCAN算法及其R实现4. 聚类结果可视化与评估- 聚类结果的可视化方法- 聚类效果的评估指标与优化方法5. 聚类分析在实际案例中的应用- 选择合适的数据集进行聚类分析- 根据实际需求调整聚类算法与参数- 案例分析与结果解读教学内容安排与进度：1. 第1周：聚类分析基本概念与原理2. 第2周：R软件基础操作与数据预处理3. 第3-4周：常用聚类算法及其R实现4. 第5周：聚类结果可视化与评估5. 第6周：聚类分析在实际案例中的应用教材章节关联：1. 《统计学》第十章：聚类分析2. 《R语言实战》第四章：数据处理与可视化3. 《数据挖掘与机器学习》第六章：聚类分析方法三、教学方法本课程将采用以下教学方法，旨在激发学生的学习兴趣，提高学生的主动参与度和实践能力：1. 讲授法：通过系统的讲解，使学生掌握聚类分析的基本概念、原理和算法流程。

04聚类分析讲课教案

04 聚类分析聚类分析专题§6.1引言俗话说，“物以类聚，人以群分”，在自然科学和社会科学等各领域中，存在着大量的分类问题。

分类学是人类认识世界的基础科学，在古老的分类学中，人们主要靠经验和专业知识进行定性的分类，很少利用数学工具进行定量的分类。

随着人类科学技术的发展，对分类的要求越来越高，以致有时仅凭经验和专业知识难以确切地进行分类，于是人们逐渐地把数学工具引用到了分类学中，这便形成了数值分类学这一学科，之后又将多元分析的技术引入到数值分类学，便又从数值分类学中分离出一个重要分支一一聚类分析。

与多元分析的其它分析方法相比，聚类分析方法较为粗糙，理论上还不够完善，正处于发展阶段。

但是，由于该方法应用方便，分类效果较好，因此越来越为人们所重视。

这些年来聚类分析的方法发展较快，内容越来越丰富。

判别分析与聚类分析都是研究事物分类的基本方法，它们有着不同的分类目的，彼此之间既有区别又有联系。

各种判别分析方法都要求对类有事先的了解，通常是每一类都有一个样本，据此得出判别函数和规则，进而可对其它新的样品属于哪一类作出判断。

对类的事先了解和确定常常可以通过聚类分析得到。

聚类分析的目的是把分类对象按一定规则分成若干类，这些类不是事先给定的，而是根据数据的特征确定的。

在同一类里的这些对象在某种意义上倾向于彼此相似，而在不同类里的对象倾向于不相似。

聚类分析能够用来概括数据而不只是为了寻找“自然的”或“实在的”分类。

例如，在选拔少年运动员时，对少年的身体形态、身体素质、生理功能的各种指标进行测试，据此对少年进行分类，分在同一类里的少年这些指标较为相近。

类确定好之后，可以根据各类的样本数据得出选材的判别规则，作为选材的依据。

又如，根据啤酒中含有的酒精成分、纳成分、所含的热量“卡路里”数值，可以对啤酒进行分类。

聚类分析根据分类对象不同分为Q型聚类分析和R型聚类分析。

Q型聚类分析是指对样品进行聚类，R型聚类分析是指对变量进行聚类。

聚类分析数据挖掘课程设计

数据挖掘课程设计一．实验目的1）请根据所给的天津各区县经济和教育数据分别做聚类分析，并给出你的结论分析。

2）聚类分析结果时候与你的直观感受相符合？如果不符，请解释并给出解决方法。

二．实验过程及结果分析本实验采用聚类分析来对各个区县进行分类，这里我使用SPSS 20来进行聚类分析。

输入各区县经济数据如下图：使用SPSS 进行K均值聚类分析，分为六类，得到如下结果：每个聚类中的案例数聚类1 1.0002 4.0003 5.0004 4.0005 1.0006 1.000有效16.000缺失.000上图中的第三列(QCL_1)即为分类情况，说明如下：北辰区分为一类，标记为1；河东区、宝坻区、宁河县、蓟县分为一类，标记为2；南开区、河北区、津南区、武清区、静海县分为一类，标记为3；和平区、河西区、东丽区、西青区分为一类，标记为4；滨海新区为一类，标记为5；红桥区分为一类，标记为6 。

结果分析：分类结果从整体来看还是比较合理的。

滨海新区这一地区产值非常高，毫无疑问是单独的一类；红桥区产值最低，也分为一类，这个与我的直观感受不太相符，作为天津市市内六区之一的红桥区，产值最低，分为一类，我觉得很不可思议，问题可能是数据量不够大，或者说评价指标太少，这里我们只有一个评价指标（总产值），导致结果具有偶然性，适当增加评价指标应该可以增加结果的准确性。

输入各区县教育数据（中学数量和中学在校生以及教师数量）如下图：使用SPSS 对这三个变量进行K均值聚类分析，分为六类，得到如下结果：每个聚类中的案例数聚类1 1.0002 1.0003 2.0004 6.0005 1.0006 5.000有效16.000缺失 1.000上图中的第五列(QCL_1)即为分类情况，说明如下：滨海新区分为一类，标记为1；蓟县分为一类，标记为2；武清区、宝坻区分为一类，标记为3；和平区、河东区、河西区、南开区、河北区、宁河县分为一类，标记为4；静海县分为一类，标记为5；红桥区、东丽区、西青区、津南区、北辰区分为一类，标记为6 。

《系统聚类分析》课件

PART 02
系统聚类分析的基本原理
REPORTING
距离度量
01
02
03
欧氏距离
根据空间中两点间的直线距离计算，适用于数值型数据。
曼哈顿距离
在直角坐标系中，两点之间的距离等于各坐标轴上绝对值之和的和。
切比雪夫距离
不考虑坐标轴上的比例因子，只考虑坐标轴上的绝对距离。
聚类方法
层次聚类
系统聚类分析
REPORTING
• 引言 • 系统聚类分析的基本原理 • 系统聚类分析的步骤 • 系统聚类分析的常用算法 • 系统聚类分析的优缺点 • 系统聚类分析的未来发展
目录
PART 01
引言
REPORTING
聚类的定义
聚类
将数据集划分为若干个组（或称为簇），使得同一组内的数据尽可能相似，不同组的数据尽可能不同。
系统聚类分析
基于距离度量，通过一定的算法将数据点（或样本）进行分类，使得同一类中的数据点尽可能接近或相似，不同类中的数据点尽可能远离或差异大。
聚类的目的
探索性数据分析
通过聚类分析，可以发现数据中的隐藏模式和结构，从而更好地理解数据的分布和特征。
数据降维
决策支持
聚类分析可以用于市场细分、客户分类等场景，帮助企业更好地了解客户需求和市场趋势，从而制定更有针对性的营销策略。
将数据点按照某种标准（如距离）进行层次分解，形成一棵聚类树。
K-means聚类
将数据点分为K个聚类，每个聚类中心点为该聚类的平均值。
DBSCAN聚类
基于密度的聚类方法，将相邻的密集区域划分为同一聚类。
聚类评估
内部评估指标
通过计算聚类内部的紧密程度来评估聚类的质量，如轮廓系数、 Calinski-Harabasz指数等。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

《空间分析》系统聚类算法及编程实现学院：地质工程与测绘学院专业：遥感科学与技术班级：2011260601学号：学生姓名：指导老师：李斌目录第1章前言 (3)第2章算法设计背景 (3)2.1 聚类要素的数据处理 (3)2.2距离的计算 (5)第3章算法思想与编程实现 (5)3.1 算法思想 (5)3.2 用Matlab编程实现 (7)3.2.1 程序代码 (7)3.2.2 编程操作结果 (12)第4章K-均值算法应用与优缺点 (13)4.1 K-均值聚类法的应用 (13)4.2 K-均值聚类法的优缺点 (14)第5章课程设计总结 (14)主要参考文献 (15)第一章前言本课题是根据李斌老师所教授的《空间分析》课程内容及要求而选定的，是对于系统聚类算法的分析研究及利用相关软件的编程而实现系统聚类。

研究的是系统聚类算法的分析及编程实现，空间聚类的目的是对空间物体的集群性进行分析，将其分为几个不同的子群（类）。

子群的形成的是地理系统运作的结果，根据此可以揭示某种地理机制。

此外，子群可以作为其它分析的基础，例如，公共设施的建立一般地说是根据居民点群的分布，而不是具体的居民住宅的分布来布置的，因此需要对居民点群进行聚类分析以形成若干居民点子群，这样便于简化问题，突出重点。

空间聚类可以采用不同的算法过程。

在分析之初假定n个点自成一类，然后逐步合并，这样在聚类的过程中，分类将越来越少，直至聚至一个适当的分类数目，这一聚类过程称之为系统聚类。

常见的聚类分析方法有系统聚类法、动态聚类法和模糊聚类法等。

下面主要介绍系统聚类算法，并基于Matlab软件用K-means算法(即k-均值算法)来实现系统聚类的算法编程。

第二章算法设计背景2.1聚类要素的数据处理假设有m 个聚类的对象，每一个聚类对象都有个要素构成。

它们所对应的要素数据可用表3.4.1给出。

在聚类分析中，常用的聚类要素的数据处理方法有如下几种。

①总和标准化②标准差标准化③极大值标准化经过这种标准化所得的新数据，各要素的极大值为1，其余各数值小于1。

④极差的标准化经过这种标准化所得的新数据，各要素的极大值为1，极小值为0，其余的数值均在0与1之间。

2.2距离的计算距离是事物之间差异性的测度，差异性越大，则相似性越小，所以距离是系统聚类分析的依据和基础。

选择不同的距离，聚类结果会有所差异。

在地理分区和分类研究中，往往采用几种距离进行计算、对比，选择一种较为合适的距离进行聚类。

第三章算法思想与编程实现3.1算法思想我们已经指出系统聚类方法首先将n个空间点看做是n个子群，然后根据所选用的聚类统计量来计算n个子群之间的关系。

对于距离，计算n个子群两两之间的距离，首先选择距离最近的两个子群（点）归为一个新的子群，这样就得到n-1个子群两两之间的聚类统计量，继续选择距离最近的子群合并，再得到n-2个子群……，依此类推，直到所有的子群全部合并。

K-means算法是硬聚类算法，是典型的局域原型的目标函数聚类方法的代表，它是数据点到原型的某种距离作为优化的目标函数，利用函数求极值的方法得到迭代运算的调整规则。

K-means算法以欧式距离作为相似度测度，它是求对应某一初始聚类中心向量V最有分类，使得评价指标J最小。

算法采用误差平方和准则函数作为聚类准则函数。

K-均值算法的聚类准则是使每一聚类中，多模式点到该类别的中心的距离的平方和最小。

其基本思想是：通过迭代，主次移动各类的中心，直到得到最好的聚类为止。

其算法框图如图所示。

开始选择m个中心Z1,Z2，···Zm所有像元分到m个集群中心计算新的集群中心聚类中心不变结束具体的计算步骤如下：假设图像上的目标要分为m 类，m 为已知数。

第一步：适当地选取m 个类的初始中心Z 1(1),Z 2(1),···，Z M (1)，初始中心的选择对聚类结果有一定的影响，初始中心的选择一般有如下几种方法：1）根据问题的性质和经验确定类别数m ，从数据中找出直观上看来比较适合的m 个类的初始中心。

2）将全部数据随即地分为m 个类型，计算每类的重心，将这些重心作为m 个类的初始中心。

第二步：在第k 次迭代中，对任一样本X 按如下的方法把它调整到m 个类别中的某一类别中去。

对于所有的i ≠ j, i = 1,2,···，m, 如果∥X-Z j (k)∥﹤∥X-Z i (k)∥，则X ∈S j (k)其中S j (k)是以Z i (k)为中心的类。

第三步：由第二步得到S j (k)类新的中心Z j (k),Z j (k)=∑∈)(1K j S X j X N式中，N j 为S j (k)类中的样本数。

Z j (k+1)是按照使J 最小的原则确定的，J 的表达式为： J=21)1()(∑∑=∈+-m j S X k j k j Z X第四步：对于所有的i=1,2···，m ，如果Z i (k+1)=Z i (k),则迭代结束，否则转到第二步继续迭代。

这种算法的结果受到所选聚类中心的数目和其初始位置以及模式分布的几何性质和读入次序等因素的影响，并且在迭代过程中又没有调整类数的措施，因此可能产生不同的初始分类得到不同的结果，这是这种方法的缺点。

可以通过其他的简单的聚类中心试探方法，如最大距离法，找出初始中心，提高分类效果。

3.2用 Matlab 编程实现3.2.1程序代码对于上述的K-mean 算法用Matlab 软件实现编程并调用数据小的图片进行聚类分析及编程是否正确性的检测。

具体程序代码如下：%%读取图片Imag = imread('hand.jpg'); %%只能读取三个波段sample = rgb2gray(Imag); %%将彩色图片转换为灰度图片[m n] = size(sample); %%读取图片的维数sample = reshape(sample,m*n,1); %%将矩阵变换为m*n行1列的向量k = 4; %%分成4类t = 0; %%控制循环次数flag = 0; %%一个和sample等维数的标记向量ocentre1 = 80; %%选取第1类聚类中心ocentre2 = 160; %%选取第2类聚类中心ocentre3 = 220; %%选取第3类聚类中心ocentre4 = 255; %%选取第4类聚类中心sample = double(sample); %%将uint8类型转换为double型while t == 0%fsample1 = 0;%fsample2 = 0;%fsample3 = 0;%fsample4 = 0;fsample = zeros(4,1);num = zeros(4,1);dis = zeros(1,4);for i = 1:m*n%a = 5 - 2;%b = 2 - 5;dis(1) = abs(sample(i) - ocentre1); %%求到第1个聚类中心距离 dis(2) = abs(sample(i) - ocentre2); %%求到第2个聚类中心距离 dis(3) = abs(sample(i) - ocentre3); %%求到第3个聚类中心距离 dis(4) = abs(sample(i) - ocentre4); %%求到第4个聚类中心距离 mindis = min([dis(1) dis(2) dis(3) dis(4)]); %%求最小的距离%选取最小值，第一个值给dis1，第二个值给dis2，判断dis2<dis1，则给dis2值于dis1，计算第三个距离给dis2，返回第三步，循环switch mindiscase dis(1)%flag = cat(1,flag,1); %%将标记数组赋值1，该点属于第1类%fsample1 = cat(1,fsample1,sample(i));flag(i) = 1;fsample(1) = fsample(1) + sample(i);num(1) = num(1) + 1;case dis(2)%flag = cat(1,flag,2); %%将标记数组赋值2，该点属于第2类%fsample2 = cat(1,fsample2,sample(i));flag(i) = 2;fsample(2) = fsample(2) + sample(i);num(2) = num(2) + 1;case dis(3)%flag = cat(1,flag,3); %%将标记数组赋值3，该点属于第3类%fsample3 = cat(1,fsample3,sample(i));flag(i) = 3;fsample(3) = fsample(3) + sample(i);num(3) = num(3) + 1;case dis(4)%flag = cat(1,flag,4); %%将标记数组赋值4，该点属于第4类%fsample4 = cat(1,fsample4,sample(i));flag(i) = 4;fsample(4) = fsample(4) + sample(i);num(4) = num(4) + 1;endend%%重新计算聚类中心%[m1 n1] = size(fsample1);%[m2 n2] = size(fsample2);%[m3 n3] = size(fsample3);%[m4 n4] = size(fsample4);%ncentre1 = sum(fsample1)/(m1 - 1);%ncentre2 = sum(fsample2)/(m2 - 1);%ncentre3 = sum(fsample3)/(m3 - 1);%ncentre4 = sum(fsample4)/(m4 - 1);%flag%fsamplencentre1 = fsample(1)/num(1);ncentre2 = fsample(2)/num(2);ncentre3 = fsample(3)/num(3);ncentre4 = fsample(4)/num(4);%flag(1) = [];if ncentre1 == ocentre1 && ncentre2 == ocentre2... && ncentre3 == ocentre3 && ncentre4 == ocentre4 for i = 1:m*nswitch flag(i)case 1sample(i) = 60;case 2sample(i) = 120; case 3sample(i) = 180; case 4sample(i) = 240; endendt = 1;elseocentre1 = ncentre1;ocentre2 = ncentre2;ocentre3 = ncentre3;ocentre4 = ncentre4;endendsample = uint8(sample);sample = reshape(sample,m,n); imshow(sample);3.2.2编程操作结果实验调用前图片：实验调用后结果截图图片：第四章 K-均值算法应用与优缺点4.1K-均值聚类法的应用①在机械设备铁路监测技术中的应用。

系统聚类分析课程设计