数据挖掘第五次作业 杨艳
数据挖掘作业讲解

《数据挖掘》作业第一章引言一、填空题(1)数据库中的知识挖掘(KDD)包括以下七个步骤:数据清理、数据集成、数据选择、数据变换、数据挖掘、模式评估和知识表示(2)数据挖掘的性能问题主要包括:算法的效率、可扩展性和并行处理(3)当前的数据挖掘研究中,最主要的三个研究方向是:统计学、数据库技术和机器学习(4)在万维网(WWW)上应用的数据挖掘技术常被称为:WEB挖掘(5)孤立点是指:一些与数据的一般行为或模型不一致的孤立数据二、单选题(1)数据挖掘应用和一些常见的数据统计分析系统的最主要区别在于:(B )A、所涉及的算法的复杂性;B、所涉及的数据量;C、计算结果的表现形式;D、是否使用了人工智能技术(2)孤立点挖掘适用于下列哪种场合?(D )A、目标市场分析B、购物篮分析C、模式识别D、信用卡欺诈检测(3)下列几种数据挖掘功能中,( D )被广泛的应用于股票价格走势分析A. 关联分析B.分类和预测C.聚类分析D. 演变分析(4)下面的数据挖掘的任务中,( B )将决定所使用的数据挖掘功能A、选择任务相关的数据B、选择要挖掘的知识类型C、模式的兴趣度度量D、模式的可视化表示(5)下列几种数据挖掘功能中,(A )被广泛的用于购物篮分析A、关联分析B、分类和预测C、聚类分析D、演变分析(6)根据顾客的收入和职业情况,预测他们在计算机设备上的花费,所使用的相应数据挖掘功能是( B )A.关联分析B.分类和预测C. 演变分析D. 概念描述(7)帮助市场分析人员从客户的基本信息库中发现不同的客户群,通常所使用的数据挖掘功能是( C )A.关联分析B.分类和预测C.聚类分析D. 孤立点分析E. 演变分析(8)假设现在的数据挖掘任务是解析数据库中关于客户的一般特征的描述,通常所使用的数据挖掘功能是( E )A.关联分析B.分类和预测C. 孤立点分析D. 演变分析E. 概念描述三、简答题(1)什么是数据挖掘?答:数据挖掘是指从大量数据中提取或“挖掘”知识。
数据挖掘原理与应用---试题及答案试卷十二答案精选全文完整版

数据挖掘原理与应用 试题及答案试卷一、(30分,总共30题,每题答对得1分,答错得0分)单选题1、在ID3算法中信息增益是指( D )A、信息的溢出程度B、信息的增加效益C、熵增加的程度最大D、熵减少的程度最大2、下面哪种情况不会影响K-means聚类的效果?( B )A、数据点密度分布不均B、数据点呈圆形状分布C、数据中有异常点存在D、数据点呈非凸形状分布3、下列哪个不是数据对象的别名 ( C )A、样品B、实例C、维度D、元组4、人从出生到长大的过程中,是如何认识事物的? ( D )A、聚类过程B、分类过程C、先分类,后聚类D、先聚类,后分类5、决策树模型中应如何妥善处理连续型属性:( C )A、直接忽略B、利用固定阈值进行离散化C、根据信息增益选择阈值进行离散化D、随机选择数据标签发生变化的位置进行离散化6、假定用于分析的数据包含属性age。
数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70。
问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。
第二个箱子值为:( A )A、18.3B、22.6C、26.8D、27.97、建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务?( C )A、根据内容检索B、建模描述C、预测建模D、寻找模式和规则8、如果现在需要对一组数据进行样本个体或指标变量按其具有的特性进行分类,寻找合理的度量事物相似性的统计量,应该采取( A )A、聚类分析B、回归分析C、相关分析D、判别分析9、时间序列数据更适合用( A )做数据规约。
A、小波变换B、主成分分析C、决策树D、直方图10、下面哪些场景合适使用PCA?( A )A、降低数据的维度,节约内存和存储空间B、降低数据维度,并作为其它有监督学习的输入C、获得更多的特征D、替代线性回归11、数字图像处理中常使用主成分分析(PCA)来对数据进行降维,下列关于PCA算法错误的是:( C )A、PCA算法是用较少数量的特征对样本进行描述以达到降低特征空间维数的方法;B、PCA本质是KL-变换;C、PCA是最小绝对值误差意义下的最优正交变换;D、PCA算法通过对协方差矩阵做特征分解获得最优投影子空间,来消除模式特征之间的相关性、突出差异性;12、将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( C )A、频繁模式挖掘B、分类和预测C、数据预处理D、数据流挖掘13、假设使用维数降低作为预处理技术,使用PCA将数据减少到k维度。
数据挖掘概念与技术原书第3版课后练习题含答案

数据挖掘概念与技术原书第3版课后练习题含答案前言《数据挖掘概念与技术》(Data Mining: Concepts and Techniques)是一本经典的数据挖掘教材,已经推出了第3版。
本文将为大家整理并提供第3版课后习题的答案,希望对大家学习数据挖掘有所帮助。
答案第1章绪论习题1.1数据挖掘的基本步骤包括:1.数据预处理2.数据挖掘3.模型评价4.应用结果习题1.2数据挖掘的主要任务包括:1.描述性任务2.预测性任务3.关联性任务4.分类和聚类任务第2章数据预处理习题2.3数据清理包括以下几个步骤:1.缺失值处理2.异常值检测处理3.数据清洗习题2.4处理缺失值的方法包括:1.删除缺失值2.插补法3.不处理缺失值第3章数据挖掘习题3.1数据挖掘的主要算法包括:1.决策树2.神经网络3.支持向量机4.关联规则5.聚类分析习题3.6K-Means算法的主要步骤包括:1.首先随机选择k个点作为质心2.将所有点分配到最近的质心中3.重新计算每个簇的质心4.重复2-3步,直到达到停止条件第4章模型评价与改进习题4.1模型评价的方法包括:1.混淆矩阵2.精确率、召回率3.F1值4.ROC曲线习题4.4过拟合是指模型过于复杂,学习到了训练集的噪声和随机变化,导致泛化能力不足。
对于过拟合的处理方法包括:1.增加样本数2.缩小模型规模3.正则化4.交叉验证结语以上是《数据挖掘概念与技术》第3版课后习题的答案,希望能够给大家的学习带来帮助。
如果大家还有其他问题,可以在评论区留言,或者在相关论坛等平台提出。
《数据挖掘》A卷

一、填空题:(每题6分, 共30分)1. 数据挖掘的主要问题包括:。
2. 数据挖掘的性能问题包括:。
3. 数据挖掘的分类方法有。
4. 数据挖掘的聚类方法有。
5.数据挖掘的基本步骤是。
二、问答题: (每题6分,共30分)1.对于类特征化,基于数据立方体的实现与诸如面向属性归纳的关系实现之间的主要不同是什么?讨论哪种方法最有效,在什么条件下最有效。
2.数据仓库和数据库有何不同?它们有那些相似之处?3.在现实世界的数据中,元组在某些属性上缺少值是常有的。
描述处理该问题的各种方法。
4. 试述对于多个异种信息源的集成,为什么许多公司宁愿使用更新驱动的方法,而不愿使用查询驱动的方法。
5.为什么说强关联规则不一定都是有趣的,举例说明。
三、证明题(10分)1.证明频繁集的所有非空子集必须也是频繁的。
2.Apriori的一种变形将事务数据库D中的事务划分为个不重叠的部分。
证明在D中是频繁的任何项集至少在D中的一个部分中是频繁的。
四、算法分析与扩展(15分)1 .描述判定树算法的思想。
2.写出比较易懂的算法伪代码3.指出算法的不足之处,应该从哪些方面增强算法的功能和性能。
五、计算题(15分)给定两个对象,分别用元组(22,1,42,10),(20,0,36,8)表示。
1.计算两个对象之间的欧几里德距离;2.计算两个对象之间的蔓哈坦距离;3.给定年龄变量的如下度量值18,22,25,42,28,43,33,35,56,28计算age的平均绝对偏差。
一、填空题:(每题6分, 共30分)1.数据挖掘是一个多学科领域,这些学科包括:数据库系统、统计学、机器学习、可视化、信息科学。
2.数据挖掘的功能有特征化和区分、关联分析、分类和预测、聚类分析、孤立点分析、演变分析。
3.数据挖掘的分类方法有判定树算法,贝叶斯方法,神经网络,K-最近邻分类,基于案例的推理,遗传算法,粗糙集方法,模糊集方法等。
4.数据挖掘的聚类方法有划分方法、层次的方法、基于密度的方法、基于网格的方法、基于模型的方法。
(完整版)数据挖掘概念课后习题答案

(完整版)数据挖掘概念课后习题答案第 1 章1.6 定义下列数据挖掘功能:特征化、区分、关联和相关分析、预测聚类和演变分析。
使⽤你熟悉的现实⽣活的数据库,给出每种数据挖掘功能的例⼦。
特征化是⼀个⽬标类数据的⼀般特性或特性的汇总。
例如,学⽣的特征可被提出,形成所有⼤学的计算机科学专业⼀年级学⽣的轮廓,这些特征包括作为⼀种⾼的年级平均成绩(GPA:Grade point a ve r s ge) 的信息,还有所修的课程的最⼤数量。
区分是将⽬标类数据对象的⼀般特性与⼀个或多个对⽐类对象的⼀般特性进⾏⽐较。
例如,具有⾼GPA 的学⽣的⼀般特性可被⽤来与具有低GPA 的⼀般特性⽐较。
最终的描述可能是学⽣的⼀个⼀般可⽐较的轮廓,就像具有⾼GPA 的学⽣的75%是四年级计算机科学专业的学⽣,⽽具有低GPA 的学⽣的65%不是。
关联是指发现关联规则,这些规则表⽰⼀起频繁发⽣在给定数据集的特征值的条件。
例如,⼀个数据挖掘系统可能发现的关联规则为:m a j or(X,“c omput i ng s c i e nc e”) ?owns(X, “pe r s ona l c omput e r”)[s uppor t=12%,c on f i d e nc e=98%]其中,X 是⼀个表⽰学⽣的变量。
这个规则指出正在学习的学⽣,12%(⽀持度)主修计算机科学并且拥有⼀台。
个⼈计算机。
这个组⼀个学⽣拥有⼀台个⼈电脑的概率是98%(置信度,或确定度)分类与预测不同,因为前者的作⽤是构造⼀系列能描述和区分数据类型或概念的模型(或,⽽后者是建⽴⼀个模型去预测缺失的或⽆效的、并且通常是数字的数据值。
它们的功能)相似性是他们都是预测的⼯具:分类被⽤作预测⽬标数据的类的标签,⽽预测典型的应⽤是预测缺失的数字型数据的值。
聚类分析的数据对象不考虑已知的类标号。
对象根据最⼤花蕾内部的相似性、最⼩化类之间的相似性的原则进⾏聚类或分组。
形成的每⼀簇可以被看作⼀个对象类。
大数据分析与挖掘课后习题参考答案

(2)使用等宽划分时,将其划分为四个箱,16 在第几个箱?
(3)利用等深分箱法,将其划分为 3 个箱,平均值平滑法进行平滑处理,第
2 个箱的取值为多少?
(4)利用等宽分箱法,将其划分为 3 个箱,边界平滑法进行平滑处理,第 2
个箱内数据值为多少?
数据清洗:负责解决填充空缺值、识别孤立点、去掉噪声和无关数据等问
题;
数据集成:负责解决不同数据源的数据变换:将原始数据转换为适合数据挖掘的形式。包括数据的汇总、聚
集、概化、规范化,同时可能需要对属性进行重构;
数据归约:负责搜小数据的取值范围,使其更适合数据挖掘算法的需要。
df=spark.createDataFrame([(Vectors.dense(3.2,1.78,130,6000),),
(Vectors.dense(3.5,1.76,122,7000),),
(Vectors.dense(3,1.73,135,5500),),
(Vectors.dense(2.8,1.80,120,4000),),
model.transform(df).show()
print('MinMax')
miScaler=MinMaxScaler(inputCol='Features',outputCol='Feature_MinMax')
model_=miScaler.fit(df)
model.transform(df).show()
7000
3
3
1.73
135
5500
4
2.8
1.80
120
南开大学《数据挖掘》在线作业5

《数据挖掘》在线作业( )很费时,并且当数据集很大、缺失很多值时,该方法可能行不通。
A:人工填写缺失值方法B:全局常量填充C:自动填充D:删除参考选项:A数据仓库和OLAP工具基于多维数据模型。
该模型将数据看作( )形式。
A:数据立方体(data cube)B:整数C:离散D:不同参考选项:ADBSCAN在最坏情况下的时间复杂度是( )。
A:O(m)B:O(m2)C:O(log m)D:O(m*log m)参考选项:B( )可以用来把数据变换到多个粒度层。
例如,关于销售的数据挖掘模式除了在单个分店挖掘之外,还可以针对指定的地区或国家挖掘。
A:概念分层B:聚类C:数据变换D:数据归约参考选项:A以下属于可伸缩聚类算法的是( )。
A:CUREB:DENCLUEC:CLIQUED:OPOSSUM参考选项:A只有非零值才重要的二元属性被称作( )。
A:计数属性B:离散属性C:非对称的二元属性D:对称属性参考选项:C( )用替代的、较小的数据表示形式替换原数据。
A:维归约B:数量归约C:离散D:聚集参考选项:B下列( )不是将主观信息加入到模式发现任务中的方法。
A:与同一时期其他数据对比B:可视化C:基于模板的方法D:主观兴趣度量参考选项:A( )是KDD。
A:数据挖掘与知识发现B:领域知识发现C:文档知识发现D:动态知识发现参考选项:A( )通常以可变长度的字节串存储,并且为便于数据的引用,数据片段要相互链接或建立多维方式的索引。
A:文本数据B:多媒体数据C:时间数据D:空间数据参考选项:B设X={1,2,3}是频繁项集,则可由X产生( )个关联规则。
A:4B:5C:6D:7参考选项:C假定用于分析的数据包含属性age。
数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46 ,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。
数据挖掘大作业例子

数据挖掘大作业例子1. 超市购物数据挖掘呀!想想看,如果把超市里每个顾客的购买记录都分析一遍,那岂不是能发现很多有趣的事情?比如说,为啥周五晚上大家都爱买啤酒和薯片呢,是不是都打算周末在家看剧呀!2. 社交媒体情感分析这个大作业超有意思哦!就像你能从大家发的文字里看出他们今天是开心还是难过,那简直就像有了读心术一样神奇!比如看到一堆人突然都在发伤感的话,难道是发生了什么大事情?3. 电商用户行为挖掘也很棒呀!通过分析用户在网上的浏览、购买行为,就能知道他们喜欢什么、不喜欢什么,这难道不是很厉害吗?就像你知道了朋友的喜好,能给他推荐最适合的礼物一样!4. 交通流量数据分析呢!想象一下,了解每个路口的车流量变化,是不是就能更好地规划交通啦?难道这不像是给城市的交通装上了一双明亮的眼睛?5. 医疗数据挖掘更是不得了!能从大量的病例中找到疾病的规律,这简直是在拯救生命啊!难道这不是一件超级伟大的事情吗?比如说能发现某种疾病在特定人群中更容易出现。
6. 金融交易数据挖掘也超重要的呀!可以知道哪些交易有风险,哪些投资更靠谱,那不就像有个聪明的理财顾问在身边吗!就好比能及时发现异常的资金流动。
7. 天气数据与出行的结合挖掘也很有趣呀!根据天气情况来预测大家的出行选择,真是太神奇了吧!难道不是像有了天气预报和出行指南合二为一?8. 音乐喜好数据挖掘呢!搞清楚大家都喜欢听什么类型的音乐,从而能更好地推荐歌曲,这不是能让人更开心地享受音乐吗!好比为每个人定制了专属的音乐播放列表。
9. 电影票房数据挖掘呀!通过分析票房数据就能知道观众最爱看的电影类型,这不是超厉害的嘛!就像知道了大家心里最期待的电影是什么样的。
我觉得数据挖掘真的太有魅力了,可以从各种看似普通的数据中发现那么多有价值的东西,真是让人惊叹不已啊!。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
d4(3,9.5) d5(6.5,5.25) d6(1.5,3.5)
A1(2,10)
1.12
6.54
6.52
A2(2,5)
4.61
4.51
1.58
A3(8,4)
7.43
3.13
6.52
B1(5,8)
2.5
3.13
5.70
B2(7,5)
6.02
0.56
5.70
B3(6,4)
6.26
1.35
4.53
C1(1,2)
2、 假设数据挖掘的任务是将如下8个点(用(xy)代表位置)聚类为 三个簇:A1(2,10),A2(2,5),A3(8,4),B1(5,8), B2(7,5),B3(6,4),C1(1,2),C2(4,9),距离函数是欧几 里得距离。假设初始选择A1,B1和C1分别为每个聚类的中心,用K-平
均算法来给出: (1)在第一次循环执行后的三个聚类中心。 (2)最后的三个簇。 解:(1)由题意整理得表格如图:
3 1 4.12 2.24 0
由表格比较Pi到P7和P10的距离,将距离小的归属于与其临近的簇中心 类,则:
P1 、P2 、P4 、P5 、P7 、P8 可以归属于以P7为簇中心的一类,而P3、 P6、P9、P10可以归属于P10为簇中心的一类;从新计算簇中心 Dx1=(3+3+4+3+4+4)/6=3.5,Dy1=(4+6+7+8+5+1)/6=5.17;Dx2= (7+8+7+5)/4=6.75,Dy2=(3+5+4+5)/4=4.25;得到新的族中心d0(3.5, 5.17),d1(6.75,4.25); (2) 以d0(3.5,5.17),d1(6.75,4.25)为族中心,重新计算得:
所以第一次循环后的簇中心为:d1(2,10),d2(6,6),d3(1.5, 3.5);
(2)根据(1)继续计算: 以d1(2,10),d2(6,6),d3(1.5,3.5)为新的簇中心,重新计算得:
d1(2,10)
d2(6,6) d3(1.5,3.5)
A1(2,10)
0
5.66
6.52
A2(2,5)
P
d0 (3.5,5.17)
d1 (6.75,4.25)
P1 (3,
1.27
3.76
4)
0.97
4.14
P2 (3,
4.12
1.27
6)
1.90
3.89
P3 (7,
2.87
5.30
3)
4.50
1.46
P4 (4,
0.53
2.85
7)
4.20
4.26
P5 (3 ,
3.50
0.35
8)
1.51
1.90
P6 (8,
3.61
0
B2(7,5)
7.07
3.61
B3(6,4)
7.21
4.12
C1(1,2)
8.06
7.21
C2(4,9)
2.24
1.41
C1(1,2)
8.06 3.16 7.28 7.21 6.71 5.39 0 7.62
由表格比较可以得到:A1可以归属于以A1为簇中心的一类;A3,B1, B2,B3,C2可以归属于以B1为簇中心的一类;A2,C1可以归属于以 C1为簇中心的一类;从新计算簇中心: Dx1=2/1=2,Dy1=10/1=10;Dx2=(8+5+7+6+4)/5=6,Dy2= (4+8+5+4+9)/5=6;Dx3=(2+1)/2=1.5,Dy3=(5+2)/2=3.5;得到新的簇中 心d1(2,10),d2(6,6),d3(1.5,3.5);
7.76
6.39
1.58
C2(4,9)
1.12
4.51
6.04
由表格比较可以得到:A1、C2可以归属于以d7为簇中心的一类;A3, B1,B2,B3可以归属于以d8为簇中心的一类;A2,C1可以归属于以d9 为簇中心的一类;从新计算簇中心: Dx7=(2+4)/2=3,Dy7=(10+9)/2=9.5;Dx8=(8+5+7+6)/4=6.5, Dy8=(4+8+5+4)/4=5.25;Dx9=(2+1)/2=1.5,Dy9=(5+2)/2=3.5;得到新 的簇中心d7(3,9.5),d8(6.5,5.25),d9(1.5,3.5);
,计算出Pi到P7和P10的距离为:
P
P7 (4,5)
P1 (3,
1.41
4)
1.41
P2 (3,
3.61
6)
2
P3 (7,
3.16
3)
4
P4 (4,
0
7)
4
P5 (3 ,
3.16
8)
1
P6 (8,
5)
P7 (4,
5)
P8 (4 ,
1)
P9 (7,
4)
P10 (5,
5)
P10 (5,5)
2.24 2.24 2.83 2.24 3.61
因为d4与d7为同一点,d5与d8为同一点,d6与d9为同一点,即簇中心 没有发生变化,所以最后得到三个簇:
以d4(3,9.5)为簇中心的类:A1、C2 以d5(6.5,5.25)为簇中心的类:A3,B1,B2,B3 以d6(1.5,3.5)为簇中心的类:A2,C1
5
4.12
1.58
A3(8,4)
8.49
2.83
6.52
B1(5,8)
3.61
2.24
5.70
B2(7,5)
7.07
1.41
5.70
B3(6,4)
7.21
2
4.53
C1(1,2)
8.06
6.40
1.58
C2(4,9)
2.24
3.61
6.04
由表格比较可以得到:A1、C2可以归属于以d1为簇中心的一类;A3, B1,B2,B3可以归属于以d2为簇中心的一类;A2,C1可以归属于以d3 为簇中心的一类;从新计算簇中心: Dx4=(2+4)/2=3,Dy4=(10+9)/2=9.5;Dx5=(8+5+7+6)/4=6.5, Dy5=(4+8+5+4)/4=5.25;Dx6=(2+1)/2=1.5,Dy6=(5+2)/2=3.5;得到新 的簇中心d4(3,9.5),d5(6.5,5.25),d6(1.5,3.5); 以d4(3,9.5),d5(6.5,5.25),d6(1.5,3.5)为新的簇中心,重新计 算得:
K-means 算法
1、 对一个二维数据,使用K-means算法将其划分为2个簇,假 设簇中心选为P7(4,5),P10(5,5)。表格如图: P P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 x3 3 7 4 3 8 4 4 7 5 y4 6 3 7 8 5 5 1 4 5
解:(1)根据欧几里得计算公式:
A1 A2 A3 B1 B2 B3 C1 C2
X2
2
8
5
7
6
1
4
y 10 5
4
8
5
4
2
9
①将距离小的归属于与其临近的簇中心类,根据欧几里得公式:
,计算各点到A1,B1和C1的距离为:
A1(2,10)
B1(5,8)
A1(2,10)
0
3.61
A2(2,5)
5
4.24
A3(8,4)
8.49
5
B1(5,8)
5)
P7 (4,
5)
P8 (4 ,
1)
P9 (7,
4)
P10 (5,
5)
由表格比较得到:P1 、P2、P4 、P5 、P7、P8、P10 可以归属于以d0为 簇中心的一类,而P3、P6、P9可以归属于以d1为簇中心的一类;从新计 算簇中心Dx2=(3+3+4+3+4+4+5)/7=3.71, Dy2=(4+6+7+8+5+1+5)/7=5.14;Dx2=(7+8+7)/3=7.33,Dy2= (3+5+4)/3=4;得到新的族中心d3(5.2,5.14),d4(7.33,4); (3) 以d3(3.71,5.14),d4(7.33,4)为簇中心,重新计算得:
5)
P7 (4,
5)
P8 (4 ,
1)
P9 (7,
4)
P10 (5,
5)
由表格比较得到:P1 、P2、P4 、P5 、P7、P8、P10 可以归属于以d3为 簇中心的一类,而P3、P6、P9可以归属于以d4为簇中心的一类;从新计 算簇中心 Dx3=(3+3+4+3+4+4+5)/7=3.71,Dy3=(4+6+7+8+5+1+5)/7=5.14; Dx4=(7+8+7)/3=7.33,Dy4=(3+5+4)/3=4;得到新的族中心d5(3.71, 5.14),d6(7.33,4); 因为簇中心d5和d3为同一点,d6和d4为同一点,即簇中心没有发生变 化,所以得到两个类: 以(3.71,5.14)为簇中心的类: P1 、P2、P4 、P5 、P7、P8、P10 以(7.33,4)为簇中心的类:P3、P6、P9