spss中 聚类分析
用SPSS进行聚类分析

实习六、用SPSS进行聚类分析SPSS中进行聚类分析统计分析过程,是由菜单“Analyze”-“Classify”导出的。
选择后显示三个过程命令。
1.K-means Cluster means Cluster过程•进行快速聚类过程,属于非系统聚类法的一种。
方法原理:选择(或人为指定)某些观测作为凝聚点,按就近原则将其余观测向凝聚点凝集,计算出各个初始分类的中心位置(均值),用计算出的中心位置重新进行聚类如此反复循环,直到凝聚点位置收敛为止。
思想:基于使聚类性能指标最小化,所用的聚类准则函数是聚类集中每一个样本点到该类中心的距离平方之和,并使其最小化。
2.Hierarchical Cluster Hierarchical Cluster过程分层聚类方法,进行样本聚类和变量聚类过程,属于系统聚类法的一种。
方法原理:先将所有n个变量/观测看成不同的n类,然后将性质最接近(距离最近)的两类合并为一类,再从这n-1类中找到最接近的两类加以合并。
依此类推,直到所有的变量/观测被合为一类,使用者再根据具体的问题和聚类结果来决定应当分几类。
调用此过程可完成系统聚类分析。
在系统聚类分析中,用户事先无法确定类别数,系统将所有例数均调入内存,且可执行不同的聚类算法。
系统聚类分析有两种形式,一是对研究对象本身进行分类,称为Q型举类;另一是对研究对象的观察指标进行分分层聚类方法类,称为R型聚类。
分层聚类方法是最常用的分类方法。
3.Discriminant过程判别分析过程。
例如:下表是1999年中国省、自治区的城市规模结构特征的一些数据,可通过聚类分析将这些省、自治区进行分类,具体过程如下:省、自治区首位城市规模(万人)城市首位度四城市指数基尼系数城市规模中位值(万人)京津冀699.70 1.4371 0.9364 0.7804 10.880山西179.46 1.8982 1.0006 0.5870 11.780内蒙古111.13 1.4180 0.6772 0.5158 17.775辽宁389.60 1.9182 0.8541 0.5762 26.320吉林211.34 1.7880 1.0798 0.4569 19.705黑龙江259.00 2.3059 0.3417 0.5076 23.480苏沪923.19 3.7350 2.0572 0.6208 22.160浙江139.29 1.8712 0.8858 0.4536 12.670安徽102.78 1.2333 0.5326 0.3798 27.375福建108.50 1.7291 0.9325 0.4687 11.120江西129.20 3.2454 1.1935 0.4519 17.080山东173.35 1.0018 0.4296 0.4503 21.215河南151.54 1.4927 0.6775 0.4738 13.940湖北434.46 7.1328 2.4413 0.5282 19.190湖南139.29 2.3501 0.8360 0.4890 14.250广东336.54 3.5407 1.3863 0.4020 22.195广西96.12 1.2288 0.6382 0.5000 14.340海南45.43 2.1915 0.8648 0.4136 8.730川渝365.01 1.6801 1.1486 0.5720 18.615云南146.00 6.6333 2.3785 0.5359 12.250贵州136.22 2.8279 1.2918 0.5984 10.470西藏11.79 4.1514 1.1798 0.6118 7.315陕西244.04 5.1194 1.9682 0.6287 17.800甘肃145.49 4.7515 1.9366 0.5806 11.650青海61.36 8.2695 0.8598 0.8098 7.420宁夏47.60 1.5078 0.9587 0.4843 9.730新疆128.67 3.8535 1.6216 0.4901 14.470(1)打开数据文件,在spss中可以打开多种类型的文件,如*.xls、*.dbf、*.txt、*.sav等,FILE→OPEN→DATA;(2)进行聚类分析:ANALYZE→CLASSIFY→HIERARCHICAL CLUSTER(此例子中用层次聚类法);进入如下对话框,设置聚类变量,以及采用的聚类方法,是否显示聚类谱系图等(因为采用不同的聚类方法,分类结果不同)。
第九章SPSS的聚类分析

第九章SPSS的聚类分析1.引言聚类分析是一种数据分析方法,用于将相似的对象划分到同一组中,同时将不相似的对象划分到不同的组中。
SPSS是一种常用的统计软件,提供了聚类分析的功能。
本章将介绍SPSS中的聚类分析方法及其应用。
2.数据准备在进行聚类分析之前,需要准备好待分析的数据。
数据应该是定量变量或者定性变量,可以包含多个变量。
如果存在缺失值,需要处理之后才能进行聚类分析。
3.SPSS中的聚类分析方法在SPSS中,聚类分析方法有两种:基于距离的聚类和基于密度的聚类。
基于距离的聚类方法将对象划分到不同的组中,使得组内的对象之间的距离最小,组间的对象之间的距离最大。
常见的基于距离的聚类方法包括单链接聚类、完全链接聚类和平均链接聚类。
基于密度的聚类方法则通过考虑对象周围的密度来划分对象所属的组。
在SPSS中,可以使用层次聚类和K均值聚类这两种方法进行聚类分析。
3.1层次聚类层次聚类又称为分级聚类,它将对象分为一个个的层级,直到每个对象都成为一个单独的组为止。
层次聚类分为两种方法:凝聚层次聚类和分化层次聚类。
凝聚层次聚类是从每个对象作为一个单独的组开始,然后根据对象之间的距离逐渐合并组,直到所有的对象都合并到一个组为止。
凝聚层次聚类的最终结果是一个层级的分组结构,可以根据需要确定分组的层数。
分化层次聚类是从所有的对象开始,然后根据对象之间的距离逐渐分离成不同的组,直到每个对象都成为一个单独的组为止。
在SPSS中,可以使用层次聚类方法进行聚类分析。
通过选择合适的距离度量和链接方法,可以得到不同的聚类结果。
3.2K均值聚类K均值聚类是一种基于距离的聚类方法,通过计算对象之间的距离,将对象分为K个组。
K均值聚类的基本思想是:首先随机选择K个对象作为初始的聚类中心,然后将每个对象分配到离它最近的聚类中心,重新计算聚类中心的位置,直到对象不再发生变化为止。
K均值聚类的结果是每个对象所属的聚类,以及聚类的中心。
在SPSS中,可以使用K均值聚类方法进行聚类分析。
SPSS聚类分析具体操作步骤spss如何聚类

算法步骤:初始 化聚类中心、分 配数据点到最近 的聚类中心、重 新计算聚类中心、 迭代直到聚类中 心不再变化
适用场景:探索 性数据分析、市 场细分、异常值 检测等
注意事项:选择 合适的聚类数目、 处理空值和异常 值、考虑数据的 尺度问题
定义:根据数据点间的距离或相似性,将数据点分为多个类别的过程 常用方法:层次聚类、K-均值聚类、DBSCAN聚类等 适用场景:适用于探索性数据分析,发现数据中的模式和结构 注意事项:选择合适的距离度量方法、确定合适的类别数目等
常见的聚类分析方法包括层次聚类、Kmeans聚类、DBSCAN聚类等。
聚类分析基于数据的相似性或距离度量, 将相似的数据点归为一类,使得同一类 中的数据点尽可能相似,不同类之间的 数据点尽可能不同。
聚类分析广泛应用于数据挖掘、市场细分、 模式识别等领域。
K-means聚类:将数据划分为K个簇,使得每个数据点到所在簇中心的距离之和最小
聚类结果的可视化:通过图表展示聚类结果 聚类质量的评估:使用适当的指标评估聚类效果的好坏 聚类结果的解释:根据实际需求和背景知识,对聚类结果进行合理的解释和解读 聚类结果的应用:探讨聚类结果在各个领域的应用场景和价值
SPSS聚类分析常 用方法
定义:将数据集 划分为K个聚类, 使得每个数据点 属于最近的聚类 中心
聚类结果展示:通过图表或表格展示聚类结果,包括各类别的样本数和占比
聚类质量评估:采用适当的指标评估聚类效果,如轮廓系数、Davies-Bouldin指数等
聚类结果解读:根据业务背景和数据特征,解释各类别的含义和特征 聚类结果应用:说明聚类分析在具体场景中的应用,如市场细分、客户分类等
SPSS聚类分析注 意事项
确定聚类变量:选 择与聚类目标相关 的变量,确保变量 间无高度相关性。
用SPSS进行聚类分析(中文版)

选择聚类方法
根据数据类型和聚类目的选择 合适的聚类方法。常见的聚类 方法有层次聚类、K均值聚类 、DBSCAN聚类等。
层次聚类按照数据点之间的距 离进行层次式的聚类,可以生 成聚类树状图。
K均值聚类将数据点划分为K 个簇,使得每个数据点与其所 在簇的中心点之间的距离之和 最小。
DBSCAN聚类基于密度的聚类 方法,可以发现任意形状的簇 ,并去除噪声点。
03
根据实际需求和应用背景,对聚类结果进行解释和 应用。
03
CATALOGUE
K-means聚类分析
K-means聚类分析的原理
K-means聚类分析是一种无监督学 习方法,通过将数据划分为K个集群 ,使得同一集群内的数据点尽可能相 似,不同集群的数据点尽可能不同。
原理基于距离度量,将数据点分配给 最近的均值(即聚类中心),并不断 迭代更新聚类中心,直到聚类中心收 敛或达到预设的迭代次数。
K-means聚类分析的步骤
选择初始聚类中心
随机选择K个数据点作为初始聚类中心。
分配数据点到最近的聚类中心
根据距离度量,将每个数据点分配给最近的聚类中心。
更新聚类中心
重新计算每个集群的均值,将新的均值作为新的聚类中心。
迭代执行
重复步骤2和3,直到聚类中心收敛或达到预设的迭代次数。
K-means聚类分析的应用实例
系统聚类分析
系统聚类分析的原理
系统聚类分析是一种无监督的统计方法,通过将个体或群体按照其相似性或差异性进行分类,从而揭示数据内在的结构和模 式。
它基于个体间的距离或相似度进行分类,通过不断迭代和合并,最终形成若干个聚类,使得同一聚类内的个体尽可能相似, 不同聚类间的个体尽可能不同。
系统聚类分析的步骤
spss聚类分析

spss聚类分析SPSS是一款广泛使用的统计分析软件,其中包含了聚类分析的功能。
聚类分析是通过对数据进行归类,将数据划分为不同的样本组,并通过比较不同样本组之间的差别,来发现样本之间的联系和规律。
因此,在社会科学研究、医学研究、市场调研等领域都有广泛的应用。
聚类分析的主要目的是通过样本之间的相似性,将样本划分为不同的组别。
这些组别应当具有高度的内聚性和低度的外在性。
通常情况下,聚类分析主要分为两类:基于距离的聚类和基于密度的聚类。
在基于距离的聚类中,样本之间的相似性是通过计算它们之间距离的度量来确定的,而在基于密度的聚类中,相似性是通过样本之间的密度来定义的。
SPSS中的聚类分析可以按照样本之间的相似性和可分性来进行分析。
在分析之前需要确定聚类的样本数量和采用的距离度量。
距离度量可以是欧氏距离、曼哈顿距离、皮尔森相关系数等。
样本数量的确定可以采用层次聚类或K均值聚类等方法。
层次聚类分析将样本逐步合并成越来越大的组别,直到形成一个大的聚类。
这种方法是基于距离的聚类方法,通常使用最短距离法、最长距离法、中间距离法、重心距离法等来确定样本之间的距离。
聚类的结果可以用树状图或热图来进行展示。
另一种方法是K均值聚类,它将样本分成K个组别,使得组内样本之间的距离最小,而组间的距离最大。
该方法采用欧氏距离来衡量样本之间的距离。
在进行K均值聚类分析时,需要确定聚类的数量,可采用手动设置和基于统计指标的自动调整方法等进行确定。
聚类分析的结果可以用样本聚类图、热图和Dendrogram 等方式进行展示。
聚类分析的结果可用来确定样本之间的相似性,进而探究变量之间的关系。
同时,聚类分析也可用于分类问题的解决,对于预测和分类都有重要的应用。
总之,SPSS聚类分析是现代研究中经常采用的一种分析技术,它能够发现数据背后的内在结构,帮助我们更好地理解和处理研究问题。
spss聚类分析方法选择

SPSS聚类分析方法选择一、导言SPSS(Statistical Package for the Social Sciences)是一款被广泛使用的统计分析软件,其功能强大且易于操作。
聚类分析是SPSS中常用的一种数据分析方法,可以将相似的个体归为一类,帮助我们理解数据的结构和特征。
在进行聚类分析时,我们首先需要选择适合的聚类方法。
本文将介绍SPSS中常用的聚类方法,并讨论如何选择最适合的方法。
二、常见的SPSS聚类分析方法1. K均值聚类K均值聚类是SPSS中最常见的聚类方法之一。
该方法将样本分为K个簇,使簇内的样本相似度最大化,簇间的相似度最小化。
K均值聚类需要预先确定簇的个数K,并且聚类结果对初始点的选取敏感。
该方法适用于样本数较大、特征数较少的数据。
2. 密度聚类密度聚类是一种基于密度的聚类方法,常用的有DBSCAN和OPTICS。
这些方法将样本集合中的数据点组成的簇定义为密度相连的点的最大集合。
密度聚类能够有效地处理一些非球形分布的数据,对噪声数据也有较好的鲁棒性。
3. 层次聚类层次聚类使用一种树状结构来组织数据,常用的有凝聚层次聚类和分裂层次聚类。
凝聚层次聚类从单个样本开始,逐步合并最相似的簇,直到形成一个包含所有样本的簇。
分裂层次聚类则从整个样本集开始,逐步将样本分割成小的、不相交的簇。
层次聚类可用于确定最佳的簇的个数,但在处理大型数据集时计算复杂度较高。
4. 二分K均值聚类二分K均值聚类将样本集合分为两个簇,并且分别对每个子簇进行迭代划分,直到满足预定的停止条件。
该方法适用于样本数较大、特征数较多的数据。
三、选择合适的聚类方法在选择SPSS聚类分析方法时,需要根据具体的数据集特点和分析目的进行考虑:1.数据集特点:数据集的样本数、特征数和分布形态对聚类方法的选择有很大影响。
如果样本数较大、特征数较少,并且数据呈现相对均匀的分布,可以选择K均值聚类。
如果数据集存在非球形分布、噪声数据等问题,可以考虑使用密度聚类方法。
SPSS数据的聚类分析

如何实现聚类?
---聚类分析的基本思想和方法
➢ 1、什么是聚类分析?
• 聚类分析: 是根据“物以类聚”的道理,对样品或指 标进行分类,使得同一类中的对象之间的相似性比与其 他类的对象的相似性更强的一种多元统计分析方法。
• 聚类分析的目的:把相似的研究对象归成类;即:使类 内对象的相似性最大化和类间对象的差异性最大化。
2023/5/3
4
zf
以系统聚类法为例
凝聚式
分解式
2023/5/3
5
zf
二、相似性度量
➢ 1、相似性的度量指标:
• 相似系数:性质越接近的变量或样品,它们的相似系数 越接近于1或-1,而彼此无关的变量或样品它们的相似系 数则越接近于0,相似的为一类,不相似的为不同类;
• 距离:变量或样本间的距离越近,说明其相似性越高, 应归为一类;距离越远则说明相似性越弱,应归为不同 的类。
为什么这样 分类?
20有23何/5/好3 处?
因为每一个类别里面的人消费方式都不一样,需要针对不同的 人群,制定不同的关系管理方式,以提高客户对公司商业活动的 参与率。 挖掘有价值的客户,并制定相应的促销策略:对经常购买酸奶 的客户;对累计消费达到12个月的老客户。
针对2潜在客户派发广告,比在大街上乱发传单命中率更高 ,成本z更f 低!
Dpq min d (xi , x j )
2023其/5/中3 ,d(xi,xj)表示点xi∈
Gp和xj
1∈4
zf
Gq之间的距离
以当前某个样本与 已经形成的小类中 的各样本距离中的 最小值作为当前样 本与该小类之间的
距离。
例1:为了研究辽宁省5省区某年城镇居民生活消费的 分布规律,根据调查资料做类型划分
SPSS聚类分析详解

指标 地区(样品) 1
2
3
456
性能
9 1 10
928
颜色
827
946
式样
728
357
用分类法对6个样品进行分类,以估计哪些地区最有可能经销 这类新产品?
按公式计算两两样品间的相似系数,得相似矩阵
Q (Coij) s(qij)
1
2
3
4
5
6
1 1
2 0.933 1
Q=
3
0.994
2)形成一个由小到大的分析系统。 3)把整个分类系统画成一张分类图
二、聚类统计量
首先定义一些分类统计指标 —— 刻画样或指标之间 的相似程度(这些统计指标称为聚类统计量)
在市场研究中,样品 —— 用作分类的事物
指标 —— 用来作为分类依据的变量。(如: 年龄、收入、销售量)
(一)相似系数(夹角余弦)
0.47
X4
0.93
X2
0.68
X7
X5
-0.94
0.49
X8
主要城市日照时数
注:连续变量
SPSS提供不同类间距 离的测量方法
1、组间连接法 2、组内连接法 3、最近距离法 4、最远距离法 5、重心法 6、中位数法 7、Ward最小偏差平 方和法
观测量概述表
聚类步骤,与图结合看!
4、5
输入格式
55列为城市
15位
输出F及t 统计量
平均法 重心法 最小距离法
输出结果:
新类中的观测值数
观测值之间距离的均方根
类间距离除以 观测值间距离 均方根得来
类数
指出被合并的类
F、t**2峰值(起伏)越大 说明分类显著
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
地区总人数(万人)总产值(亿)客运量(万人)货运量(万吨)地方财政预算内收入(万元)固定资产投资总额(万元)城乡居民储蓄存款年末余额(万元)在岗职工平均工资(元)北京 1278 16251.9 145773 24787.56 30062751 58515201 189162355 75834.6 天津996 11307.3 25331 43427.91 14551299 74836973 62060300 55636.3 石家庄997 4082.7 13938 24273.32 2212284 30269778 32435792 35131.8 太原365 2080.1 5194 13542.97 1747179 10241444 27755685 44868.3 呼和浩特232 2177.3 2466 10100.00 1514252 10316781 10536800 42796.9 沈阳723 5915.7 31625 19405.27 6201243 45770940 37294713 45756.5 大连589 6150.6 13724 34942.60 6511266 45800585 36722094 49727.9 长春762 4003.1 13631 13328.25 2886312 23566189 23377846 41471.2 哈尔滨993 4242.2 14837 11431.10 3003190 30119710 28965659 36449.9 上海 1419 19195.7 17755 93134.63 34298318 50642624 162492900 77031.3 南京636 6145.5 43042 35754.66 6350018 37572517 39102037 54711.9 杭州696 7019.1 34778 28831.24 7851524 31000218 55191683 54408.5 宁波576 6059.2 28745 32019.50 6575531 23855072 36962819 49756.4 合肥706 3636.6 29157 29286.86 3385113 33769652 16895435 45442.2 福州649 3736.4 19858 16032.76 3200356 27202827 25507706 42240.1 厦门185 2539.3 13883 11932.06 3707718 11280872 15587417 46413.9 南昌505 2688.9 10396 8843.66 1870259 20223297 16039632 39816.2 济南607 4406.3 15257 25595.43 3254165 19343389 24274843 44004.5 青岛766 6615.6 24582 29183.93 5661400 35025382 31985099 43161.5 郑州 1010 4979.8 33759 24369.47 5023175 30025000 32521450 35755.6 武汉827 6762.2 25743 41803.99 6732600 42551621 40362313 45643.6 长沙657 5619.3 35524 25494.96 4257827 35102425 25269331 44495.2 广州815 12423.4 67756 64132.14 9794800 34122000 100326200 57473.6 深圳268 11505.5 168445 28900.87 13395728 21363882 74276400 55142.2 南宁711 2211.4 11170 24325.70 1862924 19508628 15810297 40118.9 海口162 713.3 34890 9306.50 609319 3950408 8521037 38059.8 重庆 3330 10011.4 141204 96778.47 14883336 75794454 70459901 40042.0 成都 1163 6854.6 99070 34367.90 6806929 49440157 59447689 42363.2 贵阳376 1383.1 38287 13885.91 1870940 16005898 12510372 38673.0 昆明544 2509.6 14855 25338.25 3176893 22755286 26156515 41645.2 拉萨58 222.4 663 441.13 264578 2205031 1782976 55740.3 西安792 3864.2 34335 39239.26 3185486 33521200 41556500 41678.8 兰州323 1360.0 4389 8881.68 864897 9505758 14801626 38968.1 西宁223 770.7 5050 3082.77 452473 5280052 6800622 38443.1 银川162 986.7 3413 11799.81 966202 7205627 7252604 49938.2 乌鲁木齐249 1690.0 4435 16539.50 2295887 4276221 14703412 47177.81.快速聚类初始聚类中心聚类1 2 3总人数(万人) 1277.92 3329.81 57.61 总产值(亿) 16252 10011 222 客运量(万人) 145772.56 141204.00 663.30 货运量(万吨) 24788 96778 441 地方财政预算内收入(万元) 30062751 14883336 264578 固定资产投资总额(万元) 58515201 75794454 2205031189162355 70459901 1782976 城乡居民储蓄存款年末余额(万元)在岗职工平均工资(元) 75835 40042 55740迭代历史记录a迭代聚类中心内的更改1 2 31 1.406E7 3.311E7 2.568E72 .000 1915245.726 1094587.0263 .000 .000 .000a. 由于聚类中心内没有改动或改动较小而达到收敛。
任何中心的最大绝对坐标更改为 .000。
当前迭代为 3。
初始中心间的最小距离为 101713620.897。
最终聚类中心聚类1 2 3总人数(万人) 1348.64 984.94 513.95 总产值(亿) 17724 7996 2988 客运量(万人) 81763.54 62277.57 16451.30 货运量(万吨) 58961 42508 16915 地方财政预算内收入(万元) 32180535 8751294 2637516 固定资产投资总额(万元) 54578913 44706777 18740640城乡居民储蓄存款年末余额175827628 56072712 19845868(万元)在岗职工平均工资(元) 76433 49326 42633ANOVA聚类误差均方df 均方dfF Sig.总人数(万人) 1265040.549 2 254994.657 33 4.961 .013 总产值(亿) 2.558E8 2 4691620.938 33 54.524 .000 客运量(万人) 1.022E10 2 1.155E9 33 8.851 .001 货运量(万吨) 3.514E9 2 2.595E8 33 13.540 .000 地方财政预算内收入(万元) 8.567E14 2 6.674E12 33 128.363 .000 固定资产投资总额(万元) 3.220E15 2 1.682E14 33 19.138 .000 城乡居民储蓄存款年末余额2.454E16 2 1.953E14 33 125.643 .000 (万元)在岗职工平均工资(元) 1.112E9 2 2.942E7 33 37.795 .000 F 检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。
观测到的显著性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。
每个聚类中的案例数聚类 1 2.0002 11.0003 23.000有效36.000缺失.0002.系统聚类案例处理摘要a案例有效缺失合计N 百分比N 百分比N 百分比36 100.0% 0 .0% 36 100.0%a. 平方 Euclidean 距离已使用聚类表阶群集组合系数首次出现阶群集下一阶群集 1 群集 2 群集 1 群集 21 8 15 .133 0 0 102 33 34 .225 0 0 203 25 30 .260 0 0 94 19 22 .276 0 0 145 35 36 .277 0 0 116 4 5 .323 0 0 77 4 16 .353 6 0 118 3 9 .410 0 0 139 18 25 .423 0 3 1610 8 17 .529 1 0 1611 4 35 .529 7 5 2312 11 12 .531 0 0 1913 3 20 .566 8 0 2414 14 19 .566 0 4 1815 7 21 .617 0 0 2116 8 18 .644 10 9 2417 26 29 .691 0 0 2018 14 32 .871 14 0 2219 11 13 .876 12 0 2520 26 33 .934 17 2 2321 6 7 1.115 0 15 2222 6 14 1.288 21 18 2523 4 26 1.361 11 20 2624 3 8 1.556 13 16 2725 6 11 1.803 22 19 2726 4 31 3.058 23 0 2827 3 6 3.072 24 25 2828 3 4 5.610 27 26 3229 2 23 8.418 0 0 3030 2 28 9.231 29 0 3131 2 24 15.196 30 0 3232 2 3 18.060 31 28 3533 1 10 21.772 0 0 3434 1 27 54.680 33 0 3535 1 2 63.383 34 32 0群集成员案例 6 群集 5 群集 4 群集 3 群集1: 北京 1 1 1 12: 天津 2 2 2 23: 石家庄 3 3 2 24: 太原 3 3 2 25: 呼和浩特 3 3 2 26: 沈阳 3 3 2 27: 大连 3 3 2 28: 长春 3 3 2 29: 哈尔滨 3 3 2 210: 上海 4 4 3 111: 南京 3 3 2 212: 杭州 3 3 2 213: 宁波 3 3 2 214: 合肥 3 3 2 215: 福州 3 3 2 216: 厦门 3 3 2 217: 南昌 3 3 2 218: 济南 3 3 2 219: 青岛 3 3 2 220: 郑州 3 3 2 221: 武汉 3 3 2 222: 长沙 3 3 2 223: 广州 2 2 2 224: 深圳 5 2 2 225: 南宁 3 3 2 226: 海口 3 3 2 227: 重庆 6 5 4 328: 成都 2 2 2 2 29: 贵阳 3 3 2 2 30: 昆明 3 3 2 2 31: 拉萨 3 3 2 2 32: 西安 3 3 2 2 33: 兰州 3 3 2 2 34: 西宁 3 3 2 2 35: 银川 3 3 2 2 36: 乌鲁木齐 3 3 2 2。