SPSS的聚类分析实验报告

合集下载

SPSS聚类分析实验报告

SPSS聚类分析实验报告一、实验目的本实验的目的是通过应用SPSS软件进行聚类分析，对样本进行分类和分组，通过群组间的比较来发现变量之间的关系和特征。

通过聚类分析的结果，可以帮助我们更好地理解和解释数据。

二、实验步骤1.数据准备：选择合适的数据集进行分析。

数据集应包含若干个已知变量，以及我们需要进行聚类的目标变量。

2.打开SPSS软件，导入数据集。

3.对数据集进行数据清洗和预处理，包括处理缺失数据、异常值等。

4.进行聚类分析：选择合适的聚类方法和变量，进行聚类分析。

5.对聚类结果进行解释和分析，确定最佳的聚类数目。

6.对不同的聚类进行比较，看是否存在显著差异。

7.结果展示和报告撰写。

三、实验结果及分析在实验过程中，我们选择了学校学生的体测数据作为聚类分析的样本。

数据集共包含身高、体重、肺活量等指标，共有200个样本。

首先，我们进行了数据预处理，包括处理缺失数据和异常值。

对于缺失数据，我们选择用平均值进行填充；对于异常值，我们使用离群值检测方法进行处理。

然后，我们选择了合适的聚类方法和变量，使用K-means聚类算法对样本进行分组。

我们尝试了不同的聚类数目，从2到10进行了分析。

根据轮廓系数和手肘法定量评估了不同聚类数目下聚类效果的好坏。

最终，我们选择了聚类数目为4的结果进行进一步分析。

通过比较不同聚类结果的均值，我们发现不同聚类之间的身高、体重和肺活量等指标存在较大差异。

这说明聚类分析对样本的分类和分组是合理和有效的。

四、实验总结本次实验通过应用SPSS软件进行聚类分析，对样本进行分类和分组，通过群组间的比较来发现变量之间的关系和特征。

通过分析聚类结果，我们发现不同聚类之间存在显著差异，这为进一步研究和探索提供了参考。

聚类分析是一种常用的数据分析方法，可以帮助我们更好地理解和解释数据，对于从大量数据中发现规律和特征具有重要的应用价值。

总之，聚类分析是一种有力的数据分析工具，可以帮助我们更好地理解和解释数据。

SPSS聚类分析实验报告

SPSS聚类分析实验报告一、实验目的本实验旨在通过SPSS软件对样本数据进行聚类分析，找出样本数据中的相似性，并将样本划分为不同的群体。

二、实验步骤1.数据准备：在SPSS软件中导入样本数据，并对数据进行处理，包括数据清洗、异常值处理等。

2.聚类分析设置：在SPSS软件中选择聚类分析方法，并设置分析参数，如距离度量方法、聚类方法、群体数量等。

3.聚类分析结果：根据分析结果，对样本数据进行聚类，并生成聚类结果。

4.结果解释：分析聚类结果，确定每个群体的特征，观察不同群体之间的差异性。

三、实验数据本实验使用了一个包含1000个样本的数据集，每个样本包含了5个变量，分别为年龄、性别、收入、教育水平和消费偏好。

下表展示了部分样本数据：样本编号，年龄，性别，收入，教育水平，消费偏好---------，------，------，------，---------，---------1，30，男，5000，大专，电子产品2，25，女，3000，本科，服装鞋包3，35，男，7000，硕士，食品饮料...，...，...，...，...，...四、实验结果1. 聚类分析设置：在SPSS软件中，我们选择了K-means聚类方法，并设置群体数量为3，距离度量方法为欧氏距离。

2.聚类结果：经过聚类分析后，我们将样本分为了3个群体，分别为群体1、群体2和群体3、每个群体的特征如下：-群体1：年龄偏年轻，女性居多，收入较低，教育水平集中在本科，消费偏好为服装鞋包。

-群体2：年龄跨度较大，男女比例均衡，收入中等，教育水平较高，消费偏好为电子产品。

-群体3：年龄偏高，男性居多，收入较高，教育水平较高，消费偏好为食品饮料。

3.结果解释：根据聚类结果，我们可以看到不同群体之间的差异性较大，每个群体都有明显的特征。

这些结果可以帮助企业更好地了解不同群体的消费习惯，为市场营销活动提供参考。

五、实验结论通过本次实验，我们成功地对样本数据进行了聚类分析，并得出了3个不同的群体。

IBM SPSS MODELER 实验一、聚类分析

IBM SPSS Modeler 实验一、聚类分析在数据挖掘中，聚类分析关注的内容是一些相似的对象按照不同种类的度量构造成的群体。

聚类分析的目标就是在相似的基础上对数据进行分类。

IBM SPSS Modeler提供了多种聚类分析模型，其中主要包括两种聚类分析，K-Mean 聚类分析和Kohonen聚类分析，下面对各种聚类分析实验步骤进行详解。

1、K-Means聚类分析实验首先进行K-Means聚类实验。

（1）启动SPSS Modeler 14.2。

选择“开始”→“程序”→“IBM SPSS Modeler 14.2”→“IBM SPSS Modeler 14.2”，即可启动SPSS Modeler程序，如图1所示。

图1 启动SPSS Modeler程序（2）打开数据文件。

首先选择窗口底部节点选项板中的“源”选项卡，再点击“可变文件”节点，单击工作区的合适位置，即可将“可变文件”的源添加到流中，如图2所示。

右键单击工作区的“可变文件”，选择“编辑”，打开如图3的编辑窗口，其中有许多选项可供选择，此处均选择默认设定。

点击“文件”右侧的“”按钮，弹出文件选择对话框，选择安装路径下“Demos”文件夹中的“DRUG1n”文件，点击“打开”，如图4所示。

单击“应用”，并点击“确定”按钮关闭编辑窗口。

图2 工作区中的“可变文件”节点图3 “可变文件”节点编辑窗口图4 文件选择对话框图5 工作区中的“表”节点（3）借助“表（Table）”节点查看数据。

选中工作区的“DRUG1n”节点，并双击“输出”选项卡中的“表”节点，则“表”节点出现在工作区中，如图5所示。

运行“表”节点（Ctrl+E或者右键运行），可以看到图6中有关病人用药的数据记录。

该数据包含7个字段（序列、年龄(Age)、性别(Sex)、血压(BP)、胆固醇含量(Cholesterol)、钠含量(Na)、钾含量(K)、药类含量(Drug)），共200条信息记录。

SPSS聚类分析实验报告

SPSS聚类分析实验报告摘要：本实验旨在利用SPSS软件进行聚类分析，并通过实验结果分析数据的分布情况，揭示数据中的隐含规律。

通过聚类分析，我们将数据样本划分为不同的类别，以便更好地理解数据的特征、相似性以及群组之间的差异。

实验结果表明，SPSS软件在聚类分析方面具有较高的可靠性和准确性，能够有效地提取数据的特征和隐含信息，为数据分析提供有力支持。

1.引言2.实验方法2.1数据收集与准备本实验使用到的数据集是从公开渠道获取的一份包含各个地区收入、消费、教育等特征的数据集。

为了保护数据安全和隐私，将被分析的数据进行了匿名化处理。

2.2SPSS操作步骤（1）导入数据集：将数据集导入SPSS软件，并进行数据检查和处理，确保数据的完整性和准确性。

（2）选择合适的聚类算法：根据实验目的和数据特点选择适合的聚类算法，这里选择了k-means算法作为聚类算法。

（3）设置聚类参数：设置聚类的类别数、迭代次数等参数，以得到最优的聚类结果。

（4）进行聚类分析：运行聚类分析模块，观察聚类结果和聚类中心的分布情况。

（5）结果解释与分析：根据聚类结果，对不同类别的数据进行特征分析和差异比较，以更好地理解数据的特点和分布规律。

3.实验结果与分析通过SPSS软件进行聚类分析，得到了数据样本的聚类结果。

根据平均轮廓系数和间隔分析等指标，确定了最优的聚类类别数，并得到了每个类别的聚类中心和分布情况。

3.1聚类类别数的确定为了确定合适的聚类类别数，使用平均轮廓系数方法和间隔分析方法进行评估。

通过计算不同聚类类别数下的平均轮廓系数和间隔分析值，选择具有最大平均轮廓系数和最小间隔分析值的类别数作为最优的聚类类别数。

经过计算分析，确定了聚类类别数为33.2聚类结果与分析根据聚类类别数为3的聚类结果，将数据样本分为了三组。

分别对每组数据进行了特征分析和差异比较。

3.2.1类别1：高收入、高教育水平、低消费该类别的个体具有较高的收入水平和教育水平，但消费水平较低。

SPSS19.0之聚类分析

1.1 系统聚类本次实验的系统聚类都是凝聚系统聚类，为了控制变量，都采用平方Euclidean距离。

1.1.1 最短距离聚类法最短距离法聚类步骤如下：1.规定样本间的距离，计算样本两两之间的距离，得到对称矩阵。

开始每个样品自成一类。

2.选择对称矩阵中的最小非零元素。

将两个样品之间最小距离记为D1，将这两个样品归并成为一类，记为G1。

3.计算G1与其他样品距离。

重复以上过程直到所有样品合并为一类。

我们在SPSS中实现最短距离分析非常简单。

单击“”-->“”-->“”。

将弹出如图1-1所示的对话框，设置相应的参数即可。

图1-1 最短距离法我们的数据已经做过标准化，在“转化值”-->“标准化”选项上选无。

在统计量的聚类成员中选择“无”，因为这是非监督分类，不需要指定最终分出的类个数。

在绘制中选择绘制“树状图”。

单击确定，得到以下结果。

聚类表阶群集组合系数首次出现阶群集下一阶群集1 群集 2 群集 1 群集 21 21 28 .211 0 0 102 12 24 .465 0 0 63 2 27 .491 0 0 54 13 20 .585 0 0 95 2 14 .645 3 0 66 2 12 .678 5 2 77 2 7 .702 6 0 88 2 25 .773 7 0 99 2 13 .916 8 4 1110 21 29 1.085 1 0 1211 2 18 1.106 9 0 12表1-2 聚类过程我们可以通过更加形象直观的树状图来观察整个聚类过程和聚类效果。

如图1-2所示，最短距离法组内距离小，但组间距离也较小。

分类特征不够明显，无法凸显各个省份的能源消耗的特点。

但是我们可以看到广东省能源消耗组成和其他省份特别不同，在其他方法中也显现出来。

12 2 21 1.115 11 10 13 13 2 17 1.360 12 0 14 14 2 26 1.564 13 0 15 15 2 22 1.627 14 0 16 16 2 5 1.649 15 0 17 17 2 8 1.877 16 0 18 18 2 16 3.027 17 0 19 19 2 30 3.543 18 0 20 20 2 11 4.930 19 0 21 21 2 4 5.024 20 0 22 22 2 10 6.445 21 0 24 23 1 9 8.262 0 0 26 24 2 15 10.093 22 0 25 25 2 23 10.096 24 0 26 26 1 2 10.189 23 25 27 27 1 6 11.387 26 0 28 28 1 3 13.153 27 0 29 2911932.36728图1-2 最短距离法聚类图1.1.2 组间联接聚类组间联接聚类法定义为两类之间的平均平方距离，即。

SPSS实验报告册

《SPSS统计软件应用》实验报告册20 - 20 学年第学期班级：学号：姓名：授课教师：实验教师：实验学时：实验组号：目录实验一SPSS的数据管理 (3)实验二描述性统计分析 (5)实验三均值检验 (6)实验四相关分析 (7)实验五因子分析 (8)实验六聚类分析 (11)实验七回归分析 (13)实验八判别分析 (14)实验一SPSS的数据管理一、实验目的1．熟悉SPSS的菜单和窗口界面，熟悉SPSS各种参数的设置；2．掌握SPSS的数据管理功能。

二、实验内容及步骤：1、定义spss数据结构。

下表是某大学的一个问卷调查，要求将问卷调查结果表示成spss可识别的数据文件，利用spss软件进行分析和处理。

练习：创建数据文件的结构，即数据文件的变量和定义变量的属性。

表1 大学教师基本情况调查表1.定义spss数据结构。

下表是某大学的一个问卷调查，要求将问卷调查结果表示成spss可识别的数据文件，利用spss软件进行分析和处理。

练习：创建数据文件的结构，即数据文件的变量和定义变量的属性。

实验步骤：（1）、打开定义变量的界面启动SPSS，进入主界面，单击图6-2所示的屏幕左下角的“Variable View”选项卡，打开定义变量的表格。

（2）、输入变量名，符合变量的命名规则在“Name”列的第一个单元格输入第一个变量名，如：“xm”。

（3）、确定变量类型，单击“Type”列的第一个单元格，如图6-3所示，SPSS的默认变量类型为数值型。

单击数值型变量后的“···”，弹出如图6-4所示的对话框，用户可以从该对话框中选择其他的变量类型。

（4）、设置字段值（5）、依次按要求输入完毕即可实验结果：实验分析：本实验，主要是按照要求一步一步来设置条件即可完满完成实验。

2 、高校提前录取名单的确定某高校今年对部分考生采取单独出题、提前录取的招生模式。

现有20名来自国内不同省市的考生报考该校，7个录取名额。

SPSS因子、聚类案例分析报告.doc

SPSS因子、聚类案例分析报告.doc《多元统计分析SPSS》实验报告实验课程：基于 SPSS的数据分析实验地点：现代商贸实训中心实验室名称：经济统计实验室学院：xxx 学院年级专业班： xxx 班学生姓名：xxx 学号： 015完成时间：2016 年 x 月 x 日开课时间：2016 至 2017 学年第 1 学期成绩教师签名批阅日期实验项目：中国上市银行竞争力分析（一）实验目的本实验目的围绕上市商业银行竞争力这一主线，遵循一般理论、具体分析到对策建议的研究思路，以我国国内上市的十家商业银行为研究对象，采用其2012年度财务报告的数据，从盈利能力、安全能力和发展能力三方面共选取了8 个重要指标，试图通过这些指标量化影响竞争力的因素，构建我国上市商业银行的竞争力评价指标体系，并运用因子分析方法，对我国上市商业银行的竞争力状况进行了分析评价。

最后针对分析的结果，通过对我国上市银行竞争力进行优劣势比较，提出了提升我国上市商业银行竞争力的一些建议。

（二）实验资料通过对资产利润率、不良贷款率、资产负债率、资本充足率、每股收益增长率、贷款增长率、存款增长率、总资产增长率等指标的选择分析不同指标在进行因子分析时所考虑的因素是否存在差异，影响我国上市商业银行的竞争力状况的因素与上述指标是否有关。

具体数据如下所示：十家同类型上市商业银行2012 年指标盈利能力安全能力发展能力资产利润资产负债资本充足每股收益贷款增长存款增长总资产增率不良贷款率率率增长率率率长率平安银行% % % % % % % % 浦发银行% % % % % % % % 建设银行% % % % % % % % 中国银行% % % % % % % % 农业银行% % % % % % % % 工商银行% % % % % % % 10% 交通银行% % % % % % % % 招商银行% % % % % % % % 中信银行% % % % % % % % 民生银行% % % % % % % %（三）实验步骤1、选择菜单2、选择参与因子分析的变量到( 变量 V) 框中3、选择因子分析的样本4、在所示窗口中点击（描述D）按钮，指定输出结果，输出基本统计量、图形等5、在所示窗口中点击（抽取E）按钮指定提取因子的方法为：主成分分析法6、在所示的窗口中点击（旋转T）按钮选择因子旋转方法7、在所示窗口中点击（得分S）按钮选择计算因子得分的方法8、在所示窗口中点击（选项）按钮（四）实验结果及分析分析结果如下表所示。

SPSS因子、聚类案例分析报告.doc

喀什大学实验报告《多元统计分析SPSS》实验报告实验课程：基于SPSS的数据分析实验地点：现代商贸实训中心实验室名称：经济统计实验室学院： xxx学院年级专业班： xxx班学生姓名： xxx 学号： XXXX1808015 完成时间： XXXX年x月x日开课时间： XXXX 至 2017 学年第 1 学期实验项目：中国上市银行竞争力分析（一）实验目的本实验目的围绕上市商业银行竞争力这一主线，遵循一般理论、具体分析到对策建议的研究思路，以我国国内上市的十家商业银行为研究对象，采用其XXXX 年度财务报告的数据，从盈利能力、安全能力和发展能力三方面共选取了8个重要指标，试图通过这些指标量化影响竞争力的因素，构建我国上市商业银行的竞争力评价指标体系，并运用因子分析方法，对我国上市商业银行的竞争力状况进行了分析评价。

最后针对分析的结果，通过对我国上市银行竞争力进行优劣势比较，提出了提升我国上市商业银行竞争力的一些建议。

具体数据如下所示：十家同类型上市商业银行XXXX年指标（三）实验步骤1、选择菜单2、选择参与因子分析的变量到(变量V)框中3、选择因子分析的样本4、在所示窗口中点击（描述D）按钮，指定输出结果，输出基本统计量、图形等5、在所示窗口中点击（抽取E）按钮指定提取因子的方法为：主成分分析法6、在所示的窗口中点击（旋转T）按钮选择因子旋转方法7、在所示窗口中点击（得分S）按钮选择计算因子得分的方法8、在所示窗口中点击（选项）按钮（四）实验结果及分析分析结果如下表所示。

相关性矩阵每股收益增长率贷款增长率存款增长率总资产增长率相关性资产利润率.383 -.144 -.404 -.359 不良贷款率-.207 -.025 -.009 -.086资产负债率.563 -.166 .105 .494资本充足率-.479 .357 .044 -.392每股收益增长率 1.000 -.366 -.345 .159贷款增长率-.366 1.000 .922 .551存款增长率-.345 .922 1.000 .738总资产增长率.159 .551 .738 1.000显著性（单尾）资产利润率.137 .346 .124 .154 不良贷款率.283 .472 .490 .407资产负债率.045 .323 .386 .073资本充足率.081 .155 .452 .131每股收益增长率.149 .164 .330贷款增长率.149 .000 .049存款增长率.164 .000 .007总资产增长率.330 .049 .007 通过观察原始变量的相关系数矩阵，可以看到，矩阵中存在许多比较高的相关系数，并且大多数变量通过了原假设为相应变量之间的相关系数为0的t假设。

聚类分析实验报告SPSS

聚类分析实验报告SPSS一、实验目的：1.掌握聚类分析的基本原理和方法；2.了解SPSS软件的使用；3.通过实际数据分析，探索样本数据的聚类结构。

二、实验步骤：1.数据预处理：a.收集并导入样本数据；b.对数据进行初步探索和了解，包括数据描述统计、缺失值处理等；2.聚类分析：a.选择合适的变量进行聚类分析；b.选择聚类算法和相似性度量方法；c.进行聚类分析，得到聚类结果；d.检验聚类结果的稳定性和合理性；3.结果解释：a.对聚类结果进行解释和描述，给出每个聚类的特点和含义；b.使用图表展示聚类结果，以便更直观地理解；c.对聚类结果进行验证和评估，如通过交叉验证等方法；4.结论：a.总结分析结果，给出对样本数据的聚类结构的总体认识；b.提出有关样本数据的进一步探索方向和建议。

三、实验结果与分析：1.数据预处理：样本数据包括了多个变量，我们首先对这些变量进行初步的探索和分析，了解它们的分布情况和特点。

同时，对于缺失值的处理，我们采取了删除或插补的方法，以保证后续分析的准确性和完整性。

2.聚类分析：在选择变量时，我们考虑到了变量之间的相关性，以及对聚类结果的解释性。

通过SPSS软件，我们选择了合适的聚类算法和相似性度量方法，进行了聚类分析。

3.结果解释：根据聚类结果，我们将样本数据划分为多个聚类群组。

对于每个聚类群组，我们进行了详细的解释和描述，给出了其特点和含义。

通过图表的展示，我们能更直观地理解每个聚类群组的分布情况和区别。

4.结论：综合分析结果，我们得出了对样本数据聚类结构的总体认识。

同时，我们提出了进一步探索的方向和建议，以获取更多的知识和信息。

四、实验总结：通过这次实验，我们掌握了聚类分析的基本原理和方法，了解了SPSS软件的使用。

通过实际数据的分析，我们能够更深入地理解样本数据的聚类结构，为进一步的研究和应用提供了基础。

在实验过程中，我们也遇到了一些问题和困难，但通过团队合作和专业指导，我们得以顺利完成实验，并取得了较好的结果。

通过SPSS进行聚类分析

我国各地区农村居民消费结构分析数学B1202 黄晓兰 2012016431一、前言居民消费是实现国民经济良性循环的关键，而消费结构是否合理，又是消费的关键问题，因此居民消费结构作为反映居民消费状况的主要因素。

本文选取了2012年中国31个农村地区居民家庭平均人均消费支出的数据，对其采用SPSS软件进行聚类分析，提出平衡我国城镇居民消费水平、改善城镇居民消费结构、提高城镇居民消费水平的对策建议。

根据2012年中国统计年鉴得到我国各地区农村居民消费支出状况，考虑到各项支出的比重为指标的话，我选取了以下8个变量：食品、衣着、居住、家庭设备及用品、交通通信、文教娱乐、医疗保健及其他来进行分析。

考察消费结构是研究和衡量居民生活水平、生活质量的一条重要途径，可以从侧面反映一个区域宏观经济发展的基本状况。

消费结构是一种客观存在，消费结构的分类则是人们主观的产物。

人们可以根据实际需要对消费结构进行不同的分类。

从其定义上来讲，居民消费结构是指在一定社会经济条件下居民各项消费支出在消费总支出所占的比重，它不但能反映居民消费的具体内容，更能反映居民消费需求的满足情况，近年来随着经济的发展，社会生产力水平迅速提高，人民的生活水平也显著得到提高，消费质量和结构不断优化,相对于过去而言，居民对衣、食、住的消费需求已从追求数量转到追求质量，居民食品支出比重不断下降，而交通通信、文教娱乐、医疗保健及其他比重不断增加。

消费结构变化反映了需求的变动，因此分析消费结构的变动及其成因对合理引导消费、促进经济的发展都有重要的意义。

注：以下数据来源于中国统计年鉴2012年二、数据分析聚类案例处理汇总a,b案例有效缺失总计N 百分比N 百分比N 百分比31 100.0 0 .0 31 100.0a. 平方Euclidean 距离已使用b. 平均联结（组之间）平均联结（组之间）聚类表阶群集组合系数首次出现阶群集下一阶群集 1 群集 2 群集 1 群集 21 12 17 15812.985 0 0 112 29 31 18798.951 0 0 93 3 30 26251.212 0 0 44 3 4 34450.926 3 0 75 24 28 49554.842 0 0 236 7 8 52033.781 0 0 167 3 16 53706.678 4 0 98 14 20 69551.264 0 0 119 3 29 80466.160 7 2 1710 5 6 80937.213 0 0 1611 12 14 85815.099 1 8 1812 21 23 99922.108 0 0 1413 13 19 108425.092 0 0 2714 18 21 152222.417 0 12 1915 22 25 152739.341 0 0 1916 5 7 169054.627 10 6 2217 3 27 186596.903 9 0 1818 3 12 246368.676 17 11 2419 18 22 260667.112 14 15 2520 2 10 325251.759 0 0 2721 1 11 353495.754 0 0 2822 5 15 369923.624 16 0 2423 24 26 381145.245 5 0 2624 3 5 442501.916 18 22 2525 3 18 476733.957 24 19 2626 3 24 861845.040 25 23 2927 2 13 980190.931 20 13 2928 1 9 1063411.550 21 0 3029 2 3 2476743.614 27 26 3030 1 2 7444712.108 28 29 0树状图C A S E 0 5 10 15 20 25Label Num +---------+---------+---------+---------+---------+安徽 12 -+湖北 17 -+江西 14 -+广西 20 -+青海 29 -+-+新疆 31 -+ |河北 3 -+ |宁夏 30 -+ |山西 4 -+ |河南 16 -+ |陕西 27 -+ |吉林 7 -+ |黑龙江 8 -+-+内蒙古 5 -+ +-+辽宁 6 -+ | |山东 15 ---+ |海南 21 -+ | |四川 23 -+ | +-----------+湖南 18 -+-+ | |重庆 22 -+ | |云南 25 -+ | |贵州 24 -+-+ | +-------------------------------+甘肃 28 -+ +-+ | |西藏 26 ---+ | |福建 13 -+-----+ | |广东 19 -+ +---------+ |天津 2 ---+---+ |江苏 10 ---+ |北京 1 ---+---+ |浙江 11 ---+ +-----------------------------------------+上海 9 -------+三、结果分析聚类分析结果如下：类别地区1—经济高度发达地区上海；2—经济发达地区江苏、北京、浙江；3—经济较发达地区福建、广东、天津；4—经济发展一般地区安徽、湖北、江西、广西、青海、新疆、河北、宁夏、山西、河南、陕西、吉林、黑龙江、内蒙古、辽宁、山东、海南、四川、湖南；5—经济发展落后地区西藏、贵州、甘肃、重庆、云南；聚类结果的五大类，基本上是根据区域经济发展环境的相似性相聚成类，并按照发展环境的优越程度由高到低排列的。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

实验报告
姓名学号专业班级
课程名
统计分析SPSS软件实验室
称
成绩指导教师
实验名称SPSS的聚类分析
1、实验目的：
掌握层次聚类分析和K-Means聚类分析的基本思想和具体，并能够对分析结果进行解释。

二、实验题目：
1.、现要对一个班同学的语文水平进行聚类，拟聚为三类，聚类依据是
两次语文考试的成绩。

数据如下表所示。

试用系统聚类法和K-均值法进
行聚类分析。

人名第一次语文成绩第二次语文成绩
张三9998
王五8889
赵四7980
小杨8978
蓝天7578
小白6065
李之7987
马武7576
郭炎6056
刘小100100
3、实验步骤（最好有截图）：
1.先打开常用软件里的SPSS 11.5 for Windows.exe,在Variable View 中根据题目输入相关数据,如下图所示
2.在Data View中先输入数据,结果如下图所示
3. 首先试用系统聚类法对相关数据进行聚类
4. 选择菜单:【Analyze】→【Classify】→【Hierarchical Cluster】，然后选择参与层次聚类分析的变量两次语文考试的成绩到【Variable（s）】框中，再选择一个字符型变量“人名”作为标记变量到【Label Cases by】框中。

5.按“Plots”后进行选择
6.按“Statistics”后进行选择
7.按“Method”后进行选择
8.对第一个表格进行保存，并且命名为“语文水平.sav”，同时保存输出结果
4、实验结果及分析（最好有截图）：
第一题：
1. 首先试用系统聚类法对相关数据进行聚类
2. K-均值法进行聚类分析后的输出结果。