SPSS的综合运用——以我国城市空气质量分析为例
spss的综合运用——以我国城市空气质量分析为例

spss的综合运用——以我国城市空气质量分析为例SPSS(统计产品和服务解决方案)是一种广泛使用的统计分析软件,它可以用于数据处理、数据分析和预测建模等任务。
在我国城市空气质量分析中,可以利用SPSS进行如下几个方面的综合运用:1. 数据清洗和整理:首先需要收集城市空气质量相关的数据,包括空气质量指数(AQI)和各个监测点的相关数据。
然后,使用SPSS进行数据清洗和整理,剔除异常值和缺失值,以确保数据的准确性和完整性。
2. 描述性统计分析:利用SPSS可以计算各个城市的平均空气质量指数、标准差等统计指标,以及绘制相关统计图表,如柱状图、折线图等,以便对不同城市的空气质量进行比较和描述。
3. 相关性分析:使用SPSS可以进行相关性分析,以了解不同因素与空气质量之间的关系。
可以计算不同污染物浓度(如PM2.5、PM10、O3等)与空气质量指数的相关系数,并进行显著性检验,以确定是否存在显著的相关关系。
4. 回归分析:通过回归分析可以探究不同变量对空气质量的影响程度。
可以使用SPSS进行多元线性回归分析,建立空气质量指数与污染物浓度、气象因素等多个自变量之间的关系模型,并进行参数估计和显著性检验。
5. 聚类分析:可以使用SPSS进行聚类分析,将城市按空气质量指数和污染物浓度等因素进行分类,以便对城市进行对比和评估。
聚类分析可以帮助发现城市之间的差异,并为进一步的空气质量改善提供参考。
6. 时间序列分析:通过分析历史数据,利用SPSS进行时间序列分析,可以揭示城市空气质量的长期趋势和季节性变化,帮助预测未来的空气质量状况,以及制定相应的政策和措施。
SPSS在我国城市空气质量分析中的综合运用可以包括数据清洗和整理、描述性统计分析、相关性分析、回归分析、聚类分析和时间序列分析等方面,这些分析结果可以为了解和改善城市空气质量提供科学依据。
SPSS的综合运用——以我国城市空气质量分析为例

SPSS的综合运用——以我国城市空气质量分析为例年欢管理科学与工程 2013200644(一)实验目的近年来随着现代化和工业化的进程,我国大气污染状况十分严重,主要呈现煤烟型污染特征,城市大气环境中总悬浮颗粒浓度普遍超标、二氧化硫污染保持在较高水平、机动车尾气污染物排放总量迅速增加、氮氧化物污染趋势加重、全国形成多个酸雨区等,危害生态环境、影响人民群众身体健康。
从污染物构成来看,我国大气污染来源主要有三个方面:一是生活污染源,包括饮食或取暖时燃料向大气排放有害气体和烟雾;二是工业污染源,包括火力发电、钢铁和有色金属冶炼,各种化学工业给大气造成的污染;三是交通污染源,包括汽车、飞机、火车、船舶等交通工具的煤烟、尾气排放。
本文通过聚类分析和主成分分析法,研究我国主要城市的空气质量,以及各参数对空气质量好坏的影响以及最主要的影响因素。
并据此提出科学合理的对策建议。
(二)问题描述在2013年之前,大部分人对于雾霾天气的认知都会自然而然觉得是北京的事。
然而,12月伊始,我国遭受了入冬以来最大范围雾霾天气,今年12月伊始,我国中东部地区迎来了严重雾霾事件,几乎涉及中东部所有地区。
天津、河北、山东、江苏、安徽、河南、浙江、上海等多地空气质量指数达到六级严重污染级别,使得京津冀与长三角雾霾连成片。
由于能见度过低,导致多处高速公路封道关闭,给车辆出行带来了不便,也严重影响了市民的正常工作与生活。
(三)数据来源通过查询“中华人民共和国国家统计局官方网站”的“国家统计数据库”,《中国统计年鉴》获得。
(四)案例中使用的SPSS方法1.描述性分析2.相关分析3.聚类分析4.主成分分析(五)实验内容与步骤1.城市空气质量因素的描述性统计本实验对城市空气质量的可吸入颗粒物、二氧化硫、二氧化氮、空气质量达到及好于二级的天数、年平均气温和年平均相对湿度六项影响空气质量的因素做描述性统计分析,包括频数、极小值、极大值、均值和标准差五个项目,见表1.1。
城市空气质量调研分析

城市空气质量调研分析作为一个生活在繁忙都市的人,我深刻地意识到空气质量对我们生活的重要性。
因此,我决定对我国城市的空气质量进行一次详细的调研分析。
我收集了我国不同城市的空气质量数据,包括PM2.5、PM10、SO2、NO2等指标。
通过对比分析,我发现我国东部沿海城市的空气质量普遍优于中西部城市。
这主要是因为东部沿海城市的经济发展较为成熟,环保意识较强,同时也有更多的资源和资金投入到环保事业中。
我关注了城市空气质量的变化趋势。
在过去几年中,尽管我国政府采取了一系列措施来改善空气质量,但某些城市的空气质量仍然不容乐观。
尤其是在冬季,受取暖需求的影响,空气质量指数(AQI)经常爆表。
这说明我们还需要在减少污染物排放、提高环保设施效率等方面下更大的功夫。
在调研过程中,我还发现了一些值得关注的现象。
例如,一些城市在空气质量改善方面取得了显著成效,其主要原因在于政府高度重视、企业积极履行社会责任、市民环保意识增强等多方面因素的共同作用。
而那些空气质量较差的城市,往往存在着政府监管不力、企业违法排污、市民环保意识薄弱等问题。
我还对城市空气质量与经济发展之间的关系进行了探讨。
结果显示,在一定范围内,经济发展水平与空气质量之间存在正相关关系。
但在达到一定程度后,空气质量的改善将需要更多的环保投入和科技创新。
因此,如何在保证经济发展的同时,实现空气质量的持续改善,是我们需要认真思考的问题。
我收集了我国不同城市的空气质量数据,包括PM2.5、PM10、SO2、NO2等指标。
通过对比分析,我发现我国东部沿海城市的空气质量普遍优于中西部城市。
这让我感到有些意外,因为通常我们会认为经济发展程度越高的地区,空气质量应该越差。
但事实并非如此,这主要是因为东部沿海城市的经济发展较为成熟,环保意识较强,同时也有更多的资源和资金投入到环保事业中。
我关注了城市空气质量的变化趋势。
在过去几年中,尽管我国政府采取了一系列措施来改善空气质量,但某些城市的空气质量仍然不容乐观。
应用spss软件包对我国环境污染的因子分析

因子分析是多元统计的一个分支 。它研究很多变 量的内部依存关系 , 把众多的变量综合成几个少数的 因子 。因子分析产生在世纪初期 , 当时由心理学家在 实际研究中提出的 , 在此后的三四十年中 , 因子分析 的理论逐渐发展成熟 。后来随着计算机的发展和普 及 , 终于成为一种应用广泛的统计分析方法 。在 SPSS 中提供了很多种常见的因子分析方法 , 我们就以一个 实际的例子来具体说明如何使用 SPSS 进行因子分析 。
应用 SPSS 软件包对我国环境污染的因子分析
吴 静 其木格 于洪文
□信息现代化
《内蒙古统计》2000 年第 5 期
© 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
— 37 —
地 区 北 京 பைடு நூலகம் 津 河 北 山 西 内蒙古 辽 宁 吉 林 黑龙江 上 海 江 苏 浙 江 安 徽 福 建 江 西 山 东 河 南 湖 北 湖 南 广 东
41 练好 “内功”是脱困的根本 。企业是脱困的 主体 , 是 “内因 ,” 因此 , 按照现代企业制度的要求 运作 , 强化管理 , 苦练 “内功 ,” 是国有企业走出困 境的根本出路 。要坚持不懈地深化企业改革 , 从体制 上 、机制上消除造成企业亏损的弊端 , 彻底转变经营 机制 。无论是已脱困的企业还是未脱困的企业 , 都必 须从有利于企业持续 、健康 、稳定发展的大原则出 发 , 把脱困工作与经济结构调整 、企业技术进步和现 代企业制度建设密切结合起来 , 在完成脱困任务的同 时 , 带动产业优化升级 。
x5 152
1 269 1725 115 437 21
Spss分析报告范例

研究的目的和意义
在经济高速增长的同时,也应该看到,这种高投入驱动的粗放 型的经济增长方式资源消耗大,无疑会给环境造成很大的压力。 从一定意义上来说,经济水平的提高和物质享受的增加,在很 大程度上是以牺牲环境与消耗资源为代价的,并由此产生了各 种生态问题,随着改革开放和经济的高速发展,对四川省的生 态质量作出科学合理的研究显得尤为重要。因此,本案例运用 因子分析,综合比较分析了四川省各地区的生态环境质量状况 及存在的主要问题,在此基础上提出建议和意见。
本案例建立了生态质量管理评价指标体系,选取经济环境
协调度、社会环境协调度、生态环境保护三大系统构成一
级指标,进而选择代表性强,易于量化的参数即人均GDP、
人均工业总产值、教育投资额、城镇化率、环境污染治理
投资总额、工业废水排放量、工业废物综合利用率、人均
公共绿地面积等八个指标作为指标层构成评价指标体系。
研究区域概况
四川省是中国西部地域辽阔、资源丰富、人口众多的一个多民族聚居的内陆大 省,以富饶的物产,秀美的山川,富足的生活被世人誉为“天府之国”。
截至2012年5月31日,四川省管辖1个副省级市(成都市)、17个地级市、3个自 治州。
四川省统计局召开新闻发布会通报2011年度四川地区的经济运行数据显示, 2011年,全省地区生产总值(GDP)突破2万亿元,达到21026.7亿元,增长 15.0%,增幅比全国平均水平高5.8个百分点。同时,初步审定,2011年除成都 市以外,绵阳、德阳、宜宾、南充、达州、凉山六个市(州)GDP总量首次 突破千亿元大关。
结果解释和研究展望
1.因子分析计算
第一公共因子F1,可以命名 为“经济环境协调度”;第
二公共因子F2,可以命名为 “社会环境协调度”;第三
探讨利用SPSS软件分析城市大气环境污染

探讨利用SPSS软件分析城市大气环境污染摘要:伴随着我国经济的高速发展,城市化的持续加速,城市大气污染问题也愈发严重,对人民群众的生产生活造成极大的影响。
更好地保护和改善空气质量,为人民群众提供健康舒适的环境。
本文主要采用SPSS软件的主成分分析方法对城市的空气质量进行研究,探讨各参数对空气质量的影响及因素。
关键词:SPSS软件分析;城市大气环境污染;主成分分析方法近年来,伴随着现代化、工业化的发展,我国主要城市大气中的“煤烟”类污染占主导地位,大气中的总悬浮物含量偏高,SO2污染偏高,汽车排放污染物总量迅速增长,NOx污染日趋严重,我国已经出现多个“酸雨区”。
这不仅给生态环境带来严重的破坏,而且还会影响到人们的身体健康。
在污染物的组成上,空气污染可以分为三类:第一类是生活污染源,即食物、取暖、燃烧等过程中产生的有害气体、烟气;二是工业污染源,主要指火电、钢铁厂、有色金属厂、各类化工企业等引起的空气污染;三是交通污染物,包括机动车、航空器、火车和轮船等交通工具产生的烟尘和尾气。
一、SPSS软件技术概述1.1SPSSSPSS(Statistical Package for the Social Science)是一种广泛应用于多个学科的、具有广泛应用前景的数据处理软件。
该软件具有无需编写程序,只需简单的图形界面就能完成,而且运算速度很快的特点,因而深受广大用户的喜爱。
目前,SPSS是一种在社会,经济,生物,教育,心理学等众多学科中都有很大的应用。
1.2多元统计分析方法多元统计分析是一种有效的数学工具,可以快速分类、筛选、总结和提取少数隐含和独立的环境事件的主要控制因素,从而找出环境事件的科学规律。
它是实现快速有效的空间统计分析和数据挖掘的有效技术手段。
环境系统是一个非常复杂的体系,在研究往往涉及多个变量。
环境监测数据因其数量多、动态变化、相互关系等特点,给从这些数据中提取有用的信息带来了很大的困难。
5统计学作业——我国城市空气质量的状况分析

天津商业大学Tianjin University of Commerce 学年论文题目我国城市空气质量的状况分析学院经济学院专业金融学_____姓名胡鹏学号*********完成时间2014年11月10日我国城市空气质量的状况分析摘要:本文针对我国城市的空气质量现状及影响城市空气质量的主要因素进行分析研究。
运用聚类分析方法对我国城市空气质量等级进行分类,把空气质量状况最相似的城市聚成一类,分析原因、得出结论。
并对影响城市空气质量的5个主要因素进行主成分分析,找出最能代表原来数据信息的2至3个因子代替原来的5个变量。
建立回归模型,对结果进行分析,寻找解决空气质量问题的方法,并对原有方法进行改进,以便更为高效、快速地解决空气质量问题。
关键词:空气质量;聚类分析;主成分分析;回归分析Abstract:This article mainly analyze urban air quality present situation in China and the key factors affecting urban air quality study. Using clustering analysis method on the classification of China's urban air quality levels, gather into the city air quality in most similar category, analysis of causes, concluded. Then 5 main factors affecting urban air quality to principal component analysis identify the most representative of the original data instead of the 2 to 3 factors 5 variables. Established regression model an analysis of the results, looking for ways to address air quality issues, and to improve the existing methods, to more efficient and faster to solve the air quality problem.Keywords: air quality;cluster analysis;Principal components analysis;regression analyze一、我国城市空气质量的现状我国是一个人口大国,城市众多,人口密集。
数学建模城市空气问题

天津市空气质量评价与预测摘要本文对天津市区的空气质量进行了评价,并选出了主要的污染物进行研究分析,运用综合指数评价法和回归分析等方法对其空气质量进行分析,综合各种因素我们建立了如下模型。
1、本文对2001-2010年的空气污染指数和空气质量状况进行了分析,采用了指标评价法和综合指数评价法分析了对空气污染最主要的物质, 对每每年每种物质用(u u i u o u o i I C C C C I I I +-⨯--=)( )这个式子计算它们的污染指数,那么计算得到的最大的值的那种物质即是天津的主要污染物,我们发现对天津市空气质影响最大的物质是10PM ;2、运用spss 软件我们对天津过去十年的主要污染物进行多种模型拟合分析,发现三次曲线模型的相关系数最接近1,曲线模型拟合度较高,因此我们运用三次曲线模型进行预测分析,运用下面式子C x b x b x b y +++=12233我们得到了未来五年主要污染物浓度预测值,再根据这些值来分析与评价未来五年的空气质量;3、研究发现我国各个城市的空气质量有类似的,也有差别很大的,文中我们利用了聚类分析法来分析我国各个城市的空气质量。
[关键词] 综合指数评价 回归分析 主要污染物 三次曲线模型 聚类分析一、问题提出空气是地球上的生物赖以生存的物质,是必不可少的一种物质。
随着人类文明和经济的发展,空气污染越来越严重,尤其是工业城市,如何改善空气质量、合理进行大气环境质量预测预警、寻求有效的控制措施是当前环境科学研究的重要内容。
空气质量的好坏直接反映了空气的污染程度,它是依据空气中污染物浓度的高低来判断的,所以控制污染物的排放是改善空气质量的根本措施。
空气污染的污染物主要有二氧化硫(SO2)、二氧化氮(NO2)、可吸入悬浮颗粒物\浮尘(PM10)等等。
目前,城市空气质量污染指数的分级标准是根据空气污染指数(API)的取值界定的,空气污染指数指常规监测的几种空气污染物浓度简化成为单一的概念性指数值形式,并分级表征空气污染程度和空气质量状况。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS的综合运用——以我国城市空气质量分析为例年欢管理科学与工程 2013200644(一)实验目的近年来随着现代化和工业化的进程,我国大气污染状况十分严重,主要呈现煤烟型污染特征,城市大气环境中总悬浮颗粒浓度普遍超标、二氧化硫污染保持在较高水平、机动车尾气污染物排放总量迅速增加、氮氧化物污染趋势加重、全国形成多个酸雨区等,危害生态环境、影响人民群众身体健康。
从污染物构成来看,我国大气污染来源主要有三个方面:一是生活污染源,包括饮食或取暖时燃料向大气排放有害气体和烟雾;二是工业污染源,包括火力发电、钢铁和有色金属冶炼,各种化学工业给大气造成的污染;三是交通污染源,包括汽车、飞机、火车、船舶等交通工具的煤烟、尾气排放。
本文通过聚类分析和主成分分析法,研究我国主要城市的空气质量,以及各参数对空气质量好坏的影响以及最主要的影响因素。
并据此提出科学合理的对策建议。
(二)问题描述在2013年之前,大部分人对于雾霾天气的认知都会自然而然觉得是北京的事。
然而,12月伊始,我国遭受了入冬以来最大范围雾霾天气,今年12月伊始,我国中东部地区迎来了严重雾霾事件,几乎涉及中东部所有地区。
天津、河北、山东、江苏、安徽、河南、浙江、上海等多地空气质量指数达到六级严重污染级别,使得京津冀与长三角雾霾连成片。
由于能见度过低,导致多处高速公路封道关闭,给车辆出行带来了不便,也严重影响了市民的正常工作与生活。
(三)数据来源通过查询“中华人民共和国国家统计局官方网站”的“国家统计数据库”,《中国统计年鉴》获得。
(四)案例中使用的SPSS方法1.描述性分析2.相关分析3.聚类分析页脚内容14.主成分分析(五)实验内容与步骤1.城市空气质量因素的描述性统计本实验对城市空气质量的可吸入颗粒物、二氧化硫、二氧化氮、空气质量达到及好于二级的天数、年平均气温和年平均相对湿度六项影响空气质量的因素做描述性统计分析,包括频数、极小值、极大值、均值和标准差五个项目,见表1.1。
表1.1 描述统计量页脚内容2从表1.1可以看出,在影响空气质量的因素中,可吸入颗粒物的最小值为0.04毫克/立方米,最大值为0.138毫克/立方米,平均值为0.9121毫克/立方米,标准差为0.21762;二氧化硫的最小值为0.08毫克/立方米,最大值为0.079毫克/立方米,平均值为0.03902毫克/立方米,标准差为0.01593;二氧化氮的最小值为0.016毫克/立方米,最大值为0.068毫克/立方米,平均值为0.04005毫克/立方米,标准差为0.011855;空气质量达到及好于二级的天数最小值为244天,最大值为365天,平均值为326.81天,标准差为27.463;年平均气温的最小值为5.2摄氏度,最大值为23.3摄氏度,平均值为13.877摄氏度,标准差为4.9856;年平均相对湿度最小值为34%,最大值为81%,平均值为63.35%,标准差为11.047。
2.相关分析(1)按照顺序:分析——相关——双变量打开相关分析的对话框(2)在简单相关分析的主对话框中将所有变量选入“变量”中。
在“显著性检验”框中,有“双侧检验”和“单侧检验”。
系统默认是双侧检验。
(3)点击“OK”,输出结果见表2.1。
表2.1 Pearson相关系数页脚内容3页脚内容4页脚内容5表2.1给出了Pearson相关系数,以一个矩阵的形式表现出来。
从中可以看出,可吸入颗粒物、二氧化硫、二氧化氮空气质量达到好于二级的天数、年平均温度和年平均相对湿度的相关系数分别为0.901、0.56、0.46、0.468、0.617和0.617,在这些数据的右边都有两个星号,表示在0.01的显著性水平下,是显著相关的,还有一些相关系数带有一个星号表示在0.05的显著性水平下,相关系数是显著的。
故得出空气质量达到及好于二级的天数和可吸入颗粒物、二氧化硫和二氧化氮在0.01置信度条件下呈高负相关,其中空气质量达到及好于二级的天数和可吸入颗粒物的相关性大雨二氧化硫和二氧化氮与空气质量达到及好于二级的天数的相关性;空气质量达到及好于二级的天数和年平均温度、年平均相对湿度在0.01置信度条件下呈高度正相关,其中年平均温度与空气质量达到及好于二级的天数相关性等于平均相对湿度与空气质量达到及好于二级的天数的相关性。
3.聚类分析页脚内容63.1.衡量指标衡量指标的选取对于聚类分析来说至关重要,具有决定性的意义,影响空气质量好坏的因素有很多,有,温度,湿度等等,为此本文选取了四个指标,分别是可吸入颗粒物,二氧化硫,二氧化氮,空气质量达到及好于二级的天数。
用以衡量我国主要的31个城市的空气质量,数据来源于中国统计年鉴2011年:12-19 主要城市空气质量指标 (2011年)单位:毫克/立方米城市可吸入颗粒物二氧化硫二氧化氮空气质量达到及空气质量达到二级以上好于二级的天数天数占全年比重(%)(天)北京天津石家庄太原呼和浩特沈阳长春哈尔滨上海南京杭州合肥福州南昌济南郑州武汉长沙广州南宁海口重庆成都贵阳昆明拉萨西安兰州西宁银川乌鲁木齐(PM)(SO)(NO)10220.1130.0280.05628678.40.0930.0420.03832087.70.0990.0520.04132087.70.0840.0640.02330884.40.0760.0540.03934795.10.0960.0590.03333291.00.0910.0260.04334594.50.0990.0410.04631786.80.0800.0290.05133792.30.0970.0340.04931786.80.0930.0390.05833391.20.1130.0220.02530383.00.0690.0090.03236098.60.0880.0560.03834795.10.1040.0510.03632087.70.1030.0510.04731887.10.1000.0390.05630683.80.0830.0400.04734193.40.0690.0280.04936098.60.0730.0260.03335196.20.0410.0080.016365100.00.0930.0380.03132488.80.1000.0310.05132288.20.0790.0490.03034995.60.0650.0370.044365100.00.0400.0090.02336499.70.1180.0420.04130583.60.1380.0480.04224466.80.1050.0430.02631686.60.0950.0380.03033391.20.1320.0790.06827675.6页脚内容73.2操作步骤(1)选择分析——分类——系统聚类打开系统聚类分析对话框。
(2)在主对话框中将用于聚类的所有变量选入“变量”,把区分样本的标签变量选入“标注个案”。
(3)单击“方法”按钮,展开分层聚类分析的方法选择对话框。
(4)点击“统计量”选中“合并进程表”。
选择“方案范围”分别输入“2”和“4”,点击“继续”回到主对话框,此时分析结果中就包含了凝聚状态表。
点击“绘制”选中“树状图”,点击“继续”回到主对话框,此时分析结果中就包括了冰柱图。
(5)点击“保存”,然后再弹出的对话框中点击“继续”,最后回到主对话框中点击“OK”。
完成上述步骤后,会得到凝聚状态表(表3.1)和树状图(图3.2)。
表3.1 分成2~4类时各地区所属的类别页脚内容8页脚内容9页脚内容10H I E R A R C H I C A L C L U S T E R A N A L Y S I SDendrogram using Average Linkage (Between Groups)Rescaled Distance Cluster CombineC A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+南京10 -+成都23 -+-+武汉17 -+ +-+杭州11 ---+ +-----+北京 1 -----+ |呼和浩特 5 -+ |南昌14 -+-+ |贵阳24 -+ +---+ |沈阳 6 ---+ | +-+重庆22 -+ +-+ | |银川30 -+---+ | | | |西宁29 -+ | | | | |哈尔滨8 -+ +-+ | | |郑州16 -+-+ | +-+ |石家庄 3 -+ | | | +---+页脚内容11济南15 -+ +-+ | | |天津 2 -+ | | | |西安27 ---+ | | |太原 4 ---------+ | |福州13 ---+---+ | |南宁20 ---+ +-----+ +---------------------+广州19 -+-+ | | |昆明25 -+ +---+ | |上海9 -+-+ | +---------+长沙18 -+ | | | |长春7 ---+ | | |合肥12 -----------------+ | |海口21 -+-------------------------------------+ |拉萨26 -+ |兰州28 -----------------------+-------------------------+乌鲁木齐31 -----------------------+图3.2 树状图从图3.2可以直观地观测整个聚类过程和结果。
图中的第一行给出的是聚类方法“系统聚类分析”;第2行给出的是计算类间距离的方法是“Ward method”;第3行是类别合并的相对距离,它是把类别间的最大距离作为相对距离25,其余的距离都换算成与之相比的相对距离大小。
页脚内容12图3.2中左边一列是参加聚类的对象;第2列是地区的编号;图3.2中线的长短表示类别之间的相对距离远近。
该图提供了1~31个类别的所有分类结果,想要分成几类可根据实际情况而定。
本例分成四类比较合适,每一类别中包括的地区如表3.3所示。
表3.3 31个地区分成四类时的系统聚类结果从聚类分析谱系图可以看出,在不同的聚类标准下,聚类的结果不同:当距离为0时,每个样本为单独的一类,即31个城市各自为一类;当距离为25时,31个城市被归为一类;在这里我们将城市分成四类:第一类:南京,成都,武汉,杭州,北京;第二类:呼和浩特,南昌,贵阳,沈阳,重庆,银川,西宁,哈尔滨,郑州,石家庄,济南,天津,西安,太原;页脚内容13第三类:福州,南宁,广州,昆明,上海,长沙,长春,合肥;第四类:海口,拉萨,兰州,乌鲁木齐4.主成分分析4.1实验步骤(1)按照顺序:分析——降维——因子分析进入因子分析主对话框中,将左侧所有变量都选入“变量”中。