因子分析SPSS操作

因子分析作业:

全国30 个省市的8 项经济指标如下:

要求:先对数据做标准化处理,然后基于标准化数据进行以下操作

1、给出原始变量的相关系数矩阵;

2、用主成分法求公因子,公因子的提取按照默认提取(即特征值大于1),给出公因子的方差贡献度表;

3、给出共同度表,并进行解释;

4、给出因子载荷矩阵,据之分析提取的公因子的实际意义。如果不好解释,请用因子旋转(采用正交旋转中最大方差法)给出旋转后的因子载荷矩阵,然后分析旋转之后的公因子,要求给各个公因子赋予实际含义;

5、先利用提取的每个公因子分别对各省市进行排名并作简单分析。最后构造一个综合因子,计算各省市的综合因子的分值,并进行排序并作简单分析。

1、输入数据,依次点选分析描述统计描述,将变量x1到x8选入右边变量下

面,点选“将标准化得分另存为变量”,点确定即可的标准化的数据。

依次点选分析降维因子分析,打开因子分析窗口,将标准化的8个变量选入右边变量下面,点选描述相关矩阵下选中系数及KMO 和Bartlett的检验,点继续,确定,就可得出8个变量的相关系数矩阵如下图。

由表中数据可以看出大部分数据的绝对值都在0.3以上,说明变量间有较强的相关性。

由上图看出,sig.值为0,所以拒绝相关系数为0(变量相互独立)的原假设,即说明变量间存在相关性。

2、依次点选在因子分析窗口点选抽取方法:主成分;分析:相关性矩阵;输出:未旋转的因

子解,碎石图;抽取:基于特征值(特征值大于1);继续,确定,输出结果如下3个图。

上表中第一列为特征值(主成分的方差),第二列为各个主成分的贡献率,第三列为累积贡献率,由上表看出前3个主成分的累计贡献率就达到了89.599%>85% ,所以选取主成分个数为3。选y1 为第一主成分,y2 为第二主成分,y3 为第三主成分。且这三个主成分的方差和占全部方差的89.599% ,即基本上保留了原

来指标的信息。这样由原来的8 个指标变为了3 个指标。

由上图看出,成分数为3 时,特征值的变化曲线趋于平缓,所以由碎石图也可大致确定出主成分个数为3。与按累计贡献率确定的主成分个数是一致的。

3、共同度结果如下:

初始提取

Zscore: 国内生产 1.000 .945

Zscore: 居民消费 1.000 .800

Zscore: 固定资产 1.000 .902

Zscore: 职工工资 1.000 .873

Zscore: 货物周转 1.000 .858

Zscore: 消费价格 1.000 .957

Zscore: 商品零售 1.000 .929

Zscore: 工业产值 1.000 .904

提取方法:主成份分析。

上表给出了该次分析从每个原始变量中提取的信息。由上表数据可以看出,主成分包含了各个原始变量的80%以上的信息。

4、在因子分析窗口,旋转输出:载荷阵。输出结果如下:

成份矩阵a

成份

1 2 3

Zscore: 国内生产.885 .384 .119

:

a. 已提取了 3 个成份。

由上表数据第一列表明:第一主成分与各个变量之间的相关性;第二列表明:第二主成分与各个变量之间的相关性;第三列表明:第三主成分与各个变量之间的相关性。可以得出:x1x3x8 主要由第一主成分解释,x4x5主要由第二主成分解释,x6主要由第三主成分解释。但是x2是由第一主成分还是第二主成分解释不好确定,x7是由三个主成分中的哪个解释也不好确定。下面作因子旋转后的因子载荷阵。

在因子分析窗口,抽取输出:旋转的因子解,继续;旋转方法:最大方差法,继续;确定。输出结果如下2图;

提取方法: 主成分分析法。

旋转法: 具有Kaiser 标准化的正交旋转法。

a. 旋转在 5 次迭代后收敛。

由上表数据可以得出:x1x3x5x8 主要由第一主成分解释,x2x4主要由第二主成分解释,x6x7主要由第三主成分解释。与第一因子关系密切的变量主要是投入(投资:固定资产投资)与产出(产值:国内生产总值、工业总产值)方面的变量,货物周转又是投入产出的中介过程,

可以命名为投入产出因

子;与第二因子关系密切的都是反映民众生活水平的变量,可以命名为消费能力因子;与第三因子关系密切的是价格指数方面的变量,可以命名为价格指数因子。

解释的总方差

由上表可以看出:第二列数据表明,各个主成分的贡献率与旋转前的有变化,但是3个主成分的累积贡献率相同都是89.599%。

5、在因子分析窗口,得分因子得分保存为变量f1f2f3; 方法:回归。再按三个主成分降序排列:数据排序个案:将f1选入排序依据,排列顺序:降序。同理得出按f2f3排序的结果。结果如下;最后,以各因子的方差贡献率占三个因子总方差贡献率的比重作为权重进行加权汇总,得出各城市的综合得分f。即

f=(0.40089*f1+0.277*f2+0.2174*f3)/0.89599

f 得分在转换计算变量中的出。最后再按f 得分排序。排序结果如下:

f1 排序f2 排序f3 排序 f 排

2.11763 山东

3.66094 上海 2.07204 云南 1.62 上

2.03281 江苏 1.6829 广东 1.69291 贵州0.95 山

1.48171 广东 1.58836 北京 1.28542 湖北0.95 江

1.22895 河北0.99048 天津 1.16111 新疆0.88 广

1.10693 四川0.74993 浙江0.98784 四川0.58 四

1.07313 河南0.6314 西藏0.90343 陕西0.5 湖

0.96184 辽宁0.27409 福建0.84557 上海0.44 浙

0.65225 浙江0.26647 江苏0.77625 甘肃0.42 云

0.60326 上海0.18476 青海0.62601 广西0.25 北

0.60136 湖北0.11802 新疆0.53464 湖南0.14 辽

0.26238 湖南0.04579 云南0.47211 青海0.09 湖

0.23633 黑龙0.00117 海南0.25513 山东0.07 新

-0.06617 安徽-0.15123 宁夏0.21824 内蒙-0.02 贵

-0.26842 福建-0.19777 山东-0.00481 西藏-0.05 河

-0.28002 云南-0.27211 广西-0.0403 江西-0.05 广西

-0.28376 广西-0.29037 甘肃-0.13117 宁夏-0.12 陕西

-0.36466 山西-0.29779 湖北-0.13995 山西-0.12 河北

-0.39638 北京-0.34462 贵州-0.17691 江苏-0.16 黑龙

-0.41389 陕西-0.37617 黑龙-0.25054 北京-0.23 甘肃

-0.47727 内蒙-0.39701 吉林-0.32565 浙江-0.24 福建

-0.51327 吉林-0.43068 辽宁-0.46473 河南-0.4 山西

-0.56026 江西-0.52044 湖南-0.57616 黑龙江-0.42 青海

-0.57753 新疆-0.52561 四川-0.61312 辽宁-0.43 内蒙

-0.74551 甘肃-0.53203 陕西-0.78714 河北-0.47 江西

-0.76636 贵州-0.66221 山西-0.79854 福建-0.5 天津

-0.88229 天津-0.68 江西-0.94379 吉林-0.52 西藏

-1.34465 青海-0.79471 安徽-1.1953 广东-0.59 吉林

-1.35668 宁夏-0.88339 内蒙-1.50695 安徽-0.66 安徽

-1.46804 海南-1.3165 河南-1.62403 天津-0.69 宁夏

-1.59344 西藏-1.52165 河北-2.25163 海南-1.23 海南

有了对各个公因子的合理的解释,结合各个城市在三个公因子的得分和综合得分,就可对各城市的经济发展水平进行评价了。在投入产出因子f1 上得分最高的6个城市是山东、江苏、广东、河北、四川。其中山东得分为2.11763 ,江苏得分为2.03281 ,高于其他城市,说明山东、江苏的工业的投入产出能力最高,工业发展相对较快,从而推动城市发展;而青海、宁夏、海南、西藏的投入产出能力较差,可能由于地理位置的缘故工业发展相对落后。上海、广东、北京、天津在消费能力因子f2 上的得分较高,说明它们的消费能力较高,人们的收入也较高,从而生活质量较好,城市发展较快;而河南、河北得分较低,它们的消费能力较低,从而说明人们的收入也相对较低,生活质量相对差一点,城市发展较慢。云南、贵州、湖北、新疆在价格指数因子f3 上的得分较高,说明在这些城市物价相对较高,可能以些非本地产的东西由于运输的不方便,使得这些物价相对较高,而广东、安徽、天津、海南的价格指数较低,说明,在这些城市,交通相对便捷,运输方便,或者本地产的东西较多基本满足需求,使得物价相对较低,但从侧面也可看出这些城市与其他城市的联系可能较少,不利于自己的总和发展,从而也说明了这些城市的发展相对较慢。由综合因子f 的分就可综合评价城市的经济发展水平,综合得分的前

3名上海、山东、江苏,得分最低的3个城市安徽、宁夏、海南。

相关主题
相关文档
最新文档