新版利用SPSS进行主成分分析-新版.pdf
零基础系列3----手把手教你用SPSS19进行主成分分析

标准化后的数值需要我们自己 在SPSS里点一下
• 这样标准化后的数值就自动填入数据窗口中,命 名都是“Z原数据名”。
最后,就可以根据每个主成分方程, 计算出每个主成分的得分F,将种 源按得分从大到小进行排序,就可 以自由分析啦。
• 信息贡献影响力综合评价
与因子分析的区别
• 因子分析是从主成分分析方法发展、延伸出来的 一种新方法。因此在进行因子分析时,提取公因 子的方法,除等。
• 1)因子分析需要构造因子模型,着重要求新变 量具有实际的意义,能解释原始变量间的内在结 构。
• 数据标准化在SPSS软件因子分析(F)过程中会自动 进行。如果需要看标准化后的数值,则需要我们自 己在SPSS里操作,后面会详细说明。
第一步,打开SPSS软件,导入 数据,点击“打开”
第二步,选择“因子分析(F)”(SPSS
软件是将主成分分析整合在“因子分析(F)”里, 没有单独列出)
把自己要分析的指标都选入“变量” 中,进入“描述”,勾选“系数”选项
• [2] 李小胜,陈珍珍. 如何正确应用SPSS软件做主成 分分析[J]. 统计研究, 2010, 27(8): 105-108.
• [3] 林海明,张文霖. 主成分分析与因子分析的异 同和SPSS软件——兼与刘玉玫、卢纹岱等同志商 榷[J]. 统计研究, 2005, (3): 65-69.
谢谢
补充知识点:数据为什么要标 准化?
• 标准化后的数值就都转化为平均值是0,方差是1的 无量纲数据。
• 做数据标准化是为了消除量纲(简单说就是单位) 和数量级的影响。比如我有XXX植物种质资源的形态 性状16个指标,它们的量纲就不同,株高是“cm”, 主茎数是“个”,各个指标的属性不同,就无法直接 进行比较和综合,同时,有些数值较大的指标,在 综合评价时所占的绝对比例就更大,绝对作用就更 突出,数值较小的可能就没几乎影响。
SPSS数据分析教程主成分分析

第13页/共31页
KMO统计量 (2)
第14页/共31页
基于相关系数矩阵还是协方差矩阵
• 当变量取值范围变化很大或者量纲变化时,协方差矩阵变化很大。一般情况下,主成分分析都是基于相关 系数矩阵的。
第15页/共31页
主成分分析案例 (1)
• 打开本章数据文件PCA20.sav • 某公司有20个工厂,现在要对每个工厂作经济效益分析。从所取得的生产成果和所消耗的人力、物力、财
累积%
48.745 76.886 86.896 94.897 100.000
合计 2.437 1.407
提取平方和载入
方差的 % 48.745 28.140
累积 % 48.745 76.886
第28页/共31页
结果分析(2)
JpMorgan Citibank WellsFargo RoyalDutchShell ExxonMobil
• 11.3 主成分分析案例
• 11.3.1 综合评价案例 • 11.3.2 主成分分析用于探索量间结构关系
第2页/共31页
本章学习目标
• 了解主成分分析的应用领域; • 了解主成分析的应用条件; • 掌握如何确定主成分的个数; • 熟练解释主成分分析的结果:载荷矩阵、共同度、方差贡献率等; • 掌握应用主成分分析进行数据降维和综合评价的方法。
力的比率等指标中,选取5个指标(变量)进行分析。 • X1——固定资产的产值率; • X2——净产值的劳动生产率; • X3——百元产值的流动资金占用率; • X4——百元产值的利润率; • X5——百元资金的利润率。
第16页/共31页
主成分分析案例(2)
• 现在对这20个工厂同时按照这5项指标收集数据,然后找出1个综合指标对它们的经济效益进行排序,找出 经济效益较高的工厂。
SPSS主成分分析

• 怎么解释这两个主成分。前面说过主成分 是原始六个变量的线性组合。是怎么样的 组合呢?SPSS可以输出下面的表。
ai x Componen t Matr
• 这里每一列代表一个主成分作为原来变量线性组 合的系数(比例)。比如第一主成分作为数学、 物理、化学、语文、历史、英语这六个原先变量 的线性组合,系数(比例)为 -0.806, -0.674, 0.675, 0.893, 0.825, 0.836。
-4
-2
0
2
4
-4
-2
0
2
4
主成分分析
对于多维变量的情况和二维类似,也 有高维的椭球,只不过无法直观地看 见罢了。 首先把高维椭球的主轴找出来,再用 代表大多数数据信息的最长的几个轴 作为新变量;这样,主成分分析就基 本完成了。 注意,和二维情况类似,高维椭球的 主轴也是互相垂直的。这些互相正交 的新变量是原先变量的线性组合,叫 做主成分(principal component)。
• 这里的 Initial Eigenvalues 就是这里的六个 主轴长度,又称特征值(数据相关阵的特 征值)。头两个成分特征值累积占了总方 差的81.142%。后面的特征值的贡献越来越 少。
• 特征值的贡献还可以从SPSS的所谓碎石图看出
Scree Plot
4
3
2
1
0 1 2 3 4 5 6
Component Number
• 如 用 x1,x2,x3,x4,x5,x6 分 别 表 示 原 先 的 六 个 变 量 , 而 用 y 1 , y 2 , y 3 , y 4, y 5 , y 6 表 示 新 的 主 成 分 , 那 么 , 原 先 六 个 变 量 x1,x2,x3,x4,x5,x6与第一和第二主成分y1,y2的关系为: X1=-0.806y1 + 0.353y2 X2=-0.674y1 + 0.531y2 X3=-0.675y1 + 0.513y2 X4= 0.893y1 + 0.306y2 x5= 0.825y1 + 0.435y2 x6= 0.836y1 + 0.425y2 • 这些系数称为主成分载荷( loading ),它表示主成分和相应 的原先变量的相关系数。 • 比如 x1 表示式中 y1 的系数为 -0.806 ,这就是说第一主成分和数 学变量的相关系数为-0.806。 • 相关系数 ( 绝对值)越大,主成分对该变量的代表性也越大。 可以看得出,第一主成分对各个变量解释得都很充分。而最后 的几个主成分和原先的变量就不那么相关了。
《2024年如何用SPSS软件进行主成分分析》范文

《如何用SPSS软件进行主成分分析》篇一一、引言主成分分析(Principal Component Analysis,PCA)是一种统计方法,用于通过创建新的变量(即主成分)来简化数据集,并解释原始数据中的复杂关系。
这种分析在社会科学、心理学、市场营销和许多其他领域中广泛应用。
本文将详细介绍如何使用SPSS软件进行主成分分析。
二、SPSS软件简介SPSS(Statistical Package for the Social Sciences)是一款用于统计分析的常用软件。
其界面友好,操作简便,深受研究者的喜爱。
本文将基于SPSS软件进行主成分分析的详细步骤进行介绍。
三、主成分分析步骤1. 数据准备首先,我们需要准备好需要进行主成分分析的数据。
数据应该为数值型变量,且各个变量之间应该存在一定程度的关联性。
在SPSS中,我们可以通过导入或输入数据的方式将数据加载到软件中。
2. 数据预处理在进行主成分分析之前,我们需要对数据进行预处理,包括缺失值处理、异常值处理以及数据标准化等。
这些预处理步骤可以确保数据的准确性和可靠性,从而影响主成分分析的结果。
3. 主成分分析操作(1)在SPSS软件中,选择“分析”菜单下的“降维”选项,然后选择“主成分分析”。
(2)在弹出的对话框中,将需要进行主成分分析的变量选入“变量”列表中。
(3)设置主成分的数量。
通常情况下,我们会根据解释的总方差比例来确定主成分的数量。
当某个主成分解释的方差比例高于设定的阈值(如85%)时,我们就可以认为这个主成分包含了原始数据的大部分信息。
(4)点击“提取”按钮,选择适当的提取方法(如基于特征值的方法)和提取标准(如方差比例)。
(5)点击“旋转”按钮,选择适当的旋转方法(如最大方差法)。
这将有助于我们更好地解释每个主成分的含义。
(6)最后,点击“确定”按钮进行主成分分析。
4. 结果解读(1)查看结果输出窗口中的“解释的总方差”表,了解每个主成分解释的方差比例和累积方差比例。
SPSS数据的主成分分析

zf
18
协方差矩阵求解中主成分的性质
❖ 1、主成分的协方差阵为对角矩阵;
❖ 2、 i V(F a i),1 r23 p
❖ 3、 1 2 3 p V ( X 1 ) V a ( X 2 ) r V a ( X 3 ) r a V ( X r p ) a t ( x r )r
zf
31
主成分分析步骤及框图
➢ 主成分分析步骤:
• 1.根据研究问题选取初始分析变量; • 2.根据初始变量特性判断由协方差阵求主成分还是由相关阵求
主成分; • 3.求协差阵或相关阵的特征根与相应标准特征向量; • 4.判断是否存在明显的多重共线性,若存在,则回到第一步; • 5.得到主成分的表达式并确定主成分个数,选取主成分; • 6.结合主成分对研究问题进行分析并深入研究.
对角线外的元素不为0
zf
17
意味着:原始变量之
间有相关关系
➢ 如何运用主成分分析将这些具有相关关系的变量转化 为没有相关关系的新变量主成分呢
➢ 新变量即主成分之间没有相关关系,其协方差阵为对角
矩阵:
1
0
0 p
主成分表达式的系数项即 是λ1、λ2···λp的特征向量
对角线上的元素λ1、 λ2···λp分别为第一、 二···第p个主成分方 差;同时也是原始变 量协方差阵的特征根
➢ 2、如何确定主成分个数
➢ 3、如何解释主成分所包含的经济意义
zf
15
如何求解主成分 - 1基于协方差矩阵求解主成分
❖ 假设有n个样本,每个样本有 p 个观测变量.运用主成分 分析构造以下 p 个主成分关于原始变量的线性组合模 型:
F1 a11x1 a12x2 a1p xp F2 a21x1 a22x2 a2 p xp
SPSS统计软件分析主成分分析

因子分析模型
x1*=a11F1+a12F2+…+a1mFm+e1 x2*=a21F1+a22F2+…+a2mFm+e2
数学原理
如果z1=u1’x满足① u1u1 1② var(z1) maxvar(ux) 则称z1为x的第一主成分。
若z1不足以代表原变量所包含的信息,就 考虑采用z2。
Z2满足① cov(z1, z2 ) 0 ③ var(z2) maxvar(UX )
② u2u2 1
Z2为第二主成分
数学原理
反映象相关矩阵 (Anti-image correction matrix)
如果反映象相关矩阵中的对角线上元素值接近1 其他元素的绝对值 比较小,则说明这些变量可 能适合作因子分析
因子分析的前提条件
Bartlett test of sphericity
H0:相关系数矩阵是一个单位阵 如果统计量值比较大,且其相对应的相伴概
SPSS实现(因子分析与主成分分析)
在Rotation:根据需要选择Loading plot(以输出 载荷图)
score:save as variables,输出主成分得分 选择Display factor score coefficient matrix; 输出主成分得分系数矩阵
实例分析
例1:
cos sin
sin x1
co
s
x2
几何解释
旋转变换的目的是为了使得n个样本点在y1 轴方向上的离散程度最大,即y1的方差最 大,变量y1代表了原始数据的绝大部分信 息,在研究某经济问题时,即使不考虑变量 y2也损失不多的信息。
SPSS做主成分分析

SPSS做主成分分析SPSS(Statistical Package for the Social Sciences)是一种常用的统计分析软件,提供了丰富的分析方法和功能,包括主成分分析。
下面将详细介绍在SPSS中进行主成分分析的步骤和注意事项。
第一步是数据准备。
在进行主成分分析之前,需要确保数据集的完整性和合理性。
如果存在缺失值或异常值,需要进行处理。
同时,应根据研究目的确定需要进行主成分分析的变量。
第二步是进行主成分分析。
在SPSS中,打开数据集后,选择“分析”菜单,然后选择“尺度化”→“主成分”,弹出主成分分析对话框。
在对话框中,将需要进行主成分分析的变量移入“变量”框中。
可以根据具体需求对分析选项进行设置,如选择因子提取方法(如主成分法、因子法)、因子选择准则(如特征值>1)、旋转方法(如方差最大旋转、直角旋转)等。
第三步是解释主成分。
主成分分析得到的主成分是原始变量的线性组合。
通过主成分分析,我们可以得到主成分的特征值、解释方差以及因子载荷。
特征值表示主成分的重要程度,一般来说,特征值>1的主成分被认为具有较高的解释能力。
解释方差表示每个主成分能够解释的原始变量的变异程度,可以通过累计解释方差和散点图来进行分析。
因子载荷表示每个原始变量对主成分的贡献程度,绝对值越大表示贡献越大。
第四步是选择主成分。
在主成分分析得到的主成分中,我们可以根据特征值和解释方差来选择保留的主成分数量。
通常可以选择满足特征值>1和解释方差累计达到一定比例(如70%)的主成分作为保留的主成分。
第五步是主成分旋转。
在得到了保留的主成分后,可以进行主成分旋转来使主成分的解释更加清晰和可解释。
主成分旋转可以通过选择旋转方法(如方差最大旋转、直角旋转)来进行。
第六步是结果解释和报告。
在得到最终的主成分分析结果后,需要对结果进行解释和报告。
可以通过主成分载荷、散点图和因子得分来解释主成分。
同时,应当注意主成分的解释要与具体研究问题和背景相结合,做到理论和实践的有机结合。
如何在SPSS数据分析报告中进行主成分分析?

如何在SPSS数据分析报告中进行主成分分析?关键信息项1、数据准备要求2、主成分分析步骤3、结果解读方法4、报告撰写要点1、数据准备要求11 数据质量检查确保数据的完整性,不存在缺失值。
若有缺失值,需采取适当的方法进行处理,如均值插补、回归插补等。
检查数据的准确性,避免错误的数据录入。
评估数据的分布特征,判断是否符合正态分布。
若不符合,可能需要进行数据转换。
12 变量选择选择具有相关性且能反映研究问题的变量。
避免包含过多无关或冗余的变量,以免增加分析的复杂性。
13 数据标准化对数据进行标准化处理,使不同变量具有相同的量纲和可比性。
2、主成分分析步骤21 打开 SPSS 软件并导入数据启动 SPSS 程序,通过“文件”菜单中的“打开”选项导入准备好的数据文件。
22 选择主成分分析方法在“分析”菜单中,选择“降维”子菜单中的“因子分析”。
23 设置分析参数将需要分析的变量选入“变量”框。
选择提取主成分的方法,如基于特征值大于 1 或指定提取的主成分个数。
24 输出结果选项设置根据需求选择输出相关的统计量和图表,如成分矩阵、碎石图等。
25 执行分析点击“确定”按钮,执行主成分分析。
3、结果解读方法31 成分矩阵解读观察成分矩阵中各变量在主成分上的载荷值,判断变量与主成分的相关性。
载荷值的绝对值越大,表明变量与主成分的相关性越强。
32 特征值和方差贡献率关注特征值,通常选择特征值大于 1 的主成分。
方差贡献率表示主成分解释原始变量变异的比例,累计方差贡献率反映了所选主成分对原始变量信息的综合解释程度。
33 碎石图分析通过碎石图直观判断主成分的重要性和提取的合理性。
34 成分得分计算如有需要,可计算成分得分,用于后续的进一步分析或建模。
4、报告撰写要点41 研究背景和目的阐述简要介绍研究的背景、问题以及进行主成分分析的目的。
42 数据来源和预处理说明描述数据的来源、样本量以及所进行的数据预处理步骤和方法。