SPSS数据分析教程-12_因子分析

合集下载

SPSS数据分析教程12因子分析

SPSS数据分析教程12因子分析
begin data. N 220 220 220 220 220 220 SD 1 1 1 1 1 1 CORR 1.00 CORR 0.439 1.00 CORR 0.410 0.351 1.00 CORR 0.288 0.354 0.164 1.0 CORR 0.329 0.320 0.190 0.595 1.00 CORR 0.248 0.329 0.181 0.470 0.464 1.00 END data.
案例1:探索变量间的结构关系
直接从相关系数矩阵或者协方差矩阵开始,用 语法命令的方式来进行因子分析。
为了分析(英格兰)盖尔语、英语、历史、算 术、几何和代数6门学科之间的相互关系, Lawley和Maxwell调查了220名男学生的6门 学科的成绩,并记录下它们的相关系数矩阵
输入数据
MATRIX DATA variables=ROWTYPE_ Gaelic English History Arithmeti Algebra Geometry.
SPSS数据分析教程12因子分 析
ห้องสมุดไป่ตู้
第12章 因子分析
目录
12.1 因子分析简介 12.2 因子分析法的统计理论
12.2.1 因子分析的模型 12.2.2 因子分析模型的求解方法 12.2.3 因子分析的应用前提 12.2.4 因子个数的确定 12.2.5 因子的解释 12.2.6 因子旋转 12.2.7 因子得分 12.3 因子分析案例 12.3.1 探索变量间的结构关系 12.3.2 因子分析在市场调查中的应用 12.4 因子分析结果的有效性 12.5 因子分析和主成分分析的比较
本章要求
了解因子分析模型的基本理论; 了解因子分析法的应用条件 因子分析模型的求解方法; 掌握因子分析法的应用; 掌握因子分析法输出结果的解释; 了解因子旋转的方法。

SPSS因子分析的基本概念和步骤

SPSS因子分析的基本概念和步骤

因子分析的基本概念和步骤四、因素分析的操作说明Statistics/Data Reduction/Factor…(统计分析/数据缩减/因子…)出现“Factor Analysis”(因子分析)对话框,将左边框中鉴别度达显著性的a1~a22选如右边“Variables”(变量)下的空框中。

其中五个按钮内的图标意义如下:Descriptives(描述性统计量)按钮,会出现“Factor Analysis:Descriptives”(因子分析:描述性统计量)对话窗口1.“Statistics”(统计量)选项框(1)“ Univariate descriptives”(单变量描述性统计量):显示每一题项的平均数、标准差。

(2)“ Initial solution”(未转轴之统计量):显示因素分析未转轴前之共同性(communality)、特征值(eigenvalues)、变异数百分比与累积百分比。

2.“Correlation Matric”(相关矩阵)选项框(1)“ Coefficients”(系数):显示题项的相关矩阵;(2)“ Significance levels”(显著水准):求出前述矩阵的显著水准;(3)“ Determinant”(行列式):求出前述相关矩阵的行列式值;(4)“ KMO and Bartlett’s test of sphericity”(KMO与Bartlett的球形检定):显示KMO抽样适当性参数与Bartlett的球形检定;(5)“ Inverse”(倒数模式):求出相关矩阵的反矩阵;(6)“ Reproduced”(重制的):显示重制相关矩阵,上三角形矩阵代表残差值;而主对角线与下三角形代表相关系数;(7)“ Anti-image”(反映象):求出反映象的共变量与相关矩阵;在“Factor Analysis:Descriptives”对话窗口中,选取“ Initial solution”、“ KMO and Bartlett’s test of sphericity”二项。

SPSS因子分析法

SPSS因子分析法

因子分析因子分析一、基础理论知识1 概念因子分析(Factor analysis):就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法.从数学角度来看,主成分分析是一种化繁为简的降维处理技术。

主成分分析(Principal component analysis):是因子分析的一个特例,是使用最多的因子提取方法.它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。

选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。

两者关系:主成分分析(PCA)和因子分析(FA)是两种把变量维数降低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子分析的一个特例.2 特点(1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。

(2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。

(3)因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显著的相关关系。

(4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。

在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理(即通过因子分析或主成分分析)。

显然,在一个低维空间解释系统要比在高维系统容易的多.3 类型根据研究对象的不同,把因子分析分为R型和Q型两种.当研究对象是变量时,属于R型因子分析;当研究对象是样品时,属于Q型因子分析.但有的因子分析方法兼有R型和Q型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。

4分析原理假定:有n 个地理样本,每个样本共有p 个变量,构成一个n ×p 阶的地理数据矩阵 :当p 较大时,在p 维空间中考察问题比较麻烦。

spss数据分析因子分析法

spss数据分析因子分析法

spss数据分析因子分析法
随着硬件技术的发展,每年被记录和存储下来的数据是非常庞大的,如何从庞大的数据堆中筛选出目标数据并分析得到有用的结论是现今重要的领域---数据挖掘。

为了能够充分有效的利用数据,化繁为简是一项必做的工作,希望将原来繁多的描述变量浓缩成少数几个新指标,同时尽可能多的保存旧变量的信息,这些分析过程被称为数据降维。

主成分分析和因子分析是数据降维分析的主要手段。

因子分析:
因子分析模型中,假定每个原始变量由两部分组成:共同因子和唯一因子。

共同因子是各个原始变量所共有的因子,解释变量之间的相关关系。

唯一因子顾名思义是每个原始变量所特有的因子,表示该变量不能被共同因子解释的部分。

举个例子:现在一个数据表有10个变量,因子分析可以将这10个变量通过特定的算法变为3个,4个,5个等等因子,而每个因子都能表达一种涵义,从而达到了降维的效果,方便接下来的数据分析。

因子分析SPSS操作

因子分析SPSS操作

因子分析作业:全国30个省市的8项经济指标如下:要求:先对数据做标准化处理,然后基于标准化数据进行以下操作1、给出原始变量的相关系数矩阵;2、用主成分法求公因子,公因子的提取按照默认提取(即特征值大于1),给出公因子的方差贡献度表;3、给出共同度表,并进行解释;4、给出因子载荷矩阵,据之分析提取的公因子的实际意义。

如果不好解释,请用因子旋转(采用正交旋转中最大方差法)给出旋转后的因子载荷矩阵,然后分析旋转之后的公因子,要求给各个公因子赋予实际含义;5、先利用提取的每个公因子分别对各省市进行排名并作简单分析。

最后构造一个综合因子,计算各省市的综合因子的分值,并进行排序并作简单分析。

1、输入数据,依次点选分析→描述统计→描述,将变量x1到x8选入右边变量下面,点选“将标准化得分另存为变量”,点确定即可的标准化的数据。

依次点选分析→降维→因子分析,打开因子分析窗口,将标准化的8个变量选入右边变量下面,点选描述→相关矩阵下选中系数及KMO和Bartlett的检验,点继续,确定,就可得出8个变量的相关系数矩阵如下图。

由表中数据可以看出大部分数据的绝对值都在0.3以上,说明变量间有较强的相关性。

由上图看出,sig.值为0,所以拒绝相关系数为0(变量相互独立)的原假设,即说明变量间存在相关性。

2、依次点选在因子分析窗口点选抽取 方法:主成分;分析:相关性矩阵;输出:未旋转的因3个图。

表看出前3个主成分的累计贡献率就达到了89.599%>85%,所以选取主成分个数为3。

选y1为第一主成分,y2为第二主成分,y3为第三主成分。

且这三个主成分的方差和占全部方差的89.599%,即基本上保留了原来指标的信息。

这样由原来的8个指标变为了3个指标。

3。

与按累计贡献率确定的主成分个数是一致的。

80%以上的信息。

由上表数据第一列表明:第一主成分与各个变量之间的相关性;第二列表明:第二主成分与各个变量之间的相关性;第三列表明:第三主成分与各个变量之间的相关性。

spss因子分析理论原理及操作分析

spss因子分析理论原理及操作分析

THANKS FOR WATCHING
感谢您的观看
因子命名
根据因子载荷矩阵,为每个因子赋予有意义 的名称。
结果解读
解释方差
分析解释的总方差,了解每个因子的贡献程 度。
因子得分
根据因子得分公式,计算每个观测值的因子 得分,进行进一步的分析或比较。
因子载荷矩阵
解读变量与因子之间的关系,确定每个变量 对因子的影响程度。
解释与讨论
结合研究目的和专业知识,对因子分析结果 进行解释和讨论。
通过因子分析,可以将复杂的数据结构简化为少数几个公共因子,便 于数据的可视化和管理。
缺点
对样本量要求高
因子分析需要较大的样本量才能获得稳 定和可靠的结果,样本量不足可能导致
分析结果不准确。
对变量间相关性要求高
因子分析要求变量间存在较强的相关 性,如果变量间相关性较弱或没有相
关性,分析结果可能不准确。
03 因子分析理论
主成分分析法
总结词
主成分分析法是一种通过线性变换将原始变量转化为少数几个互不相关的主成 分的方法。
详细描述
主成分分析法通过找出原始数据中的主要成分,使得这些主成分能够尽可能地 保留原始数据中的变异信息,从而达到降维的目的。
最大方差法
总结词
最大方差法是一种因子旋转方法,通 过旋转因子轴使得因子的解释方差达 到最大。
目的
简化数据结构、解释变量间的内在关 系、揭示潜在的公共因子、进行综合 评价等。
因子分析的原理
基于变量间的相关性
因子分析通过研究变量间的相关性,将多个变量归结为少数几个 公共因子,这些公共因子能够反映变量间的内在联系。
降维思想
通过提取公共因子,将多个变量归结为少数几个综合指标,实现数 据的降维处理,便于分析。

SPSS因子分析法-内容及案例

SPSS因子分析法-内容及案例

实验课:因子分析实验目的理解主成分〔因子〕分析的根本原理,熟悉并掌握SPSS中的主成分〔因子〕分析方法及其主要应用。

因子分析一、根底理论知识1 概念因子分析〔Factor analysis〕:就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大局部信息的统计学分析方法。

从数学角度来看,主成分分析是一种化繁为简的降维处理技术。

主成分分析〔Principal ponent analysis〕:是因子分析的一个特例,是使用最多的因子提取方法。

它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。

选取前面几个方差最大的主成分,这样到达了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大局部的信息。

两者关系:主成分分析〔PCA〕和因子分析〔FA〕是两种把变量维数降低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子分析的一个特例。

2 特点〔1〕因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。

〔2〕因子变量不是对原始变量的取舍,而是根据原始变量的信息进展重新组构,它能够反映原有变量大局部的信息。

〔3〕因子变量之间不存在显著的线性相关关系,对变量的分析比拟方便,但原始局部变量之间多存在较显著的相关关系。

〔4〕因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。

在保证数据信息丧失最少的原那么下,对高维变量空间进展降维处理〔即通过因子分析或主成分分析〕。

显然,在一个低维空间解释系统要比在高维系统容易的多。

3 类型根据研究对象的不同,把因子分析分为R 型和Q 型两种。

当研究对象是变量时,属于R 型因子分析;当研究对象是样品时,属于Q 型因子分析。

但有的因子分析方法兼有R 型和Q 型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。

4分析原理假定:有n 个地理样本,每个样本共有p 个变量,构成一个n ×p 阶的地理数据矩阵 :当p 较大时,在p 维空间中考察问题比拟麻烦。

SPSS因子分析法

SPSS因子分析法

因子分析因子分析一、基础理论知识1 概念因子分析(Factor analysis):就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。

从数学角度来看,主成分分析是一种化繁为简的降维处理技术。

主成分分析(Principal component analysis):是因子分析的一个特例,是使用最多的因子提取方法。

它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。

选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。

两者关系:主成分分析(PCA)和因子分析(FA)是两种把变量维数降低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子分析的一个特例。

2 特点(1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。

(2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。

(3)因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显著的相关关系。

(4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。

在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理(即通过因子分析或主成分分析)。

显然,在一个低维空间解释系统要比在高维系统容易的多。

3 类型根据研究对象的不同,把因子分析分为R型和Q型两种。

当研究对象是变量时,属于R型因子分析;当研究对象是样品时,属于Q型因子分析。

但有的因子分析方法兼有R型和Q型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。

4分析原理假定:有n 个地理样本,每个样本共有p 个变量,构成一个n ×p 阶的地理数据矩阵 :当p 较大时,在p 维空间中考察问题比较麻烦。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因子得分


因子分析中各个变量的公共因子取值称为因子 得分。从因子分析模型知道,原始变量是公共 因子的线性组合和特殊因子之和。 SPSS提供了三种估计因子得分的方法,它们是 Thomson回归法、Bartlett法和AndersonRubin法。
因子分析案例

SPSS因子分析的菜单是【分析】→【降维】→ 【因子分析】
.855 2 888.038 300 .000
因子分析结果(2)
成份 1 2 3 4 5 6 7 8 9 10
初始特征值 合计 6.50 3.82 2.50 1.68 1.09 0.93 0.85 0.79 0.73 0.70 方差的% 26.02 15.28 10.01 6.74 4.34 3.73 3.41 3.15 2.93 2.78 累积% 26.02 41.30 51.31 58.05 62.39 66.12 69.53 72.67 75.60 78.38 合计 6.50 3.82 2.50 1.68 1.09
本章要求



了解因子分析模型的基本理论; 了解因子分析法的应用条件 因子分析模型的求解方法; 掌握因子分析法的应用; 掌握因子分析法输出结果的解释; 了解因子旋转的方法。
12.1 因子分析简介

有时侯,我们要考察的指标是无法直接测量的。 比如考察学生的学习能力,可以直接测试的指 标有数学、语文、物理等科目的考试成绩,但 是一些抽象的指标,譬如运算能力、表达能力 则无法通过直接测试的方法得到,然而这些抽 象指标却体现在上述可以测试的指标之中。因 子分析法就是研究如何来表达这两类不同性质 的指标之间的关系的。
因子分析结果(3)
成份 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 初始特征值 合计 0.65 0.55 0.53 0.49 0.42 0.39 0.36 0.36 0.30 0.27 0.26 0.24 0.22 0.20 0.16 方差的% 2.59 2.19 2.12 1.96 1.67 1.55 1.45 1.44 1.22 1.10 1.05 0.97 0.87 0.79 0.66 累积% 80.97 83.16 85.28 87.24 88.91 90.46 91.91 93.34 94.56 95.66 96.71 97.68 98.55 99.34 100.00 合计 提取平方和载入 方差的% 累积% 合计 旋转平方和载入 % 累积%
案例1:探索变量间的结构关系


直接从相关系数矩阵或者协方差矩阵开始,用 语法命令的方式来进行因子分析。 为了分析(英格兰)盖尔语、英语、历史、算 术、几何和代数6门学科之间的相互关系, Lawley和Maxwell调查了220名男学生的6门学 科的成绩,并记录下它们的相关系数矩阵
Gaelic English History Arithmetic Algebra Geometry 1.000 0.439 1.000 R 0.410 0.351 1.000 0.288 0.354 0.164 1.00 0.329 0.320 0.190 0.595 1.000 0.248 0.329 0.181 0.470 0.464 1.00
因子分析模型(2)

因子分析模型要求方程(1)满足下列条件:

q<p:公共因子的个数不大于原始变量的个 数 公共因子和特殊因子是不相关的,即: 公共因子F1,…,Fq不相关且方差为1 各个特殊因子不相关,但是方差不要求相等。
Cov(F, ε) 0

因子分析结果解释

因子载荷的意义

在因子上的因子载荷实际上是原始变量和公共因子 的相关系数。它们的大小反映了原始变量对公共因 子的重要性。 它反映了公共因子对原始变量的影响程度 它衡量公共因子的重要性。
子 2 .660 .551 .591 .173 .215 .213
碎石图
因子载荷图
案例2:因子分析在市场调查中的应用

数据文件cereals.sav 某市场调查项目需要了解消费者是否偏爱某个 谷物品牌。现有117个受访者对12个销量比较 好的谷物产品的25个属性进行评分。现在用因 子分析法对消费者的偏好习惯进行分析。哪些 品牌的谷物产品易受消费者青睐?消费者喜欢 哪些属性?这些属性之间有什么关系?
因子分析选项设置(1)
因子分析选项设置(2)

如果因子分析的结果输出错误信息“解不收 敛”,可以考虑更改 “最大收敛性迭代次数” 为一个较大的值,然后重新进行因子分析。
因子分析选项设置(3)
因子分析结果(1)
取样足够度的 Kaiser-Meyer-Olkin 度量。 Bartlett 的球形度检验 近似卡方 Df Sig.
结果分析(1):相关系数矩阵
Englis Gaelic 相 关 h History Arithm eti Algebr a Geome try Gaelic Englis 1.0 00 .43 9 .41 0 .28 8 .32 9 .24 8 h .43 9 1.0 00 .35 1 .35 4 .32 0 .32 9 y .41 0 .35 1 1.0 00 .16 4 .19 0 .18 1 Histor eti .28 8 .35 4 .16 4 1.0 00 .59 5 .47 0 Arithm a .32 9 .32 0 .19 0 .59 5 1.0 00 .46 4 Algebr try .24 8 .32 9 .18 1 .47 0 .46 4 1.0 00 Geome
12.2 因子分析的统计理论

因子分析假设每一个原始变量都可以表示成不 可观测的公共因子的线性组合和一个特殊因子 之和。
X1 1 a11F1 a12 F2 a1q Fq 1 X 2 2 a21 F1 a22 F2 a2 q Fq 2 X a F a F a F p pq q p p1 1 p2 2 p

变量共同度


公共因子的方差贡献

因子分析模型的求解方法 (1)

SPSS中给出了7种求解因子分析模型的方法

主成分 未加权的最小平方法 综合最小平方法 最大似然(K) 主轴因子分解 α因子分解 映像因子分解法。
因子分析模型的求解方法(2)


这7种求解因子分析模型的方法都可以基于相 关系数矩阵 。 主成分、主轴因子分解和映像因子分解 3种方 法既可以基于相关系数矩阵,也可以基于协方 差矩阵。
SPSS数据分析教程
—《SPSS数据分析教程》
第12章 因子分析
目录



12.1 因子分析简介 12.2 因子分析法的统计理论 12.2.1 因子分析的模型 12.2.2 因子分析模型的求解方法 12.2.3 因子分析的应用前提 12.2.4 因子个数的确定 12.2.5 因子的解释 12.2.6 因子旋转 12.2.7 因子得分 12.3 因子分析案例 12.3.1 探索变量间的结构关系 12.3.2 因子分析在市场调查中的应用 12.4 因子分析结果的有效性 12.5 因子分析和主成分分析的比较
因子分析模型(1)

这里q为公共因子的个数 ,F1,…,Fq表示公共 因子 , 也可以表示为下列矩阵形式: (1)
X AF ε

其中,A称为载荷矩阵
a11 a12 a1q a21 a22 a2q A a p1 a p 2 a pq
因 子
初始因子载荷矩阵
因 1 Gaelic English History Arithmeti Algebra Geometry .553 .568 .392 .740 .724 .595
子 2 .429 .288 .450 − .273 − .211 − .132
旋转因子载荷矩阵
因 1 Gaelic English History Arithmeti Algebra Geometry .232 .321 .085 .770 .723 .572
因子个数的确定

有3个方法可以用来确定因子的个数

方差贡献率 设定特征值条件 碎石图
因子旋转


当因子分析模型得到的公共因子没有较好的解 释时,一般可以对因子进行旋转以得到原始变 量和公共因子之间关系的较好解释。 因子旋转分为正交旋转和非正交旋转。在正交 旋转下,特殊因子的协方差、公共因子的协方 差都不变,因此旋转之后的因子仍然是不相关 的。
因子分析的应用前提


因子分析的主要目的是数据降维,如果原始变 量之间没有相关性,因子分析的意义不大。 判断原始变量之间是否有相关性。判断的方法 为Bartlett球形检验和KMO方法。


经验上,因子分析方法要求个案个数是变量个数的 10到25倍。如果个案个数相对于变量个数而言较少, 那么考虑用主成分法来替代。 建议如果变量中有分类变量,那么分类变量的可取 值个数要不小于5。
提取平方和载入 方差的% 26.02 15.28 10.01 6.74 4.34 累积% 26.02 41.30 51.31 58.05 62.39 合计 5.50 3.08 3.07 2.38 1.56
旋转平方和载入 % 22.01 12.31 12.29 9.53 6.25 累积% 22.01 34.32 46.61 56.14 62.39
因子分析是一种数据降维方法

因子分析试图用最少个数的不可观测的互不相 关的公共因子(例如运算能力、表达能力等公 共因子)的线性组合,再加上特殊因子来描述 原来一组可观测的有相互关系的变量。其目的 是尽可能合理地解释存在于原始变量之间的相 关性,并且简化变量的维数和结构。
相关文档
最新文档