探索性因素分析
探索性因素分析的原理与步骤知识讲解

探索性因素分析的原理与步骤知识讲解探索性因素分析(Exploratory Factor Analysis,EFA)是一种多变量分析方法,旨在确定观察数据中潜在的结构或维度。
它可以帮助研究者发现数据中隐藏的模式和关联,进而减少数据的复杂性,并起到简化和理解数据的作用。
以下是探索性因素分析的原理与步骤的知识讲解。
原理:探索性因素分析基于统计原理,假设观察数据是由一组潜在变量(即因素)决定的。
每个因素代表一组具有内在关联的观察变量,它们共同解释了数据中的方差。
因此,探索性因素分析的目标是找出这些潜在因素的数量和结构,并确定它们与观察变量之间的关系。
步骤:1.确定分析目标:在进行探索性因素分析之前,需要明确分析的目标和研究问题。
明确问题有助于选择适当的分析方法和解释结果。
2.数据准备与预处理:将需要分析的数据整理为适合因素分析的格式。
常见的预处理包括数据标准化、缺失值处理和异常值处理等。
4.因素提取:在这一步骤中,通过计算特征值、特征向量或因子载荷来确定潜在因素的数量和结构。
特征值表示一个因素解释的方差比例,而特征向量是表示潜在因素之间关系的向量。
因子载荷是观察变量与潜在因素之间的相关系数。
5. 因子旋转:在因子提取之后,因子结构可能并不是直观和可解释的。
因此,需要进行因子旋转以改善因子解释性和解释因素的意义。
常见的因子旋转方法包括正交旋转(如Varimax)和斜交旋转(如Promax)等。
6.因子解释和命名:根据提取的因子载荷和因子旋转结果,解释每个因素所代表的观察变量的意义。
通过命名每个因素,以增加对潜在因素结构的理解和解释。
7.评估因子模型:对于确定的因子结构,需要进行信度和效度分析来评估模型的质量和适用性。
信度分析衡量因子和观察变量之间的内部一致性,而效度分析衡量因子与其他变量之间的关系。
8.结果解释与报告:根据分析结果进行解释和报告。
包括提取的因子数目、每个因子的载荷、因子间的关系、因子的解释以及模型的信度和效度指标。
使用SPSS进行探索式因素分析的教程

使用SPSS进行探索式因素分析的教程探索性因素分析是一种统计方法,用于确定一组变量之间的潜在结构。
SPSS是一种常用于数据分析的软件工具,它提供了强大的因素分析功能。
以下是一个使用SPSS进行探索性因素分析的简单教程,该教程可以帮助您了解如何使用SPSS来执行因素分析并对结果进行解释。
步骤1:导入数据步骤2:准备数据确保您的数据符合因素分析的前提条件。
确定您要进行因素分析的变量是否具有线性关系,并进行必要的数据转换(例如,对数转换)以满足这个条件。
步骤3:执行因素分析在SPSS的“分析”菜单下,选择“数据准备”和“因子”。
在弹出的对话框中,选择您要进行因素分析的变量并将其移动到“因子”框中。
选择“萃取方法”(如主成分分析或最大似然估计)并指定要提取的因素的数量。
您还可以选择执行因子旋转以获得更简单和解释性更强的因子结构。
步骤4:解读结果SPSS将生成一个因素分析的输出报告,其中包含多个表格和图形。
以下是一些常见的解读步骤:-总体解释:观察“总体解释”表,了解因子数量和提取方法的解释力度。
查看“因素”的特征值,了解提取的因子解释的总方差比例。
-因子负荷:查看“因子负荷”表,该表显示了原始变量与提取的因子之间的相关性。
较高的因子负荷表示原始变量与特定因子之间的较强关联。
-因子旋转:如果您选择了因子旋转,则查看“旋转因子载荷矩阵”表,该表显示了旋转后的因子负荷。
查看这些旋转后的因子负荷以确定是否存在更简单的因子结构。
-因子得分:根据选定的因子分析方法,可以生成每个观测值的因子得分。
这些得分表示了每个观测值在每个因子上的得分情况,可以用于后续的分析和解释。
步骤5:解释因子根据因子负荷和因子名称,解释每个因子代表的潜在结构。
结合领域知识和因子负荷,您可以确定每个因子是否与特定概念或潜在维度相关联。
步骤6:结果报告根据您的研究目的和需要,将因子分析的结果写入报告中。
确保清楚地描述因子数量、命名以及每个因子代表的结构或概念。
张厚粲《现代心理与教育统计学》(第3版)配套题库[课后习题](多变量统计分析简介)
](https://img.taocdn.com/s3/m/2df4574c49649b6649d7470b.png)
第13章多变量统计分析简介1.探索性因素分析与验证性因素分析有什么区别?答:(1)探索性因素分析(exploratory factor analysis,简写为EFA)就是指传统的因素分析。
这种因素分析方法对于观察变量因子结构的寻找,并未有任何事前的预设假定。
对于因子的抽取、因子的数目、因子的内容以及变量的分类,研究者也没有事前的预期,而是由因素分析的程序去决定。
在典型的EFA中,研究者通过共变关系的分解,找出最低限度的主要成分(principal component)或共同因子(common factor),然后进一步探讨这些主成分或共同因子与个别变量的关系,找出观察变量与其相对应因子之间的强度,也就是因子负荷值(factor loading),以说明因子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。
由于传统的因素分析企图找出最少的因子来代表所有的观察变量,因此研究者必须在因子数目与可解释变异量(explained variance)两者间寻找平衡点。
因为因素分析至多可以抽取出相等于观察变量总数的因子数目,这样,虽然可以解释全部百分之百的变异,但失去因素分析找寻因子结构的目的,但如果研究者企图以少数几个较明显的因子来代表所有的项目,势必然将损失部分可解释变异来作为代价。
因而在EFA中,研究者相当一部分工作是在决定因子数目与提高因子解释的变异(即R square)。
(2)验证性因素分析(confirmatory factor analysis,简写为CFA)是在研究人员积极改善传统因素分析的限制,扩大其应用范围的基础上产生的。
这类因素分析要求,研究者对于潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观察变量的组成模式,进行因素分析的目的是为了检验这一先期提出的因子结构的适合性。
这种因素分析方法也可用于理论架构的检验,它在结构方程模型中占有相当重要的地位,有着重要的应用价值,也是近年来心理测量与测验发展中相当重视的内容。
探索性因素分析

4. 根据以上三方面的信息将可能的因素个数压 缩到一个比较小的范围内
5. 根据4 分别抽取不同个数的因素比较旋转后 因素负荷的可解释性以作出最终决定
这是一个相对比较全面的程序。研究者可以 批判性地采用总之因素个数的确定并不存在 着唯一 正确 客观的答案
最大似然法的模型拟合度
由因素个数从多到少考察最大似然法的 模型拟合度
当拟合度由不显著变为显著时,此时的 因素数目即合适的因素抽取个数
因素所能解释方差的百分比
所有因素所能解释方差的累计百分比应 超过40%。
Browne 提出了以下的程序
1. 考虑研究者在理论中是否事先假设了因素个 数
2. 考虑一些简单方法如Kaiser 法,Scree Test 所提供的信息
最大似然法 (maximum-likelihood method)
–相关系数经变项的残差 (uniqueness)加权后,利用参数 估计(paratemer estimation)原 理,估计出最可能出现的相关矩阵 的方法 。
主成分分析 (PCA) 与 主因素分析 (PFA) 的适用条件
目的方面:PCA用于分类; PFA用于探讨结构 PCA
PCA 特征值 > 1 的规则抽取 直交旋转 因素负载只显示>.40的,整齐结构
1.因素的抽取 2. 因素个数的确定 3. PCA结构矩阵所包含的信息 4. 因素的命名 5. 因素转轴 6. 因素分析的统计假定 7. 主成分分析和因素分析 8. 探索性因素分析和验证性因素分析
1.因素的抽取 (factor extraction)
解释一组变量的总方差 (独特方差+共同方差 ) 可用于对一组变量进行分类 是最常用的因素分析选择。
体育科学研究方法——第五章资料的整理与分析方法

体育科学研究方法——第五章资料的整理与分析方法尊敬的各位领导、专家、同事们:大家好!我今天将为大家讲解体育科学研究方法的第五章,资料的整理与分析方法。
资料的整理与分析是体育科学研究中非常重要的一环。
合理地整理和分析数据,可以为研究者提供有力的支持和论证,进而推动科学研究的发展。
一、资料的整理方法1.数据清洗数据清洗是整理数据的第一步,它的目的是删除、修正不完整、错误或不适用的数据。
数据清洗时,我们要注意遵循科学原则,确保数据的真实性、准确性和可靠性。
2.数据归类数据归类是将数据按照一定的规则分类,使得整理后的数据具有明确的结构和体系。
数据归类可以根据不同的研究目的和主题进行,例如按照运动员的年龄、性别、水平等进行分类。
3.数据标记数据标记是对整理后的数据进行标识和注释,以便后续的分析和处理。
数据标记可以通过添加注释、编号、符号等方式进行,使得数据在后续的分析过程中有更好的辨识度和可读性。
二、资料的分析方法1.描述性统计描述性统计是通过计算数据的均值、标准差、频数等指标来描述数据的主要特征和分布情况。
常用的描述性统计方法包括原始数据的整理和绘制直方图、散点图、饼图等,以及计算数据的总体均值、中位数、众数等。
2.探索性因素分析探索性因素分析是通过对数据进行降维处理,找出变量之间的相关性,提取出数据中的主要因素,并给出各因素的权重。
探索性因素分析在体育科学研究中常用于提取运动员身体素质测试中的主要影响因素。
3.相关性分析相关性分析是通过计算数据间的相关系数,研究两个或多个变量之间的相关关系。
常见的相关性分析方法包括皮尔逊相关系数、斯皮尔曼等级相关系数等。
相关性分析可以帮助研究者了解变量之间的关系,对研究结果进行解释和预测。
4.归因分析归因分析是研究数据中各因素对结果的影响程度和贡献度。
归因分析可以通过单因素方差分析、多因素方差分析等方法进行。
归因分析有助于确定哪些因素对结果具有显著影响,为研究者提供筛选和优化变量的依据。
探索性因素分析讲解

二、探索性因素分析的原理
1、因素分析模型 K个观测变量,分别为x1,x2,…,xk, xi为具有零均值, 单位方差的标准化变量。 因子模型的一般表达式为:
因子负载(Factor loadings) 特殊因子 (Ufacotor)
xi ai1 f 1 ai 2 f 2 ... aimfm ui (i 1, 2,..., k )
因子之间彼此独立 特殊因子和公因子之间彼此独立
二、探索性因素分析的原理
a11 .
二、探索性因素分析的原理
2、因素分析中的有关概念 (1)因子负载(loading):当公因子之 间完全不相关时,aij等于第i个变量和第j个 因子之间的相关系数。 反映了因子和变量之间的相关程度 大多数情况下,人们往往假设公因子之间 时彼此正交的(Orthogonal),即不相关。
三、探索性因素分析的步骤
判断是否适合做因素分析的方法:
(2)巴特利特球体检验(Bartlett test of sphericity) 差异显著——适合做因素分析
三、探索性因素分析的步骤
(3)KMO(Kaiser-Meyer-Olkin Measure of Sampling Adequacy)测度 比较观测变量之间的简单相关系数和偏相 关系数的相对大小出发,其值的变化范围 从0到1 KMO<0.5肯定不适合做因素分析,最好大 于0.8
四、求解初始因子
2、公因子分析法 公因子方差的估计
用主成分分析的结果作为公因子方差的初始估计值 把每个变量和其余变量的相关系数中绝对值最大的, 作为该变量的公因子方差的初始估计值 用每个变量和剩下的其他变量的复相关系数的平方, 即R2作为该变量的公因子方差的初始估计值。
探索性因素分析的原理与步骤

(五)、因子的解释
经验性&主观色彩 合理即可接受
分析 过程
1
操作 演示
结果 展示
2 3
目录
*
数据
数据符合相应假设 从数据得到的信息 进行EFA的必要性
SPSS操作演示
基于EFA对量表进行初步修订
判断:判断该数据是否适合采用因子分析 删除:删除那些负载小和重复负载的变量 提取:根据新的旋转成份矩阵和碎石图 方案:提出量表进一步修订的建议和方案
(三)、因子提取
三种方法:
1. 以特征跟是否>1为标准 2. 参考特征跟的碎石图 3. 方差贡献率
(三)、因子提取
唯一 正确 客观
综合判断
(四)、因素的旋转
目的:更易解释的负荷结构 方法:正交旋转VS斜交旋转
(四)、因素旋转
因素间可以相关 事实上的相关被强制限制 导致较差的拟合度 斜交旋转能提供更多的信息
分析 过程
1
操作 演示
结果 展示
2 3
目录
*
分析 过程
1
操作 演示
结果 展示
2 3
目录
*
探索性因素分析的基本过程
(一)、确定变量及样本
1. 高质量的数据产生高质量的信息 2.否则就是garbage in,garbage out
(二)、判断是否适合做EFA
1. 观察相关矩阵 2.KMO值检验和球形检验的结果
因子累计方差贡献率为55.866%,各个项目在相应因素上 具有较大的负荷,处于.553-.821之间。各因子内部一致性 系数在.803-.826, 问卷总的内部一致性系为.875。
。结果表示如下:
(四)、最终结果呈现
探索性因素分析

PFA
解释一组变量的共同方差(独特方差被设定为0) 可用于确定一组变量的维度 如量表中的一组题目 特别是用于检验一个 因素 能否解释一组变量的共同方差 缺点是有时会得到负的特征值, 是无意义的.
3. 考虑由最大似然法所产生的模型拟合度的信 息
4. 根据以上三方面的信息将可能的因素个数压 缩到一个比较小的范围内
5. 根据4 分别抽取不同个数的因素比较旋转后 因素负荷的可解释性以作出最终决定
这是一个相对比较全面的程序。研究者可以 批判性地采用总之因素个数的确定并不存在 着唯一 正确 客观的答案
• 主成份分析法适用状况于单纯为简化大量变 项为较少数的成份时,以及作为因素分析的 预备工作。
主轴因素法 (principal axis factors)
• 分析变项间的共同变异量而非全体变异量。 • 将相关矩阵中的对角线,由原来的1.0改用
共同性(communalities)来取代。 • 目的在抽出一系列互相独立的因素。第一
因素分析中的共同方差,独特方差和误差方差
2.因素个数的确定
因素个数的确定是探索性因素分析中的 一个非常重要的决定,因为一旦因素个 数确定模型的拟合度也就确定了,不随 以后因素的旋转而改变 。
Kaiser 法
特征值代某一因素可解释的总变异量,特征 值越大,代表该因素的解释力越强。
特征值以1为标准。低于1的特征值,代表该 因素的变异数少于单一一个变项的变异数1, 无法以因素的形式存在。
PC1
PC2
.49
.20
Depression
.49
.23
Anger
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
17
共同性與解釋百分比
Communality共同性:
變項的變異量被因素解釋的百分比
− .086 .981 − .071 − .977 Αrotated = .994 .026 .997 − .040
(-.086)2+(.981)2=.970 (-.071)2+(-.997)2=.960 (.994)2+(.026)2=.989 (997)2+(-.040)2=.996 1.919 .48 3.915 .98
5
因素分析的類型
不同平平方法皆產生直交的成分或因素來反應觀察相關矩陣R
不同點在於抽平的標準不同,例如最大變異、最小殘差等 當樣本數大、觀察變項數目多或共同性估計相近時,各方法差異不大 因素分析結果是否穩定不是決定於平平的方法而是變項間的關係
方法目的
PCA:單純的化簡測量(得到成分components) FA:尋找測量題目背後的結構與理論意涵,並利用這些潛在結構進行分析應用(得到因素 factors )
18
SUM= 1.994 %= .50
重重矩陣
重重矩陣為由因素所推導出的相關矩陣
R
− .086 .981 .970 − .953 − .059 − .125 − .071 − .977 − .086 − .071 .994 .997 − .953 .962 − .098 − .033 R = = .994 .026 .981 − .977 .026 − .040 − .059 − .098 .989 .990 .997 − .040 − .125 − .033 .990 .996
Oblique rotation(斜交轉軸)
允許因素間具共相關之轉軸 因素間最大的相關由δ(delta)決定, 負的δ越小,表示月接近直交, δ=-4為 直交, δ接近1時,因素間的相關可能最高 Direct oblimin:使因素負荷量的差累(cross-products)最小化 Direct quartimin:使型態矩陣中的負荷量平方的差累(cross-products)最小化 Orthoblique:使用quartimax計式將因素負荷量重新量尺化(rescaled)以產生直交 的結果,因此最後的結果保共斜交的性質 Promax:將直交轉軸(varimax)的結果再進行共相關的斜交轉軸。因素負荷量平2, 9 4,6次方以產生接近0但不為零的值,藉以找出因素間的相關,但仍保共最簡化因 素的特性
實務層次的問題
因素分析受到相關係數的特性所影響,任何影響相關係數的原因都可能干擾因 素分析 樣本數、遺漏值、常態性、線性關係、偏離值 多元共線性(multicollinearity)與單一性(singularity),極端的共線性與單一性個於 因素分析具共影響 相關係數的大小:如果觀察矩陣中相關係數均小於.3,抽平因素能力低,可能 需放棄使用因素分析 因素分析的偏離值:當某測量變項不被因素所解釋時。當僅共兩個變項所決定 的因素,可能是一種不穩定的因素。
相關矩陣R 上式可以轉成為R=AA’,A稱為因素負荷矩陣
特徵值矩陣L
R = VLV ′ = V L LV ' = (V L )( LV ' ) = AA′
15
因素負荷矩陣
前式可以轉成為R=AA’,A稱為因素負荷矩陣
R = VLV ′ = V L LV ' = (V L )( LV ' ) = AA′
A =V L
− .283 .651 .177 − .685 2.00 A= − .658 .252 .00 .207 .675 − .400 .900 .00 .251 − .947 = .348 1.91 .932 .286 .956
探索性因素分析: 主成分分析與因素分析
1
相關矩陣
Observed correlation matrix
由觀察變項計計得到的相關係數矩陣
Reproduced correlation matrix
由因素導出的相關係數矩陣
Residual correlation matrix
觀察相關係數矩陣與重重相關係數矩陣的差異
平平結果
PCA:
以最少的直交成分來解釋最大的變項變異量 具共單一的數學解
FA:
以最少的直交因素來反應相關矩陣 具共不同的最佳解
6
不同的平平方法一
主成分法(Principal components) 目的在使每一個成分能夠個表最大的觀察變異量 第一個主成分為觀察變項的線性整合,能夠反應最大的變異量, 依序發展各主成分 可以得到最大的解釋變異量 主要因素法(principal factors) 以共同性為分析的個象 因素的抽平以個個程序來進行,起始值為SMC(squared multiple correlations),反覆帶入共同性直到無改善 能夠產生最理想的重重矩陣 映像因素平平(image factor extraction) 各觀察變項的變異量為其他變項的投射。每一個變項的映像分數 係以多元迴歸的方法來計計,映像分數的共變矩陣被進行PCA 類似PCA,能夠產生單一的數學解,個角線與FA相同,為共同 性 因素負荷量不是相關係數,而是變項與因素的共變 7
相關矩陣中的個角線個表變項的標準化的變異量(1.00) 因素分析經由因素的平平個於觀察變項相關矩陣進行平平後,轉成 成為特徵值(L) L=V’RV V’V=I V稱為特徵向量
1.00 − .953 − .055 − .130 − .283 .651 − .283 .177 .658 .675 − .953 1.00 − .091 − .036 .177 − .685 2.00 .00 L= = .651 − .685 .252 .207 − .055 − .091 1.00 .990 − .658 .252 .00 1.91 1.00 .675 .207 − .130 − .036 .990
13
因素分析的範例解明
Cost
Cost of ski ticket S1 S2 S3 S4 S5
Lift
Speed of ski lift
Depth
Depth of snow
Powder
Moisture of snow
32 61 59 36 62
Cost Cost Lift Depth Powder
Pattern matrix型態矩陣
斜交轉軸後各觀察變項與因素間排除因素間相關後之相關係 數矩陣 為斜交轉軸可以反應因素意義的係數
Factor score coefficients matrix因素分數係數矩陣
用以反應因素得分的類迴歸方程式係數矩陣
3
因素分析的目的與問題
因素分析的主要目的在將繁多的變項縮減為少 數的因素,找出變項背後的結構,涉及下列問 題的探討
16
直交轉軸
Varimax法:將因素負荷量的變異數最大化 將高相關更高,低相關更低(19度轉軸)
ΑunrotatedΛ = Αrotated
cos Ψ − sin Ψ Λ= sin Ψ cos Ψ
Α rotated − .400 .900 − .086 .981 .251 − .947 .946 .325 − .071 − .977 = .325 .946 = .994 .932 .348 .026 .286 .956 .997 − .040
2
因素分析的各類矩陣
Orthogonal rotation直交轉軸
所共的因素不具共相關的轉軸結果
Oblique rotation斜交轉軸
因素間具共相關的轉軸結果
Loading matrix因素負荷矩陣
直交轉軸後各觀察變項與因素間的相關係數矩陣
Structure matrix結構矩陣
斜交轉軸後各觀察變項與因素間的相關係數矩陣
Alpha 因素平平 法
1 -.086 -.071 .994 .997 1.997 49.93 1.995 49.87 97.85 2 -.981 .977 -.026 .040 1.917 47.92 1.919 47.99
映像因素平平 法
1 -.086 -.071 .993 .993 1.984 49.61 1.983 49.59 96.35
8
Rotation 轉軸
轉軸的時機
依目的:得到最佳的結構,或保留因素的原始面貌 利用因素散佈圖協助判斷:觀察變項應在各軸上:接近各軸,遠離原點,形成群 落
Orthogonal rotation(直交轉軸)
Varimax:使負荷量的變異數在因素內最大( Г =1) Quartimax :使負荷量的變異數在變項內最大( Г =0) Equamax :綜合前兩者,使負荷量的變異數在因素內與變項內同時最大( Г =.5) Г(gamma)指標:表示簡化的程度:0表變項最簡化,1表因素最簡化,.5表兩者 各半