因子分析法(自己整理)

合集下载

文档:因子分析法(1)

文档:因子分析法(1)

因子分析法一、 因子分析法的原理因子分析的形成和发展有相当长的历史,最早用于以研究解决心理学和教育学方面的问题,由于计算量大,又缺少高速计算的设备使因子分析的应用和发展受到很大的限制,甚至停滞了很长时间。

由于电子计算机的出现,使因子分析的理论研究和计算,有了很大的进展。

目前这一方法的应用范围已十分广泛。

因子分析是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子,还可以对变量进行分类。

它也是属于多元分析中处理降维的一种统计方法。

因子分析的任务:一是构造一个因子模型,确定模型中的参数,然后根据分析结果进行因子解释;二是对公共因子进行估计,并做进一步分析。

因子分析的一般模型为式中:x1,x2,…,xm 为原始变量;a ij (i=1,2,,m ;j=1,2,,n )为因子载荷;Z i (i=1,2,,n )为公共因子;(i=1,2,,m )为特殊因子。

因子载荷a ij 是第i 个变量在第j 个因子上的载荷,或者说,第i 个变量与第j 个因子的相关系数。

载荷较大,则说明第i 个变量与第j 个因子的关系密切;载荷较小,则说明第i 个变量与第j 个因子关系疏远。

因子载荷矩阵中各行数值的平方和,称为各变量对应的坐标轴。

特殊因子实际上就是实测变量与估计量之间的残差值。

如果特殊因子为零,则称为主成分分析。

为了使找到的主因子更易于解释,往往需要对因子载荷矩阵进行旋转。

旋转的方法有很多,最常用的是最大方差旋转法。

进行旋转的目的,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使大的载荷更大,使小的载荷更小将因子表示为变量的线性组合时,所得到的计算结果称为因子得分,它是对公共因子的估计值。

mn mn m m m n n n n Z a Z a Z a x Z a Z a Z a x Z a Z a Z a x ξξξ++++=++++=++++=...... (22112)22211212112121111二、 采用因子分析法评估的步骤1. 建立评价矩阵,进行因子分析显著性检验将建立的评价指标体系对不同目标分别赋值,建立评价矩阵。

因子分析法自己整理

因子分析法自己整理

因子分析法自己整理因子分析法是一种统计方法,用于探索观测变量之间的潜在结构和关系。

它可以帮助我们理解数据背后的因果关系,发现潜在因素,并减少数据的复杂性。

在本文中,我们将介绍因子分析法的基本原理、应用步骤以及分析结果的解读。

一、因子分析法的基本原理因子分析法的基本原理是将观测变量分解成若干个潜在因子和误差项的线性组合。

这些潜在因子是观测变量背后的真实变量,可以帮助我们理解数据的结构和关系。

和其他统计方法相比,因子分析法更加注重隐含在数据中的潜在因素,而不是变量本身。

二、因子分析法的应用步骤1. 确定研究目的:在进行因子分析之前,我们需要明确研究的目的和问题。

例如,我们想要研究消费者购买行为背后的因素,或者分析某个地区经济发展的潜在因素等。

2. 收集数据:接下来,我们需要收集与研究问题相关的数据。

这些数据可以来自调查问卷、实验数据、观测数据等。

3. 进行因子分析:一旦数据收集完毕,我们可以使用统计软件进行因子分析。

在分析时,我们需要选择适当的因子提取方法和旋转方法,以及确定因子数目。

4. 解释因子:在因子分析的结果中,我们可以得到每个因子的系数,这些系数告诉我们每个观测变量与特定因子之间的关系。

我们可以通过解释因子的载荷矩阵来理解观测变量之间的结构和关系。

5. 验证模型:为了验证因子分析的结果的可靠性和有效性,我们需要进行模型检验。

常用的检验方法包括 Kaiser-Meyer-Olkin (KMO) 测试、巴特利特球形性检验等。

6. 结果解读:最后,我们需要对因子分析的结果进行解读和说明。

根据因子的载荷大小以及理论依据,我们可以给每个因子命名,并解释因子代表的潜在因素。

三、因子分析结果的解读在解读因子分析的结果时,我们可以根据载荷矩阵中的系数来理解观测变量与因子之间的关系。

载荷系数的绝对值越大,表示观测变量与因子的关系越密切。

一般来说,载荷系数大于0.3或0.4的观测变量可以被认为与该因子高度相关。

因子分析步骤范文

因子分析步骤范文

因子分析步骤范文因子分析是一种用于检验变量是否能够归类为一组潜在变量(或因子)的统计方法。

它的基本思想是通过观察变量之间的相关关系,将它们归纳为少量的相互关联的因子,从而实现数据降维和减少信息冗余的目的。

因子分析的步骤主要包括确定因子个数、因子提取、因子旋转和因子解释。

下面我将详细介绍这四个步骤。

1.确定因子个数确定因子个数是因子分析的第一步。

一般来说,最开始可以设定一个较大的因子个数,然后通过一系列的统计方法来逐步缩减因子个数。

常用的方法包括主成分分析、协方差矩阵的特征值分析和并通过解释因子的累计方差。

主成分分析通过特征值分析确定因子个数,特征值大于1的因子被保留;协方差矩阵的特征值分析确定因子个数时,特征值突变点处的因子个数被保留;通过解释因子的累计方差,一般选择累计方差达到80%以上的因子个数。

2.因子提取因子提取是根据因子假设,从原始变量中提取出代表变量间共同特点的因子。

最常用的因子提取方法是主成分分析法和最大似然法。

主成分分析法假设因子之间无关,通过正交变换将原始变量的方差分解为特征值和特征向量,特征向量即为因子载荷。

最大似然法则假设因子是多元正态分布的线性组合,通过最大化样本观测值对因子的似然函数,来估计因子载荷。

3.因子旋转因子旋转是为了将因子与其对应的变量之间的关系更加清晰明了。

常用的旋转方法包括正交旋转和斜交旋转。

正交旋转能够保留因子之间的独立性,常用的有方差最大(varimax)旋转和等距(equimax)旋转。

斜交旋转能够允许因子间存在一定的相关性,常用的有极小残差(direct oblimin)旋转和极大似然(promax)旋转。

旋转之后,通常会选择因子载荷绝对值大于0.3或0.4的变量进行命名,以便更好地解释因子。

4.因子解释因子解释是对提取和旋转后的因子进行解释。

解释因子需要从因子载荷、因子变量之间的相关系数和因子得分的角度进行。

因子载荷表示了变量与因子之间的相关性,越大表示变量在因子上的贡献越大;因子变量之间的相关系数可以帮助解释因子之间的关系,相关系数越大表示两个因子之间的相关性越强;因子得分是指个体在每个因子上的分数,它反映了个体在各个因子上的位置,用于解释个体的特征和性质。

(最新整理)1、因子分析法(FactorAnalysis)

(最新整理)1、因子分析法(FactorAnalysis)
(1)对原始变量标准化。在因子分析求解时若采用主成分法,由于主成分分 析在通过总体协方阵求主成分时,往往优先顾及方差较大的变量,受变量的计量单位 影响较大,有时会造成不合理的结果,所以为了消除这种影响,需在分析之前,对原 始变量标准化。标准化最常规的方法是将原变量数列化为均值为 0、方差为 1 的数列, 即令
Fp
cmU
m
简记为
2
1、因子分析法(FactorAnalysis)
Z A*F C U
(m1) (m p) ( p1) (mm) (m1) (对角阵)
(2)
且满足:(I) P≤m;
(II) COV(F.U)=0 (即 F 与 U 是不相关的); (III) E(F)=0 COV(F)= (1 1) pp I p 。
子空间的一个向量,则 aij 表示 zi 在坐标轴 Fj 上的投影.
因子分析的目的就是通过模型(1)或(2),以 F 代 Z,由于一般有 P<m,从而达
到简化变量维数的愿望。
二、使用软件和软件实现过程
采用 Eviews5。1、SPSS12。0、Stata5。1、SAS Release8.02 等计量软件均可 完成上述因子分子模型,建议采用 SPSS12。0 操作。 因子分析的基本步骤如下(事物可观测原始变量为 x1,x2,……,xp):
1、资料来源
4
1、因子分析法(FactorAnalysis)
消费结构是人们在生活中消费的消费资料和接受的服务种类及其比例关系,也就 是指各类消费支出在总消费支出中的比重.对居民消费支出按照人们实际支出的去 向分类可分为食品、衣着、家庭设备及服务、医疗保健、交通通讯、文教娱乐及服务、 居住、杂项商品及服务。分别记为 X1 , X2 ,…… , X8。根据重庆市统计年鉴 1998~ 2003 年各卷,得重庆市城镇居民消费结构变化如表 1 所示.由表 1 中资料可知,食 品、衣着所占比重从 1998 年开始是下降的.联合国 提出的恩格尔系数(食品在总消费支出中的比重) 判定生活发展阶段的一般标准:60 %以上为贫困, 50%~60%为温饱,40%~50%为小康,40%以下为富裕,可见重庆城 镇居民消费水平已从小康迈向了富裕。家庭设备所占比重也是下降的,这说明居民 对一般家庭设备的需求已经基本饱和,且由于总收入的增加,杂项支出所占比重也 逐年下降。另一方面,表 1 说明:医疗保健、交通通讯、文教娱乐和住房消费所占比 重在逐年上升。这是因为随着社会的发展,居民的保健意识增强,更关注自身的身心 健康,再加上医保制度的改革,所以医疗保健所占比重逐年上升;由于城镇居民家 庭拥有小汽车的比例增加,移动通讯的普遍使用,网络通讯进入家庭,因而交通和 通讯所占比重也是上升的;由于居民对自身进一步发展和子女教育的投入力度加大, 并且在物资享受已经得到满足的情况下更加注重精神享受,所以文教和娱乐方面的 支出增多;随着我国住房制度的改革,居民在居住上面的支出也出现了大幅增加.为 了进一步研究消费结构的变化情况,下面用因子分析法,对表 1 的数据进行统计分析.

因子分析法详细步骤

因子分析法详细步骤
及其特征向量,并由此再估计因子负荷及其各变量的共同度和特殊方差,再由此新估计的共 同度为初始值继续迭代,直到解稳定为止。
• Heywood现象 • 残差矩阵
五、因子旋转
• 目的:使因子负荷两极分化,要么接近于0,要么接近于1。 • 常用的旋转方法:
(1)方差最大正交旋转(varimax orthogonal rotation) • 基本思想:使公共因子的相对负荷(lij/hi2)的方差之和最大,且保持原公共因子的正交性和
• 确定公共因子数; • 计算公共因子的共性方差hi2; • 对载荷矩阵进行旋转,以求能更好地解释公共因子; • 对公共因子作出专业性的解释。
四、因子分析提取因子的方法 • 主成分法(principal component factor)
aij jlji
i 1,2,..., p; j 1,2,...,m
因子分析法详细步骤
二、因子分析模型
一般地,设X=(x1, x2, …,xp)’为可观测的随机变量,且有 • f=(f1,f2,…,fm)’为公共(共性)因子(common factor),简称因子(factor)
X ii a i1 f1 a i2 f2 a im fm e i
• e=(e1,e2,…,ep)’为特殊因子(specific factor) f和e均为不可直接观测的随机变量 • μ=(μ1,μ2,…,μp)’为总体x的均值 • A=(aij)p*m为因子负荷(载荷)(factor loading)矩阵
通常先对x作标准化处理,使其均值为零,方差为1.这样就有
假定(1)fi的均数为0,方差为1;
(2)ei的均数为0,方差为δi;
x af af af e (3) fi与ei相互独立.

因子分析法详细步骤

因子分析法详细步骤

因子分析法详细步骤因子分析是一种常用的多元统计分析方法,用于探索多个变量之间的潜在关系。

它通过将多个变量通过线性组合提取出共同的因子,从而减少变量的维度,并帮助我们理解变量之间的结构。

下面详细介绍了因子分析的步骤。

步骤一:确定研究的目的和研究对象在进行因子分析之前,我们需要明确研究的目的和研究对象。

例如,我们可能希望了解一组问卷测量的心理健康变量之间的结构关系。

步骤二:收集数据收集数据是因子分析的基础。

我们需要选择合适的问卷或量表,并向目标群体发放,以获取相关数据。

通常,我们会收集多个变量之间的相关数据。

步骤三:数据预处理在进行因子分析之前,我们需要对数据进行预处理。

这包括检查数据的缺失值、异常值和离群值,并进行处理。

还需要对变量进行标准化处理,以确保不同变量之间的度量单位一致。

步骤四:选择因子提取方法选择合适的因子提取方法是因子分析的核心。

常用的因子提取方法包括主成分分析(PCA)、最大似然估计和广义最小方差(GLS)等。

不同的方法对于数据的处理和解释有不同的要求和假设。

步骤五:因子提取在此步骤中,我们将应用所选择的因子提取方法,从数据中提取潜在的因子。

提取的因子是原始变量的线性组合,它们能够解释原始变量中的共同变异性。

通常,我们会根据一些准则(如特征值大于1)决定提取几个因子。

步骤六:因子旋转在因子提取之后,我们需要对提取的因子进行旋转,以使因子具有更好的解释性。

常用的旋转方法有方差最大化旋转(Varimax)、极大似然法(Promax)等。

旋转可以使因子在因子载荷矩阵中具有更清晰的结构,以便于解释。

步骤七:因子解释和命名在旋转之后,我们需要解释每个因子的含义,并为每个因子取一个能够反映其内涵的名称。

这需要我们仔细分析因子载荷矩阵,观察变量与因子之间的关系,然后进行命名。

步骤八:因子得分计算在因子分析的最后,我们可以计算每个观测值对于每个因子的得分。

这些得分可以用于进一步的数据分析或其他研究目的。

因子分析法

因子分析法因子分析法是一种基于统计学的方法,用于探索数据中潜在的隐藏结构,以确定变量之间的相关关系。

它在社会科学研究中被广泛应用,用于探究研究对象的潜在变量结构。

因子分析法可以通过把原始变量组合成新的具有含义的变量,来降低数据中的冗余信息,有助于研究者全面理解研究对象特征,以及作出正确的判断和决策,从而更好地为解决社会实际问题服务,有着重要的学术意义与社会意义。

一、因子分析法的历史溯源因子分析法最早起源于美国社会心理学家凯尔(Charles Spearman),在20世纪早期,他研究生物化学的统计学,用于检验的普遍水平尺度和特定水平尺度的可能性,他发现,当把一个变量与另一个变量之间的关系抽象化时,它会隐藏在变量的值中,于是形成了一种新的统计手段,即因子分析法。

之后,此方法被广泛应用于科学研究及其他领域,以确定变量之间的相互联系,并识别出潜在结构、趋势及关联关系。

二、因子分析法的基本原理因子分析法基于把多个变量按变量特征和变量之间的相互关系组合在一起,把多个变量转换成少量几个变量,这些变量也称为因子。

它们是导致原始变量所反映出的潜在结构的原因,可能是变量内在的差异,也可能是变量之间的关系。

因子分析法在实际应用中,最重要的是理解变量之间的关系,而不仅仅是观察原始变量之间的差异,因此,它可以在研究中更有效地发现因素,有助于更精确地描述研究对象。

三、因子分析法的主要方法因子分析法有诸多方法,最基本的是相关分析,但诸如因子模式分解、因子结构分析、多元统计分析等,也是开展因子分析的有力工具,可以辅助分析师更全面地探究变量之间的关系。

因子模式分解(FMA)是因子分析法的一种,它可以让分析师发现一组变量中潜在的结构和模式,同时考虑变量之间的不同关系,以揭示潜在变量结构。

当需要组合多组变量时,可以通过多元统计分析来检验两个或多个因子之间的差异及其关系,以便发现数据关系,检验是否有潜在的结构。

四、因子分析法的应用领域因子分析法在社会科学研究中有着广泛的应用,它可以将原始变量组合成新的有含义的变量,以发现数据之间的隐含关系,并理解一个研究事件的潜在结构。

因子分析法详细步骤

因子分析法详细步骤1.研究设计:-确定研究目的和问题,并确定应用因子分析的数据集。

-确定所需要的变量类型和测量方式。

2.数据收集:-确定数据收集方式和样本大小。

-通过合适的数据收集工具,收集相关变量的数据。

3.数据预处理:-检查数据质量,包括数据完整性、异常值、缺失值等。

-进行数据清洗,如删除无关变量、处理异常值、填充缺失值等。

4.相关性分析:-对每个变量计算相关系数矩阵,用于评估变量之间的相关性。

-检查相关系数矩阵的变量之间的线性关系。

5.适度性检验:- 对数据进行测试适用性检验,可以使用统计方法如列总和测验、Bartlett检验等。

-如果样本适应性检验通过,则可以进行因子分析;否则需要重新考虑数据或模型。

6.因子提取:-使用适当的因子提取方法,如主成分分析、极大似然估计等,将多个变量转化为少数几个无关的因子。

-利用特征值、特征向量、共同度等指标,确定需要提取的因子数量。

7.因子旋转:-在因子提取后,进行因子旋转,以获得更简单的解释和解释性。

- 常用的因子旋转方法包括正交旋转(如Varimax旋转)和斜交旋转(如Oblique旋转)。

8.因子解释:-根据因子载荷、因子结构矩阵等指标,解释每个因子代表的含义和解释率。

-确定每个因子代表的潜在变量特征。

9.因子命名:-为每个因子命名,以便更好地理解和解释。

-命名应根据因子载荷权重和因子在数据集中的重要性进行。

10.因子得分:-使用因子分析结果,计算每个个体在各个因子上的得分。

-这可以帮助理解每个个体在不同潜在变量特征上的表现。

11.结果解释:-基于因子载荷、因子得分、因子解释,解释结果并得出结论。

-分析因子对原始变量的解释能力和解释率,判断因子分析是否有效。

12.结果验证:-使用因子分析结果进行验证,可基于交叉验证、重复抽样等方法。

-检验因子分析的结果是否稳定和可靠。

13.结果报告:-撰写因子分析报告,包括研究目的、方法描述、结果解释、结论等内容。

多元统计分析 因子分析(方法+步骤+分析 总结)

因子分析+聚类分析:一.对数据进行因子分析,实验步骤:1在SPSS窗口中选择:分析-降维-因子分析,在因子分析主界面将变量X1 移入变量框2点击“描述”,在对话框中,统计量选择:原始分析结果,相关矩阵选择:系数,以描述相关系数,点击继续3点击“抽取”,在对话框中,方法为主成份,分析选择:相关性矩阵,输出选择:未旋转的因子解和碎石图,抽取中选择基于特征值(特征值大于1)或者因子的固定数量(要提取的因子为2),点击继续4点击“旋转”,在对话框中,方法为最大方差法,在输出中选择旋转解和载荷图(当因子数=2时),点击继续5点击“得分”,在对话框中,选中“保存为变量”和“显示因子得分系数矩阵”,在方法中选择“回归”,点击继续6点击确定实验结果分析:1.特征根和累计贡献率解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 % 累积 % 合计方差的 % 累积 % 合计方差的 % 累积 %1 2.731 45.520 45.520 2.731 45.520 45.520 2.688 44.802 44.8022 2.218 36.969 82.488 2.218 36.969 82.488 2.261 37.687 82.4883 .442 7.360 89.8484 .341 5.688 95.5365 .183 3.044 98.5806 .085 1.420 100.000提取方法:主成份分析。

由表中可以看出,因为成份1和2的特征值>1,被提取出来,而且由于第三个特征根相比下降比较快,我们也只选取两个公共因子,对1和2旋转后其累计贡献率为82.488%。

由碎石图,我们也可以看出1和2的特征值大于1,可以被提取出来,其余变量特征值过小,不予提取。

成份矩阵a成份1 2v1 .928 .253v2 -.301 .795v3 .936 .131v4 -.342 .789v5 -.869 -.351v6 -.177 .871由旋转前的成分矩阵可以写出每个原始变量关于各个成份的表达式。

因子分析法(自己整理)

因子分析法1.因子分析法简介:1)因子分析法的提出“因子分析”的名称于1931年由Thurstone 首次提出,但它的概念起源于二十世纪初Karl Pearson 和Charles Spearmen 等人关于智力测验的统计分析。

近年来,随着电子计算机的高速发展,人们将因子分析方法成功地应用于各个领域,使得因子分析的理论和方法更加丰富。

2)因子分析的定义因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。

因子分析法(Factor Analysis)就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。

运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。

3)与主成分分析的联系主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。

主成分分析一般很少单独使用:a,了解数据。

(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。

(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。

2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因子分析法1.因子分析法简介:1)因子分析法的提出“因子分析”的名称于1931年由Thurstone 首次提出,但它的概念起源于二十世纪初Karl Pearson 和Charles Spearmen 等人关于智力测验的统计分析。

近年来,随着电子计算机的高速发展,人们将因子分析方法成功地应用于各个领域,使得因子分析的理论和方法更加丰富。

2)因子分析的定义因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。

因子分析法(Factor Analysis)就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。

运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。

3)与主成分分析的联系主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。

主成分分析一般很少单独使用:a,了解数据。

(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。

(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。

2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。

3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。

因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。

4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。

5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。

在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。

和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。

大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。

而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。

当然,这种情况也可以使用因子得分做到。

所以这种区分不是绝对的。

在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。

4)因子分析的主要目标和用途主要目标:数据缩减。

主要用途:1.减少分析变量个数;2.通过对变量间相关关系探测,将原始变量进行分类3.即将相关性高的变量分为一组,用共性子代替该组变量;4.既可以进行探索性因子分析,也可以部分验证因子.2.因子分析的原理1)因子分析的基本思想因子分析可以看成是主成分分析的一种推广。

它的基本目的是,用少数几个因子F1 、F2 、.、Fm 去描述许多变量之间的关系。

被描述的变量X1 、X2 、.、Xp 是可以观测的随机变量,即显在变量。

而这些因子是不可观测的潜在变量。

因子分析是基于信息损失最小化而提出的一种非常有效的方法。

它把众多的指标综合成几个为数较少的指标,这些指标即因子指标。

2)因子的特点1.因子变量的数量远远少于原始变量的个数;2.因子变量并非原始变量的简单取舍,而是一种新的综合;3.因子变量之间没有线性关系;4.因子变量具有明明解释性,可以最大限度地发挥专业分析的作用。

3)因子分析流程图4)因子分析的模型因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。

它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。

对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。

因子分析模型描述如下:(1)X = (x1,x2,…,xp)¢是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现)。

(2)F = (F1,F2,…,Fm)¢(m<p)是不可测的向量,其均值向量E(F)=0,协方差矩阵Cov(F) =I,即向量的各分量是相互独立的。

(3)e = (e1,e2,…,ep)¢与F相互独立,且E(e)=0, e的协方差阵∑是对角阵,即各分量e之间是相互独立的,则模型:x1 = a11F1+ a12F2 +…+a1mFm + e1x2 = a21F1+a22F2 +…+a2mFm + e2………xp = ap1F1+ ap2F2 +…+apmFm + ep称为因子分析模型,由于该模型是针对变量进行的,各因子又是正交的,所以也称为R型正交因子模型。

其矩阵形式为: x =AF + e .其中:x=,A=,F=,e=这里,(1)m £ p;(2)Cov(F,e)=0,即F和e是不相关的;(3)D(F) = Im ,即F1,F2,…,Fm不相关且方差均为1;D(e)=,即e1,e2,…,ep不相关,且方差不同。

我们把F称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,e 称为X 的特殊因子。

A = (aij),aij为因子载荷。

数学上可以证明,因子载荷aij就是第i变量与第j因子的相关系数,反映了第i变量在第j因子上的重要性。

5)模型的意义模型中F1,F2,…,Fm叫做主因子或公共因子,它们是在各个原观测变量的表达式中都共同出现的因子,是相互独立的不可观测的理论变量。

公共因子的含义,必须结合具体问题的实际意义而定。

e1,e2,…,ep叫做特殊因子,是向量x的分量xi(i=1,2,…,p)所特有的因子,各特殊因子之间以及特殊因子与所有公共因子之间都是相互独立的。

模型中载荷矩阵A中的元素(aij)是为因子载荷。

因子载荷aij是xi与Fj的协方差,也是xi与Fj的相关系数,它表示xi依赖Fj的程度。

可将aij看作第i个变量在第j公共因子上的权,aij的绝对值越大(|aij|£1),表明xi与Fj的相依程度越大,或称公共因子Fj对于xi 的载荷量越大。

为了得到因子分析结果的经济解释,因子载荷矩阵A中有两个统计量十分重要,即变量共同度和公共因子的方差贡献。

因子载荷矩阵A中第i行元素之平方和记为hi2,称为变量xi的共同度。

它是全部公共因子对xi的方差所做出的贡献,反映了全部公共因子对变量xi的影响。

hi2大表明x的第i个分量xi对于F的每一分量F1,F2,…,Fm的共同依赖程度大。

将因子载荷矩阵A的第j列( j =1,2,…,m)的各元素的平方和记为gj2,称为公共因子Fj对x的方差贡献。

gj2就表示第j个公共因子Fj对于x的每一分量xi(i= 1,2,…,p)所提供方差的总和,它是衡量公共因子相对重要性的指标。

gj2越大,表明公共因子Fj对x的贡献越大,或者说对x的影响和作用就越大。

如果将因子载荷矩阵A的所有gj2 ( j =1,2,…,m)都计算出来,使其按照大小排序,就可以依此提炼出最有影响力的公共因子。

3.因子分析步骤因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。

因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。

(i)因子分析常常有以下四个基本步骤:(1)确认待分析的原变量是否适合作因子分析。

(2)构造因子变量。

(3)利用旋转方法使因子变量更具有可解释性。

(4)计算因子变量得分。

(ii)因子分析的计算过程:(1)将原始数据标准化,以消除变量间在数量级和量纲上的不同。

(2)求标准化数据的相关矩阵;(3)求相关矩阵的特征值和特征向量;(4)计算方差贡献率与累积方差贡献率;(5)确定因子:设F1,F2,…, Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;(6)因子旋转:若所得的m个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。

(7)用原指标的线性组合来求各因子得分:采用回归估计法,Bartlett估计法或Thomson估计法计算因子得分。

(8)综合得分以各因子的方差贡献率为权,由各因子的线性组合得到综合评价指标函数。

F = (w1F1+w2F2+…+wmFm)/(w1+w2+…+wm )此处wi为旋转前或旋转后因子的方差贡献率。

(9)得分排序:利用综合得分可以得到得分名次。

4.关键名词解释1)因子旋转建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个主因子的意义,以便对实际问题进行分析。

如果求出主因子解后,各个主因子的典型代表变量不很突出,还需要进行因子旋转,通过适当的旋转得到比较满意的主因子。

目的:使因子负荷两极分化,要么接近于0 ,要么接近于1 。

常用的旋转方法:(1)方差最大正交旋转(varimax orthogonal rotation)(2)斜交旋转(oblique rotation)(3)方差最大正交旋转(varimax orthogonal rotation)基本思想:使公共因子的相对负荷(lij/hi2)的方差之和最大,且保持原公共因子的正交性和公共方差总和不变。

可使每个因子上的具有最大载荷的变量数最小,因此可以简化对因子的解释。

2)斜交旋转因子斜交旋转后,各因子负荷发生了较大变化,出现了两极分化。

各因子间不再相互独立,而彼此相关。

各因子对各变量的贡献的总和也发生了改变。

适用于大数据集的因子分析。

3)因子得分因子分析模型建立后,还有一个重要的作用是应用因子分析模型去评价每个样品在整个模型中的地位,即进行综合评价。

例如地区经济发展的因子分析模型建立后,我们希望知道每个地区经济发展的情况,把区域经济划分归类,哪些地区发展较快,哪些中等发达,哪些较慢等。

相关文档
最新文档