因子分析

合集下载

因子分析

因子分析

因子分析因子分析是指研究从变量群中提取共性因子的统计技术。

最早由英国心理学家C.E.斯皮尔曼提出。

他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。

因子分析可在许多变量中找出隐藏的具有代表性的因子。

将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。

1、探索性因子分析的方法约有10多种,如重心法、影像分析法,最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。

这些方法本质上大都属近似方法,是以相关系数矩阵为基础的,所不同的是相关系数矩阵对角线上的值,采用不同的共同性□2估值。

在社会学研究中,因子分析常采用以主成分分析为基础的反覆法。

主成分分析为基础的反覆法主成分分析的目的与因子分析不同,它不是抽取变量群中的共性因子,而是将变量□1,□2,…,□□进行线性组合,成为互为正交的新变量□1,□2,…,□□,以确保新变量具有最大的方差:在求解中,正如因子分析一样,要用到相关系数矩阵或协方差矩阵。

其特征值□1,□2,…,□□,正是□1,□2,…,□□的方差,对应的标准化特征向量,正是方程中的系数□,□,…,□。

如果□1>□2,…,□□,则对应的□1,□2,…,□□分别称作第一主成分,第二主成分,……,直至第□主成分。

如果信息无需保留100%,则可依次保留一部分主成分□1,□2,…,□□(□<□)。

当根据主成分分析,决定保留□个主成分之后,接着求□个特征向量的行平方和,作为共同性□:□并将此值代替相关数矩阵对角线之值,形成约相关矩阵。

根据约相关系数矩阵,可进一步通过反复求特征值和特征向量方法确定因子数目和因子的系数。

因子旋转为了确定因子的实际内容,还须进一步旋转因子,使每一个变量尽量只负荷于一个因子之上。

这就是简单的结构准则。

常用的旋转有直角旋转法和斜角旋转法。

因子分析法

因子分析法

因子分析法因子分析法,又称因子分析,是在描述、预测和理解给定的研究结果时一种常用的统计分析方法。

它可用于探索数据中潜在的因素结构,以及找出影响解释变量的最重要的驱动因子。

因子分析涉及多个变量,可以将数据中的噪声减少到最小,并对变量之间的关系进行建模以实现最佳假设。

因子分析的主要目的是通过分析变量之间的关系,将多个变量组合起来,形成一个有意义的因子结构,有助于来源于同一个因素的变量聚为一类。

因子分析还可以用于验证现有的统计模型,检测数据中是否存在偏差,以及主成分分析中用于减少变量数量。

因子分析通常需要经历四个步骤:实验设计、数据处理、因子分析以及结果分析和解释。

实验设计阶段,研究者需要收集所需要的数据,如变量的定义、变量的数量、测量方式等;数据处理阶段,一般包括数据属性的编码、检查缺失值以及数据的标准化;在因子分析阶段,研究者需要指定假设的因子个数,并根据特定的方法进行变量的讯析;最后,研究者可以检查因子提取结果,并通过模态图和层次图等绘图方法对因子分析结果进行可视化,以更好地理解研究的解释变量。

因子分析的优点在于,它是一种基于模型的统计分析方法,它可以通过分析变量之间的关系来减少数据中的噪声,以提高分析的准确性。

另外,因子分析可以从复杂的数据中提取出重要的因素,以便进行有用的模型建构。

然而,因子分析也存在一些缺点。

由于因子分析假设只有有限数量的因子导致了变量,因此不能解释所有变量之间的关系。

此外,因子分析受到偏差和方差的影响,某些变量可能被忽略了,而有些因素可能被过分重视。

总而言之,因子分析方法是一种有效的研究工具,可用于简化复杂的数据,探索数据中潜在的因素结构,以及验证和解释研究结果。

因此,有效的因子分析有助于研究者更好地理解数据,并得出合理的结论。

第六讲因子分析

第六讲因子分析

第六讲因⼦分析第五讲因⼦分析在许多实际问题中,涉及的变量众多,各变量间还存在错综复杂的相关关系,这时最好能从中提取少数综合变量,这些综合变量彼此不相关,⽽且包含原变量提供的⼤部分信息。

因⼦分析就是为解决这⼀问题提供的统计分析⽅法。

以后,如⽆特别说明,都假定总体是⼀个p维变量:它的均值向量,协⽅差矩阵V=(ij)pp都存在。

第⼀节正交因⼦模型1.1 公共因⼦与特殊因⼦从总体中提取的综合变量:F1, F2, … , F m(m于是,我们有:变量X i的信息=公共因⼦可以表达部分公共因⼦不可表达部分这就是所谓因⼦模型。

⽬前,公共因⼦可以表达的部分由公共因⼦的线性组合表⽰。

即上⾯的因⼦模型可以写成以下的形式:1.2 正交因⼦模型设总体,均值向量,协⽅差矩阵。

因⼦模型有形式:其中m如果引⼊以下向量与矩阵:则因⼦模型的矩阵形式为:对于正交的因⼦模型,还要进⼀步要求:z1. 。

即有:公共因⼦是互相不相关的。

z2. 。

即:特殊因⼦和公共因⼦不相关。

1.3 因⼦载荷矩阵1.矩阵A称为因⼦载荷矩阵(component matrix),系数a ij称为变量X i在因⼦F j上的载荷(loading)。

由于特别,如果总体是标准化的,则有Var(X i)=1,从⽽有:于是:即变量X i在公共因⼦F j上的载荷a ij就是X i与F j的相关系数。

2.载荷矩阵的估计:主成分法。

主成分法是估计载荷矩阵的⼀种⽅法,由于其估计结果和变量的主成分仅相差⼀个常数倍,因此就冠以主成分法的名称。

在学到这⾥的时候,不要和主成分分析混为⼀谈。

主成分法是SPSS系统默认的⽅法,在⼀般情况下,这是⽐较好的⽅法。

以数据“应征⼈员”为例,按特征值⼤于1提取公共因⼦。

在⽤不同⽅法获得因⼦载荷时,公共因⼦对总体⽅差的贡献率以主成分法为最⾼:⽅法贡献率 %Principle components 81.476Maximum likelihood74.304Unweighted least squares74.485Principal axis factoring74.462Alpha factoring74.540Image factoring69.365关于主成分法的内容可参看任何⼀本多元统计分析书,例如:《应⽤多元统计分析》,⾼惠璇著,北京⼤学出版社,p301。

因子分析

因子分析

因子分析因子分析是根据相关矩阵内部的依赖关系,把一些具有错综复杂关系的变量综合为数量较少的几个因子。

通过不同因子来分析决定某些变量的本质及其分类的一种统计方法。

简单地说,就是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。

每组变量代表一个基本结构,这个基本结构称为因子。

因子分析是利用少数几个潜在变量或公共因子去解释多个显在变量或可观测变量中存在的复杂关系的分析方法,也是一种将多变量降维处理的方法。

因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。

因子的特点:1.因子个数远远少于原有变量的个数2.因子能够反映原有变量的绝大部分信息3.因子之间线性关系不显著4.因子具有命名解释性因子分析模型因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。

它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。

对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。

因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。

因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。

(i)因子分析常常有以下四个基本步骤:第一步:数据标准化第二步:计算相关系数矩阵第三步:计算相关系数矩阵的特征值以及特征向量第四步:确定综合因子数以及因子结构和因子模型第五步:计算因子得分(ii)因子分析的计算过程:(1)将原始数据标准化,以消除变量间在数量级和量纲上的不同。

(2)求标准化数据的相关矩阵;(3)求相关矩阵的特征值和特征向量;(4)计算方差贡献率与累积方差贡献率;(5)确定因子:设F1,F2,…,Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;(6)因子旋转:若所得的m 个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。

因子分析

因子分析
2
2.1概述
因子分析
因子分析是多元统计分析的一个重要分支。主要目的是浓缩数 据。通过对诸多变量的相关性研究,可以用假想的少数几个变量,来 表示原来变量的主要信息。 因子分析最初是由英国心理学家C.Spearman提出的。目前因子 分析在心理学、社会学、经济学、人口学、地质学、生理学,甚至在 化学和物理学中都得到了成功的运用。它的运用主要有两个方面:一 是寻求基本结构,简化观测系统。通常采用因子分析的方法将为数众 多的变量减少为几个新因子,以再现他们之间的内在联系;二是用语 于分类,将变量或者样本进行分类,根据因子得分值在因子轴所构成 的空间中进行分类处理。
2.3因子模型与主成分模型的区别
请注意因子模型 X1=a11f1+a12f2+…+a1mfm+e1

Xk=ak1f1+ak2f2+…+akmfm+ek
与主成分模型
Y1=b11X1+b12X2+…+b1mXk

Yk=b1kX1+b2kX2+…+bkKXk
之间的区别:公共因子在因子模型等号的右边,主成分在主成分模型等号 的左边。虽然在一定的条件下,等号左右边是可以转换的,但还需注意, 在因子模型中,除了公共因子外,还有特殊因子,也就是说公共因子只解 释了原来变量的部分方差,而主成分解释了原来变量的全部方差。
同理可求出a3,… ,am。
(2)ε 未知,求负载矩阵A的实际方法(事实上我们不知道ε ) 现ε 未知,先用R(X)代替R*(X),按照上面的方法求出对应于 R(X)的最大特征根λ1的、标准化了的(长度为1的)特征向量b1, a1= 1。若R(X)-a1a1t接近对角阵,则说明剩下的 b1

因子分析法

因子分析法

因子分析法因子分析是一种统计方法,用于确定变量之间存在的隐藏因素或构建因素。

它适用于许多领域,包括心理学、社会科学、市场研究等领域。

这篇文章将介绍因子分析的基本概念、应用和方法,以及一些在因子分析中可能遇到的挑战。

基本概念在因子分析中,我们假设每个可观测变量(或指标)都受到若干个潜在因素的影响。

每个潜在因素都无法直接观察,但可以通过样本数据分析得到。

因子分析的目标是识别这些潜在因素,并计算每个变量对于每个因素的贡献程度。

因子分析的步骤根据具体问题而有所不同,但通常可以分为以下几个步骤:1. 确定研究目的和研究变量:我们需要清楚研究的目的和所选择的变量。

2. 收集数据:数据可以是问卷、实验或其他来源。

3. 统计分析:通常使用软件进行因子分析,例如SPSS、R或MATLAB等。

4. 输出结果:因子分析输出的结果通常有因子载荷矩阵、因子得分和解释变异度等。

应用和方法因子分析可以应用于许多问题中。

以下是一些例子。

1. 人格特质:人格特质是一种人们对他人和社会的观察和理解方式。

人格特质可以通过因子分析确定为什么维度。

2. 市场研究:因子分析可以用于分析产品特征、顾客需求和品牌忠诚度等市场研究问题。

3. 教育研究:因子分析可以用于分析教育领域的课程设计、教学策略和学习效果等。

4. 社会科学:因子分析可以用于分析社会科学领域的认知、态度、行为和人际关系等问题。

在因子分析中,最常用的方法是主成分分析(PCA)和最大方差旋转(varimax rotation)。

PCA的目标是最小化观察变量和因子之间的平方和差异,而varimax rotation的目标是最大化观察变量和因子之间的方差。

挑战和限制尽管因子分析是一个强大的方法,但在使用过程中,可能会遇到一些挑战和限制。

1. 数据不完备或有缺失值:因子分析要求变量之间有相关性或协方差。

如果数据不完整或有缺失值,则可能会导致因子载荷矩阵不准确。

2. 成分解释:因子载荷矩阵是因子分析的主要输出之一,但不能说明因子的含义。

因子分析

因子分析

m
Xi的方差由两部分组成,第一部分hi 是全部(m个)公共因子对变量Xi的总 方差所作出的贡献,称为公因子方差; 第二部分σ 2i 由特定因子εi 产生的 方差,它仅与变量 Xi 有关,也称为剩余 方差.
2
15
2 1 aij i2 hi2 i2 j 1
m
显然,若hi2大,σ
16
2
3、公共因子F j 方差贡献的统计意义 因子载荷矩阵中各列元素的平方和
g a
2 j i 1
p
2 ij
gj2的统计意义与Xi的共同度h2i恰好相反, gj2表 示第j 个公因子Fj 对X的所有分量X1,…,Xp的总 影响,称为公共因子Fj对X的贡献(gj2是同一公 共因子Fj 对诸变量所提供的方差之总和),它 是衡量公共因子相对重要性的指标 .
7
§ 2 因子分析模型
一、数学模型
设 X i (i 1,2,, p ) p 个变量,如果表示为
X i i1F1 i 2 F2 im Fm i
(m p)
X 1 11 12 1m F1 1 X 22 2 m F2 2 2 21 X P p1 p 2 pm Fm P
19
u1 u 2
u1 1 0 u 2 up 0 p u p
1u1u 2u 2u2 mu mum m1u m1um1 pupu 1 p
例2 调查青年对婚姻家庭的态度,抽取了n个
引 言
什么是因子分析
克十项全能的得分进行研究(n=160),用X1-X10 表示十项全能的标准化得分数据(十项全能包括 :100米,铝球,跳高,跳远,400米,110米跨栏,铁 饼,撑杆,标枪,1500米),目的是分析哪些因素决 定了十项全能的成绩,以此来指导运动员的选拔 工作. 这些因素可归纳为如下几类:短跑速度,爆发 性臂力,腿力,耐力等.这也是一个因子分析的模 型,每一个因素就是一个公共因子. 6

统计学中的因子分析

统计学中的因子分析

统计学中的因子分析统计学是一门研究如何对数据进行收集、分类、汇总、分析和解释的学科,其运用范围非常广泛。

在统计学中,因子分析是一种常用的数据分析方法,它可以帮助研究者发现数据中的潜在结构和模式。

下面,我们来探讨一下因子分析的相关知识。

一、因子分析的定义因子分析是一种多元统计分析方法,它从一组测量数据中寻找一些基础特征,即所谓的“因子”。

这些因子可以解释数据的方差和协方差,从而揭示数据中隐含的结构和模式。

因子分析的目的是将原始数据变换为更容易理解和解释的形式。

二、因子分析的应用因子分析广泛应用于社会科学、心理学、市场调研、教育评估等领域。

例如,在心理学中,因子分析可以揭示人类行为背后的心理机制和动机。

在市场调研中,因子分析可以帮助分析消费者的真实偏好和行为。

因子分析的核心思想是将原始数据转化为一组潜在因子,这些因子可以用较少的变量来解释数据的方差和协方差。

具体来说,因子分析的过程包括以下几个步骤:1.提出假设:根据研究目的和数据特点,提出因子分析的假设。

2.选择合适的因子数:根据实际情况和统计指标,选择合适的因子数。

3.确定因子载荷:计算每个变量与每个因子之间的相关性,即因子载荷。

4.旋转因子:通过旋转因子,使因子之间互相独立,更好地解释数据的方差和协方差。

5.识别因子:根据因子载荷和实际情况,识别每个因子所代表的潜在特征。

因子分析具有以下优点:1.揭示数据中的结构和模式。

2.可以简化数据,从而便于解释和分析。

3.可以分析大量变量之间的关系和影响。

但是,因子分析也存在一些缺点:1.需要研究者对数据有较深的了解和判断。

2.结果可能受到假设、因子数和旋转方法等因素的影响。

3.结果的可解释性可能有所限制。

五、因子分析实例分析下面我们以某公司员工薪资分析为例来展示因子分析的过程:某公司的员工薪水涉及到多个因素,包括岗位、资历、工作年限等。

我们想要了解这些因素之间的关系,并找出影响员工薪资的主要因素。

首先,我们可以收集相关数据,包括员工的薪资、岗位、资历、工作年限等信息。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

这些数据能够较为全面精确地描述事物, 也会给统计分析带来许多问题。
计算量的问题 变量间的相关性问题
例如,学生综合评价研究中,可能会收集 如基础课成绩、专业基础课成绩、专业课成绩、 体育等各类课程的成绩以及累计获得各项奖学金 的次数等。
为解决这些问题,最简单和最直接的解决 方案是消减变量个数,但这必然又会导致信息丢 失和信息不完整等问题的产生。
(特征值)
因子变量的方差贡献率 因子变量的累计方差贡献率
Compo nent Matrix a
Component
1
2
出发点
.823
-.130
发展机会
.787
.479Βιβλιοθήκη 职位升迁.781.239
权力距离
.763
.248
领导风格
.650
.194
分配
.596
-.701
合作性
.493
-.626
工作投入
-.222
因子分析的主要四个步骤: 因子分析的前提条件 因子提取 使因子更具有命名解释性 计算各样本的因子得分
二、因子分析的基本操作
有20名大学生关于价值观的9项测验结果, 包括合作性、对分配的看法、行为出发点、工作 投入程度、对发展机会的看法、社会地位的看法、 权力距离、对职位升迁的态度、以及领导风格的 偏好。
Extraction Method: Principal Component Analysis.
因子分析后因子提取 和因子旋转的结果
T otal Variance Explained
Initial EigenvaluEexstracti on Sums of SquareRdotLaotiaodninSgusms of Squared Loading
因子旋转的方法
方差最大法
四次方最大法 等量最大法
斜交旋转法
旋转后的因子载荷矩阵
计算因子得分的方法
将因子得分保存的变量中
计算得 分方法
FACn_m
回归法
输出因子得分函数中 的因子得分系数
缺失值的处理方法和因子 载荷矩阵的输出方法
以第一因子得分的降 序输出因子载荷矩阵
合作性 分配 出发点 工作投入 发展机会 社会地位 权力距离 职位升迁 领导风格
未旋转的 因子载荷
矩阵
碎石图
大于该值的特征根
KMO and Bartlet t's Test
Kaiser-Meyer-Olkin Measure of Sampling
A de quac y.
.585
Bartlett's Test of Approx. Chi-Squar7e4.733
Sphe ric it y
数学建模
数学教研室
齐德全
qidequan@
因子分析
一、因子分析的基本内容 二、因子分析的基本操作
一、因子分析的基本内容
在研究实际问题时往往希望尽可能多地收 集相关变量,以期望对问题有比较全面、完整的 把握和认识。
例如,学生综合评价研究中,可能会收集 如基础课成绩、专业基础课成绩、专业课成绩、 体育等各类课程的成绩以及累计获得各项奖学金 的次数等。
df
36
Sig.
.000
Undefined error #60601 - Cannot open text file "sp
4
纵坐标为
3
各特征根
的值
2
横坐标为
特征根的
1
个数
0
1
2
3
4
5
6
7
8
9
碎石图 Undefined error #60618 - Cannot open text file "spss.err": No such file
.537
社会地位
.133
.558
Undefined error #11401 - Cannot open text file "spss.err": No such file or directory
a. 3 components extracted.
3 -.120 .122 .117 -.394 -.162
2
1.886 20.952 60.682 1.886 20.952 60.682 1.979 21.989 58.416
3
1.022 11.350 72.032 1.022 11.350 72.032 1.225 13.616 72.032
4
.845
9.385 81.417
5
.638
7.085 88.502
ComponTeontta%l of VarC iaunm ceulati ve % Tota%l of VarC iaunm ceulati ve % Tota%l of VarC iaunm ceulati ve %
1
3.576 39.730 39.730 3.576 39.730 39.730 3.278 36.427 36.427
要求根据这9项内容进行因子分析、得到维 度较少的几个因子。
参与因子分 析的变量
输入变量值 条件变量
指定输出结果
基本描述统计量
相关系数检验 的概率值
因子分析的初始解
相关系数矩阵
逆矩阵
行列式
巴特利特 球度和 KMO检验
提取因子的方法
方法 主成分分析方法
依据 相

因子数
系 数


协方 差阵
Communalities
Initial 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000
Extraction
因子分析 初始结果
.722
.848
.708 解释掉 .504 “合作性” .863 方差的
.871 72.2%
.799
.681
.486
为此,采用因子分析,它既能大大减少参 数据建模的变量个数,同时也不会造成信息的大 量丢失。
因子分析以最少的信息丢失为前提,将众 多的原有变量综合成较少几个综合指标,名为因 子。通常,因子有以下几个特点:
因子个数远远少于原有变量的个数 因子能够反映原有变量的绝大部分信息 因子之间的线性关系不显著
因子具有命名解释性
-2.86E-02 .295 -.407 .737
最终的因子 载荷矩阵
Rotated Component Matrix
6
.518
5.753 94.255
7
.250
2.774 97.030
8
.186
2.069 99.099
可解释原有数据
信息的72.03% 9 8.113E-02
.901 100.000
Extracti on Method: Principal Component A nal ysis.
因子变量的 方差贡献
相关文档
最新文档