第九章因子分析
因子分析-PPT

因子 得分
因子分析
什么 叫因 子分
析
定义解释
因子分析就是主成分分析得推广和发展, 她就是把具有复杂关系得多个变量(或样 品)综合为少数几个因子,并给出原始变量 与综合因子之间得相关关系得多元统计 分析方法
种类
R型因子分析(对变量进行因子分析) Q型因子分析(对样品进行因子分析)
应用意义
应用范围
表示得形式不同。
因子 分析 得统 计意
义
假定因子模型中,各个变量、 公共因子、特殊因子都已经进 行了标准化处理
因子载荷矩阵得统计意义
变量共同度得统计意义
公因子方差贡献得统计意义
因子 载荷 矩阵 得估 计方
法
方法一:流
应用类型
基本思想 数学模型
因子 分析 得模
型
主成 分分 析与 因子 分析 得区
别
主成分分析就是一种数学变换 (正交变换)不能称为一种数学 模型;而因子分析需要构造数 学模型。
主成分得个数与原始数据个数 相等,就是把原始变量变换成 为相互独立得新得变量;而因 子个数一般要求小于原始数据 个数,目得在于得到一个结构 简单得因子模型。
可以互相讨论下,但要小声点
因子 旋转
含义:
因子旋转就是根据因子载荷矩阵 得不唯一性,用一个正交矩阵右乘 因子载荷矩阵,实行旋转(由线性代 数,一次正交变换,对应坐标系得一 次旋转),使旋转后得因子载荷矩阵 结构简化,以便对公共因子进行合 理得解释。
所谓结构简化就就是使得每个变 量仅在一个公共因子上有较大得 载荷,而在其她得公共因子上得载 荷比较小。
常用得方法有:
第九讲 因子分析

其中 i 1,,24
3
例:某公司对100名招聘人员的知识和能力进行测评,主要 测评六个方面的内容:语言表达能力、逻辑思维能力、判断 事物的敏捷和果断程度、思想修养、兴趣爱好、生活常识等, 我们将每一个方面称为因子,显然这里所说的因子不同于回 归分析中的因素,因为前者是比较抽象的一种概念,而后者 有着极为明确的实际意义。假设100人测试得分xi可以用上 述六个因子表示成线性函数:
* 6
还可求出各变量的共同度,各变量对应的特殊因子方差, 各公共因子方差贡献率以及两个公共因子的累计方差贡献
变量 X1* X2* X3* X4* X5* X6* 方差贡献率 累计方差贡献率 ai1 0.272 0.409 0.477 0.926 0.848 0.843 45.9% 45.9% ai2 0.293 0.439 0.513 -0.179 0.031 0.172 10.1% 56% 共同度 0.16 0.36 0.49 0.89 0.72 0.74 56% 特殊因子方差 0.84 0.64 0.51 0.11 0.28 0.26 44%
因子载荷不唯一。对于m m的正交阵T , 令A AT , F T F 则模型可表示为X A F 由于 D( F ) I mm cov(F , ) 0 仍满足模型条件,同样 可分解为: A A D 实际中,常利用这一点,通过因子的变换,使得新的因子有更 好的实际意义
注:
因子分析与回归分析不同,因子分析中的因子是一个 比较抽象的概念,而回归因子有非常明确的实际意义; 主成分分析分析与因子分析也有不同,主成分分析仅 仅是变量变换,而因子分析需要构造因子模型。 主成分分析:原始变量的线性组合表示新的综合变量, 即主成分;
因子分析:潜在的假想变量和随机影响变量的线性组 合表示原始变量。
第九章 因子分析

(9-4)
可以证明,上式系数的平方和满足: 可以证明,上式系数的平方和满足:
4
2 aki = 1 (i = 1,2,L, m) ∑ k =1
m
在此条件下, 在此条件下,由原始变量经线性组合而得到的新 主因子或 变量f 叫做主因子 综合变量。 变量 i叫做主因子或综合变量。 组合成新变量有什么用途呢? 组合成新变量有什么用途呢? m个原始变量表示为 个主因子的线性组合, 个原始变量表示为p个主因子的线性组合 把m个原始变量表示为p个主因子的线性组合, 小于m, 当p小于 ,特别是 p=2时,可以在二维空间对变 小于 时 量作图,进而对变量的相关性及成因联系进行研 量作图, 究。
xi = ai1 f1 + ai 2 f2 +L+ aim fm (i = 1,2,L, m)
a11 a12 a 21 a22 其中 A = L L am1 am2 L L L L
(9-5)
a1m a 2m 因子载荷矩阵。 称因子载荷矩阵。 L amm
7
在进行综合地质研究时,如果用前 在进行综合地质研究时,如果用前p(p << m)个主 个主 因子就能解释原始数据80~ 以上的信息, 因子就能解释原始数据 ~90%以上的信息,那么 以上的信息 可改写为: 式(9-5)可改写为: 可改写为
那么可以证明前p个主因子载荷矩阵为 那么可以证明前 个主因子载荷矩阵为: 个主因子载荷矩阵为
A1 = [ a ij ] m× p = [u ij λ j ] m× p
相应的R型因子分析模型为: 型因子分析模型为:
xi = ai1 f1 + ai 2 f 2 + L+ aip f p + αi ei
因子分析

因子分析因子分析是一种常用的统计方法,广泛应用于社会科学、经济学、心理学等领域。
它可以帮助研究者找出数据中的主要因素,并将原始变量转化为更少的几个综合指标,从而简化数据分析和解释。
本文将介绍因子分析的基本原理、应用场景以及一些常见的因子分析方法。
一、因子分析的基本原理因子分析基于一种潜在变量模型,假设观察到的一组变量是由少数几个潜在的因子所决定的。
这些潜在因子无法直接观察到,但可以通过观察到的变量来推断。
通过因子分析,我们可以找出这些潜在因子,并将原始变量转化为这些因子的得分。
在因子分析中,我们假设每个潜在因子与一组观察到的变量相关联,这些变量称为因子载荷。
因子载荷可以解释变量之间的协方差结构,反映了变量与潜在因子之间的相关程度。
我们可以通过计算因子载荷矩阵来评估这种关系。
同时,我们还假设观察到的变量之间相互独立,即不存在多重共线性。
多重共线性会使得因子分析的结果不准确,因此在进行因子分析之前,我们需要先进行相关性分析和多重共线性检验。
二、因子分析的应用场景因子分析在许多领域都有广泛的应用。
以下是其中一些常见的应用场景:1.心理学研究:因子分析可以帮助心理学家理解人类行为的潜在因素。
例如,在人格心理学中,我们可以使用因子分析来研究人格特征的结构,并找出彼此相关的因素。
2.市场研究:因子分析可以帮助市场研究人员理解消费者行为的背后因素。
例如,在消费者调查中,我们可以使用因子分析来提取消费者购买决策中的主要影响因素,并根据这些因素进行市场定位和目标群体选择。
3.经济学研究:因子分析可以帮助经济学家理解经济变量之间的关系。
例如,在宏观经济学中,我们可以使用因子分析来提取经济增长、通货膨胀和失业率等变量的主要因素,并分析它们之间的相互作用。
4.社会科学研究:因子分析可以帮助社会科学家理解社会现象的潜在因素。
例如,在教育研究中,我们可以使用因子分析来研究学生学习成绩的主要影响因素,并提供相应的教学策略。
三、常见的因子分析方法在因子分析中,有许多不同的方法可以选择。
财务报表分析方法 第9章 因子分析与主成分分析.ppt

因子分析法在财务比率分类中的应用
(三)应用的基本步骤
1.收集所要研究企业的财务比率数据, 得到样本原始数据矩阵
Y11 Y12
Y
Y21
Y22
Y31 Y32
Y13
Y23
Y33
因子分析法在财务比率分类中的应用
2.对样本原始数据进行标准化处理 变量标准化的公式为:
财务比率因子分析法的作用
财务比率因子分析法的作用主要体现在如下几 个方面:
首先,因子分析法能够应用实际的数据提供对这些 财务比率的关系的实质性测试及使分类合理化,这 种研究是有用的,它基于的思想是:相关的比率归 为一类,不相关的归为不同类。
其次,因子分析法会因为数据及方法的不同产生不 同的分类。财务比率分类的研究表明了财务比率相 互之间的关系,有助于研究者或使用者通过财务比 率的分类来选择财务比率。
因子分析法在财务比率分类中的应用
(一)应用的理论依据
将因子分析法的基本思想应用于其中,一 方面将相类似的指标(比率)归为一个因 子,另一方面将不相似的指标归为不同的 因子,可以有效地将大量的财务比率由几 个因子来进行代表。基于财务比率的来源 与构成,利用因子分析的方法,可以将它 们按照特性进行分类,将相类似的项目归 为一组,而不相类似的归在不同的类别中, 不同组的比率反映企业不同的特性。
8.运算过程的辅助实现
实务中,我们可以借助计算机进行辅助处理,例如 可直接利用SPSS软件、SAS软件,或者运用高级 语言(如Visual C++,Visual Basic)编制运算 程序等进行辅助运算。
财务比率因子分析法的特征评价
(一)因子分析法的性质
九章节因子分析

该方程组表示了得到m 个公共因子后,就可以使用这些公共因 子在一定程度上预测每一个观测变量。方程中的系数正好是相对应 的观测变量与公共因子的相关系数,也叫做该观测变量在对应因子 上的载荷,即因子载荷,它反映了二者的关系强度。
几个重要概念:
1. 因子载荷:某个因子与某个原变量的相关系数,主要反映该公共因
出发点 13 15 17 17 16 16 16 18 15 20 14 18 15 12 14 13 15 15 18 13
工作投入 发展机会 社会地位 权力距离 职位升迁 领导风格
18
16
17
15
16
16
16
18
18
18
17
19
14
17
18
16
161616 Nhomakorabea19
18
19
20
19
16
18
18
15
16
(3) 在“Display”下选中“Unrotated factor solution”和 “Scree plot”以输出未经旋转的因子载荷矩阵、碎石图。执行之 后根据输出信息确定提取因子数,比如根据碎石图来确定;
第四步:点击“Rotation”按钮打开选择因子载荷矩阵的旋转 方法。一般使用最多的是正交旋转(选中Varimax)或斜交旋转 方法(选中Promax),其中斜交旋转速度快,所以大样本时多选 此方法。同时可选中“Rotated solution”和 “Loading plot(s)”, 以输出旋转后因子旋转矩阵、载荷散点图。
第九章因子分析

14
65
60
60
50
65
62
60
80
15
96
86
75
70
82
65
88
82
操作练习
感谢您的关注
点击打开数据文件
2.根据15名学生的8门课程成绩,对之进行因素分析
学号 代数x1 几何x2 物理x3 地理x4 英语x5 语文x6 化学x7 历史x8
1
94
83
78
80
70
50
65
80
2
73
75
80
65
70
60
52
75
3
52
55
65
40
80
40
55
70
4
50
45
68
60
80
60
65
80
5
68
85
75
三、因子分析的SPSS过程
第一步:准备数据文件,打开对话框,加载观测变量。数据 文件主要是由较多的(一般在10个以上)可观测变量组成,个案 数应比较大 。然后点击“Analyze” ,选择 “Data Reduction” 中 的“Factor”打开因子分析对话框,将参与分析的所有观测变量加 载到“Variables”下边的方框中。 。
一因子分析的基本概念和原理通常在科学研究中首先得到的观测资料都是关于事物的外在特征或个别的具体特征这些特征的观测值存在聚合趋势有倾向于聚合的一些变量具有高度相关性这种高度的相关性显示出这些变量的背后存在着一个共同的制约因素称为共同因子或因子
第九章因子分析
1
3.因子变量的命名解释
第9章:因子分析

第9章因子分析与主成份分析因子分析与因子分析过程因子分析是将多个实测变量转换为少数几个不相关的综合指标的多元统计分析方法。
线性综合指标往往是不能直接观测到的,但它更能反映事物的本质。
因子分析概念在各个领域的科学研究中往往需要对反映事物的多个变量进行大量的观测,收集大量数据以便进行分析寻找规律。
多变量大样本无疑会为科学研究提供丰富的信息,但也在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可能存在相关性而增加了问题分析的复杂性。
由于各变量之间存在一定的相关关系,因此有可能用较少的综合指标分别综合存在于各变量中的各类信息,而综合指标之间彼此不相关,即各指标代表的信息不重叠。
这样就可以对综合指标根据专业知识和指标所反映的独特含义给予命名。
这种分析方法成为因子分析,代表各类信息的综合指标就称为因子或主成份。
根据因子分析的目的我们知道,综合指标应该比原始变量少,但包括的信息量应该相对损失较少。
原始变量:X1、X2、X3、X4……Xm主成份:Z1、Z2、Z3、Z4……Zn则各因子与原始变量之间的关系可以表示成:X1=b11Z1+b12Z2+b13Z3……+b1n Z n+e1X2=b21Z1+b22Z2+b23Z3……+b2n Z n+e2X3=b31Z1+b32Z2+b33Z3……+b3n Z n+e3……X m=b m1Z1+b m2Z2+b m3Z3……+b mn Z n+en写成矩阵形式为:X=BZ+E。
其值X为原始变量向量,B为公因子负荷系数矩阵,Z为公因子向量,E为残差向量。
公因子Z1、Z2、Z3…Zn之间彼此不相关,称为正交模型。
因子分析的任务就是求出公因子负荷系数和残差。
如果残差E的影响很小可以忽略不计,数学模型变为X=BZ。
如果Z中各分量之间彼此不相关,形成特殊形式的因子分析,称为主成分分析。
主成分分析的数学模型可以写成:Z1=a11X 1+a12X2+a13X 3……+a1m X mZ2=a21X 1+a22X2+a23X 3……+a2m X mZ3=a31X 1+a32X2+a33X 3……+a3m X m……Z n=an1X 1+an2X2+an3X 3……+anm X m写成矩阵形式为:Z=AX。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
要点:因子内高相关、因子间低相关,简化解释维度
误区:因子分析就是抱弃一些变量,用最少的变量代替全体变量
因子分析是简化结构ห้องสมุดไป่ตู้以较少的变量说明原始总体的全部信息。
A2-b2=(a+b)(a-b)
因素分析
四、常用术语
1.因子载荷(factor loading)
因子载荷也叫因素负荷,是指因子分析模型中各公共因素和 独特因素的加权系数。通常称公共因素的系数为因素负荷。若 从p个观测变量提取m个公共因素,第i个变量zi在第j个公共因 素fj上的因子负荷记作aij(也可称fj在zi上的因子负荷), i=1,2,...p,j=1,2,...,m。因素负荷aij 是变量zi与公共因素 fj
因素分析
一、基本含义
因素分析就是用最少的因素概括和解释大量的观测事实, 建立起最简洁的,基本的概念系统,以揭示事物之间,各种 复杂现象背后本质联系的一种统计分析方法。 当因素分析的重点放在从一堆观测变量中去探索/挖掘 出潜变量的时候,称为探索性因素分析。当方法的重点放在 检验假设(即事先对潜变量的维度有了假设)时候,称为验 证性因素分析。
四、常用术语
3.因子的贡献率(contributions)
每个公因子对原始数据的解释能力,可以用该因子所解释 的总方差来衡量,通常称为该因子的贡献率,记作Vp。它等于
和该因子有关的因子负载的平方和。实际中常用相对指标来表
示,相对指标体现着公因子的相对重要性。即每个公共因子所 解释的方差占所有变量总方差的比例。设k表示观测变量数, Vp/k表示第p个因子所解释的方差比例,则V/k表示所有公因子 累积解释的方差比例,它可以用来作为因子分析结束的判断指 标。
因素分析
五、数据处理过程
因素分析 二、基本含义
因素分析假定个体在某一变量上的反应由两部分组成: 一 是 各 个 变 量 共 有 的 部 分 , 称 为 共 同 因 素 ( Common Factor);另一部分是各变量所特有的部分,称为独特因 素(Unique Factor),可用下式表示:
zij = aj1Fi1 + aj2 Fi2 +... + ajmFim + d jUij
zij是第i个体在第j观测变量上的得分,(
对观测变量的加权系数,(Fik)是个体i在因素F k上的 得分,Uij为特殊因素,dj为特殊因素对观测变量的加权系 数;N为样本容量,n为观测变量的个数,m为公因素的个 数。
j k)是因素
因素分析
三、因素分析基本过程
1.计算相关矩阵,确定因素初始载荷值(矩阵) 2.确定公因子提取的方法。(特征值法或陡坡检验法) 3.计算各公因素的载荷情况,分析特征值。 4.因素旋转。 5.计算旋转后的因子载荷矩阵。 6.因子命名与解释
因素分析
四、常用术语
4.特征值(Eigenvalues)
特征值是指每个变量在某一公共因子上的因子负荷量的平 方总和,又叫特征根。在因子分析的公共因子提取中,特征值
最大的公共因子会最先被提取,其次是次大者,最后提取的公
共因子的特征值最小。因子分析的目的,在于使因子维度简单 化,希望以最少的公共因子,能对总变异量作最大的解释,因 而提取的因愈少愈好,但提取因子之累积解释的变异量则愈大 愈好。
表示m个公共因素能解释变量zi的方差的比例数。
公共因素 h i2 测量变量 Ⅰ .761 .774 .860 .873 .731 Ⅱ -.007 .296 -.007 .013 .420
1 2 3 4 5
段落大意 反义词 词语解释 同义词 词汇量
.579 .687 .740 .660 .710
因素分析
间的相关系数,即 aij=rzi,fj。如某一公共因素在若干个观测变
量上的负荷最大,则该公共因素的实际意义可由这几个变量的 测验内容来确定,因素负荷是识别公共因素的依据。
因素分析
四、常用术语
2.公因子方差(communality)
公因子方差也叫共同度,又称公共方差,指一个观测变量 在全部公共因素上的因素负荷的平方之和。记为h2。第i个变量 zi的公共因素方差hi2=ai12+ ai22+…+aim2 ,m为公共因素数。hi2