第七章 因子分析
因子分析 PPT课件

同时假定随机向量 X 满足以下模型: X 1 a11F1 a12 F2 a1m Fm 1 X a F a F a F 2 12 1 22 2 2m m 2 X p a p1 F1 a p 2 F2 a pm Fm P 则称模型(3.1)为正交因子模型。
设 X ( X1 , X 2 ,
E( F ) 0 , Cov( F ) I m (即 F 的各分量方差为 1,且互不相关) 。又设 (1, 2 , , p ) 与 F 互不相关,且
2 E ( ) 0 , Cov( ) diag(12 ,2 , 2 , p )。
之因子分析
SPSS软件
• 因子分析(Factor Analysis)是多元统计 分析中处理降维问题的一种重要方法。变 量的共线性很多是都对分析结果具有显著 的影响。所谓降维,就是独钓共线性,剩 下的,或者合并的都是线性无关的,或者 正交的,或者垂直的。
一、什么是主成分分析和因子分析?
• 主成分分析(Principal Components Analysis)也是多元统计分析中简化数据 结构(降维问题)的一种重要方法。简化 数据结构是指将某些较复杂的数据结构通 过变量变换等方法使相互依赖的变量变成 互不相关的;或把高维空间的数据投影到 低维空间,使问题得到简化而损失的信息 市的实证 设施建设情况。
案例1
• 中国统计年鉴,2005,各地区城市市政设施数据。 变量有: • City—城市名称; • X1—年末实有道路长度(公里); • X2—年末实有道路面积(万平方公里); • X3—城市桥梁(座); • X4—城市排水管道长度(公里); • X5—城市污水日处理能力(万立方米); • X6—城市路灯(盏);
7 因子分析

注意:在因子表达式中的各变量为进行标准化变换后的标准变
量,均值为0,标准差为1。
7. 由于我们已经在Scores子对话框中选择了Save as variables 复选框,因此,因子得分已经作为新的变量保存在数据文件 中,变量名分别为fac1_1、fac2_1、fac3_1和fac4_1。此后, 我们还可以利用因子得分进行其他的统计分析。
表7.1 特征根与方差贡献率表
Total Varianc e Explaine d Rota tion Sums of Squared Loadings Tota l 4.164 2.767 2.456 2.268 % of Va riance 32.032 21.282 18.893 17.443 Cumulative % 32.032 53.314 72.207 89.651
(一) 操作步骤 1. 在SPSS窗口中选择Analyze→Data Reduction→Factor,调 出因子分析主界面图(7.1),并将变量X1—X13移入Variables 框中。
图7.1 因子分析主界面
2. 点击Descriptives按钮,展开相应对话框,见图7.2。选择 Initial solution复选项。这个选项给出各因子的特征值、各 因子特征值占总方差的百分比以及累计百分比。单击 Continue按钮,返回主界面。
图7.5 Scores子对话框 6. 单击OK按钮,运行因子分析过程。
(二) 主要运行结果解释 1. Communalities(给出变量共同度)
变量共同度反映每个变量对所提取的所有公共因子的依赖程度,
此数值是因子载荷阵中每一行的因子载荷量的平方和,提取的 因子个数不同,变量共同度也不同。
因子分析ppt课件

(3)因子旋转
通过正交旋转或斜交旋转使提取出的因子具有可解 释性。
(4)计算因子得分
通过各种方法求解各样本在各因子上的得分,为进 一步分析奠定基础。
❖ 2、因子分析前提条件——相关性分析:
分析方法主要有:
(1)计算相关系数矩阵(correlation coefficients matrix)
1 2 为p的特0 征根,
标准化特征向量,则
为u对1 , 应u2 的,, up
1
Σ = U
2
U AA + D
p
u1 u2
up
1
0
1u1u1 2u2u2
0
u1 u2
p
up
mumum m1um1um1
1u1
2u2
pu p
1u1
2
u2
p
因子分析的基本理论 ❖ 3、因子分析的目的:
因子分析的目的之一,简化变量维数。即要使因素结 构简单化,希望以最少的共同因素(公共因子),能 对总变异量作最大的解释,因而抽取得因子愈少愈好, 但抽取因子的累积解释的变异量愈大愈好。
在因子分析的公共因子抽取中,应最先抽取特征值最 大的公共因子,其次是次大者,最后抽取公共因子的 特征值最小,通常会接近0。
(3)因子分析中因子载荷的不唯一性有利于对公因子进行有效解释; 而主成分分析对提取的主成分的解释能力有限。
因子分析的基本理论
❖ 5、因子分析模型: 设 Xi (i 1,2,个,变p)量p,如果表示为
X i i ai1F1 aimFm i (m p)
X1 1 11 12
或
X
2
大课第七讲 因子分析

身 高 ( x1) 坐 高 ( x2) 体 重 ( x3) 胸 围 ( x4) 肩 宽 ( x5) 骨 盆 宽 ( x6)
1 .930 .936 .910 .617 .336 .330
2 -.224 -.093 -.208 -.053 .754 .803
Extraction Method: Principal Component Analysis. a. 2 components extracted.
三、因子分析中的几个概念
1. 因子负荷(系数) 假设公因子之间彼此正交,即不相关
,则可以证明因子负荷aij等于第i个变量和 第j个因子之间的相关系数,即aij反映了因 子和变量之间的相关程度, aij的绝对值越 大,表示公因子fj与变量xi关系越密切。
-1≤aij≤1
2. 共性方差(Communality)
52.874
52.874
21.952
74.825
15.604
90.429
7.001
97.430
2.041
99.471
.529
100.000
Extraction Method: Principal Component Analysis.
Extraction Sums of Squared Loadings
2. 累积方差比例原则:一般推荐公因子累积解释的 方差比例达到80%以上时,即可停止选择公因子 。
3. 利用碎石图:将因子按特征根从大到小排列,画 出因子的特征根随因子个数变化的散点图,根据 图的形状来判断因子的个数。曲线开始变平的前 一个点(拐点)认为是提取的最大因子数。也就 是根据特征根的变化速率来确定。
所有公因子累积解释的方差比例,可以用来作为 因子分析结束的判断指标。
7因子分析原理

1
Σ = U
2
U AA + D
p
16
u1 u2
up
1
0
0
u1 u2
p
up
1u1u1 2u2u2 mumum m1um1um1
30
假定某地固定资产投资率x1 ,通货膨胀率x2,失业率 x3 ,
相关系数矩阵为
1 1/ 5 1/ 5
1/
5
1
2
/
5
1/ 5 2 / 5 1
试用主因子分析法求因子分析模型。假定用hˆi2 max | rij | ( j i)
代替初始的 hi2
。h12
1 5
主成分分析:原始变量的线性组合表示新的 综合变量,即主成分;
因子分析:潜在的假想变量和随机影响变 量的线性组合表示原始变量。
4
§ 2 因子分析模型
一、数学模型 设 X i (i 1,2,, p) p 个变量,如果表示为
Xi i ai1F1 aimFm i (m p)
0.783 0.305 0.548
29
x1 0.569F1 0.814F2 x2 0.783F1 0.305F2 0.548F3 x3 0.783F1 0.305F2 0.548F3
可取前两个因子F1和F2为公共因子,第一公因 子F1物价就业因子,对X的贡献为1.55。第一公因子 F2为投资因子,对X的贡献为0.85。共同度分别为1, 0.706,0.706。
因子分析

因子分析因子分析是一种常用的统计方法,广泛应用于社会科学、经济学、心理学等领域。
它可以帮助研究者找出数据中的主要因素,并将原始变量转化为更少的几个综合指标,从而简化数据分析和解释。
本文将介绍因子分析的基本原理、应用场景以及一些常见的因子分析方法。
一、因子分析的基本原理因子分析基于一种潜在变量模型,假设观察到的一组变量是由少数几个潜在的因子所决定的。
这些潜在因子无法直接观察到,但可以通过观察到的变量来推断。
通过因子分析,我们可以找出这些潜在因子,并将原始变量转化为这些因子的得分。
在因子分析中,我们假设每个潜在因子与一组观察到的变量相关联,这些变量称为因子载荷。
因子载荷可以解释变量之间的协方差结构,反映了变量与潜在因子之间的相关程度。
我们可以通过计算因子载荷矩阵来评估这种关系。
同时,我们还假设观察到的变量之间相互独立,即不存在多重共线性。
多重共线性会使得因子分析的结果不准确,因此在进行因子分析之前,我们需要先进行相关性分析和多重共线性检验。
二、因子分析的应用场景因子分析在许多领域都有广泛的应用。
以下是其中一些常见的应用场景:1.心理学研究:因子分析可以帮助心理学家理解人类行为的潜在因素。
例如,在人格心理学中,我们可以使用因子分析来研究人格特征的结构,并找出彼此相关的因素。
2.市场研究:因子分析可以帮助市场研究人员理解消费者行为的背后因素。
例如,在消费者调查中,我们可以使用因子分析来提取消费者购买决策中的主要影响因素,并根据这些因素进行市场定位和目标群体选择。
3.经济学研究:因子分析可以帮助经济学家理解经济变量之间的关系。
例如,在宏观经济学中,我们可以使用因子分析来提取经济增长、通货膨胀和失业率等变量的主要因素,并分析它们之间的相互作用。
4.社会科学研究:因子分析可以帮助社会科学家理解社会现象的潜在因素。
例如,在教育研究中,我们可以使用因子分析来研究学生学习成绩的主要影响因素,并提供相应的教学策略。
三、常见的因子分析方法在因子分析中,有许多不同的方法可以选择。
第七章 因子分析
越大,密切程度越高;另一方面也反映了变量 Xi 对公共因子Fj
的相对重要性。了解这一点对我们理解抽象的因子含义有非常
重要的作用。
2.变量共同度 hi2 的统计意义
设因子载荷矩阵为 A ,称第 i 行元素的平方和,即
m
hi2 ai2j j 1
i 1, 2, , p
( 7.7)
为变量 Xi 的共同度。
= aij
如果对 Xi 作了标准化处理, Xi 的标准差为 1,且 Fj 的标准差
为 1,因此
r Xi ,Fj
C o vX( i F,j D( Xi ) D F( j
)
)
C
o
vX(
i
F,j
)aij
( 7.6)
那么,从上面的分析,我们知道对于标准化后的 Xi ,aij 是 Xi
与 Fj 的相关系数,它一方面表示 Xi 对 Fj 的依赖程度,绝对值
第一,变量 X 的协差阵 Σ 的分解式为
D(X ) D(AF ε) E[(AF ε)( AF ε)] AE(FF )A AE(Fε) E(εF )A E(εε) AD(F )A D(ε)
由模型(7.2)式所满足的条件知
因子分析
因子应用
在市场调研中,研究人员关心的是一些研究指标的集成或者组合,这些概念通常是通过等级评分问题来测量 的,如利用李克特量表取得的变量。每一个指标的集合(或一组相关联的指标)就是一个因子,指标概念等级得 分就是因子得分。
因子分析
统计学方法
01 简介
03 得到因子 05 分析描述
目录
02 隐性变量 04 验证因子 06 因子应用
因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。他发现学 生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某 些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。因子分析可在许多变量中找出隐藏的具有代 表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。
简介
因子分析是简化、分析高维数据的一种统计方法。假定p维随机向量满足 是q维随机变量,,满足,它的分量称为公共因子,对X的每个分量都起作用。是p维不可观测的随机向量, 满足 且,e的分量称为特殊因子,它仅对X的分量起作用。 μ和A为参数矩阵。若X满足上式,则称随机向量X具有因子结构。这时,容易算得 矩阵A称为因子载荷,其元素是第i个分量在第j个因子上的载荷。记,则有 由此可见,反映了公共因子对的影响,称为公共因子对的“贡献”。当时,表明公共因子对的影响大于特殊 因子的影响,也可以看出反映了分量对公共因子的依赖程度。 另一方面,对一个指定的公共因子,记,称为公共因子对X的贡献。的值越大,反映了公共因子对X的影响也 越大,所以是衡量公共因子重要性的一个尺度。
应用多元统计分析习题解答_因子分析
第七章 因子分析7.1 试述因子分析与主成分分析的联系与区别。
答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。
②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。
因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。
因子分析也可以说成是主成分分析的逆问题。
如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。
而因子分析是从显在变量去提炼潜在因子的过程。
此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
7.2 因子分析主要可应用于哪些方面?答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。
目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。
具体来说,①因子分析可以用于分类。
如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。
即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。
对我们进一步研究与探讨指示方向。
在社会调查分析中十分常用。
③因子分析的另一个作用是用于时空分解。
如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。
7.3 简述因子模型中载荷矩阵A 的统计意义。
答:对于因子模型1122i i i ij j im m i X a F a F a F a F ε=++++++ 1,2,,i p =因子载荷阵为11121212221212(,,,)m m m p p pm a a a a a a A A A a a a ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦Ai X 与j F 的协方差为:1Cov(,)Cov(,)mi j ik k i j k X F a F F ε==+∑=1Cov(,)Cov(,)mikk j i j k aF F F ε=+∑=ij a若对i X 作标准化处理,=ij a ,因此 ij a 一方面表示i X 对j F 的依赖程度;另一方面也反映了变量iX对公共因子jF的相对重要性。
第七章 因子分析
第七章 因子分析实验目的:是使学生能熟练应用计算机软件进行因子分析与结果分析,培养实际应用能力;实验方法是上机操作;本章安排2个课时的上机实验;实验内容是SPSS 软件中factor analysis 的计算机操作及结果分析.因子分析同主成分分析一样,也是一种简化和分析数据的方法。
因子分析最早是心理学家提出来的,主要用于心理测验和分析上,后来用来对各种数据的分析。
这种方法不同于主成分分析,它把每个变量分解为两部分因素,一部分是由这些变量内含的共同因素所构成的,即所谓公共因素部分,另一部分是每个变量各自独有的因素,即所谓独特因素部分或单一因素部分。
因子分析关注的是找出这些公共的因子,利用少数的公共因子的线性函数与独特因素之和来解释原来的观测变量,并对这些公共因子的实际意义进行解释,而不是按分解的变差贡献大小来决定因子,这是和主成分分析的一个很大的差别。
例如100个学生考试,考试成绩记为10021,,x x x ,考题为30题,覆盖的知识面很广,但是总体上可以分为以下4个方面:数理逻辑、文学修养、历史知识、生活实践,设为4321,,,f f f f ,则我们可以建立如下的模型:i i i i i i i f f f f x ελλλλμ+++++=44332211 100,2,1 =i用这四个方面的一个线性组合再加上表示单个因素的i ε来解释第i 个学生的考试成绩x i ,其中4321,,,f f f f 称为公共因子,矩阵()4100⨯ij λ称为因子载荷矩阵,i ε是第i 个学生的考试成绩不能被这四个因子解释的部分,称为特殊因子。
因子分析就是要竭力找出这些公共因子和特殊因子,将观测值表示成这些因子的线性组合,并给这些因子以合理的解释,但是虽然所要讨论的变量的公共因子和特殊因子客观存在,但往往不能直接观测到,这也是因子分析问题的一个特点。
应用SPSS 软件中的数据文件car_sales.sav 进行因子分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
思考与练习
7.1试述因子分析与主成分分析的联系与区别。
7.2因子分析主要可应用于哪些方面?
7.3 简述因子模型X AY ε=+中载荷矩阵的统计意义。
A 7.4 在进行因子分析时,为什么要进行因子旋转?最大方差因子旋转的基本思路是什么?
7.5 试析因子分析模型与线形回归模型的区别与联系。
7.6 设某客观现象可用123(,,)X x x x ′=来描述,在因子分析时,从约相关阵出发计算出特征值为
123,1,0.2551.754λλλ===。
由于
,所以找前两个特征值所对应的公共因子即
可,又知()(1
2
1
2
3
/λλλλλ+++12,)85%≥λλ()0,0.899,0.447对应的正则化特征向量分别为()及
0.707,0.316,0−.632′′,要求:
⑴ 计算因子载荷矩阵A,并建立因子模型。
⑵ 计算共同度()2
1,2,3i h i =。
⑶ 计算第一公共因子对X 的“贡献”。
7.7 利用因子分析方法分析下列30个学生成绩的因子构成,并分析各个学生较适合学文科还是理科。
序号 数学 物理 化学 语文 历史 英语 1 65 61 72 84 81 79 2 77 77 76 64 70 55 3 67 63 49 65 67 57 4 80 69 75 74 74 63 5 74 70 80 84 81 74 6 78 84 75 62 71 64 7 66 71 67 52 65 57 8 77 71 57 72 86 71 9 83 100 79 41 67 50 10 86 94 97 51 63 55 11 74 80 88 64 73 66 12 67 84 53 58 66 56 13 81 62 69 56 66 52 14 71 64 94 52 61 52 15 78 96 81 80 89 76 16 69 56 67 75 94 80 17
77
90
80
68
66
60
1
18 84 67 75 60 70 63
19 62 67 83 71 85 77
20 74 65 75 72 90 73
21 91 74 97 62 71 66
22 72 87 72 79 83 76
23 82 70 83 68 77 85
24 63 70 60 91 85 82
25 74 79 95 59 74 59
26 66 61 77 62 73 64
27 90 82 98 47 71 60
28 77 90 85 68 73 76
29 91 82 84 54 62 60
30 78 84 100 51 60 60
7.8 某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标间的相关关系影响预测结果,需首先进行因子分析来简化指标系统。
下表是抽查欧洲某汽车市场7个品牌不同型号的汽车的各种指标数据,试用因子分析法找出其简化的指标系统。
品牌 价格 发动机功率轴距宽长 轴距 燃料
容量
燃料
效率
A 21500 1.8140101.267.3172.4 2.63913.2 28 A 28400 3.2225108.170.3192.9 3.51717.2 25
A 42000 3.5210114.671.4196.6 3.85018.0 22
B 23990 1.8150102.668.2178.0 2.99816.4 27 B 33950 2.8200108.776.1192.0 3.56118.5 22
B 62000 4.2310113.074.0198.2 3.90223.7 21
C 26990 2.5170107.368.4176.0 3.17916.6 26 C 33400 2.8193107.368.5176.0 3.19716.6 24
C 38900 2.8193111.470.9188.0 3.47218.5 25
D 21975 3.1175109.072.7194.6 3.36817.5 25 D 25300 3.8240109.072.7196.2 3.54317.5 23 D 31965 3.8205113.874.7206.8 3.77818.5 24
D 27885 3.8205112.273.5200.0 3.59117.5 25
E 39895 4.6275115.374.5207.2 3.97818.5 22 E 39665 4.6275108.075.5200.6 3.84319.0 22 E 31010 3.0200107.470.3194.8 3.77018.0 22
E 46225 5.7255117.577.0201.2 5.57230.0 15
F 13260 2.2115104.167.9180.9 2.67614.3 27 F 16535 3.1170107.069.4190.4 3.05115.0 25 F 18890 3.1175107.572.5200.9 3.33016.6 25 F 19390 3.4180110.572.7197.9 3.34017.0 27 F 24340 3.8200101.174.1193.2 3.50016.8 25 F 45705 5.7345104.573.6179.7 3.21019.1 22 F 13960 1.812097.166.7174.3 2.39813.2 33 F 9235 1.05593.162.6149.4 1.89510.3 45
F 18890 3.4180110.573.0200.0 3.38917.0 27
G 19840 2.5163103.769.7190.9 2.96715.9 24 G 24495 2.5168106.069.2193.0 3.33216.0 24 G 22245 2.7200113.074.4209.1 3.45217.0 26 G 16480 2.0132108.071.0186.0 2.91116.0 27
2
G 28340 3.5253113.074.4207.7 3.56417.0 23
G 29185 3.5253113.074.4197.8 3.56717.0 23
7.9 根据人均 GDP、第三产业从业人员占全部从业人员的比重、第三产业增加值占GDP的比重、人均铺装道路面积、万人拥有公共汽电车、万人拥有医生、百人拥有电话机数、万人拥有高等学校在校学生人数、人均居住面积、百人拥有公共图书馆藏书、人均绿地面积等十一项指标对目前我国省会城市和计划单列市的城市化进行因子分析,并利用因子得分对其进行排序和评价。
(数据可从《中国统计年鉴》查获)
7.10 根据习题5.10中2003年我国省会城市和计划单列市的主要经济指标数据,利用因子分析法对其进行排序和分类,并与聚类分析的结果进行比较。
3。