因子分析是主成分分析的推广和发展

合集下载

2因子分析

2因子分析

775.8
0.82
2410.05
2295.19
1.1496
62.8
14
江西
1103.2
1.3
2310.98
1804.93
0.6649
59.9
15
山东
2475.1
1.44
3109.11
1989.53
0.8809
55
16
河南
2815.8
1.5
3782.26
1508.36
0.5823
58.5
17
湖北
1296.5
11559.83
1257.71
0.4349
70.4
26
陕西
1046.1
2.6
2228.55
1091.96
0.4383
59.7
27
甘肃
672
5.86
2879.36
1037.12
0.4883
57.2
28
青海1Biblioteka 7.12.626725.11
1133.06
0.4096
70.3
29
宁夏
139.1
4.01
5607.97
X5
-0.9089 0.3057 -0.0356 0.9210
X6
0.9086 0.0296
0.192
0.8634
用统计学术语叫权重表示x的分量cov的共同度共同度公共因子方差剩余方差变量共同度的统计意义变量共同度的统计意义因子载荷据阵a中各列元素的平方和记为表示第j个因子对所有分量的总影响称为第j因子对x的贡献它是衡量第j个因子相对重要性的指标公共因子公共因子ffjj方差的统计意义方差的统计意义因子载荷阵的估计方法因子载荷阵的估计方法主成分法主因子法极大似然法则协差阵可分解为其中分量a和d就是因子模型的一个解a中的第j中的第j个主成分的系数相差一个倍数

5因子分析

5因子分析
ห้องสมุดไป่ตู้
华中农业大学数学建模基地 网站
6 因子分析
由于F1、F2与每一个Xi都有关,因此,研究这 5个指标变量之间的关系可以转化为研究这两个潜 在因子之间的关系。 因子分析的基本原理就是依据可测指标变量 之间的相关关系,把一些具有错综复杂关系的变 量归结为少数几个有实际意义的潜在因子,并估 计出潜在因子对可测指标变量的影响程度。
6 因子分析
因子分析模型是主成分分析的推广。它也是利用 降维的思想,由研究原始变量相关矩阵内部的依赖关 系出发,把一些具有错综复杂关系的变量归结为少数 几个综合因子的一种多变量统计分析方法。 因子分析的思想始于1904年Charles Spearman对 学生考试成绩的研究。近年来,随着电子计算机的高 速发展,人们将因子分析的理论成功地应用于心理学、 医学、气象、地质、经济学等各个领域,也使得因子 分析的理论和方法更加丰富。
华中农业大学数学建模基地 网站
data ex842; input objects$ pop school employ services house@@; cards; /*数据省略*/ ; proc factor data=ex842 method=principal rotate=varimax /*rotate表示因子旋转*/ percent=0.8 /*要求累计贡献率大于0.8*/ score outstat=ex1; /*计算因子得分*/ var pop school employ services house; run; proc score data=ex842 score=ex1 out=ex2; var pop school employ services house; run; proc print data=ex1; proc print data=ex2; run;

因 子 分 析

因 子 分 析
p ) 是可观测的随机向量,其均值为 ,协方差矩阵为 (ij ) T ,若X能表示为 X AF ,其中 F (F1, , Fm ) 称为X的公共因子(向量) (1, p )T 称为X的特殊因子(向量),它们满足 ,
应用举例
利用SPSS软件进行因子分析
从表3可以看出,第一个主因子在 X1、X8、X9上有较大载荷,因 此可以命名为盈利和现金获取能力 ;第二个因子主要由X6、X7、 X2、X5决定,可命名为成长因子 ;第三个因子主要由X3、X4决定 ,命名为偿债因子。 为了考查上市公司的竞争力状况, 并对其进行分析和综合评价,采用 回归方法求出因子得分矩阵,得到 3个主因子的得分F1,F2,F3,以 贡献率为权数,构建综合评价函数 综合得分 =(0.36064xF1+0.23066x F2+0.22132x F3)/0.81262 ,经计算得到样本17家上市公司 的综合因子总得分。(见表4)


因子模型的参数估计
因子载荷矩阵 A (aij ) pm 与特殊因子方差 i2 (i=1,...,p)的估计, 常采用的估计方法有以下三种:主成分法、主因子解和最大似然法。 主成分法: A ( l , , l ), 1 1 m m m 2 2 i 1, , p. i sii aij , j 1
Fj b j 0 b j1 X1 b jp X p , j 1, , m
^
F A' R 1 X
其中R是X的相关系数矩阵。 最后以每个公共因子的贡献率来求出各因子权重,求得综合得分。
^
因子分析与主成分分析的异同比较
相同点:主成分分析法和因子分析法都是从变量的方差-协 方差结构入手,在尽可能多的保留原始信息的基础上,用 少数新变量来解释原始变量的多元统计分析方法。 区别:因子分析是把变量表示成各公因子的线性组合;而 主成分分析中则是把主成分表示成各变量的线性组合。主 成分的数量是一定的,一般有几个变量就有几个主成分; 因子个数需要分析者指定,指定的因子数量不同而结果也 不同。主成分分析重点在于解释个变量的总方差;因子分 析则把重点放在解释各变量之间的协方差。主成分分析法 是求出少数几个主成分,使它们尽可能多的保留原始变量 的信息;因子分析法是对原始变量进行分解,用最少个数 的不可测的所谓公共因子的线性函数与特殊因子之和来描 述原来观测的每一分量。

7因子分析

7因子分析

PRIN3 0.53968 0.08818 0.107935 0.84111
PRIN4 0.45150 0.10855 0.090300 0.93141
PRIN5 0.34295
.
0.068590
1.00000
Eigenvectors
PRIN1 PRIN2 PRIN3
PRIN4 PRIN5
X1 0.463605 -.240339 -.611705 0.386635 -.451262
4
Eigenvalues of the Correlation Matrix
Eigenvalue Difference Proportion Cumulative
PRIN1 2.85671 2.04755 0.571342 0.57134
PRIN2 0.80916 0.26949 0.161833 0.73317
F

j
x1,x2,
,xp的贡献
是衡量公共因子 F j 重要性的一个尺度
p
p
p
V(X) V(xi) ai21V(f1) ai22V(f2)
i1
i1
i1
p
p
ai2mV(fm) V(i)
i1
i1
p
g12 g22 gm 2 i2
i1
24
§ 3 因子载荷矩阵的估计方法
(一)主成分分析法
设随机向量 xx1,x2, ,xp 的均值为,协方差为,
7
变量
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
F1
0.691 0.789 0.702 0.674 0.62 0.687 0.621 0.538 0.434 0.147

实证分析

实证分析

实证分析1、因子分析法的基本原理因子分析(Factor Analysis)是利用降维方法进行统计分析的一种多元统计方法,是主成分分析的推广和发展,最初是20世纪初英国的心理学家Charles Spearmen提出,在有关智力测验的统计工作中应用,它通过研究相关矩阵或协方差矩阵的内部依赖关系,在尽可能不损失信息或者少损失信息的情况下,探求样本数据集地基本结构,并将多个变量综合为少数几个潜在的因子,这几个因子可以高度地概括大量样本的信息,几乎能够完全表达出原始变量同因子之间的关系设有P 个原始变量,表示为X ,根据因子分析法的原理,首先假设这些变量已经标准化(均值为0,标准差为1),并假设P 个变量可以由m 个因子表示为线性组合,即用矩阵的形式表示因子分析的数学模型为:,其中 X 为可实测的 p 维随机向量,它的每个分量都表示一个变或者指标:是公共因子(Common Factors)。

矩阵 A是特殊因子(Unique Factors),表示原始变量中不能由因子解释的部分,均值为零,包括随机误差。

因子分析首先要保证变量是相关的,如果变量之间不存在相关性,则提取不出公共因子,不适合因子分析。

所以在进行因子分析前,必须先检验是否相关,只有具备较高的相关性,才适合做因子分析,也称适当性检验。

KMO和Bartlett球形检验一般用来测试变量的相关性是够适合进行因子分析,当KMO的值在0.5以上时表明适合做公共因子分析,Bartlett球形检验的值在0.05以下时,即相关系数矩阵显著异于单位矩阵,表明将样本采用因子分析是合适的。

2、回归分析的基本原理回归分析是统计学中常用的基本分析方法,它用于分析事物之间的统计关系。

回归分析主要研究变量之间的线性关系,称为线性回归分析,线性回归分析是基于最小二乘法原理产生的古典统计假设下的统计分析方法,用来研究一个或多个自变量与一个因变量之间是否存在某种线性关系。

假如引入回归分析的自变量仅有一个,就是简单线性回归分析,如果引入回归分析的自变量有两个以上,那么就是多元线性回归分析,简单线性回归是多元线性回归的特例。

因子分析实验报告范本

因子分析实验报告范本

因子分析实验报告范本(8)对实验结果进行分析研究5、预习抽查、提问及成绩(请按优,良,中,及格,不及格五级评定)6、未抽查学生的预习成绩(请按优,良,中,及格,不及格五级评定,由教师评阅实验报告时确定)第二部分:实验过程记录(可加页)1、实验原始记录(包括实验数据记录,实验现象记录,实验过程发现的问题等)第一步:导入数据交作® 编勘视图茁fttg(D)炜飘D 分折他)图羽〔① 起H■幵数据俸回3檢素…■关闭Q Ct甘斗Q 探存Ctrl-S另存M£0...1舲股票代冯蛋票启称星玉每股收主营业务临入万元主营壮务和净利掏万元总资庐万元总氏储万元am万元净资庐万元1600519蛊州茅台9.3500217181918531611D69333536615&831023:625034133 2520*ST 風圈 4.3100 765S9 91S3 4360£9 5321S J3330 34 48773 2304 洋河战储370001230535 735376 396274 29^0921D08495 3719206974 E00694大酋股盼 3.5100244355349&401 1029551M0G9409297431E177205 551 格力电器 3.27® 9341Q06 35387J6982755 1595O3B3 11073129 1140772596 600392 广杀朋珠 2.42008612 5149 02756 2&35B1 1041310 25314B76031B8亚邦股粘 2.380019276S9613051512365843105490 10 260053 8300386 飞天诚信 2.3200 73471 31617 18937 1452S8 13802 13 131J869 33B 建茉动力 2.2200 5614B38 1196345 J44543 12291644 8253531 4B4038113 10300Q95三六五网•-■'ill3275730342117353B773BO536080720 111600340 痒夏車舊 2 130******** 5SI71492821171O454E07 0757223 75 1697464 12333 美的菓团 2.120010908416 2724175895296 115822077164805 7D 4417492 13601336新华■保晞 2.030010992500770400&3250061043000663669001246B2100 14 E0Q742 一汽宣錐 1.0300 321935 44368 39B42E25EQ323354120392142 15538 云甫白药 1.0700 1331752397977 194470 1471992397999 37 1074393 1660D436片甘腐 1.06001067735215223877338619&37^025274S21 17 600104 上芫棄团1,0500 46954731 528B0772CMO93238147695 2127279010 16674997 106D3168 张普罢思 1.B400 5B567 41D699995 8347S 1031789 7315819601533匠城汽生 1.BJ0042665B9105313355S625543O55J2317249213113305 2060081G 妄怯信托1,6100135026 109457 S209Q22956270060:45 1594&4图1数据第二步:将数据标准化fe9.36004.3100口十"gn丄H L H教IM也…,貝谒股J締出(①…■本©•••r Trnrsn点击分析f 描述统计f 描述。

主成分分析与因子分析的联系与区别

主成分分析与因子分析的联系与区别

一、问题的提出在科学研究或日常生活中,常常需要判断某一事物在同类事物中的好坏、优劣程度及其发展规律等问题。

而影响事物的特征及其发展规律的因素(指标)是多方面的,因此,在对该事物进行研究时,为了能更全面、准确地反映出它的特征及其发展规律,就不应仅从单个指标或单方面去评价它,而应考虑到与其有关的多方面的因素,即研究中需要引入更多的与该事物有关系的变量,来对其进行综合分析和评价。

多变量大样本资料无疑能给研究人员或决策者提供很多有价值的信息,但在分析处理多变量问题时,由于众变量之间往往存在一定的相关性,使得观测数据所反映的信息存在重叠现象。

因此为了尽量避免信息重叠和减轻工作量,人们就往往希望能找出少数几个互不相关的综合变量来尽可能地反映原来数据所含有的绝大部分信息。

而主成分分析和因子分析正是为解因子分相关。

1.2.),3. 主成分的各系数,是唯一确定的、正交的。

不可以对系数矩阵进行任何的旋转,且系数大小并不代表原变量与主成分的相关程度;而因子模型的系数矩阵是不唯一的、可以进行旋转的,且该矩阵表明了原变量和公共因子的相关程度。

4. 主成分分析,可以通过可观测的原变量X直接求得主成分Y,并具有可逆性;因子分析中的载荷矩阵是不可逆的,只能通过可观测的原变量去估计不可观测的公共因子,即公共因子得分的估计值等于因子得分系数矩阵与原观测变量标准化后的矩阵相乘的结果。

还有,主成分分析不可以像因子分析那样进行因子旋转处理。

5.综合排名。

主成分分析一般依据第一主成分的得分排名,若第一主成分不能完全代替原始变量,则需要继续选择第二个主成分、第三个等等,此时综合得分=∑(各主成分得分×各主成分所对应的方差贡献率),主成分得分是将原始变量的标准化值,代入主成分表达式中计算得到;而因子分析的综合得分=∑(各因子得分×各因子所对应的方差贡献率)÷∑各因子的方差贡献率,因子得分是将原始变量的标准化值,代入因子得分函数中计算得到。

因子分析

因子分析
2016-12-6

怎样解释因子分析结果?
例8.1数据的因子分析。在SPSS中,因子分析与主成分分析类似, 也可以根据各个特征值的大小来选择因子,也可以绘制直观的碎石 图来帮助判断,标准也是类似的。不同的是,因子分析可以通过“ 因子旋转”这一步骤得到下表的旋转后的因子载荷矩阵。
旋转成份矩阵a 成份 1 数学 物理 化学 语文 历史 英语 -.341 -.028 -.415 .893 .899 .924 2 .821 .895 .737 -.312 -.196 -.176
2016-12-6
几点说明
作为多元分析中处理降维的两种统计方法,无论是主成 分分析还是因子分析,我们已经知道,只有当原始数据 中的变量之间具有较强的相关关系时,降维的效果才会 明显,试图用少数几个变量代表多个变量的操作才是可 行的。 对于主成分和因子的选择标准也应基于定量分析的结果 ,结合具体情况予以确定。而选出的主成分或因子虽然 都可以表示成原始变量的线性组合,并且人们总是希望 能够根据它们之间的关系特征对主成分或因子进行命名 ,但结果并不会总是那么清晰。 即使得到了满意的主成分或因子,在运用它们对实际问 题进行评价、排序等分析时,仍然要保持高度谨慎。
样本量要足够大。一般而言,要求样本量至 少是原始变量总数的5倍以上。如果要得到比 较理想的结果,则应该在 10 倍以上。此外, 样本总量也应足够大,理论要求应该在100以 上。 各原始变量间应该具有相关性。如果变量独 立,则无法提取公共因子,因子分析也就没 有意义了。 因子分析中各公因子应该具有实际意义。
因子分析
因子分析的概念和思想
因子分析和主成分分析有很多相似之处,它们的目的是一致的,都 是要将具有一定关联的多个变量进行高度概括,寻找合适的少数变量 来代表原先的所有变量。尤其在计算机上实现时,两种方法所要耗费 的时间并没有太大差异,除了可能有一两个选项不同之外,它们的输 出结果所包含的内容十分类似。因此,人们往往对二者不加区分。 实质上,主成分分析可以看作是因子分析的一个特例,因子分析是 主成分分析的推广和发展,二者最直观的区别就在于变量和主成分/因 子个数的一致性上。 主成分分析的基本思想是要寻找高维椭球的所有主轴,因此,原始 数据包含了多少个变量,就有多少个主成分,人们对于主成分的选择 是依据最终的分析结果来确定的。而因子分析则需要事先确定要找几 个成分,也就是所谓的因子 (Factor) ,因子个数从一开始可能就远少 于原始变量的个数。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因子分析是主成分分析的推广和发展,它也是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它也是属于多元分析中处理降维的一种统计方法。

因子分析的内容十分丰富,这里仅介绍因子分析常用一种类型:R型因子分析(对变量做因子分析)。

基本思想:因子分析的基本思想是通过变量(或样品)的相关系数矩阵(对样品是相似系数矩阵)内部结构的研究,找出能控制所有变量(或样品)的少数几个随机变量去描述多个变量(或样品)之间的相关(相似)关系,但在这里,这少数几个随机变量是不可观测的,通常称为因子。

然后根据相关性(或相似性)的大小把变量(或样品)分组,使得同组内的变量(或样品)之间相关性(或相似性)较高,但不同组的变量相关性(或相似性)较低。

R 型因子分析数学模型:
用矩阵表示:=
简记为
且满足:
即和是不相关的;
Digg
排行
主成
分分

动态
分析

判别
分析
聚类
分析
因子
分析
密切
值法
综述
综合
评价
分析
相关
分析

因素
分析

平衡
分析

热门
即不相关且方差皆为1。

<!--[if !vml]--><!--[endif]-->
<!--[if !vml]-->
<!--[endif]-->

<!--[if !vml]--><!--[endi
f]-->
不相关,且方差不同。

其中
是可实测的个指标所构成
维随机向量,
是不可观测的向量,称为的公共因子或潜因子。

称为
因子载荷是第个变量在第个公共因子上的负荷。

矩阵称为因子载荷矩阵;
称为的特殊因子,通常理论上要求的斜方差阵是对角阵,中包括了随
机误差。

因子分析和主成分分析的区别:主成分分析的数学模型实质上是一种变换,
而因子分析模型是描述原指标斜方差阵结构的一种模型。

另外,在主成分分
析中每个主成分相应的系数是唯一确定的。

与此相反,在因子分析中每个因
子的相应系数不是唯一的,即因子载荷不是唯一的。

因子模型中公共因子,因子载荷和变量共同度的统计意义:
假定因子模型中,各个变量以及公共因子、特殊因子都已经是标准化(均
值为0,方差为1)的变量。

(1)因子载荷的统计意义:因子载荷的统计意义就是第个变量与第
个公共因子的相关系数即表示依附于的分量(比重)。

它反映第个变量
评论
在第个公共因子上的相对重要性。

(2)变量共同度的统计意义:变量的共同度定义为因子载荷阵中第
行元素的平方和,即,为了说明它的统计意义,将下式两
边求方差,即
由于已经标准化了,所以有
此式说明变量的方差由两部分组成:第一部分为共同度,它刻划全部公共因子对变量的总方差所作的贡献,越接近1,说明该变量的几乎全部原始信息都被所选取的公共因子说明了。

(3)公因子的方差贡献的统计意义
将因子载荷矩阵中各列元素的平方和记为:
称为公共因子对的贡献,即表示同一公共因子对诸变量所提供的方差贡献之总
和,它是衡量公共因子相对重要性指标。

因子分析的计算步骤:
第一步:将原始数据标准化,为书写方便仍记为。

第二步:建立变量的相关系数阵
其中
第三步:求R的特征根及相应的单位特征向量,分别记为

根据累计贡献率的要求比如,取前个特征根及相应的特征向量写出因子载荷阵:
第四步:对A施行方差最大正交旋转。

建立因子分析数学模型的目的不仅要找出公共因子以及对变量进行分组,更重要的是要知道每个公共因子的意义,以便对实际问题做出科学的分析,如果每个公共因子的含义不清,不便于进行实际背景的解释,这时根据因子载荷阵的不唯一性,可对因子载荷阵实行旋转即用一个正交阵右乘A(由线性代数知道一个正交变换,对应坐标系的一次旋转)使旋转后的因子载荷阵结构简化,便于对公共因子进行解释。

所谓结构简化就是使每个变量仅在一个公共因子上有较大的载荷,而在其余公共因子上的载荷比较小,至多是中等大小。

这种变换因子载荷阵的方法称为因子轴的旋转,而旋转的方法有多种,如正交旋转,斜交旋转等。

第五步:计算因子得分。

因子分析的数学模型是将变量(或样品)表示为公共因子的线性组合,由于公共因子能反映原始变量的相关关系,用公共因子代表原始变量时,有时更有利于描述研究对象的特征,因而往往需要反过来将公共因子表示为变量(或样品)的线性组合,即
称上式为因子得分函数。

用它来计算每个样品的公共因子得分。


样就可以在二维平面上作出因子得分的散点图,进而对样品进行分类或作为下一步分析原始数据时对问题作作更深入的研究。

相关文档
最新文档