第6章--因子分析
06 第六章 R-Q型因子分析

X = nW
于是有
(6.24)
F=
nWU
∧−1 2
=
nF R
∧−1 2
即
(6.24)
FR =
1
F
∧−1 2
n
(6.25)
其中各记号同前文一致。 现在用图 4-9 中汇水盆地的样本为例说明R-Q型因子分析的计算与应用。由样本中 25
个样品 6 个变量作R型因子分析后得因子负载矩阵A于表 5-2。它就是R-Q型因子分析中要求 的R型负载AR。表 5-2 对应的R型因子得分矩阵F列表 5-3,由(6.25)式可求得R-Q型因子分 析中要求的Q型的负载AQ=FR,所得结果列于表 6-1。
三、R-Q 型因子分析的图示
矩阵AR和AQ都是p列的,这意味着m维变量空间和n维样品空间样品都可用一p维因子空
3
间代替,因为p<<min(n,m),故原始空间维数约简了许多。 由于下面的关系成立
AR ARΤ = W ΤW
AQ AQΤ = WW Τ
可见,变量间关系完全保留在ARARΤ中,样品间关系完全保留在AQAQΤ中。
一、R-Q 型因子分析的相似性矩阵
我们考虑用相关系数作为变量间相似性的度量,用欧氏距离作为样品间的相似性度量,并
以此建立起变量间相似性矩阵与样品间相似性矩阵的联系。设原始数据矩阵为如下的形式:
Xn×m=(xij)n×m 其中xij为样品i变量j的观测值;并对数据作如下变换,即类似与标准化变换:
(6.1)
n
j =1
j =1
∑ (xij − x j )2
i =1
(6.8)
∑m
=
(xkj − xLj ) 2
n
= hkk + hLL − 2hkL
第六章 因子分析

因此:因子也是综合变量;因子具有更 明确的指标意义;具有不同意义的因子 便于揭示事物变化的内在结构;提取少 量重要因子可以达到降维和简化分析的 作用。
(二)因子分析的一般模型:
令因子为 F(factor),当我们研究 m 个因子对实 际问题的影响时可以建立因子模型,即
X i ai1F1 ai 2 F2 aim Fm + i 。 其中的 F 是对所有
(三)基本思想:
基于对因子的认识,因子分析的基本思想就是通过变 量(或样品)的相关系数矩阵(或相似系数矩阵)内 部结构的研究,找出能控制所有变量(或样品)的少 数几个随机变量去描述多个变量(或样品)之间的相 关(或)相似关系。在分解原始变量的基础上,从中 归纳出潜在的“类别”,相关性较强的变量归为一类, 不同类间变量的相关性则较低。从而实现因子分析的 两个目的:一简化分析,二将原变量分类,对公因子 的意义作出合理可信的解释。
而进行因子分析的起点就是因子模型,我们通 过估计因子模型中的参数即因子负荷和方差对 各因子的重要程度进行衡量,并利用因子负荷 矩阵所体现的各变量或样品之间的相关程度提 取出具有明确意义的公因子F,赋予其有实际 背景的解释进而给以命名,从而达到降维和分 类的目的。
三、因子分析的数学原理。
因R型因子分析应用广泛,故本章的解释均是 以R型因子分析为对象。 (一)正交因子模型: 因子分析的一般模型为:
X 1 a11F1 a12 F2 a1m Fm 1 X 2 a21F1 a22 F2 a2 m Fm 2 X p a p1F1 a p 2 F2 a pm Fm p
i
可将上式写成简单的矩阵形式
第六章 温度因子分析

不同生态系统生产力
化,形成与此相应的植物发育节律,称为物候。 • 植物发芽、生长、现蕾、开花、结实、落叶、 休
眠等生长发育阶段的开始和结束称为物候期。 • 植物物候具有稳定性,可以用来指导林业生产。
影响物候的因素
• 纬度、经度和海拔 • 霍普金斯通过研究发现: • 在北美洲温带,每向北移动纬度1度,或向
东移动经度5度,或海拔上升124m,植物 在春天和初夏 物候会延迟4天。这一规律称 为霍普金斯定律。 • 南京和北京,纬度相差6度,桃、李开花 间 差19天;但到4、5月间,两地物候相差9天。
二、关于温度的一些生态概念
• (一)三基点温度 • 最适温度:生物生长发育或生理活动得以
正常进行的温度范围。 • 最低温度和最高温度:植物生长发育和生
理活动的低温和高温限度。 • 合称为三基点温度。
• (二)积温: 积温既能说明某一地区的热 量条件,又能说明生物各生长发育阶段或 整个生长期所需要的热量条件。
• *昼夜变温与种子萌发
•
有一些植物的种子在变温下萌发良好。
低温有利于增加氧在细胞中的溶解度;提
高透性。
• 昼夜变温与生长发育 • 较低的夜温和适宜的昼温对植物生长、开花、结
实和物质的贮藏有利。 • 云南松林:1000m 3/ha。 • 波密云杉林:2000m 3/ha。 • (二)物候 • 季节明显地区,植物适应于气候条件的节律性 变
因子分析及对应分析

2012-12-13 2012-12-13
5 5
在满足以上假定的条件下,就有:
cov( X i , X j ) E (ai F gi )(a j F g j ) ai a j var F ai a j
于是,有
cov( X i , X j ) cov( X i , X k )
aj ak
2012-12-13 2012-12-13
6 6
因为 a i 是一个常数,与 gi 相互独立且 F 与 X i 的方差均被假定为1。 F 于是有 1 ai2 var( gi )
因此,常数a i 的意义就在于其平方表示了公共因子F 解释X i 的方 2 差的比例,因此被称之为因子载荷,而 a i 被称作共同度。 对Spearman的例子进行推广,假定每一门科目的考试成绩都受 到 m个公共因子的影响及一个特殊因子的影响,于是上式就变 成了如下因子分析模型的一般形式:
x* a 1 1 f 1 a 1 2 f 2 a 1 p f p c 1 g 1 1 * x 2 a 2 1 f 1 a 2 2 f 2 a 2 p f p c 2 g2 x* a f a f a f c g , m1 1 m2 2 m p p m m m where E ( f j ) 0 , D( f j ) 1, E ( g i ) 0 , D( g i ) 1
X i ai 1 F1 ai 2 F2 aim Fm gi
2012-12-13 2012-12-13
7 7
X 式中, i为标准化后的第 i 门科目的考试成绩,均值为0,方差为 1。F1 , F2 , , Fm 是彼此独立的公共因子,都满足均值为0,方差 为1。gi为特殊因子,与每一个公共因子均不相关且均值为0。 则ai 1 , ai 2 , , aim 为对第 i 门科目考试成绩的因子载荷。对该模型, 有: 2 2 2
第6章 主成分分析

第6章主成分分析与因子分析6.1主成分分析数学模型当存在若干个随机变量时,寻求它们的少量线性组合(即主成分),用以解释这些随机 变量,是很必要的。
首先我们看一个例子。
例6.1 为了调查学生的身材状况,可以测量他们的身高(X1)、体重(X2)、胸围(X3)和坐高(X4)。
可是用这4个指标表达学生身材状况不方便。
但若用 y1=3.6356x1+3.3242x2+2.4770x3+2.1650x4表示学生身体魁梧程度;用y2=-3.9739x1+1.3582x2+3.7323x3-1.5729x4表示学生胖瘦程度。
则这两个指标(Y1,Y2)很好概括了4个指标(X1-X4)。
例6.1中,学生不同,身高(X1)、体重(X2)、胸围(X3)和坐高(X4)不同;X1,X2,X3,X4是4维随机向量;Y1,Y2是他们的2个线性组合,Y1,Y2能很好表示X1,X2,X3,X4的特性。
类似的问题在许多地方出现:可观测的随机变量很多,需要选出所有所有随机变量的少数线性组合,使之尽可能刻划全部随机变量的特性,选出的线性组合就是诸多变量的主成分,又称为主分量。
寻求随机向量主成分,并加以解释,称为主成分分析,又称为主分量分析。
主成分分析的数学模型是:对于随机向量X ,想用它分量的线性组合X c '反映随机向 量X 的主要信息。
也即)'(X c D 应当最大。
但是c 的模可以无限增大,从而使)'(X c D 无限变大,这是我们不希望的;于是固定c 模的大小,而改变c 各分量的比例,使)'(X c D 最 大;通常取c 的模为1最方便。
定义6.1 设随机向量)',...(1p x x X =二阶矩存在,若常数向量1c ,在条件c =1下使)'(X c D 最大,则称X c Y '11=是X 的第一主成分或第一主分量。
由定义可见,1Y 尽可能多地反映原来p 个随机变量变化的信息。
第六章 因子分析

9
寻找基本结构
在多元统计中,经常遇到诸多变量之间存在强相关的问题,它 会对分析带来许多困难。通过因子分析,可以找出几个较少的有实
际意义的因子,反映出原来数据的基本结构。
例如:调查汽车配件的价格中,通过因子分析从 20 个指标中概 括出原材料供应商、配件厂商、新进入者、后市场零部件厂商、整 车厂和消费者6个基本指标。从而找出对企业配件价格起决定性作用 的几个指标。
本包含了原来变量的所有信息。
12
主成分分析的数学模型
13
主成分分析与因子分析公式上的区别
y1 a11 x1 a12 x2 a1 p x p
主成分分析
y2 a21 x1 a22 x2 a2 p x p y p a p1 x1 a p 2 x2 a pp x p
由于umn为随机向量X的相关矩阵的特征值对 应的特征向量的分量,特征向量之间彼此正交, 实际上从X到F的转换关系是可逆的,即:
x1 11 F1 21 F2 p1 Fp x2 12 F1 22 F2 p 2 Fp x F F F 1p 1 2p 2 pp p p
1、因子分析的核心:用较少的、相互独立的因 子反映原有变量的绝大部分信息。 因子分析的数学模型:设有p个变量,每个变量 的均值为0,标准差为1。将每个原有变量用k个 (k<p)因子f1,f2,…,fk 的线性组合表示,即
x1 a11 f1 a12 f 2 a1k f k 1 x2 a21 f1 a22 f 2 a2 k f k 2 x p a p1 f1 a p 2 f 2 a pk f k p
光学第六篇傅里叶变换光学简介

复杂波场: 分解为一系列平面波或球面波成分
波的类型和特性 波前相因子
波前相因子
方向角的余角
线性相因子
系数(cosx,cosy)或 (sin1,sin2)与平面 波的传播方向一一对应。
U2 U1
ik x2 y2
e 2fBiblioteka 凹透镜和凸透镜的情况相同,
只是焦距一个为负,一个为正。
相位型
例题:求薄透镜傍轴成像公式:
在傍轴条件下:U1 ( x,
y)
ik x2 y2
A1e 2s
ik x2 y2
透镜函数:tL (x, y) e 2 f
s
s’
ik x2 y2
ik x2 y2
U2 (x, y) tL (x, y)U1(x, y) e 2 f
二维 tP ( x, y) eik (n1() 1x+2 y)
例题:推导棱镜傍轴成像公式:
傍轴条件:
ik x2 y2
s
U1(x, y) A1e 2s
ik x2 y2 ik (n1) x
U2 (x, y) tP (x, y) U1(x, y) A1e 2s
(n1)s 2 x(n1)s 2 y2
第六章 傅里叶变换光学简介
第六章 傅里叶变换光学简介
1、衍射系统 波前变换 2、相位衍射元件 3、波前相因子分析法 4、余弦光栅的衍射场 5、傅里叶变换 6、超精细结构的衍射 隐失波 7、阿贝成像原理与空间滤波 8、光学信息处理列举 9、泽尼克的相衬法
惠更斯-菲涅耳原理 光波衍射
菲涅耳衍射 夫琅禾费衍射
二维波前 决定 三维波场
二维波前 决定 三维波场
Double-helix Point Spread Function (DH-PSF) DH-PSF transfer function obtained from the iterative obtimization procedure, and its GL modal plane decomposition, which forms a cloud around the GL modal plane line. The DH-PSF transfer function does not have any amplitude component, and consequently is not absorptive.
环境统计学环境因子分析ppt课件

环境多元线性回归分析
最小二乘法 SPSS求解
环境系统聚类分析 聚类要素的显数著据性处检理验 距离的计算环境应用
聚类分析常用方法
环境判别分析 距 Fis离he判r判别别法S环P法境SS应求用解
环境主成分分析Bayes主判成别分法分析概述 主成分分析计算原理
人工神经网络
主成分分析性质 SPSS求解和环境应用
表明,十项得分基本上可归结于他们的 短跑速度,爆发性臂力、爆发性腿力和耐力, 每一方面都称为一个因子。
20
因子模型
100米跑 a11短跑速度 a12爆发性臂力 a13爆发性腿力 a14耐力1 跳远 a21短跑速度 a22爆发性臂力 a23爆发性腿力 a24耐力2 铅球 a31短跑速度 a32爆发性臂力 a33爆发性腿力 a34耐力3
1500米
a 短跑速度 a 爆发性臂力 a 爆发性腿力 a 耐力 10,1
短1跑0,速2 度 11x1s 12 x2s 1,1100x,130s
10,4
10
爆发性臂力 21x1s 22 x2s x 2,10 10s
爆发性腿力 31x1s 32 x2s x 3,10 10s
主成分分析的一般目的:
国民经
消费资料 净增库存
人口
生产指数
外贸盈余
变量的降维
主成分的解释
国民经济指标
总收入F1 总收入变化率F2 经济发展趋势F3
17个变量
3个变量
15
主成分分析例子
样本 x1 x2
COD BOD 氨氮 SS 浊度 pH 色度
16
因子分析:潜在的假想变量和随机影响变量的线 性组合表示原始变量。
因子分析(factor analysis)也是一种降维、简化数据的 技术。它通过研究众多变量之间的内部依赖关系, 探求观测数据中的基本结构,并用少数几个“抽象” 的变量来表示其基本的数据结构。这几个抽象的变 量被称作“因子”,能反映原来众多变量的主要信 息。原始的变量是可观测的显在变量,而因子一般 是不可观测的潜在变量。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第6章--因子分析
第六章因子分析
一、填空题
1.因子分析常用的两种类型为和。
2.因子分析是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现_____________与____________之间的相互关系。
3.因子分析就是通过寻找众多变量的来简化变量中存在的复杂关系的一种方法。
4.因子分析是把每个原始变量分解成两个部分即、。
5.变量共同度是指因子载荷矩阵中_______________________。
6.公共因子方差与特殊因子方差之和为_______。
7.求解因子载荷矩阵常用的方法有和。
8.常用的因子旋转方法有和。
9.Spss中因子分析采用命令过程。
10.变量
X的方差由两部分组成,一部分为,另一部分为。
i
二、判断题
1.在因子分析中,因子载荷阵不是唯一的。
()
2.因子载荷阵经过正交旋转后,各变量的共性方差和各个因子的贡献都发生了变化。
()
3.因子分析和主成分分析的核心思想都是降维。
()
4.因子分析有两大类,R型因子分析和Q型因子分析;其中R型因子分析是从变量的相似矩阵出发,而Q型因子分析是从样品的相关矩阵出发。
()5.特殊因子与公共因子之间是相互独立的。
()
6.变量共同度是因子载荷矩阵列元素的平方和。
()
7.公共因子的方差贡献是衡量公共因子相对重要性指标。
()
8.对因子载荷阵进行旋转的目的是使结构简化。
()
三、简答题
1.因子分析的基本思想是什么,它与主成分分析有什么区别和联系?
2.因子模型的矩阵形式ε+=X UF ,其中:
()
()
()
u F
F ij m
p P
m
U F
⨯='
='
=εεε,,,,1
1
ΛΛ
请解释式中F 、
ε、U 的统计意义。
3.因子旋转的意义何在?如何进行最大方差因子旋转? 4.因子分析主要应用在哪几个方面? 四、计算题
4.假设某地固定资产投资率1x , 通货膨胀率2x 和失业率3x 的约相关矩阵为:
⎥⎥⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢
⎢⎢⎣⎡----=525
25
152********
51*
R 并且已知该相关矩阵的各特征根和相应的非零特征根的单位特征向量分别为: 9123.01=λ ()'-=657.0657.0369
.01α 0877.02=λ ()'-=261.0261
.0929.02α
03=λ
要求求解因子分析模型,计算各变量的共同度和各公共因子的方差贡献并解释它们的统计意义。
2.设变量x 1,x 2和x 3已标准化,其样本相关系数矩阵为:
⎥⎥
⎥⎦
⎤⎢⎢⎢⎣⎡=135.045.035.0163.045.063.01
R (1)对变量进行因子分析。
(2)取q=2进行正交因子旋转。
3.已知我国某年各地区的国有及非国有规模以上的工业企业经济效益资料,现做因子分析,结果如下,请说明每一个输出结果的含义及目的,并回答以下问题:
(1)什么是方差贡献率? 计算方差贡献率的目的何在?
(2)如何利用因子分析结果进行综合评价?结合本例写出计算综合评价结果的公式。
表1
表2
表3
表4
表5
五、操作题
1.10名初中男生身高、胸围、体重的数据资料如下:
身高x
1(cm) 胸围x
2
(cm) 体重x
3
(kg)
149.5 162.5 162.7 162.2 156.5 156.1 172.0 173.2 159.5 157.7 69.5
77.0
78.5
87.5
74.5
74.5
76.5
81.5
74.5
79.0
38.5
55.5
50.8
65.5
49.0
45.5
51.0
59.5
43.5
53.5
(2)分别计算各变量的公共因子方差和特殊因子方差,判断哪个因子能概括原始信息的大部分,为什么?
(3)写出方差最大正交旋转因子模型,并分析各因子的实际含义
(4)计算各个样本点的因子得分
2.对某市15个大中型工业企业进行经济效益分析,经研究确定,从有关经济效益指标中选取7个指标作分析,即固定资产产值率(X1),固定资产利税率(X2),资金利润率(X3),资金利税率(X4),流动资金周转天数(X5),销售收入利税率(X6)和全员劳动生产率(X7)。
数据资料如下:
企业及编号固定资产
率X1 固定资产
利税率
资金利润
率(X3)
资金利税
率(X4)
流动资金
周转天数
销售收入利
税率(X6)
全员劳动生
产率(X7)
第一、对数据资料进行主成分分析:
(1)前两个最大特征根为_____________、______________,其对应的特征向量为__________________________________,_____________________________。
(2)第一主成分的表达式为_________________________________________ ___,该主成分包含了原始信息的_______%,第二主成分的表达式为_________________________________________,该主成分的方差贡献率为_______。
(3)如果舍弃第二主成分,则哪个原始变量的损失信息最大:_______
(4)第一个主成分与第二个变量间的相关系数为_____________
(5)第一个主成分主要反映盈利能力,现对第一主成分计算得分为_________________________________________________________________,对得分进行排序(降序),各企业的得分排名顺序依次为:_________________ __________________________(依企业顺序写出排名)。
若利用第一、二主成分构造综合评价函数,则两主成分的权数分别为_________、_________。
第二、对原数据资料进行因子分析:
(6)利用主成分法求解因子载荷,现提取两个因子进行分析,因子模型表示为:
(7)前三个变量(X1,X2,X3)的公共因子方差为___________、_____________、____________,特殊因子方差为________、___________、_____________。
(8)对以上模型进行方差最大正交旋转,得出旋转后的因子载荷矩阵为:。