第六章 全因子分析分析

合集下载

06 第六章 R-Q型因子分析

06 第六章  R-Q型因子分析

X = nW
于是有
(6.24)
F=
nWU
∧−1 2
=
nF R
∧−1 2

(6.24)
FR =
1
F
∧−1 2
n
(6.25)
其中各记号同前文一致。 现在用图 4-9 中汇水盆地的样本为例说明R-Q型因子分析的计算与应用。由样本中 25
个样品 6 个变量作R型因子分析后得因子负载矩阵A于表 5-2。它就是R-Q型因子分析中要求 的R型负载AR。表 5-2 对应的R型因子得分矩阵F列表 5-3,由(6.25)式可求得R-Q型因子分 析中要求的Q型的负载AQ=FR,所得结果列于表 6-1。
三、R-Q 型因子分析的图示
矩阵AR和AQ都是p列的,这意味着m维变量空间和n维样品空间样品都可用一p维因子空
3
间代替,因为p<<min(n,m),故原始空间维数约简了许多。 由于下面的关系成立
AR ARΤ = W ΤW
AQ AQΤ = WW Τ
可见,变量间关系完全保留在ARARΤ中,样品间关系完全保留在AQAQΤ中。
一、R-Q 型因子分析的相似性矩阵
我们考虑用相关系数作为变量间相似性的度量,用欧氏距离作为样品间的相似性度量,并
以此建立起变量间相似性矩阵与样品间相似性矩阵的联系。设原始数据矩阵为如下的形式:
Xn×m=(xij)n×m 其中xij为样品i变量j的观测值;并对数据作如下变换,即类似与标准化变换:
(6.1)
n
j =1
j =1
∑ (xij − x j )2
i =1
(6.8)
∑m
=
(xkj − xLj ) 2
n
= hkk + hLL − 2hkL

第六章 因子分析

第六章 因子分析


因此:因子也是综合变量;因子具有更 明确的指标意义;具有不同意义的因子 便于揭示事物变化的内在结构;提取少 量重要因子可以达到降维和简化分析的 作用。
(二)因子分析的一般模型:
令因子为 F(factor),当我们研究 m 个因子对实 际问题的影响时可以建立因子模型,即
X i ai1F1 ai 2 F2 aim Fm + i 。 其中的 F 是对所有
(三)基本思想:

基于对因子的认识,因子分析的基本思想就是通过变 量(或样品)的相关系数矩阵(或相似系数矩阵)内 部结构的研究,找出能控制所有变量(或样品)的少 数几个随机变量去描述多个变量(或样品)之间的相 关(或)相似关系。在分解原始变量的基础上,从中 归纳出潜在的“类别”,相关性较强的变量归为一类, 不同类间变量的相关性则较低。从而实现因子分析的 两个目的:一简化分析,二将原变量分类,对公因子 的意义作出合理可信的解释。

而进行因子分析的起点就是因子模型,我们通 过估计因子模型中的参数即因子负荷和方差对 各因子的重要程度进行衡量,并利用因子负荷 矩阵所体现的各变量或样品之间的相关程度提 取出具有明确意义的公因子F,赋予其有实际 背景的解释进而给以命名,从而达到降维和分 类的目的。
三、因子分析的数学原理。
因R型因子分析应用广泛,故本章的解释均是 以R型因子分析为对象。 (一)正交因子模型: 因子分析的一般模型为:

X 1 a11F1 a12 F2 a1m Fm 1 X 2 a21F1 a22 F2 a2 m Fm 2 X p a p1F1 a p 2 F2 a pm Fm p
i

可将上式写成简单的矩阵形式

6-因子分析

6-因子分析

上式是假定了因子模型中特殊因子是不重要的,因而 从∑的分解中忽略掉特殊因子的方差 如果考虑了特殊因子以后,协差阵为:
当∑未知,可用样本协差阵S去代替,要经过标准化 处理,则S与相关阵R相同,仍然可作上面类似的表示。 一般设 则因子载荷阵的估计 即 为样本相关阵尺的特征根, 设 m < p, 相应的标准正交化特征向量为;
所以
也是公共因子,
ቤተ መጻሕፍቲ ባይዱ
也是因子载荷阵。
因子载荷这个不唯一性,从表面上看是不利的,但后面将 会看到当因子载荷阵A的结构不够简化时,可对A实行变 换以达到简化目的,使新的因子更具有鲜明的实际意义。 从因子分析的数学模型上看,它与多变量回归分析也有类 似之处,但本质的区别是因子分析模型作为“自变量”的 F是不可观测的。 2 因子模型中公共因子、因子载荷和变量共同度的 统计意义 为了便于对因子分析计算结果做解释,将因子分析数 学模型中各个量的统计意义加以说明是十分必要的, 假定因子模型中,各个变量以及公共因子、特殊因子 都已经是标准化(均值为0,方差为1)的变量。 (1)因子载荷的统计意义 已知模型:
为了说明它的统计意义,将下式两边求方差,即
由于
已标准化了,所以有
此式说明变量 的方差由两部分组成:第一部分为共 度 它刻划全部公共因子对变量 的总方差所作的贡 献, 越接近1,说明该变量的几乎全部原始信息都被 所选取的公共因子说明了,如 则说明 的 97%的信息被m个公共因子说明了,也就是说由原始变量 空间转为因子空间转化的性质越好, 保留原来信息量
A经过Tk j ,旋转(变换)后,矩阵A=A T k j ,其元素为
其中旋转角度
仍按下面公式求得:
m个因子,每次取两个全部配对进行旋转,共需旋转

第六章 温度因子分析

第六章 温度因子分析
植物对生长所必须的水分、CO2、养分吸收增多, 酶活性增强、促进细胞分裂、伸长,因此生长量 增 加。 • 3.影响生产力 • 温度是影响生产力的主要因素之一。怀梯克认 为, 沿温度梯度,生产力从热带到到北极逐渐降低。 对生产力而言,最适温度为15~25,与光合作用 的 适宜范围一致。
不同生态系统生产力
化,形成与此相应的植物发育节律,称为物候。 • 植物发芽、生长、现蕾、开花、结实、落叶、 休
眠等生长发育阶段的开始和结束称为物候期。 • 植物物候具有稳定性,可以用来指导林业生产。
影响物候的因素
• 纬度、经度和海拔 • 霍普金斯通过研究发现: • 在北美洲温带,每向北移动纬度1度,或向
东移动经度5度,或海拔上升124m,植物 在春天和初夏 物候会延迟4天。这一规律称 为霍普金斯定律。 • 南京和北京,纬度相差6度,桃、李开花 间 差19天;但到4、5月间,两地物候相差9天。
二、关于温度的一些生态概念
• (一)三基点温度 • 最适温度:生物生长发育或生理活动得以
正常进行的温度范围。 • 最低温度和最高温度:植物生长发育和生
理活动的低温和高温限度。 • 合称为三基点温度。
• (二)积温: 积温既能说明某一地区的热 量条件,又能说明生物各生长发育阶段或 整个生长期所需要的热量条件。
• *昼夜变温与种子萌发

有一些植物的种子在变温下萌发良好。
低温有利于增加氧在细胞中的溶解度;提
高透性。
• 昼夜变温与生长发育 • 较低的夜温和适宜的昼温对植物生长、开花、结
实和物质的贮藏有利。 • 云南松林:1000m 3/ha。 • 波密云杉林:2000m 3/ha。 • (二)物候 • 季节明显地区,植物适应于气候条件的节律性 变

第六章因子分析

第六章因子分析

第六章因子分析第六章因子分析§6.1因子分析的基本原理与模型一、因子分析的基本思想基本思想:根据相关性的大小将变量分组,使得同组内变量间的相关性较高,不同组间的相关性较低。

每组变量代表一个基本结构,并用一个不可观测的综合变量形式表示,这个基本结构成为公共因子。

此时的原始变量就可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。

目的:从一些有错综复杂的问题中找出几个主要因子,每个主要因子代表原始变量间相互依赖的一种作用。

二、因子分析的基本模型常用的因子分析模型:R型因子分析和Q 型因子分析(一)R型因子分析模型R型因子分析是对变量作因子分析。

R型因子分析中的公共因子是不可直接观测但又客观存在的共同影响因素,每一个变量都可以表示成公共因子的线性函数与特殊因子之和,即:其中:称为公共因子,称为的特殊因子矩阵表达式:且满足:(1)(2),即公共因子与特殊因子是不相关的(3),即各公共因子不相关且方差为1(4),即各个特殊因子不相关,方差不要求相等模型中称为因子载荷,是第个变量在第个因子上的负荷,如果把变量看成维空间中的一个点,则表示它在坐标轴上的投影,因此矩阵称为因子载荷矩阵。

(二)Q型因子分析Q型因子分析是对样品作因子分析。

模型同上注:主成分分析与因子分析的区别主成分分析的数学模型本质上是一种线性变换,是将原始坐标变换到变异程度大的方向上去,相当于从空间上转换观看数据的的角度,突出数据变异的方向,归纳重要信息。

因子分析与主成分分析一样都属降低变量维数的方法。

但因子分析的本质是从显在变量去“提炼”潜在因子的过程。

模型中应注意的问题:(1)变量的协方差阵的分解式为即(2)因子载荷不是唯一的。

三、因子载荷阵的统计意义(一)因子载荷的统计意义对于因子模型可知的协方差若对作标准化处理,的标准差为1,且的标准差为1则(相关系数)综上可知:对于标准化后的,是的相关系数,一方面表示的依赖程度,绝对值越大,密切程度越高;另一方面也反映了变量对公共因子的相对重要性。

第六章 全因子分析

第六章 全因子分析

10
任两列中,“--”、“-+”、“+-”、“++”四种搭配出现 的次数相等,两列间的乘积的和为0,即两列“正交”。 这种正交性使实验结果的分析有“均衡分散,整齐可比” 的特点,因而具有很多优良性质,而且很容易计算出相应的回 归方程。这种实验设计方法常称为“正交实验设计法”
(orthogonal experimental design)。
11
12
13
14
15
16
计算机(Design-Expert)计算:
17
23三因子二水平全因子实验
23三因子二水平全因子实验具有以下 特点: 3个因子(主效应); 3个二因子交互效应(AB,AC, BC);
1个三因子交互效应(ABC);
需要8次实验。 右图所示给出23实验设计示意图。
3
1
主效应和交互效应
4
5
(a)无交互作用
(b)有交互作用
6
7
2二水平全因子实验设计8 Nhomakorabea9
二水平全因子实验设计原理 二水平全因子实验采用正交表(orthogonal array)设计,
具有均衡性(balanced)与正交性(orthogonaiity)两个特点:
任一列中正负号出现次 数各占一半,即在实验 中,每个因子取低水平、 高水平次数相同,即均 衡性。
30
No 1 2 3
I/A 7.5 7.5 3.5
ton/μs 6 7.5 7.5
toff/μs 6.5 6.5 6.5
Ra1/μm 21.82 23.1 19.62
Ra2/μm 11.68 18.27 12.63
4
5 6 7 8

多元统计分析第六章 因子分析

多元统计分析第六章 因子分析

第6章因子分析6.1 因子分析数学模型因子分析是很有用的统计分析工具,因子分析的实质就是找出少量不可观测的随机变量,用它们表示众多的可观测随机变量。

以下例子能说明因子分析的意义。

例6.1对一个班的学生,进行五门课程(力学、物理、代数、分析、统计)考试,其中力学和物理闭卷考试,代数、分析、统计开卷。

这5门功课的成绩是可观测的随机向量。

每个学生的成绩可以看成5维随机向量的一个观测,见表6-1。

表6-1 五门课程考试成绩经过一定计算(因子分析)后发现存在不可观测的随机变量:1f 、2f ,它们和51,...x x 间有关系 521542143213221212116377.1091469.9750.678264.162258.5364.721559.013358.6909.720269.564838.7523.721220.864570.8409.62v f f x v f f x v f f x v f f x v f f x +-+=+-+=+-+=+++=+++= (6.1) 其中1f 、2f 是不可观测的随机变量。

我们认为它们分别表示学生的学习能力和适应开闭卷能力,所以可分别称为学习因子和适应开闭卷因子。

(6.1)揭示了这两个因子如何影响5门功课的成绩,也揭示5门课成绩的实质:每门课的成绩由学习因子和适应开闭卷因子的线性组合,加上常数,再加上随机变量而得。

这是是很有意义的。

象例6.1那样,找出少量不可观测因子(例如1f 、2f ),并给出它们影响可观测随机变量(例如51,...x x )方式的统计分析,就是因子分析。

因子分析与主成分分析不同:主成分分析是寻求若干个可观测随机变量的少量线性组合,说明其含义;因子分析主要的目的是找出不一定可观测的潜在变量作为公共因子,并解释公共因子的意义,及如何用不可观测随机变量,计算可观测随机变量。

因子分析方法在心理学,经济,医学,生物学,教育学等方面有重要用途。

第六章 因子分析

第六章 因子分析

9
寻找基本结构
在多元统计中,经常遇到诸多变量之间存在强相关的问题,它 会对分析带来许多困难。通过因子分析,可以找出几个较少的有实
际意义的因子,反映出原来数据的基本结构。
例如:调查汽车配件的价格中,通过因子分析从 20 个指标中概 括出原材料供应商、配件厂商、新进入者、后市场零部件厂商、整 车厂和消费者6个基本指标。从而找出对企业配件价格起决定性作用 的几个指标。
本包含了原来变量的所有信息。
12
主成分分析的数学模型
13
主成分分析与因子分析公式上的区别
y1 a11 x1 a12 x2 a1 p x p
主成分分析
y2 a21 x1 a22 x2 a2 p x p y p a p1 x1 a p 2 x2 a pp x p
由于umn为随机向量X的相关矩阵的特征值对 应的特征向量的分量,特征向量之间彼此正交, 实际上从X到F的转换关系是可逆的,即:
x1 11 F1 21 F2 p1 Fp x2 12 F1 22 F2 p 2 Fp x F F F 1p 1 2p 2 pp p p
1、因子分析的核心:用较少的、相互独立的因 子反映原有变量的绝大部分信息。 因子分析的数学模型:设有p个变量,每个变量 的均值为0,标准差为1。将每个原有变量用k个 (k<p)因子f1,f2,…,fk 的线性组合表示,即
x1 a11 f1 a12 f 2 a1k f k 1 x2 a21 f1 a22 f 2 a2 k f k 2 x p a p1 f1 a p 2 f 2 a pk f k p
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档