9因子分析(精选)
因子分析因素分析详解

5色5变量
5色5主成分
一、案例引读
二、基本原理
三、历史渊源 四、分析步骤
五、案例详解
因素分析(Factor Analysis)就是将错综复杂的实测变量归结为 少数几个因子的多元统计分析方法。其目的是揭示变量之间的内在 关联性,简化数据维数,便于发现规律或本质。
因素分析的基本原理是根据相关性大小把变量分组,使得同组变 量之间的相关性较高,不同组变量之间相关性较低。每组变量代表 一个基本结构,这个结构用公共因子来进行解释。
一、案例引读
二、基本原理 三、历史渊源
四、分析步骤
五、案例详解
xi=aiF+ei
因子旋转
因子得分
因子负荷
F→F’ 主成分法 便于解释 样本的优劣
一、案例引读
二、基本原理 三、历史渊源
四、分析步骤
五、案例详解
因子负荷 主成分法
因子旋转
F→F’
利用主成分分 析把前几个主成分 作为未旋转的公共 因子。
案例 1
(3)设置对因素的抽取选项:单击图1-1对话框中的“Extraction…”按钮,弹出 “Factor Analyze:Extraction”(因素分析:萃取)对话框。 ① “Method”(方法)选项框:下拉式选项内 有其中抽取因素的方法: A “Principal components”法:主成份分析 未旋转因子解 共变异数矩阵 法抽取因素,此为SPSS默认方法。 陡坡图 相关矩阵 B “Unweighted least squares”法:未加权 特征值 最小平方法。 因子个数 C “Generalized least square”法:一般化最 小平方法。 图1-3 Factor Analyze:Extraction对话框 D “Maximum likelihood”法:最大概似法。 ② “Analyze”(分析)选项框 E “Principal-axis factoring”法:主轴法。 A “Correlation matrix”(相关矩阵) F “Alpha factoring”法:α因素抽取法。 :以相关矩阵来抽取因素。 G “Image factoring”法:映像因素抽取法。 B “Covariance matrix”(共变异数矩 ④ “Extract”(抽取)选项框 阵):以共变量矩阵来抽取因素。 A “Eigenvalues over”(特征值):后面的空 ③ “Display”(显示)选项框 格默认为1,表示因素抽取时,只抽取特征值 大于1者,使用者可随意输入0至变量总数之间 A “Unrotated factor solution”(未 旋转因子解):显示未转轴时因素负 的值。 荷量、特征值及共同性。 B “Number of factors”(因子个数):选取 此项时,后面的空格内输入限定的因素个数。 B “Scree plot”(陡坡图):陡坡图。
SPSS第九章 因子分析

3.735
62.254
62.254
1.133
18.887
81.142
• 这里的Initial Eigenvalues就是这里的六个
主轴长度,又称特征值(数据相关阵的特
征值)。头两个成分特征值累积占了总方 差的81.142%。后面的特征值的贡献越来越 少。
例: 成绩数据(student.sav)
• 100个学生的数学、物理、化学、语文、历史、
i j
i j
其中rij为第i个变量与第j个变量的简单相关系数;
pij为第i个变量与第j个变量在控制了剩余变量下
的偏相关系数。
3、Bartlett’s球度检验(巴特利特)
以原有变量的相关系数矩阵为出发点,假设相关系数
为单位矩阵,如果该检验对应的P值小于给定的显著性水平 a,则应拒绝原假设,认为原有变量适合进行因子分析。
原有变量用k(k<p)个因子 f1、f2、...、fk 的线性
组合来表示,即:
x1 a11 f1 a12 f2 ......a1k fk 1 x2 a21 f1 a22 f2 ......a2k fk 2
.....................................................
强的相关关系。 2、因子提取; 3、使因子更具有命名可解释性; 4、计算各样本的因子得分。
• 9.2.2因子分析的前提条件
1、计算相关系数并进行统计检验 如果相关系数矩阵中的大部分相关系数小于0.3,那么
这些变量不适合进行因子分析。
2、计算反映象相关矩阵
rij2
MSAi
i j
rij2
pij 2
英语的成绩如下表(部分)。
9.3 主成分分析和因子分析的R语言操作

有用的统计学Statistics第9讲降维方法中央财经大学统计与数学学院9.3主成分分析和因子分析的R语言操作学习目标:1.在R中如何实现主成分分析和因子分析2.熟悉主成分分析和因子分析的过程3.理解主成分的含义和主成分的得分,因子的含义和因子得分的应用主成分分析案例背景•某公司打算从48名应聘者中选出6人,对前来应聘的人在简历格式,兴趣爱好,洞察力,工作能力、自信心以及销售能力等15个方面的表现进行打分,然后根据他们的得分情况择优录取。
其中评分取值范围为0~10分,0分为最低评价,10分为最高评价。
•问题:如何根据应聘者在这些方面的得分,给出他们的一个排序情况呢?•可以采用主成分分析法。
主成分分析:读入数据data<-read.csv(file="employee.csv", header = T,fileEncoding= "GB18030") #读取数据head(data) # 显示数据的前几个观测x = scale(data[,-c(1)]) # 数据标准化。
(在本案例中,由于15个变量的量纲都是相同的,所以是否做标准化对结果影响不大)mycor=cor(x) #计算相关系数round(mycor,2) # 输出相关系数,保留两位小数pca.fit=princomp(x, fix_sign=TRUE) #主成分分析,参数fix_sign=TRUE保证被抽取的主成分的第一个元素为非负。
summary(pca.fit) #输出所有主成分的标准差(特征值开平方)、方差贡献率、累计贡献率。
cbind(round(pca.fit$loadings[,1:4],2)) #输出前4个主成分的主成分系数(保留两位小数),可用来解释主成分的含义round(pca.fit$scores[,c(1:4)],2) #输出48个应聘者在第一主成分的得分,保留两位小数因子分析案例背景•如果此时公司想在应聘者中选取最具有某种潜力的人胜任一项重要的工作岗位。
多元统计分析第六章 因子分析

第6章因子分析6.1 因子分析数学模型因子分析是很有用的统计分析工具,因子分析的实质就是找出少量不可观测的随机变量,用它们表示众多的可观测随机变量。
以下例子能说明因子分析的意义。
例6.1对一个班的学生,进行五门课程(力学、物理、代数、分析、统计)考试,其中力学和物理闭卷考试,代数、分析、统计开卷。
这5门功课的成绩是可观测的随机向量。
每个学生的成绩可以看成5维随机向量的一个观测,见表6-1。
表6-1 五门课程考试成绩经过一定计算(因子分析)后发现存在不可观测的随机变量:1f 、2f ,它们和51,...x x 间有关系 521542143213221212116377.1091469.9750.678264.162258.5364.721559.013358.6909.720269.564838.7523.721220.864570.8409.62v f f x v f f x v f f x v f f x v f f x +-+=+-+=+-+=+++=+++= (6.1) 其中1f 、2f 是不可观测的随机变量。
我们认为它们分别表示学生的学习能力和适应开闭卷能力,所以可分别称为学习因子和适应开闭卷因子。
(6.1)揭示了这两个因子如何影响5门功课的成绩,也揭示5门课成绩的实质:每门课的成绩由学习因子和适应开闭卷因子的线性组合,加上常数,再加上随机变量而得。
这是是很有意义的。
象例6.1那样,找出少量不可观测因子(例如1f 、2f ),并给出它们影响可观测随机变量(例如51,...x x )方式的统计分析,就是因子分析。
因子分析与主成分分析不同:主成分分析是寻求若干个可观测随机变量的少量线性组合,说明其含义;因子分析主要的目的是找出不一定可观测的潜在变量作为公共因子,并解释公共因子的意义,及如何用不可观测随机变量,计算可观测随机变量。
因子分析方法在心理学,经济,医学,生物学,教育学等方面有重要用途。
因子分析法

因子分析法
因子分析法是一种人工智能技术,在机器学习、数据挖掘和建模技术中,它是一种重要的方法,用来捕捉变量之间的复杂相关性。
该方法在数据解析和特征提取方面发挥了重要作用,能够简洁地描述一组多变量的影响原因。
因子分析法包括三个步骤:第一步是信息准备,信息准备采用的是排列矩阵,将原始数据转换为矩阵进行统计分析;第二步是因子载荷矩阵,找出与观察量有关的因子;第三步是因子判别,由此可以总结出各因子的意义。
因子分析法不仅能够有效分解出变量之间的关系,而且能够减少变量数量,以实现资源最优化和目标函数最大化。
此外,因子分析法也能够迅速地挖掘该变量之间的内在关系,使得我们使用最少的变量实现最终的目的。
总的来说,因子分析法在数据整理以及多变量分析上都是非常有用的,可以有效节省时间,把一组复杂的数据和相关的变量转换成一组清晰的因子,使得研究者可以快速有效地针对该组数据进行分析,获得结论和解决方案。
第八章因子分析(2009.11)

0.60 ≤ KMO﹤0.70:不太适合
KMO﹤0.60:不适合
2014/5/19 14-36
第四步:单击Extraction按纽,弹出对话框,选择 未经旋转的因子 因子提取方法
载荷矩阵
主成分分析法
相关系数矩阵
提取特征值 大于1的因子
2014/5/19
因子与其特征 15-36 值的碎石图
★ 几个重要的概念
Sig. (1-tailed)
a. Determinant = 9.356E-03
2014/5/19
25-36
3.相关系数矩阵的逆矩阵
Inverse of Correlation Matrix 合 作性 分配 出 发点 工 作投 入 发 展机 会 社 会地 位 权 力距 离 职 位升 迁 领 导风 格 合 作性 3.215 -2.417 -1.112 -.399 1.945 -1.249 .612 -1.286 .152 分配 -2.417 3.704 -.053 .681 -.826 1.392 -.563 .152 .008 出 发点 -1.112 -.053 3.281 .674 -2.230 .609 -1.292 1.343 -.441 工 作投 入 -.399 .681 .674 1.412 -.752 .335 -.585 .425 .114 发 展机 会 1.945 -.826 -2.230 -.752 6.499 -1.874 .101 -4.326 -.151 社 会地 位 -1.249 1.392 .609 .335 -1.874 1.951 -.225 .938 -.019 权 力距 离 .612 -.563 -1.292 -.585 .101 -.225 2.018 -.224 -.033 职 位升 迁 -1.286 .152 1.343 .425 -4.326 .938 -.224 4.341 -.309 领 导风 格 .152 .008 -.441 .114 -.151 -.019 -.033 -.309 1.409
第十章 因子分析
5、由m个主成分得出m 个公因子(坐标伸缩)
fj
=
l
' j
x
∑ ∑ ∑ p
λj =
i =1
lij
λj
⋅ xi
=
p i =1
αij λj
⋅ xi
=
p
bij ⋅ xi
i =1
6、得出原指标xi 关于公因子的关系式
xi = αi1 f1 + αi2 f2 + ... + αim fm + εi
7、得出共性方差,因子的方差贡献
εi 称为特殊因子 (Unique factor),是不能被前m个公共
因子包含的部分
αij 称为因子负载 (Factor loadings)
因子分析模型矩阵形式
x = AF + ε
式中x是p×1的随机向量,且总假定已标准化,即
E(x) = 0,
D(x) = I p
公因子向量F是m×1的不可观测的随机向量,假定
⎜ ⎜ ⎜ ⎜⎝
li1 #
l p1
li 2 lp2
" " "
lij l pj
" "
lim #
l pm
⎟ ⎟ ⎟ ⎟⎠ p×m
A = (aij ) p×m 因子负荷矩阵
=
⎜ ⎜ ⎜
ai1 #
⎜⎝ ap1
ai 2 ap2
" " "
aij a pj
" "
aim #
⎟ ⎟ ⎟
apm ⎟⎠ p×m
bij = lij λ j
fj = yj λj
xˆi = αi1 f1 + αi2 f2 +" + αij f j +" + αij fm
9对应分析new
1、获取对应分析数据 首先要规定研究的目的,然后选择对应分析中 所需数据,应该包括的背景资料。 2、建立列联表
3、对应分析
4、对应图并解释结果的意义。
二、对应分析的原理
由于R型因子分析和Q型因子分析是反映一个整体
的不同侧面,R型因子分析是从列来讨论(对变量),
Q型因子分析是从行来讨论(对样品),因此他们之
因子分析,称为Q型因子分析。
当我们对同一观测数据施加R和Q型因子分析,并分别保留 两个公共因子,则是对应分析。
在讨论对应分析之前,我们先简要回顾一下列联表及 列联表分析的有关内容。在实际研究工作中,人们常常用列 联表的形式来描述属性变量(定类尺度或定序尺度)的各种 状态或是相关关系,这在某些调查研究项目中运用得尤为普 遍。比如,公司的管理者为了了解消费者对自己产品的满意 情况,需要针对不同职业的消费者进行调查,而调查数据很 自然的就以列联表的形式提交出来。见下表:
一般地,假设按两个特性对事物进行研究,特性A有n 类,特性B有p类,属于Ai和Bj的个体数目为nij,i=1,2,…,n, j=1,2,…,p 。则可以得到如下列联表:
为了更方便的表示各频数之间的关系,人们往往用频 若特性A与特性B之间是相互独 率来代替频数,即将列联表中每一个元素都除以元素的总 立的,单元格概率与边缘概率之间的 nij 和n,令 pij 关系如何? ,得到如下频率意义上的列联表:
x11 x 21 X x n1
x12 x22 xn 2
x1 p x2 p xnp n p
变量的均值向量X p ( x1, x2 ,, x p )
样品的均值向量Xn ( x1 , x2 ,, xn )
SAS第九课因子分析:Factor过程
SAS的Factor过程因子分析Factor 过程(李东风教程P251—256,P255正交旋转,斜交旋转)DATA SOCECON;TITLE 'FIVE SOCIO-ECONOMIC VARIABLES';TITLE2 'SEE PAGE 14 OF HARMAN: MODERN FACTOR ANALYSIS, 2ND ED';INPUT POP 1-9 SCHOOL 10-19 EMPLOY 20-29 SERVICES 30-39HOUSE 40-49;LABEL POP='TOTAL POPULATION' SCHOOL='MEDIAN SCHOOL YEARS' EMPLOY='TOTAL EMPLOYMENT' SERVICES='MISC. PROFESSIONAL SERVICES'HOUSE='MEDIAN VALUE HOUSE';CARDS;5700 12.8 2500 270 250001000 10.9 600 10 100003400 8.8 1000 10 90003800 13.6 1700 140 250004000 12.8 1600 140 250008200 8.3 2600 60 120001200 11.4 400 10 160009100 11.5 3300 60 140009900 12.5 3400 180 180009600 13.7 3600 390 250009600 9.6 3300 80 120009400 11.4 4000 100 13000;RUN;PROC PRINT;RUN;PROC FACTOR OUTSTAT=FACT1 METHOD=PRINCIPAL NFACT=2ROTATE=VARIMAX PREPLOT PLOT SCORE;TITLE2 'SEE PAGES 137 & 310 OF HARMAN: MODERN FACTOR ANALYSIS, 2ND ED'; RUN;PROC PRINT; BY _TYPE_ NOTSORTED;TITLE2 'OUTPUT DATA SET FROM PROC FACTOR';RUN;PROC SCORE SCORE=FACT1 DATA=SOCECON OUT=SCORES;TITLE2 'FACTOR SCORES';PROC PRINT;RUN;PROC FACTOR DATA=FACT1 METHOD=PRIN NFACT=2;PRIORS SMC;TITLE2 'SEE PAGE 162 OF HARMAN: MODERN FACTOR ANALYSIS, 2ND ED'; RUN;PROC FACTOR DATA=FACT1 METHOD=ML NFACT=2 HEYWOOD;TITLE2 'SEE PAGE 229 OF HARMAN: MODERN FACTOR ANALYSIS, 2ND ED'; RUN;一、factor过程格式:proc factor 选项;var 变量;priors 公因子方差;run;注:1)、选项:data=输入数据集outstat=输出数据集method=因子选择方法(包括principal , ML , alpha , prinit 等)rotate=因子转轴方式(包括none , varimax , promax , orthomax 等)Priors=计算公因子方差的方法(包括One Smc 等)2)priors语句为var语句中的变量设定公因子方差的预估值(介于0与1之间)。