第6章因子分析

第6章因子分析
第6章因子分析

第六章因子分析

一、填空题

1.因子分析常用的两种类型为和。

2.因子分析是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现_____________与____________之间的相互关系。

3.因子分析就是通过寻找众多变量的来简化变量中存在的复杂关系的一种方法。

4.因子分析是把每个原始变量分解成两个部分即、。5.变量共同度是指因子载荷矩阵中_______________________。

6.公共因子方差与特殊因子方差之和为_______。

7.求解因子载荷矩阵常用的方法有和。

8.常用的因子旋转方法有和。9.Spss中因子分析采用命令过程。

X的方差由两部分组成,一部分为,另一部分10.变量

i

为。

二、判断题

1.在因子分析中,因子载荷阵不是唯一的。()

2.因子载荷阵经过正交旋转后,各变量的共性方差和各个因子的贡献都发生了变化。()

3.因子分析和主成分分析的核心思想都是降维。()

4.因子分析有两大类,R型因子分析和Q型因子分析;其中R型因子分析是从变量的相似矩阵出发,而Q型因子分析是从样品的相关矩阵出发。()5.特殊因子与公共因子之间是相互独立的。()

6.变量共同度是因子载荷矩阵列元素的平方和。()

7.公共因子的方差贡献是衡量公共因子相对重要性指标。()

8.对因子载荷阵进行旋转的目的是使结构简化。( ) 三、简答题

1. 因子分析的基本思想是什么,它与主成分分析有什么区别和联系 2.因子模型的矩阵形式ε+=X UF ,其中:

()

()

()

u F

F ij m

p P

m

U F

?='

='

=εεε,,,,1

1

ΛΛ

请解释式中F 、

ε、U 的统计意义。

3.因子旋转的意义何在如何进行最大方差因子旋转 4.因子分析主要应用在哪几个方面 四、计算题

4.假设某地固定资产投资率1x , 通货膨胀率2x 和失业率3x 的约相关矩阵为:

???????

?????

????----=525

25

152********

51

*

R 并且已知该相关矩阵的各特征根和相应的非零特征根的单位特征向量分别为: 9123.01=λ ()'

-=657.0657.0369

.01α 0877.02=λ ()'-=261.0261

.0929.02α

03=λ

要求求解因子分析模型,计算各变量的共同度和各公共因子的方差贡献并解释它们的统计意义。

2.设变量x 1,x 2和x 3已标准化,其样本相关系数矩阵为:

??

??

??????=135.045.035.0163.045.063.01

R (1)对变量进行因子分析。 (2)取q=2进行正交因子旋转。

3.已知我国某年各地区的国有及非国有规模以上的工业企业经济效益资料,现做因子分析,结果如下,请说明每一个输出结果的含义及目的,并回答以下问题:(1)什么是方差贡献率计算方差贡献率的目的何在

(2)如何利用因子分析结果进行综合评价结合本例写出计算综合评价结果的公式。

表1

表2

表3

表4

表5

五、操作题

1.10名初中男生身高、胸围、体重的数据资料如下:

(2)分别计算各变量的公共因子方差和特殊因子方差,判断哪个因子能概括原始信息的大部分,为什么

(3)写出方差最大正交旋转因子模型,并分析各因子的实际含义

(4)计算各个样本点的因子得分

2.对某市15个大中型工业企业进行经济效益分析,经研究确定,从有关经济效益指标中选取7个指标作分析,即固定资产产值率(X1),固定资产利税率(X2),资金利润率(X3),资金利税率(X4),流动资金周转天数(X5),销售收入利税率(X6)和全员劳动生产率(X7)。数据资料如下:

第一、对数据资料进行主成分分析:

(1)前两个最大特征根为_____________、______________,其对应的特征向量为__________________________________,_____________________________。(2)第一主成分的表达式为_________________________________________ ___,该主成分包含了原始信息的_______%,第二主成分的表达式为_________________________________________,该主成分的方差贡献率为_______。

(3)如果舍弃第二主成分,则哪个原始变量的损失信息最大:_______

(4)第一个主成分与第二个变量间的相关系数为_____________

(5)第一个主成分主要反映盈利能力,现对第一主成分计算得分为_________________________________________________________________,对得分进行排序(降序),各企业的得分排名顺序依次为:_________________ __________________________(依企业顺序写出排名)。若利用第一、二主成分构造综合评价函数,则两主成分的权数分别为_________、_________。

第二、对原数据资料进行因子分析:

(6)利用主成分法求解因子载荷,现提取两个因子进行分析,因子模型表示为:

(7)前三个变量(X1,X2,X3)的公共因子方差为___________、_____________、____________,特殊因子方差为________、___________、_____________。

(8)对以上模型进行方差最大正交旋转,得出旋转后的因子载荷矩阵为:

SPSS探索性因子分析报告地过程

现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示: 问题 题项 从未使用 很少使用 有时使用 经常使用 总是使用 1 2 3 4 5 a1 电脑 a2 录音磁带 a3 录像带 a4 网上资料 a5 校园网或因特网 a6 电子邮件 a7 电子讨论网 a8 CAI 课件 a9 视频会议 a10 视听会议 一.因子分析的定义 在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型 i m im i i i i U F F F F Z +++++=αααα · · · 332211 i Z 为第i 个变量的标准化分数;(标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的 那批分数中的相对位置的。) m F 为共同因子; m 为所有变量共同因子的数目; i U 为变量i Z 的唯一因素; im α为因子负荷。(也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关系数,它反映了第i 个变量在 第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。) 因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数,也就是i Z 在第m 个共同因子变量上的相

探索性因子分析法.doc

探索性因子分析法(Exploratory Factor Analysis,EFA) 目录 [隐藏] ? 1 什么是探索性因子分析法? ? 2 探索性因子分析法的起源 ? 3 探索性因子分析法的计算 ? 4 探索性因子分析法的运用 ? 5 探索性因子分析法的步骤 ? 6 探索性因子分析法的优点 ?7 探索性因子分析法的缺点 ?8 探索性因子分析法的假定 ?9 EFA在教育、心理领域存在的问题及建议[1] ?10 参考文献 [编辑] 什么是探索性因子分析法? 探索性因子分析法(Exploratory Factor Analysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。因而,EFA能够将将具有错综复杂关系的变量综合为少数几个核心因子。 [编辑] 探索性因子分析法的起源 因子分析法是两种分析形式的统一体,即验证性分析和纯粹的探索性分析。英国的心理学家Charles Spearman在1904年的时候,提出单一化的智能因子(A Single Intellectual Factor)。随着试验的深入,大量个体样本被分析研究,Spearman的单一智能因子理论被证明是不充分的。同时,人们认识到有必要考虑多元因子。 20世纪30年代,瑞典心理学家Thurstone打破了流行的单因理论假设,大胆提出了多元因子分析(Multiple Factor Analysis)理论。 Thurstone 在他的《心智向量》(Vectors of Mind, 1935)一书中,阐述了多元因子分析理论的数学和逻辑基础。 [编辑] 探索性因子分析法的计算

在运用EFA法的时候,可以借助统计软件(如SPSS统计软件或SAS统计软件)来进行数据分析。 [编辑] 探索性因子分析法的运用 1、顾客满意度调查。 2、服务质量调查。 3、个性测试。 4、形象调查。 5、市场划分识别。 6、顾客、产品及行为分类。 [编辑] 探索性因子分析法的步骤 一个典型的EFA流程如下: 1、辨认、收集观测变量。 2、获得协方差矩阵(或Bravais-Pearson的相似系数矩阵) 3、验证将用于EFA的协方差矩阵(显著性水平、反协方差矩阵、Bartlett 球型测验、反图像协方差矩阵、KMO测度)。 4、选择提取因子法(主成分分析法、主因子分析法)。 5、发现因素和因素装货。因素装货是相关系数在可变物(列在表里)和因素(专栏之间在表里)。 6、确定提取因子的个数(以Kaiser准则和Scree测试作为提取因子数目的准则)。 7、解释提取的因子(例如,在上述例子中即解释为“潜在因子”和“流程因子”)。 [编辑]

第6章 因子分析

第六章 因子分析 一、填空题 1.因子分析常用的两种类型为 和 。 2.因子分析是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现_____________与____________之间的相互关系。 3.因子分析就是通过寻找众多变量的 来简化变量中存在的复杂关系的一种方法。 4.因子分析是把每个原始变量分解成两个部分即 、 。 5.变量共同度是指因子载荷矩阵中_______________________。 6.公共因子方差与特殊因子方差之和为_______。 7.求解因子载荷矩阵常用的方法有 和 。 8.常用的因子旋转方法有 和 。 9.Spss 中因子分析采用 命令过程。 10.变量i X 的方差由两部分组成,一部分为 ,另一部分为 。 二、判断题 1.在因子分析中,因子载荷阵不是唯一的。 ( ) 2.因子载荷阵经过正交旋转后,各变量的共性方差和各个因子的贡献都发生了变化。 ( ) 3.因子分析和主成分分析的核心思想都是降维。 ( ) 4.因子分析有两大类,R 型因子分析和Q 型因子分析;其中R 型因子分析是从变量的相似矩阵出发,而Q 型因子分析是从样品的相关矩阵出发。( ) 5.特殊因子与公共因子之间是相互独立的。( ) 6.变量共同度是因子载荷矩阵列元素的平方和。( ) 7.公共因子的方差贡献是衡量公共因子相对重要性指标。( ) 8.对因子载荷阵进行旋转的目的是使结构简化。( ) 三、简答题 1. 因子分析的基本思想是什么,它与主成分分析有什么区别和联系? 2.因子模型的矩阵形式ε+=X UF ,其中:

() () () u F F ij m p P m U F ?=' =' =εεε,,,,1 1 请解释式中F 、 ε、U 的统计意义。 3.因子旋转的意义何在?如何进行最大方差因子旋转? 4.因子分析主要应用在哪几个方面? 四、计算题 4.假设某地固定资产投资率1x , 通货膨胀率2x 和失业率3x 的约相关矩阵为: ??????? ????? ????----=525 25 152******** 51* R 并且已知该相关矩阵的各特征根和相应的非零特征根的单位特征向量分别为: 9123.01=λ ()' -=657.0657.0369 .01α 0877.02=λ ()'-=261.0261 .0929 .02α 03=λ 要求求解因子分析模型,计算各变量的共同度和各公共因子的方差贡献并解释它们的统计意义。 2.设变量x 1,x 2和x 3已标准化,其样本相关系数矩阵为: ?? ?? ??????=135.045.035.0163.045.063.01 R (1)对变量进行因子分析。 (2)取q=2进行正交因子旋转。 3.已知我国某年各地区的国有及非国有规模以上的工业企业经济效益资料,现做因子分析,结果如下,请说明每一个输出结果的含义及目的,并回答以下问题: (1)什么是方差贡献率? 计算方差贡献率的目的何在? (2) 如何利用因子分析结果进行综合评价? 结合本例写出计算综合评价结果的公式。

第六章 因子分析 (2)

第五章主成分分析 clear set more off cd "C:\Users\zhou\OneDrive\Lectures_ebook\multivariate_statistics\labora tory\03principal" use data *定义变量的标签 label var area "省份" label var x1 "GDP(亿元)" label var x2 "居民消费水平(元)" label var x3 "固定资产投资(亿元)" label var x4 "职工平均工资(元)" label var x5 "货物周转量(亿吨公里)" label var x6 "居民消费价格指数(上年100)" label var x7 "商品零售价格指数(上年100)" label var x8 "工业总产值(亿元)" describe sum corr //findit factortest //ssc install factortest //check the data factortest x1-x8 pca x1-x8, correlation /*主成分估计*/ pca x1-x8, covariance component(3) /*主成分估计*/ //test estat kmo /*KMO检验,越高越好*/ estat smc /*SMC检验,值越高越好*/ screeplot /* 碎石图(特征值等于1处的水平线标示保留主成分的分界点)*/ loadingplot , yline(0) xline(0)/*载荷图 */ loadingplot , combined factors(3) yline(0) xline(0)/*载荷图 */ predict f1 f2 f3 /*预测变量得分*/ scoreplot,mlabel(area) yline(0) xline(0) /*得分图*/ scoreplot,xtitle("经济社会总量") ytitle("人民生活水平") mlabel(area) yline(0) xline(0) /*得分图*/ scatter f2 f3,xtitle("人民生活水平") ytitle("物价水平") mlabel(area) yline(0) xline(0) /*得分图*/ scoreplot, factors(3) mlabel(area) /*得分图*/

第六章 因子分析 (1)

第六章 因子分析 首先通过主因子分析(factor),得到主成分因子: Factor | Eigenvalue Difference Proportion Cumulative -------------+------------------------------------------------------------ Factor1 | 4.75929 3.71841 0.6954 0.6954 Factor2 | 1.04088 0.38315 0.1521 0.8475 Factor3 | 0.65773 0.37761 0.0961 0.9436 Factor4 | 0.28012 0.09188 0.0409 0.9845 Factor5 | 0.18825 0.19040 0.0275 1.0120 Factor6 | -0.00216 0.01548 -0.0003 1.0117 Factor7 | -0.01764 0.04472 -0.0026 1.0091 Factor8 | -0.06236 . -0.0091 1.0000 从上面的分析可以看出,只有两个成分大于1大于的特征值,同时两个成分解释了全部八个变量组合的方差还多。不重要的第2 到8个主成分在随后的分析中可以放心地省略去。 运行factor 命令后,我们可以接着运行screeplot 命令画出碎石图。碎石图中特征值等于1处的水平线标示了保留主成分的常用分界点,同时再次强调了本例中的成分3到成分6并不重要。 Variable | Factor1 Factor2 Factor3 Factor4 Factor5 -------------+-------------------------------------------------- x1 | 0.9611 0.0193 0.2412 -0.0637 0.0013 x2 | 0.9119 0.3828 -0.1409 0.0380 0.0786 x3 | 0.8626 -0.0724 0.3816 0.0792 -0.2719 x4 | 0.9395 0.3468 -0.0299 -0.0313 0.0137 x5 | 0.7542 -0.0828 -0.2302 0.3307 0.1499 E i g e n v a l u e s

SPSS探索性因子分析的过程

SPSS探索性因子分析的过程

现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示: 一. 因子分析的定义

在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二. 数学模型 Z i i1F1 i2^ i3F3 …im F m U i 乙为第i个变量的标准化分数;(标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。) F m为共同因子; m为所有变量共同因子的数目; U为变量Z的唯一因素; i个变量与第im为因子负荷。(也叫因子载荷,统计意义就是第 m个公共因子的相关系数,它反映了第i个变量在第m个公共因子上的相对重要性也就是第m个共同因子对第i个变量的解释程

度。) 因子分析的理想情况,在于个别因子负荷im不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则U彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷.就是第i个原有变量和第m个因子变量间的相关系数,也就是Z在第m个共同因子变量上的相对重要性,因此,.绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针:一为“共同性”,二为“特征值”。 所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于0.8,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能

最新 基于因子分析法的评价过程-精品

本篇论文目录导航: 【题目】上市农业公司财务实力提升探析 【第一章】提升农业上市公司财务优势探究绪论 【第二章】财务竞争力的内涵界定及理论阐述 【第三章】农业上市公司财务竞争力的指标体系与评价方法 【4.1 4.2】基于因子分析法的评价过程 【4.3 4.4】基于熵权法的评价过程 【第五章】提升农业公司财务竞争力的对策与展望 【】农业上市企业财务能力评价研究参考文献 4 农业上市公司财务竞争力实证分析 4.1 样本的选取与数据说明 本文以 2012 年中国证监会(CSRC)公布的《上市公司行业分类指引》为分类标准,选取在深沪两地上市的农业上市公司为研究样本,共涉及农业、林业、畜牧业、渔业及其服务业 40 家公司,剔除数据不完整与财务状况异常的ST 公司后共有 37 家公司入选,原始数据来源于各上市公司年报与新浪财经网站,指标数据通过财务报表中的原始数据计算得出。 4.2 基于因子分析法的评价过程 4.2.1 因子分析法的分析过程 在构建农业上市公司财务竞争力评估指标体系时,本文根据科学性、系统性、可行性等原则选取了 18 个财务指标,按各指标的性质与评价维度可分三种类别:正相关指标、适度指标、负相关指标。正相关指标的数值越大,代表企业财务竞争力越强;适度指标的数值越接近某个合理值,代表企业财务竞争力状况越好(李博,2013);负相关指标的数值越大,代表企业财务竞争力越弱。鉴于三类指标属性的不同,需对指标数值进行一致化处理才能避免不同类别的指标数据对企业综合财务竞争力评价的影响。此外,由于各个指标的单位不尽相同,在正式进行企业财务竞争力评价的实证研究前,还需对指标数据进行无量纲化与标准化处理。本文通过SPSS19.0 软件对 37 家公司的 18 个指标进行一致化、无量纲化、标准化处理后,再进行后续分析评价工作。 (1)模型适用性检验 所选指标具有较强的相关性是进行因子分析法的前提,即因子分析法需对处理过的原始数据进行适用性检验。本文选用 KMO 检验与 Bartlett 球形检验对所选的指标进行检验,KMO 统计量的取值范围一般在 0 到 1 之间,数值越接近 1,说明指标间的公共因子越多,相关性越强。学者 Kaiser(1974)设定了 KMO 值判定标准:若 KMO 统计值小于 0.5 时,则不适宜做因子分析。而Bartlett 检验是通过分析相关系数矩阵的行列式得出的数值来判定指标间是否

探索性因子分析及其在应用中存在的主要问题

探索性因子分析及其在应用中存在的主要问题 Ξ 孙晓军ΞΞ 周宗奎 (华中师范大学心理学院,武汉,430079) 摘 要 探索性因子分析的发展非常迅速,已成为教育与社会心理学领域中最常用的统计方法之一。本文全面介绍了探索性因子分析的基本原理,阐述了其发生的机制及基本过程,对其在教育、心理领域应用中存在的问题进行了总结,并针对应用中样本容量和观测变量数目不够、因子求解方法的误用、因子数目的确定标准及因子旋转中存在的问题、因子值缺乏重复验证性、研究结果呈现形式不规范、过于依赖SPSS 、缺乏主动性等问题提出了一些相应的建议。关键词:探索性因子分析 因子旋转 因子值 因子分析(Factor Analysis )是通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量(因子)来表示基本的数据结构的方法[1]。1904年,查尔斯?斯皮尔曼(Charles Spearman )在研究智力时首次采用了因子分析的方法,将因子分析方法运用于实践[2]。随后,因子分析的理论和数学基础逐步得到发展和完善,特别是50年代以后,随着计算机的普及和各种统计软件的出现,因子分析得到了巨大的发展。现在,因子分析已成为教育与社会心理学领域研究中最常用的统计方法之一。但令人遗憾的是,在实际研究的应用中,研究者并不能合理、正确的使用这一方法,导致最后的研究结果缺乏可信度。 本文的目的就是通过对探索性因子分析发生原理、步骤的详细探讨,结合其在应用中存在的问题,希望对心理领域中探索性因子分析的运用提出一些实质性的建议,包括样本大小、因子数目、观测变量数目、因 子旋转等等。 1 探索性因子分析的基本原理 探索性因子分析模型(见图1)的一般表达形式为: X 1=w 11F 1+w 21F 2+……w n1F n +w 1U 1+e 1 其中,X n 表示观测变量,F M 代表因子分析中最基本的公因子(Common factor ),它们是各个观测变量所共有的因子,解释了变量之间的相关;U n 代表特殊因子(Unique factor ),它是每个观测变量所特有的因子,相当于多元回归分析中的残差项,表示该变量不能被公因子所解释的部分;w M 代表因子负载(Factor loading ),它是每个变量在各公因子上的负载,相当于多元回归分析中的回归系数;而e n 则代表了每一观测变量的随机误差。 图1 探索性因子分析模型(来源:郭志刚,1999) 探索性因子分析的过程实质就是寻求F 1、F 2、......F m 等少数几个公因子以构建因子结构来最大限度地表示所有变量的信息[3]。在探索性因子分析中,一个重要的假设就是所 有的特殊因子间及特殊因子与公因子间是彼此独立、不相关的。 ΞΞΞ通讯作者:孙晓军,男。E 2mail :sxj -ccnu @https://www.360docs.net/doc/8b5848057.html, 本研究得到国家自然科学基金资助,项目号30270473。1440 心理科学 Psychological Science 2005,28(6):1440-1442

多元统计分析第六章 因子分析

第6章因子分析 6.1 因子分析数学模型 因子分析是很有用的统计分析工具,因子分析的实质就是找出少量不可观测的随机变量,用它们表示众多的可观测随机变量。以下例子能说明因子分析的意义。 例6.1对一个班的学生,进行五门课程(力学、物理、代数、分析、统计)考试,其中力学和物理闭卷考试,代数、分析、统计开卷。这5门功课的成绩是可观测的随机向量。每个学生的成绩可以看成5维随机向量的一个观测,见表6-1。 表6-1 五门课程考试成绩

经过一定计算(因子分析)后发现存在不可观测的随机变量:1f 、2f ,它们和51,...x x 间有关系 5 215421432132 21212116377.1091469.9750.678264.162258.5364.721559.013358.6909.720269.564838.7523.721220.864570.8409.62v f f x v f f x v f f x v f f x v f f x +-+=+-+=+-+=+++=+++= (6.1) 其中1f 、2f 是不可观测的随机变量。我们认为它们分别表示学生的学习能力和适应开闭卷能力,所以可分别称为学习因子和适应开闭卷因子。(6.1)揭示了这两个因子如何影响5门功课的成绩,也揭示5门课成绩的实质:每门课的成绩由学习因子和适应开闭卷因子的线性组合,加上常数,再加上随机变量而得。这是是很有意义的。象例6.1那样,找出少量不可观测因子(例如1f 、2f ),并给出它们影响可观测随机变量(例如51,...x x )方式的统计分析,就是因子分析。 因子分析与主成分分析不同:主成分分析是寻求若干个可观测随机变量的少量线性组合,说明其含义;因子分析主要的目的是找出不一定可观测的潜在变量作为公共因子,并解释公共因子的意义,及如何用不可观测随机变量,计算可观测随机变量。因子分析方法在心理学,经济,医学,生物学,教育学等方面有重要用途。例如为了测验应聘者的素质,出40道题,让应聘者回答,每道题有一得分, 40题得分被认为可以观测的随机变量。我们希望找出有限个不可观测的潜在变量来解释这40个随机变量,这些不可观测的潜在变量不一定能表示为原来随机变量的线性组合,但却是有实际意义的,例如交际能力,应变能力,语言能力、推理能力、艺术修养、历史知识和生活常识等。又如分析生物生长状况时,从生物的实测指标(长、宽和体重等)可以分析出生长因子和控制因子,找出它们在不同时刻的作用。有关因子分析细节可参看方开泰(1989)、Richard(2003)和Gorsuch (1983)。 因子分析模型包括正交和斜交因子模型,本书只介绍正交因子分析模型,表述如下: 定义6.1 设X 为p 维可观测随机向量,其均值向量为μ,协差阵为∑=)var(X ,若X 能表为 u f X +Λ+=μ (6.2)

因子分析方法

因子分析法 1. 因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较 密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不 可观测的,即不是具体的变量) ,以较少的几个因子反映原资料的大部分信息。运用这种研究技 术,我们可以方便地找岀影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响 力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 因子分析法与其他一些多元统计方法的区别: 2?主成分分析 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析 来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简 化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释各变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumpti on s),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子( specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定( spss根据一定的条件自动设定,只要是特征 值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技 术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进 行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的 变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息) 来进入后续的分析,则可 以使用主成分分析。当然,这种情况也可以使用因子得分做到。所以这种区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单 独使用:a,了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份 发对变量简化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

(整理)多元统计分析思考题.

《多元统计分析思考题》 第一章回归分析 1、回归分析是怎样的一种统计方法,用来解决什么问题? 概念:回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。 解决的问题:自变量对因变量的影响程度、方向、形式 2、线性回归模型中线性关系指的是什么变量之间的关系?自变量与因变量之间一定是线 性关系形式才能做线性回归吗?为什么? 3、实际应用中,如何设定回归方程的形式? 4、多元线性回归理论模型中,每个系数(偏回归系数)的含义是什么? 5、经验回归模型中,参数是如何确定的?有哪些评判参数估计的统计标准?最小二乘估 计两有哪些统计性质?要想获得理想的参数估计值,需要注意一些什么问题? 6、理论回归模型中的随机误差项的实际意义是什么?为什么要在回归模型中加入随机误 差项?建立回归模型时,对随机误差项作了哪些假定?这些假定的实际意义是什么? 7、建立自变量与因变量的回归模型,是否意味着他们之间存在因果关系?为什么? 8、回归分析中,为什么要作假设检验?检验依据的统计原理是什么?检验的过程是怎样 的? 9、回归诊断可以大致确定哪些问题?回归分析有哪些基本假定?如果实际应用中不满足 这些假定,将可能引起怎样的后果?如何检验实际应用问题是否满足这些假定?对于各种不满足假定的情形,分别采用哪些改进方法? 10、回归分析中的R2有何意义?它能用来衡量模型优劣吗? 11、如何确定回归分析中变量之间的交互作用?存在交互作用时,偏回归系数的意义与不 存在交互作用的情形下是否相同?为什么? 12、有哪些确定最优回归模型的准则?如何选择回归变量? 13、在怎样的情况下需要建立标准化的回归模型?标准化回归模型与非标准化模型有何 关系?形式有否不同? 14、利用回归方法解决实际问题的大致步骤是怎样的? 15、你能够利用哪些软件实现进行回归分析?能否解释全部的软件输出结果? 第二章判别分析 1、判别分析的目的是什么? 根据分类对象个体的某些特征或指标来判断其属于已知的某个类中的哪一类。 2、有哪些常用的判别分析方法?这些方法的基本原理或步骤是怎样的?它们各有什么特 点或优劣之处? 3、判别分析与回归分析有何异同之处? 4、判别分析对变量与样本规模有何要求? 5、如何度量判别效果?有哪些影响判别效果的因素? 6、逐步判别是如何选择判别变量的?基本思想或步骤是什么?

SPSS探索性因子分析的过程

一.因子分析的定义 在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型 i m im i i i i U F F F F Z +++++=αααα · · · 332211 i Z 为第i 个变量的标准化分数; (标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。) m F 为共同因子; m 为所有变量共同因子的数目;

i U 为变量i Z 的唯一因素; im α为因子负荷。 (也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关系数,它反映了第i 个变量在第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。) 因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数,也就是i Z 在第m 个共同因子变量上的相对重要性,因此,im α绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针:一为“共同性”,二为“特征值”。 所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能被因子变量所能解释的部分。 所谓特征值,是每个变量在某一共同因子的因子负荷的平方总和(一直行所有因子负荷的平方和),在因子分析的的共同因子抽取中,特征值最大的共同因子会最先被抽取,其次是次大者,最后抽取的共同因子的特征值会最小,通常会接近于0。将每个共同因子的特征值除以总题数,为此共同因子可以解释的变异量,因子分析的目的之一,即在因素结构的简单化,希望以最少的共同因子能对总变异量做最大的解释,因而抽取的因素越少越好,但抽取的因子的累积变异量越大越好。 三.SPSS 中实现过程 (一)录入数据 (二)因子分析 1.在菜单栏中依次单击“分析”|“降维”|“因子分析”选项卡,打开如图所示“因子分析”对话框。从原变量量表中选择需要进行因子分析的变量,然后单击箭头按钮将选中的变量选入“变量”列表中。“变量列表”的变量为要进行因子分析的的目标变量,变量在区间或比率级别应该是定量变量。分类数据(如:性别等)不适合因子分析。 2.“描述按钮”:主要设定对原始变量的基本描述并对原始变量进行相关性分析。

统计学课后题

第二章均值向量和协方差阵的检验 1、试谈willks统计量在多元方差分析中的重要意义。 2、形象分析的基本思路是什么? 形象又称轮廓图,是将总体样本的均值绘制到同一坐标轴里所得的折线图,每一个指标都表示为折线图上的一点。形象分析是将两(多)总体的形象绘制到同一个坐标下,根据形象(轮廓图)的形状对总体的均值进行比较分析。 第三章聚类分析 1、聚类分析的基本思想和功能是什么? 聚类分析的核心思想是根据具体的指标(变量)对所研究的个体或者对象进行分类,使得同一类中的对象之间的相似性比其他类的对象的相似性更强。聚类分析不仅可以用来对样品进行分类,也可以用来对变量进行分类。对样品的分类常称为Q型聚类分析,对变量的分类常称为R型的聚类分析。 聚类分析的目的或功能就是把相似的研究对象归成类,即使类间对象的同质性最大化和类与类间对象的异质性最大化。 2、试述系统聚类法的原理和具体步骤 (1)系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。 (2)系统聚类的具体步骤:假设总共有N个样品(或变量) 第一步:将每个样品(或变量)独自聚成一类,共有N类; 第二步:根据所确定的样品(或变量)“距离”公式,把距离较近的两个样品(或变量)聚合为一类,其他的样品(或变量)仍各自聚为一类,共聚成N-1类; 第三步:将“距离”最近的两个类进一步聚成一类,共聚成N-2类;。。。,以上步骤一直进行下去,最后将所有的样品(或变量)全聚成一类。 3、试述K-均值聚类的方法原理

这种聚类方法的思想是把每个样品聚集到其最近形心(均值)类中。 首先随机从数据集中选取 K个点作为初始聚类中心,然后计算各个样本到聚类中的距离,把样本归到离它最近的那个聚类中心所在的类。计算新形成的每一个聚类的数据对象的平均值来得到新的聚类中心,如果相邻两次的聚类中心没有任何变化,说明样本调整结束,聚类准则函数已经收敛。 4、试述模糊聚类的思想方法 模糊聚类分析是根据客观事物间的特征、亲疏程度、相似性,通过建立模糊相似关系对客观事物进行聚类的分析方法。在模糊聚类中,每个样本不再仅属于某一类,而是以一定的隶属度属于每一类。换句话说,通过模糊聚类分析,可得到样本属于各个类别的不确定性程度,即建立起了样本对于类别的不确定性的描述,这样就更能准确地反映现实世界。 第四章判别分析 1、应用判别分析应该具备什么样的条件? 判别分析最基本的要求是:分组类型在两组以上;每组案例的规模必须至少在一个以上;解释变量必须是可测量的,才能够计算其平均值和方差,使其能合理地应用于统计函数。2、试述贝叶斯判别法的思路 思想是:假定对研究的对象已有一定的认识,常用先验概率分布来描述这种认识,然后我们取得一个样本,用样本来修正已有的认识(先验概率分布),得到后验概率分布,各种统计推断都通过后验概率分布来进行。将贝叶斯思想用于判别分析,就得到贝叶斯判别。 3、试述费歇判别方法的思想。 费歇判别的思想是投影,将K组P维数据投影到某一个方向,使得它们的投影组和组之间尽可能地分开。 4、什么是逐步判别分析 凡具有筛选变量能力的判别方法统称为逐步判别法。逐步判别法的基本思想是:逐步引入变量,每次引入一个"最重要"的变量,同时也检验先前引入的变量,如果先前引入的变量

SPSS探索性因子分析的过程

S P S S探索性因子分析的 过程 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示: 一.因子分析的定义 在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型 Z为第i个变量的标准化分数;(标准分是一种由原始分出来的,它是用来说明原始分i 在所属的那批分数中的相对位置的。)

m F 为共同因子; m 为所有变量共同因子的数目; i U 为变量i Z 的唯一因素; im α为因子负荷。(也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关 系数,它反映了第i 个变量在第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。) 因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数,也就是i Z 在第m 个共同因子变量上的相对重要性,因此,im α绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针:一为“共同性”,二为“特征值”。 所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能被因子变量所能解释的部分。 所谓特征值,是每个变量在某一共同因子的因子负荷的平方总和(一直行所有因子

第6章--因子分析

第6章--因子分析

第六章因子分析 一、填空题 1.因子分析常用的两种类型为和。 2.因子分析是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现_____________与____________之间的相互关系。 3.因子分析就是通过寻找众多变量的来简化变量中存在的复杂关系的一种方法。 4.因子分析是把每个原始变量分解成两个部分即、。5.变量共同度是指因子载荷矩阵中_______________________。 6.公共因子方差与特殊因子方差之和为_______。 7.求解因子载荷矩阵常用的方法有和。8.常用的因子旋转方法有和。9.Spss中因子分析采用命令过程。 10.变量 X的方差由两部分组成,一部分为,另一部分为。 i 二、判断题 1.在因子分析中,因子载荷阵不是唯一的。() 2.因子载荷阵经过正交旋转后,各变量的共性方差和各个因子的贡献都发生了变化。() 3.因子分析和主成分分析的核心思想都是降维。() 4.因子分析有两大类,R型因子分析和Q型因子分析;其中R型因子分析是从变量的相似矩阵出发,而Q型因子分析是从样品的相关矩阵出发。()5.特殊因子与公共因子之间是相互独立的。() 6.变量共同度是因子载荷矩阵列元素的平方和。() 7.公共因子的方差贡献是衡量公共因子相对重要性指标。() 8.对因子载荷阵进行旋转的目的是使结构简化。() 三、简答题 1.因子分析的基本思想是什么,它与主成分分析有什么区别和联系?

2.因子模型的矩阵形式ε+=X UF ,其中: ()()()u F F ij m p P m U F ?='='=εεε,,,,11ΛΛ 请解释式中F 、ε、U 的统计意义。 3.因子旋转的意义何在?如何进行最大方差因子旋转? 4.因子分析主要应用在哪几个方面? 四、计算题 4.假设某地固定资产投资率1x , 通货膨胀率2x 和失业率3x 的约相关矩阵为: ??????? ?????????----=525251 52525 1515151*R 并且已知该相关矩阵的各特征根和相应的非零特征根的单位特征向量分别为: 9123.01=λ ()'-=657.0657 .0369.01α 0877.02=λ ()'-=261.0261.0929 .02α 03=λ 要求求解因子分析模型,计算各变量的共同度和各公共因子的方差贡献并解释它们的统计意义。 2.设变量x 1,x 2和x 3已标准化,其样本相关系数矩阵为: ???? ??????=135.045.035.0163.045.063.01R (1)对变量进行因子分析。 (2)取q=2进行正交因子旋转。 3.已知我国某年各地区的国有及非国有规模以上的工业企业经济效益资料,现做因子分析,结果如下,请说明每一个输出结果的含义及目的,并回答以下问题: (1)什么是方差贡献率? 计算方差贡献率的目的何在?

第6章因子分析

第六章因子分析 一、填空题 1.因子分析常用的两种类型为和。 2.因子分析是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现_____________与____________之间的相互关系。 3.因子分析就是通过寻找众多变量的来简化变量中存在的复杂关系的一种方法。 4.因子分析是把每个原始变量分解成两个部分即、。5.变量共同度是指因子载荷矩阵中_______________________。 6.公共因子方差与特殊因子方差之和为_______。 7.求解因子载荷矩阵常用的方法有和。 8.常用的因子旋转方法有和。9.Spss中因子分析采用命令过程。 X的方差由两部分组成,一部分为,另一部分10.变量 i 为。 二、判断题 1.在因子分析中,因子载荷阵不是唯一的。() 2.因子载荷阵经过正交旋转后,各变量的共性方差和各个因子的贡献都发生了变化。() 3.因子分析和主成分分析的核心思想都是降维。() 4.因子分析有两大类,R型因子分析和Q型因子分析;其中R型因子分析是从变量的相似矩阵出发,而Q型因子分析是从样品的相关矩阵出发。()5.特殊因子与公共因子之间是相互独立的。() 6.变量共同度是因子载荷矩阵列元素的平方和。() 7.公共因子的方差贡献是衡量公共因子相对重要性指标。()

8.对因子载荷阵进行旋转的目的是使结构简化。( ) 三、简答题 1. 因子分析的基本思想是什么,它与主成分分析有什么区别和联系 2.因子模型的矩阵形式ε+=X UF ,其中: () () () u F F ij m p P m U F ?=' =' =εεε,,,,1 1 ΛΛ 请解释式中F 、 ε、U 的统计意义。 3.因子旋转的意义何在如何进行最大方差因子旋转 4.因子分析主要应用在哪几个方面 四、计算题 4.假设某地固定资产投资率1x , 通货膨胀率2x 和失业率3x 的约相关矩阵为: ??????? ????? ????----=525 25 152******** 51 * R 并且已知该相关矩阵的各特征根和相应的非零特征根的单位特征向量分别为: 9123.01=λ ()' -=657.0657.0369 .01α 0877.02=λ ()'-=261.0261 .0929.02α 03=λ 要求求解因子分析模型,计算各变量的共同度和各公共因子的方差贡献并解释它们的统计意义。 2.设变量x 1,x 2和x 3已标准化,其样本相关系数矩阵为: ?? ?? ??????=135.045.035.0163.045.063.01 R (1)对变量进行因子分析。 (2)取q=2进行正交因子旋转。

相关文档
最新文档