因子分析

合集下载

因子分析(因子评价)

因子分析(因子评价)

因子分析一.因子分析原理因子分析是根据相关性大小把原始变量进行分组,使得同组内的变量之间相关性高,而不同组的变量之间的相关性低。

每组变量代表一个基本结构(即公共因子),并用一个不可观测的综合变量来表示。

对于所研究的某一具体问题,原始变量分解为两部分之和。

一部分是少数几个不可观测的公共因子的线性函数,另一部分是与公共因子无关的特殊因子。

从全部计算过程来看作R 型因子分析与作Q 型因子分析都是一样的,只不过出发点不同,R 型从相关系数矩阵出发,Q 型从相似系数阵出发都是对同一批观测数据,可以根据其所要求的目的决定用哪一类型的因子分析因子模型的性质:模型不受变量量纲的影响;因子载荷不是唯一的。

二.因子分析的数学模型设有p 个指标,则因子分析数学模型为:11111221221122221122p p p pp p p pp p X r Y r Y r Y X r Y r Y r Y X r Y r Y r Y=+++⎧⎪=+++⎪⎨⎪⎪=+++⎩ 其中,12,,,p X X X 是已标准化的可观测的评价指标。

12,,,k F F F 出现在每个指标i X 的表达式中,称为公共因子,公共因子是不可观测的,其含义要根据具体问题来解释。

i ε是各个对应指标i X 所特有的因子,故称为特殊因子,它与公共因子之间彼此独立。

ij r 是指标i X 在公共因子j F 上的系数,称为因子载荷,因子载荷ij r 的统计含义是指标i X 在公共因子j F 上的相关系数,表示i X 与j F 线性相关程度。

用矩阵形式表示为:X AF ε=+其中12(,,,)p X X X X '=,12(,,,)k F F F F '=,12(,,,)p εεεε'=,111212122212m m p p pm r r r r r r A rr r ⎛⎫⎪⎪= ⎪ ⎪ ⎪⎝⎭,A 称为因子载荷矩阵。

其统计含义是:A 中的第i 行元素12,,,i i im r r r 说明了指标i X 依赖于各个公共因子的程度。

因子分析

因子分析

因子分析因子分析是指研究从变量群中提取共性因子的统计技术。

最早由英国心理学家C.E.斯皮尔曼提出。

他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。

因子分析可在许多变量中找出隐藏的具有代表性的因子。

将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。

1、探索性因子分析的方法约有10多种,如重心法、影像分析法,最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。

这些方法本质上大都属近似方法,是以相关系数矩阵为基础的,所不同的是相关系数矩阵对角线上的值,采用不同的共同性□2估值。

在社会学研究中,因子分析常采用以主成分分析为基础的反覆法。

主成分分析为基础的反覆法主成分分析的目的与因子分析不同,它不是抽取变量群中的共性因子,而是将变量□1,□2,…,□□进行线性组合,成为互为正交的新变量□1,□2,…,□□,以确保新变量具有最大的方差:在求解中,正如因子分析一样,要用到相关系数矩阵或协方差矩阵。

其特征值□1,□2,…,□□,正是□1,□2,…,□□的方差,对应的标准化特征向量,正是方程中的系数□,□,…,□。

如果□1>□2,…,□□,则对应的□1,□2,…,□□分别称作第一主成分,第二主成分,……,直至第□主成分。

如果信息无需保留100%,则可依次保留一部分主成分□1,□2,…,□□(□<□)。

当根据主成分分析,决定保留□个主成分之后,接着求□个特征向量的行平方和,作为共同性□:□并将此值代替相关数矩阵对角线之值,形成约相关矩阵。

根据约相关系数矩阵,可进一步通过反复求特征值和特征向量方法确定因子数目和因子的系数。

因子旋转为了确定因子的实际内容,还须进一步旋转因子,使每一个变量尽量只负荷于一个因子之上。

这就是简单的结构准则。

常用的旋转有直角旋转法和斜角旋转法。

因 子 分 析

因 子 分 析
p ) 是可观测的随机向量,其均值为 ,协方差矩阵为 (ij ) T ,若X能表示为 X AF ,其中 F (F1, , Fm ) 称为X的公共因子(向量) (1, p )T 称为X的特殊因子(向量),它们满足 ,
应用举例
利用SPSS软件进行因子分析
从表3可以看出,第一个主因子在 X1、X8、X9上有较大载荷,因 此可以命名为盈利和现金获取能力 ;第二个因子主要由X6、X7、 X2、X5决定,可命名为成长因子 ;第三个因子主要由X3、X4决定 ,命名为偿债因子。 为了考查上市公司的竞争力状况, 并对其进行分析和综合评价,采用 回归方法求出因子得分矩阵,得到 3个主因子的得分F1,F2,F3,以 贡献率为权数,构建综合评价函数 综合得分 =(0.36064xF1+0.23066x F2+0.22132x F3)/0.81262 ,经计算得到样本17家上市公司 的综合因子总得分。(见表4)


因子模型的参数估计
因子载荷矩阵 A (aij ) pm 与特殊因子方差 i2 (i=1,...,p)的估计, 常采用的估计方法有以下三种:主成分法、主因子解和最大似然法。 主成分法: A ( l , , l ), 1 1 m m m 2 2 i 1, , p. i sii aij , j 1
Fj b j 0 b j1 X1 b jp X p , j 1, , m
^
F A' R 1 X
其中R是X的相关系数矩阵。 最后以每个公共因子的贡献率来求出各因子权重,求得综合得分。
^
因子分析与主成分分析的异同比较
相同点:主成分分析法和因子分析法都是从变量的方差-协 方差结构入手,在尽可能多的保留原始信息的基础上,用 少数新变量来解释原始变量的多元统计分析方法。 区别:因子分析是把变量表示成各公因子的线性组合;而 主成分分析中则是把主成分表示成各变量的线性组合。主 成分的数量是一定的,一般有几个变量就有几个主成分; 因子个数需要分析者指定,指定的因子数量不同而结果也 不同。主成分分析重点在于解释个变量的总方差;因子分 析则把重点放在解释各变量之间的协方差。主成分分析法 是求出少数几个主成分,使它们尽可能多的保留原始变量 的信息;因子分析法是对原始变量进行分解,用最少个数 的不可测的所谓公共因子的线性函数与特殊因子之和来描 述原来观测的每一分量。

因子分析法

因子分析法

因子分析法因子分析法,又称因子分析,是在描述、预测和理解给定的研究结果时一种常用的统计分析方法。

它可用于探索数据中潜在的因素结构,以及找出影响解释变量的最重要的驱动因子。

因子分析涉及多个变量,可以将数据中的噪声减少到最小,并对变量之间的关系进行建模以实现最佳假设。

因子分析的主要目的是通过分析变量之间的关系,将多个变量组合起来,形成一个有意义的因子结构,有助于来源于同一个因素的变量聚为一类。

因子分析还可以用于验证现有的统计模型,检测数据中是否存在偏差,以及主成分分析中用于减少变量数量。

因子分析通常需要经历四个步骤:实验设计、数据处理、因子分析以及结果分析和解释。

实验设计阶段,研究者需要收集所需要的数据,如变量的定义、变量的数量、测量方式等;数据处理阶段,一般包括数据属性的编码、检查缺失值以及数据的标准化;在因子分析阶段,研究者需要指定假设的因子个数,并根据特定的方法进行变量的讯析;最后,研究者可以检查因子提取结果,并通过模态图和层次图等绘图方法对因子分析结果进行可视化,以更好地理解研究的解释变量。

因子分析的优点在于,它是一种基于模型的统计分析方法,它可以通过分析变量之间的关系来减少数据中的噪声,以提高分析的准确性。

另外,因子分析可以从复杂的数据中提取出重要的因素,以便进行有用的模型建构。

然而,因子分析也存在一些缺点。

由于因子分析假设只有有限数量的因子导致了变量,因此不能解释所有变量之间的关系。

此外,因子分析受到偏差和方差的影响,某些变量可能被忽略了,而有些因素可能被过分重视。

总而言之,因子分析方法是一种有效的研究工具,可用于简化复杂的数据,探索数据中潜在的因素结构,以及验证和解释研究结果。

因此,有效的因子分析有助于研究者更好地理解数据,并得出合理的结论。

第六讲因子分析

第六讲因子分析

第六讲因⼦分析第五讲因⼦分析在许多实际问题中,涉及的变量众多,各变量间还存在错综复杂的相关关系,这时最好能从中提取少数综合变量,这些综合变量彼此不相关,⽽且包含原变量提供的⼤部分信息。

因⼦分析就是为解决这⼀问题提供的统计分析⽅法。

以后,如⽆特别说明,都假定总体是⼀个p维变量:它的均值向量,协⽅差矩阵V=(ij)pp都存在。

第⼀节正交因⼦模型1.1 公共因⼦与特殊因⼦从总体中提取的综合变量:F1, F2, … , F m(m于是,我们有:变量X i的信息=公共因⼦可以表达部分公共因⼦不可表达部分这就是所谓因⼦模型。

⽬前,公共因⼦可以表达的部分由公共因⼦的线性组合表⽰。

即上⾯的因⼦模型可以写成以下的形式:1.2 正交因⼦模型设总体,均值向量,协⽅差矩阵。

因⼦模型有形式:其中m如果引⼊以下向量与矩阵:则因⼦模型的矩阵形式为:对于正交的因⼦模型,还要进⼀步要求:z1. 。

即有:公共因⼦是互相不相关的。

z2. 。

即:特殊因⼦和公共因⼦不相关。

1.3 因⼦载荷矩阵1.矩阵A称为因⼦载荷矩阵(component matrix),系数a ij称为变量X i在因⼦F j上的载荷(loading)。

由于特别,如果总体是标准化的,则有Var(X i)=1,从⽽有:于是:即变量X i在公共因⼦F j上的载荷a ij就是X i与F j的相关系数。

2.载荷矩阵的估计:主成分法。

主成分法是估计载荷矩阵的⼀种⽅法,由于其估计结果和变量的主成分仅相差⼀个常数倍,因此就冠以主成分法的名称。

在学到这⾥的时候,不要和主成分分析混为⼀谈。

主成分法是SPSS系统默认的⽅法,在⼀般情况下,这是⽐较好的⽅法。

以数据“应征⼈员”为例,按特征值⼤于1提取公共因⼦。

在⽤不同⽅法获得因⼦载荷时,公共因⼦对总体⽅差的贡献率以主成分法为最⾼:⽅法贡献率 %Principle components 81.476Maximum likelihood74.304Unweighted least squares74.485Principal axis factoring74.462Alpha factoring74.540Image factoring69.365关于主成分法的内容可参看任何⼀本多元统计分析书,例如:《应⽤多元统计分析》,⾼惠璇著,北京⼤学出版社,p301。

因子分析

因子分析

因子分析因子分析是一种常用的统计方法,广泛应用于社会科学、经济学、心理学等领域。

它可以帮助研究者找出数据中的主要因素,并将原始变量转化为更少的几个综合指标,从而简化数据分析和解释。

本文将介绍因子分析的基本原理、应用场景以及一些常见的因子分析方法。

一、因子分析的基本原理因子分析基于一种潜在变量模型,假设观察到的一组变量是由少数几个潜在的因子所决定的。

这些潜在因子无法直接观察到,但可以通过观察到的变量来推断。

通过因子分析,我们可以找出这些潜在因子,并将原始变量转化为这些因子的得分。

在因子分析中,我们假设每个潜在因子与一组观察到的变量相关联,这些变量称为因子载荷。

因子载荷可以解释变量之间的协方差结构,反映了变量与潜在因子之间的相关程度。

我们可以通过计算因子载荷矩阵来评估这种关系。

同时,我们还假设观察到的变量之间相互独立,即不存在多重共线性。

多重共线性会使得因子分析的结果不准确,因此在进行因子分析之前,我们需要先进行相关性分析和多重共线性检验。

二、因子分析的应用场景因子分析在许多领域都有广泛的应用。

以下是其中一些常见的应用场景:1.心理学研究:因子分析可以帮助心理学家理解人类行为的潜在因素。

例如,在人格心理学中,我们可以使用因子分析来研究人格特征的结构,并找出彼此相关的因素。

2.市场研究:因子分析可以帮助市场研究人员理解消费者行为的背后因素。

例如,在消费者调查中,我们可以使用因子分析来提取消费者购买决策中的主要影响因素,并根据这些因素进行市场定位和目标群体选择。

3.经济学研究:因子分析可以帮助经济学家理解经济变量之间的关系。

例如,在宏观经济学中,我们可以使用因子分析来提取经济增长、通货膨胀和失业率等变量的主要因素,并分析它们之间的相互作用。

4.社会科学研究:因子分析可以帮助社会科学家理解社会现象的潜在因素。

例如,在教育研究中,我们可以使用因子分析来研究学生学习成绩的主要影响因素,并提供相应的教学策略。

三、常见的因子分析方法在因子分析中,有许多不同的方法可以选择。

因子分析


或 X μ AF ε
称模型X μ AF ε 为正交因子模型,称 F1 , F2 ,, Fm 为公 共因子 ,它们是不可观测的变量,它们的系数矩阵 A 称为 因子载荷矩阵;aij(i=1,2,…,p,j=1,2,…,m)称为第i个变量在 第j个因子上的载荷(简称为因子载荷), 1 , 2 ,, p 称为 特殊因子 ,它们是不能被前 m 个公共因子包含的部分;并 且满足:
实例1
(1) 为了解学生的学习能力,观测了n个学生p个科目的成绩, 用X1, X2, …, Xp 表示科目(例如代数、几何、语文、英语,……) 可以认为各科目有两部分组成: X i ai F i i 1,......, p 其中F是对所有的Xi都起作用的公共因子,它表示智能高低的 因子;系数ai称为因子载荷,表示第i各科目在智能高低上的体 i 是科目变量特有的特殊因子,描述原始变量。这就是一 现; 个最简单的因子模型。 (2) 推广到m个因子,如数学因子、记忆因子、计算因子 等,分别记为F1,…,Fm。
实例2 调查青年对婚姻家庭的态度,抽取n个青年回答了 p=50个问题的答卷,这些问题可归纳为如下的几个方面: 如对相貌的重视,对孩子的观点、对老人的态度等。 实例3 考察人体的五项生理指标:收缩压(X1)、舒张压 (X2)、心跳间隔(X3)、呼吸间隔(X4)和舌下温度(X5)。 从生理学知识,这五项指标是受植物神经支配的,植物神 经又分为交感神经和副交感神经,因此这五项指标也可以 用因子分析模型去处理。
主成分分析的成功需满足如下两点: (1)前(少数)几个主成分具有较高的累计贡献 率;(通常较易得到满足) (2)对主成分给出符合实际背景和意义的解释 。 (往往正是主成分分析的困难之处) 因子分析的用途与主成分分析类似,它也是一种降 维方法。由于因子往往比主成分更易得到解释,故 因子分析比主成分分析更容易成功,从而有更广泛 的应用。

因子分析

因子分析因子分析是根据相关矩阵内部的依赖关系,把一些具有错综复杂关系的变量综合为数量较少的几个因子。

通过不同因子来分析决定某些变量的本质及其分类的一种统计方法。

简单地说,就是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。

每组变量代表一个基本结构,这个基本结构称为因子。

因子分析是利用少数几个潜在变量或公共因子去解释多个显在变量或可观测变量中存在的复杂关系的分析方法,也是一种将多变量降维处理的方法。

因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。

因子的特点:1.因子个数远远少于原有变量的个数2.因子能够反映原有变量的绝大部分信息3.因子之间线性关系不显著4.因子具有命名解释性因子分析模型因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。

它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。

对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。

因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。

因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。

(i)因子分析常常有以下四个基本步骤:第一步:数据标准化第二步:计算相关系数矩阵第三步:计算相关系数矩阵的特征值以及特征向量第四步:确定综合因子数以及因子结构和因子模型第五步:计算因子得分(ii)因子分析的计算过程:(1)将原始数据标准化,以消除变量间在数量级和量纲上的不同。

(2)求标准化数据的相关矩阵;(3)求相关矩阵的特征值和特征向量;(4)计算方差贡献率与累积方差贡献率;(5)确定因子:设F1,F2,…,Fp为p个因子,其中前m个因子包含的数据信息总量(即其累积贡献率)不低于80%时,可取前m个因子来反映原评价指标;(6)因子旋转:若所得的m 个因子无法确定或其实际意义不是很明显,这时需将因子进行旋转以获得较为明显的实际含义。

因子分析

2
2.1概述
因子分析
因子分析是多元统计分析的一个重要分支。主要目的是浓缩数 据。通过对诸多变量的相关性研究,可以用假想的少数几个变量,来 表示原来变量的主要信息。 因子分析最初是由英国心理学家C.Spearman提出的。目前因子 分析在心理学、社会学、经济学、人口学、地质学、生理学,甚至在 化学和物理学中都得到了成功的运用。它的运用主要有两个方面:一 是寻求基本结构,简化观测系统。通常采用因子分析的方法将为数众 多的变量减少为几个新因子,以再现他们之间的内在联系;二是用语 于分类,将变量或者样本进行分类,根据因子得分值在因子轴所构成 的空间中进行分类处理。
2.3因子模型与主成分模型的区别
请注意因子模型 X1=a11f1+a12f2+…+a1mfm+e1

Xk=ak1f1+ak2f2+…+akmfm+ek
与主成分模型
Y1=b11X1+b12X2+…+b1mXk

Yk=b1kX1+b2kX2+…+bkKXk
之间的区别:公共因子在因子模型等号的右边,主成分在主成分模型等号 的左边。虽然在一定的条件下,等号左右边是可以转换的,但还需注意, 在因子模型中,除了公共因子外,还有特殊因子,也就是说公共因子只解 释了原来变量的部分方差,而主成分解释了原来变量的全部方差。
同理可求出a3,… ,am。
(2)ε 未知,求负载矩阵A的实际方法(事实上我们不知道ε ) 现ε 未知,先用R(X)代替R*(X),按照上面的方法求出对应于 R(X)的最大特征根λ1的、标准化了的(长度为1的)特征向量b1, a1= 1。若R(X)-a1a1t接近对角阵,则说明剩下的 b1

因子分析


m
Xi的方差由两部分组成,第一部分hi 是全部(m个)公共因子对变量Xi的总 方差所作出的贡献,称为公因子方差; 第二部分σ 2i 由特定因子εi 产生的 方差,它仅与变量 Xi 有关,也称为剩余 方差.
2
15
2 1 aij i2 hi2 i2 j 1
m
显然,若hi2大,σ
16
2
3、公共因子F j 方差贡献的统计意义 因子载荷矩阵中各列元素的平方和
g a
2 j i 1
p
2 ij
gj2的统计意义与Xi的共同度h2i恰好相反, gj2表 示第j 个公因子Fj 对X的所有分量X1,…,Xp的总 影响,称为公共因子Fj对X的贡献(gj2是同一公 共因子Fj 对诸变量所提供的方差之总和),它 是衡量公共因子相对重要性的指标 .
7
§ 2 因子分析模型
一、数学模型
设 X i (i 1,2,, p ) p 个变量,如果表示为
X i i1F1 i 2 F2 im Fm i
(m p)
X 1 11 12 1m F1 1 X 22 2 m F2 2 2 21 X P p1 p 2 pm Fm P
19
u1 u 2
u1 1 0 u 2 up 0 p u p
1u1u 2u 2u2 mu mum m1u m1um1 pupu 1 p
例2 调查青年对婚姻家庭的态度,抽取了n个
引 言
什么是因子分析
克十项全能的得分进行研究(n=160),用X1-X10 表示十项全能的标准化得分数据(十项全能包括 :100米,铝球,跳高,跳远,400米,110米跨栏,铁 饼,撑杆,标枪,1500米),目的是分析哪些因素决 定了十项全能的成绩,以此来指导运动员的选拔 工作. 这些因素可归纳为如下几类:短跑速度,爆发 性臂力,腿力,耐力等.这也是一个因子分析的模 型,每一个因素就是一个公共因子. 6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因子分析判别分析和因子分析的区别,什么是聚类分析,多向测量的定义,广州专业广告市场调查。

在市场调查中,对问题的分析和评论往往涉及众多的评测变量。

因子分析,就是将多项评测变量归结为尽可能少的几个评测因素。

如对咖啡的评测内容有很多,专业性的调查报告结构上分为哪些部分:(1)闻着令人愉快;(2)喝起来感到解乏;(3)口感适宜;(4)价格便宜;(5)喝起来提神;(6)味道浓重有特色;(7)保持原料的味道。

通过因子分析,将7个评测项目减少到4个,广播委员会的任务是什么:享受感——闻着令人愉快、口感适宜浓厚感——味道浓重有特色货真感——喝起来感到解乏、提神,价格便宜新鲜感——保持原料的味道判别分析和因子分析实质上都是分类的方法。

聚类分析则是一种更简单、直观的分类方法,广泛地应用在市场调查中,如实验市场的选择、市场细分、市场范围的划分、产品的定位、消费者分类,等等,什么是创意广告。

多向测量,是指用多维空间定位图模拟市场或消费者对产品的心理评价的方法。

它能够形象地反映某一个市场的结构,即它是判别分析、因子分析和聚类分析的图形化。

主成分分析和因子分析的区别1,因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。

2,主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。

3,主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。

因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。

4,主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不到的因子。

5,在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。

在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。

和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。

大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。

而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。

当然,这中情况也可以使用因子得分做到。

所以这中区分不是绝对的。

总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。

主成分分析一般很少单独使用:a,了解数据。

(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。

(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。

主成分分析和因子分析的区别1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。

2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。

3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。

因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。

4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。

5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。

在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。

和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。

大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。

而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。

当然,这中情况也可以使用因子得分做到。

所以这中区分不是绝对的。

总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。

主成分分析一般很少单独使用:a,了解数据。

(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。

(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不在是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。

多元统计分析multivariate statistical analysis研究客观事物中多个变量(或多个因素)之间相互依赖的统计规律性。

它的重要基础之一是多元正态分析。

又称多元分析。

如果每个个体有多个观测数据,或者从数学上说,如果个体的观测数据能表为 P维欧几里得空间的点,那么这样的数据叫做多元数据,而分析多元数据的统计方法就叫做多元统计分析。

它是数理统计学中的一个重要的分支学科。

20世纪30年代,R.A.费希尔,H.霍特林,许宝以及S.N.罗伊等人作出了一系列奠基性的工作,使多元统计分析在理论上得到迅速发展。

50年代中期,随着电子计算机的发展和普及,多元统计分析在地质、气象、生物、医学、图像处理、经济分析等许多领域得到了广泛的应用,同时也促进了理论的发展。

各种统计软件包如SAS,SPSS等,使实际工作者利用多元统计分析方法解决实际问题更简单方便。

重要的多元统计分析方法有:多重回归分析(简称回归分析)、判别分析、聚类分析、主成分分析、对应分析、因子分析、典型相关分析、多元方差分析等。

多元统计分析是从经典统计学中发展起来的一个分支,是一种综合分析方法,它能够在多个对象和对个指标互相关联的情况下分析它们的统计规律,很适合农业科学研究的特点。

主要内容包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设检验、多元方差分析、直线回归与相关、多元线性回归与相关(Ⅰ)和(Ⅱ)、主成分分析与因子分析、判别分析与聚类分析、Shannon信息量及其应用。

探索性因子分析与验证性因子分析比较研究摘要:探索性因子分析与验证性因子分析是因子分析的两种不同形式。

它们都是以普通因子模型为基础,但它们之间也存在着较大差异。

本文通过对它们进行比较分析,找出其异同,并对实证分析提供一定的指导依据。

现实生活中的事物是错综复杂的,在现实的数据中,我们经常遇到的是多元的情况,而不仅仅是单一的自变量和单一的因变量。

因此要用到多元的分析方法,而因子分析就是其中一种非常重要的处理降维的方法。

它是将具有错综复杂关系的变量(或样品)综合为少数几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类。

它实际上就是一种用来检验潜在结构是怎样影响观测变量的方法。

因子分析主要有两种基本形式:探索性因子分析(Exploratory Factor Analysis)和验证性因子分析(Confirmatory FactorAnalysis)。

探索性因子分析(EFA)致力于找出事物内在的本质结构;而验证性因子分析(CFA)是用来检验已知的特定结构是否按照预期的方式产生作用。

两者之间是既有联系也有区别的,下面我们就从不同的方面进行分析比较。

两种因子分析的相同之处两种因子分析都是以普通因子模型为基础的。

因子分析的基本思想是通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系,但在这里,这少数几个随机变量是不可观测的,通常称为因子。

然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量相关性较低。

如图1所示,我们假定一个模型,它表明所有的观测变量(变量1到变量5)是一部分受到潜在公共因子(因子1和因子2)影响,一部分受到潜在特殊因子(E1到E5)影响的。

而每个因子和每个变量之间的相关程度是不一样的,可能某给定因子对于某些变量的影响要比对其他变量的影响大一些。

我们可以把图1的因子模型表示成线性函数:其中表示两个因子,它对所有是公有的因子,通常称为公共因子,它们的系数表示第个变量在第个因子上的载荷。

表示第个变量不能被前两个因子包括的部分,称为特殊因子,通常假定。

不论是探索性因子分析还是验证性因子分析都是为了考察观测变量之间的相关系数和方差协方差。

高度相关的观测变量(不管是正相关还是负相关)很可能是受同样的因子影响,而相对来说相关程度不是很高的观测变量很可能是受不同的因子影响的。

而因子必须尽可能多地解释变量方差,每个变量在每个因子上都有一个因子载荷,因子的意义需由看哪些变量在哪个因子上载荷最大来决定。

通过寻找潜在公共因子,并合理解释因子的意义,我们就能揭示错综复杂的事物的内部结构。

二、两种因子分析的差异(一)、基本思想的差异因子分析的基本思想是寻找公共因子以达到降维的目的。

在寻找公共因子的过程中,是否利用先验信息,产生了探索性因子分析和确定性因子分析的区别。

探索性因子分析是在事先不知道影响因素的基础上,完全依据资料数据,利用统计软件以一定的原则进行因子分析,最后得出因子的过程。

而确定性因子分析充分利用了先验信息,是在已知因子的情况下检验所搜集的数据资料是否按事先预定的结构方式产生作用。

因此探索性因子分析主要是为了找出影响观测变量的因子个数,以及各个因子和各个观测变量之间的相关程度;而验证性因子分析的主要目的是决定事前定义因子的模型拟合实际数据的能力。

进行探索性因子分析之前,我们不必知道我们要用几个因子,各个因子和观测变量之间的联系如何;而验证性因子分析要求事先假设因子结构,我们要做的是检验它是否与观测数据一致。

相关文档
最新文档