主成分分析与因子分析的联系与区别
因子分析与主成分分析的基本原理与应用

因子分析与主成分分析的基本原理与应用因子分析与主成分分析是统计学中常用的多元分析方法,用于降低数据维度、提取主要信息、捕捉变量间关系等。
本文将介绍因子分析与主成分分析的基本原理,并探讨它们在实际应用中的价值。
一、因子分析的基本原理与应用因子分析是一种用于推断观测变量背后的潜在因子结构的统计技术。
其基本原理是将多个相关的变量归纳为更少的无关因子来解释数据的变异。
使用因子分析,可以将多个变量聚合为更少的综合因子,从而简化数据分析过程。
在实际应用中,因子分析可以在不丢失太多信息的情况下,提取数据中最重要的变量。
例如,在心理学研究中,通过对大量问卷数据进行因子分析,可以将众多心理特征综合为几个核心因子,如情绪、认知、个性等。
这有助于研究者更好地理解心理特征间的关系,简化测量过程,提高数据分析效率。
二、主成分分析的基本原理与应用主成分分析是一种多元统计方法,其目的是将原始变量转化为少数几个无关的主成分,以解释数据的方差。
其基本原理是通过线性变换,将原始变量投影到一个新的坐标系中,使得变换后的变量间不相关。
主成分分析在许多领域有着广泛的应用。
例如,在金融领域,主成分分析可以应用于资产组合管理,通过将多个相关的金融指标转化为少数几个主成分,帮助投资者降低风险、优化投资组合。
在生物医学领域,主成分分析可以用于基因表达数据的降维与分类,从而帮助研究者鉴别不同类型的肿瘤、发现潜在的治疗靶点等。
三、因子分析与主成分分析的区别与联系尽管因子分析与主成分分析在某些方面有相似之处,但它们之间仍存在一些区别。
主要的区别在于其目标和假设。
因子分析更关注于数据背后的潜在结构与因子之间的关系,认为潜在因子是直接影响观测变量的原因。
而主成分分析更注重于减少数据维度、解释数据的变异,将原始变量变换为无关的主成分。
主成分分析假设没有测量误差而因子分析则允许变量间存在测量误差。
尽管两者有所区别,但由于其相似的思想和方法,因子分析与主成分分析常常被用来相互验证或者联合应用。
主成分分析与因子分析的异同比较及应用

主成分分析与因子分析的异同比较及应用一、相似之处:1.降低数据维度:主成分分析和因子分析都是降维方法,通过将原始变量进行线性组合,生成一组新变量,减少原始数据的维度。
2.揭示变量之间的关系:主成分分析和因子分析都可以揭示数据中变量之间的相关性和潜在结构,更好地理解变量之间的关系。
3.数据依赖:主成分分析和因子分析都依赖原始数据的线性关系。
二、主成分分析的特点和应用:1.数据探索:主成分分析可以用于对数据进行探索性分析,揭示数据中的模式和变量之间的关系。
2.特征选择:主成分分析可以用于提取最相关的变量,帮助选择最能代表数据信息的特征。
3.数据压缩:通过保留主要的主成分,主成分分析可以将数据压缩成较低维度,减少存储和计算的开销。
4.降噪:主成分分析可以通过去除与主成分相关较小的维度,减少噪声的影响。
三、因子分析的特点和应用:因子分析的目标是通过找到能够解释原始变量间共同方差的不可观测因子,来揭示变量背后的潜在结构。
因子分析的原理是通过将多个变量通过线性函数关系表示为少数几个潜在因子的和。
因子分析可以用于以下场景:1.变量间关系建模:因子分析可以用于建立变量之间的概念模型,识别变量的共同因子、独特因子和测量误差。
2.假设测试:因子分析可以用于检验变量之间的因果关系,以验证一些假设。
3.变量缩减:通过识别共同的因子,并组合成新的因子变量,因子分析可以减少数据集的维度。
4.数据恢复:因子分析可以通过基于因子提取的结果,恢复原始变量的丢失信息。
四、主成分分析与因子分析的区别:1.目标:主成分分析的目标是将原始变量转化为一组新的不相关的维度,以解释数据方差最大化;而因子分析的目标是将原始变量转化为一组潜在因子,以解释变量间的共同方差。
2.变量假设:主成分分析假设所有变量是观测变量的线性组合,而因子分析假设所有变量既有观测变量,也有不可观测的因子变量。
3.因素解释:主成分分析的主要解释对象是方差,因而主成分的解释目标是能够包含尽可能多的方差;而因子分析的解释对象是共同方差,因而因子的解释目标是能够解释原始变量之间的共同方差。
数据分析中的因子分析与主成分分析

数据分析中的因子分析与主成分分析在当今信息爆炸的时代,数据分析已经成为了各行各业中不可或缺的一部分。
在数据分析的过程中,因子分析和主成分分析是常用的两种统计方法。
它们可以帮助我们理解数据背后的隐藏规律和关联性。
本文将介绍因子分析和主成分分析的基本概念、应用场景以及它们之间的区别。
一、因子分析因子分析是一种用于探索多个变量之间关系的统计方法。
它的基本思想是将多个相关的变量归纳为少数几个潜在因子,从而简化数据的复杂性。
通过因子分析,我们可以找到隐藏在数据背后的共性因素,并将其用较少的变量来代表。
在因子分析中,我们需要确定两个重要的概念:因子载荷和公因子。
因子载荷表示变量与因子之间的相关性,取值范围为-1到1。
而公因子则是指影响多个变量的共同因素。
通过因子分析,我们可以得到每个变量对于每个公因子的因子载荷,从而得知变量之间的相关性以及它们与公因子的关系。
因子分析在实际应用中有着广泛的用途。
例如,在市场调研中,我们可以利用因子分析来确定消费者对于某个产品的偏好因素;在心理学研究中,我们可以通过因子分析来探索人们的个性特征。
因子分析的结果可以帮助我们更好地理解数据,为进一步的分析提供基础。
二、主成分分析主成分分析是一种用于降维的统计方法。
它的目标是通过线性组合将原始变量转化为一组新的互相无关的变量,即主成分。
主成分分析通过保留原始数据的大部分信息,同时减少数据的维度,从而达到简化数据和减少冗余的目的。
在主成分分析中,我们首先需要计算协方差矩阵。
然后,我们通过求解协方差矩阵的特征值和特征向量,得到主成分。
特征值表示主成分的重要性,而特征向量则表示主成分的方向。
通过选择特征值较大的主成分,我们可以保留较多的原始数据信息。
主成分分析在实际应用中也有着广泛的用途。
例如,在金融领域,我们可以利用主成分分析来构建投资组合,降低风险;在图像处理中,我们可以利用主成分分析来提取图像的特征。
主成分分析可以帮助我们更好地理解数据的结构,发现数据中的重要特征。
数据分析中的因子分析和主成分分析

数据分析中的因子分析和主成分分析在数据分析领域,因子分析和主成分分析是两种常用的多变量分析方法。
它们可以用来处理大量的数据,找出数据的内在规律,并将数据简化为更少的变量。
本文将介绍因子分析和主成分分析的定义、应用以及它们在数据分析中的区别和联系。
一、因子分析因子分析是一种用于研究多个变量之间的潜在因素结构及其影响的统计方法。
它通过将多个观测变量转化为少数几个无关的因子,来解释变量之间的相关性。
因子分析的基本思想是将多个相关观测变量归因于少数几个潜在因子,这些潜在因子不能被观测到,但可以通过观测变量的变化来间接地推断出来。
因子分析通常包括两个主要步骤:提取因子和旋转因子。
提取因子是指确定能够解释原始变量方差的主要共性因子,常用的方法有主成分分析法和最大似然估计法。
旋转因子是为了减少因子之间的相关性,使得因子更易于解释。
常用的旋转方法有正交旋转和斜交旋转。
因子分析的应用非常广泛,可以用于市场研究、社会科学调查、心理学、金融等领域。
例如,在市场研究中,因子分析可以用来确定消费者购买行为背后的潜在因素,从而更好地理解市场需求。
二、主成分分析主成分分析是一种通过线性变换将原始变量转化为一组线性无关的主成分的统计方法。
主成分是原始变量的线性组合,具有较大的方差,能够尽可能多地解释原始数据。
主成分分析的主要思想是将原始变量投影到一个新的坐标系中,使得新坐标系上的第一主成分具有最大方差,第二主成分具有次最大方差,以此类推。
通过选择解释原始数据方差较多的前几个主成分,我们可以实现数据的降维和主要信息提取。
主成分分析在数据降维、特征提取和数据可视化等领域有广泛的应用。
例如,在图像处理中,主成分分析可以用来压缩图像数据、提取重要特征,并且可以在保留图像主要信息的同时减少存储空间的需求。
三、因子分析和主成分分析的区别和联系因子分析和主成分分析在某些方面有相似之处,但也存在明显的区别。
首先,因子分析是用于研究多个观测变量之间的潜在因素结构,而主成分分析是通过线性变换将原始变量转化为一组线性无关的主成分。
主成分分析和因子分析-回归分析和相关分析的区别

主成分分析和因子分析的区别通过主成分分析所得来的新变量是原始变量的线性组合,每个主成分都是由原有P个变量线组合得到,在诸多主成分z中,Z1在总方差中占的比重最大,说明它综合原有变量的能力最强,其余主成分在总方差中占的比重依次递减,说明越往后的主成分综合原信息的能力越弱。
以后的分析可以用前面几个方差最大的主成分来进行,一般情况下,要求前几个z所包含的信息不少于原始信息的85%,这样既减少了变量的数目,又能够用较少的主成分反映原有变量的绝大部分信息。
如利用主成分来消除多元回归方程的多重共线性,利用主成分来筛选多元线性回归方程中的变量等。
通过因子分析得来的新变量是对每一个原始变量进行内部剖析。
打比喻来说,原始变量就如成千上万的糕点,每一种糕点的原料都有面粉、油、糖及相应的不同原料,这其中,面粉、油、糖是所有糕点的共同材料,这正好象是因子分析中的新变量即因子变量。
正确选择因子变量后,如果想考虑成千上万糕点的物价变动,只需重点考虑面粉、油、糖等公共因子的物价变动即可。
所以因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子与特殊因子两部分。
即因子分析就是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系,它把原始变量分解为两部分因素,一部分是由所有变量共同具有的少数几个公共因子构成的,另一部分是每个原始变量独自具有的因素,即特殊因子。
1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成各个变量的线性组合。
在主成分分析中,最终确定的新变量是原始变量的线性组合,如原始变量为x1,x2,. . . ,x3 ,经过坐标变换,将原有的p个相关变量xi 作线性变换,每个主成分都是由原有p 个变量线性组合得到。
在诸多主成分Zi 中,Z1 在方差中占的比重最大,说明它综合原有变量的能力最强,越往后主成分在方差中的比重也小,综合原信息的能力越弱。
2、主成分分析的重点在于解释各变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。
主成分分析与因子分析

标题: 主成分分析和因子分析的区别1,因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。
2,主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。
3,主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。
因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。
4,主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不到的因子。
5,在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。
在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。
和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。
大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。
而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。
当然,这中情况也可以使用因子得分做到。
所以这中区分不是绝对的。
总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。
主成分分析一般很少单独使用:a,了解数据。
(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。
(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。
应用多元统计分析习题解答_因子分析

第七章 因子分析7.1 试述因子分析与主成分分析的联系与区别。
答:因子分析与主成分分析的联系是:①两种分析方法都是一种降维、简化数据的技术。
②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。
因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。
因子分析也可以说成是主成分分析的逆问题。
如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。
因子分析与主成分分析的主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。
而因子分析是从显在变量去提炼潜在因子的过程。
此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。
7.2 因子分析主要可应用于哪些方面?答:因子分析是一种通过显在变量测评潜在变量,通过具体指标测评抽象因子的统计分析方法。
目前因子分析在心理学、社会学、经济学等学科中都有重要的应用。
具体来说,①因子分析可以用于分类。
如用考试分数将学生的学习状况予以分类;用空气中各种成分的比例对空气的优劣予以分类等等②因子分析可以用于探索潜在因素。
即是探索未能观察的或不能观测的的潜在因素是什么,起的作用如何等。
对我们进一步研究与探讨指示方向。
在社会调查分析中十分常用。
③因子分析的另一个作用是用于时空分解。
如研究几个不同地点的不同日期的气象状况,就用因子分析将时间因素引起的变化和空间因素引起的变化分离开来从而判断各自的影响和变化规律。
7.3 简述因子模型中载荷矩阵A 的统计意义。
答:对于因子模型1122i i i ij j im m i X a F a F a F a F ε=++++++ 1,2,,i p =因子载荷阵为11121212221212(,,,)m m m p p pm a a a a a a A A A a a a ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦Ai X 与j F 的协方差为:1Cov(,)Cov(,)mi j ik k i j k X F a F F ε==+∑=1Cov(,)Cov(,)mikk j i j k aF F F ε=+∑=ij a若对i X 作标准化处理,=ij a ,因此 ij a 一方面表示i X 对j F 的依赖程度;另一方面也反映了变量iX对公共因子jF的相对重要性。
主成分分析和因子分析十大不同点

主成分分析和因子分析十大不同点主成分分析和因子分析无论从算法上还是应用上都有着比较相似之处,本文结合以往资料以及自己的理解总结了以下十大不同之处,适合初学者学习之用。
1.原理不同主成分分析基本原理:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标(主成分),即每个主成分都是原始变量的线性组合,而且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能(主成分必须保留原始变量90%以上的信息),从而达到简化系统结构,抓住问题实质的目的。
因子分析基本原理:利用降维(线性变换)的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。
就是要从数据中提取对变量起解释作用的少数公共因子(因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系)。
2.线性表示方向不同因子分析是把变量表示成各公因子的线性组合;而主成分分析中则是把主成分表示成各变量的线性组合。
3.假设条件不同主成分分析:不需要有假设(assumptions)。
因子分析:需要一些假设。
因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。
4.求解方法不同求解主成分的方法:从协方差阵出发(协方差阵已知),从相关阵出发(相关阵R已知),采用的方法只有主成分法。
(实际研究中,总体协方差阵与相关阵是未知的,必须通过样本数据来估计)。
注意事项:由协方差阵出发与由相关阵出发求解主成分所得结果不一致时,要恰当的选取某一种方法;一般当变量单位相同或者变量在同一数量等级的情况下,可以直接采用协方差阵进行计算;对于度量单位不同的指标或是取值范围彼此差异非常大的指标,应考虑将数据标准化,再由协方差阵求主成分;实际应用中应该尽可能的避免标准化,因为在标准化的过程中会抹杀一部分原本刻画变量之间离散程度差异的信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主成分分析与因子分析的联系与区别Revised by Jack on December 14,2020一、问题的提出在科学研究或日常生活中,常常需要判断某一事物在同类事物中的好坏、优劣程度及其发展规律等问题。
而影响事物的特征及其发展规律的因素(指标)是多方面的,因此,在对该事物进行研究时,为了能更全面、准确地反映出它的特征及其发展规律,就不应仅从单个指标或单方面去评价它,而应考虑到与其有关的多方面的因素,即研究中需要引入更多的与该事物有关系的变量,来对其进行综合分析和评价。
多变量大样本资料无疑能给研究人员或决策者提供很多有价值的信息,但在分析处理多变量问题时,由于众变量之间往往存在一定的相关性,使得观测数据所反映的信息存在重叠现象。
因此为了尽量避免信息重叠和减轻工作量,人们就往往希望能找出少数几个互不相关的综合变量来尽可能地反映原来数据所含有的绝大部分信息。
而主成分分析和因子分析正是为解决此类问题而产生的多元统计分析方法。
近年来,这两种方法在社会经济问题研究中的应用越来越多,其应用范围也愈加广泛。
因子分析是主成分分析的推广和发展,二者之间就势必有着许多共同之处,而SPSS软件不能直接进行主成分分析,致使一些应用者在使用SPSS进行这两种方法的分析时,常常会出现一些混淆性的错误,这难免会使人们对分析结果产生质疑。
因此,有必要在运用SPSS分析时,将这两种方法加以严格区分,并针对实际问题选择正确的方法。
二、主成分分析与因子分析的联系与区别两种方法的出发点都是变量的相关系数矩阵,在损失较少信息的前提下,把多个变量(这些变量之间要求存在较强的相关性,以保证能从原始变量中提取主成分)综合成少数几个综合变量来研究总体各方面信息的多元统计方法,且这少数几个综合变量所代表的信息不能重叠,即变量间不相关。
主要区别:1. 主成分分析是通过变量变换把注意力集中在具有较大变差的那些主成分上,而舍弃那些变差小的主成分;因子分析是因子模型把注意力集中在少数不可观测的潜在变量(即公共因子)上,而舍弃特殊因子。
2. 主成分分析是将主成分表示为原观测变量的线性组合,(1)主成分的个数i=原变量的个数p,其中j=1,2,…,p,是相关矩阵的特征值所对应的特征向量矩阵中的元素,是原始变量的标准化数据,均值为0,方差为1。
其实质是p维空间的坐标变换,不改变原始数据的结构。
而因子分析则是对原观测变量分解成公共因子和特殊因子两部分。
因子模型如式(2),(2)其中i=1,2,…,p, m是因子分析过程中的初始因子载荷矩阵中的元素, 是第j个公共因子,是第i个原观测变量的特殊因子。
且此处的与的均值都为0,方差都为1。
3. 主成分的各系数,是唯一确定的、正交的。
不可以对系数矩阵进行任何的旋转,且系数大小并不代表原变量与主成分的相关程度;而因子模型的系数矩阵是不唯一的、可以进行旋转的,且该矩阵表明了原变量和公共因子的相关程度。
4. 主成分分析,可以通过可观测的原变量X直接求得主成分Y,并具有可逆性;因子分析中的载荷矩阵是不可逆的,只能通过可观测的原变量去估计不可观测的公共因子,即公共因子得分的估计值等于因子得分系数矩阵与原观测变量标准化后的矩阵相乘的结果。
还有,主成分分析不可以像因子分析那样进行因子旋转处理。
5.综合排名。
主成分分析一般依据第一主成分的得分排名,若第一主成分不能完全代替原始变量,则需要继续选择第二个主成分、第三个等等,此时综合得分=∑(各主成分得分×各主成分所对应的方差贡献率),主成分得分是将原始变量的标准化值,代入主成分表达式中计算得到;而因子分析的综合得分=∑(各因子得分×各因子所对应的方差贡献率)÷∑各因子的方差贡献率,因子得分是将原始变量的标准化值,代入因子得分函数中计算得到。
区别中存联系,联系中显区别由于上文提到主成分可表示为原观测变量的线性组合,其系数为原始变量相关矩阵的特征值所对应的特征向量,且这些特征向量正交,因此,从X到Y的转换关系是可逆的,便得到如下的关系:(3)下面对其只保留前m个主成分(贡献大),舍弃剩下贡献很小的主成分,得:i=1,2,...p(4)由此可见,式(4)在形式上已经与因子模型(2)忽略特殊因子后的模型即:(2)*相一致,且(j=1,2,…,m)之间相互独立。
由于模型(2)*是因子分析中未进行因子载荷旋转时建立的模型,故如果不进行因子载荷旋转,许多应用者将容易把此时的因子分析理解成主成分分析,这显然是不正确的。
然而此时的主成分的系数阵即特征向量与因子载荷矩阵确实存在如下关系:主成分分析中,主成分的方差等于原始数据相关矩阵的特征根,其标准差也即特征根的平方根,于是可以将除以其标准差(单位化)后转化成合适的公因子,即令,,则式(4)变为:(4)*可得,(5)式(5)便是主成分系数矩阵与初始因子载荷阵之间的联系。
不能简单地将初始因子载荷矩阵认为是主成分系数矩阵(特征向量矩阵),否则会造成偏差。
三、实证分析通过实例来研究SPSS软件中的因子分析和主成分分析及二者分析结果的比较。
运用两种分析方法对2005年江苏省13个主要城市的经济发展综合水平进行分析。
本文在选取指标时遵循了指标选取的基本原则,即针对性、可操作性、层次性、全面性等原则,选取了以下反映城市经济发展综合水平的9项指标: GDP(X1)亿元、人均GDP (X2) 元、城镇居民人均可支配收入(X3)元、农村居民纯收入(X4) 元、第三产业占GDP比重(X5)%、金融机构存款余额(X6)亿元、万人中各专业技术人员数(X7)人、科技三项和文教科卫支出(X8)亿元、实际利用外资(X9) 亿美元。
(一)数据来源及处理按照上述指标体系,选取了江苏13个城市的数据,(所有数据均来源于《江苏统计年鉴(2006)》)。
指标都是正指标,无需归一化,将自动对原始数据进行标准差标准化处理,消除指标量纲及数量级的影响。
(二)运用SPSS进行分析首先,通过SPSS中的Data Reduction-Factor命令进行因子分析,本文采取主成分分析法来抽取公共因子,并依据特征值大于1来确定因子数目。
相关的分析结果及分析,如下:1.相关系数矩阵由于因子分析是基于相关矩阵进行的,即要求各指标之间具有一定的相关性,求出相关矩阵是必要的。
KMO统计量是,且Bartlett球体检验值为,卡方统计值的显着性水平为小于,都说明各指标之间具有较高相关性,因此本文数据适用于作因子分析。
2.总方差分解表2中,依据特征值大于1的原则,提取了2个公因子(主成分),它们的累积方差贡献率达%,这2个公因子(主成分)包含了原指标的绝大部分信息,可以代替原来9个变量对城市经济发展水平现状进行衡量。
3.主成分表达式与因子模型初始因子载荷矩阵(见表3)反映了公因子与原始变量之间的相关程度,而主成分的系数矩阵并不反映公因子与原始变量之间的相关程度,故不能直接用表3中的数据表示。
根据该系数矩阵与初始因子载荷阵之间的关系(如式(5)),可以计算出前2个特征值所对应的特征向量阵(系数矩阵),见表4。
很明显表4和表3中的数据相差很大,因此,如果将初始因子载荷阵误认为是主成分系数矩阵,分析结果将会产生较大偏差。
主成分的表达式应为:(6)Y1= *Z1+ *Z2+…+*Z9Y2= * *Z2+…*Z9=(* Y1+* Y2)/100因子模型:X1=**F2X2=**F2…X9=**F2其中Z1~Z9是X1~X9的标准化数据.4.因子得分函数从表3得知,各因子在各变量上的载荷已经向0和1两极分化,故无需进行因子旋转。
公因子是不可观测的,估计因子得分应借助于未旋转因子得分系数矩阵,见表5。
得到以下因子得分函数:(7)F1=*Z1+*Z2 +…+*Z9F2= **Z2 +...*Z9同样Z1~Z9是标准化的数据,其综合得分计算公式:=*F1+*F2)/(8)(三)两种方法综合排名比较按照主成分综合得分和因子综合得分,对江苏13个城市的经济发展综合水平进行排名,见表6。
表6中,综合得分出现负值,这只表明该城市的综合水平处于平均水平之下(由于主成分(因子)已经标准化了)。
从该表看出,主成分分析与因子分析的实证结果,不仅大部分城市的排名存在差异,且综合得分值上存在较大差异,其定量值差异较大,这对于后来的综合定量定性分析,最终所提出的政策建议等都会产生较大影响。
因此不能混用。
四、结束语使用主成分分析和因子分析进行综合评价时,可以通过不同的统计软件来完成数据分析,除SPSS软件外,其他软件都分别设有两种方法的过程命令,使用者可以根据需要采用其中一种来分析问题,一般不会混淆。
而正是因为SPSS没有直接进行主成分分析的命令,才使得那些本身尚未清楚区分这两种方法的使用者更加迷惑,不慎便会出现混淆性错误。
因此,本文很详细地从理论和实证角度,分析了这两种方法的异同及如何运用SPSS软件进行分析。
从实证结果看,运用主成分分析和因子分析进行综合定量分析时,不但综合排名结果存在差异,而且定量值也存在较大差异,这必然会影响后面的综合定性分析结果。
因此,我们应正确理解和运用这两种方法,使其发挥出各自最大的优势,以便更好地服务于实际问题的分析。
参考文献:[1] 郭显光. 如何用SPSS软件进行主成分分析[J]. 统计与信息论坛,1998, (2)[2] 何晓群. 现代统计分析方法与应用[M]. 中国人民大学出版社,1998[3] 余建英、何旭宏. 数据统计分析与SPSS应用[M]. 人民邮电出版社,2003[4] 于秀林、任雪松. 多元统计分析[M]. 中国统计出版社,1999[5] Anderson, T. W. An Introduction to Multivariate Statistical Methods, New York: John Wiley, 19582007/12/08/。