主成分分析与因子分析详细的异同和SPSS软件

合集下载

主成分分析和因子分析的SPSS实现比较

主成分分析和因子分析的SPSS实现比较

主成分分析和因子分析的SPSS实现比较主成分分析和因子分析是多元统计方法中关系密切的两种方法,应用范围十分广泛,可以解决经济、教育、科技、社会等领域中的综合评价问题。

主成分分析采用降维的思想,将研究对象的多个相关变量(指标)综合为少数几个不相关的变量,反映原变量提供的主要信息。

因子分析是主成分分析的推广和发展,它将具有错综复杂关系的变量综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它属于多元分析中处理降维的一种统计方法。

但是,在许多论文中用SPSS进行综合分析时,出现这两种方法运用混淆的错误。

比如,主成分分析中对变量进行了因子旋转,因子分析的公因子系数错误等问题。

本文就此对主成分分析和因子分析的异同进行比较,并在SPSS和DPS软件上如何实现给予说明。

一、主成分分析与因子分析的异同点两者的相同点:1、思想一致:都是降维的思想;2、应用范围一致:都要求变量之间具有不完全的相关性;3、数据处理过程一致:数据的无量纲化,求相关系数矩阵的特征值和特征向量,通过累计贡献率确定主成分个数、因子个数;4、合成方法一致:都没有考虑原始变量之间的关系,直接用线性关系处理变量与主成分和因子之间的关系。

两者的不同点:1、方差损失上:主成分解释了原始变量的全部方差,无方差损失;因子模型中除了有公因子外还有特殊因子,公因子只解释了部分信息,有方差损失;2、唯一性:主成分分析不存在因子旋转,主成分是唯一的;因子分析进行因子旋转,解不唯一;3、实际意义:主成分没有实际意义;公因子有实际意义;4、应用:主成分侧重信息贡献、影响力综合评价;因子分析侧重成因清晰性的综合评价。

二、SPSS上的实现1、主成分分析在SPSS上的实现(1)将原始数据无量纲化。

传统主成分分析进行无量纲化处理的方法是“中心标准化”,这在SPSS中通过Analyse-DescriptiveStatistics-Descriptive中Save standardized values as variables执行。

主成分与因子分析的10点异同总结

主成分与因子分析的10点异同总结

主成分与因子分析的10点异同总结一、原理不同主成分分析(Principal components analysis,PCA)基本原理:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个不相关的综合指标(主成分),即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能(主成分必须保留原始变量90%以上的信息),从而达到简化系统结构,抓住问题实质的目的。

因子分析(Factor Analysis,FA)基本原理:利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。

就是要从数据中提取对变量起解释作用的少数公共因子(因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系)二、线性表示方向不同因子分析是把变量表示成各公因子的线性组合主成分分析中则是把主成分表示成各变量的线性组合。

三、假设条件不同主成分分析:不需要有假设(assumptions),因子分析:需要一些假设。

因子分析的假设包括:各个共同因子之间不相关,特殊因子(specificfactor)之间也不相关,共同因子和特殊因子之间也不相关。

四、求解方法不同求解主成分的方法:从协方差阵出发(协方差阵已知),从相关阵出发(相关阵R已知),采用的方法只有主成分法。

(实际研究中,总体协方差阵与相关阵是未知的,必须通过样本数据来估计)注意事项:由协方差阵出发与由相关阵出发求解主成分所得结果不一致时,要恰当的选取某一种方法;一般当变量单位相同或者变量在同一数量等级的情况下,可以直接采用协方差阵进行计算;对于度量单位不同的指标或是取值范围彼此差异非常大的指标,应考虑将数据标准化,再由协方差阵求主成分;实际应用中应该尽可能的避免标准化,因为在标准化的过程中会抹杀一部分原本刻画变量之间离散程度差异的信息。

主成分分析与因子分析的异同比较及应用

主成分分析与因子分析的异同比较及应用

主成分分析与因子分析的异同比较及应用一、相似之处:1.降低数据维度:主成分分析和因子分析都是降维方法,通过将原始变量进行线性组合,生成一组新变量,减少原始数据的维度。

2.揭示变量之间的关系:主成分分析和因子分析都可以揭示数据中变量之间的相关性和潜在结构,更好地理解变量之间的关系。

3.数据依赖:主成分分析和因子分析都依赖原始数据的线性关系。

二、主成分分析的特点和应用:1.数据探索:主成分分析可以用于对数据进行探索性分析,揭示数据中的模式和变量之间的关系。

2.特征选择:主成分分析可以用于提取最相关的变量,帮助选择最能代表数据信息的特征。

3.数据压缩:通过保留主要的主成分,主成分分析可以将数据压缩成较低维度,减少存储和计算的开销。

4.降噪:主成分分析可以通过去除与主成分相关较小的维度,减少噪声的影响。

三、因子分析的特点和应用:因子分析的目标是通过找到能够解释原始变量间共同方差的不可观测因子,来揭示变量背后的潜在结构。

因子分析的原理是通过将多个变量通过线性函数关系表示为少数几个潜在因子的和。

因子分析可以用于以下场景:1.变量间关系建模:因子分析可以用于建立变量之间的概念模型,识别变量的共同因子、独特因子和测量误差。

2.假设测试:因子分析可以用于检验变量之间的因果关系,以验证一些假设。

3.变量缩减:通过识别共同的因子,并组合成新的因子变量,因子分析可以减少数据集的维度。

4.数据恢复:因子分析可以通过基于因子提取的结果,恢复原始变量的丢失信息。

四、主成分分析与因子分析的区别:1.目标:主成分分析的目标是将原始变量转化为一组新的不相关的维度,以解释数据方差最大化;而因子分析的目标是将原始变量转化为一组潜在因子,以解释变量间的共同方差。

2.变量假设:主成分分析假设所有变量是观测变量的线性组合,而因子分析假设所有变量既有观测变量,也有不可观测的因子变量。

3.因素解释:主成分分析的主要解释对象是方差,因而主成分的解释目标是能够包含尽可能多的方差;而因子分析的解释对象是共同方差,因而因子的解释目标是能够解释原始变量之间的共同方差。

基于SPSS的主成分分析与因子分析的辨析

基于SPSS的主成分分析与因子分析的辨析

基于SPSS的主成分分析与因子分析的辨析主成分分析和因子分析是两种常用的多元统计分析方法,用于处理多个变量之间的关系和结构。

尽管它们在一些方面相似,但它们有着不同的目标、假设和应用领域。

主成分分析(PCA)是一种降维技术,旨在将多个相关的变量转化为较少数量的互相无关的新变量,称为主成分。

主成分是原始变量线性组合的结果,它们按照方差的大小递减排序,第一个主成分解释了尽可能多的方差,第二个主成分解释了剩余的方差,依此类推。

主成分分析的目标是找到最重要的成分,以减少数据维度并保留尽可能多的信息。

因子分析(FA)是一种探索性分析方法,旨在找到观察到的变量背后潜在的隐藏因子及其之间的关系。

它假设每个观察到的变量受到几个潜在因子的影响,并通过解释方差-共方差矩阵来确定这些因子。

因子分析的目标是解释数据的系统结构,并识别变量之间的潜在关系。

下面是主成分分析和因子分析的几个区别:1.假设:主成分分析假设所有的变量都是线性相关的,而因子分析假设变量之间存在潜在的隐藏因子。

2.目标:主成分分析的目标是减少数据的维度,使用少量的主成分来解释尽可能多的方差。

因子分析的目标是找出潜在因子,并解释数据的结构。

3.变量解释:在主成分分析中,每个主成分解释了数据中的方差,而在因子分析中,每个因子代表了一个潜在原因,描述了观察到的变量之间的共同性。

4.变换:在主成分分析中,通过线性组合原始变量来创建主成分。

在因子分析中,每个观察到的变量都被假设为由潜在因子和特定的误差项组合而成。

5.前提要求:主成分分析对变量之间的线性关系没有特定的要求,可以处理混合类型的数据。

因子分析假设线性关系是必需的,且数据应满足正态分布。

尽管主成分分析和因子分析在一些方面不同,但它们也有一些共同之处。

它们都可以用于数据降维和构建新的变量,以更好地解释和理解数据。

此外,它们都是无监督学习方法,不需要以前的假设。

在实际应用中,选择主成分分析还是因子分析取决于具体的研究目标和数据属性。

主成分分析与因子分析详细的异同和SPSS软件

主成分分析与因子分析详细的异同和SPSS软件

主成分分析与因子分析详细的异同和SPSS软件摘要:主成分分析与因子分析(R-型)应用十分广泛,但一些论文和一些SPSS软件教科书(见附文)出错。

本文指出了这些错误及其成因,指出了出错造成的危害,从原理上给出了主成分分析与R-型因子分析数学模型详细的异同,给出了避免出错的方法, 并对SPSS软件及有关教科书提出了一些建议。

关键词:主成分分析;因子分析;SPSS软件;出错;避免设=(X1,…,X P为标准化随机向量(p≥2),R为相关系数矩阵, =(F1 ,…,F m为主成分向量,=(Z1 ,…,Z m为因子向量,m≤p,为方便,因子、因子估计、因子得分用同一记号。

一、问题的提出与结论主成分分析与R-型因子分析是多元统计分析中的两个重要方法,同是降维技术,应用范围十分广泛,但通过流行甚广的SPSS软件调用这两种方法的过程命令,使用者容易出错,是什么原因造成这些错误呢?主成分分析与R-型因子分析到底有何异同呢?出错会造成什么危害呢?由于SPSS软件在经济、医学、管理等领域中的广泛流行使用,解决这些问题尤其必要。

经过对一些论文和一些SPSS软件教科书(见附文)仔细查证分析、比较、研究得出:出错原因:有些使用者和书作者对主成分分析与R-型因子分析的原理、异同与解题步骤掌握不透,现行SPSS软件及其书中没有完善这两种方法的研究(对高校师生出错影响很大)。

结论:主成分分析与R-型因子分析有10处主要的不同,致使主成分分析与因子分析的定量综合评价体系不同,混淆在一起是不同定量值交替错误,综合评价必须分开进行。

出错带来的危害:企业经济效益、竞争力等的综合评价会带来误评,医学诊断会带来误诊,决策会带来误断等。

二、一些使用者出现的错误及其成因分析经过仔细查证分析,有下列错误:使用主成分分析时①对主成分分析的原理没有掌握, 如叙述主成分分析概念出错。

②主成分F求解出错,如=中(为单位矩阵,的意义见表1)。

③不知主成分F的命名依据,对主成分F命名出错。

基于SPSS的主成分分析与因子分析的辨析

基于SPSS的主成分分析与因子分析的辨析

基于SPSS的主成分分析与因子分析的辨析一、本文概述随着统计学的快速发展和广泛应用,主成分分析(Principal Component Analysis, PCA)和因子分析(Factor Analysis, FA)作为两种重要的降维和变量整合技术,在社会科学、医学、经济学等众多领域得到了广泛应用。

SPSS作为一款强大的统计分析软件,为这两种分析方法提供了便捷的操作平台和丰富的功能支持。

然而,尽管PCA和FA在理论上具有一定的相似性,但它们的核心理念、适用场景、解释方式等方面都存在显著差异。

因此,本文旨在通过辨析基于SPSS的主成分分析与因子分析的不同点,帮助研究者更加准确地理解和运用这两种方法,以便更有效地提取信息、简化数据结构,并提升研究的科学性和准确性。

本文首先将对主成分分析和因子分析的基本概念进行简要介绍,明确它们各自的核心思想和理论基础。

随后,将重点分析这两种方法在SPSS软件中的实现过程,包括数据准备、参数设置、结果解读等关键步骤。

在此基础上,文章将详细比较PCA和FA在SPSS应用中的不同点,包括适用范围、前提条件、分析结果解释等方面。

本文还将结合实例分析,展示如何在具体研究问题中选择合适的方法,并对分析结果进行有效解读和应用。

通过本文的辨析和讨论,期望能够帮助研究者更深入地理解主成分分析和因子分析的基本原理及其在SPSS中的应用方法,从而为实证研究提供有力的统计工具和方法支持。

二、主成分分析(PCA)主成分分析(Principal Component Analysis,简称PCA)是一种广泛应用的多元统计方法,其目标是通过降维技术来揭示数据中的内部结构。

PCA通过将多个原始变量转换为少数几个主成分,这些主成分能够最大限度地保留原始数据中的变异信息,并且彼此之间互不相关。

PCA的基本原理是通过对原始变量的协方差矩阵或相关矩阵进行特征值分解,得到一系列的主成分。

每个主成分都是原始变量的线性组合,其权重由特征向量决定。

主成分分析与因子分析区别

主成分分析与因子分析区别

主成分分析主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。

主成分分析一般很少单独使用:a、了解数据。

(screening the data),b、和cluster analysis一起使用,c、和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。

(reduce dimensionality)d、在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。

2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。

3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。

因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。

4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。

5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。

在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。

和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。

大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。

而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。

当然,这种情况也可以使用因子得分做到。

《2024年主成分分析与因子分析的异同和SPSS软件——兼与刘玉玫、卢纹岱等同志商榷》范文

《2024年主成分分析与因子分析的异同和SPSS软件——兼与刘玉玫、卢纹岱等同志商榷》范文

《主成分分析与因子分析的异同和SPSS软件——兼与刘玉玫、卢纹岱等同志商榷》篇一主成分分析与因子分析的异同及其在SPSS软件中的应用——兼与刘玉玫、卢纹岱等同志商榷一、引言主成分分析和因子分析是统计学中两种重要的降维技术,被广泛应用于社会、经济、科研等领域的多维数据分析。

然而,对于这两者之间的异同及其应用方式,学者们常有争议。

本文将深入探讨主成分分析与因子分析的异同点,并详细介绍如何在SPSS 软件中实现这两种分析方法,同时与刘玉玫、卢纹岱等同志的见解进行商榷。

二、主成分分析与因子分析的异同(一)异同点概述主成分分析和因子分析都是通过降维技术将多个原始变量转化为少数几个综合变量,以简化数据结构,揭示数据间的内在联系。

然而,两者在分析目的、原理、方法等方面存在显著差异。

(二)主成分分析主成分分析(PCA)是一种基于数据结构正交化降维的统计分析方法,其主要目的是找出原始数据集中具有代表性的主要特征(即主成分),同时尽量减少原始数据信息丢失。

PCA注重对原始变量之间的相关性进行降维处理,使得新的综合变量(即主成分)之间相互独立。

(三)因子分析因子分析(FA)则是一种基于数据结构提取潜在公共因子的统计分析方法。

其目的是找出原始变量之间潜在的公共因子和特殊因子,以解释原始变量之间的关系。

FA更注重对原始变量之间的内在联系进行解释和描述,提取出的因子之间可能存在一定的相关性。

(四)异同点详解1. 目的不同:主成分分析主要关注数据的降维和结构简化,而因子分析则更侧重于揭示变量之间的内在联系和潜在结构。

2. 原理不同:主成分分析基于数据之间的协方差关系进行降维,而因子分析则基于潜在因子的提取和解释。

3. 方法不同:主成分分析主要通过线性变换得到主成分,而因子分析则通过因子载荷矩阵和特殊因子解释原始变量的关系。

4. 结果解释不同:主成分分析得到的综合变量相对独立,更便于理解和解释;而因子分析则提取出潜在的公共因子,对原始变量的关系进行深入解析。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

主成分分析与因子分析详细的异同和SPSS软件摘要:主成分分析与因子分析(R-型)应用十分广泛,但一些论文和一些SPSS软件教科书(见附文)出错。

本文指出了这些错误及其成因,指出了出错造成的危害,从原理上给出了主成分分析与R-型因子分析数学模型详细的异同,给出了避免出错的方法, 并对SPSS软件及有关教科书提出了一些建议。

关键词:主成分分析;因子分析;SPSS软件;出错;避免设=(X1,…,X P为标准化随机向量(p≥2),R为相关系数矩阵, =(F1 ,…,F m为主成分向量,=(Z1 ,…,Z m为因子向量,m≤p,为方便,因子、因子估计、因子得分用同一记号。

一、问题的提出与结论主成分分析与R-型因子分析是多元统计分析中的两个重要方法,同是降维技术,应用范围十分广泛,但通过流行甚广的SPSS软件调用这两种方法的过程命令,使用者容易出错,是什么原因造成这些错误呢?主成分分析与R-型因子分析到底有何异同呢?出错会造成什么危害呢?由于SPSS软件在经济、医学、管理等领域中的广泛流行使用,解决这些问题尤其必要。

经过对一些论文和一些SPSS软件教科书(见附文)仔细查证分析、比较、研究得出:出错原因:有些使用者和书作者对主成分分析与R-型因子分析的原理、异同与解题步骤掌握不透,现行SPSS软件及其书中没有完善这两种方法的研究(对高校师生出错影响很大)。

结论:主成分分析与R-型因子分析有10处主要的不同,致使主成分分析与因子分析的定量综合评价体系不同,混淆在一起是不同定量值交替错误,综合评价必须分开进行。

出错带来的危害:企业经济效益、竞争力等的综合评价会带来误评,医学诊断会带来误诊,决策会带来误断等。

二、一些使用者出现的错误及其成因分析经过仔细查证分析,有下列错误:使用主成分分析时①对主成分分析的原理没有掌握, 如叙述主成分分析概念出错。

②主成分F求解出错,如=中(为单位矩阵,的意义见表1)。

③不知主成分F的命名依据,对主成分F命名出错。

④解释变量某X k被丢失。

⑤对错误地进行旋转。

⑥错误地进行回归求F。

⑦把因子分析法(含没有旋转过程的)错误地当作主成分分析法。

使用因子分析时①对因子分析的原理没有掌握, 如将因子分析的思想叙述为主成分分析的思想。

②不知因子Z i的命名依据,对因子Z i的命名出错,如用因子得分函数对因子Z i进行命名。

③解释变量某X k被丢失。

④将主成分或因子错误地表示为(的意义见表1)。

⑤不知相关系数矩阵特征值与因子贡献v i的区别,如综合因子得分函数Z综=Z i中的v i错误地取为特征值。

使用SPSS软件时①由于SPSS软件本身无主成分分析模块,有些使用者就用因子分析中一些模块来制造主成分的结果,出现了混乱的定量过程。

②由于SPSS软件教科书中因子分析内容处混淆主成分分析与因子分析,致使有些使用者也混淆这两种方法出错。

从以上可看出出错的原因是:有些使用者对主成分分析与R-型因子分析的原理(原理可见[4])、异同与解题步骤掌握不透,现行SPSS软件及其书中没有完善这两种方法的研究。

三、主成分分析与R-型因子分析数学模型的异同比较这里给出的主成分分析与R-型因子分析的异同,与现行观点相比,是内容与过程上的比较,更透彻、更准确,是认识的深入。

相同之处:主成分分析与R-型因子分析都是对协差阵的逼近,都是打算降维解释数据集。

具体为指标的正向化[3], 指标的标准化(SPSS软件自动执行),通过相关系数矩阵判断变量间的相关性,求相关系数矩阵的特征值和特征向量, 主成分间、因子间线性无关,用累计贡献率(%)、变量不出现丢失确定主成分、因子个数m, 前m个主成分与前m个因子对X的综合贡献相同、是最大化的,命名依据都是主成分、因子与变量的相关系数。

不同之处:方差, 最大化方向, 所处的坐标系(标准正交性), 应用上侧重等见表1。

表1主成分分析与R-型因子分析的不同=(=(),, ,+(为特殊因子),= (=,(=,=i =。

=。

+ =i(/注意:主成分分析有时命名清晰, 此时既能达到信息贡献影响力综合评价效果, 又能达到成因清晰性的综合评价效果,此时主成分分析的结果多数优于因子分析的结果。

以上说明:主成分分析与因子分析定量上不同的显著性标志是方差。

事实上,VarF i >(<) VarZ i =1,即F i的取值范围比Z i的取值范围大(小);通常VarF综 > VarZ综,即F综的取值范围比Z综的取值范围大(见表5、8),这些都肯定了主成分分析与因子分析的定量值评价体系不同。

结论:主成分分析与因子分析两种方法方差、最大化方向不同,直接导致主成分值、因子得分值、综合评价值和应用侧重上不同,综合评价应该分开进行, 混淆在一起是不同定量值交替错误。

出错带来的危害:如在企业的综合评价中,某行业通过样本搜集,可确定出主成分分析、因子分析各自优、良、中、一般的定量值范围,两种方法确定的定量值范围肯定不同,如果混用二种方法,那么就会带来二种方法定量值的误用, 甚至误评,使企业失去公平竞争机会。

在医学诊断、经济竞争力等综合评价问题中也是如此。

检验: 用实际结果、经验和原始数据做聚类分析对综合评价值进行检验。

争议解决:用原始数据做判别分析解决综合评价中的争议。

四、避免出错的方法步骤1.主成分分析法和SPSS软件应用时一对一的正确步骤:①指标的正向化[2]。

②指标数据标准化(SPSS软件自动执行)。

在SPSS中的“分析”中的“描述”功能将“将标准化数据另存为变量”划勾③指标之间的相关性判定: 用SPSS软件中表“Correlation Matrix(相关系数矩阵)”判定。

分析-因子分析-抽样-相关性分析④确定主成分个数m:用SPSS软件中表“Total Variance Explained(总方差解释)”的主成分方差累计贡献率%、结合表“Component Matrix(初始因子载荷阵)”中变量不出现丢失确定主成分个数m。

⑤主成分F i表达式(这是SPSS软件及其教科书中没完善的地方):将SPSS软件中表“Component Matrix”中的第i列向量除以第i个特征根的开根后就得到第i个主成分函数F i的系数(在“transform -->compute”中进行计算,公式为“第i列向量”/sqrt(第i个特征根)),由此写出主成分F i表达式。

用的=检验之。

转化-计算(Fi=∑成分得分系数矩阵中的较大的数乘以相应的标准化的指标)⑥主成分F i命名:用SPSS软件中表“Component Matrix”中的第i列中系数绝对值大的对应变量对F i命名(有时命名清晰性低)。

⑦主成分与综合主成分(评价)值(这是SPSS软件及其教科书中没完善的地方):综合主成分(评价)公式F综= F i(在“transform-->compute”中进行计算[3]), 在SPSS软件中表“Total Variance Explained”下“Initial Eigrnvalues(主成分方差)”栏的“% of Variance(方差率)”中。

Var F综 = =(。

转化-计算(F综合=∑解释总方差的各主成分方差贡献率*Fi)进行检验(对有争议的结果,可用原始数据做判别分析解决争议)。

⑨综合实证分析。

2. 因子分析法和SPSS软件应用时一对一的正确步骤:①∽③步骤同主成分分析步骤。

④确定因子个数m:用SPSS软件中表“Total Variance Explained”特征值累计贡献率%、结合表“Rotated Component Matrix(旋转后因子载荷阵)”中变量不出现丢失确定因子个数m。

⑤求因子载荷矩阵: SPSS软件中表“Rotated Component Matrix”(旋转后的成分矩阵)。

⑥因子Z i的命名:将SPSS软件中表“Rotated Component Matrix”因子载荷矩阵的第i列绝对值大的对应变量归为Z i一类, 并由此对Z i命名(命名清晰性高)。

⑦回归求因子得分函数Zi表达式:SPSS软件中表“Component Score Coefficient Matrix(因子得分系数矩阵)”的第i列向量为第i个因子得分函数Z i的系数,由此写出因子得分函数Z i表达式。

Zi=∑因子得分系数矩阵的*Fi⑧求因子得分值与综合因子得分(评价)值:综合因子得分(评价)公式Z综=Z i (在“transform -->compute”中进行计算),在SPSS 软件中表“Total Variance Explained”下“Rotation Sums of Squared Loadings(一定是旋转后因子对X的方差,此处与主成分分析有很大差别)”栏的“% of Variance”中。

用v i=检验, 通常> v1,Var Z综=(。

(对有争议的结果,可用原始数据做判别分析解决争议)。

⑩综合实证分析。

五、对SPSS软件及其书中的建议①应单列主成分分析这一重要内容。

②通过两种方法与软件相应结果一对一的步骤化, 完善软件研究和教科书的正确编写。

③因子分析中Component(成分)应写为factor(因子)。

④因子分析中将不应有“主成分分析”“主成分”的用词和内容删除。

⑤由于因子分析中旋转后的因子贡献与相关系数矩阵的特征值不等,应将两者区分使用。

⑥笔者对SPSS软件的教科书有一分详细的更正资料,需要者可来涵。

六、应用例子。

2002年16家上市公司4项指标的数据[5]见表2,定量综合赢利能力分析如下:表21. 主成分分析的做法用SPSS 软件输入数据,先对四个指标进行标准化处理,并把标准化后的数据保存在数据编辑窗口中然后利用SPSS 的factor 过程对数据进行主成分分析(指标之间的相关性判定略)。

得出的相关系数矩阵的特征根及方差贡献率见表3,由于前2个主成分贡献率≥85%、结合表4中变量不出现丢失,所以提取的主成分个数m=2。

表3 主成分方差 表4 初始因子载荷阵初始因子载荷阵见表4,表4还不能得出主成分的表达式,还需要把表4中的每列的系数除以其相应的特征根的开根(在表3的“total ”列对应的值比如主成份1的特征值为1.897,主成份2的特征值为1.550,对其求其开根)后才能得到主成分系数向量,于是主成分函数的表达式为:F 1= 0.531zx 1+0.594zx 2+0.261zx 3+0.546zx 4F 2= -0.412zx 1+0.404zx 2+0.720zx 3-0.383zx 4(其中,zx i 为标准化后的数据)表4中每列表示相应主成分与对应变量的相关系数[4],第一主成分F1反映的是销售净利率、资产净利率、销售毛利率的信息,而第二主成分F2则反映的是净资产收益率的信息。

相关文档
最新文档