主成分分析法在排序中的应用
统计学中的主成分分析

统计学中的主成分分析主成分分析(Principal Component Analysis, PCA)是一种多变量分析方法,用于降维和数据可视化。
它通过将原始数据转换为新的坐标系,使得转换后的数据能够保留原始数据的主要变化趋势,并且可以按照重要性进行排序。
在本文中,将介绍主成分分析的原理、应用场景和步骤。
一、主成分分析原理主成分分析的核心是寻找数据中的主要变化趋势,即找到数据中的主成分。
主成分是数据最大方差方向上的投影,也即是能够解释数据中最大不同的变量。
对于一个具有p个变量的数据集,主成分分析可以得到p个主成分,按照重要性递减排序。
通过选择适当数量的主成分,可以实现对数据的降维和可视化。
主成分分析的计算过程可以通过特征值分解或奇异值分解来实现。
特征值分解会得到数据的特征向量和特征值,而奇异值分解则可以直接得到主成分。
在实际应用中,奇异值分解是更常用的方法。
二、主成分分析的应用场景主成分分析广泛应用于各个领域,包括金融、生物学、社会科学等。
下面将介绍主成分分析在这些领域的具体应用。
1. 金融:主成分分析常用于资产组合管理和风险管理。
通过将各种金融数据进行主成分分析,可以获得具有代表性的主成分,从而有效降低资产组合的维度,减少投资组合中的相关风险。
2. 生物学:主成分分析可以应用于基因表达数据的分析。
通过主成分分析,可以从大量的基因表达数据中提取出基因表达的主要变化趋势,帮助研究人员理解基因与表型之间的关系。
3. 社会科学:主成分分析可以用于社会调查数据的分析。
通过对调查数据进行主成分分析,可以发现不同变量之间的相关性,进而揭示不同因素对于社会问题的影响程度。
三、主成分分析的步骤主成分分析的步骤通常包括以下几个步骤:1. 数据标准化:对原始数据进行标准化处理,将不同量级的变量转化为标准差为1的变量。
这一步骤是为了消除变量间的量纲差异。
2. 计算协方差矩阵:根据标准化后的数据计算协方差矩阵,用于度量变量之间的相关性。
主成分分析方法综述

主成分分析方法综述
赵蔷
【期刊名称】《软件工程》
【年(卷),期】2016(019)006
【摘要】主成分分析是一种非常有效的数据分析处理的技术,具有非常广泛的应用前景。
本文首先概述了主成分分析方法,然后介绍了PCA的定义、模型、算法及选取主成分个数的标准,对PCA技术的优势和缺陷分别进行了剖析和总结,对PCA在评价排序、特征提取、模式识别、图像处理、图像分类和图像压缩等领域的实际应用进行了讨论,对主成分分析方法的发展趋势和应用前景做了展望。
【总页数】3页(P1-3)
【作者】赵蔷
【作者单位】咸阳师范学院计算机学院,陕西咸阳712000
【正文语种】中文
【中图分类】TP391
【相关文献】
1.主成分分析方法综述
2.环境质量评价中的主成分分析与全局主成分分析方法
3.主成分分析方法在遥感数字图像处理中的应用综述
4.鲁棒主成分分析模型综述
5.鲁棒性主成分分析算法综述
因版权原因,仅展示原文概要,查看原文内容请购买。
主成分分析

引言:主成分分析也称主分量分析,是由霍特林于1933 年首先提出的。
主成分分析是利用降维的思想,在损失很少信息的前提下,把多个指标转化为几个综合指标的多元统计方法。
通常把转化生成的综合指标称为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能。
这样在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息,从而更容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时使得问题得到简化,提高分析效率。
本文用主成分分析的方法对某市14 家企业的经济效益进行分析。
[1] 在处理涉及多个指标问题的时候,为了提高分析的效率可以不直接对p 个指标构成的P维随机向量X=(X1, X2, X3, , Xp)进行分析,而是先对向量x进行线性变换,形成少数几个新的综合变量,使得个综合变量之间相互独立且能解释原始变量尽可能多的信息,这样在意损失很少部分信息为代价的前提下,达到简化数据结构,提高分析效率的目的。
主成分的基本思想就是在保留原始变量尽可能多的前提下达到降维的目的,从而简化问题的复杂性并抓住问题的主要矛盾。
而这里对于随机变量X1,X2,X3,……,Xp而言,其协方差矩阵或相关矩阵正是对各变量离散程度与变量之间的相关程度的信息的反映,而相关矩阵不过是将原始变量标准化后的协方差矩阵我们所说的保留原始变量尽可能多的信息,也就是指生成的较少的综合变量 (主成分)的方差和尽可能接近原始变量方差的总和。
因此在实际求解主成分的时候,总是从原始变量的协方差矩阵或相关矩阵的结构分析入手。
一般来说从原始变量的协方差矩阵出发求得的主成分与从原始变量的相关矩阵出发求得的主成分是不同的本文我们用从原始变量的相关矩阵出发求得的主成分进行分析。
[5]一、材料与方法1.1数据材料表1 14 家企业的利润指标的统计数据1.2分析方法本文采用多元统计学方法,选取14家企业作为样本收集每家企业的8个不同的利润指标,利用spss统计软件做主成分分析,给出载荷阵,并通过载荷阵给出主成分系数表,写出主成分表达式以此给出14个企业的得分值,最后根据主成分构造一个综合性评价指标,对14个企业进行综合排名。
主成分分析法及其应用

主成分分析法及其应用一、本文概述主成分分析法(Principal Component Analysis,简称PCA)是一种广泛应用于数据降维和特征提取的统计方法。
它通过正交变换将原始数据集中的多个变量转换为少数几个互不相关的主成分,这些主成分能够最大程度地保留原始数据集中的信息。
本文旨在全面介绍主成分分析法的基本原理、实现步骤以及在各个领域中的应用案例。
我们将详细阐述主成分分析法的数学基础和算法流程,包括协方差矩阵、特征值、特征向量等关键概念的计算方法。
然后,我们将通过实例演示如何使用主成分分析法进行数据降维和特征提取,以及如何通过可视化工具展示降维后的数据效果。
我们将探讨主成分分析法在机器学习、图像处理、生物信息学、社会科学等多个领域中的实际应用,展示其在数据分析和处理中的重要价值和潜力。
二、主成分分析法的基本原理主成分分析法(Principal Component Analysis,简称PCA)是一种在多个变量中找出主要影响因素,并通过降维技术把多个变量转化为少数几个互不相关的综合变量的统计方法。
这种方法在保持数据信息损失最小的原则下,通过正交变换将原始数据转化为一个新的坐标系统,使得在这个新的坐标系统中,任何数据的最大方差都投影在第一主成分上,第二大的方差都投影在第二主成分上,以此类推。
变量降维:在多数情况下,原始数据集中可能存在多个变量,这些变量之间可能存在相关性。
主成分分析通过构造新的变量(即主成分),这些新变量是原始变量的线性组合,并且新变量之间互不相关,从而将原始的高维数据空间降维到低维空间,实现数据的简化。
方差最大化:主成分分析的另一个重要原理是方差最大化。
这意味着,第一个主成分将捕获数据中的最大方差,第二个主成分捕获第二大方差,以此类推。
通过这种方式,主成分分析能够识别出数据中的主要变化方向和模式。
数据解释性:主成分分析生成的主成分是对原始数据的线性变换,因此,每个主成分都可以被解释为原始变量的某种组合。
主成分分析法原理及应用

主成分分析法原理及应用主成分分析的基本思想是将高维数据转化为一个新的低维坐标系,新的坐标系由特征向量构成。
特征向量是通过对数据矩阵进行特征值分解得到的,每一个特征向量都代表数据的一个主成分,同时也代表了原始数据在该主成分上的投影。
通过选择前N个主成分,可以将原始数据的维度从D维降低到N维。
1.对原始数据进行标准化处理,即将每个维度上的数据减去其均值并除以标准差;2.构建数据的协方差矩阵;3.对协方差矩阵进行特征值分解,得到特征向量和特征值;4.将特征值按降序排列,选择前N个特征向量作为主成分。
1.数据降维:主成分分析可以将高维数据降低到低维空间中,从而减少数据的维度。
这对于处理高维数据而言非常重要,可以减少计算复杂度,并且有助于解决维度灾难问题。
2.特征提取:主成分分析可以通过选择前N个主成分来提取最具代表性的特征。
这对于处理大规模数据集、挖掘数据的基本模式和结构非常有用。
3.数据可视化:主成分分析可以将多维数据映射到二维或三维的空间中。
这样做可以简化数据的可视化和分析过程,帮助人们更好地理解数据的结构和关系。
4.噪声过滤:主成分分析可以通过去除数据的主成分中的低方差部分来剔除数据中的噪声。
这对于提高数据质量和预测性能非常有帮助。
5.数据预处理:主成分分析可以用于数据的预处理,比如去除冗余特征、去除缺失值等。
通过去除无关和缺失的特征,可以提高后续分析的准确性和效率。
总之,主成分分析是一种非常实用的数据分析技术。
它可以帮助人们更好地理解数据的结构和关系,并从中提取有用的信息。
在实际应用中,人们可以根据具体的需求和问题选择适当的主成分数目,以获得最佳的结果。
主成分分析法在我国居民生活质量状况_多元统计分析报告

《多元统计分析》课程设计报告学生:峰学号:090090鹤090 学院: 理学院班级: 数学0题目: 主成分分析法在我国居民生活质量状况综合评价中的应用指导教师:辰职称: 教授红讲师2012 年 12 月 7 日一、问题分析1.1 问题及背景人均GDP达到1000美元,标志着我国居民生活水平迈上了一个新台阶,我国经济步入了一个崭新的发展时期。
然而,我国地域辽阔,人口众多,地区间经济发展很不平衡,城乡差距明显,经济发展的非均衡性已经严重威胁到我国经济的持续、健康发展。
若不妥善处理,将会成为制约我国经济发展的瓶颈因素。
事实上,东、中、西部地区的经济发展差距已是众所周知,并引起中央政府和有关部门的广泛重视。
但在地区间经济发展差距的背后,东、中、西部地区居民的生活质量究竟存在着多大的差距却鲜为人知。
随着生产力水平的不断提高,我国居民生活水平不断提高,生活质量也在不断改善。
但是,受各地生产力发展水平不平衡的影响,我国各地居民的生活质量也表现为不平衡。
利用主成分分析法对我国31个省市、自治区居民的生活状况进行评价分析。
为全面分析各地居民生活状况,可选取如下指标体系进行反应:职工人均工资、人均居住面积、城市人均用水普及量、城市煤气普及量、人均拥有道路面积、人均绿地公共面积、批发零售贸易商品销售总额、旅游外汇收入。
对我国居民生活质量问题的研究不仅是社会经济发展的客观要求,也是我国全面建设小康社会的迫切需要城市居民生活质量的评价体系,是依据中国城市居民生活的特征,并参阅国外生活质量评价研究的大量成果后构建的,集中体现了研究者的专业知识和对生活质量评价体系的理论构思,具有主观色彩,因此,有必要对理论遴选的评价指标进行隶属度分析、相关分析和辨别力分析等实证筛选,以增强评价指标的科学性、合理性和可操作性。
1.2 数据图1数据来源:《中国统计年鉴2009》二、主成分分析方法基本原理2.1 主成分分析定义主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
主成分分析法在学生成绩分析中的应用

主成分分析法在学生成绩分析中的应用摘要:本文采用主成分方法研究了学校实行的学分绩的合理性,还给出了学科成绩方面的分析,并且发现一年级的排序和二、三年级的排序的成绩显著相关,说明一年级的成绩对后面的成绩有影响,对教学管理有一定指导意义。
关键词:平均学分绩 第一主成分法 学生成绩 学年如何科学地、可观地、全面地评价学生的综合成绩对学生和学校都特别重要。
目前,大多数院校统计学生综合成绩的普遍做法是学分绩,这种方法能够体现学时多,即学分高的课程的重要性,但各门课程给定的学分数是否合理,学分绩是否能全面反应原始数据的主要信息?我们知道主成分运用少数几个无关的指标来代替原来众多的相关指标,能全面地反应映原变量的信息量,用主成分得到的成绩排序来看学分绩的得到的学生成绩是否合理。
我们可以用学分绩和主成分两种方法研究一年级学生成绩排序和后续学年的排序是否相关?1.研究对象本文以天津工业大学电信专业05级99名为例,以三个学年成绩作为样本将每学年的各科成绩作为变量,以三学年成绩排序为研究对象,数据由天津工业大学教务科提供。
2.评价学生综合成绩的模型2.1平均学分绩模型天津工业大学实施以学分绩对学生进行学业评价的制度,每位学生的学分绩是按照下面的公式算出:(总和的)百分制成绩×学分÷总学分。
2.2主成分分析模型下面是主成分分析的步骤:设有n 个样本,每个样本有m 个数据,记为:11121213m m n m x x x a x x x ⎛⎫ ⎪= ⎪ ⎪⎝⎭=(12,,...,m x x x ) (1) 对x 的列进行标准化变换: *()/ij ij j j x x x σ=- i=1,2,…,n;j=1,2,…,m其中111m 22*212m 1n13m x x 11,(),x x=x x x x n j ij j ij J i X X x X n n σ=⎛⎫ ⎪==- ⎪ ⎪⎝⎭∑得到标准化矩阵,仍记为 i i1i2x =x x ,1,...,T in i n =(,,...,x ) (2) 用计算机计算指标变量的相关系数矩阵: 111'21211m m n nm r r R r r x x n r r ⎛⎫ ⎪== ⎪ ⎪⎝⎭,其中11n ij ij ik r X X n =∑ j ,k=1,2,…,m (3) 用相关系数矩阵计算R 的特征值i λ。
主成分分析和因子分析方法在省域区域社会发展状况排序中的应用

主成分分析和因子分析方法在省域区域社会发展状况排序中的应用刘彦慧【摘要】本文通过分析2012年全国31个地区的社会发展状况的截面数据,针对我国各省域社会发展的现状特点,利用主成份分析和因子分析方法,简化多维数据,把复杂的数据用较少9项综合指标来表达,达到降维和分类的优越效果.对我国各省城社会发展的现状特点进行了统计分析,得到客观的评价结果.【期刊名称】《价值工程》【年(卷),期】2015(034)036【总页数】4页(P20-23)【关键词】主成分分析;因子分析;社会发展;因子旋转【作者】刘彦慧【作者单位】黑龙江科技大学,哈尔滨150022【正文语种】中文【中图分类】F812.42当今社会经济增长的状况和社会发展的状况是密切相关的,2012年我国采用层次多、覆盖面涉及广的指标体系对全国31个地区省域区域的社会发展状况进行分析,因为纳入的指标繁多,使得分析过程十分繁杂。
如果能降低指标的维数,会大大减小分析的难度。
主成分分析和因子分析是多元统计分析中常用的两种处理降维的统计方法,在力保数据信息损失最少的原则下,把多个指标转化为少数几个综合指标的一种对多变量数据进行最佳综合简化的多元统计方法。
主成分是原始变量的线性组合,保留主要信息量的原则充分反映原指标的信息。
本文力图针对我国各省域社会发展的现状特点,突破以往的传统分析方法,利用主成份分析和因子分析方法,简化多维数据,把复杂的数据用较少9项综合指标来表达,达到降维和分类的目标。
同时对我国各省域社会发展的现状进行了统计分析,并得到客观的评价结果,从而使评价方法更具有优越性。
①主成分分析和因子分析是多元统计分析中常用的两种处理降维的统计方法。
方法客观,评价结果正确。
主成分分析是利用降维的思想,在力保数据信息损失最少的原则下,把多个指标转化为少数几个综合指标的一种对多变量数据进行最佳综合简化的多元统计方法。
也就是说,将原来的高维空间的问题转化为低维空间来处理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ui ,
重复多次可得出P个特征向量,构成矩阵U
5 求排序坐标矩阵Y 6 求属性的负荷量
lij
Y UX
U11 U12 U U 22 U 21 U P1 U P2
U 1P U 2P U PP
Lij j U ji (i, j 1,2, P)
排序结果
排序的结果一般用直观的排序图表示, 排序图通常只能表现出三维坐标。 降低维数往往会损失信息 排序的一个重要内容就是降低维数,减少 坐标轴的数目
二维排序图 一个好的排序方法应该是由降低维数引起的 信息损失尽量少,即发生最小的畸变,也就 是说它的低维排序轴包含大量的生态信息。
一维排序图
三维排序图
是第i个属性(种)对第j个主分量的负荷量。 矩阵表示:
L lij
例子
假定调查得到6个样方两个种的数据,得原始数据矩阵Z为
5 6 4 6 0 3 Z 11 8 7 6 2 2
第一步,数据中心化得
1 5 2 2 1 2 0 2 - 4 - 1 0 1 26 29 S XX T 2 0 29 62 5 2 1 0 - 4 - 4 - 4 - 4 - 1 - 4
主成分分析法在植被排序 中的应用
Contents
排序的概述 主分量分析
典范主分量分析
主坐标分析
排序方法的比较
排序的概述
排序最初的概念是指植 被样方在某一空间(一 维或多维)的排列,这 里的空间指植物种空间 或环境因素空间。它是 随着“植被连续体”概 念的提出而诞生的。
50年代,许多学者强调植被的连续性,认为分类 是确定植被间断性的有效方法,但不能用于解释 植被的连续性,因此,对排序方法才开始研究而 得以发展。当时的排序是用于分析群落 之间的连续分布关系。
3 主坐标分析
• 主坐标分析(principal coordinates analysis, PCOA)在外文文献中也有叫做principal axes analysis(PAA)的,它是Gower(1966,1967) 建立的排序方法。
• PCoA的计算原理与PCA相同,只是不像PCA只 用欧氏距离计算点间距离,它可以用各种距离系 数。所以,PCoA实际上是PCA的普通化。这一 改进是有益的,并在一些研究中表现出优越性。
29 U11 0 26 - 78.13 S I U 1 29 62 - 78.13 U12 0 29 U 21 0 26 - 9.87 S I U 2 29 62 - 9.87 U 22 0
排序结果用图形表示,得6个样方的PCA排序图: 5 3 2 4 1
6
• PCA是首次在低维空间排列样方而包含了 大多数数据信息的多元排序方法,受到不 少学者的喜爱,它在排序方法发展的过程 中有着重要的地位。 • PCA的最大缺点是它的线性模型,一般认 为,线性模型不能很好的反映植物种、植 被与环境间的关系,因此PCA结果的解释 较为困难而且带有较大的主观性。
* 新得到的值就是结合了环境因子的排序值,记作 y j 。
5)对样方排序值进行利差标准化
*'
y *' y * /S j j
式中, y j 为标准化后的值;S为离差,
S y* j
j 1
N
6)回到第2)步,重新计算种类排序新值,重复迭代,直到两次迭代结果基本 一致,这样就得到CPCA的第一排序轴,含种类第一排序轴和样方第一排序轴。 7)求第二排序轴。与第一排序轴一样,先进行1-4)步。接下来对样方排序 值进行正交化。 计算正交化系数v
1)任意选一组样方排序初始值 y j ,不应全部为0 ( j 1,2,, N为样方数) 2)计算种类排序值
mk
mk xkj y j
j 1
' 3)计算新的样方排序值 y j
N
( k 1,2, , P )
y
' j
x
k 1
P
kj
mk
4)以多元线性回归求各环境因子的回归系数 (b b0 , b1 , , bq ) , 这是普通回归分析。然后用 y j b0 b1 z1 j b2 z2 j bq zqj 求样方排序值,
4 求特征根所对应的特征向量
根据S矩阵的特征方程,第i个特征根和第i个特征向量有如下关系:
( S11 i ) S S I U i 21 S P1
解方程可以得到特征向量
U1i 0 ( S 22 i ) S 2 P U 2i 0 SP2 ( S PP i ) U Pi 0 S12 S1P
U 21 U 22 1
2 2
-52.13 29
0.486 特征向量矩阵 U - 0.875
0.87 0.486
第五步,求排序坐标
0.87 1 2 0 2 - 4 - 1 0.486 Y UX - 0.875 0.486 5 2 1 0 - 4 - 4 2.72 0.87 0.97 - 5.44 - 3.98 4.86 1.55 - 0.78 0.49 - 1.75 1.56 - 1.07
到50年代后期,排序概念已趋于完 善,其不仅排列样方,也可以排列 植物种及环境因素,用于研究群落 之间、群落与成员之间、群样方或植物种排列在一定的空间,使得排 序轴能够反映一定的生态梯度,从而能够解释植被或植物 种的分布与环境因子间的关系,也就是说排序是为了揭示 植被-环境间的生态关系。
y j b0 b1 z1 j b2 z2 j bq zqj
b0
为截距; 为第i个环境因子的回 b
i
式中, 为第j个样方的排序值; y
j
归系数( i 1,2,, q为环境因子的数目)可以用多元线性回归求得; z ij 为第i个环境因子观测值。
用迭代过程进行CPCA计算 首先对原始数据进行中心化,将中心化后的种类数据矩阵记为 X xij
展开两个联立方程
- 52.13U 11 29U 12 0 29U 11 16 .13U 12 0
16.13U 21 29U 22 0 29U 21 52 .13U 22 0
U11 U12 1
2 2
再依正交矩阵的特点
U 21 U 22
U11
U12
29 52.13
• 因此,排序也叫梯度分析(gradient analysis)。
• 简单的梯度分析是研究植物种和植物群落在某一环境梯度 或群落线(coenocline)上的变化,也就是一维排序。
• 复杂的梯度分析是揭示植物种和群落在某些环境梯度(群 落面coenoplane或群落体coenocube)上的变化,这相 当于二维或多维排序。
S12 S1P ( S11 ) S ( S 22 ) S2 P 21 0 根据S矩阵的特征方程 S I S P1 SP2 ( S PP ) 求得P个特征根,并依大小排列:
1 2 P
PCA的分析过程
1 标准化
种中心化:
样方中心化:
X ij Zij - zi (i 1,2,, P)(种数)
X ij Zij - z j ( j 1,2,, N )(样方数)
_
_
中心化后的数据矩阵为: X xij
2 计算属性间内积矩阵S 3 求内积矩阵S的特征根
S XX T
而成为方法的组成部分;
所有排序方法对二元数据和数量数据都适合,没有特殊要求。 分类方法有的只能使用二元数据。
种类环境关系模型 所有排序方法都是基于一定的模型之上,这种模型反映植物种和环境之间的关
系以及在某一环境梯度上的种间关系。最常用的关系模型有两种: 直线线性关系 线性模型 关 系 模 型 非线性模型
2
典范主分量分析
为了更好地研究环境因子对群落的作用,将主分量分析与环境因子结合起来, 就形成了典范主分量分析(CPCA)。由于它结合了环境矩阵,能够更好地 反映群落与环境间的生态关系。 CPCA是PCA与多元回归的结合,其结合方式为:在PCA分析的每一步 都与环境因子进行回归,再将回归系数结合到下一步排序值的计算之中。 与环境因子的结合方式:
梯度分析
直接梯度分析
间接梯度分析
同时使用植物种的 组成数据和环境因子组成 数据的排序
只使用植物种的组成 数据的排序
直接梯度分析因为使用了环境因子组成 数据,排列轴的生态意义往往是一目 了然的,在结果解释上比较容易。
间接梯度分析完成后,研究者需要通过 再分析找出排列轴的生态意义,再用其 解释植物群落或植物种在排序图上的分布
第二步,计算内积矩阵S
1 2 0 2 - 4 - 1 X 5 2 1 0 - 4 - 4
第三步,求S的特征根
26 - S I 29
29 2 88 771 0 62 -
得
1 78.13 , 2 9.78
第四步,求S的特征向量
基于线性模型上所建立的排序方法
线性排序 (以主分量分析(PCA)为主)
曲线线性关系
二次曲线模型(高斯模型或高斯曲线)
非线性排序 (以对应分析(CA)为主)
1
主分量分析
主分量分析(PCA)也叫做主成分分析,它是1954年由 Goodall引入植被分析,但该方法的数学分析早在1933年 Hotelling就已开始使用。 PCA是第一个完全基于植被结构或组成数据之上而不须要 考虑环境梯度、不须要选择端点和权重的排序方法。 Goodall(1954)当时称PCA为因子分析,但现在已明确 了分量和因子的区别,主分量分析的名称早已被公认了。 PCA不需要主观选择端点、权重等,因此其结果更接近实 际。 但PCA计算复杂,必须使用计算机才能完成,致使PCA直 到20世纪60年代后期才被大量应用,从那时起到80年代 中期,PCA一直是较普遍使用的方法。