主成分分析法介绍教学文稿

合集下载

19.主成分分析法

19.主成分分析法一、方法介绍基本思路：主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标，同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来指标的信息。

这种将多个指标化为少数互相无关的综合指标的统计方法叫做主成分分析或称主分量分析。

主成分分析的基本思想就是，设法将原来众多具有一定相关性的指标（比如P 个指标），重新组合成一组新的相互无关的综合指标来代替原来指标。

最经典的方法就是用F 1的方差来表达，即 V ar (F 1)越大，表示F 1包含的信息越多。

理论模型：设有n 个样品，每个样品观测p 项指标（变量）：X 1，X 2，．．．，Ｘp ，得到原始数据资料阵：()111121,,....p P n np x x X X X X x x ⎛⎫⎪== ⎪ ⎪⎝⎭（1）其中，123.....i ii i x x X x ⎛⎫ ⎪⎪= ⎪ ⎪⎝⎭i=1，．．．，p用数据矩阵X 的p 个向量(即p 个指标向量)X 1，．．．，Xp 作线形组合（即综合指标向量）为：11112121212122221122p P p P P P P pP P F a X a X a X F a X a X a X F a X a X a X =+++⎧⎫⎪⎪=+++⎪⎪⎨⎬⎪⎪⎪⎪=+++⎩⎭（2）简写成1122i i i pi P F a X a X a X =+++ i=1，．．．，p （3）（注意：Xi 是n 维向量，所以Fi 也是n 维向量。

）上述方程要求：121i i pi a a a ++= i=1,．．．，p （4）且系数a ij 由下列原则决定：（1）F i 与F j （i ≠j ，i ，j=1，…，p ）不相关；（2）F 1是X 1，．．．，Ｘp 的一切线性组合（系数满足上述方程组）中方差最大的，F 2是与F 1不相关的X 1，．．．，Ｘp 的一切线性组合中方差最大的，…，F p 是与其他都不相关的X 1，．．．，Ｘp 的一切线性组合中方差最大的。

主成分分析法及其应用

主成分分析法及其应用一、本文概述主成分分析法（Principal Component Analysis，简称PCA）是一种广泛应用于数据降维和特征提取的统计方法。

它通过正交变换将原始数据集中的多个变量转换为少数几个互不相关的主成分，这些主成分能够最大程度地保留原始数据集中的信息。

本文旨在全面介绍主成分分析法的基本原理、实现步骤以及在各个领域中的应用案例。

我们将详细阐述主成分分析法的数学基础和算法流程，包括协方差矩阵、特征值、特征向量等关键概念的计算方法。

然后，我们将通过实例演示如何使用主成分分析法进行数据降维和特征提取，以及如何通过可视化工具展示降维后的数据效果。

我们将探讨主成分分析法在机器学习、图像处理、生物信息学、社会科学等多个领域中的实际应用，展示其在数据分析和处理中的重要价值和潜力。

二、主成分分析法的基本原理主成分分析法（Principal Component Analysis，简称PCA）是一种在多个变量中找出主要影响因素，并通过降维技术把多个变量转化为少数几个互不相关的综合变量的统计方法。

这种方法在保持数据信息损失最小的原则下，通过正交变换将原始数据转化为一个新的坐标系统，使得在这个新的坐标系统中，任何数据的最大方差都投影在第一主成分上，第二大的方差都投影在第二主成分上，以此类推。

变量降维：在多数情况下，原始数据集中可能存在多个变量，这些变量之间可能存在相关性。

主成分分析通过构造新的变量（即主成分），这些新变量是原始变量的线性组合，并且新变量之间互不相关，从而将原始的高维数据空间降维到低维空间，实现数据的简化。

方差最大化：主成分分析的另一个重要原理是方差最大化。

这意味着，第一个主成分将捕获数据中的最大方差，第二个主成分捕获第二大方差，以此类推。

通过这种方式，主成分分析能够识别出数据中的主要变化方向和模式。

数据解释性：主成分分析生成的主成分是对原始数据的线性变换，因此，每个主成分都可以被解释为原始变量的某种组合。

主成分分析讲解范文

主成分分析讲解范文下面我们来具体讲解主成分分析的步骤和原理：1.数据预处理在进行主成分分析之前，需要对原始数据进行预处理，包括去除噪声、处理缺失值和标准化等操作。

这些操作可以使得数据更加准确和可靠。

2.计算协方差矩阵协方差矩阵是衡量各个变量之间相关性的指标。

通常，我们会对数据进行标准化处理，使得各个变量具有相同的尺度。

然后，计算标准化后的数据的协方差矩阵。

3.计算特征值和特征向量通过对协方差矩阵进行特征分解，可以得到特征值和特征向量。

其中，特征值表示新坐标系中的投影方差，特征向量表示新坐标系的方向。

4.选择主成分根据特征值的大小，我们可以按照降序的方式选择主成分。

选取一部分较大的特征值所对应的特征向量，即可得到相应的主成分。

这些主成分是原始数据中最重要的成分。

5.生成投影数据通过将原始数据投影到选取的主成分上，即可得到降维后的数据。

每个样本在各个主成分上的投影即为新的特征值。

6.重构数据在需要恢复原始数据时，可以通过将降维后的数据乘以选取的主成分的转置矩阵，再加上原始数据的均值，即可得到近似恢复的原始数据。

主成分分析在实际应用中有很广泛的用途。

首先，它可以用于数据的降维，使得复杂的数据集可以在低维空间中进行可视化和分析。

其次，它可以用于数据的简化和压缩，减少数据存储和计算的成本。

此外，主成分分析还可以用于数据的特征提取和数据预处理，辅助其他机器学习和统计分析方法的应用。

然而，主成分分析也有一些限制和注意事项。

首先，主成分分析假设数据具有线性关系，对于非线性关系的数据可能失效。

其次，主成分分析对于离群值敏感，需要对离群值进行处理。

另外，主成分分析得到的主成分往往是原始数据中的线性组合，不易解释其具体含义。

总之，主成分分析是一种常用的降维数据分析方法，通过寻找新的投影空间，使得数据的方差最大化，实现数据的降维和简化。

它可以应用于数据可视化、数据压缩和特征提取等方面，是数据分析和机器学习中常用的工具之一、在应用主成分分析时，需要注意数据的预处理和对主成分的解释和理解。

主成分分析法介绍.doc

主成分分析方法我们进行系统分析评估或医学上因子分析等时，多变量问题是经常会遇到的。

变量太多，无疑会增加分析问题的难度与复杂性，而且在许多实际问题中，多个变量之间是具有一定的相关关系的。

因此，我们就会很自然地想到，能否在各个变量之间相关关系研究的基础上，用较少的新变量代替原来较多的变量，而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息事实上，这种想法是可以实现的，本节拟介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。

第一节主成分分析方法的原理主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法，从数学角度来看，这是一种降维处理技术。

假定有 n 样本，每个样本共有 p 个变量描述，这样就构成了一个 n×p阶的数据矩阵：x 11 x12 ...x1 px 21 x22 ...x2 pX... ... ... ⋯⋯⋯⋯(1) ...xn1 x n 2 ... x np如何从这么多变量的数据中抓住事物的内在规律性呢要解决这一问题，自然要在 p 维空间中加以考察，这是比较麻烦的。

为了克服这一困难，就需要进行降维处理，即用较少的几个综合指标来代替原来较多的变量指标，而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息，同时它们之间又是彼此独立的。

那么，这些综合指标（即新变量 )应如何选取呢显然，其最简单的形式就是取原来变量指标的线性组合，适当调整组合系数，使新的变量指标之间相互独立且代表性最好。

如果记原来的变量指标为x 1, x 2, xp ，它们的综合指标 —— 新变量指标为 z 1 , z 2 ， z m （ m ≤p)。

则z 1 l 11x 1 l 12 x 2 l 1 p x pz 2l 21x1l 22x2l 2 pxp (2)z m l m1x 1 l m2 x 2l mp x p在（ 2)式中，系数 l ij 由下列原则来决定：（ 1)z i与 z j （ i ≠j；i ，j=1，2，， m)相互无关；（ 2)z 1 是 x 1，x 2，⋯，x p 的一切线性组合中方差最大者；z 2 是与 z 1 不相关的 x 1， x 2，⋯，x p 的所有线性组合中方差最大者；；z m 是与 z 1，z 2，⋯⋯z m-1 都不相关的 x 1，x 2， ⋯， x p 的所有线性组合中方差最大者。

(完整版)主成分分析法的步骤和原理.doc

（一）主成分分析法的基本思想主成分分析（ Principal Component Analysis ）是利用降的思想，将多个量化少数几个合量（即主成分），其中每个主成分都是原始量的性合，各主成分之互不相关，从而些主成分能反映始量的大部分信息，且所含的信息互不重叠。

[2]采用种方法可以克服一的指不能真反映公司的情况的缺点，引多方面的指，但又将复因素几个主成分，使得复得以化，同得到更科学、准确的信息。

（二）主成分分析法代数模型假用 p 个量来描述研究象，分用 X 1， X 2⋯X p 来表示， p 个量构成的 p 随机向量 X=(X 1，X 2⋯X p )t 。

随机向量 X 的均 μ，方差矩 Σ。

X 行性化，考原始量的性合：Z 1=μ11 X 1+μ12 X 2+⋯μ 1p X p Z 2=μ21 X 1+μ22 X 2+⋯μ 2p X p ⋯⋯ ⋯⋯ ⋯⋯Z p =μp1 X 1+μp2 X 2+⋯μ pp X p主成分是不相关的性合 Z 1，Z 2⋯⋯ Z p ，并且 Z 1 是 X 1，X 2 ⋯X p 的性合中方差最大者， Z 2 是与 Z 1 不相关的性合中方差最大者，⋯， Z p 是与 Z 1， Z 2 ⋯⋯ Z p-1 都不相关的性合中方差最大者。

（三）主成分分析法基本步第一步：估本数 n ，取的指数 p ，由估本的原始数据可得矩 X=(x ij ) m ×p ，其中 x ij 表示第 i 家上市公司的第 j 指数据。

第二步：了消除各指之在量化和数量上的差，指数据行准化，得到准化矩（系自生成）。

第三步：根据准化数据矩建立方差矩 R ，是反映准化后的数据之相关关系密切程度的指，越大，明有必要数据行主成分分析。

主成分分析完整版

主成分分析完整版一、主成分分析的原理1.标准化数据：先对原始数据进行标准化处理，以确保不同变量的尺度一致。

2.计算协方差矩阵：对标准化后的数据计算协方差矩阵，矩阵中的元素表示不同变量之间的相关性。

3.计算特征值和特征向量：对协方差矩阵进行特征值分解，得到特征值和对应的特征向量。

4.选择主成分：按照特征值的大小选择最重要的k个特征值和它们对应的特征向量，称之为主成分。

5.数据转换：将原始数据投影到选取的主成分上，得到降维后的数据。

二、主成分分析的方法1.方差解释比：主成分分析通过特征值展示了每个主成分的重要性。

方差解释比是计算每个主成分的方差所占总方差的比例。

选择解释总方差的比例较高的主成分，可以保留更多的信息。

2.累计方差解释比：累计方差解释比是计算前n个主成分的方差解释比之和。

通过选择累计方差解释比较高的主成分，可以保留更多的原始数据信息。

3.维度选择：主成分分析可以通过选择合适的主成分数来实现数据降维。

通过观察特征值的大小和累计方差解释比，可以选择合适的主成分数。

三、主成分分析的应用1.数据可视化：主成分分析可以将高维度的数据转换为低维度的数据，从而方便可视化。

通过在二维或三维空间中绘制主成分，可以更好地理解数据的分布和关系。

2.特征提取：主成分分析可以提取数据中的最重要特征，从而减少数据维度并保留主要信息。

特征提取可以在分类、聚类等问题中提高算法的效果。

3.数据压缩：主成分分析可以将高维度的数据压缩为低维度的数据，从而节省存储空间和计算时间。

压缩后的数据可以用于后续分析和处理。

4.噪音过滤：主成分分析通过保留数据中最重要的特征，可以减少噪音的影响。

通过滤波后的数据可以提高实验测量的准确性和稳定性。

综上所述，主成分分析是一种强大的数据降维技术，可以在许多领域中应用。

熟悉主成分分析的原理、方法和应用，对于理解数据和提升数据分析的能力具有重要意义。

主成分分析法教案

主成分分析法一、主成分分析（principal components analysis ）也称为主分量分析，是由Holtelling 于1933年首先提出的。

主成分分析是利用降维的思想，把多指标转化为少数几个综合指标的多元统计分析方法。

二、应用背景：对同一个体进行多项观察时，必定涉及多个随机变量X1，X2，…，Xp ，它们都是相关的, 一时难以综合。

这时就需要借助主成分分析 (principal component analysis)来概括诸多信息的主要方面。

我们希望有一个或几个较好的综合指标来概括信息，而且希望综合指标互相独立地各代表某一方面的性质。

任何一个度量指标的好坏除了可靠、真实之外，还必须能充分反映个体间的变异。

如果有一项指标，不同个体的取值都大同小异，那么该指标不能用来区分不同的个体。

由这一点来看，一项指标在个体间的变异越大越好。

因此我们把“变异大”作为“好”的标准来寻求综合指标。

例1、考察对象股票业绩（这里单个股票为观察个体）。

（1）确定影响股票业绩主要因素：主营业务收入（X1），主营业务利润（X2）利润总额（X3），净利润（X4），总资产（X5），净资产（X6），净资产收益率（X7），每股权益（X8），每股收益（X9），每股公积金（X10），速动比率（X11）作为变量。

因此对单个股票来说，用11个随机变量综合刻化。

但这些因素过多，各因素区别不明显，有交叉反映。

通过主成分分析，可降为少数几个综合指标加以刻化。

（2）考察20支不同的股票。

从数学角度看，每种影响因素是随机变量（X i ），观察一支股票便得到影响该股票的11个随机变量取值；观察20支股票，便得到了20×11的原始数据阵X20×11（略）。

三、问题：作为主成分？严格的数学定义？相应的性质有哪些？主成分取多少？1、主成分的一般定义设有随机变量X1，X2，…，Xp ，其样本均数记为1X ，2X ，…，p X，样本标准差记为S1，S2，…，Sp 。

主成分分析讲义

主成分分析方法在经济问题的研究中，我们常常会遇到影响此问题的很多变量，这些变量多且又有一定的相关性，因此我们希望从中综合出一些主要的指标，这些指标所包含的信息量又很多。

这些特点，使我们在研究复杂的问题时，容易抓住主要矛盾。

那么怎样找综合指标？主成分分析是将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标的统计方法,也是数学上处理降维的一种方法. 一. 主成分分析法简介主成分分析是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法，又称主分量分析。

在实际问题中，为了全面分析问题，往往提出很多与此有关的变量（或因素），因为每个变量都在不同程度上反映这个课题的某些信息。

但是，在用统计分析方法研究这个多变量的课题时，变量个数太多就会增加课题的复杂性。

人们自然希望变量个数较少而得到的信息较多。

在很多情形，变量之间是有一定的相关关系的，当两个变量之间有一定相关关系时，可以解释为这两个变量反映此课题的信息有一定的重叠。

主成分分析是对于原先提出的所有变量，建立尽可能少的新变量，使得这些新变量是两两不相关的，而且这些新变量在反映问题的信息方面尽可能保持原有的信息。

信息的大小通常用离差平方和或方差来衡量。

主成分分析的基础思想是将数据原来的p 个指标作线性组合,作为新的综合指标(P F F F ,,,21 )。

其中1F 是“信息最多”的指标，即原指标所有线性组合中使)var(1F 最大的组合对应的指标，称为第一主成分；2F 为除1F 外信息最多的指标，即0),cov(21 F F 且)var(2F 最大，称为第二主成分；依次类推。

易知P F F F ,,,21 互不相关且方差递减。

实际处理中一般只选取前几个最大的主成分（总贡献率达到85%），达到了降维的目的。

主成分分析是一种进行信息压缩的方法。

通过这种方法，可以将原来相关的若干变量，变换成不相关的变量。

二.求主成分方法步骤：（1）对样本数据的标准化设有n个样品，P个指标，得到的原始资料矩阵为了实现样本数据的标准化，应求样本数据的平均和方差。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

主成分分析法介绍主成分分析方法我们进行系统分析评估或医学上因子分析等时，多变量问题是经常会遇到的。

变量太多，无疑会增加分析问题的难度与复杂性，而且在许多实际问题中，多个变量之间是具有一定的相关关系的。

因此，我们就会很自然地想到，能否在各个变量之间相关关系研究的基础上，用较少的新变量代替原来较多的变量，而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息？事实上，这种想法是可以实现的，本节拟介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。

第一节主成分分析方法的原理主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法，从数学角度来看，这是一种降维处理技术。

假定有n 样本，每个样本共有p 个变量描述，这样就构成了一个n×p 阶的数据矩阵：111212122212.....................p p n n np x x x x x x X x x x ⎛⎫⎪⎪= ⎪ ⎪⎪⎝⎭ (1)如何从这么多变量的数据中抓住事物的内在规律性呢？要解决这一问题，自然要在p 维空间中加以考察，这是比较麻烦的。

那么，这些综合指标（即新变量)应如何选取呢？显然，其最简单的形式就是取原来变量指标的线性组合，适当调整组合系数，使新的变量指标之间相互独立且代表性最好。

如果记原来的变量指标为p x x x ,,21 ，它们的综合指标——新变量指标为 21,z z ，m z （m≤p)。

则)2.........(..........22112222121212121111⎪⎪⎩⎪⎪⎨⎧+++=+++=+++=p mp m m m pp p p x l x l x l z x l x l x l z x l x l x l z在（2)式中，系数l ij 由下列原则来决定：（1)z i 与z j （i≠j；i ，j=1，2，…，m)相互无关；（2)z 1是x 1，x 2，…，x p 的一切线性组合中方差最大者；z 2是与z 1不相关的x 1，x 2，…，x p 的所有线性组合中方差最大者；……；z m 是与z 1，z 2，……z m-1都不相关的x 1，x 2，…，x p 的所有线性组合中方差最大者。

且（2）式要求：22212....1i i ip l l l +++=这样决定的新变量指标z 1，z 2，…，z m 分别称为原变量指标x 1，x 2，…，x p 的第一，第二，…，第m 主成分。

其中，z 1在总方差中占的比例最大，z 2，z 3，…，z m 的方差依次递减。

在实际问题的分析中，常挑选前几个最大的主成分，这样既减少了变量的数目，又抓住了主要矛盾，简化了变量之间的关系。

从以上分析可以看出，找主成分就是确定原来变量x j （j=1，2，…，p)在诸主成分z i （i=1，2，…，m)上的载荷l ij （i=1，2，…，m ；j=1，2，…，p)。

同时，12(,,....,)i i ip l l l 不是别的，而恰好是x 1，x 2，…，x p 的相关矩阵的特征值所对应的特征向量。

且z 1方差取到最大就是x 1，x 2，…，x p 相关矩阵在第一个特征值所对应特征向量处达到。

z m 方差取到最大就是x 1，x 2，…，x p 相关矩阵在第m 个特征值所对应特征向量处达到。

第二节主成分分析的解法主成分分析的计算步骤通过上述主成分分析的基本原理的介绍，我们可以把主成分分析计算步骤归纳如下：（1)计算相关系数矩阵⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=PP P P P P r r r r r r r r r R 212222111211........................... ………(3) 在公式（3)中，ij r （i ，j=1，2，…，p)为原来变量i x 与j x 的相关系数，其计算公式为∑∑∑-------=nk nk j kj i kink j kj i kiij x x x xx x x xr 11221)()())(( (4)因为R 是实对称矩阵（即r ij =r ji )，所以只需计算其上三角元素或下三角元素即可。

（2)计算特征值与特征向量首先解特征方程｜λI -R ｜=0求出特征值λi （i=1，2，…，p)，并使其按大小顺序排列，即λ1≥λ2≥…，≥λp ≥0；然后分别求出对应于特征值λi 的特征向量e i （i=1，2，…，p)。

（3)计算主成分贡献率及累计贡献率∑∑∑---=pk kmk kpk k i i p i r z 111),,,2,1(/γγγ累计贡献率：贡献率：主成分。

一般取累计贡献率达85-95％的特征值m λλλ ,,21，所对应的第一，第二，……，第m （m ≤p)个主成分。

（4)计算主成分得分矩阵由此可以进一步计算主成分得分矩阵：Z=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡nm n n m m l l l l l l l l l 212222111211............ （5）进一步还可以根据式：⎪⎪⎩⎪⎪⎨⎧+++=+++=+++=p mp m m m p p p p x l x l x l z x l x l x l z x l x l x l z 22112222121212121111计算各主成分得分：11...j j jp pZ l X l X=++（6）和总得分：1212...mj m m m mi i ii i iy z z zλλλλλλ=+++∑∑∑（7）主成分分析应用实例实证研究1本文是对实施西部大开发以来的经济增长状况作实证研究,把西部地区10个省（自治区、直辖市）的经济增长状况作为研究对象集,即={ 重庆，四川，贵州，云南，西藏，陕西，甘肃，青海，宁夏，新疆}选取17个经济指标值：即：地区生产总值、财政收入、固定资产投资、城市用水普及率、城市燃气普及率、每万人拥有交通公共车辆、人均城市道路面积、普通高等学校数、每千人医疗卫生机构床位数、居民收入与消费指标等17个经济指标。

进行主成分分析：西部地区2011横向因子分析解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 % 累积 % 合计方差的 % 累积 % 合计方差的 % 累积 % 1 7.302 42.951 42.951 7.302 42.951 42.951 6.515 38.321 38.321 2 4.576 26.916 69.867 4.576 26.916 69.867 3.782 22.249 60.570 32.13012.52782.3942.13012.52782.3943.71021.82482.394主成分载荷量表：西部地区2011年横向主成分1f2f3f.173 -.070 .045 -.019 .186 .110 .151 -.012 .002 .172 -.064 .041 -.012 -.042 .240 .028 .085 .199 .091 -.136 .294 -.041 .100 .093 .163 -.071 .016 .037 -.073 .258 -.022 .261 -.021 -.003 .232 -.140 -.098 .330 -.115 .066 .056 .050 .138 -.021 -.015 .152 -.005 .034 .086.025.006主成分得分函数：12011,12001,22011,32011,42011,52011,62011,72011,82011,92011,102011,112011,122011,132011,1420110.1730.0190.1510.172v 0.0120.0280.0910.0410.1630.0370.0220.0030.0980.0660.138f v v v v v v v v v v v v v v =-++-++-++---++,152011,162011,1722011,12001,22011,32011,42011,52011,62011,72011,82011,92011,102011,112011,122010.1520.0860.0700.1860.0120.064v 0.0420.0850.1360.10.0710.0730.2610.2320.33v v f v vv v v v v v v v v v ++=-+---+-+--+++1,132011,142011,152011,162011,1732011,12001,22011,32011,42011,52011,62011,72011,82011,92011,10200.0560.0210.0050.0250.0450.110.0020.041v 0.240.1990.2940.0930.0160.2580.021v v v v f v vv v v v v v v v +--+=+++++++++-11,112011,122011,132011,142011,152011,162011,170.140.1550.050.0150.0340.006v v v v v v ⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪--+-++⎩各地区主成分得分表：因子得分1f因子得分2f因子得分3f因子综合得分2011,i y排名重庆 3.6449 0.9609 0.2711 2.0033 3 四川 6.5026 0.2998 0.3145 3.1520 1 贵州 1.8152 0.6392 0.0258 1.0119 5 云南1.76720.78210.14281.05874西藏0.0361 0.8579 -0.0085 0.2434 10 陕西 3.6385 0.8769 0.4434 2.0230 2 甘肃 1.4814 0.7016 0.0619 0.8846 7 青海0.3321 1.0881 0.1317 0.4776 9 宁夏0.7464 1.2218 0.2191 0.7267 8 新疆 1.4230 0.9765 0.2779 0.9877 6 第一类主成分：经济实力、社会基础以及对外开程度是影响经济增长的主要因素(地区生产总值、财政收入、固定资产投资、普通高校数、客运量和货运量等)第二类主成分：居民消费水平、城镇居民人均可支配收入、人均公园绿地面积、人均生产总值。

第三类主成分有：城市用水普及率、城市燃气普及率、每万人拥有交通公共车辆数、每千人医疗卫生机构床位数等。