主成分分析法介绍.doc
主成分分析法全

• 如果我们将xl 轴和x2轴先平移,再同时 按逆时针方向旋转角度,得到新坐标轴Fl和 F2。Fl和F2是两个新变量。
根据旋转变换的公式:
y y1 1 x1xc1soin sx2 xs2cio ns
y y 1 2 cs o in sc si o n s x x 1 2 U x
设有P维正交向量 a1 a11, a21,, ap1
F1 a11X1 L ap1X p aX
1
V
(F1)
a1a1
a1U
2
Ua1
p
1
a1
u1
,
u2
,L,
up
2
O
u1
u2 M
a1
p
up
p
iauiuia i1
p
i (aui )2 i1
1ip1(aui )2
1)贡献率:第i个主成分的方差在全部方差中所占
比重
i
p
i 1
i
,称为贡献率
,反映了原来P个指标多大
的信息,有多大的综合能力 。
2)累积贡献率:前k个主成分共有多大的综合能力, 用这k个主成分的方差和在全部方差中所占比重
k
p
i i
i1
i1
来描述,称为累积贡献率。
我们进行主成分分析的目的之一是希望用尽可能 少的主成分F1,F2,…,Fk(k≤p)代替原来的P个指 标。到底应该选择多少个主成分,在实际工作中,主 成分个数的多少取决于能够反映原来变量80%以上的信 息量为依据,即当累积贡献率≥80%时的主成分的个数 就足够了。最常见的情况是主成分为2到3个。
F 1
主 成
F2
•• • • •
分 分 析 的 几 何
19.主成分分析法

19.主成分分析法一、方法介绍 基本思路:主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标,同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来指标的信息。
这种将多个指标化为少数互相无关的综合指标的统计方法叫做主成分分析或称主分量分析。
主成分分析的基本思想就是,设法将原来众多具有一定相关性的指标(比如P 个指标),重新组合成一组新的相互无关的综合指标来代替原来指标。
最经典的方法就是用F 1的方差来表达,即 V ar (F 1)越大,表示F 1包含的信息越多。
理论模型:设有n 个样品,每个样品观测p 项指标(变量):X 1,X 2,...,Xp ,得到原始数据资料阵:()111121,,....p P n np x x X X X X x x ⎛⎫⎪== ⎪ ⎪⎝⎭(1)其中,123.....i ii i x x X x ⎛⎫ ⎪⎪= ⎪ ⎪⎝⎭i=1,...,p用数据矩阵X 的p 个向量(即p 个指标向量)X 1,...,Xp 作线形组合(即综合指标向量)为:11112121212122221122p P p P P P P pP P F a X a X a X F a X a X a X F a X a X a X =+++⎧⎫⎪⎪=+++⎪⎪⎨⎬⎪⎪⎪⎪=+++⎩⎭(2)简写成1122i i i pi P F a X a X a X =+++ i=1,...,p (3)(注意:Xi 是n 维向量,所以Fi 也是n 维向量。
) 上述方程要求:121i i pi a a a ++= i=1,...,p (4)且系数a ij 由下列原则决定:(1)F i 与F j (i ≠j ,i ,j=1,…,p )不相关;(2)F 1是X 1,...,Xp 的一切线性组合(系数满足上述方程组)中方差最大的,F 2是与F 1不相关的X 1,...,Xp 的一切线性组合中方差最大的,…,F p 是与其他都不相关的X 1,...,Xp 的一切线性组合中方差最大的。
主成分分析方法

主成分分析方法主成分分析(Principal Component Analysis,PCA)是一种常用的数据降维技术,它通过线性变换将原始数据映射到一个新的坐标系中,以便更好地揭示数据的内在结构。
在实际应用中,主成分分析方法被广泛应用于数据压缩、特征提取、模式识别等领域。
本文将介绍主成分分析的基本原理、数学推导以及实际应用。
1. 基本原理。
主成分分析的基本思想是将高维数据映射到低维空间中,同时尽可能保留原始数据的信息。
假设我们有一个包含n个样本和m个特征的数据集X,其中每一行代表一个样本,每一列代表一个特征。
我们的目标是找到一个线性变换,将原始数据映射到k维空间中(k < m),使得映射后的数据能够最大程度地保留原始数据的信息。
2. 数学推导。
设我们的线性变换矩阵为W,映射后的数据集为Z,即Z = XW。
我们的目标是找到一个合适的W,使得映射后的数据集Z的协方差矩阵达到最大。
通过对协方差矩阵进行特征值分解,我们可以得到最大的k个特征值对应的特征向量,这些特征向量构成了我们的主成分。
3. 实际应用。
主成分分析方法在实际应用中具有广泛的应用价值。
首先,它可以用于数据压缩,将高维数据映射到低维空间中,从而节省存储空间和计算资源。
其次,主成分分析可以用于特征提取,提取最能代表原始数据的特征,从而降低数据维度并提高模型的泛化能力。
此外,主成分分析还可以用于模式识别,通过对数据进行降维和去噪,提高数据的分类和聚类效果。
总结。
主成分分析是一种重要的数据分析方法,它通过线性变换将高维数据映射到低维空间中,以便更好地揭示数据的内在结构。
在实际应用中,主成分分析方法具有广泛的应用价值,可以用于数据压缩、特征提取、模式识别等领域。
希望本文对主成分分析方法有所帮助,谢谢阅读!。
主成分分析法

3. 主成分是原变量的线性组合;第1主成分方差最大;第2 主成分是在和第1主成分不相关 的前提下方差最大; 第3主成分是… 4. 理论上,若有p个向量,我们可以有p个“主成分”,但 只有前几个“主成分”才涵盖6原来p个变量的大部分信 息。 “几个”? ----两种做法: 保留方差大于或等于1者,作为“主成分”; 保留前几个“主成分”,使积累百分比达到要求。
Var ( Z1 )+Var ( Z 2 )+ +Var ( Z P ) =Var ( x1 ) Var ( x2 ) Var ( xP ) p
信息总量不增不减
五.主成分的计算和解释
1.计算X1 , X 2 , , X P的相关矩阵
1 r 12 R ... 1p r r 12 1 ... r2 p ... ... ... ... r 1p r2 p ... 1
得到c11 , c12 , , c1 p
Z p c p1x1 c p 2 x2 ... c pp x p
Var ( Z p ) p
4. 计算主成分贡献率及累计贡献率
主成分zi的贡献率为 i
Qi
k 1
p
i
1 , 2, ... ,p
k
前i个主成分的累计贡献率为
2.计算R的特征根(特征值)
1 2 p 0
1 r12 r12 1 ... ... r1 p r2 p
即求解方程
... r1 p ... r2 p =0 ... ... ... 1
3.计算特征向量 即求解方程
得到c11 , c12 , , c1 p
5. 主成分的应用之一是对付回归中变量线性相关的问题:
主成分分析法及其应用

主成分分析法及其应用一、本文概述主成分分析法(Principal Component Analysis,简称PCA)是一种广泛应用于数据降维和特征提取的统计方法。
它通过正交变换将原始数据集中的多个变量转换为少数几个互不相关的主成分,这些主成分能够最大程度地保留原始数据集中的信息。
本文旨在全面介绍主成分分析法的基本原理、实现步骤以及在各个领域中的应用案例。
我们将详细阐述主成分分析法的数学基础和算法流程,包括协方差矩阵、特征值、特征向量等关键概念的计算方法。
然后,我们将通过实例演示如何使用主成分分析法进行数据降维和特征提取,以及如何通过可视化工具展示降维后的数据效果。
我们将探讨主成分分析法在机器学习、图像处理、生物信息学、社会科学等多个领域中的实际应用,展示其在数据分析和处理中的重要价值和潜力。
二、主成分分析法的基本原理主成分分析法(Principal Component Analysis,简称PCA)是一种在多个变量中找出主要影响因素,并通过降维技术把多个变量转化为少数几个互不相关的综合变量的统计方法。
这种方法在保持数据信息损失最小的原则下,通过正交变换将原始数据转化为一个新的坐标系统,使得在这个新的坐标系统中,任何数据的最大方差都投影在第一主成分上,第二大的方差都投影在第二主成分上,以此类推。
变量降维:在多数情况下,原始数据集中可能存在多个变量,这些变量之间可能存在相关性。
主成分分析通过构造新的变量(即主成分),这些新变量是原始变量的线性组合,并且新变量之间互不相关,从而将原始的高维数据空间降维到低维空间,实现数据的简化。
方差最大化:主成分分析的另一个重要原理是方差最大化。
这意味着,第一个主成分将捕获数据中的最大方差,第二个主成分捕获第二大方差,以此类推。
通过这种方式,主成分分析能够识别出数据中的主要变化方向和模式。
数据解释性:主成分分析生成的主成分是对原始数据的线性变换,因此,每个主成分都可以被解释为原始变量的某种组合。
主成分分析的原理与方法

主成分分析的原理与方法主成分分析(Principal Component Analysis, PCA)是一种常用的降维技术,用于数据的降维和特征提取。
它通过线性变换将原始数据映射到新的特征空间,使映射后的数据在新的特征空间中具有最大的方差。
一、主成分分析的原理主成分分析的核心思想是将高维数据映射到低维空间,同时保留最重要的信息。
具体而言,将原始数据映射到新的特征空间后,希望得到的新特征具有以下特性:1. 最大化方差:在新的特征空间中,希望找到使数据方差最大化的方向。
这样做的目的是将数据的主要变化方向保留下来,有利于更好地区分不同的样本。
2. 无相关性:希望得到的新特征之间是相互独立的,即它们之间没有任何相关性。
这样可以减少数据中的冗余信息,提取出更具代表性的特征。
二、主成分分析的方法主成分分析通常分为以下几个步骤:1. 标准化数据:由于主成分分析是基于数据的协方差矩阵进行计算的,所以首先需要将数据进行标准化处理,使各个维度的数据具有相同的尺度。
2. 计算协方差矩阵:通过计算标准化后的数据的协方差矩阵,可以得到各个维度之间的相关性。
3. 计算特征值和特征向量:对协方差矩阵进行特征值分解,可以得到特征值和对应的特征向量,其中特征值表示对应特征向量方向上的方差。
4. 选择主成分:根据特征值的大小,选择方差解释最大的前k个特征向量作为主成分。
5. 数据映射:将原始数据映射到选择的主成分上,得到降维后的数据。
三、主成分分析的应用主成分分析在数据分析和特征工程中有广泛的应用,可以用于数据降维、数据可视化和去除数据冗余等方面。
1. 数据降维:主成分分析可以将高维数据映射到低维空间,减少数据的维度,降低计算复杂度,并且保留了大部分的数据信息。
2. 数据可视化:通过将数据映射到二维或三维空间,可以将高维数据可视化,更好地观察数据的分布和结构。
3. 特征提取:主成分分析可以提取出数据中最具代表性的特征,对于后续的模型建立和训练有重要的意义。
主成分分析法

主成分分析法什么事主成分分析法:主成分分析(principal components analysis , PCA 又称:主分量分析,主成分回归分析法主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。
它是一个线性变换。
这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。
主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。
这是通过保留低阶主成分,忽略高阶主成分做到的。
这样低阶成分往往能够保留住数据的最重要方面。
但是,这也不是一定的,要视具体应用而定。
主成分分析的基本思想:在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。
这些涉及的因素一般称为指标,在多元统计分析中也称为变量。
因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。
在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
主成分分析正是适应这一要求产生的,是解决这类题的理想工具同样,在科普效果评估的过程中也存在着这样的问题。
科普效果是很难具体量化的。
在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。
如上所述,主成分分析法正是解决这一问题的理想工具。
因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。
根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。
(完整版)主成分分析法的步骤和原理.doc

(一)主成分分析法的基本思想主成分分析( Principal Component Analysis )是利用降 的思想,将多个 量 化 少数几个 合 量(即主成分) ,其中每个主成分都是原始 量的 性 合,各主成分之 互不相关, 从而 些主成分能 反映始 量的 大部分信息,且所含的信息互不重叠。
[2]采用 种方法可以克服 一的 指 不能真 反映公司的 情况的缺点,引 多方面的 指 , 但又将复 因素 几个主成分, 使得复 得以 化,同 得到更 科学、准确的 信息。
(二)主成分分析法代数模型假 用 p 个 量来描述研究 象,分 用 X 1, X 2⋯X p 来表示, p 个 量构成的 p 随机向量 X=(X 1,X 2⋯X p )t 。
随机向量 X 的均 μ, 方差矩 Σ。
X 行 性 化,考 原始 量的 性 合:Z 1=μ11 X 1+μ12 X 2+⋯μ 1p X p Z 2=μ21 X 1+μ22 X 2+⋯μ 2p X p ⋯⋯ ⋯⋯ ⋯⋯Z p =μp1 X 1+μp2 X 2+⋯μ pp X p主成分是不相关的 性 合 Z 1,Z 2⋯⋯ Z p ,并且 Z 1 是 X 1,X 2 ⋯X p 的 性 合中方差最大者, Z 2 是与 Z 1 不相关的 性 合中方差最大者,⋯, Z p 是与 Z 1, Z 2 ⋯⋯ Z p-1 都不相关的 性 合中方差最大者。
(三)主成分分析法基本步第一步: 估 本数 n , 取的 指 数 p , 由估 本的原始数据可得矩 X=(x ij ) m ×p ,其中 x ij 表示第 i 家上市公司的第 j 指 数据。
第二步: 了消除各 指 之 在量 化和数量 上的差 , 指 数据 行 准化,得到 准化矩 (系 自 生成) 。
第三步:根据 准化数据矩 建立 方差矩 R ,是反映 准化后的数据之 相关关系密切程度的 指 , 越大, 明有必要 数据 行主成分分析。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主成分分析方法我们进行系统分析评估或医学上因子分析等时,多变量问题是经常会遇到的。
变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。
因此,我们就会很自然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息事实上,这种想法是可以实现的,本节拟介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。
第一节主成分分析方法的原理主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。
假定有 n 样本,每个样本共有 p 个变量描述,这样就构成了一个 n×p阶的数据矩阵:x 11 x12 ...x1 px 21 x22 ...x2 pX... ... ... ⋯⋯⋯⋯(1) ...xn1 x n 2 ... x np如何从这么多变量的数据中抓住事物的内在规律性呢要解决这一问题, 自然要在 p 维空间中加以考察, 这是比较麻烦的。
为了克服这一困难, 就需要进行降维处理, 即用较少的几个综合指标来代替原来较多的变量指标, 而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息, 同时它们之间又是彼此独立的。
那么,这些综合指标(即新变量 )应如何选取呢显然,其最简单的形式就是取原来变量指标的线性组合, 适当调整组合系数,使新的变量指标之间相互独立且代表性最好。
如果记原来的变量指标为x 1, x 2, xp ,它们的综合指标 —— 新变量指标为 z 1 , z 2 , z m ( m ≤p)。
则z 1 l 11x 1 l 12 x 2 l 1 p x pz 2l 21x1l 22x2l 2 pxp (2)z m l m1x 1 l m2 x 2l mp x p在( 2)式中,系数 l ij 由下列原则来决定:( 1)z i与 z j ( i ≠j;i ,j=1,2, , m)相互无关;( 2)z 1 是 x 1,x 2,⋯,x p 的一切线性组合中方差最大者;z 2 是与 z 1 不相关的 x 1, x 2,⋯,x p 的所有线性组合中方差最大者; ;z m 是与 z 1,z 2,⋯⋯z m-1 都不相关的 x 1,x 2, ⋯, x p 的所有线性组合中方差最大者。
且( 2)式要求:l i 12l i 22.... l ip2 1这样决定的新变量指标z1,z2,⋯,z m分别称为原变量指标 x1,x2,⋯,x p的第一,第二,,第m主成分。
其中, z1在总方差中占的比例最大,z2,z3,⋯,z m的方差依次递减。
在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。
从以上分析可以看出,找主成分就是确定原来变量x j(j=1,2,,p)在诸主成分z i(i=1,2,,m)上的载荷l ij(i=1,2,,m;j=1,2,, p)。
同时,(l i1, l i 2,...., l ip)不是别的,而恰好是x1,x2,⋯,x p的相关矩阵的特征值所对应的特征向量。
且z1方差取到最大就是x1,x2,⋯,x p相关矩阵在第一个特征值所对应特征向量处达到。
z m方差取到最大就是x1,x2,⋯,x p相关矩阵在第m个特征值所对应特征向量处达到。
第二节主成分分析的解法主成分分析的计算步骤通过上述主成分分析的基本原理的介绍,我们可以把主成分分析计算步骤归纳如下:(1)计算相关系数矩阵r 11 r12r1Pr 21 r22r2PR(3)...........................r P1 rP 2rPP在公式( 3)中,r ij(i, j=1,2,,p)为原来变量x i与x j的相关系数,其计算公式为n(x ki x i )( x kj x j )r ijk 1 .(4) n n(x ki x i ) 2 (x kj x j ) 2k 1 k 1因为 R 是实对称矩阵(即 r ij=r ji),所以只需计算其上三角元素或下三角元素即可。
(2)计算特征值与特征向量首先解特征方程|λI-R|=0求出特征值λi(i=1,2,,p),并使其按大小顺序排列,即λ1≥λ2≥ ,≥λp≥0;然后分别求出对应于特征值λi的特征向量 e i( i=1,2,, p)。
(3)计算主成分贡献率及累计贡献率mp k。
主成分 z i贡献率: r i / k (i 1,2, , p),累计贡献率:k 1 pk 1kk 1 一般取累计贡献率达85-95%的特征值1,2,m ,所对应的第一,第二,,第m(m≤p)个主成分。
(4)计算主成分得分矩阵由此可以进一步计算主成分得分矩阵:l 11 l12l1ml21 l 22 l2 mZ=... ... ... ... ( 5)l n1 ln 2lnmz1l11x1l12x2 z2l21x1l22 x2进一步还可以根据式:z m l m1x1l m2 x2计算各主成分得分:Z j l j 1 X 1...y j 1z 2 z ...和总得分:m 1 m 2i ii il1 pxpl2 p x pl mp x pljpXp(6)mm zmii(7)主成分分析应用实例实证研究 1本文是对实施西部大开发以来的经济增长状况作实证研究 ,把西部地区 10 个省(自治区、直辖市)的经济增长状况作为研究对象集 ,即 ={ 重庆,四川,贵州,云南,西藏,陕西,甘肃,青海,宁夏,新疆 }选取 17 个经济指标值:即:地区生产总值、财政收入、固定资产投资、城市用水普及率、城市燃气普及率、每万人拥有交通公共车辆、人均城市道路面积、普通高等学校数、每千人医疗卫生机构床位数、居民收入与消费指标等 17 个经济指标。
进行主成分分析:西部地区 2011 横向因子分析解释的总方差初始特征值提取平方和载入旋转平方和载入成份合计方差的%累积%合计方差的%累积%合计方差的%累积% 123主成分载荷量表:西部地区 2011 年横向主成分f 1f 2f 3.173.045.186.110 .151 .002 .172.041.240 .028 .085 .199 .091.294.100.093 .163 .016 .037.258.261 .232.330.066 .056.050.138.152.034.086.025.006主成分得分函数:f 1 0.173v 2011,1 0.019v 2001,2 0.151v 2011,3 0.172v0.012v 2011,5 0.028v 2011,6 0.091v 2011,7 0.041v2011,80.163v 2011,92011,40.037v 2011,10 0.022v 2011,11 0.003v 2011,12 0.098v 2011,13 0.066v 2011,14 0.138v 2011,15 0.152v 2011,16 0.086v 2011,17f 2 0.070v 2011,1 0.186v 2001,20.012v 2011,3 0.064v 0.042v 2011,5 0.085v 2011,60.136v 2011,7 0.1v 2011,8 0.071v 2011,92011,40.073v 2011,10 0.261v 2011,11 0.232v 2011,12 0.33v 2011,13 0.056v 2011,14 0.021v 2011,15 0.005v 2011,16 0.025v 2011,17 f 3 0.045v 2011,1 0.11v 2001,2 0.002v 2011,3 0.041v 0.24v 2011,5 0.199v 2011,6 0.294v 2011,7 0.093v 2011,8 0.016v2011,92011,40.258v 2011,10 0.021v 2011,11 0.14v 2011,12 0.155v 2011,13 0.05v 2011,14 0.015v 2011,15 0.034v 2011,16 0.006v 2011,17各地区主成分得分表:因子得分 f1 因子得分 f 2因子得分 f 3因子综合得分 y 2011,i排名重 庆 3四 川 1 贵 州 5 云 南 4 西 藏 10 陕西2甘 肃 7 青 海 9宁 夏 8新 疆6第一类主成分: 经济实力、 社会基础以及对外开程度是影响经济增长的主要因素 (地区生产总值、财政收入、固定资产投资、普通高校数、客运量和货运量等)第二类主成分:居民消费水平、城镇居民人均可支配收入、人均公园绿地面积、人均生产总值。
第三类主成分有:城市用水普及率、城市燃气普及率、每万人拥有交通公共车辆数、每千人医疗卫生机构床位数等。
例:投资项目的风险评估模型现在针对具体的综合投资项目,假设请N 名专家对可能次年在的 M 项风险指标进行打分评估,采用10 分制,分支越低,风险越小。
具体打分数据统计表形式如表5-13 所示:某项目投资分先评估打分表政策风险技术风险市场风险管理风险环境风险风险指标专家序号1 6 8 4 4 32 5 73 5 23 4 9 2 7 14 4 6 4 8 35 7 5 3 5 26 3 6 4 8 37 5 4 5 6 38 7 6 4 2 39 4 7 4 6 110 6 7 5 5 4>>Matlab 命令窗口中输入语句: p=[6 8 4 4 3;4 9 2 7 1; ];>>princomp(p)风险指标特征值方差贡献率( %) 累计贡献率( %)12345100F=-0.5766x 1 +0.0094x 2 -0.1698x +0.6237x 4 +0.4997x13 5F 2 =0.1213x 1+ 0.8054x 2 +0.5409x 3 +0.0987x 4 +0.18545 pcF 3 =-0.0984x 1-0.4107x 2 0.5037x 3 -0.4386x 4 +0.6128x 50.7880 -0.2358 -0.0214 0.4686 .03215-0.1490 -0.3563 0.6515 0.4351 -0.48695.0592 2.6122=0.9544 0.35730.1168从上表可知,前 3 个主成分的累计贡献率达到%,因此取前三个主成分:F1 =-0.5766x1 +0.0094x 2 -0.1698x3 +0.6237x 4 +0.4997x 5F2 =0.1213x1 + 0.8054x 2 +0.5409x3 +0.0987x 4 +0.18545F3 =-0.0984x1 -0.4107x2 0.5037x3 -0.4386x 4 +0.6128x5 所以最终风险综合评估函数:F 55.60F128.71F210.49F3主成分分析实例 2对于某区域地貌 -水文系统,其57 个流域盆地的九项地理要素:x1为流域盆地总高度( m)x2为流域盆地山口的海拔高度(m),x3为流域盆地周长(m),x4为河道总长度( km),x5为河等表 2-14某57个流域盆地地理要素数据道总数, x6为平均分叉率, x7为河谷最大坡度(度 ),x8为河源数及 x9为流域盆地面积( km2)的原始数据如表 2-14 所示。