主分量分析方法及
主分量分析方法及

主分量分析方法及在故障诊断中的应用
三、主分量分析在设备诊断中的应用 在设备故障诊断时,通常使用一些判别设备各种状态的特征参数,
例如:有效值、峰值、峭度、频带能量等等。由于每个特征参数往往仅 对设备的某种状态敏感,而对其它状态可能不敏感,所以为了全面准确 地对设备进行诊断,一般都是同时采用多种特征参数。而因多个特征参 数的相关性,往往又造成了分析数据的困难。通过变量变换的方法把相 关的变量变为不相关的若干新变量,这对于分析数据带来很大的方便。 而且选择少数无关的主分量来概括原来的多个参数的特征,实现了多诊 断参数的融合,既提取出了对我们有用的信息,又能使设备诊断工作简 化,并有可能通过简易诊断的方法达到精密诊断的目的。下面介绍具体 做法。
r1n
r2n
0
rn1
rn2 1
求出n个非负实根并按值从大到小进行排列:
1 2 n 0
主分量分析方法及在故障诊断中的应用
将λi代入下方程组求出特征向量aI(i=1,…,r), 也称为主分量系数。
1 i
r21 rn1
r12
1 i
rn 2
r1n ai1 0
r2n
主分量分析方法及在故障诊断中的应用
Z1 a11 x1 a12 x2 Z 2 a21 x1 a22 x2
主分量分析方法及在故障诊断中的应用
二、主分量分析的一般方法步骤
在实际工作中,由于n个特征变量的相关性,往往 造成了分析数据的困难。主分量分析的目的在于: l、选择少数无关的新变量来概括原来的n个特征。 2、通过对观测数据和几个主分量的数据的整理和分析, 提取出对我们有用的信息。 3、利用这些信息进行决策.
Z1
Z 2
S 0.514
S 0.239
PCA(主分量分析法)

协方差矩阵——PCA的关键。
PCA的目的就是“降噪”和“去冗余”。
“降噪”的目的就是使保留下来的维度间的相关性尽可能小,而“去冗余”的目的就是使保留下来的维度含有的“能量”即方差尽可能大。
那首先的首先,我们得需要知道各维度间的相关性以及个维度上的方差!那有什么数据结构能同时表现不同维度间的相关性以及各个维度上的方差呢?自然是非协方差矩阵莫属。
回忆下《浅谈协方差矩阵》的内容,协方差矩阵度量的是维度与维度之间的关系,而非样本与样本之间。
协方差矩阵的主对角线上的元素是各个维度上的方差(即能量),其他元素是两两维度间的协方差(即相关性)。
我们要的东西协方差矩阵都有了,先来看“降噪”,让保留下的不同维度间的相关性尽可能小,也就是说让协方差矩阵中非对角线元素都基本为零。
达到这个目的的方式自然不用说,线代中讲的很明确——矩阵对角化。
而对角化后得到的矩阵,其对角线上是协方差矩阵的特征值,它还有两个身份:首先,它还是各个维度上的新方差;其次,它是各个维度本身应该拥有的能量(能量的概念伴随特征值而来)。
这也就是我们为何在前面称“方差”为“能量”的原因。
也许第二点可能存在疑问,但我们应该注意到这个事实,通过对角化后,剩余维度间的相关性已经减到最弱,已经不会再受“噪声”的影响了,故此时拥有的能量应该比先前大了。
看完了“降噪”,我们的“去冗余”还没完呢。
对角化后的协方差矩阵,对角线上较小的新方差对应的就是那些该去掉的维度。
所以我们只取那些含有较大能量(特征值)的维度,其余的就舍掉即可。
PCA的本质其实就是对角化协方差矩阵.PCA的本质是对角化协方差矩阵,目的是让维度之间的相关性最小(降噪),保留下来的维度的能量最大(去冗余)。
PCA简介以及模型Web的发展产生了大量的数据,尤其是现在的互联网公司,集结了大量的用户信息。
,怎样从这些复杂混乱的数据中提取有用的信息才是重点。
我们举一个物理模型如图所示:当把一个弹簧球沿着X方向进行拉伸的时候,弹簧球会在X方向上进行来往复运动。
主成分分析法

主成分分析法什么事主成分分析法:主成分分析(principal components analysis , PCA 又称:主分量分析,主成分回归分析法主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。
它是一个线性变换。
这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。
主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。
这是通过保留低阶主成分,忽略高阶主成分做到的。
这样低阶成分往往能够保留住数据的最重要方面。
但是,这也不是一定的,要视具体应用而定。
主成分分析的基本思想:在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。
这些涉及的因素一般称为指标,在多元统计分析中也称为变量。
因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。
在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
主成分分析正是适应这一要求产生的,是解决这类题的理想工具同样,在科普效果评估的过程中也存在着这样的问题。
科普效果是很难具体量化的。
在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。
如上所述,主成分分析法正是解决这一问题的理想工具。
因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。
根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。
主成分分析、因子分析应用

主成分分析
例中的的数据点是六维的;也就是说,每个观测值是6 维空间中的一个点。我们希望把6维空间用低维空间表 示。 先假定只有二维,即只有两个变量,它们由横坐标和纵 坐标所代表;因此每个观测值都有相应于这两个坐标轴 的两个坐标值;如果这些数据形成一个椭圆形状的点阵 (这在变量的二维正态的假定下是可能的) 那么这个椭圆有一个长轴和一个短轴。在短轴方向上, 数据变化很少;在极端的情况,短轴如果退化成一点, 那只有在长轴的方向才能够解释这些点的变化了;这样, 由二维到一维的降维就自然完成了。
Co mpo ne nt 1
该图左面三个点是数学、物理、化学三科,右边三个点是语文、历史、外语三 科。图中的六个点由于比较挤,不易分清,但只要认识到这些点的坐标是前面 的第一二主成分载荷,坐标是前面表中第一二列中的数目,还是可以识别的。
主成分分析的应用
在主成分分析中,我们首先应保证所提取的前几个 主成分的累计贡献率达到一个较高的水平(即变量 降维后的信息量须保持在一个较高水平上),其次 对这些被提取的主成分必须都能够给出符合实际背 景和意义的解释(否则主成分将空有信息量而无实 际含义)。 主成分的解释其含义一般多少带有点模糊性,不像 原始变量的含义那么清楚、确切,这是变量降维过 程中不得不付出的代价。因此,提取的主成分个数 m通常应明显小于原始变量个数p(除非p本身较小 ),否则维数降低的“利”可能抵不过主成分含义 不如原始变量清楚的“弊”。
+ + + + + +
0.353y2 0.531y2 0.513y2 0.306y2 0.435y2 0.425y2
• 这些系数称为主成分载荷(loading),它表示主成分和相应的原先变 量的相关系数。 • 比如x1 表示式中y1 的系数为-0.806,这就是说第一主成分和数学变量的 相关系数为-0.806。 • 相关系数(绝对值)越大,主成分对该变量的代表性也越大。可以看得 出,第一主成分对各个变量解释得都很充分。而最后的几个主成分和原 先的变量就不那么相关了。
主成分分析法的原理应用及计算步骤

一、概述在处理信息时,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠,例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。
而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。
为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。
为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。
主成分分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。
主成分分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,通常综合指标(主成分)有以下几个特点:↓主成分个数远远少于原有变量的个数原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。
↓主成分能够反映原有变量的绝大部分信息因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。
↓主成分之间应该互不相关通过主成分分析得出的新的综合指标(主成分)之间互不相关,因子参与数据建模能够有效地解决变量信息重叠、多重共线性等给分析应用带来的诸多问题。
↓主成分具有命名解释性总之,主成分分析法是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法。
二、基本原理主成分分析是数学上对数据降维的一种方法。
其基本思想是设法将原来众多的具有一定相关性的指标X1,X2,…,XP (比如p 个指标),重新组合成一组较少个数的互不相关的综合指标Fm 来代替原来指标。
那么综合指标应该如何去提取,使其既能最大程度的反映原变量Xp 所代表的信息,又能保证新指标之间保持相互无关(信息不重叠)。
主分量与核主分量分析

核主分量分析要提取原始特征的非线性特征,首先采用非线性映射将原始数据
R F X由数据空间 N 映射到高维空间 ,进而在高维空间进行对应的线性操作
从本质上讲,核方法实现了数据空间、高维空间、和类别空间之间的非线性变换。
设 和xi
x j 为数据空间中的样本点,数据空间到高维空间的映射函数为
,核函数的基础是实现向量的内积变换
C 1 M
M
xi xiT
i 1
4
Company Logo
主分量与核主分量分析
二、主分量分析
2、解协方差矩阵C的特征方程:
Cv v
得到矩阵C的N个特征值 i i 1, 2,3,...N 以及对应的特征向量 vi
。把特征值按由大到小排序,此时前P个特征值的累计贡献率
P
i
i 1 N
i
i 1
贡献率的大小可以用来衡量特征压缩后信息的保留程度,η值越大,
xy 2
高斯径向基函数(RBF)核函数 K(x, y) exp(
)
2 2
P阶多项式核函数 K (x, y) (x y)d
Sigmoid核函数
K(x, y) tanh[v(x y) ]
14
Company Logo
主分量与核主分量分析
四、核主分量分析
M
首先,假设映射向量
xk
在高维空间F中满足零均值条件,即 (xk ) 0 k 1
原理及步骤:
1、从原始数据中的每个样本中提取N个特征指标组成的N维特征向量
x x1, x2,....., xN T
设共有M个样本,则组成N×M的矩阵
xk x1k , x2k ,....., xNk T (k 1, 2,....M )
主成分分析方法

主成分分析方法在经济问题的研究中,我们常常会遇到影响此问题的很多变量,这些变量多且又有一定的相关性,因此我们希望从中综合出一些主要的指标,这些指标所包含的信息量又很多。
这些特点,使我们在研究复杂的问题时,容易抓住主要矛盾。
那么怎样找综合指标?主成分分析是将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标的统计方法,也是数学上处理降维的一种方法. 一. 主成分分析法简介主成分分析是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法,又称主分量分析。
在实际问题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。
但是,在用统计分析方法研究这个多变量的课题时,变量个数太多就会增加课题的复杂性。
人们自然希望变量个数较少而得到的信息较多。
在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。
主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映问题的信息方面尽可能保持原有的信息。
信息的大小通常用离差平方和或方差来衡量。
主成分分析的基础思想是将数据原来的p 个指标作线性组合,作为新的综合指标(P F F F ,,,21 )。
其中1F 是“信息最多”的指标,即原指标所有线性组合中使)var(1F 最大的组合对应的指标,称为第一主成分;2F 为除1F 外信息最多的指标,即0),cov(21 F F 且)var(2F 最大,称为第二主成分;依次类推。
易知P F F F ,,,21 互不相关且方差递减。
实际处理中一般只选取前几个最大的主成分(总贡献率达到85%),达到了降维的目的。
主成分的几何意义:设有n 个样品,每个样品有两个观测变量,,21X X 二维平面的散点图。
n 个样本点,无论沿着1X 轴方向还是2X 轴方向,都有较大的离散性,其离散程度可以用1X 或2X 的方差表示。
主成份

主成分分析的基本思想主成分分析的主要作用及应用范围 主成分分析法的计算步骤 应用举例主成分分析(Principal Component Analysis,PCA )也称作主分量分析或者矩阵数据分析,是统计分析常用到的一种重要方法,在系统评价、故障诊断、质量管理和发展对策等许多方面都有应用。
它利用数理统计方法找出系统中的主要因素和各因素之间相互关系,由于系统的相互关联性,当出现异常情况时或对系统进行分析时,抓住几个主要技术参数的状态,就能把握系统的全局。
这几个参数反映了综合指标,也是系统的主要因素。
主成分分析法是通过研究指标体系的内在结构关系,从而将多个指标转化为互不相关的、包含原来指标大部分信息的少数几个指标,即主成份。
这种方法一方面可以减少研究总体指标的个数,另一方面因各主成份是相互独立的,可以减少指标提供信息的交叉和冗余,有利于分析评价。
此外,所确定的权数是基于数据分析得出的指标间内在的结构关系,客观性较好。
一般风险因素相互间存在交互作用,所设置的指标之间也往往不能相互独立。
所反应的信息也经常有重叠,同时指标能否真正全面反映企业风险本质以及各指标的影响程度也很难准确确定,因此可用系统分析法中的主成分分析法确定。
主成分分析的基本步骤 1.确定原始评价矩阵假定有M 个样本,每个样本P 个变量,构成一个P M >阶的数据矩阵为⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=ij i i jj x x x x x x x x X 212222111211x 式(4.1) 2. 计算相关系数矩阵⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=-=iji i j j r r r r r r r r xx n R .....................r 11212222111211'式(4.2) ),,2,1,(p j i r ij =为原变量i X 与j X 的相关系数, ji ij r r =, 其计算式为∑∑∑==--=-----=nk nk j kj i kink j kj i kiij x x x xx x x xr 11221)()())(( 式(4.3)3.计算特征值与特征向量首先, 解特征方程0=-R I λ,求出特征值,并使其按大小顺序排列),,2,1(;0,,21m p p =≥≥≥≥λλλ。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主分量分析方法及在故障诊断中的应用
值得注意的是,不必求出所有的特征向量, 只要求前r个即可,确定r的方法是求出其 累计贡献率:
k 1
r
k
1 k k n k 1 k 1
n
r
希望累计贡献率大于95%,实际应用时还可 以低一些,如累计贡献率取80%左右。
主分量分析方法及在故障诊断中的应用
yik, (i 1 , ,n;k 1 , ,m)
主分量分析方法及在故障诊断中的应用
计算样本相关矩阵:
1 r21 R r n1 r12 1 rn 2 r1n r2 n 1
其中:
1 m rij yik y jk r ji (i,j 1, ,n) m 1 k 1
主分量分析方法及在故障诊断中的应用
由特征方程: R I 0
即:
1 r12 r1n r21 1 r2 n 0 r r 1 n2 n1
求出n个非负实根并按值从大到小进行排列:
1 2 n 0
希望累计贡献率大于95%,实际应用时还可 以低一些,如累计贡献率取80%左右。 当r=2时,主分量为Z1,Z2,可用二 维空间表述,即平面坐标,此时主分量分析 的表现形式为:
n Z1 a11 x1 a12 x2 a1n xn a1i xi i 1 n Z 2 a21 x1 a22 x2 a2 n xn a2i xi i 1
当r=3时,主分量为Z1,Z2,Z3, 可用三维空间表述,即立体三维坐标。
主分量分析方法及在故障诊断中的应用
三、主分量分析在设备诊断中的应用 在设备故障诊断时,通常使用一些判别设备各种状态 的特征参数,例如:有效值、峰值、峭度、频带能量等等。 由于每个特征参数往往仅对设备的某种状态敏感,而对其 它状态可能不敏感,所以为了全面准确地对设备进行诊断, 一般都是同时采用多种特征参数。而因多个特征参数的相 关性,往往又造成了分析数据的困难。通过变量变换的方 法把相关的变量变为不相关的若干新变量,这对于分析数 据带来很大的方便。而且选择少数无关的主分量来概括原 来的多个参数的特征,实现了多诊断参数的融合,既提取 出了对我们有用的信息,又能使设备诊断工作简化,并有 可能通过简易诊断的方法达到精密诊断的目的。下面介绍 具体做法。
S f S fm C f C fm f avg f avgm 2 2m m Z a a a a a 1 11 12 13 14 15 S frms C frms 2 rms f avgrms rms Z a S f S fm a C f C fm a 2 2 m a f avg f avgm a m 21 22 23 24 25 2 S C f rms frms frms 2 rms avgrms
主分量分析方法及在故障诊断中的应用
将λi代入下方程组求出特征向量aI(i= 1,…,r),也称为主分量系数。
r12 1 i r21 1 i r rn 2 n1 r1n ai1 0 r2 n ai 2 0 a 0 1 i in
主分量分析方法及在故障诊断中的应用
(3)、轧钢机振动的监测
钢铁厂轧制薄钢板时,有时会产生自激振动,在轧出的钢板上留下 一道一道横向的振纹,严重影响了钢板的质量。图中为轧钢过程中所 检测到的轧机振动变化情况,其中包括了正常时的情况和异常振动情 况。为了早期发现自激振动以便采取相应的措施,有必要对其振动进 行监测。所采用的方法就是对前述的五个特征参数通过主分量分析求 出其第一主分量和第二主分量。具体做法是将这段振动信号分成M段, 从振动信号正常区间A段取20小段数据,分别求出上述五个特征参数的 20个数据,根据这五个特征参数的20个数据求出特征向量[arM],得到 主分量表达式: Sf Sf Cf Cf f avg f avg 2 2 0.406 0.15 0.628 0.392 Z 1 0.514 S frms C frms 2 rms f avgrms rms Z 0.239 S f S f 0.558 C f C f 0.716 2 2 0.215 f avg f avg 0.271 2 S frms C frms 2 rms f avgrms rms
(2)、在设备状态判别中的应用
将设备监测所得到待判别设备状态的数据分别求出上 述5个特征参数值,代入式中,求得Z1、Z2。用Z1、Z2做 横坐标和纵坐标,用设备在不同状态测得的数据求出Z1、 Z2值,把它作为坐标点点在坐标中,可以发现,不同状态 的点会按密集程度分别分布在坐标系的不同位置(如图所 示),以此可以区分出设备的状态。
主分量分析方法及在故障诊断中的应用 一、主分量分析的简述 假定有一特征向量x由两个分量x1和x2组成, 相应的有x1N
x21 , x22 ,, x2 N
现在需要寻找一个新的坐标系Z1、Z2,使全部样 本点投影到新的坐标Z1上的分量弥散为最大,即 方差为最大。这样在Z1方向上就保存了原来样本 最多的信息量,亦即有可能用一个分量来代表原来 的两个分量。由此可见,主分量分析实质上是作一 线性变换,使原来的坐标系旋转到主分量方向:
C f C f 1C f 2 C fM
f avg f avg1 f avg 2 f avgM
S f S f 1S f 2 S fM
2 21 22 2 M
1 2 M
主分量分析方法及在故障诊断中的应用
根据这五个特征参数的M个数据求出特征向量[arM],得 到主分量表达式:
主分量分析方法及在故障诊断中的应用
主分量分析方法及在故障诊断中的应用
用Z1、Z2做横坐标和纵坐标,再将正常数据代入式中, 求得各点的Z1、Z2,将每个数据求出的Z1、Z2值作为坐标 点点在坐标中,可以发现,数据点会比较集中的聚集在坐 标系原点附近(参见图4)。根据这些点的均值、方差等参 数,可以求出正常时数据的置信区间,置信区间在主分量 坐标系中是一个椭圆。如果检测到的振动信号所计算出的 坐标点(主分量值)落在置信区间以外,此时则说明轧机 发生了异常振动。图4中点F、G、H就是图3中F、G、H段 数据计算所得到的点,从图3可以看出这几段的振动信号已 经大大超过了正常时A段振动值。
主分量分析方法及在故障诊断中的应用 二、主分量分析的一般方法步骤
常用的分析方法和步骤。
如果Xl,…,Xn为特征样本数据,Z1,…, Zr为用Xl,…,Xn特征样本数据求出的前r个主分 量(n>r),如果前r个主分量保存了原来的n个征 样本数据95%左右的信息量(称为累计贡献率), 那么Z1,…,Zr就能够很好代表或者概括原来的n 个测试特征样本数据的特征。
主分量分析方法及在故障诊断 中的应用
主分量分析方法及在故障诊断中的应用
主分量分析(也称为主成分分析)法是一 种多变量分析方法,也称为矩阵数据分析法。 它通过变量变换的方法把相关的变量变为不 相关的若干新变量。这对于分析数据带来很 大的方便,因此它在许多方面都有重要的应 用,如用于多元回归,多维时间序列分析, 多维谱分析等。变量个数愈多,它的优越性 愈加突出。在此我们介绍它的原理和在设备 故障诊断中的应用。
主分量分析方法及在故障诊断中的应用
计算主分量的简便方法如下。 设有Xl,…,Xn,n个特征参数,每个特征 参数有k个样本数据(k=m),对其归一化 预处理:
yik
xik xi
i
1 m xi xik m k 1
1 m 2 i x x ik i m 1 k 1
P f i P f i
f
i 1 n2 i 1
n2
i
P f i
i
P f
稳定指数:
f
i 1
P f i
f
n2
4 i
P f i
i 1
n2
f
i 1
i 1 n2
2 i
主分量分析方法及在故障诊断中的应用
将设备监测所得的设备状态的数据(如振动信号)代入求 得上述特征参数,每个特征参数计算M个数据,即:
主分量分析方法及在故障诊断中的应用
(1)、特征参数的选定和主分量的确定
在进行设备故障诊断时,事先要确定一些判别设备各种 状态的特征参数,本文采用以下参数。
波形因素:
xrms Sf x
波峰因素:
Cf
xp xrms
峭度:
2
4 x i i 1 4 nxrms
n2 2 i
n
平均频率:
f avg
主分量分析方法及在故障诊断中的应用
运用主分量分析方法可以将多个诊断用特征参数的信息融 合到两个或三个主分量上,实现了多诊断参数的信息融合,简 化了诊断参数,也避免了采用多个诊断参数时造成的判断困难。
主分量分析方法及在故障诊断中的应用
Z1 a11 x1 a12 x2 Z 2 a21 x1 a22 x2
主分量分析方法及在故障诊断中的应用
二、主分量分析的一般方法步骤
在实际工作中,由于n个特征变量的相 关性,往往造成了分析数据的困难。主分量 分析的目的在于: l、选择少数无关的新变量来概括原来的n个 特征。 2、通过对观测数据和几个主分量的数据的 整理和分析,提取出对我们有用的信息。 3、利用这些信息进行决策.