几何观点下的主成分分析法知识点浅析

合集下载

主成分分析法

主成分分析法

3. 主成分是原变量的线性组合;第1主成分方差最大;第2 主成分是在和第1主成分不相关 的前提下方差最大; 第3主成分是… 4. 理论上,若有p个向量,我们可以有p个“主成分”,但 只有前几个“主成分”才涵盖6原来p个变量的大部分信 息。 “几个”? ----两种做法: 保留方差大于或等于1者,作为“主成分”; 保留前几个“主成分”,使积累百分比达到要求。
Var ( Z1 )+Var ( Z 2 )+ +Var ( Z P ) =Var ( x1 ) Var ( x2 ) Var ( xP ) p
信息总量不增不减
五.主成分的计算和解释
1.计算X1 , X 2 , , X P的相关矩阵
1 r 12 R ... 1p r r 12 1 ... r2 p ... ... ... ... r 1p r2 p ... 1
得到c11 , c12 , , c1 p
Z p c p1x1 c p 2 x2 ... c pp x p
Var ( Z p ) p
4. 计算主成分贡献率及累计贡献率
主成分zi的贡献率为 i
Qi

k 1
p
i
1 , 2, ... ,p
k
前i个主成分的累计贡献率为
2.计算R的特征根(特征值)
1 2 p 0
1 r12 r12 1 ... ... r1 p r2 p
即求解方程
... r1 p ... r2 p =0 ... ... ... 1
3.计算特征向量 即求解方程
得到c11 , c12 , , c1 p
5. 主成分的应用之一是对付回归中变量线性相关的问题:

主成分分析【可编辑全文】

主成分分析【可编辑全文】
沿着xl轴方向或x2轴方向都具有较大的离散性,其离散 的程度可以分别用观测变量xl的方差和x2的方差定量地 表示。显然,如果只考虑xl和x2中的任何一个,那么包 含在原始数据中的经济信息将会有较大的损失。
• 如果我们将xl 轴和x2轴先平移,再同时 按逆时针方向旋转角度,得到新坐标轴Fl和 F2。Fl和F2是两个新变量。
• 如果变量分组较有规则,则从特征向量各 分量数值作出组内组间对比分析。
主成分分析的一般步骤
6. 解释各个主成分的含义 7. 进行其他分析
利用SPSS进行主成分分析的步骤
1. 指标数据的标准化。
可以利用“Descriptive statistics” 中的“Descriptives”进行标准化。
这种由讨论多个指标降为少数几个综合指 标的过程在数学上就叫做降维。主成分分析通 常的做法是,寻求原指标的线性组合Fi。其中, Xi 是经过标准化后的变量。
F1 u11X1 u21X 2 u p1X p F2 u12 X1 u22 X 2 u p2 X p
Fp u1p X1 u2 p X 2 u pp X p
4. 确 定 主 成 分 Fi 的 表 达 式 : 将 表 “Component Matrix”(初始因子载荷 阵)中的第i列向量除以第i个特征根的平方 根,得到第i个主成分Fi的变量系数向量。
5. 对主成分Fi进行解释。
• x1:数学 • x2:物理 • x3:化学 • x4:语文 • x5:历史 • x6:英语
满足如下的条件:
每个主成分的系数平方和为1。即
u2 1i
u2 2i
u
2 pi
1
主成分之间相互独立,即无重叠的信息。即
Cov(Fi,Fj) 0,i j,i,j 1, 2, ,p 主成分的方差依次递减,重要性依次递减,即

主成分分析方法

主成分分析方法

主成分分析方法在经济问题的研究中,我们常常会遇到影响此问题的很多变量,这些变量多且又有一定的相关性,因此我们希望从中综合出一些主要的指标,这些指标所包含的信息量又很多。

这些特点,使我们在研究复杂的问题时,容易抓住主要矛盾。

那么怎样找综合指标?主成分分析是将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标的统计方法,也是数学上处理降维的一种方法. 一. 主成分分析法简介主成分分析是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法,又称主分量分析。

在实际问题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。

但是,在用统计分析方法研究这个多变量的课题时,变量个数太多就会增加课题的复杂性。

人们自然希望变量个数较少而得到的信息较多。

在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。

主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映问题的信息方面尽可能保持原有的信息。

信息的大小通常用离差平方和或方差来衡量。

主成分分析的基础思想是将数据原来的p 个指标作线性组合,作为新的综合指标(P F F F ,,,21 )。

其中1F 是“信息最多”的指标,即原指标所有线性组合中使)var(1F 最大的组合对应的指标,称为第一主成分;2F 为除1F 外信息最多的指标,即0),cov(21 F F 且)var(2F 最大,称为第二主成分;依次类推。

易知P F F F ,,,21 互不相关且方差递减。

实际处理中一般只选取前几个最大的主成分(总贡献率达到85%),达到了降维的目的。

主成分的几何意义:设有n 个样品,每个样品有两个观测变量,,21X X 二维平面的散点图。

n 个样本点,无论沿着1X 轴方向还是2X 轴方向,都有较大的离散性,其离散程度可以用1X 或2X 的方差表示。

主成分分析

主成分分析
2、主成分分析的数学模型及几何解释
(1 )、 数学模型
设有 n 个样品,每个样品观测p项指标(变量), X1,
X2,202…0/7/7,Xp,得到原始数据资料阵:
5
其中
用数据矩阵X的p个向量(即p个指标向量)X1,…,Xp作线
性组合(即综合指标向量)为:
2020/7/7
6
简写成
(注意:Xi是n维向量,所以Fi也是 n 维向量) 上述方程组要求:
主成分分析
2020/7/7
1
一、什么是主成分分析及基本思想
1 、什么是主成分分析
主成分概念首先由Karl parson在1901年引进,不 过当时只对非随机变量来讨论的。1933年Hotelling将 这个概念推广到随机向量:
在实际问题中,研究多指标(变量)问题是经常遇到的,
然而在多数情况下,不同指标之间是有一定相关性。由于
一般情况,p个变量组成p维空间,n个样本就是p维 空间的n个点,对p元正态分布变量来说,找主成分的问 题就是找p维空间中椭球体的主轴问题。
3 主成分的推导及性质
在下面推导过程中,要用到线性代数中的两个定理先 作一下复习:
定理一 若矩阵A是p阶实对称阵,则一定可以找到 正交阵
定理二 若上述矩阵A的特征根所对应的单位特征向量
X1,…,Xp构成的坐标系旋转产生的新坐标系,新坐标 轴使之通过样品变差最大的方向(或说具有最大的样品
方差)。下面以最简单的二元正态变量来说明主成分的
几何202意0/7/7义。
9
设有 n 个样本,每个样本有p个变量记为X1,…,Xp,
它们的综合变量记为F1,F2,…,Fp。当p=2时,原变
量是X1,X2,设
指标较多再加上指标之间有一定的相关性,势必增加了分

第05章__主成分分析

第05章__主成分分析
但是,对于取值范围相差不大或度量相同的指标建议从协方
差阵求解主成分。
二、主成分分析不要求数据来自正态总体 三主成分分析与重叠信息
(1)主成分分析方法适用于变量之间存在较强相关性的数据,如果原 始数据相关性较弱,运用主成分分析后不能起到很好的降维作用,即所 得到的各个主成分浓缩原始变量信息的能力差别不大,一般认为,当原 始数据大部分变量的相关系数都小于0.3时,运用主成分分析不会取到很 好的效果。 (2)若原始变量存在着多重共线性,主成分分析对重叠信息的剔除是 无能为力的 在进行主成分分析得出协方差阵或相关阵,发现最小特征根接近0时, 就要对初选的指标进行筛选。
差阵求得的主成分一般情况是不相同的。实际表明,这种差 异有时很大。我们认为,如果各指标之间的数量级相差悬殊, 特别是各指标有不同的物理量纲的话,较为合理的做法是使 用R代替∑。对于研究经济问题所涉及的变量单位大都不统 一,采用R代替∑后,可以看作是用标准化的数据做分析, 这样使得主成分有现实经济意义,不仅便于剖析实际问题, 又可以避免突出数值大的变量。
序号 1 2 3 4 5 6 7 8 特征根 3.1049 2.8974 0.9302 0.6421 0.3041 0.0866 0.0322 0.0024 方差贡献率% 38.8114 36.2180 11.6277 8.0265 3.8011 1.0825 0.4023 0.0305 累计贡献率% 38.8114 75.0294 86.6571 94.6836 98.4847 99.5672 99.9695 100.0000
一般来说,利用主成分分析得到的主成分与原始变量之间
的关系: (1)每一个主成分都是各原始变量的线性组合 (2)主成分的数目大大少于原始变量的数目 (3)主成分保留了原始变量绝大多数信息 (4)各主成分之间互不相关

第六章主成分分析

第六章主成分分析
主成分分析的数学模型是,设p个变量构成的p维随机向量为
X = (X1,…,Xp)′。对X作正交变换,令Y = T′X,其中T
为正交阵,要求Y的各分量是不相关的,并且Y的第一个分 量的方差是最大的,第二个分量的方差次之,……,等等。 为了保持信息不丢失,Y的各分量方差和与X的各分量方差 和相等。
5
Y1 的最大方差值为 1 ,其相应的单位化特征向量为T1 。 15
在 求 第 二 主 成 分 之 前 , 我 们 首 先 明 确 , 由 (6.6) 知 Cov(Y2 ,Y1) T2ΣT1 T2T1 。那么,如果 Y2 与Y1 相互独立,即有 T2T1 0 或 T1T2 0 。这时,我们可以构造求第二主成分的目标函 数,即
10
考虑两种极端的情形:
一种是椭圆的长轴与短轴的长度相等,即椭圆变成圆,第一主 成分只含有二维空间点的约一半信息,若仅用这一个综合变量, 则将损失约50%的信息,这显然是不可取的。造成它的原因是, 原始变量X1和X2的相关程度几乎为零,也就是说,它们所包含 的信息几乎不重迭,因此无法用一个一维的综合变量来代替。
第六章 主成分分析
第一节 引言 第二节 主成分的几何意义及数学
推导 第三节 主成分的性质 第四节 主成分方法应用中应注意
的问题 第五节 实例分析与计算机实现
第一节 引言
在实际课题中,为了全面分析问题,往往提出很多与此有关 的变量(或因素),因为每个变量都在不同程度上反映这个 课题的某些信息。
在用统计分析方法研究多变量的问题时,变量个数太多就会 增加问题的复杂性。人们自然希望用尽量少的变量来得到尽 量多的信息。
TkΣTk
(TkTk
1)

k 1
2

主成分分析法

4,主成分分析法主成分分析(Principal Component Analysis,PCA),是一种统计方法。

通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。

主成分分析首先是由K.皮尔森(Karl Pearson)对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。

信息的大小通常用离差平方和或方差来衡量。

②主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。

因此,提取的主成分个数m通常应明显小于原始变量个数p(除非p本身较小),否则维数降低的“利”可能抵不过主成分含义不如原始变量清楚的“弊”。

③当主成分的因子负荷的符号有正有负时,综合评价函数意义就不明确。

4.4主成分分析法的运用叶晓枫,王志良,【2】在介绍主成分分析方法的基本思想及计算方法基础上,对水资源调配评价指标进行了降维计算. 结果显示筛选出的指标对原指标具有较好的代表性,简化了水资源评价问题的难度。

傅湘,纪昌明【3】,针对模糊综合评判法在综合评价中存在的主观随意性问题,提出采用主成分分析法进行区域水资源承载能力综合评价。

对各区域的灌溉率、水资源利用率、水资源开发程度、供水模数、需水模数、人均供水量和生态环境用水率达七个主要因索进行了分析;根据主成分分析法的原理,运用少数几个新的综合指标对原来的七个指标所包含的信息进行最佳综合与简化,研究其在各区域水资源开发利用过程中的不同贡献及综合效应。

周莨棋,徐向阳等【4】,针对传统主成分分析法用于水资源综合评价中存在一些问题,包括指标评价中的“线性”问题、无法体现评价指标主观重要性以及评价范围无法确定。

进行了改进,采用改进的极差正规方法对数据进行规格化,用规格化后的数据加入了主观重要性权进行协方差计算,对协方差特征向量采用正负理想点进行检验。

陈腊娇,冯利华等【5】,将主成分分析方法引入到水资源承载力研究中,并以浙江省为例,在现有资料的基础上,利用主成分分析的方法,定量分析影响水资源承载力变化的最主要的驱动因子。

主成分分析原理及详解

第14章主成分分析1 概述1.1 基本概念1.1.1 定义主成分分析是根据原始变量之间的相互关系,寻找一组由原变量组成、而彼此不相关的综合变量,从而浓缩原始数据信息、简化数据结构、压缩数据规模的一种统计方法。

1.1.2 举例为什么叫主成分,下面通过一个例子来说明。

假定有N 个儿童的两个指标x1与x2,如身高和体重。

x1与x2有显著的相关性。

当N较大时,N观测量在平面上形成椭圆形的散点分布图,每一个坐标点即为个体x1与x2的取值,如果把通过该椭圆形的长轴取作新坐标轴的横轴Z1,在此轴的原点取一条垂直于Z1的直线定为新坐标轴的Z2,于是这N个点在新坐标轴上的坐标位置发生了改变;同时这N个点的性质也发生了改变,他们之间的关系不再是相关的。

很明显,在新坐标上Z1与N个点分布的长轴一致,反映了N个观测量个体间离差的大部分信息,若Z1反映了原始数据信息的80%,则Z2只反映总信息的20%。

这样新指标Z1称为原指标的第一主成分,Z2称为原指标的第二主成分。

所以如果要研究N个对象的变异,可以只考虑Z1这一个指标代替原来的两个指标(x1与x2),这种做法符合PCA提出的基本要求,即减少指标的个数,又不损失或少损失原来指标提供的信息。

1.1.3 函数公式通过数学的方法可以求出Z1和Z2与x1与x2之间的关系。

Z1=l11x1+ l12x2Z2=l21x1+ l22x2即新指标Z1和Z2是原指标x1与x2的线性函数。

在统计学上称为第一主成分和第二主成分。

若原变量有3个,且彼此相关,则N个对象在3维空间成椭圆球分布,见图14-1。

通过旋转和改变原点(坐标0点),就可以得到第一主成分、第二主成分和第三主成分。

如果第二主成分和第三主成分与第一主成高度相关,或者说第二主成分和第三主成分相对于第一主成分来说变异很小,即N个对象在新坐标的三维空间分布成一长杆状时,则只需用一个综合指标便能反映原始数据中3个变量的基本特征。

1.2 PCA满足条件1.2.1 一般条件一般来说,N个对象观察p个指标,可以得到N*p个数据(矩阵)。

第六章-主成分分析法精选全文

可编辑修改精选全文完整版第六章 主成分分析法主成分分析法是将高维空间变量指标转化为低维空间变量指标的一种统计方法。

由于评价对象往往具有多个属性指标,较多的变量对分析问题会带来一定的难度和复杂性。

然而,这些指标变量彼此之间常常又存在一定程度的相关性,这就使含在观测数据中的信息具有一定的重叠性。

正是这种指标间的相互影响和重叠,才使得变量的降维成为可能。

即在研究对象的多个变量指标中,用少数几个综合变量代替原高维变量以达到分析评价问题的目的。

当然,这少数指标应该综合原研究对象尽可能多的信息以减少信息的失真和损失,而且指标之间彼此相互独立。

第一节 引言主成分分析,也称主分量分析,由皮尔逊(Pearson )于1901年提出,后由霍特林(Hotelling )于1933年发展了,这也正是现在多元统计分析中的一种经典统计学观点。

经典统计学家认为主成分分析是确定一个多元正态分布等密度椭球面的主轴,这些主轴由样本来估计。

然而,现代越来越多的人从数据分析的角度出发,用一种不同的观点来考察主成分分析。

这时,不需要任何关于概率分布和基本统计模型的假定。

这种观点实际上是采用某种信息的概念,以某种代数或几何准则最优化技术对一个数据阵的结构进行描述和简化。

主成分分析方法的主要目的就是通过降维技术把多个变量化为少数几个主要成分进行分析的统计方法。

这些主要成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线性组合。

为了使这些主要成分所含的信息互不重迭,应要求它们互不相关。

当分析结束后,最后要对主成分做出解释。

当主成分用于回归或聚类时,就不需要对主成分做出解释。

另外,主成分还有简化变量系统的统计数字特征的作用。

对于任意p 个变量,描述它们自身及其相互关系的数字特征包括均值、方差、协方差等,共有)1(21-+p p p 个参数。

经过主成分分析后,每个新变量的均值和协方差都为零,所以,变量系统的数字特征减少了)1(21-+p p p 个。

主成分分析方法PPT课件


X
x21
x22
x2
p
xn1
xn 2
xnp
❖ 当p较大时,在p维空间中考察问题比较麻烦。 为了克服这一困难,就需要进行降维处理. 要求:较少的几个综合指标尽量多地反映原来较 多变量指标所反映的信息,同时它们之间又是彼 此独立的
例,成绩数据
❖ 100个学生的数学、物理、化学、语文、历 史、英语的成绩如下表(部分)。
p
lk2j 1, (k 1,2,, m)
j 1
Rlk lk (R E)lk 0
计算主成分贡献率及累计贡献率
▲贡献率:
k
p
i
(k 1,2,, p)
i 1
▲累计贡献率:
k
p
j1 j / i1 i
一般取累计贡献率达85—95%的特征值 1, 2 ,, m 所对应的第一、第二、…、第m(m≤p)个主成分
6
6
样方
1
物种X1 1
物种X2 5
2 3 4 5 6 总和 2 0 2 -4 -1 0 2 1 0 -4 -4 0
种X2
X2
12
10
8
6
4
2
0
0
1
2
3
4
5
6
7
种X1
6 5 4 3 2 1 0 -5 -4 -3 -2 -1-1 0 1 2 3 4 5 6 -2 -3 -4 -5
X1
中心化后的原始数据矩阵
X
1 5
2 2
0 1
2 0
4 4
1 4
❖ 把坐标轴X1、 X2刚性地旋转 一个角度,得
到图中新坐标
轴Y1和Y2
X2
6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

对主成分分析法的知识点进行分解,并给予几何解释和分析。文章为学生直观理解主成分分析法提供一个几
何视角。
关键词:主成分分析;协方差矩阵;向量运算
中图分类号:G642.0
文献标志码:A
文章编号:1674-9324(2018)22-0172-02
在教学过程中,系统工程、多元统计分析等课程 里关于主成分分析内容的介绍,现有教材里多使用公 式推导来抽象解释,缺乏几何直观解释,从而影响了 学生对于该方法的直观理解。本文结合实际教学经 验,尝试从解析几何的角度出发,分解并介绍该方法 的各个知识点,为学生深入直观理解该方法提供一个 新的视角。
点在矢量空间里运动,即旋转或平移。
3.样本数据标准化处理。由样本点集合X=(X1,X2, …,Xm)T出发,先将X标准化处理为Y以便于后继计算, 即将样本点在n维坐标系中的各个坐标轴上进行标准

处理,其
-
-
中Yij=(Xij-X·j)/S·j,X·j为第j列的
均值,S·2j为
第j列的方差,
∑ ∑ -
参考文献:
[1]汪应洛.系统工程理论、方法与应用[M].北京:高等教育出
X·j=
1 m
m i=1
Xij,S·2j=
1 m-1
m i=1
-
(Xij-X·j),(j=1,2,…,
n).
4.协方差矩阵计算。考虑两个向量之间的差异性
度量用角度余弦来表示,标准化样本点集合Y中,第i 列向量Y·i和第j列向量Y·j之间的差异可以表示为向量 之间的点乘再除以各自的模长,即为,
cosθij=Y··i Y·j/ 蓸 Y·i · Y·j 蔀 ,(i,j=1,2,…,n),
-172-
2018 年 5 月 第 22 期
教育教学论坛 EDUCATION TEACHING FORUM
May 2018 NO.22
∑m
k=1 YkiYkj,Δ即为标准化样本集合Y的协方差矩阵。 5.计算特征根降序排列。设Δ的特征根为λ,则存
少数几个主要成分作为指标来有效描述原来n个指标 所描述的样本点集,选择累计贡献率占主要部分的若 干特征根所对应的特征向量最终构成新的坐标系。累
在特征向量z,使得Δ·z=λ·z。设特征根λ共有n个,则 λ可以写为λ=(λ1,λ2,...,λn)的形式,并满足条件 λ1≥λ2≥,...,λi,...,≥λn。可根据各个特征根计算 相应的特征向量z=(z1,z2,...zi,...,zn),其中zi为特征根 λi所对应的n维特征向量。特征向量zi即为新坐标系中 与特征根λi所对应的第i个新坐标系轴在旧n维坐标 系中的方向向量表示。因此,对于m个样本点,其在旧n 维坐标系中位置,可以投影到新坐标系z=(z1,z2,...zi,.. .,zn)的各个坐标轴上,获得在新坐标系中的坐标。我 们知道向量点乘是投影运算,设第k个样本点为n维向 量Xk·,其中1<k<m,则样本点Xk·在新坐标系下的坐标 可以写为,Zk·=z·Xk·,即
2018 年 5 月 第 22 期
教育教学论坛 EDUCATION TEACHING FORUMLeabharlann May 2018 NO.22
几何观点下的主成分分析法知识点浅析
唐明 (吉林大学交通学院,吉林 长春 130000)
摘要:主成分分析法在教材里,多使用公式推导,缺乏几何直观解释。本文针对上述问题,引入几何观点,
一、主成分分析法概述 主成分分析 (Principal Component Analysis,PCA) 是系统工程学中的一种矩阵数据处理方法,用于分析 系统中影响因素所对应的指标向量,通过坐标系变换 的方法,将原有众多相关的指标向量组转换为新的少 数不相关指标向量组,从而达到系统降维、提炼潜在 抽象因素的目的。 二、知识点分解 1.问题描述。设对某系统的研究涉及n个指标,分 别用x1,x2,…,xn来表示,这个n个指标构成的n维向量 Xi=(x1,x2,...,xn),可以认为是Xi在n维空间上的一个样 本点,设系统中有m个n维样本点,可表示为X=(X1,X2, …,Xm)T,其中X为m行n列的矩阵。寻找一组新的坐标 系来代替现有的n维坐标系,使得在新的坐标系下,各 个坐标向量相互独立,且样本点在新坐标系里,在各 个新坐标轴方向上的位置分布,依次有最大的方差。 2.矩阵向量积的几何意义。矩阵向量积即为矩阵 乘以向量,记为a`=Aa,其中A为矩阵,a和a`为向量。该 乘积的几何意义为,向量a在矩阵A的作用下经过旋转 或者拉伸后得到的新向量a`,或者说矩阵向量积导致
差计算公式为,
∑ 方差:m1-1 km=1(Ykj-Y-·j)2=1,均值:Y-·j=0,
代入
上面Δij的表达式得到
简化形式
,Δ
ij =
1 m-1
收稿日期:2018-04-01 基金项目:2017年教改项目———交通运输工程学科创新型人才培养课程体系构建 作者简介:唐明(1976-),男(汉族),河南临颍人,吉林大学,讲师,博士,研究方向:系统建模与仿真。 通讯作者:唐明。
其中分子部分表示两个列向量的点乘,可以将式
子写为向量的坐标分量运算的形式,
∑ 蓸 姨∑ 姨∑ 蔀 m
Δ ij = k=1 Y ki Y kj /
Y m
2
k=1 ki
Y m
2
k=1 kj
, 其 中 Δ ij
=cosθij。
我们注意到Y是经过标准化处理的样本点集,故
有第j列向量的均值为零,方差为1,第j列向量的标准
其中λ= (λ1,λ2,...,λn),λ1≥λ2≥,...,λi,...,
≥λn,1<r<n。
三、结束语
文章从解析几何的角度对主成分分析法的知识
点进行了分解和内容分析,使得学生在课堂学习过程
中能够透过繁杂的矩阵运算,从几何角度直观地看到
各个知识点背后所蕴含的技巧与方法,从而直观理解
PCA方法解决工程问题的数学本质。
Zk·=(z1·Xk·,z2·Xk·,...z·i Xk·,...,zn·Xk·),k=1,2,…, m.
所以,对于所有的m个样本点集X可以转换为在 新坐标系的点集合Z,简写为Z=z·X。
6.主成分选择。主成分选择即为特征向量的选择。 为了降低问题的维度,减少考虑因素,需要合理选择
∑ ∑ r
n
计贡献率I的计算公式为,I= i=1 λi/ i=1 λi,
相关文档
最新文档