K主成分分析资料
K主成分分析资料

第十一章 主成分分析第一节主成分分析及其基本思想地理系统是多要素的复杂系统,在地理学研究中,经常会遇到多变量问题。
变量太多,会增加分析问题的难度与复杂性,而在许多实际问题中,多个变量之间是具有一定的相关关系的。
能否在相关分析的基础上,通过某些线性组合使原始变量减少为有代表意义的少数几个新的变量,而且这些较少的新变量尽可能多地保留原来变量所反映的信息?解决这个问题的数学方法就是主成分分析。
主成分分析的数学原理简单易懂,在地理学研究中应用较为广泛。
主成分分析(Principal Components Analysis ,PCA)也称为主分量分析,是一种通过降维来简化数据结构的方法:如何把多个变量(指标)化为少数几个综合变量(综合指标),而这几个综合变量可以反映原来多个变量的大部分信息。
为了使这些综合变量所含的信息互不重叠,应要求它们之间互不相关。
一、主成分分析的基本思想主成分分析在数学 上就是将原来m 个指标作线性组合,求得新的综合指标,并选取几个具有代表性的综合指标(原指标的线性组合)。
下面介绍这种选择的方法原理和实现过程。
如果将选取的第一个线性组合即第一个综合指标记为z1,自然希望z1尽可能多地反映原来的指标信息,这里的“信息”用什么来表示呢?最经典的方法就是用z1的方差来表示,z1的方差越大,表示z1包含的信息越多。
因此,在所有的线性组合中,选取的z1应该是方差最大的,称z1为第一主成分。
如果z1没有包含原来m 个指标的绝大部分信息,则需要考虑选取第二个线性组合z2,且希望z1中已有的信息不出现在z2中,即z1与z2的协方差Cov(z1,z2)=0。
那 么z2就是第二主成分,依此可以建立第三、第四等主成分,要求这些主成分互不相关,且方差依次减小。
二、主成分分析的几何意义和数学模型为了方便,下面通过一个例子在二维空间中讨论主成分的几何意义。
图17-115 主成分的几何意义设有n 个样品,每个样品测量了两个变量x1和x2,在由x1和x2确定的样品空间中,n 个样品点的分布如图所示。
KL变换和主成分分析

根据经济学知识,斯通给这三个新 变量分别命名为总收入F1、总收入变化 率F2和经济发展或衰退的趋势F3。更有 意思的是,这三个变量其实都是可以直 接测量的。
主成分分析就是试图在力保数据信息丢 失最少的原则下,对这种多变量的数据表进 行最佳综合简化,也就是说,对高维变量空 间进行降维处理。
jd 1
λ j :拉格朗日乘数
g(uj )
uTj Ru j
j
(u
T j
u
j
1)
jd 1
jd 1
用函数 g(u j ) 对 u j 求导,并令导数为零,得
(R j I )u j 0 j d 1, ,
——正是矩阵 R 与其特征值和对应特征向量的关系式。
• 如果这些数据形成一个椭圆形状的 点阵(这在变量的二维正态的假定下 是可能的).
3.2 PCA: 进一步解释
• 椭圆有一个长轴和一 个短轴。在短轴方向上, 数据变化很少;在极端的 情况,短轴如果退化成一 点,那只有在长轴的方向 才能够解释这些点的变化 了;这样,由二维到一维 的降维就自然完成了。
分为: 连续K-L变换 离散K-L变换
1.K-L展开式 设{X}是 n 维随机模式向量 X 的集合,对每一个 X 可以
用确定的完备归一化正交向量系{u j } 中的正交向量展开:
X a juj j 1
d
用有限项估计X时 :Xˆ a juj j 1
aj:随机系数;
引起的均方误差: E[( X Xˆ )T ( X Xˆ )]
总样本数目为 N。将 X 变换为 d 维 (d n) 向量的方法:
主成分分析案例数据

主成分分析案例数据目录主成分分析案例数据 (1)介绍主成分分析 (1)主成分分析的定义和背景 (1)主成分分析的应用领域 (2)主成分分析的基本原理 (3)主成分分析案例数据的收集和准备 (4)数据收集的方法和来源 (4)数据的预处理和清洗 (5)数据的特征选择和变换 (6)主成分分析的步骤和方法 (7)数据的标准化和中心化 (7)协方差矩阵的计算 (8)特征值和特征向量的求解 (9)主成分的选择和解释 (10)主成分分析案例数据的分析和解释 (11)主成分的解释和贡献率 (11)主成分的权重和特征 (11)主成分得分的计算和应用 (12)主成分分析的结果和结论 (13)主成分分析的结果解读 (13)主成分分析的应用建议 (14)主成分分析的局限性和改进方法 (15)总结和展望 (16)主成分分析的优势和局限性总结 (16)主成分分析的未来发展方向 (16)主成分分析在实际问题中的应用前景 (16)介绍主成分分析主成分分析的定义和背景主成分分析(Principal Component Analysis,简称PCA)是一种常用的多变量数据分析方法,旨在通过降维将高维数据转化为低维数据,同时保留原始数据中的主要信息。
它是由卡尔·皮尔逊(Karl Pearson)于1901年提出的,被广泛应用于数据挖掘、模式识别、图像处理等领域。
主成分分析的背景可以追溯到19世纪末,当时统计学家们开始关注如何处理多变量数据。
在那个时代,数据集的维度往往非常高,而且很难直观地理解和分析。
因此,研究人员开始寻找一种方法,能够将高维数据转化为低维数据,以便更好地理解和解释数据。
主成分分析的基本思想是通过线性变换将原始数据映射到一个新的坐标系中,使得新坐标系下的数据具有最大的方差。
这样做的目的是希望通过保留原始数据中的主要信息,同时减少数据的维度,从而更好地理解数据的结构和特征。
具体而言,主成分分析通过计算数据的协方差矩阵,找到一组正交的基向量,称为主成分。
主成分分析完整版

主成分分析完整版一、主成分分析的原理1.标准化数据:先对原始数据进行标准化处理,以确保不同变量的尺度一致。
2.计算协方差矩阵:对标准化后的数据计算协方差矩阵,矩阵中的元素表示不同变量之间的相关性。
3.计算特征值和特征向量:对协方差矩阵进行特征值分解,得到特征值和对应的特征向量。
4.选择主成分:按照特征值的大小选择最重要的k个特征值和它们对应的特征向量,称之为主成分。
5.数据转换:将原始数据投影到选取的主成分上,得到降维后的数据。
二、主成分分析的方法1.方差解释比:主成分分析通过特征值展示了每个主成分的重要性。
方差解释比是计算每个主成分的方差所占总方差的比例。
选择解释总方差的比例较高的主成分,可以保留更多的信息。
2.累计方差解释比:累计方差解释比是计算前n个主成分的方差解释比之和。
通过选择累计方差解释比较高的主成分,可以保留更多的原始数据信息。
3.维度选择:主成分分析可以通过选择合适的主成分数来实现数据降维。
通过观察特征值的大小和累计方差解释比,可以选择合适的主成分数。
三、主成分分析的应用1.数据可视化:主成分分析可以将高维度的数据转换为低维度的数据,从而方便可视化。
通过在二维或三维空间中绘制主成分,可以更好地理解数据的分布和关系。
2.特征提取:主成分分析可以提取数据中的最重要特征,从而减少数据维度并保留主要信息。
特征提取可以在分类、聚类等问题中提高算法的效果。
3.数据压缩:主成分分析可以将高维度的数据压缩为低维度的数据,从而节省存储空间和计算时间。
压缩后的数据可以用于后续分析和处理。
4.噪音过滤:主成分分析通过保留数据中最重要的特征,可以减少噪音的影响。
通过滤波后的数据可以提高实验测量的准确性和稳定性。
综上所述,主成分分析是一种强大的数据降维技术,可以在许多领域中应用。
熟悉主成分分析的原理、方法和应用,对于理解数据和提升数据分析的能力具有重要意义。
什么是主成分分析精选全文

可编辑修改精选全文完整版主成分分析(principal component analysis, PCA)如果一组数据含有N个观测样本,每个样本需要检测的变量指标有K个, 如何综合比较各个观测样本的性质优劣或特点?这种情况下,任何选择其中单个变量指标对本进行分析的方法都会失之偏颇,无法反映样本综合特征和特点。
这就需要多变量数据统计分析。
多变量数据统计分析中一个重要方法是主成份分析。
主成分分析就是将上述含有N个观测样本、K个变量指标的数据矩阵转看成一个含有K维空间的数学模型,N个观测样本分布在这个模型中。
从数据分析的本质目的看,数据分析目标总是了解样本之间的差异性或者相似性,为最终的决策提供参考。
因此,对一个矩阵数据来说,在K维空间中,总存在某一个维度的方向,能够最大程度地描述样品的差异性或相似性(图1)。
基于偏最小二乘法原理,可以计算得到这个轴线。
在此基础上,在垂直于第一条轴线的位置找出第二个最重要的轴线方向,独立描述样品第二显著的差异性或相似性;依此类推到n个轴线。
如果有三条轴线,就是三维立体坐标轴。
形象地说,上述每个轴线方向代表的数据含义,就是一个主成份。
X、Y、Z轴就是第1、2、3主成份。
由于人类很难想像超过三维的空间,因此,为了便于直观观测,通常取2个或者3个主成份对应图进行观察。
图(1)PCA得到的是一个在最小二乘意义上拟合数据集的数学模型。
即,主成分上所有观测值的坐标投影方差最大。
从理论上看,主成分分析是一种通过正交变换,将一组包含可能互相相关变量的观测值组成的数据,转换为一组数值上线性不相关变量的数据处理过程。
这些转换后的变量,称为主成分(principal component, PC)。
主成分的数目因此低于或等于原有数据集中观测值的变量数目。
PCA最早的发明人为Karl Pearson,他于1901年发表的论文中以主轴定理(principal axis theorem)衍生结论的形式提出了PCA的雏形,但其独立发展与命名是由Harold Hotelling于1930年前后完成。
主成分分析

语言表达就是要求Cov(F1,F2)=0,称F2为第二主成分, 依此类推可以造出第三,四,…,第p个主成分。不难 想像这些主成分之间不仅不相关,而且它们的方差依次 递减。因此在实际工作中,就挑选前几个最大主成分, 虽然这样做会损失一部分信息,但是由于它使我们抓住 了主要矛盾,并从原始数据中进一步提取了某些新的信 息,因而在某些实际问题的研究中得益比损失大,这种 既减少了变量的数目又抓住了主要矛盾的做法有利于问 题的分析和处理。
第p个特征值所对应特征向量处达到。
这里要说明两点:一个是数学模型中为什么作线性组合? 基于两种原因:①数学上容易处理;②在实践中效果很好。 另一个要说明的是每次主成分的选取使Var(Fi)最大,如果 不加限制就可使Var(Fi) 则就无意义了,而常用的 限制是要求 (2 )主成分的几何意义 从代数学观点看主成分就是p个变量X1…,Xp的 一些特殊的线性组合,而在几何上这些线性组合正是把 X1,…,Xp构成的坐标系旋转产生的新坐标系,新坐标 轴使之通过样品变差最大的方向(或说具有最大的样品 方差 )。下面以最简单的二元正态变量来说明主成分的 9 2015/12/16 几何意义。
我们看到F1,F2是原变量 X1 和 X2 的线性组合,用矩阵表 示是
显然
且是正交矩阵,即
从上图还容易看出二维平面上的n个点的波动(可用方 差表示)大部分可以归结为在 F1 轴上的波动,而在F2轴上 的波动是较小的。如果上图的椭园是相当扁平的,那么我 们可以只考虑F1方向上的波动,忽略F2方向的波动。这样 一来,二维可以降为一维了,只取第一个综合变量 F1即可。 2015/12/16 11 而F1是椭园的长轴。
2、主成分分析的数学模型及几何解释
(1 )、 数学模型
设有 n 个样品,每个样品观测p项指标(变量), X1, X2, …,Xp,得到原始数据资料阵: 2015/12/16 5
模式识别主成分分析和KL变换

模式识别:主成分分析和KL变换什么是模式识别?模式识别是一种利用计算机算法和数学方法,通过对给定数据进行处理和分析,找出其内在规律和模式的一种技术。
模式识别在许多领域中都有应用,在人工智能、机器学习、数据挖掘等领域中都有广泛的应用。
主成分分析主成分分析(Principal Component Analysis,PCA)是一种数据降维技术,可以将高维数据降到低维,同时尽可能地保留数据的信息。
PCA的一般思路是找到一个新的坐标系,将数据映射到这个新的坐标系中,从而达到数据降维的目的。
主成分分析的基本实现步骤如下:1.数据中心化。
将各维度数据减去其均值,使其在新坐标系中保持原有的方差(即去除数据的线性相关性)。
2.计算协方差矩阵。
协方差矩阵的每个元素表示数据在不同维度上的相关程度。
3.计算协方差矩阵的特征值和特征向量。
特征向量描述了协方差矩阵的方向,而特征值表示协方差矩阵沿该方向的大小。
4.选择最大特征值对应的特征向量,作为新的坐标系。
5.将数据映射到新的坐标系中。
,PCA算法是将高维数据转化为低维数据的过程,它可以快速识别数据的内在结构,发现隐藏数据之间的相关性信息。
KL变换KL变换(Karhunen-Loève Transform,KLT)又称作Hotelling变换,它是一种优秀的信号处理技术,也常被用于模式识别。
KL变换的主要目的是分离信号中的信息和噪声成分,将重要信息提取出来,以便实现信号的压缩和去噪等操作。
KL变换的主要思路是将一组信号的协方差函数分析,然后求出其特征分解,从而得到KL基函数。
KL基函数是一组正交函数,它基于信号中的协方差函数进行计算。
KL基函数的特点是垂直于噪声分布的方向,能够很好地去除信号中的噪声成分。
对于一个N维随机向量X,KL变换可以描述为下列公式:KL变换公式KL变换公式式中,X是一个N维随机向量,K是一个N*N的矩阵,其列向量是单位正交向量。
KL变换可以针对任意信号类型进行处理,对于平稳信号而言,KL变换还可以处理非平稳性的问题,得到良好的结果。
第六章-主成分分析法精选全文

可编辑修改精选全文完整版第六章 主成分分析法主成分分析法是将高维空间变量指标转化为低维空间变量指标的一种统计方法。
由于评价对象往往具有多个属性指标,较多的变量对分析问题会带来一定的难度和复杂性。
然而,这些指标变量彼此之间常常又存在一定程度的相关性,这就使含在观测数据中的信息具有一定的重叠性。
正是这种指标间的相互影响和重叠,才使得变量的降维成为可能。
即在研究对象的多个变量指标中,用少数几个综合变量代替原高维变量以达到分析评价问题的目的。
当然,这少数指标应该综合原研究对象尽可能多的信息以减少信息的失真和损失,而且指标之间彼此相互独立。
第一节 引言主成分分析,也称主分量分析,由皮尔逊(Pearson )于1901年提出,后由霍特林(Hotelling )于1933年发展了,这也正是现在多元统计分析中的一种经典统计学观点。
经典统计学家认为主成分分析是确定一个多元正态分布等密度椭球面的主轴,这些主轴由样本来估计。
然而,现代越来越多的人从数据分析的角度出发,用一种不同的观点来考察主成分分析。
这时,不需要任何关于概率分布和基本统计模型的假定。
这种观点实际上是采用某种信息的概念,以某种代数或几何准则最优化技术对一个数据阵的结构进行描述和简化。
主成分分析方法的主要目的就是通过降维技术把多个变量化为少数几个主要成分进行分析的统计方法。
这些主要成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线性组合。
为了使这些主要成分所含的信息互不重迭,应要求它们互不相关。
当分析结束后,最后要对主成分做出解释。
当主成分用于回归或聚类时,就不需要对主成分做出解释。
另外,主成分还有简化变量系统的统计数字特征的作用。
对于任意p 个变量,描述它们自身及其相互关系的数字特征包括均值、方差、协方差等,共有)1(21-+p p p 个参数。
经过主成分分析后,每个新变量的均值和协方差都为零,所以,变量系统的数字特征减少了)1(21-+p p p 个。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十一章 主成分分析第一节主成分分析及其基本思想地理系统是多要素的复杂系统,在地理学研究中,经常会遇到多变量问题。
变量太多,会增加分析问题的难度与复杂性,而在许多实际问题中,多个变量之间是具有一定的相关关系的。
能否在相关分析的基础上,通过某些线性组合使原始变量减少为有代表意义的少数几个新的变量,而且这些较少的新变量尽可能多地保留原来变量所反映的信息?解决这个问题的数学方法就是主成分分析。
主成分分析的数学原理简单易懂,在地理学研究中应用较为广泛。
主成分分析(Principal Components Analysis ,PCA)也称为主分量分析,是一种通过降维来简化数据结构的方法:如何把多个变量(指标)化为少数几个综合变量(综合指标),而这几个综合变量可以反映原来多个变量的大部分信息。
为了使这些综合变量所含的信息互不重叠,应要求它们之间互不相关。
一、主成分分析的基本思想主成分分析在数学 上就是将原来m 个指标作线性组合,求得新的综合指标,并选取几个具有代表性的综合指标(原指标的线性组合)。
下面介绍这种选择的方法原理和实现过程。
如果将选取的第一个线性组合即第一个综合指标记为z1,自然希望z1尽可能多地反映原来的指标信息,这里的“信息”用什么来表示呢?最经典的方法就是用z1的方差来表示,z1的方差越大,表示z1包含的信息越多。
因此,在所有的线性组合中,选取的z1应该是方差最大的,称z1为第一主成分。
如果z1没有包含原来m 个指标的绝大部分信息,则需要考虑选取第二个线性组合z2,且希望z1中已有的信息不出现在z2中,即z1与z2的协方差Cov(z1,z2)=0。
那 么z2就是第二主成分,依此可以建立第三、第四等主成分,要求这些主成分互不相关,且方差依次减小。
二、主成分分析的几何意义和数学模型为了方便,下面通过一个例子在二维空间中讨论主成分的几何意义。
图17-115 主成分的几何意义设有n 个样品,每个样品测量了两个变量x1和x2,在由x1和x2确定的样品空间中,n 个样品点的分布如图所示。
从图可以看到,变量x1和x2都有较大的波动(方差较大),而且二者具有明显的相关性。
如果作一坐标旋转,取z1和z2为新坐标轴。
在新坐标系中,n 个样品点的新坐标的相关性很小,几乎为0;n 个点的方差大部分归结为z1的方差,而z2的方差很小,故用z1就可以反映变量的大部分信息;z1和z2 与x1和x2之间的关系为:11111222211222z l x l x z l x l x =+⎧⎨=+⎩ 将以上结果推广到m 维的情况,设有n 个样品,每个样品有m 个变量,经过适当的线性组合,可以得到m 个新变量:11111221221122221122m m m m m m m mm mz l x l x l x z l x l x l x z l x l x l x =+++⎧⎪=+++⎪⎨⎪⎪=+++⎩ 系数ij l 由下列原则决定 (1) i z 与j z ( ,,1,2,,i j i j m ≠=)互相无关;(2)z1是原始变量12,,,m x x x 的一切线性组合中方差最大的;z2与z1不相关且除z1外在原始变量12,,,m x x x 的一切线性组合中方差最大;……;zm与121,,,m z z z -不相关且除121,,,m z z z -外在原始变量12,,,m x x x 的一切线性组合中方差最大。
这样确定的新变量12,,,m z z z 称为原始变量的第一,第二,……,第m 主成分,其中z1在总的方差中占的比例最大,其余的23,,,m z z z 的方差依次递减,其重要性也依次减小,这样就可以取前面少数几个主成分对样本数据的主要性质进行分析。
第二节 主成分分析的计算步骤找主成分就是确定原始变量12,,,m x x x 在诸主成分12,,,m z z z 上的载荷ij l 。
从数学上可以得到证明,它们分别是12,,,m x x x 的相关矩阵中较大特征值所对应的特征向量。
根据主成分分析的基本思想和基本原理,可以把主成分分析的计算步骤归纳如下:1、对地理数据进行标准化处理。
由于变量的量纲的数值的差别,在做主成分分析时,需要对变量进行标准化处理,常用的标准化处理方法是标准差标准化法。
设原始数据为n 个样品,每个样品p 个观察值组成的矩阵。
2、计算相关系数矩阵R3、计算特征值和特征向量4、计算贡献率和累计贡献率5、计算主成分载荷6、计算主成分得分第三节 主成分分析在PASW Statistics 中的实现表13-1给出了某农业生态经济系统各个区域单元的有关数据,下面我们对这个农业生态经济做主成分分析,得出维度较少的几个代表性因子。
样本序号人口密度x1/(人·.km-2)人均耕地面积x 2/hm2)森林覆盖率x3/%农民人均纯收入x4/(元·人-1)人均粮食产量x5 (kg·人-1)经济作物占农作物播面比例x6/%耕地占土地面积比率x7/%果园与林地面积之比x8/%灌溉田占耕地面积之比x9/%1 363.912 0.352 16.101 192.110 295.340 26.724 18.492 2.231 26.2622 141.503 1.684 24.301 1752.350 452.260 32.314 14.464 1.455 27.0663 100.695 1.067 65.601 1181.540 270.120 18.266 0.162 7.474 12.4894 143.739 1.336 33.205 1436.120 354.260 17.486 11.805 1.892 17.5345 131.412 1.623 16.607 1405.090 586.590 40.683 14.401 0.303 22.9326 68.337 2.032 76.204 1540.290 216.390 8.128 4.065 0.011 4.8617 95.416 0.801 71.106 926.350 291.520 8.135 4.063 0.012 4.8628 62.901 1.652 73.307 1501.240 225.250 18.352 2.645 0.034 3.2019 86.624 0.841 68.904 897.360 196.370 16.861 5.176 0.055 6.16710 91.394 0.812 66.502 911.240 226.510 18.279 5.643 0.076 4.47711 76.912 0.858 50.302 103.520 217.090 19.793 4.881 0.001 6.16512 51.274 1.041 64.609 968.330 181.380 4.005 4.066 0.015 5.40213 68.831 0.836 62.804 957.140 194.040 9.110 4.484 0.002 5.79014 77.301 0.623 60.102 824.370 188.090 19.409 5.721 5.055 8.41315 76.948 1.022 68.001 1255.420 211.550 11.102 3.133 0.010 3.42516 99.265 0.654 60.702 1251.030 220.910 4.383 4.615 0.011 5.59317 118.505 0.661 63.304 1246.470 242.160 10.706 6.053 0.154 8.70118 141.473 0.737 54.206 814.210 193.460 11.419 6.442 0.012 12.94519 137.761 0.598 55.901 1124.050 228.440 9.521 7.881 0.069 12.65420 117.612 1.245 54.503 805.670 175.230 18.106 5.789 0.048 8.46121 122.781 0.731 49.102 1313.110 236.290 26.724 7.162 0.092 10.078 注:数据来源于徐建华《计量地理学》(2006年第1版)PASW Statistics中的实现步骤:步骤1:在“分析”菜单的“降维”子菜单中选择“因子分析”命令,如图11-1所示。
图11-1 菜单中选择“因子分析”命令步骤2:在弹出的如图11-2所示的“因子分析”对话框中,从左侧的变量列表中选择这9个变量,添加到“变量”框中。
步骤3:单击“描述”按钮,弹出“因子分析:描述统计”对话框,如图13-3所示。
图11-2 “因子分析”对话框图11-3 “因子分析:描述统计”对话框“统计量”框用于选择输出哪些相关的统计量,选项如下。
★单变量描述性:要求输出各变量的平均数与标准差。
★原始分析结果:表示输出初始分析结果。
输出的是因子提取前分析变量的公因子方差,是一个中间结果。
对主成分分析来说,这些值是要进行分析变量的相关或协方差矩阵的对角元素;对因子分析模型来说,输出的是每个变量是否合适作因子分析的检验方法。
“相关矩阵”框中提供了以下几种变量是否适合作因子分析的方法。
★系数:要求计算相关系数矩阵★显著性水平:选择此项给出每个相关系数的单尾假设检验的水平。
★行列式:相关系数矩阵的行列式。
★逆模型:相关系数矩阵的逆矩阵★再生:再生相关阵。
选择此项给出因子分析后的相关阵,还给出残差,即原始相关与再生相关之间的差值。
★反映像:反映像相关矩阵检验。
反映像相关阵,包括偏相关系数的取反;反映像协方差阵,偏协方差的取反。
★KMO 和Bartlett的球形度检验:即KMO检验和巴特利特球形检验。
KMO检验,检验变量间的偏相关是否很小;巴特利特球形检验,检验相关阵是否为单位阵。
在本例中,选择该对话框中所有选项。
单击“继续”,返回“因子分析”对话框。
步骤4:单击“抽取”按钮,弹出“因子分析:抽取”对话框,选择因子提取方法。
如图11-4所示。
图11-4 “因子分析:抽取”对话框因子提取方法在“方法”下拉框中选取,PASW Statistics提供了7种方法。
★主成份(主成分分析法)★未加权最小平方法★综合最小平方法★最大似然(极大似然估计法)★主轴因子分解(主轴因子法)★α因子分解(α因子法)★映像因子分解(映像因子提取法)“分析”框用于选择提取因子变量的依据,选项如下:★相关性矩阵:表示依据相关系数矩阵★协方差矩阵:表示依据协方差矩阵“抽取”框用于指定因子个数的标准,选项如下。