如何有效利用主成分分析进行综合评价

合集下载

主成分分析用于多指标评价的方法研究主成分评价

主成分分析用于多指标评价的方法研究主成分评价

主成分分析用于多指标评价的方法研究主成分评价一、本文概述本文旨在探讨主成分分析(PCA)在多指标评价中的应用及其方法研究。

主成分分析作为一种广泛使用的统计分析工具,其主要目的是通过降维技术,将多个相关变量转化为少数几个独立的综合指标,即主成分,以便更好地揭示数据的内在结构和规律。

在多指标评价体系中,由于指标间可能存在的信息重叠和相关性,直接分析往往难以得出清晰的结论。

因此,利用主成分分析进行降维处理,提取出关键的主成分,对于简化评价过程、提高评价效率和准确性具有重要意义。

本文首先介绍主成分分析的基本原理和步骤,包括数据标准化、计算协方差矩阵、求解特征值和特征向量、确定主成分个数以及计算主成分得分等。

然后,结合具体案例,详细阐述主成分分析在多指标评价中的应用过程,包括评价指标的选择、数据的预处理、主成分的计算和解释等。

对主成分分析方法的优缺点进行讨论,并提出相应的改进建议,以期为多指标评价领域的研究和实践提供参考和借鉴。

通过本文的研究,旨在加深对主成分分析在多指标评价中应用的理解,提高评价方法的科学性和实用性,为相关领域的研究和实践提供有益的启示和帮助。

二、主成分分析的基本原理和方法主成分分析(Principal Component Analysis,PCA)是一种广泛应用于多变量数据分析的统计方法。

其基本原理是通过正交变换将原始数据转换为一系列线性不相关的变量,即主成分。

这些主成分按照其解释的原始数据方差的大小进行排序,第一个主成分解释的方差最大,之后的主成分依次递减。

通过这种方式,主成分分析可以在不损失过多信息的前提下,降低数据的维度,从而简化复杂的多变量系统。

数据标准化:需要对原始数据进行标准化处理,以消除量纲和数量级的影响。

标准化后的数据均值为0,标准差为1。

计算协方差矩阵:然后,计算标准化后的数据的协方差矩阵,以捕捉变量之间的相关性。

计算特征值和特征向量:接下来,求解协方差矩阵的特征值和特征向量。

主成分分析综合评价应该注意的问题

主成分分析综合评价应该注意的问题

主成分分析综合评价应该注意的问题众所周知,综合分析题在国家公务员考试与省级公务员考试中属于相对较难的题型,也是在考试中比较容易失分的题型,综合分析又分为4类题型:要素分析、词句理解、评价分析、比较分析。

接下来一起探讨一下评价分析题。

第一、认识评价分析【基准1】取值资料5提及“报复性看球”这一现象,恳请你根据取值资料4、5,对这一现象展开评析。

(15分后)要求:观点明确,分析透彻,条理清晰,不超过字。

【基准2】“取值资料3”中,郑女士指出:“京剧这个行当真的无法过分商业化,直播中多数人只看见京剧的皮毛和八卦而忽略了京剧艺术本身。

”恳请就她的观点谈谈你的观点。

(15分后)要求:观点明确,分析透彻,条理清晰,字数不超过字。

通过上面两道题,我们不难辨认出,题干中都就是建议学生对资料中发生的观点、现象展开分析,谈论观点、重新认识、看法,其实就是实地考察学生的评价能力。

答题建议中除了经常出现的常规建议之外还可以发生观点明晰这一建议,并且发生的频率比较低,这也属评价分析题的题干特征。

第二、学会评价分析的解题方法评价分析解题方法相比较词句认知来说,解题方法比较简单。

一共分成三步:分别就是抒发观点、论证观点、得出结论。

具体来说:1.表达观点(1)恰当:积极支持、赞成、恰当、认知、很关键等;(2)错误:片面、偏激、不科学、不支持、反对、存在……问题等;(3)部分恰当:不完全正确、须要实事求是对待、有利有弊;(4)不能判断:尚需观察、尚不能确定。

(备注:如果明确要求推论正误必须写下对或错)对观点(或社会现象)结合材料进行解释,材料中没有解释可以用自己的理解简单解释。

2.论证观点判断观点的理由:材料中的对表态有利的信息都是理由。

3.得出结论可针对观点(或社会现象)提出简单对策;可再次对观点进行肯定或总结。

第三、评价分析题完备的答题示范点1.执法部门的做法其出发点是好的,值得借鉴,但也存在问题,应进一步完善。

(表达观点)2.首先,广场晒谷可以化解农民晾干缺乏场地的问题,火车站边线偏远,农忙时节旅客较太少,农民晾干基本不能对旅客乘车和公共安全导致影响。

主成分分析用于综合评价合理性的探讨

主成分分析用于综合评价合理性的探讨

·学术讨论·主成分分析用于综合评价合理性的探讨滨州医学院(264003) 孙红卫 徐天和 王 玖 近年来在不少文献上用主成分的方法来进行综合评价。

具体方法是:对p 个原始指标x 1,x 2,…,x p ,通过主成分分析,取前m 个主成分y 1,y 2,…,y m ,其方差分别为λ1,λ2,…,λm ,以每个主成分的y i 的贡献率k i =λi /∑pi =1λi 作为权数,构造综合评价函数:F =k 1y 1+k 2y 2+…+k m y m计算出每个样品的(F )综合得分,然后依这个得分的大小对所有样品进行综合排名〔1〕。

并认为主成分分析用于综合评价优点有两个,一是可以对指标进行客观赋权,因为各个主成分是原指标的线性函数,其系数可以看为权重,而且各个主成分还有对总方差的贡献率作为权重,这都是计算出来的,而不需要人为来定;二是可以解决指标相关给综合评价带来的问题,原变量实施这样的变量代换后,原来相关的x 1,x 2,…,x p 可变成相对独立的y 1,y 2,…,y m ,这样就有助于消除变量间相关对综合评价的信息重复影响〔2〕。

这两个优点解决的都是综合评价应用中的难点问题。

但是主成分分析是否真的能解决这两个问题呢?我们从主成分方法的思想出发,并结合实例,来探讨主成分分析法是否达到了能够合理地综合评价的目的。

探讨主成分的思想与综合评价的目的是否一致设x ′=(x 1,x 2,…,x p ),为综合评价中的p 个原始指标,a ′=(a 1,a 2,…,a p ),为综合评价中待定的权重,求第一主成分就是寻找a ′使得线性函数y =a ′x 的方差达到最大,即Var (a ′x )=a ′V a 达到最大,且a ′a =1。

则此处V 为x 的协方差阵。

则线性函数y 能达到的最大方差恰好为V 的最大特征根λ1,a 是λ1相应的特征向量。

而第二主成分是与第一主成分无关的前提下其方差达到最大,并依此类推可以得到p 个主成分。

基于主成分分析的综合评价

基于主成分分析的综合评价

基于主成分分析的综合评价作者:戚淑兰来源:《商》2016年第24期摘要:研究综合评价研究问题关于社会、环境、经济等很多领域,是将事物的时效性,准确性,经济性以及满意性等方面进行评价的过程。

这要经过一定的途径将许多评价指标值合成一个综合性的评价指标值,从而进行综合评价。

主成分分析是一种重要的统计分析方法,它不仅可以想办法把原来很多具有一定相关关系的指标重新组合成一组新的且相互之间没有关系的指标,而且还能显示出比较客观的权重。

关键词:主成分分析;综合评价;环境污染;工业发展;spss.一、引言评价是一个综合咨询、计算和观测等方法的一个综合分析的过程。

但是这个过程需要评价者做出相应的指示。

综合评价就是将事物的准确性,时效性,经济性以及满意性等方面进行评价的过程。

但是评价者在评价这个过程中很容易主关干预,造成评价的结果偏离原来的结果。

多元统计分析是探讨多维变量总体,总体的每一个个体都可用p项指标来表示,虽然指标多能够描述详尽,显示细腻的一方面;但由于指标很多就较易造成分不清主次,对研究的对象很难做一个直接清楚的判断。

而主成分分析作为综合分析的一种统计方法,能够比较好的保证评价的结果是客观的。

主成分分析作为了一种比较科学的、客观的评价方法。

使综合评价的结果更加的科学,更加的实效。

二、研究背景人类的生产及生活过程与环境资源和生态环境有着很强的关系。

随着科学技术与经济的发展,人民生活水平的提高,工业的发达,废弃废料的排放造成很大程度的环境破坏和环境污染。

中国作为一个发展中国家,随着改革开放和经济的高速发展,环境污染也随之呈加剧之势。

经济发展与环境污染已经成为一个越来越重要的话题。

现在我们国家处于经济转型期,要把经济效益、环境保护以及产业结构相结合起来,形成经济新常态。

运用主成分分析综合评价的方法,寻找各省市经济发展、工业产值与环境污染状况之间的关系,而且对评价结论进行了解释。

三、主要思路经过探讨指标体系里面的结构关系就可以把许多个指标转换为相互之间没有关系的、含有初始指标的大部分内容的少数的几个综合性指标,运每个主成分的方差贡献率对那些指标加权得到综合评价得分。

主成分分析法在水质综合评价中的应用

主成分分析法在水质综合评价中的应用

主成分分析法在水质综合评价中的应用学习主成分分析法的目的是:对水质评价因子进行筛选、组合,用于水环境综合整治工程的指导。

本论文就是以主成分分析法为依据建立综合评价模型,利用神经网络算法确定各评价因子的权重。

在神经网络算法的基础上,选取C-C作为遗传算法的初始值,经过多次迭代后,最终确定评价指标。

1、评价体系设计理论评价体系设计理论包括:确定指标体系的原则与指标赋权方法;确定指标的筛选方法;构建权重集;构建评价模型。

2、主成分分析法及其应用根据前人研究结果得出,水环境质量的综合评价指标具有高度的相关性和重复性,通过聚类分析将各因子划分成不同的类别,选择相应的阈值作为主成分,并根据重要性排序法确定权重,从而确定出最优综合评价指标体系。

3、基于成分相似性度量和分析结果,建立了数据驱动的评价模型基于主成分分析法,确定因子的权重。

通过改变因子的评价方式,以及根据因子的重要性赋予不同权重,对上海市黄浦江两岸水质综合评价模型进行重新调整,实现了三类评价指标之间的互补性。

基于因子重要性赋予评价指标权重的步骤是:①评价指标的选取及水平权重的确定。

由于水质的复杂性,采用因子评价指标体系,可以保证较大的信息容量。

②对水质评价指标的确定。

主成分的选择是关键问题,也是最难处理的问题,即综合评价指标选取时存在一个怎样的阈值问题。

③基于相似性指标和重要性,确定综合评价模型的形式。

④对比实例验证模型的可靠性。

4、结果及讨论3、基于成分相似性度量和分析结果,建立了数据驱动的评价模型。

因此,建立评价模型过程中应该遵循从简单到复杂,由单因素逐步过渡到多因素的规律,才能使分析结果更接近真实情况。

4、结果表明,建立的模型能很好地反映水质质量的状况,尤其适用于短时间的水质评价,以便于快速进行环境整治工程的决策。

主成分分析与聚类分析在地区综合实力评价中的应用

主成分分析与聚类分析在地区综合实力评价中的应用

主成分分析与聚类分析在地区综合实力评价中的应用【摘要】本文选取具有代表性的7类共17个指标作为我国31个省、市、自治区综合实力评价的原始指标,运用主成分分析得到综合评价函数,计算得到我国各省市的综合得分,并据此进行K均值聚类分析,将我国31个省、市、自治区划分为5个类型,根据聚类结果对其进行了简单评价。

【关键词】主成分分析聚类分析综合实力评价一、主成分分析法主成分分析也称主分量分析,由于多个变量之间往往存在着一定程度的相关性,人们希望通过线性组合的方式,从这些指标中尽可能快地提取信息。

主成分分析旨在保证原始数据信息损失最小的前提下,通过线性变换对高维变量空间进行降维处理,以少数的综合变量取代原有的多维变量。

由于主成分是通过正交变换得到的,因此各个主成分是互不相关的,且第一个主成分的方差最大,其余次之。

主成分分析能够从选定的指标体系中归纳出大部分信息,并且能够根据指标间的相对重要性进行客观加权,可以避免评价者的主观影响,因此主成分分析在综合评价中的应用越来越得到人们的重视。

根据主成分分析法进行综合评价的步骤如下:将原始数据标准化并建立变量的相关系数矩阵R;求出R的特征根λ1≥…≥λp≥0相应地特征向量为T1,T2…Tp;由累计方差贡献率确定主成分的个数(m),并写出主成分为:Y=T’X(1);以特征根维权,构造综合评价函数Z。

各个主成分的权重分别为wi=λt/ λi(i=1,2,…p)(2),Z=w1Y+w2Y+…+wPY=W’Y=W’T’X=(TW)’X=(3)。

二、聚类分析法聚类分析(cluster analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。

本文采用聚类分析中的K均值聚类,以主成分分析得到的各地区的综合实力得分为聚类变量,以距离的远近亲疏为标准进行聚类,类数的确定参考系统聚类的结果。

三、综合实力指标的选取影响一个地区综合实力的指标有很多,本文参考国内外相关文献资料,综合考虑各种因素的影响力和数据的可得性,选择了以下七个方面的十七项指标作为综合评价的指标。

主成分进行综合评价 综合评价主成分分析方法与因子分析方法的比较

主成分进行综合评价 综合评价主成分分析方法与因子分析方法的比较

主成分进行综合评价综合评价主成分分析方法与因子分析方法的比较统计研究主成分分析方法和因子分析方法都是寻求从高维空间到低维空间的映射的方法,其目的是起到降维的效果,以便于用几个较少的综合指标来综合所研究总体各方面的信息,且这几个指标所代表的信息不重叠,也就是说从高维空间到低维空间的映射仍保持高维空间的“序”的结构。

但这两种综合评价方法往往易混淆,本文从这两种方法的统计依据、数学模型、计算方法、综合指标的选取等方面比较它们的异同,以供初学者参考。

1、统计依据不同。

主成分分析方法的统计问题:依P个指标戈l,x2,A,戈P的/7,个观察值矩阵X=G0帅,能否找到能较好地综合反映这个P、二指标的线性函数Y=乞atxt,即i=1找到这个主成分的方法就是主成分分析方法。

因子分析方法的统计问题仍口由P个指标戈。

,戈:,A,却的几个观钱道察信息阵X=GF)忡,用有限个不翠可观测的潜在变量来解释原始变量间的相关性或协方差关系,寻求这几个公因子的方法就是因子缉含汗价士气分析劣珐乡图分奸劣珐的火仪分析法。

它的原理源于已知信息的指标向量戈=0。

,戈:,A,菇P)’,总存在正交变换戈=Qy使得记x=Az,这里正交阵Q是X=G0。

巾的协方差阵y的特征向量排成的,y的各分量是不相关的,若茹的方差集中在少数几个变量三,,A,缸上,即y的特征值A,,A,A。

较大,后几个特征值A㈨,A,A。

很小几乎为零,于是就有因子模型算=4厂+s。

寻求公因子、厂及因子载荷阵A的方法就是因子分析法。

,2、数学模型不同。

主成分分析的数学模型:Y=Eat、、ri,1=1即主成分是原始指标的线性函数。

因子分析的数学模型:戈=4厂+£,A为因子载荷阵。

厂为公因子向量,£为随机误差项,Vnroq=I。

,Var=o,VarI30圈羹堑绻过丝Q丝生皇塑万方数据=D。

从形式上看二者的模型不同,但主成分分析又为因子分析中因子的寻求提供了一个有效的途径。

主成分分析与因子分析法最易混淆的地方在于,将主成分分析方法与因子分析方法中估计公因子及因子载荷阵的主分量法混为一谈。

主成分分析方法在经济评价中的作用

主成分分析方法在经济评价中的作用

4)主成分载荷
定义主成分载荷为第j个主成分与第i个原始变 量的相关系数,经推导可得:
lij ( yi , x j )
i ii
pij
其含义是:原变量xj 在第i个主成分上的载荷, 它反映了主成分yi与原变量xj之间的关联程度。
3. 利用主成分分析进行综合评价
人们进行综合评价时,都会遇到如何选择评价指标 体系和如何对这些指标进行综合的困难。
1)协方差矩阵及数据的协方差
注意1: 协方差矩阵计算的是不同维度(指标)之间的协方差,而 不是不同样本之间的。
注意2:协方差,反应了两个维度之间的线性相关程度。 协方差越大,则线性相关性越大,数据的维度冗余也越大。
注意3:协方差矩阵在对角线上的元素越大,表明信号越 强,变量的重要性越高;元素越小则表明可能是存在的 噪声或是次要变量。在非对角线上的元素大小则对应于 相关观测变量对之间冗余程度的大小。
第一个主成分,是输入样本协方差阵的具有最大特征 值对应的特征向量。
特征向量不唯一,如何选取呢?一般选取特征向量的元素 之和为正数的这个向量。
2. 主成分分析的数学知识
3) PCA中的主成分及贡献率
累积贡献率:前k个主成分共有多大的综合能力,用这k个
主成分的方差和在全部方差中所占比重来描述,称为累积
线性代数理论的经济学应用系列专题之
主成分分析方法 在经济评价中的应用
1. 概述
主成分分析Principle Component Analysis(PCA) , 是一种通过降维来简化数据结构的方法。
其目的是把多个变量化为少数几个综合变量(综合指标), 这几个综合变量可以反映原来多个变量的大部分信息,但 指标之间要相互独立,互不相关。主成分分析主要起着降 维和简化数据结构的作用。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如何有效利用主成分分析进行综合评价 摘要 由于主成分分析在多元统计分析中的降维作用,使之在社会、经济、医疗、生化等各领域运用越来越广泛,但由于传统主成分分析方法的局限性导致了一些问题的产生。这些问题吸引了许多领域专家的关注,并具有针对性的提出了一些不同的改进方法。本文介绍了主成分分析的基本和性质,并整理了近年来主成分分析在综合评价应用中遇到的普遍问题并整理验证了认同率较强的一些改进方法,以供大家研究学习。 关键词 主成分分析,综合评价,均值化

1引言 1.1研究的背景和意义 随着生产力的不断进步,生产方式由外延式扩张转化为追求经济效益的内涵式发展,以致在生产过程中必须考虑经济效益的各个方面,如生产力水平、技术进步、资源占用等情况,并需要就综合各方面的因素进行综合评价。 评价是根据确定的目的来测定对象系统的属性,并将这种属性变为客观定量的计值或者主观效用行为,整个过程离不开评价者的参与,而综合评价作为评价的一种也需要评价者做出相应反应或指示,而很多综合评价过程易受到评价者的干预,使评价结果产生偏差。 主成分分析能将高维空间的问题转化到低维空间去处理,使问题变得比较简单、直观,而且这些较少的综合指标之间互不相关,又能提供原有指标的绝大部分信息。而且,伴随主成分分析的过程,将会自动生成各主成分的权重,这就在很大程度上抵制了在评价过程中人为因素的干扰,因此以主成分为基础的综合评价理论能够较好地保证评价结果的客观性,如实地反映实际问题。主成分综合评价提供了科学而客观的评价方法,完善了综合评价理论体系,为管理和决策提供了客观依据,能在很大程度上减少了上述不良现象的产生。 所以在社会经济、管理、自然科学等众多领域的多指标体系中,如节约型社会指标体系、生态环境可持续型指标体系、和谐社会指标体系、投资环境指标体系等,主成分分析法常被应用于综合评价与监控。 综上所述,对综合评价指标体系理论进行研究,既有理论上的必要性,更有实践中的迫切性。 1.2主成分分析的发展史 主成分分析,首先是由英国的皮尔生(Kar卜Pearson)对非随机变量引入的,而后美国的数理统计学家赫特林(Harold.Hotelling)在1933年将此方法推广到随机向量的情形团。主成分分析的降维思想从一开始就很好地为综合评价提供了有力的理论和技术支持。 20世纪80~90年代,是现代科学评价在我国向纵深发展的年代,人们对包括主成分综合评价在内的评价理论、方法和应用开展了多方面的、卓有成效的研究,主要表现为:常规评价方法在国民经济、生产控制和社会生活中的广泛应用;多种评价方法的组合研究,综合应用及比较;新评价方法的研究和应用;评价方法的深入研究,如:评价属性集的设计、标准化变换、评价模型选择等等。 1.3主成分做综合评价的研究现状 目前国内外关于综合评价的方法很多,在根据各指标间相关关系或各指标值的变异程度来确定权重系数的方法中,主成分分析法是应用尤为广泛。在使用该方法的早期,大多都是按照传统的主成分分析法做综合评价的步骤来计算综合得分来对样品排序,即利用主成分F1,F2,„,Fm做线性组合,并以每个主成分Fi的方差贡献率αi作为权重系数来构造一个综合评价函数: Y =α1F1 +α2F2 +„+αm F m 然而,随着传统主成分分析方法在综合评价中的进一步应用,人们发现此方法时经不起实践检验的。在实际应用中,经常发现运用此方法所得结果的解释往往与实际情况不符。举了一个简单的例子,假定高考中考试科目有四门:数学(x1)、语文(x2)、外语(x3)和物理(x4),满分都是相同的150分。考生的四门考试成绩必须综合成一个综合评价函数,一般取为总分

ixi41。但从统计学的角度来看,可能取为*41ixi更为合理,这里xi*是xi的标准化数值

(x1* 、x2* 、x3* 、x4*有相同的均值和标准差)。如果我们使用传统的主成分分析法,根据上述综合评价函数F的得分来对学生进行排名,那就酿成大错了。 就此,一些学者提出了一些改进的方法,其中具有代表性的方法有:Yan(1998)提出,当第一主成分的方差比较大时,即贡献率较大时,用它做综合评价指标。如果觉得用一个主成分解释的方差不够大时,综合反映X1 ,X 2 ,„,Xp信息的能力不够,而用多个主成分构造综合评价函数又不合适时,可以像因子分析那样对主成分进行旋转。Hou(2006)也提出,当用第一主成分进行综合评价达不到理想结果时,可用分组主成分评价法。即先用因子分析法将p个变量分成k组,然后分别对各组变量进行主成分分析,只取每组的一主成分,求出各组第一主成分的得分Cj(j=1,2,„,k)以因子旋转后各因子的放差贡献率为权重

kjjjWj1

建立综合评价函数:kjWjCjz1。最后根据各评价样本综合得分y来对样品进行排序。但其可行性也受到了一些学者的质疑【4】。由此可见,主成分综合评价法是一片有待进一步深耕细作的热土。 2关于主成分分析基本知识 2.1主成分分析 设要进行主成分分析的原指标有p个,记作x 1 ,x2 ,„,x p 。现有n个样品,相应的观测值为x ik , i =1,2,„,n,而k =1,2,„,p。 作标准化变换后,将Xk变换为Xk*,即

SkXk-XkXk*

,k =1,2,„,m.

式中,Xk及Sk分别是xk的均值及标准差,x k*的均值为0、标准差为1. 主成分分析的原理是: 根据各样品原指标的观测值x ik或标准化变换后的观测值x ik*求出系数 a ik (k=1,2,„,p,j=1,2,„,m,m

建立用标准化变换后的指标x k*表示综合指标Fj的方程*xkakjFjk,也可建立用原指标Xk表示综合指标Fj的方程*xkakjFjk。 对系数a ik由下列原则决定: (1)各个综合指标Fj彼此独立或不相关; (2)各个综合指标Fj所反映的各个样品的总信息等于原来p个指标Xk*所反映的各个样品的总信息,即p个Fj的方差λj之和等于p个Xk*的方差之和,也就是 Pjj

且λ1≥λ2 „ ≥λP。 称上述彼此独立或不相关又不损失或损失很少原有信息的各个综合指标。yj为原指标 的主成分.其中,第一综合指标F1的方差最大,吸收原来p个指标的总信息最多,称第一主成分;第二综合指标F2的方差次之,吸收原来p个指标的总信息次之,称为第二主成分;同理,F3 F 4„Fp分别称为第三主成分、第四主成分„„第p主成分。【9】 2.2 主成分分析能否旋转 2.2.1 主成分分析与因子分析的联系与区别 相当数量的应用文章对主成分分析与因子分析不加严格区分,因而对分析结果的解释非常模糊。文献【1】认为主成分分析与因子分析两者之间有联系,但也存在着明显的区别。 从联系上看,主成分分析和因子分析都是将多个相关变量(指标)转化为少数几个不相关变量的一种多元统计分析方法。其目的是使在高维空间中研究样本分布规律的问题,通过降维得到简化,并尽量保留原变量的信息量。两者都有消除相关、降维的功能。 主成分分析是通过变量变换把注意力集中到具有最大变差的那些主成分上,而视变量不大的主成分为常数予以舍弃;因子分析是通过因子模型把注意力集中到少数不可观测的公共因子上,而舍弃特殊因子。主成分个数与公共因子个数的选择准则通常是相同的。

主成分分析中主成分向量Y与原指标向量X的表达式为XLYT,式中ppijlL.;而因子分析中的因子模型为AFX,其中ε为特殊因子,0.mpijaA,当0D时,可采用主成分分析法估计A阵,则ijjijla。 对主成分分析中的主成分与因子分析中的公共因子的含义均需进行明确解释,否则,会遇到应用上的困难。 虽然主成分分析法与因子分析法有着密切的联系,但从应用上更需关注的是它们之间的区别。 1、 主成分分析的实质是P维空间的坐标旋转,并不改变样本数据结构,不能作为模型来描述;因子分析的实质是P维空间到M维空间的一种映射,需构造模型。 2、 主成分的个数与原变量个数相等,而公因子的个数小于原变量的个数。 3、 主成分分析是把主成分表示为原变量的线性组合,因子分析是把原变量表示为公共因子和特殊因子的线性组合。 4、 主成分分析由可观测的变量X直接求的主成分Y,并可逆;因子分析只能通过可观测的原变量去估计不可观测的公共因子F,不能用X表示F。 5、 主成分分析中的L阵是唯一的正交阵;因子分析中的A阵不唯一,也不一定是正交阵。 6、 主成分分析主要应用在综合评价和指标筛选上;因子分析除这两个作用以外,还可以应用于对样本或变量的分类。 2.2.2 能否对主成分实施旋转 对于主成分能否进行旋转这一问题,很多研究学者认为,当主成分不能很好解释综合评价结果时,可以像因子分析那样进行正交旋转,从而使主成分得到更好的解释。 关于主成分能否旋转的问题,文献【1】【4】【5】【7】【8】均做了论证,发现这种方法是不可行的。 论证具体如下:

主成分分析的实质是对原始指标变量进行线性变换,即F =XA,其中ppijaA. 显然A为正交矩阵,如果对主成分进行旋转,则有:

TTTTAFAFLLFAXˆˆ

其中L是正交矩阵。由于X矩阵不变,其相关矩阵R对应的特征根和单位特征向量也不变,即说明矩阵A具有唯一性。由上式知:如果主成分能旋转则说明矩阵A不是唯一的。 从而我们可以得出:主成分不能进行旋转。 3.主成分分析的局限性 3.1.1第一主成分未必能用于综合评价 文献【8】通过论证指出,主成分贡献率的大小反映的是该主成分包含原始数据的信息量的大小,这种信息不一定指的是综合水平,也有可能指的是变量间的差异性。对于有些情况做综合评价,如一个班同学的综合排名,用于综合评价的需是水平因子,但只考虑第一主成分的话,得到的会是一个形状因子,所以在这种情况下,第一主成分贡献率再高,用于综合评价也是不合理的。 3.1.2 主成分分析标准化的不足 文献【2】【3】【7】等文献指出,原始数据保含两部分信息:一部分是个指标变异程度的差异信息;另一部分是个指标间相互影响程度上的相关信息。但在主成分分析过程中,为了消除指标纲量和数量级的影响往往对原始数据进行标准化:

jjijijs

xxx

,i =1,2,„ ,n;j =1,2,„,p

其中nkkjijxnx11,21211nkjijjxxns,j=1,2,„,p。 由此可以看出标准化使各指标的方差全为1,在消除量纲和数量级影响的同时,也消除了各指标变异程度上的差异信息。而从标准化后的数据提取的主成分,即从相关系数矩阵来计算主成分,实际上只包含了各指标间相互影响这一个方面的信息,所以不能准确反映原始数据所包含的全部信息。 3.1.3 “线性”相关度的不足 文献【3】指出,主成分分析只是一种“线性”降维技术,之梦处理线性问题:一方面主成分是原始指标的线性组合,另一方面对原始数据进行标准化处理,是协方差矩阵变成相关系数矩阵,而相关系数矩阵矩阵只能反映指标间的“线性”相关程度。 研究实际问题时,不仅指标见有非线性关系,有时主成分与原始数据之间也呈非线性关系,如果简单地进行先行处理,必然导致评价结果的偏差。 3.2关于主成分分析做综合评价的改进 3.2.1 可用于综合评价的主成分的条件 在用主成分分析做综合评价的改进时,对选择第一主成分还是多个主成分现在任有一定的分歧,就此问题许多学者都做了研究探讨【1】【7】【8】,过程如下: 当(Xi1,Xi2 ,„,Xip)>( Xk1 ,Xk2 ,„,Xkp)时,称第i个样本点优于第k个样

相关文档
最新文档