如何有效利用主成分分析进行综合评价
主成分分析方法及其应用效果评估

主成分分析方法及其应用效果评估主成分分析(Principal Component Analysis,简称PCA)是一种常用的数据降维技术,被广泛应用于数据分析、模式识别和机器学习等领域。
本文将介绍主成分分析的基本原理、具体方法以及其在实际应用中的效果评估。
一、主成分分析的基本原理主成分分析是一种统计分析方法,旨在将具有相关性的多个变量转化为一组线性无关的新变量,称为主成分。
通过降维,主成分分析可以有效减少数据的维度,并保留原始数据中的大部分信息。
主成分分析的基本原理是通过找到数据中的最大方差方向来构建主成分。
具体步骤如下:1. 标准化数据:对原始数据进行标准化处理,使得每个变量具有相同的尺度。
2. 计算协方差矩阵:计算标准化后数据的协方差矩阵。
3. 计算特征值与特征向量:对协方差矩阵进行特征值分解,得到特征值和对应的特征向量。
4. 选择主成分:根据特征值的大小排序,选择前k个特征值对应的特征向量作为主成分。
5. 构建主成分:将选择的主成分按权重线性组合,得到原始数据的主成分。
二、主成分分析的具体方法主成分分析可以通过多种计算方法实现,其中最常用的是基于特征值分解的方法。
下面介绍主成分分析的具体计算步骤:1. 标准化数据:对原始数据进行标准化处理,使得每个变量具有均值为0、方差为1的特性。
2. 计算协方差矩阵:将标准化后的数据计算协方差矩阵。
3. 特征值分解:对协方差矩阵进行特征值分解,得到特征值和对应的特征向量。
4. 选择主成分:根据特征值的大小选择前k个特征向量作为主成分。
5. 构建主成分:将选择的主成分按权重线性组合,得到原始数据的主成分。
三、主成分分析在实际应用中的效果评估在应用主成分分析时,我们需要对其效果进行评估,以确保选择的主成分能够充分保留原始数据的信息。
常用的效果评估方法有以下几种:1. 解释方差比(Explained Variance Ratio):解释方差比可以衡量每个主成分对原始数据方差的贡献程度。
主成分分析用于多指标评价的方法研究主成分评价

主成分分析用于多指标评价的方法研究主成分评价一、本文概述本文旨在探讨主成分分析(PCA)在多指标评价中的应用及其方法研究。
主成分分析作为一种广泛使用的统计分析工具,其主要目的是通过降维技术,将多个相关变量转化为少数几个独立的综合指标,即主成分,以便更好地揭示数据的内在结构和规律。
在多指标评价体系中,由于指标间可能存在的信息重叠和相关性,直接分析往往难以得出清晰的结论。
因此,利用主成分分析进行降维处理,提取出关键的主成分,对于简化评价过程、提高评价效率和准确性具有重要意义。
本文首先介绍主成分分析的基本原理和步骤,包括数据标准化、计算协方差矩阵、求解特征值和特征向量、确定主成分个数以及计算主成分得分等。
然后,结合具体案例,详细阐述主成分分析在多指标评价中的应用过程,包括评价指标的选择、数据的预处理、主成分的计算和解释等。
对主成分分析方法的优缺点进行讨论,并提出相应的改进建议,以期为多指标评价领域的研究和实践提供参考和借鉴。
通过本文的研究,旨在加深对主成分分析在多指标评价中应用的理解,提高评价方法的科学性和实用性,为相关领域的研究和实践提供有益的启示和帮助。
二、主成分分析的基本原理和方法主成分分析(Principal Component Analysis,PCA)是一种广泛应用于多变量数据分析的统计方法。
其基本原理是通过正交变换将原始数据转换为一系列线性不相关的变量,即主成分。
这些主成分按照其解释的原始数据方差的大小进行排序,第一个主成分解释的方差最大,之后的主成分依次递减。
通过这种方式,主成分分析可以在不损失过多信息的前提下,降低数据的维度,从而简化复杂的多变量系统。
数据标准化:需要对原始数据进行标准化处理,以消除量纲和数量级的影响。
标准化后的数据均值为0,标准差为1。
计算协方差矩阵:然后,计算标准化后的数据的协方差矩阵,以捕捉变量之间的相关性。
计算特征值和特征向量:接下来,求解协方差矩阵的特征值和特征向量。
主成分分析在煤矿安全评价中的应用

主成分分析在煤矿安全评价中的应用1.建立指标体系主成分分析可以通过对煤矿安全相关指标的分析,确定一个综合评价指标体系。
对于煤矿安全评价来说,可以将各类指标分为物理指标(如瓦斯浓度、煤尘浓度等)、技术指标(如瓦斯抽放量、通风量等)、管理指标(如事故率、投入产出比等)等。
通过主成分分析,可以将这些指标综合,得到一个综合评价指标,用于对煤矿安全状况进行评价和比较。
2.确定主要风险因素主成分分析可以通过对煤矿安全指标的分析,确定主要的风险因素。
通过主成分分析,可以对各个指标之间的关联关系进行分析,找出其中具有高度相关性的指标,并将其归纳为主要风险因素。
这样可以帮助煤矿安全管理者更好地了解煤矿安全的脆弱性,有针对性地采取措施来降低风险。
3.评估煤矿安全状况主成分分析可以通过对一段时间内煤矿安全实际数据的分析,评估煤矿的安全状况。
通过主成分分析,可以从多个角度对煤矿安全进行综合评价,从而得到一个客观的安全状况评估结果。
这样可以帮助煤矿安全管理者更好地了解煤矿当前的安全状况,及时采取措施来改善安全状况。
4.风险预警和预测主成分分析还可以通过对历史数据的分析,建立预测模型,用于煤矿安全风险的预警和预测。
通过主成分分析,可以提取出影响煤矿安全风险的关键因素,并建立模型进行预测。
这样可以帮助煤矿安全管理者提前预判潜在的安全风险,并采取措施来避免或减轻事故的发生。
5.优化煤矿管理策略主成分分析可以通过对煤矿安全指标的分析,帮助煤矿安全管理者优化管理策略。
通过主成分分析,可以找到关键的影响因素,并确定其权重,从而更好地分配资源和制定管理策略。
这样可以帮助煤矿安全管理者制定科学有效的管理措施,以提高煤矿的安全水平。
综上所述,主成分分析在煤矿安全评价中具有广泛的应用价值。
通过主成分分析,可以建立综合评价指标体系、确定主要风险因素、评估煤矿安全状况、进行风险预警和预测、优化管理策略等,从而提高煤矿的安全水平。
主成分分析法在综合评价学生成绩中的应用

学) 、 L ( 质量 工 程 I) 、 M( 全面质量 管理 ) 、 N( 机
取几个较少的综合指标 , 尽可能多地反映原来指 标 的信息。主成分分析法也是数学上处理降维的
一
种方 法 , 该方法既降低了数据“ 维数” , 同 时 保
法是适 合用 来综 合评 价学 生成绩 的一 种多 因素 评
价方 法 。
应用 S P S S 软件 , 首先将数据标准化 , 然后计 算各 门课成绩之 间的相关 系数矩阵, 分析结果表 明: ( 1 ) 在被统计 到的 l 7门课程 中, 虽然 c程序 设计 ( C ) 和管理学 ( G ) 的相关性为负 , 但是仅 为
留 了原数据 的大 部 分信 息 。因此 , 主成 分 分 析 方 法 常常被用 来处 理多 指标评 价 问题 。当第 一 主成
械设 计基 础 ) 、 O( 机 械 制 图 Ⅱ) 、 P( 试 验设 计 ( 双 语 Ⅱ) ) 、 Q( 可靠 性 工程 ) 。A—F为公 共 基 础课 , G、 H、 I 、 J 、 K、 N、 O为 学 科 基 础 课 , L 、 M、 P 、 Q 为专
G UAN L l 6oNG CHENG s
主成 分 分析 法在 综合 评 价 学 生成绩 中的 应 用
禹建 丽 , 郑芬芸 , 周 瑞芳 , 胡 紫研
摘 要: 应用 S P S S 数据处理软件对质量与可靠性工程专业学生的课程成绩进行主 成分分析 , 以2 0位 学生 l 7门课程 的成绩为样本进行研 究, 得 出了五个主 成 分的特 征 向量 , 累积 方差贡 献率 达到 8 1 . 2 5 1 %, 同 时给 出 了学生成 绩排
主成分分析综合评价应该注意的问题

主成分分析综合评价应该注意的问题众所周知,综合分析题在国家公务员考试与省级公务员考试中属于相对较难的题型,也是在考试中比较容易失分的题型,综合分析又分为4类题型:要素分析、词句理解、评价分析、比较分析。
接下来一起探讨一下评价分析题。
第一、认识评价分析【基准1】取值资料5提及“报复性看球”这一现象,恳请你根据取值资料4、5,对这一现象展开评析。
(15分后)要求:观点明确,分析透彻,条理清晰,不超过字。
【基准2】“取值资料3”中,郑女士指出:“京剧这个行当真的无法过分商业化,直播中多数人只看见京剧的皮毛和八卦而忽略了京剧艺术本身。
”恳请就她的观点谈谈你的观点。
(15分后)要求:观点明确,分析透彻,条理清晰,字数不超过字。
通过上面两道题,我们不难辨认出,题干中都就是建议学生对资料中发生的观点、现象展开分析,谈论观点、重新认识、看法,其实就是实地考察学生的评价能力。
答题建议中除了经常出现的常规建议之外还可以发生观点明晰这一建议,并且发生的频率比较低,这也属评价分析题的题干特征。
第二、学会评价分析的解题方法评价分析解题方法相比较词句认知来说,解题方法比较简单。
一共分成三步:分别就是抒发观点、论证观点、得出结论。
具体来说:1.表达观点(1)恰当:积极支持、赞成、恰当、认知、很关键等;(2)错误:片面、偏激、不科学、不支持、反对、存在……问题等;(3)部分恰当:不完全正确、须要实事求是对待、有利有弊;(4)不能判断:尚需观察、尚不能确定。
(备注:如果明确要求推论正误必须写下对或错)对观点(或社会现象)结合材料进行解释,材料中没有解释可以用自己的理解简单解释。
2.论证观点判断观点的理由:材料中的对表态有利的信息都是理由。
3.得出结论可针对观点(或社会现象)提出简单对策;可再次对观点进行肯定或总结。
第三、评价分析题完备的答题示范点1.执法部门的做法其出发点是好的,值得借鉴,但也存在问题,应进一步完善。
(表达观点)2.首先,广场晒谷可以化解农民晾干缺乏场地的问题,火车站边线偏远,农忙时节旅客较太少,农民晾干基本不能对旅客乘车和公共安全导致影响。
主成分分析和聚类分析在高职学生成绩综合评价中的应用

主成分分析和聚类分析在高职学生成绩综合评价中的应用作者:***来源:《计算机时代》2023年第11期关键词:主成分分析;聚类分析;学生成绩;综合评价中图分类号:G717 文献标识码:A 文章编号:1006-8228(2023)11-64-05 0 引言职业院校经常需要对学生成绩进行综合评价,以检测学校管理、教育教学和人才培养的成效,进而做出相应的调整及改进。
目前,学生成绩综合评价应用较多的方法是加权综合评分法或将各种成绩简单的相加,由于加权评分法中的权重设置容易受人为因素的影响,而各项成绩简单的相加又不能体现学生综合的学习能力,这些方法都存在各自的缺点[1],这里基于主成分分析给出一个简单实用的综合评价方法,并在此基础上进一步对学生成绩进行聚类分析,相对有效的解决了上述评价方法存在的问题,有利于因材施教,提升人才培养质量。
1 数学模型1.1 主成分分析基本思想主成分分析是一种数据“降维”分析方法。
其基本思想是将原来众多的具有一定相关性的指标,重新组合成一组新的互不相关的综合指标来代替原来指标。
通常数学上的处理就是将原来多个指标作线性组合,作为新的综合指标[2]。
问题是如何选取相应的线性组合。
代入数据计算学生各主成分得分如下表3 所示,由每位学生的主成分得分代入综合评价函数,可以得到综合得分,按照综合得分大小排序,就得到每位学生的名次,由于排名是通过统计分析计算得到,其排名结果将减少主观因素,反映某些实际情况。
結果分析:第一主成分中x1,x4,x5,x6,x7五个变量的系数比较大且都为正数,说明第一主成分主要由这五个变量决定,且与这五个变量的取值成正相关,从这五个变量分别所代表的课程(英语、高等数学、计算机基础、Linux 基础、Python 语言程序设计)来看,他们相对于其他两门课程(道德与法治、体育),是专业核心课,传统学分占比也较大,是反映高职学生技能水平和决定一位学生成绩的主要方面,得分较高,名次就较高,这与目前实际情况也是相符的。
基于主成分分析的我国各地区经济发展水平综合评价(2)

基于主成分分析的我国各地区经济发展水平综合评价摘要我国幅员辽阔,但是由于历史发展、地理位置、自然条件、人口、政策等因素影响,各地区经济发展水平存在很大差异。
本文通过建立我国各省、直辖市、自治区社会经济发展的综合评价指标体系,运用主成分分析方法,计算出各地区经济发展水平的综合得分,得出综合排名,并对结果作出分析,提出相应的建议对策,旨在促进区域共同发展。
关键词:经济发展水平;主成分分析法;对策AbstractChina area is very large,but because of the historical development , geographical location, natural conditions , population, policy and other factors, there is a big difference in the level of economic development of the region. This article through the establishment of a comprehensive evaluation system of provinces, municipalities and autonomous regions of socio-economic development , the use of principal component analysis method to calculate the level of economic development in all regions composite score , ranking results , and to analyze the results ,make recommendations measures to promote common development of the region.Keywords : the level of economic development;principal component analysis ;countermeasures引言地区经济发展是指一个地区从贫困、落后的状态向经济及社会生活现代化发展的过程。
主成分分析综合评价应该注意的问题

主成分分析综合评价应该注意的问题随着科学技术与质量活动的日益深入,统计学在质量评价管理中发挥了重要作用,以及汇总多维数据,将它们归纳为有限数量的衡量变量。
在这些方法中,主成分分析(PCA)是最常用的一种,它可以有效地压缩原始数据,并将其转换为可以三维可视化的表示形式。
PCA 是一种有用的工具,可以帮助改进和提高质量管理的工作效率和效果。
然而,在使用PCA进行综合评价时,应该注意一些问题,以确保评估的准确性和可靠性。
首先,评估者必须正确地确定动因和衡量变量的范围,它们是确定主要因素和价值的关键因素。
其次,应检查衡量变量之间的相关性,以确定其评价影响和贡献程度。
此外,应评估数据的质量,以确保数据准确,并采取必要措施来纠正任何质量问题。
最后,当选择PCA时,应检查数据中的噪声水平,排除有害因素并正确校准结果。
除了上述注意事项之外,PCA还可以用来识别待评价对象的关键特征,以及识别重要关联的变量和因素。
识别这些特征可以帮助理解影响指标的因素,从而有效地实施绩效评估。
此外,评估者还可以利用PCA来比较受评价对象之间的差异性,以及对其影响因素的衡量。
最后,需要强调的是,PCA并不能像多元统计分析那样涵盖更多的变量,但它可以帮助识别出评价的关键结构,从而有助于绩效管理的有效实施。
基于上述原因,在使用PCA进行综合评价时,必须首先认真考虑上述注意事项,以确保有效的绩效评估结果。
总而言之,PCA在质量管理中发挥了重要作用,但在使用PCA进行综合评价时,必须注意确定衡量变量范围、检查衡量变量相关性、评估数据质量、检查数据中的噪声水平等因素,以确保评估结果的准确性和可靠性。
而且,识别PCA所测量的特征可以有效实施绩效评估,而PCA还可以帮助比较受评价对象之间的差异性,以及对其影响因素的衡量。
此外,在实施PCA前,还需要深入了解PCA的本质,以及PCA评价的局限性,并提前了解不同因素对结果的影响,以获得准确判断。
因此,只有掌握这些问题,才能使PCA对绩效评价产生有效效果。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如何有效利用主成分分析进行综合评价 摘要:由于主成分分析在多元统计分析中的降维作用,使之在社会、经济、医疗、生化等各领域运用越来越广泛,但由于传统主成分分析方法的局限性导致了一些问题的产生。这些问题吸引了许多领域专家的关注,并具有针对性的提出了一些不同的改进方法。本文介绍了主成分分析的基本和性质,并整理了近年来主成分分析在综合评价应用中遇到的普遍问题并整理验证了认同率较强的一些改进方法,以供大家研究学习。 关键词: 主成分分析;综合评价;均值化
1引言 研究的背景和意义 随着生产力的不断进步,生产方式由外延式扩张转化为追求经济效益的内涵式发展,以致在生产过程中必须考虑经济效益的各个方面,如生产力水平、技术进步、资源占用等情况,并需要就综合各方面的因素进行综合评价。 评价是根据确定的目的来测定对象系统的属性,并将这种属性变为客观定量的计值或者主观效用行为,整个过程离不开评价者的参与,而综合评价作为评价的一种也需要评价者做出相应反应或指示,而很多综合评价过程易受到评价者的干预,使评价结果产生偏差。 主成分分析能将高维空间的问题转化到低维空间去处理【9】,使问题变得比较简单、直观,而且这些较少的综合指标之间互不相关,又能提供原有指标的绝大部分信息。而且,伴随主成分分析的过程,将会自动生成各主成分的权重,这就在很大程度上抵制了在评价过程中人为因素的干扰,因此以主成分为基础的综合评价理论能够较好地保证评价结果的客观性,如实地反映实际问题。主成分综合评价提供了科学而客观的评价方法,完善了综合评价理论体系,为管理和决策提供了客观依据,能在很大程度上减少了上述不良现象的产生。 所以在社会经济、管理、自然科学等众多领域的多指标体系中,如节约型社会指标体系、生态环境可持续型指标体系、和谐社会指标体系、投资环境指标体系等,主成分分析法常被应用于综合评价与监控【6】。 综上所述,对综合评价指标体系理论进行研究,既有理论上的必要性,更有实践中的迫切性。 研究的发展史 基于主成分分析的综合评价以主成分分析为理论基础,以综合评价为主线,着眼于作出合理公正的综合评价。以下从综合评价和主成分分析两个方面来讨论主成分综合评价的发展史。 综合评价是伴随着人类文明的产生、发展而产生、发展的。其基本思想是将反映研究对象数量特征的多个指标转化为一个综合指标,并据以对各个具体评价对象进行排序比较,从而做出好坏优劣的评价结论。 1888年,艾奇沃斯(Edgeworth)发表了论文《考试中的统计学》,提出了对考生中的不同部分应如何加权。1913年,斯皮而曼(sPe~an)发表了《和与差的相关性》一文,讨论了不同加权的作用。在20世纪30年代,瑟斯通(Thurstone)和利克特(Likert)又对定性记分方法的工作给予了新的推动。20世纪60年代,美国学者查德(L·A·zadaen)模糊集合理论,为模糊综合评价法奠定了基础。20世纪70一80年代,是现代科学评价蓬勃兴起的年代。在此期间,产生了多种应用广泛的评价方法,诸如ELECTRE法(1971一1977,1983)、多维偏好分析的线性规划法(LINMAP,1973)、层次分析法(AHP,1977)、数据包络分析法(DEA,1978)、逼近于理想解的排序法(TOPSIS,1981)等【7】。 主成分分析,首先是由英国的皮尔生(Kar卜Pearson)对非随机变量引入的,而后美国的数理统计学家赫特林在1933年将此方法推广到随机向量的情形团【8】。主成分分析的降维思想从一开始就很好地为综合评价提供了有力的理论和技术支持。 20世纪80~90年代,是现代科学评价在我国向纵深发展的年代,人们对包括主成分综合评价在内的评价理论、方法和应用开展了多方面的、卓有成效的研究,主要表现为:常规评价方法在国民经济、生产控制和社会生活中的广泛应用;多种评价方法的组合研究,综合应用及比较;新评价方法的研究和应用;评价方法的深入研究,如:评价属性集的设计、标准化变换、评价模型选择等等。 主成分做综合评价的研究现状 目前国内外关于综合评价的方法很多,在根据各指标间相关关系或各指标值的变异程度来确定权重系数的方法中,主成分分析法是应用尤为广泛。在使用该方法的早期,大多都是按照传统的主成分分析法做综合评价的步骤来计算综合得分来对样品排序,即利用主成分F1,F2,…,Fm做线性组合,并以每个主成分Fi的方差贡献率αi作为权重系数来构造一个综合评价函数: Y =α1F1 +α2F2 +…+αm F m 然而,随着传统主成分分析方法在综合评价中的进一步应用,人们发现此方法时经不起实践检验的。在实际应用中,经常发现运用此方法所得结果的解释往往与实际情况不符。举了一个简单的例子,假定高考中考试科目有四门:数学(x1)、语文(x2)、外语(x3)和物理(x4),满分都是相同的150分。考生的四门考试成绩必须综合成一个综合评价函数,一般取为总分ixi41。但从统计学的角度来看,可能取为*41ixi
更为合理,这里xi*是xi的标准化数值(x1* 、x2* 、x3* 、x4*有相同的均值和标准差)。如果我们使用传统的主成分分析法,根据上述综合评价函数F的得分来对学生进行排名,那就酿成大错了。 就此,一些学者提出了一些改进的方法,其中具有代表性的方法有:Yan(1998)提出,当第一主成分的方差比较大时,即贡献率较大时,用它做综合评价指标。如果觉得用一个主成分解释的方差不够大时,综合反映X1 ,X 2 ,…,Xp信息的能力不够,而用多个主成分构造综合评价函数又不合适时,可以像因子分析那样对主成分进行旋转。Hou(2006)也提出,当用第一主成分进行综合评价达不到理想结果时,可用分组主成分评价法。即先用因子分析法将p个变量分成k组,然后分别对各组变量进行主成分分析,只取每组的一主成分,求出各组第一主成分的得分Cj(j=1,2,…,k)以因子旋转后各因子的放差贡
献率为权重kjjjWj1建立综合评价函数:kjWjCjz1。最后根据各评价样本综合得分y来对样品
进行排序。但其可行性也受到了一些学者的质疑【4】。由此可见,主成分综合评价法是一片有待进一步深耕细作的热土。
2关于主成分分析基本知识 主成分分析 设要进行主成分分析的原指标有p个,记作x 1 ,x2 ,…,x p 。现有n个样品,相应的观测值为x ik , i =1,2,…,n,而k =1,2,…,p。 作标准化变换后,将Xk变换为Xk*,即
SkXk-XkXk*,k =1,2,…,m.
式中,Xk及Sk分别是xk的均值及标准差,x k*的均值为0、标准差为1. 主成分分析的原理是: 根据各样品原指标的观测值x ik或标准化变换后的观测值x ik*求出系数 a ik (k=1,2,…,p,j=1,2,…,m,m 建立用标准化变换后的指标x k*表示综合指标Fj的方程*xkakjFjk,也可建立用原指标Xk
表示综合指标Fj的方程*xkakjFjk。 对系数a ik由下列原则决定: (1)各个综合指标Fj彼此独立或不相关; (2)各个综合指标Fj所反映的各个样品的总信息等于原来p个指标Xk*所反映的各个样品的总信息,即p个Fj的方差λj之和等于p个Xk*的方差之和,也就是 Pjj
且λ1≥λ2 … ≥λP。
称上述彼此独立或不相关又不损失或损失很少原有信息的各个综合指标。yj为原指标 的主成分.其中,第一综合指标F1的方差最大,吸收原来p个指标的总信息最多,称第一主成分;第二综合指标F2的方差次之,吸收原来p个指标的总信息次之,称为第二主成分;同理,F3 F 4…Fp分别称为第三主成分、第四主成分……第p主成分。【9】 主成分分析能否旋转 主成分分析与因子分析的联系与区别 相当数量的应用文章对主成分分析与因子分析不加严格区分,因而对分析结果的解释非常模糊。文献【1】认为主成分分析与因子分析两者之间有联系,但也存在着明显的区别。 从联系上看,主成分分析和因子分析都是将多个相关变量(指标)转化为少数几个不相关变量的一种多元统计分析方法。其目的是使在高维空间中研究样本分布规律的问题,通过降维得到简化,并尽量保留原变量的信息量。两者都有消除相关、降维的功能。 主成分分析是通过变量变换把注意力集中到具有最大变差的那些主成分上,而视变量不大的主成分为常数予以舍弃;因子分析是通过因子模型把注意力集中到少数不可观测的公共因子上,而舍弃特殊因子。主成分个数与公共因子个数的选择准则通常是相同的。 主成分分析中主成分向量Y与原指标向量X的表达式为XLYT,式中ppijlL.;而因子分析中的因子模型为AFX,其中ε为特殊因子,0.mpijaA,当0D时,可采用主成分分析法估计A阵,则ijjijla。 对主成分分析中的主成分与因子分析中的公共因子的含义均需进行明确解释,否则,会遇到应用上的困难。 虽然主成分分析法与因子分析法有着密切的联系,但从应用上更需关注的是它们之间的区别。 1、 主成分分析的实质是P维空间的坐标旋转,并不改变样本数据结构,不能作为模型来描述;因子分析的实质是P维空间到M维空间的一种映射,需构造模型。 2、 主成分的个数与原变量个数相等,而公因子的个数小于原变量的个数。 3、 主成分分析是把主成分表示为原变量的线性组合,因子分析是把原变量表示为公共因子和特殊因子的线性组合。 4、 主成分分析由可观测的变量X直接求的主成分Y,并可逆;因子分析只能通过可观测的原变量去估计不可观测的公共因子F,不能用X表示F。 5、 主成分分析中的L阵是唯一的正交阵;因子分析中的A阵不唯一,也不一定是正交阵。 6、 主成分分析主要应用在综合评价和指标筛选上;因子分析除这两个作用以外,还可以应用于对样本或变量的分类。 能否对主成分实施旋转 对于主成分能否进行旋转这一问题,很多研究学者认为,当主成分不能很好解释综合评价结果时,可以像因子分析那样进行正交旋转,从而使主成分得到更好的解释。 关于主成分能否旋转的问题,文献【1】【4】【5】【7】【8】均做了论证,发现这种方法是不可行的。 论证具体如下: 主成分分析的实质是对原始指标变量进行线性变换,即F =XA,其中ppijaA.
显然A为正交矩阵,如果对主成分进行旋转,则有: 其中L是正交矩阵。由于X矩阵不变,其相关矩阵R对应的特征根和单位特征向量也不变,即说明矩阵A具有唯一性。由上式知:如果主成分能旋转则说明矩阵A不是唯一的。 从而我们可以得出:主成分不能进行旋转。
3 主成分分析做综合评价的局限性与改进方法 传统主成分分析做综合评价的一般步骤 (1)将原始数据标准化。将各样品指标值x i按iiiIXDXEXX*式转化成标准化指标Xi*,其中,E(Xi)和D(Xi)分别是Xi的均值和方差。Xi的均值是0,方差是1. (2)求各标准化指标Xi*的两两相关系数rij,并写出相关系数矩阵ppijrR][。