对主成分分析法运用中十个问题的解析_林海明

合集下载

(完整word版)主成分分析练习题

(完整word版)主成分分析练习题

主成分分析填空题1.主成分分析是通过适当的变量替换,使新变量成为原变量的___________,并寻求_________的一种方法。

2.主成分分析的基本思想是______________。

3.主成分的协方差矩阵为_________矩阵。

4.主成分表达式的系数向量是_______________的特征向量。

5.原始变量协方差矩阵的特征根的统计含义是________________。

6.原始数据经过标准化处理,转化为均值为____ ,方差为____ 的标准值,且其________矩阵与相关系数矩阵相等。

7.因子载荷量的统计含义是_____________________________。

8.样本主成分的总方差等于_____________。

9.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为________________。

10.SPSS 中主成分分析采用______________命令过程。

计算题1.设三个变量(x 1,x 2,x 3)的样本协方差矩阵为:2121002222222<<-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡r s rs r s s r s r s s试求主成分及每个主成分的方差贡献率。

解特征方程:=∑-I λ02.在一项对杨树的性状的研究中,测定了20株杨树树叶,每个叶片测定了四个变量:叶长(x 1),2/3处宽(x 2),1/3处宽(x 3),1/2处宽(x 4)。

这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:)7930.0,5513.0,2519.0,0612.0(007.0)1624.0,5589.0,7733.0,2516.0(049.0)0824.0,2695.0,0984.0,9544.0(024.1)5814.0,5577.0,5735.0,1485.0(920.244332211--='=--='=-='=---='=U U U U λλλλ(1) 写出四个主成分,计算它们的贡献率。

主成分分析【可编辑全文】

主成分分析【可编辑全文】
沿着xl轴方向或x2轴方向都具有较大的离散性,其离散 的程度可以分别用观测变量xl的方差和x2的方差定量地 表示。显然,如果只考虑xl和x2中的任何一个,那么包 含在原始数据中的经济信息将会有较大的损失。
• 如果我们将xl 轴和x2轴先平移,再同时 按逆时针方向旋转角度,得到新坐标轴Fl和 F2。Fl和F2是两个新变量。
• 如果变量分组较有规则,则从特征向量各 分量数值作出组内组间对比分析。
主成分分析的一般步骤
6. 解释各个主成分的含义 7. 进行其他分析
利用SPSS进行主成分分析的步骤
1. 指标数据的标准化。
可以利用“Descriptive statistics” 中的“Descriptives”进行标准化。
这种由讨论多个指标降为少数几个综合指 标的过程在数学上就叫做降维。主成分分析通 常的做法是,寻求原指标的线性组合Fi。其中, Xi 是经过标准化后的变量。
F1 u11X1 u21X 2 u p1X p F2 u12 X1 u22 X 2 u p2 X p
Fp u1p X1 u2 p X 2 u pp X p
4. 确 定 主 成 分 Fi 的 表 达 式 : 将 表 “Component Matrix”(初始因子载荷 阵)中的第i列向量除以第i个特征根的平方 根,得到第i个主成分Fi的变量系数向量。
5. 对主成分Fi进行解释。
• x1:数学 • x2:物理 • x3:化学 • x4:语文 • x5:历史 • x6:英语
满足如下的条件:
每个主成分的系数平方和为1。即
u2 1i
u2 2i
u
2 pi
1
主成分之间相互独立,即无重叠的信息。即
Cov(Fi,Fj) 0,i j,i,j 1, 2, ,p 主成分的方差依次递减,重要性依次递减,即

关于主成分分析的五个问题

关于主成分分析的五个问题

关于主成分分析的五个问题主成分分析是一种多元分析中最常见的降维和赋权方法。

然而,在实际的应用中,许多人在没有搞清楚方法的意义时就大胆使用,很有点好分析不求甚解的味道。

要知道这样的行为不仅害人而且害己。

所谓害人,就是害了阅读你报告的人;所谓害己,就是你会一而再,再而三的犯错。

第一问:为什么要降维?在实际分析问题时,研究者往往选择很多的指标。

这些指标之间经常会存在一定程度的线性相关,这样就会导致信息的重叠。

直白说就是用多个指标分析一个问题,由于某些指标反映的是问题的同一方面,这样如果把全部指标都同等地纳入模型,就会导致结果失真。

例如衡量学生成绩时,成绩表里有语文、数学、物理、化学。

可是化学老师勤快,一学期测验过好多次,所以这里就有多个化学成绩。

那么计算总分的时候,如果不把几个化学成绩降维成一个化学成绩,就会由于信息的重叠导致结果失真。

第二个问题:线性相关就一定是信息重叠吗?这个不一定吧。

我们举个例子。

比如:要衡量经济发展的影响因素,理论上讲,刺激经济发展的三驾马车是投资、消费和出口,那么我们用于衡量经济发展程度是不是就把这三个指标主成分一下?肯定不是。

正确的做法应该是这三个相加,纵然他们之间可能存在相关,甚至是高度相关,也不能使用主成分。

因为这种相关不是信息的重叠。

所以这里记住一点,线性相关并不意味着信息重叠。

第三个问题:降维一定要用主成分吗?这个答案更容易回答,相信很多人都会说否。

但实际中却一直这么操作。

因为觉得其他降维方法不会呀,而且主成分貌似很高深,用它倍有面子。

其实,实际中使用主成分是因为从主观上没有办法删减变量,如果主观上就能区别出哪些是核心原因,哪些不是,直接将不是的删了就行了,没必要搞个神秘的主成分来把问题复杂化。

要知道主成分使用时,第一步是标准化,这样一来很多指标的意义就模糊了。

这种删减指标的降维方法估计人人都会,可实际中统计专业的达人们却不屑使用。

总觉得用这个方法太没面子了。

所以这里再强调点,使用方法是为了有效解决问题。

因子分析综合评价应该注意的问题

因子分析综合评价应该注意的问题

Issues That Should Be Noted on Factor Analysis for Comprehensive Evaluation
作者: 林海明[1,2];刘照德[2];詹秋泉[2]
作者机构: [1]广东财经大学华商学院,广东广州511300;[2]广东财经大学经济学院,广东广州510320
出版物刊名: 数理统计与管理
页码: 1037-1047页
年卷期: 2019年 第6期
主题词: 因子分析模型L;综合评价;合理性
摘要:因子分析综合评价应用较为普遍,而目前存在一些问题,如:因子何时需要旋转,因子个数如何确定更好,何为因子命名与正向化选取变量的标准,何为具有优良性的准确因子值,何为主成分分析与因子分析的关系与差异等,忽视这些问题会导致评价没有合理性。

这里用近期建立的因子分析新模型及其解理论等,解决了这些问题,得出因子分析综合评价达到合理需要的5个条件,并结合评价实例提出了建议。

主成分分析法总结

主成分分析法总结

主成分分析法总结在实际问题研究中,多变量问题是经常会遇到的。

变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。

因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息?一、概述在处理信息时,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠,例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。

而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。

为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。

为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。

主成分分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。

主成分分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,通常综合指标(主成分)有以下几个特点:↓主成分个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。

↓主成分能够反映原有变量的绝大部分信息因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。

↓主成分之间应该互不相关通过主成分分析得出的新的综合指标(主成分)之间互不相关,因子参与数据建模能够有效地解决变量信息重叠、多重共线性等给分析应用带来的诸多问题。

↓主成分具有命名解释性总之,主成分分析法是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法。

运用主成分分析评价海洋沉积物中重金属污染来源

运用主成分分析评价海洋沉积物中重金属污染来源

运用主成分分析评价海洋沉积物中重金属污染来源一、本文概述本文旨在运用主成分分析(PCA)这一统计工具,对海洋沉积物中的重金属污染来源进行评价。

随着工业化和城市化的快速发展,海洋环境面临着日益严重的重金属污染问题,这不仅对海洋生态系统构成威胁,还可能通过食物链对人类健康造成潜在影响。

因此,识别和评价重金属污染的来源对于制定有效的污染防治策略至关重要。

主成分分析作为一种多变量统计分析方法,能够通过降维处理,提取出数据中的主要信息,揭示隐藏在复杂数据背后的污染源信息。

本文首先将对主成分分析的基本原理进行介绍,然后详细阐述其在海洋沉积物重金属污染来源评价中的应用过程,包括数据收集、预处理、主成分提取与解释等步骤。

通过实例分析,展示主成分分析在海洋沉积物重金属污染来源评价中的实际应用效果,以期为相关研究和实践工作提供有益的参考。

二、研究区域与样品采集本研究选取位于中国东南沿海的某典型海域作为研究对象。

该海域受到人类活动影响显著,包括工业排放、农业活动、城市污水排放以及船舶运输等,使得该海域的海洋沉积物中可能含有多种重金属元素。

在研究区域内,我们选择了10个代表性站位进行沉积物样品的采集。

站位的选择考虑了海域内不同污染源的分布、水深、水流等因素,以确保采集到的样品能够全面反映研究区域的污染状况。

样品采集使用抓斗式采样器,在每个选定的站位采集表层沉积物样品,深度约为0-10厘米。

采样过程中,我们严格遵守了无污染的采样原则,确保采集到的样品不受外界因素的干扰。

同时,我们还对每个站位的水深、水温、盐度等环境参数进行了现场测量,以便后续分析。

采集到的沉积物样品被立即装入洁净的聚乙烯塑料袋中,密封后低温保存,以确保样品的原始状态不受破坏。

在实验室中,我们对每个样品进行了详细的记录,包括站位位置、采样日期、环境参数等信息,为后续的数据分析提供了基础数据。

通过本次采样工作,我们共获得了10个站位的海洋沉积物样品,这些样品将用于后续的主成分分析,以评价研究区域内重金属污染的来源。

主成分分析作业解析

主成分分析作业解析

Eigenvalue Difference Proportion Cumulative
1 3.10491252 0.20747090 2 2.89744162 1.96722608 3 0.93021555 0.28809329 4 0.64212226 0.33803813 5 0.30408413 0.21748637 6 0.08659776 0.05441338 7 0.03218438 0.02974261 8 0.00244178
这说明,标准后的变量X1*=(X1-27410.15385)/sqrt(41925.34721) =0.00488384*X1-133.86688 X2*=(X2- 31852.38462)/sqrt(53549.87903) ……
Eigenvalue Difference Proportion Cumulative
6(建材)
12215 16219 10351 6382 62.500 8.700 145818 0.066
7(森工)
2372 6572 8103 12329 184.400 22.200 20921 0.152
8(食品)
11062 23078 54935 23804 370.400 41.000 65486 0.263
16:26 Tuesday, May 27, 2019 2
The PRINCOMP Procedure
Eigenvectors
z1
z2
z3
z4
z5
z6
z7
z8
x1 0.476650 0.295991 0.104190 0.045303 -.184219 -.065854 0.757619 0.245000 x2 0.472808 0.277894 0.162983 -.174431 0.305448 -.048451 -.518413 0.527105 x3 0.423845 0.377951 0.156255 0.058670 0.017475 0.099048 -.174045 -.780540 x4 -.212893 0.451408 -.008544 0.516086 -.539407 0.287855 -.249427 0.220196 x5 -.388460 0.330945 0.321133 -.199416 0.449899 0.582289 0.232969 0.030623 x6 -.352427 0.402737 0.145144 0.279257 0.316835 -.713571 0.056436 -.042355 x7 0.214835 -.377415 0.140459 0.758169 0.418201 0.193587 0.052842 0.041160 x8 0.055034 0.272736 -.891162 0.071855 0.322201 0.122168 0.067111 -.003300

黑龙江省15家县级公立医院医疗服务绩效评价

黑龙江省15家县级公立医院医疗服务绩效评价

黑龙江省15家县级公立医院医疗服务绩效评价黑龙江省护理高等专科学校黑龙江省哈尔滨市 150000【摘要】:目的对黑龙江省15家县级公立医院2021年的服务能力进行评价,促进黑龙江省县级公立医院改革。

方法采用主成分分析法分析黑龙江省县级公立医院的服务能力。

结果黑龙江省县级公立医院整体服务能力较低,不同级别、不同县域医院的服务能力差距较大。

结论黑龙江省县级公立医院服务能力有待提高,成本控制能力尚需要进一步改善。

【关键词】:县级公立医院;服务能力;主成分分析县级公立医院的服务能力能够反应出其满足县域内居民医疗服务需求的能力及水平,医院服务能力的高低直接影响到县域内居民健康的改善情况[1]。

本研究收集了2021年黑龙江省15家县级公立医院的相关数据,采用主成分分析法对黑龙江省县级公立医院的服务能力进行评价[2],为深化医药卫生体制改革提供决策依据。

一、资料与方法1.1资料来源所有数据来源于黑龙江省卫生信息统计数据。

1.2方法运用SPSS24,采用因子分析方法建立黑龙江省县级公立医院财务绩效的综合评价模型,并筛选影响黑龙江省县级公立医院财务绩效的主要因素。

二、结果1.KMO和Bartlett's球形检验结果如表1所示。

说明各维度指标之间并非独立,此资料适合做因子分析。

表1 KMO统计量和Bartlett's球形检验结果KMO统计量0.897Bartlett's球形检验近似卡方值122.37P值0.0002.主成分分析结果综合考虑因子的特征值和贡献率,按照常规以累积贡献率超过70%为标准,对8个一级指标进行主成分的提取。

最终保留了3个公因子,第一个公因子命名为“经营能力因子”;第二个公因子命名为“服务质量因子”;第三个公因子里命名为“服务效率因子”。

表2 各维度主成分列表成分初始特征值提取平方和载入旋转平方和载入特征根变异(%)累积变异(%)特征根变异(%)累积变异(%)特征根变异(%)累积变异(%)14 .32632.60132.6014.32632.60132.6013.25617.33245.78623 .15829.32461.9253.15829.32461.9252.74617.10166.854311577.11577.21677..992.412337.992.412337.231.38133740 .8749.72187.05850 .3548.14795.20560 .3262.06297.26770 .2171.87699.14380 .1420.857100表3 各维度旋转成份矩阵成份F1F2F3偿债能力(X1)0.674营运能力(X2)0.971发展能力0.3260.702(X3)成本效果0.241-0.549(X4)收支结构-0.6690.387(X5)0.549患者医药费用水平(X6)医疗服务质量0.8460.187(X7)0.921医疗服务效率(X8)1.综合评价模型构建表4县级公立医院财务绩效评价指标各初始因子的载荷矩阵F1F2F3偿债能力(X1)-0.176-0.165-0.118营运能力(X2)0.621-0.021-0.159发展能力(X3)0.322-0.3860.074成本效果(X4)0.1310.259-0.075收支结构(X5)0.1030.4280.004-0.126-0.2190.197患者医药费用水平(X6)0.1480.4330.178医疗服务质量(X7)0.0210.0290.564医疗服务效率(X8)根据因子得分的系数矩阵,可以进一步得出三个公因子的计算公式为:F经营能力因子、=-0.176X1+0.621X2+0.322X3+0.131X4+0.103X5-0.126X6+0.148X7+0.021X8;F服务质量因子=-0.165X1-0.021X2-0.386X3+0.659X4+0.428X5-0.219X6+0.433X7+0.029X8;F服务效率因子=-0.118X1-0.159X2+0.074X3-0.075X4+0.004X5+0.197X6+0.178X7+0.564X8;4.黑龙江省县级公立医院财务绩效综合评价将15个县级公立医院编码依次为A1,A2,A3,....,A15。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
关键词: 主成分分析; 综合评价; 步骤; 问题; 解析 中图分类号: O212 文献标识码: A 文章编号: 1002- 6487( 2007) 08- 0016- 03
1 主成分分析法在综合评价中出现的一些问 题
在 社 会 经 济 、管 理 、自 然 科 学 等 众 多 领 域 的 多 指 标 体 系 中, 如节约型社会指标体系、生态环境可持续型指标体系、和 谐 社 会 指 标 体 系 、投 资 环 境 指 标 体 系 等 , 主 成 分 分 析 法 常 被 应用于综合评价与监控。
理论新探
对主成分分析法运用中十个问题的解析
林海明
( 广东商学院 经济贸易与统计学院, 广州 510320)
摘 要: 主成分分析的应用十分广泛,但由于有关文献没有完整、系统地阐述主成分分析的综合评 价步骤,以至应用主成分分析法进行综合评价时出现一些问题和困难。据归纳, 有 10 个问题经常出现。 本文对这些进行了逐一解析, 提出了主成分分析法使用中的建议与综合评价步骤, 并以实例说明它的 有效性。

息误差(∑i=m+1 λi)达到最小, 使用主成分分析法最好。 结论 3 当原始变量之间有 相 关 性 , B0 中 每 行 的 系 数 绝
对值往 0 或 1 靠近得较多 (与旋转后因子载荷阵 B0C 比较), 则使用主成分分析法。
问题⑦解析: m 按某个累积贡献率确定, 当 λm>1、第 m+1 个 单 位 特 征 向 量 αm+1 的 第 t 个 元 素 atm+1≥0.9 时 , 则 Fm 中 不 能解释原始变量 xt, 这是主成分 分 析 法 有 时 会 丢 失 一 些 原 始 变量解释的主要原因。因为初始因子载荷阵 B0 是变量 X 与 主成分 Fm 的相关 系 数 阵 , 如 果 B0 每 行 中 至 少 有 一 个 系 数 绝 对 值 足 够 大(≥0.5), 则 主 成 分 Fm 不 会 丢 失 原 始 变 量 的 解 释 , 故有:
主 成 分 分 析 法 中 对 主 成 分 没 有 旋 转 。如 果 对 主 成 分 进 行 正 交
旋转, 原始变量的线性组合会发生改变, 该线性组合不能达
到方差的最大化, 这已不是主成分分析的结果了。
问题④解析: 主成分解的公式是直接的表达式, 主成分
基金项目: 广州市哲学社会科学规划资助项目( 06YZ140) ; 广东商学院经济贸易与统计学院 2006 年资助课题
/ 2 1用前 m 个主成分的样品值做聚类分析, 按综合主成分
值相应顺序给出分类结果( 结论 5) ;
/ 3 1结合前 m 个主成分样品值的聚类分析结果, 主成分、
综 合 主 成 分 样 品 值 和 排 序 , 主 成 分 、综 合 主 成 分 与 原 始 变 量
的 对 应 关 系 , 进 行 优 势 、劣 势 、潜 力 、差 距 状 况 和 原 因 等 的 综
⑤与旋转后因子载荷阵 B0C ( SAS 软件因子分析过程命 令中的 Rotated Factor Pattern)比较, 若 B。中每行的系数绝对
值往 0、1 靠近较多, 则用主成分分析法( 结论 3) ;
⑥确定主成分个 数 m: 以 B0 每 行 中 至 少 有 一 个 系 数 绝 对值足够大( ≥0.5) 确定( 结论 4) ;
16 统计与决策 2007 年 8 月( 理论版)
理论新探
分析法中的主成分解是完全没有必要进行回归计算的。 问题⑤解析: 主成分 fi 与正交因子 zi 有 , Varfi=λi, Varzi=
1, 主成分分析法中没有旋转, 即主成分 fi 与正交因子 zi 的 取 值范围、旋转方向不同, 故样品计量值不相等、两种方法应用 条 件 不 相 同 , 混 淆 在 一 起 是 样 品 计 量 值 、旋 转 方 向 交 替 错 误 (具体异同见文献[4]) , 故不论何条件, 有:
主成分分析法的理论与计算是较成熟的, 但在解决实际 问题中, 主成分分析法的应用并没有达到较成熟状态。据归 纳, 一些使用者在应用主成分分析法进行综合评价时, 出现 以下 10 个问题不明确:
①原始数据没有正向化, 有何影响? 如何正向化? ②原始变量表示主成分的系数平方和不是 1 对吗? ③主成分分析法的主成分正交旋转后会怎样? ④主成分分析法的主成分有必要回归计算吗? ⑤主成分分析法与正交因子分析法能混合使用吗? ⑥何时使用主成分分析法? ⑦主成分分析法有时会丢失一些原始变量的原因是什么? ⑧主成分如何命名, 并能保持原始变量与多个主成分的 内在关系? ⑨前 m 个主成分仍然是多因素, 仅用综合主成分进行综 合分析客观吗? ⑩综合评价结果, 如何能深入到决策相关性程度? 有关文献并没有清楚地阐述上述问题, 以至应用主成分 分析法进行综合评价时, 不易把握。本文除了逐一解析上述 问题外, 还给出了主成分分析法使用中的建议与综合评价步 骤, 并以实例说明它的有效性。
!1 /xj
xij>0
1 /(max |xij |+xj +1) xij 中有 0 或有负数

适度指标 xj 正向化公式[3]: 1 / ( |xj- E|+1) , E 为理想值。这
里 xij 为第 i 个样品第 j 个指标的观测值。
设 X=(x1 ,…,xP)T(T 为转置符号)为正向化、标准化随机变

成分 X 的 系 数 平 方 和 是 1、无 旋 转 、无 回 归 , zi 为 未 旋 转 因 子
得分, 结论 1);

⑨综合主成分函数 F 综=∑i=1 (λi /p)fi;
/ 0 1对前 m 个主成分的样品值进 行 排 序 , 用 SAS 软 件 iml
模块计算综合主成分 F 综的样品值并排序;

问 题②解 析 : 主 成 分 fi 中 变 量 x 的 系 数 向 量 αi 是 ( R 的
特征值 λi 的相应) 单位正交特征向 量 , 即 主 成 分 中 变 量 X 的
ห้องสมุดไป่ตู้

系数平方和全部是 1, αi αj=0,i≠j, 如果不符合这个条件就是
错的, 同时有:

结论 1 fi=(bi / $λi )'X, i=1,…,m。 问题③解析: 主成分解的公式对主成分是无旋转的, 即
结 论 4 如 果 B0 每 行 中 至 少 有 一 个 系 数 绝 对 值 足 够 大 (≥0.5), m 便是主成分的确定个数, 此时主成分 Fm 不会丢失 原始变量, 能达到最大限度降维的目的。

问题⑧解析: B0 的第 i 列 bi 是原始变量 X 与主成分 fi 的 相关系数, 绝对值大(≥0.5)的对应变量 与 fi 相 关 性 高 , 而 以 fi 中 X 的系数向量 αi 对主成 分 fi 进 行 命 名 不 能 判 断 出 原 始 变 量 X 与主成分 fi 的相关性, 这样主成分分析法有时会失去一 些原始变量与多个主成分的内在关系, 因此有:
结论 6 对无相关性的前 m 个主成分样品值进行聚类 分析, 按综合主成分值相应顺序给出分类, 能可靠地反映样 品之间的共性规律, 便于客观、可靠地进行样品共性的分析。
问题⑩解析: 主成分分析、聚类分析给出了样品客观、可 靠的个性与共性特征, 但主成分有综合性, 决策相关性有待 与 原 始 指 标 结 合 起 来 。注 意 到 主 成 分 是 按 相 关 性 高 的 原 始 变 量进行归类命名的, 故将相应原始变量对应替换为相应主成
结论 5 B0 的第 i 列绝对值大(≥0.5)的对 应 原 始 变 量 归 为 主 成 分 fi 一 类 , 并 由 这 些 变 量 对 fi 命 名 , 这 样 主 成 分 分 析 法不会失去一些原始变量与多个主成分的内在关系。
问题⑨解析: 前 m 个主成分的样品值反映的是 n 个样品 在 m 个主成分中的相对位置, 表现出样品的优势、劣势、差距 状况等, 且没有相关性, 分析问题可靠性高, 仅用综合主成分 进行综合分析失去的就是这些内在因素, 以致不客观, 因此, 应将前 m 个主成分、综合主成分的样品值结合起来分析才是 客 观 的 、可 靠 的 。 但 样 品 数 量 较 多 , 逐 个 分 析 看 不 出 共 性 规 律, 为此, 对无相关性的前 m 个主成分样品值进行聚类分析, 并按综合主成分值相应顺序给出分类, 便找出了样品之间具 有可靠性的共性规律, 故有:
结论 2 主成分分析法与正交因子分析法不能混淆使 用。
问题⑥解析: 主成分分析法的优点是, 对原始变量具有 综 合 性 的 降 维 能 力 ; 如 果 B0 中 每 行 的 系 数 绝 对 值 往 0 或 1 靠 近 得 较 多(与 旋 转 后 因 子 载 荷 阵 B0C[1]比 较 ) , 即 主 成 分 命 名、解释原始变量清晰, 同时主成分 Fm 解释原始变量 X 的信
量 向 量(p≥2), R 为 相 关 系 数 矩 阵 , 秩(R)=r( R 的 非 零 特 征 根
个 数 ) , R 的 特 征 值 为 λ1、λ2、… 、λr、0, λ1≥λ2≥…≥λr>0, 前 m
个单位正交特征向量矩阵 Am=(α1, ...,αm)=(αij)p×m, 主成分向量
Fm=(f1,…,fm)T。
合评价, 给出决策相关性建议( 结论 5、结论 6) 。
4 实证应用: 安徽省各地市经济发展综合评 价与建议
现以文献[2]数据为例, 指标选取为: X1- 城镇单位在岗职 工平均工资(元), X2- 固定 资 产 投 资(万 元), X3- 进 口 总 额(万 美 元),X4- 社会消费品零售总额(万元),X5- 工业增加值(亿元),X6- 财政收入(亿元); 城市为 17 个: 合肥市、淮北市、亳州市、宿州 市 、蚌 埠 市 、阜 阳 市 、淮 南 市 、滁 州 市 、六 安 市 、马 鞍 山 市 、巢 湖 市 、芜 湖 市 、宣 城 市 、铜 陵 市 、池 州 市 、安 庆 市 和 黄 山 市 。 原 始 数 据 见 文 献 [2]。
相关文档
最新文档