多元统计分析-因子分析案例
最新多元统计分析-因子分析案例

y3
0.372 -0.017 -0.500 0.575 -0.295 -0.182 0.361 -0.245 0.099 -0.100 -0.256 -0.134 -0.078 0.560 0.103
y4
-0.119 0.289 0.710 0.361 -0.178 -0.070 0.448 -0.230 0.070 -0.165 -0.206 0.092 0.213 -0.234 -0.028
5、主成分的含义解释
6、初始因子载荷矩阵
载荷
X1 X2 X3 X4 X5 X6
Y1
0.459 0.517 0.335 0.858 0.890 0.790
Y2
0. 837 0.780 0.767 -0.420 -0.329 -0.495
7、旋转后的因子载荷阵矩阵
教学水平 教学态度
载荷
X1 X2 X3 X4 X5 X6
F1
0.007 0.080 -0.030 0.949 0.945 0.931
F2
0. 932 0.958 0.469 0.089 0.085 -0.068
8、因子得分
例2:In a job interview , 48 applicants were each judged on 15 variables. The variables were
0.308 -0.014 -0.414 0.476 -0.244 -0.151 0.298 -0.202 0.082 -0.083 -0.212 -0.111 -0.065 0.463 0.085
初始因子载荷矩阵
y1
X1
0.445
X2
0.583
X3
0.109
多元统计分析案例分析

一、对我国30个省市自治区农村居民生活水平作聚类分析1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。
因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。
现从2010年的调查资料中抽取30个样本,指标数据如下:数据来源:《中国统计年鉴2010》.2、将数据进行标准化变换:3、用K-均值聚类法对样本进行分类如下:分四类的情况下,最终分类结果如下:第一类:北京、上海、浙江。
第二类:天津、、辽宁、、福建、甘肃、江苏、广东。
第三类:浙江、河北、内蒙古、吉林、黑龙江、安徽、山东、河南、湖北、四川、云南。
第四类:山西、青海、宁夏、新疆、重庆、贵州、陕西、湖南、广西、江西、。
从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。
二、判别分析针对以上分类结果进行判别分析。
其中将新疆作作为待判样本。
判别结果如下:**. 错误分类的案例从上可知,只有一个地区判别组和原组不同,回代率为96%。
下面对新疆进行判别:已知判别函数系数和组质心处函数如下:判别函数分别为:Y1=0.18x1 +0.493x2 + 0.087x3 + 1.004x4 + 0.381x5 -0.041x6 -0.631x7Y2=0.398x1+0.687x2 + 0.362x3 + 0.094x4 -0.282x5 + 1.019x6 -0.742x7Y3=0.394x1-0.197x2 + 0.243x3-0.817x4 + 0.565x5-0.235x6 + 0.802x7 将西藏的指标数据代入函数得:Y1=-1.08671Y2=-0.62213Y3=-0.84188计算Y值与不同类别均值之间的距离分别为:D1=138.5182756D2=12.11433124D3=7.027544292D4=2.869979346经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。
实验报告-因子分析(多元统计)精选全文

精选全文完整版可编辑修改实验报告主成分分析(综合性实验)(Principal component analysis)实验原理:主成分分析利用指标之间的相关性,将多个指标转化为少数几个综合指标,从而达到降维和数据结构简化的目的。
这些综合指标反映了原始指标的绝大部分信息,通常表示为原始指标的某种线性组合,且综合指标间不相关。
利用矩阵代数的知识可求解主成分。
实验题目一:将彩色胶卷在显影液下处理后在不同情形下曝光,然后通过红、绿、蓝三种滤色片并在高、中、低三种密度下进行测量,每个胶卷有高红、高绿、高蓝、中红、…、低蓝等九个指标(分别记为X1-X9九个变量)。
试验了108个胶卷,由数据已算得如下协差阵:(S2a1)177 179 95 96 53 32 -7 -4 -3419 245 131 181 127 -2 1 4302 60 109 142 4 4 11158 102 42 4 3 2137 96 4 5 6128 2 2 834 31 3339 3948实验要求:(1)试从协差阵出发进行主成分分析;(2)计算方差累积贡献率;(3)作Scree图,并结合(2)的结果确定主成分的个数;(4)试对结果进行解释。
实验题目二:下表中给出了不同国家及地区的男子径赛记录:(t8a6)Country 100m(s) 200m(s)400m(s)800m(min)1500m(min)5000m(min)10,000m(min)Marathon(mins)Argentina 10.39 20.81 46.84 1.81 3.7 14.04 29.36 137.72 Australia 10.31 20.06 44.84 1.74 3.57 13.28 27.66 128.3 Austria 10.44 20.81 46.82 1.79 3.6 13.26 27.72 135.9 Belgium 10.34 20.68 45.04 1.73 3.6 13.22 27.45 129.95 Bermuda 10.28 20.58 45.91 1.8 3.75 14.68 30.55 146.62 Brazil 10.22 20.43 45.21 1.73 3.66 13.62 28.62 133.13 Burma 10.64 21.52 48.3 1.8 3.85 14.45 30.28 139.95 Canada 10.17 20.22 45.68 1.76 3.63 13.55 28.09 130.15 Chile 10.34 20.8 46.2 1.79 3.71 13.61 29.3 134.03 China 10.51 21.04 47.3 1.81 3.73 13.9 29.13 133.53 Columbia 10.43 21.05 46.1 1.82 3.74 13.49 27.88 131.35 Cook Islands 12.18 23.2 52.94 2.02 4.24 16.7 35.38 164.7 Costa Rica 10.94 21.9 48.66 1.87 3.84 14.03 28.81 136.58 Czechoslovakia 10.35 20.65 45.64 1.76 3.58 13.42 28.19 134.32 Denmark 10.56 20.52 45.89 1.78 3.61 13.5 28.11 130.78 Dominican Republic 10.14 20.65 46.8 1.82 3.82 14.91 31.45 154.12 Finland 10.43 20.69 45.49 1.74 3.61 13.27 27.52 130.87 France 10.11 20.38 45.28 1.73 3.57 13.34 27.97 132.3 German (D.R.) 10.12 20.33 44.87 1.73 3.56 13.17 27.42 129.92 German (F.R.) 10.16 20.37 44.5 1.73 3.53 13.21 27.61 132.23 Great Brit.& N. Ireland 10.11 20.21 44.93 1.7 3.51 13.01 27.51 129.13 Greece 10.22 20.71 46.56 1.78 3.64 14.59 28.45 134.6 Guatemala 10.98 21.82 48.4 1.89 3.8 14.16 30.11 139.33 Hungary 10.26 20.62 46.02 1.77 3.62 13.49 28.44 132.58 India 10.6 21.42 45.73 1.76 3.73 13.77 28.81 131.98Indonesia 10.59 21.49 47.8 1.84 3.92 14.73 30.79 148.83 Ireland 10.61 20.96 46.3 1.79 3.56 13.32 27.81 132.35 Israel 10.71 21 47.8 1.77 3.72 13.66 28.93 137.55 Italy 10.01 19.72 45.26 1.73 3.6 13.23 27.52 131.08 Japan 10.34 20.81 45.86 1.79 3.64 13.41 27.72 128.63 Kenya 10.46 20.66 44.92 1.73 3.55 13.1 27.38 129.75 Korea 10.34 20.89 46.9 1.79 3.77 13.96 29.23 136.25 D.P.R Korea 10.91 21.94 47.3 1.85 3.77 14.13 29.67 130.87 Luxembourg 10.35 20.77 47.4 1.82 3.67 13.64 29.08 141.27 Malaysia 10.4 20.92 46.3 1.82 3.8 14.64 31.01 154.1 Mauritius 11.19 22.45 47.7 1.88 3.83 15.06 31.77 152.23 Mexico 10.42 21.3 46.1 1.8 3.65 13.46 27.95 129.2 Netherlands 10.52 20.95 45.1 1.74 3.62 13.36 27.61 129.02 New Zealand 10.51 20.88 46.1 1.74 3.54 13.21 27.7 128.98 Norway 10.55 21.16 46.71 1.76 3.62 13.34 27.69 131.48 Papua New Guinea 10.96 21.78 47.9 1.9 4.01 14.72 31.36 148.22 Philippines 10.78 21.64 46.24 1.81 3.83 14.74 30.64 145.27 Poland 10.16 20.24 45.36 1.76 3.6 13.29 27.89 131.58 Portugal 10.53 21.17 46.7 1.79 3.62 13.13 27.38 128.65 Rumania 10.41 20.98 45.87 1.76 3.64 13.25 27.67 132.5 Singapore 10.38 21.28 47.4 1.88 3.89 15.11 31.32 157.77 Spain 10.42 20.77 45.98 1.76 3.55 13.31 27.73 131.57 Sweden 10.25 20.61 45.63 1.77 3.61 13.29 27.94 130.63 Switzerland 10.37 20.46 45.78 1.78 3.55 13.22 27.91 131.2 Taipei 10.59 21.29 46.8 1.79 3.77 14.07 30.07 139.27 Thailand 10.39 21.09 47.91 1.83 3.84 15.23 32.56 149.9 Turkey 10.71 21.43 47.6 1.79 3.67 13.56 28.58 131.5 USA 9.93 19.75 43.86 1.73 3.53 13.2 27.43 128.22 USSR 10.07 20 44.6 1.75 3.59 13.2 27.53 130.55Western Samoa 10.82 21.86 49 2.02 4.24 16.28 34.71 161.83 (数据来源:1984年洛杉机奥运会IAAF/AFT径赛与田赛统计手册)实验要求:(1)试求主成分,并对结果进行解释;(2)试用方差累积贡献率和Scree图确定主成分的个数;(3)计算各国第一主成分的得分并排名。
因子分析法的经典案例

因子分析法的经典案例因子分析法是一种常用的多元统计分析方法,它可以帮助研究者发现变量之间的内在关联性,从而揭示数据背后的潜在结构。
在实际应用中,因子分析法被广泛运用于心理学、市场调研、金融分析等领域,为研究者提供了强大的工具和方法。
经典案例一,市场调研。
假设我们要对某种产品的市场需求进行调研,我们可以通过因子分析法来挖掘消费者对产品的偏好和需求。
我们收集了关于产品特性、价格、品牌、包装、口味等多个变量的调查数据,然后运用因子分析法来分析这些变量之间的内在关联性。
通过因子分析,我们可以发现消费者对产品的偏好主要集中在价格和品牌上,而对产品特性和口味的需求相对较低。
这样的分析结果可以为企业制定产品定位、市场推广和定价策略提供重要参考,有助于提升产品竞争力和市场份额。
经典案例二,心理学研究。
在心理学研究中,因子分析法常常被用来分析人格特质、心理健康、情绪状态等多维度数据。
例如,研究者可以通过调查问卷收集被试者的自我评价数据,包括情绪稳定性、社交能力、抑郁倾向等多个方面的变量。
然后,运用因子分析法来探索这些变量之间的内在结构,发现它们之间的共性因子和特质维度。
通过因子分析,我们可以发现这些变量之间的内在联系,揭示出人格特质和情绪状态的潜在结构,为心理学研究提供了重要的数据分析方法和结果解释。
经典案例三,金融分析。
在金融领域,因子分析法被广泛运用于资产组合管理、风险评估、投资决策等方面。
例如,投资者可以通过因子分析法来分析不同资产的收益率变化,挖掘出背后的共性因子和结构性关联性。
通过因子分析,投资者可以发现不同资产之间的相关性和共同波动因子,从而优化资产配置、降低投资风险、提高收益率。
总结。
因子分析法作为一种多元统计分析方法,具有广泛的应用价值和重要的理论意义。
通过以上经典案例的介绍,我们可以看到因子分析法在市场调研、心理学研究、金融分析等领域的实际应用,为研究者提供了强大的工具和方法。
因子分析法的经典案例不仅展示了其在实际问题中的应用效果,也为我们提供了深入理解和掌握这一方法的重要参考。
应用多元分析第八章 因子分析

1.00 0.32 0.33 0.18 0.00
1.00 0.24 1.00 0.34 0.24 1.00 -0.02 0.17 -0.00 1.00
例8.1.2 为了评价即将进大学的高中生的学习能力, 抽了200名高中生进行问卷调查,共50个问题。素 有这些问题可以归结为阅读理解、数学水平和艺 术素养三个方面。 例8.1.3 公司老板对48名应聘者进行面试,并给出 他们在15个方面的得分,这15个方面是:申请书 的形式(x1)、外貌(x2)、专业能力(x3)、讨人喜欢 (x4)、自信心(x5)、精明(x6)、诚实(x7)、推销能力 (x8)、经验(x9)、积极性(x10)、抱负(x11)、理解能 力(x12)、潜力(x13)、交际能力(x14)、适应性(x15)。 通过因子分析,这15个方面可归结为应聘者的外露 能力、讨人喜欢的程度、经验、专业能 i i 1,,10.
j 1
4
十项全能运动员得分相关矩阵
X1
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 1.00 0.59 0.35 0.34 0.63 0.40 0.28 0.20 0.11 -0.77
X2
X3
X4
X5
X6
X7
i 1
i
i 1
一、主成分法:
1 n 1 n x xi , S ( xi x )( xi x ) ' n i 1 n 1 i 1
ˆ ˆ 1、求出S的特征值1 p 0, 相应的正交单位特征向量
ˆ ti , i 1, , p。
2、估计:
data examp733(type=corr); input x1-x8; cards; 1.000 . . . . . . . 0.923 1.000 . . . . . . 0.841 0.851 1.000 . . . . . 0.756 0.807 0.870 1.000 . . . . 0.700 0.775 0.835 0.918 1.000 . . . 0.619 0.695 0.779 0.864 0.928 1.000 . . 0.633 0.697 0.787 0.869 0.935 0.975 1.000 . 0.520 0.596 0.705 0.806 0.866 0.932 0.943 1.000 ; proc factor data=examp733(type=corr); var x1-x8; proc factor data=examp733(type=corr) n=2; var x1-x8; run;
多元统计分析案例分析

一、对我国30个省市自治区农村居民生活水平作聚类分析1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。
因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。
现从2010年的调查资料中抽取30个样本,指标数据如下:数据来源:《中国统计年鉴2010》.2、将数据进行标准化变换:3、用K-均值聚类法对样本进行分类如下:分四类的情况下,最终分类结果如下:第一类:北京、上海、浙江。
第二类:天津、、辽宁、、福建、甘肃、江苏、广东。
第三类:浙江、河北、内蒙古、吉林、黑龙江、安徽、山东、河南、湖北、四川、云南。
第四类:山西、青海、宁夏、新疆、重庆、贵州、陕西、湖南、广西、江西、。
从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。
二、判别分析针对以上分类结果进行判别分析。
其中将新疆作作为待判样本。
判别结果如下:**. 错误分类的案例从上可知,只有一个地区判别组和原组不同,回代率为96%。
下面对新疆进行判别:已知判别函数系数和组质心处函数如下:判别函数分别为:Y1=0.18x1 +0.493x2 + 0.087x3 + 1.004x4 + 0.381x5 -0.041x6 -0.631x7Y2=0.398x1+0.687x2 + 0.362x3 + 0.094x4 -0.282x5 + 1.019x6 -0.742x7Y3=0.394x1-0.197x2 + 0.243x3-0.817x4 + 0.565x5-0.235x6 + 0.802x7 将西藏的指标数据代入函数得:Y1=-1.08671Y2=-0.62213Y3=-0.84188计算Y值与不同类别均值之间的距离分别为:D1=138.5182756D2=12.11433124D3=7.027544292D4=2.869979346经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。
因子分析 案例
因子分析案例在统计学中,因子分析是一种用于探索变量之间关系的多元统计技术。
它旨在识别观察变量之间的共性因素,并将它们组合成更少的几个因子,以便更好地理解数据的结构和特征。
本文将通过一个实际案例来介绍因子分析的应用和分析过程。
案例背景:某公司想要了解员工对工作环境的满意度,为了更好地改善工作条件和提高员工绩效,他们进行了一项调查,涉及到员工的工作压力、工作内容、工作氛围、上级领导等多个方面的问题。
调查共涉及了20个问题,公司希望通过因子分析来探索这些问题之间是否存在一些共性因素。
数据收集:公司通过问卷调查的方式收集了员工对这20个问题的评价,每个问题的评分范围为1-5分,1代表非常不满意,5代表非常满意。
共有300名员工参与了这次调查。
因子分析过程:首先,我们需要进行Kaiser-Meyer-Olkin(KMO)测度和巴特利特球形度检验,以确认数据的适合度。
然后,我们进行主成分分析,提取特征值大于1的因子,并进行因子旋转,以便更好地解释因子。
结果解释:通过因子分析,我们最终提取了4个因子,分别是工作压力、工作内容、工作氛围和上级领导。
这些因子解释了原始变量的70%的方差,说明这4个因子能够很好地概括员工对工作环境的评价。
结论与建议:根据因子分析的结果,公司可以针对不同的因子制定相应的改善措施。
比如针对工作压力较大的员工,可以加强心理健康辅导和压力管理培训;对于工作内容不满意的员工,可以优化工作流程和提供更多的技能培训;而对于工作氛围和上级领导方面的问题,公司可以加强团队建设和领导力培训,以提高员工的满意度和工作绩效。
总结:因子分析为公司提供了一个更全面、更系统的视角来理解员工对工作环境的评价,有助于公司更有针对性地改善工作条件和提高员工满意度。
因子分析不仅可以用于员工满意度调查,还可以应用于市场研究、心理学调查等领域,帮助研究者更好地理解数据的结构和特征。
通过这个案例,我们可以看到因子分析在实际问题中的应用,以及其对于数据分析和决策制定的重要性。
多元统计分析案例分析
一、对我国30个省市自治区农村居民生活水平作聚类分析1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。
因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。
现从2010年的调查资料中抽取30个样本,指标数据如2、将数据进行标准化变换:第一类:北京、上海、浙江。
第二类:天津、、辽宁、、福建、甘肃、江苏、广东。
第三类:浙江、河北、内蒙古、吉林、黑龙江、安徽、山东、河南、湖北、四川、云南。
第四类:山西、青海、宁夏、新疆、重庆、贵州、陕西、湖南、广西、江西、。
从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。
二、判别分析从上可知,只有一个地区判别组和原组不同,回代率为96%。
下面对新疆进行判别:判别函数分别为:Y1=0.18x1 +0.493x2 + 0.087x3 + 1.004x4 + 0.381x5 -0.041x6 -0.631x7Y2=0.398x1+0.687x2 + 0.362x3 + 0.094x4 -0.282x5 + 1.019x6 -0.742x7Y3=0.394x1-0.197x2 + 0.243x3-0.817x4 + 0.565x5-0.235x6 + 0.802x7将西藏的指标数据代入函数得:Y1=-1.08671Y2=-0.62213Y3=-0.84188计算Y值与不同类别均值之间的距离分别为:D1=138.5182756D2=D3=D4=经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。
三,因子分析:分析数据在上表的基础上去掉两个耕地面积和农村固定资产投资两个指标。
经spss软件分析结果如下:(1)各指标的相关系数阵:从中可以看出,大部分指标的相关系数都比较高,各变量之间的线性关系较明确,能够从中提取公共因子,适合因子分子。
多元统计分析案例分析
一、对我国30个省市自治区农村居民生活水平作聚类分析1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。
因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。
现从2010年的调查资料中抽取30个样本,指标数据如下:数据来源:《中国统计年鉴2010》.2、将数据进行标准化变换:3、用K-均值聚类法对样本进行分类如下:分四类的情况下,最终分类结果如下:第一类:北京、上海、浙江。
第二类:天津、、辽宁、、福建、甘肃、江苏、广东。
第三类:浙江、河北、内蒙古、吉林、黑龙江、安徽、山东、河南、湖北、四川、云南。
第四类:山西、青海、宁夏、新疆、重庆、贵州、陕西、湖南、广西、江西、。
从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。
二、判别分析针对以上分类结果进行判别分析。
其中将新疆作作为待判样本。
判别结果如下:**. 错误分类的案例从上可知,只有一个地区判别组和原组不同,回代率为96%。
下面对新疆进行判别:已知判别函数系数和组质心处函数如下:判别函数分别为:Y1=0.18x1 +0.493x2 + 0.087x3 + 1.004x4 + 0.381x5 -0.041x6 -0.631x7Y2=0.398x1+0.687x2 + 0.362x3 + 0.094x4 -0.282x5 + 1.019x6 -0.742x7Y3=0.394x1-0.197x2 + 0.243x3-0.817x4 + 0.565x5-0.235x6 + 0.802x7 将西藏的指标数据代入函数得:Y1=-1.08671Y2=-0.62213Y3=-0.84188计算Y值与不同类别均值之间的距离分别为:D1=138.5182756D2=12.11433124D3=7.027544292D4=2.869979346经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。
多元统计分析案例分析
一、对我国30个省市自治区农村居民生活水平作聚类分析1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进行考察。
因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数。
现从2010年的调查资料中抽取30个样本,指标数据如下:数据来源:《中国统计年鉴2010》.2、将数据进行标准化变换:3、用K-均值聚类法对样本进行分类如下:分四类的情况下,最终分类结果如下:第一类:北京、上海、浙江。
第二类:天津、、辽宁、、福建、甘肃、江苏、广东。
第三类:浙江、河北、内蒙古、吉林、黑龙江、安徽、山东、河南、湖北、四川、云南。
第四类:山西、青海、宁夏、新疆、重庆、贵州、陕西、湖南、广西、江西、。
从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平。
二、判别分析针对以上分类结果进行判别分析。
其中将新疆作作为待判样本。
判别结果如下:**. 错误分类的案例从上可知,只有一个地区判别组和原组不同,回代率为96%。
下面对新疆进行判别:已知判别函数系数和组质心处函数如下:判别函数分别为:Y1=0.18x1 +0.493x2 + 0.087x3 + 1.004x4 + 0.381x5 -0.041x6 -0.631x7Y2=0.398x1+0.687x2 + 0.362x3 + 0.094x4 -0.282x5 + 1.019x6 -0.742x7Y3=0.394x1-0.197x2 + 0.243x3-0.817x4 + 0.565x5-0.235x6 + 0.802x7 将西藏的指标数据代入函数得:Y1=-1.08671Y2=-0.62213Y3=-0.84188计算Y值与不同类别均值之间的距离分别为:D1=138.5182756D2=12.11433124D3=7.027544292D4=2.869979346经过判别,D4最小,所以新疆应归于第四类,这与实际情况也比较相符。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
y2
0.83792 0.33162 -0.29855 0.31611 0.35476 0.18554 -0.26862 -0.18716 -0.38142 -0.24218 0.13628 0.21648 0.17209 0.32557 -0.29605 -0.42673 -0.48287
y4
-0.119 0.289 0.710 0.361 -0.178 -0.070 0.448 -0.230 0.070 -0.165 -0.206 0.092 0.213 -0.234 -0.028
0.445 0.583 0.109 0.606 0.799 0.865 0.433 0.881 0.365 0.864 0.873 0.908 0.912 0.710 0.646
F1得分
-0.2463 -0.6029 2.5415 -0.1316 0.7151 -0.9363 -0.5405 0.0669 1.9646 -0.4841 -0.7702 -0.6141 -0.5599 -0.4392 -0.1057
2、 计算R的特征值
主成分 特征根 贡献率(%) 累计贡献率
Y1 2.741 45.69 45.69
Y2 2.428 40.46 86.15
Y3 0.438 7.30 93.45
3、 求特征根所对应的单位特征向量
特征向量
X1 X2 X3
Y1
0.276 0.313 0.202
Y2
0.538 0.500 0.492 教学水平
y4
0.162 0.213 0.040 0.221 0.292 0.316 0.158 0.322 0.133 0.315 0.319 0.332 0.333 0.259 0.236
初始因子载荷矩阵
y1
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
9) Experience 10) Drive 11) Ambition 12) Grasp 13) Potential 14) Keenness to join 15) Suitability
1、 求相关系数矩阵R
2、 计算R的特征值
Y1 特 征 根 7.50
Y2 2.06
Y3 1.46
Y4 1.21 0.74
F2得分
4.5448 0.2392 -0.4544 -0.8717 -0.8819 -0.1261 0.2413 -0.6099 0.3311 0.3413 -0.2304 -0.3616 -0.3808 0.0831 -0.0658 -0.0984
地区
湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆
y2
0.431 -0.033 0.237 -0.125 -0.249 -0.131 -0.400 -0.039 0.553 0.046 -0.068 -0.022 0.024 -0.079 0.421
y3
0.308 -0.014 -0.414 0.476 -0.244 -0.151 0.298 -0.202 0.082 -0.083 -0.212 -0.111 -0.065 0.463 0.085
展的17 项指标作因子分析。
数据见cd.pcrex01
反映地区社会经济发展的指标体系
X1:国内生产总值(GDP) X3:第三产业产值占GDP比重 X5:工业企业劳动生产率 X7:每万人拥有卫生技术人员数 X9:教育经费投入占GDP比重 X11:人均邮电业务总量 X13:人均固定资产投资 X15:地方财政收入占GDP比重 X17:科研经费占GDP比重 X2:人均GDP X4:人均出口额 X6:人均社会消费品零售额 X8:每万人高等学校在校生数 X10:人均货运总量 X12:每万人电话机装机数 X14:人均实际利用外资 X16:每万人科研机构数
要求:根据上面的评比结果对教师进行综合评价并分类。
1、 求相关系数矩阵R ?????
1 0.905 0.683 R 0.052 0.098 0.037 1 0.617 1 0.131 0.067 1 0.186 0.085 0.870 1 0.000 0.086 0.824 0.803
X4
X5 X6
0.518
0.538 0.477
-0.270
-0.212 -0.318 教学态度
4、 由特征向量写出主成分的表达式
y1 0.276 x1 0.313 x2 0.202 x3 0.518 x4 0.538 x5 0.477 x6 y2 0.538 x1 0.500 x2 0.492 x3 0.270 x4 0.212 x5 0.318 x6
发展实力
人文发展
交通运输 总量
6、因子得分
地区
北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南
F1得分
0.7155 0.4212 -0.2370 -1.1269 -0.7406 -0.5088 -0.8362 -0.3889 3.1695 0.1618 0.1741 -0.3588 0.9353 -0.9027 0.1243 -0.3990
F2
0. 932 0.958 0.469 0.089 0.085 -0.068
教学水平
X1 X2 X3 X4 X5 X6
教学态度
8、因子得分
例2:In a job interview , 48 applicants were each judged on 15 variables. The variables were 1) 2) 3) 4) 5) 6) 7) 8) Form of letter of application Appearance Academic ability Likeability Self-confidence Lucidity Honesty Salesmanship
5、将17项指标按高载荷分成四类,并给各公共因子命名如下:
高载荷指标 因子命名
公共因子F1Байду номын сангаас
公共因子F2
公共因子F3 公共因子F4
x2 : 人均GDP x4 : 人均出口额 x5 : 工业企业劳动生产率 x6 : 人均社会消费品零售额 x11: 人均邮电业务总量 x12: 每万人电话装机数 x13: 人均固定资产投资 x14: 人均实际利用外资 X15: 地方财政收入占GDP比重 X3:第三产业占GDP比重 X7:每万人拥有卫生技术人员数 X8:每万人高等学校在校生数 X9:教育经费投入占GDP比重 X16:每万人科研机构数 X17:科研经费占GDP比重 X10:人均货运总量 X1:GDP
旋转后的因子载荷矩阵
f1
申请书 外貌 学术 讨人喜欢 自信 精明 诚实 推销 经验 积极性 抱负 理解 潜力 交际能力 适应性
X1 X2
f2
0.83
f3
f4
0.928
X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
-0.872 0.918 0.863
-0.863
y2
0.618 -0.048 0.340 -0.180 -0.358 -0.188 -0.576 -0.056 0.795 0.066 -0.098 -0.031 0.035 -0.114 0.605
y3
0.372 -0.017 -0.500 0.575 -0.295 -0.182 0.361 -0.245 0.099 -0.100 -0.256 -0.134 -0.078 0.560 0.103
1、 求相关系数矩阵R
2、 计算R的特征值
主成分 特征根 Y1 11.1134 Y2 2.6656 Y3 0.9126 Y4 0.7052
贡献率(%)
累计贡献率
65.37
65.37
15.68
81.05
5.37
86.42
4.15
90.57
3、用主成分法得到初始因子载荷矩阵
y1
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
0.917 0.852 0.798 0.917 0.806 0.741 -0.538 0.797 -0.522
第一公共因子 f1 : 申请者外露的能力
第二公共因子 f2 :
经验
第三公共因子 f3 :
第四公共因子 f4 :
讨人喜欢
学术能力
“外貌”和“交际能力”在任何一个因子上都没 有大的载荷值。
将上章例子对全国 31个地区的社会经济发
贡献率(%)
累计贡献率
50
50
13.73
63.73
9.73
73.46
8.07
81.53
特征向量
y1
申请书 外貌 学术 讨人喜欢 自信 精明 诚实 推销 经验 积极性 抱负 理解 潜力 交际能力 适应性
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
0.12823 0 .92016 0.81227 0.87838 0.60188 0.96955 0.86623 0.93517 0.31414 0.71990 0.97349 0.96099 0.94015 0.86344 0.72272 0.86663 0.70772
4、旋转后的因子载荷矩阵
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16 X17 y1 0.36476 0.69104 0.36105 0.78837 0.92226 0.62703 0.27491 0.37746 0.02543 0.25966 0.67988 0.65907 0.68347 0.74125 0.60631 0.28362 0.15066 y2 -0.01356 0.41494 0.73168 0.42280 0.00720 0.56659 0.58194 0.77170 0.50168 0.21634 0.59021 0.50739 0.47467 0.36873 0.28811 0.77616 0.88549 y3 -0.09974 0.51072 0.26591 0.27899 0.03069 0.49666 0.68189 0.46591 -0.10558 0.87360 0.39706 0.51118 0.46804 0.34934 0.28303 0.41315 0.12400 y4 -0.83020 -0.22770 0.21693 -0.16291 0.05607 -0.15459 0.24019 0.07210 0.79724 0.09953 -0.07801 -0.14711 -0.06432 -0.17291 0.55692 0.31378 0.25580