多元统计实验报告--因子分析
多元统计分析之因子分析

多元统计分析之因子分析因子分析是一种常用的多元统计分析方法,旨在从大量观测指标中发现其背后的基本因素或维度,以简化数据分析的复杂性,并提供关于样本之间的隐含结构的信息。
本文将对因子分析的概念、原理、步骤以及其在研究中的应用进行详细介绍。
一、概念和原理因子分析是一种研究多个变量之间关系的统计技术,它通过寻找多个变量之间的共同特征,将它们归纳为较少的无关因素或构念。
这些无关因素或构念称为因子,它们是通过将原始变量进行数学转换而得到的。
因子分析通过发现这样的因子,帮助研究者识别数据中潜在的结构和模式。
因子分析的基本原理是假设多个变量之间存在共同的潜在因素,并试图将这些变量映射到较少的综合因素上。
这些潜在因素无法被直接观察到,因此需要通过数学上的推导和计算才能确定它们的存在。
因子分析的目标是找到能够解释原始变量之间的相关性的最小数目的因子。
二、步骤因子分析通常包括以下步骤:1.收集数据:收集包含多个观测指标的数据,这些指标应当反映被研究对象的多个方面。
2.确定分析的类型:根据研究目的和数据特点,确定主成分分析还是常规因子分析。
3.确定因子数目:使用合适的统计方法(如特征值、解释方差等)确定需要提取的因子数目。
4.提取因子:通过数学计算,将原始变量转换为较少的无关因子。
5.因子旋转:为了使因子更易于解释,通常进行因子旋转,以最大化因子之间的独立性并减少因子与原始变量之间的关联性。
6.解释因子:解释提取的因子,确定它们的意义和作用。
7.评估结果:评估因子分析的效果,并根据需要进行调整和修正。
三、应用因子分析广泛应用于社会科学、市场调研、心理学等领域。
以下列举一些常见的应用场景:1.人格特征研究:通过对多个问卷调查指标进行因子分析,识别人格特征的维度和结构。
2.战略管理:通过对市场指标、经济指标等进行因子分析,发现不同因素对企业发展的影响程度,从而制定合理的战略决策。
3.客户满意度调查:通过对客户满意度调查指标进行因子分析,发现影响客户满意度的各因素,并为改善客户满意度提供指导。
多元统计分析因子分析

多元统计分析因子分析多元统计分析是一种综合应用统计学和数学的方法,旨在分析多个变量之间的关系以及它们对其中一或多个隐含变量的影响。
其中,因子分析是多元统计分析中的一种方法,用于识别和解释观测数据中潜在的因子结构。
本文将介绍多元统计分析和因子分析的基本概念、原理和应用。
多元统计分析的基本概念主要包括变量、变量间的关系以及隐含变量。
变量是观测数据中的各个测量指标,可以是定量变量或定性变量。
变量间的关系描述了不同变量之间可能存在的相关性、相互作用关系或影响关系。
隐含变量是观测数据中未直接测量到但对所研究现象具有重要影响的一种潜在因素。
因子分析是一种常用的多元统计分析方法,其原理基于变量内部存在共同的变异性。
该方法尝试将观测数据中的变量通过线性组合转化为较少数量的潜在因子,以解释变量间的共同变异性。
因子分析可以分为探索性因子分析和确认性因子分析两种类型。
探索性因子分析旨在发现潜在因子的结构,确定因子的数目和变量的载荷;而确认性因子分析则是根据先前的理论和假设,验证数据是否符合所设定的因子结构。
因子分析的应用十分广泛。
在社会科学研究中,因子分析可以用于构建问卷调查中的量表,进一步检验其信度和效度。
在经济学领域,因子分析可以用于分析股票市场的主要因子,帮助投资者理解市场波动并制定投资策略。
在教育评价中,因子分析可以用于确定考试的难度、区分度和信度。
此外,因子分析还可以在医学研究中用于测量疾病的风险因素和干预效果。
在进行因子分析时,需要进行一系列的数据预处理步骤。
首先,需要检查数据的完整性,并根据需要进行数据清洗。
然后,可以进行因素提取,即确定因子的数目和每个变量在因子上的载荷。
最后,可以进行因子旋转,以使得因子的解释更为直观。
常用的因子旋转方法有正交旋转和斜交旋转两种类型。
正交旋转方法(如Varimax旋转)试图使得因子之间相互独立;而斜交旋转方法(如Oblimin旋转)允许因子之间存在一定的相关性。
总之,多元统计分析和因子分析提供了一种强大的工具,用于探索和解释多个变量之间的关系。
多元统计分析报告大作业—基于某因子分析报告地各省份城镇居民消费结构研究

2014~ 2015学年第二学期期末考试论文题目基于因子分析的各省份城镇居民消费结构研究课程名称多元统计分析任课教师学号姓名学院专业考试时间基于因子分析的各省份城镇居民消费结构研究【摘要】经济发展的差异导致了我国各省份的居民消费结构的不同。
搜集了全国31个省市某年城镇居民月平均消费数据,采用因子分析法对数据进行分析,得出各省市居民消费结构的差异,北京、广东、上海已经处于较高消费水平,各方面消费能力都较高,消费重心已经从购买商品支出转变为享受型的非商品支出;而天津、江苏、浙江等6省(市)处于中等消费水平,生存型得分较低,发展型消费因子得分较高,消费结构有很大优化空间;最后剩余的22个省(市)处于低消费水平,生存型消费因子得分最低,消费结构还没有脱离传统模式,结构较单一,并在此基础上对改善我国城镇居民消费结构提出了几点建议。
【关键词】因子分析消费结构城镇居民随着居民生活水平的不断提高以及经济发展方式的转变,居民的消费结构也在逐步转变。
现如今国内经济将主要以内需为主,最终体现出消费率提升和内需消费市场的活跃。
因此,居民的消费水平是内需的主要来源,消费结构也会影响到各地区经济的持续稳定快速发展以及经济结构的突出转变,只有看清楚各地区居民的消费水平结构,合理进行规划,才能推动经济发展和经济结构向合理方式的转变[1]。
本文在这个大前提下,为了减小各个省份在诸多方面的差异,选取各地区城镇居民家庭全年人均的消费性支出作为研究数据,根据某年31个省、市、自治区城镇居民月平均消费数据的统计数据结果,运用因子分析法对全国居民消费结构进行分析。
1.因子分析简介1.1 因子分析的基本原理因子分析是将多个实测变量转换为少数几个新的不可观测的而且相互无关的综合指标( 因子)的多元统计分析方法。
这些少量的综合指标涵盖了原始指标带有的绝大部分信息,并且根据相关性的大小把原始指标重新分组,使得同组内的指标之间相关性较高,但不同组的指标相关性较低。
因子分析实验报告

因子分析实验报告一、实验目的因子分析是一种多元统计分析方法,旨在将多个相关变量归结为少数几个综合因子,以简化数据结构和揭示潜在的变量关系。
本次实验的主要目的是通过因子分析方法,对给定的数据集进行分析,提取主要因子,并解释其含义和实际应用价值。
二、实验数据来源及描述本次实验所使用的数据来源于一项关于消费者购买行为的调查。
该数据集包含了 500 个样本,每个样本包含了 10 个变量,分别是:价格敏感度、品牌忠诚度、产品质量感知、售后服务满意度、促销活动参与度、购买频率、购买金额、购买渠道偏好、口碑传播意愿和推荐他人购买意愿。
这些变量反映了消费者在购买过程中的不同方面的态度和行为,通过对这些变量的分析,可以更好地了解消费者的购买模式和偏好,为企业的市场营销策略提供决策依据。
三、实验方法及步骤1、数据预处理首先,对数据进行了缺失值处理。
对于存在少量缺失值的变量,采用了均值插补的方法进行填充。
然后,对数据进行了标准化处理,以消除量纲的影响,使得不同变量之间具有可比性。
2、因子提取运用主成分分析法(PCA)进行因子提取。
通过计算相关矩阵的特征值和特征向量,确定因子的个数。
根据特征值大于 1 的原则,初步确定提取 3 个因子。
3、因子旋转为了使因子更具有可解释性,采用了方差最大正交旋转(Varimax rotation)方法对因子进行旋转。
4、因子解释对旋转后的因子载荷矩阵进行分析,解释每个因子所代表的含义。
四、实验结果及分析1、因子载荷矩阵经过旋转后的因子载荷矩阵如下:|变量|因子 1|因子 2|因子 3|||||||价格敏感度|075|-012|021||品牌忠诚度|018|072|-015||产品质量感知|025|068|028||售后服务满意度|022|065|031||促销活动参与度|032|-025|078||购买频率|015|028|072||购买金额|012|025|068||购买渠道偏好|028|-035|052||口碑传播意愿|018|032|058||推荐他人购买意愿|021|035|055|2、因子解释因子 1 主要反映了消费者对产品本身相关因素的关注,包括价格敏感度、产品质量感知、售后服务满意度等,可命名为“产品相关因子”。
多元统计正交因子分析实验报告

正交因子分析(设计性实验)(Orthogonal factor analysis)实验原理:因子分析是主成分分析的推广和发展,其目的是用少数几个不可观测的隐变量,即因子,来解释原始变量之间的相关关系,它也是属于多元分析中处理降维的一种统计方法。
因子分析的基本思想是通过变量间的协方差矩阵(或相关系数矩阵)内部结构的研究,寻找能控制所有变量的少数几个因子去描述多个变量之间的相关关系。
因子分析中最常用的数学模型是正交因子模型,其特点是模型中的因子相互之间正交。
实验题目一:下表中给出了二战以来奥运会运动员十项运动成绩的相关系数矩阵:(E9a6) 100米 1.00 . . . . . . . . .跳远0.59 1.00 . . . . . . . .铅球0.35 0.42 1.00 . . . . . . .跳高0.34 0.51 0.38 1.00 . . . . . .400米0.63 0.49 0.19 0.29 1.00 . . . . .110米跨栏0.40 0.52 0.36 0.46 0.34 1.00 . . . .铁饼0.28 0.31 0.73 0.27 0.17 0.32 1.00 . . .撑竿跳高0.20 0.36 0.24 0.39 0.23 0.33 0.24 1.00 . .标枪0.11 0.21 0.44 0.17 0.13 0.18 0.34 0.24 1.00 .1500米-0.07 0.09 -0.08 0.18 0.39 0.00 -0.02 0.17 -0.00 1.00实验要求:(1)试由相关系数矩阵作因子分析;covmat(2)试根据因子载荷,并结合题目背景知识,对公共因子进行命名。
实验题目二:下表中给出了不同国家及地区的女子径赛记录:(t1a7)Country 100 m(s)200 m(s)400 m(s)800 m(min)1500 m(min)3000 m(min)Marathon(min)australi 11.2 22.35 51.08 1.98 4.13 9.08 152.37 austria 11.43 23.09 50.62 1.99 4.22 9.34 159.37 belgium 11.41 23.04 52 2 4.14 8.88 157.85 bermuda 11.46 23.05 53.3 2.16 4.58 9.81 169.98 brazil 11.31 23.17 52.8 2.1 4.49 9.77 168.75 burma 12.14 24.47 55 2.18 4.45 9.51 191.02 canada 11 22.25 50.06 2 4.06 8.81 149.45 chile 12 24.52 54.9 2.05 4.23 9.37 171.38 china 11.95 24.41 54.97 2.08 4.33 9.31 168.48 columbia 11.6 24 53.26 2.11 4.35 9.46 165.42 cookis 12.9 27.1 60.4 2.3 4.84 11.1 233.22 costa 11.96 24.6 58.25 2.21 4.68 10.43 171.8 czech 11.09 21.97 47.99 1.89 4.14 8.92 158.85 denmark 11.42 23.52 53.6 2.03 4.18 8.71 151.75 domrep 11.79 24.05 56.05 2.24 4.74 9.89 203.88 finland 11.13 22.39 50.14 2.03 4.1 8.92 154.23 france 11.15 22.59 51.73 2 4.14 8.98 155.27 gdr 10.81 21.71 48.16 1.93 3.96 8.75 157.68 frg 11.01 22.39 49.75 1.95 4.03 8.59 148.53 gbni 11 22.13 50.46 1.98 4.03 8.62 149.72 greece 11.79 24.08 54.93 2.07 4.35 9.87 182.2 guatemal 11.84 24.54 56.09 2.28 4.86 10.54 215.08 hungary 11.45 23.06 51.5 2.01 4.14 8.98 156.37 india 11.95 24.28 53.6 2.1 4.32 9.98 188.03 indonesi 11.85 24.24 55.34 2.22 4.61 10.02 201.28 ireland 11.43 23.51 53.24 2.05 4.11 8.89 149.38 israel 11.45 23.57 54.9 2.1 4.25 9.37 160.48 italy 11.29 23 52.01 1.96 3.98 8.63 151.82 japan 11.73 24 53.73 2.09 4.35 9.2 150.5 kenya 11.73 23.88 52.7 2 4.15 9.2 181.05 korea 11.96 24.49 55.7 2.15 4.42 9.62 164.65 dprkorea 12.25 25.78 51.2 1.97 4.25 9.35 179.17 luxembou 12.03 24.96 56.1 2.07 4.38 9.64 174.68 malaysia 12.23 24.21 55.09 2.19 4.69 10.46 182.17 mauritiu 11.76 25.08 58.1 2.27 4.79 10.9 261.13 mexico 11.89 23.62 53.76 2.04 4.25 9.59 158.53 netherla 11.25 22.81 52.38 1.99 4.06 9.01 152.48 nz 11.55 23.13 51.6 2.02 4.18 8.76 145.48 norway 11.58 23.31 53.12 2.03 4.01 8.53 145.48 png 12.25 25.07 56.96 2.24 4.84 10.69 233 philippi 11.76 23.54 54.6 2.19 4.6 10.16 200.37 poland 11.13 22.21 49.29 1.95 3.99 8.97 160.82 portugal 11.81 24.22 54.3 2.09 4.16 8.84 151.2singapor 12.3 25 55.08 2.12 4.52 9.94 182.77 spain 11.8 23.98 53.59 2.05 4.14 9.02 162.6 sweden 11.16 22.82 51.79 2.02 4.12 8.84 154.48 switzerl 11.45 23.31 53.11 2.02 4.07 8.77 153.42 taipei 11.22 22.62 52.5 2.1 4.38 9.63 177.87 thailand 11.75 24.46 55.8 2.2 4.72 10.28 168.45 turkey 11.98 24.44 56.45 2.15 4.37 9.38 201.08 usa 10.79 21.83 50.62 1.96 3.95 8.5 142.72 ussr 11.06 22.19 49.19 1.89 3.87 8.45 151.22 wsamoa 12.74 25.85 58.73 2.33 5.81 13.04 306 (数据来源:1984年洛杉机奥运会IAAF/AFT径赛与田赛统计手册)ussr 11.06 22.19 49.19 1.89 3.87 8.45 151.22 rumania 11.44 23.46 51.2 1.92 3.96 8.53 165.45 实验要求:(1)根据以上数据对女子径赛项目作因子分析;(2)对公共因子进行解释;(3)计算各个国家的第一因子得分并进行排名。
多元统计分析实验指导书——实验五 因子分析

实验五因子分析【实验目的】掌握因子分析的基本理论,熟练掌握利用SPSS软件系统进行因子分析的步骤,会找出合理的公共因子,建立因子模型和综合评价模型。
【实验性质】必修,基础层次【实验仪器及软件】计算机及SPSS软件【实验内容】1、熟悉掌握SPSS软件进行因子分析的基本操作;2、掌握因子分析的基本原理。
【实验学时】8学时【实验注意事项】1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。
2.遇到各种难以处理的问题,请询问指导教师。
3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员同意,禁止使用移动存储器。
4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换,应报指导教师或实验室管理人员同意。
5.上机时间,禁止使用计算机从事与课程无关的工作。
【上机练习】1、对企业经济效益体系的8项指标建立因子分析模型,见表格。
这8项指标分别为:x1-固定资产利税率,x2-资金利税率,x3-销售收入利税率,x4-资金利润率,x5-固定资产利润率,x6-资金周转天数,x7-万元产值能耗,x8-全员劳动生产率。
在分析过程中,提取因子的方法为“主成分”法,并以数据的“相关阵”为分析矩阵,并且提取3个因子,采用“斜交旋转”进行因子旋转。
(1)则这3个因子的累积方差贡献率为多少?(2)请写出原始变量x1和x2的因子表达式;(3)所提取的3个公共因子分别在8个指标中的哪些指标上有较大载荷?并据此说明所提取的公因子概括了企业的何种能力?(4)分别写出因子得分表达式,并计算“大同”企业的综合因子得分。
厂家名称x1x2x3x4x5x6x7x8 1琉璃河16.6826.7531.8418.453.255528.83 1.752邯郸19.7027.5632.9419.259.825532.92 2.873大同15.2023.4032.9816.246.786541.69 1.534哈尔滨7.298.9721.30 4.834.396239.28 1.635华新29.4556.4940.7443.775.326926.68 2.146湘乡32.9342.7847.9833.966.465032.87 2.607柳州25.3937.8236.7627.668.186335.79 2.438峨嵋15.0519.4927.2114.2 6.137635.76 1.759耀县19.8228.7833.4120.259.257139.13 1.8310永登21.1335.2039.1626.552.476235.08 1.7311工源16.7528.7229.6219.255.765830.08 1.5212抚顺15.8328.0326.4017.461.196132.75 1.6013大连16.5329.7332.4920.650.416937.57 1.3114江南22.2454.5931.0537.067.956332.33 1.5715江油12.9220.8225.1212.551.076639.18 1.8操作步骤:1.选择菜单项Analyze→Data Reduction→Factor,。
《多元统计实验》因子分析实验报告一
《多元统计实验》因子分析实验报告newscore2 #显示以第二因子得分排序结果newscore3<-newscore[order(newscore[,4],decreasing=T),] #按第三因子得分排序newscore3 #显示以第三因子得分排序结果newscore4<-newscore[order(newscore[,5],decreasing=T),] #按因子综合得分排序newscore4 #显示以因子综合得分排序结果三、实验结果分析下图为数据标准化后相关系数矩阵图,可以看出x3、x8、x4之间的存在较大的相关性,这些消费指标之间存在较强的线性相关关系,适合用因子分析模型进行分析,下面用极大似然估计法进行因子分析。
将公共因子设置为3个,从下运行结果可以看出,累计方差贡献率达到了83.36%,说明选择3个是合适的,从初始载荷阵可以看出消费指标无法准确的解释因子的含义,故我们在进行基于极大似然法的正交旋转。
由下图旋转得到的因子载荷估计,居住(x3)、生活用品及服务(x4)、交通通信(x5)、教育文化娱乐(x6)、医疗保健(x7)和其他用品及服务(x8)在因子f1上的载荷分别为0.772、0.679、0.663、0.858、0.733、0.692,这六个消费指标反映了日常消费,因此f1命名为日常消费因子;x1在f2上反映了食品烟酒的消费,因此f2命名为食品烟酒因子;x2在f3上反映了衣着的消费,因此命名为衣着因子。
也由此可得到因子分析模型:x*1≈0.208f1+0.975f2+ε1x*2≈0.220f1+0.972f3+ε2x*3≈0.772f1+0.510f2+ε3x*4≈0.679 f1+0.361 f2+0.405f3+ε4x*5≈0.663 f1+0.440 f2+0.271 f3+ε5x*6≈0.858 f1+0.262 f2+ε6x*7≈0.733 f1+0.350 f3+ε7x*8≈0.692 f1+0.522 f2+0.391+ε8从下图的各因子得分结果,可以看出,在第一因子上得分多的为上海、北京、天津;第二因子上得分多的为北京、上海、云南;第三因子得分多的为海南、广东、上海;但是这样得到的结果,较难找,因此我们对得分分别按第一因子和第二因子以及第三因子进行排序可直观看出。
应用多元统计分析因子分析详解演示文稿
应用多元统计分析因子分析详解演示文稿多元统计分析是一种将多个变量进行整体分析的方法,通过该方法可以对变量之间的关系进行深入研究。
其中,因子分析是多元统计分析的一种重要方法,用于研究多个变量之间存在的潜在因子。
本文将详细介绍因子分析的原理和应用,并通过演示文稿的形式进行展示。
一、因子分析的原理因子分析是一种可以将多个变量进行综合分析的方法,它通过寻找一些潜在因子来解释变量之间的关系。
具体来说,因子分析假设变量之间存在一些潜在因子,这些因子可以通过将原始变量进行线性组合来表示。
通过因子分析,我们可以发现这些潜在因子,并了解它们与原始变量之间的关系。
因子分析的步骤如下:1.收集数据:首先需要收集相关数据,包括多个变量的观测值。
2.因素提取:将原始变量进行线性组合,得到一组新的变量,称为因子。
通常有两种方法进行因素提取,一种是主成分分析法,另一种是最大似然估计法。
3.因子旋转:由于原始因子可能存在重叠或者不够清晰的问题,需要对因子进行旋转,以便更好地解释变量之间的关系。
常用的旋转方法有方差最大旋转法和均方差旋转法。
4.因子解释:通过因子载荷矩阵来解释因子分析的结果,载荷值表示了每个变量与因子之间的相关程度,通过对载荷矩阵进行解读,可以了解到每个因子代表的意义。
5.结果验证:最后需要对因子分析的结果进行验证,包括判断因子的可解释性、因子的可靠性和效度等方面。
二、因子分析的应用因子分析可以广泛应用于各个领域中,例如心理学、经济学、市场研究等。
以下是一些具体的应用示例:1.心理学:在心理学中,因子分析可以用于研究人的心理特征。
比如,可以通过因子分析来发现人的个性特征,如外向性、内向性等因子。
2.经济学:在经济学中,因子分析可以用于研究宏观经济指标。
比如,可以通过因子分析来发现影响经济增长的因素,如投资、消费等因子。
3.市场研究:在市场研究中,因子分析可以用于分析产品特征和顾客需求。
比如,可以通过因子分析来发现不同产品特征对顾客购买行为的影响因素。
主成分分析、因子分析实验报告--SPSS
主成分分析、因子分析实验报告--SPSS主成分分析、因子分析实验报告SPSS一、实验目的主成分分析(Principal Component Analysis,PCA)和因子分析(Factor Analysis,FA)是多元统计分析中常用的两种方法,旨在简化数据结构、提取主要信息和解释变量之间的关系。
本次实验的目的是通过使用 SPSS 软件对给定的数据集进行主成分分析和因子分析,深入理解这两种方法的原理和应用,并比较它们的结果和差异。
二、实验原理(一)主成分分析主成分分析是一种通过线性变换将多个相关变量转换为一组较少的不相关综合变量(即主成分)的方法。
这些主成分是原始变量的线性组合,且按照方差递减的顺序排列。
主成分分析的主要目标是在保留尽可能多的数据信息的前提下,减少变量的数量,从而简化数据分析和解释。
(二)因子分析因子分析则是一种探索潜在结构的方法,它假设观测变量是由少数几个不可观测的公共因子和特殊因子线性组合而成。
公共因子解释了变量之间的相关性,而特殊因子则代表了每个变量特有的部分。
因子分析的目的是找出这些公共因子,并估计它们对观测变量的影响程度。
三、实验数据本次实验使用了一份包含多个变量的数据集,这些变量涵盖了不同的领域和特征。
数据集中的变量包括具体变量 1、具体变量 2、具体变量 3等,共X个观测样本。
四、实验步骤(一)主成分分析1、打开 SPSS 软件,导入数据集。
2、选择“分析”>“降维”>“主成分分析”。
3、将需要分析的变量选入“变量”框。
4、在“抽取”选项中,选择主成分的提取方法,如基于特征值大于1 或指定提取的主成分个数。
5、点击“确定”,运行主成分分析。
(二)因子分析1、同样在 SPSS 中,选择“分析”>“降维”>“因子分析”。
2、选入变量。
3、在“描述”选项中,选择相关统计量,如 KMO 检验和巴特利特球形检验。
4、在“抽取”选项中,选择因子提取方法,如主成分法或主轴因子法。
多元统计分析实验报告(精选多篇)
多元统计分析实验报告(精选多篇)第一篇:多元统计分析实验报告多元统计分析得实验报告院系:数学系班级:13级 B 班姓名:陈翔学号:20131611233 实验目得:比较三大行业得优劣性实验过程有如下得内容:(1)正态性检验;(2)主体间因子,多变量检验a;(3)主体间效应得检验;(4)对比结果(K 矩阵);(5)多变量检验结果;(6)单变量检验结果;(7)协方差矩阵等同性得Box 检验a,误差方差等同性得Levene 检验 a;(8)估计;(9)成对比较,多变量检验;(10)单变量检验。
实验结果:综上所述,我们对三个行业得运营能力进行了具体得比较分析,所得数据表明,从总体来瞧,信息技术业要稍好于电力、煤气及水得生产与供应业以及房地产业。
1。
正态性检验Kolmogorov-SmirnovaShapir o—Wilk 统计量 df Sig.统计量df Sig、净资产收益率。
113 35、200*。
978 35。
677 总资产报酬率。
121 35、200*。
964 35、298 资产负债率。
086 35。
200*.962 35、265 总资产周转率.180 35、006。
864 35。
000流动资产周转率、164 35、018.88535、002 已获利息倍数、28135.000。
55135、000 销售增长率.103 35、200*。
949 35、104 资本积累率。
251 35。
000、655 35。
000 *。
这就是真实显著水平得下限。
a。
Lilliefors显著水平修正此表给出了对每一个变量进行正态性检验得结果,因为该例中样本中n=35<2000,所以此处选用 Shapiro—W ilk 统计量。
由 Sig。
值可以瞧到,总资产周转率、流动资产周转率、已获利息倍数及资本积累率均明显不遵从正态分布,因此,在下面得分析中,我们只对净资产收益率、总资产报酬率、资产负债率及销售增长率这四个指标进行比较,并认为这四个变量组成得向量遵从正态分布(尽管事实上并非如此)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多元统计实验报告设计题目:因子分析
一、分析数据
1995年我国社会发展状况的数据
二、基本原理
因子分析的基本思想是把每个研究变量分解为几个影响因素变量,将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子。
三、实验步骤及其结果分析
1、选择Analyze→Data Reduction→Factor,打开Factor Analysis主对话框;
2、选择变量X1至X6,点击向右的箭头按钮,将六个变量移到Variable栏中;
3、点击Descriptives…按钮,打开Descriptives子对话框。
在此对话框的Statistics下选择Initial solution;Correlation Matrix下选择coefficients,单击Continue按钮,返回Factor Analysis主对话框;
4、单击Extraction…按钮,打开Extraction子对话框。
在此对话框的Method 下选择Principal components;Analyze下选择Correlation Matrix;Extract下选择Number of Factor,并在其右端的矩形框键入6;Display下选择Unrotated factor 和Scree plot,单击Continue按钮,返回Factor Analysis主对话框;点击OK按钮,显示结果清单。
(1)相关矩阵
从表Correlation Matrix(相关矩阵)可知,各变量间存在较强的相关关系,因此有必要进行因子分析。
表中主对角线上的元素为1,表明变量自身于自身的相关系数为1。
(2)解释总方差
从表Total Variance Explained(解释总方差)可知,前三个因子一起解释总方差的93.466%(累计贡献率),这说明前三个因子提供了原始数据的足够信息。
5、根据以上分析提取因子情况,单击Extraction…按钮,打开Extraction子对
话框。
Extract下选择Number of Factor,并在其右端的矩形框键入3;Display下选择Unrotated factor和Scree plot,单击Continue按钮,返回Factor Analysis主对话框;单击Scores…按钮,打开Scores子对话框。
在此对话框选择Save as Variable和Display Factor Scree Coefficient matrix,单击Continue按钮,返回Factor Analysis
主对话框;点击OK按钮,显示结果清单。
(1)因子共同度
从表Communalities(因子共同度)可看出,变量至都很好地被三个因子解释,因为这6个变量的因子共同度均在0.8以上。
(2)解释方差总和
从表Total Variance Explained (解释方差总和)的特征值可看出,提取的前三个因子的特征值共占总方差93 .364%,被放弃的其它3个因子解释的方差仅占不到10%,因此说明前三个因子提供了原始数据的足够信息。
(3)因子载荷矩阵
Component Matrix(a)(因子载荷矩阵)是初始因子载荷矩阵,通过这个系数矩阵可以用各原变量写出因子表达式,以便了解因子的含义。
从表中数据看出第一、第二和第三因子在原变量上的载荷值都相差不大,故不太好解释它们的含义,因此须进一步因子旋转以便更好地了解它们的含义。
6、单击Rotation…按钮,打开Rotation子对话框。
在Method中选择Varimax (方差最大旋转法)。
(1)旋转后因子载荷矩阵
从表Rotated Component Matrix(a)(旋转后因子载荷矩阵)可知,转轴后的因子系数已经明显向两极分化,有了更鲜明的实际意义。
将六个指标按高载荷(绝对值大)分成三类,并结合专业知识对各因子给此命名如下:
●收入因子:人均GDP、城镇居民人均年可支配收入、农村居民家庭人均
纯收入
●社会因子:高等学校数、卫生机构数
●投资因子:新增固定资产
(2)因子得分系数矩阵
根据Component Score Coefficient Matrix(因子得分系数矩阵)中因子得分系数和原始变量的标准化值可计算各观测量的各因子的得分数。
并将三个因子的得分作为三个新变量保存在数据文件中。