多元统计分析报告
多元统计分析实验报告

第二部分:实验过程记录(可加页) (包括实验原始数据记录,实验现象记录,实验过程发现的问题
等) 操作步骤: 1、 执行“分析”—“比较均值”—“单因素方差分析” ; 2、 在弹出的单因素方差分析对话框中,将时期选为因子,将 X1、X2、X3、X4 选为因变量; 3、 单击“对比” ,选择“多项式” ,在后面的下拉菜单中选择“线性” ,然后继续; 4、 单击“两两比较” ,选择“LSD”和“S-N-K” ,显著性水平默认为 0.05,然后继续; 5、 单击“选项” ,选择“方差同质性检验”和“均值图” ,然后继续,点击“确定”后即可输出结果。
12
题目:研究者提出,随着时间的推移头骨尺寸会发生变化,这是外来移民与原住民人口民族融合的证据。表 6.13 是古埃及三个时期的男性头骨的四个观测值得观测数据,这是个观测变量是: X1=头骨最大的最大宽度 X2=头骨高度 X3=头骨底穴至齿槽的长度 X4=头骨鼻梁高度 对古埃及头骨数据构造单因子 MANOVA 表, a=0.05.并构造 95%联合置信区间来判断在三个时期中哪个分 令 量的均值发生了改变。同常的 MANOVA 假设对这些数据是不是合理的?请解释。 部分数据如下:
实验课程名称:多元统计分析-均值向量检验
实验项目名称 实 验 者 同 组 者
均值向量检验习题 均值向量检验习题 6.24
专业班级
实验成绩 实验成绩 组 别 年 月 日
实验日期
一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,主要仪器设备及耗材,实验
方案与技术路线等) 实验目的:深入了解方差分析及方差分析的概念,掌握方差分析的基本原理;掌握方差分析的过程;增强实 践能力,能够动手用统计软件解决实际问题,熟练掌握方差分析的基本操作。 实验原理:多个正态总体均值向量检验(多元方差分析) 设 有 k 个 p 元 正 态 总 体 N p ( µ1 , Σ), L , N p ( µ k , Σ) , 从 每 个 总 体 抽 取 独 立 样 品 个 数 分 别 为
多元统计数据分析报告(3篇)

第1篇一、引言随着大数据时代的到来,数据量急剧增加,传统的统计分析方法已无法满足复杂数据关系的挖掘需求。
多元统计分析作为一种处理多个变量之间关系的方法,在社会科学、自然科学、工程技术等领域得到了广泛应用。
本报告旨在通过对某研究项目的多元统计分析,揭示变量之间的关系,为决策提供科学依据。
二、研究背景与目的本研究以某企业员工绩效评估数据为研究对象,旨在通过多元统计分析方法,探究员工绩效与个人特质、工作环境等因素之间的关系,为企业人力资源管理部门提供决策支持。
三、数据与方法1. 数据来源本研究数据来源于某企业员工绩效评估系统,包括员工的基本信息、个人特质、工作环境、绩效评分等。
2. 研究方法本研究采用以下多元统计分析方法:(1)描述性统计分析:对员工绩效、个人特质、工作环境等变量进行描述性统计分析,了解数据的分布情况。
(2)相关分析:分析变量之间的线性关系,找出相关系数较大的变量对。
(3)因子分析:将多个变量归纳为少数几个因子,揭示变量之间的内在关系。
(4)聚类分析:将员工根据绩效、个人特质、工作环境等因素进行分类,分析不同类别员工的特点。
(5)回归分析:建立员工绩效与个人特质、工作环境等因素之间的回归模型,分析各因素对绩效的影响程度。
四、数据分析结果1. 描述性统计分析通过对员工绩效、个人特质、工作环境等变量的描述性统计分析,得出以下结论:(1)员工绩效评分呈正态分布,平均绩效评分为75分。
(2)个人特质得分集中在中等水平,其中创新能力得分最高,稳定性得分最低。
(3)工作环境得分普遍较高,其中工作压力得分最低。
2. 相关分析通过对员工绩效、个人特质、工作环境等变量进行相关分析,得出以下结论:(1)绩效与创新能力、稳定性、工作环境等因素呈正相关。
(2)创新能力与稳定性呈负相关。
3. 因子分析通过对员工绩效、个人特质、工作环境等变量进行因子分析,得出以下结论:(1)提取了3个因子,分别对应创新能力、稳定性、工作环境。
多元统计分析 实验报告

多元统计分析实验报告1. 引言多元统计分析是一种用于研究多个变量之间关系的统计方法。
在实验中,我们使用了多元统计分析方法来探索一组数据中的变量之间的关系。
本报告将介绍我们的实验设计、数据收集和分析方法以及结果和讨论。
2. 实验设计为了进行多元统计分析,我们设计了一个实验,收集了一组相关变量的数据。
我们选择了X、Y和Z这三个变量作为我们的研究对象。
为了获得准确的结果,我们采用了以下实验设计:1.确定研究目的:我们的目标是探索X、Y和Z之间的关系,并确定它们之间是否存在任何相关性。
2.数据收集:我们通过调查问卷的方式收集了一组数据。
我们请参与者回答与X、Y和Z相关的问题,以获得关于这些变量的定量数据。
3.数据整理:在收集完数据后,我们将数据进行整理,将其转化为适合多元统计分析的格式。
我们使用Excel等工具进行数据整理和清洗。
4.数据验证:为了确保数据的准确性,我们对数据进行验证。
我们检查数据的有效性,比较数据之间的一致性,并排除任何异常值。
3. 数据分析在数据收集和整理完毕后,我们使用了一些常见的多元统计分析方法来分析我们的数据。
以下是我们使用的方法和步骤:1.描述统计分析:我们首先对数据进行了描述性统计分析。
我们计算了X、Y和Z的均值、标准差、最大值和最小值等。
这些统计量帮助我们了解数据的基本特征。
2.相关性分析:接下来,我们进行了相关性分析,以确定X、Y和Z之间是否存在相关关系。
我们计算了变量之间的相关系数,并绘制了相关系数矩阵。
这帮助我们确定变量之间的线性关系。
3.回归分析:为了更进一步地研究X、Y和Z之间的关系,我们进行了回归分析。
我们建立了一个多元回归模型,通过回归方程来预测因变量。
同时,我们还计算了回归系数和R方值,以评估模型的拟合度和预测能力。
4. 结果和讨论根据我们的实验设计和数据分析,我们得出了以下结果和讨论:1.描述统计分析结果显示,X的平均值为x,标准差为s;Y的平均值为y,标准差为s;Z的平均值为z,标准差为s。
多元统计实验报告

多元统计实验报告一、实验目的多元统计分析是统计学的一个重要分支,它能够处理多个变量之间的复杂关系。
本次实验的主要目的是通过实际操作和数据分析,深入理解多元统计分析的基本原理和方法,并掌握其在实际问题中的应用。
二、实验数据本次实验使用了一组来自某市场调研公司的数据集,包含了消费者的年龄、性别、收入、消费习惯等多个变量,共计_____个样本。
三、实验方法1、主成分分析(PCA)主成分分析是一种降维方法,它通过将多个相关变量转换为一组较少的不相关变量(即主成分),来简化数据结构并提取主要信息。
2、因子分析因子分析用于发现潜在的公共因子,这些因子能够解释多个观测变量之间的相关性。
3、聚类分析聚类分析将数据对象分组,使得同一组内的对象具有较高的相似性,而不同组之间的对象具有较大的差异性。
四、实验过程1、数据预处理首先,对原始数据进行了清洗和预处理,包括处理缺失值、异常值和数据标准化等操作,以确保数据的质量和可用性。
2、主成分分析使用统计软件进行主成分分析,计算出特征值、贡献率和累计贡献率。
根据特征值大于 1 的原则,确定了保留的主成分个数。
通过主成分载荷矩阵,解释了主成分的实际意义。
3、因子分析运用因子分析方法,提取公共因子,并通过旋转因子载荷矩阵,使得因子的解释更加清晰和具有实际意义。
计算因子得分,用于进一步的分析和应用。
4、聚类分析采用 KMeans 聚类算法,根据选定的变量对样本进行聚类。
通过不断调整聚类中心和重新分配样本,最终得到了较为合理的聚类结果。
五、实验结果与分析1、主成分分析结果提取了_____个主成分,它们累计解释了_____%的方差。
第一个主成分主要反映了_____,第二个主成分主要与_____相关,以此类推。
这为我们理解数据的主要结构提供了重要的线索。
2、因子分析结果成功提取了_____个公共因子,它们能够较好地解释原始变量之间的相关性。
每个因子所代表的潜在因素也得到了清晰的解释,有助于深入了解消费者的行为特征和市场结构。
多元统计实验报告

多元统计实验报告多元统计实验报告导言在现代科学研究中,多元统计方法被广泛应用于数据分析和模式识别等领域。
本次实验旨在通过多元统计方法探索变量之间的关系,并研究其对研究对象的影响。
实验设计我们选择了一个实验样本,包括100名大学生。
我们收集了他们的性别、年龄、身高、体重、学业成绩和运动习惯等多个变量。
通过对这些变量进行统计分析,我们希望能够了解它们之间的关系,并且进一步推断这些变量对大学生的影响。
数据预处理在进行多元统计分析之前,我们首先需要对数据进行预处理。
我们对缺失值进行了处理,使用均值填充了缺失的数据。
然后,我们进行了数据标准化,以消除不同变量之间的量纲差异。
主成分分析我们首先进行了主成分分析(PCA),以降低数据维度并寻找主要的变量。
通过PCA,我们得到了三个主成分,它们分别解释了总方差的70%、20%和10%。
这表明我们可以用这三个主成分来代表原始数据的大部分信息。
聚类分析接下来,我们进行了聚类分析,以研究样本之间的相似性和差异性。
我们使用了K-means算法,并将样本分为三个簇。
通过观察每个簇的特征,我们发现第一个簇主要包括男性、年龄较大、身高较高、体重较重、学业成绩较好和较少运动的大学生;第二个簇主要包括女性、年龄较小、身高较矮、体重较轻、学业成绩一般和较多运动的大学生;第三个簇则包括了男女性别各半、年龄、身高、体重、学业成绩和运动习惯都相对均衡的大学生。
相关分析为了研究变量之间的相关性,我们进行了相关分析。
我们发现学业成绩与年龄和身高之间存在较强的正相关关系,而与体重和运动习惯之间存在较弱的负相关关系。
这表明学业成绩可能受到年龄和身高的正向影响,而受到体重和运动习惯的负向影响。
回归分析最后,我们进行了回归分析,以探究变量对学业成绩的影响。
我们选择了年龄、身高、体重和运动习惯作为自变量,学业成绩作为因变量。
通过回归分析,我们得到了一个显著的回归模型,解释了学业成绩的40%的方差。
其中,年龄和身高对学业成绩有正向影响,而体重和运动习惯对学业成绩有负向影响。
多元统计课程实验报告

一、实验背景随着社会经济的发展和科学技术的进步,数据量日益庞大,如何从大量数据中提取有价值的信息,成为统计学研究的热点问题。
多元统计分析作为统计学的一个重要分支,通过对多个变量之间的关系进行分析,为决策者提供有力的数据支持。
本实验旨在通过实际操作,让学生熟练掌握多元统计分析方法,提高数据分析能力。
二、实验目的1. 掌握多元统计分析的基本概念和方法;2. 学会运用多元统计分析方法解决实际问题;3. 提高数据分析能力,为后续课程打下坚实基础。
三、实验内容本次实验以某城市居民消费数据为例,运用多元统计分析方法对其进行分析。
四、实验步骤1. 数据导入首先,将实验数据导入统计软件(如SPSS、R等)。
本实验采用SPSS软件,数据集包含以下变量:(1)收入(y):居民年收入;(2)教育程度(x1):居民最高学历;(3)年龄(x2):居民年龄;(4)家庭人口(x3):家庭人口数量;(5)住房面积(x4):家庭住房面积。
2. 描述性统计分析对数据集进行描述性统计分析,包括各变量的均值、标准差、最大值、最小值等。
3. 相关性分析运用皮尔逊相关系数、斯皮尔曼等级相关系数等方法,分析变量之间的相关关系。
4. 主成分分析运用主成分分析方法,提取主要成分,降低数据维度。
5. 聚类分析运用K-means聚类分析方法,将居民划分为不同的消费群体。
6. 随机森林回归分析运用随机森林回归分析方法,预测居民收入。
五、实验结果与分析1. 描述性统计分析根据描述性统计分析结果,可知居民年收入、教育程度、年龄、家庭人口、住房面积的平均值、标准差、最大值、最小值等。
2. 相关性分析通过相关性分析,发现收入与教育程度、年龄、家庭人口、住房面积之间存在显著的正相关关系。
3. 主成分分析根据主成分分析结果,提取出两个主成分,累计方差贡献率为84.95%,可以解释大部分的变量信息。
4. 聚类分析通过K-means聚类分析,将居民划分为3个消费群体。
多元统计分析——典型相关分析实验报告

多元统计分析实验报告课程名称多元统计分析实验成绩实验内容典型相关分析指导老师姓名专业班级一、实验目的典型相关分析(Canonical correlation)又称规则相关分析,用以分析两组变量间关系的一种方法;两个变量组均包含多个变量,所以简单相关和多元回归的解惑都是规则相关的特例。
典型相关将各组变量作为整体对待,描述的是两个变量组之间整体的相关,而不是两个变量组个别变量之间的相关。
本文旨在通过分析农业基础用品投入量与农产品产量数据,利用典型相关分析分析两者的关系,同时达到熟练使用SPSS软件进行典型相关分析操作的目的。
二、实验数据本文使用2002-2011年全国农产品产量与农业基础用品投入量数据,如表2-1所示。
第一组数据为农产品产量(由左到右依次为,粮食产量X1、油料产量X2、糖料产量X3、蔬菜产量X4),第二组数据为农业基础用品投入量(由左到右依次为,农用塑料薄膜使用量Y1、农用柴油使用量Y2、农药使用量Y3)。
表2-1 2011-2011年全国农产品产量与农业基础用品投入量数据由于cancorr不能读取中文名称,所以变量名均需为英文名。
将表2-1数据转换为能够进行典型相关分析形式的数据,如表2-2所示。
表2-2 典型相关分析数据(农产品产量与农业基础用品投入量数据)三、实验过程SPSS 16.0并未提供典型相关分析的交互窗口,只能直接在syntax editor 窗口呼叫SPSS的CANCORR程序来执行分析。
选择【File】—【New】—【Syntax】,弹出Syntax对话框,在对话框中写入调用Cancorr程序,如图3-1所示。
图3-1 Syntax窗口调用CONCORR函数四、实验结果表4-1为第一组数据,即农产品产量之间的相关关系表。
从表中可以看出,粮食产量(X1)与蔬菜产量(X4)有较高的相关关系,相关系数高达0.9035;粮食产量(X1)与糖料产量(X3)相关关系也较大,相关系数为0.8081;油料产量(X2)与蔬菜产量(X4)的相关关系较大,为0.7442。
SPSS多元统计分析实验报告

实 验 课名称:SPSS统计分析
实验项目名称:多元线性回归分析
专 业 名 称:统计学
班 级:
学 号:
学 生 姓 名:
教 师 姓 名:
2014年12月20日
组别同组同学
实验日期2014年12月20日 实验名称多元统计分析
一、实验名称:
多元统计分析
二、实验目的和要求:
通过运用SPSS软件的多元统计分析揭示主管性格与雇员对其整体满意度之间的关系掌握多元统计分析的原理及建模过程。
六、实验结果与分析
通过以上建模和检验过程,最后得到的符合实际且具有统计意义的方程为:Y=0.78X1,即雇员对主管的满意程度只与主管处理雇员的抱怨有关,且成正相关。
七、讨论和回答问题及体会:
1.通过学习,我掌握了多元线性回归的基本原理和步骤,并学会运用SPSS软件进行处理该类问题和比较熟练地分析结果。
设随机变量y与一般变量x1,x2……xk的线性回归模型为:
y=β0+β1*x1+β2*x2+……+βk*xk+ε
其中β0,β1,β2……+βk是k+1个未知参数,β0称为回归常数,β1,β2……+βk称为回归系数,y称为被解释变量;x1,x2……xk称为解释变量。通过最小二乘法估算出各系数,并测定方程的拟合程度、检验回归方程和回归系数的显著性,得到最后的方程。
3运用SPSS软件进行多元分析对模型进行整理,比较调整的R系数、方差分析表、回归分析结果(各系数机器t检验等)、共显性检验等统计方法,得出结果。
四、实验仪器与设备:
SPSS软件、兼容SPSS软件的电脑一台、老师给的数据素材。
五、实验原理:
多元线性回归模型是一元线性回归模型的扩展,其基本原理与一员线性回归模型类似,计算公式如下:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多元统计分析课程设计主成分分析法在我国居民生活质量状况综合评价中的应用姓名:专业班级:学院:数学与系统科学学院学号:指导教师:山东科技大学2014年6月24日目录摘要 (1)1.问题及背景 (2)1。
1背景提出 (2)2主成分分析概念与方法 (2)3主成分分析法在我国居民生活质量状况综合评价中的应用 (4)3。
1原始数据 (4)3.2数据标准化 (5)3。
3相关系数矩阵 (6)3。
4特征方程及主成分确定 (7)3。
5各特征值的单位特征向量 (7)3.6主成分值以及综合分值 (7)3。
7各主成分上的得分 (8)3.8综合因子得分 (10)3。
9评价结果和排序 (10)4。
聚类分析 (10)5 建议 (11)摘要改革开放以来,我国各地区间的经济发展速度有着明显差别,而人民的生活质量也因此产生了不同,本文用主成分分析法、聚类分析法,选取职工人均工资1()X ,人均居住面积2()X ,城市人口用水普及量3()X ,城市煤气普及量4()X ,人均拥有道路面积5()X ,人均绿地公共面积6()X ,批发零售贸易商品销售总额7()X ,旅游外汇收入8()X 8个指标,以综合因子的贡献率确定主成分和权重, 计算出主成分分值值以及综合分值,对全国31个省市居民的生活质量进行了简单的分析,得到以下结论:根据31个省市的综合分值可以将居民生活质量状况按照降序进行以下排序:上海、广东、北京、江苏、浙江、福建、天津、山东、重庆、辽宁、湖北、安徽、 湖 南、江西、山西、河北、陕西、四川、新疆、广西、青海、河南、云南、贵州、内蒙古、 宁夏、黑龙江、吉林、海南、甘肃、西藏。
关键词主成分分析法、聚类分析法、居民生活质量状况、综合评价使用软件:SPSS 17.0 Matlab 7.01。
问题及背景1.1背景提出随着生产水平的的不断提高,我国居民生活水平不断提高,生活质量也在不断改进。
但是,受各地区生产力发展水平不平衡的影响,我国各地区居民生活质量也表现为不平衡。
1.2 问题阐述基于以上背景,我们决定利用主成分分析法对我国31个省市、自治区的居民生活质量状况进行评价分析。
为全面分析各地区居民生活质量的状况,特选取如下的指标体系进行反映:职工人均工资1()X ,人均居住面积2()X ,城市人口用水普及量3()X ,城市煤气普及量4()X ,人均拥有道路面积5()X ,人均绿地公共面积6()X ,批发零售贸易商品销售总额7()X ,旅游外汇收入8()X (符号下同)。
通过对以上指标进行分析,从而对我国的居民生活质量状况进行评价分析。
2主成分分析概念与方法2.1主成分分析概念主成分分析是由卡尔和皮尔逊最早在1901年提出, 只不过当时是应用于非随机变量, 1933年霍蒂林将这个概念推广到随机向量。
该方法是利用降维的思想, 把多指标转化为几个综合指标的多元统计分析方法。
主成分分析的基本原理: 主成分分析是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量, 这些新的变量按照方差依次递减的顺序排列,在数学变换中保持变量的总方差不变, 使第一变量具有最大的方差, 称为第一主成分; 第二变量的方差次大, 并且和第一变量不相关, 称为第二主成分; 依次类推,k 个变量就有k 个主成分。
通过主成分分析方法, 可以根据专业知识和指标所反映的独特含义对提取的主成分因子给予新的命名, 从而得到合理的解释性变量。
将得到的主成分筛选、计算, 最终得到综合评价结果。
2。
2主成分分析法综合评价模型的基本步骤基于主成分分析法的综合评价是根据评价等级中各因子的参数, 通过主成分分析法的计算, 得出基于主成分分析法的评价标准, 再将待评价的事物按照主成分分析法, 得出主成分值及综合分值, 对照评价标准, 得出综合评价结果。
2.3主成分分析法综合评价模型的具体步骤如下:(1)建立观测样本矩阵:111212122212p p n n np x x x x x x X x x x ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦式中:n p 为样本数,为变量数(2)将原始数据标准化:为了排除数量级和量纲不同带来的影响, 采用以下公式对原始数据进行标准化处理.*,(1,2,,;1,2,,)ij jij jx x x i n j p s -===其中,221111,()1n n j ij j ij j i i x x S x x n n ====--∑∑ (3)建立变量的相关系数矩阵:,T ij p pR R X X ⨯==(r )不妨设 式中,ij r 是指标i X 与指标j X 之间的相关系数。
(4)计算特征方程:计算特征方程0E R λ-= 求解R 的特征根12.....0p λλλ≥≥≥>及其相应的单位特征向量.其中, 特征根为主成分j Y 的方差, 方差越大, 则对总方差的贡献越大。
(5)计算各个成分的方差贡献率:① 计算各个成分的方差贡献率1/100%pj j j j e λλ==⨯∑贡献率解释了主成分 j Y 所反映信息的大小, 贡献率最大的主成分为第一主成分, 其次为第二主成分, 以此类推。
②选择主成分的个数取决于主成分的累计方差贡献率1,1,2,....mj j e m p ==∑当前面m 个主成分的累计贡献率大于85%以上, 基本上保留了原来因子12,,......,p X X X 的信息, 由此因子数将由 p 个减少为m 个, 从而起到筛选因子的作用。
③写出主成分, 即1122......j j j pj p Y a X a X a X =+++(6)计算综合得分:将待评价事物的标准化数据代入各主成分的表达式中, 计算得到待评价事物的各主成分值 j Y , 以各主成分的方差贡献率 j e 为权重求和, 即得到待评价事物的综合分值为:1mj j j Z e Y ==∑( 7) 评价等级及标准:根据主成分分析法的评价标准, 结合待评价事物的综合分值, 最终得到待评价事物所属等级。
3主成分分析法在我国居民生活质量状况综合评价中的应用3.1原始数据:3.2数据标准化对表一中31个地区八项指标的具体数据进行标准化处理,把数据转换为标准指标正态分布,见表二:表二31个地区八项指标的标准化数据注:正值表示该项指标位于平均值以上,零表示该项指标与平均值持平;负值表示位于平均值以 下。
3。
3相关系数矩阵相关系数矩阵为:1.0000 0.4341 0.2013 0.1850 -0.3111 -0.1153 0.4632 0.4188 0.4341 1.0000 0.3666 0.3972 -0.0552 -0.0626 0.6002 0.3898 0.2013 0.3666 1.0000 0.92V =97 0.1638 0.1524 0.4354 0.3270 0.1850 0.3972 0.9297 1.0000 0.1770 0.2492 0.4339 0.3172 -0.3111 -0.0552 0.1638 0.1770 1.0000 0.5133 0.1402 -0.0025 -0.1153 -0.0626 0.1524 0.2492 0.5133 1.0000 0.2342 0.2538 0.4632 0.6002 0.4354 0.4339 0.1402 0.2342 1.0000 0.8586 0.4188 0.3898 0.3270 0.3172 -0.0025 0.2538 0.8586 1.0000⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦3.4特征方程及主成分确定通过计算, 得到 31个省市的标准化指标的相关系数矩阵特征值(表三)及其对应的特征向量(表四):表三 各特征值(从大到小)的贡献率特征值 3。
34751.7898 1。
1705 0.6334 0.5136 0。
3992 0.0858 0.0602 累计贡献率(%)41.844 64。
21678。
84786。
760____________________________一般取特征值大于 1, 累积贡献率大于 85%的因子作为主成分, 由表 三可以看出, 前面 4个主成分的贡献率达到86.760% , 如果舍去后面的几个主成分, 丢失的信息仅为 13。
240% 。
可见, 前面 4个主成分基本上包含了全部指标具有的信息,因此本报告用前面4个主成分作新的指标代替原来的8项指标。
3。
5各特征值的单位特征向量表四 各特征值的单位特征向量3.6主成分值以及综合分值3。
6。
1各个主成分的表达式根据i i i Y U λ=()可得下面四个主成分及综合分值:1123456780.28880.37400.41060.41610.07530.15620.47900.4190Y X X X X X X X X =+++++++2123456780.44480.23840.17870.21380.60990.53060.06740.0984Y X X X X X X X X =+----++3123456780.10800.05050.52500.49790.17320.36830.33160.4320Y X X X X X X X X =---++++4123456780.21250.7176+0.1681+0.1601-0.46540.3044-0.10230.2575Y X X X X X X X X =-++12340.418440.22372+0.14631+0.07913Y Y Y Y Y =+其中:1Y 指31个省市生活质量状况的第一主成分值; 2Y 指31个省市生活质量状况的第二主成分值; 3Y 指31个省市生活质量状况的第三主成分值; 4Y 指31个省市生活质量状况的第四主成分值; Y 表示居民生活质量综合水平. 3。
6.2主成分命名解释第一主成分在人均居住面积2()X ,城市人口用水普及量3()X ,城市煤气普及量4()X ,批发零售贸易商品销售总额7()X 上的系数绝对值比较大,说明第一主成分代表了我国居民生活质量状况中的居民基本生活保障设施。
第二主成分在职工人均工资1()X 的系数的绝对值比较大,说明第二主成分代表了我国居民生活质量状况中人均收入.第三主成分在人均拥有道路面积5()X ,人均绿地公共面积6()X ,旅游外汇收入8()X 的系数的绝对值比较大,说明第三主成分代表了我国居民生活质量状况中城市建设以及风景区的规划.3.7各主成分上的得分表五 31个省市居民生活质量状况在第一主成分(1Y )上的得分些地区在居民基本生活保障设施以及消费上做得比较好;而西藏、云南等地区的得分比较低,说明他们在这一方面还需要加大力度,提高居民的基本生活保障设施以及消费水平。