主成分聚类分析法在大学生综合测评中的应用
因子分析和聚类分析方法在大学生综合素质评价中的应用

因子分析和聚类分析方法在大学生综合素质评价中的应用姜明明;马丹【摘要】采用因子分析和聚类分析的方法,对学生成绩进行分析处理,得到学生综合素质的科学评价,并将学生做出科学的分类。
研究结果表明,和以往常用的两种方法(平均积点分和综合测评总分)相比,该方法更具科学性。
同时,利用多种聚类方法对学生做出的分类更加合理。
%Using factor analysis and cluster analysis methods, analyze the students’achievements and get scientific evaluation of students’comprehensive qualities, then classify the students. The results of the study show that this method is scientific, compared with commonly used two methods (grade point average and comprehensive evaluation score). At the same time, the use of several kinds of clustering methods for students makes classification more reasonable.【期刊名称】《齐齐哈尔大学学报(自然科学版)》【年(卷),期】2013(000)002【总页数】5页(P77-80,83)【关键词】因子分析;聚类分析;学生成绩;综合素质【作者】姜明明;马丹【作者单位】大庆师范学院数学科学学院,黑龙江大庆 163712;大庆师范学院数学科学学院,黑龙江大庆 163712【正文语种】中文【中图分类】O212在多元统计分析中,因子分析是指研究从变量群中提取共性因子的统计技术。
浅谈统计综合评价中主成分分析法的应用

③ 在主成分分析将原始变量变换
为成分的过程中 , 同时形成了反 映成分和指标包含信息量的权 数 , 以计算综合评价值 , 这比人为 地确定权数 , 工作量少些 , 也有助 于保证客观地反映样本间的现实 关系。 此外 , 随着电子计算机技术 的 发 展 , SAS、 SPSS等 商 品 化 统 计 分析软件的推广与应用 , 使得主 成分分析在各类综合评价实践中 的广泛应用成为现实。
GONGZUOYANJ IU
等功能于一身 , 是世界著名的统 计分析软件之一。 因此 , 我们可以 利用 SPSS中的主成分分析模块进 行评价。 具体做法是 : 将参评指标的 数据导入软件后 , 在分析模块上 选择主成分法进行分析。在矩阵 方差最大旋转” 它 旋转方面 , 取“ 。 是一种正交旋转方法。它使每个 因子上的具有最高载荷的变量数 最小 , 可以简化对因子的解释。 其 余的都可按系统默认值确定。最 后我们用第一主成分的特征向量 与原始指标值的线性加权的值得 出综合值 , 并根据其分值对企业 由高到低进行排序。 总之 , 综合评价的过程实际 上是理论与实践相结合的过程。 没有经济理论和统计专业知识的 而主 支持 , 是体现不出科学性的。 成分分析在综合评价中的应用可 避免许多人为因素 , 使评价结果 更为科学。 此外 , 由于计算机的普 及和计算软件的发展 , 使得进行 主成分分析已变成一件逐渐普遍 和十分容易的事情了。
通过数学计算可将p个原始指标的总方差分解为p个不相关的综合指标的方差之和方差达到最大贡献率最大第二个综合指标y的方差次大以此类推一般前面几个综合指标yp即可包含总方差中绝大部分也就是说主成分分析可以使原始指标的大部分方差集中于少数几个主成分综合指标上通过对这几个主成分的分析来实现对总体的综合评价
工作研究
基于主成分分析法的学生综合成绩分析

O.引 言 随着 经济全球 化和知识 经济 的强力 推动 ,人 力资源 已成 为人类 的 第一 宝贵资 源 。各 行各业 高素质人 才培养 的主要基地 是 高等院校,因 此,如 何科学 地评价 大学生 的综合成 绩成为 当前各高 校在全 面推进 素 质教育过程 中所面临 的问题之一 。 目前 高校普遍采用的方法是取学 习 成绩 的加权 平均 ,然而这种方法存在着 许多不足 ,无法反映学生的整体 素质 ,也不利 于素质教育 的推进 。如何科学地评 价当代大学 生的综合 成绩 已经引起广泛 的关注 。 1、主成 分 分 析 模 型 PCA的基本 思想是对 原来 的多个变量进 行适 当的组 合 ,组 成一些
表 2主成分载荷矩阵
1
2
3
4
X 1
0.843
O.123
-0.099
0.101
X2
O3l1
—0.128
0.563
一O.138
其中 J 骞c 。,
X
0.727
0.239
-0.285
0.087
得到标准化矩阵仍记为 =卜 ] l1 3212 ,)221 .2"22
方 面的信息 。很 明显,各 因子 的含义更为清晰 。 表 1特征值 和贡献率
特 征 值
贡献率
累计 贡 献 率
4.9l92
49.3825
49.3825
1 4758
15.1246
64.507l
1 1271
10.2486
74.7557
0.7664
8.6547
83.4104
0.023 0.454 -0.021 一O.24l -0.44012 0.283
聚类算法在大学生心理调查数据分析中的应用

聚类算法在大学生心理调查数据分析中的应用作者:许新刚赵燕来源:《无线互联科技》2023年第19期摘要:为了保障疫情防控期间高职大学生心理调查项目统计结果的可靠性,文章提出了一种基于K-means聚类算法的学生心理压力分组方法。
该方法综合利用了心理压力在生理、情绪、认知、行为等方面的外在表现数据,克服问卷调查中因主观性导致的学生自评压力数据失真的问题。
通过对自评和聚类分组结果的对比分析,本研究证明了该方法的有效性。
关键词:心理调查;描述性分析;数据挖掘;聚类算法中图分类号:TP311.13 文献标志码:A0 引言新型冠状病毒感染疫情是一次全球性的事件,给在校高职大学生的学习、生活环境带来了很多的影响:居家网课、在校网课、随疫情变化的线上线下交替的新学习模式给学习带来了不适;封控隔离、出行不便等影響了学生的交际范围;病毒的变异和传染力的提升增加了对疫情的恐慌[1-4]。
环境的急剧改变给入世尚浅的高职大学生的心理带来了压力。
学生出现了焦虑、烦躁、易怒等负面情绪,生理上出现失眠、出汗、紧张等现象,学习过程中出现了上课不集中、记忆力下降等认知下降问题。
及时了解疫情防控期间高职大学生的心理压力状态,制定合理的对策给予有效的干预释放压力,这对高职大学生的成长非常重要。
问卷调查是心理工作中获取统计资料的重要手段,既可以收集简单的人口统计信息,也可以获取体验、情感等复杂信息,通过描述性统计分析和推断性统计分析,从少量样本数据的研究得到一般性推论[5-9]。
本项目采用问卷调查的方式获取疫情防控期间高职大学生的心理状态资料,研究不同心理压力状态下学习心理特征和心理调适的效果,为学校心理工作的开展提供决策依据。
基于心理状态数据做交叉分析可以了解疫情防控期间学生在压力下的表现现状和产生问题的原因。
为了掌握学生的心理压力状态,在问卷中设计了学生的心理状态自我评价的单选题,但部分学生因自我认识不精确等原因而在自评时未选择真实的答案,导致自评数据与学生的真实心理状况出现较大差异。
主成分分析与聚类分析的实际运用

定量分析方法实验课程论文题目:主成分分析与聚类分析的实际运用专业年级:学号:姓名:任课教师:评价项目摘要正文内容工作量写作规范性合计分值10分50分20分10分10分100分得分目录一.摘要 (3)二:研究的背景及意义 (4)三.指标体系的构建 (4)1.指标体系的构建 (4)2.数据的收集整理 (4)3.指标变异系数和相关性的分析 (5)3.1指标的变异性分析 (5)3.2指标的相关性分析 (6)四.主成分分析 (7)3.1主成分基本概述 (7)3.2实际计算运用 (8)3.2.1数据的计算 (8)3.2.2结果的解释 (9)五.聚类分析 (10)4.1主要步骤 (10)4.1.1数据预处理 (10)4.1.2为衡量数据点间的相似度定义一个距离函数 (10)4.1.3聚类或分组 (10)4.1.4评估输出。
(11)六.结论 (13)七.参考文献 (14)摘要随着改革开放的进行,我国进入了一个前所未有的经济飞速发展时期,整体经济实力与日俱增。
但是,我们也应该看到各个地区的发展不平衡,沿海地区发展较快,经济增长也较快,而中西部发展相对较慢。
基于这种现状,本文从我国31个省市自治区经济的发展视角入手,运用相应的分析方法对我国各地区经济发展状况进行统计分析,用以说明我国各地区经济发展不协调的现状。
并对全国各地区的经济用聚类分析进行分类,用主成分分析对其进行分排序。
一.研究的背景及意义我国地域辽阔,由于历史、地理位置及经济基础等原因,各地经济发展水平差异很大。
改革开放以来,特别是实施西部大开发、振兴东北地区等老工业基地、促进中部地区崛起、鼓励东部地区率先发展的区域发展总体战略以来,各地经济社会发展水平有了很大提高,人民生活也有了很大改善。
但区域发展不协调、发展差距拉大的趋势仍未根本改变。
因此通过主成分分析可以得出个地区间的差距大小。
我国拥有31个省市,如果国家对每个不同的地区都采取不同的宏观政策是不切实际的,因此,通过聚类分析,对其进行分类,可以更好的对不同的经济类型采取不同的政策。
主成分分析法在多指标综合评价方法中的应用_李艳双

河 北 工 业 大 学 学 报JOURNAL OF HEBEI UNIVERSITY OF T ECHNOLOGY 第28卷1999年第1期主成分分析法在多指标综合评价方法中的应用李艳双 曾珍香 张闽 于树江(河北工业大学 管理学院 天津 300130)摘要 阐述了多指标综合评价方法的定义,并根据权重确定方法的不同,进一步将其划分为主观赋权法和客观赋权法两类评价方法.文章讨论了两类不同的评价方法的各自特点,并重点论述了客观赋权法中的主成分分析法的优点及原理,归纳整理出了主成分分析法的计算步骤.在文章的最后,以天津市的人口发展状况为基础数据,给出了计算实例.关键词 指标,综合评价,权重,主观赋权法,客观赋权法,主成分分析法中图法分类号 F 2240 引 言多指标综合评价方法[1]是把多个描述被评价事物不同方面且量纲不同的统计指标,转化成无量纲的相对评价值,并综合这些评价值以得出对该事物一个整体评价的方法.目前国内外关于多指标综合评价的方法很多,根据权重确定方法的不同,这些方法大致可分为两类:一类是主观赋权法,如层次分析法、德尔菲法[5]等,多是采用综合咨询评分的定性方法,这类方法因受到人为因素的影响,往往会夸大或降低了某些指标的作用,致使排序的结果不能完全真实地反映事物间的现实关系.另一类是客观赋权法,即根据各指标间的相关关系或各项指标值的变异程度来确定权数,避免了人为因素带来的偏差.如主成分分析法、因子分析法[2]等.本文介绍的主成分分析法在将原始变量转变为主成分的过程中,同时形成了反映主成分和指标包含信息量的权数,以计算综合评价值,这样在指标权重选择上克服了主观因素的影响,有助于保证客观地反映样本间的现实关系.1 主成分分析法的原理及优点主成分分析法是通过恰当的数学变换,使新变量主成分成为原变量的线性组合,并选取少数几个在变差总信息量中比例较大的主成分来分析事物的一种方法.主成分在变差信息量中的比例越大,它在综合评价中的作用就越大.以两个指标来衡量n 个样本的简单情况为例.n 个样本之间的变量信息用离差平方和表示,则综合评价时的总变差为:∑ni =1(xi1-x 1)2+∑ni =1(xi 2-x 2)2,如果∑ni =1(x i 1-x 1)2与∑ni =1(x i 2-x 2)2两个数值差不多,说明两个指标在变差总信息量中比重相当,综合评价时两个指标都要保留,如果二者比例为4:1的关系则说明第1个指标反映的信息量很大,占到80%,综合评价时仅用第1个就可以了,第2个可以舍弃.数学上已证明,实施变换前后的总方差(与离差平方和一样说明变差信息量)是相等的,这说明原指标代表的变差信息已由主成分来表示。
聚类与判别分析在大学生SCL-90测试结果中的运用
聚类与判别分析在大学生SCL-90测试结果中的运用滕燕【摘要】Objectives Through cluster analysis of freshmen's cores from SCL-90,seeking some effective target variables in the data from cluster analysis.Methods To evaluate the psychology health of 3 638 freshmen by Cluster analysis and stepwise discriminant analysis.Results 3 638 freshmen were divided into 3 groups by cluster analy-sis.In addition,a function on predicting was established by stepwise discriminant analysis,which included 8 target variables out of 11,which were from the scores of SCL-90.3 638 freshmen were evaluated retrospectively by the function with the error rate of 2.9%.Conclusions To evaluate the scores of SCL-90,compulsion,interpersonal sen-sitivity,depression,hostility,terror,paranoid,psychoticism factor and GSI of SCL-90 has larger discriminant signifi-cance to cluster analysis of SCL-90.%目的分析探索SCL-90结果解释中判别效果较好的聚类指标.方法对某高校3638名新生SCL-90测试结果进行K-均值聚类及逐步判别分析.结果采用K-均值聚类的方法分类,将测试结果分成3组,各组之间差异具有统计学意义.其次,通过逐步判别分析,在11个聚类指标中,选出8个有统计学意义的指标构建判别模型,用此模型对3638个新生样本作回顾性评价,误判率为2.9%.结论逐步判别分析发现,通过SCL-90中的强迫症状、人际敏感、抑郁、敌对、恐怖、偏执、精神病性7个因子分及总均分进行聚类分析的判别效果较好.【期刊名称】《中国社会医学杂志》【年(卷),期】2017(034)005【总页数】3页(P460-462)【关键词】大学生;SCL-90;聚类分析;判别分析【作者】滕燕【作者单位】云南大学心理健康咨询服务中心,云南昆明,650091【正文语种】中文【中图分类】R395.6大学阶段是青年学生心理发展的关键时期,在这一时期所面临的环境改变及适应,使得大学生在原生家庭及其社会化过程中形成的一系列问题突显。
主成分分析法在学生成绩分析中的应用
是 否 能全 面反 映原 始 数据 的 主要 信息 以 及如 何科 学 、 客
观、 全面 地评 价 学生 的 综合 成绩 对 学生 和学 校 都特 别 重 要, 是值 得大 家研 究 的课题 。
3 运 用主成 分分析 法分析学生成绩
以北京 联合 大 学应 用 文理 学 院计 算科 学 系 0 7信 息
【 A b s t r a c t】 T h i s p a p e r s t a r t s 仃 o m l h e r e a l d a t a o f t h e u n i v e r s i t y f o u r y e a r s a c h i e v e m e n t , u s i n g h t e p r i n c i p a l c o m p o n e n t a n a l y s i s m e h t o d . e s a t b l i s h e s a
m a t h e m a t i c a l mo d e l , a n d t h e n g i v e s t h e s or c e f u n c t i o n o fห้องสมุดไป่ตู้ d i f e r e n t o mp c o n e n t s , a n d om c b i n i n g he t e r s u l t s a n a l y s i s , T h e m a i n c o u se r i f n a l l y g r a d e s . A n d v e r i f y t h e c r e d i t g r a d e s c h o o l i s r e a s o n a b l e , h t e r e s u l s t p r o v i d e d h t e s c i e n i t i f c b a s i s f o r t e a c h i n g r e s e a r c h a n d ma n a g e me n t i n he t f u t u r e .
主成分分析法在SPSS中的操作及在 学生成绩评价中的应用.
毕业论文题目主成分分析法在SPSS中的操作及在学生成绩评价中的应用学院数学科学学院专业数学与应用数学班级数学1302班学生朱越文学号20130921154指导教师邢顺来二〇一七年五月二十日摘要主成分分析也称主分量分析,是用降维的思想,把分析中较多的相关因素生成少数几个无关综合因素的一种方法。
在多元统计方法中,主成分分析是一种基本的统计方法。
它不单将多指标转化为较少的综合指标,并且能给出比较客观的权重。
在本文中,首先对主成分分析的基本原理、基本模型、几何意义和求解主成分的方法进行介绍。
再依赖SPSS软件实现主成分分析方法在成绩分析的应用。
本文采用的数据是济南大学2013届数学科学学院1302班的成绩,对SPSS得出的结果进行分析评价,分析得出大学四年开设的所有课程主要与11个主成分因子有关,再对这11 个因子进一步归类,得出大学生考研与这11 类主成分因子归纳出的8类因子有很大的关联性,并依据结果再进行评价。
使得教师根据这种分析方法,能够给学生在大一到大三期间明确需要补漏的方向,从而提高学生的考研成功率。
关键词:主成分分析;SPSS;综合指标;多元统计ABSTRACTPrincipal component analysis, is an analysis of ways to reduce the number of indicators into a few comprehensive indicators. Many of the revaluation methods of human factors, the principal component analysis as a basic statistical method, not only multi-indicators into less comprehensive indicators, and can give a more objective weight.In this paper, we first introduce the basic principle, basic model, geometric meaning and principal component method of principal component analysis. And the rely on SPSS software to achieve the application of principal component analysis in performance analysis. The data used in this paper are the results of 1302 classes of 2013 School of Mathematical Sciences in Jinan University. The results obtained from SPSS are analyzed and evaluated. All the courses offered by four years are mainly related to 11 principal component factors. The factors are further classified, and it is concluded that the college entrance examination is of great relevance to the 7 factors of the 11 principal component factors, and the results are evaluated according to the results. So that teachers based on this analysis method, to the students clearly need to trap the direction of the students, so as to improve the success rate of students PubMed.Key words: Principal component analysis; SPSS; comprehensive index; multivariate statistics目录摘要 (I)ABSTRACT.............. ........ ........ ........ .. (II)1前言.................................................................. ......................... .. (1)1.1研究的背景和意义 (1)1.2研究的历史和现状 (1)1.2.1 主成分评价的历史 (1)1.2.2 主成分评价的现状 (2)1.3本文的结构安排 (2)2 主成分分析 (3)2.1数学模型和几何意义 (3)2.1.1 数学模型 (3)2.1.2 几何意义 (4)2.2 基本原理 (6)2.2.1基本定义和性质 (6)2.2.1 总体主成分 (6)2.2.1 样本主成分 (6)2.3 基本算法和步骤 (9)3 求解主成分 (12)3.1总体主成分 (12)3.1.1从协方差矩阵求解主成分 (12)3.1.2从相关阵求解主成分 (12)3.2样本主成分 (12)4 SPSS软件的简单介绍 (15)5 学生成绩分析评价 (17)5.1主成分分析在SPSS中的具体操作步骤 (17)5.2对SPSS的输出结果进行说明 (18)5.3对SPSS得出的数据进行分析评价 (27)5.4对分析结果要改进的地方进行说明 (31)结论 (33)参考文献 (34)致谢 (35)1前言1.1研究的背景和意义Karl Pearson早在1901年就提出了“主成分”这一观点,但仅仅只针对于非随机变量,Harold Hotelling基于此,在1933年把它延拓到了随机变量这一领域[8]。
主成分分析法在工业工程专业学生成绩评估中的应用
主成分分析法在工业工程专业学生成绩评估中的应用作者:周三玲,童一飞来源:《当代教育理论与实践》 2018年第3期摘要:随着中国高等教育的发展,如何综合评价学生越来越受到关注。
以62名工业工程专业本科生的13门课程成绩为样本数据,在正态分布检验、线性相关分析的基础上,运用SPSS统计软件将主成分分析法应用到学生成绩评估中,根据各主成分得分认为高等数学、系统工程、生产管理与控制等课程成绩较能代表该专业学生的总体学习状况,学生在主成分得分中的优势和劣势能为教师有针对性地进行因材施教提供一定的依据。
关键词:课程成绩;主成分分析;综合评价;SPSS中图分类号:G642.47文献标志码:A文章编号:1674-5884(2018)03-0079-06在我国高教政策的不断推进过程中,中国高等教育这几年带给大众的感觉是日新月异的发展,大众化教育也越来越普遍,其优势在于让更多的人接受了现代化的高等教育,但也在生源情况、教学质量等方面出现层次不齐的问题,同时,多元化的社会现象影响着也反映到学生的大学学习和生活中去,要想有效公正地评估学生的状况不是一件容易的事情,所以,如何评估学生具体学业水平应该受到关注和重视[1]。
目前对学生进行评估的方法主要体现在:1)基于多元统计分析的评价研究[1-2];2)基于正态分析的评价[3-4];(3)基于数据挖掘的评价分析[5]。
在众多评价方法中,以多元统计分析中的主成分分析的评价居多,而主成分分析方法从最初的数学模型到现在的一些改进算法,较多的学者对此进行了研究[6-7]。
作为一名本科生,大学四年的时间里要参与到本专业许多核心主干课程的学习中,学生的最终成绩基本能够反映学生对该门课程的掌握情况。
现行的对学生课程考试成绩的分析操作大多数在期末考试结束后分课程进行,教师通过考试成绩分析获得想要的结果,为该门课程以后的教学工作提出改进。
但是,分课程进行课程成绩的统计分析,容易忽视不同课程成绩之间的相关性,而且学生的总体成绩与哪些课程的联系比较紧密?有没有一种更加客观公正地评价学生大学4年来的综合学习效果的方法?带着这些疑问,文中以我校2011级工业工程专业62名学生在大学四年期间所学的13门核心主干课程的考试成绩为原始样本数据,运用多元统计分析的相关知识及应用SPSS统计软件[8],发现学生成绩背后掩藏的内在教学规律,从而为工业工程专业的教育教学质量改进提供参考和依据。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
X
0.6 6 2 0.7 6 4 1o O .o 0.4 8 9 0.4 7 9
X
05 6 .5 0.9 4 6 08 9 .4 1O o .o 0.7 5 9
Xs
091 . 9 0.3 7 9 07 9 .4 05 9 .7 1O o .o
1引 言 .
大学生综合素质测评是高校根据 国家的教育方针 ,采用科学的方 法 , 出符合高校教育 目标 的测评指标 , 制定 收集大学生在校学 习 、 生活 等主要活动领域 中反映 出的素质的表征信息 ,并对其做出量值或价值 的综合评定及判断过程。大学生素质综 合测评具有明确的教育导向和 积极的教育约束作用 , 能把教育中教和学有 机地统 一起来 , 有力 地提高 大学生各方面的综合素质 , 是大学生素质管理开发的有效手段。 目前 , 学生综合素质测评已成为大学生评优 、 用人单位选择毕业生的依据 。 本文利用主成分分析方法 ,对我校大学生综 合素质测评 指标进行 了研究 , 并进行聚类分析 , 以求客观 、 准确地评价大学生 的综合素质。 2 . 主成分聚类分析的原理和算法 主成 分分析法是一种将原来指标重 新组合成一组新 的综合指标 , 并根据实际需要从中取几个较少 的指标尽 可能 多地反 映原信息量 的统 计方法 目前 , 。 这种方法 已经在经济等领域得 到了广泛的应用。 聚类分 析是数理统计中的一 种多元分析方法 ,它是用数学方法定量地确定样 本的亲疏关系 , 从而客观地划分类型 。所谓 主成分 聚类分析就是将 主
x( :x 为了消除数量级和量纲不 同带来的影响 ,对原始数据进行标准化
X6
05 8 .2
06 7 .3
08 3 .5
0.4l 7
0.7 63
1O o .o
表 2各项指标的特征值和累计 贡献率 序号
l
特征值
4.3 4 3
贡献率 %
7 .7 38 6
科技信息
高校理科研 究
主 成 分 聚 类 分析 法 在大 学 生 综合 测 评 巾硇 应用
南通 大学 电子信 息 学院 陆慧琴 高月红
[ 要] 摘 大学生综合素质测评是高校 学生管理工作 中的一个重要组成部分。本文采 用主成分聚类的分析 方法对 大学生综合 测评的 评价指标进行 了研 究, 出第 1 第 2主成分和综合主成 分, 得 、 并依得分对样本进行排名 , 再利 用主成分分析结果代替原来较 多的评价 指标 , 进行聚类分析 , 所得结论客观 、 可信 , 具有说服力。 [ 关键词 ] 主成分 聚类分析 综合 测评
X
X5
) ( _ 6
09 8 .l
—. 1 02 0
从表 l中可以看 出, 学习成绩 ( ) x,与早 自习晚 自修( 间有 很强 x) 的相关性 , 道德水平 ( 与宿舍卫生 值勤 ( ) x) 之间也具有较强 的相关 性。对 R矩阵作进一步的主成分分析 , 出特征值( 求 如表 2所示 ) 。所得 到的特征值即为该主成分所对应 的方差 。方差越 大对总变量 的贡献也 就越大 , 为确定主成分 的个数和顺序 , 一般选取 累计 贡献率大于或等于 8 . %。由表 2 50 0 可见 ,相关系数矩阵有 2 个大的特征值 :. 3 0 4 , 4 3 、. 5 4 7
0. 3 85
第 2主成分
05 . 5l - .8 00 7 - 27 0.7 - 40 0.7
05 5 .3
( 确 主 分的 数。 般, 方 献 j 解释 成 4 定 成 个 一 用 差贡 率ev∑ ) = 主 分Y 反 的 息 的 小 当 计贡 率G : 到 够 的 映 信 量 大 。 累 献 ( ∑e 足 大 所 0 达
)6 【
0.2 5 8 0.3 6 7 0. 5 83 0.4l 7 0.7 6 3
成分分析与聚类分析相结合 的一种新 的综合评价方法 ,即先作 主成分
分析 , 再取若干主成分对样本进行聚类分析 。 主成分聚类分析 的算法可分为如下几个步骤 : () 1设有 n个 观测样本 , 每个样本有 P项 指标 , 得到 P项 指标的原 始数据矩阵 :
计算综合主成分得分 , 最后确定每个样本的排 序并进行综合评价。 3大学生综 合测评的主成分聚类分析 . 本文以我校某班级 2 名学生 的综合测评数据为例 , O 选取反映学生 素质 的 6项 因素作为评价指标 , 别为 : 习成绩( 、 分 学 x )思想政 治水平 ( :、 x )道德水平( 3、 x )宿舍卫生值勤 ( )早 自习晚 自修( 以及课外实 、 X) 践 ( , x )构成 了 2 0×6的原始数据矩阵( 原始数据省略 ) 。利用 S S P S软 件对这组数据进行 主成分 聚类分析 。将数据进行标准化后计算相关系
累计贡献率 %
7 .7 38 6
处理 ( 设标准化处理后 的值为 ) :
x
: =
2
3
07 5 .4
04 2 .5
1 .1 24 3
75 0 .4
8 .8 62 9
938 9 .2
4
5
02 8 .2
00 5 .9
37 4 .9
15 l .9
数 据 矩 阵 R, 果 见 表 l 结 。
表 1各指标 的相关 系数矩阵
●
Xt
Xl X2 X3 X X5 10 0 .o O6 2 .O 06 2 .6 05 6 ..0 1O o .0 06 4 .7 04 6 .9 07 9 .3
9 .2 76 4
9 21 9- 5
; X k i X k j - 撩
,… i, , j = l , 2 ,
6
00 7 .4
07 5 .8
l o.0 0 Oo
表 3主成分载荷矩 阵
指标
X1 X2 X3
第1 主成分
08 7 .l 0.4 96 0. 7 9l 08 H .0 D