基于主成分分析法学生成绩综合评价
应用主成分分析对学生综合素质进行评价

表示矩 阵 x 的列 向量 ,为简单计 ,不妨设 x】 ,…,x 尸已经 过标准化 。 通过 变换 将变量 X :l , , ) 换成 主成 分 ( ( , … p转 f 2 用 表示 ) ,主成分是 原变量 的线性 组合 ,且具有 正交特征 ,即 将X 一X 综合成 ) 个变量 ( … , ) , ,可 用多项式表
1 引言 .
高校 在对 学生 的综合 素质进 行评价 时, 传统的做法是从 现有 的指标 中精选 出若干个有代 表性的指标 , 但人为地精选 指标 难免 带有主观 随意性 ,可 能丢失 部分有 价值 的原始信 息。 而利用 主成分分析法对 多维变量进行 降维, 降维后 的变 量是原变量 的线性组合 ,并 能反映原变量绝大部 分的信息 , 使信息量 损失最小 , 对原变 量的综合解释 能力 强。该方法通 过主成分 的方 差贡献率来表示变 量的作用 , 可避免在系统分 析 中对权 重的主观判断 , 使权 重的分配更合理 ,尽可能地减 少重叠信息 的不 良影响 , 克服变 量之 间的多重相 关性 , 简化 系统分析 。 从实 际的运行 结果来看 , 应用主成分分 析法 对高校学生 的综合素 质进 行评价总体上 是合 理的 , 能为大学生在校 期 这 间创造一 个相对公平 的育人环 境,因此是有积极 意义 的。 2 .主成分 分析 的基本原理 . 11 . 什么是主成 分分析 在 实际问题 中, 究多指标 ( 研 变量 ) 问题 是经 常遇到 的, 在很 多情况 下,不 同的指标 之间具有一定 的相 关性 。由于指 标较 多并且指标之间有一定 的相关性 , 增加了分析 问题 的复 杂性 。 主成分分析就是将 原指标重新组成 一组新的相互无关 的综合指 标以代替原指标 , 同时根据实 际需要从中可取几个 较少 的综合 指标尽 可能 多地反 映指标 的统计 方法 叫做主成 分分析或 主分量分析 。 将原来 P个指标作线性 组合 ,作为新 的综 合指标 , 然后 从 中选取 若干个 ,准则如下 :用 (= , … )表示综合指 i12 , 标 ,选择其 中方差 最大的 ( 方差越大包含 的信息越 多)那个 综合指标 作为第一 个综合指标 ,标 记为 ,称为第一主成 分 ,即 V r 1 a( ) F 最大 。如 果第一主成分不足 以代 表原来 P个 指标 的信 息,再考虑选取第 二个综合指标 ,为了有效反 映原 来信息 , 已有的信息就不 需要出现在 中,用数学语 言 表达就是 C vF ,F)O o ( l 2 ,称 为第二主成 分 ,依此类推可 = 以构造 出第三 、四 ,… ,第 P个主成分 ,虽 然这样做会损 失 部分信 息 但是 由于它使 我们 抓住 了主要 矛盾,并从 原始 数据 中进一步 提取 了某些新 的信 息, 因而在某 些实际 问题 的 研究 中得益 比损失大 。 2 2主成分 分析 法及 其主要研究 思路 . 由提供 的信 息得到原始 资料矩 阵:
主成分分析在大学生综合素质评价和管理中的应用研究

主 成 分 分析 在 大 学 生 综 合 素质 评 价 和 管理 中 的应 用 研 究
郭 婧
( 北 农 业 大 学 农 学 院 ,河 北 保 定 0 1 0 ) 河 7 0 1 摘 要 :应 用 主 成 分 分析 法 , 样 本 相 关 矩 阵 出发 , 随 机 抽 取 农 学 院 农 学 专 业 2 从 对 O名 学 生 的 业 务 能 力 、 德 表 现 、 品 实践 技 能 和 体 能等 项 指 标 进 行 分 析 , 据 调 查 指 标 的 累计 方 差 贡 献 率达 到 8 以上 , 出 了 4个 反 映 学 生 综 合 素 依 5 提 质 的 主成 分 及 其 主成 分 函 数 表达 式 。 通过 计 算 各 学 生 的 重 要 主 成 分 值 , 而 对 学 生 综 合 素质 进 行 评 价 , 结 果 与 进 其 学 生 毕 业 后 从 事 工 作 的 实 际表 型相 近 。表 明用 主成 分 分 析 法 对 学 生 综 合 素 质 评 价 , 传 统 按 学 习成 绩 和 表 现 打 分 比
排 序 评 价 更 具 科 学 性 和 实用 性 , 学 生 综 合 素 质 科 学评 价 提 供 理 论 参 考 。 为
关 键 词 :主 成 分 分 析 ; 生 ;综 合 素 质 ; 学评 价 学 科
中 图 分 类 号 :G 4 67 文 献 标 志 码 :A 文 章 编 号 :1 0 0 8—6 2 ( 0l ) 1—0 1 9 7 2 10 O 3一O 4
On t e p i i a o p n nta a y i n qu lt h r nc p lc m o e n l ss i a iy a s s m e nd m a a e e t o o l g t d n s s e s nta n g m n f c le e s u e t
基于主成分分析法的学生综合成绩分析

O.引 言 随着 经济全球 化和知识 经济 的强力 推动 ,人 力资源 已成 为人类 的 第一 宝贵资 源 。各 行各业 高素质人 才培养 的主要基地 是 高等院校,因 此,如 何科学 地评价 大学生 的综合成 绩成为 当前各高 校在全 面推进 素 质教育过程 中所面临 的问题之一 。 目前 高校普遍采用的方法是取学 习 成绩 的加权 平均 ,然而这种方法存在着 许多不足 ,无法反映学生的整体 素质 ,也不利 于素质教育 的推进 。如何科学地评 价当代大学 生的综合 成绩 已经引起广泛 的关注 。 1、主成 分 分 析 模 型 PCA的基本 思想是对 原来 的多个变量进 行适 当的组 合 ,组 成一些
表 2主成分载荷矩阵
1
2
3
4
X 1
0.843
O.123
-0.099
0.101
X2
O3l1
—0.128
0.563
一O.138
其中 J 骞c 。,
X
0.727
0.239
-0.285
0.087
得到标准化矩阵仍记为 =卜 ] l1 3212 ,)221 .2"22
方 面的信息 。很 明显,各 因子 的含义更为清晰 。 表 1特征值 和贡献率
特 征 值
贡献率
累计 贡 献 率
4.9l92
49.3825
49.3825
1 4758
15.1246
64.507l
1 1271
10.2486
74.7557
0.7664
8.6547
83.4104
0.023 0.454 -0.021 一O.24l -0.44012 0.283
学分成绩-主成分分析法综合评价医学院学生成绩

t r An l s , o a i 弹出F co ay i y s a tr An ls 对话 框 , s 把 X1 ~X1 选人Va ibe 框 。 3 ra ls
Decrptv s s i ie
-
Core a i n r l to M a rx一 ti
Co fiin s 点 击 Co tn e 返 回Fa t r ef e t, c niu , co
An lss ay i对话 框 , 点击 “ 0K” 。 2 3主 成分表 达式 . 每 一 个 主 成分 的特 征 向 量 由 各个 主 成
2学分绩一 主成分分析 法的应用
某独立学院 临床医学 专业0 年级5 6 班 共 有2 名学 生 , 文 基于 用S S 软件 , 9 本 PS 利用 2 名学 生 每 门 课 程 的平 均 学 分 成 绩 进 行主 9 成分分析 。 作步骤如下 : 操 2 1 准 化数据 . 标
据 窗 口中 , 以 Z 头 命 名 。 并 开 2 2调用 F c r . a t 过程 o
Ana yz _ l e——~ t Re Da a duci n— — Fa — t0 c
3结果 与讨论
由表 l 知 , 可 只需 提 取 前 4 主 成 分 累 个 计 贡 献 率 达 到 8 .1 包 含 了学 生 成 绩 原 1 8 %, 始 指 标 提 供 的 大 部 分 信 息 , 以 利 用 它 们 可 作 为 新 的综 合 评 价 指 标 。 由表 2 知 , 一 可 第 主 成 分 中 , 专 业 英 语 》 Ⅸ 能 实 验 ( ) 和 《 、机 二 》 《 验 诊 断 学 》 荷 较 低 , 它指 标 都 有 较 实 载 其 高 的 载 荷 , 合 反 映 了 理 论 课 全 部 原 始 指 综 标 的信 息 ; 二 主 成 分 中 ,技 能 实 验 ( ) 第 《 二 》 载 荷较 高 , 主要 反映 了技 能 实验 动 力 ; 三 第 主成 分 中 , 专业 英 语 》 《 《 、 机能 实验 ( )和 二 》 《 验 诊 断 学 》 荷 较 高 , 要 反 映 了综 合 实 载 主 动手 能 力 和 专 业英 语 水 平 ; 四主 成 分 中 , 第 《 献 检 索 》 荷 较 高 , 要 反 映 了文 献 检 文 载 主
用主成分分析模型构造综合评价指数

用主成分分析模型构造中学考试综合评价指数[摘要] 在中学考试的综合评价中,使用较多的指标进行描述使分析复杂化,难以对众多指标的影响作出正确的判断,需要少量几个“综合评价指标”。
通过简单加权的合成方法,难以得到科学的结果。
主成分分析是一种多元统计方法,可以将众多指标简化浓缩为少量几个甚至一个综合评价指标,使简化的指标既能基本包括全部指标具有的信息,又使指标之间相互无关,较好地解决了这一课题。
[关键词] 考试评价;主成分分析;数学模型;计算步骤,指数构造方法一、问题的提出在中学考试评价中,通常使用各学科的“平均分”、“优秀率”、“及格率”和“低分率”等指标。
考虑到成绩的分布状况(“优秀率”与“及格率”之间的差距偏大,可能失去部分信息量),某些地区还使用了“良好率”指标。
这样,k 个学科的考试评价的p 项指标将多达k ╳p 个。
在对考试进行综合的评价时,使用较多的指标进行描述不仅会增加评价的工作量,而且会因评价指标间的相关性造成评价信息重叠,相互干扰,其结果使分析复杂化,难以对众多指标的影响作出正确的判断。
因此,需要少数几个甚至一个“综合评价指标”来代替众多的且相互之间具有相关关系的指标,同时又需要不失去原有指标具有的信息量,这是考试评价中具有现实意义的课题。
某些地区采用一种“降维”的方法,较成功地把k ╳p 维指标降为p 维指标,即在使用“总分平均分”的同时,用“科平均╳╳率”取代各科的“╳╳率”(计算方法见备注1)。
如何把p 维指标再合成为一个“综合评价指标”?采用一些简单加权的合成方法时,由于对各指标的影响不容易作出正确的定量化的判断,及权数产生的科学性等问题,往往难以得到令人信服的科学的结果。
主成分分析是一种多元统计方法,可以将众多指标简化浓缩为少数几个甚至一个综合评价指标,使简化的指标既能基本包括全部指标具有的信息,又使指标之间相互无关。
较好地解决了这一课题。
二、主成分分析的数学模型设有n 个样品,每个样品观测p 个指标(变量):X 1,X 2,…,X p , 得到原始数据矩阵:用数据矩阵X 的p 个列向量(即p 个指标向量)作线形组合(即综合指标向量)为:上述方程组要求:且系数αij 由下列原则决定:①、F i 与F j (i ≠j ,i ,j =1,…,p )不相关;②、F 1是X 1,X 2,…,X p 的一切线性组合(系数满足上述方程组)中方差最大的,F 2是与F 1不相关的X 1,X 2,…,X p 的一切线性组合中方差最大的,…,F p 是是与F 1,F 2,…,F p-1都不相关的X 1,X 2,…,X p 的一切线性组合中方差最大的。
基于主成分分析法的学生成绩评价与分析-最新教育文档

基于主成分分析法的学⽣成绩评价与分析-最新教育⽂档
基于主成分分析法的学⽣成绩评价与分析
2.运⽤主成分分析法对学⽣成绩进⾏综合评价与分析
以周⼝师范学院数学系45名学⽣在2013―2014学年的考试科成绩为例,把45名学⽣成绩作为⼀个整体,把9科考试科⽬作为变量,分别⽤X1,X2,…,X9来表⽰。
为科学评价学⽣的成绩,以各科学时除以总学时作为该科权重,再乘以此课程的原始成绩。
利⽤SPSS软件将原始数据标准化,并求出该矩阵的相关系数矩阵Q。
计算矩阵Q的特征值,得到各主成分的⽅差贡献率和累计⽅差贡献率。
累计贡献率达到80%以上的主成分系数有四个,所以可得出关系如下。
将标准化处理以后得到的数据分别代⼊到以上各个式⼦中,这样就可以得到样本在G1,G2,G3,G4,G上的得分及综合排名。
由以上分析可以知第⼀主成分对泛函分析解释⽐较充分,表⽰数学抽象理解能⼒;第⼆主成分对运筹学解释⽐较充分,作为学⽣的计算能⼒指标;第三主成分对⽑中特代表较⼤为学⽣对于时事政治⽅⾯的关注程度;第四主成分对于数学教学论解释较⼤,表⽰学⽣作为师范⽣所必须具备的实际课堂教学技能⽅⾯的能⼒。
基于主成分分析法(pca)的大学英语考试成绩综合评定

2019.3江苏外语教学研究基于主成分分析法(PCA)的大学英语考试成绩综合评定王㊀辉(广东财经大学华商学院)㊀㊀摘要:英语是一门语言ꎬ仅仅通过期末考试成绩很难科学地评定学生的英语水平ꎮ为了使考试成绩评定更加科学合理ꎬ本文提出了一种基于主成分分析(PCA)的成绩综合评定方法ꎮ首先以考试试题各项目满分值为基础对各分项目的成绩进行归一化处理ꎬ然后利用主成分分析方法求取各项目的权值系数ꎬ最后对各项目的分数进行综合评定得出综合成绩ꎬ作为学生的最终成绩ꎮ研究表明ꎬ本文所提出的方法能够有效地反映考试中难度最大和得分最离散项目的影响ꎬ与各项直接相加所得的成绩相比ꎬ综合成绩更加科学合理ꎬ也更能够反映不同考生的学习水平ꎮ关键词:考试成绩ꎻ归一化ꎻ主成分分析0.引言考试成绩是衡量学生学习情况的重要指标ꎬ也是教师教学效果的重要反映ꎮ准确㊁客观㊁全面㊁科学地评价考生的学业综合成绩对考生和教师来说都是非常重要的ꎮ目前大部分高校采取传统的评价方法ꎬ即以考试总分或学分绩点作为评价学生综合成绩的手段ꎮ但是ꎬ知识本位观影响下的教学评价内容狭窄ꎬ仅仅着眼于学生对知识掌握的多少及精确度ꎮ(李光梅ꎬ2007)如何科学地评价学生的成绩这个话题是国际上共同关心的话题ꎮ学生考试成绩不应该仅以分数论高低ꎬ学生成绩应该体现学生在本学科多方面的水平ꎮ美国采用CAAP(CollegiateAssementofAcademicProfi ̄ciency)及CLA(CollegiateLearningAssessment)测试ꎬ其共同测试内容就包括了批判性思维㊁阅读能力㊁写作能力ꎮ(赵婷婷ꎬ2015)英语作为一门语言ꎬ其掌握水平需要学生听说读写译各方面能力的展现ꎬ而课程考试的成绩并不能完全体现出学生的水平ꎮ例如ꎬ有的学生平常课堂上体现出的英语水平跟英语考试分数并不能成正比ꎮ因此ꎬ本文采用主成分分析法来对考生成绩进行科学的评价ꎮ将试题各个项目通过PCA计算分析ꎬ最终得出能体现学生真实的英语水平的成绩ꎮ1.研究方法本研究方法的原理如图1所示ꎬ首先对试题各项分数进行归一化处理ꎬ然后利用主成分分析方法(PrincipalComponentAnalysisꎬPCA)计算得出各主成分的系数ꎬ最后根据各项系数计算得出新成绩ꎮ㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀各项分数归一化ң㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀PCA分析求权值系数ң㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀计算新成绩图1㊀方法的原理1.1㊀成绩归一化试题通常由多个分项构成ꎬ英语考试常见的分项有听力㊁词汇㊁填空㊁阅读㊁翻译㊁作文等ꎬ各个分项的满分不同ꎮ在改卷时一个项目通常由一组判卷尺度相近的教师审阅ꎬ为了消除各项满分不同和教师判卷给分尺度不同所造成的影响ꎬ需要对各项分数进行归一化处理ꎮ设一次考试试题有n个项目ꎬ每个项目的满分为Mi(i=1ꎬ ꎬn)ꎬ总共有m位考生参加了考试ꎬ则由考生成绩构成的矩阵Y=(y1ꎬy2ꎬ ꎬyn)为一个m行n列的矩阵ꎬ其每一行表示一位考生的n个项目的成绩ꎬ其每一列yi表示m位考生某一项的成绩ꎬ则归一化处理方法为:xi=yi/Mi(i=1ꎬ ꎬn)(1)这种归一化方法有两个好处:一是有效地消除了教师改卷时给分尺度的问题ꎬ将尺度统一化ꎻ二是有效地消除各项满分不同所造成的差别ꎮ1.2㊀权值系数求取在实际中ꎬ很多观测变量并不是相互独立的ꎬ部分变量包含了相同的信息ꎬ主成分分析的目的主要有三方面:一㊁提取数据中最重要的信息ꎻ二㊁去除不重要的信息ꎬ以简化压缩数据ꎻ三㊁决定变量的重要程度与相互关系ꎮ(AbdiꎬWilliamsꎬ2010ꎻWoldꎬ1987)主成分分析通过对输入变量进行线性组合ꎬ生成一系列正交的主成分ꎬ并按照变量的变化速度大小进行排序ꎮ对考生成绩进行主成分分析ꎬ求取主成分系数的过程如下:首先ꎬX=(x1ꎬx2ꎬ ꎬxn)ꎬC=cov(x1ꎬx1)cov(x2ꎬx1) cov(xnꎬx1)ìîíïïïï式(2)中cov(xiꎬx于cov(xiꎬxj)=cov(xjJiangsuForeignLanguageTeachingandResearch2019.3然后ꎬ求协方差矩阵的特征值ꎬ求特征值的方程为:λI-C=0(3)式(3)中I为单位矩阵ꎮ当求出特征值λi(i=1ꎬ2ꎬ3ꎬ ꎬn)之后ꎬ将其按从大到小的顺序进行排列(即λ1ȡλ2ȡ ȡλn)ꎮ之后ꎬ求取各主成分的权值系数和累计贡献率ꎬ权值系数最大的主成分通常包含了数据中最重要的信息ꎬ主成分的权值系数ri和累计贡献率L的计算式为:ri=λi/ðni=1λi(4)L=ðki=1λi/ðni=1λi(kɤn)(5)式(5)中L表示前k个主成分的累计贡献率ꎬ通常要求主成分的累计贡献率不低于80%ꎮ最后ꎬ分别求取从大到小的k个特征值λi(i=1ꎬ ꎬk)所对应的正交单位化特征向量ei(i=1ꎬ ꎬk)ꎬ设R=[r1ꎬr2ꎬ ꎬrk]TꎬE=[e1ꎬe2ꎬ ꎬek]ꎬ则各分项的权值系数矩阵为:F=ER(6)1.3㊀综合成绩评定利用归一化处理之后的成绩X和各分项的权值系数F计算综合成绩系数:P=XF(7)由于前文对成绩进行了归一化处理ꎬ因此公式(7)计算得出的为分布在0~1之间的综合成绩系数ꎬ为了使综合评定成绩的量纲与原成绩保持一致ꎬ按下式计算综合成绩:Z=k P(8)公式(8)中k=ðni=1Miꎬ为各项目的满分之和ꎬ即试卷的总分ꎮ2.研究数据及结果2.1㊀研究数据本研究以广州某独立学院2016级大学英语成绩作为数据来源ꎬ选取了工商㊁金融㊁会计三个班共122位考生某次期末英语考试的成绩ꎬ其中工商班40位考位考生ꎬ所有班级考㊁词汇㊁填空㊁阅读㊁25㊁10㊁10㊁Y为122行Y进行归一化处理ꎬ最低ꎬ表明听力项是本次考试中难度最大㊁最难得分的一项ꎬ填空项平均归一化成绩最高ꎬ表明填空项是本次考试中最容易得分的一项ꎬ按照难度从大到小排列的顺序依次为听力㊁阅读㊁词汇㊁作文㊁翻译㊁填空ꎮ表1㊀各项的平均归一化成绩项目听力词汇填空阅读翻译作文平均归一化成绩0.470.700.860.630.840.75㊀㊀归一化后的成绩X的6个分项目的标准差如表2所示ꎬ标准差越大表示考生在该项目得分的离散程度越大ꎬ从表2中可以看出词汇的标准差最大ꎬ表明词汇项的分数分布最离散ꎮ表2㊀各项分数的标准差项目听力词汇填空阅读翻译作文标准差0.1350.2790.1970.1550.1800.127㊀㊀然后ꎬ计算各主成分的累计贡献率ꎬ计算发现前4个主成分的累计贡献率为84%ꎬ因此取前4个主成分进行分析ꎮ进而按照公式(6)计算各项目的权值系数ꎬ如表3所示ꎬ从表3中可以看出ꎬ各项权值系数从大到小排列依次为听力项㊁词汇项㊁翻译项㊁填空项㊁阅读项和作文项ꎬ其中听力项的权值最大ꎬ表明听力项最难最重要ꎬ听力对综合成绩的影响也最大ꎬ这与表1的分析结果一致ꎮ此外ꎬ词汇项的权值系数也较大ꎬ主要是因为词汇项的离散程度最大ꎬ离散程度越大的项目越容易区分出不同学生的学习水平ꎮ表3㊀各分项的权值系数听力项词汇项填空项阅读项翻译项作文项0.3240.2470.1070.0610.2210.051㊀㊀最后ꎬ按照公式(8)计算得到各位考生的综合成绩ꎮ综合成绩与原成绩的对比如图2所示ꎬ与原成绩相比综合成绩的分布更为分散ꎬ最高分由原成绩的91提高到了94.7ꎬ最低分由原成绩的44降低到了37ꎬ更加分散的成绩分布则更容易区分不同考生的水平ꎮ图2㊀综合成绩与原成绩的对比2.3㊀研究结果原成绩中80分至100分的10位高分考生的原成2019.3江苏外语教学研究绩与综合成绩的对比如表3所示ꎬ从表中可以看出ꎬ原成绩中编号为43的考生的成绩最高ꎬ而其综合成绩也最高ꎻ原成绩高于80分的考生ꎬ他们的综合成绩也都高于81.4分ꎬ表明本文介绍的方法不会埋没成绩优秀的考生ꎮ表3㊀10位高分考生的原成绩与综合成绩的对比考生编号161939436365669198122原成绩80818591808389818682综合成绩81.484.186.194.785.687.691.184.987.388.1㊀㊀编号为16和63的两位考生ꎬ他们的原成绩都为80分ꎬ从原成绩中无法区分两位考生的英语水平ꎬ而他们的综合成绩分类为81.4分和85.6分ꎬ存在明显的差别ꎻ编号为39和122的两位考生的原成绩分别为85分㊁82分ꎬ考生39的原成绩较高ꎬ而其综合成绩却低于考生122的综合成绩ꎮ以上4位考生的各项成绩如表4所示ꎬ从表中可以看出ꎬ考生16的听力㊁词汇项得分都低于考生63ꎬ而听力为本次考试中考生得分困难的一项ꎬ其在综合成绩中的权值系数也最大ꎬ并且词汇项的权值系数也较大ꎬ因此考生16的综合得分低于考生63ꎮ考生39的听力㊁词汇㊁翻译㊁填空这四项权值系数最大的项目的得分都不高于考生122ꎬ因此其综合成绩低于考生122ꎮ表4㊀4位高分考生的各项成绩考生编号听力词汇填空阅读翻译作文原成绩综合成绩16158102410138081.463179102310118085.639161010269148586.11221710102510108288.1㊀㊀原成绩中低于50分的8位低分考生的原成绩与综合成绩的对比如表5所示ꎬ从表5中可以看出ꎬ这8位原成绩低于50分的考生ꎬ他们的综合成绩也不高于56分ꎮ表5㊀8位低分考生的原成绩与综合成绩的对比考生编号136174109116117118原成绩4445454946474646综合成绩47.941.237.048.656.042.942.543.4㊀㊀考生109的原成绩低于考生74ꎬ而其综合成绩却得到了56分ꎬ高于考生74ꎮ这两位考生的各项成绩如表5所示ꎬ从表中可以看出ꎬ对于权值系数最大的四项 听力㊁词汇㊁翻译㊁填空ꎬ两位考生听力项的得分相同ꎬ翻译和词汇两项的权值系数相近ꎬ虽然考生109词汇项得分比考生74少4分ꎬ但是考生109翻译项得分比考生74高8分ꎬ并且考生109填空项得分比考生74高ꎬ因此考生109比考生74的综合得分高ꎮ表6㊀2位低分考生的各项成绩考生编号听力词汇填空阅读翻译作文原成绩综合成绩74108515294948.61091046610104656.03.结语通过数据分析ꎬ可得出以下结论:(1)以主成分分析方法重新计算学生学习成绩ꎬ由综合成绩可以看出ꎬ原成绩高的学生综合成绩也高ꎬ原成绩低的学生综合成绩也没有太大改变ꎮ这说明ꎬ主成分分析得出的成绩对学生原成绩的影响并不太大ꎮ(2)本文所提出的基于主成分分析的综合评分法中ꎬ考试难度最大的项目是听力题ꎬ得分最离散的项目是词汇题ꎬ这两项对综合得分影响最大ꎮ按照多数学者的观点及学生自身的反映ꎬ听力和词汇确实属于相对较难的题型ꎮ以此来看ꎬ主成分分析方法比普通的直接相加计算总分的方法更加科学合理ꎮ此分析结果或许能为以后的英语教学提供一点启示ꎬ在教学中要注重听力和词汇的教学ꎬ学生也要加强听力和词汇方面的学习ꎮ同时ꎬ本文的方法能够为其他课程考试成绩的评定以及多课程的综合成绩的评定提供些许参考ꎮ参考文献[1]AbdiHꎬWilliamsLJ.Principalcomponentanalysis[J].Wiley2010(4):433459.[2]WoldSꎬEsbensensis[J].1987(2):3752.[3]李光梅.[4]赵婷婷.大学生学究ꎬ2015.[作者信息]王㊀辉㊀ibelieve@126.com。
主成分分析法在学生成绩分析中的应用

是 否 能全 面反 映原 始 数据 的 主要 信息 以 及如 何科 学 、 客
观、 全面 地评 价 学生 的 综合 成绩 对 学生 和学 校 都特 别 重 要, 是值 得大 家研 究 的课题 。
3 运 用主成 分分析 法分析学生成绩
以北京 联合 大 学应 用 文理 学 院计 算科 学 系 0 7信 息
【 A b s t r a c t】 T h i s p a p e r s t a r t s 仃 o m l h e r e a l d a t a o f t h e u n i v e r s i t y f o u r y e a r s a c h i e v e m e n t , u s i n g h t e p r i n c i p a l c o m p o n e n t a n a l y s i s m e h t o d . e s a t b l i s h e s a
m a t h e m a t i c a l mo d e l , a n d t h e n g i v e s t h e s or c e f u n c t i o n o fห้องสมุดไป่ตู้ d i f e r e n t o mp c o n e n t s , a n d om c b i n i n g he t e r s u l t s a n a l y s i s , T h e m a i n c o u se r i f n a l l y g r a d e s . A n d v e r i f y t h e c r e d i t g r a d e s c h o o l i s r e a s o n a b l e , h t e r e s u l s t p r o v i d e d h t e s c i e n i t i f c b a s i s f o r t e a c h i n g r e s e a r c h a n d ma n a g e me n t i n he t f u t u r e .
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于主成分分析法的学生成绩综合评价
摘要:以贵州航天职业技术学院2011级社区管理与服务班在2011—2012学年的13门主要课程考试成绩为研究对象,借助统计软件进行主成分分析,计算出主成分得分,并按主成分得分对学生进行了排名。
为使成绩评价更具科学性、客观性和合理性,还将平均分和综合分比对,进行综合评价与分析,为教学研究、学生管理及就业指导提供科学依据。
关键词:主成分分析法;学习成绩;评价
中图分类号:g455 文献标识码:a 文章编号:1001-828x(2013)07-0-03
一、引言
在经济全球化和社会分工越来越细化的当今社会,人力资源已成为人类的第一宝贵资源。
作为高素质人才主要培养基地的高等院校,如何科学地评价大学生的综合成绩成为当前各高校在全面推进素质教育过程中所面临的问题之一。
传统的以多门课程总平均分排名的评价方法,比较笼统,为了尽可能全面、科学地反映被评价对象的情况,往往需要选取众多的指标构成评价体系,但是,过多的指标不仅会增加评价的工作量,还会因评价指标间的相关性造成评价信息相互重叠、相互干扰,从而难以客观地反映被评价对象的真实水平。
本文认为可以使用主成分分析法解决此类问题。
二、主成分分析方法简介
主成分分析,是利用降维的方法,将多个指标转化为少数几个综
合指标,去解释原始资料中的大部分变异的一种方法。
在实际问题中,为了全面、系统地分析问题,通常必须考虑众多的影响因素,这些影响因素一般被称为指标或者变量。
因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而反映的信息在一定程度上有重叠。
在用统计方法研究多变量问题时,变量太多会增加计算量和分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
因此,把这些变量转化成彼此不相关的变量,然后从中选出比原始变量个数少、却能解释原始资料中大部分变异的几个新变量,即所谓的主成分,从而达到降维和简化问题分析的目的。
具体而言,主成分分析法是通过数学变换把给定的一组相关变量通过线性变换转成另一组不相关的变量,并按方差依次递减的顺序排列,找到第一、第二、…第 k个主成分,然后计算因子载荷矩阵,建立主成分模型,最后按因子得分及贡献率的大小,计算综合得分并进行排序。
三、高校学生成绩综合评价应用
(一)研究的对象及指标的选择
本文以贵州航天职业技术学院11级社区管理与服务班在2011—2012学年的13门主要课程考试成绩为研究对象,借助统计软件进行主成分分析,计算出主成分得分,并按主成分得分对学生进行了排名。
班上共有28名同学,将这28名同学作为总体,13门主要课程具体为:大学英语ⅰ(x1)、思想道德修养与法律基础(x2)、管
理学原理(x3)、社区管理学(x4)、社会工作法律实务(x5)、应用统计学(x6)、体育(x7)、社会心理学(x8)、服务礼仪(x9)、高等数学(x10)、团队建设(x11)、大学英语ⅱ(x12)、大学语文(x13),学生姓名用序号1、2、… 28表示,用xij 表示第i个同学在第j 门课上的得分,则x=(xij)28×l3,这样就得到了一个28×13的原始数据矩阵。
见表1。
(二)主成分分析过程
将原始数据标准化,用计算机求出标准化矩阵的相关系数矩阵;求相关矩阵的特征值,确定主成分个数。
(见表2)
表2 方差分解主成分提取分析表
如表2所示,将13个主成分按照特征根从大到小的次序排列,可以看出第一主成分的特征根为5.984,它解释了总变异的
46.352%;第二主成分的特征根为1.617,它解释了总变异的
12.683%;第三主成分的特征根为1.382,它解释了总变异的
11.476%;第四主成分的特征根为1.134,它解释了总变异的9.556%,因此,前4个主成分的累计贡献率已经达到80.067%,即前4 个主成分可以反映13个指标80.067%的信息量,说明只取前4个主成分即可。
上述13 项指标可以综合成4个公共因子(f1、f2、f3 和f4),并可得到因子载荷矩阵(表3)。
表3 因子载荷矩阵
从表3可以看出:第一主成分在x3、x4、x5、x6、x8、x10、x11
上有较大载荷,f1反映的是学生在管理学、社区管理学、社会工作法律实务、应用统计学、社会心理学、高等数学、团队建设方面的信息,故可以认为第一主成分是说明学生专业知识的学习情况;第二主成分在x2、x13上有较大载荷,f2反映的是学生在思想道德修养与法律基础、大学语文方面的信息,故可以认为第二主成分是说明学生基础知识的学习情况;第三主成分在x7上有较大载荷,f3反映的是学生在体育方面的信息,故可以认为第三主成分是说明学生体育运动方面的情况;第四主成分在x9上有较大载荷,f4反映的是服务礼仪方面的信息,因此可以认为第四主成分是说明学生在交际礼仪方面的情况。
计算各个主成分的得分:
f1=0.2865x1+0.1276x2+0.3260x3+0.3675x4+0.3762x5+0.2711x 6-0.1798x7+0.3502x8+0.2113x9+0.3205x10+0.3063x11+0.2117x1 2-0.0136x13
f2=-0.2335x1+0.5682x2-0.1802x3-0.1065x4-0.1418x5-0.2198 x6-0.3501x7-0.0123x8+0.2177x9-0.1055x10+0.1182x11+0.4782x 12+0.2408x13
f3=0.1927x1-0.0909x2-0.1206x3+0.0922x4-0.0672x5-0.1326x 6+0.4301x7+0.0912x8-0.2786x9+0.2721x10+0.0059x11+0.2231x1 2+0.7065x13
f4=-0.2876x1+0.7285x2-0.2251x3-0.1353x4-0.1765x5-0.2755 x6-0.4256x7-0.0156x8+0.2716x9-0.1346x10+0.1519x11+0.5976x
12+0.3129x13
根据以上四个表达式求出各主成分得分后,以特征值的贡献率作为加权系数求出综合得分:
f=0.46352f1+0.12683f2+0.11476f3+0.09556f4
由此得到学生成绩的综合排名详见表4。
表4 综合排名
(三)评价
经主成分分析,在基本保留原始数据信息量的前提下,将l3个具有一定相关性的原始指标降维成4个相对独立的主成分,这4个主成分可以代表13个指标80.067%的信息量。
从表4可以看出,通过主成分分析法得到的综合分排名与平均分排名基本相符,但也存在一定的差距。
如20号同学综合分排名是第6名,而平均分排名是第16名,主要原因是他在第一主成分上得分较高,说明该同学专业知识学得比较扎实,其专业能力相对较强;而22号同学则刚好相反,其综合分排名是第19名,平均分排名是第12名,主要原因是他在第一主成分上得分较低,恰恰第一主成分是考察社区管理专业学生的关键,它反映了学生专业素质方面的水平,因此要建议该同学提高认识,加强专业知识的学习,努力提高专业素质。
又如平均分很接近的3号、11号、26号三位同学,平均分排名均为第9、第7、第8名,综合分排名分别为第8、第5、第3名,从表4看出26号同学在第一和第二主成分上得分比3号和11同学号要高,表明26号同学在专业知识和基础知识方面有优势, 26号
同学在三个主成分上得分均为正,因此综合得分高出3号和11号;虽然3号在第三主成分上得分均高于11号和26号同学,但是第三主成分的贡献率仅为11.476%,无法取代11号、26号同学在第一主成分上的优势,因此他的综合分排名仍在11号、26号同学之后。
四、结论
本文运用主成分分析法,评价了大学生的综合成绩,克服了传统方法中只能笼统反映学生考试成绩的缺点,分析的结果可以客观地反映学生各方面知识的掌握情况,了解学生的优、劣势,帮助教学人员因材施教,做到有针对性地指导学生发挥优势,弥补劣势,为教学研究、学生管理及就业指导提供科学依据。
参考文献:
[1]向定峰.高职学生成绩的因子分析[j].重庆教育学院报,2007(03):24-27.
[2]李曦.多元统计在学生成绩分析的运用[j].南昌航空工业学
院学报·自然科学版,2006(033):58-62.
[3]管宇.实用多元统计分析[m]杭州:浙江大学出版社,2011.
[4]扬宇音,赵雅明,曲立敏.因子分析法在大学生综合排名中的应用[j].贵州工业大学学报,2005,34(01):9-12.。