大学生教育测量与评价期末复习资料

教育测量与评价

第一章教育测量与评价的学科发展

1.测量:从广义上讲，就是根据某些法则与程序，用数字对事物在量上的规定性予以正确和描述的过程。

2.测量的要素:量具、单位、参照物

3.教育测量，指针对学校教育影响下学生各方面的发展，侧重从量的规定性上予以准确和描述的过程。

4.教育评价:是指按照一定的价值标准和教育目标，利用测量和非测量的种种方法系统地收集资料信息，对学生的发展变化及其影响学生发生发展变化的各种要素进行价值分析和价值判断，并为教育决策提供依据的过程。

5.教育测量与教育评价的实际联系与区别:

教育测量可以为教育评价提供价值判断的基本数量事实，教育测量是教育评价的基础，教育评价往往是教育测量过程的延续，是对测量结果的解释与应用，并朝着价值判断与释放教育功能的方向拓展。

6.中国是考试制度的发源地:西周选士是我国考试制度的萌生阶段

7.中国科举制度:中国古代科举考试制度对世界教育、政治、文化，尤其是考试制度产生过重大的影响。

8.教育测量学科的诞生:美国心理学家桑代克，《精神与社会测量导论》，首次较系统地介绍了教育统计方法及其编制测量的基本原理，它标志着以科学理论为指导的教育测量理论的诞生。

9历史意义:美国的“八年研究”是教育评价的催生剂。

10.泰勒在“八年研究”中提出了评价活动原理和课程编制原理，形成了“行为目标评价模式”，被称为当代教育评价之父。

第二章教育测量与评价的类型与功能

1.教育测量与评价的主要类型

⑴按测量与评价在教学中运用的时机分类:

①形成性测量与评价:是在教学过程中经常实施的，在性质上大致相当于现在的中小学单元测验。

目的:对于教师而言，可以获得教学过程中连续性的反馈，了解学生的学习效果、特点和困难等信息，作为随时修正自己教学的参考。对学生的学习，也可提供反馈信息，学生可以根据反馈结果获知自己学习后的表现情况，从而肯定或修正自己的学习方式。

②诊断性测量与评价

③终结性测量与评价:用于教学结束后在性质上相当于现在学校中所举行的期末考试。

目的:Ⅰ.在教学目标之下，检查学生一学期学业达到了什么程度，从而判断教学效果的得失。Ⅱ.根据结果，评定学生的学业成就，并将评定结果通知学生家长或记入档案。

⑵按解释测量结果和评价结果时的参照点分类:

①常模参照测量与评价

②标准参照测量与评价:也称为目标参照测量与评价，是将被试的表现与既定的教育目标或行为标准相比较，以评价被试在多大程度上达到该标准。

(学校的教育测量与评价，主要目的是为了确定学生达到教学目标的程度，考查学生对知识技能的掌握程度，因此，一般都采用标准参照测量与评价)

③潜力参照测量与评价

⑶按测量与评价被试行为表现的性质分类:①最佳行为测量与评价②典型行为测量与评价

⑷按测量与评价的内容分类:

①智力测量与评价

②能力倾向测量与评价

③成就测量与评价:目的在于测量评价个人在接受教育或训练后的成就。

常见有两种类型:

Ⅰ.学科成就测验:旨在测量与评价被试在某一学科上的学习成就。

Ⅱ.综合成就测验:旨在评价与测量被试在多个学科或综合学科上的学习成就。综合成就既可以单个测验，也可以成套测验。 ④人格测量与评价

2.教育测量与评价的主要功能 ①实现教育判断的功能

教育测量与评价的最基本、最原始、最现实、最普遍的功能，就是实现教育判断。它包括测量评定的功能、事实判断的功能、价值判断的功能、问题诊断的功能、区分选拔的功能。 ②改进教师教学的功能 ③促进学生学习的功能 ④行使教育管理的功能

第三章教育测量与评价的质量特性

第一节信度

一、信度，简单的说就是测量结果的可信程度。信度指的是测量结果的稳定性程度，记为r xy 。也就

是说，如果用同一测量工具反复测量同一种特质对象，则多次测量结果间的一致性程度就叫信度。二、信度的估计方法。

（一）重测信度：重测性都指的是用同一个量表（测验或评价表）对同一组被试施测两次所得结果的一致性程度，其大小等于同一组被试在两次测验上所得分数的相关系数。公式 ∑∑∑--∑∑∑-∑=

i 2

i i i i i xy (n (n ))((n r ）

）Y Y X X Y X Y X

公式中，n 为被试的数量，X i 是每个被试第一次考试分数，Y i 是每个被试第二次考试分数。

重测信度有个基本假设，那就是假设某测验所要测量的潜在特质，短期内不会随着时间推移而改变。因此重测信度的用途也在于估计测验结果（以测验分数表示）经过一段时间后是否仍然维持稳定、一致的特性，所以又称为稳定性系数。

（二）复本信度

所谓复本测验是指在试题格式、题数、难度、指导语说明、施测要求等方面都相当，并且都用来测量相同潜在特质或属性，但试题又是不相同的测验，复本测验也称作平行测验。复本信度指的是两个平行测验测量同一批被试所得结果的一致性程度，其大小等于同一批被试在两个复本测验上所得分数的相关系数。

实施复本测验有两种方式：一种是在同一个时间连续施测，另一种是间隔一段时间后施测。前者主要可以反映出测验内容造成的误差的多少，也就是说可以反映出两个测验是否是真正的平行测验，所以这种复本信度称作等值性系数。

（三）同质性信度

同质性信度也叫内部一致性信度，它是指测验内部所有题目间的一致性程度。

1.分半信度。分半信度指的是将一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。

斯皮尔曼—布朗公式）（hh hh xy r 1/2r r +=

公式中，xy r 为整个测验的信度系数，hh r 为两个“半测验”上得分的相关系数。（1）弗朗那根公式

[]

2b 2a xy /(12r X

S S S ）+-= （2）卢仑公式

2d xx /1r X S S -=

2.库德—理查逊信度。该方法适合于测验题目全部为二分记分题的测验的内部一致性信度分析。

（1）KR 20公式 ???

? ??--=

∑2i i 20q p 11X S K K KR

公式中，KR 20为测验的信度，K 为题目数，i p 和i q 分别表示答对和答错第i 题的被试人数比例，2

X S 为

测验总分的方差。

（2）KR 21公式 ??

?????---=2

__21)(11X

KS X K X K K KP 公式中，KR 21为测验的信度，—

X 是全体被试测验总分的平均数，其它符号的含义与（1）相同。

3.克龙巴赫α系数

当测验题型较多，并非都是二分记分题时，估计测验信度可采用克龙巴赫α系数。

公式???

? ??--=

∑22i 11X S S K K α

（四）评分者信度。

（五）评分者信度指的是多个评分者给同一批人的答卷进行评分的一致性程度。（六）公式 )(12

2N N K S W -=

（七）公式中，W 为肯德尔和谐系数，K 为评价者的人数，N 为被评价的试卷（或作品）个数。S 为每一个被评价对象的K 个等级之和的离均差平方和。即：

（八）公式 N

R R S 2

i 2i

）

（∑∑-=

（九）i R 为第i 个被评价对象的K 个等级之和。

（十）

（十一）第二节效度

一、效度，就是一次测量的有效程度，严格的说效度是指一个测量或量表实际能测出其所要测量的特性的程度。

二、内容效度就是测验题目样本对于应测内容与行为领域的代表性程度，如果是教学情境下的成就测验，那么其内容效度就是看测验题目样本体现教学目标与教材要求的程度。因此内容效度主要适用于教育测量（尤其是学业成就测验）的情境。内容效度也适合于某些用于选拔和分类的职业测验，这种测验所测的内容就是实际工作所需的知识和技能。三、二、结构效度的验证方法：

四、测验内部寻找证据法，这种方法是通过研究测验内部结构来验证测验的结果效度。因素分析法。因素分析法是目前研究结构效度最常使用的实证方法之一。五、

六、第三节难度

七、一、难度，就是被试完成题目或项目任务时所遇到的困难程度，定量刻画被视作答一个题目所遇到的困难程度的量数就叫题目的难度系数，也常称为难度值，用符号P 表示。八、二、难度系数的计算方法九、1.二值记分题的难度值计算：公式 N

P =

（P 为难度值，N 为被试人数，K 为答题答对该题目的人数） P 值介于0与1之间，P 值越大，表明通过这个题目的人数比例越大，P 值越小，表明通过该题目的人数则越少。

2.多值记分题的难度值计算：公式 max

X X

P =

P 代表题目难度，__

X 为全体被试在某题目上的平均得分，X m ax 为该题目的满分。

3.难度值的其他计算方法：公式 q=1-P q 为失分率。十、测验题目的恰当难度和恰当难度分布

十一、在常模参照测验中，测验的目的主要是区分学生能力或成就的高低，因此教师所期望的难度系数以接近左右为理想，此时的试题最能够区分学生水平的高低，但是在标准参照测验中测验的目的是检验学生们是否已达到教学目标规定的掌握程度，因此教师所期望的是学生都能够在教学之后掌握所有的教学内容，也就是说学生在试题上的表现应该都是100%答对，亦即答对率接近一。筛选参照测验，针对划界点水平来确定恰当难度。十二、

十三、第四节区分度。

十四、一、题目区分度就是题目区别被试水平能力的量度，常记为D 。区分度的实质就是题分与总分的相关程度。区分度的值域范围在~+之间。通常D 为正值，称作积极区区分，D 为负值，称作消极区分，D 为0，称作无区分作用。具有积极区分作用的项目，其D 值越大，区分的效果越好，具有消极区分作用的项目，其D 值越小，区分效果就越好。十五、二、区分度的计算

十六、做题步骤：选公式，计算，显著性判断（P70），下结论。 1、相关法

（1）点双列相关系数：（1，0）题型，连续变量 pq r t

__p pbi S X X -=

公式中，pbi r 为点双列相关系数，__

p X 为此题对的人平均总分，q __

X 为失分平均总分，所有被试总分标准差，p 得分率，q 失分率。

（2）二列相关系数：总分，等级评分。 =

b r Y

S X X pq

__p ?

- （3）公式中，b r 为二列相关系数，Y 为正态分布下百分比p 与q 分割点所在位置的曲线高度（有正态分布表给出，书本附表二），其余符号同（1）。

（4）积差相关系数：（k ，0），分值评分。

Y X D

Y X S S S S S 2r 2

22xy -+= 可简化为 ∑∑∑∑∑∑∑---=2

i 2i 2i 2i i i i i xy )

(n )(n ))((n r Y Y X X Y X Y X 公式中，X S 为全体被试在某题目上得分的标准差，2

X S 为全体被试在某题目上得分的方差，Y S 为全体被试总分的标准差，2Y S 为全体被试总分的方差，2

D S 是由被试总分减去某题目得分而获得的一个

新变量（D=X-Y ）的方差。（i X 小题分，i Y 总分。）

项目区分度评价标准：

第四章

测验题目分为两大类：客观性试题和主观性试题

客观性试题：

（一）选择题：运用最多编写原则：

（1）意义完整，并能表达一个确定的问题；（2）题干简明；

（3）题干不要滥用否定结构，要尽可能地采用正面陈述；

（4）诱答项具有似真性；编制良好选择题的技术取决于有效的干扰选项的编写。

增加干扰选项似真性的具体方法有：

①使用学生共同的错误观念或过失来作为诱答项

②以学生惯用的模糊性用语叙述诱答项

③在正确选项和又打象中使用同样精确的重要性等堂皇的用语来叙述；

④诱答项的长度和措辞的复杂性与正确选项相似；

⑤在右打向中使用额外的线索；

⑥保持选项之间的同质性

（5）不能对正确答案有任何暗示。

（二）是非题，又叫做二项选择题，通常是给被试一个句子，要被试做出正误的判断；

编写原则：

（1）考核的内容应是重要的知识，应有考核价值；

（2）题目应该是测量理解能力，而不应测验记忆性的知识，更不要直接焯六教科书中的知识，以免引导被试死记硬背二不求理解；

（3）一个题目中只能有一个中心问题或一个重要概念，避免两个以上的概念在同一题中出现；（4）试题应做到是非界限分明，用词准确，避免模棱两可的语句，不致引起对正确答案的争议；（5）题目承受应简单明了，避免使用复杂的句子结构，以减少因被试的阅读能力而对测量产生的不良影响，应尽量采用正面叙述，避免用否定和双重否定的语句；

（6）正句和误句的排列要随机化，且数量应大致相等。

（三）填空题

编制原则：

（1）题意要明确，限定要严密，使空白处应填的答案是唯一的；

（2）空白中所填写的烟是关键词语，而且要和上下文有密切的关系，使被试不至于有填写困难；（3）题目中空白地方不能太多，以免句子变得支离破碎，不利于被试理解题意；

（4）尽量将空白放在句子的后面或中间，而不要放在句子开头；

（5）所有空白处的线段长度应当一致，不能随正确答案文字的多少而长短不一，以免产生暗示作用；（6）若答案是数字，应指明单位和数字的精确程度。

（四）简答题

编制原则：

（1）问题的叙述要明确，要确实能使被试用简单的语言来回答；

（2）而问题和答案应该只有一个，并且答案要简短具体；

（3）避免出只考机械记忆的题，应注重知识的应用；

（4）在考查某公式的应用时，不要给太复杂的数字，以免给计算带来麻烦；

（5）尽可能使用直接问句来提出问题。

主观性试题：

（一）论述题

编制原则：

（1）试题应该用来测量较高层次的教学目标，像综合、评价等目标层次，限于那些客观题不能测量的学习成就；

（2）要明确而系统的陈述问题，使被试能清楚的了解题目的要求；

（3）一般应采用答案具有统一定论的试题；

（4）当有多个论述题时，可以设置一个必答的论述题，剩下的题目可允许被试选择作答。

（5）最好在题目中能给出回答本题所需的参考时间；

（二）作文题

编制原则：（1）根据考试目的，考试对象来确定作文文体和要求；

（2）根据社会需要，现实生活和学生实际设计命题，作文命题要直接测量语文素养和书面表达能力；（3）作文命题不能过于抽象，要让学生有话可说，有内容可写，有思路可走，有发挥的余地；（4）避免材料或话题出现测验偏倚，再确定选材和写作意图时；要考虑对所有被试都是公平的，并且试题应符合被试的心理特征；

（三）表现性测验题

是指以行动、作品、表演、展示、口头回答、操作、写作、科学研究、制作等更真实的行为表现，来测量与评价学生在真实情境或模拟真实情境下的所知与所能的一种测验类型。

类型：（1）纸笔的表现性测验（2）辨认的表现性测验（3）结构化的表现性测验（4）模拟情境的表现性测验（5）工作样本的表现性测验

编制原则：

（1）测验材料和要求应与日常教学内容和目标有关联，关注重要的学习结果；

（2）将考察重点放在测量复杂和高层次能力上；

（3）将干扰测验目的的无关困难降到最低；

（4）测验尽可能选择真实的情境或问题；

（5）提供必要的操作指导与让学生了解作业任务和期望内涵；

（6）指导语简单清晰，向被试明确说明实际的情境，任务以及评价的标准；

（7）确定科学合理的计分方法。

第五章制定教育评价表的一般方法和步骤

第一节教育评价表的基本类型与制定原则

1.教育评价表P112

是根据教育教学的特性编制而成的，它由评价指标、评价项目、评价标准、评定等级、指标权重等构成。它是进行教育测量与评价的工具，为了使评价的接过更为可靠，需要对教育评价表进行更深入的研究。

2.制定原则P114

教育规律性和导向原则；

科学性和可操作性原则；

超前性和发展性原则；

第二节教育评价表的构成及编制方法

1.编制方法P115

确定教育评价的对象和目标；

初拟评价指标；

筛选评价指标（经验法、调查统计法）；

确定评价指标权重；(关键特征调查法、两两比较法、专家评判平均法、倍数比较法）；

设计教育评价标准；

整合、修改与完善教育评价表；

第八章学生课业发展的测量与评价

一、课业考评

指对学生的课程学业所取得的发展进步进行考核评价。在课业考评过程中，考试是最常用的一种测量与评价手段。

二、我国学校传统课业考评目前存在的问题

1.考试评价改革的发展很不平衡。

2.考试评价的指导思想与学校教育理念、目标不适应，把考试的教育功能简单化，考试的评定功能绝对化。

3.考试评价只注重考试结果量化的分数表达，不重视分析研究学生的试卷，不重视学习过程和发展进步在质性方面的描述评价；只重视对认知领域可测性内容的考试测量，不重视学校教学目标的广泛性和学习内容的丰富性；只重视用抽象概括化的考分来评价学生的学习结果，不重视采用多种方法来对学生发展进步作实质性的描述评价；只重视学习的共性目标，不重视学生学习的特点、发展进步以及潜能结构作个别化的评价。在这种单调和抽象的课业考评的方法下，容易忽视了学生在心理发展和智能结构方面差异的多面性和客观性。考试命题常带有随意性，缺乏基本的命题结构和起码的教育测量与评价学当面的质量要求。

三、国外课业考评改革的主要经验

1.减少考试次数，强化课程作业，把经常性评价同若干关键年龄段所举行的校外统一考试相结合，以便在宽松自主的教育环境下全面落实教育目标。

2.小学阶段宽松、初中阶段次之、高中阶段相对绷紧。

3.课业考评方法多元化，教学评价整合化，尤其是表现性测验和实验技能教学考试受到高度重视并被广泛采用。

4.学习成绩和学生素质发展的评价大量使用观察表现的等级评定量表、学生参与评价、记录成就与成长的多功能的学习成绩报告单得到普遍重视。

5.考试评价结合学生年龄特征和学习内容等特点是采用游戏化的、活动化的和动态化的评价方法。

四、课业考评改革的主要目标

1.要实现考试观向发展性评价观转变。

2.要努力实现从重视“掌握性结果”的评价转变到既重视“掌握性结果”又重视“发展性结果”的评价。

3.内容要从认知领域转变到涵盖学习结果的更广泛的教育目标领域上来。

4.要努力实现从表征性分数机制到实质性内容机制的转变。

五、评价学生课业发展进步的主要方法

1.客观题评价法与主观题评价法

2.表现性测验评价法

①含义：指的是客观测验以外一类的以行动、作品、表演、操作、写作、制作档案资料等更真实的表现来展示学生的口头表达力、文字表达力、思维思考力、随机应变力、想象力、创造力、实践能力及学习成果与学习成果与过程的测验。

②口头测验:常用于测量那些用纸笔测验难以考查的知识、技能及情感（口试、课堂提问、论辩或辩论）

③论文题测验：不仅可以考查各种认知学习问题，而且在组织、架构、表达、创意及完整思考历程等能力特性的测量与评价方面都有着独特的作用。（扩展反应论文题又称申论题与限制反应论文题，短文题考试与写作测验）

④实验技能教学考试评价

3、评定量表评价法

4、档案袋评价法

①含义：是教师依据教学目标与计划，请学生持续一段时间主动收集、组织与省思学习成果的档案，以评定其努力、进步、成长情形的一种评价方法。

②按内容侧重点可以把档案袋分为成果型、过程型和综合型。成果型主要展现学生的优秀作品与学习成果。过程型重点是呈现与展示学生学习进步、探索、努力、进取、反思、达成目标与成就的历程。综合型是兼具成果型和过程型，或者是兼具多个主题的学习档案袋。

③按生成结构可以分为结构型、半结构型和非结构型。结构型是学生在制作档案袋之前，教师或教研人员就已经对档案袋的生成给予结构型较强的设计。

④按用途分可以分为评价型、展示型、反思学习型。

5、动态评价法

第九章课堂教学的测量与评价

课堂教学测评

是以现代教育教学理念、现代教学观为依据，运用现代教育评价理论和科学评价标准及方法，按照规范的评价程序，对课堂教学活动的状态和效果进行价值判断的过程。

六大系统（矢量系统、理念系统、定位系统、条件系统、运行系统、输出系统）

运行系统：教学组织

（教学组织是联系教师的教和学生的学的纽带，是教师根据一定的教学思想、教学目的和教学内容及教学主客观的条件来组织安排教学活动的方式。）

教学组织的观测点：

在教学环节的组织上，“自然地有序”是最高法则，“问题导学式”的分布课堂可以被实践。

在教学内容的层次组织上，进行“编码式”精心加工，引领学生对教材内容进行“主编式”的深度解读。

课堂常态管理要在做好时间管理、信息管理、环境管理、事件管理等具体工作的基础上，把握科学性与艺术性的原则，关注与课堂教学发生关联的全过程。

输出系统：教学质量（“全面质量”“学生收获质量观”）

三维立体质量标准”：

一维是纵向层面的课堂教学比较适宜的深度，体现为问题解决的分析过程；

二维是横向层面课堂教学比较适中的广度，体现在课堂内容的知识面；

三维是课堂教学的厚度，体现在课堂教学的思想性和文化性。

第十章教师发展的测量与评价

意义：有利于贯彻和落实国家教育法规

有利于提高教师的素质和工作积极性

有利于提高教师的教育教学质量

有利于加强教师队伍建设和科学管理

内容：教师基本素质；

教师工作过程（备课、上课、辅导作业、课外活动、

学业成绩考评、教研科研、出勤）

教师工作绩效（教育效果、教学效果、教育教学科研成果）

其他工作（班主任工作、继续教育培训）

教师发展测量与评价的设计与实施

一、教师发展测量与评价的设计

（一）测评目标：促进教师专业化水平提升；改进教师的教育教学实践；实现教师与学校的共同发展（二）测评主体：教师同行学生领导专家

（三）测评工具：教师发展测评量表、教师发展评价手册

（四）测评方式

绩效考评法课堂听课评价法教学档案袋评价法微格教学评价法

二、教师发展测量与评价的实施

（一）测评程序

1. 测评前期准备

建立教师发展测评领导小组

确定测评的时间、形式、范围等基本内容

确定评价者，即根据测评目标选取最为适宜的测评主体

2. 收集测评信息

信息收集的渠道包括：课堂听课、问卷及量表调查、与教师进行面谈

3. 分析测评信息

通过问卷及量表获得的信息需要通过量化统计，采用统计软件来进行处理

通过课堂观察以及听课等质性评价方法获得的材料，则需要给予质性判断

4. 撰写测评报告

教师发展的测评包括一般包含：测评概况、测评结论、测评中发现的问题、提出建议四个部分（二）测评监控

测评者与被测评者之间的关系问题

实事求是与形式主义测评的价值取向问题

测评指标标准性与灵活性辩证统一的操控问题

测评的条件、过程与效果的相互关系处理

三、教师发展测量与评价的结论

（一）测评结论反馈：多元化的反馈主体、测评结论的双向反馈

（二）测评元评价

内部元评价主要由学校领导、管理人员、评价人员进行，评价内容包括教师发展测评的方案设计、方法、组织形式和过程监控等。

外部元评价一般由专业评价人员主导进行，主要对测评的整体理论框架体系进行评价。

（三）测评优化

测评目的观的优化：由奖惩性测评转向发展性测评

测评技术方法的优化：由偏重量化测评转向定性和定量测评充分结合

测评标准的优化：由普适性标准向差异性、个性化的标准转变

重视教师发展的再测评

补充：教育测量与评价的基础理论

一、经典测量理论

1.内容：（1）三大核心词：真分数、观测分数、误差分数。

（2）“三个基本假设”：①真分数的恒定性；②误差具有完全随机性；③观测分数。

（3）“两个重要推论”

2.优缺点：优：①广泛的适用性②易于理解和掌握③易于测量本土化的实现

缺：①在实际使用中所求得的项目统计指标具有不稳定性，容易受受测者样本选取的影响；②项目统计量和受测者测验得分往往是分别求得的，因此受测者测验得分与测验统计量之间无法建立一定的函数关系；③用到的两个假设条件，即严格意义上的平行测验以及测验误差与真分数之间的不相关，这在实际的测验操作中最难控制并实现的。

二、发展性评价理论

特点：非奖惩性、协作性、诊断性、过程性、个体差异性、评价主体多元性。

教育测量与评价自考资料(整理打印版)

《教育测量与评价复习纲要 6、教育测量的特点有测量结果的间接性，度量单位的相对性，测量对象的复杂性，测量目的的针对性。第二节：教育评价概述 1、2.、3、4、国外学者关于教育评价的观点:①泰勒：确定教育目标在实际上被理解到何种程度的过程；②克龙巴赫：评价是为决策提供信息的过程；③斯克里文和豪斯：评价是一种对优缺点和价值的评估，是一种既有描述又有判断的活动；④大桥正飞夫：教育评价就是对照教育目标，对教育行为产生的变化进行价值上的判断。 4、5、教育评价具有导向功能、监督检查功能、激励功能、筛选择优功能、诊断改进功能。 6、7、在教育、教学活动开始之前，为使计划更有效地实施而进行的预测性、摸底性评价是诊断性评价。 8、形成性评价指在教育、教学活动计划实施的过程中，对计划、方案执行情况进行的评价。 9、总结性评价指某一教育、教学活动项目，是告一段落或完成以后进行的评价。第三节：教育测评的发展阶段 ⑩美国的教育测验运动分三个时期：1904-1915开拓期，1915-1930为兴盛期，1930-1940为批判期。 1931年塞蒙兹主人格测量应用评定发、问卷法、交谈法、轶事记录法等。 2、1904年桑代克发表了《精神与社会测验学导论》，标志着教育测验运动的开始。 3、 4、1963年，克龙巴赫发表了《通过评价改革课程》。第一节：信度 2、计算信度的几种常用的方法：①稳定性系数：又称为重测信度，它是指用同一测验试卷，在先后两个不同时间同一组被试进行测验，两次测验实得分数的相关系数。这是估量信度最简单的方法。②等值性系数：先实施第一次测验，然后在最短的时间实施第二份等值的测验，再求他们得分的相关系数，这个相关系数就是信度的等值性系数。③部一致性系数：把一次测验人为地分成两部分，比较两个部分的一致程度，从而估计信度系数。估计方法有两种：分半信度和库德尔-理查森公式法。④论文式测验信度系数；⑤评分者信度。 4、测量误差的来源基本可分为三类：第一类误差产生于测验的本身；第二类误差与特定的实施条件有关；第三类误差包括被试本身的变化。 1、2、效度分为三大类：容效度、效标关联效度、结构效度。 3、容效度是指测验目的代表所欲测量的容和引起预期反应所达到的程度。估计容效度的方法有：逻辑分析的方法和用测验题目与教材容比较的方法。 45、结构效度是指一个测量能实际测量出理论上的狗年或者心理特性的程度。 6、影响效度的因素：测验的组成；测验的实施；被试主观状态方面；估计效度所依据的效标；样本方面。 7、提高效度的方法：控制系统误差；精心编制量表；妥善组织测验；扩充样本的容量和代表性；合理处理效度和信度的关系；适当增加测验的长度。 1、2、难度对测验的影响：影响测验分数的分布形态；影响测验分数的离散程度；影响测验的鉴别能力。 3、影响题目难度的因素：①考查知识点的多少；②考查能力的复杂程度或层次的高低； ③考生对题目的熟悉程度；④命题的技巧性。

教育测量与评价试题

一、选择题 1.根据某些法则与程序，用数字对事物在量上的规定性予以确定和描述的过程，这一概念是(A) A、测量 B、评价 C、测验 D、统计 2. 在评价对象的集合内选择一个或若干基准，各个评价对象和基准进行比较，叫做（B） A、绝对评价法 B、相对评价法 C、教育评价方法 D、定量分析法 3．通过自评、专家组评、社会群体众评等不同方面的评价或者学生、教师、领导等不同阶层的评价者的评价来综合评定叫做（A） A、加权平均法 B、定量分析法 C、行为目标评价法 D、临床督导评价法 4. 物理量的测量大多是直接性的，而教育测量内容主要是关于人的各种非物质属性，只能通过人对来自外界的刺激作出（B） A、模糊性、不确定性 B、间接性、推断性 C、间接性、多样性 D、多样性、抽象性 5. 在自然状态下，通过观察去获取评价信息的一种方法，具有目的性、直接性、情感性、可重复性，这种方法是（A） A、观察法 B、测量法 C、收集文字资料 D、问卷法 6.衡量测量题目质量的两个重要指标是（D） A、信度与区分度 B、效度与信度 C、难度与效度 D、难度与区分度 7. 教师依据教学目标与计划，请学生持续一段时间主动收集、组织与省思学习成果档案，以评定其努力、进步、成长情形的评价方法是（A） A、档案袋评价 B、动态评价 C、轶事记录评价 D、同伴评价

8．某人情绪稳定、心情愉快、心境开朗时，评价标准掌握较准，信息搜集较细、较全，分析评价较认真。这一例子所属的概念是（C） A、意识倾向性 B、认知倾向 C、情意心理 D、个性心理特征 9. 被称为教育评价的催生剂的是美国的一项着名研究，它是（D） A、教育研究 B、教育测量理论研究 C、心理测验研究 D、八年研究 10. 表示每项评价指标体系中所占的重要性程度，并赋予相应的值，这一概念是（D） A、评价指标 B、评价标准 C、指标权数 D、指标权重 11. 由一定的心理活动所形成的准备状态，影响或决定同类后继心理活动趋势的一种心理现象称为（A） A、心理定势 B、角色心理 C、首因效应 D、近因效应 12. 教育测量的数据具有（D） A、主观性 B、随机性 C、模糊性 D、以上都对 13．用同一个量表(测验或评价表)对同一组被试测两次所得结果的一致性程度，其大小等于同一组被试在两次测验上所得分数的相应系数，这一概念是（B） A、复本信度 B、重测信度 C、同质性信度 D、分半信度 14. 标准化考试的优点是（D） A、试卷编制的科学性 B、试题取样的代表性 C、评分的客观性 D、以上都对 15. 主要经验性考试的弊端是（D） A、命题的主观性 B、评分的误差较大 C、分数解释的片面性 D、以上都对 16. 因评价的先后顺序不同，而对评价对象的评价结果产生干扰的一种心理

教育测量与评价

教育测量与评价文件编码（008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256）

《教育测量与评价》习题（一）填空题 1. _桑代克_的论着《精神与社会测量导论》一书标志着教育测量理论的诞生，泰勒领导了着名的八年研究并提出“行为目标评价模式”，最早提出了教育评价的概念，被称为“当代教育评价之父”。 2. 按照测量的精确程度，教育测量量表从低级到高级分为称名量表、顺序量表、区间量表/等距量表和比率量表。 3. 某道论述题满分12分，所有考生在这道题上的平均得分为分，则此题的难度为。 4.教育基本理论研究、教育测量与评价科学研究以及教育发展理论研究已成为现代教育科学研究的三大领域。 5. 教学工作评价的内容包括对教师的备课、上课、批改作业、课外辅导、命题考试等教学工作基本环节的评价。（二）判断题（√）1. 测验的信度受许多因素的影响。一般来讲，增加测验的长度，可以提高试题取样的代表性，因而有助于提高测验的信度。（√）2. 标准分数本身是关于原始分数的一种线性变换，因此，标准分数不改变原始分数的分布形态。（×）3. 假如某学生在期中语文统考中卷面分数为85分，又知该学生所在年级中有60％的学生成绩低于85分，则该学生的百分等级为51。（×）4. 等距变量具有等级变量的特征，要求连续数量之间的差距相等，亦即具有相等的单位。因此，等距变量可以作加减乘除运算。

（×）5. 教育评价的主要功能就是甄别和选拔，通过各个层次的教育评价可以监督教师的教学工作和学生的学习活动，确保学校教育教学工作的正常进行。（√）6. 测验试题的难度影响着测验分数的分布。（×）7. 现代测量理论是在经典测量理论的基础上发展起来的，修正了经典测量理论的不足，所以现代测量理论可以完全代替经典测量理论。（√）8. 发展性教学评价认为面面俱到的课不是好课，只是“教教材”，没有“用教材教”的课也不是好课。（三）简答题 1. 常见的指标权重分配方法有哪几种【答题要点】：常见的指标权重分配方法包括：（1）关键特征调查法；（2）两两比较法；（3）专家评判平均法；（4）倍数比较法；（5）Q分类法。答题时一是要阐述清楚这五种方法各自的内涵是什么，二是简单说明这五种方法的操作步骤。相关内容可参考第七章“制定教育评价表的一般方法和步骤”中第二节“教育评价表的构成及编制”。 2. 衡量测验质量的四个指标分别是什么【答题要点】：（1）衡量测量质量的四个指标分别是信度、效度、难度和区分度。（2）在答案中需阐述清楚这四个指标分别的定义是什么。（3）一个良好的测验应该具备恰当的难度和区分度，具备较高的信度和效度。（4）指出这四个指标对于测量质量的意义，即前两个指标主要是对整个测验而言，后来两个指标主要是对测量的项目而言。相关内容可参考第三章“教育测量与评价的质量特性”。 3. 在现代社会中，具有健康人格的学生具有哪些特征

大学《教育测量与评价》试题库及答案

瑞文测验中哪一项是适用于高智力成人的（）收藏 A. B 瑞文彩图推理测验 B. A 瑞文标准推理测验 C. D联合瑞文推理测验 D. C 瑞文高级推理测验回答错误!正确答案： D 对人的智力进行的一种客观、标准化的度量，叫做（）收藏 A. D 智力测验 B. B 情商 C. C 智力 D. A 能力回答错误!正确答案： A WAIS 的计分是（）收藏 A. A 先计算标准分 B. B 先计算智商 C. D答对1题得1分 D. C原始分转化为标准二十分回答错误!正确答案： D 测验所要达到的某种具体的目的，叫做（）收藏 A. B测验目标 B. D 行为目标 C. C 教学目标

A 教育目标回答错误!正确答案： C 在评价对象的集合内选择一个或若干基准，各个评价对象和基准进行比较，叫做（）收藏 A. A 绝对评价法 B. C 教育评价方法 C. D 定量分析法 D. B 相对评价法回答错误!正确答案： D 在编制试题时，题型的分类中填空题、改错题、名词解释、简答题都属于（）收藏 A. B 选择型 B. D 常用题型 C. A 提供型 D. C 开放式回答错误!正确答案： C WISC主要测验的年龄范围是（）收藏 A. B 6-16岁 B. D 4-75 C. A 4-6.5岁 D. C 16岁以上回答错误!正确答案： A 忧郁、淡漠、悲观、思想与行动缓慢，分数太高可能会自杀。是哪种临床表现（）收藏

A 疑病 B. B 抑郁 C. D 精神病态 D. C 癔症回答错误!正确答案： B 由反映评价对象内涵的指标集、评价标准和量化符号构成的是（）收藏 A. B 模型 B. A 框架 C. D 体系 D. C 教育评价指标体系回答错误!正确答案： D 以班级的平均成绩为标准对学生学习成绩进行的评价为（）收藏 A. B 相对评价 B. D 需要性的评价 C. C 比较性评价 D. A 绝对评价回答错误!正确答案： A 我国教育工作者创造的认知领域目标分类法是（）收藏 A. C 五分法和四分法 B. B 三分法 C. A 六分法 D. D 二分法

教育测量与评价教案

教育测量与评价教案 Company number：【0089WT-8898YT-W8CCB-BUUT-202108】

《数学教育测量与评价》教案第一章数学教育测量与评价的学科发展 [教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系，了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求，认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。 [重点与难点]重点：数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。难点：数学教育测量和教育评价的含义及二者之间的关系。[教学时数]讲授2课时，课堂讨论、学生自主学习1课时 [教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合第一节数学教育测量与评价的基本问题一、数学教育测量与评价的含义二、教育评价的基本问题三、教育评价相关概念辨析第二节数学教育测量与评价的发展历史一、中国是考试制度的发源地二、中国科举制度的世界地位三、数学教育测量学科的诞生四、数学教育测量运动的蓬勃开展五、美国的“八年研究”是教育评价的催生剂六、数学教育测量与评价理论的发展第三节数学教育测量与评价的学科地位和作用一、数学教育测量与评价是现代教育科学研究的三大领域之一二、数学教育测量与评价在教育改革中具有重要的作用三、教育改革呼唤数学教育测量与评价更加科学化四、数学教育测量与评价是教师的专业素养和能力 [课堂训练、作业思考题] [1]数学教育测量与评价有什么联系与区别 [2]教育评价与教育评估有什么联系与区别

教育测量与评价试题

西南大学教育学院《教育测量与评价》课程试题【A】卷阅卷须知：阅卷需用红色墨水笔书写，得分用阿拉伯数字写在每小题题号前，用正分表示，不得分则在题号前写0；大题得分登录在相对应的分数框内；统一命题的课程应当进行集体阅卷，流水作业；阅卷后需要进行复核，发现漏评漏记或总分统计错误应及时更正；对评定分数或统分记录进行修改时，修改人必须签名。特别提醒：考生必须遵守课程考核纪律，违者将受到严肃处理一、选择题（本大题共15小题，2分×15=30分） 1、考试制度的发源地是（），其中一个制度的建立对世界文化发展和考试制度的建立起过重要的影响 A、中国 B、美国 C、英国 D、日本 2、20世纪初，美国的教育测量运动轰轰烈烈的开展起来，美国的（）是教育评价的催生剂。 A、五年研究 B、六年研究 C、七年研究 D、八年研究 3、下面哪种教育测量与评价属于按测量与评价被试行为表现的性质分类的（） A、智力测量与评价 B、典型行为测量与评价 C、能力倾向测量与评价 D、成就测量与评价 4、根据资料获得的时间不同及测验使用的目的不同，效标关联效度可以分为：（） A、同时效度和结构效度 B、结构效度和预测效度

C、同时效度和预测效度 D、结构效度和内容效度 5、李秉德提出：“教育目标分类的三维结构模型”，下面（）不属于三个维度之一。 A、教育目标的组成部分 B、学生的个性心理因素 C、学生的健康程度 D、各类组成的发展水平 6、以下关于测验常模的说法，错误的是（） A、有代表性的样组 B、针对某种人群 C、根据整理统计来获得资料 D、是已知的、规定的数据 7、标准分数是以标准差为单位表示测验成绩与平均分数之间的距离，下列选项中，（）不属于标准分数在我国高考中的试点应用 A、建立标准分数制度是高考标准化的重要环节 B、在高考中使用原始分数不具局限性 C、高考标准分数制度由常模量表分数、等值量表分数组成 D、高考标准分数有单科标准分数转换方法及高考综合分的转换方法 8、在以下标准参照测验的定性标准-测验内容领域规范模式中，（）包括说明、实例指导与题目样本、内容范围、答案范围 A、汉布莱顿模式 B、美国IOX模式 C、英国GCSE模式 D、我国高中毕业会考标准的建立模式 9、教育测量与评价方案的可用性可以从（）几个方面进行阐述。 A、科学性、公平性、稳定性、针对性、区分性、简洁性 B、科学性、公平性、可行性、针对性、区分性、简洁性 C、经济性、公平性、稳定性、针对性、区分性、简洁性 D、经济性、公平性、稳定性、针对性、区分性、简洁性 10、确定测验目标应该注意（） A、大概分析课程目标 B、正确选择目标

教育测量与评价教案

《数学教育测量与评价》教案第一章数学教育测量与评价的学科发展 [教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系，了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求，认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。 [重点与难点]重点：数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。难点：数学教育测量和教育评价的含义及二者之间的关系。 [教学时数]讲授2课时，课堂讨论、学生自主学习1课时 [教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合第一节数学教育测量与评价的基本问题一、数学教育测量与评价的含义二、教育评价的基本问题三、教育评价相关概念辨析第二节数学教育测量与评价的发展历史一、中国是考试制度的发源地二、中国科举制度的世界地位三、数学教育测量学科的诞生四、数学教育测量运动的蓬勃开展五、美国的“八年研究”是教育评价的催生剂六、数学教育测量与评价理论的发展第三节数学教育测量与评价的学科地位和作用一、数学教育测量与评价是现代教育科学研究的三大领域之一二、数学教育测量与评价在教育改革中具有重要的作用三、教育改革呼唤数学教育测量与评价更加科学化四、数学教育测量与评价是教师的专业素养和能力 [课堂训练、作业思考题] [1]数学教育测量与评价有什么联系与区别？ [2]教育评价与教育评估有什么联系与区别？ [3]在学科专业分类中，“数学教育测量与评价”放在哪一个类别中比较合适？ [4]试分析一下，狭义、中义与广义的教育评价概念有何区别？ [5]怎样使用数学教育测量与评价这个概念？ [6]为什么说数学教育测量与评价在教育中有重要的作用？

《教育测量与评价》试题与答案

一、选择题（每题1分，共15题） 1、根据某些法则与程序，用数字对事物在量上的规定性予以确定和描述的过程，这一概念是（A ） A. 测量 B. 评价 C. 测验 D. 统计 2、衡量、判断人物或事物的价值，这一概念是（ B ） A. 测量 B. 评价 C. 测验 D. 统计 3、被称为教育评价的催生剂的是美国的一项著名研究，它是（D ） A. 教育研究 B. 教育测量理论研究 C. 心理测验研究 D. 八年研究 4、于1975年成立的在开展教育评价的国际交流与协作过程中，最有影响力的协会是（B ） A. 国际教育成就评价协会 B. 国际教育评估协会 C. 国际教育评价协会 D. 国际教育成就评估协会 5、测量结果的稳定性程度是指（ C ） A. 效度 B. 稳定性 C. 信度 D. 可信度 6、用同一个量表（测验或评价表）对同一组被试测两次所得结果的一致性程度，其大小等于同一组被试在两次测验上所得分数的相关系数，这一概念是（B ） A.复本信度 B. 重测信度 C. 同质性信度 D. 分半信度 7、一个测验或量表实际能测出其所要测量的特性的程度，这一概念是（A ） A. 效度 B. 稳定性 C. 信度 D. 可信度 8、一个测验对于处于特定情境中的个体行为进行预测时的有效性，这一概念是（ C ）

A.同质性信度 B.复本信度 C.效标关联效度 D.重测信度 9、衡量测量题目质量的两个重要指标是（D ） A.信度与区分度 B.效度与信度 C.难度与效度 D.难度与区分度 10、表示每项评价指标在指标体系中所占的重要性程度，并赋予相应的值，这一概念是（D ） A.评价指标 B.评价标准 C.指标权数 D.指标权重 11、在评价指标拟定过程中，经常会将评价指标按照评价对象本身的逻辑结构逐级进行分解，把分解出来的主要因素作为评价指标的方法，这种方法是（C ） A.头脑风暴法 B.理论推演法 C.因素分解法 D.典型研究法 12、一个与被试同类的团体在相同测验上得分的分布状况与结构模式，这一概念是（B ） A. 模型 B. 常模 C. 量规 D. 参照物

教育测量与评价教案

《数学教育测量与评价》教案第一章数学教育测量与评价的学科发展 [教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系，了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求，认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。 [重点与难点]重点：数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。难点：数学教育测量和教育评价的含义及二者之间的关系。 [教学时数]讲授2课时，课堂讨论、学生自主学习1课时 [教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合第一节数学教育测量与评价的基本问题一、数学教育测量与评价的含义二、教育评价的基本问题三、教育评价相关概念辨析第二节数学教育测量与评价的发展历史一、中国是考试制度的发源地二、中国科举制度的世界地位三、数学教育测量学科的诞生四、数学教育测量运动的蓬勃开展五、美国的“八年研究”是教育评价的催生剂六、数学教育测量与评价理论的发展第三节数学教育测量与评价的学科地位和作用一、数学教育测量与评价是现代教育科学研究的三大领域之一二、数学教育测量与评价在教育改革中具有重要的作用三、教育改革呼唤数学教育测量与评价更加科学化四、数学教育测量与评价是教师的专业素养和能力 [课堂训练、作业思考题] [1]数学教育测量与评价有什么联系与区别？ [2]教育评价与教育评估有什么联系与区别？ [3]在学科专业分类中，“数学教育测量与评价”放在哪一个类别中比较合适？ [4]试分析一下，狭义、中义与广义的教育评价概念有何区别？ [5]怎样使用数学教育测量与评价这个概念？ [6]为什么说数学教育测量与评价在教育中有重要的作用？ [7]为什么说数学教育测量与评价是教师必备的知识技能修养？ [8]基础教育课程改革对考试评价制度改革提出哪些要求？第二章数学教育测量与评价的类型和功能 [教学目的与要求]掌握数学教育测量与评价的不同标准的分类，了解形成性、诊断性和总结性测验（评价）之间的区别和联系，初步了解常模参照测验和标准参

中学数学教育测量与评价

数学测量与评价洪梅一、举例分析中学数学各种类型试题命制的方法与技巧？（总分：25分）答：在此以选择题、填空题、解答题为例来分析我自己对中学数学试题命制的方法与技巧的一些认识。 1、选择题选择题由题干和多个（备用）选择项组成。数学的选择题一般备有4个选项，这些信息或多或少具有“提示”与“迷惑”双重作用. 题干往往包含两部分：题设与提问指导语句. 提问可以是定性提问、定量提问或者定性、定量兼具的提问.而选择项，通常是所提问题的结论或答案. 选择题型较为适合考查概念的理解、性质的运用、公式的变形、数值的计算、思维的切换，等等方面的情况. 运用选择题型编制试题时应该注意下列事项：在题干中，要用精练、明确的语言把题设（已知条件）和问题述清楚；每一个选择项的表述必须明确清楚，它与题干连接在一起，读起来应当顺畅，并且应当成为一个完整的语句，或者是一个完整的命题. 几个选择项之间，通常应当具有同类性（即类型相同）、相近性（即形式相近）和匀称性（即容量彼此相称）. 正确的选择项多一点隐蔽的色彩，而错误的选择项尽量多一些迷惑的因素，要针对学生的弱点和可能失误的情形设置起干扰作用的选择项；题设与结论之间的关联词、提问的指导语，既要合乎逻辑，又要无歧义，而且一般情况下应放在题干中. 2.填空题填空题的一般形式是给出若干个条件，要求推断出一个结论，或者计算出一个结果. 也有的是给一个命题要求补充条件或结论，使之成为正确的、完整的命题. 填空题的特点是只考查结果而不考查获得结果的过程. 适合编为填空题的容有：较简单的推理运算问题；容易由概念、性质或图形做出判断而严格地演绎出结果却是很难或冗繁的问题；貌似计算，实则运用概念或性质容易揭示出其中某些数量关系的问题. 填空题的进一步发展，出现了填写答案不惟一的填空题. 这类问题具有较好的辨析性、探索性或开放性，是对传统填空题具有创新意义的应用. 填空题命题的关键是材料的取舍和空位的设置，以及述方式的处理. 编制填空题应该力求做到：取材合理，涉及的容不宜多；考查中心突出、鲜明、集中；发问明确，指导语贴切，不会产生歧义，不会引发误解；述简洁、精炼，规． 3.解答题解答题是要求完整地写出解题过程的题目. 它的特点是容量较大，能直接考查多个知识点，以及综合考查多种数学思想、方法和数学能力. 由于这类题目要求考生完整地写出解题过程，因此较之选择题和填空题更能考查考生的解题思路和解题过程，也能更好地对不同水平的考生进行多层次的区分. 在一个大前提（已知条件）下，提出若干问题，要求学生解答，这是数学解答题的常见呈现方式. 从一个基本数学事实出发，研究其变形、扩、发展，形成

教育测量与评价

第一章、教育测量与评价的学科发展教育测量与评价一.教育测量 1、测量:根据法则给事物赋予数量。(史蒂文斯) 测量：客观事物及其属性；所依据的规则或方法；数量化的结果。 2、教育测量：广义：对于教育领域内的事物或现象，根据一定的客观标准，作缜密地考核，并依据一定的规则将考核的结果予以数量的描述。狭义：是指对学生某些学科经过学习和训练之后，所获得的知识、技能的测量。又称成就测量、学业成绩测量或学科测量。 3、教育测量的特点： 1.间接性和推断性 2.测量对象的模糊性和测量误差的不可避免性 3.量表具有多样性,结果具有相对抽象性 4.测量目的的针对性二.教育评价评价：评：评定；价：价值——教育价值教育评价：注重效果：美国的泰勒；注重资料的获得：美国的克龙巴赫、斯塔弗尔比姆；注重评价方法、手段：中国的张秀理、日本的长谷川容 1、教育评价的概念：教育评价是评价者对教育活动或行为主客体价值关系、价值实现过程、结果及其意义的一种认识活动过程，其核心内容是揭示教育活动或行为中的客体对主体的需要、目标的价值意义。三.教育测量与评价的关系联系: 教育测量就是指根据一定的理论、规则，运用一定的测量工具对教育现象进行数量化描述的过程教育评价是对教育现象状态和价值的判断，这一判断是以对评价对象的客观描述为前提的，没有对评价对象的客观描述，就不会有对评价对象价值的客观判断教育测量是教育评价的基础，教育评价要在教育测量所获得的客观信息的基础上进行.同时，教育测量的结果要通过评价才能获得实际意义．教育测量与评价的区别：第一，测量是对事物数量特征的获得。而教育评价则是对教育现象客体的价值进行判断。第二，教育测量是一种纯客观的过程，其突出特点是客观性。而教育评价则具有两种属性，即客观性和主观性第三，测量的任务是对事物的量的认识，而评价作为一种认识活动，是人的意识对实践活动及其结果的综合反映，它反映的是活动的过程和终点，又是新的实践活动的起点。教育测量与评价的产生与发展过程：一.教育测量的产生 1904年以前（教育测量的萌芽期）中国的科举制（隋炀帝大业二年，公元606年）科举制的特征：逐级考核、制度完备、考场严格、命题规范

中学数学教育测量与评价审批稿

中学数学教育测量与评价 YKK standardization office【 YKK5AB- YKK08- YKK2C- YKK18】

数学测量与评价李洪梅一、举例分析中学数学各种类型试题命制的方法与技巧（总分：25分）答：在此以选择题、填空题、解答题为例来分析我自己对中学数学试题命制的方法与技巧的一些认识。 1、选择题选择题由题干和多个（备用）选择项组成。数学的选择题一般备有4个选项，这些信息或多或少具有“提示”与“迷惑”双重作用. 题干往往包含两部分：题设与提问指导语句. 提问可以是定性提问、定量提问或者定性、定量兼具的提问.而选择项，通常是所提问题的结论或答案. 选择题型较为适合考查概念的理解、性质的运用、公式的变形、数值的计算、思维的切换，等等方面的情况. 运用选择题型编制试题时应该注意下列事项：在题干中，要用精练、明确的语言把题设（已知条件）和问题陈述清楚；每一个选择项的表述必须明确清楚，它与题干连接在一起，读起来应当顺畅，并且应当成为一个完整的语句，或者是一个完整的命题. 几个选择项之间，通常应当具有同类性（即类型相同）、相近性（即形式相近）和匀称性（即容量彼此相称）. 正确的选择项多一点隐蔽的色彩，而错误的选择项尽量多一些迷惑的因素，要针对学生的弱点和可能失误的情形设置起干扰作用的选择项；题设与结论之间的关联词、提问的指导语，既要合乎逻辑，又要无歧义，而且一般情况下应放在题干中. 2.填空题

填空题的一般形式是给出若干个条件，要求推断出一个结论，或者计算出一个结果. 也有的是给一个命题要求补充条件或结论，使之成为正确的、完整的命题. 填空题的特点是只考查结果而不考查获得结果的过程. 适合编为填空题的内容有：较简单的推理运算问题；容易由概念、性质或图形做出判断而严格地演绎出结果却是很难或冗繁的问题；貌似计算，实则运用概念或性质容易揭示出其中某些数量关系的问题. 填空题的进一步发展，出现了填写答案不惟一的填空题. 这类问题具有较好的辨析性、探索性或开放性，是对传统填空题具有创新意义的应用. 填空题命题的关键是材料的取舍和空位的设置，以及陈述方式的处理. 编制填空题应该力求做到：取材合理，涉及的内容不宜多；考查中心突出、鲜明、集中；发问明确，指导语贴切，不会产生歧义，不会引发误解；陈述简洁、精炼，规范． 3.解答题解答题是要求完整地写出解题过程的题目. 它的特点是容量较大，能直接考查多个知识点，以及综合考查多种数学思想、方法和数学能力. 由于这类题目要求考生完整地写出解题过程，因此较之选择题和填空题更能考查考生的解题思路和解题过程，也能更好地对不同水平的考生进行多层次的区分. 在一个大前提（已知条件）下，提出若干问题，要求学生解答，这是数学解答题的常见呈现方式. 从一个基本数学事实出发，研究其变形、扩张、发展，形成一系列的题

教育测量与评价考试题目汇总

测量题目汇总一、单选题（本题共15个小题，每小题1分，共15分。将答案填入下表） 1．与物理测量相比,以下属于教育测量特点的是( )。 A．它一般是间接测量 B.它的度量单位是绝对的 C.它的目的是特为测量服务的 D.它的作用是单一的 2. 下列量尺中，属于最高水平测度的是（）。 A．类别量表 B．等级量表 C．等距量表 D．等比量表 3. 一个主试在同一时间，只测量一个被试的测验称为（）。 A.难度测验 B.速度测验 C.预测测验 D.个别测验 4．区分度指数D的取值围为（）。 A．[-1，0] B．[0，1] C．[-1，1] D．[-2，2] 5．提出“凡有数量的东西都可以测量”的测验学者是（）。 A.桑代克 B.麦柯尔 C.王书林 D.萨蒂 6．测验难度系数P值在0.8—1.0为（ D ）。 A、难题 B、较难题 C、中等题 D、易题 7.测题基本上分为选择题和（）。 A.是非题 B.供答题 C.论述题 D.客观题 8．原则上区分度水平（）以下的题必须淘汰。 A．0.19 B．0.4 C．0.30—0.39 D． 0.20—0.29 9．下列教育测量类型属于按照测量的功能分类的是（）。 A．常模参照测验和标准参照测验 B．智力测验和能力倾向测验 C．难度测验和速度测验 D．标准化测验和教师自编测验 10．下列有关信度解释正确的是（）。 A．信度是有关测量结果的可信程度 B．信度越高，测验结果越是真实的 C．信度追求测量中的系统误差的最佳控制程度的估计 D．测验的项目少，测验的信度高 11．测量项目的难度为0.5时，项目的区分度值最大为（）。 A．0.8 B．1.5 C．1 D．-1 12．通常所用的时限是使大约（）%的被试在规定时间完成全部测验。 A．90 B．80 C．95 D．100 13．人的身高与学业成就、相貌与人的行为等现象的关系都属于（）。 A．积差相关 B．零相关 C．正相关 D．负相关 14．下列估计测验信度的方法中，对信度最严格的检验方法是（）。 A．再测信度 B．在一致性信度 C．复本信度 D．评分者信度 15．项目分析时一般将总分最高和最低的（）的被试划分为高分组和低分组。 A．7% B．17% C．27% D．37% 二、多项选择题（本题共8个小题，每题2分，共16分。将答案填入下表）

教育测量与评价

第一章、教育测量与评价的学科发展填空用数字对事物在量上的规定性予以确定，就需要有一个测量或计算的起点，这个起点叫参照点。量表，指的是确定了测量单位和参照点并具有取值系统的测量工具。泰勒指出英国剑桥大学直到1720年才开始使用笔试。20世纪初，在桑代克的影响下名词解释教育测量：就是针对学校教育影响下学生各方面的发展，侧重从量的规定性上予以确定和描述的过程。教育评价：是根据一定的标准，对教育事物或现象的价值进行系统的调查，在获取足够多的资料事实基础上，作出价值分析和价值判断。简答题教育测量的特点 ①间接性和推断性 ②测量对象的模糊性和测量误差的不可避免性 ③量表具有多样性，结果具有相对抽象性 “八年研究”的基本原则 ①应当帮助学生学习什么，即在教育计划中，应当帮助学生发展哪些思维、感觉和行动的方式。 ②为了帮助学生达到教育目标，应当提供什么学习经验，即怎样帮助学生学习预期的东西。 ③怎样组织学习经验，以使这些经验的累计效果最大，即怎样的学习顺序和学习经验的整体计划会有助于学生内化他们所学之物，并将其应用于适当的环境。 ④怎样评价方案效果，即随后采取什么步骤，以不断检查期望的学习活动所发生的变化。美国的“八年研究”对传统的教育测验提出的一些批评 ①传统测验是片断的，不能全部了解知识之过程和人格之发展。 ②测验只是关注客观的信度，但对于质的妥当性已不足以说明。 ③测验是教科书主义，测验内容关注记诵教材中的知识，是片面的，不能反映学生的全面发展。 ④对测量或考试的过分依赖必然养成个人主义与被动式的学习态度等等。第二章、教育测量与评价的类型和功能填空教育测量评价可大致分成常模参照、标准参照和潜力参照。教育测量与评价所指向的被试的行为表现，按其性质分成最佳行为和典型行为。名词解释 1、形成性测量与评价：是在教学过程中经常实施的，在性质上大致相当于现在的中小学单元测验。形成性测量与评价的目的，对教育而言是藉此获得教学过程中连续性的反馈，了解学生的学习效果、学习历程、学习特点、学习困难等信息，作为随时修正自己教学的参考。 2、常模参照测量与评价：是将被试水平与测验常模相比较，以评价被试团体中的相对地位的一种测量与评价类型。也就是说，常模参照评价对学生学习成就的解释，是采用了相对的观点。 3、标准化测验：是指由测量专家严格按照测验编制程序而编成的一种测验，通常标准化测

数学教育测量与评价

数学教育测量与评价专题讲座第一章均值和方差的检验题一、参数假设检验的几个基本因素关于什么是参数假设检验，我们先看一个实际例子。“某班语文课教学采用研讨式方法后,对其中10名同学测验,平均成绩为85分。已知这个班过去测验成绩服从正态分布,其均值保持在82分左右,这意味着总体平均分是给定的,那么现在问采用研讨式方法后,其平均成绩是否和原来一致?” 如果我们假设采用研讨式方法后的平均成绩和采用研讨式方法前的平均成绩一致,则需要判断这种假设对不对? 如果对,对的把握性有多大? 如果不对,那么平均成绩比原来是增加还是减少? 当然,我们不能只看到85分高于82分就认为比原来高了,这是因为抽取样本时受到随机因素的干扰,我们不能以样本参数对总体参数进行单纯比较而简单地下结

论。这个例子所反映问题的是: 总体分布已知,对总体参数作假设,用统计理论来判断这一假设正确与否,统计学上称为参数假设检验。一般说来，进行假设检验应重点关注以下几个基本因素：其一，假设。假设分为参数假设和非参数假设.参数假设指总体分布已知,关于未知参数的假设,教育研究中用的最多的是已知总体服从正态分布,对总体均值某校五年级学生期末语文成绩,方差,总体方差做出假设。例如,在过在原有状况下不变,而均值去常规教学下为82分。为了提高教学质量,采用新的教学法后抽测10名同学,其平均成绩为85分,这时我们提出采用新教学法后总体均值称为原假设或零假设,相对于为82分的假设,记为,还要给出一个备选假设,记为对这个例子我们不提本均值85大于82。小于82这样的假设,这是因为这样的假设是没有根据的,原因在于样其二，假设检验。

(完整版)教育测量与评价

教育测量与评价期末复习题一、简答 1.简述教育测量的基本要素及四种水平包括哪些？答：（1）教育测量的基本要素包括：参照点和单位。参照点：计算事物数量的起点，也叫零点。绝对参照点: 绝对零点, ,如长度, , 重量。相对参照点: 相对零点, ,如海拔高度、温度。单位：计量事物标准量的名称。理想的单位要符合两个条件: 同一个单位意义相同, 即确定的意义；相邻两个单位间的差别相等。（2）教育测量的四种水平四、教育测量的水平（第二章25页未找到准确答案）从所使用的参照点来说，教育和心理测量的参照点均为相对参照点。从所使用的单位来说，教育和心理测量所使用的单位意义不太明确, 单位常常不等值。从本质上讲，教育和心理测量的量表属于等级量表。无论是对智力，还是对能力倾向或人格的测量，都只具有等级量表的特征。由于多数心理特征具有常态分布的特征，无绝对零点，所以我们也可把测量后直接得到的原始分数转化为常态分布下的标准分数，把这些量表当作等距量表来处理。

2.简述教育测验编制的基本程序有哪些？答：一、确定编制测验的目标二、制定编题计划三、设计测验项目四、预测与项目分析五、合成测验六、测验的标准化七、搜集信度、效度资料八、编写测验手册 3．简述实施教育测验应注意的问题。答：第三节、测验的实施（第4章92页未找到准确答案）（一）测试开始前的准备主试方面： ?首先，主试在测试前要熟悉测验的结构和内容以及使用方法。 ?其次，测验实施者要熟练测验指导语并能口语清楚而流利地说出来。 ?有时还要对施测者进行必要的训练。训练的内容包括： 1 、熟悉测验内容； 2 、掌握施测步骤； 3 、掌握记分方法；

数学教育测量与评价教学提纲

数学教育测量与评价1.学习目的：通过学习了解数学教育测量与评价的基本原理，运用数学教育测量与评价获得信息，对数学教学进行测量与评价，从而指导数学教学实践。2．内容介绍：了解和掌握数学教育测量与评价的基本概念，学会运用教育统计学的基本理论进行教学测量与评价。3．考核或方案：运用教育测量与评价的基本原理，结合教学实践，选一个课题进行教学评价。4. 主要参考书目：[1] 田万海等著数学教学测量与评估上海教育出版社，1995年12月第1版[2] 王孝玲编著教育统计学，华东师范大学出版社，2001年7月第1版[3] 王孝玲编著教育测量华东师范大学出版社，2001年4月第1版第一章绪论§1.1教育统计学的内容一、什么是教育统计学教育统计学是运用数理统计的原理和方法，研究教育问题的一门应用科学。它的主要任务是研究如何搜集、整理、分析由教育调查和教育实验所获得的数字资料，并以此为依据，进行科学推断，揭示教育现象以蕴含的客观规律。二、统计学研究的内容分成描述统计、推断统计、实验设计1．描述统计对已获得的数据进行整理、概括，显现其分布特征的统计方法，称为描述统计。通过教育调查和教育实验获得大量的数据。用归纳、编表、绘图等统计方法对之进行归纳、整理，以直观形象的形式反映其分布特征；通过计算各种特征量，来反映它们分布上的数字特征。例如，计算集中量（算术平均数、中位数、众数、加权算术平均数、几何平均数、调和平均数等）来反映它的集中趋势；计算差异量（如全距、四分位距、百分位距、平均数、标准差、差异系数等）来反映它们的离散程度；计算偏态量及峰态量来反映它们的分布形态；计算相关量（如积差相关系数、等级相关数、点二列相关系数、相关系数、四分相关系数、C相关系数、肯德尔和谐系数、多系列相关系数等）来反映一个事物的中特性之间变化的一致性程度（尤其是测量评价中）。这些均属于描述统计范围。目的：在于将大量零散的、杂乱无序的数字资料进行整理、归纳、概括，使事物的全貌及其分布特征清晰，明确的显现出来。 2．推断统计根据样本所提供的信息，运用概率的理论进行分析，论证，在一定可靠程度上，对总体分布特征进行统计、推测，这种统计方法称为推断统计。例如，对总体参数值，即总体数字特征值（如总体平均数、总体标准差、总体相关系数等）的估计；对总体数字特征值或总体参数之差（如总体平均数之差、方差之差、总体相关系数之差等）的假设检验；对总体分布是否服从某种分布的假设检验等，都属于推断统计的范围。其目的在于根据已知的情况，在一定概率的意义上估计、推测未知的情况。 3．实验设计教师为了揭示实验中自变量与因变量的关系，在实验之前所制定的实验计划，称为实验设计。其中包括选择怎样的抽样方式；如何计算样本容量；确定怎样的实验对照形式；如何实现实验组和对照组的等组化；如何安排实验因素和如何控制无关因素；用什么统计方法处理及分析实验结果等。以上三部分内容，不是截然分开，而是相互联系的。描述统计是推断统计的基础，推断统计可以通过样本信息估计，推测总体。从已知情况推测、估计未知情况。良好的实验设计才能使我们获得真实的有价值的数据，对这样的数据进行统计处理才能得出正确的结论。而良好的实验设计又必须以统计就原理为根据，符合统计方法的要求才能对实验结果进行统计处理。 §1.2 学习统计与测量评价的意义1．可以顺利地阅读运用统计方法进行走量分析的科研报告和文献，从中可以间接地学习国内外先进地研究成果。2．可以提供一种科学方法为教科研服务——工具。3．可以提高教育工作的科学性和效率（学制的改革、课程的建设、课

大学生教育测量与评价期末复习资料

教育测量与评价自考资料(整理打印版)

教育测量与评价试题

教育测量与评价

大学《教育测量与评价》试题库及答案

教育测量与评价教案

教育测量与评价试题

教育测量与评价教案

《教育测量与评价》试题与答案

教育测量与评价教案

最新教育测量与评价考试试卷

中学数学教育测量与评价

教育测量与评价

中学数学教育测量与评价审批稿

教育测量与评价考试题目汇总

教育测量与评价

数学教育测量与评价

(完整版)教育测量与评价

数学教育测量与评价教学提纲