教育评价与测量

教育评价与测量
教育评价与测量

最常用的统计量有三类:

一类是代表一组数据典型水平或集中趋势的量,即集中量;另一类是反映一组数据的变异程度或离散程度的量,即差异量第三类是反映数据的相关程度的量,即相关量。

集中量是代表一组数据典型水平或集中趋势的量。常用的集中量有平均数、中位数和众数

随机变量的分类:测量数据按其是否等距和有无绝对零点,又可细分为下述四种测量水平:(1)有相等单位又有绝对零点的数据称为比率变量,如身高、体重、反应时、各种感觉阈值的物理量。(2)有相等单位但无绝对零点的数据,称为等距变量,如温度、各种能力分数、智商等。(3)既无相等单位,也无绝对零点,仅表示顺序,不能指出其间的差别大小的数据,称为顺序变量。如等级评定、品质等级等等。(4)既无相等单位,也无绝对零点,仅表示其名称的变量,称为称名变量。如名字、学号等等。

1、次数次数是指某一事件在某一类别中出现的数目,又称为频数,一般用符号f表示。

2、频率又称相对次数,即某一事件的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据数目的总数除。频率常用比例来表达,有时也用百分数表示。f/N

3、概率又称机率或然率,常用符号P表示。是指某事件在无限的观测中所能预料的相对出现的次数。概率常用比例表示。

测定的观测值与真值之差称为误差.误差可分为随机误差、系统误差和抽样误差三种类别。

随机误差指由与究目的无关的难以控制的偶然因素所引起的误差。

系统误差指由与研究目的无关的因素所引起的有规律性的误差。

抽样误差指由于抽样而产生的误差。抽样误差属于随机误差的范畴,由于它

在统计中的重要地位,所以人们专门列条陈述。

平均数特点①离均差之和等于0。

②在一组数据中,每一个数都加上一常数c,则所得的平均数为原来的平均数

加常数C 。

③在一组数据中,每一个数都乘以一个常数c,则所得的平均数为原来的平均

数乘以常数C 。

加权平均数

(1)加权平均数的概念

加权平均数是不同比重数据(平均数),

W 表示各观察值的权数;X 表示具有不同比重的观察值。

W

i

W X M W ∑=∑

平均数、中数、众数之间的关系:

1、在一个正态分布中,平均数、中数、众数三者相等,因此在数轴上三点重合。

2、在正偏态分布中M>Md>M 。

在负偏态分布中M

量较大的那个数据。

方差称变异数、均方。作为统计量,常用符号S2,δx2表示,作为总体参数,常用符号δ2表示。

标准差即方差的平方根,常用S 或SD δx 表示。若用δ表示,则是指总体的

标准差。

方差与标准差的意义:方差与标准差是表示一组数据离散程度的最好指标,

其值越大,说明离散程度大,其值小,说明数据比较集中,它是统计描述与

统计分析中最常应用的差异量数。

它基本具备一个良好的差异量数应具备的条件:(1)反应灵敏;(2)有一定

的计算公式严密确定;(3)容易计算;(4)适合代数运算;(5)受抽样变动

的影响小,即不同样本的标准差或方差比较稳定;(6)简单明了;(7)具有

可加性。

标准分(1)概念:标准分是将原始分数(测验分数)与平均分数相减,再除

以标准差所得的商。

X

X Z -=

标准分特点标准分是以标准差为单位的,故称为标准分。它是一种相对地位

分,即表明原始数据在团体分布中的地位。

1、标准分有正负之分,一般在[-3,3]中(几率为99.74%) 。

2、标准分的平

均数为0,标准差为1。 3、标准分可比性根据在于标准正态分布。

标准分数Z 的变换

标准分数有广泛的应用。大学英语水平考试采用标准分数量表。在实际应用

中,通常把标准分数Z 通过线性变换,转到更大的标准分数量表上,其一般

转换公式为:论 T=a+bZ

上式中,a 和b 为选定的两个常数,Z 为标准分数,T 为线性变换的标准分数。

如:

①教育与心理测验中的T分数:T=50+10Z ②韦氏智力量表智商(离差智商):IQ=100+15Z

③美国大学入学考试报告分数:CEEB=500+100Z ④美国教育测验中心举办“托福”考试:TOEFL=500+70Z

教育测量的概述:测量是根据法则给事物赋予数量。

测量的三要素(参照点、单位、量具)

1、参照点:为测定事物的量,事先确定的计量起点

绝对零点:计量起点在内容丝毫不存在一点量

相对零点:共同约定的零点作为测量的起点(不存在倍数关系)

2、单位:实施测量必须有统一的单位

具有明确的意义,即:大家对同一个单位的理解一致

测量过程中单位“距离”的不变性,即:单位的实际价值处处相同

3、量具:测量工具

具有准确性具备操作的简约性

教育测量工具:试卷?测试题?重视命题的研究

量表:根据测量目的所设计的测试项目和赋值规则

教育测量就是对教育领域内的事物或现象,根据一定的客观标准,作缜密地考核,并依一定的规则将考核的结果予以数量描述。如对学生的思想品德、健康状况、学业成绩等的测量。

特点:1、间接性和推断性2、测量对象的模糊性和测量误差的不可避免性3、量表的多样性,结果具有相对抽象性

量表的类型1.称名量表

类别量表,最低层次的量表,用于分类,表示事物的不同类别和性质

用数字表示每一个研究个体:学号、准考证号

用数字代表事物的类别:“1”、“0”表示“好”、“坏”

2. 顺序量表也称位次量表,根据事物的特性和设定的法则在分类的基础上确定同类客体中各元素之间的相对顺序

只关心研究对象的顺序,不问津间距是否一致合格与否、优良中差等3. 等距量表

间距量表,在赋值时有相等的度量单位,采用相对零点,被测所对应的测量值由明确的距离关系

原始测验分数经过统计处理后推导出一种新的量表分数,此分数的“零点”是一个相对零点

4. 比率量表

具有等距量表的一切性质,采用绝对零点。

针对总体而不是样本

不但能确定一个被测比另一个被测大(小)多少,而且还能得出其间的倍数关系

教育测量的种类1、形成性测验2、诊断性测验3、终结性测验

1、最佳行为测验以测量被试的最佳行为表现为目的。凡是以成就或能力的高低行为评价基础的,都属最佳行为测验。

2、典型行为测验典型行为测验目的不在测评被试能力的高低,而是测评其是否具备某种典型行为。

按测验的内容分类

1、智力测验目的在于测量被试的智力并对被试的智力发展水平和特点作

出评价。

2、能力倾向测验

目的在于测量与评价个人的潜在才能,预测个人能力发展倾向。分为两种:一是关于能力测验;一是特殊能力倾向测验。

3、成就测验

目的在于测评个人在接受教育或者训练后的成就。常见的两种:一是学科成就测验;一是综合成就测验。

4、人格测验

也称为个性测验,其目的在于测评被试的人格心理特征。本测量与评价所涉及的内容层面也很多。

良好测验的特征

一、可靠性(信度)二、有效性(效度)三、难易性(难度)和鉴别性(区分度)四、实用性(可操作性)

学习教育统计测量的意义

(1)认识教育现象,了解教育规律;(2)顺利阅读教育科研报告和文献,指导教育科研;

(3)有效地检查和评价教学,科学地选拔人才;(4)提高教育工作的科学性和效率。

提高测验信度的方法:

第一,测题要有一定数量。题目较少,测题抽样越受偶然性影响信度也越低。第二,测题难度要适中。难度太大或太小得分普遍高或普遍低,就会降低信度。第三,测题内容要单纯集中,不宜过于庞杂。

第四,测验时间要充分。第五,评分要客观。

内容效度:测验题目样本对于应测内容与行为领域的代表性程度。逻辑分析

结构效度:测验反映某种理论构想的准确性程度。因素分析

内容效度与结构效度一般没有适当的计算方法。效标关联效度一般用积差相关系数表示,如,求出入学测验分数与期末测验分数的相关系数。效度指标一般认为在0.6以上是有效测验。

效标关联效度:测验对于特定情境下个体行为进行预测的有效性程度。相关分析

效标:判断测验效度(预测有效性)的外部标准。

一个测验要具有较高的内容效度必须具备两个条件:

1、测验内容范围明确

2、取样具有代表性

提高测验信、效度的方法

第一,要控制系统误差,即控制测验过程的误差,包括:测量标准的失真,题目的复杂现象,题目与指导语有暗示性,答案具有明显的规律性。第二,精心编制测题,分析教学目标,编制双向细目表,测题表述简明易懂,测题有必要的覆盖面。第三,妥善组织测验等。

测验的编制与实施

题目类型:选择题、填空题、判断题、简答题、论述题

标准化测验编制的一般程序

教师自编测验

判断题其模式是提供一个陈述句,让考生判断是非、正误,故亦称是非题或

正误题。学生得分的偶然性大,所以判断题一般用于低年级。

编制判断题的操作要则:①测题含义必须单一明确,不能有歧义。②答案必须明确,并且是无可争议的。同一题中避免使用两个矛盾的概念。③叙述语言简明、不含混,减少读题干扰。

④避免使用暗示性词语。⑤应避免使用否定词,尤其不用双重否定词。⑥全部答案对与错的比例应大体相等。⑦测题次序应随机排列,不应有任何规则,⑧尽量不直录教材原文,不得已用时,措词要重新组织。

选择题优点:

1、可以测量学生多种层次的学习结果

2、评分标准统一、客观,有利于提高评阅的速度

3、允许较大的试题容量,可以保障题目的覆盖范围和代表性

4、可根据学生对似真选项的选择情况进行诊断

缺点:1、无法了解被试作答时的思维过程2、难以考核被试的综合能力3、具有似真性的干扰选项有时不好编制4、存在猜中答案的几率

编制原则:1、题干意义完整,问题表述明确2、题干及选项的语言均应简明3、诱答项应具有似真性4、同一测验中各题目应尽量保持独立,避免相互牵连5、正确答案不能有明显组型

填空题特点:主要用于考察被试对基本知识的记忆和理解能力。受被试猜测影响小,评分较客观。无法测量高级的学习结果。使用过多容易造成被试的死记硬背。

编制原则:1、题意要明确,限定要严密,以保证空白处应填答案的唯一性。

2、题目中空白部分以一处为宜,过多则使题干支离破碎。

3、所有空白处的线段长度应一致,避免产生暗示作用。

4、若答案是数字,应指明单位或数字的精确程度。

匹配题:其模式是由若干匹配项与选择项两部分组成。其形式有:连线式(将一组词句、段落依据规定的顺序排列起来)、归类式(按某一标准把有关选项归入匹配项)等。

编制匹配题的操作要则:

①匹配项与选择项不应是一对一的,选择项要多于匹配项,以减少学生猜答的可能性。②允许同一选项多次使用,当然也可以有的选项不被选用,以降低猜对的概率。③连线匹配题,分开两组的各项目的性质必须一致,以增加迷惑性。④选择项一般控制在10项以内,太多会增加学生的心理负担,⑤正确的答案要随机排列。⑥一题的所有匹配项与选择项要安排在同一页上,尤其是连线式的,以减少考生答案的麻烦。

简答题特点:适合于考察被试对基本知识、概念和原理的掌握、记忆情况。编制简单、灵活。

编制原则:问题叙述清楚、明确。

答案要简短具体,使被试可以用简洁的语言来回答,避免繁琐的计算和长篇大论。

避免只出机械记忆性的题目,应注重知识的应用。

论述题优点:1、可以用来对高层次、复杂学习结果的测量。2、可以增进学生的思考、应用及解决问题的能力,对于被试的学习态度和学习方式可以产生积极的影响。3、试题编制相对容易,可以增进被试的写作能力。

缺点:1、论述题一般都是大题,因此在一次考试中试题的取样范围比较小,且分布不均匀,难以做到全面考察。2、评分的主观性强。即使有参考答案和评分标准,但因被试的回答自由,回答问题的方向也不尽相同,评分的主观性仍难以避免。3、被试作答和评分阅卷均较为费时。

操作题:操作题是测量考生实际能力的新题型。其局限是:题目同质困难,评分不易客观,

编制操作题的操作要则:

①应以测量本学科基本知识基本技能的实际应用能力为内容。②测题应是同质同级、难易相仿的,以保证评分的公平性。③测题内容覆盖面要宽,数量要多,由考生随机抽取。④一个测题只能由一个考生来做,不能一个题目先后由几个考生来做。⑤操作的内容、形式、完成时间要有明确交代。⑥要准备好操作所必需的材料。

编制测验的一般步骤

1、确定测验目的

2、分析教育目标(编制双向细目表的一般步骤)

3、测验取材并编拟题(遵循的要求)

4、试测与分析(项目分析的步骤)

5、编制测验

大学《教育测量与评价》试题库及答案

瑞文测验中哪一项是适用于高智力成人的() 收藏 A. B 瑞文彩图推理测验 B. A 瑞文标准推理测验 C. D联合瑞文推理测验 D. C 瑞文高级推理测验 回答错误!正确答案: D 对人的智力进行的一种客观、标准化的度量,叫做()收藏 A. D 智力测验 B. B 情商 C. C 智力 D. A 能力 回答错误!正确答案: A WAIS 的计分是() 收藏 A. A 先计算标准分 B. B 先计算智商 C. D答对1题得1分 D. C原始分转化为标准二十分 回答错误!正确答案: D 测验所要达到的某种具体的目的,叫做() 收藏 A. B测验目标 B. D 行为目标 C. C 教学目标

A 教育目标 回答错误!正确答案: C 在评价对象的集合内选择一个或若干基准,各个评价对象和基准进行比较,叫做() 收藏 A. A 绝对评价法 B. C 教育评价方法 C. D 定量分析法 D. B 相对评价法 回答错误!正确答案: D 在编制试题时,题型的分类中填空题、改错题、名词解释、简答题都属于()收藏 A. B 选择型 B. D 常用题型 C. A 提供型 D. C 开放式 回答错误!正确答案: C WISC主要测验的年龄范围是() 收藏 A. B 6-16岁 B. D 4-75 C. A 4-6.5岁 D. C 16岁以上 回答错误!正确答案: A 忧郁、淡漠、悲观、思想与行动缓慢,分数太高可能会自杀。是哪种临床表现() 收藏

A 疑病 B. B 抑郁 C. D 精神病态 D. C 癔症 回答错误!正确答案: B 由反映评价对象内涵的指标集、评价标准和量化符号构成的是()收藏 A. B 模型 B. A 框架 C. D 体系 D. C 教育评价指标体系 回答错误!正确答案: D 以班级的平均成绩为标准对学生学习成绩进行的评价为() 收藏 A. B 相对评价 B. D 需要性的评价 C. C 比较性评价 D. A 绝对评价 回答错误!正确答案: A 我国教育工作者创造的认知领域目标分类法是() 收藏 A. C 五分法和四分法 B. B 三分法 C. A 六分法 D. D 二分法

教育评价与测量(整理好)

教育评价与测量 简答题: 1、信息的描述包括哪几个要素? 答:⑴经过审核、整理及汇总的资料;⑵研究对象;⑶描述的技术和手段。 2、评价信息解释的特性是什么? 答:⑴可检验性;⑵不完全性;⑶有效性 3、定性分析的特点是什么? 答:⑴定性分析关注事物发展过程以及相互关系。⑵定性分析的对象是质的描述性资料。⑶定性分析无严格的分析程序,有较大的灵活性。⑷定性分析主要采用逻辑分析及哲学思辨方法。⑸定性分析容易受主观因素的影响并对背景具有敏感性。4、影响评价效度的因素是什么? 答:⑴评价指标和工具的科学性⑵评价实施的质量⑶效标特征⑷被评价者的特性和样本的代表性 5、评价信度鉴定的方法? 答:⑴评价指标的信度鉴定方法⑵评价工具的信度鉴定方法⑶评分者信度鉴定方法 6、影响信度的因素? 答:⑴被评价对象的情况⑵评价指标和评价工具⑶实施评价过程中的各种因素 7、设计双向细目表包括几个基本步骤? 答:⑴考核的内容抽样与考核认知水平的确定⑵题型和题量的确定⑶试题的平均难度和难度分布的确定⑷试题赋分与测验期望分的预估 8、学生思想品德评价的意义是什么? 答:⑴实施学生思想品德评价,是提高学生思想道德水平,促进向素质教育转轨的重要措施。⑵是促进德育管理科学化的重要手段⑶有利于激励先进,鞭策后进。 9、思想品德评价的方法 答:⑴操行评语法⑵等第法⑶评等评分测评法⑷操作加减评分法⑸加权综合测评法⑹模糊综合测评法⑺评等评分评语综合测评法

10、表现性评价的基本特点 答:⑴评价的问题情境具有开放性、真实性、综合性⑵评价的方案具有灵活性⑶评价主体具有多元性⑷评价的结论以质的描述为主,辅以必要的等级⑸评价具有持续性,并鼓励学生通过合作解决问题 11、当前思想品德评价中存在的主要问题 答:⑴品德测评指标的设计问题⑵品德测评的量化问题⑶思想品德测评方法实践可行性的问题 12、课堂教学评价中教师自我反思的策略与途径 答:⑴在自我评价中反思⑵在他人评价中反思⑶在评价学生中反思⑷评价的结论以质的描述为主,辅以必要的等级⑸评价具有持续性,并鼓励学生通过合作解决问题 13、课堂教学评价中教师自我反思的形式 答:⑴自我提问法⑵行动研究法⑶教学诊断法⑷交流对话法⑸案例研究法⑹观摩分析法⑺总结记录法 14、班主任工作过程评价的内容 答:⑴了解和研究学生⑵组织和培养班集体⑶班级日常管理及思想教育⑷协调各方面教育力量⑸制定班级工作计划和总结,搞好期末的鉴定和评优工作 15、班主任工作评价的方法 答:⑴定量积分评价法⑵定性讨论分析法⑶综合法 16、教育评价按评价功能分为哪几类? 答:一、诊断性评价二、形成性评价三、终结性评价。 17、教育评价的主要功能有哪些 答:一、导向功能二、鉴定功能三、改进功能四、调控功能五、服务功能 18、西方教育评价发展的原因有哪些? 答:一、社会经济和科学经济的发展是评价发展的根本原因二、教育评价理论和时间发展过程中的猫冬运动是西方教育评价发展的内在因素。三、政府对评价工作的重视并用法律手段保证他的顺利实施是外部动力。 19、简述二十年来我国教育评价发展的特点 答:1、起点高,发展快2、搞试点,重实践3、建制度将规范

自学测验考试现代教育测量与评价网络课堂答案

教育测量与评价 现代教育测量与评价学 第一章教育测量与评价概述 一、教育测量的含义(33分) 本节测验题:智力测量属于 A. 物理测量 B. 心理测量 C. 生理测量 D. 社会测量 二、教育测量的特点、教育评价的含义(35分) 提出“凡物之存在必有其数量”命题的是谁? A. 麦柯尔 B. 孟子 C. 桑戴克 D. 孔子 三、教育评价的特点、教育测量与评价的产生(35分) 现代教育评价产生的标志是 A. 《比纳.西蒙量表》 B. 科举考试 C. T.B.C.F制 D. “八年研究” 四、现代教育测量与评价的发展(30分) 第四代教育评价”的创立者是 A. 枯巴和林肯 B. 比纳和西蒙 C. 桑代克和麦柯尔 D. 泰勒与布鲁姆 五、教育测量与教育评价相关概念辨析(30分) 我国教育法规定的两项基本教育制度:一是教育督导制度,二是 A. 教育评价制度 B. 教育考试制度 C. 教育测量制度 D. 教育评估制度 第二章教育测量与评价的信度 一、信度概述(31分) 样本统计量与总体参数越接近,说明测验的信度 A. 越低 B. 无法判断 C. 越高 D. 需要验证 二、重测信度、复本信度、同质性信度(一)(35分) 用同一个量表对同一组被试先后施测两次,所得结果的一致性程度是A. 等值性信度

B. 等值稳定性信度 C. 分半信度 D. 重测信度 三、同质性信度(二)、评分者的信度(一)(31分) 若2个评分者评阅N份试卷,计算评分者的信度可用 A. 斯皮尔曼等级相关系数公式 B. 斯皮尔曼-布朗公式 C. 积差相关系数公式 D. 肯德尔和谐系数公式 四、评分者的信度(二)、标准参照测验的信度(33分) 估计标准参照测验的信度需要预先确定 A. 淘汰的人数 B. 达标的比例 C. 通过的人数 D. 决断的分数 第三章教育测量与评价的效度 一、效度概述、内容效度的含义(30分) 下列适合于内容效度的测验是 A. 能力倾向测验 B. 成就测验 C. 人格测验 D. 性格测验 二、内容效度的估计方法、结构效度(38分) 下面哪种测验的效度不属于结构效度? A. 智力测验 B. 焦虑测验 C. 动机测验 D. 学科测验 三、效标关联效度(44分) 效标关联效度也称为 A. 实证效度 B. 预测效度 C. 同时效度 D. 逻辑效度 第四章教育测量与评价题目的难度和区分度 一、难度及其计算、区分度及其计算(一)(40分) 最适宜的难度系数是 A. 0.50 B. 0.00 C. 1.00 D. -1.00 二、区分度的计算(二)、区分度与信度和难度的关系(31分)难度系数越接近何值,题目的区分度越大? A. 0.50

教育测量与评价试题

西南大学教育学院 《教育测量与评价》课程试题【A】卷 阅卷须知:阅卷需用红色墨水笔书写,得分用阿拉伯数字写在每小题题号前,用正分表示,不得分则在题号前写0;大题得分登录在相对应的分数框内;统一命题的课程应当进行集体阅卷,流水作业;阅卷后需要进行复核,发现漏评漏记或总分统计错误应及时更正;对评定分数或统分记录进行修改时,修改人必须签名。 特别提醒:考生必须遵守课程考核纪律,违者将受到严肃处理 一、选择题(本大题共15小题,2分×15=30分) 1、考试制度的发源地是(),其中一个制度的建立对世界文化发展和考试制度的建立起过重要的影响 A、中国 B、美国 C、英国 D、日本 2、20世纪初,美国的教育测量运动轰轰烈烈的开展起来,美国的()是教育评价的催 生剂。 A、五年研究 B、六年研究 C、七年研究 D、八年研究 3、下面哪种教育测量与评价属于按测量与评价被试行为表现的性质分类的() A、智力测量与评价 B、典型行为测量与评价 C、能力倾向测量与评价 D、成就测量与评价 4、根据资料获得的时间不同及测验使用的目的不同,效标关联效度可以分为:() A、同时效度和结构效度 B、结构效度和预测效度

C、同时效度和预测效度 D、结构效度和内容效度 5、李秉德提出:“教育目标分类的三维结构模型”,下面()不属于三个维度之一。 A、教育目标的组成部分 B、学生的个性心理因素 C、学生的健康程度 D、各类组成的发展水平 6、以下关于测验常模的说法,错误的是() A、有代表性的样组 B、针对某种人群 C、根据整理统计来获得资料 D、是已知的、规定的数据 7、标准分数是以标准差为单位表示测验成绩与平均分数之间的距离,下列选项中,()不属于标准分数在我国高考中的试点应用 A、建立标准分数制度是高考标准化的重要环节 B、在高考中使用原始分数不具局限性 C、高考标准分数制度由常模量表分数、等值量表分数组成 D、高考标准分数有单科标准分数转换方法及高考综合分的转换方法 8、在以下标准参照测验的定性标准-测验内容领域规范模式中,()包括说明、实例指导与题目样本、内容范围、答案范围 A、汉布莱顿模式 B、美国IOX模式 C、英国GCSE模式 D、我国高中毕业会考标准的建立模式 9、教育测量与评价方案的可用性可以从()几个方面进行阐述。 A、科学性、公平性、稳定性、针对性、区分性、简洁性 B、科学性、公平性、可行性、针对性、区分性、简洁性 C、经济性、公平性、稳定性、针对性、区分性、简洁性 D、经济性、公平性、稳定性、针对性、区分性、简洁性 10、确定测验目标应该注意() A、大概分析课程目标 B、正确选择目标

现代教育测量与评价与衡量学

现代教育测量与评价学 1、一次考试中某生在50名学生中排名第13名,则该生的百分等级应该是【 B 】A.13 B. 26 C. 50 D. 74 2、在现代测验理论的诸多模式中,最具有优越性的是【 B 】A.经典测验理论B.项目反应理论C.心理测验理论D.智力测验理论 3、适合于某些用于选拔和分类的职业测验的效度是【 B 】A.时间效度B.内容效度C.效标关联效度 D.结构效度 4、韦克斯勒智力测验属于【 B 】 A.限时测验和典型作为测验B.限时测验和最高成就测验C.非限时测验和典型作为测验 D.非限时测验和最高成就测验 5、测验被试回忆或辨认某些特定事实的能力的认知层次是【A 】A.知识 B.应用 C.分析 D.综合 6、学生成绩测验的主要类型有安置性测验、形成性测验、诊断性测验和【 D 】 A.智力测验 B.能力倾向测验 C.人格测验D.总结性测验 7、学业成绩是一个【 D 】 A.名义变量 B.顺序变量 C.等距变量 D.比率变量 8、通常认为|r|<0.2时称为【 A 】 A.极低相关 B.低相关 C.中等相关 D.高相关9、根据测验编制程序的严格程度,可以简单地把学业成就

测验分成教师自编课堂成就测验和【 D 】 A.标准参照测验 B.纸笔测试 C.安置性测验D.标准化成就测验 10、下面题型中属于客观题的是【 D 】 A.计算题B.证明题 C.作图题D.选择题 11、最重要的测验质量指标是【 A 】 A.难度 B.区分度 C.梯度D.效度 12、评价的重点在于“过程”的评价是【 B 】 A.诊断性评价B.形成性评价 C.总结性评价 D.整体性评价 13、在布鲁姆认知领域教育目标分类中,层次最低的是【 D 】A.领会 B.应用 C.分析D.知识 14、学生的英语测验成绩属于【 B 】 A.名义量尺B.顺序量尺 C.等距量尺 D.比率量尺 15、内容效度的评估方法不包含【 B 】 A、专家判断法 B、双向细目表法 C、统计分析法 D、经验推测法. 16、下列几种效度中,不具有效度真正意义的是【 C 】A.结构效度 B.内容效度C.表面效度 D.效标关联效度17、学期初或单元教学开始时使用的测验是【 A 】A.安置性测验 B.形成性测验 C.终结性测验 D.能力倾向性测验

教育测量与评价考试重点整理版,DOC

课程性质和教学要求 课程的性质:《教育测量与评价》是教育测量学与教育评价学内容的整合并侧重于教育测量的一门综合性教育课程,它着力探讨对教育教学效果进行测量、评价的原理和方法,是一门带有综合性、技术性、实践性、应用性等特征的应用性学科,是实现教育科学研究与教育管理科学化所必须借助的一门科学,也是教育学专业和小学教育专业所开设的一门必修专业基础课程。 教学目标和要求:理解《教育测量与评价》的基本概念、原理和方法,能正确使用各类标准化的教育测验、会作测验质量分析、能正确解释分数的含义,并学会运用这些知识,对学校教育、教学和研究实践中的实际问题,做出比较正确与合理的判断和评价,以促进教育管理现代化、教育研究科学化。 第一章教育测量与评价的学科发展 教育测量与评价的基本问题 教育测量与评价的发展历史 教育测量与评价的学科地位和作用 1.测量的定义 史蒂文斯曾对测量作出以下定义:“就其广义来说,测量是按照法则给事物指派数字。” 我国有些学者认为:“测量是对客观事物进行某种数量化的测定”,“测量是按照一定的法则,用数字方式对事物的属性进行描述的过程”。

本书的观点:从广义上讲,测量就是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。 从以上对测量所下的各种定义可以看出,这种对事物进行区分的过程,必须是按照一定法则的,区分的结果必须能够用数字的方式进行描述的。 2.测量的要素 (1)测量的量具 测量的量具是指依据某些科学原理和法则,发展出合适的量具或制定出科学的测量方案。(2)测量的单位 不同的测量所采用的单位是不同的。 理想的测量单位必须符合两个条件:①要有确定的意义;②要有相等的价值。教育测量的单位不够完善,既无统一的单位,也不符合等距的要求。 (3)测量的参照点 量的参照点系测量的起点。要确定事物的量,必须有一个测量的起点,这个起点就叫做测量的参照点。 参照点有两种类型:①绝对参照点(绝对零点);②相对参照点(相对零点)。理想的参照点是绝对参照点,但教育测量中很难找到绝对零点,多采用人为指定的相对零点。 3.教育测量的定义与特点 教育测量的定义 教育测量,就是针对学校教育影响下学生各方面的发展,侧重从量的

最新教育测量与评价考试试卷

《教育测量与评价》试卷 总分:100分考试时间:50分钟 姓名:______________ 学号:______________ 考试分数______________ 一、单选题(2*13) 1、下列哪类题型不属于客观题() A填空题B判断题C选择题D论述题 2、同一量表,同一被试群体,在不同时间,两次施测,求其相关。这样得出的信度是()A复本信度B分半信度C重测信度D同质性信度 3、名称量表上的数字具有什么特性() A等比性B等距性C等级性D区别性 4、用测验来寻找被试某种能力上的特殊优点或缺点,这种测验是() A普通测验B诊断测验C预测测验D成绩测验 5、把总体中各个个体按照一定标志分为不同类型或层次,然后从各类型中随机抽取若干个个体,从而构成样本的抽样方法叫做() A整群抽样 B 机械抽样 C 分层抽样 D 单纯随机抽样 6、下列关于分半信度的描述哪一项是不正确的() A计算分半信度先要对测验分半 B要注意使那些性质不相同、联系不紧密的项目分在相同的一半 C测验越长、项目越多,两半分数的相关就越可能高 D不同的分半法可能会得到不同的信度值 7、下列关于区分度的描述哪一项是不正确的() A区分度是测验对被试实际水平的区分程度 B取值范围为0到1 C区分度越高时,试题的质量越好 D区分度是作为评价项目质量、筛选项目的主要指标与依据 8、区分度与难度之间的关系是() A 题目越难,区分度越高B题目越难,区分度越低 C 难度为1时,区分度为0 D难度为0时,区分度为1 9、测验工具是否测到了要测的东西,即测到了被试的某种心理特性、特质、结构,这就是测验的 ( ) A 信度 B 效度 C 难度 D 区分度 10、通常是以问卷的形式,提出一系列题目的人格测验的方法是( ) A 评定量表法 B 情境测验法 C 自陈量表法 D 投射测验法 11、标准分数值具有 ( ) A 可比性 B 可加性 C 可比性而无可加性 D A、B都对 12、发展常模就是某类个体正常发展进程各特定阶段的( ) A 高等水平 B 一般水平 C 低等水平 D 特定水平

【知识总结】教育评价与测量

一、名词解释(每小题8分共40分) 1、教育评价 2、形成性评价 3、泰勒模式 4、评价方案 5、教育测验运动 答: 1、教育评价——所谓教育评价,是指在系统地、科学地和全面地搜集、整理、处理和分析教育信息的基础上,对教育的价值做出判断的过程,目的在于促进教育改革,提高教育质量。上述定义包含:第一,教育评价的对象;第二,教育评价的本质;第三,教育评价的手段;第四,教育评价的目的。 2、形成性评价——指在教育活动进行过程中评价活动本身的效果,用以调节活动过程,保证教育目标实现而进行的价值判断。它的目的不是预测,也不是为了评定成绩,而是为了了解工作过程中的情况,以便及时调整工作的状态。 3、泰勒模式——是一个单向封闭系统。先制定目标,再根据目标选择和组织学习经验,然后评价目标的实现程度。其关注原初目标实现的程度。 4、评价方案——是整个评价过程的计划和蓝图,是实施评价工作的基本工具。它是教育评价组织者根据教育评价的目的,遵循教育活动的客观规律,在教育评价实施前拟定的有关教育评价目的、内容、范围、方法、手段、程序和预期结果的纲领性文件。 5、教育测验运动——指用各种测量工具(教育、心里测验和其他量表)测定被评价对象的某些重要特性,从而收集到有关评价信息的方法。测验法常用来收集学生的认知发展、学业成就、学习能力、体能等方面的资料。 二、简答(每题10分,共30分) 1、教育评价有哪些功能? 2、简述教育评价实施阶段被评价者的心理现象及其调控。 3、简述协同自评模式的基本步骤及其特点。 答: 1、教育评价有 (1)导向功能,是指教育评价本身所具有的引导评价对象朝着理想目标前进的功效和能力。 (2)鉴定功能,是指教育评价认定、判断评价对象合格与否、优劣程度、水平高低等实际价值的功效和能力。 (3)改进功能,是指教育评价本身所具有的促进评价对象为实现理想目标不断改进和完善行动的功效和能力。

教育测量与评价教案

教育测量与评价教案 Company number:【0089WT-8898YT-W8CCB-BUUT-202108】

《数学教育测量与评价》教案 第一章数学教育测量与评价的学科发展 [教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系,了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求,认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。 [重点与难点]重点:数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。难点:数学教育测量和教育评价的含义及二者之间的关系。[教学时数]讲授2课时,课堂讨论、学生自主学习1课时 [教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合 第一节数学教育测量与评价的基本问题 一、数学教育测量与评价的含义 二、教育评价的基本问题 三、教育评价相关概念辨析 第二节数学教育测量与评价的发展历史 一、中国是考试制度的发源地 二、中国科举制度的世界地位 三、数学教育测量学科的诞生 四、数学教育测量运动的蓬勃开展 五、美国的“八年研究”是教育评价的催生剂 六、数学教育测量与评价理论的发展 第三节数学教育测量与评价的学科地位和作用 一、数学教育测量与评价是现代教育科学研究的三大领域之一 二、数学教育测量与评价在教育改革中具有重要的作用 三、教育改革呼唤数学教育测量与评价更加科学化 四、数学教育测量与评价是教师的专业素养和能力 [课堂训练、作业思考题] [1]数学教育测量与评价有什么联系与区别 [2]教育评价与教育评估有什么联系与区别

《教育测量与评价》试题与答案

一、选择题(每题1分,共15题) 1、根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程,这一概念是(A ) A. 测量 B. 评价 C. 测验 D. 统计 2、衡量、判断人物或事物的价值,这一概念是( B ) A. 测量 B. 评价 C. 测验 D. 统计 3、被称为教育评价的催生剂的是美国的一项著名研究,它是(D ) A. 教育研究 B. 教育测量理论研究 C. 心理测验研究 D. 八年研究 4、于1975年成立的在开展教育评价的国际交流与协作过程中,最有影响力的协会是(B ) A. 国际教育成就评价协会 B. 国际教育评估协会 C. 国际教育评价协会 D. 国际教育成就评估协会 5、测量结果的稳定性程度是指( C ) A. 效度 B. 稳定性 C. 信度 D. 可信度 6、用同一个量表(测验或评价表)对同一组被试测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数,这一概念 是(B ) A.复本信度 B. 重测信度 C. 同质性信度 D. 分半信度 7、一个测验或量表实际能测出其所要测量的特性的程度,这一概念 是(A ) A. 效度 B. 稳定性 C. 信度 D. 可信度 8、一个测验对于处于特定情境中的个体行为进行预测时的有效性,这一概念是( C ) A.同质性信度 B.复本信度

C.效标关联效度 D.重测信度 9、衡量测量题目质量的两个重要指标是(D ) A.信度与区分度 B.效度与信度 C.难度与效度 D.难度与区分度 10、表示每项评价指标在指标体系中所占的重要性程度,并赋予相应的值,这一概念是(D ) A.评价指标 B.评价标准 C.指标权数 D.指标权重 11、在评价指标拟定过程中,经常会将评价指标按照评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标的方法,这种方法 是(C ) A.头脑风暴法 B.理论推演法 C.因素分解法 D.典型研究法 12、一个与被试同类的团体在相同测验上得分的分布状况与结构模式,这一概念是(B ) A. 模型 B. 常模 C. 量规 D. 参照物 13、我国高考标准分数采用了一种方案,这种方案是(A ) A. 正态化转换方案 B. 对比参照方案 C. 百分等级方案 D. 常模参照方案

教育测量与评价教案

《数学教育测量与评价》教案第一章数学教育测量与评价的学科发展 [教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系,了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求,认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。 [重点与难点]重点:数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。难点:数学教育测量和教育评价的含义及二者之间的关系。 [教学时数]讲授2课时,课堂讨论、学生自主学习1课时 [教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合 第一节数学教育测量与评价的基本问题 一、数学教育测量与评价的含义 二、教育评价的基本问题 三、教育评价相关概念辨析 第二节数学教育测量与评价的发展历史 一、中国是考试制度的发源地 二、中国科举制度的世界地位 三、数学教育测量学科的诞生 四、数学教育测量运动的蓬勃开展 五、美国的“八年研究”是教育评价的催生剂 六、数学教育测量与评价理论的发展 第三节数学教育测量与评价的学科地位和作用 一、数学教育测量与评价是现代教育科学研究的三大领域之一 二、数学教育测量与评价在教育改革中具有重要的作用 三、教育改革呼唤数学教育测量与评价更加科学化 四、数学教育测量与评价是教师的专业素养和能力 [课堂训练、作业思考题] [1]数学教育测量与评价有什么联系与区别? [2]教育评价与教育评估有什么联系与区别? [3]在学科专业分类中,“数学教育测量与评价”放在哪一个类别中比较合适? [4]试分析一下,狭义、中义与广义的教育评价概念有何区别? [5]怎样使用数学教育测量与评价这个概念? [6]为什么说数学教育测量与评价在教育中有重要的作用?

教育测量与评价考试题目汇总

测量题目汇总 一、单选题(本题共15个小题,每小题1分,共15分。将答案填入下表) 1.与物理测量相比,以下属于教育测量特点的是( )。 A.它一般是间接测量 B.它的度量单位是绝对的 C.它的目的是特为测量服务的 D.它的作用是单一的 2. 下列量尺中,属于最高水平测度的是()。 A.类别量表 B.等级量表 C.等距量表 D.等比量表 3. 一个主试在同一时间,只测量一个被试的测验称为()。 A.难度测验 B.速度测验 C.预测测验 D.个别测验 4.区分度指数D的取值围为()。 A.[-1,0] B.[0,1] C.[-1,1] D.[-2,2] 5.提出“凡有数量的东西都可以测量”的测验学者是()。 A.桑代克 B.麦柯尔 C.王书林 D.萨蒂 6.测验难度系数P值在0.8—1.0为( D )。 A、难题 B、较难题 C、中等题 D、易题 7.测题基本上分为选择题和()。 A.是非题 B.供答题 C.论述题 D.客观题 8.原则上区分度水平()以下的题必须淘汰。 A.0.19 B.0.4 C.0.30—0.39 D. 0.20—0.29 9.下列教育测量类型属于按照测量的功能分类的是()。 A.常模参照测验和标准参照测验 B.智力测验和能力倾向测验 C.难度测验和速度测验 D.标准化测验和教师自编测验 10.下列有关信度解释正确的是()。 A.信度是有关测量结果的可信程度 B.信度越高,测验结果越是真实的 C.信度追求测量中的系统误差的最佳控制程度的估计 D.测验的项目少,测验的信度高 11.测量项目的难度为0.5时,项目的区分度值最大为()。 A.0.8 B.1.5 C.1 D.-1 12.通常所用的时限是使大约()%的被试在规定时间完成全部测验。 A.90 B.80 C.95 D.100 13.人的身高与学业成就、相貌与人的行为等现象的关系都属于()。 A.积差相关 B.零相关 C.正相关 D.负相关 14.下列估计测验信度的方法中,对信度最严格的检验方法是()。 A.再测信度 B.在一致性信度 C.复本信度 D.评分者信度 15.项目分析时一般将总分最高和最低的()的被试划分为高分组和低分组。 A.7% B.17% C.27% D.37% 二、多项选择题(本题共8个小题,每题2分,共16分。将答案填入下表)

教育测量与评价教案

《数学教育测量与评价》教案 第一章数学教育测量与评价的学科发展 [教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系,了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求,认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。 [重点与难点]重点:数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。难点:数学教育测量和教育评价的含义及二者之间的关系。 [教学时数]讲授2课时,课堂讨论、学生自主学习1课时 [教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合 第一节数学教育测量与评价的基本问题 一、数学教育测量与评价的含义 二、教育评价的基本问题 三、教育评价相关概念辨析 第二节数学教育测量与评价的发展历史 一、中国是考试制度的发源地 二、中国科举制度的世界地位 三、数学教育测量学科的诞生 四、数学教育测量运动的蓬勃开展 五、美国的“八年研究”是教育评价的催生剂 六、数学教育测量与评价理论的发展 第三节数学教育测量与评价的学科地位和作用 一、数学教育测量与评价是现代教育科学研究的三大领域之一 二、数学教育测量与评价在教育改革中具有重要的作用 三、教育改革呼唤数学教育测量与评价更加科学化 四、数学教育测量与评价是教师的专业素养和能力 [课堂训练、作业思考题] [1]数学教育测量与评价有什么联系与区别? [2]教育评价与教育评估有什么联系与区别? [3]在学科专业分类中,“数学教育测量与评价”放在哪一个类别中比较合适? [4]试分析一下,狭义、中义与广义的教育评价概念有何区别? [5]怎样使用数学教育测量与评价这个概念? [6]为什么说数学教育测量与评价在教育中有重要的作用? [7]为什么说数学教育测量与评价是教师必备的知识技能修养? [8]基础教育课程改革对考试评价制度改革提出哪些要求? 第二章数学教育测量与评价的类型和功能 [教学目的与要求]掌握数学教育测量与评价的不同标准的分类,了解形成性、诊断性和总结性测验(评价)之间的区别和联系,初步了解常模参照测验和标准参

(0374)《教育评价与测量》网上作业题及答案

(0374)《教育评价与测量》网上作业题 及答案 1:第一次作业 2:第二次作业 3:第三次作业 4:第四次作业 5:第五次作业 1:[论述题] 一、名词解释题 1、常模 2、导出分数 3、相对参照点 4、行为样本 二、简答题 1、测量误差的含义及来源。 2、百分等级分数的特点。 3、两个测验应具备什么样的条件才能称为平行测验。 4、测验难度越大区分度越好,对吗? 三、论述题 1、为了提高测量效度,可以采取哪些措施。 2、联系实际说明如何向受测者报告测验分数。 参考答案:答题要点: 爱国主义是人类一种最古老的感情。是千百年来巩固起来的人们对祖国的一种最深厚的情感、也是对祖国在历史和现实中所起的进步作用的正确理解,力图使祖国更富强、更强大,为世界和平与人类进步作出更大贡献的―种坚定的志向。但是爱国主义以及爱国主义教育也都应该建立在理性思考的基础之上。具体说来,我们应当注意处理以下几种关系。 第一,爱“祖国”与爱“国家”(或政府)。第二,“爱国”与“爱人类”。第三,爱国

与改革开放。第四,爱国情感与爱国行动。 1:[论述题] 一、名词解释题 1、样本 2、重测信度 3、校标 4、原始分数 二、简答题 1、测验信度与效度的关系。 2、心理与教育测量的主要特征。 3、制定常模的过程。 4、导出分数与原始分数有何异同。 三、论述题 1、在测量中如何控制测量误差。 2、与其他的人格测验相比,投射测验的基本原理是什么。 参考答案:答题要点: 爱国主义是人类一种最古老的感情。是千百年来巩固起来的人们对祖国的一种最深厚的情感、也是对祖国在历史和现实中所起的进步作用的正确理解,力图使祖国更富强、更强大,为世界和平与人类进步作出更大贡献的―种坚定的志向。但是爱国主义以及爱国主义教育也都应该建立在理性思考的基础之上。具体说来,我们应当注意处理以下几种关系。 第一,爱“祖国”与爱“国家”(或政府)。第二,“爱国”与“爱人类”。第三,爱国与改革开放。第四,爱国情感与爱国行动。 1:[论述题] 一、名词解释题 1、个别测验 2、分数转换 3、绝对参照点

第二章 教育测量与评价的类型和功能

第二章教育测量与评价的类型和功能 第一节教育测量与评价的主要类型 一、按测量与评价在教学中运用的时机分类 ●形成性测量与评价 ●诊断性测量与评价 ●终结性测量与评价 形成性测量与评价 ●在教学过程中实施的,使教师借此获得教学过程中连续性的反馈,了解学生的学习效果、 学习历程等信息,作为修正教学的参考。 ●如:平时测验,随堂检测。 诊断性测量与评价 ●对经常表现出学习困难的学生所作的测量与评价,目的是对个人的问题行为及其原因进 行诊断。 ●注意:长期学习困难的学生可能有特别原因。 终结性测量与评价 ●一般用于教学结束后,相当于期末考试。 ●目的: ●一是检查学生一学期的学业达到了什么程度; ●二是根据终极性测量与评价的结果,评定学生的学业成绩,并将评定结果同时家长或记 入档案。 二、按解释测量结果或评价结果时的参照点分类 ●常模参照测量与评价 ●标准参照测量与评价 ●潜力参照测量与评价 常模参照测量与评价 ●测验常模简称常模,即指一定人群在测验所测特性上的普遍水平或水平分布状况。 ●常模参照测量与评价是将被试水平与测样常模相比较,以评价被试在团体中的相对地位 的一种测量与评价类型。 标准参照测量与评价 ●是将被试的表现与既定的教育目标或行为标准相比较,以评价被试在多大程度上达到该 标准。 ●学校中的考试多标准参照测量与评价。 潜力参照测量与评价 ●将被试实际水平与其自身潜在水平(潜力)相比较,以评价被试有无充分发挥自身潜力

为目的。 ●最近发展区 三、按测量与评价被试行为表现的性质分类 1、最佳行为测量与评价 以测量被试的最佳行为为目的。如成就测验或能力测验。 2、典型行为测量与评价 测量与评价被试是否具备某种(或某些)典型行为。如态度、情感、人格测验。 四、按测量与评价的内容分类 1、智力测量与评价 测量被试的智力并对被试的智力发展水平和特点作出评价。 2、能力倾向测量与评价 评价个人的潜在才能,预测个人的能力发展倾向。 3、成就测量与评价 测量并评价个人在接受教育或训练后的成就。 4、人格测量与评价 测量与评价被试的人格心理特征,如气质、性格、兴趣等。 五、教育测量与评价的其他分类 (一)按测量对象的个数 1.个别测量与评价 如:韦氏智力量表、学习障碍儿童诊断量表。 2.团体测量与评价 如:瑞文推理、气质类型量表 (二)按测验材料分类 1、文字测验 如:气质量表、霍兰德职业倾向性量表 2、非文字测验 罗夏墨迹测验、主题统觉测验 (三)按测量工具的标准程度 1.标准化测验 是指由测量专家严格按照测验编制程序而编成的一种测验。 2.非标准化测验 这类测样的编制相对自由,没有严格按照测验编制程序进行。 如教师自制的考试试卷。 第二节教育测量与评价的主要功能 一、实现教育判断的功能 ●测量评定功能 ●事实判断功能

教育测量与评价考试试卷

教育测量与统计测试试题(A卷) 第一部分选择题(共40分) 一、单项选择题(本大题共10题,每小题2分,共20分)在每小题列出的四个选项中只有一个选项是符合题目要求的,请将正确选项前的字母填在题后的括号。 1、测验手段反映真识情况的稳定性和一致性的程度是() A.效度 B. 信度 C. 区分度 D. 难度 2、把总体中各个个体按照一定标志分为不同类型或层次,然后从各 类型中随机抽取若干个个体,从而构成样本的抽样方法叫做() A.整群抽样 B. 机械抽样 C. 分层抽样 D. 单纯随机抽样 3、一个小组有10个学生,从中选一个组长,若每个人被选到的机会 是相等的,则明或华被选中的概率是(),如果进行两次选举,那么两次都选到明的概率是() A.1/5,1/5 B. 1/5,1/100 C. 1/10,1/100 D. 1/5,1/10 4、某班36个学生,英语测验分数地标准差为9.6,则其离差平方和是() A. 3317.6 B. 3217.0 C. 3320.5 D. 3500.1 5、一位老师对8个学生的作业成绩进行猜测。如果教师猜对的可能 性为1/3,且规定教师只有猜对95%才算这个教师有一定的评判能力。那么,这个教师至少要猜对学生成绩的个数为() A.4 B. 5 C. 6 D. 7 6、下列两组数据①14、2、1 7、9、22、13、1、7、11②1、26、11、 9、14、13、7、17、22、2的中位数分别是()

A.11、12 B. 14、9 C. 13、9 D、14、12 7、某年初中入学考试时语文、数学、英语的计分比例为4:3:3, 一个学生的考试成绩语文为72分,数学为94分,英语为79分,那么该生(假设各科难度相近)总平均分数为() A.82 B. 82.8 C. 80 D. 80.7 8、下列数据:23、36、20、25、33、31、27、29的四分位距是() A. 4 B. 6 C. 3 D. 8 9、某区拟对参加数学竞赛的2000人中前500名予以奖励,考试的平 均分数为75,标准差为9,那么,获奖的分数线是() A.81.03 B. 83.15 C. 84.56 D81.15 10、某区3600个学生数学测验成绩接近正态分布,其平均分为80 分,标准差为11.5分,则在70——90分之间应当有()人。 A.2216.52 B. 2218.05 C. 2235.32 D. 2650.85 二、多项选择题(本大题共5小题,每小题4分,共20分)在每小题列出的五个选项中有二至五个选项是符合题目要求的,请将正确选项前的字母填在题后的括号。多选、少选、错选均无分。 11、在教育统计过程中,抽样调查的种类有() A.单纯随机抽样 B. 分层抽样 C. 机械抽样 D、整群抽样 12、下列选项中,属于差异量的有() A.全距 B. 中位数 C. 平均差 D. 标准差 13、在教育实验中,常用的教育实验有( ) A. 单组实验 B. 等组实验 C. 轮组实验 D. 田野考察 14、积差相关使用的条件有() A. 两个变量都是连续性数据

2019春天南大学[0374]《教育评价与测量》作业答案

单项选择题 1、每个人与他人的人格都是不同的,这属于人格的(?? )。 1.?整体性 2.?稳定性 3.?独特性?? 4.?可塑性 2、结构效度是测验能够测量到理论上所定义的某一(?? )或特质的程度。 1.?思维形式 2.?行为方式 3.?心理结构?? 4.?人格结构 3、内容效度的分析方法常用(?? )。 1.?观察法 2.?统计法 3.?思辨法 4.?逻辑分析法?? 4、(?? )主要应用于成就测验。 1.?结构效度 2.?内容效度?? 3.?实证效度 4.?预测效度 5、实际能测出其所要测的心理特质的程度称为测验的(?? )。

1.?效度?? 2.?难度 3.?信度 4.?区分度 6、两个复本测验同时连续施测,则称这种复本信度为(?? )。 1.?一致性系数 2.?相同性系数 3.?等值性系数?? 4.?同质性系数 7、美国心理学家吉尔福特提出的是()。 1.?智力三维结构模型?? 2.?群因素说 3.?智力层次结构模型 4.?特殊因素说 8、智力的重要组成部分包括观察能力、记忆能力、(?? )和想象能力。 1.?创新能力 2.?思维能力?? 3.?推理能力 4.?问题解决能力 9、心理测验实质上是对(?? )的客观的和标准化的测量。 1.?心理样本 2.?人格样本

3.?行为样本?? 4.?个性样本 10、人口普查属于(? )。 1.?心理测量 2.?社会测量 3.?生理测量?? 4.?物理测量 11、难度和(?? )是题目质量的两个重要指标。 1.?信度 2.?区分度?? 3.?效度 4.?拟合度 12、(?? )是指一个人相对稳定的心理特征和行为倾向。 1.?心理特质 2.?心理品质 3.?人格?? 4.?心理过程 13、世界上第一个智力量表是由(?? )编制的。 1.?比内和西蒙?? 2.?推孟 3.?戈达德 4.?韦克斯勒

教育测量与评价

第一章、教育测量与评价的学科发展 填空 用数字对事物在量上的规定性予以确定,就需要有一个测量或计算的起点,这个起点叫参照点。 量表,指的是确定了测量单位和参照点并具有取值系统的测量工具。 泰勒指出 英国剑桥大学直到1720年才开始使用笔试。20世纪初,在桑代克的影响下 名词解释 教育测量:就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。 教育评价:是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实基础上,作出价值分析和价值判断。 简答题 教育测量的特点 ①间接性和推断性 ②测量对象的模糊性和测量误差的不可避免性 ③量表具有多样性,结果具有相对抽象性 “八年研究”的基本原则 ①应当帮助学生学习什么,即在教育计划中,应当帮助学生发展哪些思维、感觉和行动 的方式。 ②为了帮助学生达到教育目标,应当提供什么学习经验,即怎样帮助学生学习预期的东 西。 ③怎样组织学习经验,以使这些经验的累计效果最大,即怎样的学习顺序和学习经验的 整体计划会有助于学生内化他们所学之物,并将其应用于适当的环境。 ④怎样评价方案效果,即随后采取什么步骤,以不断检查期望的学习活动所发生的变化。美国的“八年研究”对传统的教育测验提出的一些批评 ①传统测验是片断的,不能全部了解知识之过程和人格之发展。 ②测验只是关注客观的信度,但对于质的妥当性已不足以说明。 ③测验是教科书主义,测验内容关注记诵教材中的知识,是片面的,不能反映学生的全 面发展。 ④对测量或考试的过分依赖必然养成个人主义与被动式的学习态度等等。 第二章、教育测量与评价的类型和功能 填空 教育测量评价可大致分成常模参照、标准参照和潜力参照。 教育测量与评价所指向的被试的行为表现,按其性质分成最佳行为和典型行为。 名词解释 1、形成性测量与评价:是在教学过程中经常实施的,在性质上大致相当于现在的中小学单元测验。形成性测量与评价的目的,对教育而言是藉此获得教学过程中连续性的反馈,了解学生的学习效果、学习历程、学习特点、学习困难等信息,作为随时修正自己教学的参考。 2、常模参照测量与评价:是将被试水平与测验常模相比较,以评价被试团体中的相对地位的一种测量与评价类型。也就是说,常模参照评价对学生学习成就的解释,是采用了相对的观点。 3、标准化测验:是指由测量专家严格按照测验编制程序而编成的一种测验,通常标准化测

教育测量与评价的试题

教育测量与评价试题 一、选择题 1.根据某种规则把所观察的对象予以数量化的过程,这一概念是() A.测量 B.评价 C.统计 D.测验 2.衡量测验题目质量的两个重要指标是( ) A.信度与区分度 B.效度与信度 C.难度与效度 D.难度与区分度 3.测量结果的稳定性程度是() A.效度 B.稳定性 C.信度 D.可信度 4.我国高考标准分数采用了一种方案,这种方案是() A.对比参照方案 B.常模参照方案 C.正态化转换方案 D.百级等级方案 5.测量学生对问题的理解、再认、比较与辨别的能力,以及思维的敏捷性和准确的推断力的题型是() A.填空题 B.选择题 C.是非题 D.计算题 6.下列不属于教育评价的原则的是() A.方向性原则 B.公平性原则 C.指导性原则 D.主体性原则 7.下列哪种效应的弊端为“以偏概全”() A.晕轮效应 B.参照效应 C.首因效应 D.成见效应 8.在评价对象的集合之外确定一个标准,评价时把评价对象与客观标准进行比较的评价法是() A.定性分析评价法 B.临床督导评价法 C.绝对评价法 D.相对评价法

9.评价者在评价中坚持反映自己“大我”价值观的心理现象是指() A.本位心理 B.逆反心理 C.“趋”中心理 D.从众心理 10.体育运动会中各个项目的名次为“第1名,第2名,第3名……”,这一变量属于() A.比率变量 B.称名变量 C.顺序变量 D.等距变量 11.评价者的心理现象中被称为“皮格马利翁效应”的是() A.期望效应 B. 时尚效应 C.理想效应 D.近因效应 12.“权,然后知轻重;度,然后知长短”所指的测量的特点是() A.间接性 B. 相对性 C.可测性 D.准确性 13.根据题目答案的范围和评价误差的大小,可把测验题目分为() A.选择题和填空题 B. 论述题和操作题 C.选择题和简答题 D.客观题和主观题 14.在一36名学生数学考试分数的频数分布表中,最高分数为97,最低分数为50,并将其分为8组,则组距为() A. 5 B. 6 C. 5.6 D.7 15.用来表示两个平行测验测量同一批被试所得结果的一致程度,且大小等于同一组被试在两个复本测验上所得分数的积差相关系数的信度是() A. 同质性信度 B.重测信度 C. 复合信度 D.评分者信度16.下列为评价信息收集标准的是() A.可靠性和准确性 B.时限性和客观性 C.准确性和一致性 D.可靠性和有效性

相关文档
最新文档