教育测验编制原理与方法

合集下载

教育测验编制的一般步骤与方法

教育测验编制的一般步骤与方法

缺点:
1.不易编制,且花费时间较多。 2.易受考生阅读能力的影响。 3.难以排除考生对试题的随机猜测。 (二)客观题命题的一般原则 1.试题能反映教学内容的重点或知识 点。
2.题目之间的相关性越低越好。 3.试题的文字力求浅显易懂、题意明 确。
2020/3/27 4.答案应该是明确、唯一的。
(三)不同类型选择题的命题原则
3
1
1
1
0
第四章 溶液 6
3
3
1
8
第五章酸碱盐 4
3
3
5
2
合计
26 12 13 14 18
评价
2 2 2 6 5 17
合计
22 21 8 22 22 100
由上图可见,命题双向细目表由3个要素组成:
测验目标、测验内容以及二者的比例,即权重。权
重代表了这部分内容的相对重要性。
2020/3/27
◆在真实的命题中,一般遵循如下顺序:
内容范围 3 1 5 3 2 2 2 15
内容范围 4
3444
15
内容范围 5 1 6 2 3 3 2 17
合计
6 32 24 16 14 8 100
2020/3/27
例 1 初中化学内容与教学目标细目表
测验目的 测验内容
知识 理解 运用 分析 综合
第一章 氧
6
3
4
4
3
第二章 氢
7
2
2
3
5
第三章 碳
① 测验材料要适合测验目的
② 测验材料要能够代表该科教材的全部 内容(测验材料要有合理的覆盖面,突出 基本内容及重点内容,比例参照命题双向 细目表)
③ 测验材料要有普遍性(要依据统一的 教学大纲)

教育测量与评价复习资料 (1)

教育测量与评价复习资料 (1)

第一章教育测量与评价的学科发展1. 测量的三要素:量具、测量的单位、测量的参照点。

2. 教育测量是为了了解学生的发展,尤其是为评价学习成绩而进行的测量活动。

这是教育测量活动最原始的动机,也是教育测量学科发展最早的立足点。

3. 教育测量的特点:间接性和推断性、测量对象的模糊性和测量误差的不可避免性、量表具有多样性以及结果具有相对抽象性。

4. 史蒂文斯根据测量的精确度将量表分为:称名量表、顺序量表、等距量表和比率量表四种水平。

称名量表是用来对事物活人的心理现象进行分类,指派的数值没有数量意义,只是表明事物的类别和性质不同;顺序量表也用于对事物活人的心理现象进行分类,这种分类基于所测属性在数量大小基础上进行的有序得分类,四等级评分法和五分法都是顺序量表;等距量表不但能在一个连续体上表示事物量的大小,而且具有形同的测量单位,但她的零点是相对的,是人为规定的;比率量表是最高水平的量表,除了具有量的大小和相同的单位,还具有绝对的零点。

5.教育评价的概念:格兰朗德:评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的系统过程,评价=测量(定量描述)+非测量(定性描述)+价值判断斯塔费尔比姆:评价是一种划定、获取和提供叙述性和判断性信息的过程,评价最重要的不是为了证明,而是为了改进。

泰勒:评价过程本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程。

日本桥本重治:评价师与教育的目标和价值有明确关系的概念,是按照教育目标和价值观对学生学习成果及教育计划的效果等进行测量的过程。

因此,评价的概念重点在于以教育目标为标准的价值判断。

布鲁姆:评价是为了某个目的而进行的,对各种想法、作品、解答、方法、资料等的价值作出判断的活动。

所谓教育评价,是指按照一定的价值标准和教育目标,利用测量和非测量的各种方法系统的收集资料信息,对学生的发展变化和影响学生发展变化的各种要素进行价值分析和价值判断,并未教育决策提供依据的过程。

第四章 教育测验的编制

第四章 教育测验的编制
25
• (二)题目分析
• 1.定量分析(略) • 2.定性分析
– (1)均衡性:试题所测量的内容能够代表学生学习 中要求掌握的学习任务吗?
– (2)相关性:试题是否再现相关的学习任务? – (3)简明性:试题的语言是否简单、明了?
26
• (4)合理性:试题的难度适中吗?是否有错误?是否存在 有争议的答案?
34
一、常见题型及其编制
• (一)选择题(multiple-choice items)及其编制原则 – 1.选择题的结构:题干(stem)和选项(alternatives) – 2.选择题的优缺点 – 优点: • (1)选择题可以测量被试各种不同层次的学习结果。 • (2)正确答案唯一。
35
• (3)可以加大试题容量,扩大试题覆盖的知识面。 • (4)有利于考察被试思维的敏捷性和准确的判断力。 • (5)通过对学生对干扰项(distracters)的选择,教师可
某种具体的目的,它明确规定测验所要达到的预 期结果或标准。它是编制测验的出发点和依据。
13
(1)测验目标与教育目标分类
• 测验目标的确定是以教育目标分类理论为基础的。 – 布卢姆等人的教育目标分类法 – 加涅的教育目标分类法 – 梶田叡一的教育目标分类法 – 我国认知目标的分类
14
15
16
我国认知目标的分类
19
3 .填写双向细目表
• 准备一个含有教学目标与教学内容两个维度的双向细目 表 – 横向设计 • 各个知识在整个测验的知识范围内的相对地位和 重要程度(确定各部分知识所占的比重)。这种 相对重要性可由该内容项目的教学课时的多少来 体现。
20
– 纵向设计 即决定每一目标层次所占比例。这一比例应与测验编制 者认为这个目标对受测学生的水平所具有的重要性相符。 一般主要是参考专家或有经验教师的意见而定。

第三章_教育测验的编制与实施

第三章_教育测验的编制与实施

布卢姆的分类法 加涅的分类法 梶田叡一的教育
评价
认 综合 知 分析
领 应用 域 理解
知识
认知策略(问题解决)
高级规则
智力技能
规则 概念
智力技能
辨别
言语信息
精神运动领域目标
体验 目标
情感领域目标
认知领域目标
技 适应 能 练习 领 模仿 域 观察
运动技能
精神运动领域目标 提高 目标 情感领域目标
认知领域目标
两可的语句,以免引起对正确答案的争议。
? (5)题目陈述应简单明了,避免使用复杂 的句子结构,应尽量采用正面叙述,避免 用否定和双重否定的语句。
? 综合(将知识各部分重新组合,形成一个新的整体)编写、写作、创造、 设计、提出、组织、计划、综合、归纳、总结
? 评价(根据一定标准进行判断)鉴别、比较、评定、判断、总结、证明、 说出……价值
C:条件的表述
? C:学习者表现行为时所处的环境
? 环境因素(空间、光线、温度、气候、室内、室外、安 静等)
等堂皇的用语来叙述。
? 诱答项的长度和措辞的复杂性与正确性与正确选项相 似。
? 在诱答项中使用额外的线索。如固定的用词,具有科 学味道的答案,以及和题干有语义上的联系等。
? 保持选项之间的同质性。
? 5、不能对正确答案有任何暗示。无意的暗 示有:
? 1)语法结构上的不一致;
? 2)各选项在逻辑上不同,如正确答案中加以 “如”、“有时”、“通常”等修饰词,诱答 项中加以“总是”、“从未”、“所有”、 “绝对”、“准”等修饰词,或正确答案使用 与题干相同的词;
2)学习目标
? 学习目标:“是对学习者通过教学以后将能做什么的一种明确的、具 体的表述”。

教育测验编制原理与方法4

教育测验编制原理与方法4

作文题
➢ 对人的逻辑思维、形象思维、书面表达等 多种能力的一种综合考查
分类
➢ 命题作文和条件作文 ➢ 记叙文、议论文、说明文等 ➢ 缩写型、改写型、续写型等
编制原则
➢ 根据考试目的、考试对象来确定作文文体和要 求
➢ 根据社会需要、现实生活和学生实际设计命题 ,作文命题要直接测量语文素养和书面表达能 力
25
45
第47页/共52页
应用
5 10 5 10
30
总体百分数
20 30 20 30
100
(一)设计测验的操作细目表
➢ 3. 使用单向归类系统(阅读理解技能)
阅读技能
识别文章中的细节 概括出文章的中心思想 判断文中事件出现的先后顺序 辨别文中所表述的关系 对文中内容进行推论 总体百分数
题目数
10 10 10 10 10 50
➢ B.气温
➢ 1.测量并报告气温;2.影响气温的因素;3.气温与天气形成的关系
➢ C.湿度和降水量
➢ 1.测量并报告湿度;2.影响湿度的因素;3.降水的形式;4.测量并报 告降水量
➢ D.风
➢ 1.测量风速和风向;2.影响风速和风向的因素;3.说出代表风速和风 向的符号
➢ E.云
➢ ……
➢ F.锋面
1
1
1
7
5
15
25
水量

2
2
2
6
12
20
题目总数 6
6
6
30
12
60
题目 10
10
10
50
20
100
百分比
第46页/共52页
(一)设计测验的操作细目表

现代教育测量与评价 简答论述题 历年考题分章节汇总

现代教育测量与评价 简答论述题 历年考题分章节汇总

06231《现代教育测量与评价学》-- 简答论述题知识点第一章教育测量与评价的学科发展1.简述教育测量的特点。

P3 (2015年4月简答、2008年4月简答)①间接性和推断性。

②测量对象的模糊性和测量误差的不可避免性。

③量表具有多样性,结果具有相对抽象性。

2.如何理解教育测量的间接性和推断性? P3 (2011年4月简答)物理测量大多是直接性的。

虽然教育测量无一例外地关注到人类自身,但测量的内容主要是关于人的种种非物质属性。

目前,我们只能通过人的外显的行为或通过人对外界的一些刺激作出的反应,对人的知识技能、智力水平、思维品质、创造能力、心理素质、情感态度、道德品质等作出间接性的、推断性的测量。

3.教育测量与教育评价的区别与联系。

P7 2005年4月简答教育测量是针对教育效果或针对学生各方面的发展予以测量和描述的过程,旨在获得有一定说服力的数量事实,是一种以量化为主要特征的事实判断。

教育评价是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实的基础上,作出价值分析和价值判断。

教育测量为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;教育评价是教育测量过程的延续,是对教育测量结果的解释与应用,并朝着价值判断与释放教育功能的方向拓展。

4.简述教育测量与评价在教育改革中的作用。

P25 2012年4月简答当我们根据教育目标和计划,把教育方案、课程、教学等因素作用于学生身上,需要参照教育目标和计划,对教育效果进行测量评估、价值分析和判断。

所以教育评价在教育系统中对实现教育目标起着十分重要的作用。

(3 分)教育改革常常以教育测量与评价的改革作为突破口。

俗话说“考试是根指挥棒“就是这个意思。

(2分)考试与评价改革成为基础教育新课程改革的重要内容。

5.为什么说教育测量与评价是教师必备的知识技能修养? (专业素养和能力)P27 2018年4月论述(1)正确评价学生的发展是教师职业能力的重要组成部分;(4分)(2)在教书育人过程中,需要教师采用教育测量与评价多种方法,以弥补教师非正式观察的不足;(3分)(3)现代教自测量与评价的思想方法对于教师创造性地教学、因材施教、提高教学质量具有重要的作用;(3分)(4)国外教师教有普遍开设"教育测量与评价”这类课程。

教育测验编制的一般原理与方法23

教育测验编制的一般原理与方法23
-题 右例
试论述灵魂是否存在 ?并说明其理由
4,编制原
-则(4)当有多个论 述题时,可以设置 一个必答的论述题 ,剩下的题目可允
-许被试选择作答 右例
待补充
-4,编制原
则(5)最好在
题目中给出回 答本题所需的
-参考时间 右例
待补充
作文题
对人的逻辑思维、形象思维、书 面表达等多种能力的一种综合考查
第二节
测验蓝图设计与测验 编制要领
一、设计测验的基本考虑
1、确定测验目标 2、确定测验的属性是学科测验或是智力测验、人格测验 3、明确测验的性质和用途 4、明确测验对象 5、分析测验目标
二、设计测验蓝图 (一)测验蓝图的作用
1、保证样本的代表性和恰当性
2、确保题目合适的比例、难度
(二) 设计测验蓝图的步骤
-5,编写原
则(4)诱答项
-应具有似真性 右例
在下列元素中,哪一 种元素存在于蛋白质 中,而不存在于碳水 化合物或脂肪中? A.二氧化碳 B.氧 C.水 D.氮
-增加干扰选项似真性的具体方 -法有:
a.使用学生共同的错误观念
-或过失作为诱答项 b.以学生惯用的模糊性用语
-叙述诱答项 c.在正确选项和诱答项中使用 同样的“精确的”“重要的”等堂
白放在句子的 后面或中间, 而不要放在句
-子开头 右例
( 汽机
)发明了蒸
3,编写原
-则(5)所有空白处 的线段长度应当一 致,不能随正确答 案文字的多少而长 短不一,以免产生
-暗示作用 右例
待补充
-3,编写原
则(6)若答案
是数字,应指 明单位和数字
-的精确程度 右例
3除以10等于( )

最新第三章-教育测验的编制与实施新1分解课件PPT

最新第三章-教育测验的编制与实施新1分解课件PPT

难易度: A.较易 B.中等 C.较难 D.难度较大 认知度: Ⅰ识记 Ⅱ理解 Ⅲ简单应用 Ⅳ综合运

一般双向细目表纵向为要考查的内容即 知识点,横向列出的各项是要考查的能力, 或说是在认知行为上要达到的水平,通常采 用识记、理解、应用、分析、综合、评价六 个等级。这是按美国教育家布鲁姆(B.Bloom) 目标分类划分的,是从最简单的、基本的到 复杂的、高级的认知能力。每前一目标都是 后面目标的基础。即没有识记,就不能有理 解,没有识记与理解,就难以应用。
第一,考试作为一种常用的评价方法,世 界各国在经历过种种考试评价改革之后, 越来越多的发达国家和地区都觉悟到,考 试以及学科成就测验毕竟是一种最实在的 评价方法。对我们国家来讲,考试堪称是 一种具有中国传统优势和鲜明特色的评价 方法。教育改革绝对不能抛弃历史传承下 来的优秀文化。推进素质教育应该更加重 视考试改革。重视考试改革,一要继承, 二要创新。
试题需要改革创新,既可以在教材和 教辅中首次出现,也可以在关键性选拔考 试中首次出现,但要务必要有利于稳定教 学秩序,避免考前各个学校教师猜测捉迷 藏以及搞题海战术。
第二部分 考试命题双向细目表
考试命题双向细目表是一种考查目标 (能力)和考查内容之间的列联表。制作 考试命题双向细目表,是命题工作的一个 重要环节。双向细目表可以使命题工作避 免盲目性而具有计划性;使命题者明确测 验的目标,把握试题的比例与份量,提高 命题的效率和质量。同时,它对于审查试 题的效度也有重要的指导意义。
二、试题改革是推进素质教育 的切入点
全面推进素质教育,要有先进的教育思 想方法,按照教育规律办事;要脚踏实地以 及站在自己祖国坚实的文化土壤上。最关键, 还是要加大教育投入,对基层学校实施素质 教育的要加强教师专业能力建设和教学基本 条件设施建设,深化教育改革,寻找素质教 育的切入点。试题改革是我国推进素质教育 改革的最佳切入点。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第7页/共52页
测验题目的编制
➢ 一、简答题与填空题
➢ 3.编制简答题的一些建议
➢题目措辞时,应使要求的答案简洁具体
➢以其他动物的肉为食的动物是


➢以其他动物的肉为食的动物属于

)类
➢不要直接引用教材上的陈述作为简答题的基 础
➢直接提问通常比不完整的陈述效果更好
第8页/共52页
➢如果答案要以数字单位的形式表示, 请标明要求的答案类型
第17页/共52页
➢除非某种重要的学习结果需要,一般 不使用否定式的题干 ➢下面哪个州不位于回归线以北? ➢下面哪个州位于回归线以南?
➢全部的选项都应与题干在语法上保持 一致
➢除非说明是多选题,否则一个题目应 该只有一个正确或者明显的最佳答案
第18页/共52页
测验题目编制
➢ 三、选择题 ➢ 3.设计选择题的建议 ➢用来测量理解力的题目应该具有一定的新 颖性,但也不要过于新颖 ➢所有的干扰项都应该是似是而非的 ➢选择题中应该有多少个选项?
➢给题目答案留的空白长度应该一样而 且都放在题目的右端
➢使用填空题时,需要学生填的空不要 太多
第9页/共52页
测验题目的编制
➢ 二、是非题 ➢ 1.基本特点 ➢用于测量事实性陈述、术语定义以及 定律表述是否正确的辨认能力
第10页/共52页
➢ 2.优点和局限性
➢优点:
➢效率高 ➢可以获得课程内容的大样本
和方法等重要问题
谁该接受批评?
测验?还是测验的使用者?
第1页/共52页
内容概要
➢ 测验题目的类型及其功能 ➢ 测验题目的编制 ➢ 测验的设计及编制要领
第2页/共52页
测验题目类型与测量功能
➢ 测验题目分类:选择型和供答型。
➢ 选择型一般要求被试在几个选项中选择正确的 答案,如是非题、匹配题、选择题等,后者要 求被试自己提供答案,如论文题、简答题、填 空题等。
➢ 若根据被试作答的范围和评分方法不同, 又可分为主观性试题和客观性试题。
第3页/共52页
➢ 客观性试题主要是因为评分客观而得名,它的正确 答案在测验前就已准备好,不同评分者各自独立评 分,所得结果基本上是相同的。
➢ 客观性试题一般适用于测量知识的掌握、理解、应 用、分析几个层次的教学目标。
➢ 客观性试题的答案明确,作答简便,因而在限定的 时间内测验可以包含足够数量的试题,能保证对知 识内容的覆盖。
➢干扰项在形式上与题干平行,在语 法上与题干一致
➢使干扰项与正确答案在长度、词汇、 句子结构和内容的复杂程度上相似
第21页/共52页
测验题目的编制
➢ 三、选择题 ➢ 3.设计选择题的建议 ➢避免使题干与正确答案之间存在语言联系 ➢不要通过选项的相对长度来提供答案的线索 ➢正确答案出现在选项重的位置应该大致平均 而且是随机的 ➢少用诸如“以上都不对”、“以上都对”的 选项 ➢如果其他题型更合适,就不要使用选择题
第19页/共52页
➢编制具有迷惑性的干扰项的方法 ➢使用学生最常见的错误 ➢使用与题干听起来重要的词,但不要过分 ➢使用那些在口语中与题干相联系的词 ➢使用课本上的语言或者其他具有真理性的 措辞
第20页/共52页
➢使用那些由于学生误解或者是粗心 大意而造成的错误答案➢干扰在内容上与正确答案同质或 者相似
第15页/共52页
➢局限性: ➢局限于对言语水平的测量 ➢难以找到足够多的似是而非的干扰项
第16页/共52页
测验题目的编制
➢ 三、选择题 ➢ 3.设计选择题的建议 ➢题干本身具有意义并以一个确定的问题呈现 ➢南美( ) ➢大多数居住在南美的殖民者来自于( ) ➢题干应包括尽可能多的内容,但与题干无关的 材料应该删去 ➢大多数南美国家的居民是来自西班牙的殖民 者。你将如何解释大量的西班牙殖民者定居 在那里呢?
第5页/共52页
测验题目的编制
➢ 一、简答题与填空题 ➢ 1.基本特点 ➢根据呈现的问题,学生以一个词、短 语、数字或者符号做出回答 ➢适合测量各种相对简单的学习结果 ➢问题答案可以由数字或符号表示的数 学和科学领域(此类问题用选择题的 方式进行测试,可能会不能达到测试 的目的)
第6页/共52页
➢ 2.优点和局限性 ➢优点: ➢容易编制 ➢学生必须提供答案,减少了通过 猜测获得答案的可能 ➢局限性: ➢不适合测量复杂的学习结果 ➢记分的难度
第4页/共52页
➢ 主观性试题主要包括论述题、操作题和作 文题等。
➢ 它们适合于测量较高层次的教学目标,尤 其适合于测量综合、评价等目标层次。
➢ 主观性试题鼓励被试积极地组织所学的资 料,表达自己的观点。被试在作答时,耗 费的时间较长,在限定的时间内,试题数 量不可能太多,对知识的覆盖面较小。由 于没有明确统一的标准答案,评分易受评 阅者的主观因素影响,因而误差较大。
如何正确看待测验?
如果没有测验,将会……
➢ 测验对学生的影响
– 对个人学习努力实施奖赏会更
➢ 产生焦虑
加困难
➢ 把学生分类,并贴上标
– 教育项目中的“优秀”作为目 标更加不可行,并难以实现

– 教育的公平性问题将加剧
➢ 预先期望直接影响自我 实现
– 社会阶级屏障更加不可逾越
– 缺少可靠证据,难以决定课程
➢局限性:
➢测量的学习结果种类有限(大多 为知识领域)
➢具有猜测性
第11页/共52页
测验题目的编制
➢ 二、是非题
➢ 3.编制是非题的一些建议
➢要判断正误,应避免过于宽泛的判断
➢美国总统是选举产生的(

➢美国总统通常是选举产生的


➢避免琐碎的陈述
➢避免使用否定句式,尤其是双重否定
➢避免使用长的复杂句型
第14页/共52页
➢ 2.优点和局限性 ➢优点: ➢较强的灵活性,可以用来测量多种类型的知识 和理解水平的学习内容 ➢在测量各种类型的学业成绩方面有广泛的应用 性 ➢摆脱了其他类型的客观题的局限性 ➢与填空题相比:呈现一个更加明确的问题 ➢与匹配题相比:不需要同质性的材料 ➢与判断题相比:减少了线索和猜测的可能性
第12页/共52页
➢如果不是测量因果关系,应避免在一 个判断中包含两个观点
➢避免使用没有任何来源的观点,除非 要测的是判断观点的能力
➢避免使用长度不一的正确判断和错误 判断
➢避免正确判断和错误判断地数量不合 比率
第13页/共52页
测验题目的编制
➢ 三、选择题
➢ 1.基本特点 ➢由一个问题和一列选项组成 ➢学生答题方式是选择正确的或者最佳 的选项 ➢错误的选项叫干扰项,目的在于干扰 那些知识掌握不牢固的学生答题
相关文档
最新文档