目标参照测验
常模参照测验

常模参照测验:是指以学生团体测验的平均成绩作为参照标准,说明某一学生在团体中的相对位置,将学生分类排队。
重在个人与个人之间的比较,主要用于选拔或编组、编班,要求试题难度适中,尽量对所有学生都有较强的鉴别力和区分度。
常模参照测验以鉴别学生个别差异为指导思想,目的是为了测得学生在所处团体中的相对水平。
常模实际上即是该团体在测验中的平均成绩,学生成绩便是以常模为参照标准来确定的。
这一测验衡量的是学生的相对水平,故其评分属相对评价范畴。
标准参照测验又称目标参照测验,标准参照测验是用来衡量学生是否达到预期教学目标的测验。
测验将个人分数与特定的标准相比较,评价学生是否合格,而不考虑学生在团体中的相对位置,故常用绝对评分方式记分。
标准参照测验是指以体现教育教学目标的标准作业为准,看学生是否达到标准以及达到标准的程度。
它主要不是用于比较个人之间的差异。
如我国高中会考及教师自编测验。
利用它可具体了解学生对某单元的知识、技能的学习和掌握情况。
标准参照测验,它是指依据某种特定操作标准可以直接解释测量结果的测验。
操作标准一般可以通过界定个体所应该完成的任务确定。
对标准参照测验来说,他的分数解释是以界定良好的任务或行为领域为基础的,是与预先设计的特定标准相对照所确定的,有了这个条件,我们便可以从较少的有代表性的测验题目的反应情况,推断出被试的真实水平。
用目标表示领域,并且题目是该领域中行为的有代表性样本,这时目标参照测验就是标准参照测验。
标准参照测验主要用于鉴定的目的。
能力评估与传统评估的不同点之一就在于,原有学习技术系统侧重的是常模参照的评价,而能力导向的评估与认证强调的乃是基于能力标准的评估,而很多能力标准的都用一些模糊的词汇加以描述,比如“理解”“掌握”“能够”,所以在能力评估的过程中也很难把握,很难给其一个质性的评价,所以能力标准的细化描述成为能力评估有效实施的关键。
标准参照测验

标准参照测验标准参照测验是一种通过对被试者进行测试,以确定其在某一特定领域的能力水平的方法。
在各行各业中,标准参照测验被广泛应用于选拔人才、评估学习成绩、确定职业资格等方面。
本文将从标准参照测验的定义、特点、应用领域以及优缺点等方面进行详细介绍。
首先,标准参照测验是一种通过与标准群体进行比较,以确定被试者在某一特定领域的表现水平的测试方法。
标准参照测验的结果通常以百分位数、标准分数等形式呈现,能够清晰地展现被试者在该领域的相对位置。
这种测试方法能够客观地评估被试者的能力水平,为选拔人才、评估学习成绩提供了重要的参考依据。
其次,标准参照测验具有客观性、可比性和标准化的特点。
由于测试结果是通过与标准群体进行比较得出的,因此具有客观性和可比性。
同时,标准参照测验采用标准化的测试程序和评分标准,能够保证测试的公平性和准确性,有效地避免了主观因素的影响。
标准参照测验在各个领域都有着广泛的应用。
在教育领域,标准参照测验被用于评估学生的学习成绩和能力水平,为学校和家长提供了重要的参考依据。
在人力资源管理领域,标准参照测验被用于选拔人才、评定员工的职业能力,帮助企业进行人才管理和培训规划。
在医学领域,标准参照测验被用于评估患者的身体健康状况和心理状态,为临床诊断和治疗提供了重要的参考依据。
然而,标准参照测验也存在着一些局限性。
首先,标准参照测验需要一个代表性的标准群体作为参照,而有些领域的标准群体很难确定,这就限制了标准参照测验的应用范围。
其次,标准参照测验只能提供被试者在相对位置上的表现,不能直接反映其真实的能力水平,因此在解释测试结果时需要注意其局限性。
综上所述,标准参照测验作为一种重要的测试方法,在选拔人才、评估学习成绩、确定职业资格等方面发挥着重要作用。
它具有客观性、可比性和标准化的特点,但也存在着一定的局限性。
在实际应用中,需要根据具体情况综合考虑,合理运用标准参照测验,以达到更好的效果。
常模标准参照测验名词解释

常模标准参照测验名词解释
常模参照测验是指在心理学和教育学中常见的一种测验方法。
它是根据某个特定的标准或参考来评价个体或团体的表现。
常模参照测验通常将个体的分数与某个特定的常模进行比较,以评估个体在特定领域中的相对位置。
常模通常是由一组具有代表性的样本人群组成,这些样本在某个特定的测验或任务中获得一系列分数。
通过统计方法,可以计算出常模中各种百分位数、均值、标准差等指标,从而为后续的个体或团体评估提供参考。
常模参照测验广泛应用于教育、心理学、社会学等领域,例如智商测试、学术能力评估、职业能力测试等。
通过常模参照测验,可以帮助教师、学生、家长等了解个体在同龄人群中的相对表现,从而制定相应的教育计划和学习目标。
除了常模参照测验,还有标准参照测验和相对参照测验等不同的评估方法。
标准参照测验是根据一定的客观标准来评价个体的表现,例如体育比赛中的评分标准。
相对参照测验则是将个体的分数与自己的过去表现或其他个体进行比较,例如个人的年度绩效考核。
需要注意的是,常模参照测验的适用性取决于常模的代表性、测验的可靠性、有效性以及评估目的等因素。
在选择和使用常模参照测验时,应考虑到这些因素,并遵循相应的伦理和法律规定,以保障被试者的权益和隐私。
总之,常模参照测验是一种常见的评估方法,它通过将个体的分数与某个特定的常模进行比较,以评估个体在特定领域中的相对位置。
常模参照测验广泛应用于教育、心理学、社会学等领域,有助于了解个体在同龄人群中的相对表现,并制定相应的教育计划和学习目标。
在使用常模参照测验时,应考虑到其适用性和限制因素,并遵循相关伦理和法律规定。
戴海崎《心理与教育测量》笔记和课后习题详解(目标参照测验)

第10章目标参照测验10.1 复习笔记一、目标参照测验概述(一)目标参照测验的产生从20世纪中期开始,随着常模参照测验模式的局限性(并不是所有的测验都只关心个体间的差异)逐渐被人们发觉,目标参照测验(亦称标准参照测验)应运而生。
1962年戈莱塞(R.Glaser)和克劳斯(D.Klaus)首先提出目标参照测验的概念。
(二)目标参照测验的定义目标参照测验的主要目的在于了解个体在所规定的测量内容上的行为水平,因此其出发点是个体本身的绝对水平,而不再是个体间的水平差异。
戈莱塞认为:“所谓目标参照测验,是根据某一明确界定的内容范围而缜密编制的测验,并且,被试在测验上所得结果,也是根据某一明确界定的行为标准直接进行解释的。
”二、目标参照测验的项目分析(一)内容范围的确定一个测验的内容范围包括所欲测量特质中蕴含的全部行为。
任何一个内容范围都具有一些共同的特点:内容范围具有边界;每一内容范围内容均可分为几类,每一类中又可分为更细更小的类,当每一类的内容及其在此内容范围内的相对重要性确定以后,内容范围就有了明确的结构。
(二)测验项目的内容效度分析目标参照测验的项目分析,首先要对构成测验的每一个题目是否合适以及有效进行分析,即检验题目与测验内容范围所要求的内容与目标的一致性。
这一过程一般缺乏客观的统计分析手段,通常采用专家评定的方法。
专家评定可以采取不同方式,其中比较直观和常用的一种方式是要求有关内容领域的专家填写项目内容评定表,在五级量表上对每个题目所测内容与项目编制者所欲测量的目标内容之间的一致性做出评定,通常情况下,需要同时邀请多位专家进行评定,以考察专家评定之间的一致性。
(三)测验项目的难度和区分度分析1.测验的预测测验编制完成后,须选取一定数量的被试进行预测,由此获得预测数据,然后才能在此数据基础上对项目的难度和区分度进行量化分析。
目标参照测验的预测方法主要有以下三种:(1)前测—后测方法:选取一组被试,在其接受与测验目标内容有关的教学过程前后各施测一次,取得前测和后测的结果,前者表示未掌握者在测验中的水平,后者表示已掌握者的水平。
《目标参照测验》课件

目标参照测验将逐渐应用于跨文化领域中,为不同文化背景的人群 提供更加客观和准确的评估。
标准化与规范化
目标参照测验的标准化和规范化将是未来的重要发展方向,制定统一 的测验标准和规范,提高测验的可靠性和有效性。
THANKS
感谢观看
大数据分析
通过大数据分析,对大量的测验数据进行深入挖掘,发现潜在的规 律和特征,为测验的改进和优化提供科学依据。
虚拟现实技术
虚拟现实技术将为测验提供更加真实和沉浸式的环境,使测验更加 生动有趣,提高测验的参与度和效果。
应用领域的拓展
1 2 3
教育领域
目标参照测验将进一步应用于教育领域中,为学 生的学业评估和教师教学提供更加科学和准确的 依据。
灵活性不足
对于不同学习者或不同学习环境,目标参照 测验可能缺乏足够的灵活性。
高成本
设计和实施目标参照测验需要投入大量时间 和资源。
改进建议
增加多元评估方式
提高测验内容的适应性
结合目标参照测验与其他评估方式,如表 现评估和同行评估,以获得更全面的学习 者表现。
根据不同的学习者或学习环境调整测验内 容,使其更符合实际需求。
03
目标参照测验的应用领域
教育领域
评估学生的学习进度和掌握程度
目标参照测验可以用来评估学生在某一学科或技能上的学习进度和掌握程度,帮助教师了 解学生的学习需求和困难,从而制定针对性的教学计划。
诊断学生的学习问题
通过目标参照测验,教师可以发现学生在学习上的薄弱环节和问题,进而进行针对性的指 导和干预,帮助学生改进学习方法,提高学习效果。
重要性
01
提高评估的准确性和有效性
目标参照测验以个体实际表现为评估标准,能够更准确地反映个体的能
《目标参照测验》课件

分析评价结果
通过分析测验结果,可以获得有关个体表现与评价目标之间的差距的信息。 - 测验结果分析方法及案例
如何应用目标参照测验
目标参照测验的应用非常广泛,以下是一些常见的应用场景: - 学校教学评估 - 企业培训评价 - 个人职业规划
总结
目标参照测验具有一定的局限性,但其未来发展趋势仍然很可观。 - 目标参照测验的局限性 - 目标参照测验的未来发展趋势 感谢观看!
《目标参照测验》PPT课 件
目标参照测验是一种评估方法,通过将个体的表现与预先设定的目标进行比 标的比较,评估个体在特定领域的表现。 - 目标参照测验的定义 - 目标参照测验的优点
测验过程
1. 确定评价目标 2. 定义测验环境 3. 确定评价标准 4. 制定测验题型 5. 编写测验题目 6. 安排测验时间和地点 7. 进行测验
第七章 测验分数的解释与应用

按照行为发生的一定顺序来判断发展的正常 与否
皮亚杰量表
用特定的任务来揭示儿童发展处于哪个阶段
格塞尔发展顺序量表 格塞尔认为,婴幼儿的行为系统的建立是一个有次序 的过程,反映了神经系统的不断成长和功能的分化, 因而可以把每个成熟阶段的行为模式作为智能诊断的 依据。
4周 不能控制 头部,仰 卧姿势左 右不对称 16周 28周 40周 可独坐, 爬行,扶 着物件站 立 52周 搀一手 行走, 摇摆 颈可竖直, 扶起独 头微摇动, 坐,身 体前倾 仰卧姿势 左右对称
2、年级当量(grade equivalents)
即年级常模,用年级代替年龄,指把学生的
测验成绩与各年级学生的平均成绩比较,看他
相当于几年级的水平。
年级常模的单位通常为10个月间隔。如5年级 的分布为5.0到5.9,5.0表示五年级的初始水 平,5.5则表示五年级中期的平均成绩。
3、 发展顺序量表(ordinal scales)
缺点: 单位不等,尤其在分配的两个极端 只具有顺序性,属于顺序量表,不能做加减乘 除运算,无法通知来说明不同被试之间分数差 异的数量 两个不同样本中的百分等级不能相互比较
2、标准分数
什么是标准分数? 有哪些特点? 如何计算?
标准分数又称Z分数,这是等距量表中最常用
的一ent referenced score) 内容参照又叫范围参照,是看被试对指定 范围中的内容和技能掌握得如何。 内容参照分数特别适用于计算机辅助教学 以及利用程序教材自我掌握进度的学习 内容参照分数主要用于成就测验以及能确 定出可接受的最低标准的资格测验
在编制内容参照测验和对此各测验分数做 解释时有两个主要步骤: 一是确定测验所包含的知识或技能的范围 二是编造一个能报道测验成绩的量表
目标参照测验

• 2、对照组法
– 临界水平被试难以界定,改用对照组法,即用 专家界定出掌握组与未掌握组两组被试,将测 验用于这些被试,然后将两组成绩绘制两分布 曲线,其交点即为合格分数线。此法被试较上 法易找,但同样依据于经验,被试选择会影响 分界点的确定,改善方法:① 多找一些组对用 其均值;② 找教学与否组代替掌握与否组,但 被认为更不准确;③由于依赖专家,因此多找 专家,综合各方的意见,更稳妥一些。
二、专家判定法
• 1、理论依据:
– 据临界水平被试在各项目上正确作答产可能性 ,进而推断整卷的合格分数线,即临界点。其 中“临界水平被试”是虚拟的,正确作答可能 性是据专家经验推测的。
• 2、Nedelsky 方法(1954)—适用于选择题
– ① 判断临界水平被试在每一试题上的正确作答 概率,方法是先判断其可排除几个错误选项, 然后再作概率估计。如选 四选一,若能排除一 个错误选项,则正确作答概率为0.33,若能排 除两个错误选项,正确作答概率为0.5。 – ② 在每一题的正确作答概率都确定后,将每一 题的正确作答概率以题分加权求和,即可得整 λ 卷分界点, =∑ Fi Pi – ③ 若能由各位专家分别评定则以各位专家评定 分数的均数为最终分界点。
• 信度及其估计 • 效度及其估计
一、信度及其估计
• 1、信度定义: 不变。 • 2、常模测验信度不适用目标测验的原因:
– 相关系数信度高低与被试团体分布有关,被试 异质性越强,信度越高,目标测验不在于鉴别 被试差异,因而分数分布相对集中,即使测验 可靠稳定,其相关也不高,因此相关信度不适 用于目标测验。
四、测验分数的解释
• 两种测验模式不同,但分数解释可以配合 使用,即常模式解释可以同时用于目标测 验,特别是既对被试绝对水平感兴趣,又 对其相对水平感兴趣时,更可以配合使用 ,如标准分数,百分等级等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 4、方差分析方法——荷伊特信度
– 公式:
– 评价:由于此式不受被试分布及测验目标影响, 可用于目标参照测验,又因为不涉及合格线, 因1、目标测验要求有明确的内容范围,要求 试题严格限制在内容范围之内,且有最充 分代表性,因此,内容效度是目标对参照 性测验关心的重点,评估计方法与常模测 验方法相同。
• 3、Angoff方法(1971)
– Angoff方法省却专家判断被试可排除的选项的 步骤,直接判断正答概率。然后用 λ=∑ F P 求分 界点。此法适用于任何题型,专家评定较自由 ,因而此法更受欢迎,但专家评定正答概率的 先验依据也就较少了。
i i
三、效标组预测法
• 1、临界组法:
– 将测验施测于一批临界水平被试,用平均值作 为合格分数线。困难是临界水平被试较难界定 ,要找一批更加困难。
• 2、难度差值指标:
• ① 掌握组—非掌握组鉴别指数(D)。 • ② 个人获得指数(DIG)
• 3、相关系数
– 常模参照测验中常用相关系数作项目区分度指 标,在目标参照测验中同样可以使用,方法也 是一样的,但只有负值题才淘汰,对低值题还 是要视其内容重要性决定取舍。
第三节 目标参照测验的信度与效度
第二节 目标参照测验的项目分析
• • • • 一、内容范围的界定 二、测验项目的内容效度分析 三、难度分析 四、区分度分析
1、内容范围界定的意义
• ① 目标参照测验本身的要求,要有明确的 内容范围。 • ② 项目分析的需要以至测验总体的评价都 要以内容的界定作前提。
2、内容范围的特点
• ① 内容范围有边界:边界有大,有小,须 界定。 • ② 内容范围中的内容可以分类、分层。每 一类每一层有其相对地位,划分清楚类层 及地位,如此构成内容的结构。 • ③ 明确了内容范围的边界和其内部结构, 则认为内容范围得到了明确的界定。
• 2、效标关联效度
– 目标测验的目的在于鉴别人的合格与某测验施 测鉴别结果是否准确应以客观评价为准,因此, 目标测验的效标关联效度成为测验评价与客观 评价一致性程度指标,可用两次评价一致的人 数在总人数中的比作为效度,也称为“决策效 度”。具体算法类似于表10.5,只是其中一次 为客观评价的合格与否。
二、专家判定法
• 1、理论依据:
– 据临界水平被试在各项目上正确作答产可能性 ,进而推断整卷的合格分数线,即临界点。其 中“临界水平被试”是虚拟的,正确作答可能 性是据专家经验推测的。
• 2、Nedelsky 方法(1954)—适用于选择题
– ① 判断临界水平被试在每一试题上的正确作答 概率,方法是先判断其可排除几个错误选项, 然后再作概率估计。如选 四选一,若能排除一 个错误选项,则正确作答概率为0.33,若能排 除两个错误选项,正确作答概率为0.5。 – ② 在每一题的正确作答概率都确定后,将每一 题的正确作答概率以题分加权求和,即可得整 λ 卷分界点, =∑ Fi Pi – ③ 若能由各位专家分别评定则以各位专家评定 分数的均数为最终分界点。
– 以个体有未达到一客观的标准来评价个体行为 的测验
• 2、从测验的编制角度定义—(R.Glaser,1971)
– “目标参照测验是根据某一明确界定的内容范 围而缜密编制的测验,并且被试在测验上所得 结果,也是根据某一明确界定的行为标准直接 进行解释的。”
Glaser的定义强调“内容范围”与 “行为标准”两词
目标参照性测验
第一节 概述
• 一、目标参照测验的意义 • 二、目标参照测验的定义
一、目标参照测验的意义
• 1、产生于实际需要。 • 2、发展的原因是常模参照测验无法胜任这 一任务。 • 3、目标参照测验应用广泛,且副作用较小, 有利于素质教育,有利于教育大面积丰收。
二、目标参照测验的定义
• 1、从评价参照标准来定义
第四节 分界点确定法
• • • • • 一、分界点确定的意义 二、专家判定法 三、效标组预测法 四、测验分数的解释 五、试卷结构调整法决定分界点
一、分界点确定的意义
• 1、知识的掌握是一个程度问题,理论上不 存在一个非常明确的合格点。 • 2、实际中都非常需要对被试的某种技能、 技术、专业知识能力作出合格与否的界定 。 • 3、上述两点的结果是需要划分界点确又非 常困难,现有方法很多,但各有缺点。
• ① 内容范围在测验编制之前就必须明确界定,最好 有操作性定义。 • ② 内容范围包括知识内容范围和能力目标范围两个 方面。 • ③ 测验试题应在内容范围之内,并且是所有属此内 容范围内试题的一个有充分代表性的样本,否则评 价是不准确的。 • ④ “行为标准”是一客观的、稳定的,被指为“已 掌握这一内容范围”的最低标准。 • ⑤ “行为”标准从统计上说就是一条合格分数线, 也称“分界点”。
3、内容范围界定的依据和方法
• 特定测验目的是界定的依据。
– (A) 如某专业资格测验,可以通过该工作分析 来界定,测验内容范围。 – (B) 教学测验可通过教材、大纲来界定,测验 内容范围。 – 形式就是测验双向细目表。
二、测验项目的内容效度分析
• 1、分析目的:检验所命试题的内容是否与 测验内容范围所规定的内容一致。 • 2、分析方法:专家评定法。 该专家对测题所测内容与测题编制者宣称 要测量的目标内容间的一致性进行评价。
• 2、对照组法
– 临界水平被试难以界定,改用对照组法,即用 专家界定出掌握组与未掌握组两组被试,将测 验用于这些被试,然后将两组成绩绘制两分布 曲线,其交点即为合格分数线。此法被试较上 法易找,但同样依据于经验,被试选择会影响 分界点的确定,改善方法:① 多找一些组对用 其均值;② 找教学与否组代替掌握与否组,但 被认为更不准确;③由于依赖专家,因此多找 专家,综合各方的意见,更稳妥一些。
• 3、分类一致性信度估计(P0)
– (A) 目标测验关心的产对被试合格与否的分类是 否一致,分类一致性指标成为目标测验的信度 是顺理成章的。 – (B) 方法: ① 测试采用复测法或复本法;② 统计 以合格线为界分别进行。③ 计算在两次测试中 分数一致人数(两次均及格或两次均表格人数) 在总人数中之比。 – (C) 评价:① 越大,信度越高,意义明确,计 算简单。 ② 但再测、复本的测试缺陷存在。③ 依赖于合格分数线的准确划分 。
三、难度分析
• 1、目标参照测验的难度计算与常模测验 的难度计算采用同一种方法。 • 2、有人认为,目标参照测验中属内容范 围中不可缺少题目并不在乎它是难还是易, 都要测。 • 3、计算目的:(A) 分析区分度的基础;(B) 调整合格分数线的参考值。
四、区分度分析
• 1、数据采集方法:
• ① 前测—后测法:同一项目对同一组被试在学 习之前之后分别测试一次。 • ② 学过组—非学过组法:同一项目对学过组和 非学过组被试各测一次。 • ③ 对照组法,掌握组—非掌握组法:同一项目 对两组被试各施测一次。 • 第③种方法被认为是对①、②两法的改进,但 分组依赖于都是的经验判断。
四、测验分数的解释
• 两种测验模式不同,但分数解释可以配合 使用,即常模式解释可以同时用于目标测 验,特别是既对被试绝对水平感兴趣,又 对其相对水平感兴趣时,更可以配合使用 ,如标准分数,百分等级等。
五、试卷结构调整法决定分界点
• 1、前面所介绍的方法都是根据试卷实际情 况来确定分界点,但在实践中,象我国都 有另一种特殊要求,这就是合格分数线有 一条,即60分,所以必须调整试卷结构, 使合格线恰好在60分以上。 • 2、调整试卷结构的含义:调整与合格标准 有关的各项指标结构比例:常见的有难度 、教学目标、内容范围、内容重要性、题 目类型等等。一般内容范围是不变的,题 型的影响不大,所以可调的是难度和教学 目标。
• 信度及其估计 • 效度及其估计
一、信度及其估计
• 1、信度定义: 不变。 • 2、常模测验信度不适用目标测验的原因:
– 相关系数信度高低与被试团体分布有关,被试 异质性越强,信度越高,目标测验不在于鉴别 被试差异,因而分数分布相对集中,即使测验 可靠稳定,其相关也不高,因此相关信度不适 用于目标测验。