第10章 标准参照测验
戴海崎《心理与教育测量》(第3版)课后习题(第10章 目标参照测验——第12章 智力测验(上))【圣

第10章目标参照测验1.请根据表10.3中专家评定结果的平均数对表中14道题目的内容效度进行评定,并决定题目取舍。
答:从表10.3的结果中,可以直接分析每一道题目的内容效度并进而决定题目的取舍:(1)若以中数为基础进行分析,表中第2、7、14题均是针对目标内容l而编制的,经专家评定,这三题所测内容均和其目标内容之间具有完美的匹配(等级评定中数均为5);同理,第4、12、5、11题的内容效度亦得到很高的评价。
因此,这七道题目无疑可以原封不动地保留下来。
再看,第1、3、6、9题所测内容与其目标内容之间的匹配程度分别被评定为较好(中数为3)或很好(中数为4),说明这四题也还是可取的,只需根据专家意见略作修改即可,最后,第8、13、10题的内容效度一般(中数为2)或较差(中数为1),说明这三题没有能够很好地反映出其欲测的目标内容,内容效度很低或根本不具备内容效度,一般需作较大的修改或删除。
(2)若以均值为基础进行分析,得到的结果与上述以中数为基础进行分析的结果是十分类同的。
(3)为了增加参加评定的专家们之间的一致性,也可根据每位专家在所有题目上所评等级与中数间的差异量来决定专家的取舍。
如表所示,第二位专家在所有题目上所评等级与各中数间的差异之和为24,说明该专家的评定结果与其他8位专家之间具有较大的差异,因此可以不考虑这位专家的意见,只保留8位专家的评定结果,在此基础上得到均值和中数等统计数据并进一步决定题目的取舍。
2.目标参照测验的题目区分度可以通过哪些方法来确定?答:测验项目的区分度一般采取两类指标:难度差值和相关系数。
(1)难度差值①掌握组——未掌握组鉴别指数(D)a.分别计算掌握者和未掌握者两组在某项目上的平均通过率,记为P A和P B,则该项目的鉴别指数为:K=P A-P B。
b.鉴别指数D的大小,可以直观反映出该项目在多大程度上对掌握者和未掌握者作出了区分。
D值从-1.00到+1.00之间变化,越接近于+1.00,题目区分度越高。
标准参照测验

标准参照测验标准参照测验是一种通过对被试者进行测试,以确定其在某一特定领域的能力水平的方法。
在各行各业中,标准参照测验被广泛应用于选拔人才、评估学习成绩、确定职业资格等方面。
本文将从标准参照测验的定义、特点、应用领域以及优缺点等方面进行详细介绍。
首先,标准参照测验是一种通过与标准群体进行比较,以确定被试者在某一特定领域的表现水平的测试方法。
标准参照测验的结果通常以百分位数、标准分数等形式呈现,能够清晰地展现被试者在该领域的相对位置。
这种测试方法能够客观地评估被试者的能力水平,为选拔人才、评估学习成绩提供了重要的参考依据。
其次,标准参照测验具有客观性、可比性和标准化的特点。
由于测试结果是通过与标准群体进行比较得出的,因此具有客观性和可比性。
同时,标准参照测验采用标准化的测试程序和评分标准,能够保证测试的公平性和准确性,有效地避免了主观因素的影响。
标准参照测验在各个领域都有着广泛的应用。
在教育领域,标准参照测验被用于评估学生的学习成绩和能力水平,为学校和家长提供了重要的参考依据。
在人力资源管理领域,标准参照测验被用于选拔人才、评定员工的职业能力,帮助企业进行人才管理和培训规划。
在医学领域,标准参照测验被用于评估患者的身体健康状况和心理状态,为临床诊断和治疗提供了重要的参考依据。
然而,标准参照测验也存在着一些局限性。
首先,标准参照测验需要一个代表性的标准群体作为参照,而有些领域的标准群体很难确定,这就限制了标准参照测验的应用范围。
其次,标准参照测验只能提供被试者在相对位置上的表现,不能直接反映其真实的能力水平,因此在解释测试结果时需要注意其局限性。
综上所述,标准参照测验作为一种重要的测试方法,在选拔人才、评估学习成绩、确定职业资格等方面发挥着重要作用。
它具有客观性、可比性和标准化的特点,但也存在着一定的局限性。
在实际应用中,需要根据具体情况综合考虑,合理运用标准参照测验,以达到更好的效果。
戴海崎《心理与教育测量》笔记和课后习题详解(目标参照测验)

第10章目标参照测验10.1 复习笔记一、目标参照测验概述(一)目标参照测验的产生从20世纪中期开始,随着常模参照测验模式的局限性(并不是所有的测验都只关心个体间的差异)逐渐被人们发觉,目标参照测验(亦称标准参照测验)应运而生。
1962年戈莱塞(R.Glaser)和克劳斯(D.Klaus)首先提出目标参照测验的概念。
(二)目标参照测验的定义目标参照测验的主要目的在于了解个体在所规定的测量内容上的行为水平,因此其出发点是个体本身的绝对水平,而不再是个体间的水平差异。
戈莱塞认为:“所谓目标参照测验,是根据某一明确界定的内容范围而缜密编制的测验,并且,被试在测验上所得结果,也是根据某一明确界定的行为标准直接进行解释的。
”二、目标参照测验的项目分析(一)内容范围的确定一个测验的内容范围包括所欲测量特质中蕴含的全部行为。
任何一个内容范围都具有一些共同的特点:内容范围具有边界;每一内容范围内容均可分为几类,每一类中又可分为更细更小的类,当每一类的内容及其在此内容范围内的相对重要性确定以后,内容范围就有了明确的结构。
(二)测验项目的内容效度分析目标参照测验的项目分析,首先要对构成测验的每一个题目是否合适以及有效进行分析,即检验题目与测验内容范围所要求的内容与目标的一致性。
这一过程一般缺乏客观的统计分析手段,通常采用专家评定的方法。
专家评定可以采取不同方式,其中比较直观和常用的一种方式是要求有关内容领域的专家填写项目内容评定表,在五级量表上对每个题目所测内容与项目编制者所欲测量的目标内容之间的一致性做出评定,通常情况下,需要同时邀请多位专家进行评定,以考察专家评定之间的一致性。
(三)测验项目的难度和区分度分析1.测验的预测测验编制完成后,须选取一定数量的被试进行预测,由此获得预测数据,然后才能在此数据基础上对项目的难度和区分度进行量化分析。
目标参照测验的预测方法主要有以下三种:(1)前测—后测方法:选取一组被试,在其接受与测验目标内容有关的教学过程前后各施测一次,取得前测和后测的结果,前者表示未掌握者在测验中的水平,后者表示已掌握者的水平。
智慧树答案教育测量与评价知到课后答案章节测试2022年

第一章1.根据教育目标的要求,按照一定的规则对教育活动的效果加以数量化测定的过程叫做()。
答案:教育测量2.其数值可以进行加、减、乘、除运算的量表是()。
答案:定比变量3.将抽象的定义转化为操作性定义,可以测量概念。
答案:对4.测量是一种()的过程。
答案:纯客观5.以下哪种说法正确()。
答案:斯塔弗尔比姆认为,评价应“有助于更好地执行和改进我们的方案”。
他强调:“评价最重要的意图不是为了证明,而是为了改进”。
;泰勒将教育评价解释为:“确定教育目标在实际上被理解到何种程度的过程。
”;我国学者陈玉琨认为:“教育评价是对教育活动满足社会与个体需要的程度做出判断的活动。
”;克龙巴赫则认为:“评价是为决策提供信息的过程。
”6.第一个较为完整的教育评价模式()。
答案:目标达成模式7.以下哪些属于现代教育评价的主要模式()。
答案:应答模式;CIPP模式;目标游离模式;泰勒的目标达成模式8.被称为教育评价的催生剂的是美国的一项著名研究,它是()。
答案:八年研究9.现代教育评价的发展阶段包括()。
答案:开创时期;专业时期;大发展时期10.属于教育测量的工具有()。
答案:量表;李克特量表第二章1.()指测量结果的可信程度或者稳定性程度。
答案:信度2.用某量表测验10名学生,得分记为X,为考察测量结果的可靠性,于16天后用原量表对这10名同学再测一次,得分记为Y,计算该测验的信度。
(其中X总和为659,Y总和为676,X·Y总和为46742,X的平方总和为47449,Y的平方总和为48256)答案:0.683.5名被试在某测验(共6道题)上的得分情况:第1题方差为3.76;第2题方差为0.4;第3题方差为1.36;第4~5题方差为1.84;第6题方差为2.00;第1位被试总分为17;第2位被试总分为28;第3位被试总分为16;第4位被试总分为19;第5位被试总分为17。
求该测验的信度系数。
(请用微课中克龙巴赫α系数的计算公式进行计算)答案:0.514.当评分者人数为两人时,评分者信度可用肯德尔和谐系数进行估计。
第十章目标参照测验ppt课件

Thank you!
① 对照组法,掌握组—非掌握组法 含义:同一项目对两组被试各实施一次。
第三种方法被认为是第一二两法的改进,但分组依赖于 教师评定,都是经验判断。
测验项目的难度分析
1. 目标参照测验的难度计算与常模测验的难度计算采 用同一种方法。
2. 有人认为,目标参照测验中属于内容范围中不可或 缺题目,并不在它是难还是易,都要测。
目标参照测验的定义
有许多定义,但是戈莱塞在1971年对于目 标参照测验的描述与界定被广泛的接受。
“所谓的目标参照测验,是根据某一明确 界定的内容范围而缜密编制的测验,并且,被 试在测验中所得结果,也是根据某一明确界定 的行为标准直接进行解释的。”
理解:特别强调“内容范围”,“行为标准”两 个词。
3. 计算目的:分析区分度的基础。
测验项目的区分度分析
难度差值指标:
① 掌握组—非掌握组鉴别指数(D)。 计算公式:D=PA-PB 其中PA 为掌握组的得分率,PB为非掌握组的得分率。
D值越大,区分度越高。
① 个人获得指数(DIG)。 • 一般用在前测—后测方法中。 • 计算方法为:前测中错误回答某项目而在后测中 能够正确回答的被试人数的比例。范围在[0,1]之 间。 • 局限:未考虑前测中通过而后测中失败的被试
测验项目的内容效度分析
A. 分析目的: 检验所命试题家评定法,填写项目内容鉴定表。
测验项目的难度和区分度分析
测验的预测(数据搜集方法)
① 前测—后测法 含义:同一项目对同一组被试在学习之前之后分别
测试一次。
① 学过组—非学过组法 含义:通过一项目对学过和非学过组被试各测一次。
标准参照测验

标准参照测验标准参照测验是一种常见的测验方式,它通过对被试者的表现与特定标准进行比较,从而评估被试者的能力水平。
本文将从测验的定义、特点、设计和应用等方面进行介绍。
首先,标准参照测验是一种以标准为参照物的测验方法,其目的是通过对被试者的表现与特定标准进行比较,从而评估被试者的能力水平。
与常见的等级参照测验相比,标准参照测验更注重对被试者在特定领域的表现进行量化评估,而非简单地进行排名或分类。
其次,标准参照测验具有以下特点,一是相对性。
标准参照测验的评分标准是相对固定的,被试者的得分是通过与标准进行比较而确定的。
二是客观性。
由于评分标准相对固定,标准参照测验的评分更加客观,减少了主观因素的干扰。
三是量化评估。
标准参照测验更注重对被试者在特定领域的表现进行量化评估,能够更准确地反映被试者的能力水平。
在标准参照测验的设计中,需要考虑以下几个方面,一是确定评分标准。
评分标准应该具有客观性和公正性,能够准确地反映被试者的能力水平。
二是选择合适的测验内容和形式。
测验内容应该与被试者所处领域的实际情况相符合,测验形式应该能够有效地评估被试者的能力水平。
三是进行试题的编制和抽样。
试题的编制需要考虑到不同能力水平的被试者,抽样也需要符合统计学的原则,能够有效地代表整个被试者群体。
标准参照测验在实际应用中具有广泛的意义。
一是在教育领域中,标准参照测验能够更准确地评估学生的学习成绩和能力水平,为学校和家长提供客观的参考。
二是在人力资源管理中,标准参照测验能够帮助企业更科学地评估员工的能力和潜力,为人才选拔和培训提供依据。
三是在医学领域中,标准参照测验能够帮助医生评估患者的健康状况和疾病风险,为临床诊断和治疗提供依据。
综上所述,标准参照测验是一种以标准为参照物的测验方法,具有相对性、客观性和量化评估的特点。
在设计和应用中,需要考虑评分标准、测验内容和形式以及试题的编制和抽样等方面。
在教育、人力资源管理和医学等领域中具有广泛的应用前景。
第十章 目标参照测验1

二、测验项目的内容效度分析
专家评定法(教材表10-2,10-3) 结合以前学过的常模参照测验的内容效 度分析来进行对比学习
三、测验项目的难度和区分度分析
1。测验的预测 (1)前测-后测方法(一组被试) (2)已接受教学组-未接受教学组方法(两组被 试) (3)对照组方法(两组被试) 2。测验项目的难度分析 目标参照测验的项目难度计算与常模参照测验相 同,一般以通过率来表示。往往并不必要。
St
适用项目是0、1记分(或二分变量),而效标或测验 总分是连续变量的数量资料。
(2)二列相关
Xp - Xq pq
rb=
•
St
y
Xp - Xt p
或 rb=
•
St
y
适用于连续的测量变量。但其中一个变量被人为二分。
(3)φ 相关 ad-bc
rφ= √(a+b)(c+d)(a+c)(b+d)
适用于φ相关的统计方法适用于两个变量都是点分配的资料,即两个变 量都是二分名义变量。在有些情况下,一些连续变量也可以用此方法计算 相关程度。φ相关不要求变量呈正态分布。
回忆常模参照测验的难度分析(注重适中值) 目标参照测验项目难度的计算,大多情况下只是 作为项目区分度分析的基础。
3。测验项目的区分度分析 注意与常模参照测验的对比
(1A-PB D的大小,可以直接反映出该项目在多大程度上对未掌握者和掌 握者作出了区分。D值从-1.00到+ 1.00之间变化,越接近于+ 1.00, 题目区分度越高,说明题目越有效。
(1)积差相关系数
当预测分和效标分都是连续变量时,可采用积差相关 系数的计算方法来求得测验的效度系数。
例:假设有10名男性经职业兴趣测验而被选定作为推 销员,其测验分数下表第一行,而第二行是经过若干年后 他们某段时间内销售金额总量(以万元为单位)。现问该测 验的预测效度如何?
心理与教育测量第十章

– 内容范围界定的依据和方法
• 特定测验目的是界定的依据。
• (A) 如某专业资格测验,可以通过该工作分析来界 定,测验内容范围。
• (B) 教学测验可通过教材、大纲来界定,测验内容 范围。
• 形式就是测验双向细目表。由三个要素组成:一是 考查目标;考查内容;每一类内容和每一种目标相 结合后在整个内容范围中所占的比重(即重要性)。 如下表:
(一) Nedelsky方法
– ① 判断临界水平被试在每一试题上的正确作答 概率,方法是先判断其可排除几个错误选项, 然后再作概率估计。
• 如选四选一,若能排除一个错误选项,则正确作答 概率为0.33,若能排除两个错误选项,正确作答概 率为0.5。
– ② 在每一题的正确作答概率都确定后,将每一 题的正确作答概率以题分加权求和,即可得整 卷分界点,即
• 相关系数接近0,一般不予保留,但应视该项目所测 内容在内容范围中的重要性而决定其取舍。
第三节 目标参照测验的信度与效度
• 信度及其估计
– 定义:与常模参照测验的信度定义一致。 – 计算:
• 不能采用相关系数法求取信度,原因:相关系数信 度高低与被试团体的特质水平分布有关,被试异质 性越强,信度越高,目标参照测验不在于鉴别被试 差异,因而分数分布相对集中,即使测验可靠稳定, 其相关也不高,因此相关系数不适用于目标参照测 验。
(三)Ebel方法
• 步骤
– 首先请评判者把题目的难度区分为若干等级。 – 然后依据题目的代表性程度将题目分成若干等
级。 – 再由专家估计临界被试答对某一代表性程度、
某一困难等级题目的百分比。 – 计算划界分数。 – 如果有多个专家参加,则划界分数为所有评估
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
能够排除的反应数; ❖ 第二步,记录下剩余的反应数的倒数; ❖ 第三步,将该份测验中所有项目的倒数的和记为A,
作为该专家确定的临界水平考生的可能分数; ❖ 最后一步,对所有专家的A值进行平均,即为最低
通过分数。
❖ (三)Angoff方法
一、判断法
Nedelsky 方法
整体 判断法
Angoff 修正法
判断法
Ebel 方法
Angoff 方法
❖ (一)整体判断法
心理测量学
一、判断法
❖ 每位专家从整体上对测验和内容范围进行判断,提 出符合标准的最低能力水平被试正确回答的项目的 比例。然后将所有专家的分数平均,作为划界分数。
心理测量学
一、判断法
心理测量学
一、标准参照测验的定义
❖ 若已知测验分数和某个外部效标有关,则可用被试 在效标上的表现直接解释测验分数,这种测验被称 为结果参照测验(result-referenced test)。
心理测量学
二、标准参照测验的编制
心理测量学
三、标准参照测验的用途
用途
各类教育水平 、职业水平测 试,采取了标 准参照测验的 编制、施测、 记分和解释模 式
(二)测验项目的区分度分析
D P甲 P乙
心理测量学
一、标准参照测验的项目分析
(二)测验项目的区分度分析
心理测量学
二、标准参照测验的信度
分类一致 性信度
荷伊特 信度
心理测量学
二、标准参照测验的信度
(一)分类一致性信度
bc PO N
PO Pe PO PAPB qAqB
1 Pe 1 PAPB qAqB
第十章 标准参照测验
心理测量学
引子
▪ 够水平的通过,不够水平的通不过 ▪ 不够水平的通过了,够水平的没过
1 标准参照测验概述
心理测量学
目录
2 标准参照测验的信、效度与误差控制 3 划界分数设置方法与被试评价
心理测量学
第六章 标准参照测验的设计与编制
1
标准参照测验概述
心理测量学
第一节 标准参照测验概述
心理测量学
二、实证法
❖ Glass(1978)将9年级学生测验成绩的中位数作为 一所中学毕业证书考试的最低标准;
❖ 有人采取低于团体平均水平一个标准差的方法确定 截点;
❖ Block(1972)提出一种“教育效果法”,试图建立 测验分数与学习效果的函数关系,他提出存在一条 S型的学习曲线,分界分数在曲线的拐点周围;
心理测量学
一、判断法
❖ (四)Ebel方法
心理测量学
一、判断法
பைடு நூலகம்
心理测量学
一、判断法
❖ (五)Angoff修正法
❖ 这种方法划分了与Ebel方法不同的两个维度,一个 维度为被试完成测题所需要的能力(如记忆和理解 等),另一个维度是每题的测量目标(如词汇、语 法和阅读理解等)。然后计算划界分数与Ebel方法 的过程就一样了。
性。
❖ 如果题目对要考察的内容范围有良好的代表性,即 使通过率很高或很低也应该保留下来;
❖ 如果题目相对要考察的内容范围而言,不具备很好 的代表性,即使中等左右通过率的题目也应修改或 删除。
心理测量学
一、标准参照测验的项目分析
(二)测验项目的区分度分析
D P后测 P前测
心理测量学
一、标准参照测验的项目分析
心理测量学
二、标准参照测验的信度
(一)分类一致性信度
(二)荷伊特信度
心理测量学
二、标准参照测验的信度
rxx
1
MS人题 MS人
内容
心理测量学
三、标准参照测验的效度
结构
绩效
从内容入手寻找 效度证据,可以 借助专家判断的 方法,也可以通 过经验规律、统 计等方法进行分 析。
从理论结构入手 寻找效度证据有 几种方法,常见 的有聚合效度法、 区分效度法和因 素分析法,其中 又以因素分析法 最为常用。
心理测量学
三、综合法
❖ (二)对照组法 ❖ 1.选择熟悉被试的专家; ❖ 2.让专家判断一组被试为掌握组,另一组被试为非
掌握组,不太容易判断的被试一概剔除; ❖ 3.对两组被试进行施测; ❖ 4.在同一坐标系上画出两个被试组的分数分布图
(见图6-6); ❖ 5.将两个组的交叉点设置为划界分数。
❖ (二)对照组法
心理测量学
三、综合法
心理测量学
三、综合法
❖ (三)Jaeger方法 ❖ 1. 每位专家先完成这份测验。 ❖ 2. 每位专家对问题“当地每个要毕业的中学生都应能正确回
答这道题吗?”作“是”或“否”回答。 ❖ 3. 确定每组专家所建议的通过分数分布,计算每组专家中各
项目的是-否反应数目。 ❖ 4. 告诉每位专家一组11年级的学生(比毕业生低一个年级)
广泛应用于教 育教学实践, 如教师自编测 验、自定进度 的教学系统等
心理测量学
第六章 标准参照测验的设计与编制
2
标准参照测验的信、效度与误差控制
心理测量学
第二节 标准参照测验的信、效度与误差控制
效
项 目 分
信 度 分 析
度 分 析
析
心理测量学
一、标准参照测验的项目分析
(一)测验项目的难度分析 ❖ 标准参照测验对题目难度的要求则侧重题目的代表
❖ 还有人提出,当通过率与达标比率一致时,可以采 用通过率确定及格线的参考标准。
心理测量学
三、综合法
临
对
Jaeger
界
照
方
组
组
法
法
法
❖(一)临界组法
心理测量学
三、综合法
❖ 1982年,Livingston和Zeiley提出由专家判断和选择 一组正处于临界水平的被试,将测验施测于该组被 试,计算他们在测验上的平均成绩,以确定测验的 内容范围所要求的临界水平。
用
编
定
途
制
义
心理测量学
一、标准参照测验的定义
❖ 戈莱塞(1971):“所谓标准参照测验,是根据某 一明确界定的内容范围而缜密编制的测验,并且, 被试在测验中所得结果,也是根据某一明确界定的 行为标准直接进行解释的”。
❖ 当使用的标准是用内容材料定义的,即为掌握某领 域知识和技能的比例,这时测验就被称为内容参照 测验(domain-referenced test)。
相关系数大小受 分数分布的影响, 不适用于标准参 照测验。下张介 绍一下标准参照 测验通过绩效或 结果来验证效度 的评估方法。
心理测量学
三、标准参照测验的效度
心理测量学
第六章 标准参照测验的设计与编制
3 划界分数设置方法与被试评价
心理测量学
第三节 划界分数设置方法与被试评价
判
实
综
断
证
合
法
法
法
心理测量学