信度、效度、区分度、难度的使用

信度、效度、区分度、难度的使用
信度、效度、区分度、难度的使用

信度、效度、难度、区分度及其在试卷分析中的使用教学测量(instructional measurement)是考核教学成效的一种方法。这是借助于一定的手段与方式,对学生的学习成绩(简称学绩)进行探察,并以一定的数量来表示的考核办法。2. 在教学测量中应注意什么(1)教学测量的目的在于考核教学成效,也就是考察教学目标的完成情况。因此,教学测量的目标应以教学目标为依据,测量目标应与教学目标一致,而不能偏离教学目标(2)教学测量的对象是学生内在的能力与品德等的形成状况,它不可能像物理测量那样直接进行,只能借助于一定的手段与方式间接进行。(3)教学成效是通过量化的学绩进行考察的。也就是说,教学成效是以学生的学习成绩为直接考察依据的,而学绩是以一定的数量来表示的,因此命题的合理性与评分的客观性是有效教学测量的一个重要影响因素

教学评价(instructional evaluation)就是依据教学目标,对学绩测验所得测量结果进行分析及解释。它主要包含以下两个方面的工作。(1)教学评价必须对学绩测验数据所表明的教学成效作出确切的诊断。(2)教学评价必须对教学的成败原因进行分析,并对今后教学工作的改进方面作出明确的规定。评价(估)的功能:为家长提供信息,为选拔提供信息,为学生提供信息,为教师提供信息,为学校(间)提供信息

教学目标,有时也称为行为目标,是指对学生在一段时间教学后应该掌握的技能与概念的陈述。

?信度

信度指的是测量结果的稳定性程度,信度是衡量一个量表质量高低的重要指标。信度不高的量表是不能使用的。3.常见的信度种类(1)重测信度(2)复本信度(3)分半信度(4)同质信度(内部一致性信度)(5)评分者信度

影响信度的因素

?被试

?主试者

?施测情境

?测量工具

信度是指考试的可靠性,即考试结果的可信程度。信度高的试题很少受到外部因素的影响,对任何学生的多次测定都会产生比较稳定的、前后一致的结果。提高试卷信度的因素大致可包括以下几种情况:(1)使用ABC卷随机抽取试题。

(2)教师考前没有划定考试X围。

(3)试题效度高,质量可靠。

(4)考试XX措施可靠。

(5)严格执行考试纪律。

(6)阅卷标准严格、规X、统一。

(7)集体阅卷且实行流水作业,复核认真。

?效度

测验的效度指的是测量的正确性和有效性,即它能够测出所要测量的心理特质与行为特征的程度。换言之,效度指测验能在多大程度上达到测量目的。2.效度的类型:内容效度、构想效度、实证效度

效度指考试的准确性,反映的是考试内容与教学大纲或考试大纲的吻合程度。效度高的试卷,能够较准确地测试出学生掌握和运用所学知识的真实度。根据教学大纲或考试大纲进行命题,且各单元试题分数分配与学时数分配基本保持一致,成正比关系,这是保证考试效度的基础。其它影响效度的因素有:是否在命题的同时制订了试题参考答案与评分标准;是否集体阅卷且实行流水作业;复核是否认真;分数是否真实等。

?难度

难度反映试题的难易程度,即考生在一个试题或一份试卷中的失分程度。一道试题,如果大部分被试都能答对,则该题的难度就小;如果大部分被试都不能答对,则该题的难度就大。一个题目的难度大小,除了所测的内容本身的难易程度有关以外,还与测验的编制技术和被试的知识经验有关,由于学得不清楚或者因被试没学过,一个本来容易的题可能变难。这就是说测验的难度具有相对性,正因为此,必须让试题通过实践来对难度作出检验。

(一)基本公式

1、客观题难度的计算(当人数较少时)

P=R/N

R为答对该试题人数,N为参加测验总人数

适用X围:客观题,只有答对与答错两种可能。(即二分)

?例1:在100个学生中,答对第一题的30人,答对第二题的60人,求第一、二道题的难度?比较这两道题谁比谁难?

2.极端分组法

当被试人数较多时,则可以先将被试依照测验总分从高到低排列,分成三组,总分最高的27%的为高分组(NH)总分最低的27%为低分组。分别计算出高分组与低分组的通过率,然后求项目的难度。公式为

P=(PH+PL)/2

?PH为高分组答对该题的百分比;

?PL为低分组答对该题的百分比。

某区域1000人参加考试,试卷第一题高分组180人答对,低分组60人答对,求该题难度?

3.非二分法记分的项目的难度

如论述题

公式

P=某题平均得分/该题满分

如满分100分的试题,考生平均得分76分,平均失分24分,则难度系数为0.24。其计算公式为:

L=1—X/W

其中,L为难度系数,X为分析组平均得分,W为试卷总分(一般为100分)

?区分度

?(一)区分度的含义

?指测验题目对考生实际水平的区分程度或鉴别能力。

?如一道题,学业水平、实际能力都较高的考生都答对了;而学业水平、实际能力都较低的考生都答错了,则可认为该题目有好的区分度。

?区分度分析主要以效能为依据,考察考生在每个题目上反应与其在效标上的表现之间的相关程度。

?区分度(D)的取值X围介于- 1.00—+1.00之间,值越大,区分度的效果越佳。

?区分度D>0为正区分,D<0为负区分,D=0为零区分

(二)区分度的计算

?1、极端分组法

?(1)客观性试题D=PH-PL

Ph与pl分别为高分组与低分组在该项目上的通过率

例6:有道试题,高分组有70%学生通过,低分组有30%的学生通过;而另一道题,高分组有40%学生通过,低分组有70%学生通过,求两题的各自区分度?

例7一次生物测试中,在100名学生中,高低分组各有27人,其中高分组答对第一题有20人,低分组答对第一题的有5人,这道题的区分度为多少?

?2)主观题D=(XH-XL)/N(H-L)

?XH为高分组得分的总分

?XL为低分组得分的总分

?H为该道题的最高分

?L为该道题的最低分

?N为应试总人数的27%。

区分度反映试题区分不同水平受试者的程度,即考出学生的不同水平,把优秀、一般、差三个层次的学生真正分别开。区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。如果把成绩从高往低排序,前50%的考生为高分组,后50%为低分组,其计算公式为:

D=2(X H—X L)/W

其中,D为区分度,X H为高分组平均分,X L为低分组平均分,W 为试卷总分(一般为100分)。

(三)现代学生评价制度的基本特征

?1、学生评价的功能重点逐步从总结性功能向形成性功能转移;

?2、评价内容从对学生的认知评价扩展为对学生全面综合性的评价;

?3、学生在评价过程中由被动等待评价向主动参与评价发展;

?4、学生评价从关注结果向重视过程发展;

5、在评价方法上,从仅强调测验分数向评价方法的主体、综合、

多层次、全方位发展。

附:

试卷评估等级指标

注:仅供参考

相关主题
相关文档
最新文档