试卷效度等
【最新精选】试题的难度、区分度、信度和效度

试卷的难度、区分度、信度和效度一.试卷的难度(一)什么是难度难度是指试卷的难易程度,是评价考试的一个非常重要的一个指标。
一个题目,如果大部分考生都能答对,那么这个题目的难度就小;如果大部分考生都不能答对,那么这个题目的难度就大。
客观题难度计算公式:P(难度指数)=试卷答对人数/考生人数;主观题难度计算公式:P=试卷平均得分/试卷满分。
试卷难度计算公式:P=为平均分,K 为试卷满分值。
易、中、难的标准为:易:P≥0.7,中:0.4≤P≤0.69,难:P≤0.39;P值越大,难度越低,P值越小,难度越高。
一般来说,难度值平均在0.5最佳,难度值过高或过低,都会降低测验的信度。
(二)难度的计算(1)客观性试卷难度P(这时也称通过率)计算公式:P=k/N(k为答对该题的人数,N为参加测验的总人数)(2)主观性试卷难度P计算公式:P=X/M(X为试卷平均得分;M为试卷满分)(3)适用于主、客观试卷的计算公式:P=(P H+P L)/2(P H、P L分别为试卷针对高分组和低分组考生的难度值)步骤为:①将考生的总分由高至低排列;②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的27%作为低分组;④计算。
(三)试卷难度的一般要求就高考来说,难度以适中为宜,单个试卷的难度以0.3--0.7之间为好,整卷以0.5--0.6之间为最佳。
一般将难度值大于和等于0.7的试卷定为容易题;大于0.4和小于0.7的定为中档题;小于和等于0.4的试卷定为难题。
命题时难度一般要按一定比例分配,如3:6:1或3:5:2。
二.试卷的区分度(一)什么是区分度区分度是指考试卷目对考生心理特征的区分能力。
区分度高的试卷能将不同水平的考生区分开来,水平高的考生得高分,水平低的考生得低分。
区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。
试题设计的五个标准分别是:效度,信度,区分度,实用性,

试题设计的五个标准分别是:效度,信度,区分度,实用性,及影响。
一.效度是指测量的有效性,也就是看考试是否考查了想要考查的内容。
二.信度是指考试结果准确,稳定,可靠的程度。
这要求有不同的评卷人阅卷,所得分数大致相同;同一评卷人在不同的时间阅卷,分数大致相同。
三.区分度就是可以进行比较。
四.实用性是指要便于使用。
试题清晰,醒目,措辞简洁,避免拼法错误或遗漏,尽量少涉及各种器材设备。
五.影响分为积极和消极两种。
积极影响:帮助学生发现问题,积极督促。
消极影响:会造成考什么学什么的结果。
试题要体现新一轮基础教育课程改革的基本理念,落实《英语课程标准》所确立的考试指导思想。
考试要有利于全面贯彻国家教育方针,推进素质教育;有利于体现九年义务教育的性质,全面提高教育质量;有利于英语课程改革,提高英语教学质量, 培养学生的创新精神和实践能力,减轻学生过重的课业负担,促进学生生动活泼、主动学习。
英语试题要落实知识与能力、过程与方法、情感态度与价值观三维课程目标,要依据《英语课程标准》来确定考查内容和标准,既重视考查学生对英语基础知识与基本技能的掌握情况,更重视考查学生在具体情境中综合运用语言的能力,考试内容不应与任何教材的具体内容直接挂钩。
在试卷设计上要遵循教育测量的基本原理,坚持以交际语言测试为主,分离测试、综合测试等多种测试并存,力求在语篇层次上,在尽可能真实情景中,以互动的形式测试学生的综合语言运用能力;不仅要关注试卷信度,更要注重试卷的效度;在力求试卷结构简约的同时,确保考查内容的覆盖面,杜绝繁、偏、旧试题,科学控制题量和难度。
要坚持“以能力立意为主、知识立意为辅”的原则,根据语言实际使用情形命题,适当增大主观性、开放性试题的比重,尽可能避免命制以词或句为语言单位的试题,不应在脱离语境的情况下单独考查微观语言知识。
在选择语言素材时,要充分考虑学生的实际生活和身心发展水平、地域以及文化差异,选用真实、地道、形式多样的语言素材。
试卷分析:信度、效度、难度和区分度

附件6、难度、区分度、信度和效度的一般说明一、难度难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。
一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。
1、难度的两种定义(1)P=1-x/w其中:x为某题得分的平均分数,w为该题的满分。
这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。
(2)P=x/w这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。
2、难度的计算(1)主观性试题的难度A、基本公式法:P=1-x/wB、极端分组法P=1-(XH+XL)/2W其中:XH为高分组的平均得分(前27%),XL为低分组的平均得分(后27%)。
(2)客观性试题的难度A、基本公式法:P=1-R/N其中:R为答对人数,N为全体人数。
B 极端分组法:P=1-(PH+PL)/2其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n为总人数的前27%。
PL=RL/n 叫低分组通过率,RL为低分组答对人数。
二、区分度区分度是区分应试者能力水平高低的指标。
试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分。
而区分度低则反映不出不同应试者的水平差异。
试题的区分度与试题的难度直接相关。
通常来说,中等难度的试题区分度较大。
另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。
1、区分度指标的评价-1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。
一般认为,区分度指数高于0.3,试题便可以被接受。
2、区分度的计算方法(1)基本公式法:D=(H-L)/N其中:D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之和。
试卷效度等

与试题编制相关的概念----难度系数、区分度、信度与效度教研之窗2008-03-14 11:25:00阅读21 评论0 字号:大中小订阅一、试题的难度:试题的难度指的是试题的难易程度。
试卷的难度指的是试题的平均难度。
难度系数计算方法:1、客观试题难度系数计算方法(二分法计分题目的难度):P=R/N,其中P为难度系数,R为答对人数,N为总人数。
2、主观性试题的难度系数计算方法(非二分法计分题目的难度):难度系数=平均分/总分。
中考试题平均难度系数:0.55~0.60之间,不能超过0.79。
二、试题的区分度:试题的区分度是指题目对考生实际水平的区分程度。
区分度高的题目,能够较好地区分学生的实际水平。
在这样的题目上,能力高的学生得高分,能力低的学生得低分。
区分度低的题目,不同能力的学生得分差别不大。
如果在某些题目上,能力高的学生得低分,能力低的学生得高分,那么这样的题目非但没有区分度,反而干扰了整个试卷的有效性和可靠性。
区分度主要用与评价以选择为目的的试题。
用于评价学业成就的试题则无需考虑区分度,即使区分度很低,只要教育者认为是重要的内容也可以选用。
对于学业考试,并不是所有的题都要求有区分度。
需要对学生能力鉴别的题目才需要有区分度。
鉴别率指数:鉴别率指数是高分组的通过率与低分组的通过率的差值。
D值越高,区分度越大。
-1≤D≤1,当D=1时,说明高分组的同学100%通过,低分组的同学通过率为0.当D=0时,高分组好低分组的学生通过率相同,试题没有区分度。
一般情况下,试题的区分度D值大于0.3时,题目可以接受了。
高低分数组的划分:一般情况下,根据试卷总分将考生排队,从高分端好低分端分别取27%的考生组成高分组好低分组,其余46%的考生不作分析。
当样本团体过小时,划分的比例可以适当提高。
三. 信度是指其可信度,既是在多大程度上是正确的,效度是指能够多有效的表示所需表达的含义。
以一份量表(测量智力,记忆力之类的标准化试卷)为例,其信度就是指同一个人在几次参加同一份试卷的考试(假设此人并未有改变)分数不会有大的差异,而效度是指这份试卷能够多大程度测量你的智力水平。
试卷效度等

与试题编制相关的概念----难度系数、区分度、信度与效度教研之窗 2008-03-14 11:25:00 阅读21 评论0 字号:大中小订阅一、试题的难度:试题的难度指的是试题的难易程度。
试卷的难度指的是试题的平均难度。
难度系数计算方法:1、客观试题难度系数计算方法(二分法计分题目的难度):P=R/N,其中P为难度系数,R为答对人数,N为总人数。
2、主观性试题的难度系数计算方法(非二分法计分题目的难度):难度系数=平均分/总分。
中考试题平均难度系数:0.55~0.60之间,不能超过0.79。
二、试题的区分度:试题的区分度是指题目对考生实际水平的区分程度。
区分度高的题目,能够较好地区分学生的实际水平。
在这样的题目上,能力高的学生得高分,能力低的学生得低分。
区分度低的题目,不同能力的学生得分差别不大。
如果在某些题目上,能力高的学生得低分,能力低的学生得高分,那么这样的题目非但没有区分度,反而干扰了整个试卷的有效性和可靠性。
区分度主要用与评价以选择为目的的试题。
用于评价学业成就的试题则无需考虑区分度,即使区分度很低,只要教育者认为是重要的内容也可以选用。
对于学业考试,并不是所有的题都要求有区分度。
需要对学生能力鉴别的题目才需要有区分度。
鉴别率指数:鉴别率指数是高分组的通过率与低分组的通过率的差值。
D值越高,区分度越大。
-1≤D≤ 1,当D=1时,说明高分组的同学100%通过,低分组的同学通过率为0.当D=0时,高分组好低分组的学生通过率相同,试题没有区分度。
一般情况下,试题的区分度D值大于0.3时,题目可以接受了。
高低分数组的划分:一般情况下,根据试卷总分将考生排队,从高分端好低分端分别取27%的考生组成高分组好低分组,其余46%的考生不作分析。
当样本团体过小时,划分的比例可以适当提高。
三. 信度是指其可信度,既是在多大程度上是正确的,效度是指能够多有效的表示所需表达的含义。
以一份量表(测量智力,记忆力之类的标准化试卷)为例,其信度就是指同一个人在几次参加同一份试卷的考试(假设此人并未有改变)分数不会有大的差异,而效度是指这份试卷能够多大程度测量你的智力水平。
期末试卷分析报告(含信度、效度、难度、区分度)

期末试卷分析报告(含信度、效度、难度、区分度)本次学年末五年级数学考试使用了乌市教研室统一命题,全市统一监考、阅卷的方式。
试卷包含了判断题、选择题、填空题、计算题和解决问题等五个部分。
总体来说,学生的检测成绩属于正常水平,班级之间的差别不大,但也存在许多问题。
学生的基础概念掌握情况不够扎实,失分率相对较高,个别学生读题不够仔细。
对于一些稍微灵活和比较灵活的知识点,学生失分则相对较多。
数据统计表一按低中高不同分数段划分,表二则是按题型划分。
从表一可以看出,总体上学生的成绩比较平均,但也有一些人成绩较低。
从表二可以看出,学生在判断、选择和填空题方面表现较好,但在计算和解决问题方面存在较多问题。
具体分析中,判断、选择、填空题部分学生完成情况较为理想,但仍有一些错误。
而在计算和解决问题部分,学生的失分率较高,主要集中在计算和规范答题的问题上。
对于解决问题部分,大部分学生的失分较少,但在处理稍微灵活和比较灵活的知识点时,学生失分则相对较多。
例如,对于“第三题有一张长方形的纸,长70厘米,宽50厘米。
如果要剪成同样大小的正方形而没有剩余,剪出的正方形的边长最大是多少”这道题,学生缺乏全面思考的能力,不能够灵活处理,给自己的解答造成了一定的困扰。
总之,本次考试中,学生的基础概念掌握情况需要加强,口算能力也需要提高。
在解决问题方面,学生需要加强对知识点的理解,提高思维灵活性。
中发现问题,思考解决方法,培养创新思维。
6、加强家校合作,让家长了解学生的研究情况,及时与教师沟通,共同关注学生的研究进展。
7、在教学中注重基础概念的讲解和理解,通过例题和练巩固学生对基础概念的掌握,提高学生的严谨性和扩展性。
8、在考试中加强监考,严格执行考试纪律,防止作弊和抄袭现象的发生,保证考试的公平性和公正性。
9、在日常教学中,注重培养学生的研究惯和思维惯,引导学生形成良好的研究态度和惯,为学生的未来发展打下坚实的基础。
在教育中,我们需要引导学生发现问题、提出问题并解决问题,以提高他们的思考能力和培养创新精神。
考卷效度等

考卷效度等文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]与试题编制相关的概念----难度系数、区分度、信度与效度教研之窗 2008-03-14 11:25:00 阅读21 评论0 字号:大中小订阅一、试题的难度:试题的难度指的是试题的难易程度。
试卷的难度指的是试题的平均难度。
难度系数计算方法:1、客观试题难度系数计算方法(二分法计分题目的难度):P=R/N,其中P为难度系数,R为答对人数,N为总人数。
2、主观性试题的难度系数计算方法(非二分法计分题目的难度):难度系数=平均分/总分。
中考试题平均难度系数:~之间,不能超过。
二、试题的区分度:试题的区分度是指题目对考生实际水平的区分程度。
区分度高的题目,能够较好地区分学生的实际水平。
在这样的题目上,能力高的学生得高分,能力低的学生得低分。
区分度低的题目,不同能力的学生得分差别不大。
如果在某些题目上,能力高的学生得低分,能力低的学生得高分,那么这样的题目非但没有区分度,反而干扰了整个试卷的有效性和可靠性。
区分度主要用与评价以选择为目的的试题。
用于评价学业成就的试题则无需考虑区分度,即使区分度很低,只要教育者认为是重要的内容也可以选用。
对于学业考试,并不是所有的题都要求有区分度。
需要对学生能力鉴别的题目才需要有区分度。
鉴别率指数:鉴别率指数是高分组的通过率与低分组的通过率的差值。
D值越高,区分度越大。
-1≤D≤ 1,当D=1时,说明高分组的同学100%通过,低分组的同学通过率为0.当D=0时,高分组好低分组的学生通过率相同,试题没有区分度。
一般情况下,试题的区分度D值大于时,题目可以接受了。
高低分数组的划分:一般情况下,根据试卷总分将考生排队,从高分端好低分端分别取27%的考生组成高分组好低分组,其余46%的考生不作分析。
当样本团体过小时,划分的比例可以适当提高。
三. 信度是指其可信度,既是在多大程度上是正确的,效度是指能够多有效的表示所需表达的含义。
试卷效度等

与试题编制相关的概念----难度系数、区分度、信度与效度教研之窗2008-03-1411:25:00阅读21评论0字号:大中小订阅一、试题的难度:试题的难度指的是试题的难易程度。
试卷的难度指的是试题的平均难度。
难度系数计算方法:1、客观试题难度系数计算方法(二分法计分题目的难度):P=R/N,其中P为难度系数,R为答对人数,N为总人数。
2、主观性试题的难度系数计算方法(非二分法计分题目的难度):难度系数=平均分/总分。
中考试题平均难度系数:0.55~0.60之间,不能超过0.79。
二、试题的区分度:试题的区分度是指题目对考生实际水平的区分程度。
区分度高的题目,能够较好地区分学生的实际水平。
在这样的题目上,能力高的学生得高分,能力低的学生得低分。
区分度低的题目,不同能力的学生得分差别不大。
如果在某些题目上,能力高的学生得低分,能力低的学生得高分,那么这样的题目非但没有区分度,反而干扰了整个试卷的有效性和可靠性。
区分度主要用与评价以选择为目的的试题。
用于评价学业成就的试题则无需考虑区分度,即使区分度很低,只要教育者认为是重要的内容也可以选用。
对于学业考试,并不是所有的题都要求有区分度。
需要对学生能力鉴别的题目才需要有区分度。
鉴别率指数:鉴别率指数是高分组的通过率与低分组的通过率的差值。
D值越高,区分度越大。
-1≤D≤ 1,当D=1时,说明高分组的同学100%通过,低分组的同学通过率为0.当D=0时,高分组好低分组的学生通过率相同,试题没有区分度。
一般情况下,试题的区分度D值大于0.3时,题目可以接受了。
高低分数组的划分:一般情况下,根据试卷总分将考生排队,从高分端好低分端分别取27%的考生组成高分组好低分组,其余46%的考生不作分析。
当样本团体过小时,划分的比例可以适当提高。
三. 信度是指其可信度,既是在多大程度上是正确的,效度是指能够多有效的表示所需表达的含义。
以一份量表(测量智力,记忆力之类的标准化试卷)为例,其信度就是指同一个人在几次参加同一份试卷的考试(假设此人并未有改变)分数不会有大的差异,而效度是指这份试卷能够多大程度测量你的智力水平。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
与试题编制相关的概念----难度系数、区分度、信度与效度教研之窗2008-03-14 11:25:00 阅读21 评论0 字号:大中小订阅一、试题的难度:试题的难度指的是试题的难易程度。
试卷的难度指的是试题的平均难度。
难度系数计算方法:1、客观试题难度系数计算方法(二分法计分题目的难度):P=R/N,其中P为难度系数,R为答对人数,N为总人数。
2、主观性试题的难度系数计算方法(非二分法计分题目的难度):难度系数=平均分/总分。
中考试题平均难度系数:0.55~0.60之间,不能超过0.79。
二、试题的区分度:试题的区分度是指题目对考生实际水平的区分程度。
区分度高的题目,能够较好地区分学生的实际水平。
在这样的题目上,能力高的学生得高分,能力低的学生得低分。
区分度低的题目,不同能力的学生得分差别不大。
如果在某些题目上,能力高的学生得低分,能力低的学生得高分,那么这样的题目非但没有区分度,反而干扰了整个试卷的有效性和可靠性。
区分度主要用与评价以选择为目的的试题。
用于评价学业成就的试题则无需考虑区分度,即使区分度很低,只要教育者认为是重要的内容也可以选用。
对于学业考试,并不是所有的题都要求有区分度。
需要对学生能力鉴别的题目才需要有区分度。
鉴别率指数:鉴别率指数是高分组的通过率与低分组的通过率的差值。
D值越高,区分度越大。
-1≤D≤1,当D=1时,说明高分组的同学100%通过,低分组的同学通过率为0.当D=0时,高分组好低分组的学生通过率相同,试题没有区分度。
一般情况下,试题的区分度D值大于0.3时,题目可以接受了。
高低分数组的划分:一般情况下,根据试卷总分将考生排队,从高分端好低分端分别取27%的考生组成高分组好低分组,其余46%的考生不作分析。
当样本团体过小时,划分的比例可以适当提高。
三. 信度是指其可信度,既是在多大程度上是正确的,效度是指能够多有效的表示所需表达的含义。
以一份量表(测量智力,记忆力之类的标准化试卷)为例,其信度就是指同一个人在几次参加同一份试卷的考试(假设此人并未有改变)分数不会有大的差异,而效度是指这份试卷能够多大程度测量你的智力水平。
信度指的是测量结果的稳定性和可靠性。
由于一个人的知识和能力水平是相对稳定的,在相当一段时间内不会发生太大的变化,所以一份试卷若能够真实反映学生的知识和能力水平的话,那么考试结果也应该是稳定的。
信度高的试卷就好比一把尺子,只要操作方法得当,无论何时、何人去测量同一张桌子的高度,所得到的结果应该是基本一致的。
如果所用的是一种具有较大弹性的皮尺,则不同的人或同一个人在不同的时候去测同一张桌子的高度,其结果会有较大的差异。
所以,为避免试卷中出现此类误差,必须检验其信度。
四、效度试题的难度系数与区分度分析教研之窗2010-11-26 22:05:04 阅读35 评论1 字号:大中小订阅一、试题的难度分析:难度系数(P)=该题平均分/该题满分,P值越大,题目越容易,难度越低。
当考生的人数较多时,可以根据时间的总分分成三组:分数最高的27%为高分组,分数最低的27%为低分组,中间的46%为中间组。
例如:某同学想用一只开关控制两只灯泡,要求开关闭合时,只有一只灯泡发光,断开开关时两只灯泡均发光,则下面的电路图正确的是(B)组别各选项选择百分数(%)A B C D总体7 80 2 11高分组0 100 0 0低分组7 57 4 32该组有80%的人通过,表明这道题目偏容易(难度系数为0.8),选项分析的结果表明,对正确选项B,高分组的选择率为100%,低分组的选择率与高分组有一定的差距;而且对D 选项,高分组每人选,而低分组有32%的人选择,说明D选项对低分组的学生很有迷惑性,对高分组不具有迷惑性。
总体来看,该题是可以接受的,如果能对C选项进行适当的修改提高试题的迷惑性的话,该题更有效。
二、试题的区分度:主要用于评价以选拔为目的的考题。
鉴别力指数:D=高分组通过率(PH)-低分组通过率(PL)。
D值越高,题目越有效。
鉴别力指数高于0.4以上区分度很好,0.3~0.39良好。
0.2~0.29,尚可,须改进。
小于0.2区分度很差。
下面的例子说明如何对题目进行区分度分析:按照提示,填出课文原文:1、开发大西北,我们实施了退耕还林、退耕还草的绿色生态战略。
可以料想,不久的将来,古人吟唱的“_____,______,_____________”的良好生态环境必将在大西北重现。
(用《敕勒歌》中词句填写)2、美国大唱所谓的“人权”,其实是_______________,目的在于干涉他国内政。
(用《醉翁亭记》中的一句话填写)区分度结果分析上面两个小题的区分度(鉴别力指数)都达到了非常优良的水平,能够很好地对不同能力的考生进行区分。
难度与区分度、信度、效度浏览量:15277 发表日期: 2008-3-7 来自: 市教育局办公室【字体:大中小】平均分(mean)表示考试分数的集中趋势的一种统计量,也是教育测量中使用最为广泛的一种统计指标。
平均分一般计算公式:(公式01)式中,为平均分;为学生I的考试分数;N为参加考试的学生数。
平均分的基本作用在于它可以作为一组分数的典型代表,其代表性优于中数、众数。
平均分数具有下列基本性质:平均分是由全部分数求出的。
●每个分数与平均分的离差之和等于零,说明平均分数是各个分数的中心。
●当分数分布呈正态时,平均分位于分布曲线的中点并和曲线的最高点相对应。
●各个分数与平均分数的离差的平方和比各个分数与其他任何集中量数的离差的平方和都小。
难度(difficulty)难度与区分度、信度、效度并称为“考试四度”,是控制考试质量的一个重要指标,也是试卷编制中特别关注的一个要素。
难度又有试题难度和考试难度之分,前者是反映题目难易程度的量化指标,有时也称作试题难度系数,通常用该题目的答对率或平均得分率表示,而后者则是所有试题难易的综合反映,在考试分数控制、成绩解释上更为重要。
●试题难度试题难度值与试题实际难易程度正好相反,越大表示试题越容易,而难度制越小则试题越难。
试题越难(试题难度值越小),说明能够正确解答该题的学生越少,或该题的得分越低。
主观题(答对得分、答错不得分)的试题难度用答对题目的人数与参加考试总人数的比值表示:(公式02)式中:为i试题难度,为答对该题人数,为总人数。
而试题使用连续分数计分时,试题难度则用参加考试的全体学生在该题的平均得分与该题满分的比值表示:(公式03)式中:为i试题难度,为该题平均得分,为该题满分值。
在试卷编制中,不同难度的试题在考试中扮演着不同的角色,不同难度试题的组和不但直接影响试卷难度和平均分数,进而影响对考生成绩的解释,还对成绩分布具有重要影响,从而影响考试深层的质量特性。
为了确保每一道试题在考试中发挥应有的作用,一般将试题难度值控制在一定的范围内,通常是在0.50.2之间。
考试难度又称试卷平均难度或加权试卷平均难度,其计算公式:(公式04)式中:P为考试难度,为i题的加权系数,为i题的试题难度。
因为, ,可以证明:(公式05)因此,计算考试平均分数后,可以通过上式方便地算出考试难度。
标准差(standard)它是描述一组分数离散情况的最常用、最可靠的统计量数,标准查核平均分一样,也是计算其他统计量数时常用的基本数据之一。
计算公式:(公式06)式中各符号与公式01意义相同。
利用标准差对试题质量进行初步评价时,主要是看学生考试分数的离散情况是否与学生以往学习成绩的实际分布一致。
如果学生学习成绩比较整齐,考试结果分数分布应相对集中,此时分数的标准差较小才符合学生的实际情况;相反,如果学生成绩参差不齐,考试分数的标准差较大才符合学生的实际情况。
只有当标准差表明的考试分数的离散情况与被测学生群体的实际情况一致时,试题质量才有可能是合格的。
区分度(discrimination)测量理论对考试的区分度十分重视,称之为判断考试是否有效的指示器,并作为评价试题质量、对试题进行筛选的主要依据。
●区分度概念指考试对学业水平不同的学生区分程度或鉴别能力。
某一道试题在学业水平、实际能力较高的学生都能答对,而学业水平、实际能力较低的学生都答错,则认为该题目有好的区分度(试题区分度)。
具有良好区分度的试题组成的试卷,实际水平高的学生应该能够获得较好的成绩,实际水平低的学生应该不能通过获得分较低。
研究发现:当考试是以选拔为主要目的时,具备良好的区分度的考试才会满足考试效度要求;考试的信度随考试区分度的提高而增加,且前者的增加速率更快;试题的难度与区分度关系密切,在难度接近于0.5时,区分度量值接近最大,但区分度相同的考试其难度值可能不同。
在编制是卷时,难度小的试题主要区分低分组学生,难度大的试题区分高分组学生,为适应对全部参考学生都能区分,需要对试卷中全部试题的难度、区分度做综合考虑。
试题区分度与试题难度一样,属于试题库建设题目优化的控制指标,本文仅提及而不做讨论。
●区分度计算最常用的计算方法是极端分组法,该方法计算简单,适合一般考试的总体区分度分析。
该方法是通过比较两个极端效标组(高分组和低分组)的差异来估计试题区分度的。
计算如下:(公式07)式中,为区分度,和分别为高分组、低分组学生的平均得分,M为该次考的满分值。
高分组和低分组的划分是将考试学生的成绩由高到低的顺序依次排序,然后取其上端一部分为高分组,取其下端一部分为低分组。
对于极端分组的人数应占全部被测学生多大比例要视成绩分布的具体情况而定,如果考试成绩分布符合正态分布,则高分组和低分组最佳比例均为27%;如果考试成绩分布较平坦则比例应略高于27%;反之比例可低一些;一般情况下,其比例值介于25%—33%之间。
●测量结果的评价使用上述算法,通常考试区分度数值应大于0.2。
考试信度(reliability)评价考试结果的稳定性是用考试信度(或测验信度)估计的。
由于任何考试结果都因考试误差的客观存在而受到或多或少的影响,因此百分之百可信的考试几乎无法得到。
考试信度就是推测考试可信与否的最重要量化指标。
实际测量中多采用分半信度和同质性信度两种算法。
●分半信度采用分半法(split-half reliability)考试信度是将考试施测于某被试总体,然后将考试分半,再求被试在每一半考试上的分数的一致性程度。
具体方法是将奇数题组成一个部分,偶数题构成奇数题的复本。
计算两半考试得分的皮尔逊相关系数(Pearson’s product moment correlation)(公式08),再采用Spearman-brown公式(公式09)矫正。
(公式08)(公式09)为皮尔逊相关系数(又称为分半信度),为矫正后的信度估计值,为配对后某对奇数题、偶数题得分值,为成对试题数目。