第四章 测验信度作业
测验的信度练习试卷1(题后含答案及解析)

测验的信度练习试卷1(题后含答案及解析)题型有:1.jpg />其中rxx代表测验的信度,代表测验中实得分数的变异,代表对测验中真分数的变异。
因此,测验中真分数造成的变异应该为测验信度(rxx),即80%。
知识模块:测验的信度5.对信度的评估方法()。
A.有统一通用的原则B.没有一个统一通用的原则C.可用一种信度系数就能说明信度的不同方面D.要用多种信度系数来说明信度的总的方面正确答案:B解析:对信度的评估方法是没有通用法则的,因为不同的信度反映测验误差的不同来源,故每一种信度系数只能说明信度的不同方面,因而具有不同的意义。
知识模块:测验的信度6.在计算重测信度时,两次施测的间隔时间不宜太短,是为了避免()。
A.被试学习经验的积累B.被试身心状况的发展变化C.被试出现遗忘D.练习效应正确答案:D解析:重测信度估计两次测试的时间间隔要恰当,间隔时间太长,被试品质发生了变化,会造成低估测验信度,间隔时间太短,练习和记忆会造成高估测验信度。
知识模块:测验的信度7.对重测信度的理解正确的是()。
A.使用同一测验,在不同条件下,对同一组被试前后两次实施之间的相关系数B.使用同一测验,在同样条件下,对同一组被试前后两次实施之间的相关系数C.使用同一测验,在同样条件下,对不同被试前后两次实施之间的相关系数D.使用不同的测验,在不同条件下,对同一组被试前后两次实施之间的相关系数正确答案:B解析:重测信度考察的是时间因素对信度的影响,因此只有两次施测仅有时间因素不同,才可以将测验成绩的变化归因为时间因素。
因此,重测信度是在除了时间不同以外,其他条件都相同的条件下,被试两次测验的相关系数。
知识模块:测验的信度8.同质性信度()。
A.是检验测验内部所有题目的一致性B.是用同一测验重复测量的一致性程度C.是检验两个测验在内容上的等质性D.主要指测验题目的内容和形式,而不论其正、负相关性正确答案:A解析:同质性主要代表测验内部所有题目间的一致性。
信度和效度练习题答案

信度和效度练习题答案1.关于测验的信度与效度的关系,说法正确的是()。
A.测验有信度,一定有效度B.测验有信度,一定没有效度C.信度与效度是正相关的D.效度高,信度一定高1.【答案】D。
解析:本题考查测验的信度与效度的关系。
其中效度是指一个测验或测量工具能真实的测量出所要测量的事物的程度。
信度主要测量结果的前后一致性程度。
具体表现为:效度高,信度一定高;效度低,信度不一定;信度低,效度一定低;信度高,效度不一定高。
A选项,信度高,效度不一定高。
因此,此说法错误。
B选项,信度高,效度不一定高。
因此,此说法错误。
C选项,信度与效度的关系具体表现为:效度高,信度一定高;效度低,信度不一定;信度低,效度一定低;信度高,效度不一定高。
因此,选项说法不正确。
D选项,效度高,信度一定高。
故说法正确。
综合上所述,本题正确答案是D。
2.柴也愚,参也鲁,师也辟,由也喭。
该古语体现的教学原则是()。
A.因材施教B.循序渐进C.启发性原则D.巩固性原则2.【答案】A。
解析:本题考查教学原则。
A选项,因材施教原则,是指教师要从学生的实际情况、个别差异出发,有的放矢地进行教学,使每个学生都能扬长避短,获得最佳发展。
B选项,循序渐进原则,要求教师严格按照科学知识的内在逻辑体系和学生认识能力发展的顺序来进行教学。
C选项,启发性原则要求教师充分调动学生学习的主动性、积极性,引导学生独立思考,积极探索,生动活泼地学习。
不符合题意,排除。
D选项,巩固性原则,是指教师要引导学生在理解的基础上牢固地掌握知识和基本技能,并使其长久地保存在记忆中,能根据需要迅速再现出来,以利于对知识、技能的运用。
不符合题意,排除。
题干中,高柴愚笨,曾参迟钝,颛孙师偏激,仲由鲁莽。
他们也是日常生活中有缺点的平凡人,但他们经过针对性的教育后,却都各有一番长进。
由此可知,体现的是因材施教。
本题正确答案是A。
3.【判断】班级授课制是近代教学主要的教学组织形式,因此,班级授课制没有任何缺点。
第四章信度

第四章信度一、什么是信度含义:指的是测量结果的稳定性程度(或叫可靠性)。
也指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。
1、理论定义:测验实测值和真值的相差程度。
2、操作定义:定义1:一组测量分数的真分数变异数(方差)与总变异数(总方差、实得分数的方差)的比率,或者是真实分数方差占总方差的的百分比。
计算公式:rxx=ST2/SX2定义2:信度乃是一个被试团体的真分数与实得分数的相关系数的平方。
即rxx=ρTx2定义3:信度乃是一个测验X(A卷)与它的任意一个“平行测验”X’(B卷)的相关系数。
即rxx=ρxx’二、信度的类型及估计方法(一)重测信度1、含义与计算又称稳定性系数。
他的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。
三、信度的类型及估计方法(一)重测信度(再测信度)例:15名同学在1个月间隔内,先后2次重复施测某测验,测验结果如表中所列,请根据这些数据对该测验的重测信度进行计算。
三、信度的类型及估计方法(一)重测信度三、信度的类型及估计方法(一)重测信度可见,这两次测验分数之间有较高的正相关,该测验有较高的重测信度。
2、使用的前提条件(1)所测量的心理特性必须是稳定的。
(2)遗忘和练习的效果基本上相互抵消。
(3)在时间间隔中没有学习另外的与测验有关的东西,或者说每人学习其他东西的程度都一样。
3、优缺点:优点:(1)它最符合重复测验的涵义,是重复测验最简单最明确的方式。
(2)首测和再测只需要一套测验题目,省时、省力。
(3)同一套题目无论施测几次,所测的属性是完全相同的。
缺点:(1)同一组被试对同一个测验先后两次作答相互之间是不独立的。
(2)如果两次施测时间间隔较长,在此期间被试的身心发展,新知识的获得,都会使两次测验结果不相同。
(3)同一个被试对现一个测验先后两次作答,对测验的兴趣不同,影响测验结果。
第四章 测验的信度与效度

复本信度的计算举例
10名学生创造力的复本测验结果
ABCDE FGH I J X1 20 19 18 18 17 16 14 12 12 10 X2 20 20 19 16 16 17 12 11 13 9
❖ 3、注意事项
要构造真正的平行测验 ❖ 复本测验必须在题目的内容、数量、形式、难度、 区分度、指导语、时限以及所用的例题、公式、测验 其它方面都相同或相似。
=0.95
• 如在评定中有相同的等级时,用下式校正。其中n为 相同等级的个数
R i2 R i 2/N
W 1 2K2N2NK n3n/12
25
四、信度对测验分数的意义 ❖ 1、解释真实分数与实得分数的相关
信度系数可以解释为测验的总变异中,真分数造成的变 异占百分之几。如,当rxx=0.90时,我们可以说实得分 数中有90%的变异是真分数造成的,仅10%来自测验的误 差。rxx=1.00,则表示完全没有测量误差,所有的变异 均来自真实分数;同样,信度系数也告诉测量的误差比 例是多少。
27
❖ 3、解释个人分数的意义(区间估计)
从信度可以解释个人分数的意义,这就是测量标准误的 应用。它有两个作用 其一是估计真实分数的范围;其 二是了解实得分数再测时可能的变化情形。
28
❖ 由于误差的存在,一个人通过测量得到的分数很难 等于真分数。理论上,我们可以对一个人施测无数 次,然后求得所得分数的平均数和标准差。在这个 假设的分布里,平均数就是这个人的真分数,标准 差则为误差大小的指标。
rxx= 2rhh 1 rhh
18
变异数不相等:
弗朗那根(Flanagan)公式:
rxx=2
1
sa2
sx2
sb2
心理与教育测量第四章

编辑ppt
16
+ 评价
– 优点:能提供有关测验是否随时间而变异的资 料,可作为被试将来行为表现的依据。
– 缺点:难以消除记忆和练习及学习的影响;难 以取得被试的全面合作。
编辑ppt
①“名片效应” ②“光环效应” ③“对比效应” ④“先后效应”
– 环境与组织管理的影响。
编辑ppt
35
+ 控制论文式试题评分误差的方法。
– 命题进尽量控制作答的发散范围,预先制定好 评分规则,并尽是客观、精细,但不吹毛求疵。
– 选择和培训阅卷人员,统一评分标准,规范阅 卷行为。
– 流水作业评分。 – 分因素评分。
+ 评价
– 优点:只需施测一次便能求取信度。 – 缺点:有些题目,很难分为对等的两半,比如
语文考试里的作文,就没办法分半;分半方法 很多,所估信度很可能有差异。
编辑ppt
25
四、同质性信度
+ 定义
– 测验内部所有题目间的一致性程度。 一致性包 含两重含义:
所有题目都是测同一种心理特质。 所有题目得分之间都有较高的正相关。 两者的关系:正相关高是同质性高的必要而非充分
信度也是多次测量同一对象的一致性程度。
编辑ppt
4
+ 信度的统计定义(统计等价定义)
– 信度是被试团体真分数方差与实得分数方差之 比,即:
rXX T2 /X2
– 信度是被试团体真分数与实得分数相关系数的
r 平方,即: XX
2 TX
– 信度是一个测验与它的任意一个平行测验的相 关系数,即:
第四章 测验信度

1 a系数 它是一种表示测验同质信度的指标,该公式 又称为克伦巴赫公式:
∑S2 k i a= 1− 2 k −1 SX
Si
SX
2
=第 i 道题的方差 =测验总分的方差
2
K=题目数量
2. 库德-里查森公式(KuderRichardson): 当题目分数均为0, 1 的 二分法记分时,作为α系数的一种特例, 可采用库德-里查森公式:
分半的方法
如果测验中包含一些大 题目,大题目之中又包 含若干个小题目,那么, 奇偶分半应按最小的题 目划分。
按题目的奇偶顺序分半 易受难易程度、练习、疲劳因 素的影响
速度测验不宜采用分半信度
分半信度的校正
矫正公式为斯匹尔曼——布朗公式: 式中crxx为经过校正的信度值 2rhh CrXX = rhh 为未经校正的信度值 1 + rhh 斯匹尔曼——布朗公式假设测验所分成的两半具有相 同的变异,弗朗那根公式可以不做这样的假设。
ssw321??????tknnkr12??123???nntn相同等级数目?例题见附件6求评分者信度?肯德尔和谐系数??w肯德尔和谐系数每位受测者所得等级的和数的平方和rss??r每位受测者所得等级数的和?k评分者人数?n受测者人数??nnksswr??32121??nrrssr22????第四节对信度的讨论?一信度与误差变异的关系?信度系数类型误差变异来源?再测信度时间取样?复本信度连续施测内容取样时间与内容取样内容取样评分者间的差异?复本信度间隔施测?分半信度?评分者信度?有时同一个测验需要检验几种信度系数这样我们就能把总分数的变异分成不同的分支
rnn = 1 −
so (1 − roo )
2
snቤተ መጻሕፍቲ ባይዱ
第四章 测量信度

主
要
测量工具
因
素
施测间隔的时间
现在您浏览到是十五页,共十七页。
二、提高测验信度的常用方法
适当增加测验的长度
提
控制试题的难度分布
高 测
努力提高每道题的区分度
验 信
维持测验的同质性
度 的
规范施测程度、统一施测环境
常 用
保证被试有充裕的作答时间
方 法
严格控制评分误差
努力提高测验在被试中各个 同质亚团体上的信度
现在您浏览到是九页,共十七页。
• 2、复本信度:
• ①定义:两个平行测验测量同一批被试所得结果 的一致性程度。
• ②计算方法:其大小等于同一批被试在两个复本 测验上所得分数的皮尔逊积差相关系数。
• ③使用的前提条件
现在您浏览到是十页,共十七页。
3、分半信度:
①定义:将一个测验分成对等两半后,所有被试在这两半 上所得分数的一致性程度。
③使用的前提条件 第一:所测量的心理特征必须是稳定的 第二:遗忘和练习的效果基本上相互抵消 第三:在两次施测的间隔时期内被试在所要 测查的心理特质方面没有获得更多的学习和 训练。
现在您浏览到是八页,共十七页。
内容总结
第四章 测量信度。信度是一个测验X(A卷)与它的任意一个平行。1、评价测验—衡量 测验好坏的重要指标之一。3、信度可以用来解释个人测验分数的意义——测量标准误。第 二节 信度的估计方法。②计算方法:分半,如奇偶分半,题目分半等。斯皮尔曼——布朗 公式校正。①定义:指测验内部所有题目间的一致性程度,也叫内部一致性系数。②计算方法 肯德尔和谐系数W系数。第三节 提高测验信度的方法。规范施测程度、统一施测环境。见 P57
现在您浏览到是十六页,共十七页。
心理测量 第4章 心理和教育测量的信度

采用SPSS计算信度
数 据 库
同 质 性 信 度 计 算 方 式
结果
输入40题
结果
评分者信度
标准化测验一般都有较为严格的评分程序。
对于客观性试题来讲,评分所引起的误差是可 以忽略不计的,但是对于一些主观题来讲,评 分者之间的变异是产生误差的重要原因之一。
一般原则是:当rxx<0.70时,测验不能
对于个人作出评价或预测,而且不能做团体比
较;当0.70≤rxx<0.85时,可用于团体比较;
当rxx≥0.85时,才能用来鉴别或预测个人成
绩或行为。 另一原则是,新编的测验信度应高于原有的 同类测验或相似测验。
表3-1 几种心理测验的信度系数
测验类型
低 成套成就测验 学术能力测验 成套倾向性测验 客观人格测验 兴趣测验 态度测验 0.66 0.56 0.46 0.46 0.42 0.47
115,那么他的智商的真分数的变动范围就是
115±1.96×3.35,也就是说,有95%的把握
认为,这个儿童真正的智商水平在108.4至
121.6之间。
某被试在韦氏成人智力测验中言语智商为 102,操作智商为110,已知两个分数都是 以100为平均数、15为标准差的分数,假 设言语测验和操作测验的分半信度分别为 0.87和0.88,问其操作智商是否显著高于 言语智商?
信度系数ቤተ መጻሕፍቲ ባይዱS为分数标准差, X 为分数的均值,C 为达标分数或分数线。
用决策的一致性作为信度指标
标准参照测验常用来把被试分为掌握(达标)和未掌 握(未达标)两组,这实际上是用测验来作决策,因此可 用作决策的一致性而不是分数的一致性来确定信度,也就 是看再测时被同样归类的受测者的比例,两次施测被同样 归类的受测者比例越高,说明信度越高。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章测量信度一、单选题1.速度测验的信度应以( c )取得。
dA.奇偶法 B.筛选法 C.反应时法 D.重测法2.在其他条件均等的情况下,测验长度和信度之间的关系是( d )。
bA.测验越长,信度越低B.测验越长,信度越高C.没有关系D.上述说法都不正确3.计算一项测验的分半信度最常用的方法是比较( b )。
A.测验的前半部分与后半部分的得分。
B.奇数项目与偶数项目的得分。
C.将测验随机分为两部分,比较这两部分的得分。
.D.上述方法都可以。
4.一个40道题目的测验其奇偶分半后的信度为0.50,那么该测验的信度接近多少?( b )A. 0.50B. 0.67C. 0.80D. 1.05.当测验的信度减少(接近0)时,测量的标准误将会怎样变化(c )?A.减小,趋向于零。
B.只要趋向于1.0,它就会要么增大,要么减小。
C.增大,趋向于测验的标准差。
D.增大,逼近无限大。
6.再测信度所考虑的误差来源是(d )所带来的随机影响。
A.形式的不同B.题目的不同C.考生的不同D.时间的不同7.在考查评分者信度时,如果三人以上评阅数份试卷,则需计算( a )。
A.肯德尔和谐系数B.等级相关系数C.皮尔逊积差相关系数D.克伦巴赫α系数8.(a )是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得结果的一致程度。
A.信度B.效度C.难度D.区分度9.信度只受(d )的影响。
bA .系统误差 B.随机误差 C.恒定效应 D.概化理论10.复本信度又称等值性系数。
它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系效。
复本信度反映的是测验在( c )上的等值性。
dA.时间B.题目C.评分D.内容11.分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系效。
这个相关系数就代表了( d )内容取样的一致程度。
A.原测验B.所有条目之间C.题目与分测验之间D.两半测验⒓.斯皮尔曼―布朗公式21tt hh hh r r r =+式中hh r 为(c )的相关系数, tt r 为测验在原长度时的信度估计值。
A.全测验B.原测验C.一半分数D.全部分数13.同质性信度主要代表测验内部( b )间的一致性。
A.两半测验B.所有题目C.题目与分测验D.分测验14.KR 20公式、KR 21公式有别于克伦巴赫α系数的是,它们只能用于( b )。
A.多项选择题B.是非题C.简答题D.论述题15.一般要求在成对的受过训练的评分者之间平均一致性达到(c )以上,才认为评分是客观的。
A. 0.70B. 0.80 c. 0.90 D. 1.0016.确定可以接受的信度水平的一般原则是,当(a )时,测验不能用于对个人做出评价或预测,而且不能作团体比较。
A. tt r <0.70B. 0.70≤tt r <0.85C. tt r ≥0.85D. tt r =1.0017.一般而言,若获得信度的取样团体较为异质的话,往往会(a )测验的信度。
A.高估B.低估C.忽略D.不清楚18.对于不同平均能力水平的团体,题目的(b )会影响信度系数。
aA.难度B.区分度C.信度D.效度19.一个包括40个题目的测验信度为0.80,欲将信度提高到0.90,通过斯皮尔曼―布朗公式的导出公式计算出至少应增加(d )个题数。
A. 40B. 60C.100D. 5020.以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越(a )。
A.大B.低C.小D.不变21.如果某测验的信度系数为0.81,那么该测验中真分数造成的变异占(a )。
A. 81%B.19%C.9%D.18%22.在能力测验中,代表测验量表的稳定性和一致性的指标是(c )。
A.效度B.区分度C.信度D.难度23.衡量测验内部一致性的指标是(a )。
cA.重测信度B.肯德尔和谐系数C.α系数D.复本信度24.分半信度求出后通常需要进行校正,通常用(b )校正。
A.α系数B.斯皮尔曼—布郎公式C.KR20公式D.肯德尔W系数参考答案:1.D 2.B 3.B 4.B 5.C 6.D ⒎A ⒏A 9.B 10.D 11.D 12.C 13.B 14.B 15.C 16.A 17.A 18.A 19.D 20.A 21.A 22.C 23.C 24.B二、多选题1.以下哪些因素会导致测验信度被低估?(abd )abcdA.测验的题目难度过高B.被试的同质性太高C.测验题目很多D.测验的题目难度过低=,公式中SE为测量的标准误,从公式中可以看出,测量的标准误与信2.SE S度之间的关系是( bd )。
A. 信度越低,标准误越小B.信度越低,标准误越大C. 信度越高,标准误越大D.信度越高,标准误越小3.复本信度的缺点有(bcd )。
abdA. 如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响。
B. 由于第二个测验只改变了题目的内容,已经掌握的解题原则可以很容易地迁移到同类问题。
C. 能够避免重测信度的一些问题,如记忆效果、学习效应等。
D. 对于许多测验来说,建立复本是十分困难的。
4.一般来说,在一个测验中增加同质的题目,可以使信度提高。
下列描述中正确的是(bd )。
abdA.测验越长,测验的测题取样或内容取样就越有代表性。
B. 测验越长,被试者受猜测因素的影响就越小。
C. 测验越长,越遵循报酬递增率原则。
D.测验太长,有时反而会引起被试者的疲劳和反感而降低可靠性。
5.信度系数在解释个人分数的意义时的作用是( ac )。
bcA.估计误差分数的范围B.估计真实分数的范围C.了解实得分数再测时可能的变化情形D.了解误差分数的大小6.信度是指测验结果的(a d )。
A.可靠性 B.有效性 C.特殊性 D.一致性7.计算内部一致性信度常用的指标包括(abd )。
A.分半信度B.克伦巴赫α系数C.肯德尔W系数D.KR20。
8.下列信度类型中受测量的时间间隔影响的有(ad )。
A.重测信度B.复本信度C.分半信度D.重测复本信度参考答案:1.ABCD 2.BD 3.ABD ⒋ABD ⒌BC 6.AD 7.ABD 8.AD三、概念题1.克郎巴赫α系数2.测量的标准误四、简答计算题1.指出各种信度系数所对应的误差来源。
2.已知“16人参加一次测验后在奇数题和偶数题上的得分情况,试用两种以上方法估计测量信度。
解:r=0.893.已知某态度量表有6道题,被试在各题上得分的方差分别是0.80、0.81、0.79、0.78、0.80、0.82,测验总分的方差为16.00,求α值。
解:4.信度的影响因素有哪些?怎样提高测量信度?5.某智力测验的信度r=0.75,某次施测得到分数的标准差为3.00,则该测验的标准误是多少?若某被试得分为100,试估计其真分数95%的置信区间?解:Se=2.5 95.1~104.96.甲被试在韦氏成人智力量表测验中言语智商为102,操作智商为110。
已知两个分测验都是以100为平均数,15为标准差的标准分数。
假设言语测验和操作测验的信度为0.93和0.94,问:甲被试的操作智商是否显著高于言语智商?解:7.如何根据测验的类型选择信度的估计方法?答:测验信度是测验在测量它所测特质时得到的分数(测值)的一致性。
它反映了测验工具对各种随机误差控制的好坏,是测验性能的重要质量指标。
由于真分数无法直接得到,因而通常需要采用重测法、复本法、分半法和内部一致性系数等几种方式来估计信度,但由于每一种方法都特别强调了对某方面误差的控制,因此,它们并不适用于所有类型的测验。
重测法多用于所测特质是相对稳定的测验。
如智力测验、能力倾向测验和人格测验等。
复本法和分半法多用于学业成就测验和智力测验。
内部一致性系数多用于智力测验、能力倾向测验和个性测验,但当测验所测特质包含性质不同的方面时,不能采用内部一致性系数。
以上信度系数估计方法的选择是相对的,实践中可根据测验目的、性质不同采取多种估计方法。
8.为什么可以用标准误估计个人测验分数的误差?解:9.在一次测验中,有些学生得了80分,已知这次测验的标准差为5,信度系数为0.84,如再测一次他们的分数将改变多少?解:1.96Se=3.9210.已知某个测验的信度为0.75,要使该测验的信度达到0.90,必须增加多少题目?解:n=3,增加到原来的3倍11.为节省测验成本,将某个信度为0.98的测验由500题减为300题,则信度变为多少?(结果保留两位小数)解:r=0.96712. 一个包括10个题目的测验,信度为0.5,若增至50个题目,其信度将是多少?解:r=0.83。