5-信度

合集下载

试题设计的五个标准分别是:效度,信度,区分度,实用性,

试题设计的五个标准分别是:效度,信度,区分度,实用性,

试题设计的五个标准分别是:效度,信度,区分度,实用性,及影响。

一.效度是指测量的有效性,也就是看考试是否考查了想要考查的内容。

二.信度是指考试结果准确,稳定,可靠的程度。

这要求有不同的评卷人阅卷,所得分数大致相同;同一评卷人在不同的时间阅卷,分数大致相同。

三.区分度就是可以进行比较。

四.实用性是指要便于使用。

试题清晰,醒目,措辞简洁,避免拼法错误或遗漏,尽量少涉及各种器材设备。

五.影响分为积极和消极两种。

积极影响:帮助学生发现问题,积极督促。

消极影响:会造成考什么学什么的结果。

试题要体现新一轮基础教育课程改革的基本理念,落实《英语课程标准》所确立的考试指导思想。

考试要有利于全面贯彻国家教育方针,推进素质教育;有利于体现九年义务教育的性质,全面提高教育质量;有利于英语课程改革,提高英语教学质量, 培养学生的创新精神和实践能力,减轻学生过重的课业负担,促进学生生动活泼、主动学习。

英语试题要落实知识与能力、过程与方法、情感态度与价值观三维课程目标,要依据《英语课程标准》来确定考查内容和标准,既重视考查学生对英语基础知识与基本技能的掌握情况,更重视考查学生在具体情境中综合运用语言的能力,考试内容不应与任何教材的具体内容直接挂钩。

在试卷设计上要遵循教育测量的基本原理,坚持以交际语言测试为主,分离测试、综合测试等多种测试并存,力求在语篇层次上,在尽可能真实情景中,以互动的形式测试学生的综合语言运用能力;不仅要关注试卷信度,更要注重试卷的效度;在力求试卷结构简约的同时,确保考查内容的覆盖面,杜绝繁、偏、旧试题,科学控制题量和难度。

要坚持“以能力立意为主、知识立意为辅”的原则,根据语言实际使用情形命题,适当增大主观性、开放性试题的比重,尽可能避免命制以词或句为语言单位的试题,不应在脱离语境的情况下单独考查微观语言知识。

在选择语言素材时,要充分考虑学生的实际生活和身心发展水平、地域以及文化差异,选用真实、地道、形式多样的语言素材。

教招高频考点-信度效度的区分

教招高频考点-信度效度的区分

教招高频考点-信度效度的区分教育学知识点中,有一个常考的知识点就是效度、信度的区分,很多人看到这个相关知识点的题就分不清,下面我们一起来梳理一下。

1.效度效度是指一个测验或测量工具能真实地测量出所要测量的事物的程度。

一次测验是否有效,主要看其是否能准确地测量所要测量的东西。

也可以这样理解效度,效度指的是测验工具和要测量内容的一致性。

问题一:假设现在要测量一个人的体重,尺子和体重秤哪个更有效?肯定是体重秤,体重秤是专门用来测量体重的,所以它的有效性更高,效度也很高,这就是工具和要测量的内容是一致的;问题二:要测量六年级学生的英语水平,现在有三份试卷,一份是六年级的数学试卷、一份是三年级的英语试卷、一份是六年级的英语试卷,这三份试卷中,只有六年级的英语试卷能够准确测量出六年级学生的英语水平,所以它的效度最高,三年级英语试卷难度偏低,所以效度低,而六年级的数学试卷完全和英语无关,因此无效度,这个例子中就显示出测量工具不仅要和内容一致,还要难度相当才行。

拓展知识:测验的效度有多种类型,主要有内容效度、构想效度和预测效度。

①内容效度:所谓测验的内容效度,是指它从需要测验的教材中提取样本的适当程度。

内容效度的高低,取决于测验题目的代表性,要看选出的题目能否包含所测量内容范围的主要方面,并使各方面题目比例适当。

②构想效度:所谓测验的构想效度,是指一个测验能够测量理论上的构想或内在心理特性的程度。

③预测效度:所谓测验的预测效度,是指一个测验能够预测学生将来某种特定行为或表现的程度。

预测得越准,效度就越高。

2.信度信度主要指测验结果的前后一致性程度。

效度是对测量的准确性程度的估计,而信度则是对测量的一致性或可靠性程度的估计。

多次施测,如果得到的结果一致,那就是信度高,比如一份试卷让同一个学生做三次,三次分数分别是88、88、88,三次分数一致,信度高,如果三次测验成绩波动极大,那就是信度低。

研究表明,效度和信度是交叠的,即有时一个测量工具对于某一个目的具有一定的信度,但并不一定是有效的;而一个测量工具如果对于某一个目的是有效的,那么它一定是可信的。

5心理测量 第五章 经典测验理论——信度

5心理测量 第五章 经典测验理论——信度
Spearman-Brown公式要求:两半测验的 方差齐性。(方差F检验,方差齐性检验)
二、估算信度系数的方法
在数据达不到这一要求时(方差不齐性) 卢仑/卢龙Rulon公式:
rXX =1-Sd2/ Sx2
弗朗那根Flanagan公式:
rXX =2[1-(Sa2+ Sb2) ] / Sx2
如果该测验的标准差是15,信度系数是 0.84,那么他智商的真实得分范围是多少?
四、信度系数的作用
3、比较不同测验分数的差异 测量标准误和测验信度在评价两个测验
分数是否有明显差异时也非常重要。 通过差别分数的标准误,可以比较两个
人不同分数的差别和一个被试在两个同 类测验上的差别
四、信度系数的作用
多个测验分数加总的合并分数
分数合成后,信度倾向于提高
测验间的相关越高,合成信度越高
rss
1
k
k (krii ) (k 2 k )rij
rii 平均测验信度 rij 平均测验相关
k 测验数目
三、特殊的信度问题
4、分量表的信度 有些量表是测量单一心理特质、心理内
容的,可计算全量表的信度系数 有些量表由多种分量表构成,应计算各
典型信度系数 0.95 0.90 0.85
0.80
0.75 0.70 0.65 0.60 0.55 0.50
信度系数的意义
测验类型
解释
测量误差几响乎没有影
能力、智力、成就
高到中等的信度
人格测验和态度、兴 趣等一些等级量表
课堂测验
中到低的信度
投射测验
低信度 真分数和误差对测验
四、信度系数的作用
2、解释个人分数 信度系数可以更加精确的解释个人分数,根据

心理学概念解释

心理学概念解释

一1、教育心理学:教育心理学是一门研究学校情景中学与教的基本心理规律的科学。

2、教学媒体:教学媒体是用于传递旨在改变学习者行为的教学信息的媒体,是教学内容的载体,是教学内容的表现形式,是师生之间传递信息的工具。

3、系统性原则:系统性原则就是用系统论来考察心理现象,把人的心理作为一个开放的、动态的、整体的系统来加以考察。

4、教学过程:教学过程指教师把知识技能等以有效的方式传授给学生并引导学生主动建构知识的过程。

5、评价/反思过程:评价/反思过程是对学习班和教学效果进行测量、评定和反思,以求进一步改进的过程。

包括在教学之前对教学设计效果的预测和评价、在教学过程中对教学的监视和分析以及在教学之后的检验、反思.6、学习过程:学习过程在学生在教学情景中通过与教师、同学以及教学信息的相互作用获得知识、技能和态度的过程.二1、心理发展:心理发展是指个体从出生、成熟、衰老直至死亡的整个生命进程中所发生的一系列心理变化。

2、自我中心:自我中心是指儿童倾向于从自己的立场、观点来认识事物,而不能从客体事物本身的内在规律以及他人的角度认识事物。

3、形式运算阶段:形式运算阶段又称命题运算阶段,其最大特点是儿童思维已摆脱具体事物的束缚,把形式和内容区分开来,能根据种种可能的假设进行推理。

4、自我意识:自我意识是意识的一种,也是人的意识的一个重要特征;是作为主体的“我"对于自己以及自己与周围事物关系,尤其是人我关系的认识。

5、自我评价:自我评价是指自己对自己的能力和行为的评价,是个体自我调节的重要机制。

6、认知方式:认知方式又称认知风格,是个体在知觉、思维、记忆和解决问题等认识活动中加工和组织信息是所显出来的独特而稳定的风格。

三1、认识策略:认识策略是指对内调控自己的认识活动的特殊技能。

2、效果律:效果律如果其他条件相等,在学习者对刺激情景做出反应的过程中,如果获得满意的结果,其联结的力量就会增强;相反,如果获得令人烦恼的结果,刺激与反应的联结就会削弱。

统计学中的信度与效度

统计学中的信度与效度

统计学中的信度与效度在统计学中,信度与效度是涉及测量工具的两个重要却又常常相互关联的概念。

它们分别从不同的侧面来评估测量工具的质量和可靠性。

在科学研究、心理测量以及社会调查等领域,理解和掌握信度与效度的概念,对于研究结果的解释和应用至关重要。

本文将深入探讨信度与效度的定义、类型、影响因素及其在实际研究中的应用。

一、信度信度指的是测量工具在多次测量中所获得结果的一致性或稳定性。

换句话说,如果我们使用同样的测量工具对同一对象多次进行测量,理论上应该得到相似或相同的结果。

如果测量结果的一致性较高,则说明该测量工具具有良好的信度。

1. 信度的类型信度可以分为以下几种主要类型:重测信度重测信度是通过对同一组受试者在不同时间点使用同一测量工具进行测试,以评估其一致性。

若两次测量结果高度相关,说明该工具具有较高的重测信度。

内部一致性内部一致性评估的是测量工具内各个项目之间的一致性。

例如,在问卷调查中,针对某一特定特质的多个问题,若回答之间存在高度相关,说明问卷具有良好的内部一致性。

常用的评估方法是计算克朗巴赫α系数。

评分者间信度评分者间信度用于比较不同评分者对同一现象或对象进行评价时所给出的结果一致性。

当多个评分者对同一个被试进行评分时,如果他们的评分高度一致,则表明该测量工具具备良好的评分者间信度。

2. 信度的重要性信度在统计学研究中的重要性不可低估。

首先,高信度意味着研究结果稳定可靠,能够有效反映所要研究的对象特征。

同时,低信度可能导致统计分析结果的不准确,使得结论失去可信性。

因此,在设计研究时,确保所使用的测量工具具备较高的信度,是任何研究者必须关注的重要环节。

二、效度效度则是指测量工具是否能够准确地测量其所声称要测量的内容或特质。

简单来说,一个具备效度的测试应该能够区分出不同被试之间真实存在的差异,而不仅仅是能重复地得到相同结果。

1. 效度的类型效度一般可分为以下几种类型:内容效度内容效度指的是测量工具所包含内容是否全面代表了待测特质。

信度与效度的名词解释

信度与效度的名词解释

信度与效度的名词解释在社会科学研究中,信度和效度是两个重要的概念,用于评估研究工具的质量和可靠性。

信度指的是测量工具的稳定性和一致性,即无论是在不同时间还是不同场合下,该工具测量的结果是否具有一致性。

效度则是指测量工具所测量的内容是否与实际情况相符,即是否能够正确地反映出所要测量的概念或变量。

信度主要关注的是测试工具的稳定性和准确性。

如果一个测量工具具有较高的信度,那么无论是在不同的时间还是不同的场合下,使用该工具测量同一个对象所得到的结果应该是一致的。

一个具有高信度的测量工具可以减少测量误差,使得研究结果更加可靠。

常用的衡量信度的方法包括重测信度、等价形式信度和内部一致性信度。

重测信度是一种常见的信度测量方法,它通过对同一组受试者在不同时间或条件下进行两次测量,然后计算两次测量结果之间的相关系数来评估工具的信度。

如果两次测量之间的相关系数较高,说明该工具具有较好的信度。

等价形式信度是一种通过将原测量工具分为两个等价的部分,然后对同一组受试者分别使用两个部分进行测量,最后计算两个部分测量结果之间的相关系数来评估工具的信度。

如果两个部分测量结果之间的相关系数较高,说明该工具具有较好的信度。

内部一致性信度是一种通过对测量工具中的一组项目进行统计分析,例如计算Cronbach's alpha系数,来评估工具的信度。

Cronbach's alpha系数表示了测量工具中各个项目之间的内部一致性。

如果Cronbach's alpha系数较高,说明该工具具有较好的信度。

效度主要关注的是测量工具的准确性和有效性。

一个具有高效度的测量工具应该能够准确地测量所要研究的概念或变量,而不是测量其他无关的内容。

常用的衡量效度的方法包括内容效度、构效度和判别效度。

内容效度是一种通过专家评估测量工具中所包含项目与所要测量的概念之间的关联程度来评估工具的效度。

如果专家评估认为测量工具中的项目与所要测量的概念之间的关联程度较高,那么该测量工具具有较好的内容效度。

信度和效度的分类

信度和效度的分类

信度和效度是评估研究工具和研究结果质量的重要指标。

它们可以分为不同的类型,以下是一些常见的分类方式:
1. 信度分类:
- 内部一致性信度:指测量工具在同一时间或同一研究对象上的一致性。

常用的内部一致性信度指标包括 Cronbach's alpha 系数、Kuder-Richardson 公式等。

- 重测信度:指在不同时间或不同研究对象上对同一测量工具进行测量时,结果的稳定性和一致性。

常用的重测信度指标包括皮尔逊相关系数、组内相关系数等。

- 复本信度:指使用两个或多个等价的测量工具对同一研究对象进行测量时,结果的一致性。

常用的复本信度指标包括皮尔逊相关系数、组内相关系数等。

2. 效度分类:
- 内容效度:指测量工具是否涵盖了所要测量的内容领域。

内容效度通常通过专家评估、文献回顾等方法进行评估。

- 效标关联效度:指测量工具与已知的有效标准之间的关系。

常用的效标关联效度指标包括皮尔逊相关系数、决定系数等。

- 构念效度:指测量工具是否真正测量了所要研究的概念或构念。

构念效度通常通过因素分析、验证性因子分析等方法进行评估。

需要注意的是,信度和效度是相互关联的,一个有效的测量工具必须同时具备较高的信度和效度。

在实际研究中,需要根据研究目的和研究对象的特点选择合适的信度和效度指标,并进行相应的评估和验证。

信度和效度检验方法

信度和效度检验方法

信度和效度检验方法
信度和效度是常用于科学研究中的两个重要概念。

一种测量工具只有
通过信度和效度的检验,才能够被认为是可靠的。

信度是指一个测量
工具在不同时间下得出的结果是否一致;效度是指测量工具所衡量的
内容是否与实际情况相符。

在本文中,我们将详细探讨信度和效度检
验方法。

一、信度检验方法
1.测试-重测法:这种方法需要在不同时间下对同一组参与者进行测量,然后将两次测量结果进行比较。

若结果相似,则说明该测量工具有很
好的信度。

2.内部一致性方法:这种方法通过分析同一个测试工具中各个题目之间的相关性来检验信度。

如果各题目之间的相关性较高,则说明该测量
工具有很好的信度。

3.切割半法:将测试工具中的题目一分为二,然后比较两个半部分得分的相关性操作。

若相关性较高,则说明该测量工具有很好的信度。

二、效度检验方法
1.试验效度:这种方法需要将测试工具与其他评估工具进行比较,以确定它是否正确地测量了特定变量。

2.构效度:这种方法通过分析测量工具是否与预期的变量进行了关联来检验效度。

如果两者相关性较高,则说明该测量工具具有很好的效度。

3.面向任务效度:这种方法需要将测试工具应用于实际任务中,看其是否能够有效地预测参与者的表现情况。

综上所述,信度和效度的检验方法可以确保测量工具的可靠性和准确性。

然而,这并不意味着所有测量工具都必须通过所有的检验方法。

研究者应该根据自己的需要来选择合适的方法,从而确保研究的可信
度和准确性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

霍伊特(C.Hoyt)信度
• 霍伊特(C.Hoyt)信度的主要原理就是把一组测验分数的总方差分 解成三个来源:人与人的差异;项目之间的差异;以及人与项目之间 相互作用的差异。真正方差用人与人的差异,ቤተ መጻሕፍቲ ባይዱSp来估计,测量误差 则用人与项目的相互作用与项目的相互作用MSr.来估计。计算公式 为:
MSP MSr MSr 1 MSP MSP
克伦巴赫(L. J. Cronbach)α系数
这是应用最广的一种信度指标 公式:
2 2 s s n t i 2 st n 1
式中Si2为各部分测验分数的方差,St2为测验总方 差。当将每一个测题作为一个分析单元时,n便是测 验的题目总数。而当n=2时,即将测验分半时,不难 证明此公式与分半信度的矫正公式相同。
测验的信度概述
3
其中,ST2是实测分数的方差,反映实测分数的的波动 程度; STR2是真分数的方差,反映真分数的波动程度; SE2是误差分数的方差,反映误差分数的波动程度。 SE2 和STR2对于rtt的大小的贡献可由下图表示:
STR2
SE2
可见误差变异数越大,信度系数越小,信度越低,误差变异 数越小,信度越高。
测量工具方面
•以测验为代表的心理与教育测量工具是否性 能稳定是测量工作成败的关键。因此,弄清楚 影响测量工具稳定性的因素是十分重要的。一 般地,试题的取样、试题之间的同质性程度、 试题的难度等是影响测验稳定性的主要因素。
试题的取样
试题的取样 如果一个测验的试题取样不当(或题目数目太少,或考察的方面不全 面),则难以测查到被试心理特质的全面情况。若是被试采取押题方 式应考,则所得结果的随机性更大。既然心理特质被考察的方面是随 机的、测查的结果也是随机的,那么这种测量的信度就必然不高。 相反,当一份测验中的同质性的题目数量增多之后,同一心理特质被 考察到的次数就会增多,被试的成绩也就被有效地拉开。整个团体的 测验分数分布就会更广,从而,提高测量的信度。
内在一致性信度
也叫同质性信度。该系数反映的是测验内部的一致性,即
项目同质性。当被试在同一测验里出跨项目的一致性时,就称测 验具有项目同质性。也就是测验里各测题得分为正相关时,就可 以从一个人在一个测验题上的作业预测其在其他测题上的作业。 内在一致性系数不可避免地受到测试时被试成绩的临时波动 、猜测、记分等测量误差的影响,除此之外上,测验内容抽样引 起的误差对其也会产生影响,而后者更是研究内在一致性系数所 需重视的误差来源。
n

r xy
n
( x i x )( y i y )
n
i1 2
( yi y)
2

nS
x
xy S
y

i1
(xi x) y S y

i1

1 n

x S x
1 n

Z
x
Z
y
与信度系数有关的误差方差来源
信度系数类型

分半信度
误差来源:误差来源主要在于分半过程,以不同的方式对 测验进行分半所得的分半信度值不同。但它基本避免了再 测法和复本法的误差源及不可行性。 斯-布公式要求前后两半题目有相同的变异(方差),方 差不同时,则会高估信度系数。
rxx
2 rx1 x2 1 rx1 x2
分半信度的矫正公式
(2)费拉南根公式:
• •
主试方面
• 就施测者而言,若他不按指导手册规定施测,或故意制 造紧张气氛,或给考生一定的暗示、协助等,则测量信 度会大大降低。 • 就阅卷评分者而言,若评分标准掌握不一,或前紧后 松,甚至是随心所欲,则也会降低测量信度。
施测情境方面
• 在实施测验时,考场是否安静,光线和通风情况是否 良好,所需设备是否齐备,桌面是否合乎要求、空间阔 窄是否恰当等等都可能影响到测量的信度。
•由于这种方法的计算较之其他方法复杂的多,因而现在不常用,但是 其运用方差分析估计信度的思想为现代测量理论之一的概化理论的诞 生奠定了一定的基础。
评分者信度
• 含义:评分者信度(Scorer reliability)指的是多个评分者 给同一批人的答卷进行评分的一致性程度。 • 计算:当评价者人数为2时,评分者信度等于评分者给同一 批被试的答卷所给分数的相关系数(积差相关或等级相关)。 当评分者人数多于两个人时评价者信度可以用肯德尔和谐系数 计算。公式分别为:
• 定义:复本信度又称等值系数,是指两假定相
等的复份测验之间的一致性,是两个平等测验分 数的相关。(当同一测验不能用来再次实施时, 就需要给同一种测验编制两份平等的测验) • 计算方法:先实施测验的复份A,然后在最短的 时距内实施复份B,再求再次测验分数的相关系 数。 •
图式:
最短时距
测验复份A
测验复份B
内在一致性信度
估计内在一致性系数的方法通常有两类, 一类是分半法, 另外一类方法需要对项目反应的方差或协方差进 行分析。
分半信度 split-half reliability
定义:将测验施测于某被试总体,然后将测验分半,再求被试在每一半 测验上的分数的一致性程度。这是最常用的信度指标 • 分半方法:完全随机分半法;奇偶分半法;将测验分成若干内容 块,再将各内容块的题目奇偶分半,所有的奇数题和所有的偶数题 各组成一个分测验。这是最有效也是应用最广泛的分半方法。 计算方法:若测验分半后得到的两个部分符合平等测量的条件,即 符合真分数等值模型的假定,则可计算两半测验得分的皮尔逊相关 系数。但所求得的相关系数只能代表半个测验而不是整个测验的信 度,因而应对此系数进行矫正。一般用著名的斯皮尔曼-布朗公 式。
试题的取样
例如,有一个测验,由5道是非题组成。如果学生知道其 中4题的正确答案,那么猜对另外1题的概率为0.5,凭猜 测获得分数的可能性就很大。但是,另有一个测验,由50 道是非题组成。如果学生知道其中40题的正确答案,那么 猜对另外10题的概率为0.5的10次方,凭猜测获得分数的 可能性就很小。
估计信度的方法
• • • •
重测信度 复本信度 内在一致性信度 评分者信度
重测信度 test-retest reliability
重测信度也称稳定系数,是指对同一 被试总体进行重复测量而得的两组数据之间的 一致性程度的量化指标。用两次测验分数之间 的相关系数表示。 • 计算方法
rtt rx1x 2
重测信度 复本信度 等值稳定系数 分半信度 库德系数和α系数 评分者信度
误差方差来源
时间抽样 内容抽样 时间和内容抽样 内容抽样 内容抽样和内容异质性 评分者之间的差异
评价测验
一般能力测验和成就测验信度在0.90以上 人格和兴趣测验信度在0.80和0.85之间 信度系数高于0.85时,可以对个体进行诊断、鉴别、解释 ,也可以进行团体比较 信度在0.70到0.85之间时,只能进行团体比较 信度小于0.70时,不能评价个人,也不能进行团体比较 根据测验目的,有些信度不高的测验也有用 信度一般指某次测验结果的信度,不能根据一两次测验的 结果否定测验的价值
被试方面
• • • 就被试团体而言,整个团体内部水平的离散程度以及团体的平均水平 都会影响测量信度。 这是因为,我们所计算的信度估计值大都是以相关为基础的,而相关 系数的大小往往取决于全体被试得分的分布情况。 当被试团体异质(即团体内水平彼此差异大)时,全体被试的总体分 布必然较广,以相关为基础计算的信度值必然会大,这就很有可能高 估实际的信度值。 当团体内部水平相差不大(同质)时,其得分分布必定会较窄,以相 关为基础计算的信度值必然会小。这时又有可能低估信度值。 此外,若团体的平均水平太高(大家都得高分)或太低(大家都得低 分),同样会使测验人总分的分布变窄,低估测量的真正信度。
2
其中,sd2是两个分半测验分数 之差的方差,st2是整个测验的总 分方差。
公式(1)和(2)不要求两个分半测验的变异相等
基于项目协方差的方法
把测验划分为两半的方法实际上有多种,除了奇偶法以外, 还有随机安置法、内容匹配法、难度排序奇偶法等等。而每一种 划分方法产生的rtt估计值都有差别,因此,用分半法得到的信度 估计值不具备唯一性。所以库德(Kuder)、理查德逊( Richardson)针对分半法的不足提出的。不过,与斯皮尔曼-布 朗方法的假设相似,库德-理查德逊方法也要求测题的难度相等 ,相关相等。
信度的相关问题
• 影响信度的因素 • 提高测量信度的常用方法 • 几点说明
影响测量信度的主要因素
• 被试方面 • 主试方面 • 施测情境方面 • 测量工具方面 • 两次施测的间隔时间
被试方面
• 就单个被试而言,被试的身心健康状况、 动机、注意力、耐心、求胜心、作答态度 等,会影响测量误差,因为这些因素往往 会影响被试心理特质水平的稳定性。
2 2 sa sb rtt 2 1 s 2 t
式中sa2,sb2分别为两个分半测验 的方差,st2为整个测验的总分 方差。
nr s 11 d rnn r tt 1 1 (n 1)r11 st2
2
(3)卢龙公式(Rulon)
sd rtt 1 2 st
• 定义
X X X X / n X ( X ) / n X ( X )
1 2 1 2 2 1 2 1 2 2 2
2
/n
X1 X 2 n X 1 X 2 rtt (n 1)1 2
X1X2 / n X1 X 2 rtt S1S2
复本信度 alternate form reliability
试题的取样
这种效果可用斯皮尔曼-布朗公式计算。 公式中,n为改变后的测验长度与原来长度 之比。r11为原测验信度,rnn为测验长度增 加n倍后的测验的信度。
相关文档
最新文档