2018年心理学考研-心理测量资料-测量的信度
心理测量学第三章信度

第三章信度心理测验就是对某些心理特质的个别差异进行测量的工具,对心理特质的测量与对物理属性,如物体长度和重量等的测量是一样的。
不同的是心理测量所测量的是抽象的心理特质,工具是心理测验,而物理测量的对象则是物体的重量和长度等特性,工具是尺子和天平。
心理测量与物理测量的另一个共同点是二者都难以避免误差的影响。
在对物体的长度进行测量时,物体的热胀冷缩,测量者读取刻度的准确性等因素都会使测量出的长度与物体的实际长度不符,在不同时间、地点的测量值会有出入。
就是说,在不同情景下测量结果是不稳定的,与测量情景和测量条件有关的误差称随机误差(random error)。
由于这一误差是由测量过程造成的,因此也称测量误差(measurement error)。
另一方面,使用一把尺子对物体的长度进行测量时,这把尺子本身的质量也可能造成误差。
如果一把尺子本身就是有问题的,测量出的物体的长度自然就不准确。
这类误差与测量情景引进的误差不同,只要在测量时使用这把尺子,误差就会恒定地存在,无法消除。
这类由测量工具本身造成的误差称为系统误差(system error)。
对心理的测量与对物理的测量一样,也同样存在这两类误差。
与这两类误差相对应,心理测验中引入了信度和效度的概念。
信度研究涉及了测验分数的可靠性和稳定性,也即如何控制和减少随机误差。
效度研究则涉及了测量的系统误差,也即如何提高测量工具本身的准确性。
第一节经典测验理论的信度观教育与心理测验的目的是将个体的心理特质数量化,从而更精确地研究心理的个别差异。
在廿世纪初心理测量实践的推动下,测验理论产生了。
经过几十年的发展,到廿世纪五十年代初,教育与心理测验理论对测验的构建、误差的控制、测验结果的统计分析及解释等问题已形成一个完整的理论体系。
为与以后产生的项目反应理论和概化理论相区别,人们习惯上将这一理论体系被称为经典测验理论(Classical Test Theory,简称CTT)。
心理测量测量的信度共63页

•
29、在一切能够接受法律支配的人类 的状态 中,哪 里没有 法律, 那里就 没有自 由。— —洛克
•
30、风俗可以造就法律,也可以废除 法律。 ——塞·约翰逊
▪
26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必心情,化为上进的力量,才是成功的保证。——罗曼·罗兰
▪
28、知之者不如好之者,好之者不如乐之者。——孔子
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇
▪
30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华
谢谢!
63
心理测量测量的信度
•
26、我们像鹰一样,生来就是自由的 ,但是 为了生 存,我 们不得 不为自 己编织 一个笼 子,然 后把自 己关在 里面。 ——博 莱索
•
27、法律如果不讲道理,即使延续时 间再长 ,也还 是没有 制约力 的。— —爱·科 克
•
28、好法律是由坏风俗创造出来的。 ——马 克罗维 乌斯
心理学测量笔记连载第五章:信度

1、信度测量结果的可靠性和一致性。
因为心理测验通常测量人的行为,行为会由于各种各样的原因,因时、因事、因地而产生变动,这些因素有些是偶然的,有些是固有的,人在完成心理测验时的行为也会受上述因素的影响,从而使测验结果与真实结果不完全一致,所以我们要用信度来衡量测验的可靠性和一致性。
2、信度的操作化定义:(1)误差理论认为:一个人的测验分数X是由真实分数(T)和误差(E)两部分构成的,公式是X = T + E。
(2)因此信度就被定义为:一组测量分数的真实方差与实得方差的比,或者是指真实方差占总方差的百分比。
公式为:rxx = 1-SE 2/SX 2(3)根据统计学理论,真实方差与实得方差的比是一个相关系数的平方,所以我们把这种相关系数的平方叫做信度系数。
(4)计算公式为:rxx = ST2/SX23、由于误差的来源信度的可分为:这种分类是基于信度的传统定义-真分数理论。
(1)重测信度:考虑的误差来源是时间取样。
(2)复本信度:考虑的误差来源是内容取样。
(3)分半信度:它考虑的误差来源也是内容取样,它与复本信度的差别是:分半信度考查一个测验内容的两半题目测量的是否是同一个心理特点行为。
(4)同质性信度(内部一致性系数):考虑的是测验内容是否异质。
(5)评分者信度:考虑的误差来源是评分者间的差别。
4、信度的表示方法:(1)信度系数和信度指数:1 信度系数:rxx = rx2T = S2T/S22 信度指数:rXT = ST/SX(2)测量标准误:SE = SX 1-rxx5、信度的意义:(1)信度系数可以解释为样本测验分数的总方差中有多少比例是真分数方差,也就是测验的总变异中真分数造成的变异占百分之几。
它直接告诉我们测量的误差有多大。
(2)测量的标准误可以告诉我们有多大可能性真实分数在某一分数范围内,并且可以预测实得分数再测时可能的变化情况。
6、信度的作用:(1)解释预测个人分数的意义。
(2)解释真实分数与实得分数间的关系,明确告诉我们测验误差大小。
心理测量学知识——3信度

二、信度评估的方法
• (三)内部一致性信度 • 反映题目之间的关系,表示测验能够测量相同内容或特 质的程度。 • 1.分半信度 • 这个相关系数就代表了两半测验内容取样的一致程度。 • 公式 2r
一、信度的概念
• (一)信度的定义 • 信度是指同一被试者在不同时间内用同一测验 (或用另一套相等的测验)重复测量,所得结 果的一致程度。信度只受随机误差的影响。 • 在测量理论中,信度被定义为一组测量分数的 真分数方差与总方差的比率。 公式: 2
rxx
ST
S
2 X
一、信度的概念
• (二)信度的指标
历年考题
• 55.信度只受( )的影响(07年5月、08年11 月 ) B A.系统误差 B.随机误差 C.恒定效应 D.概化作用 • 102.使用同一测验,在同样条件下对同一组被 试者前后施测两次测验,求两次得分之间的相 关系数,叫—,又称—。( )(06年11月) BC A.复本信度 B.重测信度 C.稳定性系数 D.分半信度
第三节
测验的信度
一、信度的概念 二、信度评估的方法 三、信度与测验分数的解释 四、影响信度的因素
方差
• 样本中各数据与样本平均数的差的平方和的平均数叫 做样本方差;样本方差的算术平方根叫做样本标准差。 样本方差和样本标准差都是衡量一个样本波动大小的 量,样本方差或样本标准差越大,样本数据的波动就 越大。 •
rxx
hh
1 rhh
• 为一半分数的相关系数,为测验在原长度时的信度估计 值。
心理测量信度与效度分析

心理测量信度与效度分析在心理学领域,心理测量是一项至关重要的工具,它帮助我们了解个体的心理特征、能力水平和行为倾向。
而信度和效度则是评估心理测量工具质量的两个关键指标。
理解信度与效度对于正确使用和解释心理测量结果具有重要意义。
信度,简单来说,就是测量的可靠性或稳定性。
想象一下,你用一把尺子去测量一个物体的长度,如果每次测量的结果都差不多,那么这把尺子就具有较高的信度;反之,如果每次测量的结果差异很大,那么这把尺子的信度就很低。
在心理测量中也是如此,如果一个心理测试在不同时间、不同情境下对同一个人进行测量,得到的结果都比较接近,那么这个测试就具有较好的信度。
信度主要有以下几种类型。
重测信度是指在不同时间对同一组被试进行相同的测量,然后计算两次测量结果之间的相关性。
例如,我们对一组学生进行智力测验,两周后再次对他们进行相同的测验,比较两次测验的得分,如果相关性较高,说明该测验的重测信度良好。
复本信度则是使用两个内容相似但形式不同的测验版本,对同一组被试进行测量,然后比较两个版本测验结果的一致性。
内部一致性信度常用于衡量一个测验内部各个项目之间的一致性程度,比如通过计算克朗巴哈系数来评估。
那么,如何提高心理测量的信度呢?首先,测验的题目应该表述清晰、明确,避免产生歧义。
其次,测量的环境要保持稳定,减少外部因素的干扰。
再者,增加测验的长度通常也能提高信度,因为更多的题目可以更全面地反映被试的特征,从而减少随机误差的影响。
接下来,我们谈谈效度。
效度指的是测量的准确性或有效性,即一个测验能够真正测量到它想要测量的东西的程度。
如果一个智力测验确实能够准确地反映一个人的智力水平,那么这个测验就具有较高的效度。
效度可以分为内容效度、结构效度和效标效度等类型。
内容效度关注的是测验的内容是否涵盖了所要测量的领域的主要方面。
比如,一个数学考试如果能够全面覆盖数学的各个重要知识点,那么它就具有较好的内容效度。
结构效度则考查测验是否符合某种理论上的结构或模型。
测量的信效度

评分者信度(Scorer Reliability)
最简单的估计方法就是随机抽取若干份答卷,由两 个独立的评分者打分,再求每份答卷两个评判分数 的相关系数。这种相关系数的计算可以用积差相关 方法,也可以采用斯皮尔曼等级相关方法。 如果评分者在三人以上,而且又采用等级记分时, 就需要用肯德尔和谐系数来求评分者信度。
评分者信度scorerreliability信度系数的类型误差变异的来源计算公式次数所需复本数目重测信度时间取样积差相关系数复本信度连续施测内容取样积差相关系数复本信度间隔施测时间取样内容取样积差相关系数分半信度内容取样积差相关系数需校正常用斯布公式同质性信度内容的异质性系数非二分法评分者信度评分者间的差积差相关系数斯皮尔曼等级相关系数肯德尔和谐系数在一般情况下间隔施测的复本信度最低因为很多因素有机会影响到分数
分半信度的估计
斯皮尔曼-布朗校正公式
rXX 2rx1x 2 1 rx1x 2
rx1x2 表示两半测验分数的相关系数
如果两半测验不等值,亦即两半测验分数没 有相同的平均数和标准差
弗朗那根公式:
r 2(1
S a Sb
2
2
Sx
2
)
Sa2 和Sb2 :两个半测验分数的变异数;Sx2 :测验总分 的变异数。
SX2 = SV2 + SI2 + SE2
SX2 SV2 SI2 SE2
ST2
系统误差的影响
系统误差可能是由以下几方面原因造成的:
1)所要测量的特质有多方面的含义,而量表本身未能
心理测量学—信度
内容抽样
复本信度 (间隔施测)
内容抽样,时间抽样
分半信度 内容抽样
同质性信度 内容的异质性
评分者信度 评分者之间的差异
Pearson相关
Pearson相关
Pearson相关
Pearson相关 Spearman-Brown校正 0,1计分:K-R法 多级计分:α系数 Pearson相关 Kender’W系数
rxx
88.7 0.97 72.06 117
练习:
以下是10名被试在同一测验中两次测量的得分 情况,计算该测验的重测信度。
测 验
ABCDE FGH
I
J
X1 70 82 65 69 77 90 45 85 66 72
X2 75 83 63 70 75 92 46 87 70 70
2、计算重测信度的几个假设:
被试
题目
1
2
3
4
5
6
7
8
1
0
1
0
0
0
0
0
0
2
1
0
1
1
0
1
0
0
3
1
1
0
1
0
0
0
0
4
1
1
1
1
1
0
0
0
5
1
1
1
1
1
1
1
1
6
1
1
0
1
1
1
1
1
7
1
0
1
1
1
0
0
0
8
1
1
1
1
心理测量第6章信度
第三节 影响信度的因素
➢一、样本特征 ➢二、测验长度 ➢三、测验难度 ➢四、时间间隔
一、样本特征
➢信度常用信度系数来表示,信度系数就 是相关系数,相关系数受样本是否异质 及样本团体平均能力水平的影响。
– (一)样本团体异质性的影响 – (二)样本团体平均能力水平的影响
请列举一些你所使用过或接触过的量表
思考: 量表的作用是什么?
你如何解释下述现象?
一个很聪明的孩子,测得智商是80分 一个学习很好的学生,考试成绩为60分 一个人缘很好的人,人际关系测量低于常
模值
量表帮助我们了解心理现象(心理特质),就像 尺子帮助我们测量身高。
思考:我们如何知道我们有多高? 有两个工具:尺子 / 秤
n
n 1
s2 t
v i
s2 t
(5.13)
➢ n为测验项目的数目, S2t是整个测验的总方差, Vi是测验每个项目的方差。
1、库德—理查逊公式20 (K—R20)
➢
r tt
n
n
i
s2 t
s2 t
pq
➢
(5.12a)
➢ n为测验项目的数目, S2t是整个测验的总方差, p是项目通过率,q是项目未通过率。
被试 A B C …
…
第一次测验 70 80 75 …
…..
第二次测验 77 72 83 …
….
重测信度计算公式:
r r
xx 12x 1Fra bibliotekx 2n
tt
x1x 2
x2 1
(
x )2 1
n
x2 2
(
x 2
【心理测量学 课件】信度c
meas = 7.07
b. Assume reliability is .9:
x = 10, Mean = 75
meas = 3.16
For applicant with a score of 70: There is a 95% chance that his/her true score is: a. 2 (7.07) or 70 14.14 or 55.86 and 84.14
Test Mean S.D. Reliability
Vocab. 10 Comp. 10 Trans. 10 Math. 10 Reas. 10
3 .80 3 .60 3 .90 3 .85 3 .85
rxy with Comp. .65
rxy with Trans. .33 .30
rxy with Math. .60 .55 .35
2 测量的标准误
• Standard Error of Measurement(SEM):测 量误差分布的标准差
• 假设在不受练习或疲劳等因素的影响下, 以同一测验重复测量相同受试者无限多次, 由于随机误差的影响,各测验实得分数与 真实分数的差,会呈正态分布
2.测量的标准误
• σe
SEM x 1 rtt
SEM 和个体测验分数
• 测量误差被假设呈正态分布,因此,可以 用来进行测量分数的区间估计
• For the 95% confidence interval,
X - 1.96 SEM < T < X + 1.96 SEM
SEM 和置信区间
meas = x 1 rtt
a. Assume reliability is .5:
测量的信度
2 KS X X (K X ) 2 ( K 1) S X
GO
BACK1
31
BACK2
32
心理测量
心理测量
3.内在一致性信度的适用范围
1 )内在一致性信度适用于同质性测验,而 不适用于异质性测验。 2)不适用于速度测验。
被试 M N O P Q
表2 100题纯速度测验的结果
做题总数 50 84 54 36 28 奇数题正确数 25 42 27 18 14 偶数题正确数 25 42 27 18 14
8
心理测量
心理测量 重测信度的计算举例
施测 时间间隔 相关系数 再施测
10名学生幸福感调查的两次施测分数
A X1 16 15 B 15 16 C 13 14 D 13 12 E 11 10 F 10 9 G 10 11 H 9 8 I 8 6 J 7 7
图1 重测信度图式
X2
9
10
心理测量
心理测量
2.使用前提条件
信度只是一个理论构念,由于真分数无法 直接获得,只能估计。估计信度的方法取 决于你认为误差是什么。 重测信度 复本信度 同质性信度 评分者信度 误差来源 时间 内容 内容 评价者/观察者
7
(一)重测(test-retest)信度
1.定义及计算:
用同一个测验对同一组被试在不同时间施测两次所得 结果的一致性程度,其大小等于同一组被试在两次测 验上所得分数的皮尔逊积差相关系数。又称稳定性信 度、再测信度、施测—再施测信度、跨时间一致性。
适当增加测验的长度使所有题目的难度接近正态分布控制在中等水平努力提高测题的区分度选取恰当的被试团体主试严格执行施测规程59心理测量四信度的作用评价测验解释分数用于计算测验分数的误差比较不同测验分数差异分数的信度相关的校正60心理测量几种心理测验的信度系数aiken1985测验类型信度成套成就测验066092098能力测验056090097成套倾向性测验026088096客观人格测验046085097兴趣测验042084093态度量表04707909820141111161心理测量信度的可接受水平不同功能测验信度接受水平不同能力测验和成就测验090以上095人格测验080085或更高自编学绩测验060以上个人评价与团队比较信度水平不同低于070070085之间高于085新编的测验信度应高于原有同类测验62心理测量测量的标准误standarderrormeasurement信度系数表明一个测验有多可信测量的标准误告诉我们一个人的分数究竟有多可信信度的另一种表达方式如果一个人在一个测验上做了无数次他的得分会形成一个分布他所得分数分布的平均值应是他的真分数观测分数分布的标准差应是测量的标准误差63心理测量测量的标准误与真分数估计围绕平均值真分数的分数的标准差称为平均值的标准误差或简称标准误sems1rtt12sem标准误tt测验的信度如果一个测验的平均值50tt
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
开心快乐每一天 2017考研已经拉开序幕,很多考生不知道如何选择适合自己的考研复习资料。中公考研辅导老师为考生准备了【心理学考研知识点讲解和习题】,希望可以助考生一臂之力。同时中公考研特为广大学子推出考研集训营、专业课辅导、精品网课、vip1对1等课程,针对每一个科目要点进行深入的指导分析,欢迎各位考生了解咨询。
第二节测量的信度 (一)信度的含义 1. 信度的定义 信度是指测量结果的稳定性程度或一致性程度,有时也叫测量的可靠性。信度有三种等价的定义: ① 信度(信度系数,reliability coefficient)是一个被测团体的真分数的变异数与实得分数
的变异数之比,即22xTssxxr,rxx代表测量的信度,sT2代表真分数变异,sx2代表总变异数,即实得分数的变异。 ② 信度是一个被试团体的真分数与实得分数的相关系数的平方,即2xTxxr。 ③ 信度是一个测验x与它的任意一个“平行测验”x'的相关系数,即x'xxxr。 注:上述三个定义中,信度是就一批人的数据而言的,并不是用同一种工具反复测量同一个人(定义3除外)。定义1和2只有理论意义,只有定义3才具有实际意义。 2. 描述测量一致性程度的指标还可以用信度指数Tx,它实际上是信度系数的平方根。 3. 信度的作用 ①信度是测量过程中所存在的随机误差大小的反映(注意:信度与测量中的系统误差无关); ②信度可以用来解释个人测验分数的意义(利用测量标准误来估计真分数的置信区间)
'xr-1xxESS
,SE为测量的标准误,Sx为实得分标准差,'rxx为测量的信度。 开心快乐每一天
真分数估计的置信区间:EcEcSZxTSZx,x为被试的观测分数,Zc是对应于某个统计检验显著性水平的标准正态分布下的临界值。 ③信度可以帮助进行不同测验分数的比较 通常来自不同测验的原始分数不能直接进行比较,必须转化成标准分数再进行比较。具体办法是采用“差异的标准误”来进行差异的显著性检验,其公式为:
yyxxdr-r-2SSE,S为相同尺度的标准分数的标准差,rxx和ryy分别是两个测验
的信度系数。 4. TIPs: ①一个测验可以有多个信度估计值,因而其误差估计值也会有多个,在实际工作中要注意选择; ②本理论假定同一个团体中所有人的测量误差都是相同的,但实际上水平高的人与水平低的人在做测量时会有不同的随机误差; ③测量的结果不能僵硬地看成是一个点,而应看成是一个以该点为中心,以SE的某个倍数为半径上下波动的一个范围。 (二)信度的估计方法 1. 重测信度(跨时间一致性信度) 含义:是指用同一个量表对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。重测信度的特点是用同一工具对同一批人测了两次,因此它只能在允许重测的情况下进行计算。重测信度反映了测量结果跨时间的稳定性。 前提条件: ① 所测量的心理特性必须是稳定的; ② 遗忘和练习的效果基本上相互抵消(智力测验的间隔时间一般在6个月左右); ③ 在两次施测的间隔内,被试在所要测查的心理特质方面没有获得更多的学习和训练。 需要注意的是: ① 在报告重测信度时,应说明两次施测的间隔,以及在此期间内被试的有关经历; ② 当某个测验设计多个年龄或年级等不同层次的考生时,重测信度不能直接用测验的原始分数进行估算,必须使用经过常模量表转换之后的量表分数或其他类型的标准分数进行估算,否则测量信度会被大大高估; 开心快乐每一天
③ 当极少数考生前测分数与后测分数相差特别明显时,重测信度往往会被低估。 2. 复本信度 含义:是指两个平行的测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。 类别:根据两个复本测验施测的时间不同,可分为等值性系数和稳定性与等值性系数。 ① 等值性系数的大小主要反映两个复本测验的题目差别所带来的变异情况。 ② 稳定性与等值性系数:两个复本测验是相距一段时间分两次施测的,此时,两个试卷题目间的差别、两次施测的情境、被试特质水平等方面的差别都会成为测验结果不一致的重要原因。 前提条件: ① 构造出两份或两份以上真正平行的测验(即A、B卷)(显然严格的平行测验是很难构造出来的); ② 被试要有条件接受两个测验,这种条件主要取决于时间、经费等几个方面; ③ 尽量减少练习、记忆或是迁移对被试的影响。 3. 分半信度 含义:是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。(分半信度的解释和等值性系数一样,即可以把对等的两半测验看成是在最短时距内施测的两个平行测验。此外,由于分半信度描述的是两半题目间的一致性,所以有时也被称为内部一致性系数) 前提条件: ① 通常是在只能施测一次或没有复本的情况下使用; ② 在使用斯皮尔曼-布朗公式时要求全体被试在两半测验上得分的变异数要相等; ③ 当两个测验无法分成对等的两半时,分半信度不宜使用; ④ 由于分半的方法很多(奇偶分半、难度分半、内容分半等),所以同一测验通常会有多个分半信度值。 计算 ① 分半信度的计算方法和等值复本信度的计算方法类似,只不过被试在两半测验上得分的相关系数只是半个测验的信度,还必须用斯皮尔曼-布朗公式来校正(使用这个公式计算需要满足两半测验分数的变异数相等): 开心快乐每一天
hhhhr
r
12
rxx,rhh为两半分数间的相关系数,rxx为整个测验的信度值。
② 如果两半测验分数的变异数不相等时,我们选择以下的公式进行计算: a. 弗朗那根公式:)1(2r222xxxbasss,式中,sa2和sb2分别表示所有被试在两半测验上得分的变异数,sx2表示全体被试在整个测验上总得分的变异数。 b. 卢仑公式:22dxx1rxss,式中sd2表示同一组被试在两半测验上得分之差的变异数,其它符号同a。 4. 同质性信度(内部一致性系数) 含义:是指测验内部所有题目间的一致性程度。这里的题目间的一致性程度有两层含义:其一是指所有题目测得都是同一种心理特质,其二是指所有题目得分之间都具有较高的正相关。 结果解释:同质性信度高,说明所测的都是同一种心理特质,而且题目得分之间也有高的正相关。所测特质单一,同质性信度不一定高,但是同质性信度高,所测特质一定单一。 计算:
① ijijrKrK)1(1rxx,式中,K为一个测验的题目数,ijr为所有题目间相关系数的平均值; ②库-理信度系数(K-R20)
)1(1r2xxxiiSqpKK,式中,K为一个测验的题目数,pi为答对第i题的人数
的比例,qi为答错第i题的人数的比例,Sx2为测验总分的变异,此公式仅适用于(0,1)记分的测验。 ③ K-R21
)qp1(1r2xxxSKKK,式中其它符号同K-R20,p和q分别表示题目的平均通过率
和平均失败率。此公式只有当所有题目的难度接近时才适用。 ④ 克龙巴赫系数 开心快乐每一天
)1(122xiSSKK,其中,Si2表示所有被试在第i题上的分数变异,其余指标
的含义与K-R20相同。克龙巴赫系数不要求测验题目仅是(0,1)记分,可以处理任何测验的内部一致性系数的计算问题。实际上②③只是克龙巴赫系数的特例。此外克龙巴赫系数还是所有可能的分半信度的平均值,它只是测量信度下界的一个估计值,即当值大时,测量信度必高,但当值小时,却不能断定测量信度不高。(注意学习老师上课的例题) ⑤荷伊特信度 用方差分量比描写测验内部一致性的方法:设有n名被试参加一有K个项目的测试,测验分数的总变异可分解为被试间变异SS人、项目间变异SS题和人与试题交互作用SS人×题三部分。荷伊特认为可用MS人作为被试方差估计值,用MS人×题作为误差方差估计值,并可用下
式作为测验信度的估计值:人题人xx-1rMSMS 4. 评分者信度 含义:是指多个评分者给同一批人的答卷进行评分的一致性程度。 计算:评分者为2人时,用积差相关或等级相关,评分者多于2人时用肯德尔和谐系数来算,但当被评价对象多于7人时,可用卡方检验。 (三)信度的影响因素 ① 被试方面:就个体而言,被试的身心健康状况、应试动机、注意力、耐心、求胜心、作答态度等因素会影响被试心理特质水平的稳定性;就团体而言,整个团体内部水平的离散程度以及团体的平均水平都会影响测量信度。 ② 主试方面:就施测者而言,若他不按指导手册中的规定施测,或故意制造紧张气氛,或给考生一定的暗示、协助等,则测量信度会大大降低;就阅卷评分者而言,若评分标准掌握不一,或前紧后送,甚至随心所欲,则会降低测量信度。 ③ 施测情境方面:考场是否那景、光线和通风情况是否良好、所需设备是否齐备、桌面是否合乎要求、空间宽窄是否恰当等都可能影响测量的信度。 ④ 测量工具方面:测量工具的稳定性是很重要的因素。一般来说,试题的取样、试题之间的同质性程度、试题的难度等是影响测验稳定性的主要因素。当测验中同质性的题目数量增多之后,同一心理特质被考查到的次数就增多,被试的成绩也就越能被有效地拉开,整个团体的测验分数分布就会更广,从而提高信度,可以用斯皮尔曼-布朗预测公式来计算: