第四章测量的信度

合集下载

测量的信度

测量的信度

信度的估计方法
• 重测信度 • 计算重测信度应当符合以下条件: 计算重测信度应当符合以下条件:
– 所测量的心理特性必须是稳定的。例如,成人的性格特点一般是稳定的, 所测量的心理特性必须是稳定的。例如,成人的性格特点一般是稳定的, 所以许多人格测验常使用重测信度。但是, 所以许多人格测验常使用重测信度。但是,刚入学儿童的识字量是极不 稳定的,只要两次施测的间隔时间稍长,儿童的识字量就会有很大变化。 稳定的,只要两次施测的间隔时间稍长,儿童的识字量就会有很大变化。 因此,重测信度不能用于这种情况, 因此,重测信度不能用于这种情况,因为测量结果的不一致很可能是被 试水平的变化所致,而不能说明测量工具是否稳定。 试水平的变化所致,而不能说明测量工具是否稳定。 – 遗忘和练习的效果基本上相互抵消。在做第一次测验时,被试可能会获 遗忘和练习的效果基本上相互抵消。在做第一次测验时, 得某种技巧,但只要间隔的时间适度, 得某种技巧,但只要间隔的时间适度,这种练习效果会基本上被遗忘掉 至于两次测验的间隔时间,这要根据问题的性质和测量目的而定。 的。至于两次测验的间隔时间,这要根据问题的性质和测量目的而定。 通常,智力测验的间隔时间一般在6个月左右。 通常,智力测验的间隔时间一般在6个月左右。 – 在两次施测的间隔时期内,被试在所要测查的心理特质方面没有获得更 在两次施测的间隔时期内, 多的学习和训练。这一点,也实际上是要保证被试具有稳定的心理特质。 多的学习和训练。这一点,也实际上是要保证被试具有稳定的心理特质。
信度的估计方法
• 同质性信度
– 同质性信度也叫内部一致性系数,它是指测验内部所有题目间的一致 同质性信度也叫内部一致性系数, 性程度。题目间的一致性含有两层意思: 性程度。题目间的一致性含有两层意思:一是指所有题目测的都是同 一种心理特质;二是指所有题目得分之间都具有较高的正相关。 一种心理特质;二是指所有题目得分之间都具有较高的正相关。值得 注意的是,这里讲的题目间的一致性是分数的一致, 注意的是,这里讲的题目间的一致性是分数的一致,而不是题目内容 或形式的一致。因此,若测验的各个题目得分有较高的正相关时, 或形式的一致。因此,若测验的各个题目得分有较高的正相关时,不 论题目内容和形式如何,测验为同质的。相反,既使所有题目看来都 论题目内容和形式如何,测验为同质的。相反, 好像测同一特质,但相关为零或负值时,这测验还是异质的。 好像测同一特质,但相关为零或负值时,这测验还是异质的。 – 题目内部的一致性主要受两方面变异的影响:一是内容的同质性。二 题目内部的一致性主要受两方面变异的影响:一是内容的同质性。 是所研究的行为的同质性。所要测量的内容或行为同质性程度越高, 是所研究的行为的同质性。所要测量的内容或行为同质性程度越高, 题目的内部一致性越高。 题目的内部一致性越高。 – 当一个测验具有较高的同质性信度时,说明测验主要测的是某一单个 当一个测验具有较高的同质性信度时, 心理特质,实测结果就是该特质水平的反映。 心理特质,实测结果就是该特质水平的反映。如果一个测验同质性信 度不高,则说明测验结果可能是几种心理特质的综合反映,这时, 度不高,则说明测验结果可能是几种心理特质的综合反映,这时,测 验结果不好解释。 验结果不好解释。一种好的办法是把一个异质的测验分解成多个具有 同质性的分测验,再根据被试在分测验上的得分分别作出解释。值得 同质性的分测验,再根据被试在分测验上的得分分别作出解释。 注意的是,一些表面上看起来是测量同一种心理特质的题目, 注意的是,一些表面上看起来是测量同一种心理特质的题目,如果其 题目间不具有较高的正相关,则不能认为它们具有同质性。 题目间不具有较高的正相关,则不能认为它们具有同质性。

第四章__测量信度

第四章__测量信度

五、评分者信度
评分者信度(Scorer
Reliability)指的是
多个评分者给同一批被试作答情况进行评分
的一致性程度。它主要用于主观性作品的评
价过程中,如论述题评分、作文题评分、歌
唱比赛的评分、设计作品的评分等。
如有A、B、C三位专家给6位应聘者的面试评分,结 果如下,试求评分者信度。
A 1 75 B 66 C 45
5、测量时间把握不恰当
6、评分不客观
(三)被试方面的可能影响
1、动机作用 2、测验经验 3、测验焦虑
4、生理变因(身心健康、疲劳等)
5、被试团体的异质性程度
同质性信度——内部一致性系数;
评分者信度——评分者之间的一致性。
第三节 影响信度的因素与提高方法 一、影响测量信度的主要因素
(一)测量工具的可能影响
1、题目样本的选择不当
题目样本不具代表性(偏题怪题),题目涵盖面过于
狭窄等。
2、题目含义及表达的模棱两可
题目含义不明确,语言表达模棱两可,会造成被试的
弗朗那根公式:rxx = 2 [ 1-( S2a + S2b )/ S2x ]
卢仑公式: rxx = 1- S2d / S2x
其中rxx是测验的分半信度, S2a 、 S2b表示被试
在两半测验上得分的方差,S2x表示被试在整个测验
上得分的方差, S2d表示被试在两半测验上得分之差 的方差。
四、同质性信度
5、测验长度偏短
测验长度偏短,难以全面考察被试的心理特质, 增加回答问题的随机性,从而降低信度。
6、特殊题型中靠猜测答题的可能性较大
猜测性将增加测验得分的随机性,从而降低测 验信度。
(二)施测过程的可能影响

第四章测量信度

第四章测量信度

第四章 测量信度一、填空题1、 根据一组被试在 两个平行或两个复本 测验上的得分计算的相关系数即为复本信度。

2、各种估计信度的方法都是对测验的一致性进行估计,但由于误差来源不同,它们研究的侧面各不相同,说明的是信度的不同方面。

其中,再测信度可用来估计________________________,复本信度可用来估计_________________,等值稳定性系数可用来估计_______________________,内部一致性系数可用来估计测验跨项目或两个分测验之间的一致性,评分者信度可用来估计测验跨评分者的一致性。

3、用同一个测验,对同一组被试前后施测两次,对两次测验分数求相关,其相关系数就叫 重测信度 。

4、一般认为经过训练的成对评分者之间的一致性达 0.90 以上,评分才是客观的。

5、再测信度又叫__________。

6、增加测验长度对信度产生的效果可用XXXX KK r K Kr r )1(1-+=公式来计算。

7、利用两平行形式测验测查同一批被试所得的两批观察分数,求其间的相关系数,跟____一样,也可求得测验的信度系数。

这种用平行形式相关求得的信度系数,因为特别强调两测验形式的____,所以又叫____。

8、复本信度又叫( )系数。

二、单项选择题信度的定义1、如果某测验的信度系数为0.80,那么该测验中真分数造成的变异占( A )A 80%B 20%C 64%D 36%2、信度之于效度正如(B )。

A 准确性之于一致性B 一致性之于准确性C 偏差数之于常模D 常模之于偏差数3、在能力测验中,代表测验量表的稳定性和一致性的指标是( C )。

(华南师大2001研) A 效度B 区分度C 信度D 难度4、信度指的是测量的( C )。

A 正确性B 针对性C 一致性D 有效性5、信度指数的( B )就是信度系数。

7、关于信度的指标正确的是( C )。

A 信度系数,即实得分数方差与真分数的方差的比值B 信度指数即是信度系数C 测量标准误与信度呈负相关D 测量标准误与信度呈正相关(相似题目)关于信度的指标,说法错误的是( D )。

心理测量 第四章 测量的信度

心理测量 第四章 测量的信度

什么样的测量要考虑重测信度?
• 人的多数心理特质如智力、性格等,具有 相对的稳定性,因此对这些心理特质的测 量,应该前后一致。因此,我们希望得到 测验稳定性的证据。 • 另外,我们还经常要用测验分数对人做预 测,此时测验分数的跨时间的稳定性更加 重要。
• 重测信度的优点在于提供有关测验结果是否随时 间而变异的资料,作为预测受试者将来行为表现 的依据。其缺点是易受学习和记忆的影响。 • 如果相隔时间太短,则记忆犹在,练习的影响很 大,往往造成假性的高相关;如果相隔时间太长, 那么身心特质的发展与学习经验的累积等均足以 改变测验分数的意义,使相关降低。 • 一般来说,最适宜的相隔时间随测验的目的和性 质而异,少者两周,多者半年。
2.信度可以帮助进行不同测验分数 的比较
• 来自不同测验的原始分数是无法直接比较 的,而必须将它们转换成相同尺度的标准 分数才能进行比较。 • 例:某班期末考试,张生语文、数学的成 绩转换成T分数(平均数为50、标准差为10) 分别为65和70,由此我们可以知道张生的 数学比语文考得稍好些,但二者差异是否 有意义,仍不清楚。
再测信度(稳定性) 复本信度,分半信度(等值性) , Alpha系数(同质性) 先后施测两个复本
评分者信度
一、重测信度
• 1.含义和计算 • 重测信度(test-retest reliability)指的是用同一个量表对 同一组被试施测两次所得结果的一致性程度。 • 重测信度能表示两次测验结果有无变动,反映测验分数的 稳定程度,所以又叫稳定性系数。 • 其计算公式即皮尔逊积差相关公式: • XX = [ (X X ) (YY )] / √ (X X )2. (YY )2 • 公式中,XX是重测信度,X及X是第一次测量的实得分数 及实得分数的平均值,Y及Y是第二次测量的实得分数及 实得分数的平均值。

测量的概念层次与信度

测量的概念层次与信度
◦ 文盲、半文盲、小学、初中、高中、大专、大学 、大学以上
定序测量(ordinal measurement )
特征:
◦ 不仅能将事物区分为不同的类别,而且还能反映事物或现象在高低 、大小、先后、强弱等序列上的差异。
◦ 数学特征是大于或小于 ◦ 所得到的信息比定类测量多一个或几个特征变量的信息 ◦ 对称性特征:区分同类与不同类 ◦ 不对称性特征:甲对乙有某种关系时,乙对甲并不一定具有同样的
语义差异量表
语义差异量表(semantic differential),也叫语义分化量表, 主要用来研究概念对于不同的人所具有的不同含义。
在社会学、社会心理学和心理学研究中,语义差异量表主要用 于文化的比较研究、个人及群体间差异的比较研究,以及人们 对周围环境或事物的态度、看法的研究等等。
语义差异量表
研究者通过对这些记号所代表的分数的统计和计算,来研究人 们对某一概念或事物的看法或态度,或者进行个人或团体间的 比较分析。
女同学
1
2
3
4
5
6
7
热情的
冷漠的
主动的
被动的
大方的
拘谨的
强的
弱的
快的
慢的
善的
恶的
概念的操作化
概念、变量和指标
概念(concept):
◦ 概念是对现象的抽象,是事物属性在人们主观上的反映。概念抽象 程度有高低之分,描述特征的明确程度也有差别。
指标选择的多样性
有些概念往往很难甚至不可能在具体现象中 找到其所对应的指标。
一个操作性定义往往也不能够完全代表一个 概念。
对抽象概念进行操作化时,往往在具体方法 和测量指标方面,存在多种不同的选择。
关于“夫妻权力”的案例

心理测量 第4章 心理与教育测量的信度

心理测量 第4章 心理与教育测量的信度

两个测验必须在项目的内容、形式、数量、难易、 时限、指导语等方面相同或相似; 两次测验的时间间隔要适当;

尽管复本信度的估计方法避免了再测法的 缺点,应用范围较广,但它本身也有一定的局 限性:

复本法只能减少而不能完全排除练习和记忆的影响; 对于许多测验来说,建立复本是相当困难的; 由于第二个测验只改变了题目的内容,已经掌握解 题原则,可以很容易迁移到同类问题中去。
2 K为测验题目数,Si2 为某一题目分数的变异数,Sx 为测验 总分的变异数
采用SPSS计算信度
数 据 库
同 质 性 信 度 计 算 方 式
结果
输入40题
结果
评分者信度
标准化测验一般都有较为严格的评分程序。
对于客观性试题来讲,评分所引起的误差是可 以忽略不计的,但是对于一些主观题来讲,评 分者之间的变异是产生误差的重要原因之一。
测验的信度。
根据统计学里讲的区间估计的方法,
我们可以得知:个人在每次测量中所得分
数X有95%的可能性在真分数加减1.96个
标准误的范围内,即
X 1.96SE T X 1.96SE

两种测验分数的比较 来自不同测验的原始分数是无法直接 比较的,只有参照统一团体的平均分数, 将它们转换成相同尺度的标准分数(如T分 数或Z分数),才能进行比较。为了说明个 人在两种测验上的差异,我们可以用差异 标准误来检验其差异的显著性,其公式:
信度是测量过程中随机误差大小的反应 信度可以用来解释个体测验分数的意义 信度可以帮助不同测验分数之间进行比较

一个测验有多个信度估计值,因而误差估计值也有 多个,我们在实际工作中要注意选择最适合某一特 殊情况的信度估计来解决问题。

第四章 测验信度作业

第四章 测验信度作业

第四章测量信度一、单选题1.速度测验的信度应以( c )取得。

dA.奇偶法 B.筛选法 C.反应时法 D.重测法2.在其他条件均等的情况下,测验长度和信度之间的关系是( d )。

bA.测验越长,信度越低B.测验越长,信度越高C.没有关系D.上述说法都不正确3.计算一项测验的分半信度最常用的方法是比较( b )。

A.测验的前半部分与后半部分的得分。

B.奇数项目与偶数项目的得分。

C.将测验随机分为两部分,比较这两部分的得分。

.D.上述方法都可以。

4.一个40道题目的测验其奇偶分半后的信度为0.50,那么该测验的信度接近多少?( b )A. 0.50B. 0.67C. 0.80D. 1.05.当测验的信度减少(接近0)时,测量的标准误将会怎样变化(c )?A.减小,趋向于零。

B.只要趋向于1.0,它就会要么增大,要么减小。

C.增大,趋向于测验的标准差。

D.增大,逼近无限大。

6.再测信度所考虑的误差来源是(d )所带来的随机影响。

A.形式的不同B.题目的不同C.考生的不同D.时间的不同7.在考查评分者信度时,如果三人以上评阅数份试卷,则需计算( a )。

A.肯德尔和谐系数B.等级相关系数C.皮尔逊积差相关系数D.克伦巴赫α系数8.(a )是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得结果的一致程度。

A.信度B.效度C.难度D.区分度9.信度只受(d )的影响。

bA .系统误差 B.随机误差 C.恒定效应 D.概化理论10.复本信度又称等值性系数。

它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系效。

复本信度反映的是测验在( c )上的等值性。

dA.时间B.题目C.评分D.内容11.分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系效。

这个相关系数就代表了( d )内容取样的一致程度。

第4章 测量的信度与效度

第4章 测量的信度与效度
2 2 X T2 E
实得分数的方差等于真分数的方差与误差方差之和。
调研人员应运用所掌握的统计知识,分析其是属于系统 误差还是属于随机误差。 系统误差会使调查结果有误,所以应尽量避免。 随机误差可通过提高样本代表性、增大样本量来减少。
信度一般规定是:真分数的方差在总体方差中所占的比 重,即信度系数:
当题目间的相关系数越大时,α系数也会越大。 当题目数目n越多时,S
2 H
n 值越大, 越接近于0, 2 SH n 1
2 S i
越接近于1,故α系数也会越接近于1。
要做信度分析须先检查每个题目是否都是同方向的,即 都是正面问法,反向问题需要做处理后才可以加入分析。
在计算α系数时,应该注意有些调查量表测量的内容包 含几个领域,这时宜分别计算各个领域的α系数。 克朗巴哈α系数适用于项目多重计分的测验数据或问卷 数据,可以用该系数测量Likert量表的信度。 在基础研究中,信度至少应达到0.8才可接受; 在探索性研究中,信度只要达到0.7就可以接受; 在旅游调查测量实践中,信度只要达到0.6即可接受。 α系数通常与量表题目数量有关,题目数量越多,α系 数就越大。
理想(甚佳,信度 佳(信度高) 很高) 非常理想(信度非 非常理想(甚佳, 常好) 信度很高)
二、克朗巴哈 α系数的手工计算
以一份有8个题项的量表为例,8个题项均为正向题, 受试样本数有6位,采用Likert 5点量表填答,获得调查 结果如下表:
题号 样本
量表试题
01 5 5 5 5 5 4 02 1 1 2 1 1 1 03 2 2 2 2 2 1 04 5 4 5 5 5 5 05 2 3 3 3 3 3 06 5 5 5 5 5 4 07 4 5 5 5 5 4 08 3 2 2 3 2 2 总分 27 27 29 29 28 24
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11
Measurement Reliability
测验类型
信度系数



学业成就测验
0.66
0.92
0.98
学术能力测验
0.56
0.90
0.97
特殊能力倾向测验 0.26
0.88
0.96
人格测验
0.46
0.85
0.97
兴趣测验
0.42
0.84
0.93
态度测验
0.47
0.79
0.98
注:表中数据来源,Lewis R. Aiken: Psychological testing and assessment (eighth edition), Allyn and Bacon, Inc, 1994.
88~112
20
Measurement Reliability
注意几点: (1)SE对真分数做的是区间估计,不可能由此得到一
个确切的点。这就是说,测验分数不是一个定点,而 是具有一定的分布范围。因此,两次测验分数之间存 在差异是很正常的。 (2)置信水平确定后,估计的精度主要取决于SE,SE 越小,范围越小,估计就越精确,反之也然。 (3)真分数不能等同于真正能力或心理特质,真分数 中包括了系统误差。
27
Measurement Reliability
一般来说,重测的时间间隔越短,那么各种施测情 境的变化就越小,重测信度系数就会越大。
重测信度系数较大时,说明该测量工具前、后两次 的测量结果比较一致。结果具有较好的跨时间上的 稳定性。
3.一个包含10个题目的测验,信度为0.50,若增至 50个题目,其信度将是多少?
4.书本P57-58第2、3题
25
Measurement Reliability
第二节 信度的评估方法
一、重测信度 二、复本信度 三、内部一致性信度 四、评分者信度
26
Measurement Reliability
2.信度系数只是对测量分数不一致程度的估计, 并没有指出不一致的原因。
3.获得较高的信度系数并不是心理测量追求的 最终目的,它只是迈向目标的一步,是使测量 有效的一个必要条件。
10
Measurement Reliability
信度系数要达到多高才可以接受呢?
最理想的是rxx =1.00,但办不到 研究结果显示,能力,成就测验都在0.90以上,有的还
rxx代表测量的信度,S2T代 表真分数的变异数, S2x代 表是实得分数的变异数,即 总变异数。
定义2:信度是被试团体真分数与实得分数相关系数的平方
rXX

2 TX
定义3:信度是一个测验X(A卷)与它的任意一个平行测验
(B卷)的相关系数
rXX XX
4
Measurement Reliability
7
Measurement Reliability
r 信度系数是表示测量结果的稳定性程度的指标。记为: XX
信度系数的值域:?[0,1]
相关系数的值域是[-1,+1] ,信度系数的值域:[0,1], 为什么?
没有百分之百可靠的测量,因此,rXX=1只是理 论上的值,实际当中是不会存在的。
8
Measurement Reliability
Measurement Reliability
第四章测量的信度
1
Measurement Reliability
导学
信度是评价测验优劣的重要指标,了解信度的相关知识是 编制优质高效测验的前提。通过本章的学习我们可解 决三个问题: 一、明确信度的理论定义及操作定义;(难点) 二、掌握几种常模参照测验的信度估计方法;(重点) 三、了解影响信度的因素,在信度估计时尽量避免由此 造成的误差;提高信度的方法。
我们可以用测量的标准误来估计个人测验的真分数的大小。 如果选用95%的可靠性水平(置信水平),即显著性水
平(a值)为.05,,真分数有95%的可能落入X ± SE , 即X ±1.96 SE的范围之内,也可以写成X-1.96SE T X+1.96 SE,SE则用公式代入。或有5%的可能落入 这范围之外。这实际上也表明了再测时分数改变的可能范 围。 X―1.96SE<T≤X+1.96SE
15
Measurement Reliability
2.确定信度可以接受的水平
最理想的是rxx =1.00,但办不到 研究结果显示,能力,成就测验都在0.90以上,有的
还可以达到0.95以上;人格测验、兴趣、态度、价值观 等都在0.80~0.85。 一般原则: ⑴当rxx﹤0.70时,测验不能用于对个人作出评价或预 测,而且不能做团体比较; ⑵当0.70≤rxx <0.85时,可用于团体比较; ⑶当rxx≥0.85时,才能用来鉴别或预测个人成就或作 为。 另一原则:新编的测验信度应该高于缘由的同类测验 或相似测量
13
Measurement Reliability
此时,个人在两次测验中的分数差异就是测量误差。 据此可制成误差分数的分布。这个分布的标准差(误 差分布的标准差)我们称之为测量的标准误,是表示 测量误差的大小的指标,其计算公式为:
SE S x 1 rxx
SE表示测量的标准误,即误差分布的标准差;Sx表示实 得分数的标准差;rxx表示信度系数。
14
Measurement Reliability
三、信度的作用(信度与测验分数的解释)
1.信度是测量过程中所存在的随机误差大小的反映
(解释真实分数与实得分数的相关) 信度系数可以解释为:总的方差中有多少比例是由真实
分数的方差决定的,也就是测验的总变异中真分数造成 的变异占百分之几。 例如,r=0.9时,实得分数90%的变异来自真分数,10% 来自误差。r=1呢?r=0呢? 信度系数从0.00~1.00,代表了从缺乏信度到完全可信 的所有状况 信度系数也告诉我们误差有多大
12
Measurement Reliability
2.标准误
信度系数仅表示一组测量的实得分数与真分数的符合 程度,但并没有直接指出个人测验分数的变异量。由 于误差存在,一个人所得分数有时比真分数高,有时 比真分数低,有时二者相等。理论上我们可以对一个 人施测无数次测验,然后求得分数的平均数和标准差。 这个平均数就是这个人的真分数,而标准差就是测量 误差大小的指标。但在实际上是行不通的。然后,我 们可以用一组被试两次测量结果来代替对同一人的反 复施测,以估计测量误差的变异数。
可以达到0.95以上;人格测验、兴趣、态度、价值观等都 在0.80~0.85。 一般原则: ⑴当rxx﹤0.70时,测验不能用于对个人作出评价或预测, 而且不能做团体比较; ⑵当0.70≤rxx <0.85时,可用于团体比较; ⑶当rxx≥0.85时,才能用来鉴别或预测个人成就或作为。 另一原则:新编的测验信度应该高于原有的同类测验或 相似测量
首先计算出差异分数的标准误: 在统计上,经常要求两个分数的差异程度达到0.05的显著
水平,才能承认不是误差的影响。因此,将差异标准误 (7.5)乘以1.96,结果为14.7,这表明个体在韦氏测验 两半得分的差异高于大约15分,才能达到0.05显著水平。 上述被试的差异分数110-102=8是不显著的。
由于真分数的方差无法统计,可转化为: rxx=(S2x-S2E)/S2x =1- S2E/S2x
该定义有两点需要注意: 第一、信度指的是一组测验分数或一列测量的特性,而
不是个人分数的特性; 第二 、真分数的变异数是不能直接测量的,因此信度是
一个理论上构想的概念,只能根据一组实得分数做出 估计。
5
23
Measurement Reliability
课堂练习
1.某个被试的测验IQ=100,再测的分数可能是多少? (已知测验的标准差为15,信度系数为0.90).
95%的可能在90.6~109.4之间
2.被试在韦氏智力测验中言语智商为102,操作智商 为110。两个分测验都是以100为平均数,15为标准 差的标准分数。假设言语测验和操作测验的分半信度 分别为0.93和0.94.问其操作智商是否显著高于言语 智商?
一、重测信度(Test-Retest Reliability)
(一)含义
也叫再测信度 1.重复测验:同一量表,同一被试群体,在不同时间,
两次施测。 2.重测信度:用同一测验,对同一组被试前后两次施测,
两次测验分数之间的相关程度(用相关系数来表示)就 是再测信度。 3.重测信度实质:主要考察了一个测量工具是否能够保 证在不同时间测量结果的一致性,表示测验结果的稳定 性。故称之为稳定性系数(Coefficient of Stability) 4.形式:施测A1—适当时间—再施测A2
16
Measurement Reliability
3.解释个人分数的意义
作用:其一是估计真实分数的范围;其二是了解实 得分数再测时可能的变化情形。 这就是测量标准误 的应用。
SE Sx 1 rxx
真分数的估计区间为:
X-1.96SE T X+1.96 SE
17
Measurement Reliability
24
Measurement Reliability
课后作业
1.某智力测验的信度r=0.75,某次施测得到标准差为 3.00,则该测验的测量标准误是多少,若某被试得分 为100,试估计其真分数1-=.95的置信区间
2. 某测验的信度为0.75。要使该测验的信度达到 0.90,须增加多少题目(原测验长度的多少倍) ?
21
Measurement Reliability
4.比较不同测验分数的差异
相关文档
最新文档