第四章测量的信度

合集下载

测量的信度

信度的估计方法
• 重测信度 • 计算重测信度应当符合以下条件：计算重测信度应当符合以下条件：
– 所测量的心理特性必须是稳定的。例如，成人的性格特点一般是稳定的，所测量的心理特性必须是稳定的。例如，成人的性格特点一般是稳定的，所以许多人格测验常使用重测信度。但是，所以许多人格测验常使用重测信度。但是，刚入学儿童的识字量是极不稳定的，只要两次施测的间隔时间稍长，儿童的识字量就会有很大变化。稳定的，只要两次施测的间隔时间稍长，儿童的识字量就会有很大变化。因此，重测信度不能用于这种情况，因此，重测信度不能用于这种情况，因为测量结果的不一致很可能是被试水平的变化所致，而不能说明测量工具是否稳定。试水平的变化所致，而不能说明测量工具是否稳定。 – 遗忘和练习的效果基本上相互抵消。在做第一次测验时，被试可能会获遗忘和练习的效果基本上相互抵消。在做第一次测验时，得某种技巧，但只要间隔的时间适度，得某种技巧，但只要间隔的时间适度，这种练习效果会基本上被遗忘掉至于两次测验的间隔时间，这要根据问题的性质和测量目的而定。的。至于两次测验的间隔时间，这要根据问题的性质和测量目的而定。通常，智力测验的间隔时间一般在６个月左右。通常，智力测验的间隔时间一般在６个月左右。 – 在两次施测的间隔时期内，被试在所要测查的心理特质方面没有获得更在两次施测的间隔时期内，多的学习和训练。这一点，也实际上是要保证被试具有稳定的心理特质。多的学习和训练。这一点，也实际上是要保证被试具有稳定的心理特质。
信度的估计方法
• 同质性信度
– 同质性信度也叫内部一致性系数，它是指测验内部所有题目间的一致同质性信度也叫内部一致性系数，性程度。题目间的一致性含有两层意思：性程度。题目间的一致性含有两层意思：一是指所有题目测的都是同一种心理特质；二是指所有题目得分之间都具有较高的正相关。一种心理特质；二是指所有题目得分之间都具有较高的正相关。值得注意的是，这里讲的题目间的一致性是分数的一致，注意的是，这里讲的题目间的一致性是分数的一致，而不是题目内容或形式的一致。因此，若测验的各个题目得分有较高的正相关时，或形式的一致。因此，若测验的各个题目得分有较高的正相关时，不论题目内容和形式如何，测验为同质的。相反，既使所有题目看来都论题目内容和形式如何，测验为同质的。相反，好像测同一特质，但相关为零或负值时，这测验还是异质的。好像测同一特质，但相关为零或负值时，这测验还是异质的。 – 题目内部的一致性主要受两方面变异的影响：一是内容的同质性。二题目内部的一致性主要受两方面变异的影响：一是内容的同质性。是所研究的行为的同质性。所要测量的内容或行为同质性程度越高，是所研究的行为的同质性。所要测量的内容或行为同质性程度越高，题目的内部一致性越高。题目的内部一致性越高。 – 当一个测验具有较高的同质性信度时，说明测验主要测的是某一单个当一个测验具有较高的同质性信度时，心理特质，实测结果就是该特质水平的反映。心理特质，实测结果就是该特质水平的反映。如果一个测验同质性信度不高，则说明测验结果可能是几种心理特质的综合反映，这时，度不高，则说明测验结果可能是几种心理特质的综合反映，这时，测验结果不好解释。验结果不好解释。一种好的办法是把一个异质的测验分解成多个具有同质性的分测验，再根据被试在分测验上的得分分别作出解释。值得同质性的分测验，再根据被试在分测验上的得分分别作出解释。注意的是，一些表面上看起来是测量同一种心理特质的题目，注意的是，一些表面上看起来是测量同一种心理特质的题目，如果其题目间不具有较高的正相关，则不能认为它们具有同质性。题目间不具有较高的正相关，则不能认为它们具有同质性。

第四章__测量信度

五、评分者信度
评分者信度（Scorer
Reliability）指的是
多个评分者给同一批被试作答情况进行评分
的一致性程度。它主要用于主观性作品的评
价过程中，如论述题评分、作文题评分、歌
唱比赛的评分、设计作品的评分等。
如有A、B、C三位专家给6位应聘者的面试评分，结果如下，试求评分者信度。
A 1 75 B 66 C 45
5、测量时间把握不恰当
6、评分不客观
（三）被试方面的可能影响
1、动机作用 2、测验经验 3、测验焦虑
4、生理变因（身心健康、疲劳等）
5、被试团体的异质性程度
同质性信度——内部一致性系数；
评分者信度——评分者之间的一致性。
第三节影响信度的因素与提高方法一、影响测量信度的主要因素
（一）测量工具的可能影响
1、题目样本的选择不当
题目样本不具代表性（偏题怪题），题目涵盖面过于
狭窄等。
2、题目含义及表达的模棱两可
题目含义不明确，语言表达模棱两可，会造成被试的
弗朗那根公式：rxx = 2 [ 1-（ S2a + S2b ）/ S2x ]
卢仑公式: rxx = 1- S2d / S2x
其中rxx是测验的分半信度， S2a 、 S2b表示被试
在两半测验上得分的方差，S2x表示被试在整个测验
上得分的方差， S2d表示被试在两半测验上得分之差的方差。
四、同质性信度
5、测验长度偏短
测验长度偏短，难以全面考察被试的心理特质，增加回答问题的随机性，从而降低信度。
6、特殊题型中靠猜测答题的可能性较大
猜测性将增加测验得分的随机性，从而降低测验信度。
（二）施测过程的可能影响

第四章测量信度

第四章测量信度一、填空题1、根据一组被试在两个平行或两个复本测验上的得分计算的相关系数即为复本信度。

2、各种估计信度的方法都是对测验的一致性进行估计，但由于误差来源不同，它们研究的侧面各不相同，说明的是信度的不同方面。

其中，再测信度可用来估计________________________，复本信度可用来估计_________________，等值稳定性系数可用来估计_______________________，内部一致性系数可用来估计测验跨项目或两个分测验之间的一致性，评分者信度可用来估计测验跨评分者的一致性。

3、用同一个测验，对同一组被试前后施测两次，对两次测验分数求相关，其相关系数就叫重测信度。

4、一般认为经过训练的成对评分者之间的一致性达 0.90 以上，评分才是客观的。

5、再测信度又叫__________。

6、增加测验长度对信度产生的效果可用XXXX KK r K Kr r )1(1-+=公式来计算。

7、利用两平行形式测验测查同一批被试所得的两批观察分数，求其间的相关系数，跟＿＿＿＿一样，也可求得测验的信度系数。

这种用平行形式相关求得的信度系数，因为特别强调两测验形式的＿＿＿＿，所以又叫＿＿＿＿。

8、复本信度又叫（）系数。

二、单项选择题信度的定义1、如果某测验的信度系数为0.80，那么该测验中真分数造成的变异占（ A ）A 80%B 20%C 64%D 36%2、信度之于效度正如（B ）。

A 准确性之于一致性B 一致性之于准确性C 偏差数之于常模D 常模之于偏差数3、在能力测验中，代表测验量表的稳定性和一致性的指标是（ C ）。

（华南师大2001研） A 效度B 区分度C 信度D 难度4、信度指的是测量的（ C ）。

A 正确性B 针对性C 一致性D 有效性5、信度指数的（ B ）就是信度系数。

7、关于信度的指标正确的是（ C ）。

A 信度系数，即实得分数方差与真分数的方差的比值B 信度指数即是信度系数C 测量标准误与信度呈负相关D 测量标准误与信度呈正相关（相似题目）关于信度的指标，说法错误的是（ D ）。

心理测量第四章测量的信度

什么样的测量要考虑重测信度？
• 人的多数心理特质如智力、性格等，具有相对的稳定性，因此对这些心理特质的测量，应该前后一致。因此，我们希望得到测验稳定性的证据。 • 另外，我们还经常要用测验分数对人做预测，此时测验分数的跨时间的稳定性更加重要。
• 重测信度的优点在于提供有关测验结果是否随时间而变异的资料，作为预测受试者将来行为表现的依据。其缺点是易受学习和记忆的影响。 • 如果相隔时间太短，则记忆犹在，练习的影响很大，往往造成假性的高相关；如果相隔时间太长，那么身心特质的发展与学习经验的累积等均足以改变测验分数的意义，使相关降低。 • 一般来说，最适宜的相隔时间随测验的目的和性质而异，少者两周，多者半年。
2．信度可以帮助进行不同测验分数的比较
• 来自不同测验的原始分数是无法直接比较的，而必须将它们转换成相同尺度的标准分数才能进行比较。 • 例：某班期末考试，张生语文、数学的成绩转换成T分数（平均数为50、标准差为10）分别为65和70，由此我们可以知道张生的数学比语文考得稍好些，但二者差异是否有意义，仍不清楚。
再测信度（稳定性）复本信度，分半信度(等值性）， Alpha系数（同质性）先后施测两个复本
评分者信度
一、重测信度
• 1．含义和计算 • 重测信度（test-retest reliability）指的是用同一个量表对同一组被试施测两次所得结果的一致性程度。 • 重测信度能表示两次测验结果有无变动，反映测验分数的稳定程度，所以又叫稳定性系数。 • 其计算公式即皮尔逊积差相关公式： • XX = [ (X X ) (YY )] / √ (X X )2. (YY )2 • 公式中，XX是重测信度，X及X是第一次测量的实得分数及实得分数的平均值，Y及Y是第二次测量的实得分数及实得分数的平均值。

测量的概念层次与信度

◦ 文盲、半文盲、小学、初中、高中、大专、大学、大学以上
定序测量（ordinal measurement ）
特征：
◦ 不仅能将事物区分为不同的类别，而且还能反映事物或现象在高低、大小、先后、强弱等序列上的差异。
◦ 数学特征是大于或小于 ◦ 所得到的信息比定类测量多一个或几个特征变量的信息 ◦ 对称性特征：区分同类与不同类 ◦ 不对称性特征：甲对乙有某种关系时，乙对甲并不一定具有同样的
语义差异量表
语义差异量表（semantic differential），也叫语义分化量表，主要用来研究概念对于不同的人所具有的不同含义。
在社会学、社会心理学和心理学研究中，语义差异量表主要用于文化的比较研究、个人及群体间差异的比较研究，以及人们对周围环境或事物的态度、看法的研究等等。
语义差异量表
研究者通过对这些记号所代表的分数的统计和计算，来研究人们对某一概念或事物的看法或态度，或者进行个人或团体间的比较分析。
女同学
1
2
3
4
5
6
7
热情的
冷漠的
主动的
被动的
大方的
拘谨的
强的
弱的
快的
慢的
善的
恶的
概念的操作化
概念、变量和指标
概念（concept）：
◦ 概念是对现象的抽象，是事物属性在人们主观上的反映。概念抽象程度有高低之分，描述特征的明确程度也有差别。
指标选择的多样性
有些概念往往很难甚至不可能在具体现象中找到其所对应的指标。
一个操作性定义往往也不能够完全代表一个概念。
对抽象概念进行操作化时，往往在具体方法和测量指标方面，存在多种不同的选择。
关于“夫妻权力”的案例

心理测量第4章心理与教育测量的信度

两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似；两次测验的时间间隔要适当；

尽管复本信度的估计方法避免了再测法的缺点，应用范围较广，但它本身也有一定的局限性：

复本法只能减少而不能完全排除练习和记忆的影响；对于许多测验来说，建立复本是相当困难的；由于第二个测验只改变了题目的内容，已经掌握解题原则，可以很容易迁移到同类问题中去。
2 K为测验题目数，Si2 为某一题目分数的变异数，Sx 为测验总分的变异数
采用SPSS计算信度
数据库
同质性信度计算方式
结果
输入40题
结果
评分者信度
标准化测验一般都有较为严格的评分程序。
对于客观性试题来讲，评分所引起的误差是可以忽略不计的，但是对于一些主观题来讲，评分者之间的变异是产生误差的重要原因之一。
测验的信度。
根据统计学里讲的区间估计的方法，
我们可以得知：个人在每次测量中所得分
数X有95%的可能性在真分数加减1.96个
标准误的范围内，即
X 1.96SE T X 1.96SE

两种测验分数的比较来自不同测验的原始分数是无法直接比较的，只有参照统一团体的平均分数，将它们转换成相同尺度的标准分数（如T分数或Z分数），才能进行比较。为了说明个人在两种测验上的差异，我们可以用差异标准误来检验其差异的显著性，其公式：
信度是测量过程中随机误差大小的反应信度可以用来解释个体测验分数的意义信度可以帮助不同测验分数之间进行比较

一个测验有多个信度估计值，因而误差估计值也有多个，我们在实际工作中要注意选择最适合某一特殊情况的信度估计来解决问题。

第四章测验信度作业

第四章测量信度一、单选题1.速度测验的信度应以( c )取得。

dA．奇偶法 B.筛选法 C.反应时法 D.重测法2.在其他条件均等的情况下，测验长度和信度之间的关系是( d )。

bA.测验越长，信度越低B.测验越长，信度越高C.没有关系D.上述说法都不正确3.计算一项测验的分半信度最常用的方法是比较( b )。

A.测验的前半部分与后半部分的得分。

B.奇数项目与偶数项目的得分。

C.将测验随机分为两部分,比较这两部分的得分。

.D.上述方法都可以。

4.一个40道题目的测验其奇偶分半后的信度为0.50,那么该测验的信度接近多少?( b )A. 0.50B. 0.67C. 0.80D. 1.05.当测验的信度减少(接近0)时,测量的标准误将会怎样变化(c )?A.减小,趋向于零。

B.只要趋向于1.0,它就会要么增大,要么减小。

C.增大,趋向于测验的标准差。

D.增大,逼近无限大。

6.再测信度所考虑的误差来源是(d )所带来的随机影响。

A.形式的不同B.题目的不同C.考生的不同D.时间的不同7.在考查评分者信度时,如果三人以上评阅数份试卷,则需计算( a )。

A.肯德尔和谐系数B.等级相关系数C.皮尔逊积差相关系数D.克伦巴赫α系数8.(a )是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得结果的一致程度。

A.信度B.效度C.难度D.区分度9.信度只受(d )的影响。

bA ．系统误差 B.随机误差 C.恒定效应 D.概化理论10.复本信度又称等值性系数。

它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系效。

复本信度反映的是测验在( c )上的等值性。

dA.时间B.题目C.评分D.内容11.分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系效。

这个相关系数就代表了( d )内容取样的一致程度。

第4章测量的信度与效度

2 2 X T2 E
实得分数的方差等于真分数的方差与误差方差之和。
调研人员应运用所掌握的统计知识，分析其是属于系统误差还是属于随机误差。系统误差会使调查结果有误，所以应尽量避免。随机误差可通过提高样本代表性、增大样本量来减少。
信度一般规定是：真分数的方差在总体方差中所占的比重，即信度系数：
当题目间的相关系数越大时，α系数也会越大。当题目数目n越多时，S
2 H
n 值越大，越接近于0， 2 SH n 1
2 S i
越接近于1，故α系数也会越接近于1。
要做信度分析须先检查每个题目是否都是同方向的，即都是正面问法，反向问题需要做处理后才可以加入分析。
在计算α系数时，应该注意有些调查量表测量的内容包含几个领域，这时宜分别计算各个领域的α系数。克朗巴哈α系数适用于项目多重计分的测验数据或问卷数据，可以用该系数测量Likert量表的信度。在基础研究中，信度至少应达到0.8才可接受；在探索性研究中，信度只要达到0.7就可以接受；在旅游调查测量实践中，信度只要达到0.6即可接受。 α系数通常与量表题目数量有关，题目数量越多，α系数就越大。
理想（甚佳，信度佳（信度高）很高）非常理想（信度非非常理想（甚佳，常好）信度很高）
二、克朗巴哈 α系数的手工计算
以一份有8个题项的量表为例，8个题项均为正向题，受试样本数有6位，采用Likert 5点量表填答，获得调查结果如下表：
题号样本
量表试题
01 5 5 5 5 5 4 02 1 1 2 1 1 1 03 2 2 2 2 2 1 04 5 4 5 5 5 5 05 2 3 3 3 3 3 06 5 5 5 5 5 4 07 4 5 5 5 5 4 08 3 2 2 3 2 2 总分 27 27 29 29 28 24

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

11
Measurement Reliability
测验类型
信度系数
低
中
高
学业成就测验
0.66
0.92
0.98
学术能力测验
0.56
0.90
0.97
特殊能力倾向测验 0.26
0.88
0.96
人格测验
0.46
0.85
0.97
兴趣测验
0.42
0.84
0.93
态度测验
0.47
0.79
0.98
注：表中数据来源，Lewis R. Aiken: Psychological testing and assessment (eighth edition), Allyn and Bacon, Inc, 1994.
88～112
20
Measurement Reliability
注意几点：（1）SE对真分数做的是区间估计，不可能由此得到一
个确切的点。这就是说，测验分数不是一个定点，而是具有一定的分布范围。因此，两次测验分数之间存在差异是很正常的。（2）置信水平确定后，估计的精度主要取决于SE，SE 越小，范围越小，估计就越精确，反之也然。（3）真分数不能等同于真正能力或心理特质，真分数中包括了系统误差。
27
Measurement Reliability
一般来说，重测的时间间隔越短，那么各种施测情境的变化就越小，重测信度系数就会越大。
重测信度系数较大时，说明该测量工具前、后两次的测量结果比较一致。结果具有较好的跨时间上的稳定性。
3.一个包含10个题目的测验，信度为0.50，若增至 50个题目，其信度将是多少？
4.书本P57－58第2、3题
25
Measurement Reliability
第二节信度的评估方法
一、重测信度二、复本信度三、内部一致性信度四、评分者信度
26
Measurement Reliability
2.信度系数只是对测量分数不一致程度的估计，并没有指出不一致的原因。
3.获得较高的信度系数并不是心理测量追求的最终目的，它只是迈向目标的一步，是使测量有效的一个必要条件。
10
Measurement Reliability
信度系数要达到多高才可以接受呢？
最理想的是rxx ＝1.00,但办不到研究结果显示，能力，成就测验都在0.90以上，有的还
rxx代表测量的信度，S2T代表真分数的变异数， S2x代表是实得分数的变异数，即总变异数。
定义2：信度是被试团体真分数与实得分数相关系数的平方
rXX

2 TX
定义3：信度是一个测验X（A卷）与它的任意一个平行测验
（B卷）的相关系数
rXX XX
4
Measurement Reliability
7
Measurement Reliability
r 信度系数是表示测量结果的稳定性程度的指标。记为： XX
信度系数的值域：？[0,1]
相关系数的值域是[-1,+1] ，信度系数的值域：[0,1]，为什么？
没有百分之百可靠的测量，因此，rXX=1只是理论上的值，实际当中是不会存在的。
8
Measurement Reliability
Measurement Reliability
第四章测量的信度
1
Measurement Reliability
导学
信度是评价测验优劣的重要指标，了解信度的相关知识是编制优质高效测验的前提。通过本章的学习我们可解决三个问题：一、明确信度的理论定义及操作定义；（难点）二、掌握几种常模参照测验的信度估计方法；（重点）三、了解影响信度的因素，在信度估计时尽量避免由此造成的误差；提高信度的方法。
我们可以用测量的标准误来估计个人测验的真分数的大小。如果选用95％的可靠性水平（置信水平），即显著性水
平（a值）为.05，，真分数有95％的可能落入X ± SE ，即X ±1.96 SE的范围之内，也可以写成X－1.96SE T X＋1.96 SE，SE则用公式代入。或有5％的可能落入这范围之外。这实际上也表明了再测时分数改变的可能范围。 X―1.96SE＜T≤X+1.96SE
15
Measurement Reliability
2.确定信度可以接受的水平
最理想的是rxx ＝1.00,但办不到研究结果显示，能力，成就测验都在0.90以上，有的
还可以达到0.95以上;人格测验、兴趣、态度、价值观等都在0.80～0.85。一般原则： ⑴当rxx﹤0.70时，测验不能用于对个人作出评价或预测，而且不能做团体比较； ⑵当0.70≤rxx <0.85时，可用于团体比较； ⑶当rxx≥0.85时，才能用来鉴别或预测个人成就或作为。另一原则：新编的测验信度应该高于缘由的同类测验或相似测量
13
Measurement Reliability
此时，个人在两次测验中的分数差异就是测量误差。据此可制成误差分数的分布。这个分布的标准差（误差分布的标准差）我们称之为测量的标准误，是表示测量误差的大小的指标，其计算公式为：
SE S x 1 rxx
SE表示测量的标准误，即误差分布的标准差；Sx表示实得分数的标准差；rxx表示信度系数。
14
Measurement Reliability
三、信度的作用（信度与测验分数的解释）
1.信度是测量过程中所存在的随机误差大小的反映
（解释真实分数与实得分数的相关）信度系数可以解释为：总的方差中有多少比例是由真实
分数的方差决定的，也就是测验的总变异中真分数造成的变异占百分之几。例如，r=0.9时，实得分数90％的变异来自真分数，10％来自误差。r=1呢？r=0呢？信度系数从0.00～1.00，代表了从缺乏信度到完全可信的所有状况信度系数也告诉我们误差有多大
12
Measurement Reliability
2.标准误
信度系数仅表示一组测量的实得分数与真分数的符合程度，但并没有直接指出个人测验分数的变异量。由于误差存在，一个人所得分数有时比真分数高，有时比真分数低，有时二者相等。理论上我们可以对一个人施测无数次测验，然后求得分数的平均数和标准差。这个平均数就是这个人的真分数，而标准差就是测量误差大小的指标。但在实际上是行不通的。然后，我们可以用一组被试两次测量结果来代替对同一人的反复施测，以估计测量误差的变异数。
可以达到0.95以上;人格测验、兴趣、态度、价值观等都在0.80～0.85。一般原则： ⑴当rxx﹤0.70时，测验不能用于对个人作出评价或预测，而且不能做团体比较； ⑵当0.70≤rxx <0.85时，可用于团体比较； ⑶当rxx≥0.85时，才能用来鉴别或预测个人成就或作为。另一原则：新编的测验信度应该高于原有的同类测验或相似测量
首先计算出差异分数的标准误：在统计上，经常要求两个分数的差异程度达到0.05的显著
水平，才能承认不是误差的影响。因此，将差异标准误（7.5）乘以1.96，结果为14.7，这表明个体在韦氏测验两半得分的差异高于大约15分，才能达到0.05显著水平。上述被试的差异分数110-102=8是不显著的。
由于真分数的方差无法统计，可转化为： rxx=（S2x-S2E)/S2x =1- S2E/S2x
该定义有两点需要注意：第一、信度指的是一组测验分数或一列测量的特性，而
不是个人分数的特性；第二、真分数的变异数是不能直接测量的，因此信度是
一个理论上构想的概念，只能根据一组实得分数做出估计。
5
23
Measurement Reliability
课堂练习
1.某个被试的测验IQ=100,再测的分数可能是多少？（已知测验的标准差为15，信度系数为0.90）.
95％的可能在90.6～109.4之间
2.被试在韦氏智力测验中言语智商为102，操作智商为110。两个分测验都是以100为平均数，15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.93和0.94.问其操作智商是否显著高于言语智商？
一、重测信度（Test-Retest Reliability）
（一）含义
也叫再测信度 1.重复测验：同一量表，同一被试群体，在不同时间，
两次施测。 2.重测信度：用同一测验，对同一组被试前后两次施测，
两次测验分数之间的相关程度（用相关系数来表示）就是再测信度。 3.重测信度实质：主要考察了一个测量工具是否能够保证在不同时间测量结果的一致性，表示测验结果的稳定性。故称之为稳定性系数（Coefficient of Stability） 4.形式：施测A1—适当时间—再施测A2
16
Measurement Reliability
3.解释个人分数的意义
作用：其一是估计真实分数的范围；其二是了解实得分数再测时可能的变化情形。这就是测量标准误的应用。
SE Sx 1 rxx
真分数的估计区间为：
X－1.96SE T X＋1.96 SE
17
Measurement Reliability
24
Measurement Reliability
课后作业
1.某智力测验的信度r=0.75，某次施测得到标准差为 3.00，则该测验的测量标准误是多少，若某被试得分为100，试估计其真分数1-=.95的置信区间
2. 某测验的信度为0.75。要使该测验的信度达到 0.90，须增加多少题目（原测验长度的多少倍）？
21
Measurement Reliability
4.比较不同测验分数的差异