5心理测量第五章经典测验理论——信度

合集下载

心理测量学第五章效度(用)

b YX r XY
sY sX
0
0 . 923

a=57.5-0.923×69.4=-6.56 Yˆ =-6.56+0.923X
如果我们已知一组人的测验得分，我们可以根据上式得到他们的效标成绩平均值的预测值： X=76时， Yˆ =-6.56+0.923×76=63.6 X=55时， Yˆ =-6.56+0.923×88=74.7 预测值不是一个确定值，只是一个估计值，可以被理解为所有获得某一测验分数者的平均效标分数值。就是说，所有在测验上得76 分的人的效标分数的平均分为63.6，在例1 中，测验中实际得76分的人的效标平均分为 59.5，测验得88分的人的效标平均分为79.5。
三、影响效标关联效度的因素
（一）样本这种影响来自两个方面：一是样本的含量，二是样本的代表性。（二）基础率基础率是经选择的总体中具有某种与测验目的有关的特质的人数比例。极高与极低的基础率，运用测验都是得不偿失的。（三）录取率录取率是根据测验选拔出的人数与全体受测者的比例。录取率越低，选拔的有效性越高。录取率越高，错误选择的可能性越大。
2. 方差比例。根据效度定义，效度是有效分数方差在所得分数方差中所占比例。这只是一种理论概念，在实际的效度系数的计算中，效度分数的平方可以解释为在效标分数的方差中可以用测验分数来解释的百分比，
r XY
2

S YX SY
2
2

r XY =效度系数
S YX
2
SY
2
=由测验所决定的效标分数方差 =效标分数方差
例1 为了考察高等教育自学考试数学试卷的效度，有关单位在自学高考的高等数学考试之后，请30名考生参加了某重点大学的高等数学结业考试。这些考生在两次考试上的成绩如下表。计算自学高考数学试卷成绩与普通大学数学考试成绩之间的相关系数：见附件1

心理与教育测量学-戴海琦-第三版-重点问答题及答案

第一章、心理测量概述1、心理测量的含义、特点;测量的含义;要素；以及测量的量表(1）心理测量的含义：依据一定的法则，对人的心理特质进行定量描述的过程.（2）心理测量的特点–间接性：与物理的直接测量不同，从外显行为推测,以间接了解人的心理属性;–相对性：测量的结果是与其所属团体比较而言。

–客观性：即测验的标准化，是对一切测量的基本要求。

（3)什么是测量:测量是根据法则给事物分派数字（S。

S。

Stevens）事物：测量对象，在心理测量中，想测量的当然是心理能力和人格特点；数字：代表某一事物或事物某一属性的量;法则：测量所依据的规则和方法.（4）测量的要素：参照点:①测量工作中测量对象的数量的固定原点②绝对参照点：以绝对的零点作为测量起点，如长度/高度③相对参照点:相对零点，如温度[水冰点]、海拔［海平面]单位①理想的单位一是要有确定的意义,不能有不同解释②其次应有相同的价值，即两个单位点之间差异相等。

（5）测量的量表：量表：任何可以使事物数量化的值或量的渐进系列.①命名量表：数字仅仅代表分类，无任何意义；不可比较,如男女②顺序量表：可比较，没有相同单位和零点，不能加减；如名次③等距量表：可比较，有相同单位无绝对零点，可加减，不可乘除；适用多种统计方法：平均数、标准差等,如温度④比例量表：最理想的量表，有等距的的单位和绝对零点，有倍数关系；如年龄.2、什么是心理测验,如何理解心理测验？心理测验的类型；心理测量的功能；（1)什么是心理测验：心理测验实质上是行为样本的客观的和标准化的测量.①行为样本：有代表性的题目②标准化：测验的编制、实施、计分和分数解释的一致性。

③难度的客观测量：测验的编制、实施等过程中减少主试和被试的随意性程度即标准化，测验的难度水平应确定④信度：测验结果的一致性⑤效度：测验结果的有效性和正确性.（2）、心理测验的类型：①测验对象分：智力测验、能力倾向测验、成就测验、人格测验②按测量方式分：个别测验和团体测验③按测验材料性质分:文字测验和非文字测验④按测验功能分：成就测验与预测测验，难度测验与速度测验,描述测验与诊断测验。

心理测量学指标

评判试卷质量优劣的测量学指标一、信度：1、定义;信度是指测量结果的一致性、稳定性及可靠性，一般多以内部一致性来加以表示该测验信度的高低。

信度系数愈高即表示该测验的结果愈一致、稳定与可靠。

系统误差对信度没什么影响，因为系统误差总是以相同的方式影响测量值的，因此不会造成不一致性。

反之，随机误差可能导致不致性，从而降低信度。

信度可以定义为随机误差R影响测量值的程度。

如果R=0，就认为测量是完全可信的，信度最高。

2、评介信度的方法一般通过使用同一量表进行不同测量，分析各测量结果之间联系的方法来评价信度。

如果联系密切，各测量结果具有一致性，则认为量表是可信的。

评价信度的方法主要有：再预测量、替换形式、内部一致性方法。

再测信度用同样的量表，对同一组访问对象在尽可量相同的情况下，在不同的时间进行两次测量。

两次测量相距一般在两到四周之间。

用两次测量结果间的相关分析或差异的显著性检验方法，可以评价量表信度的高低。

结果越是相关，差异越不显著则信度越高。

用再次测量法评价信度存在一些问题。

首先，结果与时间间隔关系密切。

在其他方面都相同的情况下，时间间隔越长，信度越低。

其次，最初的测量可能会改变被测特征。

例如，测量人们对低脂肪食品的态度可能会使他们更为关心健康问题，从而对低脂食品持更为肯定的态度。

第三，实施重复测量有时是不可能的，例如测量消费者对某种新产品的反应。

第四，第一次测量的答案可能会对以后测量有影响。

受访者可能会图回忆第一次受测时给出的答案。

第五，在两次测量之间一个有利的信息可能会使受访者的态度更为有利。

最后，再测信度的相关系数可能会由于被测项目自身之间的相关而偏高。

两次测量中，同一项目自身之间的相关性要比不同项目间的相关性高。

因此，即使不同项目之间的相关性很差，也可能得以很高的再测相关系数。

替换形式信度用两个形式不同的等价量表，对同一组受访者在不同的时间（通常间隔两到四周）进行测量。

两次测量结果间的相关性被用来评价量表的信度。

心理学考研心理测量知识点：信度(一)

心理学考研心理测量知识点：信度（一）1、信度是指：测量结果的可靠性和一致性。

因为心理测验通常测量人的行为，行为会由于各种各样的原因，因时、因事、因地而产生变动，这些因素有些是偶然的，有些是固有的，人在完成心理测验时的行为也会受上述因素的影响，从而使测验结果与真实结果不完全一致，所以我们要用信度来衡量测验的可靠性和一致性。

2、信度的操作化定义：（1）误差理论认为：一个人的测验分数X是由真实分数（T）和误差（E）两部分构成的，公式是X = T + E。

（2）因此信度就被定义为：一组测量分数的真实方差与实得方差的比，或者是指真实方差占总方差的百分比。

公式为：rxx = 1－SE 2／SX 2（3）根据统计学理论，真实方差与实得方差的比是一个相关系数的平方，所以我们把这种相关系数的平方叫做信度系数。

（4）计算公式为：rxx = ST2／SX23、由于误差的来源信度的可分为：这种分类是基于信度的传统定义-真分数理论。

（1）重测信度：考虑的误差来源是时间取样。

（2）复本信度：考虑的误差来源是内容取样。

（3）分半信度：它考虑的误差来源也是内容取样，它与复本信度的差别是：分半信度考查一个测验内容的两半题目测量的是否是同一个心理特点行为。

（4）同质性信度（内部一致性系数）：考虑的是测验内容是否异质。

（5）评分者信度：考虑的误差来源是评分者间的差别。

4、信度的表示方法：（1）信度系数和信度指数：1信度系数：rxx = rx2T = S2T／S22信度指数：rXT = ST／SX（2）测量标准误：SE = SX 1－rxx5、信度的意义：（1）信度系数可以解释为样本测验分数的总方差中有多少比例是真分数方差，也就是测验的总变异中真分数造成的变异占百分之几。

它直接告诉我们测量的误差有多大。

（2）测量的标准误可以告诉我们有多大可能性真实分数在某一分数范围内，并且可以预测实得分数再测时可能的变化情况。

6、信度的作用：（1）解释预测个人分数的意义。

心理测量信度与效度分析

心理测量信度与效度分析在心理学领域，心理测量是一项至关重要的工具，它帮助我们了解个体的心理特征、能力水平和行为倾向。

而信度和效度则是评估心理测量工具质量的两个关键指标。

理解信度与效度对于正确使用和解释心理测量结果具有重要意义。

信度，简单来说，就是测量的可靠性或稳定性。

想象一下，你用一把尺子去测量一个物体的长度，如果每次测量的结果都差不多，那么这把尺子就具有较高的信度；反之，如果每次测量的结果差异很大，那么这把尺子的信度就很低。

在心理测量中也是如此，如果一个心理测试在不同时间、不同情境下对同一个人进行测量，得到的结果都比较接近，那么这个测试就具有较好的信度。

信度主要有以下几种类型。

重测信度是指在不同时间对同一组被试进行相同的测量，然后计算两次测量结果之间的相关性。

例如，我们对一组学生进行智力测验，两周后再次对他们进行相同的测验，比较两次测验的得分，如果相关性较高，说明该测验的重测信度良好。

复本信度则是使用两个内容相似但形式不同的测验版本，对同一组被试进行测量，然后比较两个版本测验结果的一致性。

内部一致性信度常用于衡量一个测验内部各个项目之间的一致性程度，比如通过计算克朗巴哈系数来评估。

那么，如何提高心理测量的信度呢？首先，测验的题目应该表述清晰、明确，避免产生歧义。

其次，测量的环境要保持稳定，减少外部因素的干扰。

再者，增加测验的长度通常也能提高信度，因为更多的题目可以更全面地反映被试的特征，从而减少随机误差的影响。

接下来，我们谈谈效度。

效度指的是测量的准确性或有效性，即一个测验能够真正测量到它想要测量的东西的程度。

如果一个智力测验确实能够准确地反映一个人的智力水平，那么这个测验就具有较高的效度。

效度可以分为内容效度、结构效度和效标效度等类型。

内容效度关注的是测验的内容是否涵盖了所要测量的领域的主要方面。

比如，一个数学考试如果能够全面覆盖数学的各个重要知识点，那么它就具有较好的内容效度。

结构效度则考查测验是否符合某种理论上的结构或模型。

心理测量的复习大纲

心理测量的复习大纲心理测量大纲.第一章：第一节一般测量概述1、测量的概念：依据一定的法则使用量具对事物的特征进行定量描述的过程。

2、影响测量精确的因素：一、测量对象本身的性质。

①确定型（物体的长度）。

②随机型（人的短时记忆容量）③模糊型，即事物本身的量是模糊不定的（人的性格特征）二、测量的精确度取决于测量工具的精确性。

3、根据测量的性质和不同的特点，可以将不同形式的测量大致分为4种类型。

①物理测量：及对事物物理特征的测量。

长度，重量等。

②生理测量：对机体生理特征的测量。

如对动植物各种化学成分含量的测量。

③社会测量：即对社会现象的测量，如人口普查。

④心理测量：对人的心理特征的测量。

如智力、人格测量。

4、任何测量都必须具备两个基本要素：参照点和测量的单位。

其中参照点分为绝对参照点和相对参照点。

5、测量的量表：能够使事物的特征数量化的数字的连续体就是量表。

量表可以分为四种：①命名量表：用数字代表事物或用数字对事物进行分类。

命名量表又分为名称量表（用数字指代个别事物）和类别量表（用数字指代事物种类）。

②顺序量表：按照事物的大小，等级，程度而排列数字的量表。

③等距量表：不仅能够指代事物的类别，等级而且具有相等的单位。

等距量表的数字是一个真正的数量，这个数量中各个部分的单位是相等的。

因此可以对其进行加减运算。

等距量表没有绝对的零点。

它的零点是人们假定的相对零点。

对于等距量表的两个数不能进行乘除运算。

④比率量表：除了具有类别、等级、等距的特征外，还有绝对的零点。

第二节心理与教育测量的性质1.、心理与教育测量的定义：依据一定的心理学和教育学原理，使用测验对人的心理特质和教育成就进行定量描述的过程。

其独特的性质：①心理与教育测量依据的法则在很大程度上只是一种理论，很难达到如同物理测量依据的法则那样普遍被人们接受的水平。

②心理与教育测量的对象是人的心理特质和教育成就。

③心理与教育测量的量具市有关领域的专家编制，经过长期的试用，修订，完善而逐渐形成的标准化测验。

心理测量理论概述

心理测量理论概述
2. 效度
（1）内容效度。（2）结构效度。（3）效标关联效度。
心理测量理论概述
3. 项目分析
为了提高测验的信度和效度，经典测验理论特别注重测验项目的质量，除了深入研究试题的类型和功能及编制技巧外，还发明了一系列筛选、甄别项目的方法，统称为项目分析，其中最主要的是难度分析和区分度分析。
心理测量理论概述
5. 标准化
标准化是指对测验实施程序、对象范围、施测环境、测试方式、测验时限和分数解释（常模）做了统一的规定，使测验能够在异时、异地和不同的主试等条件下进行，并能得到同等有效的测验结果。标准化的思想主要来自自然科学中对实验条件进行严格控制以降低测量误差，其方法主要源自实验心理学中对无关变量和干扰变量控制的方法。
一、经典测验理论
斯皮尔曼的真分数模型指出，任何心理测验所得到的分数（X）都是由反映对象稳定的心理特征的“真分数”（T）和随机因素造成的误差分数（e）两种成分构成的。斯皮尔曼的真分数模型表示为
心理测量理论概述
一、经典测验理论
1. 信度 2. 效度 3. 项目分析 4. 常模 5. 标准化
心理测量理论概述
心理测量理论概述
（3）测量项目的质量
测量项目的质量会直接影响测量的可靠性。其比较重要的方面是项目的选择，这也是取样的问题，应选用或设计具有代表性的项目（代表测量的特征）和内部一致性高的项目。
心理测量理论概述
（4）测试人和受试者
测试人的表现常常会影响测验时的气氛和受试者的反应定式，测试人的评分偏向也会降低测量的信度。受试者的身心健康状况、动机、态度、注意力等的变化，也影响测量的信度。受试者样本的特征（如同质和异质）对测量信度的影响也比较大，如果异质样本分数的全距较大，那么其测量信度将高于同质样本的测量信度。

五章心理测量的信度

三、等值稳定性系数
等值稳定性系数是用两个平行的（等值的）测验，间隔适当时距施测于同一组被试得到两组测验分数，求这两组测验分数的相关，其相关系数就是等值稳定性系数。
等值稳定性系数的模式是：
测验A 适当时距测验B
计算方法同稳定性系数和等值性系数。
等值稳定性系数也是采用复本对被试施测，但等值性系数的测验要求两次测验的时间间隔尽可能短，而计算等值稳定性系数的两次测验却要求有一个适当的时距。
（1）计算出每个应试者的奇数题总分（X1）和偶数题总分（X2），见表5－3。
得
被试
分 1 2 3 4 5 6 7 8 9 10
X1 38 37 38 41 40 36 38 39 40 35
X2 37 37 36 39 39 34 38 39 39 36
采用分半信度应注意以下几个问题：
（1）若用分半法时，以按奇数题和偶数题分半为宜。
复本信度的模式是：复本A 最短时距复本B
例3：假设用A、B两型创造力复本测验对初中一年级10个学生施测。结果见表5－ 2。请同学们自己计算。
表5－2 某创造力复本测验测试结果
测
被试
验 1 2 3 4 5 6 7 8 9 10
X1 20 19 19 18 17 16 14 13 12 10
2

SE
，即
X ±1.96 SE的范围之内，也可以写成X
－1.96SE T X＋1.96 SE，SE则用公
式5－4代入。或有5％的可能落入这范围
之外。这实际上也表明了再测时分数改
变的可能范围。
例1，已知WISC-R的标准差为15，信度系数为0.95，对一名12岁的儿童实施该测验后，IQ为110，那么他的真分数在95％的可靠度要求下，变动范围应是多大？

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Spearman-Brown公式要求：两半测验的方差齐性。(方差F检验，方差齐性检验)
二、估算信度系数的方法
在数据达不到这一要求时(方差不齐性）卢仑/卢龙Rulon公式：
rXX ＝1－Sd2/ Sx2
弗朗那根Flanagan公式：
rXX ＝2[1－（Sa2+ Sb2） ] / Sx2
如果该测验的标准差是15，信度系数是 0.84，那么他智商的真实得分范围是多少？
四、信度系数的作用
3、比较不同测验分数的差异测量标准误和测验信度在评价两个测验
分数是否有明显差异时也非常重要。通过差别分数的标准误，可以比较两个
人不同分数的差别和一个被试在两个同类测验上的差别
四、信度系数的作用
多个测验分数加总的合并分数
分数合成后，信度倾向于提高
测验间的相关越高，合成信度越高
rss
1
k
k (krii ) (k 2 k )rij
rii 平均测验信度 rij 平均测验相关
k 测验数目
三、特殊的信度问题
4、分量表的信度有些量表是测量单一心理特质、心理内
容的，可计算全量表的信度系数有些量表由多种分量表构成，应计算各
典型信度系数 0.95 0.90 0.85
0.80
0.75 0.70 0.65 0.60 0.55 0.50
信度系数的意义
测验类型
解释
测量误差几响乎没有影
能力、智力、成就
高到中等的信度
人格测验和态度、兴趣等一些等级量表
课堂测验
中到低的信度
投射测验
低信度真分数和误差对测验
四、信度系数的作用
2、解释个人分数信度系数可以更加精确的解释个人分数，根据
四、估算信度系数的方法
Kuder-Richardson库德－理查森公式，适合 0、1计分
K－R20 当题目难度接近时，每个项目的通过率应基本相等，我们就不用逐个题目计算通过率
K－R21 难度：某题目上，答对人数和总人数的百分比
被试 01 02 03 04 05 06 07 08 09 10
100
100
100
03
9
10
81
100
92
04
6
6
36
36
36
05
10
10
100
100
100
06
7
8
49
64
56
07
5
4
25
16
20
08
7
8
49
64
56
09
9
9
81
81
81
10
4
4
16
16
16
∑X=75
∑Y=78
∑X2=601 ∑Y2=658 ∑XY=627
二、估算信度系数的方法
估计重测信度时，应注意以下几点：重测时间间隔重测信度测量的心理特性必须是稳定的两次实测的间隔期，被试所测得的心理特
C10*20=92378
信度估计 0.64 0.68 0.82 0.79 0.88 0.81 0.82 0.72 0.71 0.74
二、估算信度系数的方法
b、同质性信度（homogeneity reliability）
同质性信度主要反映测验能够测量相同内容或特质的程度，或者说所有测验题目得分之间的一致性。
α系数来表示，使用范围广泛
被试题目1 题目2 题目3 题目4 题目5 题目6 总分Xt Xt2
01
3
4
3
2
1
4
17
289
02
6
3
4
5
4
6
28
784
03
1
3
1
2
4
5
16
256
04
6
2
2
1
5
3
19
361
05
5
3
1
2
4
2
17
289
∑X
21
15
11
12
18
20
97 1979
∑X2
107
47
31
38
74
90
分量表的α系数如果抽取其中部分分量表的题目组成新
的测验，必须重新计算信度
四、信度系数的作用
1、评价测验 rXX＝1.00，理想化的智力、能力倾向、成就，0.90以上；人格、兴趣、态度，应0.80－0.85。当rXX＜0.70，不能用，或扔，或重编当rXX≥0.70，可用于团体间的比较；当rXX≥0.85时，可用于鉴别个人。
一、什么是信度？
信度（Reliability）是指测量结果的一致性或稳定性。信度的大小用信度系数来表示
定义1：一被测团体的真分数变异数（方差）与观察分数的变异数之比。
定义2：一被测团体的真分数与观察分数的相关系数的平方。
定义3：一个测验X与其平行测验X’的相关系数。
二、估算信度系数的方法
5
-3
9
3
3
4
3
0
0
4
4.5
7
6.5
-2
4
4
4.5
3
2
2.5
6.25
5
6
7
6.5
-0.5
0.25
6
7
9
9
-2
4
7
8
5
4
4
16
8
9
10
10
-1
1
9
10
8
8
2
4
∑D2=44.5
被试评分者1 评分者2 评分者3 评分者4 等级和R R2
01
1
2
1
2
6
36
02
3
1
2
1
7
49
03
5
3
3
4
15
225
04
4
5
例子：某被试在韦克斯勒智力测验中言语智商为102，操作智商110，这两个分数都是 100为平均数，15为标准差的标准分数（ IQ=100+15Z）。言语测验和操作测验的分半信度分别为0.87和0.88，那么他的操作智商是否显著高于言语智商？
五、影响信度的因素
一、测量过程 1、主试：不按规定施测、给予协助、制造紧
Spearman-Brown公式的通用形式是这样的：
rXX＝nrhh / {1＋（n－1）rhh } 其中n为测验题目增加或缩减的倍数， rhh是计算相关得到的测验的信度， rXX是校正后测验的信度。
五、影响信度的因素
1225
1296Βιβλιοθήκη 1260∑X=382∑Y=374 ∑X2=14624 ∑Y2=14014 ∑XY=14311
二、估算信度系数的方法
分半之后，每半测验的题目只相当于原测验的1/2，也就是说，样本数少了一半，信度偏小，需要修正
斯皮尔曼－布朗（ Spearman-Brown)公
r r 式：rXX＝2 hh /(1＋ hh )
三、特殊的信度问题
把整个时限分成四等分，测验完成后，把被试在第一、第四两个时段的分数相加，第二第三时间段的分数相加作为两半得分，计算相关系数，并用斯皮尔曼—布朗公式校正。
三、特殊的信度问题
2、差异分数Different scores
受测者在两个测验的分数的差值（D） D=X-Y（ D=后侧-前测）通常用于反应进步幅度
质方面没有获得过学习和训练注意提高被试的积极性
二、估算信度系数的方法
2、复本信度平行测验信度 parallel form reliability 对一组被试用两个复本测验（平行测
验）施测，计算积差相关系数，就是复本信度。
被试测验A（X）测验B（Y）
X2
Y2
XY
01
8
9
64
81
72
张气氛等 2、施测情景：噪音、通风、光线、测验工具二、被试 1、单个被试：生理心理因素 2、被试团体：异质团体
五、影响信度的因素
三、测验工具 1、测验项目的代表性 2、测验项目的同质性程度 3、测验的难度 4、测验的长度四、心理特质的特点五、不同的信度估计方法
五、影响信度的因素
二、估算信度系数的方法
4、评分者信度主观题时要考虑评分者信度。如果是两个评分者，计算等级相关
系数。如果是多个评分者，需计算
Kendal肯德尔和谐系数
被试 01 02 03 04 05 06 07 08 09 10
甲评分者转换等级乙评分者转换等级等级差D
D2
1
1
2
1
0
0
2
2
6
5 0.5 0.5 0.25
题目5 0 0 1 0 1 0 0 0 1 1
4 0.4 0.6 0.24
题目6 0 0 1 0 1 0 0 0 1 1
4 0.4 0.6 0.24
四、估算信度系数的方法
克伦巴赫（ Cronbach）α系数非0、1计分，如人格测验、态度测验 0、1计分的测验同样可以采用大多测验采用克伦巴赫（ Cronbach）
四、估算信度系数的方法
b. 间隔一段时期进行第二次施测：其相关系数既反映测验形式上的变化，也反映时间上的变化，这种相关系数称为稳定性与等值性系数。
从数值上，稳定性与等值性系数应既小于稳定性系数，又小于等值性系数。