第五部分心理测量的信度教学案例

合集下载

心理测量学 第五章 效度(用)

心理测量学 第五章  效度(用)

b YX r XY
sY sX
0
0 . 923

a=57.5-0.923×69.4=-6.56 Yˆ =-6.56+0.923X
如果我们已知一组人的测验得分,我们可以 根据上式得到他们的效标成绩平均值的预测 值: X=76时, Yˆ =-6.56+0.923×76=63.6 X=55时, Yˆ =-6.56+0.923×88=74.7 预测值不是一个确定值,只是一个估计值, 可以被理解为所有获得某一测验分数者的平 均效标分数值。就是说,所有在测验上得76 分的人的效标分数的平均分为63.6,在例1 中,测验中实际得76分的人的效标平均分为 59.5,测验得88分的人的效标平均分为79.5。
三、影响效标关联效度的因素
(一)样本 这种影响来自两个方面:一是样本的含量,二是样 本的代表性。 (二)基础率 基础率是经选择的总体中具有某种与测验目的有关 的特质的人数比例。极高与极低的基础率,运用测 验都是得不偿失的。 (三)录取率 录取率是根据测验选拔出的人数与全体受测者的比 例。录取率越低,选拔的有效性越高。录取率越高, 错误选择的可能性越大。
2. 方差比例。根据效度定义,效度是有效 分数方差在所得分数方差中所占比例。这只 是一种理论概念,在实际的效度系数的计算 中,效度分数的平方可以解释为在效标分数 的方差中可以用测验分数来解释的百分比,
r XY
2

S YX SY
2
2

r XY =效度系数
S YX
2
SY
2
=由测验所决定的效标分数方差 =效标分数方差
例1 为了考察高等教育自学考试数学试卷的 效度,有关单位在自学高考的高等数学考试 之后,请30名考生参加了某重点大学的高等 数学结业考试。这些考生在两次考试上的成 绩如下表。 计算自学高考数学试卷成绩与普通大学数学 考试成绩之间的相关系数:见附件1

《心理咨询师 理论知识》第五章 心理测量学知识(精华版)

《心理咨询师 理论知识》第五章  心理测量学知识(精华版)

第一节概述第一单元测量与测量量表(P348-350)一、测量的定义:测量就是依据一定的法则用数字对事物加以确定。

该定义包括三个主要的元素:事物(指的是我们要测量的对象,更准确地说,就是引起我们兴趣的事物的属性或特征)、数字(是代表某一事物或事物某一属性的量)、法则(代表的是测量所依据的规则和方法)。

二、测量要素:参照点、单位参照点:要确定事物的量,必须有一个计算的起点,这个起点叫做参照点。

1绝对零点(全无)2相对零点(人为);单位:是测量的基本要求,没有单位就无法进行测量;好的单位必须具备的两个条件:有确定的意义、相同的价值。

三、测量量表:斯蒂文斯测量表的四水平:命名量表、顺序量表、等距量表、等比量表(心理测量为顺序量表)种类功能基本特征运算举例1.命名量表代号或分类无相等单位无绝对零点不能+-×÷性别、学号⋯2.顺序量表1+等级无相等单位无绝对零点不能+-×÷品德、名次、⋯3.等距量表2+差异决策和比较有相等单位无绝对零点可+-温度、分数⋯4.比率量表3+比值决策和比较有相等单位有绝对零点可+-×÷身高、体重⋯第二单元心理测量的基本概念(P350-352)一、心理测量的定义:心理测验的定义:依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。

1、心理测验测量的是人的行为。

2、心理测验在测量个别差异的时候,往往只是对少数经过慎重选择的行为样本进行观察,来间接推知被试者的心理特征。

3、为了使不同的被试者所获得的分数有比较的可能性,测验的条件对所有的被试者都必须是相同的。

4、个人在测验中所得到的原始分数并不具有什么意义,只有将它与其他人的分数或常模相比较才有意义。

二、心理测验的性质:间接性(心理测量的间接性迄今为止,我们还无法直接测量人的心理,只能通过测量人的外显行为,即通过测量人们对测验题目的反应来推论出他的心理特质);相对性(心理测量的相对性我们在比较不同人之间的行为或心理特征时,没有绝对的标准,也没有绝对的零点,我们有的只是一个连续的行为序列);客观性(1、测验的刺激是客观的2、对反应的量化是客观的3、对结果的推论是客观的)第三单元心理测验的分类(P352-354)分类标准分类定义智力测验按功能分特殊能力测验人格测验文字测验按测验材料的性质分操作测验客观测验按测验材料的严谨程度分投射测验个别测验按测验的方式分团体测验最高作为测验要求受测者尽可能做出最好的回答,与认知过程有关,有正确答案;如智力测验、成就测验按测验的要求分典型行为测验要求受测者尽按通常的习惯方式做出反应,没有正确答案;如人格测验第四单元纠正错误的测验观(P354)错误的测验观:万能论、无用论、心理测验即智力测验正确的测验观:重要的心理学研究方法之一;是决策的辅助工具;作为研究方法和测量工具尚不完善第五单元心理测验在心理咨询中的应用(P355-356)在我国的心理门诊中应用较多的三类心理测验:智力测验(可在求助者有特殊要求时及对方有可疑智力障碍的情况下应用);人格测验(有助于治疗者对求助者人格特征的了解,以便于对其问题有更深入的理解,并可针对性地开展咨询与心理治疗工作);心理评定量表(用于检查求助者某方面心理障碍的存在与否或其程度如何)。

心理测量学课程教学大纲讲课教案

心理测量学课程教学大纲讲课教案

心理测量学课程教学大纲一、课程编号二、课程英文名称Psychological measurement三、学时\学分64学时\4学分四、开课学期(春、秋、全年)第三学期(秋)五、先修课程普通心理学、心理统计学六、适用专业(层次)应用心理学本科七、课程简介本课程是心理学专业的学科专业基础课程,属于定量研究方法类课程,包括心理测量的理论和心理测量的具体方法两部分。

通过心理测量理论的学习,学生将了解心理测量史,理解心理测量的性质,掌握信度、效度、难度、区分度等概念及估计,了解测验编制的基本方法,掌握测验分数的解释方法等。

通过心理测量具体方法的学习,学生将了解有关智能量表、人格量表等量表的内容、测验方法、记分和解释等,获得基本的测验实施技能。

八、课程内容主要内容:心理测量理论部分包括心理测量史、测量的性质、测验的编制、测验的实施、测验分数的解释、信度、效度、难度、区分度等。

心理测量具体方法部分包括智能量表、人格量表等量表的内容、测验方法、记分和解释等。

课程重点:测量的性质、测验的实施、测验分数的解释、信度、效度、难度、区分度。

课程难点:测验分数的解释、信度、效度、难度、区分度。

第一章心理测量的历史发展了解:中国古代的心理测量思想和实践,西方心理测量早期的探索,科学心理测验产生与发展,心理测量和测验在中国的发展第一节中国古代的心理测量思想和实践一、孔子二、孟子三、刘邵与《人物志》四、科举取士制度五、中国民间第二节西方心理测量早期的探索一、早期对智力落后儿童的分类与训练的尝试二、冯特实验心理学的影响三、高尔顿的思想和贡献四、卡特尔及其早期个别差异研究第三节科学心理测验产生与发展一、比奈和世界上第一个智力测验二、心理测验在西方的发展第四节心理测量和测验在中国的发展一、旧中国心理测验的发展与停滞二、新中国成立后心理测量和测验的发展三、近20年来的发展第二章心理测量的性质了解:测验的种类,测验的应用理解:测量的基本问题,心理测量的基本概念,心理测验的基本概念第一节测量的基本问题一、测量的定义史蒂文斯:就其广义来说,测量是按照法则给事物指派数字。

2019年 第五章 心理测量学(打印版)

2019年 第五章 心理测量学(打印版)
心理测验在未来发展倾向:团体智力测验、能力倾向测验、人格测验和操作测验。 (二)现代心理测验在我国的发展
1916 年樊炳清先生首先介绍了比内—西蒙智力量表。1920 年,北京高等师范和南京师 范学校建立了我国最早的两个心理学实验室,廖世承和陈鹤琴先生在南京高等师范学校开设 心理测量课。1921 年,他俩正式出版《心理测验法》一书,当时影响很大。1922 年夏天, 中华教育改进社聘请美国教育心理测验专家麦考尔来华讲学。
单位是测量的基本要素,没有单位就无法进行测量。好的单位具备条件:一是确定的 意义,二是相同的价值。一般来说,心理测量的单位往往不够完善。
三、测量量表
量表是根据一定法则在一个定有单位和参照点的连续体上把事物的属性表现出来的连 续体。根据量表的精确度,斯蒂文斯将量表从低到高分为成四种水平,即命名量表、顺序量 表、等距量表和等比量表。 (一)命名量表
课程简介
心理测量学是心理学的一门专业基础学科,心理测量是重要的心 理学研究方法,是心理诊断和人力资源管理中决策的辅助工具,但心 理测量工具目前尚不完善。
心理测量是心理学工作者需要熟练掌握的一项工具或一种手段。 因为心理测量学中涉及到统计学和数学方面知识,在心理咨询师知识 结构中是最难学、最难懂的一门课程,所以,本章课程对大部分参加 心理咨询师课程学习者来说是具有相当难度的。
心理咨询师 (基础知识)
第五章 心理测量学
辅 导 资 料
洪进鹏 2018.11
第五章 心理测量学 课程目录
第一讲 测量:心理咋测量 第二讲 定义:什么是心理测验 第三讲 常模:成绩好坏跟谁比 第四讲 信度:心理测量可靠吗 第五讲 效度:心理测量准确吗 第六讲 项目分析:这次测验难吗 第七讲 编制:测验咋编制 第八讲 技术:测验咋使用

心理测量与教案测量信度教学目的通过本章的教学

心理测量与教案测量信度教学目的通过本章的教学
42
《心理测量与评估》教案 跨时间跨形式的一致性。是合估等值性与稳定性而得到的信度系数。 既能反映由于试题变异(复份)引起的测验成绩变化的程度,又能反映由于应试者的变异(在两次测验 的间隔中,由学习、练习、成熟等引起的应试者的变化)而产生的测验成绩的变化的程度。 计算等值稳定性系数基本上采用复份法,但要求一个适当长的时距。 等值稳定性系数的模式如下:测验A1 适 当 时 距 测验B1 皮尔逊积差相关公式
四、内部一致性系数(同质性信度) (homogeneity reliability) 跨项目的一致性。主要反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。内部一致 性系数是用同一测验量表的两个部分得分的相关系数。 同质性信度指测验内部所有题目间的一致性。题目的一致性有两层含义:其一是指所有题目都测的是同 一种心理特质;其二是指所有题目之间都具有较高的正相关。总之,同质性信度就是一个测验所测内容或特 质的相同程度。 计算内部一致性系数的方法有以下两种: 1、分半法 这种方法是把一个量表按题目序号分为两半,一般奇数题,一般偶数题,计算时先把每个人的奇数题、 偶数题得分相加,得一个奇数题总分,一个偶数题总分,然后求所有应试者奇数题总分与偶数题总分的相关 系数。最后用斯皮尔曼—布朗公式校正,求整个测验的信度系数。 皮尔逊积差相关公式
2
2
其中,rkk 为整个测验结果的信度系数;K 为题目数;pi 为通过第 i 个题目的人数占总人数的百分数;qi 为 2 未通过第 i 个题目的人数占总人数的百分数(qi=1-pi) ;Sx 为测验总分的变异数。 注:适用答对一题得一分,答错无分的测验。 ②KR21 用法:这个公式以各应试者总分的平均数和方差为基础计算,无需各题难度的信息。
其中,k 是题目数:pi 为题目的平均通过率;qi 为 1-pi;X 为测验总分的平均数;Sx 为测验总分的变异 数。

五章节心理测量信度

五章节心理测量信度

我们可以用“差异的标准误”来检验差异的显著 性。
差S 异d的E 标S 准1 误2 E 的S公2E 2 式 为S:2rxx ry(y 公式5-5)
r SE d为差异的标准误,S为相同尺度的xx标准r y分y 数的
标准差,Z分数为1,T分数为10。 、 分别为 两个测验的信度系数。
先将原始分数化成标准分数,然后将两个标准分
(3)获得较高的信度系数并不是心理测 量有效的充分条件,只是一个必要条件。 back
1.评价测验
信度系数是衡量测验好坏的一个重要的技术指 标。
一般能力与学绩测验的信度系数为0.90以上, 有的可以达到0.95;标准智力测验的信度系数 应达到0.85以上,个性和兴趣测验的信度系数 可稍低,一般应达到0.70~0.80,(也有人认 为兴趣、性格、价值观等人格测验的信度系数, 通常在0.80~0.85或更高些)。当信度系数小 于0.70时,不能用测验来对个人进行评价,也 不能用来进行团体间的比较;当信度系数大于 0.70时,可用来进行团体间的比较;大于0.85 时,可以用来鉴别个人。
第五章 心理测量的信度
第一节 第二节 第三节
什么以表示为:
rxx
1
S 2E S2X
(公式5-2)
这个定义有两点要注意:
(1)信度是一组测量分数的特性,不是 某个测量分数的特性。是对一个人测量 多次或对一个群体进行测量得到一组测 量分数的特性
表5-1 某幸福感调查表的两次测试结果

被试
验 1 2 3 4 5 6 7 8 9 10
X1 16 15 13 13 11 10 10 9 8 7
X2 16 16 14 12 11 9 11 8 6 7
计算再测信度必须注意几个问题:

心理测量学—信度

心理测量学—信度

内容抽样
复本信度 (间隔施测)
内容抽样,时间抽样
分半信度 内容抽样
同质性信度 内容的异质性
评分者信度 评分者之间的差异
Pearson相关
Pearson相关
Pearson相关
Pearson相关 Spearman-Brown校正 0,1计分:K-R法 多级计分:α系数 Pearson相关 Kender’W系数
rxx
88.7 0.97 72.06 117
练习:
以下是10名被试在同一测验中两次测量的得分 情况,计算该测验的重测信度。
测 验
ABCDE FGH
I
J
X1 70 82 65 69 77 90 45 85 66 72
X2 75 83 63 70 75 92 46 87 70 70
2、计算重测信度的几个假设:
被试
题目
1
2
3
4
5
6
7
8
1
0
1
0
0
0
0
0
0
2
1
0
1
1
0
1
0
0
3
1
1
0
1
0
0
0
0
4
1
1
1
1
1
0
0
0
5
1
1
1
1
1
1
1
1
6
1
1
0
1
1
1
1
1
7
1
0
1
1
1
0
0
0
8
1
1
1
1

第五章 测量效度

第五章  测量效度
计算测验内部的相关系数。计算各项目与量表总分 的相关;计算各项目与所属分量表的相关,以及各 项目与不同质分量表的相关;计算各分量表之间的 相关以及各分量表与总量表之间的相关。 因素分析。采用探索性因素分析或验证性因素分析, 考察测验的因素负荷情况,找出影响测验的共同因 子,比较测验的因素结构与假设的理论结构是否吻 合。

效度不是一个全或无的概念。
2、效度是随机误差和系统误差的综合反映。
3、效度不是直接可以测量到的,判断一个测验 是否有效要从多方面搜集证据,从证据去推 论测验的效度 (犹如法庭上收集证据一样) 。
三、用统计学术语谈效度
根据CTT假设,有以下公式存在:
S S +Sபைடு நூலகம்=S S S
2 X
2 T
2 E
2 V
2 I
2 E
效度系数等于有效分数的方差与观测分数的方差之 比,即:
r
2
xy
S S
2 V 2 X
四、效度和信度的关系
1、信度高是效度高的必要而非充分的条件。 即信度高但效度不一定高(非充分条件),信 度低则效度一定低(必要条件)。


高信度,低效度 高信度,高效度 低信度,低效度

总命中率关心录取者中合格的人数与淘汰者 中不合格的人数的比率。 正命中率只关心录取者中有多少合格的人, 不关心淘汰者是否有合格的人。

(三)影响效标关联效度的因素
1、效标的选择:效标的适当性; 2、效标测量与预测源测量的时间间隔; 3、预测源与效标测量的信度; 4、被试样本的特征:样本的大小、样本的 代表性。
一、内容效度
(一)内容效度的含义
定义:指一个测验实际测到的内容与所要测量
的内容之间的吻合程度。或者说,指测验题目 对所要测量的内容范围的代表性程度。 内容效度的关键问题是测验题目取样的代表性 程度。(覆盖面不够、偏题、超纲)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(一)分半法(分半信度)
(二)其它计算内部一致性系it-half reliability): 分半信度就是将测验题目分成等值的两 半,分半求出量表题目的总分,再计算 两部分总分的相关系数。
分半的方法很多,常见的方法是把一个 量表按题目番号分为两半,一半是奇数 题,另一半数偶数题。求出每个人的奇 数题的总得分和偶数题的总得分,然后 求出奇数题总得分和偶数题总得分的相 关系数,最后对相关系数进行校正。
X2 20 20 18 16 15 17 12 11 13 9
复本信度应用时应注意以下几点:
(1)复本信度的关键在于两个量表必须 等值,即必须具有相同的难度、区分度、 长度、题型等。
(2)两次测验的时距应尽可能短促,以 便避免知识的积累、练习效应等因素的 影响。
(3)由于量表的两个复份在许多方面近 似,所以信度系数有稍稍偏高的倾向。
弗朗那根公式:
r 21S2aS2xS2b (公式5-8)
式中, S 2 变异数, 信度值。
a、
S
2为S x
2 分别为两半测验分数的 测b 验总分的变异数。r为
卢伦公式:
r
1
S 2d S 2x
(公式5-9)
式中,S 2 d为两半测验分数之差的变异数, S 2 x 为测验总分的变异数。r为信度值。
2.用来估计个人的测验分数(真分数)
由于误差的存在,一个人通过测量得到 的分数很难等于真分数。理论上,我们 可以对一个人施测无数次,然后求得所 得分数的平均数和标准差。在这个假设 的分布里,平均数就是这个人的真分数, 标准差则为误差大小的指标。
X
在实际工作中,我们用一组被试(人数足够多) 两次施测的结果来代替对同一个人反复施测, 以估计测量误差的变异数。此时,个人在两次 测验中的分数差异就是测量误差。据此可制成 误差分数的分布。这个分布的标准差(误差分 布的标准差)我们称之为测量的标准误,是表 示测量误差的大小的指标,其计算公式为:
(2)信度系数只是对测量分数不一致程 度的估计,并没有指出不一致的原因。
(3)获得较高的信度系数并不是心理测 量有效的充分条件,只是一个必要条件。 back
1.评价测验
信度系数是衡量测验好坏的一个重要的技术指 标。
一般能力与学绩测验的信度系数为0.90以上, 有的可以达到0.95;标准智力测验的信度系数 应达到0.85以上,个性和兴趣测验的信度系数 可稍低,一般应达到0.70~0.80,(也有人认 为兴趣、性格、价值观等人格测验的信度系数, 通常在0.80~0.85或更高些)。当信度系数小 于0.70时,不能用测验来对个人进行评价,也 不能用来进行团体间的比较;当信度系数大于 0.70时,可用来进行团体间的比较;大于0.85 时,可以用来鉴别个人。
(3)如遇到有牵连的项目或一组解决同 一问题的项目时,这些项目应放在同一 半,否则会高估信度的值。
(4)将一个测验分成两半的方法很多 (如,按题号的奇偶性分半、按题目的 难度分半、按题目的内容分半等),因 此,一个测验可以有多个分半信度值。 提供分半信度值时,要说明分半的方法。
back
分半法实际上是对测验内部一致性的一 个粗略估计。但对于同一个测验分半的 方法是很多的,而且用不同的分半方法 求出的分半信度都不一样,因此分半信 度不是最好的内部一致性的估计。为了 弥补分半法的不足,可以采用其它的方 法。
优点:
(1)因两次测试有适当的时间间隔,减少了 复本法中的练习、疲劳效应。
(2)只要时间间隔适当,可用于计算稳定性 不高的心理特质的测验的信度。
注意:
等值稳定性信度系数的值一般要比等值性系数 和稳定性系数要低。
等值稳定性系数是测验信度的最严格的考察, 得到的是信度系数的下限。
back
利用一次测验所获得的资料来计算信度 系数。这样计算出来的信度系数反应的 是测验内部的一致性,即测验项目的同 质性,叫做内部一致性系数或同质性系 数。
数的差异与1.96SEd(0.05显著性水平)进行比较,
如果其绝对值大于此值,则差异显著,否则差异 不显著。
例2,某校五年级进行了两次数学测验, 小张第一次考了85分,此次数学测验年 级平均分是77分,标准差是8分,此次测 验的信度系数是0.84;第二次考了95分, 此次数学测验年级平均分是81分,标准 差是10分,此次测验的信度系数是0.91; 问小张这两次数学测验的成绩是否有显 著差异?
表5-1 某幸福感调查表的两次测试结果

被试
验 1 2 3 4 5 6 7 8 9 10
X1 16 15 13 13 11 10 10 9 8 7
X2 16 16 14 12 11 9 11 8 6 7
计算再测信度必须注意几个问题:
(1)所测量的特性必须是稳定的。当然绝对 的稳定是不可能的,但应该是比较稳定的。
例4:有一个由100题构成的量表施测于10个高 三学生。测验一次后,应试者即毕业离校。现 在怎样评介测验结果的信度?
(1)计算出每个应试者的奇数题总分(X1)和 偶数题总分(X2),见表5-3。

被试
分 1 2 3 4 5 6 7 8 9 10
X1 38 37 38 41 40 36 38 39 40 35
我们可以用“差异的标准误”来检验差异的显著 性。
差S 异d的E 标S 准1 误2 E 的S公2E 2 式 为S:2rxx ry(y 公式5-5)
r SE d为差异的标准误,S为相同尺度的xx标准ry分y 数的
标准差,Z分数为1,T分数为10。 、 分别为
两个测验的信度系数。
先将原始分数化成标准分数,然后将两个标准分
(4)被试易出现疲劳、失去积极性等反 应,还会出现迁移。这些称为顺序效应, 为了抵消顺序效应,可随机分配一半被 试先做复本A再做复本B,另一半被试先 做复本B再做复本A,以平衡顺序效应。
(5)复本法只能减少而不能完全排除练 习和记忆的影响。
(6)对于许多测验来说,建立复本是相
当困难的。
back
X2 37 37 36 39 39 34 38 39 39 36
采用分半信度应注意以下几个问题:
(1)若用分半法时,以按奇数题和偶数题分 半为宜。
(2)在使用斯皮尔曼-布朗公式时要求全体 被试在两半测验上的得分的变异数相等。当一 个测验不宜分成对等的两半时分半信度不宜采 用。
(2)当试卷中存在任选题时,不宜采用分半 法。速度测验也不宜采用分半法。因为速度测 验中试题的难度低,被试得分的多少主要是看 答题的多少,分半法易使得分相同,从而夸大 分半法的信度估计。
式(皮尔逊积差相关公式的变式)为:
rxx
X1X2 NX1X2 S1S2
(公式5-6)
式中X1、X2为同一被试的两次测验分数,X 1 、X 2
为全体被试两次测验的平均数,S1、S2为两次
测验的标准差,N为被试人数。
再测法的模式是:施测 适当时距 再施测
例2:假设有一份主观幸福感调查表,先后两次施测于 10名学生,时间间隔为半年,结果如表所示,求该测 验的重测信度。(为了便于理解和计算,本章估计信 度的例子都是小样组,实际应用时应采用大样组。)
复本信度的模式是:复本A 最短时距 复本B
例3:假设用A、B两型创造力复本测验对 初中一年级10个学生施测。结果见表5- 2。请同学们自己计算。
表5-2 某创造力复本测验测试结果

被试
验 1 2 3 4 5 6 7 8 9 10
X1 20 19 19 18 17 16 14 13 12 10
真变异数与总变异数(实得变异数)的比率。

式中
rxx
S
2 T
S 2X
(公式5-1)
rxx代表信度系数,S 2T 代表真分数的变异数,
S
2 X
代表实得分数的变异数,即总变异数。
根据公式5-1,信度还可以表示为:
rxx
1
S 2E S2X
(公式5-2)
对于信度系数,还应该注意以下几点:
(1)在不同的情况下,对于不同的样本, 采用不同的方法会得到不同的信度系数, 因此一个测验可能不止一个信度系数。
校正公式有:
(1)斯皮尔曼-布朗(Spearman-Brown) 公式
rxx
2r hh 1 rhh
(公式5-7)
式中,rhh 是两半测验分数的相关系数,
rxx 为整个测验的信度估计值。
采用斯皮尔曼-布朗(Spearman-Brown) 公式进行校正时,假定两半测验等值, 亦即两半测验具有相同的平均数和标准 差。当假定不能满足时,可以采用下面 两个公式来估计信度。
3.用来对两种测验分数进行比较
来自不同测验的原始分数是无法直接进 行比较的,只有将它们转换成相同尺度 的标准分数才能进行比较。
如,某班期末考试,小明的数学成绩是 80分,语文成绩是70分。另外,已知小 明所在班级的数学平均成绩是70分,标 准差是10分,语文平均成绩是60分,标 准差是7分 。
注意几点:
(1)SE对真分数做的是区间估计,不可 能由此得到一个确切的点。这就是说, 测验分数不是一个定点,而是具有一定 的分布范围。因此,两次测验分数之间 存在差异是很正常的。
(2)置信水平确定后,估计的精度主要 取决于SE,SE越小,范围越小,估计就 越精确,反之也然。
(3)真分数不能等同于真正能力或心理 特质,真分数中包括了系统误差。
SESx 1rxx
(公式5-4)
式中SE表示测量的标准误,即误差分布的标准 差 度系;数Sx表。示一次测量分数的标准差;rxx表示信
我们可以用测量的标准误来估计个人测 验的真分数的大小。
如果选用95%的可靠性水平(置信水
平),即显著性水平(a值)为.05,,
真分数有95%的可能落入X
±Z
2
(2)遗忘和练习的效果基本上相互抵消。
相关文档
最新文档