第五章心理测量的信度说课讲解

合集下载

2019年第五章心理测量学(打印版)

心理测验在未来发展倾向：团体智力测验、能力倾向测验、人格测验和操作测验。（二）现代心理测验在我国的发展
1916 年樊炳清先生首先介绍了比内—西蒙智力量表。1920 年，北京高等师范和南京师范学校建立了我国最早的两个心理学实验室，廖世承和陈鹤琴先生在南京高等师范学校开设心理测量课。1921 年，他俩正式出版《心理测验法》一书，当时影响很大。1922 年夏天，中华教育改进社聘请美国教育心理测验专家麦考尔来华讲学。
单位是测量的基本要素，没有单位就无法进行测量。好的单位具备条件：一是确定的意义，二是相同的价值。一般来说，心理测量的单位往往不够完善。
三、测量量表
量表是根据一定法则在一个定有单位和参照点的连续体上把事物的属性表现出来的连续体。根据量表的精确度，斯蒂文斯将量表从低到高分为成四种水平，即命名量表、顺序量表、等距量表和等比量表。（一）命名量表
课程简介
心理测量学是心理学的一门专业基础学科，心理测量是重要的心理学研究方法，是心理诊断和人力资源管理中决策的辅助工具，但心理测量工具目前尚不完善。
心理测量是心理学工作者需要熟练掌握的一项工具或一种手段。因为心理测量学中涉及到统计学和数学方面知识，在心理咨询师知识结构中是最难学、最难懂的一门课程，所以，本章课程对大部分参加心理咨询师课程学习者来说是具有相当难度的。
心理咨询师（基础知识）
第五章心理测量学
辅导资料
洪进鹏 2018.11
第五章心理测量学课程目录
第一讲测量：心理咋测量第二讲定义：什么是心理测验第三讲常模：成绩好坏跟谁比第四讲信度：心理测量可靠吗第五讲效度：心理测量准确吗第六讲项目分析：这次测验难吗第七讲编制：测验咋编制第八讲技术：测验咋使用

心理测量知识点之什么是信度_毙考题

心理测量知识点之什么是信度第五章测量的信度第一节什么是信度一、信度的定义信度又叫可靠性，指的是测量的一致性程度。

一个好的测量工具必须稳定可靠，即多次测量的结果要保持一致，否则便不可信。

信度只受随机误差影响。

随机误差越大，信度越低。

因此，信度亦可视为测量结果受机遇影响的程度。

系统误差产生恒定效应，不影响信度。

在测量理论中，信度被定义为：一组测量分数的真变异数与总变异数(实得变异数)的比率。

即，(5.1)式中rxx代表测量的信度，S 代表真分数的变异数，代表实得分数的变异数，即总变异数。

根据公式(4.3)，信度还可表示为(5.2)该定义有两点要注意: 1)信度指的是一组测验分数或一列测量的特性，而不是个人分数的特性。

2)真分数的变异数是不能直接测量的，因此信度是一个理论上构想的概念，只能根据一组实得分数作出估计。

任何测验只能包含特定样本的题目，由特定的施测者，对特定的被式，在特定的时间、地点施测，情况不同便会得到不同的分数。

信度涉及的主要问题是对测验分数的意义的概化能力，即从一次测量来推论总体(真实分数)能达到何种正确程度。

根据现代信息论，每组信息可包括一些真正信息(信号)和一些错误的信息(噪音)。

为了提供有用的数据，任何测量必须有高的信号噪音比率即提供更多真正的信息。

信号可由真实分数的变异数表示，噪音可由误差分数的变异数表示。

信噪比与信度有如下关系：信号/噪音= (5.3)公式(5.3)并不难证明，将代入上式的右端可得：=信号/噪音假如一个测验的信度为0.90，则信噪比为0.90/(1 0.90)=9.0即真正变异数对误差变异数的比率为9：1。

一个测验的信度只要稍微增加一点就会使信噪比大大改变。

例如，信度从0.90增为0.91，可使信噪比从9：1,变为10.1:1。

因此，即使一个相当可靠的测验也应努力改善其信度。

二、信度系数大部分的信度指标都以相关系数表示，即用同一被试样本所得的两组资料的相关作为测量一致性的指标，称作信度系数。

国家三级心理咨询师第五章心理测量

27
心理测量学基础
• • • • • • • • • • • • • • 1979年，林传鼎，吴天敏，张厚粲在武汉举办全国测验培训班 1979年，龚耀先主持修订“韦克斯勒成人智力量表” 1979年，林传鼎、张厚粲编制“少年儿童学习能力测验” 1980年，林传鼎、张厚粲主持修订“韦克斯勒儿童智力量表” 1980年，北师大开设心理测验课 1980年，张厚粲开始对高考试卷做系统分析 1981年，刘绍衣修订“卡特尔16种人格因素问卷” 1982年，吴天敏第三次修订中国比内测验 1982年，宋维真修订“明尼苏达多相人格调查表” 1983年，龚耀先、陈仲庚修订“艾森克问卷” 1984年，中国心理学会成立心理测量专业委员会 1984年，我国正式加入“国际教育成就评价协会” 1985年，张厚粲主持修订“瑞文标准推理测验” 1986年，龚耀先主持修订“韦克斯勒幼儿智力量表”
算。
测量水平最低的一种形式，如代号、类别
7
心理测量学基础
• （2）顺序量表
表明类别的大小或某种属性的多少。
主要用于分等论级和分类。
数字仅表示等级并不表示某种属性的真正量或绝对值。无参照点（没有绝对零度）和单位。无法进行数学方法运算。
8
心理测量学基础
（3）等距量表存在大小关系。无绝对零度，但存在 • 54. 其数值只可以相对零点。有相等单位，可以进行加进行加减运算，二减数学运算，但不能做乘除运算。不能进行乘除的量（4）等比量表表是（）2013.05 是最精确的测量。具有相等单位又有 A命名量表绝对零点。 B顺序量表大多是物理量表，可以进行各种数学 C等距量表运算。可以知道事物之间的某种特点 D等比量表上相差多少及它们之间的倍数关系。心理测验属于?量表！
29

第五章测量效度

计算测验内部的相关系数。计算各项目与量表总分的相关；计算各项目与所属分量表的相关，以及各项目与不同质分量表的相关；计算各分量表之间的相关以及各分量表与总量表之间的相关。因素分析。采用探索性因素分析或验证性因素分析，考察测验的因素负荷情况，找出影响测验的共同因子，比较测验的因素结构与假设的理论结构是否吻合。

效度不是一个全或无的概念。
2、效度是随机误差和系统误差的综合反映。
3、效度不是直接可以测量到的，判断一个测验是否有效要从多方面搜集证据，从证据去推论测验的效度 (犹如法庭上收集证据一样) 。
三、用统计学术语谈效度
根据CTT假设，有以下公式存在：
S Ｓ＋Ｓபைடு நூலகம்＝S S S
2 X
２Ｔ
２Ｅ
2 V
2 I
2 E
效度系数等于有效分数的方差与观测分数的方差之比，即：
r
2
xy
S S
2 V 2 X
四、效度和信度的关系
1、信度高是效度高的必要而非充分的条件。即信度高但效度不一定高（非充分条件），信度低则效度一定低（必要条件）。

高信度，低效度高信度，高效度低信度，低效度

总命中率关心录取者中合格的人数与淘汰者中不合格的人数的比率。正命中率只关心录取者中有多少合格的人，不关心淘汰者是否有合格的人。

（三）影响效标关联效度的因素
1、效标的选择：效标的适当性； 2、效标测量与预测源测量的时间间隔； 3、预测源与效标测量的信度； 4、被试样本的特征:样本的大小、样本的代表性。
一、内容效度
（一）内容效度的含义
定义：指一个测验实际测到的内容与所要测量
的内容之间的吻合程度。或者说，指测验题目对所要测量的内容范围的代表性程度。内容效度的关键问题是测验题目取样的代表性程度。（覆盖面不够、偏题、超纲）

(完整版)心理测量学的知识

第五章心理测量学知识第一节概述第一单元测量与测量量表一、什么是测量1。

测量是依据一定的法则用数字对事物加以确定.该定义包括三个要素,即事物、数字和法则。

2。

数字具有区分性、序列性、等距性和可加性。

二、则量要素（一)参照点1.要确定事物的量，必须有一个计算的起点，这个起点叫做参照点。

2.参照点有两种:一是绝对零点。

二是人为确定的参照点，即相对零点。

3。

理想的参照点是绝对零点，但在心理测量中很难找到绝对零点，多采用人为标定的测量零点。

(二）单位：具备两个条件1.有确定的意义。

2。

有相同的价值。

三、测量量表根据量表的精确程度，斯蒂文斯将测量从低级到高级分成四种水平:（一）命名量表1。

命名量表是测量水平最低的一种量表形式，只用数字来代表事物或把事物归类.2.这种量表分为两种：（1)代号-—用数字来代表个别事物.（2)类别-—用数字来代表具有某一属性的事物的全体。

3.在命名量表中，数字只用来作标记和分类，而不能作数量化分析，既不能比大小,也不能做加、减、乘、除运算.(二）顺序量表1。

顺序量表比命名量表水平高,其中的数字不仅指明类别，同时也指明类别的大小或含有某种属性的程度。

2.数字包含有数量关系,代表符号是“＞”，如A＞B＞C等，主要用于分等或排出顺序。

3。

顺序量表既无相等单位，又无绝对零点，数字仅表示等级，并不表示某种属性的真正量或绝对值。

(三）等距量表1.有大小关系，而且具有相等的单位，其数值可做加、减运算，但因为没有绝对零点，所以不能做乘、除运算。

2.等距量表的数值加上或减去一个常数，或者用一个常数去乘或除，不会破坏原来数据之间的等距关系.（四）等比量表1。

等比量表是最高水平的量表，既有相等单位，又有绝对零点。

2.长度、重量、时间等都是等比量表，其数值可以做加、减、乘、除运算。

心理测量是在顺序量表上进行,利用某种统计方法，可以把顺序量表得到的数据换算为等距数据来进行统计。

第二单元心理测量的基本概念一、心理测量的定义：依据心理学理论，使用一定的操作程序，通过观察人的少数有代表性的行为，对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。

心理测量第三篇—信度

二、概化理论的基本原理和概念
1.测量目标——希望测量的实体，如能力、成就等特性。 2.侧面——一组特定的测量条件，其中条件的数量为该侧面的水平。
例题：如果要求每个被试写两篇题目不同的短文，并由三名评分者给所有短文评分测量目标：被试的写作水平；侧面：题目和评分者；水平数：分别为2和3。
二、测验长度的影响
一般说来，在—个测验中增加同质性的题目，可以使信度提高。
二、测验长度的影响
假设有一个包括10个题目的测验，信度为0.50，若把测验增加到50个题目，其信度将增加到：
二、测验长度的影响
当由于测题过少而导致信度较低时，增加多少个题目可以达到理论的信度指标，可以用下式来推算：
一、概化理论对经典测验理论的发展
2.概化理论的诞生及其特点 (1)诞生：1972年，克朗巴赫出版《行为测量的可靠性：测验分数和剖面图的概化理论》，正式形成了概化理论(GT)。 (2)特点：克朗巴赫指出：“概化分析超越经典信度分析之处在于它明确问到，这个分析过程如何计算误差?每个来源的变异有多大?”
一、测量的标准误的含义及其作用
5.测量的标准误差的解释
比如：以95%的置信度为标准，则Z0.95=1.96，
它表示真分数有95％的可能性落在范围内。
二、直接估计标准误差
1.公式：估计信度rtt要求每个人都有两个测验分数，估计Se也是一样要求每个人要有成对的分数，每个人成对的分数由复份法、再测法、分半法获得。
（二）分半信度
2.“斯皮尔曼—布朗公式”校正
条件：两个分半测验分数的变异性相等。
（二）分半信度
当两个分半测验分数的变异性不等时：费拉南根(Flanagan)公式：

心理测量-信度与效度

五、测量的标准误差
X T E
2 X
2 T
2 E
1
Байду номын сангаас
2 T 2 X
2 E 2 X
1
X1X2
2 E 2 X
2 E
2 X
(1
X1X
2
)
E X 1 X1X2 E称为测量的标准误差
（一）速度测验的信度
没有完成测验的人数的百分比，可以作为判断一个测验是否是速度测验的依据。但要视具体情况而定。
一般来说，纯速度测验几乎不考虑难度因素，但如果难度与速度测验混在一起，就更难处理了。
纯速度测验可用复本法和再测法，指标是两次回答完题目的数量。
如果速度和难度混在一起，就将时间分为四等份，在每个时间点上要被试作记号，然后将一四时间段的题目合并，二三时间段的题目合并，再用分半相关法计算信度。
4、内容效度没有可靠的数量指标。
5、内容效度是许多测验要考虑的，但不适合人格和能力倾向测验，因为它们没有明确范围。
影响效度的因素:
1、测验本身的因素（题目、结构） 2、实施 3、信度
（四）差异信度（如语文与数学分数差异的稳定性）
（五）变迁信度
有时，分数稳定性对研究者来说毫无意义，相反，我们希望分数是提高或者降低的（如教学、心理治疗、体育训练等），所以传统的信度理论（高信度）还要发展，以应对复杂的问题。
一、效度概述（一）效度要回答什么 1、一个测验测量到什么东西？ 2、测验对它要测量的东西测验到什么程度？（二）效度的含义 1、效度的概念：一个测验对其要测量的特性测
（二）标准参照测验的信度
作为心理与教育统计，都是以个别差异的模式为基础的，即适合常模参照测验。在教育测验种有很多是标准参照测验（掌握测验），统计方法还在探索中，还不成熟。一般以两次测验的通过率差异来判断，当然，前提是被试同质

《心理测量信度》课件

02
信度系数可以帮助雇主了解测验的一致性和可靠性，从而更好地解释和比较测验结果。
03
在职业测验中，信度可以通过重测法、分半法、同质性法等方法进行评估。
04
高信度的测验结果可以更准确地反映应聘者的能力和潜力，为雇主做出更明智的招聘决策提供支持。
信度在临床心理测验中的应用
在临床心理测验中，信度是评估测验可靠性和稳定性的关键
因素。
在临床心理测验中，信度可以通过重测法、分半法、同质性法等方法进行评估。
信度系数可以帮助心理医生了解测验的一致性和可靠性，从而更好地解释和比较测验结果
。
高信度的测验结果可以更准确地反映患者的心理状况和需求，为心理医生制定更有效的治疗方案提供支持。
THANKS
感谢观看
测验难度
测验难度对信度的影响主要体现在被试的得分分布上。如果测验难度适中，被试的得分分布较为集中，信度就较高；如果测验难度过高或过低，被试的得分分布就会过于分散，导致信度下降。
VS
在编制心理测验时，应根据测验的目的和被试的特点来设置适当的难度水平，以保证测验的信度。
被试样本
被试样本的差异也会影响测验的信度。如果被试样本具有代表性，那么测验的信度就较高；如果被试样本偏差较大，那么测验的信度就会受到影响。
信度的意义
提高测量结果的可靠性
信度评估可以确定测量工具的一致性，从而提高测量结果的可靠性，使结果更加准确可靠。
减少误差
比较和解释
信度评估可以比较不同测量工具之间的结果，以及在不同时间或情境下对同一对象进行测量的结果，从而更好地解释和比较测量结果。
信度评估可以识别和减少测量误差，从而提高测量的准确性。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

3.用来对两种测验分数进行比较
来自不同测验的原始分数是无法直接进行比较的，只有将它们转换成相同尺度的标准分数才能进行比较。
如，某班期末考试，小明的数学成绩是 80分，语文成绩是70分。另外，已知小明所在班级的数学平均成绩是70分，标准差是10分，语文平均成绩是60分，标准差是7分。
SE
，即
X ±1.96 SE的范围之内，也可以写成X
－1.96SE T X＋1.96 SE，SE则用公
式5－4代入。或有5％的可能落入这范围
之外。这实际上也表明了再测时分数改
变的可能范围。
例1，已知WISC-R的标准差为15，信度系数为0.95，对一名12岁的儿童实施该测验后，IQ为110，那么他的真分数在95％的可靠度要求下，变动范围应是多大？
第五章心理测量的信度
第一节第二节第三节
什么是信度估计信度的方法影响信度系数的因素
一、信度的意义二、信度系数的作用
back
一、信度的意义
信度即测验的可靠性，指的是测量的一致性程度。
信度受随机误差的影响，随机误差越大，信度越低。
在测量学中，信度被定义为：一组测量分数的
我们可以用“差异的标准误”来检验差异的显著性。
差S 异d的E 标S 准1 误2 E 的S公2E 2 式为S：2rxx ry（y 公式5－5）
r SE d为差异的标准误，S为相同尺度的xx标准ry分y 数的
标准差，Z分数为1，T分数为10。、分别为
两个测验的信度系数。
先将原始分数化成标准分数，然后将两个标准分
表5－1 某幸福感调查表的两次测试结果
测
被试
验 1 2 3 4 5 6 7 8 9 10
X1 16 15 13 13 11 10 10 9 8 7
X2 16 16 14 12 11 9 11 8 6 7
计算再测信度必须注意几个问题：
（1）所测量的特性必须是稳定的。当然绝对的稳定是不可能的，但应该是比较稳定的。
数的差异与1.96SEd（0.05显著性水平）进行比较，
如果其绝对值大于此值，则差异显著，否则差异不显著。
例2，某校五年级进行了两次数学测验，小张第一次考了85分，此次数学测验年级平均分是77分，标准差是8分，此次测验的信度系数是0.84；第二次考了95分，此次数学测验年级平均分是81分，标准差是10分，此次测验的信度系数是0.91；问小张这两次数学测验的成绩是否有显著差异？
式（皮尔逊积差相关公式的变式）为：
rxx
X1X2 NX1X2 S1S2
（公式5－6）
式中X1、X2为同一被试的两次测验分数，X 1两次
测验的标准差，N为被试人数。
再测法的模式是：施测适当时距再施测
例2：假设有一份主观幸福感调查表，先后两次施测于 10名学生，时间间隔为半年，结果如表所示，求该测验的重测信度。（为了便于理解和计算，本章估计信度的例子都是小样组，实际应用时应采用大样组。）
（2）信度系数只是对测量分数不一致程度的估计，并没有指出不一致的原因。
（3）获得较高的信度系数并不是心理测量有效的充分条件，只是一个必要条件。 back
1.评价测验
信度系数是衡量测验好坏的一个重要的技术指标。
一般能力与学绩测验的信度系数为0.90以上，有的可以达到0.95；标准智力测验的信度系数应达到0.85以上，个性和兴趣测验的信度系数可稍低，一般应达到0.70～0.80，（也有人认为兴趣、性格、价值观等人格测验的信度系数，通常在0.80～0.85或更高些）。当信度系数小于0.70时，不能用测验来对个人进行评价，也不能用来进行团体间的比较；当信度系数大于 0.70时，可用来进行团体间的比较；大于0.85 时，可以用来鉴别个人。
注意几点：
（1）SE对真分数做的是区间估计，不可能由此得到一个确切的点。这就是说，测验分数不是一个定点，而是具有一定的分布范围。因此，两次测验分数之间存在差异是很正常的。
（2）置信水平确定后，估计的精度主要取决于SE，SE越小，范围越小，估计就越精确，反之也然。
（3）真分数不能等同于真正能力或心理特质，真分数中包括了系统误差。
back
一、再测信度二、复本信度三、等值稳定性系数四、内部一致性系数五、评分者信度总结练习
back
再测信度(Test-Retest Reliability) ，也叫重测信度，也叫稳定性系数。用同一个测验，
对同一组被试前后施测两次，对两次测验分数
求相关，其相关系数就叫再测信度。其计算公
真变异数与总变异数（实得变异数）的比率。
即
式中
rxx
S
2 T
S 2X
（公式5－1）
rxx代表信度系数，S 2T 代表真分数的变异数，
S
2 X
代表实得分数的变异数，即总变异数。
根据公式5－1，信度还可以表示为：
rxx
1
S 2E S2X
（公式5－2）
对于信度系数，还应该注意以下几点：
（1）在不同的情况下，对于不同的样本，采用不同的方法会得到不同的信度系数，因此一个测验可能不止一个信度系数。
2.用来估计个人的测验分数（真分数）
由于误差的存在，一个人通过测量得到的分数很难等于真分数。理论上，我们可以对一个人施测无数次，然后求得所得分数的平均数和标准差。在这个假设的分布里，平均数就是这个人的真分数，标准差则为误差大小的指标。
X
在实际工作中，我们用一组被试（人数足够多）两次施测的结果来代替对同一个人反复施测，以估计测量误差的变异数。此时，个人在两次测验中的分数差异就是测量误差。据此可制成误差分数的分布。这个分布的标准差（误差分布的标准差）我们称之为测量的标准误，是表示测量误差的大小的指标，其计算公式为：
SESx 1rxx
（公式5－4）
式中SE表示测量的标准误，即误差分布的标准差度系；数Sx表。示一次测量分数的标准差；rxx表示信
我们可以用测量的标准误来估计个人测验的真分数的大小。
如果选用95％的可靠性水平（置信水
平），即显著性水平（a值）为.05，，
真分数有95％的可能落入X
±Z
2