第四章信度

合集下载

第四章心理测量的信度

第四章心理测量的信度一、单项选择题。

1.当代信度理论的大部分要点是（）。

（4.1.63）A斯皮尔曼 B皮尔逊 C桑代克 D库德2.重测信度的大小等于同一组被试在两次测验上所得分数的（）。

（4.2.67）A.克伦巴赫α系数B.皮尔逊积差相关系数C.肯德尔和谐系数D.肯德尔W系数3.关于重测信度说法正确的是（）。

（4.2.67）A．每一种信度系数都能说明信度B．重测信度高，说明分数受被试状况和测验情境变化的影响小C．所有的测验都可以计算重测信度D．重测信度不仅反映了随机误差的影响，也反映了被试心理特点的长期变化4.关于重测信度下列说法正确的是（）。

（4.2.67）A每一种信度系数都能说明信度。

B重测信度高，说明分数受被试状态和测验情境变化的影响小。

C所有的测验都可以计算重测信度。

D重测信度不仅反映了随机误差的影响，也反映了被试心理特点的长期变化。

5.关于重测信度下列说法不正确的是（）。

（4.2.69）A任何一个测验都可能有不止一个再测信度系数。

B一份完备的测验应有很多重测系数，分别与不同的测验间隔时间相对应。

C重测相关很低意味着测验不可信。

D重测相关很低可能是被试被研究的特性发生了改变。

6.等值性系数取决于平行测验的得分之间的相关，且两次测验的时间间隔极短，所以若等值性系数偏低肯定是由于（）造成的。

( 4.2.71)A.学生自身变化B.题目取样不同C.主试的反应D.测试环境变化7.分半信度只适用于（）。

(4.2.7 4)A.难度测验B.速度测验C.=非标准化测验D.成就测验8.同质性信度是指测验的（）的一致性程度。

(4.2.74)A.题目内容B.题目形式C.所有题目间D.各维度题目9.下列估计信度的方法需施测2次的是（）。

（4.2.80）A．分半信度 B.同质性信度C.评分者信度D.再测信度10.下列哪项不是影响信度的因素（）。

（4.3.82）A.样本团体平均水平B.题目数量C.系统误差D.施测情境11.人格测验的信度应达（）以上。

第四章信度和效度1

• （一）构想效度的概念 • 构想效度是指测验能够测量到理论上的构想或特质的程度。 • （二）确定构想效度的步骤 • 1.建立理论框架，以解释被试在测验中的表现； • 2.依据理论框架推演出各种有关测验成绩的假设； • 3.以逻辑和实证的方法验证假设。 • （三）常见的确定构想效度的指标 • 发展变化、与其他测验的相关、因素分析、内部一致性。
（三）重测信度的评估
• • • • • • • • • • • 1.在进行重测信度评估时要注意：（1）重测信度一般只反映由随机因素导致的变化，而不反映被试行为的长久变化；（2）不同行为受随机误差的影响不同。 2.重测信度的假设前提（1）每一被试对前一次测验的遗忘程度相同；（2）每一被试在重测的间隔期内没有学习与测验有关的其他材料。 3.注意：解决问题型的测验不适合采用重测的方式来考察其信度；而感觉-运动型测验或人格测验较适合采用重测的方式来考察其信度。
第二节信度的评估方法
一、重测信度二、复本信度
一、重测信度的概念及间隔时间
• （一）重测信度的概念及理解 • 又称稳定性信度，指同一测验在不同的时间上对同一群体先后施测两次的测验结果的一致性。这两次测验结果的相关系数即为重测信度系数。 • （二）重测的间隔时间 • 重测信度所考察的误差来源主要是时间的变化所带来的随机影响，因此，必须注意间隔时间的长短。间隔时间的长短要根据测验的性质和目的来确定。如果希望测验成绩能够预测较长时间的变化，则间隔时间应该较长。 • （三）重测信度的评估（见下页）
• 一、效度的概念及其理解 • 是指测验的结果所反映的内容与想要考察的内容的关系，二者越是吻合，效度就越高。 • 效度不仅要排除随机误差，而且还要排除系统误差。 • 二、效度的性质 • 效度指的是测量结果的效度；效度是连续性的；效度同时也是针对目标而言的；效度是用已有的证据推理而得到的。 • 三、效度与信度的关系 • 信度高，效度不一定高；效度高信度必定高。信度是效度的必要条件，但不是充分条件。

信度的种类和内涵心理学解释

标题：信度的种类和内涵心理学解释引言信度是心理测量学中一个重要的概念，用来评估测量工具或者测量结果的稳定性和一致性。

在心理学研究中，信度是确保测量结果可靠和准确的关键因素之一。

本文将介绍信度的种类和内涵，并提供心理学解释。

一、信度的概念和意义1.1 信度的定义信度是指测量工具或者测量结果的稳定性和一致性程度。

它反映了测量工具或测量结果中随机误差的程度。

1.2 信度的意义信度是心理学研究中至关重要的概念，它保证了研究的可信度和准确性。

如果测量工具或者测量结果的信度较高，研究者可以更有信心地使用这些工具进行数据收集和分析，并得出可靠的结论。

二、信度的种类2.1 内部一致性信度内部一致性信度是指测量工具内部各项指标或题目之间的相互关联程度。

常用的内部一致性信度指标包括Cronbach's alpha 系数和Kuder-Richardson公式20。

2.2 测试-重测信度测试-重测信度是指同一测量工具在不同时间点上的测量结果之间的相关性。

通过重复测试同一受试者，可以评估测量工具的稳定性和一致性。

2.3 平行形式信度平行形式信度是指不同但具有相似测量目标的测量工具之间的相关性。

研究者使用不同的测量工具来测量同一概念，通过比较它们的结果相关性来评估平行形式信度。

2.4 交叉信度交叉信度是指不同的评分者或评分项目对同一对象进行评分时的一致性程度。

它常用于评估客观性测量工具，例如问卷调查中的主观题。

三、信度的计算方法3.1 相关系数法相关系数法是最常用的计算信度的方法之一。

通过计算两个变量（例如两次测量结果）之间的相关性来评估信度的程度。

常用的相关系数包括皮尔逊相关系数和斯皮尔曼相关系数。

3.2 内部一致性信度的计算方法内部一致性信度可以使用Cronbach's alpha系数或Kuder-Richardson公式20来计算。

这两种方法可以评估测量工具内部各项指标或题目之间的相互关联程度。

3.3 直接比较法直接比较法是通过比较不同测量工具或不同评分者的结果来评估信度。

第四章测验信度作业

第四章测量信度一、单选题1.速度测验的信度应以( c )取得。

dA．奇偶法 B.筛选法 C.反应时法 D.重测法2.在其他条件均等的情况下，测验长度和信度之间的关系是( d )。

bA.测验越长，信度越低B.测验越长，信度越高C.没有关系D.上述说法都不正确3.计算一项测验的分半信度最常用的方法是比较( b )。

A.测验的前半部分与后半部分的得分。

B.奇数项目与偶数项目的得分。

C.将测验随机分为两部分,比较这两部分的得分。

.D.上述方法都可以。

4.一个40道题目的测验其奇偶分半后的信度为0.50,那么该测验的信度接近多少?( b )A. 0.50B. 0.67C. 0.80D. 1.05.当测验的信度减少(接近0)时,测量的标准误将会怎样变化(c )?A.减小,趋向于零。

B.只要趋向于1.0,它就会要么增大,要么减小。

C.增大,趋向于测验的标准差。

D.增大,逼近无限大。

6.再测信度所考虑的误差来源是(d )所带来的随机影响。

A.形式的不同B.题目的不同C.考生的不同D.时间的不同7.在考查评分者信度时,如果三人以上评阅数份试卷,则需计算( a )。

A.肯德尔和谐系数B.等级相关系数C.皮尔逊积差相关系数D.克伦巴赫α系数8.(a )是指在不同时间内用同一测验(或用另一套相等的测验)重复测量同一被试者,所得结果的一致程度。

A.信度B.效度C.难度D.区分度9.信度只受(d )的影响。

bA ．系统误差 B.随机误差 C.恒定效应 D.概化理论10.复本信度又称等值性系数。

它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系效。

复本信度反映的是测验在( c )上的等值性。

dA.时间B.题目C.评分D.内容11.分半信度通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系效。

这个相关系数就代表了( d )内容取样的一致程度。

第4章测量的信度与效度

2 2 X T2 E
实得分数的方差等于真分数的方差与误差方差之和。
调研人员应运用所掌握的统计知识，分析其是属于系统误差还是属于随机误差。系统误差会使调查结果有误，所以应尽量避免。随机误差可通过提高样本代表性、增大样本量来减少。
信度一般规定是：真分数的方差在总体方差中所占的比重，即信度系数：
当题目间的相关系数越大时，α系数也会越大。当题目数目n越多时，S
2 H
n 值越大，越接近于0， 2 SH n 1
2 S i
越接近于1，故α系数也会越接近于1。
要做信度分析须先检查每个题目是否都是同方向的，即都是正面问法，反向问题需要做处理后才可以加入分析。
在计算α系数时，应该注意有些调查量表测量的内容包含几个领域，这时宜分别计算各个领域的α系数。克朗巴哈α系数适用于项目多重计分的测验数据或问卷数据，可以用该系数测量Likert量表的信度。在基础研究中，信度至少应达到0.8才可接受；在探索性研究中，信度只要达到0.7就可以接受；在旅游调查测量实践中，信度只要达到0.6即可接受。 α系数通常与量表题目数量有关，题目数量越多，α系数就越大。
理想（甚佳，信度佳（信度高）很高）非常理想（信度非非常理想（甚佳，常好）信度很高）
二、克朗巴哈 α系数的手工计算
以一份有8个题项的量表为例，8个题项均为正向题，受试样本数有6位，采用Likert 5点量表填答，获得调查结果如下表：
题号样本
量表试题
01 5 5 5 5 5 4 02 1 1 2 1 1 1 03 2 2 2 2 2 1 04 5 4 5 5 5 5 05 2 3 3 3 3 3 06 5 5 5 5 5 4 07 4 5 5 5 5 4 08 3 2 2 3 2 2 总分 27 27 29 29 28 24

4. 信度

在测量理论中，信度被定义为：一组测验分数的真变异数与总变异数（实得变异数）的比率。
rxx=ST2 / Sx2 式中，rxx代表测量的信度，ST2代表真分数的变异数， Sx2
代表是实得分数的变异数，即总变异数。
该定义有两点需要注意：
第一、信度指的是一组测验分数或一列测量的特性，而不是个人分数的特性；
2. 假设用A、B两型创造力复本测验对初中一年级10个学生施测。结果如表所示，X1 ，X2 分别代表A、 B两型测验。求该测验的复本信度。
测
被试
验 1 2 3 4 5 6 7 8 9 10
X1 20 19 19 18 17 16 14 13 12 10 X2 20 20 18 16 15 17 12 11 13 9
（一）定义与计算
１．定义用同一种测验，对同一组受试者，前后施测两次，再根据受试者两次测验分数计算其相关系数，即得重测信度。
即测验时距（几分－几年）再测验
此种信度能表示两次测验结果有无变动，反映测验分数的稳定程度，故又称稳定性系数。
２．计算方法
计算使用皮尔逊积差相关公式的变式： ∑ Ｘ１Ｘ２－ ∑Ｘ１ ∑Ｘ２／Ｎ
2. 两次测验的时间间隔要适当，若太短，由于测验太相似被试可能厌倦，若太长可能又会因新的学习而产生干扰。
（五）使用复本信度的局限
1. 只能减少但不能完全消除练习和记忆的影响； 2. 由于第二个测验只改变了题目的具体内容，已经掌握的解题原则可以很容易地迁移到同类问题。 3. 对许多测验来说，建立复本是十分困难的。
rxx NＳ１Ｓ２
式中Ｘ１、Ｘ２为同一被试的两个分数，Ｓ１、Ｓ２为两次测验的标准差，Ｎ为被试人数。
（二）误差来源
1. 测验本身：测验所测的特性本身就不稳定，例如情绪。

(2021年整理)心理测量学重点

心理测量学重点编辑整理：尊敬的读者朋友们：这里是精品文档编辑中心，本文档内容是由我和我的同事精心编辑整理后发布的，发布之前我们对文中内容进行仔细校对，但是难免会有疏漏的地方，但是任然希望（心理测量学重点）的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈，这将是我们进步的源泉，前进的动力。

本文可编辑可修改，如果觉得对您有帮助请收藏以便随时查阅，最后祝您生活愉快业绩进步，以下为心理测量学重点的全部内容。

心理测量学第一章概论一、测量:根据一定的法则使用量尺对事物的属性进行定量描述的过程.二、测量的精确度决定于测量对象本身的性质（确定型、随机型、模糊型）和测量工具的精密性。

三、测量的基本要素 :1。

参照点(1）绝对参照点(有绝对的零点,可进行乘除运算）（2）相对参照点（以人确定的零点，只可加减）2。

单位：条件：要有确切的意义和相等的价值四、测量的量表 : 称名量表、顺序量表、等距量表（可进行加减运算)、比率量表（可进行加减乘除）五、心理与教育测量的定义：根据心理学和教育学法则给人的心理特质和教育成就指派数字，或者根据一定的心理学和教育学理论在测验上对人的心理特质和教育成就进行定量描述的过程。

六、编制一个测验应当具备下列四个基本条件:（1)行为样本.（2）标准化:指测验的编制、实施、记分以及测量分数解释的程序的一致性。

标准化条件:测验内容、施测条件、评分规则和测验常模的标准化。

（3）难度或应答率。

（4）信度和效度。

七、1918年，桑代克提出“凡客观存在的事物都有其数量”。

1939年，麦柯尔进一步提出“凡有其数量的事物都可以测量"作业补充题:1、为什么说心理与教育测验的分数本质上是顺序量表上的分数？答：从本质上讲，心理与教育测量的量表属于顺序量表。

（1)从使用的参照点来说，教育测量和心理测量领域的参照点均为相对零点；（2)从使用的单位来说，教育与心理测量的单位远没有其他测量的单位成熟完善.第二章简史一、现代心理与教育测量的起源：(1）1879年德国心理学家冯特在莱比锡大学建立了世界上第一个心理实验室.（2）高尔顿把统计方法应用到对个别差异资料的分析之中.学生皮尔逊创立了积差相关公式。

心理测量第4章心理和教育测量的信度

2 K为测验题目数，Si2 为某一题目分数的变异数，Sx 为测验总分的变异数
采用SPSS计算信度
数据库
同质性信度计算方式
结果
输入40题
结果
评分者信度
标准化测验一般都有较为严格的评分程序。
对于客观性试题来讲，评分所引起的误差是可以忽略不计的，但是对于一些主观题来讲，评分者之间的变异是产生误差的重要原因之一。
一般原则是：当rxx＜0.70时，测验不能
对于个人作出评价或预测，而且不能做团体比
较；当0.70≤rxx＜0.85时，可用于团体比较；
当rxx≥0.85时，才能用来鉴别或预测个人成
绩或行为。另一原则是，新编的测验信度应高于原有的同类测验或相似测验。
表3-1 几种心理测验的信度系数
测验类型
低成套成就测验学术能力测验成套倾向性测验客观人格测验兴趣测验态度测验 0.66 0.56 0.46 0.46 0.42 0.47
115，那么他的智商的真分数的变动范围就是
115±1.96×3.35，也就是说，有95%的把握
认为，这个儿童真正的智商水平在108.4至
121.6之间。

某被试在韦氏成人智力测验中言语智商为 102，操作智商为110，已知两个分数都是以100为平均数、15为标准差的分数，假设言语测验和操作测验的分半信度分别为 0.87和0.88，问其操作智商是否显著高于言语智商？
信度系数ቤተ መጻሕፍቲ ባይዱS为分数标准差， X 为分数的均值，C 为达标分数或分数线。

用决策的一致性作为信度指标
标准参照测验常用来把被试分为掌握（达标）和未掌握（未达标）两组，这实际上是用测验来作决策，因此可用作决策的一致性而不是分数的一致性来确定信度，也就是看再测时被同样归类的受测者的比例，两次施测被同样归类的受测者比例越高，说明信度越高。

第四章信度与随机误差

ST2 = SV2 + SI2
最后二式合并可得 SX2 = SV2 + SI2 + SE2
二. 测量信度
? 稳定性 \ 可靠性 \ 一致性
你的观测分数在多大程度上反映了你的“真实”分数？在不同时间测验同一个人获得的结果是一致吗？
? 人们通常把测量结果的可靠性称为信度,即测量结果的一致性或可信性程度。
如果进行无数次测量,X的平均值等于T
? 对于一个团体来说,实得分数、真分数和测量误差之间有如下关系: SX2 = ST2 + SE2
即实得分数的变异数 SX2等于真分数的变异数 ST2加上误差变异数 SE2
而真分数变异数可分成与测量目的有关 (有效)的变异数 SV2和与测量目的无关但却稳定的变异数 SI2
专业资料这个假想测验的误差变异来源分析信度类型误差变异量误差变异来源复本信度间隔施测1070030时间与内容取样分半信度1080020内容取样上述二者差异030020010时间取样评分者信度1092008评分者差异误差变异总和020010008038真实变异1038062专业资料这个假想测验的误差变异来源分析真实变异误差变异时间上的稳定性复本之间的一致性评分者之间的一致性内容取样误差时间取样误差评分者间差异6220108专业资料?信度的作用反映了测量过程中所存在的随机误差大小可以用来解释个人测验分数的意义可以帮助进行不同测验分数的比较?影响信度的因素
各种信度系数相应误差变异的来源
信度系数的类型
误差变异的来源
再测信度复本信度（连续施测）复本信度（间隔施测）分半信度同质性信度评分者信度
时间取样内容取样时间与内容取样内容取样内容的异质性评分者间的差异
假设对100个六年级学生以两个月的时间间隔先后施测一个创造力测验的A\B两个复本, 所得的

第四章测量的信度与效度ppt课件

力等难度测验
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
➢ （二）复本信度（Alternate-form reliability） ➢ 1.含义与计算 ➢ 是指两个平行测验测量同一批被试所得结果的一
致程度，其大小等于同一组被试在两个复本测验上所得分数的积差相关系数。计算公式同重测信度。
2. 信度的测量学定义（操作性定义）
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
3. 误差方差与信度的关系
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
➢ 二、信度的估计方法 ➢ （一）重测信度（test-retest reliability） ➢ 1.含义与计算 ➢ 重测信度是指用同一量表对同一组被试测试两次
所得结果的一致程度，其大小等于同一组被试在两次测验上所得分数的积差相关系数。即：
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。
➢ 当评分者人数为2时，评分者信度等于两个评分者给同一批被试答卷所给分数的相关系数。如果是多个评分者，评分者信度采用肯德尔和谐系数进行估计。
严格执行突发事件上报制度、校外活动报批制度等相关规章制度。做到及时发现、制止、汇报并处理各类违纪行为或突发事件。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第四章信度
一、什么是信度
含义：指的是测量结果的稳定性程度（或叫可靠性）。

也指同一被试在不同时间内用同一测验（或用另一套相等的测验）重复测量，所得结果的一致程度。

1、理论定义：测验实测值和真值的相差程度。

2、操作定义：
定义1：一组测量分数的真分数变异数（方差）与总变异数（总方差、实得分数的方差）的比率，或者是真实分数方差占总方差的的百分比。

计算公式：
rxx=ST2/SX2
定义2：信度乃是一个被试团体的真分数与实得分数的相关系数的平方。

即
rxx=ρTx2
定义3：信度乃是一个测验X（A卷）与它的任意一个“平行测验”X’（B卷）的相关系数。

即
rxx=ρxx’
二、信度的类型及估计方法
（一）重测信度
1、含义与计算
又称稳定性系数。

他的计算方法是采用重测法，即使用同一测验，在同样条件下对同一组被试前后施测两次测验，求两次得分间的相关系数。

三、信度的类型及估计方法
（一）重测信度（再测信度）
例：15名同学在1个月间隔内，先后2次重复施测某测验，测验结果如表中所列，请根据这些数据对该测验的重测信度进行计算。

三、信度的类型及估计方法
（一）重测信度
三、信度的类型及估计方法
（一）重测信度
可见，这两次测验分数之间有较高的正相关，该测验有较高的重测信度。

2、使用的前提条件
（1）所测量的心理特性必须是稳定的。

（2）遗忘和练习的效果基本上相互抵消。

（3）在时间间隔中没有学习另外的与测验有关的东西，或者说每人学习其他东西的程度都一样。

3、优缺点：
优点：
（1）它最符合重复测验的涵义，是重复测验最简单最明确的方式。

（2）首测和再测只需要一套测验题目，省时、省力。

（3）同一套题目无论施测几次，所测的属性是完全相同的。

缺点：
（1）同一组被试对同一个测验先后两次作答相互之间是不独立的。

（2）如果两次施测时间间隔较长，在此期间被试的身心发展，新知识的获得，都会使两次测验结果不相同。

（3）同一个被试对现一个测验先后两次作答，对测验的兴趣不同，影响测验结果。

（4）两次施测的环境不同，也是产生测量误差的因素。

（二）复本信度
1、含义与计算：
含义：
又称等值性系数。

它是以两个平行或复本的测验（等值但题目不同）来测量同一群体，然后求得被试在两个测验上得分的相关系数，这个相关系数就代表了复本信度的高低。

复本信度反映的是测验在内容上的等值性，故称等值性系数。

2、使用的前提条件：
（1）要两份或两份以上真正平行的测验。

（2）被试要有条件接受两个测验。

主要取决于时间、经费等几方面。

3、优缺点：
优点：
（1）一个测验的复本使得测验数目的增加，对于所欲测量的属性相联系的行为总体代表性强，因此，一个测验的两个复本在两三天至一周对同一组被试施测时，获得的复本信度系数是相当准确的。

（2）测验的两个复本，如果在不同时间使用，其信度不仅可以反映在不同时间的稳定性，而且还可以反映对于不同测题的一致性。

（3）两个复本在同时使用时，可以避免再测验信度的缺点。

缺点：
（1）编制两个完全相等的测验是很困难的。

（2）复本法只能减少而不能完全排除练习和记忆的影响。

（3）被试同时接受性质相似的两个测验可能减少完成测验的积极性。

（三）分半信度
1、含义
指采用分半法估计所得的信度系数。

这种方法估计信度系数只需一种测验形式，实施一次测验。

通常是在测验实施后将测验按奇、偶数分为等值的两半，并分别计算每位被试在两半测验上的得分，求出这两半分
数的相关系数。

2、计算
（1）两半测验分数的变异数相等（方差齐性）
先计算两半测验的积差相关系数，再进行校正。

常用的修正公式是：斯皮尔曼－布朗公式：
21hh
hh
r r r χχ
=
+
（2）两半测验分数的变异数不等（方差不齐），可采用：弗朗那根公式或卢伦公式中的任意一个。

22
2
21a b
x s s r s ⎛⎫+=- ⎪⎝⎭
2
2
22
1d
x
d x s r s s s =-其中为两半测验分数之差的变异数,为测验总分的变异数.
问题：对初一年级学生进行地理成绩测验，每答对1题得1分，答错1题得0分.得分如表所示，试估计该测验的分半信度。

3、使用条件及范围
分半信度通常是在只能施测一次或没有复本的情况下使用。

当一个测验无法分成对等的两半时，分半信度不宜使用。

（四）同质性信度
1、含义：指测验内部所有题目间的一致性。

题目的一致性有两层含义：其一是指所有题目都测的是同一种心理特质；其二是指所有题目之间都具有较高的正相关。

总之，同质性信度就是一个测验所测内容或特质的相同程度。

幻灯片22
2、测量同质性信度的基本公式：
1(1).
ij kk ij
ij kk Kr r k r r r =
+-其中K 为构成测验的项目数,为项目间相关系数的平均数,为同质性信度值3
、库德-理查逊公式：适用于客观性试题（0、1记分）
20221222
1111()(1)i i x i i x x
x K R p q k k S K K R kp q k k S kS X k X k S K X -⎛⎫∑⎛⎫=- ⎪
⎪-⎝⎭⎝
⎭-⎛⎫⎛⎫=- ⎪
⎪-⎝⎭⎝⎭--=-kk 2i i x kk 2x 公式:
r 表示构成测验的题目数,p 为通过第i 题的人数比例,q 为未通过第i 题的人数比例,s 为测验总分的变异数.公式:
r 表示构成测验的题目数,为测验总分的平均数,s 为测验总分的变异数.
3、克伦巴赫系数
222211i x i x S k k S K S S α⎛⎫∑=- ⎪
-⎝⎭
其中为测验的题目数,为某一题目分数的变异数,为测验总分的变异数.
例题：某态度量表共7题，100个被试在各题上的得分方差分别是 0.81,0.82,0.79,0.83,0.85,0.76,0.77。

测验总分的方差为14.00 求此测验的信度(α=0.70) （五）评分者信度
1、含义与计算：指的是多个评分者给同一批人的答卷进行评分的一致性程度。

是用于测量不同评分者之间所产生的误差。

式中W 为和谐系数，K 为评分者的人数，N 为被评对象数，Ri 为每一对象被评的等级总和。

()
()
2
22
3
1
12
i i R R N
W K N
N
∑∑-=
-
例子：假设有三位专家给六篇论文评等级，结果如表所示，试计算此次评分者的评分者信度。

学1 学2 学3 学4 学5 学6 专1 2 4 1 5 6 3 专2 3 4 1 5 6 2 专3 3 5 1 4 6 2 Ri 8 13 3 14 18 7
()()22
2232
23:,63,811,3,6
1
12
638116
1
3(66)120.95
i i i i
R R k n R R
N
W K N N ∑=∑===∑∑-
=
--
=
⨯-=i 解分别求出各篇论文等级之各R 则有
2、注意的问题：
为了衡量评分者之间的信度高低，可随机抽取若干份测验卷，由两位评分者按评分标准分别给分，然后再根据每份测验的两个分数计算相关，即得评分者信度。

一般要求在两位受过训练的评分者之间平均一致性达0.90以上，才认为评分是客观的。

当多个评分者评定多个对象，并以等级法记分时，可采用肯德尔和谐系数作为评分者信度的估计。

思考题:
1.请思考评分者信度的含义，是否脱离了信度
的理论定义?
2.如何对于“焦虑自评量表”的信度进行评价?。