信度的计算

合集下载

心理测量学第三章信度

心理测量学第三章信度

第三章信度心理测验就是对某些心理特质的个别差异进行测量的工具,对心理特质的测量与对物理属性,如物体长度和重量等的测量是一样的。

不同的是心理测量所测量的是抽象的心理特质,工具是心理测验,而物理测量的对象则是物体的重量和长度等特性,工具是尺子和天平。

心理测量与物理测量的另一个共同点是二者都难以避免误差的影响。

在对物体的长度进行测量时,物体的热胀冷缩,测量者读取刻度的准确性等因素都会使测量出的长度与物体的实际长度不符,在不同时间、地点的测量值会有出入。

就是说,在不同情景下测量结果是不稳定的,与测量情景和测量条件有关的误差称随机误差(random error)。

由于这一误差是由测量过程造成的,因此也称测量误差(measurement error)。

另一方面,使用一把尺子对物体的长度进行测量时,这把尺子本身的质量也可能造成误差。

如果一把尺子本身就是有问题的,测量出的物体的长度自然就不准确。

这类误差与测量情景引进的误差不同,只要在测量时使用这把尺子,误差就会恒定地存在,无法消除。

这类由测量工具本身造成的误差称为系统误差(system error)。

对心理的测量与对物理的测量一样,也同样存在这两类误差。

与这两类误差相对应,心理测验中引入了信度和效度的概念。

信度研究涉及了测验分数的可靠性和稳定性,也即如何控制和减少随机误差。

效度研究则涉及了测量的系统误差,也即如何提高测量工具本身的准确性。

第一节经典测验理论的信度观教育与心理测验的目的是将个体的心理特质数量化,从而更精确地研究心理的个别差异。

在廿世纪初心理测量实践的推动下,测验理论产生了。

经过几十年的发展,到廿世纪五十年代初,教育与心理测验理论对测验的构建、误差的控制、测验结果的统计分析及解释等问题已形成一个完整的理论体系。

为与以后产生的项目反应理论和概化理论相区别,人们习惯上将这一理论体系被称为经典测验理论(Classical Test Theory,简称CTT)。

如何计算信度和效度

如何计算信度和效度
一、重测信度
1、选择10人采用“评测信度”问卷对其进行调查
2、数据录入Excel
3、录入时注意:答案为“是”记为“1”分,“否”记为“2”分
4、将每个人问卷总分算出来
5、录入格式
研究对象
第一次测试
第二次测试
1
分数
分数
2
分数
分数
3
分数
分数
4
分数
分数
5
分数
分数
6
分数Hale Waihona Puke 分数7分数
分数
8
分数
分数
9
分数
分数
10
分数
分数
6.两次测试间隔一周
7.如不录入数据,计算可以不通过软件
8.计算公式
X:第一次测试得分
Y:第二次测试得分
n=10
r:相关系数
>0.7问卷有效
二、内容效度
1.选择5名熟悉便秘及便秘护理相关知识专家,评价问卷内容。修改后再次评价。
2.应用效度测评问卷
3.计算平均效度

第六章-信度

第六章-信度

rKK
(三)测验难度
难度对信度的影响,只存在于某些测验中。
如智力测验、成就测验、能力倾向测验等;
对于人格测验、兴趣测验、态度量表等不存在难
度问题,因为这些测验的题目没有正确或错误答
案之分。
就难度与信度的关系而言,并没有简单的对应关
系。
从理论上说,只有平均难度水平为50%时,才能使
4
5 6
6
3 1
6
3 1
6
2 1
18
8 3
R
i
=14+7+13+18+8+3=63
2 R i =142+72+132+182+82+32=811
由题意知 K=3, N=6, 将上述值代入公式有:
2 12 811 63 / 6 =0.95 W= 32 63 6

如在评定中有相同的等级时,用下式校正。其中n
K-R20公式(仅适用于以1、0记分)
rKK K ( K 1
2 SX pi qi 2 X
S
)
公式K-R20中:K为构成测验的题目数;Pi为通过
第i题的人数比例;qi为未通过第i题的人数比
例;SX为测验总分的标准差。
K-R21公式(适用于以1、0记分,各题难度近似)
rKK
KS X ( K X ) 2 ( K 1) S X
1.两次测验的时间间隔要适当
时间太短,第一次的测验记忆犹新,夸大了稳定性;时间 太长,受学习、成熟等影响,从而降低了稳定性。 2.再测法适用于速度测验或人格测验,而不适用于难度测 验。 因为速度测验和人格测验项目多,被试无法记住测验内 容,所以受第一次测验影响小。

教育测量的质量指标--信度概述

教育测量的质量指标--信度概述
值),E表示误差。

E=x-T
(公式1-2
(一)信度指实测值和真值相差的程度
1、试比较以下两次测量结果(只进行 一次)的信度:
用尺子量100cm高的一个儿童,得到1cm 的绝对误差;量185cm高的一位运动员 ,也得得到1cm的绝对误差。
要比较两种测量结果的信度,一定要看误差分数(E )对于真分数(T)所占的百分数是多少。这个百分 数表示该实得分数(x)的相对误差。其计算式如下 :
rxx
1-σE2 σ2x
=1- 2.8 =0.865 20.8
(二)信度指统计量与参数之间的接近程度
❖统计量是指样本上的各种数字特征。(如样本平均数 、标准差等);参数是总体上的各种数字特征(如总体 平均数、标准差等)。 ❖在统计学中,统计量越接近参数,这个统计量的可靠 性越高。而要知道统计量与参数的接近程度,可以对参 数进行区间估计。
NXY x Y
r A1A2 [N X 2 ( X )2 ] [N Y 2 ( Y )2 ]
12 6420 280 286
[12 6594 2802 12 6912 2862
采用重测法计算稳定系数时,要注意的问题:
1、两次测验之间的时间间隔要适宜,尽可能在 较短的时距内进行。
➢ 信度(reliability):指的是测量结果的 稳定性和可靠的程度,亦即测量的结果是否 真实、客观地反映了考生的实际水平,可记 为rxx。
➢ 具体而言,可以从以下三方面来理解测量的 信度:
(一)信度指实测值和真值相差的程度
x=T+E (公式1-1)
x表示实测值,T表示真值(是未知的,可以
把多次测量的实测值的平均值作为真值的近似
2、怎样估计对一组人或一个人测量多次的实测 值与真值(真分数)的差异程度呢?

问卷信度的计算

问卷信度的计算

克朗巴赫系数 Cronbach α
• 内部一致性信度( Internal Consistency Reliability)
• 折半信度 (Split-halα系数
• 内部一致性系数大于0.7表明量表的可靠性较高;在探索性研究中,内部一致性系数可以 小于0.7,但应大于0.6;
分析——刻度——可靠性分析
选入量表的条目 模型选择Alpha
信度较低时,根据此表 格剔除部分条目。
谢谢!
• 问项数量小于6个时,内部一致性系数大于0.6,表明量表是有效的。
Hair Jr., J.F., Anderson, R., Tatham, R. and Black, W.C. (1998) Multivariate Data Analysis (5th Edition). Prentice Hall, Upper Saddle
问卷信度的计算
采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度。信度是指 测验结果的一致性、稳定性及可靠性。信度系数愈高即表示该测验的结果愈一致、 稳定与可靠。
• 重测信度( Test-retest Reliability) • 复本信度( Alternate-orm reliability)

考试成绩评价的区分度、信度、效度等概念

考试成绩评价的区分度、信度、效度等概念

目录考试成绩评价的区分度、信度、效度等概念 (1)高一化学备课组 2009.3.26 (4)考试成绩评价的区分度、信度、效度等概念1、试卷的区分度试卷的区分度指测试题目对被测试者实际水平的区分能力。

区分度高的试题,能将不同水平的被试者区分开来;区分度低的试题则对被试者水平不能很好地鉴别。

区分度是指试题对被试者情况的分辨能力的大小。

一般在-1~+1之间,值越大区分度越好。

试题的区分度在0.4以上表明此题的区分度很好,0.3 ~0.39表明此题的区分度较好,0.2 ~0.29表明此题的区分度不太好需修改,0.19以下表明此题的区分度不好应淘汰。

计算区分度的方法很多,特别需要注意的是对同一个试题的考试成绩采用不同的方法所得到的区分度的值是不同的。

我们可以使用下面的两种方法计算区分度:(1)先将分数排序,P1=27﹪高分组的难度,P2= 27﹪低分组的难度区分度D =P1-P2或区分度 D = (27﹪高分组的平均分-27﹪低分组的平均分)?/font>满分值(2)利用积差系数r 计算区分度D当两个变量都是正态连续变量,而且两者之间呈线性关系,表示这两个变量之间的相关成为积差相关。

积差相关的使用条件a、两个变量都是由测量获得的连续性数据。

如百分制分数。

b、两个变量的总体都呈正态分布,或接近正态分布,至少是单峰对称的分布。

c、必须是成对的数据,而且每对数据之间是相互独立的。

d 、两个变量之间呈线性关系。

积差相关系数r的计算在计算机上是很容易进行的。

积差相关系数r的公式如下:r=(无法显示)原谅!2、试卷的信度试卷的信度主要从两个方面进行分析,一方面是考试成绩期望值与实际成绩平均值的差异,考试成绩期望值一般应以平时成绩的平均值为依据确定.另一方面是考试成绩的预期及格率与实际及格率的差异,考试成绩及格率的预期值同样以平时成绩的及格率为确定依据.两个方面的差异性较小,说明试卷信度较高.考试信度,简单地说是考试结果的可信程度,是推测考试可信与否的最重要的量化指标。

scott's pi信度公式

scott's pi信度公式

Scott's Pi信度公式是统计学中用于测量测量工具或测试的信度的一种方法。

信度是指一个测量工具稳定性和一致性的度量,也就是说,当同一个对象在不同时间或者不同条件下被测试时,结果是否稳定和一致。

Scott's Pi信度公式是由David W. Scott在1977年提出的,它可以用于二分类的测试数据,并且在实际应用中被广泛使用。

Scott's Pi信度公式的计算方法相对简单,它是通过测量两次测试之间的一致性来确定信度的。

具体而言,Scott's Pi信度公式可以衡量两次测试结果中同时判断为是或者不是的概率,以此来判断测试工具的信度。

在实际应用中,Scott's Pi信度公式常常用于衡量医学诊断测试、行为研究、心理学测试等领域中的信度。

使用Scott's Pi信度公式进行信度测量时,我们需要首先确定两次测试的结果,然后将结果分类为“是”和“否”,接着根据测试结果进行交叉分类计算,最后使用Scott's Pi信度公式进行计算。

具体的计算公式如下:1. 首先我们需要确定四个值,分别为a、b、c、d,它们分别代表了两次测试结果的交叉分类数量。

其中a代表两次测试中判断为“是”的数量,b代表第一次测试判断为“是”而第二次测试判断为“否”的数量,c代表第一次测试判断为“否”而第二次测试判断为“是”的数量,而d代表两次测试中判断为“否”的数量。

2. 我们通过计算Scott's Pi信度系数来得到信度的度量值。

计算公式如下:Pi = (a + d) / (a + b + c + d)Pi = 2(a + d) / (2(a + b) + 2(a + c))其中,Pi的取值范围为-1到1之间,当Pi为1时,表示两次测试结果完全一致,信度非常高;当Pi为0时,表示两次测试结果完全不一致,信度非常低;当Pi为-1时,表示两次测试结果完全相反,信度也非常低。

第二章 信度

第二章 信度
被 试 1 2
18
3
23
4
21
5
17
6
18
7
20
8
17
9
16
10
13
11
14
12
13
13
12
14
8
15
8
奇数 20 题 (X)
偶数 20 题 (Y)
22
19
22
18
15
14
17
15
16
14
12
10
7
8
(2)库得-理查逊(Kuder&Richardson)系数(采 用0,1记分时 )
KR20
n ( n-1
第二讲 信度
内容: 1.信度的含义 2.信度的计算方法 3.影响测验信度的因素 4.提高测验信度的方法
(一)什么是信度 信度是指测量结果的稳定性或可靠性程度。 一个好的测量必须具有较高的信度,其结果就不应 随工具的使用者或使用时间等方面的变化而发生较 大的变化。 信度可以理解为:信度指实测值(观察分数)和真 值(真分数)相差的程度;信度指两次重复测量或 等值测量之间的关联程度。
3.内部一致性系数 (1)分半信度 在测验无复本且只能施测一次的情况下,通 常用分半法估计信度,即将测题分成对等的两 半,根据各人在这两半测验的分数,用皮尔逊 积差相关公式计算其相关系数,作为信度指标。 分半信度考察的是两半题目之间的一致性, 故这种信度系数也称内部一致性系数。计算分 半信度仍然可用积差相关方法。
也可用下列公式:其中X、Y为同一 被试的两个分数,Sx、Sy为两组分 数的标准差。X、Y为两组分数的平均 数,N为被试人数。
∑ XY/N-XY rxy = SxSy
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.问卷设计质量的信度检验
所谓问卷设计质量的信度检验,指的是对问卷测量结果准确性的分析,即对设计的问卷在多次重复使用下得到的数据结果的可靠性的检验。

在实际应用中,信度检验多以相关系数表示,常用的方法有:重测信度,复本信度,折半信度,克朗巴哈 信度,评分者信度等。

国内外已经有很多关于这些信度分析方法介绍的文献,在这里,笔者不再一一详述,仅列出相关公式作为参考。

(1)重测信度,也叫稳定系数,对同一组调查对象采用同一调查问卷进行先后两次调查,采用检验公式
,其中
为两次调查结果的协方差,
为第一次调查结果
的协方差, 为第二次调查结果的协方差。

系数值越大说明信度越高。

(2)复本信度,也叫等值系数,对同一组调查对象进行两种相等或相近的调查,要求两份问卷的题数、形式、内容及难度和鉴别度等方面都要尽可能的一致。

检验公式同稳定系数公式,系数越大,说明两份问卷的信度越高,具体调查时使用哪一份都可以。

(3)折半信度,也叫内在一致性系数,将调查的项目按前后分成两等份或按奇偶题号分成两部分,通过计算这两部分调查结果的相关系数来衡量信度。

当假定两部分调查结果得分的方差相等时,检验用Spearman-Brown 公式来表示:
, 其中 表示折半信
度系数;当假定方差不相等时,采用Flanagan 公式: ,其中 、 分别表示两部分调查结果的方差, 表示整个问卷调查结果的方差。

如果折半信度很高,则说明这份问卷的各项题之间难度相当,调查结果信度高。

(4)Cronbach’s α系数是Cronbach 于1951年创立的,是指测验内部的项目在多大程度上考察了同一内容,评价的是量表中各题项得分间的一致性。

同构型信度低时,即使各个测试题看起来似乎是测量同一特质,但测验实际上是异质的,即测验测量了不止一种特质。

α信度系数法是目前最常用的内部信度系数。

实际上,α系数是所有可能的分半信度的平均值,α系数是估计信度的最低限度,α系数高时,信度就高,α系数低时,信度不一定低。

低信度:α<0.35, 中信度: 0.35<α<0.70,高信度: 0.70<α。

一般来说,问卷的α系数在0.8以上该问卷的信度较好,达0.85以上,表明问卷信度良好。

克朗巴哈 信度,是对折半信度的改进,检验公式是:)1(1k k 2
2
i σσα∑--=
,其中K
表示问卷中的题目数, 为第i 题的调查结果方差, 为全部调查结果的方差。

信度
系数是目前最常用的信度分析法。

(5)评分者信度,包括 信度和
信度,将问卷中的每道题看作是一个变量,然后
通过调查的结果得分对所有问题做因子分析。

得到 ,
,其中
是最大特征值,N 是问题数, 是因子分析法的第i 个问题的共同度。

例:
【壹】内部一致性(Internal Consistency Coefficient)【计算α系数】
有5题问答题的随测验施测5名学生,每题问答题配分是5分,以下是施测
结果,请计算信度。

person Item 1 Item 2 Item 3 Item 4 Item 5
Joe 3 4 4 3 5
Sam 4 3 4 3 3
Sue 2 3 3 2 3
Peg 4 4 5 3 4
Gil 3 2 4 3 3
Dot 3 2 3 2 3
步骤一输入数据
步骤二按【Analyze】→【Scale】→【Reliability Analysis】将左边方格内的变项全选入右边items的方格内,在左下角
的Model框中选取Alpha后按键。

步骤三出现下列对话框候选取下列勾选处,后按键
按。

Reliability
****** Method 2 (covariance matrix) will be used for this analysis ******
R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
Correlation Matrix
ITEM_1 ITEM_2 ITEM_3 ITEM_4 ITEM_5
ITEM_1 1.0000
ITEM_2 .2970 1.0000
ITEM_3 .7647 .5941 1.0000
ITEM_4 .6860 .4330 .8575 1.0000
ITEM_5 .1588 .8018 .4763 .4629 1.0000
N of Cases = 6.0
Item-total Statistics
Scale Scale Corrected
Mean Variance Item- Squared Alpha if Item if Item Total Multiple if Item Deleted Deleted Correlation Correlation Deleted
ITEM_1 13.0000 6.4000 .5251 .6471 .8472 ITEM_2 13.1667 5.3667 .6757 .7500 .8116 ITEM_3 12.3333 5.4667 .8333 .8588 .7642 ITEM_4 13.5000 6.7000 .7481 .7857 .8093 ITEM_5 12.6667 5.8667 .5922 .7143 .8333
Reliability Coefficients 5 items
Alpha = .8457 Standardized item alpha = .8609
纸笔计算结果
σi 2 =
X =16.1667, σ2=7.4722 σ=2.7335 k=5 N=6
85
.84575.)3234.1)(25.1()4722
.74166
.21)(25.1()4722.75833.2222.4722.6667.4722.1(45==-=-=++++-
=α。

相关文档
最新文档