测量工具地信度和效度分析报告报告材料

测量工具地信度和效度分析报告报告材料
测量工具地信度和效度分析报告报告材料

测量工具的信度和效度分析

测量工具的信度和效度分析

常用的测量工具主要有调查问卷和量表,它们都是对个人行为和态度的一种测量技术,是测量答卷者对问卷题目主观认识的个体差异的工具,也是研究者用来搜集资料的一种技术。一般情况下,编制一份量表必须做效度和信度评价,而调查问卷则不是必须的。对于有些调查问卷,其包含了类似量表性质对答卷者客观指标测量的题目,对这部分题目需要进行效度和信度的评价。

第一节信度分析概述

一、信度的概念

信度是指测量工具的可靠性和稳定性的程度,或是指使用某测量工具所获得结果的一致程度或准确程度。

测量工具的信度包含2层含义:一是相同的个体在不同时间,以相同的测量工具测验或以复本测验,或在不同的情景下测验,是否能得到相同的结果,即测量工具的测验结果是否随时间和地点等因素而变化;二是能否减少随机误差对测量工具测验结果的影响,从而反映测量工具所要测量的真实情况,即测量工具是否具有稳定性、可靠性和可预测性。

信度的三个特征是:稳定性、内部一致性和等同性。一个好的测量工具必须是稳定可靠,且多次测验结果应前后一致。

信度本质上是一个统计学概念,是用于估计测量误差大小的尺度,主要说明测量工具测验结果中测量误差所占的比例。实际应用中主要通过构建平行测验来计算测量工具的信度。

二、信度的评价方法

信度研究的是测量工具测验结果的可靠性与稳定性,这种可靠性与稳定性可以从4个不同的角度来评价:①在相同条件下所得测量工具测验结果一致程度;②不同研究者用同一种测量工具同时测验所得结果的一致程度;③同一研究者用同一种测量工具在不同时间内测验所得结果的一致程度;④同一答卷者在不同时间内对同一种测量工具测验的稳定程度。

根据研究角度不同,信度分为外在信度(external reliability )与内在信度(internal reliability )两大类。外在信度是指不同时间测量时测量工具测量的

一致性程度。内在信度是指测量工具是否测量的是单一概念,同时也表明测量工具各项目之间的内在一致性程度。

衡量信度高低的统计指标是信度系数(r)来表示,r〉0.75表明信度水平较高;r= 0.5-0.75表示信度处于中等水平低水平;r < 0.5表示信度处于较低水平。常见的信度系数有重测信度、复本信度、分半信度和Cron bach's系数等。重测信度是最常用的外在信度,Cron bach's系数是最常用的内在信度。

三、信度的分析方法

1 重测信度(test-retest reliability )

1.1定义:用同一工具两次或多次测定同一研究对象,所得结果的一致程度。

1.2指标:重测相关系数(r)r= 0 -1 ;r越接近1,重测信度越高

计算公式:r= * m_丫-产

D:第一次测试研究对象各得分之和

E Y:第二次测试研究对象各得分之和

IX2:第一次测试研究对象各得分平方之和

E Y2:第二次测试研究对象各得分平方之和

1.3在SPSS中计算重测信度的步骤:

在任务栏中选An alyze —correlate bivaviate —varables —pears on

1.4使用重测信度需考虑的问题

①两次测量间隔时间

②研究工具所测量的变量性质:适用较稳定的变量:人格特征、能力、生活质量、某些生理指标。

③测量环境的一致,包括:物理环境、时间、测量程序与测试者等

④样本量:预计样本的10% (10-20例

1.5重测信度结果的影响原因:变量随时间推移而发生改变;第一次测量结果的记忆效应;被调查者对第二次测评的不认真;条目设置问题;答案的评分等级问

研究表明:采用同一份由204个问题组成的自填式医学问卷,对2352名病人进行两次调查,间隔30分钟,发现仅20 %的人对所有问题两次回答一致,有5% 的人对13个及以上的问题两次回答不一致。

2 复本信度 (alternative form reliability ):也叫等值性系数(coefficient

Of equivale nee)。指两个大致相似的研究工具同时被用于研究对象,即题目不同但内容相似的两份测量工具。复本信度越高,测量工具越可靠,越能代表所欲测量的内容。计算方法是用两个复本间隔一定时间或同时施于同一答卷者所得分数的相关系数。

3分析测量工具内部一致性(internal consistency)的信度系数:适用于由多个条目组成的问卷或量表,是护理研究中最常用的信度测量方法。种类包括:折半信度(split-half reliability )、Cron bach's a系数以及适用于计算二分类是非题同质性信度的库德-理查森20号公式(KR20 )。

3.1折半系数:将测量工具(量表)的各项目分成两部分,分别加以计分,对这两个部分的数值进行相关分析,然后采用Spearma n-Brow n 公式计算信度。折半方法:

奇偶折半法、前后折半法

计算方法:先根据重测信度公式计算出相关系数r,再使用Spearman-Brown

公式计算折半信度。

折半系数测定的缺点是:不同的折半方法会导致不同的结果,而Cron bach ' a 系数与KR-20值所计算的是工具中所有项目的平均相关程度。

3.2 Cron bach ' a系数:该系数是Cron bach于1951年创立的,取值范围在

0-1之间,a系数越高,信度越高,测量工具内部一致性越好。

计算公式:a =Np/[1 + p(N-1)

在SPSS中计算重测信度的步骤:

在任务栏中选Analyze —scale —reliability —item —alpha

3.3 KR-20 :是Cron bach ' a的一种特殊形式,适用于二分制的测量工具,例

如回答“是”或“否”、“正确”或“错误”的测量工具。

计算公式:a = [ k/(k - 1) ]. ( §2 - Ipiqi)/ §2

4评分者信度:不同评定者使用相同的工具,同时测量相同的对象时,需计算

评定者间一致程度。检验方法:相关系数。

信度系数的计算有多种方法,各种方法所适用的信度类型也不同,因此在计算信度系数时必须认真考虑实际所求信度的类型,然后选择恰当的信度系数公式。由于误差来源不同,即使同一个测量工具用不同方法所计算的信度系数也会不同,

所以各信度系数间也不具有可比性。一般在信度分析中,要分别报告不同方法计算出的信度值。各种信度及其误差来源:

重测信度:检验量表的稳定性,考虑的误差来源是时间取样。

分半信度:检验量表的一致性,它考虑的误差来源是内容取样。

内部一致性系数:检验量表的一致性,考虑的是测验内容是否异质。

评分者信度:检验量表的等同性,考虑的误差来源是评分者间的差别。

复本信度:检验量表的等同性,考虑的误差来源是内容取样。

四提高测量工具信度的方法

1适当延长测量工具的长度。测量工具的题目越少,得分越容易受偶然因素的影响,测量工具的信度就越低;反之,测量工具题目越多,扩大了被测量者得分范围,在一定程度上排除了偶然因素的影响,提高了测量工具的信度。但是测量工具长度的增加与测量工具信度的提高并不总成正比,当信度系数较小时,延长测

量工具的题目,信度系数增加较大;而当信度系数较大时,延长测量工具的长度对信度系数的影响就较小。

2测量工具难度适中。测量工具题目太难或太易都会使测量工具得分差异减小,

从而降低了测量工具的信度。

3测量工具的内容尽可能同质。

4测验时间要充分,测验程序要统一,测量工具的评分要客观。

第二节效度分析概述

一、效度的概念

1效度的定义:效度通常是指测量工具的有效性和正确性,即所用的测量工具能够测量出研究者所欲测量特性的程度。效度是测量工具最重要的特征,效度越高表示该测量工具测验的结果所能代表要测验行为的真实度越高,越能够达到测验目的,该测量工具才越正确越有效。对于一个标准测验来说,效度比信度更为重要,效度的大小由效度系数来表示。

效度包括了两方面的含义:其一是测量工具的测验目的;其二是测量工具对测量目

标测量的精确度和真实性。

2效度的性质效度是指测验结果的正确性或可靠性,而不是指测验工具本身;效度并非全有或全无,只是在程度上有高低不同的差别;效度是针对某一特殊功能或者某种特殊用途而言,不具有普遍性;效度无法实际测量,只能从现有信息

作逻辑推断或对实证资料作统计检验分析。

3效度的分类

①内在效度(internal validity )是指某特定测量工具中自变量与因变量之间存在因果关系的程度,反应测量工具的内容的正确性与真实性。内在效度是测量研究工具中应具备的最基本的效度,测量工具的内在效度越高,其价值也越高。

②外在效度(external validity )是指研究结果的概括性和代表性,即研究结果可否推论到研究对象以外的其它受试者,或研究情景以外的其它情境。一项研究越能实现以上目标,就表示该研究的外部效度越好。

二、效度的评价方法

评价效度的指标有:表面效度(face validity )、内容效度(content validity )、效标关联效度(criterio n —related validity )、结构效度(con struct validity )、判别效度(discrimi nan t validity 、、聚合效度(coverge nt validity 、、因子效度(factorial validity 、等。

1 表面效度(Face validity):

定义:指通过粗略观察判断研究工具是否能测出所期望的概念。表面效度属于一种直觉判断用“有”或“无”来评价,在阐述表面效度时,应详细报告评价者的特点及其评价的可信度。

缺点:缺乏科学性,不能体现效度在程度上差异

2 内容效度(content validity ):

2.1定义:指量表中条目反映所测量内容的程度。即每个条目与所测内容的相关性,

以及量表中条目是否充分地反映了测量工具所测的领域。适用范围:问卷或量表形式的研究工具。建立在大量查阅文献、工作经验、综合分析、判断的基础上。

2.2评价方法:专家组(expert panel )以文字形式评价评定,由专家对工具内容的合

适性进行判断,一般需3个以上专家。应包括社会心理学领域、相关领域的临床护理专家、护理教育专家。专家资质要求:在本领域具有较高的学术水平;具有较高的教育背景;具有丰富的社会心理学知识;熟悉测量工具的发展与心理学特征测定的方法;严谨求实的科学态度。

2.3实施步骤:内容效度指数CVI公式(content validity index)

专家两两配对成组,分别计算各组中两个专家都认为相关的条目数占总条目数的

百分比。女口:AB-0.8 AC-0.9 AD-0.85、AE-0.9、BC-0.7、BD-0.8、BE-0.85、

CD-0.7、CE-0.75、DE-0.75。计算所有组的平均值,得到CVI为0.8

3、效标效度(criterion-related validity )

定义:以一个公认有效的研究工具作为标准,检验新工具与标准工具测定结果

的相关性。可分为同时效度(con curre nt validity) 研究工具与现有标准之间的相关性和预测效度(predictive validity) 测量工具作为未来情况预测指标的有效程度。

估计方法:①相关法,即计算某测量工具得分与效标间的相关性性,其结果即为

效标效度。当测验分数与效标测量分数都是连续变量时,用积差相关公式求相关系数;当测量工具分数是连续变量而效标分数是二分变量时,可用二列相关公式计算效标效度。②区分法:即看测量工具测量分数是否可以区分由效标所划分的团体,可以用t检验进行差异性检验。

4、结构效度(constructive validity)

定义:反映研究工具所依据理论的程度,与理论框架相符合与否。用已知的具体

的概念反映抽象的概念。

检验方法:因子分析,其主要功能是从量表全部变量(题项)中提取一些公因子,

各公因子分别与某一群特定变量高度关联,这些公因子即代表了量表的基本结构。通过因子分析可以考察问卷是否能够测量出研究者设计问卷时假设的某种结构。在因子分析的结果中,用于评价结构效度的主要指标有累积贡献率、共同度和因子负荷。累积贡献率反映公因子对量表或问卷的累积有效程度,共同度反映由公因子解释原变量的有效程度,因子负荷反映原变量与某个公因子的相关程度。

评价测量工具的效度较为复杂,实际应用时可以结合各种情况进行评价。

三、提高效度的方法

1提高内在效度的方法:理论正确,解释清楚,概念要明确,解释要信而可证;操作规范以减少误差;控制系统误差;样本适宜且要预防流失,测试的样本容量一般不应低于30例;适当增加测量工具的长度,增加测量工具的长度既可以提高测量工具的信度又可以增加测量工具的效度,但增加测量工具长度对信度的影响大于效度;排除无关因素干扰。

2提高外在效度的方法:测量工具测量结果的解释分析应具有普遍性、客观性、合理性与真实性;以可操作性定义代表抽象性定义,取样应有足够的代表性,研究的情

景要适宜,最好能与未来情景类似;观察具有普遍性,资料搜集要注意多元性,且要客观;尽可能排除无关的干扰变量,并慎防实验者效应发生。

四效度和信度的关系

信度与效度,二者既有联系又有区别,信度是对调查对象而言,效度是对调

查所要说明的问题而言信度高效度不一定高,效度高则信度必定高,换句话说,

可信的不一定有效的,有效的则必是可信的。以打靶为例,信度检验资料的可

靠性、稳定性、一致性,效度(validity)检验结果的准确性。

信度和效度的关系概括如下:信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研究的对象:信度高,效度未必高。例如,尺子量布;效度低,信度很可能高;效度高,信度也必然高。即1可信:可能有效, 也可能无效;2.不可信:无效3.有效:必须可信4.无效:可能不可信,也可能可信。

问卷的信度与效度

调查问卷的信度效度分析方法 问卷调查法是教育研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的信度和效度。信度和效度分析的方法包括逻辑分析和统计分析,本文主要讨论后者。 一、信度分析 信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种: 1、重测信度法 这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。 2、复本信度法 复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。 3、折半信度法 折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的

SPSS信度和效度检验全套资料(吐血推荐)

关于调查问卷的信度和效度检验 (一)信度 1 、信度的含义 测验的信度又称测验的可靠性 , 是指同一个测验对同一组被试施测两次或多次 , 所得结果一致形程度。一个好的测验必须是稳定可靠的 , 多次使用所获得的结果是前后一致的。例如 , 用直尺测量长度 , 其结果是稳定可靠的 ; 用橡皮筋测长度则是不可靠的 , 前后测量结果缺乏一致性。在测量理论中 , 信度被定义为 : 某次测验分数的真变异数与总变异数 ( 即实测分数 ) 之比 : 2 2 S R x xx ST = 式中 Rxx 表示测量的信度 ,ST 2 代表真分数的变异数 ( 方差 ),Sx 2 表示实得分数的变异数 ( 方差 ) 。 从上式可看出 , ( 1 )信度是指实测值和真值相差的程度 , 实测值是指对某物实际进行测量时所获得值 , 也称实测分数 (X); 真值是指被测事物的真实规模取值 , 也称真分数 (T) 。由于各种原因 , 实得分数常不等于真分数 , 两者之差称为测量误差或误差分数 (E) 。从理论上看 , 实得分数由真分数和误差分数两部分组成即 :X=T+E Rxx 就是对一组测验数据的实测分数与真分数相差程度的最好估计。 ( 2 )信度又是指相同的测验对相同的被试再次测量时引起的同样反应的程度。如果两次测验中 , 受测者所得分数或所处等级前后一致 , 则说明测验结果的信度较高 ; 反之 , 两次测验结果一致性低 , 说明测验结果的信度低。 信度是任何一种测量的必要条件 ( 但不是唯一条件 ), 只有测量值接近或等于真值 , 用同一工具多次测量同一特性获得相同或相近的结果 , 才能认为这个测量结果是可靠的。信度对于教育测量尤其重要 , 只有信度高的教育测验才能成为教育工作者有用的工具 , 才能为教育工作者提供可靠的信息 , 为教育预测和决策提供客观依据。 2 、信度的估计方法 测验的信度是用信度系数的大小来表示的 , 根据测量理论 , 信度系数 2 2 S R x xx ST = 但是在实际测量中 , 一般只能获得实得分数 (X) 及实得变异数 (Sx 2 ), 而真分数 (T) 及真变异数 (ST 2 ) 是不知道的 , 因此 , 依据上述公式还无法机算信度系数。在统计上 , 主要采用相关分析的方法即机算两列变量的相关系数 , 用相关系数的大小来表示信度的高低。主要用以下方法来求得信度 : ( 1 )再测法 : 用同一测验对同一被试 , 前后施测两次 , 根据两次测验分数计算相关系数 , 即是再测信度。该信度反映了测验的稳定性程度 , 故又称稳定性系数 , 是用皮尔逊积差相关公式计算的 : 2 12 1/21S S M M N X X R xx ?-= ∑ 式中 X 1 .X 2 为同一被试的两次测验得分 ,M1.M2 为两次测验的平均分数 ,S 1 .S 2 是两次测验的标准 差 ,N 是被试人数。 用再测法估计信度 , 可以得到有关测验结果是否随时间而变化及变化程度的资料 , 可以作为预测被测者将来行为表现的依据。但也存在明显的局限性 : 前后两次测验结果易受到练习和记忆的影响 , 前后两次施测的时间间隔影响稳定性系数 , 特别是对学绩测验的影响较大。如果时间间隔太长 , 被测者的身心因受环境影响将发生大的变化 , 从而对第二次施测结果产生较大影响 , 使稳定性系数降低 ; 如果间隔太短 , 则被试第一次完成测验时练习和记忆会对第二次测验产生较大影响 , 使第二次测验性质发生变化。另外 , 有些测验不宜用再测法估计信度 , 如测量创造力测验 , 被试一旦掌握了解决问题的办法、原则 , 重测时 , 他将很容易作出反应 , 这样测验的性质就发生了改变。因此 , 只有在没有复本可用 , 测验不易受重复使用影响 , 现实条件又允许重复施测的情况下才使用重测法估计信度。 用重测法估计信度 , 间隔时间长短没有严格的规定 , 一般说 , 间隔时间越长 , 稳定性系数越低 , 最适

信度与效度的关系

研究信度与效度的关系 一、信度与效度的定义 信度即可靠性,它指的是采取同样的方法对同一对象重复进行测量时,其所得结果相一致的程度,或者说,信度是指测量结果的一致性或稳定性。 效度即准确度,它是指测量工具或测量手段能够准确测出所要测量的变量的程度,或者说能够准确、真实地度量事物属性的程度.二、信度与效度的关系 (一)教育科学研究中信度与效度的关系 信度是研究结果所显示的一致性、稳定性程度,也是对研究结果一致性和稳定性的评价标准。一个具有信度的研究程序,不论其过程是由谁操作,或进行多少次同样的操作,其结果总是非常一致的.效度是一个研究程序的性质和功能,也是对研究结果正确性的评价标准,一个有效度的研究程序,不仅能够明确地回答研究的问题和解释研究结果,而且能够保证研究结果在一定规模的领域中推广。把两者的作用结合起来看,信度和效度是一项教育科学研究活动和结果具有科学价值和意义的保证。研究的信度是研究的效度的一个必要的前提,没有信度,效度不可能单独存在,也就是说,一项研究不可能没有信度却具有效度。 (二)人力资源招聘信度与效度的关系 影响测评信度的因素有很多,主要是系统误差和随机误差.包括测评者的专业性和素质、被测评者本人的心理、侧评工具的稳定性、

环境的稳定性等都会影响测评的可信度。影响测评的效度因素也有很多,如测评工具、测评过程及测评者因素、被测评者状态、效标因素和信度因素等。在实际招聘与录用评估过程中要把握各相关方面,不仅要有专业的测评人员,同时也要在稳定的环境中为被测评者提供一个放松真实的氛围。信度和效度是人才侧评与选拔质量的重要指标.图形形式表现分析得出的信度和效度的三种关系,则会是以下这些样式,如图8—l .图8-2和图8—3所示。所以,:高信度是高效度的必要条件,但非充分条件.即信度高不一定其效度就高,但要想获得较高的测评效度,其信度必定要高, (三)用结构式问卷来测量家长“溺爱孩子”的行为中信度与效

量表的信度效度检验

第六章量表的信度效度检验 我们采用含有多个项目的量表来测量人们的意见、态度、看法等、这样得到的结果是否准确、可靠,是否有适用性?这就需要评价量表的信度和效度。从理论的观点来看,一个良好的测量工具(量表)应具有足够的效度和信度。 一、信度检验 信度(Reliability)即可靠性,是指采用同一方法对同一对象进行调查时,问卷调查结果的稳定性和一致性,即测量工具(问卷或量表)能否稳定地测量所测的事物或变量。信度指标多以相关系数表示,具体评价方法大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性\替换形式)和内在一致性系数(跨项目的一致性)。信度表示的方法主要有以下四种: 1、稳定性系数 稳定性系数是采用同样的问卷,对同一组访问对象在尽可能相同的情况下,在不同时间内进行两次测量,用两次测量结果间的相关分析来评价量表信度的高低,连皮尔逊积差相关系数即是信度系数,也称为重测信度,或再测信度。 两次测量,如果间隔时间过长,调查对象容易受环境和个人经历的影响而发生态度的转变,如果间隔时间过短,则受到上次调查记忆的影响。适当的间隔时间是既不能让调查对象记住上一次测验的内容,也不能让其被测的主观特征在两次测验之间没有发生较大的变化。适合的间隔时间要视调查对象和测量内容不同而不同,一般来说,年幼儿童,间隔时间要小,年长者,间隔时间可以延长。并且调查对象在两次测量期间没有发生于相关的重大事件。在最后提交调研报告时,要对间隔时间加以说明,报告间隔的时间。 2、等值系数(复本信度) 用两个复本在最短时间内对同一组调查对象进行测量所得结果的一致性程度,复本信度系数等于两个复本测量所得分数的皮尔逊积差相关系数。复本信度的高低反映了这两个测验复本在内容上的等值性程度,是等值系数。复本类似于考试中得A、B卷,如果一个人在A卷和B卷的得分相同,就说明考题具有信度;如果两者差异很大,则缺乏信度。 复本信度的使用前提是测量所用的两个复本必须是等效的,两个复本要满足以下几个条件:两个复本测量的是同一种特征。两个复本具有相同的内容和形

测量工具的信度和效度分析

测量工具的信度和效度分析 常用的测量工具主要有调查问卷和量表,它们都是对个人行为和态度的一种测量技术,是测量答卷者对问卷题目主观认识的个体差异的工具,也是研究者用来搜集资料的一种技术。一般情况下,编制一份量表必须做效度和信度评价,而调查问卷则不是必须的。对于有些调查问卷,其包含了类似量表性质对答卷者客观指标测量的题目,对这部分题目需要进行效度和信度的评价。 第一节信度分析概述 一、信度的概念 信度是指测量工具的可靠性和稳定性的程度,或是指使用某测量工具所获得结果的一致程度或准确程度。 测量工具的信度包含2层含义:一是相同的个体在不同时间,以相同的测量工具测验或以复本测验,或在不同的情景下测验,是否能得到相同的结果,即测量工具的测验结果是否随时间和地点等因素而变化;二是能否减少随机误差对测量工具测验结果的影响,从而反映测量工具所要测量的真实情况,即测量工具是否具有稳定性、可靠性和可预测性。 信度的三个特征是:稳定性、内部一致性和等同性。一个好的测量工具必须是稳定可靠,且多次测验结果应前后一致。 信度本质上是一个统计学概念,是用于估计测量误差大小的尺度,主要说明测量工具测验结果中测量误差所占的比例。实际应用中主要通过构建平行测验来计算测量工具的信度。 二、信度的评价方法 信度研究的是测量工具测验结果的可靠性与稳定性,这种可靠性与稳定性可以从4个不同的角度来评价:①在相同条件下所得测量工具测验结果一致程度; ②不同研究者用同一种测量工具同时测验所得结果的一致程度;③同一研究者用同一种测量工具在不同时间内测验所得结果的一致程度;④同一答卷者在不同时间内对同一种测量工具测验的稳定程度。 根据研究角度不同,信度分为外在信度(external reliability)与内在信度(internal reliability)两大类。外在信度是指不同时间测量时测量工具测量的一致性程度。内在信度是指测量工具是否测量的是单一概念,同时也表明测

测量工具地信度和效度分析报告报告材料

测量工具的信度和效度分析

测量工具的信度和效度分析 常用的测量工具主要有调查问卷和量表,它们都是对个人行为和态度的一种测量技术,是测量答卷者对问卷题目主观认识的个体差异的工具,也是研究者用来搜集资料的一种技术。一般情况下,编制一份量表必须做效度和信度评价,而调查问卷则不是必须的。对于有些调查问卷,其包含了类似量表性质对答卷者客观指标测量的题目,对这部分题目需要进行效度和信度的评价。

第一节信度分析概述 一、信度的概念 信度是指测量工具的可靠性和稳定性的程度,或是指使用某测量工具所获得结果的一致程度或准确程度。 测量工具的信度包含2层含义:一是相同的个体在不同时间,以相同的测量工具测验或以复本测验,或在不同的情景下测验,是否能得到相同的结果,即测量工具的测验结果是否随时间和地点等因素而变化;二是能否减少随机误差对测量工具测验结果的影响,从而反映测量工具所要测量的真实情况,即测量工具是否具有稳定性、可靠性和可预测性。 信度的三个特征是:稳定性、内部一致性和等同性。一个好的测量工具必须是稳定可靠,且多次测验结果应前后一致。 信度本质上是一个统计学概念,是用于估计测量误差大小的尺度,主要说明测量工具测验结果中测量误差所占的比例。实际应用中主要通过构建平行测验来计算测量工具的信度。 二、信度的评价方法 信度研究的是测量工具测验结果的可靠性与稳定性,这种可靠性与稳定性可以从4个不同的角度来评价:①在相同条件下所得测量工具测验结果一致程度;②不同研究者用同一种测量工具同时测验所得结果的一致程度;③同一研究者用同一种测量工具在不同时间内测验所得结果的一致程度;④同一答卷者在不同时间内对同一种测量工具测验的稳定程度。 根据研究角度不同,信度分为外在信度(external reliability )与内在信度(internal reliability )两大类。外在信度是指不同时间测量时测量工具测量的

问卷的信度与效度

?调查问卷的信度效度分析方法 问卷调查法是教育研究中广泛采用的一种调查方法,根据调查目的设计的调查问卷是问卷调查法获取信息的工具,其质量高低对调查结果的真实性、适用性等具有决定性的作用。为了保证问卷具有较高的可靠性和有效性,在形成正式问卷之前,应当对问卷进行试测,并对试测结果进行信度和效度分析,根据分析结果筛选问卷题项,调整问卷结构,从而提高问卷的信度和效度。信度和效度分析的方法包括逻辑分析和统计分析,本文主要讨论后者。 一、信度分析 信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种: 1、重测信度法 这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。 2、复本信度法

复本信度法是让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。 3、折半信度法 折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于在一致性系数,测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。在问卷调查中,态度测量最常见的形式是5级克特(Likert)量表。进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数(r hh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式: 求出整个量表的信度系数(r )。 u 4、α信度系数法 Cronbach α信度系数是目前最常用的信度系数,其公式为: 其中,K为量表中题项的总数,为第i题得分的题方差,为全部题项总得分的方差。从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。 二、效度分析

信度和效度检验

2.3.3 信度和效度检验 (1)信度检验 采用Cronbach α系数、个别项目信度、潜在变量的组合信度(Composite Reliability, CR)进行信度检验,其中运用SPSS15.0中的“Analyze-Scale-Reliability Analysis”命令,并选择“Statistics”中的“Scale if item deleted”,来计算Cronbach α系数,利用LISREL8.70进行验证性因子分析来计算个别项目信度和组合信度,验证性因子分析的运算结果(详见附录3)经整理如表2.6所示: 从表2.6中关于Cronbach α系数的三栏中可以看出:C1、B4对应的“校正得项总计相关性”(Corrected Item-Total Correlation)偏低(相对于该部分量表中的其他指标对应值而言),且删除C1、B4有利于分别提升该部分量表的总体信度,故应将C1、B4两个指标删除。 同时“个别项目信度”一栏中C1、C2、B3、B4、P1这5个指标的因子负荷均小于0.50,根据社会科学研究特点,这5个指标也应删除,且删除后有利于提高整个因素的一致性;而另外35个指标的因子负荷均大于0.5,满足信度要求。 除此之外,诚信环境、企业素质、投标诚信、履约诚信、社会诚信各个量表以及整体的Cronbach α系数分别为0.750、0.845、0.817、0.862、0.830、0.939,属于很可信的区间范围;且对应的组合信度分别为0.75、0.85、0.83、0.86、0.83、0.96,均大于0.5,满足信度要求。 (2)效度检验 在信度检验删除5个指标基础上,首先,对有效样本数据进行KMO抽样适当性检验和Bartlett球形检验,检验结果显示KMO值为0.5,Bartlett球形检验的x2值为250.278(自由度为105),达到显著水平(p=0.000<0.001)。一般认为,当KMO值大于0.5时,即可进行因子分析,而本次KMO的检验值为0.5,说明本调查问卷的样本数据基本适合进行因子分析。 其次,采用主成分分析法,进行V arimax方差正交旋转,最终提取特征值大于1的因子4个,7个共同因子累计解释的变异量为60.74%,且正交旋转后得到的因子负荷矩阵如表2.7所示:

试卷分析信度效度难度和区分度

附件6、 难度、区分度、信度和效度的一般说明 一、难度 难度是指试题的难易程度,它是衡量试题质量的一个重要指标参数,它和区分度共同影响并决定试卷的鉴别性。 一般认为,试题的难度指数在0.3-0.7之间比较合适,整份试卷的平均难度最好在0.5左右,高于0.7和低于0.3的试题不能太多。 1、难度的两种定义 (1)P=1-x/w 其中:x为某题得分的平均分数,w为该题的满分。 这种定义法,难度值小时表明试题容易,值大时表明试题难,最小值为0,最大值为1。 (2)P=x/w 这种定义法,难度值小时表明试题难,值大时表明试题容易,最小值为0,最大值为1。 2、难度的计算 (1)主观性试题的难度 A、基本公式法:P=1-x/w B、极端分组法P=1-(XH+XL)/2W 其中:XH为高分组的平均得分(前27%),XL为低分组的平均得分(后27%)。

(2)客观性试题的难度 A、基本公式法:P=1-R/N 其中:R为答对人数,N为全体人数。 B 极端分组法:P=1-(PH+PL)/2 其中:PH=RH/n叫高分组通过率,RH为高分组答对人数,n 为总人数的前27%。PL=RL/n 叫低分组通过率,RL为低分组答对人数。 二、区分度 区分度是区分应试者能力水平高低的指标。试题区分度高,可以拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分。而区分度低则反映不出不同应试者的水平差异。 试题的区分度与试题的难度直接相关。通常来说,中等难度的试题区分度较大。另外,试题的区分度也与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。 1、区分度指标的评价 -1.00≤D≤+1.00,区分度指数越高,试题的区分度就越强。一般认为,区分度指数高于0.3,试题便可以被接受。 2、区分度的计算方法 (1)基本公式法:D=(H-L)/N 其中:D代表区分度指数,H代表高分组答对题的人数,L代表低分组答对题的人数,N代表一个组的人数即高分组与低分组人数之

如何进行信度检验、效度检验:概念介绍 & 软件操作

如何进行信度检验、效度检验:概念介绍&软件操作一、构念的维度: 可以用验证性因子分析(CFA)检验因子(维度)与测项之间的从属关系是否正确。检验指标是各个拟合优度指数和路径系数。 二、量表的信度: 信度包括重测信度、复本信度和内部一致性信度。在一次测量中,只能检验内部一致性信度,通常是用α系数。SPSS可以进行信度检验,一般要求α>0.7。每个测项的item-total correlation(项对总项相关系数)>0.4。同时还要看每个测项“α if item deleted”的值,它表示的是当删除该测项时,量表的α系数的值。如果α if item deleted>原来的α,则应该删除该测项。 三、构念的效度 1. 构念的收敛效度(convergent validity) 收敛效度指的是量表与同一构念的其他指标确实相互关联的程度。收敛效度可通过CFA检验,观察测量项目在构念上的负载(loading),如果标准化估计值(standardizes estimate)大于0.5,且t值大于1.96,平均提取方差(Average variance extracted,AVE)大于0.6,组合信度(construct reliability,CR)大于0.7,通常认为收敛效度较高。 ●平均提取方差(AVE):表示的是潜变量的变异量中有多大比例能用指 标变异量来解释(即指标解释潜变量的程度); ●组合信度(CR):模型内在质量的判别准则之一,反映了每个潜变量中 所有测项是否一致性地解释该潜变量。 2. 构念的判别效度(discriminant validity) 判别效度指的是一个测量值与其他应该有所不同的构念之间不相互关联的程度。判别效度可通过CFA检验,如果各个因子的AVE的平方根比该因子与其他因子之间的相关系数都大,则判别效度较高(或者说AVE的平方根大于该构念与任何其他构念的相关系数,则判别效度较高)。 另外一种检验判别效度的方法是卡方检验。在一个限制模型中(相关系数限制为1),配对构念之间的相关系数如果允许自由估计,卡方值显著地减少了,则说明两个构念之间的判别效度较高。卡方分布临界点为 3.84(P<0.05)或6.63(P<0.01)。 3. 构念的法则效度(nomological validity) 法则效度指的是量表以在理论上可以预测的方式,与不同但相关的构念的测量值之间相互关联的程度。 ◆收敛效度、判别效度、法则效度并称为建构效度(construct validity);另外 两种效度是内容效度(content validity)和标准效度(criterion validity)。内容效度是对量表的内容表现特定测量项目任务的优劣程度的一个主观而系统的评价。标准效度指一个量表是否像预期的那样反映与选作标准的其他变

分享:软件检验信度和效度的指标

一、构念的维度: 可以用验证性因子分析(CFA)检验因子(维度)与测项之间的从属关系是否正确。检验指标是各个拟合优度指数和路径系数。 二、构念的效度 1.构念的收敛效度(convergent validity) 收敛效度指的是量表与同一构念的其他指标确实相互关联的程度。收敛效度可通过CFA检验,观察测量项目在构念上的负载(loading),如果标准化估计值(standardizes estimate)大于0.5,且t值大于1.96,平均提取方差(Average variance extracted,AVE)大于0.6,组合信度(construct reliability,CR)大于0.7,通常认为收敛效度较高。 2.构念的判别效度(discriminant validity) 判别效度指的是一个测量值与其他应该有所不同的构念之间不相互关联的程度。判别效度可通过CFA检验,如果各个测量对因子的平均提取方差(Average variance extracted,AVE)大于该因子与任何其他因子的共同方差(highest shared variance),则判别效度较高。另外一种检验判别效度的方法是检验修正指数(modification index,MI)的显著性。MI指的是模型中某个受限制的参数(通常是固定为0的参数),若允许自由估计,模型会因此改良,整个模型卡方值的减少量,称为此参数的修正指数。Ml小于3.84(P<0.05)或6.63(P<001),表明测量模型有较好的判别效度。 3.构念的法则效度(nomological validity) 法则效度指的是量表以在理论上可以预测的方式,与不同但相关的构念的测量值之间相互关联的程度。 收敛效度、判别效度、法则效度并称为建构效度(construct validity);另外两种效度是内容效度(content validity)和标准效度(criterion validity)。内容效度是对量表的内容表现特定测量项目任务的优劣程度的一个主观而系统的评价。标准效度指一个量表是否像预期的那样反映与选作标准的其他变量(标准变量)之间的关系,包括平行效度(parallel validity)和预测效度(predictive validity)。 三、量表的信度: 信度包括重测信度、复本信度和内部一致性信度。在一次测量中,只能检验内部一致性信度,通常是用α系数。SPSS可以进行信度检验,一般要求α>0.7。每个测项的item-total correlation(项对总项相关系数)>0.4。同时还要看每个测项“αif item deleted”的值,它表示的是当删除该测项时,量表的α系数的值。如果αif item deleted>原来的α,则应该删除该测项。 1 / 1

测量问卷信效度分析

测量问卷信效度分析 信度和效度分析是问卷分析的第一步,也是检验该问卷是否合格的标准之一,所以,我们在做问卷调查的时候第一步就要进行信度和效度的分析,才能确保我们的问卷有意义。 信度(Reliability)即可靠性,是指使用相同指标或测量工具重复测量相同事物时,得到相同结果的一致性程度。一个好的测量工具,对同一事物反复多次测量,其结果应该始终保持不变才可信。例如,我们用一把尺子测量一张桌子的高度,今天测量得高度与明天测量的高度不同,那么我们就会对这把尺子产生怀疑。因此,一张设计合理的调查问卷应该具有它的可靠性和稳定性。 目前最常用的是Alpha信度系数,一般情况下我们主要考虑量表的内在信度——项目之间是否具有较高的内在一致性。通常认为,信度系数应该在0~1之间,如果量表的信度系数在0.9以上,表示量表的信度很好;如果量表的信度系数在0.8~0.9之间,表示量表的信度可以接受;如果量表的信度系数在0.7~0.8之间,表示量表有些项目需要修订;如果量表的信度系数在0.7以下,表示量表有些项目需要抛弃。 信度分析是:“分析”——“度量”——“可靠性分析”,把所有主观题选到:“项目”中,确定即可,得出总的信度。把统一维度的题目选中,得出先关维度的信度。 具体步骤:分析——度量——可靠性分析 模型选择a,点击确定即可。 结果分析: 分析各个维度和总量的信度后,将它们列出一个表格,其中每个维度的a信度系数都大于0.7,说明该量表信度较好,符合问卷调查。 效度(Validity)即有效性,是衡量综合评价体系是否能够准确反映评价目的和要求。是指测量工具能够测出其所要测量的特征的正确性程度。效度越高,即表示测量结果越能显示其所 要测量的特征,反之,则效度越低。常用于调查问卷效度分析的方法主要有以下几种。 1、单项与总和相关效度分析 这种方法用于测量量表的内容效度。内容效度又称表面效度或逻辑效度,它是指所设计的题项能否代表所要测量的内容或主题。对内容效度常采用逻辑分析与统计分析相结合的方法进行评价。逻辑分析一般由研究者或专家评判所选题项是否“看上去”符合测量的目的和要求。统计分析主要采用单项与总和相关分析法获得评价结果,即计算每个题项得分与题项

问卷信度效度检验

从统计数据质量角度谈调查问卷的设计质量 一、引言 从保证统计数据质量的统计工作过程看,统计数据质量可以被划分为统计设计质量、统计调查质量、统计整理质量、统计分析质量以及数据发布传输质量等。统计设计质量是保证统计数据质量的首要环节,在统计数据质量保证体系中起着关键性作用。统计设计质量一般包括调查问卷设计质量与调查方案设计质量,其中调查问卷设计质量指的是:通过问卷测量得到的,反映调查对象客观现象的统计数据的准确性和有效性,即调查问卷设计质量的好坏,需要通过问卷测量能力的高低来检验。 在市场调查中,为了深入地研究一些本质的或理论性的现象,问卷调查法被广泛运用,除了调查时采用的抽样方法以及所抽取的调查对象是否具有代表性之外,调查者最关心的就是调查问卷的测量能力。问卷测量能力包含了两个方面的内容,即问卷测量结果的准确性和有效性。准确性和有效性是统计数据质量蕴涵的最主要的两个特性,一个好的调查问卷设计不仅可以保证在多次重复使用下得到可靠的数据结果,即准确性;也可以保证所得测量结果能够反映它所应该反映的客观现实,即有效性。 所以我们可以通过对问卷测量能力的分析来检验问卷的设计质量,对问卷设计进行质量控制,进而发现问卷设计中应注意的问题。在此基础上,通过不断改进问卷设计,提高其测量能力,最终将有助于我们得到高质量的调查数据。 二、调查问卷的设计质量检验 信度和效度的概念来源于心理测试中关于测验的可靠性和有效性研究,当建构和评估测量时,通常使用信度和效度这两个技术性指标。因此我们采用问卷的信度和效度分析来评估其测量能力,进而实现对问卷设计质量的检验。 1.问卷设计质量的信度检验 所谓问卷设计质量的信度检验,指的是对问卷测量结果准确性的分析,即对设计的问卷在多次重复使用下得到的数据结果的可靠性的检验。在实际应用中,信度检验多以相关系数表示,常用的方法有:重测信度,复本信度,折半信度,克朗巴哈信度,评分者信度等。国内外已经有很多关于这些信度分析方法介绍的文献,在这里,笔者不再一一详述,仅列出相关公式作为参考。 (1)重测信度,也叫稳定系数,对同一组调查对象采用同一调查问卷进行先后两次调 查,采用检验公式,其中为两次调查结果的协方差,为第一次调查结果 的协方差,为第二次调查结果的协方差。系数值越大说明信度越高。 (2)复本信度,也叫等值系数,对同一组调查对象进行两种相等或相近的调查,要求两份问卷的题数、形式、内容及难度和鉴别度等方面都要尽可能的一致。检验公式同稳定系数公式,系数越大,说明两份问卷的信度越高,具体调查时使用哪一份都可以。 (3)折半信度,也叫内在一致性系数,将调查的项目按前后分成两等份或按奇偶题号分成两部分,通过计算这两部分调查结果的相关系数来衡量信度。当假定两部分调查结果得 分的方差相等时,检验用Spearman-Brown公式来表示:,其中表示折半信度系数;当假定方差不相等时,采用Flanagan 公式:,其中、分别 表示两部分调查结果的方差,表示整个问卷调查结果的方差。如果折半信度很高,则说明这份问卷的各项题之间难度相当,调查结果信度高。 (4)克朗巴哈信度,是对折半信度的改进,检验公式是:,其中

关于调查问卷的信度和效度检验

关于调查问卷的信度和效度检验 (一)信度 1、 信度的含义 测验的信度又称测验的可靠性 ,是指同一个测验对同一组被试施测两次或多次 ,所得结果 一致形程度。一个好的测验必须是稳定可靠的 ,多次使用所获得的结果是前后一致的。例 如,用直尺测量长度,其结果是稳定可靠的 ;用橡皮筋测长度则是不可靠的 ,前后测量 结果缺乏一致性。在测量理论中 ,信度被定义为:某次测验分数的真变异数与总变异数 ST2 (即实测分数)之比:R xx - S x 2 式中Rxx 表示测量的信度,ST -代表真分数的变异数 (方差),Sx -表示实得分数的变异 数(方差)。 For pers onal use only in study and research; not for commercial use 从上式可看出,(1)信度是指实测值和真值相差的程度 ,实测值是指对某物实际进行测 量时所获得值 ,也称实测分数 (X );真值是指被测事物的真实规模取值 ,也称真分数 (T )。由于各种原因,实得分数常不等于真分数 ,两者之差称为测量误差或误差分数 (E )。从理论上看,实得分数由真分数和误差分数两部分组成即 :X=T+E Rxx 就是对一组测验数据的实测分数与真分数相差程度的最好估计。 (2 )信度又是指相同的测验对相同的被试再次测量时引起的同样反应的程度。如果两次 测验中,受测者所得分数或所处等级前后一致 ,则说明测验结果的信度较高 ;反之,两 次测验结果一致性低 ,说明测验结果的信度低。 For pers onal use only in study and research; not for commercial use 信度是任何一种测量的必要条件 (但不是唯一条件 ),只有测量值接近或等于真值 ,用同 一工具多次测量同一特性获得相同或相近的结果 ,才能认为这个测量结果是可靠的。 信度 对于教育测量尤其重要,只有信度高的教育测验才能成为教育工作者有用的工具 ,才能为 教育工作者提供可靠的信息,为教育预测和决策提供客观依据。 2、 信度的估计方法 测验的信度是用信度系数的大小来表示的 ,根据测量理论,信度系数 For pers onal use only in study and research; not for commercial use ST2 R xx S 2 但是在实际测量中,一般只能获得实得分数 (X )及实得变异数 (Sx 2 ),而真分数(T )及 真变异数(ST 2 )是不知道的,因此,依据上述公式还无法机算信度系数。在统计上 ,主 要采用相关分析的方法即机算两列变量的相关系数 ,用相关系数的大小来表示信度的高 低。主要用以下方法来求得信度 :

什么是测试的信度和效度,如何保证测试的信度和效度

什么是测试的信度和效度,如何保证测试的信度和效度 棋盘中小张倩倩 在教育研究中,信度与效度是很常见的两个概念。但每次看到或听到这两个名词,我的脑袋老反应不过来,看来基础就是不扎实。我在这里就谈谈我浅显的认识。 一、信度 所谓的信度,是指使用相同指标或测量工具重复测量相同事物时,得到相同结果的可能性。如果说某个指标或测量工具的信度高,那它提供的测量结果就不会因为指标、测量工具或测量设计本身的特性而发生变化;反之亦然。根据测量过程中不同的误差来源,可分为再测信度、复本信度和折半信度。 再测信度,是用同一测量工具在不同的时间对同一群受试者前后测量两次,然后计算两次测量分数的相关系数,相关系数越大说明两次测量的一致性越高。相隔的时间不应该太长。 复本信度,是用两个完全等值的(平行的)复本对同一群受试者进行测试,计算两种复本测量分数的相关系数,相关系数越大说明两个复本构成带来的变异越小。如考试中使用的A、B卷 折半信度,只用一个测量工具对同一群受试者实施一次测量,但将奇数题和偶数题分开计分,再计算奇数试题和偶数试题分数之间的相关系数。 二、效度 所谓的效度,是指测量工具能够测出其所要测量的特征的正确性程

度。效度越高,即表示测量结果越能显示其所要测量的特征。如果说根据某项特征能够区分人、物或事件,那么说某个测量该特征的测量工具是有效的,就是指它的测量结果能把具有不同特征的人、物或事件进行有效的区分。常用的有变面效度、内容效度和效标效度。 表面效度是指测量效果和人们头脑中的印象或学术界形成的共识之间的吻和程度,吻合程度高,表面效度就高。 内容效度是指测量在多大程度上涵盖了被测量概念的全部内涵,测量工具代表概念定义的内容越多,内容效度就越高。 效标效度是指测量结果与一些标准之间的一致性程度,这些标准能够精确表示被测概念。 三、信度与效度的关系 信度是效度的必要条件,但不是充分条件。一个测量工具要有效度必须有信度,没有信度就没有效度;但是有了信度不一定有效度。 信度低,效度不可能高。因为如果测量的数据不准确,也并不能有效地说明所研究的对象。 信度高,效度未必高。例如,如果我们准确地测量出某人的经济收入,也未必能够说明他的消费水平。 效度低,信度很可能高。例如,即是一项研究未能说明社会流动的原因,但它很有可能很精确很可靠地调查各个时期各种类型的人的流动数量。 效度高,信度也必然高。

前测数据分析--信度和效度分析

第二节信度和效度分析 一、信度分析 与预测试数据分析方法一样,为了确保问卷的可靠性,先进行信度分析,信度检验指标在前面已详细述,在此不再述。问卷信度分析如表4-2所示: 表4-2:量表信度检验结果 - . -优质文档

经过SPSS24.0数据统计软件分析得知个变量Cronbach's α均大于0.6,且 组合信度在0.792以上,说明所有问卷都具备可靠性,能够较好的反应变量的真实情况。 二、效度检验 (一)容效度 为了确保调研问卷容的有效性,问卷量表通过文献研究先初步圈定问卷容,所用量表大多采用国外已经开发出的成熟量表,对于这部分量表,本文给予直接采用的方式,其余量表则是在前人研究的基础上,根据本文的研究目的和方向进行谨慎的拟定。因此,本问卷具有容效度。 (二)结构效度 在测量结构效度时,通常采用探索性因子分析。在进行因子分析时,通常采用主成分分析法,主成分分析的目的在于利用变量间的线性组合来解释每个层面的方差,变量的第一个线性组合可以解释最大的变异量,以此类推,所以主成分分析法的步骤是,选取特征值大于1的因子,然后利用方差最大旋转法进行旋转,使得旋转后题目在各个因子的负荷量大小出现明显差异,大部分题目在每个公共 因子中有一个差异较大的因子负荷量出现。但在因子分析之前需要进行KMO值- . -优质文档

和Bartlett球形检验,只有当KMO>0.5且Bartlett球形检验的Sig.值小于0.05时,问卷才具有结构效度,才能够进行因子分析。本研究中对三个量表进行的结构效度分析具体情况如下。 (1)虚拟品牌社群价值的效度检测 1.1虚拟品牌社群价值的KMO值和Bartlett球形检验 在对虚拟品牌社群价值做因子分析之前,先做KMO值和Bartlett球形检验,检测结果如表4-3所示: 表4-3:虚拟品牌社群价值的KMO值和Bartlett检验 取样足够度的Kaiser-Meyer-Olkin度量.901 Bartlett的球形度检验近似卡方4892.820 df 186 Sig. .000 通过对虚拟品牌社群价值量表的14个题项进行KMO检验和Bartlett球形检验,发现虚拟品牌社群价值量表的KMO值为0.901,表明各个变量之间的相关系数非常高,适合做因子分析,同时Sig.值为0.000<0.05,达到显著性水平,综上可以得出虚拟品牌社群价值量表适合做因子分析。 1.2虚拟品牌社群价值因子分析 通过KMO值和Bartlett球形检验可知,虚拟品牌社群价值适合做因子分析,运用主成分提取法进行因子旋转后得到以下数据,如:表4-4所示: 表4-4:虚拟品牌社群价值旋转因子负荷值 - . -优质文档

spss数据分析教程之SPSS信度分析和效度分析

信度分析和效度分析 数据计分方法说明 类别 小分类 对应题项 每题计分方法 维度计分方法 题项 职业倦怠 情感枯竭 1-3题 正向计分 全部题项直接加总 3 去个性化 4-6题 正向计分 全部题项直接加总 3 个人成就感 7-10题 逆向计分 全部题项取倒数后加 总 4 心理资本 11-18题 正向计分 全部题项直接加总 8 组织气氛 19-26题 21题为逆向计分,其余题项正向计分 21题取倒数后与其余 题项加总 8 总体幸福感 27-31题 27题和31题为逆向计分,其余题项为正 向计分 27和31题取到术后与 其余题项加总 5 整体问卷 以上各个维度的总分 直接加总 31 讲问卷调查的数据进行如上表的数据预处理后,接下来再进行如下分析。 1 信度分析 这里有63份问卷,首先我们需要的判定的是问卷中的调查题目能否反映调查的目的和调查的意图,问卷中的各个问题是否测量了相同的内容和信息;同时,对于调查问卷所得到的数据是否具有可靠性,就必须在对问卷分析之前做信度分析。信度本身与测量结果的正确与否无关,它的用途在于检测问卷本身的稳定性。信度分析中常用Cronbach α系数的大小来衡量调查问卷的信度。一般而言,如果问卷的信度系数达到0.9以上,该问卷调查的信度就较好;信度系数在0.8以上,是不错的;一般认为试卷信度在0.5至0.9以内是合理的,如果信度系数低于0.5,则此问卷的调查结果就不可信了。 将以上63份问卷的数据用SPSS21.0先进行标准化处理,再进行信度分析,其结果如表一所示: 表一 信度分析表

类别Cronbach's Alpha项数 整体问卷.61731 职业倦怠.82210 心理资本.8018 组织气氛.8378 总体幸福感.6795 表一显示,整体问卷和问卷中的各个维度的Cronbach's Alpha系数值均大于0.6,所以可以推断此问卷的可信度一般,该评价问卷只具有很较高的内在一致性。 2 效度分析 具备信度的问题不一定具备效度,因此做完信度分析,再用SPSS21.0对其进行效度分析。 2.1 因子模型适应性分析 效度分析使用的是因子分析模型,在运用因子模型分析之前,首先要对问卷数据进行因子模型适应性分析,分析结果如下表所示: 表二 KMO 和 Bartlett 的检验 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。.657 Bartlett 的球形度检验近似卡方1187.636 df 465 Sig. .000 由上表的数据可知,问卷数据的KMO值为0.657,并且通过了显著性水平为0.05的巴特利球型检验,说明问卷调查的数据非常适合做因子分析。 2.2 因子分析结果 在进行了适应性检验之后,接下来就进行因子分析,其结果如下: 表三方差贡献率 解释的总方差 成份初始特征值提取平方和载入旋转平方和载入

相关文档
最新文档