第4章 测量的信度与效度

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Cronbachα系数的计算公式为:
2 S i
n (1 2 ) n 1 S
已知:题项n=8,
8题加总后量表总分的方差S2=3.467,
2 S 8 个题项的方差总和 i =1.533
8 1.5333 8 (1 ) (0.558 ) 0.637 8 1 3.467 7
α系数的判断标准:
内部一致性信度系数值 α系数<.50 .50≤ α系数<.60 .60 ≤ α系数<.70 .70 ≤ α系数<.80 .80 ≤ α系数<.90 α系数≥.90 层面或构念 整个量表
不理想,舍弃不用 非常不理想,舍弃 不用 可以接受,增列题 不理想,重新编制 项或修改词句 或修订 尚佳 佳(信度高) 勉强接受,最好增 列题项或修改词句 可以接受
第2 节
一、效度分析原理
1、效度的概念
效度分析
效度就是正确性程度,即测量工具在多大程度上反映 我们想要测量的概念的真实含义。效度越高,表示测量结果 越能显示出所要测量的对象的真正特征。
2、效度的估算方法与评价 测量的效度通常以测量数值与其所要测量的特性之间的 相关系数来表示。效度系数一般规定为与测量目的相关的分 数方差在总体方差中所占的比重:
第1节 信度分析
§1.信度分析原理 §2.在SPSS上实现信度分析 第2节 效度分析 §1.效度分析原理 §2.在SPSS上实现效度分析 第3节 信度与效度的关系
第1节 信度分析
一、信度分析原理
1、信度的概念 信度是指对测度一致性程度的估计。信度分析就是要探 究调查的可靠性,就是指被调查者表达其意见的准确性。 信度也称为可靠度,指的是一份量表所测得的分数的一 致性(consistency)与稳定性(stability)。 2、信度的估计方法 测量的误差总是难免的,真实值与测量值的关系可以表 达为:
01 02 03 04 5 1 2 5 5 1 2 4 5 2 2 5 5 1 2 5 5 1 2 5 4 1 1 5 4.833333 1.166667 1.833333 4.833333 0.408248 0.408248 0.408248 0.408248 0.166667 0.166667 0.166667 0.166667 05 06 07 08 2 5 4 3 3 5 5 2 3 5 5 2 3 5 5 3 3 5 5 2 3 4 4 2 2.833333 4.833333 4.666667 2.333333 0.408248 0.408248 0.516398 0.516398 0.166667 0.166667 0.266667 0.266667 总分 27 27 29 29 28 24 27.33333 1.861899 3.466667
tests. Psychometrika, 16(3),297-334.
设一份量表包括n个项目(x1,x2, …,xn), 假设这n个项目的分数都 与真实分数T有关,即每一个项目xi除与T有关外,也有独立的 误差项Ei,即令量表总和为H=x1+x2+…+xn.
n Var ( H ) Var ( xi ) n i 1 RH n 1 Var ( H ) 2 Si n 1 2 n 1 SH
复本信度有两个优点: 一是它不会受记忆效用的影响; 二是对测量误差的相关性通常比再测法低。
(3)折半信度(Split-Half Reliability) 将同一量表施测后的题目分成两半,分别计算这两半的 总分及其相关系数,此一相关系数即为折半信度。
由于实际上折半信度系数会比全部题目放在一起计算获 得的信度低,所以求得的折半信度需要进一步修正。 折半信度的优点在于只需要施测一次,因而可以节省人 力、物力和时间。 但由于折半信度需将一份量表分成两半,分法不同,所 获信度就会不同。 如可以将测量结果按题目的单双号分成两部分。
X T BE
式中,T为真实值,B为偏差即系统误差,E为测量误差即随 机误差。
由于系统误差很难分解,因而有时将系统误差包含在真实值 中,上式可以简化为:
X T E
对于测量误差E,一般假定它的期望值是0,与真实值相独 立,在此假定下,可以证明:
E ( x) E (T )
实得分数和真分数的总体均值相等。
由于旅游者流动性太强,因而不适宜使用再测信度分 析。
(2)复本信度(Alternative-Form Reliability) 当某一套量表有两种以上版本时,可以替换使用,根据 一组被调查者接受两个复本测量的数值来计算相关系数,以 避免再测信度的缺陷。 复本是指内容相似、难易度相当的两份量表,对同一受 测群体,第一次使用A份测试,第二次使用B份测试,两次 分数的相关系数即为复本信度。 复本得分的差异是由量表的内容造成的,而非时间造成 的。
2 2 X T2 E
实得分数的方差等于真分数的方差与误差方差之和。
调研人员应运用所掌握的统计知识,分析其是属于系统 误差还是属于随机误差。 系统误差会使调查结果有误,所以应尽量避免。 随机误差可通过提高样本代表性、增大样本量来减少。
信度一般规定是:真分数的方差在总体方差中所占的比 重,即信度系数:
(4)克朗巴哈α系数(Cronbach α) 美国教育心理学家Lee Joseph Cronbach于1951年提出 了一种计算问卷或测验的测量工具的信度,称为Cronbach α系数。 当一个研究任务项由很多题目组成,每个问项都与研究 任务项相关,若以总分的方差与问项的方差作为测量信度的 指标,即为α系数。
理想(甚佳,信度 佳(信度高) 很高) 非常理想(信度非 非常理想(甚佳, 常好) 信度很高)
二、克朗巴哈 α系数的手工计算
以一份有8个题项的量表为例,8个题项均为正向题, 受试样本数有6位,采用Likert 5点量表填答,获得调查 结果如下表:
题号 样本
量表试题
01 5 5 5 5 5 4 02 1 1 2 1 1 1 03 2 2 2 2 2 1 04 5 4 5 5 5 5 05 2 3 3 3 3 3 06 5 5 5 5 5 4 07 4 5 5 5 5 4 08 3 2 2 3 2 2 总分 27 27 29 29 28 24
当题目间的相关系数越大时,α系数也会越大。 当题目数目n越多时,S
2 H
n 值越大, 越接近于0, 2 SH n 1
2wenku.baidu.comS i
越接近于1,故α系数也会越接近于1。
要做信度分析须先检查每个题目是否都是同方向的,即 都是正面问法,反向问题需要做处理后才可以加入分析。
在计算α系数时,应该注意有些调查量表测量的内容包 含几个领域,这时宜分别计算各个领域的α系数。 克朗巴哈α系数适用于项目多重计分的测验数据或问卷 数据,可以用该系数测量Likert量表的信度。 在基础研究中,信度至少应达到0.8才可接受; 在探索性研究中,信度只要达到0.7就可以接受; 在旅游调查测量实践中,信度只要达到0.6即可接受。 α系数通常与量表题目数量有关,题目数量越多,α系 数就越大。
三、在SPSS上实现克朗巴哈α系数的计算
第一步:按Analyze-Scale-Reliability打开主对话框。 第二步:在左侧的源变量框中选择变量进入Items框,作 为分析变量。 第三步:在源变量框的Model选项框中,选择Alpha (α)信度系数。 第四步:在主对话框,单击OK按钮,提交运行。 第五步:判断计算结果是否可以接受。
2 2 2 Rxx T2 / X 1 ( E /X )
信度系数越大,表明测量的可信程度越大。 信度的估计方法有许多,比较易于使用的是相关系数的方 法。 一般采用同一问卷进行两次调查,再计算其相关系数。
3、信度的类型 (1)再测信度(Retest Reliability) 再测是指在不同时间的相同测验。 使用同一测量量表,对同一受测群体,在不同的时间前 后测试两次,再计算两次测试结果的相关系数,该系数即为 再测信度。 重复测量时,要注意时间间隔的合理控制。如果时间间 隔太短,受测者可能还记忆犹新,容易造成信度偏高。 如果时间间隔太久,可能环境条件的改变、或者受测者 心智成长会影响再测结果,从而造成信度偏低。 因而时间间隔应随测验的目的与性质而定。
(2)准则效度(Criterion Validity) 准则效度又称为效标关联效度(criterion-related validity)、 预测效度(predictive validity)。 它是指量表所得到的数据和其他被选择的变量(准则变 量)的值相比是否有意义,被访问者的答案看起来是否在设 计时所考虑的度量范围之内。 调研人员对问卷一般都可以客观地判断它的表面有效 性。因此,设计每一个问题时都应该有表面有效性的假定。 符合这种标准的测量工具是可以作为测量某一特定现象或概 念的效标。 当我们对同一现象或概念进行测量时,我们可以使用多 种测量工具,每种测量方式与效标的一致性就成为准则效 度。 评价准则效度的方法是相关分析或差异显著性检验。 但选择一个合适的准则往往十分困难。
(3)结构效度(Construct Validity) 结构效度也称建构效度。 它是指一个测验实际测到所要测量的理论结构和特质的 程度,是指实验与理论之间的一致性,即实验是否真正测量 到假设(构造)的理论。 结构效度分析所采用的方法是因素分析(因子分析)。 在因素分析的结果中,用于评价结构效度的主要指标有累计 贡献率、共同度和因子载荷。 结构效度的体现首先必须作KMO和Bartlett球形检验, 如果这两个检验合格的话,说明数据是适合做因素分析的。 通常KMO的值小于0.5时较不适合做因素分析,一般以大于 0.7为好。 然后提取因子,主因子解释总变异一般若大于60%的和 因子载荷大于0.6的话,说明结构效度很好。
2 co 效度 2 o
2 式中, co 为个体在与属性有关的共同特征上所造成的变异 2 量, o 为在某测量上所得数值的总变异量。
3、影响效度的因素 调查提纲的科学与否; 调查程序选择是否得当; 调查项目的设计是否合理; 调查方法的选择是否得当。 其中,调查项目的设计最为重要。 4、效度的量化 虽然效度可分为内容效度、准则效度和结构效度,但每 一种效度都很难测量。没有方法可以真正保证研究者可以测 量到要测量的理论构想。 在学术研究中,经常只能通过强调量表设计程序的过程 严谨,或经过专家的修正及经过预测,以此来强化其具有的 效度。但这只是内容效度,准则效度和结构效度仍难测量。
1.167
1.833 4.833 2.833 4.833 4.667 2.333 27.333
0.408
0.408 0.408 0.408 0.408 0.516 0.516 1.862
0.167
0.167 0.167 0.167 0.167 0.267 0.267 1.533 3.467
可以利用Excel软件进行有关计算: 第8行计算均值, 第9行计算标准差, 第10行计算方差。
A B C D E F
计算获得描述性统计量如下表:
描述性统计量
题号 A1 个数 6 最小值 最大值 4 5 平均数 4.833 标准差 0.408 方差 0.167
A2
A3 A4 A5 A6 A7 A8 ∑Si2 总分
6
6 6 6 6 6 6 6
1
1 4 2 4 4 2 24
2
2 5 3 5 5 3 29
如果每个题目都是测量相同的理论维度,则总和的方差 会大于每个题目的方差之和。 每个理论维度下,必须至少有两题以上才能计算信度, 若只有一个题目,则信度值为1。
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of
5、效度的类型 (1)内容效度(Content Validity) 也称为表面效度(Face Validity)、逻辑效度。 它是指问卷的内容是否具有代表性,即是否包括被测量 构成所有层面的项目。 若问卷内容是以理论为基础,并参考以往学者类似研究 的问卷内容加以修订,并与实践或学术专家讨论过,且进行 过预测,即可以认为具有相当的内容效度。 内容效度反映设计的观测变量是否代表了所要测量的内 容或主题,可通过计算观测变量单项与得分总和之间相关系 数来测量,相关系数越大,量表的内容效度越高。一般要求 所测单项与总和之间的相关系数 在0.3以上。 考察内容效度旨在系统地检查测量内容的适当性,并根 据我们对所研究概念的了解去鉴别测量内容是否反映了这一 概念的基本内容。
相关文档
最新文档