第五章 效度 作业
第五章效度

二、内容效度
(一)内容效度及基本保证条件 1、定义 内容效度(content validity) 是指测验项目所涉及
的内容对欲测内容范围的代表性程度。或者说所 测内容对要测内容范围行为取样的代表性,又称 推理效度、逻辑效度。 2、内容效度的基本保证条件 要获得较高的内容效度,必须具备两个基本条件: 1)欲测的内容范围必须定义清楚,界限分明。
(2)二列相关系数 适用条件:测验分数和效标分数都是连续变量,其中一个变
量被人为分为两类
(3)四分相关系数 适用条件:当测验分数和效标分数都是连续变量,且每一个
变量的变化都被人为地分为两类
(4)φ相关系数 适用条件:当测验分数与效标分数都是真正的二分变量
(5)列联相关系数 适用条件:当测验分数与效标分数其中一个变量不止分为两
? 表面效度指被试或其他未受过专门训练的 人员对测量有效性程度的估计
? 表面效度不能算是一种效度,它不反映测 验实际测量的内容,但可取得被试的合作。
? 成就测验需较高的表面效度,而人格测验 则需较低的表面效度。
(五)内容效度的优缺点
? 优点:对测验内容的详细描述是编制任何测验都 应借鉴的
? 缺点:
四、效标关联效度
(一)定义、种类、运用 1、定义 是指测验对个体的效标行为表现进行估计的有效程度。 又称实证效度、经验效度、准则关联效度 2、分类(收集效标的时间)
? 同时效度:效标资料与测验资料同时获得,如机械能力倾向测验。 ? 预测效度:效标资料后于测验资料获得,如MBA考试。
3、应用(二者本质区别)
2. 尽量不让评定者知道以前的测验结果,防止评 定时产生主观倾向。
第五章效度

3、效标和效标测量:
效标,即衡量测验有效性的参照标准,指的是 可以直接而且独立测量的我们感兴趣的行为。
效标可以分为两个层次,其一是理论水平的观 念效标,其二是操作定义水平的效标测量。
4、常用的效标
(1)学业成就; (2)实际工作表现 (3)特殊训练成绩 (4)精神病诊断 (5)等级评定 (6)效标团体的比较 (7)先前有效的测验
(二)构想效度(construct Validity)
1954年提出,有人翻译为构思效度,也有叫结 构效度。它是指测验能够测量到理论上的构想 和特质的程度,即测验的结果是否能证实或解 释某一理论的假设、术语或构想,解释的程度 如何。
(三)效标效度
1、定义:又称实证效度,反映的是测验预测个 体在某种情境下行为表现的有效性程度。
空间想象能力 67 1 2 4 6 4 6 1 2 2 3 1 35 23
测验成绩
00403106308
一年后几何测 65 7 6 5 4 6 7 3 6 5 4 6 70 62
验成绩
02588282088
1 110011010011 1
5、效标效度的表示方法 (1)相关法:
(2)命中率法
是当测验用来做取舍的依据时,用其正确决定 的比例作为效度指标的一种方法。命中率的计 算有两种方法,一是计算总命中率,另一种是 计算正命中率。
(3)命中率法
效标成绩 测验预测
成功(+)
失败(-) A(失误)
成功(+) B(命中)
失败(-) C(命中) D(失误)
总命中率:PCT
命中 命中 失误 100%
A
CB BC
100% D
正命中率 : PCP
心理测量学 第五章 效度(用)

b YX r XY
sY sX
0
0 . 923
a=57.5-0.923×69.4=-6.56 Yˆ =-6.56+0.923X
如果我们已知一组人的测验得分,我们可以 根据上式得到他们的效标成绩平均值的预测 值: X=76时, Yˆ =-6.56+0.923×76=63.6 X=55时, Yˆ =-6.56+0.923×88=74.7 预测值不是一个确定值,只是一个估计值, 可以被理解为所有获得某一测验分数者的平 均效标分数值。就是说,所有在测验上得76 分的人的效标分数的平均分为63.6,在例1 中,测验中实际得76分的人的效标平均分为 59.5,测验得88分的人的效标平均分为79.5。
三、影响效标关联效度的因素
(一)样本 这种影响来自两个方面:一是样本的含量,二是样 本的代表性。 (二)基础率 基础率是经选择的总体中具有某种与测验目的有关 的特质的人数比例。极高与极低的基础率,运用测 验都是得不偿失的。 (三)录取率 录取率是根据测验选拔出的人数与全体受测者的比 例。录取率越低,选拔的有效性越高。录取率越高, 错误选择的可能性越大。
2. 方差比例。根据效度定义,效度是有效 分数方差在所得分数方差中所占比例。这只 是一种理论概念,在实际的效度系数的计算 中,效度分数的平方可以解释为在效标分数 的方差中可以用测验分数来解释的百分比,
r XY
2
S YX SY
2
2
r XY =效度系数
S YX
2
SY
2
=由测验所决定的效标分数方差 =效标分数方差
例1 为了考察高等教育自学考试数学试卷的 效度,有关单位在自学高考的高等数学考试 之后,请30名考生参加了某重点大学的高等 数学结业考试。这些考生在两次考试上的成 绩如下表。 计算自学高考数学试卷成绩与普通大学数学 考试成绩之间的相关系数:见附件1
Chapter5效度

策 N 正确 错误
拒绝 拒绝
2020/8/13
决策的可能结果 32
泰勒-罗赛尔预期表
2020/8/13
33
2020/8/13
34
增益效度
增益效度(incremental validity):由于 应用测验而在决策中提高的效度。
2020/8/13
35
例子:
• 假设你是一家公司的人事部经理。有100 个人申请某一职位。根据以往公司招聘 员工的资料,你了解到申请该职位的平 均成功率为60%。现在你手头上有个针 对该职位的测验,效度为0.7,而因额度 限制,你只能招收30人。
• 或测验使用者的预定目的与实测结果相 吻合的程度。
–这个测验测什么? –测得有多准?
2020/8/13
5
效度的性质
• 效度是针对测验结果的 • 效度是针对某种特定的测验目的的
–尺子可以用来度量长度,但不能用来度量重 量,即便每次度量的结果都完全一样。
–16PF是用来测人格的,如果那来测智力的话, 就缺乏效度 。
• 3.命中率:当使用测验进行决策时,决策的正命中
率和总命中率可以作为效度的指标。
2020/8/13
26
总命中率=命中人数/总人数
正2020命/8/13中率=被录取的成功者/录取人数
27
2.2.5 效标关联效度的实际应用问题
• 1. 统计的显著性
样本量对相关系数显 著性的影响
2020/8/13
相关显著性与样本量之间 的关系(p < .05 水平)
2020/8/13
41
内部一致性方法
• 人格测验常用
–题目分数与总分相关 –分测验与总分相关
注:这种考察方法一般只能根据结果推论出测验是测单
第5章效度_PPT幻灯片

3、经验推测法
这种效度是通过实践来检验效度。如儿 童发展量表是否有效,需要经过实践调查。
(三)内容效度的特性 表面效度(重点):是由外行对测
验作表面上的检查确定的,它不反映 测验实际测量的东西,只是指测验表 面上看来好像是测量所要测的东西。
编制测验时,表面效度需要考虑。
最高行为测验,如智力测验、成 就测验,需要较高的表面效度。
第三节 影响效度的因素
一、测验本身的因素 二、测验实施中的干扰因素 (一)主试的影响因素 (二)被试的影响因素 三、样本团体的性质 (一)样本团体的异质性 (三)干涉变量 四、效标的性质
一、测验本身的因素
如词汇和句型不能过于太难,如低年级 小学生,要用拼音和图形来注解。测验取 材、测验长度、试题类型、难度、区分度 及编排方式等都会影响效度。
• 1、如果某测验的效度系数是0.70,则在测 验中无法作出正确预测的比例是( )。
• (A)0.30 • (B)0.51 • (C)0.49 • (D)0.70
• 2、一个测验所测量的与所要测量的心理特 点之间符合的程度,指的就是测验的( )。
(A)信度 (B)难度 (C)区分度 (D)效度
• 3、好的效标应具备的条件包括( )。 • (A)效标测量本身必须有效 • (B)效标必须具有较高的信度 • (C)效标可以客观地加以测量 • (D)效标测量的方法经济实用
典型行为测验却要求较低的表面效 度,如大多数人格测验,如UPI中的25 题“想轻生”。
二、构想效度
(一)什么是构想效度 定义:是指测验能够测量到理论上的构
想或特质的程度,即测验的结果是否能 证实或解释某一理论的假设、术语或构 想,解释的程度如何。
建立构想效度的三步
第五章 效度

观念效标和效标测量
同一个观念效标可有多个效标测量
①效标测量必须真实地反映观念效标的重要侧面;
②效标测量必须稳定可靠;
③效标测量必须客观,避免偏见; ④在保证有效性的前提下,效标测量必须尽可能简 单、省时、花费少。
“大学学习成功”?
实证效度的估计方法:
相关法 区分法 命中率
命中率:用某智力测验对1万名儿童进 行鉴定的结果 测验鉴定 为弱智 真正弱智 真正正常 合计 240 70 310 测验确定 为正常 60 9630 9690 合计 300 9700 10000
如何确定内容效度? ◆ 专家判断法:“逻辑效度” “双向细目表” ◆ 统计分析法:复本信度(等值性系数) ◆ 再测法
为什么编制问卷时需要双向细目表?
原因一:它是设计试卷的蓝图,使命题者明确测验的目标, 把握试题的比例与分量,提高命题的效率和质量。 原因二:它对于审查试题的效度也有重要的指导意义,包括 两个维度(双向)的表格,反映测验内容、测验目标。
第五章 测量效度
——你的测验准吗?
第一节 效度概述
一、效度的含义 效度——是指一个测验或量表实际能测 量出其所要测的心理特质的程度。 相对性 综合反映随机误差和系统误差 要从多方面收集证据
CTT理论假设:
SX2=SV2+SI2+SE2
效度的数学定义:
S r S
2 xy
2 v 2 x
补充: 信度与效度的关系 信度是测验和自己/严格平行的测验的相 关程度 效度是测验和某个效标测验之间的相关, 此效标不必是平行测验
各种效度策略的恰当使用:
内容效度最适于测量具体属性的测验
第五章测量效度

第五章测量效度第五章效度一、多项选择题1、效度与信度的关系()A、信度高是效度高的充分非必要条件B、测验的效度受它的信度制约C、信度高是效度高的必要非充分条件D、测验的效度不受它的信度制约2、内容效度主要应用于()A、智力测验B、职业测验C、人格测验D、成就测验3、结构效度主要应用于()A、智力测验B、职业测验C、人格测验D、成就测验4、内容效度的确定方法有()A、逻辑分析法B、复本分析法C、再测法D、经验推测法5、结构效度的估计方法有()A、测验内部寻找证据法B、测验之间寻找证据法C、实证效度法D、MTMM法E、因素分析法F、相关法G、经验推测法6、效标特点有()A、多样性B、复杂性C、特殊性D、时间性一、填空题1、效度的种类主要有、、。
2、多种特质—多种方法矩阵法是和方法的综合运用。
3、实证效度可以被分为和。
4、一般来说,如果效标测量要想较好地体现观念效标,效标测量本身就必须是、和,而且必须和。
5、在考虑效标与分数的相关时,有一个因素是必须忠实的,即测验分数与效标之间是否符合的问题。
三、名词解释1、效度2、效标3、表面效度4、效标污染四、判断题1、一般来说,最佳行为测验往往表面效度高,其他测验则希望表面效度低。
2、结构效度的大小首先取决于实现嘉定的心理特质理论。
3、信度不高的测验也可以有很高的效度。
4、在评价一个测验的效度时,可以不考虑测验使用的功利率。
5、增加测验的长度可以提高测量效度。
五、简答题1、简述什么是效度。
2、影响测量效度的因素有哪些?3、怎样提高测量效度?参考答案:一、1、BC 2、BD 3、AC 4、ABCD 5、ABCDE 6、ABCD二、1、内容效度、结构效度、实证效度2、相容效度区分效度3、同时效度预测效度4、有效可靠客观实用5、线性关系三、1、效度是指一个测验或量表实际能测出其所要测的心理特质的程度。
2、效标就是衡量一个测验是否有效的外在标准,它是独立于测验并可以从实践中直接获得我们所感兴趣的行为。
第五章 效度

ˆ 这里, Y 为预测的效标分数;
S X 和 SY 分别为效标分数与测验分数的标准差.
X为测验得分。
效标关联效度的关键是选择好效标。一个好的效标必 须具备以下几个条件:(1)可靠性,即效标测验必须具有 较高的信度,如果效标测验不稳定,就不能与本测验有恒 定的关系.相关系数也就不能科学地解释同时或预测效度; (2)有效性,即效标测验本身必须是有效的,如果效标测 验本身缺乏有效性,则无法准确确定本测验的同时效度或 预测效度;〔3)客观性,即效标测验必须尽量客观 标准化.力求排除主观偏见,特别是防止效标污染的影响; (4)实用性.即效标应尽量使其用法简单、省时、花费少、 讲究经济实用。
三、效标关联效度
效标关联效度是指测验分数与作为效标的另一独立测验结果之间 的一致性程度。一般是用本测验与效标测验去测同一组被试得到的 两组分数的相关系数表示。 所谓效标,是检验测验效度的参照标准。效标实际上是本测验 所想测量或要预测的特性或功能,这些特性和功能通常以另一独 立测验的结果来表示。因此,效标是估计效标关联效度的主要根 据,所以效标必须确实能反映某个方面的特性和功能,才能成为估 计测验效度的依据。在运用效标进行测验时.还要避免效标污染。 所谓效标污染,是指由于主试知道某个人(或某个集体)的原来测验 成绩,存有成见,凭印象给分.影响了在效标测验中对某个人(或 某个集体)的成绩评定。
第一节 效度的估算
效度的估算与效度的类型相关,对于测验效度 的类型,不同学者有不同的分类方法。美国心理 学会1974年发行的《教育和心理测验的标准》一 书,正式采用将效度分为内容效度、构想效度和 效标关联效度三大类的方法。目前在教育与心理 测量中,应用最广泛的就是这种效度分类方法。
一、内容效度
内容效度是指测验内容与预定要测的内容之间 的一致性程度。也可以说是指测验内容对所要测 验的全部内容的取样代表性程度。取样代表性是指 测验题目能最大限度地代表预测的内容范围。因 此,一个测验要具有较高的内容效度必须具备两个 条件,其一是测验内容范围明确,其二是取样具有 代表性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章效度作业
一、单选题
⒈.如果研究表明,高考分数与大学学习成绩有高度正相关,那么可以认为,对于大学学习而言,高考分数具有较高的(b )。
A.表面效度
B.预测效度
C.构想效度
D.区分度
2.一项新测验与现存的经常引用的同类测验的相关,是( b ) 的证据。
A.内容效度
B.实证效度
C.预测效度
D.构想效度
3.如果一个测验在测验使用者、测验人员尤其是受试者看来是有效的,那么,此测验具有
(a )。
A.表面效度
B.内容效度
C.构想效度
D.效标关联效度
4.下列哪一概念与其他概念不属于一类?(c )
A.实证效度
B.预测效度
C.构想效度
D.同时效度
5.北京师范大学是一所强调教学和研究并重的大学,校方以学生对教师的评价衡量教师的工作绩效,校方的效标可以被认为是( c )。
A.适当的 B.污染的 C.有缺陷的 D.无效的
6.如果开放性分数与销售技巧的同伴评价存在正相关,那么你可以认为(d )。
A.开放性分数越高,销售技巧的同伴评价也越高。
B.开放性能使人更有效的进行销售。
C.销售工作能使人更开放的面对各种不同的经历。
D.各种经历越丰富,越能使人具有开放性并在销售工作上做的更好。
7.假设你要测查一个儿童的智力,你测量了他眼眉以上头的周长,你测量了5次,得到了一个平均值,然后将平均数乘以7得到该儿童的IQ,这种测量IQ的程序(c )。
A.不可信,也无效
B.不可信,但有效
C.可信,但无效
D.即可信又有效。
8.你是一所全国重点高中的校长,你有500名最有才华的学生,当他们毕业时,你发现他们高考的数学成绩和在校的各门功课总的平均成绩只有0.13的相关,解释这个相关的最好理由是(b )。
A.预测源的全距限制(这个样本的高考分数很高)
B.预测源的信度低(高考是不可靠的,削弱了相关)
C.抽样误差变异(实际得到相关低只是一种偶然性)
D.效标不可靠
9.刘明想雇佣更好的旅行代理,所以他想知道在职业能力测验X1的基础上是否应该添加一个动机定向测验X2,在预测工作绩效上,X l和X2一样好,当X l和X2的相关是哪种情况时,你建议增加X2以获得最大的渐进效度?(a )
A. r=+1.00
B. r=0.00
C.不需要添加X2,因为X2与X1预测同一个东西。
D.与X l和X2的相关没有关系,因为X2与X1预测同一个东西。
10.刘明是上面提到的旅行社的总经理,他告诉你他们花了很多钱用这个测验,所以他想知道该测验预测工作绩效的有效性,如果该测验有很好的效标效度,你最有力的证据是:( a )
A.该测验的内容与工作绩效评定的内容紧密相配。
、
B.该测验恰当而可靠的测查了能力,工作绩效评定也反应了能力。
C.即使在做校正前,该测验与工作绩效评定的相关也很高,达到0.42。
D.就任意一个工作绩效评定值来说,它反映真分数的置信区间非常小(95%)。
11.从信度与效度的关系看,信度是效度的(b )。
A.充分条件
B.必要条件
C.基本条件
D.重要条件
12.内容效度主要用于考查(d )的有效性。
A.智力测验
B.人格测验
C.特殊能力测验
D.成绩、技能测验
13.通过对测验所含项目作内容的系统考察,以确定由这些项目所构成的测验,是否是测验测特质行为领域的代表性样本。
这样的程序获得的效度叫做(d )。
A.效标关联效度
B.内容效度
C.一致性效度
D.结构效度
14.用重测相关估计信度时存在的局限是(a )。
A.对所测特质的稳定性有限制
B.对测验项目的难度排列有限制
C.只能在一定时间间隔内重测才能得到重测相关
D.对测验的内容范围、测验难度、试题类型等有限制
15.在心理与教育测量中,测验误差与信度的关系是(c )。
A.系统误差控制得好,测验信度就越高。
B.随机误差控制得较好,测验信度就越高。
C.各方面误差因素都控制得好,测验信度才会高。
D.通过多次反复施测才能减少误差,提高测验信度。
16.下列四个概念中与效标效度无关的是( d )。
A.同时效度 B.预测效度 C.效标测量 D.因素效度
17.在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简
单地说是指一个心理测验的(b )。
A.稳定性 B.准确性 C.可信度 D. 区分效度
18.在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方差)与( d )方差的比率。
A.误差 B.系统误差 C.随机误差 D.总
19.( a )指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。
A.内容效度 B.构想效度 C.效标效度 D.区分效度
20.专家判断法,就是请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。
如果专家认为测验题目恰当地代表了所测内容,则测验具有内容效度。
因此,内容效度有时又称( a )。
A.构想效度
B.效标效度
C.区分效度
D.逻辑效度
21.在编制测验时,效度是重要的要考虑的特性。
如果是编制最高行为测验,除了内容效度,也要求有(a )。
A.较高的表面效度 B.较好的专家判断 C.较好的外行判断 D.主观性
22.计算两种测验之间得分的相关,其中一种测验是待研究效度的,另一种是已有效度证据的成熟的测验,但两者测量的是同一种心理特质,假如相关高,说明新测验所测量的特质确实是老测验所反映的特质或行为。
这种方法叫(c )。
A.区分效度 B.逻辑效度 C.相容效度 D.构想效度
23.(c )是检验测验分数能否有效地区分由效标所定义的团体的一种方法。
A.相关法 B.区分法 C.命中率法 D.失误法
24.效度系数的实际意义常常以决定系数来表示,如测验的效度是0.80,则测验的总方差中有(b )的方差是测验分数的方差。
A. 36%
B. 46%
C.56%
D.64%
25. YX Y a b X ∧=+式中Y ∧
是(a )
A .预测的效标分数 B.纵轴的截距 C.斜率 D.测验分数
26.如果其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越(b )。
A. 高
B. 低
C. 大
D.接近1
27.效标与测验分数之间的相关,用皮尔逊积差相关系数的前提是假设两个变量的关系是(d )的分布。
A. 线性
B.非线性
C.抛物线
D. 正态曲线
28.效标测量本身的可靠性如何亦是值得考虑的一个问题。
效标测量的可靠性即效标测量的(d )
A.区分度
B.常模
C.信度
D.效度
29.( d )是指一个测验看起来好像是测量所要测量的东西的程度。
A.构想效度
B.同时性效度
C.相容效度
D.表面效度
30.如果测验的效标资料是经过一段时间后获得的,这样所得的效度称(b )。
A.同时效度
B.预测效度
C.构想效度
D.内容效度
31.当测验用于强调维护社会公平时,应重视( b )。
A.总命中率
B.正命中率
C.基础率
D.录取率
32、除了描述性语言外,内容效度的确定也可以采用一些统计分析方法,如(bd )(此题为多选)
A.计算两个评分者一致性
B.复本相关
C.专家推测
D.再测法
二、简答题
1、什么是测量效度?它与信度的关系怎样?
2、效度的影响因素有哪些?如何提高测量效度?
三、假设用某种测验选拔员工100人,经过一段时间的工作检验,得到以下四组数据:正确接受为42人,正确拒绝为34人,错误接受为10人,错误拒绝为14人。
请算出该次选拔的总命中率。