第五章 效度 作业

合集下载

第五章效度

第五章效度
内容效度、构想效度、预测效度、同时效度 ? French、Michbel 内容效度、构想效度、效标效度
二、内容效度
(一)内容效度及基本保证条件 1、定义 内容效度(content validity) 是指测验项目所涉及
的内容对欲测内容范围的代表性程度。或者说所 测内容对要测内容范围行为取样的代表性,又称 推理效度、逻辑效度。 2、内容效度的基本保证条件 要获得较高的内容效度,必须具备两个基本条件: 1)欲测的内容范围必须定义清楚,界限分明。
(2)二列相关系数 适用条件:测验分数和效标分数都是连续变量,其中一个变
量被人为分为两类
(3)四分相关系数 适用条件:当测验分数和效标分数都是连续变量,且每一个
变量的变化都被人为地分为两类
(4)φ相关系数 适用条件:当测验分数与效标分数都是真正的二分变量
(5)列联相关系数 适用条件:当测验分数与效标分数其中一个变量不止分为两
? 表面效度指被试或其他未受过专门训练的 人员对测量有效性程度的估计
? 表面效度不能算是一种效度,它不反映测 验实际测量的内容,但可取得被试的合作。
? 成就测验需较高的表面效度,而人格测验 则需较低的表面效度。
(五)内容效度的优缺点
? 优点:对测验内容的详细描述是编制任何测验都 应借鉴的
? 缺点:
四、效标关联效度
(一)定义、种类、运用 1、定义 是指测验对个体的效标行为表现进行估计的有效程度。 又称实证效度、经验效度、准则关联效度 2、分类(收集效标的时间)
? 同时效度:效标资料与测验资料同时获得,如机械能力倾向测验。 ? 预测效度:效标资料后于测验资料获得,如MBA考试。
3、应用(二者本质区别)
2. 尽量不让评定者知道以前的测验结果,防止评 定时产生主观倾向。

第五章效度

第五章效度

3、效标和效标测量:
效标,即衡量测验有效性的参照标准,指的是 可以直接而且独立测量的我们感兴趣的行为。
效标可以分为两个层次,其一是理论水平的观 念效标,其二是操作定义水平的效标测量。
4、常用的效标
(1)学业成就; (2)实际工作表现 (3)特殊训练成绩 (4)精神病诊断 (5)等级评定 (6)效标团体的比较 (7)先前有效的测验
(二)构想效度(construct Validity)
1954年提出,有人翻译为构思效度,也有叫结 构效度。它是指测验能够测量到理论上的构想 和特质的程度,即测验的结果是否能证实或解 释某一理论的假设、术语或构想,解释的程度 如何。
(三)效标效度
1、定义:又称实证效度,反映的是测验预测个 体在某种情境下行为表现的有效性程度。
空间想象能力 67 1 2 4 6 4 6 1 2 2 3 1 35 23
测验成绩
00403106308
一年后几何测 65 7 6 5 4 6 7 3 6 5 4 6 70 62
验成绩
02588282088
1 110011010011 1
5、效标效度的表示方法 (1)相关法:
(2)命中率法
是当测验用来做取舍的依据时,用其正确决定 的比例作为效度指标的一种方法。命中率的计 算有两种方法,一是计算总命中率,另一种是 计算正命中率。
(3)命中率法
效标成绩 测验预测
成功(+)
失败(-) A(失误)
成功(+) B(命中)
失败(-) C(命中) D(失误)
总命中率:PCT

命中 命中 失误 100%

A
CB BC
100% D
正命中率 : PCP

心理测量学 第五章 效度(用)

心理测量学 第五章  效度(用)

b YX r XY
sY sX
0
0 . 923

a=57.5-0.923×69.4=-6.56 Yˆ =-6.56+0.923X
如果我们已知一组人的测验得分,我们可以 根据上式得到他们的效标成绩平均值的预测 值: X=76时, Yˆ =-6.56+0.923×76=63.6 X=55时, Yˆ =-6.56+0.923×88=74.7 预测值不是一个确定值,只是一个估计值, 可以被理解为所有获得某一测验分数者的平 均效标分数值。就是说,所有在测验上得76 分的人的效标分数的平均分为63.6,在例1 中,测验中实际得76分的人的效标平均分为 59.5,测验得88分的人的效标平均分为79.5。
三、影响效标关联效度的因素
(一)样本 这种影响来自两个方面:一是样本的含量,二是样 本的代表性。 (二)基础率 基础率是经选择的总体中具有某种与测验目的有关 的特质的人数比例。极高与极低的基础率,运用测 验都是得不偿失的。 (三)录取率 录取率是根据测验选拔出的人数与全体受测者的比 例。录取率越低,选拔的有效性越高。录取率越高, 错误选择的可能性越大。
2. 方差比例。根据效度定义,效度是有效 分数方差在所得分数方差中所占比例。这只 是一种理论概念,在实际的效度系数的计算 中,效度分数的平方可以解释为在效标分数 的方差中可以用测验分数来解释的百分比,
r XY
2

S YX SY
2
2

r XY =效度系数
S YX
2
SY
2
=由测验所决定的效标分数方差 =效标分数方差
例1 为了考察高等教育自学考试数学试卷的 效度,有关单位在自学高考的高等数学考试 之后,请30名考生参加了某重点大学的高等 数学结业考试。这些考生在两次考试上的成 绩如下表。 计算自学高考数学试卷成绩与普通大学数学 考试成绩之间的相关系数:见附件1

Chapter5效度

Chapter5效度

策 N 正确 错误
拒绝 拒绝
2020/8/13
决策的可能结果 32
泰勒-罗赛尔预期表
2020/8/13
33
2020/8/13
34
增益效度
增益效度(incremental validity):由于 应用测验而在决策中提高的效度。
2020/8/13
35
例子:
• 假设你是一家公司的人事部经理。有100 个人申请某一职位。根据以往公司招聘 员工的资料,你了解到申请该职位的平 均成功率为60%。现在你手头上有个针 对该职位的测验,效度为0.7,而因额度 限制,你只能招收30人。
• 或测验使用者的预定目的与实测结果相 吻合的程度。
–这个测验测什么? –测得有多准?
2020/8/13
5
效度的性质
• 效度是针对测验结果的 • 效度是针对某种特定的测验目的的
–尺子可以用来度量长度,但不能用来度量重 量,即便每次度量的结果都完全一样。
–16PF是用来测人格的,如果那来测智力的话, 就缺乏效度 。
• 3.命中率:当使用测验进行决策时,决策的正命中
率和总命中率可以作为效度的指标。
2020/8/13
26
总命中率=命中人数/总人数
正2020命/8/13中率=被录取的成功者/录取人数
27
2.2.5 效标关联效度的实际应用问题
• 1. 统计的显著性
样本量对相关系数显 著性的影响
2020/8/13
相关显著性与样本量之间 的关系(p < .05 水平)
2020/8/13
41
内部一致性方法
• 人格测验常用
–题目分数与总分相关 –分测验与总分相关
注:这种考察方法一般只能根据结果推论出测验是测单

第5章效度_PPT幻灯片

第5章效度_PPT幻灯片

3、经验推测法
这种效度是通过实践来检验效度。如儿 童发展量表是否有效,需要经过实践调查。
(三)内容效度的特性 表面效度(重点):是由外行对测
验作表面上的检查确定的,它不反映 测验实际测量的东西,只是指测验表 面上看来好像是测量所要测的东西。
编制测验时,表面效度需要考虑。
最高行为测验,如智力测验、成 就测验,需要较高的表面效度。
第三节 影响效度的因素
一、测验本身的因素 二、测验实施中的干扰因素 (一)主试的影响因素 (二)被试的影响因素 三、样本团体的性质 (一)样本团体的异质性 (三)干涉变量 四、效标的性质
一、测验本身的因素
如词汇和句型不能过于太难,如低年级 小学生,要用拼音和图形来注解。测验取 材、测验长度、试题类型、难度、区分度 及编排方式等都会影响效度。
• 1、如果某测验的效度系数是0.70,则在测 验中无法作出正确预测的比例是( )。
• (A)0.30 • (B)0.51 • (C)0.49 • (D)0.70
• 2、一个测验所测量的与所要测量的心理特 点之间符合的程度,指的就是测验的( )。
(A)信度 (B)难度 (C)区分度 (D)效度
• 3、好的效标应具备的条件包括( )。 • (A)效标测量本身必须有效 • (B)效标必须具有较高的信度 • (C)效标可以客观地加以测量 • (D)效标测量的方法经济实用
典型行为测验却要求较低的表面效 度,如大多数人格测验,如UPI中的25 题“想轻生”。
二、构想效度
(一)什么是构想效度 定义:是指测验能够测量到理论上的构
想或特质的程度,即测验的结果是否能 证实或解释某一理论的假设、术语或构 想,解释的程度如何。
建立构想效度的三步

第五章 效度

第五章 效度


观念效标和效标测量

同一个观念效标可有多个效标测量
①效标测量必须真实地反映观念效标的重要侧面;
②效标测量必须稳定可靠;
③效标测量必须客观,避免偏见; ④在保证有效性的前提下,效标测量必须尽可能简 单、省时、花费少。
“大学学习成功”?
实证效度的估计方法:


相关法 区分法 命中率
命中率:用某智力测验对1万名儿童进 行鉴定的结果 测验鉴定 为弱智 真正弱智 真正正常 合计 240 70 310 测验确定 为正常 60 9630 9690 合计 300 9700 10000


如何确定内容效度? ◆ 专家判断法:“逻辑效度” “双向细目表” ◆ 统计分析法:复本信度(等值性系数) ◆ 再测法

为什么编制问卷时需要双向细目表?
原因一:它是设计试卷的蓝图,使命题者明确测验的目标, 把握试题的比例与分量,提高命题的效率和质量。 原因二:它对于审查试题的效度也有重要的指导意义,包括 两个维度(双向)的表格,反映测验内容、测验目标。
第五章 测量效度
——你的测验准吗?
第一节 效度概述
一、效度的含义 效度——是指一个测验或量表实际能测 量出其所要测的心理特质的程度。 相对性 综合反映随机误差和系统误差 要从多方面收集证据
CTT理论假设:
SX2=SV2+SI2+SE2
效度的数学定义:
S r S
2 xy
2 v 2 x


补充: 信度与效度的关系 信度是测验和自己/严格平行的测验的相 关程度 效度是测验和某个效标测验之间的相关, 此效标不必是平行测验

各种效度策略的恰当使用:
内容效度最适于测量具体属性的测验

第五章测量效度

第五章测量效度

第五章测量效度第五章效度一、多项选择题1、效度与信度的关系()A、信度高是效度高的充分非必要条件B、测验的效度受它的信度制约C、信度高是效度高的必要非充分条件D、测验的效度不受它的信度制约2、内容效度主要应用于()A、智力测验B、职业测验C、人格测验D、成就测验3、结构效度主要应用于()A、智力测验B、职业测验C、人格测验D、成就测验4、内容效度的确定方法有()A、逻辑分析法B、复本分析法C、再测法D、经验推测法5、结构效度的估计方法有()A、测验内部寻找证据法B、测验之间寻找证据法C、实证效度法D、MTMM法E、因素分析法F、相关法G、经验推测法6、效标特点有()A、多样性B、复杂性C、特殊性D、时间性一、填空题1、效度的种类主要有、、。

2、多种特质—多种方法矩阵法是和方法的综合运用。

3、实证效度可以被分为和。

4、一般来说,如果效标测量要想较好地体现观念效标,效标测量本身就必须是、和,而且必须和。

5、在考虑效标与分数的相关时,有一个因素是必须忠实的,即测验分数与效标之间是否符合的问题。

三、名词解释1、效度2、效标3、表面效度4、效标污染四、判断题1、一般来说,最佳行为测验往往表面效度高,其他测验则希望表面效度低。

2、结构效度的大小首先取决于实现嘉定的心理特质理论。

3、信度不高的测验也可以有很高的效度。

4、在评价一个测验的效度时,可以不考虑测验使用的功利率。

5、增加测验的长度可以提高测量效度。

五、简答题1、简述什么是效度。

2、影响测量效度的因素有哪些?3、怎样提高测量效度?参考答案:一、1、BC 2、BD 3、AC 4、ABCD 5、ABCDE 6、ABCD二、1、内容效度、结构效度、实证效度2、相容效度区分效度3、同时效度预测效度4、有效可靠客观实用5、线性关系三、1、效度是指一个测验或量表实际能测出其所要测的心理特质的程度。

2、效标就是衡量一个测验是否有效的外在标准,它是独立于测验并可以从实践中直接获得我们所感兴趣的行为。

第五章 效度

第五章  效度

ˆ 这里, Y 为预测的效标分数;
S X 和 SY 分别为效标分数与测验分数的标准差.
X为测验得分。
效标关联效度的关键是选择好效标。一个好的效标必 须具备以下几个条件:(1)可靠性,即效标测验必须具有 较高的信度,如果效标测验不稳定,就不能与本测验有恒 定的关系.相关系数也就不能科学地解释同时或预测效度; (2)有效性,即效标测验本身必须是有效的,如果效标测 验本身缺乏有效性,则无法准确确定本测验的同时效度或 预测效度;〔3)客观性,即效标测验必须尽量客观 标准化.力求排除主观偏见,特别是防止效标污染的影响; (4)实用性.即效标应尽量使其用法简单、省时、花费少、 讲究经济实用。
三、效标关联效度
效标关联效度是指测验分数与作为效标的另一独立测验结果之间 的一致性程度。一般是用本测验与效标测验去测同一组被试得到的 两组分数的相关系数表示。 所谓效标,是检验测验效度的参照标准。效标实际上是本测验 所想测量或要预测的特性或功能,这些特性和功能通常以另一独 立测验的结果来表示。因此,效标是估计效标关联效度的主要根 据,所以效标必须确实能反映某个方面的特性和功能,才能成为估 计测验效度的依据。在运用效标进行测验时.还要避免效标污染。 所谓效标污染,是指由于主试知道某个人(或某个集体)的原来测验 成绩,存有成见,凭印象给分.影响了在效标测验中对某个人(或 某个集体)的成绩评定。
第一节 效度的估算
效度的估算与效度的类型相关,对于测验效度 的类型,不同学者有不同的分类方法。美国心理 学会1974年发行的《教育和心理测验的标准》一 书,正式采用将效度分为内容效度、构想效度和 效标关联效度三大类的方法。目前在教育与心理 测量中,应用最广泛的就是这种效度分类方法。
一、内容效度
内容效度是指测验内容与预定要测的内容之间 的一致性程度。也可以说是指测验内容对所要测 验的全部内容的取样代表性程度。取样代表性是指 测验题目能最大限度地代表预测的内容范围。因 此,一个测验要具有较高的内容效度必须具备两个 条件,其一是测验内容范围明确,其二是取样具有 代表性。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章效度作业
一、单选题
⒈.如果研究表明,高考分数与大学学习成绩有高度正相关,那么可以认为,对于大学学习而言,高考分数具有较高的(b )。

A.表面效度
B.预测效度
C.构想效度
D.区分度
2.一项新测验与现存的经常引用的同类测验的相关,是( b ) 的证据。

A.内容效度
B.实证效度
C.预测效度
D.构想效度
3.如果一个测验在测验使用者、测验人员尤其是受试者看来是有效的,那么,此测验具有
(a )。

A.表面效度
B.内容效度
C.构想效度
D.效标关联效度
4.下列哪一概念与其他概念不属于一类?(c )
A.实证效度
B.预测效度
C.构想效度
D.同时效度
5.北京师范大学是一所强调教学和研究并重的大学,校方以学生对教师的评价衡量教师的工作绩效,校方的效标可以被认为是( c )。

A.适当的 B.污染的 C.有缺陷的 D.无效的
6.如果开放性分数与销售技巧的同伴评价存在正相关,那么你可以认为(d )。

A.开放性分数越高,销售技巧的同伴评价也越高。

B.开放性能使人更有效的进行销售。

C.销售工作能使人更开放的面对各种不同的经历。

D.各种经历越丰富,越能使人具有开放性并在销售工作上做的更好。

7.假设你要测查一个儿童的智力,你测量了他眼眉以上头的周长,你测量了5次,得到了一个平均值,然后将平均数乘以7得到该儿童的IQ,这种测量IQ的程序(c )。

A.不可信,也无效
B.不可信,但有效
C.可信,但无效
D.即可信又有效。

8.你是一所全国重点高中的校长,你有500名最有才华的学生,当他们毕业时,你发现他们高考的数学成绩和在校的各门功课总的平均成绩只有0.13的相关,解释这个相关的最好理由是(b )。

A.预测源的全距限制(这个样本的高考分数很高)
B.预测源的信度低(高考是不可靠的,削弱了相关)
C.抽样误差变异(实际得到相关低只是一种偶然性)
D.效标不可靠
9.刘明想雇佣更好的旅行代理,所以他想知道在职业能力测验X1的基础上是否应该添加一个动机定向测验X2,在预测工作绩效上,X l和X2一样好,当X l和X2的相关是哪种情况时,你建议增加X2以获得最大的渐进效度?(a )
A. r=+1.00
B. r=0.00
C.不需要添加X2,因为X2与X1预测同一个东西。

D.与X l和X2的相关没有关系,因为X2与X1预测同一个东西。

10.刘明是上面提到的旅行社的总经理,他告诉你他们花了很多钱用这个测验,所以他想知道该测验预测工作绩效的有效性,如果该测验有很好的效标效度,你最有力的证据是:( a )
A.该测验的内容与工作绩效评定的内容紧密相配。


B.该测验恰当而可靠的测查了能力,工作绩效评定也反应了能力。

C.即使在做校正前,该测验与工作绩效评定的相关也很高,达到0.42。

D.就任意一个工作绩效评定值来说,它反映真分数的置信区间非常小(95%)。

11.从信度与效度的关系看,信度是效度的(b )。

A.充分条件
B.必要条件
C.基本条件
D.重要条件
12.内容效度主要用于考查(d )的有效性。

A.智力测验
B.人格测验
C.特殊能力测验
D.成绩、技能测验
13.通过对测验所含项目作内容的系统考察,以确定由这些项目所构成的测验,是否是测验测特质行为领域的代表性样本。

这样的程序获得的效度叫做(d )。

A.效标关联效度
B.内容效度
C.一致性效度
D.结构效度
14.用重测相关估计信度时存在的局限是(a )。

A.对所测特质的稳定性有限制
B.对测验项目的难度排列有限制
C.只能在一定时间间隔内重测才能得到重测相关
D.对测验的内容范围、测验难度、试题类型等有限制
15.在心理与教育测量中,测验误差与信度的关系是(c )。

A.系统误差控制得好,测验信度就越高。

B.随机误差控制得较好,测验信度就越高。

C.各方面误差因素都控制得好,测验信度才会高。

D.通过多次反复施测才能减少误差,提高测验信度。

16.下列四个概念中与效标效度无关的是( d )。

A.同时效度 B.预测效度 C.效标测量 D.因素效度
17.在心理测验中,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简
单地说是指一个心理测验的(b )。

A.稳定性 B.准确性 C.可信度 D. 区分效度
18.在测验理论中,效度被定义为在一组测量中,与测量目标有关的真实方差(或称有效方差)与( d )方差的比率。

A.误差 B.系统误差 C.随机误差 D.总
19.( a )指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。

A.内容效度 B.构想效度 C.效标效度 D.区分效度
20.专家判断法,就是请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。

如果专家认为测验题目恰当地代表了所测内容,则测验具有内容效度。

因此,内容效度有时又称( a )。

A.构想效度
B.效标效度
C.区分效度
D.逻辑效度
21.在编制测验时,效度是重要的要考虑的特性。

如果是编制最高行为测验,除了内容效度,也要求有(a )。

A.较高的表面效度 B.较好的专家判断 C.较好的外行判断 D.主观性
22.计算两种测验之间得分的相关,其中一种测验是待研究效度的,另一种是已有效度证据的成熟的测验,但两者测量的是同一种心理特质,假如相关高,说明新测验所测量的特质确实是老测验所反映的特质或行为。

这种方法叫(c )。

A.区分效度 B.逻辑效度 C.相容效度 D.构想效度
23.(c )是检验测验分数能否有效地区分由效标所定义的团体的一种方法。

A.相关法 B.区分法 C.命中率法 D.失误法
24.效度系数的实际意义常常以决定系数来表示,如测验的效度是0.80,则测验的总方差中有(b )的方差是测验分数的方差。

A. 36%
B. 46%
C.56%
D.64%
25. YX Y a b X ∧=+式中Y ∧
是(a )
A .预测的效标分数 B.纵轴的截距 C.斜率 D.测验分数
26.如果其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越(b )。

A. 高
B. 低
C. 大
D.接近1
27.效标与测验分数之间的相关,用皮尔逊积差相关系数的前提是假设两个变量的关系是(d )的分布。

A. 线性
B.非线性
C.抛物线
D. 正态曲线
28.效标测量本身的可靠性如何亦是值得考虑的一个问题。

效标测量的可靠性即效标测量的(d )
A.区分度
B.常模
C.信度
D.效度
29.( d )是指一个测验看起来好像是测量所要测量的东西的程度。

A.构想效度
B.同时性效度
C.相容效度
D.表面效度
30.如果测验的效标资料是经过一段时间后获得的,这样所得的效度称(b )。

A.同时效度
B.预测效度
C.构想效度
D.内容效度
31.当测验用于强调维护社会公平时,应重视( b )。

A.总命中率
B.正命中率
C.基础率
D.录取率
32、除了描述性语言外,内容效度的确定也可以采用一些统计分析方法,如(bd )(此题为多选)
A.计算两个评分者一致性
B.复本相关
C.专家推测
D.再测法
二、简答题
1、什么是测量效度?它与信度的关系怎样?
2、效度的影响因素有哪些?如何提高测量效度?
三、假设用某种测验选拔员工100人,经过一段时间的工作检验,得到以下四组数据:正确接受为42人,正确拒绝为34人,错误接受为10人,错误拒绝为14人。

请算出该次选拔的总命中率。

相关文档
最新文档