第五章 测量效度
合集下载
第五章效度

内容效度、构想效度、预测效度、同时效度 ? French、Michbel 内容效度、构想效度、效标效度
二、内容效度
(一)内容效度及基本保证条件 1、定义 内容效度(content validity) 是指测验项目所涉及
的内容对欲测内容范围的代表性程度。或者说所 测内容对要测内容范围行为取样的代表性,又称 推理效度、逻辑效度。 2、内容效度的基本保证条件 要获得较高的内容效度,必须具备两个基本条件: 1)欲测的内容范围必须定义清楚,界限分明。
(2)二列相关系数 适用条件:测验分数和效标分数都是连续变量,其中一个变
量被人为分为两类
(3)四分相关系数 适用条件:当测验分数和效标分数都是连续变量,且每一个
变量的变化都被人为地分为两类
(4)φ相关系数 适用条件:当测验分数与效标分数都是真正的二分变量
(5)列联相关系数 适用条件:当测验分数与效标分数其中一个变量不止分为两
? 表面效度指被试或其他未受过专门训练的 人员对测量有效性程度的估计
? 表面效度不能算是一种效度,它不反映测 验实际测量的内容,但可取得被试的合作。
? 成就测验需较高的表面效度,而人格测验 则需较低的表面效度。
(五)内容效度的优缺点
? 优点:对测验内容的详细描述是编制任何测验都 应借鉴的
? 缺点:
四、效标关联效度
(一)定义、种类、运用 1、定义 是指测验对个体的效标行为表现进行估计的有效程度。 又称实证效度、经验效度、准则关联效度 2、分类(收集效标的时间)
? 同时效度:效标资料与测验资料同时获得,如机械能力倾向测验。 ? 预测效度:效标资料后于测验资料获得,如MBA考试。
3、应用(二者本质区别)
2. 尽量不让评定者知道以前的测验结果,防止评 定时产生主观倾向。
二、内容效度
(一)内容效度及基本保证条件 1、定义 内容效度(content validity) 是指测验项目所涉及
的内容对欲测内容范围的代表性程度。或者说所 测内容对要测内容范围行为取样的代表性,又称 推理效度、逻辑效度。 2、内容效度的基本保证条件 要获得较高的内容效度,必须具备两个基本条件: 1)欲测的内容范围必须定义清楚,界限分明。
(2)二列相关系数 适用条件:测验分数和效标分数都是连续变量,其中一个变
量被人为分为两类
(3)四分相关系数 适用条件:当测验分数和效标分数都是连续变量,且每一个
变量的变化都被人为地分为两类
(4)φ相关系数 适用条件:当测验分数与效标分数都是真正的二分变量
(5)列联相关系数 适用条件:当测验分数与效标分数其中一个变量不止分为两
? 表面效度指被试或其他未受过专门训练的 人员对测量有效性程度的估计
? 表面效度不能算是一种效度,它不反映测 验实际测量的内容,但可取得被试的合作。
? 成就测验需较高的表面效度,而人格测验 则需较低的表面效度。
(五)内容效度的优缺点
? 优点:对测验内容的详细描述是编制任何测验都 应借鉴的
? 缺点:
四、效标关联效度
(一)定义、种类、运用 1、定义 是指测验对个体的效标行为表现进行估计的有效程度。 又称实证效度、经验效度、准则关联效度 2、分类(收集效标的时间)
? 同时效度:效标资料与测验资料同时获得,如机械能力倾向测验。 ? 预测效度:效标资料后于测验资料获得,如MBA考试。
3、应用(二者本质区别)
2. 尽量不让评定者知道以前的测验结果,防止评 定时产生主观倾向。
第五章效度

3、效标和效标测量:
效标,即衡量测验有效性的参照标准,指的是 可以直接而且独立测量的我们感兴趣的行为。
效标可以分为两个层次,其一是理论水平的观 念效标,其二是操作定义水平的效标测量。
4、常用的效标
(1)学业成就; (2)实际工作表现 (3)特殊训练成绩 (4)精神病诊断 (5)等级评定 (6)效标团体的比较 (7)先前有效的测验
(二)构想效度(construct Validity)
1954年提出,有人翻译为构思效度,也有叫结 构效度。它是指测验能够测量到理论上的构想 和特质的程度,即测验的结果是否能证实或解 释某一理论的假设、术语或构想,解释的程度 如何。
(三)效标效度
1、定义:又称实证效度,反映的是测验预测个 体在某种情境下行为表现的有效性程度。
空间想象能力 67 1 2 4 6 4 6 1 2 2 3 1 35 23
测验成绩
00403106308
一年后几何测 65 7 6 5 4 6 7 3 6 5 4 6 70 62
验成绩
02588282088
1 110011010011 1
5、效标效度的表示方法 (1)相关法:
(2)命中率法
是当测验用来做取舍的依据时,用其正确决定 的比例作为效度指标的一种方法。命中率的计 算有两种方法,一是计算总命中率,另一种是 计算正命中率。
(3)命中率法
效标成绩 测验预测
成功(+)
失败(-) A(失误)
成功(+) B(命中)
失败(-) C(命中) D(失误)
总命中率:PCT
命中 命中 失误 100%
A
CB BC
100% D
正命中率 : PCP
Chapter5效度

策 N 正确 错误
拒绝 拒绝
2020/8/13
决策的可能结果 32
泰勒-罗赛尔预期表
2020/8/13
33
2020/8/13
34
增益效度
增益效度(incremental validity):由于 应用测验而在决策中提高的效度。
2020/8/13
35
例子:
• 假设你是一家公司的人事部经理。有100 个人申请某一职位。根据以往公司招聘 员工的资料,你了解到申请该职位的平 均成功率为60%。现在你手头上有个针 对该职位的测验,效度为0.7,而因额度 限制,你只能招收30人。
• 或测验使用者的预定目的与实测结果相 吻合的程度。
–这个测验测什么? –测得有多准?
2020/8/13
5
效度的性质
• 效度是针对测验结果的 • 效度是针对某种特定的测验目的的
–尺子可以用来度量长度,但不能用来度量重 量,即便每次度量的结果都完全一样。
–16PF是用来测人格的,如果那来测智力的话, 就缺乏效度 。
• 3.命中率:当使用测验进行决策时,决策的正命中
率和总命中率可以作为效度的指标。
2020/8/13
26
总命中率=命中人数/总人数
正2020命/8/13中率=被录取的成功者/录取人数
27
2.2.5 效标关联效度的实际应用问题
• 1. 统计的显著性
样本量对相关系数显 著性的影响
2020/8/13
相关显著性与样本量之间 的关系(p < .05 水平)
2020/8/13
41
内部一致性方法
• 人格测验常用
–题目分数与总分相关 –分测验与总分相关
注:这种考察方法一般只能根据结果推论出测验是测单
第五章 效度

观念效标和效标测量
同一个观念效标可有多个效标测量
①效标测量必须真实地反映观念效标的重要侧面;
②效标测量必须稳定可靠;
③效标测量必须客观,避免偏见; ④在保证有效性的前提下,效标测量必须尽可能简 单、省时、花费少。
“大学学习成功”?
实证效度的估计方法:
相关法 区分法 命中率
命中率:用某智力测验对1万名儿童进 行鉴定的结果 测验鉴定 为弱智 真正弱智 真正正常 合计 240 70 310 测验确定 为正常 60 9630 9690 合计 300 9700 10000
如何确定内容效度? ◆ 专家判断法:“逻辑效度” “双向细目表” ◆ 统计分析法:复本信度(等值性系数) ◆ 再测法
为什么编制问卷时需要双向细目表?
原因一:它是设计试卷的蓝图,使命题者明确测验的目标, 把握试题的比例与分量,提高命题的效率和质量。 原因二:它对于审查试题的效度也有重要的指导意义,包括 两个维度(双向)的表格,反映测验内容、测验目标。
第五章 测量效度
——你的测验准吗?
第一节 效度概述
一、效度的含义 效度——是指一个测验或量表实际能测 量出其所要测的心理特质的程度。 相对性 综合反映随机误差和系统误差 要从多方面收集证据
CTT理论假设:
SX2=SV2+SI2+SE2
效度的数学定义:
S r S
2 xy
2 v 2 x
补充: 信度与效度的关系 信度是测验和自己/严格平行的测验的相 关程度 效度是测验和某个效标测验之间的相关, 此效标不必是平行测验
各种效度策略的恰当使用:
内容效度最适于测量具体属性的测验
第五章测量效度

(3)考察测验的实证效度法
根据效标把被试分组,考察其得分差异。 根据测验得分差异把被试分组,考察其所测特质(行为表 现)的差异。
成就测验:分为高分组和低分组 人格测验:分为不同类型的效标组
(4)多种特质-多种方法矩阵法
方法:1、2、3 特质:A、B、C
A1
B1
C1
A2
B2
C2
A3
B3
C3
A1
这种测验所要测的内容就是实际工作中 所需的知识和技能,编制这种测验应首
先对实际工作做较细的分析,否则,题
目取样的代表性就难以令人满意。
内容效度不适合用于能力倾向测验和人格测验。 此外,在使用内容效度时,要避免与表面效度 (surface validity)相混淆。
表面效度是外行人对某个测验从表面上看好像 是测某种心理特质的一种现象。
(2)效标的特性
a.多样性: 一个测验可能有不同的观念效标,同一个观念效标又可能有不同的效标测量。 b.复杂性: 几乎每一种效标行为都由多种特质构成,包含复杂的成分。 c.特殊性: 即使一个普通的效标,在应用时也有特殊性。 d.时间性: 近期效标与最后效标
(3)效标测量的条件
a.有效性:效标测量能真正反映观念效标。 b.可靠性:有较高的信度 c.客观性: 效标测量必须能真正反映观念效标,防止效标污染。 效标污染(criterion contamination)是指评定者知道被试的测验分数,因而影响到 对效标的客观评定。
(1)要有定义完好的内容范围
(2)测验题目应是所界定的内容范围的代表性取样。
内容效度主要应用于成就测验。
因为成就测验主要是测量被试掌握某种 技能或学习某门课程所达到的程度。
第五章 测量效度

(三)创设标准的测试环境
(四)选好效标,定好效标测量
效标就是衡量一个测验是否有效的外在标准,是我们所要预 测的行为。
效标可以是连续变量(如分数),也可以是分类变量(如职
业);可以是自然的现成的指标(如产量、薪水),也可以
是人为设计的指标(如考试测验);可以是主观评判,也可 以是客观测量。归纳起来,常见的效标主要有学业成就、等
级评定、临床诊断、实际工作表现和其他测验成绩。
(三)效标效度的确定方法
效标效度的确定方法一般有三个步骤:明确观念效标, 确定效标测量,考察测验分数与效标测量的关系。
效标效度的估计方法:
(1)相关法 即计算测验分数与效标测量的相关系数:积差相关、等 级相关、二列相关、点二列相关等。
(2)分组法(区分法)
是被试接受测验后,让他们工作一段时间,再根据工作
2. 项目数量
增加项目的数量不但能够提高测验的信度,也可以提高 测验的效度,增加项目数对于效度的影响效果可以通过
下面公式估计:
(二)测验的实施 (三)被试 (四)效标的性质
(五)测量的信度
五、提高测量效度的方法 (一)精心编制测验量表,避免出现比较大的系统误 差
(二)妥善组织测验,控制随机误差
效标。
根据效标资料搜集的时间,效标效度可以分为同时效标和 预测效标。效标资料与测验分数是同时收集的,获得的效 度叫同时效度;效标资料是在测验分数之后收集的,获得 的效度叫预测效度。
同时效度主要用于诊断现状,预测效度在于预测个体将来
的行为。
(二)效标与效标测量
第五章测量效度

--
对构想效度的评价
总的来说,构想效度促使研究者把着眼点 放在提出假设、检验假设上,使得测验成 为理论研究的重要工具,而不再只是实际 决策的辅助工具,从而使测验有了更广阔 的发展前景。
--
三、实证效度 1.含义、种类及作用
实证效度是指一个测验对处于特定情境中的个体的行为进行估计的有效性。 被估计的行为是检验测验效度的标准,简称效标。 所以,实证效度又称效标关联效度(criterion-related validity)。
第五章
测量效度
201-- 5
第一节 效度概述
效度
效度(validity)是指一个测验或量表实际
能测出其所要测的心理特质的程度。 在测验的众多质量指标中,效度是一个重要 的指标。
--
效度注意三要点:
效度是一个相对的概念:每个测量工具都有自己的目的; 内隐特质是通过外显行为间接测得的 ( 因此心理测量不可 能达到百分之百准确,只能达到某种程度上的准确)。
--
内容效度既具有一定的优点,也有一定 的局限。其主要缺点是缺乏可靠的数量 指标,因而妨碍了各测验间的相互比较。
--
(2)统计方法:用两个测验复本来测同一批被试,若相关高 ,则内容效度可能高,但若相关低,则说明必有一个测验 缺乏内容效度。
(3)再测法: 前测→教学→后测 如果后测成绩优于前测成绩,说明该测验具有一定的内容效度
2.内容效度的确定方法 (1)逻辑分析法:专家判断根据自己的知识经验对量表的
有效性(逻辑性)作出判断,也称逻辑效度。 为使内容效度的判断过程更客观,一般采用下列步骤: ①确定欲测内容的范围; ②编制双向细目表; ③编制评定量表,从测验内容所测的技能、题目对所定义的
范围的覆盖率、各种题目数量和分数的比例以及题目形式 的适当性等方面,对测验作出总的评价。
对构想效度的评价
总的来说,构想效度促使研究者把着眼点 放在提出假设、检验假设上,使得测验成 为理论研究的重要工具,而不再只是实际 决策的辅助工具,从而使测验有了更广阔 的发展前景。
--
三、实证效度 1.含义、种类及作用
实证效度是指一个测验对处于特定情境中的个体的行为进行估计的有效性。 被估计的行为是检验测验效度的标准,简称效标。 所以,实证效度又称效标关联效度(criterion-related validity)。
第五章
测量效度
201-- 5
第一节 效度概述
效度
效度(validity)是指一个测验或量表实际
能测出其所要测的心理特质的程度。 在测验的众多质量指标中,效度是一个重要 的指标。
--
效度注意三要点:
效度是一个相对的概念:每个测量工具都有自己的目的; 内隐特质是通过外显行为间接测得的 ( 因此心理测量不可 能达到百分之百准确,只能达到某种程度上的准确)。
--
内容效度既具有一定的优点,也有一定 的局限。其主要缺点是缺乏可靠的数量 指标,因而妨碍了各测验间的相互比较。
--
(2)统计方法:用两个测验复本来测同一批被试,若相关高 ,则内容效度可能高,但若相关低,则说明必有一个测验 缺乏内容效度。
(3)再测法: 前测→教学→后测 如果后测成绩优于前测成绩,说明该测验具有一定的内容效度
2.内容效度的确定方法 (1)逻辑分析法:专家判断根据自己的知识经验对量表的
有效性(逻辑性)作出判断,也称逻辑效度。 为使内容效度的判断过程更客观,一般采用下列步骤: ①确定欲测内容的范围; ②编制双向细目表; ③编制评定量表,从测验内容所测的技能、题目对所定义的
范围的覆盖率、各种题目数量和分数的比例以及题目形式 的适当性等方面,对测验作出总的评价。
第五章效度

1、影响测量效度的因素
(4)所选效标的性质 有的学者认为,智力测验分数与教师对学生等级评定之 间的效度系数只要在0.30~0.50之间就可以了,因为 教师的评价会受到与智力无关的其他因素的影响。与此 类似,相同科目的标准化测验成绩与教师评价之间的相 关应达到0.60~0.70,两种不同智力测验或标准化测验 之间的相关应达到0.60~0.80等等。 所有这些不同的要求,主要是因为所用效标的不同而提 出来的。
式中 是测验x增长至原来的K倍后,新测验与 效标(y)的相关(效度系数);K为测验增长的 倍数; 原测验的效度系数; 为原测验的信
度系数。
1、影响测量效度的因素
(2)测验的实施过程 一个测验在实施过程中,如不遵从指导语的要求、
或出现以外干扰、或评分计分出现差错等等,都会降低 测量效度。 (3)接受测验的被试
(二)构想效度(construct Validity)
1954年提出,有人翻译为构思效度,也有叫结 构效度。它是指测验能够测量到理论上的构想 和特质的程度,即测验的结果是否能证实或解 释某一理论的假设、术语或构想,解释的程度 如何。
(三)效标效度
1、定义:又称实证效度,反映的是测验预测个 体在某种情境下行为表现的有效性程度。
一般情况下,被试的应试动机、情绪、态度、身体 状态等等,都会影响测量信度,造成较大的随机误差, 进而影响测量的效度。
就整个被试团体而言,如果缺乏必要的同质性,则 很可能会得到不恰当的效度资料。
1、影响测量效度的因素
(4)所选效标的性质
由于同一个测验可以有不同的效标,同一 个观念效标也可以有不同的效标测量,所以在 评价测量效度时,所选效标的性质是很重要的 考虑因素。
3、效标和效标测量:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(三)影响效标关联效度的因素
1、效标的选择:效标的适当性; 效标的选择:效标的适当性; 效标测量与预测源测量的时间间隔; 2、效标测量与预测源测量的时间间隔; 预测源与效标测量的信度; 3、预测源与效标测量的信度; 被试样本的特征:样本的大小、 4、被试样本的特征:样本的大小、样本的 代表性。 代表性。 效标关联效度的系数在大小上变化很 大,但一般认为.60以上是高相关。 但一般认为.60以上是高相关。 .60以上是高相关
三、结构效度
(一)结构效度的含义
结构效度( validity):又称构想效度 又称构想效度, 结构效度(construct validity):又称构想效度, 指一个测验实际能测到所要测量的理论结构的程度, 指一个测验实际能测到所要测量的理论结构的程度, 或者说测验分数能够说明心理学理论的某种结构或特 质的程度。 质的程度。 实际测量的结果 心理学的理论结构或构想 两者关系
测验题目 所要测查的内容范围
两者关系
具备高内容效度的两个基本条件
1、所要测量的内容范围必须定义清楚,界 所要测量的内容范围必须定义清楚, 限分明,重点突出。 限分明,重点突出。 2、测验题目应是所界定的内容范围的代表 性取样。 性取样。
以“教学大纲”为例,它明确规定了教学范围、 教学大纲”为例,它明确规定了教学范围、 教学目标、每一章的知识要点、重点和难点, 教学目标、每一章的知识要点、重点和难点,这些既 是教学的纲要,也是考试命题的参照标准; 是教学的纲要,也是考试命题的参照标准; 参照教学大纲,教师命题时一是不要超纲,二是 参照教学大纲,教师命题时一是不要超纲, 题目的覆盖面要尽可能宽,三是题目要具有典型性、 题目的覆盖面要尽可能宽,三是题目要具有典型性、 代表性,四是题目的难度和区分度应合乎要求。 代表性,四是题目的难度和区分度应合乎要求。这些 都是保证题目取样能够具有较高代表性的条件。 都是保证题目取样能够具有较高代表性的条件。
3、预测效度与同时效度
预测效度(predictive validity): 预测效度(predictive validity):效标资料 后于测验资料获得。 后于测验资料获得。预测效度用于预测个体将 来的行为 。如SAT考试与大学GPA,招聘考试 SAT考试与大学GPA, 考试与大学GPA 与实际工作表现,等等。 与实际工作表现,等等。 同时效度(concurrent 同时效度(concurrent validity) :效标资料 与测验资料同时获得。同时效度用于诊断现状。 与测验资料同时获得。同时效度用于诊断现状。 如学习障碍测验与学校表现。 如学习障碍测验与学校表现。
2、区分法(被试组的差异检验法)
由效标测量区分小组,考察不同小组被试在 由效标测量区分小组, 测验分数上是否有显著差异。 测验分数上是否有显著差异。 以一次招聘中的营销能力测验为例, 以一次招聘中的营销能力测验为例,区分法 的具体程序是:( :(1 的具体程序是:(1)一批候选人接受营销能 力测验,然后考察他们的实际营销业绩,根 力测验,然后考察他们的实际营销业绩, 据他们的营销业绩分为优等组和劣等组;( ;(2 据他们的营销业绩分为优等组和劣等组;(2) 分析优等组和劣等组在营销能力测验的分数 上是否具有显著差异。采用t 上是否具有显著差异。采用t检验 。
阿斯丁把效标分为两个层次: 阿斯丁把效标分为两个层次:一是理论描述水 平的“观念效标” 二是操作定义水平的“ 平的“观念效标”,二是操作定义水平的“效 标测量” 理论定义与操作定义。 标测量”。理论定义与操作定义。 所谓观念效标指衡量一个测验是否有效的外在 标准, 标准,它独立于测验并可以从实践中直接获得 我们所感兴趣的行为变量。 我们所感兴趣的行为变量。 常用的观念效标有:实际工作表现、学业成就、 常用的观念效标有:实际工作表现、学业成就、 临床诊断、行为的等级评定、专门的训练成绩、 临床诊断、行为的等级评定、专门的训练成绩、 对团体的区分能力以及其他现成的有效测验, 对团体的区分能力以及其他现成的有效测验, 等等。 等等。
第五章 测量效度
本章学习目标:
1、理解效度的概念和统计学含义。 、理解效度的概念和统计学含义。 2、掌握信度和效度之间的关系。 、掌握信度和效度之间的关系。 3、掌握三种效度的概念及其估算方法。 、掌握三种效度的概念及其估算方法。 4、了解提高测量效度的途径。 、了解提高测量效度的途径。
第一节 效度的定义
效度检验的实质
实际的测量结果 测量目标
两者关系
二、效度的概念理解
1、效度是一个相对的概念。 效度是一个相对的概念。 效度是相对于一定的测量目的而言的。 效度是相对于一定的测量目的而言的。 效度不是一个全或无的概念。 效度不是一个全或无的概念。 2、效度是随机误差和系统误差的综合反映。 效度是随机误差和系统误差的综合反映。 3、效度不是直接可以测量到的,判断一个测验 效度不是直接可以测量到的, 是否有效要从多方面搜集证据, 是否有效要从多方面搜集证据,从证据去推 犹如法庭上收集证据一样) 论测验的效度 (犹如法庭上收集证据一样) 。
一、内容效度
(一)内容效度的含义
定义: 定义:指一个测验实际测到的内容与所要测量 的内容之间的吻合程度。或者说, 的内容之间的吻合程度。或者说,指测验题目 对所要测量的内容范围的代表性程度。 对所要测量的内容范围的代表性程度。 内容效度的关键问题是测验题目取样的代表性 程度。(覆盖面不够、偏题、超纲) 。(覆盖面不够 程度。(覆盖面不够、偏题、超纲)
第二节 效度的种类与确定方法
弗兰西与米西贝( Michbel) 弗兰西与米西贝(French & Michbel)1966 提出,并被APA APA《 提出,并被APA《教育与心理测验及诊断技术 标准》所采用的效度分类法: 标准》所采用的效度分类法: 内容效度 实证效度(又称效标关联效度) 实证效度(又称效标关联效度) 结构效度(又称构想效度) 结构效度(又称构想效度) 效度是一个整合的概念, 效度是一个整合的概念,不同类型的效度 只是寻求证据的方式不同,三者有交叉重叠。 只是寻求证据的方式不同,三者有交叉重叠。
求相关系数
对效度系数的说明
效度系数告诉我们的是, 效度系数告诉我们的是,根据测验结果对效 标进行推断时的有效程度。 标进行推断时的有效程度。 没有一个迅速而简洁的规则,可以判断多大 没有一个迅速而简洁的规则, 的效度系数是有意义的。在实际工作中, 的效度系数是有意义的。在实际工作中,很 少会看到效度系数大于0.6的情况, 0.6的情况 少会看到效度系数大于0.6的情况,效度系数 0.3-0.4之间已经被认为是比较高 之间已经被认为是比较高。 在0.3-0.4之间已经被认为是比较高。 例如,假定江苏07年高考预测大学GPA 07年高考预测大学GPA的效度 例如,假定江苏07年高考预测大学GPA的效度 系数为0.4 并且该系数在统计上是显著的, 0.4, 系数为0.4,并且该系数在统计上是显著的, 我们就可以认为高考分数预测大学GPA GPA的信息 我们就可以认为高考分数预测大学GPA的信息 超过了机遇因素。 超过了机遇因素。
(二)效标关联效度的确定方法
1、相关法:计算测验分数与效标测量之间的相关系数, 相关法:计算测验分数与效标测量之间的相关系数, 称为效度系数。 称为效度系数。 根据数据特点选择积差相关、等级相关、 根据数据特点选择积差相关、等级相关、二列相关 、四分相关等计算方法。 四分相关等计算方法。
选择团体 心理测验 处理 效标测量
3、命中率(决策正确性)
预测源 成功 成功 失败 合计 效标作为 失败 合计
错误接收) A(正确接收) B(错误接收) A+B 正确接收) 正确拒绝) C(错误拒绝) D(正确拒绝) C+D 错误拒绝) A+C B+D A+B+C+D
总命中率=命中人数÷总人数 总命中率=命中人数÷ =(A+D)÷(A+B+C+D) A+D) A+B+C+D) 正命中率=命中人数÷ 正命中率=命中人数÷ 选择人数 =A ÷(A+B) A+B) 总命中率关心录取者中合格的人数与淘汰者 中不合格的人数的比率。 中不合格的人数的比率。 正命中率只关心录取者中有多少合格的人, 正命中率只关心录取者中有多少合格的人, 不关心淘汰者是否有合格的人。 不关心淘汰者是否有合格的人。
效标测量必须满足以下要求:
1、关联性:效标测量必须真正反映观念效标的 关联性: 重要方面,与观念效标具有密切的关联性; 重要方面,与观念效标具有密切的关联性; 2、可靠性:效标测量必须是稳定的; 可靠性:效标测量必须是稳定的; 3、抗偏性:效标测量必须对每个受测者是客观 抗偏性: 的、公平的; 公平的; 4、可行性:即省时、省力、省钱,易于获得。 可行性:即省时、省力、省钱,易于获得。
一、效度的含义
所谓的测量效度是指测量结果的有效性、 所谓的测量效度是指测量结果的有效性、准 确性程度, 确性程度,也就是一个测验实际能测出其所 要测量的心理特质的程度。 要测量的心理特质的程度。 效度关注两个基本问题:其一, 效度关注两个基本问题:其一,心理测验所 测查的“心理特质”是什么(测验目的); 测查的“心理特质”是什么(测验目的); 其二, 其二,该测验对欲测量的心理特质测查到了 什么程度?测量的准确性和有效性如何? 什么程度?测量的准确性和有效性如何?
2、测验的效度受它的信度的制约。研究发现, 测验的效度受它的信度的制约。研究发现, 效度和信度具有如下关系: 效度和信度具有如下关系:
r
2 xy
≤ r
即
xx
r ≤
xy
r
xx
用语言表达就是:效度系数的最大值受信度系 用语言表达就是: 数的制约, 数的制约, 效度系数永远不可能大于信度系 数的平方根。 数的平方根。
结构效度的特点
结构效度取决于事先假定的心理学理论。 结构效度取决于事先假定的心理学理论。 结构效度没有单一指标,确定方法更复杂、 结构效度没有单一指标,确定方法更复杂、更 综合,需要由各方面证据累积起来作出评价。 综合,需要由各方面证据累积起来作出评价。 内容效度和效标关联效度都可以作为结构效度 的证据之一。 的证据之一。