效度基本概念汇总

合集下载

第五章效度

3、效标和效标测量：
效标，即衡量测验有效性的参照标准，指的是可以直接而且独立测量的我们感兴趣的行为。
效标可以分为两个层次，其一是理论水平的观念效标，其二是操作定义水平的效标测量。
4、常用的效标
（1）学业成就；（2）实际工作表现（3）特殊训练成绩（4）精神病诊断（5）等级评定（6）效标团体的比较（7）先前有效的测验
（二）构想效度（construct Validity）
1954年提出，有人翻译为构思效度，也有叫结构效度。它是指测验能够测量到理论上的构想和特质的程度，即测验的结果是否能证实或解释某一理论的假设、术语或构想，解释的程度如何。
（三）效标效度
1、定义：又称实证效度，反映的是测验预测个体在某种情境下行为表现的有效性程度。
空间想象能力 67 1 2 4 6 4 6 1 2 2 3 1 35 23
测验成绩
00403106308
一年后几何测 65 7 6 5 4 6 7 3 6 5 4 6 70 62
验成绩
02588282088
1 110011010011 1
5、效标效度的表示方法（1）相关法：
（2）命中率法
是当测验用来做取舍的依据时，用其正确决定的比例作为效度指标的一种方法。命中率的计算有两种方法，一是计算总命中率，另一种是计算正命中率。
（3）命中率法
效标成绩测验预测
成功（+）
失败（-） A（失误）
成功（+） B（命中）
失败（-） C（命中） D（失误）
总命中率:PCT

命中命中失误 100%

A
CB BC
100% D
正命中率 : PCP

效度的名词解释

效度的名词解释效度是一个常用的研究方法学概念，广泛应用于各个领域的研究中。

它对于评估和证实研究结论的可靠性和准确性至关重要。

本文将对效度进行解释，并探讨在不同领域中的应用。

一、效度的定义效度是指一个测量工具或方法是否能够有效地衡量出所关注的变量或概念。

换句话说，效度可以用来评估一个研究是否真正测量到了研究者想要探究的现象或属性。

在科学研究中，我们经常需要使用多个测量工具来衡量某个概念，而效度则可以帮助我们确定这些工具是否具有准确性和可靠性。

二、内在效度内在效度是指一个实验或研究是否能够准确地反映出因果关系。

内在效度的存在意味着研究结果能够被正确地推广到整个总体。

为了确保内在效度，研究者需要排除或控制其他可能导致结果偏差的变量。

例如，在医学研究中，为了确保内在效度，研究者会使用随机对照实验设计，以排除其他干扰变量对效果的影响。

三、外部效度外部效度是指一个研究结果在不同群体或情境下是否能够被推广。

外部效度的存在意味着研究结果与现实世界中的其他情境能够相吻合。

为了确保外部效度，研究者需要尽可能广泛地选择样本，以便能够代表整个目标群体。

例如，在心理学研究中，为了确保结果的外部效度，研究者会选择来自不同文化、不同年龄和不同社会经济背景的参与者。

四、建构效度建构效度是指一个测量工具是否能够准确地衡量出所关注的概念或属性。

建构效度的存在意味着测量工具能够捕捉到研究者想要研究的概念的整体特征。

为了确保建构效度，研究者通常会使用统计分析来验证测量工具与其他相关的变量之间的关系。

例如，在教育研究中，为了评估一个学习成就测量工具的建构效度，研究者可以将该测量工具与其他已经被广泛接受并且与学习成就相关的测量工具进行比较。

五、内容效度内容效度是指一个测量工具或方法是否能够包括所关注概念的全部维度或内容。

内容效度的存在意味着测量工具涵盖了所研究概念的多个方面，以便全面衡量。

为了确保内容效度，研究者通常会请专家或相关领域的专业人士评价测量工具中的各个项目是否涵盖了所关注概念的全部内容。

心理学里的效度名词解释

心理学里的效度名词解释心理学作为一门研究人类思维与行为的学科，依赖于各种实证研究方法来获取准确的数据，从而支撑理论的建立和推进学科的发展。

而在实证研究中，效度是一个重要的概念，用于评估测量工具或研究方法的可靠性和准确性。

本文将解释心理学中常用的几种效度概念，包括内在效度、外在效度、建构效度和预测效度，并探讨其在实证研究中的应用。

一、内在效度内在效度是指测量工具本身是否能够准确地反映出所要测量的现象或变量。

较高的内在效度意味着测量工具能够准确地捕捉到被测量的概念，反之则表示测量结果可能存在偏差或失真。

在心理学中，常用的衡量内在效度的方法包括对比测验、重测法和因子分析等。

例如，一位研究员希望衡量一个新开发的心理健康问卷的内在效度，可以通过与已有被广泛验证的心理健康测验进行对比测验，评估两者之间的相关度。

二、外在效度外在效度是指测量工具的结果是否与其他已经被接受的标准或者相关变量存在一定的关联性。

如果测量工具的结果与其他相关性高的变量存在显著的相关性，那么我们可以说该测量工具具有较高的外在效度。

常用的用以衡量外在效度的方法包括相关分析、回归分析和实验证实等。

例如，一位研究员想要验证一个新开发的学业成就测验的外在效度，可以通过与学生的平均学业成绩进行相关分析，评估两者之间的关联程度。

三、建构效度建构效度是指测量工具所衡量的概念是否与其所表征的概念相符合。

在心理学研究中，研究者常常需要设计或选用特定的测量工具来评估某个理论概念，这时建构效度变得尤为重要。

常用的衡量建构效度的方法包括因子分析、信度分析和共同方法偏差检验等。

例如，一位研究者希望验证一个新提出的幸福感测量工具的建构效度，可以通过对该工具进行因子分析，评估其维度结构是否和理论预期相一致。

四、预测效度预测效度是指测量工具对于预测某种结果的准确程度。

在心理学研究中，预测效度常用于评估某个测量工具对于预测未来行为或结果是否具有有效性。

例如，研究员设计了一个心理量表，用于预测大学生在毕业后对工作的满意度。

效度[教学教程课件

第七章效度
第一节效度的概述
一、效度的定义
效度是衡量测验结果有效性的重要指标，它是指一个测验是否能准确地测量出它所要测量的特质或功能的程度。
对于物理、化学等自然科学，效度的问题并不是很突出的，因为科学家们很清楚他的工具所测量的是什么。例如，天平，测到的肯定是重量；米尺，测到
的肯定是长度。但是在教育和心理的测量中，由于被测试的对象非常复杂，只能采用间接测量的方法，由此就产生了效度的问题。测量的有效性是良好测验的最基本条件，一个缺乏效度的测量是毫无价值的。
2、根据各项教材重点和各类行为改变的相对重要性而决定它们的权重。
3、编制一个命题双向细目表 4、根据命题双向细目表来编制测验。
A、成就测验的效标，可以是学年的平均成绩，教师的评定结果，学习量，对所学知识的应用能力，评判知识的批判能力，自学能力等等。
B、智力测验的效标，可以是学科的成绩，教师的评定结果，学生的总成绩等等。
（3）训练差异评定内容效度：先给一组被试进行先期测量，这组人必须对测验与包含的内容具有最少量的知识，然后让这组人参加训练活动，再给以后期测量，这样可以发现测验是否测量了课堂上所教的知识，如果后期测量的结果显著优于前期，就说明该测验对课程内容范围的测量是有效的。

第三节效标关联效度
效度的形式化定义是指与测验目的
有关的真实变异数 Sv2 和实得分数变异数 Sx2 之比，即效度。
rxy= Sv2 / Sx2
二、效度的种类
美国心理学会1974年发行的《教育和心理测验的标准》一书中将效度区分为内容效度、效标关联效度和结构效度。
内容效度是指测验的试题能否充分代表其所要测量的内容范围，它的检验方法一般是靠专家来评测。

效度是什么意思

效度是什么意思
效度（validity）是指所测量到的结果反映所想要得考察内容的程度。

测量结果和要考察的内容越吻合则效度越高，反之，则效度越低。

但信度高的测量工具未必具有高的效度。

效度是一种测量手段能够测得预期结果的程度。

从统计学角度可把效度定义为潜在真分数方差（垏）与实得分数方差（垑）的比率，效度与信度的关系为：信度是效度的必要条件，但不是充分条件。

一个测量的效度要高，其信度必须高，而一个测量的信度高时，效度并不一定高。

即测量工具确能测出其所要测量特质的程度。

效度是科学的测量工具所必须具备的最重要的条件。

在社会测量中，对作为测量工具的问卷或量表的效度要求较高。

鉴别效度须明确测量的目的与范围，考虑所要测量的内容并分析其性质与特征，检查测量的内容是否与测量的目的相符，进而判断测量结果是否反映了所要测量的特质的程度。

效度的名词解释

效度的名词解释效度是指一种测量工具或测试的准确性和有效性。

在心理学、教育学、社会科学和医学等领域，效度是评估研究方法和工具的重要指标。

本文将从效度的定义、类型、测量方法和影响因素等方面进行解释。

一、效度的定义效度是指测量工具或测试所测量的概念或现象的准确性和有效性。

简单来说，效度是指测量工具或测试是否能够准确地反映出所要测量的概念或现象。

例如，一份英语考试的效度是指它是否能够准确地反映出考生的英语水平。

如果一份英语考试的效度很高，那么它所测量的英语水平就会比较准确。

二、效度的类型效度可以分为内部效度和外部效度两种类型。

1. 内部效度内部效度是指测量工具或测试所测量的不同项目之间的相关性。

例如，一份数学考试的内部效度是指其中各个数学题目之间的相关性。

如果一份数学考试的内部效度很高，那么它所测量的数学能力就会比较准确。

2. 外部效度外部效度是指测量工具或测试所测量的概念或现象与其他相关概念或现象之间的相关性。

例如，一份英语考试的外部效度是指它与其他英语考试的相关性。

如果一份英语考试的外部效度很高，那么它所测量的英语水平就会比较准确。

三、效度的测量方法效度的测量方法有很多种，其中比较常用的方法有以下几种。

1. 内部一致性内部一致性是指测量工具或测试中的各个项目之间的相关性。

例如，一份数学考试中各个数学题目之间的相关性。

内部一致性可以通过计算各个项目之间的相关系数来进行测量。

2. 重测效度重测效度是指测量工具或测试在不同时间或不同场合下所测量的结果之间的相关性。

例如，一份英语考试在不同时间或不同场合下所测量的英语水平之间的相关性。

重测效度可以通过计算不同时间或不同场合下所测量的结果之间的相关系数来进行测量。

3. 交叉效度交叉效度是指测量工具或测试与其他相关测量工具或测试之间的相关性。

例如，一份英语考试与其他英语考试之间的相关性。

交叉效度可以通过计算不同测量工具或测试之间的相关系数来进行测量。

四、效度的影响因素效度的影响因素有很多，其中比较常见的因素有以下几种。

效度的名词解释

效度的名词解释
效度是指一个测试或测量工具的有效性和准确性。

在心理学、教育学、医学等领域中，效度是评估测量工具的重要指标之一。

它是指测量工具所测量的内容是否与被测量的现象相对应。

如果一个测量工具具有高效度，则说明它能够准确地测量出被测量的现象，从而可靠地评估人们的表现、能力、态度、情感等方面。

效度分为内部效度和外部效度两种。

内部效度是指测量工具的各项指标之间的相互关系，包括信度、稳定性、一致性等。

信度是指测量工具的稳定性和一致性，即测量结果的可靠性。

稳定性是指测量工具在不同时间、不同环境下所得到的结果是否一致。

一致性是指测量工具的各项指标之间是否相互协调和一致。

外部效度则是指测量工具与被测量现象之间的关系，包括相关效度、预测效度、构效度等。

相关效度是指测量工具所测量的内容与被测量现象之间的相关性。

预测效度是指测量工具能否准确地预测被测量现象的变化趋势。

构效度是指测量工具所测量的内容是否与被测量现象的内在结构相一致。

测量工具的效度是评估其是否具有正确性和准确性的重要指标。

一个测量工具的效度高，则说明它能够准确地测量出被测量的现象，从而可靠地评估人们的表现、能力、态度、情感等方面。

因此，在选择和使用测量工具时，必须考虑其效度，以保证测量结果的准确性和可靠性。

同时，在测量过程中，也应该注意对测量工具的效度进行监测和评估，以确保测量结果的正确性和准确性。

总之，效度是测量工具的一个重要指标，它关系到测量结果的准
确性和可靠性。

在选择和使用测量工具时，必须考虑其效度，并对其进行监测和评估，以确保测量结果的正确性和准确性。

效度的名词解释

效度的名词解释效度是指一种度量工具或测试的精确度和准确性，也可以理解为测量结果是否正确地反映了所要测量的现象或概念。

在心理学、教育学、社会科学等领域，效度是评估研究成果的重要指标之一。

效度分为内部效度和外部效度两种类型。

内部效度是指测量工具内部的一致性和稳定性，即测量结果是否在同一时间、同一人群、同一条件下具有一致性和稳定性。

例如，一个心理学测试工具在同一时间内进行多次测试，得到的结果是否相同。

外部效度是指测量工具的结果是否能够反映出所要测量的现象或概念，即测量结果能否与其他相关变量进行比较和验证。

例如，一个学习成绩测试工具是否能够准确地反映出学生的学习成绩，是否与其他相关变量（如学习时间、学习方法等）具有一定的关联性。

在实际应用中，我们需要使用各种测量工具和测试，如问卷、测试、观察等，来获取所要研究的数据。

而这些测量工具和测试的效度对于研究结果的准确性和可靠性有着至关重要的影响。

因此，研究者需要在研究设计和数据收集中充分考虑效度的问题。

如何评估一个测量工具或测试的效度呢？这需要我们使用一些方法来进行检验。

下面介绍几种常见的效度检验方法：1. 内部一致性检验：使用Cronbach's alpha系数来评估测量工具内部的一致性，即工具中各项之间的关联性。

Cronbach's alpha 系数越高，说明测量工具内部的一致性越好。

2. 测试重测信度检验：使用Pearson相关系数或Spearman相关系数来评估同一测试工具在不同时间内的测量结果之间的相关性。

相关系数越高，说明测试工具的稳定性越好。

3. 交叉效度检验：使用皮尔逊相关系数或Spearman相关系数来评估不同测试工具之间的相关性，即这些工具能否测量同一概念或现象。

相关系数越高，说明测试工具的外部效度越好。

4. 内容效度检验：使用专家评估或借助文献资料来评估测量工具的内容是否充分、准确地反映了所要测量的现象或概念。

总之，效度是评估研究成果的一个重要指标，影响着研究结论的可靠性和准确性。

效度的名词解释

效度的名词解释效度是指测量工具（如问卷、测试）所测量的内容是否与所要测量的概念或属性相关，或者说是否能够准确地反映出所要测量的内容。

效度是评价测量工具好坏的重要指标之一，它与信度一样，是心理学、教育学、社会学等领域研究中的重要概念。

在心理学中，效度被认为是测量工具的一个重要属性，它与信度一样，是评价测量工具好坏的重要指标之一。

效度可以分为内部效度和外部效度两种。

内部效度是指测量工具所测量的内容是否与所要测量的概念或属性相关。

在测量同一属性时，如果测量工具的测量结果与实际情况相符，那么这个测量工具就具有较高的内部效度。

因此，在设计测量工具时，需要确保其能够准确地测量所要测量的属性。

外部效度是指测量工具所测量的内容是否与其他相关变量相关。

在测量某一属性时，如果测量工具的测量结果与其他相关变量的测量结果相符，那么这个测量工具就具有较高的外部效度。

因此，在设计测量工具时，需要考虑与其他相关变量的关系。

除了内部效度和外部效度之外，还有一些其他类型的效度，如构效度、面向效度和预测效度等。

构效度是指测量工具所测量的内容是否能够准确地反映出所要测量的概念或属性。

面向效度是指测量工具所测量的内容是否能够涵盖所要测量的概念或属性的各个方面。

预测效度是指测量工具所测量的内容是否能够预测将来的行为或结果。

在测量工具的设计和使用中，要注意效度的问题。

如果测量工具的效度不高，那么测量结果可能会产生误导，从而影响研究的结论。

因此，在设计测量工具时，需要认真考虑效度的问题，确保测量工具具有较高的效度。

同时，在使用测量工具时，也需要注意效度的问题，避免因为效度问题而产生误导。

效度-基本概念、测量和解释

同时效度：诊断现状；预测效度：预测将来。
4、都是用简便的测验去预测个体行为，因此也成为效标预测效度。 5、效标污染：效标评定受到评定者知道测验分数的“污染”，即测验分数影响效标成绩。
效标污染会人为提高测验分数与效标之间的相关。
2012/5/28 效度：基本概念、测量和解释 16
6、效标度量一个测验有多少种具体用途，就可以根据多少种效标进行效度分析。评定任何情境中行为的任何方法，都为某种特定的目的提供一种效标度量。（1）智力测验的常用效标是学业成就。（2）能力倾向测验的常用效标是训练课程的成绩。
效度：基本概念、测量和解释
9
2、统计分析法（克伦巴赫相关法）（1）从统一教学内容总体中抽取两套独立的平行测验，用这两个测验来测同一批被试，求其相关。（2）若相关低，则两个测验中至少有一个缺乏内容效度；若相关高，则测验可能有较高的内容效度。
2012/5/28
效度：基本概念、测量和解释
10
（三）应用
1、内容效度能让我们回答教育成就测验效度的两个基本问题：（1）该测验覆盖了规定的知识和技能的代表性样本吗？（2）测验成绩不受无关变量影响吗？
2012/5/28
效度：基本概念、测量和解释
12
2、内容效度主要应用于成就测验（1）成就测验主要测量被试掌握某种技能或学习某门课程所达到的程度。题目取样的代表性是内容效度的主要考察方面。（2）使用语某些对员工进行选拔和分类的职业测验。（3）不适用于能力测验和人格测验。
效度：基本概念、测量和解释
18
（二）具体方法
1、相关法计算测验分数与效标测量之间的相关系数，包括积差相关、等级相关、二列相关、四分相关等。 2、区分法对照组、高分组&低分组 3、命中率

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

效標預測程序
• 根據工作表現的追蹤紀錄來作為效標必須注意的是，相似工作在不同組織中的性質通常有所差異，因此，在測驗指導手冊中根據工作效標所建立的效度資料不只應該描述所使用的特殊效度指標，還有工作者的職責內容。 • 以「對照組」來建立效度通常涉及綜合指標，它能夠反映出日常生活中無法控制之累積性選擇因素的影響。這種效標最終是以留存在特定團體中或者被淘汰為基礎。例如，音樂性向測驗的效度是比較音樂學校學生與一般學生來獲得。當然，選擇對照組時可以根據任何效標，例如，學業等第、評分或工作表現，我們只需要挑選位於效度指標分配兩端的對象即可。
效標預測程序
• 效度指標 • 建立測驗效度所使用的效標就像它的用途ㄧ樣多。 • 智力測驗最常用的效標是學業成就的指標，因此這類測驗通常被視為測量學業性向的工具。 • 各種學業成就的指標提供了所有教育層級的效標資料。另一種學業成就效標的形式就是個人已經完成的教育總數量。我們可以預期：一般而言，智力越高的人持續接受教育的時間越長。但是教育總數量和學業性向之間的關係並不是完美的。尤其在較高的教育水準上，經濟、社會、動機和其他非智力因素都可能影響個人是否持續接受教育。
描述內容的程序
• 特殊程序 • 訂定測驗規格(test specifications)。測驗的說明書內應該清楚地陳述測驗所涵蓋的內容領域或主題、所測試的教學目標或過程及相對重要性，以及每ㄧ主題的題數。此外，參予測驗編製的專家之人數及專業資格等訊息亦應當說明清楚。
描述內容的程序
• 其它實徵程序(量化分析)可以用來補充教育成就的內容效度包括 • 1.檢驗總分以及個別題目的表現隨著年級而產生進步的情形。 • 2.答題的錯誤類型分析或觀察受測者的工作方法。 • 3.檢驗速度之影響幅度可以計算無法完成測驗的人數 • 4.將測驗與無關因素求相關，以獲得無關因素的影響程度。例如為了釐清閱讀指導與能力所造成的無關影響，我們可以將測驗分數與閱讀理解的測驗分數求相關
建構確認程序
• 測驗的建構效度表示測驗可以測量理論建構或特質的程度。 • 建構的實例包括學業性向、機械理解、語文流暢性、行走速度、神經質和焦慮等等。每ㄧ個建構都是為了解釋和組織所觀察到的反應一致性。「建構」來自行為指標之間的互相關連。 • 建構效度的建立必須逐漸累積各種來源的訊息。任何資料若是有助於了解該特質之性質，以及對其發展和形成條件產生影響，都可以作為建構效度的適當證據。 • 以下將介紹確認建構的特定技術。
描述內容的程序
• 表面效度 • 表面效度表示：對於受測者、使用測驗的管理人員，以及其他未曾接受訓練的觀察者而言，測驗是否「看起來有效」。 • 表面效度並不能取代客觀方法所決定的效度。但可以增進受測者的在施測時的配合。
效標預測程序
• 同時效度與預測效度 • 效標預測程序可以指出：測驗能夠預測個人在特定活動之表現的有效性。根據取得效標和測驗分數的時間關係，將之區分為同時效度和預測效度。 • 同時效度在某種層次上的涵義是現有分類的診斷，而非未來結果的預測。 • 由於同時效度的效標總是在測驗當時就已經獲得，在這種情況下，測驗的功能究竟是什麼？基本上，這樣的測驗提供了比效標資料更簡單、迅速或者便利的替代品。
測驗效度概念的演進
• 測驗發展史目前的階段反映出兩種主要趨勢： • 1.理論取向逐漸受到重視 • 2.心理學理論密切地結合由實徵和實驗方法所進行的假設檢驗。 • 這些趨勢的結果之ㄧ，就是心理學家逐漸承認建構(construct)對於描述和了解人類行為的價值。建構是廣泛的類別，源自可以直接觀察之行為變項的共同特徵。它們存在於理論中，本身無法直接被觀察。
測驗效度概念的演進
• 建構效度被認定為涵蓋所有的基礎效度概念，因為它指明了測驗所測量的內容。內容和預測效度只是界定和了解建構的諸多訊息來源之二。 • 前述三個測驗發展階段所重視的效度分別稱為：內容效度、預測效度(效標關聯效度)、建構效度
描述內容的程序
• 性質 • 就本質上來看，描述內容效度程序就是：有系統地檢驗測驗內容，以決定它是否涵蓋了所欲測量之行為領域的代表性樣本。 • 我們必須有系統地分析所欲測試的行為領域，以便確保所有主要層面都被涵蓋在測驗題目中。
效標預測程序
• 效標污染(criterion contamination) • 避免效標受到測驗分數的影響，例如，如果大學教師或是工廠督導知道某一個人的性向測驗分數非常差，這項訊息可能就會影響他們給予這位學生或員工的成績或評分。效標污染可能會異常地提高測驗分數與效標的相關，因此必須避免。
效標預測程序
• 在其他類型的效標當中，值得注意的是學校教師、特殊課程的老師以及工作督導的評定(ratings)。 • 評定幾乎可以用在各類測驗的效度建立。它們尤其適合做為性格測驗的效標，因為在此一領域中比較難找到客觀的效標。尤其對於明顯的社會性特質而言，以個人接觸為基礎的評定就邏輯上來看是最合理的效標。
效標預測程序
• 對照組經常用於性格測驗的效度建立。例如在建立社交性特質測驗的效度時，可以比較業務或行政人員的測驗表現與文書人員或工程師的測驗表現。其背後隱含的假設是：進入且持續留在業務或行政工作的人，再社交性特質上屬於特別傑出的一群。 • 職業團體通常用來建立興趣測驗的效度，例如史氏職業興趣表格(Strong Vocational Interest Blank, SVIB)
建構確認程序
• 因素分析(factor analysis) • 是ㄧ種確認心理特質的方法，尤其與建構確認的程序有十分密切的關連。 • 舉例來說，如果對ㄧ群人實施20項測驗，第一個步驟就是計算各測驗之間的相關。在檢驗190個相關系數組成的列表之後，可以顯示出測驗所形成的集群，這就表示共同特質存在。
效標預測程序
• 在發展特殊性向測驗的時候，通常使用的效標是特殊訓練的表現。例如，機械性向測驗可以依據實習課程的最後成就來建立效度。 • 在針對特殊測驗計畫所特別設計的測驗裡，訓練記錄是常用的效標資料來源。例如，空軍飛行員甄選計畫的效度便是根據基本飛行訓練的表現所建立。
效標預測程序
• 多元性向測驗組通常以高中或大學課程的成績為準，以便確定其區分預測效度。例如，語文理解測驗的分數可以和英文成績互相比較，空間視覺化分數則和幾何成績比較，其餘依此類推。 • 最終效標(ultimate criterion)通常需等待相當長的時間才能獲得，有時候甚至不存在所謂的最終效標，例如戰鬥表現(若沒有發生戰爭，哪來的戰鬥表現？)。因此，通常採用所謂的中途效標 (intermediate criterion)，例如各階段訓練之表現紀錄。
Chapter Five
效度：基本概念
• 測驗效度的重點在於測驗究竟在測量什麼以及測量結果有多好。 • 它告訴我們：從測驗分數可以推測什麼東西。 • 基本上，所有建立測驗效度的程序都涉及了測驗表現與其他相關行為特徵之獨立觀察事實之間的關係。
測驗效度概念的演進
• 測驗最早的用途之ㄧ，是評量個人在特定內容領域中的學習效果。例如學校的期末考等，這類測驗ㄧ般稱為成就測驗，通常在檢驗其效度時是將測驗內容與原先所要評量之內容領域加以比較。 • 測驗發展的下一個階段重點轉為預測。不同的人在目前或未來的特定情境中會有何反應？測驗所欲測量的目標行為之表現稱為效標(criterion)。預測用途的測驗效度通常是測驗分數與直接測量該效標的獨立指標之間的相關係數。因此，對於機械性向測驗而言，其效標可能是未來擔任機械技師的工可以回答成就測驗效度兩個基本問題 • 1.該測驗是否涵蓋特定技能或知識的代表性樣本？ • 2.測驗表現是否合理地排除無關變項的影響？ • 由於領域參照測驗的解釋必須根據其內容意義來解釋，因此內容效度適用於這類測驗。
描述內容的程序
• 內容效度也可以應用在員工甄選和分類的職業測驗中。如果該測驗是實際的工作樣本，或是從事該工作時所需的技能和知識，就適合使用內容效度。在這種情況下，我們必須進行徹底的工作分析(job analysis)，以便證明工作中的活動與測驗的相似性。 • 但是性向測驗和性格測驗並不適合使用內容效度。 • 性格測驗和性向測驗不同於成就測驗，因為前者並不是以特定教學課程為基礎來進行測驗內容的抽樣。因此，對性格或性向測驗而言，人們在回答相同測驗題目時，所經歷的工作方法或心理歷程有更大的差異，相同測驗可能在不同的人身上測量到相異的功能。在這種情況下，我們根本無法由測驗內容去決定它所測量的心理功能。
效標預測程序
• 新測驗和現有測驗的相關通常也被引用為效度的證據。如果新測驗比現有測驗更簡短或簡單，則後者就可以當作效度指標。 • 因此，紙筆測驗可能根據已經建立效度、但是較為複雜耗時的作業測驗來建立效度。或者團體測驗可以根據個別測驗來建立效度。
效標預測程序
• 效度類化 • 考慮測驗對於不同團體的預測效度是否都具有一定的高水準。 • 有研究指出，語文、數字推理性向測驗的效度可以類推到先前所確認的其他職業。顯然，各種職業任務之成功表現的共同核心集中在認知技能。
建構確認程序
• 發展變化 • 許多傳統智力測驗所使用的主要效標就是年齡區辨。我們預期某種能力在兒童時期會隨年齡而增強，因此如果測驗是有效的，測驗分數應該顯示出同步的增進。 • 第三章皮亞傑之次序量表，在建立效度時也是以發展分析為基礎。達到早先階段是學習較晚之概念技能的先決條件。
建構確認程序
建構確認程序
• 聚合效度(convergent validity)和區辨效度 (discriminant validity) • 為了證明建構效度的存在，我們不只要顯示：測驗分數與理論上應該有關的其他變項呈現高相關(即聚合效度)，而且它不應該與無關變項產生顯著相關(即區辨效度)。 • 使用多重特質-多重方法矩陣來獲得聚合效度與區辨效度的證據。表5-1