第四章效度

合集下载

心理测量—效度

M3 攻击性 0.14 0.82 0.16 0.13 0.61 0.23 0.30 智力 0.21 0.01 0.72 0.06 0.19 0.52 0.49 0.36
相同特质不同测量方法之间的相关（会聚效度）相同方法测量不同特质的相关（区分效度）不同方法测量不同特质之间的相关
（3）因素分析
因素分析将为数众多的观测变量缩减为少数不可测的潜变量（因素），即用最少的因素概括和解释最大量的观测数据。
年龄差异只是效度的一个必要条件而不是充分条件。
教育与训练效应
有效的教育与训练会提高被试的某种特质水平，这种变化应在测验分数中体现出来。
4.对构想效度的评价
贡献
把着眼点放在提出假设、检验假设上，因此使心理测验不再只是做决定的辅助工具，同时还成为发展心理学理论的重要工具。
缺点
有些构想概念模糊，缺乏统一的定义。确定效度时没有明确的操作步骤与程序。没有单一的数量指标来描述有效的程度。
如果后测成绩有较大提高，说明测验确实测量了所教授的内容，测验的内容效度较好。
（4）经验法
检查项目分数和测验总分随年级升高的变化情况，一般而言，应保留从低年级到高年级学生通过的百分比增加最大的那些项目。
分析学生所使用的各种解答方法以及测验中常见的错误。
计算测验分数与阅读理解分数的相关，检查阅读指导语的能力对测验成绩可能产生的无关影响。
3.内容效度的特点
（1）内容效度的特定性测验的内容效度与测验的编制者所定义的
内容范围有关。
（2）内容效度常与表面效度混淆
表面效度（Face validity）是在受测者、没有受过训练的观察者看来这个测验是否有效。
注意：
表面效度会影响被试的测验动机，适当的表面效度会让被试觉得测验是有意义的，也会更加配合测验实施。

《心理测量学》复习思考题答案

(0076)《心理测量学》复习思考题答案第一章心理测量概述一、解释1．测量：按照一定法则给事物指派数字。

2．心理测验：实质上是行为样本的客观的和标准化的测量。

3．量表：具有参照点和单位的用以测量某种事物以确定其数量的连续体。

二、填空1．/2．无论是物理特性的测量，还是精神特性的测量，都必须具有（参照点）和（单位）两个要素。

3．量表可以分为（类别量表）、（等级量表）、（等距量表）和（比率量表）四级水平。

4．要求被试按平时的习惯作出反应而无正确答案的测验称为（典型行为测验）。

5．以预先确定的教学内容为标准，考查被试对于指定的教学目标中的内容或技能掌握程度的测验称为（目标参照测验）。

三、单项选择1．心理测量的参照点是（①）。

①人定零点②绝对零点③人定零点和绝对零点④不能确定2. 一般而言，心理测验的分数属于（②）。

①类别量表②等级量表③等距量表④比率量表3．狭义的心理测量是指以（②）为工具的测量。

]①调查②测验③实验④口试四、判断分析1．心理测量主要用于对人的精神特性的直接测量。

（×）分析：人的心理行为变化无法直接测出，只能通过个人在活动中（具体讲就是对测验题目）的反应来间接推断人的某种精神特性的状况。

2．由于心理测量属于等级量表，因而在应用中只能使用等级量表适用的统计方法。

（×）分析：虽然心理测量属于等级量表，但在应用时可以采取变通的方式：①假设量表上的单位是相等或近似相等，其前提是常态分布的假设；②把测验分数转换到一个有相等单位的量表上，即把原始分数转换成标准分数。

这样就可以使用等距量表的统计方法。

3，在对心理测验进行区分时，应主要看编制者的目的和测验的实际内容。

（√）分析：由于测验的编制者给要测量的特性所下的操作性定义不同，因而区分测验时不能只看测验的名称，而应主要看编制者的目的和测验的实际内容。

五、简答1．心理测量的特点是什么&答案要点：①心理测量没有绝对零点，只有人定零点。

第四章教育测量的质量指标-效度

– 评分一致性考查法（不同评分者之间评分的一致性程度，即考查评分者信度）
– 前后测对比法（根据前后两次测验的差异显著性，确定测验的内容效度）
（二）结构效度的验证方法
• 结构效度是指一个测量能实际测量出理论上的构想或心理特性的程度。它的目的在于用心理学的概念来说明分析测验分数的意义，也就是说从心理学的理论观点就测验的结果加以解释和探讨。
二列相关
• 适用于两个变量就其实际含义而言是等距或等比数据，它们服从正态分布，
其中一列人为地划分为两类。
rb
Xp Xq St
pq y
公式 (2-5)
Xp或Xq是二分名称变1量 ”中或0“ ”相对应的连续平变均量数的
St是该例连续变量量全值部的变标准差。 p是二分称名量表的中次一数种占总次数比的， q百＝1分－p。
– 效标效度，也称为效标关联效度，也称为实证效度
– 验证方法是指一个测验对处于特定情境中的个体行为进行预测时的有效性
– 例：
• 高考成绩预测大学学习成绩 • 能力倾向测验预测工作成效
（三）效标关联效度的估计方法
– 分类：
• 同时效度：测验分数与效标资料的取得约在同一时间内连续完成，这两种资料的相关系数即为同时效度
所以可以将效度rxy定义为
潜在真分数方差（
V2）实得分数方差（
2）之比，
x
即：rxy
V2
2 x
2 x
(
2 I
2 E
)
2 x
1
2 I
2 E
( 公式2 3)
2 x
rxx
2 I 2 x
2、效度与信度的关系
根据公式（2-2）和（2-3），可将效度与信度的关系图解于后：

第4章测量的信度与效度

2 2 X T2 E
实得分数的方差等于真分数的方差与误差方差之和。
调研人员应运用所掌握的统计知识，分析其是属于系统误差还是属于随机误差。系统误差会使调查结果有误，所以应尽量避免。随机误差可通过提高样本代表性、增大样本量来减少。
信度一般规定是：真分数的方差在总体方差中所占的比重，即信度系数：
当题目间的相关系数越大时，α系数也会越大。当题目数目n越多时，S
2 H
n 值越大，越接近于0， 2 SH n 1
2 S i
越接近于1，故α系数也会越接近于1。
要做信度分析须先检查每个题目是否都是同方向的，即都是正面问法，反向问题需要做处理后才可以加入分析。
在计算α系数时，应该注意有些调查量表测量的内容包含几个领域，这时宜分别计算各个领域的α系数。克朗巴哈α系数适用于项目多重计分的测验数据或问卷数据，可以用该系数测量Likert量表的信度。在基础研究中，信度至少应达到0.8才可接受；在探索性研究中，信度只要达到0.7就可以接受；在旅游调查测量实践中，信度只要达到0.6即可接受。 α系数通常与量表题目数量有关，题目数量越多，α系数就越大。
理想（甚佳，信度佳（信度高）很高）非常理想（信度非非常理想（甚佳，常好）信度很高）
二、克朗巴哈 α系数的手工计算
以一份有8个题项的量表为例，8个题项均为正向题，受试样本数有6位，采用Likert 5点量表填答，获得调查结果如下表：
题号样本
量表试题
01 5 5 5 5 5 4 02 1 1 2 1 1 1 03 2 2 2 2 2 1 04 5 4 5 5 5 5 05 2 3 3 3 3 3 06 5 5 5 5 5 4 07 4 5 5 5 5 4 08 3 2 2 3 2 2 总分 27 27 29 29 28 24

效度的名词解释

效度的名词解释
效度是指一个测试或测量工具的有效性和准确性。

在心理学、教育学、医学等领域中，效度是评估测量工具的重要指标之一。

它是指测量工具所测量的内容是否与被测量的现象相对应。

如果一个测量工具具有高效度，则说明它能够准确地测量出被测量的现象，从而可靠地评估人们的表现、能力、态度、情感等方面。

效度分为内部效度和外部效度两种。

内部效度是指测量工具的各项指标之间的相互关系，包括信度、稳定性、一致性等。

信度是指测量工具的稳定性和一致性，即测量结果的可靠性。

稳定性是指测量工具在不同时间、不同环境下所得到的结果是否一致。

一致性是指测量工具的各项指标之间是否相互协调和一致。

外部效度则是指测量工具与被测量现象之间的关系，包括相关效度、预测效度、构效度等。

相关效度是指测量工具所测量的内容与被测量现象之间的相关性。

预测效度是指测量工具能否准确地预测被测量现象的变化趋势。

构效度是指测量工具所测量的内容是否与被测量现象的内在结构相一致。

测量工具的效度是评估其是否具有正确性和准确性的重要指标。

一个测量工具的效度高，则说明它能够准确地测量出被测量的现象，从而可靠地评估人们的表现、能力、态度、情感等方面。

因此，在选择和使用测量工具时，必须考虑其效度，以保证测量结果的准确性和可靠性。

同时，在测量过程中，也应该注意对测量工具的效度进行监测和评估，以确保测量结果的正确性和准确性。

总之，效度是测量工具的一个重要指标，它关系到测量结果的准
确性和可靠性。

在选择和使用测量工具时，必须考虑其效度，并对其进行监测和评估，以确保测量结果的正确性和准确性。

第4章效度

二、内容效度的确定方法
（一）逻辑分析法：专家评定(p175) 根据自己的知识经验对量表的有效性（逻辑性）作出判断，也称逻辑效度。为使内容效度的判断过程更客观，一般采用下列步骤： ①确定测验内容的总体范围； ②编制双向细目表； ③编制评定量表，从测验内容所测的技能、题目对所定义的范围的覆盖率、各种题目数量和分数的比例以及题目形式的适当性等方面，对测验作出总的评价。
因素分析案例
公因子 F1 Z1=代数1 0.896 公因子 F2 0.341 共同度 hi2
Z3=几何 Z4=三角
0.802
0.516 0.841
0.496
0.855 0.444
0.889
0.997 0.904
0.111
0.003 0.096
Z5=解析几何
第四章效度
第一节效度概述
一、什么是效度（一）定义 1、效度（validity）是指一个测验或量表实际能测出其所要测的心理特质的程度。（1）效度是一个相对的概念：每个测量工具都有自己的目的；内隐特质是通过外显行为间接测得的；（2）效度是测量的随机误差和系统误差的综合反映；（3）判断一个测量是否有效要从多方面收集证据。
第七节因素分析
• 1904，斯皮尔曼，《客观决定和测量一般智力》，用因素分析技术研究智力结构。标志着因素分析方法的诞生。 • 运用此方法，心理学家探索出多种智力理论。如：群因素论、三维结构智力模型。（探索性因素分析） • 20世纪60年代后期，统计学家波克等人在研究因素分析模型中参数的假设检验问题时，发展出验证性因素分析。 • 1973年，乔纳斯柯格创立了验证性因素分析，运用因素分析检验假设成为可能。
（二）区分法测验→工作→准则测量（工作成绩）按工作成绩分高低两组，如工作成绩高，测验得分也高；工作成绩低，测验得分也低，说明该测验是有一定效度的 1、差异性检验 2、重叠量的计算见P184

第四章_心理评估

人的心理活动是复杂多样的，要想客观、准确地了解人的心理特质，最科学的方法是心理评估。

心理评估可作为人的心理品质及行为健康与否的重要评价手段。

对评估出有心理健康问题的人群，根据心理问题的程度和临床表现，采取相应的心理咨询或者心理治疗。

同时，学会心理评估的方法有助于临床护士在护理患者的过程中为患者制订有效的心理护理措施。

第一节心理评估概述(一)心理评估的概念心理评估是依据心理学的理论和方法对人的心理品质及水平所作出的全面、系统、深入和客观的描述与鉴定。

所谓心理品质包括心理过程和人格特征等内容，如情绪状态、记忆、智力、性格等。

心理评估是心理咨询和心理治疗的重要前提和依据，也是对心理咨询及治疗效果进行判断的主要手段。

心理评估用于临床则称为临床心理评估。

(二)心理评估的基本程序依据心理评估的目的不同，心理评估的具体程序也有所不同。

但是，心理评估的基本程序是类似的。

(1)要确定评估的目的，明确评估所要达到的目标。

. (2)详细了解被评估者目前的心理问题，了解心理问题产生的原因及发展变化的状况、可能的影响因素。

主要生活经历、家庭背景等。

在这个过程中，主要应用调查法、晤谈法和观察法等. (3)要对被评估者的重要心理问题深入了解和评估。

这个过程通常要应用心理测验的方法。

最后要将评估获得的资料或者数据进行分析、处理、得出评估结论。

(三)心理评估的常用方法1．观察法观察法是心理学研究中最基本的方法，也是心理评估的基本方法之一。

观察法是指评估者通过对被评估者可观察的心理现象和行为表现，进行有目的、有计划的观察和记录而进行的评估。

观察的结果需要经过科学而正确的描述，并加以“量化”o在心理评估中观察的内容包括被评估者的仪表、面部表情、人际交往风格、言行举止、注意力、兴趣、爱好、各种情境下的应对行为等。

观察法的优点是观察所采集的资料比较客观真实、方法简便、易于操作，应用范围广泛。

其不足是观察指标不易定量，标准难以统一。

2．晤谈法晤谈法是通过与被评估者晤谈，了解其心理信息，同时观察其在晤谈时的行为反应，以补充和验证所获得的资料，进行描述或者等级记录，以供分析研究的心理评估方法。

第四章测量的信度与效度

（3）结构效度通过测量什么、不测量什么的证据积累起来给以确定的，因而不可能有单一的数量指标来描述结构效度。
结构效度主要应用于智力测验、人格测验等一些心理测验方面。
2.结构效度的确定确定结构效度的基本程序第一，对所研究的心理特质的结构进行界定第二，依据理论框架，提出可能的假设第三，收集数据，验证假设
③考察测验的同质性。
④因素分析的方法 ⑤结构方程的方法
（2）测验间法通过对几个测验的比较研究，找出它们所测的共同特质，
这样便可以确定这些测验是否具有结构效度。 ①相容效度：计算被试在新旧两个同类测验上的分数的
相关。如果相关高，则说明两个测验测的是相同的特质。 ②区分效度：一个有效的测验不仅与其它测量同一构想
（二）结构效度（construct validity） 1.结构效度的含义、特点与应用范围结构效度是指一个测验实际测到所要测量的理论结构和
特质的程度，或者说测验分数能够说明测量的理论结构和特质的程度。
结构效度有如下特点：
（1）结构效度首先取决于事先假定的心理特质的结构理论
（2）当实际测量的资料无法证实事先的理论假设时，并不一定就表明该测验结构效度不高。
测量随机误差大，测量结果就会与真分数发生较大偏离。 ➢ 信度是衡量一个测验好坏的重要指标之一，测验的信度达
到多少才可以接受呢？一般来讲，能力与成就测验的信度应该在0.90以上，人格测量信度系数应该在0.80 以上。 ➢ 测量中的系统误差与信度无关。
➢ （二）解释分数
➢ 1. 解释个人测验分数的意义 ➢ 从理论上讲，一个人的真分数本来是用同一测验对他反复
向细目表对照 ③制订评定量表，考察题目对所定义的内容范围的覆盖
率、判断题目难度与能力要求之间的差异等。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1、测验内部寻找证据法
（1）确定内容效度作为结构效度的证据例如，编制语文能力测验时，编制者将总体内容
描述为对词汇下定义、对语言做类比推理、以及在句子中正确运用文字的能力，这在实际上就是给“语文能力”的构想下了定义。（2）分析被试的答题过程
例如，在人格测验上有这样一些题目：“当事情不顺我意时，我时常动怒。”“我总避免批评别人的言行。” （3）通过计算测验的同质性信度来检验结构效度
实证效度是指一个测验对处于特定情景中的个体的行为进行估计的有效性
一、内容效度
定义：内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。
适用于成就测验、选拔和分类的职业测验，不适于能力倾向测验和人格测验。
注意与表面效度的区分
能力
积极的行为指标
1、同情形成使病人安全的气氛；
心及敏严肃地对待病人，对其医疗保密；
二、教材內容(以纵轴表示) 以出题的范围，表示出包含几个不同的单元。
以台湾学校教育文科为例
知识理应分综评总和解用析合价
唐诗 8 8 4 4 2 2 28 文言文 6 4 6 4 2 2 24
新诗 8 6 4 4 2 2 26 散文 6 4 6 2 2 2 22 总和 28 22 20 14 8 8 100
以相同方法测量不同特质所得的分数之间的相关应较低，
以不同方法测量不同特质所得的分数之间的相关应最低。
若合乎上述的情形，即表示这套测验同时兼有相容效应和区分效度，这是考验构想效度的新途径。
语文理解
数学推理
一般常识
言语测验
操作测验
教师评定
资料来自于Mosher（1968）的一项研究报告，他假设了三种不同结构，名为“性罪恶感”、“敌对罪恶感”和“道德良心”，使用了是非判断、迫选和完成句子多种测验方法对62名女性被试样本施测。
三、效度与信度的关系
根据公式S2X=S2V+S2I+S2E，可以得到信度与效度的关系如下： 1、信度高是效度高的必要而非充分条件 2、测验的效度受它的信度制约
信效度关系
S
2 X
SV2
S
2 I
S
2 E
ST2
S²E↓， S²T↑， rxx↑
信度高，给 S²V 增加提供可能 – 能否提高效度，再看S²I大小 – 信度高不一定效度高
感性
快速理解病人的情绪和心情；
医
……
生
2、沟通显示主动倾听的技能；
职
技巧
不是以恩人的态度出现；
业
在方法上有信心；
要求
……
3、临床相信你的临床判断；
专业技临床能力；
术
提供预想的照顾；
……
内容效度与表面效度的区别
（1）表面效度是由外行对测验做表面上的检查确定的，而内容效度是由够资格的判断者（专家）详尽地、系统地对测验评价而建立的。
（5）发展水平的变化许多智力量表的效度验证都使用了智力的年龄差异这一
特点。
（6）实验操作
根据不同测验具有不同的特性，我们可以预期经过某种实验处理之后将会发生哪些变化，以此推测测量某个心理结构的测验的结构效度。
比如说，我们可以预期，将某个人放在容易产生焦虑的环境中，其焦虑测验得分会有所变化。如果预期得到证实，就说明这个测验有结构效度。这种方法实际是要比较实验处理前后测验得分的差异。
一个测验要有效必须具备以下几点：
1）效度系数显著地大于0，即同一特质的各种不同测量应有正相关；
2)以不同方法测量同一特质的相关必须高于不同的特质用同一方法来测的相关。也就是说，特质的差异必须比方法的差异更重要；
3)效度系数必须高于不同特质用不同方法测量所得之相关。
其他考察结构效度的方法
1、逻辑分析法
含义
– 专家按测题和假设内容范围作出的符合度判断
作法与程序
– 明确欲测内容的范围 – 与双向细目表对比； – 制定评定量表；
局限
– 无良好的数量指标描述这种符合性的程度； – 不同专家对同一测验内容效度的判断可能不一致； – 不同专家对内容范围会有不同的理解
双向细目表（举例）
一、教学目标(以橫轴表示) 以Bloom所提的认知领域六个教学目标为依据：知识、理解、应用、分析、综合、评价。
1。寻找测验依据的理论定义：全美智力落后协会（AAMD）对适应行为的定义是：个体实现
人们所期待的与其年龄和文化群相适应的个人独立与社会职责的程度和功效。 2。根据理论定义提出假设：
比如，随着年龄增长，适应行为得分应逐步提高；弱智儿童和正常儿童相比，前者的适应行为显著弱于后者；儿童的适应行为表现与其所处的社会经济、文化背景有关。 3。搜集资料，验证假设
（三）搜集结构效度资料的方法
结构效度无单一的效度指标，要从多方面的资料来源，经过长期的、艰苦的搜集和积累证据资料的过程，才能逐步验证测验的结构效度。常用于搜集结构效度资料的方法有如下几种。
1、测验内部寻找证据法 2、测验之间寻找证据法 3、考察测验的实证效度法 4、多种特质——多种方法矩阵 5、发展水平的变化 6、实验操作
2、统计分析法
信度指标——复本信度
复本1
复本2
✓r高：内容效度 ✓r低：至少一个缺乏内容效度
被试团体
3、再测法
前测
后测
被试经过预测知识的教学
内容效度的评价
内容效度不但是评价学绩测验的最适合的方法，而且编制任何测验都要加以考虑的方面。
它的主要缺点是缺乏理想的数量指标，因而妨碍了信息交流和各测验间的相互比较。
1966年美国心理学会在《教育心理测验值标准》中将效度分为三大类： 1．内容效度（Content Validity）
内容效度指测验实际测到的内容与所要测量的内容之间的吻合程度。 2．结构效度(Construct Validity)
结构效度是指测验对于被称作构想的某一理论概念或特质测量的程度。 3．实证效度(Criterion related Validity)
例如，MMPI中有这样的题目：“我的喉咙里总好象有一块东西堵着似的。”
（2）表面效度不是效度的客观指标，但能对受测者的动机产生影响，因而也会影响到效度。
最高行为测验要求有较高的表面效度，典型行为测验却要求较低的表面效度。
1、逻辑分析法 2、统计分析法 3、再测法
内容效度的评估方法
内容效度的评估方法
对结构效度的评价着眼点放在提出假设、检验假设上，因此使心理测验不再只是作实际决定的辅助工具，同时还成为发展心理学理论的重要工具，从而使测验有了更广阔的发展前景。
缺点：有些构想概念模糊，缺乏一致的定义。确定效度时没有明确的操作步骤与程序。结构效度是通过对测验测量什么、不测量什么的证据加以积累确定的，因而没有单一的数量指标来描述有效的程度。
相容效度可看做是同时效度的一种
（二）效标
效标就是衡量一个测验是否有效的外在标准，它是独立于测验并可以从实践中直接获得我们所感兴趣的行为。
需注意的知识点：
观念效标效标测量
在测验手册中报告实证效度时，不但要说明使用说明作为效标，还要说明这些效标来自说明团体。
乘法 0.10 0.70 0.30 0.85 0.01 0.49 0.09 0.26 0.15
3、考查测验的实证效度法
其一，根据效标把人分成两类，考查其得分。其二，根据测验得分把人分成高分组和低分
组，考察这两组人在所测特质方面是否确有差异。
（4）多种特质——多种方法矩阵法
坎贝尔和费司克（1959）
效度要高，S²V须占较大比重，S²T↑ – 效度高，信度必高
SV2
SI2
SE2
ST2 SX2
SV2
SI2
SE2
ST2
SX2
SV2
SI2
ST2
SE2
SX2
rx↑y rxx↑ rx↓y rxx↑ rxy↓ rx↓x
2.测验的效度受它的信度制约
信度系数的平方根是效度系数的最高界限根据效度和信度的定义（r2xy= S²V/ S²X， rxx=
三、实证效度
（一）实证效度的含义、种类及作用
定义：实证效度是指一个测验对处于特定情景中的个体的行为进行估计的有效性。也称为效标关联效度。
被估计的行为是检验测验效度的标准，简称效标。
根据效标资料搜集的时间差异，实证效度可以分成同时效度和预测效度两种。有人把二种效度都称为预测效度，并把测验称作预测源。
S²T/S²X ）以及S²T= S²V + S²I
可得r2xy= （S²T - S²I ）/ S²X= rxx- S²I/S²X ） S²I>0 r2xy< rxx
第二节效度的估计
要确定测验在解决某方面问题时的效度，需要收集充分的客观事实材料和证据，这种收集大量资料和证据来检验测验效度的工作过程就叫做效度验证。
实质上是相容效度法和区分效度法的综合运用
原理是若用多种极不相同的方法测量同一种特质相关很高，则说明测量效度较高（相容效度即属此类）。
从理论上看，测验的结果应与其所要测的特质有显著相关而与其他不相干的特质无关。
以相同方法测量相同特质所得的分数之间应具有最大的相关，
以不同方法测量相同特质所得的分数之间应具有次大的相关，
– 通过缩减变量的方法，用反映变量本质联系的少数几个基本因素（或公共因素）来说明先前需要用较多变量才能说明的原因或特性。
100名学生在9个不同学科间的相关系数
两个假想测验的因素效度及其变异来源
测验共同因素负荷信
作用比例
度
系
言数字推数言数推理特误