统一构念效度及其特性

合集下载

论心理学构念及其测量效度的估计

论心理学构念及其测量效度的估计论心理学构念及其测量效度的估计【作者】李朝旭/李竹琴〔内容提要〕本文试图澄清学界长期以来对“心理学构念”不够准确的模糊认识，并讨论了构念效度及其估计方法。

笔者认为，构念效度在心理学研究中扮演着非常重要的角色，尤其是在社会心理学领域的研究中。

对于一个特定的量具而言，有两类资料可以作为其构念效度的证据，一是关于所测构念的本质的资料，一是关于该构念影响因素的资料。

〔关键词〕构念心理学构念构念效度构念效度的估计对于心理学的学科性质，中国人一直在争论不休，至少已经辩论了半个世纪的时间。

现在，国家教委最终把心理学类专业确定为理科专业（专业类别代码为0715）[1][2]，从此以后，心理学专业和应用心理学专业的本科毕业生应授予“理学士”学位，而不再是“教育学学士”学位。

我们认为心理学之所以被视为理科专业的原因之一，是与心理学研究中对测量、统计的高度重视分不开的。

哲学家探讨形而上学的问题时，他们无须依赖测量技术；文学家激昂文字时，也用不着测量；唯独心理学家无论在哪一个分支的研究中，大都要对所探讨的心理学构念进行操作化、数量化，然后再借助统计手段来分析。

然而，我国心理学研究的现状并非如此理想化，存在着的一个主要问题就是仍有某些研究的构念不清晰、测量效度不高。

那么，什么是构念呢？构念效度的确切涵义又是什么？如何对一个心理量具的构念效度进行估计？一何谓构念“构念”这一概念是与构念效度的提出有密切关系的。

“构念效度”在英文中是construct validity，最早出现于美国心理学会（1954）制定的《心理测验与诊断技术的技术推介》（即《教育与心理测验标准》的初版）之中，翌年由克龙巴赫（L.J. Cronbach ）和米尔（P. E. Meehl）两人在一篇经典性的文章中系统地提出这一概念[3]。

国内心理学界及教育测量学工作者在引进“构念效度”这一术语时，形成了两种有代表性的译法，即以郑日昌（1987）[4]、王重鸣（1990）[5]为代表的一部分学者主张译作“构想效度”或“构思效度”（“建构效度”的译法也属于这一类），而以戴忠恒（1987）[6]、王汉澜（1987）[7]为代表的另一部分学者主张译作“结构效度”。

效度的标准 -回复

效度的标准-回复效度的标准是评价一个测量工具是否能够准确地衡量所要测量的特质或概念的程度。

它是心理学研究中非常重要的概念，因为一个测量工具的效度决定了它的信用度和可靠性。

在本文中，我们将逐步回答关于效度的标准的问题，并解释如何评估一个测量工具的效度。

一、内容效度内容效度是指测量工具是否能够全面和准确地反映出所要测量的特质或概念。

它关注测量工具中包含的所有项目是否反映了所要测量的特质的各个方面。

评估内容效度的常用方法是专家评议法。

在这种方法中，专家们会对测量工具的项目进行评估，确定每个项目是否包含了特质的相关方面。

他们的意见和反馈将用于决定测量工具是否具有良好的内容效度。

二、构念效度构念效度是指测量工具是否能够衡量所要测量的特质或概念，以及与其他相关特质或概念之间的关系。

评估构念效度的方法之一是相关效度。

这种方法通过与测量工具所要测量的特质有关的其他已经被广泛研究的特质进行比较，来确定是否存在相关关系。

如果两个特质之间存在显著的正相关或负相关关系，那么可以认为测量工具具有良好的构念效度。

三、判准效度判准效度是指测量工具是否能够与其他已经被广泛接受的测量工具进行比较，以确定它们之间是否存在一致性。

这种效度可以通过与其他测量同一个特质的工具进行相关性研究，来评估测量工具的准确性和一致性。

如果测量工具与其他被认可的工具之间存在高度显著的相似性，那么可以认为它具有良好的判准效度。

四、预测效度预测效度是指测量工具是否能够预测未来的行为或结果。

它可以通过与所要预测的特质或概念相关的相关变量进行比较来评估。

如果测量工具能够准确地预测未来的行为或结果，那么可以说它具有良好的预测效度。

以上是关于效度的标准的简要介绍。

要评估一个测量工具的效度，需要考虑其内容效度、构念效度、判准效度和预测效度。

不同的效度标准在不同的研究领域有不同的重要性和适用性。

因此，在选择和使用测量工具时，研究者应根据研究目的和领域的需求，合理选择和评估测量工具的效度。

心理学中的各种信度和效度

⼼理学中的各种信度和效度⼼理学中的各种信度和效度⼀、信度所谓信度，指的是测量结果的稳定性程度，其操作定义是，信度乃是⼀个测验X与它的任意⼀个“平⾏测验X＇的相关系数。

⽆关因素、测验的长度、测验试题的区分度、被试团体的代表性都会影响信度。

（⼀）重测信度1、定义：利⽤同⼀量表，让同⼀被试群体在不同时间两次施测之后的相关值。

这⼀信度值表⽰的是测验结果的稳定性，故也称之为稳定性系数。

2、形式：施测——经过适当时间——再施测3、举例：假设有⼀份主观幸福感调查表，先后两次施测于10名学⽣，时间间隔为半年，结果如下表所⽰，求该测验的重测信度。

4、使⽤的前提条件（1）所测量的⼼理特质必须是稳定的。

（2）遗忘和练习的效果基本上互相抵消。

（3）在两次施测的间隔期内，被试在所要测查的⼼理特质⽅⾯没有更多的学习和训练。

5、注意事项（1）有些测验不宜采⽤重测法估计信度，如测量推理和创造⼒的测验。

那些不易受重复使⽤影响的测验才能⽤再测法估计信度。

如感觉运动测验、⼈格测验。

（2）两次测验间隔的时间要适当，并注意提⾼被试的积极性（3）测验⼿册中报告重测信度时应说明两次施测的间隔，以及在此期间内被试的有关经历（4）时间间隔的把握：适宜时间间隔依照测验⽬的、性质及被试特点⽽定，可以是⼏分钟甚⾄⼏年。

例如对于年幼⼉童的间隔要⼩；年长群体的间隔可⼤。

但智⼒测验的间隔不能太短，成就测验的间隔不能太长。

⼀般间隔时间不超过六个⽉，既不能让被试记住上⼀次测验的内容，⼜不能让其特质发⽣变化，或对所学知识产⽣遗忘。

6、重测信度的评价：（1）优点：能够提供有关测验结果是否随时间⽽变异的资料，可作为预测受测者将来⾏为表现的依据。

（2）缺点：易受练习和记忆的影响，前后两次施测间隔的长短必须要适度。

（⼆）复本信度1、什么是复本：任何测验只是所有可能题⽬中的⼀份取样，所以可编制许多平⾏的等值测验，叫做复本。

复本等值要符合下列条件：（1）各份测验测量的是同⼀种⼼理特性。

语言测试中的构念效度研究

知识文库第14期64 语言测试中的构念效度研究王天予1.引言在考虑到语言测试发展、解释和使用时首要考虑的就是效度。

那么什么是构念效度？如何更好地理解构念效度？该效度与其他效度的不同之处是什么？2.构念及构念效度 2.1构念要想理解什么是构念效度，首先要明白什么是构念（construct）。

从心理学的角度来看，构念指的是人类头脑中存在的一种特质、水平、能力或技巧（Brown,2000:9）。

在教育测量领域，构念就是一种能力（Wiley,2002)，“指成功完成特定任务所要求的人类特征”。

Ebel 和Frisbie（1991：108）将构念解释为“有关人类行为某一方面的心理构建或理论概念，是既不能够直接测量也不能够直接观察的。

”构念效度是指某个心理测验在多大程度上正确地验证编制测验的理论构想。

《标准》（APA，1999）将构念视为一个测验拟测的概念或特征。

这是从广义上将构念来指测验所涉及测量的概念或特征。

实际上，构念的选择对考试内容、考试方式和分数意义的解释息息相关，是效度研究的基础，也对考试的设计和评价起着重要的作用。

2.2 构念效度如何更好的理解构念效度呢？在教育测量领域，上述讨论的内容效度、准则关联效度和构念效度这三种类型效度都是作为整体构念效度的不同方面。

语言测试者认为这种把构念效度作为整体观点是一种新的发展。

理论界对构念的定义有不同的看法，因此，通过识别他们是如何解释应答一致性来定义构念（Messick 1981) 。

Loevinger（1957:636）最早提出要把构念效度作为整体效度来看待。

在80 年代, 这一观点逐渐得到人们的认同: 构念效度不再作为效度的一种证据，而应包括内容和标准证据、信度及其它与理论验证有关的方法 (Messick 1975, 1980, 1988, 1989; Anastasi 1986)。

其中影响最大的是 Messick 的“效度整体观”。

Messick （1988,1989）进一步丰富了效度理论，对测试的解释和使用提供了证据基础。

语言测试构念效度

持续改进测试
根据测试结果和反馈，对测试进行持续改进，优化试题设计、评分标准和考试流程，进一步提高语言测试的构念效度和实用性。
05
结论和展望
主要结论汇总
语言测试构念效度是评估语言测试结果是否真实反映被测者语言能力的重要指标。
研究表明，有效的语言测试应该具备清晰的目标、真实的任务、可靠的评分方法等特征。
03
语言测试构念效度的实证研究
研究设计
明确研究目标
首先，需要明确语言测试构念效度的具体目标，例如，是要验证某一特定语言测试的构念效度，还是要比较不同语言测试的构念
效度。
选择适当的受试者
受试者的选择应当代表语言测试的目标人群，以确保研究结果的普遍性。同时，受试者的数量也应足够，以满足统计分析的要求
。
设计测试任务
测试任务应能全面反映语言能力的各个方面，包括听、说、读、写等。任务的难度和长度应适中，以避免受试者产生疲劳或厌倦
。
Hale Waihona Puke 数据收集和分析方法数据收集
收集受试者在语言测试中的表现数据，包括得分、反应时间、错误类型等。同时，也可以收集一些背景信息，如受试者的年龄、性别、母语等。
数据分析
可以采用定量和定性两种分析方法。定量分析可以通过统计方法，如相关分析、回归分析等，来探究语言测试和语言能力之间的关系。定性分析可以通过对受试者的表现进行深入观察和分析，来获取更丰富的信息。
构念的理解
构念可以是理论构念，也可以是经验构念，它们都是对某一现象或事物的抽象描述。
构念效度的评估方法
内容效度评估
通过检查测验内容是否充分、全面地反映了所要测量的构念
来进行评估。
结构效度评估

罗夏墨迹技术的构念效度

内容摘要
然而，罗夏墨迹技术也存在一些缺点。首先，该技术的评估结果受到评估者主观因素的影响，可能导致评估结果的不一致。其次，由于罗夏墨迹技术的实施过程较为繁琐，需要专门的培训和技能，因此成本相对较高。此外，由于罗夏墨迹技术的结果解释需要丰富的专业知识和实践经验，因此对评估者的要求较高。
内容摘要
内容摘要
罗夏墨迹技术是一种著名的投射测试，通过展示模糊的墨迹图片，引导受试者描述图片中的形象、场景、情感等，从而了解其人格特征和内心世界。该技术最初用于临床心理学中，后来逐渐被应用于人际关系构念测量和心理诊断领域。
内容摘要
在人际关系构念测量方面，罗夏墨迹技术主要通过分析受试者对墨迹图片的描述，了解其人际敏感度、信任程度等方面。例如，墨迹图片中如果出现人脸或身体部位，受试者可能会联想到与他人交往的经历，从而反映其人际关系的心理特质。在心理诊断方面，罗夏墨迹技术可以帮助评估受试者的心理健康状况，例如通过分析其描述中是否涉及抑郁、焦虑等情绪。
然而，也有一些研究指出罗夏墨迹技术的构念效度存在一定的问题。例如，有些研究发现，不同测试者对同一受试者的墨迹图案解读存在较大的差异，影响了该技术的有效性。此外，也有一些批评指出，罗夏墨迹技术过于主观和模糊，缺乏科学性和可靠性。
案例分析
案例分析
为了更好地理解罗夏墨迹技术的构念效度，我们选取了一个具体的案例进行分析。在一项研究中，研究人员使用了罗夏墨迹技术来评估一群职业罪犯的心理特征。研究表明，与非罪犯对照组相比，职业罪犯组在罗夏墨迹测试中的反应显示出更高的攻击性和更低的适应性。此外，研究还发现，职业罪犯组的反应与外部效标（如犯罪行为、心理健康状况等）具有显著的相关性。
罗夏墨迹技术的构念效度进行全面分析，指出其在心理学、社会学和历史学等领域的应用中具有一定的有效性和可靠性。然而，我们也需要注意到该技术的构念效度会受到多种因素的影响，需要在应用时谨慎评估其局限性和风险。

语言测试构念效度理论:发展、贡献与挑战

语言测试构念效度理论：发展、贡献与挑战
高怀勇;刘峰;戢焕奇
【期刊名称】《东北师大学报：哲学社会科学版》
【年(卷),期】2013()5
【摘要】构念效度自20世纪50年代提出以来,经历了一个从无到有,从"三足鼎立"到"核心地位"的过程,逐渐成为语言测试评价中最重要的考量因素。

随着统一效度观的逐渐确立,构念效度理论在取得新进展的同时却伴随着诸多问题和挑战。

本文在梳理分析构念效度发展轨迹的基础上,重点讨论在统一效度框架下构念效度理论之贡献及其面临的问题和挑战,并提出了笔者的观点和立场。

【总页数】4页(P135-138)
【关键词】构念效度;语言测试;发展;贡献;挑战
【作者】高怀勇;刘峰;戢焕奇
【作者单位】四川农业大学文法学院
【正文语种】中文
【中图分类】H310.41
【相关文献】
1.语言测试中的构念效度研究 [J], 王天予;
2.国内语言测试构念效度验证研究近十年来的发展 [J], 张春青;
3.语言测试中构念效度的影响因素研究 [J], 王天予
4.国内语言测试构念效度验证研究近十年来的发展 [J], 张春青
5.计算机化语言测试的效度研究——浅析计算机能力与测试构念的关系 [J], 金艳因版权原因，仅展示原文概要，查看原文内容请购买。

心理测量相关知识总结(10)

构想效度（construct validity)：亦称“构念效度”“结构效度”。

效度最重要的一种。

美国心理学家克龙巴赫和米尔1955年提出。

测验对理论上的构想或特质的测量程度。

确定方法主要有：(1）测验内法，确定测验的内容效度、分析被试的反应过程、考查测验的同质性等；(2）测验时间法，考查测验的聚合效度、区分效度、因素效度等；(3）效标关联法，计算测验结果与某一效标之间的相关程度；(4）实验操作法，通过控制实验条件，观察测验分数的变化。

构想效度的出现，是自比内发明智力测验以来，测验领域中最为显著的变化，至今仍影响着测验领域。

区分效度（differential validity)：与“聚合效度”相对。

不同特质的测验结果之间的相关程度。

相关程度越低，说明测验之间区分效度越好。

聚合效度（convergent validity)：与“区分效度”相对。

不同测验测定同一特质的测验结果之间的相关程度。

相关程度越高，说明测验之间聚合程度越好，即不同测量方式应在相同特质的测定中聚合在一起。

内容效度（content validity：）测验项目对相关内容或行为领域的代表性取样的适当程度。

反映测验项目在多大程度上与预测量或预测的内容相一致。

确定方法主要有：(1）专家评定，由相关领域专家对测验项目与所涉及内容范围进行符合性判断；(2）统计分析，由两个独立取自同样内容范围测验分数的相关来表示；(3）经验法，通过多次测验实践积累判断的标准和原则，同时与表面效度相区分。

一个测验要具备较好内容效度须满足两个条件：(1）清晰界定内容范围，使测验全部项目均在此范围内。

内容范围包括具体知识或技能、复杂行为。

成就测验特别重视内容效度。

(2）测验项目应是内容范围内代表性样本，即选出的项目能够代表内容范围的主要方面，并使各部分项目比例适当。

效标关联效度（criterion-related validity)：亦称“效标效度”“实证效度”。

构念效度

总结：
• 近三年的高考英语听力全国卷基本考查了理解主旨和要义，获取具体的、事实性信息，对所听内容作出推断，理解说话者的意图、观点和态度等能力，能力构念划分十分明确，而且符合考试大纲要求，因此构念效度都比较高。
2.选项设计干扰性强。要求学生在听取录音时，不仅需要有速记相关信息点能力，同
时也还需要具有理解原文，辨别信息的能力，均符合考纲要求。
[以12题为例]
C. In Avon.
12. Where is the woman now? A. In Baltimore. B. In New York.
该题三个选项的地名对话中都出现过。因此需要学生进行排除。
2014年高考英语听力全国卷的构念效度分析：
• 从整体上看，2014年高考英语听力全国卷的 20 个小题中，理解主旨与要义有 1 个题，获取事实性的具体信息有 9 个题，对所听内容作出推断有 7个题，理解说话者的意图、观点和态度有3个，与
13年大体上相同。较好地体现了考试大纲对考生的能力要求பைடு நூலகம்也
2013，2014，2015年高考英语听力全国卷考试大纲
• 听力：要求考生能听懂所熟悉话题的简短独白和对话。考生应能： • （1）理解主旨和要义 • （2）获取具体的、事实性信息 • （3）对所听内容作出推断 • （4）理解说话者的意图、观点和态度
2013年高考英语听力全国卷的构念效度分析：
• 整体上来看，本套试题对能力考察点的分布还是比较正常的，以考查事实细节为主，有12道题左右，目的是检测学生听取和捕抓具体的，事实性信息等的能力。其余的理解，推断，总结题约为8
个，主要考查的是从已知信息中作推断，理解说话者意图并且进

效度类指标

效度类指标引言在社会科学研究中，效度是一个重要的概念。

它用来评估一个测量工具或实验设计的质量和准确性。

效度类指标是用来衡量研究工具或方法是否能够准确地衡量或预测所要研究的现象或变量。

本文将对效度类指标进行详细介绍，并探讨其在研究中的应用。

效度的定义和分类效度是指测量工具或方法是否能够准确地衡量或预测所要研究的现象或变量。

它反映了研究工具的信度和有效性。

一般来说，效度可以分为内部效度和外部效度。

内部效度内部效度是指测量工具或方法在特定样本中是否能够准确地衡量所要研究的现象或变量。

内部效度可以通过以下几个方面进行评估：1.构念效度：构念效度是指测量工具是否能够准确地反映出所要研究的概念。

例如，如果我们想要测量一个人的幸福感，那么我们需要确保所设计的问卷能够全面而准确地衡量幸福感的各个方面。

2.信度：信度是指测量工具在重复测量同一样本时的稳定性和一致性。

常用的信度指标包括重测信度、等价形式信度和内部一致性信度。

高信度意味着测量工具在不同时间或条件下的结果是相似的。

3.内容效度：内容效度是指测量工具是否包含了所要研究的所有重要方面。

评估内容效度可以通过专家评审、文献综述和逻辑推理等方法进行。

外部效度外部效度是指测量工具或方法在不同样本中是否能够准确地衡量所要研究的现象或变量。

外部效度可以通过以下几个方面进行评估：1.相关效度：相关效度是指测量工具与其他已经被广泛接受为有效的测量工具之间的相关性。

如果一个新设计的测量工具与已有的有效工具之间存在高相关性，那么它就有较高的相关效度。

2.预测效度：预测效度是指测量工具对未来结果或行为进行预测的能力。

例如，如果一个心理测试能够准确地预测一个人的学术成绩，那么它就具有较高的预测效度。

3.构念效度：构念效度在内部效度中已经提到，但它也可以用来评估测量工具在不同样本中的外部效度。

如果一个测量工具在不同样本中都能够准确地反映出所要研究的概念，那么它就具有较高的构念效度。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

首先，效度是对测试结果解释和使用的一种属性．而不是测试和分数本身的性质。Ｃｒｏｎｂａｃｈ（１９７１）指出效度并不是测试本身的特性，而是分数所蕴含的意义．他进一步指出被认为有效的并不是测试或观察的手段．而是从分数或其他指标中所获得的推断。即便如此，也经常能看到或听到有某一测试的效度或某一分数的效度的说法．Ｂａｃｈｍａｎｎ（２００４：２６０）指出这种用法是不准确的，更确切的说法应是测试分数作为有效的指标或者作为某一能力的有效测量。其次，对使用的某一测试的效度只是一个程度问题。一个特定的测试分数一定不能全面准确地测量出某个特定能力．分数解释和使用的效度要依赖于解释理论的逻辑理据和支持这
１９８８）．构念是指具有个体差异而又不可捉摸的特征和能力的理论抽象。构念是一种能力，指成功完成特定任务所要求的人类特性（Ｗｉｌｅｙ，２００２）。构念不是一种客观存在，而是为了某种测量目的而假设的抽象概念。Ｂａｃｈｍａｎ（１９９０）对构念效度做出了如下定义：构念效度是关于测试表现与此测试基于某种能力理论或构念理论所做出的预测的一致程度。Ｍｅｓｓｉｃｋ从测量构念的本质做出了定义：构念效度即测量个体拥有或
种理据的实证依据的充足程度。因此，Ｂａｃｈｍａｎ（２００４：２６０）ቤተ መጻሕፍቲ ባይዱ强调我们无法证明我们对分数的解释和使用是有效的．我们最多能提供依据说明，我们意欲进行的解释和使用比其他可能的解释和使用是更有道理的。再次，效度总是针对一定的测
■墨
统一构念效度及其特性
赵栋
（西安外国语大学，陕西西安７１０１２８）
：
摘要：随着心理测量理论的发展，统计方法和计算机技术的更新，以及人们对于考试维权意识的增强，效度概念的内涵和外延在不断发展变化。效度在考试质量评价中的地位不断得到提升，已经成为测量评价中最重要的方面。本文通过对Ｍｅｓｓｉｃｋ￣统构念效度理论的阐释，总结统一构念效度在实际运用中所具有的特性，以加强对统一构念效度的理解与运用。关键词：效度构念构念效度
一
构念效度的出现是在二十世纪五十年代初期美国心理学会为弥补心理测量中概念的不足而引入的（Ｃｒｏｎｂａｅｈ，
义。统一意味着在效度检验中分数所具有的意义体现在基于分数所做出的推断之中。构念效度作为统一效度的代名词，Ｌｉｎｎ和Ｇｒｏｎｌｕｎｄ（２０００：７５ — ６）总结了统一效度的一些特性。
测试中的检验假设是指一项测试所能测量的（即从测试分数所得出的推论）及所得测量分数的应用（即基于测试分数的决定）之间的假设。
将构念效度提升成为在心理测量与语言测试学界核心地位的是由Ｍｅｓｓｉｃｋ所提出的效度框架，在此效度框架中Ｍｅｓｓｉｃｋ（１９９５）主张引人价值含义（ｖａｌｕｅｉｍｐｌｉｃａｔｉｏｎ）和社会影响（ＳＯ．ｃｉａｌｃｏｎｓｅｑｕｅｎｃｅｓ）方面。他认为．统一构念效度的本质是，分数推断要恰当（ａｐｐｒｏｐｒｉａｔｅｎｅｓｓ）、有意义（ｍｅａｎｉｎｇｆｕｌｎｅｓｓ）和有用（ｕｓｅｆｕｌｎｅｓｓ），这三方面具有不可分割性；这种综合解释力来源
能展现出多少构念。而Ｈｅｐｐｎｅｒ，Ｋｉｖｌｉｇｈａｎ和Ｗａｍｐｏｌｄ（１９９２）对
构念效度的定义则体现了其测量假设检验的性质，即测试者所选取的测量变量能在多大程度上体现出其假设构念的本质特性．换言之，即所测量的变量是否能够代表其假设的构念。Ｃｈａｐｅｌｉｅ（１９９９）也对语言测试的假设检验本质指出：语言