效应量的估计、报告和解释

合集下载

心理学常用效应量

2
2.1
效应量的计算
差异类效应量这类效应量一般用于实验研究 , 进行两组均
其中一组 , 一般是控制组 (Glass, 1976), 此时该组的权重是 1。特别地 , 假设要比较的是第 1 组和第 2 组的差异。各组的样本容量分别为 n1 , n2 , L , nJ , 样本均值分别为 y1 , y2 ,L , y J , 样本标准差分别为
(6)
应和简单主效应 (Bird, 2004)。例如 , 一个实验探讨小学生 “ 对文章内容的不同预期对阅读理解的影响 ”, 有两个因素：因素 A—— 不同类型标题提示 , 有 2 个水平：正确提
不难看出 ,
⎡n + n − 2⎤ g=⎢ 1 2 ⎥ ⎣ n1 + n2 ⎦
(3) Glass 的 Δ 值
s1 , s2 , L , s J 。下面分别介绍上面三种方法对应的
效应量公式。 (1) Cohen 的 d 值上面第一种方法对应的两组差异的效应量为 (2) d = ( y1 − y2 ) σ pooled
σ pooled
单因素实验设计时 , 均值的差异可以是两组比较 , 也可以是多组比较 , 其一般形式为线性对比 (contrast, Keppel & Wickens, 2004; Kline, 2004; Bonett, 2008; 温忠麟, 2006)： ψ = c1μ1 + L + cJ μ J , 其中 J 是组数 , μi 表示第 i 组的均值 , i = 1, L, J , ci 是常数满足 c1 + L + cJ = 0 。均值差异是线性对比
值比较或多组均值比较。在两组均值比较的情况下 , 最直观的是用两组的均值差值作为效应量。但在心理学研究中 , 使用原始数据的均值差值作为效应量会存在单位不统一、研究间效应量无法比较的问题 , Cohen (1969)和 Glass (1976) 提出用均值之差的标准化值替代原始均值差值 , 是差异类效应量的基础。 2.1.1 单因素实验设计

效应量的使用与报告

第２２卷
第１０期
牡丹江大学学报
ＭｕｄａｎｊｉａｎｇＵｎｉｖｅｒｓｉｔｙ
Ｖｏ１．２２Ｎｏ．１０
２０１３年１０月
文章编号：ｌ００８．８７１７（２０１３）Ｏ１Ｏ－Ｏｌ０５。０５
设置虚无假设检验的显著性差异存在误读。通过具体的案列，结合统计软件ＳＰＳＳ，分别对心理行为研究中的几类常见的数据处理方法，如
ｆ检验、ＡＮＯＶＡ、非参数检验、相关分析与回归分析等，参考ＡｐＡ写作手册进行规范的效应量的使用与报告，并讨论了效应量大小标准的争论以及补充分析了几种常用的效应量。
会心理。
范夺大先学心（理１９６学３一）博士，后男，安微合肥人，安徽师范大学，ｂＮ系教授，博士生导师，北京师
，
研究方向：现代社会心理。
１Ｏ５
借助ＳＰＳＳＩ８．０对案例数据进行呈现与分析。３结果与分析３．１ｔ检验３．１．１ｔ检验中效应量使用，检验中常用的效应有Ｃｏｈｅｎｓｄ、Ｈｅｄｇｅｓｓｇ等，也有教材采纳Ｃｏｈｅｎ的建议，补充作为效应量解释总分的变异程度。本文中统一采用ｄ作为效应量。其他效应量的分析将在讨论中阐述。Ｃｏｈｅｎ（１９９２）对ｄ值大小界定的标准为：０．２左右说明实验效果小，ｏ．５左右说明实验效果中等，０．８左右实验效果大，中等以上便能够引起学者注意了。ＳＰＳＳ中不提供此效应量，需手算。３．１．２单样本ｔ检验效应量报告单样本ｔ检验用于样本均值与总体均值的差异性比较。ｄ计算方法如下：（其中为样本均值，为总体均值，ＳＤ为样本标准差）

effect size 结果解释

文章标题：深度解读效应量：为什么它重要，如何解释和运用？1. 导论效应量（effect size）是指实验或观察研究中所观察到的效应的大小。

它是衡量研究结果的重要指标，能够帮助我们更全面地理解研究结果的实际意义。

本文将从效应量的概念和重要性、如何解释效应量以及有效运用效应量等方面展开探讨，帮助读者深入了解并灵活运用效应量。

2. 效应量的概念和重要性效应量是用于衡量两组之间差异大小的指标，它能够告诉我们两组在研究变量上的差异有多大。

在研究结果中，效应量能够帮助我们判断实验结果的重要性，而不仅仅关注显著性检验的结果。

在实际研究中，效应量能够帮助我们克服样本大小对显著性检验结果的影响，从而更全面地评价研究结果的可靠性。

3. 如何解释效应量在解释效应量时，我们通常会使用Cohen's d、r、ω²等统计指标。

其中，Cohen's d用于描述两组之间的均值差异大小，r用于衡量两个变量之间的相关性，ω²则是适用于方差分析的效应量指标。

当我们解释效应量时，需要根据不同的研究设计和分析方法，选择适合的效应量指标进行解释，避免武断地使用单一指标进行评价。

4. 有效运用效应量在实际研究中，我们需要灵活运用效应量来解释研究结果。

除了简单地报告效应量的数值外，还需要结合研究背景、数据特点来更全面地解释效应量的意义。

可以通过绘制图表或提供实际例子来帮助读者更好地理解效应量的意义。

在报告效应量时，也需要关注95%置信区间，以便更准确地估计效应的精度，从而更加可靠地解释研究结果。

5. 个人观点和理解在我的个人看法中，效应量在研究中具有重要的意义。

它能够帮助我们更全面地理解研究结果，避免过分关注显著性检验的结果而忽视了实际效应的大小。

在解释效应量时，需要结合数据的背景和研究设计来灵活选择合适的指标进行解释，从而更准确地传达研究结果的重要性。

我认为，通过深入了解和有效运用效应量，我们能够更好地理解研究结果，并为进一步的研究提供科学依据。

从效应量应有的性质看中介效应量的合理性

计算公式：效应量检验法使用Sobel检验、GoodmanKruskal Lambda检验等公式来计算中介效应量。
0
0
1
2
适用范围：适用于检验一个或多个中介变量对自变量和因变量之间关系的调节作用。
0 3
注意事项：在应用效应量检验法时，需要注意数据的正态性和样本量的大小，以确保结果的准确性和可靠性。
根源。
经济学研究
探讨因果关系：中介变量帮助确定自变量和因变量之间的因果关
系。
解释复杂关系：中介效应量可以解释不同变量之间复杂的相互作用和影响机制。
评估干预措施：通过中介效应量分析，可以评估各种干预措施对目标变量的影响
程度和效果。
预测未来趋势：基于中介效应量的分析结果，可以对未来的经济趋势进行预测和
的值。
效应量解读：根据研究目的和实际情况，对计算出的效应量进行解读，说明其意义和影响。
报告效应量的解释和讨论
效应量定义：表示自变量对因变量影响的量级
效应量选择：根据研究目的和数据类型选择合适的效应量指标
效应量报告规范：遵循国际通用的效应量报告标准，如 Cohen's d、r等
效应量讨论：结合研究背景、目的和结果，对效应量进行解释和讨论
研究方向。
医学研究
医学研究：中介效应量可以帮助研究者了解不同因素对健康状况的影响程度，从而为预防和治疗提供科学依据。
添加标题
心理学研究：中介效应量可以揭示心理机制的作用过程，解释不同因素对行为和认知的影响，为心理干预和治疗提供理论支持。
添加标题
社会学研究：中介效应量可以帮助研究者了解社会因素对个体行为和心理的影响机制，为政策制定和社会干预提

非参数统计中的效应大小估计技巧(Ⅰ)

非参数统计中的效应大小估计技巧统计学是一门研究数据收集、分析和解释的学科，而非参数统计是其中的一个重要分支。

在进行统计分析时，我们经常需要评估不同变量之间的关系，确定变量之间的差异是否显著。

而效应大小则是评估这种差异的大小，它可以帮助我们更好地理解数据和结果。

在非参数统计中，效应大小的估计技巧尤为重要。

一、效应大小的概念在统计学中，效应大小指的是在两组或多组数据之间发现的差异有多大。

它可以帮助我们理解这种差异的实际意义，而不仅仅是考虑差异的存在与否。

效应大小的估计通常可以帮助我们判断研究结果的实际重要性，以及在实际应用中的可行性。

二、效应大小的计算方法在非参数统计中，效应大小的计算方法有很多种。

其中比较常用的包括Cohen's d、Kendall's tau等。

Cohen's d是一种用于计算两组数据之间效应大小的方法，它的计算公式为 (M1 - M2)/SDpool，其中M1和M2分别是两组数据的平均值，SDpool是两组数据的标准差的平均值。

而Kendall's tau则是一种用于衡量两组数据之间相关性的方法，它可以帮助我们评估两组数据之间的等级关系。

三、效应大小的解释在进行效应大小的估计时，我们需要对结果进行解释，以便更好地理解数据和结论。

通常，我们可以根据效应大小的大小，将其分为小、中、大三个等级。

效应大小为左右的情况可以认为是小效应，左右可以认为是中效应，1左右可以认为是大效应。

这种分级的标准可以帮助我们更好地理解效应大小的意义。

四、非参数统计中的效应大小估计技巧在非参数统计中，效应大小的估计技巧可以分为两种基本类型：基于计算的方法和基于图形的方法。

基于计算的方法通常是通过一定的数学公式来计算效应大小，比较常用的有Cohen's d和Kendall's tau等。

而基于图形的方法则是通过绘制图表来展现两组数据之间的差异，从而直观地评估效应大小。

效应量的估计报告和解释

效应量的估计报告和解释效应量是指用来衡量两组之间差异的一个重要统计指标，它反映了干预措施对因变量的影响大小。

在实证研究中，人们经常关注效应量的估计，因为它能帮助我们理解变量之间的关系以及干预措施的实际效果。

本文将对效应量的估计和解释进行详细阐述。

效应量的估计可以使用多种统计指标，比如平均差异（Mean Difference）和标准化平均差异（Standardized Mean Difference）等。

平均差异是指在两个组之间具体表现出来的差异量，通常用于比较两组的平均值。

标准化平均差异则是将平均差异除以标准差，以此消除不同测量单位的影响，使得效应量能够直接进行比较。

在估计效应量时，还需要考虑到样本大小（Sample Size）的影响。

一般来说，样本越大，效应量的估计越准确。

因此，在报告效应量时，需要注明样本大小，并根据样本大小进行解释。

此外，还需要考虑到统计学的显著性（Statistical Significance）和实际意义（Practical Significance）之间的关系。

统计显著性是指统计结果是否达到了显著的程度，而实际意义则是指效应量是否具有实际的重要性。

当效应量达到显著水平时，我们可以认为结果是有实际意义的。

当报告效应量时，可以结合具体的实例进行解释。

例如，假设研究对象是两组学生，一组接受了项教育干预措施，另一组没有接受。

测量的因变量是学生的考试成绩。

通过比较两组学生的平均成绩，我们可以计算出平均差异。

如果平均差异为2分，标准差为1分，那么标准化平均差异为2、这意味着接受教育干预的学生的平均成绩比未接受干预的学生高出2个标准差。

根据统计学的显著性检验，我们可以确定这种差异是显著的。

因此，我们得出结论说该教育干预措施对学生成绩有实际意义的改善效果。

在解释效应量时，还可以采用其他的统计指标来说明结果。

例如，可以使用置信区间（Confidence Interval）来表示效应量的可信度范围。

循证医学试题及答案大全01

循证医学试题及标准答案一选择题1、循证医学又称实证医学，即以证据为基础的临床医学,它的思想原理起源于（)中叶.A.17世纪B.18世纪C.19世纪D.20世纪E.21世纪2、循证医学的（)是要求任何医疗措施的实施都应建立在最新、最好的医学科学研究信息的基础上。

A.基础B.理论C.要点D.目的E.核心3、（)是指在疾病的诊治过程中，将个人的临床经验与现有的最好临床科学证据（current best evidence)相结合，同时考虑病人的价值观，最后为每个病员作出最佳诊治决策。

A、循证医学B、实验医学C、现代医学D、基础医学E、临床医学4、个人的临床经验是指临床医生通过临床实践获得的处理临床问题的熟练能力和判断能力，也就是说临床医生应具备通过（)的临床表现来发现临床问题的能力。

A、证据B、随机对照实验C、医生D、护士E、病员5、循证医学显示了现代医学的进展，不仅有利于临床医学由经验型向科学型的转变，还将在医疗卫生领域引入人性化服务。

传统医学是以经验为主，即根据医师的（医学全在线、（)或（)原理来处理病人。

A、经验B、实验C、直觉D、大家的讨论结果E、病理生理答案：1、C2、E3、A4、E5、ACE二、名词解释1、循证医学：是遵循科学证据的医学，指的是临床医生在获得患者准确的临床依据的前提下，根据自己的临床经验和知识技能，分析并抓住患者的主要临床问题（诊断、治疗、雨后、康复等），应用最佳的和最新的科学证据，做出科学的诊治决策，联系具体的医疗环境，并取得患者的合作和接受，以实践这种诊治决策的具体医疗过程。

2、成本-效益分析：将不同的结果换算成流通货币的形式，用货币量作为共同的获利单位进行比较。

3、效用：即用社会效益和个人主观满意度来测量和评价健康效果。

4、药物不良反应：在预防、诊断、治疗疾病或调节生理机能过程中，人接受正常剂量的药物时出现的任何有害的和用药目的无关的反应。

5、证据：主要是指经过试验所得出的结论。

效应量 effect size-概述说明以及解释

效应量effect size-概述说明以及解释1.引言1.1 概述概述效应量（effect size）是指在统计学中用于衡量一个变量或处理之间的差异或关联程度的指标。

它旨在提供一个客观的度量，用于评估研究结果的实际意义和实际效果的大小。

在研究中，我们常常关注是否存在某种效应，而效应量则帮助我们了解这种效应的大小。

效应量的概念源于对统计假设检验的批评。

传统的假设检验主要关注样本之间的差异是否是由于抽样误差引起的。

然而，在实际研究中，我们往往更感兴趣的是变量之间的差异或关联程度的实际意义。

因此，效应量的引入为我们提供了一种更直观、更实用的方法来描述变量之间的关系。

效应量的计算方法因具体研究设计不同而有所差异。

常见的效应量指标包括标准化的平均差异（如Cohen's d）、相关系数（如Pearson相关系数）、风险比（如Odds Ratio）等。

这些指标根据研究设计的不同而有不同的计算方式，但它们的目的都是提供一个对效应大小的度量。

在本文中，我们将探讨不同效应量指标的应用及其计算方法，并深入分析效应量在研究中的重要性。

同时，我们将讨论效应量对研究的启示，以及如何使用效应量来提高研究的可靠性和可解释性。

通过深入理解和应用效应量，我们可以更准确地评估研究结果的实际意义，同时为进一步的研究提供更有价值的启示。

总之，效应量作为衡量变量之间差异或关联程度的指标，在统计学和研究方法学中扮演着重要的角色。

它不仅能够提供一种客观的度量来评估研究结果的实际意义，还能够为研究者提供宝贵的启示和指导。

在接下来的章节中，我们将进一步探讨效应量的计算方法及其在研究中的应用。

1.2文章结构1.2 文章结构本文将按照以下结构进行分析和讨论效应量的概念、计算方法以及其在研究中的重要性和启示。

具体而言，本文将分为三个部分：第一部分为引言。

首先，我们将概述效应量的定义和背景，并介绍本文的结构。

其次，我们明确本文的目的和意义。

第二部分为正文。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

表 1 标准差异型 ES 指标的计算及使用
估计指标及公式
使用条件
d
=
M1
－ M2 σ^
，σ^ 为任意组的样本标准差*
Δ
=
M1 － M2 scontrol
，scontrol 为控制组标准差
Δ1
=
M1
－ s1
M2
，并 Δ2
= M1 － M2 s2
g
=
M1 － M2 spooled
，spooled
[ 槡 ] g = corrected
组内设计情况下几种典型标准差异 ES 指标的计算公式及适用条件［11 － 14］。SPSS 软件尚未提供这些指标
一般建议在满足方差齐性的前提下，更多地考虑 g 指标。因为相比 d 或 Δ ，g 值对总体 ES 的估计偏差
的计算机生成程序，因此还需研究者手动计算。
更小（ less biased），估计更有效（ smaller variance），
据 Kirk（ 1996）总结，统计学家已经发展出了至少 40 多种 ES 估计指标，并对估计结果的报告和解释形成了一定规范［1］。遗憾的是，这些方法学期刊中的知识对国内心理学工作者的影响似乎不大。国内研究报告中，基于 NHST 的数据分析仍占统治地位［5］。对于这种不尽人意的情况，存在两种可能的解释：第一，应用工作者对 NHST 的结果尚存在一定程度的误读［6］，如将统计显著性（ statistical significance）曲解为实际重要性（ practical significance）。第二，在有关 ES 的国外文献中，很多涉及高度专业
联强度型 ES 指标的计算公式及使用条件，并说明关联强度型指标在 SPSS 软件中的操作。其次，
强调 ES 估计结果的两个报告原则，即明确指出所计算的是何种 ES 指标，尽可能地呈现 ES 的置信
区间。在 ES 的解释方面，建议研究者结合具体情况综合权衡结果的实际重要性，而非机械援引各
种所谓“小”、“中”、“大”的 ES 判定准则。
槡槡 rpearson =
t2
t2 + df
=
F F + df
使用条件 / 对应的 NHST
SPSS 操作
卡方检验中的四格表分析
卡方检验中的 R × C 列联分析
组间设计的均值差异显著性检验；或组间设计的单因素两水平方差分析；或点二列相关的显著性检验组内设计的均值差异显著性检验；或组内设计的单因素两水平方差分析；或积差相关的显著性检验
关键词：效应量；实际重要性；虚无假设显著性检验
中图分类号：B841． 2
文献标识码：A
文章编号：1003 － 5184（2011）03 － 0260 － 05
虚无假设显著性检验（ null hypothesis significance testing，NHST）是心理学研究中普遍使用的统计程序。然而，在 NHST 存在的 70 余年间，人们围绕其逻辑、功效等问题争议不断［1］。虽然期间有不少观点主张取缔 NHST，但近年来研究者们趋于认为如果合理利用 NHST，同时辅以其他数据信息， NHST 仍有其实用性［2］。其中估计结果的 ES 大小是常见的改进方案之一。美国心理学会（ American Psychology Association，APA）召集成立的统计推断专责小组曾呼吁研究者“无一例外地将 ES 估计值作为主要的结果呈现 ”，并强调这类数据有助于今后进一步的效力分析（ power analysis）＊＊和元分析［3］。之后第五版和第六版 APA 写作手册也提醒笔者： “为了使读者意识到研究结果的重要性，有必要在结果部分对 ES 进行测量”［4］。
顾名思义，标准差异型（ standardized differences
图 1 ES 大小与两假设分布重叠面积的对应关系
对每种具体的 NHST 而言，都有与其相适应的
type）指标以标准化的差异单元来衡量总体 ES。在某些情况下，测量单位本身具有实际意义，各组别原
ES 估计指标，如均值差异显著性检验中的 g 值，方始分数差异（如实验组与控制组的日吸烟量之差）
对值大小与证据强弱相一致。ES 指标的绝对取值同一构念的各种度量标尺会因操作定义的不同而难
是一个从零开始的连续变量，其大小与结果的实际以直接比较。此时研究者必须借助标准化的差异指
重要程度相对。当虚无假设 H0 为真时，ES 理想的估计值为零。3）非样本量依赖性。通常，ES 指标较
标来衡量效应大小，甚至比较不同参照体系中的 ES。
Cohen（ 1988）将 ES 定义为“总体中存在某种现象的程度”；具体到 NHST 体系中，ES 即“虚无假设 H0 错误的程度”［9］。这种错误程度可形象理解为虚无假设 H0 和备择假设 H1 所代表的两抽样分布分离程度或面积重叠程度。如图 1 所示，ES 越大，H0 偏离 H1 而犯错误的程度越明显，两分布的分离程度越高，重叠面积越小，反之亦然。这样，对 ES 的考察能告诉读者一些不同于 NHST 结果的信息。NHST 仅能回答抽样所得均值差异“是否 ”由偶然误差引起，或结果“是否”具备统计显著性之类的方向性信息。如总体均值间的差异到底有多大，变量间的关联强度如何，自变量能在多大程度上解释因变量等，而这类证据强度信息正是人们在推断总体参数时所希望了解的。
1－ 4（ n1
= SS1 + SS2
3
df1 + df2 g
+ n2 ）－ 9
d
=
MD σ^
，σ^ 为任意测量条件的样本标准差
Δ
=
MD spretest
，spretest 为前测条件的样本标准差
Δ1
=
MD s1
，并 Δ2
= MD s2
槡 g
=
MD spooled
，spooled
=
SS1 + SS2 df1 + df2
槡2（ 1 － r12）（其中 r12为两测量条件的积差相关），因此 Gibbons 等人的 gD 与 Hedges 的 g 指标关系为 gD = g / 槡2（ 1 － r12）。
262
心理学探新
2011 年
表 1 总结了均值差异显著性检验中，组间设计和
另外，在选择指标时，除了关注表 1 所列条件，
* 基金项目：湖南师范大学社会科学青年学术骨干培养计划项目（ 09XGG23）。＊＊效力（ power）即成功拒绝错误的虚无假设的概率，抑或正确获得统计显著性结果的可能性。效力分析则是一种利用效力与样本量、显著性水平、总体 ES 之间的函数关系来评估某具体 NHST 效力高低的技术。目前，效力分析所面临的一个棘手问题是估计总体 ES，这至少部分是由于人们对 ES 的长期忽视所致［10］。有关效力与 ES 的关系分析可参见胡竹菁（ 2010）《平均数差异显著性检验统计检验力和效果大小的估计原理与方法》。
df1 + df2 1 － r2pb
1 +1 n1 n2
，rpb 为点二列相关系数（也见表 3）
组内设计
槡 g = t
2s2D n（ s21 + s22 ）
槡当 s21 = s22 时，有 g = t
2（
1
－ n
r12 ）
，r12 为两测量条件的积差相关
然而，在大样本研究中，对 d、Δ 和 g 的计算结议不大［16］。也正因如此，在大样本情况下，使用未
总体而言，Cohen 的 d 值、Glass 等人的 Δ 值及且充分利用了全部的观测数据。鉴于该指标对参数
Hedges 的 g 值是三种常见的标准差异型 ES 估计指的良好估计特性，表 2 进一步给出了 g － t 和 g － r 的
标。在具体计算中，这三种指标的分子相同，分母部转换公式［14，16］。在整理那些缺乏足够描述信息（如
分略有差异。不同的设计类型及统计前提下，基于未报告样本平均数或标准差）的二手数据时，以下
不同的理论思考，各指标对总体标准差异单元的估公式尤为便利。
计策略有所不同。
表 2 g 值与 t 值、r 值间的转换
设计类型
g － t 转换
g － r 转换
组间设计
槡 g = t 1 + 1 n1 n2
槡( )( ) g = r2pb
＊＊非严格意义的组内设计是指对同一因素的考察在理论上允许以组间设计替换。此时对 ES 的估计类似于组间设计
的情况。但对那种关注测量变化量的严格意义的组内设计而言，建议基于差异分数 D 而非原始分数来计算分母标准差。这体现出对研究主题本身的理论思考［14］。
＊＊＊gD 是 Gibbons，Hedeker 和 Davis（ 1993）将 Hedges 基于组间设计的 g 指标研究扩展至组内设计而成［13］，由于 sD = spooled
果相近，且估计偏差变得十分微小，选用何种指标争经矫正的公式便足以估计总体 ES。
表 3 关联强度型 ES 指标的计算及使用
估计指标及公式*
非平方尺度
槡 φ^ =
χ2 n
槡 V =
χ2
min（ R － 1，C － 1） × n
槡槡 rpb =
t2
t2 + dfwithin
=
F F + dfwithin
非严格意义的组内设计＊＊，且两测量条件总体方差齐性非严格意义的组内设计，且理论上能区分出前测条件和后测条件非严格意义的组内设计，且理论上无法区分出前测条件和后测条件，两测量条件方差不齐性，此时需同时报告两种可能的 Δ 值