双重差分模型介绍及其应用_叶芳

合集下载

计量经济学双重差分模型介绍及应用

计量经济学双重差分模型介绍及应用

计量经济学双重差分模型介绍及应用双重差分模型——基于文章《“一带一路”倡议的对外投资促进效应》DID模型介绍ONE1.1DID原理DID模型主要用于政策的效应分析,通过将新政策视作一次“自然实验”,设定实验组和对照组对比分析新政策的效应。

DID方法的基本模型如下:G i为政策虚拟变量,值为1时表示实验组,值为0时表示对照组;D i为时间虚拟变量,值为1时表示政策发生后,为0时表示政策发生前。

当D i=1时公式可以改写为:当D i=0时公式为:将上面两个式子相减可得:对上式进行OLS估计,β的估计量即为实验组和控制组的平均变化差,也就是我们所研究的政策效应。

以文章《“一带一路”倡议的对外投资促进效应》为例,为研究2013年“一带一路”倡议(之后以倡议代指)的实施对中国FDI的影响,将一带一路沿线国家作为实验组、非沿线国家作为对照组进行对比,分析此时对一带一路国家的FDI是否会因倡议增加。

为回答上面这个问题,需要将我国企业对沿线和非沿线国家的FDI 数据进行对比,理论上如果我国企业对沿线国家的对外投资更高,则倡议对FDI有促进作用。

但这将面临一个问题,如果对一带一路沿线国家的对外投资数量在倡议前就比非沿线国家高呢?此时我们需要观察倡议提出前后即2013年前后两期的区别。

这里我们假设被解释变量y ct受三个虚拟变量的影响:silkroad ct,值为1表示是一带一路沿线国家,为0表示是非沿线国家;post ct,值为1表示2013年后,为0表示2013年前;silk_dum ct前两个虚拟变量的交乘项(如下式)。

此时我们分析以下两种情况:(1)中国企业在非沿线国家在2013年前后的绿地投资项目数量变化2013年后:a0+a2 2013年前:a0(2)中国企业在沿线国家在2013年前后的绿地投资项目数量变化2013年后:a0+a1+a2+β2013年前:a0+a1整理后得下表,可以看出β为所求的倡议的效应系数。

双重差分模型英语

双重差分模型英语

双重差分模型英语【最新版】目录一、什么是双重差分模型二、双重差分模型的应用场景三、双重差分模型的优点与局限性四、如何使用 Python 实现双重差分模型正文一、什么是双重差分模型双重差分模型(Difference-in-Differences,简称 DID)是一种计量经济学方法,用于评估政策或项目实施效果。

它通过比较实施政策或项目前后的变化,以及实施政策或项目组与对照组的差异,来评估政策或项目的效果。

双重差分模型特别适用于大范围的公共政策,因为这些政策通常是非随机分配的,难以保证实施组和对照组在样本分配上的完全随机。

二、双重差分模型的应用场景双重差分模型近年来多用于计量经济学中对于公共政策或项目实施效果的定量评估。

例如,研究铁路建设对城市经济增长的影响、政策补贴对企业创新的影响、环境保护政策对企业环保投资的影响等。

这些研究领域都涉及到政策实施效果评估,因此都可以使用双重差分模型进行分析。

三、双重差分模型的优点与局限性双重差分模型的优点有:1.考虑了政策实施前后的变化和实施组与对照组的差异,可以更准确地评估政策或项目的效果。

2.适用于非随机分配的政策实施组和对照组,解决了实际操作中难以保证完全随机分配的问题。

然而,双重差分模型也存在局限性:1.模型假设政策实施组和对照组在没有政策干预的情况下,其趋势是相同的。

如果这个假设不成立,模型估计的结果可能会出现偏误。

2.模型受到样本选择、对照组的选择等因素影响较大,不同的选择可能导致不同的结果。

四、如何使用 Python 实现双重差分模型要使用 Python 实现双重差分模型,可以使用诸如 Stata、R、Python 等软件。

这里以 Python 为例,可以使用 statsmodels 库中的difference_models 模块进行实现。

以下是一个简单的示例:```pythonimport numpy as npimport pandas as pdfrom statsmodels.formula.api import diff_model# 假设有如下数据# 城市编号政策实施前政策实施后城市经济增长率data = pd.DataFrame({"city_id": [1, 1, 2, 2, 3, 3],"before_policy": [10, 20, 30, 40, 50, 60],"after_policy": [20, 30, 40, 50, 60, 70],"growth_rate": [0.1, 0.2, 0.3, 0.4, 0.5, 0.6]})# 定义双重差分模型model = diff_model(formula="growth_rate ~ city_id +after_policy - before_policy", data=data)# 拟合模型results = model.fit()# 输出结果print(results.summary())```以上代码首先导入所需的库和数据,然后定义双重差分模型,最后使用拟合方法求解模型。

双重差分模型

双重差分模型

双重差分模型摘要:双重差分模型是一种常用的统计模型,用于研究两个或多个相关变量之间的关系。

它通过使用差分运算来消除时间和空间的影响,以便更准确地分析变量之间的因果关系。

本文将介绍双重差分模型的基本原理、应用领域以及实际案例,并探讨其优缺点和未来发展的趋势。

1. 引言双重差分模型是一种旨在解决因果推理问题的统计模型。

在传统的统计建模中,我们常常面临时间序列数据、面板数据等复杂数据结构,而且这些数据可能受到时间和空间影响的复杂性。

双重差分模型的提出解决了这个问题,使得我们能够更全面、准确地分析变量之间的因果关系。

2. 基本原理双重差分模型的基本原理是采用差分运算来消除时间和空间的影响。

通常,我们会选择一个合适的差分期,将其作为基准期,并将其他期间的数据相对于基准期的差值作为分析对象。

通过这种方式,我们可以排除了时间的影响,从而更准确地分析变量之间的因果关系。

3. 应用领域双重差分模型在多个领域都有广泛的应用。

其中,最常见的应用领域包括经济学、社会学和医学等。

在经济学中,双重差分模型通常用于评估公共政策的效果,如最低工资政策、减税政策等。

在社会学中,双重差分模型则可以用于研究教育、就业和犯罪等社会问题。

在医学中,双重差分模型可以帮助我们评估药物治疗的效果,从而提供更准确的临床决策依据。

4. 实际案例为了更好地理解双重差分模型的应用,我们将介绍一个实际案例。

假设我们想研究最低工资政策对就业率的影响。

我们从不同城市和不同时期的数据中收集到了就业率和最低工资水平的信息。

通过运用双重差分模型,我们可以消除不同城市间的差异以及时间的影响,并准确地分析最低工资政策对就业率的影响。

5. 优缺点双重差分模型具有一些优点和缺点。

其优点包括:消除时间和空间影响的能力,准确分析变量之间的因果关系,适用于多种复杂数据结构。

然而,双重差分模型也存在一些限制。

首先,它要求数据满足一定的前提条件,如平稳性和线性关系。

其次,由于使用差分运算,这种模型容易引入误差,需要小心处理。

双重差分模型简介及其在金融学研究中的运用

双重差分模型简介及其在金融学研究中的运用

Financial View金融视线 |双重差分模型简介及其在金融学研究中的运用巴英龙中央财经大学 北京 100081摘要:本文追溯了双重差分模型的起源与经济学含义,并通过清晰简明的推导,对双重差分模型、多期双重差分模型、倾向匹配得分双重差分等模型的原理和使用条件进行区分。

另外,本文综述多篇具有代表性的学术研究作品,并通过这些研究展示了双重差分模型在数理经济学和数理金融学等方面的实证意义,为后续研究提供思路。

关键词:双重差;金融模型;金融学中图分类号:F832 文献识别码:A 文章编号:1673-5889(2021)11-0109-04自20世纪中叶,金融学演化成一门独立的研究学科以来,就在不断革新的研究工具和研究思路中,继续细化成各个不同的学术流派。

在日益复杂的商业活动中,金融学不断创新,并在经济活动决策中扮演着越来越重要的角色。

21世纪以来,各种信息呈几何式增长,还有不断扩容的存储设备、逐渐提速的计算设备等为处理信息创造条件。

学者们开始逐渐探索收集数据、整理数据、处理和分析数据的科学方法。

而互联网、计算机的出现更为金融学的发展提供新的契机,一门以金融学为基础,数学和数理知识为支撑的新学科——数理金融学蓬勃发展。

数理金融学将数学模型与推导运用到金融学研究实践中,为决策制定、商业活动等提供了科学支持。

本文将介绍19世纪70年代以来,在数理金融的学术研究中大放异彩的一个数学模型:双重差分模型,通过清晰简明的推导使读者对该模型形成系统的认识,并抽丝剥茧地介绍在不同运用前提下,该模型的多种变型。

在模型推导结束后,本文将通过几篇经典文献对该模型及其变型进行剖析,并为读者开拓研究思路。

一、实验与数据在社会科学的学术研究中,根据数据集的不同收集过程,实验可分为“理想实验”“准实验”“自然实验”。

在现代金融学学术研究中,通过仔细设计与收集,许多商业活动的数据能够被运用为“准实验”。

当选取自然状况下发生的事件作为研究样本时,由于这些数据在形成过程中较少受到人为设计的实验因素的干扰,其结果往往会更具有说服力。

双重差分模型和固定效应模型

双重差分模型和固定效应模型

双重差分模型和固定效应模型双重差分模型和固定效应模型是常用于面板数据分析的两种方法。

它们都可以用来研究某个政策、事件等事件对个体或群体行为产生的影响。

这篇文章将介绍双重差分模型和固定效应模型的基本原理、优缺点以及应用场景。

一、双重差分模型双重差分模型是一种用于控制面板数据的基线特征的方法。

该模型将两个差分作用于面板数据,以消除混杂的时间不变个体特征和处理组与未处理组之间的异质性。

该模型的实现方法是,先对每个个体的基线跨时间差异进行差分,再对处理组和未处理组之间的跨时间差异进行差分。

通过这种方法,将二者都控制在一个固定效应中,从而消除了外生性的时间不变个体特征和处理组与未处理组之间的异质性。

这样,就得到了纯粹的因果效应估计。

优点:1.双重差分模型与一般回归模型相比,具有更高的可控性和可靠性;2.可以消除时间不变的个体特征和处理组与未处理组之间的异质性,得到更为准确的因果效应估计;3.对于个体固定效应等渐进性的变量意义解释更为清晰。

缺点:1.适用场景有限,只适用于处理组和未处理组各包含一个时间序列的情况;2.某些情况下可能掩盖了处理组特征和未处理组的变化。

二、固定效应模型固定效应模型也是一种常见的面板数据分析方法,其基本思想是,将所有可能影响观测到的并且被观察时间减去之后不再变化的个体的异质性控制住。

该模型通过在回归方程中引入个体固定效应,将个体固有的特征控制在一个固定参数中,然后再根据时间变化来估计系统的动态变化趋势,以此得到因果效应估计。

优点:1.可以消除个体固定效应对结果的影响,得到精确的因果效应估计;2.适用于各种处理组和未处理组的情况,不受处理组和未处理组包含时间序列的限制;3.在时间序列较长的情况下,更容易提高模型准确度和可控性。

缺点:1.不能处理在时间和个体上变化的异质性问题,且容易受到省略变量等干扰因素的影响;2.涉及重复测量的面板数据时,需要大量的样本大小。

综上所述,双重差分模型和固定效应模型是两种常见的面板数据分析方法,具有不同的优缺点。

双重差分调节效应模型

双重差分调节效应模型

双重差分调节效应模型
双重差分调节效应模型是一种被广泛使用的统计学工具,用于研究两个或多个变量之间的相互作用。

在这种模型中,可以通过将样本组按照某个特定的因素分组来比较不同样本组之间的差异,并且可以检查某些变量是否对不同组之间的差异起到调节作用。

这个模型最初是在经济学领域中被开发出来的,目的是为了研究收入水平与补贴政策之间的关系。

双重差分调节效应模型将数据分为两组,分别是实验组和控制组。

实验组被给予某种干预措施,而控制组没有。

然后,将两组数据之间的差异与干预措施及其他变量之间的关系进行比较。

这个模型的优点是可以减小实验误差对结果的影响,从而更准确地评估干预措施的效果。

例如,研究人员想要研究一个新药治疗心脏病的效果。

可以将患者分成两组,一组接受新药治疗,另一组接受传统的治疗方法。

通过将两组患者之间的差异与药物治疗和其他变量之间的关系进行比较,可以确定药物治疗是否对患者的康复有积极的影响。

同时还可以检查某些因素(如性别、年龄等)是否对药物治疗产生了调节作用。

双重差分调节效应模型的一个重要应用是在教育研究中。

例如,在研究教育政策的效果时,可以将学生分组,一组接受政策干预,另一组不接受。

然后,将两组之间的差别与政策干预和其他相关因素之间的关系进行比较。

通过这种方法,可以评估教育政策对学生成绩和其他学业表现的影响,并检查某些因素(如性别、家庭背景等)是否对政策的效果产生了调节作用。

双重差分模型(DID)介绍及其应用

双重差分模型(DID)介绍及其应用

双重差分模型(DID)介绍及其应用双重差分模型(Difference-in-Differences, DID)是一种在计量经济学中常用的分析方法,用于评估政策或干预措施对一些群体或区域的影响。

DID模型通过比较处理组和对照组在干预前后的差异,来估计干预的效果,同时控制其他可能影响结果的因素。

DID模型的基本假设是处理组和对照组在干预前是相似的,且在干预后相似的变化也受到相似的影响。

该模型可以消除时间不变的固定效应和圈定效应的影响,从而能够更准确地评估政策或干预措施的效果。

DID模型的应用非常广泛,包括评估政策的影响、估计政府干预措施的效果、评估教育或健康项目的成效等。

以下是一些具体的应用案例:1.教育政策评估:研究者可以使用DID模型来比较实施教育前后学生的学业成绩、学生的参与度和教育资源分配情况等,以评估政策的影响。

2.劳动力市场政策评估:DID模型可以用于评估各类劳动力市场政策对就业率、工资水平以及职业发展的影响,例如最低工资政策、就业培训计划等。

3.健康政策评估:研究人员可以使用DID模型来比较实施健康政策前后人们的健康状况、医疗资源利用情况以及医疗费用等,以评估政策的效果。

4.环境政策评估:DID模型可以用于评估环境政策对环境污染的影响,例如排放限制政策、废弃物管理政策等。

在应用DID模型时,需要满足一些前提条件。

首先,时间上的变化应是外生的,即处理组和对照组没有受到其他干预的影响。

其次,处理组和对照组在干预前应是相似的,没有系统性的差异。

最后,DID模型的结果只能反映干预的平均效应,对个体或次群体的效应不能直接解释。

总体来说,DID模型是一种强大的工具,可以帮助我们评估政策或干预措施的效果,为政策制定者提供决策依据。

然而,使用DID模型时需要慎重考虑前提条件,并适当控制其他可能影响结果的因素,以增加研究的可靠性和准确性。

二重差分法分析(DID)

二重差分法分析(DID)

二重差分法分析(DID)双重差分模型(difference-in-differences)主要被用于社会学中的政策效果评估。

其原理是基于一个反事实的框架来评估政策发生和不发生这两种情况下被观测因素y的变化。

如果一个外生的政策冲击将样本分为两组—受政策干预的Treat组和未受政策干预的Control 组,且在政策冲击前,Treat组和Control组的y没有显著差异,那么我们就可以将Control组在政策发生前后y的变化看作Treat组未受政策冲击时的状况(反事实的结果)。

通过比较Treat组y的变化(D1)以及Control组y的变化(D2),我们就可以得到政策冲击的实际效果(DD=D1-D2)。

双重差分法,英文名Differences-in-Differences,别名“倍差法”,小名“差中差”。

作为政策效应评估方法中的一大利器,双重差分法受到越来越多人的青睐,概括起来有如下几个方面的原因:(1)可以很大程度上避免内生性问题的困扰:政策相对于微观经济主体而言一般是外生的,因而不存在逆向因果问题。

此外,使用固定效应估计一定程度上也缓解了遗漏变量偏误问题。

(2)传统方法下评估政策效应,主要是通过设置一个政策发生与否的虚拟变量然后进行回归,相较而言,双重差分法的模型设置更加科学,能更加准确地估计出政策效应。

(3)双重差分法的原理和模型设置很简单,容易理解和运用,并不像空间计量等方法一样让人望而生畏。

(4)尽管双重差分法估计的本质就是面板数据固定效应估计,但是DID听上去或多或少也要比OLS、FE之流更加“时尚高端”,因而DID的使用一定程度上可以满足“虚荣心”。

在细致介绍DID之前首先强调一点,一般而言,DID仅适用于面板数据,因此在只有截面数据时,还是不要浪费心思在DID上了。

不过,事无绝对,在某些特殊的情景下,截面数据通过巧妙的构造也是可以运用DID的,大神Duflo曾经就使用截面数据和DID研究了南非的养老金计划项目对学前儿童健康的影响,感兴趣的可以去搜搜大神的文章。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

pooled cross-sectional data / repeated cross-sectional da-
ta) 的 DID 模型
独立混合横截面数据是在不同时点从同一个的大
总体内部分别进行随机抽样,将所得的数据混合起来
的一种数据集。该类数据的特点为每一条数据都是独
立的观测值。通过将不同时点的多个观测值结合起
DID 模型正是基于自然试验得到的数据,通过建 模来有效控制研究对象间的事前差异,将政策影响的 真正结果有效分离出来。
医疗卫生领域常用于差异比较的统计方法
1.“前后”差异比较 是将研究对象干预后结局
变量的值 A t1 减去干预前的值 A t0 ,所得之差即为干预
效果 d,如下式: d = A t1 - A t0
2001 年 6 月哈佛大学公共卫生学院学者 Yip W 与 Eggleston K 对中国海南省的医疗报销付费制度改 革进行了分析〔4〕。同年 12 月,杜克大学卫生政策研究 中心学者 Conover C J 等人,对美国保险制度 M edicaid 对于妇幼 健 康 结 局 的 影 响 进 行 了 研 究〔5〕。 这 两 篇 文 章将 DID 模型引入医学和公共卫生领域,随后带动了 一批学者使用该模型进行相关研究。
“LINE”条件,则需要对数据进行进一步转化、分层以
及使用广义最小二乘等方法来进行模型的构造。
( 2) 适用于综列数据 ( panel data / longitudinal da-
ta) 的 DID 模型
综列数据同时兼有横截面数据和时间序列数据的
特点,要求在不同时点调查相同的研究对象。它与独立
混合横截面数据最大的不同在于,不同时点的观测值并
布的连续性变量,可通过非线性处理( 如取自然对数)
后再行建模,而进一步提高模型的拟合度。
DID 模型的国内外应用现状
1. DID 发展历史 1985 年普林斯顿大学的 Ashenfelter 和 Card 的一
中国卫生统计 2013 年 2 月第 30 卷第 1 期
·133·
篇项目评价的文章〔3〕,第一次引入了 DID 模型。随后 的十多年间,该模型在计量经济学界以及社会学界被 广泛应用。
( 4)
在( 4) 式中,Y 为被解释变量( dependent) ,T 和 A
是分别 代 表 时 间 和 分 组 的 虚 拟 变 量 ( dummy varia-
ble) 。T·A 即为时间和分组虚拟变量的交互作用。
在回归分析中,被解释变量不仅受到一些定量变量的
影响( 如年龄、收入、体重等等) ,还受到一些定性变量
通的较大范围的调查,很难收集到所有与 ai 有关的信 息,无法得到这个参数的某个无偏估计系数或关系式,
因此通常进行差分来移除 ai 而不影响对双重差分估 计量的无偏估计,即
△Yi( t( 1) - t( 0) ) = b1 ·△T + b3 ·△( T·G ) + △e it ( 10) 由于 DT 为固定不变的参数,用 d0 来代表截距 b1 · △T,因此将( 10) 式略微修改并进一步简化就成为:
进一步通过计量经济学方法对其进行分析。
3. 一般化 DID 模型
由于一般大规模的人群调查存在较大的变异性问
题,仅 在 模 型 中 纳 入 虚 拟 变 量“分 组 ( A) ”、“时 间 ( T) ”是远远不够的。为了提高解释系数 R2 ,需要加
入其他可能影响被解释变量的因素,即控制除分组、时
间变量以外的其他变量。对于结局变量是一些偏态分
△Yi = d0 + b3 ·D( T·G ) + △e it
( 11)
经过差分和简化后,就可以通过普通最小二乘法来对
综列数据进行回归了。
以上分析仅针对最简单的两时期综列数据进行分
析,通过差分来移除固定效应。而综列数据同样具有
时间序列的性质,对于多于两期的综列数据而言,还应
考虑到滞后性等问题,需要结合时间序列数据的特点,
组解释变量完全独立,即:
E( e it | A it) = 0
( 8)
在确定 满 足 条 件 ( 8 ) 以 及 满 足 回 归 方 程 要 求 的
“LINE”条件( 线性、独立、正态分布、方差齐) 后,该模
型可采用普通最小二乘( OLS) 来进行回归,并得到无
偏的估计量。若在实际情况中得到的数据不满足以上
中国卫生统计 2013 年 2 月第 30 卷第 1 期
·131·
双重差分模型介绍及其应用
北京大学公共卫生学院( 100191) 叶 芳 王 燕△
双重差分模型( difference-in-difference,DID) 近年 来多用于计量经济学中对于公共政策或项目实施效果 的定量评估。
通常大范围的公共政策有别于普通科研性研究, 难以保证对于政策实施组和对照组在样本分配上的完 全随机。非随机分配政策实施组和对照组的试验称为 自然试验( natural trial) ,此类试验存在较显著的特点, 即不同组间样本在政策实施前可能存在事前差异,仅 通过单一前后对比或横向对比的分析方法会忽略这种 差异,继而导致对政策实施效果的有偏估计。
来,从而可以加大样本量以获得更精密的估计量和更
具功效 的 检 验 统 计 量; 也 可 加 入 新 的 变 量———时 间
( 即干预前后) ,以便判断干预前后的差别。对于总体
Hale Waihona Puke 一致、范围较大、涉及不同时间点的调查研究,多收集 此类数据〔2〕。
这类数据的 DID 模型基本形式为:
Yit = b0 + b1 ·Tit + b2 ·A it + b3 ·Tit ·A it + e it
营养支持,而对照组无。若有部分对照组研究对象通
过各种办法也获得了该项免费营养支持,则违反了本
模型的第一项假设,造成干预效果的低估。( 2) 项目
开展期间,宏观环境( 除项目实施以外的因素) 对干预
组和对照组的影响相同〔1〕。( 3) 干预组和对照组的某
些重要特征分布稳定,不随时间变化,即在整个项目开
展期间保持稳定。
DID 模型的核心是构造双重差分估计量( DID es-
timator) ,通过对单纯前后比较( 干预前 vs. 干预后) 和
单纯截面比较( 干预组 vs. 对照组) 的结合,得到如下
公 式: dID = △珔Ytreatment - △珔Ycontrol = ( 珔Ytreatment,t1 -
素与分组变量完全无关,这样就不能保证( 8) 式,即残
差独立于分组变量。为了解决该问题,需将这些因素
从残差 e it 中分离出来。于是我们引入变量 ai ,称为固 定效应( fixed effect) ,代表不同个体的自身相关因素。
因为它不随时间变化,因此右下角脚标为 i。即有:
Yit = b0 + b1 ·Tit + b2 ·A it + b3 ·Tit ·A it + ai + e it ' ( 9) 相比( 4) 式,( 9) 式增加了新变量 ai。这样就在一定程 度上保证了残差项独立于解释变量这个条件。对于普
局变量 Y,分别选用相应的参数检验方法来进行建模。
·132·
Chinese Journal of Health Statistics,Feb 2013,Vol. 30,No. 1
2. 不同数据类型的基本 DID 模型
对于不同的数据类型,DID 模型的双重差分估计
量的估算方法有所不同。
( 1) 适 用 于 独 立 混 合 横 截 面 数 据 ( independent
我国学者周黎安、陈烨借鉴 DID 模型的思路,运 用全国 591 个县市级数据对我国农村税费改革政策的 效果进行系统的评价〔6〕,这也是国内医疗卫生领域首 次运用该模型对政策效果进行评价。
2. DID 模型的国外应用现状 通过对 pubmed 进行检索,从 2001 年至 2011 年 11 月共检索到 124 篇文献应用到 DID 模型对医疗卫 生相关领域数据进行分析,DID 模型的应用呈递增趋 势( 图 1) 。
预组结 局 变 量 的 值 Btreat 减 去 对 照 组 结 局 变 量 的 值
Bcontrol ,如下式: d = Btreat - Bcontrol
( 2)
该方法的使用需建立在一个重要的假设基础之
上,即干预实施前干预组和对照组之间需考察的结局
变量没有差异。在小范围、通过随机分组得到的研究
对象可满足这一假设,而对于大规模、规定区域分组的
( 6)
那么,干预的实际效果,即干预组和对照组在随访前后
被解释变量的差△△Yi 为:
△△Yi = △Yi( 1) - △Yi( 0) = ( b1 + b3 ) - b1 = b3
( 7)
因此,b3 就是我们最感兴趣的双重差分估计量。
由于混合独立横截面的一大特点: 数据集都是由
独立抽取的观测值构成的,因此可以满足残差项与分
珔Y ) treatment,t0 - ( 珔Ycontrol,t1 - 珔Ycontrol,t0 )
( 3)
其中,d 就是双重差分估计量,Y 为研究的结局变
量,右侧脚标中 treatment 和 control 分布代表干预组和
对照组,t0 和 t1 分别代表干预前和干预后。构造了差
分估计量之后,就要根据不同的数据类型和不同的结
为应变量,即可解决干预前干预组和对照组业已存在 的差异问题。协方差分析通过分离干预组和对照组可 消除其他影响因素,并考虑到干预实施前存在的应变 量的事前差异,可在理论上保证分析结果的真实可靠 性,然而过多、过于严格的应用条件使得协方差分析在 实际工作中并不能得到广泛使用。
相关文档
最新文档