(完整word版)DID双重差分法(20210203013002)
双重差分法的适用条件

双重差分法的适用条件摘要:一、双重差分法简介二、双重差分法的适用条件1.研究对象必须具有可观测的属性2.研究对象必须有多个观测值3.研究对象必须满足平行趋势假设4.研究对象必须满足恒定效应假设5.研究对象必须满足随机分组假设正文:双重差分法(Difference-in-Differences,简称DID)是一种常用的因果推断方法,适用于处理横断面和面板数据。
该方法通过比较实验组和对照组在处理前后的差异,来估计处理对结果的影响。
在实际应用中,双重差分法的适用条件需要被充分满足,以保证研究结果的准确性和可靠性。
一、双重差分法简介双重差分法是一种基于观测数据的因果推断方法,主要通过比较实验组和对照组在处理前后的差异,来估计处理对结果的影响。
该方法可以应用于横断面数据和面板数据,对于处理效应的估计具有较高的准确性和可靠性。
二、双重差分法的适用条件1.研究对象必须具有可观测的属性双重差分法要求研究对象具有可观测的属性,这样才能够将研究对象分为实验组和对照组。
如果研究对象的属性不可观测,那么就无法准确地将研究对象分组,从而无法应用双重差分法进行因果推断。
2.研究对象必须有多个观测值双重差分法需要有多个观测值才能够进行有效的因果推断。
如果研究对象只有一个观测值,那么就无法进行处理前后的比较,从而无法应用双重差分法。
3.研究对象必须满足平行趋势假设平行趋势假设要求实验组和对照组在没有处理的情况下,其趋势是平行的。
如果实验组和对照组在处理前的趋势不平行,那么就无法排除处理前的因素对结果的影响,从而无法得到准确的因果估计。
4.研究对象必须满足恒定效应假设恒定效应假设要求处理效应在实验组和对照组中是恒定的,即处理效应不会因为实验组和对照组的差异而产生变化。
如果处理效应不恒定,那么就无法得到准确的因果估计。
5.研究对象必须满足随机分组假设随机分组假设要求实验组和对照组是随机分组的,即每个研究对象都有相等的概率被分到实验组或对照组。
did方法

双重差分法(DID)是近年来的“学术明星”,常用于各种经济政策的评估。
只要有一个政策外生冲击使得我们的被解释变量 y 在两个维度发生变化,其实就可以考虑双重差分法(DID)。
当然,这两个维度一般都是时间维度和地区维度,所以DID常见于面板数据。
不过,双重差分法(DID)是一个大家族,除了标准DID模型之外,还存在多种扩展的(准)DID模型,今天咱们就来总结和梳理一下“DID大家族”的成员信息。
标准DID
标准DID是“DID大家族”的基础,也是最容易理解和学习的一种DID模型。
双重差分顾名思义,就是要做两次差分,一次是时间维度上的,一次是地区(个体)维度上的,在回归中我们可以通过交互项实现时间和地区维度的两次差分。
标准DID模型的形式如下所示:
其中,是政策分组变量,处理组取值为1,控制组取值为0;是政策时间变量,政策时点后取值为1,政策时点之前取值为0。
交互项的系数反映的就是经过两次差分后得到的“纯净”的政策效应。
did双重差分法中的omitted variable bias推导

did双重差分法中的omitted variable bias推导在计量经济学中,双重差分法(Difference-in-Differences,简称DID)是一种常用的估计因果效应的方法。
它通过比较处理组和对照组在处理前后的变化,来估计处理效应。
然而,在实际应用中,如果存在未观测到的变量(omitted variable),就会导致遗漏变量偏误(omitted variable bias)。
假设我们有两组实验对象,分别为处理组和对照组。
我们想要评估某个政策对处理组的影响,使用DID方法可以得到处理效应。
DID方法的基本思想是,对于处理组和对照组,它们在处理前的趋势应该是相似的。
如果在处理后,处理组的变化与对照组的变化有显著差异,那么这种差异可以被归因于处理效应。
然而,如果存在未观测到的变量影响了处理组和对照组的趋势,就会导致遗漏变量偏误。
这种未观测到的变量可能与处理变量和因变量同时相关,从而扭曲了我们对处理效应的估计。
为了详细推导遗漏变量偏误在DID方法中的影响,我们可以考虑以下简单的线性回归模型:Y_it = β0 + β1D_i + β2T_t + β3(D_i*T_t) + ε_it其中,Y_it是因变量(例如收入),D_i是处理变量(1表示处理组,0表示对照组),T_t是时间变量(1表示处理后,0表示处理前),D_i*T_t是处理变量和时间变量的交互项,ε_it是误差项。
如果我们没有考虑到某个未观测到的变量X_it,它与处理变量和因变量同时相关,那么我们的模型应该是:Y_it = β0 + β1D_i + β2T_t + β3(D_i*T_t) + β4X_it + ε_it这时,我们的估计结果就会受到遗漏变量偏误的影响。
具体来说,如果X_it是正相关的,那么我们的处理效应估计会被低估;如果X_it是负相关的,那么我们的处理效应估计会被高估。
为了解决遗漏变量偏误,我们可以尝试通过控制其他可能的影响因素,或者使用其他的估计方法(如IV-DID或者控制函数方法)。
双重差分方法的常见类型

双重差分方法的常见类型一、双重差分方法的概念与作用双重差分方法(Difference-in-Differences,DID)是一种常用的因果推断方法,主要用于评估政策干预或其他处理的因果效应。
它通过比较处理组和对照组在处理前后的平均结果变化来估计处理效应。
双重差分方法的关键假设是,在没有处理的情况下,处理组和对照组的结果变量的变化趋势是相同的,即平行趋势假设。
二、双重差分方法的常见类型1.并行双重差分法:在这种方法中,处理组和对照组在处理前后的结果变量变化趋势是平行的。
这种方法是最常见的双重差分设计,适用于评估政策干预的因果效应。
2.序列双重差分法:在这种方法中,处理组和对照组在处理后的结果变量变化趋势是平行的,但在处理前可能存在差异。
这种方法适用于评估连续性政策干预的因果效应。
3.交叉双重差分法:在这种方法中,处理组和对照组在处理前后的结果变量变化趋势可能不同,但处理组和对照组之间的差异在处理前后保持不变。
这种方法适用于评估跨部门或跨地区的政策干预效应。
4.重复双重差分法:在这种方法中,处理组和对照组在多个处理周期内的结果变量变化趋势是平行的。
这种方法适用于评估重复性政策干预的因果效应。
三、各类型双重差分法的应用场景与优缺点1.并行双重差分法:应用场景广泛,适用于政策干预、产品推广等。
优点是假设较为简单,易于操作;缺点是对于处理效应的估计可能受到平行趋势假设的限制。
2.序列双重差分法:适用于连续性政策干预的评估,可以较好地处理政策实施过程中的时间效应。
优点是能够较好地捕捉政策实施过程中的细节;缺点是对平行趋势假设的要求较高。
3.交叉双重差分法:适用于跨部门或跨地区的政策干预效应评估,可以较好地处理部门或地区间的差异。
优点是具有较强的适用性;缺点是操作复杂,对数据要求较高。
4.重复双重差分法:适用于重复性政策干预的评估,可以较好地处理政策实施过程中的动态效应。
优点是能够较好地捕捉政策实施过程中的动态变化;缺点是对重复处理周期假设的要求较高。
双重差分法原理

双重差分法原理
双重差分法是一种常用的分析方法,被广泛应用于经济学和其他社会科学领域。
它的
原理是通过对数据进行两次差分操作,来消除序列的非平稳性,提取出序列的趋势信息。
双重差分法的步骤如下:
1. 第一次差分:将原始序列中的每个观测值减去其相邻观测值,得到一系列新的差
分值。
2. 第二次差分:对第一次差分后得到的新序列再进行一次差分操作,得到双重差分
的结果。
通过这两次差分操作,双重差分法能够消除序列中的季节性、趋势性等非平稳成分,
从而使得序列变得平稳。
平稳序列的特点是数据的均值和方差不随时间变化,更有利于进
行统计分析和建模。
在应用双重差分法时,需要注意以下几点:
1. 数据的选择:双重差分法适用于存在趋势和季节性的非平稳序列。
在选择数据时,需要确保序列存在这种特征。
2. 差分阶数:差分的次数可以根据序列的性质和目标进行调整。
一般情况下,一次
差分可以消除线性趋势,两次差分可以消除线性趋势和季节性。
3. 检验平稳性:在进行双重差分之前,需要对差分后的序列进行平稳性检验。
常用
的方法包括ADF检验和单位根检验。
双重差分法的优势在于能够较好地处理非平稳序列,提取出序列的趋势信息。
通过该
方法,我们能够更准确地分析序列的性质和趋势变化,进行预测和决策。
DID双重差分回归

Difference
β0+ β1+ β2+ β3 ΔYt = β2+ β3
β0+ β2
ΔYc = β2
ΔΔY = β3
2021/3/26
15
More general model
• Dat(i) – time (t) – Outcome is Yit
• If the intervention occurs in an area with a different trend, will under/over state the treatment effect
• In this example, suppose intervention occurs in area with faster falling Y
the intervention
• Yit = β0 + β1Tit + β2Ait + β3TitAit + εit
2021/3/26
14
Yit = β0 + β1Tit + β2Ait + β3TitAit + εit
Before After Change Change
Difference
Group 1 β0+ β1 (Treat)
2021/3/26
11
Y Yc1 Yt1
Yc2
Yt2
2021/3/26
Estimated treatment
True treatment effect
control
treatment
True Treatment Effect
[比较·学习心得] DID(双重差分)DDD(三重差分)倾向得分匹配、断点回归、处理效应等之间的关系图
![[比较·学习心得] DID(双重差分)DDD(三重差分)倾向得分匹配、断点回归、处理效应等之间的关系图](https://img.taocdn.com/s3/m/823e08c31eb91a37f0115c2e.png)
处理效应模型断点回归含程序判断是精确断点回归问题还是模糊断点回归问题倾向得分匹配双重差分倾向得分匹配处理变量依可测变量选择处理变量依不可测变量选择偏差校正的匹配估计等等
针对随机实验、自然实验得到的实验数据、政策实施后的观测数据的评价方法(如政策评价等),
通常有DID(双重差分法、倍分法、倍差法)、DDD(三重差分法)(含检验是采用DID、还是DDD?)、处理效应模型、断点回归(含程序判断是精确断点回归问题、还是模糊断点回归问题)、倾向得分匹配、双重差分倾向得分匹配、处理变量依可测变量选择、处理变量依不可测变量选择、偏差校正的匹配估计等等。
双重差分法原理(一)

双重差分法原理(一)双重差分法(Double Difference Method)什么是双重差分法?•双重差分法是一种常用的数据分析方法,用于评估特定事件对观测结果的影响。
•它通过对对照组和实验组之间,以及不同时期的差异进行比较,消除了潜在的混杂因素的影响,得到更准确的因果估计结果。
常见应用领域•双重差分法在经济学、社会学、医学等领域有广泛的应用。
•经济学:用于评估政策变化对经济指标的影响,如最低工资政策对就业率的影响。
•社会学:用于研究特定事件对社会群体的影响,如教育政策对学生成绩的影响。
•医学:用于评估治疗方法的有效性,如新药对患者疾病状况的影响。
双重差分法原理及步骤1.确定观测组和对照组–观测组:受到特定事件/处理影响的群体。
–对照组:没有受到特定事件/处理影响的群体,用于作为比较基准。
2.选择观测期和控制期–观测期:特定事件/处理发生后的时间段。
–控制期:观测期之前的相同时间段,用于作为对照组的基准。
3.计算差分–对观测组和对照组在观测期和控制期的指标进行差分计算。
–差分 = 观测组(观测期) - 观测组(控制期) - 对照组(观测期) + 对照组(控制期)。
4.通过对差分进行回归分析–使用回归模型,将差分作为因变量,并考虑其他可能的解释变量。
–通过回归分析得到差分的系数,用于评估特定事件/处理对观测结果的影响。
5.构建置信区间和假设检验–构建置信区间,评估差分系数的置信度。
–进行假设检验,判断差分系数是否显著不为零。
双重差分法的优势和注意事项•优势:–双重差分法能够消除观测组和对照组之间的固定差异,得到更准确的因果估计结果。
–双重差分法对于潜在的混杂因素具有较强的鲁棒性,可以降低估计结果的偏误。
•注意事项:–双重差分法的有效性依赖于事件的随机性。
如果事件并非随机发生,结果可能受到其他因素的影响。
–双重差分法要求观测组和对照组在除了特定事件/处理之外的其他因素上足够相似,以消除混杂因素的影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
双重差分法的平行趋势假定
双重差分法是估计处理效应的常见方法,但也有被滥用的倾向,因为有些应用者对于双重差分法的优 点与局限
缺乏了解,特别是其潜在的平行趋势( parallel trend )假定 ....
差分法的局限
经济学家常关心某政策实施后的效应,比如对于收入( y )的作用。最简单(天真)的做法是比较处
理组(即受政策影响的地区或个体)的前后差异,比如
这称为 差分估计量"(difference estimator ),即将处理组(treatment group )政策实施后的样本均值, 减去
政策实施前的样本均值。然而,由于宏观经济环境也随时间而变(时间效应),故政策实施地区的前 后差异未必就是
处理效应(treatment effects )。
双重差分法的反事实逻辑
为了解决差分法的局限性, 常用方法是寻找适当的控制组 (cont⑹group ),即未实施政策的地区(或
未参加项目的个体),作为处理组的反事实( counterfactual )参照系。具体来说,可将未受政策影响的控 制组之
前后变化视为纯粹的时间效应,即
V control — ^ctwiirof, before
综合以上两个差分,即将处理组的前后变化减去控制组的前后变化,可得到对于政策处理效应更为可 靠的估
计:
这就是所谓的双重差分估计量( Difference in Differences,简记DD或DID ),因为它是处理组差分
与控制组差分之差。该法最早由 Ashenfelter (1978 )引入经济学,而国内最早的应用或为周黎安、陈烨
(2005 )
从以上推理可知,DID的反事实逻辑能够成立,其基本前提是,处理组如果未受到政策干预,其时间
效应或趋势应与控制组一样(故可以后者来控制时间效应),这就是所谓的
或 共同趋势”(common trend )假定。下图直观地展示了 DID的思想与平行趋势假定。
平行趋势"(parallel trend )
E 伽G = = 1) = a + d
其中,t = 1表示政策实施前(before ),而t = 2表示政策实施后(after)。然而,通过双重差分得 到的DID
估计量并不易计算其标准误,无法加入控制变量,也不易推广到多期数据。故在实践中,一般通 过回归的方法来得到
DID估计量。
双重差分法的回归模型
考虑以下面板模型:
其中,Gi为分组虚拟变量(处理组 =1,控制组=0),表示处理组与控制组的固有差异(无论是否实施 政策都
存在);Dt为分期虚拟变量(政策实施后 =1,政策实施前=0,允许使用多期数据),表示政策实施 前后的时间效应
(即使不实施政策也存在);而交互项 Gi • Dt才真正表示处理组在政策实施后的效应,
即处理效应。这是因为,处理组在政策干预之后的期望值为:
1, Df = 1) = « + 7
而处理组在政策干预之前的期望值为:
£7(VH|
Gi = 1, A = 0) = -a + 7
故处理组期望值的前后变化为:
八几匕 m 1:八丛.匕1: D 工 「」
⑶
另一方面,控制组在政策干预之后的期望值为:
而控制组在政策干预之前的期望值为:
E(则 q = 0, = 0) = a
故控制组期望值的前后变化为:
将(3)式减去(4)式可知,双重差分的结果正好是回归方程 (2)中交互项 Gi -Dt之系数 仇进一步可以证
明,用OLS估计面板模型⑵,所得交互项 Gi -Dt之系数B的估计值,正好等于双重差分法 ⑴的计算结 果(陈强,
2014,第 335、339 页)。
一般的双重差分回归
更一般地,可在面板模型中加入个体固定效应、时间固定效应,以及其它控制变量:
丁门二二一-丄农 + •丁 + 匕 + 心一:卫 (5)
其中,5为个体固定效应(取代了更为粗糙的分组虚拟变量 Gi,若同时二者包括将导致严格多重共
线性),入为时间固定效应(取代了更为粗糙的分期虚拟变量 Dt ,若同时包括二者将导致严格多重共线
性),zit为一系列控制变量(影响结果变量 y的其它因素),而 at为暂时性冲击(transitory shock )。
不难看出,上式其实就是 双向固定效应模型"(two-way fixed effects ),因为它既包括个体固定效应
(Ui ),也包括时间固定效应(入);只不过多了双重差分法的关键变量,即交互项 Gi -Dt (也称为 政
策虚拟变量”,policy dummy )。在具体回归中,个体固定效应 Ui可通过加入个体虚拟变量来实现 (即LSDV 法,
或进行组内离差变换,within transformation );而时间效应 入可通过加入每期的时间虚拟变量 (time dummies )来
实现。
双重差分法的假定
为了使用OLS —致地估计方程(5),需要作以下两个假定。
假定1、此模型设定正确。特别地,无论处理组还是控制组,其时间趋势项都是 入。此假定即上文的
平行趋势假定"(parallel trend assumption )。此假定比较隐蔽(有人称为 “ hidden assumption ) ”因为
只要写下方程(5),就已默认了平行趋势假定。
假定2、暂时性冲击 at与政策虚拟变量 Gi -Dt不相关。这是保证双向固定效应为一致估计量
(consistent estimator )的重要条件
在此,可以允许个体固定效应 Ui与政策虚拟变量 Gi -Dt相关(可通过双重差分或组内变换消去 Ui ,
或通过LSDV法控制Ui )。DID允许根据个体特征(Ui )进行选择,只要此特征不随时间而变;这是 DID 的最大优
点,即可以部分地缓解因 选择偏差”(selection bias )而导致的内生性(endogeneity )。
如果违背假定1 (平行趋势假定),会有什么后果?假设真实模型为:
ya =尬 + 0G ■ A + 吋环 + g + 入 + Gg + 鼬
则处理组(Gi=1)的时间趋势为(入+ n),而控制组(Gi =0)的时间趋势为 入,故为非平行趋势。如 果将此
模型误设为平行趋势,则实际估计的模型为
孙* = m + 卩£却
h
Dt + Y 込就 + + At + (G功 +
其中,Gi n被纳入扰动项中,导致扰动项 (Gi n+ at)与政策虚拟变量(Gi -Dt )相关,使得OLS
不一致,也违背了上述假定 2。
阿森费尔特沉降(Ashenfelter ' s dip)
在使用个体或企业层面的微观数据时,有些人认为因个体无法影响宏观政策(或培训项目)的推出, 故为外
生。但事实上,个体依然可以自我选择是否参加项目,从而导致内生性。
比如,Ashenfelter (1978) 在研究就业培训的效应时发现, 参加就业培训者在参加培训之年 (1964)以
及之前的那年 (1963),其平均收入不仅相对于控制组下降,而且绝对地下降,称为 阿森费尔特沉降”
(Ashenfelter ' s dip,参见下图。
--coniroi GrtxipMeen Earning
Trainee 冷Ean Earning
在上图中,实线为参加项目者的平均收入,而虚线为未参加项目者的平均收入(二者均为男性白人,
该现象也存在于女性白人、男性黑人、女性黑人,在此从略)。上图表明,在 1963年与1964年收入下降
的不走运者(st为很大的负向冲击),很多人自我选择参加就业培训。
如果因为s或st-1特别低而参加培训,贝U通常st+1与 牡+2会恢复到正常值,导致高估培训项目的 效应。而
{哦}也可能存在自相关。这使得暂时性冲击 %与政策虚拟变量 Gi - Dt相关,导致不一致的估
计(也意味着非平行的时间趋势,违背假定 1,参见上图)。
非平行趋势的检验与处理方法
方法一、画时间趋势图
如果在政策干预前有多期数据,则可分别画处理组与控制组的时间趋势图(类似于上图),并直观判
断这两组的时间趋势是否平行(比如,考察是否存在 Ashenfelter's dip )。如果二者大致平行,则可增强对
平行趋势假定的信心。然而,即使在政策干预前两组的时间趋势相同,也无法保证二者在干预后的时间趋 势也相同
(后者本质上不可观测,因为时间效应已与处理效应混合在一起)。另外,如果只有两期数据, 则无法使用此法。
方法二、加入更多的控制变量
从上文的讨论可知,非平行趋势可能由于遗漏变量所导致,故在 z,中加入更多控制变量,或可缓解
内生性。但此法在实践中不易实施。
方法三、假设线性时间趋势
如果假设时间趋势为线性函数,则可加入每位个体的时间趋势项:
ya = + Dt +呵跖 +広f +选+
E
養
在具体回归时,加入个体虚拟变量与时间趋势项 t = 1,2, ... , T的交互项即可。然而,线性时间趋势
毕竟是较强的假定,不一定能成立。故此法也不完全解决问题,但可作为稳健性检验。
方法四、三重差分法
在一定条件下,可通过引入两个控制组,进行三次差分,称为 三重差分法
(difference-in-differences-in-differences ,简记DDD ),这样可以更好地控制时间趋势的差异,使得平行 趋势
假定更易成立。有关 DDD的进一步介绍,参见陈强(2014,第343页)