差分断点回归设计(DIRD)及其在人口断点中的应用

合集下载

断点回归方法的应用

断点回归方法的应用

一引言2010年4月24日,该年度的约翰·贝茨·克拉克奖章(John Bates Clark Medal)——针对40岁以下年轻经济学者的最高荣誉,授予了麻省理工学院经济系的Esther Duflo教授以表彰其在随机实验普及和其在发展经济学中应用方面的卓越贡献。

在因果关系分析的实证方法中,最优的选择应当为随机实验,但是随机实验的时间成本和经济成本都比较高,而在随机实验不可得的情况下,需要考虑使用其它方法。

断点回归(Regression Discontinuity)便是仅次于随机实验的,能够有效利用现实约束条件分析变量之间因果关系的实证方法。

Lee(2008)认为在随机实验不可得的情况下,断点回归能够避免参数估计的内生性问题,从而真实反映出变量之间的因果关系。

然而,断点回归也仅仅是在20世纪90年代末才被应用于处理经济学的问题。

2001年,Hahn等人对断点回归模型的识别和估计的理论问题进行了严格细致的分析,此后,断点回归才在众多的经济学研究领域中崭露头角。

时至今日,断点回归已经在劳动和教育经济学、政治经济学、环境经济学和发展经济学等领域取得了广泛的应用。

然而,断点回归却鲜为中国经济学者所应用,正是基于断点回归在实证研究中的重要性和国内文献的缺乏,本文拟以此为背景,从断点回归的理论、发展历史、实证步骤和经济学中的应用几个方面阐述断点回归这一个新“拟随机试验”方法的兴起。

二断点回归理论及发展历史断点回归是一种拟随机实验,此种随机实验定义了这样一个特征,即接受处置(Treatment)的概率是一个或者几个变量的间断函数。

Hahn et al.(2001)提出了断点回归的首要假设,如果变量表示处置效应,表示决定处置的关键变量,那么和必须存在,并且。

在使用断点回归的情况下,存在一个变量,如果该变量大于一个临界值时,个体接受处置,而在该变量小于临界值时,个体不接受处置。

一般而言,个体在接受处置的情况下,无法观测到其没有接受处置的情况,而在断点回归中,小于临界值的个体可以作为一个很好的可控组(Control Group)来反映个体没有接受处置时的情况,尤其是在变量连续的情况下,临界值附近样本的差别可以很好的反映处置和经济变量之间的因果联系。

断点回归设计国内外研究综述

断点回归设计国内外研究综述

断点回归设计国内外研究综述和其他因果分析方法相比, 学术界普遍认为运用断点回归设计更接近准自然实验, 估计的结果更加准确, 因此近年来越来越多的实证文献依赖断点回归设计进行政策效应评估。

文章主要按照模型设定、估计方法、相关实证研究这三个方面对国内外相关理论和文献进行述评, 呈现断点回归设计完整的理论框架和应用领域, 旨在为国内相关研究者提供借鉴。

文/吉丹俊来源/无锡商业职业技术学院学报因果分析与政策效应评估是经济分析最为关注的核心问题[1], 运用计量模型进行因果分析的难点在于如何避免模型的内生性问题。

针对这一问题, 微观计量领域的学者们通过不断探索, 借助于心理学和医学研究中准自然实验(quasiexperiment) 的思想评估不同政策的处理效应, 试图获得一致 (consistent) 或者无偏 (unbiased) 估计量。

常见的通过准自然实验思想估计处理相应的模型有:工具变量(Instrumental variables) 、匹配和加权估计法 (matching and reweighting) 、倍差法(difference-in-difference) 和断点回归设计(regression discontinuity design) [2]。

和其他方法相比, 学术界普遍认为运用断点回归设计更接近准自然实验, 估计的结果更加准确。

因此, 近年来越来越多的实证文献依赖断点回归设计进行政策效应评估。

Thistlethwaite、Campbell于1960年首次提出使用断点回归设计研究处理效应, 在该文中他们的目的是研究奖学金对于未来学业的影响, 学生是否获得奖学金取决于考试的分数。

如果考试分数大于获奖标准分数, 则进入处理组;如果考试分数小于获奖标准分数, 则进入控制组。

因此处理变量在获奖标准分数处形成了一个断点, 该研究设计的主要思想是可以利用靠近这一断点附近的样本来有效估计处理效应[3]。

断点回归和读者的提问解答

断点回归和读者的提问解答

断点回归和读者的提问解答本文包括两部分:政策评估方法里的断点回归设计(regression discontinuity design),附加了部分倾向匹配分析方法,和读者3个提问的解答(文章后面)。

断点回归是一种准实验设计。

如果政策在一个关于个人背景的连续的变量(例如考试成绩、家庭人均收入等)上设定一个临界值(Cutoff/Threshold),使得在临界值一侧的个体接受政策干预,而在临界值另一侧的个体不接受干预,则在临界值附近就构成了一个准实验。

我们把这个决定了是否接受干预的连续变量叫做强制变量(Forcing Variable),由于强制变量是连续的,所以在临界值两侧的个体应该是类似的、可比的,则这两侧的个体在产出上的差异就应该是干预造成的差异。

当个体是否接受政策干预由强制变量值与临界值之间的关系决定时,我们可以用如下数学表达式:现在假设设立了奖学金,且只有成绩高于一个临界点的学生才能获得,则获得这个奖学金对上大学概率的影响可以用公式(10)来表达:应用断点回归的一个经典研究是Lemieux&Milligan(2008)(17)。

他们研究社会救助会不会影响就业率。

劳动力经济学家根据理论推测,增加社会救济会减少接受救济的人群工作的必要性,从而减少劳动力供给、降低就业率。

Lemieux&Milligan(2008)研究的这个社会救助项目规定30岁以下的人只能获得185美元,而一旦超过30岁,就可以获得507美元,这是一个巨大的差额。

因此年龄就是这个政策的强制变量,临界点是30岁。

图4展示了1986年人口普查时30岁以下和30以上的人群获得社会救助的额度。

可以看到在临界点两侧,人们的救助收入有一个飞跃。

因此,实际情况完全符合政策设计。

图5展示了人口普查当天在临界点30岁附近,就业率的情况。

可以看到,在30岁附近的就业率确实有一个跳跃。

这就是在30岁时大幅增加社会救助的干预效应——降低就业率。

Stata:不可不知的4种断点回归(RDD)中的平滑性检验方法

Stata:不可不知的4种断点回归(RDD)中的平滑性检验方法

Stata:不可不知的4种断点回归(RDD)中的平滑性检验方法Stata: 不可不知的4种断点回归 (RDD) 中的平滑性检验方法断点回归由Thistlewaite and Campbell(1960)首次使用,但直到1990年代末才引起经济学家的重视。

Thistlethwaite、Campbell于1960年首次提出使用断点回归设计研究处理效应,在该文中他们的目的是研究奖学金对于未来学业的影响, 学生是否获得奖学金取决于考试的分数。

此后30年, 该方法并未引起学术界的重视,直到1990年以后, 断点回归设计开始被应用于各种领域,并且近年来成为因果分析和政策评估领域最重要的研究方法。

Hahn et al(2001)提供了断点回归在计量经济学理论基础。

目前,断点回归在教育经济学、劳动经济学、健康经济学、政治经济学以及区域经济学的应用仍方兴未艾。

参见Imbens and Lemieux(2008),Van Der Klaauw(2008)以及Lee and Lemieux(2010)的文献综述。

在进行断点回归(RD)设计时,一般需要检验参考变量分布连续性检验/检验内生分组这里检验内生分组,即主要检验配置变量,其实就是RD中个体是否将自行进入断点两侧,决定是否进入实验的,并是否存在某种跳跃性的变化。

如果存在内生分组,个体将自行进入实验,导致在断点两侧的分布不均匀,这样分组变量x的密度函数f(x)在x=c处不连续,出现左右极限不相等的情况。

McCrary(2008)提出了一种核密度函数的检验方法(命令是DCdensity,介绍见下述操作),将参考变量划分成不同的区间并计算各区间中的个体数量,如果个体能够操纵参考变量,我们将能观测到断点左右个体数量有较大差别,比如很多个体通过操纵到了断点的右侧,那么,在断点右侧的区间中个体数量可能将大大超过断点左侧区间中个体的数量,利用带宽选择和曲线拟合方法,可以检验在断点处c是否存在跳跃。

断点回归RDD

断点回归RDD

工具变量法( Instrumental Variable,IV) 、双重差分法( Difference-in-Difference,DID) 和断点回归设计( Regression Discontinuity Design,RDD) 成为应用微观计量研究中运用最广泛的方法。

断点回归是拟随机实验方法中揭示因果效应最有效的一种方法,可以视作是一种特殊的倾向值匹配,它不需要对多个混淆变量控制,而是考虑一个个体是否接受某个自变量的影响。

RDD 优势:更接近于随机试验的拟随机实验方法,从理论上讲是一种更好的因果识别方法。

拟随机实验方法是以统计控制模拟实验控制,从而检验因果假设。

Lee(2008)认为在随机实验不可得的情况下,断点回归能够避免参数估计的内生性问题,从而真实反映出变量之间的因果关系。

1960 年就已被Thistlethwaite 和Campbell( 1960)提出,Lee 和Lemieux ( 2010)提出了运用RDD 做经验研究的规范。

RDD 适用条件:符合非混淆假设。

在断点附近有较多观测值,对数据要求很高。

强制变量一定要非常干净,强制变量的临界值不得用于作为实验之外的干预。

断点回归设计的基本逻辑哲学逻辑:Holland(1986)通过总结自然科学、社会科学的大量研究和讨论,提出科学的解决方案和统计的解决方案两种解决因果问题的方案,科学的解决方案主要包括重复实验和随机实验。

断点回归的主要思想,运用随机实验思想,控制研究的样本近似于随机分布在临界值附近,小于临界值的样本作为控制组,大于临界值的样本作为实验组,通过比较它们的差别来研究干预变量和结果变量之间的因果联系。

统计逻辑:通过统计控制,使得非实验的调查数据尽可能地随机分布在临界值附近,同时,满足非混淆假设,就是要求结果变量独立于干预变量。

解决了传统方法中个体异质性和混杂因素的问题。

非混淆假设要求研究对象是随机地分配到实验组和对照组,即二分量D(实验处置变量)本身和最后的实验结果Y1(接受实验的结果——事实)、Y0(未接受实验的结果——反事实)没有关系(工具变量思想),换句话说,Y1、Y0独立于D。

断点回归法事件研究法

断点回归法事件研究法

断点回归法事件研究法断点回归法(Breakpoint Regression Analysis)是一种常用的事件研究方法,在金融学、经济学、管理学等领域得到广泛应用。

本文将介绍断点回归法的基本概念、原理和应用,并探讨其优缺点。

一、断点回归法的基本概念断点回归法是一种用于研究某个事件对特定变量的影响的统计方法。

该方法通过在时间序列数据中选择一个或多个断点,将数据分为两个或多个子样本,然后对每个子样本进行回归分析,从而比较不同子样本之间的差异。

这种方法能够帮助研究者判断某个事件对变量的影响是否存在、是否显著,并进一步分析影响的程度和方向。

二、断点回归法的原理断点回归法的核心原理是基于时间序列数据中存在的某个结构性断点,该断点可能是由于政策改变、市场变动、经济周期变化等原因引起的。

研究者通过设定断点,将样本数据分为两个或多个子样本,然后对每个子样本进行回归分析。

在分析中,需要控制其他可能影响结果的变量,以确保所得的结果是由所关注的事件引起的。

三、断点回归法的应用断点回归法在金融学、经济学、管理学等领域有广泛的应用。

例如,在金融市场中,研究者可以使用断点回归法来分析某个重大事件对股票市场的影响。

他们可以选择一个事件作为断点,将数据分为事件前后两个子样本,然后对每个子样本进行回归分析,以比较事件前后的差异。

这样可以帮助研究者了解事件对股票价格、交易量等指标的影响程度和方向。

四、断点回归法的优缺点断点回归法具有一定的优点和缺点。

其优点在于可以通过选择合适的断点,准确地判断事件对变量的影响,并量化影响的程度和方向。

此外,断点回归法能够更好地控制其他可能的干扰变量,提高分析结果的可靠性。

然而,该方法也存在一些缺点,如对断点的选择比较主观,需要研究者具备一定的经验和专业知识;另外,断点回归法只能检测到存在结构性断点的影响,对于连续性变化的影响则无法有效分析。

断点回归法是一种常用的事件研究方法,通过选择断点,将样本数据分为两个或多个子样本,并对每个子样本进行回归分析,以比较不同子样本之间的差异。

断点回归方法及其应用

断点回归方法及其应用

断点回归方法及其应用下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。

文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!断点回归方法及其应用断点回归方法是一种用于分析因果关系的方法,通过对处理组和对照组进行划分,并利用断点回归分析处理效应。

社会科学研究中的断点回归设计

社会科学研究中的断点回归设计

社会科学研究中的断点回归设计
断点回归设计是社会科学研究中常用的一种方法,旨在探究某个自变量在一个或多个特定阈值点发生变化时,对因变量产生的影响。

在断点回归设计中,研究者首先选择一个或多个自变量作为断点,并通过对该自变量的某个或多个阈值点进行分割,将样本观测值划分为低于、高于或等于阈值的不同组别。

然后,通过运用回归分析,分别对每个组别进行回归分析,以探究自变量在不同组别中对因变量的影响。

主要应用领域包括经济学、教育学、社会学等社会科学领域。

例如,在经济学中,研究者可能对所得水平进行断点回归分析,以探究所得对消费行为的影响是否存在非线性关系。

断点回归设计的优点包括能够识别自变量与因变量之间的不同关系模式,帮助理解自变量对因变量的影响方式;同时,通过考察阈值点,还可以揭示政策或实践上的相关意义。

然而,断点回归设计也存在一些限制和挑战。

例如,确定合适的阈值点需要在理论和实证的基础上进行推断,具有一定的主观性和不确定性;此外,样本选择和内生性问题也可能对分析结果产生影响。

总而言之,断点回归设计是一种用于社会科学研究中探究自变量对因变量影响的方法,其在研究领域中应用广泛,可以帮助研究者更深入地理解相关关系,并为政策制定提供参考依据。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

差分断点回归设计(DIRD)及其在人口断点中的应用
2015-12-27BOSS应用微观计量经济学
差分断点回归设计(DIRD)及其在人口断点中的应用在各国的政策实践(特别是财政政策和选举政策等)中,经常有针对不同城市人口范围制定差异化政策的设定。

近年来,利用这种人口层级使用断点回归设计来解决实证研究中内生性问题的文章大量涌现。

然而,由于人口本身的特殊性,使用人口作为驱动变量进行的断点回归设计与一般的断点不同,存在着一些天然的陷阱,并且往往不为研究者所注
意。

Eggers等人的最新工作论文Regression DiscontinuityDesigns Based on Population Thresholds: Pitfalls and Solutions针对这一问题做了详细的阐述。

作者通过搜集发现,使用人口断点的实证文献有28篇之多,并且这一数目还在不断增加。

作者指出,使用人口断点的文章必须注意两个陷阱:
1、政府制定政策时如果采用人口断点,那么通常会有多项不同的政策采用相同的政策断点,因此研究者估计的断点两侧Y变量的跳跃很有可能并非某一项具体政策的效果,而是多项不同政策加总的净效果。

这一问题在研究者使用模糊断点回归(Fuzzy RDD)时将会变得尤为严重,作者将其称为confounded treatment problem。

针对这一问题,作者建议使用刚刚发展起来的“差分断点回归设计”(Difference-in-discontinuitiesdesign,DIRD)进行更为细致的检验。

差分断点回归设计的基本思想十分简单,当某一政策断点处两项政策
的混合效果AB和其中某项政策的效果B已知时,直接做差即可得到A的一致估计。

当然,如果我们要得到其中某些政策的处置效应,前提必须是这两项政策在某一具体的断点处实施的时间上有差异,与此同时我们假定这一处置效应不随时间变化。

如果两项政策碰巧又是同时实施的(此处应有叹息声),那么我们可以退而求其次,寻求新的假定来实施差分断点回归。

例如,当基于人口断点的政策利用的是多断点时(几乎所有的文献中使用的人口断点都是多断点,这是由政策制定的实际决定的),如果我们假定不同人口断点处的处置效应是相同的,碰巧A政策与B政策只在某一特定的断点处重合而不在另一个断点处重合,那么我们仍然可以通过做差的方式来消除重合断点产生的混淆效应。

如果上述设定仍然难以找到,我们可以进一步寻求空间上的差异,看看其他地区有没有与我们关注的地区存在variation从而使得我们能够区分两项政策。

如果时间、不同断点处和空间上都没有差异,那么我宣
布:A、B这一对好基友天长地久,确实难以分开,少年,洗洗碎吧……
2、当某项政策给地方政府带来的激励足够强时,地方政府可能通过某种手段操纵当地的人口数量,从而使得自己落入更加符合自身利益的政策区域内。

RDD模型的设定本身要求,样本无法精确地操纵(precisely manipulate)是否接受处置。

目前一个近似标准化的做法是检验驱动变量(forcing variable)在断点两侧分布情况,如McCrary检验(McCrary,2008)。

然而,作者通过法国、意大利和德国的几个政策实例发现,当驱动变量不是连续变量的时候,McCrary检验的结果是有偏的。

此外,大量的文献受制于某些特殊的情况(例如断点很多,某个具体的断点两侧的样本量不足,或者想要估计一个所谓
的“加总效果”),通常会尝试将多个断点“堆叠”起来的模型设定。

一旦采用数据堆叠,那么一定会导致断点两侧的人口分布出现不连续的情况,从而使得McCrary检验失效。

当然,最后作者给了我们极大的宽慰,尽管使用人口断点可能存在这样那样的问题,但这些问题并不会影响我们利用RDD的方法来解决实证研究中的内生性问题,因为你现在也找不到别的更好的办法。

Don’t throw the baby out withthe bathwater,换一种表达方式是you canyou up,no canno BB.
阅读 271918。

相关文档
最新文档