断点回归及其在经济学中的应用

合集下载

RD断点回归法

RD断点回归法

Y ou jump, I will not jump!断点回归的连续性假设断点回归RD是当代社会科学因果推断的最基本无害的大招之一。

比如我们要研究上一本大学是否能提高一个人的工资,如果直接对比上了一本大学和没上一本大学群体的工资,可能会因为上一本大学的天生能力更强而得出有偏误的结论,而能力等不可观测变量无法控制。

RD给我们提供了一个思想——观察一本线附近上下几分学生的工资。

比一本线低2分、1分的人工资差距不大,高2分、1分的差距也不大,但比一本线低1分的和正好达线的工资上有个跳跃,那这个跳跃就是一本大学对工资的作用。

一本线产生了一个天然的跳跃(两侧的人分别上一本和二本),如果在一本线两侧我们也看到了关注变量(工资)的跳跃,那么就识别了因果效应。

直觉上来看,RD的成立还需要一个关键假设:一本线产生了一个天然的跳跃,但一本线附近学生各特征不能有跳跃!否则就混淆了一本大学对工资的作用。

这就是连续性假设。

1、断点回归背景介绍Thistlethwaite and Campbell(1960)使用了RD方法后的40年,RD并没有在经济学中大规模使用,一大原因就是RD太像自然科学的随机实验了,太不像经济学传统方法了(比如上周我们BLUE_OLS读Black(1999)关于择校会使房价上升的论文(”Do better schools matter? Parental valuation of elementary education”),该文利用学区边界推断因果,应该说思想跟RD 很像,但没有按照RD框架来写,可能的原因是作者写作年代RD还并不流行)。

直到Hahn, Todd, and van der Klaauw(2001)把RD纳入到了我们熟悉的“反事实因果推断”框架下,如下图(原文图2)。

我们把断点看成一种treatment,断点右侧的是处理组,断点左侧的是控制组。

可以观测到处理后的处理组,和未处理的控制组。

诺贝尔奖断点回归例子

诺贝尔奖断点回归例子

诺贝尔奖断点回归例子所谓断点回归就是找到一个断点,然后在确定因素里找随机性,比如高考分数650分可以上清华大学,649分不能上,65岁能退休,64岁不能退休,22岁可以结婚,21岁不能结婚,这条分割线就叫断点,高考的随机性就是分数,比如一群高考学生们成绩稳定在650分,上下20分浮动,就可以认为这些学生的学习水平基本没有太大差别,而他们唯一的差别就是“是否上了清华大学”,对比他们将来的收入水平,就可以大致排除其他因素,得到“是否上清华大学”对于他们收入的影响。

有了他们两这些看似原理极其简单的方法贡献,却对经济学、心理学、社会学甚至国际关系等等学科都产生了非常重大的影响。

如今他们使用的“差中差方法”已经成为了每一位研究实证经济学者都必须学习的基本工具之一。

而今年另一位经济学诺奖得主大卫· 卡德(David Card)的发现,离我们的生活更加贴近了一步,在上世纪90年代初之前,几乎所有的传统经济学家都有两个共同的想法,一个是如果提高法定最低工资一定会导致企业的工资成本增加,企业压力增大逐渐被迫裁员,进一步导致就业率减少,失业率上升。

第二个是外国移民增多会导致本地人的失业率上升,因为外国移民增加会夺取本地有限的工作席位,这两种想法在理论上都站得住脚,但所有人都苦于这两个理论无法用实验来证明或推翻。

为了调查法定最低工资如何影响就业,来自于加拿大的大卫· 卡德和另一位经济学家艾伦·克鲁格(Alan Krueger)通过电话调查新泽西州和宾夕法尼亚州东部的快餐店市场,使用刚才提到的“差中差”方法做了实验,终于顶着压力推翻了传统观念,他们发现新泽西州在提高了最低工资之后,快餐业的工作并没有出现如预料般减少,反而有了几个重要的新发现,包括更高的工资换来的是工作效率的上升,员工更加自愿的工作,并由此吸引来更多的人才。

而企业可以通过提升产品价格来弥补工资成本的上升,而且产品价格的提升幅度也只需要非常小,他们发现最低工资从7.25美元上升到10.10美元,提升了近40%,而快餐店仅仅只需要将产品的价格上升2.7%,就可以覆盖上升的工资成本。

断点回归方法的应用

断点回归方法的应用

一引言2010年4月24日,该年度的约翰·贝茨·克拉克奖章(John Bates Clark Medal)——针对40岁以下年轻经济学者的最高荣誉,授予了麻省理工学院经济系的Esther Duflo教授以表彰其在随机实验普及和其在发展经济学中应用方面的卓越贡献。

在因果关系分析的实证方法中,最优的选择应当为随机实验,但是随机实验的时间成本和经济成本都比较高,而在随机实验不可得的情况下,需要考虑使用其它方法。

断点回归(Regression Discontinuity)便是仅次于随机实验的,能够有效利用现实约束条件分析变量之间因果关系的实证方法。

Lee(2008)认为在随机实验不可得的情况下,断点回归能够避免参数估计的内生性问题,从而真实反映出变量之间的因果关系。

然而,断点回归也仅仅是在20世纪90年代末才被应用于处理经济学的问题。

2001年,Hahn等人对断点回归模型的识别和估计的理论问题进行了严格细致的分析,此后,断点回归才在众多的经济学研究领域中崭露头角。

时至今日,断点回归已经在劳动和教育经济学、政治经济学、环境经济学和发展经济学等领域取得了广泛的应用。

然而,断点回归却鲜为中国经济学者所应用,正是基于断点回归在实证研究中的重要性和国内文献的缺乏,本文拟以此为背景,从断点回归的理论、发展历史、实证步骤和经济学中的应用几个方面阐述断点回归这一个新“拟随机试验”方法的兴起。

二断点回归理论及发展历史断点回归是一种拟随机实验,此种随机实验定义了这样一个特征,即接受处置(Treatment)的概率是一个或者几个变量的间断函数。

Hahn et al.(2001)提出了断点回归的首要假设,如果变量表示处置效应,表示决定处置的关键变量,那么和必须存在,并且。

在使用断点回归的情况下,存在一个变量,如果该变量大于一个临界值时,个体接受处置,而在该变量小于临界值时,个体不接受处置。

一般而言,个体在接受处置的情况下,无法观测到其没有接受处置的情况,而在断点回归中,小于临界值的个体可以作为一个很好的可控组(Control Group)来反映个体没有接受处置时的情况,尤其是在变量连续的情况下,临界值附近样本的差别可以很好的反映处置和经济变量之间的因果联系。

半参数回归断点回归

半参数回归断点回归

半参数回归断点回归半参数回归是一种常用的统计方法,用于研究自变量对因变量的影响。

而断点回归则是半参数回归的一种特殊形式,用于揭示自变量对因变量的影响在某一阈值点处发生了显著变化的情况。

本文将介绍半参数回归和断点回归的基本原理、应用场景以及相关的统计分析方法。

一、半参数回归的基本原理半参数回归是一种非参数统计方法,不对自变量和因变量之间的函数关系做出任何假设。

它通过拟合局部的回归线来估计自变量对因变量的影响。

半参数回归可以应用于自变量和因变量之间的线性和非线性关系,具有较强的灵活性和适应性。

二、断点回归的基本原理断点回归是半参数回归的一种特殊形式,用于研究自变量对因变量的影响在某一阈值点处发生显著变化的情况。

断点回归将自变量分为两个区间,分别估计这两个区间内的回归系数,并通过比较两个区间的回归系数来判断是否存在断点。

如果存在断点,则说明自变量对因变量的影响在断点处发生了显著变化。

三、半参数回归和断点回归的应用场景半参数回归和断点回归可以应用于各种研究领域和实际问题。

例如,在经济学中,可以使用半参数回归和断点回归来研究收入对消费的影响是否存在阈值效应;在医学研究中,可以使用半参数回归和断点回归来研究药物剂量对疗效的影响是否存在阈值效应。

四、半参数回归和断点回归的统计分析方法在进行半参数回归和断点回归分析时,需要选择合适的估计方法和假设检验方法。

常用的估计方法包括局部加权回归、核密度估计和B样条回归等;常用的假设检验方法包括断点是否存在的检验和断点位置的检验等。

这些方法可以通过统计软件来实现,如R语言中的segmented包和np包。

总结:半参数回归和断点回归是一种常用的统计方法,可以用于研究自变量对因变量的影响以及是否存在阈值效应。

它们具有较强的灵活性和适应性,可以应用于各种研究领域和实际问题。

在进行半参数回归和断点回归分析时,需要选择合适的估计方法和假设检验方法。

通过合理地运用半参数回归和断点回归,我们可以更好地理解数据背后的规律和关系,为实际问题的解决提供科学的依据。

企业避税、债务融资与债务融资来源基于所得税征管体制改革的断点回归分析

企业避税、债务融资与债务融资来源基于所得税征管体制改革的断点回归分析

企业避税、债务融资与债务融资来源基于所得税征管体制改革的断点回归分析一、本文概述1、研究背景与意义随着全球经济的深度融合与快速发展,企业在经营活动中面临着日益复杂的税收环境和融资挑战。

避税行为和债务融资作为企业财务策略的重要组成部分,对于企业的经济效益和长期发展具有深远的影响。

特别是在我国所得税征管体制不断改革的大背景下,企业的避税行为、债务融资决策及其融资来源的选择都受到了前所未有的关注。

所得税征管体制的改革不仅直接影响企业的税负水平,也间接影响企业的融资决策。

一方面,随着税收征管的加强,企业避税的空间逐渐缩小,这迫使企业重新审视其财务策略,寻找新的税收优化途径。

另一方面,税收改革也可能影响企业的债务融资成本,进而影响企业的融资结构和融资来源的选择。

因此,研究企业避税、债务融资及其融资来源在所得税征管体制改革背景下的变化,具有重要的理论和实践价值。

本文以断点回归分析方法为基础,旨在深入探究所得税征管体制改革对企业避税行为、债务融资及其融资来源选择的影响。

通过实证分析,不仅有助于揭示税收改革与企业财务策略之间的内在联系,还能为企业制定合理的财务策略提供决策支持,同时也为政府完善税收政策和优化税收征管体制提供参考依据。

因此,本研究具有重要的现实意义和深远的社会影响。

2、国内外研究现状避税行为作为企业财务管理的重要策略之一,一直以来都受到国内外学者的广泛关注。

国内外的研究主要集中在避税对企业价值、股东利益、公司策略等方面的影响。

在国内,随着所得税征管体制的不断改革,企业避税行为也呈现出新的特点。

这些改革包括税率调整、税收优惠政策的变化、反避税力度的加大等,这些都对企业避税行为产生了深远影响。

国外研究方面,早期的研究主要关注避税行为对企业价值的影响,认为避税可以增加企业的自由现金流,从而提高企业价值。

然而,随着研究的深入,学者们开始关注避税行为可能带来的负面效应,如增加企业的财务风险、损害企业声誉等。

断点回归法事件研究法

断点回归法事件研究法

断点回归法事件研究法断点回归法(Breakpoint Regression Analysis)是一种常用的事件研究方法,在金融学、经济学、管理学等领域得到广泛应用。

本文将介绍断点回归法的基本概念、原理和应用,并探讨其优缺点。

一、断点回归法的基本概念断点回归法是一种用于研究某个事件对特定变量的影响的统计方法。

该方法通过在时间序列数据中选择一个或多个断点,将数据分为两个或多个子样本,然后对每个子样本进行回归分析,从而比较不同子样本之间的差异。

这种方法能够帮助研究者判断某个事件对变量的影响是否存在、是否显著,并进一步分析影响的程度和方向。

二、断点回归法的原理断点回归法的核心原理是基于时间序列数据中存在的某个结构性断点,该断点可能是由于政策改变、市场变动、经济周期变化等原因引起的。

研究者通过设定断点,将样本数据分为两个或多个子样本,然后对每个子样本进行回归分析。

在分析中,需要控制其他可能影响结果的变量,以确保所得的结果是由所关注的事件引起的。

三、断点回归法的应用断点回归法在金融学、经济学、管理学等领域有广泛的应用。

例如,在金融市场中,研究者可以使用断点回归法来分析某个重大事件对股票市场的影响。

他们可以选择一个事件作为断点,将数据分为事件前后两个子样本,然后对每个子样本进行回归分析,以比较事件前后的差异。

这样可以帮助研究者了解事件对股票价格、交易量等指标的影响程度和方向。

四、断点回归法的优缺点断点回归法具有一定的优点和缺点。

其优点在于可以通过选择合适的断点,准确地判断事件对变量的影响,并量化影响的程度和方向。

此外,断点回归法能够更好地控制其他可能的干扰变量,提高分析结果的可靠性。

然而,该方法也存在一些缺点,如对断点的选择比较主观,需要研究者具备一定的经验和专业知识;另外,断点回归法只能检测到存在结构性断点的影响,对于连续性变化的影响则无法有效分析。

断点回归法是一种常用的事件研究方法,通过选择断点,将样本数据分为两个或多个子样本,并对每个子样本进行回归分析,以比较不同子样本之间的差异。

断点回归方法及其应用

断点回归方法及其应用

断点回归方法及其应用下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。

文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!断点回归方法及其应用断点回归方法是一种用于分析因果关系的方法,通过对处理组和对照组进行划分,并利用断点回归分析处理效应。

退休与城镇家庭消费基于断点回归设计的经验证据

退休与城镇家庭消费基于断点回归设计的经验证据

退休与城镇家庭消费基于断点回归设计的经验证据一、本文概述1、阐述研究背景:退休制度对城镇家庭消费的影响日益受到关注。

随着中国社会经济的快速发展和人口老龄化趋势的加剧,退休制度对城镇家庭消费的影响日益受到广泛关注。

这一变革性的社会现象不仅直接关系到亿万城镇家庭的经济生活,还深刻影响着国家经济结构调整和社会稳定大局。

在这一背景下,深入探究退休制度如何影响城镇家庭消费,对于理解家庭消费行为、优化社会保障政策、促进经济持续健康发展具有重要的理论和现实意义。

一方面,随着我国人口老龄化程度的不断加深,退休人口数量逐年增加,这一群体在消费市场上的影响力不容忽视。

他们的消费行为不仅关系到自身的生活品质,还对整个社会的消费结构和产业升级产生深远影响。

另一方面,随着我国社会保障体系的不断完善,退休制度也在逐步调整和优化,这些变化无疑会对城镇家庭消费产生直接或间接的影响。

因此,本文旨在通过断点回归设计等方法,实证探究退休制度对城镇家庭消费的影响,以期为相关政策制定提供科学依据和决策支持。

我们期望通过这一研究,不仅能够深化对退休制度与城镇家庭消费关系的理解,还能够为优化社会保障政策、促进消费升级提供有益参考。

2、提出研究问题:退休如何影响城镇家庭消费?是否存在断点回归现象?随着中国社会经济的持续发展,人口老龄化问题日益凸显,退休制度对城镇家庭消费的影响逐渐受到学术界的关注。

退休作为个体生命周期中的一个重要节点,标志着个体从职业劳动市场转向非劳动市场,这一转变可能会带来家庭消费结构和消费行为的变化。

因此,探讨退休对城镇家庭消费的具体影响及其内在机制,不仅对于理解个体和家庭在生命周期内的消费决策过程具有重要价值,也为政府制定相关政策以应对人口老龄化挑战提供了科学依据。

在经济学研究中,断点回归现象通常指的是某一变量在达到某一特定阈值后,其与其他变量之间的关系发生显著变化。

在退休与城镇家庭消费的背景下,断点回归现象可能表现为退休前后家庭消费模式的显著变化。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

断点回归及其在经济学中的应用一引言2010年4月24日,该年度的约翰·贝茨·克拉克奖章(John Bates Clark Medal)——针对40岁以下年轻经济学者的最高荣誉,授予了麻省理工学院经济系的Esther Duflo教授以表彰其在随机实验普及和其在发展经济学中应用方面的卓越贡献。

在因果关系分析的实证方法中,最优的选择应当为随机实验,但是随机实验的时间成本和经济成本都比较高,而在随机实验不可得的情况下,需要考虑使用其它方法。

断点回归(Regression Discontinuity)便是仅次于随机实验的,能够有效利用现实约束条件分析变量之间因果关系的实证方法。

Lee(2008)认为在随机实验不可得的情况下,断点回归能够避免参数估计的内生性问题,从而真实反映出变量之间的因果关系。

然而,断点回归也仅仅是在20世纪90年代末才被应用于处理经济学的问题。

2001年,Hahn等人对断点回归模型的识别和估计的理论问题进行了严格细致的分析,此后,断点回归才在众多的经济学研究领域中崭露头角。

时至今日,断点回归已经在劳动和教育经济学、政治经济学、环境经济学和发展经济学等领域取得了广泛的应用。

然而,断点回归却鲜为中国经济学者所应用,正是基于断点回归在实证研究中的重要性和国内文献的缺乏,本文拟以此为背景,从断点回归的理论、发展历史、实证步骤和经济学中的应用几个方面阐述断点回归这一个新“拟随机试验”方法的兴起。

二断点回归理论及发展历史断点回归是一种拟随机实验,此种随机实验定义了这样一个特征,即接受处置(Treatment)的概率是一个或者几个变量的间断函数。

Hahn et al.(2001)提出了断点回归的首要假设,如果变量表示处置效应,表示决定处置的关键变量,那么和必须存在,并且。

在使用断点回归的情况下,存在一个变量,如果该变量大于一个临界值时,个体接受处置,而在该变量小于临界值时,个体不接受处置。

一般而言,个体在接受处置的情况下,无法观测到其没有接受处置的情况,而在断点回归中,小于临界值的个体可以作为一个很好的可控组(Control Group)来反映个体没有接受处置时的情况,尤其是在变量连续的情况下,临界值附近样本的差别可以很好的反映处置和经济变量之间的因果联系。

断点回归可以分为两类,第一类,临界值是确定的(Sharp),即在临界值一侧的所有的观测点都接受了处置,反之,在临界值另一侧的所有观测点都没有接受处置。

此时,接受处置的概率从临界值一侧的0跳转到另一侧的1;第二类,临界点是模糊的(Fussy),即在临界值附近,接受处置的概率是单调变化的。

Hahn et al.(2001)在一定的假设下,证明了无论是哪一类型的断点回归,都可以利用临界值附近样本的系统性变化来研究处置和其它经济变量之间的因果关系。

断点回归首先是由美国西北大学的心理学家Campbell于1958年首先发展设计出来的,从那时开始直到二十世纪80年代,Campbell和西北大学心理学系和统计学系的同事一直从事断点回归的设计和研究工作。

Thistlethwaite和Campbell(1960)正式发表了第一篇关于断点回归的论文,他们提出断点回归是在非实验的情况下处理处置效应(Treatment Effects)的一种有效的方法,主要应用于心理学和教育学领域。

随后,Campbell和Stanley(1963)为断点回归提供了更加清晰化的概念,但是由于他们并没有给出断点回归统计上的证明。

在他们看来,断点回归主要是为了解决选择性偏误(Selection Bias)问题,断点回归利用了一个取决于某连续变量的间断函数,这个间断函数完全决定了个体是否受到处置,这就使得样本选择的细节完全展示出来,使得我们知道样本选择的问题所在。

此外,Campbell和Stanley 还认为断点回归仅仅是在间断的临界值处类似于随机实验,其推论的有效性也仅仅局限于间断的临界值处。

整个20世纪60年代,断点回归方法的应用还停留在一种直觉的推导,而缺乏统计上严密的证明。

Goldberger(1972 a, b)曾对断点回归的无偏因果推断进行了证明,可惜的是,他的论文并没有得到发表,这主要是因为他认为断点回归的适用环境是一个高度理想化的环境,其适用范围十分有限。

相反,变量之间因果关系的推断还包括了工具变量法(IV Approach)和Heckman处理样本选择问题的模型,这两种方法的适用性更加广泛,从而使得人们忽视了断点回归方法的应用,也使得断点回归在很长一段时间内消失在人们的视野之中。

随着Campbell等人所认为的断点回归适用性仅仅局限于临界值附近这一论断被证伪之后,断点回归才开始重新回到人们的视野之中。

Rubin(1977)证明了在个体是否接受处置仅仅取决于一个关键变量的情况下,处置效应能够在关键变量的整个范围内得到无偏的因果推断。

Sacks和Ylvisaker(1978)提出了断点回归的估计方法,并在理论上给予了较粗略的证明。

他们将被解释变量分解为观察变量的线性组合再加上一个非随机的误差项,其估计方法类似于局部非参数回归(Local Nonparametric Regression),其有效性不仅仅是对于临界值附近的样本,而且可以扩展到关键变量的整个领域。

断点回归在理论方面取得了新进展的同时,其它因果推断方法的不足之处也逐渐的被认识到。

比如,工具变量法存在局限性,特别是排他性(Excludability)条件难以满足,即难以保证工具变量仅仅通过影响关键解释变量而影响到被解释变量,寻找合适的工具变量存在一定的困难。

此外,Lalonde(1985)发现Heckman样本选择模型并不能产生和随机实验一样的结果。

正因为因果关系的推断是经济学家所关注的最主要的问题,并且现有的因果推断方法都不能得出完全合理的因果关系,人们开始逐渐将目光转向了断点回归。

Trochim(1984)继续了他老师Campbell的工作,Trochim综合了之前关于断点回归的理论和方法,并且将断点回归类型分为两类,第一类是确定型的断点回归(Sharp Regression Discontinuity),即个体在临界值一边接受处置效应的概率为1,而在临界值另一边接受处置效应的概率为0;第二类是模糊型的断点回归(Fuzzy Regression Discontinuity),即个体接受处置效应的概率均大于0小于1,个体在临界值一边接受处置的概率大于在临界值另一边接受处置的概率。

Trochim特别对第二类断点回归问题进行了研究,并开始利用该方法进行实证研究。

与Campbell观点不同,Trochim认为断点回归的应用性并非那么的狭隘,相反,其应用范围还十分的广泛。

除此之外,他还强调了决定处置的关键变量不仅仅可以是一个单一变量,而且还可以是一个合成变量。

随后,断点回归的优势逐渐被学界所认可,其应用也愈加广泛。

具体而言,其优势包括两方面:第一,断点回归可以应用于出于对经济成本和伦理道德问题的考虑,随机实验不能进行的环境;第二,断点回归优越于所有其它已知的因果推断方法,其结果十分接近于随机实验结果,Lee和Lemieux(2010)也通过形象的例子展示了断点回归和随机实验的相似性。

Hahn et al(2001)最终为断点回归的模型识别和模型估计进行了严格意义上的理论证明,并提出了相应的估计方法,由此,断点回归在经济学中的应用如雨后春笋般出现在重要经济学文献中。

三断点回归的实施步骤(一)确定型断点回归运用图形来分析处置效应是否存在是断点回归分析的基础。

图形分析在断点回归的实施中扮演着重要的角色,通过将样本点和决定处置的关键变量在坐标系中描述出来,便可以清楚的看到临界值附近的样本点是否存在跳跃。

如果样本点存在跳跃,那么说明确实存在处置效应,相反,如果样本点没有出现相应的跳跃,那么说明断点回归的模型识别可能存在问题。

当我们从图形分析中发现了临界值处存在处置效应,那么就应当做进一步更加细致的计量实证分析。

为了使图形更为直观,需要根据决定处置的关键变量来划分箱体(Bin)和箱体的范围,并在该范围内计算变量的均值。

一般而言,箱体的范围需要大到包含足够多的样本使其样本点在临界值两边都比较平滑,但又要小到一定程度使得样本点在临界值处的跳跃能够明显的显现出来。

Lee和Lemieux(2010)提出两种方法来选择合适的箱体范围。

第一种是根据对数据的观察决定使用个箱体;然后对个箱体的虚拟变量做回归;随后,将箱体范围缩小二分之一,使得箱体由个变为个,将个箱体的虚拟变量作为解释变量再做一次回归。

由于使用个箱体虚拟变量的回归是内嵌于使用个箱体虚拟变量的回归之中的,因此,可以使用标准的F检验来比判断个箱体和个箱体的优劣。

第二种方法是基于这样一个原理,如果箱体足够的小,那么被解释变量和决定处置的关键变量将不会出现系统的联系,因此,可以将被解释变量对箱体的虚拟变量以及该虚拟变量和决定处置的关键变量的乘积项做回归,并使用F检验来判断虚拟变量和关键变量的乘积项是否显著的为0。

通过以上方法得到合适箱体范围后,便可以分别对临界值两边的样本进行估计,得到临界值两边的平滑曲线,具体实施步骤如下:第一步,构造箱体,,其中为临界值,为箱体的范围;其次,计算每一个箱体中的样本数量,,其中为决定处置的关键变量;再次,求出每个箱体的平均值,;最后,画出和二者之间的曲线关系。

第二步,同时利用临界值两边的样本进行回归。

这就好比在非参数回归中使用了rectangular的核,选取叶宽(bandwidth),将样本的估计局限在范围内。

一般而言,可以使用非参数回归,但是如Hahn et al.(2001)指出的,非参数回归会产生高阶数的偏差,简单的非参数估计往往并不具有吸引力,所以对于样本的回归可以采取局部线性回归(Local Linear Regression),即最小化下式:这其中存在叶宽选择的问题,Hahn等(2001)提出最优的叶宽与成比例。

例如,样本增加32倍,那么为1/2,叶宽就可以减少一半,但是这并没有解决如何选择叶宽的问题。

计量经济学和统计学的文献中有两种选择叶宽的方法:第一种方法是根据拇指规则(Rule of Thumb)对整个样本的数据进行估计以求得最优叶宽。

比如,对于rectangular的核,最优叶宽可以根据下式求出:其中是断点回归的标准差,表示断点回归方程的二阶导数,是断点回归方程估计时的范围,2.702是使用rectangular核估计的常数。

另一种方法是交叉验证法(cross-validation),即首先对临界值两边的样本分别进行回归,得到:交叉验证准则即为选择合适的叶宽以最小化:此外,断点回归中也可以加入其它的控制变量,如此做的原因是消除小样本偏差,同时使得估计更为精确。

相关文档
最新文档