工具变量与两阶段最小二乘法.

合集下载

2sls原理

2SLS原理1. 引言在经济学和社会科学研究中，我们经常需要研究变量之间的因果关系。

然而，由于多种原因，例如内生性、遗漏变量等，我们很难直接观察到这些因果关系。

为了解决这个问题，研究者们提出了一种被广泛应用的方法，即两阶段最小二乘法（Two-Stage Least Squares，2SLS）。

2SLS方法通过使用工具变量（Instrumental Variable，IV）来解决内生性问题。

工具变量是一种与内生变量相关但与被解释变量不相关的变量。

2SLS方法通过两个阶段的回归来估计因果关系，并且可以控制内生性的影响。

2. 2SLS方法的基本原理2SLS方法的基本原理可以通过以下步骤来解释：第一阶段：1.确定内生变量（被解释变量）Y，内生变量（解释变量）X和工具变量Z；2.估计第一阶段回归模型：X=α+βZ+ϵ1；3.通过第一阶段回归模型得到的估计值X̂代替原始的内生变量X。

在第一阶段，我们使用工具变量Z来预测内生变量X，从而消除了内生性的影响。

第二阶段：1.确定内生变量（被解释变量）Y，内生变量（解释变量）X̂和工具变量Z；2.估计第二阶段回归模型：Y=α+βX̂+ϵ2。

在第二阶段，我们使用第一阶段得到的X̂来估计内生变量Y的影响。

通过两个阶段的回归，2SLS方法可以提供一致且有效的估计结果，从而解决内生性问题。

3. 2SLS方法的优势和应用优势：1.解决内生性问题：2SLS方法通过使用工具变量来解决内生性问题，确保因果关系的估计结果可靠；2.一致性估计：2SLS方法在满足一定条件下可以提供一致的估计结果；3.有效性估计：2SLS方法可以提供有效的估计结果，即估计量的方差较小。

应用：2SLS方法广泛应用于经济学和社会科学研究中，例如：1.评估政策效果：研究者可以使用2SLS方法来评估某个政策对经济或社会变量的影响；2.估计需求和供给关系：研究者可以使用2SLS方法来估计需求和供给关系，并进一步分析市场的均衡状况；3.研究教育和健康等领域的影响因素：研究者可以使用2SLS方法来估计教育和健康等领域的影响因素，并提出政策建议。

stata工具变量法：使用2SLS进行ivreg2估计及其检验

stata⼯具变量法：使⽤2SLS进⾏ivreg2估计及其检验转⾃：作为OLS回归不符合假定的问题，还包括解释变量与随机扰动项不相关。

如果出现了违反该假设（即解释变量和随机扰动项相关了）的问题，就需要找⼀个和解释变量⾼度相关的、同时和随机扰动项不相关的变量，作为⼯具变量进⾏回归。

传统来讲，⼯具变量有两个要求：与内⽣变量⾼度相关、与误差项不相关，这两个要求缺⼀不可。

前者的违背会导致弱⼯具，这其中⼀个更有意思的问题是有很多的弱⼯具（many weak instruments）的情况。

⽽后者的违背会使得⼯具变的⽆效（Invalid）。

⼯具变量通常采⽤⼆阶段最⼩⼆乘法（2SLS）进⾏回归，当随机扰动项存在异⽅差或⾃相关的问题，2SLS就不是有效率的，就需要⽤GMM等⽅法进⾏估计，除此之外还需要对⼯具变量的弱⼯具性和内⽣性进⾏检验。

sysuse auto构造⼯具变量结构⽅程初始回归⽅程：mpg = β0+β1turn+β2gear_ratio+µ内⽣变量：turn=z0+z1weight+z2length+z3headroom+ε回归⽅程中内⽣变量为turn，⼯具变量为weight、length、headroom。

2SLS估计1.使⽤ivreg2进⾏2SLS估计ivreg2 mpg gear_ratio (turn=weight length headroom)这⾥运⾏时出现错误提⽰：原因：括号前⾯要有个空格。

结果显⽰：turn变量的估计系数是-1.246，z检验值为-6.33，p值0.000，⼩于0.05，说明turn系数显著，且与mpg呈现负相关。

Underidentification test，⽅程的不可识别检验，得到LM统计值为26.822，p值=0.000，⼩于0.05，强烈拒绝“不可识别”的原假设。

Weak identification test弱⼯具变量检验，得到得到Wald-F统计值为30.303，KP Wald-F统计值为42.063，⼤于所有临界值，说明拒绝“弱⼯具变量”的原假设，即⽅程不存在弱⼯具变量。

工具变量法二阶段回归模型

工具变量法二阶段回归模型是一种用于处理内生性问题的统计方法，主要通过两个阶段的最小二乘法（Two Stage Least Square，2SLS或TSLS）来实现。

在第一阶段，该方法使用工具变量（iv）去做解释变量（x）的回归。

然后在第二阶段，它用工具变量对解释变量的估计值（x'）去对被解释变量（y）做回归。

此方法的逻辑是将内生解释变量分解为两部分，一部分是由工具变量造成的外生部分，另一部分是与扰动项相关的内生部分。

这样的分解能够“治疗”内生性问题，从而得到更加准确的估计结果。

在实际应用中，工具变量的回归操作可以通过多种统计软件实现，例如Stata，其基本操作代码有：ivregress, ivreg2, ivreghdfe, xtivreg, xtivreg2等。

这些工具和方法使得工具变量法二阶段回归模型在处理内生性问题时具有广泛的应用价值。

第15章-工具变量讲解

这样一来 , 我们便把 abil 放人误差项中，而只留下简单回归模型： Log（wage） =β 0+β 1educ+u （15.1 ）其中，u 包含 abil。当然，如果用 OLS 估计方程 (15.1) ，若 educ 与 abil 相关，则得到的结果将是 1 的有偏而又不一致估计量。
第15章工具变量估计与两阶段最小二乘法
在本章中，我们进一步研究多元回归模型中的内生解释变量 (endogenous explanatory Variables）问题。在第 3 章中，我们推导出遗漏一个重要变量时 OLS 估计量的偏误，在第 5 章中，我们说明了在遗漏变量(omitted variables)的情况下，OLS 通常是不一致的。
举例来说，考虑成年劳动者的工资方程中存在无法观测之能力因素的问题。一个简单的模型为： log（wage）=β 0+β 1educ+β 2abil+e 其中，e 是误差项。
在第 9 章中，我们证明了在某些假定下，如何用诸如 IQ 的代理变量代替能力，从而通过以下回归可得到一致估计量 log(wage)对 educ，IQ 回归然而假定不能得到适当的代理变量（或它不具备足以获取 1 一致估计量所需的性质）。
我们一开始先说明，在存在遗漏变量的情况下，如何用 IV 法获得一致估计量。此外， IV 至少能在某些假定下用于解决变量误差 (errors-in-variables)问题。下一章将证明运用 IV 法如何估计联立方程模型。
我们对工具变量估计的论述严格遵照我们在第 1 篇中对普通最小二乘的推导，其中假定我们有一个来自潜在总体的随机样本。这个起点很合人意，因为除了简化符号之外，它还强调用潜在总体来表述对 IV 估计所做的重要假定 (正如用 OLS 时一样)。

工具变量两阶段最小二乘

估计结果与前面相差很大，检验工具变量与内生变量的相关性，发现用三个工具变量时相关性大大提升，故应采用mothedu,fathedu,husedu一起做工具变量。 • 工具变量的好坏直接影响估计结果，实际应用中，寻找合适的工具变量是解决问题的关键，也是困难所在。
两阶段最小二乘法：TSLS
点击选择按钮（Op>ons）对参数估计协方差矩阵的估计方法进行选择，本例采用的是横截面数据，因此采用怀特异方差一致的协方差矩阵估计。
6.2 工具变量估计方法
6.2.2 两阶段最小二乘法：TSLS
两阶段最小二乘法：TSLS
一个内生自变量
Y = β0 + β1X1 + β2 X 2 + β3 X3 + u X1 为内生变量， X2 和X 3 为外生变量，Z1 、Z2 X为1 的工具变量。两阶段最小二乘步骤：
原假设： H0 : α1 = α2 = 0
• 用第五章构造的Tr 统计量进行F检验，若 Tr值够大，通常大于10则认为相关性足够，可做工具变量。
• 若接受原假设，则表明工具变量与内生变量相关性太弱，其不适宜做工具
两阶段最小二乘法：TSLS
一个内生自变量
EViews实现两阶段最小二乘：例子6.2 已婚女性小时工资（续）
• 不相干变量引入不会影响参数估计的无偏性和一致性，但是会影响参数估计的有效性。
6.2 工具变量估计方法
6.2.1 工具变量估计法 6.2.2 两阶段最小二乘法：TSLS
6.2 工具变量估计方法
6.2.1 工具变量估计法
工具变量估计法
一元线性回归模型
Y = β0 + β1X + u
Ø 定义1：如果存在变量Z

工具变量法IV两阶段最小二乘法TSLS

YY12
b12Y2 b23Y3
c11 X1 c12 X 2 c23 X 3 u2
u1
Y3 b31Y1 b32Y2 c33 X 3 u3
其中：Y1,Y2 ,Y3 为内生变量， X1, X 2 , X 3为外生变量。
Dongbei University Of Finance & Economics
2）方程组系统估计法包括：三阶段最小二乘法（3SLS）、完全信息最
大似然估计法（FIML）等。这些方法是对模型中所有结构方程的参数同时进行估计，从而获得模型全部参数的估计值。它利用了模型的全部方程信息，称为完全信息方法。
Dongbei University Of Finance & Economics
/ ˆ23 bˆ12ˆ21
cˆ12 ˆ12 bˆ12ˆ22
若已知πij，即可解出惟一的cij，第一个结构方程得以估计。这样，结构方程的参数估计值用传统的OLS就得到了。
Dongbei University Of Finance & Economics
ILS的步骤
一、先对模型作识别判断，找出恰好识别的方程；二、利用简约式和结构式参数的关系式 B
Y1 11 X1 12 X 2 13 X 3 v1 Y2 21 X1 22 X 2 23 X 3 v2 Y3 31 X1 32 X 2 33 X 3 v3
Dongbei University Of Finance & Economics
第一阶段是对结构方程右端所包含的所有内生变量（作为解释变量）所对应的简化式方程进行OLS估计,得到内生变量的估计（回归)值；

第15章工具变量估计与两阶段最小二乘法

2
15.3 两阶段最小二乘法
2SLS可用于多个内生解释变量的模型中，但工具变量必须满足一定的条件方程才能识别。方程识别的阶条件：被排斥的外生变量的个数至少与结构方程中包含的解释变量一样多。阶条件仅是必要条件，方程识别的充分条件是秩条件，需要用矩阵代数来表述。
15.1 动机：简单回归模型中的遗漏变量
要求（2）容易检验，只需x对z简单回归，检验斜率系数的显著性。内生解释变量和工具变量也可以是二值变量如果现在的工具变量是低劣的，即z可能与u 相关，此时IV估计也是不一致的。OLS估计也是不一致的，但IV估计的偏误要大很多。 2 R 与OLS估计不同，IV估计中的可能为负，对此也没有合理的解释。
15.2 多元回归模型中的IV估计
zk 与 y2 存在某种偏相关，即约简型方程（2） y2 0 1z1 k 1zk 1 k zk v 的系数满足： k 0
同样要求（1）不能检验，只能寄希望于经济逻辑和反思。要求（2）可对约简型方程估计后直接检验。具体的IV估计量可从k+1个矩条件对应的样本方程求出： E u 0, E z1u 0, , E zk 1u 0, E zku 0
15.1 动机：简单回归模型中的遗漏变量
借助于工具变量，回归方程的参数是可识别（identification），即参数可用总体矩表示，而总体矩可用样本矩来估计。用工具变量z 对回归方程两边协方差：
cov z, y 1 cov z, x cov z, u
解出： 1 cov z, y / cov z, x 由此得到工具变量估计量： z z y y
n
ˆ 1

工具变量两阶段最小二乘

1 IV
n−2
∑
n
i =1 i n
ˆ Z ,X = ρ
∑
i =1
( X i − X )(Z i − Z )
2 ( Z − Z ) ∑i=1 i n
2 ( X − X ) ∑i=1 i
ˆ −β ˆ X ˆi = Yi − β u 0 IV 1IV i
工具变量估计法
一元线性回归模型
Y = β0 + β1 X + u
内生性影响图示：
X
Y
u
dY / dX = β + du / dX
ˆ 是对 β + du / dX 的估计。 β
6.1 内生性
6.1.2 内生性产生的原因
模型设定错误、测量误差和联立性
• 模型设定错误是导致内生性最常见的原因，模型设定错误往往表现为相关变量的缺失，缺失变量成为错误设定模型误差项的一部分，当缺失变量和模型中其他变量相关时，就会导致这些变量的内生性。（工资与教育、能力）、 • 不相干变量引入不会影响参数估计的无偏性和一致性，但是会影响参数估计的有效性。
??模型设定错误是导致内生性最常见的原因模型设定错误往往表现为相关变量的缺失缺失变量成为错误设定模型误差项的一部分当缺失变量和模型中其他变量相关时就会导致这些变量的内生性
第6章
内生性和工具变量估计方法
内生性和工具变量估计方法
6.1 内生性
6.1.1 OLS估计的不一致性 6.1.2 内生性产生的原因
fathedu 作工具变量：
ln(wage) = − 0.441+ 0.059 educ
( 0.989 ) (1.686 )
工具变量估计法
多元线性回归模型

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

Intermediate Econometrics, Yan Shen 2
Lecture Outline 本课提要

Motivation: Why using IV? 出发点：为何用工具变量？ Statistical Inference with the IV estimator IV 估计中的统计推断 Properties of IV with a poor IV ―坏”工具变量的性质 Computing R squares after IV 计算IV估计的R方 IV estimation of the multiple regression model 多方程回归的IV估计
Intermediate Econometrics, Yan Shen 3
Problem to start with 从这个问题出发…

If important variables are omitted, what should we do? 如果一些重要的变量被遗漏，我们应当怎么办？
Intermediate Econometrics, Yan Shen

Intermediate Econometrics, Yan Shen
7
Instrumental Variable: Who qualifies? 什么样的变量可以作为IV？

In order for a variable, z, to serve as a valid instrument for x, the following must be true 针对内生变量 x 的一个有效的工具变量 z 应当满足如下条件 The instrument must be exogenous 工具变量应为外生 That is, Cov(z,u) = 0 (15.4) 即Cov(z,u) = 0
Intermediate Econometrics, Yan Shen 5
Why Use Instrumental Variables? 为何使用工具变量？
Instrumental Variables (IV) estimation is used when your model has endogenous x’s 当模型解释变量具有内生性时，使用工具变量估计 That is, when Cov(x,u) ≠ 0 即，Cov(x,u) ≠0时
Intermediate Econometrics, Yan Shen 8
Instrumental Variable: Who qualifies? 什么样的变量可以作为IV？
The instrument must be correlated with the endogenous variable x 工具变量应与内生变量 x 相关 That is, Cov(z,x) ≠ 0 (15.5)

Intermediate Econometrics, Yan Shen
6
Why Use Instrumental Variables? 为何使用工具变量？
Thus, IV can be used to address the problem of omitted variable bias 所以，IV可以用来解决遗漏变量偏差 Additionally, IV can be used to solve the classic errors-in-variables problem 而且，IV可用来解决经典的测量误差问题
Intermediate Econometrics, Yan Shen
10
About Cov(z,x)
We can test if Cov(z,x) ≠ 0 我们可以检验是否Cov(z,x) ≠ 0 Just testing H0: p1 = 0 in x = p0 + p1z + v 只需检验 H0: p1 = 0 in x = p0 + p1z + v Sometimes we refer to this regression as the first-stage regression. 有时我们将这个回归称为第一阶段回归。
4
The ways out 一些办法

Ignore the problem, pretend that it does not exist 忽略这个问题，假装这个问题并不存在 Find and use a suitable proxy 使用代理变量 Uses an estimation method that recognizes the presence of the omitted variable 使用一种对遗漏变量稳健的估计方法。
1
Chapter Outline 本章提要

Omitted Variables in a simple regression model 简单回归中的遗漏变量 IV estimation of the Multiple Regression 多方程回归中的工具变量估计 Two Stage Least Squares 两阶段最小二乘法 IV solutions to errors-in-variables problem 用工具变量解决测量误差问题 Testing for endogeneity… 检验内生性
Instrumental Variables & 2SLS 工具变量与两阶段最小二乘法
y = b0 + b1x1 + b2x2 + . . . bkxk + u x1 = p0 + p1z + p2x2 + . . . pkxk &#nometrics, Yan Shen

Intermediate Econometrics, Yan Shen
9
About Cov(z,u) 关于Cov(z,u)

We have to use common sense and economic theory to decide if it makes sense to assume Cov(z,u) = 0 为了判断Cov(z,u) = 0这一假定是否合理，我们不得不依赖于常识和经济理论。

工具变量与两阶段最小二乘法.

2sls原理

stata工具变量法：使用2SLS进行ivreg2估计及其检验

工具变量法二阶段回归模型

第15章-工具变量讲解

工具变量两阶段最小二乘

工具变量法IV两阶段最小二乘法TSLS

第15章 工具变量估计与两阶段最小二乘法

工具变量 两阶段最小二乘

第15章工具变量估计与两阶段最小二乘法

工具变量两阶段最小二乘