工具变量 两阶段最小二乘
2sls原理

2SLS原理1. 引言在经济学和社会科学研究中,我们经常需要研究变量之间的因果关系。
然而,由于多种原因,例如内生性、遗漏变量等,我们很难直接观察到这些因果关系。
为了解决这个问题,研究者们提出了一种被广泛应用的方法,即两阶段最小二乘法(Two-Stage Least Squares,2SLS)。
2SLS方法通过使用工具变量(Instrumental Variable,IV)来解决内生性问题。
工具变量是一种与内生变量相关但与被解释变量不相关的变量。
2SLS方法通过两个阶段的回归来估计因果关系,并且可以控制内生性的影响。
2. 2SLS方法的基本原理2SLS方法的基本原理可以通过以下步骤来解释:第一阶段:1.确定内生变量(被解释变量)Y,内生变量(解释变量)X和工具变量Z;2.估计第一阶段回归模型:X=α+βZ+ϵ1;3.通过第一阶段回归模型得到的估计值X̂代替原始的内生变量X。
在第一阶段,我们使用工具变量Z来预测内生变量X,从而消除了内生性的影响。
第二阶段:1.确定内生变量(被解释变量)Y,内生变量(解释变量)X̂和工具变量Z;2.估计第二阶段回归模型:Y=α+βX̂+ϵ2。
在第二阶段,我们使用第一阶段得到的X̂来估计内生变量Y的影响。
通过两个阶段的回归,2SLS方法可以提供一致且有效的估计结果,从而解决内生性问题。
3. 2SLS方法的优势和应用优势:1.解决内生性问题:2SLS方法通过使用工具变量来解决内生性问题,确保因果关系的估计结果可靠;2.一致性估计:2SLS方法在满足一定条件下可以提供一致的估计结果;3.有效性估计:2SLS方法可以提供有效的估计结果,即估计量的方差较小。
应用:2SLS方法广泛应用于经济学和社会科学研究中,例如:1.评估政策效果:研究者可以使用2SLS方法来评估某个政策对经济或社会变量的影响;2.估计需求和供给关系:研究者可以使用2SLS方法来估计需求和供给关系,并进一步分析市场的均衡状况;3.研究教育和健康等领域的影响因素:研究者可以使用2SLS方法来估计教育和健康等领域的影响因素,并提出政策建议。
工具变量与两阶段最小二乘法

工具变量与两阶段最小二乘法在经济学和统计学中,工具变量(Instrumental Variable,简称IV)与两阶段最小二乘法(Two-stage Least Squares,简称2SLS)是重要的分析方法。
本文将介绍工具变量的基本概念及其应用,然后详细探讨两阶段最小二乘法的原理和使用场景。
一、工具变量的概念和应用工具变量是一种用来解决内生性问题的工具,即解决因果分析中存在的内生性偏误。
在观察数据中,变量之间可能存在内生性关系,即某个解释变量与误差项相关,从而导致我们无法准确估计变量之间的真实关系。
举个例子,假设我们想研究教育对收入的影响,但教育水平很可能与个体的能力有关,这样教育水平就与误差项相关,无法得到准确的估计。
为了解决这个问题,我们可以引入一个工具变量,它与教育水平相关,但与个体能力无关。
通过使用工具变量,我们可以消除这种内生性问题,得到更加准确的估计结果。
二、两阶段最小二乘法的原理两阶段最小二乘法是一种常用的解决内生性问题的方法。
它将原始模型的内生变量替换为工具变量,通过两个阶段的回归来进行估计。
第一阶段,我们使用工具变量回归原始内生变量,得到预测值。
这个预测值不受内生性问题的影响,可以作为第二阶段的新解释变量。
第二阶段,我们将第一阶段得到的预测值作为新的解释变量,与其他变量一起回归目标变量。
这样可以得到消除内生性偏误后的估计结果。
三、两阶段最小二乘法的使用场景两阶段最小二乘法主要用于解决内生性问题,特别是在实证经济学中的因果推断中常见的内生性问题。
常见的使用场景包括但不限于:1. 自然实验:在某些情况下,自然条件的改变可以提供有效的工具变量。
比如,研究教育对收入的影响时,某个教育政策的实施可以被视为一个自然实验,政策的实施对教育水平有影响,但与个体能力无关。
2. 父母教育对子女教育的影响:父母的教育水平很可能同时与遗传因素有关,这样就存在内生性问题。
通过引入工具变量,比如父母的出生地和教育机会,可以解决这个问题。
第15章 工具变量估计与两阶段最小二乘法

15.2 多元回归模型中的IV估计
简单回归模型IV估计很容易延伸到多元回归
y1 0 1 y2 2 z1 L k zk1 u1
借用联立方程模型的形式和术语,此方程称 为结构方程(structural equation)。 z1, z2 ,L , zk1是外生变量,y2 被怀疑是内生的, 即可能与u相关。需要找到其工具变量
具体的IV估计量可从k+1个矩条件对应的样本 方程求出:
Eu 0, Ez1u 0,L , E zk1u 0, E zku 0
15.3 两阶段最小二乘法
如果一个内生解释变量有多个工具变量,如 何有效运用多个工具变量?以下面结构模 型为例: y1 0 1y2 2z1 u1
如果内生解释变量 y2有两个被排斥的外生变 量 z2 , z3,且都与 y2相关,则不仅其中任何 一个可作为IV,而且它们的任何线性组合也 是有效的IV。为了找到最好的IV,需选择与 y2
最高度相关的线性组合,这要求估计约简型 方程: y2 0 1z1 2 z2 3z3 v2
有效的工具变量 zk 需满足:(1)是未包含的 外生变量,即它不在结构方程中且与u不相 关。
15.2 多元回归模型中的IV估计
(2)zk 与 y2 存在某种偏相关,即约简型方程
y2 0 1z1 L k1zk1 k zk v
的系数满足: k 0
同样要求(1)不能检验,只能寄希望于经济 逻辑和反思。要求(2)可对约简型方程估 计后直接检验。
15.1 动机:简单回归模型中的遗漏变量
要求(2)容易检验,只需x对z简单回归,检 验斜率系数的显著性。
内生解释变量和工具变量也可以是二值变量
01-93.2 两阶段最小二乘(2SLS)

F( 1,
48
46) = 40.39
Prob > F
= 0.0000
R-squared
= 0.4710
Root MSE
= .09394
-----------------------------------------------------------------------------------------------|
• 标准误不正确,因为第一阶段的结果是估计的而非真实的。
合并指令
Y
X
Z
. ivregress 2sls lpackpc (lravgprs = rtaxso) if year==1995, vce(robust);
Instrumental variables (2SLS) regression
Number of obs =
6.35
0.000
.0209956 .0404621
_cons | 4.616546 .0289177 159.64 0.000
4.558338 4.674755
X-hat
. predict lravphat;
Now we have the predicted values from the 1st stage
_cons
| 9.719875 1.597119
6.09
0.000
6.505042 12.93471
------------------------------------------------------------------------------------------------
• 系数为 TSLS 估计值
第二阶段
eviews两阶段最小二乘法步骤

eviews两阶段最小二乘法步骤最小二乘法(OLS)是一种常用的线性回归参数估计方法。
然而,有时候样本数据可能同时受到外部因素和内部因素的影响,导致OLS估计出的参数具有偏误。
为了应对这个问题,经济学家和统计学家提出了两阶段最小二乘法(2SLS)。
两阶段最小二乘法是基于一种被称为工具变量的技术。
在使用OLS 估计线性回归模型时,我们经常会面对内生性问题,即自变量和误差项之间可能存在内生性关系,导致OLS估计结果不准确甚至出现偏误。
这时候,我们就需要引入一个工具变量来解决内生性问题。
两阶段最小二乘法的步骤大致可以分为两个阶段:第一阶段:工具变量的选择在两阶段最小二乘法中,首先需要确定一个或多个工具变量。
工具变量应当满足两个条件:第一,与内生自变量相关;第二,与回归方程的误差项不相关。
通常情况下,工具变量的选择需要通过经验和理论知识来确定。
例如,如果我们想要研究教育对收入的影响,而教育受家庭背景的影响,那么我们可以选择父母教育水平作为工具变量。
第二阶段:两阶段最小二乘法的估计在第一阶段确定了工具变量之后,接下来就是进行两阶段最小二乘法的估计。
这个过程可以分为两个步骤。
在第一步中,我们使用工具变量来估计内生自变量,得到估计值。
在第二步中,我们将这些估计值代入原始回归方程中,然后利用OLS对整个模型进行估计,得到最终的参数估计结果。
两阶段最小二乘法的步骤相对于OLS来说更为复杂,但它能够有效地解决内生性问题,得到更加准确的参数估计结果。
然而,同时也需要注意的是,在使用两阶段最小二乘法时需要满足一些前提条件,比如工具变量的有效性和外生性等。
如果这些前提条件不满足,那么两阶段最小二乘法的结果可能会出现偏误。
总之,两阶段最小二乘法是一种强大的工具,能够有效地应对内生性问题,提高线性回归模型的参数估计准确性。
在实际应用中,研究者需要根据具体情况来选择合适的工具变量,并严格遵守两阶段最小二乘法的步骤,以获得可靠的结果。
二阶段最小二乘法和工具变量法结果相同的证明

二阶段最小二乘法(Two-Stage Least Squares, 2SLS)和工具变量法(Instrumental Variables, IV)在计量经济学中被广泛应用,用于解决因果关系的内生性问题。
虽然这两种方法在形式上有所不同,但是它们在某些条件下可以得到相同的结果。
本文将就二阶段最小二乘法和工具变量法结果相同的证明展开探讨。
1. 二阶段最小二乘法的基本原理及公式我们需要了解二阶段最小二乘法的基本原理。
在计量经济学中,当自变量存在内生性问题时,我们无法直接使用最小二乘法进行回归分析。
这时,我们可以通过引入工具变量来解决内生性问题。
二阶段最小二乘法包括两个阶段,第一阶段是利用工具变量估计内生变量的值,第二阶段是利用第一阶段的估计值替代内生变量进行普通最小二乘法回归分析。
其公式为:[Y_i = _0 + _1X_i + _i][X_i = _0 + _1Z_i + _i]其中,(Y_i)代表因变量,(X_i)代表内生解释变量,(Z_i)代表工具变量,(_i)和(_i)分别为误差项。
通过两个阶段的回归分析,我们可以得到最终的估计结果。
2. 工具变量法的基本原理及公式工具变量法是一种处理内生性的方法,其基本原理是利用与内生解释变量相关但与误差项不相关的外生变量作为工具变量,通过工具变量的线性组合来替代内生变量进行估计。
工具变量法的回归模型可以表示为:[X_i = _0 + _1Z_i + _i] [Y_i = _0 + _1 + _i]其中,()是利用工具变量估计的内生变量的值。
3. 二阶段最小二乘法和工具变量法结果相同的条件现在让我们来探讨二阶段最小二乘法和工具变量法结果相同的条件。
事实上,当工具变量法满足一定条件时,其结果与二阶段最小二乘法是等价的。
具体而言,若工具变量满足外生性和相关性条件(即与内生变量相关),并且内生变量的影响能够完全通过工具变量进行替代,那么工具变量法的结果将与二阶段最小二乘法一致。
工具变量两阶段最小二乘

两阶段最小二乘法:TSLS
点击选择按钮(Op>ons)对参数估计协方差矩 阵的估计方法进行选择,本例采用的是横截面数据, 因此采用怀特异方差一致的协方差矩阵估计。
6.2 工具变量估计方法
6.2.2 两阶段最小二乘法:TSLS
两阶段最小二乘法:TSLS
一个内生自变量
Y = β0 + β1X1 + β2 X 2 + β3 X3 + u X1 为内生变量, X2 和X 3 为外生变量,Z1 、Z2 X为1 的工具变量。 两阶段最小二乘步骤:
原假设: H0 : α1 = α2 = 0
• 用第五章构造的Tr 统计量进行F检验,若 Tr值够大, 通常大于10则认为相关性足够,可做工具变量。
• 若接受原假设,则表明工具变量与内生变量相关 性太弱,其不适宜做工具
两阶段最小二乘法:TSLS
一个内生自变量
EViews实现两阶段最小二乘: 例子6.2 已婚女性小时工资(续)
• 不相干变量引入不会影响参数估计的无偏性和一 致性,但是会影响参数估计的有效性。
6.2 工具变量估计方法
6.2.1 工具变量估计法 6.2.2 两阶段最小二乘法:TSLS
6.2 工具变量估计方法
6.2.1 工具变量估计法
工具变量估计法
一元线性回归模型
Y = β0 + β1X + u
Ø 定义1:如果存在变量Z
工具变量法IV两阶段最小二乘法TSLS

YY12
b12Y2 b23Y3
c11 X1 c12 X 2 c23 X 3 u2
u1
Y3 b31Y1 b32Y2 c33 X 3 u3
其中:Y1,Y2 ,Y3 为内生变量, X1, X 2 , X 3为外生变量。
Dongbei University Of Finance & Economics
2)方程组系统估计法 包括:三阶段最小二乘法(3SLS)、完全信息最
大似然估计法(FIML)等。这些方法是对模型中所有 结构方程的参数同时进行估计,从而获得模型全部参 数的估计值。它利用了模型的全部方程信息,称为完 全信息方法。
Dongbei University Of Finance & Economics
/ ˆ23 bˆ12ˆ21
cˆ12 ˆ12 bˆ12ˆ22
若已知πij,即可解出惟一的cij,第一个结构方程得以 估计。这样,结构方程的参数估计值用传统的OLS就 得到了。
Dongbei University Of Finance & Economics
ILS的步骤
一、先对模型作识别判断,找出恰好识别的方程; 二、利用简约式和结构式参数的关系式 B
Y1 11 X1 12 X 2 13 X 3 v1 Y2 21 X1 22 X 2 23 X 3 v2 Y3 31 X1 32 X 2 33 X 3 v3
Dongbei University Of Finance & Economics
第一阶段是对结构方程右端所包含的所有内生变量(作为解 释变量)所对应的简化式方程进行OLS估计,得到内生变量的估计 (回归)值;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6.1 内生性
6.1.2 内生性产生的原因
模型设定错误、测量误差和联立性
• 模型设定错误是导致内生性最常见的原因,模型 设定错误往往表现为相关变量的缺失,缺失变量 成为错误设定模型误差项的一部分,当缺失变量 和模型中其他变量相关时,就会导致这些变量的 内生性。(工资与教育、能力)、 • 不相干变量引入不会影响参数估计的无偏性和一 致性,但是会影响参数估计的有效性。
6.1 内生性
6.1.1 OLS估计的不一致性
2 −1 2 SX = n ( X − X ) , ∑ ji j j i =1 n n
j = 1,2
2 −1 SX = n ∑i=1 ( X ji − X j )ui , j = 1,2 j ,u 2 −1 SX = n ∑i=1 ( X 1i − X 1 )( X 2i − X 2 ) 1,X 2 n
6.2 工具变量估计方法
6.2.1 工具变量估计法 6.2.2 两阶段最小二乘法:TSLS
6.2 工具变量估计方法
6.2.1 工具变量估计法
工具变量估计法
一元线性回归模型
Y = β0 + β1 X + u
Ø 定义1:如果存在变量 ,满足 Z Cov ( Z , u ) = 0 (1)与 u 不相关 Cov ( Z , X ) ≠ 0 (2)与 X 相关 Z X为 称 的工具变量,也称工具 (instrument)。
工具变量估计法
一元线性回归模型
Y = β0 + β1 X + u
总体矩条件:
Cov(Z,u ) = E ( Zu ) = E[(Y − β 0 − β1 X ) Z ] = 0 E(u ) = E(Y − β 0 − β1 X ) = 0
类比出样本矩条件:
n n
−1
∑ (Y
i =1 n i =1
n
工具变量估计法
多元线性回归模型
Y = β0 + β1 X1 + !β r X r + βr +1 X r +1 + ! + βk X k + u
同பைடு நூலகம்元情形一样,总体矩条件:
Cov ( Z l , u ) = E( Z l u ) = E[ Z l (Y − β 0 − β1 X 1 − ! − β k X k )] = 0, l = 1,!, r Cov ( X m , u ) = E( X mu ) = E[ X m (Y − β 0 − β1 X 1 − ! − β k X k )] = 0, m = r + 1,!, k
6.1 内生性
6.1.1 OLS估计的不一致性
模型: Y = β0 + β1 X1 + β2 X 2 + ! + βk X k + u 若 Cov( X r , u) ≠ 0 则 X r 为内生自变量。 • 存在内生自变量时,OLS估计不再有一致性
6.1 内生性
6.1.1 OLS估计的不一致性
假设检验: 统计量
t β1 ≡
ˆ β 1 IV S1IV
给定误差项服从正态分布,则 t β1 ~ t (n − 2) 若没给定分布,大样本情况下服从标准正态分布。
工具变量估计法
一元线性回归模型
例子6.2 已婚女性小时工资 直接OLS:
ln(wage) = − 0.185+ 0.109 educ
( −1.000) ( 7.785)
i =1 n
( Z i − Z )(Yi − Y )
工具变量估计法
一元线性回归模型
Y = β0 + β1 X + u
u 结论2:工具变量估计的性质 (1)工具变量估计是一致估计 (2)工具变量估计具有渐进正态分布
Z
X
u
Y
工具变量估计法
一元线性回归模型
Y = β0 + β1 X + u
u 结论3:OLS估计和工具变量估计 一元线性回归模型的自变量为外生时, OLS估计可看做以自变量本身为工具的工具变量估 计。 例子6.1 气温与冷饮消费(续) Coldr = β + β AirCd + u
6.2 工具变量估计方法
6.2.2 两阶段最小二乘法:TSLS
两阶段最小二乘法:TSLS
一个内生自变量 Y = β0 + β1 X 1 + β 2 X 2 + β3 X 3 + u
Z1 、 X1 为内生变量, X 2 和 Z2 X X 3 为外生变量, 为 1 的工具变量。 两阶段最小二乘步骤: 第一阶段(first stage):以内生变量为因变量, 所有外生变量为自变量做回归 X1 = α 0 + α1Z1 + α 2 Z 2 + α3 X 2 + α 4 X 3 + v 得拟合值
ˆ 只要 ρ X , X ≠ 0 β 2 敛到 。
1 2
2 σ X Cov ( X 2 , u ) − ρ X , X Cov ( X 1 , u ) ˆ β2 − β2 → 2 [σ X σ X (1 − ρ X , X )]
1 2 1 1 2 1 2
,
β2 不以概率收
6.1 内生性
6.1.1 OLS估计的不一致性
fathedu 作工具变量:
ln(wage) = − 0.441+ 0.059 educ
( 0.989 ) (1.686 )
工具变量估计法
多元线性回归模型
Y = β0 + β1 X1 + !β r X r + βr +1 X r +1 + ! + βk X k + u
定义2:如果存在变量 Zl ,满足 Cov (Zl , u) = 0 (1)与 u 不相关 Cov ( Z l , X l ) ≠ 0 (2)与 X l 相关 Zl X为 l = 1,!, r 称 的工具变量,也称工 l 具 , 。
类比原则得样本矩条件,可解得参数估计。
工具变量估计法
多元线性回归模型
Y = β0 + β1 X1 + !β r X r + βr +1 X r +1 + ! + βk X k + u
u 结论4:工具变量估计的性质 p ˆ β ⎯ ⎯→ β jIV (1) jIV 2 ˆ n ( β − β ) ~ N ( 0 , σ (2) ˆ ) jIV jIV (a) β 2 ˆ σβ j= 0,1,!, k β 其中 为 的方差, ˆ jIV
0 1
House
用住房面积
作为工具变量
工具变量估计法
一元线性回归模型
Y = β0 + β1 X + u
方差估计:若 Var (u | Z ) = E(u 2 | Z ) = σ 2 2 ˆ σ S2 = n β 2 2 ˆ Z ,X ( X − X ) ρ ∑i=1 i n 1 其中, σ ˆ2 = ˆ2 u
ˆ =α ˆ0 + α ˆ1Z1 + α ˆ2Z2 + α ˆ3 X 2 + α ˆ4 X 3 X 1
两阶段最小二乘法:TSLS
一个内生自变量 Y = β0 + β1 X 1 + β 2 X 2 + β3 X 3 + u
Z1 、 X1 为内生变量, X 2 和 Z2 X X 3 为外生变量, 为 1 的工具变量。 两阶段最小二乘步骤: ˆ X1作为 X 第二阶段(second stage):将 1 Y = β0 + 的工具变量,对模型 β1 X1 + β2 X 2 + β3 X 3 + u 实施工具变量估计
u 结论1:OLS估计的不一致性 (1)线性回归模型内生自变量回归系数的 OLS估计不是一致估计; (2)如果和内生自变量相关,外生自变量回 归系数的OLS估计不是一致估计
6.1 内生性
6.1.1 OLS估计的不一致性
内生性影响图示:
X
Y
u
dY / dX = β + du / dX
ˆ 是对 β + du / dX 的估计。 β
jIV
jIV
工具变量估计法
多元线性回归模型 例子6.3 在职男性工资
log( wage ) = β 0 + β1exper + β 2exper + β 3edu + βX + ε 由于能力变量的缺失,导致经验和教育都具内 生性,因此Kling用居住地附近是否有四年制大学 (虚拟变量)作为 edu 的工具变量,以年龄和年 2 exper exper 龄的平方作为 和 的工具变量
i
ˆ −β ˆ X )Z = 0 −β 0 1 i i
−1
ˆ −β ˆX )=0 ( Y − β ∑ i 0 1 i
工具变量估计法
一元线性回归模型
Y = β0 + β1 X + u
ˆ =Y −β ˆ β 0 IV 1IV ˆ β
1IV
∑ = ∑
n
( Z − Z )( X − X ) i i i =1
工具变量估计法
EViews操作
例子6.2 已婚女性小时工资(续) log( wage ) = β 0 + β1exper + β 2exper 2 + β 3edu + u
工具变量估计法
EViews操作
例子6.2 已婚女性小时工资(续) log( wage ) = β 0 + β1exper + β 2exper 2 + β 3edu + u 点击选择按钮(Op>ons)对参数估计协方差矩 阵的估计方法进行选择,本例采用的是横截面数据, 因此采用怀特异方差一致的协方差矩阵估计。