第10章-工具变量法,2SLS与GMM
工具变量与两阶段最小二乘法

工具变量与两阶段最小二乘法在经济学和统计学中,工具变量(Instrumental Variable,简称IV)与两阶段最小二乘法(Two-stage Least Squares,简称2SLS)是重要的分析方法。
本文将介绍工具变量的基本概念及其应用,然后详细探讨两阶段最小二乘法的原理和使用场景。
一、工具变量的概念和应用工具变量是一种用来解决内生性问题的工具,即解决因果分析中存在的内生性偏误。
在观察数据中,变量之间可能存在内生性关系,即某个解释变量与误差项相关,从而导致我们无法准确估计变量之间的真实关系。
举个例子,假设我们想研究教育对收入的影响,但教育水平很可能与个体的能力有关,这样教育水平就与误差项相关,无法得到准确的估计。
为了解决这个问题,我们可以引入一个工具变量,它与教育水平相关,但与个体能力无关。
通过使用工具变量,我们可以消除这种内生性问题,得到更加准确的估计结果。
二、两阶段最小二乘法的原理两阶段最小二乘法是一种常用的解决内生性问题的方法。
它将原始模型的内生变量替换为工具变量,通过两个阶段的回归来进行估计。
第一阶段,我们使用工具变量回归原始内生变量,得到预测值。
这个预测值不受内生性问题的影响,可以作为第二阶段的新解释变量。
第二阶段,我们将第一阶段得到的预测值作为新的解释变量,与其他变量一起回归目标变量。
这样可以得到消除内生性偏误后的估计结果。
三、两阶段最小二乘法的使用场景两阶段最小二乘法主要用于解决内生性问题,特别是在实证经济学中的因果推断中常见的内生性问题。
常见的使用场景包括但不限于:1. 自然实验:在某些情况下,自然条件的改变可以提供有效的工具变量。
比如,研究教育对收入的影响时,某个教育政策的实施可以被视为一个自然实验,政策的实施对教育水平有影响,但与个体能力无关。
2. 父母教育对子女教育的影响:父母的教育水平很可能同时与遗传因素有关,这样就存在内生性问题。
通过引入工具变量,比如父母的出生地和教育机会,可以解决这个问题。
2SLS 和 GMM 的区别

Walter Sosa-Escudero
Instrumental Variables
Endogeneities IV under Exact Identification IV: the Overidentified Case Efficient GMM Conditional Homoskedasticity and 2SLS
Simultaneous Equations The simplest supply and s qi qd i s qi In equilibrium:
s d −1 d d s pi = (β2 − β2 ) (xi β1 − xs i β1 + d i
demand system:
s s = xs i β1 + β2 pi + d d dp + = xi β 1 + β 2 i d = qi s i d i
Endogeneities IV under Exact Identification IV: the Overidentified Case Efficient GMM Conditional Homoskedasticity and 2SLS
Instrumental Variables
Walter Sosa-Escudero
Explanatory variable measured with error Ci = β1 + β2 Xi∗ + ui and assume all assumptions for consistency hold. Now suppose we observe a ‘noisy’ version of Xi : Xi = Xi∗ + ωi ωi is a measurement error. We will assume ωi is iid, with 2 and uncorrelated with X ∗ and u . E (ωi ) = 0, V (ωi ) = σω i i Replacing Xi∗ = Xi − ωi , the regression model can be written as Ci = β1 + β2 Xi + νi with ν = −β2 ωi + ui
第10 章 工具变量,2SLS 与GMM

以上工具变量法仅适用于恰好识别的情形。在过度识别的 情况下, Z′X 不是方阵, (Z′X)−1不存在,无法定义 βˆ IV 。解 决方法之一是扔掉“多余”的工具变量。更有效率的做法 是 2SLS。
10.3 二段最小二乘法
第一阶段
20
将 每 个 解 释 变 量 x1, ", xK 分 别 对 所 有 L 个 工 具 变 量
ut vt
令 qt ≡ qtd = qts ,可得
⎪⎪⎩⎧⎪⎪⎨qqtt
= =
α 0
β 0
+ +
α 1
β 1
pt pt
+ +
ut vt
(demand) (supply) (equilibrium)
(10.1)
(10.2)
2
p
i
i
i
i
ii
i
i
i
i
i
i
i
i i
qts
i
i
i
qtd
0
q
图 10.1、需求与供给决定市场均衡
14
∑ ∑ βˆ MM
=
⎛⎜⎜⎜⎝
1 n
n i=1
xi
xi′⎞⎠⎟⎟⎟−1
⎛⎝⎜⎜⎜
1 n
n i=1
xi
yi
⎞⎟⎟⎟⎠
=
(
X′X)−1
X′y
=
βˆ
OLS
(10.14)
2.工具量法作为一种矩估计
假设回归模型为,
yi
=
β 1
xi1
+
"
+
β K
−1
xi,
《金融实证分析方法》课程教学大纲

《金融实证分析方法》课程教学大纲
系(专业)课程委员会审查意见:
我系(专业)课程委员会已对本课程教学大纲进行了审查,同意执行。
系(专业)课程委员会主任签名:日期:年月日
注:1、课程教学目标:请精炼概括3-5条目标,并注明每条目标所要求的学习目标层次(理解、运用、分析、综合和评价)。
本课程教学目标须与授课对象的专业培养目标有一定的对应关系
2、学生核心能力即毕业要求或培养要求,请任课教师从授课对象人才培养方案中对应部分复制()
3、教学方式可选:课堂讲授/小组讨论/实验/实训
4、若课程无理论教学环节或无实践教学环节,可将相应的教学进度表删掉。
第七章-工具变量、2SLS、GMM

为外生解释变量向量。记工具变量为 x1 z2 ,其中
z2为方程外的工具变量。在2SLS的第一阶段回归中
x2
OLS
x1,z
2,其R
2包含了内生变量x
与工具变
2
量z 2相关性的信息,但也可能由于x 2与x1的相关性造
成。
为此,应该使用滤去x1影响的“偏R2”(partial R2)
记为R
2 p
具体操作步骤如下:首先作x2对x1回归,
x2
OLS
x1,记其残差为e
x
,代表x
2
2中不能由x1解
释的部分;其次,作z2对x1回归,z2 OLS x1,记
其残差为ez2,代表z2中不能由x1解释的部分;最后
对两个残差进行回归,即ex2
OLS
e
,所得的判
z2
定系数即R
2p,若其较小即可认为z
是弱工具变量
2
判断弱工具变量的另一个方法是,在第一阶段回
一、工具变量法(Instrumental Variable,IV)
可以引入工具变量w
来解决内生变量问题。一个有
t
效的工具变量应满足以下两个条件:
(1)相关性:工具变量与内生解释变量相关,即
Cov
w
t,p
t
0,p
为内生解释变量
t
(2)外生性:工具变量与扰动项不相关,即
Cov wt,t =0
二、工具变量法作为一种矩估计
n i=1
xi yi =
XX
-1 Xy=ˆOLS
显然这就是OLS估计量
2、工具变量法作为一种矩估计
假设回归模型为
yi=1x
+
i1
工具变量法(二):弱工具变量

工具变量法(二):弱工具变量世上没有完美的计量方法,因为所有的计量方法与模型均依赖于一定的前提假设。
因此,在估计完计量模型后,通常需要对模型的前提假设进行检验,称为“诊断性检验”(diagnostic checking)或“模型检验”(model checking)。
工具变量法也不例外。
工具变量法的成立依赖于有效的工具变量(valid instruments),即所使用的工具变量须满足相关性(与内生解释变量相关)与外生性(与扰动项不相关)。
工具变量的相关性(Instrument Relevance)在大样本下,2SLS为一致估计。
但对于大多数实践中的有限样本(finite sample),2SLS估计量依然存在偏差(bias),并不以真实参数为其分布的中心,即而且,如果工具变量与内生变量的相关性较弱,则 2SLS 的偏差会变得更为严重。
直观来看,2SLS 的基本思想是通过外生的工具变量,从内生变量中分离出一部分外生变动(exogenous variations),以获得一致估计。
如果工具变量与内生变量的相关性很弱,则通过工具变量分离出的内生变量之外生变动仅包含很少的信息。
因此,利用这些少量信息进行的工具变量法估计就不准确,即使样本容量很大也很难收敛到真实的参数值。
这种工具变量称为“弱工具变量”(weak instruments)。
弱工具变量的后果弱工具变量的后果类似于样本容量过小,会导致 2SLS 的小样本性质变得很差,而 2SLS 的大样本分布也可能离正态分布相去甚远,致使基于大样本理论的统计推断失效。
下面通过蒙特卡洛模拟(Monte Carlo simulation)来直观地考察弱工具变量的后果。
考虑最简单的一元回归模型,假设其数据生成过程(data generating process)为:其中,为内生变量,与扰动项相关;而的真实系数为 2。
假设样本容量为10,000,并使用工具变量进行2SLS 回归。
二阶段最小二乘法和工具变量法结果相同的证明

二阶段最小二乘法和工具变量法结果相同的证明【知识文章格式】标题:二阶段最小二乘法和工具变量法的结果相同的证明【引言】在经济学和社会科学领域,研究因果关系常常面临内生性问题。
为了解决这个问题,研究人员常常使用两种方法:二阶段最小二乘法(2SLS)和工具变量法(IV)。
在很多情况下,这两种方法给出了相似的结果,但我们是否可以证明它们真的是等价的呢?本文将通过理论推导进行证明。
【正文】1. 二阶段最小二乘法(2SLS)和工具变量法(IV)的基本原理在介绍证明之前,我们先回顾一下二阶段最小二乘法和工具变量法的基本原理。
二阶段最小二乘法通过两个阶段来估计模型参数。
在第一阶段,我们利用工具变量对内生变量进行回归,得到工具变量的估计量。
在第二阶段,我们使用第一阶段得到的工具变量的估计量替代内生变量,再进行回归,得到最终的估计结果。
工具变量法与2SLS类似,也是使用工具变量进行内生变量的回归,但与2SLS不同的是,工具变量法只进行一次回归,而不需要进行第二阶段的回归。
两种方法都旨在解决内生性问题,但它们的具体实施方式略有不同。
2. 二阶段最小二乘法和工具变量法的理论等价性证明我们现在来证明二阶段最小二乘法和工具变量法的结果是相同的。
设真实模型为:Y = α + βX + ε其中,Y是因变量,X是内生变量,α和β是参数,ε是误差项。
根据2SLS方法的第一阶段回归估计有:X = γ + πZ + u其中,γ和π是参数,Z是工具变量,u是干扰项。
利用第一阶段的估计结果,我们可以得到内生变量的估计量X^:X^ = γ + πZ将内生变量的估计量代入原模型,得到二阶段回归模型:Y = α + β(γ + πZ) + ε进一步整理得:Y = (α + βγ) + βπZ + ε我们可以看到,二阶段最小二乘法的结果与工具变量法的结果非常类似,只是加入了一个常数项(α+βγ)。
由此可证明二阶段最小二乘法和工具变量法的结果是相同的。
2sls回归公式

2sls回归公式2SLS回归公式在经济学和统计学中被广泛应用,它是基于最小二乘法的一种估计方法,用于解决因果关系的内生性问题。
在本文中,我们将详细介绍2SLS回归公式的原理和应用。
2SLS回归公式全称为Two-Stage Least Squares regression,中文翻译为两阶段最小二乘回归。
它主要用于解决因果关系中的内生性问题,即自变量与误差项之间存在相关性的情况。
内生性问题在经济学和社会科学研究中非常常见,如果不加以控制,会导致估计结果的偏误。
2SLS回归公式的基本原理是通过两个阶段的回归来解决内生性问题。
第一个阶段,我们先用一个外生性变量(Instrumental Variable,IV)来替代内生性变量,进行回归分析,得到一个“第一阶段回归方程”。
通过这个方程,我们可以估计出内生性变量的预测值。
在第二个阶段,我们将这个预测值代入原始的回归方程中,作为自变量进行回归分析。
这样,我们就得到了一个“第二阶段回归方程”。
通过2SLS回归,我们可以得到对内生性变量的一致估计。
具体来说,2SLS回归公式可以表示为:Y = Xβ + ε其中,Y是因变量,X是自变量矩阵,包括外生性变量和内生性变量的预测值,β是回归系数,ε是误差项。
通过2SLS回归,我们可以得到β的一致估计。
2SLS回归公式的应用非常广泛。
在经济学中,它常用于解决内生性问题,例如在研究教育对收入的影响时,教育水平往往与家庭背景存在内生性关系,通过2SLS回归可以解决这个问题。
在实证研究中,2SLS回归也被广泛应用于解决因果关系的内生性问题,例如评估政策的效果时,政策变量可能与其他因素存在内生性关系,通过2SLS 回归可以得到更准确的估计结果。
然而,使用2SLS回归公式也存在一些注意事项。
首先,选择合适的工具变量非常重要,工具变量应与内生性变量相关,但与误差项不相关。
其次,2SLS回归要求工具变量的可用性和可靠性,需要进行严格的检验。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
qqtt
0 0
1 pt 1 pt
ut vt
两个方程中的被解释变量与解释变量完全一样。
如直接作回归qt OLS pt ,估计的是需求函数还是供给函数?
2
图 10.1 需求与供给决定市场均衡
3
把线性方程组中的( pt , qt )看成是未知数(内生变量),把(ut , vt )看 作已知,可求解( pt , qt )为(ut , vt )的函数:
由于气温 xt 的变化使得供给函数qts 沿着需求函数qtd 移动,故可估 计需求函数qtd 。
此时,称 xt 为“工具变量”(Instrumental Variable,简记 IV)。
在回归方程中(此处为需求方程),一个有效(valid)的工具变量应 满足以下两个条件。
(i) 相关性:工具变量与内生解释变量相关,即Cov(xt , pt ) 0。
pt
qt
pt (ut ,vt )
0 1
0 1
vt
1
ut
1
qt
(ut
, vt
)
10 1
01 1
1vt 1
1ut 1
由于 pt 为(ut , vt )的函数,故Cov( pt , ut ) 0,Cov( pt , vt ) 0。
OLS 估计值ˆ1, ˆ1不是1, 1的一致估计量。
称这种偏差为“联立方程偏差”(simultaneity bias)或“内生变量 偏差”(endogeneity bias)。
1
如果工具变量与内生变量无关,Cov(xt , pt ) 0,则无法定义工 具变量法。
如果工具变量与内生变量的相关性很弱,Cov(xt , pt ) 0,会导 致估计量ˆ1, IV 的方差变得很大,称为“弱工具变量问题”。
传统的工具变量法通过“二阶段最小二乘法”(Two Stage Least Square,简记 2SLS 或 TSLS)来实现。
8
同时对需求方程qt 0 1 pt ut 两边求与 xt 的协方差:
Cov(qt , xt ) Cov(0 1 pt ut , xt )
1 Cov( pt , xt ) Cov(ut, xt ) 1 Cov( pt , xt )
0
根据工具变量的相关性,Cov( pt , xt ) 0,可把上式两边同除 以Cov( pt , xt ):
© 陈强,《高级计量经济学及 Stata 应用》课件,第二版,2014 年,高等教育出版社。
第 10 章 工具变量,2SLS 与 GMM
10.1 解释变量与扰动项相关的例子
例 农产品市场均衡模型
qqtdts
0 0
1 pt 1 pt
ut vt
qtd
qts
(需求) (供给) (均衡)
1
令qt qtd qts ,可得
第一个方程为消费方程,第二个方程为国民收入恒等式。
如果单独对消费方程进行 OLS 估计,将不一致。
1
Cov(qt , xt ) Cov( pt , xt )
使用对应的样本值,可得一致的“工具变量估计量” (Instrumental Variablt , xt ) C ov( pt , xt )
p Cov(qt , Cov( pt ,
xt ) xt )
4
如能将内生变量分成两部分,一部分与扰动项相关,另一部分 与扰动项不相关,可用与扰动项不相关的那部分得到一致估计。
这种分离常借助另一“工具变量”来实现。
假设在图 10.1 中,存在某个因素(变量)使得供给曲线经常移动, 而需求曲线基本不动,则可估计需求曲线,参见图 10.2。
这个使得供给曲线移动的变量就是工具变量。
(ii) 外生性:工具变量与扰动项不相关,即Cov(xt , ut ) 0。
7
工具变量的外生性也称“排他性约束”(exclusion restriction), 因为外生性意味着,工具变量影响被解释变量的唯一渠道是通过 与其相关的内生解释变量,它排除了所有其他的可能影响渠道。
在本例中,气温 xt 满足这两个条件。 (i) 相 关 性 : 从 联 立 方 程 组 可 解 出 pt pt (xt , ut , vt ) , 故 Cov(xt , pt ) 0。 (ii) 外生性:因为气温 xt 是前定变量,故Cov(xt , ut ) 0。 利用工具变量的这两个性质,可得到对1的一致估计。
其次,由于在第一阶段回归中,拟合值 pˆt 与残差 pt pˆt 正交(OLS 的正交性),故上式右边的第二项Cov( pˆt , pt pˆt ) 0。
由于 pˆt 与t 不相关,故 2SLS 一致。
12
例 宏观经济模型中的消费函数
YCtt
0 1Yt
Ct It Gt
t
X
t
其中,Yt , Ct , It , Gt , Xt 分别代表国民收入、总消费、总投资、政 府净支出与净出口。
10
第一阶段回归:用内生解释变量对工具变量回归,即 pt OLS xt ,得到拟合值 pˆt 。
第二阶段回归:用被解释变量对第一阶段回归的拟合值进行回 归,即qt OLS pˆt 。
为什么这样做能得到好结果?把需求方程qt 0 1 pt ut 分解
qt 0 1 pˆt ut1( pt pˆt )
t
命题 在第二阶段回归中,pˆt 与新扰动项t ut 1( pt pˆt )不相 关。
11
证明:由于t ut 1( pt pˆt ),故 Cov( pˆt , t ) Cov( pˆt , ut ) 1 Cov( pˆt , pt pˆt )
首先,由于 pˆt 是 xt 的线性函数( pˆt 为第一阶段回归的拟合值),而 Cov(xt , ut ) 0(工具变量的外生性),故上式右边的第一项 Cov( pˆt , ut ) 0。
假设供给方程的扰动项可分解为两部分,即可观测的气温 xt 与不 可观测的其他因素:
qts 0 1 pt 2 xt vt
5
图 10.2 稳定的需求与变动的供给
6
假 定 气 温 xt 是 前 定 变 量 , 与 两 个 扰 动 项 都 不 相 关 , 即 Cov(xt , ut ) 0,Cov(xt , vt ) 0。