第十五章工具变量估计和TSLS4
工具变量(IV)详细解说

IV
The 2SLS name notwithstanding, we don‘t usually construct 2SLS estimates in two-steps. For one thing, the resulting standard errors are wrong, as we discuss later. () Where si is the residual from a regression cov( si , si ) V ( si ) of si on X i .This follows from the multivariate regression anatomy formula and the fact that cov( si , si ) V ( si ) . It is also easy to show that, in a model with a single endogenous variable and a single instrument, the 2SLS estimator is the same as the corresponding ILS( Indirect Least Squares ) estimator.(Q3) 由2SLS,
Zi 0 1si i cov( Zi ,i ) 0 cov(Yi , Zi ) cov(Yi , Zi ) / v( Zi ) (4.1.3) cov( si , Zi ) cov( si , Zi ) / v( Zi )
Zi
(IV)
IV
• Q1:The second equality in (4.1.3) is useful because its usually easier to think in terms of regression coefficients than in terms of covariance. 2.
第15章-工具变量

Cov( z, y) 1Cov( z, x) Cov( z, u)
现在,在式 (15.4) 中 Cov(z,u)=0 与式(15.5) 中 Cov(z,x)≠0 的假定下 ,我们可以解出 1 为:
Cov( z, y ) 1 Cov( z, x)
(15.9)
[注意到,若 z 与 x 不相关,即 Cov(z,x)=0,这 个简单的代数关系便不成立。]方程 (15.9)表 明, 1 是 z 和 y 之间的总体协方差除以 z 和 x 之间的总体协方差,这说明 1 被识别了。 给定一个随机样本,我们用对应样本量来估 计总体量。
score 0 1skipped u
(15.8)
其中,score 是期末考试成绩, skipped 是该 学期逃课的总次数。
当然,我们可能担心 skipped 与 u 中其他因素 相关:越有能力而又积极的学生可能逃课也越 少。因而 score 对 skipped 的简单回归,可能 不会给出逃课之因果效应的可靠估计。
这样一来 , 我们便把 abil 放人误差项中,而 只留下简单回归模型: Log(wage) =β 0+β 1educ+u (15.1 ) 其中,u 包含 abil。当然,如果用 OLS 估计 方程 (15.1) ,若 educ 与 abil 相关,则得到 的结果将是 1 的有偏而又不一致估计量。
即使能获得,如果我们的兴趣在于变量的影响, 而该变量又不随时间而变化,它对于我们也几 无用处:一阶差分或固定效应估计排除了不随 时间而变化的变量。 此外,迄今为止我们所研 究的面板数据方法,还不能解决与解释变量相 关的时变(即随着时间而不断变化的)遗漏变 量问题。
在本章,我们对内生性问题采用了一种不同的 方法。你将看到如何用工具变量法 (IV)来解决 一个或多个解释变量的内生性问题。就应用计 量经济学中线性方程的估计而言,两阶段最小 二乘法 (2SLS 或 TSLS)的受欢迎程度仅次于普 通最小二乘。
第15章 工具变量估计与两阶段最小二乘法

Eu 0, Ez1u 0,L , E zk1u 0, E zku 0
15.3 两阶段最小二乘法
如果一个内生解释变量有多个工具变量,如 何有效运用多个工具变量?以下面结构模 型为例: y1 0 1y2 2z1 u1
则称z是x的工具变量(IV)。工具变量可得 能够用于一致估计回归方程的参数。
15.1 动机:简单回归模型中的遗漏变量
借助于工具变量,回归方程的参数是可识别 (identification),即参数可用总体矩表示, 而总体矩可用样本矩来估计。用工具变量z 对回归方程两边协方差:
cov z, y 1 cov z, x cov z,u
对此也没有合理的解释。
15.2 多元回归模型中的IV估计
简单回归模型IV估计很容易延伸到多元回归
y1 0 1 y2 2 z1 L k zk1 u1
借用联立方程模型的形式和术语,此方程称 为结构方程(structural equation)。 z1, z2 ,L , zk1是外生变量,y2 被怀疑是内生的, 即可能与u相关。需要找到其工具变量
有效的工具变量 zk 需满足:(1)是未包含的 外生变量,即它不在结构方程中且与u不相 关。
15.2 多元回归模型中的IV估计
(2)zk 与 y2 存在某种偏相关,即约简型方程
y2 0 1z1 L k1zk1 k zk v
的系数满足: k 0
同样要求(1)不能检验,只能寄希望于经济 逻辑和反思。要求(2)可对约简型方程估 计后直接检验。
第十五章 工具变量估计与两阶段 最小二乘法
本章研究多元回归模型中的内生解释变 量问题。解释变量的内生性常来自遗漏 变量问题,这使OLS估计不一致。尽管 代理变量法和面板数据的固定效应法可 在某些情况下解决内生性问题,但远未 完善。本章讨论另一解决解释变量内生 性问题的方法:工具变量法(IV)。其 受欢迎程度仅次于OLS。
工具变量(IV):估计与检验_图文_图文

• 3。Wright考虑了几个可能的工具变量; 其中一个是天气。例如,某牧场的降雨量低 于平均值会使牧草减少从而减少给定价格时 黄油的产量(会使供给曲线向左移动而使均 衡价格上升),因此牧场地区降雨量满足工 具变量相关性的条件。但牧场地区降雨量对 黄油的需求没有直接影响,因此牧场地区降 雨量与ui的相关系数为零;也就是牧场地区 降雨量满足工具变量外生性条件。
• 例如具休考虑黄油的需求弹性估计问题 :
根据11个均衡样本点估计的方程究竟是需求函数还是 供给函数?两者都不是。由于这些点是由需求和供给 两者的变化确定的,因此用OLS拟合这些点的直线既 不是需求曲线也不是供给曲线的估计。
利用这些样本点估计出来的OLS拟合线是需求曲 线还是供给曲线,都不是!两个极端的情况如图 :
• 工具变量的外生性:若销售税是外生的,则必 须与需求方程中的误差无关;即销售税必然只 是通过价格间接影响香烟的需求。这看上去是 合理的:主要是因为不同州选择了不同的销售 额、收入、财产和其他公共财政事业的混合税 收,所以不同州的一般销售税是不同的。其中 关于公共财政的选择受到政治考量的驱使而不 是受香烟需求有关的因素影响。
工具变量(IV):估计与检验_图文_图文.ppt
• 由来
• 估计
– 矩估计(不好)
– 2SLS (最常用) – GMM(异方差自相关);LIML(若IV)
• 工具变量有效imum eigenvalue statistic,最小特征值统计量,用于多内 生解释变量
• 相关性条件:
• 1. 当包含一个内生变量但有多个工具变量时,工具 变量相关性的条件为给定W时至少有一个Z对预测X 是有用的(相关的)。
• 2. 当包含多个内生变量时,不但要排除完全多重共 线性问题,而且工具变量必须提供关于这些变量外生 性变动的足够信息,以分离出它们各自对Y的效应。
第15章-工具变量讲解

这样一来 , 我们便把 abil 放人误差项中,而 只留下简单回归模型: Log(wage) =β 0+β 1educ+u (15.1 ) 其中,u 包含 abil。当然,如果用 OLS 估计 方程 (15.1) ,若 educ 与 abil 相关,则得到 的结果将是 1 的有偏而又不一致估计量。
第15章 工具变量估计与两阶段最小二乘法
在本章中,我们进一步研究多元回归模型中的 内生解释变量 (endogenous explanatory Variables) 问题。在第 3 章中,我们推导出遗漏一个重要变 量时 OLS 估计量的偏误,在第 5 章中,我们说明 了在遗漏变量(omitted variables)的情况下,OLS 通 常是不一致的。
举例来说,考虑成年劳动者的工资方程中存 在无法观测之能力因素的问题。一个简单的 模型为: log(wage)=β 0+β 1educ+β 2abil+e 其中,e 是误差项。
在第 9 章中,我们证明了在某些假定下,如 何用诸如 IQ 的代理变量代替能力,从而通过 以下回归可得到一致估计量 log(wage)对 educ,IQ 回归 然而假定不能得到适当的代理变量(或它不 具备足以获取 1 一致估计量所需的性质)。
我们一开始先说明,在存在遗漏变量的情况 下,如何用 IV 法获得一致估计量。此外, IV 至少能在某些假定下用于解决变量误差 (errors-in-variables)问题。下一章将证明运 用 IV 法如何估计联立方程模型。
我们对工具变量估计的论述严格遵照我们在 第 1 篇中对普通最小二乘的推导,其中假定 我们有一个来自潜在总体的随机样本。这个 起点很合人意,因为除了简化符号之外,它 还强调用潜在总体来表述对 IV 估计所做的重 要假定 (正如用 OLS 时一样)。
c15 工具变量估计与两阶段最小二乘法

第15章工具变量估计与两阶段最小二乘法摘要: 本章继续讨论如何解决模型中的内生解释变量(endogenous explanatory variables )问题。
遗漏变量(omitted variables )是导致内生性问题的一个原因。
本章采用工具变量法(method of instrumental variables,IV )来解决模型中的一个或多个解释变量的内生性问题。
所采用的估计方法被称为两阶段最小二乘估计(method of two stage least squares ,2SLS or TSLS),其受欢迎程度仅次于OLS. IV 也能在某些特定的情形下解决变量带误差(errorsin-variables )的问题.15.1 动机: 简单回归中的遗漏变量如何处理可能发生的变量遗漏带来的偏误,已有三种选择: 1)直接忽略,讨论偏误的方向;2)寻找一个合适的代理变量;3)如果该遗漏变量不随时间变化时,采用FE 或FD 方法。
工具变量法的思路:不是考虑如何处理遗漏变量(此时遗漏变量在误差项中),而是寻找被遗漏的解释变量的替代变量,使得替代变量和误差项不再存在相关性。
y =β0+β1x +u ,此时该模型不满足MLR.4,从而不能保证Cov (x,u )=0,特别地,假定Cov (x,u )≠0. 如果x 的替代变量z 同时满足下面两个条件:1) 工具外生性(instrument exogeneity )条件:Cov (z,u )=0,2) 工具相关性(instrument relevance )条件:Cov (z,x )≠0,则称z 为x 的工具变量(instrumental variable ),或简称工具(instrumental ). 几点说明:1) 工具变量的外生性意味着z 对y 没有偏效应(当x 和u 中遗漏变量被控制时),同时也和其它被遗漏变量不相关;2) 工具外生性检验在多数情况下只能通过经济行为或反思来判断;3) 工具相关性检验借助t 和F 检验就行;外生性和相关性假设足以帮助我们识别(Identification )出β1=COv(z,y)Cov(z,x),那么β1的工具变量估计(instrumental variables (IV) estimator )为:β̂1=∑(z i −z ̅)(y i −y ̅)n i=1∑(z i −z ̅)(x i −x ̅)n i=1, 其是β1的一致但有偏的估计;4)β̂1显然当z=x,该估计就是OLS 估计,但这要以x 和u 无关为条件,也即工具变量法适于u 和x 无关的情形。
证明工具变量估计法的渐进方程

一、概述工具变量估计法是一种在计量经济学中常用的方法,用于解决内生性问题。
内生性问题是指自变量与误差项之间存在相关性,这会导致普通最小二乘法(OLS)估计出现偏误,从而影响结果的准确性。
为了解决这一问题,研究者引入了工具变量估计法,其基本思想是利用外生的工具变量来代替内生的自变量,从而消除内生性。
二、工具变量估计法的基本模型1. 基本假设在介绍工具变量估计法的基本模型之前,我们首先来说明其基本假设。
工具变量估计法的基本假设包括两部分:(1)内生性假设:自变量与误差项之间存在相关性,即自变量不满足外生性假设。
(2)工具变量假设:工具变量与自变量相关,但与误差项不相关,即工具变量满足外生性假设。
2. 简单的工具变量模型工具变量估计法的基本模型可以表示为:Y = β1X + u (1)其中,Y 表示因变量,X 表示内生的自变量,β1 表示自变量 X 对因变量 Y 的影响。
由于 X 存在内生性问题,因此我们引入工具变量 Z 来代替 X,得到以下两个方程:X = γ1Z + v (2)Y = β2Z + e (3)其中,Z 表示外生的工具变量,γ1 和β2 分别表示 Z 对 X 和 Y 的影响,v 和 e 分别表示方程(2)和方程(3)的误差项。
根据方程(2)和方程(3),我们可以得到工具变量估计法的渐进方程。
三、工具变量估计法的渐进方程1. 渐进方程的基本形式工具变量估计法的渐进方程可以表示为:β2slim = [(∑zi*zi)^(-1) * (∑zi*yi)] / [(∑zi*zi)^(-1) * (∑zi*xi)] (4)其中,β2slim 表示工具变量估计法的渐进系数估计值,zi 表示工具变量,yi 和 xi 分别表示因变量和内生自变量的观测值。
2. 渐进方程的意义通过渐进方程(4)可以得到工具变量估计法的渐进系数估计值。
工具变量估计法的渐进方程引入了工具变量 Z,并利用 Z 来代替内生自变量 X,从而消除内生性问题。
工具变量法IV两阶段最小二乘法TSLS

YY12
b12Y2 b23Y3
c11 X1 c12 X 2 c23 X 3 u2
u1
Y3 b31Y1 b32Y2 c33 X 3 u3
其中:Y1,Y2 ,Y3 为内生变量, X1, X 2 , X 3为外生变量。
Dongbei University Of Finance & Economics
2)方程组系统估计法 包括:三阶段最小二乘法(3SLS)、完全信息最
大似然估计法(FIML)等。这些方法是对模型中所有 结构方程的参数同时进行估计,从而获得模型全部参 数的估计值。它利用了模型的全部方程信息,称为完 全信息方法。
Dongbei University Of Finance & Economics
/ ˆ23 bˆ12ˆ21
cˆ12 ˆ12 bˆ12ˆ22
若已知πij,即可解出惟一的cij,第一个结构方程得以 估计。这样,结构方程的参数估计值用传统的OLS就 得到了。
Dongbei University Of Finance & Economics
ILS的步骤
一、先对模型作识别判断,找出恰好识别的方程; 二、利用简约式和结构式参数的关系式 B
Y1 11 X1 12 X 2 13 X 3 v1 Y2 21 X1 22 X 2 23 X 3 v2 Y3 31 X1 32 X 2 33 X 3 v3
Dongbei University Of Finance & Economics
第一阶段是对结构方程右端所包含的所有内生变量(作为解 释变量)所对应的简化式方程进行OLS估计,得到内生变量的估计 (回归)值;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
将残差û对所有外生变量(包括结构方程中外生 变量)回归,得到可决系数R2
计算统计量nR2
nR2 ~ 2(q)
大于临界值,拒绝原假设,有工具变量不是外生的 小于临界值,可SLS中的异方差和自相关问题
û对z1, z2, z3, z4回归 得到可决系数R2,计算统计量nR2
nR2~ 2(1)
为什么自由度是1,而不是4? 外生变量虽然有4个,但对于y2情况:
若结构方程中有m个内生变量,备选IV有m+q 个,即有m+q个可能的外生差检验:
同方差假定:
Var(u|z)=E(u2|z)=2
z包含所有外生变量,但不包含内生变量 异方差检验:
û2对所有外生变量回归,检验系数的联合显 著性 不能用Ev关检验
时间序列和截面数据,TSLS估计没有区别
自相关检验
假定y2是内生的,模型(1)的估计化模型的残差 vˆ2代替v2
y1=b0+b1y2+b2z1+b2z2+d1 vˆ+2 e
模型中b系数的估计结果等同于TSLS估计
检验H0:d1=0
等同方法:引入简化模型中y2的拟合值ŷ2 :
过度识别检验目的就是思路:
若z3 和z4都是有效工具变量,分别以其作为IV, TSLS估计量都具有一致性,估计值差异不大
若估计值差异很大,必有一个不是外生的 问题:
不知道哪个不是外生的 两个工具变量都不是外生的时=b0+b1y2+b2z1+b3z2+u
假定有两个备选变量z3 和z4:
若Cov(z3, u)=0;Cov(z4, u) =0,同时利用z3 和 z4作为工具变量,估计结果更有效!
工具外生性不能检验,工具变量中可能有些不 是外生的,会导致估计量不一致!
对于模型:
yt=b0+b1x1t+…+bkxkt+ut
利用工具变量对模型进行TSLS估计,得到残差ût 同样利用工具变量对下面模型进行TSLS估计:
yt=b0+b1x1t+…+bkxkt+ût -1+残差
(1)
检验H0:=0,拒绝则存在AR(1)自相关
AR(q)自相关检验,模型(1)中引入ût 的q阶滞后。
性,两个不一致的估计可能刚好差别不大 般的思路:
y1=b0+b1y2+b3z1+b4z2+u
外生变量z1, z2, z3, z4 若u已知,估计模型:
u对z1, z2, z3, z4回归
u未知,用TSLS回归的残差û代替:
检验H0:d1=d2=0【爱】核心用户 By微0渺 上传过度识别约束检验
考虑模型:
y1=b0+b1y2+b2z1+b3z2+u
若y2有一个有效的工具变量,称模型恰好识别 若y2有效工具变量多于一个,称模型过度识别
一般情形:
若被排除掉的外生变量个数多于作为解释变量的内 生变量个数,且IV相关性满足,则过度识别
y1=b0+b1y2+b2z1+b2z2+d1(y2-ŷ2)+e
=b0+g1y2+b2z1+b2z2-d1ŷ2+e
g1=b1+d1
若可能存在异内生变量的内生性检验
考虑模型:
y1=b0+b1y2+b2y3+b3z1+b4z2+u
一种简单的实施方法(内生性检验)
考虑第一步回归的简化模型:
y2=p0+p1z1+p2z2+p3z3+p4z4+v2
z1, z2,验Cov(v2, u) 0等同于检验:H0:d1=0 u=d1v2+e
或者:
y1=b0+b1y2+b2z1+b2z2+d1v2+e (1)
检验y2和y3内生性,外生变量z1, z2, z3, z4
估计简化模型:
y2 pˆ0 + pˆ1z1 + pˆ2 z2 + pˆ3z3 + pˆ4 z4 + vˆ2
y2 ˆ0 + ˆ1z1 + ˆ2 z2 + ˆ3z3 + ˆ4 z4 + vˆ3
估计模型:
y1=b0+b1y2+b2y3+b3z1+b4z2+d1 vˆ+2 d2 v+ˆ3u