第2讲_工具变量法最终版.ppt
工具变量法工具变量法具体步骤

工具变量法工具变量法具体步骤工具变量法(Instrumental Variable Method)是一种用于处理内生性问题的统计方法,它通过引入一个“工具变量”来解决内生性问题。
工具变量是一个有着良好相关性但不会受到内生性干扰的变量,它可以用来代替内生变量,从而解决内生性的影响。
1.确定内生变量和工具变量:首先,需要确定研究中存在的内生变量和可能的工具变量。
内生变量是对所研究问题有影响的变量,而工具变量是与内生变量具有相关性但不会受到内生性干扰的变量。
内生性问题是由于内生变量的存在而导致的因果关系估计偏倚。
2.检验工具变量的相关性:接下来,需要检验所选取的工具变量与内生变量之间的相关性。
这可以通过计算相关系数或进行统计检验来实现。
如果工具变量与内生变量存在显著相关性,那么它可能是一个有效的工具变量。
3.确定工具变量的外生性:除了相关性外,工具变量还需要满足外生性的要求,即工具变量对因变量的影响是通过内生变量而不是其他方式引起的。
这可以通过进行实证分析来判断,例如通过回归模型来检验工具变量对因变量的影响是否通过内生变量进行中介。
如果工具变量的影响仅通过内生变量介导,则可以认为工具变量满足外生性的要求。
4.估计工具变量模型:一旦确定了有效的工具变量,可以使用工具变量法来估计因果关系。
工具变量法的核心思想是通过回归模型来解释内生变量对因变量的影响,并利用工具变量对内生变量进行替代。
通过将工具变量引入估计方程中,可以消除内生性的影响,从而得到无偏的因果关系估计。
5.进行统计推断:在估计了工具变量模型之后,可以进行统计推断来评估估计结果的显著性。
这可以通过计算标准误差、置信区间和假设检验等来实现。
统计推断可以帮助判断估计结果的可靠性,并验证因果关系的存在与否。
总结而言,工具变量法是一种用于解决内生性问题的统计方法。
它通过引入一个有效的工具变量来代替内生变量,消除内生性的干扰,从而得到无偏的因果关系估计。
工具变量法的具体步骤包括确定内生变量和工具变量、检验工具变量的相关性和外生性、估计工具变量模型,并进行统计推断。
工具变量法

工具变量法一、工具变量法得主要思想在无限分布滞后模型中,为了估计回归系数,通常得做法就是对回归系数作一些限制,从而对受限得无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好得解决此类问题得思路。
经过变换,新得模型中,随机扰动项得表达式为:考伊克模型: ( ,为衰减率) (1、1);适应性期望模型:(,为期望系数)(1、2);部分调整模型:( ,为调整系数) (1、3)。
为原无限分布滞后模型中得扰动项,为变换后得扰动项。
在原模型中得随机扰动项满足经典假设得前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型得随机扰动项由于存在原随机扰动项得滞后项,也就就是说考伊克模型与适应性期望模型得解释变量势必与误差项相关,因此,可能会出现上述两个模型得最小二乘估计甚至就是有偏得这样严重得问题。
那么,我们就是否可以找到一个与高度相关但与不相关得变量来替代?在这里,一个可行得估计方法就就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。
一般来说:一个回归模型中得解释变量有得与随机扰动项无关,我们称这样得解释变量为外生变量;而模型中有得解释变量与随机扰动项相关,我们可称这样得解释变量为内生解释变量。
内生解释变量得典型情况之一就就是滞后应变量为解释变量得情形,如上述考伊克模型与适应性期望模型中得。
外生解释变量:回归模型中得解释变量与随机扰动项无关;内生解释变量:回归模型中得解释变量与随机扰动项无关;了解了内生变量与外生变量得概念,我们接着讨论工具变量法得主要思想:工具变量法与普通最小二乘法就是模型参数估计得两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数得普通最小二乘估计就是非一致得,这时就需要引入工具变量。
工具变量,顾名思义就是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关得随机解释变量(即内生变量)。
工具变量法

ut )
1
ztut zt xt
(9.8.7)
(9.8.7)两边取期望值:
(ˆ1)
1
(
ztut zt xt
)
1
所以,ˆ1 不是1 的无偏估计量。
(9.8.7)两边取概率极限:
P lim
ˆ1
1
P lim P lim
1
n 1
n
ztut zt xt
1
COV COV
(zt ,ut) (zt , xt)
1
即
P lim ˆ1 1
表明 ˆ1 是1 的一致估计量。
(9.8.8) (9.8.9)
工具变量法是一种单方程估计方法,每次只适用于 模型中的一个结构方程。 显然,对于多个解释变量的单方程也是适用的。 三、工具变量法的有效性
y1 10 12 y2 1g1 y g1 11 x1 12 x2
第二步,分别用工具变量去乘结构方程,并对所有 的样本观测值求和,得到与未知参数一样多的线性 方程组成的方程组。解方程组就得到结构参数的估
二、工具变量法的应用举例 1.设有一个解释变量的结构方程:
yt 0 1 xt ut
(9.8Байду номын сангаас1)
其中xt是该方程所在模型中的内生变量,因而 COV(xt,ut) ≠ 0。在模型的其他结构方程中可找到这 样的外生变量zt,zt与xt高度相关,但zt与ut不相关即 COV(zt,ut)=0,即zt
1k1 xk1 u1
(9.8.20)
模型(9.8.20)共有(g1-1)个内生说明变量和k1个前定
变量
1.若方程(9.8.20)
由阶条件知
K1 G1* G 1
或
工具变量法

工具变量法Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。
经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)();部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) ()。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。
那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里,一个可行的估计方法就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。
一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。
内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y 。
外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。
工具变量法

工具变量法一.为什么需要使用工具变量法?当模型存在内生解释变量问题,一般为以下三种情形:(1)遗漏变量:如果遗漏的变量与其他解释变量不相关,一般不会造成问题。
否则,就会造成解释变量与残差项相关,从而引起内生性问题。
(2)解释变量与被解释变量相互影响(3)度量误差 (measurement error ):由于在关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差的一部分,从而导致内生性问题。
Ex :i 01122Y i i k ik i X X X ββββμ=+++⋅⋅⋅++ 其中:X 2为内生解释变量 当22Cov(X ,)=E[X ]0i i i i μμ≠时,内生解释变量与随机干扰项同期相关。
此时会导致回归参数估计量是有偏的且不一致,需要用工具变量法进行回归。
二.如何使用工具变量? (一)判断是否需要用工具变量当存在内生性变量时,则需使用工具变量,所以需要对内生性变量进行检验。
在实践中,往往是通过经济学理论先说明是否存在内生性变量,最后再通过检验证明确实存在内生变量。
(1)豪斯曼检验(Hausman )原假设H 0:所有解释变量均为外生变量将内生解释变量关于工具变量与外生变量进行OLS 回归估计 记录残差序列(^^IV OLS ββ−),加入原模型后进行OLS 估计 结果:若差值依概率收敛于0,接受原假设;反之,拒绝。
(2)杜宾-吴-豪斯曼检验(DWH )注:存在异方差的情况下传统豪斯曼检验不适用。
回归模型:'1122y x x ββε=++ z=(x 1,z 2) 第一阶段回归:''21x x z v γδ=++ 检验扰动项v 与ε相关性模型:=v+ερξ 其中:ρ为ε对v 回归系数,ε与v 不相关则ρ=0. 对 ^'''1122y=x x v e ββρ+++ 回归 对原假设H 0:ρ=0. 进行t 检验。
工具变量法(二):弱工具变量

工具变量法(二):弱工具变量世上没有完美的计量方法,因为所有的计量方法与模型均依赖于一定的前提假设。
因此,在估计完计量模型后,通常需要对模型的前提假设进行检验,称为“诊断性检验”(diagnostic checking)或“模型检验”(model checking)。
工具变量法也不例外。
工具变量法的成立依赖于有效的工具变量(valid instruments),即所使用的工具变量须满足相关性(与内生解释变量相关)与外生性(与扰动项不相关)。
工具变量的相关性(Instrument Relevance)在大样本下,2SLS为一致估计。
但对于大多数实践中的有限样本(finite sample),2SLS估计量依然存在偏差(bias),并不以真实参数为其分布的中心,即而且,如果工具变量与内生变量的相关性较弱,则 2SLS 的偏差会变得更为严重。
直观来看,2SLS 的基本思想是通过外生的工具变量,从内生变量中分离出一部分外生变动(exogenous variations),以获得一致估计。
如果工具变量与内生变量的相关性很弱,则通过工具变量分离出的内生变量之外生变动仅包含很少的信息。
因此,利用这些少量信息进行的工具变量法估计就不准确,即使样本容量很大也很难收敛到真实的参数值。
这种工具变量称为“弱工具变量”(weak instruments)。
弱工具变量的后果弱工具变量的后果类似于样本容量过小,会导致 2SLS 的小样本性质变得很差,而 2SLS 的大样本分布也可能离正态分布相去甚远,致使基于大样本理论的统计推断失效。
下面通过蒙特卡洛模拟(Monte Carlo simulation)来直观地考察弱工具变量的后果。
考虑最简单的一元回归模型,假设其数据生成过程(data generating process)为:其中,为内生变量,与扰动项相关;而的真实系数为 2。
假设样本容量为10,000,并使用工具变量进行2SLS 回归。
工具变量法

2、如果X与μ同期不相关,异期相关,得到 的参数估计量有偏、但却是一致的。
x ˆ E ( β 1 ) = β 1 + E (∑ t 2 μ t ) = β 1 + ∑ E ( k t μ t ) ∑ xt
kt的分母中包含不同期的X;由异期相关性 知:kt与μt相关,因此,
ˆ E ( β1 ) ≠ β1
其中
称为工具变量矩阵
3、工具变量法估计量是一致估计量
一元回归中,工具变量法估计量为
~
i 1 i i i i i 1 1 i i i
∑ z (β x + μ ) = β + ∑ z μ β = ∑z x ∑z x 两边取概率极限得:
P lim(β1 ) = β1 + ~
P lim 1 ∑ z i μ i n P lim 1 ∑ z i xi n
例如: (1)耐用品存量调整模型:
耐用品的存量Qt由前一个时期的存量Qt-1和 当期收入It共同决定:
Qt=β0+β1It+β2Qt-1+μt
t=1,…T
这是一个滞后被解释变量作为解释变量的模型。 但是,如果模型不存在随机误差项的序列相关 性,那么随机解释变量Qt-1只与μt-1相关,与μt不相 关,属于上述的第2种情况。
拟合的样本回归线 高估截距项,而低 估斜率项。
对一元线性回归模型:
Yt = β 0 + β 1 X t + μ t
OLS估计量为
ˆ β1 =
∑x y ∑x
t 2 t
t
= β1
∑x μ + ∑x
t 2 t
t
随机解释变量X与随机项μ的关系不同,参 数OLS估计量的统计性质也会不同。 1、如果X与μ相互独立,得到的参数估计量 仍然是无偏、一致估计量。 已经得到证明
工具变量

= 0 + 1X1 + 2X2 + . . . kXk + u
• 定义: u = y − E(y|X),则假设1意味E(u|X)=0,这 又成为X严格外生性的假设
– 如果E(u|X)=0成立,线性模型就能够解释x与y之间的因 果关系,并成为结构模型
– 同时E(u|X)= 0是E(X’u)=0的充分条件,E(X‘u)=0是 OLS估计的依据。
模型的设定错误
• 遗漏变量
– 被遗漏的变量q进入到随机扰动项中, u=rq+v,OLS估计不一致,教材P63例
• 解决的办法
– 代理变量 – 工具变量法
– panel data
• 教育回报的例子
– 正确的模型设定 log(wage)= 0+ 1exp+ 2exp²+ 3edu+abil+v
– 能力ability通常观察不到,成为遗漏变量,模型 成为 log(wage)= 0+ 1exp+ 2exp²+ 3edu+u
• 直观上讲,2SLS就是首先构造出与XK相关 程度最强的工具变量的线性组合 Xˆ,然 后 再用y对 Xˆ进行回归,从而得到的一 致估计
• Xˆ 被认为是内生解释变量的外生变化部分
2SLS具体步骤
• 以XK为因变量,对 X1, X 2 ,… , X K −1ˆ
无条件方差 – 该假设等价于Var(u|X)= ²,即同方差
Var(ui)= ²,无序列相关Cov(ui,uj)=0
假设4
• (yi, xi)为随机样本,i=1,2,⋯,n
对模型假设的讨论
• 线性条件期望不成立的情形 E(y|X)≠X’,E(u|X)≠0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据,这样回归模型就成为:
Y = X β + ε ,其中 ε = Wγ + u
• 如果X中的某个或某几个解释变量,如Xk与W 相关,就将导致Cov(xk ,ε ) ≠ 0 ,从而出现内生的 解释变量问题
唯一
..........
4
假设3
• 随机扰动项同方差、无自相关 Var(y|X)=²I
• 含义
– y的条件方差为纯量协方差矩阵 – 由于 ²为常数,与x无关,所以条件方差等价于
无条件方差 – 该假设等价于Var(u|X)= ²,即同方差
Var(ui)= ²,无序列相关Cov(ui,uj)=0
..........
13
解释变量的外生性
• 解释变量外生性是古典线性回归模型的一 个基本假定,也是保证线性模型成为结构 模型的前提
• 该假定的பைடு நூலகம்本内容是指扰动项关于解释变 量的条件期望等于零 :
E(u|X ) = 0
– 解释变量X产生机制与随机扰动项u无关
–
–
可以推出:Cov( Xjk , ui ) = 0 和E(x′k u) = 0
..........
12
联立性
• 所谓联立性是指,两个变量之间的因果关 系不是单方向的,它们之间相互影响
• 在单方程模型中,如果至少一个解释变量 同时由被解释变量y部分决定,模型就出现 了联立性问题
• 联立性问题很多情况下,是由于变量遗漏 造成的。
• 在出现联立性的模型中,E(u|X)≠0
..........
如果z与x无关,则β₀=β ,但通常的情况下,z与x相 关,从而 ₀≠
..........
8
• 遗漏变量
– 被遗漏的变量q进入到随机扰动项中, u=rq+v,OLS估计不一致,教材P63例
• 解决的办法
– 代理变量 – 工具变量法
– panel data
..........
9
• 教育回报的例子
– 正确的模型设定 log(wage)= 0+ 1exp+ 2exp²+ 3edu+abil+v
– 能力ability通常观察不到,成为遗漏变量,模型 成为 log(wage)= 0+ 1exp+ 2exp²+ 3edu+u
– 通常ability受到教育的影响 abil=₀+₃edu+r,
E(r|exp,exp²)=0 – 从而E(b3)= 3+ 3,b3不仅是有偏的,而且在大
..........
2
假设1
• 条件期望线性与外生性假设
y = E(y|X)+u
= 0 + 1X1 + 2X2 + . . . kXk + u
• 定义: u = y − E(y|X),则假设1意味E(u|X)=0,这 又成为X严格外生性的假设
– 如果E(u|X)=0成立,线性模型就能够解释x与y之间的因 果关系,并成为结构模型
5
假设4
• (yi, xi)为随机样本,i=1,2,⋯,n
..........
6
对模型假设的讨论
• 线性条件期望不成立的情形 E(y|X)≠X’,E(u|X)≠0
• 来源
– 模型设定的错误 misspecification – 变量的误差 – 联立性
..........
7
模型的设定错误
• 函数形式的错误
..........
15
内生解释变量的产生
• 内生解释变量产生的原因基本上可以分为 四种:
– 遗漏变量 – 观测误差 – 联立偏差 – 样本选择问题 (sample selection)
..........
16
遗漏变量
• 当被遗漏的变量与引入模型的其他解释变量相 关,被遗漏的变量进入到随机扰动项时,就会 导致解释变量与扰动项相关
– 同时E(u|X)= 0是E(X’u)=0的充分条件,E(X’u)=0是 OLS估计的依据。
– E(u|X)= 0还意味着Cov(X,u)=0
..........
3
假设2
• 样本矩阵满列秩 rank(X)=K<n
• 含义
– 要求有足够多的观测值,n>k
– 变量之间不存在线性组合 – 保证X‘X可逆,满秩,非奇异,从而估计结果
大样本条件下的渐进无关性:p lim(
1 n
X ku)
0
..........
14
一个说明
• E(x′k u) = 0 表示Xk与u在小样本情形下无关
•
但是当
E(x′k u)
≠
0
时,p lim(
1 n
X ku)
0
仍然有
可能成立,即在大样本条件下,Xk与u满足
渐近无关性。此时,OLS估计量仍然能够
保持良好的大样本性质
第二讲:
内生的解释变量与工具变量法
..........
1
单方程线性模型
• 如果我们在经验分析中采用一个单方程线 性模型来研究x 对y 的影响,并得到相关的 政策结论,那么则要求方程
y = 0 + 1X1 + 2X2 + . . . kXk + u
能够反映X与y之间的因果关系,而不是单 纯的统计相关关系
样本中也是不一致的。
– 特别是,如果3>0,b3会高估教育对工资的影响
..........
10
变量的测量误差
• 被解释变量的测量误差 • 真实的模型设定
y*=X’+u
• y*没有被准确观察到,观察到的是y
– y= y*+v,v为测量误差 – 模型变为:y=X’ +u+v – 如果E(v|X)=0,假设1没有被破坏 – 如果E(v|X)≠0,假设1不成立,OLS有偏且不
– 非参数设定来解决
• 包含了多余变量
– 如果多加的变量与其它的解释变量无关,OLS估计仍然 是无偏,一致,但不有效
– 如果多加的变量与其它的解释变量有关,OLS估计有偏 – 例:研究新生儿体重y与母亲在孕期的食品摄入量x的关
系,如果考虑家庭收入z。正确的模型设定为: E(y|x,z)=x。如果加入z,模型变为E(y|x,z)=₀x+γz
一致
..........
11
• 解释变量的测量误差
• 真实的模型设定 y=X’β+z*+u
– z*含有测量误差,观察到 z=z*+v, E(z|x, z*)=z*,
– 实际的回归方程为: y = X’+z+ (u-v)=X’+z+ε
– 这时,由于 ε =u-v与z=z*+v相关,所以 E(ε|X,z)≠0,假设1不成立
..........
17
观测误差
• 不论是通过现场调查还是二手数据,我们 都不可能避免“观测误差”问题
• 当观测误差进入到随机扰动项中,并与某 个或某些解释变量相关时,就出现了内生 解释变量