Chapter4-工具变量法
Chapter4-工具变量法

Chapter4-⼯具变量法第1章两阶段最⼩⼆乘法在模型的基本假定中,解释变量与误差项正交保证了参数估计量的⽆偏性和⼀致性。
当这⼀假定被违背时,称解释变量是内⽣的。
常见的⼏种情况会导致内⽣问题:忽略重要的解释变量、变量的测量误差、变量的联⽴性。
⼯具变量估计是解决解释变量内⽣问题的基本⽅法。
本章介绍⼯具变量法和两阶段最⼩⼆乘法,以及模型内⽣性检验和过度识别约束检验等问题。
1.1 变量的内⽣性如果模型中的解释变量与误差项出现相关,即(')E =X u 0,称解释变量是内⽣的。
导致解释变量内⽣性的原因有很多,主要的⼏个原因包括:模型中忽略了重要的解释变量、变量因果关系的双向性、变量的测量误差等。
模型中出现内⽣解释变量时,OLS 估计量是不⼀致的。
根据OLS 估计量:11111?(')(')(')(')(')(')N N -----==+=+βX X X y βX X X u βX X X u (1.1) 由假定Rank(X)=K 和⼤数定律,样本均值的概率极限等于总体均值,可得:1Plim(')E(')N -=≡X X X X A , 1Plim(')E(')N -=≠X u X u 0。
(1.2)⼜由Slustky 定理,111Plim(')N ---=X X A 1?Plim E(')-=+≠ββA X u β (1.3)1.2 ⼯具变量估计1.2.1 ⼯具变量在如下模型中,y = X+ u第i 个解释变量x i 为内⽣解释变量。
如果存在变量z ,z 满⾜如下两个条件:正交条件:与u 不相关,即cor(z, u) = 0 相关条件:与x 相关,即cor(z, x i ) 0,也称为识别约束条件。
那么,z 被称作x i 的⼯具变量。
1.2.2 ⼯具变量估计设回归模型为:y =X β+u (1.4) 其中,解释变量为X (1×K )⼯具变量为Z (1×K )。
工具变量法工具变量法具体步骤

工具变量法工具变量法具体步骤工具变量法(Instrumental Variable Method)是一种用于处理内生性问题的统计方法,它通过引入一个“工具变量”来解决内生性问题。
工具变量是一个有着良好相关性但不会受到内生性干扰的变量,它可以用来代替内生变量,从而解决内生性的影响。
1.确定内生变量和工具变量:首先,需要确定研究中存在的内生变量和可能的工具变量。
内生变量是对所研究问题有影响的变量,而工具变量是与内生变量具有相关性但不会受到内生性干扰的变量。
内生性问题是由于内生变量的存在而导致的因果关系估计偏倚。
2.检验工具变量的相关性:接下来,需要检验所选取的工具变量与内生变量之间的相关性。
这可以通过计算相关系数或进行统计检验来实现。
如果工具变量与内生变量存在显著相关性,那么它可能是一个有效的工具变量。
3.确定工具变量的外生性:除了相关性外,工具变量还需要满足外生性的要求,即工具变量对因变量的影响是通过内生变量而不是其他方式引起的。
这可以通过进行实证分析来判断,例如通过回归模型来检验工具变量对因变量的影响是否通过内生变量进行中介。
如果工具变量的影响仅通过内生变量介导,则可以认为工具变量满足外生性的要求。
4.估计工具变量模型:一旦确定了有效的工具变量,可以使用工具变量法来估计因果关系。
工具变量法的核心思想是通过回归模型来解释内生变量对因变量的影响,并利用工具变量对内生变量进行替代。
通过将工具变量引入估计方程中,可以消除内生性的影响,从而得到无偏的因果关系估计。
5.进行统计推断:在估计了工具变量模型之后,可以进行统计推断来评估估计结果的显著性。
这可以通过计算标准误差、置信区间和假设检验等来实现。
统计推断可以帮助判断估计结果的可靠性,并验证因果关系的存在与否。
总结而言,工具变量法是一种用于解决内生性问题的统计方法。
它通过引入一个有效的工具变量来代替内生变量,消除内生性的干扰,从而得到无偏的因果关系估计。
工具变量法的具体步骤包括确定内生变量和工具变量、检验工具变量的相关性和外生性、估计工具变量模型,并进行统计推断。
工具变量法操作过程

工具变量法操作过程嘿,咱今儿就来唠唠工具变量法的操作过程哈。
你想啊,这工具变量法就像是一个巧妙的解题钥匙。
咱先得找到一个合适的工具变量,这可不容易哦,就跟找宝藏似的,得有一双火眼金睛。
这个工具变量得和咱关心的那个自变量有关系,还得满足一些特别的条件呢,可不能随随便便找一个。
然后呢,就开始建立模型啦。
这就好比搭积木,得一块一块稳稳地放上去。
把工具变量和其他相关的变量都放进去,看看它们能搭出个啥样的“建筑”来。
接下来就是进行估计啦。
这可不能马虎,得仔细着点儿。
就好像你在走一条不熟悉的路,得小心翼翼地试探着,看看怎么走才最靠谱。
在这过程中,你还得不断地检验呢。
检验啥?检验这个工具变量找得对不对呀,模型建得好不好呀。
这就像是给你的“作品”做个全面“体检”,有啥毛病赶紧找出来改掉。
你说这工具变量法是不是很有意思?它就像是一个魔法棒,能帮我们解决一些看似很难的问题。
比如说,我们想研究一个因素对另一个因素的影响,但中间可能有很多干扰因素。
这时候工具变量法就派上用场啦,它能帮我们把那些干扰因素给“过滤”掉,让我们更清楚地看到真正的关系。
而且哦,这工具变量法可不是随便谁都能玩好的,得有一定的专业知识和经验才行。
就像学骑自行车,一开始可能会摔倒,但多练几次就熟练啦。
你想想,如果没有工具变量法,我们很多研究不就没法进行啦?那得错过多少重要的发现呀!所以说,它可真是我们研究的好帮手呢。
咱再回过头来看看,找工具变量要细心,建模型要认真,估计要谨慎,检验要严格。
每一步都不能马虎,就跟盖大楼一样,根基得打牢了,每一层都得建得稳稳当当的。
总之呢,工具变量法是个很有用的方法,但要用好它可得下点功夫。
别嫌麻烦,等你真正掌握了,你就会发现它的魅力啦!就像学会了一门绝世武功,那感觉,倍儿爽!你还等啥,赶紧去试试吧!。
工具变量法

工具变量法一、工具变量法得主要思想在无限分布滞后模型中,为了估计回归系数,通常得做法就是对回归系数作一些限制,从而对受限得无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好得解决此类问题得思路。
经过变换,新得模型中,随机扰动项得表达式为:考伊克模型: ( ,为衰减率) (1、1);适应性期望模型:(,为期望系数)(1、2);部分调整模型:( ,为调整系数) (1、3)。
为原无限分布滞后模型中得扰动项,为变换后得扰动项。
在原模型中得随机扰动项满足经典假设得前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型得随机扰动项由于存在原随机扰动项得滞后项,也就就是说考伊克模型与适应性期望模型得解释变量势必与误差项相关,因此,可能会出现上述两个模型得最小二乘估计甚至就是有偏得这样严重得问题。
那么,我们就是否可以找到一个与高度相关但与不相关得变量来替代?在这里,一个可行得估计方法就就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。
一般来说:一个回归模型中得解释变量有得与随机扰动项无关,我们称这样得解释变量为外生变量;而模型中有得解释变量与随机扰动项相关,我们可称这样得解释变量为内生解释变量。
内生解释变量得典型情况之一就就是滞后应变量为解释变量得情形,如上述考伊克模型与适应性期望模型中得。
外生解释变量:回归模型中得解释变量与随机扰动项无关;内生解释变量:回归模型中得解释变量与随机扰动项无关;了解了内生变量与外生变量得概念,我们接着讨论工具变量法得主要思想:工具变量法与普通最小二乘法就是模型参数估计得两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数得普通最小二乘估计就是非一致得,这时就需要引入工具变量。
工具变量,顾名思义就是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关得随机解释变量(即内生变量)。
工具变量法

ut )
1
ztut zt xt
(9.8.7)
(9.8.7)两边取期望值:
(ˆ1)
1
(
ztut zt xt
)
1
所以,ˆ1 不是1 的无偏估计量。
(9.8.7)两边取概率极限:
P lim
ˆ1
1
P lim P lim
1
n 1
n
ztut zt xt
1
COV COV
(zt ,ut) (zt , xt)
1
即
P lim ˆ1 1
表明 ˆ1 是1 的一致估计量。
(9.8.8) (9.8.9)
工具变量法是一种单方程估计方法,每次只适用于 模型中的一个结构方程。 显然,对于多个解释变量的单方程也是适用的。 三、工具变量法的有效性
y1 10 12 y2 1g1 y g1 11 x1 12 x2
第二步,分别用工具变量去乘结构方程,并对所有 的样本观测值求和,得到与未知参数一样多的线性 方程组成的方程组。解方程组就得到结构参数的估
二、工具变量法的应用举例 1.设有一个解释变量的结构方程:
yt 0 1 xt ut
(9.8Байду номын сангаас1)
其中xt是该方程所在模型中的内生变量,因而 COV(xt,ut) ≠ 0。在模型的其他结构方程中可找到这 样的外生变量zt,zt与xt高度相关,但zt与ut不相关即 COV(zt,ut)=0,即zt
1k1 xk1 u1
(9.8.20)
模型(9.8.20)共有(g1-1)个内生说明变量和k1个前定
变量
1.若方程(9.8.20)
由阶条件知
K1 G1* G 1
或
工具变量法

工具变量法Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】工具变量法一、工具变量法的主要思想在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。
在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。
经过变换,新的模型中,随机扰动项的表达式为:考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)();部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) ()。
t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。
在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。
那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里,一个可行的估计方法就是工具变量法。
在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。
一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。
内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y 。
外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关;了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。
工具变量法例子及解析

工具变量法例子及解析工具变量法是经济学中常用的一种回归分析方法,它的作用是削弱内生性问题对回归结果的影响。
本文将通过具体例子和分析,介绍工具变量法的原理、应用和重要性。
一、工具变量法原理工具变量法的核心思想是利用一个与内生变量有关的外生变量来代替内生变量,既能够在一定程度上削弱内生性问题,又能够保留回归模型的一般结构。
其原理可以简单归纳为以下几个步骤:1. 利用可靠性高的工具变量代替内生变量2. 使用工具变量回归得到内生变量的估计值3. 将内生变量的估计值代入原始回归模型,得出正确的回归效果。
通过以上三个步骤,工具变量法可以尽可能地消除内生性问题对回归分析的干扰,从而得到准确的分析结果。
二、工具变量法应用在实际经济研究中,工具变量法的应用非常广泛,以下是几个常见的应用:1. 教育和收入的关系分析这是一个非常经典的实证研究,研究者发现,教育与收入之间存在内生性问题,即教育水平可能受到家庭收入的影响。
为了解决这个问题,研究者使用父母教育程度作为工具变量,用它来代替受教育程度对收入的内生性影响,最终得出正确的研究结果。
2. 运动员收入与绩效的关系分析在研究运动员收入与绩效关系的时候,由于运动员自身的能力或健康状况等因素可能会影响分析结果,因此需要使用工具变量来解决内生性问题。
例如,研究者可以使用运动员所属的地理区域作为工具变量,用它来代替个人因素对收入和绩效的影响,从而得出更加准确的研究结果。
3. 货币政策与经济增长的关系分析在研究货币政策对经济增长的影响时,通常会使用实际利率作为工具变量来解决内生性问题。
由于实际利率受银行制度、资本市场以及政府债券利率等多种因素的影响,因此能够代替内生性较强的利率变量,得出更加准确的研究结果。
三、工具变量法的重要性工具变量法在经济学研究中具有非常重要的地位,它的主要作用在于解决内生性问题,从而得出更加准确的研究结果。
由于内生性问题可能会导致回归结果的偏误,因此如果不进行工具变量法处理,可能得出的结论会与实际情况有较大差距,这对于政策的制定和实施将会带来严重影响。
工具变量法IV两阶段最小二乘法TSLS

YY12
b12Y2 b23Y3
c11 X1 c12 X 2 c23 X 3 u2
u1
Y3 b31Y1 b32Y2 c33 X 3 u3
其中:Y1,Y2 ,Y3 为内生变量, X1, X 2 , X 3为外生变量。
Dongbei University Of Finance & Economics
2)方程组系统估计法 包括:三阶段最小二乘法(3SLS)、完全信息最
大似然估计法(FIML)等。这些方法是对模型中所有 结构方程的参数同时进行估计,从而获得模型全部参 数的估计值。它利用了模型的全部方程信息,称为完 全信息方法。
Dongbei University Of Finance & Economics
/ ˆ23 bˆ12ˆ21
cˆ12 ˆ12 bˆ12ˆ22
若已知πij,即可解出惟一的cij,第一个结构方程得以 估计。这样,结构方程的参数估计值用传统的OLS就 得到了。
Dongbei University Of Finance & Economics
ILS的步骤
一、先对模型作识别判断,找出恰好识别的方程; 二、利用简约式和结构式参数的关系式 B
Y1 11 X1 12 X 2 13 X 3 v1 Y2 21 X1 22 X 2 23 X 3 v2 Y3 31 X1 32 X 2 33 X 3 v3
Dongbei University Of Finance & Economics
第一阶段是对结构方程右端所包含的所有内生变量(作为解 释变量)所对应的简化式方程进行OLS估计,得到内生变量的估计 (回归)值;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章 两阶段最小二乘法在模型的基本假定中,解释变量与误差项正交保证了参数估计量的无偏性和一致性。
当这一假定被违背时,称解释变量是内生的。
常见的几种情况会导致内生问题:忽略重要的解释变量、变量的测量误差、变量的联立性。
工具变量估计是解决解释变量内生问题的基本方法。
本章介绍工具变量法和两阶段最小二乘法,以及模型内生性检验和过度识别约束检验等问题。
1.1 变量的内生性如果模型中的解释变量与误差项出现相关,即(')E =X u 0,称解释变量是内生的。
导致解释变量内生性的原因有很多,主要的几个原因包括:模型中忽略了重要的解释变量、变量因果关系的双向性、变量的测量误差等。
模型中出现内生解释变量时,OLS 估计量是不一致的。
根据OLS 估计量:11111ˆ(')(')(')(')(')(')N N -----==+=+βX X X y βX X X u βX X X u (1.1) 由假定Rank(X)=K 和大数定律,样本均值的概率极限等于总体均值,可得:1Plim(')E(')N -=≡X X X X A , 1Plim(')E(')N -=≠X u X u 0。
(1.2)又由Slustky 定理,111Plim(')N ---=X X A1ˆPlim E(')-=+≠ββA X u β (1.3)1.2 工具变量估计1.2.1 工具变量在如下模型中,y = X β+ u第i 个解释变量x i 为内生解释变量。
如果存在变量z ,z 满足如下两个条件: 正交条件:与u 不相关,即cor(z, u) = 0相关条件:与x 相关,即cor(z, x i ) ≠ 0,也称为识别约束条件。
那么,z 被称作x i 的工具变量。
1.2.2 工具变量估计设回归模型为:y =X β+u (1.4)其中,解释变量为X (1×K )工具变量为Z (1×K )。
Z 作为工具变量满足正交条件和识别约束条件。
在正规方程组ˆ'()-=X y X β0中,用Z 替换X , ˆ'()-=Z y X β0 (1.5) 解此方程组,可得IV 估计量为:1ˆ(')'-=βZ X Z y (1.6) 将y =X β+u 带入估计量中,可得11ˆ(')'()(')'--=+=+βZ X Z X βu βZ X Z u 可以证明,1ˆE()(')'E()-=+=ββZ X Z u β 1121121ˆVar()E[(')''(')](')'(')(')σσ-----==≠βZ X Z uu Z X Z Z X Z Z X Z X X即IV 估计量是无偏的,但不是有效的。
同时,由111111ˆPlim()Plim[(')(')]Plim(')Plim(')E()n n n i i n N N N N ---→∞→∞--→∞-→∞=+===ββZ X Z u Z X AZ u Z u 0可知,IV 估计量是一致的。
1.3 两阶段最小二乘法设模型中存在K 个内生解释变量,存在L=K 个工具变量。
每个工具变量都必须满足正交条件和相关条件。
如果L=K ,称为恰好识别;如果L>K ,称为过度识别。
即利用其中不同的K 个工具变量,都可以得到不同的估计量。
当然,用任何一组工具变量得到的估计量都是一致的。
因此,现在的问题是如何在这L 个工具变量中找到K 个工具变量使其估计量最有效。
这即是两阶段最小二乘法。
1.3.1 TSLS 估计设模型为:=+y X βu (1.7)其中,解释变量为X (1×K )工具变量为Z (1×L )。
用Z 作为工具变量,Z 满足正交条件和识别约束条件。
首先回归模型=+X Z Πv (1.8)可得1ˆ(')-=ΠZ Z ZX ,并提取拟合值1ˆˆ(')-==X Z ΠZ Z Z ZX 。
令1(')'-=ZP Z Z Z Z ,P Z 为对称幂等矩阵,则ˆ=ZX P X 。
然后,利用ˆX 做为工具变量回归模型,可得IV 估计量为: 11ˆˆˆ(')'(')(')--==ZZβX X X y X P X X P y (1.9) 而ˆˆˆ''''()''====Z Z Z Z ZX X X P X X P P X P X P X X X 。
由此可得: 11ˆˆˆˆˆˆ(')'(')'--==βX X X y X X X y (1.10) 而1ˆˆˆ(')'-X X X y 是y 对ˆX 的OLS 回归估计量。
因此,利用ˆX作为工具变量作IV 回归与利用ˆX 替换X 作LS 回归是等价的。
也正因为此,我们称之为两阶段最小二乘法。
估计步骤归纳如下。
Step1:利用X 对Z 作OLS 回归:=+X Z Πv ;提取拟合值ˆX。
Step2:用ˆX替换X ,直接作OLS 回归。
1.3.22SLS 的渐进特征假定1:令X 表示解释变量(包括常数变量1)。
假定存在L 个工具变量构成的(1×L )向量Z ,满足E(Z 'u )=0。
Z 包含模型中的外生解释变量。
如果模型中存在内生变量,则Z 必须包含模型以外的外生变量。
假定2:(A )Rank(Z 'Z )=L ;(B )Rank(Z 'X )=K 。
(A )条件是指L 个向量Z 不存在完全的线性关系;条件(B )是指Z 与X 充分线性相关,即所有工具变量都必须满足识别约束条件。
条件(B )称为秩条件。
秩条件成立的必要条件是L ≥K 。
即,工具变量的个数至少等于解释变量的个数,称之为阶条件。
由X =Z ∏+v (其中,∏为L ×K 矩阵),两侧同时乘Z 并求期望可得:1'''E(')E(')[E(')]E(')-=+⇒=⇒=Z X Z Z ΠZ v Z X Z Z ΠΠZ Z Z X (1.11)令X *=Z ∏ = Z[E(Z 'Z )]-1 E(Z 'X )。
在X β+u =y 两边同时乘以X *可得,X *'X β + X *'u = X *'y (1.12)求期望可得:E(X *'X )β= E(X *'y ) (1.13)而X *'X = X *'Z ∏ + X *'v , E(X *'X ) = E(X *'Z )∏ + E(X *'v ) = E(X *'Z )∏ E(X *'Z )= E[(X -v ) 'Z ] = E[X 'Z - v 'Z ] = E(X 'Z )将∏ = [E(Z 'Z )]-1 E(Z 'X )带入上两个式子中,可得:E(X *'X ) = E(X 'Z ) [E(Z 'Z )]-1 E(Z 'X )= E(X 'Z ) [E(Z 'Z )]-1 E(Z 'X ) (1.14) E(X *'y ) = E(X 'Z ) [E(Z 'Z )]-1 Z ' y注意,上式中Z 是(1×L )阶,X 是(1×K )阶。
因此, X 'Z 是(K ×L )阶,Z 'Z 是(L ×L )阶,Z 'X 是(L ×K )阶。
如果要估计出β,E(X *'X )必须是非奇异的,当且仅当E(Z 'X )的秩为K 。
将其带入β = [E(X *'X )]-1 E(X *'y ),可得β = [E(X *'X )]-1 E(X *'y )= {E(X 'Z ) [E(Z 'Z )]-1 E(Z 'X )} -1{E(X 'Z ) [E(Z 'Z )]-1Z 'y} (1.15)β的TSLS 估计量为:{}{}-1112ˆ'(')(')'(')'SLS--=βX Z Z Z Z X X Z Z Z Z y (1.16) 1.一致性由2SLS 估计量可得:1-1121-111111-11111ˆ['(')(')]['(')'()]['(')(')]['(')'][(')(')(')][(')(')(')]SLS N N N N N N ------------=+ =+ =+βX Z Z Z Z X X Z Z Z Z X βu βX Z Z Z Z X X Z Z Z Z u βX Z Z Z Z X X Z Z Z Z u (1.17)由大数定律和Slustky 定理,可得:2ˆPlim SLS =ββ。
即2SLS 估计量具有一致性。
2.渐进正态性根据1Plim(')E(')i i N -==Z u Z u 0,并由中心极限定理,1/2'~(,)N Normal -Z u 0B 。
同方差假定下,22E(')E(')i i i i u σ==B Z Z Z Z ,2=var()i u σ。
根据Slutsky 定理,1111-11111/22ˆ)[(')(')(')][(')(')(')]SLSN N N N N N ---------=ββX Z Z Z Z X X Z Z Z Z u (1.18)定理:在假定1、22ˆ)SLS -ββ渐进服从正态分布,均值为0,方差矩阵为{}-121E(')E(')E(')σ-X Z Z Z Z X (1.19)其中,1E(')E(')E(')-X Z Z Z Z X 可以用样本进行估计,2σ的估计量公式为:2121ˆˆ()Ni i N K u σ-==-∑ 其中,2ˆˆi i i SLS u y =-x β,而不是第二阶段的残差项。