第七章 工具变量2SLSGMM

合集下载

GMM的stata操作步骤

GMM的stata操作步骤

GMM的sta操作步骤广义矩估计(Generalized Method of Moments,即GMM)一、解释变量内生性检验首先检验解释变量内生性(解释变量内生性的Hausman 检验:使用工具变量法的前提是存在内生解释变量。

Hausman 检验的原假设为:所有解释变量均为外生变量,如果拒绝,则认为存在内生解释变量,要用IV;反之,如果接受,则认为不存在内生解释变量,应该使用OLS。

reg ldi lofdi estimates store ols xtivreg ldi (lofdi=l.lofdi ldep lexr) estimates store iv hausman iv ols (在面板数据中使用工具变量,Sta 提供了如下命令来执行2SLS:xtivreg depvar [varlist1](varlist_2=varlist_iv)(选择项可以为fe,re 等,表示固定效应、随机效应等。

详见help xtivreg)如果存在内生解释变量,则应该选用工具变量,工具变量个数不少于方程中内生解释变量的个数。

“恰好识别”时用2SLS。

2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外生部分进行回归,从而满足OLS 前定变量的要求而得到一致估计量。

t p t q t p 二、异方差与自相关检验在球型扰动项的假定下,2SLS是最有效的。

但如果扰动项存在异方差或自相关,面板异方差检验:xtgls enc invs exp imp esc mrl,igls panel(het)estimates store hetero xtgls enc invs exp imp esc mrl,igls estimates store homo local df = e(N_g) - 1 lrtest hetero homo,df(`df')面板自相关:xtserial enc invs exp imp esc mrl 则存在一种更有效的方法,即GMM。

2sls stata代码

2sls stata代码

2sls stata代码使用2sls stata代码进行计量经济分析一、引言在计量经济学中,为了解决内生性问题,研究者常常使用两阶段最小二乘法(Two-Stage Least Squares, 2SLS)进行估计。

2SLS是一种常见的计量经济学方法,它通过建立一个结构方程模型,通过两个阶段的回归来估计内生变量的影响。

二、2SLS方法简介2SLS方法通过建立一个工具变量来解决内生性问题。

在第一阶段,研究者选择一个与内生变量相关但与误差项不相关的工具变量,通过回归得到内生变量的预测值。

在第二阶段,将这个预测值代入原始模型,再次进行回归分析,从而得到内生变量的准确估计。

三、使用Stata进行2SLS分析的步骤在Stata中,可以使用ivregress命令进行2SLS分析。

以下是一个简单的示例,演示了如何使用Stata进行2SLS分析。

1. 导入数据我们需要导入我们的数据集。

可以使用命令"import"或"insheet"导入数据。

2. 第一阶段回归接下来,我们需要进行第一阶段的回归分析,以得到内生变量的预测值。

使用ivregress命令进行第一阶段的回归分析,指定内生变量作为因变量,工具变量作为自变量。

3. 得到预测值在第一阶段回归之后,我们可以得到内生变量的预测值。

使用predict命令将预测值保存起来,以便在第二阶段回归中使用。

4. 第二阶段回归我们进行第二阶段的回归分析,将预测值代入原始模型。

使用ivregress命令进行第二阶段的回归分析,指定因变量和其他解释变量,并使用预测值作为自变量。

5. 结果解读在第二阶段回归之后,我们可以得到最终的估计结果。

通过检查回归系数的显著性和方向,我们可以判断内生变量对因变量的影响。

四、注意事项在进行2SLS分析时,需要注意以下几点:1. 工具变量的选择:工具变量应当与内生变量相关,但与误差项不相关。

2. 检验工具变量的有效性:可以使用Hausman检验或其他相关检验方法来检验工具变量的有效性。

搞定内生性,不可不知的工具变量法笔记

搞定内生性,不可不知的工具变量法笔记

搞定内生性,不可不知的工具变量法笔记内生性( endogeneity)问题,是指由自变量与误差项相关所引发的估计偏倚及统计结果误导性等问题的总称,即违背了线性回归中的正交假定而产生的一系列问题。

内生性问题看似简单,但目前已成为线性回归及其他回归模型中最为棘手的问题。

工具变量法是解决内生性问题的有效方法。

在工具变量估计中,第一,检验是否具有内生性,可以使用豪斯曼检验。

第二,工具变量的正交性检验。

(1)、强度条件,即工具变量应该与内生自变量具有较强的相关性,即该工具变量的应该能够代替或者表达原内生变量的信息,数学表达式为:COV(Z,X)=/0(2)、排除限制条件,即工具变量应该与误差项不相关,也就是与因变量Y中不能被已有的自变量x所表达的部分无关(也是与误差项无关)COV(Z,u)=/0。

工具变量估计二阶段最小二乘法的第一阶段就是利用原模型的内生解释变量对工具变量进行OLS,得到解释变量的拟合值;第二步,利用得到解释变量的拟合值对原模型进行最小二乘法,从而得到方程模型的估计值,这样就可以消除内生性的影响。

首先了解一下二阶段最小二乘法Stata中的命令为ivregress,语法格式为•ivregress estimator depvar [varlist1] (varlist2 = varlist_iv) [if] [in] [weight] [, options]选项介绍estimator分为2sls两阶段最小二乘、liml有限的信息最大似然(liml) 、gmm广义矩方法(gmm)depvardepvar 为被解释变量;varlist1为外生解释变量;varlist2 为所有的内生解释变量;varlist_iv为所有的工具变量;在选项 options 中,vce(robust)表示稳健型标准误可使用 firstfirst 选项报告 2SLS 中第一阶段的回归结果small表示小样本下的自由度调整本文以伍德里奇第十五章数据mroz.dta为例,研究已婚妇女的教育回报,相关数据介绍如下:•••••••••••••use morz.dtaeditdesc*被解释变量label var lwage 已婚妇女工资的对数值*解释变量label var educ 受教育年数 label var exper 工作年限label var expersq 工作年限平方*工具变量label var fatheduc 已婚妇女的父亲的受教育年数label var motheduc 已婚妇女的母亲的受教育年限其中研究问题为:建立lnwage与educ、exper 、expersq的方程,但是包括了影响已婚妇女工资的遗漏变量,可能存在内生性问题,其中能力会对工资产生影响,但是却与解释变量X中的educ相关,内生性存在。

GMM学习笔记

GMM学习笔记

自由度为 m-k
3 3在 / 中输入 广义矩估计 广义矩方法 经典矩方法
Hansen 的表述:
当 l>K 时,称模型参数“过度识别” ,该检验称为过渡识别约束检验。 过渡识别约束检验也称为 Sargan 检验。 即,软件给出的结果是 J,但是判断时,要使用 nJ. 例如,某个模型计 算得到 J=0.029837, 那么,nJ=0.477, 5%的显著性水平下,自由度为 1 的卡方 分布的临界值为 3检验构造的矩条件是否成立。如果矩条件不成立,就要从模型设定方面寻找原因。 另外,如果对模型参数施加约束,则需要进行参数约束检验。
广义矩估计
How?如,IV。及此 页下面这个例子
经典矩估 计中,只取 K 阶样本矩
E(XU)=0,X=X1,X3; E(U)=0; E(ZU)=0,Z=Z1,Z2
损失函数?
对称权矩阵 是 m*m 阶的 W 矩阵反映 了 g 的重要 性
如,以下说明以某一标准选择权矩阵
1
W n2 i
Cov[Zii , Z j j ]
1极大似然估计法(maximumlikelihoodmethod,ML)的应用虽然没有普通最小二乘法广泛,但它是 一个具有更强理论性质的点估计方法,它以极大似然原理为基础,通过概率密度函数或者分布律 来估计总体参数。对于一些特殊类型的计量经济模型,如我们后面将介绍的 Logit 和 Probit 模型, 最小二乘法不再适用,极大似然法成为首选的估计方法。极大似然法的思路 极大似然估计法的 出发点是已知被观测现象的分布,但不知道其参数。极大似然法用得到观测值(样本)最高概率的 那些参数的值来估计该分布的参数,从而提供了一种用于估计刻画一个分布的一组参数的方法。 2广义矩方法确实是一种具有高度概括性的方法。其他的参数估计量可以看做它的特例。比如最 小二乘法估计量(OLS)和最大似然估计量(MLE)都是 GMM 估计量的特例。当待估参数较多时。最 大似然估计需要较为复杂的数值求解。GMM 估计更加方便。GMM 在时间序列及面板数据分析 等许多场合有着广泛的应用

GMM作用与操作

GMM作用与操作
1极大似然估计法(maximumlikelihoodmethod,ML)的应用虽然没有普通最小二乘法广泛,但它是 一个具有更强理论性质的点估计方法,它以极大似然原理为基础,通过概率密度函数或者分布律 来估计总体参数。对于一些特殊类型的计量经济模型,如我们后面将介绍的 Logit 和 Probit 模型, 最小二乘法不再适用,极大似然法成为首选的估计方法。极大似然法的思路 极大似然估计法的 出发点是已知被观测现象的分布,但不知道其参数。极大似然法用得到观测值(样本)最高概率的 那些参数的值来估计该分布的参数,从而提供了一种用于估计刻画一个分布的一组参数的方法。 2广义矩方法确实是一种具有高度概括性的方法。其他的参数估计量可以看做它的特例。比如最 小二乘法估计量(OLS)和最大似然估计量(MLE)都是 GMM 估计量的特例。当待估参数较多时。最 大似然估计需要较为复杂的数值求解。GMM 估计更加方便。GMM 在时间序列及面板数据分析 等许多场合有着广泛的应用
g(
)


g1 g2
gJ
( ( (
) )
)
Biblioteka n 1 n
1 n
z1iei
i

z2i
ei

i


i z Ji ei
2STS
vs
GMM
一阶导
GMM 与 OLS 、MLE、IV、 GEE 的联系和区别 1, OLS:选择解释变量作为工具变量构造矩条件,权利矩阵为单位阵,GMM 即为 OLS。参 数估计值相同,参数估计量的方差—协方差矩阵一般不相同. 2,MLE:用对数似然函数的导数构造等于 0 的矩条件时,所表示的 GMM 等价于 ML 。 3,IV:GMM 中方程个数等于参数个数时,即等价于工具变量估计法。 4,2STS: 2SLS 是工具变量估计方法的特殊情形,而工具变量估计是 GMM 估计的特殊情形。 如果 GMM 中利用了所有先决变量, 2SLS 与 GMM 估计等价。如上图。 5,与 GEE 的对比,GMM 的使用场合是估计方程的个数大于未知参数的个数。而这两者相 等时,可以使用 GEE。 GMM 的检验 对于 GMM,关键是两项检验:

工具变量法(二):弱工具变量

工具变量法(二):弱工具变量

⼯具变量法(⼆):弱⼯具变量世上没有完美的计量⽅法,因为所有的计量⽅法与模型均依赖于⼀定的前提假设。

因此,在估计完计量模型后,通常需要对模型的前提假设进⾏检验,称为 “诊断性检验”(diagnostic checking)或 “模型检验”(model checking)。

⼯具变量法也不例外。

⼯具变量法的成⽴依赖于有效的⼯具变量(valid instruments),即所使⽤的⼯具变量须满⾜相关性(与内⽣解释变量相关)与外⽣性(与扰动项不相关)。

⼯具变量的相关性(Instrument Relevance)在⼤样本下,2SLS为⼀致估计。

但对于⼤多数实践中的有限样本(finite sample),2SLS估计量依然存在偏差(bias),并不以真实参数为其分布的中⼼,即⽽且,如果⼯具变量与内⽣变量的相关性较弱,则 2SLS 的偏差会变得更为严重。

直观来看,2SLS 的基本思想是通过外⽣的⼯具变量,从内⽣变量中分离出⼀部分外⽣变动(exogenous variations),以获得⼀致估计。

如果⼯具变量与内⽣变量的相关性很弱,则通过⼯具变量分离出的内⽣变量之外⽣变动仅包含很少的信息。

因此,利⽤这些少量信息进⾏的⼯具变量法估计就不准确,即使样本容量很⼤也很难收敛到真实的参数值。

这种⼯具变量称为 “弱⼯具变量”(weak instruments)。

弱⼯具变量的后果弱⼯具变量的后果类似于样本容量过⼩,会导致 2SLS 的⼩样本性质变得很差,⽽ 2SLS 的⼤样本分布也可能离正态分布相去甚远,致使基于⼤样本理论的统计推断失效。

下⾯通过蒙特卡洛模拟(Monte Carlo simulation)来直观地考察弱⼯具变量的后果。

考虑最简单的⼀元回归模型,假设其数据⽣成过程(data generating process)为:其中,为内⽣变量,与扰动项相关;⽽的真实系数为 2。

假设样本容量为10,000,并使⽤⼯具变量进⾏ 2SLS 回归。

工具变量法2SLS与GMM

工具变量法2SLS与GMM

工具变量法2SLS与GMM1第 10 章工具变量,2SLS 与 GMM10.1 解释变量与扰动项相关的例子例农产品市场均衡模型q d = α + α p + u (需求)t 0 1 t t ? q s = β + β p + v(供给) t ? q d 0 1 t t = q s(均衡)tt令q ≡q d=q s,可得t t tq t =α0+α1 p t +u tq =β+βp +vt 0 1 t t两个方程中的被解释变量与解释变量完全一样。

如直接作回归q ?O?LS?→p,估计的是需求函数还是供给函数?t t2图10.1 需求与供给决定市场均衡341 1 1 11 1把线性方程组中的( p t , q t )看成是未知数(内生变量),把(u t , v t ) 看作已知,可求解( p t , q t )为(u t , v t ) 的函数:p = p (u ,v ) = β0 - α0 + v t - u t ? t t t t α - β α - β ? 1 1 1 1 ?q = q (u ,v ) = α1β0 - α0 β1 + α1v t - β1u t ?? t t t t α - β α - β由于 p t 为(u t , v t ) 的函数,故Cov( p t , u t ) ≠ 0,Cov( p t , v t ) ≠ 0。

OLS 估计值α?1, β? 不是α , β 的一致估计量。

称这种偏差为“联立方程偏差”(simultaneity bias)或“内生变量偏差”(endogen eity bias)。

1如能将内生变量分成两部分,一部分与扰动项相关,另一部分与扰动项不相关,可用与扰动项不相关的那部分得到一致估计。

这种分离常借助另一“工具变量”来实现。

假设在图10.1 中,存在某个因素(变量)使得供给曲线经常移动,而需求曲线基本不动,则可估计需求曲线,参见图10.2。

这个使得供给曲线移动的变量就是工具变量。

计量经济学:一般估计方法(NLS、GLS、GMM、逐步筛选、对数极大似然)

计量经济学:一般估计方法(NLS、GLS、GMM、逐步筛选、对数极大似然)

10 *一般估计方法回归方程的估计在特定的条件下选择适当的估计方法会使得结果更加接近实际,更具有说服力。

满足古典线性回归模型的基本假设条件下,利用普通最小二乘法(OLS )估计出来的系数具备优良的线性无偏最小方差(BLUE )的性质。

如果一些条件不能满足,例如出现非线性模型、异方差、序列相关等情形,就无法得到这样的性质。

并且在面对因变量有影响而难以取舍或特殊的计量模型时,就需要改进估计方法以获得更加满意的估计结果。

下面依次介绍几种常见的一般估计方法:非线性最小二乘法(NLS )、广义最小二乘法(GLS )、广义矩阵法(GMM )、逐步筛选最小二乘法、对数极大似然估计法。

10.1 非线性最小二乘法最小二乘法适用的古典假设之一是回归模型是线性的,然而社会经济现象是极其复杂的,有时被解释变量与解释变量之间的关系不一定是线性的。

例如柯布.道格拉斯(Cobb-Dauglass )生产函数模型:321t t t t y L K u ααα=+ ,t=1,2,...,T (10.1.1) 对此方程(10.1.2)进行对数变换,如下式123ln ln ln t t t t y L K u ααα=+++ (10.1.2)虽然式(10.1.2)的变量是非线性形式,此时我们仍能采用估计线性模型的方法,因此模型是参数线性的。

反之,就是参数非线性的,我们就要采用非线性的估计方法。

构建下面的非线性模型:(,)t t t y f x u α=+ ,t=1,2,…,T (10.1.3)式中,y 是被解释变量,x 为解释变量(向量),t u 为误差项,α为待估计的K 维参数向量12(,,...,)k αααα'=,T 是样本个数。

此处讨论的是,f 关于参数α的导数仍含参数α本身,即参数非线性模型。

非线性最小二乘估计是要选择参数向量α的估计值ˆα使残差平方和S(ˆα)最小:[]21ˆˆ()(,)T t t t S y f x αα==-∑ (10.1.4)求解方程,对每个参数分别求偏导数并令这些偏导数为0,得到方程组:[]1ˆˆ(,)()ˆ2(,)0ˆˆT t t t t i i f x S y f x ααααα=∂∂=--=∂∂∑,i=1,2,...,k (10.1.5) 对于参数非线性模型,无法利用普通最小二乘的方法直接求解式(10.1.5)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
? ? x N ?,? 2 ,其中?,? 2为待估参数。因为有两
个待估参数,故需要使用以下两个总体矩条件:
一阶中心矩:E ?x?=?
? ? 二阶中心矩:E x2 =Var ?x?+??E ?x???2 =? 2+? 2
用对应的样本矩来替代总体矩条件可得以下联立 方程组,求解后即得到期望与方差的矩估计:
秩),则在一定的正则条件下,??IV是? 的一致ቤተ መጻሕፍቲ ባይዱ计 且??IV服从渐近正态分布
证明:抽样误差 ??IV-?=?Z?X ?-1 Z?y-?
=?Z?X ?-1 Z??X?+? ?-?=?Z?X ?-1 Z??
? ? =?? ?
1 n
n i=1
zi
-1
x?i ?? ?
? ? ?
1 n
n i=1
zi?i ??=S-ZX1 g
以样本矩替代上式中的总体矩,即可得到矩估计:
? ? ? ? ??MM=?? ?
1 n
n i=1
-1
xix?i ?? ?
?1 ?? n
n xiyi ??=
i=1
?
X?X
-1 X?y=??OLS
显然这就是 OLS估计量
2、工具变量法作为一种矩估计 假设回归模型为
yi=?1xi1+ +? k-1x ? + i,k-1 k xik+?i
由此可得E ?zi?i ?=0 ? E ??zi ?yi-x?i? ???=0 ? E ?zi yi ?=??E ?zix?i ??? ?
? ?=??E ?zix?i ???-1 E ?ziyi ? (假定 ??E ?zix?i ???-1 存在)
以样本矩代替上式中的总体矩,即可得到工具变
量估计量:
假设只有最后一个解释变量xik为内生变量,即
Cov ?xik,?i ?? 0,因此OLS是不一致的。
假设有一个有效工具变量w满足Cov ?xik,wi ?? 0 (相关性),以及Cov ?wi,?i ?=(0 外生性)。由于
x1, ,xk-1不是内生变量,故可以把自己作为自己 的工具变量(因为满足工具变量的两个条件)
违背解释变量外生性假定也可以出现在滞后被解 释变量作为模型解释变量的情况。例如,消费不 仅受收入的影响,还要受到前期消费水平的影响; 投资不仅受GDP的影响,也要受前期投资水平的 影响。当存在扰动项序列相关时,就会造成解释 变量与扰动项相关的情况
一、工具变量法(Instrumental Variable,IV)
? ? 记解释变量向量 xi ? xi1 xi,k-1 xik ?,则原模型为
yi=x?i? +?i
记工具变量向量为
? ? ? ? zi ? zi1 zi,k-1 zik ? ? xi1 xi,k-1 wi ?。
定义gi ? zi?i。由于工具向量与扰动项正交,故
E ?gi ?=E ?zi?i ?=0为总体矩条件或正交条件
总体矩。事实上, OLS也是一种矩估计。利用解释
变量与扰动项的正交性,可以得到以下总体矩条件
E?xi?i ?=0 ? E ??xi ?yi-x?i? ???=0
? E ?xi yi ?=E ?xix?i ?? ? ?=??E ?xix?i ???-1 E ?xiyi ? (假设E ?xixi??可逆)
第七章 工具变量、2SLS、 GMM
OLS估计成为一致估计量的前提是解释变量与扰动
项不相关(即前定变量假设),否则,无论样本容
量多大,OLS估计量也不会收敛到参数真值,这将
难以接受。解决方法之一是本章介绍的工具变量法
复习第三章p34-p38
违背前定变量假设可以出现在联立方程中,比如
? ? ?
Ct=? 0+? 1Yt+?
? ? ? ? ?? n ??IV-? =S-ZX1 ng ??d? N 0,AVar ??IV ,其
? ? 中渐近方差矩阵AVar ??IV =??E ?zix?i ???-1 S ??E ?zixi????-1
用到??E ?zix?i ???-1 为对称矩阵
秩条件r ??E ?zix?i ???=k意味着工具变量wi与内生解释
变量xi相关,若不相关,则秩条件无法满足。证略 阶条件:zi中至少包含k个变量 根据是否满足阶条件可分为三种情况:
?1?不可识别:工具变量个数少于内生解释变量个数 ?2?恰好识别:工具变量个数等于内生解释变量个数 ?3?过度识别:工具变量个数多于内生解释变量个数
?
??p?
??E ?zix?i ???-1 E ?gi ?=0
=0
? ? 其中SZX
?
1 n
n i=1
z i x?i,g
?
1 n
n i=1
zi?i
与第三章大样本最小二乘法类似的假定和推导,
可以证明,ng ??d? N ?0,S?,
? ? 其中S ? E ?gig?i ?=E ?i2ziz?i
进一步,工具变量估计量??IV渐近服从正态分布,即
? ? ? ? ??IV=?? ?
1 n
n i=1
-1
zix?i ?? ?
?1 ?? n
n i=1
ziyi ??= ?
Z?X
-1 Z?y
其中,Z ? ?z1 zn-1 zn ?? 即Z?? ?z1 ? zn-1 zn
下面是工具变量法的大样本性质:
定理:若秩条件r ??E ?zix?i ???=k成立(方阵E ?zix?i ?满
可以引入工具变量 w t 来解决内生变量问题。一个有 效的工具变量应满足以下两个条件: (1)相关性:工具变量与内生解释变量相关,即
Cov ?wt,pt ?? 0,pt为内生解释变量
(2)外生性:工具变量与扰动项不相关,即
Cov ?wt,?t ?=0
二、工具变量法作为一种矩估计
1、矩估计( Method of Moments ,MM) 首先以一个例子来说明矩估计方法:假设随机变量
Yt=Ct+I t+X t
t
,Yt、Ct、It、X
t
分别表示GDP、
消费、投资、净出口。将第一个方程代入第二个
方程,经整理可得Yt=1-1? 1 ?? 0+It+Xt ?+1-?t? 1
可见Yt与?t相关,因此当单独对Ct=? 0+? 1Yt+?t
进行OLS估计时会碰到解释变量与扰动项相关的 情况
?
? ??
? ?
1
? ?? n
1 n
n i=1
xi=??
n
xi2=??2+??2
i=1
?
?
??=x
? ?
?????2=
1 n
n i=1
?xi-x ?2
? 其中,x= 1 n
n i=1
xi为样本均值,上面推导中用到:
n
n
? ? ?xi-x?2= xi2-nx2
i=1
i=1
任何随机向量 x的函数f ?x ?的期望E ??f ?x ???都被称为
相关文档
最新文档