2019工具变量法的Stata命令及实例

相关主题

常用到的stata命令

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

●本实例使用数据集“grilic.dta”。

●先看一下数据集的统计特征：

●考察智商与受教育年限的相关关系：

上表显示，智商（在一定程度上可以视为能力的代理变量）与受教育年限具有强烈的正相关关系（相关系数为0.51）。

●作为一个参考系，先进行OLS回归，并使用稳健标准差：

其中expr, tenure, rns, smsa均为控制变量，而我们主要感兴趣的是变量受教育年限（s）。

回归的结果显示，教育投资的年回报率为10.26%，这个似乎太高了。可能的原因是，由于遗漏变量“能力”与受教育正相关，故“能力”对工资的贡献也被纳入教育的贡献，因此高估了教育的回报率。

●引入智商iq作为能力的代理变量，再进行OLS回归：

虽然教育的投资回报率有所下降，但是依然很高。

●由于用iq作为能力的代理变量有测量误差，故iq是内生变量，考虑使用变量（med（母亲的受教育年限）、kww（在“knowledge of the World of Work”中的成绩）、mrt（婚姻虚拟变量，已婚=1）age（年龄））作为iq的工具变量，进行2SLS回归，并使用稳健的标准差：

在此2SLS回归中，教育回报率反而上升到13.73%，而iq对工资的贡献居然为负值。使用工具变量的前提是工具变量的有

效性。为此，进行过度识别检验，考察是否所有的工具变量均外生，即与扰动项不相关：

结果强烈拒绝所有工具变量均外生的原假设。

●考虑仅使用变量（med, kww）作为iq的工具变量，再次进行2SLS回归，同时显示第一阶段的回归结果：

上表显示，教育的回报率为6.08%，较为合理，再次进行过度识别检验：

接受原假设，认为（med，kww）外生，与扰动项不相关。

●进一步考察有效工具变量的第二个条件，即工具变量与内生变量的相关性。从第一阶段的回归结果可以看出，工具变量对内生变量具有较好的解释力。更正式的检验如下：

从以上结果可以看出，虽然Shea’s partial R^2不到0.04，但是F统计量为13.40>10。

我们知道，虽然2SLS是一致的，但却是有偏的，故使用2SLS 会带来“显著性水平扭曲”（size distortion），而且这种扭曲随着弱工具变量而增大。上表的最后部分显示，如果在结构方程中对内生解释变量的显著性进行“名义显著性水平”（nominal size）为5%的沃尔德检验，加入可以接受的“真实显著性水平”（true size）不超过15%，则可以拒绝“弱工具变量”的原假设，因为最小特征值统计量为14.91，大于临界值11.59。

总之我们有理由认为不存在弱工具变量。但为了稳健起见，下面使用对弱工具变量更不敏感的有限信息最大似然法（LIML）: 结果发现，LIML的系数估计值与2SLS非常接近，这也从侧面印证了“不存在弱工具变量”。

●使用工具变量法的前提是存在内生解释变量，为此须进行豪斯曼检验，其原假设是“所有的解释变量均为外生”：

上表显示，可以在5%的显著性水平下拒绝“所有解释变量均外生的原假设”，即认为存在内生解释变量iq。由于传统的豪斯曼检验建立在同方差的前提下，故在上述回归中均没有使用稳健标准差。

●由于传统的豪斯曼检验在异方差的情形下不成立，下面使用异方差稳健的DWH检验：

据此可认为iq为内生解释变量。

●如果存在异方差，则GMM比2SLS更有效。为此进行如下的最优GMM估计：

●进行过度识别检验：

●由于p值为0.70，故认为所有的工具变量均为外生。考虑迭代GMM：

●如果希望将以上各种估计法的系数估计值及其标准差列在同一张表中，可使用如下命令：

●