第8讲工具变量讲解

合集下载

工具变量法及其应用

工具变量法及其应用一、工具变量法简介工具变量法是一种在统计分析中常用的技术，主要用于解决回归分析中的内生性问题。

内生性问题通常出现在一个或多个解释变量与误差项相关的情况下，这会导致回归模型的估计结果有偏且不一致。

为了解决这个问题，工具变量法通过引入一个或多个与内生解释变量相关，但与误差项无关的工具变量，来替代内生解释变量。

二、工具变量的选择工具变量的选择是工具变量法的关键步骤。

理想的工具变量应满足与内生解释变量相关，但与误差项无关的条件。

在实践中，通常需要根据研究问题的具体情况和理论依据来选择工具变量。

一些常见的选择方法包括使用先前的研究、使用相关行业的平均值、使用其他相关变量的滞后值等。

三、工具变量法的优缺点工具变量法的优点主要包括：可以解决内生性问题，提高回归模型的估计精度和一致性；可以扩大解释变量的范围，使得模型更全面地反映被解释变量的影响因素；可以降低误差项的相关性，从而降低模型的标准误，提高模型的置信度。

但是，工具变量法也存在一些缺点，如工具变量的选择困难、可能导致过度拟合和模型过度设定等问题。

四、工具变量法在经济学中的应用工具变量法在经济学中有着广泛的应用。

例如，在研究货币政策时，工具变量法可以用来解决货币供应量与通货膨胀之间的内生性问题，从而提高模型的预测精度；在研究劳动市场时，工具变量法可以用来解决工资与就业之间的内生性问题，从而更准确地估计模型的参数。

五、工具变量法在金融学中的应用工具变量法在金融学中也有着广泛的应用。

例如，在研究股票市场时，工具变量法可以用来解决市场收益率与风险之间的内生性问题，从而提高模型的预测能力和风险管理水平；在研究信贷市场时，工具变量法可以用来解决利率与信贷风险之间的内生性问题，从而更准确地估计模型的参数。

六、工具变量法在其他领域的应用工具变量法在其他领域也有着广泛的应用。

例如，在环境科学中，工具变量法可以用来解决环境污染与经济增长之间的内生性问题，从而更准确地估计模型的参数；在医学研究中，工具变量法可以用来解决吸烟与健康之间的内生性问题，从而更准确地估计模型的参数。

题目什么是工具变量请简要解释两阶段最小二乘法的原理

题目什么是工具变量请简要解释两阶段最小二乘法的原理工具变量是经济学研究中常用的一种样本选择技术，在解决内生性问题时发挥重要的作用。

而两阶段最小二乘法（Two-stage Least Squares, 2SLS）则是一种通过工具变量解决内生性问题的统计方法。

本文将简要解释什么是工具变量，并介绍两阶段最小二乘法的原理。

一、什么是工具变量？工具变量是一种被用来估计因果效应的技术。

在经济学研究中，我们通常希望通过观察变量之间的关系来推断因果关系。

然而，当我们的解释变量与误差项存在内生性的时候，观察到的关系可能是虚假的。

内生性指的是解释变量与误差项之间存在相关性，从而导致回归结果的偏误。

例如，假设我们想要研究教育对收入的影响，但教育水平与个体的天赋能力存在相关性，那么在简单的回归模型中，教育水平的系数可能是被天赋能力所驱动的，而隐藏了教育对收入的真实影响。

为了解决内生性问题，我们需要引入工具变量。

工具变量是与解释变量相关但与误差项无关的变量。

通过利用工具变量的性质，我们可以有效地分离出解释变量与误差项之间的关系。

二、两阶段最小二乘法的原理两阶段最小二乘法是一种使用工具变量估计内生变量系数的方法。

它将估计过程分为两个阶段，通过两个回归模型来实现。

第一阶段：通过工具变量来解决内生性问题。

首先，选择一个与内生变量相关的工具变量。

然后，利用工具变量进行回归，得到内生变量的预测值。

这个预测值具有以下性质：它与误差项无关，并且与内生变量存在相关性。

第二阶段：根据第一阶段得到的内生变量的预测值，再次进行回归。

这一次回归的目的是估计解释变量对因变量的影响，并控制了内生性的影响。

通过这两个阶段的回归，我们可以得到内生变量系数的一致估计。

两阶段最小二乘法的核心思想是利用工具变量来消除内生性问题，进而获得内生变量系数的一致估计。

通过第一阶段的回归得到的预测值，我们可以将内生变量视为无误差的外生变量，并在第二阶段的回归中进行计算。

工具变量法工具变量法具体步骤

工具变量法工具变量法具体步骤工具变量法（Instrumental Variable Method）是一种用于处理内生性问题的统计方法，它通过引入一个“工具变量”来解决内生性问题。

工具变量是一个有着良好相关性但不会受到内生性干扰的变量，它可以用来代替内生变量，从而解决内生性的影响。

1.确定内生变量和工具变量：首先，需要确定研究中存在的内生变量和可能的工具变量。

内生变量是对所研究问题有影响的变量，而工具变量是与内生变量具有相关性但不会受到内生性干扰的变量。

内生性问题是由于内生变量的存在而导致的因果关系估计偏倚。

2.检验工具变量的相关性：接下来，需要检验所选取的工具变量与内生变量之间的相关性。

这可以通过计算相关系数或进行统计检验来实现。

如果工具变量与内生变量存在显著相关性，那么它可能是一个有效的工具变量。

3.确定工具变量的外生性：除了相关性外，工具变量还需要满足外生性的要求，即工具变量对因变量的影响是通过内生变量而不是其他方式引起的。

这可以通过进行实证分析来判断，例如通过回归模型来检验工具变量对因变量的影响是否通过内生变量进行中介。

如果工具变量的影响仅通过内生变量介导，则可以认为工具变量满足外生性的要求。

4.估计工具变量模型：一旦确定了有效的工具变量，可以使用工具变量法来估计因果关系。

工具变量法的核心思想是通过回归模型来解释内生变量对因变量的影响，并利用工具变量对内生变量进行替代。

通过将工具变量引入估计方程中，可以消除内生性的影响，从而得到无偏的因果关系估计。

5.进行统计推断：在估计了工具变量模型之后，可以进行统计推断来评估估计结果的显著性。

这可以通过计算标准误差、置信区间和假设检验等来实现。

统计推断可以帮助判断估计结果的可靠性，并验证因果关系的存在与否。

总结而言，工具变量法是一种用于解决内生性问题的统计方法。

它通过引入一个有效的工具变量来代替内生变量，消除内生性的干扰，从而得到无偏的因果关系估计。

工具变量法的具体步骤包括确定内生变量和工具变量、检验工具变量的相关性和外生性、估计工具变量模型，并进行统计推断。

工具变量法

工具变量法一、工具变量法得主要思想在无限分布滞后模型中,为了估计回归系数,通常得做法就是对回归系数作一些限制,从而对受限得无限分布滞后模型进行估计。

在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好得解决此类问题得思路。

经过变换,新得模型中,随机扰动项得表达式为:考伊克模型: ( ，为衰减率) （1、1);适应性期望模型:（,为期望系数)(1、2）;部分调整模型:( ，为调整系数） (1、3)。

为原无限分布滞后模型中得扰动项,为变换后得扰动项。

在原模型中得随机扰动项满足经典假设得前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型得随机扰动项由于存在原随机扰动项得滞后项,也就就是说考伊克模型与适应性期望模型得解释变量势必与误差项相关,因此,可能会出现上述两个模型得最小二乘估计甚至就是有偏得这样严重得问题。

那么，我们就是否可以找到一个与高度相关但与不相关得变量来替代？在这里，一个可行得估计方法就就是工具变量法。

在讨论工具变量法之前，我们先来了解一下外生变量与内生变量。

一般来说:一个回归模型中得解释变量有得与随机扰动项无关,我们称这样得解释变量为外生变量;而模型中有得解释变量与随机扰动项相关,我们可称这样得解释变量为内生解释变量。

内生解释变量得典型情况之一就就是滞后应变量为解释变量得情形，如上述考伊克模型与适应性期望模型中得。

外生解释变量:回归模型中得解释变量与随机扰动项无关；内生解释变量:回归模型中得解释变量与随机扰动项无关;了解了内生变量与外生变量得概念,我们接着讨论工具变量法得主要思想：工具变量法与普通最小二乘法就是模型参数估计得两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关（即出现内生变量）时,其回归系数得普通最小二乘估计就是非一致得,这时就需要引入工具变量。

工具变量，顾名思义就是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关得随机解释变量（即内生变量）。

工具变量法

工具变量法Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】工具变量法一、工具变量法的主要思想在无限分布滞后模型中，为了估计回归系数，通常的做法是对回归系数作一些限制，从而对受限的无限分布滞后模型进行估计。

在这里，考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。

经过变换，新的模型中，随机扰动项的表达式为：考伊克模型：1t t t v u u λ-=- （01λ<< ，λ为衰减率）（）；适应性期望模型：1（1）t t t v u u λ-=--（01λ<< ，λ为期望系数）（）；部分调整模型：（1）t t v u γ=-（01γ≤< ，1γ-为调整系数）（）。

t u 为原无限分布滞后模型中的扰动项，t v 为变换后的扰动项。

在原模型中的随机扰动项满足经典假设的前提下，部分调整模型也满足经典假设，但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项，也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关，因此，可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。

那么，我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里，一个可行的估计方法就是工具变量法。

在讨论工具变量法之前，我们先来了解一下外生变量和内生变量。

一般来说：一个回归模型中的解释变量有的与随机扰动项无关，我们称这样的解释变量为外生变量；而模型中有的解释变量与随机扰动项相关，我们可称这样的解释变量为内生解释变量。

内生解释变量的典型情况之一就是滞后应变量为解释变量的情形，如上述考伊克模型与适应性期望模型中的1t Y 。

外生解释变量：回归模型中的解释变量与随机扰动项无关；内生解释变量：回归模型中的解释变量与随机扰动项无关；了解了内生变量和外生变量的概念，我们接着讨论工具变量法的主要思想：工具变量法和普通最小二乘法是模型参数估计的两类重要方法，在多元线性回归模型中，如果出现解释变量与随机误差项相关（即出现内生变量）时，其回归系数的普通最小二乘估计是非一致的，这时就需要引入工具变量。

《工具变量SLSG》课件

智能化与人性化
未来的工具变量slsg将更加注重智能化和人性化的设计。通过人工智能和机器学习技术，实现工具变量slsg的自动化和智能化；同时，将更加注重用户体验和人机交互，使工具变量slsg更加易于使用和操作。
05
工具变量slsg的实际应用与案例分析
工具变量slsg在经济学中的应用
总结词
经济学中，工具变量slsg被广泛应用于解决内生性问题，如遗漏变量偏差和同时性偏差。
《工具变量slsg》ppt课件
• 工具变量slsg简介 • 工具变量slsg的基本原理 • 工具变量slsg的实证分析 • 工具变量slsg的未来发展与展望 • 工具变量slsg的实际应用与案例分析
01
工具变量slsg简介
定义与特点
定义
工具变量（SLSG）是一种用于解决内生性问题的方法，通过引入一个或多个外生的工具变量来替代或估计内生解释变量，以获得一致的估计结果。
实证分析的案例与结果
数据处理
对收集到的数据进行预处理和清洗，确保数据的质量和一致性。
结果分析
对拟合结果进行详细分析，评估模型的适用性和解释能力。
案例选择
选择具有代表性的案例进行实证分析，确保案例的典型性和可信度。
模型拟合
使用所选模型对数据进行拟合，得到拟合结果。
结果比较
将实证分析结果与其他相关研究进行比较，验证结果的可靠性和创新性。
人工智能与机器学习在工具变量slsg中的应用
随着人工智能和机器学习技术的发展，越来越多的研究开始探索如何将这些技术应用于工具变量slsg中，以提高其效率和准确性。
大数据处理与分析在工具变量slsg中的研究
随着大数据时代的到来，如何有效地处理和分析大规模数据成为工具变量slsg面临的重要挑战。当前的研究热点是如何利用先进的数据处理和分析技术，从海量数据中提取有

工具变量法结果解读

工具变量法结果解读一、引言工具变量法是计量经济学中一种重要的估计方法，主要用于解决内生性问题。

通过引入工具变量，工具变量法能够有效地减少误差，提高估计的准确性和可靠性。

然而，对于初学者来说，如何正确解读工具变量法的结果可能是一个挑战。

本文将详细解读工具变量法的理论基础、工具变量的选择、结果解读以及结论，以期帮助读者更好地理解和应用工具变量法。

二、工具变量法的理论基础工具变量法源于经济理论，特别是当一个或多个解释变量与误差项相关时，就会产生内生性问题。

在这种情况下，普通最小二乘法（OLS）的估计结果是有偏的。

为了解决这个问题，我们引入一个或多个与内生解释变量相关，但与误差项无关的工具变量。

这些工具变量通过与内生解释变量的线性组合来“工具化”内生解释变量，从而在估计中起到减少误差和偏误的作用。

三、工具变量的选择选择合适的工具变量是工具变量法的关键步骤。

理想情况下，一个好的工具变量应该与内生解释变量高度相关，同时与误差项无关。

在实践中，我们通常选择那些与内生解释变量相关，同时又遵循随机扰动的因素作为工具变量。

此外，工具变量的数量应该足够多，以便能够充分地“工具化”内生解释变量。

四、结果解读在应用工具变量法后，我们得到了一组估计结果。

这些结果应该如何解读呢？首先，我们需要关注估计系数的符号。

如果估计系数的符号与预期相符，那么我们可以初步认为估计结果是可靠的。

其次，我们需要检验估计结果的显著性。

常用的方法是观察估计系数的p值。

如果p值较小（通常小于0.05），则表明估计结果是显著的。

最后，我们需要检验工具变量的有效性。

这可以通过观察工具变量的系数是否接近于1来初步判断。

如果工具变量的系数接近于1，并且显著，那么我们可以认为工具变量是有效的。

此外，我们还可以使用诸如弱工具检验、过度识别检验等统计方法来进一步检验工具变量的有效性。

五、结论本文对工具变量法的结果解读进行了详细阐述。

通过关注估计系数的符号、显著性以及工具变量的有效性等方面，我们可以更好地理解和应用工具变量法。

工具变量方法原理

工具变量方法原理工具变量方法（Instrumental Variable Method）是一种常用的实证研究方法，用于解决因果关系中的内生性问题。

当研究主变量与随机抽样原则（即不相关性假设）无关时，内生性问题会出现。

在这种情况下，使用传统的OLS（Ordinary Least Squares）回归模型估计将导致参数估计的无效性。

工具变量方法通过利用一个或多个工具变量，来解决内生性问题，并得到一致的估计结果。

工具变量是一个满足两个条件的变量：首先，工具变量与内生变量相关。

其次，工具变量与干扰项不相关。

这样，可以通过回归工具变量来消除内生性问题，从而得到因果关系的一致估计。

工具变量方法的基本思想是在原始模型中引入一个工具变量，在回归分析中用工具变量代替内生变量。

这样，内生变量与工具变量的回归关系就代替了内生变量与因变量的直接关系。

通过估计工具变量与因变量的关系，就可以得到一致的因果关系估计。

Y=α+βX+ε其中，Y是因变量，X是内生变量，α和β是参数，ε是误差项。

由于X与ε存在内生性问题，参数估计将变得无效。

为了解决内生性问题，引入一个工具变量Z。

使用工具变量方法得到的回归方程为：X=α+γZ+ε'其中，γ是工具变量与被解释变量的关系。

将工具变量引入原始模型，得到：Y=α+β(α+γZ+ε')+ε化简后可以得到：Y=α+βα+βγZ+βε'+ε由于内生性问题，βγ≠0，OLS估计将无效。

但是，由于工具变量与ε无相关性，βε'=0。

因此，使用工具变量方法可以得到一致的估计结果，即β的一致估计。

工具变量方法中的关键问题是选择合适的工具变量。

一个好的工具变量要满足两个条件：首先，与内生变量相关，以确保能够消除内生性问题；其次，与干扰项不相关，以确保工具变量不会引入新的内生性问题。

如果工具变量不满足这两个条件，工具变量方法仍然会产生一致的估计结果，但结果可能存在偏误。

要选择合适的工具变量，需要根据研究问题及具体情境进行判断。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第8讲单方程工具变量回归（完）OLS能够成立的假设之一是解释变量与扰动项不相关。

否则，OLS估计量将是不一致的，即无论样本容量多大，OLS估计量都不会收敛到真实的总体参1，解决方法之一就是本讲介绍数。

然而，解释变量与扰动项相关的例子却很多的工具变量法。

从历史上看，工具变量估计和联立方程系统是同时教授的，更老的教科书仅在联立方程中描述工具变量估计。

然而在最近的几十年，内生性的处理和工具变量估计已经呈现出更广阔的前景，而对于联立方程完整系统设定的兴趣已经减弱。

最新的教材，如Cameron & Trivedi (2005)，Davidson & MacKinnon (1993, 2004)和Wooldridge (2010, 2013)，把工具变量估计看作现代经济学家的工具包中不可或缺的一部分，用更长的篇幅介绍它，而缩短对联立方程的讨论。

在回归方程中，一个有效（valid）的工具变量应满足以下两个条件：（1）相关性：工具变量与内生解释变量相关；（2）外生性：工具变量与扰动项不相关。

但是，工具变量的这两个条件常常矛盾，即与内生解释变量相关的变量往往与扰动项也相关。

故在实践上，寻找合适的工具变量通常比较困难，需要一定的创造性与想象力。

寻找工具变量的步骤大致可以分为两步：（1）列出与内生解释变量相关的尽可能多的变量的清单（较容易）（2）从这一清单中剔除与扰动项相关的变量（较困难）传统的工具变量法一般通过“两阶段最小二乘法”（2SLS）来实现，顾名思义，即作两个回归。

可以证明，在扰动项的经典假定下，由2SLS得到的工具变2。

这个结论类似于小样本理论中的量线性组合是所有线性组合中最渐近有效的高斯—马尔可夫定理。

第一阶段回归：用内生解释变量对工具变量回归，得到内生解释变量的拟合值。

1在计量经济学中，把所有与扰动项相关的解释变量都称为“内生变量”。

2在条件同方差的情况下，最优GMM还原为2SLS，而最优GMM是渐近有效的。

1第二阶段回归：用被解释变量对第一阶段回归的拟合值进行回归，得到被解释变量的拟合值。

ivregress —Single-equation instrumental-variables regression命令语法：ivregress estimator depvar [varlist] (varlist= varlist) [if] [in] [weight] [, iv21options](2SLS)(LIML)(GMM)命令描述：ivregress拟合被解释变量depvar对varlist和varlist的线性回归，使用varlist iv12作为varlist的工具变量，varlist和varlist是外生（解释）变量，varlist是内生221iv （解释）变量。

ivregress可以利用两阶段最小二乘法(2SLS)，有限信息最大似然法(LIML)和广义矩估计(GMM)执行工具变量估计。

备注和示例ivregress执行工具变量回归和加权工具变量回归。

对于工具变量的一般讨论，请参见Baum (2006)，Cameron和Trivedi (2005；2010，第6章)，Davidson和MacKinnon (1993，2004)，Greene (2012，第8章)，以及Wooldridge (2010，2013)。

参见Hall (2005)对于GMM估计的明晰介绍。

Angrist和Pischke (2009，第4章)非正式而全面地介绍了工具变量估计量，包括他们在估计处理效应的使用。

ivregress的语法假设从方程系统拟合一个方程，或拟合一个不用指定剩余方程的函数形式的方程。

为了拟合一个完整的方程系统，使用2SLSequation-by-equation或三阶段最小二乘法，请参阅[R] reg3。

ivregress的一个优点是，可以拟合多方程系统中的一个方程，而不用指定剩余方程的函数形式。

形式上，由ivregress拟合的模型是：2ββ+ u y = z + x (1) ii1ii12ΠΠ+ v z = x+ x (2) i2ii21i1其中y是第i个观测值的因变量，z表示内生回归元（varlist），x表示包1ii2i括的外生回归元（varlist），x表示排除的外生回归元（varlist）。

x 和x统称2i2i1iv1i为工具。

u和v是零均值误差项，u和v元素的相关性假设是非零。

iiii2SLS and LIML estimators最常用的工具变量估计量是2SLS。

例1：2SLS estimator我们有从1980年以来的州人口普查数据，包括自有住房价值的中位数(hsngval)和每月总租金的中位数(rent)。

我们想构建rent为hsngval和生活在城市地区的人口比例(pcturban)的函数：rent=β+βhsngval+βpcturban+ u i 12i ii0其中i表示各个州，u是误差项。

i因为随机冲击影响一个州的租金价格，也可能会影响房屋价值，所以我们把hsngval看作是内生的。

我们相信hsngval和u的相关性不等于零。

另一方面，我们没有理由相信pcturban和u的相关性不为零，所以我们假设pcturban是外生的。

因为把hsngval当作内生回归元，所以必须有一个或多个与hsngval相关但与u不相关的其他变量。

此外，这些排除的外生变量不能直接影响rent，因为如果它们影响rent的话，就应该包含在前面指定的回归方程中。

另外，家庭收入变量(faminc)和地区变量(region)，与hsngval相关但与误差项u不相关。

总之，pcturban，faminc和因子变量2.region，3.region和4.region构成了一套工具变量。

为了拟合方程，我们指定了因变量和包括外生变量的自变量。

在括号中，我们指定了内生回归元，一个等号，和排除的外生变量。

其他外生变量必须指定在等号的右边；出现在回归方程中的外生变量自动纳入工具变量。

use hsng,clearivregress 2sls rent pcturban (hsngval = faminc i.region)正如所期望的，具有更高房屋价值的州有更高的租金价格。

生活在城市地区的州人口比例对租金没有显著影响。

3技术说明在联立方程的框架下，写出前面拟合的模型为：hsngval=π+πfaminc +π2.region+π3.region+π4.region+ v ii4ii0231ii rent =β+βhsngval+βpcturban+ u i210iii方程系统是递归的，因为hsngval出现在rent的方程中，但rent并没有出现在hsngval的方程中。

然而，在一般情况下，联立方程系统不是递归的。

由于系统是递归的，我们可以用OLS分别拟合这两个方程，如果我们愿意假设u和v是独立的。

例2：LIML estimator理论和Monte Carlo模拟表明，LIML估计量比2SLS估计量可能会得到更小的偏差，并且置信区间的覆盖率更好。

use hsng,clearivregress liml rent pcturban (hsngval = faminc i.region)这些结果与2SLS结果定性相似，尽管hsngval的系数比2SLS的系数高19%左右。

例3：GMM estimator在扰动项的经典假定下，2SLS是最有效率的。

但如果扰动项存在异方差或自相关，则存在更有效的方法，即“广义矩估计”（Generalized Method of Moments，GMM）。

在某种意义上，GMM之于2SLS，正如GLS之于OLS。

从Hansen (1982)的著名论文以来，GMM已成为了经济学和金融学的常用估计方法，它非常适用于工具变量估计。

对于更一般的GMM估计量，参见[R] gmm。

gmm不限定拟合单个的线性方程，尽管语法更复杂。

use hsng,clearivregress gmm rent pcturban (hsngval = faminc i.region), wmatrix(robust)（wmatrix(robust)是默认选项。

指定wmatrix(robust)项要求一个最优加权矩4阵，当误差项存在异方差时。

）例4：GMM estimator with clustering有关于年轻女性的1968年—1988年NLS(National Longitudinal Survey)工资调查数据，我们想要拟合一个工资模型，工资是年龄、年龄的平方、工作任期、出生年份和教育水平的函数。

我们认为影响女性工资水平的随机冲击，也会影响她的工作任期，所以我们把tenure看作内生的。

额外的工具变量包括，是否加入工会，在过去的一年工作周数，婚姻状况。

因为每名女性都有多个观测值（对应于多年的跟踪调查），所以我们要为每个人进行聚类。

use nlswork,clearivregress gmm ln_wage age c.age#c.age birth_yr grade (tenure = unionwks_work msp), wmatrix(cluster idcode)工作任期和教育年限对工资有显著的正效应。

有关GMM估计更多的内容，参见Baum (2006)；Baum，Schaffer和Stillman (2003, 2007)；Cameron & Trivedi (2005)；Davidson & MacKinnon (1993, 2004)；Hayashi (2000)；Wooldridge (2010)。

参见Newey & West (1987)，Wang & Wu (2012)对于HAC协方差矩阵估计的介绍。

例5：Mincer收入方程遗漏变量的处理Mincer(1958)最早研究了工资与受教育年限的正相关关系，但遗漏了“能力”这个变量，导致遗漏变量偏差。

使用美国面板调查数据（NLS）中的年轻男子组，采用工具变量法处理遗漏变量的问题。

该数据集包括以下变量：lw(工资对数)，s(受教育年限)，age(年龄)，expr(工龄)，tenure(在现单位的工作年数)，iq(智商)，med(母亲的受教育年限)，kww(在“knowledge of the World of Work 测试中的成绩)，mrt(婚姻虚拟变量，已婚=1)，rns(美国南方虚拟变量，住在南方=1)，smsa(大城市虚拟变量，住在大城市=1)，year(有数据的最早年份，1966-1973年中的某一年)。

这是一个两期面板数据。

use grilic,clearcorrelate iq s5（智商（在一定程度上可视为“能力”的代理变量）与受教育年限具有较强的正相关关系（相关系数为0.51））regress lw s expr tenure rns smsa,r(先用OLS回归作为一个参照系，并使用稳健标准差。