第15章工具变量与两阶段最小二乘.doc

第15章工具变量与两阶段最小二乘.doc
第15章工具变量与两阶段最小二乘.doc

第15章 工具变量估计与两阶段最小二乘法

在本章中,我们进一步研究多元回归模型中的内生解释变量(endogenous explanatory variable )问题。在第3章中,我们推导出,遗漏一个重要变量时OLS 估计量的偏误;在第5章中,我们说明了在遗漏变量(omitted variable )的情况下,OLS 通常是非一致性的。第9章则证明了,对未观测到的解释变量给出适宜的代理变量,能消除(或至少减轻)遗漏变量偏误。不幸的是,我们不是总能得到适宜的代理变量。 在前两章中,我们解释了存在不随时间变化的遗漏变量的情况下,对综列数据如何用固定效应估计或一阶差分来估计随时间变化的自变量的影响。尽管这些方法非常有用,可我们不是总能获得综列数据的。即使能获得,如果我们的兴趣在于变量的影响,而该变量不随时间变化,它对于我们也几无用处:一阶差分或固定效应估计排除了不随时间变化的变量。此外,迄今为止我们已研究出的综列数据法还不能解决与解释变量相关的随时间而变化的遗漏变量的问题。

在本章中,我们对内生性问题采用了一个不同的方法。你将看到如何用工具变量法(IV )来解决一个或多个解释变量的内生性问题。就应用计量经济学中线性方程的估计而言,两阶段最小二乘法(2SLS 或TSLS )是第二受人欢迎的,仅次于普通最小二乘。

我们一开始先说明,在存在遗漏变量的情况下,如何用IV 法来获得一致性估计量。此外,IV 能用于解决含误差变量(errors-in-variable )的问题,至少是在某些假定下。下一章将证明运用IV 法如何估计联立方程模型。

我们对工具变量估计的论述严格遵照我们在第1篇中对普通最小二乘的推导,其中假定我们有一个来自基本总体的随机样本。这个起点很合人意,因为除了简化符号之外,它还强调了应根据基本总体来表述对IV 估计所做的重要的假定(正如用OLS 时一样)。如我们在第2篇中所示,OLS 可以应用于时间序列数据,而工具变量法也一样可以。第15.7节讨论IV 法应用于时间序列数据时出现的一些特殊问题。在第15.8节中,我们将论述在混合横截面和综列数据上的应用。

15.1 动机:简单回归模型中的遗漏变量

面对可能发生的遗漏变量偏误(或未观测到的异质性),迄今为止我们已讨论了三种选择:(1)我们可以忽略此问题,承受有偏、非一致性估计量的后果;(2)我们可以试图为未观测到的变量寻找并使用一个适宜的代理变量;(3)我们可以假定遗漏变量不随时间变化,运用第`13与14章中的固定效应或一阶差分方法。若能把估计值与关键参数的偏误方向一同给出,则第一个回答是令人满意的。例如,如果我们能说一个正参数(譬如职业培训对往后工资的影响)的估计量有朝零偏误 ,并且我们找到了一个统计上显著的正的估计值,那么我们还是学到了一些东西:职业培训对工资有正的影响,而我们很可能低估了该影响。不幸的是,相反的情况经常发生,我们的估计值可能在数值上太大了,以致我们要得出任何有用的结论都非常困难。

第9.2节中讨论的代理变量解也能获得令人满意的结果,但并不是总可以找到一个好的代理。该方法试图通过用代理变量取代不可观测的变量,来解决遗漏变量的问题。

另一种方法是将未观测到的变量留在误差项中,但不是用OLS 估计模型,而是运用一种承认存在遗漏变量的估计方法。这便是工具变量法所要做的。

举例来说,考虑成年劳动者的工资方程中存在未观测到的能力的问题。一个简单的模型为:

,)log(210e abil educ wage +++=βββ

其中e 是误差项。在第9章中,我们说明了在某些假定下,如何用诸如IQ 的代理变量代替能力,从而通过以下回归可得到一致性估计量

)log(wage 对IQ educ , 回归

然而,假定不能得到适当的代理变量(或它不具备足以获取一致性估计量所需的性质)。这样一来,我们将abil 放入误差项中,留下来的就是简单的回归模型:

,)log(10u educ wage ++=ββ (15.1)

其中u 包含了abil 。当然,如果用OLS 估计方程(15.1),若是educ 与abil 相关,得到的结果将是1β的有偏、非一致性估计量。

最后证明是,假如我们能为educ 找到一个工具变量,我们仍可以根据方程(15.1)来进行估计。为描述该方法,将简单回归模型写成:

,10u x y ++=ββ

(15.2)

其中我们认为x 与u 相关: .0),(Cov ≠u x (15.3) 工具变量法无论x 与u 相关与否都行得通,但是,如果x 与u 不相关,我们应该使用OLS ,其原因我们将在后面看到。

为了获得x 与u 相关时0β和1β的一致性估计量,我们还需要一些另外的信息。这些信息由一个满足某些性质的新变量给出。假定我们有一个可观测到的变量z ,它满足两个假定:(1)z 与u 不相关,即,

.0),(Cov =u z (15.4)

(2)z 与x 相关,即,

.0),(Cov ≠x z (15.5)

我们则称z 是x 的工具变量(instrumental variable )。

有时候,人们把所需条件(15.4)概括为“z 在方程(15.2)中是外生的”。从遗漏变量的角度看,这意味着z 应当对y 无偏效应,也不应当与其它影响y 的因素相关。方程(15.5)意味着z 必然与内生解释变量x 有着正的或负的关系。

对工具变量的两个要求之间有一个非常重要的差别。因为(15.4)是z 与不可观测的误差u 的协方差,我们无法对它进行验证或哪怕是检验:我们必须求助于经济行为或内心感受来维持这一假定。相比之下,给定一个来自总体的随机样本,z 与x 相关(在总体中)的条件则可加以检验。做到这一点最容易的方法是估计一个x 与z 之间的简单回归。在总体中,我们有

.10v z x ++=ππ (15.6) 从而,由于)(V ar ),Cov(1z x z =π,(15.5)中的假定当且仅当01≠π时成立。因而我们就能够以充分小(习惯说充分高——译者)的显著水平(5%或1%)拒绝虚拟假设

0 :H 10=π (15.7) 并接受双侧对立假设0 :H 10≠π。如果真是这样,我们能相当有把握肯定(15.5)是成立的。

对于(15.1)中的log(wage )方程,educ 的工具变量z 必须:(1)与能力(以及其它影响工资的不可观测的因素)不相关,(2)与教育相关。诸如一个人的社会福利登记号的最后一位数字之类的变量,几乎一定满足第一个必需条件:与能力不相关,因为它是随机决定的。然而,该变量与教育不相关,因而是educ

的一个低劣的工具变量。

我们所谓的用于遗漏变量的代理变量因相应的原因成为低劣的IV 。例如,在遗漏能力的log(wage )例子中,abil 的代理变量应该尽可能地与abil 高度相关。而工具变量必须与abil 不相关。因此,尽管IQ 是abil 的一个好的代理变量候选者,它却不是educ 的好的工具变量。

对其它可能的工具变量候选者,这些必需条件更加不确定。劳动经济学家已在工资方程中使用家庭背景变量作为教育的IV 。例如,母亲的教育(motheduc )与孩子的教育是正相关的,这一点通过收集劳动者数据样本并做educ 对motheduc 的简单回归便可以看出来。因此,motheduc 满足方程(15.5)。问题是,母亲的教育也可能与孩子的能力相关(通过母亲的能力和可能通过孩子幼年所受的教养的质量)。

(15.1)中educ 的另一个IV 选择是成长过程中兄弟姊妹的数目(sibs )。一般地说,较多的兄弟姊妹与较低的平均教育水平相联系。这样,如果兄弟姊妹的数目与能力不相关,它可以 充当educ 的工具变量。

再举一个例子,考虑估计逃课对期末考试成绩的因果影响的问题。在一个简单的回归框架中,我们有 ,10u skipped score ++=ββ (15.8) 其中score 是期末考试成绩,skipped 是该学期逃课的总数目。当然,我们可能担心skipped 与u 中其它因素相关:较好的学生可能逃课较少。因而score 对skipped 的简单回归可能不会给我们一个对逃课的因果影响的好的估计。

什么可能是skipped 的好的IV ?我们所需要的是对score 无直接效应,且与学生能力不相关的IV 。同时,该IV 必须与skipped 相关。一个选择是利用住宿区与学校之间的距离。一所大规模的大学中将有部分学生乘车去学校,这也许会增加逃课的可能性(由于恶劣的天气、睡过头等等)。因而,skipped 可能与distance 正相关;这一点可通过skipped 对distance 的回归并作一个t 检验得以验证,正如前面所描述的。

distance 是否与u 不相关?在简单回归模型(15.8)中,u 中的一些因素可能与distance 相关。例如,低收入家庭的学生可能不住在学校;如果收入影响到学生的行为,可能会导致distance 与u 相关。第15.2节说明如何在多元回归的情况下使用IV ,以便其他影响score 的因素能直接地包含在模型中。那么,distance 也许是skipped 的一个好的IV 。如果学生能力有一个好的代理,例如以往学期的累积GPA ,IV 法可能根本就不需要。

现在我们来证明可得到的工具变量能够用于进行方程(15.2)中的一致性参数估计。特别地,我们将说明(15.4)与(15.5)[等价地,(15.4)与(15.7)]中的假定足以识别参数1β。在这一点上,参数的识别(identification )意味着我们可以根据总体矩写出1β,总体矩可用样本数据来估计。为了根据总体协方差写出1β,我们利用方程(15.2):z 与y 之间的协方差为

).,(Cov ),(Cov ),(Cov 1u z x z y z +=β

现在,在(15.4)中0),(Cov =u z 与(15.5)中0),(Cov ≠x z 的假定下,我们可以解出1β为: .)

,(Cov ),(Cov 1x z y z =β (15.9) [注意到如果z 与x 不相关,即0),(Cov =x z ,该简单代数式不成立。] 方程(15.9)表明1β是z 、y 之间的总体协方差除以z 、x 之间的总体协方差的商,这说明了1β被识别。给定一个随机样本,我们用对应样本量来估计总体的量。在分子和分母中约去样本容量后,我们得到1β的工具变量(IV )估计量(instrumental

variables (IV) estimator ):

.))(())((?111∑∑==----=n i i i

n i i i x x z z

y y z z β (15.10) 给定x 、y 和z 的样本数据,很容易获得(15.10)中的IV 估计量。0β的IV 估计量就为:x y 1

0??ββ-=,除了其中的斜率估计量1

?β现在为IV 估计量,它看起来就像OLS 中的截距估计量。 当x z =时,我们获得1β的OLS 估计量决不是偶然的。换句话说,当x 是外生的时,它可用作自身的IV ,IV 估计量等同于OLS 估计量。

大数定律的一个简单应用表明,如果满足(15.4)和(15.5)中的假定,1β的IV 估计量具有一致性:1

1)?plim(ββ=。如果任一个假定不成立,IV 估计量都将是非一致性的(这一点后面将进一步地研究)。IV 估计量的一个特点是:当事实上x 与u 相关——以致确实需要工具变量来估计——它实质上绝不是无偏的。在小样本中,这意味着IV 估计量可能有相当大的偏误,这就是为什么希望有大样本的一个原因。

用IV 估计量做统计推断

已知IV 和OLS 具有类似的结构,我们无需惊讶在大样本容量的情况下IV 估计量近似服从正态分布。为了对1β进行推断,我们需要一个可用于计算t 统计量和置信区间的标准误,通常的方法是增加一个同方差性的假定,这和在OLS 的情况下一样。不过现在,同方差性的假定是以工具变量z ,而不是以内生解释变量x 为条件来表述的。除了前面关于u 、x 和z 的假定之外,我们增加

).(Var )(E 22u z u ==σ (15.11)

可以表明,在(15.4)、(15.5)和(15.11)中的假定下,1

?β的渐近方差为: ,2,22

z

x x n ρσσ (15.12) 其中2x σ是x 的总体方差,2σ是u 的总体方差,2,z x ρ是x 与z 之间的总体相关系数的平方,它告诉我们在总体中x 与z 是怎样的高度相关。如同运用OLS 估计量一样,IV 估计量的渐近方差以n

1的速度降为0,这里n 是样本容量。

方程(15.12)引起人们兴趣的原因有两点。第一,它提供了一种获得IV 估计量的标准误的方法。(15.12)中的所有的量均可以在给定一个随机样本的情况下进行一致性的估计。为估计2x σ,我们简单地计算出i x 的样本方差;为估计2,z x ρ,我们可以做i x 对i z 的回归来获得2R ,即2,z x R 。最后,为估计2

σ,我们可以运用IV 残差,

...., 2, 1,??? ,10n i x y u i

i i =--=ββ 其中0?β与1?β是IV 估计量。2σ的一致性估计量看起来就像从简单OLS 回归中得出的2

σ估计量: ,?21?122

∑=-=n i i u n σ 其中用自由度进行纠正是标准的做法(即使随着样本容量的增加,这样做几乎不起什么作用)。

1

?β的(渐近的)标准误是所估计的渐近方差的平方根。这个渐近的方差由下式给出: ,SST ?2,2z x x R σ

(15.13)

其中, x SST 是i x 的总平方和。回忆i x 的样本方差是n x SST ,因而约去样本容量我们得到(15.13)。所

得到的标准误可用于构造t 统计量,以检验关于1β的假设,或者是1β的置信区间。0

?β也有一个标准误,我们在此不提。任何现代计量经济学的软件包都会计算出任一IV 估计后的标准误。

在我们给出例子之前,比较IV 和OLS 估计量(当x 与u 不相关时)的渐近方差是有用处的。在高斯-马尔科夫假定下,OLS 估计量的方差为x SST 2σ

,而IV 估计量类似的计算式为2,2SST z x x R ?σ;两者的区别仅在于IV 的方差的分母中出现了2,z x R 。由于2R 总是小于1,这个2SLS 的方差总是大于OLS 的方差

(当OLS 有效时)。如果2,z x R 很小,IV 的方差会比OLS 的方差大得多。记住,2

,z x R 衡量的是样本中x 与z 之间的线性关系的大小。如果x 与z 只是轻度相关,2,z x R 会很小,而这将转化为IV 估计量的一个非常大的

抽样方差。z 越是与x 高度相关,2,z x R 越是接近于1,IV 估计量的方差就越小。在x z =的情况下,12,=z x R ,我们得到OLS 的方差,这正是所预期的。

前面的讨论突出了当x 与u 不相关时进行IV 估计的一个重要代价:IV 估计量的渐近方差总是大于——有时大得很多——OLS 估计量的渐近方差。

例15.1 对已婚女性进行教育的回报估计

我们用MROZ. RAW 中关于已婚职业女性的数据来估计以下简单回归模型的教育回报,

.)log(10u educ wage ++=ββ (15.14) 为了比较,我们首先得到OLS 估计值:

.118. ,428 (.014) (.185)

109. 185.)?log(2==+-=R n educ ge a

w (15.15)

1β的估计值表明,再受一年的教育可得到约11%的回报。

接下来,我们用父亲的教育(fatheduc )作为educ 的工具变量。我们必须认为fatheduc 与u 不相关。第二个必需条件是educ 与 fatheduc 相关。做一个educ 对fatheduc 的简单回归(样本中只有职业女性),我们可以非常容易地验证这一点:

.

173. 428, (.029) (0.28) 269. 24.10?2==+=R n fatheduc uc d

e (15.16)

fatheduc 的t 统计量为9.28,说明educ 与 fatheduc 之间存在统计上显著的正相关。(实际上,fatheduc 解释了样本中educ 的变异中约17%的部分。)用fatheduc 作为educ 的IV ,得:

.

093. ,428 (.035) (.446) 059. 441.)?log(2==+-=R n educ ge a

w (15.17)

教育回报的IV 估计值为5.9%,大约是OLS 估计值的21。这表明OLS 估计值过高,且与遗漏的能力变量的偏误相一致。但我们应该记住,这些都是仅从一个样本中得出的估计值:我们根本不知道0.109是否高于真正的教育回报,或者0.059更接近真正的教育回报。其次,IV 估计量的标准误是OLS 标准误的212倍。(这是我们预期到的,原因已在前面表明)。运用OLS 得出1β的95%置信区间比运用IV 要狭窄得多;事实上,IV 的置信区间确实包含了OLS 估计值。因此,尽管实践中(15.15)与(15.17)之间的差异很大,我们不能说该差异在统计上显著。第15.5节中我们将说明如何对此进行检验。

在前面的例子中,运用IV 估计出的教育回报小于运用OLS 的估计结果,这符合我们的预期。以下的例子将表明这个结果不是必然的。

例15.2 估计对男性进行教育的回报

现在我们再用W AGE2. RAW 来对男性估计教育的回报。我们用sibs (兄弟姊妹的数目)作为educ 的工具变量。它们是负相关的,对此我们可以从以下简单回归中来证实:

.

057. ,359 (.030)

(0.11) 228. 14.14?2==-=R n sibs uc d

e

该方程意味着,每多一个兄弟姊妹,相关联的是一年内所受的教育平均比原来减少约0.23。如果我们假定sibs 与(15.14)中的误差项不相关,那么IV 估计量就具有一致性。用sibs

作为educ 的工具变量估计方程(15.14),得: .

935 (.026)

(0.36) 122. 13.5)?log(=+=n educ ge a

w (2R 计算出为负数,因而我们没有予以报告。后面将从IV 估计的角度对2

R 进行讨论。)相比之下,1β的

OLS 估计值是.059,标准误是.006。与前面的例子不同,现在IV 估计值比OLS 估计值大得多。尽管我们不知道该差异是否在统计上显著,但它不会与OLS 中遗漏的能力变量所造成的偏误相混淆(mesh with )。有可能sibs 也与能力相关:较多的兄弟姊妹意味着平均起来受父母的照料较少,这可能导致较低的能力。另一个解释是,由于educ 中的测量误差,OLS 估计量有朝零偏误。该解释不能完全令人信服,因为educ 未必满足经典的含误差变量模型,这一点我们已在第9.3节中讨论过。

在前面的例子中,内生解释变量(educ )与工具变量(fatheduc ,sibs )均有数量含义。然而,这两类都可以是二值变量。Angrist 和Krueger (1991)在他们最简单的分析中,利用美国的男性人口调查数据,提出了educ 的一个巧妙的二值工具变量。如果该男性是在第一季度出生的,令frstqrt 等于1,否则为0。(15.14)中的误差项——特别是能力——似乎应该与出生季度不相关。但是,frstqrt 还要与educ 相关。事实表明,在基于出生季度的总体中,教育年数确实有系统性差异。Angrist 和Krueger 认为是缘于在各州实行的义务就学法,这很有说服力。简单地说,年初出生的学生往往入学较晚。因此,他们在达到义务教育年龄时(大部分州定为16岁),所受的教育略少于入学较早的学生。Angrist 和Krueger 证实了,对于已完成高中学业的学生来说,受教育年数与出生季度并无关系。

因为教育年数在各出生季度之间的变化仅仅是微乎其微的——这意味着(15.13)中的2

,z x R 非常小——Angrist 和Krueger 需要很大的样本容量来得到一个合理而准确的IV 估计值。利用1920至1929年之间出生的247,199位男性的数据,得出教育回报的OLS 估计值为.0801(标准误为.0004),IV 估计值为.0715(.0219);见于Angrist 和Krueger 的论文中的表III 。注意到OLS 估计值的t 统计量那么大(约为200),然而IV 估计值的t 统计量仅为3.26。因而IV 估计值在统计上不为0,但其置信区间比基于OLS 估计值的置信区间宽得多。

Angrist 和Krueger 有一个有趣的发现:IV 估计值与OLS 估计值相差并不多。实际上,利用下一个十年中出生的男性的数据,得出IV 估计值稍微高于OLS 估计值。对此可以这样解释:说明在用OLS 估计工资方程时不存在遗漏能力的偏误。可是,Angrist 和Krueger 的论文在计量经济学界受到了非难。如同Bound ,Jaeger 和Baker (1995)讨论的那样,它不能明显地判断出生季节与影响工资的诸因素不相关,纵然这些因素没有被人观测到。我们在下一小节中将解释,即使z 与u 之间有少量的相关,也会导致IV 估计量存在严重的问题。

对于政策分析,内生解释变量往往是二值变量。例如,Angrist (1990)研究了,参加越南战争的老兵,其终身收入因参加越战而受到的影响。一个简单模型为:

,)log(10u veteran earns ++=ββ (15.18) 其中veteran 是二值变量。疑问在于,用OLS 估计该方程时,可能存在一个自我选择(self-selection )的问题,这一点我们在第7章中提到过:也许人们因为能从军队中得到最多的收入而选择参军,或者参军的决策与其他对收入有影响的特征相关。这些问题将导致veteran 与u 相关。

Angrist 指出,越南战争的征兵抽签提供了一个自然试验(natural experiment )(亦参见第13章),从而产生了veteran 的一个工具变量。年轻人被分给的征兵抽签号决定了他们是否会被征召去服役于越南战争。因为所分给的号码(毕竟)是随机分配的,征兵抽签号与误差项u 不相关似乎是可信的。而得到号码足够小(指号码小于某个数——译者)的人必须服役于越南战争,使得成为老兵的概率与抽签号相关。如果以上两点都是正确的,征兵抽签号是veteran 的一个好的IV 候选者。

还有可能遇到一个二值的内生解释变量与一个二值的工具变量的情况。作为一个例子,参见习题15.1。

低劣的工具变量条件下IV 的性质

我们已经看到,尽管当z 与u 不相关,而z 与x 存在着正的或负的相关时,IV 是一致性的,但当z 与x 只是弱相关时IV 估计值可能有大的标准误。z 与x 之间的弱相关可能产生甚至是更加严重的后果:即使z 与u 只是适度相关,IV 估计量也会有大的渐近偏误。

当z 与u 可能相关时,通过对IV 估计量的概率极限的分析,就可以看到这一点。利用总体相关和标准差,可以推出:

.),(Corr ),(Corr ?plim 11x

u x z u z σσββ+= (15.19) 其中u σ和x σ分别代表总体中u 和x 的标准差。该方程中引起人们兴趣的是包含相关项的部分。它表明,即使)Corr(z,x 很小,如果)Corr(z,u 也很小,IV 估计量的非一致性会非常大。因此,即使我们只考虑一致性,如果z 与u 之间的相关小于x 与u 之间的相关,使用IV 不一定比OLS 更好。由于

)/(),Cov(),Corr(u x u x u x σσ=,连同方程(5.3)一起,我们可以将OLS 估计量的plim ——称之为1~β—

—写为

.),(Corr ~plim 11x

u u x σσββ+= (15.20) 比较两式,说明当),(Corr ),(Corr /),(Corr u x x z u z <时,IV 就渐近偏误而言比OLS 更可取。

在前面提到的Angrist 和Krueger (1991)的例子中,x 是学校教育的年数,z 是一个指示出生季度的二值变量,z 与x 之间的相关非常小。Bound ,Jaeger 和Baker (1995)讨论了出生季度与u 可能有些相关的原因。从方程(15.19)中,我们看到这将会导致IV 估计量有相当大的偏误。

当z 与x 完全不相关时,无论z 是否与u 不相关,事情尤其糟糕。接下来的例子说明了为什么我们应当时常检查内生解释变量是否与备选的IV 相关。

例15.3 估计吸烟对出生体重的影响

在第6章中,我们估计了吸烟对婴儿出生体重的影响。没有其他的解释变量,模型为:

,)log(10u packs bwght ++=ββ (15.21) 其中packs 是母亲每天吸烟的包数。我们会担心packs 与其它健康因素或者获得良好的产前护理的可能性相关,以致packs 与u 可能相关。packs 的一个可能的工具变量是所居住州的香烟价格cigprice 。我们将假定cigprice 与u 不相关(即使州政府对健康护理的支持可能与香烟税相关)。

如果香烟是典型的消费品,基本的经济理论表明packs 与cigprice 负相关,所以cigprice 可用作packs 的IV 。为验证这一点,我们利用BWGHT. RAW 中的数据,做packs 对cigprice 的回归:

.0006. ,0000. 1,388,

(.0008) (.103) 0003.067.? 22-===+=R R n cigprice ck a

p

这说明怀孕期间吸烟与香烟价格之间没有关系。考虑到吸烟有使人上瘾的特性,该结论可能不会太令人惊讶。

因为packs 与cigprice 不相关,我们不应该在(15.21)中用cigprice 作为packs 的IV ,但如果我们用了会怎么样?IV 的结果将为:

.

1,388

(8.70) (0.91) 99.245.4)?log( =+= n packs ght w

b (所报告的2R 为负数)。packs 的系数极大,而且有一个意想不到的符号。标准误也非常大,因此packs 不是显著的。可是估计值是没有意义的,因为cigprice 不满足我们总可以检验的IV 的一个必需条件,即(15.5)中的假定。

IV 估计后计算2R 大多数回归软件包运用标准公式SST SSR 12

-=R 计算IV 估计之后的2R ,其中SSR 是IV 残差的平方和,SST 是y 的总平方和。

与OLS 中的情况不同,由于IV 的SSR 实际上可能大于SST 。IV 估计中2R 的可能为负数,尽管报告IV 估计的2R 不会有什么害处,但也不很有用。当x 与u 相关时,我们不能将y 的方差分解成)(V ar )(V ar 21u x +β,因此对2

R 没有合理的解释。另外,正如我们将在第15.3节中讨论的,这些2R 不能以通常的方法用于计算联合约束的F 检验值。

如果我们的目标是要得出最大的2R ,我们将总是用OLS 。IV 法是打算当x 与u 相关时,为x 在其余条件不变情况下对y 的影响提供更好的估计值;拟合优度不是考虑的因素。如果我们不能对1β进行一致性估计,从OLS 中得出高的2R 也不会让人感到欣慰。

15.2 多元回归模型的IV 估计

简单回归模型的IV 估计量容易延伸至多元回归的情形。我们从仅有一个解释变量与误差相关的情形开始。实际上,考虑两个解释变量条件下的标准线性模型:

.1122101u z y y +++=βββ (15.22) 我们称之为结构方程(structural equation ),以强调我们的兴趣在于j β ,这仅仅意味着此方程应该测量一个因果关系。在此我们用一个新的符号来区分内生变量与外生变量(exogenous variables )。因变量1y 显然是内生的,它与1u 相关。变量2y 和1z 是解释变量,1u 是误差。通常,我们假定1u 的期望值为0:0)(E 1=u 。

我们用1z 表示该变量在(15.22)中是外生的(1z 与1u 不相关)。我们用2y 表示该变量被怀疑与1u 相关。我们没有详细地说明为什么2y 与1u 相关,但现在最好认为1u 包含一个与2y 相关的遗漏变量。方程(15.22)中的符号源自于联立方程模型(我们将在第16章中讨论),但我们把它更广泛地用于多元回归模型中,目的是容易区分外生变量和内生变量。

(15.22)的一个例子是:

,)log(1210u er exp educ wage +++=βββ (15.23) 其中)log(1wage y =,educ y =2,er exp z =1。换句话说,我们假定exper 在(15.23)中是外生的,但我们允许educ ——由于通常的原因——与1u 相关。

我们知道,如果用OLS 估计(15.22),所有的估计量将是有偏而非一致性的。这样,我们采用前一节中建议的策略,寻找2y 的工具变量。因为假定了1z 与1u 不相关,我们能否假定2y 与1z 相关而将1z 用作2y 的工具呢?答案是不能。既然1z 自身作为解释变量出现在(15.22)中,它就不能用作2y 的工具变量。我们需要另外一个外生变量——称之为2z ——它不出现在(15.22)中。因此,关键的假定是1z 、2z 与1u 不相关;我们还假定1u 具有零均值,当方程包含截距时,这并不失普遍性。

0,),Cov( ,0)(E 111==u z u 和0.),Cov(12=u z (15.24) 给定零均值的假定,后两个假定等价于0)(E )(E 1211==u z u z ,因而按照矩法的意思是求解(15.24)的对

应样本方程来获得0

?β、1?β和2?β: .0)???(0)???(0)???(11221012

1

12210111

1

22101∑∑∑====---=---=---n i i i i i n i i i i i n i i i i z y y z

z y y z

z y y

βββββββββ (15.25) 这是关于三个未知量0

?β、1?β和2?β的三线性方程组,给定1y 、2y 、1z 和2z 的数据,它很易于求解。这些估计量叫做工具变量估计量。如果我们认为2y 是外生的,并选择22y z =,方程(15.25)恰恰是OLS 估计量的一阶条件;参见方程(3.13)。

我们仍需要工具变量2z 与2y 相关,可是这两个变量必须相关的含义因(15.22)中存在1z 而变得复杂。我们现在需要从偏相关的角度来表述这一假定。表述该条件最容易的方法是将内生解释变量写成关于外生变量和误差项的一个线性函数:

,2221102v z z y +++=πππ (15.26) 其中,定义

0,),Cov( 0,),Cov( ,0)(E 22212===v z v z v

j π是未知参数。关键的识别条件 [除了(15.24)之外] 是

.02≠π (15.27) 换句话说,排除了1z 的影响后,2y 与2z 仍然相关。该相关可正可负,但不为0。检验(15.27)是容易的:我们通过OLS 估计(15.26),并运用t 检验(也许要把它变换成即使出现异方差也能适用的、所谓对异方差性强健的t 检验)。我们应当时常检验这一假定。不幸的是,我们不能检验1z 和2z 与1u 不相关;这一点必须不加怀疑地接受。

方程(15.26)是诱导型方程(reduced form equation )的一个例子,它意味着我们是用外生变量来表述内生变量的。这个名称源自于联立方程模型——我们将在下一章中进行研究——但是每逢我们有内生解释变量,它都是一个有用的概念,帮助我们把它和结构方程(15.22)区分开来。

在模型中增添更多的外生解释变量(exogenous explanatory variables )是简单易行的。将结构模型写成 ,...11122101u z z y y k k +++++=-ββββ (15.28) 其中2y 被认为与1u 相关。令k z 也是一个外生变量,但它不在(15.28)中。因此,我们假定

. ..., 1, 0,),Cov( ,0)(E 12k j u z u j === (15.29)

2y 的诱导型是

,...2111102v z z z y k k k k +++++=--ππππ (15.30) 我们需要k z 与2y 之间存在某些偏相关:

.0≠k π (15.31) 在(15.29)和(15.31)中的假定下,k z 是2y 的一个有效的IV 。(我们不关心其余的j π;它们可能部分或全部为0。)考虑11 ..., ,-k z z 可用作它们自身的IV 是合理的;因此,外生变量系列常常叫做工具变量系列。一个次要的补充假定是,外生变量之间不存在完全线性关系;这类似于OLS 情况下的非完全共线性假定。

对于标准的统计推断,我们需要假定1u 具有同方差性。第15.3节中我们将在更一般的环境下仔细地表述这些假定。

例15.4 用邻近大学作为教育的IV

Card (1995)利用1976年的工资和教育的一个男性样本数据来估计教育回报。他运用这样一个虚拟变量作为教育的工具变量,即是否在一所四年制大学的附近长大(nearc4)。在一个)log(wage 方程中,还引进了其它的标准控制变量:经验、黑人的虚拟变量、居住在大城市及其郊区(SMSA )和居住在南方的虚拟变量,一整套地域性的虚拟变量以及1966年在何处居住的SMSA 虚拟变量。为了nearc4成为一个有效的工具,它必须与工资方程中的误差项不相关——我们假定如此——且必须与educ 偏相关。为验证后一个所需条件,我们将educ 对nearc4及方程中出现的所有外生变量做回归。(那就是说,我们估计educ 的诱导型。)利用CARD. RAW 中的数据,以缩写形式我们获得:

.

477. 3,010, (.034) (.088) (0.24) ...413.4320. 64.16?2==+-+=R n exper nearc uc d

e (15.32)

表15.1 因变量:)log(wage

我们的兴趣在于nearc4的系数及其t 统计量。其系数意味着,在其他因素(经历、种族、地域等)固定的情况下,曾于1966年住在大学附近的人1976年所受的教育比不在大学附近长大的人平均多出约3

1,nearc4的t 统计量是3.64,其对应的p 值在小数点后的前三位数字均为0。因此,如果nearc4与误差项中未观测到的因素不相关,我们就可以用nearc4作为educ 的IV 。

OLS 和IV 估计值由表15.1给出。有趣的是,教育回报的IV 估计值将近是OLS 估计值的两倍,而IV 估计值的标准误却比OLS 的标准误大18倍还多。IV 估计值的95%置信区间是从.024到.239,这是一个很宽的范围。当我们认为educ 是内生的时,我们要得到教育回报的一致性估计量所必须付出的代价将是更大的置信区间。

正如前面讨论的,我们会认为在IV 估计中,较小的2R 并不奇怪:按照定义,由于OLS 使残差平方和最小化,OLS 的2R 将总是大一些。

15.3 两阶段最小二乘

在前一节中,我们假定有单一的内生解释变量(2y ),和2y 的一个工具变量。可往往我们有不只一个的外生变量,它们被排斥在结构模型之外,且可能与2y 相关,这意味着它们是2y 的有效的IV 。在本节中,我们讨论如何运用复工具变量。

单一内生解释变量

重新考虑结构模型(15.22),它有一个内生和一个外生解释变量。假定现在我们有两个被排斥在(15.22)之外的外生变量:2z 和3z 。2z 和3z 不出现在(15.22)中,且与误差项1u 不相关的诸假定称为排斥性约束(exclusion restrictions )。

如果2z 和3z 都与2y 相关,我们就可仅用任一个变量作为IV ,如同前一节那样。但这样一来,我们将有两个IV 估计量,而一般地说没有一个会是有效的。由于1z 、2z 和3z 各自与1u 不相关,它们的任何线性组合也与1u 不相关,因此,外生变量的任何线性组合都是有效的IV 。为寻找最好的IV ,我们选择与2y 最高度相关的线性组合。这正是由2y 的诱导型方程所给出的。写

.233221102v z z z y ++++=ππππ (15.33) 其中

0.),Cov( 0,),Cov( 0,),Cov( ,0)(E 2322212====v z v z v z v

那么,2y 最好的IV (在本章附录中给出的假定下)是(15.33)中j z 的线性组合,我们称之为*

2y :

.33221102z z z y ππππ+++=* (15.34)

为了使该IV 与1z 不是完全相关,我们需要2π或3π之中至少一个不为0:

02≠π或.03≠π (15.35) 一旦我们假定j z 全部都是外生的,这便是关键的识别假定。(1π的值是不相干的。)如果02=π且03=π,结构方程(15.22)将不被识别。我们可以运用F 统计量,检验0 :H 20=π与03=π,其对立假设为(15.35)。

以一个有用的方式来考虑(15.33),将2y 分成两部分。第一部分是*2y ,这是2y 中与误差项1u 不相关的部分。第二部分是2v ,它可能与1u 相关——这是为什么2y 可能内生的原因。

已知j z 的数据,假如我们知道总体参数j π,我们可对每次观测计算*2y 。在实践中这根本不真实。然而,正如我们在前一节中所看到的,我们总是可以用OLS 估计诱导型。这样,利用样本,我们将2y 对1z 、2z 和3z 回归,获得拟合值:

.?????33221102z z z y ππππ+++= (15.36)

(就是说,对每个i ,我们有2?i y )。现在,我们将证实在(15.33)中2z 与3z 以一个相当小的显著水平(不

大于5%)联合显著。如果2z 与3z 在(15.33)中不是联合显著的,做IV 估计是在浪费时间。

一旦我们有了2?y

,我们便可以用它作为2y 的IV 。用于估计0β、1β和2β的三个方程是(15.25)中的前两个方程,和代替第三个方程的

.0)???(?11

221012∑==---n i i i i i z y y y

βββ (15.37) 求解关于三个未知量的三个方程,我们得到IV 估计量。

在复工具条件下,IV 估计量也叫做两阶段最小二乘(2SLS )估计量(two stage least squares (2SLS)

estimator )。原因很简单。运用OLS 代数,可以说明当我们用2?y 作为2y 的IV 时,IV 估计值0

?β、1?β和2?β等同于从

1y 对2?y 和1z (15.38)

的回归中得出的OLS 估计值。换句话说,我们可以通过两阶段来获得2SLS 。第一阶段是做(15.36)中的

回归,我们得到拟合值2?y

。第二阶段是做(15.38)中的OLS 回归。因为我们用2?y 代替了2y ,2SLS 估计值与OLS 估计值有实质上的差异。

一些经济学家喜欢这样来解释(15.38)中的回归:拟合值2?y

是*2y 的估计形式,*

2y 与1u 不相关。因此,2SLS 在做(15.38)的OLS 回归之前先“清除” 2y 中与1u 的相关。这一说法,可通过将222v y y +=*代

入(15.22)中,发现其正确性:

.211122101v u z y y ββββ++++=* (15.39)

现在合成误差211v u β+有零均值,且与*

2y 和1z 不相关,这就是OLS 估计有效的原因。

大多数计量经济学的软件包对2SLS 有专门的指令,所以无需明确地分两阶段进行。实际上,在大多数情况下,你应当避免用手工来做第二阶段的工作,因为以这样的方法获得的标准误和检验统计量是不正确的。[ 原因是(15.39)中的误差项包括2v ,但标准误只包括1u 的方差。] 任何支持2SLS 的回归软件要求有因变量、解释变量(内生和外生)和整个工具变量的表列(即所有的外生变量)。其结果典型地说十分类似于OLS 的结果。

在2y 有单一IV 的模型(15.28)中,第15.2节得出的IV 估计量等同于2SLS 估计量。因此,当我们对每个内生解释变量有一个IV 时,我们可称估计方法为IV 或2SLS 。

增添更多外生变量,方法上也没有什么变化。例如,假定工资方程为

,)log(123210u er exp er exp educ wage ++++=ββββ (15.40) 其中1u 与exper 和 exper 2

均不相关。假定我们还认为母亲和父亲的教育与1u 不相关。那么我们可以将它们都用作educ 的IV 。educ 的诱导型方程为

,2432210v fatheduc motheduc er exp er exp educ +++++=πππππ (15.41) 识别的要求是03≠π或04≠π(或两个都非零)。

例15.5 职业女性的教育回报

用MROZ. RAW 中的数据估计方程(15.40)。首先,我们在(15.41)中用F 检验来检验0 :H 30=π,04=π。结果是F = 55.40,p 值 = .0000。正如所预期的,educ 与父母的教育(偏)相关。

当我们用2SLS 估计(15.40)时,我们获得的方程形式为:

.

136. ,428 (.0004)

(.013) (.031) (.400) 0009.044.061. 048.)?log(2==-++=R n exper exper educ ge a

w 2 所估计的教育回报约为6.1%,相比OLS 估计值约为10.8%。由于它相对大的标准误,在对应着双侧对立假设的5%的显著水平上,2SLS 估计值几乎不显著。

本章附录中给出了2SLS 需要的假定,它们使得2SLS 具备所希望的大样本性质。但在此进行简要的概述是有用的。如果我们写出如(15.28)中的结构方程

,...11122101u z z y y k k +++++=-ββββ (15.42)

然后我们假定每个j z 与1u 不相关。另外我们至少需要一个与2y 偏相关的外生变量不在(15.42)之中。这保证了一致性。为了使通常的2SLS 标准误和t 统计量渐近有效,我们还需要一个同方差性的假定:结构误差1u 的方差不会与任何外生变量有关。对于时间序列上的应用,我们需要更多的假定,这将在第15.7节中看到。

多重共线性与2SLS

在第3章中,我们介绍了多重共线性的问题,并说明回归元之间的相关如何导致OLS 估计值具有大的标准误。多重共线性在2SLS 条件下甚至会更严重。要知道为什么,可以把1β的2SLS 估计量的(渐近)方差近似地写为:

,)1(SST 2222R -σ (15.43) 其中)(V ar 12u =σ,2SST 是2?y

中的总变异,22R 是将2?y 对其他所有出现在结构方程中的外生变量做回归得出的2R 。2SLS 的方差大于OLS 的方差的原因有两点。第一,2?y 从结构上看,其变异比2y 小。(记住,

总平方和 = 解释平方和 + 残差平方和;2y 中的变异构成总平方和,而2?y 中的变异构成解释平方和。)第

二,2?y 与(15.42)中外生变量之间的相关往往比2y 与这些变量之间的相关大得多。这在本质上解释了2SLS 中的多重共线性问题。

作为一个实例来考虑例15.4。当educ 对表15.1中的外生变量做回归时,475.2

=R ;这是中等程度的多重共线性,但重要的是educ

β?的OLS 标准误差相当小。当我们获得第一阶段的拟合值uc d e ?,并将它们对表15.1中外生变量做回归时,995.2

=R ,这表明uc d e ?与表中其余的外生变量之间有很高程度的多重共线性。(这个高的2

R 并不太令人吃惊,因为uc d e ?是关于表15.1中所有外生变量和nearc4的一个函数。)方程(15.43)表明,接近1的2

2R 可导致2SLS 估计值有非常大的标准误。然而如在OLS 条件下一样,大样本容量可帮助抵消大的22R 。

多个内生解释变量

两阶段最小二乘也可以用于不只一个内生解释变量情形下的模型中。例如,考虑模型

,1352413322101u z z z y y y ++++++=ββββββ (15.44) 其中0)(E 1=u ,1u 与1z 、2z 和3z 不相关。变量2y 和3y 是内生解释变量:每个都可能与1u 相关。

为了用2SLS 估计(15.44),我们需要至少两个外生变量,它们不出现在(15.44)中,但与2y 和3y 相

关。假定我们有两个被排斥的外生变量,即4z 和5z 。然后,根据我们对单一内生解释变量的分析,我们需要4z 或者5z 出现在2y 和3y 的诱导型中。(与前面一样,我们可以用F 统计量来检验。)尽管这对于识别是必要的,但不幸的是,它不是充分的。假定4z 出现在每个诱导型中,而5z 在两个中都没有出现。那么,我们并不是真正的有两个外生变量与2y 和3y 偏相关。两阶段最小二乘不会获取j β的一致性估计量。

一般的说,当我们在回归模型中有不只一个的内生解释变量时,在若干复杂的情况下仍可能不能识别。但是,我们可以容易地表述识别的一个必要条件,叫做阶条件(order condition )。

方程识别的阶条件:我们需要被排斥的外生变量至少与结构方程中包括的内生解释变量一样多。验证阶条件是简单的,因为它只须数一数内生和外生变量的个数。识别的充分条件称为秩条件(rank condition )。我们在前面已见到不少秩条件的特例——例如,围绕方程(15.35)的讨论。对秩条件的一般表述需要矩阵代数,超出了本书的范围。[参见Wooldridge (1999,第五章)。]

2SLS 估计后对多个假设的检验

在一个用2SLS 来估计的模型中,检验多个假设时我们必须小心。正如我们在第4章中OLS 条件下所学过的,运用残差平方和或F 统计量的2R 形式是很吸引人的,。然而,2SLS 中的2

R 可能为负数的事实表明,通常计算F 统计量的方法可能不适合;现在就遇到了这个问题。实际上,如果我们用2SLS 残差去计算受约束和无约束模型的SSR ,不能保证ur r SSR SSR ≥;如果反之成立,F 估计量将为负数。

有可能将第二阶段回归 [例如(15.38)] 得出的残差平方和与ur SSR 结合起来,以获得一个在大样本下近似服从F 分布的统计量。因为许多计量经济学软件包中有使用简单的检验指令,它们可用于检验2SLS 估计后的多个假设,这里不作详细介绍。Davidson 与Mackinnon (1993)和Wooldridge (1999,第五章)含有如何计算2SLS 的F 型统计量的讨论。

15.4含误差的变量问题的IV 解

在前一节中,我们提出用工具变量作为解决遗漏变量问题的方法,然而它们也能用于处理测量误差的问题。为了说明,考虑模型

.22110u x x y +++=*βββ (15.45)

其中y 和2x 是可观测到的,而*1x 则观测不到。令1x 是*1x 的一个可观测到的度量:111e x x +=*

,其中1e 是测量误差。在第9章中,我们说明了1x 与1e 之间的相关导致了OLS 的有偏和非一致性,这里用1x 代替了*1x 。写出下式,就可以看到这一点

).(1122110e u x x y ββββ-+++= (15.46) 如果经典的含误差变量(CEV )的假定成立,1β的OLS 估计量有朝零偏误。没有进一步的假定,我们对此毫无办法。

在一些情况下,我们可以用IV 方法来解决测量误差问题。在(15.46)中,我们假定u 与*1x 、1x 和2x 不相关;在CEV 的情况下,我们假定1e 与*1x 和2x 不相关。这些意味着2x 在(15.46)中是外生的,可是1x 与1e 相关。我们所需的是1x 的IV 。这样的IV 必须与1x 相关,与u 不相关——从而它必须被排斥在(15.45)之外——并且与测量误差1e 不相关。

一种可能是获取*1x 的第二个度量,即1z 。既然影响y 的是*

1x ,假定1z 与u 不相关是自然不过的了。如果我们写成111a x z +=*,其中1a 是1z 的测量误差,那么我们必须假定1a 与1e 不相关。换句话说,1x 和1z 都错误地测量了*1x ,但它们的测量误差不相关。当然,1x 和1z 通过对*1x 的相依而相关,因而我们可以用1z 作为1x 的IV 。

什么时候我们可以得到一个变量的两个度量呢?有时,当一群工人被问及他们的年薪时,他们的雇主可以提供第二个度量。对于夫妻俩,每一方都可以独立地报告储蓄或家庭收入的水平。第14.3节所引用的Ashenfelter 和Krueger (1994)的研究中,每个双胞胎被问及他的兄弟或她的姊妹所受教育的年数;这给出了第二个度量,它可以在工资方程中用作自我报告的教育的IV 。(Ashenfelter 和Krueger 还结合差分和IV 来解释遗漏变量问题;对此第15.8节中有更多的讨论。)然而一般地说,一个解释变量有两个度量是罕见的。

另一个选择是运用其他外生变量,将它们作为潜在的误测变量的IV 。例如,我们在例15.5中用

motheduc 和fatheduc 作为educ 的 IV ,可以达到该目的。如果我们认为1e educ educ +=*,若motheduc

和fatheduc 与测量误差1e 不相关,那么例15.5中的IV 估计值不会受测量误差的影响。比起假定motheduc 和fatheduc 与能力不相关,而能力却包含在(15.45)的u 中,这可能更加合理。

当运用像测验成绩等去控制未观测到的特征时,也可以用IV 方法。在第9.2节中,我们说明了,在某些假定下,代理变量可用于解决遗漏变量问题。例9.3中,我们用IQ 作为未观测到的能力的代理变量。这仅仅需要在模型中添加IQ 并作一个OLS 回归。但是当IQ 不完全满足代理变量的假定时,存在另一种行之有效的选择。举例说明,将工资方程写成

,)log(23210u abil er exp er exp educ wage +++++=ββββ (15.47)

这里我们又一次看到遗漏变量的问题。可是我们有两种测验成绩作为能力的指标。我们假定成绩可写为

111e abil test +=γ

,212e abil test +=δ

其中01>γ,01>δ。既然影响工资的是能力,我们就可以假定1test 和2test 与u 不相关。如果我们根据第一种测验成绩写出abil ,并将之代入(15.47),我们得到

),( )log(11112

3210e u test er exp er exp educ wage ααββββ-+++++= (15.48) 其中111γα=。现在,如果我们假定1e 与(15.47)中包括abil 在内的所有解释变量不相关,那么1e 与1test 必须相关。[注意到educ 在(15.47)中不是内生的;而1test 是。] 这意味着用OLS 估计(15.48)将得到j β(和1α)的非一致性估计量。在我们所做的假定下,1test 不满足代理变量的假定。

如果我们假定2e 也与(15.47)中的所有解释变量不相关,并且1e 与2e 不相关,那么1e 与第二种测验成绩2test 不相关。因此,2test 可用作1test 的IV 。

例15.6 用两种测验成绩作为能力的指标

我们利用W AGE2. RAW 中的数据实施前面的程序,其中IQ 起着第一种测验成绩的作用,KWW (工作领域中的知识)是第二种测验成绩。解释变量与例9.3中的一样:educ 、exper 、tenure 、married 、south 、urban 和black 。我们不是像表9.2第(2)列中那样添加IQ 做OLS ,而是添加IQ ,并用KWW 作为它的工具。educ 的系数是.025(se = .017)。这是个低的估计值,且在统计上无异于零。该发现是令人费解的,它表明我们的诸假定之一不成立的;也许1e 与2e 相关。

15.5 内生性检验与检验过度识别约束

在本节中,我们根据工具变量估计来描述两个重要的检验。

内生性检验

当解释变量是外生的时,2SLS 估计量不如OLS 有效;正如我们已看到的,2SLS 估计值会有非常大的标准误。因此,检验一个解释变量的内生性是有用的,它说明了2SLS 甚至是否必要。获取这样的检验相当简单。

举例说明,假定我们有单一的被怀疑的内生变量,

,123122101u z z y y ++++=ββββ (15.49) 其中1z 和2z 是外生的。我们有另外两个外生变量,3z 和4z ,它们不出现在(15.49)中。如果2y 与1u 不相

关,我们该用OLS 估计(15.49)。对此我们如何检验呢?Hausman (1978)建议直接比较OLS 和2SLS 估计值,判断其差异是否在统计上显著。毕竟,如果所有变量外生,OLS 和2SLS 都是一致性的。如果2SLS 与OLS 的差异显著,我们断定2y 必定是内生的(j z 保持外生性)。

计算OLS 和2SLS ,看估计值是否实际上有差异,这是个好主意。为了判断差异是否在统计上显著,用回归来检验更容易。这是以估计2y 的诱导型为基础的,此时诱导型为

.24433221102v z z z z y +++++=πππππ (15.50) 现在,因为各个j z 与1u 不相关,所以2y 与1u 不相关当且仅当2v 与1u 不相关;这是我们希望检验的。写成1211e v u +=δ,其中1e 与2v 不相关,且有零均值。那么,1u 与2v 不相关当且仅当01=δ。检验这一点最容易的方法是将2v 作为添加的回归元包括在(15.49)中,做t 检验。这么做唯一的问题是:2v 不能被观测

到,因为它是(15.50)中的误差项。可是因为我们能用OLS 估计2y 的诱导型,我们可以获取诱导型残差2?v

。因此,我们用OLS 估计

error v z z y y +++++=2123122101?δββββ (15.51)

并用t 统计量检验0:H 10=δ。如果我们以一个小的显著水平拒绝0H ,我们因2v 与1u 相关推断出2y 是内生的。

例15.7(职业女性的教育回报)

通过仅利用职业女性的数据估计诱导型(15.41),从中获得残差2?v

,并将它们包括在(15.40)中,我们可以检验(15.40)中educ 的内生性。当我们这么做时,2?v

的系数058.?1=δ,且67.1=t 。它是1u 与2v 之间适度正相关的证据。同时报告两个估计值也许是个好主意,因为教育回报的2SLS 估计值(6.1%)远低于OLS 估计值(10.8%)。

单一解释变量的内生性检验

(i )通过将2y 对所有的外生变量(包括那些在结构方程中和另外的IV )做回归估计它的诱导型。获得残差2?v

。 (ii )把2?v 添加到结构方程中(其包括了2y ),用OLS 回归检验2?v

的显著性。如果2?v 的系数在统计上异于零,我们推断出2y 确实是内生的。我们也许要用对异方差性强健的t 检验。

第(ii )部分中的回归有一个有趣的特点,所有变量(除了2?v

)的估计值等同于2SLS 估计值。例如,用OLS 估计(15.51)所给出的j

β?等同于方程(15.49)中的2SLS 估计值。这是一个简单的检查方法,得

SPSS数据分析—两阶段最小二乘法

传统线性模型的假设之一是因变量之间相互独立,并且如果自变量之间不独立,会产生共线性,对于模型的精度也是会有影响的。虽然完全独立的两个变量是不存在的,但是我们在分析中也可以使用一些手段尽量减小这些问题产生的影响,例如采用随机抽样减小因变量间的相关性,使其满足假设;采用岭回归、逐步回归、主成分回归等解决共线性的问题。以上解决方法做都会损失数据信息,而且似乎都是采取一种回避问题的态度而非解决问题,当碰到更复杂的情况例如因变量和自变量相互影响时,单靠回避是无法得到正确的分析结果的,那么有没有更好的直接解决问题的方法呢?接下来介绍的 两阶段最小二乘法和路径分析就是解决此类问题比较好的方法。当因变量与自变量存在相互作用时,会直接违反传统回归模型的基本假设,也就无法再使用普通最小 二乘法,解决此类问题的方法是:首先确定和因变量有相互作用的自变量,将这些自变量作为因变量拟合回归方程,该方程中的自变量和原始因变量无关,用这些自变量的估计值代替原值进行分析,由于估计值是根据与原始因变量无关的变量预测而来,因此可以认为这些估计值也和因变量的作用是单向的,从而避免了相互作用的影响,整个过程用了两次最小二乘法,因此成为两阶段最小二乘法。当然,还有三阶或多阶最小二乘法。 两阶段最小二乘法在SPSS中有一个单独的过程: 分析—回归—两阶段最小二乘法 我们通过一个例子来说明其用法 现在想研究受教育年限、种族、年龄对收入的影响,表面上看,可以采用以教育年限、种族、年龄为自变量,收入为因变量的多重线性回归进行分析,但是根据常识,教育年限和收入存在双向的影响,这使得线性模型的基本假定被否定,分析结果可能不正确。此时,我们可以采用二阶段最小二乘法进行分析,为此,我们找到了父亲和母亲的受教育年限这两个变量,以此来估计原始变量的受教育年限,我们把这种在第一阶段用于预测自变量的变量称为工具变量,而被预测的自变量,称为内生变量。

第15章 工具变量与两阶段最小二乘

第15章 工具变量估计与两阶段最小二乘法 在本章中,我们进一步研究多元回归模型中的内生解释变量(endogenous explanatory variable )问题。在第3章中,我们推导出,遗漏一个重要变量时OLS 估计量的偏误;在第5章中,我们说明了在遗漏变量(omitted variable )的情况下,OLS 通常是非一致性的。第9章则证明了,对未观测到的解释变量给出适宜的代理变量,能消除(或至少减轻)遗漏变量偏误。不幸的是,我们不是总能得到适宜的代理变量。 在前两章中,我们解释了存在不随时间变化的遗漏变量的情况下,对综列数据如何用固定效应估计或一阶差分来估计随时间变化的自变量的影响。尽管这些方法非常有用,可我们不是总能获得综列数据的。即使能获得,如果我们的兴趣在于变量的影响,而该变量不随时间变化,它对于我们也几无用处:一阶差分或固定效应估计排除了不随时间变化的变量。此外,迄今为止我们已研究出的综列数据法还不能解决与解释变量相关的随时间而变化的遗漏变量的问题。 在本章中,我们对内生性问题采用了一个不同的方法。你将看到如何用工具变量法(IV )来解决一个或多个解释变量的内生性问题。就应用计量经济学中线性方程的估计而言,两阶段最小二乘法(2SLS 或TSLS )是第二受人欢迎的,仅次于普通最小二乘。 我们一开始先说明,在存在遗漏变量的情况下,如何用IV 法来获得一致性估计量。此外,IV 能用于解决含误差变量(errors-in-variable )的问题,至少是在某些假定下。下一章将证明运用IV 法如何估计联立方程模型。 我们对工具变量估计的论述严格遵照我们在第1篇中对普通最小二乘的推导,其中假定我们有一个来自基本总体的随机样本。这个起点很合人意,因为除了简化符号之外,它还强调了应根据基本总体来表述对IV 估计所做的重要的假定(正如用OLS 时一样)。如我们在第2篇中所示,OLS 可以应用于时间序列数据,而工具变量法也一样可以。第15.7节讨论IV 法应用于时间序列数据时出现的一些特殊问题。在第15.8节中,我们将论述在混合横截面和综列数据上的应用。 15.1 动机:简单回归模型中的遗漏变量 面对可能发生的遗漏变量偏误(或未观测到的异质性),迄今为止我们已讨论了三种选择:(1)我们可以忽略此问题,承受有偏、非一致性估计量的后果;(2)我们可以试图为未观测到的变量寻找并使用一个适宜的代理变量;(3)我们可以假定遗漏变量不随时间变化,运用第`13与14章中的固定效应或一阶差分方法。若能把估计值与关键参数的偏误方向一同给出,则第一个回答是令人满意的。例如,如果我们能说一个正参数(譬如职业培训对往后工资的影响)的估计量有朝零偏误 ,并且我们找到了一个统计上显著的正的估计值,那么我们还是学到了一些东西:职业培训对工资有正的影响,而我们很可能低估了该影响。不幸的是,相反的情况经常发生,我们的估计值可能在数值上太大了,以致我们要得出任何有用的结论都非常困难。 第9.2节中讨论的代理变量解也能获得令人满意的结果,但并不是总可以找到一个好的代理。该方法试图通过用代理变量取代不可观测的变量,来解决遗漏变量的问题。 另一种方法是将未观测到的变量留在误差项中,但不是用OLS 估计模型,而是运用一种承认存在遗漏变量的估计方法。这便是工具变量法所要做的。 举例来说,考虑成年劳动者的工资方程中存在未观测到的能力的问题。一个简单的模型为: ,)log(210e abil educ wage +++=βββ 其中e 是误差项。在第9章中,我们说明了在某些假定下,如何用诸如IQ 的代理变量代替能力,从而通过以下回归可得到一致性估计量 )log(wage 对IQ educ , 回归

寻找工具变量

我们认为以下真理是不证自明的:制度对经济增长具有很大的促进作用。 当然为了科学性也需要证明一下。考虑两个命题: 1、在控制了其他因素的前提下,由于制度较好的国家通常经济更发达,因此制度对经济增长具有很大的促进作用。 2、在控制了其他因素的前提下,由于中国 1919 年教会学校人数较多的地区通 常经济更发达,因此制度对经济增长具有很大的促进作用。 你可能会觉得,命题 1 显然是合理的,而命题 2,傻逼吗? 但是经济学家会告诉你,命题 2 是合理的,而命题 1 则略显傻逼。 为什么呢? 因为不但制度(更好的产权保护,更加清廉更加民主更加法制等等)影响了经 济发展,经济发展也会影响制度。因此经济和制度之间有一种反向因果关系。 例如美国的陪审团制度,其诉讼成本是巨大的,而对于追求结果的正义并没有 太大帮助(如辛普森案),因此只有财大气粗的美国才能像购买奢侈品一样购 买程序正义。 这种现象叫做内生性,内生性带来的估计是有偏估计。具有内生性的估计有时 候是非常可笑的,例如警察人数通常与犯罪数高度正相关,但是我们无法得出“警察人数增加带来犯罪提升”的因果关系,因此恰恰是因为犯罪较多,人们才 配备了更多的警察。 与直觉相违背的内生性偏差是有害的,而与直觉相一致的内生性偏差更加有害,因为你也不知道你直觉的正确性。这使得经济学家不敢对任何一个简单的回归 妄下断言,而是反复推敲计量模型所代表的真实因果关系。 那么内生性问题如何解决呢? 我们仔细看制度和经济的关系问题。我们用制度的改善来解释经济的提高,但 是经济的提高也有可能反过来影响了制度的改善,所以我们的估计是有偏的。 那么解决的方法就显而易见了,我们寻找一个不被经济的提高而影响的,并且 确实会影响经济的制度因素就好了。而在实际操作中,由于我们找不到这么一 个完美的制度变量,我们通常可以找一个与这个完美的制度变量高度相关的变 量来作为制度的工具变量,从而通过它的变化来间接反映制度对经济的影响。

经济学实证研究路在何方_赵洪春

Journal of Translation from Foreign Literature of Economics ·80·经济学实证研究路在何方? 华中科技大学赵洪春* 1 引言 上世纪八十年代初,Christopher Sims(1980)、David Hendry(1980)和Edward Leamer (1983)对当时的实证经济学提出了尖锐的批评。这些批评都指出当时的实证研究结果难以取信于人。而缺乏可信性的原因,一是对因果关系识别的理解甚少,二是计量推断往往对附设的模型设定和误差项分布不稳健。自那时起,实证经济学在三个方向取得了显著的进展。除了稳健的经济计量推断之外,还有基于设计的实验主义实证研究方法和基于经济学模型的结构性实证研究。尤其是基于设计的实验主义方法已广泛应用于发展、教育、环境经济学、卫生、劳动和公共财政等诸多微观经济学领域的实证研究和政策分析。同时,其在宏观经济学和产业组织中的应用也有若干有益的尝试。①实证经济学的新进展也把对实证经济学的很多思考推向深入。比如,实验主义方法在多大程度上提高了实证经济学的可信度?敏感性分析能否解决有限样本带来的困扰?在结构性实证研究中,如何看待基于回归的计量方法和基于计算的定量方法?这些思考发生的背景是,实证经济学越来越关注如何设计好的实验或者发现有效的自然实验,而与经济学理论渐行渐远,并且引发了很多涉及实证经济学基本问题的争论。②在深入思考之后,人们不禁要问:合理的实证经济学研究方法是什么? 本文在梳理这些思考的基础上发现,这些思考不仅把经济学实证研究推向深入,也为其未来的发展方向提供了新思路。具体而言,首先,基于设计的实验主义方法虽然是回答在具体情境下因果效应是否存在的终极武器,在概念上能够可信地估计平均干预效果,能够回答“有没有”的问题。但是,这种方法本质上独立于经济学理论,无法解答“为什么”的问题。其次,敏感性分析不是解决有限样本带来的问题的终极方案,而更多的实验和自然实验是当前积累可靠信息的必要途径。最后,在结构性实证研究中,基于回归的计量方法需要借助统计相关性沟通模型与数据,而不能直接联系二者。即便某些识别条件是基于理论的,回归分析的估计结果也只是赋予统计相关性以因果性的解释。而基 *作者获美国南加州大学经济学博士学位,现为华中科技大学经济学院经济系讲师。作者电子邮箱:zhaohongchun@https://www.360docs.net/doc/1917145667.html,。作者对王俊杰、张丽娜、马克、刘延洁出色的助研工作表示感谢。本文得到华中科技大学“国家级建设高水平国际化课程”项目的资助。 ①Diamond和Robinson(2010)汇集了许多实验主义方法在历史学中的各种应用。 ②一次争论是Deaton(2009),Heckman和Urzua(2010)对工具变量法的批评,以及Imbens(2010)的回应。另一次争论是Angrist和Pischke(2010)对包括工具变量法在内的实验主义方法的评价,以及Leamer(2010),Keane(2010),Sims(2010),Nevo和Whinston(2010),Stock(2010)的回应和反驳。

Chapter4-工具变量法

第1章 两阶段最小二乘法 在模型的基本假定中,解释变量与误差项正交保证了参数估计量的无偏性和一致性。当这一假定被违背时,称解释变量是内生的。常见的几种情况会导致内生问题:忽略重要的解释变量、变量的测量误差、变量的联立性。工具变量估计是解决解释变量内生问题的基本方法。本章介绍工具变量法和两阶段最小二乘法,以及模型内生性检验和过度识别约束检验等问题。 1.1 变量的内生性 如果模型中的解释变量与误差项出现相关,即(')E =X u 0,称解释变量是内生的。导致解释变量内生性的原因有很多,主要的几个原因包括:模型中忽略了重要的解释变量、变量因果关系的双向性、变量的测量误差等。 模型中出现内生解释变量时,OLS 估计量是不一致的。根据OLS 估计量: 11111?(')(')(')(')(')(')N N -----==+=+β X X X y βX X X u βX X X u (1.1) 由假定Rank(X)=K 和大数定律,样本均值的概率极限等于总体均值,可得: 1Plim(')E(')N -=≡X X X X A , 1Plim(')E(')N -=≠X u X u 0。 (1.2) 又由Slustky 定理,

111Plim(')N ---=X X A 1?Plim E(')-=+≠β βA X u β (1.3) 1.2 工具变量估计 1.2.1 工具变量 在如下模型中, y = X + u 第i 个解释变量x i 为内生解释变量。如果存在变量z ,z 满足如下两个条件: 正交条件:与u 不相关,即cor(z, u) = 0 相关条件:与x 相关,即cor(z, x i ) 0,也称为识别约束条件。 那么,z 被称作x i 的工具变量。 1.2.2 工具变量估计 设回归模型为: y =X β+u (1.4) 其中,解释变量为X (1×K )工具变量为Z (1×K )。Z 作为工具变量满足正交条件和识 别约束条件。在正规方程组?'()-=X y X β 0中,用Z 替换X , ?'()-=Z y X β 0 (1.5)

多元化与归核化战略转换及其价值效应

第5期(总第354期)2013年5月 财经问题研究 ResearchOnFinancialandEconomicIssues Number5(GeneralSefiMNo.354) May,2013 多元化与归核化战略转换及其价值效应 孙戈兵1’2,胡培1 (1.西南交通大学经济管理学院,四川成都610031;2.新疆大学经济管理学院,新疆乌鲁木齐830046) 摘要:多元化和归核化是公司成长过程中相互转换的动态过程,本文将其置于同一框架内分 析相互转换的影响因素及价值效应。运用多项Logit模型进行实证检验表明,多元化和归核化与 公司特质和外部环境显著相关,产业利润率与多元化负相关,产业竞争性与归核化正相关。使 用工具变量法控制多元化与归核化转换引起的联立性偏差后,笔者没有发现多元化折价和归核 化溢价。 关键词:多元化;归核化;战略转换;价值效应 中图分类号:F270.7文献标识码:A文章编号:1000.176X(2013)05-0016-08 一、引言及文献综述 在动态不确定性的竞争环境下,任何战略不可能是一成不变的。给定企业在不同时期呈现出多元化与归核化交替出现的循环转换状况,战略管理领域的学者和企业家对多元化战略的探索已经从“静态竞争观”向“动态竞争观”转化。当前多数文献分别研究多元化或归核化的价值效应,将两者割裂或孤立起来进行研究,尽管少数学者开始研究多元化动态性,但仍然没有对两者之间的交替作用进行实证检验。多数研究认为多元化经营损害公司价值…而归核化经营创造价值嵋J,这似乎意味着公司应该选择归核化而不是多元化,然而,为什么每年多元化经营成功的企业几乎与专业化的企业一样为数众多?那么,考虑多元化与归核化两者间的转换后,还意味着多元化折价而归核化盈利吗?究竟是哪些因素影响多元化和归核化选择呢?这些问题值得我们进一步深入研究和探讨。 本文研究有以下几个特点:(1)扬弃了把多元化与归核化战略割裂或孤立研究的思路,将两者纳入统一的研究体系,应用多项选择模型进一步研究影响多元化和归核化决策的因素。(2)为了考察多元化和归核化动态转化过程,本文构建了反映这些相互转化现象的哑变量。(3)为了控制多元化与归核化相互作用产生的联立性偏差,应用工具变量法,进~步考察多元化和归核化的价值效应。实证检验表明,多元化与归核化本身既不折价也不溢价,是公司常态化的经营战略。 多元化、归核化和公司价值之间的关系一直是国内外战略管理和金融领域研究和争论的焦点,相关理论和实证检验的文献可谓是汗牛充栋,如Hyland和Dihz【31对产生多元化动机的一般特质进行了研究分析,也有学者认为相对低的多元化价值是由于无效的内部资本市场造成的H1,或者是由于更高的代理成本造成【5J。Maksimovic和Phillips使用在一个产业内公司之间竞争优势的均衡分布解释多元化折价MJ。多元化与公司价值之间实证检验结论一般分为三 收稿日期:2013-03-15 基金项目:教育部人文社会科学基金项目“基于粗糙集理论的动态多属性决策方法研究”(11WJC630127) 作者简介:孙戈兵(1970一),男,新疆奎屯人,博士研究生,副教授,主要从事企业理论与应用和战略管理等方面的研究。E.mail:sgb69@163.corn

工具变量法~

工具变量法 一、工具变量法的主要思想 在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。经过变换,新的模型中,随机扰动项的表达式为: 考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (1.1); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)(1.2); 部分调整模型:(1)t t v u γ=-(01γ≤< , 1γ-为调整系数) (1.3)。 t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。 在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代 1t Y -?在这里,一个可行的估计方法就是工具变量法。 在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。 一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y -。 外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关; 了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。 工具变量,顾名思义是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关的随机解释变量(即内生变量)。 满足条件:1)总体无关:工具变量与随机扰动项无关; 2)样本相关:工具变量必须与被它所代替的内生变量高度相关; 3)与模型中其他解释变量不相关,以避免出现多重共线性。 做了替代后,用普通最小二乘法即可得到原回归系数的一致估计量。 二、工具变量法的基本原理

工具变量法

工具变量法 一、工具变量法得主要思想 在无限分布滞后模型中,为了估计回归系数,通常得做法就是对回归系数作一些限制,从而对受限得无限分布滞后模型进行估计。在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好得解决此类问题得思路。经过变换,新得模型中,随机扰动项得表达式为: 考伊克模型: ( ,为衰减率) (1、1); 适应性期望模型:(,为期望系数)(1、2); 部分调整模型:( ,为调整系数) (1、3)。 为原无限分布滞后模型中得扰动项,为变换后得扰动项。 在原模型中得随机扰动项满足经典假设得前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型得随机扰动项由于存在原随机扰动项得滞后项,也就就是说考伊克模型与适应性期望模型得解释变量势必与误差项相关,因此,可能会出现上述两个模型得最小二乘估计甚至就是有偏得这样严重得问题。那么,我们就是否可以找到一个与高度相关但与不相关得变量来替代?在这里,一个可行得估计方法就就是工具变量法。 在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。 一般来说:一个回归模型中得解释变量有得与随机扰动项无关,我们称这样得解释变量为外生变量;而模型中有得解释变量与随机扰动项相关,我们可称这样得解释变量为内生解释变量。内生解释变量得典型情况之一就就是滞后应变量为解释变量得情形,如上述考伊克模型与适应性期望模型中得。 外生解释变量:回归模型中得解释变量与随机扰动项无关; 内生解释变量:回归模型中得解释变量与随机扰动项无关; 了解了内生变量与外生变量得概念,我们接着讨论工具变量法得主要思想:工具变量法与普通最小二乘法就是模型参数估计得两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数得普通最小二乘估计就是非一致得,这时就需要引入工具变量。 工具变量,顾名思义就是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关得随机解释变量(即内生变量)。 满足条件:1)总体无关:工具变量与随机扰动项无关; 2)样本相关:工具变量必须与被它所代替得内生变量高度相关; 3)与模型中其她解释变量不相关,以避免出现多重共线性。 做了替代后,用普通最小二乘法即可得到原回归系数得一致估计量。 二、工具变量法得基本原理 我们分别从简单线性回归模型与多元线性回归模型两方面来具体分析工具变量法得基本原理: 简单线性回归模型 考虑简单线性回归模型(2、1)其中为内生变量。 则其正规方程为:(2、2) 设回归模型中得解释变量与随机扰动项相关,则如前所述,普通最小二乘估计量就是非一致得。现用一个工具变量来代替正规方程中得解释变量,其残差表达式不变。

第8讲工具变量讲解

第8讲单方程工具变量回归(完) OLS能够成立的假设之一是解释变量与扰动项不相关。否则,OLS估计量将是不一致的,即无论样本容量多大,OLS估计量都不会收敛到真实的总体参1,解决方法之一就是本讲介绍数。然而,解释变量与扰动项相关的例子却很多的工具变量法。 从历史上看,工具变量估计和联立方程系统是同时教授的,更老的教科书仅在联立方程中描述工具变量估计。然而在最近的几十年,内生性的处理和工具变量估计已经呈现出更广阔的前景,而对于联立方程完整系统设定的兴趣已经减弱。最新的教材,如Cameron & Trivedi (2005),Davidson & MacKinnon (1993, 2004)和Wooldridge (2010, 2013),把工具变量估计看作现代经济学家的工具包中不可或缺的一部分,用更长的篇幅介绍它,而缩短对联立方程的讨论。 在回归方程中,一个有效(valid)的工具变量应满足以下两个条件: (1)相关性:工具变量与内生解释变量相关; (2)外生性:工具变量与扰动项不相关。 但是,工具变量的这两个条件常常矛盾,即与内生解释变量相关的变量往往与扰动项也相关。故在实践上,寻找合适的工具变量通常比较困难,需要一定的创造性与想象力。寻找工具变量的步骤大致可以分为两步: (1)列出与内生解释变量相关的尽可能多的变量的清单(较容易) (2)从这一清单中剔除与扰动项相关的变量(较困难) 传统的工具变量法一般通过“两阶段最小二乘法”(2SLS)来实现,顾名思义,即作两个回归。可以证明,在扰动项的经典假定下,由2SLS得到的工具变2。这个结论类似于小样本理论中的量线性组合是所有线性组合中最渐近有效的高斯—马尔可夫定理。 第一阶段回归:用内生解释变量对工具变量回归,得到内生解释变量的拟合值。 1在计量经济学中,把所有与扰动项相关的解释变量都称为“内生变量”。2在条件同方差的情况下,最优GMM还原为2SLS,而最优GMM是渐近有效的。 1 第二阶段回归:用被解释变量对第一阶段回归的拟合值进行回归,得到被解释变量的拟合值。 ivregress —Single-equation instrumental-variables regression 命令语法: ivregress estimator depvar [varlist] (varlist= varlist) [if] [in] [weight] [, iv21options]

工具变量法

工具变量法 Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】

工具变量法 一、工具变量法的主要思想 在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。经过变换,新的模型中,随机扰动项的表达式为: 考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)(); 部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) ()。 t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。 在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。那么,我们是否可以找到一个与 1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里,一个可行的估计方法 就是工具变量法。 在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。 一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相

关,我们可称这样的解释变量为内生解释变量。内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y 。 外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关; 了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。 工具变量,顾名思义是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关的随机解释变量(即内生变量)。 满足条件:1)总体无关:工具变量与随机扰动项无关; 2)样本相关:工具变量必须与被它所代替的内生变量高度相关; 3)与模型中其他解释变量不相关,以避免出现多重共线性。 做了替代后,用普通最小二乘法即可得到原回归系数的一致估计量。 二、工具变量法的基本原理 我们分别从简单线性回归模型和多元线性回归模型两方面来具体分析工具变量法的基本原理: 简单线性回归模型

经济学综合(微、宏观及计量经济学)考试大纲

经济学综合(微、宏观及计量经济学)考试大纲总分150分,其中微、宏观经济学占120分,计量经济学占30分。 第一部分:《微观经济学》 一、考试目的 本次考试是南开大学金融学院各专业全日制学术型研究生的入学资格考试之微观经济学部分。 二、考试的性质与范围 微观经济学考试主要测试考生是否理解和掌握微观经济学的基本概念、基本原理和基本方法,是否能够运用相关知识和原理分析问题和解决问题,达到甄别优秀考生以进一步学习金融学的目的。考试范围包括本大纲规定的微观经济学考试内容。 三、考试基本要求 要求考生熟悉基本概念和定理,并系统、深入理解整个微观经济理论的框架和内在逻辑,熟练掌握微观经济学的主要分析方法、工具和手段,理论联系实际,准确、恰当地使用微观经济学专业术语,文字通顺、层次清晰、合乎逻辑地表述和分析经济问题。考生统一用中文答题。 四、考试形式 考试形式采用闭卷考试。试卷结构采用如下题型范围:名词解释题、简答题、计算题和论述题等。 五、考试内容 考试重点内容如下 1.预算约束:预算约束的定义、预算集的性质、预算线的变动、税收、补贴和 配额等经济工具对预算线的影响

2.偏好:偏好的定义、偏好的假设、无差异曲线、边际替代率、良态偏好的定 义性特征 3.效用:效用函数的单调变换、构造效用函数、拟线性偏好、边际效用和边际 替代率的关系 4.选择:消费者的最优选择、需求函数 5.需求:正常商品和低档商品、收入提供曲线和恩格尔曲线、相似偏好、普通 商品和吉芬商品、价格提供曲线和需求曲线、替代品和互补品、反需求函数 6.显示偏好:显示偏好的概念、从显示偏好到偏好 7.斯勒茨基方程:价格变动的替代效应和收入效应、希克斯替代效应 8.需求分析和跨期选择问题:禀赋和需求变动、修正的斯勒茨基方程、劳动供 给、跨期选择的预算约束 9.不确定性条件下的选择:或有消费、期望效用、风险厌恶、风险偏好、风险 中性 10.消费者剩余:消费者剩余的概念、补偿变化和等价变化 11.市场需求:从个人需求到市场需求、弹性、弹性与收益、边际收益曲线、收 入弹性 12.均衡:市场均衡、比较静态分析、税收、税收的转嫁、税收的额外损失、税 收与帕累托效率 13.技术:投入和产出、生产函数、技术的特征、边际产品、技术替代率、边际 产品递减、技术替代率递减、长期和短期、规模报酬 14.利润最大化:利润、不变要素和可变要素、短期利润最大化、长期利润最大 化、反要素需求曲线、利润最大化和规模报酬 15.成本最小化:成本最小化的定义、规模报酬和成本函数、长期成本和短期成 本、沉没成本 16.成本曲线:各种成本概念、各种成本之间的关系 17.厂商供给和行业供给:市场特征、反供给函数、利润和生产者剩余、短期行 业供给和长期行业供给、零利润、不变要素和经济租金、寻租 18.垄断和垄断行为:垄断的定义、线性需求曲线和垄断、成本加成定价、垄断 的低效率、自然垄断、价格歧视的定义、三种价格歧视

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章 工具变量估计与两阶段最小二乘法【圣

第15章 工具变量估计与两阶段最小二乘法15.1复习笔记 一、动机:简单回归模型中的遗漏变量 1.面对可能发生的遗漏变量偏误(或无法观测异质性)的四种选择 (1)忽略遗漏变量问题,承受有偏而又不一致估计量,若能把估计值与关键参数的偏误方向一同给出,则该方法便令人满意。 (2)试图为无法观测变量寻找并使用一个适宜的代理变量,该方法试图通过用代理变量取代无法观测变量来解决遗漏变量的问题,但并不是总可以找到一个好的代理。 (3)假定遗漏变量不随时间变化,运用固定效应或一阶差分方法。 (4)将无法观测变量留在误差项中,但不是用OLS 估计模型,而是运用一种承认存在遗漏变量的估计方法,工具变量法。 2.工具变量法 简单回归模型 01y x u ββ=++其中x 与u 相关: ()Cov 0 ,x u ≠(1)为了在x 和u 相关时得到0β和1β的一致估计量,需要有一个可观测到的变量z,z 满足两个假定: ①z 与u 不相关,即Cov(z,u)=0;

②z 与x 相关,即Cov(z,x)≠0。 满足这两个条件,则z 称为x 的工具变量,简称为x 的工具。 z 满足①式称为工具外生性条件,工具外生性意味着,z 应当对y 无偏效应(一旦x 和u 中的遗漏变量被控制),也不应当与其他影响y 的无法观测因素相关。z 满足②式意味着z 必然与内生解释变量x 有着或正或负的关系。这个条件被称为工具相关性。 (2)工具变量的两个要求之间的差别 ①Cov(z,u)是z 与无法观测误差u 的协方差,通常无法对它进行检验:在绝大多数情形中,必须借助于经济行为或反思来维持这一假定。 ②给定一个来自总体的随机样本,z 与x(在总体中)相关的条件则可加以检验。最容易的方法是估计一个x 与z 之间的简单回归。在总体中,有 01x z v ππ=++从而,由于 ()() 1Cov /ar V ,x z z π=所以式Cov(z,x)≠0中的假定当且仅当10π≠时成立。因而就能够在充分小的显著水平上,相对双侧对立假设110H π≠:而拒绝虚拟假设010H π=:。就能相当有把握地肯定工具z 与x 是相关的。 3.工具变量估计量 (1)参数的工具变量(IV)估计量 参数的识别意味着可以根据总体矩写出1β,而总体矩可用样本数据进行估计。为了根据总体协方差写出1β,利用简单回归方程可得z 与y 之间的协方差为:

第七章_联立方程模型和两阶段最小二乘法

第七章联立方程模型和两阶段最小二乘法 建立一个OBJECT。确定内外生变量: cc=c(1)+c(2)*PP+c(3)*PP(-1)+c(4)*(WP+WG) ii=c(5)+c(6)*PP+c(7)*PP(-1)+c(8)*KK WP=c(9)+c(10)*XX+c(11)*XX(-1)+c(12)*AA INST WG GG TT AA PP(-1) KK XX(-1) C 回归结果: System: KLEINMODEL Estimation Method: Two-Stage Least Squares Date: 07/13/11 Time: 15:29 Sample: 1921 1941 Included observations: 21 Total system (balanced) observations 63

Coefficient Std. Error t-Statistic Prob. C(1) 16.55476 1.467979 11.27725 0.0000 C(2) 0.017302 0.131205

0.131872 0.8956 C(3) 0.216234 0.119222 1.813714 0.0756 C(4) 0.810183 0.044735 18.11069 0.0000 C(5) 20.27821 8.383249 2.418896 0.0192 C(6) 0.150222 0.192534

0.780237 0.4389 C(7) 0.615944 0.180926 3.404398 0.0013 C(8) -0.157788 0.040152 -3.929751 0.0003 C(9) 1.500297 1.275686 1.176070 0.2450 C(10) 0.438859 0.039603

组织控制和组织政治化程度如何影响企业战略绩效

组织控制和组织政治化程度如何影响企业战略绩 效? 组织控制在企业战略管理中发挥着至关重要的作用(Arthur,1994;Cardinal,2001;Turner and Makhija,2006;Brenner and Ambos,2012;Kownatzki et al.,2013)。现有研究通常将组织控制划分为行为控制(Behavior control)和结果控制(Outcome control),并开始探索不同的组织控制类型分别对企业战略绩效的影响(McGrath,2001)。然而,企业战略实施过程中的一个重要因素——组织政治化程度(Organizational politics)却少有考虑。企业战略实施是一个动态调整的过程,不断更新和拓展企业能力以获得更大的变革和绩效。管理层和员工在此过程中自然会调整自身行为,有可能倾向于自利(Kacmar and Carlson,1997),所谓组织政治化行为,进而对企业战略绩效产生重要影响。 基于此,Markus Kreutzer, Jorge Walter, and Laura B. Cardinal于2015年发表在Strategic Management Journal杂志第36卷第9期的论文研究了组织控制与企业战略绩效之间的关系,并考虑了组织政治化程度在其中的调节作用。论文采用调查问卷的方法获取了德国、澳大利亚和瑞士三个国家共184家企业的有效问卷数据(问卷回收率为23.8%),样本企业涉及公共事业、制造业、银行保险业、咨询行业和高科技行业。论文采用李克特七级量表得分衡量企业战略绩效(Strategic initiative performance),涉及11个项目(预算、雇员、目标期限、产品质量、可靠性、成本、效率、用户、服务、销售收入和总体目标);自变量同样采用七级量表得分衡量,包括组织控制和组织政治化程度。其中,组织控制细分为行为控制和结果控制,组织政治化程度细分为管理层政治化程度(Managerial politics)和员工政治化程度(Group politics)。控制变量包括企业三年前的业绩(销售收入和息税前利润)、企业成长经历、新添加的企业成长目标、成长性对盈余的持续影响、企业规模以及所属行业和国家。为了克服潜在的内生性问题,论文还使用工具变量实施两阶段最小二乘回归进行稳健性检验。研究发现:行为控制水平和结果控制水平对企业战略绩效的影响存在着交互作用,即行为控制水平与企业战略绩效之间具有正相关关系,此时,若结果控制水平较高,这种正相关关系更强;行为控制水平和结果控制水平对企业战略绩效的交互作用,在管理层政治化程度较强时更为显著,而员工的政治化程度对此交互作用没有显著影响。 论文主要的创新之处在于:1.本文首次运用实证方法研究了两种组织控

工具变量法的Stata命令及实例

●本实例使用数据集“grilic.dta”。 ●先看一下数据集的统计特征: ●考察智商与受教育年限的相关关系: 上表显示,智商(在一定程度上可以视为能力的代理变量)与受教育年限具有强烈的正相关关系(相关系数为0.51)。 ●作为一个参考系,先进行OLS回归,并使用稳健标准差: 其中expr, tenure, rns, smsa均为控制变量,而我们主要感兴趣的是变量受教育年限(s)。 回归的结果显示,教育投资的年回报率为10.26%,这个似乎太高了。可能的原因是,由于遗漏变量“能力”与受教育正相关,故“能力”对工资的贡献也被纳入教育的贡献,因此高估了教育的回报率。 ●引入智商iq作为能力的代理变量,再进行OLS回归: 虽然教育的投资回报率有所下降,但是依然很高。 ●由于用iq作为能力的代理变量有测量误差,故iq是内生变量, 考虑使用变量(med(母亲的受教育年限)、kww(在“knowledge of the World of Work”中的成绩)、mrt(婚姻虚拟变量,已婚=1)

age(年龄))作为iq的工具变量,进行2SLS回归,并使用稳健的标准差: 在此2SLS回归中,教育回报率反而上升到13.73%,而iq对工资的贡献居然为负值。使用工具变量的前提是工具变量的有效性。 为此,进行过度识别检验,考察是否所有的工具变量均外生,即与扰动项不相关: 结果强烈拒绝所有工具变量均外生的原假设。 ●考虑仅使用变量(med, kww)作为iq的工具变量,再次进行2SLS 回归,同时显示第一阶段的回归结果: 上表显示,教育的回报率为6.08%,较为合理,再次进行过度识别检验: 接受原假设,认为(med,kww)外生,与扰动项不相关。 ●进一步考察有效工具变量的第二个条件,即工具变量与内生变量 的相关性。从第一阶段的回归结果可以看出,工具变量对内生变量具有较好的解释力。更正式的检验如下:

利率传导机制分析SVAR

2009年第3期经济经纬 ECONOM I C S URVEY No.3 2009 利率传导机制分析 周 纲,陈金贤 (西安交通大学国际经济研究所,陕西西安710049) 摘 要:利率问题是金融市场分析和金融管理领域的敏感问题,利率传导反映了货币政策由现行的直接控制型传导机制向间接控制型传导机制的过渡。利率传导机制与宏观经济和微观经济主体的运行密切相关。本文从利率市场化生成制度因素,即货币冲击因子、利率跨业和业内传导特征、利率对实体经济传导和利率传导的经济波动四个方面分析了利率传导机制,并运用结构性VAR模型,对利率变动对实体经济的传导效应进行了实证分析,验证了利率传导在不同利率灵敏度产业中的差异。 关键词:利率传导;金融市场;机制;向量自回归 基金项目:国家社科基金项目(01BJL012)。 作者简介:周 纲(1959-),男,江苏无锡人,博士研究生,西安交通大学国际经济研究所副研究员,研究方向为技术管理、金融经济学;陈金贤(1932-),男,福建福州人,西安交通大学管理学院教授、博士生导师,西安交通大学国际经济研究所所长,博士生导师,研究方向为理论经济学、金融经济学、国际金融学。 中图分类号:F822.0 文献标识码:A 文章编号:1006-1096(2009)03-0124-05收稿日期:2009-01-20 一、引言 利率作为货币政策工具,它对实体经济的影响越来越显著,但利率传导理论的产生与发展时间较短,目前还未形成一个统一的理论体系和分析框架。在已有的文献中,主要针对货币政策、利率市场化以及利率传导效应进行了探讨。夏斌等(2001)分析了中国货币政策的中介目标,提出了货币供应量已经不适应货币中介目标的功能,需要以利率为代表的货币政策工具作为货币中介;万海航(2003)和朱世武等(2003)研究了中国国债利率的期限结构问题,为利率非稳态传导提供了很好的参考;卢宝梅(2002)和吴曙明(1997)探讨了中国基准利率选择标准和基准利率的传导效应,认为市场化利率体系中应采用基准利率-资本市场利率-信贷市场利率-总需求的传导途径,基准利率有效传导的关键环节是金融市场,并且提出以同业拆借利率、再贴现率或国债利率作为基准利率的政策主张;宋玉华等(2007)根据世界经济周期理论,提出了在世界经济周期变化中,贸易、投资和短期资金流动的传导特点、渠道和影响因素,并通过各国货币政策的协动性,对国际金融市场的互动关系进行了实证研究; Marina等(2003)通过对阿根廷、智利和乌拉圭三国利率市场化改革的实证研究,论证了利率市场化改革的制度制约因素,验证了利率体制渐进式改革的制度路径;Jori on等(1991)的研究表明,未来通货膨胀和经济增长是可以通过收益曲线斜率进行解释的;Sikl os等(1997)根据对工业化国家的实证研究发现,当债券到期期限为1年期或更短时,存在更多关于通货膨胀的协积分而不是关于利率的协积分,这个结果表明在欧洲国家的样本中,通货膨胀率的收敛速度要快于名义利率的收敛速度;Estrella等(1997)利用美国、德国和瑞士的数据观察利率期限结构和通货膨胀之间的联系,并且得出利率期限结构有较强的预测1年以至更长时间通货膨胀的能力;Si m等(1992)利用结构性VAR方法通过识别货币政策的外部冲击以及这种冲击对不同经济总量的影响来估计货币政策的产业效应;Fung等(1995)运用VAR模型研究了利率、汇率、产出如何对货币政策冲击做出反应,从而得出货币政策的扩张性冲击导致了利率的下降、产出的增加和本币的贬值,而且货币政策的冲击对短期利率的影响呈显著性和短暂性;Raddatz等(2003)通过对结构性VAR以及识别策略的详尽分析,着重研究了货币政策与产业冲击之间的关系,并以高技术产业作为研究对象,从理论和实证意义上验证了结构性VAR的效能。 本文首先从宏观上把握利率市场化生成的制度因素,在此基础上研究利率传导机制及影响因素,利用扩展的结构性VAR实证研究了利率变动冲击对国民经济相关产业的传导影响,探讨从金融政策协调等方面寻求平缓经济波动的途径。 二、利率市场化的制度变迁因素 利率市场化的制度变迁是利率制度由利率管制向利率

相关文档
最新文档