第15章 工具变量与两阶段最小二乘

第15章 工具变量与两阶段最小二乘
第15章 工具变量与两阶段最小二乘

第15章 工具变量估计与两阶段最小二乘法

在本章中,我们进一步研究多元回归模型中的内生解释变量(endogenous explanatory variable )问题。在第3章中,我们推导出,遗漏一个重要变量时OLS 估计量的偏误;在第5章中,我们说明了在遗漏变量(omitted variable )的情况下,OLS 通常是非一致性的。第9章则证明了,对未观测到的解释变量给出适宜的代理变量,能消除(或至少减轻)遗漏变量偏误。不幸的是,我们不是总能得到适宜的代理变量。 在前两章中,我们解释了存在不随时间变化的遗漏变量的情况下,对综列数据如何用固定效应估计或一阶差分来估计随时间变化的自变量的影响。尽管这些方法非常有用,可我们不是总能获得综列数据的。即使能获得,如果我们的兴趣在于变量的影响,而该变量不随时间变化,它对于我们也几无用处:一阶差分或固定效应估计排除了不随时间变化的变量。此外,迄今为止我们已研究出的综列数据法还不能解决与解释变量相关的随时间而变化的遗漏变量的问题。

在本章中,我们对内生性问题采用了一个不同的方法。你将看到如何用工具变量法(IV )来解决一个或多个解释变量的内生性问题。就应用计量经济学中线性方程的估计而言,两阶段最小二乘法(2SLS 或TSLS )是第二受人欢迎的,仅次于普通最小二乘。

我们一开始先说明,在存在遗漏变量的情况下,如何用IV 法来获得一致性估计量。此外,IV 能用于解决含误差变量(errors-in-variable )的问题,至少是在某些假定下。下一章将证明运用IV 法如何估计联立方程模型。

我们对工具变量估计的论述严格遵照我们在第1篇中对普通最小二乘的推导,其中假定我们有一个来自基本总体的随机样本。这个起点很合人意,因为除了简化符号之外,它还强调了应根据基本总体来表述对IV 估计所做的重要的假定(正如用OLS 时一样)。如我们在第2篇中所示,OLS 可以应用于时间序列数据,而工具变量法也一样可以。第15.7节讨论IV 法应用于时间序列数据时出现的一些特殊问题。在第15.8节中,我们将论述在混合横截面和综列数据上的应用。

15.1 动机:简单回归模型中的遗漏变量

面对可能发生的遗漏变量偏误(或未观测到的异质性),迄今为止我们已讨论了三种选择:(1)我们可以忽略此问题,承受有偏、非一致性估计量的后果;(2)我们可以试图为未观测到的变量寻找并使用一个适宜的代理变量;(3)我们可以假定遗漏变量不随时间变化,运用第`13与14章中的固定效应或一阶差分方法。若能把估计值与关键参数的偏误方向一同给出,则第一个回答是令人满意的。例如,如果我们能说一个正参数(譬如职业培训对往后工资的影响)的估计量有朝零偏误 ,并且我们找到了一个统计上显著的正的估计值,那么我们还是学到了一些东西:职业培训对工资有正的影响,而我们很可能低估了该影响。不幸的是,相反的情况经常发生,我们的估计值可能在数值上太大了,以致我们要得出任何有用的结论都非常困难。

第9.2节中讨论的代理变量解也能获得令人满意的结果,但并不是总可以找到一个好的代理。该方法试图通过用代理变量取代不可观测的变量,来解决遗漏变量的问题。

另一种方法是将未观测到的变量留在误差项中,但不是用OLS 估计模型,而是运用一种承认存在遗漏变量的估计方法。这便是工具变量法所要做的。

举例来说,考虑成年劳动者的工资方程中存在未观测到的能力的问题。一个简单的模型为:

,)log(210e abil educ wage +++=βββ

其中e 是误差项。在第9章中,我们说明了在某些假定下,如何用诸如IQ 的代理变量代替能力,从而通过以下回归可得到一致性估计量

)log(wage 对IQ educ , 回归

然而,假定不能得到适当的代理变量(或它不具备足以获取一致性估计量所需的性质)。这样一来,我们将abil 放入误差项中,留下来的就是简单的回归模型:

,)log(10u educ wage ++=ββ (15.1)

其中u 包含了abil 。当然,如果用OLS 估计方程(15.1),若是educ 与abil 相关,得到的结果将是1β的有偏、非一致性估计量。

最后证明是,假如我们能为educ 找到一个工具变量,我们仍可以根据方程(15.1)来进行估计。为描述该方法,将简单回归模型写成:

,10u x y ++=ββ

(15.2)

其中我们认为x 与u 相关: .0),(Cov ≠u x (15.3) 工具变量法无论x 与u 相关与否都行得通,但是,如果x 与u 不相关,我们应该使用OLS ,其原因我们将在后面看到。

为了获得x 与u 相关时0β和1β的一致性估计量,我们还需要一些另外的信息。这些信息由一个满足某些性质的新变量给出。假定我们有一个可观测到的变量z ,它满足两个假定:(1)z 与u 不相关,即,

.0),(Cov =u z (15.4)

(2)z 与x 相关,即,

.0),(Cov ≠x z (15.5)

我们则称z 是x 的工具变量(instrumental variable )。

有时候,人们把所需条件(15.4)概括为“z 在方程(15.2)中是外生的”。从遗漏变量的角度看,这意味着z 应当对y 无偏效应,也不应当与其它影响y 的因素相关。方程(15.5)意味着z 必然与内生解释变量x 有着正的或负的关系。

对工具变量的两个要求之间有一个非常重要的差别。因为(15.4)是z 与不可观测的误差u 的协方差,我们无法对它进行验证或哪怕是检验:我们必须求助于经济行为或内心感受来维持这一假定。相比之下,给定一个来自总体的随机样本,z 与x 相关(在总体中)的条件则可加以检验。做到这一点最容易的方法是估计一个x 与z 之间的简单回归。在总体中,我们有

.10v z x ++=ππ (15.6) 从而,由于)(V ar ),Cov(1z x z =π,(15.5)中的假定当且仅当01≠π时成立。因而我们就能够以充分小(习惯说充分高——译者)的显著水平(5%或1%)拒绝虚拟假设

0 :H 10=π (15.7) 并接受双侧对立假设0 :H 10≠π。如果真是这样,我们能相当有把握肯定(15.5)是成立的。

对于(15.1)中的log(wage )方程,educ 的工具变量z 必须:(1)与能力(以及其它影响工资的不可观测的因素)不相关,(2)与教育相关。诸如一个人的社会福利登记号的最后一位数字之类的变量,几乎一定满足第一个必需条件:与能力不相关,因为它是随机决定的。然而,该变量与教育不相关,因而是educ

的一个低劣的工具变量。

我们所谓的用于遗漏变量的代理变量因相应的原因成为低劣的IV 。例如,在遗漏能力的log(wage )例子中,abil 的代理变量应该尽可能地与abil 高度相关。而工具变量必须与abil 不相关。因此,尽管IQ 是abil 的一个好的代理变量候选者,它却不是educ 的好的工具变量。

对其它可能的工具变量候选者,这些必需条件更加不确定。劳动经济学家已在工资方程中使用家庭背景变量作为教育的IV 。例如,母亲的教育(motheduc )与孩子的教育是正相关的,这一点通过收集劳动者数据样本并做educ 对motheduc 的简单回归便可以看出来。因此,motheduc 满足方程(15.5)。问题是,母亲的教育也可能与孩子的能力相关(通过母亲的能力和可能通过孩子幼年所受的教养的质量)。

(15.1)中educ 的另一个IV 选择是成长过程中兄弟姊妹的数目(sibs )。一般地说,较多的兄弟姊妹与较低的平均教育水平相联系。这样,如果兄弟姊妹的数目与能力不相关,它可以 充当educ 的工具变量。

再举一个例子,考虑估计逃课对期末考试成绩的因果影响的问题。在一个简单的回归框架中,我们有 ,10u skipped score ++=ββ (15.8) 其中score 是期末考试成绩,skipped 是该学期逃课的总数目。当然,我们可能担心skipped 与u 中其它因素相关:较好的学生可能逃课较少。因而score 对skipped 的简单回归可能不会给我们一个对逃课的因果影响的好的估计。

什么可能是skipped 的好的IV ?我们所需要的是对score 无直接效应,且与学生能力不相关的IV 。同时,该IV 必须与skipped 相关。一个选择是利用住宿区与学校之间的距离。一所大规模的大学中将有部分学生乘车去学校,这也许会增加逃课的可能性(由于恶劣的天气、睡过头等等)。因而,skipped 可能与distance 正相关;这一点可通过skipped 对distance 的回归并作一个t 检验得以验证,正如前面所描述的。

distance 是否与u 不相关?在简单回归模型(15.8)中,u 中的一些因素可能与distance 相关。例如,低收入家庭的学生可能不住在学校;如果收入影响到学生的行为,可能会导致distance 与u 相关。第15.2节说明如何在多元回归的情况下使用IV ,以便其他影响score 的因素能直接地包含在模型中。那么,distance 也许是skipped 的一个好的IV 。如果学生能力有一个好的代理,例如以往学期的累积GPA ,IV 法可能根本就不需要。

现在我们来证明可得到的工具变量能够用于进行方程(15.2)中的一致性参数估计。特别地,我们将说明(15.4)与(15.5)[等价地,(15.4)与(15.7)]中的假定足以识别参数1β。在这一点上,参数的识别(identification )意味着我们可以根据总体矩写出1β,总体矩可用样本数据来估计。为了根据总体协方差写出1β,我们利用方程(15.2):z 与y 之间的协方差为

).,(Cov ),(Cov ),(Cov 1u z x z y z +=β

现在,在(15.4)中0),(Cov =u z 与(15.5)中0),(Cov ≠x z 的假定下,我们可以解出1β为: .)

,(Cov ),(Cov 1x z y z =β (15.9) [注意到如果z 与x 不相关,即0),(Cov =x z ,该简单代数式不成立。] 方程(15.9)表明1β是z 、y 之间的总体协方差除以z 、x 之间的总体协方差的商,这说明了1β被识别。给定一个随机样本,我们用对应样本量来估计总体的量。在分子和分母中约去样本容量后,我们得到1β的工具变量(IV )估计量(instrumental

variables (IV) estimator ):

.))(())((?111∑∑==----=n i i i

n i i i x x z z

y y z z β (15.10) 给定x 、y 和z 的样本数据,很容易获得(15.10)中的IV 估计量。0β的IV 估计量就为:x y 1

0??ββ-=,除了其中的斜率估计量1

?β现在为IV 估计量,它看起来就像OLS 中的截距估计量。 当x z =时,我们获得1β的OLS 估计量决不是偶然的。换句话说,当x 是外生的时,它可用作自身的IV ,IV 估计量等同于OLS 估计量。

大数定律的一个简单应用表明,如果满足(15.4)和(15.5)中的假定,1β的IV 估计量具有一致性:1

1)?plim(ββ=。如果任一个假定不成立,IV 估计量都将是非一致性的(这一点后面将进一步地研究)。IV 估计量的一个特点是:当事实上x 与u 相关——以致确实需要工具变量来估计——它实质上绝不是无偏的。在小样本中,这意味着IV 估计量可能有相当大的偏误,这就是为什么希望有大样本的一个原因。

用IV 估计量做统计推断

已知IV 和OLS 具有类似的结构,我们无需惊讶在大样本容量的情况下IV 估计量近似服从正态分布。为了对1β进行推断,我们需要一个可用于计算t 统计量和置信区间的标准误,通常的方法是增加一个同方差性的假定,这和在OLS 的情况下一样。不过现在,同方差性的假定是以工具变量z ,而不是以内生解释变量x 为条件来表述的。除了前面关于u 、x 和z 的假定之外,我们增加

).(Var )(E 22u z u ==σ (15.11)

可以表明,在(15.4)、(15.5)和(15.11)中的假定下,1

?β的渐近方差为: ,2,22

z

x x n ρσσ (15.12) 其中2x σ是x 的总体方差,2σ是u 的总体方差,2,z x ρ是x 与z 之间的总体相关系数的平方,它告诉我们在总体中x 与z 是怎样的高度相关。如同运用OLS 估计量一样,IV 估计量的渐近方差以n

1的速度降为0,这里n 是样本容量。

方程(15.12)引起人们兴趣的原因有两点。第一,它提供了一种获得IV 估计量的标准误的方法。(15.12)中的所有的量均可以在给定一个随机样本的情况下进行一致性的估计。为估计2x σ,我们简单地计算出i x 的样本方差;为估计2,z x ρ,我们可以做i x 对i z 的回归来获得2R ,即2,z x R 。最后,为估计2

σ,我们可以运用IV 残差,

...., 2, 1,??? ,10n i x y u i

i i =--=ββ 其中0?β与1?β是IV 估计量。2σ的一致性估计量看起来就像从简单OLS 回归中得出的2

σ估计量: ,?21?122

∑=-=n i i u n σ 其中用自由度进行纠正是标准的做法(即使随着样本容量的增加,这样做几乎不起什么作用)。

1

?β的(渐近的)标准误是所估计的渐近方差的平方根。这个渐近的方差由下式给出: ,SST ?2,2z x x R σ

(15.13)

其中, x SST 是i x 的总平方和。回忆i x 的样本方差是n x SST ,因而约去样本容量我们得到(15.13)。所

得到的标准误可用于构造t 统计量,以检验关于1β的假设,或者是1β的置信区间。0

?β也有一个标准误,我们在此不提。任何现代计量经济学的软件包都会计算出任一IV 估计后的标准误。

在我们给出例子之前,比较IV 和OLS 估计量(当x 与u 不相关时)的渐近方差是有用处的。在高斯-马尔科夫假定下,OLS 估计量的方差为x SST 2σ

,而IV 估计量类似的计算式为2,2SST z x x R ?σ;两者的区别仅在于IV 的方差的分母中出现了2,z x R 。由于2R 总是小于1,这个2SLS 的方差总是大于OLS 的方差

(当OLS 有效时)。如果2,z x R 很小,IV 的方差会比OLS 的方差大得多。记住,2

,z x R 衡量的是样本中x 与z 之间的线性关系的大小。如果x 与z 只是轻度相关,2,z x R 会很小,而这将转化为IV 估计量的一个非常大的

抽样方差。z 越是与x 高度相关,2,z x R 越是接近于1,IV 估计量的方差就越小。在x z =的情况下,12,=z x R ,我们得到OLS 的方差,这正是所预期的。

前面的讨论突出了当x 与u 不相关时进行IV 估计的一个重要代价:IV 估计量的渐近方差总是大于——有时大得很多——OLS 估计量的渐近方差。

例15.1 对已婚女性进行教育的回报估计

我们用MROZ. RAW 中关于已婚职业女性的数据来估计以下简单回归模型的教育回报,

.)log(10u educ wage ++=ββ (15.14) 为了比较,我们首先得到OLS 估计值:

.118. ,428 (.014) (.185)

109. 185.)?log(2==+-=R n educ ge a

w (15.15)

1β的估计值表明,再受一年的教育可得到约11%的回报。

接下来,我们用父亲的教育(fatheduc )作为educ 的工具变量。我们必须认为fatheduc 与u 不相关。第二个必需条件是educ 与 fatheduc 相关。做一个educ 对fatheduc 的简单回归(样本中只有职业女性),我们可以非常容易地验证这一点:

.

173. 428, (.029) (0.28) 269. 24.10?2==+=R n fatheduc uc d

e (15.16)

fatheduc 的t 统计量为9.28,说明educ 与 fatheduc 之间存在统计上显著的正相关。(实际上,fatheduc 解释了样本中educ 的变异中约17%的部分。)用fatheduc 作为educ 的IV ,得:

.

093. ,428 (.035) (.446) 059. 441.)?log(2==+-=R n educ ge a

w (15.17)

教育回报的IV 估计值为5.9%,大约是OLS 估计值的21。这表明OLS 估计值过高,且与遗漏的能力变量的偏误相一致。但我们应该记住,这些都是仅从一个样本中得出的估计值:我们根本不知道0.109是否高于真正的教育回报,或者0.059更接近真正的教育回报。其次,IV 估计量的标准误是OLS 标准误的212倍。(这是我们预期到的,原因已在前面表明)。运用OLS 得出1β的95%置信区间比运用IV 要狭窄得多;事实上,IV 的置信区间确实包含了OLS 估计值。因此,尽管实践中(15.15)与(15.17)之间的差异很大,我们不能说该差异在统计上显著。第15.5节中我们将说明如何对此进行检验。

在前面的例子中,运用IV 估计出的教育回报小于运用OLS 的估计结果,这符合我们的预期。以下的例子将表明这个结果不是必然的。

例15.2 估计对男性进行教育的回报

现在我们再用W AGE2. RAW 来对男性估计教育的回报。我们用sibs (兄弟姊妹的数目)作为educ 的工具变量。它们是负相关的,对此我们可以从以下简单回归中来证实:

.

057. ,359 (.030)

(0.11) 228. 14.14?2==-=R n sibs uc d

e

该方程意味着,每多一个兄弟姊妹,相关联的是一年内所受的教育平均比原来减少约0.23。如果我们假定sibs 与(15.14)中的误差项不相关,那么IV 估计量就具有一致性。用sibs

作为educ 的工具变量估计方程(15.14),得: .

935 (.026)

(0.36) 122. 13.5)?log(=+=n educ ge a

w (2R 计算出为负数,因而我们没有予以报告。后面将从IV 估计的角度对2

R 进行讨论。)相比之下,1β的

OLS 估计值是.059,标准误是.006。与前面的例子不同,现在IV 估计值比OLS 估计值大得多。尽管我们不知道该差异是否在统计上显著,但它不会与OLS 中遗漏的能力变量所造成的偏误相混淆(mesh with )。有可能sibs 也与能力相关:较多的兄弟姊妹意味着平均起来受父母的照料较少,这可能导致较低的能力。另一个解释是,由于educ 中的测量误差,OLS 估计量有朝零偏误。该解释不能完全令人信服,因为educ 未必满足经典的含误差变量模型,这一点我们已在第9.3节中讨论过。

在前面的例子中,内生解释变量(educ )与工具变量(fatheduc ,sibs )均有数量含义。然而,这两类都可以是二值变量。Angrist 和Krueger (1991)在他们最简单的分析中,利用美国的男性人口调查数据,提出了educ 的一个巧妙的二值工具变量。如果该男性是在第一季度出生的,令frstqrt 等于1,否则为0。(15.14)中的误差项——特别是能力——似乎应该与出生季度不相关。但是,frstqrt 还要与educ 相关。事实表明,在基于出生季度的总体中,教育年数确实有系统性差异。Angrist 和Krueger 认为是缘于在各州实行的义务就学法,这很有说服力。简单地说,年初出生的学生往往入学较晚。因此,他们在达到义务教育年龄时(大部分州定为16岁),所受的教育略少于入学较早的学生。Angrist 和Krueger 证实了,对于已完成高中学业的学生来说,受教育年数与出生季度并无关系。

因为教育年数在各出生季度之间的变化仅仅是微乎其微的——这意味着(15.13)中的2

,z x R 非常小——Angrist 和Krueger 需要很大的样本容量来得到一个合理而准确的IV 估计值。利用1920至1929年之间出生的247,199位男性的数据,得出教育回报的OLS 估计值为.0801(标准误为.0004),IV 估计值为.0715(.0219);见于Angrist 和Krueger 的论文中的表III 。注意到OLS 估计值的t 统计量那么大(约为200),然而IV 估计值的t 统计量仅为3.26。因而IV 估计值在统计上不为0,但其置信区间比基于OLS 估计值的置信区间宽得多。

Angrist 和Krueger 有一个有趣的发现:IV 估计值与OLS 估计值相差并不多。实际上,利用下一个十年中出生的男性的数据,得出IV 估计值稍微高于OLS 估计值。对此可以这样解释:说明在用OLS 估计工资方程时不存在遗漏能力的偏误。可是,Angrist 和Krueger 的论文在计量经济学界受到了非难。如同Bound ,Jaeger 和Baker (1995)讨论的那样,它不能明显地判断出生季节与影响工资的诸因素不相关,纵然这些因素没有被人观测到。我们在下一小节中将解释,即使z 与u 之间有少量的相关,也会导致IV 估计量存在严重的问题。

对于政策分析,内生解释变量往往是二值变量。例如,Angrist (1990)研究了,参加越南战争的老兵,其终身收入因参加越战而受到的影响。一个简单模型为:

,)log(10u veteran earns ++=ββ (15.18) 其中veteran 是二值变量。疑问在于,用OLS 估计该方程时,可能存在一个自我选择(self-selection )的问题,这一点我们在第7章中提到过:也许人们因为能从军队中得到最多的收入而选择参军,或者参军的决策与其他对收入有影响的特征相关。这些问题将导致veteran 与u 相关。

Angrist 指出,越南战争的征兵抽签提供了一个自然试验(natural experiment )(亦参见第13章),从而产生了veteran 的一个工具变量。年轻人被分给的征兵抽签号决定了他们是否会被征召去服役于越南战争。因为所分给的号码(毕竟)是随机分配的,征兵抽签号与误差项u 不相关似乎是可信的。而得到号码足够小(指号码小于某个数——译者)的人必须服役于越南战争,使得成为老兵的概率与抽签号相关。如果以上两点都是正确的,征兵抽签号是veteran 的一个好的IV 候选者。

还有可能遇到一个二值的内生解释变量与一个二值的工具变量的情况。作为一个例子,参见习题15.1。

低劣的工具变量条件下IV 的性质

我们已经看到,尽管当z 与u 不相关,而z 与x 存在着正的或负的相关时,IV 是一致性的,但当z 与x 只是弱相关时IV 估计值可能有大的标准误。z 与x 之间的弱相关可能产生甚至是更加严重的后果:即使z 与u 只是适度相关,IV 估计量也会有大的渐近偏误。

当z 与u 可能相关时,通过对IV 估计量的概率极限的分析,就可以看到这一点。利用总体相关和标准差,可以推出:

.),(Corr ),(Corr ?plim 11x

u x z u z σσββ+= (15.19) 其中u σ和x σ分别代表总体中u 和x 的标准差。该方程中引起人们兴趣的是包含相关项的部分。它表明,即使)Corr(z,x 很小,如果)Corr(z,u 也很小,IV 估计量的非一致性会非常大。因此,即使我们只考虑一致性,如果z 与u 之间的相关小于x 与u 之间的相关,使用IV 不一定比OLS 更好。由于

)/(),Cov(),Corr(u x u x u x σσ=,连同方程(5.3)一起,我们可以将OLS 估计量的plim ——称之为1~β—

—写为

.),(Corr ~plim 11x

u u x σσββ+= (15.20) 比较两式,说明当),(Corr ),(Corr /),(Corr u x x z u z <时,IV 就渐近偏误而言比OLS 更可取。

在前面提到的Angrist 和Krueger (1991)的例子中,x 是学校教育的年数,z 是一个指示出生季度的二值变量,z 与x 之间的相关非常小。Bound ,Jaeger 和Baker (1995)讨论了出生季度与u 可能有些相关的原因。从方程(15.19)中,我们看到这将会导致IV 估计量有相当大的偏误。

当z 与x 完全不相关时,无论z 是否与u 不相关,事情尤其糟糕。接下来的例子说明了为什么我们应当时常检查内生解释变量是否与备选的IV 相关。

例15.3 估计吸烟对出生体重的影响

在第6章中,我们估计了吸烟对婴儿出生体重的影响。没有其他的解释变量,模型为:

,)log(10u packs bwght ++=ββ (15.21) 其中packs 是母亲每天吸烟的包数。我们会担心packs 与其它健康因素或者获得良好的产前护理的可能性相关,以致packs 与u 可能相关。packs 的一个可能的工具变量是所居住州的香烟价格cigprice 。我们将假定cigprice 与u 不相关(即使州政府对健康护理的支持可能与香烟税相关)。

如果香烟是典型的消费品,基本的经济理论表明packs 与cigprice 负相关,所以cigprice 可用作packs 的IV 。为验证这一点,我们利用BWGHT. RAW 中的数据,做packs 对cigprice 的回归:

.0006. ,0000. 1,388,

(.0008) (.103) 0003.067.? 22-===+=R R n cigprice ck a

p

这说明怀孕期间吸烟与香烟价格之间没有关系。考虑到吸烟有使人上瘾的特性,该结论可能不会太令人惊讶。

因为packs 与cigprice 不相关,我们不应该在(15.21)中用cigprice 作为packs 的IV ,但如果我们用了会怎么样?IV 的结果将为:

.

1,388

(8.70) (0.91) 99.245.4)?log( =+= n packs ght w

b (所报告的2R 为负数)。packs 的系数极大,而且有一个意想不到的符号。标准误也非常大,因此packs 不是显著的。可是估计值是没有意义的,因为cigprice 不满足我们总可以检验的IV 的一个必需条件,即(15.5)中的假定。

IV 估计后计算2

R 大多数回归软件包运用标准公式SST SSR 12-=R 计算IV 估计之后的2R ,其中SSR 是IV 残差的平方和,SST 是y 的总平方和。

与OLS 中的情况不同,由于IV 的SSR 实际上可能大于SST 。IV 估计中2R 的可能为负数,尽管报告IV 估计的2R 不会有什么害处,但也不很有用。当x 与u 相关时,我们不能将y

的方差分解成)(V ar )(V ar 21u x +β,因此对2

R 没有合理的解释。另外,正如我们将在第15.3节中讨论的,这些2R 不能以通常的方法用于计算联合约束的F 检验值。

如果我们的目标是要得出最大的2R ,我们将总是用OLS 。IV 法是打算当x 与u 相关时,为x 在其余条件不变情况下对y 的影响提供更好的估计值;拟合优度不是考虑的因素。如果我们不能对1β进行一致性估计,从OLS 中得出高的2R 也不会让人感到欣慰。

15.2 多元回归模型的IV 估计

简单回归模型的IV 估计量容易延伸至多元回归的情形。我们从仅有一个解释变量与误差相关的情形开始。实际上,考虑两个解释变量条件下的标准线性模型:

.1122101u z y y +++=βββ (15.22) 我们称之为结构方程(structural equation ),以强调我们的兴趣在于j β ,这仅仅意味着此方程应该测量一个因果关系。在此我们用一个新的符号来区分内生变量与外生变量(exogenous variables )。因变量1y 显然是内生的,它与1u 相关。变量2y 和1z 是解释变量,1u 是误差。通常,我们假定1u 的期望值为0:0)(E 1=u 。

我们用1z 表示该变量在(15.22)中是外生的(1z 与1u 不相关)。我们用2y 表示该变量被怀疑与1u 相关。我们没有详细地说明为什么2y 与1u 相关,但现在最好认为1u 包含一个与2y 相关的遗漏变量。方程(15.22)中的符号源自于联立方程模型(我们将在第16章中讨论),但我们把它更广泛地用于多元回归模型中,目的是容易区分外生变量和内生变量。

(15.22)的一个例子是:

,)log(1210u er exp educ wage +++=βββ (15.23) 其中)log(1wage y =,educ y =2,er exp z =1。换句话说,我们假定exper 在(15.23)中是外生的,但我们允许educ ——由于通常的原因——与1u 相关。

我们知道,如果用OLS 估计(15.22),所有的估计量将是有偏而非一致性的。这样,我们采用前一节中建议的策略,寻找2y 的工具变量。因为假定了1z 与1u 不相关,我们能否假定2y 与1z 相关而将1z 用作2y 的工具呢?答案是不能。既然1z 自身作为解释变量出现在(15.22)中,它就不能用作2y 的工具变量。我们需要另外一个外生变量——称之为2z ——它不出现在(15.22)中。因此,关键的假定是1z 、2z 与1u 不相关;我们还假定1u 具有零均值,当方程包含截距时,这并不失普遍性。

0,),Cov( ,0)(E 111==u z u 和0.),Cov(12=u z (15.24) 给定零均值的假定,后两个假定等价于0)(E )(E 1211==u z u z ,因而按照矩法的意思是求解(15.24)的对

应样本方程来获得0

?β、1?β和2?β: .0)???(0)???(0)???(11221012

1

12210111

1

22101∑∑∑====---=---=---n i i i i i n i i i i i n i i i i z y y z

z y y z

z y y

βββββββββ (15.25) 这是关于三个未知量0

?β、1?β和2?β的三线性方程组,给定1y 、2y 、1z 和2z 的数据,它很易于求解。这些估计量叫做工具变量估计量。如果我们认为2y 是外生的,并选择22y z =,方程(15.25)恰恰是OLS 估计量的一阶条件;参见方程(3.13)。

我们仍需要工具变量2z 与2y 相关,可是这两个变量必须相关的含义因(15.22)中存在1z 而变得复杂。我们现在需要从偏相关的角度来表述这一假定。表述该条件最容易的方法是将内生解释变量写成关于外生变量和误差项的一个线性函数:

,2221102v z z y +++=πππ (15.26) 其中,定义

0,),Cov( 0,),Cov( ,0)(E 22212===v z v z v

j π是未知参数。关键的识别条件 [除了(15.24)之外] 是

.02≠π (15.27) 换句话说,排除了1z 的影响后,2y 与2z 仍然相关。该相关可正可负,但不为0。检验(15.27)是容易的:我们通过OLS 估计(15.26),并运用t 检验(也许要把它变换成即使出现异方差也能适用的、所谓对异方差性强健的t 检验)。我们应当时常检验这一假定。不幸的是,我们不能检验1z 和2z 与1u 不相关;这一点必须不加怀疑地接受。

方程(15.26)是诱导型方程(reduced form equation )的一个例子,它意味着我们是用外生变量来表述内生变量的。这个名称源自于联立方程模型——我们将在下一章中进行研究——但是每逢我们有内生解释变量,它都是一个有用的概念,帮助我们把它和结构方程(15.22)区分开来。

在模型中增添更多的外生解释变量(exogenous explanatory variables )是简单易行的。将结构模型写成 ,...11122101u z z y y k k +++++=-ββββ (15.28) 其中2y 被认为与1u 相关。令k z 也是一个外生变量,但它不在(15.28)中。因此,我们假定

. ..., 1, 0,),Cov( ,0)(E 12k j u z u j === (15.29)

2y 的诱导型是

,...2111102v z z z y k k k k +++++=--ππππ (15.30) 我们需要k z 与2y 之间存在某些偏相关:

.0≠k π (15.31) 在(15.29)和(15.31)中的假定下,k z 是2y 的一个有效的IV 。(我们不关心其余的j π;它们可能部分或全部为0。)考虑11 ..., ,-k z z 可用作它们自身的IV 是合理的;因此,外生变量系列常常叫做工具变量系列。一个次要的补充假定是,外生变量之间不存在完全线性关系;这类似于OLS 情况下的非完全共线性假定。

对于标准的统计推断,我们需要假定1u 具有同方差性。第15.3节中我们将在更一般的环境下仔细地表述这些假定。

例15.4 用邻近大学作为教育的IV

Card (1995)利用1976年的工资和教育的一个男性样本数据来估计教育回报。他运用这样一个虚拟变量作为教育的工具变量,即是否在一所四年制大学的附近长大(nearc4)。在一个)log(wage 方程中,还引进了其它的标准控制变量:经验、黑人的虚拟变量、居住在大城市及其郊区(SMSA )和居住在南方的虚拟变量,一整套地域性的虚拟变量以及1966年在何处居住的SMSA 虚拟变量。为了nearc4成为一个有效的工具,它必须与工资方程中的误差项不相关——我们假定如此——且必须与educ 偏相关。为验证后一个所需条件,我们将educ 对nearc4及方程中出现的所有外生变量做回归。(那就是说,我们估计educ 的诱导型。)利用CARD. RAW 中的数据,以缩写形式我们获得:

.

477. 3,010, (.034) (.088) (0.24) ...413.4320. 64.16?2==+-+=R n exper nearc uc d

e (15.32)

表15.1 因变量:)log(wage

我们的兴趣在于nearc4的系数及其t 统计量。其系数意味着,在其他因素(经历、种族、地域等)固定的情况下,曾于1966年住在大学附近的人1976年所受的教育比不在大学附近长大的人平均多出约3

1,nearc4的t 统计量是3.64,其对应的p 值在小数点后的前三位数字均为0。因此,如果nearc4与误差项中未观测到的因素不相关,我们就可以用nearc4作为educ 的IV 。

OLS 和IV 估计值由表15.1给出。有趣的是,教育回报的IV 估计值将近是OLS 估计值的两倍,而IV 估计值的标准误却比OLS 的标准误大18倍还多。IV 估计值的95%置信区间是从.024到.239,这是一个很宽的范围。当我们认为educ 是内生的时,我们要得到教育回报的一致性估计量所必须付出的代价将是更大的置信区间。

正如前面讨论的,我们会认为在IV 估计中,较小的2R 并不奇怪:按照定义,由于OLS 使残差平方和最小化,OLS 的2R 将总是大一些。

15.3 两阶段最小二乘

在前一节中,我们假定有单一的内生解释变量(2y ),和2y 的一个工具变量。可往往我们有不只一个的外生变量,它们被排斥在结构模型之外,且可能与2y 相关,这意味着它们是2y 的有效的IV 。在本节中,我们讨论如何运用复工具变量。

单一内生解释变量

重新考虑结构模型(15.22),它有一个内生和一个外生解释变量。假定现在我们有两个被排斥在(15.22)之外的外生变量:2z 和3z 。2z 和3z 不出现在(15.22)中,且与误差项1u 不相关的诸假定称为排斥性约束(exclusion restrictions )。

如果2z 和3z 都与2y 相关,我们就可仅用任一个变量作为IV ,如同前一节那样。但这样一来,我们将有两个IV 估计量,而一般地说没有一个会是有效的。由于1z 、2z 和3z 各自与1u 不相关,它们的任何线性组合也与1u 不相关,因此,外生变量的任何线性组合都是有效的IV 。为寻找最好的IV ,我们选择与2y 最高度相关的线性组合。这正是由2y 的诱导型方程所给出的。写

.233221102v z z z y ++++=ππππ (15.33) 其中

0.),Cov( 0,),Cov( 0,),Cov( ,0)(E 2322212====v z v z v z v

那么,2y 最好的IV (在本章附录中给出的假定下)是(15.33)中j z 的线性组合,我们称之为*

2y :

.33221102z z z y ππππ+++=* (15.34)

为了使该IV 与1z 不是完全相关,我们需要2π或3π之中至少一个不为0:

02≠π或.03≠π (15.35) 一旦我们假定j z 全部都是外生的,这便是关键的识别假定。(1π的值是不相干的。)如果02=π且03=π,结构方程(15.22)将不被识别。我们可以运用F 统计量,检验0 :H 20=π与03=π,其对立假设为(15.35)。

以一个有用的方式来考虑(15.33),将2y 分成两部分。第一部分是*2y ,这是2y 中与误差项1u 不相关的部分。第二部分是2v ,它可能与1u 相关——这是为什么2y 可能内生的原因。

已知j z 的数据,假如我们知道总体参数j π,我们可对每次观测计算*2y 。在实践中这根本不真实。然而,正如我们在前一节中所看到的,我们总是可以用OLS 估计诱导型。这样,利用样本,我们将2y 对1z 、2z 和3z 回归,获得拟合值:

.?????33221102z z z y ππππ+++= (15.36)

(就是说,对每个i ,我们有2?i y )。现在,我们将证实在(15.33)中2z 与3z 以一个相当小的显著水平(不

大于5%)联合显著。如果2z 与3z 在(15.33)中不是联合显著的,做IV 估计是在浪费时间。

一旦我们有了2?y

,我们便可以用它作为2y 的IV 。用于估计0β、1β和2β的三个方程是(15.25)中的前两个方程,和代替第三个方程的

.0)???(?11

221012∑==---n i i i i i z y y y

βββ (15.37) 求解关于三个未知量的三个方程,我们得到IV 估计量。

在复工具条件下,IV 估计量也叫做两阶段最小二乘(2SLS )估计量(two stage least squares (2SLS)

estimator )。原因很简单。运用OLS 代数,可以说明当我们用2?y 作为2y 的IV 时,IV 估计值0

?β、1?β和2?β等同于从

1y 对2?y 和1z (15.38)

的回归中得出的OLS 估计值。换句话说,我们可以通过两阶段来获得2SLS 。第一阶段是做(15.36)中的

回归,我们得到拟合值2?y

。第二阶段是做(15.38)中的OLS 回归。因为我们用2?y 代替了2y ,2SLS 估计值与OLS 估计值有实质上的差异。

一些经济学家喜欢这样来解释(15.38)中的回归:拟合值2?y

是*2y 的估计形式,*

2y 与1u 不相关。因此,2SLS 在做(15.38)的OLS 回归之前先“清除” 2y 中与1u 的相关。这一说法,可通过将222v y y +=*代

入(15.22)中,发现其正确性:

.211122101v u z y y ββββ++++=* (15.39)

现在合成误差211v u β+有零均值,且与*

2y 和1z 不相关,这就是OLS 估计有效的原因。

大多数计量经济学的软件包对2SLS 有专门的指令,所以无需明确地分两阶段进行。实际上,在大多数情况下,你应当避免用手工来做第二阶段的工作,因为以这样的方法获得的标准误和检验统计量是不正确的。[ 原因是(15.39)中的误差项包括2v ,但标准误只包括1u 的方差。] 任何支持2SLS 的回归软件要求有因变量、解释变量(内生和外生)和整个工具变量的表列(即所有的外生变量)。其结果典型地说十分类似于OLS 的结果。

在2y 有单一IV 的模型(15.28)中,第15.2节得出的IV 估计量等同于2SLS 估计量。因此,当我们对每个内生解释变量有一个IV 时,我们可称估计方法为IV 或2SLS 。

增添更多外生变量,方法上也没有什么变化。例如,假定工资方程为

,)log(123210u er exp er exp educ wage ++++=ββββ (15.40) 其中1u 与exper 和 exper 2

均不相关。假定我们还认为母亲和父亲的教育与1u 不相关。那么我们可以将它们都用作educ 的IV 。educ 的诱导型方程为

,2432210v fatheduc motheduc er exp er exp educ +++++=πππππ (15.41) 识别的要求是03≠π或04≠π(或两个都非零)。

例15.5 职业女性的教育回报

用MROZ. RAW 中的数据估计方程(15.40)。首先,我们在(15.41)中用F 检验来检验0 :H 30=π,04=π。结果是F = 55.40,p 值 = .0000。正如所预期的,educ 与父母的教育(偏)相关。

当我们用2SLS 估计(15.40)时,我们获得的方程形式为:

.

136. ,428 (.0004)

(.013) (.031) (.400) 0009.044.061. 048.)?log(2==-++=R n exper exper educ ge a

w 2 所估计的教育回报约为6.1%,相比OLS 估计值约为10.8%。由于它相对大的标准误,在对应着双侧对立假设的5%的显著水平上,2SLS 估计值几乎不显著。

本章附录中给出了2SLS 需要的假定,它们使得2SLS 具备所希望的大样本性质。但在此进行简要的概述是有用的。如果我们写出如(15.28)中的结构方程

,...11122101u z z y y k k +++++=-ββββ (15.42)

然后我们假定每个j z 与1u 不相关。另外我们至少需要一个与2y 偏相关的外生变量不在(15.42)之中。这保证了一致性。为了使通常的2SLS 标准误和t 统计量渐近有效,我们还需要一个同方差性的假定:结构误差1u 的方差不会与任何外生变量有关。对于时间序列上的应用,我们需要更多的假定,这将在第15.7节中看到。

多重共线性与2SLS

在第3章中,我们介绍了多重共线性的问题,并说明回归元之间的相关如何导致OLS 估计值具有大的标准误。多重共线性在2SLS 条件下甚至会更严重。要知道为什么,可以把1β的2SLS 估计量的(渐近)方差近似地写为:

,)1(SST 2222R -σ (15.43) 其中)(V ar 12u =σ,2SST 是2?y

中的总变异,22R 是将2?y 对其他所有出现在结构方程中的外生变量做回归得出的2R 。2SLS 的方差大于OLS 的方差的原因有两点。第一,2?y 从结构上看,其变异比2y 小。(记住,

总平方和 = 解释平方和 + 残差平方和;2y 中的变异构成总平方和,而2?y 中的变异构成解释平方和。)第

二,2?y 与(15.42)中外生变量之间的相关往往比2y 与这些变量之间的相关大得多。这在本质上解释了2SLS 中的多重共线性问题。

作为一个实例来考虑例15.4。当educ 对表15.1中的外生变量做回归时,475.2

=R ;这是中等程度的多重共线性,但重要的是educ

β?的OLS 标准误差相当小。当我们获得第一阶段的拟合值uc d e ?,并将它们对表15.1中外生变量做回归时,995.2

=R ,这表明uc d e ?与表中其余的外生变量之间有很高程度的多重共线性。(这个高的2

R 并不太令人吃惊,因为uc d e ?是关于表15.1中所有外生变量和nearc4的一个函数。)方程(15.43)表明,接近1的2

2R 可导致2SLS 估计值有非常大的标准误。然而如在OLS 条件下一样,大样本容量可帮助抵消大的22R 。

多个内生解释变量

两阶段最小二乘也可以用于不只一个内生解释变量情形下的模型中。例如,考虑模型

,1352413322101u z z z y y y ++++++=ββββββ (15.44) 其中0)(E 1=u ,1u 与1z 、2z 和3z 不相关。变量2y 和3y 是内生解释变量:每个都可能与1u 相关。

为了用2SLS 估计(15.44),我们需要至少两个外生变量,它们不出现在(15.44)中,但与2y 和3y 相

关。假定我们有两个被排斥的外生变量,即4z 和5z 。然后,根据我们对单一内生解释变量的分析,我们需要4z 或者5z 出现在2y 和3y 的诱导型中。(与前面一样,我们可以用F 统计量来检验。)尽管这对于识别是必要的,但不幸的是,它不是充分的。假定4z 出现在每个诱导型中,而5z 在两个中都没有出现。那么,我们并不是真正的有两个外生变量与2y 和3y 偏相关。两阶段最小二乘不会获取j β的一致性估计量。

一般的说,当我们在回归模型中有不只一个的内生解释变量时,在若干复杂的情况下仍可能不能识别。但是,我们可以容易地表述识别的一个必要条件,叫做阶条件(order condition )。

方程识别的阶条件:我们需要被排斥的外生变量至少与结构方程中包括的内生解释变量一样多。验证阶条件是简单的,因为它只须数一数内生和外生变量的个数。识别的充分条件称为秩条件(rank condition )。我们在前面已见到不少秩条件的特例——例如,围绕方程(15.35)的讨论。对秩条件的一般表述需要矩阵代数,超出了本书的范围。[参见Wooldridge (1999,第五章)。]

2SLS 估计后对多个假设的检验

在一个用2SLS 来估计的模型中,检验多个假设时我们必须小心。正如我们在第4章中OLS 条件下所学过的,运用残差平方和或F 统计量的2R 形式是很吸引人的,。然而,2SLS 中的2

R 可能为负数的事实表明,通常计算F 统计量的方法可能不适合;现在就遇到了这个问题。实际上,如果我们用2SLS 残差去计算受约束和无约束模型的SSR ,不能保证ur r SSR SSR ≥;如果反之成立,F 估计量将为负数。

有可能将第二阶段回归 [例如(15.38)] 得出的残差平方和与ur SSR 结合起来,以获得一个在大样本下近似服从F 分布的统计量。因为许多计量经济学软件包中有使用简单的检验指令,它们可用于检验2SLS 估计后的多个假设,这里不作详细介绍。Davidson 与Mackinnon (1993)和Wooldridge (1999,第五章)含有如何计算2SLS 的F 型统计量的讨论。

15.4含误差的变量问题的IV 解

在前一节中,我们提出用工具变量作为解决遗漏变量问题的方法,然而它们也能用于处理测量误差的问题。为了说明,考虑模型

.22110u x x y +++=*βββ (15.45)

其中y 和2x 是可观测到的,而*1x 则观测不到。令1x 是*1x 的一个可观测到的度量:111e x x +=*

,其中1e 是测量误差。在第9章中,我们说明了1x 与1e 之间的相关导致了OLS 的有偏和非一致性,这里用1x 代替了*1x 。写出下式,就可以看到这一点

).(1122110e u x x y ββββ-+++= (15.46) 如果经典的含误差变量(CEV )的假定成立,1β的OLS 估计量有朝零偏误。没有进一步的假定,我们对此毫无办法。

在一些情况下,我们可以用IV 方法来解决测量误差问题。在(15.46)中,我们假定u 与*1x 、1x 和2x 不相关;在CEV 的情况下,我们假定1e 与*1x 和2x 不相关。这些意味着2x 在(15.46)中是外生的,可是1x 与1e 相关。我们所需的是1x 的IV 。这样的IV 必须与1x 相关,与u 不相关——从而它必须被排斥在(15.45)之外——并且与测量误差1e 不相关。

一种可能是获取*1x 的第二个度量,即1z 。既然影响y 的是*

1x ,假定1z 与u 不相关是自然不过的了。如果我们写成111a x z +=*,其中1a 是1z 的测量误差,那么我们必须假定1a 与1e 不相关。换句话说,1x 和1z 都错误地测量了*1x ,但它们的测量误差不相关。当然,1x 和1z 通过对*1x 的相依而相关,因而我们可以用1z 作为1x 的IV 。

什么时候我们可以得到一个变量的两个度量呢?有时,当一群工人被问及他们的年薪时,他们的雇主可以提供第二个度量。对于夫妻俩,每一方都可以独立地报告储蓄或家庭收入的水平。第14.3节所引用的Ashenfelter 和Krueger (1994)的研究中,每个双胞胎被问及他的兄弟或她的姊妹所受教育的年数;这给出了第二个度量,它可以在工资方程中用作自我报告的教育的IV 。(Ashenfelter 和Krueger 还结合差分和IV 来解释遗漏变量问题;对此第15.8节中有更多的讨论。)然而一般地说,一个解释变量有两个度量是罕见的。

另一个选择是运用其他外生变量,将它们作为潜在的误测变量的IV 。例如,我们在例15.5中用

motheduc 和fatheduc 作为educ 的 IV ,可以达到该目的。如果我们认为1e educ educ +=*,若motheduc

和fatheduc 与测量误差1e 不相关,那么例15.5中的IV 估计值不会受测量误差的影响。比起假定motheduc 和fatheduc 与能力不相关,而能力却包含在(15.45)的u 中,这可能更加合理。

当运用像测验成绩等去控制未观测到的特征时,也可以用IV 方法。在第9.2节中,我们说明了,在某些假定下,代理变量可用于解决遗漏变量问题。例9.3中,我们用IQ 作为未观测到的能力的代理变量。这仅仅需要在模型中添加IQ 并作一个OLS 回归。但是当IQ 不完全满足代理变量的假定时,存在另一种行之有效的选择。举例说明,将工资方程写成

,)log(23210u abil er exp er exp educ wage +++++=ββββ (15.47)

这里我们又一次看到遗漏变量的问题。可是我们有两种测验成绩作为能力的指标。我们假定成绩可写为

111e abil test +=γ

,212e abil test +=δ

其中01>γ,01>δ。既然影响工资的是能力,我们就可以假定1test 和2test 与u 不相关。如果我们根据第一种测验成绩写出abil ,并将之代入(15.47),我们得到

),( )log(11112

3210e u test er exp er exp educ wage ααββββ-+++++= (15.48) 其中111γα=。现在,如果我们假定1e 与(15.47)中包括abil 在内的所有解释变量不相关,那么1e 与1test 必须相关。[注意到educ 在(15.47)中不是内生的;而1test 是。] 这意味着用OLS 估计(15.48)将得到j β(和1α)的非一致性估计量。在我们所做的假定下,1test 不满足代理变量的假定。

如果我们假定2e 也与(15.47)中的所有解释变量不相关,并且1e 与2e 不相关,那么1e 与第二种测验成绩2test 不相关。因此,2test 可用作1test 的IV 。

例15.6 用两种测验成绩作为能力的指标

我们利用W AGE2. RAW 中的数据实施前面的程序,其中IQ 起着第一种测验成绩的作用,KWW (工作领域中的知识)是第二种测验成绩。解释变量与例9.3中的一样:educ 、exper 、tenure 、married 、south 、urban 和black 。我们不是像表9.2第(2)列中那样添加IQ 做OLS ,而是添加IQ ,并用KWW 作为它的工具。educ 的系数是.025(se = .017)。这是个低的估计值,且在统计上无异于零。该发现是令人费解的,它表明我们的诸假定之一不成立的;也许1e 与2e 相关。

15.5 内生性检验与检验过度识别约束

在本节中,我们根据工具变量估计来描述两个重要的检验。

内生性检验

当解释变量是外生的时,2SLS 估计量不如OLS 有效;正如我们已看到的,2SLS 估计值会有非常大的标准误。因此,检验一个解释变量的内生性是有用的,它说明了2SLS 甚至是否必要。获取这样的检验相当简单。

举例说明,假定我们有单一的被怀疑的内生变量,

,123122101u z z y y ++++=ββββ (15.49) 其中1z 和2z 是外生的。我们有另外两个外生变量,3z 和4z ,它们不出现在(15.49)中。如果2y 与1u 不相

关,我们该用OLS 估计(15.49)。对此我们如何检验呢?Hausman (1978)建议直接比较OLS 和2SLS 估计值,判断其差异是否在统计上显著。毕竟,如果所有变量外生,OLS 和2SLS 都是一致性的。如果2SLS 与OLS 的差异显著,我们断定2y 必定是内生的(j z 保持外生性)。

计算OLS 和2SLS ,看估计值是否实际上有差异,这是个好主意。为了判断差异是否在统计上显著,用回归来检验更容易。这是以估计2y 的诱导型为基础的,此时诱导型为

.24433221102v z z z z y +++++=πππππ (15.50) 现在,因为各个j z 与1u 不相关,所以2y 与1u 不相关当且仅当2v 与1u 不相关;这是我们希望检验的。写成1211e v u +=δ,其中1e 与2v 不相关,且有零均值。那么,1u 与2v 不相关当且仅当01=δ。检验这一点最容易的方法是将2v 作为添加的回归元包括在(15.49)中,做t 检验。这么做唯一的问题是:2v 不能被观测

到,因为它是(15.50)中的误差项。可是因为我们能用OLS 估计2y 的诱导型,我们可以获取诱导型残差2?v

。因此,我们用OLS 估计

error v z z y y +++++=2123122101?δββββ (15.51)

并用t 统计量检验0:H 10=δ。如果我们以一个小的显著水平拒绝0H ,我们因2v 与1u 相关推断出2y 是内生的。

例15.7(职业女性的教育回报)

通过仅利用职业女性的数据估计诱导型(15.41),从中获得残差2?v

,并将它们包括在(15.40)中,我们可以检验(15.40)中educ 的内生性。当我们这么做时,2?v

的系数058.?1=δ,且67.1=t 。它是1u 与2v 之间适度正相关的证据。同时报告两个估计值也许是个好主意,因为教育回报的2SLS 估计值(6.1%)远低于OLS 估计值(10.8%)。

单一解释变量的内生性检验

(i )通过将2y 对所有的外生变量(包括那些在结构方程中和另外的IV )做回归估计它的诱导型。获得残差2?v

。 (ii )把2?v 添加到结构方程中(其包括了2y ),用OLS 回归检验2?v

的显著性。如果2?v 的系数在统计上异于零,我们推断出2y 确实是内生的。我们也许要用对异方差性强健的t 检验。

第(ii )部分中的回归有一个有趣的特点,所有变量(除了2?v

)的估计值等同于2SLS 估计值。例如,用OLS 估计(15.51)所给出的j

β?等同于方程(15.49)中的2SLS 估计值。这是一个简单的检查方法,得

信息技术《有趣的绘画工具》说课稿

信息技术《有趣的绘画工具》说课稿 一、教材分析 《有趣的绘画工具》是省小学信息技术教材第一册(下)的内容,教学对象是小学四年级学生。它是教材关于金山画王2002画图知识的初步认识,并且贯穿着以后整个的画图知识教学,是学生能够顺利、快捷操作使用画图的基础之一,也是形成学生“了解熟悉——基本技能——综合运用”这一合理知识链的必要环节。教材目的是让学生学会金山画王中一些基本操作工具的运用,重点是掌握利用金山画王2002画板下的9种工具的基础操作及利用工具画图。新的工具的学习与使用,对学生充满着挑战,能够让学生在现有的基础上,产生一种求知与创作的冲动。正是这种冲动,也导致了学生内心理想与实际技能的不平衡。因此,探究学习的过程中,学生学习和创作的欲望极其强烈。学生的需要与兴趣就是学生探究的动力和起点。基于此点,从信息课本身的学科特点出发,结合学科课程整合理念,我设计了这一课时,目的在于让学生掌握各种工具的同时,着重培养学生的动手操作,思维能力,自我创新能力,进而唤起学生的生活体验,提高学生的信息素养。拓展信息技术课,只教电脑操作狭隘的课程局面。争取把更多的信息纳入到我们信息课程体系中来。培养学生的综合能力,从而使学生发现美,感觉美,创造美。让他们在无数的失败中寻找成功,感受成功的快乐。 从内容层面出发,对具备一定抽象思维能力和动手操作能力的四年级学生来说并不难,而且也是学生非常感兴趣的东西,因此在课堂上只需坚持精讲多练的原则,重难点知识让学生通过自己探究和小组合作学习等主要学习方式完成,同时结束教师适当个别指导。 二、教学目标 认知目标:让学生熟悉和掌握画板下工具的操作。掌握对工具的综合运用的方法。 能力目标:培养学生如何获取信息、处理信息和应用信息的能力。 培养学生自我探索、自主学习的能力和自我创新、团体协作的能力。 情感目标:让学生在无数的失败中,寻找并且体验成功。 三、教学重点与难点 重点:熟悉和掌握画板下9种工具的操作。 难点:对油漆桶的正确用法。 四、教法阐述 本课采用的主要教学方法有“任务驱动法”、“创设情境法”等。 信息技术课程本身的特点,要求我们知识及技能的传授应以完成典型"任务"为主。因此本课采用建构主义理论指导下的主体式教学模式。通过学生已经受过的美术教育和信息技术教育,利用创设情境教学法创设情境。设置一个任务,让学生在学习的过程中,自己动手,有机结合画图的各种工具,以任务驱动的方式发展能力。使教学内容合理流动,水到渠成。教学中,启发、诱导贯穿始终,创造学生自主探究学习的平台,使学生变被动学习为主动愉快的学习,提高课堂40分钟的战斗力与生命力。 五、学法指导 本课教给学生的学法是“分析体验---接受任务——合作探究——综合运用”。

计量经济学复习资料——虚拟变量

虚拟变量习题 一、 单项选择题 1、 若一个回归模型包含截距项,对一个具有m 个特征的质的因素需要引入的虚拟变量个数为 A.m-2 B.m-1 C.m D.m+1 2、 某商品需求函数为:Y i =β0+β1X i +μi ,其中Y 为需求量,X 为价格,为了考虑“性别”(男性、女性)和“地区”(东部、中部、西部)两个因素的影响,考虑引入虚拟变量,则应引入虚拟变量的个数为( ) A. 5 B. 4 C. 3 D. 2 3、 消费函数Y i =α0+α1D+β0X i +β1DX i +μi ,其中 虚拟变量D=???农村家庭城镇家庭 01,当统计检验表明下列哪项成立时,表示城镇家庭 与农村家庭有一样的消费行为( ) A. α1=0, β1=0 B. α1=0, β1≠0 C. α1≠0, β1=0 D. α1≠0, β1≠0 4、 根据样本资料建立某消费函数如下:?100.5055.350.45t t C D X =++,其中C 为消费,X 为收入,虚拟变量 1 D 0 ?=??城镇家庭 农村家庭,所有参数均检验显著,则城 镇家庭的消费函数 为 ( ) A 、?155.850.45t t C X =+ B 、?100.500.45t t C X =+ C 、?100.5055.35t t C X =+ D 、?100.9555.35t t C X =+ 5、 假设某需求函数为01i i i Y X ββμ=++,为了考虑“季节”因素(春、夏、秋、 冬四个不同的状态),引入4个虚拟变量形成截距变动模型,则模型的 ( ) A 、参数估计量将达到最大精度 B 、参数估计量是有偏估计量 C 、参数估计量是非一致估计量 D 、参数将无法估计 6、 对于模型01i i i Y X ββμ=++,为了考虑“地区”因素(北方、南方),引入2 个虚拟变量形成截距变动模型,则会产生 ( ) A 、序列的完全相关 B 、序列的不完全相关 C 、完全多重共线性 D 、不完全多重共线性

《有趣绘画工具》说课稿

《有趣绘画工具》说课稿 《有趣绘画工具》说课稿 一、教材分析 《有趣的绘画工具》是省小学信息技术教材第一册(下)的内容,教学对象是小学四年级学生。它是教材关于金山画王xxxx画图知识的初步认识,并且贯穿着以后整个的画图知识教学,是学生能够顺利、快捷操作使用画图的基础之一,也是形成学生“了解熟悉——基本技能——综合运用”这一合理知识链的必要环节。教材目的是让学生学会金山画王中一些基本操作工具的运用,重点是掌握利用金山画王xxxx画板下的9种工具的基础操作及利用工具画图。新的工具的学习与使用,对学生充满着挑战,能够让学生在现有的基础上,产生一种求知与创作的冲动。正是这种冲动,也导致了学生内心理想与实际技能的不平衡。因此,探究学习的过程中,学生学习和创作的欲望极其强烈。学生的需要与兴趣就是学生探究的动力和起点。基于此点,从信息课本身的学科特点出发,结合学科课程整合理念,我设计了这一课时,目的在于让学生掌握各种工具的同时,着重培养学生的动手操作,思维能力,自我创新能力,进而唤起学生的生活体验,提高学生的信息素养。拓展信息技术课,只教电脑操作狭隘的课程局面。争取把更多的信息纳入到我们信息课程体系中来。培养学生的综合能力,从而使学生发现美,感觉美,创造美。让他们在无数的失败中寻找成功,感受成功的快乐。 从内容层面出发,对具备一定抽象思维能力和动手操作能力的四年级学生来说并不难,而且也是学生非常感兴趣的东西,因此在课堂上只需坚持精讲多练的原则,重难点知识让学生通过自己探究和小组合作学习等主要学习方式完成,同时结束教师适当个别指导。 二、教学目标 认知目标:让学生熟悉和掌握画板下工具的操作。掌握对工具的综合运用的方法。能力目标:培养学生如何获取信息、处理信息和应用信息的能力。 培养学生自我探索、自主学习的能力和自我创新、团体协作的能力。 情感目标:让学生在无数的失败中,寻找并且体验成功。 三、教学重点与难点

计量经济学实验教学案例实验9_虚拟变量

实验九虚拟变量 【实验目的】 掌握虚拟变量的设置方法。 【实验内容】 一、试根据表9-1的1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料建立我国城镇居民彩电需求函数; 资料来源:据《中国统计年鉴1999》整理计算得到 二、试建立我国税收预测模型(数据见实验一); 资料来源:《中国统计年鉴1999》 三、试根据表9-2的资料用混合样本数据建立我国城镇居民消费函数。

资料来源:据《中国统计年鉴》1999-2000整理计算得到 【实验步骤】 一、我国城镇居民彩电需求函数 ⒈相关图分析; 键入命令:SCAT X Y ,则人均收入与彩电拥有量的相关图如9-1所示。 从相关图可以看出,前3个样本点(即低收入家庭)与后5个样本点(中、高收入)的拥有量存在较大差异,因此,为了反映“收入层次”这一定性因素的影响,设置虚拟变量如下: ?? ?=低收入家庭 中、高收入家庭 1D 图9-1 我国城镇居民人均收入与彩电拥有量相关图 ⒉构造虚拟变量; 方式1:使用DATA 命令直接输入; 方式2:使用SMPL 和GENR 命令直接定义。 DATA D1 GENR XD=X*D1 ⒊估计虚拟变量模型: LS Y C X D1 XD 再由t 检验值判断虚拟变量的引入方式,并写出各类家庭的需求函数。 按照以上步骤,虚拟变量模型的估计结果如图9-2所示。

图7-2 我国城镇居民彩电需求的估计 我国城镇居民彩电需求函数的估计结果为: i i i i XD D x y 0088.08731.310119.061.57?-++= =t (16.249)(9.028) (8.320) (-6.593) 2R =0.9964 2R =0.9937 F =366.374 S.E =1.066 虚拟变量的回归系数的t 检验都是显著的,且模型的拟合优度很高,说明我国城镇居民低收入家庭与中高收入家庭对彩电的消费需求,在截距和斜率上都存在着明显差异,所以以加法和乘法方式引入虚拟变量是合理的。低收入家庭与中高收入家庭各自的需求函数为: 低收入家庭: i i x y 0119.061.57?+= 中高收入家庭: ()()i i x y 0088.00119.08731.3161.57 ?-++=i x 003.048.89+= 由此可见我国城镇居民家庭现阶段彩电消费需求的特点:对于人均年收入在3300元以下的低收入家庭,需求量随着收入水平的提高而快速上升,人均年收入每增加1000元,百户拥有量将平均增加12台;对于人均年收入在4100元以上的中高收入家庭,虽然需求量随着收入水平的提高也在增加,但增速趋缓,人均年收入每增加1000元,百户拥有量只增加3台。事实上,现阶段我国城镇居民中国收入家庭的彩电普及率已达到百分之百,所以对彩电的消费需求处于更新换代阶段。 二、我国税收预测模型 要求:设置虚拟变量反映1996年税收政策的影响。 方法:取虚拟变量D1=1(1996年以后),D1=0(1996年以前)。 键入命令:GENR XD=X*D1 LS Y C X D1 XD 则模型估计的相关信息如图7-3所示。

SPSS数据分析—两阶段最小二乘法

传统线性模型的假设之一是因变量之间相互独立,并且如果自变量之间不独立,会产生共线性,对于模型的精度也是会有影响的。虽然完全独立的两个变量是不存在的,但是我们在分析中也可以使用一些手段尽量减小这些问题产生的影响,例如采用随机抽样减小因变量间的相关性,使其满足假设;采用岭回归、逐步回归、主成分回归等解决共线性的问题。以上解决方法做都会损失数据信息,而且似乎都是采取一种回避问题的态度而非解决问题,当碰到更复杂的情况例如因变量和自变量相互影响时,单靠回避是无法得到正确的分析结果的,那么有没有更好的直接解决问题的方法呢?接下来介绍的 两阶段最小二乘法和路径分析就是解决此类问题比较好的方法。当因变量与自变量存在相互作用时,会直接违反传统回归模型的基本假设,也就无法再使用普通最小 二乘法,解决此类问题的方法是:首先确定和因变量有相互作用的自变量,将这些自变量作为因变量拟合回归方程,该方程中的自变量和原始因变量无关,用这些自变量的估计值代替原值进行分析,由于估计值是根据与原始因变量无关的变量预测而来,因此可以认为这些估计值也和因变量的作用是单向的,从而避免了相互作用的影响,整个过程用了两次最小二乘法,因此成为两阶段最小二乘法。当然,还有三阶或多阶最小二乘法。 两阶段最小二乘法在SPSS中有一个单独的过程: 分析—回归—两阶段最小二乘法 我们通过一个例子来说明其用法 现在想研究受教育年限、种族、年龄对收入的影响,表面上看,可以采用以教育年限、种族、年龄为自变量,收入为因变量的多重线性回归进行分析,但是根据常识,教育年限和收入存在双向的影响,这使得线性模型的基本假定被否定,分析结果可能不正确。此时,我们可以采用二阶段最小二乘法进行分析,为此,我们找到了父亲和母亲的受教育年限这两个变量,以此来估计原始变量的受教育年限,我们把这种在第一阶段用于预测自变量的变量称为工具变量,而被预测的自变量,称为内生变量。

第15章 工具变量与两阶段最小二乘

第15章 工具变量估计与两阶段最小二乘法 在本章中,我们进一步研究多元回归模型中的内生解释变量(endogenous explanatory variable )问题。在第3章中,我们推导出,遗漏一个重要变量时OLS 估计量的偏误;在第5章中,我们说明了在遗漏变量(omitted variable )的情况下,OLS 通常是非一致性的。第9章则证明了,对未观测到的解释变量给出适宜的代理变量,能消除(或至少减轻)遗漏变量偏误。不幸的是,我们不是总能得到适宜的代理变量。 在前两章中,我们解释了存在不随时间变化的遗漏变量的情况下,对综列数据如何用固定效应估计或一阶差分来估计随时间变化的自变量的影响。尽管这些方法非常有用,可我们不是总能获得综列数据的。即使能获得,如果我们的兴趣在于变量的影响,而该变量不随时间变化,它对于我们也几无用处:一阶差分或固定效应估计排除了不随时间变化的变量。此外,迄今为止我们已研究出的综列数据法还不能解决与解释变量相关的随时间而变化的遗漏变量的问题。 在本章中,我们对内生性问题采用了一个不同的方法。你将看到如何用工具变量法(IV )来解决一个或多个解释变量的内生性问题。就应用计量经济学中线性方程的估计而言,两阶段最小二乘法(2SLS 或TSLS )是第二受人欢迎的,仅次于普通最小二乘。 我们一开始先说明,在存在遗漏变量的情况下,如何用IV 法来获得一致性估计量。此外,IV 能用于解决含误差变量(errors-in-variable )的问题,至少是在某些假定下。下一章将证明运用IV 法如何估计联立方程模型。 我们对工具变量估计的论述严格遵照我们在第1篇中对普通最小二乘的推导,其中假定我们有一个来自基本总体的随机样本。这个起点很合人意,因为除了简化符号之外,它还强调了应根据基本总体来表述对IV 估计所做的重要的假定(正如用OLS 时一样)。如我们在第2篇中所示,OLS 可以应用于时间序列数据,而工具变量法也一样可以。第15.7节讨论IV 法应用于时间序列数据时出现的一些特殊问题。在第15.8节中,我们将论述在混合横截面和综列数据上的应用。 15.1 动机:简单回归模型中的遗漏变量 面对可能发生的遗漏变量偏误(或未观测到的异质性),迄今为止我们已讨论了三种选择:(1)我们可以忽略此问题,承受有偏、非一致性估计量的后果;(2)我们可以试图为未观测到的变量寻找并使用一个适宜的代理变量;(3)我们可以假定遗漏变量不随时间变化,运用第`13与14章中的固定效应或一阶差分方法。若能把估计值与关键参数的偏误方向一同给出,则第一个回答是令人满意的。例如,如果我们能说一个正参数(譬如职业培训对往后工资的影响)的估计量有朝零偏误 ,并且我们找到了一个统计上显著的正的估计值,那么我们还是学到了一些东西:职业培训对工资有正的影响,而我们很可能低估了该影响。不幸的是,相反的情况经常发生,我们的估计值可能在数值上太大了,以致我们要得出任何有用的结论都非常困难。 第9.2节中讨论的代理变量解也能获得令人满意的结果,但并不是总可以找到一个好的代理。该方法试图通过用代理变量取代不可观测的变量,来解决遗漏变量的问题。 另一种方法是将未观测到的变量留在误差项中,但不是用OLS 估计模型,而是运用一种承认存在遗漏变量的估计方法。这便是工具变量法所要做的。 举例来说,考虑成年劳动者的工资方程中存在未观测到的能力的问题。一个简单的模型为: ,)log(210e abil educ wage +++=βββ 其中e 是误差项。在第9章中,我们说明了在某些假定下,如何用诸如IQ 的代理变量代替能力,从而通过以下回归可得到一致性估计量 )log(wage 对IQ educ , 回归

计量经济学范本

第八章 虚拟变量 一、单选题: 1、虚拟变量模型i i i D Y μβα++=中,i Y 为居民的年可支配收入,i D 为虚拟解释变量, i D =1代表城镇居民,i D =0代表非城镇居民。当i μ满足古典假设时,则α ==)0|(i i D Y E 表示( B ) A 、城镇居民的年平均收入, B 、非城镇居民的年平均收入, C 、所有居民的年平均收入, D 、其他; 2、虚拟变量模型i i i D Y μβα++=中,i Y 为居民的年可支配收入,i D 为虚拟解释变量, i D =1代表城镇居民,i D =0代表非城镇居民。当i μ满足古典假设时,则βα+==)1|(i i D Y E 表示( A ) A 、城镇居民的年平均收入, B 、非城镇居民的年平均收入, C 、所有居民的年平均收入, D 、其它; 3、在没有定量解释变量的情形下,以加法形式引入虚拟解释变量,主要用于( C )。 A 、共线性分析, B 、自相关分析, C 、方差分析 , D 、其它 4、如果你有连续几年的月度数据,如果只有2、4、6、8、10、12月表现季节类型,则需要引入虚拟变量的个数是( B )。 A 、模型中有截距项时,引入12个, B 、模型中有截距项时,引入5个 C 、模型中没有截距项时,引入11个, D 、模型中没有截距项时,引入12个 5、下列不属于常用的虚拟变量模型是( D ); A 、解释变量中只包含虚拟变量, B 、解释变量中既含定量变量又含虚拟变量, C 、被解释变量本身为虚拟变量的模型, D 、解释变量和被解释变量中不含虚拟变量。 6、考虑虚拟变量模型:i i i X D D D Y μβαααα+++++=3322110,其中 ???=其他一季度011D ???=其他二季度012D ???=其他 三季度013D , 当其随机扰动项服从古典假定时,则下列回归方程中表示一季度的是:( B ) A 、i i i X D D D X Y E βαα++====)()0,1,|(20312 B 、i i i X D D D X Y E βαα++====)()0,1,|(10321 C 、i i i X D D D X Y E βαα++====)()0,1,|(30213 D 、i i i X D D D X Y E βα+====0321)0,|( 7、在含有截距项的分段线性回归分析中,如果只有一个属性变量,且其有三种类型,则引入虚拟变量个数应为( B ) A 、 1个, B 、 2个, C 、3个, D 、4个; 8、某商品需求函数为 u x b b y i i i ++=10,其中y 为需求量,x 为价格。为了考虑“地

WINDOWS系列工具--画图详细教程

WINDOWS系列工具--画图详细教程 目录 一.如何使用画图工具 二.《画图》工具系列-妙用曲线工具 三. 《画图》工具系列-巧用圆形工具 四. 《画图》工具系列妙用文字工具 五. 用“画图”进行屏幕拷贝 六. “画图”程序的放大修改功能 七. “画图”中的工具与颜色配置 八. 灵活使用编辑功能 九. Windows画图程序操作技巧 十. Windows画图程序操作技巧 十一. 用画图程序检测LCD的暗点

一.如何使用画图工具 想在电脑上画画吗?很简单,Windows 已经给你设计了一个简洁好用的画图工具,它在开始菜单的程序项里的附件中,名字就叫做“画图”。 启动它后,屏幕右边的这一大块白色就是你的画布了。左边是工具箱,下面是颜色板。 现在的画布已经超过了屏幕的可显示范围,如果你觉得它太大了,那么可以用鼠标拖曳角落的小方块,就可以改变大小了。 首先在工具箱中选中铅笔,然后在画布上拖曳鼠标,就可以画出线条了,还可以在颜色板上选择其它颜色画图,鼠标左键选择的是前景色,右键选择的是背景色,在画图的时候,左键拖曳画出的就是前景色,右键画的是背景色。 选择刷子工具,它不像铅笔只有一种粗细,而是可以选择笔尖的大小和形状,在这里单击任意一种笔尖,画出的线条就和原来不一样了。

图画错了就需要修改,这时可以使用橡皮工具。橡皮工具选定后,可以用左键或右键进行擦除,这两种擦除方法适用于不同的情况。左键擦除是把画面上的图像擦除,并用背景色填充经过的区域。试验一下就知道了,我们先用蓝色画上一些线条,再用红色画一些,然后选择橡皮,让前景色是黑色,背景色是白色,然后在线条上用左键拖曳,可以看见经过的区域变成了白色。现在把背景色变成绿色,再用左键擦除,可以看到擦过的区域变成绿色了。 现在我们看看右键擦除:将前景色变成蓝色,背景色还是绿色,在画面的蓝色线条和红色线条上用鼠标右键拖曳,可以看见蓝色的线条被替换成了绿色,而红色线条没有变化。这表示,右键擦除可以只擦除指定的颜色--就是所选定的前景色,而对其它的颜色没有影响。这就是橡皮的分色擦除功能。 再来看看其它画图工具。 是“用颜料填充”,就是把一个封闭区域内都填上颜色。 是喷枪,它画出的是一些烟雾状的细点,可以用来画云或烟等。 是文字工具,在画面上拖曳出写字的范围,就可以输入文字了,而且还可以选择字体和字号。 是直线工具,用鼠标拖曳可以画出直线。 是曲线工具,它的用法是先拖曳画出一条线段,然后再在线段上拖曳,可以把线段上从拖曳的起点向一个方向弯曲,然后再拖曳另一处,可以反向弯曲,两次弯曲后曲线就确定了。 是矩形工具,是多边形工具,是椭圆工具,是圆角矩形,多边形工具的用法是先拖曳一条线段,然后就可以在画面任意处单击,画笔会自动将单击点连接起来,直到你回到第一个点单击,就形成了一个封闭的多边形了。另外,这四种工具都有三种模式,就是线框、线框填色、和只有填色。

画图软件教案-工具举例

第1课初识画笔 教学目标:认识“画图板”窗口。 教学时间:1课时 教学过程: 同学们,喜欢画画吗?在我们的电脑中有一个强大的工具软件叫“画图板”,在这个软件里面有用不完的“颜料”和“画布”,使用它可以绘制美丽的风景画、人物画、想象画,还可以用它制作名片、明信片和贺卡。 上图所示就是使用“画图板”程序画的画,怎么样,心动了吗?下面我们一起来学习使用这个软件吧。 一、启动“画图” 1、画图程序是电脑中一个非常有趣实用的小程序,启动方法如下: 步骤1:启动电脑后,使用鼠标左键单击“开始”按钮; 步骤2:在弹出的菜单里选择“娱乐”; 步骤3:使用鼠标左键单击“画图”即可启动程序。 2、也可以使用画图程序的快捷图标起动程序:点击桌面“娱乐(4)”按钮,双击“画图”图标启动程序。 二、认识“画图” 1、画图的窗口 “画图”窗口主要有3个区域,左边是工具栏,下面是颜料盒,中间的大块区域就是绘图区(画布)等。 2、练一练 将下面的工具和它们对应的名称连接起来。 曲线画笔 文本选择(椭圆的) 颜色提取器连接线 填充颜色橡皮擦 喷雾罐直线 选择(自由形式)多边形

3、想一想 尝试使用工具箱中的不同工具,并注意观察工具箱下方“工具状态选择器”的变化。 4、看一看 使用“图像(I)”菜单中的“改变大小/缩放(E)……”命令可以调整画图区的大小。 三、退出“画图” 使用完“画图”程序后,要正确地退出“画图”程序。 单击“关闭”按钮后,出现对话框,分别点击“保存(S)”、“放弃(D)”、“取消(C)”,看看它们分别有什么作用? 四、讨论坊: 还有哪些计算机软件能帮助我们画图? 五、成果篮:

《计量经济学》虚拟变量练习题及参考答案

一、选择题 1、 对于一个含有截距项的计量经济模型,若某定性因素有m 个互斥的类型,为将其引入模型中,则需要引入虚拟变量个数为( B ) A. m B. m-1 C. m+1 D. m-k 2、 在经济发展发生转折时期,可以通过引入虚拟变量方法来表示这种变化。例如,研究中国城镇居民消费函数时。1991年前后,城镇居民商品性实际支出Y 对实际可支配收入X 的回归关系明显不同。现以1991年为转折时期,设虚拟变 量???=年以前,年以后,1991019911t D ,数据散点图显示消费函数发生了结构性变化:基本消费部分下降了,边际消费倾向变大了。则城镇居民线性消费函数的理论方程可以写作( D ) A. t t t u X Y ++=10ββ B. t t t t t u X D X Y +++=210βββ C. t t t t u D X Y +++=210βββ D. t t t t t t u X D D X Y ++++=3210ββββ 3、设某地区消费函数中,消费支出不仅与收入x 有关,而且与消费者的年龄构成有关,若将年龄构成分为小孩、青年人、成年人和老年人4个层次。假设边际消费倾向不变,考虑上述年龄构成因素的影响时,该消费函数引入虚拟变量的个数为 ( C ) A.1个 B.2个 C.3个 D.4个 4、在利用月度数据构建计量经济模型时,如果一年里的12个月全部表现出季节模式,则应该引入虚拟变量个数为( C ) A. 4 B. 12 C. 11 D. 6 5、在利用月度数据构建计量经济模型时,如果一年里的1、3、5、9四个月表现出季节模式,则应该引入虚拟变量个数为( 3个 ) 6、个人保健支出的计量经济模型为:i i i i X D Y μβαα+++=221 ,其中i Y 为保健年度 支出;i X 为个人年度收入;虚拟变量 ???=大学以下大学及以上 012i D ;i μ满足古典假定。则大学以上群体的平均年度保健支出为 ( B ) A. i i i i X D X Y E βα+==12)0,/( B.i i i i X D X Y E βαα++==212)1,/(

工具变量法~

工具变量法 一、工具变量法的主要思想 在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。经过变换,新的模型中,随机扰动项的表达式为: 考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (1.1); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)(1.2); 部分调整模型:(1)t t v u γ=-(01γ≤< , 1γ-为调整系数) (1.3)。 t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。 在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。那么,我们是否可以找到一个与1t Y -高度相关但与t v 不相关的变量来替代 1t Y -?在这里,一个可行的估计方法就是工具变量法。 在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。 一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相关,我们可称这样的解释变量为内生解释变量。内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y -。 外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关; 了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。 工具变量,顾名思义是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关的随机解释变量(即内生变量)。 满足条件:1)总体无关:工具变量与随机扰动项无关; 2)样本相关:工具变量必须与被它所代替的内生变量高度相关; 3)与模型中其他解释变量不相关,以避免出现多重共线性。 做了替代后,用普通最小二乘法即可得到原回归系数的一致估计量。 二、工具变量法的基本原理

五年级上信息技术教案-有趣的画图工具_湘科版

第九课有趣的画图工具 教学目的和要求 1. 掌握画图软件的启动与退出,并熟悉画图软件窗口的组成。 2. 学会设置画纸的大小。 3. 学会铅笔、刷子、直线、曲线、圆形等绘图工具的使用。 4. 通过运用画笔软件绘制公共汽车,使学生进一步熟练掌握画笔软件各部分的操作方法,同时激发学生对学习电脑的兴趣。 教学重点:绘图软件的操作与应用。 教学难点:曲线工具的运用。 教学准备:计算机及辅助教学软件。 教学过程 一、新课导入 谈话:“画图”软件是windows98操作系统中所附的绘图软件,利用它可以绘制简笔画、水彩画、插图或贺年片等。也可以绘制比较复杂的艺术图案;既可以在空白的画稿上作画,也可以修改其他已有的画稿。这节课我们就来学习win98画图软件的操作与运用。 二、新课教学 1、启动“画图”软件:讲解并演示启动“画图”软件的方法与操作步骤。 A.单击“开始”按钮,打开“开始”菜单; B.将鼠标指向“开始”菜单下的“程序”选项,打开“程序”菜单。 C.将鼠标指向“程序”菜单中的附件选项,打开“附件”菜单。 D.用鼠标单击“附件”菜单下的“画图”选项,启动画图程序。 启动后的屏幕窗口如图1所示: 2.讲解并演示画图软件的窗口组成: (1)标题栏:它包含了画笔的标题和图画的命名。 (2)菜单栏:有六个下拉式菜单。 (3)工具箱:有许多绘图工具,绘画时任选一项工具。

(4)线宽框:改变每个工具的线条宽度。 (5)调色板:左面是绘画时的前景色和背景色的显示框,右边有28种颜色供选择。 (6)滚动条:上、下、左、右移动绘图区域。 (7)绘图区:在该区作图、绘画。 3.讲解绘画工具的选择和应用:(边讲解边演示) (1)剪切工具:裁剪工具:它可以定义形状自由的剪切块。 (2)选定工具:它可以定义一个矩形剪切块。 (3)橡皮:可以擦除图面中不想要的部分。 (4)涂色工具:用前景色对封闭区填充。 (5)取色工具:它是用一个图形的颜色填另外的封闭图形区域。 (6)铅笔:可以在绘图区内任意画线, (7)刷子:与铅笔工具相似,只是刷子工具状态有12种,使绘图更为丰富。 (8)喷枪:该工具与前两种工具的功能类似,它们留下的痕迹的不同是由鼠标的拖动速度决定的,速度越们慢,斑点越密。 (9)文字:利用文字工具可以在图画上写字。 (10)直线:利用它可以画直线、水平线、垂直线。 (11)曲线:利用它可以画单弯头曲线、双弯头曲线。 (12)矩形:可以画空心方框或空心矩形。 (13)多边形:可以画一些多边形图形。 (14)椭圆:可以画一些垂直或水平的椭圆环。 (15)圆角矩形:可以画一些圆角方框。 5.作品存盘退出:(讲解并演示) 讲解:选择"文件"菜单下的"保存"命令,将所绘制的图画保存磁盘上。 退出画图程序:a.单击画图窗口右侧的关闭按钮; b.单击菜单中“文件”选项中的退出命令; c.单击【是(Y)选项,保存当前窗口中的图形并退出画图程序;

工具变量法

工具变量法 一、工具变量法得主要思想 在无限分布滞后模型中,为了估计回归系数,通常得做法就是对回归系数作一些限制,从而对受限得无限分布滞后模型进行估计。在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好得解决此类问题得思路。经过变换,新得模型中,随机扰动项得表达式为: 考伊克模型: ( ,为衰减率) (1、1); 适应性期望模型:(,为期望系数)(1、2); 部分调整模型:( ,为调整系数) (1、3)。 为原无限分布滞后模型中得扰动项,为变换后得扰动项。 在原模型中得随机扰动项满足经典假设得前提下,部分调整模型也满足经典假设,但就是考伊克模型与适应性期望模型得随机扰动项由于存在原随机扰动项得滞后项,也就就是说考伊克模型与适应性期望模型得解释变量势必与误差项相关,因此,可能会出现上述两个模型得最小二乘估计甚至就是有偏得这样严重得问题。那么,我们就是否可以找到一个与高度相关但与不相关得变量来替代?在这里,一个可行得估计方法就就是工具变量法。 在讨论工具变量法之前,我们先来了解一下外生变量与内生变量。 一般来说:一个回归模型中得解释变量有得与随机扰动项无关,我们称这样得解释变量为外生变量;而模型中有得解释变量与随机扰动项相关,我们可称这样得解释变量为内生解释变量。内生解释变量得典型情况之一就就是滞后应变量为解释变量得情形,如上述考伊克模型与适应性期望模型中得。 外生解释变量:回归模型中得解释变量与随机扰动项无关; 内生解释变量:回归模型中得解释变量与随机扰动项无关; 了解了内生变量与外生变量得概念,我们接着讨论工具变量法得主要思想:工具变量法与普通最小二乘法就是模型参数估计得两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数得普通最小二乘估计就是非一致得,这时就需要引入工具变量。 工具变量,顾名思义就是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关得随机解释变量(即内生变量)。 满足条件:1)总体无关:工具变量与随机扰动项无关; 2)样本相关:工具变量必须与被它所代替得内生变量高度相关; 3)与模型中其她解释变量不相关,以避免出现多重共线性。 做了替代后,用普通最小二乘法即可得到原回归系数得一致估计量。 二、工具变量法得基本原理 我们分别从简单线性回归模型与多元线性回归模型两方面来具体分析工具变量法得基本原理: 简单线性回归模型 考虑简单线性回归模型(2、1)其中为内生变量。 则其正规方程为:(2、2) 设回归模型中得解释变量与随机扰动项相关,则如前所述,普通最小二乘估计量就是非一致得。现用一个工具变量来代替正规方程中得解释变量,其残差表达式不变。

奇妙的Word画图工具_教学设计

奇妙的Word画图工具 教学内容 小学四年级下册(川版)信息技术课中第六课奇妙的Word画图工具 教材分析 本节课是小学信息技术四年级下册第六课,是在学生初步掌握了计算机的基本知识,操作技能以及word的基础知识上进行学习的。本节课内容的设计形象直观,灵活有趣,可以充分调动学生的手和脑,培养学生学习计算机的兴趣,使学生掌握一种简单有趣的绘图方法,熟悉word里进行绘图的操作方法,并在画图的过程中,把知识的教学和思维能力的培养结合起来,有利于促进学生创造性思维的发展,是进行创造性教育的好助手,为今后的学习奠定良好的基础。 学生分析 四年级的学生因年龄小,组织教学时,难以使每一个学生的注意力都很集中,因此在备课和设计练习与问题时,应尽量照顾到每一位学生,调动起每一位学生积极性,尽量满足学生的表现欲,尊重学生的个体差异。在教学中尽量营造不同的气氛,如:教学长方形时,设置长方形的线条和颜色及培养学生的综合应用知识的能力和动手的能力。 教学目的 1、认识word绘图工具,基本掌握绘图工具条的简单使用。 2、学会制作简单的图形。 3、培养学生逐渐养成自主探索学习的习惯。 重点、难点 本节课的重难点是使学生掌握画图中各种工具的使用并培养学生的创新能力。 所用教具:多媒体教室、教学广播系统。 所用教法:演示法、练习法、讲述对比法。 教学准备: 制作如教材P30的三个图形。 长方形斜坡上的小车科技之光一、教学流程 为了突破教学重难点,本课教学设计是以“学生练”为本,把学习的主动权交给学生,让学生主动参与学习及其自由的发挥,从而使学生学得生动活泼,并且妙趣横生。如果学生出现偏差,不恰当之处,教师适当点拨一下,本节课力求在教师帮助指导下,让学生自己领悟,自己画图,使学生养成独立思考勇于发现创新的思维习惯。 我设计的教学过程有这样几个环节。

计量经济学实验报告(虚拟变量)

计量经济学实验报告 实验三:虚拟变量模型 姓名:上善若水 班级: 序号: 学号: 中国人均消费影响因素 一、理论基础及数据 1. 研究目的 本文在现代消费理论的基础,分析建立计量模型,通过对 1979—— 2008 年全国城镇居民的人均消费支出做时间序列分析和对2004— 2008年各地区(31 个省市)城镇居民的人均消费支出做面板数据分析,比较分析了人均可支配收入、消费者物价指数和银行一年期存款利率等变量对居民消费的不同影响。

2. 模型理论 西方消费经济学者们认为,收入是影响消费者消费的主要因素,消费是需求的函数。消费经济学有关收入与消费的关系,即消费函数理论有:( 1)凯恩斯的绝对收入理论。他认为消费主要取决于消费者的净收入,边际消费倾向小于平均消费倾向。他假定,人们的现期消费,取决于他们现期收入的绝对量。(2)杜森贝利的相对收入消费理论。他认为消费者会受自己过去的消费习惯以及周围消费水准来决定消费,从而消费是相对的决定的。当期消费主要决定于当期收入和过去的消费支出水平。(3)弗朗科?莫迪利安的生命周期的消费理论。这种理论把人生分为三个阶段:少年、壮年和老年;在少年与老年阶段,消费大于收入;在壮年阶段,收入大于消费,壮年阶段多余的收入用于偿还少年时期的债务或储蓄起来用来防老。( 4)弗里德曼的永久收入消费理论。他认为消费者的消费支出主要不是由他的现期收入来决定,而是由他的永久收入来决定的。这些理论都强调了收入对消费的影响。除此之外,还有其他一些因素也会对消费行为产生影响。(1)利率。传统的看法认为,提高利率会刺激储蓄,从而减少消费。当然现代经济学家也有不同意见,他们认为利率对储蓄的影响要视其对储蓄的替代效应和收入效应而定,具体问题具体分析。( 2)价格指数。价格的变动可以使得实际收入发生变化,从而改变消费。 基于上述这些经济理论,我找到中国 1979-2008 年全国城镇居民人均消费以及城镇居民人均可支配收入、城镇居民消费者物价指数和 2004— 2008年各地区城镇居民人均消费以及城镇居民人均可支配收入、城镇居民消费者物价指数、以及银行一年期存款利率的官方数据。想借此来分析中国消费的影响因素以及它们具体是如何对消费产生影响的。针对这一模型,有以下两个假定。一,自改革开放以来,我国人均消费倾向呈现缓慢的递减趋势,即保持粘性。这一假定符合我国居民的储蓄——消费心理,也与其他一些发展中国家的情况大体一致。二,由储蓄和消费的替代关系,可以假定刺激储蓄的因素,会制约消费。我们知道提高利率会刺激储蓄,因而我把利率也引入模型的分析中。 以下对我所找的数据作一一说明 : 1、城镇居民人均消费水平。借此来代表城镇居民的消费支出情况,这是将要建立计量经济学模型的被解释变量。由下图可以看到消费是逐年增加的,与此同时,人均可支配收入也是逐年增加,隐含着两者可能有很高的线性相关性这层意思。

工具变量法

工具变量法 Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】

工具变量法 一、工具变量法的主要思想 在无限分布滞后模型中,为了估计回归系数,通常的做法是对回归系数作一些限制,从而对受限的无限分布滞后模型进行估计。在这里,考伊克模型、适应性期望模型与部分调整模型给出了很好的解决此类问题的思路。经过变换,新的模型中,随机扰动项的表达式为: 考伊克模型:1t t t v u u λ-=- (01λ<< ,λ为衰减率) (); 适应性期望模型:1(1)t t t v u u λ-=--(01λ<< ,λ为期望系数)(); 部分调整模型:(1)t t v u γ=-(01γ≤< ,1γ-为调整系数) ()。 t u 为原无限分布滞后模型中的扰动项,t v 为变换后的扰动项。 在原模型中的随机扰动项满足经典假设的前提下,部分调整模型也满足经典假设,但是考伊克模型与适应性期望模型的随机扰动项由于存在原随机扰动项的滞后项,也就是说考伊克模型与适应性期望模型的解释变量1t Y - 势必与误差项t v 相关,因此,可能会出现上述两个模型的最小二乘估计甚至是有偏的这样严重的问题。那么,我们是否可以找到一个与 1t Y -高度相关但与t v 不相关的变量来替代1t Y -在这里,一个可行的估计方法 就是工具变量法。 在讨论工具变量法之前,我们先来了解一下外生变量和内生变量。 一般来说:一个回归模型中的解释变量有的与随机扰动项无关,我们称这样的解释变量为外生变量;而模型中有的解释变量与随机扰动项相

关,我们可称这样的解释变量为内生解释变量。内生解释变量的典型情况之一就是滞后应变量为解释变量的情形,如上述考伊克模型与适应性期望模型中的1t Y 。 外生解释变量:回归模型中的解释变量与随机扰动项无关; 内生解释变量:回归模型中的解释变量与随机扰动项无关; 了解了内生变量和外生变量的概念,我们接着讨论工具变量法的主要思想:工具变量法和普通最小二乘法是模型参数估计的两类重要方法,在多元线性回归模型中,如果出现解释变量与随机误差项相关(即出现内生变量)时,其回归系数的普通最小二乘估计是非一致的,这时就需要引入工具变量。 工具变量,顾名思义是在模型估计过程中被作为工具使用,以替代模型中与随机误差性相关的随机解释变量(即内生变量)。 满足条件:1)总体无关:工具变量与随机扰动项无关; 2)样本相关:工具变量必须与被它所代替的内生变量高度相关; 3)与模型中其他解释变量不相关,以避免出现多重共线性。 做了替代后,用普通最小二乘法即可得到原回归系数的一致估计量。 二、工具变量法的基本原理 我们分别从简单线性回归模型和多元线性回归模型两方面来具体分析工具变量法的基本原理: 简单线性回归模型

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章 工具变量估计与两阶段最小二乘法【圣

第15章 工具变量估计与两阶段最小二乘法15.1复习笔记 一、动机:简单回归模型中的遗漏变量 1.面对可能发生的遗漏变量偏误(或无法观测异质性)的四种选择 (1)忽略遗漏变量问题,承受有偏而又不一致估计量,若能把估计值与关键参数的偏误方向一同给出,则该方法便令人满意。 (2)试图为无法观测变量寻找并使用一个适宜的代理变量,该方法试图通过用代理变量取代无法观测变量来解决遗漏变量的问题,但并不是总可以找到一个好的代理。 (3)假定遗漏变量不随时间变化,运用固定效应或一阶差分方法。 (4)将无法观测变量留在误差项中,但不是用OLS 估计模型,而是运用一种承认存在遗漏变量的估计方法,工具变量法。 2.工具变量法 简单回归模型 01y x u ββ=++其中x 与u 相关: ()Cov 0 ,x u ≠(1)为了在x 和u 相关时得到0β和1β的一致估计量,需要有一个可观测到的变量z,z 满足两个假定: ①z 与u 不相关,即Cov(z,u)=0;

②z 与x 相关,即Cov(z,x)≠0。 满足这两个条件,则z 称为x 的工具变量,简称为x 的工具。 z 满足①式称为工具外生性条件,工具外生性意味着,z 应当对y 无偏效应(一旦x 和u 中的遗漏变量被控制),也不应当与其他影响y 的无法观测因素相关。z 满足②式意味着z 必然与内生解释变量x 有着或正或负的关系。这个条件被称为工具相关性。 (2)工具变量的两个要求之间的差别 ①Cov(z,u)是z 与无法观测误差u 的协方差,通常无法对它进行检验:在绝大多数情形中,必须借助于经济行为或反思来维持这一假定。 ②给定一个来自总体的随机样本,z 与x(在总体中)相关的条件则可加以检验。最容易的方法是估计一个x 与z 之间的简单回归。在总体中,有 01x z v ππ=++从而,由于 ()() 1Cov /ar V ,x z z π=所以式Cov(z,x)≠0中的假定当且仅当10π≠时成立。因而就能够在充分小的显著水平上,相对双侧对立假设110H π≠:而拒绝虚拟假设010H π=:。就能相当有把握地肯定工具z 与x 是相关的。 3.工具变量估计量 (1)参数的工具变量(IV)估计量 参数的识别意味着可以根据总体矩写出1β,而总体矩可用样本数据进行估计。为了根据总体协方差写出1β,利用简单回归方程可得z 与y 之间的协方差为:

相关文档
最新文档