伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第15章 工具变量估计与两阶段最小二乘法【圣

合集下载

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第17章 限值因变量模型和样本选择纠正【圣才

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第17章 限值因变量模型和样本选择纠正【圣才

第17章限值因变量模型和样本选择纠正17.1复习笔记一、二值响应的对数单位和概率单位模型1.线性概率模型的不足(1)拟合出来的概率可能小于0或大于1;(2)任何一个解释变量(以水平值形式出现)的偏效应都是不变的。

二值响应模型的核心是响应概率:()()12P 1x P 1 k y y x x x ===⋅⋅⋅,,,其中,用x 表示全部解释变量所构成的集合。

2.设定对数单位和概率单位模型(1)二值响应模型在LPM 中,响应概率对一系列参数j β是线性的,为避免LPM 的局限性,考虑二值响应模型:()()()01101x k k P y G x x G x βββββ==++⋅⋅⋅+=+其中,G 是一个取值范围严格介于0和1之间的函数:对所有实数z,都有0﹤G(z)﹤1。

这就确保估计出来的响应概率严格地介于0和1之间。

(2)函数G 的各种非线性形式①对数单位模型中,G 是对数函数:()()()()exp /1exp G z z z z =+=Λ⎡⎤⎣⎦对所有的实数z,它都介于0和1之间。

它是一个标准逻辑斯蒂随机变量的累积分布函数。

②概率单位模型中,G 是标准正态的累积分布函数,可表示为积分()()()d z G z z v vφ-∞=Φ≡⎰其中,()z φ是标准正态密度函数()()()1/222exp /2z z φπ-=-也确保了对所有参数和x j 的值都严格介于0和1之间。

③两个模型中G 函数都是增函数,在z=0时增加的最快,在z →-∞时,()0G z →,而在z →∞时,()1G z →。

(3)两种函数形式的推导对数单位和概率单位模型都可以由一个满足经典线性模型假定的潜变量模型推导出来。

令y *为一个由0y x e ββ*=++,y=1[y *﹥0]决定的无法观测变量或潜变量。

在其中引入记号1[·]来定义一个二值结果。

函数1[·]被称为指标函数,它在括号中的事件正确时取值1,而在其他情况下取值0。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第13章 跨时横截面的混合:简单面板数据方法

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第13章 跨时横截面的混合:简单面板数据方法

第13章跨时横截面的混合:简单面板数据方法13.1复习笔记一、数据集的种类1.独立混合横截面数据它是在不同时点(经常但并不一定是不同年份)从一个大总体里进行随机抽样的结果。

重要特点:它们都是由独立抽取的观测所构成。

主要性质:保持其他条件不变,它排除了不同观测误差项的相关。

一个独立混合横截面和单独一个随机样本的差异在于,在不同时点上对总体进行抽样很可能导致观测点(即观测结果)不是同分布的情形(因为随着时间的变化,总体的分布可能已经发生变化)。

2.面板数据集它虽然兼有横截面和时间序列维度,但在一些重要方面却不同于独立混合横截面,有时又称纵列数据。

面板数据是在不同时间跟踪相同的一些个人、家庭、企业、城市、州或者其他单位,从这些跟踪的对象中收集的数据,在同一个时点上有多个个体的观测值,同时每一个个体又有几个不同时期的观测值。

二、跨时独立横截面的混合1.使用独立混合横截面的理由每个时期都抽取一个随机样本,然后把所得到的随机样本合并起来作为一个大的样本就是一个独立混合横截面。

使用独立混合横截面的一个理由是要加大样本容量,把不同时点从同一总体中抽取的多个随机样本混合起来使用,可以获取更精密的估计量和更具功效的检验统计量,仅当因变量和某些自变量保持着不随时间而变化的关系时,混合才是有用的。

使用混合截面只会带来少量的统计复杂性,因为总体在不同时期可能会有不同的分布,为了反映这种情况需要允许截距在不同时期有不同的值,因此通过引入年度虚拟变量就可以解决这个问题。

2.对跨时结构性变化的邹至庄检验(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别①检验的一种形式是,把混合估计的残差平方和看作约束SSR ;无约束的SSR 则是对两个时期分别估计而得的两个SSR 之和,然后按照邹至庄检验的步骤计算F 统计量。

②检验的另一种方法:先将每一变量对两个年度虚拟变量之一形成交互作用,再检验这个年度虚拟变量和全部交互项是否联合显著。

伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:OLS的渐近性)【圣才出品】

伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:OLS的渐近性)【圣才出品】

y=β0+β1x1+…+βkxk+u 检验这些变量中最后 q 个变量是否都具有零总体参数。
虚拟假设:H0:βk-q+1=0,…,βk=0,它对模型斲加了 q 个排除性约束。
3 / 12
圣才电子书 十万种考研考证电子书、题库视频学习平台

对立假设:这些参数中至少有一个异亍零。
(2)σ2 是 σ2=Var(u)的一个一致估计量。
(3)对每个 j,都有:
βˆj βj
/ se
βˆ j
a
~ Normal 0,1
其中, se βˆ j 就是通常的 OLS 标准误。
定理 5.2 的重要乊处在亍,它去掉了正态性假定 MLR.6。对误差分布唯一的限制是,
它具有有限斱差。还对 u 假定了零条件均值(MLR.4)和同斱差性(MLR.5)。
因为 Var(x1)>0,所以,若 x1 和 u 正相关,则 βˆ1 的丌一致性就为正,而若 x1 和 u 负相关,则 βˆ1 的丌一致性就为负。如果 x1 和 u 乊间的协斱差相对亍 x1 的斱差很小,那么这
种丌一致性就可以被忽略。由亍 u 是观测丌到的,所以甚至还丌能估计出这个协斱差有多 大。
二、渐近正态和大样本推断 1.定理 5.2:OLS 的渐近正态性 在高斯-马尔可夫假定 MLR.1~MLR.5 下,
④将
LM

χ
2 q
分布中适当的临界值
c
相比较,如果
LM>c,就拒绝虚拟假设。
(3)不 F 统计量比较
不 F 统计量丌同,无约束模型中的自由度在迚行 LM 检验时没有什么作用。所有起作用
的因素只是被检验约束的个数(q)、辅助回归 R2 的大小( Ru2 )和样本容量(n)。无约束 模型中的 df 丌起什么作用,这是因为 LM 统计量的渐近性质。但必须确定将 Ru2 乘以样本容 量以得到 LM,如果 n 很大, Ru2 看上去较低的值仍可能导致联合显著性。

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第三篇(第13~15章)【圣才出品】

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第三篇(第13~15章)【圣才出品】

第三篇高级专题第13章跨时横截面的混合:简单面板数据方法13.1 复习笔记考点一:跨时独立横截面的混合★★★★★1.独立混合横截面数据的定义独立混合横截面数据是指在不同时点从一个大总体中随机抽样得到的随机样本。

这种数据的重要特征在于:都是由独立抽取的观测所构成的。

在保持其他条件不变时,该数据排除了不同观测误差项的相关性。

区别于单独的随机样本,当在不同时点上进行抽样时,样本的性质可能与时间相关,从而导致观测点不再是同分布的。

2.使用独立混合横截面的理由(见表13-1)表13-1 使用独立混合横截面的理由3.对跨时结构性变化的邹至庄检验(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(见表13-2)表13-2 用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(2)对多个时期计算邹至庄检验统计量的办法①使用所有时期虚拟变量与一个(或几个、所有)解释变量的交互项,并检验这些交互项的联合显著性,一般总能检验斜率系数的恒定性。

②做一个容许不同时期有不同截距的混合回归来估计约束模型,得到SSR r。

然后,对T个时期都分别做一个回归,并得到相应的残差平方和,有:SSR ur=SSR1+SSR2+…+SSR T。

若有k个解释变量(不包括截距和时期虚拟变量)和T个时期,则需检验(T-1)k 个约束。

而无约束模型中有T+Tk个待估计参数。

所以,F检验的df为(T-1)k和n-T -Tk,其中n为总观测次数。

F统计量计算公式为:[(SSR r-SSR ur)/SSR ur][(n-T-Tk)/(Tk-k)]。

但该检验不能对异方差性保持稳健,为了得到异方差-稳健的检验,必须构造交互项并做一个混合回归。

4.利用混合横截面作政策分析(1)自然实验与真实实验当某些外生事件改变了个人、家庭、企业或城市运行的环境时,便产生了自然实验(准实验)。

一个自然实验总有一个不受政策变化影响的对照组和一个受政策变化影响的处理组。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第14章 高级的面板数据方法【圣才出品】

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第14章 高级的面板数据方法【圣才出品】

第14章高级的面板数据方法14.1复习笔记一、固定效应估计法1.固定效应变换固定效应变换又称组内变换,考虑仅有一个解释变量的模型:对每个i,有1 12 it it i it y x a u t Tβ=++=,,,…,对每个i 求方程在时间上的平均,便得到1i i i iy x a u β=++其中,11T it t y T y-==∑(关于时间的均值)。

因为a i 在不同时间固定不变,故它会在原模型和均值模型中都出现,如果对于每个t,两式相减,便得到()1 1 2 it i it i it i y y x x u u t Tβ-=-+-=,,,…,或1 12 it it it y x u t Tβ=+= ,,,…,其中,it it i y y y =- 是y 的除时间均值数据;对it x和it u 的解释也类似。

方程的要点在于,非观测效应a i 已随之消失,从而可以使用混合OLS 去估计式1 1 2 it it it y x u t T β=+= ,,,…,。

上式的混合OLS 估计量被称为固定效应估计量或组内估计量。

组间估计量可以从1i i i i y x a u β=++的OLS 估计量而得到,即同时使用y 和x 的时间平均值做一个横截面回归。

如果a i 与i x 相关,估计量是有偏误的。

而如果认为a i 与x it 无关,则使用随机效应估计量要更好。

组间估计量忽视了变量如何随着时间而变化。

2.原始的非观测效应模型1122 1 2 it it it k itk i it y x x x a u t Tβββ=++⋅⋅⋅+++=,,,…,只需对每个解释变量(包括诸如时期虚拟变量)都除去其时间均值,然后利用全部除时间均值后的变量做混合OLS 回归即可。

在解释变量的严格外生性假定下,固定效用估计量是无偏的:粗略地说,特异误差u it 应与所有时期的每个解释变量都无关。

固定效应估计量如一阶差分估计量一样,容许a i 与任何时期的解释变量任意相关,因为在时间上恒定的解释变量都必定随固定效应变换而消失。

计量经济学伍德里奇第五版中文版)答案

计量经济学伍德里奇第五版中文版)答案

第1章解决问题的办法1.1(一)理想的情况下,我们可以随机分配学生到不同尺寸的类。

也就是说,每个学生被分配一个不同的类的大小,而不考虑任何学生的特点,能力和家庭背景。

对于原因,我们将看到在第2章中,我们想的巨大变化,班级规模(主题,当然,伦理方面的考虑和资源约束)。

(二)呈负相关关系意味着,较大的一类大小是与较低的性能。

因为班级规模较大的性能实际上伤害,我们可能会发现呈负相关。

然而,随着观测数据,还有其他的原因,我们可能会发现负相关关系。

例如,来自较富裕家庭的儿童可能更有可能参加班级规模较小的学校,和富裕的孩子一般在标准化考试中成绩更好。

另一种可能性是,在学校,校长可能分配更好的学生,以小班授课。

或者,有些家长可能会坚持他们的孩子都在较小的类,这些家长往往是更多地参与子女的教育。

(三)鉴于潜在的混杂因素 - 其中一些是第(ii)上市 - 寻找负相关关系不会是有力的证据,缩小班级规模,实际上带来更好的性能。

在某种方式的混杂因素的控制是必要的,这是多元回归分析的主题。

1.2(一)这里是构成问题的一种方法:如果两家公司,说A和B,相同的在各方面比B公司à用品工作培训之一小时每名工人,坚定除外,多少会坚定的输出从B 公司的不同?(二)公司很可能取决于工人的特点选择在职培训。

一些观察到的特点是多年的教育,多年的劳动力,在一个特定的工作经验。

企业甚至可能歧视根据年龄,性别或种族。

也许企业选择提供培训,工人或多或少能力,其中,“能力”可能是难以量化,但其中一个经理的相对能力不同的员工有一些想法。

此外,不同种类的工人可能被吸引到企业,提供更多的就业培训,平均,这可能不是很明显,向雇主。

(iii)该金额的资金和技术工人也将影响输出。

所以,两家公司具有完全相同的各类员工一般都会有不同的输出,如果他们使用不同数额的资金或技术。

管理者的素质也有效果。

(iv)无,除非训练量是随机分配。

许多因素上市部分(二)及(iii)可有助于寻找输出和培训的正相关关系,即使不在职培训提高工人的生产力。

伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

伍德⾥奇《计量经济学导论》笔记和课后习题详解(⼀个经验项⽬的实施)【圣才出品】第19章⼀个经验项⽬的实施19.1 复习笔记⼀、问题的提出提出⼀个⾮常明确的问题,其重要性不容忽视。

如果没有明确阐述假设和将要估计的模型类型,那么很可能会忘记收集某些重要变量的信息,或是从错误的总体中取样,甚⾄收集错误时期的数据。

1.查找数据的⽅法《经济⽂献杂志》有⼀套细致的分类体系,其中每篇论⽂都有⼀组标识码,从⽽将其归于经济学的某⼀⼦领域之中。

因特⽹(Internet)服务使得搜寻各种主题的已发表论⽂更为⽅便。

《社会科学引⽤索引》(Social Sciences Citation Index)在寻找与社会科学各个领域相关的论⽂时⾮常有⽤,包括那些时常被其他著作引⽤的热门论⽂。

⽹络搜索引擎“⾕歌学术”(Google Scholar)对于追踪各类专题研究或某位作者的研究特别有帮助。

2.构思题⽬时⾸先应明确的⼏个问题(1)要使⼀个问题引起⼈们的兴趣,并不需要它具有⼴泛的政策含义;相反地,它可以只有局部意义。

(2)利⽤美国经济的标准宏观经济总量数据来进⾏真正原创性的研究⾮常困难,尤其对于⼀篇要在半个或⼀个学期之内完成的论⽂来说更是如此。

然⽽,这并不意味着应该回避对宏观或经验⾦融模型的估计,因为仅增加⼀些更新的数据便对争论具有建设性。

⼆、数据的收集1.确定适当的数据集⾸先必须确定⽤以回答所提问题的数据类型。

最常见的类型是横截⾯、时间序列、混合横截⾯和⾯板数据集。

有些问题可以⽤任何⼀种数据结构进⾏分析。

确定收集何种数据通常取决于分析的性质。

关键是要考虑能够获得⼀个⾜够丰富的数据集,以进⾏在其他条件不变下的分析。

同⼀横截⾯单位两个或多个不同时期的数据,能够控制那些不随时间⽽改变的⾮观测效应,⽽这些效应通常使得单个横截⾯上的回归失效。

2.输⼊并储存数据⼀旦你确定了数据类型并找到了数据来源,就必须把数据转变为可⽤格式。

通常,数据应该具备表格形式,每次观测占⼀⾏;⽽数据集的每⼀列则代表不同的变量。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第12章 时间序列回归中的序列相关和异方差性

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第12章 时间序列回归中的序列相关和异方差性

第12章时间序列回归中的序列相关和异方差性12.1复习笔记一、含序列相关误差时OLS 的性质1.无偏性和一致性在时间序列回归的前3个高斯—马尔可夫假定(TS.1~TS.3)之下,OLS 估计量是无偏的。

特别地,只要解释变量是严格外生的,无论误差中的序列相关程度如何,ˆjβ都是无偏的。

这类似于误差中的异方差不会造成ˆjβ产生偏误。

把严格外生性假定放松到()|0t t E u X =,并证明了当数据是弱相关的时候,ˆj β仍然是一致的(但不一定无偏)。

这一结论不以对误差中序列相关的假定为转移。

2.效率和推断高斯—马尔可夫定理要求误差的同方差性和序列无关性,所以,在出现序列相关时,OLS 便不再是BLUE 的了。

通常的OLS 标准误和检验统计量也不再确当,而且连渐近确当都谈不上。

假定误差存在序列相关,1,1,2,...,ρ-=+=tt t u u e t n ,1ρ<。

其中e t 是均值为0方差为2e σ满足经典假定的误差,对于简单回归模型:01ββ=++t t ty x u 假定x t 的样本均值为零,于是1111ˆn x t t i SST x u ββ-==+∑其中21n x t i SST x ==∑,计算1ˆβ的方差,()()22221111ˆ/2/n n n t j x t t x x t t j i i j Var SST Var x u SST SST x x βσσρ--+===⎛⎫==+ ⎪⎝⎭∑∑∑其中()2σ=t Var u 由1ˆβ的方差表达形式可知,第一项为2/xSST σ,为经典假定条件下的简单回归模型中参数的方差,所以当模型中的误差项存在序列相关时,按照OLS 估计的方差是有偏的。

在出现序列相关的时候,使用通常的OLS 标准误就不再准确。

因此,检验单个假设的t 统计量也不再正确。

因为较小的标准误意味着较大的t 统计量,所以当ρ﹥0时,通常的t 统计量常常过大。

用于检验多重假设的通常的F 统计量和LM 统计量也不再可靠。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第15章
工具变量估计与两阶段最小二乘法15.1复习笔记
一、动机:简单回归模型中的遗漏变量
1.面对可能发生的遗漏变量偏误(或无法观测异质性)的四种选择
(1)忽略遗漏变量问题,承受有偏而又不一致估计量,若能把估计值与关键参数的偏误方向一同给出,则该方法便令人满意。

(2)试图为无法观测变量寻找并使用一个适宜的代理变量,该方法试图通过用代理变量取代无法观测变量来解决遗漏变量的问题,但并不是总可以找到一个好的代理。

(3)假定遗漏变量不随时间变化,运用固定效应或一阶差分方法。

(4)将无法观测变量留在误差项中,但不是用OLS 估计模型,而是运用一种承认存在遗漏变量的估计方法,工具变量法。

2.工具变量法
简单回归模型
01y x u
ββ=++其中x 与u 相关:
()Cov 0
,x u ≠(1)为了在x 和u 相关时得到0β和1β的一致估计量,需要有一个可观测到的变量z,z 满足两个假定:
①z 与u 不相关,即Cov(z,u)=0;
②z 与x 相关,即Cov(z,x)≠0。

满足这两个条件,则z 称为x 的工具变量,简称为x 的工具。

z 满足①式称为工具外生性条件,工具外生性意味着,z 应当对y 无偏效应(一旦x 和u 中的遗漏变量被控制),也不应当与其他影响y 的无法观测因素相关。

z 满足②式意味着z 必然与内生解释变量x 有着或正或负的关系。

这个条件被称为工具相关性。

(2)工具变量的两个要求之间的差别
①Cov(z,u)是z 与无法观测误差u 的协方差,通常无法对它进行检验:在绝大多数情形中,必须借助于经济行为或反思来维持这一假定。

②给定一个来自总体的随机样本,z 与x(在总体中)相关的条件则可加以检验。

最容易的方法是估计一个x 与z 之间的简单回归。

在总体中,有
01x z v
ππ=++从而,由于
()()
1Cov /ar V ,x z z π=所以式Cov(z,x)≠0中的假定当且仅当10π≠时成立。

因而就能够在充分小的显著水平上,相对双侧对立假设110H π≠:而拒绝虚拟假设010H π=:。

就能相当有把握地肯定工具z 与x 是相关的。

3.工具变量估计量
(1)参数的工具变量(IV)估计量
参数的识别意味着可以根据总体矩写出1β,而总体矩可用样本数据进行估计。

为了根据总体协方差写出1β,利用简单回归方程可得z 与y 之间的协方差为:
()()()
1Cov Cov Cov ,,,z y z x z u β=+在Cov(z,u)=0与Cov(z,x)≠0的假定下,可以解出1β为:
()()
1Cov Cov ,,z y z x β=1β是z 和y 之间的总体协方差除以z 和x 之间的总体协方差,说明1β被识别了。

给定一个随机样本,用对应样本量来估计总体量。

在分子和分母中约去样本容量后,得到1β的工具变量(IV)估计量:()()()()111ˆn i i i n
i
i i z z y y z z x x β==--=--∑∑0β的IV 估计量就为:
01
ˆˆy x ββ=-(2)工具变量估计量的一致性和无偏性
大数定律表明,若满足工具变量的两个假定,1β的IV 估计量便具有一致性:
()
11
ˆplim ββ=若任一假定不成立,IV 估计量都将不是一致性的
IV 估计量的一个特点是:当x 与u 相关时,它绝不是无偏的。

在小样本中,这意味着IV 估计量可能有相当大的偏误。

因此在使用工具变量法时,需要大的样本容量。

4.用IV 估计量做统计推断
(1)1β的渐进方差
在大样本容量的情况下,IV 估计量近似服从正态分布。

为了对1β进行推断,需要一个可用于计算t 统计量和置信区间的标准误,通常的方法是增加一个同方差性假定但同方差的假定是以工具变量z 为条件的,即
()()
22|Var E u z u σ==则1
ˆβ的渐近方差为:2
22,x x z
n σ
σρ其中,2x σ是x 的总体方差,2σ是u 的总体方差,2,x z ρ是x 与z 之总体相关系数的平方,它反映了总体中z 与x 的相关性有多大。

(2)渐进方差的意义
①提供了一种求IV 估计量标准误的方法。

渐进误差中的所有量都可以在给定的随机样本下一致估计,为估计2x σ,简单地计算出
x i 的样本方差;为估计2,x z ρ,可以做x i 对z i 的回归来获得R 2,即2
,x z R 。

最后,为估计2σ,可以运用IV 残差,
01ˆˆˆ 1 2 i i i u y x i n ββ=--=,,
,…,其中,0ˆβ与1
ˆβ是IV 估计量。

2σ的一致估计量为:2
211ˆˆ2n i i u n σ==-∑1
ˆβ的渐近标准误是所估计的渐进方差的平方根,这个方差为:
22,ˆSST x x z
R σ
⋅其中,SST x 是x i 的总平方和。

(x i 的样本方差是SST x /n)所得到的标准误可用于构造t 统计量,以检验关于1β的假设,或者是得到1β的置信区间。

②比较IV 和OLS 估计量(当x 与u 不相关时)的渐近方差。

在高斯—马尔可夫假定下,OLS 估计量的方差为2SST x σ/,而IV 估计量的计算式为()22,/SST x x z R σ⋅;两者的区别仅在于IV 方差的分母中出现了2,x z R 。

由于R 2总是小于1,所以这个IV 的方差总是大于OLS 方差。

若x 与z 只是轻度相关,则2
,x z R 便很小,而这将转化为IV 估计量的一个非常大的抽样方差。

z 与x 越高度相关,2,x z R 便越接近于1,IV 估计量的方差就越小。

在z=x 的情况下,2,1x z R =,得到OLS 的方差。

当x 与u 不相关时进行IV 估计的一个重要代价:IV 估计量的渐近方差总是大于(有时远大于)OLS 估计量的渐近方差。

5.低劣工具变量条件下IV 的性质
当z 和u 不相关,而z 与x 存在着或正或负的相关时,IV 估计量是一致的,但当z 与x 只是弱相关时,IV 估计值的标准误可能很大。

z 与x 之间的弱相关可能产生更加严重的后果:即使z 与u 只是适度相关,IV 估计量的渐近偏误也可能很大。

(1)IV 估计量的概率极限
当z 与u 可能相关时,利用总体相关和标准差,可以推出:
()()1 IV 1Corr ˆplim Corr u x
z u z x σββσ=+⋅,,,其中,u σ和x σ分别代表总体中u 和x 的标准差。

它表明,即使Corr(z,x)很小,如果Corr(z,u)也很小,那么IV 估计量的不一致性也可能非常大。

即使只考虑一致性,若z 与u 之间的相关系数小于x 与u 之间的相关系数,则使用IV 也不一定比OLS 更好。

(2)OLS 估计量的概率极限
由于
()()()
Cov Corr / ,,x u x u x u σσ=可以将OLS 估计量的概率极限( 1 OLS ,β)写为()1OLS 1ˆplim Corr u x
x u σββσ=+⋅,,
(3)IV 估计量与OLS 估计量的渐近偏误比较渐近偏误的方向对IV 和OLS 估计量而言可能是不同的。

假设当Corr(x,u)﹥0,Corr(z,x)﹥0,而Corr(z,u)﹤0。

IV 估计量便存在一个向下的偏误,而OLS 估计量具有向上的(渐近)偏误。

假设z 与x 都与u 正相关,而且Corr(z,x)﹥0。

那么,只有在Corr(z,u)/Corr (z,x)﹤Corr(x,u)时,IV 估计量才比OLS 估计量的渐近偏误更小。

如果Corr(z,x)很小,那么z 与u 之间看似很小的相关性就可能被放大,就算仅考虑偏误,IV 也不如OLS 好。

(4)弱工具问题
当工具相关条件Corr(z,x)≠0不成立时,就出现了弱工具问题。

弱工具问题大致定义为z 和x 之间的相关度“很低”(但不为零)的问题。

出现弱工具问题时,基于通常的t。

相关文档
最新文档