伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第13章 跨时横截面的混合:简单面板数据方法

合集下载

伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:OLS的渐近性)【圣才出品】

伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:OLS的渐近性)【圣才出品】

y=β0+β1x1+…+βkxk+u 检验这些变量中最后 q 个变量是否都具有零总体参数。
虚拟假设:H0:βk-q+1=0,…,βk=0,它对模型斲加了 q 个排除性约束。
3 / 12
圣才电子书 十万种考研考证电子书、题库视频学习平台

对立假设:这些参数中至少有一个异亍零。
(2)σ2 是 σ2=Var(u)的一个一致估计量。
(3)对每个 j,都有:
βˆj βj
/ se
βˆ j
a
~ Normal 0,1
其中, se βˆ j 就是通常的 OLS 标准误。
定理 5.2 的重要乊处在亍,它去掉了正态性假定 MLR.6。对误差分布唯一的限制是,
它具有有限斱差。还对 u 假定了零条件均值(MLR.4)和同斱差性(MLR.5)。
因为 Var(x1)>0,所以,若 x1 和 u 正相关,则 βˆ1 的丌一致性就为正,而若 x1 和 u 负相关,则 βˆ1 的丌一致性就为负。如果 x1 和 u 乊间的协斱差相对亍 x1 的斱差很小,那么这
种丌一致性就可以被忽略。由亍 u 是观测丌到的,所以甚至还丌能估计出这个协斱差有多 大。
二、渐近正态和大样本推断 1.定理 5.2:OLS 的渐近正态性 在高斯-马尔可夫假定 MLR.1~MLR.5 下,
④将
LM

χ
2 q
分布中适当的临界值
c
相比较,如果
LM>c,就拒绝虚拟假设。
(3)不 F 统计量比较
不 F 统计量丌同,无约束模型中的自由度在迚行 LM 检验时没有什么作用。所有起作用
的因素只是被检验约束的个数(q)、辅助回归 R2 的大小( Ru2 )和样本容量(n)。无约束 模型中的 df 丌起什么作用,这是因为 LM 统计量的渐近性质。但必须确定将 Ru2 乘以样本容 量以得到 LM,如果 n 很大, Ru2 看上去较低的值仍可能导致联合显著性。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解
伍德里奇《计量经济学导论》(第5 版)笔记和课后习题详解
读书笔记模板
01 思维导图
03 目录分析 05 读书笔记
目录
02 内容摘要 04 作者介绍 06 精彩摘录
思维导图
本书关键字分析思维导图
第版
计量经济 学
时间
习题
序列
经典
变量
笔记
教材
笔记 复习
模型
导论
笔记
第章
习题
分析
数据
回归
内容摘要
本书是伍德里奇《计量经济学导论》(第5版)教材的配套电子书,主要包括以下内容:(1)整理名校笔记, 浓缩内容精华。每章的复习笔记以伍德里奇所著的《计量经济学导论》(第5版)为主,并结合国内外其他计量经 济学经典教材对各章的重难点进行了整理,因此,本书的内容几乎浓缩了经典教材的知识精华。(2)解析课后习 题,提供详尽答案。本书参考国外教材的英文答案和相关资料对每章的课后习题进行了详细的分析和解答。(3) 补充相关要点,强化专业知识。一般来说,国外英文教材的中译本不太符合中国学生的思维习惯,有些语言的表 述不清或条理性不强而给学习带来了不便,因此,对每章复习笔记的一些重要知识点和一些习题的解答,我们在 不违背原书原意的基础上结合其他相关经典教材进行了必要的整理和分析。本书特别适用于参加研究生入学考试 指定考研考博参考书目为伍德里奇所著的《计量经济学导论》的考生,也可供各大院校学习计量经济学的师生参 考。

2.1复习笔记 2.2课后习题详解
3.1复习笔记 3.2课后习题详解
4.1复习笔记 4.2课后习题详解
5.1复习笔记 5.2课后习题详解
6.1复习笔记 6.2课后习题详解
7.1复习笔记 7.2课后习题详解

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第2章 简单回归模型【圣才出品】

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第2章 简单回归模型【圣才出品】

第2章简单回归模型2.1复习笔记一、简单回归模型的定义1.简单线性回归模型一个简单的方程是:01y x uββ=++假定方程在所关注的总体中成立,它便定义了一个简单线性回归模型。

因为它把两个变量x 和y 联系起来,所以又把它称为两变量或者双变量线性回归模型。

变量u 称为误差项或者干扰项,表示除x 之外其他影响y 的因素。

1β就是y 与x 的关系式中的斜率参数,表示在其他条件不变的情况下,x 变化一个单位y 平均变化。

0β被称为截距参数,在一般的模型中除非有很强的理论依据说明模型没有截距项,否则一般情况下都要带上截距项。

2.回归术语表2-1简单回归的术语3.零条件均值假定(1)零条件均值u 的平均值与x 值无关。

可以把它写作:()()|E u x E u =当方程成立时,就说u 的均值独立于x。

(2)零条件均值假定的意义①零条件均值假定给出1β的另一种非常有用的解释。

以x 为条件取期望值,并利用()|0E u x =,便得到:()01|E y x xββ=+方程表明,总体回归函数(PRF)()|E y x 是x 的一个线性函数,线性意味着x 变化一个单位,将使y 的期望值改变1β。

对任何给定的x 值,y 的分布都以()|E y x 为中心。

1β就是斜率参数。

②给定零条件均值假定()|0E u x =,把方程中的y 看成两个部分是比较有用的。

一部分是表示()|E y x 的01x ββ+,被称为y 的系统部分,即由x 解释的那一部分,另一个部分是被称为非系统部分的u,即不能由x 解释的那一部分。

二、普通最小二乘法的推导1.最小二乘估计值从总体中找一个样本。

令(){} 1 i i x y i n =,:,…,表示从总体中抽取的一个容量为n 的随机样本。

01i i iy x u ββ=++在总体中,u 与x 不相关。

因此有:()()()0cov 0E u x u E xu ===,和用可观测变量x 和y 以及未知参数0β和1β表示为:()010E y x ββ--=()010E x y x ββ--=⎡⎤⎣⎦得到()0111ˆˆ0ni ii y x n ββ=--=∑和()0111ˆˆ0ni i ii x y x n ββ=--=∑这两个方程可用来解出0ˆβ和1ˆβ01ˆˆy x ββ=+则01ˆˆy x ββ=-一旦得到斜率估计值1ˆβ,则有:()111ˆˆ0niiii x y y x x ββ=⎡⎤---=⎣⎦∑整理后便得到:()()111ˆnniii i i i x yy x x x β==-=-∑∑根据求和运算的基本性质,有:()()211n ni i i i i x x x x x ==-=-∑∑()()()11nniii i i i x yy x x y y==-=--∑∑因此,只要有()21nii x x =->∑估计的斜率就为:()()()1121ˆnii i ni i xx y yx x β==--=-∑∑所给出的估计值称为0β和1β的普通最小二乘(OLS)估计值。

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第三篇(第13~15章)【圣才出品】

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第三篇(第13~15章)【圣才出品】

第三篇高级专题第13章跨时横截面的混合:简单面板数据方法13.1 复习笔记考点一:跨时独立横截面的混合★★★★★1.独立混合横截面数据的定义独立混合横截面数据是指在不同时点从一个大总体中随机抽样得到的随机样本。

这种数据的重要特征在于:都是由独立抽取的观测所构成的。

在保持其他条件不变时,该数据排除了不同观测误差项的相关性。

区别于单独的随机样本,当在不同时点上进行抽样时,样本的性质可能与时间相关,从而导致观测点不再是同分布的。

2.使用独立混合横截面的理由(见表13-1)表13-1 使用独立混合横截面的理由3.对跨时结构性变化的邹至庄检验(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(见表13-2)表13-2 用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(2)对多个时期计算邹至庄检验统计量的办法①使用所有时期虚拟变量与一个(或几个、所有)解释变量的交互项,并检验这些交互项的联合显著性,一般总能检验斜率系数的恒定性。

②做一个容许不同时期有不同截距的混合回归来估计约束模型,得到SSR r。

然后,对T个时期都分别做一个回归,并得到相应的残差平方和,有:SSR ur=SSR1+SSR2+…+SSR T。

若有k个解释变量(不包括截距和时期虚拟变量)和T个时期,则需检验(T-1)k 个约束。

而无约束模型中有T+Tk个待估计参数。

所以,F检验的df为(T-1)k和n-T -Tk,其中n为总观测次数。

F统计量计算公式为:[(SSR r-SSR ur)/SSR ur][(n-T-Tk)/(Tk-k)]。

但该检验不能对异方差性保持稳健,为了得到异方差-稳健的检验,必须构造交互项并做一个混合回归。

4.利用混合横截面作政策分析(1)自然实验与真实实验当某些外生事件改变了个人、家庭、企业或城市运行的环境时,便产生了自然实验(准实验)。

一个自然实验总有一个不受政策变化影响的对照组和一个受政策变化影响的处理组。

伍德里奇《计量经济学导论》笔记和课后习题详解(时间序列回归中的序列相关和异方差)【圣才出品】

伍德里奇《计量经济学导论》笔记和课后习题详解(时间序列回归中的序列相关和异方差)【圣才出品】

第12章 时间序列回归中的序列相关和异方差12.1 复习笔记一、含序列相关误差时OLS 的性质 1.无偏性和一致性在时间序列回归的前3个高斯-马尔可夫假定(TS.1~TS.3)之下,OLS 估计量是无偏的。

特别地,只要解释变量是严格外生的,无论误差中的序列相关程度如何,ˆj β都是无偏的。

这类似于误差中的异方差不会造成ˆjβ产生偏误。

把严格外生性假定放松到()0t t E u X =,并证明了当数据是弱相关的时候,ˆjβ仍然是一致的(但不一定无偏)。

这一结论不以对误差中序列相关的假定为转移。

2.效率和推断高斯-马尔可夫定理要求误差的同方差性和序列无关性,所以,在出现序列相关时,OLS 便不再是BLUE 的了。

通常的OLS 标准误和检验统计量也不再确当,而且连渐近确当都谈不上。

在序列相关的时候,通常的方差估计量都是()1ˆVar β的有偏估计。

因为ˆj β的标准误是ˆjβ的标准差的估计值,所以在出现序列相关的时候,使用通常的OLS 标准误就不再确当。

因此,检验单个假设的t 统计量也不再确当。

因为较小的标准误意味着较大的t 统计量,所以当ρ>0时,通常的统计量常常过大。

用于检验多重假设的通常的F 统计量和LM 统计量也不再可靠。

3.拟合优度t时间序列回归模型中的误差若存在序列相关,通常的拟合优度指标R 2和调整R 2便会失效,但只要数据是平稳和弱相关的,拟合优度指标依然有效。

在横截面背景中将总体R 2定义为221/u y σσ-。

在使用平稳而又弱相关数据的时间序列回归背景中,这个定义依然确当:误差和因变量的方差都不随时间而变化。

根据大数定律,R 2和调整R 2都是总体R 2的一致估计。

拟合优度指标仍是总体参数的一致估计量。

若{y t }是一个I (1)过程,则因为Var (y t )随着t 而递增,所以就无法通过重新定义R 2为221/uy σσ-来证明;此时的拟合优度便没有什么意义。

4.出现滞后因变量时的序列相关回归中出现滞后因变量时,误差有序列相关的危险。

伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

伍德⾥奇《计量经济学导论》笔记和课后习题详解(⼀个经验项⽬的实施)【圣才出品】第19章⼀个经验项⽬的实施19.1 复习笔记⼀、问题的提出提出⼀个⾮常明确的问题,其重要性不容忽视。

如果没有明确阐述假设和将要估计的模型类型,那么很可能会忘记收集某些重要变量的信息,或是从错误的总体中取样,甚⾄收集错误时期的数据。

1.查找数据的⽅法《经济⽂献杂志》有⼀套细致的分类体系,其中每篇论⽂都有⼀组标识码,从⽽将其归于经济学的某⼀⼦领域之中。

因特⽹(Internet)服务使得搜寻各种主题的已发表论⽂更为⽅便。

《社会科学引⽤索引》(Social Sciences Citation Index)在寻找与社会科学各个领域相关的论⽂时⾮常有⽤,包括那些时常被其他著作引⽤的热门论⽂。

⽹络搜索引擎“⾕歌学术”(Google Scholar)对于追踪各类专题研究或某位作者的研究特别有帮助。

2.构思题⽬时⾸先应明确的⼏个问题(1)要使⼀个问题引起⼈们的兴趣,并不需要它具有⼴泛的政策含义;相反地,它可以只有局部意义。

(2)利⽤美国经济的标准宏观经济总量数据来进⾏真正原创性的研究⾮常困难,尤其对于⼀篇要在半个或⼀个学期之内完成的论⽂来说更是如此。

然⽽,这并不意味着应该回避对宏观或经验⾦融模型的估计,因为仅增加⼀些更新的数据便对争论具有建设性。

⼆、数据的收集1.确定适当的数据集⾸先必须确定⽤以回答所提问题的数据类型。

最常见的类型是横截⾯、时间序列、混合横截⾯和⾯板数据集。

有些问题可以⽤任何⼀种数据结构进⾏分析。

确定收集何种数据通常取决于分析的性质。

关键是要考虑能够获得⼀个⾜够丰富的数据集,以进⾏在其他条件不变下的分析。

同⼀横截⾯单位两个或多个不同时期的数据,能够控制那些不随时间⽽改变的⾮观测效应,⽽这些效应通常使得单个横截⾯上的回归失效。

2.输⼊并储存数据⼀旦你确定了数据类型并找到了数据来源,就必须把数据转变为可⽤格式。

通常,数据应该具备表格形式,每次观测占⼀⾏;⽽数据集的每⼀列则代表不同的变量。

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第12章 时间序列回归中的序列相关和异方差性

伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第12章 时间序列回归中的序列相关和异方差性

第12章时间序列回归中的序列相关和异方差性12.1复习笔记一、含序列相关误差时OLS 的性质1.无偏性和一致性在时间序列回归的前3个高斯—马尔可夫假定(TS.1~TS.3)之下,OLS 估计量是无偏的。

特别地,只要解释变量是严格外生的,无论误差中的序列相关程度如何,ˆjβ都是无偏的。

这类似于误差中的异方差不会造成ˆjβ产生偏误。

把严格外生性假定放松到()|0t t E u X =,并证明了当数据是弱相关的时候,ˆj β仍然是一致的(但不一定无偏)。

这一结论不以对误差中序列相关的假定为转移。

2.效率和推断高斯—马尔可夫定理要求误差的同方差性和序列无关性,所以,在出现序列相关时,OLS 便不再是BLUE 的了。

通常的OLS 标准误和检验统计量也不再确当,而且连渐近确当都谈不上。

假定误差存在序列相关,1,1,2,...,ρ-=+=tt t u u e t n ,1ρ<。

其中e t 是均值为0方差为2e σ满足经典假定的误差,对于简单回归模型:01ββ=++t t ty x u 假定x t 的样本均值为零,于是1111ˆn x t t i SST x u ββ-==+∑其中21n x t i SST x ==∑,计算1ˆβ的方差,()()22221111ˆ/2/n n n t j x t t x x t t j i i j Var SST Var x u SST SST x x βσσρ--+===⎛⎫==+ ⎪⎝⎭∑∑∑其中()2σ=t Var u 由1ˆβ的方差表达形式可知,第一项为2/xSST σ,为经典假定条件下的简单回归模型中参数的方差,所以当模型中的误差项存在序列相关时,按照OLS 估计的方差是有偏的。

在出现序列相关的时候,使用通常的OLS 标准误就不再准确。

因此,检验单个假设的t 统计量也不再正确。

因为较小的标准误意味着较大的t 统计量,所以当ρ﹥0时,通常的t 统计量常常过大。

用于检验多重假设的通常的F 统计量和LM 统计量也不再可靠。

伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

第19章一个经验项目的实施19.1 复习笔记一、问题的提出提出一个非常明确的问题,其重要性不容忽视。

如果没有明确阐述假设和将要估计的模型类型,那么很可能会忘记收集某些重要变量的信息,或是从错误的总体中取样,甚至收集错误时期的数据。

1.查找数据的方法《经济文献杂志》有一套细致的分类体系,其中每篇论文都有一组标识码,从而将其归于经济学的某一子领域之中。

因特网(Internet)服务使得搜寻各种主题的已发表论文更为方便。

《社会科学引用索引》(Social Sciences Citation Index)在寻找与社会科学各个领域相关的论文时非常有用,包括那些时常被其他著作引用的热门论文。

网络搜索引擎“谷歌学术”(Google Scholar)对于追踪各类专题研究或某位作者的研究特别有帮助。

2.构思题目时首先应明确的几个问题(1)要使一个问题引起人们的兴趣,并不需要它具有广泛的政策含义;相反地,它可以只有局部意义。

(2)利用美国经济的标准宏观经济总量数据来进行真正原创性的研究非常困难,尤其对于一篇要在半个或一个学期之内完成的论文来说更是如此。

然而,这并不意味着应该回避对宏观或经验金融模型的估计,因为仅增加一些更新的数据便对争论具有建设性。

二、数据的收集1.确定适当的数据集首先必须确定用以回答所提问题的数据类型。

最常见的类型是横截面、时间序列、混合横截面和面板数据集。

有些问题可以用任何一种数据结构进行分析。

确定收集何种数据通常取决于分析的性质。

关键是要考虑能够获得一个足够丰富的数据集,以进行在其他条件不变下的分析。

同一横截面单位两个或多个不同时期的数据,能够控制那些不随时间而改变的非观测效应,而这些效应通常使得单个横截面上的回归失效。

2.输入并储存数据一旦你确定了数据类型并找到了数据来源,就必须把数据转变为可用格式。

通常,数据应该具备表格形式,每次观测占一行;而数据集的每一列则代表不同的变量。

(1)不同类型数据的输入要求①对时间序列数据集来说,只有一种合理的方式来进行数据的输入和存储:即以时间为序,最早的时期列为第一次观测,最近的时期列为最后一次观测。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第13章跨时横截面的混合:简单面板数据方法
13.1复习笔记
一、数据集的种类
1.独立混合横截面数据
它是在不同时点(经常但并不一定是不同年份)从一个大总体里进行随机抽样的结果。

重要特点:它们都是由独立抽取的观测所构成。

主要性质:保持其他条件不变,它排除了不同观测误差项的相关。

一个独立混合横截面和单独一个随机样本的差异在于,在不同时点上对总体进行抽样很可能导致观测点(即观测结果)不是同分布的情形(因为随着时间的变化,总体的分布可能已经发生变化)。

2.面板数据集
它虽然兼有横截面和时间序列维度,但在一些重要方面却不同于独立混合横截面,有时又称纵列数据。

面板数据是在不同时间跟踪相同的一些个人、家庭、企业、城市、州或者其他单位,从这些跟踪的对象中收集的数据,在同一个时点上有多个个体的观测值,同时每一个个体又有几个不同时期的观测值。

二、跨时独立横截面的混合
1.使用独立混合横截面的理由
每个时期都抽取一个随机样本,然后把所得到的随机样本合并起来作为一个大的样本就
是一个独立混合横截面。

使用独立混合横截面的一个理由是要加大样本容量,把不同时点从同一总体中抽取的多个随机样本混合起来使用,可以获取更精密的估计量和更具功效的检验统计量,仅当因变量和某些自变量保持着不随时间而变化的关系时,混合才是有用的。

使用混合截面只会带来少量的统计复杂性,因为总体在不同时期可能会有不同的分布,为了反映这种情况需要允许截距在不同时期有不同的值,因此通过引入年度虚拟变量就可以解决这个问题。

2.对跨时结构性变化的邹至庄检验
(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别
①检验的一种形式是,把混合估计的残差平方和看作约束SSR ;无约束的SSR 则是对两个时期分别估计而得的两个SSR 之和,然后按照邹至庄检验的步骤计算F 统计量。

②检验的另一种方法:先将每一变量对两个年度虚拟变量之一形成交互作用,再检验这个年度虚拟变量和全部交互项是否联合显著。

由于回归模型中的截距常随时间而变,邹至庄检验便能识破是否存在这种变化。

若时期很多,而且解释变量也不少,则构造一套完整的交互项可能十分繁琐。

(2)对多个时期计算邹至庄检验统计量的办法
①使用所有时期虚拟变量与一个或几个或所有解释变量的交互项,并检验这些交互项的联合显著性,一般总能检验斜率系数的恒定性。

②做一个容许不同时期有不同截距的混合回归来估计约束模型,从而得到SSR r 。

然后,对T 个时期中的每个时期都做一个回归,并分别得到残差平方和。

无约束残差平方和便是
12SSR SSR SSR SST ur T
=+++
若有k 个解释变量(不包括截距和时期虚拟变量)和T 个时期,便需要检验(T-1)k 个约束。

而无约束模型中有T+Tk 个待估计参数。

所以,若n 为总观测次数,则F 检验的df 为(T-1)k 和n-T-Tk。

F 统计量:
()()()SSR SSR /SSR /1r ur ur n T Tk T k ----⎡⎤⎡⎤⎣⎦⎣⎦
但这个检验不能对异方差性保持稳健,为了得到—个异方差—稳健的检验,必须构造交互项并做一个混合回归。

三、利用混合横截面作政策分析
1.自然实验与真实实验
当某些外生事件改变了个人、家庭、企业或城市运行的环境时,便产生了自然实验(准实验)。

一个自然实验总有一个不受政策变化影响的对照组和一个被认为受政策变化影响的处理组。

在自然实验中,对照组和处理组均来自某个具体的政策变化,一个在政策改变以前,一个在政策改变以后。

在真实实验中,处理组和对照组是随机而明确地抽取的。

把对照组称为C,处理组称为T,并令处理组T 中观测的dT 等于1,否则等于0。

再令d2为第2个时期的虚拟变量,模型方程为
001122y d dT d dT βδβδ=+++⋅+其他因素
其中,y 是我们关注的结果变量。

δ1度量了政策效应。

若回归中没有其他因素,1ˆδ就是倍差估计量:()()
1 2 2 1 1 ˆ=T C T C y y y y δ---,,,,
2.平均处理效应及其估计方法
δ1因度量对y 的平均结果的“处理”或政策效应,有时也被称为平均处理效应。

δ1两种估计方法:
(1)在每个时期都计算处理组与控制组的平均值之差,然后再将不同时期的上述差值进行差分;(2)分别计算处理组和控制组不同时期的平均值变化,然后将这些变化进行差分,这就意味着是求()()
1 2 1 2 1 ˆT T C C y y y y δ=---,,,,从结果可知估计值1ˆδ不会依赖于差分的方式。

四、两时期面板数据分析
1.固定效应模型
简单的回归方程很可能遇到遗漏变量的问题。

利用面板数据的方法,把影响因变量的无法观测因素分为两类:一类是恒常不变的,另一类则随时间而变。

令i 表示横截面单位,t 表示时期,可将含有单个可观测解释变量的模型写成
0012 1 2
it t it i it y d x a u t βδβ=++++=,,变量d2t 是一个在t=1时取值为零而在t=2时取值为1的虚拟变量,它不随i 而变化。

变量a i 概括了影响着y it 但又不随着时间而变化的所有无法观测的因素,一般都被称为非观测效应,在应用研究中也常常被称为固定效应,a i 在时间上是固定的,因此模型被称为非观测效应模型或固定效应模型。

a i 又称为非观测异质性。

误差u it 常被称为特异误差或时变误差,因为它代表因时而变且影响着y it 的那些无法观测的因素。

2.估计1β的方法
例如,给定两年的面板数据,估计参数1β的方法是:直接把两年的数据混合起来,然后用OLS。

这种方法有两个缺点,最重要的一点是,为了使混合的OLS 得到1β的一个一致估计量,就必须假定非观测效应a i 与x it 无关。

将模型写成:
0012,1,2
βδβ=+++=it t it it y d x v t 其中,v it =a i +u it 常被称为复合误差。

即使假定特异误差u it 与x it 无关,如果a i 与x it 相关,混合OLS 估计就是偏误且不一致的。

由此造成的偏误有时又被称为异质性偏误,这是由于遗漏了一个不随时间而变化的变量所导致的。

3.一阶差分方程
在大多应用中,收集面板数据主要是为了考虑非观测效应a i 与解释变量相关。

因为a i 是不随着时间而变化的常数,所以可以取两个年份的数据之差。

对横截面的第i 个观测值,把两年的方程分别写为:
()()
()
2001221011 1 2 1i i i i i i i i y x a u t y x a u t βδβββ=++++==+++=如果将第一个方程减去第二个方程,便得到
()()
21012121i i i i i i y y x x u u δβ-=+-+-或
01i i i
y x u δβ∆=+∆+∆
非观测效应a i 被“差分掉”了,该式称为一阶差分方程,它是由单个横截面方程对每个变量都取其时间上的差分所得到的。

如果容许x it 与不随时间而变化的无法观测因素相关,则i u ∆与i x ∆无关,这就是在时间序列模型中的严格外生性假定。

在这里,允许x it 与不随时间而变化的无法观测的因素相关,运用OLS 对1β进行估计,由此得到1β的OLS 估计量为一阶差分估计量。

此外,容许a i 与x it 相关就不能把a i 对y it 的影响与不随时间而变的任何变量的影响分离开来。

另一个关键条件是,∆x i 必须因i 的不同而有所变化。

要用通常的OLS 上式还要满足同方差性。

4.利用面板数据的差分控制非观测效应的代价
(1)面板数据比单个横截面更难于收集,特别是关于个人的数据。

必须进行一次调查,然后跟踪所有个人再进行另一次跟踪调查。

在进行第二次调查时,要查找跟踪对象通常很困难。

(2)即便得到了一个面板数据集,用于消除a i 的差分也可能大大减少解释变量中的变异。

虽然可以利用很大的横截面来克服这一困难,但并非总能奏效。

而且,利用较长时间间隔的差分有时比利用逐年的变化来得好。

5.面板数据的编排
(1)假设有关于城市的两个不同年份的数据。

为了大多数目的,登记数据的最好方法是,对每个城市都安排两个记录,每年一个,每个城市的第一个记录对应于较早的一年,第二个记录对应于较晚的一年。

这两个记录应该放在相邻位置(如相邻的两行)。

前两个记录用于样本中第一个城市,接下来两个记录用于第二个城市,依此类推。

这样就很容易构造差分并把这些差分贮存在每个城市的第二个记录中,也便于进行能与差分估计相比较的混合横。

相关文档
最新文档