伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解-第13~15章【圣才出品】
伍德里奇《计量经济学导论》笔记和课后习题详解(多元回归分析:OLS的渐近性)【圣才出品】

y=β0+β1x1+…+βkxk+u 检验这些变量中最后 q 个变量是否都具有零总体参数。
虚拟假设:H0:βk-q+1=0,…,βk=0,它对模型斲加了 q 个排除性约束。
3 / 12
圣才电子书 十万种考研考证电子书、题库视频学习平台
对立假设:这些参数中至少有一个异亍零。
(2)σ2 是 σ2=Var(u)的一个一致估计量。
(3)对每个 j,都有:
βˆj βj
/ se
βˆ j
a
~ Normal 0,1
其中, se βˆ j 就是通常的 OLS 标准误。
定理 5.2 的重要乊处在亍,它去掉了正态性假定 MLR.6。对误差分布唯一的限制是,
它具有有限斱差。还对 u 假定了零条件均值(MLR.4)和同斱差性(MLR.5)。
因为 Var(x1)>0,所以,若 x1 和 u 正相关,则 βˆ1 的丌一致性就为正,而若 x1 和 u 负相关,则 βˆ1 的丌一致性就为负。如果 x1 和 u 乊间的协斱差相对亍 x1 的斱差很小,那么这
种丌一致性就可以被忽略。由亍 u 是观测丌到的,所以甚至还丌能估计出这个协斱差有多 大。
二、渐近正态和大样本推断 1.定理 5.2:OLS 的渐近正态性 在高斯-马尔可夫假定 MLR.1~MLR.5 下,
④将
LM
不
χ
2 q
分布中适当的临界值
c
相比较,如果
LM>c,就拒绝虚拟假设。
(3)不 F 统计量比较
不 F 统计量丌同,无约束模型中的自由度在迚行 LM 检验时没有什么作用。所有起作用
的因素只是被检验约束的个数(q)、辅助回归 R2 的大小( Ru2 )和样本容量(n)。无约束 模型中的 df 丌起什么作用,这是因为 LM 统计量的渐近性质。但必须确定将 Ru2 乘以样本容 量以得到 LM,如果 n 很大, Ru2 看上去较低的值仍可能导致联合显著性。
伍德里奇《计量经济学导论》笔记和课后习题详解(异方差性)【圣才出品】

(4)在丌包括截距癿情况下将 1 对 r1u, r2u, , rqu 做回归。异斱差-稳健癿 LM 统计
χ 量就是 n-SSR1,其中 SSR1 是最后这个回归通常癿残差平斱和。在 H0 下 LM 渐近服从
2 q
分布。
4 / 36
圣才电子书 十万种考研考证电子书、题库视频学习平台
变量乊类癿情况出现则具有这种影响。
2.异斱差性对拟合优度癿影响
对拟合优度指标 R2 和 R2 癿解释丌受异斱差性癿影响。通常癿 R2 和调整 R2 都是估计总
体
R2
癿丌同斱法,而总体
R2 无非就是1 σu2
/
σ
2 y
,其中
σu2
是总体误差斱差,
σ
2 y
则是
y
癿总体斱差。关键是,由亍总体 R2 中这两个斱差都是无条件斱差,所以总体 R2 丌受
十万种考研考证电子书、题库视频学习平台
令 uˆi 表示原来 y 对 x 做回归所得到癿 OLS 残差。那么,对亍仸何形式癿异斱差(包括
同斱差),Var βˆ j 癿一个确当估计量都是
n
xi x 2 uˆi2
i 1
SSTx2
可以证明,将斱程乘以样本容量
n
后,会依概率收敛亍
在没有同斱差假定癿情况下,估计量癿斱差是有偏癿。由亍 OLS 标准误直接以这些斱
差为基础,所以它们都丌能用来构造置信区间和 t 统计量。
4.对统计检验癿影响
1 / 36
圣才电子书 十万种考研考证电子书、题库视频学习平台
在出现异斱差性癿情况下,在高斯-马尔可夫假定下用来检验假设癿统计量都丌再成立。 (1)在出现异斱差性时,通常普通最小二乘法癿 t 统计量就丌具有 t 分布,使用大样 本容量也丌能解决这个问题。 (2)F 统计量也丌再是 F 分布。 (3)LM 统计量也丌服从渐近 χ2 分布。
伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-第三篇(第13~15章)【圣才出品】

第三篇高级专题第13章跨时横截面的混合:简单面板数据方法13.1 复习笔记考点一:跨时独立横截面的混合★★★★★1.独立混合横截面数据的定义独立混合横截面数据是指在不同时点从一个大总体中随机抽样得到的随机样本。
这种数据的重要特征在于:都是由独立抽取的观测所构成的。
在保持其他条件不变时,该数据排除了不同观测误差项的相关性。
区别于单独的随机样本,当在不同时点上进行抽样时,样本的性质可能与时间相关,从而导致观测点不再是同分布的。
2.使用独立混合横截面的理由(见表13-1)表13-1 使用独立混合横截面的理由3.对跨时结构性变化的邹至庄检验(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(见表13-2)表13-2 用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(2)对多个时期计算邹至庄检验统计量的办法①使用所有时期虚拟变量与一个(或几个、所有)解释变量的交互项,并检验这些交互项的联合显著性,一般总能检验斜率系数的恒定性。
②做一个容许不同时期有不同截距的混合回归来估计约束模型,得到SSR r。
然后,对T个时期都分别做一个回归,并得到相应的残差平方和,有:SSR ur=SSR1+SSR2+…+SSR T。
若有k个解释变量(不包括截距和时期虚拟变量)和T个时期,则需检验(T-1)k 个约束。
而无约束模型中有T+Tk个待估计参数。
所以,F检验的df为(T-1)k和n-T -Tk,其中n为总观测次数。
F统计量计算公式为:[(SSR r-SSR ur)/SSR ur][(n-T-Tk)/(Tk-k)]。
但该检验不能对异方差性保持稳健,为了得到异方差-稳健的检验,必须构造交互项并做一个混合回归。
4.利用混合横截面作政策分析(1)自然实验与真实实验当某些外生事件改变了个人、家庭、企业或城市运行的环境时,便产生了自然实验(准实验)。
一个自然实验总有一个不受政策变化影响的对照组和一个受政策变化影响的处理组。
伍德里奇《计量经济学导论》笔记和课后习题详解(时间序列回归中的序列相关和异方差)【圣才出品】

第12章 时间序列回归中的序列相关和异方差12.1 复习笔记一、含序列相关误差时OLS 的性质 1.无偏性和一致性在时间序列回归的前3个高斯-马尔可夫假定(TS.1~TS.3)之下,OLS 估计量是无偏的。
特别地,只要解释变量是严格外生的,无论误差中的序列相关程度如何,ˆj β都是无偏的。
这类似于误差中的异方差不会造成ˆjβ产生偏误。
把严格外生性假定放松到()0t t E u X =,并证明了当数据是弱相关的时候,ˆjβ仍然是一致的(但不一定无偏)。
这一结论不以对误差中序列相关的假定为转移。
2.效率和推断高斯-马尔可夫定理要求误差的同方差性和序列无关性,所以,在出现序列相关时,OLS 便不再是BLUE 的了。
通常的OLS 标准误和检验统计量也不再确当,而且连渐近确当都谈不上。
在序列相关的时候,通常的方差估计量都是()1ˆVar β的有偏估计。
因为ˆj β的标准误是ˆjβ的标准差的估计值,所以在出现序列相关的时候,使用通常的OLS 标准误就不再确当。
因此,检验单个假设的t 统计量也不再确当。
因为较小的标准误意味着较大的t 统计量,所以当ρ>0时,通常的统计量常常过大。
用于检验多重假设的通常的F 统计量和LM 统计量也不再可靠。
3.拟合优度t时间序列回归模型中的误差若存在序列相关,通常的拟合优度指标R 2和调整R 2便会失效,但只要数据是平稳和弱相关的,拟合优度指标依然有效。
在横截面背景中将总体R 2定义为221/u y σσ-。
在使用平稳而又弱相关数据的时间序列回归背景中,这个定义依然确当:误差和因变量的方差都不随时间而变化。
根据大数定律,R 2和调整R 2都是总体R 2的一致估计。
拟合优度指标仍是总体参数的一致估计量。
若{y t }是一个I (1)过程,则因为Var (y t )随着t 而递增,所以就无法通过重新定义R 2为221/uy σσ-来证明;此时的拟合优度便没有什么意义。
4.出现滞后因变量时的序列相关回归中出现滞后因变量时,误差有序列相关的危险。
伍德里奇《计量经济学导论》(第4版)笔记和课后习题详解-第1~4章【圣才出品】

Байду номын сангаас
2.假设让你进行一项研究,以确定较小的班级规模是否会提高四年级学生的成绩。
4 / 119
圣才电子书 十万种考研考证电子书、题库视频学习平台
(i)如果你能设定你想做的任何实验,你想做些什么?请具体说明。 (ii)更现实地,假设你能搜集到某个州几千名四年级学生的观测数据。你能得到他们 四年级班级规模和四年级末的标准化考试分数。你为什么预计班级规模与考试成绩存在负相 关关系? (iii)负相关关系一定意味着较小的班级规模会导致更好的成绩吗?请解释。 答:(i)假定能够随机的分配学生们去不同规模的班级,也就是说,在不考虑学生诸如 能力和家庭背景等特征的前提下,每个学生被随机的分配到不同的班级。因此可以看到班级 规模(在伦理考量和资源约束条件下的主体)的显著差异。 (ii)负相关关系意味着更大的班级规模与更差的考试成绩是有直接联系的,因此可以 发现班级规模越大,导致考试成绩越差。 通过数据可知,两者之间的负相关关系还有其他的原因。例如,富裕家庭的孩子在学校 可能更多的加入小班,而且他们的成绩优于平均水平。 另外一个可能性是:学校的原则是将成绩较好的学生分配到小班。或者部分父母可能坚 持让自己的孩子进入更小的班级,而同样这些父母也更多的参与子女的教育。 (iii)鉴于潜在的其他混杂因素(如 ii 所列举),负相关关系并不一定意味着较小的班 级规模会导致更好的成绩。控制混杂因素的方法是必要的,而这正是多重回归分析的主题。
伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

伍德⾥奇《计量经济学导论》笔记和课后习题详解(⼀个经验项⽬的实施)【圣才出品】第19章⼀个经验项⽬的实施19.1 复习笔记⼀、问题的提出提出⼀个⾮常明确的问题,其重要性不容忽视。
如果没有明确阐述假设和将要估计的模型类型,那么很可能会忘记收集某些重要变量的信息,或是从错误的总体中取样,甚⾄收集错误时期的数据。
1.查找数据的⽅法《经济⽂献杂志》有⼀套细致的分类体系,其中每篇论⽂都有⼀组标识码,从⽽将其归于经济学的某⼀⼦领域之中。
因特⽹(Internet)服务使得搜寻各种主题的已发表论⽂更为⽅便。
《社会科学引⽤索引》(Social Sciences Citation Index)在寻找与社会科学各个领域相关的论⽂时⾮常有⽤,包括那些时常被其他著作引⽤的热门论⽂。
⽹络搜索引擎“⾕歌学术”(Google Scholar)对于追踪各类专题研究或某位作者的研究特别有帮助。
2.构思题⽬时⾸先应明确的⼏个问题(1)要使⼀个问题引起⼈们的兴趣,并不需要它具有⼴泛的政策含义;相反地,它可以只有局部意义。
(2)利⽤美国经济的标准宏观经济总量数据来进⾏真正原创性的研究⾮常困难,尤其对于⼀篇要在半个或⼀个学期之内完成的论⽂来说更是如此。
然⽽,这并不意味着应该回避对宏观或经验⾦融模型的估计,因为仅增加⼀些更新的数据便对争论具有建设性。
⼆、数据的收集1.确定适当的数据集⾸先必须确定⽤以回答所提问题的数据类型。
最常见的类型是横截⾯、时间序列、混合横截⾯和⾯板数据集。
有些问题可以⽤任何⼀种数据结构进⾏分析。
确定收集何种数据通常取决于分析的性质。
关键是要考虑能够获得⼀个⾜够丰富的数据集,以进⾏在其他条件不变下的分析。
同⼀横截⾯单位两个或多个不同时期的数据,能够控制那些不随时间⽽改变的⾮观测效应,⽽这些效应通常使得单个横截⾯上的回归失效。
2.输⼊并储存数据⼀旦你确定了数据类型并找到了数据来源,就必须把数据转变为可⽤格式。
通常,数据应该具备表格形式,每次观测占⼀⾏;⽽数据集的每⼀列则代表不同的变量。
伍德里奇《计量经济学导论》笔记和课后习题详解(一个经验项目的实施)【圣才出品】

第19章一个经验项目的实施19.1 复习笔记一、问题的提出提出一个非常明确的问题,其重要性不容忽视。
如果没有明确阐述假设和将要估计的模型类型,那么很可能会忘记收集某些重要变量的信息,或是从错误的总体中取样,甚至收集错误时期的数据。
1.查找数据的方法《经济文献杂志》有一套细致的分类体系,其中每篇论文都有一组标识码,从而将其归于经济学的某一子领域之中。
因特网(Internet)服务使得搜寻各种主题的已发表论文更为方便。
《社会科学引用索引》(Social Sciences Citation Index)在寻找与社会科学各个领域相关的论文时非常有用,包括那些时常被其他著作引用的热门论文。
网络搜索引擎“谷歌学术”(Google Scholar)对于追踪各类专题研究或某位作者的研究特别有帮助。
2.构思题目时首先应明确的几个问题(1)要使一个问题引起人们的兴趣,并不需要它具有广泛的政策含义;相反地,它可以只有局部意义。
(2)利用美国经济的标准宏观经济总量数据来进行真正原创性的研究非常困难,尤其对于一篇要在半个或一个学期之内完成的论文来说更是如此。
然而,这并不意味着应该回避对宏观或经验金融模型的估计,因为仅增加一些更新的数据便对争论具有建设性。
二、数据的收集1.确定适当的数据集首先必须确定用以回答所提问题的数据类型。
最常见的类型是横截面、时间序列、混合横截面和面板数据集。
有些问题可以用任何一种数据结构进行分析。
确定收集何种数据通常取决于分析的性质。
关键是要考虑能够获得一个足够丰富的数据集,以进行在其他条件不变下的分析。
同一横截面单位两个或多个不同时期的数据,能够控制那些不随时间而改变的非观测效应,而这些效应通常使得单个横截面上的回归失效。
2.输入并储存数据一旦你确定了数据类型并找到了数据来源,就必须把数据转变为可用格式。
通常,数据应该具备表格形式,每次观测占一行;而数据集的每一列则代表不同的变量。
(1)不同类型数据的输入要求①对时间序列数据集来说,只有一种合理的方式来进行数据的输入和存储:即以时间为序,最早的时期列为第一次观测,最近的时期列为最后一次观测。
伍德里奇《计量经济学导论》笔记和课后习题详解(联立方程模型)【圣才出品】

第16章联立方程模型16.1 复习笔记解释变量另一种重要的内生性形式是联立性。
当一个或多个解释变量与因变量联合被决定时,就出现了这个问题。
估计联立方程模型的主要方法是工具变量法。
一、联立方程模型的性质联立方程组中的每个方程都具有其他条件不变的因果性解释。
因为只观察到均衡结果,所以在构造联立方程模型中的方程时,使用违反现存事实的逻辑。
SEM的经典例子是某个商品或要素投入的供给和需求方程:h i=α1w i+β1z i1+u i1h i=α2w i+β2z i2+u i2联立方程模型的重要特征:首先,给定z i1、z i2、u i1和u i2,这两个方程就决定了h i和w i。
h i和w i是这个SEM中的内生变量。
z i1和z i2由于在模型外决定,是外生变量。
其次,从统计观点来看,关于z i1和z i2的关键假定是,它们都与u i1和u i2无关。
由于这些误差出现在结构方程中,所以它们是结构误差的例子。
最后,SEM中的每个方程自身都应该有一个行为上的其他条件不变解释。
二、OLS中的联立性偏误在一个简单模型中,与因变量同时决定的解释变量一般都与误差项相关,这就导致OLS中存在偏误和不一致性。
1.约简型方程考虑两个方程的结构模型:y1=α1y2+β1z1+u1y2=α2y1+β2z2+u2并专门估计第一个方程。
变量z1和z2都是外生的,所以每个都与u1和u2无关。
如果将式y1=α1y2+β1z1+u1的右边作为y1代入式y2=α2y1+β2z2+u2中,得到(1-α2α1)y2=α2β1z1+β2z2+α2u1+u2为了解出y2,需对参数做一个假定:α2α1≠1。
这个假定是否具有限制性则取决于应用。
y2可写成y2=π21z1+π22z2+v2其中,π21=α2β1/(1-α2α1)、π22=β2/(1-α2α1)和v2=(α2u1+u2)/(1-α2α1)。
用外生变量和误差项表示y2的方程(16.14)是y2的约简型方程。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3篇高深专题讨论
第13章跨时横截面的混合:简单面板数据方法
13.1 复习笔记
一、数据集的种类
1.独立混合横截面数据
它是在不同时点(经常但并不一定是不同年份)从一个大总体里进行随机抽样的结果。
重要特点:它们都是由独立抽取的观测所构成。
主要性质:保持其他条件不变,它排除了不同观测误差项的相关。
一个独立混合横截面和单独一个随机样本的差异在于,在不同时点上对总体进行抽样很可能导致观测点(即观测结果)不是同分布的情形。
2.面板数据集
它虽然兼有横截面和时间序列维度,但在一些重要方面却不同于独立混合横截面,有时又称纵列数据。
二、跨时独立横截面的混合
1.使用独立混合横截面的理由
如果每个时期都抽取一个随机样本,那么把所得到的随机样本合并起来就给出一个独立混合横截面。
使用独立混合横截面的一个理由是要加大样本容量,把不同时点从同一总体中抽取的多
个随机样本混合起来使用,可以获取更精密的估计量和更具功效的检验统计量,仅当因变量和某些自变量保持着不随时间而变化的关系时,混合才是有用的。
2.对跨时结构性变化的邹至庄检验
(1)对两个时期构造邹至庄检验统计量的方法
①检验的一种形式是,把混合估计的残差平方和看作约束SSR;无约束的SSR则是对两个时期分别估计而得的两个SSR之和。
②先将每一变量对两个年度虚拟变量之一形成交互作用,再检验这个年度虚拟变量和全部交互项是否联合显著。
由于回归模型中的截距常随时间而变,这个成熟的邹至庄检验便能识破是否存在这种变化。
若时期很多,而且解释变量也不少,则构造一套完整的交互项可能十分烦琐。
(2)对多个时期计算邹至庄检验统计量的办法
①使用所有时期虚拟变量与一个或几个或所有解释变量的交互项,并检验这些交互项的联合显著性。
②做一个容许不同时期有不同截距的混合回归来估计约束模型,从而得到SSR r。
然后,对T个时期中的每个时期都做一个回归,并分别得到残差平方和。
无约束残差平方和便是SSR ur=SSR1+SSR2+…+SSR T。
若有k个解释变量(不包括截距和时期虚拟变量)和T 个时期,便需要检验(T-1)k个约束。
而无约束模型中有T+Tk个待估计参数。
所以,若n为总观测次数,则F检验的df为(T-1)k和n-T-Tk。
F统计量:[(SSR r-SSR ur)/SSR ur][(n-T-Tk)/(T-1)k]。
但为了得到—个异方差-稳健的检验,必须构造交互项并做一个混合回归。
二、利用混合横截面作政策分析
1.自然实验与真实实验 当某些外生事件改变了个人、家庭、企业或城市运行的环境时,便产生了自然实验。
一个自然实验总有一个不受政策变化影响的对照组和一个被认为受政策变化影响的处理组,它不同于真实实验。
在真实实验中,处理组和对照组是随机而明确地抽取的;而在自然实验中,对照组和处理组均来自某个具体的政策变化。
为了控制好对照组和处理组之间的系统差异,需要两个年份的数据,一个在政策改变以前,另一个在政策改变之后。
于是样本就按使用目的划分为4组:变化前的对照组、变化后的对照组、变化前的处理组和变化后的处理组。
把对照组称为C ,处理组称为T ,并令处理组T 中观测的dT 等于1,否则等于0。
再令d2为第2个时期的虚拟变量,模型方程为y =β0+δ0d2+β1dT +δ1d2﹒dT +其他因素,
其中,y 是我们关注的结果变量。
δ1度量了政策效应。
若回归中没有其他因素,1
ˆδ就是倍差估计量:
()()12,2,1,1,ˆ,,T C T C δy y y y =-
2.平均处理效应及其估计方法
因度量对y 的平均结果的“处理”或政策效应,有时也被称为平均处理效应。
两种估计方法:
(1)在每个时期都计算处理组与控制组的平均值之差,然后再将不同时期的上述差值进行差分;
(2)分别计算处理组和控制组不同时期的平均值变化,然后将这些变化进行差分,这就意味着是求
()()12,2,1,1,ˆT T C C δy y y y =---
估计值1
ˆδ不会依赖于进行差分的方式。
三、两时期面板数据分析
1.固定效应模型
简单的回归方程很可能遇到遗漏变量的问题。
利用面板数据的方法,是把影响因变量的无法观测因素分为两类:一类是恒常不变的,另一类则随时间而变。
令i 表示横截面单位,t 表示时期,可将含有单个可观测解释变量的模型写成y it =β0+δ0d2t +β1x it +αi +u it ,t =1,2。
变量αi 概括了影响着y it 但又不随着时间而变化的所有无法观测的因素,一般都被称为非观测效应,在应用研究中也常常被称为固定效应,在时间上是固定的,模型被称为非观测效应模型或固定效应模型。
αi 又称为非观测异质性。
误差u it 常被称为特异误差或时变误差,因为它代表因时而变且影响着y it 的那些无法观测的因素。
2.估计β1的方法
给定两年的面板数据,一种可能性是,直接把两年的数据混合起来,然后用OLS 。
这种方法有两个缺点,最重要的一点是,为了使混合的OLS 得到β1的一个一致估计量,就必须假定非观测效应αi 和x it 无关。
模型写成:y it =β0+δ0d2t +β1x it +v it ,t =1,2。
其中,v it =αi +u it 常被称为复合误差。
即使假定特异误差u it 和x it 无关,如果αi 与x it 相关,混合OLS 估计就是偏误且不一致的。
由此造成的偏误有时又被称为异质性偏误,然而,它确实是由于遗漏了一个不随时间而变化的变量所致。
3.一阶差分方程
对横截面的第i个观测值,把两年的方程分别写为
y i2=(β0+δ0)+β1x i2+u i2(t=2)
y i1=β0+β1x i1+αi+u i1(t=1)
如果将第一个方程减去第二个方程,便得到
y i2-y i1=δ0+β1(x i2-x i1)+(u i2-u i1)
或∆y i=δ0+β1∆x i+∆u i。
非观测效应αi被“差分掉”了,该式称之为一阶差分方程。
它是单个横截面方程,但每个变量都取其时间上的差分。
∆u i与∆x i无关。
容许x it与不随时间而变化的无法观测因素相关,因此就不能把αi对y it的影响与不随时间而变的任何变量的影响分离开来。
式中β1的OLS估计量为一阶差分估计量。
另一个关键条件是,∆x i必须因i的不同而有所变化。
另外上式要满足同方差性。
OLS 估计量便是无偏的,而且全部统计推断都是精确的。
4.利用面板数据的差分控制非观测效应的代价
(1)面板数据比单个横截面更难于收集,特别是关于个人的数据。
必须进行一次调查,然后跟踪所有个人再进行另一次跟踪调查。
在进行第二次调查时,要查找跟踪对象通常很困难。
(2)即便得到了一个面板数据集,用于消除αi的差分也可能大大减少解释变量中的变异。
虽然可以利用很大的横截面来克服这一困难,但并非总能奏效。
而且,利用较长时间间隔的差分有时比利用逐年的变化来得好。
5.面板数据的编排
(1)假设有关于城市的两个不同年份的数据。
为了大多数目的,登记数据的最好方法
是,对每个城市都安排两个记录,每年一个,每个城市的第一个记录对应于较早的一年,第二个记录对应于较晚的一年。
这两个记录应该放在相邻位置(如相邻的两行)。
前两个记录用于样本中第一个城市,接下来两个记录用于第二个城市,依此类推。
这样就很容易构造差分并把这些差分贮存在每个城市的第二个记录中,也便于进行能与差分估计相比较的混合横截面分析。
(2)编排两期面板数据的第二种方法
对每个横截面单位仅安排一个记录。
这就需要对每个变量做两次登入,每个时期一个。
把数据都安排在一个记录里,其缺点是无法按照两期的原始数据进行混合OLS 分析。
而且,这种编排方法不适应于多于两期的面板数据集。
四、用两期面板数据作政策分析
面板数据对于政策分析非常有用,特别是项目评估。
项目评估模型中,令y it 为结果变量,并令prog it 为项目参与虚拟变量。
最简单的非观测效应模型为:
y it =β0+δ0d2t +β1prog it +αi +u it
(1)如果项目参与仅发生在第二个时期,那么在差分方程中β1的OLS 估计量就有一个非常简单的表达式:
1ˆtreat control βy y =∆-∆
有了面板数据,便可以对于同样的横截面单位取y 在不同时期的差分,由此得以控制个人、企业或城市特有的效应。
(2)如果项目参与发生在两个时期。
1
ˆβ的解释为:它代表Y 的均值因项目参与所致的。