EVIEWS用面板数据模型预测

EVIEWS用面板数据模型预测
EVIEWS用面板数据模型预测

第8讲用面板数据模型预测

1.面板数据定义

时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到的数据;截面数据是变量在固定时点的一组数据。面板数据是同时在时间和截面上取得的二维数据。面板数据也可以定义为相同截面上的个体在不同时点的重复观测数据或者称为纵向变量序列(个体)的多次测量。所以,面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。

面板数据示意图见图1。面板数据从横截面(cross section)看,是由若干个体(entity, unit, individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列。

图1 N=15,T=50的面板数据示意图

图2是1978~2005年中国各省级地区消费性支出占可支配收入比率序列图。

图2 1978-2005年中国各省级地区消费性支出占可支配收入比率序列图(价格平减过)

面板数据用双下标变量表示。例如

y i t, i = 1, 2, …, N; t = 1, 2, …, T

i对应面板数据中不同个体。N表示面板数据中含有N个个体。t对应面板数据中不同时点。T表示时间序列的最大长度。若固定t不变,y i ., ( i = 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。

这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据。

利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应回归模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。

例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。

对于面板数据y i t, i = 1, 2, …, N; t = 1, 2, …, T,如果每个个体在相同的时期内都有观测值记录,则称此面板数据为平衡面板数据(balanced panel data)。若面板数据中的个体在相同时期内缺失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。

案例1:1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)关系研究(file:5panel02)

1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)数据见file:panel02。数据是7年的,每一年都有15个数据,共105组观测值。

人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费面板数据按个体连线见图3,按截面连线见图4。人均收入面板数据按个体连线见图5,按截面连线见图6。

图3 15个省级地区的人均消费序列(个体)(file:5panel02)

图4 7个人均消费横截面数据(含15个地区)(每条连线表示同一年度15个地区的消费值)

图5 15个省级地区的人均收入序列(个体)(file:5panel02)

图6 7个人均收入横截面数据(含15个地区)(每条连线表示同一年度15个地区的收入值)

用CP表示消费,IP表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ,

ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。

图7 人均消费对收入的面板数据散点图(15个时间序列叠加)

2000

4000

6000

8000

10000

12000

2000400060008000100001200014000

IP(1996-2002)

CP1996

CP1997

CP1998

CP1999

CP2000

CP2001

CP2002

图8 人均消费对收入的面板数据散点图(7个截面叠加)

15个地区7年人均消费对收入的面板数据散点图见图7和图8。图7中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图8中每一种符号代表一个年度的截面散点图(共7个截面)。相当于观察7个截面散点图的叠加。

为了观察得更清楚,图9给出北京和内蒙古1996-2002年消费对收入散点图。从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古2002年的收入与消费规模还不如北京市1996年的大。图10给出该15个省级地区1996和2002年的消费对收入散点图。6年之后15个地区的消费和收入都有了相应的提高。

图9 北京和内蒙古1996-2002年消费对收入散点图 图10 1996和2002年15个地区的消费对收入散点图

2.面板数据模型分类

用面板数据建立的模型通常有3种,即混合回归模型、固定效应回归模型和随机效应回归模型。

2.1 混合回归模型(Pooled model )。 如果一个面板数据模型定义为, y it = α + X it 'β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (1) 其中y it 为被回归变量(标量),α表示截距项,X it 为k ?1阶回归变量列向量(包括k 个回归量),β为k ?1阶回归系数列向量,εit 为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截面,回归系数α和β都相同。

如果模型是正确设定的,解释变量与误差项不相关,即Cov(X it ,εit ) = 0。那么无论是N →∞,还是T →∞,模型参数的混合最小二乘估计量(Pooled OLS )都是一致估计量。

2.2 固定效应回归模型(fixed effects regression model )。 固定效应模型分为3种类型,即个体固定效应回归模型、时点固定效应回归模型和个体时点双固定效应回归模型。下面分别介绍。

2.2.1个体固定效应回归模型(entity fixed effects regression model ) 如果一个面板数据模型定义为,

y it = αi + X it 'β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (3) 其中αi 是随机变量,表示对于i 个个体有i 个不同的截距项,且其变化与X it 有关系;X it 为k ?1阶回归变量列向量(包括k 个回归量),β为k ?1阶回归系数列向量,对于不同个体回归系数相同,y it 为被回归变量(标量),εit 为误差项(标量),则称此模型为个体固定效应回归模型。

个体固定效应模型(3)的强假定条件是,

E(εit ∣αi , X it ) = 0, i = 1, 2, …, N

αi 作为随机变量描述不同个体建立的模型间的差异。因为αi 是不可观测的,且与可观测

的解释变量X it 的变化相联系,所以称(3)式为个体固定效应回归模型。 个体固定效应回归模型也可以表示为

y it = α1 D 1 + α2 D 2 + … +αN D N + X it 'β +εit , t = 1, 2, …, T (4) 其中

D i =?

??= 其他,,个个体如果属于第,,0 ..., ,2 ,1,1N i i

注意:

(1)在EViews5.0输出结果中αi 是以一个不变的常数部分和随个体变化的部分相加而成。(2)在EViews 5.0以上版本个体固定效应对话框中的回归因子选项中填不填c 输出结果都会有固定常数项。

个体固定效应回归模型的估计方法有多种,首先设法除去αi 的影响,从而保证β估计量的一致性。(详见第3节,面板数据模型估计方法。)

下面解释设定个体固定效应回归模型的原因。假定有面板数据模型 y it = β0 + β1 x it +β2 z i +εit , i = 1, 2, …, N ; t = 1, 2, …, T (5) 其中β0为常数,不随时间、截面变化;z i 表示随个体变化,但不随时间变化的难以观测的变

量。

以案例1为例,省家庭平均人口数就是这样的一个变量。对于短期面板来说,这是一个基本不随时间变化的量,但是对于不同的省份,这个变量的值是不同的。

上述模型可以被解释为含有N 个截距,即每个个体都对应一个不同截距的模型。令αi = β0 +β2 z i ,于是(5)式变为

y it = αi + β1 x it +εit , i = 1, 2, …, N ; t = 1, 2, …, T (6) 这正是个体固定效应回归模型形式。对于每个个体回归函数的斜率相同(都是β1),截距αi 却因个体不同而变化。可见个体固定效应回归模型中的截距项αi 中包括了那些随个体变化,但不随时间变化的难以观测的变量的影响。αi 是一个随机变量。因为z i 是不随时间变化的量,所以当对个体固定效应回归模型中的变量进行差分时,可以剔除那些随个体变化,但不随时间变化的难以观测变量的影响,即剔出αi 的影响。

以案例1(file:5panel02)为例得到的个体固定效应模型估计结果如下: 输出结果的方程形式是

t y 1?= γ?安徽+1

?β x 1t = (515.6 - 36.3) + 0.70 x 1t (55.0)

t y 2?= γ?北京+1

?βx 2t = (515.6 + 537.6) + 0.70 x 2t 。。。 (55.0)

t y 15?= γ?浙江+1

?βx 15t = (515.6 + 198.6) + 0.70 x 15t (55.0)

R 2 = 0.99, SSE r = 2270386, t 0.05 (88) = 1.98

从结果看,北京、上海、浙江是自发消费(消费函数截距)最大的3个地区。

图11 EViwes5.1个体固定效应回归模型的估计结果

2.2.2 时点固定效应回归模型(time fixed effects regression model ) 如果一个面板数据模型定义为,

y it = γt + X it 'β +εit , i = 1, 2, …, N (7) 其中γt 是模型截距项,随机变量,表示对于T 个截面有T 个不同的截距项,且其变化与X it 有关系;y it 为被回归变量(标量),εit 为误差项(标量),满足通常假定条件。X it 为k ?1阶回归变量列向量(包括k 个回归变量),β为k ?1阶回归系数列向量,则称此模型为时点固定效应回归模型。

时点固定效应回归模型也可以加入虚拟变量表示为 y it =γ0 + γ1 W 1 + γ2 W 2 + … +γ T W T + X it 'β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (8) 其中

W t =??

?= ,0

; ..., ,2 ,1 ,1)(。

,个截面不属于第其他个截面如果属于第t t T t

设定时点固定效应回归模型的原因。假定有面板数据模型

y it = γ0 + β1 x it +γ2 z t +εit , i = 1, 2, …, N ; t = 1, 2, …, T (9)

其中β0为常数,不随时间、截面变化;z t 表示随不同截面(时点)变化,但不随个体变化的难以观测的变量。

以案例1为例,“全国零售物价指数”就是这样的一个变量。对于不同时点,这是一个变化的量,但是对于不同省份(个体),这是一个不变化的量。

上述模型可以被解释为含有T 个截距,即每个截面都对应一个不同截距的模型。令γt = γ0 +γ2 z t ,于是(9)式变为

y it = γt + β1 x it +εit , i = 1, 2, …, N ; t = 1, 2, …, T (10) 这正是时点固定效应回归模型形式。对于每个截面,回归函数的斜率相同(都是β1),γt 却因截面(时点)不同而异。可见时点固定效应回归模型中的截距项γt 包括了那些随不同截面(时点)变化,但不随个体变化的难以观测的变量的影响。γt 是一个随机变量。

以例1为例得到的时点固定效应模型估计结果见图11,代数式如下:

1?i y =γ?0 +γ?1996 +1

?βx i 1 = (2.6 + 105.9) + 0.7789 x i 1 , t = 1996 (0.04) (74.6)

2?i y =γ?0 +γ?1997 +1

?βx i 2 = (2.6 + 134.1) + 0.7789 x i 2 , t = 1997 (0.04) (74.6) …

7?i y =γ?0 +γ?2002 +1

?βx i 7 = (2.6 - 93.9) + 0.7789 x i 7 , t = 2002 (0.04) (74.6)

R 2 = 0.9867, SSE r = 4028843, t 0.05 (97) = 1.98

2.2.3 个体时点固定效应回归模型(time and entity fixed effects regression model ) 如果一个面板数据模型定义为,

y it = α0 +αi +γt + X it 'β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (11) 其中y it 为被回归变量(标量);αi 是随机变量,表示对于N 个个体有N 个不同的截距项,且其变化与X it 有关系;γt 是随机变量,表示对于T 个截面(时点)有T 个不同的截距项,且其变化与X it 有关系;X it 为k ?1阶回归变量列向量(包括k 个回归量);β为k ?1阶回归系数列向量;εit 为误差项(标量)满足通常假定(εit ?X it , αi , γt ) = 0;则称此模型为个体时点固定效应回归模型。

个体时点固定效应回归模型还可以表示为,

y it = α0 +α1 D 1+α2 D 2 +…+αN D N + γ1W 1+ γ2W 2 +…+γ T W T + X it 'β +εit , (12) 其中

D i =??

?= 其他,

,

个个体如果属于第,,0 ..., ,2,1,1N i i (13)

W t =?

?

?= ,0

;,...,2,1 ,1)(。,个截面不属于第其他个截面如果属于第t t T t (14)

如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型(12)进行混合

OLS 估计,全部参数估计量都是不一致的。正如个体固定效应回归模型可以得到一致的、甚至有效的估计量一样,一些计算方法也可以使个体时点双固定效应回归模型得到更有效的参数估计量。

以例1为例得到的截面、时点固定效应模型估计结果如下:

图12 EViwes 5.1截面、时点双固定效应模型估计结果

注意:

对于第1个截面(t =1)EViwes 输出结果中把(α +αi +γ1), (i = 1, 2, …, N )合在一起。第2, …, T 个截面以此类推。 输出结果如下:

19961,?y =γ?0 +α?1+γ?1996 +1?β x 1,1996 = 681.9 - 68.6 - 75.3 + 0.67 x 1,1996 (安徽省)

19962,?y =γ?0 +α?2+γ?1996 +1

?β x 2,1996 = 681.9 + 617.2 - 75.3 + 0.67x 2,1996(北京市) …

19971,?y =γ?0 +α?1+γ?1997 +1?βx 1,1997 = 681.9 - 68.6 +23.6 + 0.67 x 1,1997 (安徽省)

19972,?y =γ?0 +α?2+γ?1997 +1

?β x 2,1997 = 681.9 + 617.2 + 0.67x 2,1997,(北京市) …

200215,?y =γ?0 +α?15 +γ?2002+1

?βx 15,2002 =183.39 +870.42+23.6 + 0.67x 15,2002(浙江省) R 2 = 0.9932, SSE r = 2045670, t 0.05 (83) = 1.98

回归系数为0.67,这与个体固定效应回归模型给出的估计结果0.70基本一致。

在上述三种固定效应回归模型中,个体固定效应回归模型最为常用。

2.3 随机效应模型

对于面板数据模型

y it = αi+X it'β +εit, i = 1, 2, …, N; t = 1, 2, …, T(15)

如果αi为随机变量,其分布与X it无关;X it为k?1阶回归变量列向量(包括k个回归量),β为k?1阶回归系数列向量,对于不同个体回归系数相同,y it为被回归变量(标量),εit为误差项(标量),这种模型称为个体随机效应回归模型(随机截距模型、随机分量模型)。其假定条件是

αi~ iid(α, σα2)

εit~ iid(0, σε2)

都被假定为独立同分布,但并未限定何种分布。

同理也可定义时点随机效应回归模型和个体时点随机效应回归模型,但个体随机效应回归模型最为常用。

这里所说的个体随机效应回归模型其实是有别于真正的随机效应回归模型。

对于个体随机效应模型,E(αi?X it) =α,则有,E(y it?x it) =α + X it'β,对y it可以识别。所以随机效应模型参数的混合OLS估计量具有一致性,但不具有有效性。

注意:术语“随机效应模型”和“固定效应模型”用得并不十分恰当,容易产生误解。其实固定效应模型应该称之为“相关效应模型”,而随机效应模型应该称之为“非相关效应模型”。因为固定效应模型和随机效应模型中的αi都是随机变量。

例1的个体随机效应模型估计结果如下:

图13 个体随机效应模型估计结果

3.面板数据模型估计方法

面板数据模型中β的估计量既不同于截面数据估计量,也不同于时间序列估计量,其性质随设定固定效应模型是否正确而变化。回归变量x it 可以是时变的,也可以是非时变的。

3.1 混合最小二乘(Pooled OLS )估计

混合OLS 估计方法是在时间上和截面上把NT 个观测值混合在一起,然后用OLS 法估计模型参数。给定混合模型

y it = α + X it 'β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (19) 如果模型是正确设定的,且解释变量与误差项不相关,即Cov (X it ,εit ) = 0。那么无论是N →∞,还是T →∞,模型参数的混合最小二乘估计量都具有一致性。

对混合模型通常采用的是混合最小二乘(Pooled OLS )估计法。

然而,在误差项服从独立同分布条件下由OLS 法得到的方差协方差矩阵,在这里通常不会成立。因为对于每个个体i 及其误差项来说通常是序列相关的。NT 个相关观测值要比NT 个相互独立的观测值包含的信息少。从而导致误差项的标准差常常被低估,估计量的精度被虚假夸大。

如果模型存在个体固定效应,即αi 与X it 相关,那么对模型应用混合OLS 估计方法,估计量不再具有一致性。解释如下:

假定模型实为个体固定效应模型y it = αi + X it 'β +εit ,但却当作混合模型来估计参数,则模型可写为

y it = α + X it 'β + (αi -α +εit ) = α + X it 'β + u it (20)

其中u it = (αi -α +εit )。因为αi 与X it 相关,也即u it 与X it 相关,所以个体固定效应模型的参数若采用混合OLS 估计,估计量不具有一致性。

3.2平均数(between )OLS 估计

平均数OLS 估计法的步骤是首先对面板数据中的每个个体求平均数,共得到N 个平均数(估计值)。然后利用y it 和X it 的N 组观测值估计参数。以个体固定效应回归模型

y it = αi + X it 'β +εit (21)

为例,首先对面板中的每个个体求平均数,从而建立模型

i y = αi +i X 'β +i ε, i = 1, 2, …, N (22)

其中i y =∑=-T

t it

y

T

1

1

,i X =∑=-T

t it T

1

1

X ,i

ε

=∑=-T

t it

T

1

1

ε

,i = 1, 2, …, N 。变换上式得

i y = α +i X 'β +(α i - α +i ε), i = 1, 2, …, N (23)

上式称作平均数模型。对上式应用OLS 估计,则参数估计量称作平均数OLS 估计量。此条件下的样本容量为N ,(T =1)。 如果i X 与(α i - α +i ε)相互独立,α和β的平均数OLS 估计量是一致估计量。平均数OLS 估计法适用于短期面板的混合模型和个体随机效应模型。对于个体固定效应模型来说,由于

αi 和X it 相关,也即αi 和i X 相关,所以,回归参数的平均数OLS 估计量是非一致估计量。

3.3 离差变换(within )OLS 估计

对于短期面板数据,离差变换OLS 估计法的原理是先把面板数据中每个个体的观测值

变换为对其平均数的离差观测值,然后利用离差变换数据估计模型参数。具体步骤是,对于个体固定效应回归模型

y it = αi + X it 'β +εit (24)

中的每个个体计算平均数,可得到如下模型,

i y = αi +i X 'β +i ε

其中i y 、i X 、i ε的定义见(22)式。上两式相减,消去了αi ,得

y it -i y = (X it -i X )'β + (εit -i ε)

此模型称作离差变换数据模型。对上式应用OLS 估计,所得β的估计量称作离差变换OLS 估计量。对于个体固定效应回归模型,β的离差变换OLS 估计量是一致估计量。如果εit 还满足独立同分布条件,β的离差变换OLS 估计量不但具有一致性而且还具有有效性。如果对固定效应αi 感兴趣,也可按下式估计。

i α

?=i y -i X 'β? (27) 利用中心化(或离差变换)数据,计算回归参数估计量β

?的方差协方差矩阵如下, ∧

Var (β

?) = 2?σ[( X it -i X )' (X it -i X )]-1 (28) 其中2?σ

=k

N NT i it i it ---'-)??()??(εεεε

个体固定效应回归模型的估计通常采用的就是离差变换(within )OLS 估计法。

在短期面板条件下,即便αi 的分布、以及αi 和X it 的关系都已知到,αi 的估计量仍不具有一致性。当个体数N 不大时,可采用OLS 虚拟变量估计法估计αi 和β。

离差变换OLS 估计法的主要缺点是不能估计非时变回归变量构成的面板数据模型。比如X it = X i (非时变变量),那么有i X = X i ,计算离差时有X i -i X = 0。

3.4 一阶差分(first difference )OLS 估计

在短期面板条件下,一阶差分OLS 估计就是对个体固定效应模型中的回归量与被回归量的差分变量构成的模型的参数进行OLS 估计。具体步骤是,对个体固定效应回归模型

y it = αi + X it 'β +εit

取其滞后一期关系式

y it -1 = αi + X it -1'β +εit -1

上两式相减,得一阶差分模型(αi 被消去)

y it -y it -1 = (X it - X it -1) 'β + (εit -εit -1) , i = 1, 2, …, N ; t = 1, 2, …, T

对上式应用OLS 估计得到的β的估计量称作一阶差分OLS 估计量。尽管αi 不能被估计,β的估计量是一致估计量。

在T >2,εit 独立同分布条件下得到的β的一阶差分OLS 估计量不如离差变换OLS 估计量有效。

3.5 随机效应(random effects )估计法(可行GLS (feasible GLS )估计法) 有个体固定效应模型

y it = αi + X it 'β +εi

αi ,εit 服从独立同分布。对其作如下变换

y it -i y λ?= (1-λ?)μ + (X it -λ?i

X )'β + v it (29) 其中v it = (1-λ?)αi + (εit -λ?i

ε)渐近服从独立同分布,λ = 1-2

2

α

εεσσσT +,应用OLS 估计,

则所得估计量称为随机效应估计量或可行GLS 估计量。当λ?= 0时,(29)式等同于混合OLS 估计;当λ?=1时,(29)式等同于离差变换OLS 估计。

对于随机效应模型,可行GLS 估计量不但是一致估计量,而且是有效估计量,但对于

个体固定效应模型,可行GLS 估计量不是一致估计量。

面板数据模型估计量的稳健统计推断。在实际的经济面板数据中,N 个个体之间相互独立的假定通常是成立的,但是每个个体本身却常常是序列自相关的,且存在异方差。为了得到正确的统计推断,需要克服这两个因素。

对于第i 个个体,当N →∞,X i ?的方差协方差矩阵仍然是T ?T 有限阶的,所以可以用以前的方法克服异方差。采用GMM 方法还可以得到更有效的估计量。

EViwes 中对随机效应回归模型的估计采用的就是可行(feasible )GLS 估计法。

4.面板数据模型设定的检验方法

面板数据建模的一项重要任务就是判别模型中是否存在个体固定效应。以个体随机效应模型y it = αi + X it 'β +εit ,为例,无论是固定效应还是随机效应模型,αi 都被看作是随机变量,并都有假定条件

E(y it ?αi , X it ) = αi + X it 'β

下面介绍两种检验方法,F 检验和Hausman 检验。

4.1 F 检验

先介绍原理。F 统计量定义为 F =

)

/(/)(k T SSE m

SSE SSE u u r -- (30)

其中SSE r 表示施加约束条件后估计模型的残差平方和,SSE u 表示未施加约束条件的估计模型的残差平方和,m 表示约束条件个数,T 表示样本容量,k 表示未加约束的模型中被估参数的个数。在原假设“约束条件真实”条件下,F 统计量渐近服从自由度为( m , T – k )的F 分布。

F ~ F ( m , T – k )

以检验建立混合回归模型还是个体固定效应回归模型为例,介绍F 检验的应用。建立假设

H 0:αi =α。模型中不同个体的截距相同(真实模型为混合回归模型)。 H 1:模型中不同个体的截距项αi 不同(真实模型为个体固定效应回归模型)。 F 统计量定义为:

F =

)

/()]()/[()(k N NT SSE k N NT k NT SSE SSE u u r -------=)/(/)(k N NT SSE N

SSE SSE u u r --- (31)

其中SSE r 表示约束模型,即混合估计模型的残差平方和,SSE u 表示非约束模型,即个体固定效应回归模型的残差平方和。约束条件为N 个。k 表示公共参数个数。

以案例1为例,已知SSE r = 4824588,SSE u =2270386,个体数15。

F =

)/(/)(k N NT SSE N SSE SSE u u r ---=)

215105/(227038615

/)22703864824588(---

=

25799

170280

= 6.6 (32) F 0.05(15, 88) = 1.8

因为F = 6.6 > F 0.05(15, 88) = 1.8,推翻原假设,比较上述两种模型,建立个体固定效应回归模型比混合回归模型更合理。

以检验建立混合回归模型还是时点固定效应回归模型为例,介绍F 检验的应用。建立假设

H 0:γt =γ。模型中不同截面的截距相同(真实模型为混合回归模型)。

H 1:模型中不同截面的截距项γt 不同(真实模型为时点固定效应回归模型)。 F 统计量定义为:

F =

)/()]()/[()(k T NT SSE k T NT k NT SSE SSE u u r -------=)

/(/)(k N NT SSE T

SSE SSE u u r --- (31)

其中SSE r 表示约束模型,即混合估计模型的残差平方和,SSE u 表示非约束模型,即时点固

定效应回归模型的残差平方和。约束条件为T 个。k 表示公共参数个数。

以案例1为例,已知SSE r = 4824588,SSE u = 4028843,截面个数7。

F =

)

/(/)(k N NT SSE T SSE SSE u u r ---=)27105/(40288437

/)40288434824588(--- =

41967

113678

= 2.7 (32) F 0.05(7, 96) = 2.1

因为F = 2.7 > F 0.05(15, 88) = 2.1,推翻原假设,比较上述两种模型,建立时点固定效应回归模型比混合回归模型更合理。

4.2 Hausman 检验

原假设与备择假设是

H 0: 个体效应与回归变量无关(个体随机效应回归模型) H 1: 个体效应与回归变量相关(个体固定效应回归模型) 例:

W β?=0.6976,s(W

β?) = 0.0127(个体固定效应回归模型估计结果,对应图10); RE β~=0.7246,s(RE β~

) = 0.0106(个体随机效应回归模型估计结果,对应图13)

H = 222

)

~()?()~?(RE W RE W s s ββββ-- = 2220106.00127.0)7246.06976.0(--= 14.89 因为H =14.89 > χ20.05 (1) = 3.8,所以模型存在个体固定效应。应该建立个体固定效应回

归模型。

注意:EViews 5.0可以直接进行Hausman 检验(见案例9)。

5.面板数据建模案例分析 案例1(file:5panel02):图14是混合估计对应数据的散点图。回归结果如下(EViwes 输出见案例),

CP = 129.63 + 0.76 IP

(2.0) (79.7)

图14 混合估计散点图 图15 平均数估计散点图

图15是平均值数据散点图。先对数据按个体求平均数CP 和IP 。然后用15组平均值数据回归,

CP

= -40.88 + 0.79IP

(-0.3) (41.1)

图16 离差变换估计散点图 图17 差分估计散点图

图16是离差变换数据散点图。先计算CP 、IP 分别对CP 、IP 的离差变换数据,然后用离差变换数据计算OLS 回归。

CPM = 0.77 IPM

(90)

图17是一阶差分数据散点图。先对CP 、IP 各个体作一阶差分,然后用一阶差分数据回归。

DCP = 0.71 DIP

(24)

由上一节知此问题应该建立个体固定效应回归模型,所以离差变换OLS 估计方法是最有效的,参数估计值0.77最可信。

案例2 美国公路交通事故死亡人数与啤酒税的关系研究(file:5panel01a )

见Stock J H and M W Watson, Introduction to Econometrics, Addison Wesley, 2003第8章。美国每年有4万高速公路交通事故,约1/3涉及酒后驾车。这个比率在饮酒高峰期会上升。早晨1~3点25%的司机饮酒。饮酒司机出交通事故数是不饮酒司机的13倍。现有1982~1988年48个州共336组美国公路交通事故死亡人数(number )与啤酒税(beertax )的数据。

1.01.5

2.02.5

3.03.5

4.04.50.0

0.4

0.8

1.2

1.6

2.0

2.4

2.8

BEER82

V F R 82

VFR82 vs. BEER82

图18 1982年数据散点图(File: 5panel01a-graph01) 图19 1988年数据散点图(File:5panel01a- graph07)

1982年数据的估计结果(散点图见图18)

number 1982 = 2.01 + 0.15 beertax 1982

(0.15) (0.13)

1988年数据的估计结果(散点图见图19)

number 1988 = 1.86 + 0.44 beertax 1988

(0.11) (0.13)

图20 混合估计共336个观测值。估计结果仍不可靠。(file: 5panel01b )

1982~1988年混合数据估计结果(散点图见图20)

number 1982~1988 = 1.85 + 0.36 beertax 1982~1988

(42.5) (5.9) SSE=98.75

显然以上三种估计结果都不可靠(回归参数符号不对)。原因是啤酒税之外还有许多因

素(如各州的路况、车型、交通立法等因素)影响交通事故死亡人数。从面板理论上说,不知混合回归模型是不是最优的模型形式。

按个体固定效应回归模型估计

number it = 2.375 +… - 0.66 beertax it

(24.5) (-3.5) SSE=10.35

用F 检验判断应该建立混合回归模型还是个体固定效应回归模型。

H 0:αi =α ,混合回归模型(约束截距项为同一参数)。

H 1:αi 各不相同。个体固定效应回归模型(截距项任意取值)

F =

)

2/(/)(---N NT SSE N

SSE SSE u u r (以EViwes5.0计算自由度)

=

)/(./)..(5033635104835107598--=0362

084

1..= 50.8

F 0.05(48, 286) = 1.2

因为F = 50.8 > F 0.05(14, 89) = 1.2,推翻原假设,比较上述两种模型,建立个体固定效应回归模型更合理。

按双固定效应回归模型估计

number it = 2.37 +… - 0.646 beertax it

(23.3) (-3.25) SSE=9.92

用F 检验判断应该建立混合回归模型还是个体时点双固定效应回归模型。

H 0:αi =α。γt =γ。混合回归模型(约束截距项为同一参数)。

H 1:αi ,γt 各不相同。个体时点双固定效应回归模型(截距项任意取值)

F =

)

/()

/()(k T N NT SSE T N SSE SSE u u r ---+- (以EViwes5.0计算自由度)

=

)2748336/(92.9)748/()92.975.98(---+-=036

.062

.1= 45

F 0.05(55, 279) = 1.6

因为F = 45 > F 0.05(55, 279) = 1.6,推翻原假设,比较上述两种模型,建立个体时点双固定效应回归模型更合理。

以上两种模型回归系数的估计结果非常近似。F 检验也说明,建立个体固定效应回归模型和双固定效应回归模型都要比混合回归模型合理。所以回归参数- 0.66和- 0.646要比混合回归模型参数0.36合理。

因为差分OLS 估计也是估计固定效应回归模型的一种方法,下面讨论面板差分数据得到的估计结果。利用1988年和1982年数据的差分数据得估计结果(散点图见图21)。这个估计结果在符号上也是合理的。

∧number 1988 -∧

number 1982 = -0.072 - 1.04 (beertax 1988 - beertax 1982)

(0.065) (0.36)

图21 差分数据散点图(File:5panel01a- graph08)

因此问题应该建立个体固定效应回归模型,所以个体固定效应估计结果-0.66应当更可信。

6.面板数据模型的EViwes操作

6.1 用EViwes 5.0建立面板数据估计模型步骤。(file:5panel02)

利用(例1)1996~2002年15个省级地区城镇居民家庭年人均消费性支出和年人均收入数据(不变价格数据)介绍面板数据模型估计步骤。

(1)建立混合数据库(Pool)对象。

首先建立年度工作文件(1996 2002)。在打开工作文件窗口的基础上,点击EViwes主功能菜单上的Objects键,选New Object功能(如图1),从而打开New Object(新对象)选择窗(如图2)。在Type of Object选择区选择Pool(合并数据库),并在Name of Object选择区为混合数据库起名Pool01(初始显示为Untitled)。点击图2中OK键,从而打开混合数据库(Pool)窗口。在窗口中输入15个地区的标识AH(安徽)、BJ(北京)、…、ZJ(浙江),如图3。

图1 图2

图3

(2)定义序列名并输入数据。

在新建的混合数据库(Pool)窗口的工具栏中点击Sheet键(第2种路径是,点击View 键,选Spreadsheet (stacked data)功能),从而打开Series List(列写序列名)窗口,定义时间序列变量CP?和IP?(符号?表示与CP和IP相连的15个地区标识名)如图4。

图4

点击OK键,从而打开混合数据库(Pool)窗口(图5)。(点击Edit+-键,使EViwes处于可编辑状态)可以用键盘输入数据,也可以用复制和粘贴的方法输入数据。

图5

图5所示为以个体为序的阵列式排列(stacked data)。点击Order+-键,还可以变换为以截面为序的阵列式排列。输入完成后的情形见图6。

图6

点击PanelGener可以通过公式用已有的变量生成新变量(注意:输入变量时,不要忘记带变量后缀“?”)。

这是1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。数据是7年的,每一年都有15个数据,共105组观测值。

用cp表示消费,ip表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。

人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。

在工作文件中打开面板数据窗口,点击View键,选Descriptive Stats功能可以得到面板数据按个体计算的特征数。见图7。

EVIEWS用面板数据模型预测

第8讲用面板数据模型预测 1.面板数据定义 时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到的数据;截面数据是变量在固定时点的一组数据。面板数据是同时在时间和截面上取得的二维数据。面板数据也可以定义为相同截面上的个体在不同时点的重复观测数据或者称为纵向变量序列(个体)的多次测量。所以,面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。 面板数据示意图见图1。面板数据从横截面(cross section)看,是由若干个体(entity, unit, individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列。 图1 N=15,T=50的面板数据示意图 图2是1978~2005年中国各省级地区消费性支出占可支配收入比率序列图。 图2 1978-2005年中国各省级地区消费性支出占可支配收入比率序列图(价格平减过)

面板数据用双下标变量表示。例如 y i t, i = 1, 2, …, N; t = 1, 2, …, T i对应面板数据中不同个体。N表示面板数据中含有N个个体。t对应面板数据中不同时点。T表示时间序列的最大长度。若固定t不变,y i ., ( i = 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据。 利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应回归模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。 例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。 对于面板数据y i t, i = 1, 2, …, N; t = 1, 2, …, T,如果每个个体在相同的时期内都有观测值记录,则称此面板数据为平衡面板数据(balanced panel data)。若面板数据中的个体在相同时期内缺失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。 案例1:1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)关系研究(file:5panel02) 1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)数据见file:panel02。数据是7年的,每一年都有15个数据,共105组观测值。 人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费面板数据按个体连线见图3,按截面连线见图4。人均收入面板数据按个体连线见图5,按截面连线见图6。 图3 15个省级地区的人均消费序列(个体)(file:5panel02)

eviews面板数据实例分析

1、已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp,不变价格)与人均收入(ip,不变价格)居民,利用数据(1)建立面板数据(panel data)工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。 年人均消费(consume)与人均收入(income)数据以及消费者价格指数(p)分别见表9、1,9、2与9、3。 表9、1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据人均消费1996 1997 1998 1999 2000 2001 2002 CONSUMEAH 3607、43 3693、55 3777、41 3901、81 4232、98 4517、65 4736、52 CONSUMEBJ 5729、52 6531、81 6970、83 7498、48 8493、49 8922、72 10284、6 CONSUMEFJ 4248、47 4935、95 5181、45 5266、69 5638、74 6015、11 6631、68 CONSUMEHB 3424、35 4003、71 3834、43 4026、3 4348、47 4479、75 5069、28 CONSUMEHLJ 3110、92 3213、42 3303、15 3481、74 3824、44 4192、36 4462、08 CONSUMEJL 3037、32 3408、03 3449、74 3661、68 4020、87 4337、22 4973、88 CONSUMEJS 4057、5 4533、57 4889、43 5010、91 5323、18 5532、74 6042、6 CONSUMEJX 2942、11 3199、61 3266、81 3482、33 3623、56 3894、51 4549、32 CONSUMELN 3493、02 3719、91 3890、74 3989、93 4356、06 4654、42 5342、64 CONSUMENMG 2767、84 3032、3 3105、74 3468、99 3927、75 4195、62 4859、88 CONSUMESD 3770、99 4040、63 4143、96 4515、05 5022 5252、41 5596、32 CONSUMESH 6763、12 6819、94 6866、41 8247、69 8868、19 9336、1 10464 CONSUMESX 3035、59 3228、71 3267、7 3492、98 3941、87 4123、01 4710、96 CONSUMETJ 4679、61 5204、15 5471、01 5851、53 6121、04 6987、22 7191、96 CONSUMEZJ 5764、27 6170、14 6217、93 6521、54 7020、22 7952、39 8713、08 表9、2 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均收入(元)数据人均收入1996 1997 1998 1999 2000 2001 2002 INCOMEAH 4512、77 4599、27 4770、47 5064、6 5293、55 5668、8 6032、4 INCOMEBJ 7332、01 7813、16 8471、98 9182、76 10349、69 11577、78 12463、92 INCOMEFJ 5172、93 6143、64 6485、63 6859、81 7432、26 8313、08 9189、36 INCOMEHB 4442、81 4958、67 5084、64 5365、03 5661、16 5984、82 6679、68 INCOMEHLJ 3768、31 4090、72 4268、5 4595、14 4912、88 5425、87 6100、56 INCOMEJL 3805、53 4190、58 4206、64 4480、01 4810 5340、46 6260、16 INCOMEJS 5185、79 5765、2 6017、85 6538、2 6800、23 7375、1 8177、64 INCOMEJX 3780、2 4071、32 4251、42 4720、58 5103、58 5506、02 6335、64 INCOMELN 4207、23 4518、1 4617、24 4898、61 5357、79 5797、01 6524、52 INCOMENMG 3431、81 3944、67 4353、02 4770、53 5129、05 5535、89 6051 INCOMESD 4890、28 5190、79 5380、08 5808、96 6489、97 7101、08 7614、36 INCOMESH 8178、48 8438、89 8773、1 10931、64 11718、01 12883、46 13249、8 INCOMESX 3702、69 3989、92 4098、73 4342、61 4724、11 5391、05 6234、36 INCOMETJ 5967、71 6608、39 7110、54 7649、83 8140、5 8958、7 9337、56 INCOMEZJ 6955、79 7358、72 7836、76 8427、95 9279、16 10464、67 11715、6 表9、3 1996—2002年中国东北、华北、华东15个省级地区的消费者物价指数物价指数1996 1997 1998 1999 2000 2001 2002 PAH 109、9 101、3 100 97、8 100、7 100、5 99

EViews面板数据模型估计教程

EViews 6.0 beta在面板数据模型估计中的应用 来自免费的minixi 1、进入工作目录cd d:\nklx3,在指定的路径下工作是一个良好的习惯 2、建立面板数据工作文件workfile (1)最好不要选择EViews默认的blanaced panel 类型 Moren_panel (2)按照要求建立简单的满足时期周期和长度要求的时期型工作文件

3、建立pool对象 (1)新建对象 (2)选择新建对象类型并命名 (3)为新建pool对象设置截面单元的表示名称,在此提示下(Cross Section Identifiers: (Enter identifiers below this line )输入截面单元名称。,建议采用汉语拼音,例如29个省市区的汉语拼音,建议在拼音名前加一个下划线“_”,如图

关闭建立的pool对象,它就出现在当前工作文件中。 4、在pool对象中建立面板数据序列 双击pool对象,打开pool对象窗口,在菜单view的下拉项中选择spreedsheet (展开表) 在打开的序列列表窗口中输入你要建立的序列名称,如果是面板数据序列必须在序列名后添加“?”。例如,输入GDP?,在GDP后的?的作用是各个截面单元的占位符,生成了29个省市区的GDP的序列名,即GDP后接截面单元名,再在接时期,就表示出面板数据的3维数据结构(1变量2截面单元3时期)了。

请看工作文件窗口中的序列名。展开表(类似excel)中等待你输入、贴入数据。 (1)打开编辑(edit)窗口

(2)贴入数据 (3)关闭pool窗口,赶快存盘见好就收6、在pool窗口对各个序列进行单位根检验 选择单位根检验 设置单位根检验

Eviews面板大数据之固定效应模型

Eviews 面板数据之固定效应模型 在面板数据线性回归模型中,如果对于不同的截面或不同的时间序列,只是模型的截距项是不同的,而模型的斜率系数是相同的,则称此模型为固定效应模型。固定效应模型分为三类: 1.个体固定效应模型 个体固定效应模型是对于不同的纵剖面时间序列(个体)只有截距项不同的模型: 2 K it i k kit it k y x u λβ==++∑ (1) 从时间和个体上看,面板数据回归模型的解释变量对被解释变量的边际影响均是相同的,而且除模型的解释变量之外,影响被解释变量的其他所有(未包括在回归模型或不可观测的)确定性变量的效应只是随个体变化而不随时间变化时。 检验:采用无约束模型和有约束模型的回归残差平方和之比构造F 统计量,以检验设定个体固定效应模型的合理性。F 模型的零假设: 01231:0N H λλλλ-===???== ()1 (1,(1)1)(1) RRSS URSS N F F N N T K URSS NT N K --= ---+--+ RRSS 是有约束模型(即混合数据回归模型)的残差平方和,URSS 是无约束模型ANCOVA 估计的残差平方和或者LSDV 估计的残差平方和。 实践: 一、数据:已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp ,不变价格)和人均收入(ip ,不变价格)居民,利用数据(1)建立面板数据(panel data )工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。年人均消费(consume )和人均收入(income )数据以及消费者价格指数(p )分别见表1,2和3。 表1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据

EViews6.0在面板数据模型估计中的操作

EViews 6.0在面板数据模型估计中的实验操作 1、进入工作目录cd d:\nklx3,在指定的路径下工作是一个良好的习惯 2、建立面板数据工作文件workfile (1)最好不要选择EViews默认的blanaced panel 类型 Moren_panel (2)按照要求建立简单的满足时期周期和长度要求的时期型工作文件

3、建立pool对象 (1)新建对象 (2)选择新建对象类型并命名 (3)为新建pool对象设置截面单元的表示名称,在此提示下(Cross Section Identifiers: (Enter identifiers below this line )输入截面单元名称。建议采用汉语拼音,例如29个省市区的汉语拼音,建议在拼音名前加一个下划线“_”,如图

关闭建立的pool对象,它就出现在当前工作文件中。 4、在pool对象中建立面板数据序列 双击pool对象,打开pool对象窗口,在菜单view的下拉项中选择spreedsheet (展开表) 在打开的序列列表窗口中输入你要建立的序列名称,如果是面板数据序列必须在序列名后添加“?”。例如,输入GDP?,在GDP后的?的作用是各个截面单元的占位符,生成了29个省市区的GDP的序列名,即GDP后接截面单元名,再在接时期,就表示出面板数据的3维数据结构(1变量2截面单元3时期)了。

请看工作文件窗口中的序列名。展开表(类似excel)中等待你输入、贴入数据。 (1)打开编辑(edit)窗口

(2)贴入数据 (3)关闭pool窗口,赶快存盘见好就收6、在pool窗口对各个序列进行单位根检验 选择单位根检验 设置单位根检验

eviews面板数据模型详解

1.已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp,不变价格)和人均收入(ip,不变价格)居民,利用数据(1)建立面板 数据(panel data)工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。 年人均消费(consume)和人均收入(income)数据以及消费者价格指数(p)分别见表9.1,9.2和9.3。 表9.1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据人均消费1996 1997 1998 1999 2000 2001 2002 CONSUMEAH 3607.43 3693.55 3777.41 3901.81 4232.98 4517.65 4736.52 CONSUMEBJ 5729.52 6531.81 6970.83 7498.48 8493.49 8922.72 10284.6 CONSUMEFJ 4248.47 4935.95 5181.45 5266.69 5638.74 6015.11 6631.68 CONSUMEHB 3424.35 4003.71 3834.43 4026.3 4348.47 4479.75 5069.28 CONSUMEHLJ 3110.92 3213.42 3303.15 3481.74 3824.44 4192.36 4462.08 CONSUMEJL 3037.32 3408.03 3449.74 3661.68 4020.87 4337.22 4973.88 CONSUMEJS 4057.5 4533.57 4889.43 5010.91 5323.18 5532.74 6042.6 CONSUMEJX 2942.11 3199.61 3266.81 3482.33 3623.56 3894.51 4549.32 CONSUMELN 3493.02 3719.91 3890.74 3989.93 4356.06 4654.42 5342.64 CONSUMENMG 2767.84 3032.3 3105.74 3468.99 3927.75 4195.62 4859.88 CONSUMESD 3770.99 4040.63 4143.96 4515.05 5022 5252.41 5596.32 CONSUMESH 6763.12 6819.94 6866.41 8247.69 8868.19 9336.1 10464 CONSUMESX 3035.59 3228.71 3267.7 3492.98 3941.87 4123.01 4710.96 CONSUMETJ 4679.61 5204.15 5471.01 5851.53 6121.04 6987.22 7191.96 CONSUMEZJ 5764.27 6170.14 6217.93 6521.54 7020.22 7952.39 8713.08 表9.2 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均收入(元)数据人均收入1996 1997 1998 1999 2000 2001 2002 INCOMEAH 4512.77 4599.27 4770.47 5064.6 5293.55 5668.8 6032.4 INCOMEBJ 7332.01 7813.16 8471.98 9182.76 10349.69 11577.78 12463.92 INCOMEFJ 5172.93 6143.64 6485.63 6859.81 7432.26 8313.08 9189.36 INCOMEHB 4442.81 4958.67 5084.64 5365.03 5661.16 5984.82 6679.68 INCOMEHLJ 3768.31 4090.72 4268.5 4595.14 4912.88 5425.87 6100.56 INCOMEJL 3805.53 4190.58 4206.64 4480.01 4810 5340.46 6260.16 INCOMEJS 5185.79 5765.2 6017.85 6538.2 6800.23 7375.1 8177.64 INCOMEJX 3780.2 4071.32 4251.42 4720.58 5103.58 5506.02 6335.64 INCOMELN 4207.23 4518.1 4617.24 4898.61 5357.79 5797.01 6524.52 INCOMENMG 3431.81 3944.67 4353.02 4770.53 5129.05 5535.89 6051 INCOMESD 4890.28 5190.79 5380.08 5808.96 6489.97 7101.08 7614.36 INCOMESH 8178.48 8438.89 8773.1 10931.64 11718.01 12883.46 13249.8 INCOMESX 3702.69 3989.92 4098.73 4342.61 4724.11 5391.05 6234.36 INCOMETJ 5967.71 6608.39 7110.54 7649.83 8140.5 8958.7 9337.56 INCOMEZJ 6955.79 7358.72 7836.76 8427.95 9279.16 10464.67 11715.6 表9.3 1996—2002年中国东北、华北、华东15个省级地区的消费者物价指数 物价指数1996 1997 1998 1999 2000 2001 2002 PAH 109.9 101.3 100 97.8 100.7 100.5 99

eviews面板数据模型详解(可编辑修改word版)

1.已知1996—2002 年中国东北、华北、华东15 个省级地区的居民家庭人均消费(cp ,不变价格)和人均收入(ip ,不变价格)居民,利用数据(1)建立面板数据(panel data)工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。 年人均消费(consume)和人均收入(income)数据以及消费者价格指数(p)分别见表9.1,9.2 和9.3。 表9.1 1996—2002 年中国东北、华北、华东15 个省级地区的居民家庭人均消费(元)数据人均消费1996 1997 1998 1999 2000 2001 2002 CONSUMEAH 3607.43 3693.55 3777.41 3901.81 4232.98 4517.65 4736.52 CONSUMEBJ 5729.52 6531.81 6970.83 7498.48 8493.49 8922.72 10284.6 CONSUMEFJ 4248.47 4935.95 5181.45 5266.69 5638.74 6015.11 6631.68 CONSUMEHB 3424.35 4003.71 3834.43 4026.3 4348.47 4479.75 5069.28 CONSUMEHLJ 3110.92 3213.42 3303.15 3481.74 3824.44 4192.36 4462.08 CONSUMEJL 3037.32 3408.03 3449.74 3661.68 4020.87 4337.22 4973.88 CONSUMEJS 4057.5 4533.57 4889.43 5010.91 5323.18 5532.74 6042.6 CONSUMEJX 2942.11 3199.61 3266.81 3482.33 3623.56 3894.51 4549.32 CONSUMELN 3493.02 3719.91 3890.74 3989.93 4356.06 4654.42 5342.64 CONSUMENMG 2767.84 3032.3 3105.74 3468.99 3927.75 4195.62 4859.88 CONSUMESD 3770.99 4040.63 4143.96 4515.05 5022 5252.41 5596.32 CONSUMESH 6763.12 6819.94 6866.41 8247.69 8868.19 9336.1 10464 CONSUMESX 3035.59 3228.71 3267.7 3492.98 3941.87 4123.01 4710.96 CONSUMETJ 4679.61 5204.15 5471.01 5851.53 6121.04 6987.22 7191.96 CONSUMEZJ 5764.27 6170.14 6217.93 6521.54 7020.22 7952.39 8713.08 表9.2 1996—2002 年中国东北、华北、华东15 个省级地区的居民家庭人均收入(元)数据人均收入1996 1997 1998 1999 2000 2001 2002 INCOMEAH 4512.77 4599.27 4770.47 5064.6 5293.55 5668.8 6032.4 INCOMEBJ 7332.01 7813.16 8471.98 9182.76 10349.69 11577.78 12463.92 INCOMEFJ 5172.93 6143.64 6485.63 6859.81 7432.26 8313.08 9189.36 INCOMEHB 4442.81 4958.67 5084.64 5365.03 5661.16 5984.82 6679.68 INCOMEHLJ 3768.31 4090.72 4268.5 4595.14 4912.88 5425.87 6100.56 INCOMEJL 3805.53 4190.58 4206.64 4480.01 4810 5340.46 6260.16 INCOMEJS 5185.79 5765.2 6017.85 6538.2 6800.23 7375.1 8177.64 INCOMEJX 3780.2 4071.32 4251.42 4720.58 5103.58 5506.02 6335.64 INCOMELN 4207.23 4518.1 4617.24 4898.61 5357.79 5797.01 6524.52 INCOMENMG 3431.81 3944.67 4353.02 4770.53 5129.05 5535.89 6051 INCOMESD 4890.28 5190.79 5380.08 5808.96 6489.97 7101.08 7614.36 INCOMESH 8178.48 8438.89 8773.1 10931.64 11718.01 12883.46 13249.8 INCOMESX 3702.69 3989.92 4098.73 4342.61 4724.11 5391.05 6234.36 INCOMETJ 5967.71 6608.39 7110.54 7649.83 8140.5 8958.7 9337.56 INCOMEZJ 6955.79 7358.72 7836.76 8427.95 9279.16 10464.67 11715.6

Eviews面板数据之随机效应模型

随机效应模型的估计原理说明与豪斯曼检验 在面板数据的计量分析中,如果解释变量对被解释变量的效应不随个体和时间变化,并且解释被解释变量的信息不够完整,即解释变量中不包含一些影响被解释变量的不可观测的确定性因素,可以将模型设定为固定效应模型,采用反映个体特征或时间特征的虚拟变量(即知随个体变化或只随时间变化)或者分解模型的截距项来描述这些缺失的确定性信息。 但是,固定效应模型也存在一定的不足。例如固定效应模型模型中包含许多虚拟变量时,减少了模型估计的自由度;实际应用中,固定效应模型的随机误差项难以满足模型的基本假设,易于导致参数的非有效估计。更为重要的是,它只考虑了不完整的确定性信息对被解释变量的效应,而未包含不可观测的随机信息的效应。为了弥补这一不足,Maddala(1971)将混合数据回归的随机误差项分解为截面随机误差分量、时间随机误差分量和个体时间随机误差分量三部分,讨论如下随机效应模型或双分量误差分解模型(1): 12 K it k kit i t it k y x u v w ββ==++++∑ (1) 2~(0,)i u u N σ表示个体随机误差分量; 2~(0,)t v v N σ表示时间随机误差分量; 2~(0,)it w w N σ表示个体时间(或混合)随机误差分量。 如果模型(1)中只存在截面随机误差分量i u 而不存在时间随机误差分量t v ,则称为个体随机效应模型,否则称为个体时间小于模型。或者称为但分了误差分解模型。 下面来介绍这两种模型: 1.个体随机效应模型 当利用面板数据研究拥有拥有充分多个体的总体经济特征时,若利用总体数据的固定效应模型就会损失巨大的自由度,使得个体截距项的估计不具有有效性。这时,可以在总体中随机抽取N 个样本,利用这N 个样本的个体随机效应模型: 12 K it k kit i it k y x u w ββ==+++∑ (2) 推断总体的经济规律。其中,个体随机误差项i u 是属于第i 个个体的随机干扰分量,并在整个时间范围(t=1,2,…,T )保持不变,其反映了不随时间变化的不可观测随机信息的效应。 检验:个体随机效应的原假设和备择假设分别是: 20:0u H σ= (混合估计模型)

面板数据分析方法步骤全解

面板数据分析方法步骤全解 yonglee , May 5 16:16 , 文档资料?数据挖掘, 评论(0) , 引用(0) , 阅读(35079) , 本站原创 面板数据分析方法步骤全解(2009-11-07 11:50:38) 转载标签:面板数据 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。 因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。 单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建 立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250 之间,截面数介于10~250 之间) 的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS 法,但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。 由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。 其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量、Hadri Z统计量,并且Levin, Lin & Chu t* 统计量、Breitung t统计量的原假设为存在普通的单位根过程,lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量的原假设为存在有效的单位根过程,Hadri Z统计量的检验原假设为不存在普通的单位根过程。 有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检验LLC (Levin-Lin-Chu)检验和不同根单位根检验Fisher-ADF检验(注:对普通序列(非面板序列)的单位根检验方法则常用ADF检验),如果在两种检验中均拒绝存在单位根的原假设则我们说此序列是平稳的,反之则不平稳。 如果我们以T(trend)代表序列含趋势项,以I(intercept)代表序列含截距项,T&I

相关文档
最新文档