第六章自相关案例分析

合集下载

第六章 自相关(序列相关)

第六章 自相关(序列相关)

2 横截面数据中的自相关:一般来说截面数据不容
易出现自相关,但相邻的观测单位之间也可能存在 “溢出效应”(neighborhood effect)。例如,相邻 省份、国家之间的经济活动相互影响(通过贸易、 投资、劳动力流动等);相邻地区的农业产量受到 类似的天气影响而相关;同一社区内的房屋价格存 在相关性;相邻地区的消费倾向有相关性
图 中 实 线 表 示 真 实 的 总 体 回 归 线 。 假 设 扰 动 项 存 在
正 自 相 关 , 即 E ij X >0 , 若 1>0 ( 图 中 左 边 小 椭 圆 形 ) 由 于 存 在 正 自 相 关 , 则 2 >0 的 可 能 性 也 就 很 大 ; 而 若


n-1<0 ( 图 中 右 边 小 椭 圆 形 ) 则 n <0 的 可 能 性 也 就 很 大
此 检 验 被 称 为 B GB 检 验 ( r e u s c h - G o d f r e y )
3B 、 o x P i e r c e Q 检 验
定义残差的各阶样本自相关系数为
t=j+1 ˆ j n
e e
t=1
n
t t-j
2 e t
(j=1,2, ,p)
d ˆ 且 n 正 态 分 布 , j = 1 , 2 , , p j
3 设 定 误 差 m i s s p e c i f i c a t i o n : 如 果 模 型 设 定 中 遗 漏 会 引 起 扰 动 项 的 自 相 关 。
了 某 个 自 相 关 的 解 释 变 量 , 并 被 纳 入 到 扰 动 项 中 , 则
三 、 自 相 关 的 检 验
X X X X n 1 j ˆ ˆ Q = S+ 1 - etet-j xt x + xt-jx t-j t n j= p+1 1i=j+1 p

计量经济学 第六章 自相关

计量经济学 第六章 自相关
5
计量经济学
第六章
自相关
6
一阶自相关系数
自相关系数 的定义与普通相关系的公式形式相同
n
utut-1
t=2
n
n
ut2
u2 t 1
t2
t2
的取值范围为 -1 1
(6.1)
式(6.1)中 ut-1是 ut 滞后一期的随机误差项。 因此,将式(6.1)计算的自相关系数 称为一阶 自相关系数。
模型中
ut

-1
ut
滞后一期的值,因此称为一阶。
此式中的 也称为一阶自相关系数。
18
如果式中的随机误差项 vt 不是经典误差项,即
其中包含有 ut 的成份,如包含有 ut2 则需将 vt
显含在回归模型中,其为
ut = 1ut-1 + 2ut-2 + vt
其中,1 为一阶自相关系数,2为二阶自相关系
另外回归模型中的解释变量在不同时期通常是
正相关的,对于
Xt和
X
t
来说
j
Xt Xt+j 是大于0的。
33
因此,普通最小二乘法的方差 Var(ˆ2) = 2 Σxt2
通常会低估 ˆ2 的真实方差。当 较大和 Xt 有
较强的正自相关时,普通最小二乘估计量的方 差会有很大偏差,这会夸大估计量的估计精度, 即得到较小的标准误。 因此在有自相关时,普通最小二乘估计 ˆ2 的标 准误就不可靠了。
许多农产品的供给呈现为 蛛网现象,供给对价格的 反应要滞后一段时间,因 为供给需要经过一定的时
间才能实现。如果时期 t
的价格 Pt 低于上一期的 价格 Pt-1 ,农民就会减少 时期 t 1 的生产量。如

第6章 自相关

第6章 自相关

2、序列相关性的后果 、
计量经济学模型一旦出现序列相关性,如果仍 采用OLS法估计模型参数,会产生下列不良后果:
(1)参数估计量非有效 (1)参数估计量非有效
因为,在有效性证明中利用了 E(UU’)=σ2I 即同方差性和互相独立性条件 同方差性和互相独立性条件。 同方差性和互相独立性条件 而且,在大样本情况下,参数估计量虽然具有 参数估计量虽然具有 一致性,但仍然不具有渐近有效性。 一致性,但仍然不具有渐近有效性。
例如,绝对收入假设 居民总消费函数模型 居民总消费函数模型: 例如,绝对收入假设下居民总消费函数模型 Ct=β0+β1Yt+µt t=1,2,…,n
由于消费习惯 消费习惯的影响被包含在随机误差项中, 消费习惯 则可能出现序列相关性(往往是正相关 )。
• (3) 回归模型中略去了带有自相关的重要解释变量。 回归模型中略去了带有自相关的重要解释变量。 • 若丢掉了应该列入模型的带有自相关的重要解 释变量,那么它的影响必然归并到误差项ut中 释变量,那么它的影响必然归并到误差项 中,从 而使误差项呈现自相关。 而使误差项呈现自相关。当然略去多个带有自相关 的解释变量, 的解释变量,也许因互相抵消并不使误差项呈现自 相关。 相关。
6.2 自相关的来源和后果
1、自相关的来源 、 1)模型设定的偏误 (1)模型设定的偏误 所谓模型设定偏误 设定偏误(Specification error)是指 设定偏误 所设定的模型“不正确”。主要表现在模型中丢掉 了重要的解释变量或模型函数形式有偏误。 例如,本来应该估计的模型为 例如 Yt=β0+β1X1t+ β2X2t + β3X3t + µt
Yi=β0+β1X1i+…βkXki+γYi-1+µi β β …β γ µ

计量经济学第六章自相关

计量经济学第六章自相关

计量经济学第六章自相关自相关是计量经济学中一种重要的现象,它指的是一个变量与其自己在过去时间点上的相关性。

自相关在实证研究中十分常见,对经济学家来说,了解和掌握自相关性质是至关重要的。

1. 引言自相关作为计量经济学的一项基础概念,是经济学研究中不可或缺的一个重要方法。

自相关性的存在通常会引起回归结果的偏误,而忽略自相关性可能导致估计不准确的结果。

因此,探讨自相关性的性质和应对方法是计量经济学的重点之一。

2. 自相关的定义和表示自相关是指一个变量与其自身在过去时间点上的相关性。

假设我们有一个时间序列数据集,其中变量yt表示一个时间点上的观测值,t表示时间索引。

自相关系数可以通过计算观测值yt与其在过去某一时间点上的观测值yt-k(k为时间滞后期数)的相关性来得到。

数学上,自相关系数可以用公式表示为:ρ(k) = Cov(yt, yt-k) / (σ(yt) * σ(yt-k))其中,ρ(k)表示第k期的自相关系数,Cov表示协方差,σ表示标准差。

3. 自相关性的性质自相关性具有以下几个性质:3.1 一阶自相关性一阶自相关性是指变量值yt与前一期的观测值yt-1之间的相关性。

一阶自相关系数ρ(1)通常用来检验时间序列数据是否存在自相关性。

若ρ(1)大于零且显著,则表明存在正的一阶自相关性;若ρ(1)小于零且显著,则表明存在负的一阶自相关性。

3.2 高阶自相关性除了一阶自相关性,时间序列数据还可能存在高阶自相关性。

高阶自相关性是指变量值yt与过去第k期的观测值yt-k之间的相关性。

通过计算不同滞后期的自相关系数ρ(k),可以了解数据在不同时间跨度上的自相关性情况。

3.3 异方差自相关性异方差自相关性是指时间序列数据中的方差不仅与自身相关,还与过去观测值的相关性有关。

异方差自相关性可能导致在回归分析中的标准误差失效,从而产生无效的回归结果。

因此,在处理存在异方差自相关性的数据时要采取合适的修正方法。

4. 自相关性的检验方法在实证研究中,经济学家通常使用多种方法来检验数据中的自相关性,常用的方法包括:4.1 Durbin-Watson检验Durbin-Watson检验是一种常用的检验自相关性的方法,其基本思想是通过检验误差项的相关性来判断自相关是否存在。

第六章自相关案例分析

第六章自相关案例分析

第六章 案例分析一、研究目的2003年中国农村人口占59.47%,而消费总量却只占41.4%,农村居民的收入和消费是一个值得研究的问题。

消费模型是研究居民消费行为的常用工具。

通过中国农村居民消费模型的分析可判断农村居民的边际消费倾向,这是宏观经济分析的重要参数。

同时,农村居民消费模型也能用于农村居民消费水平的预测。

二、模型设定正如第二章所讲述的,影响居民消费的因素很多,但由于受各种条件的限制,通常只引入居民收入一个变量做解释变量,即消费模型设定为t t t u X Y ++=21ββ(6.43)式中,Y t 为农村居民人均消费支出,X t 为农村人均居民纯收入,u t 为随机误差项。

表6.3是从《中国统计年鉴》收集的中国农村居民1985-2003年的收入与消费数据。

表6.3 1985-2003年农村居民人均收入和消费 单位: 元2000 2001 2002 20032253.40 2366.40 2475.60 2622.241670.00 1741.00 1834.00 1943.30314.0 316.5 315.2 320.2717.64 747.68 785.41 818.86531.85 550.08 581.85 606.81注:资料来源于《中国统计年鉴》1986-2004。

为了消除价格变动因素对农村居民收入和消费支出的影响,不宜直接采用现价人均纯收入和现价人均消费支出的数据,而需要用经消费价格指数进行调整后的1985年可比价格计的人均纯收入和人均消费支出的数据作回归分析。

根据表6.3中调整后的1985年可比价格计的人均纯收入和人均消费支出的数据,使用普通最小二乘法估计消费模型得t t X Y 0.59987528.106ˆ+=(6.44)Se = (12.2238) (0.0214)t = (8.7332)(28.3067)R 2 = 0.9788,F = 786.0548,d f = 17,DW = 0.7706该回归方程可决系数较高,回归系数均显著。

南开大学计量经济学第6章自相关

南开大学计量经济学第6章自相关

经济模型中最常见的是一阶自回归形式。
T
ut ut1
依据 OLS 公式,模型 ut = 1 ut -1 + vt 中1 的估计公式是
aˆ1
=
t=2 T

ut12
t=2
若把 ut, u t-1 看作两个变量,则它们的相关系数是 ˆ =
T
ut ut1
t=2

T
T
ut 2
u t 1 2
(2)样本容量T
21 1.22 1.42 1.13 1.54 1.03 1.67 0.93 1.81 0.83 1.96
22 1.24 1.43 1.15 1.54 1.05 1.66 0.96 1.80 0.86 1.94 (3)原回归模型中解 23 1.26 1.44 1.17 1.54 1.08 1.66 0.99 1.79 0.90 1.92 释变量个数k(不包括
《Econometrics》 《计量经济学》
攸频
nkeconometrics126 南开大学经济学院数量经济研究所
第六章 自相关
Autocorrelation
§6.1 基本概念、类型及来源 §6.2 自相关的后果 §6.3 自相关的检验(DW检验、LM检验) §6.4 自相关的修正(GLS) §6.5 案例
同理,Cov(ut, ut - s) = s Var(ut)
自相关的表现形式
§6.1.3 自相关的来源
(1)惯性 大多数经济时间数据都有一个明显的特点,即
具有惯性。 如:经济周期
棘轮效应
(2)设定偏误:模型中遗漏了显著的变量
例如:如果对羊肉需求的正确模型应为
Yt=b0+b1X1t+b2X2t+b3X3t+ut

6.1自相关的概念及产生原因

6.1自相关的概念及产生原因

0时,称ut 不存在自相关。
ut为一阶自回归形式时的特点:
(1) E (ut ) 0
v2 2 (2)Var(ut ) u 常数 2 1
2 (3)Cov(ut , ut s ) s u (s 0)
可见,当随机误差项满足一阶自回归形式的自 相关时,随机误差项满足零均值和同方差的假定, 但不满足无自相关的假定。
则称模型存在自相关性。
二、自相关的分类
自相关按形式可分为两类:
(1)一阶自回归形式
当随机误差项ut 只与其滞后一期值ut 1有关时,即
ut f (ut 1 ) vt
称ut 具有一阶自回归形式。
(2)高阶自回归形式
当随机误差项ut 不仅与其前一期值有关,而且与其 前若干期的值都有关时,即
注意:时间序列数据比横截面数据更容易产生自相关。
3.模型设定不当的影响 例如,平均成本函数应该是二次多项式模型, 如果设成了线性模型,则随机误差项是自相关的。 因为这时随机误差项包括了产量的平方项,产量的 各期相关性将会导致随机误差项的自相关性。 4.一些随机干扰因素的影响 例如,自然灾害、金融危机等随机因素的影响, 往往要持续多个时期。从而使得随机误差项呈现出 自相关性。
ut f (ut 1,ut 2, ) vt
称ut 具有高阶自回归形式。
计量经济模型中自相关的最常见的形式是一 阶线性自回归形式
ut ut 1 vt
其中, 是ut 与ut 1的相关系数,vt 是满足基本假定的 随机误差项。的取值范围是[-1, 1]。当 0时,称 ut 存在正自相关,当 01.模型中遗漏了重要的解释变量
例如,以年度资料建立居民消费函数时,居民 消费除了受收入水平影响之外,还受消费习惯、 家庭财产等因素的影响,这些因素的各期值一般 是相关的,如果模型中未包含这些因素,它们对 消费的影响就表现在随机误差项中,从而使随机 误差项的各期值之间呈现出相关关系。

自相关

自相关
(3) 原回归模型中解释变量个数k(不包括常数项)。
6.3 自相关检验
(3)LM检验(亦称BG检验)法
(第2版169页) (第3版145页)
LM 统计量既可检验一阶自相关,也可检验高阶自相关。
LM 检验是通过一个辅助回归式完成的,具体步骤如下。
Yt = 0 + 1 X1 t + 2 X2 t + … + k Xk t + ut 考虑误差项为 n 阶自回归形式 ut = 1 ut-1 + … + n ut - n + vt H0: 1 = 2 = …= n = 0
T
T
ut 2
u
t
2 1
t2
t2
t2
t2
把这种关系代入上式得
T
ut ut1
ˆ t2
T
aˆ1
u
t
2 1
t2
对于总体参数有 = a1,回归模型中误差项 ut 的
一阶自回归形式可表示为, ut = ut-1 版教材第136页)
ˆ = 1 -(DW / 2)
2. 直接拟合估计。
6.6 案例分析
(第2版177页) (第3版152页)
例6.1 天津市城镇居民人均消费与人均可支配收入的关系。
改革开放以来,天津市城镇居民人均消费性支出(CONSUM),人 均可支配收入(INCOME)以及消费价格定基指数(PRICE)数据 (1978~2000年)见表6.2。现在研究人均消费与人均可支配收入的关系。
怎样查明自相关是由于略去重要解释变量引起的?一种方法 是用残差et对那些可能影响被解释变量,但又未单列入模型的 解释变量回归,并作显著性检验。
只有当以上两种引起自相关的原因都排除后,才能认为误差 项ut 真正存在自相关。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章 案例分析
一、研究目的
2003年中国农村人口占59.47%,而消费总量却只占41.4%,农村居民的收入和消费是一个值得研究的问题。

消费模型是研究居民消费行为的常用工具。

通过中国农村居民消费模型的分析可判断农村居民的边际消费倾向,这是宏观经济分析的重要参数。

同时,农村居民消费模型也能用于农村居民消费水平的预测。

二、模型设定
正如第二章所讲述的,影响居民消费的因素很多,但由于受各种条件的限制,通常只引入居民收入一个变量做解释变量,即消费模型设定为
t t t u X Y ++=21ββ
(6.43)
式中,Y t 为农村居民人均消费支出,X t 为农村人均居民纯收入,u t 为随机误差项。

表6.3是从《中国统计年鉴》收集的中国农村居民1985-2003年的收入与消费数据。

表6.3 1985-2003年农村居民人均收入和消费 单位: 元
2000 2001 2002 2003
2253.40 2366.40 2475.60 2622.24
1670.00 1741.00 1834.00 1943.30
314.0 316.5 315.2 320.2
717.64 747.68 785.41 818.86
531.85 550.08 581.85 606.81
注:资料来源于《中国统计年鉴》1986-2004。

为了消除价格变动因素对农村居民收入和消费支出的影响,不宜直接采用现价人均纯收入和现价人均消费支出的数据,而需要用经消费价格指数进行调整后的1985年可比价格计的人均纯收入和人均消费支出的数据作回归分析。

根据表6.3中调整后的1985年可比价格计的人均纯收入和人均消费支出的数据,使用普通最小二乘法估计消费模型得
t t X Y 0.59987528.106ˆ+=
(6.44)
Se = (12.2238) (0.0214)
t = (8.7332)
(28.3067)
R 2 = 0.9788,F = 786.0548,d f = 17,DW = 0.7706
该回归方程可决系数较高,回归系数均显著。

对样本量为19、一个解释变量的模型、5%显著水平,查DW 统计表可知,d L =1.18,d U = 1.40,模型中DW<d L ,显然消费模型中有自相关。

这一点残差图中也可从看出,点击EViews 方程输出窗口的按钮Resids 可得到残差图,如图6.6所示。

图6.6
残差图
图6.6残差图中,残差的变动有系统模式,连续为正和连续为负,表明残差项存在一阶正自相关,模型中t 统计量和F 统计量的结论不可信,需采取补救措施。

三、自相关问题的处理
为解决自相关问题,选用科克伦—奥克特迭代法。

由模型(6.44)可得残差序列e t ,在EViews 中,每次回归的残差存放在resid 序列中,为了对残差进行回归分析,需生成命名为
e 的残差序列。

在主菜单选择Quick/Generate Series 或点击工作文件窗口工具栏中的Procs/ Generate Series ,在弹出的对话框中输入e = resid ,点击OK 得到残差序列e t 。

使用e t 进行滞后一期的自回归,在EViews 命今栏中输入ls e e (-1)可得回归方程
e t = 0.4960 e t-1
(6.45)
由式(6.45)可知ρ
ˆ=0.4960,对原模型进行广义差分,得到广义差分方程 t t t t t u X X Y Y +-+-=---)4960.0()4960.01(4960.01211ββ
(6.46)
对式(6.46)的广义差分方程进行回归,在EViews 命令栏中输入ls Y -0.4960*Y (-1) c
X -0.4960*X (-1),回车后可得方程输出结果如表6.4。

表6.4 广义差分方程输出结果 Dependent Variable: Y-0.496014*Y(-1) Method: Least Squares Date: 03/26/05 Time: 12:32 Sample(adjusted): 1986 2003
Included observations: 18 after adjusting endpoints
Variable Coefficient Std. Error t-Statistic Prob. C
60.44431 8.964957 6.742287 0.0000 X-0.496014*X(-1) 0.583287
0.029410
19.83325
0.0000
R-squared
0.960914 Mean dependent var 231.9218 Adjusted R-squared 0.958472 S.D. dependent var 49.34525 S.E. of regression 10.05584 Akaike info criterion 7.558623 Sum squared resid 1617.919 Schwarz criterion 7.657554 Log likelihood -66.02761 F-statistic 393.3577 Durbin-Watson stat
1.397928 Prob(F-statistic)
0.000000
**5833.04443.60ˆt t X Y +=
(6.47)
)9650.8(=Se (0.0294)
t = (6.7423)
(19.8333)
R 2 = 0.9609 F = 393.3577 d f = 16 DW = 1.3979
式中,1*4960.0ˆ--=t t t Y Y Y ,
1*4960.0--=t t t X X X 。

由于使用了广义差分数据,样本容量减少了1个,为18个。

查5%显著水平的DW 统
计表可知d L = 1.16,d U = 1.39,模型中DW = 1.3979> d U ,说明广义差分模型中已无自相关,不必再进行迭代。

同时可见,可决系数R 2
、t 、F 统计量也均达到理想水平。

对比模型(6.44)和(6.47),很明显普通最小二乘法低估了回归系数2ˆ
β的标准误差。

[原模型中Se (2ˆβ)= 0.0214,广义差分模型中为Se (2ˆ
β)= 0.0294。

经广义差分后样本容量会减少1个,为了保证样本数不减少,可以使用普莱斯—温斯
腾变换补充第一个观测值,方法是21*11ρ-=X X 和21*11ρ-=Y Y 。

在本例中即为
210.49601-X 和210.49601-Y 。

由于要补充因差分而损失的第一个观测值,所以在
EViews 中就不能采用前述方法直接在命令栏输入Y 和X 的广义差分函数表达式,而是要生成X 和Y 的差分序列X *和Y *。

在主菜单选择Quick/Generate Series 或点击工作文件窗口工具栏中的Procs/Generate Series ,在弹出的对话框中输入Y *= Y -0.4960*Y (-1),点击OK 得到广义差分序列Y *,同样的方法得到广义差分序列X *。

此时的X *和Y *都缺少第一个观测值,
需计算后补充进去,计算得*1X =345.236,*
1Y =275.598,双击工作文件窗口的X * 打开序列
显示窗口,点击Edit +/-按钮,将*
1X =345.236补充到1985年对应的栏目中,得到X *的19个观测值的序列。

同样的方法可得到Y *的19个观测值序列。

在命令栏中输入Ls Y * c X*得到普莱斯—温斯腾变换的广义差分模型为
**5833.04443.60t t X Y +=
(6.48)
)1298.9(=Se (0.0297)
t = (6.5178)
(19.8079)
R 2 = 0.9585 F = 392.3519 d f = 19 DW = 1.3459
对比模型(6.47)和(6.48)可发现,两者的参数估计值和各检验统计量的差别很微小,说明在本例中使用普莱斯—温斯腾变换与直接使用科克伦—奥克特两步法的估计结果无显著差异,这是因为本例中的样本还不算太小。

如果实际应用中样本较小,则两者的差异会较大。

通常对于小样本,应采用普莱斯—温斯腾变换补充第一个观测值。

由差分方程(6.46)有
9292
.1194960.014443
.60ˆ1
=-=β
(6.49)
由此,我们得到最终的中国农村居民消费模型为 Y t = 119.9292+0.5833 X t
(6.50)
由(6.50)的中国农村居民消费模型可知,中国农村居民的边际消费倾向为0.5833,即中国农民每增加收入1元,将增加消费支出0.5833元。

相关文档
最新文档