计量经济学--自相关性的检验及修正
计量经济学:自相关

所以在实际应用中,对于序列相关问题一般只进行D.W.检验。
3、LM检验(或BG检验)
• 此方法不仅适用于一阶自相关检验,也适用于高阶自相关的检验。 • 检验步骤: 1、用OLS对回归模型进行,得到残差序列et;
1、经济变量固有的惯性 大多数经济时间序列数据都有一个明显的特点——惯性,表现为 滞后值对本期值具有影响。
例如:GDP、价格指数、生产、就业与失业等时间序列都呈周期性,如周期 中的复苏阶段,大多数经济序列均呈上升势,序列在每一时刻的值都高于前 一时刻的值,似乎有一种内在的动力驱使这一势头继续下去,直至某些情况 (如利率或课税的升高)出现才把它拖慢下来。
证明:由于 DW
e
t 2
T
t
e t 1
2 t T
2
e
t 1
T
e e
t 2 2 t t 2 T T
T
T
2 t 1
2 e t e t 1
t 2 2 t
T
e
t 1 t 2 2 t 1
T
若样本容量足够大,有 则 e e
t 2 2 t
et2
3、数据的“加工整理”
在实际经济问题中,有些数据是通过已知数据生成的。因此,新生
成的数据与原数据间就有了内在的联系,从而表现出序列相关性。
例如:季度数据来自月度数据的简单平均,这种平均的计算减弱了每 月数据的波动而引进了数据中的平滑性,这种平滑性本身就能使干扰项 中出现系统性的因素,从而出现序列相关。 还有就是两个时间点之间的“内插”技术往往导致随机项的序列相关性。
计量经济学讲义—— 线性回归模型的自相关问题

10.5 自相关的诊断-Durbin-Watson d检验法
Durbin-Watson d统计量可以用来诊断回归模型的自相关
n
d =
∑
t=2
( e t − e t −1 ) 2
n
∑
样本容量为n-1。
t =1
e t2
(10.3)
Durbin-Watson d检验量是诊断自相关常用的检验 工具,必须掌握。
10.2 自相关产生的原因
1. 经济时间序列的惯性(inertia)或迟缓性(sluggishness)特征。 2. 模型适定误差。有些自相关并不是由于连续观察值之间相 关产生的,而是因为回归模型不是适定性的“好”模型。 “不好模型”有多种原因。 3. 蛛网现象(the cobweb phenomenon)。一个变量对另一个变 量的反映不是同步的,时滞一定的时间。商品供给对价格 的反映: St = B1 + B2*Pt-1 + ut (10.2)
∑
t=2 n
e t e t −1 e t2
ˆ ,− 1 ≤ ρ ≤ 1
(10.5)
∑
t =1
如果d接近0,则存在正相关;d接近4,则存在负相关;d 接近2,表示不存在相关。
10.5 自相关的诊断-Durbin-Watson d检验法
d 统计量诊断自相关需要一定的假设条件,不是任意可用的: 1. 回归模型包括一个截距项。因此,d统计量无法判断通过原 点的回归模型的自相关问题。 2. 变量X是非随机变量,即在重复抽样中变量X的值是固定不 变的。 3. 扰动项ui的生成机制是:
4. 数据处理。在做季节因素的调整时,经常要做移动平均。 移动平均的处理可以消除季节波动的影响,但带来新的问 题则是产生了自相关。
计量经济学第六章自相关

计量经济学第六章自相关自相关是计量经济学中一种重要的现象,它指的是一个变量与其自己在过去时间点上的相关性。
自相关在实证研究中十分常见,对经济学家来说,了解和掌握自相关性质是至关重要的。
1. 引言自相关作为计量经济学的一项基础概念,是经济学研究中不可或缺的一个重要方法。
自相关性的存在通常会引起回归结果的偏误,而忽略自相关性可能导致估计不准确的结果。
因此,探讨自相关性的性质和应对方法是计量经济学的重点之一。
2. 自相关的定义和表示自相关是指一个变量与其自身在过去时间点上的相关性。
假设我们有一个时间序列数据集,其中变量yt表示一个时间点上的观测值,t表示时间索引。
自相关系数可以通过计算观测值yt与其在过去某一时间点上的观测值yt-k(k为时间滞后期数)的相关性来得到。
数学上,自相关系数可以用公式表示为:ρ(k) = Cov(yt, yt-k) / (σ(yt) * σ(yt-k))其中,ρ(k)表示第k期的自相关系数,Cov表示协方差,σ表示标准差。
3. 自相关性的性质自相关性具有以下几个性质:3.1 一阶自相关性一阶自相关性是指变量值yt与前一期的观测值yt-1之间的相关性。
一阶自相关系数ρ(1)通常用来检验时间序列数据是否存在自相关性。
若ρ(1)大于零且显著,则表明存在正的一阶自相关性;若ρ(1)小于零且显著,则表明存在负的一阶自相关性。
3.2 高阶自相关性除了一阶自相关性,时间序列数据还可能存在高阶自相关性。
高阶自相关性是指变量值yt与过去第k期的观测值yt-k之间的相关性。
通过计算不同滞后期的自相关系数ρ(k),可以了解数据在不同时间跨度上的自相关性情况。
3.3 异方差自相关性异方差自相关性是指时间序列数据中的方差不仅与自身相关,还与过去观测值的相关性有关。
异方差自相关性可能导致在回归分析中的标准误差失效,从而产生无效的回归结果。
因此,在处理存在异方差自相关性的数据时要采取合适的修正方法。
4. 自相关性的检验方法在实证研究中,经济学家通常使用多种方法来检验数据中的自相关性,常用的方法包括:4.1 Durbin-Watson检验Durbin-Watson检验是一种常用的检验自相关性的方法,其基本思想是通过检验误差项的相关性来判断自相关是否存在。
南开大学计量经济学第6章自相关

经济模型中最常见的是一阶自回归形式。
T
ut ut1
依据 OLS 公式,模型 ut = 1 ut -1 + vt 中1 的估计公式是
aˆ1
=
t=2 T
。
ut12
t=2
若把 ut, u t-1 看作两个变量,则它们的相关系数是 ˆ =
T
ut ut1
t=2
。
T
T
ut 2
u t 1 2
(2)样本容量T
21 1.22 1.42 1.13 1.54 1.03 1.67 0.93 1.81 0.83 1.96
22 1.24 1.43 1.15 1.54 1.05 1.66 0.96 1.80 0.86 1.94 (3)原回归模型中解 23 1.26 1.44 1.17 1.54 1.08 1.66 0.99 1.79 0.90 1.92 释变量个数k(不包括
《Econometrics》 《计量经济学》
攸频
nkeconometrics126 南开大学经济学院数量经济研究所
第六章 自相关
Autocorrelation
§6.1 基本概念、类型及来源 §6.2 自相关的后果 §6.3 自相关的检验(DW检验、LM检验) §6.4 自相关的修正(GLS) §6.5 案例
同理,Cov(ut, ut - s) = s Var(ut)
自相关的表现形式
§6.1.3 自相关的来源
(1)惯性 大多数经济时间数据都有一个明显的特点,即
具有惯性。 如:经济周期
棘轮效应
(2)设定偏误:模型中遗漏了显著的变量
例如:如果对羊肉需求的正确模型应为
Yt=b0+b1X1t+b2X2t+b3X3t+ut
计量经济学的三种检验

• 非完全共线性是指变量不能完全表示为 其他变量的完全线性函数。
• 违反假定:多重共线性
8
完全多重共线性
• 完全共线性(Perfect collinearity)的例子 :
– X1 X2 X3 – 10 50 52 – 15 75 75 – 18 90 97 – 24 120 129 – X1 和 X2 是完全线性相关的:
计量经济学检验
一、多重共线性 二、异方差 三、自相关
1
一:多重共线性 • 多重共线性的性质 • 多重共线性的原因 • 多重共线性的后果 • 多重共线性的诊断 • 多重共线性的补救措施
2
回顾多元线性回归模型的若干假定 • 零均值假定 • 同方差假定 • 无自相关假定 • 随机项与自变量不相关 • 非多重共线性
• X2 = 5X1
9
完全多重共线性
• 若X2 = 5X1 • 将其代入Y’=b0 ’ +b1 ’ X1+b2 ’ X2 +b3 ’ X3
Y’=b0 ’ +b1 ’ X1 +b2 ’ * 5X1 +b3 ’ X3 = b0 ’ +(b1 ’ + 5b2 ’ ) X1 +b3 ’
X3 = b0 ’ +A X1 +b3 ’ X3
• 三变量模型 • 无法从A值中得到b1 ’ 、b2’的值
10
接近完全多重共线性的情形 • 多重共线性是一个极端的情形 • 在实际中,很少遇到完全多重共线性的情
况,常常是接近或高度多重共线性。亦即 解释变量是接近线性相关的。 • 例:《widget》教科书
11
问题
• 多重共线性的性质是什么? • 多重共线性产生的原因是什么? • 多重共线性的理论后果是什么? • 多重共线性的实际后果是什么? • 在实际中,如何发现多重共线性? • 消除多重共线性的弥补措施有哪些?
时间序列模型 自相关性和协整检验

8
T
(uˆt uˆt1)2
D.W . t2 T
uˆt2
2(1 ˆ )
t 1
如果序列不相关,D.W.值在2附近。
如果存在正序列相关,D.W.值将小于2。
如果存在负序列相关,D.W.值将在2~4之间。
正序列相关最为普遍,根据经验,对于有大于50个观测 值和较少解释变量的方程,D.W.值小于1.5的情况,说明残 差序列存在强的正一阶序列相关。
第五章 时间序列模型
关于标准回归技术及其预测和检验我们已经在 前面的章节讨论过了,本章着重于时间序列模型的估 计和定义,这些分析均是基于单方程回归方法,第9 章我们还会讨论时间序列的向量自回归模型。
这一部分属于动态计量经济学的范畴。通常是运 用时间序列的过去值、当期值及滞后扰动项的加权和 建立模型,来“解释”时间序列的变化规律。
10
2 . 相关图和Q -统计量
1. 自相关系数 我们还可以应用所估计回归方程残差序列的自相关系数
和偏自相关系数来检验序列相关。时间序列 ut 滞后 k 阶的
自相关系数由下式估计
rk
T
t k 1
ut
u
utk u
TtLeabharlann 1utu2
(5.2.26)
其中 u 是序列的样本均值,这是相距 k 期值的相关系数。
15
反之,如果,在某一滞后阶数 p,Q-统计量超过设定 的显著性水平的临界值,则拒绝原假设,说明残差序列存 在 p 阶自相关。由于Q-统计量的 P 值要根据自由度 p 来 估算,因此,一个较大的样本容量是保证Q-统计量有效 的重要因素。
在EViews软件中的操作方法: 在方程工具栏选择View/Residual Tests/correlogramQ-statistics。EViews将显示残差的自相关和偏自相关函数 以及对应于高阶序列相关的Ljung-Box Q统计量。如果残 差不存在序列相关,在各阶滞后的自相关和偏自相关值都 接近于零。所有的Q-统计量不显著,并且有大的 P 值。
回归检验法检验自相关

回归检验法检验自相关自相关是指时间序列中自身过去值与当前值之间的相关关系。
在时间序列分析中,自相关的存在可能会影响建模和预测的准确性。
为了验证时间序列数据中是否存在自相关,常常使用回归检验法进行检验。
回归检验法是一种常用的统计方法,用于检验时间序列数据中的自相关性。
它可以帮助我们判断时间序列数据是否存在自相关,并进一步确定是否需要进行自相关修正。
具体步骤如下:1. 收集并整理时间序列数据。
首先,我们需要收集所需的时间序列数据,并按照时间顺序进行整理。
确保数据的准确性和完整性是非常重要的,因为数据的质量直接影响到后续的分析和检验结果。
2. 统计学描述。
在进行回归检验之前,我们需要对数据进行统计学描述,包括均值、方差、偏度和峰度等指标。
这些指标可以帮助我们对数据的分布情况和特征进行初步了解。
3. 绘制自相关图。
自相关图是判断数据自相关性的一种常用图形方法。
通过绘制自相关图,我们可以观察不同滞后阶数下的自相关系数,并判断是否存在显著的自相关。
4. 设置假设。
在进行回归检验之前,我们需要设置相应的假设。
通常,我们假设时间序列数据不存在自相关(原假设),然后根据样本数据进行统计检验,以判断是否拒绝原假设。
5. 进行回归检验。
在进行回归检验时,我们可以使用多种方法,如Durbin-Watson检验、Ljung-Box检验和皮尔逊相关系数检验等。
这些检验方法基于不同的统计指标和算法,旨在判断自相关是否显著,并对其进行修正。
6. 解读结果。
根据回归检验的结果,我们可以得出结论,判断时间序列数据中的自相关性程度。
如果结果显示存在自相关,我们可以进一步进行自相关修正,以提高建模和预测的准确性。
回归检验法可以帮助我们判断时间序列数据中是否存在自相关,并进一步确定是否需要进行自相关修正。
通过合理使用回归检验方法,我们可以更好地分析和预测时间序列数据,提高决策的准确性和可靠性。
在使用回归检验法进行自相关检验时,我们需要注意数据的质量和准确性,选择合适的检验方法,并根据结果进行解读和处理。
计量经济学第5讲 自相关性

数据的“编造” 3、数据的“编造”
在实际经济问题中,有些数据是通过已知数据 生成的。 因此,新生成的数据与原数据间就有了内在的 联系,表现出自相关性。 例如:季度数据 季度数据来自月度数据的简单平均,这 季度数据 种平均的计算减弱了每月数据的波动性,从而使 随机干扰项出现序列相关。 还有就是两个时间点之间的“内插 内插”技术往往 内插 导致随机项的自相关性。
如何得到矩阵 如何得到矩阵?
对的形式进行特殊设定后,才可得到其估计值。 如设定随机扰动项为一阶序列相关形式 i=ρi-1+εi 则 1 ρ ρ
σε ρ Cov (μ, ′) = μ 1 ρ 2 n 1 ρ
2
1
ρ n2
0 0 1 0 0
ρ = σ 2Ω 1
给定α,查临界值χα2(p),与LM值比较,做出判断, 实际检验中,可从1阶、2阶、…逐次向更高阶检验。
四、自相关性的解决方法 如果模型被检验证明存在自相关性,则 需要发展新的方法估计模型。 最常用的方法是广义最小二乘法 广义最小二乘法(GLS: 广义最小二乘法 Generalized least squares)和广义差分法 广义差分法 (Generalized Difference)。
不 能 确 定
4-dU <D.W.<4- dL 不能确定
负 相 关
0
dL
dU
2
4-dU 4-dL
当D.W.值在2左右时,模型不存在一阶自相关。 证明: 证明: 展开D.W.统计量:
D.W . = ~ ~ ~~ ∑ et 2 + ∑ et 21 2∑ et et 1
t =2 t =2 t =2 n n n
变换原模型: D-1Y=D-1X β +D-1 即 Y*=X*β + * (*) 该模型具有同方差性和随机误差项互相独立性: 该模型具有同方差性和随机误差项互相独立性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
经济计量分析实验报告一、实验项目自相关性的检验及修正二、实验日期2015.12.13三、实验目的对于国内旅游总花费的有关影响因素建立多元线性回归模型,对变量进行多重共线性的检验及修正后,对随机误差项进行异方差的检验和补救及自相关性的检验和修正。
四、实验内容建立模型,对模型进行参数估计,对样本回归函数进行统计检验,以判定估计的可靠程度,包括拟合优度检验、方程总体线性的显著性检验、变量的显著性检验,以及参数的置信区间估计。
检验变量是否具有多重共线性并修正。
检验是否存在异方差并补救。
检验是否存在相关性并修正。
五、实验步骤1、建立模型。
以国内旅游总花费Y 作为被解释变量,以年底总人口表示人口增长水平,以旅行社数量表示旅行社的发展情况,以城市公共交通运营数表示城市公共交通运行状况,以城乡居民储蓄存款年末增加值表示城乡居民储蓄存款增长水平。
2、模型设定为:t t t t t μβββββ+X +X +X +X +=Y 443322110t 其中:t Y — 国内旅游总花费(亿元) t 1X — 年底总人口(万人) t 2X — 旅行社数量(个) t 3X — 城市公共交通运营数(辆)t 4X — 城乡居民储蓄存款年末增加值(亿元)3、对模型进行多重共线性检验。
4、检验异方差是否存在并补救。
5、检验自相关性是否存在并修正。
六、实验结果消除多重共线性及排除异方差性之后的回归模型为:2382963.08388.301ˆX Y +-=检验I 、图示法1、1-t e ,t e 散点图-1,500-1,000-5005001,0001,500-2,000-1,00001,0002,000ET(-1)E T大部分落在第Ⅰ,Ⅲ象限,表明随机误差项存在正自相关。
2、t e 折线图-1,500-1,000-5005001,0001,50086889092949698000204060810RESIDⅡ、解析法1、D-W 检验Dependent Variable: COST Method: Least SquaresDate: 12/13/15 Time: 20:35Sample (adjusted): 1994 2008Included observations: 15 after adjustmentsVariable Coefficient Std. Error t-Statistic Prob. C -301.8388394.3549-0.7653990.4577AGENT0.3829630.03223111.881750.0000R-squared0.915681 Mean dependent var 3875.880Adjusted R-squared 0.909195 S.D. dependent var 2295.093S.E. of regression 691.6017 Akaike info criterion 16.03946Sum squared resid 6218068. Schwarz criterion 16.13387Log likelihood -118.2960 Hannan-Quinn criter.16.03846F-statistic141.1760 Durbin-Watson stat 0.641734Prob(F-statistic)0.000000D-W=0.641734查表知:L d =1.08,U d =1.36。
所以存在一阶正自相关。
2、LM 检验Breusch-Godfrey Serial Correlation LM Test:F-statistic4.492419 Prob. F(2,11)0.0375Obs*R-squared6.743741 Prob. Chi-Square(2)0.0343Test Equation:Dependent Variable: RESID Method: Least SquaresDate: 12/13/15 Time: 20:43Sample: 1994 2008Included observations: 15Presample missing value lagged residuals set to zero.Variable Coefficient Std. Error t-Statistic Prob. C -171.0092361.8256-0.4726290.6457AGENT 0.0213550.0333880.6396130.5355RESID(-1)0.8902450.313795 2.8370260.0162RESID(-2)-0.1256190.426001-0.2948800.7736R-squared0.449583 Mean dependent var -6.37E-13Adjusted R-squared 0.299469 S.D. dependent var 666.4441S.E. of regression 557.7986 Akaike info criterion 15.70905Sum squared resid 3422532. Schwarz criterion 15.89786Log likelihood -113.8179 Hannan-Quinn criter.15.70704F-statistic2.994946 Durbin-Watson stat 2.036592Prob(F-statistic)0.077146n 2R =6.743741,查表得2 (p)=5.99。
p 值=0.0343小于0.05,拒绝原假设,不存在高阶自相关。
修正(迭代法)Dependent Variable: COSTMethod: Least SquaresDate: 12/13/15 Time: 20:55Sample (adjusted): 1995 2008Included observations: 14 after adjustmentsConvergence achieved after 32 iterationsVariable Coefficient Std. Error t-Statistic Prob.C-105.10801522.424-0.0690400.9462AGENT0.3966590.102371 3.8747320.0026AR(1)0.7549890.287218 2.6286300.0235R-squared0.945391 Mean dependent var4079.621Adjusted R-squared0.935462 S.D. dependent var2236.535S.E. of regression568.1771 Akaike info criterion15.71015Sum squared resid3551077. Schwarz criterion15.84709Log likelihood-106.9711 Hannan-Quinn criter.15.69748F-statistic95.21571 Durbin-Watson stat 1.467537Prob(F-statistic)0.000000Inverted AR Roots .75D-W=1.467537 无法查表,所以用LM检验。
Breusch-Godfrey Serial Correlation LM Test:F-statistic 1.019016 Prob. F(1,10)0.3366Obs*R-squared 1.294691 Prob. Chi-Square(1)0.2552Test Equation:Dependent Variable: RESIDMethod: Least SquaresDate: 12/13/15 Time: 21:01Sample: 1995 2008Included observations: 14Presample missing value lagged residuals set to zero.Variable Coefficient Std. Error t-Statistic Prob.C11.127301521.1400.0073150.9943AGENT-0.0335630.107550-0.3120670.7614AR(1)-0.3234740.430157-0.7519900.4694RESID(-1)0.4854860.480935 1.0094630.3366R-squared0.092478 Mean dependent var7.45E-06Adjusted R-squared-0.179779 S.D. dependent var522.6469S.E. of regression567.6866 Akaike info criterion15.75597Sum squared resid3222681. Schwarz criterion15.93856Log likelihood-106.2918 Hannan-Quinn criter.15.73907F-statistic0.339672 Durbin-Watson stat 2.149347Prob(F-statistic)0.797241n2R=1.294691,查表得2 (p)=3.84。
P值=0.2552大于0.05,接受原假设,不存在自相关性。
七、结论模型为2396659.01080.105-ˆX Y+=,说明旅行社数量每增加1个,平均说来国内旅游总花费将增加3966.59万元。