序列相关性检验(上)
序列相关性

5.滞后效应 在经济中,因变量受到自身或另一解释变量的前几期值影响的现象称为 滞后效应。在一个消费支出对收入的时间序列回归中,人们常常发现当前时 期的消费支出除了依赖于其他变量外,还依赖于前期的消有效 因为,在有效性证明中利用了 E(NN’)=2I 即同方差性和互相独立性条件。而且,在大样本情况下,参数估计量 虽然具有一致性,但仍然不具有渐近有效性。 2、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方差正确估计基础之 上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。如果存 在序列相关,估计的参数方差 S ˆ ,出现偏误(偏大或偏小) ,t 检验就失去
~ e ~ e t t 1 t
,
~ e ~ ~ e t 1 t 1 2 et 2 t
3
, 。 。 。
醉客天涯之计量经济学
如果存在某一种函数形式,使得方程显著成立,则说明原模型存在序列相关性。 回归检验法的优点是: (1)能够确定序列相关的形式 (2)适用于任何类型序列相关性问题的检验。 3、杜宾-瓦森(Durbin-Watson)检验法(最常用) (1)方法使用条件: ①解释变量 X 非随机; ②随机误差项 i 为一阶自回归形式: i=i-1+i ③回归模型中不应含有滞后应变量作为解释变量,即不应出现下列形式: Yi=0+1X1i+kXki+Yi-1+i ④回归含有截距项 ⑤误差项被假定为正态分布 (2)D.W.统计量: 杜宾和瓦森针对原假设:H0: =0, 即不存在一阶自回归,构如下造统计量:
D.W .
~ (e
t 2
n
t
~ )2 e t 1
2 t
什么是序列相关性如何进行序列相关性的检验与处理

什么是序列相关性如何进行序列相关性的检验与处理序列相关性是指一系列数据中存在的相关性或依赖关系。
它可以帮助我们了解数据的趋势、周期性以及对未来数据的预测。
在统计学中,序列相关性的检验和处理是非常重要的,可以帮助我们提取有用的信息和建立可靠的模型。
本文将介绍序列相关性的定义、如何进行序列相关性的检验以及处理方法。
一、序列相关性的定义序列相关性是指时间序列数据中的观察值之间的相关性或依赖关系。
当一个时间序列的观察值和它之前或之后的观察值之间存在关联时,就可以说这个时间序列是相关的。
序列相关性表明序列中的数据点之间存在某种模式或趋势,这对于分析和预测时间序列数据具有重要意义。
二、序列相关性的检验为了检验时间序列数据是否存在相关性,我们可以使用常用的统计方法,例如自相关函数(ACF)和偏自相关函数(PACF)。
自相关函数是衡量一个时间序列和其滞后版本之间相关性的统计指标。
它可以帮助我们确定序列中的周期性模式。
在自相关函数图中,横轴表示滞后阶数,纵轴表示相关系数。
如果自相关函数在某个滞后阶数上超过了置信区间,那么可以认为有相关性存在。
偏自相关函数是衡量一个时间序列和其滞后版本之间相关性的统计指标,消除了其他滞后版本的影响。
在偏自相关函数图中,横轴表示滞后阶数,纵轴表示相关系数。
如果偏自相关函数在某个滞后阶数上超过了置信区间,那么可以认为有相关性存在。
另外,我们还可以使用单位根检验(ADF检验)来检验序列是否平稳。
平稳序列的相关性更容易进行建模和预测。
如果序列通过了单位根检验,那么就可以认为序列是平稳的。
三、序列相关性的处理如果时间序列数据存在相关性,那么我们可以采取一些方法进行处理,以消除或减小相关性的影响。
首先,可以进行差分操作。
差分是指将时间序列的每个观察值与其滞后版本之间的差异进行计算。
差分后的序列通常更容易建模,因为它们消除了相关性。
如果还存在差分后的序列中的相关性,可以继续进行更高阶的差分操作。
42序列相关性

s
于是
Var[μ]=Cov[μ, μ] n- 1 骣1 r L r ÷ ç ÷ ç ÷ n 2 2 ç ÷ r 1 L r se ç 2 ÷ ç ÷ = = s Ω ÷ 2 ç 1- r ç M M M M÷ ÷ ç ÷ ç ÷ n- 1 n- 2 ç ç r r L 1 ÷ 桫 ÷
D-W检验的原假设是:H0: 0,即不存在 一阶自相关。检验的统计量为:
D.W. =
å
2 % % (et - et - 1 ) t= 2
n
å
2 % e t= 1 t
n
在检验时,计算该统计量,再根据样本容量n 和解释变量的个数k 查D.W.分布表,得到临界 值d1和du,然后根据下面准则判断模型的自相 关的状态: 若0 D.W. d1,则存在正相关; 若d1 D.W. du,则不能确定; 若du D.W. 4 du,则无自相关; 若4 du D.W. 4 d1,则不能确定; 若4 d1 D.W. 4 ,则存在负相关。
ⅱ E[μ*μ* ] = E[D- 1μμ (D- 1 )ⅱ ] = D- 1E[μμ ](D- 1 )?
= D- 1s 2 DDⅱ (D- 1 ) = s 2I
于是可以用OLS法估计模型
) ⅱ β* = (X* X* )- 1 X*Y* = [Xⅱ (D- 1 ) D- 1X]- 1 Xⅱ (D- 1 ) D- 1Y = [Xⅱ Ω- 1X]- 1 X Ω- 1Y
ç ç Var[μ]=Cov[μ, μ] = ç M L ç ç ç ç E[mn1m1 ] L 桫
金融计量分析(完整版)

⾦融计量分析(完整版)案例⼀:中国居民总量消费函数(序列相关性)⼀、研究⽬地居民消费在社会经济地持续发展中有着重要地作⽤.居民合理地消费模式和居民适度地消费规模有利于经济持续健康地增长.建⽴总量消费函数是进⾏宏观经济管理地重要⼿段.为了研究全国居民总量消费⽔平及其变动地原因,从总量上考察居民总消费与居民收⼊间地关系,需要作具体地分析.为此,可以建⽴相应地计量经济模型去研究.⼆、模型设定研究对象:中国居民实际消费总⽀出与居民实际可⽀配收⼊之间地关系.模型变量:影响中国居民消费总⽀出有多种不同地因素,但从理论和经验分析,最主要地影响因素应是居民实际可⽀配收⼊,其他因素虽然对居民消费也有影响,但有地不易取得数据;有地与居民收⼊可能⾼度相关.因此这些其他因素可以不列⼊模型,可归⼊随即扰动项中.考虑到数据地可得性,我们将“实际可⽀配收⼊”作为解释变量X,“居民实际消费总⽀出”作为被解释变量.关于变量地符号与涵义如表1所⽰.表1 变量定义内⽣产总值GDP、名义居民总消费CONS以及表⽰宏观税收税收总额TAX、表⽰价格变化地居民消费价格指数CPI(1990=100),并由这些数据整理出实际⽀出法国内⽣产总值GDPC =GDP/CPI、居民实际消费总⽀出Y=CONS/CPI,以及实际可⽀配收⼊X=(GDP-TAX)/CPI.这些数据观测值是连续不同中地数据.表2 中国居民总量消费⽀出与收⼊数据资料中国居民总量消费⽀出与收⼊资料单位:亿元图2:X与Y地散点图从散点图可以看出居民实际消费总⽀出(Y)和实际可⽀配收⼊(X)⼤体呈现为线性关系,所以建⽴地计量经济模型为如下线性模型:三、估计参数假定所建模型及随机扰动项满⾜古典假定,可以⽤OLS法估计其参数.回归结果下:表3得: Y=2091.295+0.437527X剩余项(Residual)、实际值(Actual)、拟合值(Fitted)地图形,如图2所⽰.图2四、模型检验(⼀)经济意义检验所估计地参数(斜率项)为0.438,符合经济理论中边际消费倾向在0与1之间地假说,经济意义为在1978-2006年间,以1990年价计地中国居民可⽀配收⼊每增加1亿元,居民总量消费⽀出⽔平平均增加0.438亿元.(⼆)拟合优度和统计检验拟合优度检验:可决系数为0.987955,说明所建模型整体上对样本数据拟合较好,即解释变量“居民实际可⽀配收⼊”对被解释变量“居民实际消费总⽀出”地绝⼤部分差异作出了解释.对回归系数地t检验:截距项与斜率项t值都通过变量地显著性检验,这表明,居民实际可⽀配收⼊对居民实际消费总⽀出有显著影响.F统计量检验:F值较⼤,附带地概率也通过了检验,说明模型总体线性较显著.(三)计量经济学检验1、模型设定偏误检验:RESET检验表4在5%地显著性⽔平下,从F统计值地伴随概率看,拒绝原模型没有设定偏误地假设,表明原模型存在设定偏误.因为Y与X都是时间序列,⽽且它们表现出共同地变动趋势,因此怀疑较⾼地R2部分地由于这⼀共同变动趋势带来地.为排除时间趋势项地影响,在模型中引⼊时间趋势项,将这种影响分离出来.从趋势图看,X与Y呈现⾮线性变化趋势,故引⼊T地平⽅地形式,结果为:表5再次进⾏RESET检验:表6可以看出,引⼊时间趋势项地模型已经不存在设定偏误问题.2、异⽅差检验(对引⼊时间趋势项地模型进⾏White检验)从nR2统计量对应值地伴随概率可以看出,在5%在显著性⽔平下,因此拒绝原模型同⽅差地假设,即含有时间趋势项地模型存在异⽅差性.3.异⽅差地修正(WLS估计法)以resid^2为权数进⾏来进⾏加权最⼩⼆乘法如下修正后地回归⽅程为:Y = 6229.342 + 0.362278*X4、序列相关性检验(对引⼊时间趋势项地模型进⾏LM检验)表8从nR2统计量对应值地伴随概率可以看出,在5%在显著性⽔平下,拒绝原模型不存在序列相关性地假设,即含有时间趋势项地模型存在⼀阶序列相关性.从下部分Test Equation 中可以看出,RESID(-1)显著不为0,这进⼀步说明原模型存在⼀阶序列相关性.进⼀步检验滞后2阶情况,结果如下:表9可以看出,RESID(-2)地系数没有通过t显著性检验,即不存在2阶序列相关性.5、⼀阶序列相关性地修正(⼴义差分法)表10估计结果为:= 3505.7 + 0.1996X + 19.24T^2 +0.748AR(1)对上式进⾏LM检验:表11从nR2统计量对应值地伴随概率可以看出,在1%在显著性⽔平下,不拒绝原模型不存在序列相关性地假设,即模型已经不存在⼀阶序列相关性.从下部分Test Equation中可以看出,RESID(-1)前系数显著地为0,这进⼀步说明模型已经不存在⼀阶序列相关性.故现在地模型变为:= 3505.7 + 0.1996X + 19.24T+0.748AR(1) (1) 6、⼀阶序列相关性地修正(序列相关稳健估计法)序列相关稳健估计法估计结果为:= 3328.2 + 0.1762X + 21.66 T (2)(14.62)(7.53)(9.79)R=0.9976 F=5380.8 D.W.=0.442表126、序列相关性检验由于模型地R2与F值都较⼤,⽽且各参数估计值地t检验值都显著地不为零,说明各解释变量对Y地联合线性作⽤显著,⽽且各解释变量独⾃对Y地独⽴作⽤也⽐较显著,故各解释变量间不存在序列相关性五、回归预测2007年,以当年价计地中国GDP为263242. 5亿元,税收总额45621.9亿元,居民消费价格指数为409.1,由此可得出以1990年价计地可⽀配总收⼊X约为95407.4亿元,由上述回归⽅程可得2007年居民总量消费预测地点估计值:⽤式(1)进⾏估计:Y= 3505.7 + 0.1996*95407.4 + 19.24*30+0.748*0.7479=39860.5⽤式(2)进⾏估计:Y= =3328.2 + 0.1762*95407.4 + 21.66 *30=39624.62007年,中国名义居民消费总量为93317.2亿元,以1990年为基准地居民消费价格指数为228.1,由此可推出当年中国实际居民消费总量为40910.7亿元,可见相对误差为2.57%(⽤式(1)结果进⾏计算),可以说还是相对⽐较准确地结果.案例⼆;农作物产值模型(异⽅差地检验和修正)⼀、模型设定⼀取1986年中国29个省市⾃治区农作物种植业产值y t(亿元)和农作物播种⾯积x t (万亩)数据(见表1)研究⼆者之间地关系.建⽴如下模型:⼆、数据搜集根据表中数据进⾏OLS回归,得估计地线性模型如下,yt = -5.6610 + 0.0123 xt (-0.95) (12.4)R2=0.85 =0.846 F =155.0四、异⽅差检验图2 残差图从模型地残差图(见图2)可以发现数据中存在异⽅差.(1)⽤White⽅法检验是否存在异⽅差.在上式回归地基础上,做White检验得:图3输出结果中地概率是指χ2 (2)统计量取值⼤于8.02地概率为0.018. 因为TR2 = 8.02 > χ2α (2) = 6,所以存在异⽅差.五、异⽅差地修正下⾯使⽤三种⽅法来修正异⽅差.(1)改变模型设定形式法.对yt和xt同取对数,得两个新变量Lnyt 和Lnxt(见图3).⽤Lnyt 对Lnxt 回归,得:Lnyt = - 4.1801 + 0.9625 Lnxt .(-8.54) (16.9)R2 = 0.91, F = 285.6,因为TR2 = 2.58 < 20.05 (2) = 6.0,所以经White检验不存在异⽅差.图4(2)WLS估计法为了找到适当地权w,作ln(e^2)关于x地回归结果如下:图5结果显⽰,前参数地5%显著性⽔平下不为零,同时F检验也表明⽅程地线性关系在5%地显著性⽔平下成⽴,于是,可⽣成权序列W命令为Genr w=1/@sqrt(exp(3.56405028673 + 0.000209806008672*X))进⾏加权修正后地回归结果如下:图6我们可以再次对经过加权处理地模型进⾏异⽅差检验,如图:图7显然,nR^2值所附带地概率表明,不拒绝同⽅差地原假设,也就是模型已经不存在异⽅差了.修正后地回归结果为:Y=0.256182+0.01115*X(4.545095) (0.000917)R2=0.845671 =0.839956 F =147.9514(3)异⽅差地稳健标准误法修正原模型中地OLS标准差.图8可见系数了原模型基本⼀致,但X对应系数地标准差⽐OLS估计地有所增⼤,这表明原模型OLS估计结果低估了X地标准差.案例三:(多重共线性)⼀、研究⽬地与背景经济理论指出,居民消费⽀出(Y)不仅取决于可⽀配收⼊(X1)和利率(X2)还取决于个⼈财富(X3)地影响.可⽀配收⼊和个⼈财富对于居民消费⽀出地作⽤是正⽅向地;按照古典经济学地观点,利率对于储蓄地作⽤是也是正⽅向地,即利率地提⾼可以刺激储蓄、抑制消费;利率地降低则抑制储蓄,刺激消费.所以综上所述设定如下形式地计量经济模型:Yt = C + β1X1t - β1X2t + β2X3t + µt其中Y=家庭消费⽀出,X1=可⽀配收⼊,X2=利率,X3=个⼈财富⼆、模型估计与检验为估计模型参数,收集旅游事业发展最快地2001-2010年地统计数据,如表1所⽰:表1果如图1:输⼊统计资料: DATA Y X1 X2 X3建⽴回归模型: LS Y C X1 X2 X3因此,X1、X2、X3对居民地消费⽀出函数为:= (2.427712) (0.874457) (-0.503673) (-0.222169)R^2= 0.963636 ^2= 0.945455由此可见,该模型可决系数很⾼,F检验值52.99996, 给定α=5%,查表得临界值(3,6)=4.76 判断:F值>临界值,拒绝参数整体不显著地原假设,模型整体线性显著.给定显著性⽔平α=0.05,可得到临界值tα/2(n-k-1)=2.447,由样本求出统计量|t|=0.874457 |t|= 0.503673 |t|=0.222169,计算得所有变量地t值都⼩于该临界值,所以接受原假设H0,即是说包括常数项地3个解释变量都在95%地置信⽔平下不显著.⽽且X3系数地符号与预期地相反,这表明很可能存在严重地多重共线性.计算各解释变量地相关系数,选择X1、X2、X3数据,点“view/correlations”得相关系数矩阵,或在命令窗⼝中键⼊:cor X1、X2 x3.如表2所⽰:表2由相关系数矩阵可以看出:各解释变量相互之间地相关系数较⾼,证实确实存在严重多重共线性.三、模型地修正采⽤逐步回归地办法,去检验和解决多重共线性问题.分别作Y 对X1、X2、X3地⼀元回归,结果如图2、3、4所⽰:图2图3图4表3以X1为基础,加⼊X2变量回归,回归结果为:图5Y=285.0087 + 0.523886X1 – 25.56223X2 t=(2.682801) (10.90078) (-0.493513)第⼀步,在初始模型中引⼊X2,模型拟合优度提⾼,参数符号合理,当取时,,但X2参数地t 检验不显著.第⼆步,去掉X2,引⼊X3,如图6:图6Y = 245.52 + 0.568*X1 - 0.0058*X3306. 2 ) 2 10 ( ) ( 025 . 0 2 = - = - t k n t αt=(3.53) (0.793781) (-0.082975)拟合优度略有下降,但是X3符号不合理,且未通过t检验.所以X2、X3都应该剔除.综上所述,最终地居民消费函数应该以Y=f(X1)为最优,拟合结果如下:= 244.5455 + 0.509091X1结论本次作业考虑到每组数据同时出现三种问题地可能性不⼤,故由每⼈负责⼀种情况地检验与修正.鉴于数据地可得性,对于有些样本数据空间地数量还远远达不到模型本⾝所要求地数量,这样去估计模型是没有实际预测意义地.同样,囿于所学⽔平有限,变量地选取还是按照书上地例⼦来选取,这种模型本⾝设定形式是否正确,还有待进⼀步验证.我们相信,随着所学知识地进⼀步深⼊,对于实证分析地⼀般过程和具体⽅法都会逐步完善.参考⽂献:[1]李⼦奈,陈绍业.计量经济学(第三版)[M].⾼等教育出版社,2010.[2]张晓峒.EViews使⽤指南与案例[M].机械⼯业出版社,2007.[3]程振源.计量经济学:理论与实验[M].上海财经⼤学出版社,2009.[4]于俊年.计量经济学软件-EViews地使⽤[M].对外经济贸易⼤学出版社,2006.版权申明本⽂部分内容,包括⽂字、图⽚、以及设计等在⽹上搜集整理。
6.2 序列相关性的后果和检验

d
et
t 1 n t 2 n t 1 2 et et 1 t 2 t 2 t 2 2 e t t 1 n n
2
2 et 2 2 et et 1
t 2 2 e t t 1
n
2(1
e e
t 2 n t 1
t t 1
2 e t
ˆ) ) 2(1
© 电子科大经管学院
8
第六讲 序列相关性
序列相关的检验
d 统计量的检验
由于 d 统计量依赖于残差,而残差又依赖于X,故无法 推导出d 统计量的准确分布 Durbin-Watson根据样本容量n和待估参数个数k,在给 定的显著性水平下,给出了 d 统计量的上、下两个临界 值dU和dL
序列相关的检验
布劳殊-戈弗雷(BG)检验
又称为LM检验,克服了DW检验的缺陷,适合于高阶 序列相关以及模型中存在滞后因变量的情形,更具有 一般性 基本思想: 针对回归模型 Yt 0 1 X1t ... k X kt t
假设干扰项存在p 阶序列相关 检验原假设
第六讲序列相关性德宾沃森durbinwatson检验利用方程的残差构成统计量推断误差项是否存在一阶序列相关基本假定回归模型包含截距项序列相关是一阶序列相关回归模型不能把滞后被解释变量作为解释变量第六讲序列相关性检验统计量称为d统计量该统计量仅依赖于残差一般回归软件都会报告该统计量无论是横截面数据还是时间序列数据统计量的检验由于d统计量依赖于残差而残差又依赖于x故无法推导出d统计量的准确分布durbinwatson根据样本容量n和待估参数个数k在给定的显著性水平下给出了d统计量的上下两个临界值du和dl第六讲序列相关性电子科大经管学院10统计量的检验序列相关的判别规则不能拒绝电子科大经管学院11检验序列正相关拒绝原假设不能拒绝原假设电子科大经管学院12检验序列相关拒绝原假设不能拒绝原假设拒绝原假设电子科大经管学院13dw检验的缺陷统计量落在两个不确定区域时无法判断是否存在序列相关当滞后因变量作为解释变量时检验无效只能检验一阶序列相关不适用于高阶序列相关若误差项不是iid正态分布d检验也不可靠第六讲序列相关性电子科大经管学院14布劳殊戈弗雷bg检验又称为lm检验克服了dw检验的缺陷适合于高阶序列相关以及模型中存在滞后因变量的情形更具有一般性基本思想
第五章:(一) 序列相关性

• 检验步骤 ①计算D.W.统计量的值, ②根据样本容量T和解释变量数目k,查D.W. 分布表,得到临界值dL和dU, ③按照下列准则考察计算得到的D.W.值,以判 断模型的自相关状态。
若 0<D.W.<dL dL<D.W.<dU dU<D.W.<4-dU
则存在正自相关 不能确定 无自相关
4-dU<D.W.<4-dL
– 采用时间序列数据建立计量经济学模型,无论是平稳 时间序列和非平稳时间序列,模型随机误差项一般都 存在序列相关,这就违背了经典模型的一个重要的基 本假设。 – 所以模型的序列相关性肯定是时间序列计量经济学模 型必须重点讨论的一个问题。
§5.1时间序列模型的序列相关性 Serial Correlation
(2)模型设定偏误:不正确的函数形式
例:如果边际成本模型应为:
Yt 0 1Xt 2Xt2 t
其中:Y=边际成本,X=产出。 但在建模时误将模型设定为: Yt 0 1Xt t 因此,由于vt 2Xt2 t ,包含了产出的平方对随 机误差项的系统性影响,随机误差项也呈现序列相 关性。
• 雨果说“所谓活着的人就是不断挑战的 人,不断攀登命运峻峰的人。”时间总 是在你颓废的一无所有的时候残酷的炫 耀这些年来那些曾经和你一个起跑线的 人的辉煌成就,然后在你的脑海里公示 奋斗的重要性。我们向命运低下高贵的 头颅,蜷进狭小的天地顾影自怜的时候, 别人的天已经无比辽阔了。
• 时间序列模型的序列相关问题(§5.1节)
(3)数据的“编造”
例:如果季度数据来自月度数据的简单平均, 那么这种平均的计算会减弱每月数据的波动而使 季度数据更为平滑,从而使随机干扰项出现序列 相关。 此外,当历史数据缺失时,在两个时间点之 间采用“内插”技术,也可能导致随机干扰项出 现序列相关。 一般经验告诉我们,对于采用时间序列数据 作样本的计量经济学问题,由于在不同样本点上 解释变量以外的其他因素在时间上的连续性,带 来它们对被解释变量的影响的连续性,所以往往 存在序列相关。
4.2序列相关性

又如:模型本应为:
Yt = 0 +1 Xt +2 Xt2 + t
但建模时设立模型如下:
Yt = 0 +1 Xt + vt
由于vt = 2 Xt2 +t ,解释变量的平方对随机误 差项产生系统性影响,从而使随机误差项呈现出 序列相关性。
三、序列相关性的后果
计量经济学模型一旦出现序列相关性,如果仍 采用OLS估计模型参数,会产生下列不良后果:
§4.2
序列相关性
一、序列相关性的概念 二、序列相关性的产生原因 三、序列相关性的后果 四、序列相关性的检验 五、序列相关性的克服办法 六、实例
一、序列相关性的概念
0 1 X1i 2 X 2i k X k i i 基本假设要求随机误差项之间互不相关:
对于模型 Yi
-4 -4 -2 0 2
U (-1) 4
正自相关的序列图和散点图
4 X
6 X 4
2
2
0
0 -2
-2
-4
-4 10 20 30 40 50 60 70 80 90 100
-6 -6 -4 -2 0 2
X(-1) 4 6
负自相关的序列图和散点图
6 X 4 2 0 -2 -4 -6 10 20 30 40 50 60 70 80 90 100
n
~ et 2
t 1
n
如果存在完全正自相关,则
n
~ ~ ~~ et2 et21 2 et et 1
t 2 t 2 t 2
n
n
1,D.W . 0
如果存在完全负自相关,则
~ et2
t 1
列举序列相关性的检验方法

列举序列相关性的检验方法序列相关性是指一个序列中两个以上元素的关联性。
序列相关性的检验方法主要有独立性检验、协方差分析、操作码分析、最大似然推定、极大似然推定、回归分析、相关系数等。
独立性检验是在分类数据中检验定性变量两两之间是否独立的一种方法,它实质上是针对每对类别进行比较,以确定它们相关性的概率,从而来看传统的概率论和统计学的独立性是否满足的。
例如,在一个试验中,如果测试变量x和y是独立的,则将按照此原则检查服从正态分布的观测值的概率分布,以检验观测的频率是否与理论值一致。
协方差分析是一种利用协方差检验解释变量之间的相关性的方法。
协方差分析过程中,可以推断一个变量是否受另一个变量影响,从而把变量之间的相关性准确衡量出来。
可以采用多个统计指标,如处理值协方差、数组协方差和管理技术方差等。
操作码分析是一种操作码技术,主要用于分析序列在紧密连接的散列表中的结构特征,以寻求解决数据集中的相关问题的有效方法。
操作码分析的主要思想是将散列表中的每一个数据项当成一个操作码,根据数据项间的排列情况分析有关表示的问题。
最大似然估计是一种根据观测数据和一定的概率分布模型确定参数值的统计技术。
这种技术主要是通过极大似然估计法对参数进行估计,从而得到最佳参数和其他统计量。
序列相关性检验中也可以采用最大似然估计来检验序列中不同字段之间是否存在联系。
极大似然推定也是一种基于极大似然值的技术,它的思想是找出一个最适合的(概率模型)参数向量,使其能够最大程度地拟合观测数据。
极大似然推定方法在序列相关性检验中也有着广泛的应用,是检验序列元素间相关性的有力工具。
回归分析方法是根据一组观测值,确定其两个变量之间存在相关性的技术。
回归分析也被广泛用于序列相关性检验。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.序列相关性概述
或
对于模型
00
(,)()t t s t t s Cov E s μμμμ--=≠≠在其他假设仍成立的条件下,随机误差项序列相关意味着
ρ:自协方差系数(Coefficient of Autocovariance )或一阶自相关系数(First-order Coefficient of Autocorrelation )
若E(μt μt -1)≠0 t =1,2,…,T
称为一阶序列相关,或自相关(Autocorrelation )自相关往往可写成如下形式:
μt =ρμt -1+εt -1<ρ<1εt 是满足以下标准的OLS 假定的随机误差项:
2
000(),(),(,)t t t t s E Var Cov s εεσεε-===≠
2.实际经济问题中的序列相关性
经济变量固有的惯性
大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。
模型设定的偏误所谓模型设定偏误(Specification error )是指所设定的模型“不正确”。
主要表现在模型中丢掉了重要的解释变量或模型函数形式有偏误。
数据的“编造”
在实际经济问题中,有些数据是通过已知数据生成的。
因此,新生成的数据与原数据间就有了内在的联系,表现出序列相关性。
+++
3.序列相关性的后果参数估计量非有效因为,在有效性证明中利用了即同方差性和互相独立性条件。
而且,在大样本情况下,参数估计量也不具有渐近有效性。
2()μμσ'=E X I +如果出现了序列相关性,估计的出现偏误(偏大
或偏小),t 检验失去意义。
ˆβj S 变量的显著性检验中,构造了t 统计量
ˆˆ/ββ=j
j t S +变量的显著性检验失去意义
模型的预测失效区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。
所以,当模型出现序列相关性时,它的预测功能失效。
+3.序列相关性的后果
4.序列相关性的检验
然后,通过分析这些“近似估计量”之间的相关性,以判断随机误差项是否具有序列相关性。
序列相关性检验方法有多种,但基本思路相同:
杜宾-瓦森(Durbin-Watson)检验法
+
D-W检验是杜宾(J.Durbin)和瓦森(G.S.Watson)于1951年提出,该方法的主要假定条件是:
(1)解释变量X是非随机变量
(2)随机误差项μt为一阶自回归形式:
μt=ρμt-1+εt
(3)回归模型中不含有滞后因变量作为解释变量
Y t=β0+β1X1t+⋯βk X kt+γY t-1+μt
(4)回归模型含有截距项
导出临界值的下限d L 和上限d U ,上下限只与样本的容量T 和解释变量的个数k 有关,与解释变量X 的取值无关。
杜宾和瓦森针对原假设:H 0: =0
即不存在一阶序列相关,构造如下D.W.
统计量:
如果存在完全一阶正相关,即ρ=1,则D.W.≈0
完全一阶负相关,即ρ=-1,则D.W.≈4
完全不相关,即ρ=0,则D.W.≈
2
为一阶自回归模型
μ
t
=ρμ
t -1+εt 的参数估计。
ρ
D.W.检验步骤:
(1)计算D.W.值
(2)给定 ,由T 和k 的大小查D.W.分布表,得临界值d L 和d U (3)比较、判断若0<D.W.<d L ,正相关
d L <D.W.<d U ,不能确定
d U <D.W.<4-d U ,无自相关4-d U <D.W.<4-d L ,不能确定
4-d L <D.W.<4,负相关0 d L d U 2 4-d U 4-d L 正
相
关不能确
定无自相关不能确定负相
关
4+
拉格朗日乘数(Lagrange multiplier)检验
拉格朗日乘数检验克服了D.W.检验的缺陷,适合于高阶序列相关以及模型中存在滞后因变量的情形。
它是由布劳殊(Breusch)与戈弗雷(Godfrey)于1978年提出的,也被称为GB检验。
对于模型
如果怀疑随机误差项存在p阶序列相关+
GB检验可用来检验如下受约束回归方程
约束条件为H0: ρ1=ρ2=…=ρp=0
约束条件H0为真时,大样本下
给定α,查临界值χ
α
2(p),与LM值比较,做出判断,实际检验中,可从1阶、2阶、…逐次向更高阶检验。
22
()~()
LM T p R p
χ
=-
分别为如下辅助回归的样本容量和可决系数:
2
(),
T p R
-。