第三章模型中误差项假定的诸问题汇总

第三章模型中误差项假定的诸问题

第一节广义最小二乘法

前面的分析知道，多元线性回归的数学模型可以表示为：

12233t t t k kt t

Y X X X ββββμ=+++???++

（t=1,2,3,…,n ）

其中t μ是随机误差项，它代表的是对于t Y 的变化，it X 不能解释的微小变动的全部。用矩阵表示，则上述回归模型可以表示为：

Y X U

β=+

其中，123n Y Y Y Y Y ??

? ? ?= ? ?

M ，123k βββββ?? ?

? ?= ?

? ???M ，2131122

32223111k k n n kn X X X X X X X X X X ????? ????

= ? ??????M M M M ，123n u u U u u ??

? ?= ?

? ?

运用最小二乘准则，我们得到的参数的估计量为：

()1''?X X X Y β-=

对于随机误差项t μ，我们所做的假定有三个：零均值、同方差和非自相关。这三个假定的矩阵表述为：

()()()()()1230000

0n E u E u E U E u E u ???? ? ? ? ? ?

?=== ? ? ? ? ? ? ?????

M M ，

()()()()()()()()()()()11212122122222'2var cov ,cov ,cov ,var cov ,var cov ,cov ,var 10000

001000000

001000

n n n n n u u u

u n u u u u u u u u u u u U u u u u u I E UU σσσσσ????? ???? ?= ? ? ??????

????

? ?

==== ? ? ? ?

???

?M M M M M M M M M M M 在上述假定条件下，我们得出的参数估计值具有最优线性无偏估计特性。现实情况的偏离：

1、随机扰动项均值不为零时，通过将随机扰动项与常数项结合，不会对估计产生影响。

2、同方差和非自相关假设不满足时，会对最小二乘估计产生重要影响。

因此，不满足假定条件的分析可以归结为同方差和非自相关的偏离。用矩阵来表示为：

()'

E UU σ=Ω

，其中，Ω为

n 阶正定矩阵。

当正定对称矩阵已知时，可以通过对给出的模型做变换，使得变换后的模型满足标准线性回归模型的条件，进而，运用最小二估计准则，求出满足最优线性无偏估计特性的参数估计量。

假设有模型Y

X U

β=+，其中随机扰动项不满足

同方差和非自相关条件，即有

()'

E UU σ=Ω

因此，不能直接用最小二乘估计准则进行估计。

现在，由于Ω为n 阶对称正定矩阵，故存在可逆矩阵D 使得下述式子成立：

DD Ω=

对原有模型Y X U

β=+进行变换，即等式两边同

时左乘矩阵1

-有：

111Y X U

D Y D X D U

ββ---=+?=+

令：111

,,Y D Y X D X U D U *

**---===。从而，原有模型Y

X U

β=+转换为：

Y X U β***=+，

新模型中的随机扰动项的协方差矩阵为：

()()()()

()()

()()()()()()()'1111111212112111111'

'''''''''''u u u n

n Var U E U U E D U D U E D UU D D E UU D D D D D I DD D D D DD D D D I σσσ***----------------=====Ω=Ω=??Ω=?Ω= ? ??Ω=??

这样，就可以运用最小二乘法进行估计，并得出参数估计值：

()1''?X X X Y β*-****=

将111,,Y D Y X D X U D U *

**---===代入得到： ()()()

(

)

()()(

)

()()1

''1

1'111

'1?''X X X Y D X D X D X D Y X D

D X

X D D Y

X X X Y

β*

------****--------====ΩΩ因此，这里我们得出的?β

称为参数的广义最小二乘估计量，

很明显，?β

具有最优线性无偏估计量特征。

上述在随机扰动项不满足假定条件的情况下，我们仍然能够得到参数的最优线性无偏估计量的关键是，误差项协方差矩阵 Ω已知，进而我们通过变换和处理使其化为满足假定条件的模型。现实情况是误差项协方差矩阵 Ω未知。因此，必须首先对Ω进行讨论。

第二节序列相关

随机扰动项不满足同方差和非自相关条件，即有

()'

E UU σ=Ω

。

如果Ω已知，我们仍然能够得到最优线性无偏估计量，在现实情况下，Ω通常未知，首先应该对其进行分析讨论。

因此，对随机扰动项假设不满足的条件的讨论分为两个方面：一个是同方差是否满足，一个是非自相关是否满足。这两个方面用数学语言来说明，就是讨论误差项协方差矩阵

Ω，因为，此矩阵上的主对角线上的元素是方差；非主对角

线的元素是协方差，说明的就是误差项之间的关系。本节先讨论误差项非自相关不满足的情况。

一、误差项之间产生序列相关的原因

序列相关的定义：模型中随机误差项不满足关系式：

()0t s E μμ=

这时称误差项之间存在着序列相关。误差项存在自相关，主要有如下几个原因。

(1) 模型的数学形式不妥。若所用的数学模型与变量间的真实关系不一致，误差项常表现出自相关。比如平均成本与产量呈抛物线关系，当用线性回归模型拟合时，误差项必存在自相关。

(2) 惯性。大多数经济时间序列都存在自相关。其本期值

往往受滞后值影响。突出特征就是惯性与低灵敏度。如国民生产总值，固定资产投资，国民消费，物价指数等随时间缓慢地变化，从而建立模型时导致误差项自相关。

(3) 回归模型中略去了带有自相关的重要解释变量。若丢掉了应该列入模型的带有自相关的重要解释变量，那么它的影响必然归并到误差项u t 中，从而使误差项呈现自相关。当然略去多个带有自相关的解释变量，也许因互相抵消并不使误差项呈现自相关。

二、序列相关存在时的回归分析结果与主要影响 1、序列相关的主要形式：一阶自回归模型：

1t t t t t t

Y X u u u αβρε-=++=+

其中，t ε满足条件：

()()()2

t t

t s E E E ε

εεσ

εε===

上述模型成为随机误差项的一阶自回归模型（？），是

一种重要的自相关模型。

2、序列相关的表现形式：

1t t t u u ρε-=+。分三种情况：相关系数ρ的符号而

定。

3、序列相关的回归分析

()()

2112

13223123

123t t t

t t t t t t t t t t t t t t t t t t t t t u u u u u u u u u ρερρεεερερερερρεερερερερερερε--------------=+=++=++=+++=+++=++++L

又因为有：

()()()2200

t t t s E E E εεεσεε===

所以有：

()()231230t t t t t E u E ερερερε---=++++=L

()()

231232222

11t t t t t Var u Var εε

ερερερεσρρσρ---=++++=+++=

-L K

进一步，我们可以得到U 的协方差矩阵：

12'22

123

1...1...E() =..

.....1n n u

u n n n UU ρ

ρρρρ

ρσσρ

ρρ-----??

????=Ω

????

这里有

()

εσσρ=-。 4、序列存在自相关时，如果继续采用最小二乘法，对模型的估计与检验到来以下的后果： 1、参数估计不再具有最小方差性；

2、序列正相关时，即ρ为正值时，最小二乘法估计时的方差偏小，从而t 检验值变大，容易出现拒零假设，从而造成解释变量的人为保留，导致伪回归的危险增大。

3、t 检验和F 检验不能用。三、序列自相关的检验 1、图示法

图示法就是依据残差e t 对时间t 的序列图作出判断。由于残差e t 是对误差项ut 的估计，所以尽管误差项u t 观测不到，但可以通过e t 的变化判断u t 是否存在自相关。图示法的具体步骤是，(1) 用给定的样本估计回归模型，计算残差e t , (t = 1, 2, … T)，绘制残差图；(2) 分析残差图。说明是属于：不存在自相关、存在正自相关、存在负自相关。

误差修正模型实例(精)

一、误差修正模型的构造对于yt的(1，1阶自回归分布滞后模型：在模型两端同时减yt-1，在模型右端，得：其中，，，。记（5-5）则（5-6）称模型（5-6）为“误差修正模型”，简称ECM。二、误差修正模型的含义如果yt ~ I(1，x t ~ I(1，则模型（5-6）左端，右端，所以只有当yt和x t协整、即yt和x t之间存在长期均衡关系时，式（5-5）中的ecm~I(0，模型（5-6）两端的平稳性才会相同。当yt和x t协整时，设协整回归方程为：

它反映了yt与x t的长期均衡关系，所以称式（5-5）中的ecm t-1是前一期的“非均衡误差”，称误差修正模型（5-6）中的是误差修正项，是修正系数，由于通常，这样；当ecm t-1 >0时（即出现正误差），误差修正项< 0，而ecm t-1 < 0时（即出现负误差）， > 0，两者的方向恰好相反，所以，误差修正是一个反向调整过程（负反馈机制）。误差修正模型有以下几个明确的含义： 1．均衡的偏差调整机制 2．协整与长期均衡的关系 3．经济变量的长期与短期变化模型长期趋势模型：短期波动模型：三、误差修正模型的估计建立ECM的具体步骤为： 1．检验被解释变量y与解释变量x（可以是多个变量）之间的协整性； 2．如果y与x存在协整关系，估计协整回归方程，计算残差序列e t：

3．将e t-1作为一个解释变量，估计误差修正模型：说明：（1）第1步协整检验中，如果残差是确定趋势过程，可以在第2步的协整回归方程中加入趋势变量；（2）第2步可以估计动态自回归分布滞后模型：此时，长期参数为：协整回归方程和残差也相应取成：，（3）第2步估计出ECM之后，可以检验模型的残差是否存在长期趋势和自相关性。如果存在长期趋势，则在ECM中加入趋势变量。如果存在自相关性，则在ECM的右端加入误差修正项的滞后期一般也要作相应调整。如取成以下形式：

误差修正模型

第二节误差修正模型（Error Correction Model ，ECM ）一、误差修正模型的构造对于y t 的(1，1)阶自回归分布滞后模型： t t t t t y x x y εβββα++++=--12110 在模型两端同时减y t-1，在模型右端10-±t x β，得： t t t t t t t t t t t t t x y x x y x y x x y εααγβεββββαββεββββα+--+?=+---+--+?=+-+++?+=?------)(]) 1()1()[1()1()(1101012120120121100 其中，12-=βγ，)1/()(200ββαα-+=，)1/(211ββα-=。记 11011-----=t t t x y ecm αα （5-5）则 t t t t ecm x y εγβ++?=?-10 （5-6）称模型（5-6）为“误差修正模型”，简称ECM 。二、误差修正模型的含义如果y t ~ I(1)，x t ~ I(1)，则模型（5-6）左端)0(~I y t ?，右端)0(~I x t ?，所以只有当y t 和x t 协整、即y t 和x t 之间存在长期均衡关系时，式（5-5）中的ecm~I(0)，模型（5-6）两端的平稳性才会相同。当y t 和x t 协整时，设协整回归方程为： t t t x y εαα++=10 它反映了y t 与x t 的长期均衡关系，所以称式（5-5）中的ecm t -1

是前一期的“非均衡误差”，称误差修正模型（5-6）中的1-t ecm γ是误差修正项，12-=βγ是修正系数，由于通常1||2<β，这样 0<γ；当ecm t -1 >0时（即出现正误差），误差修正项1-t ecm γ< 0，而ecm t -1 < 0时（即出现负误差），1-t ecm γ> 0，两者的方向恰好相反，所以，误差修正是一个反向调整过程（负反馈机制）。误差修正模型有以下几个明确的含义： 1．均衡的偏差调整机制 2．协整与长期均衡的关系 3．经济变量的长期与短期变化模型长期趋势模型： t t t x y εαα++=10 短期波动模型： t t t t ecm x y εγβ++?=?-10 三、误差修正模型的估计建立ECM 的具体步骤为： 1．检验被解释变量y 与解释变量x （可以是多个变量）之间的协整性； 2．如果y 与x 存在协整关系，估计协整回归方程，计算残差序列e t ： t t t x y εβα++=0 t t t x y e 0??βα--= 3．将e t-1作为一个解释变量，估计误差修正模型： t t t t v e x y ++?=?-10γβ 说明：（1）第1步协整检验中，如果残差是确定趋势过程，可以在第2步的协整回归方程中加入趋势变量；（2）第2步可以估计动态自回归分布滞后模型： t i t i i t i t y x y εβαα∑∑+++=-- 此时，长期参数为： ∑∑-=)1(i i βαθ 协整回归方程和残差也相应取成：

协整检验及误差修正模型实验指导

协整检验及误差修正模型实验指导一、实验目的理解经济时间序列之间的理论关系，并学会用统计方法验证他们之间的关系。学会验证时间序列存在的不平稳性，掌握ADF检验平稳性的方法。认识不平稳的序列容易导致虚假回归问题，掌握为解决虚假回归问题引出的协整检验，协整的概念和具体的协整检验过程。协整描述了变量之间的长期关系，为了进一步研究变量之间的短期均衡是否存在，掌握误差纠正模型方法。二、实验内容及要求 1、实验内容用Eviews来分析1982年到2002年中国居民实际消费支出的对数序列和中国居民实际可支配收入的对数序列{}之间的关系。内容包括：（1）对两个对数序列分别进行ADF平稳性检验；（2）进行二者之间的协整关系检验；（3）若存在协整关系，建立误差修正模型ECM。 2、实验要求（1）在认真理解本章内容的基础上，通过实验掌握ADF检验平稳性的方法；（2）掌握具体的协整检验过程，以及误差修正模型的建立方法；（3）能对宏观经济变量间的长期均衡关系进行分析。三、实验指导 1、对两个数据序列分别进行平稳性检验：（1）做时序图看二者的平稳性在workfile中按住ctrl选择要检验的二变量，击右键，选择open—as group，此时他们可以作为一个数据组被打开。点击“View”―“graph”—“line”，得到两个序列的时序图。给出两个序列的时序图。从上图可以看出两个序列都呈上升趋势，显然不平稳，但二者有大致相同的增长和变化趋势，说明二者可能存在协整关系。但若要证实二者有协整关系，必须先看二者的单整阶数，如果都是一阶单整，则可能存在协整关系，若单整地阶数不相同，则需采取差分的方式，

协整检验及误差修正模型实验指导

实验八协整检验及误差修正模型实验指导一、实验目的理解经济时间序列之间的理论关系，并学会用统计方法验证他们之间的关系。学会验证时间序列存在的不平稳性，掌握ADF 检验平稳性的方法。认识不平稳的序列容易导致虚假回归问题，掌握为解决虚假回归问题引出的协整检验，协整的概念和具体的协整检验过程。协整描述了变量之间的长期关系，为了进一步研究变量之间的短期均衡是否存在，掌握误差纠正模型方法。二、基本概念设随机向量t X 中所含分量均为d 阶单整，记为t X I(d ):。如果存在一个非零向量β，使得随机向量()~t t Y X I d b =-β，0b >，则称随机向量t X 具有d ,b 阶协整关系，记为t X CI(d ,b ):，向量β被称为协整向量。特别地，t y 和t x 为随机变量，并且t y ，~(1)t x I ，当01()~I(0)t t t y x εββ=-+，即t y 和t x 的线性组合与I(0)变量有相同的统计性质，则称t y 和t x 是协整的，()01,ββ称为协整系数。更一般地，如果一些I(1)变量的线性组合是I(0)，那么我们就称这些变量是协整的。三、实验内容及要求 1、实验内容用Eviews5.1来分析1978年到2002年中国农村居民对数生活费支出序列{ln }t y 和对数人均纯收入{ln t x }序列之间的关系。内容包括：（1）对两个对数序列分别进行ADF 平稳性检验；（2）进行二者之间的协整关系检验；（3）若存在协整关系，建立误差纠正模型ECM 。 2、实验要求（1）在认真理解本章内容的基础上，通过实验掌握ADF 检验平稳性的方法；（2）掌握具体的协整检验过程，以及误差纠正模型的建立方法；（3）能对宏观经济变量间的长期均衡关系进行分析。四、实验指导 1、对两个数据序列分别进行平稳性检验：（1）做时序图看二者的平稳性首先按前面介绍的方法导入数据，在workfile 中按住ctrl 选择要检验的二变量，击右键，选择open —as group ，此时他们可以作为一个数据组被打开。点击“View ”―“graph ”—“line ”，对两个序列做时序图见图8-1，两个序列都呈上升趋势，显然不平稳，但二者有大致相同的增长和变化趋势，说明二者可能存在协整关系。但若要证实二者有协整关系，必须先看二者的单整阶数，如果都是一阶单整，则可能存在协整关系，若单整地阶数不相同，则需采取差分的方式，将他们变成一阶单整序列。图8-1 ln t x 和ln t y 时序图

第5章动态回归与误差修正模型(案例)汇总

例：（file: break2）东北、华北、华东、华中21省市1993和1998年耕地面积（land ,百万公顷）和农业产值（Y , 百亿元）数据见图（已取对数）。用圆圈表示的观测点为1993年数据，用三角表示的观测点为1998年数据。大体看各省市1998年耕地面积比1993年耕地面积略有减少，产值却都有增加。以1993和1998年数据为两个子样本，以42个数据为总样本，求得残差平方和见下表 -10 12 3 -2 -1 1 2 3 LOG(LAND) LOG(Y93)LOG(Y98) -10 1 2 3 -2 -1 1 2 3 LOG(LAND) LOG(Y93)LOG(Y98) 样本容量残差平方和相应自由度回归系数 1 T = 42 SSE T = 14.26 T - k = 40 2 n 1= 21 SSE 1 = 4.37 n 1 - k = 19 α1 3 n 2= 21 SSE 2 = 3.76 n 2 - k = 19 β1 注：三次回归的模型形式Lnout t = β0 +β1 Lnland t + u t 。因为， F = ) 2/()(/)]([2121k T SSE SSE k SSE SSE SSE T -++-= 38 /)76.337.4(2 /)]76.337.4(26.14[++-= 14.33 > F (1, 40) = 7.31

所以两个年度21省市的农业生产发生了很大变化。

案例1：开滦煤矿利润影响因素的实证分析（1903-1940，动态分布滞后模型，file:LH1）（发表在《学术论坛》，2003.1, p. 88-90） 1000 2000300040005000600005 10 15 20 25 30 35 40 销煤量 x1 图 1 开滦煤矿销煤量变化曲线（x 1, 1903-1940） 2 4681012141605 10 15 20 25 30 35 40 吨煤售价 X2 图2 开滦煤矿吨煤售价变化曲线（x 2, 1903-1940）

第三章模型中误差项假定的诸问题汇总

第三章模型中误差项假定的诸问题第一节广义最小二乘法前面的分析知道，多元线性回归的数学模型可以表示为： 12233t t t k kt t Y X X X ββββμ=+++???++ （t=1,2,3,…,n ）其中t μ是随机误差项，它代表的是对于t Y 的变化，it X 不能解释的微小变动的全部。用矩阵表示，则上述回归模型可以表示为： Y X U β=+ 其中，123n Y Y Y Y Y ?? ? ? ?= ? ? ? ?? ，123k βββββ?? ? ? ?= ? ? ???，2131122 32223111k k n n kn X X X X X X X X X X ????? ???? ? = ? ??????，123n u u U u u ?? ? ? ?= ? ? ? ?? 运用最小二乘准则，我们得到的参数的估计量为： ()1''?X X X Y β-= 对于随机误差项t μ，我们所做的假定有三个：零均值、同方差和非自相关。这三个假定的矩阵表述为：

()()()()()1230000 0n E u E u E U E u E u ???? ? ? ? ? ? ?=== ? ? ? ? ? ? ????? ， ()()()()()()()()()()()112121221222 22'2var cov ,cov ,cov ,var cov ,var cov ,cov ,var 100000001000000001000n n n n n u u u u n u u u u u u u u u u u U u u u u u I E UU σσσσσ????? ? ??? ? = ? ? ????? ????? ? ? ? ? ==== ? ? ? ? ??? ? ? 在上述假定条件下，我们得出的参数估计值具有最优线性无偏估计特性。现实情况的偏离： 1、随机扰动项均值不为零时，通过将随机扰动项与常数项结合，不会对估计产生影响。 2、同方差和非自相关假设不满足时，会对最小二乘估计产生重要影响。因此，不满足假定条件的分析可以归结为同方差和非自相关的偏离。用矩阵来表示为： ()' 2u E UU σ =Ω，其中，Ω为n 阶正定矩阵。

ECM误差修正模型

协整与误差修正模型在处理时间序列数据时，我们还得考虑序列的平稳性。如果一个时间序列的均值或自协方差函数随时间而改变，那么该序列就是非平稳的。对于非平稳的数据，采用传统的估计方法，可能会导致错误的推断，即伪回归。若非平稳序列经过一阶差分变为平稳序列，那么该序列就为一阶单整序列。对一组非平稳但具有同阶的序列而言，若它们的线性组合为平稳序列，则称该组合序列具有协整关系。对具有协整关系的序列，我们算出误差修正项，并将误差修正项的滞后一期看做一个解释变量，连同其他反映短期波动关系的变量一起。建立误差修正模型。建立误差修正模型的步骤如下：首先，对单个序列进行单根检验，进行单根检验有两种：ADF （Augument Dickey-Fuller ）和DF(Dickey-Fuller)检验法。若序列都是同阶单整，我们就可以对其进行协整分析。在此我们只介绍单个方程的检验方法。对于多向量的检验参见Johensen 协整检验。我们可以先求出误差项，再建立误差修正模型，也可以先求出向量误差修正模型，然后算出误差修正项。补充一点的是，误差修正模型反映的是变量短期的相互关系，而误差修正项反映出变量长期的关系。下面我们给出案例分析。案例分析在此，我们考虑从1978年到2002年城镇居民的人均可支配收入income 与人均消费水平consume 的关系，数据来自于《中国统计年鉴》，如表8.1所示。根据相对收入假设理论，在一定时期，人们的当期的消费水平不仅与当期的可支配收入、而且受前期的消费水平的影响，具有一定的消费惯性，这就是消费的棘轮效应。从这个理论出发，我们可以建立如下（8.1）式的模型。同时根据生命周期假设理论，消费者的消费不仅与当期收入有关，同时也受过去各项的收入以及对将来预期收入的限制和影响。从我们下面的数据分析中，我们可以把相对收入假设理论与生命周期假设理论联系起来，推出如下的结果：当期的消费水平不仅与当期的可支配收入有关，而且还与前期的可支配收入、前两期的消费水平有关。在此先对人均可支配收入和人均消费水平取对数，同时给出如下的模型 t t t lincome lconsume lconsume 2110?+?+?=- t=1,2,…,n （8.1）如果当期的人均消费水平与当期的人均可支配收入及前期的人均消费水平均为一阶单整序列，而它们的线性组合为平稳序列，那么我们可以求出误差修正序列，并建立误差修正模型，如下： t ecm lconsume lincome lconsume t t t t 4131210βββββ++?+?+=?-- t=1,2,…,n (8.2) t ecm = 12110--?-?-?-t t t lincome lconsume lconsume t=1,2,…,n (8.3) 从（8.2）式我们可以推出如下的方程： t lincome lincome lconsume lconsume lconsume t t t t t 4030123222131131)()()1(ββββββββββ+?-+?--+?--++=---（8.4）在（8.2）中lconsume ?、 lincome ?分别为变量对数滞后一期的值，)1(-ecm 为误差修正项，如（8.3）式所示。（8.2）式为含有常数项和趋势项的形式，我们省略了只含趋

误差修正模型案例

大型作业报告课程名称计量经济学课程代码142102601 题目误差修正模型专业经济学班级2010271 成员陈晓燕

上海电力学院经济与管理学院

计量经济学大型作业评分表备注：课程设计报告的质量70%，分4个等级： 1、按要求格式书写，计算正确，方案合理，内容完整，绘图规范整洁，符合任务书的要求35－40 2、按要求格式书写，计算较正确，有少量错误，方案较合理，内容完整，绘图较规范整洁，基本符合任务书的要求26－34 3、基本按要求格式书写，计算较正确，有部分错误，方案较合理，内容基本完整，绘图不规范整洁，基本符合任务书的要求15－25 4、基本按要求格式书写，计算错误较多，方案不合理，内容不完整，绘图不规范整洁，不符合任务书的要求0－14 工作态度30%，分4个等级： 1、很好，积极参与，答疑及出勤情况很好16－20 2、良好，比较能积极参与，答疑情况良好但有少量缺勤记录，或答疑情况

一般但出勤情况良好11－15 3、一般，积极性不是很高，基本没有答疑记录，出勤情况较差6－10 4、欠佳，不认真投入，且缺勤很多，也没有任何答疑记录0－5 实验报告一、实验目的与要求 1、掌握时间序列的ADF平稳性检验； 2、掌握双变量的Engel-Granger检验； 3、掌握双变量的误差修正模型； 4、熟练使用Eviews软件建立误差修正模型。二、实验内容依据1978-2010年我国人均消费和人均GDP的数据，完成以下内容。 1、对实验数据进行单位根检验； 2、利用E-G两步法对实验数据进行协整检验； 3、根据实验数据的关系，建立误差修正模型，估计并进行解释。三、实验步骤（1）收集数据

stata-误差修正模型讲解

误差修正模型：如果用两个变量，人均消费y 和人均收入x （从格林的数据获得）来研究误差修正模型。令z=（y x ）’，则模型为： t t k i i t t z p z A z επ+?++=?-=-∑11 10 其中，'αβπ= 如果令1=k ，即滞后项为1，则模型为 t t t t z p z A z επ+?++=?--1110 实际上为两个方程的估计： t t t t t y t x p y p x b y b a y 1112111112111ε+?+?+++=?---- t t t t t x t x p y p x b y b a x 2122121122121ε+?+?+++=?---- 用ols 命令做出的结果： gen t=_n tsset t time variable: t, 1 to 204 gen ly=L.y (1 missing value generated) gen lx=L.x (1 missing value generated) reg D.y ly lx D.ly D.lx Source | SS df MS Number of obs = 202 -------------+------------------------------ F( 4, 197) = 21.07 Model | 37251.2525 4 9312.81313 Prob > F = 0.0000 Residual | 87073.3154 197 441.996525 R-squared = 0.2996 -------------+------------------------------ Adj R-squared = 0.2854 Total | 124324.568 201 618.530189 Root MSE = 21.024 ------------------------------------------------------------------------------ D.y | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- ly | .0417242 .0187553 2.22 0.027 .0047371 .0787112 lx | -.0318574 .0171217 -1.86 0.064 -.0656228 .001908 ly | D1. | .1093189 .082368 1.33 0.186 -.0531173 .2717552 lx | D1. | .0792758 .0566966 1.40 0.164 -.0325344 .1910861 _cons | 2.533504 3.757158 0.67 0.501 -4.875909 9.942916 这是t t t t t y t x p y p x b y b a y 1112111112111ε+?+?+++=?----的回归结果，其中y a =2.5335，

多元线性回归模型

第四章多元线性回归模型在一元线性回归模型中，解释变量只有一个。但在实际问题中，影响因变量的变量可能不止一个，比如根据经济学理论，人们对某种商品的需求不仅受该商品市场价格的影响，而且受其它商品价格以及人们可支配收入水平的制约；影响劳动力劳动供给意愿（用劳动参与率度量）的因素不仅包括经济形势（用失业率度量），而且包括劳动实际工资；根据凯恩斯的流动性偏好理论，影响人们货币需求的因素不仅包括人们的收入水平，而且包括利率水平等。当解释变量的个数由一个扩展到两个或两个以上时，一元线性回归模型就扩展为多元线性回归模型。本章在理论分析中以二元线性回归模型为例进行。一、预备知识（一）相关概念对于一个三变量总体，若由基础理论，变量21,x x 和变量y 之间存在因果关系，或21,x x 的变异可用来解释y 的变异。为检验变量21,x x 和变量y 之间因果关系是否存在、度量变量21,x x 对变量y 影响的强弱与显著性、以及利用解释变量21,x x 去预测因变量y ，引入多元回归分析这一工具。将给定i i x x 21,条件下i y 的均值 i i i i i x x x x y E 2211021),|(βββ++= （4.1）定义为总体回归函数（Population Regression Function,PRF ）。定义),|(21i i i i x x y E y -为误差项（error term ）,记为i μ，即),|(21i i i i i x x y E y -=μ，这样i i i i i x x y E y μ+=),|(21，或 i i i i x x y μβββ+++=22110 （4.2）（4.2）式称为总体回归模型或者随机总体回归函数。其中，21,x x 称为解释变量（explanatory variable ）或自变量（independent variable ）；y 称为被解释变量（explained variable ）或因变量（dependent variable ）；误差项μ解释了因变量的变动中不能完全被自变量所解释的部分。在总体回归模型（4.2）中参数210,,βββ是未知的，i μ是不可观察的，统计计量分析的目标之一就是估计模型的未知参数。给定一组随机样本n i x x y i i i ,,2,1),,,(21 =，对（4.1）式进行估计，若21021,,),,|(βββi i i x x y E 的估计量分别记为^2^1^0^,,,βββi y ，则定义（4.3）式为样本回归函数 i i i x x y 2^ 21^1^0^βββ++= （n i ,,2,1 =）（4.3）注意，样本回归函数随着样本的不同而不同，也就是说^2^1^0,,βββ是随机变量，它们的随机性是由于i y 的随机性（同一组),(21i i x x 可能对应不同的i y ）、21,x x 各

第三章一元线性回归模型

第三章一元线性回归模型一、预备知识（一）相关概念对于一个双变量总体),(i i x y ,若由基础理论，变量x 和变量y 之间存在因果关系，或x 的变异可用来解释y 的变异。为检验两变量间因果关系是否存在、度量自变量x 对因变量y 影响的强弱与显著性以及利用解释变量x 去预测因变量 y ，引入一元回归分析这一工具。将给定i x 条件下i y 的均值 i i i x x y E 10)|(ββ+= （3.1）定义为总体回归函数（Population Regression Function,PRF ）。定义 )|(i i i x y E y -为误差项（error term ）,记为i μ，即)|(i i i i x y E y -=μ，这样i i i i x y E y μ+=)|(，或 i i i x y μββ++=10 （3.2）（3.2）式称为总体回归模型或者随机总体回归函数。其中，x 称为解释变量（explanatory variable ）或自变量（independent variable ）；y 称为被解释变量（explained variable ）或因变量（dependent variable ）；误差项μ解释了因变量的变动中不能完全被自变量所解释的部分。误差项的构成包括以下四个部分：（1）未纳入模型变量的影响（2）数据的测量误差（3）基础理论方程具有与回归方程不同的函数形式，比如自变量与因变量之间可能是非线性关系（4）纯随机和不可预料的事件。在总体回归模型（3.2）中参数10,ββ是未知的，i μ是不可观察的，统计计量分析的目标之一就是估计模型的未知参数。给定一组随机样本 n i y x i i ,,2,1),,( =，对（3.1）式进行估计，若10,),|(ββi i x y E 的估计量分别记为^ 1^ 0^ ,,ββi y ，则定义3.3式为样本回归函数 i i x y ^ 1^ 0^ ββ+= （n i ,,2,1 =）（3.3）注意，样本回归函数随着样本的不同而不同，也就是说^ 1^ 0,ββ是随机变量，它们的随机性是由于i y 的随机性（同一个i x 可能对应不同的i y ）与x 的变异共同引起的。定义^ i i y y -为残差项（residual term ）,记为i e ，即^ i i i y y e -=，这样 i i i e y y +=^ ，或 i i i e x y ++=^ 1^0ββ （n i ,,2,1 =）（3.4）

应用回归分析,第4章课后习题参考答案.

第4章违背基本假设的情况思考与练习参考答案 4.1 试举例说明产生异方差的原因。答：例4.1：截面资料下研究居民家庭的储蓄行为 Y i=β0+β1X i+εi 其中：Y i表示第i个家庭的储蓄额，X i表示第i个家庭的可支配收入。由于高收入家庭储蓄额的差异较大，低收入家庭的储蓄额则更有规律性，差异较小，所以εi的方差呈现单调递增型变化。例4.2：以某一行业的企业为样本建立企业生产函数模型 Y i=A iβ1K iβ2L iβ3eεi 被解释变量：产出量Y，解释变量：资本K、劳动L、技术A，那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。由于每个企业所处的外部环境对产出量的影响程度不同，造成了随机误差项的异方差性。这时，随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化，呈现复杂型。 4.2 异方差带来的后果有哪些？答：回归模型一旦出现异方差性，如果仍采用OLS估计模型参数，会产生下列不良后果： 1、参数估计量非有效 2、变量的显著性检验失去意义 3、回归方程的应用效果极不理想总的来说，当模型出现异方差性时，参数OLS估计值的变异程度增大，从而造成对Y的预测误差变大，降低预测精度，预测功能失效。 4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。答：普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。其中每个平方项的权数相同，是普通最小二乘回归参数估计方法。在误差项等方差不相关的条件下，普通最小二乘估计是回归参数的最小方差线性无偏估计。然而在异方差

的条件下，平方和中的每一项的地位是不相同的，误差项的方差大的项，在残差平方和中的取值就偏大，作用就大，因而普通最小二乘估计的回归线就被拉向方差大的项，方差大的项的拟合程度就好，而方差小的项的拟合程度就差。由OLS 求出的仍然是的无偏估计，但不再是最小方差线性无偏估计。所以就是：对较大的残差平方赋予较小的权数，对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正，以提高参数估计的精度。加权最小二乘法的方法： 4.4简述用加权最小二乘法消除多元线性回归中异方差性的思想与方法。答：运用加权最小二乘法消除多元线性回归中异方差性的思想与一元线性回归的类似。多元线性回归加权最小二乘法是在平方和中加入一个适当的权数i w ，以调整各项在平方和中的作用，加权最小二乘的离差平方和为： ∑=----=n i ip p i i i p w x x y w Q 1211010)( ),,,(ββββββ （2）加权最小二乘估计就是寻找参数p βββ,,,10 的估计值pw w w βββ?,,?,?10 使式（2）的离差平方和w Q 达极小。所得加权最小二乘经验回归方程记做 22011 1 ???()()N N w i i i i i i i i Q w y y w y x ββ===-=--∑∑22 __ 1 _ 2 _ _ 02 222 ()() ?()?1 11 1 ,i i N w i i i w i w i w w w w w kx i i i i m i i i m i w x x y y x x y x w kx x kx w x σβββσσ==---=-= = ===∑∑1N i =1 1表示=或

协整检验及误差修正模型实验指导(精)

首先按前面介绍的方法导入数据，在workfile中按住ctrl选择要检验的二变量，击右键，选择open—as group，此时他们可以作为一个数据组被打开。点击“View”―“graph”—“line”，对两个序列做时序图见图8-1，两个序列都呈上升趋势，显然不平稳，但二者有大致相同的增长和变化趋势，说明二者可能存在协整关系。但若要证实二者有协整关系，必须先看二者的单整阶数，如果都是一阶单整，则可能存在协整关系，若单整地阶数不相同，则需采取差分的方式，将他们变成一阶单整序列。图8-1 和时序图（2）用ADF检验分别对序列和进行单整检验双击每个序列，对其进行ADF单位根检验，有两种方法。方法一：“view”—“unit root test”；方法二：点击菜单中的“quick”―“series statistic”―“unit root test”。序列和都有明显的上升趋势，采用带常数项和趋势项的模型进行检验，见图8-2，对对数序列的原水平进行带趋势项和常数项的ADF检验，采用SC准则自动选择滞后阶数，检验结果见图8-3和8-4，在0.05的显著性水平下，都接受存在一个单位根的原假设，说明这两个序列都不平稳。

实验报告二——误差修正模型的建立与分析

实验报告（二）——误差修正模型(ECM)的建立与分析一、单位根检验： 1、绘制cons与GDP的时间序列图：从时间序列图中可以看出，cons与GDP随时间增加都呈上升趋势，表现出非平稳性。 2、对cons进行单位根检验：先选择对原序列（level）进行单位根检验，根据cons与GDP的时间序列图的走势，选择trend and intercept的检验方法，在maximum lags中填写ADF 检验方法的滞后期为0，从上表中可以看出，P值为0.9888，大于0.05的显著性水平，说明原序列是非平稳的。

选择cons的一阶差分（1st）和trend and intercept,从上表中可以看出，经过一阶差分后，P值（=0.5099）仍然没有通过0.05的置信水平检验，说明是不平稳的，需要继续改进。再试用ADF检验，在滞后期（maximum lags）中填入8，选择一阶差分和trend and intercept，得出上表，可以看出P值=0.0801，大于0.05，没有通过0.05的置信水平检验，说明是不平稳的，需要继续改进。

再试用ADF检验，在滞后期（maximum lags）中填入6，选择二阶差分和trend and intercept，得出上表，可以看出P值=0.0137，小于0.05，通过0.05的置信水平检验，说明是平稳的。 3、对GDP进行单位根检验：

先选择对原序列（level）进行单位根检验，根据cons与GDP的时间序列图的走势，选择trend and intercept的检验方法，在maximum lags中填写ADF 检验方法的滞后期为0，从上表中可以看出，P值为1.0000，大于0.05的显著性水平，说明原序列是非平稳的。选择GDP的一阶差分（1st）和trend and intercept,从上表中可以看出，经过一阶差分后，P值（=0.5574）仍然没有通过0.05的置信水平检验，说明是不平稳的，需要继续改进。

回归分析方法

回归分析方法Newly compiled on November 23, 2020

第八章回归分析方法当人们对研究对象的内在特性和各因素间的关系有比较充分的认识时，一般用机理分析方法建立数学模型。如果由于客观事物内部规律的复杂性及人们认识程度的限制，无法分析实际对象内在的因果关系，建立合乎机理规律的数学模型，那么通常的办法是搜集大量数据，基于对数据的统计分析去建立模型。本章讨论其中用途非常广泛的一类模型——统计回归模型。回归模型常用来解决预测、控制、生产工艺优化等问题。变量之间的关系可以分为两类：一类叫确定性关系，也叫函数关系，其特征是：一个变量随着其它变量的确定而确定。另一类关系叫相关关系，变量之间的关系很难用一种精确的方法表示出来。例如，通常人的年龄越大血压越高，但人的年龄和血压之间没有确定的数量关系，人的年龄和血压之间的关系就是相关关系。回归分析就是处理变量之间的相关关系的一种数学方法。其解决问题的大致方法、步骤如下：（1）收集一组包含因变量和自变量的数据；（2）选定因变量和自变量之间的模型，即一个数学式子，利用数据按照最小二乘准则计算模型中的系数；（3）利用统计分析方法对不同的模型进行比较，找出与数据拟合得最好的模型；（4）判断得到的模型是否适合于这组数据；（5）利用模型对因变量作出预测或解释。应用统计分析特别是多元统计分析方法一般都要处理大量数据，工作量非常大，所以在计算机普及以前，这些方法大都是停留在理论研究上。运用一般计算语言编程也要

占用大量时间，而对于经济管理及社会学等对高级编程语言了解不深的人来说要应用这些统计方法更是不可能。MATLAB 等软件的开发和普及大大减少了对计算机编程的要求，使数据分析方法的广泛应用成为可能。MATLAB 统计工具箱几乎包括了数理统计方面主要的概念、理论、方法和算法。运用MATLAB 统计工具箱，我们可以十分方便地在计算机上进行计算，从而进一步加深理解，同时，其强大的图形功能使得概念、过程和结果可以直观地展现在我们面前。本章内容通常先介绍有关回归分析的数学原理，主要说明建模过程中要做的工作及理由，如模型的假设检验、参数估计等，为了把主要精力集中在应用上，我们略去详细而繁杂的理论。在此基础上再介绍在建模过程中如何有效地使用MATLAB 软件。没有学过这部分数学知识的读者可以不深究其数学原理，只要知道回归分析的目的，按照相应方法通过软件显示的图形或计算所得结果表示什么意思，那么，仍然可以学到用回归模型解决实际问题的基本方法。包括：一元线性回归、多元线性回归、非线性回归、逐步回归等方法以及如何利用MATLAB 软件建立初步的数学模型，如何透过输出结果对模型进行分析和改进，回归模型的应用等。 8.1 一元线性回归分析回归模型可分为线性回归模型和非线性回归模型。非线性回归模型是回归函数关于未知参数具有非线性结构的回归模型。某些非线性回归模型可以化为线性回归模型处理；如果知道函数形式只是要确定其中的参数则是拟合问题，可以使用MATLAB 软件的curvefit 命令或nlinfit 命令拟合得到参数的估计并进行统计分析。本节主要考察线性回归模型。一元线性回归模型的建立及其MATLAB 实现其中01ββ，是待定系数，对于不同的,x y 是相互独立的随机变量。

误差修正模型.

第二节误差修正模型（Error Correction Model，ECM）一、误差修正模型的构造对于yt的(1，1阶自回归分布滞后模型：在模型两端同时减yt-1，在模型右端，得：其中，，，。记（5-5）则（5-6）称模型（5-6）为“误差修正模型”，简称ECM。二、误差修正模型的含义如果yt ~ I(1，xt ~ I(1，则模型（5-6）左端，右端，所以只有当yt和xt协整、即yt 和xt之间存在长期均衡关系时，式（5-5）中的 ecm~I(0，模型（5-6）两端的平稳性才会相同。当yt和xt协整时，设协整回归方程为：

它反映了yt与xt的长期均衡关系，所以称式（5-5）中的ecmt-1是前一期的“非均衡误差”，称误差修正模型（5-6）中的是误差修正项，是修正系数，由于通常，这样；当ecmt-1 >0时（即出现正误差），误差修正项< 0，而ecmt-1 < 0时（即出现负误差）， > 0，两者的方向恰好相反，所以，误差修正是一个反向调整过程（负反馈机制）。误差修正模型有以下几个明确的含义： 1．均衡的偏差调整机制 2．协整与长期均衡的关系 3．经济变量的长期与短期变化模型长期趋势模型：短期波动模型：三、误差修正模型的估计建立ECM的具体步骤为： 1．检验被解释变量y与解释变量x（可以是多个变量）之间的协整性； 2．如果y与x存在协整关系，估计协整回归方程，计算残差序列e t：

3．将e t-1作为一个解释变量，估计误差修正模型：说明：（1）第1步协整检验中，如果残差是确定趋势过程，可以在第2步的协整回归方程中加入趋势变量；（2）第2步可以估计动态自回归分布滞后模型：此时，长期参数为：协整回归方程和残差也相应取成：，（3）第2步估计出ECM之后，可以检验模型的残差是否存在长期趋势和自相关性。如果存在长期趋势，则在ECM中加入趋势变量。如果存在自相关性，则在ECM的右端加入的滞后项来消除自相关性，误差修正项的滞后期一般也要作相应调整。如取成以下形式：由于模型中的各项都是平稳变量，所以可以用t检验判断各项的显著性，逐个剔除其中不显著的变量，当然误差修正项要尽可能保留。

协整检验及误差修正模型定稿版

协整检验及误差修正模型 HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】

协整检验及误差修正模型设随机向量t X 中所含分量均为d 阶单整，记为t X I(d )。如果存在一个非零向量β，使得随机向量()~t t Y X I d b =-β，0b >，则称随机向量t X 具有d ,b 阶协整关系，记为t X CI(d ,b )，向量β被称为协整向量。特别地，t y 和t x 为随机变量，并且t y ， ~(1)t x I ，当01()~I(0)t t t y x εββ=-+，即t y 和t x 的线性组合与I(0)变量有相同的统计性质，则称t y 和t x 是协整的，()01,ββ称为协整系数。更一般地，如果一些I(1)变量的线性组合是I(0)，那么我们就称这些变量是协整的。用Eviews5.1来分析1978年到2002年中国农村居民对数生活费支出序列{ln }t y 和对数人均纯收入{ln t x }序列之间的关系。 1、对两个数据序列分别进行平稳性检验：（1）做时序图看二者的平稳性首先按前面介绍的方法导入数据，在workfile 中按住ctrl 选择要检验的二变量，击右键，选择open —as group ，此时他们可以作为一个数据组被打开。点击“View ”―“graph ”—“line ”，对两个序列做时序图见图8-1，两个序列都呈上升趋势，显然不平稳，但二者有大致相同的增长和变化趋势，说明二者可能存在协整关系。但若要证实二者有协整关系，必须先看二者的单整阶数，如果都是一阶单整，则可能存在协整关系，若单整地阶数不相同，则需采取差分的方式，将他们变成一阶单整序列。图8-1 ln t x 和ln t y 时序图

第三章 模型中误差项假定的诸问题汇总

误差修正模型实例(精)

误差修正模型

协整检验及误差修正模型实验指导

协整检验及误差修正模型实验指导

第5章 动态回归与误差修正模型(案例)汇总

第三章 模型中误差项假定的诸问题汇总

ECM误差修正模型

误差修正模型案例

stata-误差修正模型讲解

多元线性回归模型

第三章 一元线性回归模型

应用回归分析,第4章课后习题参考答案.

协整检验及误差修正模型实验指导(精)

实验报告二——误差修正模型的建立与分析

回归分析方法

误差修正模型.

协整检验及误差修正模型定稿版

第三章模型中误差项假定的诸问题汇总

第5章动态回归与误差修正模型(案例)汇总

第三章模型中误差项假定的诸问题汇总

第三章一元线性回归模型