第4章 回归模型中的随机误差项问题

合集下载

计量经济学课程第4章(多元回归分析)

计量经济学课程第4章(多元回归分析)
Page 2
§4.1 多元线性回归模型的两个例子
一、例题1:CD生产函数
Qt AKt 1 Lt 2 et
这是一个非线性函数,但取对数可以转变为一个 对参数线性的模型
ln Qt 0 1 ln Kt 2 ln Lt t
t ~ iid(0, 2 )
注意:“线性”的含义是指方程对参数而言是线 性的
R 2 1 RSS /(N K 1) TSS /(N 1)
调整思想: 对 R2 进行自由度调整。
Page 20
基本统计量TSS、RSS、ESS的自由度:
1.
TSS的自由度为N-1。基于样本容量N,TSS

N i1
(Yi
Y
)2
因为线性约束 Y 1 N
Y N
i1 i
而损失一个自由度。
分布的多个独立统计量平方加总,所得到的新统计量就服从
2 分布。
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
Page 23
双侧检验
概 率 密 度
概率1-
0
2 1 / 2
2 /2
图4.3.1

2
(N-K-1)的双侧临界值
双侧检验:统计值如果落入两尾中的任何一个则拒绝原假设
《计量经济学》,高教出版社2011年6月,王少平、杨继生、欧阳志刚等编著
Page 24
单侧检验
概 率 密 度
概率 概率
0
2 1
2
图4.3.2 (2 N-K-1)的单侧临界值
H0:
2


2,
0
HA :

2


2 0

(整理)第四章 多元线性回归模型

(整理)第四章  多元线性回归模型

第四章 多元线性回归模型在一元线性回归模型中,解释变量只有一个。

但在实际问题中,影响因变量的变量可能不止一个,比如根据经济学理论,人们对某种商品的需求不仅受该商品市场价格的影响,而且受其它商品价格以及人们可支配收入水平的制约;影响劳动力劳动供给意愿(用劳动参与率度量)的因素不仅包括经济形势(用失业率度量),而且包括劳动实际工资;根据凯恩斯的流动性偏好理论,影响人们货币需求的因素不仅包括人们的收入水平,而且包括利率水平等。

当解释变量的个数由一个扩展到两个或两个以上时,一元线性回归模型就扩展为多元线性回归模型。

本章在理论分析中以二元线性回归模型为例进行。

一、预备知识(一)相关概念对于一个三变量总体,若由基础理论,变量21,x x 和变量y 之间存在因果关系,或21,x x 的变异可用来解释y 的变异。

为检验变量21,x x 和变量y 之间因果关系是否存在、度量变量21,x x 对变量y 影响的强弱与显著性、以及利用解释变量21,x x 去预测因变量y ,引入多元回归分析这一工具。

将给定i i x x 21,条件下i y 的均值i i i i i x x x x y E 2211021),|(βββ++= (4.1) 定义为总体回归函数(Population Regression Function,PRF )。

定义),|(21i i i i x x y E y -为误差项(error term ),记为i μ,即),|(21i i i i i x x y E y -=μ,这样i i i i i x x y E y μ+=),|(21,或i i i i x x y μβββ+++=22110 (4.2)(4.2)式称为总体回归模型或者随机总体回归函数。

其中,21,x x 称为解释变量(explanatory variable )或自变量(independent variable );y 称为被解释变量(explained variable )或因变量(dependent variable );误差项μ解释了因变量的变动中不能完全被自变量所解释的部分。

应用回归分析,第4章课后习题参考答案

应用回归分析,第4章课后习题参考答案

第4章违背基本假设的情况思考与练习参考答案4.1 试举例说明产生异方差的原因。

答:例4.1:截面资料下研究居民家庭的储蓄行为Y i=β0+β1X i+εi其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。

由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。

例4.2:以某一行业的企业为样本建立企业生产函数模型Y i=A iβ1K iβ2L iβ3eεi被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。

由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。

这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。

4.2 异方差带来的后果有哪些?答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效2、变量的显著性检验失去意义3、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。

4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。

答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。

其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。

在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。

然而在异方差的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。

由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。

所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。

应用回归分析第四版课后答案

应用回归分析第四版课后答案

假设 3、随机误差项ε与解释变量 X 之间不相关:
Cov(Xi, εi)=0
i=1,2, …,n
假设 4、ε服从零均值、同方差、零协方差的正态分布
εi~N(0, 2 )
i=1,2, …,n
2.3 证明(2.27 式),ei =0 ,eiXi=0 。
n
n
Q (Yi Yˆi )2 (Yi (ˆ0 ˆ1 X i ))2
方法。
答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。其中每个平 方项的权数相同,是普通最小二乘回归参数估计方法。在误差项等方差不相关的 条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。然而在异方差 的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差 平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方 差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。由 OLS
X 2n

X kn
量的观测值矩阵; β(k 1)1


0 1

2
k




为总体回归参数向量;
μ
n1



1 2 n

为随机误差项向量。
多元回归线性模型基本假定:课本 P57
第四章
4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与
法。
答:运用加权最小二乘法消除多元线性回归中异方差性的思想与一元线性回
归的类似。多元线性回归加权最小二乘法是在平方和中加入一个适当的权数 wi ,
以调整各项在平方和中的作用,加权最小二乘的离差平方和为:

第四章--方差分量线性回归模型

第四章--方差分量线性回归模型

第四章 方差分量线性回归模型本章考虑的线性模型不仅有固定效应、随机误差,而且有随机效应。

我们先从随机效应角度理解回归概念,导出方差分量模型,然后研究模型三种主要解法。

最后本章介绍关于方差分量模型的两个前沿研究成果,是作者近期在《应用数学学报》与国际数学杂志《Communications in Statistics 》上发表的。

第一节 随机效应与方差分量模型一、随机效应回归模型前面所介绍的回归模型不仅都是线性的,而且自变量看作是固定效应。

我们从资料对npi i i X X Y 11},,{ 出发建立回归模型,过去一直是把Y 看作随机的,X 1,…,X p 看作非随机的。

但是实际上,自变量也经常是随机的,而并不是我们可以事先设计好的设计矩阵。

我们把自变量也是随机变量的回归模型称为随机效应回归模型。

究竟一个回归模型的自变量是随机的还是非随机的,要视具体情况而定。

比如一般情况下消费函数可写为)(0T X b C C(4.1.1)这里X 是居民收入,T 是税收,C 0是生存基本消费,b 是待估系数。

加上随机扰动项,就是一元线性回归模型)(0T X b C C(4.1.2)那么自变量到底是固定效应还是随机效应?那要看你采样情况。

如果你是按一定收入的家庭去调查他的消费,那是取设计矩阵,固定效应。

如果你是随机抽取一些家庭,不管他收入如何都登记他的收入与消费,那就是随机效应。

对于随机效应的回归模型,我们可以从条件期望的角度推导出与最小二乘法则等价的回归函数。

我们希望通过X 预测Y ,也就是要寻找一个函数),,()(1p X X M X M Y ,当X 的观察值为x 时,这个预测的误差平均起来应达到最小,即22)]([min )]([X L Y E X M Y E L(4.1.3)这里min 是对一切X 的可测函数L(X)取极小。

由于当)|()(X Y E X M(4.1.4)时,容易证明0)]()()][([ X L X M X M Y E(4.1.5)故当)|()(X Y E X M 时,222)]()([)]([)]([X L X M E X M Y E X L Y E(4.1.6)要使上式左边极小,只有取)|()()(X Y E X M X L 。

违背模型基本假设汇总

违背模型基本假设汇总
2
建立违背基本假定回归模型存在的基本问题:
OLS法是否还适用?所得参数的OLS估计
量是否还具有优良的统计性质?变量显著性t 检验和方程显著性F检验还有效吗?
如果OLS法失效,有哪些补救措施? 如何检验模型是否违背基本假定条件?
本章主要讨论不满足基本假定中的某一条, 而其余假定条件均成立时,多元线性回归模型参 数的有效估计和检验问题。
6
一、 多重共线性的概念
在计量经济学中所谓的多重共线性,包括 完全的多重共线性和不完全的多重共线性 对于线性回归模型
Yi 0 1X1i 2 X 2i k X ki u(i i 1, 2, , n)
即 Y X u
7
完全的多重共线性:解释变量 X1, X 2 ,, X k 之间存在完全的多重共线性是指 Rank(X ) k 1 ,
12
➢实际经济问题中的多重共线性
一般地,产生多重共线性的主要原因有以下三个 方面:
(1)经济变量相关的共同趋势
时间序列样本:经济繁荣时期,各基本经济变 量(收入、消费、投资、价格)都趋于增长;衰退时 期,又同时趋于下降。
横截面数据:生产函数中,资本投入与劳动力
投入往往出现高度相关情况,大企业二者都大,小企
4.E+11 3.E+11
GDP
4.E+11
GDP
3.E+11
2.E+11
2.E+11
1.E+11
0.E+00 80 82 84 86 88 90 92 94 96 98 00 02
1.E+11
0.E+#43;11
GDP(-1) 15
3.E+11 4.E+11

《应用回归分析》课后习题答案

《应用回归分析》课后习题答案
1.7构造回归理论模型的基本依据是什么?
答:选择模型的数学形式的主要依据是经济行为理论,根据变量的样本数据作出解释变量与被解释变量之间关系的散点图,并将由散点图显示的变量间的函数关系作为理论模型的数学形式。对同一问题我们可以采用不同的形式进行计算机模拟,对不同的模拟结果,选择较好的一个作为理论模型。
df
均方
F
显著性
组间
(组合)
1231497.500
7
175928.214
5.302
.168
线性项
加权的
1168713.036
1
1168713.036
35.222
.027
偏差
62784.464
6
10464.077
.315
.885
组内
66362.500
2
33181.250
总数
1297860.000
9
由于 ,拒绝 ,说明回归方程显著,x与y有显著的线性关系。
.212
.586
1.708
a.因变量: y
(6)可以看到P值最大的是x3为0.284,所以x3的回归系数没有通过显著检验,应去除。
去除x3后作F检验,得:
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
12893.199
2
6446.600
11.117
.007a
残差
4059.3.500
.724
.433
.212
.586
1.708
a.因变量: y
(2)
所以三元线性回归方程为
模型汇总
模型
R

应用回归分析课后习题第4章第9题

应用回归分析课后习题第4章第9题

4.9 1)由上表可知,普通最小二乘法所建立的回归方程为831.0004.0ˆ-=x y残差散点图为(1)诊断该问题是否存在异方差。

第一步,由残差图可以知道,残差图中53个散点并不是随机的,残差e 随y 值得增大而增大,具有明显的规律,所以可以认为模型的随机误差项i ε的方差是非齐性的,可以初步认为该问题中存在异方差。

第二步,用等级相关系数法进一步的检验首先,用Excel 计算出残差绝对值|i e |,然后利用SPSS 软件,用斯皮尔曼等级相关法进行计算与i x 的等级相关系数,输出结果如表:可以得到等级相关系数为0.318,p=0.021所以可以认为残差绝对值与i x 之间相关,存在异方差。

综上两种方法,可以知道,该问题存在异方差。

(2)如果存在异方差,用幂指数型的权函数建立加权最小二乘回归方程。

由SPSS 软件中的权重估计可以得到当m=1.5,似然函数的值达到最大,由系数表可以知道,此时,加权最小二乘幂指数m 的最优取值为1.5的时候的,回归方程为:683.0004.0ˆ-=x y(3)用方差稳定变换y y =’消除异方差。

首先计算:用Excel 计算出y y =’,然后用SPSS 软件计算出结果中系数表为:由系数表可以知道此时回归方程为582.0001.0ˆ+=x y下面将普通最小二乘估计与做变换后的结果进行比较:首先,由残差图可以知由上图可知道,此时,残差图完全随机分布在0的上方。

另外,由SPSS计算出此时的残差绝对值与x的等级相关系数表如下:此时等级相关系数为0.318,P值为0.021此时说明已消除了异方差的影响,但由于此时的决定系数R方为0.648小于最小二乘估计的R方0.705。

说明此时回归效果并不比最小二乘估计有效。

4.13(1)由普通最小二乘法建立y与x的回归方程。

由上表可知y与x的回归方程为:435.1176.0ˆ-=xy由回归系数的显著性知道,t=107.928 p=0说明自变量对因变量的线性显著影响。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2014年4月25日 山东财经大学统计学院计量经济教研室 第23页
机动 目录 上页 下页 返回 结束
2
2
例4.1 根据随机抽取的21个农村家庭年底储蓄余额与年内家庭 纯货币收入的资料,按收入排序后的数据见下表。其中, x为 年内家庭纯货币收入(元), y为年底家庭储蓄余额(元)。
表4.1 家庭储蓄余额与纯货币收入数据表
• 最小二乘估计量仍然是线性无偏的,但不再具有最小 方差性。 • 参数的显著性检验和置信区间的建立发生困难。 • 虽然最小二乘法参数的估计量是无偏的,但这些参数 方差的估计量、是有偏的。 • 预测的精确度降低。
2014年4月25日
山东财经大学统计学院计量经济教研室
第17页
机动 目录 上页 下页 返回 结束
第 9页
机动 目录 上页 下页 返回 结束
第二节 异 方 差 一、异方差及其产生的原因
当不能满足同方差的假设,即u的条件方差在不同 次的观测中不再是一个常数,而是取得不同的数值,即
Var(u | xi ) i2 常数
(i 1,2, ,n)
则称随机误差项u具有异方差性(Heteroscedasticity)。 如果被解释变量观测值的分散程度是随解释变量的 变化而变化的,如图4.1所示,可以把异方差看成是 由于某个解释变量的变化而引起的,则
Y X u
使得其中的 U 重新满足假定2(同方差性)和假定3(无序列 相关性)。这样就可以对上式使用OLS估计参数,从而 使得上式的OLSE仍然为BLUE。 若因假定2和假定3不满足时,有
2 Cov(u) E(uu) u
其中Ω≠I, Ω是一个n×n的正定对称方阵。
2014年4月25日 山东财经大学统计学院计量经济教研室 第 7页
家庭编号 1 x 590.2 y 107 家庭编号 12 x 2827.73 y 1589
2
3 4 5 6 7 8
664.94
809.5 875.54 991.25 1109.95 1357.87 1682.8
山东财经大学统计学院计量经济教研室
第14页
机动 目录 上页 下页 返回 结束
异方差产生的原因
1、模型中省略的解释变量 如果将某些未在模型中出现的重要影响因素归入随机误差 项,而且这些影响因素的变化具有差异性,则会对被解释 变量产生不同的影响,从而导致误差项的方差随之变化, 即产生异方差性。 2、测量误差 一方面,解释变量取值越大测量误差会趋于增大;另一方 面,测量误差可能随时间而变化。 3、截面数据中总体各单位的差异 如前面家庭储蓄行为中高低收入家庭的差异。 4. 模型函数形式设定错误 如把变量间本来为非线性的关系设定为线性,也可能导致 异方差。
2014年4月25日
山东财经大学统计学院计量经济教研室
第21页
机动 目录 上页 下页 返回 结束
G-Q检验的步骤:
1.将n对样本观察值(xi , yi)按观察值xi的大小排队。 2.将序列中间的c个观察值除去,并将剩下的观察值 划分为较小与较大的相同的两个子样本,每个子 样样本容量均为(n-c)/2。 注意:对于n≥30时,c=n/4最合适。 3.对每个子样分别进行OLS回归,并计算各自的残 差平方和。分别用RSS1与RSS2表示较小与较大的 残差平方和,它们的自由度均为(n-c)/2–k–1,k为 模型中自变量个数。 4.选择统计量
ˆ 称为广义最小二乘估计量(GLSE),可以 上式中的 β 证明,它具有线性、无偏性和最小方差性,即它是最优 线性无偏估计量(BLUE)
GLSE的协方差矩阵为:
2 2 ˆ) (X Cov(β X )1 u ( X 1 X )1 u
2014年4月25日
山东财经大学统计学院计量经济教研室
机动 目录 上页 下页 返回 结束
此时可以觅得一个n×n的非奇异矩阵P,使得: PΩ P′=I 即 P′ P = Ω-1 然后用觅得的P乘以(4.7)的两边,有: PY=PXβ+Pu 记 Y PY , X PX , u Pu
(4.7)就转换为: 由于:
Y X u
(4.14)
Cov(u ) E (uu) E ( PuuP) PE (uu) PT P u2PT u2 PPT u2 I
2014年4月25日 山东财经大学统计学院计量经济教研室 第 8页
机动 目录 上页 下页 返回 结束
所以,(4.14) 满足同方差性和无序列相关性,即可以采 用OLS估计参数了。其参数的OLSE为:
ˆ ( X X )1 X Y [( PX )( PX )]1 ( PX )PY β [ X PPX ]1 X PPY [ X 1 X ]1 X 1Y (4.16)
其中, Q 为产出量, K 为资本, L 为劳动力, u 为随机项。 u 在该问题中表示了包括不同企业在设计上、生产工艺 上的区别,技术熟练程度和管理上的差别以及其它因素。 这些因素在小企业之间差别不大,而在大企业之间,这 些因素都相差甚远,即随机项的方差随着解释变量的增 大而增大。
2014年4月25日
具有 BLUE性质。
若古典假定得不到完全满足,特别是假定2(同方 差性)和假定3(无序列相关性)得不到满足时, 对OLSE的影响更大。
2014年4月25日
山东财经大学统计学院计量经济教研室
第 6页
机动 目录 上页 下页 返回 结束
广义最小二乘法(General Least Squares-GLS)就是 为了解决上述问题提出的。其基本思路是:若假定2同 方差性)和假定3(无序列相关性)得不到满足时,我 们可以采取适当的变换,使原模型变为以下的形式:
2014年4月25日 山东财经大学统计学院计量经济教研室 第15页
机动 目录 上页 下页 返回 结束
注意:
☆异方差问题多在于截面数据中而非时间序列数据中。
☆本教材只讨论横截面数据的异方差问题。
2014年4月25日
山东财经大学统计学院计量经济教研室
第16页
机动 目录 上页 下页 返回 结束
二、异方差产生的后果
2014年4月25日 山东财经大学统计学院计量经济教研室 第18页
机动 目录 上页 下页 返回 结束
y
y
x
y
x
A
同方差
y
B 递增异方差
x
x
C 递减异方差
2014年4月25日 山东财经大学统计学院计量经济教研室
D 复杂异方差
第19页
机动 目录 上页 下页 返回 结束
2014年4月25日
山东财经大学统计学院计量经济教研室
第四章 回归模型中的 随机误差项问题
第一节 概述 第二节 异方差 第三节 自相关
第一节
一、古典假定


假定1:随机项ui具有零均值: E(ui|xi)=0 i=1,2, …, n 假定2:随机项ui具有同方差: Var (ui|xi)=u2 i=1,2, …, n 假定3:随机项ui无序列相关性: Cov(ui , uj)=0 i≠j i,j= 1,2, …, n 假定5:u服从正态分布 ui ~ N(0, u2 ) i=1,2, …, n
2014年4月25日 山东财经大学统计学院计量经济教研室 第 2页
机动 目录 上页 下页 返回 结束
有了以上这些假定,根据高斯-马尔可夫 (Gauss-Markov)定理,我们知道古典回归模型的 最小二乘估计量(OLSE)是线性最优无偏估计量 (BLUE),而且服从正态分布。因此,就可以进行参 数的区间估计,而且也可以检验真实总体回归系数的 显著性。
三、异方差的检验
由于异方差性就是相对于不同的解释变量观测值, 随机误差项具有不同的方差。那么: 检验异方差性,也就是检验随机误差项的方差与解 释变量观测值之间的相关性及其相关的“形式”。 (一)图示法 随机项u的异方差与解释变量的变化有关。因 此,可利用因变量y与解释变量x的散点图或残差e2i 与x的散点图,对随机项u的异方差作近似的直观判 断。
Var(ui2 ) i2 2 f ( xi )
2014年4月25日 山东财经大学统计学院计量经济教研室 第10页
机动 目录 上页 下页 返回 结束
f (y)
y
E( y | xi ) 0 1 xi
x 图4.1 异方差示意图
2014年4月25日
山东财经大学统计学院计量经济教研室
2014年4月25日
山东财经大学统计学院计量经济教研室
第 3页
机动 目录 上页 下页 返回 结束
二、古典假定的违背及造成的后果
在实际经济问题中,上述的古典假定不一定都 能得到满足。如果这些假定不完全满足,则OLSE的 BLUE特性将不复存在。当然,每一个假定不满足所 造成的后果是不同的。在本章中,我们将严格考察 上述假定,找出如果有一个或多个假定得不到满足 时,估计量的性质将会发生什么变化 ,并研究当出现 这些情况时,应该如何处理,即古典模型假定违背 的经济计量问题。
2014年4月25日
山东财经大学统计学院计量经济教研室
第 4页
机动 目录 上页 下页 返回 结束
关于假定1,一般地我们认为假定E(ui|xi)=0 是合理的。 因为随机项u是多种因素的综合,而每种因素的影响都 “均匀”地微小,它对因变量的影响不是系统的,且正负 影响相互抵消,故所有可能取值平均起来为零。即使有轻 度的违反,从实践的观点来看可能不会产生严重的后果, 因为它可能只影响回归方程的截距项 。 关于随机项正态性分布的假定,如果我们的目的仅仅 是估计,这种假定并不是绝对必要的。事实上,无论是否 是正态分布,OLSE估计式都是BLUE。 剩下的四个假定将在下面的四节中分别加以讨论。
2014年4月25日
山东财经大学统计学院计量经济教研室
第 5页
机动 目录 上页 下页 返回 结束
相关文档
最新文档