5 第五章异方差性(第二版)
计量经济学庞皓课件(第五章 异方差性)

绘制出
ei2
对
X
的散点图
i
◆如果 ui 不随 Xi 而变化,则表明不存在异方差;
◆如果 ui 随 Xi 而变化,则表明存在异方差。
19
二、Goldfeld-Quanadt检验
作用:检验递增性(或递减性)异方差。
基本思想:将样本分为两部分,然后分别对两个样 本进行回归,并计算两个子样的残差平方和所构成 的比,以此为统计量来判断是否存在异方差。
E(Yi ) 1 2 X 2i 3X3i ... k X ki (5.2)
的分散程度,因此同方差性指的是所有观测值的
分散程度相同。
6
异方差性的含义
设模型为
Yi 1 2 X2i 3 X3i ... k X ki ui i 1, 2,..., n
如果对于模型中随机误差项 ui 有:
即认为存在异方差性。
38
第四节 异方差性的补救措施
主要方法:
●模型变换法 ●加权最小二乘法 ●模型的对数变换
39
一、模型变换法
以一元线性回归模型为例:
Yi 1 2 X i ui
经检验 ui 存在异方差,且
var(ui )
2 i
2
f
(Xi)
其中 σ 2是常数,f (Xi ) 是 X i的某种函数。
40
变换模型时,用 f (Xi) 除以模型的两端得:
Yi = f(Xi )
β1 f(X i
)
+
β2
Xi + f(Xi )
ui f(Xi )
记 Yi* 则有:
Yi f (Xi)
;
X
* i
Xi f (Xi)
; 1*
Yi*
第五章 异方差性

26
异方差性的检验
问题在于用什么来表示随机误差项的方差 一般的处理方法:
Var(ui ) E(uቤተ መጻሕፍቲ ባይዱ2) ei2
图示检验法
图示检验法
(一)相关图形分析 方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释
变量Y与随机误差项u有相同的方差,所以分析Y与X的相关图,可以初 略地看到Y的离散程度与X之间是否有相关关系。
ui 的某些分布特征,可通过残差 ei 的图形对异方差进行观察。
对于一元回归模型,绘制出ei2 对Xi的散点图,对于多元回归模型,绘制出ei2 对Yi的散点图或ei2 与认为和异方差有关的X的散点图。
31
图示检验法
(二)残差图形分析
e~i 2
e~i 2
X 同方差
e~i 2
X 递增异方差
e~i 2
X 递减异方差
每个企业所处的外部环境对产出量的影响被包含在随机误差项中 每个企业所处的外部环境对产出量的影响程度不同,造成了随机
误差项的异方差性
产生异方差性的原因
产生异方差性的原因
(一)模型设定误差
假设正确的模型是:
Yi 1 2 X2i 3 X3i ui
假如略去了重要的解释变量X3 ,而采用 Yi 1 2 X2i vi
排序,再按戈德菲尔德匡特检验方法回归,否则即使存在异方差,也有可能用戈德菲
尔德匡特方法检验不出来。
用 EViews 给截面数据排序的方法:在 Workfile 窗口点击 Procs 键并选 Sort current page
功能,在打开的 Sort Workfile Series 对话窗填写以哪一个序列为标准(基准序列)排
第五章 异方差性

Qt
ALt
K
t
eut
• U为随机误差项,它包含了资本K和劳动力L
以外的因素对产出Q的影响,比如能源、环境、
政策等。由于不同的地区这些因素不同造ui 成了 对产出的影响出现差异,使得模型中的 具有
异方差,并且这种异方差的表现是随资本和劳 动力的增加而有规律变化的。
(二)样本数据的观测误差
• 一方面,样本数据的观测误差常随着时间的 推移而逐步积累,引起随机误差项的方差增 加。另一方面,随着时间的推移,样本观测 技术会随之提高,也可能使得样本的观测误 差减少,引起随机误差项的方差减小。因此, 随着时间的推移,样本数据的观测误差会发 生变化,从而引起随机误差项的变化。
Yt 1 2 X 2i 3 X 3i ui (1)
Y 1 2 X 2 3 X 3
(2)
Yt 1' 2 X 2i ui'
(3)
Y 1' 2 X 2
(4)
由(2)、(4)得:1' 1 3 X3 (5)
由(1)、(3)、(5)得:
Var(ui )
2 i
f
(X
ji )
i 1, 2, , n
则称随机误差项存在异方差.
( 即回归模型中随机误差项的方差不是常数 )
例2:使用截面数据研究储蓄函数
假设 储蓄函数模型Y i 0 1X i ui
式中:Y i第i个家庭的储蓄额,X i第i个家庭的可支配收入,ui 代表除可支配收入以外影响储蓄额的其它因素,如利率、家庭 人口、文化背景等等。这里,同方差假设显然与事实不符。
ui' 1 3 X 3i ui 1'
5异方差性

钱还很多,这些余钱可用于购买奢侈消费品,也可用于储蓄或投资,其消费支出的方差 将会很大。显然,这里存在异方差现象。
又例如,使用截面资料建立储蓄模型(可能存在异方差)
Yi 1 2 X i ui
Yi : 第i个家庭的储蓄额; X i : 第i个家庭的可支配收入 ui : 除可支配收入之外的其它因素(如 : 利息、家庭人口、文化背景等)
销售收入 利润总额
商店名称
X
Y
回归值
残差
1、百货大楼 2、城乡贸易中心
… 19.新街口百货商场 20.星座商厦
160.0
12.8
10.2
2.634705
151.8
8.9
9.6
-0.717881
…
…
…
…
22.2
1.0
1.0
0.033928
20.7
0.5
0.9
-0.365935
资料来源:《北京统计年鉴》1997年卷 利润总额对销售收入的线性回归, Kt增大),观测误差降低, 引起ui偏离均值的程度不同,会产生异方差。
又例如,边学边改学习模型(人们在学习过程中,其行为误差随时间而减少)。
在给定的一段时间内,打字出错个数与用于打字练习的小时数的关系。随着打字练 习时间的增加,平均打错个数及打错个数的方差都有所下降。
E(2
xi u i xi2
2)2
E(
xi u i xi2
)2
xi2
u
2 i
E(
2
i j
xi x juiu j
)
E(
xi2
u
2 i
)
(xi2 ) 2
(xi2 ) 2
xi2
庞浩 计量经济学5第五章 异方差性

同方差
递增型异方差
递减型异方差
复杂型异方差
18
2.借助X-e2散点图进行判断 观察散点的纵坐标是否随解释变量Xi的变化而 变化。
~2 e2e i ei e2 ~2
X 同方差 递增异方差
X
e2
~2 e i
~2 e 2 e i
X 递减异方差 复杂型异方差
X
19
二、戈德菲尔德—夸特 (Goldfeld-Quanadt)检验
3
说明1
矩阵表示: Y X u 随机扰动项向量 其方差—协 u1 u 方差矩阵不 2 u 再是: un n1 而是:
2 2 Var Cov ( ui ) 2 nn
ei X i v i
ei
1 vi Xi
ei X i v i 1 ei vi Xi
③利用上述回归的R2、t统计量、F统计量等判断,R2 好、t统计量和F统计量显著,即可判定存在异方差。 28
说明: 1.也可以用 e i 与可能产生异方差的多个解释变 量进行回归模拟; 2.戈里瑟检验的优点在于不仅检验了异方差是否 存在,同时也给出了异方差存在时的具体表现 形式,为克服异方差提供了方便。 3.试验模型选得不好,也可能导致检验不出是否 存在异方差性。
12 2 2 Var Cov ( ui ) 2 n nn
4
说明2
随机扰动项 ui具有异方差性,可理解释为被解释变量 的条件分散程度随解释变量的变化而变化,如下图所 示:var( ui ) i2 2 f ( X i)(i 1,2,, n)
10
第二节 异方差性的后果
第五章异方差ppt课件

f
ˆ 2
2
w i (Yˆ ( ˆ1 ˆ2 X i ))( X i ) 0
ˆ2
wi xi* yi*
w
i
x
* i
2
ˆ1 Y * ˆ 2 X *
其中, X * w i X i , Y * w iYi
wi
wi
xi*
Xi
X
* i
,
yi*
Yi
Yi*
Econometrics 2005
将是不可靠的。
Econometrics 2005
13
5.3 异方差的检验
方法有 (1)图示法( X _ e2); (2)解析法:
戈德菲尔德-匡特检验 怀特检验 ARCH检验
Econometrics 2005
14
5.3.1 图示法及其类型
1. 异方差指u的方差随着x的变化而变化。 2. 故可以根据x-e2的散点图,对异方差是否
Y的预测值的精度降低;
2
(2)由于 i 难以确定, Y的方差也就难以确定, Y
的预测区间的确定也出 现困难;
2
(3)在 = ei2 /( n k )是 2的无偏的证明中用到了
2
同方差的假定,由于异 方差性,使得 = ei2 /( n k )
是有偏的。在此区间估 计基础上区间估计和假 设检验
基本思路:
(以二元回归为例Y:t 1 2 X2t 3X3t ut)
如果有异方差,则i2与解释变量有关系。:如
i2=0
1X2i
3 X3i
2
X
2 2i
4 X32i
5 X2i
X3i+vi
但是i2一般未知,用模型回剩归余ei2作为i2的渐进
第5章 异方差性

5、计算统计量:
RSS2
F
nc ( k 1) nc nc 2 ~ F( k 1, k 1) RSS1 2 2 nc ( k 1) 2
6、在给定的显著性水平下比较判断。
注意: (1) 当模型含有多个解释变量时,应以每一个解释变 量为基准检验异方差。 (2)对于截面样本,计算F统计量之前,必须先把数据 按解释变量的值从小到大排序。 (3)G—Q检验仅适用于检验递增或递减型异方差。 (4)检验结果与数据剔除个数c的选取有关。 (5) G—Q检验无法判定异方差的具体形式。
5.2异方差性的后果
5.2.1对模型参数估计值无偏性的影响
以简单线性回归模型为例,对模型 yt = b0 + b1 xt + ut ˆ 当Var(ut) = t 2,为异方差时,以 b1 为例:
ˆ b1
k
t
yt b1 kt ut
ˆ E (b1 ) E (b1 kt ut ) b1
划分方法是: 把成对(组)的观测值按解释变量的大小顺序排列, 略去c个处于中心位置的观测值 (通常n 30时,取c n/ 4), 余下的n- c个观测值自然分成容量相等,(n- c) / 2的两 个子样本。
{x1, x2, …, xt-1, xt, xt+1, …, x n-1, xn}
n1 = (n-c) / 2
5.2.3对模型参数估计值显著性检验的影响
ee ˆ 并非随机误差项 在异方差情况下, n k 1 方差的无偏估计量。
2
ˆ 导致在此基础上估计的 s ( b j ) 也出现偏误。
ˆ bj 而变量的显著性检验中,构造了t统计量 t ˆ s(b j )
变量的显著性检验失去意义。
计量经济学第五章异方差性

计量经济学第五章异⽅差性第五章异⽅差性本章教学要求:根据类型,异⽅差性是违背古典假定情况下线性回归模型建⽴的另⼀问题。
通过本章的学习应达到,掌握异⽅差的基本概念包括经济学解释,异⽅差的出现对模型的不良影响,诊断异⽅差的⽅法和修正异⽅差的若⼲⽅法。
经过学习能够处理模型中出现的异⽅差问题。
第⼀节异⽅差性的概念⼀、⼆个例⼦例1,研究我国制造业利润函数,选取销售收⼊作为解释变量,数据为1998年的⾷品年制造业、饮料制造业等28个截⾯数据(即n=28)。
数据如下表,其中y表⽰制造业利润函数,x表⽰销售收⼊(单位为亿元)。
Y对X的散点图为从散点图可以看出,在线性的基础上,有的点分散幅度较⼩,有的点分散幅度较⼤。
因此,这种分散幅度的⼤⼩不⼀致,可以认为是由于销售收⼊的影响,使得制造业利润偏离均值的程度发⽣变化,⽽偏离均值的程度⼤⼩的不同,就是所谓的随机误差的⽅差存在变异,即异⽅差。
如果⾮线性,则属于哪类⾮线性,从图形所反映的特征看,并不明显。
下⾯给出制造业利润对销售收⼊的回归估计。
模型的书写格式为212.03350.1044(0.6165)(12.3666)0.8547,..56.9046,152.9322213.4639,146.4905Y Y X R S E F Y s =+=====通过变量的散点图、参数估计、残差图,可以看到模型中(随机误差)很有可能存在异⽅差性。
例2,改⾰开放以来,各地区的医疗机构都有了较快发展,不仅政府建⽴了⼀批医疗机构,还建⽴了不少民营医疗机构。
各地医疗机构的发展状况,除了其他因素外主要决定于对医疗服务的需求量,⽽医疗服务需求与⼈⼝数量有关。
为了给制定医疗机构的规划提供依据,分析⽐较医疗机构与⼈⼝数量的关系,建⽴卫⽣医疗机构数与⼈⼝数的回归模型。
根据四川省2000年21个地市州医疗机构数与⼈⼝数资料对模型估计的结果如下:i iX Y 3735.50548.563?+-= (291.5778) (0.644284) t =(-1.931062) (8.340265)785456.02=R 774146.02=R 56003.69=F式中Y 表⽰卫⽣医疗机构数(个),X 表⽰⼈⼝数量(万⼈)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ˆ*) Var ( 2
( x )
2 2 x i i 2 2 i
(证明见下页)
i2 未知,也不能再用 ( ei2 ) (n 2) ˆ 2 去估计, 2 ˆ * ) 无法确定。 ( i 不再是常数), Var (
2
2、如果仍然用不存在异方差性时的OLS方式估计其 方差,即用
第五章 异 方 差 性
引子:更为接近真实的结论是什么?
根据四川省2000年21个地市州医疗机构数与人口数资 料,分析医疗机构与人口数量的关系,建立卫生医疗机 构数与人口数的回归735 X Y i i
(291.5778) (0.644284) t =(-1.931062) (8.340265)
●
第五章
异方差性
本章将讨论四个问题: ●异方差的实质和产生的原因 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救
第一节 异方差性的概念
一、异方差的实质
同方差的含义 同方差性:对所有的 i (i 1,2,..., n) 有:
Var(ui ) = σ
2
因为方差是度量被解释变量
Y
的观测值围绕回归线
● 要求为大样本 ● 不仅能够检验异方差的存在性,同时在多变量 的情况下,还能判断出是哪一个变量引起的异方 差。
White 检验在EViews上的实现(用现成命令)
设 Yt 1 2 X 2t 3 X 3t t
1)Ls Y C X2 X3 2)点击 View/residual test/White/回车; 3)在出现的对话框中,选择 no cross terms(没有交叉项) /回车或 cross terms(有交叉项)/回车 4)出现输出框(比模型输出框多2行) Test直接给出了相关的统计量(F-statistic和Obs*R-squared)
ˆ ) 2 Var ( 2
2 x i
所估计的方差,会低估存在异方差时的的真实方差。
ˆ ) ,也就会高估 t 统计量,从而 后果: 低估 Var ( 2 夸大所估计参数的统计显著性。
三、预测精度降低,区间预测面临困难
尽管参数的OLS估计量仍然无偏,并且基 于此的预测也是无偏的,但是
ˆ 的方差增大,Y预测值 ●由于异方差的存在, k 的精确度将会下降
1)
键入 Sort /回车,在对话框中 键入X(或Xi中任一个)/ok;
2) 键入Sample /回车,在对话框中键入1 n1 /ok(前部分样本区) 3) 键入 Ls y c x(或Ls y c x2 x3 x4┄)/回车,得残差平方和S2小 4) 键入Sample /回车,在对话框中键入n1+c+1 n / ok(后部分样本区) 5) 键入Ls y c x(或Ls y c x2 x3 x4┄)/回车,记住残差平方和S2大 6)计算F统计量,作出是否拒绝原假设的结论。
并计算辅助回归的 R 2
3.计算统计量 nR2 2 R n 为样本容量, 为辅助回归可决系数 4.提出假设
H0 : 2 =...= 6 = 0, H1 : ( )不全为零 j j=2,,3,...,6
在大样本情况下可以证明,在零假设成立下,nR 2服
2 从自由度为5的 分布,即 nR 2 ~ 2 (5)
2 ◆如果 ei 不随 X i 而变化,则表明不存在异方差; 2 e ◆如果 i 随 X i 而变化,则表明存在异方差。
通过Eviews作x- e2 散点图 1、键入 LS y c x 作回归 2、键入 genr e1=resid 调用残差 3、键入 genr e2=e1^2 生成残差平方 4、键入 Scat X e2
或 1、点击 2、点击 3、选
Quick / Graph,键入 x e2 Line Graph,在出现的下拉菜单中 Scatter Diagram (散点图) / ok
e
2
e
2
e
2
(a)
X(d )
e
2
(b)
e
2 i
e
与 X i的散点图或Y与X的散点图,作出近似判
2 i
1.残差图形分析
设一元线性回归模型为:
Yi β1 β 2 X i u i
运用OLS法估计,得样本回归模型为:
ˆ + β ˆ X Yˆi = β 1 2
由上两式得残差: 绘制出 ei2 对 X i 的散点图
i
ˆ ei Yi - Y i
其中 t 为随机误差项。
2 2 2 但一般 t 未知,可用原模型回归剩余 et 作为 t 的 估计值,进行以上辅助回归。在大样本情况下寻求 能确定分布的统计量,判断 t2 的变化是否与解释
v
变量有关 (当有K个解释变量时,可作类似的含两两交互的辅 助回归)
检验的基本步骤: (手算)
1.求回归估计式并计算
例如两个解释变量的模型中 Yt = β1 + β2 X2t + β3 X3t +ut 2 设 t 与 X 2 和X 3 的关系为如下辅助回归:
t2 1 2 X 2t 3 X 3t 4 X 22t 5 X 32t 6 X 2t X 3t vt
(2)如果方差随X递减
统计量
F
2 e 1i ( 2 e 2i
nc k) 2 nc k) ( 2
F服从第一、二自由度均为 [( n c) 2] k 的F 分布。 判断:查表得F临界值
F [(n c)
2
k , (n c)
2
k]
◆若 F F(临界值),说明前部分与后部分比值显著大于1, 就拒绝 H 0 (同方差) ,即接受存在异方差性 ◆若 F F(临界值),说明前部分与后部分比值不显著大于1, 就接受 H 0 ,认为是同方差性
对比同方差时为
2 i
(i 1,2, n)
Var (ui | X 2i , , X ki )
2
异方差可看成是由于某个解释变量的变化而引起的,则
V a r (u i | X
2i , , X
ki )
2 i
2
f (X
mi
)
异方差性的图示
概 率 分 布 密 度
储蓄Y
收入X
二、产生异方差性的原因
X
(c )
X
(d )
X
2.相关图分析
Y与X之间图形举例:
分析Y与X的相关图形,也可以初略地看到Y的离散程度与X之间 是否有相关关系。 用1998年四川省各地市州农村居民家庭消费支出与家庭纯收入 的数据,绘制出消费支出对纯收入的散点图,其中用 Y1 表示 农村家庭消费支出, X 1表示家庭纯收入。
2 e 的平方 t 。 2 et
ˆt ,并求残差 用OLS法估计原模型,计算残差 et Yt -Y
2.求辅助函数
2 2 e σ 用残差平方 t 作为异方差 t 的估计,并建立
2 2 X 2t , X 3t , X 2 , X t 3t , X 2t X 3t 的辅助回归,即
2 2 ˆ2 X 2t + α ˆ3 X 3t + α ˆ4 X 2 ˆ ˆ ˆ1 + α ˆt2 = α e + α X t 5 3t + α6 X 2t X 3t
5.检验
2 2 χ χ 给定显著性水平 ,查 分布表得临界值 (5) ,
2 2 nR χ 如果 (5) , H 0 不合理,则拒绝原假设 H 0,
即认为模型中随机误差存在异方差 。
2 2 nR 5 ( ) 则不拒绝 若
H 0 ,即认为模型中随
机误差是同方差。
White检验的特点
Xi
具体步骤:
●排序:将观测值按解释变量X大小顺序排列 ●数据分组:去掉中间的C个(约1/4)观测值,分别进 行前后两部分 (n c) 2 个观测值的回归 ●提出假设 :分别进行前后两部分回归的基础上,提出检 验假设:
H 0 : ui 是同方差(前后两部分方差无显著差异),
2 2 H : 即 0 i
三、White检验
基本思想:
2 如果存在异方差,其方差 t 与某解释变量有关系。
在不知道关于异方差的任何先验信息时,在大样本的 情况下,将OLS估计后的残差平方对解释变量的各种 形式(如常数、解释变量、解释变量的平方及其交叉 乘积等)构成一个辅助回归,利用辅助回归建立相应 的检验统计量来判断异方差性。
F服从第一、二自由度均为 [(n c) 2] k 的F 分布。 ●判断:
k] 2 2 ◆若 F F(临界值),说明后部分与前部分比值显著 大于1,就拒绝 H 0 (同方差) ,即接受存在异方差性 F [(n c) k , (n c)
查表得F临界值
◆若 F F (临界值),说明后部分与前部分比值不 显著大于1,就接受 H 0 ,认为是同方差性
● 由于 难以确定,Y的方差也难以确定,Y置 信区间的确定会出现困难
2 i
第三节 异方差性的检验
一、图形分析法
基本思想: 异方差性的表现是 u i 的方差随某个解释变量的变 化而变化,或Y的分散程度随X的变化而变化。因此可利 用 u i 的代表 ei 与某解释变量的散布图,观察是否存在异 方差及其异方差的形式,或从Y的分散程度与X的关系观 测是否存在异方差。 具体方法: 假定不存在异方差,进行回归,并计算剩余平方 描绘 断。
第二节 异方差性的后果
存在异方差时,OLS估计仍然是无偏估计,但是
一、OLS估计式不再具有最小方差特性(不同方法)
OLS估计式的方差不一定是最小的,即OLS估计式虽然无 偏,但不一定是最佳的(存在异方差时,可证明能够找到比 OLS 的方差更小的估计方法)