第五章 异方差性67页
第五章 异方差性

Qt
ALt
K
t
eut
• U为随机误差项,它包含了资本K和劳动力L
以外的因素对产出Q的影响,比如能源、环境、
政策等。由于不同的地区这些因素不同造ui 成了 对产出的影响出现差异,使得模型中的 具有
异方差,并且这种异方差的表现是随资本和劳 动力的增加而有规律变化的。
(二)样本数据的观测误差
• 一方面,样本数据的观测误差常随着时间的 推移而逐步积累,引起随机误差项的方差增 加。另一方面,随着时间的推移,样本观测 技术会随之提高,也可能使得样本的观测误 差减少,引起随机误差项的方差减小。因此, 随着时间的推移,样本数据的观测误差会发 生变化,从而引起随机误差项的变化。
Yt 1 2 X 2i 3 X 3i ui (1)
Y 1 2 X 2 3 X 3
(2)
Yt 1' 2 X 2i ui'
(3)
Y 1' 2 X 2
(4)
由(2)、(4)得:1' 1 3 X3 (5)
由(1)、(3)、(5)得:
Var(ui )
2 i
f
(X
ji )
i 1, 2, , n
则称随机误差项存在异方差.
( 即回归模型中随机误差项的方差不是常数 )
例2:使用截面数据研究储蓄函数
假设 储蓄函数模型Y i 0 1X i ui
式中:Y i第i个家庭的储蓄额,X i第i个家庭的可支配收入,ui 代表除可支配收入以外影响储蓄额的其它因素,如利率、家庭 人口、文化背景等等。这里,同方差假设显然与事实不符。
ui' 1 3 X 3i ui 1'
5异方差性

钱还很多,这些余钱可用于购买奢侈消费品,也可用于储蓄或投资,其消费支出的方差 将会很大。显然,这里存在异方差现象。
又例如,使用截面资料建立储蓄模型(可能存在异方差)
Yi 1 2 X i ui
Yi : 第i个家庭的储蓄额; X i : 第i个家庭的可支配收入 ui : 除可支配收入之外的其它因素(如 : 利息、家庭人口、文化背景等)
销售收入 利润总额
商店名称
X
Y
回归值
残差
1、百货大楼 2、城乡贸易中心
… 19.新街口百货商场 20.星座商厦
160.0
12.8
10.2
2.634705
151.8
8.9
9.6
-0.717881
…
…
…
…
22.2
1.0
1.0
0.033928
20.7
0.5
0.9
-0.365935
资料来源:《北京统计年鉴》1997年卷 利润总额对销售收入的线性回归, Kt增大),观测误差降低, 引起ui偏离均值的程度不同,会产生异方差。
又例如,边学边改学习模型(人们在学习过程中,其行为误差随时间而减少)。
在给定的一段时间内,打字出错个数与用于打字练习的小时数的关系。随着打字练 习时间的增加,平均打错个数及打错个数的方差都有所下降。
E(2
xi u i xi2
2)2
E(
xi u i xi2
)2
xi2
u
2 i
E(
2
i j
xi x juiu j
)
E(
xi2
u
2 i
)
(xi2 ) 2
(xi2 ) 2
xi2
第5章 异方差性

估计量不具有最佳性。 但OLS估计量不具有最佳性。 估计量不具有最佳性
5.2.3对模型参数估计值显著性检验的影响 对模型参数估计值显著性检验的影响
e′e 并非随机误差项 并非随机误差项 在异方差情况下, ˆ 在异方差情况下, σ = n − k −1 方差的无偏估计量。 方差的无偏估计量。
2
ˆ 导致在此基础上估计的 s ( b j ) 也出现偏误。
e t 来近似代表随机误差项
5.3.1图示检验法 图示检验法
的估计值) (1)用X(或Y的估计值)与残差平方的散点图进 ) ( 的估计值 行初步判断
~ ei 2 ~ ei 2
X 同方差 递增异方差
X
~ ei 2
~ ei 2
X 递减异方差 复杂型异方差
X
(2)用X-Y的散点图进行判断 ) 的散点图进行判断 看是否存在明显的散点扩大 缩小 复杂型趋势 散点扩大、缩小 散点扩大 缩小或复杂型趋势 (即不在一个固定的带型域中)
. 0 . 0 . ... σ nn ...
5.1.2产生异方差的原因 产生异方差的原因
1、解释变量的遗漏。 2、来自不同抽样单元的因变量观察值的差异。 3、异常观测值的出现。 4、时间序列数据中,观测技术的改进引起的观测值的变化。
注意: (1)时间序列数据和截面数据中都有可能存在异方差,其 中截面样本中更为常见。 (2) 经济时间序列中的异方差常为递增型异方差。金融时 间序列中的异方差常表现为自回归条件异方差。
yt = b0 + b1 x1t + b2 x2t + ut
1、用普通最小二乘法估计模型,求出残差平方序 2 列:e t
2、以残差平方作为因变量,以原方程中所有解释变 解释变 解释变量的平方项和交叉积项 量以及解释变量的平方项 交叉积项 解释变量的平方项 交叉积项做辅助回归:
计量经济学第五章 异方差

异方差性
引子:更为接近真实的结论是什么?
根据四川省2000年21个地州市医疗机构数与人口数资料,分 析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的 回归模型。模型估计的结果如下:
Yˆi 563.0548 5.3735Xi (291.5778) (0.644284)
t =(-1.931062) (8.340265)
二、加权最小二乘法
以一元线性回归模型为例:
Yi 1 2 Xi ui
(5.18)
经检验 u存i 在异方差,
var(ui )
2 i
2
f
(Xi)
(一)基本思路
区别对待不同的 。对2i 较小的 给予e较i2 大的权
数,对较大的 e给i2 予较小的权数,从而使 更e好i2 地
反映 对i2 残差平方和的影响程度。
Yi 1 2 Xi ui
其中: Y表i 示卫生医疗机构数,表示 人X口i 数。
四川省2000年各地区医疗机构数与人口数
地区
成都 自贡 攀枝
花 泸州 德阳 绵阳 广元 遂宁 内江 乐山 南充
人口数 (万人)X
10133 315 103
463.7 379.3 518.4 302.6 371 419.9 345.9 709.2
2、求使满足 min
wiei2 的
* i
根据最小二乘原理,若使得加权残差平方和最小,则:
ˆ1* Y * ˆ2* X *
ˆ2*
wi ( Xi X * )(Yi Y * ) wi ( X i X * )2
其中: X * wi Xi ,Y * wiYi
计量经济学五异差性

计量经济学五异差性————————————————————————————————作者:————————————————————————————————日期:第五章 异方差性用OLS 法得到的估计模型通过统计检验后,还要检验摸型是否满足假定条件。
由第二章知,只有模型的5个假定条件都满足时,用OLS 法得到的估计量才具有最佳线性无偏特性。
当一个或多个假定条件不成立时,OLS 估计量将丧失上述特性。
本节讨论当假定条件不成立时,对参数估计带来的影响以及相应的补救措施。
以下讨论都是在某一个假定条件被违反,而其他假定条件都成立的情况下进行。
分为5个步骤。
(1) 回顾假定条件。
(2) 假定条件不成立对模型参数估计带来的影响。
(3) 定性分析假定条件是否成立。
(4) 假定条件是否成立的检验(定量判断)。
(5) 假定条件不成立时的补救措施。
5.1 异方差性的含义与产生的原因 5.1.1 同方差假定-224681012050100150200XY图5.1 同方差情形 图5.2 同方差情形模型的假定条件⑴ 给出Var(u ) 是一个对角矩阵,Var(u ) = E(u u ' ) = σ 2I = σ 210101⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦O (5.1) 且u 的方差协方差矩阵主对角线上的元素都是常数且相等,即每一误差项的方差都是有限的相同值(同方差假定);且非主对角线上的元素为零(非自相关假定),当这个假定不成立时,Var(u ) 不再是一个纯量对角矩阵。
Var(u ) = σ 2 Ω = σ 211220..00...0 00...TT σσσ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦≠σ 2 I (5.2)当误差向量u 的方差协方差矩阵主对角线上的元素不相等时,称该随机误差系列存在异方差,即误差向量u 中的元素u t 取自不同的分布总体。
非主对角线上的元素表示误差项之间的协方差值。
比如 Ω 中的 σi j 与σ 2的乘积 ,(i ≠ j )表示与第i 组和第j 组观测值相对应的u i 与 u j 的协方差。
异方差性及后果

V (ui ) E(ui2) ui 2 常数
(5.1.2)
异方差性的数学表达式,可写成自变量 xi 的函数,
即
2 ui
f (xi )
(5.1.3)
§5.2 异方差性的后果 一、线性和无偏性
ˆ ki ui
ki
xi xi2
ˆ 是ui的线性函数显然成立
(5.2.1)
由(2.3.7)知α的OLS估计量为
对于多元线性回归模型
y 0 1 x1 k xk u
若异方差的结构不知道,可以证明有下列估计式
n
Vˆ (ˆ
j)
rˆi2j uˆi2
i1
ESS2j
(5.2.9)
其中 ESS j rˆi2j
式中 rˆij 为xj将对所有其它自变量作回归所得到的第i个
残差;ESSj则为这个回归的残差平方和。 (5.2.9)的算 术根称为 ˆ j 的异方差—稳健标准差(heteroskedasticity -robust standard error )。(参看武德263页)
(5.2.8)的结果是线性模型(5.2.5)具有异方差情况下,
参数β估计值的方差。用
ˆ
2 u
代替
u2便有估计值
Vˆ
(ˆ
)
ˆ
2 u
xi2
xi2
( xi2 )2
可以证明:u具有异方差时,参数的方差失去了最 佳性。(参看课本108页)
如果存在异方差性而仍然采用OLS估计参数β, 由于参数的估计值的方差并非最小,在对β进行显 著性检验时将低估t值可能导致错误的统计判断, 在对参数β进行区间估计时就会不必要地扩大置信 区间。 甚至统计量T失去t
ˆ
(1 n
x
第五章异方差性

∑
2
ˆ σ 2 = ∑ ei2 n − k 是有偏的,在此基础上的区间估 是有偏的,
计和假设检验都将不可靠。 计和假设检验都将不可靠。
第三节 异方差性的检验
一. 图形分析法
基本思想: 基本思想: 异方差性的表现是 u i 的方差随某个解释变量的变 化而变化, 的分散程度随X的变化而变化 化而变化 , 或 Y的分散程度随 的变化而变化 。 因此可 的分散程度随 的变化而变化。 与某解释变量的散布图, 利用 u i 的代表 ei 与某解释变量的散布图,观察是否存 在异方差及其异方差的形式。 在异方差及其异方差的形式。 具体方法: 具体方法: ●假定不存在异方差,进行回归,并计算剩余平方 e 2,描绘 假定不存在异方差,进行回归, 假定不存在异方差
⋅ ⋅⋅ ⋅⋅ ⋅
Yi
⋅⋅ ⋅ ⋅ ⋅ ⋅⋅ ⋅
⋅
C个
Xi
●将前后两部分分别作回归,分别计算出各部 将前后两部分分别作回归, 分剩余 ei , 2 ● 比较前后两个回归的剩余平方和 ∑ ei : ei2 之比接近于 ,为同方差; 如果两个 ∑ 之比接近于1,为同方差; ei2 之比不同于 ,为异方差 如果两个 ∑ 之比不同于1, 前提条件: 前提条件: ●样本容量较大 服从正态分布, ● ui 服从正态分布,并除异方差外满足其他 基本假定
具体步骤: 具体步骤:
●排序 将观测值按解释变量 大小顺序排列 排序:将观测值按解释变量 排序 将观测值按解释变量X大小顺序排列 数据分组:去掉中间的 去掉中间的C个 ●数据分组 去掉中间的 个(约1/4)观测值,分别 )观测值, 进行前后两部分 (n − c) 2 个观测值的回归 ●提出假设:分别进行前后两部分回归的基础上,提出 提出假设 分别进行前后两部分回归的基础上, 分别进行前后两部分回归的基础上 检验假设: 检验假设: o : ui H 即
5 异方差

异方差性的后果
(heteroskedasticity :Consequences)
计量经济学模型一旦出现异方差性(heteroskedasticity ),如 果仍采用OLS估计模型参数,会产生下列不良后果: 1、参数估计量仍然具有无偏性(unbiased) ) 2、参数估计量非有效(does not have minimum variance) 由于非有效, 3、由于非有效,因而变量的显著性检验失去意义 (t statistics are unreliable) )
1
ˆ 如果出现了异方差,se(β1) 出现偏误(偏大或偏小), t检验失真。
三、异方差诊断
(heteroskedasticity detection)
? 用什么来表示随机误差项的方差 用什么来表示随机误差项的方差? (how to indicate the variance of stochasic?) • 在同方差假定下(homoskedasticity assumption),随机误差项的方差用 σ 2 表示。 • 事实上,关于模型是否满足同方差假定,我们 在估计模型时并不知道,是需要通过异方差性 诊断(detecting heteroskedasticity)才能知道的。 • 要诊断模型是否存在异方差,首先需要找到一 个用以表示随机误差项方差的“量”。
第五章 异方差性 (Heteroskedasticity)
本章内容
• 异方差性的含义及异方差产生的原因(Nature and causes) • 异方差性对模型的影响(Practical consequences) • 检验异方差性方法(Detection) • 处理和消除异方差的办法(Remedies)
OLS估计结果
Dependent Variable: TX Method: Least Squares Date: 05/27/09 Time: 00:37 Sample: 1 30 Included observations: 30 Variable C SR R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 38.75161 0.041419 0.544467 0.528198 67.01587 125751.5 -167.6811 2.009705 Std. Error 39.64001 0.007160 t-Statistic 0.977588 5.785021 Prob. 0.3366 0.0000 256.8727 97.56583 11.31208 11.40549 33.46646 0.000003
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/6/22
6
二、产生异方差性的原因
1、模型中缺少了某些解释变量
1)由于一些客观原因,使得某些重要的解释变量无法包括在模型中; 2)由于一些主观原因,在变量的选择上遗漏了某些重要的解释变量(设定 偏误)。
例如,用截面上不同收入组的收入X和消费支出Y样本数据建模:
Y i 12Xi ui
由于各户的收入X不同,消费观念和习惯有差异,通常情况下,模型会 存在异方差性:
2020/6/22
13
纺锤型(cloudy graph) Y
e
2 i
X
2020/6/22
X
14
反纺锤型(哑铃型)
2020/6/22
15
漏斗型
2020/6/22
16
反漏斗型
2020/6/22
17
其它有规律可寻的图形
2020/6/22
18
通过Eviews作x- e2 散点图
1、键入 LS y c x 作回归(点击 resid ) 2、键入 genr e1=resid 调用残差 3、键入 genr e2=e1^2 生成残差平方 4、键入 Scat e2 X(或键入Scat e1 X)
2020/6/22
4
表明:不同规模的商店,其利润总额的方差是不相同的, 从而模型中随机误差的方差不是常数,这里存在着异方差现象。
4
2
RESID
0
-2
-4 0
2020/6/22
50
100
150
200
X
5
一、异方差性的定义
设线性回 Y i归 12X 模 2i 型 kXk为 i ui : i1,2,,n
3
利润总额对销售收入的线性回归方程为:
Yˆ 0.515950.06676X (0.622) 4 (0.008) 5 R2 0.7759
将销售收入X作为横坐标, Y(或残差e)作为纵坐标,作散点图:
从残差图看出: 销售收入小的商店,其残差一般也较小; 销售收入大的商店,其残差一般也较大;残差有随着商店 规模增大而增大的倾向。
商店名称
1、百货大楼 2、城乡贸易中心
…
19.新街口百货商场 20.星座商厦
2020/6/22
销售收入
X 160.0 151.8
…
22.2 20.7
利润总额
Y 12.8 8.9 …
1.0 0.5
回归值
10.2 9.6 …
1.0 0.9
残差
2.634705 -0.717881
…
0.033928 -0.365935
2、参数估计量的方差非最小
记存在异方差 2的 情 O况 L估 S下 计ˆ为 2* 不存在异方差 2的 情 O况 L估 S下 计ˆ为 2 则有 : Va( rˆ2*)Va( rˆ2)
2020/6/22
10
二、解释变量显著性检验失效
存在异方差时,如果继续用经典假定下的方差公式求估计量的 方差,则低估了真实方差。
t
ˆ 2 Sˆe ( ˆ 2 )
从而导致了方差不正常的偏小,而t统计量不正常的偏大, 假设检验失效。
三、预测精度降低
由于异方差的存在,使得参数估计值的方差低估了其真实方差,
造成参数的区间估计失真,进一步影响Y的预测区间,使其预测精
度降低。
6/22
11
第三节 异方差性的检验
2020/6/22
xi yi
x
2 i
xi ( 2 xi
x
2 i
ui )
2
x
2 i
xiui
x
2 i
2020/6/22
2
xiui
x
2 i
Yi Y(12Xi ui)Y
(12Xi ui)(12X)
2(Xi X)ui 即 yi 2xi ui
9
1、该估计量为无偏估计
E(ˆ2)2
E(ˆ2)
E(2
xiui xi2
)
2
E( xxi2iui)2
第五章 异方差性
违反古典假定回归模型的研究方式
☻问题的概念 ☻问题的后果 ☻对问题的检验 ☻对问题的修正
本章讨论
☻异方差性的含义与产生背景 ☻异方差性对模型的影响 ☻异方差性的检验 ☻异方差性的补救措施
第一节异方差性的含义与产生背景
一个实例
例1:2019年北京市规模最大的20家百货零售商店 的商品销售收入X和利润总额Y资料如下表所示:
注:除上述原因外,模型的函数形式不正确、异常值的出现等都可能产生异方差性。
2020/6/22
8
第二节 异方差性对模型的影响
一、参数估计量不再具有最小方差特性
考虑一个简单的线性回归模型:
Yi 12Xiui
利用普通最小二乘法,可得回归系数的最小二乘估计
ˆ2 xxiiy2i 2 xxiu i2i
复习:
ˆ 2
2020/6/22
7
2、样本数据的观测误差
样本数据的观测误差常随时间的推移逐步积累; 或随着数据 采集技术的改进,随机干扰项的方差减小。
例如,以时间序列数据为样本建立生产函数模型
Q t f(L t,K t) u t A tK L te u t
(Q:产出; L:劳动力; K:资本)
由于不同时间 术的 、观 评测 价技 标准 时不 间同 的; 推随 移, 的投资环境、 、管 生理 产水 规L 平 t模 ,Kt增 (大 如),观测 ,误 引起 ui偏离均值的程 会度 产不 生同 异, 方差。
经典线性回归模型的一个重要假定是:总体回归函数中的随 机误差项满足同方差性,即它们都有相同的方差
V(a u i)r 2 i 1 ,2 , ,n
随机误i的 差方 项差随某个 Xj的 i 解变 释化 变而 ,即 量变化
V( u ia ) r i22 f(X ) i 1 ,2 , ,n
则称随机误差项存在异方差(方差非齐性).
12
一、图形分析法(补充)
图形分析法是利用残差序列绘制出各种图形,以供分析 检验使用,包括:
** 1、解释变量为X 轴,残差的平方e2(或因变量Y)为Y轴的散点图。 (另有:2、时间为X 轴,残差e 为Y 轴的残差序列图;
3、因变量估计值y 为X 轴, 残差e 为Y 的Y-e 散点图)
异方差的类型 分大 为致 递可 增以 异方 异差 方、 差递 、减 复杂 三种。 Y用 X作散点分布图 渐的 变区 宽域 、逐 变窄 变、 化不 ,规 存在异方差 ei2 ; X作 (散 用点分e布 2并图 不上 近似于某 则一 认常 存在异方差)。
对于低收入家庭来说,除去购买生活必需品后的余钱不多,其消费支出 的方差将不会很大;而对于高收入家庭来说,家庭购买行为差异性就很大。 除去购买生活必需品以后的余钱还很多,这些余钱可用于购买奢侈消费品, 也可用于储蓄或投资,其消费支出的方差将会很大。存在异方差现象。
注:有重要的解释变量没有(或无法)引入模型,可能产生异方差性。