异方差性的概念、类型、后果、检验和修正方法(含案例)

合集下载

第五章异方差性

于OLS估计得到的残差 ei 的分析
26
异方差性的检验
问题在于用什么来表示随机误差项的方差一般的处理方法：
Var(ui ) E(uቤተ መጻሕፍቲ ባይዱ2) ei2
图示检验法
图示检验法
（一）相关图形分析方差描述的是随机变量取值的（与其均值的）离散程度。因为被解释
变量Y与随机误差项u有相同的方差，所以分析Y与X的相关图，可以初略地看到Y的离散程度与X之间是否有相关关系。
ui 的某些分布特征，可通过残差 ei 的图形对异方差进行观察。
对于一元回归模型，绘制出ei2 对Xi的散点图,对于多元回归模型，绘制出ei2 对Yi的散点图或ei2 与认为和异方差有关的X的散点图。
31
图示检验法
（二）残差图形分析
e~i 2
e~i 2
X 同方差
e~i 2
X 递增异方差
e~i 2
X 递减异方差
每个企业所处的外部环境对产出量的影响被包含在随机误差项中每个企业所处的外部环境对产出量的影响程度不同，造成了随机
误差项的异方差性
产生异方差性的原因
产生异方差性的原因
（一）模型设定误差
假设正确的模型是：
Yi 1 2 X2i 3 X3i ui
假如略去了重要的解释变量X3 ，而采用 Yi 1 2 X2i vi
排序，再按戈德菲尔德匡特检验方法回归，否则即使存在异方差，也有可能用戈德菲
尔德匡特方法检验不出来。
用 EViews 给截面数据排序的方法：在 Workfile 窗口点击 Procs 键并选 Sort current page
功能，在打开的 Sort Workfile Series 对话窗填写以哪一个序列为标准（基准序列）排

第五章异方差性

Qt

ALt
K

t
eut
• U为随机误差项，它包含了资本K和劳动力L
以外的因素对产出Q的影响，比如能源、环境、
政策等。由于不同的地区这些因素不同造ui 成了对产出的影响出现差异，使得模型中的具有
异方差，并且这种异方差的表现是随资本和劳动力的增加而有规律变化的。
(二）样本数据的观测误差
• 一方面，样本数据的观测误差常随着时间的推移而逐步积累，引起随机误差项的方差增加。另一方面，随着时间的推移，样本观测技术会随之提高，也可能使得样本的观测误差减少，引起随机误差项的方差减小。因此，随着时间的推移，样本数据的观测误差会发生变化，从而引起随机误差项的变化。
Yt 1 2 X 2i 3 X 3i ui (1)
Y 1 2 X 2 3 X 3
(2)
Yt 1' 2 X 2i ui'
(3)
Y 1' 2 X 2
(4)
由(2)、(4)得:1' 1 3 X3 (5)
由(1)、(3)、(5)得:
Var(ui )

2 i

f
(X
ji )
i 1, 2, , n
则称随机误差项存在异方差.
( 即回归模型中随机误差项的方差不是常数 )
例2：使用截面数据研究储蓄函数
假设储蓄函数模型Y i 0 1X i ui
式中：Y i第i个家庭的储蓄额，X i第i个家庭的可支配收入，ui 代表除可支配收入以外影响储蓄额的其它因素，如利率、家庭人口、文化背景等等。这里，同方差假设显然与事实不符。
ui' 1 3 X 3i ui 1'

第六章异方差性

第六章异方差性Chapter 6 异方差性二、异方差的类型同方差：i2 = 常数f(Xi) 异方差：i2 = f(Xi) 四、异方差性的后果总而言之，在异方差情况下，我们建立在高斯马尔科夫定理基础上的用来检验各种假设的统计量都不再是有效的，因而OLS 估计量不再是最佳线性无偏估计量（即不具有BLUE 性质）。

五、异方差性的检验检验思路：辅助回归: 6. 怀特（White ）检验怀特检验不需要排序，且适合任何形式的异方差。

怀特检验的基本思想与步骤（以二元为例）：去掉交互项是一种方法，另一种方法也可以用原来模型OLS 回归得到的Y的拟合值作为辅助回归中的解释变量：在进行怀特异方差检验时，建立如下辅助回归：然后在计算LM 统计量例子6-5 异方差检验的说明性例子P160 图示法G-Q 检验F 检验LM 检验怀特检验一旦获得了异方差稳健标准差，就可以构造异方差稳健t统计量。

稳健标准差的优点在于：不需要知道总体模型是否存在异方差以及是何种形式的异方差。

异方差稳健标准差比普通的OLS 标准差更有效。

在大样本下，截面数据分析中我们可以仅仅报告异方差稳健标准差，一般软件都提供。

例子6-6 P164 运用EViews 报告异方差稳健估计。

打开OLS 估计结果，Estimate, options, 在LS&TSLS 中选择Heteroskedasticity consistent coefficient\white 异方差稳健标准差通常大于OLS 标准差。

STATA ：reg y x1 x2, vce(robust) （一）异方差为已知的解释变量的某一函数形式时的加权最小二乘估计模型检验出存在异方差性，可用加权最小二乘法（Weighted Least Squares, WLS ）进行估计。

如果直接用作为权数，则容易验证变换后模型的随机干扰项的方差等于1，也满足同方差性。

此时加权最小二乘法就是对如下加了权的模型采取OLS 法：指数函数，我们需要估计FWLS 估计量的性质例子6-7 ：FWLS 若以指数函数求权函数fx OLS 回归后，log(resid^2) gene fx=exp(…….) 权数1/sqr(fx) 第五节：案例分析P172 1988 年美国18 个工业群体的研发注意：辅助回归仍是检验与解释变量可能的组合的显著性，因此，辅助回归方程中还可引入解释变量的更高次方。

异方差性的概念、类型、后果、检验及其修正方法(含案例).PPT共74页

5、虽然权力是一头固执的熊，可是金子可以拉着它的鼻子走。— —莎士比
谢谢
11、越是没有本领的就越加自命不凡。——邓拓 12、越是无能的人，越喜欢挑剔别人的错儿。——爱尔兰 13、知人者智，自知者明。胜人者有力，自胜者强。——老子 14、意志坚强的人能把世界放在手中像泥块一样任意揉捏。——歌德 15、最具挑战性的挑战莫过于提升自我。——迈克尔·F·斯特利
异方差性的概念、类型、后果、检验及其修正方法(含案例).
1、合法而稳定的权力在使用得当时很少遇到抵抗。 ——塞 ·约翰逊 2、权力会使人渐渐失去温厚善良的美德。— —伯克
3、最大限度地行使权力总是令人反感；权力不易确定之处始终存在着危险。— —·约翰逊 4、权力会奴化一切。——塔西佗

第五章异方差性(1)

8
第二节异方差性的后果
一、对参数估计统计特性的影响
二、对参数显著性检验的影响
三、对预测的影响
9
一、对参数估计式统计特性的影响
1、仍然具有线性性
2、仍然具有无偏性
参数估计的无偏性仅依赖于基本假定中的零均值假定（即 E(ui ) 0 ）。所以异方差的存在对无偏性的成立没有影响。
3、仍然具有一致性
3
如果把异方差看成是由于某个解释变量的变化而引起的，则
Var(ui ) f ( X i )
2 i 2
异方差一般可归结为三种类型： (1)单调递增型： i 2 随X的增大而增大 (2)单调递减型： i 2 随X的增大而减小 2 (3)复杂型： i 与X的变化呈复杂形式
4
单调递增型异方差例
7
u i*
2、数据的测量误差
样本数据的观测误差有可能随研究范围的扩大而增加，或随时间的推移逐步积累，也可能随着观测技术的提高而逐步减小。
3、截面数据中总体各单位的差异 u*
i
通常认为，截面数据较时间序列数据更容易产生异方差。这是因为同一时点不同对象的差异，一般说来会大于同一对象不同时间的差异。不过，在时间序列数据发生较大变化的情况下，也可能出现比截面数据更严重的异方差。
34
3、检验的特点
（1）变量的样本值为大样本；（2）数据是时间序列数据；（3）只能判断模型中是否存在异方差，而不能诊断出哪一个变量引起的异方差。
35
五、Glejser检验
1、检验的基本思想
由OLS法得到残差
ei
，取得绝对值，然后将对
某个解释变量回归，根据回归模型的显著性和拟合优度来判断是否存在异方差。

异方差性的概念、类型、后果、检验及其修正方法含案例

例4.1.1：在截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。
在该模型中，i的同方差假定往往不符合实际情况。对高收入家庭来说，储蓄的差异较大；低收入家庭的储蓄则更有规律性（如为某一特定目的而储蓄），差异较小。
因此，i的方差往往随Xi的增加而增加，呈单调递增型变化。
– 在选项中，EViews提供了包含交叉项的怀特检验“White Heteroskedasticity（cross terms）”和没有交叉项的怀特检验“White Heteroskedasticity（no cross terms）” 这样两个选择。
• 软件输出结果：最上方显示两个检验统计量：F统计量和White统计量nR2；下方则显示以OLS的残差平方为被解释变量的辅助回归方程的回归结果。
随机误差项具有不同的方差，那么：检验异方差性，也就是检验随机误差项的方差与解
释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
路漫漫其修远兮, 吾将上下而求索
问题在于：用什么来表示随机误差项的方差？一般的处理方法：
路漫漫其修远兮, 吾将上下而求索
2.图示检验法
路漫漫其修远兮, 吾将上下而求索
3.模型的预测失效
一方面，由于上述后果，使得模型不具有良好的统计性质；
【书上这句话有点问题】
其中所以，当模型出现异方差性时，Y预测区间的建立将发生困难，它的预测功能失效。
路漫漫其修远兮, 吾将上下而求索
三、异方差性的检验（教材P111）
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值，
（注意：其中的2完全可以是1）

计量经济学课件：第五章-异方差性汇总

第五章异方差性本章教学要求：根据类型，异方差性是违背古典假定情况下线性回归模型建立的另一问题。

通过本章的学习应达到，掌握异方差的基本概念包括经济学解释，异方差的出现对模型的不良影响，诊断异方差的方法和修正异方差的方法。

经过学习能够处理模型中出现的异方差问题。

第一节异方差性的概念一、例子例1，研究我国制造业利润函数，选取销售收入作为解释变量，数据为1998年的食品年制造业、饮料制造业等28个截面数据（即n=28）。

数据如下表,其中y表示制造业利润函数，x表示销售收入（单位为亿元）。

Y对X的散点图为从散点图可以看出，在线性的基础上，有的点分散幅度较小，有的点分散幅度较大。

因此，这种分散幅度的大小不一致，可以认为是由于销售收入的影响，使得制造业利润偏离均值的程度发生了变化，而这种偏离均值的程度大小不同是一种什么现象？如何定义？如果非线性，则属于哪类非线性，从图形所反映的特征看并不明显。

下面给出制造业利润对销售收入的回归估计。

模型的书写格式为2ˆ12.03350.1044(0.6165)(12.3666)0.8547,..84191.34,152.9322213.4639,146.4905Y YX R S E FY s =+=====通过变量的散点图、参数估计、残差图，可以看到模型中（随机误差）很有可能存在一种系统性的表现。

例2，改革开放以来，各地区的医疗机构都有了较快发展，不仅政府建立了一批医疗机构，还建立了不少民营医疗机构。

各地医疗机构的发展状况，除了其他因素外主要决定于对医疗服务的需求量，而医疗服务需求与人口数量有关。

为了给制定医疗机构的规划提供依据，分析比较医疗机构与人口数量的关系，建立卫生医疗机构数与人口数的回归模型。

根据四川省2000年21个地市州医疗机构数与人口数资料对模型估计的结果如下：i iX Y 3735.50548.563ˆ+-= （291.5778） (0.644284) t =(-1.931062) (8.340265)785456.02=R 774146.02=R 56003.69=F式中Y 表示卫生医疗机构数（个），X 表示人口数量（万人）。

第七章异方差性

ҧ
=1

መ1 =
•
•
•
σ=1( − )ҧ
2
[σ=1 − ҧ ]
White(1980)给出了异方差性的调整方法：
σ=1( − )ҧ
ෝ
ො መ1 =
2
[σ=1 − ҧ ]
其中ො 是y对所有自变量做回归所得到的OLS残差。
=1
加权最小二乘估计
已知异方差形式
• 实践中，很少知道ℎ()的形式。但有一种情况，WLS所需要的
权数会自然来自潜在的计量模型。
• 例：研究工人参加养老金计划参与情况
, = 0 + 1 , + 2 , + 3 + ,
– 其中，i表示第i个企业，e表示第e个工人，共有个工人。
log 2 = 0 + 1 1 + 2 2 + ⋯ + +
– 其中， = ， = 0
加权最小二乘估计
已知异方差形式
• 假定 = 2 ℎ
– ℎ 是解释变量的某种函数（已知其形式），
并决定着异方差性， ℎ > 0。
• 对于总体中的随机样本，有 2 =
= 2 ℎ = 2 ℎ
– 例：储蓄函数 = 0 + 1 +

2
~ 0, ℎ ֜
~ 0, 2 ֜
ℎ
Τ ℎ
= 0 Τ ℎ + 1 1 Τ ℎ +2 2 Τ ℎ + ⋯ + Τ ℎ + Τ ℎ
•
•
•
•
也就是 ∗ = 0 ∗ + 1 1 ∗ + 2 2 ∗ + ⋯ + ∗ + ∗ ，其中，0 ∗ =0 Τ ℎ

4.2 异方差性

• 其他检验也是如此。
3、模型的预测失效
一方面，由于上述后果，使得模型不具有良好的统计性质；
所以，当模型出现异方差性时，参数OLS 估计值的变异程度增大，从而造成对Y的预测误差变大，降低预测精度，预测功能失效。
四、异方差性的检验 Detection of Heteroscedasticity
OLS估计
ˆ exp( ˆ ˆ1 X i1 ˆ2 X i 2 L ˆk X ik ) ˆi2 ˆi2 f i 0
2、异方差稳健标准误法（Heteroscedasticity-Consistent
Variances and Standard Errors）

应用软件中推荐的一种选择。适合样本容量足够大的情况。
仍然采用OLS，但对OLS估计量的标准差进行修正。与不附加选择的OLS估计比较，参数估计量没有变化，但是参数估计量的方差和标准差变化明显。即使存在异方差、仍然采用OLS估计时，变量的显著性检验有效，预测有效。

六、案例 —中国农村居民人均消费函数模型
~ y (y i ) 0ls e i i
~2 Var ( i ) E ( i2 ) e i
2、图示法
（1）用X-Y的散点图进行判断
看是否存在明显的散点扩大、缩小或复杂型趋势（即不在一个固定的带型域中）。
~ 的散点图进行判断 (2)X- e i
2
看是否形成一斜率为零的直线。
~2 e i
wi 1/
f ( X i1 , X i 2 ,L , X ik )

一种具有应用价值的方法
Var(i | X i1,L , X ik ) 2 exp(0 1 X i1 L k X ik )

异方差性的概念、类型、后果、检验及其修正方法(含案例).74页PPT

31、只有永远躺在泥坑里的人，才不会再掉进坑里。——黑格尔 32、希望的灯一旦熄灭，生活刹那间变成了一片黑暗。——普列姆昌德 33、希望是人生的乳母。——科策布 34、形成天才的决定因素应该是勤奋。——郭沫若 35、学到很多东西的诀窍，就是一下子不要学很多。——洛克
异方差性的概念、类型、后果、检验及其修正方法(含
案例).
26、机遇对于有准备的头脑有特别的亲和力中最必要的力量泉源之一，也是成功的利器之一。没有它，天才也会在矛盾无定的迷径中，徒劳无功。- -查士德斐尔爵士。 29、困难就是机遇。--温斯顿．丘吉尔。 30、我奋斗，所以我快乐。--格林斯潘。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

规律
• 一般经验告诉人们：对于采用截面数据作样本的计量经济学问题，由于在不同样本点（即不同空间）上解释变量以外的其他因素的差异较大，所以往往存在异方差性。
二、异方差性的后果
1.参数估计量非有效
• 当计量经济学模型出现异方差性时，其普通最小二乘法参数估计量仍然具有无偏性，但不具有有效性。而且，在大样本情况下，参数估计量仍然不具有渐近有效性。
分布的随机变量围绕其均值0的分散程度不同。
或者，也可以说，对于每一个样本点i，随机误差项的方差i2衡量的是被解释变量的观测值Yi围绕回归线E(Yi)=0+1Xi1+…+kXik 的分散程度。而所谓异方差性，是指被解释变量观测值的分散
程度随样本点的不同而不同。【庞皓P130】
概
异方差性示意图
率
密
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。
在该模型中，i的同方差假定往往不符合实际情况。对高收入家庭来说，储蓄的差异较大；低收入家庭的储蓄则更有规律性（如为某一特定目的而储蓄），差异较小。
因此，i的方差往往随Xi的增加而增加，呈单调递增型变化。
例4.1.2：以绝对收入假设为理论假设、以分组数据（将居民按照收入等距离分成n组，取组平均数为样本观测值）作样本建立居民消费函数：
• 本章正是要讨论违背了某一项基本假设的问题及其估计方法。
异方差性 Heteroscedasticity
一、异方差性的概念及类型二、异方差性的后果三、异方差性的检验四、异方差的修正五、案例
一、异方差性的概念及类型
1.什么是异方差？
对于模型
Yi 0 1X i1 2 X i2 k X ik i
（i=1,2,…,n）
同方差性假设为
Var ( i
)
2
（i=1,2,…,n）
如果出现
Var(i
)
2 i
（i=1,2,…,n）
即对于不同的样本点i ，随机误差项的方差不再是常数，则认为出现了异方差性。
注意：对于每一个样本点i，随机误差项i都是随机变量，服
从均值为0的正态分布；而方差i2衡量的是随机误差项围绕其均值0的分散程度。所以，所谓异方差性，是指这些服从正态
一般的处理方法：
首先采用 OLS 法估计模型，以求得随机误差项的
估计量（注意，该估计量是不严格的），我们称之为“近
似估计量”，用e~i 表示。于是有
e~ Y (Yˆ )
ii
i 0ls
Var(i ) E(i2 ) e~i2
三、异方差性的检验（教材P111）
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值，
随机误差项具有不同的方差，那么：检验异方差性，也就是检验随机误差项的方差与解
释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
问题在于：用什么来表示随机误差项的方差？
jj
（j=0,1,2,…,k）
包含有随机误差项共同的方差
2
。
如果出现了异方差性，而仍按同方差时的公式计算t
统计量，将使t统计量失真【偏大或偏小，见第三版P110补充说明】，从而使t检验失效【使某些原本显著的解释变量
可能无法通过显著性检验，或者使某些原本不显著的解释变量
可能通过显著性检验】。
3.模型的预测失效
一方面，由于上述后果，使得模型不具有良好的统计性质；
另一方面，在预测值的置信区间中也包含有随机误差项共同的方差 2 。【书上这句话有点问题】
P(Yˆ0
t
2
SEYˆ0 Y0
Y0
Yˆ0
t
2
SEYˆ0 Y0 ) 1
其中
SEYˆ0 Y0
2
1
X0 (XX)1 X0
所以，当模型出现异方差性时，Y预测区间的建立将发生困难，它的预测功能失效。
引言
• 在教材P29-32和P64-65，分别对一元和多元线性回归模型
提出了若干基本假设，只有在满足这些基本假设的情况下，应用普通最小二乘法才能得到无偏的、有效的参数估计量。
• 但是，在实际的计量经济学问题中，完全满足这些基本假设的情况并不多见。
• 如果违背了某一项基本假设，那么应用普通最小二乘法估计模型所得参数估计量就可能不具有某些优良特性，这就需要发展新的方法估计模型。
• 异方差一般可以归结为三种类型：
（1）单调递增型： i2=f(Xi)随Xi的增大而增大；（2）单调递减型： i2=f(Xi )随Xi的增大而减小；（3）复杂型： i2=f(Xi )随Xi的变化呈复杂形式。
3.实际经济问题中的异方差性
例4.1.1：在截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i
例4.1.3：以某一行业的企业为样本建立企业生产函数模型
Yi=Ai1 Ki2 Li3ei
产出量为被解释变量，选择资本、劳动、技术等投入要素为解释变量，那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
由于每个企业所处的外部环境对产出量的影响程度不同，造成了随机误差项的异方差性。
这时，随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化，为复杂型的一种。
Ci= 0+1Yi+i
一般情况下：居民收入服从正态分布，处于中等收入组中的人数最多，处于两端收入组中的人数最少。而人数多的组平均数的误差小，人数少的组平均数的误差大。所以样本观测值的观测误差随着解释变量观测值的增大而先减后增。
如果样本观测值的观测误差构成随机误差项的主要部分，那么对于不同的样本点，随机误差项的方差随着解释变量观测值的增大而先减后增（U形），出现了异方差性。
因为在有效性证明（见教材P70-71）中利用了
E
(
)
2
I
Var( ) 2 , i 1,2, , n
iHale Waihona Puke Cov( , ) 0, i j
ij
即同方差和无序列相关条件。
2.变量的显著性检验失去意义
在变量的显著性检验中，t统计量
ˆ ˆ
t
j
Se(ˆ
j
)
j
j j
2c
jj
ˆ
jj
2 ( X X )1
度
Y
X
2.异方差的类型
• 同方差性假定是指，每个i围绕其0均值的方差
并不随解释变量Xi的变化而变化，不论解释变量的观测值是大还是小，每个i的方差保持相同，
即
i2 =常数（i=1,2,…,n）
• 在异方差的情况下，i2已不是常数，它随Xi的
变化而变化，即
i2 =f(Xi) （i=1,2,…,n）

异方差性的概念、类型、后果、检验和修正方法(含案例)

第五章 异方差性

第五章 异方差性

第六章异方差性

异方差性的概念、类型、后果、检验及其修正方法(含案例).PPT共74页

第五章 异方差性(1)

异方差性的概念、类型、后果、检验及其修正方法含案例

计量经济学课件：第五章-异方差性汇总

第七章 异方差性

4.2 异方差性

异方差性的概念、类型、后果、检验及其修正方法(含案例).74页PPT

第五章异方差性

第五章异方差性

第五章异方差性(1)

第七章异方差性