异方差性的概念、类型、后果、检验及其修正方法(含案例).
异方差性在回归分析的影响

异方差性在回归分析的影响在回归分析中,异方差性是一个重要的概念,指的是误差项的方差不是恒定的,而是随着自变量的变化而变化。
异方差性会对回归分析的结果产生影响,导致参数估计不准确甚至失真,从而影响对模型的解释和预测能力。
本文将从异方差性的定义、影响、检验以及处理方法等方面展开讨论。
一、异方差性的定义在回归分析中,我们通常假设误差项具有同方差性,即误差项的方差是恒定的。
然而,在实际应用中,误差项的方差可能会随着自变量的变化而发生变化,这种情况被称为异方差性。
异方差性通常表现为误差项的方差与自变量的水平相关,即方差不是常数。
二、异方差性的影响1. 参数估计的不准确性:异方差性会导致参数估计的不准确性,使得回归系数的估计偏离真实值,从而影响对自变量与因变量之间关系的解释。
2. 统计检验的失真:异方差性会使得回归模型的显著性检验结果失真,可能导致错误的结论,影响对模型整体拟合优度的评估。
3. 预测精度的下降:异方差性会影响对未来观测值的预测精度,使得预测结果不可靠,降低模型的预测能力。
三、异方差性的检验为了检验回归模型是否存在异方差性,可以采用以下方法:1. 图形诊断法:通过残差图、残差与预测值的散点图等图形来观察残差的分布情况,如果残差呈现出明显的异方差性模式,就可以怀疑模型存在异方差性。
2. 统计检验法:利用异方差性检验统计量,如White检验、Goldfeld-Quandt检验、Breusch-Pagan检验等,对模型的异方差性进行显著性检验。
四、处理异方差性的方法当检验结果表明模型存在异方差性时,可以采取以下方法进行处理:1. 加权最小二乘法(Weighted Least Squares, WLS):通过对残差进行加权,使得残差的方差与自变量的水平相关,从而消除异方差性。
2. 变量转换:对自变量或因变量进行对数变换、平方根变换等,使得变量的方差变化较小,减轻异方差性的影响。
3. 引入干扰项:在模型中引入干扰项,如虚拟变量、交互项等,来控制异方差性的影响。
第五章 异方差性

26
异方差性的检验
问题在于用什么来表示随机误差项的方差 一般的处理方法:
Var(ui ) E(uቤተ መጻሕፍቲ ባይዱ2) ei2
图示检验法
图示检验法
(一)相关图形分析 方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释
变量Y与随机误差项u有相同的方差,所以分析Y与X的相关图,可以初 略地看到Y的离散程度与X之间是否有相关关系。
ui 的某些分布特征,可通过残差 ei 的图形对异方差进行观察。
对于一元回归模型,绘制出ei2 对Xi的散点图,对于多元回归模型,绘制出ei2 对Yi的散点图或ei2 与认为和异方差有关的X的散点图。
31
图示检验法
(二)残差图形分析
e~i 2
e~i 2
X 同方差
e~i 2
X 递增异方差
e~i 2
X 递减异方差
每个企业所处的外部环境对产出量的影响被包含在随机误差项中 每个企业所处的外部环境对产出量的影响程度不同,造成了随机
误差项的异方差性
产生异方差性的原因
产生异方差性的原因
(一)模型设定误差
假设正确的模型是:
Yi 1 2 X2i 3 X3i ui
假如略去了重要的解释变量X3 ,而采用 Yi 1 2 X2i vi
排序,再按戈德菲尔德匡特检验方法回归,否则即使存在异方差,也有可能用戈德菲
尔德匡特方法检验不出来。
用 EViews 给截面数据排序的方法:在 Workfile 窗口点击 Procs 键并选 Sort current page
功能,在打开的 Sort Workfile Series 对话窗填写以哪一个序列为标准(基准序列)排
第五章 异方差性

Qt
ALt
K
t
eut
• U为随机误差项,它包含了资本K和劳动力L
以外的因素对产出Q的影响,比如能源、环境、
政策等。由于不同的地区这些因素不同造ui 成了 对产出的影响出现差异,使得模型中的 具有
异方差,并且这种异方差的表现是随资本和劳 动力的增加而有规律变化的。
(二)样本数据的观测误差
• 一方面,样本数据的观测误差常随着时间的 推移而逐步积累,引起随机误差项的方差增 加。另一方面,随着时间的推移,样本观测 技术会随之提高,也可能使得样本的观测误 差减少,引起随机误差项的方差减小。因此, 随着时间的推移,样本数据的观测误差会发 生变化,从而引起随机误差项的变化。
Yt 1 2 X 2i 3 X 3i ui (1)
Y 1 2 X 2 3 X 3
(2)
Yt 1' 2 X 2i ui'
(3)
Y 1' 2 X 2
(4)
由(2)、(4)得:1' 1 3 X3 (5)
由(1)、(3)、(5)得:
Var(ui )
2 i
f
(X
ji )
i 1, 2, , n
则称随机误差项存在异方差.
( 即回归模型中随机误差项的方差不是常数 )
例2:使用截面数据研究储蓄函数
假设 储蓄函数模型Y i 0 1X i ui
式中:Y i第i个家庭的储蓄额,X i第i个家庭的可支配收入,ui 代表除可支配收入以外影响储蓄额的其它因素,如利率、家庭 人口、文化背景等等。这里,同方差假设显然与事实不符。
ui' 1 3 X 3i ui 1'
第六章异方差性

第六章异方差性Chapter 6 异方差性二、异方差的类型同方差:i2 = 常数f(Xi) 异方差:i2 = f(Xi) 四、异方差性的后果总而言之,在异方差情况下,我们建立在高斯马尔科夫定理基础上的用来检验各种假设的统计量都不再是有效的,因而OLS 估计量不再是最佳线性无偏估计量(即不具有BLUE 性质)。
五、异方差性的检验检验思路:辅助回归: 6. 怀特(White )检验怀特检验不需要排序,且适合任何形式的异方差。
怀特检验的基本思想与步骤(以二元为例):去掉交互项是一种方法,另一种方法也可以用原来模型OLS 回归得到的Y的拟合值作为辅助回归中的解释变量:在进行怀特异方差检验时,建立如下辅助回归:然后在计算LM 统计量例子6-5 异方差检验的说明性例子P160 图示法G-Q 检验F 检验LM 检验怀特检验一旦获得了异方差稳健标准差,就可以构造异方差稳健t统计量。
稳健标准差的优点在于:不需要知道总体模型是否存在异方差以及是何种形式的异方差。
异方差稳健标准差比普通的OLS 标准差更有效。
在大样本下,截面数据分析中我们可以仅仅报告异方差稳健标准差,一般软件都提供。
例子6-6 P164 运用EViews 报告异方差稳健估计。
打开OLS 估计结果,Estimate, options, 在LS&TSLS 中选择Heteroskedasticity consistent coefficient\white 异方差稳健标准差通常大于OLS 标准差。
STATA :reg y x1 x2, vce(robust) (一)异方差为已知的解释变量的某一函数形式时的加权最小二乘估计模型检验出存在异方差性,可用加权最小二乘法(Weighted Least Squares, WLS )进行估计。
如果直接用作为权数,则容易验证变换后模型的随机干扰项的方差等于1,也满足同方差性。
此时加权最小二乘法就是对如下加了权的模型采取OLS 法:指数函数,我们需要估计FWLS 估计量的性质例子6-7 :FWLS 若以指数函数求权函数fx OLS 回归后,log(resid^2) gene fx=exp(…….) 权数1/sqr(fx) 第五节:案例分析P172 1988 年美国18 个工业群体的研发注意:辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。
第五章 异方差性(1)

第二节 异方差性的后果
一、对参数估计统计特性的影响
二、对参数显著性检验的影响
三、对预测的影响
9
一、对参数估计式统计特性的影响
1、仍然具有线性性
2、仍然具有无偏性
参数估计的无偏性仅依赖于基本假定中的零 均值 假定(即 E(ui ) 0 )。所以异方差的存在对 无偏性的成立没有影响。
3、仍然具有一致性
3
如果把异方差看成是由于某个解释变量的变 化而引起的,则
Var(ui ) f ( X i )
2 i 2
异方差一般可归结为三种类型: (1)单调递增型: i 2 随X的增大而增大 (2)单调递减型: i 2 随X的增大而减小 2 (3)复杂型: i 与X的变化呈复杂形式
4
单调递增型异方差例
7
u i*
2、数据的测量误差
样本数据的观测误差有可能随研究范围的扩 大而增加,或随时间的推移逐步积累,也可能随 着观测技术的提高而逐步减小。
3、截面数据中总体各单位的差异 u*
i
通常认为,截面数据较时间序列数据更容易 产生异方差。这是因为同一时点不同对象的差异, 一般说来会大于同一对象不同时间的差异。 不过,在时间序列数据发生较大变化的情况 下,也可能出现比截面数据更严重的异方差。
34
3、检验的特点
(1)变量的样本值为大样本; (2)数据是时间序列数据; (3)只能判断模型中是否存在异方差,而不能诊 断出哪一个变量引起的异方差。
35
五、Glejser检验
1、检验的基本思想
由OLS法得到残差
ei
,取得绝对值,然后将对
某个解释变量回归,根据回归模型的显著性和拟合 优度来判断是否存在异方差。
异方差性的概念、类型、后果、检验及其修正方法含案例

Yi和Xi分别为第i个家庭的储蓄额和可支配收入。
在该模型中,i的同方差假定往往不符合实际情况。对高收 入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律 性(如为某一特定目的而储蓄),差异较小。
因此,i的方差往往随Xi的增加而增加,呈单调递增型变化 。
– 在选项中,EViews提供了包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”和没有交叉项的怀特检 验“White Heteroskedasticity(no cross terms)” 这样两个 选择。
• 软件输出结果:最上方显示两个检验统计量:F统计 量和White统计量nR2;下方则显示以OLS的残差平 方为被解释变量的辅助回归方程的回归结果。
随机误差项具有不同的方差,那么: 检验异方差性,也就是检验随机误差项的方差与解
释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
路漫漫其修远兮, 吾将上下而求索
问题在于:用什么来表示随机误差项的方差? 一般的处理方法:
路漫漫其修远兮, 吾将上下而求索
2.图示检验法
路漫漫其修远兮, 吾将上下而求索
3.模型的预测失效
一方面,由于上述后果,使得模型不具有良好的统计性质;
【书上这句话有点问题】
其中 所以,当模型出现异方差性时,Y预测区间的建立将发生困 难,它的预测功能失效。
路漫漫其修远兮, 吾将上下而求索
三、异方差性的检验(教材P111)
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值,
(注意:其中的2完全可以是1)
4.2 异方差性

• 其他检验也是如此。
3、模型的预测失效
一方面,由于上述后果,使得模型不具 有良好的统计性质;
所以,当模型出现异方差性时,参数OLS 估计值的变异程度增大,从而造成对Y的预测 误差变大,降低预测精度,预测功能失效。
四、异方差性的检验 Detection of Heteroscedasticity
OLS估计
ˆ exp( ˆ ˆ1 X i1 ˆ2 X i 2 L ˆk X ik ) ˆi2 ˆi2 f i 0
2、异方差稳健标准误法(Heteroscedasticity-Consistent
Variances and Standard Errors)
应用软件中推荐的一种选择。适合样本容量足 够大的情况。
仍然采用OLS,但对OLS估计量的标准差进行 修正。 与不附加选择的OLS估计比较,参数估计量没 有变化,但是参数估计量的方差和标准差变化 明显。 即使存在异方差、仍然采用OLS估计时,变量 的显著性检验有效,预测有效。
六、案例 —中国农村居民人均消费函数模型
~ y (y i ) 0ls e i i
~2 Var ( i ) E ( i2 ) e i
2、图示法
(1)用X-Y的散点图进行判断
看是否存在明显的散点扩大、缩小或复杂型 趋势(即不在一个固定的带型域中)。
~ 的散点图进行判断 (2)X- e i
2
看是否形成一斜率为零的直线。
~2 e i
wi 1/
f ( X i1 , X i 2 ,L , X ik )
一种具有应用价值的方法
Var(i | X i1,L , X ik ) 2 exp(0 1 X i1 L k X ik )
异方差性的后果

可以证明,在同方差假设下: R2为(*)的可决系数,h为(*)式解释变量的个数, 表示渐近服从某分布。
注意: 辅助回归仍是检验与解释变量可能的组合的 显著性,因此,辅助回归方程中还可引入解释 变量的更高次方。 如果存在异方差性,则表明确与解释变量的 某种组合有显著的相关性,这时往往显示出有 较高的可决系数以及某一参数的t检验值较大。 当然,在多元回归中,由于辅助回归方程中 可能有太多解释变量,从而使自由度减少,有 时可去掉交叉项。
注意: 在实际操作中人们通常采用如下的经验 方法: 不对原模型进行异方差性检验,而是直接 选择加权最小二乘法,尤其是采用截面数据 作样本时。 如果确实存在异方差,则被有效地消除了; 如果不存在异方差性,则加权最小二乘法 等价于普通最小二乘法
七、案例--中国农村居民人均消费函数
例1.4 中国农村居民人均消费支出主要由人均 纯收入来决定。 农村人均纯收入包括(1)从事农业经营的收入, (2)包括从事其他产业的经营性收入(3)工资性收 入、(4)财产收入(5)转移支付收入。
④在同方差性假定下,构造如下满足F分布的 统计量
nc 2 ~ e2i ( 2 k 1) nc nc F ~ F( k 1, k 1) 2 2 ~ 2 ( n c k 1) e 1i 2
⑤给定显著性水平,确定临界值F(v1,v2), 若F> F(v1,v2), 则拒绝同方差性假设,表明存 在异方差。 当然,还可根据两个残差平方和对应的子样 的顺序判断是递增型异方差还是递减异型方差。
如: 帕克检验常用的函数形式: ~ 2 ) ln 2 ln X ln( e f ( X ji ) 2 X e 或 i ji i ji
i
若在统计上是显著的,表明存在异方差性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
规
律
• 一般经验告诉人们:对于采用截面数据作样本
的计量经济学问题,由于在不同样本点(即不
同空间)上解释变量以外的其他因素的差异较
大,所以往往存在异方差性。
二、异方差性的后果
1.参数估计量非有效
• 当计量经济学模型出现异方差性时,其普通最小二乘法参 数估计量仍然具有无偏性,但不具有有效性。而且,在大样 本情况下,参数估计量仍然不具有渐近有效性。 因为在有效性证明(见教材P70-7异方差。
怀特(White)检验的EViews软件操作要点
• 在OLS的方程对象Equation中,选择View/Residual tests/White Heteroskedasticity。
– 在选项中,EViews提供了包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”和没有交叉项的怀特 检验“White Heteroskedasticity(no cross terms)” 这样 两个选择。
③对每个子样本分别求回归方程,并计算各自的残差平方
e 2 ,较大的一 和。将两个残差平方和中较小的一个规定为 ~ 1i
nc 2 ~ k 1。 个规定为 e2i 。二者的自由度均为 2
2 2 H0 : 12 2 12 2 ④提出假设: ,H 1 : 2 12 与 2
或者,也可以说,对于每一个样本点i,随机误差项的方差i2衡
量的是被解释变量的观测值Yi围绕回归线E(Yi)=0+1Xi1+…+kXik
的分散程度。而所谓异方差性,是指被解释变量观测值的分散 程度随样本点的不同而不同。 【庞皓P130】
概 率 密 度
异方差性示意图
Y
X
2.异方差的类型 • 同方差性假定是指,每个i围绕其0均值的方差
并不随解释变量 Xi的变化而变化,不论解释变量 的观测值是大还是小,每个i的方差保持相同, 即 i2 =常数 (i=1,2,…,n)
• 在异方差的情况下,i2已不是常数,它随Xi的
变化而变化,即
i2 =f(Xi) (i=1,2,…,n)
• 异方差一般可以归结为三种类型:
(1)单调递增型: i2=f(Xi)随Xi的增大而增大; (2)单调递减型: i2=f(Xi )随Xi的增大而减小; (3)复杂型: i2=f(Xi )随Xi的变化呈复杂形式。
异方差性 Heteroscedasticity
一、异方差性的概念及类型 二、异方差性的后果 三、异方差性的检验 四、异方差的修正 五、案例
一、异方差性的概念及类型
1.什么是异方差?
对于模型
Yi 0 1 X i1 2 X i 2 k X ik i
同方差性假设为 如果出现
• 软件输出结果:最上方显示两个检验统计量:F统计 量和White统计量nR2;下方则显示以OLS的残差平 方为被解释变量的辅助回归方程的回归结果。
– 以教材P118的例子为例,包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”的输出结果为 :
ˆ
j
j
c
jj
2
ˆ
j 2
j
( X X ) 1 jj
(j=0,1,2,…,k)
2 。 包含有随机误差项共同的方差
如果出现了异方差性,而仍按同方差时的公式计算t 统计量,将使t统计量失真【偏大或偏小,见第三版P110补 充说明】,从而使t检验失效【使某些原本显著的解释变量
3.实际经济问题中的异方差性
例4.1.1: 在截面资料下研究居民家庭的储蓄行为
Yi=0+1Xi+i
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。 在该模型中, i的同方差假定往往不符合实际情况。对高收 入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律 性(如为某一特定目的而储蓄),差异较小。 因此, i 的方差往往随 Xi的增加而增加,呈单调递增型变化。
如果存在某一种函数形式,使得方程显著成立,则说明原 模型存在异方差性。 由于f(Xj)的具体形式未知,因此需要选择各种形式进行试验。
4.戈德菲尔德-匡特(Goldfeld-Quandt)检验
G-Q检验以F检验为基础,仅适用于样本容量较大、 异方差为单调递增或单调递减的情况。 G-Q检验的思想:
先按某一被认为有可能引起异方差的解释变量对样
可能无法通过显著性检验,或者使某些原本不显著的解释变量 可能通过显著性检验】。
3.模型的预测失效
一方面,由于上述后果,使得模型不具有良好的统计性质;
另一方面, 在预测值的置信区间中也包含有随机误差项共
2 同的方差 。 【书上这句话有点问题】
ˆ t SE ˆ ˆ t SE ˆ ) 1 P(Y Y Y 0 0 0 Y Y Y Y
~2 来表示随机误差项的方差。 即用e
i
2.图示检验法
(1)用X-Y的散点图进行判断(李子奈P108)
看是否存在明显的散点扩大、缩小或复杂型 趋势(即不在一个固定的带型域中)。
随机误差项的 方差描述的是 取值的离散程 度。而由于被 解释变量Y与随 机误差项有相 同的方差,所 以利用Y与X之 间的相关图形 也可以粗略地 看出的离散程 度与X之间是否 有相关关系。
2 ~ (2)用 X—e 的散点图进行判断
i 看是否形成一条斜率为零的直线。
~2 e i
(教材P111)
~2 e i
X 同方差 递增异方差
X
~2 e i
~2 e i
X 递减异方差 复杂型异方差
X
3.戈里瑟(Gleiser)检验与帕克(Park)检验 • 戈里瑟检验与帕克检验的思想:
~ |或 e ~ 2 为被解释变量,以原模型的某一解释变量 Xj 以 |e i
分别为两个子样对应的随机项方差。
H0成立,意味着同方差; H1成立,意味着异方差。
⑤构造统计量
nc 2 ~ e2i ( 2 k 1) nc nc F ~ F( k 1, k 1) nc 2 2 2 ~ e ( k 1 ) 1i 2
⑥检验。给定显著性水平,确定F分布表中相应的临界值
• 下面,以二元回归为例,说明怀特检验的基本思想与步骤: 设回归模型为:
Yi 0 1 X1i 2 X 2i i
首先,对该模型做普通最小二乘回归,记残差为:
~ Y (Y ˆ) e
i i
i 0ls
然后,以上述残差的平方为被解释变量,以原模型中各解释 变量的水平项、平方项(还可以有更高次项)、交叉项等各
问题在于:用什么来表示随机误差项的方差?
一般的处理方法:
首先采用 OLS 法估计模型,以求得随机误差项的 估计量 (注意, 该估计量是不严格的) , 我们称之为 “近
~ e 似估计量” ,用 i
i
表示。于是有
i i 0ls
~ Y (Y ˆ) e
~2 Var ( i ) E ( i2 ) e i
2 Var(i )
(i=1,2,…,n) (i=1,2,…,n) (i=1,2,…,n)
Var (i ) i2
即对于不同的样本点i ,随机误差项的方差不再是常数,则认 为出现了异方差性。 注意:对于每一个样本点i,随机误差项i都是随机变量,服 从均值为0的正态分布;而方差i2衡量的是随机误差项围绕其 均值0的分散程度。所以,所谓异方差性,是指这些服从正态 分布的随机变量围绕其均值0的分散程度不同。
种组合为解释变量,做如下的辅助回归:
2 2 2 ~ ei 0 1 X1i 2 X 2i 3 X1i 4 X 2i 5 X1i X 2i i
则在同方差性假设下【也即H0:1=…= 5=0 】,该辅助回归 方程的可决系数R2与样本容量n的乘积渐近地服从自由度=辅 助回归方程中解释变量个数【该例= 5】的2分布:
2 0 0 2 0 0
其中
2 SEYˆ Y 1 X0 (XX) 1 X 0
0 0
所以,当模型出现异方差性时,Y预测区间的建立将发生困 难,它的预测功能失效。
三、异方差性的检验(教材P111)
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值,
随机误差项具有不同的方差,那么: 检验异方差性,也就是检验随机误差项的方差与解 释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
引 言
• 在教材P29-32和P64-65,分别对一元和多元线性回归模型
提出了若干基本假设,只有在满足这些基本假设的情况下, 应用普通最小二乘法才能得到无偏的、有效的参数估计量。 • 但是,在实际的计量经济学问题中,完全满足这些基本假 设的情况并不多见。 • 如果违背了某一项基本假设,那么应用普通最小二乘法估 计模型所得参数估计量就可能不具有某些优良特性,这就需 要发展新的方法估计模型。 • 本章正是要讨论违背了某一项基本假设的问题及其估计方 法。
本排序,再将排序后的样本一分为二,对子样本①和 子样本②分别进行OLS回归,然后利用两个子样本的 残差平方和之比构造F统计量进行异方差检验。
G-Q检验的步骤:
①将n对样本观察值(Xi1, Xi2, …,Xik,Yi)按某一被认为有 可能引起异方差的解释变量观察值Xij的大小排队。 ②将序列中间的c=n/4个观察值除去,并将剩下的观 察值划分为较小与较大的容量相同的两个子样本, 每个子样本的样本容量均为(n-c)/2 。
的增大而先减后增(U形),出现了异方差性。
例4.1.3:以某一行业的企业为样本建立企业生产函数模型
Yi=Ai1 Ki2 Li3ei
产出量为被解释变量,选择资本、劳动、技术等投入要素