异方差

合集下载

异方差

异方差
第五章 异方差
• • • • 异方差的概念 异方差性的后果 异方差的检验 异方差的补救措施
第一节 异方差的概念
一、异方差的性质 违反同方差的假定: 同方差: E( ) 2 异方差: E(i ) i2
Yi X i i
var( Y X i ) E(i ) i2
2 2 ˆ (( ) X ) ˆ i i ˆ )) E ( ) E ( ˆr( E (va ) 2 2 (n 1) X i Xi 2 i
X X (n 1)( X )
2 i 2 i 2 2 i
2 i
i2
ˆ) var(
第四节 异方差的补救措施 一、加权最小二乘法
Yi X i i
E(i ) 2 f ( X i )
变换模型: Yi f (Xi )
i
1 f (Xi )
2
Xi f (Xi )
i
f (Xi )
E ( i ) 2 E( ) 2 f (Xi ) f (Xi )
注意: ①当摸型含有多个解释变量时,应以每一个解释变 量为基准检验异方差。 ②此法只适用于递增型异方差。 ③对于截面样本,计算F统计量之前,必须先把数据 按解释变量的值从小到大排序。
三、white检验 White检验由H. White 1980年提出。GoldfeldQuandt 检验必须先把数据按解释变量的值从小到 大排序。White检验不需要对观测值排序,也不依 赖于随机误差项服从正态分布,它是通过一个辅 助回归式构造 2 统计量进行异方差检验。White 检验的具体步骤如下。以二元回归模型为例, yt = +1 xt1 +2 xt2 + ut ①首先对上式进行OLS回归,求残差 et 。 ②做如下辅助回归式, 2 et = 0 +1 xt1 +2 xt2 + 3 xt12 +4 xt22 + 5 xt1 xt2 + vt

计量经济学第九章异方差

计量经济学第九章异方差
2 2
四、异方差的补救措施
(一)加权最小二乘法 1.当 2i已知时: 考虑双变量PRF,
Y i B 1 B 2 X i ui (7)
var(ui ) i2
其中,Y为被解释变量,X为解释变量。假设误差方差 对模型(7)考虑如下变换:
i
Yi B 1(
是已知的。
i
1
) B2 (
ln ei2 B1 B2 ln X i vi
2
(3)
(4)检验零假设 B 0 ,即不存在异方差。如果 ln X i 和 ln ei2 之 间是统计显著的,则拒绝零假设:不存在异方差。

例子:利用方程(2)来说明帕克检验。把从该回归方程中得到的残差 用于模型(3),得到如下结果:
ln ei2 3.412 0.938 ln salesi se (4.972)
三、异方差的诊断
与多重共线性的情况一样,并没有诊断异方差的确定办法,只能借助一 些诊断工具判断异方差的存在。主要有:
1.根据问题的性质 2.残差的图形检验
(1)残差图可以是关于观察值与残差的散点图,也可以是残 ˆ 的散点图。这些图可以帮 差与解释变量,残差与估计值 Y i 助我们判断同方差假设或者是CLRM其他假设是否满足。 例子可参见美国行业利润,销售量和R&D支出。 由该例中关于观察值与残差的散点图可以得出结论,该模 型存在异方差。 2 e (2)此外,还可以利用残差的平方 i 与观察值或解释变量或 ei2 估计值的散点图来判断是否存在异方差。一般来说, 与变量 X 之间的散点图主要有如下样式。(见下一页) 图a到图c中,图a中残差平方与X之间没有可识别的系统模 式,所以不存在异方差;而图b到图e中两者都呈现出系统 关系,所以都可能存在异方差。

9第九章 异方差

9第九章  异方差
如果确实存在异方差,则被有效地消除了; 如果不存在异方差性,则加权最小二乘法 等价于普通最小二乘法
七、案例—例9-2P207
现考虑工人的工资主要由受教育程度和工作年限所影响, 现收集了523个工人的工资、受教育程度、工作年限的数 据,详见表9-2。构建如下回归模型:
wagei B1 B2Edui B3Experi ui
一、异方差的性质---异方差举例
例图9-1:截面资料下研究居民家庭的储蓄行为
Yi=0+1Xi+i
Yi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入
高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性,差异较小
i的方差呈现单调递增型变化
例9-1股票交易所经纪人佣金
• Y:佣金额;X:交易额; • Y对X的斜率:佣金率 • 结论:
如果存在异方差性,则表明确与解释变量的 某种组合有显著的相关性,这时往往显示出有 较高的可决系数以及某一参数的t检验值较大。
当然,在多元回归中,由于辅助回归方程中 可能有太多解释变量,从而使自由度减少,有 时可去掉交叉项。
四、异方差的修正:补救措施1-加权最小二乘法wls
模型检验出存在异方差性,可用加权最小二乘 法(Weighted Least Squares, WLS)进行估计。
X越大,对应的方差越小; X越小,对应的方差越大。 • 解读: 经纪公司对大机构投资者收取的佣金率差异小
对小机构投资者收取的佣金率差异大
例9-2 523个工人的工资等数据
• Y:工资;X1:教育程度;X2:工作年限 • 讨论: X1越大,Y的波动越大,扰动项的方差越大; X2越大, Y的波动越大,扰动项的方差越大。

Yi Xi

第三章异方差和自相关

第三章异方差和自相关
▪ 在本章中,我们将着重考虑假定2和假定3得不到 满足,即存在异方差和自相关情况下的处理办法。
2
第一节 异方差的介绍
一、异方差的定义及产生原因
▪ 异方差(heteroscedasticy)就是对同方差假设 (assumption of homoscedasticity)的违反。经典 回归中同方差是指随着样本观察点X的变化 i ,线 性模型中随机误差项 的方差并不改变,保持为
▪ 对每一个回归模型,计算残差平方和:记 值较小的一组子样本的残差平方和为 RSS1
= 1i2 ,xi 值较大的一组子样本的残差平
方和为 RSS2 = 2i2 。
13
▪ 第三步,建立统计量。
▪ 用所得出的两个子样本的残差平方和构成F统 计量:
F
2i
2
/(
n
2
d
1i
2
/(
n
2
d
k 1) k 1)
用OLS法。对 进行t检验,如果不显著,则没
有异方差性。否则表明存在异方差。 ▪ Park检验法的优点是不但能确定有无异方差性,
而且还能给出异方差性的具体函数形式。但也有
质疑,认为 仍可vi 能有异方差性,因而结果的真
实性要受到影响。
20
(四)Glejser检验法
▪ 这种方法类似于Park检验。首先从OLS回归取得
7
一、图示法
▪ 图示法是检验异方差的一种直观方法,通常有下 列两种思路:
▪ (一)因变量y与解释变量x的散点图:若随着x 的增加,图中散点分布的区域逐渐变宽或变窄,
或出现了偏离带状区域的复杂变化,则随机项可 能出现了异方差。
▪ (与x二的)散残点差图图,。或残者差在图有即多残个差解平释方变ˆ量i(2 时i2的可估作计残值)

异方差

异方差

3.模型的对数变换
在经济意义成立的情况下,如果对模型: 在经济意义成立的情况下,如果对模型:
Yi = b1 + b2 X i + u i 作对数变换, 代替, 作对数变换,其变量 Yi 和 X i 分别用 lnYi 和 lnXi 代替,即:
lnYi = b1 + b2 lnX i + ui
对数变换后的模型通常可以降低异方差性的影响: 对数变换后的模型通常可以降低异方差性的影响: (1)运用对数变换能使测定变量值的尺度缩小 运用对数变换能使测定变量值的尺度缩小。 (1)运用对数变换能使测定变量值的尺度缩小。 (2)经过对数变换后的线性模型 经过对数变换后的线性模型, (2)经过对数变换后的线性模型,其残差表示相对误差往往 比绝对误差有较小的差异。 比绝对误差有较小的差异。 注意:对变量取对数虽然能够减少异方差对模型的影响, 注意:对变量取对数虽然能够减少异方差对模型的影响,但应 注意取对数后变量的经济意义。 注意取对数后变量的经济意义。
Yt = β1 +β2 X2t +β3 X3t +ut
et2 (1)求回归估计式并计算 (1)求回归估计式并计算
(2)建立辅助函数 (2)建立辅助函数 建立辅助回归: 建立辅助回归:
ˆ ˆ ˆ ˆ ˆ ˆ ˆ et2 = α1 + α 2 X 2 t + α 3 X 3 t + α 4 X 22t + α 5 X 32t + α 6 X 2 t X 3 t
i = 1, 2, 3,..., n
因此同方差性指的是所有观测值的分散程度相同。 因此同方差性指的是所有观测值的分散程度相同。 同方差性指的是所有观测值的分散程度相同 异方差是指各观测值的分散程度有明显差异。 异方差是指各观测值的分散程度有明显差异。

4-异方差

4-异方差
α
5.
3 Spearman等级相关系数检验
1. 2. 3.
利用最小二乘法进行回归分析,计算残差 原假设:同方差;备择假设:异方差
ˆ µi
ˆ 对解释变量Xi和 µ i 分别按从小到大的顺序排列,并赋予1到n中的 一个顺序号表示其等级 ˆ 对每个下标i,计算Xi和 µ i 的等级差di
计算等级相关系数
四. 异方差的检验
图示法 Goldfeld-Quandt检验 Spearman等级相关系数检验 Glejser(戈里瑟)检验 Reset检验 White检验
1图示法
ˆ µ ˆ µ
X
X
ˆ µ ˆ Y
ˆ µ
ˆ Y
2 Goldfeld-Quandt检验
1.
建立两个子样本:按大小排列样本观测值,去除中间c个观测值 (c一般为样本容量的1/4到1/3)
第4章
异方差
主要内容
异方差的概念 产生异方差的原因 异方差的结果 异方差的检验 异方差的修正方法
统计知识复习
E(cX ) = cE( X ) 2 Var (cX ) = c Var ( X )
一. 异方差的概念
随机误差项的方差受到解释变量的影响,随解释变量 取值的变化而变化,称随机误差项存在异方差。 同方差(经典假设):随机扰动项ui对每一个样本点的 方差是一个常数 异方差:∂ µ i 与i有关,不再是常数,但ui仍然是一个服 从正态分布的随机变量 Var (µi) = σ2µ =常数
Yi = b0 + b1 ln X 1i + b2 ln X 2i + µ i
(产出) (资本) (劳动力)
对规模小的企业,在一定的劳动投入和资金投 入下,产出的波动幅度小,随机项的方差小 对规模大的企业,在一定的劳动投入和资金投 入下,产出的波动幅度大,随机项的方差大 随机误差项的方差随企业规模增大而递增

异方差

异方差

异方差问题1.什么是异方差?i ki k i i i u X X X Y +++++=ββββ 22110,ni ,,2,1 =221),,|(i i i i X X u Var σ= ,n i ,,2,1 =或者 2)(i i u Var σ=,n i ,,2,1 =同方差异方差2.异方差性的两个例子⏹收入与储蓄⏹打字出错个数与打字练习小时数3.异方差的类型同方差递增方差4.异方差性的后果(1)OLS 估计量仍然具有线性性和无偏性 证明:我们以一元线性回归模型为例来证明。

∑∑∑∑∑∑+-++=-==21010221)]()[()(ˆii i i i i i i i i ΔX X u X ΔX ΔX Y Y ΔX ΔX ΔY ΔX βββββ ∑+=i i u k 1β,其中∑=2iii ΔX ΔX k 。

⏹ 证明无偏性时只使用到两个假设:解释变量是外生的,误差的均值为零 ⏹ 下面证明OLS 估计量方差在同方差与异方差情况下不相等。

当假设为同方差时,1ˆβ的方差为 )var()var()ˆvar(11∑∑=+=i i i i u k u k ββ (由随机扰动项的无自相关性假设) ∑∑==)var()var(2i i i i u k u k (由同方差假设)∑∑∑∑=⎥⎥⎦⎤⎢⎢⎣⎡==22222222)(ii i iΔXΔX ΔX k σσσ当方差为异方差是,1ˆβ的方差为 ∑∑==2221)var()ˆvar(i i i i k u k σβ 22222222)()()(∑∑∑∑=⎥⎥⎦⎤⎢⎢⎣⎡=i i i i i i ΔX ΔX ΔX ΔX σσ (2)变量的显著性检验失去意义说明:如果在存在异方差的情况下,仍然使用常用的OLS 估计量表达式,则计算得到的方差通常是有偏的。

由于t 统计量和F 统计量的表达式中都包含样本标准差,因此计算得到的t 统计值和F 统计值都是有偏误的,则建立在其上的假设检验也是不可靠的。

异方差的名词解释

异方差的名词解释

异方差的名词解释引言:在实际应用中,我们常常会遇到一种数据特征,即样本的方差不稳定的现象。

这种现象称为异方差,是统计分析中一个重要的概念。

本文将从定义、原因、影响以及如何处理异方差等方面进行探讨,以帮助读者更好地理解异方差的概念及其应用。

一、定义异方差(Heteroscedasticity)指的是在统计学中,方差并不是恒定的,而是与自变量的某些特征相关联。

换句话说,样本的方差会随着自变量的不同取值而发生变化。

二、原因异方差可能由多种因素引起。

常见的原因包括以下几个方面:1. 异常值:样本中存在极端值或异常值,使得方差的测量结果被拉大或压缩;2. 比例误差:不同自变量取值下,因变量的测量误差有一定的比例关系;3. 数据收集:数据收集过程中的误差,或者是相关变量的选择问题,可能导致异方差的出现。

三、影响异方差存在对统计分析结果产生不良影响的情况,对回归分析尤为关键。

以下是几个常见的影响:1. 回归系数估计值的不准确:异方差可能导致回归系数估计值的偏倚,进而影响模型的解释和预测能力;2. 统计检验结果的误导:异方差使得恰当的统计检验成为挑战,常见的问题是标准误估计的错误;3. 置信区间和预测区间的准确性下降:异方差可能导致对未来观测值进行预测时的不确定性增加。

四、处理方法针对异方差问题,有一些常用的方法可以帮助我们处理。

以下是几种常见的处理方法:1. 权重最小二乘法(Weighted Least Squares, WLS):根据异方差的特征,使用加权最小二乘法来估计回归系数。

即根据样本的方差-均值关系,为每个样本赋予相应的权重,从而平衡不同自变量值下对模型的贡献。

2. 魏布尔-克劳修斯检验(White-Huber test):该检验用于检验异方差的存在。

若检验结果表明存在异方差,则可以尝试使用WLS进行回归估计。

3. 变量转换(Variable Transformation):通过将特征变量进行线性或非线性的转换,以消除异方差的影响。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

19
几种异方差的检验方法: 几种异方差的检验方法: 非正式的方法(图示法) 一、非正式的方法(图示法)
1、用X-Y的散点图进行判断 、 的散点图进行判断 看是否存在明显的散点扩大 缩小 复杂 散点扩大、缩小 散点扩大 缩小或复杂 型趋势(即不在一个固定的带型域中) 型趋势(即不在一个固定的带型域中)
先将样本一分为二,对子样①和子样② 先将样本一分为二,对子样①和子样②分别 作回归, 作回归,然后利用两个子样的残差平方和之比构 造统计量进行异方差检验。 造统计量进行异方差检验。 由于该统计量服从F分布, 由于该统计量服从 分布,因此假如存在递增 分布 的异方差, 远大于1;反之就会等于1( 的异方差,则F远大于 ;反之就会等于 (同方 远大于 )、或小于 或小于1(递减方差)。 差)、或小于 (递减方差)。
26 26
戈德菲尔德-匡特(Goldfeld Quandt)检验 (Goldfeld3、戈德菲尔德-匡特(Goldfeld-Quandt)检验
G-Q检验以 检验为基础,适用于样本容量较 检验以F检验为基础 检验以 检验为基础, 异方差递增或递减的情况。 大、异方差递增或递减的情况。
G-Q检验的思想: 检验的思想:
所以,当模型出现异方差性时,参数 所以,当模型出现异方差性时,参数OLS 估计值的变异程度增大,从而造成对Y的预测 估计值的变异程度增大,从而造成对 的预测 误差变大,降低预测精度,预测功能失效。 误差变大,降低预测精度,预测功能失效。
18
§5.3 异方差的侦察方法
检验思路: 检验思路:
由于异方差性就是相对于不同的解释 由于异方差性就是相对于不同的解释 异方差性 变量观测值,随机误差项具有不同的方差。 变量观测值,随机误差项具有不同的方差。 那么: 那么 检验异方差性, 检验异方差性,也就是检验随机误差项 的方差与解释变量观测值之间的相关性及 其相关的“形式” 其相关的“形式”。
ˆ µi = β1 + β 2 X i + Vi 可以用 X i 或 1 来代替X i Xi
根据图形的分布情况选择解释变量的具体形式。
24
格莱泽检验
异方差的格莱泽 格莱泽检验 格莱泽
e
e
0
(a )
X
j
0
(b )
X
j
e
0
(c )
X
j
25 25
帕克检验和格莱泽检验的困难
需要选择不同的解释变量, 需要选择不同的解释变量,尝试各种不 同的函数形式,进行多次反复试验; 同的函数形式,进行多次反复试验; 在进行试验的回归模型中, 在进行试验的回归模型中,其随即干扰 项本身就可能不满足OLS的经典假设 的经典假设。 项本身就可能不满足 的经典假设
Ci=β0+β1Yi+µI
将居民按照收入等距离分成 组,取组平均数为样 居民按照收入等距离分成n组 居民按照收入等距离分成 本观测值。 本观测值。 一般情况下,居民收入服从正态分布: 一般情况下,居民收入服从正态分布:中等收 入组人数多,两端收入组人数少。 入组人数多,两端收入组人数少。而人数多的组平 均数的误差小,人数少的组平均数的误差大。 均数的误差小,人数少的组平均数的误差大。 所以样本观测值的观测误差随着解释变量观测 所以样本观测值的观测误差随着解释变量观测 样本观测值的观测误差 值的不同而不同,往往引起异方差性。 值的不同而不同,往往引起异方差性。
2 2
6
异方差的类型
异方差一般可归结为三种类型: 异方差一般可归结为三种类型: 三种类型 (1)单调递增型: σi2随X的增大而增大 单调递增型: 单调递增型 的增大而增大 (2)单调递减型: σi2随X的增大而减小 单调递减型: 单调递减型 的增大而减小 (3)复 复 杂 型: σi2与X的变化呈复杂形式 的变化呈复杂形式
即对于不同的样本点 随机误差项的方差不再 对于不同的样本点,随机误差项的方差不再 对于不同的样本点 是常数,而互不相同 则认为出现了异方差性 而互不相同,则认为出现了 是常数 而互不相同 则认为出现了异方差性 (Heteroskedasticity)。
5
一、异方差的类型
古典假定之一:随机扰动项µi的方差相同 var(µi ) = σ 2 = 常数 ≠ f ( X i ) i = 1,2,..., n 异方差:µi的方差随X i的变化而变化,即 var(µi ) = σ i = σ f ( X i )
第二部分 经典单方程计量经济 学模型: 学模型:放宽基本假定的模型
1
基本假定违背: 基本假定违背:不满足基本假定的情况。 主要包括: 异方差性 (1)随机误差项序列存在异方差性; )随机误差项序列存在异方差 序列相关性 (2)随机误差项序列存在序列相关性; )随机误差项序列存在序列相关 (3)解释变量之间存在多重共线性; )解释变量之间存在多重共线性 多重共线 4) (4)解释变量是随机变量且与随机误差项相关 随机解释变量) (随机解释变量); (5)模型设定有偏误。 )模型设定有偏误。 计量经济检验: 计量经济检验:对模型基本假定的检验
12
三、异方差的原因
1、截面数据中,随着自变量的增加,应变量 、截面数据中,随着自变量的增加, 的变异就越大。 的变异就越大。 2、模型中遗漏了某些重要的解释变量,从而 、模型中遗漏了某些重要的解释变量, 造成了异方差。 造成了异方差。 3、异常观测值的出现。 、异常观测值的出现。 波动、 如 波动、不确定性与经济规模的比例关 赚钱越多, 系 ——赚钱越多,消费的选择余地越大。 赚钱越多 消ห้องสมุดไป่ตู้的选择余地越大。
ˆ σ2 = u i2 ∑ˆ d.f . = e i2 ∑ d .f .
也不是真实方差的无偏估计。 也不是真实方差的无偏估计
16
2、变量的显著性检验失去意义
变量的显著性检验中,构造了 统计量 变量的显著性检验中,构造了t统计量
其他检验也是如此。
17
3、模型的预测失效
一方面,由于上述后果, 一方面,由于上述后果,使得模型不具有 良好的统计性质; 良好的统计性质;
20
异方差的侦察方法
2、图解法: 图解法: 图解法
ˆ ˆ µi ~ Yi或X i
2
ˆ µi2
ˆ µi 2
. . . . . . . . . . . . . . . . . . . . .
.
ˆ Y i
ˆ Yi
21
二、正式方法
1.帕克( 1.帕克(Park)检验 帕克 检验 选择关于变量X的不同的函数形式, 选择关于变量 的不同的函数形式,对方程 的不同的函数形式 进行估计并进行显著性检验, 进行估计并进行显著性检验,如果存在某一种 函数形式,使得方程显著成立, 函数形式,使得方程显著成立,则说明原模型 存在异方差性。 存在异方差性。 帕克检验常用的函数形式:
13
三、异方差的原因
4、异常值的出现。 、异常值的出现。 5、某个解释变量或多个解释变量的偏态分布。 、某个解释变量或多个解释变量的偏态分布。 6、不正确的数据变形或者函数形式的错误选 、 择。
14
§5.2 出现异方差的后果
15
异方差性的后果
计量经济学模型一旦出现异方差性,如果仍采 用OLS估计模型参数,会产生下列不良后果: 1、参数估计量非有效 OLS估计量仍然具有无偏性 仍然具有无偏性 不具有有效 仍然具有无偏性,但不具有有效 不具有 方差会变大。( 。(即使在大样本的情况系也是 性,方差会变大。(即使在大样本的情况系也是 如此)。 如此)。
2
第五章:异方差 第五章 异方差
3
本章主要内容 异方差的概念和产生原因 产生异方差的后果 异方差的侦察方法 异方差性的修正 案例
4
§5.1 异方差的概念
对于模型
Yi = β 0 + β 1 X ii + β 2 X 2i + L + β k X ki + µ i
如果出现
Var ( Var( µi ) = σ i2
研究表明,异方差问题多存在于截面数据中。 异方差问题多存在于截面数据中。 异方差问题多存在于截面数据中
9
异方差的图形表示
密 度 密 度 储 蓄 Y
储 蓄 Y
β1 + β 2 X i β1 + β 2 X i
(A) 收入X 收入X (B)
10
以绝对收入假设为理论假设、 例5.1.2,以绝对收入假设为理论假设、以截面 以绝对收入假设为理论假设 数据为样本建立居民消费函数: 数据为样本建立居民消费函数:
在统计上是显著的,表明存在异方差性。 若 β 在统计上是显著的,表明存在异方差性
22
步骤: 1.不考虑异方差的问题,做普通最小二乘回归。 2.求残差序列,并求其平方的对数形式。 3.利用原始模型中的一个解释变量做下面的回归: ln σ i = α + β ln X i + Vi
2
ˆ 用µi 代替未知的σ i
7
8
二、实际经济问题中的异方差性
例5.1.1:截面资料下研究居民家庭的储蓄行为 截面资料下研究居民家庭的储蓄行为 Yi=β0+β1Xi+µi Yi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收 第 个家庭的储蓄额 第 个家庭的可支配收 入 高收入家庭: 高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性, 低收入家庭:储蓄则更有规律性,差异较小 µi的方差呈现单调递增型变化
27
G-Q检验的步骤: 检验的步骤:
对样本观察值(X 按观察值X ①将n对样本观察值 i,Yi)按观察值 i的大小 对样本观察值 按观察值 排队 将序列中间的c=n/4个观察值除去,并将 个观察值除去, ②将序列中间的 个观察值除去 剩下的观察值划分为较小与较大的相同的两 个子样本,每个子样样本容量均为(n-c)/2 个子样本,每个子样样本容量均为 对每个子样分别进行OLS回归 回归, ③对每个子样分别进行OLS回归,并计算各自 的残差平方和
相关文档
最新文档