异方差性的后果

合集下载

异方差性在回归分析的影响

异方差性在回归分析的影响

异方差性在回归分析的影响在回归分析中,异方差性是一个重要的概念,指的是误差项的方差不是恒定的,而是随着自变量的变化而变化。

异方差性会对回归分析的结果产生影响,导致参数估计不准确甚至失真,从而影响对模型的解释和预测能力。

本文将从异方差性的定义、影响、检验以及处理方法等方面展开讨论。

一、异方差性的定义在回归分析中,我们通常假设误差项具有同方差性,即误差项的方差是恒定的。

然而,在实际应用中,误差项的方差可能会随着自变量的变化而发生变化,这种情况被称为异方差性。

异方差性通常表现为误差项的方差与自变量的水平相关,即方差不是常数。

二、异方差性的影响1. 参数估计的不准确性:异方差性会导致参数估计的不准确性,使得回归系数的估计偏离真实值,从而影响对自变量与因变量之间关系的解释。

2. 统计检验的失真:异方差性会使得回归模型的显著性检验结果失真,可能导致错误的结论,影响对模型整体拟合优度的评估。

3. 预测精度的下降:异方差性会影响对未来观测值的预测精度,使得预测结果不可靠,降低模型的预测能力。

三、异方差性的检验为了检验回归模型是否存在异方差性,可以采用以下方法:1. 图形诊断法:通过残差图、残差与预测值的散点图等图形来观察残差的分布情况,如果残差呈现出明显的异方差性模式,就可以怀疑模型存在异方差性。

2. 统计检验法:利用异方差性检验统计量,如White检验、Goldfeld-Quandt检验、Breusch-Pagan检验等,对模型的异方差性进行显著性检验。

四、处理异方差性的方法当检验结果表明模型存在异方差性时,可以采取以下方法进行处理:1. 加权最小二乘法(Weighted Least Squares, WLS):通过对残差进行加权,使得残差的方差与自变量的水平相关,从而消除异方差性。

2. 变量转换:对自变量或因变量进行对数变换、平方根变换等,使得变量的方差变化较小,减轻异方差性的影响。

3. 引入干扰项:在模型中引入干扰项,如虚拟变量、交互项等,来控制异方差性的影响。

第五章 异方差性

第五章 异方差性
于OLS估计得到的残差 ei 的分析
26
异方差性的检验
问题在于用什么来表示随机误差项的方差 一般的处理方法:
Var(ui ) E(uቤተ መጻሕፍቲ ባይዱ2) ei2
图示检验法
图示检验法
(一)相关图形分析 方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释
变量Y与随机误差项u有相同的方差,所以分析Y与X的相关图,可以初 略地看到Y的离散程度与X之间是否有相关关系。
ui 的某些分布特征,可通过残差 ei 的图形对异方差进行观察。
对于一元回归模型,绘制出ei2 对Xi的散点图,对于多元回归模型,绘制出ei2 对Yi的散点图或ei2 与认为和异方差有关的X的散点图。
31
图示检验法
(二)残差图形分析
e~i 2
e~i 2
X 同方差
e~i 2
X 递增异方差
e~i 2
X 递减异方差
每个企业所处的外部环境对产出量的影响被包含在随机误差项中 每个企业所处的外部环境对产出量的影响程度不同,造成了随机
误差项的异方差性
产生异方差性的原因
产生异方差性的原因
(一)模型设定误差
假设正确的模型是:
Yi 1 2 X2i 3 X3i ui
假如略去了重要的解释变量X3 ,而采用 Yi 1 2 X2i vi
排序,再按戈德菲尔德匡特检验方法回归,否则即使存在异方差,也有可能用戈德菲
尔德匡特方法检验不出来。
用 EViews 给截面数据排序的方法:在 Workfile 窗口点击 Procs 键并选 Sort current page
功能,在打开的 Sort Workfile Series 对话窗填写以哪一个序列为标准(基准序列)排

第二章异方差性

第二章异方差性

R2
第二种修正方法
以上是知道了回归结果的残差项和自变 量的具体形式才用加权最小二乘法,但 是当我们不知道这种形式的时候,就可 以用自相关相容协方差。其过程和ols差 不多,只是在回归过程中多加了一步操 作,操作如下:
总结
异方差是回归过程的一种情况,有时候 可能不能完全消除,这就要看我们关注 的参数指标谁更重要来进行选择。
进一步分析
有时候我们很有可能找不到残差项和自 变量的拟和优度很高的方程这时就应该 采用残差项的绝对值的倒数作为权重来 进行回归,即令1/abs(resid)作为权重来 进行回归,这种方法调整的力度非常大, 一般调整后会得到很好的结果。如本例 的结果为:
结果
com=199.8212+0.479522gdp (9.334611) (52.32882) =0.996279 F=2738.306 D.W.=1.472518
说明
异方差检验的形式为: 原假设:无异方差 备择假设:有异方差 可以看出无异方差的相伴概率几乎为零, 所以存在异方差。
判断异方差的第一种方法
观察残差项的直方图,图中显示残差项 在一定的范围聚集,并且其高度明显不 同,不满足残差项是随机项的要求,即 残差项随时间不规则的上下跳动,而图 则没有表现出这种随机性。判断回归是 否有异方差性,观察直方图是其中的一 种方法。
模型简介
以下采用2001年我国各省,市,自治区 的国内生产总值gdp和最终消费com来估 计我国的消费函数,这是一个典型的截 面数据,从中可以看出模型有很大的异 方差性。
数据如下:
地区 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 gdp 2845.65 1840.1 5577.78 1779.97 1545.79 5033.08 2032.48 3561 4950.84 9511.91 6748.15 3290.13 4253.68 2175.68 9438.31 com 1467.71 901.85 2509.3 1046.43 936.19 2828.09 1331.32 2110.54 2149.07 4295.96 3306.1 2108.09 2225.23 1357.47 4582.61 河南 湖北 湖南 广东 广西 海南 重庆 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 5640.11 4662.28 3983 10647.71 2231.19 545.96 1749.77 4421.76 1084.9 2074.71 138.73 1844.27 1072.51 300.95 298.38 1485.48 3114.13 2408.84 2553.14 5841.32 1597.05 299.86 1078.06 2691.47 833.87 1430.44 82.79 1004.5 674.42 197.79 223.52 854.6

异方差性的概念、类型、后果、检验及其修正方法含案例

异方差性的概念、类型、后果、检验及其修正方法含案例
例4.1.1: 在截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。
在该模型中,i的同方差假定往往不符合实际情况。对高收 入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律 性(如为某一特定目的而储蓄),差异较小。
因此,i的方差往往随Xi的增加而增加,呈单调递增型变化 。
– 在选项中,EViews提供了包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”和没有交叉项的怀特检 验“White Heteroskedasticity(no cross terms)” 这样两个 选择。
• 软件输出结果:最上方显示两个检验统计量:F统计 量和White统计量nR2;下方则显示以OLS的残差平 方为被解释变量的辅助回归方程的回归结果。
随机误差项具有不同的方差,那么: 检验异方差性,也就是检验随机误差项的方差与解
释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
路漫漫其修远兮, 吾将上下而求索
问题在于:用什么来表示随机误差项的方差? 一般的处理方法:
路漫漫其修远兮, 吾将上下而求索
2.图示检验法
路漫漫其修远兮, 吾将上下而求索
3.模型的预测失效
一方面,由于上述后果,使得模型不具有良好的统计性质;
【书上这句话有点问题】
其中 所以,当模型出现异方差性时,Y预测区间的建立将发生困 难,它的预测功能失效。
路漫漫其修远兮, 吾将上下而求索
三、异方差性的检验(教材P111)
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值,
(注意:其中的2完全可以是1)

第4章 异方差性Eviews

第4章 异方差性Eviews
2
以一个二元线性回归模型为例,设模型为: Yt = β1 + β2 X 2t + β3 X 3t +ut
并且,设异方差与 X 2t , X 3t 的一般关系为
2 σt2 = α1 +α2 X 2t +α3 X 3t +α4 X 2t +α5 X32t +α6 X 2t X3t +vt
其中 vt为随机误差项。
设模型为
Yi 1 2 X 2i 3 X 3i ... k X ki ui i 1,2,..., n
如果对于模型中随机误差项 u i 有:
Var(ui ) i2 , i 1, 2,3,..., n (5.3) 则称具有异方差性。进一步,把异方差看成是由于某 个解释变量的变化而引起的,则
绘制出ei2对Xi的散点图
如果ei2不随Xi而变化,则表明不存在异方差;
如果ei2随Xi而变化,则表明存在异方差。
2500000
命令格式为: ls y c x genr e2=resid^2 scat x e2
2000000
1500000
E2
1000000 500000
0 0 200 400 600 X 800 1000
8000 6000
4000
Y
2000
0 0 200 400 600 X 800 1000 1200
2.残差图形分析
ui的变化是由模型之外其它因素综合影响决定, 其取值无法预测,残差ei也是描述解释变量之外 其它因素的综合影响,因此可以将其作为ui的估 计量,ei能在一定程度上反映ui的某些分布特征。
本节基本内容:
●对参数估计统计特性的影响 ●对参数显著性检验的影响 ●对预测的影响

异方差性及后果

异方差性及后果

V (ui ) E(ui2) ui 2 常数
(5.1.2)
异方差性的数学表达式,可写成自变量 xi 的函数,

2 ui
f (xi )
(5.1.3)
§5.2 异方差性的后果 一、线性和无偏性
ˆ ki ui
ki
xi xi2
ˆ 是ui的线性函数显然成立
(5.2.1)
由(2.3.7)知α的OLS估计量为
对于多元线性回归模型
y 0 1 x1 k xk u
若异方差的结构不知道,可以证明有下列估计式
n
Vˆ (ˆ
j)
rˆi2j uˆi2
i1
ESS2j
(5.2.9)
其中 ESS j rˆi2j
式中 rˆij 为xj将对所有其它自变量作回归所得到的第i个
残差;ESSj则为这个回归的残差平方和。 (5.2.9)的算 术根称为 ˆ j 的异方差—稳健标准差(heteroskedasticity -robust standard error )。(参看武德263页)
(5.2.8)的结果是线性模型(5.2.5)具有异方差情况下,
参数β估计值的方差。用
ˆ
2 u
代替
u2便有估计值


)
ˆ
2 u
xi2
xi2
( xi2 )2
可以证明:u具有异方差时,参数的方差失去了最 佳性。(参看课本108页)
如果存在异方差性而仍然采用OLS估计参数β, 由于参数的估计值的方差并非最小,在对β进行显 著性检验时将低估t值可能导致错误的统计判断, 在对参数β进行区间估计时就会不必要地扩大置信 区间。 甚至统计量T失去t
ˆ
(1 n
x

第五篇异方差性

第五篇异方差性

南阳师范学院课时教学计划式中Y表示卫生医疗机构数(个),X表示人口数量(万人)。

●人口数量对应参数的标准误差较小;一、异方差性产生的原因 例1:考察居民家庭收入与储蓄的关系时,用i x 表示第i 个家庭的收入量,用i y 表示第i 个家庭的储蓄量,假设这种关系是线性关系,因而储蓄函数模型可以表示为:i i i u x a y ++=β在这一问题中,收入低的家庭,他们除了必要的支出之外剩余较少,解:先在同方差假定下,应用OLS 对模型进行估计:i i x y8940.01347.1ˆ+-= 96786.02=R 利用此模型可算出yˆ和e 的值,最终得出e 与x 的等级相关系数:异方差性相关理论的解释一、异方差不影响估计量的线性和无偏性,但导致有效性不能满足 (1)线性无偏 证明:()()()()YX U βββββ'='=+'=+-1-1-1X X X (满足线性)那么E()=(无偏性)''X X X X X XU2.有效性 证明:()()()()()()()()()()()()()()()()()()122222222222222222222222222222222222222==i ii i j ii ji i i i i i jjx u x x u x x xx xx f x x x f x x x f x xx xx x βββββσββσσσσβ=++⎛⎫- ⎪+ ⎪ ⎪-⎝⎭-=---==--∑∑∑∑∑∑∑∑i 以一元回归为例假设y 直接做普通最小二乘回归,可得的估计量为:在没有自相关和U 与X 线性无关的假定下:易知的方差为:VAR 当存在异方差时:VAR ()()()()()()()()()2222222222222222=11,jii ji i jx xx f x xx x x f x xx β---->-∑∑∑∑∑由于难以保证所以,异方差的存在就容易使得的方差被高估或低估。

计量经济学:异方差性

计量经济学:异方差性

计量经济学:异方差性异方差性在现实经济活动中,最小二乘法的基本假定并非都能满足,上一章介绍的多重共线性只是其中一个方面,本章将讨论违背基本假定的另一个方面——异方差性。

虽然它们都是违背了基本假定,但前者属于解释变量之间存在的问题,后者是随机误差项出现的问题。

本章将讨论异方差性的实质、异方差出现的原因、异方差的后果,并介绍检验和修正异方差的若干方法。

第一节异方差性的概念一、异方差性的实质第二章提出的基本假定中,要求对所有的i (i=1,2,…,n )都有2)(σ=i u Var (5.1)也就是说i u 具有同方差性。

这里的方差2σ度量的是随机误差项围绕其均值的分散程度。

由于0)(=i u E ,所以等价地说,方差2σ度量的是被解释变量Y 的观测值围绕回归线)(i Y E =ki k i X X βββ+++ 221的分散程度,同方差性实际指的是相对于回归线被解释变量所有观测值的分散程度相同。

设模型为n i u X X Y iki k i i ,,2,1221 =++++=βββ (5.2)如果其它假定均不变,但模型中随机误差项i u 的方差为).,,3,2,1(,)(22n i u Var i i ==σ (5.3)则称i u 具有异方差性。

由于异方差性指的是被解释变量观测值的分散程度是随解释变量的变化而变化的,如图5.1所示,所以进一步可以把异方差看成是由于某个解释变量的变化而引起的,则)()(222i i i X f u Var σσ== (5.4)图5.1二、产生异方差的原因由于现实经济活动的错综复杂性,一些经济现象的变动与同方差性的假定经常是相悖的。

所以在计量经济分析中,往往会出现某些因素随其观测值的变化而对被解释变量产生不同的影响,导致随机误差项的方差相异。

通常产生异方差有以下主要原因:1、模型中省略了某些重要的解释变量异方差性表现在随机误差上,但它的产生却与解释变量的变化有紧密的关系。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3、怀特(White)检验
怀特检验不需要排序,且适合任何形式的异方差
怀特检验的基本思想与步骤(以二元为例): Yi 0 1 X 1i 2 X 2i i
然后做如下辅助回归
例1.2,以绝对收入假设为理论假设、以截面数 据为样本建立居民消费函数: Ci=0+1Yi+i
将居民按照收入等距离分成n组,取组平均数为样 本观测值。
一般情况下,居民收入服从正态分布:中等收入 组人数多,两端收入组人数少。而人数多的组平均 数的误差小,人数少的组平均数的误差大。 所以样本观测值的观测误差随着解释变量观测值 的不同而不同,往往引起异方差性。
如: 帕克检验常用的函数形式: ~ 2 ) ln 2 ln X ln( e f ( X ji ) 2 X e 或 i ji i ji
i
若在统计上是显著的,表明存在异方差性。
3、戈德菲尔德-匡特(Goldfeld-Quandt)检验
G-Q检验以F检验为基础,适用于样本容量较大、 异方差递增或递减的情况。
异方差性及序列相关性
2016年5月
目录
第一部分:异方差性
一、异方差的定义
二、异方差的类型
三、实际经济问题中的异方差性
四、异方差性的后果
五、异方差性的检验
六、异方差的修正
七、案例
一、异方差的定义
设线性回归模型为:
异方差性主要发生在横截面数据的情况,时间序列问题中一般不会发生,除非时 间跨度过大。
一、异方差的定义
四、异方差性的后果
计量经济学模型一旦出现异方差性,如果仍采 用OLS估计模型参数,会产生下列不良后果: 1、参数估计量非有效 OLS估计量仍然具有无偏性,但不具有有效性 因为在有效性证明中利用了 E(’)=2I 而且,在大样本情况下,尽管参数估计量具有一 致性,但仍然不具有渐近有效性。
2、变量的显著性检验失去意义
G-Q检验的思想:
先将样本一分为二,对子样①和子样②分别 作回归,然后利用两个子样的残差平方和之比构 造统计量进行异方差检验。
由于该统计量服从F分布,因此假如存在递增 的异方差,则F远大于1;反之就会等于1(同方 差)、或小于1(递减方差)。
G-Q检验的步骤:
①将n对样本观察值(Xi,Yi)按观察值Xi的大小排 队 ②将序列中间的c=n/4个观察值除去,并将剩 下的观察值划分为较小与较大的相同的两个 子样本,每个子样样本容量均为(n-c)/2 ③对每个子样分别进行OLS回归,并计算各自 的残差平方和
X
2、帕克(Park)检验与戈里瑟(Gleiser)检验
基本思想: 偿试建立方程: 2 ~ ~ | f ( X ) |e ei f ( X ji ) i 或 i ji i 选择关于变量X的不同的函数形式,对方程进行 估计并进行显著性检验,如果存在某一种函数 形式,使得方程显著成立,则说明原模型存在 异方差性。
④在同方差性假定下,构造如下满足F分布的 统计量
nc 2 ~ e2i ( 2 k 1) nc nc F ~ F( k 1, k 1) 2 2 ~ 2 ( n c k 1) e 1i 2
⑤给定显著性水平,确定临界值F(v1,v2), 若F> F(v1,v2), 则拒绝同方差性假设,表明存 在异方差。 当然,还可根据两个残差平方和对应的子样 的顺序判断是递增型异方差还是递减异型方差。
二、异方差的类型
三、实际经济问题中的异方差性
例1.1:截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i Yi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入 高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性,差异较小 i的方差呈现单调递增型变化
三、实际经济问题中的异方差性
三、实际经济问题中的异方差性
例1.3,以某一行业的企业为样本建立企业生产函 数模型 Yi=Ai1 Ki2 Li3ei
被解释变量:产出量Y 解释变量:资本K、劳动L、技术A, 那么:每个企业所处的外部环境对产出量的影响被 包含在随机误差项中。 每个企业所处的外部环境对产出量的影响程度不 同,造成了随机误差项的异方差性。 这时,随机误差项的方差并不随某一个解释变量 观测值的变化而呈规律性变化,呈现复杂型。
产生异方差的原因
1、模型中遗漏了某些解释变量
2、模型函数形式的设定误差 3、样本数据的测量误差 4、随机因素的影响
二、异方差的类型
同方差性假定:i2 = 常数 f(Xi) 异方差时: i2 = f(Xi) 异方差一般可归结为三种类型: (1)单调递增型: i2随X的增大而增大 (2)单调递减型: i2随X的增大而减小 (3)复 杂 型: i2与X的变化呈复杂形式
问题在于用什么来表示随机误差项的方差
一般的处理方法:
首先采用 OLS 法估计模型,以求得随机误差项的ቤተ መጻሕፍቲ ባይዱ估计量 (注意, 该估计量是不严格的) , 我们称之为 “近
~ e 似估计量” ,用 i
表示。于是有
~2 Var ( i ) E ( i2 ) e i
~ y (y i ) 0ls e i i
变量的显著性检验中,构造了t统计量
其他检验也是如此。
3、模型的预测失效
一方面,由于上述后果,使得模型不具有 良好的统计性质;
所以,当模型出现异方差性时,参数OLS估 计值的变异程度增大,从而造成对Y的预测误 差变大,降低预测精度,预测功能失效。
五、异方差性的检验
• 检验思路:
由于异方差性就是相对于不同的解释变量 观测值,随机误差项具有不同的方差。那么: 检验异方差性,也就是检验随机误差项的 方差与解释变量观测值之间的相关性及其相 关的“形式”。
几种异方差的检验方法:
1、图示法
(1)用X-Y的散点图进行判断 看是否存在明显的散点扩大、缩小或复杂型 趋势(即不在一个固定的带型域中)
2 ~ e (2)X- i 的散点图进行判断
看是否形成一条斜率为零的直线
~2 e i ~2 e i
X 同方差 递增异方差
X
~2 e i
~2 e i
X 递减异方差 复杂型异方差
相关文档
最新文档