第六章--异方差性

合集下载

异方差性在回归分析的影响

异方差性在回归分析的影响

异方差性在回归分析的影响在回归分析中,异方差性是一个重要的概念,指的是误差项的方差不是恒定的,而是随着自变量的变化而变化。

异方差性会对回归分析的结果产生影响,导致参数估计不准确甚至失真,从而影响对模型的解释和预测能力。

本文将从异方差性的定义、影响、检验以及处理方法等方面展开讨论。

一、异方差性的定义在回归分析中,我们通常假设误差项具有同方差性,即误差项的方差是恒定的。

然而,在实际应用中,误差项的方差可能会随着自变量的变化而发生变化,这种情况被称为异方差性。

异方差性通常表现为误差项的方差与自变量的水平相关,即方差不是常数。

二、异方差性的影响1. 参数估计的不准确性:异方差性会导致参数估计的不准确性,使得回归系数的估计偏离真实值,从而影响对自变量与因变量之间关系的解释。

2. 统计检验的失真:异方差性会使得回归模型的显著性检验结果失真,可能导致错误的结论,影响对模型整体拟合优度的评估。

3. 预测精度的下降:异方差性会影响对未来观测值的预测精度,使得预测结果不可靠,降低模型的预测能力。

三、异方差性的检验为了检验回归模型是否存在异方差性,可以采用以下方法:1. 图形诊断法:通过残差图、残差与预测值的散点图等图形来观察残差的分布情况,如果残差呈现出明显的异方差性模式,就可以怀疑模型存在异方差性。

2. 统计检验法:利用异方差性检验统计量,如White检验、Goldfeld-Quandt检验、Breusch-Pagan检验等,对模型的异方差性进行显著性检验。

四、处理异方差性的方法当检验结果表明模型存在异方差性时,可以采取以下方法进行处理:1. 加权最小二乘法(Weighted Least Squares, WLS):通过对残差进行加权,使得残差的方差与自变量的水平相关,从而消除异方差性。

2. 变量转换:对自变量或因变量进行对数变换、平方根变换等,使得变量的方差变化较小,减轻异方差性的影响。

3. 引入干扰项:在模型中引入干扰项,如虚拟变量、交互项等,来控制异方差性的影响。

异方差定义及检验

异方差定义及检验

4、帕克(Park)检验和戈里瑟(Glejser)检验
2 e x e i • Park检验的辅助模型为: i 2 • 求对数后为: ln(ei ) ln( ) ln xi

(4.1.2)
2 e • Glejser检验以 i 为被解释变量,以原模型的某一解释 变量 x j为解释变量,建立如下方程 :
ei f x ji i (4.1.3) • • f x j 可有多种函数形式。(利用试回归法,选择关于 变量的不同的函数形式,对方程进行估计并进行显著 性检验,如果存在某一种函数形式,使得方程显著成 立,则说明原模型存在异方差性。) • 可利用Eviews软件实现。
2
第二节 异方差的修正
方式2:在方程窗口中点击Estimate\Options\Weighted, 并在权数变量栏输入权数变量;
3)利用White检验判断是否消除了异方差性 权数变量的确定:依据Pack检验和Gleiser检验的结 果,或直接取成1/ei
精品课件!
作业四:
• 第五章3/4/6/8。
步骤:1)将解释变量的样本值按从小到大排序,再利用

ห้องสมุดไป่ตู้ • 检验统计量:
• F服从分布
2 1
n c k 1 2 RSS 2 2 F (4.1.1) 2 2 RSS1 RSS1 n c k 1 2
nc nc F (k 1), (k 1) 2 2
2.戈德菲尔德—匡特(Goldfeld—Quant)检验
原理:适合递增型的异方差,利用方差与解释变量同步增
长的原理,通过检验小方差与大方差是否有明显差异,达 到检验异方差的目的。 OLS求出估计值和残差序列 ei 2)在所有样本点中删去中间的c个点,将余下的点分为两组, 每组样本为 n c 2 个。 3)将两组样本分别作OLS,求得各自的残差平方和,再设计 统计量检验两组残差平方和是否有显著差异,若有,异方 差存在。

异方差性的概念、类型、后果、检验及其修正方法含案例

异方差性的概念、类型、后果、检验及其修正方法含案例
例4.1.1: 在截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。
在该模型中,i的同方差假定往往不符合实际情况。对高收 入家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律 性(如为某一特定目的而储蓄),差异较小。
因此,i的方差往往随Xi的增加而增加,呈单调递增型变化 。
– 在选项中,EViews提供了包含交叉项的怀特检验“White Heteroskedasticity(cross terms)”和没有交叉项的怀特检 验“White Heteroskedasticity(no cross terms)” 这样两个 选择。
• 软件输出结果:最上方显示两个检验统计量:F统计 量和White统计量nR2;下方则显示以OLS的残差平 方为被解释变量的辅助回归方程的回归结果。
随机误差项具有不同的方差,那么: 检验异方差性,也就是检验随机误差项的方差与解
释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
路漫漫其修远兮, 吾将上下而求索
问题在于:用什么来表示随机误差项的方差? 一般的处理方法:
路漫漫其修远兮, 吾将上下而求索
2.图示检验法
路漫漫其修远兮, 吾将上下而求索
3.模型的预测失效
一方面,由于上述后果,使得模型不具有良好的统计性质;
【书上这句话有点问题】
其中 所以,当模型出现异方差性时,Y预测区间的建立将发生困 难,它的预测功能失效。
路漫漫其修远兮, 吾将上下而求索
三、异方差性的检验(教材P111)
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值,
(注意:其中的2完全可以是1)

计量经济学 异方差性 共46页

计量经济学 异方差性 共46页
HSK-异方差稳健标准差 HSK-异方差稳健t, F, LM统计量
3
什么是异方差
同方差假定意味着条件于解释变量,不可观测误 差的方差为常数
如果u 的方差随x变化,那么误差是异方差的。 例子:估计教育回报并且能力不可观测,认为能
力的方差随教育水平变化。
4
异方差图示
f(y|x)
wage
对异方差稳健F统计量
在异方差下,常规F统计量不再服从F分布。 HSK-稳健F统计量也称为Wald统计量
18
稳健的LM统计量
在有限制模型下进行OLS,保存残差ŭ 将每一个排除变量对全部未排除变量进行回归
(q个回归)并将每一组残差ř1, ř2, …, řq保存 将1向量对ř1 ŭ, ř2 ŭ, …, řq ŭ进行无截矩回归。 LM定义为n – SSR1其中 SSR1 为最后一次回归的
多元回归分析
y = b0 + b1x1 + b2x2 + . . . bkxk + u
6. 异方差(Heteroskedasticity,HSK)
1
本章提要
OLS中异方差的影响 OLS估计后“对异方差稳健”的统计推断 检验异方差 加权最小二乘估计
2
本课提要
什么是异方差 异方差的影响 OLS估计后的“对异方差稳健”统计推断
8
异方差存在时的方差
一个简单情况是bˆ1
b1
xi xi
xui x2
,所以对于给定的x,
Var bˆ1 xSiSTxx22i2,其中SSTx xi x2.
当同方差成立时Var(bˆ1)退化为2/SSTx。
White指出,xSiSTxx22uˆi2是Var(bˆj)的一个

6、计量经济学【异方差】

6、计量经济学【异方差】

给定显著性水平 下的 F 临界值),则表明第二 部分的误差项方差大于第一部分的误差项方差,即 两个子样本的方差水平显著不同,于是拒绝 H 0 , 接受 H1 ,即随机误差项存在异方差性。若 F F 则接受 H 0 ,即不存在异方差性。 例4.1.2:下面我们用戈德菲尔德—匡特检验法来 Y 检验例 4.1.1中模型: i 0 1 X i i 是否存在异方差 性。在例 4.1.1中,样本数据个数为 n 28 ,c n 4 为了使两个子样本的容量相同,从中间去掉 8 个数据
一、异方差性的含义与产生的原因
异方差性在许多应用中均存在,但主要出现在横断
面数据的分析中。例如,在考虑到了公司规模上的差 别之后,大公司比那些小公司有更大的利润方差。另 外,利润方差也可能取决于产品多样化、研究与开发 支出和产业特点,因此,类似规模的公司的利润方差 也可能不同。在分析家庭支出模式时,我们发现由于 更高的收入而允许更大的选择自由,高收入家庭通常 比低收入家庭对某些商品组的支出有更大的变差。
已学知识回顾:经典线性回归模型的基本假定
1、解释变量是确定性变量并且相互独立; 2、零均值同方差假定。随机误差项 i 的方差与 i 无关,为一个常数 2 ,即: E(i ) 0

Var ( i ) E i E ( i ) E ( i 2 ) 2
2
由于存在异方差 2 不再是常数,所以最小二乘估计 量不再是有效的。 (二)无法正确估计参数的标准误差
ˆ S (0 ) ˆ
2
n ( X i X )
X
2 i
2
ˆ S ( 1 )
( X i X )2
ˆ 2
二、异方差性的影响
(三)t 检验的可靠性降低 在异方差情况下,无法正确估计系数的标准误差 ˆ ˆ ˆ ˆ S (1 ) , S (1 ) 有偏误,用 t 统计量为 t ( 1 ) 1 来 ˆ) S ( 1 判断解释变量对被解释变量影响的显著性将失去意 义。 (四)模型的预测失效 随机误差项的方差与模型的预测区间密切相关; ˆ ˆ ˆ ˆ 预测区间:Y0 t 2 S (Y0 Y0 ), , Y0 t 2 S (Y0 Y0 ) 1 其中 ( X 0 X )2 2 ˆ

异方差性的后果

异方差性的后果
(*)
可以证明,在同方差假设下: R2为(*)的可决系数,h为(*)式解释变量的个数, 表示渐近服从某分布。
注意: 辅助回归仍是检验与解释变量可能的组合的 显著性,因此,辅助回归方程中还可引入解释 变量的更高次方。 如果存在异方差性,则表明确与解释变量的 某种组合有显著的相关性,这时往往显示出有 较高的可决系数以及某一参数的t检验值较大。 当然,在多元回归中,由于辅助回归方程中 可能有太多解释变量,从而使自由度减少,有 时可去掉交叉项。
注意: 在实际操作中人们通常采用如下的经验 方法: 不对原模型进行异方差性检验,而是直接 选择加权最小二乘法,尤其是采用截面数据 作样本时。 如果确实存在异方差,则被有效地消除了; 如果不存在异方差性,则加权最小二乘法 等价于普通最小二乘法
七、案例--中国农村居民人均消费函数
例1.4 中国农村居民人均消费支出主要由人均 纯收入来决定。 农村人均纯收入包括(1)从事农业经营的收入, (2)包括从事其他产业的经营性收入(3)工资性收 入、(4)财产收入(5)转移支付收入。
④在同方差性假定下,构造如下满足F分布的 统计量
nc 2 ~ e2i ( 2 k 1) nc nc F ~ F( k 1, k 1) 2 2 ~ 2 ( n c k 1) e 1i 2
⑤给定显著性水平,确定临界值F(v1,v2), 若F> F(v1,v2), 则拒绝同方差性假设,表明存 在异方差。 当然,还可根据两个残差平方和对应的子样 的顺序判断是递增型异方差还是递减异型方差。
如: 帕克检验常用的函数形式: ~ 2 ) ln 2 ln X ln( e f ( X ji ) 2 X e 或 i ji i ji
i
若在统计上是显著的,表明存在异方差性。

第06章条件异方差模型

第06章条件异方差模型
11z2z2 pzp0(6.1.9)
的根全部位于单位圆外。如果 i(i = 1, 2, …, p)都非 负,式(6.1.9)等价于 1 + 2 + … + p 1。
9
6.1.2 ARCH的检验
下面介绍检验一个模型的残差是否含有ARCH效应的 两种方法:ARCH LM检验和残差平方相关图检验。
它为ARCH(1)过程:
va ut)r(t201 ut2 1
通常用极大似然估计得到参数0, 1, 2, , k, 0, 1的有
效估计。
容易加以推广,ARCH (p)过程可以写为:
vu t) a t 2 r ( 0 1 u t 2 1 2 u t 2 2 p u t 2 p(6.1.8)
18
例6.2 中国CPI模型的ARCH检验
本例建立CPI模型,因变量为中国的消费价格指数(上年同月 =100)减去100,记为cpit;解释变量选择货币政策变量:狭义货 币供应量M1的增长率,记为m1rt;3年期贷款利率,记为Rt,样本 期间是1994年1月~2019年12月。由于是月度数据,利用X-12季节 调整方法对 cpit 和 m1rt 进行了调整,结果如下:
假设:
u ˆ t 2 ˆ0 ˆ 1 u ˆ t 2 1 ˆ2 u ˆ t 2 2 ˆp u ˆ t 2 p
其中,ût 表示从原始回归模型(6.1.1)估计得到的OLS残
差。
8
在 ARCH(p) 过程中,由于 ut 是随机的,ut2 不可能 为负,所以对于 {ut} 的所有实现值,只有是正的,才 是合理的。为使 ut2 协方差平稳,所以进一步要求相应 的特征方程
c t 1 . p 3 c t 1 i 5 0 p . 3 c t i 2 6 p 2 . 6 m 1 i r t 8 1 0 . 0 R t 2 6 u ˆ t

异方差性

异方差性

例5-1 -我国制造业利润函数模型表5-1列出了1998年我国主要制造工业销售收入Y与销售利润X的统计资料,请利用统计软件Eviews建立我国制造业利润函数模型。

表5-1 我国制造工业1998年销售利润与销售收入情况(1) 参数估计进入EViews软件包,确定时间范围;编辑输入数据;选择估计方程菜单,估计样本回归函数如下估计结果为9322.1528547.0)367.12()6165.0(1044.00335.12ˆ2==+=F R X yi i括号内为t 统计量值。

(2) 检验异方差性①图形分析检验A. 观察销售利润(Y )与销售收入(X )的相关图(图5-1):SCAT XY图5-3 我国制造工业销售利润与销售收入相关图从图中可以看出,随着销售收入的增加,销售利润的平均水平不断提高,但离散程度也逐步扩大。

这说明变量之间可能存在递增的异方差性。

B. 残差分析首先将数据排序(命令格式为:SORT 解释变量),然后建立回归方程。

在方程窗口中点击Resids 按钮就可以得到模型的残差分布图(或建立方程后在Eviews 工作文件窗口中点击resid 对象来观察)。

图5-4 我国制造业销售利润回归模型残差分布图5-4显示回归方程的残差分布有明显的扩大趋势,即表明存在异方差性。

②Goldfeld-Quant 检验A. 将样本按解释变量排序(SORT X )并分成两部分(分别有1到10共10个样本合19到28共10个样本)B. 利用样本1建立回归模型1,其残差平方和为1RSS =2579.587。

C. 利用样本2建立回归模型2,其残差平方和为2RSS =63769.67。

D. 计算F 统计量:12/RSS RSS F ==63769.67/2579.59=24.72。

取05.0=α时,查F 分布表得44.3)210,210(05.0=--F ,44.372.2405.0=>=F F ,所以存在异方差性③White 检验A. 建立回归模型:LS Y C X ,回归结果如图5-5。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档