第四章 异方差打印
chap4 异方差

4. 异方差用OLS 法得到的估计模型通过统计检验后,还要检验模型是否满足假定条件。
只有模型的假定条件都满足时,用OLS 法得到的回归系数估计量才具有最佳线性无偏特性。
当一个或多个假定条件不成立时,OLS 估计量将丧失上述特性。
第5-7章讨论当假定条件不成立时,对参数估计带来的影响以及相应的补救措施。
以下讨论都是在某一个假定条件被违反,而其他假定条件都成立的情况下进行。
分为5个步骤。
(1)回顾假定条件。
(2)假定条件不成立时对模型参数估计带来的影响。
(3)定性分析假定条件是否成立。
(4)检验(定量分析)假定条件是否成立。
(5)假定条件不成立时的补救措施。
本章介绍异方差的检验和修正方法。
4.1 异方差的概念在随机误差项u 满足同方差和没有序列自相关的假定下,u 的方差协方差矩阵Var(u ) 是一个对角矩阵,Var(u ) = σ 2I = σ 2⎪⎪⎪⎪⎪⎭⎫⎝⎛10101=⎪⎪⎪⎪⎪⎭⎫⎝⎛22200σσσ 4.1即Var(u )主对角线上的元素都是常数且相等,每一误差项的方差都是有限的相同值(同方差假定);且非主对角线上的元素为零(非自相关假定)。
当这两个假定不成立时,Var(u ) 不再是一个纯量对角矩阵,表示如下。
Var(u ) = σ 2 Ω = σ 2⎪⎪⎪⎪⎪⎭⎫⎝⎛TT T T T T σσσσσσσσσ (2)12222111211≠σ 2I 4.2 当误差向量u 的方差协方差矩阵主对角线上的元素不相等时,这意味着对应不同的随机变量,方差不同。
此时,称该随机误差系列存在异方差,即误差向量u 中的元素u t 取自不同的分布总体。
非主对角线上的元素表示误差项之间的协方差值。
比如 Ω 中的 σi j ,(i ≠ j )表示与第i 组和第j 组观测值相对应的u i 与 u j 的协方差。
若 Ω 非主对角线上的部分或全部元素都不为零,误差项就是自相关的。
本章讨论异方差。
第6章讨论自相关。
第四讲 异方差性

第4章 异方差性4.1 异方差性的含义与产生的原因4.1.1 异方差性的定义设线性回归模型为:t kt k t t t u x b x b x b b y +++++= 22110 (4.1.1)经典回归中所谓同方差是指不同随机误差项t u (n t ,2,1=)的方差相同,即:2)var(σ=t u如果随机误差项的方差不是常数,则称随机项t u 具有异方差性(heteroskedasticity ),即:2)var(t t u σ=≠常数(t=1,2,…n)异方差性的几何直观表示形式,可借助观测值的散布图表示。
以一元线性回归为例,在散布图上,就是样本残差平方2t e 随解释变量的变化而变化。
ox图(a) y图4.1.1 异方差性在散布图上的反映yxo图(b)图(d) oyyoxx图(c)4.1.2 产生异方差性的原因在计量经济研究中,异方差性的产生原因主要有1.模型中遗漏了某些解释变量 2.模型函数形式的设定误差 3.样本数据的测量误差 4.随机因素的影响4.2 异方差性的影响4.2.1 对模型参数估计值无偏性的影响以一元线性回归模型为例。
设一元线性回归模型为t t t u x b b y ++=10,随机误差项tu 的方差随解释变量的变化而变化:2)var(t t u σ=,其他条件不变。
此时:),0(~2t t N u σ。
在高斯——马尔可夫定理证明过程中曾经得到:t t u k b b ∑+=11ˆ,因此,111)()ˆ(b u E k b b E t t =∑+=。
这表明1b 满足无偏性。
同理可以证明0ˆb 也是0b 的无偏估计量。
由此可见,随机误差项存在异方差性,并不影响模型参数最小二乘估计值的无偏性。
4.2.2 对模型参数估计值有效性的影响在上述假定下参数1b 的估计值1ˆb 的方差为 )var()var()ˆvar(211tt t t u k u k b b ∑=∑+= 在随机误差项t u 同方差的假定下,则参数1b 的估计值1ˆb 的方差为 2222221)()ˆvar(x x k k b t tt -∑=∑=∑=σσσ在随机误差项t u 存在异方差条件下,假设参数估计值为*1ˆb ,2)var(t t u σ==2σλt (0〉t λ,t=1,2,…n ),此时,=)ˆvar(*1b 2222tt ttk k λσσ∑=∑2222t t t tk k k ∑∑⋅∑=λσ=221)ˆvar(tt t k k b ∑∑⋅λ比较上式两端,当122〉∑∑tt t k k λ时,有)ˆvar()ˆvar(1*1b b 〉 从而说明在随机误差项t u 存在异方差条件下,最小二乘估计量1ˆb 不再具有最小方差。
[数学]第四章放宽假定条件的模型
![[数学]第四章放宽假定条件的模型](https://img.taocdn.com/s3/m/557cc5f584254b35eefd3493.png)
X2
Y
2703.36 1550.62 1357.43 1475.16 1497.52 1098.39 1336.25 1123.71 1331.03 1127.37 1330.45 1388.79 1350.23 2703.36 1550.62
X1
1242.9 1068.8 1386.7 883.2 919.3 764.0 889.4 589.6 614.8 621.6 803.8 859.6 1300.1 1242.9 1068.8
ˆ 2 3.842 0.570 ln X 1 0.042 (ln X 1 ) 2 0.539 ln X 2 0.039 (ln X 2 ) 2 e
(1.36) (-0.64)
(064)
(-2.76)
(2.90)
R2 =0.4374
X2项与X2的平方项的参数的t检验是显著的,且
n R2 =31 0.4374=13.56
(-0.04)(0.10) (-1.11) R2 =0.4638
(0.21)
(-0.12)
(1.47)
0.043 ln X 1 ln X 2
似乎没有哪个参数的t检验是显著的 。但 n R2 =31*0.4638=14.38 =5%下,临界值 20.05(5)=11.07,拒绝同方差性
去掉交叉项后的辅助回归结果
变量的显著性检验中,构造了t统计量
其他检验也是如此。
3、模型的预测失效
一方面,由于上述后果,使得模型不具有良 好的统计性质;
所以,当模型出现异方差性时,参数OLS 估计值的变异程度增大,从而造成对Y的预测 误差变大,降低预测精度,预测功能失效。
四、异方差性的检验
检验思路:
4 违背基本假定问题(1)异方差性

Ci=0+1Yi+i
将居民按照收入等距离分成n组,取组平均数为样本 观测值。 • 一般情况下,居民收入服从正态分布:中等收入 组人数多,两端收入组人数少。而人数多的组平均 数的误差小,人数少的组平均数的误差大。 样本观测值的观测误差随着解释变量观测值的不 同而不同,往往引起随机项的异方差性,且呈U形。
1 1 wi ˆ exp(93 .20 25 .981 ln X i 2 1.701(ln X i 2 ) 2 fi
1/sqr(exp(93.20-25.98*log(x2)+1.701*(log(x2))^2))
(2)异方差稳健标准误法
估计的参数 与普通最小 二乘法相同, 只是由于参 数的标准差 得到了修正, 从而使得t 检验值与普 通最小二乘 法不同
~ 2 ( n c k 1) e2 i 2 nc nc F ~ F( k 1, k 1) 2 2 ~ 2 ( n c k 1) e1i 2
3、怀特(White)检验
Yi 0 1 X i1 2 X i 2
建立辅助 回归模型 以二元模型为例
例4.1.1:截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i Yi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入。 高收入家庭:
储蓄的差异较大;
低收入家庭: 储蓄则更有规律性,差异较小。
i的方差呈现单调递增型变化
例4.1.2: 以绝对收入假设为理论假设、以截面数据 为样本建立居民消费函数:
Var( i ) E ( ) f ( X ij )
2 i 2 i
2
1 Yi 0 f ( X ij ) k
1 1 f ( X ij ) 1 X ik f ( X ij )
第四章条件异方差模型

= Evt E ( 0 1 t21 )1/ 2 0 由于 Evt , vt i 0 ,则有
E t t i 0, i 0
条件异方差模型介绍
2) t 的无条件方差是
E t2 E[vt2 ( 0 1 t21 )] Evt2 E ( 0 1 t21 ) 0 /(1 1 )
第三章 条件异方差模型
模型提出背景
单位根检验 时间序列的加法、乘法模型, X12 季节调整 ARIMA(时间序列)模型 线性时间序列 SARIMA(季节时间序列)模型 GAR(广义自回归)模型 BL(双线性)模型 非线性时间序列 TAR、STAR(门限自回归、平滑转移)模型 ARCH、GARCH(自回归条件异方差)模型 向 量 序 列 波动模型 SV(随机波动)模型 ACD、 SCD(自回归、随机条件久期)模型 VAR、 VEC(向量自回归、误差修正)模型 单方程(线性、非线性) 、分位数回归模型 回 归 分 析 时间序列回归 联立方程模型(结构、简化型、递归模型) PANEL(面板数据)模型、空间计量模型 DS(离散选择)模型、有序响应、计数模型 LDV(受限因变量)模型(删失、截断模型) 蒙特卡罗模拟技术
xt f (t , xt 1 , xt 2 , ) t t t t 2 2 2 m t m 0 1 t 1 t
23
0 0, i 0
ARCH效应检验方法 ARCH_LM检验
H 0 : 0 1 2 m 0 H1 : 0 0 or 1 0 or m 0
16
条件异方差模型介绍
ARCH 模型 Engle(1982) 提出可以同时对一个序列的均值和方差建 模方法。 yt 1 的条件方差是: Var ( yt 1 yt ) Et ( yt 1 a0 a1 yt ) 2
第4讲 异方差与自相关

(2)WLS法(加权最小二乘法)
vwls 是进行加权最小二乘估计的命令,y x1 x2 …依次填 入被解释变量和解释变量,if是条件语句,in是范围语句, weight是权重语句,options的内容反映在下表中:
在模型修正中,很重要的一步就是如何计算标准差序列, 下面介绍具体做法:
实验操作指导
根据本实验中模型的具体形式基本回归命令形式 如下: reg D.rs LD.r20 输入该命令表示rs的一阶差分项对r20的滞后一阶 差分项进行回归
3、自相关检验 (1)作图法 在Stata中通过描绘残差项的自相关图与偏自相关图来判 断模型的自相关情况。 模型回归之后,在Stata命令窗口输入如下命令生成模型 的残差项: predict e, res 然后输入如下命令来生成模型的残差图: scatter eps time 使用散点图绘制命令scatter在这里绘制横轴是时间变量 time,纵轴是模型残差项eps的散点图。 在本实验中,输入如下命令得到图8.16残差图: scatter e month 此命令表示绘制的是以月为时间变量的残差图。 此图横轴为时间,可以看到残差项随时间成连续变化(在 一段时间内残差在0的同一侧),是典型的具有正自相关 的模型。
第2节 自相关和可行广义最小二乘法
实验基本原理
自相关是在运用计量经济学分析现象、建立模型时又一违反球形扰动 项假设的重要问题,即若存在i不等于j,使 , 就称模型存在 自相关问题。从扰动项的协方差矩阵来看自相关问题就是,非对角线 的元素不全为零。如果所建模型出现自相关,则模型的估计会出现以 下问题:
(2)对回归方程进行估计 在stata命令窗口中输入如下命令:
根据实验结果图回归方程具体化为:lntc=3.57+0.72lnq+0.46lnpl-0.22lnpk + 0.43lnpf;根 据结果图中给出的p值看出,在10%和5%的置信 度下模型都只有lnq和lnpf的系数和常数项通过了t 检验。
第四章 异方差性:软件操作方法

第四章异方差性本章的重点内容总结:异方差检验及修正一、异方差的检验方法一:图示法步骤:首先,对被解释变量和解释变量进行回归:LS Y C X其次,在主菜单中,点击Quick/Graph 得到对话框“Series List”,在对话框中现列出横坐标X,同时列出纵坐标Y,点击“OK”,出现“Graph”对话框,再点击“Show Options”出现对话框“Graph Options” ,在左上角图形类型Graph Type 下拉列表里选择“Scatter Diagram,在右下角散点图项目下选择“Regression Line,再点击“OK”,即可得到X 、Y之间的散点图。
这是随机误差项存在异方差的初步经验证据。
此外,同理也可以做出解释变量X与残差e2之间的散点图。
方法二:G-Q检验法(详细内容参见教科书及本章案例)注意:该方法适用于样本容量较大,且异方差为单调递增或单调递减的情况。
另外,G-Q检验需要按某一被认为有可能引起异方差的解释变量观测值的大小排序,因此,可能需要对各个解释变量进行轮流试验。
构造一个G-Q 检验的F 统计量与F 临界值的实现方法: 操作如下: 以截面数据n=20为例(去掉中间4个观察值,即c=4) Smpl 1 8 LS Y C X Scalar sig1=@SE Smpl 13 20 LS Y C X Scalar sig2=@SE 构造G-Q 统计量建立检验结果的储存向量: COEF(2)GQ第一个放置F 统计量: GQ(1)=(sig1^2/sig2^2) 第二个放置F 临界值: GQ(2)=@QFDIST(.95,6,6)以上操作步骤结束后,在当前工作簿中便出现αgq 标志,双击此标志即可显示出F 统计量和F 临界值的计算结果。
方法三:怀特(White )检验优点:怀特检验异方差不需要对解释变量进行排序,且对任何形式的异方差都适用。
1.首先,对二元线性回归模型作普通最小二乘回归,并得到残差平方(e 2)序列2.其次,作如下辅助回归方程:εααααααi i i iii i ix x x x x x e++++++=215241322110222若 nR 2>χ2(h )(注意: h 为模型中卡方分布的解释变量个数,上述辅助回归模型中h=5),则表明二元线性回归模型存在异方差性。
第四讲 异方差性

第四讲 放宽基本假定的模型学习目标:1. 理解异方差性、序列相关性、多重共线性和随机解释变量问题;2. 掌握异方差性的检验方法(图示检验法、G-Q 检验和怀特检验法)以及异方差的修正方法(加权最小二乘法);3. 掌握序列相关性的检验方法(图示检验法、回归检验法、D.W.检验法和LM 检验法)以及异方差的修正方法(广义最小二乘法和广义差分法); 4. 理解虚假序列相关性问题;5. 掌握多重共线性的检验方法以及克服多重共线性的方法(排除法和差分法) 背景:• 基本假定违背主要 包括: (1)随机误差项序列存在异方差性; (2)随机误差项序列存在序列相关性; (3)解释变量之间存在多重共线性;(4)解释变量是随机变量且与随机误差项相关的随机解释变量问题; (5)模型设定有偏误;(6)解释变量的方差不随样本容量的增加而收敛。
• 计量经济检验:对模型基本假定的检验§4.1 异方差性一、异方差的概念对于模型如果出现即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性(Heteroskedasticity)。
同方差是指 Var (μi )=σ2iki k i i i X X X Y μββββ++⋅⋅⋅+++=22110Var i i ()μσ=2二、异方差的类型同方差:σi2 = 常数≠ f(X i) ——不随X的变化而变化异方差:σi2 = f(X i)异方差一般可归结为三种类型:(1)单调递增型:σi2随X的增大而增大(2)单调递减型:σi2随X的增大而减小(3)复杂型:σi2与X的变化呈复杂形式三、实际经济问题中的异方差性例1:截面资料下研究居民家庭的储蓄行为:Y i=β0+β1X i+μiY i第i个家庭的储蓄额X i:第i个家庭的可支配收入。
高收入家庭:储蓄的差异较大低收入家庭:储蓄则更有规律性,差异较小μi 包含人们的储蓄心理、消费习惯μi的方差呈现单调递增型变化例2:以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:C i=β0+β1Y i+μi将居民按照收入等距离分成n组,取组平均数为样本观测值。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四 异方差(Heterscedasticity) 第一节 异方差性 在线性回归模型中,我们首先做了GM假定,其中有一个假定就是假定误差
项误差是相同的。即:22
uiiuEuVar。而在实际中这一假定经常不被满足,那
么在这种情况下,我们想知道的是: 1、异方差造成什么样的结果? 2、异方差的性质是什么? 3、怎样去诊断它? 4、有什么补救措施? 由于经济现象是错综复杂的,所以用等方差假定在许多情况下不符合实际情况。比如说:
例1、研究家庭的收入和储蓄的关系,用iX表示第I户的收入量,iY表示第I户的储蓄量,储蓄函数可以用模型表示为:
iiiuXbbY10 这一问题中,随机项iu等方差假定是不符合实际情况的,因为在储蓄行为中,高收入家庭的储蓄平均来说高于低收入的家庭,但是低收入家庭的储蓄差异性比较小,而高收入家庭的储蓄差异性比较大,这是因为低收入的家庭,他们除了必要的支出之外剩余比较少,为了某种目的而储蓄(如为了购买高档商品,准备喜事之类的。)所以,他们的储蓄形势较有规律,差异很小。而收入高的家庭,由于他们的收入高,不必要的支出外剩余很多,就有更大的使用选择余地。 例2、边错边改进模型(error-learning models).我们用函数模型表示打字出错个数与用于练习打字的时间数的关系。
iiiuXbbY10 其中:iY表示出错个数;iX表示练习打字的小时数。 U表示什么?表示除了之外的所有因素对出错个数的影响。这些影响随时间而逐渐减弱。换句说Y的变小是由于U的变小所至。 异方差产生的原因: 因为随机项包括了测量误差和模型中被省略的一些因素对因变量的影响。这样一方面由于解释变量越大,测量误差就会越大。另一方面,测量误差又有可能随着时间的变化而变化,比如测量技术与收集资料的改进,测量误差有可能较少。再者,模型中被省略的变量中,有许多变量随解释变量的变化而变化。
第二节 异方差性的后果 在存在异方差的情况下,如果我们还是用原来的OLS对参数进行估计。就会得到一个线性无偏但是并不满足最小方差的估计量。 一、线性和无偏性 为了简单期间,我们来研究一元线性回归, iiiuXY10 可以得到参数1b的估计量
1ˆb=2iiixyx=iiukb1
其中 2iiixxk 所以线性性肯定不会改变。 同样无偏性也不会改变。 二、有效性: 1、异方差参数OLS估计的方差增大:
对于参数1b,其方差应该是:
22221)(ˆvariiixxb
证明:22)()ˆ()ˆ(iiukEE =)(22jijijiiiuukkukE=22iik=2222)(iiixx
这显然不同于同方差假定下的常用方差公式: 221ˆvar
iu
x
可以证明在异方差存在的情况下,我们如果还是用原来的OLS对参数进行估计,将会出现:估计量的方差增大。 2、加权最小二乘估计的方差:
iiiiiuX10Y则方程变换为:
***1*0*iiiuXY此方程为同方差1)(/1)/(iiiiuEuE
而此方程的残差平方和为:2*1*02)](ˆ)1(ˆ)[()(iiiiiiiXYuQ
对1ˆ求导:0)1)]((ˆ)1(ˆ)[(2*1*0iiiiiiXY 01)](ˆ1(ˆ)[(2*1*0iiiiii
XY
解得:2*1)())(())(())((iiiiiiiiiiiiXwXwwYwXwYXww
)())(()(22*12iiiiiiXwXwww
其中:iiw/1
iiiiiiiwwXXw,)()(1)(22
*12
而)ˆ(12=2222)(iiixx, 令:****,,,YYyXXxwYwYwXwXiiiiiiiiii 2*
***1ii
iii
xw
yxw
3.系数的最小二最小二乘估计量失去有效性 (1)可以证明:)ˆ(12>)ˆ(*12,二者的比值可以证明大于1。
(2)理解加权的意义:由2*1*02)](ˆ)1(ˆ)[()(iiiiiiiXYuQ 可以看出WLS与OLS相比是在对数据的处理上,OLS对每个样本的iuˆ都给与相同的权重,前提是iu的方差都差不多,同方差,iu对1的影响相同。但WLS对于产生较大iuˆ以较小的权重,对较小iuˆ以较大的权重,从而使RSS比OLS的更小。 三、出现异方差时使用OLS的后果: 1、忽略异方差的OLS估计:
(1)如在有异方差的情形下,我们不但使用了1ˆ,而且继续使用同方差性公式
221ˆvar
iu
x
,这是经常发生的严重事情。OLS回归软件,忽略异方差时会按
221ˆvar
iu
x
给出方差,这是一个有偏的估计量,平均而言和真正的方差2222
)(iiixx
相比不估就是低估。同时2ˆ22neiu已经不是2u的无偏估计量,所以
统计推断会产生严重的误导。 2、具体而言,由于方差过大,预测时置信区间过宽,预测不准;而且此时的t
检验)ˆ(ˆiisT,由于异方差的存在已经不是t分布了,所以对估计量的t检验失效。同样F检验也一样。
第三节 异方差的诊断 计量经济学检验有两种基本方法:图示法和解析法导出检验统计量的解析式,根据一些准则,进行检验。例如:检验异方差的Goldfeld-Quandt检验
一,残差图法 1、异方差就是随机项的方差与解释变量的变化有关,因此我们可以用因变量Y和解释变量x的散点图。若散点图出现随着解释变量变化而变化,则随机项出现了异方差。
2、也可以用残差图即2i与x的散点图,在多个解释变量时可作残差2i与因变量
或者残差2i与人为何异方差有关的x的散点图。
有图 3、怎样通过Eviews作x- e2 散点图 1)、键入 LS y c x 作回归 2)、键入 GENR E1=resid 调用残差 3) 键入 GENR E2=E1^2 生成残差平方 4)、键入 SCAT E2 X 或 SCAT E1 X 如果呈现出某种有规律的分布,说明残差中蕴涵作模型(1)未提取净的信息,或(2)可能存在异方差或自相关,或(3)设定有误。
二、戈德菲尔特—夸特(Goldfeld—Quandt)检验 戈德菲尔特—夸特(Goldfeld—Quandt)检验,也称为G—Q检验。这种检验适
合于大样本检验,随机项iu的方差随着一个解释变量的增加而增大。检验的前提
是要求随机项iu不存在序列相关。检验步骤如下: 1、将解释变量观测值iX按大小的顺序排列,被解释变量观测值iY保持原来与解释变量iX的对应关系。 2、按照上述顺序排列的观测值,把位于中间的c个删除,这里删除的数目c是Goldfeld和Quandt通过实验的方法确定的。对于30n时,删去的中心观测
值数目为整个观测值数目的四分之一最合适,比如说,当8,30cn。将剩下
的n-c个观测值划分为大小相等的两个子样本,每个子样本的容量分别为2cn,其中以个子样本是相应的观测值iX较大的部分,另一部分是相应的观测值iX较小的部分。 3、对于这两个子样本分别求出回归方程,并计算出相应的残差平方和。设
211ieRSS为iX较小值的子样本的残差平方和,222ieRSS为iX较大值的子
样本的残差平方和,它们的自由度均为kcn2,其中k为模型中参数的个数。 4、构造统计量
kcnkcnFRSSRSSkcnRSSkcnRSSF2,2~
)2(
)2(
121
2
5、查出显著性水平为的临界值,如果: FF,则拒绝原假设,接受异方差性。
FF,则接收原假设,接受模型不存在异方差性。 6、Goldfeld-Quant检验在EViews上的实现 (1)用SORT X 以X为条件排序 (2)用SMPL命令定义两个子样 (3)用LS命令进行两次回归,计算出残差平方和(可以直接读出)与自由度 (4)进行F检验 7、Goldfeld-Quant检验适用条件:G-Q检验以F检验为基础,适用于样本容量较大、异方差递增或递减的情况 8、例子: 三、怀特检验:(white heteroskedasticity)
1、思想:为找到2i与X的原因,把ie与所有解释变量iX的二次项作辅回归求
出2R。 假如模型有三个自变量,
的关系与此确定哪一回归系数显著,借回归,判断分别对那么用xexxxxxxxxxxxxeiiixxx3231212322213212321,,,,,,,, ,,,ˆ