第4章 违背经典假定的回归模型-异方差
第4章 违背经典假定的回归模型-异方差祥解

R2 0.785456 R 2 0.774146
F 69.56003
式中 Y 表示卫生医疗机构数(个), X表 示人口数量(万人)。
2018/11/28 2
模型显示的结果和问题
●人口数量对应参数的标准误差较小; ● t统计量远大于临界值,可决系数和修正的可决系 数结果较好,F检验结果明显显著; 表明该模型的估计效果不错,可以认为人口数量 每增加1万人,平均说来医疗机构将增加5.3735个。 然而,这里得出的结论可能是不可靠的,平均说来 每增加1万人口可能并不需要增加这样多的医疗机构, 所得结论并不符合真实情况。 有什么充分的理由说明这一回归结果不可靠呢?更 为接近真实的结论又是什么呢? 异方差问题
都被虚假地夸大,因此所得结果是不可信的。为
什么呢?
2018/11/28
自相关问题
5
第四章 违背经典假定的回归模型
本章讨论四个问题:
●异方差性 ●自相关 ●多重共线性 ●随机解释变量
2018/11/28
6
第一节 异方差性 本节讨论四个问题:
●异方差的实质和产生的原因 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救
2018/11/28 14
三、异方差的后果
(一)对参数估计统计特性的影响 1、参数估计的无偏性和线性性仍然成立 参数估计的无偏性仅依赖于基本假定中的零均值 假定(即 E(ui ) 0 )。所以异方差的存在对无偏 性的成立没有影响。 2、参数估计的方差不再是最小的 同方差假定是OLS估计方差最小的前提条件,所 以随机误差项是异方差时,将不能再保证最小二 乘估计的方差最小。
u 有相同的
方差,所以利用分析 Y 与 X 的相关图形,可以初略
地看到 Y 的离散程度与 X 之间是否有相关关系。 如果随着 X 的增加, Y 的离散程度为逐渐增大(或 减小)的变化趋势,则认为存在递增型(或递减型) 的异方差。
4 违背基本假定问题(1)异方差性

Ci=0+1Yi+i
将居民按照收入等距离分成n组,取组平均数为样本 观测值。 • 一般情况下,居民收入服从正态分布:中等收入 组人数多,两端收入组人数少。而人数多的组平均 数的误差小,人数少的组平均数的误差大。 样本观测值的观测误差随着解释变量观测值的不 同而不同,往往引起随机项的异方差性,且呈U形。
1 1 wi ˆ exp(93 .20 25 .981 ln X i 2 1.701(ln X i 2 ) 2 fi
1/sqr(exp(93.20-25.98*log(x2)+1.701*(log(x2))^2))
(2)异方差稳健标准误法
估计的参数 与普通最小 二乘法相同, 只是由于参 数的标准差 得到了修正, 从而使得t 检验值与普 通最小二乘 法不同
~ 2 ( n c k 1) e2 i 2 nc nc F ~ F( k 1, k 1) 2 2 ~ 2 ( n c k 1) e1i 2
3、怀特(White)检验
Yi 0 1 X i1 2 X i 2
建立辅助 回归模型 以二元模型为例
例4.1.1:截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i Yi:第i个家庭的储蓄额 Xi:第i个家庭的可支配收入。 高收入家庭:
储蓄的差异较大;
低收入家庭: 储蓄则更有规律性,差异较小。
i的方差呈现单调递增型变化
例4.1.2: 以绝对收入假设为理论假设、以截面数据 为样本建立居民消费函数:
Var( i ) E ( ) f ( X ij )
2 i 2 i
2
1 Yi 0 f ( X ij ) k
1 1 f ( X ij ) 1 X ik f ( X ij )
违背经典假设的回归模型汇总

rs
1Hale Waihona Puke n6 n2 1n
di 2
i 1
其中,n为样本容量,d为等级的差数。
第三步,对等级相关系数进行显著性检验。在n>8下,
用下式对样本等级相关系数进行t检验。检验统计量为
t rs n 2 1 rs 2
如果, t t / 2 n 2 可以认为异方差性问题不存在,
反之,说明自变量与残差之间存在系统影响关系, 异方差性问题存在。(等级相关系数可以如实反映 单调递增或单调递减趋势的变量之间相关性,而简 单相关系数适宜衡量直线趋势变量之间相关性)
情形之二:数据采集技术的改进带来差 错率的减小;
5
情形之三:回归模型的设定不正确,如 遗漏了重要变量;
情形之四:因为存在异常值; 最常见情形:采用截面数据作样本的经
济计量学问题,由于在不同样本点上解 释变量以外的其他因素的差异较大,所 以往往存在异方差性。
6
异方差性的后果
一旦出现异方差性,如果仍采用普通最 小二乘法估计模型参数。会产生以下不 良后果:
Vari u 2
i 1, 2, , n
这一假设称为方差齐性假定或同方差性假 定。
3
如果回归模型中的随机误差项的方差不是 常数,即
Vari i 2
i 1, 2, , n
对于不同的样本点,随机误差项的方差不 再是常数,则称随机误差项的方差非齐 性或为异方差。
4
实际中的异方差性
情形之一:随机误差项的方差是随着某 一个解释变量观测值的变化而呈现规律 性的变化;例如,越来越小,边错边改 学习模型-在学习过程中行为误差随时 间而减少;随着收入的增加,储蓄的变 异越来越大;
释变量描点。
9
高级计量第4章 违背基本假定问题(2)

一、多重共线性的概念 二、多重共线性的后果 三、多重共线性的检验 四、克服多重共线性的方法 五、例题 六、分部回归与多重共线性
一、多重共线性的概念
1、多重共线性
Yi 0 1 X 1i 2 X 2i k X ki i
i 1,2,, n
Cov( X 2i, is ) E( x2i is ) 0 s 0
(3) 随机解释变量与随机误差项同期相关
Cov( X 2i, i ) E( x2i i ) 0
2、实际经济问题中的随机解释变量问题 • 在实际经济问题中,经济变量往往都具有随机性。
• 但是在单方程计量经济学模型中,凡是外生变量都 被认为是确定性的。
y ( 1 2 ) x1
这时,只能确定综合参数1+2的估计值:
2、近似共线性下OLS估计量非有效
• 近似共线性下,可以得到OLS参数估计量,但
参数估计量方差的表达式为
ˆ ) 2 (XX) 1 Cov(β
由于|X’X|0,引起(X’X) -1主对角线元素较大, 使参数估计值的方差增大, OLS 参数估计量非有 效。
具体可进一步对上述回归方程作F检验:
构造如下F统计量
Fj R2 j . /( k 2) (1 R ) /(n k 1)
2 j.
~ F (k 2, n k 1)
式中:Rj•2为第j个解释变量对其他解释变量的回归方
程的决定系数,
若存在较强的共线性,则Rj•2较大且接近于1,这时( 1- Rj•2 )较小,从而Fj的值较大。 因此,给定显著性水平,计算F值,并与相应的临界 值比较,来判定是否存在相关性。
ˆ (XX D) 1 XY β
违背模型基本假设汇总

建立违背基本假定回归模型存在的基本问题:
OLS法是否还适用?所得参数的OLS估计
量是否还具有优良的统计性质?变量显著性t 检验和方程显著性F检验还有效吗?
如果OLS法失效,有哪些补救措施? 如何检验模型是否违背基本假定条件?
本章主要讨论不满足基本假定中的某一条, 而其余假定条件均成立时,多元线性回归模型参 数的有效估计和检验问题。
6
一、 多重共线性的概念
在计量经济学中所谓的多重共线性,包括 完全的多重共线性和不完全的多重共线性 对于线性回归模型
Yi 0 1X1i 2 X 2i k X ki u(i i 1, 2, , n)
即 Y X u
7
完全的多重共线性:解释变量 X1, X 2 ,, X k 之间存在完全的多重共线性是指 Rank(X ) k 1 ,
12
➢实际经济问题中的多重共线性
一般地,产生多重共线性的主要原因有以下三个 方面:
(1)经济变量相关的共同趋势
时间序列样本:经济繁荣时期,各基本经济变 量(收入、消费、投资、价格)都趋于增长;衰退时 期,又同时趋于下降。
横截面数据:生产函数中,资本投入与劳动力
投入往往出现高度相关情况,大企业二者都大,小企
4.E+11 3.E+11
GDP
4.E+11
GDP
3.E+11
2.E+11
2.E+11
1.E+11
0.E+00 80 82 84 86 88 90 92 94 96 98 00 02
1.E+11
0.E+#43;11
GDP(-1) 15
3.E+11 4.E+11
违背经典假设的线性回归模型及估计

(55)
估计辅助回归模型(55) ,计算未调整可决系数 RA 。 3)提出检验假设 原假设 H 0 : 1 2 p 0 ,即原模型中的 t 不存在 ARCH 效应; 备择假设 H1 : i ( i 1,2,, p )不全为零,即原模型中的 t 存在 ARCH 效应。 4)构造检验统计量 在原假设下,即 t 不存在 ARCH 效应时,LM 检验统计量
2
(Park 检验)是否与解释变量 xt 存在函数关系,若存在某种显著的函数关系,则表明异方 差性的存在;若不存在,则表明异方差性不存在。 检验步骤: 1)利用普通最小二乘法对样本观测值进行回归,估计模型参数并求得残差 et ; 2)分别建立残差的绝对值 et (Glejser 检验)或残差平方 et (Park 检验)对每个解 释变量的回归方程; 3)检验各回归模型参数的显著性; 4)判别:若残差序列与解释变量的回归模型参数显著地不为零,则表明存在异方差; 反之,若模型参数显著地为零,则随机误差项满足同方差性。 检验通常假设的几种函数形式: 1)Glejser 提出的假设函数形式
2 2 2
检验步骤: 1)对原模型作最小二乘估计,计算残差 et 和 et 1 , et 2 , 2)定义 p 阶辅助回归模型
2 2
et 2 0 1et 12 2et 2 2 pet p 2 t
( t p 1, p 2,, n )
2
et 0 1 xt h t
2)Park 提出的假设函数形式
( h 1, 2, 1/ 2, )
et 2 0 xt1 et
或 Glejser 检验的特点: 1)既可检验递增型异方差,也可检验递减型异方差; 2)当存在异方差时,能够发现了异方差的具体表现形式; 3)对样本容量要求也较大,且计算量相对较大; 4)当原模型为多元回归模型时,可以把 et 或 et 拟合成多变量回归形式。
3.计量检验复习题(经典试题,举一反三)

第四章 计量检验复习题一、单选题1、如果回归模型违背了同方差假定,最小二乘估计量__A __。
A .无偏的,非有效的 B. 有偏的,非有效的 C .无偏的,有效的 D. 有偏的,有效的 2、Goldfeld-Quandt 方法用于检验__A __。
A .异方差性 B. 自相关性 C .随机解释变量 D. 多重共线性 3、DW 检验方法用于检验__B __。
A .异方差性 B. 自相关性 C .随机解释变量 D. 多重共线性4、在异方差性情况下,常用的估计方法是__D __。
A .一阶差分法 B. 广义差分法 C .工具变量法 D. 加权最小二乘法5、在以下选项中,正确表达了序列自相关的是__A __。
ji u x Cov D ji x x Cov C j i u u Cov B j i u u Cov A j i j i j i j i ≠≠≠≠≠=≠≠,0),(.,0),(.,0),(.,0),(.6、如果回归模型违背了无自相关假定,最小二乘估计量__A __。
A .无偏的,非有效的 B. 有偏的,非有效的 C .无偏的,有效的 D. 有偏的,有效的7、如果回归模型中解释变量之间存在完全的多重共线性,则最小二乘估计量__A __。
A .不确定,方差无限大 B. 确定,方差无限大 C .不确定,方差最小 D. 确定,方差最小 8、用t 检验与F 检验综合法检验__A __。
A .多重共线性 B. 自相关性 C .异方差性 D. 非正态性 9、在自相关情况下,常用的估计方法__B __。
A .普通最小二乘法 B. 广义差分法 C .工具变量法 D. 加权最小二乘法10、在不完全多重共线性不严重的情况下(其它条件不变),则仍可用模型进行__C __。
A .经济预测 B. 政策评价C .结构分析 D. 检验与发展经济理论 11、White 检验方法主要用于检验__A __。
A .异方差性 B. 自相关性 C .随机解释变量 D. 多重共线性 12、ARCH 检验方法主要用于检验__A __。
4违背基本假定的情况-异方差性

4 求得权矩阵W的一种实用方法
从前面的推导过程看,权矩阵来自于原模型 (4.1)残差项 ε 的方差-协方差矩阵,因此仍然 可对原模型(4.1)首先采用OLS法,得到随机误 差项的近似估计量,以此构成权矩阵的估计量, 即
e12 ˆ W 2 e2 , n2 e 1/ e1 1/ e2 1 D 1/ en
Sig. 0.000
Coefficients(a) Unstandardized Coefficients Standardized Coefficients Model B Std. Error Beta t Sig. 1 (Constant) -648.124 118.163 -5.485 0.000 X居民收 0.085 0.005 0.955 17.342 0.000 a. Dependent Variable: Y (储)
地位不同,误差项方差大的项,在平方和中的作用大, 回归线被拉向方差大的项。加权最小二乘法是在平方 和中加入一个适当的权数 ,以调整各项在平方和中 wi 的作用。)
2 一个例子
例如,如果在检验过程中已经知道:
var( i ) E ( i ) f ( x j )
2 2 i
2
即随机误差项的方差与解释变量 x j 之间存在相 关性,那么可以用 f ( x j ) 去除原模型,使之变 成如下形式的新模型
(4.4)
5 加权最小二乘法具体步骤
①选择普通最小二乘法估计原模型,得到随机误差
~ 项的近似估计量ei ;
~ ② 建立1 | ei | 的数据序列;
1 ~ ③ 选择加权最小二乘法,以 | ei | 序列作为权,进
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013-12-10
8
异方差性的含义
设模型为
Yi 1 2 X 2i 3 X 3i ... k X ki ui i 1,2,..., n
如果对于模型中随机误差项 u i 有:
Var(ui ) i2 , i 1, 2,3,..., n (4.3) 则称具有异方差性。进一步,把异方差看成是由于某 个解释变量的变化而引起的,则
u 有相同的
方差,所以利用分析 Y 与 X 的相关图形,可以初略
地看到 Y 的离散程度与 X 之间是否有相关关系。 如果随着 X 的增加, 的离散程度为逐渐增大(或 Y 减小)的变化趋势,则认为存在递增型(或递减型) 的异方差。
2013-12-10 19
图形举例1
用1998年四川省各地市州农村居民家庭消费支出与家庭纯 收入的数据,绘制出消费支出对纯收入的散点图,其中用 X Y1 表示农村家庭消费支出, 1 表示家庭纯收入。
2 n -c e2i / [ - k] 2
(4.6)
2013-12-10
28
(5)判断 给定显著性水平 ,查 F分布表得临界值 F n-c n-c ( ) 计算统计量 F * 。
( 2 -k , 2 -k )
如果
F F n-c
*
n-c ( -k , -k ) 2 2
( )
则拒绝原假设,接受备择假设,即模型中的 随机误差存在异方差。
Var(ui ) i2 2 f ( X i )
2013-12-10
(4.4)
9
图形表示
概 率 密 度
Y
X
2013-12-10
10
2013-12-10
11
二、产生异方差的原因
(一)模型中省略了某些重要的解释变量
假设正确的计量模型是: Yi 1 2 X 2i 3 X 3i ui
2013-12-10
27
在原假设成立的条件下,因 e1i 和 e2i 自由度均 χ 2 分布,可导出: 为 [(n - c) / 2] - k ,
2 2
2 e2i n -c n -c F* = = 2 ~ F( - k, - k) 2 2 2 n -c e1i / [ - k ] e1i 2
(2)求辅助函数 et2 作为异方差 σt2 的估计,并建立 用残差平方 2 2 X 2t , X 3t , X 2t , X 3t , X 2t X 3t 的辅助回归,即
ˆt2 = α1 +α2 X 2t +α3 X 3t +α4 X 2t +α5 X32t +α6 X 2t X3t (4.8) ˆ ˆ ˆ ˆ 2 ˆ ˆ e
2013-12-10 3
引子2:t检验和F检验一定就可靠吗?
研究居民储蓄存款 Y 与居民收入 X 的关系:
Yt = 1 + 2 X t + ut
用普通最小二乘法估计其参数,结果为
ˆ Yt = 27.9123+ 0.3524 Xt
(1.8690) (0.0055)
t = (14.9343) (64.2069)
R2 0.785456 R 2 0.774146
F 69.56003
式中 Y 表示卫生医疗机构数(个), X表 示人口数量(万人)。
2013-12-10 2
模型显示的结果和问题
●人口数量对应参数的标准误差较小; ● t统计量远大于临界值,可决系数和修正的可决系 数结果较好,F检验结果明显显著; 表明该模型的估计效果不错,可以认为人口数量 每增加1万人,平均说来医疗机构将增加5.3735个。 然而,这里得出的结论可能是不可靠的,平均说来 每增加1万人口可能并不需要增加这样多的医疗机构, 所得结论并不符合真实情况。 有什么充分的理由说明这一回归结果不可靠呢?更 为接近真实的结论又是什么呢? 异方差问题
2013-12-10 29
2、检验的特点
●要求大样本 ●异方差的表现既可为递增型,也可为递减型 ●检验结果与选择数据删除的个数 c 的大小有关 ●只能判断异方差是否存在,在多个解释变量的 情形下,对哪一个变量引起异方差的判断存在局 限。
2013-12-10
30
(三)White检验
1、基本思想:
不需要关于异方差的任何先验信息,只需要在大 样本的情况下,将OLS估计后的残差平方对常数、 解释变量、解释变量的平方及其交叉乘积等所构 成一个辅助回归,利用辅助回归建立相应的检验 统计量来判断异方差性。
都被虚假地夸大,因此所得结果是不可信的。为
什么呢?
2013-12-10
自相关问题
5
第四章 违背经典假定的回归模型
本章讨论四个问题:
●异方差性 ●自相关 ●多重共线性 ●随机解释变量
2013-12-10
6
第一节 异方差性 本节讨论四个问题:
●异方差的实质和产生的原因 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救
2 σt2 = α1 +α2 X 2t +α3 X 3t +α4 X 2t +α5 X 32t +α6 X 2t X 3t +vt
其中 vt为随机误差项。
2013-12-10
33
(1)求回归估计式并计算
2 et
ˆ 用OLS估计式(4.7),计算残差 et Yt - Yt ,并求残差 et2 。 的平方
2013-12-10
34
(3)计算 利用求回归估计式(4.8)得到辅助回归函数的可 决系数 nR2 ,n 为样本容量。 (4)提出假设
H0 : 2 = ...= 6 = 0,
H1 : (j=2,,3,...,6)不全为零 j
2013-12-10
35
(5)检验 在零假设成立下,有 nR2 渐进服从自由度为5的 χ 2 分布。给定显著性水平 ,查 χ 2 分布表得临界 2 2 值 χ (5) ,如果 nR2 χ (5),则拒绝原假设,表明模 型中随机误差存在异方差 。
2013-12-10
7
一、异方差性的实质
同方差的含义
同方差性:对所有的 i (i 1,2,..., n)有:
Var(ui ) = σ 2
(4.1)
因为方差是度量被解释变量 Y 的观测值围绕回归线 E(Yi ) 1 2 X 2i 3 X 3i ... k X ki (4.2) 的分散程度,因此同方差性指的是所有观测值的 分散程度相同。
2013-12-10 15
(二)对参数显著性检验的影响
由于异方差的影响,使得无法正确估计参数的
标准误差,导致参数估计的 t 统计量的值不能正
确确定,所以,如果仍用 t 统计量进行参数的显
著性检验将失去意义。
2013-12-10
16
(三)对预测的影响
尽管参数的OLS估计量仍然无偏,并且基于此 的预测也是无偏的,但是由于参数估计量不是有 效的,从而对Y的预测也将不是有效的。
2 1 2 2
2 n
26
(4)构造F统计量
分别对上述两个部分的观察值求回归模型,由此
2 2 得到的两个部分的残差平方为 e1i 和 e2i 。
e 为前一部分样本回归产生的残差平方和,
2 1i 2 e2i为后一部分样本回归产生的残差平方和。它
们的自由度均为 [(n - c) / 2] - k ,k 为参数的个数。
2013-12-10
31
2、检验的特点
要求变量的取值为大样本
不仅能够检验异方差的存在性,同时在多变量的
情况下,还能判断出是哪一个变量引起的异方差。
2013-12-10
32
3、检验的基本步骤:
以一个二元线性回归模型为例,设模型为: Yt = β1 + β2 X 2t + β3 X 3t +ut (4.7) 并且,设异方差与 X 2t , X 3t 的一般关系为
通常认为,截面数据较时间序列数据更容易产 生异方差。这是因为同一时点不同对象的差异, 一般说来会大于同一对象不同时间的差异。不过, 在时间序列数据发生较大变化的情况下,也可能 出现比截面数据更严重的异方差。 一般经验告诉我们,对于采用截面数据的计量
经济学问题,由于在不同样本点上解释变量以外
的因素的差异较大,所以往往存在异方差。
假如略去 X 3i ,而采用
Yi 1 2 X 2i ui*
X 3i
u i* (4.5) 当被略去的 X 3i 与 X 2i 有呈同方向或反方向变 化的趋势时,随 X 2i 的有规律变化会体现在(4.5) 式的 ui* 中。
2013-12-10
12
(二)模型的设定误差
模型的设定主要包括变量的选择和模型数学形式的确定。模 型问题。除此而外,模型的函数形式不正确,如把变量间本 X 3i
u i* 来为非线性的关系设定为线性,也可能导致异方差。
(三)数据的测量误差
样本数据的观测误差有可能随研究范围的扩大 而增加,或随时间的推移逐步积累,也可能随 着观测技术的提高而逐步减小。
2013-12-10 13
(四)截面数据中总体各单位的差异
2013-12-10
36
EViews软件中: ①建立回归模型:LS Y C X ②检验异方差性:在方程窗口中依次点击View \Residual Test\White Heteroskedastcity 一般是直接观察p值的大小,若p值 较小,认为模型存在异方差性。
第四章
违背经典假定的回归模型
2013-12-10
1
引子1:更为接近真实的结论是 什么?
根据四川省2000年21个地市州医疗机构数与 人口数资料,分析医疗机构与人口数量的 关系,建立卫生医疗机构数与人口数的回 归模型。对模型估计的结果如下: