第五章 异方差性 思考题

合集下载

第五章 异方差性

第五章 异方差性
于OLS估计得到的残差 ei 的分析
26
异方差性的检验
问题在于用什么来表示随机误差项的方差 一般的处理方法:
Var(ui ) E(uቤተ መጻሕፍቲ ባይዱ2) ei2
图示检验法
图示检验法
(一)相关图形分析 方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释
变量Y与随机误差项u有相同的方差,所以分析Y与X的相关图,可以初 略地看到Y的离散程度与X之间是否有相关关系。
ui 的某些分布特征,可通过残差 ei 的图形对异方差进行观察。
对于一元回归模型,绘制出ei2 对Xi的散点图,对于多元回归模型,绘制出ei2 对Yi的散点图或ei2 与认为和异方差有关的X的散点图。
31
图示检验法
(二)残差图形分析
e~i 2
e~i 2
X 同方差
e~i 2
X 递增异方差
e~i 2
X 递减异方差
每个企业所处的外部环境对产出量的影响被包含在随机误差项中 每个企业所处的外部环境对产出量的影响程度不同,造成了随机
误差项的异方差性
产生异方差性的原因
产生异方差性的原因
(一)模型设定误差
假设正确的模型是:
Yi 1 2 X2i 3 X3i ui
假如略去了重要的解释变量X3 ,而采用 Yi 1 2 X2i vi
排序,再按戈德菲尔德匡特检验方法回归,否则即使存在异方差,也有可能用戈德菲
尔德匡特方法检验不出来。
用 EViews 给截面数据排序的方法:在 Workfile 窗口点击 Procs 键并选 Sort current page
功能,在打开的 Sort Workfile Series 对话窗填写以哪一个序列为标准(基准序列)排

第五章 异方差性

第五章  异方差性

Qt

ALt
K

t
eut
• U为随机误差项,它包含了资本K和劳动力L
以外的因素对产出Q的影响,比如能源、环境、
政策等。由于不同的地区这些因素不同造ui 成了 对产出的影响出现差异,使得模型中的 具有
异方差,并且这种异方差的表现是随资本和劳 动力的增加而有规律变化的。
(二)样本数据的观测误差
• 一方面,样本数据的观测误差常随着时间的 推移而逐步积累,引起随机误差项的方差增 加。另一方面,随着时间的推移,样本观测 技术会随之提高,也可能使得样本的观测误 差减少,引起随机误差项的方差减小。因此, 随着时间的推移,样本数据的观测误差会发 生变化,从而引起随机误差项的变化。
Yt 1 2 X 2i 3 X 3i ui (1)
Y 1 2 X 2 3 X 3
(2)
Yt 1' 2 X 2i ui'
(3)
Y 1' 2 X 2
(4)
由(2)、(4)得:1' 1 3 X3 (5)
由(1)、(3)、(5)得:
Var(ui )


2 i

f
(X
ji )
i 1, 2, , n
则称随机误差项存在异方差.
( 即回归模型中随机误差项的方差不是常数 )
例2:使用截面数据研究储蓄函数
假设 储蓄函数模型Y i 0 1X i ui
式中:Y i第i个家庭的储蓄额,X i第i个家庭的可支配收入,ui 代表除可支配收入以外影响储蓄额的其它因素,如利率、家庭 人口、文化背景等等。这里,同方差假设显然与事实不符。
ui' 1 3 X 3i ui 1'

(第3版)第五章异方差性

(第3版)第五章异方差性
第五章 异方差性
引子:更为接近真实的结论是什么?
根据四川省2000年21个地市州医疗机构数与人口数资料,
分析医疗机构与人口数量的关系,建立卫生医疗机构数
与人口数的回归模型。对模型估计的结果如下:
ˆ 563.0548 5.3735 X Y i i
(291.5778) (0.644284)
t =(-1.931062) (8.340265)
第五章 异方差性
本章将讨论四个问题: ●异方差的实质和产生的原因 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救
第一节 异方差性的概念
一、 异方差的实质
同方差的含义 同方差性:对所有的 i (i 1,2,..., n) 有: Var (ui X i ) 2
因为方差是度量被解释变量 Y 的观测值围绕条件期望 E(Yi X 2 , X 3 , X k ) 1 2 X 2i 3 X 3i ... k X ki
具体步骤:
●排序:将观测值按解释变量X大小顺序排列
●数据分组 : 去掉中间的 C 个(约 1/4 )观测值,分 别进行前后两部分 (n c) 2 个观测值的回归 ●提出假设 : 分别进行前后两部分回归的基础上,提 出检验假设:
2 2 H : 即 0 i
H o : ui 是同方差(前后两部分方差无显著差异),
计算辅助回归的可决系数 R 2 3.提出原假设 H0 : 1 = 2 = ... = p = 0 ; H1 : j不全为零
并计算辅助回归的 R 2
2 t
2 2t
2 3t
3.提出假设 H 0 : 2 = ...= 6 = 0,
H1 : ( j j = 2,,3,...,6)不全为零

第五章_异方差性及检验

第五章_异方差性及检验
样本数据的观测误差有可能随研究范围的扩大而增加,或 随时间的推移逐步积累,也可能随着观测技术的提高而逐步 减小。如储蓄函数,假如用的是1980年至2010年的数据,前 些年工资较透明,现在灰色收入较多,测量误差有变化。
7
(四)截面数据中总体各单位的差异 例如利用截面数据研究消费与收入的关系时,不同
情况下,无法判断是哪个变量引起的异方差。
27
三、White检验
(一)基本思想: 不需要关于异方差的任何先验信息,只需要
在大样本的情况下,将OLS估计后的残差平方对 常数、解释变量、解释变量的平方及其交叉乘积 等构成一个辅助回归,利用辅助回归建立相应的 检验统计量来判断异方差性。
28
(二)检验步骤: 以一个二元线性回归模型为例,设模型为:
( xi
)2
Xi
Var(ˆ2
)


2xi2
X
2 i
(xi2 )2
于是
Var(ˆ2 ) Var(ˆ2 )

(
2xi2
xi Xi
)2

xi2
X
2 i
由于
(
xi Xi
)2

xi2
X
2 i

(
xi Xi

xi
Xi
)

(xi2 )2
所以
Var(ˆ2 Var(ˆ2
) )

1
第五章 异方差性
1
本章讨论四个问题: ●异方差的实质和产生的原因 ●异方差产生的后果 ●异方差的检测方法 ●异方差的补救
2
第一节 异方差性的概念
一、什么是异方差性
在简单线性回归模型和多元线性回归模型的基 本假定中,有同方差假定:

第五章 异方差性(1)

第五章 异方差性(1)
8
第二节 异方差性的后果
一、对参数估计统计特性的影响
二、对参数显著性检验的影响
三、对预测的影响
9
一、对参数估计式统计特性的影响
1、仍然具有线性性
2、仍然具有无偏性
参数估计的无偏性仅依赖于基本假定中的零 均值 假定(即 E(ui ) 0 )。所以异方差的存在对 无偏性的成立没有影响。
3、仍然具有一致性
3
如果把异方差看成是由于某个解释变量的变 化而引起的,则
Var(ui ) f ( X i )
2 i 2
异方差一般可归结为三种类型: (1)单调递增型: i 2 随X的增大而增大 (2)单调递减型: i 2 随X的增大而减小 2 (3)复杂型: i 与X的变化呈复杂形式
4
单调递增型异方差例
7
u i*
2、数据的测量误差
样本数据的观测误差有可能随研究范围的扩 大而增加,或随时间的推移逐步积累,也可能随 着观测技术的提高而逐步减小。
3、截面数据中总体各单位的差异 u*
i
通常认为,截面数据较时间序列数据更容易 产生异方差。这是因为同一时点不同对象的差异, 一般说来会大于同一对象不同时间的差异。 不过,在时间序列数据发生较大变化的情况 下,也可能出现比截面数据更严重的异方差。
34
3、检验的特点
(1)变量的样本值为大样本; (2)数据是时间序列数据; (3)只能判断模型中是否存在异方差,而不能诊 断出哪一个变量引起的异方差。
35
五、Glejser检验
1、检验的基本思想
由OLS法得到残差
ei
,取得绝对值,然后将对
某个解释变量回归,根据回归模型的显著性和拟合 优度来判断是否存在异方差。

第5章 异方差性

第5章 异方差性

估计量不具有最佳性。 但OLS估计量不具有最佳性。 估计量不具有最佳性
5.2.3对模型参数估计值显著性检验的影响 对模型参数估计值显著性检验的影响
e′e 并非随机误差项 并非随机误差项 在异方差情况下, ˆ 在异方差情况下, σ = n − k −1 方差的无偏估计量。 方差的无偏估计量。
2
ˆ 导致在此基础上估计的 s ( b j ) 也出现偏误。
e t 来近似代表随机误差项
5.3.1图示检验法 图示检验法
的估计值) (1)用X(或Y的估计值)与残差平方的散点图进 ) ( 的估计值 行初步判断
~ ei 2 ~ ei 2
X 同方差 递增异方差
X
~ ei 2
~ ei 2
X 递减异方差 复杂型异方差
X
(2)用X-Y的散点图进行判断 ) 的散点图进行判断 看是否存在明显的散点扩大 缩小 复杂型趋势 散点扩大、缩小 散点扩大 缩小或复杂型趋势 (即不在一个固定的带型域中)
. 0 . 0 . ... σ nn ...
5.1.2产生异方差的原因 产生异方差的原因
1、解释变量的遗漏。 2、来自不同抽样单元的因变量观察值的差异。 3、异常观测值的出现。 4、时间序列数据中,观测技术的改进引起的观测值的变化。
注意: (1)时间序列数据和截面数据中都有可能存在异方差,其 中截面样本中更为常见。 (2) 经济时间序列中的异方差常为递增型异方差。金融时 间序列中的异方差常表现为自回归条件异方差。
yt = b0 + b1 x1t + b2 x2t + ut
1、用普通最小二乘法估计模型,求出残差平方序 2 列:e t
2、以残差平方作为因变量,以原方程中所有解释变 解释变 解释变量的平方项和交叉积项 量以及解释变量的平方项 交叉积项 解释变量的平方项 交叉积项做辅助回归:

异方差性自相关性和多重共线性思考与练习

异方差性自相关性和多重共线性思考与练习

第二章异方差性、自相关性和多重共线性思考与练习参考答案2.1参考答案答:随机误差项方差随观察单位而变的现象为异方差。

影响:(1)尽管OLS估计仍无偏,但起方差不再有效(即最小方差性不具备),且模型误差项方差估计有偏.(2)t检验、F 检验失效,从而对参数、模型整体的显著性判断不可靠.(3)预测精度低,模型的应用失效.2.2参考答案答:G---Q检验原理:(1)假定随机误差项方差σ2t 与某一解释变量Xti成正(负)相关;(2)对样本观察值按Xi升序排列后去除中间的部分样本值;(3)分别以剩下的两部分样本值为子样,利用OLS法计算各自的方差估计值;(4)以两子样的方差估计值构造F统计量,判断两子样的方差是否差异显著。

若显著,则存在异方差;否则反之。

White检验原理:通过构造辅助回归模型e2t =β+tipiix∑=1β+tjpjitiijxx∑=1,β来判断零假设H0:①E(Ut)=2σ(t=1,2,3……N) ,并且②模型设定Y=XB+U正确若检验显著,则否定零假设,从而认为存在异方差或者模型设定错误;若检验不显著,则接受零假设。

White、Park和Glecses检验均使用辅助回归模型来探测住回归方程系数显著性检验来探测异方差性。

其间区别在于:Park和Glecses检验是通过辅助回归方程系数显著性来探测异方差;而White检验则是通过辅助回归方程整体显著性来检验探测主回归模型是否存在异方差性或者设定误差。

2.3参考答案答:WLS发实质上为模型变换法.考虑回归模型Y t =b 0+b 1x t +U t ,假设其存在异方差性并且Var(U t )=2t σ=K 2其中K 为常数,对远模型使用权数为W t =1/)/(t x t 的WLS 法进行估计时,实质上是对原模型作了变换,变换后的形式为:)(t tx f Y =)(0t x f b +)(1t tx f x b +)(t tx f v经过转换后,模型的异方差性被清除了。

计量经济学课后答案第五章 异方差性汇总

计量经济学课后答案第五章 异方差性汇总

第五章课后答案5.1(1)因为22()i i f X X =,所以取221iiW X =,用2i W 乘给定模型两端,得 312322221i i ii i i i Y X u X X X X βββ=+++ 上述模型的随机误差项的方差为一固定常数,即22221()()i i i iu Var Var u X X σ==(2)根据加权最小二乘法,可得修正异方差后的参数估计式为***12233ˆˆˆY X X βββ=-- ()()()()()()()***2****22232322322*2*2**2223223ˆi i i i i i i i i i i i i i i i i iW y x W x W y x W x x W x W x W x x β-=-∑∑∑∑∑∑∑()()()()()()()***2****23222222332*2*2**2223223ˆii ii i i iii i i ii i i i i iW y x W x W y x W x x Wx W x W x x β-=-∑∑∑∑∑∑∑其中22232***23222,,iii i i i iiiW XW X W Y X X Y WWW ===∑∑∑∑∑∑******222333i i i i i x X X x X X y Y Y=-=-=- 5.2(1)2222211111 ln()ln()ln(1)1 u ln()1Y X Y X Yu u X X X u ββββββββββ--==+≈=-∴=+[ln()]0()[ln()1][ln()]11E u E E u E u μ=∴=+=+=又(2)[ln()]ln ln 0 1 ()11i i iiP P i i i i P P i i E P E μμμμμμμ===⇒====∑∏∏∑∏∏不能推导出所以E 1μ()=时,不一定有E 0μ(ln )= (3) 对方程进行差分得:1)i i βμμ--i i-12i i-1lnY -lnY =(lnX -X )+(ln ln 则有:1)]0i i μμ--=E[(ln ln5.3(1)该模型样本回归估计式的书写形式为:Y = 11.44213599 + 0.6267829962*X (3.629253) (0.019872)t= 3.152752 31.5409720.944911R =20.943961R = S.E.=9.158900 DW=1.597946 F=994.8326(2)首先,用Goldfeld-Quandt 法进行检验。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章 异方差性 思考题5.1 简述什么是异方差 ? 为什么异方差的出现总是与模型中某个解释变量的变化有关 ?5.2 试归纳检验异方差方法的基本思想 , 并指出这些方法的异同。

5.3 什么是加权最小二乘法 , 它的基本思想是什么 ?5.4 产生异方差的原因是什么 ? 试举例说明经济现象中的异方差性。

5.5 如果模型中存在异方差性 , 对模型有什么影响 ? 这时候模型还能进行应用分析吗 ?5.6 对数变化的作用是什么 ? 进行对数变化应注意什么 ? 对数变换后模型的经济意义有什么变化 ? 5.7 怎样确定加权最小二乘法中的权数 ? 练习题5.1 设消费函数为 12233i i i i Y X X u βββ=+++其中,i Y 为消费支出;2i X 为个人可支配收入;3i X 为个人的流动资产;i u 为随机误差项 ,并且 E(i u )=0,Var(i u )= 222i X σ( 其中2σ为常数) 。

试回答以下问题 :1) 选用适当的变换修正异方差 , 要求写出变换过程 ; 2) 写出修正异方差后的参数估计量的表达式。

5.2 根据本章第四节的对数变换 , 我们知道对变量取对数通常能降低异方差性 , 但需对这种模型的随机误差项的性质给予足够的关注。

例如 ,设模型为21Y X u ββ=,对该模型中 的变量取对数后得12ln ln ln ln Y X u ββ=++1) 如果ln u 要有零期望值 ,u 的分布应该是什么 ? 2) 如果 E(u )=1, 会不会 E(ln u )=0? 为什么 ? 3) 如果 E(ln u ) 不为零 , 怎样才能使它等于零 ?5.3 表 5.8 给出消费 Y 与收入 X 的数据 , 试根据所给数据资料完成以下问题 :1) 估计回归模型12Y X u ββ=++中的未知参数1β和2β, 并写出样本回归模型的书写格式;2) 试用 GOMeld-Quandt 法和 White 法检验模型的异方差性 3 3) 选用合适的方法修正异方差。

5.4 表 5.9 给出 1985 年我国北方地区农业总产值 , 农用化肥量、农用水利、农业劳动力、户均固定资产以及农机动力数据 , 要求 :1) 试建立我国北方地区农业产出线性模型 ;2) 选用适当的方法检验模型中是否存在异方差 ;3) 如果存在异方差 , 采用适当的方法加以修正。

地区农业总产值(亿元)农业劳动力(万人)灌溉面积(万公顷)化肥用量(万吨)户均固定资产(元)农机动力(万马力)北京19.64 90.1 33.84 7.5 394.3 435.3 天津14.4 95.2 34.95 3.9 567.5 450.7 河北149.9 1639 .0 357.26 92.4 706.89 2712.6 山西55.07 562.6 107.9 31.4 856.37 1118.5 内蒙古60.85 462.9 96.49 15.4 1282.81 641.7 辽宁87.48 588.9 72.4 61.6 844.74 1129.6 吉林73.81 399.7 69.63 36.9 2576.81 647.6 黑龙江104.51 425.3 67.95 25.8 1237.16 1305.8 山东276.55 2365.6 456.55 152.3 5812.02 3127.9 河南200.02 2557.5 318.99 127.9 754.78 2134.5 陕西68.18 884.2 117.9 36.1 607.41 764 新疆49.12 256.1 260.46 15.1 1143.67 523.3 *1马力=0.735kW5.5 表 5.10 中的数据是美国 1988 研究与开发 (R&D) 支出费用 (Y) 与不同部门产品销售量 (X) 。

试根据资料建立一个回归模型 , 运用 Glejser 方法和 White 方法检验异方差 , 由此决定异方差的表现形式并选用适当方法加以修正。

表 5.10 美国工业群体销售、研发、利润数据 ( 单位 :106 美元 ) 工业群体销售量X R&D费用Y 利润Z1.容器与包装6375.3 62.5 185.12.非银行业金融11626.4 92.9 1569.53.服务行业14655.1 178.3 276.84.金属与采矿21869.2 258.4 2828.15.住房与建筑26408.3 494.7 225.96.一般制造业32405.6 1083 3751.97.休闲娱乐35107.7 1620.6 2884.18.纸张与林木产品40295.4 421.7 4645.79.食品70761.6 509.2 5036.410.卫生保健80552.8 6620.1 13869.911.宇航95294 3918.6 4487.812.消费者用品101314.3 1595.3 10278.913.电器与电子产品116141.3 6107.5 8787.314.化工产品122315.7 4454.1 16438.815.五金141649.9 3163.9 9761.416.办公设备与电算机175025.8 13210.7 19774.517.燃料230614.5 1703.8 22626.618.汽车293543 9528.2 18415.4 5.6 表 5.11 给出收入和住房支出样本数据 , 建立住房支出模型。

表 5.11 收入和住房支出样本数据假设模型为12i i i Y X u ββ=++, 其中 ,Y 为住房支出 ,X 为收入。

试求解下列问题 :1) 用OLS 求参数的估计值、标准差、拟合优度。

2) 用 GoMeld-Quandt 方法检验异方差 ( 假设分组时不去掉任何样本值 ) 。

3) 如果模型存在异方差 , 假设异方差的形式是222I i X σσ=,试用加权最小二乘法重新估计1β和2β的估计值、标准差、拟合优度。

5.7 表 5.12 给出 1969 年 20 个国家的股票价格变化率 (Y) 和消费者价格变化率 (X) 的一个横截面数据。

表 5.12 1969 年 20 个国家的股票价格变化率 {Y} 和消费者价格变化率 {X} 国家 股票价格变化率%Y 消费者价格变化率%X 1.澳大利亚 5 4.3 2.奥地利 11.1 4.6 3.比利时 3.2 2.4 4.加拿大 7.9 2.4 5.智利 25.5 26.4 6.丹麦 3.8 4.2 7.芬兰 11.1 5.5 8.法国 9.9 4.7 9.德国 13.3 2.2 10.印度 1.5 4 11.爱尔兰 6.4 4 12.以色列 8.9 8.4 13.意大利 8.1 3.3 14.日本 13.5 4.7 15.墨西哥 4.7 5.2 16.荷兰 7.5 3.6 17.新西兰 4.7 3.6 18.瑞典 8 419.英国7.5 3.920.美国9 2.1试根据资料完成以下问题 :1) 将 Y 对 X 回归并分析回归中的残差 ;2) 因智利的数据出现了异常 , 去掉智利数据后 , 重新作回归并再次分析回归中的残差;3) 如果根据1款的结果你将得到有异方差性的结论,而根据2款的结论你又得到相反的结论 , 对此你能得出什么样的结论 ?5.8 表 5.13 给出的是1998年我国重要制造业销售收入与销售利润的数据。

1) 求销售利润岁销售收入的样本回归函数 , 并对模型进行经济意义检验和统计检验;2) 分别用图形法、Glejser方法、White方法检验模型是否存在异方差 ;3) 如果模型存在异方差 , 选用适当的方法对异方差性进行修正。

5.9 表 5.14 所给资料为 1978~2000 年四川省农村人均纯收入X和人均生活t费支出Y的数据。

s1) 求农村人均生活费支出对人均纯收入的样本回归函数 , 并对模型进行经济意义检验和统计检验 ;2) 选用适当的方法检验模型中是否存在异方差 ;3) 如果模型存在异方差 , 选用造当的方法对异方差性进行修正。

5.10 在 5.9 中用的是时间序列数据 , 而且没有剔除物价上涨因素。

试分析如果剔除物价上涨因素 , 即用实际可支配收入和实际消费支出 , 异方差的问题是否会有所改善? 由于缺乏四川省 1978 年后的农村居民消费价格定基指数 , 以 1978-2000年全国商品零售价格指数(1978年为100)代替 , 如表5.15所示。

表 5.151978~2000 年全国商品零售价格指资料来源 : 中国统计年鉴 2001第五章 异方差性 思考与练习1. 简述什么是异方差?为什么异方差的出现总是与模型中某个解释变量的变化有关?答:异方差性是指模型违反古典假定中的同方差性,即各残差项的方差并非相等。

一般地,由于数据观测质量、数据异常值、某些经济变化的特性、模型设定形式的偏误等原因,导致了异方差的出现。

主要原因往往是重要变量的遗漏,所以很多情况下,异方差表现为残差方差随着某个(未纳入模型的)解释变量的变化而变化。

2. 归纳教材中所介绍的检验异方差的方法的基本思想。

答:本书中给出了5种检验方法:Goldfeld -Quandt 检验,Glejser 检验,Breusch-Pagan 检验,White 检验,ARCH 检验。

其共同的基本思想是:判断随机误差项与解释变量观测值之间的相关性。

对上述每一种检验来说,具体的寻找误差项与解释变量的关系的方法手段有所不一样。

3.什么是加权最小二乘法,它的基本思想是什么?答: 加权最小二乘法是对各个残差的平方赋予不同的权重后求和,求解参数估计值,使加权之后的残差平方和最小。

这种确定参数估计值的方法称为加权最小二乘法。

其基本思想是:在异方差的情形下,方差越小,偏离均值的离散程度越小,越应该受到重视。

即e i 的方差越小,在确定回归线时起的作用越大,反之,起的作用越小。

这样,应该对方差小的e i 赋予较大的权重,对方差大的e i 赋予较小的权重,让各个e i 2提供的信息大致一致。

4.判断下列说法是否正确,并简要说明为什么。

(1) 当异方差出现时,最小二乘估计是有偏的和不具有最小方差特性;答:不正确。

这个时候估计式是无偏的,但是不具有最小方差性。

(2) 当异方差出现时,常用的t 和F 检验失效;答:正确。

由于方差不是常数而是变数,这时一般意义上t 比值的分布是未知的,但肯定不再遵从t-分布,使得t 检验失效;同理,在异方差条件下,F 比值也不再是遵从F-分布,F 检验也失效。

(3) 异方差情况下,通常的OLS 估计一定高估了估计量的标准差;答:一般是低估了其标准差。

(4) 如果OLS 回归的残差表现出系统性,则说明数据中有异方差性;答:是,但同时也要考虑自相关性的存在。

相关文档
最新文档