第四章 多重共线性

合集下载

第四章 多重共线性

第四章 多重共线性
5
二、产生多重共线性的背景
多重共线性产生的经济背景主要有几种情形: 1.经济变量之间具有相同的变化趋势。 2.模型中包含滞后变量。 3.利用截面数据建立模型也可能出现多重共线性。 4.样本数据的原因。
6
第二节 多重共线性的后果
一、完全多重共线性产生的后果
1.参数的估计值不确定 2.参数估计值的方差无限大
Cov( ˆ2 ,
ˆ3 )

(1

r223 )
r23 2
x22i

x32i
随着共线性增加,r23趋于1,方差将增大。同样 协方差的绝对值也增大,它们增大的速度决定于
方差扩大(膨胀)因子(variance inflation factor, VIF)
VIF

1
1 r223
这时
Var(ˆ2 )
4.多重共线性严重时,甚至可能使估计的回归系数 符号相反,得出完全错误的结论。(如引例)
18
第三节 多重共线性的检验
本节基本内容: 简单相关系数检验法 方差扩大因子法 直观判断法 病态指数检验法 逐步回归法
19
一、简单相关系数检验法 简单相关系数检验法是利用解释变量之间的线性 相关程度去判断是否存在严重多重共线性的一种 简便方法。适用于只有两个变量的情形。

2

x32i 0

同理
ˆ3
这说明完全多重共线性时,参数估计量的方差将 变成无穷大。
9
关于方差的推导
Var(ˆ2 )

x32i (x22i ) (x32i )
(x2i x3i )2

2
1 X21 X 1 X22
1 X2n

计量经济学第四章多重共线性

计量经济学第四章多重共线性

R-squared
0.989654
Adjusted R-squared 0.986955 S.E. of regression 1437.448 Sum squared resid 47523916 Log likelihood -256.7013 Durbin-Watson stat 1.654140
4
(二)不完全的多重共线性
实际中,常见的情形是解释变量之间存在不 完全的多重共线性。
对于解释变量 X 2 , X 3, X k,存在不全为0的数
1
,

2
,
,使得
k
1 2X2 3X3 ...k Xk u 0
5
(三)解释变量的关系小节
可能表现为三种情形: r为相关系数 (1) rxixj 0 ,解释变量间毫无线性关系。这时多元
Var(ˆ2 )
9
二、不完全多重共线性产生的后果
1、参数估计值的方差增大
Var( βˆ 2 ) = σ 2
1 x22i (1-
r223 )
=
σ2
1
x22i (1 - r223 )
当 r23增大时,
^
Var( 2)
也增大
10
方差膨胀因子 (Variance Inflation Factor)
17 17
2、交叉相关系数(Cross correlation)
相关系数计算的是两组样本的同期相关程 度,交叉相关则可以表示不同期之间的相关 程度。
Eviews操作: Group窗口的view/cross correlation/输入 滞后期设定/ 输出结果阅读:看是否超出2倍标准差线
18
2倍 标准 差线
1、参数估计值有很大的偶然性。 2、参数显著性检验未通过。 3、经济意义检验未通过。 4、相关系数大。

第四章多重共线性

第四章多重共线性

第四章 多重共线性一、单项选择题1、完全的多重共线性是指解释变量的数据矩阵的秩( )(A )大于k (B )小于k(C )等于k (D )等于k+12、当模型存在严重的多重共线性时,OLS 估计量将不具备( )(A )线性 (B )无偏性(C )有效性 (D )一致性3、如果每两个解释变量的简单相关系数比较高,大于( )时则可认为存在着较严重的多重共线性。

(A )0.5 (B )0.6(C )0.7 (D )0.84、方差扩大因子VIF j 可用来度量多重共线性的严重程度,经验表明,VIF j ( )时,说明解释变量与其余解释变量间有严重的多重共线性。

(A )小于5 (B )大于1(C )小于1 (D )大于105、对于模型01122i i i i Y X X u βββ=+++,与r 23等于0相比,当r 23等于0.5时,3ˆβ的方差将是原来的( )(A )2倍 (B )1.5倍(C )1.33倍 (D )1.25倍6、无多重共线性是指数据矩阵的秩( )(A )小于k (B )等于k(C )大于k (D )等于k+17、无多重共线性假定是假定各解释变量之间不存在( )(A )线性关系 (B )非线性关系(C )自相关 (D )异方差8、经济变量之间具有共同变化的趋势时,由其构建的计量经济模型易产生( )(A )异方差 (B )自相关(C )多重共线性 (D )序列相关9、完全多重共线性产生的后果包括参数估计量的方差( )(A )增大 (B )减小(C )无穷大 (D )无穷小10、不完全多重共线性产生的后果包括参数估计量的方差( )(A )增大 (B )减小(C )无穷大 (D )无穷小11、不完全多重共线性下,对参数区间估计时,置信区间趋于( )(A )变大 (B )变小(C )不变 (D )难以估计12、较高的简单相关系数是多重共线性存在的( )(A )必要条件 (B )充分条件(C )充要条件 (D )并非条件13、方差扩大因子VIF j是由辅助回归的可决系数R j2计算而得,R j2越大,方差扩大因子VIF j就()(A)越大(B)越小(C)不变(D)无关14、解释变量间的多重共线性越弱,方差扩大因子VIF j就越接近于()(A)1 (B)2(C)0 (D)1015、多重共线性是一个()(A)样本特性(B)总体特性(C)模型特性(D)以上皆不对二、多项选择题1、多重共线性包括()(A)完全的多重共线性(B)不完全的多重共线性(C)解释变量间精确的线性关系(D)解释变量间近似的线性关系(E)非线性关系2、多重共线性产生的经济背景主要由()(A)经济变量之间具有共同变化趋势(B)模型中包含滞后变量(C)采用截面数据(D)样本数据自身的原因3、多重共线性检验的方法包括()(A)简单相关系数检验法(B)方差扩大因子法(C)直观判断法(D)逐步回归法(E)DW检验法4、修正多重共线性的经验方法包括()(A)剔除变量法(B)增大样本容量(C)变换模型形式(D)截面数据与时间序列数据并用(E)变量变换5、严重的多重共线性常常会出现下列情形()(A)适用OLS得到的回归参数估计值不稳定(B)回归系数的方差增大(C)回归方程高度显著的情况下,有些回归系数通不过显著性检验(D)回归系数的正负号得不到合理的经济解释三、名词解释1、多重共线性2、完全的多重共线性3、辅助回归4、方差扩大因子VIF j5、逐步回归法6、不完全的多重共线性四、简答题1、多重共线性的实质是什么?2、为什么会出现多重共线性?3、多重共线性对回归参数的估计有何影响?4、判断是否存在多重共线性的方法有那些?5、针对多重共线性采取的补救措施有那些?6、具有严重多重共线性的回归方程能否用来进行预测?五、辨析题1、在高度多重共线性的情形中,要评价一个或多个偏回归系数的单个显著性是不可能的。

第四章多重共线性

第四章多重共线性

2
x2j VIFj
注意:R2j 是多个解释变量辅助回归的多重可决系数,
而相关系数 r223只是说明两个变量的线性关系 。
(一元回归中可决系数的数值等于相关系数的平方)
17
方差扩大因子的作用

R2j 越大
VIFJ 1 (1 R2j ) 多重共线性越严重
VIFj越大
VIFj的大小可以反映解释变量之间存在多重共线性的严重
1 x22i (1
r223 )
2
x22i
1 (1 r223)
2
x22i
VIF2
当 r23 增大时,VIF2 增大, Var(ˆ2 ) 也会增大 ,
思考: 当 r23 0 时 Var(ˆ2) 2
x22i
(与一元回归比较)
当 r23 1 时 Var(ˆ2 )
(见前页结论) 8
三、当多重共线性严重时,甚至可能使估计
在总体中部分或全部解释变量可能没有线性关系,但是 在具体获得的样本中仍可能有共线性关系,因此多重共线 性问题本质上是一种样本现象。
正因为如此,我们无法对多重共线性问题进行统计假设 检验,只能设法评价解释变量之间多重共线性的严重程度。
5
第二节 多重共线性产生的后果
从参数估计看,在完全无多重共线性时,各解释变量都独
Kt
Kt
ln Qt ln A ln Lt ln Kt ln u
(ln Lt 与 ln Kt 有多重共线性) ln Qt ln A ln Lt ln u
Kt
Kt 22
三、截面数据与时间序列数据的结合
有时在时间序列数据中多重共线性严重的变量,在截 面数据中不一定有严重的共线性
假定前提:截面数据估计出的参数在时间序列中变化不大

第4章多重共线性

第4章多重共线性

计量经济学课程教案第四章 多重共线性§ 什么是多重共线性 一、多重共线性的概念 对于模型Y i =1+2X 2i +3X 3i++k X ki+ii=1,2,…,n其基本假设之一是解释变量是互相独立的。

如果存在c 1X 1i +c 2X 2i +…+c k X ki =0 i=1,2,…,n其中: c i 不全为0,则称为解释变量间存在完全共线性(perfectmulticollinearity )。

在矩阵表示的线性回归模型 Y=X+中,完全共线性指:秩(X)<k+1,即⎪⎪⎪⎪⎪⎭⎫⎝⎛=kn nn k k X X XX X X X X X X 212221212111111二、实际经济问题中的多重共线性一般地,产生多重共线性的主要原因有以下三个方面: (1)经济变量相关的共同趋势时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。

横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。

(2)滞后变量的引入在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。

例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。

(3)样本资料的限制由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。

一般经验:时间序列数据样本:简单线性模型,往往存在多重共线性。

截面数据样本:问题不那么严重,但多重共线性仍然是存在的。

§ 多重共线性产生的后果一、完全共线性下参数估计量不存在μX βY +=的OLS 估计量为:Y X X X β''=-1)(ˆ如果存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。

二、近似共线性下OLS 估计量非有效 近似共线性下,可以得到OLS 参数估计量, 但参数估计量方差的表达式为12)()ˆ(-'=X X βσCov由于|X’X|0,引起(X’X)-1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。

多重共线性

多重共线性

第四章 多重共线性第一节 什么是多重共线性一、多重共线性的含义所谓多重共线性,不仅包括解释变量之间完全(精确)的线性关系,还包括解释变量之间近似的线性关系。

对于解释变量23,,,k X X X ,如果存在不全为零的数123,,,,k λλλλ ,能使得12233i i k ki X X X λλλλ++++ =0 ,(i =1,2,,n )——即解释变量的数据矩阵的列向量组线性相关。

则称解释变量23,,,k X X X 之间存在着完全的线性关系。

用数据表示,解释变量的数据矩阵为X =213112232223111k k nnkn X X X XX X X X X ⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦当()r X <k 时,也说明解释变量23,,,k X X X 之间存在着完全的线性关系。

当存在完全共线性时,至少有一个变量(列向量)可以用其余的变量(列向量)线性表出。

在实际问题中,完全的共线性并不多见。

常见的情形是解释变量23,,,k X X X 之间存在不完全的共线性,这是指存在不全为零是数123,,,,k λλλλ ,使得12233λλλλ+++++ i i k ki i X X X v =0(i =1,2,,n )其中i v 是随机变量。

这表明此时解释变量之间只是一种近似的线性关系。

二、产生多重共线性的背景1.经济变量之间具有共同的变化趋势2.模型中包含滞后变量3.利用截面数据建立模型也可能出现共线性4. 样本数据自身的原因第二节 多重共线性产生的后果完全共线性时,矩阵X X '不可逆,参数估计式ˆβ=1()X X X Y -''不存在,OLS 无法应用。

不完全的共线性时,1()X X -'也存在,可以得到参数的估计值,但是对计量经济分析可能会产生一系列影响。

一、参数估计量的无偏性依然成立不完全共线性时ˆ()E β=1()E X X X Y -''⎡⎤⎣⎦=1()()E X X X X U β-''⎡⎤+⎣⎦=β+()1()X X X E U -''=β二、参数OLS 估计值方差扩大 如二元回归模型i Y =12233i i i X X u βββ+++中的2X 与3X 为不完全的共线性时,2X 与3X 之间的相关系数23r 可由下式给出223r=2232223()x x x x∑∑∑容易证明2ˆ()Var β=222223(1)i x r σ-∑3ˆ()Var β=222323(1)ixr σ-∑随着共线性的程度增加,23r 的绝对值趋于1,两个参数估计量的方差也增大。

《计量经济学》第四章精选题及答案

《计量经济学》第四章精选题及答案

《计量经济学》第四章精选题及答案第四章:多重共线性二、简答题1、导致多重共线性的原因有哪些?2、多重共线性为什么会使得模型的预测功能失效?3、如何利用辅回归模型来检验多重共线性?4、判断以下说法正确、错误,还是不确定?并简要陈述你的理由。

(1)尽管存在完全的多重共线性,OLS估计量还是最优线性无偏估计量(BLUE)。

(2)在高度多重共线性的情况下,要评价一个或者多个偏回归系数的个别显著性是不可能的。

(3)如果某一辅回归显示出较高的2R值,则必然会i存在高度的多重共线性。

(4)变量之间的相关系数较高是存在多重共线性的充分必要条件。

(5)如果回归的目的仅仅是为了预测,则变量之间存在多重共线性是无害的。

5、考虑下面的一组数据:Y -10 -8 -6 -4 -2 0 2 4 6 8 10X 1 2 3 4 5 6 7 8 9 10 11 2X 1 3 5 7 9 11 13 15 17 19 21 3如果我们用模型:12233i i i Y X X βββ=++来对以上数据进行拟合回归。

(1) 我们能得到这3个估计量吗?并说明理由。

(2) 如果不能,那么我们能否估计得到这些参数的线性组合?可以的话,写出必要的计算过程。

6、考虑以下模型:231234i i i i i Y X X X ββββμ=++++ 由于2X 和3X 是X 的函数,那么它们之间存在多重共线性。

这种说法对吗?为什么?7、在涉及时间序列数据的回归分析中,如果回归模型不仅含有解释变量的当前值,同时还含有它们的滞后值,我们把这类模型称为分布滞后模型(distributed-lag model )。

我们考虑以下模型:12313233i t t t t tY X X X X βββββμ---=+++++ 其中Y ——消费,X ——收入,t ——时间。

该模型表示当期的消费是其现期的收入及其滞后三期的收入的线性函数。

(1) 在这一类模型中是否会存在多重共线性?为什么?(2) 如果存在多重共线性的话,应该如何解决这个问题?8、设想在模型12233i i i i Y X X βββμ=+++ 中,2X 和3X 之间的相关系数23r 为零。

第四章第二节 多重共线性产生的后果

第四章第二节  多重共线性产生的后果

Y E(Y ) 1 2 X2 3 X3

二元线性回归模型 Y 1 2 X 2 3 X3 u
其离差形式为: y 2 x2 3x3 u


y 2 x2 3 x3 e
2和 3 的估计式
ˆ2 (
yx2 )( x32 ) ( yx3 )( x2 x3 ) ( x22 )( x32 ) ( x2 x3 )2

x31x32 x3n xk1xk 2xkn (k1)n



y x e, xy xx xe xx ,即为正规方程组
x21x22 x2n y1 x31x32 x3n y2 xk1xk2 xkn yn
r24 0.9632 r35 0.8435 r46 0.9248
r25 0.4569 r36 0.5494 r56 0.5438
r26 0.8569
表明一些解释变量之间确实存在共线性。
***离差形式的最小二乘估计量
多元线性总体回归模型有:
Yi 1 2 X 2i 3 X 3i k X ki ui Y 1 2 X2 3 X3 k Xk Yi Y 2 ( X 2i X 2 ) 3 ( X 3i X 3 ) k ( X ki X k ) ui yi 2 x2i 3 x3i k xki ui
x22 )2
x22 )

(
yx2
) 2 ( y)( ( x22 )( 2 )
x22 )
通过上式可以看出,随着 X2、X3 共线性程度的越
高,即 愈向零靠近,从而 ˆ2 就会愈趋向于不确定
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2019年4月26日 山东财经大学统计学院计量经济教研室
第9页
机动 目录 上页 下页 返回 结束
二、 多重共线性产生的原因
由于经济现象的变化涉及多个影响因素,而影 响因素之间常常存在一定的相关性。多重共线性产 生的经济背景主要有几种情形:
1.经济变量之间具有共同变化趋势。
例如,对于收入、消费、就业率等变量,都随宏观 经济的繁荣和紧缩呈现大致相同的波动,在经济上升 时期均呈现增长的趋势,当经济收缩期都呈现下降趋 势。当这些变量同时作为解释变量进入模型时就可能 带来多重共线性问题。
2019年4月26日 山东财经大学统计学院计量经济教研室
第6页
机动 目录 上页 下页 返回 结束
我们只能估计出系数的线性组合 (?1 ? 2? 2) 的样本 估计值,而无法得到 ?1和? 2 的具体估计。且可以证明
参数估计量的方差为无穷大。
? ? ? ? var(??1) ?
( x1i ? x1 )2
yi=?0+?1x 1i+?2x 2i+? +? kxki+ui i=1,2,…,n
如果存在某解释变量是其他解释变量的线 性组合,则称为存在完全多重共线性(Complete Multicollinearity, Exact Multicollinearity)
即:若存在一组不全为零的常数 ?0 , ?1, ?2 , , ?k
??1 x1n x2n ?
xk1 ?
xk1
? ?
??
xkn
? ?n?
(
k
?
1)
当存在完全共线性时: rank(X)<k+1,即
在数据矩阵X中,至少有一列向量可由其他 列向量线性表示。
2019年4月26日 山东财经大学统计学院计量经济教研室
第5页
机动 目录 上页 下页 返回 结束
需要强调的是模型中存在完全的多重共线性非 常罕见,一般来讲,通常发生在确定回归变量出错 的时候,即模型中变量选择出现逻辑错误。
第四章 多重共线性
多重共线性(Multicollinearity)一词由弗里希 (Ragnar Frisch,1895—1973)于1934年引入。
原意是指回归模型中的部分或全部解释变量 之间存在完全的线性关系,是对假定MLR.3的违 背,后来人们将这个概念扩展到近似的线性关系。
多重共线性是多元回归建模过程中最常遇到 的问题。本章中我们首先分析与界定完全多重共 线性与多重共线性,探讨多重共线性可能引起的 后果,然后介绍多重共线性的诊断与缓解多重共 线性的补救措施。
2019年4月26日 山东财经大学统计学院计量经济教研室
第1页
机动 目录 上页 下页 返回 结束
学习目标: 1、了解多重共线性的概念、能区分完全的多重 共线性与多重共线性; 2、了解多重共线性产生的原因; 3、理解多重共线性引起的后果; 4、理解并掌握多重共线性的诊断; 5、掌握缓解多重共线性问题的处理方法。 重点与难点:
无法估计 ??
var(??j )
?
( X'X
)
? ? 1
jj
2 u

也没法计算。
2019年4月26日 山东财经大学统计学院计量经济教研室
第8页
机动 目录 上页 下页 返回 结束
(二)近似(但不完全)多重共线性。 一般的,若解释变量之间无准确的或完全的线性相
关关系,但它们之间存在高度的线性相关性,称模型存 在近似(不完全)多重共线性( Near Multicollinearity )。
理解多重共线性是一种样本现象; 深刻理解多重共线性的理论后果与实际后果; 掌握多重共线性的诊断及多重共线性问题的 处理方法。
2019年4月26日 山东财经大学统计学院计量经济教研室
第2页
机动 目录 上页 下页 返回 结束
第一节 多重共线性问题及其对建模的影响
一、多重共线性的含义
广义的多重共线性包括完全多重共线性和近似 多重共线性。狭义的的多重共线性指的是近似多 重共线性。如果不特加说明,本章使用的是狭义 的多重共线性。
(一)完全多重共线性
多元线性回归模型的古典假定MLR.3是,模型 中解释变量之间不存在完全的线性相关关系,此
2019年4月26日 山东财经大学统计学院计量经济教研室
第3页
机动 目录 上页 下页 返回 结束
时就称解释变量 x j ( j ? 1,2,..., k ) 之间不存在
完全的多重共线性。
对于模型
使得: ?0 ? ?1x1 ? ?2 x2 ? ? ? k xk ? 0
2019年4月26日
?0
山东财经大学统计学院计量经济教研室
第4页
机动 目录 上页 下页 返回 结束
则称模型存在完全多重共线性。
用矩阵表示,解释变量的观测值矩阵为
?1 x11 x21 ?
X
?
??1 ??
x12 ?
x22 ?
? ?
?
x1
(x1 ? ) ] ? 2 2
4[
x1
)2 ( x1i
?
x1
)2 ]2
??2
?
?
同理,可以证明 var(??2 ) ? ?
2019年4月26日 山东财经大学统计学院计量经济教研室
第7页
机动 目录 上页 下页 返回 结束
用矩阵代数的术语来讲,由于参数的 OLSE为
?? ? ( X'X )?1 X'Y 在完全多重共线性时, X降秩, ( X'X )?1 不存在,故
即若存在存在一组不全为零的常数 ?0 ,?1, ,?k ,使得 ?0 ? ?1x1 ? ?2 x2 ? ? ?k xk ? v ? 0
其中 v 是随机项。称自变量之间存在(但不完全)多重 共线性。本章就是在这个意义上使用“多重共线性”一词 的。
值得强调的是,模型存在(近似)多重共线性并不 违反任何古典假定,但会对回归分析带来不利的后果, 所以要尽力避免自变量之间存在过高的共线程度。
多元线性回归模型中如果存在完全多重共线性, 则参数的最小二乘估计量是不确定的(即无法估计)。 例如二元线性回归模型
yi ? ? 0 ? ?1x1i ? ? 2 x2i ? ui
(4.2)
如果有 x2i ? 2x1i ,则(4.2)式可写为:
yi ? ? 0 ? (?1 ? 2? 2)x1i ? ui
( x1i ? x1 )2Fra bibliotek??2
(x2i ? x2 )2 ? [ (x1i ? x1 )( x2i ? x2 )]2
? ? ? ? ? 4
(x1i ? x1 )2
( x1 ? x1 )2
??2
(x1i ? x1 )2 ? 4[
(x1i ? x1 )( x1i ? x1 )]2
? ? ? ? 4[
( x1i
相关文档
最新文档