第4章 多重共线性

合集下载

第四章 多重共线性

第四章 多重共线性

2
( x2 i x3 i ) 2 x [1 2 x3 i
2 2i

2
2 2 x2 i (1 r23 )
ˆ Var( 3 ) 同样可得
2
2 2 x3 i (1 r23 )
ˆ ˆ Cov( 2 , 3 )
r23 2
2 2 2 (1 r23 ) x2 i x3 i
1 X X 21 X 31
1 X 22 X 32
1 X 2n X 3n
nX 3 X 2 i X 3 i 2 X 3 i
X 2 i
2 X 2 i X 2 i X 3 i
X 3 i n nX 2 2 X 2 i X 3 i nX 2 X 2 i 2 X 3 i nX 3 X 2 i X 3 i
其中vi为随机变量,则称解释变量X2、X3、 …、 Xk 之间存在着不完全的多重共线性。 注意:解释变量之间不存在线性关系,并非不存在 非线性关系,当解释变量之间存在非线性关 系时,并不违反古典假定。
5
二、产生多重共线性的背景
多重共线性产生的经济背景主要有几种情形:
1.经济变量之间具有相同的变化趋势。
10
n X X nX 2 nX 3 n 0
nX 2 X
2 2i
nX 3 X 2 i X 3 i
2 X 3 i
X 2 i X 3 i nX 2
2 2 X 2 i nX 2
X 2 i x2 i X 2 X 3 i x3 i X 3
nX 3
X 2 i X 3 i nX 2 X 3
这里r23是X2,X3的相关系数。
16

计量经济学:多重共线性

计量经济学:多重共线性

计量经济学:多重共线性多重共线性52=.53085123 第四章专门讨论古典假定中⽆多重共线性假定被违反的情况,主要内容包括多重共线性的实质和产⽣的原因、多重共线性产⽣的后果、多重共线性的检测⽅法及⽆多重共线性假定违反后的处置⽅法。

第⼀节什么是多重共线性⼀、多重共线性的含义第三章讨论多元线性回归模型的估计时,强调了假定⽆多重共线性,即假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性⽆关。

在计量经济学中所谓的多重共线性(Multi-Collinearity),不仅包括解释变量之间精确的线性关系,还包括解释变量之间近似的线性关系。

从数学意义上去说明多重共线性,就是对于解释变量k X 、、X X 32,如果存在不全为0的数k λλλ,2,1 ,能使得n ,2, ,1i 033221 ==++++ki k i i X X X λλλλ ( 4.1 )则称解释变量k X X X ,,,32 之间存在着完全的多重共线性。

⽤矩阵表⽰,解释变量的数据矩阵为X=213112232223111k k nnkn X X X X X X X X X ??(4.2)当Rank(X )在实际经济问题中,完全的多重共线性并不多见。

常见的情形是解释变量k X X X ,,,32 之间存在不完全的多重共线性。

所谓不完全的多重共线性,是指对于解释变量k X 、、X X 32,存在不全为0的数k λλλ,2,1 ,使得n ,2, ,1i 033221 ==+++++i ki k i i u X X X λλλλ(4.3)其中,i u 为随机变量。

这表明解释变量k X 、、X X 32只是⼀种近似的线性关系。

如果k 个解释变量之间不存在完全或不完全的线性关系,则称⽆多重共线性。

若⽤矩阵4表⽰,这时X 为满秩矩阵,即Rank(X )=k 。

需要强调,解释变量之间不存在线性关系,并⾮不存在⾮线性关系,当解释变量存在⾮线性关系时,并不违反⽆多重共线性假定。

计量经济学第四章多重共线性

计量经济学第四章多重共线性

R-squared
0.989654
Adjusted R-squared 0.986955 S.E. of regression 1437.448 Sum squared resid 47523916 Log likelihood -256.7013 Durbin-Watson stat 1.654140
4
(二)不完全的多重共线性
实际中,常见的情形是解释变量之间存在不 完全的多重共线性。
对于解释变量 X 2 , X 3, X k,存在不全为0的数
1
,

2
,
,使得
k
1 2X2 3X3 ...k Xk u 0
5
(三)解释变量的关系小节
可能表现为三种情形: r为相关系数 (1) rxixj 0 ,解释变量间毫无线性关系。这时多元
Var(ˆ2 )
9
二、不完全多重共线性产生的后果
1、参数估计值的方差增大
Var( βˆ 2 ) = σ 2
1 x22i (1-
r223 )
=
σ2
1
x22i (1 - r223 )
当 r23增大时,
^
Var( 2)
也增大
10
方差膨胀因子 (Variance Inflation Factor)
17 17
2、交叉相关系数(Cross correlation)
相关系数计算的是两组样本的同期相关程 度,交叉相关则可以表示不同期之间的相关 程度。
Eviews操作: Group窗口的view/cross correlation/输入 滞后期设定/ 输出结果阅读:看是否超出2倍标准差线
18
2倍 标准 差线
1、参数估计值有很大的偶然性。 2、参数显著性检验未通过。 3、经济意义检验未通过。 4、相关系数大。

第四章多重共线性

第四章多重共线性

第四章 多重共线性一、单项选择题1、完全的多重共线性是指解释变量的数据矩阵的秩( )(A )大于k (B )小于k(C )等于k (D )等于k+12、当模型存在严重的多重共线性时,OLS 估计量将不具备( )(A )线性 (B )无偏性(C )有效性 (D )一致性3、如果每两个解释变量的简单相关系数比较高,大于( )时则可认为存在着较严重的多重共线性。

(A )0.5 (B )0.6(C )0.7 (D )0.84、方差扩大因子VIF j 可用来度量多重共线性的严重程度,经验表明,VIF j ( )时,说明解释变量与其余解释变量间有严重的多重共线性。

(A )小于5 (B )大于1(C )小于1 (D )大于105、对于模型01122i i i i Y X X u βββ=+++,与r 23等于0相比,当r 23等于0.5时,3ˆβ的方差将是原来的( )(A )2倍 (B )1.5倍(C )1.33倍 (D )1.25倍6、无多重共线性是指数据矩阵的秩( )(A )小于k (B )等于k(C )大于k (D )等于k+17、无多重共线性假定是假定各解释变量之间不存在( )(A )线性关系 (B )非线性关系(C )自相关 (D )异方差8、经济变量之间具有共同变化的趋势时,由其构建的计量经济模型易产生( )(A )异方差 (B )自相关(C )多重共线性 (D )序列相关9、完全多重共线性产生的后果包括参数估计量的方差( )(A )增大 (B )减小(C )无穷大 (D )无穷小10、不完全多重共线性产生的后果包括参数估计量的方差( )(A )增大 (B )减小(C )无穷大 (D )无穷小11、不完全多重共线性下,对参数区间估计时,置信区间趋于( )(A )变大 (B )变小(C )不变 (D )难以估计12、较高的简单相关系数是多重共线性存在的( )(A )必要条件 (B )充分条件(C )充要条件 (D )并非条件13、方差扩大因子VIF j是由辅助回归的可决系数R j2计算而得,R j2越大,方差扩大因子VIF j就()(A)越大(B)越小(C)不变(D)无关14、解释变量间的多重共线性越弱,方差扩大因子VIF j就越接近于()(A)1 (B)2(C)0 (D)1015、多重共线性是一个()(A)样本特性(B)总体特性(C)模型特性(D)以上皆不对二、多项选择题1、多重共线性包括()(A)完全的多重共线性(B)不完全的多重共线性(C)解释变量间精确的线性关系(D)解释变量间近似的线性关系(E)非线性关系2、多重共线性产生的经济背景主要由()(A)经济变量之间具有共同变化趋势(B)模型中包含滞后变量(C)采用截面数据(D)样本数据自身的原因3、多重共线性检验的方法包括()(A)简单相关系数检验法(B)方差扩大因子法(C)直观判断法(D)逐步回归法(E)DW检验法4、修正多重共线性的经验方法包括()(A)剔除变量法(B)增大样本容量(C)变换模型形式(D)截面数据与时间序列数据并用(E)变量变换5、严重的多重共线性常常会出现下列情形()(A)适用OLS得到的回归参数估计值不稳定(B)回归系数的方差增大(C)回归方程高度显著的情况下,有些回归系数通不过显著性检验(D)回归系数的正负号得不到合理的经济解释三、名词解释1、多重共线性2、完全的多重共线性3、辅助回归4、方差扩大因子VIF j5、逐步回归法6、不完全的多重共线性四、简答题1、多重共线性的实质是什么?2、为什么会出现多重共线性?3、多重共线性对回归参数的估计有何影响?4、判断是否存在多重共线性的方法有那些?5、针对多重共线性采取的补救措施有那些?6、具有严重多重共线性的回归方程能否用来进行预测?五、辨析题1、在高度多重共线性的情形中,要评价一个或多个偏回归系数的单个显著性是不可能的。

第4章多重共线性

第4章多重共线性

计量经济学课程教案第四章 多重共线性§ 什么是多重共线性 一、多重共线性的概念 对于模型Y i =1+2X 2i +3X 3i++k X ki+ii=1,2,…,n其基本假设之一是解释变量是互相独立的。

如果存在c 1X 1i +c 2X 2i +…+c k X ki =0 i=1,2,…,n其中: c i 不全为0,则称为解释变量间存在完全共线性(perfectmulticollinearity )。

在矩阵表示的线性回归模型 Y=X+中,完全共线性指:秩(X)<k+1,即⎪⎪⎪⎪⎪⎭⎫⎝⎛=kn nn k k X X XX X X X X X X 212221212111111二、实际经济问题中的多重共线性一般地,产生多重共线性的主要原因有以下三个方面: (1)经济变量相关的共同趋势时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。

横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。

(2)滞后变量的引入在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。

例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性。

(3)样本资料的限制由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。

一般经验:时间序列数据样本:简单线性模型,往往存在多重共线性。

截面数据样本:问题不那么严重,但多重共线性仍然是存在的。

§ 多重共线性产生的后果一、完全共线性下参数估计量不存在μX βY +=的OLS 估计量为:Y X X X β''=-1)(ˆ如果存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。

二、近似共线性下OLS 估计量非有效 近似共线性下,可以得到OLS 参数估计量, 但参数估计量方差的表达式为12)()ˆ(-'=X X βσCov由于|X’X|0,引起(X’X)-1主对角线元素较大,使参数估计值的方差增大,OLS参数估计量非有效。

第四章多重共线性

第四章多重共线性

1 2 ˆ Var ( j ) VIFj 2 2 2 x j (1 Rj ) x j
2
注意:R 2 是多个解释变量辅助回归的多重可决系数, j
而相关系数
2 r23只是说明两个变量的线性关系 。
17
(一元回归中可决系数的数值等于相关系数的平方)
方差扩大因子的作用

VIFJ 1 (1 R2 ) j
2. 严重多重共线时,假设检验作出错误判断的概率增大 (A)参数的置信区间扩大,使得接受一个本应拒绝的假 设(“以假当真”的第二类错误)的概率增大
ˆ (B)因为 t 2 ˆ Var ( 2 ) ,当方差变大时 会使 t 值减
小,导致使本应否定的“参数为0”的原假设被接受。
(该解释变量本来有显著影响,而检验结果却为无显著影响) 10
x y x ) x y x
3i i 2 2i
2i i 2 2i
对比一元回归时
ˆ 2
x y x
i 2 i
6
i
这种情况下多元回归是否还有必要呢?
一、存在完全多重共线性时 ——OLS估计式变得不确定、不精确
1. 解释变量完全线性相关时 ——OLS 估计式不确定 ▲ 从OLS估计式看:此时 X 3i X 2i 可以证明(见教材108页)
●多重共线性的影响程度与解释变量在方程中的
相对“地位”有关
11
●多重共线性的后果与研究目的有关:如果研究目的 仅在于预测Y,而解释变量X之间的多重共线性关系的性 质在未来将继续保持(前提条件),这时多重共线性可 能并不是严重问题,而应着重于可决系数高,F检验显 著。
(理解:出现高度共线性时,虽然无法精确估计个别回归系 数,但可精确估计这些系数的某些线性组合。)

计量经济学(第四章多重共线性)


06
总结与展望
研究结论总结
多重共线性现象普遍存在于经济数据中,对计量 经济学模型的估计和解释产生了重要影响。
通过使用多种诊断方法,如相关系数矩阵、方差膨 胀因子(VIF)和条件指数(CI),可以有效地识别 多重共线性问题。
在存在多重共线性的情况下,普通最小二乘法 (OLS)估计量虽然仍然是无偏的,但其方差可能 变得很大,导致估计结果不稳定。
主成分分析法的优点
可以消除多重共线性的影响,同 时降低自变量的维度,简化模型。
岭回归法
岭回归法的基本思想
通过在损失函数中加入L2正则化项(即所有自变量的平方和),使得回归系数的估计更加稳定, 从而消除多重共线性的影响。
岭回归法的步骤
首先确定正则化参数λ的值,然后求解包含L2正则化项的损失函数最小化问题,得到岭回归系数的估 计值。
逐步回归法的优点
可以自动选择重要的自变量,同时消除多重共线性的影响。
主成分分析法
主成分分析法的基本思想
通过正交变换将原始自变量转换 为互不相关的主成分,然后选择 少数几个主成分进行回归分析。
主成分分析法的步骤
首先对原始自变量进行标准化处理, 然后计算相关系数矩阵并进行特征值 分解,得到主成分及其对应的特征向 量。最后,选择少数几个主成分作为 新的自变量进行回归分析。
岭回归法的优点
可以有效地处理多重共线性问题,同时避免过拟合现象的发生。此外,岭回归法还可以提供对所 有自变量的系数进行压缩估计的功能,使得模型更加简洁易懂。
05
实证研究与结果分

数据来源及预处理
数据来源
本研究采用的数据集来自于公开的统 计数据库,涵盖了多个经济指标和影 响因素的观测值。
数据预处理

第四章多重共线性实例


表 4.3.3 中国粮食生产与相关投入资料
农业化肥施 粮食播种面 受灾面积 农业机械总
用量 X 1
(万公斤)
积X 2
(千公顷)
X3
(公顷)
动力X 4
(万千瓦)
1659.8
114047 16209.3
18022
1739.8
112884 15264.0
19497
1775.8
108845 22705.3
20913
Yˆ 28259.19 2.240X5
(-1.04) (2.66) R2=0.3064 F=7.07 DW=0.36
• 可见,应选第1个式子为初始的回归模型。
4、逐步回归
将其他解释变量分别导入上述初始回归模型,寻 找最佳回归方程。
C
X1 X2 X3
X4
X5
R2
DW
Y=f(X1)
30868 4.23
0.8852 1.56
t值
25.58 11.49
Y=f(X1,X2)
-43871 4.65 0.67
0.9558 2.01
t值
-3.02 18.47 5.16
Y=f(X1,X2,X3)
-11978 5.26 0.41 -0.19
0.9752 1.53
t值
0.85
19.6 3.35 -3.57
Y=f(X1,X2,X3,X4) -13056 6.17 0.42 -0.17 -0.09
1930.6
110933 23656.0
22950
1999.3
111268 20392.7
24836
2141.5
110123 23944.7

计量经济学第四章 多重共线性


x2i


3 2
x3i

x3i
参数的估计值为:
ˆ2
x32i x2i yi x2i x3i x3i yi
(
x22i )(
x32i ) (
x2i
x 3i
)2
x32i
2
x3i yi x32i 2 2
x32i x32i
x2i x3i x22i
x2i x3i
ˆ1 Y ˆ2 X 2 ˆ3 X 3
ˆ2
x32i x2i yi x2i x3i x3i yi ( x22i )( x32i ) ( x2i x3i )2
ˆ3
x22i x3i yi x2i x3i x2i yi •
(
x22i )(
x32i ) (
x2i
x 3i
)
2
x2i yi x3i yi
x2i x3i x32i
4.2多重共线性的后果
如果X1和X2完全线性相关,则存在非0的λ使得:
1 2 X 2i 3 X 3i 0
则有:
1 2 X 2 3 X 3 0
2 X 2i X 2 3 X3i X3 0
X 2i X3i X 2iYi
X
2 3i

X
3iYi


VAR
COV
(βˆ )


2
(XX)1


2

N X 2i


X 3i
X2i
X
2 2i
X 2i X 3i

第四章第四节 多重共线性的补救措施

Yt 1 2 X 2t 3 X 3t ut
其中, Yt 为商品的消费量, X 2t 为商品的价格,X3t 为消费者收入,若通过抽样调查得到截面数据从而
求得消费者收入的边际消费倾向估计量 ˆ3 ,则上式
变为:
Yt ˆ3 X3t 1 2 X2t ut
令 Yt* Yt ˆ3X3t ,则 Yt* 1 2 X 2t ut
如果原模型(4.4.13)式存在严重的多重共 线性,那么一般情况下,经过差分变换后 会对减轻或消除多重共线性。但是在对一 阶差分式的估计中极有可能会出现 ut 序 列相关的问题,将不满足高斯-马尔可夫 定理(古典假设)。所以,一般情况下, 差分形式应慎用。
五、逐步回归法
基本做法:1.将被解释变量Y对每一个解 释变量 Xi (i 1,2,, k) 分别进行回归,对每一个 回归方程根据经济理论和统计检验进行综合分 析判断,从中挑选出一个最优的基本回归方程。 2.在此基础上,再逐一引入其他解释变量,重 新作回归,逐步扩大模型的规模,直至从综合 情况看出现最好的模型估计形式。
但是劳动力的增长同资本的增长随时间的变换呈高
度相关。如果已知规模报酬不变,即 1 ,则 生产函数变为:
Qt

ALt
K
1 t
从而有:
ห้องสมุดไป่ตู้
Qt Kt

A( Lt ) Kt
Qt
Lt
其中 Kt 为资本产出率, Kt 为劳动对资本的
投入率。将上式两边去对数得:
ln( Qt ) ln A ln( Lt )

1


* 2
X 3t X 2t
ut
可回避原模型的多重共线性。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2014年1月16日
山东财经大学统计学院计量经济教研室
第11页
机动 目录 上页 下页 返回 结束
3.模型中包含滞后变量。 在经济计量模型中,往往需要引入滞后经济 变量来反映真实的经济关系。 例如,消费= f (当期收入, 前期收入) 由于变量与其滞后期变量常常呈现高度相关 性,于是导致出现多重共线性。
第四章
多重共线性
多重共线性(Multicollinearity)一词由弗里希 (Ragnar Frisch,1895—1973)于1934年引入。 原意是指回归模型中的部分或全部解释变量 之间存在完全的线性关系,是对假定MLR.3的违 背,后来人们将这个概念扩展到近似的线性关系。 多重共线性是多元回归建模过程中最常遇到 的问题。本章中我们首先分析与界定完全多重共 线性与多重共线性,探讨多重共线性可能引起的 后果,然后介绍多重共线性的诊断与缓解多重共 线性的补救措施。
2014年1月16日 山东财经大学统计学院计量经济教研室 第 1页
机动 目录 上页 下页 返回 结束
学习目标: 1、了解多重共线性的概念、能区分完全的多重 共线性与多重共线性; 2、了解多重共线性产生的原因; 3、理解多重共线性引起的后果; 4、理解并掌握多重共线性的诊断; 5、掌握缓解多重共线性问题的处理方法。 重点与难点: 理解多重共线性是一种样本现象; 深刻理解多重共线性的理论后果与实际后果; 掌握多重共线性的诊断及多重共线性问题的 处理方法。
理想地,为了分别评价收入和财富对消费支出的影 响,我们需要对财富多而收入低以及财富少而收入高的 人们进行足够多的样本观测。虽然在横截面研究中(通 过增加样本的方法)有可能做到这一点,但考虑到研究 者一般都是被动的采用第二手资料(指由他人收集的数 据或由统计年鉴得来的数据),对样本数据的多少似乎 无能为力。
果无法得到合理解释。
(二)参数估计值的方差增大 第三章我们已经推断出,对于多元线性回归模型
yi 0 1 x1i 2 x2i ki xk ui
在古典假设成立条件下,参数的OLSE 的方差 2 u 1 2 ˆ var( j ) ( X'X ) jj u 2 2 ( x x ) (1 R ji j j)
2 ( x x ) 1 1 2 ˆ 2
(x
1 2
x1 ) 2
2 ˆ 2
ˆ ) 同理,可以证明 var( 2
2014年1月16日 山东财经大学统计学院计量经济教研室 第 7页
机动 目录 上页 下页 返回 结束
用矩阵代数的术语来讲,由于参数的OLSE为
1 ˆ ( X'X ) X'Y
2 (1)误差方差 u : 2 从方程(4.5)容易看到, u 越大意味着OLS估计 2 量的方差就越大。由于 u 是总体的一个特征,所以它 与样本容量无关。它是(4.5)中未知因素的一个组成 部分。
2014年1月16日 山东财经大学统计学院计量经济教研室 第 3页
机动 目录 上页 下页 返回 结束
时就称解释变量 x j ( j 1, 2,..., k ) 之间不存在
完全的多重共线性。
对于模型
yi=0+1x1i+2x2i++kxki+ui
i=1,2,…,n
如果存在某解释变量是其他解释变量的线 性组合,则称为存在完全多重共线性(Complete Multicollinearity, Exact Multicollinearity) 即:若存在一组不全为零的常数 0 , 1 , 2 ,, k
2 2 x ( x x ) R 其中 ji 为变量 j 样本变异(方差),而 j j 则是将 x j 对所有其他解释变量(并包括截距项)进行回 2 ˆ 的方差取决于三 R 归所得到的 。方程(4.5)表明, j 2 个因素:误差方差 u 、变量 x j 样本变异(方差) 2 2 ( x x ) R ji j 和自变量之间的线性关系 j 。
2014年1月16日 山东财经大学统计学院计量经济教研室 第10页
机动 目录 上页 下页 返回 结束
2.模型或从中取样的总体受到约束。
(1)对于截面数据,许多变量变化与发展规模相关, 会呈现出共同增长的趋势,例如资本、劳动力、科技、能 源等投入与产出的规模相关,这时容易出现多重共线性。 (2)有时如果出现部分因素的变化与另一部分因素 的变化相关程度较高时,也容易出现共线性。如用粮食产 量对化肥用量、水浇地面积、农业投入资金进行回归,发 现回归效果较差,原因是农业资金的影响已经通过化肥用 量、水浇地面积两个因素体现出来。
2014年1月16日
山东财经大学统计学院计量经济教研室
第12页
机动 目录 上页 下页 返回 结束
4.样本资料的限制 例如,抽样仅仅限于总体中解释变量取值的一个 有限范围,使得变量变异不大;或由于总体受限, 多个解释变量的样本数据之间存在相关,这时都可 能出现多重共线性。
5.过度决定的模型。 这种情况出现在解释变量个数大于观测次数时。例 如,在医药研究中可能只有少数病人,但却要在他们身 上收集大量的变量信息。
2014年1月16日 山东财经大学统计学院计量经济教研室 第15页
机动 目录 上页 下页 返回 结束
三、多重共线性引起的后果
近似多重共线性并不违反回归假定。无偏的、有 效的、一致的参数估计量仍可以得出,其标准误也仍 将被正确估计。理论上,多重共线性的唯一影响是难 以得到标准误较小的系数估计值。由于观测次数过少、 自变量的方差过小时也会产生这种影响。所以,从理 论的高度看,近似多重共线性、过少的观测次数以及 过小的自变量方差,实质上是同一问题。尽管近似多 重共线性不影响OLS估计量的BLUE性质,但在任给 一个样本中,可能会出现如下后果:
2014年1月16日
山东财经大学统计学院计量经济教研室
第13页
机动 目录 上页 下页 返回 结束
需要强调的是,多重共线性本质上是一种样本现 象。意思是说,即使在总体中解释变量之间没有线性 关系,但在具体获得的样本中仍可能存在线性关系: 当我们设想一个理论或总体回归函数时,我们相信, 我们选择的变量x对y都有各自的独立的影响 。但有可 能在任给的一个用以检验总体回归函数的样本中,一 些或全部x变量之间共线性却是如此之高,以致我们无 法区分它们对y的各自影响。尽管理论告诉我们,所有 的x变量都重要,但我们的样本还是没有“富裕”到足以 在分析中容纳全部的变量的境况。 考虑消费函数的例子。经济学家从理论上推知除 收入(x1)外,消费者的财富(x2)也是消费支出(y) 的重要决定因素。于是消费者的消费函数可以写成:
2014年1月16日 山东财经大学统计学院计量经济教研室 第 2页
机动 目录 上页 下页 返回 结束
第一节 多重共线性问题及其对建模的影响
一、多重共线性的含义
广义的多重共线性包括完全多重共线性和近似 多重共线性。狭义的的多重共线性指的是近似多 重共线性。如果不特加说明,本章使用的是狭义 的多重共线性。 (一)完全多重共线性 多元线性回归模型的古典假定MLR.3是,模型 中解释变量之间不存在完全的线性相关关系,此
机动 目录
(4.2)
如果有 x2i 2 x1i ,则(4.2)式可写为:
上页
下页
返回
结束
我们只能估计出系数的线性组合 ( 1 2 2 ) 的样本
估计值,而无法得到1和 2 的具体估计。且可以证明 参数估计量的方差为无穷大。
ˆ) var( 1
2 ( x x ) 1i 1
多元线性回归模型中如果存在完全多重共线性, 则参数的最小二乘估计量是不确定的(即无法估计)。 例如二元线性回归模型
yi 0 1 x1i 2 x2i ui
yi 0 ( 1 2 2 ) x1i ui
2014年1月16日 山东财经大学统计学院计量经济教研室 第 6页
(x
2 2 x ) ( x x ) [ ( x1i x1 )( x2i x2 )] 1i 1 2i 2
2 ˆ 2
4 ( x1i x1 ) 2 ( x1i x1 ) 4[ ( x1i x1 )( x1i x1 )] 4[ ( x1i x1 ) 2 ]2 4[ ( x1i x1 ) 2 ]
2014年1月16日 山东财经大学统计学院计量经济教研室 第17页
机动 目录
( j 0,1, 2,, k )
上页
下页
返回
结束
ˆ ) ( X'X ) 1 2 var( j jj u
2 2 ( x x ) (1 R ji j j)
u2
( j 0,1, 2,, k )
使得:
2014年1月16日
0 1 x1 2 x2 k xk 0
第 4页
机动 目录 上页 下页
0
山东财经大学统计学院计量经济教研室
返回
结束
则称模型存在完全多重共线性。
用矩阵表示,解释变量的观测值矩阵为
1 x11 1 x 12 X 1 x1n x21 xk1 x22 xk1 x2 n xkn(X)<k+1,即
在数据矩阵X中,至少有一列向量可由其他 列向量线性表示。
2014年1月16日 山东财经大学统计学院计量经济教研室 第 5页
机动 目录 上页 下页 返回 结束
需要强调的是模型中存在完全的多重共线性非 常罕见,一般来讲,通常发生在确定回归变量出错 的时候,即模型中变量选择出现逻辑错误。
(一)估计结果不好解释 存在多重共线性时,尽管可以得到参数的估计值,
2014年1月16日 山东财经大学统计学院计量经济教研室 第16页
机动 目录 上页 下页 返回 结束
相关文档
最新文档