第六章 多重共线性
古扎拉蒂计量经济学第四版讲义Ch6 Multicollinearity

∗
∑c x
j =2 j
K
∗ j
≅0
3.32
符号 ≅ 表示,如果右端确实等于 0,那么这种线性依赖关系就是 exact,而且 X ' X 不再存在。
2
Use of eigenvalues and eigenvectors to explain multicollinearity 考虑相关系数形式的 X ' X 矩阵。 我们知道,总存在一个正交矩阵(orthogonal matrix) V = [ v 2 v 3 " v K ] ,使得
−1 2
( X ' X)
−1
中的 ( X ' X ) 不存在或无限大。
−1
课本以三元回归模型为例,写出β系数的表达式,比如
b2
∑ ( y − y )( x − x ) ∑ ( x − x ) − ∑ ( y − y )( x − x ) ∑ ( x − x )( x = x − x )( x − x ) ∑( x − x ) ∑(x − x ) − ∑ (
2)实际结果 In case of near or high multicollinearity, one is likely to encounter the following consequences: 1. Although BLUE, the OLS estimators have large variances and covariances, making precise estimation difficult. 2. Due to consequence 1, the confidence intervals tend to be much wider, leading to the acceptance of the zero null hypothesis more readily. 3. Also due to consequence 1, the t ratio of one or more coefficients tends to be statistically
多重共线性

多重共线性多重共线性(multicollinearity )的特征● 多重共线性是指一个回归模型中的一些或全部解释变量之间存在有一种“完全”或准确的线性关系:0...2211=+++k k X X X λλλ其中k λλλ,...,,21为常数,但不同时为零。
● 0...2211≈+++k k X X X λλλ, 近似的多重共线性● 通过巴伦坦图做简单的描述。
共线性部分可用两圆圈的重叠部分来衡量。
重叠部分越大,共线性程度越高。
● 我们定义的多重共线性仅对X 变量之间的线性关系而言,它们之间的非线性关系并不违反无多重共线性的假设i i i i u X X Y +++=2210βββ多重共线性的后果●如果多重共线性是完全的,诸X变量的回归系数将是不正确的,并且它们的标准误差为无穷大●如果多重共线性是不完全的,那末,虽然回归系数可以确定,却有较大的标准误差,意思是,系数不能以很高的精确或准精确加以估计,这会导致:-参数估计不精确,也不稳定-参数估计量的标准差较大,影响系数的显著性检验●多重共线性产生的后果具有一定的不确定性●在近似的多重共线性的情况下,只要模型满足CLRM 假定,回归系数就为BLUE,但特定的样本估计量并不一定等于真值。
多重共线性的来源(1)许多经济变量在时间上由共同变动的趋势,如:收入,投资,消费(2)把一些经济变量的滞后值也作为解释变量在模型中使用,而解释变量和滞后变量通常相关,如:消费和过去的收入多重共线性一般与时间序列有关,但在横截面数据中也经常出现多重共线性的检验● 多重共线性是普遍存在的,造成的后果也比较复杂,对多重共线性的检验缺少统一的准则- 对有两个解释变量的模型,作散点图,或相 关系数,或拟和优度R平方。
- 对有多个解释变量的模型,分别用一个解释 变量对其它解释变量进行线性回归,计算拟 和优度22221,...,,k R R R- 考察参数估计值的符号,符不符合理论 - 增加或减少解释变量,考察参数估计值的变 化- 对比拟和优度和t检验值多重共线性的修正方法● 增加样本观测值,如果多重共线性是由样本引起的,可以通过收集更多的观测值增加样本容量。
多重共线性(统计累赘)的概念、特征及其测量方式和处理方式

试述多重共线性(统计累赘)的概念、特征及其测量方式和处理方式。
1、概念多重共线性是指自变量之间存在线性相关关。
倘若其中两个自变项的关系特别强,则在相互控制后就会使每者的效果减弱,而其他的变相的效果就会因此而增大。
2、特征3、产生原因产生多重相关性的原因主要包括四方面。
一是没有足够多的样本数据; 二是选取的自变量之间客观上就有共线性的关系; 还可能由其它因素导致, 如数据采集所用的方法, 模型设定, 一个过度决定的模型等。
但多数研究者认为共线性本质上是由于样本数据不足引起的。
4、测量方式(1)经验式的诊断方法通过观察,得到一些多重相关性严重存在的迹象。
①在自变量的简单相关系数矩阵中,有某些自变量的相关系数值较大。
②回归系数的代数符号与专业知识或一般经验相反;或者该自变量与因变量的简单相关系数符号相反。
③对重要自变量的回归系数进行t 检验,其结果不显著。
特别是当F 检验能在高精度下通过,测定系数R 2的值也很大,但自变量的t 检验却全都不显著,这时多重相关性的可能将会很大。
④如果增加或删除一个变量,或者增加或删除一个观测值,回归系数发生了明显的变化。
⑤重要自变量的回归系数置信区别明显过大。
⑥在自变量中,某一个自变量是另一部分自变量的完全或近似完全的线性组合。
⑦对于一般的观测数据,如果样本点的个数过少,比如接近于变量的个数或者少于变量的个数,样本数据中的多重相关性就会经常存在。
(2)统计检验方法共线性的诊断方法是基于对自变量的观测数据构成的矩阵X ’X 进行分析,使用各种反映自变量间相关性的指标。
共线性诊断常用的统计量有方差膨胀因子VIF 或容限TOL 、条件指数和方差比例等。
方差膨胀因子VIF 是指回归系数的估计量由于自变量的共线性使其方差增加的一个相对度量。
对于第i 个回归系数,它的方差膨胀因子定义为:VIF=1/1-R 2=1/TOL i 其中R2i 是自变量Xi 对模型中其余自变量线性回归模型的R 平方。
多重共线性

多重共线性基本概念(1)多重共线性; (2)完全多重共线性;(3)不完全多重共线性;练习题1、什么是变量之间的多重共线性?举例说明。
2、判断题:(1)存在完全多重共线性时,模型参数无法估计;(2)存在多重共线性时,一定会使参数估计值的方差增大,从而造成估计效率的损失; 3、完全多重共线性和不完全多重共线性之间的区别是什么? 4、产生多重共线性的经济背景是什么?5、多重共线性的危害是什么?为什么会造成这些危害?检验多重共线性的方法思路是什么?有哪些克服方法?6、考虑下列一组数据Y-10 -8 -6 -4 -2 0 2 4 6 8 10 2X 1 2 3 4 5 6 7 8 9 10 11 3X13579111315171921现在我们进行如下的回归分析:12233i i Y X X u βββ=+++请回答如下问题:(1)你能估计出该模型的参数吗?为什么? (2)如果不能,你能估计哪一参数或参数组合? 7、将下列函数用适当的方法消除多重共线性: (1)消费函数为012C W P u βββ=+++其中C 、W 、P 分别表示消费、工资收入和非工资收入,W 和P 可能高度相关,但研究表明122ββ=。
(2)需求函数为0123s Q Y P P u ββββ=++++其中Q 、Y 、P 和s P 分别为需求量、收入水平、该商品价格水平及其替代品价格水平,P 和s P可能高度相关。
基本概念解释(1)多重共线性指两个或两个以上解释变量之间存在某种线性相关关系。
(2)完全多重共线性指,在有多个解释变量模型中,解释变量之间的线性关系是准确的。
在此情况下,不能估计解释变量各自对被解释变量的影响。
(3)不完全多重共线性指,在实际经济活动中,多个解释变量之间存在多重共线性问题,但解释变量之间的线性关系是近似的,而不是完全的。
练习题答案1、如果在经典回归模型Y X U β=+中,如果基本假定6遭到破坏,则有()1k r x k <+,此时称解释变量之间存在完全多重共线性。
计量经济学习题第6章多重共线性

计量经济学习题第6章多重共线性第6章多重共线性⼀、单项选择题1、当模型存在严重的多重共线性时,OLS估计量将不具备()A、线性B、⽆偏性C、有效性D、⼀致性2、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF()A、⼤于B、⼩于C、⼤于5D、⼩于53、模型中引⼊实际上与解释变量有关的变量,会导致参数的OLS估计量⽅差()A、增⼤B、减⼩C、有偏D、⾮有效4、对于模型y t=b0+b1x1t+b2x2t+u t,与r12=0相⽐,r12=0.5时,估计量的⽅差将是原来的()A、1倍B、1.33倍C、1.8倍D、2倍5、如果⽅差膨胀因⼦VIF=10,则什么问题是严重的()A、异⽅差问题B、序列相关问题C、多重共线性问题D、解释变量与随机项的相关性6、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( )A 异⽅差B 序列相关C 多重共线性D ⾼拟合优度7、存在严重的多重共线性时,参数估计的标准差()A、变⼤B、变⼩C、⽆法估计D、⽆穷⼤8、完全多重共线性时,下列判断不正确的是()A、参数⽆法估计B、只能估计参数的线性组合C、模型的拟合程度不能判断D、可以计算模型的拟合程度⼆、多项选择题1、下列哪些回归分析中很可能出现多重共线性问题()A、资本投⼊与劳动投⼊两个变量同时作为⽣产函数的解释变量B、消费作被解释变量,收⼊作解释变量的消费函数C、本期收⼊和前期收⼊同时作为消费的解释变量的消费函数D、商品价格、地区、消费风俗同时作为解释变量的需求函数E、每亩施肥量、每亩施肥量的平⽅同时作为⼩麦亩产的解释变量的模型2、当模型中解释变量间存在⾼度的多重共线性时()A、各个解释变量对被解释变量的影响将难以精确鉴别B、部分解释变量与随机误差项之间将⾼度相关C、估计量的精度将⼤幅度下降D、估计对于样本容量的变动将⼗分敏感E、模型的随机误差项也将序列相关3、下述统计量可以⽤来检验多重共线性的严重性()A、相关系数B、DW值C、⽅差膨胀因⼦D、特征值E、⾃相关系数4、多重共线性产⽣的原因主要有()A、经济变量之间往往存在同⽅向的变化趋势B、经济变量之间往往存在着密切的关联C、在模型中采⽤滞后变量也容易产⽣多重共线性D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性E、以上都正确5、多重共线性的解决⽅法主要有()A、保留重要的解释变量,去掉次要的或替代的解释变量B、利⽤先验信息改变参数的约束形式C、变换模型的形式D、综合使⽤时序数据与截⾯数据E、逐步回归法以及增加样本容量6、关于多重共线性,判断错误的有()A、解释变量两两不相关,则不存在多重共线性B、所有的t检验都不显著,则说明模型总体是不显著的C、有多重共线性的计量经济模型没有应⽤的意义D、存在严重的多重共线性的模型不能⽤于结构分析7、模型存在完全多重共线性时,下列判断正确的是()A、参数⽆法估计B、只能估计参数的线性组合C、模型的判定系数为0D、模型的判定系数为1三、简述1、什么是多重共线性?产⽣多重共线性的原因是什么?2、什么是完全多重共线性?什么是不完全多重共线性?3、完全多重共线性对OLS估计量的影响有哪些?4、不完全多重共线性对OLS估计量的影响有哪些?5、从哪些症状中可以判断可能存在多重共线性?6、什么是⽅差膨胀因⼦检验法?四、判断(1)如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。
第6章多重共线性

浙江财经学院 倪伟才
12
例题
例3.3的多重共线性
注意:消费额前面的系数为负的,者符 合常识吗?
题后语:整个回归方程作为整体高度显 著(通过F检验),但有些回归系数不能 通过显著性检验,甚至出现正负号得不 到合理的解释,此时应考虑是否存在多 重共线性。
浙江财经学院 倪伟才
13
四、多重共线性的诊断
(1)R2高,F检验显著,但t检验不显著。
Variable |
VIF
1/VIF
-------------+----------------------
x1 | 482.13 0.002074
x2 | 482.13 0.002074
-------------+----------------------
Mean VIF | 482.13
浙江财经学院 倪伟才
浙江财经学院 倪伟才
17
例题讲解
例3.3多重共线性的判断。(VIF) 1通过辅助回归计算x1的VIF 练习:计算x2的VIF 2:直接产生VIF 3:考虑x1,x2的偏相关系数:0.9776
浙江财经学院 倪伟才
18
stata
相关命令请参考
数据:消费和收入财富的多重共线性.dta reg y x1 x2 vif
浙江财经学院 倪伟才
11
2.近似完全多重共线性的后果
将xi2 xi1 i 代入ˆ1
ˆ1=
(yi x i1 )(2
x
2 i1
i2 ) - (
yi xi1
yii )(
xi21( 2 xi21 i2 ) ( xi21)2
x
2 i1
)
①将x2=λx1+v代入^1说明x2,x1共线性程度越 高,即v越趋于0,从而^1 趋于不确定。② var(^1 )会增大;③参数显著性检验的t统计量: t= ^1 / [var(^1 )] (1/2) ,存在共线时,var(^1 ) 会增大,t值会变小。对于给定,当|t|<t(/2) , 接受 原假设(相关系数0)表明x1对y的影响不显著。总 之,实际上x1对y的影响是显著的,但由于共线性, 可导致x1对y的影响不显著的!
计量经济第六章多重共线性

• 2、数据采集的范围有限,或采集 的样本量小于模型的自变量个数。
• 如在罕见疾病的研究过程中,由于病 情罕见、病因又相当复杂,而只能在 少数的患者身上采集大量的变量信息。
3、模型中采用滞后变量
在计量经济模型中,往往需要引入 滞后变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相 关性。
up
三、方差膨胀因子法
• 自变量间的共线性程度越大时,VIF值也随之 增大。所以也可利用方差膨胀因子来检验 多重共线性问题。 • 一般来说,当VIF >10时,表明 涉及的两个 变量存在高度线性相关,模型存在不完全 多重共线性。
P111 【经典实例】
• 计算得到的方差膨胀因子值分别为
VIF1 =10000,VIF2 =10000,VIF3 =9.6525,VIF4 =11.5875
2 2 2 1
同理易得
ˆ ) Var( 2
• EVIEWS遇到完全多重共线性时,会 显示 • Near singular matrix,无法进行估 计
2、不完全多重共线性下的后果
(1)估计量的方差增大 2 2 x 2 ˆ) 由于 Var ( 1 2 x12x2 (x1 x2 )2
• 可以看出,除了 VIF3 10 ,其余的方 差膨胀因子值均大于10,表明模型中 存在较严重的多重共线性问题。
up
第三节 多重共线性的修正 一、改变模型的形式 二、删除自变量 三、减少参数估计量的方差 四、其它方法 习题
up
• 一、改变模型的形式
• (一)变换模型的函数形式
• 例如将线性回归模型转化为对数模 型或者多项式模型。 • (二)改变模型的自变量的形式
多重共线性

2.采用综合统计检验法
R2与F值较大,但t检验值较小,说明各解释变量对Y的联合线 性作用显著,但各解释变量间存在共线性而使得它们对Y的独 立作用不能分辨,故t检验不显著。
3.3 多重共线性
3、辅助回归模型检验 通过每个解释变量对其它解释变量的辅助回归模型
xi a0 a1 x1 ai 1 xi 1 ai 1 xi 1 ak xk
3.3多重共线性
• • • • 多重共线性及其产生原因 多重共线性的后果 多重共线性的检验 多重共线性的方法
一、多重共线性及其产生原因
1.多重共线性的概念---解释变量间相关
对于多元线性回归模型 yi=b0+b1x1i+b2x2i+…+bkxki+εi 存在一组不全为零的常数λ1,λ2,…λk,使得 λ1x1i + λ2x2i +…+ λkxki +νi=0 其中νi是一个随机误差项,则称模型存在着多重共线性。 “共线性”:变量间线性相关 “多重”:多种组合 “完全多重共线性”: νi=0
3.3 多重共线性
例5.服装需求函数。根据理论和经验分析,影响居民服 装需求的主要因素有:可支配收入X、流动资产拥有量 K、服装类价格指数P1和总物价指数P0 。教材P124的表 3-4给出了有关统计资料。 设服装需求函数为 :Y=a+b1x+b2P1+b3P0+b4K+ε (1)相关系数检验 键入:COR Y X K P1 P0 输出的相关系数矩阵为:
3.3 多重共线性
2、间接剔除重要的解释变量 ⑴利用附加信息
例如,著名的Cobb-Dauglas 生产函数中
附加信息: α +β =1 则
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x
2 1i
x ( x1i x2i )
2 2i
2 2 x2 i
2
1 ( x1i x2i ) 2
2 / x12i
2 2 x x 1i 2i
2 恰为 X 与 X 的线性相关系数的平方 r 1 2 x x
2 1i 2 2i
( x1i x 2i ) 2
1 2 2 x 1 r 1i
如果某两个或多个解释变量之间出现了相关 性,则称为多重共线性(Multi-collinearity)。
(一)多重共线性的类型
如果存在 c1X1i+c2X2i+…+ + +ckXki=0 i=1,2,…, =1 2 n 其中 : ci不全为 0 ,则称为解释变量间存在完全共线 性(perfect multicollinearity)。 如果存在 c1X1i+c2X2i+…+ckXki+vi=0 i=1,2,…,n 其中 ci 不全为 0 , vi 为随机误差项,则称为近似线性相 关的,或近似共线性( approximate multicollinearity )。
2
由于 r2 1,故 故 1/(11/(1 r2 )1
当完全不共线时,
r2
=0
当近似共线时, 0< r2 <1
2 1 ˆ ) var( 1 2 2 2 x 1 r x 1i 1i
ˆ ) 2 / x2 var( 1i 1
2
多 共线性使 数估计值 方 增大 1/(1-r 多重共线性使参数估计值的方差增大, ( 2)为 方差膨胀因子(Variance Inflation Factor, VIF)
5. 模型的预测功能失效
变大的方差容易使参数的置信区间明显变大,使预测失 去意义。
注意
除非是完全共线性,多重共线性并不意味着任何基本假
设的违背; 因此,即使出现较高程度的多重共线性,OLS估计量仍 具有线性性等良好的统计性质。 问题在于,即使OLS法仍是最好的估计方法,它却不是 “完美的”,尤其是在统计推断上无法给出真正有用的信 息。
二、实际经济问题中的多重共线性
一般地,产生多重共线性的主要原因有以下三个方面: (1)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济变量(收 入 消费 投资 价格)都趋于增长 衰退时期 又同 入、消费、投资、价格)都趋于增长;衰退时期,又同 时趋于下降。 横截面数据:生产函数中,资本投入与劳动力投入往往 出现高度相关情况,大企业二者都大,小企业都小。
第六章
多重共线性
一、多重共线性的概念 二 实际经济问题中的多重共线性 二、实际经济问题中的多重共线性 三、多重共线性的后果 四 多重共线性的检验 四、多重共线性的检验 五、多重共线性的修正方法 六、案例
一、多重共线性的概念
对于模型 Yi=0+1X1i+2X2i++kXki+i i=1,2,…,n i=1 2 n 其基本假设之一是解释变量是互相独立的。
2 1 ˆ Var ( ) ( X X)
由于|X’X|0,引起 ( XX) 1 主对角线元素较大, 使参数估计值的方差增大 OLS参数估计量的假设检 使参数估计值的方差增大, 验失效。
仍以二元线性模型 y=1x1+2x2+ 为例:
ˆ ) 2 ( X X ) 1 var( 1 11
(2)方差膨胀因子检验
ˆ 的方差为: 多元线性回归模型, j 2 2 1 ˆ ) var( j 2 2
( X
ij
X j ) 1 Rj
( X
ij
Xj)
2
VIFj
2 其中 其中, X j 关于其他解释变量辅助回归模 Rj 为 型的判定系数。 一般当VIF 10 ,认为模型存在较严重的多 重共线性。
具体可进一步对上述回归方程作F检验:
构造如下F统计量 R2 j . /( k 2) Fj ~ F (k 2, n k 1) 2 (1 R j . ) /( n k 1) 式中: R 2 为第j个解释变量对其他解释变量的回归 j 2 R 方程的决定系数,若存在较强的共线性,则j 较大 (1 R 2 且接近于1,这时 较小,从而 的值较大。 Fj j) 因此,给定显著性水平,计算F值,并与相应的临 界值比较,来判定是否存在相关性。
整理可得:
log Y log K log A log L log K Y L log log A log K K 最后这个函数相当于两变量线性回归模型,当 然不会有多重共线性问题。
3、逐步回归法
以Y为被解释变量,逐个引入解释变量,构成回归模型, 进行模型估计。 根据拟合优度的变化决定新引入的变量是否应该保留。 如果拟合优度变化显著,且回归系数的t检验在统计 上是显著的,则在模型中可以保留该解释变量; 如果拟合优度变化很不显著,且对其他回归系数的检 如果拟合优度变化很不显著 且对其他回归系数的检 验没有什么影响,则应从模型中剔除该变量; 如果拟合优度发生变化,且对其他回归系数显著性也 如 拟合优度发生变化 对其他 归系数 著性也 有影响,则应找出与其相关的解释变量,保留贡献较大的那 个。
2.
判明存在多重共线性的范围
如果存在多重共线性,需进一步确定究竟由哪些 变量引起。 变量引起 (1) 判定系数检验法 使模型中每一个解释变量分别以其余解释变量为 解释变量进行回归,并计算相应的拟合优度 R 2 。 如果某一辅助回归: Xji=1X1i+2X2i+LXLi 的判定系数较大 说明Xj与其他X间存在共线性。 的判定系数较大,说明 间存在共线性
2、近似或者不完全多重共线性的情形
ˆ 145.37 2.7975X 0.3191X Y i 2i 4i se (120.06) (0.8122) (0.4003) t =(1.2107) (1 2107) (-3.4444) ( 3 4444) (-0.7971) ( 0 7971)
(3)样本资料的限制
由于完全符合理论模型所要求的样本数据较难收 集 特定样本可能存在某种程度的多重共线性 集,特定样本可能存在某种程度的多重共线性。 一般经验: 时间序列数据样本:简单线性模型,往往存在 多重共线性。 截面数据样本:问题不那么严重,但多重共线 性仍然是存在的。 性仍然是存在的
三、多重共线性的后果
四、多重共线性的检验
多重共线性表现为解释变量之间具有相关关 系,所以用于多重共线性的检验方法主要是统 计方法:如判定系数检验法、逐步回归检验法 等 多重共线性检验的任务是: 等。 多重共线性检验的任务是 (1)检验多重共线性的严重程度; ( )检验多重共线性的严重程度; (2)估计多重共线性的范围,即判断哪些变 量之间存在共线性。 量之间存在共线性
1.
检验多重共线性严重程度
(1)对两个解释变量的模型,采用简单相关系数法 求出X1与X2的简单相关系数r,若 若|r|接近1,则说明 则说明 两变量存在较强的多重共线性。 (2)对多个解释变量的模型,采用综合统计检验法 若 在OLS法下:R2与F值较大,但t检验值较小, 说明各解释变量对Y的联合线性作用显著,但各解 释变量间存在共线性而使得它们对Y的独立作用不 能分辨,故t检验不显著。
1 、 2 已经失去了应有的经济含义,于是经常表现出 似乎反常的现象 例如1本来应该是正的,结果恰是负的。 似乎反常的现象:例如 本来应该是正的 结果恰是负的
4. 变量的显著性检验失去意义
存在多重共线性时 参数估计值的方差与标准差变大 容易使通过样本计算的t值小于临界值, 误导作出参数为0的推断 可能将重要的解释变量排除在模型之外
如果两个解释变量完全相关,如x2= x1,则
y (1 2 )x1
这时 只能确定综合参数1+2的估计值: 这时,只能确定综合参数 的估计值
x1i yi 1 2 2 x 1i
2. 近似共线性下OLS估计量方差增大
近似共线性下,可以得到OLS参数估计量, 但参数估计量方差的表达式为
一个数值例子:对圣诞树装饰品的需求
1、完全多重共线性的情形
估计结果如下
ˆ 49.667 2.1576 X Y i 2i se (0.746) (0.1203) t =(66.538) =(66 538) (-17.935) ( 17 935) R 0.9757 0 9757
2
结论:当解释变量之间完全线性相关(完全多 重共线性)时,不可能获得所有参数的唯一估 计值,也不能根据样本进行统计推断。
结果的比较: 能否估计; 模型参数的预期;
R2 0.9778 0 9778
近似或者不完全多重共线性的情形
图6-2 工资 X 4 和价格 X 2
关系
在矩阵表示的线性回归模型 Y=X+中,完全共线性 指:秩(X)<k+1,即 X 11 X 21 X k 1 1 1 X 12 X 22 X k 2 X 1 X X X 1n 2n k kn 中,至少有一列向量可由其他列向量(不包括第一列)线 性表出。 性表出 如:X2= X1,则X2对Y的作用可由X1代替。
五、多重共线性的修正方法
如果模型被检验证明存在多重共线性,则需要发 展新的方法估计模型,最常用的方法有四种。
1. 排除引起共线性的变量
找出引起多重共线性的解释变量,将它排除。一般 删减掉一些与其他解释变量意义相近的变量 常可起 删减掉一些与其他解释变量意义相近的变量,常可起 到有效降低多重共线性的作用。 例如,资产和流动资产 注意:但是如果我们把模型中重要的解释变量从模 型中剔除掉,可能导致所估计模型的参数是有偏的, 即“模型设定误差”。此外,剩余解释变量参数的经 济含义和数值都发生了变化。