第7章 多重共线性

合集下载

第七章7.0多重共线性

第七章7.0多重共线性

实际经济问题中的多重共线性
(1)经济变量相关的共同趋势
时间序列样本:经济繁荣时期,各基本经济变 量(收入、消费、投资、价格)都趋于增长; 衰退时期,又同时趋于下降。
横截面数据:生产函数中,资本投入与劳动力 投入往往出现高度相关情况,大企业二者都大, 小企业都小。
(2)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济 变量来反映真实的经济关系。 (3)样本资料的限制 一般经验:
在矩阵表示的线性回归模型 Y=X+u 中,完全共线性指:秩(X)<k+1,即
1 1 X 1 X 11 X 12 X 1n X 21 X 22 X 2n X k1 X k2 X kn
中,至少有一列向量可由其他列向量(不包括第 一列)线性表出。 如:X2= X1,则X2对Y的作用可由X1代替。
如果模型被检验证明存在多重共线性,则需要 发展新的方法估计模型,最常用的方法有三类。 1、第一类方法:排除引起共线性的变量 找出引起多重共线性的解释变量,将它排除。 以逐步回归法得到最广泛的应用。 • 注意:这时,剩余解释变量参数的经济含义和 数值都发生了变化。
2、第二类方法:差分法 时间序列数据、线性模型:将原模型变换为 差分模型: Yi=1 X1i+2 X2i++k Xki+ i
当完全不共线时,
r2
=0
ˆ var(1 ) 2 / x12i
1 2 ˆ var(1 ) 2 2 x1i 1 r x12i
当近似共线时, 0< r2 <1
2
多重共线性使参数估计值的方差增大,1/(1-r2)为 方差膨胀因子(Variance Inflation Factor, VIF) 当完全共线时, r2=1,

7.1多重共线性的概念及产生原因

7.1多重共线性的概念及产生原因
第一节多重共线性的概念及产生原因第二节多重共线性的后果第三节多重共线性的检验第四节多重共线性的修正方法第五节案例分析第一节多重共线性的概念及产生原因多重共线性产生的原因对于k元线性回归模型如果模型的解释变量之间存在着较强的相关关系则称模型存在多重共线性
第七章 多重共线性
• 本章主要内容: 本章主要内容: 第一节 多重共线性的概念及产生原因 第二节 多重共线性的后果 第三节 多重共线性的检验 第四节 多重共线性的修正方法 第五节 案例分析
多重共线性有两种情况: 多重共线性有两种情况:完全多重共线性和 近似多重共线性。 近似多重共线性。
如果存在一组不全为零的数λ0 , λ1 , λ2 ,⋯ , λk,使得
λ0 + λ1 X 1i + λ2 X 2i + ⋯ + λk X ki = 0
则称模型存在完全多重共线性。 则称模型存在完全多重共线性。 完全多重共线性
(2)解释变量中含有滞后变量 ) 在计量经济学模型中, 在计量经济学模型中,往往需要引入滞后经济 变量来反映真实的经济关系。例如,以相对收入 变量来反映真实的经济关系。例如, 假说为理论假设,则居民消费C 假说为理论假设,则居民消费 t的变动不仅受当 期收入Y 的影响, 的影响, 期收入 t的影响,还受前期收入 Yt-1的影响,于 是建立以下模型: 是建立以下模型:
Ct = β 0 + β1Yt + β 2Yt −1 + ut
显然, 显然,当期收入和前期收入之间存在着较强的线 性相关性。 性相关性。
3.利用截面数据建立模型也可能出现多重共线性 利用截面数据建立模型也可能出现多重共线性 多重共线性一般与时间序列有关, 多重共线性一般与时间序列有关,但在截面 一般与时间序列有关 数据中也经常出现。例如,在生产函数中, 数据中也经常出现。例如,在生产函数中,大企 业拥有大量的劳动力和资本,小企业只有较少的 业拥有大量的劳动力和资本, 劳动力和资本, 劳动力和资本,投入的劳动量和资本量通常是高 度相关的。 度相关的。 在多元线性回归模型中, 在多元线性回归模型中,我们关心的并不是 多重共线性的有无,而是多重共线性的程度。当 多重共线性的有无,而是多重共线性的程度。 有无 程度 多重共线性程度过高时, 多重共线性程度过高时,将给最小二乘估计带来 严重的后果。 严重的后果。

第七章 多重共线性

第七章 多重共线性

2
X 1i 1 r 2
2
ˆ 同理:Var b2

2
X 2i 1 r 2
2
第二节
多重共线性的影响后果
2
ˆ 当完全不共线时,r=0, Var b1
X
2 1i
当不完全共线时,r越接近1,相关程度越高, bi Var ˆ 越大,参数估计值越不准确。
第四节
多重共线性的解决方法
三、逐步回归法 (1)计算因变量对每一个解释变量的回归方程,并分别 进行统计检验,从中选取最合适的基本回归方程。 (2)逐一引入其他解释变量,重新进行回归,在模型中 每个解释变量均显著,参数符号正确, R 2 值有所提高的前 提下,从中再选取最合适的二元回归方程。 (3)在选取的二元回归方程的基础上以同样的方式引 入第三解释变量;如此引入,直至无法引入新变量为止。
第四节
多重共线性的解决方法
(2)如果历年的平均收入弹性与近期的收入弹性 近似相等,就可以用 a2代替原模型中的 b2 。将原模 ln y a2 ln I b0 b1 ln P 型变为 y1 ln y a2 ln I 令:
p1 ln P 再利用时间序列数据求出价格弹性 b1 以及 b0即可。
第四节
多重共线性的解决方法
二、间接剔除重要的解释变量 1、利用已知信息 所谓已知信息,就是在建立模型之前,根据经 济理论、统计资料或经验分析,已知的解释变量之 间存在某种关系。为了克服模型的多重共线性,可 以将解释变量按已知关系加以处理。
第四节
多重共线性的解决方法
例如:柯布-道格拉斯生产函数
y aL K e
ln y / K ln a ln L / K

多重共线性(统计累赘)的概念、特征及其测量方式和处理方式

多重共线性(统计累赘)的概念、特征及其测量方式和处理方式

试述多重共线性(统计累赘)的概念、特征及其测量方式和处理方式。

1、概念多重共线性是指自变量之间存在线性相关关。

倘若其中两个自变项的关系特别强,则在相互控制后就会使每者的效果减弱,而其他的变相的效果就会因此而增大。

2、特征3、产生原因产生多重相关性的原因主要包括四方面。

一是没有足够多的样本数据; 二是选取的自变量之间客观上就有共线性的关系; 还可能由其它因素导致, 如数据采集所用的方法, 模型设定, 一个过度决定的模型等。

但多数研究者认为共线性本质上是由于样本数据不足引起的。

4、测量方式(1)经验式的诊断方法通过观察,得到一些多重相关性严重存在的迹象。

①在自变量的简单相关系数矩阵中,有某些自变量的相关系数值较大。

②回归系数的代数符号与专业知识或一般经验相反;或者该自变量与因变量的简单相关系数符号相反。

③对重要自变量的回归系数进行t 检验,其结果不显著。

特别是当F 检验能在高精度下通过,测定系数R 2的值也很大,但自变量的t 检验却全都不显著,这时多重相关性的可能将会很大。

④如果增加或删除一个变量,或者增加或删除一个观测值,回归系数发生了明显的变化。

⑤重要自变量的回归系数置信区别明显过大。

⑥在自变量中,某一个自变量是另一部分自变量的完全或近似完全的线性组合。

⑦对于一般的观测数据,如果样本点的个数过少,比如接近于变量的个数或者少于变量的个数,样本数据中的多重相关性就会经常存在。

(2)统计检验方法共线性的诊断方法是基于对自变量的观测数据构成的矩阵X ’X 进行分析,使用各种反映自变量间相关性的指标。

共线性诊断常用的统计量有方差膨胀因子VIF 或容限TOL 、条件指数和方差比例等。

方差膨胀因子VIF 是指回归系数的估计量由于自变量的共线性使其方差增加的一个相对度量。

对于第i 个回归系数,它的方差膨胀因子定义为:VIF=1/1-R 2=1/TOL i 其中R2i 是自变量Xi 对模型中其余自变量线性回归模型的R 平方。

多重共线性讲义

多重共线性讲义
当存在不完全多重共线性时,从上面已经知道,参数的OLS估计量方差 较大,其标准误也就较大,从而使得参数估计量的精度较低。
9
3.参数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性,例如 X2= X1 ,这时,X1和
X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它 们对被解释变量的共同影响。1、2已经失去了应有的经济含义,于是经常 表现出似乎反常的现象:例如1本来应该是正的,结果恰是负的。
如果存在 c1X1i+c2X2i+…+ckXki+vi=0 i=1,2,…,n
其中ci不全为0,vi为随机误差项,则称为 不完全多重共线性或欠完 全多重共线性(approximate multicollinearity)。
4
7.2.产生多重共线性的原因
一般地,产生多重共线性的主要原因有以下四个方面: (1)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、 投资、价格)都趋于增长;衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动力投入往往出现高度 相关情况,大企业二者都大,小企业都小。 (2)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济 关系。 例如,消费=f(当期收入, 前期收入),显然,两期收入间有较强的 线性相关性。
14
15
2、辅助回归法
利用模型中每一个解释变量分别以其余解释变量为解释变量进行回归, 并计算相应的拟合优度。
如果某一种回归 X j c 1X1 2 X 2 ... j1X j1 j1X j1 ... k X k
的判定系数较大,说明Xj与其他X间存在共线性。 判别的标准是回归模型是否通过F检验。

第七章多重共线性

第七章多重共线性

X i fi ( X1, X 2 , , X i1, X i1, , X k )
X k fk ( X1, X 2 , , X k1)
对应的判定系数 R12, R22, , R2j , , Rk2

R2j
对应为以 X j 为被解释变量的回归方程。
显然,这些判定系数中最大且接近于1的那 一个R2i所对应的变量Xi,是与其他解释 变量发生多重共线性最严重的一个
(2)估计多重共线性的范围,即判断哪些 变量之间存在共线性。
有几点我们要明白:
(1) 多重共线性是一个程度问题而不是存在与否 的问题。
(2) 由于多重共线性是在假定解释变量是非随机 的条件下出现的问题,因而它是样本的特征,而 不是总体的特征。
因此,我们不仅可以“检测多重共线性”,而且 可以测度任何给定样本的多重共线性程度。
X1 9
X2i、2, 25, 48 X 2 25
X3i、1, 23, 24
X 3 16
view correlations
它们两两简单相关系数不大,但是严格共线性
所以,用简单相关系数判断模型是否存在多重共线性,只 适用于两个解释变量的情况
(二)估计多重共线性的范围
如果存在多重共线性,需进一步确定究竟由哪些变 量引起。
多重共线性是一个程度问题
若解释变量两两之间完全不相关,则不存在 该问题;
若其中部分解释变量之间完全相关,则根本 不能用OLS进行回归;
若解释变量之间存在一定程度的线性关系, 则是本章所要解决的多重共线性的问题。
2.参数的方差 因为估计值的方差为:
Var(1)
2 x22i
x12i x22i ( x1i x2i )2
注意: 完全共线性的情况并不多见,一般出现的

7.1多重共线性的概念及产生原因

7.1多重共线性的概念及产生原因
多重共线性是指在一个多元回归模型中,多个解释变量之间存在高度相关性,导致回
归方程中的参数无法估计或估计不准确的现象。

因此,多重共线性会对回归结果的解释和
预测产生负面影响。

多重共线性的产生原因可以归纳为以下几点:
1. 变量选择不当:如果在选择解释变量时,没有考虑它们之间可能存在的相关性,
就会出现多重共线性。

2. 数据处理不当:在数据处理中,如果对变量进行过度的转换和调整,或者使用过
于宽泛的指标,也可能导致多重共线性问题。

3. 数据收集不当:如果数据样本不足或者数据来源中存在重复的信息,就可能出现
多重共线性。

4. 特征工程不当:特征工程是指对原始数据进行预处理,提取出更有利于建模的特征。

如果特征工程不当,就可能导致多重共线性的问题。

如,过多的特征选择等。

5. 非线性关系:多重共线性不仅存在于线性模型中,也可能存在于非线性模型中,
如决策树模型、KNN模型等。

6. 误差项相关:当自变量中存在测量误差时,误差会通过模型的回归系数来影响因
变量,导致自变量之间的相关性,从而产生多重共线性。

7. 时间趋势:在同一时间段内,多个自变量具有相似的趋势也可能导致多重共线性。

例如,时间序列中常常出现的季节性变化等。

综上所述,多重共线性是在多元回归模型中常见的问题,它会对模型的稳定性、可靠
性和准确性产生重要影响。

因此,在进行回归分析时,需要注意避免多重共线性的问题。

第七章多重共线性

第七章多重共线性第七章多重共线性若线性模型不满⾜假定6,就称模型有多重共线性。

§7.1 多重共线性的概念⼀. 基本概念:假定6 ()1k r X k n =+<,是指模型中所有⾃变量12,,,,k x x x 1线性⽆关,也可理解为矩阵X 的列向量线性⽆关。

若不满⾜该假定,即 ()1k r X k <+,则称12,,,,k x x x 1存在完全多重共线性,12,,,,k x x x 1存在严格的线性关系,这是⼀种极端情况;若12,,,,k x x x 1之间的线性关系不是严格的,⽽是⼀种近似的线性关系,则称⾼度相关或存在不完全多重共线性。

如,01122i i i i y x x u βββ=+++ 若12,λλ?不全为零,使11220i i x x λλ+=,完全多重共线性11220i i i x x v λλ++= 不完全多重共线性完全多重共线性和不完全多重共线性统称为多重共线性。

解释变量(⾃变量)之间的线性关系可⽤拟合优度2i R 描述,2i R 表⽰i x 对其它解释变量的拟合优度,21i R = 完全 21i R ≈⾼度 20i R = ⽆⼆. 产⽣的原因:在实际经济问题中主要是不完全多重共线性。

其产⽣的主要原因是:1. 两个解释变量具有相同或相反的变化趋势;(家庭能耗与住房⾯积、⼈⼝)⽣产、需求.......2. 数据收集的范围过窄,造成解释变量之间有相同或相反变化的假象;3. 某些解释变量之间存在某种近似的线性关系;(各解释变量有相同的时间趋势)4. ⼀个变量是另⼀个变量的滞后值;供给5. 解释变量的选择不当也可能引起变量间的多重共线性。

6. 过度决定模型。

(观测值个数少于参数个数)对于正确设置的模型,多重共线性基本上是⼀种样本现象。

§7.2 多重共线性的后果⼀. 完全多重共线性当模型具有完全多重共线性时,⽆法进⾏参数的OLS 估计;设模型 Y XB U =+,若有完全多重共线性,即()1k r X k <+,则()1T r X X k <+ 1()T X X -?不存在1()T TB X X X Y ∧-?=不存在,同样 21()()Tj u jj V X X βσ∧-=也不存在,显著性检验和预测都⽆法进⾏。

第七章 多重共线性及其处理

第七章 多重共线性及其处理第一部分 学习辅导一、本章学习目的与要求1.理解多重共线性的概念;2.掌握多重共线性存在的主要原因;3.理解多重共线性可能造成的后果;4.掌握多重共线性的检验与修正的方法。

二、本章内容提要本章主要介绍计量经济模型的计量经济检验。

即多重共线性问题。

多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。

模型的多个解释变量间出现完全共线性时,模型的参数无法估计。

更多的情况则是近似共线性,这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的参数的标准差往往较大,从而使得t 统计值减小,参数的显著性下降,导致某些本应存在于模型中的变量被排除,甚至出现参数正负号方面的一些混乱。

显然,近似多重共线性使得模型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。

多重共线性的检验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。

而解决多重共线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。

(一)多重共线性及其产生的原因当我们利用统计数据进行分析时,解释变量之间经常会出现高度多重共线性的情况。

1.多重共线性的基本概念多重共线性(Multicollinearity )一词由弗里希(Frish )于1934年在其撰写的《借助于完全回归系统的统计合流分析》中首次提出。

它的原义是指一个回归模型中的一些或全部解释变量之间存在有一种“完全”或准确的线性关系。

如果在经典回归模型Y X βε=+中,经典假定(5)遭到破坏,则有()1R X k <+,此时称解释变量k X X X ,,,21 间存在完全多重共线性。

解释变量的完全多重共线性,也就是解释变量之间存在严格的线性关系,即数据矩阵X 的列向量线性相关。

因此,必有一个列向量可由其余列向量线性表示。

同时还有另外一种情况,即解释变量之间虽然不存在严格的线性关系,但是却有近似的线性关系,即解释变量之间高度相关。

计量经济学题库第7章多重共线性

第7章 多重共线性习 题一、单项选择题1.如果回归模型中解释变量之间存在完全的多重共线性,则最小二乘估计量( )A.不确定,方差无限大B.确定,方差无限大C.不确定,方差最小D.确定,方差最小2.多元线性回归模型中,发现各参数估计量的t 值都不显著,但模型的F 值确很显著,这说明模型存在( )A .多重共线性B .异方差C .自相关D .设定偏误 3.逐步回归法既检验又修正了( )A .异方差性 B.自相关性 C .随机解释变量 D.多重共线性4.如果模型中的解释变量存在完全的多重共线性,参数的最小二乘估计量是( )A .无偏的 B. 有偏的 C. 不确定 D. 确定的 5.设线性回归模型为,下列表明变量之间具有完全多重共线性的是( )A .B .C .D .其中v 为随机误差项6.简单相关系数矩阵方法主要用于检验( )A .异方差性 B.自相关性 C .随机解释变量 D.多重共线性 7.设为解释变量,则完全多重共线性是( )8.下列说法不正确的是( )A. 多重共线性产生的原因有模型中大量采用滞后变量,)(22很大或R R 01122i i i iY X X u βββ=+++1202*0*0i i X X ++=1202*0*0i i X X v +++=1200*0*0i i X X ++=1200*0*0i i X X v +++=21,x x 221211211.0.021.0(.02x x A x x B x e C x x v v D x e +==++=+=为随机误差项)B. 多重共线性是样本现象C. 检验多重共线性的方法有DW检验法D. 修正多重共线性的方法有增加样本容量二、多项选择题1.能够检验多重共线性的方法有()A. 简单相关系数矩阵法B. t检验与F检验综合判断法C. DW检验法D. ARCH检验法E. White 检验2.如果模型中解释变量之间存在共线性,则会引起如下后果()A. 参数估计值确定B. 参数估计值不确定C. 参数估计值的方差趋于无限大D. 参数的经济意义不正确E. DW统计量落在了不能判定的区域3.能够检验多重共线性的方法有()A. 简单相关系数矩阵法B. DW检验法C. t检验与F检验综合判断法D. ARCH检验法E. 辅助回归法(又待定系数法)三、判断题1.多重共线性问题是随机扰动项违背古典假定引起的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
LnY i = LnA + α LnL i + β LnK i + u i 高度相关。 通常 L 和 K 高度相关。若已知该 CD 生产函数规模报酬不变 , 代入原模型可得: 即满足 α + β = 1,则将 α =1 − β 代入原模型可得: Y K Ln i = LnA + β Ln i + u i Li Li 新模型只有一个解释变 量,自然也就不存在多 重共线性问题
经济贸易学院 熊维勤
2011-3-6
15
4、利用参数之间的关系进行参数代换 、
如果多重共线性是由某些解释变量引起的, 如果多重共线性是由某些解释变量引起的,根据经济理论和 实际分析又知道他们对应的参数之间满足一定的关系, 实际分析又知道他们对应的参数之间满足一定的关系,则可 通过参数代换减少和避免多重共线性。 通过参数代换减少和避免多重共线性。 和劳动投入量L, 例:若产出量取决于资本K和劳动投入量 ,且模型为 若产出量取决于资本 和劳动投入量
2011-3-6 经济贸易学院 熊维勤 16
5、利用解释变量之间的关系将模型化为联立方程模型 、 6、变换模型的形式 、 如果某些解释变量之间高度相关, 如果某些解释变量之间高度相关,根据研究目的的实际情 可通过改变模型形式来避免多重共线性。 况,可通过改变模型形式来避免多重共线性。 取决于其出厂价格X 市场价格X 例:某产品的销售量Y取决于其出厂价格 1、市场价格 2 某产品的销售量 取决于其出厂价格 和市场总供应量X 模型为: 和市场总供应量 3,模型为:
()
由于|X’X|≈0,引起 ≈ ,引起(X’X) -1主对角线元素较大,使参数 主对角线元素较大, 由于 估计量的方差较大, 使得在参数的显著性检验中增加了 估计量的方差较大, 接受原假设的可能, 接受原假设的可能 , 从而舍去对被解释变量有显著影响 的解释变量。 的解释变量。
2011-3-6 经济贸易学院 熊维勤 8
2011-3-6 经济贸易学院 熊维勤 5
第二节 多重共线性的来源与后果
2、滞后变量的引入 、 在经济计量模型中, 在经济计量模型中,往往需要引入滞后经济变量来反映真 实的经济关系。例如,消费=f(当期收入 前期收入) 当期收入, 实的经济关系。例如,消费 当期收入 前期收入) 显然,两期收入间有较强的线性相关性。 显然,两期收入间有较强的线性相关性。 3、样本资料的限制 、 由于完全符合理论模型所要求的样本数据较难收集,特定 由于完全符合理论模型所要求的样本数据较难收集, 样本可能存在某种程度的多重共线性(数据不完备)。 样本可能存在某种程度的多重共线性(数据不完备)。 一般经验: 一般经验: 时间序列数据样本 简单线性模型, 样本: 时间序列数据样本:简单线性模型,往往存在多重 共线性;截面数据样本:问题不那么严重,但多重共线 共线性;截面数据样本:问题不那么严重, 样本 性仍然是存在的。 性仍然是存在的。
2011-3-6
经济贸易学院 熊维勤
11
第三节 多重共线性的检验
辅助回归法中的方差膨胀因子: 辅助回归法中的方差膨胀因子: 方差膨胀因子
对于多元线性回归模型 : Yi = β 0 + β 1 X 1 i + ... + β k X ki + ui 存在多重共线性, 如下辅助回归: 为判断诸自变量间是否 存在多重共线性,进行 如下辅助回归: X ji = α 0 + α 1 X 1 i + ... + α j − 1, i X j −1 , i + α j + 1, i X j + 1, i + ... + α k X ki + v i , j = 1,2,..., k 的方差膨胀因子为: 若上述辅助回归的可决 系数为 R 2,则定义自变量 X j的方差膨胀因子为: j VIF j = 1 1 − R2 j
计量经济学基础
第七章 多重共线性
2011-3-6 经济贸易学院 熊维勤 1
主要内容
一、多重共线性的概念 二、多重共线性的来源与后果 三、多重共线性的检验 四、多重共线性的修正方法
2011-3-6
经济贸易学院 熊维勤
2
第一节 多重共线性的概念
对于模型: 对于模型: Yi=β0+β1X1i+β2X2i+…+βkXki+ui i=1,2,…,n
2011-3-6 经济贸易学院 熊维勤 10
第三节 多重共线性的检验
1、对两个解释变量的模型,采用简单相关系数法 、对两个解释变量的模型,采用简单相关系数法 求出X1与X2的简单相关系数r,若|r|接近 ,则说明两变量 求出 的简单相关系数 , 接近1, 接近 存在较强的多重共线性。 存在较强的多重共线性。也可以建立两变量之间的辅助线性 回归模型,根据拟合优度的高低进行判断。 回归模型,根据拟合优度的高低进行判断。 2、对多个解释变量的模型,采用辅助回归法 、对多个解释变量的模型, 分别以一个解释变量为因变量,其他解释变量为自变量, 分别以一个解释变量为因变量,其他解释变量为自变量, 建立多元线性回归模型并进行OLS估计,拟合优度最大且 估计, 建立多元线性回归模型并进行 估计 接近1时 说明这个变量与其他所有解释变量间存在共线性。 接近 时,说明这个变量与其他所有解释变量间存在共线性。
其基本假设之一是解释变量相互独立 其基本假设之一是解释变量相互独立 如果某两个或多个解释变量之间出现了相关性, 如果某两个或多个解释变量之间出现了相关性, 则称为模型中解释变量间存在多重共线性 则称为模型中解释变量间存在多重共线性 (Multicollinearity)。2011ຫໍສະໝຸດ 3-6经济贸易学院 熊维勤
第二节 多重共线性的来源与后果
4、参数估计值不精确,也不稳定 、参数估计值不精确, 样本观测值稍有变动、 样本观测值稍有变动、增加或减少解释变量等都会使参 数估计值发生较大变化,甚至出现符号错误, 数估计值发生较大变化,甚至出现符号错误,从而不能 正确反映解释变量对被解释变量的影响。 正确反映解释变量对被解释变量的影响。 5、模型的预测功能失效 、 较大的方差容易使预测区间变大, 较大的方差容易使预测区间变大,从而使预测失去意义 注意:只要模型满足经典假设, 注意:只要模型满足经典假设,则在近似多重共线性情 况下, 估计量仍然满足无偏性、 况下,OLS估计量仍然满足无偏性、线性性和有效性。 估计量仍然满足无偏性 线性性和有效性。 但此时,无偏性并不意味着对某一给定样本, 但此时,无偏性并不意味着对某一给定样本,其参数估 计值就等于真实值。 计值就等于真实值。有效性也不意味着参数估计量的方 差一定很小。 差一定很小。
3
第一节 多重共线性的概念
若有c 若有 0+c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n。其中 。其中: ci不全为 ,则称解释变量间存在完全多重共线性 不全为0,则称解释变量间存在完全多重共线性 若 存 在 : c0+c1X1i+c2X2i+…+ckXki≈0 共线性。 共线性。 完全共线性的情况并不多见, 完全共线性的情况并不多见,一般出现的是在一 定程度上的共线性,即近似共线性。 定程度上的共线性,即近似共线性。
2011-3-6 经济贸易学院 熊维勤 6
第二节 多重共线性的来源与后果
二、后果 1、完全共线性下OLS参数估计量不存在 、完全共线性下 参数估计量不存在
Y = Xβ+ μ β
估计量为: 的OLS估计量为: 估计量为
ˆ β= ( X ′X ) −1 X ′Y
如果存在完全共线性 完全共线性, 不存在, 如果存在完全共线性,则(X’X)-1不存在,无法得到参数的 估计量。 估计量。
2011-3-6
3、参数的显著性检验失去意义 、
存在多重共线性时 参数估计量的方差(标准差) 参数估计量的方差(标准差)较大 容易使通过样本计算的t值小于临界值, 容易使通过样本计算的 值小于临界值, 值小于临界值 误导作出参数显著为0的推断 误导作出参数显著为 的推断 可能将重要的解释变量排除在模型之外
2011-3-6 经济贸易学院 熊维勤 9
2011-3-6 经济贸易学院 熊维勤 4
i=1,2,…,n
其中: 不全为0,则称为解释变量间存在近似多重 其中:ci不全为 ,则称为解释变量间存在近似多重
第二节 多重共线性的来源与后果
计量分析的原则:相关性原则(因果关系, 计量分析的原则 : 相关性原则 ( 因果关系 , 回归分析的基 连贯性原则(前后期相关,时间序列分析的基础) 础 ) ; 连贯性原则 ( 前后期相关 , 时间序列分析的基础 ) 二者均可导致多重共线性。 二者均可导致多重共线性。 一、来源 1、许多经济变量具有共同变动趋势 、 时间序列样本:经济繁荣时期,各基本经济变量(收入、 时间序列样本:经济繁荣时期,各基本经济变量(收入、 繁荣时期 消费、投资、价格)都趋于增长;衰退时期, 消费、投资、价格)都趋于增长;衰退时期,又同时趋于 下降。 下降。 横截面数据:生产函数中, 横截面数据:生产函数中,资本投入与劳动力投入往 往出现高度相关情况,大企业二者都大,小企业都小。 往出现高度相关情况,大企业二者都大,小企业都小。
2011-3-6
经济贸易学院 熊维勤
14
3)用被解释变量的滞后值代替解释变量的滞后值 )
如果多重共线性是由解释变量的现期值与其过去值高度相 关引起的, 关引起的,则可用被解释变量的滞后值代替解释变量的 滞后值,避免多重共线性。 滞后值,避免多重共线性。 例如个人消费Yt取决于现期收入 t和过去收入 t-1,Xt-2,…, 例如个人消费 取决于现期收入X 和过去收入X 则:Yt=β0+ β1Xt+ β2Xt-1+ β3Xt-2+…+ut 通常X 高度相关, 代替X 通常 t,Xt-1,Xt-2,…高度相关,用Yt-1代替 t-1,Xt-2,… 高度相关 则可得新模型: 则可得新模型:Yt=β0+ β1Xt+ ρYt-1+u*t 其中Yt-1和Xt之间的相关性通常较弱 其中
相关文档
最新文档