第五章 多重共线性(计量经济学,南开大学)

合集下载

计量经济学实验五 多重共线性的检验与修正 完成版

计量经济学实验五 多重共线性的检验与修正 完成版

习题1.下表给出了中国商品进口额Y 、国内生产总值GDP 、消费者价格指数CPI 。

年份 商品进口额 (亿元)国内生产总值(亿元)居民消费价格指数(1985=100)1985 1257.8 8964.4 1001986 1498.3 10202.2 106.5 1987 1614.2 11962.5 114.3 1988 2055.1 14928.3 135.8 1989 2199.9 16909.2 160.2 1990 2574.3 18547.9 165.2 1991 3398.7 21617.8 170.8 1992 4443.3 26638.1 181.7 1993 5986.2 34634.4 208.4 1994 9960.1 46759.4 258.6 1995 11048.1 58478.1 302.8 1996 11557.4 67884.6 327.9 1997 11806.5 74462.6 337.1 1998 11626.1 78345.2 334.4 1999 13736.4 82067.5 329.7 2000 18638.8 89468.1 331.0 2001 20159.2 97314.8 333.3 2002 24430.3 105172.3 330.6 200334195.6117251.9334.6资料来源:《中国统计年鉴》,中国统计出版社2000年、2004年。

请考虑下列模型:i t t t u CPI GDP Y ++=ln ln ln 321βββ+ (1)利用表中数据估计此模型的参数。

解:ln 3.6489 1.796ln 1.2075ln t t t Y GDP CPI =--+t= (-11.32) (9.93) (-3.415)20.988770.6.0.1124R F S E ===(2)你认为数据中有多重共线性吗?多重共线性的检验 1)综合统计检验法若 在OLS 法下:R 2与F 值较大,但t 检验值较小,则可能存在多重共线性。

计量经济学(南开大学经济学院张伯伟)4-7

计量经济学(南开大学经济学院张伯伟)4-7
假定λ1<>0,
X 1i =
λ2 λ λ v X 2 i + 3 X 3 i + k X ki + i λ1 λ1 λ1 λ1
其中vi 为随机项.我们把这种解释变量间存在的完全或不完全的线性关系 称为多重共线性.由于经济变量自身的性质,它们之间这种多重共线性或 强或弱,普遍存在的.
第三节 多重共线性的影响
( ∑ x 2 i )( ∑ x 32i ) ( ∑ x 2 i x 3 i ) 2 2
2 ( λ ∑ y i x 3 i )( ∑ x 3 i ) ( ∑ y i x 3 i )( λ ∑ x 32i ) 2 ( λ 2 ∑ x 32i )( ∑ x 3 i ) ( λ ∑ x 32i ) 2
二,半对数线性模型: 模型的函数形式可变为:
ln Yi = β1 + β 2 X i + ui
或 Yi = β1 + β 2 ln X i + ui
Yi* = β1 + β 2 X i + ui 或 Yi = β1 + β 2 X i* + ui
根据解释变量的观测值,进行OLS估计,得到:
Y i* = β 1 + β 2 X i 或 Y i = β 1 + β 2 X * i
Yi = β1 + β 2 X * i
因此可得到原模型的估计方程:
1 Yi = β1 + β 2 Xi
二,对数线性模型: 通过对原模型的对数变换,函数形式可变为:
ln Yi = β1 + β 2 ln X 2i + β 2 ln X 3i + ui
* * 令变量 Yi = ln Yi , X ki = ln X ki ,则回归函数可变为:

计量经济学:多重共线性

计量经济学:多重共线性

计量经济学:多重共线性多重共线性52=.53085123 第四章专门讨论古典假定中⽆多重共线性假定被违反的情况,主要内容包括多重共线性的实质和产⽣的原因、多重共线性产⽣的后果、多重共线性的检测⽅法及⽆多重共线性假定违反后的处置⽅法。

第⼀节什么是多重共线性⼀、多重共线性的含义第三章讨论多元线性回归模型的估计时,强调了假定⽆多重共线性,即假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性⽆关。

在计量经济学中所谓的多重共线性(Multi-Collinearity),不仅包括解释变量之间精确的线性关系,还包括解释变量之间近似的线性关系。

从数学意义上去说明多重共线性,就是对于解释变量k X 、、X X 32,如果存在不全为0的数k λλλ,2,1 ,能使得n ,2, ,1i 033221 ==++++ki k i i X X X λλλλ ( 4.1 )则称解释变量k X X X ,,,32 之间存在着完全的多重共线性。

⽤矩阵表⽰,解释变量的数据矩阵为X=213112232223111k k nnkn X X X X X X X X X ??(4.2)当Rank(X )在实际经济问题中,完全的多重共线性并不多见。

常见的情形是解释变量k X X X ,,,32 之间存在不完全的多重共线性。

所谓不完全的多重共线性,是指对于解释变量k X 、、X X 32,存在不全为0的数k λλλ,2,1 ,使得n ,2, ,1i 033221 ==+++++i ki k i i u X X X λλλλ(4.3)其中,i u 为随机变量。

这表明解释变量k X 、、X X 32只是⼀种近似的线性关系。

如果k 个解释变量之间不存在完全或不完全的线性关系,则称⽆多重共线性。

若⽤矩阵4表⽰,这时X 为满秩矩阵,即Rank(X )=k 。

需要强调,解释变量之间不存在线性关系,并⾮不存在⾮线性关系,当解释变量存在⾮线性关系时,并不违反⽆多重共线性假定。

计量经济学第五章

计量经济学第五章
14
2024/10/15
15
用Eviews的多重共线性对策
Quick/Estimate Equation的对话框中
对数法: 直接输入log(Y) c log(X1) log(X2)… 或 差分法: 输入Y-Y(-1) C X1-X1(-1) X2-X2(-1)… 但差分常常会丢失一些信息,运用时应慎重。
则表明多重共线性存在。
11
对策:
• 去掉关系不大的变量,但应注意遗漏变量问题; • 重新建立模型(差分或对数处理); • 利用事先掌握的信息变换模型;
(如:Cobb-Douglas函数中K与L之间存在多 重
共线性,且它们的系数之和等于1) • 增加样本数.
12
用Eviews的多重共线性检验1
相关系数法 首先同时选择所有的自变量; 然后双击-出现选择栏时点击 Open Group/View/Correlations; 观察各自变量之间的大小。
即选择Quick/Estimate Equation后写入 v_hat c xi x2i x3i…
• 命令scalar LM=@regobs*@R² --Enter 双击LM时,在下边出现LM值./或直接计算。
10
二、多重共线性的检验及对策
诊断方法
• 系数估计值的符号不对; • 参数估计值不稳定; • R2很大,但重要的自变量 t 值很低; • 自变量之间呈高度相关(正负0.8~0.9)
• 首先估计出一般方程 • View/Coefficient Tests/Redundant
Variables-Likelihood Ratio • 出现对话框时,写入删除变量名--OK • 对比删除前后的AIC与SC信息值,信息
值小的结论是应采纳的。

第五章 多重共线性(计量经济学-北京大学,岳昌君)

第五章 多重共线性(计量经济学-北京大学,岳昌君)
4
§2 多重共线性的来源
一、解释变量受同一因素的影响 时间序列数据: 1、经济发展;2、政治事件 3、偶然事件;4、时间趋势 二、解释变量中含有当期和滞后变量 I t 1 2 rt 3Yt 4Yt 1 ut Y2 Y3 Y1 , Yn ; Y n Y1 Y2 有多重共线性。 Yn 1
5
§3 多重共线性的影响
一、完全共线性 ˆ X Y ˆ无唯一解 ( X X ) ˆ 的方差是无穷大。 i
6
二、“不完全”多重共线性
ˆ的解不稳定。 ˆ 的方差非常大。 1、 i ˆ 2.8 ˆ 1 1 0.9 2 2 例如: 0.9 1 ˆ 2.9 ˆ 2 3 3 ˆ 2.8 ˆ 3.5678 0.99 1 2 2 0.99 ˆ ˆ 1 2 . 9 6 . 4322 3 3 ˆ 2.8 ˆ 40 .5743 0.999 1 2 2 0.999 2.9 ˆ ˆ 1 51 . 4257 3 3
观察结果(共线性诊断):1、最大条件指数 37.1>30,说明中等相关;2、与最大条件指数在 一行的4个变量的方差比例都大于0.5,说明这4个 变量就是一个具有中等相关的变量集。
14
五、F检验
例如:X2,X3,X4相互回归
1、 X2—X3,X4;若F >F ,则有多重共线性; 否则的话,就没有。 2、 X3—X2,X4;若F >F ,则有多重共线性; 否则的话,就没有。
t 1 t t 1 t

计量经济学分章习题与答案

计量经济学分章习题与答案

第一章 导 论一、名词解释1、截面数据2、时间序列数据3、虚变量数据4、生变量与外生变量二、单项选择题1、同一统计指标按时间顺序记录的数据序列称为 ( )A 、横截面数据B 、虚变量数据C 、时间序列数据D 、平行数据2、样本数据的质量问题,可以概括为完整性、准确性、可比性和 ( )A 、时效性B 、一致性C 、广泛性D 、系统性3、有人采用全国大中型煤炭企业的截面数据,估计生产函数模型,然后用该模型预测未来 煤炭行业的产出量,这是违反了数据的哪一条原则。

( ) A 、一致性 B 、准确性 C 、可比性 D 、完整性4、判断模型参数估计量的符号、大小、相互之间关系的合理性属于什么检验? ( )A 、经济意义检验B 、统计检验C 、计量经济学检验D 、模型的预测检验5、对下列模型进行经济意义检验,哪一个模型通常被认为没有实际价值? ( )A 、i C (消费)5000.8i I =+(收入)B 、di Q (商品需求)100.8i I =+(收入)0.9i P +(价格)C 、si Q (商品供给)200.75i P =+(价格)D 、i Y (产出量)0.60.65i K =(资本)0.4i L (劳动)6、设M 为货币需求量,Y 为收入水平,r 为利率,流动性偏好函数为012M Y r βββμ=+++,1ˆβ和2ˆβ分别为1β、2β的估计值,根据经济理论有 ( ) A 、1ˆβ应为正值,2ˆβ应为负值 B 、1ˆβ应为正值,2ˆβ应为正值 C 、1ˆβ应为负值,2ˆβ应为负值 D 、1ˆβ应为负值,2ˆβ应为正值三、填空题1、在经济变量之间的关系中, 因果关系 、 相互影响关系 最重要,是计量经济分析的重点。

2、从观察单位和时点的角度看,经济数据可分为 时间序列数据 、 截面数据 、 面板数据 。

3、根据包含的方程的数量以及是否反映经济变量与时间变量的关系,经济模型可分为 时间序列模型 、 单方程模型 、 联立方程模型 。

计量经济学之多重共线性

计量经济学之多重共线性

计量经济学之多重共线性引言多重共线性是计量经济学中一个重要的概念,在经济学研究中扮演着重要的角色。

在本文中,我们将深入探讨多重共线性的概念、原因和影响,并介绍一些常见的解决方案和应对方法。

什么是多重共线性?多重共线性是指在回归分析中,自变量之间存在高度相关性的情况。

具体来说,多重共线性指的是自变量之间线性相关性较高,可能导致回归分析的结果不准确或难以解释。

多重共线性的原因多重共线性的产生有多种原因,以下是一些常见的原因:1.样本选择偏倚:当样本中存在特定的特征或者数据的选择方式导致一些变量的相关性增强。

2.变量的定义重复:有些变量可能在定义上重复,导致它们之间存在高度相关性。

3.缺少重要变量:当回归模型中存在遗漏的重要变量时,其他变量可能会代替这些遗漏的变量,导致多重共线性。

4.数据测量误差:测量误差也可能导致自变量之间存在高度相关性。

多重共线性的影响多重共线性可能会对回归模型产生一系列的问题和影响:1.估计系数不准确:多重共线性会导致回归系数的估计不准确,使得对自变量的解释变得困难。

2.系数符号相反:多重共线性可能导致估计系数的符号与理论预期相反。

3.误差项的方差增加:多重共线性会导致误差项的方差增加,从而降低了模型的精确度。

4.解释力度减弱:多重共线性会降低模型的解释力度,使得我们难以解释模型的结果。

解决多重共线性的方法针对多重共线性问题,我们可以采取以下方法来解决:1.增大样本量:增大样本量可以降低变量之间的相关性,从而减轻多重共线性的影响。

2.删除相关变量:通过检验变量之间的相关性,删除相关性较高的变量,可以减轻多重共线性的程度。

3.主成分分析:主成分分析是一种降维的方法,可以将相关性较高的变量合并为一个主成分,从而避免了多重共线性的问题。

4.增加惩罚项:在回归模型中增加惩罚项,如岭回归或lasso回归,可以减轻多重共线性的影响。

5.使用时间序列数据:对于存在多重共线性的房地产数据等时间序列数据,可以使用时间序列模型来避免多重共线性的问题。

计量经济学:多重共线性

计量经济学:多重共线性

影响比较大的,略去影响较小的。
元线性回归模型并进行OLS估计,拟合优度最大且接近1时,说明
这个变量与其他所有解释变量间存在共线性。
第三节 多重共线性的检验
辅助回归法中的方差膨胀因子:
对 于 多 元 线 性 回 归 模: 型Yi 0 1 X 1i ... k X ki ui 为 判 断 诸 自 变 量 间 是存 否在 多 重 共 线 性 , 进如 行下 辅 助 回 归 : X ji 0 1 X 1i ... j 1,i X j 1,i j 1,i X j 1,i ... k X ki v i , j 1,2,...,k 若 上 述 辅 助 回 归 的 可系 决数 为 R2 X j的 方 差 膨 胀 因 子 为 : j, 则 定 义 自 变 量 1 VIF j 1 R2 j
第一节 多重共线性的概念
若有c0+c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n。其中: ci不全为0,则称
解释变量间存在完全多重共线性
若存在:c0+c1X1i+c2X2i+…+ckXki≈0 i=1,2,…,n。 其中:ci不全为0,
则称为解释变量间存在近似多重共线性。
完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,
第二节 多重共线性的来源与后果
4、参数估计值不稳定,经济含义不合理
样本观测值稍有变动、增加或减少解释变量等都会使参数估计值发生较大变 化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响。
5、模型的预测功能失效
较大的方差容易使预测区间变大,从而使预测失去意义
注意:只要模型满足经典假设,则在近似多重共线性情况下,OLS估计量仍 然满足无偏性、线性性和有效性。但此时,无偏性并不意味着对某一给定样 本,其参数估计值就等于真实值。有效性也不意味着参数估计量的方差一定 很小。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例如,为了估计汽车需求的价格弹性和收入弹性,得到销售量、平均价格、消 费者收入的时间序列数据。设定回归式:
ln(Yt ) 1 2 ln P t 3 ln I t ut
由于在时间序列数据中价格Pt、收入It 一般都具有高度共线的趋势。因此,直接 估计上面的回归式将存在问题。由于在同一式点上,价格与收入的相关程度不高, 可以先利用截面数据估计出收入弹性 ,再利用这一估计结果修改原回归式,变 ˆ 为: 3
R 2 /(k 1) F ~ F (k 1, n k ) 2 (1 R ) /(n k )
可以采用类似的方法检验:
F
R2 ) j /( k 1 (1 R j ) /(n k 1)
2
~ F (k 1, n k )
选择显著水平α ,计算F 统计量的值,与F分布表中的临界值进行比较,若F检验值 小于临界值,则多重共线性不显著,反之,则多重共线性显著。
第三节 多重共线性的探查和解决
一、多重共线性的探查 由于多重共线性使一种普遍现象,而多重共线性的程度影响了参数估计结果, 因此我们关心的是共线性的程度,而不是共线性是否存在。
在双边量回归模型中,可以直接对解释变量的相关系数进行显著性检验,以确 定线性相关的程度(此时相关系数的平方等于样本决定系数)。而对于多于两个结 束变量的回归模型,则不能利用俩俩相关系数来检验。 对于有多个变量的回归模型,可以采用辅助回归的方法,分别以k-1个解释变量 中的第i个对其他变量进行回归,可得到k-2个回归方程的判定系数: R22,R32,…,Rk2。假定这些判定系数中Rj2最大且接近1,则变量Xj 与其他解释变量 中的一个或多个有较高相关程度,因此回归方程出现高度多重共线性。 可以进行F 检验确定其显著性: 根据第三章的结果,检验R2显著性的F检验值为:
2、利用先验信息
假定对回归模型:
Yi 1 2 X 2i 3 X 3i ui
已知X2 和X3 之间高度共线。根据先验信息,确定β3=2β2,带入模型后可得:
Yi 1 2 X 2i 2 2 X 3i ui 1 2 ( X 2 i 2 X 3i ) ui 设变量Z i ( X 2i 2 X 3i ), 估计方程 Yi 1 2 Z i ui ˆ 和 ˆ 2 ˆ。 可得到

2 2 ( yi x3i )( x 3 ) ( y x )( x i 3i 3 i ) i 2 2 2 2 (2 x 3 )( x ) ( x 3i 3i ) i
ˆ 是不确定的。同样 ˆ 也是不确定的。而方差 此时, 2 3 ˆ ) Var ( 2
Yt* 1 2 ln Pt ut
ˆ ln I , 其中Yt* ln Yt 3 t
新的回归式中消除了多重共线性的影响。 6、利用时间序列数据的差分或离差进行估计 如果时间序列数据中,解释变量间存在高度相关,那么这些变量的差分之间不 一定相关。因此利用差分进行回归能降低多重共线性的程度。
根据最小平方和原则,并求解正规方程组,可得到:
ˆ 2
2 ( yi x2i )( x 3 ) ( yi x3i )( x2 i x3i ) i 2 2 ( x 2 )( x ) ( x x ) 3i 2 i 3i 2i
ˆ 3
( yi x2 i )( x 2 ) ( yi x2 i )( x2 i x3i ) 2i
0 0
2 2 x 3 i ˆ ) 在 x2 x3时,Var ( 2 2 2 2 2 2 2 ( x3i) ( x )
3i
x x
2 2i
2 x 2i 2 3i
( x2i x3i)
2

因此,存在完全共线性时,不能利用OLS估计参数,参数的方差变为无限大。
ˆ ) Var ( 2
当样本容量增大时,
x x
2 2i
x
2 3i
( x 2i x3i)
2
2 2i

2 2 x ( 1 r ) 3i 23

x 增大,方差将减小,可以提高参数估计的精度。
2 2i
5、横截面数据与时间序列数据并用 如果时间序列数据中,解释变量间存在高度相关,可以先使用横截面数据估计 出存在高度相关解释变量中的一个或多个,然后再在时间序列数据中剔除这些变量, 在消除多重共线性影响下估计因变分母可化简为 ( x 3 )( v i ) 0。 i ˆ 是可估计的的。同样 ˆ 也是可估计的。而方 此时, 2 3
ˆ ) Var ( 2
x x
2 2i
x
2 3i
2 2 2 x ( x x ) / x 3 i 2 i 3i 2 i 2 2 2 2 x [ 1 ( x x ) /( x x 3i 2 i 3i 2i 2i )]
Yi 1 2 X 2 3 X 3 ui
如果采用OLS估计,则有:
ˆ Y ˆ X ˆ X 1 2 2 3 3 min
2 ˆ ˆ X ˆ X )2 ˆ u ( Y i i 1 2 2 3 3
ˆ x ˆ x )2 ( yi 2 2 3 3
第五章 多重共线性
第一节 违背古典假定的估计问题
我们关于经典线性回归模型(CLRM)有如下假定: 假定1:回归模型对参数是线性的 假定2:在重复抽样中X的值是固定的(非随机) 假定3:干扰项的均值为零。即,E(ui|Xi)=0 假定4:同方差性或ui的方差相等。即 Var(ui|Xi)=E[ui-E(ui)|Xi]2 = E(ui2|Xi]2 = 2 假定5:各个干扰项无自相关。即 Cov(ui,uj|Xi,Xj)=E[ui-E(ui|Xi) ][uj-E(uj|Xj)] = E(ui|Xi)(uj|Xj) = 0 假定6:ui和Xi的协方差为零。即 Cov(ui,Xi) = E[ui – E(ui)][ Xi – E(Xi)] = E[ui (Xi – E(Xi))] =E(ui Xi) – E(ui)E(Xi) = E(ui Xi) = 0 假定7:观测次数必须大于待估计的参数个数。 假定8:解释变量X的只要有变异性。即一个样本中,Xi不能完全相同。 假定9:模型没有设定误差。 假定10:没有完全的多重共线性,即解释变量之间没有完全的线性关系。 在现实中,以上假定不一定得到满足。本章讨论某些假定不成立时的估计问题。
服从t (n-k+1)。给定显著水平α,若统计量大于临界值tα/2,则说明Xj 与Xi引起回归方 程的多重共线性。 二、解决多重共线性的方法 如果发现监视变量之间存在高度得多重共线性,就必须消除这种多重共线性的 影响,保证模型的正确性和估计的有效性。有以下几种解决方法。 1、除去不重要的变量 把回归模型中引起多重共线性,而对因变量的影响不大的变量。但是变量的剔 除可能导致模型的设定偏误。
3 k vi 2 X 1i X 2i X 3i X ki 1 1 1 1
其中vi 为随机项。我们把这种解释变量间存在的完全或不完全的线性关系称为多重 共线性。由于经济变量自身的性质,它们之间这种多重共线性或强或弱,普遍存在 的。
第三节 多重共线性的影响
一、完全多重共线性 以两个解释变量的回归模型为例,假定回归模型为:
二、不完全多重共线性 假定X2,X3 间存在不完全多重共线性, 以离差形式表示为: 其中vi 为随机项。则
x2。 x3 vi
ˆ 2
2 [ yi ( x3i vi )]( x 3 ) ( yi x3i )[ ( x3i vi ) x3i ] i 2 2 [ ( x3i vi ) 2 ]( x 3 ) [ ( x v ) x ] 3i i 3i i
第二节 多重共线性(multi-collinearity)
如果假定10不成立,即在解释变量X1,X2,…,Xk中,存在线性关系。 解释变量间的确定线系关系存在时,存在不全为零的常数
1 , 2 ,k,使
1 X1i 2 X 2i k X ki 0
设1 0, 则 X 1i
如果通过前的F检验得到某解释变量Xj 与其它解释变量存在多重共线性,则可以 通过t 检验寻找Xj 与哪些变量引起多重共线性。 首先计算Xj 与其它每个解释变量的偏相关系数:
rji.2( j 1)( j 1)( i 1)( i 1)k , i j , i 2,3,k 定义统计量: rji.2( j 1)( j 1)( i 1)( i 1)k t 2 (1 r ji ) /(n k 1) .2( j 1 )( j 1)( i 1 )( i 1 )k
2 2 ( x 2 )( x ) ( x x ) 2 i 3 i 2i 3i
如果X2与X3存在完全共线性,即
x2 则: x3
ˆ 2
2 ( yi x2i )( x 3 ) ( yi x3i )( x2i x3i ) i 2 2 ( x 2 )( x ) ( x x ) 3 i 2 i 3i 2i
3、变换模型的形式 如果作为解释变量的某些经济变量间出现高度相关,而进行回归分析的目的是 为了预测,不是研究单个经济变量对因变量的影响时,可以根据实际问题,改变模 型模型的形式。 4、增加样本容量 如果多重共线性是由样本引起,增加样本容量可以减少多重共线性的程度。以 二元回归方程为例,根据第二节的结果,参数估计值的方差为:
2 X 2i 3 X 3i k X ki 1 1 1
这种关系为完全多重共线性,变量间的相关系数为1。实际上更多的情况是, 解释变量间有不完全的线性关系:存在不全为零的数:
1 , 2 ,k,使
假定λ1<>0,
1 X1i 2 X 2i k X ki vi 0

( x2 i x3i)
2
2 2i
相关文档
最新文档