2019年1计量经济学作业多重共线性p171.doc复习进程

合集下载

计量经济学【多重共线性】

计量经济学【多重共线性】

四、多重共线性的解决方法
(三)逐步回归法( Frisch综合分析法) ◆ 从所有解释变量中间先选择影响最为显著的变量 建立模型,然后再将模型之外的变量逐个引入模型; 每引入一个变量,就对模型中的所有变量进行一次显 著性检验,并从中剔除不显著的变量;逐步引入—— 剔除——引入,直到模型之外所有变量均不显著时为 止。这种消除多重共线性的方法称为逐步回归法,也 称 Frisch 综合分析法。
◆ 根据前页表中的数据,回归结果如下所示:
◆ 回归结果表明,在 5%显著性水平下,收入(GNP) 和价格(CPI) 的系数各自均不是统计显著的。模型 通过 F 检验。我们可以断定上述方程存在严重的多 重共线性。为解决这个问题,我们可以用实际进口 额 (IM/CPI) 对实际收入 (GNP/CPI) 进行回归,得到 如下结果:
根据理论分析,可支配收入应该是服装需求最主要的
影响因素,相关系数检验也表明,可支配收入与服装
需求的相关性最强。所以,以
作为最基
本的模型。
(2) 加入服装价格指数 ,对服装需求 关于 建立二元回归模型:
可以看出,加入 后, 值稍微有所减少,参数估 计值的符号也正确,并没有影响 系数的显著性, 所以在模型中保留 。
如果两个解释变量完全相关,如 回归模型退化为一元线性回归模型
,该二元线性
这时,只能确定综合参数 定 各自的估计值。
的估计值,却无法确
二、多重共线性造成的影响
◆ 注意:除非是完全共线性,多重共线性并不意味 着任何基本假设的违背;因此,即使出现较高程度 的多重共线性,OLS 估计量仍具有线性性等良好的 统计性质。问题在于,即使 OLS 法仍是最好的估计 方法,它却不是“完美的”,尤其是在统计推断上
五、案例分析

多重共线性

多重共线性

解决方法
解决方法
(1)排除引起共线性的变量 找出引起多重共线性的解释变量,将它排除出去,以逐步回归法得到最广泛的应用。 (2)差分法 时间序列数据、线性模型:将原模型变换为差分模型。 (3)减小参数估计量的方差:岭回归法(Ridge Regression)。 (4)简单相关系数检验法
谢谢观看
简介
简介
对线性回归模型 基本假设之一是自变量,之间不存在严格的线性关系。如不然,则会对回归参数估计带来严重影响。为了说 明这一点,首先来计算线性回归模型参数的 LS估计的均方误差。为此。重写线性回归模型的矩阵形式为 其中服从多元正态分布,设计矩阵 X是的,且秩为 p。这时,参数的 LS估计为,而回归系数的 LS估计为。 注意到由此获得的 LS估计是无偏的,于是估计的均方误差为 其中是的特征根。显然,如果至少有一个特征根非常接近于零,则就很大,也就不再是的一个好的估计。由 线性代数的理论知道,若矩阵的某个特质根接近零,就意味着矩阵 X的列向量之间存在近似线性关系。 如果存在一组不全为零的数,使得 则称线性回归模型存在完全共线性;如果还存在随机误差 v,满足,使得 则称线性回归模型存在非完全共线性。 如果线性回归模型存在完全共线性,则回归系数的 LS估计不存在,因此,在线性回归分析中所谈的共线性 主要是非完全共线性,也称为复共线性。判断复共线性及其严重程度的方法主要有特征分析法(analysis of eigenvalue),条件数法 (conditional numbers)和方差扩大因子法(variance inflation factor)。
产生原因
产生原因
主要有3个方面: (1)经济变量相关的共同趋势 (2)滞后变量的引入 (3)样本资料的限制
影响
影响

经济计量学 多重共线性问题

经济计量学 多重共线性问题
逆运算矩阵有较小特征根的情形得到改善
3. 岭回归估计是线性估计量
( ) D 1* ( ~ x ~ x I ) 1 ~ x Y
~
0 ( ) [ l MD*1 ( ~ x ~ x I ) 1 ~ x ]Y
4. 岭回归估计是有偏估计量
~
1 n
~ E ( ) D*1 ( ~ x ~ x I ) 1 ~ x ~ x D*
高度共线性
r ( X X ) r ( X ) k 1
det( X X ) a0a1 ak 0
1 ai
ˆ ) 2Tr ( X X ) 1 2 var( i
OLS估计可能出现与较大方差有关的一类症状:
ˆ ) 可能很大; ˆr( (a)个别 va i
X4=轻工业总产值(亿元) X5=农产品收购价格指数与农村工业品牌价指数比 样本区间:1953-1982
农民消费函数主要回归计算结果
ˆ i
-223.33 0.8129
ˆ) var( i
ti
-3.91 7.93
ˆ) VIF ( i
57.127 0.1025
132.52
0.0039
-0.1478 0.0068 94.62
求解知: z 2
~ x a2
,其中:
a2
是矩阵
~ x ~ x 的属于第二大特征根 2 的单位特征向量;
z 2 z 2 2
z1 0
z (~ ( ~ ~ ~ z1 x a ) x a ) a x 2 1 2 1 x a 2 2 a1 a 2 0
逐一求得全部
k
个组合变量 z1 , z 2 , , z k ,它们具有以下性质:

计量经济学-7多重共线性

计量经济学-7多重共线性

2 2
因此,存在完全共线性时,不能利用OLS估计参数,参数的 方差变为无限大。
计量经济学
2.不完全多重共线性
假定X1,X2 间存在不完全多重共线性, 以离差形式表示为: 其中vi 为随机项。则
x1 x2 vi
ˆ 1
[ yi ( xi 2 vi )]( x i22 ) ( yi xi 2 )[ ( xi 2 vi ) xi 2 ] [ ( xi 2 vi ) 2 ]( x i22 ) [ ( xi 2 vi ) xi 2 ]2
计量经济学
6、无多重共线。设( X i1,X i 2, ,X iP)为 (X 1,X 2, ,X P)的第i个观测值, 1 1 记: X 1 X 11 X 21 X n1 X 12 X 22 X n2 X 1P X 2P X nP
4、OLS估计量对观测值的轻微变化相当敏感。
计量经济学
三、多重共线的检验
1、利用解释变量之间的拟合优度(判定系数)检验法 ①每次以一个解释变量对余下的P-1个解释变量做回归, 即建立P个回归方程: 2 X1 g ( X , X , , X ) R 1 2 3 P 1
X2 g ( ,X 3, ,X P) 2 X1 X P g( ,X 2, ,X P 1) p X1
计量经济学
2、利用先验信息 假定对回归模型:
Yi 0 1 X i1 2 X i 2 ui
已知X1和X2 之间高度共线。根据先验信息,确定β2=2β1, 带入模型后可得:
Yi 0 1 X i1 2 1 X i 2 ui 0 1 ( X i1 2 X i 2 ) ui 设变量Z i ( X i1 2 X i 2 ), 估计方程 Yi 0 1Z i ui ˆ 和 ˆ 2 ˆ。 可得到

计量经济学-第7章(多重共线性)-文档资料

计量经济学-第7章(多重共线性)-文档资料
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著 9
3.参数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性,例如 X2= X1 ,这时,X1和 X2前的参数1、2并不反映各自与被解释变量之间的结构关系,而是反映它 们对被解释变量的共同影响。1、2已经失去了应有的经济含义,于是经常 表现出似乎反常的现象:例如1本来应该是正的,结果恰是负的。
存在比较严重的多重共线性,因此仅利用相关系数来判断是否存在多
重共线性,有时不能准确判断多重共线性的严重程度。
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著
14
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著
15
2、辅助回归法 利用模型中每一个解释变量分别以其余解释变量为解释变量进行回归, 并计算相应的拟合优度。 如果某一种回归 X j c 1 X1 2 X 2 ... j 1 X j 1 j 1 X j 1 ... k X k
相关情况,大企业二者都大,小企业都小。
(2)滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济 关系。 例如,消费=f(当期收入, 前期收入),显然,两期收入间有较强的 线性相关性。
《计量经济学》,高教出版社,王 少平、杨继生和欧阳志刚等编著 5
(3)多项式项的引入
如研究企业的成本与产量之间的关系时,往往在成本模型中引
进产量的三次方,即:
Yi 0 1 X1i 2 X12i 3 X13i ui
在这种模型中,解释变量之间可能存在一定程度的多重共线性。
(4)样本资料的限制
由于完全符合理论模型所要求的样本数据较难收集,特定范
围内抽取样本可能存在某种程度的多重共线性。 进一步地讲,如果在实际应用中我们有足够多的样本,解释 变量的多重共线性程度就会大大降低。这就再次说明,多重共线 性本质上是样本问题。

计量经济学 第七章 多重共线性

计量经济学 第七章 多重共线性

ˆ QV ( β 1 ) =
2 &2 σ µ ∑ x2 i
&2 &2 & & x1i ∑ x2 i − ( ∑ x1i x2 i )2 ∑
2 &2 σ µ ∑ x2 i ˆ = 2 = ∞ 同 样, V ( β 2 ) = ∞ &2 &2 λ ( ∑ x2 i )2 − λ 2 ( ∑ x2 i )2
第七章 多重共线性
§7.4 消除多重共线性的方法
三、利用事前信息 事前信息指经济理论或前人研究的成果,其在一定的 条件下可消除多重共线性。 如生产函数Y = ALβ1 K β 2 e ε,其中Y 、L、K 分别表示产出 劳力、资本,变换模型有: ln Y = ln A + β 1 ln L + β 2 ln K + ε L、K 之间可能存在共线性,但有“生产规模报酬不变”假定, Y L ln = β 0 + β 1 ln + ε 故有:β 1 + β 2 = 1,故原方程可转换为: K K 从而消除了多重共线性。
1 2
& & ( ∑ x1 x2 ) 2 ∴R = = r12 & &2 x12 x2 ∑
2 1
第七章 多重共线性
§7.3 多重共线性的检验
三 、利 用缺 某个解 释变 量的 拟合优 度检 验 设有 线性回 归模 型 y = f ( x1,x2,⋅ ⋅ ,xk ),其拟合优度为R 2 ⋅
现依次建立缺一个解释变量 的回归方程: y = f1 ( x1,x2,⋅ ⋅ ,xk ) ⋅ y = f 2 ( x1,x3,⋅ ⋅ ,xk ) ⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ y = f j ( x1,x2,x j −1,⋅ ⋅ ,x j +1 ⋅ ⋅ ⋅ ,xk ) ⋅ ⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅ y = f k ( x1,x2,⋅ ⋅ ,xk −1 ) ⋅

计量经济学(第四章多重共线性)

计量经济学(第四章多重共线性)

06
总结与展望
研究结论总结
多重共线性现象普遍存在于经济数据中,对计量 经济学模型的估计和解释产生了重要影响。
通过使用多种诊断方法,如相关系数矩阵、方差膨 胀因子(VIF)和条件指数(CI),可以有效地识别 多重共线性问题。
在存在多重共线性的情况下,普通最小二乘法 (OLS)估计量虽然仍然是无偏的,但其方差可能 变得很大,导致估计结果不稳定。
主成分分析法的优点
可以消除多重共线性的影响,同 时降低自变量的维度,简化模型。
岭回归法
岭回归法的基本思想
通过在损失函数中加入L2正则化项(即所有自变量的平方和),使得回归系数的估计更加稳定, 从而消除多重共线性的影响。
岭回归法的步骤
首先确定正则化参数λ的值,然后求解包含L2正则化项的损失函数最小化问题,得到岭回归系数的估 计值。
逐步回归法的优点
可以自动选择重要的自变量,同时消除多重共线性的影响。
主成分分析法
主成分分析法的基本思想
通过正交变换将原始自变量转换 为互不相关的主成分,然后选择 少数几个主成分进行回归分析。
主成分分析法的步骤
首先对原始自变量进行标准化处理, 然后计算相关系数矩阵并进行特征值 分解,得到主成分及其对应的特征向 量。最后,选择少数几个主成分作为 新的自变量进行回归分析。
岭回归法的优点
可以有效地处理多重共线性问题,同时避免过拟合现象的发生。此外,岭回归法还可以提供对所 有自变量的系数进行压缩估计的功能,使得模型更加简洁易懂。
05
实证研究与结果分

数据来源及预处理
数据来源
本研究采用的数据集来自于公开的统 计数据库,涵盖了多个经济指标和影 响因素的观测值。
数据预处理

计量经济学第四章 多重共线性

计量经济学第四章 多重共线性

x2i


3 2
x3i

x3i
参数的估计值为:
ˆ2
x32i x2i yi x2i x3i x3i yi
(
x22i )(
x32i ) (
x2i
x 3i
)2
x32i
2
x3i yi x32i 2 2
x32i x32i
x2i x3i x22i
x2i x3i
ˆ1 Y ˆ2 X 2 ˆ3 X 3
ˆ2
x32i x2i yi x2i x3i x3i yi ( x22i )( x32i ) ( x2i x3i )2
ˆ3
x22i x3i yi x2i x3i x2i yi •
(
x22i )(
x32i ) (
x2i
x 3i
)
2
x2i yi x3i yi
x2i x3i x32i
4.2多重共线性的后果
如果X1和X2完全线性相关,则存在非0的λ使得:
1 2 X 2i 3 X 3i 0
则有:
1 2 X 2 3 X 3 0
2 X 2i X 2 3 X3i X3 0
X 2i X3i X 2iYi
X
2 3i

X
3iYi


VAR
COV
(βˆ )


2
(XX)1


2

N X 2i


X 3i
X2i
X
2 2i
X 2i X 3i
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2019年1计量经济学作业多重共线性
p171.d o c
计量经济学作业
——多重共线性P171
8.下表是被解释变量Y,解释变量X1,X2,X3,X4的时间序列观测值:
时间序列观测值表
3 6.5 47.5 5.2 108 86
4 7.1 49.2 6.8 100 100
5 7.2 52.3 7.3 99 107
6 7.6 58.0 8.
7 99 111
7 8.0 61.3 10.2 101 114
8 9.0 62.3 14.1 97 116
9 9.0 64.7 17.1 93 119
10 9.3 66.8 21.3 102 121
(1)采用适当的方法检验多重共线性。

(2)多重共线性对参数估计值有何影响?
(3)用Frisch法确定一个较好的回归模型。

解:(1)采用参数估计值的统计检验法检验多重共线性。

用OLS最小二乘法,估计被解释变量Y与解释变量X1,X2,X3,X4的样本方程,如下所示:
图1-1 在Eviews中建立样本回归模型
图1-2 样本回归模型数据表
输入被解释变量与解释变量:
图1-3 整体样本回归模型建立
用最小二乘法求得结果如下所示:
图1-4 Eviews的结果分析一元线性样本回归方程为:
1.拟合优度检验
由上表可知,样本可决系数为:
R-squared=0.978915
修正样本可决系数为:
Adjusted-squared=0.962046

计算结果表明,估计的样本回归方程较好的拟合了样本观测值。

2.F检验
提出检验的原假设为
对立假设为
由图1-4,得F统计量为
F-statistic=58.03254
对于给定的显著性水平α=0.05,查出分子自由度为4,分母自由度为5的F分布上侧分位数F0.05(4,5)=5.19。

因为
F=58.03254>5.19,所以否定H0,总体回归方程显著。

3.t检验
提出检验的原假设为
由上表可知,t统计量为
β0的t-statistic=1.975329
β1的t-statistic=1.149646
β2的t-statistic=2.401806
β3的t-statistic=-0.662938
β4的t-statistic=0.472622
对于给定的显著性水平α=0.05,查出自由度v=5的t分布双侧分位数t0.05/2(5)=2.57。

t0=1.975329<2.57= t0.05/2(5),所以否定H1,β0显著等于0。

t1=1.149646<2.57=t0.05/2(5),所以否定H1,β1显著等于0。

t2=2.401806<2.57= t0.05/2(5),所以否定H1,β0显著等于0。

|t3|=0.662938<2.57= t0.05/2(5),所以否定H1,β0显著等于0。

t4=0.472622<2.57= t0.05/2(5),所以否定H1,β0显著等于0。

该模型的拟合优度较大,总体线性关系显著,但回归系数在统计上均不显著,即t检验绝对值过小,说明模型存在多重共线性。

(2)多重共线性对参数估计值的影响
多元线性回归模型中如果存在完全的多重共线性,则参数的最小二乘估计量是不确定的,其标准差为无穷大;如果存在近似的多重共线性,则参数的最小二乘估计量是确定的,而且具有无偏性,但其方差较大,常导致参数估计值不精确,不稳定,样本观测值稍有变动,增加或减少的解释变量等都会使参数估计值发生较大变化,甚至出现符号错误,从而不能正确反映解释变量对被解释变量的影响,参数估计量的标准差较大,使参数t假烟增加了接受零假设的可能,从而舍去对被解释变量有显著影响的解释变量。

(3)用Frisch法修正多重共线性
1.对Y分别关于X1,X2,X3,X4作最小二乘回归,其步骤与结果如下所示:
图1-5 Y与X1的最小二乘回归
图1-6 Eviews的结果分析得:
图1-7 Y与X2的最小二乘回归
图1-8 Eviews的结果分析得:
图1-9 Y与X3的最小二乘回归
图1-10 Eviews的结果分析
得:
图1-11 Y与X4的最小二乘回归
图1-12 Eviews的结果分析
得:
根据回归结果易知X1是最重要的解释变量,所以选取第一个回归方程为基本方程。

2.加入X2,对Y关于X1,X2作最小二乘回归,得:
图1-13 Y与X1,X2的最小二乘回归
图1-14 Eviews的结果分析得:
可以看出,加入X2后,拟合优度有所增加,参数估计值的符号也正确,并且没有影响X1的显著性,所以在模型中保留X1。

3.加入X.4,对Y关于X1,X2,X4作最小二乘回归,得:
图1-15 Y与X1,X2,X4的最小二乘回归
图1-16 Eviews的结果分析
得:
可以看出,在加入X4后,拟合优度R2增加不显著,调整后的R2有所减小,并且X1和X4系数均不显著,说明存在严重的多重共线性,在模型中保留X1,略去X4。

相关文档
最新文档