(完整版)多重共线性检验与修正.doc

合集下载

多重共线性的检验与修正

多重共线性的检验与修正

多重共线性的检验与修正【实验目的】掌握多重共线性的检验方法和补救措施。

【实验要求】选择习题4.7,运用EViews 软件进行解答。

【实验内容】一、 利用EViews 软件,输入654321,X X X X X X Y ,,,,, 等数据,采用这些数据对模型进行OLS 回归,结果如下表所示由此可见,该模型2R =0.9810,2R =0.9677可决系数很高,F 检验值73.8081,明显显著,但是当228.2)818()(025.02/=-=-t k n t α,不仅所有解释变量系数t 检验不显著,而且654321X X X X X X ,,,,,系数符号与预期相反,这表明它们之间很可能存在严重多重共线性;二、计算各解释变量的相关系数,的相关系数矩阵如下由相关系数矩阵可以看出,各解释变量相互之间相关系数较高,证实确实存在严重的多重共线性。

三、修正多重共线性采用逐步回归的办法,去检验和解决多重共线性问题。

分别做lny对lnxi(i=1……7)的一元回归,结果如下表:其中,加入lnx1的方程修正拟合度最大,以lnx1为基础,顺次加入其它变量逐步回归,结果如下表:这里说明:对于两个解释变量标准T 分布为:1312318302502.)(t )(n t .α/=-=-,加入各解释变量后,要么2R 下降,要么ln i X (i=1……7)参数的T 检验不显著,这说明765432,X X X X X X ,,,,引起严重多重共线性,应予以剔除。

最后,修正后的回归结果为:1ln 2359.01631.9ˆln X Y t+= T= (73.1914) (19.7895)2R =0.9607 2R =0.9583 F=391.6234 DW=0.5038 这说明,在其他因素不变的情况下,当国民总收入增加e 单位,能源消费标准煤总量增加2359.0e单位。

此案例存在问题是样本容量过小,其可靠性受到影响,如果增大样本容量,效果会好一些; 【练习解答】1) 所建立的对数线性多元回归模型为1ln 2359.01631.9ˆln X Y t+= 2) 会,从表中的解释变量比如“国民总收入”与“GDP ”的本身意义,我们知道这两个变量之间存在很大的联系;3)存在多重共线性,通过逐步回归方法:①简单线性回归分析,找出基本解释变量②逐步进行二次,三次回归分析,直到出现回归系数不显著或者变量系数符号与预期不相符,以及修正拟合度不高的情况,即可认为该解释变量会引起严重多重共线性,应予以剔除,最后得出所需要的回归模型。

(完整word版)多重共线性问题的几种解决方法

(完整word版)多重共线性问题的几种解决方法

多重共线性问题的几种解决方法在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,X k中的任何一个都不能是其他解释变量的线性组合。

如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。

多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。

这里,我们总结了8个处理多重共线性问题的可用方法,大家在遇到多重共线性问题时可作参考:1、保留重要解释变量,去掉次要或可替代解释变量2、用相对数变量替代绝对数变量3、差分法4、逐步回归分析5、主成份分析6、偏最小二乘回归7、岭回归8、增加样本容量这次我们主要研究逐步回归分析方法是如何处理多重共线性问题的。

逐步回归分析方法的基本思想是通过相关系数r、拟合优度R2和标准误差三个方面综合判断一系列回归方程的优劣,从而得到最优回归方程。

具体方法分为两步:第一步,先将被解释变量y对每个解释变量作简单回归:对每一个回归方程进行统计检验分析(相关系数r、拟合优度R2和标准误差),并结合经济理论分析选出最优回归方程,也称为基本回归方程。

第二步,将其他解释变量逐一引入到基本回归方程中,建立一系列回归方程,根据每个新加的解释变量的标准差和复相关系数来考察其对每个回归系数的影响,一般根据如下标准进行分类判别:1.如果新引进的解释变量使R2得到提高,而其他参数回归系数在统计上和经济理论上仍然合理,则认为这个新引入的变量对回归模型是有利的,可以作为解释变量予以保留。

2。

如果新引进的解释变量对R2改进不明显,对其他回归系数也没有多大影响,则不必保留在回归模型中。

3.如果新引进的解释变量不仅改变了R2,而且对其他回归系数的数值或符号具有明显影响,则认为该解释变量为不利变量,引进后会使回归模型出现多重共线性问题。

不利变量未必是多余的,如果它可能对被解释变量是不可缺少的,则不能简单舍弃,而是应研究改善模型的形式,寻找更符合实际的模型,重新进行估计.如果通过检验证明回归模型存在明显线性相关的两个解释变量中的其中一个可以被另一个很好地解释,则可略去其中对被解释变量影响较小的那个变量,模型中保留影响较大的那个变量。

6-多重共线性

6-多重共线性

举例
HOUSING = α 1 + α 2 INTRATE t + α 3 POPt + u1t A:
HOUSING = β 1 + β 2 INTRATEt + β 3GNPt + u 2 t B:
HOUSING = γ 1 + γ 2 INTRATE t + γ 3 POPt + γ 4GNPt + u1t C:
完全多重共线性 近似多重共线性
λ1 X 1i + λ2 X 2i = 0 λ1 X 1i + λ2 X 2i + vi = 0
矩阵形式
在线性回归模型中,对X的基本假定是:
rank ( X ) = k (k < n)
即 X ′X ≠ 0 ,亦即矩阵中各列向量之间是线 性无关的,如果这一假定不满足, rank ( X ) < k 或 X ′X = 0 ,则称模型存在多重共线性。
ln Yt = b0 + b1 ln X 1t + b2 X 2t + b3 X 3t + ε t
销量 出厂价格 市场价格 市场总供应量 高度相关
X 1t ln Yt = b0 + b1 ln + b2 X 3t + ε t X 2t
相对价格
6. 数据中心化
Yi = b0 + b1 X i + b2 X i2 + L + bk X ik + ε i
6
多重共线性
主要内容
多重共线性的概念 产生多重共线性的原因 多重共线性的结果 多重共线性的检验 多重共线性的修正方法
一. 多重共线性的概念

多重共线性的判断与修正

多重共线性的判断与修正

多重共线性的判断与修正一、多重共线性的判断1. 综合统计检验法LS Y C X1 X2 对模型进行OLS, 得到参数估计表(1) 当2,R F 很大,而回归系数的t 检验值小于临界值时,可判定该模型存在多重共线性。

(2) 当完全共线性存在时,模型的OLS 无法进行,Eviews 会提示:矩阵的逆(1()T X X -)不存在。

2. 简单相关系数检验法LS Y C X1 X2 对模型进行OLS, 得到参数估计表中的2R .点击:Quick/Group Statistics/Correlation在对话框中输入:X1 X2 , 点击OK, 即可得到简单相关系数矩阵检验:若存在 i j x x r 接近于1, 或 22,i j x x r R >,则说明,i j x x 之间存在着严重的相关性。

3. 辅助回归法(方差扩大因子法)设 121112...(1)(1)...j j k Xj X X X j X j Xk V ααααα-+=+++-+++++ (j ) LS Xj X1 X2…Xk 对(j) 进行OLS, 得到参数估计表检验:若表中 (2,1)F F k n k α>--+, 则可确定存在多重共线性。

或者(方差扩大因子法):计算211j jVIF R =-, (2j R 为以上方程的可决系数), 若10j VIF ≥, 则可确定存在多重共线性。

4. 逐步回归法1) 首先计算被解释变量对每个解释变量的回归方程,得到基本回归方程:LS Y C Xi OLS ,得到基本回归方程(i), i = 1,2,…,k2) 从这些基本回归方程中选出最合理的方程, 即,2R 取值最大,且t 检验显著。

比方说,0j Y Xj ββ=+3) 在这个选出的方程中增加新的解释变量, 再进行OLS 分析:LS Y C Xj Xi ( i= 1,2,…,j-1, j+1,…k)判断: 如果新加入的解释变量对2R 改进最大, 且每个系数又是t 统计显著,则保留这个新的解释变量。

多重共线性检验与修正

多重共线性检验与修正

多重共线性检验与修正数据来源:《中国统计年鉴2014》12-10、4-3、12-4、12-5、12-8、Eviews操作:1、基本操作:(1)录入数据:命令:data y l m f a ir(y代表粮食产量,l代表第一产业劳动力数量,m代表农业机械总动力,f代表化肥施用量,a代表农作物总播种面积,ir为有效灌溉面积/农作总播种面积得出的灌溉率)(2)做线性回归:命令:LS y c l m f a ir2、检验多重共线性(1)方差膨胀因子判断法在生成的线性回归eq01中,view—coefficient diagnostics—variance inflation factors看生成表格中的Centered VIF,发现L、M、F、A、IR的方差膨胀因子都很大,说明存在严重多重共线性。

(eg:L的Centered VIF指以L为因变量,M、A、F、IR为自变量所做出的辅助回归的判定系数R²,然后1/1-R²得出的值。

)(由课本内容可知,当完全不共线性时,VIF=1;完全共线性时,VIF=正无穷)(2)相关系数矩阵判断法命令:cor l m f a ir这个是通过看各个解释变量之间的相关系数来判断是否存在多重共线性的。

可以看到大多数解释变量之间两两相关系数都大于0.9。

相关系数极大说明解释变量之间存在很高的相关性,因而也就很可能存在共线性。

3、修正多重共线性(1)逐步回归排除引起共线性的变量①菜单栏操作在生成的线性回归eq01中,Estimate—Method—STEPLS接下来会出现两个框框,上面的框框是固定住不做逐步回归的变量,一般设定为y和c下面的框框是需要进行逐步回归选择是否剔除的变量,这里填入l m f a ir 然后出来一个新的表格,这个表格已经自动选择了可以保留的变量l a f,剔除了m ir②命令栏操作命令:STEPLS y c @ l m f a ir这条命令其实和菜单栏操作的意思一样,stepls代表采用逐步回归方法,@前的y、c代表固定不做逐步回归的变量,@后的l、m、f、a、ir代表要做逐步回归的变量出来的结果和菜单栏操作的结果是一样的。

多重共线性和自相关的检验和解决

多重共线性和自相关的检验和解决

《计量经济学》课程实训项目报告项目名称多重共线性和自相关的检验及解决方法实训日期2012.11.23 实训人53 班级统计1005 学号1004100508 指导教师张维群应用软件SPSS 实训地点实验楼314实训目的1.多重共线性和自相关的检验及解决方法的软件操作能力训练2.验证多重共线性和自相关的检验及解决方法的理论,并加深理解。

实训内容1.根据自己在网上寻找到的感兴趣的数据,用膨胀因子法和相关系数法对其进行是否存在多重共线性的检验;运用图示法和D-W法对数据是否存在自相关进行检验。

2.若检验出有多重共线性,则用逐步回归法剔除对因变量影响不大的解释变量;若检验出存在自相关,则用广义差分法建立新的模型进行解决。

实训数据资料说明1.问题:我国GDP的增长率与第一产业增长率、第二产业增长率、第三产业增长率用最小二乘法回归时的模型是否存在多重共线性和自相关。

若存在,先解决多重共线性再解决自相关并重新估计。

2.指标有哪些?自变量有x1:第一产业增长率,x2:第二产业增长率,x3:第三产业增长率。

因变量是y:GDP的增长率。

3.数据来源什么地方?数据是从网上查找的,数据包括从1981—2010年我国的GDP增长率、第一产业增长率、第二产业增长率和第三产业增长率,为时间序列数据,样本量为30。

实训结果与简要分析首先对原始数据进行用普通最小二乘法进行大致的拟合,并选择Linear Regression-Statistics-Collinearity diagnostics,即用膨胀因子法对原模型进行多重共线性检验,结果如下:Model SummaryModel R R Square Adjusted R Square Std. Error of the Estimate1 .982a.965 .961 .55883表1A N OVA bModel Sum of Squares df Mean Square F Sig.1 Regression 224.079 3 74.693 239.176 .000aResidual 8.120 26 .312T otal 232.199 29表2Coefficients aModel1(Constant) 第一产业增长率第二产业增长率第三产业增长率Unstandardized Coeff icients B .690 .187 .456 .287Std. Error .400 .047 .030 .042 Standardized Coeff icients Beta .169 .742 .344t 1.727 3.971 15.045 6.837 Sig. .096 .001 .000 .000 Collinearity Statistics T olerance .740 .553 .531VIF 1.351 1.809 1.883表3由表1可知模型的可决系数R^=0.965>0.8,可见其拟合程度较好。

计量经济学实验四-多重共线性的检验与修正

《计量经济学》实验报告四开课实验室:财经科学实验室年月日班级:学号:姓名:实验项目名称:多重共线性的检验与修正成绩:实验性质:验证性□综合性□设计性指导教师签字:【实验目的】掌握多重共线性的检验与修正方法并能运用Eviews软件进行实现【实验要求】能根据OLS的估计结果判断是否存在多重共线性,熟悉逐步回归法修正模型的基本操作步骤,读懂各项上机榆出结果的含义并能进行分析【实验软件】 Eviews 软件【实验内容】根据给定的案例数据按实验要求进行操作【实验方案与进度】实验:设蔬菜销售量Y与人口(X1)、价格(X2)、粮食(X3)、收入(X4)、副食(X5)Dependent Variable: Y Method: Least Squares Date: 06/03/13 Time: 16:48 Sample: 1978 1996 Included observations: 19Variable Coefficient Std. Error t-Statistic Prob. C -1.530260 6.006901 -0.254750 0.8032 X1 0.014649 0.002923 5.012107 0.0003 X2 -0.702775 0.254521 -2.761169 0.0172 X3 0.060321 0.027575 2.187545 0.0492 X4 0.119825 0.036991 3.239290 0.0071 X5 0.018081 0.026022 0.694816 0.5004 X60.0922660.0542651.7003020.1148 R-squared0.986169 Mean dependent var 9.091579 Adjusted R-squared 0.979254 S.D. dependent var 1.717935 S.E. of regression 0.247442 Akaike info criterion 0.322027 Sum squared resid 0.734730 Schwarz criterion 0.669979 Log likelihood 3.940740 F-statistic 142.6067 Durbin-Watson stat2.292164 Prob(F-statistic)0.000000123456-1.5300.0150.7030.0600.120.0180.092t t t t t t t t Y X X X X X X u =+-+++++(2)方程线性显著性检验由(1)表中的数据可知F 统计量的值为142.6067,查表得0.05(6,12)F =3,显然142.6067>0.05(6,12)F =3,说明方程具有线性显著性。

多重共线性验证及修正

论文选读:中国货币需求的因素分析钟瑜王桢黄琦珍内容摘要:本文以宏观货币需求理论为基础,引入收入和利率两个解释变量,利用计量经济学的方法,分析货币需求与这两者的关系.从中国的实际情况出发,在利用年度数据分析的基础上,又引入九十年代中期到目前为止的季度数据着重分析利率对货币需求的影响,从而将经济理论和中国现实情况结合进行分析.关键字:货币需求利率一经济理论阐述凯恩斯在传统的货币数量论和现金余额说的基础上,考虑了货币的交易职能和货币的价值贮藏职能,提出了自己的货币需求理论。

他认为人们之所以持有货币是处于三个动机:交易动机,预防动机和投机动机,从而相应地形成了货币的交易需求,预防需求和投机需求。

随着经济的发展,交易与收入和支出往往在时间上不一致,人们为了应付日常的购买而持有一定量的货币即构成了货币的交易需求。

而人们为了应付一些意外开支而持有的货币即为货币的预防需求。

这两种需求都来源于货币的交易媒介职能。

在影响交易动机和预防动机的众多因素中,货币收入起着决定作用,并且收入与货币的交易需求和预防需求成正方向变化。

而货币的投机需求则是为了应付有价证券市场上价格的变化,从而获利。

这一货币需求来源于货币的价值贮藏职能。

人们总是根据对利率变动的预期持有一定量的货币,以在有利时机购买债券进行投机获利,因而,货币的投机需求与利率成反方向变化。

凯恩斯根据对人们持有货币的心理动机的分析,将货币需求分为两个部分:货币的交易需求和预防需求L1(Y)和货币的投机需求L2(r), 从而提出了他的货币需求函数:L=L1(Y)+L2(r),其中,L代表对货币的需求,Y代表收入,r代表利率.在凯恩斯的货币需求理论的基础上,后凯恩斯主义对其进行了发展。

美国经济学家汉森将商品市场和货币市场结合起来建立了IS-LM模型,认为货币的交易需求不仅受到收入的影响,而且受到利率的影响。

这是由于利率的变化会影响投资,进而影响收入,最终影响对货币的交易需求。

实验四-多重共线性模型的检验和处理

实验报告课程名称:计量经济学实验项目:实验四多重共线性模型的检验和处理实验类型:综合性□设计性□验证性 专业班别:11本国贸五班姓名:学号:实验课室:厚德楼A207指导教师:实验日期:2014/5/20广东商学院华商学院教务处制一、实验项目训练方案小组合作:是□否 小组成员:无实验目的:掌握多重共线性模型的检验和处理方法:实验场地及仪器、设备和材料实验室:普通配置的计算机,Eviews软件及常用办公软件。

实验训练内容(包括实验原理和操作步骤):【实验原理】多重共线性的检验:直观判断法(R2值、t值检验)、简单相关系数检验法、方差扩大因子法(辅助回归检验)多重共线性的处理:先验信息法、变量变换法、逐步回归法【实验步骤】(一)多重共线性的检验1.直观判断法(R2值、t值检验)根据广东数据(见附件1),先分别建立以下模型:【模型1】财政收入CS对第一产业产值GDP1、第二产业产值GDP2和第三产业产值GDP3的多元线性回归模型;(请对得到的图表进行处理,以上在一页内)【模型2】固定资产投资TZG对固定资产折旧ZJ、营业盈余YY和财政支出CZ的多元线性回归模型。

观察模型结果,初步判断模型自变量之间是否存在多重共线性问题。

【模型1】从上图可以得到,估计方程的判定系数R 2很高,但三个参数t检验值两个不显著,有一个较显著,其中一个参数估计值还是负的,不符合经济理论。

所以,出现了严重的多重共线性。

【模型2】1】从上图可以得到,估计方程的判定系数R 2很高,方程显著性F检验也显著,但只有两个参数显著性t检验比较显著,这与很高的判定系数不相称,出现了严重的多重共线性。

2.简单相关系数检验法分别计算【模型1】和【模型2】的自变量的简单相关系数。

【模型1】【模型2】(请对得到的图表进行处理,以上在一页内)根据计算的简单相关系数,判断模型是否存在多重共线性。

【模型1】可看出三个解释变量GDP1 、GDP2和GDP3之间高度相关,存在严重的多重共线性。

(完整版)多重共线性检验与修正

问题:选取粮食生产为例,由经济学理论和实际可以知道,影响粮食生产y的因素有:农业化肥施用量x1,粮食播种面积x2,成灾面积x3,农业机械总动力x4,农业劳动力x5,由此建立以下方程:y=β0+β1x1+β2x2+β3x3+β4x4+β5x5,相关数据如下:解:1、检验多重共线性(1)在命令栏中输入:ls y c x1 x2 x3 x4 x5,则有;可以看到,可决系数R2和F值都很高,二自变量x1到x5的t值均较小,并且x4和x5的t检验不显著,说明方程很可能存在多重共线性。

(2)对自变量做相关性分析:将x1——x5作为组打开,view——covariance analysis——correlation,结果如下:可以看到x1和x4的相关系数为0.96,非常高,说明原模型存在多重共线性2、多重共线性的修正 (1)逐步回归法第一步:首先确定一个基准的解释变量,即从x1,x2,x3,x4,x5中选择解释y 的最好的一个建立基准模型。

分别用x1,x2,x3,x4,x5对y 求回归,结果如下:在基准模型的基础上,逐步将x2,x3等加入到模型中, 加入x2,结果:从上面5个输出结果可以知道,y 对x1的可决系数R2=0.89(最高),因此选择第一个方程作为基准回归模型。

即: Y = 30867.31062 + 4.576114592* x1再加入x3,结果:再加入x4,结果:拟合优度R2=0.961395,显著提高;并且参数符号符合经济常识,且均显著。

所以将模型修改为:Y= -44174.52+ 4.576460*x1+ 0.672680*x2拟合优度R2=0.984174,显著提高;并且参数符号符合经济常识(成灾面积越大,粮食产量越低),且均显著。

所以将模型修改为:Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3拟合优度R2=0.987158,虽然比上一次拟合提高了;但是变量x4的系数为-0.091271,符号不符合经济常识(农业机械总动力越高,粮食产量越高),并且x4的t检验不显著。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

问题:
选取粮食生产为例,由经济学理论和实际可以知道,影响粮食生产y 的因素有:农业化肥施
用量x1,粮食播种面积x2,成灾面积x3,农业机械总动力x4,农业劳动力x5,由此建立以下方程: y=β0+β1x1+β2x2+β3x3+β4x4+β5x5,相关数据如下:
解: 1、检验多重共线性
(1)在命令栏中输入: ls y c x1 x2 x3 x4 x5,则有;
可以看到,可决系数R2 和 F 值都
很高,二自变量x1 到 x5 的 t 值
均较小,并且x4 和 x5 的 t 检验
不显著,说明方程很可能存在多
重共线性。

(2)对自变量做相关性分析:
将x1—— x5 作为组打开, view —— covariance analysis—— correlation ,结果如下:
可以看到x1 和 x4 的相关系数
为 0.96,非常高,说明原模型
存在多重共线性
2、多重共线性的修正
(1)逐步回归法
第一步:首先确定一个基准的解释变量,即从 x1, x2, x3, x4, x5 中选择解释 y 的最好的一个建
立基准模型。

分别用 x1, x2, x3, x4, x5 对 y 求回归,结果如下:
从上面 5 个输出结果可以知道,y 对 x1
的可决系数R2=0.89(最高),因此选择
第一个方程作为基准回归模型。

即:
Y = 30867.31062 + 4.576114592* x1
在基准模型的基础上,逐步将x2, x3 等加入到模型中,
加入 x2,结果:
拟合优度R2=0.961395 ,显著提高;
并且参数符号符合经济常识,且均显著。

所以将模型修改为:
Y= -44174.52+ 4.576460*x1+ 0.672680*x2
再加入 x3,结果:
拟合优度R2=0.984174 ,显著提高;
并且参数符号符合经济常识(成灾面积越大,粮食产
量越低),且均显著。

所以将模型修改为:
Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3 再加入 x4,结果:
拟合优度R2=0.987158 ,虽然比上一次拟
合提高了;
但是变量x4 的系数为 -0.091271 ,符号不
符合经济常识(农业机械总动力越高,
粮食产量越高),并且 x4 的 t 检验不显著。

因此应该从模型中剔除x4。

再加入 x5,结果:
拟合优度 R2=0.984466 ,有一定的提高;
并且参数符号符合经济常识,但是变量x5 的 t 检
验值为 0.493866 ,小于临界值,不显著,因此应该
剔除,常数 C 的 t 检验值为 -1.095407 ,也不显著,
应该剔除。

Ls y x1 x2 x3
综上所述,
Y=5.361203*x3+0.308763*x2-0.241639*x3。

相关文档
最新文档