实验四-多重共线性模型的检验和处理
多重共线性的检验与修正

多重共线性的检验与修正【实验目的】掌握多重共线性的检验方法和补救措施。
【实验要求】选择习题4.7,运用EViews 软件进行解答。
【实验内容】一、 利用EViews 软件,输入654321,X X X X X X Y ,,,,, 等数据,采用这些数据对模型进行OLS 回归,结果如下表所示由此可见,该模型2R =0.9810,2R =0.9677可决系数很高,F 检验值73.8081,明显显著,但是当228.2)818()(025.02/=-=-t k n t α,不仅所有解释变量系数t 检验不显著,而且654321X X X X X X ,,,,,系数符号与预期相反,这表明它们之间很可能存在严重多重共线性;二、计算各解释变量的相关系数,的相关系数矩阵如下由相关系数矩阵可以看出,各解释变量相互之间相关系数较高,证实确实存在严重的多重共线性。
三、修正多重共线性采用逐步回归的办法,去检验和解决多重共线性问题。
分别做lny对lnxi(i=1……7)的一元回归,结果如下表:其中,加入lnx1的方程修正拟合度最大,以lnx1为基础,顺次加入其它变量逐步回归,结果如下表:这里说明:对于两个解释变量标准T 分布为:1312318302502.)(t )(n t .α/=-=-,加入各解释变量后,要么2R 下降,要么ln i X (i=1……7)参数的T 检验不显著,这说明765432,X X X X X X ,,,,引起严重多重共线性,应予以剔除。
最后,修正后的回归结果为:1ln 2359.01631.9ˆln X Y t+= T= (73.1914) (19.7895)2R =0.9607 2R =0.9583 F=391.6234 DW=0.5038 这说明,在其他因素不变的情况下,当国民总收入增加e 单位,能源消费标准煤总量增加2359.0e单位。
此案例存在问题是样本容量过小,其可靠性受到影响,如果增大样本容量,效果会好一些; 【练习解答】1) 所建立的对数线性多元回归模型为1ln 2359.01631.9ˆln X Y t+= 2) 会,从表中的解释变量比如“国民总收入”与“GDP ”的本身意义,我们知道这两个变量之间存在很大的联系;3)存在多重共线性,通过逐步回归方法:①简单线性回归分析,找出基本解释变量②逐步进行二次,三次回归分析,直到出现回归系数不显著或者变量系数符号与预期不相符,以及修正拟合度不高的情况,即可认为该解释变量会引起严重多重共线性,应予以剔除,最后得出所需要的回归模型。
多重共线性实验报告

【实验名称】:多重共线性的检验方法和处理【实验目的】:掌握多重共线性的原理【实验原理】:综合统计检验法、相关系数矩阵检验法、逐步回归法【实验步骤】:一、创建一个新的工作文件:二、输入样本数据:三、用普通最小二乘法估计模型:由于解释变量个数较多,并且解释变量之间可能存在相关性,为了降低这种相关性以减弱序列相关性对模型的影响,我们先对各个解释变量和被解释变量取对数:即在Eviews软件的命令框执行:genr lnY=log(Y),genr lnX1=log(X1),genr lnX2=log (X2)……genr lnX5=log(X5)我们设粮食生产函数为:LnY=β0+β1lnX1+β2lnX2+β3lnX3+β4lnX4+β5lnX5+μ用运普通最小二乘法估计:下表给出了采用Eviews软件对表一的数据进行回归分析的统计结果:Dependent Variable: LNYMethod: Least SquaresDate: 12/19/13 Time: 10:05Sample: 1983 2007C -4.173174 1.923624 -2.169434 0.0429LNX1 0.381145 0.050242 7.586182 0.0000 LNX2 1.222289 0.135179 9.042030 0.0000 LNX3 -0.081110 0.015304 -5.300024 0.0000 LNX4 -0.047229 0.044767 -1.054980 0.3047R-squared 0.981597 Mean dependent var 10.70905 Adjusted R-squared 0.976753 S.D. dependent var 0.093396 S.E. of regression 0.014240 Akaike info criterion -5.459968 Sum squared resid 0.003853 Schwarz criterion -5.167438 Log likelihood 74.24960 F-statistic 202.6826 Durbin-Watson stat 1.791427 Prob(F-statistic) 0.000000根据上表估计出的参数,可以得到如下普通最小二乘法估计模型:lnY=‐4.17+0.381lnX1+1.222lnX2‐0.081lnX3‐0.047lnX4‐0.101lnX5四、模型检验:1、数学检验:由于R2为0.9816接近于一,且F=202.68>F0.05(5,9)=2.74,故认为粮食产量和上述解释变量之间的总体线性关系显著;但是就X4,X5来说,其t检验的参数较小,尚不能通过t检验,因此怀疑模型中存在多重共线性。
计量经济 实验四

计量经济实验报告实验四多重共线性的识别与补救一、实验目的:1.对Cobb-Douglas生产函数及其参数估计进行初步的认识2.掌握多重共线性的识别方法3.能针对具体问题提出解决多重共线性问题的措施二、实验内容:随机形式的Cobb-Douglas生产函数可以表达为:其中:Y—产出--劳动投入---资本投入u---随即干扰项通过对模型的对数变换,可得:=+为说明Cobb-Douglas生产函数,收集1958-1972年的台湾地区农业部门经济的数据如下:用数据对Cobb-Douglas生产函数的对数变换模型进行估计并回答以下问题:1.劳动和资本的系数是否显著?2.判断劳动和资本两变量是否高度相关?3.如果对2的回答是肯定的,能不能从模型中剔除劳动变量而仅对资本投入作产出的回归?并解释理由。
4.针对该问题,给出消除多重共线性的方法并重新对模型进行估计。
三、实验结果:1.相关分析变量X2与X3的相关系数矩阵如下:图一LNX2 LNX3LNX2 1.000000 0.697618LNX3 0.697618 1.0000002.回归结果:(1)对lny,lnx2,lnx3进行回归分析:图二Dependent Variable: LNYMethod: Least SquaresDate: 12/16/13 Time: 19:25Sample: 1958 1972Included observations: 15Variable Coefficient Std. Error t-Statistic Prob.C -3.338455 2.449508 -1.362908 0.1979LNX2 1.498767 0.539803 2.776509 0.0168LNX3 0.489858 0.102043 4.800487 0.0004R-squared 0.889030 Mean dependent var 10.09653Adjusted R-squared 0.870535 S.D. dependent var 0.207914S.E. of regression 0.074810 Akaike info criterion -2.170875Sum squared resid 0.067158 Schwarz criterion -2.029265Log likelihood 19.28156 F-statistic 48.06885Durbin-Watson stat 0.891083 Prob(F-statistic) 0.000002(2)对lny1,lnk进行回归分析:图三Dependent Variable: LNY1Method: Least SquaresDate: 12/16/13 Time: 19:32Sample: 1958 1972Included observations: 15Variable Coefficient Std. Error t-Statistic Prob.C 1.708572 0.415882 4.108311 0.0012LNK 0.612980 0.093304 6.569715 0.0000R-squared 0.768523 Mean dependent var 4.437090 Adjusted R-squared 0.750717 S.D. dependent var 0.168009 S.E. of regression 0.083884 Akaike info criterion -1.995195 Sum squared resid 0.091475 Schwarz criterion -1.900788 Log likelihood 16.96396 F-statistic 43.16115 Durbin-Watson stat 0.601128 Prob(F-statistic) 0.000018(3)消除多重共线性后的模型:图四Dependent Variable: LY1Method: Least SquaresDate: 12/16/13 Time: 19:35Sample: 1958 1972Included observations: 15Variable Coefficient Std. Error t-Statistic Prob.C 1.708572 0.415882 4.108311 0.0012LK 0.612980 0.093304 6.569715 0.0000R-squared 0.768523 Mean dependent var 4.437090 AdjustedR-squared 0.750717 S.D. dependent var 0.168009 S.E. ofregression 0.083884 Akaike info criterion -1.995195四、 结果分析对1958-1972年的台湾地区农业部门生产函数进行回归分析,回归结果为:lnY= -3.3385 + 1.4988lnX 2 + 0.489858 lnX 3 t : -1.3629 2.7765 4.80052R =0.8890 修正的2R =0.870535F=48.0689 D W=0.8910831、由图二得:因为t2=2.776509, t3=4.800487,t 值均大于t α/2(12)=2.179,所以劳动和资本的系数是显著的。
第4章课程论文多重共线性模型的检验与处理

多重共线性模型的检验与处理一、 研究的目的和要求 1)研究的目的中国钢材工业自新中国成立以来,历经起伏,虽然目前中国钢铁工业已形成具有相当规模,布局比较合理,大、中、小型企业相结合,行业比较完整的工业体系,但是钢材行业在现在有进入低速增长的趋势,面临供大于求,同质无序竞争,效益下滑的严峻局面。
在此背景下,寻找正确的钢材产量的预测模型,改变追求规模和产量的观念,给如何控制产量,优化产品提供了一定的参考。
本实验的目的在于建立并检验我国钢材产量预测模型,检验其多重共线性,并加以补救并得出正确的预测模型。
2)研究的具体内容本实验主要研究并建立检验我国钢材产量预测模型,检验其多重共线性,并加以补救并得出正确的预测模型。
二、 模型设定经分析,影响我国的钢材产量的主要因素除了生铁产量和发电量外,还可能和固定资产投资、国内生产总值、铁路运输量有关。
为此,为考虑的影响因素主要有生铁产量X1和发电量X2、固定资产投资X3、国内生产总值X4、铁路运输量X5,为此设定了如下形式的计量经济模型:12132435465t Y X X X X X ββββββμ=++++++其中Yt 为第t 年的钢材产量(万吨);生铁产量X1(万吨);发电量X2(亿千瓦时);固定资产投资X3(亿元);国内生产总值X4(亿元);铁路运输量X5(万吨)。
为估计模型中的参数,收集1978-1997年我国钢材产量及其它相关经三、 估计参数利用Eviews 软件,生成Yt 、X1、X2、X3、X4、X5等数据,采用这些数据对模型进行OLS 回归,输入命令:LS Yt C X1 X2 X3 X4 X5 可得到如下回归表格如下表2:表2 OLS 回归结果Dependent Variable: YT Method: Least Squares Date: 05/20/15 Time: 10:16 Sample: 1978 1997 Included observations: 20Variable Coefficient Std. Error t-Statistic Prob. C 354.5884 435.6968 0.813842 0.4294 X1 0.026041 0.120064 0.216892 0.8314 X2 0.994536 0.136474 7.287380 0.0000 X3 0.392676 0.086468 4.541271 0.0005 X4 -0.085436 0.016472 -5.186649 0.0001 X5-0.0059980.006034-0.9940190.3371R-squared 0.999098 Mean dependent var 5153.450 Adjusted R-squared 0.998776 S.D. dependent var 2512.131 S.E. of regression 87.87969 Akaike info criterion 12.03314 Sum squared resid 108119.8 Schwarz criterion 12.33186 Log likelihood -114.3314 Hannan-Quinn criter. 12.09145 F-statistic 3102.411 Durbin-Watson stat 1.919746 Prob(F-statistic)0.000000由此可见2R =0.999098,2R =0998776可决系数很高,F 检验值3102.411,明显显著。
什么是多重共线性如何进行多重共线性的检验

什么是多重共线性如何进行多重共线性的检验多重共线性是指在统计模型中,独立变量之间存在高度相关性或者线性依赖关系,从而给模型的解释和结果带来不确定性。
在回归分析中,多重共线性可能导致系数估计不准确、标准误差过大、模型的解释变得复杂等问题。
因此,对于多重共线性的检验和处理是非常重要的。
一、多重共线性的检验多重共线性的检验可以通过以下几种方式进行:1. 相关系数矩阵:可以通过计算独立变量之间的相关系数,判断它们之间的关系强度。
当相关系数超过0.8或-0.8时,可以视为存在高度相关性,即可能存在多重共线性问题。
2. 方差扩大因子(VIF):VIF是用来检验自变量之间是否存在共线性的指标。
计算每一个自变量的VIF值,当VIF值大于10或者更高时,可以视为存在多重共线性。
3. 条件数(Condition index):条件数也是一种用来检验多重共线性的指标。
它度量了回归矩阵的奇异性或者相对不稳定性。
当条件数超过30时,可以视为存在多重共线性。
4. 特征值(Eigenvalues):通过计算特征值,可以判断回归矩阵的奇异性。
如果存在特征值接近于零的情况,可能存在多重共线性。
以上是常用的多重共线性检验方法,可以根据实际情况选择合适的方法进行检验。
二、多重共线性的处理在检测到存在多重共线性问题后,可以采取以下几种方式进行处理:1. 去除相关性强的变量:在存在高度相关变量的情况下,可以选择去除其中一个或多个相关性较强的变量。
2. 聚合相关变量:将相关性强的变量进行加权平均,得到一个新的变量来替代原来的变量。
3. 主成分分析(PCA):主成分分析是一种降维技术,可以将相关性强的多个变量合并成为一个或多个无关的主成分。
4. 岭回归(Ridge Regression):岭回归是一种缓解多重共线性的方法,通过加入一个正则化项,来使得共线性变量的系数估计更加稳定。
5. Lasso回归(Lasso Regression):Lasso回归也是一种缓解多重共线性的方法,通过对系数进行稀疏化,来选择重要的变量。
多重共线性问题的检验和处理

山西大学实验报告实验报告题目:多重共线性问题的检验和处理学院:专业:课程名称:计量经济学学号:学生姓名:教师名称:崔海燕上课时间:一、实验目的:熟悉和掌握Eviews在多重共线性模型中的应用,掌握多重共线性问题的检验和处理。
二、实验原理:1、综合统计检验法;2、相关系数矩阵判断;3、逐步回归法;三、实验步骤:(一)新建工作文件并保存打开Eviews软件,在主菜单栏点击File\new\workfile,输入start date1978和end date 2006并点击确认,点击save键,输入文件名进行保存。
(二)输入并编辑数据在主菜单栏点击Quick键,选择empty\group新建空数据栏,根据理论和经验分析,影响粮食生产(Y)的主要因素有农业化肥施用量(X1)、粮食播种面积(X2)、成灾面积(X3)、农业机械总动力(X4)和农业劳动力(X5),其中成灾面积的符号为负,其余均应为正。
下表给出了1983——2000中国粮食生产的相关数据。
点击name键进行命名,选择默认名称Group01,保存文件。
Y X1 X2 X3 X4 X5 1983 38728 1660 114047 16209 18022 31151 1984 40731 1740 112884 15264 19497 30868 1985 37911 1776 108845 22705 20913 31130 1986 39151 1931 110933 23656 22950 31254 1987 40208 1999 111268 20393 24836 31663 1988 39408 2142 110123 23945 26575 32249 1989 40755 2357 112205 24449 28067 33225 1990 44624 2590 113466 17819 28708 38914 1991 43529 2806 112314 27814 29389 39098 1992 44264 2930 110560 25895 30308 38669 1993 45649 3152 110509 23133 31817 37680 1994 44510 3318 109544 31383 33802 36628 1995 46662 3594 110060 22267 36118 35530 1996 50454 3828 112548 21233 38547 34820 1997 49417 3981 112912 30309 42016 34840 1998 51230 4084 113787 25181 45208 35177 1999 50839 4124 113161 26731 48996 35768 2000 46218 4146 108463 34374 52574 36043 2001 45264 4254 106080 31793 55172 36513 2002 45706 4339 103891 27319 57930 36870 2003 43070 4412 99410 32516 60387 365462004 46947 4637 101606 16297 64028 35269 2005 48402 4766 104278 19966 68398 33970 2006 49804 4928 104958 24632 72522 32561 2007 50160 5108 105638 25064 76590 31444 (三)用普通最小二乘法估计模型参数用最小二乘法估计模型参数。
多重共线性实训报告
一、实训背景多重共线性是指回归模型中存在两个或两个以上的自变量高度相关,导致回归系数估计不准确、显著性检验失效等问题。
为了解决多重共线性问题,我们进行了一次多重共线性实训,通过实际操作,了解和掌握多重共线性的检验方法和解决策略。
二、实训目的1. 理解多重共线性的概念和产生原因;2. 掌握多重共线性的检验方法;3. 学习解决多重共线性的策略;4. 培养实际操作能力和问题解决能力。
三、实训内容1. 数据收集与整理本次实训选用某地区居民消费支出数据作为研究对象,数据包括居民收入、教育支出、医疗支出、娱乐支出等变量。
2. 数据分析(1)多重共线性检验采用方差膨胀因子(VIF)和条件指数(CI)对数据进行多重共线性检验。
VIF值越大,表示多重共线性程度越高;CI值越小,表示多重共线性程度越低。
(2)解决多重共线性策略针对检验出的多重共线性问题,采取以下策略进行解决:1)剔除高度相关的变量:通过VIF和CI筛选出高度相关的变量,并将其剔除。
2)主成分分析(PCA):将高度相关的变量通过主成分分析转换为低维变量,降低多重共线性。
3)岭回归:在回归模型中引入岭参数,对回归系数进行惩罚,降低多重共线性。
四、实训过程1. 数据导入与预处理首先,将数据导入统计软件(如SPSS、R等),然后进行数据清洗,包括处理缺失值、异常值等。
2. 多重共线性检验(1)计算VIF和CI通过软件中的相关系数矩阵,计算每个变量的VIF和CI值。
(2)筛选出高度相关的变量根据VIF和CI值,筛选出高度相关的变量。
3. 解决多重共线性问题(1)剔除高度相关的变量根据筛选结果,将高度相关的变量从模型中剔除。
(2)主成分分析对剩余变量进行主成分分析,将高度相关的变量转换为低维变量。
(3)岭回归在回归模型中引入岭参数,对回归系数进行惩罚。
4. 结果分析通过上述处理,多重共线性问题得到有效解决。
对比处理前后的回归系数,发现回归系数估计更加准确,显著性检验更加有效。
计量经济学实验四-多重共线性的检验与修正
《计量经济学》实验报告四开课实验室:财经科学实验室年月日班级:学号:姓名:实验项目名称:多重共线性的检验与修正成绩:实验性质:验证性□综合性□设计性指导教师签字:【实验目的】掌握多重共线性的检验与修正方法并能运用Eviews软件进行实现【实验要求】能根据OLS的估计结果判断是否存在多重共线性,熟悉逐步回归法修正模型的基本操作步骤,读懂各项上机榆出结果的含义并能进行分析【实验软件】 Eviews 软件【实验内容】根据给定的案例数据按实验要求进行操作【实验方案与进度】实验:设蔬菜销售量Y与人口(X1)、价格(X2)、粮食(X3)、收入(X4)、副食(X5)Dependent Variable: Y Method: Least Squares Date: 06/03/13 Time: 16:48 Sample: 1978 1996 Included observations: 19Variable Coefficient Std. Error t-Statistic Prob. C -1.530260 6.006901 -0.254750 0.8032 X1 0.014649 0.002923 5.012107 0.0003 X2 -0.702775 0.254521 -2.761169 0.0172 X3 0.060321 0.027575 2.187545 0.0492 X4 0.119825 0.036991 3.239290 0.0071 X5 0.018081 0.026022 0.694816 0.5004 X60.0922660.0542651.7003020.1148 R-squared0.986169 Mean dependent var 9.091579 Adjusted R-squared 0.979254 S.D. dependent var 1.717935 S.E. of regression 0.247442 Akaike info criterion 0.322027 Sum squared resid 0.734730 Schwarz criterion 0.669979 Log likelihood 3.940740 F-statistic 142.6067 Durbin-Watson stat2.292164 Prob(F-statistic)0.000000123456-1.5300.0150.7030.0600.120.0180.092t t t t t t t t Y X X X X X X u =+-+++++(2)方程线性显著性检验由(1)表中的数据可知F 统计量的值为142.6067,查表得0.05(6,12)F =3,显然142.6067>0.05(6,12)F =3,说明方程具有线性显著性。
多重共线性的检验与处理
实验名称:多重共线性的检验与处理实验时间:2011.12.10实验要求:主要是学习多重共线性的检验与处理,主要是研究解释变量与其余解释变量之间有严重多重共线性的模型,分析变量之间的相关系数。
通过具体案例建立模型,然后估计参数,求出相关的数据。
再对模型进行检验,看数据之间是否存在多重共线性。
最后利用所求出的模型来进行修正。
实验内容:实例:我国钢材供应量分析通过分析我国改革开放以来(1978-1997)钢材供应量的历史资料,可以建立一个单一方程模型。
根据理论及对现实情况的认识,影响我国钢材供应量 Y(万吨)的主要因素有:原油产量X1(万吨),生铁产量X2(万吨),原煤产量X3(万吨),电力产量X4(亿千瓦小时),固定资产投资X5(亿元),国内生产总值X6(亿元),铁路运输量X7(万吨)。
(一)建立我国钢材供应量的计量经济模型:(二)估计模型参数,结果为:Dependent Variable: YMethod: Least SquaresDate: 11/02/09 Time: 16:09Sample: 1978 1997Included observations: 20Variable Coefficient Std. Error t-Statistic Prob.C 139.2362 718.2493 0.193855 0.8495X1 -0.051954 0.090753 -0.572483 0.5776X2 0.127532 0.132466 0.962751 0.3547X3 -24.29427 97.48792 -0.249203 0.8074X4 0.863283 0.186798 4.621475 0.0006X5 0.330914 0.105592 3.133889 0.0086X6 -0.070015 0.025490 -2.746755 0.0177X7 0.002305 0.019087 0.120780 0.9059R-squared 0.999222 Mean dependent var 5153.350Adjusted R-squared 0.998768 S.D. dependent var 2511.950S.E. of regression 88.17626 Akaike info criterion 12.08573Sum squared resid 93300.63 Schwarz criterion 12.48402Log likelihood -112.8573 F-statistic 2201.081Durbin-Watson stat 1.703427 Prob(F-statistic) 0.000000由此可见,该模型可绝系数很高,F检验值2201.081,明显显著。
实验四-多重共线性模型的检验和处理
实验报告课程名称:计量经济学实验项目:实验四多重共线性模型的检验和处理实验类型:综合性□设计性□验证性 专业班别:11本国贸五班姓名:学号:实验课室:厚德楼A207指导教师:实验日期:2014/5/20广东商学院华商学院教务处制一、实验项目训练方案小组合作:是□否 小组成员:无实验目的:掌握多重共线性模型的检验和处理方法:实验场地及仪器、设备和材料实验室:普通配置的计算机,Eviews软件及常用办公软件。
实验训练内容(包括实验原理和操作步骤):【实验原理】多重共线性的检验:直观判断法(R2值、t值检验)、简单相关系数检验法、方差扩大因子法(辅助回归检验)多重共线性的处理:先验信息法、变量变换法、逐步回归法【实验步骤】(一)多重共线性的检验1.直观判断法(R2值、t值检验)根据广东数据(见附件1),先分别建立以下模型:【模型1】财政收入CS对第一产业产值GDP1、第二产业产值GDP2和第三产业产值GDP3的多元线性回归模型;(请对得到的图表进行处理,以上在一页内)【模型2】固定资产投资TZG对固定资产折旧ZJ、营业盈余YY和财政支出CZ的多元线性回归模型。
观察模型结果,初步判断模型自变量之间是否存在多重共线性问题。
【模型1】从上图可以得到,估计方程的判定系数R 2很高,但三个参数t检验值两个不显著,有一个较显著,其中一个参数估计值还是负的,不符合经济理论。
所以,出现了严重的多重共线性。
【模型2】1】从上图可以得到,估计方程的判定系数R 2很高,方程显著性F检验也显著,但只有两个参数显著性t检验比较显著,这与很高的判定系数不相称,出现了严重的多重共线性。
2.简单相关系数检验法分别计算【模型1】和【模型2】的自变量的简单相关系数。
【模型1】【模型2】(请对得到的图表进行处理,以上在一页内)根据计算的简单相关系数,判断模型是否存在多重共线性。
【模型1】可看出三个解释变量GDP1 、GDP2和GDP3之间高度相关,存在严重的多重共线性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验报告
课程名称:计量经济学
实验项目:实验四多重共线性模型的
检验和处理
实验类型:综合性□设计性□验证性 专业班别:11本国贸五班
姓名:
学号:
实验课室:厚德楼A207
指导教师:
实验日期:2014/5/20
广东商学院华商学院教务处制
一、实验项目训练方案
小组合作:是□否 小组成员:无
实验目的:
掌握多重共线性模型的检验和处理方法:
实验场地及仪器、设备和材料
实验室:普通配置的计算机,Eviews软件及常用办公软件。
实验训练内容(包括实验原理和操作步骤):
【实验原理】
多重共线性的检验:直观判断法(R2值、t值检验)、简单相关系数检验法、方差扩大因子法(辅助回归检验)
多重共线性的处理:先验信息法、变量变换法、逐步回归法
【实验步骤】
(一)多重共线性的检验
1.直观判断法(R2值、t值检验)
根据广东数据(见附件1),先分别建立以下模型:
【模型1】财政收入CS对第一产业产值GDP1、第二产业产值GDP2和第三产业产值GDP3的多元线性回归模型;
(请对得到的图表进行处理,以上在一页内)
【模型2】固定资产投资TZG对固定资产折旧ZJ、营业盈余YY和财政支出CZ的多元线性回归模型。
观察模型结果,初步判断模型自变量之间是否存在多重共线性问题。
【模型1】从上图可以得到,估计方程的判定系数R 2
很高,但三个参数t检验值两个不显著,有一个较显著,其中
一个参数估计值还是负的,不符合经济理论。
所以,出现了严重的多重共线性。
【模型2】1】从上图可以得到,估计方程的判定系数R 2
很高,方程显著性F检验也显著,但只有两个参数显著性
t检验比较显著,这与很高的判定系数不相称,出现了严重的多重共线性。
2.简单相关系数检验法
分别计算【模型1】和【模型2】的自变量的简单相关系数。
【模型1】
【模型2】
(请对得到的图表进行处理,以上在一页内)
根据计算的简单相关系数,判断模型是否存在多重共线性。
【模型1】可看出三个解释变量GDP1 、GDP2和GDP3之间高度相关,存在严重的多重共线性。
【模型2】可以看出三个解释变量ZJ 、YY和CZ之间也高度相关,特别是ZJ和CZ之间高度相关,必然也存在严重的多重共线性。
3.方差扩大因子法(辅助回归检验)
分别建立【模型1】和【模型2】的辅助回归。
计算各模型各个自变量的方差扩大因子(只需将计算的结果以表格形式列出即可)。
【模型1】根据广东数据,CS对GDP1、GDP2和GDP3的回归中,解释变量GDP1、GDP2和GDP3之间的辅助回归分别为:
【模型2】根据广东数据,TZG对ZJ、YY和CZ的回归中,解释变量ZJ、YY和CZ之间的辅助回归分别为:
根据以上结果,确定模型是否存在严重的多重共线性。
【模型1】三个回归方程均高度显著,特别是第二、三个方程,显示存在严重的多重共线性,特别是GDP2和GDP3之间存在严重的多重共线性,解释变量之间的相关系数检验也证实了这一点。
【模型2】三个回归方程均高度显著,特别是第一、三个方程,显示存在严重的多重共线性,特别是ZJ和CZ之间存在严重的多重共线性,解释变量之间的相关系数检验也证实了这一点。
(请对得到的图表进行处理,以上在一页内)
③如果存在多重共线性的问题,使用逐步回归法处理模型的多重共线性问题。
(请对得到的图表进行处理,以上在两页内)。