统计学第五次实验-多重共线性实验报告

合集下载

多重共线性实验报告-lucas

多重共线性实验报告-lucas

多重共线性实验报告-l u c a s-CAL-FENGHAI.-(YICAI)-Company One1《计量经济学》实验报告四图6.4.1 Eviews 输出的回归结果分析:模型R 2=0.970391 0.9518852 R 可决系数很高,F 检验值52.43740,显著。

但当α=5%时,t 统计值=1.7613,X4和X5系数的t 检验不显著,同时X5的系数为负号不符合实际,这表明很可能存在多重共线性。

STEP2:检验计算各解释变量的相关系数,选择X1、X2、X3、X4、X5数据,点击“quick\group statistics\correlation ”的相关系数矩阵,见表6.4.1。

有相关系数矩阵可以看出:各解释变量相关之间的相关系数较高,证实存在严重多重共线性。

表6.4.1 自变量相关系数矩阵STEP3:消除多重共线性采用逐步回归的办法,检验和解决多重共线性问题。

分别作Y 对X1、X2、X3、X4、X5的一元回归,结果如表6.4.2。

Dependent Variable: Y Method: Least Squares Date: 05/12/03 Time: 13:56 Sample: 1974 1987 Included observations: 14Variable Coefficient Std. Error t-Statistic Prob.C -90.92074 19.32929 -4.703781 0.0005 X1 0.316925 0.026081 12.15161 0.0000R-squared 0.924841 Mean dependent var 142.7129 Adjusted R-squared 0.918578 S.D. dependent var 26.09805。

多重共线性实验报告

多重共线性实验报告

【实验名称】:多重共线性的检验方法和处理【实验目的】:掌握多重共线性的原理【实验原理】:综合统计检验法、相关系数矩阵检验法、逐步回归法【实验步骤】:一、创建一个新的工作文件:二、输入样本数据:三、用普通最小二乘法估计模型:由于解释变量个数较多,并且解释变量之间可能存在相关性,为了降低这种相关性以减弱序列相关性对模型的影响,我们先对各个解释变量和被解释变量取对数:即在Eviews软件的命令框执行:genr lnY=log(Y),genr lnX1=log(X1),genr lnX2=log (X2)……genr lnX5=log(X5)我们设粮食生产函数为:LnY=β0+β1lnX1+β2lnX2+β3lnX3+β4lnX4+β5lnX5+μ用运普通最小二乘法估计:下表给出了采用Eviews软件对表一的数据进行回归分析的统计结果:Dependent Variable: LNYMethod: Least SquaresDate: 12/19/13 Time: 10:05Sample: 1983 2007C -4.173174 1.923624 -2.169434 0.0429LNX1 0.381145 0.050242 7.586182 0.0000 LNX2 1.222289 0.135179 9.042030 0.0000 LNX3 -0.081110 0.015304 -5.300024 0.0000 LNX4 -0.047229 0.044767 -1.054980 0.3047R-squared 0.981597 Mean dependent var 10.70905 Adjusted R-squared 0.976753 S.D. dependent var 0.093396 S.E. of regression 0.014240 Akaike info criterion -5.459968 Sum squared resid 0.003853 Schwarz criterion -5.167438 Log likelihood 74.24960 F-statistic 202.6826 Durbin-Watson stat 1.791427 Prob(F-statistic) 0.000000根据上表估计出的参数,可以得到如下普通最小二乘法估计模型:lnY=‐4.17+0.381lnX1+1.222lnX2‐0.081lnX3‐0.047lnX4‐0.101lnX5四、模型检验:1、数学检验:由于R2为0.9816接近于一,且F=202.68>F0.05(5,9)=2.74,故认为粮食产量和上述解释变量之间的总体线性关系显著;但是就X4,X5来说,其t检验的参数较小,尚不能通过t检验,因此怀疑模型中存在多重共线性。

实验报告3 多重共线性

实验报告3 多重共线性

E V I E W S操作实验题目:多重共线性实验类型:基本操作实验目的:掌握利用Eviews进行多元线性回归;存在多重共线性的基础上掌握逐步回归法的基本操作;及方差扩大因子的计算方法。

实验内容:(按要求完成下面题目)4.6 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。

为此,收集了中国能源消费总量Y (万吨标准煤)、国内生产总值(亿元)X1(代表经济发展水平)、国民总收入(亿元)X2(代表收入水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2002年期间的统计要求:(1)建立对数线性多元回归模型(2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?(3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。

实验步骤:一、设定模型Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+β7X7+u二、估计参数1、各解释变量的相关系数矩阵:X1 X2 X3 X4 X5 X6 X7X1 1.000000 0.9999780.9996710.9988680.9918430.9934890.722545X2 0.999978 1.000000.9997280.9989480.9912510.992990.725681X3 0.999671 0.9997281.000000.9989830.9909460.9921480.732289X4 0.998868 0.9989480.9989831.000000.9878390.9888740.737354X5 0.991843 0.9912510.9909460.9878391.000000.9988290.682852X6 0.993489 0.99299 0.9921480.9888740.9988291.000000.680992X7 0.722545 0.7256810.7322890.7373540.6828520.6809921.00000可以看出,各解释变量之间的相关系数较高,证明存在多重共线性。

计量经济学实验报告四---多重共线性

计量经济学实验报告四---多重共线性

计量经济学实验报告四
[实验名称] 多重共线性
[实验目的] 用Eviews 软件检验模型的多重共线性.
[实验内容] (1)根据表列出的家庭消费支出Y与可支配收入X1和个人财富X2的统计数据,在Eviews软件下,OLS的估计结果为
所以模型为Yˆ=245.52+0.57X1-0.0058X2
(3.53)(0.79)(-0.08)
R2=0.962 F=88.845 D.W.=2.708
由拟合优度知,收入和财富一起解释了消费支出的96%.然而两者的t检验都在5%的显著性水平下是不显著的.不仅如此,财富变量的符号也与经济理论不相符合.但从F的检验值看,对收入与财富的参数同时为零的假设显然是拒绝的.因此,显著的F检验值与不显著t检验值,说明了收入与财富存在较高的相关性,使得无法分辨二者各自对消费的影响.只作消费支出关于收入的一元回归模型.如下
所以模型为Yˆ=244.55+0.509X1
(3.813)(14.24)
R2=0.962 F=202.87 D.W.=2.68
我们将上面模型与之相比,新引入的变量并没有带来拟合优度的显著变化,所以该引入的变量不是一个独立的解释变量.因此应该只作消费支出关于收入或财富的一元回归模型来对二元模型进行修正.。

实验五多重共线性检验参考案例

实验五多重共线性检验参考案例

实验五 多重共线性‎检验实验时间: 姓名:学号: 成绩:【实验目的】1、掌握多元线‎性回归模型‎的估计、检验和预测‎;2、掌握多重共‎线性问题的‎检验方法3、掌握多重共‎线性问题的‎修正方法 【实验内容】1、数据的读取‎和编辑;2、多元回归模‎型的估计、检验、预测;3、多重共线性‎问题的检验‎4、多重共线性‎问题的修正‎ 【实验背景】为了评价报‎账最低工资‎(负收入税)政策的可行‎性,兰德公司进‎行了一项研‎究,以评价劳动‎供给(平均工作小‎时数)对小时工资‎提高的反应‎,词研究中的‎数据取自6‎000户男‎户主收入低‎于1500‎0美元的一‎个国民样本‎,这些数据分‎成39个人‎口组,并放在表1‎中,由于4个人‎口组中的某‎些变量确实‎,所以只给出‎了35个组‎的数据,用于分析的‎各个变量的‎定义如下:Y 表示该年‎度平均工作‎小时数;X1表示平‎均小时工资‎(美元);X2表示配‎偶平均收入‎(美元);X3表示其‎他家庭成员‎的平均收入‎(美元);X4表示年‎均非劳动收‎入(美元);X5表示平‎均家庭资产‎拥有量;X6表示被‎调查者的平‎均年龄;X7表示平‎均赡养人数‎;X 8表示平‎均受教育年‎限。

μ为随机干扰‎项,考虑一下回‎归模型:μβββββββββ+++++++++=87654321876543210X X X X X X X X Y (1) 将该年度平‎均工作小时‎数Y 对X 进‎行回归,并对模型进‎行简单分析‎; (2) 计算各变量‎之间的相关‎系数矩阵,利用相关系‎数法分析变‎量间是否具‎有多重共线‎性;(3) 利用逐步回‎归方法检验‎并修正回归‎模型,最后再对模‎型进行经济‎意义检验、统计检验。

表5观测组Y X1 X2 X3 X4 X5 X6 X7 X81 2157 2.905 1121 291 380 7250 38.5 2.34 10.52 2174 2.97 1128 301 398 7744 39.3 2.335 10.53 2062 2.35 1214 326 185 3068 40.1 2.851 8.94 2111 2.511 1203 49 117 1632 22.4 1.159 11.55 2134 2.791 1013 594 730 12710‎57.7 1.229 8.86 2185 3.04 1135 287 382 776 38.6 2.602 10.77 2210 3.222 1100 295 474 9338 39 2.187 1128 2105 2.495 1180 310 255 4730 39.9 2.616 9.39 2267 2.838 1298 252 431 8317 38.9 2.024 11.110 2205 2.356 885 264 373 6489 38.8 2.662 9.511 2121 2.922 1251 328 312 5907 39.8 2.287 10.312 2109 2.499 1207 347 271 5069 39.7 3.193 8.913 2108 2.796 1036 300 259 4614 38.2 2.4 9.214 2047 2.453 1213 397 139 1987 40.3 2.545 9.115 2174 3.582 1141 414 498 10239‎40 2.064 11.716 2067 2.909 1805 290 239 4439 39.1 2.301 10.517 2159 2.511 1075 289 308 5621 39.3 2.486 9.518 2257 2.516 1093 176 392 7293 37.9 2.042 10.119 1985 1.423 553 381 146 1866 40.6 3.833 6.620 2184 3.636 1091 291 560 11240‎39.1 2.328 11.621 2084 2.983 1327 331 296 5653 39.8 2.208 10.222 2051 2.573 1197 279 172 2806 40 2.362 9.123 2127 3.263 1226 314 408 8042 39.5 2.259 10.824 2102 3.234 1188 414 352 7557 39.8 2.019 10.725 2098 2.28 973 364 272 4400 40.6 2.661 8.426 2042 2.304 1085 328 140 1739 41.8 2.444 8.227 2181 2.912 1072 304 383 9340 39 2.337 10.228 2186 3.015 1122 30 352 7292 37.2 2.046 10.929 2188 3.01 990 366 374 7325 38.4 2.847 10.630 2077 1.901 350 209 95 1370 37.4 4.158 8.231 2196 3.009 947 294 342 6888 37.5 3.047 10.632 2093 1.899 342 311 120 1425 37.5 4.512 8.133 2173 2.959 1116 296 387 7625 39.2 2.342 10.534 2179 2.959 1116 296 387 7625 39.2 2.342 10.535 2200 2.98 1126 204 393 7885 39.2 2.341 10.6 【实验过程】一、利用Evi‎e ws软件‎建立年度平‎均工作小时‎数y的回归‎模型。

多重共线性案例分析实验报告

多重共线性案例分析实验报告

《多重共线性案例分析》实验报告表2由此可见,该模型,可决系数很高,F 检验值173.3525,明显显著。

但是当时,不仅、系数的t 检验不显著,而且系数的符号与预期的相反,这表明很可能存在严重的多重共线性。

9954.02=R 9897.02=R 05.0=α776.2)610()(025.02=-=-t k n t α2X 6X 6X②.计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵表3由关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性相。

4.消除多重共线性①采用逐步回归的办法,去检验和解决多重共线性问题。

分别作Y 对X2、X3、X4、X5、X6的一元回归 如下图所示变量 X2 X3 X4 X5 X6 参数估计值0.08429.0523 11.6673 34.3324 2014.146 t 统计量8.665913.1598 5.1967 6.4675 8.74870.90370.95580.77150.83940.9054表4 按的大小排序为:X3、X6、X2、X5、X4。

以X3为基础,顺次加入其他变量逐步回归。

首先加入X6回归结果为:t=(2.9086) (0.46214)2R 2R 631784.285850632.7639.4109ˆX X Y t ++-=957152.02=R1995 1375.7 62900 464.0 61.5 115.70 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.60 1998 2391.2 69450 607.0 197.0 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.80 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200.0 180.98 7.30表1:1994年—2003年中国游旅收入及相关数据表2:OLS 回归表3:关系数矩阵变量 X2 X3 X4 X5 X6 参数估计值0.08429.0523 11.6673 34.3324 2014.146 t 统计量8.665913.1598 5.1967 6.4675 8.74870.90370.95580.77150.83940.9054表4:Y 对X2、X3、X4、X5、X6的一元回归六、实验结果及分析1. 在参数估计模型和关系数矩阵中, ,可决系数很高,F 检验值173.3525,明显显著。

多重共线性回归分析及其实验报告

实验报告实验题目:多重共线性的研究指导老师:学生一:学生二:实验时间:2011年10月多重线性回归分析及其实验报告实验目的:为了更好地了解财政收入构成,需要定量地分析影响财政收入的因素模型设定及其估计:经分析,影响财政收入的主要因素,农业增加值X1,工业增加值X2,建筑业增加值X3,总人口X4,受灾面积X5.为此设定了如下形式的计量经济模型:Y=β1+β2X1+β3X2+β4X3+β5X4+β6X5+u0其中,Y为财政收入(元),X1农业增加值(元),X2为工业增加值(元),X3为建筑业增加值(元),X4为总人口(万人),X5为受灾面积(千公顷)为估计模型参数,收集1978~2007年财政收入及其影响因素数据,如图:1978~2007年财政收入及其影响因素数据年份财政收入CS/亿元农业增加值NZ/亿元工业增加值GZ/亿元建筑业增加值JZZ/亿元总人口TPOP/万人受灾面积SZM/千公顷1978 1132.3 1027.5 1607 138.2 96259 50790 1979 1146.6 1270.2 1769.7 143.8 97542 39370 1980 1159.9 1371.4 1996.5 195.5 98705 44526 1981 1175.8 1559.5 2048.5 207.1 100072 39790 1982 1212.3 1777.4 2162.3 220.7 101654 33130 1983 1367 1978.5 2375.8 270.6 103008 34710 1984 1642.5 2316.1 2789 316.7 104357 31890 1985 2004.6 2564.3 3448.5 417.9 105851 44365 1986 2122 2788.7 3987.5 525.7 107507 47170 1987 2199.4 3233 4565.9 665.8 109300 42090 1988 2357.6 3865.4 5062 810 111026 50870 1989 2664.5 5062 8087.3 794 112704 46991 1990 2937.4 5342.3 10284.5 859.4 114333 384741991 3149.48 5866.8 14188 1015.1 115823 55472 1992 3483.48 6963.6 19480.5 1415 117171 51333 1993 4348.95 9572.7 19480.4 2266.5 118517 48829 1994 5218.1 12315.7 24950.7 2964.7 119850 55043 1995 6242.2 14015.8 29447.6 3728.8 121121 45821 1996 7407.99 14441.8 32921.4 4387.4 122389 46898 1997 8615.14 14917.6 34018.4 4985.8 123626 53429 1998 9875.95 14944.5 40036 5172.1 124761 59145 1999 11444.08 15871.8 43580.6 5522.3 125786 49981 2000 13395.23 16537 47431.6 5913.7 126743 54688 2001 16386.04 17381.8 54945.5 6465.5 127627 52215 2002 18903.64 21412.7 65210 7490.8 128453 47119 2003 21715.25 22420 76912.6 8694.3 129227 54506 2004 26396.47 21224 87632.4 8967.8 129988 37106 2005 31649.29 22420 89834.5 10133.8 130756 38818 2006 38760.2 24040.9 91310.9 11851.1 131448 41091 2007 51321.45 28095 107367.2 14014.1 132129 48992利用Eviews软件,生成Y、X1、X2、X3、X4、X5等数据,采用这些数据进行OLS回归,结果如下Dependent Variable: YMethod: Least SquaresDate: 10/24/11 Time: 22:49Sample: 1978 2007Included observations: 30Variable Coefficient Std. Error t-Statistic Prob.C -6734.394 11259.37 -0.598115 0.5554X1 -1.678611 0.328371 -5.111937 0.0000X2 0.071078 0.081171 0.875666 0.3899X3 5.699199 0.745591 7.643870 0.0000X4 0.101481 0.114244 0.888277 0.3832X5 -0.010922 0.057578 -0.189691 0.8511R-squared 0.983660 Mean dependent var 10047.83Adjusted R-squared 0.980255 S.D. dependent var 12585.61S.E. of regression 1768.473 Akaike info criterion 17.97048Sum squared resid 75059958 Schwarz criterion 18.25072Log likelihood -263.5572 F-statistic 288.9512Durbin-Watson stat 0.898668 Prob(F-statistic) 0.000000由此可见,该模型R2=0.983660,R2=0.980255可决系数很高,F检验值为288.9512,明显显著。

多重共线性实训报告

一、实训背景多重共线性是指回归模型中存在两个或两个以上的自变量高度相关,导致回归系数估计不准确、显著性检验失效等问题。

为了解决多重共线性问题,我们进行了一次多重共线性实训,通过实际操作,了解和掌握多重共线性的检验方法和解决策略。

二、实训目的1. 理解多重共线性的概念和产生原因;2. 掌握多重共线性的检验方法;3. 学习解决多重共线性的策略;4. 培养实际操作能力和问题解决能力。

三、实训内容1. 数据收集与整理本次实训选用某地区居民消费支出数据作为研究对象,数据包括居民收入、教育支出、医疗支出、娱乐支出等变量。

2. 数据分析(1)多重共线性检验采用方差膨胀因子(VIF)和条件指数(CI)对数据进行多重共线性检验。

VIF值越大,表示多重共线性程度越高;CI值越小,表示多重共线性程度越低。

(2)解决多重共线性策略针对检验出的多重共线性问题,采取以下策略进行解决:1)剔除高度相关的变量:通过VIF和CI筛选出高度相关的变量,并将其剔除。

2)主成分分析(PCA):将高度相关的变量通过主成分分析转换为低维变量,降低多重共线性。

3)岭回归:在回归模型中引入岭参数,对回归系数进行惩罚,降低多重共线性。

四、实训过程1. 数据导入与预处理首先,将数据导入统计软件(如SPSS、R等),然后进行数据清洗,包括处理缺失值、异常值等。

2. 多重共线性检验(1)计算VIF和CI通过软件中的相关系数矩阵,计算每个变量的VIF和CI值。

(2)筛选出高度相关的变量根据VIF和CI值,筛选出高度相关的变量。

3. 解决多重共线性问题(1)剔除高度相关的变量根据筛选结果,将高度相关的变量从模型中剔除。

(2)主成分分析对剩余变量进行主成分分析,将高度相关的变量转换为低维变量。

(3)岭回归在回归模型中引入岭参数,对回归系数进行惩罚。

4. 结果分析通过上述处理,多重共线性问题得到有效解决。

对比处理前后的回归系数,发现回归系数估计更加准确,显著性检验更加有效。

实验报告三(多重共线性)

实验三多重共线性一、研究的目的要求一直以来,钢铁一直是衡量一个国家经济实力的一个标志。

近年来,随着经济的不断发展。

我国钢铁产量及供应量也在不断提升。

为了确定影响中国钢铁供应量的主要因素,需要建立计量分析模型,分析影响我国钢铁供应量的主要因素。

二、模型设定为了全面反映影响我国钢铁供应量的主要因素,选取了我国1986-2005年我国钢材供应量的具体数据,选择“钢材供应量(万吨)Y”作为被解释变量,“原油产量(万吨)X2”、“生铁产量(万吨)X3”、“原煤产量(万吨)X4”、“电力产量(亿千瓦小时)X5”、“固定资产投资(亿元)X6”、“国内生产总值(亿元)X7”、和“铁路运输量(万吨)X8”作为解释变量。

收集的数据如下:利用EViews软件,生成Y t、X2、X3、X4、X5、X6、X7、X8等的数据,采用这些对模型进行OLS回归,结果如下图所示:由此可见,该模型R2=0.997857,修正的可决系数为0.996606,可决系数高,F检验值为798.0921,明显显著。

但是当α= 0.05时,t a/2(n-k)=t0.025(20-9)=2.201,不仅X2、X4、X6、X7、X8 的系数t检验不显著,而且X2、X4、X7系数的符号与预期相反,这表明很可能存在严重的多重共线性。

计算各解释变量的相关系数,选择X2、X3、X4、X5、X6、X7、X8的数据,点“view/correlation”得相关系数矩阵,如下图:由相关系数矩阵可以看出,各解释变量相互之间的相关系数较高,证实确实存在严重的多重共线性。

三、修正多重共线性采用逐步回归的办法,去检验和解决多重共线性问题。

分别作Y对X2、X3、X4、X5、X6、X7、X8一元回归,结果如下图所示:其中,X5的方程修正的可决系数最大,以X5为基础,顺次加入其他变量逐步回归。

结果如下图:加入新变量的回归结果经比较,加入X3的方程的修正的可决系数为0.997005,改进最大,而且各参数的t检验显著,选择保留X3,再加入其他新变量逐步回归,结果如下图所示:加入新变量的回归结果经比较,无论加入哪一个变量,修正的可决系数均没有有所提高,反而下降,且新加入的参数的t检验不显著,并为负值不合理。

实验报告6-多重共线性

2014-2015学年第 一 学期实 验 报 告实验课程名称 多重共线性的检验与修正专 业 班 级 金融1204学生 学号 31205382学 生 姓 名 黄聪聪实验指导教师 董美双编号:实验名称多重共线性检验与修正指导老师董美双成绩专业金融班级金融1204 姓名黄聪聪学号 31205382一、实验目的目的:通过实验,理解并掌握多重共线性的原理,熟悉掌握对多元模型的多重共线性问题进行检验和修正的方法与步骤。

要求:熟练掌握检验多重共线性检验的不显著系数法、系数符号判断法、相关系数矩阵法、拟合优度法、Frisch综合分析法;消除多重共线性:可以综合应用各种方法。

验证性部分用教材中的例题7.6的数据,按步骤做。

或者自己收集数据按上面的步骤做一遍,把结果输出到word文档中。

步骤: 1.模型的参数估计(至少有3个解释变量);2.检验是否存在多重共线性;方法一:不显著系数法;方法二:系数符号法方法三:相关系数矩阵法方法四:Frish综合分析法——逐步回归法3.多重共线性的修正:差分法、取对数法、逐步回归法等。

4.得出修正后的模型。

1.模型的参数估计(至少有3个解释变量)Dependent Variable: BUSTRAVLMethod: Least SquaresDate: 07/26/14 Time: 10:09Sample: 1 40C 2744.680 2641.672 1.038994 0.3064FARE -238.6544 451.7281 -0.528314 0.6008 GASPRICE 522.1132 2658.228 0.196414 0.8455 INC -0.194744 0.064887 -3.001294 0.0051POP 1.711442 0.231364 7.397176 0.0000 DENSITY 0.116415 0.059570 1.954253 0.0592R-squared 0.921026 Mean dependent var 1933.175 Adjusted R-squared 0.906667 S.D. dependent var 2431.757 S.E. of regression 742.9113 Akaike info criterion 16.21666 Sum squared resid 18213267 Schwarz criterion 16.51221 Log likelihood -317.3332 F-statistic 64.14338估计方程为:LANDAREA DENSITYPOPINC GASPRICEFARE SBU16.112.071.119.011.52265.23868.2744ˆ-++-+-=2.检验是否存在多重共线性方法一:不显著系数法Dependent Variable: BUSTRAVLMethod: Least SquaresDate: 07/26/14 Time: 10:09Sample: 1 40C 2744.680 2641.672 1.038994 0.3064FARE -238.6544 451.7281 -0.528314 0.6008GASPRICE 522.1132 2658.228 0.196414 0.8455INC -0.194744 0.064887 -3.001294 0.0051POP 1.711442 0.231364 7.397176 0.0000DENSITY 0.116415 0.059570 1.954253 0.0592LANDAREA -1.155230 1.802638 -0.640855 0.5260R-squared 0.921026 Mean dependent var 1933.175Adjusted R-squared 0.906667 S.D. dependent var 2431.757S.E. of regression 742.9113 Akaike info criterion 16.21666Sum squared resid 18213267 Schwarz criterion 16.51221Log likelihood -317.3332 F-statistic 64.14338Durbin-Watson stat 2.082671 Prob(F-statistic) 0.000000由表格可知,样本整体拟合优度达到92.1%,意味着模型解释变量整理能够解释因变量的92.1%,即说服力相对较强。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多重共线性实验报告
实验内容:影响粮食生产的主要因素有农作物播种面积,农用化肥施用量、农业机械总动力、农业灾害成灾面积、有效灌溉面积。

根据下列相关数据,建立中国粮食生产函数。

实验目的:估计农作物播种面积,农用化肥施用量、农业机械总动力、农业灾害成灾面积、有效灌溉面积对粮食产量的多重共线性,建立方程并对方程进行检验。

实验数据:
粮食产量(万吨)农作物播种
面积(千公
顷)
农用化肥
施用量(万
吨)
农业机械总动
力(万千瓦)
农业灾害成
灾面积(千
公顷)
有效灌溉
面积(千公
顷)
1984 40730.5 144221.3 1739.8 19497.19 15607 44453 1985 37910.8 143625.9 1775.8 20912.51 22705.333 44035.9 1986 39151.2 144204 1930.6 22950.00 23656 44225.8 1987 40297.7 144956.5 1999.3 24836.00 20392.667 44403 1988 39408.1 144868.9 2141.5 26575.00 24502.667 44375.9 1989 40754.9 146553.9 2357.1 28067.00 24449 44917.2 1990 44624.3 148362.3 2590.3 28707.70 17819 47403.1 1991 43529.3 149585.8 2805.1 29388.60 27814 47822.1 1992 44265.8 149007.1 2930.2 30308.40 25859 48590.1 1993 45648.8 147740.7 3151.9 31816.60 23133 48727.9 1994 44510.1 148240.6 3317.9 33802.50 31383 48759.1 1995 46661.8 149879.3 3593.7 36118.05 22267 49281.2 1996 50453.5 152380.6 3827.9 38546.90 21233 50381.4 1997 49417.1 153969.2 3980.7 42015.60 30309 51238.5 1998 51229.53 155705.7 4083.7 45207.71 25181 52295.6 1999 50838.58 156372.8 4124.32 48996.12 26731 53158.41 2000 46217.52 156299.85 4146.412 52573.61 34374 53820.33 2001 45263.67 155707.86 4253.763 55172.10 31793 54249.391 2002 45705.75 154635.51 4339.39 57929.85 27318.9 54354.8 2003 43069.53 152414.96 4411.56 60386.54 32516.3 54014.23
实验过程:
1.做出散点图,打开eviews,并把1984年到2003年全国粮食产量及相关值的数据输入表中,建立y和x1,x2,x3,x4,x5。

在命令窗口输入”ls y c x1 x2 x3 x4 x5”,单击回车,这是运用的最小二乘法估计该模型。

分析:由上最小二乘估计法可以得到多元线性回归模型估计,得到如下结果:
5
4321328069.0234936.0357875.0551127.6774979.045.57319X X X X X Y ---++-=
2R =0.977167 F=119.8311
方程中可决系数2R 和F 统计量都很大,但统计量值较小。

临界值为:=-)620(025.0t 2.145 所以参数估计值都能不能通过显著性检验,这是存在多重线性的典型特征。

2.把数据建立在一个组内。

然后object —new object —group ,view —correlation —common sample ,得到变量之间的相关系数图
62
.090.095.0141312===r r r 66
.094.096
.0242315===r r r
67.096
.070.098.045353425====r r r r
可见任何两个解释变量之间都有很正的线性相关关系,因此样本存在多重共线性。

模型的修正:
2.object ——new object ——equation ——在弹出的对话框里输入“y c x2”点击ok 。

然后一次
输入“y c x3”,"y c x4","y c x5". 出现下面的结果:
方程
t
F
DW
23.362X 33808.53Y += 5.687 0.642 32.338 2453.311 0.701 3188.053.37599X Y +=
3.186 0.361 10.153 3280.470 0.476 4213.06
4.39068X Y += 1.161 0.070 1.348 3957.139 0.659 5790.0684.5770X Y +=
4.770
0.558
0.0001
2726.479 0.517
以上结果显示,除第四个外,任何一个解释变量和被解释变量之间的关系都是显著的。

经济意义检验:
从经济意义的角度看,农作物播种面积和农业化肥施用量应该是主要因素,因此建模时农作物播种面积X1和农业化肥施用量X2应作为基本解释变量予以保留。

包含和各种估计式如下:
变量 t
F
DW X1,X2 1.779 0.27416 0.699 19.694 2317.959 0.671 X1 X2 X3 4.213 5.382 -7.589 0.934 76.031 1114.096 2.240 X1 X2 X4 2.078 1.372 -3.296 0.820 24.369 1843.932 0.486 X1 X2 X5
3.275 2.565 -2.993 0.807 22.259 1913.140 1.506 X1 X2 X3 X4 6.263 8.698-9.699
-4.981
0.974 148.101 706.252
1.686
X1 X2 X3 X5 3.728 4.482 -5.451
-0.405
0.935 54.086 1144.379 2.367 X1 X2 X4 X5 3.958 3.757 -3.707
-3.420
0.899
33.426
1427.377 0.903
由以上各估计式可以看出,具有保留了X1,和X2的估计式通过了显著性检验,而且经济意义明显,是一个相当好的样本回归方程。

尽管两者之间还存在多重共线性,但是由于模型的整体显著,每个估计值也显著,因此可以不考虑他们之间的共线性问题。

21471.0653.019.54910X X Y ++-=
(1.779) (0.274)。

相关文档
最新文档