实验三 多重共线性
计量经济学多元线性回归、多重共线性、异方差实验报告(推荐文档)

计量经济学实验报告多元线性回归、多重共线性、异方差实验报告、研究目的和要求:随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。
旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。
尤其是假日旅游,有力刺激了居民消费而拉动内需。
2012年,我国全年国内旅游人数达到30.0亿人次,同比增长13.6%,国内旅游收入2.3万亿元,同比增长19.1%。
旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。
为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。
影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。
旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。
因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。
二、模型设定根据以上的分析,建立以下模型57丫=仇+ B1X 1+ 伍X 2+ B 3X 3+ 34 X 4 +Ut参数说明:旅游景区营业收入/万元X 1 旅游业从业人员/人 X 2 旅游景区固定资产/万元 X 3 旅游外汇收入/万美元 X 4城镇居民可支配收入/元收集到的数据如下(见表 2.1):表2.1 2011年全国旅游景区营业收入及相关数据(按地区分) 地区 北 京 天 津 河 北 山 西内蒙 古辽 丿jA吉营业收入145249.0148712.3182226.8729465.0 70313.0 25665.3 20389.3 从业人 数1454 66 247879645771 3626 64812906 固定资产694252.393529.67 420342.7121809.7206819.146573.27 87827.16外汇收入可支配 收入5416017555 447655671967097 2713138528 32903. 0326920. 8618292. 2318123. 8720407.20466. 8417796.林0 6 57 黑龙38367.8 3034 137426.215696.91762江 1 1 7 18 上194762. 9110 563007.4 57511 36230. 海 3 6 4 8 48 江316051. 1401 1195000. 56529 26340. 苏65 54 60 7 73 浙385976. 1324 1110975. 45417 30970. 江92 59 20 3 68 安79562.7 5584 139769.0 11791 18606. 徽 5 0 2 8 13 福155378. 8030 151897.6 36344 24907. 建95 3 9 4 40 江54961.6 4179 17494.85528.05 41500西 6 1 87 山116995. 1430 327733.2 25507 22791. 东67 26 9 6 84 河222108. 7016 482005.3 18194.54903南33 4 2 80 湖104565. 6276 243794.618373.94018北58 7 2 87 湖118180. 806110143 18844.257226.7南87 5 4 05 广476345. 2265 1160675. 13906 26897. 东50 39 4 19 48 广66195.5 4987 143982.0 10518 18854. 西 5 6 3 8 06 海29081.6 3075 18368.70386.55 37615南0 9 95 重86713.6 5016 230124.0 96806 20249.庆7 0 0 70 四218624. 7075 464763.5 17899.59383川03 6 2 12 贵42214.1 2768 16495.62415.21 13507州 4 3 01 云135897. 6267 348426.0 16086 18575. 南97 9 4 1 62 西30406.7 462971.0 16195.6023 12963藏 3 3 56 陕48692.1 5707 154529.1 12950 18245. 西7 7 9 5 23 —30949.0 3128 14988.56684.68 1740肃0 0 68 青15603.1 -J 638.43 8741 9851.28 2659海31 /宁49509.8 1219 17578.23149.90 620夏 6 6 92 新28993.1 4045 15513.52280.36 46519疆 1 1 62 数据来源:1.中国统计年鉴2012,2.中国旅游年鉴2012。
多重共线性实验指导

第六章 多重共线性问题一、 实验目的熟练使用EViews 软件进行计量分析,理解多重共线性的检验和估计的基本方法。
二、 基本知识点:多重共线性的基本概念,多重共线性的后果,检验是否存在的基本方法——样本决定系数检验、参数估计值的经济检验和参数估计值的统计检验,多重共线性的解决办法——逐步回归法。
三、 实验内容及要求:依据经济学理论,以实际数据(实验数据五)为基础,①建立反映天津市粮食市场需求状况的粮食需求函数。
②检验所建立的粮食需求函数是否存在多重共线性。
③如果存在多重共线性,使用恰当的方法加以解决。
四、 实验指导:经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。
为此,考虑的影响因素主要有国内旅游人数X1,城镇居民人居旅游支出X2、农村居民人均旅游支出X3、公路里程X4和铁路里程X5。
为此设定如下的对数形式的计量经济模型:t t t t t t t X X X X X Y μββββββ++++++=54321543210 Y t ——第年全国旅游收入; X1t ——国内旅游人数(万人); X2t ——城镇居民人均旅游支出(元); X3t ——农村居民人均旅游支出(元); X4t ——公路里程(万公里); X5t ——铁路里程(万公里)。
数据见实验指导数据五,来源于《中国统计年鉴年》 STEP1:参数估计在Eviews 中点击NEW 项,建立Workfile 输入Y 、X1、X2、X3、X4、X5的数据。
点 击Quick ,选Estimate Equation 项,在OLS 对话框中,键入Y C X1 X2 X3 X4 X5,输出结果。
见图6.4.1。
Dependent Variable: Y Method: Least Squares Date: 12/12/10 Time: 08:35 Sample: 1994 2006 Included observations: 13Variable Coefficient Std. Error t-Statistic Prob. C 658.4612 1822.588 0.361278 0.7285 X1 0.046675 0.006842 6.821912 0.0002 X2 6.161783 1.608916 3.829772 0.0065 X3 2.372393 1.083468 2.189629 0.0647 X4 1.134097 1.417467 0.800087 0.4500 X5-853.5124426.8085-1.9997550.0857R-squared0.996586 Mean dependent var 3201.408 Adjusted R-squared 0.994148 S.D. dependent var 1552.189 S.E. of regression 118.7417 Akaike info criterion 12.69582 Sum squared resid 98697.10 Schwarz criterion 12.95656 Log likelihood -76.52280 F-statistic 408.7042 Durbin-Watson stat1.368523 Prob(F-statistic)0.000000图6.4.1 Eviews 输出的回归结果分析:模型R 2=0.996586 0.9941482=R 可决系数很高,F 检验值408.7042,显著。
多重共线性实验报告

【实验名称】:多重共线性的检验方法和处理【实验目的】:掌握多重共线性的原理【实验原理】:综合统计检验法、相关系数矩阵检验法、逐步回归法【实验步骤】:一、创建一个新的工作文件:二、输入样本数据:三、用普通最小二乘法估计模型:由于解释变量个数较多,并且解释变量之间可能存在相关性,为了降低这种相关性以减弱序列相关性对模型的影响,我们先对各个解释变量和被解释变量取对数:即在Eviews软件的命令框执行:genr lnY=log(Y),genr lnX1=log(X1),genr lnX2=log (X2)……genr lnX5=log(X5)我们设粮食生产函数为:LnY=β0+β1lnX1+β2lnX2+β3lnX3+β4lnX4+β5lnX5+μ用运普通最小二乘法估计:下表给出了采用Eviews软件对表一的数据进行回归分析的统计结果:Dependent Variable: LNYMethod: Least SquaresDate: 12/19/13 Time: 10:05Sample: 1983 2007C -4.173174 1.923624 -2.169434 0.0429LNX1 0.381145 0.050242 7.586182 0.0000 LNX2 1.222289 0.135179 9.042030 0.0000 LNX3 -0.081110 0.015304 -5.300024 0.0000 LNX4 -0.047229 0.044767 -1.054980 0.3047R-squared 0.981597 Mean dependent var 10.70905 Adjusted R-squared 0.976753 S.D. dependent var 0.093396 S.E. of regression 0.014240 Akaike info criterion -5.459968 Sum squared resid 0.003853 Schwarz criterion -5.167438 Log likelihood 74.24960 F-statistic 202.6826 Durbin-Watson stat 1.791427 Prob(F-statistic) 0.000000根据上表估计出的参数,可以得到如下普通最小二乘法估计模型:lnY=‐4.17+0.381lnX1+1.222lnX2‐0.081lnX3‐0.047lnX4‐0.101lnX5四、模型检验:1、数学检验:由于R2为0.9816接近于一,且F=202.68>F0.05(5,9)=2.74,故认为粮食产量和上述解释变量之间的总体线性关系显著;但是就X4,X5来说,其t检验的参数较小,尚不能通过t检验,因此怀疑模型中存在多重共线性。
实验报告多重共线性.doc

实验报告实验项目:非线性模型的线性化 课程名称:计量经济学 指导教师:王云 专业:市场营销 年级:2013级 学号:20135666060 姓名:林楚睿 实验地点:信息楼 实验日期:2015/10/15一、 实验S 的及要求利用计量经济学软件Evicws5.0处进行非线性回归模型的参数估计、检验和预测 二、 课本第七章课后习题第八题 三、 实验结果:(1)利用表中数据进行最小二乘估计 使用Eviews 得:EViews - [Equation: UNTITLED Workfile: UNTTLED\Untitled]d File Edit Object View Proc Quick Options WindowView I Proc I Object I Print | Name I Freeze | Estimate I Forecast! Stats I Resids IDependent Variable: Y Method: Least Squares Date: 10/16/15 Time: 13:43 Sample: 1 10 Included observations: 10Coefficient Std. Error t-Statistic ProbPath = c:\users\d 石头 \docume DB = non. WF = untit I e< A用普通最小二乘法求到的估计结果为f =3.914451 +0.060263 X, +0.089090 X ,-0 012598 %3 +0.007406 (2.004902) (1.245671) (2.396978)(-0.693309)(0.420498)/?2 =0.979655/?2 =0.963379DW=2.213879 F=60.18950给定显著水帄汉=0.05,回归系数估计值都没有显著性。
查F 分布表,得临界值为 /?005(4,6)=4.53,故 F=60.18950>4.53,回归方程显著。
实验报告3 多重共线性

E V I E W S操作实验题目:多重共线性实验类型:基本操作实验目的:掌握利用Eviews进行多元线性回归;存在多重共线性的基础上掌握逐步回归法的基本操作;及方差扩大因子的计算方法。
实验内容:(按要求完成下面题目)4.6 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。
为此,收集了中国能源消费总量Y (万吨标准煤)、国内生产总值(亿元)X1(代表经济发展水平)、国民总收入(亿元)X2(代表收入水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2002年期间的统计要求:(1)建立对数线性多元回归模型(2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?(3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。
实验步骤:一、设定模型Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+β7X7+u二、估计参数1、各解释变量的相关系数矩阵:X1 X2 X3 X4 X5 X6 X7X1 1.000000 0.9999780.9996710.9988680.9918430.9934890.722545X2 0.999978 1.000000.9997280.9989480.9912510.992990.725681X3 0.999671 0.9997281.000000.9989830.9909460.9921480.732289X4 0.998868 0.9989480.9989831.000000.9878390.9888740.737354X5 0.991843 0.9912510.9909460.9878391.000000.9988290.682852X6 0.993489 0.99299 0.9921480.9888740.9988291.000000.680992X7 0.722545 0.7256810.7322890.7373540.6828520.6809921.00000可以看出,各解释变量之间的相关系数较高,证明存在多重共线性。
多重共线性实验

经对比发现,新加入X2的方程的调整可决系数改进最大,
R 2 =0.9935
而且,X1与 X2的t检验都是显著的,因此选择保留X2。 (3)在包含X1与X2的二元线性回归方程的基础上,再逐个加
入其它解释变量进行回归,结果如图所示:
Y对X1、X2和X3的回归结果
Y对X1、X2和X4的回归结果
Y对X1、X2和X5的回归结果
而确定拟合优度最好的二元回归模型。做法为【Estimate】【Equation Specification】,在文本框中输入“Y C X1 X2”,
点击【OK】。回归结果如下:
用类似的方法分别加入X2,X3,X4,X5,得到如下回归结果:
Y对X1和X3的回归结果
Y对X1和X4的回归结果
Y对X1和X5的回归结果
高,其中X1与X4之间的相关系数高达0.9569,存在高度相关性。
因此,可以判断原模型存在严重多重共线性。
4 修正多重共线性 采用逐步回归法来修正多重共线性 (1)首先确定一个最优的回归方程。即从X1、X2、X3、X4、 X5中选择解释Y最好的那个解释变量来建立最优回归模型。
分别做Y对X1、X2、X3、X4、X5的回归,得到如下的回归结果。
2 参数估计 (1)创建工作文件
启动Eviews,在主菜单依次点击【File】-【New】-【Workfile】,
在弹出在对话框中选取【Annual】,并输入开始时间和结束时间。
(2)输入数据
在命令窗口输入Data Y X1 X2 X3 X4 X5,并回车,将数据输入
对应序列中。
(3)估计参数 【Quick】-【Estimate Equation】,在文本框中输入“Y C X1 X2 X3 X4 X5”,选择“LS-Least Squares”,点击【OK】。
什么是多重共线性如何进行多重共线性的检验
什么是多重共线性如何进行多重共线性的检验多重共线性是指在统计模型中,独立变量之间存在高度相关性或者线性依赖关系,从而给模型的解释和结果带来不确定性。
在回归分析中,多重共线性可能导致系数估计不准确、标准误差过大、模型的解释变得复杂等问题。
因此,对于多重共线性的检验和处理是非常重要的。
一、多重共线性的检验多重共线性的检验可以通过以下几种方式进行:1. 相关系数矩阵:可以通过计算独立变量之间的相关系数,判断它们之间的关系强度。
当相关系数超过0.8或-0.8时,可以视为存在高度相关性,即可能存在多重共线性问题。
2. 方差扩大因子(VIF):VIF是用来检验自变量之间是否存在共线性的指标。
计算每一个自变量的VIF值,当VIF值大于10或者更高时,可以视为存在多重共线性。
3. 条件数(Condition index):条件数也是一种用来检验多重共线性的指标。
它度量了回归矩阵的奇异性或者相对不稳定性。
当条件数超过30时,可以视为存在多重共线性。
4. 特征值(Eigenvalues):通过计算特征值,可以判断回归矩阵的奇异性。
如果存在特征值接近于零的情况,可能存在多重共线性。
以上是常用的多重共线性检验方法,可以根据实际情况选择合适的方法进行检验。
二、多重共线性的处理在检测到存在多重共线性问题后,可以采取以下几种方式进行处理:1. 去除相关性强的变量:在存在高度相关变量的情况下,可以选择去除其中一个或多个相关性较强的变量。
2. 聚合相关变量:将相关性强的变量进行加权平均,得到一个新的变量来替代原来的变量。
3. 主成分分析(PCA):主成分分析是一种降维技术,可以将相关性强的多个变量合并成为一个或多个无关的主成分。
4. 岭回归(Ridge Regression):岭回归是一种缓解多重共线性的方法,通过加入一个正则化项,来使得共线性变量的系数估计更加稳定。
5. Lasso回归(Lasso Regression):Lasso回归也是一种缓解多重共线性的方法,通过对系数进行稀疏化,来选择重要的变量。
计量经济学多重共线性实验报告
计量经济学实验报告一、实验目的:1、熟悉和掌握Eviews在多重共线性模型中的应用,如何判断和解决多重共线性问题。
2、加深对课程理论知识的理解和应用。
二、实验问题:农村居民各种不同类型的收入对消费支出影响(2006年)农村居民收入(Y)主要来源于4项:即农业经营收入(X1)、工资性收入(X2)、财产性收入(X3)及转移性收入(X4)。
(1)利用线性模型或双对数模型进行分析。
(2)回归模型中存在多重共线性吗?三、实验数据:由老师提供(本实验报告截取从北京到新疆共31组数据)四、实验步骤:1、建立新的工作文件,输入数据,分别保存为Y(农村居民收入),X1(农业经营收入)、X2(工资性收入)、X3(财产性收入)、及X4(转移性收入)。
2、建立线性模型:Y = a1*X1 + a2*X2 +a3*X3 + a4*X4 + u得到方程:Y = 0.6268809567*X1 + 0.481134931*X2 - 0.255544644*X3 + 2.683018467*X4 + 479.30109493、分析由图中数据可以看出,在最小二乘法下,模型的R平方和F值较大,表明模型中各解释变量对Y的联合线性作用显著;但是X3(财产性收入)的系数是负的,这不符合经济学意义,财产性收入应当与消费支出正相关,故怀疑模型存在多重共线性。
4、检验:计算解释变量之间的简单相关系数:在“quick”菜单中选“group statistics”项中的“correlation”命令。
在出现“serieslist”对话框时,直接输入X1,X2,X3,X4出现如下结果从表中可以看出,解释变量X1、X3、X4之间存在高度线性相关。
4、修正第一步:运用OLS方法逐一求Y对各个解释变量的回归。
(1)Y = 0.8997862236*X1 + 1541.033294t值 15.32947 12.29913prob.值 0.0000 0.0000R2=0.890148 F=234.9925(2)Y = 0.2487123305*X2 + 2505.747921t值 0.527219 2.676297prob.值 0.6021 0.0121R2= 0.009494 F=0.277960(3)Y = 8.049228785*X3 + 1943.170851t值 9.28666 11.56389prob.值 0.0000 0.0000R2=0.748356 F= 86.24206(4)Y = 5.928884198*X4 + 1631.299987t值 9.212266 8.434353prob.值 0.0000 0.0000R2= 0.745314 F=84.86584结合经济意义和统计检验结果分析,在4个一元回归模型中消费支出Y对X1工资性收入线性关系最强,拟合程度较好,与经验相符,因此选(1)为初始的回归模型。
多重共线性回归分析及其实验报告
实验报告实验题目:多重共线性的研究指导老师:学生一:学生二:实验时间:2011年10月多重线性回归分析及其实验报告实验目的:为了更好地了解财政收入构成,需要定量地分析影响财政收入的因素模型设定及其估计:经分析,影响财政收入的主要因素,农业增加值X1,工业增加值X2,建筑业增加值X3,总人口X4,受灾面积X5.为此设定了如下形式的计量经济模型:Y=β1+β2X1+β3X2+β4X3+β5X4+β6X5+u0其中,Y为财政收入(元),X1农业增加值(元),X2为工业增加值(元),X3为建筑业增加值(元),X4为总人口(万人),X5为受灾面积(千公顷)为估计模型参数,收集1978~2007年财政收入及其影响因素数据,如图:1978~2007年财政收入及其影响因素数据年份财政收入CS/亿元农业增加值NZ/亿元工业增加值GZ/亿元建筑业增加值JZZ/亿元总人口TPOP/万人受灾面积SZM/千公顷1978 1132.3 1027.5 1607 138.2 96259 50790 1979 1146.6 1270.2 1769.7 143.8 97542 39370 1980 1159.9 1371.4 1996.5 195.5 98705 44526 1981 1175.8 1559.5 2048.5 207.1 100072 39790 1982 1212.3 1777.4 2162.3 220.7 101654 33130 1983 1367 1978.5 2375.8 270.6 103008 34710 1984 1642.5 2316.1 2789 316.7 104357 31890 1985 2004.6 2564.3 3448.5 417.9 105851 44365 1986 2122 2788.7 3987.5 525.7 107507 47170 1987 2199.4 3233 4565.9 665.8 109300 42090 1988 2357.6 3865.4 5062 810 111026 50870 1989 2664.5 5062 8087.3 794 112704 46991 1990 2937.4 5342.3 10284.5 859.4 114333 384741991 3149.48 5866.8 14188 1015.1 115823 55472 1992 3483.48 6963.6 19480.5 1415 117171 51333 1993 4348.95 9572.7 19480.4 2266.5 118517 48829 1994 5218.1 12315.7 24950.7 2964.7 119850 55043 1995 6242.2 14015.8 29447.6 3728.8 121121 45821 1996 7407.99 14441.8 32921.4 4387.4 122389 46898 1997 8615.14 14917.6 34018.4 4985.8 123626 53429 1998 9875.95 14944.5 40036 5172.1 124761 59145 1999 11444.08 15871.8 43580.6 5522.3 125786 49981 2000 13395.23 16537 47431.6 5913.7 126743 54688 2001 16386.04 17381.8 54945.5 6465.5 127627 52215 2002 18903.64 21412.7 65210 7490.8 128453 47119 2003 21715.25 22420 76912.6 8694.3 129227 54506 2004 26396.47 21224 87632.4 8967.8 129988 37106 2005 31649.29 22420 89834.5 10133.8 130756 38818 2006 38760.2 24040.9 91310.9 11851.1 131448 41091 2007 51321.45 28095 107367.2 14014.1 132129 48992利用Eviews软件,生成Y、X1、X2、X3、X4、X5等数据,采用这些数据进行OLS回归,结果如下Dependent Variable: YMethod: Least SquaresDate: 10/24/11 Time: 22:49Sample: 1978 2007Included observations: 30Variable Coefficient Std. Error t-Statistic Prob.C -6734.394 11259.37 -0.598115 0.5554X1 -1.678611 0.328371 -5.111937 0.0000X2 0.071078 0.081171 0.875666 0.3899X3 5.699199 0.745591 7.643870 0.0000X4 0.101481 0.114244 0.888277 0.3832X5 -0.010922 0.057578 -0.189691 0.8511R-squared 0.983660 Mean dependent var 10047.83Adjusted R-squared 0.980255 S.D. dependent var 12585.61S.E. of regression 1768.473 Akaike info criterion 17.97048Sum squared resid 75059958 Schwarz criterion 18.25072Log likelihood -263.5572 F-statistic 288.9512Durbin-Watson stat 0.898668 Prob(F-statistic) 0.000000由此可见,该模型R2=0.983660,R2=0.980255可决系数很高,F检验值为288.9512,明显显著。
实验报告多重共线性
西南科技大学Southwest University of Science and Technology 经济管理学院计量经济学实验报告——多元线性回归的检验专业班级:国贸0903姓名:王鑫学号: 20092438任课教师:龙林成绩:简单线性回归模型的处理实验目的:掌握多元回归参数的估计和检验的处理方法。
实验要求:学会建立模型,估计模型中的未知参数等。
试验用软件:Eviews实验原理:线性回归模型的最小二乘估计、回归系数的估计和检验。
实验内容:1、实验用样本数据:运用Eviews软件,建立1990—2001年中国国内生产总值X和深圳市收入Y的回归模型,做简单线性回归分析,并对回归结果进行检验。
以研究我国国内生产总值对深圳市收入的影响。
年份地方预算内财政收入Y(亿元)国内生产总值(GDP)X(亿元)1990 21.7037 171.6665 1991 27.3291 236.6630 1992 42.9599 317.3194 1993 67.2507 449.2889 1994 74.3992 615.1933 1995 88.0174 795.6950 1996 131.7490 950.0446 1997 144.7709 1130.0133 1998 164.9067 1289.0190 1999 184.7908 1436.0267 2000 225.0212 1665.4652 2001 265.6532 1954.6539经过简单的回归分析后得出表EQ1:Dependent Variable: YMethod: Least SquaresDate: 11/28/11 Time: 18:31Sample: 1990 2001Included observations: 12Variable CoefficientStd. Error t-Statistic Prob.C -3.611151 4.161790 -0.867692 0.4059X 0.134582 0.003867 34.80013 0.0000 R-squared 0.991810 Mean dependent var 119.8793 Adjusted R-squared 0.990991 S.D. dependent var 79.36124S.E. of regression 7.532484 Akaike infocriterion 7.027338Sum squared resid 567.3831 Schwarz criterion 7.108156Log likelihood -40.16403 F-statistic 1211.049Durbin-Watson stat 2.051640 Prob(F-statistic) 0.00000其中拟合优度为:0.991810有很强的线性关系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【实验步骤】 (1) 建立线性回归模型并检验多重共线性 1.建立模型 利用数据分别建立散点图
首先建立一个多元线性回归模型
2.检验多重共线性 进一步选择 Covariance Analysis 的 Correlation,得到变量之间的相关系数矩阵。
由图可得,粮食生产与上述解释变量间总体线性关系显著。但由于其中 X4,X5 前参数估计值未能通过 t 检验,而且符号的经济意义也不合理,故认为解释变量 间存在多重共线性。 (2) 用逐步回归法克服多重共线性 1. 找出最简单的回归形式
计量经济学实验三多重共线性
金融工程 1 班吴卉雨 20141363015 【实验目的】 掌握多重共线性问题出现的来源、后果、检验及修正的原理,以及相关的 Eviews 操作方法。 【实验内容】 练习检查和克服模型的多重共线性的操作方法。 实验题目和内容: 以教材 P140 例 4.3.1 的数据为基础,练习多重共线性的检验与解决。 数据
X 。 分别使用量影响较大,与经验相符合,因此选其为初 始的回归模型。 2.逐步回归 将其他解释变量分别导入上述初始回归模型,寻找最佳回归方程。 第一步:在初始模型中引入 X 2 ,模型拟合优度提高,参数符号合理,且变量通 过了 t 检验,D.W.检验值落在上界以上,表明不存在 1 阶序列相关性;
第二步,引入 X 3 ,拟合优度再次提高,且参数符号合理,变量也通过 t 检验,
只是 D.W.值落入了无法判断的区域,且由 LM 检验知道仍不存在 1 阶自相关性
第三步,引入 X 4 ,修正的拟合优度有所下降,且 X 4 参数未能通过 t 检验;
第四步,去掉 X4,引入 X5,拟合优度有所提高,但 X5 参数未通过 t 检验,且参 数符号与经济意义不同
第三步与第四步表明,X4 与 X5 是多余的。同时还可以继续验证,如果用以 X1 高度相关的 X4 代替 X1,则 X4 与 X2,X3,X5 间的任意线性组合,均以不高以 X1, X2, X3 为解释变量的回归效果。 因此, 最终的粮食产量函数应以 Y=f(X1,X2,X3) 最优,拟合结果如下 lny = −5.996 + 0.323lnx1 + 1.290lnx2 − 0.087lnx3