多重共线性习题与答案

多重共线性习题与答案
多重共线性习题与答案

第七章 多重共线性习题与答案

1、多重共线性产生的原因是什么?

2、检验多重共线性的方法思路是什么?有哪些克服方法?

3、考虑一下模型:

Y t =β1+β2X t +β3X 1-t +4βX 2-t +5βX 3-t +6βX 4-t +u t

其中Y =消费,X =收入,t =时间。上述模型假定了时间t 的消费支出不仅是时间t 的收入,而且是以前多期的收入的函数。例如,1976年第一季度的消费支出是同季度收入合1975年的四个季度收入的函数。这类模型叫做分布滞后模型(distributed lag models )。我们将在以后的一掌中加以讨论。

(1) 你预期在这类模型中有多重共线性吗?为什么?

(2)如果预期有多重共线性,你会怎么样解决这个问题?

4、已知回归模型μβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年)。随机扰动项μ的分布未知,其他所有假设都满足。

(1)从直观及经济角度解释α和β。

(2)OLS 估计量α

?和β?满足线性性、无偏性及有效性吗?简单陈述理由。 (3)对参数的假设检验还能进行吗?简单陈述理由。

5、根据1899—1922年在美国制造业部门的年度数据,多尔蒂(Dougherty )获得如下回归结果:

LogY=2.81 - 0.53logK+ 0.91logL + 0.047t

Se =(1.38)(0.34) (0.14) (0.021)

R 2=0.97 F=189.8

其中Y =实际产生指数,K=实际资本投入指数,L=实际劳力投入指数,t =时间或趋势。利用同样数据,他又获得一下回归:

(1)回归中有没有多重共线性?你怎么知道?

(2)在回归(1)中,logK 的先验符号是什么?结果是否与预期的一致?为什么或为什么不?

(3)你怎样替回归的函数形式(1)做辩护:(提示:柯柏—道格拉斯生产函数。)

(4)解释回归(1)在此回归中趋势变量的作用为何?

(5)估计回归(2)的道理何在?

(6)如果原先的回归(1)有多重共线性,是否已被回归(2)减弱?你怎样知道?

(7)如果回归(2)被别看作回归(1)的一个受约束形式,作者施加的约束是什么呢?(提示:规模报酬)你怎样知道这个约束是否正确?你在哪一种检验?说明你的计算。

两个回归的R 2值是可比的么?为什么或为什么不?如果它们现在的形式不可比,你会怎样使得它们可比?

答案:1、(1)样本的原因,比如样本中的解释变量个数大于观测次数。(2)经济变量变化的相同趋向。(3)模型中引入滞后变量。(4)经济变量的本质特征。

2、检验多重共线性的方法思路:用统计上求相关系数的原理,如果变量之间的相关系数较大则认为它们之间存在多重共线性。克服多重共线性的方法主要有:排除引起共线性的变量,差分法,减少参数估计量的方差,利用先验信息改变参数的约束形式,增加样本容量,岭回归法等。

3、(1) 不能。因为变量X i 2与成线性关系X i 3,X i 3=X i

2+1 (2)X i 3=X i 2+1带入模型,Y i =β1+(β2+2β3) X i

2+u i

我们发现模型中有三个参数,不能估计出β2,β3的值。

4、(1)N βα+为接受过N 年教育的员工的总体平均起始薪金。当N 为零时,平均薪金为α,因此α表示没有接受过教育员工的平均起始薪金。β是每单位N 变化所引起的E 的变化,即表示每多接受一年学校教育所对应的薪金增加值。(2)

OLS 估计量α?和仍β?满足线性性、无偏性及有效性,因为这些性质的的成立无需随机扰动项μ的正态分布假设。(3)如果t μ的分布未知,则所有的假设检验都是无效的。因为t 检验与F 检验是建立在μ的正态分布假设之上的。

5、(1)由于2

R 很高,F 显著,可以知道可能有多重共线性的存在。

(2)logK 的先验符号应该为正,但是却不是,可能与共线性有关。

(3)方程1的模型是:

3241t Y K L e ββββ=;因此,函数的形式应该就像所述的一样。 (4)平均来说,真实劳动的1%的增长会带来真实产出的0.91%的增长。产出每年增长0.047,模型揭示了真实产出的97%的变异。

(5)方程2就是方程1的的基础上作了修改。假设有一个固定的回报比例,(231ββ+=)。模型应该是212411()t Y K L e L L βββββ+-=。

(6)题目给出资本-劳动比率是统计上不显著,这表示问题没有得到解决。

(6)题意假设固定的回报比例,由(c )可知。可以用8.7.10F 来检验这个约束。尽管如此,因变量不同,必须首先使2R 相一致。读者需要一列数据来完成检验。

(7)不是.给出数据,读者可以用7.8和8.7所提到的方法。

多重共线性的解决之法

第七章 多重共线性 教学目的及要求: 1、重点理解多重共线性在经济现象中的表现及产生的原因和后果 2、掌握检验和处理多重共线性问题的方法 3、学会灵活运用Eviews 软件解决多重共线性的实际问题。 第一节 多重共线性的产生及后果 一、多重共线性的含义 1、含义 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X 1,X 2,……,X k 中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 2、类型 多重共线性包含完全多重共线性和不完全多重共线性两种类型。 (1)完全多重共线性 完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。 如对于多元线性回归模型 i ki k i i i X X X Y μββββ+++++= 22110 (7-1) 存在不全为零的数k λλλ,,,21 ,使得下式成立: X X X 2211=+++ki k i i λλλ (7-2) 则可以说解释变量k X ,,X ,X 21 之间存在完全的线性相关关系,即存在完全多重共线性。 从矩阵形式来看,就是0' =X X , 即1)(-

(2)不完全多重共线性 不完全多重共线性是指线性回归模型中解释变量间存在不严格的线性关系,即近似线性关系。 如对于多元线性回归模型(7-1)存在不全为零的数k λλλ,,,21 ,使得下式成立: X X X 2211=++++i ki k i i u λλλ (7-3) 其中i u 为随机误差项,则可以说解释变量k X ,,X ,X 21 之间存在不完全多重共线性。随机误差项表明上述线性关系是一种近似的关系式,大体上反映了解释变量间的相关程度。 完全多重共线性与完全非线性都是极端情况,一般说来,统计数据中多个解释变量之间多少都存在一定程度的相关性,对多重共线性程度强弱的判断和解决方法是本章讨论的重点。 二、多重共线性产生的原因 多重共线性在经济现象中具有普遍性,其产生的原因很多,一般较常见的有以下几种情况。 (一)经济变量间具有相同方向的变化趋势 在同一经济发展阶段,一些因素的变化往往同时影响若干经济变量向相同方向变化,从而引起多重共线性。如在经济上升时期,投资、收入、消费、储蓄等经济指标都趋向增长,这些经济变量在引入同一线性回归模型并作为解释变量时,往往存在较严重的多重共线性。 (二)经济变量间存在较密切关系 由于组成经济系统的各要素之间是相互影响相互制约的,因而在数量关系上也会存在一定联系。如耕地面积与施肥量都会对粮食总产量有一定影响,同时,二者本身存在密切关系。 (三)采用滞后变量作为解释变量较易产生多重共线性 一般滞后变量与当期变量在经济意义上关联度比较密切,往往会产生多重共线性。如在研究消费规律时,解释变量因素不但要考虑当期收入,还要考虑以往各期收入,而当期收入与滞后收入间存在多重共线性的可能很大。 (四)数据收集范围过窄,有时会造成变量间存在多重共线性问题。 三、多重共线性产生的后果 由前述可知,多重共线性分完全多重共线性和不完全多重共线性两种情况,两种情况都会对模

(完整版)多重共线性检验与修正.doc

问题: 选取粮食生产为例,由经济学理论和实际可以知道,影响粮食生产y 的因素有:农业化肥施 用量x1,粮食播种面积x2,成灾面积x3,农业机械总动力x4,农业劳动力x5,由此建立以下方程: y=β0+β1x1+β2x2+β3x3+β4x4+β5x5,相关数据如下: 解: 1、检验多重共线性 (1)在命令栏中输入: ls y c x1 x2 x3 x4 x5,则有; 可以看到,可决系数R2 和 F 值都 很高,二自变量x1 到 x5 的 t 值 均较小,并且x4 和 x5 的 t 检验 不显著,说明方程很可能存在多 重共线性。 (2)对自变量做相关性分析: 将x1—— x5 作为组打开, view —— covariance analysis—— correlation ,结果如下: 可以看到x1 和 x4 的相关系数 为 0.96,非常高,说明原模型 存在多重共线性

2、多重共线性的修正 (1)逐步回归法 第一步:首先确定一个基准的解释变量,即从 x1, x2, x3, x4, x5 中选择解释 y 的最好的一个建 立基准模型。分别用 x1, x2, x3, x4, x5 对 y 求回归,结果如下: 从上面 5 个输出结果可以知道,y 对 x1 的可决系数R2=0.89(最高),因此选择 第一个方程作为基准回归模型。即: Y = 30867.31062 + 4.576114592* x1 在基准模型的基础上,逐步将x2, x3 等加入到模型中, 加入 x2,结果:

拟合优度R2=0.961395 ,显著提高; 并且参数符号符合经济常识,且均显著。 所以将模型修改为: Y= -44174.52+ 4.576460*x1+ 0.672680*x2 再加入 x3,结果: 拟合优度R2=0.984174 ,显著提高; 并且参数符号符合经济常识(成灾面积越大,粮食产 量越低),且均显著。 所以将模型修改为: Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3 再加入 x4,结果: 拟合优度R2=0.987158 ,虽然比上一次拟 合提高了; 但是变量x4 的系数为 -0.091271 ,符号不 符合经济常识(农业机械总动力越高, 粮食产量越高),并且 x4 的 t 检验不显著。 因此应该从模型中剔除x4。

EVIEWS案例:(消除多重共线性)影响国内旅游市场收入的主要因素分析

第四章 案例分析 一、研究的目的要求 近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长 22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。 二、模型设定及其估计 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数2X ,城镇居民人均旅游支出3X ,农村居民人均旅游支出4X ,并以公路里程5X 和铁路里程6X 作为相关基础设施的代表。为此设定了如下对数形式的计量经济模型: 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中 :t Y ——第t 年全国旅游收入 2X ——国内旅游人数 (万人) 3X ——城镇居民人均旅游支出 (元) 4X ——农村居民人均旅游支出 (元) 5X ——公路里程(万公里) 6X ——铁路里程(万公里) 为估计模型参数,收集旅游事业发展最快的 1994—2003年的统 计数据,如表4.2所示: 表4.2 1994年—2003年中国旅游收入及相关数据

数据来源:《中国统计年鉴2004》 利用Eviews 软件,输入Y 、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS 回归,结果如表4.3: 表4.3 由此可见,该模型9954.02=R ,9897.02 =R 可决系数很高,F 检验值173.3525,明 显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检 验不显著,而且6X 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据, Views/Open Selected/One Windows/Open Group 点”view/correlations ”得相关系数矩阵(如表4.4): 表4.4 由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。

多重共线性的检验与修正

计量经济学实验报告成绩 课程名称计量经济学指导教师苏卫东实验日期 2014-6-24 院(系)财政与金融学院专业班级金融二专实验地点实验楼八机房 学生姓名单一芳学号 201212041018 同组人无 实验项目名称多重共线性的检验与修正 一、实验目的和要求 1、理解多重共线性的含义与后果 2、掌握Eviews软件的操作和多重共线性的检验与修正 二、实验原理 Eviews软件的操作和多重共线性的检验修正方法 三、主要仪器设备、试剂或材料 Eviews软件,计算机 四、实验方法与步骤 1、准备工作:建立工作文件,并输入数据 CREATE A 1974 1981; DATA Y X1 X2 X3 X4 X5 2、OLS估计: LS Y C X1 X2 X3 X4 X5; 3、计算简单相关系数 COR X1 X2 X3 X4 X5 4、多重共线性的解决 LS Y C X1; LS Y C X2; LS Y C X3; LS Y C X4; LS Y C X5;

LS Y C X1 X3; LS Y C X1 X3 X2; LS Y C X1 X3 X4; LS Y C X1 X3 X5 五、实验数据记录、处理及结果分析 1、建立工作组,输入以下数据: obs Y X1 X2 X3 X4 X5 1974 98.45 560.2 153.2 6.53 1.23 1.89 1975 100.7 603.11 190 9.12 1.3 2.03 1976 102.8 668.05 240.3 8.1 1.8 2.71 1977 133.95 715.47 301.12 10.1 2.09 3 1978 140.13 724.27 361 10.93 2.39 3.29 1979 143.11 736.13 420 11.85 3.9 5.24 1980 146.15 748.91 497.16 12.28 5.13 6.83 1981 144.6 760.32 501 13.5 5.47 8.36 1982 148.94 774.92 529.2 15.29 6.09 10.07 1983 158.55 785.3 552.72 18.1 7.97 12.57 1984 169.68 795.5 771.16 19.61 10.18 15.12 1985 162.14 804.8 811.8 17.22 11.79 18.25 1986 170.09 814.94 988.43 18.6 11.54 20.59 1987 178.69 828.73 1094.65 23.53 11.68 23.37 2、OLS估计 LS Y C X1 X2 X3 X4 X5 Dependent Variable: Y Method: Least Squares Date: 06/24/14 Time: 18:45 Sample: 1974 1987 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C -3.650950 30.00144 -0.121692 0.9061 X1 0.125752 0.059087 2.128275 0.0660 X2 0.072656 0.037445 1.940317 0.0883 X3 2.681426 1.258639 2.130418 0.0658 X4 3.405866 2.444896 1.393052 0.2011 X5 -4.430561 2.194164 -2.019248 0.0781 R-squared 0.970397 Mean dependent var 142.7129

多重共线性 多重共线性实验案例与独立实验问题

实验五 多重共线性模型的检验与处理(1) 一、研究的目的要求 近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。 二、模型设定及其估计 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数2X ,城镇居民人均旅游支出3X ,农村居民人均旅游支出4X ,并以公路里程5X 和铁路里程6X 作为相关基础设 施的代表。为此设定了如下对数形式的计量经济模型: 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中 :t Y ——第t 年全国旅游收入 2X ——国内旅游人数 (万人) 3X ——城镇居民人均旅游支出 (元) 4X ——农村居民人均旅游支出 (元) 5X ——公路里程(万公里) 6X ——铁路里程(万公里) 为估计模型参数,收集旅游事业发展最快的1994—2003年的统计数据,如表4.2所示: 利用Eviews 软件,输入Y 、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS 回归,结果如表4.3: 表4.3

由此可见,该模型9954.02=R ,9897.02 =R 可决系数很高,F 检验值173.3525,明 显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检 验不显著,而且6X 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵(如表4.4): 表4.4 由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。 三、消除多重共线性 采用逐步回归的办法,去检验和解决多重共线性问题。分别作Y 对X2、X3、X4、X5、X6的一元回归,结果如表4.5所示: 表4.5

(整理)多重共线性的检验与修正

附件二:实验报告格式(首页) 山东轻工业学院实验报告成绩 课程名称计量经济学指导教师实验日期 2013-5-25 院(系)商学院专业班级实验地点二机房 学生姓名学号同组人无 实验项目名称多重共线性的检验与修正 一、实验目的和要求 掌握Eviews软件的操作和多重共线性的检验与修正 二、实验原理 Eviews软件的操作和多重共线性的检验修正方法 三、主要仪器设备、试剂或材料 Eviews软件,计算机 四、实验方法与步骤 (1)准备工作:建立工作文件,并输入数据: CREATE EX-7-1 A 1974 1981; TATA Y X1 X2 X3 X4 X5 ; (2)OLS估计: LS Y C X1 X2 X3 X4 X5; (3)计算简单相关系数 COR X1 X2 X3 X4 X5 ; (4)多重共线性的解决 LS Y C X1; LS Y C X2; LS Y C X3; LS Y C X4; LS Y C X5; LS Y C X1 X3; LS Y C X1 X3 X2; LS Y C X1 X3 X4; LS Y C X1 X3 X5; 五、实验数据记录、处理及结果分析 (1)建立工作组,输入以下数据: 98.45 560.20 153.20 6.53 1.23 1.89 100.70 603.11 190.00 9.12 1.30 2.03 102.80 668.05 240.30 8.10 1.80 2.71 133.95 715.47 301.12 10.10 2.09 3.00 140.13 724.27 361.00 10.93 2.39 3.29

第七章 多共线性及其处理

第七章 多重共线性及其处理 第一部分 学习辅导 一、本章学习目的与要求 1.理解多重共线性的概念; 2.掌握多重共线性存在的主要原因; 3.理解多重共线性可能造成的后果; 4.掌握多重共线性的检验与修正的方法。 二、本章内容提要 本章主要介绍计量经济模型的计量经济检验。即多重共线性问题。 多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模型的多个解释变量间出现完全共线性时,模型的参数无法估计。更多的情况则是近似共线性,这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的参数的标准差往往较大,从而使得t 统计值减小,参数的显著性下降,导致某些本应存在于模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。多重共线性的检验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。 (一)多重共线性及其产生的原因 当我们利用统计数据进行分析时,解释变量之间经常会出现高度多重共线性的情况。 1.多重共线性的基本概念 多重共线性(Multicollinearity )一词由弗里希(Frish )于1934年在其撰写的《借助于完全回归系统的统计合流分析》中首次提出。它的原义是指一个回归模型中的一些或全部解释变量之间存在有一种“完全”或准确的线性关系。 如果在经典回归模型Y X βε=+中,经典假定(5)遭到破坏,则有()1R X k <+,此时称解释变量k X X X ,,,21ΛΛ间存在完全多重共线性。解释变量的完全多重共线性,也就是解释变量之间存在严格的线性关系,即数据矩阵X 的列向量线性相关。因此,必有一个列向量可由其余列向量线性表示。 同时还有另外一种情况,即解释变量之间虽然不存在严格的线性关系,但是却有近似的线性关系,即解释变量之间高度相关。 2.多重共线性产生的原因 多元线性回归模型产生多重共线性的原因很多,主要有: (1)经济变量的内在联系 这是产生多重共线性的根本原因。 (2)解释变量中含有滞后变量 (3)经济变量变化趋势的“共向性” 必须指出,多重共线性基本上是一种样本现象。因为人们在设定模型时,总是尽量避免将理论上具有严格线性关系的变量作为解释变量收集在一起,因此,实际问题中的多重共线性并不是解释变量之间存在理论上或实际上的线性关系造成的,而是由所收集的数据(解释变量观察值)之间存在近似的线性关系所致。 (二)多重共线性的影响 多重共线性会产生以下问题: (1)增大了OLS 估计量的方差 (2)难以区分每个解释变量的单独影响 (3)回归模型缺乏稳定性 (4)t 检验的可靠性降低 (三)多重共线性的判别 在应用多元回归模型中,人们总结了许多检验多重共线性的方法。 1.系数判定法

计量经济学多重共线性

2014-8-8 商学院 王中昭 教学内容 一、多重共线性 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验 五、克服多重共线性的办法和实例 §4.3 多重共线性

2014-8-8商学院 王中昭 对于模型Y i =β0+ β1x 1i + β2x 2i +…… βk x ki +μi 如果某两个或多个解释变量之间出现相关性,即:C 1x 1i +C 2X 2i +……C k X ki =0 其中C i 不全为0,即某一个解释变量是其他解释变量的线性组合,则称为完全多重共线性。 完全多重共线性的情况并不多见,一般是出现不同程度的多重共线性。 注意多重共线性不 是指因变量与解释 一、多重共线性概念

2014-8-8商学院 王中昭 Y=Xβ+μ完全共线性:∣X′X ∣=0,(X′X)-1不存在, 使B ^=(X′X)-1X′Y 无法求解。 例如:, 0)(0020 1631084104213211 x x x 3213322113 21≠'=+-=++??????? ??=X X x x x X i i i i i i x c x c x c 这里,完全多重共线性

2014-8-8商学院 王中昭完全多重共线性的情况不多,一般出现不同程度的多重共线性。 多重共线性:∣X′X∣≈0,(X′X)-1存在,但 (X′X)-1主对角线上的元素很大。 ????? ?='≈'?≈+??????? ??=400300000300000100040030000030000010002100010004X)X ( ,0)( 0,0x x - x 199 .2993001001.4004001099.1992001101.1001001 x x x 1 -3i 2i 1i 3 21||这里,X X X 近似多重共线性

多重共线性案例分析实验报告

《多重共线性案例分析》实验报告

表2 由此可见,该模型,可决系数很高,F 检验值 173.3525,明显显著。但是当时,不仅、 系数的t 检验不显著,而且系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 9954.02=R 9897.02 =R 05.0=α776 .2)610()(025.02=-=-t k n t α2X 6X 6X

②.计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵 表3 由关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性相。 4.消除多重共线性 ①采用逐步回归的办法,去检验和解决多重共线性问题。 分别作Y 对X2、X3、X4、X5、X6的一元回归 如下图所示 变量 X2 X3 X4 X5 X6 参数估计值 0.0842 9.0523 11.6673 34.3324 2014.146 t 统计量 8.6659 13.1598 5.1967 6.4675 8.7487 0.9037 0.9558 0.7715 0.8394 0.9054 表4 按的大小排序为:X3、X6、X2、X5、X4。 以X3为基础,顺次加入其他变量逐步回归。首先加入X6回归结果为: t=(2.9086) (0.46214) 2R 2 R 6 31784.285850632.7639.4109?X X Y t ++-=957152.02 =R

1995 1375.7 62900 464.0 61.5 115.70 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.60 1998 2391.2 69450 607.0 197.0 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.80 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200.0 180.98 7.30 表1:1994年—2003年中国游旅收入及相关数据

最新多重共线性的解决之法

多重共线性的解决之 法

第七章多重共线性 教学目的及要求: 1、重点理解多重共线性在经济现象中的表现及产生的原因和后果 2、掌握检验和处理多重共线性问题的方法 3、学会灵活运用Eviews软件解决多重共线性的实际问题。 第一节多重共线性的产生及后果 一、多重共线性的含义 1、含义 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,X k中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 2、类型 多重共线性包含完全多重共线性和不完全多重共线性两种类型。 (1)完全多重共线性 完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。 如对于多元线性回归模型

i ki k i i i X X X Y μββββ+++++= 22110 (7- 1) 存在不全为零的数k λλλ,,,21 ,使得下式成立: 0X X X 2211=+++ki k i i λλλ (7-2) 则可以说解释变量k X ,,X ,X 21 之间存在完全的线性相关关系,即存在完全多重共 线性。 从矩阵形式来看,就是0'=X X , 即1)(-

检验多重共线性

实验目的:在回归模型牵涉到多个自变量的时候,自变量之间可能会相互关联,即他们之间存在有多重共线性,本节实验的实验目的是如何用Eviews检测各个自变量之间是否存在的多重共线问题以及如何对多重共线性进行修正。 我们实验的原始数据如图所示,判断钢产量y与生铁产量X1,发电量X2,固定资产投资X3,国内生产总值X4,铁路运输量X5之间的关系。 实验步骤: 1:打开Eviews7.0. →File→Workfile,选择年度数据,在初始日期和结束日期分别输入“1978”和结束年份“1997”。点击“OK”确定。 2:在新建工作表中,点击Proc→Import→Read,选定需要导入的Excel工作表,在“Upper-left data cell”中输入数据在Excel中的初始位置“B2”,在“Excel 5+….”中输入“sheet1”,在“Name for serises、”中输入“y x1 x2 x3 x4 x5”点击“OK”即可。 3:在Eviews空白处输入:“ls y c x1 x2 x3 x4 x5”,回车即可,结果如下。

Dependent Variable: Y Method: Least Squares Date: 04/19/13 Time: 11:24 Sample: 1978 1997 Included observations: 20 Variable Coefficient Std. Error t-Statistic Prob. C 354.5884 435.6968 0.813842 0.4294 X1 0.026041 0.120064 0.216892 0.8314 X2 0.994536 0.136474 7.287380 0.0000 X3 0.392676 0.086468 4.541271 0.0005 X4 -0.085436 0.016472 -5.186649 0.0001 X5 -0.005998 0.006034 -0.994019 0.3371 R-squared 0.999098 Mean dependent var 5153.450 Adjusted R-squared 0.998776 S.D. dependent var 2512.131 S.E. of regression 87.87969 Akaike info criterion 12.03314 Sum squared resid 108119.8 Schwarz criterion 12.33186 Log likelihood -114.3314 Hannan-Quinn criter. 12.09145 F-statistic 3102.411 Durbin-Watson stat 1.919746 Prob(F-statistic) 0.000000 经查表可知,t(17)=1.345,结合上表可知,x1和x5没有通过t检验,而且F\检验较大,估计解释变量之间可能存在着多重共线性。相关性如下图所示: 可知X1 X2 X3 X4 X5,之间存在着较强的多重共线

EViews计量经济学实验报告-多重共线性的诊断与修正

时间 地点 实验题目 多重共线性的诊断与修正 一、实验目的与要求: 要求目的:1、对多元线性回归模型的多重共线性的诊断; 2、对多元线性回归模型的多重共线性的修正。 二、实验内容 根据书上第四章引子“农业的发展反而会减少财政收入”,1978-2007年的财政收入,农业增加值,工业增加值,建筑业增加值等数据,运用EV 软件,做回归分析,判断是否存在多重共线性,以及修正。 三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等) (一)模型设定及其估计 经分析,影响财政收入的主要因素,除了农业增加值,工业增加值,建筑业增加值以外,还可能与总人口等因素有关。研究“农业的发展反而会减少财政收入”这个问题。 设定如下形式的计量经济模型:i Y =1β+2β2X +3β3X +4β4X +5β5X +6β6X +7β7X +i μ 其中,i Y 为财政收入CS/亿元;2X 为农业增加值NZ/亿元;3X 为工业增加值GZ/亿元;4X 为建筑业增加值JZZ/亿元;5X 为总人口TPOP/万人;6X 为最终消费CUM/亿元;7X 为受灾面积SZM/千公顷。 图1: 1978~2007年财政收入及其影响因素数据 年份 财政收入CS/亿元 农业增加值NZ/亿元 工业增加值GZ/亿元 建筑业 增加值 JZZ/亿 元 总人口 TPOP/万 人 最终消费 CUM/亿元 受灾面 积SZM/ 千公顷 1978 1132.3 1027.5 1607 138.2 96259 2239.1 50790 1979 1146.4 1270.2 1769.7 143.8 97542 2633.7 39370 1980 1159.9 1371.6 1996.5 195.5 98705 3007.9 44526 1981 1175.8 1559.5 2048.4 207.1 100072 3361.5 39790 1982 1212.3 1777.4 2162.3 220.7 101654 3714.8 33130 1983 1367 1978.4 2375.6 270.6 103008 4126.4 34710 1984 1642.9 2316.1 2789 316.7 104357 4846.3 31890 1985 2004.8 2564.4 3448.7 417.9 105851 5986.3 44365 1986 2122 2788.7 3967 525.7 107507 6821.8 47140 1987 2199.4 3233 4585.8 665.8 109300 7804.6 42090 1988 2357.2 3865.4 5777.2 810 111026 9839.5 50870 1989 2664.9 4265.9 6484 794 112704 11164.2 46991 1990 2937.1 5062 6858 859.4 114333 12090.5 38474 1991 3149.48 5342.2 8087.1 1015.1 115823 14091.9 55472 1992 3483.37 5866.6 10284.5 1415 117171 17203.3 51333 1993 4348.95 6963.8 14188 2266.5 118517 21899.9 48829 1994 5218.1 9572.7 19480.7 2964.7 119850 29242.2 55043

多重共线性题目的检验和处理

山西大学 实 验 报 告 实验报告题目:多重共线性问题的检验和处理 学 院: 专 业: 课程名称: 计量经济学 学 号: 学生姓名: 教师名称: 崔海燕 上课时间: 题电源备,检查料试卷资料试

一、实验目的: 熟悉和掌握Eviews在多重共线性模型中的应用,掌握多重共线性问题的检 验和处理。 二、实验原理:1、综合统计检验法; 2、相关系数矩阵判断; 3、逐步回归法; 三、实验步骤: (一)新建工作文件并保存 打开Eviews软件,在主菜单栏点击File\new\workfile,输入start date 1978和end date 2006并点击确认,点击save键,输入文件名进行保存。 (二)输入并编辑数据 在主菜单栏点击Quick键,选择empty\group新建空数据栏,根据理论和 经验分析,影响粮食生产(Y)的主要因素有农业化肥施用量(X1)、粮食播种面 积(X2)、成灾面积(X3)、农业机械总动力(X4)和农业劳动力(X5),其中成灾 面积的符号为负,其余均应为正。下表给出了1983——2000中国粮食生产的相关 数据。点击name键进行命名,选择默认名称Group01,保存文件。 Y X1X2X3X4X5 1983387281660114047162091802231151 1984407311740112884152641949730868 1985379111776108845227052091331130 1986391511931110933236562295031254 1987402081999111268203932483631663 1988394082142110123239452657532249 1989407552357112205244492806733225 1990446242590113466178192870838914 1991435292806112314278142938939098 1992442642930110560258953030838669 1993456493152110509231333181737680 1994445103318109544313833380236628 1995466623594110060222673611835530 1996504543828112548212333854734820 1997494173981112912303094201634840 1998512304084113787251814520835177 1999508394124113161267314899635768 2000462184146108463343745257436043 2001452644254106080317935517236513 2002457064339103891273195793036870 200343070441299410325166038736546

计量经济学中多重共线性案例问题研究报告方案

计量经济学中多重共线性案例问题研究 摘要:本论文主要通过案例来研究计量经济学中的多重共线性的问题,对案例进行EVIEWS分析,并利用诊断共线性的经验方法及修正共线性的经验方法和通过EVIEWS分析对案例中的多重共线性进行诊断与修正,以能够完成减弱多重共线性的目标。 关键字:多重共线性诊断共线性的经验方法修正共线性的经验方法经典的线性回归模型的假定之一是各解释变量X之间不存在多重共线性。然而,在计量经济学中所说的多重共线性(mnlti-collinearity),不仅包含解释变量之间精确的线性关系,还包含解释变量之间近似的线性关系。下面来通过研究国内生产总值的增加会影响财政收入的增加还是减少的案例对多重共线性进行研究。 一、研究的目的和要求 国内生产总值GDP按照支出法的公式为:国内生产总值=消费+投资+政府购买支出+净出口,而财政收入的主要来源为各项税收收入如增值税等。只有经济持续的增长,才能提供稳定的税收来源。所以,影响财政收入的主要因素是税收收入。但是,税收收入还影响着国内生产总值。因此,为了中国未来经济的发展,需要定量的分析影响中国财政收入的因素。 二、模型设定及其估计 经过研究与分析,影响财政收入的主要因素,除了税收收入以外,还有与一些其他因素有关。为此,考虑的影响因素主要有财政支出CZZC/亿元用X2表示,国内生产总值GDP/亿元用X3表示,税收总额SSZE/亿元用X4表示。各影响变量与财政收入之间呈现正相关。因此设定了如下形式的计量经济模型来研究“国内生产总值的增加会减少财政收入吗”这个问题: Y t=β1+β2X2t+β3X3t+β4X4t+μt 式中,Yt为第t年国内财政收入(亿元);X2为财政支出(亿元);X3为国内生产总值(亿元);X4为税收总额(亿元)。各解释变量前的回归系数预期都大于0. 为估计模型参数,1985~2011年阶段财政收入的统计数据,如下表:

实验六多元线性回归和多重共线性

实验六多元线性回归和多重共线性 姓名:何健华 学号:201330110203 班级:13金融数学2班 一 实验目的: 掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二 实验要求: 应用教材P140例子4.3.1案例做多元线性回归模型,并识别和修正多重共线性。 三 实验原理: 普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。 四 预备知识: 最小二乘法估计的原理、t 检验、F 检验、R 2值。 五 实验步骤: 有关的研究分析表明,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出外,还可能与基础设施有关。因此考虑影响国内旅游收入Y (单位为亿元)的以下几个因素:国内旅游人数X1、城镇居民人均旅游支出X2(单位为元)、农村居民人均旅游支出X3(单位为元)、并以公路里程X4(单位为万公里)和铁路里程X5(单位为万公里)作为相关设施的代表,根据这些变量建立如下的计量经济模型: 01122334455y x x x x x ββββββμ=++++++ 为了估计上述模型,从《中国统计年鉴》收集到1994年到2003年的有关统计数据。 Year Y X1 X2 X3 X4 X5 1994 1023.5 52400 414.7 54.9 111.78 5.9 1995 1375.7 62900 464 61.5 115.7 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.6 1998 2391.2 69450 607 197 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.8 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200 180.98 7.3 1、 请用普通最小二乘方法估计模型参数; 2、 检验模型是否存在多重共线性,如果存在共线性,试采用适当的方法消除共线性。

计量经济学Eviews多重共线性实验报告记录

计量经济学Eviews多重共线性实验报告记录

————————————————————————————————作者:————————————————————————————————日期:

实验报告 课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期:2014 年05 月11日

广东商学院教务处制 姓名实验报告成绩 评语: 指导教师(签名) 年月日

说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。 四、预备知识:最小二乘法估计的原理、t检验、F检验、2 R值。 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据 年份 能源消费 国民 总收入 国内生 产总值 工业 增加值 建筑业 增加值 交通运输邮电 增加值 人均生活 电力消费 能源加工 转换效率 y X1 X2 X3 X4 X5 X6 X7 1985766829040.7 9016 3448.7 417.9 406.9 21.3 68.29 198680850 10274.4 10275.2 3967 525.7 475.6 23.2 68.32 198786632 12050.6 12058.6 4585.8 665.8 544.9 26.4 67.48 198892997 15036.8 15042.8 5777.2 810 661 31.2 66.54 198996934 17000.9 16992.3 6484 794 786 35.3 66.51 199098703 18718.3 18667.8 6858 859.4 1147.5 42.4 67.2 1991103783 21826.2 21781.5 8087.1 1015.1 1409.7 46.9 65.9 1992109170 26937.3 26923.5 10284.5 1415 1681.8 54.6 66.00 1993115993 35260 35333.9 14188 2266.5 2205.6 61.2 67.32 1994122737 48108.5 48197.9 19480.7 2964.7 2898.3 72.7 65.2 1995131176 59810.5 60793.7 24950.6 3728.8 3424.1 83.5 71.05 1996138948 70142.5 71176.6 29447.6 4387.4 4068.5 93.1 71.5 1997137798 77653.1 78973 32921.4 4621.6 4593 101.8 69.23 1998132214 83024.3 84402.3 34018.4 4985.8 5178.4 106.6 69.44 1999133831 88189 89677.1 35861.5 5172.1 5821.8 118.2 69.19 2000138553 98000.5 99214.6 40033.6 5522.3 7333.4 132.4 69.04 2001143199 108068.2 109655.2 43580.6 5931.7 8406.1 144.6 69.03 2002151797 119095.7 120332.7 47431.3 6465.5 9393.4 156.3 69.04 2003174990 135174 135822.8 54945.5 7490.8 10098.4 173.7 69.4 2004203227 159586.7 159878.3 65210 8694.3 12147.6 190.2 70.71 2005223319 183956.1 183084.8 76912.9 10133.8 10526.1 216.7 71.08 2006 246270 213131.7 211923.5 91310.9 11851.1 12481.1 249.4 71.24

相关文档
最新文档