多重共线性习题

多重共线性习题
多重共线性习题

多重共线性

习 题

一、单项选择题

1.如果回归模型中解释变量之间存在完全的多重共线性,则最小二乘估计量( )

A.不确定,方差无限大

B.确定,方差无限大

C.不确定,方差最小

D.确定,方差最小

2.多元线性回归模型中,发现各参数估计量的t 值都不显著,但模型的

,)(22很大或R R F 值确很显著,这说明模型存在( )

A .多重共线性

B .异方差

C .自相关

D .设定偏误 3.逐步回归法既检验又修正了( )

A .异方差性 B.自相关性 C .随机解释变量 D.多重共线性

4.如果模型中的解释变量存在完全的多重共线性,参数的最小二乘估计量是( )

A .无偏的 B. 有偏的 C. 不确定 D. 确定的 5.设线性回归模型为01122i i i i Y X X u βββ=+++,下列表明变量之间具有完全多重共线性的是( )

A .1202*0*0i i X X ++=

B .1202*0*0i i X X v +++=

C .1200*0*0i i X X ++=

D .1200*0*0i i X X v +++= 其中v 为随机误差项

6.简单相关系数矩阵方法主要用于检验( )

A .异方差性 B.自相关性 C .随机解释变量 D.多重共线性 7.设21,x x 为解释变量,则完全多重共线性是( )

221211211

.0.0

21

.

0(.0

2x x A x x B x e C x x v v D x e +==++=+=为随机误差项)

8.下列说法不正确的是( )

A. 多重共线性产生的原因有模型中大量采用滞后变量

B. 多重共线性是样本现象

C. 检验多重共线性的方法有DW检验法

D. 修正多重共线性的方法有增加样本容量

二、多项选择题

1.能够检验多重共线性的方法有()

A. 简单相关系数矩阵法

B. t检验与F检验综合判断法

C. DW检验法

D. ARCH检验法

E. White 检验

2.如果模型中解释变量之间存在共线性,则会引起如下后果()

A. 参数估计值确定

B. 参数估计值不确定

C. 参数估计值的方差趋于无限大

D. 参数的经济意义不正确

E. DW统计量落在了不能判定的区域

3.能够检验多重共线性的方法有()

A. 简单相关系数矩阵法

B. DW检验法

C. t检验与F检验综合判断法

D. ARCH检验法

E. 辅助回归法(又待定系数法)

三、判断题

1.多重共线性问题是随机扰动项违背古典假定引起的。

2.解释变量与随机误差项相关,是产生多重共线性的主要原因。

3.在模型中引入解释变量的多个滞后项容易产生多重共线性。

四、问答题

1.下面结果是利用某地财政收入对该地第一、二、三产业增加值的回归结果。根据这一结果试判断该模型是否存在多重共线性,说明你的理由。

Dependent Variable: REV

Method: Least Squares

Sample: 1 10

Included observations: 10

Variable Coefficient Std. Error t-Statistic Prob.

C 17414.63 14135.10 1.232013 0.2640

GDP1 -0.277510 0.146541 -1.893743 0.1071

GDP2 0.084857 0.093532 0.907252 0.3992

GDP3

0.190517 0.151680 1.256048 0.2558 R-squared

0.993798 Mean dependent var 63244.00 Adjusted R-squared 0.990697 S.D. dependent var 54281.99 S.E. of regression 5235.544 Akaike info criterion 20.25350 Sum squared resid 1.64E+08 Schwarz criterion 20.37454 Log likelihood -97.26752 F-statistic 320.4848 Durbin-Watson stat

1.208127 Prob(F-statistic)

0.000001

2.克莱因与戈德伯格曾用1921-1950年(1942-1944年战争期间略去)美国国内消费Y 和工资收入X1、非工资—非农业收入X2、农业收入X3的时间序列资料,利用OLSE 估计得出了下列回归方程(括号中的数据为相应参数估计量的标准误):

2?8.133 1.05910.45220.1213 (8.92) (0.17) (0.66) (1.09)

0.95 107.37Y

X X X R F =+++==

试对上述模型进行评析,指出其中存在的问题。

习题答案

一、单项选择题

1.A 2.A 3.D 4.C 5.A 6.D 7.A 8.C

二、多项选择题

1.AB 2. BCD 3.ACE

三、判断题

1.答:错误。应该是解释变量之间高度相关引起的。

2.答:错误。产生多重共线性的主要原因是:(1)许多经济变量在时间上有共同变动的趋势;(2)解释变量的滞后值作为解释变量在模型中使用。 3.答:正确。在分布滞后模型里多引进解释变量的滞后项,由于变量的经济意义一样,只是时间不一致,所以很容易引起多重共线性。

四、问答题

1.答:存在严重多重共线性。因为方程整体非常显著,表明三次产业GDP 对财政收入的解释能力非常强,但是每个个别解释变量均不显著,且存在负系数,与

理论矛盾,原因是存在严重共线性。

2.答:从模型拟合结果可知,样本观测个数为27,消费模型的判定系数95.02

=R ,

F 统计量为107.37,在0.05置信水平下查分子自由度为3,分母自由度为23的F 临界值为3.03,计算的F 值远大于临界值,表明回归方程是显著的。模型整体拟合程度较高。

依据参数估计量及其标准误,可计算出各回归系数估计量的t 统计量值:

01238.133

1.059

0.91, 6.23,8.920.170.4520.1210.68,

0.11

0.66 1.09t t t t =

==

===== 除1t 外,其余的j t

值都很小。工资收入X1的系数的t 检验值虽然显著,但

该系数的估计值过大,该值为工资收入对消费边际效应,因为它为1.059,意味着工资收入每增加一美元,消费支出的增长平均将超过一美元,这与经济理论和常识不符。另外,理论上非工资—非农业收入与农业收入也是消费行为的重要解释变量,但两者的t 检验都没有通过。这些迹象表明,模型中存在严重的多重共线性,不同收入部分之间的相互关系,掩盖了各个部分对解释消费行为的单独影响。

(完整版)多重共线性检验与修正.doc

问题: 选取粮食生产为例,由经济学理论和实际可以知道,影响粮食生产y 的因素有:农业化肥施 用量x1,粮食播种面积x2,成灾面积x3,农业机械总动力x4,农业劳动力x5,由此建立以下方程: y=β0+β1x1+β2x2+β3x3+β4x4+β5x5,相关数据如下: 解: 1、检验多重共线性 (1)在命令栏中输入: ls y c x1 x2 x3 x4 x5,则有; 可以看到,可决系数R2 和 F 值都 很高,二自变量x1 到 x5 的 t 值 均较小,并且x4 和 x5 的 t 检验 不显著,说明方程很可能存在多 重共线性。 (2)对自变量做相关性分析: 将x1—— x5 作为组打开, view —— covariance analysis—— correlation ,结果如下: 可以看到x1 和 x4 的相关系数 为 0.96,非常高,说明原模型 存在多重共线性

2、多重共线性的修正 (1)逐步回归法 第一步:首先确定一个基准的解释变量,即从 x1, x2, x3, x4, x5 中选择解释 y 的最好的一个建 立基准模型。分别用 x1, x2, x3, x4, x5 对 y 求回归,结果如下: 从上面 5 个输出结果可以知道,y 对 x1 的可决系数R2=0.89(最高),因此选择 第一个方程作为基准回归模型。即: Y = 30867.31062 + 4.576114592* x1 在基准模型的基础上,逐步将x2, x3 等加入到模型中, 加入 x2,结果:

拟合优度R2=0.961395 ,显著提高; 并且参数符号符合经济常识,且均显著。 所以将模型修改为: Y= -44174.52+ 4.576460*x1+ 0.672680*x2 再加入 x3,结果: 拟合优度R2=0.984174 ,显著提高; 并且参数符号符合经济常识(成灾面积越大,粮食产 量越低),且均显著。 所以将模型修改为: Y=-12559.35+5.271306*x1+0.417257*x2-0.212103*x3 再加入 x4,结果: 拟合优度R2=0.987158 ,虽然比上一次拟 合提高了; 但是变量x4 的系数为 -0.091271 ,符号不 符合经济常识(农业机械总动力越高, 粮食产量越高),并且 x4 的 t 检验不显著。 因此应该从模型中剔除x4。

多重共线性回归分析及其实验报告

实验报告 实验题目:多重共线性的研究指导老师: 学生一: 学生二: 实验时间:2011年10月

多重线性回归分析及其实验报告 实验目的:为了更好地了解财政收入构成,需要定量地分析影响财政收入的因素 模型设定及其估计:经分析,影响财政收入的主要因素,农业增加值X1,工业增加值X2,建筑业增加值X3,总人口X4,受灾面积X5.为此设定了如下形式的计量经济模型: Y=β 1+β 2 X1+β 3 X2+β 4 X3+β 5 X4+β 6 X5+u0 其中,Y为财政收入(元),X1农业增加值(元),X2为工业增加值(元),X3为建筑业增加值(元),X4为总人口(万人),X5为受灾面积(千公顷) 为估计模型参数,收集1978~2007年财政收入及其影响因素数据,如图: 1978~2007年财政收入及其影响因素数据 年份 财政收入CS/亿 元 农业增加值 NZ/亿元 工业增加值 GZ/亿元 建筑业增加 值JZZ/亿元 总人口 TPOP/万 人 受灾面积 SZM/千公顷1978 1132.3 1027.5 1607 138.2 96259 50790 1979 1146.6 1270.2 1769.7 143.8 97542 39370 1980 1159.9 1371.4 1996.5 195.5 98705 44526 1981 1175.8 1559.5 2048.5 207.1 100072 39790 1982 1212.3 1777.4 2162.3 220.7 101654 33130 1983 1367 1978.5 2375.8 270.6 103008 34710 1984 1642.5 2316.1 2789 316.7 104357 31890 1985 2004.6 2564.3 3448.5 417.9 105851 44365 1986 2122 2788.7 3987.5 525.7 107507 47170 1987 2199.4 3233 4565.9 665.8 109300 42090 1988 2357.6 3865.4 5062 810 111026 50870 1989 2664.5 5062 8087.3 794 112704 46991 1990 2937.4 5342.3 10284.5 859.4 114333 38474

计量经济学Eviews多重共线性实验报告

计量经济学E v i e w s多重共线性实验报告 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

实验报告课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期: 2014 年 05 月 11日 广东商学院教务处制 姓名实验报告成绩 评语: 指导教师(签名) 年月日 说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。

四、预备知识:最小二乘法估计的原理、t检验、F检验、2R值。 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据

资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。 为分析Y 与X1、X2、X3、X4、X5、X6、X7之间的关系,做如下折线图: 能源消费Y 在1986到1996年间缓慢增长,在96至98年有短暂的下跌,但是98至02年开始缓慢回升,02年到06年开始快速增长。 国民总收入X1和国内生产总值X2以相同的趋势逐年缓慢增长。 工业增加值X3在1985年-1999年期间一直是缓慢增长,但在2000年出现了急剧下降的现象,2001年又急剧增长,达到下降前的水平,2001年以后开始缓慢增长。建筑业增长值x4、交通运输邮电业增加值x5、人均生活电力消费x6、能源加工转换效率x7数值较低,但都以较平缓的方式增长。 2、设定并估计多元线性回归模型 t t t t t t t u X X X X X Y ++++++=66554433221ββββββ () 录入数据,得到图。 2.2.1)采用OLS 估计参数 在主界面命令框栏中输入 ls y c x1 x2 x3 x4 x5 x6 x7回车,即可得到参数的估计结果。 由此可见,该模型的可决系数为,修正的可决系数为,模型拟和很好,F 统计量为,回归方程整体上显着。 可是其中的lnX3、lnX4、lnX6对lnY 影响不显着,不仅如此,lnX2、lnX5的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。 3、多重共线性模型的识别

计量经济学多元线性回归、多重共线性、异方差实验报告记录

计量经济学多元线性回归、多重共线性、异方差实验报告记录

————————————————————————————————作者:————————————————————————————————日期:

计量经济学实验报告

多元线性回归、多重共线性、异方差实验报告 一、研究目的和要求: 随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到亿人次,同比增长%,国内旅游收入万亿元,同比增长%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。 影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。 二、模型设定 根据以上的分析,建立以下模型 Y=β 0+β 1 X 1 +β 2 X 2 +β 3 X 3 +β 4 X 4 +Ut 参数说明: Y ——旅游景区营业收入/万元 X 1 ——旅游业从业人员/人 X 2 ——旅游景区固定资产/万元 X 3 ——旅游外汇收入/万美元 X 4 ——城镇居民可支配收入/元

多重共线性的检验与修正

计量经济学实验报告成绩 课程名称计量经济学指导教师苏卫东实验日期 2014-6-24 院(系)财政与金融学院专业班级金融二专实验地点实验楼八机房 学生姓名单一芳学号 201212041018 同组人无 实验项目名称多重共线性的检验与修正 一、实验目的和要求 1、理解多重共线性的含义与后果 2、掌握Eviews软件的操作和多重共线性的检验与修正 二、实验原理 Eviews软件的操作和多重共线性的检验修正方法 三、主要仪器设备、试剂或材料 Eviews软件,计算机 四、实验方法与步骤 1、准备工作:建立工作文件,并输入数据 CREATE A 1974 1981; DATA Y X1 X2 X3 X4 X5 2、OLS估计: LS Y C X1 X2 X3 X4 X5; 3、计算简单相关系数 COR X1 X2 X3 X4 X5 4、多重共线性的解决 LS Y C X1; LS Y C X2; LS Y C X3; LS Y C X4; LS Y C X5;

LS Y C X1 X3; LS Y C X1 X3 X2; LS Y C X1 X3 X4; LS Y C X1 X3 X5 五、实验数据记录、处理及结果分析 1、建立工作组,输入以下数据: obs Y X1 X2 X3 X4 X5 1974 98.45 560.2 153.2 6.53 1.23 1.89 1975 100.7 603.11 190 9.12 1.3 2.03 1976 102.8 668.05 240.3 8.1 1.8 2.71 1977 133.95 715.47 301.12 10.1 2.09 3 1978 140.13 724.27 361 10.93 2.39 3.29 1979 143.11 736.13 420 11.85 3.9 5.24 1980 146.15 748.91 497.16 12.28 5.13 6.83 1981 144.6 760.32 501 13.5 5.47 8.36 1982 148.94 774.92 529.2 15.29 6.09 10.07 1983 158.55 785.3 552.72 18.1 7.97 12.57 1984 169.68 795.5 771.16 19.61 10.18 15.12 1985 162.14 804.8 811.8 17.22 11.79 18.25 1986 170.09 814.94 988.43 18.6 11.54 20.59 1987 178.69 828.73 1094.65 23.53 11.68 23.37 2、OLS估计 LS Y C X1 X2 X3 X4 X5 Dependent Variable: Y Method: Least Squares Date: 06/24/14 Time: 18:45 Sample: 1974 1987 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C -3.650950 30.00144 -0.121692 0.9061 X1 0.125752 0.059087 2.128275 0.0660 X2 0.072656 0.037445 1.940317 0.0883 X3 2.681426 1.258639 2.130418 0.0658 X4 3.405866 2.444896 1.393052 0.2011 X5 -4.430561 2.194164 -2.019248 0.0781 R-squared 0.970397 Mean dependent var 142.7129

多重共线性 多重共线性实验案例与独立实验问题

实验五 多重共线性模型的检验与处理(1) 一、研究的目的要求 近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。 二、模型设定及其估计 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数2X ,城镇居民人均旅游支出3X ,农村居民人均旅游支出4X ,并以公路里程5X 和铁路里程6X 作为相关基础设 施的代表。为此设定了如下对数形式的计量经济模型: 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中 :t Y ——第t 年全国旅游收入 2X ——国内旅游人数 (万人) 3X ——城镇居民人均旅游支出 (元) 4X ——农村居民人均旅游支出 (元) 5X ——公路里程(万公里) 6X ——铁路里程(万公里) 为估计模型参数,收集旅游事业发展最快的1994—2003年的统计数据,如表4.2所示: 利用Eviews 软件,输入Y 、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS 回归,结果如表4.3: 表4.3

由此可见,该模型9954.02=R ,9897.02 =R 可决系数很高,F 检验值173.3525,明 显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检 验不显著,而且6X 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵(如表4.4): 表4.4 由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。 三、消除多重共线性 采用逐步回归的办法,去检验和解决多重共线性问题。分别作Y 对X2、X3、X4、X5、X6的一元回归,结果如表4.5所示: 表4.5

多重共线性

城乡居民消费水平研究 —解决多重共线性 一、文献综述 长期以来,我国处于商品短缺的困扰之中,不得不采用配给制的办法限制居民的消费选择自由;随着供求关系的变化,人们的消费取向正在发生根本改变。因此,了解目前城乡居民的消费水平以及其影响因素对于把握国内不同群体消费需求的变化,指导生产、引导消费、开拓市场、发展循环经济、建立和谐社会具有重要意义。 影响消费的因素很多,如价格水平、利率水平、收入水平、消费偏好、家庭财产、风俗习惯、制度模式等。其中,收入是影响消费的最重要因素。改革开放以来,我国居民的收入水平在不断提高,居民消费情况也有明显变化。在居民总体收入逐渐增加的同时,居民的收入差距也有所扩大,形成了高、中、低不同阶层的收入与消费群体。根据国家统计局的调查资料显示,不同消费群体之间的消费与投资倾向已有很大差异,受此影响,社会消费结构也已发生了较大变化。如今生活宽裕的高收入居民,十分关注生活质量的提高,消费倾向也出现明显变化,投资意识日益高涨。调查显示,越来越多的高收入居民,在消费时追求精神消费和服务消费,教育、文化、通信、保健、住宅等成为消费热点,追求时尚化与个性化日趋明显。高收入家庭的投资是社会民间投资中极为重要的部分,在国民经济运行中的作用不可低估. 中等收入群体占到城镇家庭总数的60%以上,收入占到居民收入总数的50%多,是我国消费的主体部分,他们的消费行为对我国整体消费状况的影响是最大的,对这一层次居民消费的启动将直接关系到我国经济启动的成败。这一消费群体的消费特征表现为对未来收入与支出不良预期的影响.所以基于这个问题的重要性,决定研究城乡居民的消费水平及其影响因素。 二、数据资料初步分析 数据的收集来源于2009年中华人民共和国国家统计局公布的年度数据,并选取城乡居民消费水平、城乡居民家庭人均可支配收入、职工平均工资、人均国内生产总值、城乡居民消费价格指数、城乡新建住房面积来研究其对城镇居民消费水平的影响。通过初步的线性回归发行这些数据都能较好的解释城镇居民消费水平。由于财富数据较难取得,所以用城乡新建住房面积来表示这一指标,并且取得较好的效果。所以将以上6个指标定位解释变量。其中城乡居民家庭人收入为城镇居民家庭人均可支配收入与农村居民家庭人均纯收入之和。

计量经济学Eviews多重共线性实验报告

实验报告 课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期: 2014 年 05 月 11日

广东商学院教务处制姓名实验报告成绩 评语: 指导教师(签名)

年月日 说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。 R值。 四、预备知识:最小二乘法估计的原理、t检验、F检验、2 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据

资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。 为分析Y 与X1、X2、X3、X4、X5、X6、X7之间的关系,做如下折线图: 能源消费Y 在1986到1996年间缓慢增长,在96至98年有短暂的下跌,但是98 至02年开始缓慢回升,02年到06年开始快速增长。 国民总收入X1和国内生产总值X2以相同的趋势逐年缓慢增长。 工业增加值X3在1985年-1999年期间一直是缓慢增长,但在2000年出现了急剧下降的现象,2001年又急剧增长,达到下降前的水平,2001年以后开始缓慢增长。建筑业增长值x4、交通运输邮电业增加值x5、人均生活电力消费x6、能源加工转换效率x7数值较低,但都以较平缓的方式增长。 2、设定并估计多元线性回归模型 t t t t t t t u X X X X X Y ++++++=66554433221ββββββ (2.1) 2.1录入数据,得到图。

(整理)多重共线性的检验与修正

附件二:实验报告格式(首页) 山东轻工业学院实验报告成绩 课程名称计量经济学指导教师实验日期 2013-5-25 院(系)商学院专业班级实验地点二机房 学生姓名学号同组人无 实验项目名称多重共线性的检验与修正 一、实验目的和要求 掌握Eviews软件的操作和多重共线性的检验与修正 二、实验原理 Eviews软件的操作和多重共线性的检验修正方法 三、主要仪器设备、试剂或材料 Eviews软件,计算机 四、实验方法与步骤 (1)准备工作:建立工作文件,并输入数据: CREATE EX-7-1 A 1974 1981; TATA Y X1 X2 X3 X4 X5 ; (2)OLS估计: LS Y C X1 X2 X3 X4 X5; (3)计算简单相关系数 COR X1 X2 X3 X4 X5 ; (4)多重共线性的解决 LS Y C X1; LS Y C X2; LS Y C X3; LS Y C X4; LS Y C X5; LS Y C X1 X3; LS Y C X1 X3 X2; LS Y C X1 X3 X4; LS Y C X1 X3 X5; 五、实验数据记录、处理及结果分析 (1)建立工作组,输入以下数据: 98.45 560.20 153.20 6.53 1.23 1.89 100.70 603.11 190.00 9.12 1.30 2.03 102.80 668.05 240.30 8.10 1.80 2.71 133.95 715.47 301.12 10.10 2.09 3.00 140.13 724.27 361.00 10.93 2.39 3.29

多重共线性的几点认识

多重共线性: 可分为完全多重共线性和近似多重共线性“或称高度相关性” 检验多重共线性问题是否严重: 1.若回归模型的R2值高(如>0.8),或F检验值显著,但单个解释变 量系数估计值却不显著; 2.若两个解释变量之间的相关系数高,比如说大于0.8,则可以认为 存在严重的共线性。 对多重共线性本质的认识: 1.多重共线性是由变量之间的性质引起的:这一认识沿袭了传统经 济计量学对多重共线性的认识,而现代经济计量学否定了这一认识; 不管数据以什么形式取得,数据取样是大是小,都会出现解释变量间高度相关问题。 2.多重共线性是数据问题引起的:指即使总体诸解释变量没有线性关系, 但在具体样本中仍可能有线性关系。当n=2时,两点总能连成一条直线,即时,使性质上原本并不存在线性关系的两个变量,由于样本数据问题产生了共线性;时序解释变量之间几乎肯定会出现谬回归,必然导致多重共线性。 线性回归模型解释变量间存在多重共线性可能产生如下后果: 1.增大最小二乘估计量的方差; 2.参数估计值不稳定,对样本变化敏感; 3.检验可靠性降低,产生弃真错误。由于参数估计量方差增大,在进 行显著性检验时,t检验值将会变小,可能使某些本该参数显著的检

验结果变得不显著,从而将重要变量舍弃。 多重共线性的修正: 若多重共线性程度较轻微,并不严重影响系数估计值(符号正确,t 值显著),则可以忽略多重共线性问题。 1.删除不必要的变量 2.改变解释变量的形式:差分法,对于时间序列数据而言,若原始 变量存在严重的多重共线性,则可以考虑对变量取差分形式,可在一定程度上降低多重共线性的程度 3.当模型中有较多解释变量的滞后值,并存在严重共线性时,可以 考虑用被解释变量的滞后值代替解释变量的滞后值;以人均形式的变量代替总体变量在某些状况下也可以在一定程度上降低多重共线性的程度

计量经济学多重共线性

2014-8-8 商学院 王中昭 教学内容 一、多重共线性 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验 五、克服多重共线性的办法和实例 §4.3 多重共线性

2014-8-8商学院 王中昭 对于模型Y i =β0+ β1x 1i + β2x 2i +…… βk x ki +μi 如果某两个或多个解释变量之间出现相关性,即:C 1x 1i +C 2X 2i +……C k X ki =0 其中C i 不全为0,即某一个解释变量是其他解释变量的线性组合,则称为完全多重共线性。 完全多重共线性的情况并不多见,一般是出现不同程度的多重共线性。 注意多重共线性不 是指因变量与解释 一、多重共线性概念

2014-8-8商学院 王中昭 Y=Xβ+μ完全共线性:∣X′X ∣=0,(X′X)-1不存在, 使B ^=(X′X)-1X′Y 无法求解。 例如:, 0)(0020 1631084104213211 x x x 3213322113 21≠'=+-=++??????? ??=X X x x x X i i i i i i x c x c x c 这里,完全多重共线性

2014-8-8商学院 王中昭完全多重共线性的情况不多,一般出现不同程度的多重共线性。 多重共线性:∣X′X∣≈0,(X′X)-1存在,但 (X′X)-1主对角线上的元素很大。 ????? ?='≈'?≈+??????? ??=400300000300000100040030000030000010002100010004X)X ( ,0)( 0,0x x - x 199 .2993001001.4004001099.1992001101.1001001 x x x 1 -3i 2i 1i 3 21||这里,X X X 近似多重共线性

计量经济学多元线性回归、多重共线性、异方差实验报告概要

计量经济学实验报告

多元线性回归、多重共线性、异方差实验报告 一、研究目的和要求: 随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到30.0亿人次,同比增长13.6%,国内旅游收入2.3万亿元,同比增长19.1%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。 影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。 二、模型设定 根据以上的分析,建立以下模型 Y=β 0+β1X 1 +β2X 2 +β 3 X 3 +β 4 X 4 +Ut 参数说明: Y ——旅游景区营业收入/万元 X 1 ——旅游业从业人员/人 X 2 ——旅游景区固定资产/万元 X 3 ——旅游外汇收入/万美元 X 4 ——城镇居民可支配收入/元

统计学第五次实验-多重共线性实验报告

多重共线性实验报告 实验内容:影响粮食生产的主要因素有农作物播种面积,农用化肥施用量、农业机械总动力、农业灾害成灾面积、有效灌溉面积。根据下列相关数据,建立中国粮食生产函数。 实验目的:估计农作物播种面积,农用化肥施用量、农业机械总动力、农业灾害成灾面积、有效灌溉面积对粮食产量的多重共线性,建立方程并对方程进行检验。 实验数据: 粮食产量(万吨)农作物播种 面积(千公 顷) 农用化肥 施用量(万 吨) 农业机械总动 力(万千瓦) 农业灾害成 灾面积(千 公顷) 有效灌溉 面积(千公 顷) 1984 40730.5 144221.3 1739.8 19497.19 15607 44453 1985 37910.8 143625.9 1775.8 20912.51 22705.333 44035.9 1986 39151.2 144204 1930.6 22950.00 23656 44225.8 1987 40297.7 144956.5 1999.3 24836.00 20392.667 44403 1988 39408.1 144868.9 2141.5 26575.00 24502.667 44375.9 1989 40754.9 146553.9 2357.1 28067.00 24449 44917.2 1990 44624.3 148362.3 2590.3 28707.70 17819 47403.1 1991 43529.3 149585.8 2805.1 29388.60 27814 47822.1 1992 44265.8 149007.1 2930.2 30308.40 25859 48590.1 1993 45648.8 147740.7 3151.9 31816.60 23133 48727.9 1994 44510.1 148240.6 3317.9 33802.50 31383 48759.1 1995 46661.8 149879.3 3593.7 36118.05 22267 49281.2 1996 50453.5 152380.6 3827.9 38546.90 21233 50381.4 1997 49417.1 153969.2 3980.7 42015.60 30309 51238.5 1998 51229.53 155705.7 4083.7 45207.71 25181 52295.6 1999 50838.58 156372.8 4124.32 48996.12 26731 53158.41 2000 46217.52 156299.85 4146.412 52573.61 34374 53820.33 2001 45263.67 155707.86 4253.763 55172.10 31793 54249.391 2002 45705.75 154635.51 4339.39 57929.85 27318.9 54354.8 2003 43069.53 152414.96 4411.56 60386.54 32516.3 54014.23 实验过程: 1.做出散点图,打开eviews,并把1984年到2003年全国粮食产量及相关值的数据输入表中,建立y和x1,x2,x3,x4,x5。在命令窗口输入”ls y c x1 x2 x3 x4 x5”,单击回车,这是运用的最小二乘法估计该模型。

多重共线性

第六章 6.6 (1)判断多重共线性 做y 与x1,x2,x3,x4x5,x6的线性回归方程,得到 由表中的VIF 值可知x1,x2,x3,x4,x5的方差膨胀因子远大于10,这几个变量之间存在很高的线性相关性,说明回归方程存在多重共线性。 (2)逐步回归法 得到回归方程:215^ 353.0611.0637.06.874x x x y --+= 方程通过了三大检验。 其中,x1为农业,x2为工业,x5为社会消费总额,由方程表明农业每增加一亿元,财政收入减少0.611亿元;工业每增加一亿元,财政收入减少0.353亿元;社会消费总额每增加一亿元,财政收入增加0.637亿元。结合实际可看出该回归方程不合理。 由表中的VIF 值可知三个自变量的方差膨胀因子远大于10,说明逐步回归法得到的回归方程仍然存在多重共线性。 (3)VIF 后退法 由(1)判断得知原方程存在严重的多重共线性,要消除多重共线性利用VIF 后退法。 首先剔除VIF 值最大的自变量x2,得到

由表中的VIF 值可知除x6外其他自变量的方差膨胀因子仍然大于10 ,方程仍存在多重共线性。 再剔除VIF 值最大的自变量x5,得到 由表中的VIF 值可知除x6外其他自变量的方差膨胀因子仍然大于10,方程仍存在多重共线性。 再剔除VIF 值最大的自变量x1,得到 由表中的VIF 值可知剩余自变量的方差膨胀因子都小于10,说明方程的多重共线性已消除。 所以得到回归方程:643^ 004.0.031.0359.1332.2296 x x x y +++-= 方程通过了R 检验和F 检验,但是x6没有通过t 检验,说明不显著,所以剔除x6,得到

多重共线性案例分析实验报告

《多重共线性案例分析》实验报告

表2 由此可见,该模型,可决系数很高,F 检验值 173.3525,明显显著。但是当时,不仅、 系数的t 检验不显著,而且系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 9954.02=R 9897.02 =R 05.0=α776 .2)610()(025.02=-=-t k n t α2X 6X 6X

②.计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵 表3 由关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性相。 4.消除多重共线性 ①采用逐步回归的办法,去检验和解决多重共线性问题。 分别作Y 对X2、X3、X4、X5、X6的一元回归 如下图所示 变量 X2 X3 X4 X5 X6 参数估计值 0.0842 9.0523 11.6673 34.3324 2014.146 t 统计量 8.6659 13.1598 5.1967 6.4675 8.7487 0.9037 0.9558 0.7715 0.8394 0.9054 表4 按的大小排序为:X3、X6、X2、X5、X4。 以X3为基础,顺次加入其他变量逐步回归。首先加入X6回归结果为: t=(2.9086) (0.46214) 2R 2 R 6 31784.285850632.7639.4109?X X Y t ++-=957152.02 =R

1995 1375.7 62900 464.0 61.5 115.70 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.60 1998 2391.2 69450 607.0 197.0 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.80 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200.0 180.98 7.30 表1:1994年—2003年中国游旅收入及相关数据

多重共线性

第六章 多重共线性问题 一、 实验目的 熟练使用EViews 软件进行计量分析,理解多重共线性的检验和估计的基本方法。 二、 基本知识点: 多重共线性的基本概念,多重共线性的后果,检验是否存在的基本方法——样本决定系数检验、参数估计值的经济检验和参数估计值的统计检验,多重共线性的解决办法——逐步回归法。 三、 实验内容及要求: 依据经济学理论,以实际数据(实验数据五)为基础,①建立反映天津市粮食市场需求状况的粮食需求函数。②检验所建立的粮食需求函数是否存在多重共线性。③如果存在多重共线性,使用恰当的方法加以解决。 四、 实验指导: 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数X1,城镇居民人居旅游支出X2、农村居民人均旅游支出X3、公路里程X4和铁路里程X5。为此设定如下的对数形式的计量经济模型:t t t t t t t X X X X X Y μββββββ++++++=54321543210 Y t ——第年全国旅游收入; X1t ——国内旅游人数(万人); X2t ——城镇居民人均旅游支出(元); X3t ——农村居民人均旅游支出(元); X4t ——公路里程(万公里); X5t ——铁路里程(万公里)。 数据见实验指导数据五,来源于《中国统计年鉴年》 STEP1:参数估计 在Eviews 中点击NEW 项,建立Workfile 输入Y 、X1、X2、X3、X4、X5的数据。点 击Quick ,选Estimate Equation 项,在OLS 对话框中,键入Y C X1 X2 X3 X4 X5,输出结果。见图6.4.1。 Dependent Variable: Y Method: Least Squares Date: 12/12/10 Time: 08:35 Sample: 1994 2006 Included observations: 13 Variable Coefficient Std. Error t-Statistic Prob. C 658.4612 1822.588 0.361278 0.7285 X1 0.046675 0.006842 6.821912 0.0002 X2 6.161783 1.608916 3.829772 0.0065 X3 2.372393 1.083468 2.189629 0.0647 X4 1.134097 1.417467 0.800087 0.4500 X5 -853.5124 426.8085 -1.999755 0.0857

检验多重共线性

实验目的:在回归模型牵涉到多个自变量的时候,自变量之间可能会相互关联,即他们之间存在有多重共线性,本节实验的实验目的是如何用Eviews检测各个自变量之间是否存在的多重共线问题以及如何对多重共线性进行修正。 我们实验的原始数据如图所示,判断钢产量y与生铁产量X1,发电量X2,固定资产投资X3,国内生产总值X4,铁路运输量X5之间的关系。 实验步骤: 1:打开Eviews7.0. →File→Workfile,选择年度数据,在初始日期和结束日期分别输入“1978”和结束年份“1997”。点击“OK”确定。 2:在新建工作表中,点击Proc→Import→Read,选定需要导入的Excel工作表,在“Upper-left data cell”中输入数据在Excel中的初始位置“B2”,在“Excel 5+….”中输入“sheet1”,在“Name for serises、”中输入“y x1 x2 x3 x4 x5”点击“OK”即可。 3:在Eviews空白处输入:“ls y c x1 x2 x3 x4 x5”,回车即可,结果如下。

Dependent Variable: Y Method: Least Squares Date: 04/19/13 Time: 11:24 Sample: 1978 1997 Included observations: 20 Variable Coefficient Std. Error t-Statistic Prob. C 354.5884 435.6968 0.813842 0.4294 X1 0.026041 0.120064 0.216892 0.8314 X2 0.994536 0.136474 7.287380 0.0000 X3 0.392676 0.086468 4.541271 0.0005 X4 -0.085436 0.016472 -5.186649 0.0001 X5 -0.005998 0.006034 -0.994019 0.3371 R-squared 0.999098 Mean dependent var 5153.450 Adjusted R-squared 0.998776 S.D. dependent var 2512.131 S.E. of regression 87.87969 Akaike info criterion 12.03314 Sum squared resid 108119.8 Schwarz criterion 12.33186 Log likelihood -114.3314 Hannan-Quinn criter. 12.09145 F-statistic 3102.411 Durbin-Watson stat 1.919746 Prob(F-statistic) 0.000000 经查表可知,t(17)=1.345,结合上表可知,x1和x5没有通过t检验,而且F\检验较大,估计解释变量之间可能存在着多重共线性。相关性如下图所示: 可知X1 X2 X3 X4 X5,之间存在着较强的多重共线

EViews计量经济学实验报告-多重共线性的诊断与修正

时间 地点 实验题目 多重共线性的诊断与修正 一、实验目的与要求: 要求目的:1、对多元线性回归模型的多重共线性的诊断; 2、对多元线性回归模型的多重共线性的修正。 二、实验内容 根据书上第四章引子“农业的发展反而会减少财政收入”,1978-2007年的财政收入,农业增加值,工业增加值,建筑业增加值等数据,运用EV 软件,做回归分析,判断是否存在多重共线性,以及修正。 三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等) (一)模型设定及其估计 经分析,影响财政收入的主要因素,除了农业增加值,工业增加值,建筑业增加值以外,还可能与总人口等因素有关。研究“农业的发展反而会减少财政收入”这个问题。 设定如下形式的计量经济模型:i Y =1β+2β2X +3β3X +4β4X +5β5X +6β6X +7β7X +i μ 其中,i Y 为财政收入CS/亿元;2X 为农业增加值NZ/亿元;3X 为工业增加值GZ/亿元;4X 为建筑业增加值JZZ/亿元;5X 为总人口TPOP/万人;6X 为最终消费CUM/亿元;7X 为受灾面积SZM/千公顷。 图1: 1978~2007年财政收入及其影响因素数据 年份 财政收入CS/亿元 农业增加值NZ/亿元 工业增加值GZ/亿元 建筑业 增加值 JZZ/亿 元 总人口 TPOP/万 人 最终消费 CUM/亿元 受灾面 积SZM/ 千公顷 1978 1132.3 1027.5 1607 138.2 96259 2239.1 50790 1979 1146.4 1270.2 1769.7 143.8 97542 2633.7 39370 1980 1159.9 1371.6 1996.5 195.5 98705 3007.9 44526 1981 1175.8 1559.5 2048.4 207.1 100072 3361.5 39790 1982 1212.3 1777.4 2162.3 220.7 101654 3714.8 33130 1983 1367 1978.4 2375.6 270.6 103008 4126.4 34710 1984 1642.9 2316.1 2789 316.7 104357 4846.3 31890 1985 2004.8 2564.4 3448.7 417.9 105851 5986.3 44365 1986 2122 2788.7 3967 525.7 107507 6821.8 47140 1987 2199.4 3233 4585.8 665.8 109300 7804.6 42090 1988 2357.2 3865.4 5777.2 810 111026 9839.5 50870 1989 2664.9 4265.9 6484 794 112704 11164.2 46991 1990 2937.1 5062 6858 859.4 114333 12090.5 38474 1991 3149.48 5342.2 8087.1 1015.1 115823 14091.9 55472 1992 3483.37 5866.6 10284.5 1415 117171 17203.3 51333 1993 4348.95 6963.8 14188 2266.5 118517 21899.9 48829 1994 5218.1 9572.7 19480.7 2964.7 119850 29242.2 55043

相关文档
最新文档