异方差多重共线性自相关的总结

异方差多重共线性自相关的总结
异方差多重共线性自相关的总结

原因后果检验方法补救措施

多重共线性 1.经济变量之间具有共同

变化趋势。

2. 在截面数据中,变量间

从经济意义上具有密切的

关联度。

3.模型中包含滞后变量。

4.样本数据自身的原因。完全:1、参数的估计值不确定

2、参数估计值的方差无限大

不完全:1、参数估计值的方差增大

2、变量的显著性检验失去意义

3、区间估计和区间预测预测功能失效

4、参数估计量经济含义不合理

1、简单相关系数检验法

2、方差膨胀因子法

3、直观判断法

4、逐步回归检测法

1、经验方法

2、逐步回归法

3、岭回归法

异方差性1、模型设定误差

2、数据的测量误差

3、截面数据中总体各单位

的差异参数估计式统计特性:

1、仍然具有线性性

2、仍然具有无偏性

3、仍然具有一致性

4、不再具有最小方差性

参数显著性检验:使t统计量值变小。而且,异

方差情况下,通常由OLS法得到的t统计量不再

服从t分布,F统计量也不再服从F分布。t检验

和F检验失去存在的基础。

预测:会扩大估计区间和预测区间,降低精度。

1、图示检验法

2、Goldfeld-Quanadt检验

3、White检验

4、ARCH检验

5、Glejser检验

1、模型变换法

2、加权最小二乘法

3、模型的对数变换

自相关1、经济系统的惯性

2、经济活动的滞后效应

3、数据处理造成的相关

4、蛛网现象

5、模型设定偏误参数估计:

1、无偏性仍成立

2、不再具有最小方差性

模型检验和预测:

1、参数显著性检验失效

2、区间预测和预测区间的精度降低

1、图示检验法

2、DW检验法

3、相关图和Q统计量

4、序列相关LM检验

1、广义差分法

2、科克伦-奥克特迭代法

3、一阶差分法

检验方法基本方法特点 E views操作

多重共线性简单相关系数检验法:

1、简单相关系数

2、交叉相关系数

1、利用解释变量之间的线性相关程度去判断是否存在

严重多重共线性。

2、相关系数计算的是两组样本的同期相关程度,交叉

相关则可以表示不同期之间的相关程度。

较高的简单相关系数只是多重共线性存在的充分条件,

而不是必要条件。因此并不能简单地依据相关系数进行

多重共线性的准确判断,可以结合交叉相关系数。

1、Group窗口的

view/covariance

analysis/correlation

2、Group窗口的

view/cross correlation/

输入滞后期设定/

输出结果阅读:看是否超

出2倍标准差线

方差膨胀因子法

j

X为被解释变量,对其他解释变量做辅助回归。

该辅助回归的可决系数为

2

j

R。

(1)引入方差扩大因子,即

2

1

1

j

j R

VIF

-

=;

(2)2

j

R度量了

j

X与其他解释变量的线性相关程度,

这种相关程度越强,说明变量之间的多重共线性越严重,

j

VIF也就越大;方差膨胀因子越接近于1,多重共线性

越弱。

直观判断法根据经验判断:

1、当增加或剔除一个解释变量,或者改变一个观测值

时,回归参数的估计值发生较大变化时,回归方程可

能存在严重的多重共线性;

2、从定性分析认为,一些重要的解释变量的回归系数

的标准误差较大,在回归方程中没有通过显著性检验,

可初步判断可能存在严重的多重共线性;

3、有些解释变量的回归系数所带正负号与定性分析

结果违背时,可能存在多重共线性;

4、解释变量的相关矩阵中,自变量之间的相关系数较

大时,可能存在多重共线性;

(1)参数估计值有很大的偶然性。

(2)参数显著性检验未通过。

(3)经济意义检验未通过。

(4)相关系数大。

逐步回归检测法将变量逐个的引入模型,每引入一个解释变量后,都

要进行F检验,并对已经选入的解释变量逐个进行t

检验。当原来引入的解释变量由于后面解释变量的引

入而变得不再显著时,将其剔除。(这是一个反复过程)

当原来引入的解释变量由于后面解释变量的引入而变得

不再显著时,就存在多重共线性。如果解释变量之间是

高度相关的,则先前引入的解释变量可能会因为后来引

入与之相关的解释变量而被剔除。

检验方法基本方法特点

异方差性图示检验法:

1、相关图形分析

2、残差图形分析1、以X为横轴,Y为纵轴,画散点图,可以粗略地看到Y的离散程度与X之间是否有相关关系,以及Y与其样本均值的离散程度。

2、绘制出2

i

e对

i

X的散点图,如果2

i

e不随

i

X而变化,则表明不存在异方差;如果2

i

e随

i

X而变化,则表明存在异方差。

Goldfeld-Quanadt检验将样本分为两部分;然后分别对两个样本进行回归;

并通过计算两个子样的残差平方和的比来判断两子

样的剩余平方和是否存在明显差异,以此为统计量来

判断是否存在异方差。

(1)适用于大样本;

(2)检验递增型或递减型异方差;

(3)只能判断异方差是否存在,在多个解释变量的情下,对哪一个变量引起异方差

的判断存在局限;

(4)该检验的功效取决于C,C值越大,检验功效越好;

(5)两个子样回归所用的观测值个数如果不相等时,也可以用该检验,需要通过改

变自由度和统计量的计算公式来调整;

(6)当模型中包含多个解释变量时,应对每个可能引起异方差的解释变量都进行检

验。

White检验构造残差平方序列与解释变量之间的辅助函数,通过

判断辅助函数的显著性来判断原方程是否存在异方

差。(一般而言,辅助回归的解释变量包括常数项、

原模型中的解释变量、解释变量平方、其交叉乘积。)(1)要求变量的取值为大样本;

(2)适用于各种类型的异方差检验;

(3)不仅能够检验异方差的存在性,同时在多变量的情况下,还能判断出是哪一个变量引起的异方差;

(4)辅助回归中可引入解释变量的相对于原模型的更高次幂;

(5)在多元回归中,由于解释变量个数太多,可去掉辅助回归式中解释变量的交叉项。

ARCH检验在时间序列数据中,可认为存在的异方差性为ARCH

过程,并通过检验这一过程是否成立来判断是否存在

异方差。(1)变量的样本值为大样本;

(2)数据是时间序列数据;

(3)只能判断模型中是否存在异方差,而不能诊断出哪一个变量引起的异方差。

Glejser检验

由OLS法得到残差

i

e,取得绝对值,然后将对某个

解释变量回归,根据回归模型的显著性和拟合优度来

判断是否存在异方差。(1)可用于各种类型的异方差检验;

(2)由于异方差形式未知,因此需要进行各种测试;

(3)不仅能对异方差的存在进行判断,还能给出异方差的具体形式;(4)该检验要求变量的观测值为大样本。

检验方法基本方法适用情况/前提条件局限性

自相关图示检验法

图示法是一种直观的诊断方法,它是把给定的回归模型直接用普通最小二乘法估计参数,求出残差项

i

e,

i

e作为随机项

i

u的真实估计值,再描绘

i

e的

散点图,根据图形来判断

i

e的相关性。

DW检验法

根据公式)

1(2

-

DW计算DW的值,显

著性水平α,查得L d和u d,同时根据DW检

验决策规则判断自相关状态;

(1)解释变量X为非随机的;

(2)随机误差项

i

u为一阶自回归形式,即

t

t

t

u

ρ+

=

-1

,其中

t

ε满足古典假定;

(3)线性回归模型中不应含有滞后内生变量作为

解释变量;

(4)模型的截距项不为零;

(5)数据无缺失项。

(6)小样本

(7)只能用于检验随机误差项具有一阶自回归形

式的自相关问题。

(1)DW检验有两个不能确定的区域,一旦DW

值落在这两个区域,就无法判断。这时,只有增大

样本容量或选取其他方法;

(2)DW统计量的上、下界表要求n≥15,这是

因为样本如果再小,利用残差就很难对自相关的存

在性做出比较正确的诊断;

(3)DW只能检验一阶自相关,DW检验不适应

随机误差项具有高阶序列相关的检验;

(4)只适用于有常数项的回归模型并且解释变量

中不能含滞后的被解释变量。

相关图和Q统计

应用所估计回归方程残差序列的自相关和偏自相关系数,以及Ljung-Box Q - 统计量来检验序列相关。在方程工具栏选择View/Residual

Tests/correlogram-Q-statistics 。EViews将显示残差的自相关和偏自相关函数以及对应于高阶序列相关的Ljung-Box Q统计量。当滞后期为p时,柱体没有

超过虚线,表示p阶Q统计量都没有超过由设定的显著性水平决定的临界值,则接受原假设,即不存在序列相关。(此时,对应的自相关和偏自相关系数

接近于0。)反之,当滞后期为p时,柱体超过虚线,表示p阶Q统计量超过由设定的显著性水平决定的临界值,则拒绝原假设,即存在序列相关,

(前提:样本量较大)

序列相关LM检

LM检验(Breush-Godfrey LM检验)是构造拉格朗日乘数来检验高阶序列相关;而且在方程中存在滞后因变量的情况下,LM检验仍然有效。

在方程结果窗口,View/Residual Tests/Serial Correlation LM Test,输入滞后期。根据AIC最小化确定滞后期(AIC值在序列相关LM 检验窗口中)。

F统计量表示辅助回归方程的整体显著性,而后面的Obs*R-squared 才是我们所重点观察的LM统计量(一般情况下,它统计量服从渐进的)

(2p

χ分布)。

修正方法具体操作方法

修正多重共线性经验方法:

1、剔除变量法

2、增大样本容量

3、变换形式——模型差分法

4、利用约束条件——先验信息法

5、横截面数据与时序数据并用

6、变量变换

1、(1)简单相关系数法下,选择相关系数较大的两个变量中相对不重要的变量进行剔除。

(2)方差膨胀因子法下,首先剔除最大的差膨胀因子对应的变量;如果仍存在多重共线性,剔除第二

大的。——要注意,如果去掉的是重要变量,通常会导致偏误。

2、常面临许多实际困难。

3、将原模型变形为差分模型形式进而降低多重共线性。变形后为

i

ki

k

i

i

i

u

X

X

X

Y?

+

?

+???+

?

+

?

=

β

β

2

2

1

1

(差分会丢失一些信息;差分模型的误差项可能存在序列相

关,在具体运用时要慎重。)

4、通过经济理论分析能够得到某些参数之间的关系,可以将这种关系作为约束条件,将此约束条件和样

本信息结合起来进行约束最小二乘估计。

5、首先利用横截面数据估计出部分参数,再利用时序数据估计出另外的部分参数,最后得到整个方程参

数的估计。方法实用性较差。

6、(1)计算相对指标(2)将名义数据转换为实际数据(3) 将小类指标合并成大类指标

逐步回归法先用被解释变量对每一个所考虑的解释变量做简单回归,然后以对被解释变量贡献最大的解释变量所对应

的回归方程为基础,再逐个引入其余的解释变量。

(1)保留变量的情况

若新变量的引入改进了2

R和F检验,且回归参数的t 检验在统计上也是显著的,则在模型中保留该

变量。

(2)剔除变量的情况

若新变量的引入未能改进2

R和F检验,且对其他回归参数估计值的t 检验也未带来什么影响,则认

为该变量是多余变量,不需加入模型。

若新变量的引入使得2

R和F值显著降低,显著地影响了其他回归参数估计值的数值或符号,同时本

身的回归参数也通不过t 检验,说明出现了严重的多重共线性。

岭回归法(不需掌握)

修正方法具体操作方法

修正异方

差模型变换法

根据图示法和Glejser检验所得到的相应信息,可以对)

(

i

X

f的函数形式作出各种假设。

加权最小二乘法(WLS)

区别对待不同的2

i

σ。

对较小的2

i

e, 给予较大的权数,对较大的2

i

e给予较小的权数,从而使2

i

e∑更好地反映2

i

σ对残差平方和的影响。

通常取权数2

/1

i

i

=(i=1,2,....n),当2

i

σ越小时,

i

w越大。当2

i

σ越大时,

i

w越小。求使满足2

min

i

i

∑的*

β。

模型的对数变换对模型中的变量作对数变换。

修正自相

关广义差分法对于自相关的结构已知的情形可采用广义差分法解决。当自相关系数为已知时,使用广义差分法消除自相关。以

一元线性回归模型为例,

1

1

2

1

1

)

(

)

1(

-

-

-

-

+

-

+

-

=

-

t

t

t

t

t

t

u

u

X

X

Y

ρ

β

ρ

β

ρ(6.30)→

t

t

t

v

X

Y+

+

=*

*

*

*

2

1

β

β

(6.31)

对(6.31)式使用普通最小二乘估计就会得到参数估计的最佳线性无偏估计量。(6.30)称为广义差分方程,因为

被解释变量与解释变量均为现期值减去前期值的一部分,由此而得名。

在进行广义差分时,会丢失了第一个观测值,即损失自由度。当样本容量较小时,会对估计精度有影响。此时,可

采用普莱斯—温思腾变换,将第一个观测值变换为:2

1

-

Y和2

1

-

X补充到差分序列*

t

Y,*

t

X中,再使用普通最小二乘法估计参数。

一阶差分法

用来消除完全一阶正自相关。

t

t

t

u

X

Y+

+

=

2

1

β

β中

t

u一阶自回归AR(1)。将模型变换为:

1

2-

-

+

?

=

?

t

t

t

t

u

u

X

Yβ。在完全一阶正自相关情况下,即ρ=1,则

t

t

t

v

u

u+

=

-1

,其中,

t

v为经典误差项。则随机误差项为经典误差项,无自相关问题。使用普通最小二乘法估计参数,可得到最佳线性无偏估计量。在方程

估计窗口输入y-y(-1) x-x(-1)

科特伦-奥克特迭代法

未知自相关系数时,利用残差2

i

e逐次迭代得到更为满意的

Λ

ρ,然后再采用广义差分法。

(1)使用OLS法估计模型

t

t

t

u

X

Y+

+

=

2

1

β

β,计算残差)

(

2

1

)1(

t

t

t

t

t

X

Y

Y

Y

e

Λ

Λ

Λ

+

-

=

-

β

(2)利用)1(

t

e作回归,即

t

t

t

v

e

e+

=

-

Λ

)1(

1

)1(

)1(ρ

(3)用OLS法估计式中的

)1(

Λ

ρ,对模型进行广义差分,即

1

)1(

1

)1(

2

)1(

1

1

)1(

)

(

)

1(

-

Λ

-

Λ

Λ

-

Λ

-

+

-

+

-

=

-

t

t

t

t

t

t

u

u

X

X

Y

ρ

β

ρ

β

ρ→)2(

2

1t

t

t

e

X

Y+

+

=*

*

*

β

(4)由前一步估计的结果有)

1

/(

)1(

1

1

Λ

*

Λ

Λ

-

β

β和

*

Λ

Λ

=

2

2

β

β,将

*

Λ

Λ

2

2

β代入原方程得到新的残差

t t t X Y e

21)3(Λ

Λ--=ββ

(5)利用残差作回归得)3(t e =t t v e +-31)2(ρ 依此类推,直到得到ρ的最佳估计值

E views 操作:如图,在估计方程对话框中加入AR(p),

即可得到参数 1ρ 2ρ等的估计值。如果是一阶自相关,就在方程对话框中加入AR(1),如果是二阶自相关,就在方程对话框中加入AR(1) 、AR(2),以此类推。

注意

当对时间序列的自相关进行修正后,经常出现变量的显著性检验不能通过的情况。其主要原因包括以下项:样本不够、同时存在异方差和多重共线性等、解释变量未能包含所有影响被解释变量的因素等,以及时间序列数据有其自身的特点,经常出现伪回归现象。

相应的处理方法:扩大样本、检验异方差、修改模型、进行单位根检验→建立协整方程。

用SPSS进行单因素方差分析报告和多重比较

SPSS——单因素方差分析 单因素方差分析 单因素方差分析也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。One-Way ANOVA过程要求因变量属于正态分布总体。如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果几个因变量之间彼此不独立,应该用Repeated Measure 过程。 [例子] 调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表1-1所示。 表1-1 不同水稻品种百丛中稻纵卷叶螟幼虫数

3 40 35 35 38 34 数据保存在“data1.sav”文件中,变量格式如图1-1。 图1-1 分析水稻品种对稻纵卷叶螟幼虫抗虫性是否存在显著性差异。 。 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“Compare Means”项,在右拉式菜单中点击“0ne-Way ANOVA”项,系统 打开单因素方差分析设置窗口如图1-2。 图1-2 单因素方差分析窗口

3)设置分析变量 因变量:选择一个或多个因子变量进入“Dependent List”框中。本例选择“幼虫”。 因素变量:选择一个因素变量进入“Factor”框中。本例选择“品种”。 4)设置多项式比较 单击“Contrasts”按钮,将打开如图1-3所示的对话框。该对话框用于设置均值的多项式比较。 图1-3 “Contrasts”对话框 定义多项式的步骤为: 均值的多项式比较是包括两个或更多个均值的比较。例如图1-3中显示的是要求计算“1.1×mean1-1×mean2”的值,检验的假设H0:第一组均值的1.

计量经济学多元线性回归、多重共线性、异方差实验报告记录

计量经济学多元线性回归、多重共线性、异方差实验报告记录

————————————————————————————————作者:————————————————————————————————日期:

计量经济学实验报告

多元线性回归、多重共线性、异方差实验报告 一、研究目的和要求: 随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到亿人次,同比增长%,国内旅游收入万亿元,同比增长%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。 影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。 二、模型设定 根据以上的分析,建立以下模型 Y=β 0+β 1 X 1 +β 2 X 2 +β 3 X 3 +β 4 X 4 +Ut 参数说明: Y ——旅游景区营业收入/万元 X 1 ——旅游业从业人员/人 X 2 ——旅游景区固定资产/万元 X 3 ——旅游外汇收入/万美元 X 4 ——城镇居民可支配收入/元

eviews异方差、自相关检验与解决办法

eviews异方差、自相关检验与解决办法 一、异方差检验: 1.相关图检验法 LS Y C X 对模型进行参数估计 GENR E=RESID 求出残差序列 GENR E2=E^2 求出残差的平方序列 SORT X 对解释变量X排序 SCAT X E2 画出残差平方与解释变量X的相关图 2.戈德菲尔德——匡特检验 已知样本容量n=26,去掉中间6个样本点(即约n/4),形成两个样本容量均为10的子样本。 SORT X 将样本数据关于X排序 SMPL 1 10 确定子样本1 LS Y C X 求出子样本1的回归平方和RSS1 SMPL 17 26 确定子样本2 LS Y C X 求出子样本2的回归平方和RSS2 计算F统计量并做出判断。 解决办法 3.加权最小二乘法 LS Y C X 最小二乘法估计,得到残差序列 GRNR E1=ABS(RESID) 生成残差绝对值序列 LS(W=1/E1) Y C X 以E1为权数进行加权最小二成估计 二、自相关 1.图示法检验 LS Y C X 最小二乘法估计,得到残差序列 GENR E=RESID 生成残差序列 SCAT E(-1) E et—et-1的散点图 PLOT E 还可绘制et的趋势图 2.广义差分法 LS Y C X AR(1) AR(2)

首先,你要对广义差分法熟悉,不是了解,如果你是外行,我奉劝你还是用eviews来做就行了,其实我想老师要你用spss无非是想看你是否掌握广义差分,好了,废话不多说了。接着,使用spss16来解决自相关。第一步,输入变量,做线性回归,注意在Liner Regression 中的Statistics中勾上DW,在save中勾Standardized,查看结果,显然肯定是有自相关的(看dw值)。第二步,做滞后一期的残差,直接COPY数据(别告诉我不会啊),然后将残差和滞后一期的残差做回归,记下它们之间的B指(就是斜率)。第三步,再做滞后一期的X1和Y1,即自变量和因变量的滞后一期的值,也是直接COPY。第四步,最后定义两个新变量,即X2=X-B*X1,Y2=Y-B*X2,最后做X2和Y2的回归,这样广义差分就完成了。但是这仅仅只是一次广义差分,观察X2和Y2的回归分析表,如果DW值仍然显示有自相关,则还要做一次差分,即重复上述步骤即可。 一般来说,广义差分最多做2次就行了。。。 本文来自: 人大经济论坛SPSS专版版,详细出处参考:https://www.360docs.net/doc/e114436306.html,/forum.php?mod=viewthread&tid=289529&page=1

多重共线性回归分析及其实验报告

实验报告 实验题目:多重共线性的研究指导老师: 学生一: 学生二: 实验时间:2011年10月

多重线性回归分析及其实验报告 实验目的:为了更好地了解财政收入构成,需要定量地分析影响财政收入的因素 模型设定及其估计:经分析,影响财政收入的主要因素,农业增加值X1,工业增加值X2,建筑业增加值X3,总人口X4,受灾面积X5.为此设定了如下形式的计量经济模型: Y=β 1+β 2 X1+β 3 X2+β 4 X3+β 5 X4+β 6 X5+u0 其中,Y为财政收入(元),X1农业增加值(元),X2为工业增加值(元),X3为建筑业增加值(元),X4为总人口(万人),X5为受灾面积(千公顷) 为估计模型参数,收集1978~2007年财政收入及其影响因素数据,如图: 1978~2007年财政收入及其影响因素数据 年份 财政收入CS/亿 元 农业增加值 NZ/亿元 工业增加值 GZ/亿元 建筑业增加 值JZZ/亿元 总人口 TPOP/万 人 受灾面积 SZM/千公顷1978 1132.3 1027.5 1607 138.2 96259 50790 1979 1146.6 1270.2 1769.7 143.8 97542 39370 1980 1159.9 1371.4 1996.5 195.5 98705 44526 1981 1175.8 1559.5 2048.5 207.1 100072 39790 1982 1212.3 1777.4 2162.3 220.7 101654 33130 1983 1367 1978.5 2375.8 270.6 103008 34710 1984 1642.5 2316.1 2789 316.7 104357 31890 1985 2004.6 2564.3 3448.5 417.9 105851 44365 1986 2122 2788.7 3987.5 525.7 107507 47170 1987 2199.4 3233 4565.9 665.8 109300 42090 1988 2357.6 3865.4 5062 810 111026 50870 1989 2664.5 5062 8087.3 794 112704 46991 1990 2937.4 5342.3 10284.5 859.4 114333 38474

用SPSS进行单因素方差分析和多重比较

方差分析 方差分析可以用来检验来多个均值之间差异的显著性,可以看成是两样本t检验的扩展。统计学原理中涉及的方差分析主要包括单因素方差分析、两因素无交互作用的方差分析和两因素有交互作用的方差分析三种情况。虽然Excel可以进行这三种类型的方差分析,但对数据有一些限制条件,例如不能有缺失值,在两因素方差分析中各个处理要有相等的重复次数等;功能上也有一些不足,例如不能进行多重比较。而在方差分析方面SPSS的功能特别强大,很多输出结果已经超出了统计学原理的范围。 用SPSS检验数据分布的正态性 方差分析需要以下三个假设条件:(1)、在各个总体中因变量都服从正态分布;(2)、在各个总体中因变量的方差都相等;(3)、各个观测值之间是相互独立的。 在SPSS中我们很方便地对前两个条件进行假设检验。同方差性检验一般与方差分析一起进行,这一小节我们只讨论正态性的检验问题。 [例7.4] 检验生兴趣对考试成绩的影响的例子中各组数据的正态性。 在SPSS中输入数据(或打开数据文件),选择Analyze→Descriptive Statistics→Explore,在Explore对话框中将统计成绩作为因变量,兴趣作为分类变量(Fator),单击Plots按钮,选中“Histogram”复选框和“Normality plots with Test”,单击“Continue”按钮,在单击主对话框中的“OK”,可以得到分类别的描述统计信息。从数据的茎叶图、直方图和箱线图都可以对数据分布的正态性做出判断,由于这些内容前面已经做过讲解,这里就不再进一步说明了。 图7-2 用Expore过程进行正态性检验 top↑

计量经济学多元线性回归、多重共线性、异方差实验报告概要

计量经济学实验报告

多元线性回归、多重共线性、异方差实验报告 一、研究目的和要求: 随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到30.0亿人次,同比增长13.6%,国内旅游收入2.3万亿元,同比增长19.1%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。 影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。 二、模型设定 根据以上的分析,建立以下模型 Y=β 0+β1X 1 +β2X 2 +β 3 X 3 +β 4 X 4 +Ut 参数说明: Y ——旅游景区营业收入/万元 X 1 ——旅游业从业人员/人 X 2 ——旅游景区固定资产/万元 X 3 ——旅游外汇收入/万美元 X 4 ——城镇居民可支配收入/元

计量经济学Eviews多重共线性实验报告

计量经济学E v i e w s多重共线性实验报告 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

实验报告课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期: 2014 年 05 月 11日 广东商学院教务处制 姓名实验报告成绩 评语: 指导教师(签名) 年月日 说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。

四、预备知识:最小二乘法估计的原理、t检验、F检验、2R值。 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据

资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。 为分析Y 与X1、X2、X3、X4、X5、X6、X7之间的关系,做如下折线图: 能源消费Y 在1986到1996年间缓慢增长,在96至98年有短暂的下跌,但是98至02年开始缓慢回升,02年到06年开始快速增长。 国民总收入X1和国内生产总值X2以相同的趋势逐年缓慢增长。 工业增加值X3在1985年-1999年期间一直是缓慢增长,但在2000年出现了急剧下降的现象,2001年又急剧增长,达到下降前的水平,2001年以后开始缓慢增长。建筑业增长值x4、交通运输邮电业增加值x5、人均生活电力消费x6、能源加工转换效率x7数值较低,但都以较平缓的方式增长。 2、设定并估计多元线性回归模型 t t t t t t t u X X X X X Y ++++++=66554433221ββββββ () 录入数据,得到图。 2.2.1)采用OLS 估计参数 在主界面命令框栏中输入 ls y c x1 x2 x3 x4 x5 x6 x7回车,即可得到参数的估计结果。 由此可见,该模型的可决系数为,修正的可决系数为,模型拟和很好,F 统计量为,回归方程整体上显着。 可是其中的lnX3、lnX4、lnX6对lnY 影响不显着,不仅如此,lnX2、lnX5的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。 3、多重共线性模型的识别

单因素方差分析与多重比较

单因素方差分析 单因素方差分析也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。One-Way ANOVA过程要求因变量属于正态分布总体。如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果几个因变量之间彼此不独立,应该用Repeated Measure过程。 [例子] 调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表5-1所示。 表5-1 不同水稻品种百丛中稻纵卷叶螟幼虫数 数据保存在“DATA5-1.SAV”文件中,变量格式如图5-1。 图5-1 分析水稻品种对稻纵卷叶螟幼虫抗虫性是否存在显著性差异。 1)准备分析数据

在数据编辑窗口中输入数据。建立因变量“幼虫”和因素水平变量“品种”,然后输入对应的数值,如图5-1所示。或者打开已存在的数据文件“DATA5-1.SAV”。 2)启动分析过程 点击主菜单“Analyze”项,在下拉菜单中点击“Compare Means”项,在右拉式菜单中点击 “0ne-Way ANOVA”项,系统 打开单因素方差分析设置窗口如图5-2。 图5-2 单因素方差分析窗口 3)设置分析变量 因变量:选择一个或多个因子变量进入“Dependent List”框中。本例选择“幼虫”。 因素变量:选择一个因素变量进入“Factor”框中。本例选择“品种”。 4)设置多项式比较 单击“Contrasts”按钮,将打开如图5-3所示的对话框。该对话框用于设置均值的多项式比较。

异方差性习题及答案

异方差性 一、单项选择 1.Goldfeld-Quandt 方法用于检验( ) A.异方差性 B.自相关性 C.随机解释变量 D.多重共线性 2.在异方差性情况下,常用的估计方法是( ) A.一阶差分法 B.广义差分法 C.工具变量法 D.加权最小二乘法 3.White 检验方法主要用于检验( ) A.异方差性 B.自相关性 C.随机解释变量 D.多重共线性 4.Glejser 检验方法主要用于检验( ) A.异方差性 B.自相关性 C.随机解释变量 D.多重共线性 5.下列哪种方法不是检验异方差的方法 ( ) A.戈德菲尔特——匡特检验 B.怀特检验 C.戈里瑟检验 D.方差膨胀因子检验 6.当存在异方差现象时,估计模型参数的适当方法是 ( ) A.加权最小二乘法 B.工具变量法 C.广义差分法 D.使用非样本先验信息 7.加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同的权数,从而提高估计精度,即 ( ) A.重视大误差的作用,轻视小误差的作用 B.重视小误差的作用,轻视大误差的作用 C.重视小误差和大误差的作用 D.轻视小误差和大误差的作用 8.如果戈里瑟检验表明,普通最小二乘估计结果的残差i e 与i x 有显著的形式 i i i v x e +=28715.0的相关关系(i v 满足线性模型的全部经典假设),则用加权最小二 乘法估计模型参数时,权数应为 ( ) A. i x B. 21i x C. i x 1 D. i x 1 9.如果戈德菲尔特——匡特检验显著,则认为什么问题是严重的 ( ) A.异方差问题 B.序列相关问题 C.多重共线性问题 D.设定误差问题 10.设回归模型为i i i u bx y +=,其中i i x u Var 2)(σ=,则b 的最有效估计量为( ) A. ∑∑=2?x xy b B. 2 2)(?∑∑∑∑∑--=x x n y x xy n b C. x y b =? D. ∑=x y n b 1? 二、多项选择 1.下列计量经济分析中那些很可能存在异方差问题( ) A.用横截面数据建立家庭消费支出对家庭收入水平的回归模型 B.用横截面数据建立产出对劳动和资本的回归模型 C.以凯恩斯的有效需求理论为基础构造宏观计量经济模型

计量经济学Eviews多重共线性实验报告

实验报告 课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期: 2014 年 05 月 11日

广东商学院教务处制姓名实验报告成绩 评语: 指导教师(签名)

年月日 说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。 R值。 四、预备知识:最小二乘法估计的原理、t检验、F检验、2 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据

资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。 为分析Y 与X1、X2、X3、X4、X5、X6、X7之间的关系,做如下折线图: 能源消费Y 在1986到1996年间缓慢增长,在96至98年有短暂的下跌,但是98 至02年开始缓慢回升,02年到06年开始快速增长。 国民总收入X1和国内生产总值X2以相同的趋势逐年缓慢增长。 工业增加值X3在1985年-1999年期间一直是缓慢增长,但在2000年出现了急剧下降的现象,2001年又急剧增长,达到下降前的水平,2001年以后开始缓慢增长。建筑业增长值x4、交通运输邮电业增加值x5、人均生活电力消费x6、能源加工转换效率x7数值较低,但都以较平缓的方式增长。 2、设定并估计多元线性回归模型 t t t t t t t u X X X X X Y ++++++=66554433221ββββββ (2.1) 2.1录入数据,得到图。

多重共线性案例分析实验报告

《多重共线性案例分析》实验报告

表2 由此可见,该模型,可决系数很高,F 检验值 173.3525,明显显著。但是当时,不仅、 系数的t 检验不显著,而且系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 9954.02=R 9897.02 =R 05.0=α776 .2)610()(025.02=-=-t k n t α2X 6X 6X

②.计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵 表3 由关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性相。 4.消除多重共线性 ①采用逐步回归的办法,去检验和解决多重共线性问题。 分别作Y 对X2、X3、X4、X5、X6的一元回归 如下图所示 变量 X2 X3 X4 X5 X6 参数估计值 0.0842 9.0523 11.6673 34.3324 2014.146 t 统计量 8.6659 13.1598 5.1967 6.4675 8.7487 0.9037 0.9558 0.7715 0.8394 0.9054 表4 按的大小排序为:X3、X6、X2、X5、X4。 以X3为基础,顺次加入其他变量逐步回归。首先加入X6回归结果为: t=(2.9086) (0.46214) 2R 2 R 6 31784.285850632.7639.4109?X X Y t ++-=957152.02 =R

1995 1375.7 62900 464.0 61.5 115.70 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.60 1998 2391.2 69450 607.0 197.0 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.80 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200.0 180.98 7.30 表1:1994年—2003年中国游旅收入及相关数据

违背基本假设的问题:多重共线性异方差和自相关

第5章、违背基本假设的问题: 多重共线性、异方差和自相关 回顾并再次记住最小二乘法(LS)的三个基本假设: 1.y=Xβ+ε 2.Rank(X)=K 3.ε|X~N(0,σ2I) 1 / 51

§1、多重共线性(multicollinearity) 1、含义及后果 1)完全的多重共线性 如果存在完全的多重共线性(perfect multicollinearity),即在X中存在不完全为0的a i,使得 a1x1+…+a K x K=0 即X的列向量之间存在线性相关。因此,有Rank(X)

3 / 51

4 / 51 2)近似共线性 常见为近似共线性,即 a 1x 1+…+a K x K ≈0 则有|X’X|≈0,那么(X’X)-1对角线元素较大。由于 21|[,(')]b X N X X βσ- , 21|[,(')]k k kk b X N X X βσ- , 所以b k 的方差将较大。 例子:Longley 是著名例子。

5 / 51

6 / 51 2、检验方法 1)VIF 法(方差膨胀因子法,variance inflation factor ) 第j 个解释变量的VIF 定义为 2 1 VIF 1j j R = - 此处2j R 是第j 个解释变量对其他解释变量进行回归的确定系数。若2j R 接近于1,那么VIF 数值将较大,说明第j 个解释变量与其他解释变量之间存在线性关系。从而,可以用VIF 来度量多重共线性的严重程度。当 2j R 大于0.9,也就是VIF 大于10时,认为自变量之间存在比较严重的

第四章 多重共线性 答案(1)

第四章 多重共线性 一、判断题 1、多重共线性是一种随机误差现象。(F ) 2、多重共线性是总体的特征。(F ) 3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t 值会趋于变大。(F ) 4、尽管有不完全的多重共线性,OLS 估计量仍然是最优线性无偏估计量。(T ) 5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。(T ) 6、变量的两两高度相关并不表示高度多重共线性。(F ) 7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。(T ) 8、在多元回归中,根据通常的t 检验,每个参数都是统计上不显著的,你就不会得到一个高的2 R 值。(F ) 9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。( F ) 10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。(T ) 11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。(T ) 12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。(F ) 13、多重共线性的存在会降低OLS 估计的方差。(F ) 14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。(T ) 15、解释变量和随机误差项相关,是产生多重共线性的原因。(F ) 16、对于模型i ni n i 110i u X X Y ++++=βββ ,n 1i ,, =;如果132X X X -=,模型必然存在解释变量的多重共线性问题。(T ) 17、多重共线性问题是随机扰动项违背古典假定引起的。(F ) 18、存在多重共线性时,模型参数无法估计。(F ) 二、单项选择题 1、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,既有12i i X kX =,其中k 为 非零常数,则表明模型中存在 ( B ) A 、异方差 B 、多重共线性 C 、序列相关 D 、随机解释变量 2、 在多元线性回归模型中,若某个解释变量对其余解释变量的可决系数接近1,则表明模型中存在 ( C ) A 、异方差性 B 、序列相关

计量经济学Eviews多重共线性实验报告记录

计量经济学Eviews多重共线性实验报告记录

————————————————————————————————作者:————————————————————————————————日期:

实验报告 课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期:2014 年05 月11日

广东商学院教务处制 姓名实验报告成绩 评语: 指导教师(签名) 年月日

说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。 四、预备知识:最小二乘法估计的原理、t检验、F检验、2 R值。 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据 年份 能源消费 国民 总收入 国内生 产总值 工业 增加值 建筑业 增加值 交通运输邮电 增加值 人均生活 电力消费 能源加工 转换效率 y X1 X2 X3 X4 X5 X6 X7 1985766829040.7 9016 3448.7 417.9 406.9 21.3 68.29 198680850 10274.4 10275.2 3967 525.7 475.6 23.2 68.32 198786632 12050.6 12058.6 4585.8 665.8 544.9 26.4 67.48 198892997 15036.8 15042.8 5777.2 810 661 31.2 66.54 198996934 17000.9 16992.3 6484 794 786 35.3 66.51 199098703 18718.3 18667.8 6858 859.4 1147.5 42.4 67.2 1991103783 21826.2 21781.5 8087.1 1015.1 1409.7 46.9 65.9 1992109170 26937.3 26923.5 10284.5 1415 1681.8 54.6 66.00 1993115993 35260 35333.9 14188 2266.5 2205.6 61.2 67.32 1994122737 48108.5 48197.9 19480.7 2964.7 2898.3 72.7 65.2 1995131176 59810.5 60793.7 24950.6 3728.8 3424.1 83.5 71.05 1996138948 70142.5 71176.6 29447.6 4387.4 4068.5 93.1 71.5 1997137798 77653.1 78973 32921.4 4621.6 4593 101.8 69.23 1998132214 83024.3 84402.3 34018.4 4985.8 5178.4 106.6 69.44 1999133831 88189 89677.1 35861.5 5172.1 5821.8 118.2 69.19 2000138553 98000.5 99214.6 40033.6 5522.3 7333.4 132.4 69.04 2001143199 108068.2 109655.2 43580.6 5931.7 8406.1 144.6 69.03 2002151797 119095.7 120332.7 47431.3 6465.5 9393.4 156.3 69.04 2003174990 135174 135822.8 54945.5 7490.8 10098.4 173.7 69.4 2004203227 159586.7 159878.3 65210 8694.3 12147.6 190.2 70.71 2005223319 183956.1 183084.8 76912.9 10133.8 10526.1 216.7 71.08 2006 246270 213131.7 211923.5 91310.9 11851.1 12481.1 249.4 71.24

第八章方差分析与回归分析

第八章 方差分析与回归分析 一、教材说明 本章内容包括:方差分析,多重比较,方差齐性检验,一元线性回归,一元非线性回归.主要讲述方差分析和一元线性回归两节内容. 1、教学目的与教学要求 (1)了解方差分析的统计模型,掌握平方和的分解,熟悉检验方法和参数估计,会解决简单的实际问题. (2)了解效应差的置信区间的求法,了解多重比较问题,掌握重复数相等与不相等场合的方法,会解决简单的实际问题. (3)熟练掌握Hartley 检验,Bartlett 检验以及修正的Bartlett 检验三种检验方法,会解决简单的实际问题. (4)理解变量间的两类关系,认识一元线性和非线性回归模型,熟悉回归系数的估计方法,熟练掌握回归方程的显著性检验.能用R 软件来进行回归分析,会解决简单的实际问题. 2、本章的重点与难点 本章的重点是平方和的分解,检验方法和参数估计、重复数相等与不相等场合的方法、检验方法的掌握,回归系数的估计方法,回归方程的显著性检验,难点是检验方法和参数估计,重复数相等与不相等场合的方法. 实际问题的检验,回归方程的显著性检验. 二、教学内容 本章共分方差分析,多重比较,方差齐性检验,一元线性回归,一元非线性回归等5节来讲述本章的基本内容. § 方差分析 教学目的:了解方差分析的统计模型,掌握平方和的分解,熟悉检验方法和参数估计,会 解决简单的实际问题. 教学重点:平方和的分解,检验方法和参数估计 教学难点:检验方法和参数估计 教学内容: 本节包括方差分析问题的提出,单因子方差分析的统计模型,平方和分解,检验方法,参数估计,重复数不等情形. 问题的提出 在实际工作中经常会遇到多个总体均值的比较问题,处理这类问题通常采用方差分析方法. 例 单因子方差分析的统计模型 在例中,我们只考察一个因子,称为单因子试验.记因子为A ,设其有r 个水平,记为 1r A , ,A ,在每一水平下考察的指标可看做一个总体,故有r 个总体,假定 (1)每一总体均为正态总体,记为2 i i N(,)μσ,i 1,2,,r =; (2)各总体方差相同,即22 2212r σσσσ== ==

第六部分异方差与自相关讲解

七、 异方差与自相关 一、背景 我们讨论如果古典假定中的同方差和无自相关假定不能得到满足,会引起什么样的估计问题呢?另一方面,如何发现问题,也就是发现和检验异方差以及自相关的存在性也是一个重要的方面,这个部分就是就这个问题进行讨论。 二、知识要点 1、引起异方差的原因及其对参数估计的影响 2、异方差的检验(发现异方差) 3、异方差问题的解决办法 4、引起自相关的原因及其对参数估计的影响 5、自相关的检验(发现自相关) 6、自相关问题的解决办法 (时间序列部分讲解) 三、要点细纲 1、引起异方差的原因及其对参数估计的影响 原因:引起异方差的众多原因中,我们讨论两个主要的原因,一是模型的设定偏误,主要指的是遗漏变量的影响。这样,遗漏的变量就进入了模型的残差项中。当省略的变量与回归方程中的变量有相关关系的时候,不仅会引起内生性问题,还会引起异方差。二是截面数据中总体各单位的差异。 后果:异方差对参数估计的影响主要是对参数估计有效性的影响。在存在异方差的情况下,OLS 方法得到的参数估计仍然是无偏的,但是已经不具备最小方差性质。一般而言,异方差会引起真实方差的低估,从而夸大参数估计的显著性,即是参数估计的t 统计量偏大,使得本应该被接受的原假设被错误的拒绝。 2、异方差的检验 (1)图示检验法 由于异方差通常被认为是由于残差的大小随自变量的大小而变化,因此,可以通过散点图的方式来简单的判断是否存在异方差。具体的做法是,以回归的残差的平方2i e 为纵坐标,回归式中的某个解释变量i x 为横坐标,画散点图。如果散点图表现出一定的趋势,则可以判断存在异方差。

(2)Goldfeld-Quandt 检验 Goldfeld-Quandt 检验又称为样本分段法、集团法,由Goldfeld 和Quandt 1965年提出。这种检验的思想是以引起异方差的解释变量的大小为顺序,去掉中间若干个值,从而把整个样本分为两个子样本。用两个子样本分别进行回归,并计算残差平方和。用两个残差平方和构造检验异方差的统计量。 Goldfeld-Quandt 检验有两个前提条件,一是该检验只应用于大样本(n>30),并且要求满足条件:观测值的数目至少是参数的二倍; 二是除了同方差假定不成立以外,要求其他假设都成立,随机项没有自相关并且服从正态分布。Goldfeld-Quandt 检验假设检验设定为:H 0:具有同方差, H 1:具有递增型异方差。具体实施步骤为: ①将观测值按照解释变量x 的大小顺序排列。 ②将排在中间部分的c 个(约n/4)观测值删去,再将剩余的观测值分成两个部分,每个部分的个数分别为n 1、n 2。 ③分别对上述两个部分的观测值进行回归,得到两个部分的回归残差平方和。 ④构造F 统计量2 221 11/()/()e e n k F e e n k '-='-,其中 k 为模型中被估参数个数。在H 0成立 条件下,21(,)F F n k n k -- ⑤判别规则如下, 若 F ≤ F α (n 2 - k , n 1 - k ), 接受H 0(具有同方差) 若 F > F α(n 2 - k , n 1 - k ), 拒绝H 0(递增型异方差) 注意: ① 当摸型含有多个解释变量时,应以每一个解释变量为基准检验异方差。 ② 此法只适用于递增型异方差。

管理统计学_异方差、自相关、多重共线性的检验

实验名称:多元回归模型的异方差、自相关性、多重共线性检验 【实验内容】 表4-7给出了我国1995-2007年名义服务产业产出(Y)、服务员就业人数(X1)、软件外包服务收入(X2)和技术进步知识(X3)的数据。试完成: 表4-7 我国1995-2007年名义服务业产出、服务员就业人数、软件外包服务收入和技术进步指数的数据 (1)根据表4-7的数据建立多元回归模型,并进行估计。 (2)用White检验法对回归模型的随机干扰项进行异方差检验。 (3)用LM检验法回归模型的随机干扰项进行自相关检验。 (4)根据回归方程的结果判断各项系数是否通过了t检验,方程是否通过了F检验。 【实验步骤】 (一)参数估计: 打开EViews软件,输入数据,估计样本回归方程(操作方法同第二章案例的建立工作文件部分)如下图:

根据上图,模型的估计的回归方程为: Y=-76769.99+6.0453X1+1631.505X2-6206.783X3 (0.199) (2.235) (31.487) (17.770) 998.02=R 181.1617=F 括号内为t 统计量值。 (二)检验异方差性: (1)图形检验分析: 1. 散点图:在EViews 命令窗口中输入:SCAT X1 Y ,得到名义服务业产出(Y )和服务员就业人数(X1)的散点图。 从图中可以看出,随着名义服务业产出(Y )的增加,服务员就业人数(X1)也不断提高,而离散程度几乎没有变化。这说明变量之间不存在异方差性。 同样地,也用散点图法检验X2,得到下图: 从图中可以看出,随着名义服务业产出(Y )的增加,软件外包服务收入(X2)也不断提高,而离散程度几乎没有变化。这说明变量之间不存在异方差性。 检验X3得到下图:

多元回归模型和多重共线性实验报告

《计量经济学》上机实验报告一 题目:多元回归模型和多重共线性实验日期和时间:2013年4月18日 班级:学号:姓名:实验室:实验楼104 实验环境:Windows XP ; EViews 3.1 实验目的: 利用相关数据建立多元回归模型,分析在不同的经济条件下一定的要素对某个经济体发展的影响程度并建立一定的关系模型。检验设定的模型是否存在多重共线性,分析产生多重共线性的原因及作用因素,并对存在多重共线性的模型进行必要的修正。 实验内容: 1、中国进出口额Y、国内生产总值GDP、居民消费价格指数CPI,根据提供的模型估计参数,判断多重共线性是否存在,表述多重共线性的性质。 2、检验能源消费需求总量Y的影响因素,选取国民总收入X1、国内生产总值X2、工业增加值X 3、建筑业增加值X 4、交通运输邮电业增加值X 5、人均生活电力消费X6和能源加工转换效率X7七个变量,模拟回归,检验修正多重共线性。 3、为什么会产生“农业的发展反而会减少财政收入”的异常结果,如何解决这种异常。 实验步骤: 一、中国进出口额Y、国内生产总值GDP、居民消费价格指数CPI (一)建立多元回归模型,估计参数 在命令窗口依次键入以下命令: 1、建立工作文件:CREATE A 1985 2007 2:输入统计资料:DATA Y GDP CPI 3、生成变量:GENR LNY=LOG(Y) GENR LNGDP=LOG(GDP) GENR LNCPI=LOG(CPI) 4、建立回归模型:LS LNY C LNGDP LNCPI 得出回归结果为:

由此可见,该模型的参数形式为:LN?t=-3.06+1.66LNGDP t-1.06LNCPI t,其中该模型R2=0.9922,R2=0.9914可决系数很高,F检验值1275.093,明显显著,且T检验的临界概率均非常小,回归效果较好。 (二)检验多重共线性 利用简单相关系数法进行检验,输入命令COR LNY LNGDP LNCPI,得到相关系数矩阵: 由相关系数矩阵可以看出,各解释变量相互之间的相关系数均很高,说明数据中存在严重的多重共线性。 (三)进行以下回归: 1、lnY t=A1+A2lnGDP t+v1i ln?t=-4.0907 +1.2186lnGDP t =(-10.6458) (34.6222) R2=0.9828 R2=0.9820 F=1198.698

异方差 自相关 多重共线性上机实验报告

异方差检验与修正 题目如下:由表中给出1985年我国北方几个省市农业总产值,农用化肥量、农用水利、 农业劳动力、每日生产性固定生产原值以及农机动力数据,要求: (1) 试建立我国北方地区农业产出线性模型; (2) 选用适当的方法检验模型中是否存在异方差; (3) 如果存在异方差,采用适当的方法加以修正。 一、模型设定 选择农业总产值为被解释变量Y ;选择农业劳动力、灌溉面积、化肥用量、户均 固定、农机动力分别为解释变量1X 2X 3X 4X 5X 。 数据如下: 地区 农业总产值 农业劳动力 灌溉面积 化肥用量 户均固定 农机动力 (亿元) (万人) (万公顷) (万吨) 资产(元) (万马力) 北京 19.64 90.1 33.84 7.5 394.3 435.3 天津 14.4 95.2 34.95 3.9 567.5 450.7 河北 149.9 1639 .0 357.26 92.4 706.89 2712.6 山西 55.07 562.6 107.9 31.4 856.37 1118.5 内蒙古 60.85 462.9 96.49 15.4 1282.81 641.7 辽宁 87.48 588.9 72.4 61.6 844.74 1129.6 吉林 73.81 399.7 69.63 36.9 2576.81 647.6 黑龙江 104.51 425.3 67.95 25.8 1237.16 1305.8 山东 276.55 2365.6 456.55 152.3 5812.02 3127.9 河南 200.02 2557.5 318.99 127.9 754.78 2134.5 陕西 68.18 884.2 117.9 36.1 607.41 764 新疆 49.12 256.1 260.46 15.1 1143.67 523.3 二、描述性统计 view-discriptive stats-common sample 的结果:

相关文档
最新文档