多元回归(多重共线-异方差-残差检验eviews-spss)

多元回归(多重共线-异方差-残差检验eviews-spss)
多元回归(多重共线-异方差-残差检验eviews-spss)

数据处理: 4.3 模型建立

设年末实有耕地面积,有效灌溉率,农用塑料薄膜使用量,农药使用量,农业机械总动力,农业从业人数,农业投资额分别为127,,,X X X L ;农业产值为Y 。在此我们假设上述七个变量都与农业产值有显著影响,在SPSS 中用进入法对其做出预判。

表4-3 回归预判表

模型 非标准化系数

标准化系数

T 显著性 共线性统计 B 标准误差 Bata 允差 VIF

(常数) 1.987E-15 .018

.000 1.000

年末实有耕地面积 .225 .291 .225 .775 .464 .004 239.655 有效灌溉率

.208 .116 .208 1.797 .115 .026

38.086

农用塑料薄膜使用量

-.396 .489 -.396 -.810 .445 .001 677.462 农药使用量 -.426 .564 -.426 -.756 .475 .001 899.494 农业机械总动力 .831 .282 .831 2.946 .022 .004 225.582 农业从业人数 .024 .179 .024 .136 .895 .011 90.381 农业投资额

.197

.140

.197

1.401

.204

.018

55.747

因变量: 农业产值

可以从表中得出回归方程:

12345670.2250.2080.3960.4260.8310.0240.197Y X X X X X X X =+---++

从显著性水平上看,小于0.05的只有一个农业机械动力,显然不能够准确的表达出与农业产值之间的关系。根据表中的VIF 值均大于10,其中四个大于了100,这说明模型中存在严重的多重共线性。并且在相关系数表中(附表1-2),我们也能够看出各个自变量之间相关系数较大,有较大的相关性。为了保证得到的回归模型能较好的反映真实意义,就要解决多重共线性问题。解决多重共线性我们一般使用逐步回归的方法。

4.3.1 逐步回归

将标准化后的数据输入EVIEWS ,首先找出与因变量拟合度最高自变量,的经过回归拟合可以得出7个变量的拟合优度,按降序排列如下表:

表4-4 拟合优度表

变量 拟合优度 5X 0.984325 3X 0.972272 4X 0.972024 1X

0.906987 7X 0.903033 2X 0.84501 6X

0.684597

拟合优度的大小也能在一定程度上表现出自变量与因变量的影响大小。这里

5X 是农业机械总动力,说明农业机械总动力对农业产值有较大的影响。在近年来江苏省整体经济发展迅速,科技水平大大提高,使农业的机械化水平发展迅速,机械设备的使用极大促进了农业产值的提高。

由表44-得,Y 与5X 的拟合优度最高,故Y 5X 作为基本方程。依次按拟合优度降序排列进入模型,检验新进入的变量是否显著并且拟合优度是否提高。拟合优度排第二的是变量3X ,所以将3X 进入基础模型。

3X 进入基本方程,结果如下图:

图4-1 变量判断图

从图41-的运行结果我们可以看出,3X 的估计量对应的0.8094p =大于

0.05,不显著,所以3X 不符合回归模型。3X 是农膜使用量,可以看出其对农业

产值的影响不显著。农膜主要使用在经济作物的种植中,近年来有部分农户利用地膜覆盖技术和塑料大棚进行种植、栽培瓜果蔬菜,获得了可观的收益,但是普及率不是很高,是一个对农业产值的影响不是很大。

所以我们不选择变量3X ,再将4X 进入基本方程。

图4-2 第一步逐步回归图

由图42-可以看出,4X 的估计量对应的0.8548p =值大于0.05,所以没有显著性,所以4X 同样不符合回归模型,故删去变量4X 。4X 为农药使用量,所以农药使用量对农业产值没有显著影响。

再将1726,,,X X X X 依次进入方程判断最优拟合方程,1X ,6X 不显著,7X 显著,2X 也是具有显著性的,表明农业投资额,有效灌溉率对农业产值也有显著影响,但是农业投资额对农业产值的影响大还是有效灌溉率对农业产值的影响大,还需要进一步比较。

表4-5 拟合优度表

变量 系数

标准差

t 值

p 值 拟合优度

1

常数

-1.57E-07 0.022013 -7.11E-06 1.0000 0.9937700 5X 0.76519 0.057883 13.21969 0.0000 7X

0.246876 0.057883 4.26518 0.0011 2

常数

8.13E-10 0.03293 2.47E-08 1.0000 0.986058 2X 0.999922 0.0818 1.221544 0.2453 5X

0.901298

0.0818

11.01832

0.0000

由表45-可得,但由于模型Y 5X 7X 的拟合优度为0.993770,模型Y 2X 5

X 的拟合优度为0.986058,比较他们两个的拟合优度,发现模型Y 5X 7X 的拟合优度较大,故选则Y 5X 7X 作为基本方程。然后按照第一次逐步回归法的步骤依次添加变量,并根据p 值判断其显著性。

可以得出Y

5X 7X 2X 为最终方程,p 值分别为

20.0107p =,20.0000p =,20.0001p =,均显著。经过逐步回归依次得到农业机械总动力,农业投资额,有效灌溉率对农业产值的影响较为显著。估计结果如下图:

图4-3 逐步回归模型结果图

从图43-中可以得出系数:

702571.5910,0.129540,0.263208,0.263208ββββ-=-?===,

所以写出对应的估计方程为:

72571.59100.1295400.6324180.263208Y X X X -=-?+++。

得出估计方程还要进行各项检验,只有通过检验才能说明我们得到的方程有效,才具有实际意义。

4.3.2 F 检验

F 检验的原假设和备择假设如下:

001:0n H βββ====L ;

1:(0,1,,)i H i n β=L 不全为零。

从图43-中可以看出F 检验(F-statistic)对应的p 值小于0.05,所以拒绝0H ,所以我们得出的估计方程存在显著的线性关系。

4.3.3 t 检验

t 检验的原假设和备择假设为:

0:0i H β=; 1:0i H β≠。

由图43-可以看出变量

2X 5X 7

X 分别对应的

20.0107p =,20.0000p =,20.0001p =均小于0.05,拒绝原假设0H 。

同样可以看模型得出的t 值,2573.067362,10.20083, 5.887977t t t ===,通过查找t 分布表得,用t 值与0.052(11) 2.201t =进行比较,如果0.052(11)i t t >,则拒绝原假设所以回归系数显著。变量5X 7X 2X 对Y 有显著影响。

4.3.4 异方差检验

由于异方差的存在使得最小二乘估计量不再是最好线性无偏估计量,会导致模型的残差不再是同方差的,所以要对模型进行异方差检验。

(1)图示法

此方法是较为原始的一种检验异方差的方法,可以直观的看出残差平方的散点图是否与样本数据i X 或i Y 有明显的关系,若随着i X 或i Y 的变化而变化,那么就说明存在异方差性。

这里我们可以看出残差平方的散点图呈不规则状,散乱分布,所以我们得出的回归模型不存在异方差性。

图4-4 异方差散点图

(2)怀特(white )检验

可以看出模型中有三个解释变量,那么模型辅助回归可以写成:

2220112233415263712813923t t t t t t t t t t t t t t u x x x x x x x x x x x x ααααααααααε=++++++++++

其原假设和备择假设分别为:

0:0i H α=,1,,9i =L ;

119:,,H ααL 中至少一个不为零。

怀特检验的运行图如下:

图4-5 怀特检验图

给定显著性水平0.05,obs*R -squared 对应的0.5587p =大于0.05,(错了要改正))拒绝原假设,故不存在异方差。

4.3.5 自相关检验

误差存在自相关时,模型中的系数用最小二乘估计计算会不准确,往往会算出的系数的真实方差值和误差项的方差值会偏小。为了检验得到的方程的准确性,我们进行自相关检验。

DW 检验的原假设和备择假设分别为:

0:0H ρ=(t u 不存在自相关)

1:0H ρ≠(t u 存在一阶自相关)

表4-6 DW 检验运行结果图

从表中得出,DW 值为1.964452,通过查找DW 表可得,当n =15,k =3时,

0.82L d =, 1.75U d =,所以DW 值在区间(1.75,2.25)之间。这说明所建立的线性回归模型无自相关现象,不需要修正DW 值检验。

4.3.6 残差检验

图4-7 残差分析图

由于JB对应的0.76874

p 大于0.05,所以拒绝原假设。从残差分析图上也可以直观的看出残差直方图中间高,两边低,基本服从正态分布。所以我们估计的线性回归模型是有意义的。

4.3.7 组内预测

对样本内数据进行组内预测:

图4-8 组内预测图

由图4-8可知,预测值和真实值几乎完全重合,且残差在零水平线上下波动,说明模型总体上效果较好。

计量经济学异方差的检验与修正

《计量经济学》实训报告 实训项目名称异方差模型的检验与处理 实训时间 2012-01-02 实训地点实验楼308 班级 学号 姓名

实 训 (实 践 ) 报 告 实 训 名 称 异方差模型的检验与处理 一、 实训目的 掌握异方差性的检验及处理方法。 二 、实训要求 1.求销售利润与销售收入的样本回归函数,并对模型进行经济意义检验和统计检验; 2.分别用图形法、Goldfeld-Quant 检验、White 方法检验模型是否存在异方差; 3.如果模型存在异方差,选用适当的方法对异方差进行修正,消除或减小异方差对模型的影响。 三、实训内容 建立并检验我国制造业利润函数模型,检验异方差性,并选用适当方法对其进行修正,消除或不同) 四、实训步骤 1.建立一元线性回归方程; 2.建立Workfile 和对象,录入数据; 3.分别用图形法、Goldfeld-Quant 检验、White 方法检验模型是否存在异方差; 4.对所估计的模型再进行White 检验,观察异方差的调整情况,从而消除或减小异方差对模型的影响。 五、实训分析、总结 表1列出了1998年我国主要制造工业销售收入与销售利润的统计资料。假设销售利润与销售收入之间满足线性约束,则理论模型设定为: 12i i i Y X u ββ=++ 其中i Y 表示销售利润,i X 表示销售收入。

表1 我国制造工业1998年销售利润与销售收入情况 行业名称销售利润Y 销售收入X 行业名称销售利润销售收入 食品加工业187.25 3180.44 医药制造业238.71 1264.1 食品制造业111.42 1119.88 化学纤维制品81.57 779.46 饮料制造业205.42 1489.89 橡胶制品业77.84 692.08 烟草加工业183.87 1328.59 塑料制品业144.34 1345 纺织业316.79 3862.9 非金属矿制品339.26 2866.14 服装制品业157.7 1779.1 黑色金属冶炼367.47 3868.28 皮革羽绒制品81.7 1081.77 有色金属冶炼144.29 1535.16 木材加工业35.67 443.74 金属制品业201.42 1948.12 家具制造业31.06 226.78 普通机械制造354.69 2351.68 造纸及纸品业134.4 1124.94 专用设备制造238.16 1714.73 印刷业90.12 499.83 交通运输设备511.94 4011.53 文教体育用品54.4 504.44 电子机械制造409.83 3286.15 石油加工业194.45 2363.8 电子通讯设备508.15 4499.19 化学原料纸品502.61 4195.22 仪器仪表设备72.46 663.68 1.建立Workfile和对象,录入销售收入X和销售利润Y: 图1 销售收入X和销售利润Y的录入 2.图形法检验 ⑴观察销售利润Y与销售收入X的相关图:在群对象窗口工具栏中点击

异方差性的white检验及处理方法

实验二异方差模型的white检验与处理 【实验目的】 掌握异方差性的white检验及处理方法 【实验原理】 1. 定性分析异方差 (1) 经济变量规模差别很大时容易出现异方差。如个人收入与支出关系,投入与产出 关系。 (2) 利用散点图做初步判断。 (3) 利用残差图做初步判断。 2、异方差表现与来源异方差通常有三种表现形式 (1)递增型 (2)递减型 (3)条件自回归型。 3、White检验 (1)不需要对观测值排序,也不依赖于随机误差项服从正态分布,它是通过一个辅助回归式构造 2 统计量进行异方差检验。White检验的零假设和备择假设是 H0: (4-1)式中的ut不存在异方差, H1: (4-2)式中的ut存在异方差。 (2)在不存在异方差假设条件下,统计量 T R 2 2(5) 其中T表示样本容量,R2是辅助回归式(4-3)的OLS估计式的可决系数。自由度5表示辅助回归式(4-3)中解释变量项数(注意,不计算常数项)。T R 2属于LM统计量。 (3)判别规则是 若T R 2 2 (5), 接受H0(ut 具有同方差) 若T R 2 > 2 (5), 拒绝H0(ut 具有异方差) 【实验软件】 Eview6 【实验要求】 熟练掌握异方差white检验方法 【实验内容】 建立并检验我国部分城市国民收入y和对外直接投资FDI异方差模型 【实验方案设计】 下表列出了我国各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据,并利用统计软件Eviews建立异方差模型

表1 各地区农村居民家庭人均纯收入与家庭人均生活消费支出的数据(单位:元) 【实验过程】 1、启动Eviews6软件,建立新的workfile. 在主菜单中选择【File 】--【New 】--【Workfile 】,弹出 Workfile Create 对话框,在Workfile structure typ 中选择unstructured/undted.然后在observations 中输入31.在WF 中输入Work1,点击OK 按钮。如图: 2、数据导入且将要分析的数据复制黏贴. 在主菜单的空白处输入data x y 按下enter 。将家庭人均纯收入X 和家庭生活消 地区 家庭人均 纯收入 家庭生活消费支出 地区 家庭人均 纯收入 家庭生活消费支出 北京 湖北 3090 天津 湖南 河北 广东 山西 广西 内蒙古 海南 辽宁 重庆 吉林 四川 黑龙江 贵州 上海 云南 江苏 西藏 浙江 陕西 安徽 甘肃 福建 青海 江西 宁夏 山东 新疆 河南

试验一异方差的检验与修正-时间序列分析

案例三 ARIMA 模型的建立 一、实验目的 了解ARIMA 模型的特点和建模过程,了解AR ,MA 和ARIMA 模型三者之间的区别与联系,掌握如何利用自相关系数和偏自相关系数对ARIMA 模型进行识别,利用最小二乘法等方法对ARIMA 模型进行估计,利用信息准则对估计的ARIMA 模型进行诊断,以及如何利用ARIMA 模型进行预测。掌握在实证研究如何运用Eviews 软件进行ARIMA 模型的识别、诊断、估计和预测。 二、基本概念 所谓ARIMA 模型,是指将非平稳时间序列转化为平稳时间序列,然后将平稳的时间序列建立ARMA 模型。ARIMA 模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA )、自回归过程(AR )、自回归移动平均过程(ARMA )以及ARIMA 过程。 在ARIMA 模型的识别过程中,我们主要用到两个工具:自相关函数ACF ,偏自相关函数PACF 以及它们各自的相关图。对于一个序列{}t X 而言,它的第j 阶自相关系数j ρ为它的j 阶自协方差除以方差,即j ρ=j 0γγ ,它是关于滞后期j 的函数,因此我们也称之为自相关函数,通常记ACF(j )。偏自相关函数PACF(j )度量了消除中间滞后项影响后两滞后变量之间的相关关系。 三、实验内容及要求 1、实验内容: (1)根据时序图的形状,采用相应的方法把非平稳序列平稳化; (2)对经过平稳化后的1950年到2007年中国进出口贸易总额数据运用经典B-J 方法论建立合适的ARIMA (,,p d q )模型,并能够利用此模型进行进出口贸易总额的预测。 2、实验要求: (1)深刻理解非平稳时间序列的概念和ARIMA 模型的建模思想; (2)如何通过观察自相关,偏自相关系数及其图形,利用最小二乘法,以及信息准则建立合适的ARIMA 模型;如何利用ARIMA 模型进行预测; (3)熟练掌握相关Eviews 操作,读懂模型参数估计结果。 四、实验指导 1、模型识别 (1)数据录入 打开Eviews 软件,选择“File”菜单中的“New --Workfile”选项,在“Workfile structure type ”栏选择“Dated –regular frequency ”,在“Date specification ”栏中分别选择“Annual ”(年数据) ,分别在起始年输入1950,终止年输入2007,点击ok ,见图3-1,这样就建立了一个工作文件。点击File/Import ,找到相应的Excel 数据集,导入即可。

异方差性的检验及处理方法

实验四异方差性 【实验目的】 掌握异方差性的检验及处理方法 【实验内容】 建立并检验我国制造业利润函数模型 【实验步骤】 【例1】表1列出了1998年我国主要制造工业销售收入与销售利润的统计资料,请利用统计软件Eviews建立我国制造业利润函数模型。 一、检验异方差性 ⒈图形分析检验 ⑴观察销售利润(Y)与销售收入(X)的相关图(图1):SCAT X Y 图1 我国制造工业销售利润与销售收入相关图 从图中可以看出,随着销售收入的增加,销售利润的平均水平不断提高,但离散程度也逐步扩大。这说明变量之间可能存在递增的异方差性。

⑵残差分析 首先将数据排序(命令格式为:SORT 解释变量),然后建立回归方程。在方程窗口中点击Resids按钮就可以得到模型的残差分布图(或建立方程后在Eviews工作文件窗口中点击resid对象来观察)。 图2 我国制造业销售利润回归模型残差分布 图2显示回归方程的残差分布有明显的扩大趋势,即表明存在异方差性。 ⒉Goldfeld-Quant检验 ⑴将样本按解释变量排序(SORT X)并分成两部分(分别有1到10共11个样本合19到28共10个样本) ⑵利用样本1建立回归模型1(回归结果如图3),其残差平方和为2579.587。 SMPL 1 10 LS Y C X 图3 样本1回归结果 ⑶利用样本2建立回归模型2(回归结果如图4),其残差平方和为63769.67。 SMPL 19 28 LS Y C X

图4 样本2回归结果 ⑷计算F 统计量:12/RSS RSS F ==63769.67/2579.59=24.72,21RSS RSS 和分别是模型1和模型2的残差平方和。 取 05 .0=α时,查F 分布表得 44.3)1110,1110(05.0=----F ,而 44.372.2405.0=>=F F ,所以存在异方差性 ⒊White 检验 ⑴建立回归模型:LS Y C X ,回归结果如图5。 图5 我国制造业销售利润回归模型 ⑵在方程窗口上点击View\Residual\Test\White Heteroskedastcity,检验结果如图6。 图6 White 检验结果

异方差性习题及答案

异方差性 一、单项选择 1.Goldfeld-Quandt 方法用于检验( ) A.异方差性 B.自相关性 C.随机解释变量 D.多重共线性 2.在异方差性情况下,常用的估计方法是( ) A.一阶差分法 B.广义差分法 C.工具变量法 D.加权最小二乘法 3.White 检验方法主要用于检验( ) A.异方差性 B.自相关性 C.随机解释变量 D.多重共线性 4.Glejser 检验方法主要用于检验( ) A.异方差性 B.自相关性 C.随机解释变量 D.多重共线性 5.下列哪种方法不是检验异方差的方法 ( ) A.戈德菲尔特——匡特检验 B.怀特检验 C.戈里瑟检验 D.方差膨胀因子检验 6.当存在异方差现象时,估计模型参数的适当方法是 ( ) A.加权最小二乘法 B.工具变量法 C.广义差分法 D.使用非样本先验信息 7.加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同的权数,从而提高估计精度,即 ( ) A.重视大误差的作用,轻视小误差的作用 B.重视小误差的作用,轻视大误差的作用 C.重视小误差和大误差的作用 D.轻视小误差和大误差的作用 8.如果戈里瑟检验表明,普通最小二乘估计结果的残差i e 与i x 有显著的形式 i i i v x e +=28715.0的相关关系(i v 满足线性模型的全部经典假设),则用加权最小二 乘法估计模型参数时,权数应为 ( ) A. i x B. 21i x C. i x 1 D. i x 1 9.如果戈德菲尔特——匡特检验显著,则认为什么问题是严重的 ( ) A.异方差问题 B.序列相关问题 C.多重共线性问题 D.设定误差问题 10.设回归模型为i i i u bx y +=,其中i i x u Var 2)(σ=,则b 的最有效估计量为( ) A. ∑∑=2?x xy b B. 2 2)(?∑∑∑∑∑--=x x n y x xy n b C. x y b =? D. ∑=x y n b 1? 二、多项选择 1.下列计量经济分析中那些很可能存在异方差问题( ) A.用横截面数据建立家庭消费支出对家庭收入水平的回归模型 B.用横截面数据建立产出对劳动和资本的回归模型 C.以凯恩斯的有效需求理论为基础构造宏观计量经济模型

异方差性的检验和补救

异方差性的检验和补救 一、研究目的和要求 表1列出了1998年我国主要制造工业销售收入与销售利润的统计资料,请利用统计软件Eviews建立我国制造业利润函数模型,检验其是否存在异方差,并加以补救。 表1 我国制造工业1998年销售利润与销售收入情况 二、参数估计 EVIEWS 软件估计参数结果如下

Dependent Variable: Y Method: Least Squares Date: 06/01/16 Time: 20:16 Sample: 1 28 Included observations: 28 Variable Coefficient Std. Error t-Statistic Prob. C 12.03349 19.51809 0.616530 0.5429 X 0.104394 0.008442 12.36658 0.0000 R-squared 0.854694 Mean dependent var 213.4639 Adjusted R-squared 0.849105 S.D. dependent var 146.4905 S.E. of regression 56.90455 Akaike info criterion 10.98938 Sum squared resid 84191.34 Schwarz criterion 11.08453 Log likelihood -151.8513 Hannan-Quinn criter. 11.01847 F-statistic 152.9322 Durbin-Watson stat 1.212781 Prob(F-statistic) 0.000000 用规范的形式将参数估计和检验结果写下 2?12.033490.104394(19.51809)(0.008442) =(0.616530) (12.36658)0.854694152.9322 i Y X t R F =+ = = 三、 检验模型的异方差 (一) 图形法 1. 相关关系图 X Y X Y 相关关系图

异方差的检验与修正

财经学院 本科实验报告 学院(部)统计学院 实验室313 课程名称计量经济学 学生姓名 学号1204100213 专业统计学 教务处制 2014年12 月15 日

《异方差》实验报告

五、实验过程原始记录(数据、图表、计算等) 一.选择数据 1.建立工作文件并录入数据File\New\workfile, 弹出Workfile create 对话框中选择数据类型。Object\new object\group,按向上的方向键,出现两个obs 后输入数据. 中国地2006年各地区农村居民家庭人均纯收入与消费支出 单位:元 城市 y x1 x2 城市 y x1 x2 5724.5 958.3 7317.2 2732.5 1934.6 1484.8 3341.1 1738.9 4489 3013.3 1342.6 2047 2495.3 1607.1 2194.7 3886 1313.9 3765.9 2253.3 1188.2 1992.7 广西 2413.9 1596.9 1173.6 2772 2560.8 781.1 2232.2 2213.2 1042.3 3066.9 2026.1 2064.3 2205.2 1234.1 1639.7 2700.7 2623.2 1017.9 2395 1405 1597.4 2618.2 2622.9 929.5 1627.1 961.4 1023.2 8006 532 8606.7 2195.6 1570.3 680.2 4135.2 1497.9 4315.3 2002.2 1399.1 1035.9 6057.2 1403.1 5931.7 2181 1070.4 1189.8 2420.9 1472.8 1496.3 1855.5 1167.9 966.2 3591.4 1691.4 3143.4 2179 1274.3 1084.1 2676.6 1609.2 1850.3 2247 1535.7 1224.4 3143.8 1948.2 2420.1 2032.4 2267.4 469.9 2229.3 1844.6 1416.4 二.对数据进行参数估计,得出多元线性回归模型 1.模型设定为εβββ+++=23121i i i X X Y Yi ----人均消费支出 X1--从事农业经营的纯收入 X2--其他来源的纯收入 2.点Quick\estimate equation,在弹出的对话框中输入”Y C X ”,结果如下:

回归模型中异方差性的检验与消除研究

回归模型中异方差性的检验与消除研究 摘要:经典线性回归模型的一个重要假设就是回归方程的随机扰动项,具有相同的方差,也称同方差性。但在大多数经济现象中,这种假设不一定成立,有时扰动项的方差随观察值的不同而变化,这就是异方差性。在经济研究中,异方差性的存在使得回归模型失效。本文以SPSS为分析工具,来研究回归模型中异方差性检验和消除。 关键词:异方差性SPSS分析工具异方差检验和消除一、引言 回归分析是处理随机变量之间的相关关系的一种统计 方法。即研究一个被解释变量与一个或多个解释变量之间的统计关系。 异方差性会导致严重的后果,所以对异方差性的检验无疑是非常重要的。对异方差检验的方法有很多,如残差图分析法、等级相关系数法、格莱斯尔检验等等,本文采用残差图和等级相关系数法进行异方差性检验。 二、检验方法 (一)散点图检验法 1、散点图检验法以残差e为纵坐标,以自变量为横坐标画散点图。其中残差e是指观测值与预测值之间的差,即

实际观察值与回归估计值的差。但需要指出的是,散点图检验法只能粗略、简单地判断异方差的存在与否,要想准确判断异方差是否存在,必须通过下面即将介绍到的等级相关系数法。 2、判定 当回归模型满足所有假定时,残差图上的几个点的散布应是随机的,无任何规律。此时随机误差项为齐性;如果回归模型存在异方差,残差图上的点的散布呈现出相应的趋势,e值会随自变量值增大而增大或减小,有明显的规律,这时 可以认为模型的随机误差项为非齐性。 (二)等级相关系数检验法 Y关于X的回归方程为: 等级相关系数:r|e|?x=1-6∑ni=1d2in(n2-1),其中,n 为样本容量,di为对应于xi和|ei|的等级的差数。对总体的 等级相关系数ρ|e|?x进行假设检验: 1、假设:H0:ρ|e|?x=0H1:ρ|e|?x≠0 当n>8时,构造t检测模型。 2、构造检验统计量: t=re?xn-21-r2e?x~t(n-2) 3、给定显著性水平α 4、确定临界值:tα/2(n-2) 5、判定:

实验异方差地检验与修正

实验异方差的检验与修正 实验目的 1、理解异方差的含义后果、 2、学会异方差的检验与加权最小二乘法 实验容 一、准备工作。建立工作文件,并输入数据,用普通最小二乘法估计方程(操作 步骤与方法同前),得到残差序列。 表2列出了1998年我国主要制造工业销售收入与销售利润的统计资料,请利用统计软件Eviews建立我国制造业利润函数模型。 表2 我国制造工业1998年销售利润与销售收入情况 二、异方差的检验 1、图形分析检验 ⑴观察销售利润(Y)与销售收入(X)的相关图(图3-1):SCAT X Y

图3-1 我国制造工业销售利润与销售收入相关图 从图中可以看出,随着销售收入的增加,销售利润的平均水平不断提高,但离散程度也逐步扩大。这说明变量之间可能存在递增的异方差性。 ⑵残差分析 首先将数据排序(命令格式为:SORT 解释变量),然后建立回归方程。在方程窗口中点击Resids按钮就可以得到模型的残差分布图(或建立方程后在Eviews工作文件窗口中点击resid对象来观察)。 图3-2 我国制造业销售利润回归模型残差分布 图3-2显示回归方程的残差分布有明显的扩大趋势,即表明存在异方差性。 2、Goldfeld-Quant检验 ⑴将样本安解释变量排序(SORT X)并分成两部分(分别有1到10共11个样本合19到28共10个样本) ⑵利用样本1建立回归模型1(回归结果如图3-3),其残差平方和为2579.587。 SMPL 1 10 LS Y C X

图3-3 样本1回归结果 ⑶利用样本2建立回归模型2(回归结果如图3-4),其残差平方和为63769.67。 SMPL 19 28 LS Y C X 图3-4 样本2回归结果 ⑷计算F 统计量:12/RSS RSS F ==63769.67/2579.59=24.72,21RSS RSS 和分别是模型1和模型2的残差平方和。 取05.0=α时,查F 分布表得44.3)1110,1110(05.0=----F ,而 44.372.2405.0=>=F F ,所以存在异方差性 3、White 检验 ⑴建立回归模型:LS Y C X ,回归结果如图3-5。

检验和消除异方差和自相关的报告

消除异方差和自相关的实验报告【实验内容】 通过查询中国统计局的2012年中国统计年鉴及新浪财经数据网,获得1980年--2012年各项指标的数据,如下表所示: 年份Y-出口贸易总额 (亿美元)X-外商直接投资(亿美元) 1980181.19 3.54 1981220.10 3.54 1982223.20 3.54 1983222.309.20 1984261.4014.20 1985273.5019.56 1986309.4022.44 1987394.4023.14 1988475.2031.94 1989525.4033.92 1990620.9134.87 1991719.1043.66 1992849.40110.08 1993917.44275.15 19941210.06337.67 19951487.80375.21 19961510.48417.26 19971827.92452.57 19981837.09454.63 19991949.31403.19

20002492.03407.15 20012660.98468.78 20023255.96527.43 20034382.28535.05 20045933.26606.30 20057619.53603.25 20069689.36630.21 200712177.76747.68 200814306.93923.95 200912016.12900.33 201015779.301057.40 201118986.001160.23 201220489.301116.16【实验步骤——检验并消除异方差】 一检查模型是否存在异方差性 1、图形分析检验 (1)散点相关图分析

异方差检验

七、 异方差与自相关 一、背景 我们讨论如果古典假定中的同方差和无自相关假定不能得到满足,会引起什么样的估计问题呢?另一方面,如何发现问题,也就是发现和检验异方差以及自相关的存在性也是一个重要的方面,这个部分就是就这个问题进行讨论。 二、知识要点 1、引起异方差的原因及其对参数估计的影响 2、异方差的检验(发现异方差) 3、异方差问题的解决办法 4、引起自相关的原因及其对参数估计的影响 5、自相关的检验(发现自相关) 6、自相关问题的解决办法 (时间序列部分讲解) 三、要点细纲 1、引起异方差的原因及其对参数估计的影响 原因:引起异方差的众多原因中,我们讨论两个主要的原因,一是模型的设定偏误,主要指的是遗漏变量的影响。这样,遗漏的变量就进入了模型的残差项中。当省略的变量与回归方程中的变量有相关关系的时候,不仅会引起内生性问题,还会引起异方差。二是截面数据中总体各单位的差异。 后果:异方差对参数估计的影响主要是对参数估计有效性的影响。在存在异方差的情况下,OLS 方法得到的参数估计仍然是无偏的,但是已经不具备最小方差性质。一般而言,异方差会引起真实方差的低估,从而夸大参数估计的显著性,即是参数估计的t 统计量偏大,使得本应该被接受的原假设被错误的拒绝。 2、异方差的检验 (1)图示检验法 由于异方差通常被认为是由于残差的大小随自变量的大小而变化,因此,可以通过散点图的方式来简单的判断是否存在异方差。具体的做法是,以回归的残差的平方2i e 为纵坐标,回归式中的某个解释变量i x 为横坐标,画散点图。如果散点图表现出一定的趋势,则可以判断存在异方差。 (2)Goldfeld-Quandt 检验

Eviews 进行异方差性检验及估计模型

异方差性检验及存在异方差模型估计 检验使用方法:(1)G-Q检验(2)White 检验 模型估计方法:加权最小二乘法(WLS) 下表为2000年中国部分省市城镇居民每个家庭平均年可支配收入(X)与消费性支出(Y)的统计数据: 1

一、利用Eviews求出线性模型 可得模型: ?272.2250.755 i i Y X =+ 2

(1.705) (32.394) R2=0.9832 二、异方差检验 (1)G-Q检验:首先将可支配收入X升序进行排列,然后去掉中间4个样本,将余下的样本分为容量各为8的两个子样本,并分别进行回归。 大样本小样本 3

样本取值较小的Eviews输出结果如下 残差平方和:RSS1=126528.3 4

样本取值较大的Eviews输出结果如下: 残差平方和:RSS2=615073.7 因此统计量为:2 14.8611 RSS F RSS == 在5%的显著性水平下,0.05(6,6) 4.28 F=,4.86>4.28,因此拒绝原假设,存在异方差性。 5

(2)White检验:在原模型的最小二乘估计窗口上选择“View\Residual Tests\Heteroskedasticity Tests\White”得到如下结果: x ,因此12.6478>5.99,因而拒绝原假设,检验统计量值为12.64768,查询20.05(2) 5.99 模型存在异方差。 三、估计存在异方差的经济模型 利用加权最小二乘法(WLS)进行估计:首先在对原模型进行估计后,保存残差,步骤如下:①Quick\Generate Series 再输入“e1=resid”,得到e1 ②Quick\Estimte Equation 再输入“Y C X” ③选择Options,在“Weighted LS/TLS”输入“1/abs(e1)”(备注:abs表示绝对值) 得到如下结果; 6

异方差的检验比较和修正

2007年 5 月 Journal of Science of Teachers′College and University May 2007 文章编号:1007-9831(2007)03-0027-03 异方差的检验比较和修正 陈晖1, 2 ,杨乃军 3 (1. 山东大学 数学与系统科学学院,山东 济南 250100;2. 烟台职业学院 软件工程学院,山东 烟台 264001; 3. 烟台大学 教务处,山东 烟台 264001) 摘要:异方差是计量经济工作中线性回归模型经常遇到的问题,异方差的存在对线性回归分析有很强的破坏作用.通过对异方差产生的原因和后果进行分析,利用异方差的戈德菲尔特-夸特检验、拉格朗日乘数(LM)检验、怀特检验方法,判断线性回归模型异方差的存在性.通过加权最小二乘法或可行广义最小二乘法进行修正,建立能够真正反映经济规律的经济模型,实现对经济的正确指导作用. 关键词:异方差;戈德菲尔特-夸特检验;拉格朗日乘数(LM)检验;最小二乘法 中图分类号:F222.1 文献标识码 :A 1 异方差产生的原因 在计量经济学中,建立线性回归模型时需要做一些假设,从而保证所分析的变量关系符合线性回归分析的基本规定性,明确分析对象,保证回归分析的有效性.其中之一要求随机误差项同方差,即2)var(σε=i 不随i 变化,保证扰动因素对被解释变量的影响是简单的、随机的,不构成主要的影响因素.当这条假设不满足,也就是线性回归模型误差项2)var(i i σε=随i 的变化而变化,这时候就产生了异方差,此时称线性回归模型存在异方差或异方差性.如果对应线性回归模型误差项随着i X 或i 的增大而增大,称为“递增异方差”,反之称为“递减异方差”,有时也有先增后减或者先减后增的其他复杂类型的异方差[1-2] . 模型中异方差产生的原因,根据来源可以归纳为以下几方面原因:(1)模型中省略相关的解释变量; (2)误差随时间变化而变化;(3)模型设定不合理带来异方差;(4)分组数据误差带来异方差. 2 异方差的后果 计量经济模型一旦出现异方差,就会破坏模型假设的基本条件,如果仍然采用普通最小二乘法的估计方法,则会产生如下的不良后果: (1)参数估计量失效:因为在有效性证明中利用了同方差的条件,因此所求的OLS 参数估计值虽然仍具有无偏性,但不再是有效的; (2)变量的显著性检验失效:因为在变量的显著性检验中,构造的t 统计量包含有随机误差项的方差 2u σ,如果出现异方差,则t 检验就失去意义; (3)模型预测失效:这是因为在预测值的置信区间中包含有随机误差项的方差2 u σ,导致预测值的置 信区间加大,降低了预测的精度,使预测失效[3] . 3 异方差的检验方法 收稿日期:2006-12-18 作者简介:陈晖(1970-),女,山东青岛人,讲师,在读研究生,从事金融数学研究.E-mail:ch_yt@https://www.360docs.net/doc/df9969171.html,

IV和GMM相关估计步骤,内生性、异方差性等检验方法

IV和GMM相关估计步骤,内?性、异?差性… ?具变量和?义矩估计相关步骤 ?、解释变量内?性检验 ?先检验解释变量内?性(解释变量内?性的Hausman 检验:使??具变量法的前提是存在内?解释变量。Hausman 检验的原假设为:所有解释变量均为外?变量,如果拒绝,则认为存在内?解释变量,要?IV;反之,如果接受,则认为不存在内?解释变量,应该使?OLS。 reg ldi lofdi est imat es st ore ols xt ivreg ldi (lofdi=l.lofdi ldep lexr) est imat es st ore iv hausman iv ols (在?板数据中使??具变量,St at a提供了如下命令来执?2SLS:xt ivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re等,表示固定效应、随机效应等。详?help xt ivreg) 如果存在内?解释变量,则应该选??具变量,?具变量个数不少于?程中内?解释变量的个数。“恰好识别”时?2SLS。2SLS的实质是把内?解释变量分成两部分,即由?具变量所造成的外?的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外?部分进?回归,从?满?OLS前定变量的要求?得到?致估计量。 ?、异?差与?相关检验 在球型扰动项的假定下,2SLS是最有效的。但如果扰动项存在异?差或?相关,?板异?差检验: xt gls enc invs exp imp esc mrl,igls panel(het) est imat es st ore het ero

异方差的检验及修正

异方差问题的检验与修正 【实验目的】 1、深刻理解异方差性的实质、异方差出现的原因、异方差的出现对模型的不良影响(即异方差的后果),掌握估计和检验异方差性的基本思想和修正异方差的若干方法。 2、能够运用所学的知识处理模型中的出现的异方差问题,并要求初步掌握用Eviews处理异方差的基本操作方法。 【实验原理】 1、最小二乘估计。 2、异方差。 3、最小二乘残差图解释异方差。 4、Breusch-Pagan检验(B-P检验)和White检验(怀特检验)检验特定方差函数的异方差性。 5、稳健标准差和加权最小二乘法对特定方差函数的异方差性的修正。 【实验软件】 Eviews6.0 【实验步骤】 一、设定模型 首先将实验数据导入软件之中。(注:本实验报告正文部分只显示软件统计结果,导入数据这一步骤参见附A) 本次实验的数据主要是Big Andy店的食品销售收入数据与食品价格数据,共采用了75组。 实验数据来源于课本中的例题,由老师提供。如下表: 表Big Andy店月销售收入和价格的观测值

sales price sales price sales price sales price 73.2 5.6975.7 5.5978.1 5.773.7671.8 6.4974.4 6.2288 5.2271.2 6.3762.4 5.6368.7 6.4180.4 5.0584.7 5.3367.4 6.2283.9 4.9679.7 5.7673.6 5.2389.3 5.0286.1 4.8373.2 6.2573.7 5.8870.3 6.4173.7 6.3585.9 5.3478.1 6.2473.2 5.8575.7 6.4783.3 4.9869.7 6.4786.1 5.4178.8 5.6973.6 6.3967.6 5.4681 6.2473.7 5.5679.2 6.2286.5 5.1176.4 6.280.2 6.4188.1 5.187.6 5.0476.6 5.4869.9 5.5464.5 6.4984.2 5.0882.2 6.1469.1 6.4784.1 4.8675.2 5.8682.1 5.3783.8 4.9491.2 5.184.7 4.8968.6 6.4584.3 6.1671.8 5.9873.7 5.6876.5 5.3566 5.9380.6 5.0282.2 5.7380.3 5.2284.3 5.273.1 5.0874.2 5.1170.7 5.8979.5 5.6281 5.2375.4 5.7175 5.2180.2 5.2873.7 6.0281.3 5.45 75 6.05 81.2 5.83 69 6.33 其中,sales 表示在某城市的月销售收入,以千美元为单位;price 表示在该城市的价格,以美元为单位。 假设表1中的月销售收入数据满足假设SR1—SR5。即,假设Big Andy 店的月销售收入的期望值是产品价格水平的线性函数,误差项额的均值为零,销售收入的方差和误差项e 的方差相同,随机误差项e 在统计上不相关,且选取的价格的值是非随机的。 这样,在上面的基础之上,建立Big Andy 的食品销售收入(sales )与食品价格(price )之间的线性模型方程: e price sales ++=10ββ根据最小二乘估计的思想估计模型参数,(此过程参见附B )结果如下图: Coefficient Std.Error t-Statistic Prob.C 121.9002 6.52629118.678320.0000PRICE -7.829074 1.142865 -6.850394 0.0000R-squared 0.391301Mean dependent var 77.37467Adjusted R-squared 0.382963 S.D.dependent var 6.488537

eviews异方差自相关检验与解决办法

e v i e w s异方差自相关检 验与解决办法 This model paper was revised by the Standardization Office on December 10, 2020

eviews异方差、自相关检验与解决办法 一、异方差检验:1.相关图检验法 LS Y C X 对模型进行参数估计 GENR E=RESID 求出残差序列 GENR E2=E^2 求出残差的平方序列 SORT X 对解释变量X排序 SCAT X E2 画出残差平方与解释变量X的相关图 2.戈德菲尔德——匡特检验 已知样本容量n=26,去掉中间6个样本点(即约n/4),形成两个样本容量均为10的子样本。 SORT X 将样本数据关于X排序 SMPL 1 10 确定子样本1 LS Y C X 求出子样本1的回归平方和RSS1 SMPL 17 26 确定子样本2 LS Y C X 求出子样本2的回归平方和RSS2 计算F统计量并做出判断。 解决办法

3.加权最小二乘法 LS Y C X 最小二乘法估计,得到残差序列 GRNR E1=ABS(RESID) 生成残差绝对值序列 LS(W=1/E1) Y C X 以E1为权数进行加权最小二成估计 二、自相关 1.图示法检验 LS Y C X 最小二乘法估计,得到残差序列 GENR E=RESID 生成残差序列 SCAT E(-1) E et—et-1的散点图 PLOT E 还可绘制et的趋势图 2.广义差分法 LS Y C X AR(1) AR(2) 首先,你要对广义差分法熟悉,不是了解,如果你是外行,我奉劝你还是用eviews来做就行了,其实我想老师要你用spss无非是想看你是否掌握广义差分,好了,废话不多说了。接着,使用spss16来解决自相关。第一步,输入变量,做线性回归,注意在Liner Regression中的Statistics中勾上DW,在save中勾Standardized,查看结果,显然肯定是有自相关的(看dw值)。第二步,做滞后一期的残差,直接COPY数据(别告诉我不会啊),然后将残差和滞后一期的残差做回归,记下它们之间的B指(就是斜率)。第三

实验四-异方差性的检验与处理

实验四-异方差性的检验与处理

实验四 异方差性的检验及处理(2学时) 一、实验目的 (1)、掌握异方差检验的基本方法; (2)、掌握异方差的处理方法。 二、实验学时:2学时 三、实验要求 (1)掌握用MATLAB 软件实现异方差的检验和处理; (2)掌握异方差的检验和处理的基本步骤。 四、实验原理 1、异方差检验的常用方法 (1) 用X-Y 的散点图进行判断 (2). 22 ?(,)(,)e x e y %%或的图形 ,),x )i i y %%i i ((e 或(e 的图形)

(3) 等级相关系数法(又称Spearman 检验) 是一种应用较广的方法,既可以用于大样本,也可与小样本。 :i u 0原假设H 是等方差的;:i u 0备择假设H 是异方差; 检验的三个步骤 ① ?t t y y =-%i e ② |i x %%i i 将e 取绝对值,并把|e 和按递增或递减次序排序, 计算Spearman 系数rs ,其中:2 1n i i d =∑s 2 6r =1-n(n -1) |i x %i i 其中, n 为样本容量d 为|e 和的等级的差数。 ③ 做等级相关系数的显著性检验。n>8时, 22(2) 1s s n t t n r -= --0当H 成立时, /2(2),t t n α≤-若认为异方差性问题不存在; /2(2),t t n α>-反之,若||i i e x %说明与之间存在系统关系, 异方差问题存在。

(4) 帕克(Park)检验 帕克检验常用的函数形式: 若α在统计上是显著的,表明存在异方差性。 2、异方差性的处理方法: 加权最小二乘法 如果在检验过程中已经知道:222 ()()()i i i ji u Var u E u f x σσ=== 则将原模型变形为: 121()()()() () i i p pi i ji ji ji ji ji y x x u f x f x f x f x f x βββ=+?++?+L 在该模型中: 22 11 ( )()()()()() i i ji u u ji ji ji Var u Var u f x f x f x f x σσ=== 即满足同方差性。于是可以用OLS 估计其参数,得到关于参数12,,,p βββL 的无偏、有效估计量。 五、实验举例 例1、某地区居民的可支配收入x(千元)与居民消费支出y(千元)的数据如下: No x y no x y 1 10 8 16 25 19.1 2 10 8.2 17 25 23.5 3 10 8.3 18 25 22. 4 4 10 8.1 19 2 5 23.1 5 10 8.7 20 25 15.1 6 15 12.3 21 30 24.2 7 15 9.4 22 30 16.7 8 15 11.6 23 30 27 9 15 12 24 30 26 10 15 8.9 25 30 22.1 11 20 15 26 35 30.5 12 20 16 27 35 28.7 13 20 12 28 35 31.1 14 20 13 29 35 20 15 20 19.1 30 35 29.9

实验报告:异方差模型的检验和处理

实验实训报告课程名称:计量经济学实验 开课学期: 2012-2013学年第一学期 开课系(部):经济系 开课实验(训)室:数量经济分析实验室 学生姓名: 专业班级: 学号: 重庆工商大学融智学院教务处制

实验题目 实验概述 【实验(训)目的及要求】 通过本次实验,使学生掌握异方差模型的检验方法及校正方法。其中,检验方法主要掌握图形法检验、怀特检验;校正方法主要掌握加权最小二乘法、White 校正法。 【实验(训)原理】 对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性。异方差的实质表现为随机误差项的方差随着解释变量(引起异方差的解释变量)观测值的变化而变化。对于出现异方差的原模型主要采用校正其异方差,再对校正后的模型采用普通最小二乘法估计。 实验内容 【实验(训)方案设计】 1、图形法检验:(1)回归分析;(2)得到残差趋势图和残差散点图;(3)分析异方差。 2、使用White检验异方差:(1)回归分析;(2)得到White检验统计量及伴随概率;(3)根据结果判断分析异方差的存在性。 3、在发现存在异方差的基础上,进行异方差的处理: (1)使用加权最小二乘法校正异方差:①输入回归方程;②在Option 中选择加权最小二乘法,并输入权重序列名称;③得到校正后的结果。 (2)使用White校正法解决异方差:①输入回归方程;②在Option中选择White校正;③得到校正后的结果。 【实验(训)过程】(实验(训)步骤、记录、数据、分析) 实验背景 本例用的是四川省2000年各地市州的医疗机构数和人口数。为了给制定医疗机构的规划提供依据,分析比较医疗机构(Y,单位:个)与人口数量(X,单

相关文档
最新文档