异方差加权最小二乘法修正(精)

第五章 案例分析

一、问题的提出和模型设定

根据本章引子提出的问题,为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。假定医疗机构数与人口数之间满足线性约束,则理论模型设定为

i i i u X Y ++=21ββ (5.31)

其中i Y 表示卫生医疗机构数,i X 表示人口数。由2001年《四川统计年鉴》得到如下数据。

表5.1 四川省2000年各地区医疗机构数与人口数

地区

人口数(万人) X

医疗机构数(个)

Y

地区

人口数(万人) X

医疗机构数(个)

Y

成都 1013.3 6304 眉山 339.9 827 自贡 315 911 宜宾 508.5 1530 攀枝花 103 934 广安 438.6 1589 泸州 463.7 1297 达州 620.1 2403 德阳 379.3 1085 雅安 149.8 866 绵阳 518.4 1616 巴中 346.7 1223 广元 302.6 1021 资阳 488.4 1361 遂宁 371 1375 阿坝 82.9 536 内江 419.9 1212 甘孜 88.9 594 乐山

345.9

1132 凉山 402.4

1471 南充 709.2

4064

二、参数估计

进入EViews 软件包,确定时间范围;编辑输入数据;选择估计方程菜单,估计样本回归函数如下

表5.2

估计结果为

56.69,2665.508..,7855.0)

3403.8()

9311.1(3735.50548.563?2===-+-=F e s R X Y i

i (5.32) 括号内为t 统计量值。 三、检验模型的异方差

本例用的是四川省2000年各地市州的医疗机构数和人口数,由于地区之间存在的不同人口数,因此,对各种医疗机构的设置数量会存在不同的需求,这种差异使得模型很容易产生异方差,从而影响模型的估计和运用。为此,必须对该模型是否存在异方差进行检验。

(一)图形法 1、EViews 软件操作。

由路径:Quick/Qstimate Equation ,进入Equation Specification 窗口,键入“y c x ”,确认并“ok ”,得样本回归估计结果,见表5.2。

(1)生成残差平方序列。在得到表5.2估计结果后,立即用生成命令建立序列2

i e ,记

为e2。生成过程如下,先按路径:Procs/Generate Series ,进入Generate Series by Equation 对话框,即

图5.4

然后,在Generate Series by Equation对话框中(如图5.4),键入“e2=(resid)^2”,

则生成序列

2

i

e

(2)绘制

2

t

e

对t

X

的散点图。选择变量名X与e2(注意选择变量的顺序,先选的变量

将在图形中表示横轴,后选的变量表示纵轴),进入数据列表,再按路径view/graph/scatter,可得散点图,见图5.5。

图5.5

2、判断。由图5.5可以看出,残差平方

2

i

e

对解释变量X的散点图主要分布在图形中的

下三角部分,大致看出残差平方

2

i

e

随i

X的变动呈增大的趋势,因此,模型很可能存在异方

差。但是否确实存在异方差还应通过更进一步的检验。

(二)Goldfeld-Quanadt检验

1、EViews软件操作。

(1)对变量取值排序(按递增或递减)。在Procs菜单里选Sort Series命令,出现排序对话框,如果以递增型排序,选Ascenging,如果以递减型排序,则应选Descending,键入X,点ok。本例选递增型排序,这时变量Y与X将以X按递增型排序。

(2)构造子样本区间,建立回归模型。在本例中,样本容量n=21,删除中间1/4的观测值,即大约5个观测值,余下部分平分得两个样本区间:1—8和14—21,它们的样本个

数均是8个,即

8

2

1

=

=n

n。

在Sample菜单里,将区间定义为1—8,然后用OLS方法求得如下结果

表5.3

在Sample菜单里,将区间定义为14—21,再用OLS方法求得如下结果

表5.4

(3)求F统计量值。基于表5.3和表5.4中残差平方和的数据,即Sum squared resid

的值。由表5.3计算得到的残差平方和为∑=9.

144958

2

1i

e

,由表5.4计算得到的残差平

方和为∑=8.

734355

2

2i

e

,根据Goldfeld-Quanadt检验,F统计量为

066

.59

.1449588

.734355212

2==

=

∑∑i

i e e F (5.33)

(4)判断。在05.0=α下,式(5.33)中分子、分母的自由度均为6,查F 分布表得

临界值为

28.4)6,6(05.0=F ,因为28.4)6,6(066.505.0=>=F F ,所以拒绝原假设,表明

模型确实存在异方差。

(三)White 检验

由表5.2估计结果,按路径view/residual tests/white heteroskedasticity (no cross terms or cross terms ),进入White 检验。根据White 检验中辅助函数的构造,最后一项为变量的交叉乘积项,因为本例为一元函数,故无交叉乘积项,因此应选no cross terms ,则辅助函数为

t t t t v x x +++=2

2102ααασ (5.34) 经估计出现White 检验结果,见表5.5。

从表5.5可以看出,0694.182

=nR ,由White 检验知,在05.0=α下,查2

χ分布表,得临界值9915.5)2(205.0=χ(在(5.34)式中只有两项含有解释变量,故自由度为2),比

较计算的2χ统计量与临界值,因为0694.182=nR >9915.5)2(205

.0=χ,所以拒绝原假设,不拒绝备择假设,表明模型存在异方差。

表5.5

四、异方差性的修正 (一)加权最小二乘法(WLS )

在运用WLS 法估计过程中,我们分别选用了权数

t

i t i t t X w X w X w 1,1,13221===

。权

数的生成过程如下,由图5.4,在对话框中的Enter Quation 处,按如下格式分别键入:

X w /11=;2^/12X w =;)(/13X sqr w =,经估计检验发现用权数t w 2的效果最好。下

面仅给出用权数

t w 2的结果。

表5.7

表5.7的估计结果如下

8838.12,0493.276..,7060.1..,9387.0)

5894.3()

3794.4(9530.26090.368?2

====+=F e s W D R X Y i

i (5.36) 括号中数据为t 统计量值。

可以看出运用加权小二乘法消除了异方差性后,参数的t 检验均显著,可决系数大幅提高,

F 检验也显著,并说明人口数量每增加1万人,平均说来将增加2.953个卫生医疗机构,而不是引子中得出的增加5.3735个医疗机构。虽然这个模型可能还存在某些其他需要进一步解决的问题,但这一估计结果或许比引子中的结论更为接近真实情况。

计量经济学异方差的检验与修正

《计量经济学》实训报告 实训项目名称异方差模型的检验与处理 实训时间 2012-01-02 实训地点实验楼308 班级 学号 姓名

实 训 (实 践 ) 报 告 实 训 名 称 异方差模型的检验与处理 一、 实训目的 掌握异方差性的检验及处理方法。 二 、实训要求 1.求销售利润与销售收入的样本回归函数,并对模型进行经济意义检验和统计检验; 2.分别用图形法、Goldfeld-Quant 检验、White 方法检验模型是否存在异方差; 3.如果模型存在异方差,选用适当的方法对异方差进行修正,消除或减小异方差对模型的影响。 三、实训内容 建立并检验我国制造业利润函数模型,检验异方差性,并选用适当方法对其进行修正,消除或不同) 四、实训步骤 1.建立一元线性回归方程; 2.建立Workfile 和对象,录入数据; 3.分别用图形法、Goldfeld-Quant 检验、White 方法检验模型是否存在异方差; 4.对所估计的模型再进行White 检验,观察异方差的调整情况,从而消除或减小异方差对模型的影响。 五、实训分析、总结 表1列出了1998年我国主要制造工业销售收入与销售利润的统计资料。假设销售利润与销售收入之间满足线性约束,则理论模型设定为: 12i i i Y X u ββ=++ 其中i Y 表示销售利润,i X 表示销售收入。

表1 我国制造工业1998年销售利润与销售收入情况 行业名称销售利润Y 销售收入X 行业名称销售利润销售收入 食品加工业187.25 3180.44 医药制造业238.71 1264.1 食品制造业111.42 1119.88 化学纤维制品81.57 779.46 饮料制造业205.42 1489.89 橡胶制品业77.84 692.08 烟草加工业183.87 1328.59 塑料制品业144.34 1345 纺织业316.79 3862.9 非金属矿制品339.26 2866.14 服装制品业157.7 1779.1 黑色金属冶炼367.47 3868.28 皮革羽绒制品81.7 1081.77 有色金属冶炼144.29 1535.16 木材加工业35.67 443.74 金属制品业201.42 1948.12 家具制造业31.06 226.78 普通机械制造354.69 2351.68 造纸及纸品业134.4 1124.94 专用设备制造238.16 1714.73 印刷业90.12 499.83 交通运输设备511.94 4011.53 文教体育用品54.4 504.44 电子机械制造409.83 3286.15 石油加工业194.45 2363.8 电子通讯设备508.15 4499.19 化学原料纸品502.61 4195.22 仪器仪表设备72.46 663.68 1.建立Workfile和对象,录入销售收入X和销售利润Y: 图1 销售收入X和销售利润Y的录入 2.图形法检验 ⑴观察销售利润Y与销售收入X的相关图:在群对象窗口工具栏中点击

试验一异方差的检验与修正-时间序列分析

案例三 ARIMA 模型的建立 一、实验目的 了解ARIMA 模型的特点和建模过程,了解AR ,MA 和ARIMA 模型三者之间的区别与联系,掌握如何利用自相关系数和偏自相关系数对ARIMA 模型进行识别,利用最小二乘法等方法对ARIMA 模型进行估计,利用信息准则对估计的ARIMA 模型进行诊断,以及如何利用ARIMA 模型进行预测。掌握在实证研究如何运用Eviews 软件进行ARIMA 模型的识别、诊断、估计和预测。 二、基本概念 所谓ARIMA 模型,是指将非平稳时间序列转化为平稳时间序列,然后将平稳的时间序列建立ARMA 模型。ARIMA 模型根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA )、自回归过程(AR )、自回归移动平均过程(ARMA )以及ARIMA 过程。 在ARIMA 模型的识别过程中,我们主要用到两个工具:自相关函数ACF ,偏自相关函数PACF 以及它们各自的相关图。对于一个序列{}t X 而言,它的第j 阶自相关系数j ρ为它的j 阶自协方差除以方差,即j ρ=j 0γγ ,它是关于滞后期j 的函数,因此我们也称之为自相关函数,通常记ACF(j )。偏自相关函数PACF(j )度量了消除中间滞后项影响后两滞后变量之间的相关关系。 三、实验内容及要求 1、实验内容: (1)根据时序图的形状,采用相应的方法把非平稳序列平稳化; (2)对经过平稳化后的1950年到2007年中国进出口贸易总额数据运用经典B-J 方法论建立合适的ARIMA (,,p d q )模型,并能够利用此模型进行进出口贸易总额的预测。 2、实验要求: (1)深刻理解非平稳时间序列的概念和ARIMA 模型的建模思想; (2)如何通过观察自相关,偏自相关系数及其图形,利用最小二乘法,以及信息准则建立合适的ARIMA 模型;如何利用ARIMA 模型进行预测; (3)熟练掌握相关Eviews 操作,读懂模型参数估计结果。 四、实验指导 1、模型识别 (1)数据录入 打开Eviews 软件,选择“File”菜单中的“New --Workfile”选项,在“Workfile structure type ”栏选择“Dated –regular frequency ”,在“Date specification ”栏中分别选择“Annual ”(年数据) ,分别在起始年输入1950,终止年输入2007,点击ok ,见图3-1,这样就建立了一个工作文件。点击File/Import ,找到相应的Excel 数据集,导入即可。

线性回归异方差地诊断检验和修补—SPSS操作

线性回归(异方差的诊断、检验和修补)—SPSS操作 首先拟合一般的线性回归模型,绘制残差散点图。步骤和结果如下:为方便,只做简单的双变量回归模型,以当前工资作为因变量,初始工资作为自变量。(你们自己做的时候可以考虑加入其他的自变量,比如受教育程度等等)Analyze——regression——linear 将当前工资变量拉入dependent框,初始工资进入independent 点击上图中的PLOTS,出现以下对话框:

以标准化残差作为Y轴,标准化预测值作为X轴,点击continue,再点击OK 第一个表格输出的是模型拟合优度2R,为0.775。调整后的拟合优

度为0.774. 第二个是方差分析,可以说是模型整体的显著性检验。F统计量为1622.1,P值远小于0.05,故拒绝原假设,认为模型是显著的。第三个是模型的系数,constant代表常数项,初始工资前的系数为1.909,t检验的统计量为40.276,通过P值,发现拒绝原假设,认为系数显著异于0。 以上是输出的残差对预测值的散点图,发现存在喇叭口形状,暗示着异方差的存在, 故接下来进行诊断,一般需要诊断异方差是由哪个自变量引起的,

由于这里我们只选用一个变量作为自变量,故认为异方差由唯一的自变量“初始工资”引起。接下来做加权的最小二乘法,首先计算权数。 Analyze——regression——weight estimation

再点击options, 点击continue,再点击OK,输出如下结果: 由于结果比较长,只贴出一部分,第二栏的值越大越好。所以挑出来的权重变量的次数为2.7。得出最佳的权重侯,即可进行回归。Analyze——regression——linear

EViews计量经济学实验报告异方差的诊断及修正

时间 地点 实验题目 异方差的诊断与修正 一、实验目的与要求: 要求目的:1、用图示法初步判断是否存在异方差,再用White 检验异方差; 2、用加权最小二乘法修正异方差。 二、实验内容 根据1998年我国重要制造业的销售利润与销售收入数据,运用EV 软件,做回归分析,用图示法,White 检验模型是否存在异方差,如果存在异方差,运用加权最小二乘法修正异方差。 三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等) (一) 模型设定 为了研究我国重要制造业的销售利润与销售收入是否有关,假定销售利润与销售收入之间满足线性约束,则理论模型设定为: i Y =1β+2βi X +i μ 其中,i Y 表示销售利润,i X 表示销售收入。由1998年我国重要制造业的销售收入与销售利润的数据,如图1: 1988年我国重要制造业销售收入与销售利润的数据 (单位:亿元)

(二) 参数估计 1、双击“Eviews ”,进入主页。输入数据:点击主菜单中的File/Open /EV Workfile —Excel —异方差数据2.xls ; 2、在EV 主页界面的窗口,输入“ls y c x ”,按“Enter ”。出现OLS 回归结果,如图2: 估计样本回归函数 Dependent Variable: Y Method: Least Squares Date: 10/19/05 Time: 15:27 Sample: 1 28 Included observations: 28 Variable Coefficient Std. Error t-Statistic Prob. C 12.03564 19.51779 0.616650 0.5428 X 0.104393 0.008441 12.36670 0.0000 R-squared 0.854696 Mean dependent var 213.4650 Adjusted R-squared 0.849107 S.D. dependent var 146.4895 S.E. of regression 56.90368 Akaike info criterion 10.98935 Sum squared resid 84188.74 Schwarz criterion 11.08450 Log likelihood -151.8508 F-statistic 152.9353 Durbin-Watson stat 1.212795 Prob(F-statistic) 0.000000 估计结果为: i Y ? = 12.03564 + 0.104393i X (19.51779) (0.008441) t=(0.616650) (12.36670) 2R =0.854696 2R =0.849107 S.E.=56.89947 DW=1.212859 F=152.9353 这说明在其他因素不变的情况下,销售收入每增长1元,销售利润平均增长0.104393元。 2R =0.854696 , 拟合程度较好。在给定 =0.0时,t=12.36670 > )26(025.0t =2.056 ,拒

异方差性的检验和补救

异方差性的检验和补救 一、研究目的和要求 表1列出了1998年我国主要制造工业销售收入与销售利润的统计资料,请利用统计软件Eviews建立我国制造业利润函数模型,检验其是否存在异方差,并加以补救。 表1 我国制造工业1998年销售利润与销售收入情况 二、参数估计 EVIEWS 软件估计参数结果如下

Dependent Variable: Y Method: Least Squares Date: 06/01/16 Time: 20:16 Sample: 1 28 Included observations: 28 Variable Coefficient Std. Error t-Statistic Prob. C 12.03349 19.51809 0.616530 0.5429 X 0.104394 0.008442 12.36658 0.0000 R-squared 0.854694 Mean dependent var 213.4639 Adjusted R-squared 0.849105 S.D. dependent var 146.4905 S.E. of regression 56.90455 Akaike info criterion 10.98938 Sum squared resid 84191.34 Schwarz criterion 11.08453 Log likelihood -151.8513 Hannan-Quinn criter. 11.01847 F-statistic 152.9322 Durbin-Watson stat 1.212781 Prob(F-statistic) 0.000000 用规范的形式将参数估计和检验结果写下 2?12.033490.104394(19.51809)(0.008442) =(0.616530) (12.36658)0.854694152.9322 i Y X t R F =+ = = 三、 检验模型的异方差 (一) 图形法 1. 相关关系图 X Y X Y 相关关系图

异方差的检验与修正

财经学院 本科实验报告 学院(部)统计学院 实验室313 课程名称计量经济学 学生姓名 学号1204100213 专业统计学 教务处制 2014年12 月15 日

《异方差》实验报告

五、实验过程原始记录(数据、图表、计算等) 一.选择数据 1.建立工作文件并录入数据File\New\workfile, 弹出Workfile create 对话框中选择数据类型。Object\new object\group,按向上的方向键,出现两个obs 后输入数据. 中国地2006年各地区农村居民家庭人均纯收入与消费支出 单位:元 城市 y x1 x2 城市 y x1 x2 5724.5 958.3 7317.2 2732.5 1934.6 1484.8 3341.1 1738.9 4489 3013.3 1342.6 2047 2495.3 1607.1 2194.7 3886 1313.9 3765.9 2253.3 1188.2 1992.7 广西 2413.9 1596.9 1173.6 2772 2560.8 781.1 2232.2 2213.2 1042.3 3066.9 2026.1 2064.3 2205.2 1234.1 1639.7 2700.7 2623.2 1017.9 2395 1405 1597.4 2618.2 2622.9 929.5 1627.1 961.4 1023.2 8006 532 8606.7 2195.6 1570.3 680.2 4135.2 1497.9 4315.3 2002.2 1399.1 1035.9 6057.2 1403.1 5931.7 2181 1070.4 1189.8 2420.9 1472.8 1496.3 1855.5 1167.9 966.2 3591.4 1691.4 3143.4 2179 1274.3 1084.1 2676.6 1609.2 1850.3 2247 1535.7 1224.4 3143.8 1948.2 2420.1 2032.4 2267.4 469.9 2229.3 1844.6 1416.4 二.对数据进行参数估计,得出多元线性回归模型 1.模型设定为εβββ+++=23121i i i X X Y Yi ----人均消费支出 X1--从事农业经营的纯收入 X2--其他来源的纯收入 2.点Quick\estimate equation,在弹出的对话框中输入”Y C X ”,结果如下:

异方差性的检验及处理方法

实验四异方差性 【实验目的】 掌握异方差性的检验及处理方法 【实验内容】 建立并检验我国制造业利润函数模型 【实验步骤】 【例1】表1列出了1998年我国主要制造工业销售收入与销售利润的统计资料,请利用统计软件Eviews建立我国制造业利润函数模型。 一、检验异方差性 ⒈图形分析检验 ⑴观察销售利润(Y)与销售收入(X)的相关图(图1):SCAT X Y 图1 我国制造工业销售利润与销售收入相关图 从图中可以看出,随着销售收入的增加,销售利润的平均水平不断提高,但离散程度也逐步扩大。这说明变量之间可能存在递增的异方差性。

⑵残差分析 首先将数据排序(命令格式为:SORT 解释变量),然后建立回归方程。在方程窗口中点击Resids按钮就可以得到模型的残差分布图(或建立方程后在Eviews工作文件窗口中点击resid对象来观察)。 图2 我国制造业销售利润回归模型残差分布 图2显示回归方程的残差分布有明显的扩大趋势,即表明存在异方差性。 ⒉Goldfeld-Quant检验 ⑴将样本按解释变量排序(SORT X)并分成两部分(分别有1到10共11个样本合19到28共10个样本) ⑵利用样本1建立回归模型1(回归结果如图3),其残差平方和为2579.587。 SMPL 1 10 LS Y C X 图3 样本1回归结果 ⑶利用样本2建立回归模型2(回归结果如图4),其残差平方和为63769.67。 SMPL 19 28 LS Y C X

图4 样本2回归结果 ⑷计算F 统计量:12/RSS RSS F ==63769.67/2579.59=24.72,21RSS RSS 和分别是模型1和模型2的残差平方和。 取 05 .0=α时,查F 分布表得 44.3)1110,1110(05.0=----F ,而 44.372.2405.0=>=F F ,所以存在异方差性 ⒊White 检验 ⑴建立回归模型:LS Y C X ,回归结果如图5。 图5 我国制造业销售利润回归模型 ⑵在方程窗口上点击View\Residual\Test\White Heteroskedastcity,检验结果如图6。 图6 White 检验结果

实验异方差地检验与修正

实验异方差的检验与修正 实验目的 1、理解异方差的含义后果、 2、学会异方差的检验与加权最小二乘法 实验容 一、准备工作。建立工作文件,并输入数据,用普通最小二乘法估计方程(操作 步骤与方法同前),得到残差序列。 表2列出了1998年我国主要制造工业销售收入与销售利润的统计资料,请利用统计软件Eviews建立我国制造业利润函数模型。 表2 我国制造工业1998年销售利润与销售收入情况 二、异方差的检验 1、图形分析检验 ⑴观察销售利润(Y)与销售收入(X)的相关图(图3-1):SCAT X Y

图3-1 我国制造工业销售利润与销售收入相关图 从图中可以看出,随着销售收入的增加,销售利润的平均水平不断提高,但离散程度也逐步扩大。这说明变量之间可能存在递增的异方差性。 ⑵残差分析 首先将数据排序(命令格式为:SORT 解释变量),然后建立回归方程。在方程窗口中点击Resids按钮就可以得到模型的残差分布图(或建立方程后在Eviews工作文件窗口中点击resid对象来观察)。 图3-2 我国制造业销售利润回归模型残差分布 图3-2显示回归方程的残差分布有明显的扩大趋势,即表明存在异方差性。 2、Goldfeld-Quant检验 ⑴将样本安解释变量排序(SORT X)并分成两部分(分别有1到10共11个样本合19到28共10个样本) ⑵利用样本1建立回归模型1(回归结果如图3-3),其残差平方和为2579.587。 SMPL 1 10 LS Y C X

图3-3 样本1回归结果 ⑶利用样本2建立回归模型2(回归结果如图3-4),其残差平方和为63769.67。 SMPL 19 28 LS Y C X 图3-4 样本2回归结果 ⑷计算F 统计量:12/RSS RSS F ==63769.67/2579.59=24.72,21RSS RSS 和分别是模型1和模型2的残差平方和。 取05.0=α时,查F 分布表得44.3)1110,1110(05.0=----F ,而 44.372.2405.0=>=F F ,所以存在异方差性 3、White 检验 ⑴建立回归模型:LS Y C X ,回归结果如图3-5。

异方差检验

七、 异方差与自相关 一、背景 我们讨论如果古典假定中的同方差和无自相关假定不能得到满足,会引起什么样的估计问题呢?另一方面,如何发现问题,也就是发现和检验异方差以及自相关的存在性也是一个重要的方面,这个部分就是就这个问题进行讨论。 二、知识要点 1、引起异方差的原因及其对参数估计的影响 2、异方差的检验(发现异方差) 3、异方差问题的解决办法 4、引起自相关的原因及其对参数估计的影响 5、自相关的检验(发现自相关) 6、自相关问题的解决办法 (时间序列部分讲解) 三、要点细纲 1、引起异方差的原因及其对参数估计的影响 原因:引起异方差的众多原因中,我们讨论两个主要的原因,一是模型的设定偏误,主要指的是遗漏变量的影响。这样,遗漏的变量就进入了模型的残差项中。当省略的变量与回归方程中的变量有相关关系的时候,不仅会引起内生性问题,还会引起异方差。二是截面数据中总体各单位的差异。 后果:异方差对参数估计的影响主要是对参数估计有效性的影响。在存在异方差的情况下,OLS 方法得到的参数估计仍然是无偏的,但是已经不具备最小方差性质。一般而言,异方差会引起真实方差的低估,从而夸大参数估计的显著性,即是参数估计的t 统计量偏大,使得本应该被接受的原假设被错误的拒绝。 2、异方差的检验 (1)图示检验法 由于异方差通常被认为是由于残差的大小随自变量的大小而变化,因此,可以通过散点图的方式来简单的判断是否存在异方差。具体的做法是,以回归的残差的平方2i e 为纵坐标,回归式中的某个解释变量i x 为横坐标,画散点图。如果散点图表现出一定的趋势,则可以判断存在异方差。 (2)Goldfeld-Quandt 检验

检验和消除异方差和自相关的报告

消除异方差和自相关的实验报告【实验内容】 通过查询中国统计局的2012年中国统计年鉴及新浪财经数据网,获得1980年--2012年各项指标的数据,如下表所示: 年份Y-出口贸易总额 (亿美元)X-外商直接投资(亿美元) 1980181.19 3.54 1981220.10 3.54 1982223.20 3.54 1983222.309.20 1984261.4014.20 1985273.5019.56 1986309.4022.44 1987394.4023.14 1988475.2031.94 1989525.4033.92 1990620.9134.87 1991719.1043.66 1992849.40110.08 1993917.44275.15 19941210.06337.67 19951487.80375.21 19961510.48417.26 19971827.92452.57 19981837.09454.63 19991949.31403.19

20002492.03407.15 20012660.98468.78 20023255.96527.43 20034382.28535.05 20045933.26606.30 20057619.53603.25 20069689.36630.21 200712177.76747.68 200814306.93923.95 200912016.12900.33 201015779.301057.40 201118986.001160.23 201220489.301116.16【实验步骤——检验并消除异方差】 一检查模型是否存在异方差性 1、图形分析检验 (1)散点相关图分析

线性回归 异方差的诊断 检验和修补 SPSS操作

线性回归(异方差的诊断、检验和修补)—S P S S操作首先拟合一般的线性回归模型,绘制残差散点图。步骤和结果如下: 为方便,只做简单的双变量回归模型,以当前工资作为因变量,初始工资作为自变量。(你们自己做的时候可以考虑加入其他的自变量,比如受教育程度等等) Analyze——regression——linear 将当前工资变量拉入dependent框,初始工资进入independent 点击上图中的PLOTS,出现以下对话框: 以标准化残差作为Y轴,标准化预测值作为X轴,点击continue,再点击OK 第一个表格输出的是模型拟合优度2R,为0.775。调整后的拟合优度为0.774. 第二个是方差分析,可以说是模型整体的显着性检验。F统计量为1622.1,P值远小于0.05,故拒绝原假设,认为模型是显着的。 第三个是模型的系数,constant代表常数项,初始工资前的系数为1.909,t检验的统计量为40.276,通过P值,发现拒绝原假设,认为系数显着异于0。 以上是输出的残差对预测值的散点图,发现存在喇叭口形状,暗示着异方差的存在, 故接下来进行诊断,一般需要诊断异方差是由哪个自变量引起的,由于这里我们只选用一个变量作为自变量,故认为异方差由唯一的自变量“初始工资”引起。接下来做加权的最小二乘法,首先计算权数。

Analyze——regression——weight estimation 再点击options, 点击continue,再点击OK,输出如下结果: 由于结果比较长,只贴出一部分,第二栏的值越大越好。所以挑出来的权重变量的次数为2.7。得出最佳的权重侯,即可进行回归。Analyze——regression——linear 继续点击save, 在上面两处打勾,点击continue,点击ok 这是输出结果,和之前同样的分析方法。 接下需要绘制残差对预测值的散点图,首先通过transform里的compute 计算考虑权重后的预测值和残差。 以上两个步骤后即可输出考虑权重后的预测值和残差值 然后点击graph,绘制出的散点图如下:

EViews计量经济学实验报告异方差的诊断及修正

姓名学号实验题目异方差的诊断与修正 一、实验目的与要求: 要求目的:1、用图示法初步判断是否存在异方差,再用White检验异方差; 2、用加权最小二乘法修正异方差。

估计结果为: i Y ? = 12.03564 + 0.104393i X (19.51779) (0.008441) t=(0.616650) (12.36670) 2R =0.854696 R =0.849107 S.E.=56.89947 DW=1.212859 F=152.9353 这说明在其他因素不变的情况下,销售收入每增长1元,销售利润平均增长0.104393元。 2R =0.854696 , 拟合程度较好。在给定 =0.0时,t=12.36670 > )26(025.0t =2.056 ,拒 绝原假设,说明销售收入对销售利润有显著性影响。F=152.9353 > )6,21(F 05.0= 4.23 ,

表明方程整体显著。 (三) 检验模型的异方差 ※(一)图形法 6、判断 由图3可以看出,被解释变量Y 随着解释变量X 的增大而逐渐分散,离散程度越来越大; 同样,由图4可以看出,残差平方2 i e 对解释变量X 的散点图主要分布在图形中的下三角部分,大致看出残差平方2 i e 随i X 的变动呈增大趋势。因此,模型很可能存在异方差。但是否确实存在异方差还应该通过更近一步的检验。

※ (二)White 检验 White 检验结果 White Heteroskedasticity Test: F-statistic 3.607218 Probability 0.042036 Obs*R-squared 6.270612 Probability 0.043486 Test Equation: t 界值5.002 χ (2) =5.99147。比较计算的2χ统计量与临界值,因为n 2R = 6.270612 > 5 .002 χ(2)=5.99147 ,所以拒绝原假设,不拒绝备择假设,这表明模型存在异方差。 (四) 异方差的修正 在运用加权最小二乘法估计过程中,分别选用了权数t 1ω=1/t X ,t 2ω=1/2 t X ,t 3ω=1/t X 。 用权数t 1ω的结果

异方差的检验及修正

异方差问题的检验与修正 【实验目的】 1、深刻理解异方差性的实质、异方差出现的原因、异方差的出现对模型的不良影响(即异方差的后果),掌握估计和检验异方差性的基本思想和修正异方差的若干方法。 2、能够运用所学的知识处理模型中的出现的异方差问题,并要求初步掌握用Eviews处理异方差的基本操作方法。 【实验原理】 1、最小二乘估计。 2、异方差。 3、最小二乘残差图解释异方差。 4、Breusch-Pagan检验(B-P检验)和White检验(怀特检验)检验特定方差函数的异方差性。 5、稳健标准差和加权最小二乘法对特定方差函数的异方差性的修正。 【实验软件】 Eviews6.0 【实验步骤】 一、设定模型 首先将实验数据导入软件之中。(注:本实验报告正文部分只显示软件统计结果,导入数据这一步骤参见附A) 本次实验的数据主要是Big Andy店的食品销售收入数据与食品价格数据,共采用了75组。 实验数据来源于课本中的例题,由老师提供。如下表: 表Big Andy店月销售收入和价格的观测值

sales price sales price sales price sales price 73.2 5.6975.7 5.5978.1 5.773.7671.8 6.4974.4 6.2288 5.2271.2 6.3762.4 5.6368.7 6.4180.4 5.0584.7 5.3367.4 6.2283.9 4.9679.7 5.7673.6 5.2389.3 5.0286.1 4.8373.2 6.2573.7 5.8870.3 6.4173.7 6.3585.9 5.3478.1 6.2473.2 5.8575.7 6.4783.3 4.9869.7 6.4786.1 5.4178.8 5.6973.6 6.3967.6 5.4681 6.2473.7 5.5679.2 6.2286.5 5.1176.4 6.280.2 6.4188.1 5.187.6 5.0476.6 5.4869.9 5.5464.5 6.4984.2 5.0882.2 6.1469.1 6.4784.1 4.8675.2 5.8682.1 5.3783.8 4.9491.2 5.184.7 4.8968.6 6.4584.3 6.1671.8 5.9873.7 5.6876.5 5.3566 5.9380.6 5.0282.2 5.7380.3 5.2284.3 5.273.1 5.0874.2 5.1170.7 5.8979.5 5.6281 5.2375.4 5.7175 5.2180.2 5.2873.7 6.0281.3 5.45 75 6.05 81.2 5.83 69 6.33 其中,sales 表示在某城市的月销售收入,以千美元为单位;price 表示在该城市的价格,以美元为单位。 假设表1中的月销售收入数据满足假设SR1—SR5。即,假设Big Andy 店的月销售收入的期望值是产品价格水平的线性函数,误差项额的均值为零,销售收入的方差和误差项e 的方差相同,随机误差项e 在统计上不相关,且选取的价格的值是非随机的。 这样,在上面的基础之上,建立Big Andy 的食品销售收入(sales )与食品价格(price )之间的线性模型方程: e price sales ++=10ββ根据最小二乘估计的思想估计模型参数,(此过程参见附B )结果如下图: Coefficient Std.Error t-Statistic Prob.C 121.9002 6.52629118.678320.0000PRICE -7.829074 1.142865 -6.850394 0.0000R-squared 0.391301Mean dependent var 77.37467Adjusted R-squared 0.382963 S.D.dependent var 6.488537

回归模型中异方差性的检验与消除研究

回归模型中异方差性的检验与消除研究 摘要:经典线性回归模型的一个重要假设就是回归方程的随机扰动项,具有相同的方差,也称同方差性。但在大多数经济现象中,这种假设不一定成立,有时扰动项的方差随观察值的不同而变化,这就是异方差性。在经济研究中,异方差性的存在使得回归模型失效。本文以SPSS为分析工具,来研究回归模型中异方差性检验和消除。 关键词:异方差性SPSS分析工具异方差检验和消除一、引言 回归分析是处理随机变量之间的相关关系的一种统计 方法。即研究一个被解释变量与一个或多个解释变量之间的统计关系。 异方差性会导致严重的后果,所以对异方差性的检验无疑是非常重要的。对异方差检验的方法有很多,如残差图分析法、等级相关系数法、格莱斯尔检验等等,本文采用残差图和等级相关系数法进行异方差性检验。 二、检验方法 (一)散点图检验法 1、散点图检验法以残差e为纵坐标,以自变量为横坐标画散点图。其中残差e是指观测值与预测值之间的差,即

实际观察值与回归估计值的差。但需要指出的是,散点图检验法只能粗略、简单地判断异方差的存在与否,要想准确判断异方差是否存在,必须通过下面即将介绍到的等级相关系数法。 2、判定 当回归模型满足所有假定时,残差图上的几个点的散布应是随机的,无任何规律。此时随机误差项为齐性;如果回归模型存在异方差,残差图上的点的散布呈现出相应的趋势,e值会随自变量值增大而增大或减小,有明显的规律,这时 可以认为模型的随机误差项为非齐性。 (二)等级相关系数检验法 Y关于X的回归方程为: 等级相关系数:r|e|?x=1-6∑ni=1d2in(n2-1),其中,n 为样本容量,di为对应于xi和|ei|的等级的差数。对总体的 等级相关系数ρ|e|?x进行假设检验: 1、假设:H0:ρ|e|?x=0H1:ρ|e|?x≠0 当n>8时,构造t检测模型。 2、构造检验统计量: t=re?xn-21-r2e?x~t(n-2) 3、给定显著性水平α 4、确定临界值:tα/2(n-2) 5、判定:

EViews计量经济学实验报告-异方差的诊断及修正模板

姓名 学号 实验题目 异方差的诊断与修正 一、实验目的与要求: 要求目的:1、用图示法初步判断是否存在异方差,再用White 检验异方差; 2、用加权最小二乘法修正异方差。 二、实验内容 根据1998年我国重要制造业的销售利润与销售收入数据,运用EV 软件,做回归分析,用图示法,White 检验模型是否存在异方差,如果存在异方差,运用加权最小二乘法修正异方差。 三、实验过程:(实践过程、实践所有参数与指标、理论依据说明等) (一) 模型设定 为了研究我国重要制造业的销售利润与销售收入是否有关,假定销售利润与销售收入之间满足线性约束,则理论模型设定为: i Y =1β+2βi X +i μ 其中,i Y 表示销售利润,i X 表示销售收入。由1998年我国重要制造业的销售收入与销售利润的数据,如图1: 1988年我国重要制造业销售收入与销售利润的数据 (单位:亿元)

(二) 参数估计 Dependent Variable: Y Method: Least Squares Date: 10/19/05 Time: 15:27 Sample: 1 28 Included observations: 28 Variable Coefficient Std. Error t-Statistic Prob. C 12.03564 19.51779 0.616650 0.5428 X 0.104393 0.008441 12.36670 0.0000 R-squared 0.854696 Mean dependent var 213.4650 Adjusted R-squared 0.849107 S.D. dependent var 146.4895 S.E. of regression 56.90368 Akaike info criterion 10.98935 Sum squared resid 84188.74 Schwarz criterion 11.08450 Log likelihood -151.8508 F-statistic 152.9353 Durbin-Watson stat 1.212795 Prob(F-statistic) 0.000000 估计结果为: i Y ? = 12.03564 + 0.104393i X (19.51779) (0.008441) t=(0.616650) (12.36670) 2R =0.854696 2R =0.849107 S.E.=56.89947 DW=1.212859 F=152.9353 这说明在其他因素不变的情况下,销售收入每增长1元,销售利润平均增长0.104393元。 2R =0.854696 , 拟合程度较好。在给定 =0.0时,t=12.36670 > )26(025.0t =2.056 ,拒

异方差的检验比较和修正

2007年 5 月 Journal of Science of Teachers′College and University May 2007 文章编号:1007-9831(2007)03-0027-03 异方差的检验比较和修正 陈晖1, 2 ,杨乃军 3 (1. 山东大学 数学与系统科学学院,山东 济南 250100;2. 烟台职业学院 软件工程学院,山东 烟台 264001; 3. 烟台大学 教务处,山东 烟台 264001) 摘要:异方差是计量经济工作中线性回归模型经常遇到的问题,异方差的存在对线性回归分析有很强的破坏作用.通过对异方差产生的原因和后果进行分析,利用异方差的戈德菲尔特-夸特检验、拉格朗日乘数(LM)检验、怀特检验方法,判断线性回归模型异方差的存在性.通过加权最小二乘法或可行广义最小二乘法进行修正,建立能够真正反映经济规律的经济模型,实现对经济的正确指导作用. 关键词:异方差;戈德菲尔特-夸特检验;拉格朗日乘数(LM)检验;最小二乘法 中图分类号:F222.1 文献标识码 :A 1 异方差产生的原因 在计量经济学中,建立线性回归模型时需要做一些假设,从而保证所分析的变量关系符合线性回归分析的基本规定性,明确分析对象,保证回归分析的有效性.其中之一要求随机误差项同方差,即2)var(σε=i 不随i 变化,保证扰动因素对被解释变量的影响是简单的、随机的,不构成主要的影响因素.当这条假设不满足,也就是线性回归模型误差项2)var(i i σε=随i 的变化而变化,这时候就产生了异方差,此时称线性回归模型存在异方差或异方差性.如果对应线性回归模型误差项随着i X 或i 的增大而增大,称为“递增异方差”,反之称为“递减异方差”,有时也有先增后减或者先减后增的其他复杂类型的异方差[1-2] . 模型中异方差产生的原因,根据来源可以归纳为以下几方面原因:(1)模型中省略相关的解释变量; (2)误差随时间变化而变化;(3)模型设定不合理带来异方差;(4)分组数据误差带来异方差. 2 异方差的后果 计量经济模型一旦出现异方差,就会破坏模型假设的基本条件,如果仍然采用普通最小二乘法的估计方法,则会产生如下的不良后果: (1)参数估计量失效:因为在有效性证明中利用了同方差的条件,因此所求的OLS 参数估计值虽然仍具有无偏性,但不再是有效的; (2)变量的显著性检验失效:因为在变量的显著性检验中,构造的t 统计量包含有随机误差项的方差 2u σ,如果出现异方差,则t 检验就失去意义; (3)模型预测失效:这是因为在预测值的置信区间中包含有随机误差项的方差2 u σ,导致预测值的置 信区间加大,降低了预测的精度,使预测失效[3] . 3 异方差的检验方法 收稿日期:2006-12-18 作者简介:陈晖(1970-),女,山东青岛人,讲师,在读研究生,从事金融数学研究.E-mail:ch_yt@https://www.360docs.net/doc/a11649782.html,

异方差加权最小二乘法修正(精)资料

第五章 案例分析 一、问题的提出和模型设定 根据本章引子提出的问题,为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。假定医疗机构数与人口数之间满足线性约束,则理论模型设定为 i i i u X Y ++=21ββ (5.31) 其中i Y 表示卫生医疗机构数,i X 表示人口数。由2001年《四川统计年鉴》得到如下数据。 表5.1 四川省2000年各地区医疗机构数与人口数 地区 人口数(万人) X 医疗机构数(个) Y 地区 人口数(万人) X 医疗机构数(个) Y 成都 1013.3 6304 眉山 339.9 827 自贡 315 911 宜宾 508.5 1530 攀枝花 103 934 广安 438.6 1589 泸州 463.7 1297 达州 620.1 2403 德阳 379.3 1085 雅安 149.8 866 绵阳 518.4 1616 巴中 346.7 1223 广元 302.6 1021 资阳 488.4 1361 遂宁 371 1375 阿坝 82.9 536 内江 419.9 1212 甘孜 88.9 594 乐山 345.9 1132 凉山 402.4 1471 南充 709.2 4064 二、参数估计 进入EViews 软件包,确定时间范围;编辑输入数据;选择估计方程菜单,估计样本回归函数如下 表5.2

估计结果为 56.69,2665.508..,7855.0) 3403.8() 9311.1(3735.50548.563?2===-+-=F e s R X Y i i (5.32) 括号内为t 统计量值。 三、检验模型的异方差 本例用的是四川省2000年各地市州的医疗机构数和人口数,由于地区之间存在的不同人口数,因此,对各种医疗机构的设置数量会存在不同的需求,这种差异使得模型很容易产生异方差,从而影响模型的估计和运用。为此,必须对该模型是否存在异方差进行检验。 (一)图形法 1、EViews 软件操作。 由路径:Quick/Qstimate Equation ,进入Equation Specification 窗口,键入“y c x ”,确认并“ok ”,得样本回归估计结果,见表5.2。 (1)生成残差平方序列。在得到表5.2估计结果后,立即用生成命令建立序列2 i e ,记 为e2。生成过程如下,先按路径:Procs/Generate Series ,进入Generate Series by Equation 对话框,即

异方差的诊断及修正

异方差的诊断与修正 —甘子君 经济1202班 1205060432 一、 异方差的概念: 异方差性(heteroscedasticity )是相对于同方差而言的。所谓同方差,是为了保证回归参数估计量具有良好的统计性质,经典线性回归模型的一个重要假定:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。如果这一假定不满足,即:随机误差项具有不同的方差,则称线性回归模型存在异方差性。 在回归模型的经典假定中,提出的基本假定中,要求对所有的i (i=1,2,…,n )都有 2 )(σ=i u Var 也就是说i u 具有同方差性。这里的方差2 σ度量的是随机误差项围绕其均值的分散程 度。由于 )(=i u E ,所以等价地说,方差2σ度量的是被解释变量Y 的观测值围绕回归线 )(i Y E = ki k i X X βββ+++Λ221的分散程度,同方差性实际指的是相对于回归线被解释变 量所有观测值的分散程度相同。 设模型为 n i u X X Y i ki k i i ,,2,1221ΛΛ=++++=βββ 如果其它假定均不变,但模型中随机误差项 i u 的方差为 ). ,,3,2,1(, )(22n i u Var i i Λ==σ 则称 i u 具有异方差性。也称为方差非齐性。 二、内容 根据1998年我国重要制造业的销售利润与销售收入数据,运用EV 软件,做回归分析,用图示法,White 检验模型是否存在异方差,如果存在异方差,运用加权最小二乘法修正异方差。 三、过程:(实践过程、实践所有参数与指标、理论依据说明等) (一) 模型设定 为了研究我国重要制造业的销售利润与销售收入是否有关,假定销售利润与销售收入之间满足线性约束,则理论模型设定为: i Y =1β+2βi X +i μ 其中,i Y 表示销售利润,i X 表示销售收入。由1998年我国重要制造业的销售收入与销售利润的数据,如图1: 1988年我国重要制造业销售收入与销售利润的数据 (单位:亿元)

相关文档
最新文档