计量经济学--异方差练习(带操作指南)
计量经济学基础-异方差

但是如果出现了异方差而一味采用惯常的检验程序,将导致检验及 区间估计的偏误。
3、模型的预测失效
第三节、异方差性的检验
一个重要的问题是:怎样知道在一个具体的情况中是否有异方 差?实际中并不存在侦破异方差性的严明法则,只有少数的经验规 则。我们介绍几种:
1、图解法 如果对异方差性的性质没有任何先验或经验信息,实际上,可 先在无异方差性的假定下作回归分析,以解释变量为横坐标,以残 差平方为纵坐标得出二维散点图,从图中判断二者的相关性。这是 非正式的方法,不够精确。
本章结束
坐标,可作出残差图(如图所示)。该残差图的形状象一个喇叭, 由此可以看出,销售收入小的商店,其残差一般也较小;而销售
收入大的商店,其残差一般也较大;残差有随着商店规模增大而
增大的倾向。这表明,不同规模的商店,其利润总额的方差是不
相同的,从而模型中随机误差的方差不是常数,这里存在着异方
差现象。
在实际问题中出现异方差性的例子很多.对回归模型 中异方差现象的研究,是经济计量学中的一个重要内容。 为什么会产生这种异方差性呢? 一方面是因为随机项包括 了观察测量误差和模型中被省略的一些因素对被解释变量 (因变量)的影响,另一方面来自不同抽样单元的因变量 观察值之间可能差别很大。因此、异方差性多出现在横断 面样本之中。至于时间序列,则由于因变量观察值来自不 同时期的同一样本单元.通常因变量的不同观察值之间的 差别不是很大。所以异方差性一般不明显。
( X T X )1 X T E( T ) X ( X T X )1
2 ( X T X )1( X T X ) X ( X T X )1 2 ( X T X )1
因而使用OLS 法,得到的估计量是无偏的,但不是有效的。
计量经济学练习和答案

练习一、单项选择题1、计量经济学是__________的一个分支学科。
CA统计学B数学C经济学D数理统计学4、横截面数据是指__________。
AA同一时点上不同统计单位相同统计指标组成的数据B同一时点上相同统计单位相同统计指标组成的数据C同一时点上相同统计单位不同统计指标组成的数据D同一时点上不同统计单位不同统计指标组成的数据5、同一统计指标,同一统计单位按时间顺序记录形成的数据列是__________。
CA时期数据B混合数据C时间序列数据D横截面数据7、描述微观主体经济活动中的变量关系的计量经济模型是__________。
AA 微观计量经济模型B 宏观计量经济模型C 理论计量经济模型D 应用计量经济模型9、下面属于横截面数据的是__________。
DA1991-2003年各年某地区20个乡镇企业的平均工业产值B1991-2003年各年某地区20个乡镇企业各镇的工业产值C某年某地区20个乡镇工业产值的合计数D某年某地区20个乡镇各镇的工业产值10、经济计量分析工作的基本步骤是__________。
AA建立模型、收集样本数据、估计参数、检验模型、应用模型B 设定模型、估计参数、检验模型、应用模型、模型评价C 个体设计、总体设计、估计模型、应用模型、检验模型D 确定模型导向、确定变量及方程式、估计模型、检验模型、应用模型 11、将内生变量的前期值作解释变量,这样的变量称为__________。
D A.虚拟变量 B.控制变量 C.政策变量 D.滞后变量15、同一统计指标按时间顺序记录的数据列称为__________。
BA.横截面数据B.时间序列数据C.修匀数据D.原始数据2、相关关系是指__________。
DA 变量间的非独立关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系5、参数β的估计量ˆβ具备有效性是指__________。
B A ˆvar ()=0βB ˆvar ()β为最小C ˆ()0ββ-= D ˆ()ββ-为最小 7、设样本回归模型为i 01i i ˆˆY =X +e ββ+,则普通最小二乘法确定的iˆβ的公式中,错误的是__________。
计量经济学上机实验手册

实验三异方差性实验目的:在理解异方差性概念和异方差对OLS回归结果影响的基础上,掌握进行异方差检验和处理的方法;熟练掌握和运用Eviews软件的图示检验、G-Q检验、怀特White 检验等异方差检验方法和处理异方差的方法——加权最小二乘法;实验内容:书P116例4.1.4:中国农村居民人均消费函数中国农村居民民人均消费支出主要由人均纯收入来决定;农村人均纯收入除从事农业经营的收入外,还包括从事其他产业的经营性收入以及工资性收入、财产收入和转移支付收入等;为了考察从事农业经营的收入和其他收入对中国农村居民消费支出增长的影响,建立双对数模型:其中,Y表示农村家庭人均消费支出,X1表示从事农业经营的纯收入,X2表示其他来源的纯收入;表4.1.1列出了中国内地2006年各地区农村居民家庭人均纯收入及消费支出的相关数据;表4.1.1 中国2006年各地区农村居民家庭人均纯收入与消费支出单位:元注:从事农业经营的纯收入由从事第一产业的经营总收入与从事第一产业的经营支出之差计算,其他来源的纯收入由总纯收入减去从事农业经营的纯收入后得到;资料来源:中国农村住户调查年鉴2007、中国统计年鉴2007;实验步骤:一、创建文件1.建立工作文件CREATE U 1 31 其中的“U”表示非时序数据2.录入与编辑数据Data Y X1 X2 意思是:同时录入Y、X1和X2的数据3.保存文件单击主菜单栏中File→Save或Save as→输入文件名、路径→保存;二、数据分析1.散点图①Scat X1 Y从散点图可看出,农民农业经营的纯收入与农民人均消费支出呈现一定程度的正相关;②Scat X2 Y从散点图可看出,农民其他来源纯收入与农民人均消费支出呈现较高程度的正相关;2.数据取对数处理Genr LY=LOG YGenr LX1=LOG X1Genr LX2=LOG X2三、模型OLS 参数估计与统计检验 LS LY C LX1 LX2得到模型OLS 参数估计和统计检验结果:Dependent Variable: LY Method: Least Squares Sample: 1 31Variable CoefficientStd. Errort-StatisticProb.C LX1 R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic 注意:在学术文献中一般以这种形式给出回归方程的输出结果,而不是把上面的软件输出结果直接粘贴到文章中可决系数,调整可决系数,显示模型拟合程度较高;同时,F 检验统计量,在5%的显着性水平下通过方程总体显着性检验;可认为农民农业经营的收入和其他收入整体与农村居民消费支出的线性关系显着成立;变量X2和截距项均在5%的显着性水平下通过变量显着性检验,但X1在10%的显着水平下仍不能通过检验;四、异方差检验对于双对数模型,由于12(0.150214)(0.477453)ββ=<=二者均为弹性系数,可认为其他来源的纯收入而不是从事农业经营的纯收入的增长,对农户人均消费的增长更有刺激作用;也就是说,不同地区农村人均消费支出的差别主要来源于非农经营收入及工资收入、财产收入等其他来源收入的差别,因此,如果模型存在异方差性,则可能是X2引起的;1.图示检验法观察残差的平方与LX2的散点图;①残差resid残差resid变量数据是模型参数估计命令完成后由Eviews软件自动生成在Workfile 框里可找到,无需人工操作获得;注意,resid保留的是最近一次估计模型的残差数据;②残差的平方与LX2的散点图Scat LX2 resid^2从上图可大体判断出模型存在递增型异方差性;2.G-Q法检验异方差补充:先定义一个变量T,取值为1、2、…、31分别代表各省市,用于在做完G-Q检验之后,再按T排序,使数据顺序还原;Data T 提示:输入1、2、…、31①将所有原始数据按照X2升序排列;Sort X2Show Y X1 X2 LY LX1 LX2显示各个变量数据的目的是查看一下,所有变量数据是否按X2升序排列好了;②将31对样本数据,去掉中间的7对,形成两个容量均为12的子样本,即1-12和20-31;③对1-12的子样本做普通最小二乘估计,并记录残差平方和RSS;1Smpl 1 12 意思是:将样本区间由1-31,改为1-12Ls LY C LX1 LX2Dependent Variable: LYMethod: Least Squares Sample: 1 12C LX1 LX2R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson statProbF-statistic子样本1:12ln 3.1412080.398385ln 0.234751ln Y X X e =+++1RSS =④对20-31的子样本做普通最小二乘估计,并记录残差平方和2RSS ; Smpl 20 31 意思是:将样本区间由1-12,改为20-31 Ls LY C LX1 LX2Dependent Variable: LY Method: Least Squares Sample: 20 31Included observations: 12C LX1 R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson statProbF-statistic子样本2:12ln 3.9936440.113766ln 0.6201681ln Y X X e =-++2RSS =⑤异方差检验在5%与10%的显着性水平下,自由度为9,9的F分布临界值分别为0.05(9,9) 3.18F=与0.10(9,9) 2.44F=;因此5%显着性水平下不能拒绝同方差假设,但在10%的显着性水平下拒绝;补充:怀特检验软件操作:在原始模型的OLS方程对象窗口中,选择view/Residual test/White Heteroskedasticity;Eviews提供了包含交叉项的怀特检验“White Heteroskedasticitycross terms”和没有交叉项的怀特检验“White Heteroskedasticityno cross terms”这样两个选择;问题:如果是刚做完上面的G-Q检验,如何得到原始模型答案:先恢复成全样本,再按T排序,然后做OLS回归;SMPL 1 31 意思是:将样本区间恢复到1-31补充:将样本数据按T升序排列,使数据顺序还原;Sort T 意思是:将数据顺序还原Ls LY C LX1 LX2下面是在原始模型的OLS方程对象窗口中,选择view/Residual test/White Heteroskedasticity,然后进行包含交叉项的怀特检验“White Heteroskedasticitycross terms”所得到的输出结果最上方显示了两个检验统计量:F统计量和White统计量nR2;下方显示的是以OLS的残差平方为被解释变量的辅助回归方程的回归结果:F-statistic ProbabilityTest Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 05/03/11 Time: 17:21Sample: 1 31C LNX1 LNX1^2 LNX1LNX2 LNX2 R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihood F-statistic 可见,怀特统计量nR 2==31×,大于自由度也即辅助回归方程中解释变量的个数为5的2分布临界值07.115205.0=)(χ,因此,在5%的显着性水平下拒绝同方差的原假设; 五、采用加权最小二乘法处理异方差以下内容和教材P118-120不一样,但是我们必须掌握的重点——以原始模型的OLS 回归残差的绝对值的倒数为权数,手工完成加权最小二乘估计LS LY C LX1 LX2Genr E=resid 意思是:记录双对数模型OLS 估计的残差 用残差的绝对值的倒数对LY 、LX1、LX2做加权: Genr LYE=LY/abs E Genr LX1E=LX1/abs E Genr LX2E=LX2/abs E Genr CE=1/abs E LS LYE CE LX1E LX2EDependent Variable: LYE Method: Least Squares Sample: 1 31CELX1ER-squared Mean dependent varAdjusted R-squared . dependent var. of regression Akaike info criterionSum squared resid Schwarz criterionLog likelihood Durbin-Watson stat可以看出,lnX1参数的t统计量有了显着改进,这表明在1%显着性水平下,都不能拒绝从事农业生产带来的纯收入对农户人均消费支出有着显着影响的假设;六、检验加权的回归模型是否还存在异方差1.检验是否由LX1E引起异方差Sort LX1E 意思是:将原始数据按LX1E升序排列①子样本1的回归:Smpl 1 12LS LYE CE LX1E LX2EDependent Variable: LYEMethod: Least SquaresSample: 1 12Variable Coefficient Std. Error t-Statistic Prob.CELX1ER-squared Mean dependent varAdjusted R-squared . dependent var. of regression Akaike info criterionSum squared resid Schwarz criterionLog likelihood Durbin-Watson stat子样本1:RSS=1②子样本2的回归:Smpl 20 31LS LYE CE LX1E LX2EDependent Variable: LYE Method: Least Squares Date: 05/01/11 Time: 23:23 Sample: 20 31Variable CoefficientStd. Errort-StatisticProb.CE LX1E R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihoodDurbin-Watson stat子样本2:2RSS =③异方差检验 注意做题的步骤提出假设 22012:H σσ= 22112:H σσ≠ 计算检验统计量:在5%的显着性水平下,自由度为9,9的F 分布临界值分别为0.05(9,9) 3.18F =;因此5%显着性水平下不能拒绝同方差假设;2.检验是否由LX2E 引起异方差Smpl 1 31 意思是:将样本区间复原Sort lx2e 意思是:将原始数据按LX2E 升序排列 ①子样本1的回归: Smpl 1 12LS LYE CE LX1E LX2EDependent Variable: LYE Method: Least Squares Sample: 1 12CE LX1E R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihoodDurbin-Watson stat子样本1:1RSS = ②子样本2的回归: Smpl 20 31LS LYE CE LX1E LX2EDependent Variable: LYE Method: Least Squares Sample: 20 31Included observations: 12CE LX1E R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared resid Schwarz criterion Log likelihoodDurbin-Watson stat子样本2:2RSS =③异方差检验 注意做题的步骤提出假设 22012:H σσ= 22112:H σσ≠ 计算检验统计量:在5%的显着性水平下,自由度为9,9的F 分布临界值分别为0.05(9,9) 3.18F =;因此5%显着性水平下不能拒绝同方差假设;结论:用OLS 估计的残差绝对值的倒数作为权数,对存在异方差的模型加权,然后采用OLS估计,则一定会消除异方差;最终通过异方差检验的估计方程为:实验四序列相关性实验目的:在理解序列相关性的基本概念、序列相关的严重后果的基础上,掌握进行序列相关检验和处理的方法;熟练掌握Eviews软件的图示检验、DW检验、拉格朗日乘数LM检验等序列相关性检验方法和处理序列相关性的方法——广义差分法;实验内容:书P132例4.2.1:中国居民总量消费函数建立总量消费函数是进行宏观经济管理的重要手段;为了从总体上考察中国居民收入与消费的关系,P56表2.6.3给出了中国名义支出法国内生产总值GDP、名义居民总消费CONS以及表示宏观税负的税收总额TAX、表示价格变化的居民消费价格指数CPI1990=100,并由这些数据整理出实际支出法国内生产总值GDPC=GDP/CPI、居民实际消费总支出Y=CONS/CPI,以及实际可支配收入X=GDP-TAX/CPI;表2.6.3 中国居民总量消费支出与收入资料单位:亿元年份GDP CONS CPI TAX GDPC X Y19781979198019811982198319841985198619871988198919901991199219931994199519961997199819992000200120022003200420052006资料来源:根据中国统计年鉴2001,2007整理;实验步骤:一、创建文件1.建立工作文件CREATE A 1978 2006 其中的“A”表示年度数据2.录入与编辑数据Data X Y3.保存文件单击主菜单栏中File→Save或Save as→输入文件名、路径→保存;二、数据分析:趋势图Plot X Y 意思是:同时画出Y和X的趋势图从X和Y的趋势图中可看出它们存在共同变动趋势;三、OLS参数估计与统计检验LS Y C XDependent Variable: YMethod: Least Squares Sample: 1978 2006C R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterion Sum squared residSchwarz criterion Log likelihood F-statistic Durbin-Watson statProbF-statistic从OLS 估计的结果看,模型拟合较好:可决系数20.9880R =,截距项和斜率项的t 检验值均大于5%显着性水平下自由度为n-2=27的临界值0.025(27) 2.05t =;而且,斜率项符合经济理论中边际消费倾向在0与1之间的绝对收入假说;斜率项表明,在1978—2006年间,以1990年价计算的中国居民可支配总收入每增加1亿元,居民消费支出平均增加亿元;四、序列相关性检验 1.图示检验法①残差与时间t 的关系图趋势图 Plot resid②相邻两期残差之间的关系图 Scat resid-1 resid从两个关系图看出,随机误差项呈正序列相关性;.检验值为,表明在5%显着性水平下,n=29,k=2包括常数项,查表得1.34L d =, 1.48U d =,由于.= 1.34L d <=,故存在正序列相关;五、处理序列相关1.修正模型设定偏误剔除虚假序列相关首先面临的问题是,模型的序列相关是纯序列相关,还是由于模型设定有偏误而导致的虚假序列相关;从X 和Y 的趋势图中看到它们表现出共同的变动趋势,因此有理由怀疑较高的2R =部分地是由这一共同的变化趋势带来的;为了排除时间序列模型中这种随时间变动而具有的共同变化趋势的影响,一种解决方案是在模型中引入时间趋势项,将这种影响分离出来;由于本例中可支配收入X 与消费支出Y 均呈非线性变化态势,因此引入的时间变量TT=1,2,……,29以平方的形式出现,回归模型变化为:①编辑变量T data T在数据表中输入1-29; ②做如下的回归 Ls Y C X T^2Dependent Variable: Y Method: Least Squares Sample: 1978 2006 Included observations: 29C X T ^2R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterionSum squared resid 6054792. Schwarz criterionLog likelihood F-statistic 得到如下的修正模型:可见,T 2的t 统计量显着;但是,修正的模型.值仍然较低,没有通过5%显着性水平下的.检验n=29,k=3时,27.1=L D ,56.1=U D ,因此该模型仍存在正序列相关性;补充:序列相关性的拉格朗日乘数检验LM检验在EViews软件中,如果在上面的OLS回归方程界面直接做残差序列的LM检验,那么得到的是如下结果,和书上P133结果不一致:原因:EViews在做LM检验时,为了不损失样本,把滞后残差序列的“前样本”缺失值设定为0Presample missing value lagged residuals set to zero.;这样,它的样本容量仍然是n,而不是n-p;回归结果和书上也有不同;解决办法:要使软件的LM检验结果和教材P133结果一致,办法是进行OLS估计之后,先把残差序列resid用genr生成另一序列e,再做辅助回归,即:genr e=resid先做含1阶滞后残差的辅助回归:ls e c x t^2 e-1Dependent Variable: EMethod: Least SquaresDate: 04/26/13 Time: 07:08Sample adjusted: 1979 2006Included observations: 28 after adjustmentsVariable Coefficient Std. Error t-Statistic Prob.CXT^2E-1R-squared Mean dependent varAdjusted R-squared . dependent var. of regression Akaike info criterionSum squared resid 2103016. Schwarz criterionLog likelihood Hannan-Quinn criter.F-statistic Durbin-Watson statProbF-statisticLM检验统计量必须自己算:LM=n-pR2=29-1=由于该值大于显着性水平为5%、自由度为1的2分布临界值84.31205.0=)(χ,由此判断原模型存在1阶序列相关;再做含2阶滞后残差的辅助回归: ls e c x t^2 e-1 e-2Dependent Variable: E Method: Least Squares Date: 04/26/13 Time: 07:32 Sample adjusted: 1980 2006Included observations: 27 after adjustmentsVariable Coefficient Std. Error t-Statistic Prob. C X T^2 E-1 E-2R-squaredMean dependent var Adjusted R-squared . dependent var . of regressionAkaike info criterion Sum squared resid 1806465. Schwarz criterion Log likelihood Hannan-Quinn criter. F-statistic Durbin-Watson statProbF-statisticLM 检验统计量必须自己算:LM=n-pR 2=29-2=由于该值大于显着性水平为5%、自由度为2的2分布临界值99.52205.0=)(χ,由此判断原模型存在序列相关;但2~-t e 的系数未通过5%的显着性检验,表明在5%的显着性水平下不存在2阶序列相关性;所以,结合前面含1阶、2阶滞后残差的辅助回归结果,可以判断在5%的显着性水平下仅存在1阶序列相关性;2.广义差分法处理序列相关①Ls Y C X T^2 AR1Dependent Variable: Y Method: Least Squares Sampleadjusted: 1979 2006Included observations: 28 after adjusting endpoints Variable CoefficientStd. Errort-StatisticProb.C X T^2 AR1R-squaredMean dependent var Adjusted R-squared . dependent var . of regression Akaike info criterionSum squared resid 2164144. Schwarz criterionLog likelihood F-statistic AR1前的参数值即为随机扰动项的1阶序列相关系数,在5%的显着性水平下显着;.= ,在5%显着性水平下,1.18.. 1.65L U d DWd =<<=样本容量为28,无法判断广义差分变换后模型是否已不存在序列相关;②继续引入AR2以下内容和教材P133-134的做法不同,但是我们必须掌握的基本做法Ls Y C X T ^2 AR1 AR2Dependent Variable: Y Method: Least Squares Sampleadjusted: 1980 2006Included observations: 27 after adjusting endpointsC X T^2 AR1 AR2R-squaredMean dependent var Adjusted R-squared. dependent var. of regression Akaike info criterionSum squared resid 1834086. Schwarz criterionLog likelihood F-statisticInverted AR Roots .53 .53+.32iAR2前的参数在10%的显着性水平下显着不为0;且.= ,接近于2,认为在10%显着性水平下,已不存在序列相关;但是,在5%的显着性水平下,则没必要引入AR2;注意:教材P133用LM检验的结果是,引入AR1 的回归方程在5%的显着性水平下已不存在序列相关性,因而不需要引入AR2;补充:下面是针对引入AR1的回归方程式的LM检验的命令操作和检验结果:首先,采用上面得到的1阶自回归系数1也即AR1的系数,做如下的1阶广义差分变量的OLS回归注:与式等价:Ls y-1 c x-1 t^t-1^2Dependent Variable: Y-1Method: Least SquaresDate: 06/02/13 Time: 11:07Sample adjusted: 1979 2006Included observations: 28 after adjustmentsVariable Coefficient Std. Error t-Statistic Prob.CX-1T^T-1^2R-squared M ean dependent varAdjusted R-squared . dependent var. of regression A kaike info criterionSum squared resid 2164144. S chwarz criterionLog likelihood H annan-Quinn criter.F-statistic D urbin-Watson statProbF-statistic然后,将上述1阶广义差分方程的残差序列resid 记为e :genr e=resid 最后,做如下的辅助回归:ls e c x-1 t^t-1^2 e-1Dependent Variable: E Method: Least Squares Date: 06/02/13 Time: 11:16 Sample adjusted: 1980 2006Included observations: 27 after adjustmentsVariable CoefficientStd. Errort-StatisticProb.C X-1 T^T-1^2 E-1R-squaredM ean dependent var Adjusted R-squared . dependent var . of regression A kaike info criterionSum squared resid 1965048. S chwarz criterionLog likelihood H annan-Quinn criter. F-statistic D urbin-Watson statProbF-statistic于是,LM 检验统计量:LM=27=;查表,当显着性水平为5%时,自由度为1的2的临界值)(1205.0χ为;上述LM <)(1205.0χ,表明模型的随机误差项已不存在序列相关;。
异方差练习题参考解答

异方差练习题参考解答练习题1.设消费函数为i i i i u X X Y +++=33221βββ式中,i Y 为消费支出;i X 2为个人可支配收入;i X 3为个人的流动资产;i u 为随机误差项,并且222)(,0)(ii i X u Var u E σ==(其中2σ为常数)。
试回答以下问题: (1)选用适当的变换修正异方差,要求写出变换过程;(2)写出修正异方差后的参数估计量的表达式。
2.由表中给出消费Y 与收入X 的数据,试根据所给数据资料完成以下问题:(1)估计回归模型u X Y ++=21ββ中的未知参数1β和2β,并写出样本回归模型的书写格式; (2)试用Goldfeld-Quandt 法和White 法检验模型的异方差性; (3)选用合适的方法修正异方差。
Y X Y X Y X 5580 152 220 95 140 65 100 144 210 108 145 70 85 175 245 113 150 80 110 180 260 110 160 79 120 135 190 125 165 84 115 140 205 115 180 98 130 178 265 130 185 95 140 191 270 135 190 90 125 137 230 120 200 75 90 189 250 140 205 74 105 55 80 140 210 110 160 70 85 152 220 113 150 75 90 140 225 125 165 65 100 137 230 108 145 74 105 145 240 115 180 80 110 175 245 140 225 84 115 189 250 120 200 79 120 180 260 145 240 90 125 178 265 130185981301912703.表中的数据是美国1988研究与开发(R &D )支出费用(Y )与不同部门产品销售量(X ).试根据资料建立一个回归模型,运用Glejser 方法和White 方法检验异方差,由此决定异方差的表现形式并选用适当方法加以修正。
伍德里奇《计量经济学导论》笔记和课后习题详解(异方差性)【圣才出品】

(4)在丌包括截距癿情况下将 1 对 r1u, r2u, , rqu 做回归。异斱差-稳健癿 LM 统计
χ 量就是 n-SSR1,其中 SSR1 是最后这个回归通常癿残差平斱和。在 H0 下 LM 渐近服从
2 q
分布。
4 / 36
圣才电子书 十万种考研考证电子书、题库视频学习平台
变量乊类癿情况出现则具有这种影响。
2.异斱差性对拟合优度癿影响
对拟合优度指标 R2 和 R2 癿解释丌受异斱差性癿影响。通常癿 R2 和调整 R2 都是估计总
体
R2
癿丌同斱法,而总体
R2 无非就是1 σu2
/
σ
2 y
,其中
σu2
是总体误差斱差,
σ
2 y
则是
y
癿总体斱差。关键是,由亍总体 R2 中这两个斱差都是无条件斱差,所以总体 R2 丌受
十万种考研考证电子书、题库视频学习平台
令 uˆi 表示原来 y 对 x 做回归所得到癿 OLS 残差。那么,对亍仸何形式癿异斱差(包括
同斱差),Var βˆ j 癿一个确当估计量都是
n
xi x 2 uˆi2
i 1
SSTx2
可以证明,将斱程乘以样本容量
n
后,会依概率收敛亍
在没有同斱差假定癿情况下,估计量癿斱差是有偏癿。由亍 OLS 标准误直接以这些斱
差为基础,所以它们都丌能用来构造置信区间和 t 统计量。
4.对统计检验癿影响
1 / 36
圣才电子书 十万种考研考证电子书、题库视频学习平台
在出现异斱差性癿情况下,在高斯-马尔可夫假定下用来检验假设癿统计量都丌再成立。 (1)在出现异斱差性时,通常普通最小二乘法癿 t 统计量就丌具有 t 分布,使用大样 本容量也丌能解决这个问题。 (2)F 统计量也丌再是 F 分布。 (3)LM 统计量也丌服从渐近 χ2 分布。
计量经济学异方差性习题及答案

异方差性一、单项选择 1.Goldfeld-Quandt 方法用于检验( )A.异方差性B.自相关性C.随机解释变量D.多重共线性2.在异方差性情况下,常用的估计方法是( )A.一阶差分法B.广义差分法C.工具变量法D.加权最小二乘法 3.White 检验方法主要用于检验( )A.异方差性B.自相关性C.随机解释变量D.多重共线性 4.Glejser 检验方法主要用于检验( )A.异方差性B.自相关性C.随机解释变量D.多重共线性5.下列哪种方法不是检验异方差的方法 ( ) A.戈德菲尔特——匡特检验 B.怀特检验C.戈里瑟检验D.方差膨胀因子检验 6.当存在异方差现象时,估计模型参数的适当方法是 ( )A.加权最小二乘法B.工具变量法C.广义差分法D.使用非样本先验信息7.加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同的权数,从而提高估计精度,即 ( )A.重视大误差的作用,轻视小误差的作用B.重视小误差的作用,轻视大误差的作用C.重视小误差和大误差的作用D.轻视小误差和大误差的作用 8.如果戈里瑟检验表明,普通最小二乘估计结果的残差与有显著的i e i x 形式的相关关i i i v x e +=28715.0系(i v满足线性模型的全部经典假设),则用加权最小二乘法估计模型参数时,权数应为) A. i x B. 21i x i x 19. ( )A.异方差问题B.序列相关问题C.多重共线性问题D.设定误差问题10.设回归模型为i i i u bx y +=,其中i i x u Var 2)(σ=,则的最有效估b 计量为( )∑∑=2ˆx xy bB. 22)(ˆ∑∑∑∑∑--=x x n y x xy n b ∑=x y n b 1ˆ2.在异方差条件下普通最小二乘法具有如下性质()A 、线性B 、无偏性C 、最小方差性D 、精确性E 、有效性3.异方差性将导致A 、普通最小二乘法估计量有偏和非一致B 、普通最小二乘法估计量非有效C 、普通最小二乘法估计量的方差的估计量有偏D 、建立在普通最小二乘法估计基础上的假设检验失效E 、建立在普通最小二乘法估计基础上的预测区间变宽5.当模型存在异方差现象进,加权最小二乘估计量具备( )A 、线性B 、无偏性C 、有效性D 、一致性E 、精确性6.下列说法正确的有()A 、当异方差出现时,最小二乘估计是有偏的和不具有最小方差特性B 、当异方差出现时,常用的t 和F 检验失效C 、异方差情况下,通常的OLS 估计一定高估了估计量的标准差D 、如果OLS 回归的残差表现出系统性,则说明数据中不存在异方差性E 、如果回归模型中遗漏一个重要变量,则OLS 残差必定表现出明显的趋势三、名词解释1.异方差性2.格德菲尔特-匡特检验3.怀特检验4.戈里瑟检验四、简答题1.什么是异方差性?试举例说明经济现象中的异方差性。
计量经济学讲义——线性回归模型的异方差问题1

Gleiser检验与Park检验存在同样的弱点。
(9.3) (9.4) (9.5)
9.4 异方差的诊断-方法4:怀特(White)检验法
Yi = B1 + B 2 X 2 i + B3 X 3 i + u i
2、做如下辅助回归: (9.6) (9.7)
1、首先用普通最小二乘法估计方程(9.6),获得残差ei
E(Y|X)=α+β*X Y
+u +u -u -u -u +u
0
同方差(homoscedasticity)
X 0
E(Y|X)=α+β*X
异方差(heteroscedasticity)
X
一元线性回归分析-回归的假定条件
假定5 无自相关假定,即两个误差项之间不相关。 Cov(ui,uj) = 0。
ui
9.2 异方差的性质
例9.1 美国创新研究:销售对研究与开发的影响 ^ R&D = 266.2575 + 0.030878*Sales se=(1002.963) (0.008347) t =(0.265471) (3.699508) p =(0.7940) R2 = 0.461032 从回归结果可以看出: (1)随着销售额的增加,R&D也逐渐增加,即销售 额每增加一百万美元,研发相应的增加3.1 万美元。 (2)随着销售额的增加,R&D支出围绕样本回归线 的波动也逐渐变大,表现出异方差性。 (0.0019)
计量经济学实验5 异方差

具体步骤是:
1 .选择普通最小二乘法估计原模型,得到随机误差 项的近似估计量 û t; 2.建立 1/| û t | 的数据序列; 3.选择加权最小二乘法,以 1/| û t |序列作为权,进
行估计得到参数估计量。实际上是以 1/| û t |乘原模型的两
边,得到一个新模型,采用普通最小二乘法估计新模型。
以不必把它们全包括在内。无交叉项选项仅使用解释变
量平方进行检验回归。
例:人均家庭交通及通讯支出(CUM)和可支配收入(IN ) 的回归方程的 White 异方差检验的结果:
该结果F 统计量和 Obs*R2 统计量的P值均很小,表明 拒绝原假设,即残差存在异方差性。
利用加权最小二乘法消除异方差
1.方差已知的情形 假设有已知形式的异方差性,并且有序列w,其值与误差标 准差的倒数成比例。这时可以采用权数序列为w 的加权最小二乘 估计来修正异方差性。对加权自变量和因变量最小化残差平方和 得到估计结果 :
四、实验原理与操作
异方差性检验
1. 图示检验法 (1) 用X-Y的散点图进行判断 观察是否存在明显的散点扩大、缩小或复杂型趋势(即 不在一个固定的带型域中)
2的散点图进行判断 (2)X - û i 首先采用OLS方法估计模型,以求得随机误差项的估计量 (注意,该估计量是不严格的),我们称之为“近似估计量”,用 2 表示。于是有 û i
5.随机误差项服从0均值、同方差的正态分布。即
ui ~
N (0, )
2
i=1,2,…,N
当随机误差项满足假定1 ~ 4时,将回归模型”称为 “标准回归模型”,当随机误差项满足假定1 ~ 5时,将回 归模型称为“标准正态回归模型”。如果实际模型满足不 了这些假定,普通最小二乘法就不再适用,而要发展其他 方法来估计模型。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验课单元(六)异方差练习【实验目的】掌握异方差及相关内容的软件操作【实验内容】用OLS方法估计模型的参数,检验异方差,修正异方差【实验步骤】异方差练习的操作指令(以双变量回归模型为例)操作:(1)用OLS方法估计模型的参数。
(2)异方差检验①图示法。
从Equation→resid,得到残差图。
还可把resid变换为e,再作e与序列x的散点图。
②G-Q检验。
从主窗口→点击Procs→Sort Current page→yes,出现排序对话框后,键入x,选升序(ascending),单击OK。
假定样本数据为n,去掉中间c(n/4)个数据,然后分成两组数据,分别做两个回归,得到两个残差平方和。
构造F统计量,取显著性水平0.05,查F分布表,得到F临界值,如果F统计量大于F临界值,则存在异方差。
(3)异方差的修正。
用加权最小二乘法,具体操作:在工作文件单击方程标识,打开回归方程,在方程窗口单击Estimate→Options→Weighted LS/TSLS→Weight(输入权数)→OK(4)为了分析异方差的校正情况,利用WLS估计出模型以后,还需要利用怀特检验再次判断模型是否存在异方差性。
具体操作:在方程窗口单击View→Residual Test→White Heteroskedasticity。
χ,n为辅助方程解释变量的个数,如果nR2<)2(2χ,则(5)取显著性水平0.05,查)2(2修正后的方程不存在异方差。
【例】我国2003年的城镇居民可支配收入和家庭平均消费支出单位:元曾康华财经数据>面板数据>biao1一、根据经济理论建立计量经济学模型Y i = β0 + β1X i + u i其中,Y i——表示城镇居民家庭平均消费支出β0、β1 ——表示待定系数X i——表示我国城镇居民可支配收入u i——表示随机误差项用普通最小二乘法进行估计,估计结果如下:Dependent Variable: YMethod: Least SquaresDate: 11/17/08 Time: 09:17Sample: 1 29Included observations: 29Variable Coefficient Std. Error t-Statistic Prob.C 188.8877 199.4366 0.947107 0.3520X 0.744054 0.023167 32.11649 0.0000R-squared 0.974491 Mean dependent var 6353.973Adjusted R-squared 0.973547 S.D. dependent var 1791.081S.E. of regression 291.3099 Akaike info criterion 14.25312Sum squared resid 2291259. Schwarz criterion 14.34742Log likelihood -204.6703 F-statistic 1031.469Durbin-Watson stat 2.177714 Prob(F-statistic) 0.000000Y i = 188.8877 +0.744054 X it-Statistic :(0.947107) (32.11649)R2 = 0.9744912ˆR= 0.973547 F = 1031.469根据上述结果,怀疑模型存在异方差,下面分别用几种不同的方法检验随机误差项的异方差性。
二、检验随机误差项的异方差性1、图示法检验:分别绘制X、e坐标系,Y、2e坐标散点图,如下:从上图中可以看出,随着城镇居民可支配收入的增加,残差的离散程度加大,表示随机误差项存在异方差。
随着家庭平均消费支出的增加,残差平方的离散程度也加大。
表示随机误差项存在异方差。
2、戈德菲尔德—夸特检验将X的样本观测值按升序排列,Y的样本观测值按原来与X样本观测值的对应关系进行排列,排列结果如下表。
略去中心7个样本观测值,将剩下的22个样本观测值分成容量相等的两个子样本,每个字样本的样本观测值个数均为11。
用第一个子样本估计模型,做最小二乘法估计得:Dependent Variable: YMethod: Least SquaresDate: 11/17/08 Time: 08:53Sample: 1 11Included observations: 11Y=C(1)+C(2)*XCoefficient Std. Error t-Statistic Prob.C(1) 5081.688 3480.197 1.460173 0.1783C(2) 0.017152 0.513006 0.033435 0.9741R-squared 0.000124 Mean dependent var 5198.015Adjusted R-squared -0.110973 S.D. dependent var 253.4918S.E. of regression 267.1872 Akaike info criterion 14.17674Sum squared resid 642501.2 Schwarz criterion 14.24909Log likelihood -75.97208 F-statistic 0.001118Durbin-Watson stat 2.669702 Prob(F-statistic) 0.974058Yˆ=5081.688 + 0.017152 X i∑2e= 642501.21i用第二个子样本估计模型,做最小二乘法估计得:Dependent Variable: Y Method: Least Squares Date: 11/17/08 Time: 08:54 Sample: 19 29Included observations: 11 Y=C(1)+C(2)*XCoefficient Std. Error t-Statistic Prob. C(1) -131.7089 410.5252 -0.320830 0.7557 C(2)0.7698700.03803620.240350.0000R-squared 0.978503 Mean dependent var 7944.065 Adjusted R-squared 0.976115 S.D. dependent var 2073.420 S.E. of regression 320.4429 Akaike info criterion 14.54025 Sum squared resid 924152.8 Schwarz criterion 14.61260 Log likelihood -77.97138 F-statistic 409.6716 Durbin-Watson stat 2.228066 Prob(F-statistic)0.000000Yˆ = -131.7089 + 0.769870 X i ∑22i e = 924152.8提出原假设 H 0 :21σ =22σ=…=230σ 备择假设 H 1 :21σ 22σ …230σ 互不相同。
构造F 统计量 F =∑∑2122i i ee=924152.8 / 642501.2 = 1.43837给定显著性水平α=0.05,查F 分布表 1v = 2v = 11- 2 = 9 ,F 0.05(9,9)= 3.18>1.43837 ,所以应拒绝备择假设,即该模型的随机误差项不存在异方差性。
3、White 检验White Heteroskedasticity Test:F-statistic 1.042503 Probability 0.366847 Obs*R-squared2.152935 Probability0.340797Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 11/17/08 Time: 09:33Sample: 1 29Included observations: 29Variable Coefficient Std. Error t-Statistic Prob.C 109462.0 337711.7 0.324128 0.7484X -13.86299 71.71463 -0.193308 0.8482X^2 0.001139 0.003493 0.326092 0.7470R-squared 0.074239 Mean dependent var 79008.93Adjusted R-squared 0.003027 S.D. dependent var 84337.38S.E. of regression 84209.65 Akaike info criterion 25.61770Sum squared resid 1.84E+11 Schwarz criterion 25.75915Log likelihood -368.4567 F-statistic 1.042503Durbin-Watson stat 2.183578 Prob(F-statistic) 0.366847Obs*R-squared =2.152935< x^0.05(2)=5.991 所以该模型不存在异方差。
三、克服异方差(本来没有异方差,实际不需要克服,纯属练习之用)如果异方差与X有关,通常的做法是用X^2去除原回归式,即以1/ X^2为权作加权最小二乘估计。
Y i / X i ^2= β0 / X i ^2+ β1 / X i + u i / X i ^2用Eviews进行加权最小二乘估计,如下图:Dependent Variable: YMethod: Least SquaresDate: 11/17/08 Time: 09:38Sample: 1 29Included observations: 29Weighting series: 1/(X^2)Variable Coefficient Std. Error t-Statistic Prob.C 388.2624 381.9063 1.016643 0.3183X 0.718070 0.052624 13.64533 0.0000Weighted StatisticsR-squared 0.950459 Mean dependent var 5788.467Adjusted R-squared 0.948624 S.D. dependent var 1266.029 S.E. of regression 286.9621 Akaike info criterion 14.22305 Sum squared resid 2223375. Schwarz criterion 14.31735 Log likelihood -204.2342 F-statistic 186.1951 Durbin-Watson stat 2.141801 Prob(F-statistic) 0.000000Unweighted StatisticsR-squared 0.973221 Mean dependent var 6353.973 Adjusted R-squared 0.972229 S.D. dependent var 1791.081 S.E. of regression 298.4755 Sum squared resid 2405366. Durbin-Watson stat 2.072040再次作怀特检验,看异方差是否消除。