第10章 误差项自相关与异方差

合集下载

第4讲异方差与自相关解析

第4讲异方差与自相关解析

三、实验操作指导
这就是实验模型。显然模型将一个非线性模型转化成了线性 模型,在运用计量经济学进行模型研究时,将非线性模型 化为线性模型来简化分析一直是计量经济学的指导准则。
2.打开文件,进行回归
(1)打开文件命令 use c:\data\nerlove,clear 或者直接从菜单栏中“file”选择“open”找到需要打开的数据 文件nerlove
通过绘制残差图可以直观地观察到是否存在异方 差,但是观察残差图的方法标准较为模糊,会遇 到模型残差图很难判断的情形。所以只采用残差 图的方式判定模型的方差形式是不够严谨的,必 须配合下面几种正规的检验方法才有信服力。 (2)怀特检验法 根据本章节介绍的该方法的原理,Stata可以直接 得到检验结果。对模型基本回归结束后,需要在 命令窗口输入如下命令:
3.异方差检验 对模型进行回归并不是本章的知识,然而回归是一个基础, 即做异方差检验之前必须做回归,下面将会详细介绍异方 差检验的基本方法。 (1)残差图观察法 做完模型的基本回归后,运用Stata绘制残差图来观察异 方差是否存在。 在命令窗口中输入如下两个命令中的任意一个即可 rvfplot (residual-versus-fitted plot) rvpplot varname (residual-versus-predictor plot) 第一个命令语句的作用是绘制默认形式的残差图,第二个 命令语句的作用是绘制残差与某个解释变量的散点图, varname可以换做认为合理的解释变量。
二、实验内容和数据来源 数据来自Nerlove 1963年的一篇文章,数据内容是美国1955 年145家电力企业的横截面数据,变量主要有TC(企业总 成本)、Q(产量)、PL(工资率)、PF(燃料价格)及 PK(资本租赁价格)。完整的数据在本书附带光盘里的 data文件夹的“nerlove.dta”工作文件夹中。 根据cobb-douglas生产函数:,在企业追求成本最小化的 的合理假设下,可证明其成本函数也为cobb-douglas函数, 可显示如下: 本实验中,运用nerlove数据分析各个解释变量对总成本 TC的影响,并运用多种方法检验是否存在异方差,如果 存在异方差则对模型进行合理的修正,最终得到一个效果 较好的模型。

异方差、自相关检验及修正

异方差、自相关检验及修正

异方差、自相关的检验与修正实验目的:通过对模型的检验掌握异方差性问题和自相关问题的检验方法及修正的原理,以及相关的Eviews 操作方法。

模型设定:εβββ+++=23121i i i X X YYi----人均消费支出X1--从事农业经营的纯收入X2--其他来源的纯收入 中国内地2006年各地区农村居民家庭人均纯收入与消费支出 单位:元 城市 y x1 x2 城市 y x1 x2 北京 5724.5 958.3 7317.2 湖北 2732.5 1934.6 1484.8 天津 3341.1 1738.9 4489 湖南 3013.3 1342.6 2047 河北 2495.3 1607.1 2194.7 广东 3886 1313.9 3765.9 山西 2253.3 1188.2 1992.7 广西 2413.9 1596.9 1173.6 内蒙古 2772 2560.8 781.1 海南 2232.2 2213.2 1042.3 辽宁 3066.9 2026.1 2064.3 重庆 2205.2 1234.1 1639.7 吉林 2700.7 2623.2 1017.9 四川 2395 1405 1597.4 黑龙江 2618.2 2622.9 929.5 贵州 1627.1 961.4 1023.2 上海 8006 532 8606.7 云南 2195.6 1570.3 680.2 江苏 4135.2 1497.9 4315.3 西藏 2002.2 1399.1 1035.9 浙江 6057.2 1403.1 5931.7 陕西 2181 1070.4 1189.8 安徽 2420.9 1472.8 1496.3 甘肃 1855.5 1167.9 966.2 福建 3591.4 1691.4 3143.4 青海 2179 1274.3 1084.1 江西 2676.6 1609.2 1850.3 宁夏 2247 1535.7 1224.4 山东 3143.8 1948.2 2420.1 新疆 2032.4 2267.4 469.9 河南 2229.3 1844.6 1416.4 数据来源:《中国农村住户调查年鉴(2007)》、《中国统计年鉴(2007)》参数估计:估计结果如下:2709030.01402097.01402.728X X Y ++=Λ(2.218) (2.438) (16.999) 922173.02=R D.W.=1.4289 F=165.8853 SE=395.2538实验步骤:一、检查模型是否存在异方差1.图形分析检验(1)散点相关图分析分别做出X1和Y 、X2和Y 的散点相关图,观察相关图可以看出,随着X1、X2的增加,Y 也增加,但离散程度逐步扩大,尤其表现在X1和Y .这说明变量之间可能存在递增的异方差性。

随机误差项的方差

随机误差项的方差

Box-Pierce Q 检验和Bartlett检验 (Ljung and Box, 1979)
❖ Q检验和Bartlett检验 reg consum income predict e2,res wntestq e2 wntestb e2
Breusch-Godfrey(LM) 检验
❖ reg consum income ❖ bgodfrey
D.W检验步骤: (1)计算DW值
DW 2(1 )
(2)给定,由n和k的大小查DW分布表,得临界 值dL和dU (3)比较、判断
若 0<D.W.<dL
存在正自相关
dL<D.W.<dU
不能确定
dU <D.W.<4-dU
无自相关
4-dU <D.W.<4- dL 不能确定
4-dL <D.W.<4
存在负自相关
Newey 稳健型估计 (White1980估计的扩展)
❖ reg consum income ❖ newey consum income , lag(1) ❖ newey consum income , lag(2)
广义差分法: CO-PW方法
Cochrane-Orcutt(1949) 估计(舍弃第一期观察 值)
❖ 由于时间序列的数据往往较少,所以尽量不 损失样本
广义差分法: CO-PW方法
❖ 广义差分的stata命令: ❖ prais y x1 x2 x3 (使用默认的PW方法) ❖ prais y x1 x2 x3, corc (使用CO方法) ❖ prais consum income,corc
prais consum income
v 异方差经常出现在截面数据中,因为在截面数据中

第讲异方差与自相关

第讲异方差与自相关
精品文档
▪ 3.异方差检验 ▪ 对模型进行回归并不是本章的知识,然而回归是一个基础,即做
异方差检验之前必须做回归,下面将会详细介绍异方差检验的基 本方法。 ▪ (1)残差图观察法 ▪ 做完模型的基本回归后,运用Stata绘制残差图来观察异方差是 否存在。 ▪ 在命令窗口中输入如下(rúxià)两个命令中的任意一个即可 ▪ rvfplot (residual-versus-fitted plot) ▪ rvpplot varname (residual-versus-predictor plot) ▪ 第一个命令语句的作用是绘制默认形式的残差图,第二个命令语 句的作用是绘制残差与某个解释变量的散点图,varname可以换 做认为合理的解释变量。
精品文档
▪ 在前面的章节中,已经介绍过作残差图的各种命令,所作出的各种 图形虽然有些差异,但是(dànshì)所展示的信息是基本一致的。图 8.2中显示残差的方差是变化的,从一开始时分散程度很大(方差 大),然后逐渐变得紧凑(方差变小),这样一来很显然的否定了 球形扰动项的假设。即通过残差图观察法,得出的结论是此模型存 在异方差问题。
精品文档
▪ reg y x1 x2… [aweight=invvar] ▪ 输入此命令语句对模型加上得出的权重(quán zhònɡ)进行修
正回归,这样就基本完成了FGLS法回归,可以得到一个修 正回归后的结果。 ▪ 那么在本实验中,使用FGLS方法来对模型进行修正回归的 操作如下: ▪ predict u, residuals ▪ gen lnu2=ln(u^2) ▪ 然后进行回归,并得到拟合值, ▪ quietly reg lnu2 lnq lnpl lnpf lnpk ▪ predict g, xb ▪ 找到权重(quán zhònɡ),对模型加上权重(quán zhònɡ)进行 回归就可以得到图8.13的回归结果图。 ▪ gen h=exp(g) ▪ gen invvar=1/h ▪ reg lntc lnq lnpl lnpf lnpk [aweight=invvar]

计量第八章异方差与自相关

计量第八章异方差与自相关
1200
1000
800
600 30
400 20
200 10
0
-10
-20 81 82 83 84 85 86 87 88 89 90 91 92 93
Residual
Actual
Fitted
时间顺序图(Time sequence plot): 将残差对时间描点
εt
t
误差εt并不频繁地改变符号,而是几个正之后 跟着几个负,几个负之后跟着几个正,则呈正 自相关。
4
▪ 根据DW值判断自相关时,需要临界值。
▪ 杜宾和瓦尔森给出了DW的两个临界值下限dL和上限dU。
序列相关的修正
差分法
克服序列相关的有效方法。
差分法原理
Y t1 2 X 2 t k X k t t
AR(1) 模型
t t1t
Y t 1 1 2 X 2 ( t 1 ) k X k ( t 1 )t 1
170.8
26651.9 4443.3
181.7
34560.5 5986.2
208.4
46670
9960.1
258.6
57494.9 11048.1 302.9
66850.5 11557.4
328
73142.7 11806.5 337.2
78017.8 11622.4 334.5
得到如下方程: IM = - 217.186 + 0.173 GNP (5) t (-0.5) (16.94) R2 = 0.960 DW= 0.735 F = 286. t1 t
三、序列相关性的后果
1)参数估计量非有效性 OLS估计得到的仍为线性、无偏估计 但不再具有效性
(低估了估计量的标准差) 2)变量的显著性检验失效

面板数据分析与Stata应用_浙江大学中国大学mooc课后章节答案期末考试题库2023年

面板数据分析与Stata应用_浙江大学中国大学mooc课后章节答案期末考试题库2023年

面板数据分析与Stata应用_浙江大学中国大学mooc课后章节答案期末考试题库2023年1.关于xtabond2这一命令的使用,以下说法错误的是:答案:iv( ) 内放置的是内生的解释变量2.关于门限面板模型的估计,以下说法错误的是:答案:使用 xthreg 命令确定门限值时,是将门限变量的所有值逐一代入进行计算的3.以下哪组数据是短面板数据?答案:N=31,T=214.以下哪个不是非观测效应模型(存在不可观测的个体效应的模型)?答案:混合回归模型5.以下哪个选项符合随机效应模型的设定?答案:不可观测的个体效应与所有解释变量不相关6.使用xtscc命令估计,得到的标准误是:答案:Driscoll-Kraay标准误7.使用聚类稳健的标准误,不能解决以下三大问题中的哪一个?答案:截面相关8.短面板数据模型中的husman检验适用于哪两种模型之间的选择判断?答案:固定效应模型与随机效应模型9.以下命令中,无需其他选项就能够同时处理组内误差自相关、组间异方差和组间相关这三大问题的命令是?答案:xtscc10.以下哪个命令能够检验长面板数据的组间相关问题?答案:xttest211.以下哪个命令没有同时处理三大问题?答案:xtpcse lnc lnp lnpmin lny state2-state10 t, corr(ar1) hetonly12.三阶段最小二乘法的命令是:答案:reg313.以下哪个命令没有同时处理三大问题?答案:xtgls lnc lnp lnpmin lny state2-state10 t,corr(ar1) panels(heteroskedastic) 14.对于解释变量与误差项存在相关性这一内生性问题,以下说法错误的是:答案:其余选项均不正确15.关于两阶段最小二乘法,以下说法错误的是:答案:其余选项均不正确16.以下不属于内生性的三大检验的是:答案:异方差检验17.如果在强相关性检验中,发现当前使用的工具变量是弱工具变量,那么以下说法错误的是:答案:此时不存在任何可以解决的方法,IV方法不再适用18.关于理解DID方法的方式,以下说法错误的是:答案:其余选项均不正确19.以下关于DID模型的设定,表示错误的是:答案:多组多期:20.以下方法中,不属于安慰剂检验的是:答案:可以按照样本的异质性特征,将样本分为不同的小组,在不同组内进行回归21.如果对照组和处理组不满足共同趋势的假定,以下解决方法中不正确的是:答案:不必在意,不满足共同趋势假设也可以继续使用DID方法22.关于合成控制法,以下说法错误的是:答案:合成控制法无法解决选择控制组时存在的主观随意性问题23.关于合成控制法中合成地区的构建,以下说法正确的是:答案:其余三个说法都正确24.下图是上课所举案例在 stata 中运用合成控制法的 synth 命令得到的部分结果:根据上述运行结果,以下说法错误的是:答案:由于预测变量的拟合效果均很好,cigsale(1975)、cigsale(1980)、cigsale(1988) 这三个变量可以省去25.我们可以通过如下目标函数来确定最优带宽:,以下说法错误的是:答案:三角核函数相当于普通 OLS 回归,矩形核函数相当于加权的 OLS 回归26.对动态面板模型使用固定效应方法进行估计时,估计结果一定是有偏且不一致的。

计量经济学_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年

计量经济学_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年

计量经济学_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年1.如果解释变量中存在被解释变量的滞后项,那么检验是否存在自相关应当用答案:BG检验2.DW统计量值接近2时,随机误差项为()答案:无自相关3.如果回归模型中的随机误差项存在异方差,则模型参数的普通最小二乘估计量()答案:无偏但非有效4.在由n=30的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定系数为0.8500,则调整后的多重决定系数为()。

答案:0.83275.对于模型【图片】,如果在异方差检验中发现【图片】,则用加权最小二乘法估计模型参数时,权数应为()答案:6.若回归模型中的随机误差项存在异方差性,则估计模型参数应采用()答案:加权最小二乘法7.总体回归线是指答案:解释变量X取给定值时,被解释变量Y的条件均值或期望值的轨迹8.下列关于可决系数的陈述哪个是正确的。

答案:可决系数是指回归平方和(SSR)在总离差平方和(SST)中所占的比重9.在二元线性回归模型【图片】中,【图片】表示()。

答案:当X2不变时,X1每变动一个单位Y的平均变动。

10.在二元线性回归模型中,回归系数的显著性t检验的自由度为答案:n-311.面板模型中丢失若干观测值,可以说该面板数据是非平衡面板数据。

答案:错误12.面板数据模型有助于减少解释变量之间的共线性,得到更有效的估计量。

答案:正确13.面板数据模型可以解决样本量不足的问题,可以增加样本容量和自由度。

答案:正确14.固定效应模型和随机效应模型的选择性检验,通常采用的是答案:Hausman检验15.面板数据是指答案:不同时点上不同统计单位相同统计指标组成的数据16.当存在序列相关时,OLS估计量是有偏的并且也是无效的答案:错误17.两个模型,一个是一阶差分形式,一个是水平形式,这两个模型的是不可以直接比较的。

答案:正确18.关于BG检验,下列说法正确的是答案:适用于解释变量中包含被解释变量滞后项的回归_适用于检验自相关性19.DW统计量值接近2时,随机误差项为( )答案:无自相关20.BP检验的结果可以帮助我们为加权最小二乘法寻找合适的权重答案:正确21.存在异方差情况下,普通最小二乘估计量依然是无偏和有效的。

异方差自相关豪斯曼检验

异方差自相关豪斯曼检验

异方差自相关豪斯曼检验异方差性(Heteroscedasticity)是指数据的方差不是常数,而是随着自变量的变化而变化。

当数据呈现异方差性时,固定效应模型可能会产生无偏但不一致的估计,而随机效应模型通常能够更好地处理异方差性。

因此,豪斯曼检验可以帮助确定在存在异方差性时应该选择哪种模型。

同时,时间序列数据中还可能存在自相关性(Autocorrelation),即误差项之间存在相关性。

如果数据中存在自相关性,那么OLS估计量可能不再是最佳线性无偏估计。

通过进行豪斯曼检验,可以确定在存在自相关性时是否需要使用修正的OLS估计方法。

要进行豪斯曼检验,首先需要建立两个模型:一个固定效应模型和一个随机效应模型。

然后通过计算两个模型的估计值的差异来进行检验。

在检验中,我们感兴趣的是这个差异是否由异方差性或自相关性引起的。

具体来说,豪斯曼检验的原假设是两个模型没有系统性的差异。

如果原假设被拒绝,说明两个模型之间存在显著差异,这可能是由于异方差性或自相关性导致的。

为了说明豪斯曼检验的方法和步骤,我们将考虑一个实际的研究示例。

假设我们对一个国家的 GDP 进行研究,我们想分析GDP 与劳动力投入之间的关系。

我们建立了一个固定效应模型和一个随机效应模型,用来估计 GDP 对劳动力投入的影响。

在固定效应模型中,我们假设不同国家之间的劳动力投入是不同的,即随着时间的推移,劳动力投入在各国之间也可能存在差异。

而在随机效应模型中,我们假设劳动力投入在各国之间是同质的,即不同的劳动力投入只是由于随机误差所致。

接下来,我们用豪斯曼检验来检验这两个模型之间的差异。

我们首先估计这两个模型,并计算它们之间的差异。

接着,我们对这些差异进行统计检验,以确定差异是否显著。

如果实证结果表明固定效应模型比随机效应模型更好,那么我们可以得出结论,数据中存在异方差性和自相关性。

在这种情况下,我们可能需要对模型进行修正,以更准确地描述数据。

总的来说,豪斯曼检验是一种在经济学和其他社会科学研究中经常使用的方法,用于检验两个模型之间的差异。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
误差项不存在自相关(序列相关)的假定在这种情况 下经常被发现是不合理的。在截面数据中,由于通常假定 搜集的数据是在相同时间对某一总体中的个体进行随机抽 样获得的,所以没有理由认为不同观测值之间存在内在的 相关关系。因而误差项自相关问题主要存在于时间序列数 可能存在,而且还有某些特殊性。
一、自相关
在时间序列中,自相关(Autocorrelation)可以理解为按 一定时间顺序排列的观测序列中各观测值之间存在相关性。
例如时间序列数据中 xt 和 xt j 相关,则称该序列存在j阶自
相关。 j=1时,称之存在1阶自相关,j=2时,则为存在2阶 自相关。
2020年4月1日 山东财经大学统计学院计量经济教研室
2020年4月1日 山东财经大学统计学院计量经济教研室
第7页
机动 目录 上页 下页 返回 结束
这种由于设定误差造成的自相关,在计量经济分析中经常 可能发生。例如,本来应该用两个解释变量去解释y,即
yt 0 1x1t 2 x2t vt
(10.3)
而建立模型时,模型设定为
yt 0 1x1t ut
第4页
机动 目录 上页 下页 返回 结束
在时间序列回归中,经典线性回归模型的假定TS.5和
TS. 6 ',都假定随机误差项相互之间不存在序列自相关,即
Cov(ut , us)=0
(ts, t,s=1,2, …,n)
若违背这个假定, Cov(ut , us)≠0,即u在不同观测点下的 取值相关连,则称随机误差项u存在序列相关(Series Correlation)或自相关(Autocorrelation) 。
(10.2)式定义的自相关系数与普通相关系数的公式形式相同,
r 的取值范围为 1 r 1 。由于式中 ut-1是ut滞后一
期的随机误差项,因此,将上式计算的自相关系数 r 称为一
阶自相关系数。
根据自相关系数的符号可以判断自相关的状态,如果 r <0, 则ut与ut-1为负相关;如果 r >0,则ut与ut-1为正相关;如果 r =0,则ut与ut-1为不相关;
2020年4月1日 山东财经大学统计学院计量经济教研室
第6页
机动 目录 上页 下页 返回 结束
二、自相关产生的原因
自相关问题是利用时间序列数据构建结构模型(因果关系 模型)时面临的主要问题。自相关产生的原因很多,主要有:
(一)解释变量的遗漏或省略
如果模型中省略了某些应该被包含到模型中的重要 解释变量,会产生系统误差,这种误差存在于随机误差 项中,从而带来了误差项自相关。
第十章 误差项自相关与异方差
第一节 误差项自相关及其影响 第二节 误差项自相关的检验 第三节 误差项自相关问题的处理 第四节 时间序列中的异方差*
学习本章后, 您应该做到: 1.理解误差项自相关的概念、产生的原因及其对回归模 型的估计产生的影响; 2.理解误差项自相关的检验方法和原理,能借助于 EViews软件对具体模型进行检验; 3.了解误差项自相关问题的补救方法,理解广义差分法 的原理,掌握EViews软件的具体应用操作; 4.了解时间序列数据中的异方差问题; 5.理解ARCH模型的特点,掌握模型中ARCH效应的检 验方法。
自相关的程度用自相关系数表示。为了不与自回归系
数 混淆,本节用符号 r 表示自相关系数。
随机误差项u t 与滞后一期的ut1的自相关系数为
cov(ut ,ut1) var(ut ) var(ut1)
(10.2)
2020年4月1日 山东财经大学统计学院计量经济教研室
第5页
机动 目录 上页 下页 返回 结束
.(0,
2 u
)
2020年4月1日 山东财经大学统计学院计量经济教研室
第8页
机动 目录 上页 下页 返回 结束
但我们设定的回归方程是AR(1):
yt 0 1 yt1 vt
显然
vt 2 yt1 ut
由于时间序列 yt 是AR(2)过程,所以,误差项肯定表现为自
相关。
更为普遍的是,在建立回归模型时,总是要略去某些次要
(三)原始数据的处理变换
在实证分析中,所用数据有的是由原始数据经过一定 的变化处理得到的。
例如有些季度数据来自于月度数据的平均,有些年度 数据是由季度数据或者月度数据计算得到的,这种处理可 能会产生系统性信息使误差项产生自相关;
学习重点与难点
理解误差项自相关的概念;掌握误差项自相关的检验方 法和补救措施;理解时间序列模型的异方差的特殊性。
2020年4月1日 山东财经大学统计学院计量经济教研室
第2页
机动 目录 上页 下页 返回 结束
由于时间序列数据按照观测时间的先后排序,而对于 变量采集其连续的观测结果很可能表现出内在的相关,当 采集频率较高时尤其明显。经常关注股票市场或者外汇市 场的人们都知道,短期内接连的上涨或下跌是常见现象。
(10.4)
这样,x2t对yt 的影响在便归入到随机误差项ut中,由于x2t在 不同观测点上是相关的,就造成了ut是自相关的。
在自回归模型中,由于随机变量的动态过程没有被完整设定,
也会导致误差项序列相关。例如,“真实”的模型是AR(2):
yt 0 1 yt1 2 yt2 ut
ut
~
i.i.d
2020年4月1日 山东财经大学统计学院计量经济教研室
第3页
机动 目录 上页 下页 返回 结束
第一节 误差项自相关及其影响
本章我们将研究时间序列数据模型中的自相关问题。 为了讨论和理解方便,按照时间序列的习惯做法,我们用t
(t=0,1,2…)表示时间序列数据的不同的观测点,称之
为“期”,将其作为随机项或其它变量的下标,如ut表示u 在第t期所取的值, ut-1表示u在第t-1期所取的值,等等。
的解释变量。如果略去的解释变量有一些存在自相关,它必 然在随机项中反映出来,从而使随机项具有自相关性。
2020年4月1日 山东财经大学统计学院计量经济教研室
第9页
机动 目录 上页 下页 返回 结束
(二)回归模型函数形式设定错误
若回归模型所采用的数学形式与所研究问题的真实 关系不一致,随机误差项就可能存在自相关。例如某些商 品的销售量受季节的影响。设y代表销售量,t 代表时间, 则y与t的真实关系是周期函数形式。如果选用了线性函数 形式,其周期项就并入了误差项之中,误差项在时间上是 相关的。
相关文档
最新文档