备课笔记_回归检验

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.ttest 二个样本独立T检验

use /stat/stata/webbooks/reg/elemapi2

ttest api00, by(yr_rnd)

Two-sample t test with equal variances

2.检查回归模型残差的正态性

一般的观点是多元回归要求残差为正态分布。实际情况是,进行回归的有效性检验如t检验的P值、F检验的p值的情况下要求残差是正态性分布的,但回归系数估计的无偏性并不要求残差的正态性。OLS只要求残差项(误差项)独立同分布。此外,对X变量的正态分布假设也不是必要的,例如对虚拟变量的回归。

当我们进行回归分析时,通常用predict 命令提取回归的残差项,并用kdensity, qnorm, pnorm 等命令检验残差是否为正态分布。

use /stat/stata/webbooks/reg/elemapi2 //api00:学术绩效;ell:英语学习人数;emer:拥有证书的教师比例;

regress api00 meals ell emer

predict r, resid //用predict命令求得残差

kdensity r, normal //用kdensity命令进行核心密度估计并生成核密度图,其中normal选项要求正态密度和计算的核密度叠加。核密度图可以相像成是一系列无限小的柱状图组合而成。

pnorm r // pnorm命令画出标准正态概率图(P-P)。pnorm对数据中段的非正态性非常敏感。

qnorm r // qnorm命令画出变量r的分位数(与分位数的正态分布相反)。qnorm对数据两端的非正态性比较敏感。

从上面两图可以看到,残差分布稍微偏离正态分布,接受残差分布为正态分布的假设。

除图形检验外,还可以用数值方法检验分布的正态性。其中一个检验程序是由Lawrence C. Hamilton 编写的,可以通过findit iqr 命令将其从网络中搜寻并安装,或者在Stata 中的帮助里查找iqr ,找到后击相对应的程序再点击、install 。

iqr r

另一个可用的检验是swilk 命令,是Shapiro-Wilk W 正态性检验,零假设为正态分布。 swilk r

从检验结果来看,p 值非常大(p=0.51),表明不能拒绝零假设。

3.检查残差的同方差(Checking Homoscedasticity of Residuals )

OLS 的一个主要假设是残差方差是齐次的,即同方差。如果模型拟合较好,残差图和拟合值应该是一致的。如果残差的方差不是常数,意味着残差方差为“异方差”(heteroscedastic )。可以用图形法,或者非图形法检测异方差。较常用的图形法是画出残差与拟合值,即rvfplot 命令。

rvfplot , yline(0) // yline(0)选项指使用y=0作为参考线。

R e s i d u a l s 从图上可以看到数据点分布基本均匀,只是右端有点窄,这时可认为是同方差。

还有两个命令可以检验同方差,estat imtest 和estat hettest 。

第一个是White's test,第二个是Breusch-Pagan test。二者的零假设均为方差残差是同方差。因此,如果p值非常小,我们拒绝零假设,接受备择假设,即存在异方差。

estat imtest

. estat imtest

Cameron & Trivedi's decomposition of IM-test

Source chi2 df p

Heteroskedasticity 18.35 9 0.0313

Skewness 7.78 3 0.0507

Kurtosis 0.27 1 0.6067

Total 26.40 13 0.0150

estat hettest

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity

Ho: Constant variance

Variables: fitted values of api00

chi2(1) = 8.75

Prob > chi2 = 0.0031

从上面的结果来看,拒绝了同方差的零假设。这两个检验对模型假设非常敏感,因此需要和图形诊断结合起来检验异方差,以及决定是否需要修正异方差。从前面的例子来看,图形分析结果不是很明确。如何修正异方差,则需要用GLS(广义最小二乘法)、FGLS(可行广义最小二乘法)、WLS(加权最小二乘法)估计来解决,或者使用稳健标准差进行回归(Stata的命令是在回归时加上robust参数)。

使用“OLS+稳健标准差”时对回归系数和标准差的估计都是一致的,并不需要知道条件方差函数的形式,在Stata中的操作也十分简单,在回归命令reg后加上选择项“robust”即可。从理论上来讲,GLS是BLUE,但FGLS即非线性估计,也不是无偏估计,因此它不是BLUE。FGLS 必须先用用样本数据来一致地估计扰动项的协方差矩阵V(X),然后再使用GLS,因此也被称为

可行加权最小二乘法(FWLS),有,其中是V的一致估计,此时是数据集(y, x)的非线性函数,因此是y的非线性函数,一般来说是有偏的。FWLS一般用于大样本理论中。FWLS的另一个缺点是必段估计条件方差函数,而通常情况下并不

知道条件方差的具体形式,如果该函数的设定不正确,则根据FWLS计算的标准差可能失效从而导致不正确的推断。总之“OLS+稳健标准差”适用于更一般的情形,而FWLS更为有效,因此我们必须在稳健性和有效性之间作出选择。具体来说,如果对V的估计不准确,FWLS估计效果不如“OLS+稳健标准差”。Stock and Waston(2004)建议大多数情况下应该使用后者。

下面是一个完整诊断异方差和处理异方差的例子。

use nerlve.dta, clear

reg lntc lnq lnpl lnpk lnpf

相关文档
最新文档