备课笔记_回归检验

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

1.ttest 二个样本独立T检验

use /stat/stata/webbooks/reg/elemapi2

ttest api00, by(yr_rnd)

Two-sample t test with equal variances

2.检查回归模型残差的正态性

一般的观点是多元回归要求残差为正态分布。实际情况是，进行回归的有效性检验如t检验的P值、F检验的p值的情况下要求残差是正态性分布的，但回归系数估计的无偏性并不要求残差的正态性。OLS只要求残差项（误差项）独立同分布。此外，对X变量的正态分布假设也不是必要的，例如对虚拟变量的回归。

当我们进行回归分析时，通常用predict 命令提取回归的残差项，并用kdensity, qnorm, pnorm 等命令检验残差是否为正态分布。

use /stat/stata/webbooks/reg/elemapi2 //api00：学术绩效；ell：英语学习人数；emer：拥有证书的教师比例；

regress api00 meals ell emer

predict r, resid //用predict命令求得残差

kdensity r, normal //用kdensity命令进行核心密度估计并生成核密度图，其中normal选项要求正态密度和计算的核密度叠加。核密度图可以相像成是一系列无限小的柱状图组合而成。

pnorm r // pnorm命令画出标准正态概率图（P-P）。pnorm对数据中段的非正态性非常敏感。

qnorm r // qnorm命令画出变量ｒ的分位数（与分位数的正态分布相反）。qnorm对数据两端的非正态性比较敏感。

从上面两图可以看到，残差分布稍微偏离正态分布，接受残差分布为正态分布的假设。

除图形检验外，还可以用数值方法检验分布的正态性。其中一个检验程序是由Lawrence C. Hamilton 编写的，可以通过findit iqr 命令将其从网络中搜寻并安装，或者在Stata 中的帮助里查找iqr ，找到后击相对应的程序再点击、install 。

iqr r

另一个可用的检验是swilk 命令，是Shapiro-Wilk W 正态性检验，零假设为正态分布。 swilk r

从检验结果来看，p 值非常大（p=0.51），表明不能拒绝零假设。

3.检查残差的同方差（Checking Homoscedasticity of Residuals ）

OLS 的一个主要假设是残差方差是齐次的，即同方差。如果模型拟合较好，残差图和拟合值应该是一致的。如果残差的方差不是常数，意味着残差方差为“异方差”（heteroscedastic ）。可以用图形法，或者非图形法检测异方差。较常用的图形法是画出残差与拟合值，即rvfplot 命令。

rvfplot , yline(0) // yline(0)选项指使用y=0作为参考线。

R e s i d u a l s 从图上可以看到数据点分布基本均匀，只是右端有点窄，这时可认为是同方差。

还有两个命令可以检验同方差，estat imtest 和estat hettest 。

第一个是White's test，第二个是Breusch-Pagan test。二者的零假设均为方差残差是同方差。因此，如果p值非常小，我们拒绝零假设，接受备择假设，即存在异方差。

estat imtest

. estat imtest

Cameron & Trivedi's decomposition of IM-test

Source chi2 df p

Heteroskedasticity 18.35 9 0.0313

Skewness 7.78 3 0.0507

Kurtosis 0.27 1 0.6067

Total 26.40 13 0.0150

estat hettest

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity

Ho: Constant variance

Variables: fitted values of api00

chi2(1) = 8.75

Prob > chi2 = 0.0031

从上面的结果来看，拒绝了同方差的零假设。这两个检验对模型假设非常敏感，因此需要和图形诊断结合起来检验异方差，以及决定是否需要修正异方差。从前面的例子来看，图形分析结果不是很明确。如何修正异方差，则需要用GLS（广义最小二乘法）、FGLS（可行广义最小二乘法）、WLS（加权最小二乘法）估计来解决，或者使用稳健标准差进行回归（Stata的命令是在回归时加上robust参数）。

使用“OLS+稳健标准差”时对回归系数和标准差的估计都是一致的，并不需要知道条件方差函数的形式，在Stata中的操作也十分简单，在回归命令reg后加上选择项“robust”即可。从理论上来讲，GLS是BLUE，但FGLS即非线性估计，也不是无偏估计，因此它不是BLUE。FGLS 必须先用用样本数据来一致地估计扰动项的协方差矩阵V(X)，然后再使用GLS，因此也被称为

可行加权最小二乘法（FWLS），有，其中是V的一致估计，此时是数据集（y, x）的非线性函数，因此是y的非线性函数，一般来说是有偏的。FWLS一般用于大样本理论中。FWLS的另一个缺点是必段估计条件方差函数，而通常情况下并不

知道条件方差的具体形式，如果该函数的设定不正确，则根据FWLS计算的标准差可能失效从而导致不正确的推断。总之“OLS+稳健标准差”适用于更一般的情形，而FWLS更为有效，因此我们必须在稳健性和有效性之间作出选择。具体来说，如果对V的估计不准确，FWLS估计效果不如“OLS+稳健标准差”。Stock and Waston(2004)建议大多数情况下应该使用后者。

下面是一个完整诊断异方差和处理异方差的例子。

use nerlve.dta, clear

reg lntc lnq lnpl lnpk lnpf