回归模型的统计检验

合集下载

第2章3一元线性回归模型的统计检验

Std. Error t-Statistic
98.40598 -1.048429 0.042485 18.28900
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
2、变量的显著性检验
我们先来构造用于变量显著性检验的检验统计量。 (补充)
对于一元线性回归方程，我们已经知道
ˆ1 ~ N(1,
2
)
xi2
另外，可以证明（参见周纪芗《回归分析》P14）：
（1）（2）
ei2 ~ 2 n 2
2
ˆ1与 ei2独立
于是，可以构造如下统计量：
ˆ1 1
t
2
R2越接近1，说明实际观测点离样本回归线越近，拟合优度越高。
在实际计算可决系数时，在 ˆ1 已经估计出后：
R2
yˆi2 yi2
ˆ12
xi2 yi2
在例2.2.1（P34-35）的可支配收入－消费支出例子中，
R2 ˆ12
xi2 yi2
(0.777)2 7425000 0.9766 4590020
• 换句话说，一个几乎不可能发生的小概率事件（“检验统计量的样本值落入拒绝域”）在一次试验中就发生了，这违背了小概率事件原理，也就意味着导致了一个不合理的结果。
显著性检验的步骤： (★)
（1）提出原假设H0和备择假设H1；（2）计算检验统计量的样本值；（3）确定临界值和拒绝域；（4）下结论。
Std. Error t-Statistic
Prob.1.3495Fra bibliotek8 0.217507

回归模型的统计检验

n 为样本容量。为样本容量。
分布。 F 统计量服从自由度为 ( k , n − k − 1) 的 F 分布。选定分布表（见本书附录）一个显著性水平 α ，查 F 分布表（见本书附录），可以得到一个临界值 Fα ( k , n − k − 1) 。
F检验与R2的关系
根据二者关系，有需注意的几个问题： ⑴F检验实际上也是判定系数的显著性检验。 ⑵如果模型对样本有较高的拟合优度，F检验一般都能通过。 ⑶实际应用中不必过分苛求R2值的大小，重要的是考察模型的经济意义是否合理。
∑ x ∑ x − (∑ x x ) ∑ x σˆ ∑ x ∑ x − (∑ x x )
2 1 2 2 1 2 2 1 2 2 1 2 2 1 2
2 x2 σ 2 ∑ ˆ
2
2
然后根据样本观测值和估计值，构造计算统计量：然后根据样本观测值和估计值，构造计算统计量：
ˆ βi − βi t= ˆ S βi
ˆ ˆ ∑(y − y) = ∑ (y − y) + ∑ (y − y )
2 2 i i i i 2
y
yi
ei
yi − y
ˆ ( yi − y )
SRF
y
xi
x
TSS = Σ ( y i − y ) 2 ˆ ESS = Σ ( y i − y ) 2 ˆ RSS = Σ ( y i − y i ) 2
拟合优度检验统计量：可决系数( 2、拟合优度检验统计量：可决系数(判
定系数) 定系数)R2和校正可决系数 R2
（1）可决系数）
R 2 进行拟合优度检验，可决系用可决系数进行拟合优度检验，
数的计算公式为：数的计算公式为：
( yi − y )2 ∑ˆ 2 R = ( yi − y )2 ∑

一元线性回归模型的统计检验

3. 怎样进行拟合优度检验（1）总离差平方和的分解已知有一组样本观测值( Xi ,Yi )(i 1, 2, , n)，得到如下样本回归直线：
Yˆi ˆ0 ˆ1Xi
Y的第i个观测值与样本均值的离差yi Yi Y 可分解为两部分之和：
yi Yi Y Yi Yˆi Yˆi Y ei yˆi (1)
规则：p值越小，越能拒绝原假设H0.
三、回归系数的置信区间
对参数作出的点估计虽然是无偏估计，但一次抽样它并不一定等于真实值，所以需要找到包含真实参数的一个范围，并确定这个范围包含参数真实值的可靠程度。
在变量的显著性检验中已经知道：
t ˆi i ~ t(n 2) i=0,1
Sˆi
给出置信度1，查自由度为(n 2)的t分布表，
假设检验的步骤：（1）提出原假设和备择假设；（2）根据已知条件选择检验统计量；（3）根据显著性水平确定拒绝域或临界值；（4）计算出统计量的样本值并作出判断。
（2）变量的显著性检验
对于最小二乘估计量ˆ1，已经知道它服从正态分布
ˆ1 ~ N(1,
2
xi2 )
由于真实的 2未知，在用它的无偏估计量ˆ 2
在上述收入——消费支出的例子中，如果给定
=0.01，查表得：
t 2 (n 2) t0.005 (8) 3.355
由于
Sˆ1 0.042
Sˆ0 98.41
于是，计算得到1、0的置信区间分别为：
(0.6345,0.9195)
(-433.32,226.98)
则
TSS RSS ESS
Y的观测值围绕其均值的总离差可分解为两部分：一部分来自回归线(RSS)，另一部分则来自随机势力(ESS)。因此，我们可以用回归平方和RSS 占Y的总离差平方和TSS的比例来度量样本回归线与样本观测值的拟合优度。

试谈回归模型的统计检验

被解释变量 Y 的线性作用的结果，考虑比值
ESS RSS
如果这个比值较大，则X的联合体对Y的解释程度高，可认为总体存在线性关系，反之总体上可能不存在线性关系。
因此,可通过该比值的大小对总体线性关系进行推断。
根据数理统计学中的知识，在原假设H0成立的条件下，统计量
F ESS / k RSS /(n k 1)
回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。
在一元线性模型中，就是要判断X是否对Y 具有显著的线性性影响。这就需要进行变量的显著性检验。
变量的显著性检验所应用的方法是数理统计学中的假设检验。
计量经计学中，主要是针对变量的参数真值是否为零来进行显著性检验的。
1、假设检验
因方程的总体线性关系显著每个解释变量对被解释变量的影响都是显著的
因此，必须对每个解释变量进行显著性检验，以决定是否作为解释变量被保留在模型中。
这一检验是由对变量的 t 检验完成的。
1、t统计量
由于可以证明: Cov(βˆ ) 2 (XX)1
以cii表示矩阵(X’X)-1 主对角线上的第i个元素，于是参数估计量的方差为：
试谈回归模型的统计检验
2021年8月6日星期五
第三节回归模型的统计检验
一、模型的拟合优度检验二、模型的显著性检验三、解释变量的显著性检验
利用样本数据估计得到的样本回归方程, 只是对总体回归方程的一个近似估计模型是否能确切反映经济变量间的相互关系还需要进行检验.
回归分析中主要是通过一些统计检验方法来保证模型在统计意义上的可靠性.
❖ 所谓假设检验，就是事先对总体参数或总体分布形式作出一个假设，然后利用样本信息来判断原假设是否合理，即判断样本信息与原假设是否有显著差异，从而决定是否接受或否定原假设。

一元线性回归模型的统计检验

预测分析
学习如何对新数据进行预测，进行误差分析，并利用置信区间来评估预测的准确性。
模型选择
学习方差分析、逐步回归和信息准则等方法，探讨如何选择最佳的一元线性回归模型。
实例分析
通过应用案例深入理解一元线性回归模型的统计检验，展示实际数据的应用和模型的术论文和研究报告等参考文献，帮助学习者进一步深入研究一元线性回归模型的统计检验。
参数估计
掌握OLS估计法，解释回归系数的含义，了解拟合优度，并且能够根据参数估计法对一元线性回归模型进行参数的估计。
模型检验
进行残差分析，检验模型是否符合要求，学习诊断性检验，发现模型中的问题并作出相应的调整。
显著性检验
学习t检验、p值和显著性水平的概念，了解在一元线性回归模型中如何进行显著性检验。
一元线性回归模型的统计检验
了解一元线性回归模型的统计检验。包括定义与介绍，相关理论，假设检验，样本数据，参数估计，模型检验，显著性检验，预测分析，模型选择，实例分析。
相关理论
了解线性回归方程、残差、误差、相关系数等相关理论，掌握它们在一元线性回归模型中的含义和应用。
样本数据
学习数据的收集、处理和描述，实现对一元线性回归模型的数据样本分析，为后续的参数估计和模型检验打下基础。
Q& A
解答学生对于一元线性回归模型的统计检验相关问题，确保学生对所学内容的充分理解。
总结
对本次PPT的主要内容进行概括，总结重点和难点，帮助学习者回顾和巩固所学知识。
答疑环节
解答学生在本次PPT学习中的遗留问题和疑惑，确保学生能够全面理解一元线性回归模型的统计检验。

多元回归模型参数的各种检验及相关关系总结

多元回归模型参数的各种检验及相关关系总结1.F检验：F检验用于判断整个回归模型是否显著，即自变量在一起解释因变量的效果是否显著。

通过计算回归模型的F统计量，然后与F分布进行比较，进行假设检验。

若F统计量显著，则拒绝原假设，即回归模型具有显著的解释效果。

2.t检验：t检验用于判断各个自变量的系数是否显著，即自变量对因变量是否有显著影响。

通过计算各个自变量的t统计量，然后与t分布进行比较，进行假设检验。

若t统计量显著，则拒绝原假设，即该自变量具有显著影响。

3.R方检验：R方是一个衡量回归模型拟合优度的指标，表示因变量的变异能够被自变量解释的比例。

R方的取值范围为0到1，越接近1表示模型对观测数据的拟合程度越好。

可以使用R方来判断模型是否拟合良好，但需要注意过高的R方可能意味着过拟合。

4.回归系数的置信区间：对回归模型的回归系数进行置信区间估计，判断回归系数是否显著。

如果回归系数的置信区间包含零，则不能拒绝原假设，即该回归系数不显著。

相反，如果回归系数的置信区间不包含零，则拒绝原假设，即该回归系数显著。

5. Durbin-Watson检验：Durbin-Watson检验用于检验回归模型自相关性的存在。

自相关性指的是误差项之间存在相关性。

Durbin-Watson检验的统计量为DW值，其取值范围为0到4，DW值接近2表示无自相关性，DW值小于2表示存在正自相关性，DW值大于2表示存在负自相关性。

各种参数检验之间存在一些相关关系1.R方与F检验：R方是回归模型拟合程度的评估指标，而F检验用于判断整个回归模型的显著性。

R方较高时，F统计量一般也较大，说明回归模型的解释效果显著。

2.回归系数与t检验：回归模型的回归系数用于表示自变量对因变量的影响程度，t检验用于判断回归系数是否显著。

当回归系数较大时，其对应的t统计量也较大，说明这个自变量对因变量有显著影响。

3.回归系数与置信区间：回归系数的置信区间反映了回归系数的不确定性。

§2.3 一元线性回归模型的统计检验

( β$i t α × s β$ , β$i + t α × s β$ )
2 i 2 i
在上述收入-消费支出例中，如果给定α =0.01，在上述收入-消费支出例中，如果给定α =0.01，收入例中查表得：查表得：
t α (n 2) = t0.005 (8) = 3.355
2
1
由于
S β = 0.042
βi βi s β
i
~ t ( n 2)
P(tα < t < tα ) = 1α
2 2
即
P(t α <
2
β$i βi
s β$
i
< tα ) = 1 α
2
$ tα ×s <β <β +tα ×s ) =1α $ P(β $ $ i i i β β
2 i 2 i
(1- 的置信度下, (1-α)的置信度下, βi的置信区间是
可构造如下t 对于一元线性回归方程中的β0，可构造如下统计量进行显著性检验：统计量进行显著性检验：
t=
β0 β0 2 ∑Xi2 n∑xi2 σ
=
β0 Sβ
0
~ t(n 2)
在上述收入-消费支出例中，首先计算σ 在上述收入-消费支出例中，首先计算σ2的估计值收入例中
σ2 = ei2 ∑ n 2 = (yi y)2 β12 ∑(xi x)2 ∑ n 2 =13402
§2.3 一元线性回归模型的统计检验
一、拟合优度检验二、变量的显著性检验三、参数的置信区间
一、拟合优度检验
含义：含义：对样本回归直线与样本观测值之间拟合程度的检验。间拟合程度的检验。指标：判定系数（可决系数）指标：判定系数（可决系数）R2

计量经济学 )多元线性回归模型的统计检验

i i
ˆ) 0 X i1 (Yi Y i
ˆ) 0 X i 2 (Yi Y i
… X (Y Y ˆ) 0 ik i i
所以从而
ˆ )(Y ˆ Y ) 0 (Y Y
i i
ˆ ) 2 (Y ˆ Y )2 (Y Y ) (Y Y i i i i
解释的那部分离差的大小。
• 那么，TSS、ESS、RSS之间存在的如下关系：
总离差平方和 = 回归平方和 + 残差平方和
TSS
=
ESS
+
RSS
关于TSS=ESS+ RSS的证明过程（教材P73）证明：将TSS，即总离差平方和进行分解：
ˆ ) (Y ˆ Y )) 2 TSS (Y Y ) 2 ((Y Y
• 拟合优度检验：检验模型对样本观测值的拟合程度。
• 在一元回归模型中，拟合优度检验是通过构造一个可以表征拟合程度的统计量R2来实现。
• 在多元回归模型中，也可以用该统计量来衡量样本回归线对样本观测值的拟合程度。
总离差平方和、回归平方和及残差平方和
• 定义
TSS (Y Y ) 2
i

2 ˆ y i
y
2 i
1
yi
ei
2 2
检验模型的拟合优度。 R2叫做多重可决系数，也简称为可决系数或判定系数。
毫无疑问，R2越接近于1，模型的拟合优度越高。但是在应用过程中人们发现，如果在模型中增加一个解释变量，那么模型的回归平方和随之增大，从而R2也随之增大。这就给人一个错觉：要使模型拟合得好，就必须增加解释变量。所以，用来检验拟合优度的统计量必须能够防止这种倾向。
说明

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2
（2）校正可决系数
RSS / n k 1 R 1 TSS / n 1
2
n 1 2 1 (1 R ) n (k 1)
R 2 R2
Hale Waihona Puke R2可以为负
补充：关于假设检验(在进行F/T统计检验之前)
假设检验是统计推断的一个主要内容，它的基本任务是根据样本所提供的信息，对未知总体分布的某些方面的假设作出合理的判断。假设检验的程序是，先根据实际问题的要求提出一个论断，称为统计假设；然后根据样本的有关信息，对假设的真伪进行判断，作出拒绝或接受假设的决策。假设检验的前提是知道所估计的样本回归系数概率分布性质，即对总体回归系数某种原假设成立。假设检验的基本思想是概率性质的反证法。概率性质的反证法的根据是小概率事件原理，该原理认为 “小概率事件在一次试验中几乎是不可能发生的,如果该小概率事件竟然发生了，就认为原假设不正确，而拒绝原假设，不拒绝备则假设”。下面讲授的模型的显著性检验及解释变量的显著性检验都基于此基础。
二、模型的显著性检验
所谓模型的显著性检验，就是检验模型对总体的近似程度，而且最常用的检验方法是F检验。 1.F检验的思想 F检验的思想来自于总离差平方和的分解式： TSS=ESS+RSS 由于回归平方和ESS是解释变量X联合体对被解释变量Y的线性作用的结果，所以，如果ESS/RSS的比值较大，则 X 的联合体对 Y的解释程度高，可认为总体存在线性关系，反之总体上可能不存在线性关系。因此 , 可通过该比值的大小对总体线性关系进行推断。
⒈总变差的分解
设估计的多元线性回归模型为：
ˆ ˆ x ˆ x ˆ x e yi 0 1 1i 2 2i k ki i
分析Y的观测值、估计值和平均值的关系
ˆi y yi y ˆi yi y y
因为 yi y 0 ，将上式两边平方加总，可证得 2 2 2 ˆi y yi y ˆi yi y y
判定系数与相关系数的关系
联系：数值上判定系数是相关系数的平方。区别： ⑴前者就模型而言，后者就两个变量而言。 ⑵前者说明解释变量对被解释变量的解释程度，后者说明两变量线性依存程度。 ⑶前者度量的不对称的因果关系，后者度量的不含因果关系的对称相关关系。 ⑷前者取值[0,1]非负，后者取值[-1,1]，可正可负。
一、模型的拟合优度检验
所谓拟合优度，即模型对样本数据的近似程度。由于实际观察得到的样本数据是对客观事实的一种真实反映，因此，模型至少应该能较好的描述这一部分客观实际情况。为了考察模型的拟合优度，需要构造一个指标— —判定系数（可决系数）。认识判定系数之前让我们回顾一下关于样本与总体回归函数，了解总离差分解。
在应用过程中我们会发现，如果在模型中增加一个解释变量，模型的解释功能增强了，可决系数 R 2 计
2 ˆ y y 算公式中的分子——回归平方和 i 就会增大，
因而 R 就增大。这就给人一种错觉：似乎要使模型拟合得好，就必须增加解释变量。但是，在样本容量一定的情况下，增加解释变量必定使得自由度减少。所以，用以检验拟合优度的统计量必须能够防止这种倾 2 2 R R 向，我们可以用自由度来调整，用来表示调整后的可决系数，以剔除解释变量数目与样本容量的影响，使具有不同样本容量和解释变量数目的回归方程可以进行拟合优度的比较。
y
yi
ei
yi y
ˆi y y
SRF
y
xi
x
TSS ( yi y ) 2 ˆi y )2 ESS ( y ˆi )2 RSS ( yi y
TSS为总体平方和（Total Sum of Squares），反映样本观测值总体离差的大小；ESS为回归平方和（Explained Sum of Squares），反映由模型中解释变量所解释的那部分离差的大小；RSS为残差平方和（Residual Sum of Squares），反映样本观测值与估计值偏离的大小，也是模型中解释变量未解释的那部分离差的大小。 TSS=RSS+ESS
注意的问题
判定系数只是说明列入模型的所有解释变量对被解释变量的联合的影响程度，不说明模型中每个解释变量的影响程度（在多元中）回归的主要目的如果是经济结构分析，不能只追求高的判定系数，而是要得到总体回归系数可信的估计量。判定系数高并不一定每个回归系数都可信。如果建模的目的只是为了预测被解释变量值，不是为了正确估计回归系数，一般可考虑有较高的判定系数。
对于样本回归模型拟合总体模型，我们通常要进行经济检验、统计检验、计量检验等。统计检验则是在一定概率下求出参数，检验样本对总体的代表性、影响关系是否显著等问题。主要通过一些统计检验方法来保证模型在统计意义上（即以样本推断总体）的可靠性。我们所要进行的统计检验包括两方面，一方面检验回归方程对样本数据的拟合程度，通过可决系数；另一方面检验回归方程的显著性，通过假设检验对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出判断，包括对回归方程线性关系的检验和对回归系数显著性的检验。
数)R2和校正可决系数
（1）可决系数
2、拟合优度检验统计量：可决系数(判定系
R2
2 R 用可决系数进行拟合优度检验，可决系
数的计算公式为：
2 ˆ y y R2 i 2 y y i
0 R 2 1 ，该统计量越接近于 1，模型
的拟合优度越高。
判定系数不仅反映了模型拟合程度的优劣，而且有直观的经济含义：它定量地描述了y的变化中可以用回归模型来说明的部分，即在被解释变量的变动中，由模型中解释变量所引起的比例。见前一节例题，解释意义判定系数的特点： ⑴判定系数取值范围[0，1]。 ⑵随抽样波动，样本判定系数是随抽样而变动的随机变量。 ⑶判定系数是非负的统计量。