计量经济学-第13章模型设定和诊断检验

合集下载

实证经济学计量模型的构建与检验

实证经济学计量模型的构建与检验经济学是研究经济现象的科学，而实证经济学则更加注重对经济现象进行量化分析和实证检验。

实证经济学计量模型的构建与检验是实证经济学的核心内容之一，本文将探讨实证经济学计量模型的构建和检验方法，以及其在经济研究中的应用。

一、实证经济学计量模型的构建实证经济学计量模型是对经济现象进行量化分析的数学模型，其构建需要从理论出发，选取合适的变量并建立变量之间的关系。

以下是实证经济学计量模型构建的一般步骤：1.选取研究领域：确定研究的经济现象或问题，明确研究领域和目标。

2.文献综述：对该领域已有的理论和实证研究进行综述，了解已有的研究成果和方法。

3.变量选择：根据研究目标和理论基础，选择适当的经济变量，并明确它们的测量方法和数据来源。

4.模型功能：根据变量之间的理论联系，构建一个能够解释研究现象或问题的数学模型，包括变量的函数形式和参数的设定。

5.数据获取：收集相关的经济数据，保证数据的可靠性和有效性。

6.模型估计：运用统计学方法对模型的参数进行估计，得到估计结果。

二、实证经济学计量模型的检验实证经济学计量模型的检验是为了验证所构建的模型是否能够准确解释实际经济现象或问题。

以下是常用的实证经济学模型检验方法：1.拟合度检验：通过比较模型的观测值和估计值之间的差异，评估模型对实际数据的拟合程度。

常用的拟合度检验指标包括R方、平均绝对百分比误差等。

2.假设检验：通过对模型的假设进行检验，判断模型的显著性和有效性。

常用的假设检验包括参数显著性检验、模型整体显著性检验等。

3.稳健性检验：对模型的参数进行鲁棒性检验，验证模型是否对数据中的异常值和极端观测点具有较好的稳健性。

4.残差分析：对模型的残差进行检验，判断模型是否存在系统性误差或模型设定是否合理。

常用的残差分析方法包括残差图、残差正态性检验等。

三、实证经济学计量模型的应用实证经济学计量模型在经济研究中具有广泛的应用，可以应用于各个领域的经济问题。

模型设定和诊断检验

Y i12X 2 i3X 3 i v i
(13.3.6) (13.3.7)
18
我们知道：
ˆ 2
yix2i x22i
1
(
ˆ2
y x 2 )( x 3 2 ) ( y x 3 )( x 2 x 3 ) x 2 2 x 3 2 ( x 2 x 3 )2
1、如果X3与X2相关，r23 ≠ 0，那么
bˆห้องสมุดไป่ตู้
和
1
bˆ
1
是有偏误
2
且非一致的。也就是说，
E(bˆ1) 1
E(bˆ12) 2
2、如果X3与X2不相关，r23 = 0，那么bˆ 3 2
0 ，尽管bˆ
现在无
1
偏，但bˆ 1 2 是无偏的。
3、干扰的方差σ2将被不正确地估计。
4、bˆ 1 2 的方差 (
第十三章
计量经济建模：模型设定和诊断检验
1
经济学家多年来对“真理”的寻求曾给人一种观感：经济学家们就好像在一间黑房子里搜寻一直原本并不存在的黑猫；而计量经济学家还经常声称找到了一只。
2
经典线性回归模型的假定之一（假定9）是，分析中所使用的模型被“正确地”设定；如果模型并未被明确设定，我们就遇到了这样的问题：模型设定误差（model specification error）或者模型设定偏误（model specification bias）。
因此，(13.2.2)中的误差项u2i事实上是：
u2i u1i 4Xi3
8
2、包含了一个无需或无关的变量（Including an unnecessary or irrelevant variable）
假定另一个研究者使用了以下模型：

计量经济学重点

第一章：计量经济学方法论计量经济学方法论大致地说，传统的计量经济学方法论按下列路线进行：（1）理论或假说陈述（2）数学模型设定（3）计量模型设定（4 ）获取数据（5）参数估计（6）假设检验（7）预测（8）利用模型进行控制或制定政策计量经济学所用数据的类型：（1）时间序列数据：对一个变量在不同时间取值的一组观测结果（2）横截面数据：对一个或多个变量在同一时间点上收集的数据（3）混合数据：两者兼有（4）综列、纵列或微观综列数据：混合数据的特殊类型，指对相同的横截面的单元在时间轴上进行跟踪调查的数据。

第二章总体回归函数的概念：反映Y的均值如何随X的变化而变化的函数被称为总体回归函数（PRF）。

女口：E（Y|XJ = M■ '-2X i其中B 1和B 2是未知但固定的参数，被称为回归系数PRF的随机设定：因为Y是随机的，每个具体的Y不可能恰好等于其均值，他们之间的离差被设定为一个随机扰动项:E（Y|Xi）被称为Ui=丫厂E（Y | XJ Yi的系统性或确定性成分ui称为随机或非系统性成分在给定X的条件下，随机扰动项的均值等于0样本回归函数：SRF在大部分情况下，我们很难获得总体的数据，而是通过对总体的抽样来探索总体的性质。

类比于总体回归函数（总体Y条件均值与X的关系），可以定义样本回归函数：抽样Y与X之间的关系。

如：其中Yi （帽）是总体均值的估计量， B 1 （帽）和B 2 （帽）分别是B 1和B 2的估计量随机形式的样本回归函数为：Y=fVf?2X i +u?第三章估计量和估计量方差矩阵形式X3 一小2u?2二Y - X ?'：（?丁2X'Y -X ? =0* se ?第2页共10页最小二乘法的基本假定 P51最小二乘法的假定漏了：没有完全多重共线性 •判定系数：R2=ESS/TSS假定1 :参数线性模型。

回归模型对参数而言是线性的。

假定2 : X 非随机（条件回归分析）。

在重复抽样 X 值是固定的。

模型的诊断和修正(计量经济学模型专题)

模型的诊断和修正
自相关检验及修正的EViews操作

1.绘图检验自相关问题的EViews操作进行了OLS回归后，选择EViews主窗口的Quick|Graph命令，输入残差序列名（Resid），选择图形类型，最后单击确定键即得到残差图。绘制残差序列图也可以通过Equation对象窗口的Resids按钮或View|Acutal,Fitted,Residual命令实现。 2.DW检验操作通常OLS回归估计输出结果中包含着对模型的D.W.检验结果，无需单独进行操作。通过查询DW临界值表可以判断模型自相关问题。DW统计量值越接近2，表明自相关程度越弱。
哈维检验
戈列瑟检验自回归条件LM检验怀特检验用户自主设定检验
模型的诊断和修正

（3）输出检验结果
F-statistic是辅助方程整体显著性的F统计量；Obs*Rsquared是怀特检验的统计量，通过比较 Obs*Rsquared的概率值和显著性水平可以对方程是否存在异方差进行判断。图示的怀特检验结果中Obs*R-squared的概率值小于显著性水平0.05，则拒绝原假设，方程存在异方差。

模型的诊断和修正

内生变量问题与两阶段最小二乘法（TSLS）最小二乘法要求解释变量与随机误差相互独立，如果解释变量与随机误差项不相互独立，模型就存在内生性问题。
பைடு நூலகம்
模型的诊断和修正

1. 内生性的含义及后果当解释变量与随机误差不相互独立时，我们称模型存在内生性问题。引起内生性问题的原因通常有忽略了重要的解释变量、变量之间存在联立性、变量存在测量误差等等。内生性使得模型不能满足OLS的基本假设，对模型进行OLS估计得到估计量是有偏且不一致的。 2.内生性的解决方法-两阶段最小二乘法（TSLS）模型存在内生性问题时，需要寻找一组工具变量（Instrument Variable）以消除解释变量和随机误差项之间的相关性。选择的工具变量应当与解释变量高度相关但与随机误差项无关，且工具变量的个数应大于等于模型需要估计的系数个数，以保证模型的可识别要求。两阶段最小二乘法估计的第一阶段是利用原模型解释变量对工具变量进行最小二乘法估计，得到解释变量的拟合值。第二阶段利用第一阶段得到的解释变量拟合值对原模型进行最小二乘估计从而得到模型的估计值。这样可以消除内生性影响，获得较为准确的模型估计值。

4模型设定与诊断

5
理论模型举例——生产函数
Q f T , K , L, Q Ae
t
其中， 1， 1， 1 0 0 0 资本，L表示劳动。
k L

u
u~N Q表示产出量，T表示技术，K表示公式描述了技术、资本、劳动与产出量之间的理论关系，认为只有加上一个随机扰动项等式才成立。
• 判别设定的模型能否得到有意义的研究结果，在研究工作中起着至关重要的作用。
17
一、模型的误设及其后果
• 1. 包含不相干的解释变量： • 则估计量是一致、无偏的，但不是最佳线性无偏估计量。假设检验是有效的。 • 此外，如果包含的不相干的变量与其它解释变量相关，则引起的主要后果是解释变量之间的多重共线性.
1i i 1 2 1i
1i i 1i 1 1i 2 2i i 2 1i 2 1i 1i 2i 1i i 1 2 2 1i 2 1i
(1)如果漏掉的X2与X1相关，则式中的第二项在小样本下求期望与大样本下求概率极限都不会为零，从而使得OLS估计量在小样本下有偏，在大样本下非一致。
25
(2)如果X2与X1不相关，则1的估计满足无偏性与一致性；但这时0的估计却是有偏的。
29
2、检验是否有相关变量的遗漏或函数形式设定偏误（1）残差图示法
30
•
残差序列变化图
趋势变化：模型设
定时可能遗漏了一随着时间的推移而持续上升的变量
循环变化：模型设定
时可能遗漏了一随着时间的推移而呈现循环变化的
变量
31
• 模型函数形式设定偏误时残差序列呈现正负交替变化
32
3、检验是否有相关变量的遗漏或函数形式设定偏误

空间计量经济学模型的估计与检验

• 所以，在本节模型检验部分，首先在各种假设下构造检验方法，最后提出一个判断准则。
一、空间滞后模型的IV和ML估计
1、空间滞后模型IV估计
• 空间滞后模型（空间自回归模型）的解释变量中出现随机变量，普通最小二乘估计（OLS）将不再适用，工具变量估计（IV）、广义矩估计（GMM）和最大似然估计（ML）是合适的估计方法。
22
2
N l n 2 1 l n { |Ω |* [ |B |] 2 } 1 [ B Y B X β ] 'Ω 1 [ B Y B X β ] 1
22
2
2
0
s21e'e,Ttr(W 'W W 2) N
1 e 'We 2
LM(e'Wes2)2 ~2(1)
T
• 该检验统计量有两个备择假设，也就是说，该统计量对于空间残差自相关和空间残差移动平均两种空间效应均有检验效力。
• 如果怀疑模型存在以空间矩阵W表示的空间结构，则可以构造一个Moran’I算子：
I e'We S e 'e N
I e'W e e 'e
I E(I) N(0,1) Var(I)
空间矩阵W 中所有元素
之和
空间矩阵行标准化
相当于模型参数γ的OLS
估计
Weeμ
如果原假设成立，则有
Moran’I 统计量
型的类型，然后进行估计。 • 但是，所有检验统计量的构造，需要模型参数估
计量，所以本节首先讨论估计，然后讨论检验。
• 不同类型空间计量经济学模型的估计方法很多，本节并不是系统的讨论，只是选择若干模型的估计方法加以介绍。
• 不同类型的空间模型分别描述了空间实质相关和空间扰动相关，那么检验是否存在空间实质相关时需要在空间扰动相关存在与否的假设下进行，反之亦然。

南开大学计量经济学课件第13章模型检验的常用统计量.ppt

(13-9)
(0.2) (2.2) (31.5) (17.8) R2 = 0.999, DW=2.12, RSSu= 48460.78, T =22, (1980-2001) 由上述 4 个变量的相关系数矩阵知，DEBTt 和 GDPt 的相关性最强，达 0.9678。那么是否可以从模型中删掉 DEFt 和 REPAYt 两个解释变量呢？可以用本节介绍的 F 统计量完成上述检验。原假设 H0 是2 = 3 = 0，（约束 DEFt 和 REPAYt 的系数为零）。给出约束模型 OLS 估计结果如下，
2021/3/2
计量经济学
13.2 检验回归系数显著性的 t 统计量对于多元线性回归模型， yt = 0 +1xt1 + 2xt2 +…+ k-1 xt k-1 + ut 如果 F 检验的结论是接受原假设，则检验止。如果 F 检验的结论是拒绝原假设，则进一步作 t 检验，检验每一个回归系数是否显著地不为零，即检验模型中相应解释变量是否为模型重要解释变量。原假设与备择假设分别是
0.4
若用样本计算的 t t-k，则接受 H 0；
若用样本计算的 t > t-k，则拒绝 H 0。
0.3
其中指检验水平。详见第 3 章。
0.2
2021/3/2
0.1
/2
-4
计量经济学
-2
-t/2(T-k)
/2
2
4
t/2(T-k)
13.3 检验线性约束条件是否成立的 F 统计量再介绍一种情形。比如对模型
中国当前正处在社会主义市场经济体制逐步完善，宏观经济运行平稳阶段。国债发行总量应该与经济总规模，财政赤字的多少，每年的还本付息规模有关系。选择这 3 个因素做解释变量，名称是国内生产总值，财政赤字额，年还本付息额。数据见表 13-1。根据散点图（作者自己做）建立中国国债发行额模型如下：

计量经济学模型建立与分析

影响财政收入的若干因素分析一、问题提出我们如果把经济增长当做源，财政收入当做流，又或者把经济增长当做是源，财政收入当做叶，源远才能长，根深才能叶茂。

经济增长带动财政收入的增长。

随着改革开放，我国经济快速发展，我国的财政收入逐年增长。

二、变量设置我国财政收入的主要来源于税收收入、罚没收入、专项收入、政府基金收入、行政事业单位收费收入、国有资本经营收益、国债收入、其他收入等。

我们将挑选税收收入、行政事业收入、上一年财政收入作为解释变量。

来就影响财政收入的这几个因素作进一步的分析。

三、建立模型εββββ++++=3322110x x x y y 为财政收入为，1x 表示税收收入，2x 表示行政事业性收入，3x 表示上一年财政收入。

ε表示其他随机影响因素。

四、数据收集影响财政收入的若干影响因素资料表时间财政收入税收收入行政事业性收费时间上一年财政收入1990 576.95 1985 2004.82 1991 697 1990 2821.86 1992 885.45 1991 2990.17 1993 1317.83 1992 3296.91 1994 1722.5 1993 4255.3 1995 2234.85 1994 5126.88 1996 3395.75 1995 6038.04 1997 2414.32 1996 6909.82 19981981.9219978234.0419992354.2819989262.820002654.54199910682.5820013090200012581.5120023238200115301.3820033335.74200217636.4520043208.42200320017.3120053858.19200424165.6820064216.8200528778.5420074681.0532********.3520084835.807200745621.9720094589.11200854223.79数据来源：《中国统计年鉴》（2010）五、具体的spss软件分析如下：Regression[DataSet0]变量的进入(模型的线性显著性分析)（回归系数）六、模型检验一、异方差检验先做普通最小二乘回归可得到方程式：321121.0384.0067.1585.152x x x y +-+-=（-0.752）（21.018）（-3.351）（2.131）在对该模型做了最小二乘法回归，并得到2iε，然后做如下辅助回归：31932821732622512433221102x x x x x x x x x x x x iααααααααααε+++++++++=i ε+（模型的线性显著性分析）根据怀特检验 22χ-nRR 2=0.820, 怀特统计量NR 2=20×0.820=16.4，因此，查（课本P3532λ分布表）可得在5%的显著性水平下，自由度为9的2χ分布的对应临界值为 92.1605.02=χ。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(13.2.7)所表明的是，研究者没有使用真正的Yi和Xi，却用
了含有测量误差的替代变量Yi*和Xi*。
11
5、对随机误差项ui不正确的设定（Specification errors to the stochastic error ）
如果真实的、正确的模型是：
Yi Xiui
并且lnui满足CLRM的假定
就很困难。
表现出数据的协调性；即从模型中估计的残差必须完全随机
（从技术上而言必须是白噪音）。
模型有一定的包容性；即模型应该包容或包括所有与之竞争
的模型。
6
§13.2 设定误差的类型
1、漏掉一个有关变量（1.Omitting A Relevant Variable）
为了简明起见，令这个模型为：
因此，(13.2.2)中的误差项u2i事实上是：
u2i
u1i

4
X
3 i
8
2、包含了一个无需或无关的变量（Including an unnecessary or irrelevant variable）
假定另一个研究者使用了以下模型：
Yi

1
2 X i

3
X
2 i

4
X
3 i

或近似地为例如，若 c = 15，k = 5，α = 5%，由(13.4.3)，真实的显著性水平为 (15／5)(5%) = 15%
(13.4.2) (13.4.3)
28
在实践中，多数研究者都仅报告其“最终”回归结果，而不透露此前是如何通过大量数据开采或预检验而得到这些结果的详情。
——这与个人升迁有关！
( E(ˆ3) 2
x2x3)( x22 ) ( x22 x32 (
x2 x3 )( x2 x3 )2
x22 ) 0
6
20
x3在真实模型中不存在，它的系数为0。因此，这一设定误差(拟合过度)将导致如下后果：（1）所有参数的OLS估计量都是无偏且一致的，即，
但是，在应用计量经济学家看来，纯粹主义者（即非数据开采者）的建模方法也存在问题。
29
查曼（Zaman，1995）的观点：如果我们从一个更开阔的视角来看待数据开采，把它看成一种寻求经验规律的过程，并能从这些经验规律中判断现有理论模型中是否存在错误或纰漏，那么它将起到一个非常大的作用。肯尼迪（Kennedy，1992）认为，“应用计量经济学家的艺术在于，容许数据驱动理论进展而又不致陷入太大的数据开采的危险。”
(13.3.6) (13.3.7)
18
我们知道：
ˆ2
yi x2i x22i
1
( ˆ2
yx2 )( x32 ) ( yx3)( x2 x3)
x22
x32 (
x2
x 3
)2
2
真实模型的离差形式为：
19
将(3)代入(2)：
( E(ˆ2 ) 2
Yi

1

2 Xi

3
X
2 i

4
X
3 i
u1i
其中，Yi = 生产的总成本，Xi = 产量。
等式(13.2.1)是立方总成本函数。
(13.2.1)
7
但是，假设出于某种原因，研究者决定使用以下模型：
Yi
1
2 Xi

3
X
2 i
u2i
(13.2.2)
由于(13.2.1)被认为是真实的，采用(13.2.2)就构成了一种设定误差，即漏掉了一个有关变量（Xi3）的误差。
bˆ 1和
bˆ12是有偏误
E(bˆ1 ) 1
E(bˆ12 ) 2
2、如果X3与X2不相关，r23 = 0，那么bˆ 32 0，尽管bˆ 1现在无
偏，但bˆ12 是无偏的。
3、干扰的方差σ2将被不正确地估计。
4、bˆ12 的方差
(

2
X
2 2i
)是真实估计量的方差的一个有偏误
的估计值。
26
本专业的纯化论者很看不起数据开采的实践。谴责 “数据开采”的原因之一如下：
在数据开采情况下的名义的与真实的显著性水平是不同的。一种数据开采的危险是，诸如1%、5%、10%的常用的显著性水平α并非是真实的显著性水平。
27
洛弗尔（Lovell，1983）曾指出，如果有c个备用的回归元，根据数据开采的情况，从中最后选出k个（k ≤ c），则真实的显著性水平（α*）和名义上的显著性水平（α）有如下关系：
一般而言，最好的方法是，根据理论，仅仅包含那些直接影响因变量，而又不能由已被引进的其他变量来代替的解释变量。
23
§13.4 设定误差的检验
一、对过度拟合的侦察
假设，为了解释某一现象，我们提出一个k变量模型：
Yi 1 2 X 2i 3 X3i ...... k X ki ui (13.4.1)
3
寻找正确的模型就像寻找圣杯一样。具体而言，我们需要考虑如下问题：
我们如何去寻找一个“正确”的模型？换言之，在经验分析中选择一个模型的准则有哪些？
在实践中，容易遇到哪些类型的模型设定误差？设定误差的后果有哪些？如何侦查设定误差？换言之，我们可以使用哪些诊断工具？一旦侦查出设定误差，我们能采取哪些补救措施？如何评价几个表现不相上下的备选模型？
14
于是，等式(4)变换为：
bˆ12 2 3bˆ 32
X 2i (ui u )
X
2 2i
(5)
分别取等式两边的期望值
E(bˆ12) 2 3bˆ32
(6)
（其中，β2和β3都是常数，ui与X2i和X3i不相关）
15
于是，漏掉变量X3的后果如下： 1、如果X3与X2相关，r23 ≠ 0，那么且非一致的。也就是说，
x22 )( x22
x32 ) ( x32 (
x2 x3 )2
x2
x 3
)2
2
4
因此，ˆ2 仍是无偏的。
我们发现：
( ˆ3
yx3 )(
x22 ) (
yx2 )(
x2
x 3
)
x22 x32 ( x2 x3 )2
(5)
将 (3) 代入 (5)：
第十三章
计量经济建模：模型设定和诊断检验
1
经济学家多年来对“真理”的寻求曾给人一种观感：经济学家们就好像在一间黑房子里搜寻一直原本并不存在的黑猫；而计量经济学家还经常声称找到了一只。
2
经典线性回归模型的假定之一（假定9）是，分析中所使用的模型被“正确地”设定；如果模型并未被明确设定，我们就遇到了这样的问题：模型设定误差（model specification error）或者模型设定偏误（model specification bias）。
4
§13.1 模型选择准则
根据亨得利和理查德的观点，一个被选用于经验分析的模型应满足如下准则：
数据容纳性；即从模型做出的预测必须有逻辑上的可能性。与理论一致；即必须有好的经济含义。回归元的弱外生性；即解释变量或回归元必须与误差项不相
关。
5
表现出参数的不变性；即参数的值必须稳定，否则预测
后果将会如何？
13
三变量回归模型的离差形式：
Yi 2 X 2i 3 X3i ui u
有： Yi X2i 2
X
2 2i

3
X2i X3i
X2i (ui u )
Yi X3i 3
X
2 3i

2
X2i X3i
X3i (ui u )
两边分别除以∑X2i2：
Yi X2i
X
2 2i
2
3
X 2i X3i
X
2 2i
X 2i (ui u )
X
2 2i
回到前面，有
bˆ12
X 2i Yi
X
2 2i
bˆ 32
X 2i X 3i
X
2 2i
（X3对X2回归）
(1) (2) (3) (4)
2
x22i ,
而 var(ˆ2 )
2
x22i (1 r223)
0 r223 1,
0 1 r223 1
var(ˆ2 ) var(ˆ2 )
一个无益的结论似乎是:与其忽略有关变量,不如含有无关变量。
22
但是，这种理论是不值得维护的，因为增加不必要的变量将导致： 1、估计量的效率损失 2、多重共线性问题 3、自由度的损失
34
为了用德宾-沃森检验来侦察模型设定误差，我们以如下方式进行：
（1）从假定的模型求得OLS残差。（2）如果认为假定的模型因排除了一个有关的解释变量，比如说Z而是误设的，则将第1步中所得的残差按 Z值的递增次序排列。注意：Z变量可以是假定模型所含的X变量之一，或
该变量的某一函数，如 X2 或 X 3
(13.2.6)
10
4、测量偏误的误差（Errors of measurement bias）
考虑有研究者使用如下模型：
Yi*

1*

2*X*i

X * *2
3i

X * *3
4i

u*i

(13.2.7)
其中，Yi* Yi i ，X*i Xi i ，εi和ωi均为测量误差。