资料：向量自回归模型详解

第十四章向量自回归模型

本章导读：前一章介绍了时间序列回归，其基本知识为本章的学习奠定了基础。这一章将要介绍的是时间序列回归中最常用的向量自回归，它独有的建模优势赢得了人们的广泛喜爱。

14.1 VAR 模型的背景及数学表达式

VAR 模型主要应用于宏观经济学。在VAR 模型产生之初，很多研究者（例如Sims ，1980

和Litterman ，1976；1986）就认为，VAR 在预测面要强于结构程模型。VAR 模型产生的原因在于20世纪60年代一大堆的结构程并不能让人得到理想的结果，而VAR 模型的预测却比结构程更胜一筹，主要原因在于大型结构程的法论存在着更根本的问题，并且结构程受到最具挑战性的批判来自卢卡斯批判，卢卡斯指出，结构程组中的“决策规则”参数，在经济政策改变时无法保持稳定，即使这些规则本身也是正确的。因此宏观经济建模的程组在式上显然具有根本缺陷。VAR 模型的研究用微观化基础重新表述宏观经济模型的基本程，与此同时，对经济变量之间的相互关系要求也并不是很高。

我们知道经济理论往往是不能为经济变量之间的动态关系提供一个格的定义，这使得在解释变量过程中出现一个问题，那就是生变量究竟是出现在程的哪边。这个问题使得估计和推理变得复杂和晦涩。为了解决这一问题，向量自回归的法出现了，它是由sim 于1980年提出来的，自回归模型采用的是多程联立的形式，它并不以经济理论为基础，在模型的每一个程中，生变量对模型的全部生变量的滞后项进行回归，从而估计全部生变量的动态关系。

向量自回归通常用来预测相互联系的时间序列系统以及分析随机扰动项对变量系统的动态影响。向量自回归的原理在于把每个生变量作为系统中所有生变量滞后值的函数来构造模型，从而避开了结构建模法中需要对系统每个生变量关于所有生变量滞后值的建模问题。一般的VAR(P)模型的数学表达式是。

11011{,}t t p t p t t q t q t

y v A y A y B x B x B x t μ----=++???++++???++∈-∞+∞ （14.1）

其中1t t Kt y y y =??????（）表示K ×1阶随机向量，

1A 到p A 表示K ×K 阶的参数矩阵， t x 表示M ×1阶外生变量向量， 1B 到q B 是K ×M 阶待估系数矩阵，

并且假定t μ是白噪声序列；即，

()0,t E μ= '(),t t E μμ=∑并且'()0,t s E μμ=)t s ≠（。

在实际应用过程之中，由于滞后期p 和q 足够大，因此它能够完整的反映所构造模型

的全部动态关系信息。但这有一个重的缺陷在于，如果滞后期越长，那么所要估计的参数就会变得越多，自由度就会减少。因此需要在自由度与滞后期之间找出一种均衡状态。一般的准则就是取瓦咨准则（SC ）和池此信息准则(AIC)两者统计量最小时的滞后期，其统计量见式(14-2)与式（14-3）。

2/2/AIC l n k n =-+ （14.2）

2/log /SC l n k n n =-+ （14.3）

式（14-2）与（14-3）中()k m qd pm =+表示待估参数个数，n 表示观测样本个数，同时满足：

'(1log 2log[det(/)]22

t t t nm n

l n πεε∧∧=-+-∑）（14.4）

14.2 VAR 模型的估计

在对VAR 模型进行估计时，首先必须对变量进行单位根检验。具体操作步骤见本书前

面章节，在此不多加阐述了。

14.2.1 VAR 模型输入

在Eviews 里面设定VAR 模型之前必须创建VAR 系统，选择quick/Estimate VAR 或者直接在命令窗口输入var 。此时会出现var 对话框，你必须在对话框中填入适当的信息,如下图14.1。

(1)选择VAR 估计的类型：Unrestricted VAR （非限制性向量自回归）或者Vector Error Correct （向量误差修正模型），现在所谓的VAR 是指Unrestricted VAR （非限制性向量自回归），Vector Error Correct （向量误差修正模型）将在下一步做进一步介绍。

(2)设定需要估计的样本跨度。

(3)在对话框（Lag Intervals for Endogenous ）键入适当的滞后期间隙，滞后期间隙必须是成对键入：每一对数字都定义了滞后期的区间，例如右图中：1 4表示Eviews 使用生变

图14.1 VAR 设定的对话框

量滞后第1期至第4期来估计系统中的（gdp cpi m1 r ）变量。你可以键入任成对滞后数字。滞后期的设定如下：

2 4 6 9 12

上面数字意味着使用滞后2-4，6-9和12-12。

(4)在对话框中键入需要估计的生变量和外生变量名称，此处我们把gdp ，cpi ，m1和r 作为生变量序列，同时把常数项c 作为一个外生变量键入对话框。剩下来的对话标签（Cointegration 和VEC Restrictions ）仅仅和我们下一步需要介绍的向量误差修正模型有关。

14.2.2 VAR 模型输出

如果设定好var 模型以后，就可以点击ok ，在var 窗口中会显示估计的结果。如图14.2。

图14.2 VAR 模型估计结果

图中每一列代表相应VAR 模型中每一个生变量的程。每一个变量的右端Eviews 汇报了

待估系数，标准差（圆括号）以及t 统计量（中括号）。例如在程GDP 中GDP(-1)的系数为0.848803，标准差为0.13700，t 统计量为6.19545，根据t 统计量分布表，可知在5%的显著水平下，该系数是显著不为0的。

在系数估计表的下端，Eviews 汇报了一些额外的信息，如图14.3。

图14.3 VAR 模型回归统计量

在图14.3中，第一部分表示的是每一个程标准的OLS 统计量。根据各自的残差分别计算每一个程的结果，并显示在对应的每一列中。

输出的第二部分表示的是整个VAR 系统的回归统计量。残差的协差行列式值（自由度进行调整以后）的计算原理是

det(

)t t t

T m εε∧∧

∧∑=-∑ （14.5）在式（14-5）中m 表示的是VAR 系统中每一个程待估参数的个数，非调整的估计可以忽略m 。通过假定服从多元正态分布（高斯分布）的似然对数值的计算如下：

{(1log 2)log }2

l k π∧=-++∑ （14.6）

AIC 和SC 两个信息准则的计算原理如下：

2/2/AIC l T n T =-+ （14.7）

2/log /SC l T n T T =-+ （14.8）

其中()n k d mk =+表示VAR 模型中待估参数的总数，根据这些准则可以决定VAR 模型适当的滞后期长度，这些准则的值越小，那么模型的滞后期就越合适。

14.3 VAR 模型的诊断

如果完成了VAR 模型的估计，那么Eviews 会提供各种视窗来反映估计的VAR 模型是否恰当。在这一节中我们将要讨论VAR 模型的设定，并对VAR 模型进行诊断。在VAR 系统视窗的View/Lag Structure 和 View/Residual Tests 菜单下提供了一系列帮助我们进行VAR 模型诊断的视图。

14.3.1 VAR 模型滞后期的确定

对于VAR(1)，11t t t Y c Y μ-=+∏+模型稳定的条件是特征程10I λ∏-=的根都在单位圆以，或相反的特征程10I L -∏=的根都要在单位圆以外。

对于k>1的VAR(k)模型可以通过矩阵变换改写成分块矩阵的VAR(1)模型形式。

1Y C AY t t t μ-=++ （14.9）

模型稳定的条件是特征程0A I λ-=的根都在单位圆以，或其相反的特征程 |I-LA|=0的全部根都在单位圆以外。所以也可以通过估计得到相应()VMA ∞模型的参数。

这一小节主要介绍的是如给VAR 模型确定去合适的滞后期，在滞后结构中提供多确定滞后期的法，见图14.4。

图14.4 VAR 滞后结构视窗对话框

1)AR 根的图表

关于AR特征根多项式的倒数可以参考：Lütkepohl (1991)。如果VAR系统中所有根的模的倒数小于1，即位于单位圆，那么VAR系统就是稳定的。如果VAR系统不是稳定的，即部分根的模的倒数位于单位圆外，那么估计的某些结果(例如，脉冲响应的标准误差)就可能无效，估计过程中存在kp个根，其中k表示生变量的个数，p表示最大滞后期。如果估计一个带有r个协整关系的向量误差修正模型，那么必须有k-r个根的模等于1。

根据这一原则，我们得到的估计结果如表14.1。

表14-1 AR根表

Roots of Characteristic Polynomial

Endogenous variables: GDP CPI M1 R

Exogenous variables: C

Lag specification: 1 4

Root Modulus

0.992091 0.992091

0.965850 0.965850

-0.413574 - 0.711282i 0.822779

-0.413574 + 0.711282i 0.822779

0.814673 0.814673

0.698590 - 0.408019i 0.809016

0.698590 + 0.408019i 0.809016

0.356653 - 0.683437i 0.770901

0.356653 + 0.683437i 0.770901

-0.168418 - 0.667357i 0.688281

-0.168418 + 0.667357i 0.688281

-0.535191 0.535191

0.478679 0.478679

-0.255845 - 0.372175i 0.451632

-0.255845 + 0.372175i 0.451632

0.290012 0.290012

No root lies outside the unit circle.

VAR satisfies the stability condition.

从表14.1估计的结果可知，所有根的模的倒数都小于1，所以估计的VAR系统满足稳定性条件，为了更加直观的所有根的模的倒数在单位圆中的位置，我们根据AR根图来判断VAR系统的稳定性。见图14.5。

图14.5 AR根图

根据图14.5可知，所有AR根的模的倒数都位于单位圆，由此可以判断VAR系统是稳定的。如果VAR系统是稳定的，那么进一步进行VEC估计的结果就是有效的，否则某些估

计的结果可能不是有效的。

2)Granger因果检验（Pairwise Granger Causality Tests）

格兰杰因果检验主要是用来检验一个生变量可否作为一个外生变量对待。对于VAR系统中的每一个程，Eviews将会输出每一个生变量与其他生变量滞后期的联合2χ(Wald)统计量，在表格的最后一行(All)报告了在这个程中检验所有滞后生变量联合的2χ(Wald)统计量数值。具体见表14.2。

表14.2 VAR格兰杰因果检验

VAR Granger Causality/Block Exogeneity Wald Tests

Sample: 1999M01 2006M12

Included observations: 92

Dependent variable: GDP

Excluded Chi-sq df Prob.

CPI 3.724384 4 0.4446

M1 59.05509 4 0.0000

R 1.446873 4 0.8360

All 77.94171 12 0.0000

Dependent variable: CPI

Excluded Chi-sq df Prob.

GDP 20.78732 4 0.0003

M1 26.63175 4 0.0000

R 2.464658 4 0.6510

All 68.51009 12 0.0000

Dependent variable: M1

Excluded Chi-sq df Prob.

GDP 72.08928 4 0.0000

CPI 33.05300 4 0.0000

R 4.744682 4 0.3145

All 93.10340 12 0.0000 Dependent variable: R

Excluded Chi-sq df Prob.

GDP 5.450381 4 0.2441

CPI 0.603649 4 0.9627

M1 2.754376 4 0.5997

All 8.353899 12 0.7569 从表14.2汇报的结果可以看出生变量CPI(物价水平)的滞后期不能很好的解释生变量GDP（国生产总值），因此CPI不是GDP 的格兰杰原因；同理可以解释其他生变量。

3)滞后排除检验（Lag Exclusion Tests）

滞后排除检验是用来检验VAR系统中每一个滞后期。对每一个滞后期，所有生变量在特定显著水平下的对于每一个程的2χ(Wald)统计量被分别单独列出，最后一列是联合的显

著性检验。具体估计结果见表14.3。

表14.3 滞后排除检验结果

VAR Lag Exclusion Wald Tests

Sample: 1999M01 2006M12

Included observations: 92

Chi-squared test statistics for lag exclusion:

Numbers in [ ] are p-values

GDP CPI M1 R Joint Lag 1 55.14276 130.6234 80.80588 83.62508 377.5179

[ 3.02e-11] [ 0.000000] [ 1.11e-16] [ 0.000000] [ 0.000000] Lag 2 6.610822 13.77340 13.61024 4.540688 45.89505

[ 0.147940] [ 0.008055] [ 0.008649] [ 0.337750] [ 0.000101] Lag 3 28.54094 3.554922 46.93112 3.605451 70.88551

[ 9.69e-06] [ 0.469577] [ 1.58e-09] [ 0.462026] [ 6.98e-09] Lag 4 4.828657 20.93722 29.99224 1.837606 57.63659

[ 0.305334] [ 0.000326] [ 4.91e-06] [ 0.765595] [ 1.30e-06] df 4 4 4 4 16

从表14.3汇报的结果可以看出，对于滞后1期来说所有生变量在0.01显著水平下的每一个程的都是显著的。

4)滞后长度准则（Lag Length Criteria）

在理想状态下，我们希望选择VAR的随机扰动项服从向量白噪音。所以从理论上说，如果能够通过某一种法选择滞后期数能够使得扰动项满足向量白噪音过程，那么滞后期的选择问题就很好解决了。在Eviews里面提供了五种准则来确定滞后期的选择。在选择时，我们需要设定一个最大滞后期数，当然它的设定存在一定的主观性。但是通常可以根据数据的频率来进行确定。例如，对于月度数据一般选择最大滞后期为6，12和18。对于季度数据一般选择4或者8。需要注意不同的准则或者检验的统计量选择的滞后期可能会有所不同。在这种状况下，一般根据多数原则来确定最优滞后期。这个过程实际上就是所谓的稳健性检验过程。所有滞后期选择准则的原理可以参见Lütkepohl (1991, Section 4.3)。由具体估计结果如表14.4。

表14.4 VAR模型滞后期选择结果

VAR Lag Order Selection Criteria

Endogenous variables: GDP CPI M1 R

Exogenous variables: C

Sample: 1999M01 2006M12

Included observations: 90

Lag LogL LR FPE AIC SC HQ

0 312.3743 NA 1.24e-08 -6.852762 -6.741659 -6.807959

1 763.3624 851.8665 7.87e-13 -16.51917 -14.96365 -16.29514

2 804.8764 74.72508 4.48e-1

3 -17.0861

4 -16.08622 -16.68291

3 828.9678 41.22313 3.76e-13 -17.26595 -14.82162 -16.68351

4 859.8364 50.07563 2.73e-13 -17.59636 -14.70762 -16.83471

5 925.3564 100.4641 9.23e-14 -18.69681 -16.36365* -17.75594

6 959.7743 49.71468* 6.29e-14* -19.10609* -16.32853 -17.98602* * indicates lag order selected by the criterion

LR: sequential modified LR test statistic (each test at 5% level)

FPE: Final prediction error

AIC: Akaike information criterion

SC: Schwarz information criterion

HQ: Hannan-Quinn information criterion

从表14.4汇报的结果可知LR、FPE、AIC和HQ都指向同样的6阶滞后期，因此应该选择VAR(6)进行后续分析。

14.3.2 VAR模型残差检验

VAR模型估计出来以后，还必须对其残差进行检验，以确保估计的结果符合VAR的经典假设。Eviews提供各种检验办法，下面一一进行介绍。

1)相关图

Eviews可以显示VAR模型在指定的滞后阶数的条件下得到残差成对交叉相关图（样本自相关）。交叉相关图有三种显示式，其中有两种表格形式显示：一是根据变量的顺序显示（以变量为序的表格形式）；另一种是根据滞后阶数的顺序显示（以滞后阶数的表格形式）。最后一种是曲线图显示的交叉相关图矩阵形式。这些点线图表示的是加上或者减去滞后性渐进标准误差的两倍（计算原理是1/T）。没有超出两本滞后性渐进标准误差的两倍，就说明VAR模型估计的残差不存在交叉相关。具体操作见图14.5。

图14.5

通过点击Corrlograms以后，会出现如图14.6的对话框。

图14.6

为了更加直观，选择用曲线图显示的形式，选择好滞后阶数以后（这里选择滞后阶数为6期）就可以直接点击OK，然后会报告残差交叉相关情况。具体见图14.7。