自回归移动平均程

————————————————————————————————作者：————————————————————————————————日期：

A . 自回归移动平均过程(),ARMA p q 理论部分

1．基本概念

(),ARMA p q 表达式为：

112211.......t t t p t p t t q t q Y c Y Y Y φφφεθεθε-----=++++++++ （1）

写成滞后算子的形式为：

()()2

1....1...p

L L L Y c L L φφφθθε----=++++ （2）

两侧同时除以()2121....p p L L L φφφ----，从而得到

()t t Y L μψε=+ （3）

其中

()()

()

1...1....q

p L L L L L

θθψφφφ+++=

----

()12/1....p c μφφφ=----

j ψ

∞

=<∞∑

从而可以发现，(),ARMA p q 过程的平稳性完全取决于回归参数()12,,...,p φφφ而与移动平均参数无关。即(),ARMA p q 过程的平稳性条件为特征方程：

2121....0p p z z z φφφ----=

的根在单位圆外。

（1）变形：

()()()112211.......t t t p t p t t q t q Y Y Y Y μφμφμφμεθεθε------=-+-++-++++ （4）两边同时乘以()t j Y μ--，求期望得到自协方差。当j q >时，结果方程的形式p 阶自协方差形式：

1122....j j j p j p γφγφγφγ---=+++ 1,2,.....j q q =++ （5）

从而解为

1122....j j j j p p h h h γλλλ=+++ （6）

j q ≤时的自协方差函数比较复杂，并且不具有应用意义。不过(),ARMA p q 过程

的自相关函数都具有拖尾特征。

(),ARMA p q 过程容易出现的两个问题：

1）过度参数化问题。例如一个白噪声过程t t Y ε=也可以用()()11t t

L Y L ρρε-=-表示。此时无论ρ取何值，利用()()11t t L Y L ρρε-=-都能够很好的拟合数据，因此造成估计的困难。

2）(),ARMA p q 过程的表达式（54）的滞后多项式进行因式分解得到

()()()()()()()121211....111...1p t q t L L L Y L L L λλλμηηηε----=--- （7）

假设自回归算子()2121....p p L L L φφφ----和移动平均算子()11...q q L L θθ+++存在共同根（公因子），同时除以公因子，得到的过程()1,1ARMA p q --和原来的

(),ARMA p q 过程相同。

表1 时间序列模型性质表

模型性质

AR(p)

MA(q)

ARMA(p,q)

模型方程 ()p t t L Y φε= ()t q t Y L θε= ()()p t q t L Y L φθε= 平稳条件

()0p z φ=的根在

单位圆外

无条件平稳

()0p z φ=的根在

单位圆外

可逆条件无条件可逆 ()0q z θ=的根在

单位圆外 ()0q z θ=的根在

单位圆外 ACF 自相关拖尾在q 截尾拖尾 PACF 偏自相关在p 截尾

拖尾

2.(),ARMA p q 的预测

2.1．预测原理（基于条件的预测）：

定义1：均方误差

对于任何预测都存在误差，我们需要给出一个损失函数来度量预测偏离一个特定的量的程度。假定一个二次损失函数，选择*1t t

Y +，使得

(

*11t t t

E Y Y

++- （8）

最小。表达式（8）称为预测值*1t t

+的均方误差，记做()()2

**1

11t t t

t t

MSE Y

E Y

+++=-。

定理1：最小均方误差预测就是t X 条件下1t Y +的期望。证明：

假定*1t t Y +为基于条件期望以外的其他函数()t g X 的预测()*1t t t

Y g X +=，其MSE 为：

()()

()()()()()()()()(){}

()()(){}

1112

1111112

1111 22t t t t t t t t t t t t t t t t t t t t t t t t t t t E Y g X E Y E Y X E Y X g X E Y E Y X E E Y X g X E Y E Y X Y X g X E Y E Y X E E Y X g X E η++++++++++++++-??=-+-??

????=-+-????

????+--????

????=-+-+???? （9）

因为在t X 的条件下，()1t t E Y X +与()t g X 都是常数，因此

(){}()(){}

11110

t t t t t t t t t E X E Y E Y X X E Y X g X η++++????

????=--????

= （10）根据迭代期望法则，（10）的期望就是无条件期望，即

()(){}

110t t t t E E E X X ηη++??==?? （11）

从而，（9）变为

()()()()()2

1111t t t t t t t t E Y g X E Y E Y X E E Y X g X ++++????-=-+-???? （12）

右边第一项为常数，因此如果希望均方误差最小，只有：

()()1t t t E Y g +=X X （13）

定理得证。

定义2：线性投影

假设预测*1t t Y +为t X 的线性函数，即*1t t

Y +'=t a X 。如果存在一个α，使得预测误差()1t t Y X α+'-与t X ，即

()10t t t E Y X X α+'''-=???? （14）

则预测t X α'称为1t Y +关于t X 的线性投影。

定理2：在线性预测族中，线性投影具有最小均方误差。证明和定理1相似。

线性投影是随机过程总体特征的归纳；而OLS 回归是对样本观察值的归纳。定理3 多重投影定理

如果2t Y +的1t +期的预测是t 期信息的投影，则结果为2t Y +的t 期最小均方误差预测。

例1.()1,1ARMA 过程预测

解：()1,1ARMA 过程()()()11t t L Y L φμθε--=+，当1,1φθ<<时，满足平稳性和可逆性。因此预测为：

(

)()11?11t t s t s L L

Y Y L L L θφμμφθ++??+-=+-??-+?? 其中

()()()()()

()

22221221111...1...1...1s s s

s s s

s L L L L L L L L L L L L L

θφφφθφφφθφφφφθφφ+

+--??

+??-????

++++++??=+????=+++++=

- 从而预测为

()()

()

()111?111s

s s

s t t t s t

Y Y Y L

φθφφθφφμμμμφθθ--+++-=+

-=+

--++

对于2,3,...s =，预测服从递归算法：

()

1t s t t s t Y Y μφμ++-=+-))

即在一期以后，预测按几何方式以速度φ收敛于无条件均值μ。前一期的预测为：

()()11t t t t t Y Y Y L

φθμμφμθεθ++=+-=-++))

其中

()()111t t t t t t t Y Y Y Y εμφμθε---=----=-)

))

例2：(),ARMA p q 过程预测解：对于(),ARMA p q 过程

()()()2

1...1...p

L L L Y L L L φφφμθθθ-----=++++

1期预测为

()()()

1211121... ...t t p t p t t t t q t q

Y Y Y Y μφμφμφμθεθεθε--+--=+-+-++-++++)

)))

其中1t t t t Y Y ε-=-))

。前s 期预测为：

()()()(

)

(

)

(

)

1212111212...1,2,..., ......1,2,...

p t s t t s t t s p t s t s t q t q

t s t

p t s t

t s t t s p t Y Y Y s q

Y Y Y Y s q q φμφμφμθεθεθεμφμφμφμ

+-+-+-+--++-+-+-?-+-++-?

++++-=??-+-++-=++??)))

)))))

))

当s q >时，预测为由自回归系数决定的p 阶差分方程。 3. 沃尔德分解和ARMA 建模 3.1．沃尔德分解

定理4 Wold 分解定理：

任何零均值协方差平稳过程t Y 可表示成如下形式

0t j t j t j Y k ψε∞

-==+∑ （15）

其中01ψ=，且20j j ψ∞

=<∞∑。t ε是白噪声（新生量），表示以Y 的滞后项预测t Y 产生的误差：

()12

?,,...t t t t t Y E Y Y Y ε--≡- （16） ()12

?,,...t t t t k E k Y Y --= （17）对于任意的j ，t k 的值与t j ε-无关。t k 由Y 的过去值确定，称为t Y 的线性确定性分量。0j t j j ψε∞

-=∑称为线性非确定性分量，若0t k =，该过程为纯线性不确定的。

Wold 分解定理仅依赖于Y 的稳定的二阶矩。因此描述了Y 的最优线性预测。

3.2．Box-Jenkins 建模 3.2.1.建模基本思想

将某个时间序列的SACF 和SPACF 的行为与各种理论ACF 和PACF 的行为匹配起来，挑选最佳匹配（或一组匹配的集合），估计模型的未知参数()2,,i i φθσ，并检查从模型拟和得到的残差，已发现可能的模型错误。

步骤：

1）变换数据，是数据满足协方差平稳性假设（单位根检验和季节调整）。 2）对序列的(),ARMA p q 过程的参数,p q 做一个初始的较小值猜测。 3）估计()L φ和()L θ的系数。

4）初步诊断分析。保证所得模型和数据特征相符。 3.2.2．样本自相关SACF

0/j j ργγ=)

)

（18）

其中

()()11T

j t t j t j y y y y T γ-=+=--∑)

0,1,2,...,1j T =- （19）

t t y y T ==∑ （20）

由于实际上假定了协方差平稳性，因此当j →∞，总体自协方差趋向于零。

SACF 的检验统计量为：

()*

21k

i i Q k T r ==∑ （21）

其渐进分布服从自由度为k 的卡方X 分布，即()*

2~a

k Q k X 。

3.2.3．偏自相关函数SPACF

m 阶偏自相关系数的估计是y 关于常数项和最近m 个值的OLS 回归的最

末一个系数：

()()()11211?...m m m t t t m t m t y c y y y e ααα+--+=+++++)))) （22）

其中t e )

代表OLS 回归的残差。

3.2.4．选择模型的标准：（存在多个行为匹配的模型） 1） AIC 标准：（Akaike 信息标准）

()()21?,log 2AIC p q p q T σ

-=++ （23） 2） BIC 标准

()()21?,log log BIC p q p q T T σ

-=++ （24） 3）首先设定()B φ和()B θ的阶数上限，max p 和max q ，并规定{}max 0,1,....,p p =和

{}max 0,1,...,q q =，则选择的阶数1p 和1q 由法则确定：

()()11,min ,AIC p q AIC p q =或 ()()11,min ,BIC p q BIC p q = （25） 3.3(),ARMA p q 在Eviews 中的实现

(1) 通过自相关分析图判断平稳性：如果序列的自相关系数很快地趋于零，即落入随机区间，则时序是平稳的，否则是非平稳的。

(2)自相关图的实现：主菜单中选择quick/series Statisttics/correlogram ，在对话框中输入分析的序列名称。如index ，点击OK 弹出相关图定义。选择之后，点击OK ，从而得到时间序列的自相关和偏自相关分析图。 (3)根据相关图和偏自相关图判断自回归和移动平均的阶数。

(4)模型参数的估计方法：在主窗口选择Quick/Estimate/Equation ，输入index ar(1) ar(2) …ar(p) ma(1) ma(2)…ma(q) 点击OK 进入。

(5)结果中要求AIC 和BIC 越小越好。而且最后两行的数值落在单位圆内。 (6) 模型的检验：

1）对模型的残差序列进行白噪声检验。检验残差序列的样本自相关系数是否为零。检验统计量为卡方检验。残差序列的自相关函数为

()121n

t t k

t k k n t

t e e r e e

-=+==

∑∑

1,2,....,k m = （26）

m 为最大滞后期。一般取/4n 。检验统计量为

()()

212m

k k r e Q n n n k

==+-∑ （27）

在零假设下，Q 服从卡方分布。给定置信度，如果()2

Q X m p q α≤--，则不能拒

绝残差序列相互独立的原假设，通过检验。否则拒绝原假设。直接对残差序列的检验，分析残差序列的自相关图。

2) 检查是否过度拟合。用高阶的模型进行拟合，并与原模型比较。

4.极大似然估计 4.1引言

考虑ARMA 模型：

112211.......t t t p t p t t q t q Y c Y Y Y φφφεθεθε-----=++++++++ （28）

其中()20,t WN εσ:。前面我们假定知道总体参数()211,,...,,,...,,p q c φφθθσ，此时利用过程（28）进行预测。

本章我们要研究在仅能观测到Y 的情况下，如何估计()2

,,...,,,...,,p

c φφθθσ。

估计方法为极大似然估计。令()2

,,...,,,...,,p

c φφθθσ=θ表示总体参数向量。假定我们观察到一个样本量为T 的样本()12,,...,T y y y 。计算所实现样本的联合概率密度函数：

()11,,...,11,,...,T T Y Y Y T T f y y y θ-- （29）

这可以看作是观察到样本发生的概率。使得“概率”最大的θ值就是最优估计。这种思想就是极大似然估计的思想。极大似然估计需要设定白噪声的分布。如果

t ε是高斯白噪声，则得到的函数为高斯似然函数。

极大似然估计的步骤： 1）计算似然函数（29）。

2）利用求极大值方法求使得函数值最大的θ值。 4.2 高斯(),ARMA p q 过程的似然函数

对于高斯(),ARMA p q 过程

112211.......t t t p t p t t q t q Y c Y Y Y φφφεθεθε-----=++++++++ （30）

其中()20,t iidN εσ:。总体参数向量为()21212,,,...,,,,...,,p q c φφφθθθσ=θ。

自回归过程的似然函数的近似以y 的初始值为条件，移动平均过程似然函数的近似以ε的初始值为条件。(),ARMA p q 过程以y 和ε的初始值为条件。

假设初始值()0011,,...,p y y y --+'=y 和()0011,,...,q εεε--+'=ε给定，则利用实现

{}12,,..,T y y y ，迭代得到：

11221122......t t t t p t p t t q t q y c y y y εφφφθεθεθε------=--------- （31）

可得1,2,....,t T =的序列{}12,,..,T εεε。则条件似然函数为：

()()

()()11001100,,...,,22

1ln ,,...,,;ln 2ln 222T T T T Y Y Y T

t t L f y y y T T θεπσσ

--===---∑Y εY εθ （32）

4.3极大似然估计的统计推断 4.3.1. 极大似然估计的标准差

如果样本量T 足够大，则极大似然估计θ)

近似表示为：

()11,N T ?--≈0θθ% （33）

其中0θ代表真实参数向量。矩阵?称为信息矩阵。信息矩阵的二阶导数估计为

()2

L T

θθ

θ?θθ-=?=-'

??)

)

（34）

其中()L θ为对数似然函数：

()()111ln ;T t T

t t Y t L f y θ--ψ==ψ∑θ （35）

1t -ψ表示t 时刻y 的所有历史观测值。利用数值方法可以计算出对数似然函数的

二阶导数。（34）代入（35），得到

(

)(

)

()1

0L E θθθθθθθθθ-???'--?-=??'????

)

) （36） 4.3.2．似然比检验

假设原假设：参数向量θ中存在m 个限制（例如某些系数等于零）。首先求

出无限制极大似然估计；在求出存在限制情况下的极大似然估计。令()

L θ)

表示

无限制对数似然函数。()L θ

%表示限制对数似然函数。明显()()

L L θθ≥)

%，检验统计量为：

()()

()22L L m θθχ??-??

)

%: （37）利用显著性检验法和置信区间法可以对原假设进行检验。 4.3.3．拉格朗日乘子检验

标准差检验需要计算无限制极大似然估计θ)

。似然比检验既要计算有限制极大似然估计量，又要计算无限制极大似然估计量。而如果计算有限制极大似然估

计量比较简单，则可以利用拉格朗日乘子检验。拉格朗日乘子检验是从有限制极大似然估计这一原假设出发，即原假设：有限制极大似然估计量为真。

令θ为一个()1a ?向量，令θ)

为有m 个限制的极大似然估计量。令

()1,...;t t f y y θ-为第t 个观察值的条件密度，令(),t h Y θ表示对数条件密度对限制估计θ的导数组成的()1a ?向量：

(

)

()

1ln ,...,,t t t f y y h Y θθ

θθθ

-=?=

)

（38）

此时拉格朗日乘子统计量为：

()

()1

1,,T

T t

t t t T h Y h Y m θ?θχ--=='????≈????????

∑∑)) （39）其中?为信息矩阵，其估计量()2

L T

θθ

θ?θθ-=?=-'

??)

)

。

B. 实验部分（MATLAB ）

105页例2.2: 利用平稳序列的前5个自协方差建立ARMA(2,2)模型

1. 根据延伸的Yule-Walker 方程

31213

224a a γγγγγγ??????= ? ? ??????? 计算出1a 和2a ,得到)6265.0,0894.0(),(21-=a a ;

⒉ 利用公式

121121(),||2

k k k T y k k k k k k k a a k γγγγγγγγγγ++-+--??

?=≤ ? ?

计算出((0),(1),(2))y y y γγγ,得到

3.2729) 2.4287- 7.1278())2(),1(),0((=y y y γγγ;

⒊ 利用公式

222

()b A C γσ

-∏ 20T C C σγ=-∏ 其中

lim T k k

k -→∞∏=ΩΓΩ，0100A ??

= ???

， 10C ??= ???

，1

212k k k k

γγγγ+???

Ω= ???L L

计算出0119.42=σ和)8158.0,3334.0(),(21-=b b 。

⒋ 所要求的模型为

1*8158.0*3334.0*6265.0*0894.0----+-+-=t t t t t t X X X εεε,

t Z ∈

其中{}t ε是)0119.4,0(WN 。

k 6 12 20 30 40 >=51

-0.3171 -0.3281 -0.3333 -0.3333 -0.3334 -0.3334 2b

0.7375 0.7986 0.8122 0.8154 0.8157 0.8158 2σ

4.4379

4.0981

4.0299

4.0139

4.0122

4.0119

程序1：

gamma1=[0.29 -1.06;0.69 0.29]; r=[0.69 -0.12]; a1=inv(gamma1)*r' a1 =

0.0894 -0.6265 程序2： a=[-1; a1];

gammaY=zeros(1,3);

for k=0:2

gamma2=[4.61 -1.06 0.29 0.69 -0.12]; gamma3=zeros(3,3);

gamma3(1,1)=gamma2(1,abs(k)+1); gamma3(1,2)=gamma2(1,abs(k+1)+1); gamma3(1,3)=gamma2(1,abs(k+2)+1); gamma3(2,1)=gamma2(1,abs(k-1)+1); gamma3(2,2)=gamma2(1,abs(k)+1); gamma3(2,3)=gamma2(1,abs(k+1)+1); gamma3(3,1)=gamma2(1,abs(k-2)+1); gamma3(3,2)=gamma2(1,abs(k-1)+1);

gamma3(3,3)=gamma2(1,abs(k)+1);

gammaY(k+1)=a'*gamma3*a;

end

gammaY

gammaY =

7.1278 -2.4287 3.2729

程序3。4：

A=[0 1;0 0;];C=[1;0];

gamma=[gammaY(1,2);gammaY(1,3)];

k=6;

Omega=zeros(2,k);

Omega(1,1)=gammaY(1,2);Omega(2,1)=gammaY(1,3);Omega(1,2)=gammaY(1,3); Gamma=zeros(k,k);

for i=1:k

Gamma(i,i)=gammaY(1,1);

end

for i=2:k

Gamma(i,i-1)=gammaY(1,2);Gamma(i-1,i)=gammaY(1,2);

end

for i=3:k

Gamma(i,i-2)=gammaY(1,3);Gamma(i-2,i)=gammaY(1,3);

end

Pai=Omega*inv(Gamma)*(Omega)';

sigma=gammaY(1,1)-C'*Pai*C;

b2=(gamma-A*Pai*C)/sigma;

sigma

(4) %零点%

A=[0.6265,-0.0894,1]; roots(A)

ans =

0.0713 + 1.2614i

0.0713 - 1.2614i

B=[0.8158, -0.3334, 1]; roots(B)

ans =

0.2043 + 1.0881i

0.2043 - 1.0881i

0.0713 + 1.2614i A(z) 0.0713 - 1.2614i

1.2634

0.2043 + 1.0881i B(z) 0.2043 - 1.0881i

1.1072

C . 实验 ARMA 模型建模与预测（Eviews ）

一、实验目的

学会通过各种手段检验序列的平稳性；学会根据自相关系数和偏自相关系数来初步判断ARMA 模型的阶数p 和q ，学会利用最小二乘法等方法对ARMA 模型进行估计，学会利用信息准则对估计的ARMA 模型进行诊断，以及掌握利用ARMA 模型进行预测。掌握在实证研究中如何运用Eviews 软件进行ARMA 模型的识别、诊断、估计和预测和相关具体操作。

二、基本概念

宽平稳：序列的统计性质不随时间发生改变，只与时间间隔有关。

AR 模型：AR 模型也称为自回归模型。它的预测方式是通过过去的观测值和现在的干扰值的线性组合预测，自回归模型的数学公式为:

1122t t t p t p t y y y y φφφε---=++++L

式中: p 为自回归模型的阶数i φ（i=1，2， K ，p ）为模型的待定系数，t ε为误差， t y 为一个平稳时间序列。

MA 模型：MA 模型也称为滑动平均模型。它的预测方式是通过过去的干扰值和现在的干扰值的线性组合预测。滑动平均模型的数学公式为:

1122t t t t q t q y εθεθεθε---=----L

式中: q 为模型的阶数； j θ（j=1，2，K ，q ）为模型的待定系数；t ε为误差；

t y 为平稳时间序列。

ARMA 模型：自回归模型和滑动平均模型的组合，便构成了用于描述平稳随机过程的自回归滑动平均模型ARMA ，数学公式为:

11221122t t t p t p t t t q t q y y y y φφφεθεθεθε------=++++----L L

三、实验内容及要求 1、实验内容：

（1）根据时序图判断序列的平稳性；

（2）观察相关图，初步确定移动平均阶数q 和自回归阶数p ；

（3）运用经典B-J 方法对某企业201个连续生产数据建立合适的ARMA （,p q ）模型，并能够利用此模型进行短期预测。 2、实验要求：

（1）深刻理解平稳性的要求以及ARMA 模型的建模思想；

（2）如何通过观察自相关，偏自相关系数及其图形，利用最小二乘法，以及信息准则建立合适的ARMA 模型；如何利用ARMA 模型进行预测；（3）熟练掌握相关Eviews 操作，读懂模型参数估计结果。

四、实验指导

1、模型识别

（1）数据录入

打开Eviews软件，选择“File”菜单中的“New--Workfile”选项，在“Workfile structure type”栏选择“Unstructured /Undated”，在“Date range”栏中输入数据个数201，点击ok，见图1，这样就建立了一个工作文件。

图1 建立工作文件窗口

点击File/Import，找到相应的Excel数据集，打开数据集，出现图2的窗口，在“Data order”选项中选择“By observation”即按照观察值顺序录入，第一个数据是从a2开始的，所以在“Upper-left data cell”中输入a2，本例只有一列数据，在“Names for series or number if named in file”中输入序列的名字production或1，点击ok，则录入了数据。

图2

（2）绘制序列时序图

双击序列production，点击view/Graph/line，则出现图3的序列时序图，

时序图看出201个连续生产的数据是平稳的，这个判断比较粗糙，需要用统计方

法进一步验证。

255075100125150175200

PRODUCTI ON

图3

（3）绘制序列相关图

双击序列production，点击view/Correlogram，出现图4，我们对原始数据序列做相关图，因此在“Correlogram of”对话框中选择“Level”即表示对原始序列做相关，在滞后阶数中选择14（201

??），点击ok，即出现相关图5。

图4

从相关图看出，自相关系数迅速衰减为0，说明序列平稳，但最后一列白噪声检验的Q统计量和相应的伴随概率表明序列存在相关性，因此序列为平稳非白噪声序列。我们可以对序列采用B-J方法建模研究。

图5

（4）ADF检验序列的平稳性

通过时序图和相关图判断序列是平稳的，我们通过统计检验来进一步证实这个结论，双击序列production，点击view/unit root test，出现图6的对话框，我们对序列本身进行检验，序列不存在明显的趋势，所以选择对常数项，不带趋势的模型进行检验，其他采用默认设置，点击ok，出现图7的检验结果，表明拒绝存在一个单位根的原假设，序列平稳。

图6

图7

（5）模型定阶

由图5看出，偏自相关系数在k=3后很快趋于0即3阶截尾，尝试拟合AR （3）；自相关系数在k=1处显著不为0，当k=2时在2倍标准差的置信带边缘，可以考虑拟合MA（1）或MA（2）；同时可以考虑ARMA（3，1）模型等。

在序列工作文件窗口点击View/Descriptive Statistics/Histogram and States对原序列做描述统计分析见图8，可见序列均值非0，我们通常对0均值平稳序列做建模分析，所以需要在原序列基础上生成一个新的0均值序列。点击主菜单Quick/Generate Series，在对话框中输入赋值语句Series x=production-84.11940，点击ok则生成新序列x，这个序列是0均值的平稳非