AR,MA,ARIMA模型介绍及案例分析

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

BOX -JENKINS 预测法

1

(1)()AR p 模型(Auto regression Model )——自回归模型

p 阶自回归模型:

y t =c +∅1y t−1+∅2y t−2+⋯+∅p y t−p +e t

式中,y t 为时间序列第t 时刻的观察值,即为因变量或称被解释变量;y t−1,y t−2,⋯,y t−p 为时序y t 的滞后序列,这里作为自变量或称为解释变量;e t 是随机误差项;c ,∅1,∅2,⋯,∅p 为待估的自回归参数。 (2)()MA q 模型(Moving Average Model )——移动平均模型

q 阶移动平均模型:

1122t t t t q t q y e e e e μθθθ---=+---

-

式中,μ为时间序列的平均数,但当{}t y 序列在0上下变动时,显然μ=0,可删除此项;t e ,1t e -,2t e -,…,t q e -为模型在第t 期,第1t -期,…,第t q -期的误差;1θ,2θ,…,q θ为待估的移动平均参数。

(3)(,)ARMA p q 模型——自回归移动平均模型(Auto regression Moving Average Model )

模型的形式为:

11221122t t t p t p t t t q t q y c y y y e e e e φφφθθθ------=+++

++---

-

显然,(,)ARMA p q 模型为自回归模型和移动平均模型的混合模型。当q =0,时,退化为纯自回归模型()AR p ;当p =0时,退化为移动平均模型()MA q 。

2 改进的ARMA 模型

(1)(,,)ARIMA p d q 模型

这里的d 是对原时序进行逐期差分的阶数,差分的目的是为了让某些非平稳(具有一定趋势的)序列变换为平稳的,通常来说d 的取值一般为0,1,2。

对于具有趋势性非平稳时序,不能直接建立ARMA 模型,只能对经过平稳化处理,而后对新的平稳时序建立(,)ARMA p q 模型。这里的平文化处理可以是差分处理,也可以是对数变换,也可以是两者相结合,先对数变换再进行差分处理。

(2)(,,)(,,)s ARIMA p d q P D Q 模型

对于具有季节性的非平稳时序(如冰箱的销售量,羽绒服的销售量),也同样需要进行季节差分,从而得到平稳时序。这里的D 即为进行季节差分的阶数;,P Q 分别是季节性自回归阶数和季节性移动平均阶数;S 为季节周期的长度,

时序为月度数据,则S =12,时序为季度数据,则S =4。

在SPSS19.0中的操作如下

● 必须要先打开一个数据源,才可以定义日期

● 数据→定义日期→选择日期的起始点,此时变量栏中会出现日期变量。

(3)ARIMAX 模型

在(,,)(,,)s ARIMA p d q P D Q 模型中,再加入除自身滞后时序变量以外的解释变量X 。

3 模型的识别

模型的识别的本质是确定(,,)(,,)s ARIMA p d q P D Q 中的,,p d q 以及,,P D Q 与

S 的取值。借助于自相关函数(Auto correlation Function, ACF )以及自相关分析图和偏自相关函数(Partial Correlation Function, PACF )以及偏自相关分析图来识别时序特性,并进一步确定p 、q 、P 、Q 。

3.1 自相关函数

自相关是时间序列12,,

t Y Y Y 诸项之间的简单相关。它的含义与相关分析中变

量之间的简单相关一样,只不过它所涉及的是同一序列自身,因而称作自相关。自相关程度的大小,用自相关系数k r 度量。

1

2

1

()()

()n k

t

t k t k n

t

t y

y y y r y

y -+==--=

-∑∑

式中,n 为样本数据的个数;k 为滞后期;y 为样本数据平均值。 自相关系数k r ,可看作自变量k 的函数,即自相关函数。它表示时间序列滞后k 个时间段的两项之间相关的程度。如1r 表示每相邻两项间的相关程度;2r 表示每隔一项的两个观察值得相关程度。

随机序列自相关系数的抽样分布,近似于以0

为均值,分布。自相关系数的95%置信区间为( 1.96,1.96)σσ-

,此处σ=时间序列的自相关系数全部落入这个区间,则认为该序列是纯随机序列。

将时间序列的自相关系数绘制成图,并标出一定的置信区间(通常采用2±倍标准差作为置信区间的两个端点),被称作自相关分析图。 SPSS19.0中的操作

1. 输入变量数据;定义时间序列日期(数据⇒定义日期)

2. 分析⇒预测⇒自相关(如下);将要分析的变量从左侧移入右侧变量框中

3. 勾选自相关、偏自相关,转换暂时不选(如果为非平稳序列,可勾选差分/自然对数转换,其中差分的阶数需要根据自相关图形来确定,通常为0,1,2)

未进行差分处理,由图可知几乎一半的自相

关系数未进入置信区间,说明该序列非平稳,此时需要进行差分处理,即在重复

第2步时,差分选项选择1或2。

3.2 偏自相关函数

偏自相关函数是时间序列t Y ,在给定了121,,t t t k Y Y Y ---+的条件下,t Y 与t k Y -之

间的条件相关。由于它需要考虑排除其他滞后期的效应,因而被称为偏自相关。

偏自相关系数kk φ计算公式如下。

111,1

11,1 1 2,3,1k k k j k j

kk j k k j k j j r k r r k r φφφ---=---==⎧⎪⎪-⋅⎪=⎨=⎪

⎪-⋅⎪⎩

偏自相关系数kk φ,可看作自变量k 的函数,即偏自相关函数,11kk φ-≤≤。它用以测量当剔除其他滞后期(1,2,3,

,1t k =-)的干扰的条件下,t Y 与t k Y -之

间相关的程度。与自相关系数类似,同样可以采用偏自相关分析图来对模型进行识别。

3.3 ARIMA 模型的参数确定

Step1:判断时序是否平稳,若不平稳,经过若干次逐期差分或季节差分使其平稳,则可确定d 和D 。对于社会经济现状,一般d 和D 的数值取0,1或2。

若自相关系数ACF 随着滞后期(一般设为16)增大,而迅速趋于0,则认为该时序是平稳的。

若自相关系数ACF 随着滞后期增大,自相关系数ACF 不趋于0,则认为该时序是非平稳的。更具体地说,若随着时滞k 的增大,自相关系数ACF 缓慢减小,说明随着序列两项间隔的提前,相关程度变弱,则序列具有趋势性;若对于季度数据或月度数据,当滞后期为4(或12),8(24)等时,自相关系数ACF 显著地部位0,即在随机区间之外,则意味着该时序具有季节性。如果时序具有趋势性,那么需要进行逐期差分,由逐期差分的次数决定d 的取值;如果序列具有季节性,那么要进行季节差分,由季节差分次数决定D 的值。

相关文档
最新文档