AR,MA,ARIMA模型介绍及案例分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
BOX -JENKINS 预测法
1
(1)()AR p 模型(Auto regression Model )——自回归模型
p 阶自回归模型:
y t =c +∅1y t−1+∅2y t−2+⋯+∅p y t−p +e t
式中,y t 为时间序列第t 时刻的观察值,即为因变量或称被解释变量;y t−1,y t−2,⋯,y t−p 为时序y t 的滞后序列,这里作为自变量或称为解释变量;e t 是随机误差项;c ,∅1,∅2,⋯,∅p 为待估的自回归参数。 (2)()MA q 模型(Moving Average Model )——移动平均模型
q 阶移动平均模型:
1122t t t t q t q y e e e e μθθθ---=+---
-
式中,μ为时间序列的平均数,但当{}t y 序列在0上下变动时,显然μ=0,可删除此项;t e ,1t e -,2t e -,…,t q e -为模型在第t 期,第1t -期,…,第t q -期的误差;1θ,2θ,…,q θ为待估的移动平均参数。
(3)(,)ARMA p q 模型——自回归移动平均模型(Auto regression Moving Average Model )
模型的形式为:
11221122t t t p t p t t t q t q y c y y y e e e e φφφθθθ------=+++
++---
-
显然,(,)ARMA p q 模型为自回归模型和移动平均模型的混合模型。当q =0,时,退化为纯自回归模型()AR p ;当p =0时,退化为移动平均模型()MA q 。
2 改进的ARMA 模型
(1)(,,)ARIMA p d q 模型
这里的d 是对原时序进行逐期差分的阶数,差分的目的是为了让某些非平稳(具有一定趋势的)序列变换为平稳的,通常来说d 的取值一般为0,1,2。
对于具有趋势性非平稳时序,不能直接建立ARMA 模型,只能对经过平稳化处理,而后对新的平稳时序建立(,)ARMA p q 模型。这里的平文化处理可以是差分处理,也可以是对数变换,也可以是两者相结合,先对数变换再进行差分处理。
(2)(,,)(,,)s ARIMA p d q P D Q 模型
对于具有季节性的非平稳时序(如冰箱的销售量,羽绒服的销售量),也同样需要进行季节差分,从而得到平稳时序。这里的D 即为进行季节差分的阶数;,P Q 分别是季节性自回归阶数和季节性移动平均阶数;S 为季节周期的长度,
如
时序为月度数据,则S =12,时序为季度数据,则S =4。
在SPSS19.0中的操作如下
● 必须要先打开一个数据源,才可以定义日期
● 数据→定义日期→选择日期的起始点,此时变量栏中会出现日期变量。
(3)ARIMAX 模型
在(,,)(,,)s ARIMA p d q P D Q 模型中,再加入除自身滞后时序变量以外的解释变量X 。
3 模型的识别
模型的识别的本质是确定(,,)(,,)s ARIMA p d q P D Q 中的,,p d q 以及,,P D Q 与
S 的取值。借助于自相关函数(Auto correlation Function, ACF )以及自相关分析图和偏自相关函数(Partial Correlation Function, PACF )以及偏自相关分析图来识别时序特性,并进一步确定p 、q 、P 、Q 。
3.1 自相关函数
自相关是时间序列12,,
t Y Y Y 诸项之间的简单相关。它的含义与相关分析中变
量之间的简单相关一样,只不过它所涉及的是同一序列自身,因而称作自相关。自相关程度的大小,用自相关系数k r 度量。
1
2
1
()()
()n k
t
t k t k n
t
t y
y y y r y
y -+==--=
-∑∑
式中,n 为样本数据的个数;k 为滞后期;y 为样本数据平均值。 自相关系数k r ,可看作自变量k 的函数,即自相关函数。它表示时间序列滞后k 个时间段的两项之间相关的程度。如1r 表示每相邻两项间的相关程度;2r 表示每隔一项的两个观察值得相关程度。
随机序列自相关系数的抽样分布,近似于以0
为均值,分布。自相关系数的95%置信区间为( 1.96,1.96)σσ-
,此处σ=时间序列的自相关系数全部落入这个区间,则认为该序列是纯随机序列。
将时间序列的自相关系数绘制成图,并标出一定的置信区间(通常采用2±倍标准差作为置信区间的两个端点),被称作自相关分析图。 SPSS19.0中的操作
1. 输入变量数据;定义时间序列日期(数据⇒定义日期)
2. 分析⇒预测⇒自相关(如下);将要分析的变量从左侧移入右侧变量框中
3. 勾选自相关、偏自相关,转换暂时不选(如果为非平稳序列,可勾选差分/自然对数转换,其中差分的阶数需要根据自相关图形来确定,通常为0,1,2)
未进行差分处理,由图可知几乎一半的自相
关系数未进入置信区间,说明该序列非平稳,此时需要进行差分处理,即在重复
第2步时,差分选项选择1或2。
3.2 偏自相关函数
偏自相关函数是时间序列t Y ,在给定了121,,t t t k Y Y Y ---+的条件下,t Y 与t k Y -之
间的条件相关。由于它需要考虑排除其他滞后期的效应,因而被称为偏自相关。
偏自相关系数kk φ计算公式如下。
111,1
11,1 1 2,3,1k k k j k j
kk j k k j k j j r k r r k r φφφ---=---==⎧⎪⎪-⋅⎪=⎨=⎪
⎪-⋅⎪⎩
∑
∑
偏自相关系数kk φ,可看作自变量k 的函数,即偏自相关函数,11kk φ-≤≤。它用以测量当剔除其他滞后期(1,2,3,
,1t k =-)的干扰的条件下,t Y 与t k Y -之
间相关的程度。与自相关系数类似,同样可以采用偏自相关分析图来对模型进行识别。
3.3 ARIMA 模型的参数确定
Step1:判断时序是否平稳,若不平稳,经过若干次逐期差分或季节差分使其平稳,则可确定d 和D 。对于社会经济现状,一般d 和D 的数值取0,1或2。
若自相关系数ACF 随着滞后期(一般设为16)增大,而迅速趋于0,则认为该时序是平稳的。
若自相关系数ACF 随着滞后期增大,自相关系数ACF 不趋于0,则认为该时序是非平稳的。更具体地说,若随着时滞k 的增大,自相关系数ACF 缓慢减小,说明随着序列两项间隔的提前,相关程度变弱,则序列具有趋势性;若对于季度数据或月度数据,当滞后期为4(或12),8(24)等时,自相关系数ACF 显著地部位0,即在随机区间之外,则意味着该时序具有季节性。如果时序具有趋势性,那么需要进行逐期差分,由逐期差分的次数决定d 的取值;如果序列具有季节性,那么要进行季节差分,由季节差分次数决定D 的值。