应用时间序列实验报告
河南工程学院课程设计
《时间序列分析课程设计》学生姓名学号:
学院:理学院
专业班级:
专业课程:时间序列分析课程设计指导教师:
2017年 6 月 2 日
目录
1. 实验一澳大利亚常住人口变动分析..... 错误!未定义书签。
实验目的............................................... 错误!未定义书签。
实验原理............................................... 错误!未定义书签。
实验内容............................................... 错误!未定义书签。
实验过程............................................... 错误!未定义书签。
2. 实验二我国铁路货运量分析........... 错误!未定义书签。
实验目的............................................... 错误!未定义书签。
实验原理............................................... 错误!未定义书签。
实验内容............................................... 错误!未定义书签。
实验过程............................................... 错误!未定义书签。
3. 实验三美国月度事故死亡数据分析...... 错误!未定义书签。
实验目的............................................... 错误!未定义书签。
实验原理............................................... 错误!未定义书签。
实验内容............................................... 错误!未定义书签。
实验过程............................................... 错误!未定义书签。课程设计体会 ............................ 错误!未定义书签。
1.实验一澳大利亚常住人口变动分析
1971年9月—1993年6月澳大利亚常住人口变动(单位:千人)情况如表1-1所示(行数据)。
表1-1
(1)判断该序列的平稳性与纯随机性。
(2)选择适当模型拟合该序列的发展。
(3)绘制该序列拟合及未来5年预测序列图。
实验目的
掌握用SAS软件对数据进行相关性分析,判断序列的平稳性与纯随机性,选择模型拟合序列发展。
实验原理
(1)平稳性检验与纯随机性检验
对序列的平稳性检验有两种方法,一种是根据时序图和自相关图显示的特征做出判断的图检验法;另一种是单位根检验法。
(2)模型识别
先对模型进行定阶,选出相对最优的模型,下一步就是要估计模型中未知参数的值,以确定模型的口径,并对拟合好的模型进行显著性诊断。
(3)模型预测
模型拟合好之后,利用该模型对序列进行短期预测。
实验内容
(1)判断该序列的平稳性与纯随机性
时序图检验,根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常识值附近波动,而且波动的范围有界。如果序列的时序图显示该序列有明显的趋势性或周期性,那么它通常不是平稳序列。
对自相关图进行检验时,可以用SAS 系统ARIMA 过程中的IDENTIFY 语句来做自相关图。
而单位根检验我们用到的是DF 检验。以1阶自回归序列为例:
11t t t x x φε-=+
该序列的特征方程为:
0λφ-=
特征根为:
λφ=
当特征根在单位圆内时:
11φ<
该序列平稳。
当特征根在单位圆上或单位圆外时:
11φ≥
该序列非平稳。
对于纯随机性检验,既白噪声检验,可以用SAS 系统中的IDENTIFY 语句来输出白噪声检验的结果。
(2)选择适当模型拟合该序列的发展
先对模型进行定阶,选出相对最优的模型,下一步就是要估计模型中未知参数的值,以确定模型的口径,并对拟合好的模型进行显著性诊断。
ARIMA过程的第一步是要IDENTIFY命令对该序列的平稳性和纯随机性进行识别,并对平稳非白噪序列估计拟合模型的阶数。使用命令如下:proc print data=example3_20;
IDENTIFY VAR =people nlag=8 minic p= (0:5) q =(0:5);
run;
(3)绘制该序列拟合及未来5年预测序列图
模型拟合好之后,利用该模型对序列进行短期预测。预测命令如下:
forecast lead=5 id=time out=results;
run;
其中,lead指定预期数;id指定时间变量标识;out指定预测后期的结果存入某个数据集。
利用存储在临时数据集RESULTS里的数据,我们可以绘制拟合预测图,相关命令如下:
proc gplot data=results;
plot people*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay;
symbol1 c=red i=none v=star;
symbol2 c=black i=join v=none;
symbol3 c=green i=join v=none l=32;
run;
实验过程
按照实验的过程运行程序,对程序结果的分析如下:
(1)判断该序列的平稳性与纯随机性
图1-1 1971年9月-1993年6月澳大利亚季度常住人口变动序列时序图时序图显示澳大利亚季度常住人口围绕在52千人附近随机波动,没有明显趋势或周期,基本可视为平稳模式。
图1-2序列自相关图
自相关图显示该序列的自相关系数一直都比较小,始终控制在2倍的标准差范围以内,故认为该序列是平稳序列。
图1-3 序列的单位根检验结果
根据第五列、第六列输出的结果我们可以判断,当显著性水平 取时,序
列非平稳,但当消除线性趋势之后序列平稳。
图1-4 白噪声检验输出结果
可以看到延迟6阶、12阶的检验P值均小于,故拒绝原假设,认为该序列为非白噪声序列(非纯随机序列)。
(2)选择适当模型拟合该序列的发展
图1-5 IDENTIFY命令输出的最小信息量结果
最后一条信息显示,在自相关延迟阶数也小于等于5的所有ARMA(p,q)模型中,BIC信息量相对于最小的是ARMA(1,3)模型。
图1-6 ESTIMATE命令输出的未知参数结果
图1-7 ESTIMATE命令输出的拟合统计量结果
图1-8 ESTIMATE 命令输出的系数矩阵
图1-9 ESTIMATE 命令输出的残差自相关检验结果
从输出结果可以看出由于延迟各阶的LB 统计量的P 值均显著大于α(0.05α≥),所以该拟合模型显著成立。
图1-10 ESTIMATE 命令输出的拟合模型形式
该输出形式等价于:
23(10.62415B 0.253693B 0.2953B )t t x ε=-++
或记为:
1230.624150.2536930.2953t t t t t x εεεε---=-++
(3)绘制该序列拟合及未来5年预测序列图
图1-11 FORECAST 命令输出的5年预测结果
拟合效果图如图1-11:
图1-12 拟合效果图
2.实验二我国铁路货运量分析
我国1949—2008年每年铁路货运量(单位:万吨)数据如表2-1所示。
表2-1
请选择适当的模型拟合该序列,并预测2009—2013年我国铁路货运量。
实验目的
掌握用SAS软件对数据进行相关性分析,掌握对非平稳时间序列的随机分析,选择合适模型,拟合序列发展。
实验原理
ARIMA模型的预测和ARMA模型的预测方法非常类似。(p,d,q)
ARIMA模型的一般表示方法为:
(B)(B)d t t x φε?=Θ
同时可以简记为:
(B)
(B)
d t t x εΘ?=
Φ 式中,{}t ε 为零均值白噪声序列。
我们可以从上式看出,ARIMA 模型的实质就是差分与ARMA 模型的组合,这说明任何非平稳序列如果能通过适当阶数的差分实现差分后平稳,就可以对差分后序列进行ARMA 模型拟合。
(1)对差分平稳后的序列可以使用ARIMA 模型进行拟合,ARIMA 建模操作流程如图2-1所示。
图2-1 建模流程
实验内容
由于ARMA 模型是ARIMA 模型的一种特例,所以在SAS 系统中这两种模型的拟合都放在ARMA 过程中。
先利用时序图分析模型是否平稳,可以运用实验一的程序来实现。再对该序
列进行1阶差分运算,同时考虑差分后序列的平稳性,添加如下命令:difhuoyunliang=dif(huoyunliang);
命令“difhuoyunliang=dif(huoyunliang);”是指令系统对变量进行的1阶差分后的序列值赋值给变量difhuoyunliang,其中dif()是差分函数。利用差分函数得出平稳模型。
再对模型进行定阶和进行预测。
模型定阶:identify var=difhuoyunliang(1) nlag=8 minic p=(0:5) q=(0:5);
模型预测:forecast lead=5 id=time;
实验过程
(1)判断序列的平稳性
图2-2 我国1949—2008年每年铁路货运量时序图
通过分析可知,该时序图有明显的上升趋势,所以为非平稳序列。在此,对该序列进行1阶差分运算。
difhuoyunliang
-30000
-20000
-10000
10000
20000
30000
time
JAN1945JAN1950JAN1955JAN1960JAN1965JAN1970JAN1975JAN1980JAN1985JAN1990JAN1995JAN2000JAN2005JAN2010
图2-3 1阶差分后序列时序图
图2-4 1阶差分后序列自相关图
通过分析可知,时序图显示差分后序列没有明显的非平稳特征;自相关图显示序列有很很强的短期相关性,所以可认为1阶差分后序列平稳。
对平稳的1阶查分序列进行白噪声检验,检验结果如图
图2-5 1阶差分后序列白噪声检验
默认显著性水平为的条件下,由于延迟6阶、12阶的P值为和,小于,所以该差分后序列不能视为白噪声序列,即差分后的序列还蕴含着不容忽视的相关信息可供提取。
(2)对平稳非白噪声查分序列进行拟合
图2-6 IDENTIFY命令输出的最小信息量结果
最后一条信息显示,在自相关延迟阶数也小于等于5的所有(p,q)
ARMA模型中,BIC信息量相对于最小的是(1,0)
ARMA模型。考虑到前面已经进行的1阶差分运算,实际上是用(1,1,0)
ARIMA模型拟合原序列。
图2-7 ESTIMATE命令输出的未知参数结果
图2-8 ESTIMATE命令输出的拟合统计结果
图2-8 ESTIMATE命令输出的残差自相关检验结果
α≥),所以显然,拟合检验统计量的P值均显著大于显著性水平α(0.05
可以认为改残差序列即为白噪声序列,显著性检验显示两参数均显著,这说明ARIMA模型对该序列建模成功。
(1,1,0)
图2-10 ESTIMATE 命令输出的拟合模型形式
输出结果显示,序列t x 的拟合模型为(1,1,0)ARIMA ,模型口径为:
10.51983t
t x B
ε?=
-
等价记为:
121.519830.51983t t t t x x x ε--=-+
利用拟合模型对序列做5期预测,结果如图2-10:
图2-11 2009-2013我国铁路货运量预测
3.实验三美国月度事故死亡数据分析
据美国国家安全委员会统计,1973—1978年美国月度事故死亡数据如表3-1所示。
请选择适当模型拟合该序列的发展。
实验目的
掌握用SAS软件对数据进行相关性分析,掌握对非平稳时间序列的随机分析,选择合适模型,拟合序列发展。
实验原理
在SAS 系统中有一个AUTOREG 程序,可以进行残差自相关回归模型拟合。 残差自回归模型的构思是首先通过确定性因素分解方法提取序列中主要的确定性信息:
t t t t x T S ε=++ (1)
式中,t T 为趋势效应拟合;t S 为季节效应拟合。
考虑到因素分解方法对确定性信息的提取可能不够充分,因而需要进一步检验残差序列{}t ε的自相关性。
如果检验结果显示残差序列的自相关性不显著说明确定性回归模型(1)对信息的提取比较充分,可以停止分析。
如果检验结果显示残差序列的自相关显著,说明确定性回归模型(1)对信息的提取不充分,这时可以考虑对残差序列拟合自回归模型,进一步提取相关信息:
11t t p t p t a εφεφε--=+???++
这样构造的模型:
t t t t x T S ε=++
11t t p t p t a εφεφε--=+???++
(a )0t E =,2(a )t Var σ=,(a ,a )0t t i Cov -=,1i ?≥
这就是自回归模型。
实验内容
首先建立数据集和绘制时序图参照实验一,接下来建立因变量关于时间的回归模型。主要程序如下:
proc autoreg data=example4_3; model death=time/ dwprob;
输出如下三方面结果:普通最小二乘估计结果、回归误差分析、最终拟合模
型,详细分析见下面的实验过程。实验过程
(1)绘制时序图
death
6000
7000
8000
9000
10000
11000
12000
time
JAN1973MAY1973SEP1973JAN1974MAY1974SEP1974JAN1975MAY1975SEP1975JAN1976MAY1976SEP1976JAN1977MAY1977SEP1977JAN1978MAY1978SEP1978JAN1979
图3-1 1973—1978年美国月度事故死亡数据的时序图
时序图显示,有一定规律性的波动,所以考虑使用误差自回归模型拟合该序列的发展。
图3-2 序列关于变量t的线性回归模型的最小二乘估计结果输出结果显示,DW统计量的值等于,输出概率显示残差序列显著正相关,所以应该考虑对残差序列拟合自相关模型。
(2)建立关于时间的回归模型
输出结果的详细分析:该部分输出信息包括误差平方和(SSE)、自由度(DFE)、均方误差(MSE)、根号均方误差(Root MSE)、SBC信息量、AIC信息量、回归部分相关系数平方(Regress R-Square)、总的相关系数平方(Total R-Square),DW 统计量及所有待估计参数的自由度、估计值、标准差、t值和t统计量的P值,
如图3-3所示。
图3-3 普通最小二乘估计结果
回归误差分析:该部分共输出四个信息:残差序列自相关图、逐步回归消除的不显著项报告、初步均方误差(MSE)、自回归参数估计值。如图所示:
图3-4 自回归误差分析输出结果
输出的残差序列自相关图显示残差序列有非常显著的1阶正相关性。逐步回归消除报告显示除了延迟1阶的序列值显著自相关外,延迟其他阶数的序列值均不具有显著的自相关性,因此延迟2~5阶的自相关项被剔除。
最终拟合模型如下图3-5所示: