第三章 平稳时间序列分析3
《时间序列分析》讲义 第三章 平稳时间序列分析

k
1 k1 2 k2,k
2
自相关系数
自相关系数的定义
k
k 0
平稳AR(p)模型的自相关系数递推公式
k 1k 1 2 k 2 p k p
常用AR模型自相关系数递推公式
AR(1)模型 k 1k , k 0
AR(2)模型
1,
k
1
1 2
1k1 2 k2
k 0 k 1 k2
自回归系数多项式
(B) 11B 2B2 pBp
特征方程
中心化AR(p)模型
xt 1 xt1 2 xt2 p xt p t
可以看成p阶常系数非齐次线性差分方程
xt 1 xt1 2 xt2 p xt p t
它对应的齐次方程的特征方程为
p 1 p1 p1 p 0
1 12
协方差函数
在平稳AR(p)模型两边同乘xt-k,再求期望
E(xt xtk ) 1E(xt1xtk ) p E(xt p xtk ) E(t xtk )
根据
E( t xtk ) 0 ,k 1
得协方差函数的递推公式
k 1 k1 2 k 2 p k p
例题
例3.3 求平稳AR(1)模型的协方差
12
2 2
,
0,
k 0 k 1
k 2 k 3
偏自相关系数
滞后k偏自相关系数由Yule-Walker方程 确定
zt a1 zt1 a2 zt2 a p zt p h(t)
齐次线性差分方程
zt a1 zt1 a2 zt2 a p zt p 0
齐次线性差分方程的解
特征方程
p a1p1 a2p2 ap 0
特征方程的根称为特征根,记作1,2,…,p
时间序列分析第三章平稳时间序列分析

注:图中,S号代表序列的观察值;连续曲线代表拟合序列曲线;虚线代表拟合序列的95%上下置信限。
所谓预测就是要利用序列以观察到的样本值对序列在未来某个时刻的取值进行估计。
目前对平稳序列最常用的预测方法是线性最小方差预测。
线性是指预测值为观察值序列的线性函数,最小方差是指预测方差达到最小。
在预测图上可以看到,数据围绕一个范围内波动,即说明未来的数值变化时平稳的。
二、课后习题第十七题:根据某城市过去63年中每年降雪量数据(单位:mm)得:(书本P94)程序:data example17_1;input x@@;time=_n_;cards;2579588397 110;proc gplot data=example17_1;plot x*time=1;symbol c=red i=join v=star;run;proc arima data=example17_1;identify var=x nlag=15minic p= (0:5) q=(0:5);run;estimate p=1;run;estimate p=1 noin;run;forecast lead=5id=time out=results;run;proc gplot data=results;plot x*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay;symbol1c=black i=none v=start;symbol2c=red i=join v=none;symbol3c=green i=join v=none l=32;run;(1)判断该序列的平稳性与纯随机性该序列的时序图如下(图a)图a由时序图显示过去63年中每年降雪量数据围绕早70mm附近随机波动,没有明显趋势或周期,基本可以看成平稳序列,为了稳妥起见,做了如下自相关图(图b)图b时序图就是一个平面二维坐标图,通常横轴表示时间,纵轴表示序列取值。
时间序列平稳性分析(课件)

时间序列平稳性分析(课件)时间序列平稳性分析文章结构•时间序列的概念•平稳性检验•纯随机性检验•spss的具体操作1.1时间序列分析的概念•时间序列是一个按时间的次序排列起来的随机数据集合。
而时间序列分析是概率论与数理统计学科的一个重要分支,它以概率统计学为理论基础来分析随机数据序列(或称为动态数据序列)并对其建立相应的数学模型,即对模型定阶,进行参数估计,进一步将用于预测。
在对时间序列进行分析的时候我们的前提任务是如何进行的呢?2.1平稳性检验•••••特征统计量平稳时间序列的定义平稳时间序列的统计性质平稳时间序列的意义平稳性检验概率分布•概率分布的意义随机变量族的统计性质完全由它们的联合分布函数或联合密度函数决定•时间序列概率分布族的定义{ }Ft1,t2,...,tm(x1,x2,...,xm)m(1,2,...,m),t1,2,...,T•实际应用局限性概率分布•概率分布的意义随机变量族的统计性质完全由它们的联合分布函数或联合密度函数决定•时间序列概率分布族的定义{ }Ft1,t2,...,tm(x1,x2,...,xm)m(1,2,...,m),t1,2,...,T•实际应用局限性特征统计量•均值t EXt•方差Var(Xt)E(Xt t)xdFt(x)2(x t)dFt(x)•协方差•自相关系数(t,s)E(Xt t)(XS)S(t,s)(t,s)DXt DXs平稳时间序列的定义•严平稳严平稳是一种条件比较苛刻的平稳性定义,它认为只有当序列所有的统计性质都不会随时间的推移而发生变化时,该序列才能被认为平稳•宽平稳宽平稳是使用序列的特征统计量来定义的一种平稳性。
它认为序列的统计性质主要由它的低阶矩决定,所以只要保证序列低阶矩平稳(二阶),就能保证序列的主要性质近似稳定。
•满足如下条件的序列称为严平稳序列正整数m,t1,t1,...,tm T,正整数t,有Ft1,t2,...,tm(x1,x2,...,xm)Ft1t,t2t,...,•满足如下条件的序列称为宽平稳序列1)EXt,t T2)EXt,为常数,t T2tmt(x1,x2,...,x3)(t,s)(k,k s t),t,s,k且k s t T•常数性质•自协方差函数和自相关函数只依赖于时间的平移长度而与时间的起止点无关1)延迟k自协方差函数(k)(t,t k),k为整数2)延迟k自相关系数k(k)(0)自相关系数的性质••••规范性对称性非负定性非唯一性平稳性的检验•时序图检验根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应、无明显该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征•自相关图检验平稳序列通常具有短期相关性。
《时间序列分析——基于R》王燕,读书笔记

《时间序列分析——基于R》王燕,读书笔记笔记:⼀、检验:1、平稳性检验:图检验⽅法:时序图检验:该序列有明显的趋势性或周期性,则不是平稳序列⾃相关图检验:(acf函数)平稳序列具有短期相关性,即随着延迟期数k的增加,平稳序列的⾃相关系数ρ会很快地衰减向0(指数级指数级衰减),反之⾮平稳序列衰减速度会⽐较慢衰减构造检验统计量进⾏假设检验:单位根检验adfTest()——fUnitRoots包2、纯随机性检验、⽩噪声检验(Box.test(data,type,lag=n)——lag表⽰输出滞后n阶的⽩噪声检验统计量,默认为滞后1阶的检验统计量结果)1、Q统计量:type=“Box-Pierce”2、LB统计量:type=“Ljung-Box”⼆、模型1、ARMA平稳序列模型1.1平稳性检验1.2ARMA的p、q定阶——acf(),pacf(),auto.arima()⾃动定阶1.3建模arima()1.4模型显著性检验:残差的⽩噪声检验Box.test();参数显著性检验t分布2、⾮平稳确定性分析2.1趋势拟合:直线、曲线(⼀般是多项式,还有其它函数)2.2平滑法移动平均法:SMA()——TTR包指数平滑法:HoltWinters()3、⾮平稳随机性分析3.1ARIMA1平稳性检验,差分运算2拟合ARMA3⽩噪声检验3.2疏系数模型arima(p,d,f)3.3季节模型可以叠加的模型4、残差⾃回归模型:4.1建⽴线性模型4.2对滞后的因变量间拟合线性模型,对模型做残差⾃相关DW检验。
dwtest()——lmtest包,增加选项order.by指定延迟因变量4.3对残差建⽴ARIMA模型5、条件异⽅差模型:异⽅差检验:LM检验ArchTest()——FinTS包,⽤ARCH、GARCH模型建模第⼀章简介统计时序分析⽅法:1、频域分析⽅法2、时域分析⽅法步骤:1、观察序列特征2、根据序列特征选择模型3、确定模型的⼝径4、检验模型,优化模型5、推断序列其它统计性质或预测序列将来的发展时域分析研究的发展⽅向:1、AR,MA,ARMA,ARIMA(Box-Jenkins模型)2、异⽅差场合:ARCH,GARCH等(计量经济学)3、多变量场合:“变量是平稳”不再是必需条件,协整理论3、⾮线性场合:门限⾃回归模型,马尔科夫转移模型第⼆章时间序列的预处理预处理内容:对它的平稳性和纯随机性进⾏检验,最好是平稳⾮⽩噪声的序列1、特征统计量1.1概率分布分布函数或密度函数能够完整地描述⼀个随机变量的统计特征,同样⼀个随机变量族{Xt}的统计特性也完全由它们的联合分布函数或联合密度函数决定。
计量经济学:平稳时间序列分析-差分方程与延迟算子

f (t)
11 0
f (t1)
11
1
f (1)
11 t 1
t
, , 给出初值y-1, y-2,…,y-p以及 0 1
t 的值,即可得到yt。
定理:矩阵F的特征根满足的特征方程为
p 1 p1 2 p2 p1 p 0
1、具有相异特征根的p阶差分方程的通解
如果矩阵F的特征根是相异的,那么存在一个非奇异矩阵
1
0
0
F 0 1 0
0 0 0
p1 p
0
0
0 0 ,
1 0
t
0
Vt
0
0
则原p阶差分方程变为一阶向量差分方程
t Ft1 Vt
参照一阶向量差分方程的递归解法有
t
F
t
1 1
F tV0
F t1V1
F t2V2
FVt1 Vt
即
yt
yt 1
y1
y2
0
0
t 21
1
2 1 2 3
1 p 2 p
t p1
1
p 1 p 2
p p1
将此结果代入 ci t1iti1 即得
ci
p
p1 i
k1(i k )
k i
如果从t期开始迭代,则有
yt j
f ( j1)
11
yt 1
f y ( j1)
12
t2
f y ( j1)
11 0
f (t1)
11
1
f (1)
11 t 1
t
其中
f ( j)
11
c11j
c22j
cppj
chap 3 平稳时间序列分析

32
方差
平稳AR模型的传递形式
xt G j t j
j 0
两边求方差得
2 Var( xt ) G 2 j , G j为Green函数 j 0
33
例3.2:求平稳AR(1)模型的方差
平稳AR(1)模型的传递形式为
t i xt (1B)i t 1 t i 1 1B i 0 i 0
12
AR(P)序列中心化变换
称 { yt }为 {xt } 的中心化序列 ,令
0
1 1 p
yt xt
13
自回归系数多项式
引进延迟算子,中心化 AR( p) 模型又可 以简记为
( B) xt t
自回归系数多项式(特征多项式)
(B) 1 1 B 2 B p B
zt r t (c1eit c2eit ) c3t3 c ptp
16
非齐次线性差分方程的解
非齐次线性差分方程的特解
使得非齐次线性差分方程成立的任意一个解zt
zt a1 zt1 a2 zt2 a p zt p h(t )
11
AR(p)
具有如下结构的模型称为 p 阶自回归模 型,简记为 AR( p) xt 0 1 xt 1 2 xt 2 p xt p t
p 0 2 E ( t ) 0,Var( t ) , E ( t s ) 0, s t Ex 0, s t s t 特别当 0 0 时,称为中心化 AR( p) 模型
37
自相关系数
线性平稳时间序列模型

第二节 建立线性时序模型旳原理 ——动态性
上一页 下一页 返回本节首页
动态性:就是指时间序列各观察值之间旳 有关性。
从系统旳观点看:动态性即指系统旳记忆 性,也就是某一时刻进入系统旳输入对 系统后继行为旳影响,图示如下:
输入
系统
输出(响应)
例
(1)某人在某一天打了一针,假如当日旳反应 是疼痛 0 ,而后来没有其他反应,那么系统 旳输入、输出如下:
假如一种时间序列是纯随机旳,得到一种 观察期数为 n旳观察序列,那么该序列旳 延迟非零期旳样本自有关系数将近似服 从均值为零,方差为序列观察期数倒数 旳正态分布
ˆ k
~
N (0, 1 ) n
,k 0
上一页 下一页 返回本节首页
2.假设条件
原假设:延迟期数不大于或等于m 期旳序 列值之间相互独立
H 0:1 2 m 0, m 1
这种情况可用模型概括为:xt 1at1
(3)假如当日旳反应是疼痛 0 ,第二天 出现了红肿 1 ,那么:
时间 输入 输出
t :1 2 at: 0 1 xt:0 0
3 45 0 00 1 0 0
这种情况可用模型概括为:xt 0at 1at1
(4)假如打针后来各个时刻都存在相应旳反 应,那么,有关该刺激旳总旳概括为:
原则正态白噪声序列纯随机性检验
样本自有关图
返回例题
检验成果
延迟
延迟6期 延迟12期
Q统计量检验
Q统计量值
P值
4.3435
0.63
14.171
0.29
因为P值明显不小于明显性水平 ,所以该序列不能
拒绝纯随机旳原假设。
返回例题
平稳时间序列分析

t Pp t tt t t x B x x B x Bxx ===---M221第3章 平稳时间序列分析一个序列经过预处理被识别为平稳非白噪声序列,那就说明该序列是一个蕴含着相关信息的平稳序列。
方法性工具 差分运算 一、p 阶差分记t x ∇为t x 的1阶差分:1--=∇t t t x x x 记t x 2∇为t x 的2阶差分:21122---+-=∇-∇=∇t t t t t t x x x x x x以此类推:记t px ∇为t x 的p 阶差分:111---∇-∇=∇t p t p t p x x x二、k 步差分记t k x ∇为t x 的k 步差分:k t t t k x x x --=∇ 延迟算子 一、定义延迟算子相当与一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻。
记B 为延迟算子,有延迟算子的性质:1.10=B2.若c 为任一常数,有1)()(-⋅=⋅=⋅t t t x c x B c x c B3.对任意俩个序列{t x }和{t y },有11)(--±=±t t t t y x y x B4.n t t nx x B-=5.)!(!!,)1()1(0i n i n CB C B i niinni in-=-=-∑=其中二、用延迟算子表示差分运算 1、p 阶差分 2、k 步差分ARMA 模型的性质 AR 模型定义 具有如下结构的模型称为p 阶自回归模型,简记为AR(p):ts Ex t s E Var E x x x x t s t s t t p tp t p t t t πΛ∀=≠===≠+++++=---,0,0)(,)(,0)(,0222110εεεσεεφεφφφφεAR(p)模型有三个限制条件: 条件一:0≠pφ。
这个限制条件保证了模型的最高阶数为p 。
条件二:t s E Var E t s t t ≠===,0)(,)(,0)(2εεσεεε。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本一阶均值估计总体均值 样本方差估计总体方差
1 n ˆ ( x i x) n i 1
2 x 2
ˆx
x
i 1
n
i
n
ˆ2 ˆ2 1 1 p 2 ˆ 2 ˆ x 2 2 ˆ ˆ 1
1 q
将偏自相关系数代入Y-W方程
xt 25.17 0.69xt 1 t
ˆ 2 ) 16.17 Var(
例3.8续
确定美国科罗拉多州某一加油站连续57天的 OVERSHORTS序列拟合模型的口径 拟合模型:MA(1) 估计方法:条件最小二乘估计 模型口径
t 1
实际中最常用的参数估计方法是条件最小二乘估 计法
条件最小二乘估计
假设条件:过去未观测到的序列值为0,即
xt 0 , t 0
t ( B) 从 而 t x t x t i x t 1 (( ) t2 [ xt i xt 1 ]2
样本相关系数的近似分布
Barlett定理
1 ˆ k ~ N (0, ) , n n
Quenouille定理
1 ˆ kk ~ N (0, ) , n n
何时可作为截尾?何时为拖尾?
模型定阶的经验方法
95%的置信区间(正态分布2̘σ原则)
2 ˆk Pr n 2 ˆ Pr kk n 2 0.95 n 2 0.95 n
由于S ( )和 ln 都不是 的显式表达式。因而似然 方程组实际上是由p+q+1个超越方程构成,通常需 要经过复杂的迭代算法才能求出未知参数的极大 似然估计值
极大似然估计的特点
优点 极大似然估计充分应用了每一个观察值所提供的信息, 因而它的估计精度高 同时还具有估计的一致性、渐近正态性和渐近有效性 等许多优良的统计性质 缺点 需要已知总体分布
序列自相关图
显然,延迟3期后,虽自相关系数都落在2σ 线内,但却逐渐 的衰减为小值波动,拖尾,平稳 。
所以可考虑拟合模型AR(1)
序列偏自相关图
显然,除延迟1期的偏自相关系数显著大于2σ 线外,其 它突然衰减为小值波动,可认为1阶截尾。
【例3.8】
美国科罗拉多州某一加油站连续57天的OVERSHORT序列
三、ARMA模型
用过去的自己,并考虑到随机干 扰或误差序列来预测自己
1、定义 具有如下结构的模型称为自回归移动 平均模型,简记为ARMA(p,q)
xt 0 1 xt 1 p xt p t 1 t 1 q t q p 0, q 0 2 E ( ) 0 , Var ( ) t t , E ( t s ) 0, s t
c2 4 , c 2 ˆ2 1 12 2 2 , c ˆ1 1 c2 4 ,c 2 2
矩估计
c ˆ ˆ 2 , ˆ 1 1 ˆ 1 c
矩估计的特点:
优点 估计思想简单直观 不需要假设总体分布 计算量小(低阶模型场合) 缺点 信息浪费严重 只依赖p+q个样本自相关系数信息,其他信 息都被忽略 估计精度较差 通常矩估计方法被用作极大似然估计和最小二乘 估计迭代计算的初始值
2 ˆ ˆ 2 1 ˆ 2 ˆ12 1
【例3.11】求MA(1)模型系数的矩估计
xt t 1 t 1 MA(1)模型 由MA(1)协方差函数公式
2 2 (1 ) 1 1 0 1 1 2 2 1 0 1 1 1
2、极大似然估计
原理 极大似然准则:抽取的样本出现概率最大。 因此未知参数的极大似然估计就是使得似然 函数(联合密度函数)达到最大的参数值
~) max{p( x ~); , ,, } ˆ , ˆ ,, ˆ ;x , x L( 1 2 k 1 1 2 k
似然方程
~ n S ( ) ~ ~ 0 2 l ( ; x ) 2 4 2 2 ~ ln 1 S ( ) ~ ~ 1 l ( ; x ) ~ ~ ~ 0 2 2 2
【例3.7】考察ARMA模型的自相关性
ARMA(1,1): xt 0.5xt 1 t 0.8t 直观地考察该模型自相关系数和偏自相关系 数的性质。
样本自相关图
样本偏自相关图
显然,自相关系数和偏自相关系数拖尾
这也是直观选择拟合模型的 常用方法之一
ARMA模型相关性特征:
模型 自相关系数 偏自相关系数
矩估计
ˆ12 1 1 4 ˆ1 ˆ1 2
【例3.12】求ARMA(1,1)模型系数的矩估计
xt 1 xt 1 t 1 t 1 ARMA(1,1)模型 自相关系数与自协方差的关系方程
1 (1 1 )(1 11 ) 1 2 1 0 1 211 2 1 1
【例3.10】求AR(2)模型系数的矩估计
AR(2)模型 xt 1 xt 1 2 xt 2 t Yule-Walker方程 1 1 2 1 2 1 1 2
矩估计(Yule-Walker方程的解)
ˆ2 1 ˆ ˆ1 1 2 ˆ1 1
4、ARMA(p,q)模型的统计性质
均值
自协方差 自相关系数
E ( xt )
1 1 p
2
0
(k ) Gi Gi k
i 0
(k ) (k ) (0)
G G
j 0 j j 0
j k
2 G j
自相关系数和偏自相关系数都具有拖 尾性
序列自相关图
显然,自相关系数拖尾。
所以可考虑拟合模型ARMA(1,1)
序列偏自相关图
显然,偏自相关系数拖尾。
四、参数估计
待估参数(也称模型口径) 非中心化的ARMA(p,q)可转化为 ( B ) xt t ( B ) 有p+q+2个未知参数
常用估计方法: 矩估计 极大似然估计 最小二乘估计
特别当φ 0=0 时,称为中心化ARMA(p,q)模型
系数多项式
引进延迟算子,中心化ARMA(p,q)模型 可简记为 ( B) xt ( B) t
(B) 1 1B 2 B2 p B p
其中p阶自回归系数多项式:
q阶移动平均系数多项式:
(B) 1 1 B 2 B 2 q B q
1 ˆ1 ˆ Dk ... ˆ k -1
由克莱姆法则,解Yule-Walker方程组得到。
三、模型识别 基本原则
ˆk
ˆ kk
P阶截尾
拖尾 拖尾
选择模型
拖尾
q阶截尾 拖尾
AR(P)
MA(q) ARMA(p,q)
一般先通过时序图直观判断序列平稳性,再根据基 本原则选择模型。
模型定阶的困惑:
因样本的随机性,样本的相关系数不会呈现出 完全截尾,本应截尾的自相关或偏自相关系数 仍会呈现出小值振荡; 因平稳时间序列具有短期相关性,随着延迟阶 数无穷大时,自相关或偏自相关系数都会衰减 至0值附近作小值波动;
何时可作为截尾?何时为拖尾? 没有绝对的标准,主要靠经验。有时也利用一 下由两种系数的近似分布推出的结论。
模型定阶的经验方法: 若样本(偏)自相关系数在最初d阶明显大于2 倍标准差,后面几乎 95 %的值都落在 2 倍 标准差范围内,且衰减为小值波动的过程 很突然。这时常视为截尾,截尾阶数为d。
例2.5续
选 择 合 适 的 ARMA 模 型 拟 合 1950 年 — 1998 年北京市城乡居民定期储蓄比例序 列。
二、计算样本相关系数
样本自相关系数
样本偏自相关系数
ˆk
(x
t 1
nk
t
x )(xt k x )
2 ( x x ) t t 1
n
ˆ D k ˆ kk ˆ D
ˆ1 1 ... ˆ k -2 ˆ1 ... ˆ2 ... ... ˆk ... 1 ˆ1 ˆ D ... ˆ k -1 ˆ1 1 ... ˆ k -2 ˆ k -1 ... ˆ k -2 ... ... ˆ1 ...
实际中,为便于计算,很多时候看作服从多元正态分 布
3、最小二乘估计
原理
使残差平方和达到最小的那组参数值即为最 小二乘估计值
n t 1 n
ˆ) 2 Q( t ( xt 1 xt 1 p xt p 1 t 1 q t q )2
AR(P)
MA(q) ARMA(p,q)
拖尾
q阶截尾 拖尾
P阶截尾
拖尾 拖尾
3.3 平稳序列的建模
建模步骤 模型识别 参数估计 模型检验 模型优化
一、建模步骤
平 稳 非 白 噪 声 序 列 计 算 样 本 相 关 系 数
模型 识别
参数 估计
No
模型 检验
模 Yes 型 优 化
序 列 预 测
i 1 i 1 i 1
~
n
n
t
用迭代法,求得使其达最小的参数值。