非线性时间序列的高阶奇异谱分析

非线性时间序列的高阶奇异谱分析
非线性时间序列的高阶奇异谱分析

非线性时间序列的高阶奇异谱分析

袁 坚 肖先赐

(电子科技大学电子工程系,成都 610054)

(1997年8月28日收到)

基于反映线性相关结构的协方差矩阵的奇异谱分析,本质上是一种线性的方法.奇异谱

分析用于吸引子重构的可靠性问题引发了一些争议.本文基于具有盲高斯噪声及体现非线性相关等性质的高阶累积量,提出了一种高阶的奇异谱分析方法.通过对H énon 映射、Logistic 映射和Lorenz 模型的分析说明了该方法的有效性,并在不同的延时、嵌入维数、抽样时间及有噪声的情况下表现出较好的鲁棒性.

PACC :0545

1 引言

对于不同系统产生的不规则动态行为解释为确定性的混沌过程,这一认识在几乎所有学科中得到广泛的应用.而用动力系统方法分析非线性时间序列,状态空间的重构是必不可少的一个步骤.从标量时间序列重构多维状态矢量的延迟坐标法,是在无法观测系统各个变量情况下的一种折衷方法.延迟坐标间不可避免地存在着线性依赖及人为的对称性.Takens 的嵌入定理[1]隐含着无噪声影响,且假设数据长度为无限长.这样对任意的延时都不会导致重构的退化.而实际得到的时间序列是有限长度的,并且不可避免地受到噪声的影响.延时选择过大或过小,都会导致噪声增强[2].另外,当对分析的系统无任何先验认识,无从得知其拓扑维数时,对嵌入维数的选择也成问题.

基于多通道时间序列主元分析的奇异谱分析(singular 2spectrum analysis ,SSA ),最先由Broomhead 和K ing [1]引入非线性动力学领域.该方法一方面将延迟矢量变换到一正交空间里,以消除坐标间的线性依赖及人为的对称性;另一方面在奇异谱上区分出信号成分及噪声平台,在确定出最小嵌入维数的基础上,一个维数等于最小嵌入维数的子空间内的轨迹代表了信噪比增强的重构.

但是,SSA 作为一种线性方法,其所用的协方差矩阵反映出的是线性相关的结构,而无法反映内在的非线性关系.另外,一些实际的分析结果更加深了对这一方法的质疑[3—5].文献[2,6,7]对奇异谱方法作了详尽的分析和确认工作.并且针对Palu 等[5]用SSA 研究H énon 和Lorenz 模型所提出的质疑,文献[8,9]中分别指出了这是由于重构窗口(包括延时和嵌入维数)选择不当而导致的错误理解.我们在工作中也发现,在选择合适的重构窗口前提下,Lorenz 模型的奇异谱分析是成功的[10].然而对H énon 模型无论选择怎样的重构窗口,分析出的奇异谱都无法得到满意的结果[3,5].

奇异谱分析所用的属于二阶统计的协方差矩阵,体现的是线性相关.高阶统计作为一

第47卷第6期1998年6月

100023290/98/47(6)/0897209物 理 学 报ACTA PHYSICA SIN ICA Vol.47,No.6,J une ,1998ν1998Chin.Phys.S oc.

898物 理 学 报47卷

种非线性的信号处理工具,可以反映高阶相关的非线性关系[11,12].从高阶统计的角度认识混沌,不仅可以开发出更多的信息,而且也有助于从一个新的角度认识该现象.高阶统计具有盲高斯噪声及体现非线性结构等性质,但与研究比较完善的二阶统计相比,尚缺少物理性质的解释.而将其引入动力系统理论,更存在着用动力学语言难以描述的问题.高阶统计用于混沌动力学研究的文献很少,见到的一篇是用高阶累积量估计重构延时[13],另一篇是利用三阶谱鉴别观测信号是否达到混沌状态[14].而作为一种数字信号处理的新手段,高阶统计在信号处理的各个领域得到了广泛的应用[11].其中,阵列测向中用四阶累积量进行奇异值分解(SVD),得到四阶子空间进行方向估计,比二阶的方法有着一些明显特点[15].由此也引发我们用高阶累积量分析混沌序列的高阶奇异谱分析的思路.

本文提出了一种基于高阶累积的高阶奇异谱分析(H2SSA)方法.对Hénon,Lorenz和Logistic等模型的分析说明,H2SSA是比SSA更加有效的方法,同时在不同延时、嵌入维数、抽样时间及有噪声的情况下表现出一定的鲁棒性.

2 吸引子的重构方法

若维数相差很大的动力系统的渐近动态行为限制在相同维数的吸引子流形上,则它们有可能属于同一等价类型.这构成了将定性的动力学特点引入实验领域的技术基础.对

一个动力系统d z

=F(z),我们将Takens的嵌入定理[1]叙述如下.

d t

定理(T akens) 设M是n维的紧流形.F表示一个光滑的(C2)矢量场,v为M 上的一个光滑函数.则ΦF,v:M→R2n+1,表示ΦF,v(z)=(v(z),v(φ1(z)),…, v(φ2n(z)))T是一个嵌入.这φi是F的流.

v(z)对应着系统状态为z(∈M)时的观测值.包含着像ΦF,v(M)的空间称作嵌入空间,嵌入空间的维数称作嵌入维数,应用Takens定理重构状态空间的方法称作延迟坐标法.

延迟坐标是由时间序列构造出的多维状态空间矢量.对一个N点的时间序列{x(1),x(2),…,x(N)},离散时刻i上的重构状态矢量为

X i=[x(i) x(i+J) … x(i+(m-1)J)]T,(1)其中J为重构延时,m为嵌入维数.相应的重构轨迹为

X=[X1 X2 … X K],(2)其中K=N-(m-1)J.

Takens定理对重构延时的选择没有任何指导性的建议.这一定理隐含着无噪声影响,且假设数据长度为无限长,这样对任意的J都不会导致重构的退化.而实际得到的时间序列既不可避免地受到噪声的影响,又是有限长度的.延时J过小,由测量误差(包括量化误差)引起的冗余误差相应地增大;适当地增加延时,测量误差的影响减小,而依赖于系统初值敏感性的动态误差的影响相应地增大[2].另外,当对分析的系统没有任何先验的认识,无从得知其拓扑维数n时,嵌入维数m的选择也成问题.数值分析的结果表明[7,10],J和m的选择一定程度上可归结为重构延时窗口(m-1)J的选择问题.但这一

问题目前在理论上尚未得到根本的解决.

延迟坐标并不是正交的,而奇异谱分析将嵌入空间变换到一个等价的正交坐标系中.一方面可以消除延迟坐标间的线性依赖及人为的对称性[1];另一方面在奇异谱上区分出信号成分及噪声平台,一个维数等于最小嵌入维数的子空间内的轨迹代表了信噪比增强的重构.若A x 表示X 的协方差矩阵,则

A x =X ?X T ,(3)

其中A x ∈R m ×m ,其元素为相关函数,即(A x )ij =R x [(i -j )J ],(4)

R x (k J )=lim T →∞12T ∫T

-T x (t )x (t +k J )d t ,(5)其中k =0,1,…,m -1.将A x 变换为一个对角阵Σ2,即

Σ2=V T ?A x ?V ,(6)

其中V 为m ×m 的正交阵,其每列为相应的特征矢量,构成了一个自然的正交坐标系.而Σ2={δi ,j s i ;i ,j =1,2,…,m }.m 个由大至小的特征值{s i ,i =1,2,…,m }就构成了奇异谱.

奇异谱中几个较大的特征值代表了信号的成分,而其余的特征值构成了一个所谓的噪声平台.将几个较大特征值对应的子空间分割出来,就能达到改善重构的目的.但是改变m 或J ,会引起X 的改变,相应地会改变奇异谱.这一点导致了文献[5]中对Lorenz 模型分析的误解.同时也说明了奇异谱分析对m 和J 的变化不够稳健.另外,作为一种线性的方法对H énon 等模型分析失败[3,5]等原因,都促使我们寻求更好的分析方法.

由(4),(5)式可以看出,奇异谱分析是在二阶平稳假设的前提下进行的.分析各种动力学不变量,如维数、K olmogorov 熵以及Lyapunov 特征指数等,也需要在微分动力系统的各态历经理论基础上作出假设[16].其实状态空间重构本身就有微分等价的假设条件.我们在讨论高阶奇异谱分析中,也需要引入高阶平稳的假设.

3 高阶统计及高阶奇异谱分析

高阶统计作为一种非线性信号处理的手段已经得到了广泛的应用[11].高阶统计包括高阶矩、高阶矩谱、高阶累积量及高阶谱.高阶指的是大于二阶的情况.高阶统计在信号处理中的应用背景主要出于各种技术上的需要.如压制信号中附加的高斯色噪声、识别和重构非最小相位信号、提取偏离高斯的信息、检测和特征化信号的非线性以及对非线性系统的识别问题等[12].

首先,高阶累积量及其相应的高阶谱对高斯白噪声和高斯色噪声都为零,即具有盲高斯的性质.这样对非高斯信号中存在加性高斯噪声的情况,高阶累积量和高阶谱仅反映出信号的特征.这对信号的检测和特征提取是非常有用的.其次,高阶累积量和高阶矩的谱同时保存着信号的幅度和相位的信息.而二阶统计中却往往无法做到,只有当信号是最小相位时才能够得到相位信息.因而从信息获取的角度来看,高阶统计中保存了更多的信息.另外,从信号角度来看,实际观测的信号基本上都是非高斯的.结合以上的特点,这对

9986期袁 坚等:非线性时间序列的高阶奇异谱分析

009物 理 学 报47卷

信号的分析是很重要的.还有,在对系统非线性的分析上,高阶统计也表现出自身的天然特性,如三阶的情况体现出二阶相关,四阶体现三阶相关,而二阶反映的是一阶(线性)相关[14].由此,我们已不难看出高阶统计用于混沌动力学所具有的巨大潜力.

对{x(k)},k=0,±1,±2,±3,…,为一个实的平稳时间序列,若阶数至n的矩都存在,则

m x n(τ1,τ2,…,τn-1)△=E{x(k)x(k+τ1)…x(k+τn-1)}(7)表示该平稳信号的n阶矩函数.显然二阶矩函数就是信号的自相关函数.而非高斯平稳信号的n阶累积量函数(在此仅限n=3或4)为

C x n(τ1,τ2,…,τn-1)=m x n(τ1,τ2,…,τn-1)-m G n(τ1,τ2,…,τn-1),(8)其中m G n(τ1,τ2,…,τn-1)是与x(k)具有相同均值和自相关序列的一个等价高斯信号的n阶矩函数.可以看出,若x(k)为一高斯信号,则m x n(τ1,τ2,…,τn-1)=m G n(τ1,τ2,…,τ

),而使C x n(τ1,τ2,…,τn-1)=0.虽然在(8)式中规定n=3或4,但对所有的n而言, n-1

若x(k)为高斯信号,都有C x n(τ1,τ2,…,τn-1)=0的性质.累积量还具有一些别的性质,有兴趣可参阅文献[12]中的表2.

一阶累积量表示的是信号的均值m x1,二阶累积量函数为协方差函数,三阶累积量函数为[12]

C x3(τ1,τ2)=m x3(τ1,τ2)-m x1[m x2(τ1)+m x2(τ2)+m x2(τ1-τ2)]+2(m x1)3,(9)而四阶累积量函数为

C x4(τ1,τ2,τ3)=m x4(τ1,τ2,τ3)-m x2(τ1)?m x2(τ3-τ2)

-m x2(τ2)?m x2(τ3-τ1)-m x2(τ3)?m x2(τ2-τ1)

-m x1[m x3(τ2-τ1,τ3-τ1)+m x3(τ2,τ3)

+m x3(τ1,τ3)+m x3(τ1,τ2)]

+(m x1)2?[m x2(τ1)+m x2(τ2)+m x2(τ3)+m x2(τ3-τ1)

+m x2(τ3-τ2)+m x2(τ2-τ1)]-6(m x1)4.(10)另外,在均值m x1=0的情况下,则C x3(0,0)称作偏态,反映偏离对称的性质;C x4(0,0,0)称作峰态,反映偏离高斯的性质;而C x2(0)体现的是方差.

累积量具有盲高斯的性质,而又以四阶累积量用得最多.这是因为三阶累积量在信号是对称分布的情况下为零,而使三阶累积量的应用相对要少一些.三阶累积量函数有两个变量,可以反映在一个平面上;四阶累积量函数有三个变量,只能体现在一个三维的空间里.高于四阶的累积量就更加复杂了.高阶谱为高阶累积量的多维傅里叶变换.一个在频域,一个在时域,有着一定的对等关系.我们在此选择四阶累积量作为将奇异谱分析扩展到高阶的工具.

由(4)和(5)式可以看出,构成矩阵A x的元素是二阶矩函数,反映的是线性依赖的关系.我们可以将A x的元素推广为由高阶矩函数构成,以反映高阶相关的非线性关系.而累积量函数比同样阶数的矩函数所具备的优势,使我们很自然地选择用累积量函数来构造矩阵A x的元素.若是我们选择四阶累积量函数,考虑到它是一个具有三个变量的函

数,要作SVD 就需要将其变为一个二元的函数.最常规的作法是作一个切片,这样的切片有许多形式,如在(10)式中设τ2=τ3,则

C x 4(τ1,τ2,τ3)=m x 4(τ1,τ2,τ2)-m x 2(τ1)?m x 2(0)

-m x 2(τ2)?m x 2(τ2-τ1)-m x 2(τ2)?m x 2(τ2-τ1)

-m x 1[m x 3(τ2-τ1,τ2-τ1)+m x 3(τ2,τ2)+2m x 3(τ1,τ2)]

+(m x 1)2?[m x 2(τ1)+2m x 2(τ2)

+2m x 2(τ2-τ1)+m x 2(0)]-6(m x 1)4.(11)

以(11)式就可以构造出A x ,其元素为

(A x )i ,j =C x 4(i ,j ,j ),(12)

其中i ,j =1,2,…,m.m 为嵌入维数.

对A x 进行SVD ,得到的奇异谱我们称作高阶奇异谱,相应分析方法就是H 2SSA .我们将在下节用多种混沌模型说明该方法在分析信号成分和噪声平台上的有效性,并通过加入噪声和改变延时、嵌入维数和抽样时间来说明其鲁棒性.

4 模拟实验

我们在此选取三种混沌模型,其拓扑维数分别为1—3,以便有一个比较.另外,分析中数据长度N 均为1000,(14),(15)式中均取x 变量.

Logistic 映射定义为

x n +1=μx n (1-x n ),(13)

其中μ=410.

H énon 映射定义为

x n +1=y n +1-ax 2n ,

y n +1=bx n ,(14)

其中a =114,b =013.

Lorenz 模型定义为

x ?=σ(y -x ),

y ?=x (R -z )-y ,

z ?=xy -bz ,(15)

其中σ=1610,R =45192,b =410.采用四阶龙格2库塔法解方程.抽样时间Δt =0101s .

图1中(a ),(c ),(e )和(g )分别为嵌入维数m =20,延时J 取2,4,8和12时,H énon 映射的SSA 所得到的奇异谱(用最大的特征值进行过归一化处理,以下同).图1中(b ),(d ),(f )和(h )分别为m =20,J 取2,4,8和12时H 2SSA 得到的高阶奇异谱.比较这两种分析方法的结果可以看出,在保持嵌入维数不变同时改变延时的情况下,SSA 得到的奇异谱不能反映出H énon 映射的二维特征,而高阶奇异谱在不同的延时下均能反映出来.

图2中(a )和(c )分别为m =10和30,J =2时H énon 映射的奇异谱.图2中(b )和(d )

1096期袁 坚等:非线性时间序列的高阶奇异谱分析

 图1 Hénon映射在m=20,J=2,4,8,12时的奇异谱(a),(c),(e),(g)

 和高阶奇异谱(b),(d),(f),(h)

分别为m=10和30,J=2时的高阶奇异谱.可以看出,在不同的嵌入维数下高阶奇异谱更好地反映出Hénon映射的维数特征.

在奇异谱分析中相对比较成功的Logistic映射和Lorenz模型的奇异谱如图3中(a)和(c)所示.这里对Logistic映射取m=20,J=1,而Lorenz模型取m=50,J=1.在同样的嵌入维数和延时情况下,Logistic和Lorenz模型的高阶奇异谱如图3中(b)和(d)所示.可以看出,这两种模型在得到满意的奇异谱参数情况下,它们的高阶奇异谱同样得到了有209物 理 学 报47卷

效结果,能够分析反映出一维和三维的特征

.

 图2 H énon 映射在m =10和30,J =2时的奇异谱(a ),(c )和高阶奇异谱(b ),(d

)

 图3 Logistic 映射在m =20,J =1时的奇异谱(a )和高阶奇异谱(b );

 Lorenz 模型在m =50,J =1时的奇异谱(c )和高阶奇异谱(d )

为了说明有噪声情况下的分析结果,图4(a ),(b )和(c )为叠加高斯白噪声使信噪比为0dB 时,H énon (m =20,J =2),Lorenz (m =50,J =1)和Logistic (m =20,J =1)的高阶

3096期袁 坚等:非线性时间序列的高阶奇异谱分析

奇异谱.可以看出H2SSA所具有的压制高斯噪声的优点,而高斯噪声却又是最普通的一类噪声,这对实际分析是非常有用的.

为了说明改变抽样时间的情况,对Lorenz模型取抽样时间Δt=010025s(在文献[5]中曾用该抽样时间说明奇异谱分析的失败),并仍取m=50,J=1,其高阶奇异谱如图4 (d)所示.可以看出,在改变抽样时间的情况下,Lorenz的高阶奇异谱没有什么变化.

由以上对Hénon,Logistic和Lorenz模型的分析可以看出,高阶奇异谱分析是一种有效的方法.并且在改变延时、嵌入维数和抽样时间及有噪声影响的情况下,表现出了一定的鲁棒性.由高阶奇异谱,我们可以有效地确定出最小嵌入维数,从而用维数等于最小嵌入维数的子空间里的轨迹体现有效的重构

.

图4 叠加高斯白噪声使信噪比为0dB时的高阶奇异谱 (a)为Hénon(m=20,

J=2),(b)为Lorenz(m=50,J=1),(c)为Logistic(m=20,J=1),(d)为Lorenz

模型在抽样时间为010025s时(m=50,J=1)

5 结论与讨论

本文提出了一种高阶奇异谱分析方法,这种方法比线性的奇异谱分析表现出更好的有效性和鲁棒性.这种方法是用了阵列测向中四阶累积量的四阶子空间方法的思路,与之不同之处在于阵列测向中用的是多元序列,而这里所用的是标量时间序列.由此不难看出,正如SSA可用到多元时间序列分析而形成M2SSA方法[9],H2SSA也可推广到对多元时间序列的分析.我们在(11)式中体现的仅是四阶累积量的一个切片,尚有大量的切片未曾用上.而利用这些冗余的信息,可能为有噪声和短数据的时间序列的分析提供一个有效的方法.还有本文中并未用上高阶谱,从频域的角度进行分析可能也会找到新的认识.高阶统计尚缺少二阶统计中合理的物理解释.然而用高阶统计这一非线性手段分析非线性409物 理 学 报47卷

动力系统,相信会使我们对非线性现象的认识更加深入.

[1] D.S.Broomhead ,G.P.K ing ,Physica ,D20(1986),217.

[2] M.Casdagli ,S.Eubank ,J.D.Farmer et al.,Physica ,D51(1991),52.

[3] A.I.Mees ,P.E.Rapp ,L.S.Jennings ,Phys.Rev.,A36(1987),340.

[4] A.M.Fraser ,Physica ,D34(1989),391.

[5] M.Palu ,I.Dvo ˇr ák ,Physica ,D55(1992),221.

[6] R.Vautard ,P.Y iou ,M.Ghil ,Physica ,D58(1992),95.

[7] J.F.G ibson ,J.D.Farmer ,M.Casdagli et al.,Physica ,D57(1992),1.

[8] K.Fraedrich ,R.Wang ,Physica ,D65(1993),373.

[9] P.L.Read ,Physica ,D69(1993),353.

[10] Yuan Jian ,Xiao Xian 2ci ,Acta Physica Si nica ,46(1997),1290(in Chinese ).

[11] J.M.Mendel ,Proceedi ngs of the I EEE ,79(3)(1991),277.

[12] C.L.Nikias ,J.M.Mendel ,I EEE Signal Processi ng M agazi ng ,10(7)(1993),10.

[13] A.M.Albano ,A.Passamante ,M.E.Farrell ,Physica ,D54(1991),85.

[14] T.S.Rao.Analysis of Nonlinear Time Series (and Chaos )by Bispectral Methods ,in :Nonlinear Modeling and Forecast 2

ing ,SFI Studies in the Sciences of Complexity ,Proc.Vol.XII ,eds.M.Casdagli ,S.Eubank (Addison 2Wesley ,1992),pp.199—225.

[15] B.Porat ,B.Fridlander ,I EEE T rans.on Signal Processi ng ,39(9)(1991),2016.

[16] J.P.Eckman ,D.Ruelle ,Rev.Mod.Phys.,57(3)(1985),617.

HIGHER 2OR DER SINGU LAR 2SPECTRUM ANALYSIS OF

NON L INEAR TIME SERIES

Y UAN J IAN X IAO X IAN 2CI

(Depart ment of Elect ronic Engineering ,U niversity of Elect ronic Science

and Technology of China ,Chengdu 610054)

(Received 28August 1997)

A BSTRACT

Singular 2spectrum analysis (SSA )is essentially a linear method based on the covariance matrix which reflects the structrue of the linear dependence.Numerical experience ,however ,led several au 2thors to express some doubts about reliability of SSA in the attractor reconstruction.In this paper ,based on higher 2order cumulants which are blind to any kind of G aussian process and can be used for analyzing the nonlinear correlation ,a new notion of higher 2order singular 2spectrum analysis (H 2SSA )is proposed.We illustrate our technique with numerical data from H énon map ,Logistic map and Lorenz model ,and show that H 2SSA is robust to reconstruction delay ,embedding dimension and sampling time ,and to the effect of the additive noise.

PACC :05455096期袁 坚等:非线性时间序列的高阶奇异谱分析

时间序列分析——最经典的

【时间简“识”】 说明:本文摘自于经管之家(原人大经济论坛) 作者:胖胖小龟宝。原版请到经管之家(原人大经济论坛) 查看。 1.带你看看时间序列的简史 现在前面的话—— 时间序列作为一门统计学,经济学相结合的学科,在我们论坛,特别是五区计量经济学中是热门讨论话题。本月楼主推出新的系列专题——时间简“识”,旨在对时间序列方面进行知识扫盲(扫盲,仅仅扫盲而已……),同时也想借此吸引一些专业人士能够协助讨论和帮助大家解疑答惑。 在统计学的必修课里,时间序列估计是遭吐槽的重点科目了,其理论性强,虽然应用领域十分广泛,但往往在实际操作中会遇到很多“令人发指”的问题。所以本帖就从基础开始,为大家絮叨絮叨那些关于“时间”的故事! Long long ago,有多long估计大概7000年前吧,古埃及人把尼罗河涨落的情况逐天记录下来,这一记录也就被我们称作所谓的时间序列。记录这个河流涨落有什么意义当时的人们并不是随手一记,而是对这个时间序列进行了长期的观察。结果,他们发现尼罗河的涨落非常有规律。掌握了尼罗河泛滥的规律,这帮助了古埃及对农耕和居所有了规划,使农业迅速发展,从而创建了埃及灿烂的史前文明。

好~~从上面那个故事我们看到了 1、时间序列的定义——按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。 2、时间序列分析的定义——对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。 既然有了序列,那怎么拿来分析呢 时间序列分析方法分为描述性时序分析和统计时序分析。 1、描述性时序分析——通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析 描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。 2、统计时序分析 (1)频域分析方法 原理:假设任何一种无趋势的时间序列都可以分解成若干不同频率的周期波动 发展过程: 1)早期的频域分析方法借助富里埃分析从频率的角度揭示时间序列的规律 2)后来借助了傅里叶变换,用正弦、余弦项之和来逼近某个函数 3)20世纪60年代,引入最大熵谱估计理论,进入现代谱分析阶段 特点:非常有用的动态数据分析方法,但是由于分析方法复杂,结果抽象,有一定的使用局限性 (2)时域分析方法

利用Excel进行时间序列的谱分析

利用Excel 进行时间序列的谱分析(I ) 在频域分析中,功率谱是揭示时间序列周期特性的最为有力的工具之一。下面列举几个例子,分别从不同的角度识别时间序列的周期。 1 时间序列的周期图 【例1】某水文观测站测得一条河流从1979年6月到1980年5月共计12月份的断面平均流量。试判断该河流的径流量变化是否具有周期性,周期长度大约为多少? 分析:假定将时间序列x t 展开为Fourier 级数,则可表示为 ∑=++=k i t i i i i t t f b t f a x 1 )2sin 2cos (εππ (1) 式中f i 为频率,t 为时间序号,k 为周期分量的个数即主周期(基波)及其谐波的个数,εt 为标准误差(白噪声序列)。当频率f i 给定时,式(1)可以视为多元线性回归模型,可以证明,待定系数a i 、b i 的最小二乘估计为 ∑∑====N t i t i N t i t i t f x N b t f x N a 1 12sin 2?2cos 2?ππ (2) 这里N 为观测值的个数。定义时间序列的周期图为 )(2 )(22 i i i b a N f I += ,k i ,,2,1 = (3) 式中I (f i )为频率f i 处的强度。以f i 为横轴,以I (f i )为纵轴,绘制时间序列的周期图,可以在最大值处找到时间序列的周期。对于本例,N =12,t =1,2,…,N ,f i =i /N ,下面借助Excel ,利用上述公式,计算有关参数并分析时间序列的周期特性。 第一步,录入数据,并将数据标准化或中心化(图1)。 图1 录入的数据及其中心化结果

统计基础知识第五章时间序列分析习题及答案

第五章时间序列分析 一、单项选择题 1.构成时间数列的两个基本要素是( C )(2012年1月) A.主词和宾词 B.变量和次数 C.现象所属的时间及其统计指标数值 D.时间和次数 2.某地区历年出生人口数是一个( B )(2011年10月) A.时期数列 B.时点数列 C.分配数列 D.平均数数列 3.某商场销售洗衣机,2008年共销售6000台,年底库存50台,这两个指标是( C ) (2010年10) A.时期指标 B.时点指标 C.前者是时期指标,后者是时点指标 D.前者是时点指标,后者是时期指标 4.累计增长量( A ) (2010年10) A.等于逐期增长量之和 B.等于逐期增长量之积 C.等于逐期增长量之差 D.与逐期增长量没有关系 5.某企业银行存款余额4月初为80万元,5月初为150万元,6月初为210万元,7月初为160万元,则该企业第二季度的平均存款余额为( C )(2009年10) 万元万元万元万元 6.下列指标中属于时点指标的是( A ) (2009年10) A.商品库存量 B.商品销售量 C.平均每人销售额 D.商品销售额 7.时间数列中,各项指标数值可以相加的是( A ) (2009年10) A.时期数列 B.相对数时间数列 C.平均数时间数列 D.时点数列 8.时期数列中各项指标数值( A )(2009年1月) A.可以相加 B.不可以相加 C.绝大部分可以相加 D.绝大部分不可以相加 10.某校学生人数2005年比2004年增长了8%,2006年比2005年增长了15%,2007年比2006年增长了18%,则2004-2007年学生人数共增长了( D )(2008年10月) %+15%+18%%×15%×18% C.(108%+115%+118%)-1 %×115%×118%-1 二、多项选择题 1.将不同时期的发展水平加以平均而得到的平均数称为( ABD )(2012年1月) A.序时平均数 B.动态平均数 C.静态平均数 D.平均发展水平 E.一般平均数2.定基发展速度和环比发展速度的关系是( BD )(2011年10月) A.相邻两个环比发展速度之商等于相应的定基发展速度 B.环比发展速度的连乘积等于定基发展速度

非线性时间序列

近代时间序列分析选讲: 一. 非线性时间序列 二. GARCH模型 三. 多元时间序列 四. 协整模型

非线性时间序列 第一章.非线性时间序列浅释 1.从线性到非线性自回归模型 2.线性时间序列定义的多样性第二章. 非线性时间序列模型 1. 概述 2. 非线性自回归模型 3.带条件异方差的自回归模型 4.两种可逆性 5.时间序列与伪随机数 第三章.马尔可夫链与AR模型 1. 马尔可夫链 2. AR模型所确定的马尔可夫链 3. 若干例子 第四章. 统计建模方法 1. 概论 2. 线性性检验 3.AR模型参数估计 4.AR模型阶数估计 第五章. 实例和展望 1. 实例 2.展望

第一章.非线性时间序列浅释 1. 从线性到非线性自回归模型 时间序列{x t}是一串随机变量序列, 它有广泛的实际背景, 特别是在经济与金融领域中尤其显著. 关于它们的从线性与非线性概念, 可从以下的例子入手作一浅释的说明. 考查一阶线性自回归模型---LAR(1): x t=αx t-1+e t, t=1,2,…(1.1) 其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, 而且e t与{x t-1,x t-1,…}独立. 反复使用(1.1)式的递推关系, 就可得到 x t=αx t-1+e t = e t + αx t-1 = e t + α{ e t-1 + αx t-2} = e t + αe t-1 + α2 x t-2 =… = e t + αe t-1 + α2e t-2

+…+ αn-1e t-n+1 +αn x t-n. (1.2) 如果当n→∞时, αn x t-n→0, (1.3) {e t+αe t-1+α2e t-2+…+αn-1e t-n+1} →∑j=0∞αj e t-j . (1.4) 虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是, 对以上的简单模型, 不难相信, 当|α|<1时, (1.3)(1.4)式成立. 于是, 当|α|<1时, 模型LAR(1)有平稳解, 且可表达为 x t=∑j=0∞αj e t-j . (1.5) 通过上面叙述可见求LAR(1)模型的解有简便之优点, 此其一. 还有第二点, 容易推广到LAR(p)模型. 为此考查如下的p阶线性自回归模型LAR(p):

时间序列分析方法第章谱分析

第六章 谱分析 Spectral Analysis 到目前为止,t 时刻变量t Y 的数值一般都表示成为一系列随机扰动的函数形式,一般的模型形式为: 我们研究的重点在于,这个结构对不同时点t 和τ上的变量t Y 和τY 的协方差具有什么样的启示。这种方法被称为在时间域(time domain)上分析时间序列+∞ ∞-}{t Y 的性质。 假设+∞ ∞-}{t Y 是一个具有均值μ的协方差平稳过程,第j 个自协方差为: 假设这些自协方差函数是绝对可加的,则自协方差生成函数为: 这里z 表示复变量。将上述函数除以π2,并将复数z 表示成为指数虚数形式)ex p(ωi z -=,1-=i ,则得到的结果(表达式)称为变量Y 的母体谱:

注意到谱是ω的函数:给定任何特定的ω值和自协方差j γ的序列+∞ ∞-}{j γ,原则上都可 以计算)(ωY s 的数值。 利用De Moivre 定理,我们可以将j i e ω-表示成为: 因此,谱函数可以等价地表示成为: 注意到对于协方差平稳过程而言,有:j j -=γγ,因此上述谱函数化简为: ω的下面我们考虑)1(MA 过程, 此时:z z θψ+=1)(,则母体谱为: 可以化简成为: 显然,当0>θ时,谱函数)(ωY s 在],0[π内是ω的单调递减函数;当0<θ时,谱函数)(ωY s 在],0[π内是ω的单调递增函数。

对)1(AR 过程而言,有: 这时只要1||<φ,则有:)1/(1)(z z φψ-=,因此谱函数为: 该谱函数的性质为:当0>φ时,谱函数)(ωY s 在],0[π内是ω的单调递增函数;当0<φ时,谱函数)(ωY s 在],0[π内是ω的单调递减函数。 一般地,对),(q p ARMA 过程而言: ) (ωY s 利用上述谱公式,可以实现谱函数与自协方差函数之间的转换。 解释母体谱函数 假设0=k ,则利用命题6.1可以得到时间序列的方差,即0γ,计算公式为: 根据定积分的几何意义,上式说明母体谱函数在区间],[ππ-内的面积就是0γ,也就是过程的方差。

非线性时间序列模型的波动性建模(中)

非线性时间序列模型的波动性建模 Song-Yon Kim and Mun-Chol Kim 朝鲜平壤金日成综合大学数学学院 本文出自于2011年5日朝鲜平壤举行的第一届PUST国际会议 本版修订于2013年11月3日 摘要:在本文中的非线性时间序列模型被用来描述金融时间序列数据的波动。描述两种由波动的非线性时间序列组合成TAR(阈值自回归模型)与AARCH(非对称自回归条件异方差 模型)的误差项和参数估计的研究。 关键词:非线性时间序列模型;波动;ARCH(自回归条件异方差模型);AARCH;TAR;QMLE(拟极大似然估计) 一介绍 在金融市场中,资产价格的波动是一个极其重要的变量,其建模在投资,货币政策,金融风险管理等方面中有重要意义 在投资持有期的资产价格波动的一个很好的预测是评价投资风险的一个很好的起点。资产价格波动是金融衍生证券定价的最重要的变量。对于定价我们需要知道的波动性范围是从现在相关资产,直至期权到期。事实上,市场惯例是根据波动单位列出价格期权。如今,波动性的定义和测量可能在衍生工具合约明确规定。在这些新的合同,波动成为潜在的“资产”。波动率模型已成为一个在金融时间序列模型分析的主要对象并且使许多科学家沉浸其中。

其中σ称为波动,在上面的公式中所示,σ准确估计成为期权定价和估计的一个非常重要的问题。此外,如对关联时间t 的波动σt 的估计等问题开始提出。 1982,罗伯特恩格尔提出了一个新的模型来用一个更准确的方法[ 7 ]对波动作出估计。他重视ARCH 模型中的误差项,这是大多线性时间序列模型如AR 、ARMA 、ARIMA 等所忽略的。同时他提出一种新的非线性模型,通过相加取代简单的白噪声,误差项的条件异方差性偏差的变化自动回归。误差项的条件异方差性偏差的 自动回归 1986年,Bollerslev 将Engle 的 ARCH (q)模型修改变为GARCH (p, q) model [8]. ???? ???++==∑∑==--q i p i i t i i t i t t t t t h h d i i z h z 112021..:,βεααε 在他的论文中,他提出了GARCH (1,1)过程中的存在,静止状态和MLE (最大似然估计)。 此后,大量ARCH 模型相继被开发出来,例如ARCH-M ,IGARCH 和LogGARCH 等。 在整个研究中,波动性已被证明是更受“坏消息”,而不是“好消息”的影响,也就是说,是不对称的,这导致对非对称模型的研究。 1991年,Nelson 提出了指数GARCH 模型(EGARCH )描述了不对称冲击。[ 6 ] () ()()x E x x x g g h t t t -+=-+-+=λωεγγ11h 10 但在许多研究论文,有效的参数估计和固定的条件是没有明确解释的,而且这种困难难以克服[ 9 ]。 但在1993,Glosten 开始使用阈值自回归条件异方差(TARCH )模型和其后提出的许多非对称模型[ 2 ],试图对不对称的波动进行建模。 特别是在2003年,Wai Mi Bei 开发了非对称ARCH (q )模型[ 10 ]。 ()∑∑==---+++=q i p j j t j i t i i t i t h 1120H γεβεαα 直到现在,持续的研究正在努力拟出更好的波动模型以显示各种ARCH 模型的影响。 在本文中,利用非线性时间序列模型的波动性建模是基于对前人研究成果分析的观察而得出。

时间序列分析法原理及步骤

时间序列分析法原理及步骤 ----目标变量随决策变量随时间序列变化系统 一、认识时间序列变动特征 认识时间序列所具有的变动特征, 以便在系统预测时选择采用不同的方法 1》随机性:均匀分布、无规则分布,可能符合某统计分布(用因变量的散点图和直方图及其包含的正态分布检验随机性, 大多服从正态分布 2》平稳性:样本序列的自相关函数在某一固定水平线附近摆动, 即方差和数学期望稳定为常数 识别序列特征可利用函数 ACF :其中是的 k 阶自 协方差,且 平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋于 0, 前者测度当前序列与先前序列之间简单和常规的相关程度, 后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。实际上, 预测模型大都难以满足这些条件, 现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。 二、选择模型形式和参数检验 1》自回归 AR(p模型

模型意义仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量互相独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性的比你更造成的困难用 PACF 函数判别 (从 p 阶开始的所有偏自相关系数均为 0 2》移动平均 MA(q模型 识别条件

平稳时间序列的偏相关系数和自相关系数均不截尾,但较快收敛到 0, 则该时间序列可能是 ARMA(p,q模型。实际问题中,多数要用此模型。因此建模解模的主要工作时求解 p,q 和φ、θ的值,检验和的值。 模型阶数 实际应用中 p,q 一般不超过 2. 3》自回归综合移动平均 ARIMA(p,d,q模型 模型含义 模型形式类似 ARMA(p,q模型, 但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用 ARMA(p,q模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中 d (差分次数一般不超过 2. 模型识别 平稳时间序列的偏相关系数和自相关系数均不截尾,且缓慢衰减收敛,则该时间序列可能是 ARIMA(p,d,q模型。若时间序列存在周期性波动, 则可按时间周期进

非线性时间序列.doc

-------------精选文档 ----------------- 近代时间序列分析选讲: 一. 非线性时间序列 二. GARCH 模型 三. 多元时间序列 四. 协整模型

-------------精选文档 ----------------- 非线性时间序列 第一章 .非线性时间序列浅释 1.从线性到非线性自回归模型 2.线性时间序列定义的多样性第二章 . 非线性时间序列模型 1.概述 2.非线性自回归模型 3.带条件异方差的自回归模型 4.两种可逆性 5.时间序列与伪随机数 第三章 . 马尔可夫链与 AR 模型 1.马尔可夫链 2.AR 模型所确定的马尔可夫链

-------------精选文档 ----------------- 3.若干例子 第四章 . 统计建模方法 1.概论 2.线性性检验 3.AR 模型参数估计 4.AR 模型阶数估计 第五章 . 实例和展望 1.实例 2.展望 第一章 .非线性时间序列浅释 1.从线性到非线性自回归模型 时间序列 {x t } 是一串随机变量序列 , 它有广泛的实际背景 , 特别是在经济与金融

-------------精选文档 ----------------- 领域中尤其显著. 关于它们的从线性与非线 性概念 , 可从以下的例子入手作一浅释的说 明. 考查一阶线性自回归模型---LAR(1): x t = x t-1 +e t ,t=1,2, (1.1) 其中 {e t } 为i.i.d.序列,且Ee t =0, Ee t = 2 <, 而且e t与 {x t-1 ,x t-1 ,} 独立 . 反复使用 (1.1) 式的递推关系 , 就可得到 x t =x t-1 +e t =e =e =e t t t +x t-1 +{ e t-1 +x t-2 } +e t-1 + 2 x t-2

(时间管理)时间序列分析方法第章谱分析

(时间管理)时间序列分析方法第章谱分析

第六章谱分析SpectralAnalysis 到目前为止,时刻变量的数值壹般均表示成为壹系列随机扰动的函数形式,壹般的模型形式为: 我们研究的重点于于,这个结构对不同时点和上的变量和的协方差具有什么样的启示。这种方法被称为于时间域(timedomain)上分析时间序列的性质。 于本章中,我们讨论如何利用型如和的周期函数的加权组合来描述时间序列数值的方法, 这里表示特定的频率,表示形式为: 上述分析的目的于于判断不同频率的周期于解释时间序列性质时所发挥的重要程度如何。如此方法被称为频域分析(frequencydomainanalysis)或者谱分析(spectralanalysis)。 我们将要见到,时域分析和频域分析之间不是相互排斥的,任何协方差平稳过程既有时域表示,也有频域表示,由壹种表示能够描述的任何数据性质,均能够利用另壹种表示来加以体现。对某些性质来说,时域表示可能简单壹些;而对另外壹些性质,可能频域表示更为简单。 §6.1 母体谱 我们首先介绍母体谱,然后讨论它的性质。 6.1.1 母体谱及性质 假设是壹个具有均值的协方差平稳过程,第个自协方差为: 假设这些自协方差函数是绝对可加的,则自协方差生成函数为: 这里表示复变量。将上述函数除以,且将复数表示成为指数虚数形式,,则得到的结果(表达式)称为变量的母体谱: 注意到谱是的函数:给定任何特定的值和自协方差的序列,原则上均能够计算的数值。 利用DeMoivre 定理,我们能够将表示成为: 因此,谱函数能够等价地表示成为: 注意到对于协方差平稳过程而言,有:,因此上述谱函数化简为: 利用三角函数的奇偶性,能够得到: 假设自协方差序列是绝对可加的,则能够证明上述谱函数存于,且且是的实值、对称、连续函数。由于对任意,有:,因此是周期函数,如果我们知道了内的所有的值,我们能够获得任意时的值。 §6.2 不同过程下母体谱的计算 假设随机过程服从过程: 这里: , 根据前面关于过程自协方差生成函数的推导: 因此得到过程的母体谱为: 例如,对白噪声过程而言,,这时它的母体谱函数是常数:下面 我们考虑过程, 此时:,则母体谱为: 能够化简成为: 显然,当时,谱函数于内是的单调递减函数;当时,谱函数于内是的单调递增函数。对过程而言,有: 这时只要,则有:,因此谱函数为: 该谱函数的性质为:当时,谱函数于内是的单调递增函数;当时,谱函数于内是的单调递减函数。 壹般地,对过程而言: 则母体谱函数为:

第五章 时间序列的模型识别

第五章时间序列的模型识别 前面四章我们讨论了时间序列的平稳性问题、可逆性问题,关于线性平稳时间序列模型,引入了自相关系数和偏自相关系数,由此得到ARMA(p, q)统计特性。从本章开始,我们将运用数据开始进行时间序列的建模工作,其工作流程如下: 图5.1 建立时间序列模型流程图 在ARMA(p,q)的建模过程中,对于阶数(p,q)的确定,是建模中比较重要的步骤,也是比较困难的。需要说明的是,模型的识别和估计过程必然会交叉,所以,我们可以先估计一个比我们希望找到的阶数更高的模型,然后决定哪些方面可能被简化。在这里我们使用估计过程去完成一部分模型识别,但是这样得到的模型识别必然是不精确的,而且在模型识别阶段对于有关问题没有精确的公式可以利用,初步识别可以我们提供有关模型类型的试探性的考虑。 对于线性平稳时间序列模型来说,模型的识别问题就是确定ARMA(p,q)过程的阶数,从而判定模型的具体类别,为我们下一步进行模型的参数估计做准备。所采用的基本方法主要是依据样本的自相关系数(ACF)和偏自相关系数(PACF)初步判定其阶数,如果利用这种方法无法明确判定模型的类别,就需要借助诸如AIC、BIC 等信息准则。我们分别给出几种定阶方法,它们分别是(1)利用时间序列的相关特性,这是识别模型的基本理论依据。如果样本的自相关系数(ACF)在滞后q+1阶时突然截断,即在q处截尾,那么我们可以判定该序列为MA(q)序列。同样的道理,如果样本的偏自相关系数(PACF)在p处截尾,那么我们可以判定该序列为AR(p)序列。如果ACF和PACF 都不截尾,只是按指数衰减为零,则应判定该序列为ARMA(p,q)序列,此时阶次尚需作进一步的判断;(2)利用数理统计方法检验高阶模型新增加的参数是否近似为零,根据模型参数的置信区间是否含零来确定模型阶次,检验模型残差的相关特性等;(3)利用信息准则,确定一个与模型阶数有关

应用时间序列分析 第5章

佛山科学技术学院 应用时间序列分析实验报告 实验名称第五章非平稳序列的随机分析 一、上机练习 通过第4章我们学习了非平稳序列的确定性因素分解方法,但随着研究方法的深入和研究领域的拓宽,我们发现确定性因素分解方法不能很充分的提取确定性信息以及无法提供明确有效的方法判断各因素之间确切的作用关系。第5章所介绍的随机性分析方法弥补了确定性因素分解方法的不足,为我们提供了更加丰富、更加精确的时序分析工具。 5.8.1 拟合ARIMA模型 【程序】 data example5_1; input x@@; difx=dif(x); t=_n_; cards; 1.05 -0.84 -1.42 0.20 2.81 6.72 5.40 4.38 5.52 4.46 2.89 -0.43 -4.86 -8.54 -11.54 -1 6.22 -19.41 -21.61 -22.51 -23.51 -24.49 -25.54 -24.06 -23.44 -23.41 -24.17 -21.58 -19.00 -14.14 -12.69 -9.48 -10.29 -9.88 -8.33 -4.67 -2.97 -2.91 -1.86 -1.91 -0.80 ; proc gplot; plot x*t difx*t; symbol v=star c=black i=join; proc arima; identify var=x(1); estimate p=1; estimate p=1 noint; forecast lead=5id=t out=out; proc gplot data=out; plot x*t=1 forecast*t=2 l95*t=3 u95*t=3/overlay; symbol1c=black i=none v=star; symbol2c=red i=join v=none; symbol3c=green I=join v=none;

非线性时间序列

第六章 时间序列的平滑 引论 上一章我们引进非参数函数估计的基本概念,现在将它应用到时间序列别的重要平滑问题上. 对估计慢变化时间趋势,平滑技术是有用的图示工具,它产生了时域平滑(§). 对将来事件和与之相联系的现在与过去变量之间的关系的非参数统计推断导致了§的状态域平滑. § 引入的样条方法是对§引入的局部多项式方法的有用替代. 这此方法能够容易地推广到时间序列的条件方差(波动性)的估计,甚至整个条件分布的估计,参阅§. 时域平滑 6.2.1 趋势和季节分量 分析时间序列的第一步是画数据图. 这种方法使得人们可以从视觉上检查一个时间序列是否像一个平稳随机过程. 如果观察到趋势或季节分量,在分析时间序列之前通常要将它们分离开来. 假定时间序列{}t Y 能够分解成 t t t t Y f s X =++, () 其中t f 表示慢变函数,称为“趋势分量”,t s 是周期函数,称为“季节分量”,t X 是随机分量,它被假定是零均值的平稳序列. 在使用这种分解之前,可以先用方差稳定变换或Box-Cox 变换. 这类幂变换有如下以参数λ为指标的形式 ,0,()log(),0, u g x u λλλ?≠=?=? () 或具有在0λ=点处连续的变换形式 ()(1)/g u u λλ=-. 这类变换由Box 和Cox (1964)给出. 注意,由在幂变换中数据必须是非负的,因此,在使用幂变换之前,可能必须先实施平移变换. 我们的目的是估计和提取确定性分量t f 和t s . 我们希望残差分量t X 是平稳的, 且能够用线性和非线性技术做进一步的分析. 通过推广Box 和Jenkins (1970)而发展的一个替代方法是对时间序列{}t Y 重复应用差分算子,直到被差分的序列表现为平稳为止. 这时,被差分的序列可以进一步平衡时间序列技术来处理. 作为说明Box 和Jenkins 方法的一个例子,我们先取S&P500指数的对数变换,然后计算一阶差分. 图给出了这个预处理序列. 所得序列基本上是该指数中变化的每日价格的百分比. 除了几个异常值(即1987年10月19日%的市场崩盘,金融市场称之为“黑色星期一”)外,这个序列显示出平稳性. 这个变换与金融工程中常用资产定价的几何布朗运动模型的离散化有关. 图 1972年1月3日至1999年12月31日(上图)和1999年1月4日至 1999年12月31日(下图)S&P500指数对数变换的差分

典型时间序列模型分析

实验1 典型时间序列模型分析 1、实验目的 熟悉三种典型的时间序列模型:AR 模型,MA 模型与ARMA 模型,学会运用Matlab 工具对对上述三种模型进行统计特性分析,通过对2 阶模型的仿真分析,探讨几种模型的适用范围,并且通过实验分析理论分析与实验结果之间的差异。 2、实验原理 AR 模型分析: 设有 AR(2)模型, X(n)=-0.3X(n-1)-0.5X(n-2)+W(n) 其中:W(n)是零均值正态白噪声,方差为4。 (1)用MA TLAB 模拟产生X(n)的500 观测点的样本函数,并绘出波形 (2)用产生的500 个观测点估计X(n)的均值和方差 (3)画出理论的功率谱 (4)估计X(n)的相关函数和功率谱 【分析】给定二阶的AR 过程,可以用递推公式得出最终的输出序列。或者按照一个白噪声 通过线性系统的方式得到,这个系统的传递函数为: 1 2 1 ()10.30.5H z z z --= ++ 这是一个全极点的滤波器,具有无限长的冲激响应。 对于功率谱,可以这样得到, ()() 2 2 12 12exp 11x w z jw P w a z a z σ--==++ 可以看出, () x P w 完全由两个极点位置决定。 对于 AR 模型的自相关函数,有下面的公式: 这称为 Yule-Walker 方程,当相关长度大于p 时,由递推式求出: 这样,就可以求出理论的 AR 模型的自相关序列。

1.产生样本函数,并画出波形 2.题目中的AR 过程相当于一个零均值正态白噪声通过线性系统后的输出,可以按照上面的方法进行描述。 clear all; b=[1]; a=[1 0.3 0.5]; % 由描述的差分方程,得到系统传递函数 h=impz(b,a,20); % 得到系统的单位冲激函数,在20 点处已经可以认为值是0 randn('state',0); w=normrnd(0,2,1,500); % 产生题设的白噪声随机序列,标准差为2 x=filter(b,a,w); % 通过线形系统,得到输出就是题目中要求的2 阶AR 过程 plot(x,'r'); ylabel('x(n)'); title('邹先雄——产生的AR 随机序列'); grid on; 得到的输出序列波形为: 2.估计均值和方差 可以首先计算出理论输出的均值和方差,得到 x m ,对于方差可以先求出理论自相 关输出,然后取零点的值。

(时间序列分析)

时间序列分析 17.某城市过去63年中每年降雪量数据(单位:mm)如表3—20所示(行数据)。表3—20 126.4 82.4 78.1 51.1 90.9 76.2 104.5 87.4 110.5 25 69.3 53.5 39.8 63.6 46.7 72.9 79.6 83.6 80.7 60.3 79 74.4 49.6 54.7 71.8 49.1 103.9 51.6 82.4 83.6 77.8 79.3 89.6 85.5 58 120.7 110.5 65.4 39.9 40.1 88.7 71.4 83 55.9 89.9 84.8 105.2 113.7 124.7 114.5 115.6 102.4 101.4 89.8 71.5 70.9 98.3 55.5 66.1 78.4 120.5 97 110 (1)判断该序列的平稳性与纯随机性。 (2)如果序列平稳且非白噪声,选择适当模型拟合该序列的发展。 (3)利用拟合模型,预测该城市未来5年的降雪量。 答:

(1)由a-time时序图(左上角),该图平稳 由ACF自相关系数图(右上角),该图非纯随机性 (2)因为该序列是平稳且非白噪声序列,由图可知ACF图拖尾, PACF图一阶截尾,故该序列可拟合为AR(1)模型

图1 (3)由图1和xt-time时序图(右下角)可知,该城市未来5年的降雪量预测为:89.01662, 82.43668, 80.37336, 79.72634, 79.52345 该题的程序: 18.某地区连续74年的谷物产量(单位:千吨)如表3—21所示(行数据)。表3—21 0.97 0.45 1.61 1.26 1.37 1.43 1.32 1.23 0.84 0.89 1.18 1.33 1.21 0.98 0.91 0.61 1.23 0.97 1.10 0.74 0.80 0.81 0.80 0.60 0.59 0.63 0.87 0.36 0.81 0.91 0.77 0.96 0.93 0.95 0.65 0.98 0.70 0.86 1.32 0.88 0.68 0.78 1.25

时间序列分析第五章作业

时间序列分析第五章作业 班级:09数学与应用数学 学号: 姓名: 习题5.7 1、 根据数据,做出它的时序图及一阶差分后图形,再用ARIMA 模型模拟该序列的发展,得出 预测。根据输出的结果,我们知道此为白噪声,为非平稳序列,同时可以得出序列t x 模型 应该用随机游走模型(0,1,0)模型来模拟,模型为:,并可以预测到下一天 的收盘价为296.0898。 各代码: data example5_1; input x@@; difx=dif(x); t=_n_; cards ; 304 303 307 299 296 293 301 293 301 295 284 286 286 287 284 282 278 281 278 277 279 278 270 268 272 273 279 279 280 275 271 277 278 279 283 284 282 283 279 280 280 279 278 283 278 270 275 273 273 272 275 273 273 272 273 272 273 271 272 271 273 277 274 274 272 280 282 292 295 295 294 290 291 288 288 290 293 288 289 291 293 293 290 288 287 289 292 288 288 285 282 286 286 287 284 283 286 282 287 286 287 292 292 294 291 288 289 ; proc gplot ; plot x*t difx*t; symbol v =star c =black i =join; proc arima data =example5_1; identify Var =x(1) nlag =8 minic p = (0:5) q = (0:5); estimate p =0 q =0 noint; forecast lead =1 id =t out =results; run ; proc gplot data =results; plot x*t=1 forecast*t=2 l95*t=3 u95*t=3/overlay ; symbol1 c =black i =none v =star; symbol2 c =red i =join v =none; symbol3 c =green i =join v =none l =32; run ; 时序图:

时间序列分析基于R——习题答案

第一章习题答案 略 第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 2.2 (1)非平稳,时序图如下 (2)-(3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

2.3 (1)自相关系数为:0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2)平稳序列 (3)白噪声序列 2.4 ,序列LB=4.83,LB统计量对应的分位点为0.9634,P值为0.0363。显著性水平=0.05 不能视为纯随机序列。 2.5 (1)时序图与样本自相关图如下

(2) 非平稳 (3)非纯随机 2.6 (1)平稳,非纯随机序列(拟合模型参考:ARMA(1,2)) (2)差分序列平稳,非纯随机 第三章习题答案 3.1 ()0t E x =,2 1 () 1.9610.7 t Var x ==-,220.70.49ρ==,220φ= 3.2 1715φ=,2115 φ= 3.3 ()0t E x =,10.15 () 1.98(10.15)(10.80.15)(10.80.15) t Var x += =--+++ 10.8 0.7010.15 ρ= =+,210.80.150.41ρρ=-=,3210.80.150.22ρρρ=-= 1110.70φρ==,2220.15φφ==-,330φ= 3.4 10c -<<, 1121,1,2 k k k c c k ρρρρ--?=? -??=+≥? 3.5 证明: 该序列的特征方程为:32 - -c 0c λλλ+=,解该特征方程得三个特征根: 11λ=,2λ=3λ=

时间序列分析论文

关于居民消费价格指数的时间序列分析 摘要 本文以我国1997年4月至2014年4月间每月的烟酒及用品类居民消费价格指数为原始数据,利用EVIEWS软件判断该序列为平稳序列且为非白噪声序列,通过对数据一系列的处理,建立AR(1)模型拟合时间序列,由于时间序列之间的相关关系和历史数据对未来的发展有一定的影响,对我国的烟酒及用品类居民消费价格指数进行了短期预测,阐述该价格指数所表现的变化规律。 关键字:烟酒及用品类居民消费价格指数,时间序列,AR模型,预测 引言 一、理论准备 时间序列分析是按照时间顺序的一组数字序列。时间序列分析就是利用这组数列,应用数理统计方法加以处理,以预测未来事物的发展。 时间序列分析是定量预测方法之一。 基本原理: 1.承认事物发展的延续性。应用过去数据,就能推测事物的发展趋势。 2.考虑到事物发展的随机性。任何事物发展都可能受偶然因素影响,为此要利用统计分析中加权平均法对历史数据进行处理。 该方法简单易行,便于掌握,但准确性差,一般只适用于短期预测。 时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。 二、基本思想 1. 拿到一个观测值序列之后,首先判断它的平稳性,通过平稳性检验,判断序列是平稳序列还是非平稳序列。 2.若为非平稳序列,则利用差分变换成平稳序列。 3.对平稳序列,计算相关系数和偏相关系数,确定模型。 4.估计模型参数,并检验其显著性及模型本身的合理性。

5.检验模型拟合的准确性。 6.根据过去行为对将来的发展做出预测。 三、背景知识 CPI(居民消费价格指数),是反映与居民生活有关的商品及劳务价格统计出来的物价变动指标,通常作为观察通货膨胀水平的重要指标。居民消费价格指数,是对一个固定的消费品篮子价格的衡量,主要反映消费者支付商品和劳务的价格变化情况,也是一种通货膨胀水平的工具。一般来说,当CPI>3%的增幅时我们称为通货膨胀。 国外许多发达国家非常重视消费价格统计,美国、加拿大等国家都计算和公布每月经过季节调整的消费价格指数,以满足不同信息使用者的要求。经济学家用消费价格指数进行经济分析和利用时间序列构建经济模型。 总所周知,居民消费价格指数是反映一个国家或地区宏观经济运行状况好坏的必不可少的统计指标之一,是世界各国判断通货膨胀(紧缩)的主要标尺,是反映市场经济景气状态必不可少的经济晴雨表。因此,我国也采用国际惯例,用消费价格指数作为判断通货膨胀的主要标尺。 由于CPI是反映社会经济现象的综合指标,对其定量分析必须建立在定性分析的基础上,因此CPI的预测趋势还要与国家宏观经济政策及我国市场的供求关系相结合。如果消费价格指数升幅过大,表明通胀已经成为经济不稳定因素,央行会有紧缩货币政策和财政政策的风险,从而造成经济前景不明朗。因此,该指数过高的升幅往往不被市场欢迎。 基于以上种种,CPI指数的预测对我国各方面显得尤为重要。 本文针对烟酒及用品类居民消费价格指数,分析其时间序列,并进行了相关预测。 模型的建立 一、数据的选择: 选取2007年4月—2014年4月的各个月份的烟酒及用品类居民消费价格指数,如表1所示: 表1 烟酒及用品类居民消费价格指数 时间指数时间指数时间指数时间指数2007.4 99.4 2009.2 103.2 2010.12 101.5 2012.1 103.4 2007.5 99.3 2009.3 103.3 2011.1 101.6 2012.11 103.4 2007.6 99.3 2009.4 103.4 2011.2 101.7 2012.12 103.3 2007.7 99.3 2009.5 103.6 2011.3 101.7 2013.1 103.1

非线性动力学——时间序列分析读书报告

非线性动力学时间序列分析读书报告 Email:dragon_hm@https://www.360docs.net/doc/80791258.html,

1.时间序列分析简介 用随机过程理论和数理统计学方法研究随机数据序列所遵从的统计规律,以用于解决实际问题。由于在大多数问题中,随机数据是依时间先后排成序列的,称为时间序列。它包括一般统计分析(如自相关分析、谱分析等),统计模型的建立与推断,以及关于随机序列的最优预测、控制和滤波等内容。 经典的统计分析都假定数据序列具有独立性,而时间序列分析则着重研究数据序列的相互依赖关系。后者实际上是对离散指标的随机过程的统计分析,所以又可看作是随机过程统计的一个组成部分。例如,用 x(t)表示某地区第 t月的降雨量,*x(t),t=1,2,…+是一时间序列。对t=1,2,…,T记录到逐月的降雨量数据x(1),x(2),…,x(T)称为长度为T的样本序列。依此,即可使用时间序列分析方法,对未来各月的雨量x(T+i) i=1,2,…进行预报。 时间序列分析不仅可以从数量上揭示某一现象的发展变化规律或从动态的角度刻画某一现象与其他现象之间的内在数量关系及其变化规律性,达到认识客观世界之目的,而且运用时间序列模型还可以预测和控制现象的未来行为。时间序列分析在第二次世界大战前就已应用于经济预测。二次大战中和战后,在军事科学、空间科学和工业自动化等部门的应用更加广泛。 2.时间序列概述 时间序列包含一系列数据,这些数据是随时间或者其他变量的增加而得到的,并随着时间的改变,变量值的序列组成了一个时间序列。例如,股票每天的收盘价格就是一个时间序列,每年客运流量是一个时间序列,某种商品的销售数量也是一个时间序列,时间序列存在于日常生活之中。 2.1 时间序列的定义 时间序列是指按照时间顺序获得的一系列观测值。从数学意义上讲,如果对某一过程中的某一变量或一组变量 X(t)进行观察测量,在一系列时刻t1,t2,…,t n (t 为自变量,且t1

相关文档
最新文档