非线性动力学数据分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
时间序列分析读书报告与数据分析
刘愉 200921210001
时间序列分析是利用观测数据建模,揭示系统规律,预测系统演化的方法。根据系统是否线性,时间序列分析的方法可分为线性时间序列分析和非线性时间序列分析。
一、 时间序列分析涉及的基本概念
1、 测量 对于一个动力系统,我们可以用方程表示其对应的模型,如有限差分方程、微分方程等。如果用t X 或)(t X 表示所关心系统变量的列向量,则系统的变化规律可表示成
)(1t t X f X =+或)(X F dt dX
=
其中X 可以是单变量,也可以是向量,F 是函数向量。通过这类方程,我们可以研究系统的演化,如固定点、周期、混沌等。
在实际研究中,很多时候并不确定研究对象数据何种模型,我们得到的是某类模型(用t X 或)(t X 表示)的若干观测值(用t D 或)(t D 表示),构成观测的某个时间序列,我们要做的是根据一系列观测的数据,探索系统的演化规律,预测未来时间的数据或系统状态。
2、 噪声
测量值和系统真实值之间不可避免的存在一些误差,称为测量误差。其来源主要有三个方面:系统偏差(测量过程中的偏差,如指标定义是否准确反映了关心的变量)、测量误差(测量过程中数据的随机波动)和动态噪音(外界的干扰等)。
高斯白噪声是一类非常常见且经典的噪声。所谓白噪声是指任意时刻的噪声水平完全独立于其他时刻噪声。高斯白噪声即分布服从高斯分布的白噪声。这类噪声实际体现了观测数据在理论值(或真实值)周围的随机游走,它可以被如下概率分布刻画:
dx M x dx x p 2222)(exp 21
)(σπσ--= (1)
其中M 和σ均为常数,分别代表均值和标准差。
3、 均值和标准差
最简单常用的描述时间序列的方法是用均值和标准差表示序列的整体水平和波动情况。
(1)均值
如果M 是系统真实的平均水平,我们用观测的时间序列估计M 的真实水平方法是:认为N 个采样值的水平是系统水平的真实反映,那么最能代表这些观测值(离所有观测值最近)的est M 即可作为M 的估计。于是定义t D 与est M 的偏离为2
)(est t M D -,所以,使下面E 最小的M 的估计值即为所求:
21)(∑=-=N t est t
M D E (2)
经过求道计算,得到
∑==N t t
est D N M 11
(3)
即样本的均值即为系统真是均值的估计值。
(2)标准差
标准差代表了系统在均值两侧的波动情况。对时间样本有:
est t t M D V -= (4)
为了分析所有时间上平均的波动情况,我们也可以尝试对波动取平均,即:
∑∑===-⎪⎪⎭
⎫ ⎝⎛=-N t est N t t est t M D N M D N 1101)(1
(5) 我们发现,这样平均的结果是正负波动抵消了,波动的平均恒为零,为了避免这种情况,改用波动的平方的平均水平代替,即
∑∑==-==N t t est
N t t
D M N V N 12
122)(11
σ (6) σ即为标准差。
(3)均值的标准误差
我们用est M 估计M ,存在一定偏差或不确定性,即:
y uncerta M M est int += (7)
实际上,这种不确定性来自每次测量偏差的平均,通常每次测量偏差是服从高斯分布的,所以平均的不确定性计算得:
N σ
(8)
我们称之为均值的标准误差。
二、 线性时间序列分析方法及模型举例
对于线性时间序列,主要的分析方法有:均值和标准差、线性相关分析和功率谱分析。
1、 均值和标准差分析前面已经讲过;
例:模型一(模型本身是确定的(无外界干扰等随机波动),观测序列是真实值加上高斯白噪声;)
有限差分方程系统:t t x A x ρ+=+1,其平稳状态为M A x t =-=)1/(ρ;观测时间序列t t t W x D +=,其中,t W 独立的服从均值为0,标准差为σ的高斯分布。从系统的差分方程我们可以看到,系统本身不受外界干扰,是确定性模型。所以观测得到时间序列的波动完全来自于测量过程。
对于上述模型,可以通过均值、方差的估计即可估计模型、作出预测。
2、 线性相关分析
这种分析方法用于研究时间上相关的序列,即后一时刻的值完全或部分由前一时刻的或前几个时刻的值决定。在模型一中,我们假设t W 之间是独立的;当这种假设不成立时,取另一种极端,即后一时刻完全取决于前一时刻的值:
)(1t t V f V =+ (9)
我们以简单的线性函数为例:
t t V V ρ=+1 (10)
如果结合完全独立的情形与式(10),则有以下情况:
t t W V V +=+ρ1 (11)
ρ在-1到1之间取值,ρ越接近0,数据间越不相关;ρ接近1,表示线性正相关;ρ接近-1,表示线性负相关
通过时间序列的一系列观测值t D 减去均值得到t V ,我们可以通过以下公式计算相关系数,
∑∑-=-=+=11111N t t t N t t
t est V V V V ρ (12)
例:模型二(模型本身有不确定因素(外界干扰),观测序列是真实值加上高斯白噪声)
受外界因素影响的有限差分方程:t t t v x A x ++=+ρ1,引入的t v 是外界干扰造成的系统本身的波动,测量过程仍然像Model One 一样,t t t W x D +=,这是如果做1+t V 对t V 的变化图(见课本figure 6.7),发现二者之间有强烈的线性关系。对于这类模型,我们即可用线性相关分析来建模、预测。
如果将线性相关加以推广,可以得到自相关函数,它反映的是t V 与k t V +之间的关系:
∑∑-=-=+=k N t t t k N t t
k t V V V V k R 11)( (13)
3、 功率谱分析
(1)傅里叶变换
对线性系统,一个信号可以分解成为不同频率的正弦波。
(a )频率为ω的正弦输入,它的输出也是同频率的正弦信号,但是幅度和相位可能发生改变。输出正弦波的振幅与输入正弦波的振幅满足:
)()()(ωωωinput output A G A = (14)
输出相位相对输入相位在每个频率上有固定的偏移,即:
)
()()(ωφωφωφinput output -= (15)