第五章-时间序列的模型识别汇总

合集下载

5时间序列模型

5时间序列模型

方差函数: 自协方差函数:
? ? 2 t
?
D(Y) t
?
?
[ yE?
??
(Y) td]2 FYt ( y)
?? Cov(Yt ,Ys ) ??E ???Yt EYt ??Ys ??EYs ??? t,s ? (t, s)
自相关函数(ACF):
? ?ts, ? ?? ts, ?
?(ts,) ??tt, ????s,
模型
? 完善阶段 :
? 异方差场合
? Robert F.Engle,1982年,ARCH模型 ? Bollerslov,1986年GARCH模型
? 多变量场合
? C.A.Sims等,1980年,向量自回归模型 ? C.Granger ,1987年,提出了协整(co-integration)理论
模拟时间序列数据:
8
? 随机过程与时间序列的关系如下所示:
随机过程: {y1, y2, …, yT-1, yT,} 第1次观测:{y11, y21, …, yT-11, yT1} 第2次观测:{y12, y22, …, yT-12, yT2}
???? ? 第n次观测:{y1n, y2n, …, yT-1n, yTn}
一般的,对于任意 m ? N,,t,1 t2 L , tm ? T,Yt1 ,L ,Ytm 的联合分布函数为:
FYt1 ,Yt2 ,L ,Ytm ( y1 ,,y,)2 L ymP ?? (Yt1 y1Y,,L tm ? ym )
均值方程:
? ?t ? E(Yt ) ?
?
?? ydFYt ( y)
9
2、随机过程的分布及其数字特征
设{Yt}为一个随机过程,对任意一个 t ? T ,Yt的分布函数为:

第五章 时间序列模型

第五章 时间序列模型
第五章 时间序列模型
5.时间序列模型
5.1 时间序列 5.2 自回归(AR)模型 5.3 滑动平均(MA)模型 5.4 自回归滑动平均(ARMA)模型
2/40
5.1 时间序列
数字化技术的应用和发展使得随机序列的分析变得日
益广泛和重要,并由平稳随机过程在时间轴上的 取样引
出平稳离散随机信号或时间序列的概念。对于这类随机序 列,主要采用相关函数和功率谱进行分析。对于平稳离散 时间信号,还常用时间序列描述方法进行研究,由此提出 时间序列模型法。它是采用各种随机差分方程表示时间序
当 z1, 2 1 时,上式右边齐次解随 n 的增大而趋于零,而特 解部分具有有限方差,在均方意义下收敛,随 n 的增大而 渐近收敛于特解公式的平稳结果。 实际上,二阶模型的平稳条件与其系数 a1和 a 2是有关
的,这可通过 a1和 a 2 平面表示。设 z1, 2 1 ,并设z1 z2 a1
1 H ( z) (1 z1 z 1 )(1 z 2 z 1 )(1 z p z 1 )
所以,AR模型的传递函数只有极点,除原点外没有任何 零点,属于全极点模型,对应于全极点滤波器,具有无限 冲激响应(IIR)。因此,模型传递函数的性质完全取决于 p
个极点在 z 平面上的分布情况。可以证明,如果所有 p 个
1 k 1 k 1 k z1 z 2 D (n) z1 z 2 k 0 k z1k 1 z 2 1 (n k ) z1 z 2 k 0


15/40
5.2 自回归(AR)模型
根据模型差分方程,零输入下得齐次方程
x(n) a1 x(n 1) a2 x(n 2) 0
11/40

《时间序列模型识别》课件

《时间序列模型识别》课件
常用的时间序列模型同样包括ARIMA 、SARIMA、VAR、VARMA等,这些 模型能够考虑利率的季节性、周期性 等特点,提高利率预测的准确度。
外汇汇率预测
外汇汇率预测是时间序列模型的又一重要应用。通过分析历史外汇汇率数据,时 间序列模型可以预测未来的汇率走势,帮助投资者制定外汇交易策略。
常用的时间序列模型同样适用于外汇汇率预测,如ARIMA、SARIMA、VAR、 VARMA等。这些模型能够捕捉外汇汇率的动态变化规律,为投资者提供有价值 的参考信息。
总结词
气候变化趋势分析是全球气候治理的重要基 础,利用时间序列模型可以对气候变化趋势 进行定量评估,为政策制定提供科学依据。
详细述
通过长时间尺度的历史气候数据,建立时间 序列模型,并利用该模型分析气候变化的趋 势。分析结果可以为应对气候变化、制定减 排政策等提供决策支持。
06
时间序列模型在生产领域 的应用
解释性
选择易于解释的模型,有助于 理解时间序列数据的内在规律 。
计算效率
考虑模型的计算效率和可扩展 性,以便在实际应用中快速处
理大量数据。
03
时间序列模型性能评估
预测精度评估
01
均方误差(MSE)
衡量预测值与实际值之间的平均 差异,值越小表示预测精度越高 。
02
平均绝对误差( MAE)
计算预测值与实际值之间的绝对 差值的平均值,值越小表示预测 精度越高。
03
均方根误差( RMSE)
将预测误差的平方和开方,反映 预测值的离散程度,值越小表示 预测精度越高。
模型稳定性评估
模型参数稳定性
评估模型参数在多次运行或不同数据集上的稳定性, 以确保模型的可靠性。
模型结构稳定性

第五章-时间序列的模型识别汇总

第五章-时间序列的模型识别汇总

第五章-时间序列的模型识别汇总第五章时间序列的模型识别前面四章我们讨论了时间序列的平稳性问题、可逆性问题,关于线性平稳时间序列模型,引入了自相关系数和偏自相关系数,由此得到ARMA(p, q)统计特性。

从本章开始,我们将运用数据开始进行时间序列的建模工作,其工作流程如下:图5.1 建立时间序列模型流程图在ARMA(p,q)的建模过程中,对于阶数(p,q)的确定,是建模中比较重要的步骤,也是比较困难的。

需要说明的是,模型的识别和估计过程必然会交叉,所以,我们可以先估计一个比我们希望找到的阶数更高的模型,然后决定哪些方面可能被简化。

在这里我们使用估计过程去完成一部分模型识别,但是这样得到的模型识别必然是不精确的,而且在模型识别阶段对于有关问题没有精确的公式可以利用,初步识别可以我们提供有关模型类型的试探性的考虑。

对于线性平稳时间序列模型来说,模型的识别问题就是确定ARMA(p,q)过程的阶数,从而判定模型的具体类别,为我们下一步进行模型的参数估计做准备。

所采用的基本方法主要是依据样本的自相关系数(ACF)和偏自相关系数(PACF)初步判定其阶数,如果利用这种方法无法明确判定模型的类别,就需要借助诸如AIC、BIC 等信息准则。

我们分别给出几种定阶方法,它们分别是(1)利用时间序列的相关特性,这是识别模型的基本理论依据。

如果样本的自相关系数(ACF)在滞后q+1阶时突然截断,即在q处截尾,那么我们可以判定该序列为MA(q)序列。

同样的道理,如果样本的偏自相关系数(PACF)在p处截尾,那么我们可以判定该序列为AR(p)序列。

如果ACF和PACF都不截尾,只是按指数衰减为零,则应判定该序列为ARMA(p,q)序列,此时阶次尚需作进一步的判断;(2)利用数理统计方法检验高阶模型新增加的参数是否近似为零,根据模型参数的置信区间是否含零来确定模型阶次,检验模型残差的相关特性等;(3)利用信息准则,确定一个与模型阶数有关的准则函数,既考虑模型对原始观测值的接近程度,又考虑模型中所含待定参数的个数,最终选取使该函数达到最小值的阶数,常用的该类准则有AI C、BIC 、FP E等。

简述时间序列模型识别的主要内容

简述时间序列模型识别的主要内容

简述时间序列模型识别的主要内容《简述时间序列模型识别的主要内容》篇一时间序列模型识别,这听起来就像是一个充满神秘代码和复杂算法的领域,但其实呢,也有一些很接地气的理解方式。

首先,咱得知道时间序列是啥玩意儿。

简单来说,就像是记录某个东西随着时间变化的数据集合。

比如说,每天的气温啊,股票的价格啊,这些都是时间序列。

那模型识别呢,就像是给这些变化的数据找个合适的“家”,或者说是找个能解释它们为啥这么变的“理由”。

在这个过程中,一个重要的内容就是看数据的趋势。

这就好比是看一个人走路的方向,是一直向上,像爬山一样越来越高呢,还是像坐滑梯一样一路向下,又或者是在平地上晃悠,没有啥明显的方向。

比如说,我观察我家那盆花的高度,随着时间的推移,它可能一开始是慢慢长高,这就是个向上的趋势。

那在模型识别的时候,就得找那种能够描述这种向上趋势的模型,像一些带有增长项的模型可能就比较合适。

还有就是季节性。

这可太常见了,就像每年春节前后,商场里人就特别多,东西也卖得好,这就是一种季节性的表现。

在时间序列里,数据可能会按照一定的周期有规律地波动。

我记得有一次我去海边旅游,那个地方的潮汐就是特别有季节性。

每天涨潮和落潮的时间都不一样,但是按照月份来看呢,又有一定的规律。

在识别时间序列模型的时候,要是发现有这种季节性,那就得找那种能处理季节性的模型,像季节性自回归滑动平均模型(SARIMA)之类的。

再说说平稳性。

平稳性就像是一个人情绪很稳定,不会突然大起大落。

对于时间序列数据来说,如果它的均值、方差等统计特性不随时间变化而变化,那就是平稳的。

可这事儿说起来简单,判断起来可不容易。

我曾经试着分析我自己每个月的零花钱花了多少,我以为它是平稳的,毕竟每个月爸妈给的钱都差不多。

但是呢,有时候会有一些意外支出,像突然要交个什么活动费之类的,就会让这个数据变得不那么平稳了。

在模型识别中,平稳性很重要,因为很多模型都是建立在数据平稳的基础上的。

时间序列的模型识别课件

时间序列的模型识别课件

时间序列的模型基础
1 自回归模型(AR)
利用过去时刻的观测值来预测未来时刻的值。
2 移动平均模型(MA)
根据过去时刻的预测误差来预测未来时刻的值。
3 自回归移动平均模型(ARMA)
结合自回归和移动平均模型的特点,适用于一般的时间序列。
时间序列的平稳性检验
1 平稳性的概念
时间序列的均值和方差在时间上保持恒定。
ARMA模型
自回归移动平均模型是自回归模型和移动平均模型的综合应用。它能够捕捉 时间序列的长期和短期动态特征。
ARIMA模型
自回归积分移动平均模型是自回归模型、差分和移动平均模型的组合应用。 它适用于具有趋势和季节性的时间序列。
季节性调整
对具有季节性的时间序列进行季节性调整可以消除季节性的影响,使时间序 列更具可预测性。
时间序列的模型识别ppt 课件
时间序列是按照时间顺序排列的数据集合,它具有趋势、季节性和周期性等 特征。本课程将介绍时间序列的基础概念和模型识别方法,帮助您更好地理 解和应用时间序列分析。
介绍时间序列
时间序列是按照时间顺序排列的数据集合,常见于经济、金融、气象等领域。了解时间序列的基 本概念和特征对于进行模型识别和预测至关重要。
2 单位根检验
用于判断时间序列是否具有单位根,进而确定是否为平稳序列。
3 差分
通过对时间序列进行差分,将非平稳序列转化为平稳序列。
AR模型
自回归模型是基于过去时刻的观测值进行预测的模型。它的特点是具有记忆性,各个时刻的值受 前面时刻的影响。
MA模型
移动平均模型是根据过去时刻的预测误差进行预测的模型。它的特点来自对预 测误差有很好的适应能力。

经济时间序列分各种模型分析

经济时间序列分各种模型分析经济时间序列分析是经济学中非常重要的一个研究领域。

对于经济时间序列,我们可以使用多种模型进行分析,以揭示其中的规律和趋势。

本文将介绍几种常见的经济时间序列模型。

首先,最常用的模型是自回归移动平均模型(ARMA)。

ARMA模型结合了自回归(AR)和移动平均(MA)两个部分,用于描述时间序列数据中的自相关性和滞后平均性。

通过对历史数据进行分析,我们可以建立ARMA模型,并预测未来的经济变化。

其次,自回归条件异方差模型(ARCH)是一种考虑时间序列数据波动性变化的模型。

在经济领域,波动性是一个非常重要的指标,因为它涉及到风险和不确定性。

ARCH模型基于时间序列数据内在的波动性特征,可以更好地描述经济变动过程中的波动性变化。

另外,向量自回归模型(VAR)是一种多变量时间序列模型。

与单变量时间序列模型不同,VAR模型可以同时考虑多个经济变量之间的相互关系和影响。

通过建立VAR模型,我们可以分析各个经济变量之间的因果关系,并进行经济政策的预测。

此外,状态空间模型是一种广义的时间序列模型,可以包含各种经济数据。

状态空间模型可以用来描述许多复杂的现象,例如经济周期、金融市场波动等。

通过建立状态空间模型,我们可以更全面地分析经济系统的结构和运行机制。

最后,非线性时间序列模型是一类适用于非线性数据的经济时间序列模型。

在现实经济中,很多经济变量的关系不能简单地用线性模型来描述。

非线性时间序列模型可以更准确地捕捉经济系统中的非线性关系,从而提供更精确的预测结果。

总之,经济时间序列分析可以使用多种模型进行分析。

从基本的ARMA模型到更复杂的VAR模型、ARCH模型、状态空间模型和非线性时间序列模型,每种模型都有其适用的领域和优势。

经济学家通过对时间序列数据的建模和分析,可以更好地理解经济变动的规律和趋势,并对未来经济发展进行预测和决策。

经济时间序列分析作为经济学中的一个重要分支,对于理解和预测经济变动具有极大的意义。

时间序列的模型识

时间序列的模型识别
• 时间序列的基本概念 • 时间序列的模型 • 时间序列的模型识别方法 • 时间序列的预测 • 时间序列的应用
01
时间序列的基本概念
时间序列的定义
总结词
时间序列是指按照时间顺序排列的一系列观测值。
详细描述
时间序列是按照时间顺序排列的一系列数据点,可以是数字、文本或其他类型 的数据。这些数据点通常表示在某个特定时间点上的测量值或观察结果。
详细描述
参数法通常需要预先设定一些数学模型,如AR模型、MA模型、ARMA模型等,然后通过最小二乘法 、最大似然估计等方法估计模型的参数。如果实际数据与某个模型的拟合度较高,则认为该模型适用 于该时间序列。
图形法
总结词
图形法是一种直观的方法,通过绘制时间序 列的图形和各种统计量来识别模型。
详细描述
图形法包括绘制时间序列的时序图、自相关 图、偏自相关图等,以及计算各种统计量如 峰度、偏度等。通过观察图形的特征和统计 量的值,可以初步判断时间序列的模型类型。
信息准则法
总结词
信息准则法是一种基于信息论的方法,通过比较不同模型的复杂度和拟合度来选择最优 模型。
详细描述
信息准则法包括AIC准则、BIC准则等,它们通过计算模型的复杂度和拟合度来选择最 优模型。复杂度越小、拟合度越高的模型被认为是更好的模型。信息准则法可以自动选
详细描述
差分自回归移动平均模型
ARIMA模型
总结词
详细描述
总结词
详细描述
自回归积分滑动平均模 型
ARIMA模型是一种结合 了自回归、积分和移动 平均三种模型的混合模 型。它通过同时考虑时 间序列中的过去值、过 去误差值和时间序列的 非平稳性来预测未来值 。

时间序列分析模型

时间序列分析模型时间序列分析是一种用来处理时间变化数据的统计分析方法。

它将观测数据按照时间顺序进行排列,并利用过去的数据来预测未来的发展趋势。

在时间序列分析中,通常会使用一些常见的模型,如自回归(AR)、移动平均(MA)和自回归移动平均(ARMA)模型。

自回归模型(AR)是时间序列分析中最基本的模型之一。

它假设未来的观测值可以通过当前和过去的观测值来预测。

AR 模型的数学表达式为:Y_t = c + ∑(φ_i * Y_t-i) + ε_t其中,Y_t表示第t个观测值,c表示常数,φ_i表示第i个滞后的自回归系数,ε_t表示误差项。

通过对AR模型进行参数估计,可以得到最优的系数估计值,从而进行未来观测值的预测。

移动平均模型(MA)是另一种常见的时间序列分析模型。

它假设未来的观测值可以通过当前和过去的误差项来预测。

MA 模型的数学表达式为:Y_t = μ + ∑(θ_i * ε_t-i) + ε_t其中,Y_t表示第t个观测值,μ表示均值,θ_i表示第i个滞后的移动平均系数,ε_t表示误差项。

通过对MA模型进行参数估计,可以得到最优的系数估计值,从而进行未来观测值的预测。

自回归移动平均模型(ARMA)是将AR模型和MA模型结合起来的一种复合模型。

它假设未来的观测值可以通过当前观测值、滞后观测值和误差项来预测。

ARMA模型的数学表达式为:Y_t = c + ∑(φ_i * Y_t-i) + ∑(θ_i * ε_t-i) + ε_t其中,Y_t表示第t个观测值,c表示常数,φ_i表示第i个滞后的自回归系数,θ_i表示第i个滞后的移动平均系数,ε_t表示误差项。

通过对ARMA模型进行参数估计,可以得到最优的系数估计值,从而进行未来观测值的预测。

总之,时间序列分析模型是一种通过利用过去数据来预测未来数据的统计分析方法。

其中,自回归模型、移动平均模型和自回归移动平均模型是一些常见的时间序列分析模型。

通过对这些模型进行参数估计,可以得到最优的预测结果。

时间序列知识点总结

时间序列知识点总结时间序列的特征在进行时间序列分析之前,需要先了解时间序列数据的特征。

时间序列数据通常包括趋势、季节性、周期性和随机性等几个方面的特征。

趋势是时间序列数据长期变化的倾向,可以分为上升趋势、下降趋势和水平趋势。

趋势可以通过线性趋势、非线性趋势等形式进行建模。

季节性是时间序列数据在一年内重复出现的短期周期性变化。

例如,零售业的销售额在每年的圣诞节期间通常会有显著增长,这就是季节性的表现。

周期性是时间序列数据在非固定时间段内重复出现的周期性变化。

例如,房地产市场可能会出现10年一个周期的波动。

随机性是无法被趋势、季节性和周期性所解释的时间序列数据的波动。

随机性也被称为噪声,它可以通过模型的残差项来描述。

时间序列的模型时间序列分析的目标是从历史数据中找出模式,并据此预测未来的走势。

在时间序列分析中,最常用的模型有自回归移动平均模型(ARMA模型)、自回归积分移动平均模型(ARIMA模型)和指数平滑模型等。

ARMA模型是一种描述时间序列数据的随机过程,它包括自回归和移动平均两种成分,可以用来描述时间序列数据的趋势和随机波动。

ARIMA模型是在ARMA模型的基础上引入差分运算,用来处理非平稳的时间序列数据。

ARIMA模型包括自回归阶数p、差分阶数d和移动平均阶数q三个参数,可以较为灵活地适应不同时间序列的特征。

指数平滑模型是一种通过加权移动平均的方式对时间序列数据进行平滑处理,并据此预测未来的走势。

指数平滑模型有简单指数平滑、双指数平滑和三指数平滑等不同形式。

时间序列的预测时间序列分析的一个重要应用就是预测未来的走势。

对于经济金融领域来说,预测未来的通货膨胀率、利率和股票价格等具有重要的实际意义。

时间序列预测的方法主要包括基于统计模型的方法和基于机器学习的方法。

基于统计模型的方法是通过建立ARMA模型、ARIMA模型或指数平滑模型等,然后根据模型对未来的走势进行估计。

这种方法的优点是模型比较简单,容易理解和解释。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章时间序列的模型识别前面四章我们讨论了时间序列的平稳性问题、可逆性问题,关于线性平稳时间序列模型,引入了自相关系数和偏自相关系数,由此得到ARMA(p, q)统计特性。

从本章开始,我们将运用数据开始进行时间序列的建模工作,其工作流程如下:图5.1 建立时间序列模型流程图在ARMA(p,q)的建模过程中,对于阶数(p,q)的确定,是建模中比较重要的步骤,也是比较困难的。

需要说明的是,模型的识别和估计过程必然会交叉,所以,我们可以先估计一个比我们希望找到的阶数更高的模型,然后决定哪些方面可能被简化。

在这里我们使用估计过程去完成一部分模型识别,但是这样得到的模型识别必然是不精确的,而且在模型识别阶段对于有关问题没有精确的公式可以利用,初步识别可以我们提供有关模型类型的试探性的考虑。

对于线性平稳时间序列模型来说,模型的识别问题就是确定ARMA(p,q)过程的阶数,从而判定模型的具体类别,为我们下一步进行模型的参数估计做准备。

所采用的基本方法主要是依据样本的自相关系数(ACF)和偏自相关系数(PACF)初步判定其阶数,如果利用这种方法无法明确判定模型的类别,就需要借助诸如AIC、BIC 等信息准则。

我们分别给出几种定阶方法,它们分别是(1)利用时间序列的相关特性,这是识别模型的基本理论依据。

如果样本的自相关系数(ACF)在滞后q+1阶时突然截断,即在q处截尾,那么我们可以判定该序列为MA(q)序列。

同样的道理,如果样本的偏自相关系数(PACF)在p处截尾,那么我们可以判定该序列为AR(p)序列。

如果ACF和PACF 都不截尾,只是按指数衰减为零,则应判定该序列为ARMA(p,q)序列,此时阶次尚需作进一步的判断;(2)利用数理统计方法检验高阶模型新增加的参数是否近似为零,根据模型参数的置信区间是否含零来确定模型阶次,检验模型残差的相关特性等;(3)利用信息准则,确定一个与模型阶数有关的准则函数,既考虑模型对原始观测值的接近程度,又考虑模型中所含待定参数的个数,最终选取使该函数达到最小值的阶数,常用的该类准则有AIC 、BIC 、FPE 等。

实际应用中,往往是几种方法交叉使用,然后选择最为合适的阶数(p,q )作为待建模型的阶数。

§5.1 自相关和偏自相关系数法在平稳时间序列分析中,最关键的过程就是利用数据去识别和建模,根据第三章讨论的内容,一个比较直观的方法,就是通过观察自相关系数(ACF )和偏自相关系数(PACF )可以对拟合模型有一个初步的识别,这是因为从理论上说,平稳AR 、MA 和ARMA 模型的ACF 和PACF 有如下特性:模型(序列) AR(p ) MA(q ) ARMA(p,q ) 自相关系数(ACF ) 拖尾 q 阶截尾 拖尾 偏自相关系数(PACF ) p 阶截尾 拖尾 拖尾 但是,在实际中ACF 和PACF 是未知的,对于给定的时间序列观测值12,,,T x x x ,我们需要使用样本的自相关系数{}ˆk ρ和偏自相关系数{}ˆkkφ对其进行估计。

然而由于{}ˆk ρ和{}ˆkkφ均是随机变量,对于相应的模型不可能具有严格的“截尾性”,只能呈现出在某步之后围绕零值上、下波动,因此,我们需要借助{}ˆk ρ和{}ˆkkφ的“截尾性”来判断{}k ρ和{}kkφ的截尾性,进而由此可以给出模型的初步识别。

首先,我们需要给出样本的自相关系数{}ˆk ρ和偏自相关系数{}ˆkkφ的定义。

设平稳时间序列{}t X 的一个样本1,,T x x 。

则样本自协方差系数定义为()()11ˆ,11ˆˆ,11T kk j j k j k k x x x x k T T k T γγγ-+=-=--≤≤-=≤≤-∑ (5.1)其中11Tj j x x T ==∑为样本均值,则样本自协方差系数{}ˆk γ是{}t X 的自协方差系数{}k γ的估计。

样本自相关系数定义为0ˆˆˆ,1k k k T ργ=≤- (5.2)是{}t X 的自相关系数{}k ρ的估计。

作为{}t X 的自协方差系数{}k γ的估计,根据数理统计知识,样本自协方差系数还可以写为()()11ˆ,11ˆˆ,11T kk j j k j k k x x x x k T T k k T γγγ-+=-=--≤≤--=≤≤-∑(5.3)在上述两种估计中,当样本容量T 很大,而k 的绝对值较小时,上述两种估计值相差不大,其中由(5.1)定义的第一种估计值的绝对值较小。

根据前面章节的讨论,因为AR(p ),MA(q )或者ARMA(,p q )模型的自协方差系数{}k γ都是以负指数阶收敛到零,所以在对平稳时间序列的数据拟合AR(p ),MA(q )或者ARMA(,p q )模型时,希望实际计算的样本自协方差系数{}ˆk γ能以很快的速度收敛。

因此,我们一般选择由(5.1)定义的第一种估计值作为{}k γ的点估计。

根据第三章偏自相关系数的计算,利用样本自相关系数{}ˆk ρ的值,定义样本偏自相关系数{}ˆkkφ如下: ˆˆ,1,2,,ˆk kk D k TDφ==(5.4)其中111112121212ˆˆˆˆ11ˆˆˆˆ11ˆˆ,ˆˆˆˆˆ1k k kk k k k k DD ρρρρρρρρρρρρρ------==关于样本的自相关系数{}ˆk ρ的统计性质,我们将在下一章给予讨论。

Quenouille 证明,{}ˆkkφ也满足Bartlett 公式,即当样本容量T 充分大时, ()ˆ~0,1kkN T φ (5.5)这样根据正态分布的性质,我们有ˆ68.3%kkP φ⎧≤=⎨⎩ (5.6) ˆ95.5%kkP φ⎧≤=⎨⎩(5.7) 这样,关于偏自相关系数{}kk φ的截尾性的判断,转化为利用上述性质(5.6)或者(5.7),可以判断{}ˆkkφ的截尾性。

具体方法为对于每一个p >0,考查1,1p p φ++,2,2p p φ++,…,,p M p M φ++中落入ˆkkφ≤ˆkkφ≤M 的68.3%或95.5%。

一般地,我们取M =0p p =之前ˆkk φ都明显地不为零,而当0p p >时,01,1p p φ++,002,2p p φ++,…,00,p M p M φ++中满足不等式ˆkkφ≤ˆkkφ≤的个数占总数M 的68.3%或95.5%,则可以认定{}kk φ在0p 处截尾,由此可以初步判定序列}{t X 为AR(0p )模型。

对于样本的自相关系数{}ˆk ρ,由第二章的Bartlett 公式,对于0>q ,{}ˆk ρ满足 ~ˆk ρ211ˆ0,12q j j N T =⎛⎫⎡⎤+ρ ⎪⎢⎥ ⎪⎣⎦⎝⎭∑ (5.8)进一步地,当样本容量T 充分大时,{}ˆk ρ也满足 ()ˆ~0,1k N T ρ(5.9)类似于(5.6)或者(5.7)式,对于每一个0>q ,检查1ˆq ρ+,2ˆq ρ+,…,ˆq M ρ+中落入ˆk ρ≤或者ˆk ρ≤中的比例是否占总数M 的68.3%或95.5%左右。

如果在0q 之前,ˆk ρ都明显不为零,而当0q q =时,01ˆq ρ+,02ˆq ρ+,…,0ˆq M ρ+中满足上述不等式的个数达到比例,则判断{}k ρ在0q 处截尾。

初步认为序列}{t X 为MA(0q )模型。

至此,我们可以利用样本的自相关系数{}ˆk ρ和偏自相关系数{}ˆkkφ,得到ARMA 模型阶数的初步判定方法。

具体做法如下:(1) 如果样本自相关系数{}ˆk ρ在最初的q 阶明显的大于2倍标准差范围,即(2,而后几乎95%的样本自相关系数ˆk ρ都落在2倍标准差范围之内,并且由非零样本自相关系数衰减为在零附近小值波动的过程非常突然,这时通常视为自相关系数{}k ρ截尾,既可以初步判定相应的时间序列为MA(q )模型(2) 同样,样本偏自相关系数{}ˆkkφ如果满足上述性质,则可以初步判定相应的时间序列为AR(p )模型。

(3) 对于样本自相关系数{}ˆk ρ和样本偏自相关系数{}ˆkkφ,如果均有超过5%的值落入2倍标准差范围之外,或者由非零样本自相关系数和样本偏自相关系数衰减为在零附近小值波动的过程非常缓慢,这时都视为不戴尾的,我们将初步判定时间序列为ARMA 模型,那么这样的判断往往会失效,因为这时ARMA(p,q )模型的阶数p 和q 很难确定。

总之,基于样本自相关和偏自相关系数的定阶法只是一种初步定阶方法,可在建模开始时加以粗略地估计。

例5.1绿头苍蝇数据的时间序列。

具有均衡性别比例数目固定的成年绿头苍蝇保存在一个盒子中,每天给一定数量的食物,每天对绿头苍蝇的总体计数,共得到T=82个观测值。

经过平稳性处理后计算其基于样本自相关和偏自相关系数,见表5.1表5.1 绿头苍蝇的样本ACF 和PACF图5.2绿头苍蝇的样本ACF 和PACF由表5.1和图5.2知,样本自相关函数}ˆ{k ρ呈拖尾状,而从10个偏自相关系数的绝对值来看,除11ˆφ显著地异于零之外,其余90.11==的有8个,80.8968.3%9≈>,故该时间序列初步判定为AR(1)模型。

例5.2某时间序列数据(T=273)的样本自相关系数和偏自相关系数计算数据如下:表5.2 某时间序列数据的样本自/偏自相关系数由上表知,样本自相关函数}ˆ{k ρ呈拖尾状,而从15个偏自相关系数的绝对值来看,除11ˆφ,22ˆφ显著地异于零之外,其余13个中绝对值不大于0.0605==的有9个,%3.68692.0139≈=,故该时间序列初步判定为AR(2)模型。

例5.3 某车站1993-1997年个月的列车运行数量数据共60个,见表5.3,试对该序列给出初步的模型识别。

表5.3 某车站1993-1997年个月的列车运行数量数据(单位:千列·千米)图5.3,5.4分别为原始数据和平稳化以后(第8章将给出具体平稳化方法)数据的散点图。

图5.3 列车运行数量数据 图5.4 平稳化列车运行数量数据经过计算,其前20个样本自相关系数和偏自相关系数如下 表5.4 平稳化列车运行数量数据样本自/偏自相关系数样本自相关系数样本偏自相关系数kˆk ρkˆk ρkˆkkφ kˆkkφ 1 2 3 4 5 6 7 8 9 10-0.685 0.341 -0.193 0.042 -0.068 0.199 -0.221 0.185 -0.130 0.03711 12 13 14 15 16 17 18 19 20-0.036 0.156 -0.165 0.038 0.001 -0.027 0.143 -0.130 0.004 0.0211 2 3 4 5 6 7 8 9 10-0.685 -0.243 -0.139 -0.208 -0.313 0.046 -0.030 -0.037 -0.002 -0.04211 12 13 14 15 16 17 18 19 20-0.130 0.139 0.136 -0.184 -0.120 -0.012 0.196 0.025 -0.143 -0.073由上表知,样本自相关函数{}ˆkkφ呈拖尾状,而从20个自相关系数的绝对值来看,样本自相关系数{}ˆk ρ在最初的2阶明显的大于2倍标准差范围,即(-0.26, 0.26),而后95%以上的样本自相关系数ˆk ρ都落在(-0.26, 0.26)内,并且由非零样本自相关系数衰减为在零附近小值波动的过程非常突然,这时通常视为自相关系数{}k ρ截尾,故该时间序列初步判定为MA(2)或MA(3)模型。

相关文档
最新文档