SAS学习系列39. 时间序列分析Ⅲ—ARIMA模型
SAS学习系列39时间序列分析Ⅲ—ARIMA模型

SAS学习系列39时间序列分析Ⅲ—ARIMA模型ARIMA模型(自回归移动平均模型)是一种广泛应用于时间序列分析中的统计模型。
在时间序列数据中,存在着一定的趋势和季节性变动,ARIMA模型可以帮助我们揭示和预测这些变动。
ARIMA模型由三个部分组成:自回归(AR)、差分(I)和移动平均(MA)。
下面我们具体来介绍一下这三个部分的含义和作用。
首先是自回归(AR)部分。
自回归是指当前时刻的数值与前几个时刻的数值之间存在相关性,即当前时刻的数值与之前一段时间的数值有关。
AR模型通过计算时间序列与其前几个时刻的线性组合来预测未来的值。
AR模型的阶数p表示使用多少个历史时刻的数值来进行预测。
其次是差分(I)部分。
差分是指对时间序列进行差分处理,即对相邻两个时刻的数值进行相减,目的是去除时间序列中的趋势性。
差分阶数d表示对时间序列进行差分的次数,通常根据时间序列的趋势性确定。
最后是移动平均(MA)部分。
移动平均是指当前时刻的数值与前几个时刻的误差的加权和有关,即通过计算与历史误差的加权平均来预测未来的值。
MA模型的阶数q表示使用多少个历史误差来进行预测。
通过将这三个部分合并在一起,就可以构建ARIMA模型。
ARIMA模型可以表示为ARIMA(p,d,q),其中p是自回归模型的阶数,d是差分阶数,q是移动平均模型的阶数。
在SAS中,可以使用PROCARIMA来建立ARIMA模型。
首先需要通过分析时间序列的自相关图、偏自相关图和ACF/PACF图来确定ARIMA模型的阶数。
然后使用PROCARIMA来估计模型参数,并进行模型拟合和预测。
ARIMA模型在时间序列分析中应用广泛,可以用于预测股票价格、商品销量、气温等数据的变动趋势。
此外,ARIMA模型还可以用于检测时间序列数据的稳定性和平稳性,以及识别时间序列中的异常值和异常模式。
总之,ARIMA模型是一种常用的时间序列分析工具,能够帮助我们揭示和预测时间序列数据中的趋势和季节性变动。
时间序列分析中的ARIMA模型

时间序列分析中的ARIMA模型时间序列分析是一种对时间序列数据进行分析和预测的模型,在现代经济学、金融学、气象学、物理学、工业生产等领域中有着广泛的应用。
ARIMA模型是时间序列分析中最为基础和经典的模型之一,其对于时间序列的平稳性、趋势性及季节性进行分解后,通过自相关函数和偏自相关函数的分析,得出模型的阶数和参数,进而进行模拟、预测和检验等步骤。
一、时间序列分析简介时间序列通常是指在某个时间段内,观测某种现象的数值,如个人月收入、经济指标、气温等。
时间序列的基本特点有趋势性、季节性、周期性、自相关和非平稳性等。
时间序列分析的目的就是对序列进行建模,找出序列中的规律性和非规律性,并对序列进行预测。
时间序列建模的基础是对序列的平稳性进行分析,若序列在时间上呈现平稳性,则可以使用分析预测方法来建模;反之,若序列不满足平稳性的要求,则需要进行差分处理,将其转换为平稳时间序列,再进行建模。
二、ARIMA模型的概述ARIMA模型是自回归移动平均模型的简称,该模型由自回归模型(AR)和移动平均模型(MA)组成,是时间序列分析中最为经典的模型之一。
ARIMA模型是一种线性模型,对于简单的时间序列分析具有良好的解释性,同时模型的表现能力也比较强。
ARIMA模型对于时间序列的建模和预测主要涉及三个方面:趋势项(Trend)、季节项(Seasonal)和误差项(Error)。
趋势项指的是时间序列中的长期趋势,在某一个方向上呈现出来的变化;季节项指的是时间序列中呈现出来的周期性变化;误差项指的是时间序列的随机波动。
ARIMA模型通常用一个(p, d, q)的表示方式描述,其中,p是自回归项数,d是差分次数,q是滑动平均项数。
P 和q 分别定义了线性拟合时窗口函数的大小,模型的复杂度取决于 p,d 和 q 的选择。
ARIMA模型主要分为“定常”和“非定常”模型两大类。
在建模中,首先需要检验时间序列的平稳性,若时间序列不符合平稳性的要求,则需要进行差分操作,将其转化为平稳的时间序列。
时间序列分析与ARIMA模型

时间序列分析与ARIMA模型时间序列分析是一种研究时间上连续测量所构成的数据的方法。
它可以用来分析数据中的趋势、周期性和随机性,并预测未来的走势。
ARIMA(自回归滑动平均模型)是时间序列分析中常用的模型之一。
本文将介绍时间序列分析的基本概念以及ARIMA模型的原理和应用。
一、时间序列分析的基本概念时间序列是按照时间顺序排列的一组连续观测数据。
在时间序列分析中,我们常常关注序列中的趋势(trend)、季节性(seasonality)和周期性(cycle)等特征。
趋势是指长期上升或下降的走势;季节性是指数据在相同周期内波动的规律性;周期性是指超过一年的时间内出现的规律性波动。
二、ARIMA模型的原理ARIMA模型是由自回归(AR)和滑动平均(MA)模型组成的。
AR模型用过去的观测值来预测未来的值,滑动平均模型则用过去的噪声来预测未来的值。
ARIMA模型是将这两种模型结合起来,对时间序列进行建模和预测。
ARIMA模型包括三个主要部分:自回归阶数(p)、差分阶数(d)和滑动平均阶数(q)。
p表示模型中的自回归项数目,d表示需要进行的差分次数,q表示模型中的滑动平均项数目。
通过对时间序列的观测值进行差分,ARIMA模型可以将非平稳的序列转化为平稳的序列。
然后,可以通过对平稳序列的自回归和滑动平均建模,预测未来的值。
三、ARIMA模型的应用ARIMA模型在实际应用中被广泛使用。
它可以用于经济学、金融学、气象学等领域中的时间序列预测和分析。
以股票市场为例,投资者可以利用ARIMA模型对历史股价进行分析,预测未来股价的走势。
在气象学中,ARIMA模型可以用于预测未来的天气情况。
除了ARIMA模型,时间序列分析还包括其他模型,如季节性分解、移动平均、指数平滑等。
这些模型都有各自的优点和应用领域。
在实际应用中,根据不同的数据特点和研究目的,选择合适的模型进行分析和预测是十分重要的。
总结时间序列分析和ARIMA模型是研究时间数据的重要方法。
arima模型原理详解

arima模型原理详解ARIMA模型是一种时间序列分析方法,用于预测未来的数值序列。
它可以分解和描述时间序列中的趋势、周期性和随机性。
ARIMA模型通过三个参数来描述时间序列数据的特性:自回归阶数p、差分阶数d和移动平均阶数q。
首先,ARIMA模型中的AR代表自回归(Autoregressive),它表示当前值与过去几个值的线性组合之间的关系。
AR模型的阶数p决定了过去值的数量。
如果p=1,则当前值只与过去一个时间步的值相关。
如果p大于1,则当前值与过去p个时间步的值相关。
AR模型可以表示为:y(t)=c+φ₁y(t-1)+φ₂y(t-2)+…+φₚy(t-p)+e(t)其中,y(t)是时间步t处的观测值,c是常数,φ₁~φₚ是权重参数,e(t)是误差项。
AR模型的核心思想是,当前值与过去值之间存在其中一种线性关系,通过调整权重参数φ来拟合这种关系。
接下来,ARIMA模型中的I代表差分(Integrated),它用于处理时间序列数据中的趋势。
如果时间序列数据是非平稳的,即存在趋势的变化,我们可以通过对数据进行差分来使其平稳化。
差分阶数d表示差分的次数。
如果d=1,则对时间序列进行一次差分,得到的差分数据不再具有趋势。
如果d大于1,则对差分数据再进行d-1次差分,以进一步消除趋势。
经过差分处理后的时间序列可以表示为:Δy(t)=y(t)-y(t-1)其中,Δy(t)表示时间步t处的差分值。
最后,ARIMA模型中的MA代表移动平均(Moving Average),它表示当前值与过去几个误差项的线性组合之间的关系。
MA模型的阶数q决定了过去误差项的数量。
如果q=1,则当前值只与过去一个误差项相关。
如果q大于1,则当前值与过去q个误差项相关。
MA模型可以表示为:y(t)=μ+e(t)+θ₁e(t-1)+θ₂e(t-2)+…+θₚe(t-q)其中,μ是均值,e(t)是时间步t处的误差项,θ₁~θₚ是权重参数。
arima模型解释

ARIMA(AutoRegressive Integrated Moving Average)模型是一种用于时间序列分析和预测的统计模型。
它结合了自回归(AR)、积分(I)和移动平均(MA)三个组成部分。
ARIMA模型通常用于处理非平稳时间序列数据,通过差分操作可以将非平稳时间序列转化为平稳时间序列。
ARIMA模型由三个参数来描述,分别是p、d、q:- p(自回归阶数):表示模型中自回归部分的阶数。
即用多少个过去的观测值来预测当前的值。
- d(差分阶数):表示为了使时间序列变得平稳,需要进行的差分操作的次数。
差分操作是指当前时刻的观测值与其前一个时刻的观测值之差。
- q(移动平均阶数):表示模型中移动平均部分的阶数。
即用多少个过去的误差值来预测当前的值。
ARIMA模型的一般形式可以表示为ARIMA(p, d, q)。
在应用ARIMA模型时,通常需要通过观察时间序列的自相关图(ACF)和偏自相关图(PACF)来确定合适的p、d、q值。
ARIMA模型的预测过程包括以下步骤:1. 数据平稳化(Stationarity):对原始时间序列进行差分操作,直到得到平稳时间序列。
2. 模型拟合(Model Fitting):利用差分后的平稳时间序列,通过观察ACF 和PACF选择合适的p、d、q值,拟合ARIMA模型。
3. 模型诊断(Model Diagnosis):检查模型的残差序列,确保它们是白噪声,即不存在系统性的模式。
4. 预测(Forecasting):使用拟合好的ARIMA模型进行未来时刻的预测。
总的来说,ARIMA模型是一种强大的时间序列分析工具,适用于各种不同类型的时间序列数据。
时序预测中的ARIMA模型详解(Ⅰ)

时序预测中的ARIMA模型详解时序预测是一种重要的统计分析方法,通过对历史数据的分析和预测,可以为未来的决策提供有力的支持。
自动回归综合移动平均模型(ARIMA)是一种常用的时序预测方法,它结合了自回归、差分和移动平均的特点,能够对非平稳的时序数据进行建模和预测。
本文将详细介绍ARIMA模型的原理、应用和参数选择方法。
1. ARIMA模型的原理ARIMA模型是由自回归模型(AR)和移动平均模型(MA)组成的,其中AR模型考虑了时序数据自身的滞后项的影响,而MA模型考虑了误差项的滞后项的影响。
ARIMA模型还引入了差分(I)的概念,用来处理非平稳的时序数据。
ARIMA(p, d, q)模型包括了自回归阶数p、差分次数d和移动平均阶数q三个参数,其中p和q是非负整数,d是非负整数或零。
ARIMA模型的原理可以用数学公式表示为:Yt = c + φ1Yt-1 + φ2Yt-2 + ... + φpYt-p + εt - θ1εt-1 -θ2εt-2 - ... - θqεt-q其中Yt表示时序数据的值,c表示常数项,φ1, φ2, ..., φp和θ1,θ2, ..., θq分别表示自回归和移动平均的系数,εt表示误差项。
2. ARIMA模型的应用ARIMA模型广泛应用于金融、经济、气象、环境等领域的时序数据预测中。
例如,在金融领域,ARIMA模型可以用来预测股票价格、汇率等金融指标的走势;在经济领域,ARIMA模型可以用来预测国内生产总值(GDP)、消费指数等经济指标的变化;在气象领域,ARIMA模型可以用来预测气温、降雨量等气象变量的变化;在环境领域,ARIMA模型可以用来预测空气质量、水质等环境指标的变化。
3. ARIMA模型的参数选择ARIMA模型的参数选择是一个重要的问题,通常可以通过自相关函数(ACF)和偏自相关函数(PACF)来进行参数的初步选择。
首先对时序数据进行差分,直到得到平稳的数据;然后通过ACF和PACF的图形分析,找到合适的p和q值,最后通过模型的拟合度和残差的自相关性来选择合适的参数。
浅谈时间序列分析——以ARIMA为例

浅谈时间序列分析——以ARIMA为例时间序列分析是研究固定时间间隔下观测到的数据的统计方法,可以用于预测未来数据趋势、检验数据的稳定性和相关性等问题。
ARIMA(自回归移动平均模型)是时间序列分析中应用广泛的方法之一,结合自回归模型和移动平均模型,可以对具有一定规律性的时间序列数据进行建模和预测。
ARIMA模型的核心思想是通过对过去时间点的观测值进行回归分析,得到一个线性函数,然后通过对残差进行移动平均,得到模型的建模。
ARIMA模型包括三个参数,分别为p、d和q:1.p表示自回归(AR)的阶数,即利用过去p个时间点的观测值来预测当前时间点的观测值。
自回归模型假设当前观测值与过去观测值之间存在相关性。
2. d表示差分(difference)的次数,即对时间序列进行平稳化处理的阶数。
如果原始数据不平稳,需要对其进行一阶或多阶差分,使得序列变得平稳。
3.q表示移动平均(MA)的阶数,即利用过去q个时间点的残差来预测当前时间点的观测值。
移动平均模型假设当前观测值与过去残差之间存在相关性。
ARIMA模型的选择可以通过观察自相关图(ACF)和部分自相关图(PACF)来确定,ACF表示给定滞后度的观测值与其他滞后度的观测值之间的相关性,PACF表示给定滞后度的观测值与其他滞后度的观测值之间的部分相关性。
在实际应用中,ARIMA模型的建立需要经过以下步骤:1.对原始时间序列进行平稳性检验。
平稳序列的均值和方差应该是常数,相关性不随时间变化而变化。
2.如果序列不平稳,需要进行差分运算,直到序列变为平稳序列为止。
3.对差分后的序列进行ACF和PACF分析,确定合适的ARIMA阶数。
4.根据确定的ARIMA阶数,进行模型拟合。
可以使用极大似然估计法或最小二乘法来估计模型参数。
5.检验模型残差的平稳性和正态性。
对于平稳性和正态性的检验,可以使用ADF检验和Q-Q图。
6.利用已经确定的模型对未来的数据进行预测。
ARIMA模型的建立虽然相对简单,但对数据的平稳性和阶数的选择要求较高。
时序预测中的ARIMA模型详解(十)

时序预测中的ARIMA模型详解一、引言时序预测是指根据一系列时间上连续的数据,对未来时间点或时间段内的数据进行预测。
这种预测方法在经济、金融、气象、交通等领域都有着广泛的应用。
而在时序预测中,ARIMA模型是一种常用的方法,本文将对ARIMA模型进行详细解读。
二、ARIMA模型概述ARIMA模型是自回归移动平均模型(Autoregressive Integrated Moving Average Model)的缩写,它是一种基于时间序列数据的预测模型。
ARIMA模型包含三个部分,分别为自回归(AR)、差分(I)和移动平均(MA)。
ARIMA模型的基本思想是,通过将非平稳的时间序列数据进行差分,使其成为平稳序列,然后建立ARMA模型进行预测。
三、ARIMA模型的建模过程1. 根据数据特征确定模型参数在建立ARIMA模型之前,首先需要对时间序列数据进行分析。
通过观察数据的自相关性和偏自相关性函数图,确定ARIMA模型的阶数。
自相关性函数图可以帮助我们找到时间序列数据的自相关性模式,从而确定AR模型的阶数。
偏自相关性函数图则可以帮助我们确定MA模型的阶数。
2. 数据平稳化ARIMA模型要求时间序列数据是平稳的,因此如果数据是非平稳的,需要对其进行差分处理。
差分的目的是使数据的均值和方差保持不变,从而使其成为平稳序列。
3. 模型训练和预测在确定了ARIMA模型的阶数和对数据进行平稳化后,就可以进行模型的训练和预测。
模型的训练是指利用历史数据对ARIMA模型的参数进行估计,然后利用训练好的模型进行未来数据的预测。
四、ARIMA模型的优缺点ARIMA模型作为一种经典的时序预测模型,具有以下优点:1. 适用性广泛:ARIMA模型适用于各种类型的时间序列数据,包括具有趋势和季节性的数据。
2. 参数可解释性强:ARIMA模型的参数具有明确的统计学意义,便于解释和理解。
然而,ARIMA模型也有一些缺点:1. 对数据要求高:ARIMA模型要求时间序列数据是平稳的,而有些实际数据不满足这一条件,需要进行差分处理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
39. 时间序列分析Ⅱ——ARIMA 模型随着对时间序列分析方法的深入研究,人们发现非平稳序列的确定性因素分解方法(如季节模型、趋势模型、移动平均、指数平滑等)只能提取显著的确定性信息,对随机性信息浪费严重,同时也无法对确定性因素之间的关系进行分析。
而非平稳序列随机分析的发展就是为了弥补确定性因素分解方法的不足。
时间序列数据分析的第一步都是要通过有效手段提取序列中所蕴藏的确定性信息。
Box 和Jenkins 使用大量的案例分析证明差分方法是一种非常简便有效的确定性信息的提取方法。
而Gramer 分解定理则在理论上保证了适当阶数的差分一定可以充分提取确定性信息。
(一)ARMA 模型即自回归移动平均移动模型,是最常用的拟合平稳时间序列的模型,分为三类:AR 模型、MA 模型和ARMA 模型。
一、AR(p )模型——p 阶自回归模型 1. 模型:011t t p t p t x x x φφφε--=+++其中,0p φ≠,随机干扰序列εt 为0均值、2εσ方差的白噪声序列(()0t s E εε=, t ≠s ),且当期的干扰与过去的序列值无关,即E(x t εt )=0.由于是平稳序列,可推得均值11pφμφφ=---. 若00φ=,称为中心化的AR (p )模型,对于非中心化的平稳时间序列,可以令01(1)p φμφφ=---,*t t x x μ=-转化为中心化。
记B 为延迟算子,1()p p p B I B B φφΦ=---称为p 阶自回归多项式,则AR (p )模型可表示为:()p t t B x εΦ=.2. 格林函数用来描述系统记忆扰动程度的函数,反映了影响效应衰减的快慢程度(回到平衡位置的速度),G j 表示扰动εt-j 对系统现在行为影响的权数。
例如,AR(1)模型(一阶非齐次差分方程),1, 0,1,2,j j G j φ==模型解为0t j t j j x G ε∞-==∑.3. 模型的方差对于AR(1)模型,2221()()1t jt j j Var x G Var εσεφ∞-===-∑. 4. 模型的自协方差对中心化的平稳模型,可推得自协方差函数的递推公式:用格林函数显示表示:200()()i j t j t k j j kj i j j k G G E GG γεεσ∞∞∞---+=====∑∑∑对于AR(1)模型,21121()(0)1k k k εσγφγφφ==- 5. 模型的自相关函数 递推公式:对于AR(1)模型,11()(0)k k k ρφρφ==.平稳AR(p )模型的自相关函数有两个显著的性质: (1)拖尾性指自相关函数ρ(k )始终有非零取值,不会在k 大于某个常数之后就恒等于零;(2)负指数衰减随着时间的推移,自相关函数ρ(k )会迅速衰减,且以负指数k i λ(其中i λ为自相关函数差分方程的特征根)的速度在减小。
6. 模型的偏自相关函数自相关函数ρ(k)实际上并不只是x t与x t-k之间的相关关系,它还会受到中间k-1个随机变量x t-1, …, x t-k+1的影响。
为了能剔除了中间k-1个随机变量的干扰,单纯测度x t与x t-k之间的相关关系,引入了滞后k 偏自相关函数(PACF),计算公式为:其中,滞后k偏自相关函数实际上等于k阶自回归模型第k个回归系数φ:kkγ得到两边同乘以x t-k,求期望再除以(0)取前k个方程构成的方程组:称为Yule-Walker方程,可以解出φ.kk可以证明平稳AR(p)模型,当k>p时,0φ=. 即平稳AR(p)模型kk的偏自相关函数具有p步截尾性。
注:实际上样本的随机性使得偏自相关函数不是严格截尾,例如上面两图都1阶显著不为0,1阶之后都近似为0.二、MA(q)模型——q 阶移动平均模型1. 模型:其中,0q θ≠,随机干扰序列t ε为0均值、2εσ方差的白噪声序列(()0t s E εε=, t ≠s )。
若μ=0,称为中心化的MA(q)模型,非中心化的MA(q)模型可以通过*t t x x μ=-转化为中心化。
记B 为延迟算子,1()q q q B I B B θθΘ=---称为q 阶自移动平均系数多项式,则中心化MA(q)模型可以表示为()t q t x B ε=Θ.2. 模型的方差3. 模型的自协方差只与滞后阶数k 相关,且q 阶截尾。
当k=0时,当1≤k ≤q 时,当k>q 时,()0k γ=.4. 模型的自相关函数:()()(0)k k γργ=(q 阶截尾性)5. 模型的滞后k 阶偏自相关函数(中心化)可以证明滞后k 阶偏自相关函数具有拖尾性。
6. 模型的可逆性 以MR(1)为例,模型Ⅰ:1111tt t t tx x Bεθεεθ-=-=-或模型Ⅱ:111111t t t t t x x Bεεεθθ-=-=-或 它们的自相关函数2111/(1)ρθθ=-+相同(即相同的自相关函数对应不同的回归模型),为了保证对应的唯一性,需要增加约束条件,即MR(q)模型的可逆性条件。
观察两个模型的第二种表示:当1||1θ<时,模型Ⅰ收敛、模型Ⅱ不收敛;当1||1θ>时,模型Ⅰ不收敛、模型Ⅱ收敛。
表示成收敛形式的MR(q)模型称为可逆MR(q)模型。
一个自相关函数只对应唯一一个可逆MR(q)模型。
三、ARMA(p, q)模型——自回归移动平均模型1. 模型其中,0p φ≠,0q θ≠,随机干扰序列εt 为0均值、2εσ方差的白噪声序列(()0t s E εε=, t ≠s ),且当期的干扰与过去的序列值无关,即E(x t εt )=0.若0=0φ,则称为中心化的ARMA(p,q)模型。
引入延迟算子,中心化的ARMA(p,q)模型可表示为:()()p t q t B x B εΦ=Θ.显然,AR(p)和MA(q)模型是ARMA(p,q)模型的特例。
2. 数字特征 (1)均值:01()1t pE x φφφ=---;(2)自协方差函数:20()i i k i k G G εγσ∞+==∑,其中G i 为格林函数;(3)自相关函数:020()()(0)i i ki ii G Gk k Gγργ∞+=∞===∑∑3. 模型的初步定阶对于平稳非白噪声序列,计算出样本自相关系数(ACF )和偏自相关系数(PACF ),根据其性质估计自相关阶数ˆp和移动平均阶数ˆq ,称为ARMA(p,q)模型的定阶。
可以推导出:样本自相关函数ˆ()k ρ和偏自相关函数ˆkkφ都近似服从正态分布1(0,)N n.取显著水平α=0.05,若样本自相关系数和样本偏自相关系数在最初的k 阶明显大于2倍标准差,而后几乎95%的系数都落在2倍标准差的范围内,且非零系数衰减为小值波动的过程非常突然,通常视为k 阶截尾;若有超过5%的样本相关系数大于2倍标准差,或者非零系数衰减为小值波动的过程比较缓慢或连续,通常视为拖尾。
4. 参数估计对非中心化的ARMA(p,q)模型()()qt tpBxBμεΘ=+Φ.参数μ可用样本均值来估计总体均值(矩估计法),初步定阶估计出自相关阶数ˆp和移动平均阶数ˆq后,模型共有p+q+1个未知参数:211,,,,,,p qεφφθθσ.(1)参数的矩估计用时间序列样本数据计算出延迟1阶到p+q阶的样本自相关函数ˆ()kρ,延迟k阶的总体自相关函数为11(,,,,,)k p qρφφθθ. 用计算出的样本自相关函数来估计总体自相函数,得到p+q个联立方程组:从中解出11,,,,,p qφφθθ的值作为未知参数估计值11ˆˆˆˆ,,,,,p qφφθθ. ARMA(p,q)模型的两边同时求方差,并把前面的参数的估计值代入,可得白噪声序列的方差估计为:(2)参数的极大似然估计当总体分布类型已知时,极大似然估计是常用的估计方法。
其基本思想是,认为样本来自使该样本出现概率最大的总体。
因此,未知参数的极大似然估计,就是使得似然函数(即联合密度函数)达到最大值的参数值:在时间序列分析中,序列的总体分布通常是未知的。
为了便于分析和计算,通常假设序列服从多元正态分布,它的联合密度函数是可导的。
在求极大似然估计时,为了求导方便,常对似然函数取对数,然后对对数似然函数中的未知参数求偏导数,得到似然方程组。
理论上,只要求解似然方程组即可得到未知参数的极大似然估计。
但在实际上是使用计算机经过复杂的迭代算法求出未知参数的极大似然估计。
两种估计的比较:矩估计的优点是不要求知道总体的分布,计算量小,估计思想简单直观。
但缺点是只用到了样本自相关系数的信息,序列中的其他信息被忽略了,这导致估计精度一般较差。
因此,它常被作为极大似然估计和最小二乘估计的迭代计算的初始值。
极大似然估计的优点是充分应用了每一个观察值所提供的信息,因而它的估计精度高,同时,还具有估计的一致性、渐近正态性和渐近有效性等优良统计性质,是一种非常优良的参数估计方法。
(3)参数的最小二乘估计使ARMA(p,q)模型的残差平方和达到最小的那组参数值:通过计算机借助迭代方法求出。
由于充分利用了序列的信息,该方法估计精度最高。
在实际运用中,最常用的是条件最小二乘估计,假定时间序列过去未观察到序列值等于序列均值,可得到残差的有限项表达式:于是残差平方和达到最小的那组参数值为:5. 模型和参数的显著性检验ARMA(p,q)模型中,使用Q LB统计量检验残差序列的自相关性,为了克服DW检验的有偏性,Durbin在1970年提出了修正的Durbin h统计量:其中,n为观察值序列的长度,2σ为延迟因变量系数的最小二乘估计β的方差。
参数的显著性检验是要检验每一个模型参数是否显著非零。
若某个参数为零,模型中包含这个参数的乘积项就为零,可以简化模型。
因此,该检验的是为了精简模型。
原假设H0:某未知参数βj=0;H1:βj≠0. 可以构造出检验未知参数显著性的t(n-m)检验统计量,其中m为参数的个数。
6. 模型优化当一个拟合模型在置信水平α下通过了检验,说明了在该置信水平下该拟合模型能有效地拟合时间序列观察值的波动。
但是这种有效的拟合模型并不是惟一的。
如果同一个时间序列可以构造两个拟合模型,且两个模型都显著有效,那么应该选择哪个拟合模型用于统计推断呢?通常采用AIC 和SBC信息准则来进行模型优化。
(1)AIC准则——最小信息量准则由日本统计学家赤池弘次(Akaike)于1973年提出,是一种考评综合最优配置的指标,它是拟合精度和参数未知个数的加权函数:AIC=-2ln(模型中极大似然函数值)+2(模型中未知参数个数)使其达到最小值的模型被认为是最优模型。
(2)BIC/SBC准则AIC准则的不足:若时间序列很长,相关信息就越分散,需要多自变量复杂拟合模型才能使拟合精度比较高。