SAS学习系列39.时间序列分析报告Ⅲ—ARIMA模型

合集下载

SAS学习系列39时间序列分析Ⅲ—ARIMA模型

SAS学习系列39时间序列分析Ⅲ—ARIMA模型

SAS学习系列39时间序列分析Ⅲ—ARIMA模型ARIMA模型(自回归移动平均模型)是一种广泛应用于时间序列分析中的统计模型。

在时间序列数据中,存在着一定的趋势和季节性变动,ARIMA模型可以帮助我们揭示和预测这些变动。

ARIMA模型由三个部分组成:自回归(AR)、差分(I)和移动平均(MA)。

下面我们具体来介绍一下这三个部分的含义和作用。

首先是自回归(AR)部分。

自回归是指当前时刻的数值与前几个时刻的数值之间存在相关性,即当前时刻的数值与之前一段时间的数值有关。

AR模型通过计算时间序列与其前几个时刻的线性组合来预测未来的值。

AR模型的阶数p表示使用多少个历史时刻的数值来进行预测。

其次是差分(I)部分。

差分是指对时间序列进行差分处理,即对相邻两个时刻的数值进行相减,目的是去除时间序列中的趋势性。

差分阶数d表示对时间序列进行差分的次数,通常根据时间序列的趋势性确定。

最后是移动平均(MA)部分。

移动平均是指当前时刻的数值与前几个时刻的误差的加权和有关,即通过计算与历史误差的加权平均来预测未来的值。

MA模型的阶数q表示使用多少个历史误差来进行预测。

通过将这三个部分合并在一起,就可以构建ARIMA模型。

ARIMA模型可以表示为ARIMA(p,d,q),其中p是自回归模型的阶数,d是差分阶数,q是移动平均模型的阶数。

在SAS中,可以使用PROCARIMA来建立ARIMA模型。

首先需要通过分析时间序列的自相关图、偏自相关图和ACF/PACF图来确定ARIMA模型的阶数。

然后使用PROCARIMA来估计模型参数,并进行模型拟合和预测。

ARIMA模型在时间序列分析中应用广泛,可以用于预测股票价格、商品销量、气温等数据的变动趋势。

此外,ARIMA模型还可以用于检测时间序列数据的稳定性和平稳性,以及识别时间序列中的异常值和异常模式。

总之,ARIMA模型是一种常用的时间序列分析工具,能够帮助我们揭示和预测时间序列数据中的趋势和季节性变动。

时间序列分析中的ARIMA模型

时间序列分析中的ARIMA模型

时间序列分析中的ARIMA模型时间序列分析是一种对时间序列数据进行分析和预测的模型,在现代经济学、金融学、气象学、物理学、工业生产等领域中有着广泛的应用。

ARIMA模型是时间序列分析中最为基础和经典的模型之一,其对于时间序列的平稳性、趋势性及季节性进行分解后,通过自相关函数和偏自相关函数的分析,得出模型的阶数和参数,进而进行模拟、预测和检验等步骤。

一、时间序列分析简介时间序列通常是指在某个时间段内,观测某种现象的数值,如个人月收入、经济指标、气温等。

时间序列的基本特点有趋势性、季节性、周期性、自相关和非平稳性等。

时间序列分析的目的就是对序列进行建模,找出序列中的规律性和非规律性,并对序列进行预测。

时间序列建模的基础是对序列的平稳性进行分析,若序列在时间上呈现平稳性,则可以使用分析预测方法来建模;反之,若序列不满足平稳性的要求,则需要进行差分处理,将其转换为平稳时间序列,再进行建模。

二、ARIMA模型的概述ARIMA模型是自回归移动平均模型的简称,该模型由自回归模型(AR)和移动平均模型(MA)组成,是时间序列分析中最为经典的模型之一。

ARIMA模型是一种线性模型,对于简单的时间序列分析具有良好的解释性,同时模型的表现能力也比较强。

ARIMA模型对于时间序列的建模和预测主要涉及三个方面:趋势项(Trend)、季节项(Seasonal)和误差项(Error)。

趋势项指的是时间序列中的长期趋势,在某一个方向上呈现出来的变化;季节项指的是时间序列中呈现出来的周期性变化;误差项指的是时间序列的随机波动。

ARIMA模型通常用一个(p, d, q)的表示方式描述,其中,p是自回归项数,d是差分次数,q是滑动平均项数。

P 和q 分别定义了线性拟合时窗口函数的大小,模型的复杂度取决于 p,d 和 q 的选择。

ARIMA模型主要分为“定常”和“非定常”模型两大类。

在建模中,首先需要检验时间序列的平稳性,若时间序列不符合平稳性的要求,则需要进行差分操作,将其转化为平稳的时间序列。

时序预测中的ARIMA模型详解(Ⅱ)

时序预测中的ARIMA模型详解(Ⅱ)

时序预测中的ARIMA模型详解时序预测是一项重要的研究课题,它涉及到对未来一段时间内的数据进行预测和分析。

在时序预测中,ARIMA(自回归移动平均)模型是一种常用的预测方法,它能够对时间序列数据进行建模和预测,具有较好的预测效果。

本文将对ARIMA模型进行详细地介绍和分析,以便读者更好地了解和应用该模型。

1. ARIMA模型的基本概念ARIMA模型是由自回归(AR)模型、差分(I)运算和移动平均(MA)模型组成的。

AR模型是指时间序列数据与其过去若干个时间点的值之间存在线性关系,而MA模型是指时间序列数据与其滞后值的误差之间存在线性关系。

差分运算是指对时间序列数据进行差分处理,将非平稳时间序列数据转换成平稳时间序列数据。

ARIMA模型能够很好地处理非平稳时间序列数据,并且适用于各种类型的时间序列预测问题。

2. ARIMA模型的建模过程ARIMA模型的建模过程包括模型识别、参数估计和模型检验三个步骤。

模型识别是指根据时间序列数据的自相关函数(ACF)和偏自相关函数(PACF)来确定ARIMA模型的阶数。

参数估计是指利用最大似然估计方法对ARIMA模型的参数进行估计。

模型检验是指对所建立的ARIMA模型进行残差检验,以验证模型的拟合效果和预测能力。

这三个步骤是建立ARIMA模型的关键,需要认真对待和仔细分析。

3. ARIMA模型的应用场景ARIMA模型适用于多种时间序列预测问题,例如股票价格预测、气温预测、销售额预测等。

在金融领域,ARIMA模型能够较好地捕捉股票价格的波动规律,帮助投资者进行风险控制和收益预测。

在气象领域,ARIMA模型能够准确地预测未来的气温变化趋势,为农业生产和城市规划提供重要参考。

在商业领域,ARIMA模型能够有效地预测销售额的变化,帮助企业制定营销策略和库存管理计划。

可以看出,ARIMA模型具有广泛的应用前景和市场需求。

4. ARIMA模型的局限性尽管ARIMA模型在时序预测中具有较好的预测效果,但它也存在一定的局限性。

时间序列分析与ARIMA模型

时间序列分析与ARIMA模型

时间序列分析与ARIMA模型时间序列分析是一种研究时间上连续测量所构成的数据的方法。

它可以用来分析数据中的趋势、周期性和随机性,并预测未来的走势。

ARIMA(自回归滑动平均模型)是时间序列分析中常用的模型之一。

本文将介绍时间序列分析的基本概念以及ARIMA模型的原理和应用。

一、时间序列分析的基本概念时间序列是按照时间顺序排列的一组连续观测数据。

在时间序列分析中,我们常常关注序列中的趋势(trend)、季节性(seasonality)和周期性(cycle)等特征。

趋势是指长期上升或下降的走势;季节性是指数据在相同周期内波动的规律性;周期性是指超过一年的时间内出现的规律性波动。

二、ARIMA模型的原理ARIMA模型是由自回归(AR)和滑动平均(MA)模型组成的。

AR模型用过去的观测值来预测未来的值,滑动平均模型则用过去的噪声来预测未来的值。

ARIMA模型是将这两种模型结合起来,对时间序列进行建模和预测。

ARIMA模型包括三个主要部分:自回归阶数(p)、差分阶数(d)和滑动平均阶数(q)。

p表示模型中的自回归项数目,d表示需要进行的差分次数,q表示模型中的滑动平均项数目。

通过对时间序列的观测值进行差分,ARIMA模型可以将非平稳的序列转化为平稳的序列。

然后,可以通过对平稳序列的自回归和滑动平均建模,预测未来的值。

三、ARIMA模型的应用ARIMA模型在实际应用中被广泛使用。

它可以用于经济学、金融学、气象学等领域中的时间序列预测和分析。

以股票市场为例,投资者可以利用ARIMA模型对历史股价进行分析,预测未来股价的走势。

在气象学中,ARIMA模型可以用于预测未来的天气情况。

除了ARIMA模型,时间序列分析还包括其他模型,如季节性分解、移动平均、指数平滑等。

这些模型都有各自的优点和应用领域。

在实际应用中,根据不同的数据特点和研究目的,选择合适的模型进行分析和预测是十分重要的。

总结时间序列分析和ARIMA模型是研究时间数据的重要方法。

arima模型原理详解

arima模型原理详解

arima模型原理详解ARIMA模型是一种时间序列分析方法,用于预测未来的数值序列。

它可以分解和描述时间序列中的趋势、周期性和随机性。

ARIMA模型通过三个参数来描述时间序列数据的特性:自回归阶数p、差分阶数d和移动平均阶数q。

首先,ARIMA模型中的AR代表自回归(Autoregressive),它表示当前值与过去几个值的线性组合之间的关系。

AR模型的阶数p决定了过去值的数量。

如果p=1,则当前值只与过去一个时间步的值相关。

如果p大于1,则当前值与过去p个时间步的值相关。

AR模型可以表示为:y(t)=c+φ₁y(t-1)+φ₂y(t-2)+…+φₚy(t-p)+e(t)其中,y(t)是时间步t处的观测值,c是常数,φ₁~φₚ是权重参数,e(t)是误差项。

AR模型的核心思想是,当前值与过去值之间存在其中一种线性关系,通过调整权重参数φ来拟合这种关系。

接下来,ARIMA模型中的I代表差分(Integrated),它用于处理时间序列数据中的趋势。

如果时间序列数据是非平稳的,即存在趋势的变化,我们可以通过对数据进行差分来使其平稳化。

差分阶数d表示差分的次数。

如果d=1,则对时间序列进行一次差分,得到的差分数据不再具有趋势。

如果d大于1,则对差分数据再进行d-1次差分,以进一步消除趋势。

经过差分处理后的时间序列可以表示为:Δy(t)=y(t)-y(t-1)其中,Δy(t)表示时间步t处的差分值。

最后,ARIMA模型中的MA代表移动平均(Moving Average),它表示当前值与过去几个误差项的线性组合之间的关系。

MA模型的阶数q决定了过去误差项的数量。

如果q=1,则当前值只与过去一个误差项相关。

如果q大于1,则当前值与过去q个误差项相关。

MA模型可以表示为:y(t)=μ+e(t)+θ₁e(t-1)+θ₂e(t-2)+…+θₚe(t-q)其中,μ是均值,e(t)是时间步t处的误差项,θ₁~θₚ是权重参数。

时间序列中的ARIMA模型

时间序列中的ARIMA模型

时间序列中的ARIMA模型时间序列指的是一组按时间顺序排列的数据,这些数据通常都带有某种趋势、周期或季节性变化。

时间序列经常用于分析股票市场、商品价格、销售量等等。

因为随时间变化的规律性,使得时间序列分析成为了一种非常有效的预测方法。

而ARIMA模型则是对时间序列进行分析和预测的重要工具之一。

ARIMA模型(Autoregressive Integrated Moving Average Model)又称为差分自回归滑动平均模型,是一种以时间序列自身的滞后值和移动平均值为基础,对时间序列进行拟合和预测的统计模型。

ARIMA模型是其他一些时间序列分析工具的基础,比如自回归移动平均模型(ARMA)和指数平滑模型等等。

通常情况下,一个时间序列中包含以下三个方面的变化情况:1.趋势变化(Trend):即随着时间变化呈现的长期趋势,比如一个公司销售量的增长或下降趋势。

2.季节性变化(Seasonality):即固定周期性的变化,比如圣诞节或节假日前后销售量的高峰期。

3.不规则变化(Residual):即与时间没什么关系的随机波动,比如房价因为某些非时间相关的事件而突然上涨或下跌。

基于这些变化情况, ARIMA模型主要有以下三个参数:1.p:表示时间序列的滞后(Lag)阶数,即AR模型的自回归项数。

p越大,模型就会考虑越多的过去数据,但是过度拟合也会带来过多的噪音。

2.d:表示进行差分(隔期间差异)的次数,即使时间序列具有平稳性(Stationary)的一阶差分系列,d=1;否则,需要再进行差分,直到为平稳性。

3.q:表示滑动平均(MA)模型中移动平均项数,即在随机波动中引入前q个误差项。

实际应用中,ARIMA模型常常需要经过以下步骤:首先,检查时间序列数据是否平稳(Stationary),如果不是平稳状态,就需要对其进行处理,通常需要差分(Differencing)操作。

因为ARIMA模型只有在平稳性条件下才能产生可靠的估计结果。

arima模型解释

arima模型解释

ARIMA(AutoRegressive Integrated Moving Average)模型是一种用于时间序列分析和预测的统计模型。

它结合了自回归(AR)、积分(I)和移动平均(MA)三个组成部分。

ARIMA模型通常用于处理非平稳时间序列数据,通过差分操作可以将非平稳时间序列转化为平稳时间序列。

ARIMA模型由三个参数来描述,分别是p、d、q:- p(自回归阶数):表示模型中自回归部分的阶数。

即用多少个过去的观测值来预测当前的值。

- d(差分阶数):表示为了使时间序列变得平稳,需要进行的差分操作的次数。

差分操作是指当前时刻的观测值与其前一个时刻的观测值之差。

- q(移动平均阶数):表示模型中移动平均部分的阶数。

即用多少个过去的误差值来预测当前的值。

ARIMA模型的一般形式可以表示为ARIMA(p, d, q)。

在应用ARIMA模型时,通常需要通过观察时间序列的自相关图(ACF)和偏自相关图(PACF)来确定合适的p、d、q值。

ARIMA模型的预测过程包括以下步骤:1. 数据平稳化(Stationarity):对原始时间序列进行差分操作,直到得到平稳时间序列。

2. 模型拟合(Model Fitting):利用差分后的平稳时间序列,通过观察ACF 和PACF选择合适的p、d、q值,拟合ARIMA模型。

3. 模型诊断(Model Diagnosis):检查模型的残差序列,确保它们是白噪声,即不存在系统性的模式。

4. 预测(Forecasting):使用拟合好的ARIMA模型进行未来时刻的预测。

总的来说,ARIMA模型是一种强大的时间序列分析工具,适用于各种不同类型的时间序列数据。

浅谈时间序列分析——以ARIMA为例

浅谈时间序列分析——以ARIMA为例

浅谈时间序列分析——以ARIMA为例时间序列分析是运用统计学中的方法,对一系列按时间顺序排列的数据进行分析和预测的一种方法。

它可以帮助我们理解时间序列数据的趋势、季节性、周期性和随机性等特征,进而进行预测和决策。

ARIMA模型是时间序列模型中最常用的一种,它的全称是自回归移动平均模型(AutoRegressive Integrated Moving Average Model)。

ARIMA模型通过对时间序列进行差分、自回归和移动平均等操作,建立了一个线性的预测模型。

主要分为三个部分:自回归(AR)、差分(Integrated)和移动平均(MA)。

首先,自回归过程是指时间序列的当前值与前几个值之间的线性关系。

例如,AR(1)模型表示当前值与前一个值之间存在线性关系。

自回归的阶数p代表了与前p个值相关的线性关系。

自回归过程可以表示为:Y(t)=c+ϕ1*Y(t-1)+…+ϕp*Y(t-p)+ε(t)其中,c是常数项,ϕ1,…,ϕp是模型的系数,Y(t)是时间序列的当前值,Y(t-1),…,Y(t-p)是前p个时刻的值,ε(t)是白噪声误差。

其次,差分过程是为了消除非平稳性,使得时间序列变得平稳。

差分操作简单地说就是对时间序列的当前值与前一个值之间的差。

差分的阶数d代表了操作的次数。

差分过程可以表示为:dY(t)=Y(t)-Y(t-1)然后,移动平均过程是指时间序列的当前值与前几个误差项之间的线性关系。

例如,MA(1)模型表示当前值与前一个误差项之间存在线性关系。

移动平均的阶数q代表了与前q个误差项相关的线性关系。

移动平均过程可以表示为:Y(t)=c+θ1*ε(t-1)+…+θq*ε(t-q)+ε(t)其中,c是常数项,θ1,…,θq是模型的系数,ε(t-1),…,ε(t-q)是前q个时刻的误差项,ε(t)是当前时刻的误差项。

综上所述,ARIMA模型就是将自回归、差分和移动平均三个过程结合起来建立一个线性预测模型,用于对时间序列进行分析和预测。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

39. 时间序列分析Ⅱ——ARIMA 模型随着对时间序列分析方法的深入研究,人们发现非平稳序列的确定性因素分解方法(如季节模型、趋势模型、移动平均、指数平滑等)只能提取显著的确定性信息,对随机性信息浪费严重,同时也无法对确定性因素之间的关系进行分析。

而非平稳序列随机分析的发展就是为了弥补确定性因素分解方法的不足。

时间序列数据分析的第一步都是要通过有效手段提取序列中所蕴藏的确定性信息。

Box 和Jenkins 使用大量的案例分析证明差分方法是一种非常简便有效的确定性信息的提取方法。

而Gramer 分解定理则在理论上保证了适当阶数的差分一定可以充分提取确定性信息。

(一)ARMA 模型即自回归移动平均移动模型,是最常用的拟合平稳时间序列的模型,分为三类:AR 模型、MA 模型和ARMA 模型。

一、AR(p )模型——p 阶自回归模型 1. 模型:011t t p t p t x x x φφφε--=+++L其中,0p φ≠,随机干扰序列εt 为0均值、2εσ方差的白噪声序列(()0t s E εε=, t ≠s ),且当期的干扰与过去的序列值无关,即E(x t εt )=0.由于是平稳序列,可推得均值011pφμφφ=---L . 若00φ=,称为中心化的AR (p )模型,对于非中心化的平稳时间序列,可以令01(1)p φμφφ=---L ,*t t x x μ=-转化为中心化。

记B 为延迟算子,1()p p p B I B B φφΦ=---L 称为p 阶自回归多项式,则AR (p )模型可表示为:()p t t B x εΦ=.2. 格林函数用来描述系统记忆扰动程度的函数,反映了影响效应衰减的快慢程度(回到平衡位置的速度),G j 表示扰动εt-j 对系统现在行为影响的权数。

例如,AR(1)模型(一阶非齐次差分方程),1, 0,1,2,j j G j φ==L 模型解为0t j t j j x G ε∞-==∑.3. 模型的方差对于AR(1)模型,2221()()1t jt j j Var x G Var εσεφ∞-===-∑. 4. 模型的自协方差对中心化的平稳模型,可推得自协方差函数的递推公式:用格林函数显示表示:200()()i j t j t k j j kj i j j k G G E GG γεεσ∞∞∞---+=====∑∑∑对于AR(1)模型,21121()(0)1k k k εσγφγφφ==- 5. 模型的自相关函数 递推公式:对于AR(1)模型,11()(0)k k k ρφρφ==.平稳AR(p )模型的自相关函数有两个显著的性质: (1)拖尾性指自相关函数ρ(k)始终有非零取值,不会在k 大于某个常数之后就恒等于零;(2)负指数衰减随着时间的推移,自相关函数ρ(k)会迅速衰减,且以负指数k i λ(其中i λ为自相关函数差分方程的特征根)的速度在减小。

6. 模型的偏自相关函数自相关函数ρ(k)实际上并不只是x t与x t-k之间的相关关系,它还会受到中间k-1个随机变量x t-1, …, x t-k+1的影响。

为了能剔除了中间k-1个随机变量的干扰,单纯测度x t与x t-k之间的相关关系,引入了滞后k 偏自相关函数(PACF),计算公式为:其中,滞后k偏自相关函数实际上等于k阶自回归模型第k个回归系数φ:kkγ得到两边同乘以x t-k,求期望再除以(0)取前k个方程构成的方程组:称为Yule-Walker方程,可以解出φ.kk可以证明平稳AR(p)模型,当k>p时,0φ=. 即平稳AR(p)kk模型的偏自相关函数具有p步截尾性。

注:实际上样本的随机性使得偏自相关函数不是严格截尾,例如上面两图都1阶显著不为0,1阶之后都近似为0.二、MA(q)模型——q 阶移动平均模型1. 模型:其中,0q θ≠,随机干扰序列t ε为0均值、2εσ方差的白噪声序列(()0t s E εε=, t ≠s )。

若μ=0,称为中心化的MA(q)模型,非中心化的MA(q)模型可以通过*t t x x μ=-转化为中心化。

记B 为延迟算子,1()q q q B I B B θθΘ=---L 称为q 阶自移动平均系数多项式,则中心化MA(q)模型可以表示为()t q t x B ε=Θ.2. 模型的方差3. 模型的自协方差只与滞后阶数k 相关,且q 阶截尾。

当k=0时,当1≤k ≤q 时,当k>q 时,()0k γ=.4. 模型的自相关函数:()()(0)k k γργ=(q 阶截尾性)5. 模型的滞后k 阶偏自相关函数(中心化)可以证明滞后k 阶偏自相关函数具有拖尾性。

6. 模型的可逆性 以MR(1)为例,模型Ⅰ:111 1tt t t t x x Bεθεεθ-=-=-或模型Ⅱ:111111t t t t t x x Bεεεθθ-=-=-或 它们的自相关函数2111/(1)ρθθ=-+相同(即相同的自相关函数对应不同的回归模型),为了保证对应的唯一性,需要增加约束条件,即MR(q)模型的可逆性条件。

观察两个模型的第二种表示:当1||1θ<时,模型Ⅰ收敛、模型Ⅱ不收敛;当1||1θ>时,模型Ⅰ不收敛、模型Ⅱ收敛。

表示成收敛形式的MR(q)模型称为可逆MR(q)模型。

一个自相关函数只对应唯一一个可逆MR(q)模型。

三、ARMA(p, q)模型——自回归移动平均模型1. 模型其中,0p φ≠,0q θ≠,随机干扰序列εt 为0均值、2εσ方差的白噪声序列(()0t s E εε=, t ≠s ),且当期的干扰与过去的序列值无关,即E(x tεt )=0.若0=0φ,则称为中心化的ARMA(p,q)模型。

引入延迟算子,中心化的ARMA(p,q)模型可表示为:()()p t q t B x B εΦ=Θ.显然,AR(p)和MA(q)模型是ARMA(p,q)模型的特例。

2. 数字特征(1)均值:01()1t pE x φφφ=---L ;(2)自协方差函数:20()i i k i k G G εγσ∞+==∑,其中G i 为格林函数;(3)自相关函数:020()()(0)i i ki i i G G k k G γργ∞+=∞===∑∑3. 模型的初步定阶对于平稳非白噪声序列,计算出样本自相关系数(ACF )和偏自相关系数(PACF ),根据其性质估计自相关阶数ˆp和移动平均阶数ˆq ,称为ARMA(p,q)模型的定阶。

可以推导出:样本自相关函数ˆ()k ρ和偏自相关函数ˆkkφ都近似服从正态分布1(0,)N n.取显著水平α=0.05,若样本自相关系数和样本偏自相关系数在最初的k 阶明显大于2倍标准差,而后几乎95%的系数都落在2倍标准差的范围内,且非零系数衰减为小值波动的过程非常突然,通常视为k 阶截尾;若有超过5%的样本相关系数大于2倍标准差,或者非零系数衰减为小值波动的过程比较缓慢或连续,通常视为拖尾。

4. 参数估计对非中心化的ARMA(p,q)模型()()q t t p B x B μεΘ=+Φ.参数μ可用样本均值来估计总体均值(矩估计法),初步定阶估计出自相关阶数ˆp和移动平均阶数ˆq 后,模型共有p+q+1个未知参数:211,,,,,,p q εφφθθσL L .(1)参数的矩估计用时间序列样本数据计算出延迟1阶到p+q 阶的样本自相关函数ˆ()k ρ,延迟k 阶的总体自相关函数为11(,,,,,)k p q ρφφθθL L . 用计算出的样本自相关函数来估计总体自相函数,得到p+q 个联立方程组:从中解出11,,,,,p q φφθθL L 的值作为未知参数估计值11ˆˆˆˆ,,,,,p qφφθθL L . ARMA(p,q)模型的两边同时求方差,并把前面的参数的估计值代入,可得白噪声序列的方差估计为:(2)参数的极大似然估计当总体分布类型已知时,极大似然估计是常用的估计方法。

其基本思想是,认为样本来自使该样本出现概率最大的总体。

因此,未知参数的极大似然估计,就是使得似然函数(即联合密度函数)达到最大值的参数值:在时间序列分析中,序列的总体分布通常是未知的。

为了便于分析和计算,通常假设序列服从多元正态分布,它的联合密度函数是可导的。

在求极大似然估计时,为了求导方便,常对似然函数取对数,然后对对数似然函数中的未知参数求偏导数,得到似然方程组。

理论上,只要求解似然方程组即可得到未知参数的极大似然估计。

但在实际上是使用计算机经过复杂的迭代算法求出未知参数的极大似然估计。

两种估计的比较:矩估计的优点是不要求知道总体的分布,计算量小,估计思想简单直观。

但缺点是只用到了样本自相关系数的信息,序列中的其他信息被忽略了,这导致估计精度一般较差。

因此,它常被作为极大似然估计和最小二乘估计的迭代计算的初始值。

极大似然估计的优点是充分应用了每一个观察值所提供的信息,因而它的估计精度高,同时,还具有估计的一致性、渐近正态性和渐近有效性等优良统计性质,是一种非常优良的参数估计方法。

(3)参数的最小二乘估计使ARMA(p,q)模型的残差平方和达到最小的那组参数值:通过计算机借助迭代方法求出。

由于充分利用了序列的信息,该方法估计精度最高。

在实际运用中,最常用的是条件最小二乘估计,假定时间序列过去未观察到序列值等于序列均值,可得到残差的有限项表达式:于是残差平方和达到最小的那组参数值为:5. 模型和参数的显著性检验ARMA(p,q)模型中,使用Q LB统计量检验残差序列的自相关性,为了克服DW检验的有偏性,Durbin在1970年提出了修正的Durbin h统计量:其中,n为观察值序列的长度,2σ为延迟因变量系数的最小二乘估β计的方差。

参数的显著性检验是要检验每一个模型参数是否显著非零。

若某个参数为零,模型中包含这个参数的乘积项就为零,可以简化模型。

因此,该检验的是为了精简模型。

原假设H0:某未知参数βj=0;H1:βj≠0. 可以构造出检验未知参数显著性的t(n-m)检验统计量,其中m为参数的个数。

6. 模型优化当一个拟合模型在置信水平α下通过了检验,说明了在该置信水平下该拟合模型能有效地拟合时间序列观察值的波动。

但是这种有效的拟合模型并不是惟一的。

如果同一个时间序列可以构造两个拟合模型,且两个模型都显著有效,那么应该选择哪个拟合模型用于统计推断呢?通常采用AIC 和SBC信息准则来进行模型优化。

(1)AIC准则——最小信息量准则由日本统计学家赤池弘次(Akaike)于1973年提出,是一种考评综合最优配置的指标,它是拟合精度和参数未知个数的加权函数:AIC=-2ln(模型中极大似然函数值)+2(模型中未知参数个数)使其达到最小值的模型被认为是最优模型。

相关文档
最新文档