基于多变量时间序列(CAR)模型的 地下水埋深预测

第十届青年学术交流
基于多变量时间序列(CAR)模型的 地下水埋深预测
管孝艳 国家节水灌溉北京工程技术研究中心 中国水利水电科学研究院水利研究所
2010年11月25日

汇报提纲 1 2 3 4 5
研究背景及意义 多变量时间序列CAR模型的建模方法 地下水埋深预测的CAR模型 模型评价 结论

1
研究背景及意义
内蒙古河套灌区是我国重要的优质绿色农业产业基地和 西北干旱半干旱地区最大的人工生态绿洲
气候条件的影响 土壤 盐碱 化问 题突 出
灌区不合理的农业灌溉
阻碍了灌区生态 环境健康发展和 农业的可持续发 展
排水不畅,地下水位超 过临界水位

中国土壤盐渍化分区
我国盐渍土总面积 约1亿ha,主要分 主要分 布在西北地区。
1、滨海湿润—半湿润海水浸渍盐渍区 3、黄淮海半湿润—半干旱耕作草甸盐渍区 5、黄河中上游半干旱—半漠境盐渍区 7、青、新极端干旱漠境盐渍区
2、东北半湿润—半干旱草原—草甸盐渍区 4、蒙古高原干旱—半漠境草原盐渍区 6、甘、蒙、新干旱—漠境盐渍区 8、西藏高寒漠境盐渍区

滨海盐土
松嫩平原盐渍土
地下水埋深 较浅是导致 土壤盐渍化 的重要因素
华 华北平原盐碱土 盐碱
河套灌区土壤盐渍化
灌区水管理的重要依据

地下水系 统复杂
相关模型
多变量时间 序列模型
地下水埋深 动态是一种 动态是 种 复杂的历史 过程,受到 人类活动和 自然作用的 综合影响.
相关分析、 回归分析模 型、灰色系 统模型、人 工神经网络 分析、系统 分析方法.
多变量时间序 列分析考虑从 多变量时间序 列中提取有用 信息来刻画复 杂系统的动态 特性

2
多变量时间序列CAR模型的建模方法
2 1 多变量时间序列CAR模型表达 2.1
假定用m个变量的时间序列组建n阶CAR模型,其形式 模型 其形式 为:
yt = at yt ?1 + a2 yt ? 2 + L + an yt ? n +b10 x1,t + b11 x1,t ?1 + b12 x1,t ? 2 + L + b1n x1,t ? n +b20 x2,t + b21 x2,t ?1 + b22 x2,t ? 2 + L + b2 n x2,t ? n + LL +bm 0 xm ,t + bm1 xm ,t ?1 + bm 2 xm ,t ? 2 + L + bmn xm ,t ? n + ε t
多变量时间序列的自回归模型

2.2 CAR模型的自动辨识
(1)采用递推最小二乘法进行参数估计
(2)模型最高阶n的判定
(3)模型真实阶及其时滞的判定

3
地下水埋深预测的CAR模型
3.1
研究区概况
3.2
地下水埋深影响因素分析 模型因子选择
3.3
CAR模型建立 C 模型建立
3.4

3.1
研究区概况
W14 北 W1 2 南 沙
W 9 W1 1 W 7 W1 0
沙 W13
W15

西
W 6
园 分
W 8

沙壕渠灌域

W 5 W 3 W 4
冻土实验 点

干 园 子 分 干


W 2

渠 W 1
沟 公 益 分 干


渠道 排水沟 公路 地下水、土壤水盐监 测点
渠 渠 沙园分水 闸闸

气候条件
降雨稀少、蒸发量大,无霜 期短,土壤封冻期长,温差 大 年平均降雨量139-222mm, 年平均蒸发量1999-2346mm 土壤冻冻深100-150cm,冻 结至融通历时180余天
试验条件
沙壕渠灌域在全灌域均匀布 置了15眼长期地下水观测井 ,对地下水位、埋深等指标 进行观测。 沙壕渠试验站积累了丰富的 地下水观测资料。

32 3.2
地下水埋深影响因素分析
地地下水埋深深分布

月份 1 0.0 0.5 地下水埋深 深/m 1.0 1.5 2.0 2.5 3.0 降雨量 地下水埋深 2 3 4 5 6 7 8 9 10 11 12 0 5 10 15 20 25 30 35 40 降雨量/mm m
随着降雨量的增大地下水埋深 呈减小趋势,而蒸发量的增大 ,地下水埋深呈增加趋势,但 水 深 势 有一定的滞后作用。 秋浇期间(10-11月份)虽然降 雨量和蒸发量较小,地下水埋 深仍然较浅。 受到冻融作用的影响,每年1-4
蒸发量/m mm
图3 平均月降雨量与平均月地下水埋深的关系
1 0.0 0.5 地下水埋深 深/m 1.0 1.5 2.0 2.5 3.0 蒸发量 地下水埋深 2 3 4 5 6 7 8 9 10 月份 11 12 350 300 250 200 150 100 50 0
月份地下水埋深较深,而在4月 份后土壤中的水分消融,对地 下水产生了补给,地下水埋深 呈减小的趋势。
图4 平均月蒸发量与平均月地下水埋深的关系

地下水动态受气象因素和引黄 灌溉影响很大,近年来灌溉引
地下水埋 埋深/m
1985 0 0 0.0 0.5 1.0 1.5 2.0 2 5 2.5
1990
1995
2000
2005
年份 2010
水量稳中有降,加上对地下水 水 稳 有 对 水 的开发利用逐年增加,所以地 下水年平均埋深呈现逐年增加 的趋势。 沙壕渠灌域地下水埋深在1.622.01m,灌溉期地下水埋深在 1.26-1.96m之间,非灌溉期地 下水埋深在1.7-2.54m之间。 随着灌域引水量的增大,地下 水埋深呈缓慢增加趋势。
y = 0.0155x - 29.306
图2 1988-2007年平均地下水埋深变化趋势
引水量/万m 3600 3800 4000
3
3000 0.0 0.5 地下水埋深/m m 1.0 1.5 2.0 2.5
3200
3400
y = 0.0001x + 1.2258
图5 年平均地下水埋深与年引水量的关系

3.3
模型因子选择
本研究通过对沙壕渠灌域多年(1988-2007)年平均地下水埋深、气 象资料 引水量相关分析发现 年引水量 降雨量 蒸发量与年平均地 象资料,引水量相关分析发现,年引水量、降雨量、蒸发量与年平均地 下水埋深有较好的相关性。
表1 年平均地下水埋深相关因子R分析
地下水埋深 地下水埋深 年引水量 水面蒸发量 年降雨量 平均气温 上年地下水 1.000 -0.536 0.384 -0.628 0 628 0.204 0.225 1.000 -0.214 -0.576 0 576 -0.091 0.0570 1.000 0 264 0.264 0.345 0.361 1 000 1.000 0.051 -0.340 1.000 -0.081 1.000 年引水量 水面蒸发量 年降雨量 平均气温 上年地下水
经过模型自动辨识和相关性分析,选择降雨量(X1)、蒸发量(X2) 、灌区引水 量(X3)作为输入变量,以地下水埋深(Y)作为输出变量。

3.4 ? ? ?
模型建立
建模及因子检验的显著性水平为0.05 递推最小二乘法的遗忘因子为1.0。 模型定阶检验结果为:CAR(n)残差平方 和S(n)=0.01187,CAR(n-1)残差平方和 S(n-1)=0.02106,模型定阶的F检验值为 F=0.69697。 选定阶次模型全参数时的残差平方和 S=0.02105548, 剔除不显著因素后模型的残差平方和 S=0.0213336, 判断是否应该剔除不显著因子的F检验 值 F=0.08586019 值, F 0 08586019,F(α=0.05)=3.8056 0 05) 3 8056 ? 剔除不显著项后的CAR模型: 模型参数 Y(t) )=0 0.7796689Y( 7796689Y(t-1) 1) -0.0008375X(1, t) 0 0002633X(2 t) 0.0002633X(2, -0.0000694X(3, t) 0.0000716X(3, t-1) 标准误差 0 1473 0.1473 0.0004 0 0002 0.0002 0.0001 0.0001
? ? ?

Y(t)=0.7796689Y(t-1) - 0.0008375X(1,t) + 0.0002633X(2,t) 0.0000694X(3,t) + 0.0000716X(3,t-1)
2 5 2.5 2.0 地下水 水埋深/m
20 10
1.0 0.5 0.0 1988 1993 1998 年份/年 2003 2008 观测值 预测值
相 对 误 差 /%
1.5
0 1989 1993 1997 2001 2005 年份/年
-10 -20
图6 1988-2007年地下水埋深数值模拟曲线
图7 预测误差的变化
预测曲线很好的跟踪了观测曲线的变化趋势,观测值和预测值的偏 差很小,两条曲线基本重合。观测值与预测值的误相对差控制在正 负8.5%以内,说明所建模型预测性能较好。

4
模型评价
为进一步检验和评价模型的预测效果,本研究还使用BP神经网络方 法和ε-SVM支持向量机方法对数据进行了预测分析。
表2 三种模型实测值与预测值相关性分析 CAR模型 BP神经网络 相关系数 0.8320 0.5117 ε-SVM支持向量机 0.5542
在沙壕渠灌域地下水埋深的预测中,多变量时间序列CAR模型的预测 效果好于BP神经网络方法和ε-SVM支持向量机方法的预测效果。这进 一步说明了该模型在沙壕渠灌域具有较好的适用性。 步说明了该模型在沙壕渠灌域具有较好的适用性。

模型不足之处: 模型不足之处
西北干旱地区蒸发量腾发量(包括土壤蒸发和作物蒸腾)较大 ,因受数据所限,在模型建立过程中只采用了水量蒸发量,这 在某种程度上导致了模型模拟误差的增大。 为提高模型的模拟精度,应在水面蒸发量(X2:mm)项前乘 以腾发量与水面蒸发量的换算系数K,K值的确定可根据作物的 气 Penman-Monteith法 种植状况和当地的气象条件,依据经典的 计算腾发量ET0,进而计算K值。

5
结论
沙壕渠灌域年平均地下水埋深与年引水量、年降雨量、水面蒸发量有 较好的相关性,受到冬春季节土壤冻融的影响,地下水埋深的变化具 有一定的滞后效应。 多变 时间序列 模 在沙壕渠灌域年平 水 深预测 具有 多变量时间序列CAR模型在沙壕渠灌域年平均地下水埋深预测中具有 较好适用性,预测效果好于BP神经网络方法和ε-SVM支持向量机方法 的预测效果。 预 效 本研究中建立的地下水埋深的预测模型具有一定的适用性,但模型中 的参数水面蒸发量(X2)不能代表实际腾发量对地下水埋深的影响, 这对模型精度有一定的影响。

时间序列预测模型

时间序列预测模型时间序列是指把某一变量在不同时间上的数值按时间先后顺序排列起来所形成的序列,它的时间单位可以是分、时、日、周、旬、月、季、年等。时间序列模型就是利用时间序列建立的数学模型,它主要被用来对未来进行短期预测,属于趋势预测法。一、简单一次移动平均预测法例1.某企业1月~11月的销售收入时间序列如下表所示.取n 4,试用简单一次移动平均法预测第12月的销售收入,并计算预测的标准误差. 二、加权一次移动平均预测法简单一次移动平均预测法,是把参与平均的数据在预测中所起的作用同等对待,但参与平均的各期数据所起的作用往往是不同的。为此,需要采用加权移动平均法进行预测,加权一次移动平均预测法是其中比较简单的一种。三、指数平滑预测法 1、一次指数平滑预测法一元线性回归模型 * 项数n的数值,要根据时间序列的特点而定,不宜过大或过小.n过大会降低移动平均数的敏感性,影响预测的准确性;n过小,移动平均数易受随机变动的影响,难以反映实际趋势.一般取n的大小能包含季节变动和周期变动的时期为好,这样可消除它们的影响.对于没有季节变动和周期变动的时间序列,项数n的取值可取较大的数;如果历史数据的类型呈上升或下降型的发展趋势,则项数n的数值应取较小的数,这样能取得较好的预测效果. 1102.7 1015.1 963.9 892.7 816.4 772.0 705.1 649.8 606.9 574.6 533.8 销售收入 11 10 9 8 7 6 5 4 3 2 1 月份 t 158542.7 993.6 12 12950.4 19016.4 17662.4 24617.6 27989.3

时间序列模型的构建和预测

时间序列模型的构建和预测 Box Jenkins Methodology) 步骤1:识别。观察相关图和偏相关图 步骤2:估计。估计模型中所包含的自回归系数和移动平均系数,可以用OLS 来估计 步骤3:诊断检验。选一个最适合数据的模型,检查从这模型中估计到的残差是否白噪声,如果不是的话,我们必须从头来过 步骤 4 :预测。在很多情况下,这种方法得到的预测结果要比其它计量模型得到的要准确 识别 检查时间序列是否平稳 - 如果自相关函数衰退的很慢,则序列可能是非平稳 - 如果时间序列为一非平稳过程,应该运用差分的形式使它变为平稳过程 - 在检验了一个时间序列的平稳性之后,我们应该用相

关图和偏相关图检验ARMA模型中的阶数p和q 模型 ARIMA(1,1,1) .■: x t = ■ 1. x t-1 + u t + ru t-1 自相关函数特征 缓慢地线性衰减 1.0 偏自相关函数特征 AR( 1) x t = -1 X t-1 + u t 右;1 > 0,平滑地指数衰减若-11 > 0,k=1时有正峰值然后截尾 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 2 - 4 6 - 8 10 12 ?14 MA ( 1) X t = U t + 71 U t- 1 AR( 2) x t = ;1 x t-1 + 2 X t-2 + u t 若;i < 0,正负交替地指数衰减 0.8 若71 > 0,k=1时有正峰值然后截尾 若71 < 0,k=1时有负峰值然后截尾 指数或正弦衰减 若-11 < 0,k=1时有负峰值然后截尾 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 若?冷> 0,交替式指数衰减 0.8 若3<0,负的平滑式指数衰减 k=1,2时有两个峰值然后截尾

时间序列模型的建立与预测

第六节时间序列模型的建立与预测 ARIMA过程y t用 Φ (L) (Δd y t)= α+Θ(L) u t 表示,其中Φ (L)和Θ (L)分别是p, q阶的以L为变数的多项式,它们的根都在单位圆之外。α为Δd y t过程的漂移项,Δd y t表示对y t 进行d次差分之后可以表达为一个平稳的可逆的ARMA 过程。这是随机过程的一般表达式。它既包括了AR,MA 和ARMA过程,也包括了单整的AR,MA和ARMA过程。 可取 图建立时间序列模型程序图 建立时间序列模型通常包括三个步骤。(1)模型的识别,(2)模型参数的估计,(3)诊断与检验。

模型的识别就是通过对相关图的分析,初步确定适合于给定样本的ARIMA模型形式,即确定d, p, q的取值。 模型参数估计就是待初步确定模型形式后对模型参数进行估计。样本容量应该50以上。 诊断与检验就是以样本为基础检验拟合的模型,以求发现某些不妥之处。如果模型的某些参数估计值不能通过显著性检验,或者残差序列不能近似为一个白噪声过程,应返回第一步再次对模型进行识别。如果上述两个问题都不存在,就可接受所建立的模型。建摸过程用上图表示。下面对建摸过程做详细论述。 1、模型的识别 模型的识别主要依赖于对相关图与偏相关图的分析。在对经济时间序列进行分析之前,首先应对样本数据取对数,目的是消除数据中可能存在的异方差,然后分析其相关图。 识别的第1步是判断随机过程是否平稳。由前面知识可知,如果一个随机过程是平稳的,其特征方程的根都应在单位圆之外;如果 (L) = 0的根接近单位圆,自相关函数将衰减的很慢。所以在分析相关图时,如果发现其衰减很慢,即可认为该时间序列是非平稳的。这时应对该时间序列进行差分,同时分析差分序列的相关图以判断差分序列的平稳性,直至得到一个平稳的序列。对于经济时间序列,差分次数d通常只取0,1或2。 实际中也要防止过度差分。一般来说平稳序列差分得到的仍然是平稳序列,但当差分次数过多时存在两个缺点,(1)序列的样本容量减小;(2)方差变大;所以建模过程中要防止差分过度。对于一个序列,差分后若数据的极差变大,说明差分过度。 第2步是在平稳时间序列基础上识别ARMA模型阶数p, q。表1给出了不同ARMA模型的自相关函数和偏自相关函数。当然一个过程的自相关函数和偏自相关函数通常是未知的。用样本得到的只是估计的自相关函数和偏自相关函数,即相关图和偏相关图。建立ARMA模型,时间序列的相关图与偏相关图可为识别模型参数p, q提供信息。相关图和偏相关图(估计的自相关系数和偏自相关系数)通常比真实的自相关系数和偏自相关系数的方差要大,并表现为更高的自相关。实际中相关图,偏相关图的特征不会像自相关函数与偏自相关函数那样“规范”,所以应该善于从相关图,偏相关图中识别出模型的真实参数p, q。另外,估计的模型形式不是唯一的,所以在模型识别阶段应多选择几种模型形式,以供进一步选择。

时间序列分析简介与模型

第二篇 预测方法与模型 预测是研究客观事物未来发展方向与趋势的一门科学。统计预测是以统计调查资料为依据,以经济、社会、科学技术理论为基础,以数学模型为主要手段,对客观事物未来发展所作的定量推断和估计。根据社会、经济、科技的预测结论,人们可以调整发展战略,制定管理措施,平衡市场供求,进行各种各样的决策。预测也是制定政策,编制规划、计划,具体组织生产经营活动的科学基础。20世纪三四十年代以来,随着人类社会生产力水平的不断提高和科学技术的迅猛发展,特别是近年来以计算机为主的信息技术的飞速发展,更进一步推动了预测技术在国民经济、社会发展和科学技术各个领域的应用。 预测包含定性预测法、因果关系预测法和时间序列预测法三类。本篇对定性预测法不加以介绍,对后两类方法选择以下几种介绍方法的原理、模型的建立和实际应用,分别为:时间序列分析、微分方程模型、灰色预测模型、人工神经网络。 第五章 时间序列分析 在预测实践中,预测者们发现和总结了许多行之有效的预测理论和方法,但以概率统计理论为基础的预测方法目前仍然是最基本和最常用的方法。本章介绍其中的时间序列分析预测法。此方法是根据预测对象过去的统计数据找到其随时间变化的规律,建立时间序列模型,以推断未来数值的预测方法。时间序列分析在微观经济计量模型、宏观经济计量模型以及经济控制论中有广泛的应用。 第一节 时间序列简介 所谓时间序列是指将同一现象在不同时间的观测值,按时间先后顺序排列所形成的数列。时间序列一般用 ,,,,21n y y y 来表示,可以简记为}{t y 。它的时间单位可以是分钟、时、日、周、旬、月、季、年等。

一、时间序列预测法 时间序列预测法就是通过编制和分析时间序列,根据时间序列所反应出来的发展过程、方向和趋势,进行类推或延伸,借以预测下一段时间或以后若干年可能达到的水平。其容包括:收集与整理某种社会现象的历史资料;将这些资料进行检查鉴别,排成数列;分析时间序列,从中寻找该社会现象随时间变化而变化的规律,得出一定的模型,以此模型去预测该社会现象将来的情况。 二、时间序列数据的特点 通常,时间序列经过合理的函数变换后都可以看作是由三个部分叠加而成,这三个部分是趋势项部分、周期项部分和随机项部分。 1. 趋势性 许多序列的一个最主要的特征就是存在趋势。这种趋势可能是向下的也可能是向上的,也许比较陡,也许比较平缓,或者是指数增长,或者近似线性。总之,时间序列的趋势性是依据时间序列进行预测的本质所在。 2. 季节性/周期性 当数据按照月或季观测时,通常的情况是这样的:时间序列会呈现出明显的季节性。对季节性也不存在一个非常精确的定义。通常,当某个季节的观测值具有与其它季节的观测值明显不同的特征时,就称之为季节性。 3. 异常观测值 异常观测值指那些严重偏离趋势围的特殊点。异常观测值的出现往往是由于某些不可抗 1958 年自然灾害和1966年左右“文化大革命”对我国经拒的外部条件的影响。如1960 济的影响,造成经济指标陡然下降现象;1992年,我国银行紧缩政策造成的房地产业泡沫破灭,而使得房地产业的经济数据发生突然变化的例子等等。 4. 条件异方差性 所谓条件异方差性,表现出来就是异常数据观测值成群地出现,故也称为“波动积聚性”。由于方差是风险的测度,因此波动存在的积聚性的预测对于评估投资决策是很有用的,对于期权和其它金融衍生产品的买卖决策也是有益的。 5. 非线性 对非线性的最好定义就是“线性以外的一切”。非线性常常表现为“机制转换”(regime witches)或者“状态依赖”(State pendence)。其中状态依赖意味着时间序列的特征依赖于其现时的状态;不同的时刻,其特征不一样。当时间序列的特征在所有的离散状态都不一样时,就成为机制转换特性。 三、时间序列的分类 1. 按研究的对象的多少可分为单变量时间序列和多变量时间序列。 如果所研究的对象是一个变量,如某个国家的国生产总值,即为单变量时间序列。果所研究的对象是多个变量,如按年、月顺序排列的气温、气压、雨量数据,为多变量时间序列。多变量时间序列不仅描述了各个变量的变化规律,而且还表示了各变量间相互依存关系的动态规律性。 2. 按时间的连续性可将时间序列分为离散时间序列和连续时间序列。 如果某一序列中的每一个序列值所对应的时间参数为间断点,则该序列就是一个离散时间序列。如果某一序列中的每个序列值所对应的时间参数为连续函数,则该序列就是一个连续时间序列。 3. 按序列的统计特性可分为平稳时间序列和非平稳时间序列两类。

多因素时间序列的灰色预测模型

第 39卷 第 2期 2007年 4月 西 安 建 筑 科 技 大 学 ( 学 报 ( 自然科学版) ) V ol.39 No.2 Apr . 2007 J 1Xi ’an Univ . of Arch . & Tech . Natural Scie nce Editio n 多因素时间序列的灰色预测模型 苏变萍 ,曹艳平 ,王 婷 (西安建筑科技大学理学院 ,陕西 西安 710055) 摘 要:对于传统的单因素时间序列预测法在实际应用中的不足之处 ,提出采用灰色 DGM (1 ,1) 模型和多元 线性回归原理相结合的方法 ,综合各种因素建立多因素时间序列的灰色预测模型。它首先利用 DGM (1 ,1) 模 型对影响事物发展趋势的各项因素进行预测 ;然后利用多元线性回归法将各种因素综合起来 ,以预测事物的 发展趋势。最后将该模型应用于预测分析陕西省的就业状况 ,取得了较好的预测效果 ,同时也验证了此模型 的可行性。 关键词: 时间序列 ;单因素 ;多因素 ;预测模型 中图分类号:TB114 文献标识码:A 文章编号 :100627930 2007 022******* ( ) 多年以来 ,对时间序列的预测研究 ,大多是停留在对单因素时间序列上 ,对其预测通常采用的是趋 势外推法 ,而且该方法适合于原始时间序列规律性较好的情况 ,若时间序列中包含了随机因素的影 响 ,再采用这种方法得出的预测结果可能会失真. 同时 ,客观世界又是复杂多变的 ,事物的发展通常不 是由某个单个因素决定 ,往往是许多错综复杂的因素综合作用的结果 ,为了对某项事物的发展做出更加 符合实际的预测 ,这就需要来探讨多因素时间序列的预测问题 ,正是基于这些 ,本文在应用灰色 D GM (1 ,1)模型对单因素时间序列预测的基础上 ,结合多元回归原理 ,提出建立多因素时间序列的灰色预测 模型 ,这样就充分发挥了二者的优点 ,既克服了时间序列的随机因素影响 ,又综合考虑了影响事物发展 的多种因素 ,从而达到提高预测精度和增加预测结果可靠性的效果. 1 模型的建立 设 Y = (y (1) , y (2) , …, y( n)) 表示事物发展的特征因素时间序列, X i = (x i (1) , x i (2) , …, x i ( n)) (i = 1 ,2 , …, p) 表示影响事物发展的单因素时间序列. 1.1 单因素时间序列的 DGM(1 ,1) 模型 对于单因素原始时间序列{ X i } (i = 1 ,2 , …, p) ,根据灰色系统理论建模方法 ,得 D GM (1 ,1) 模 型 : x i (1) a (1 - a) + a b ,t > 1 1.2 多因素时间序列的预测模型 为了能将影响事物发展的众多因素结合起来进行综合预测和相关因素的预测分析 ,在经过多次研 究与比较后,采用多元回归的原理建立多因素时间序列的灰色预测模型: y t = a 0 + a 1 x 1 t + a 2 x 2 t + …+ a p x p t 2 式中 y t 为该事物在 t 时刻的预测值;x i t i = 1 ,2 , …, p 为第 i 个单因素 ,通过应用上述的灰色 3收稿日期 :2005201209 修改稿日期:2006204212 基金项目 :陕西省教育厅专项基金项目 01J K133( ) 作者简介 :苏变萍 19632( ) ,女 ,山西忻州人 ,副教授 ,博士研究生 ,研究方向为计量经济学. [122] (0) (0) (0) ( ) ( ) [4] (0) x (1) = x (1) ^ x (t) = (1) ( ) ^ ^ ^ ^ ^ ^

时间序列分析-降水量预测模型

课程名称: 时间序列分析 题目: 降水量预测 院系:理学院 专业班级:数学与应用数学10-1 学号: 87 学生姓名:戴永红 指导教师:__潘洁_ 2013年 12 月 13日

1.问题提出 能不能通过以前的降水序列为样本预测出2002的降水量? 2.选题 以国家黄河水利委员会建站的山西省河曲水文站1952年至2002年51年的资料为例,以1952年至2001年50年的降水序列作为样本,建立线性时间序列模型并预测2002年的降水状态与降水量,并与2002年的实际数据比较说明本模型的具体应用及预测效果。资料数据见表1。 表1 山西省河曲水文站55年降水量时间序列

3.原理 模型表示 均值为0,具有有理谱密度的平稳时间序列的线性随机模型的三种形式,描述如下: 1、()AR p 自回归模型:1122t t t p t p t ωφωφωφωα-------=L 由2p +个参数刻画; 2、()MA q 滑动平均模型:1122t t t t q t q ωαθαθαθα---=----L 由2q +个参数刻画; 3、(,)ARMA p q 混和模型: 11221122t t t p t p t t t q t q ωφωφωφωαθαθαθα----------=----L L (,)ARMA p q 混和模型由3p q ++个参数刻画; 自相关函数k ρ和偏相关函数kk φ 1、自相关函数k ρ刻画了任意两个时刻之间的关系,0/k k ργγ= 2、偏相关函数kk φ刻画了平稳序列任意一个长1k +的片段在中间值11,t t k ωω++-L 固定的条件下,两端t ω,t k ω+的线性联系密切程度。 3、线性模型k ρ、kk φ的性质 表2 三种线性模型下相关函数性质 模型识别

时间序列分析与Eviews应用

时间序列分析与Eviews 应用非稳定序列转化为稳定序列数据变量的平稳性是传统的计量经济分析的基本要求之一。只有模型中的变量满足平稳性要求时,传统的计量经济分析方法才是有效的. 而在模型中含有非平稳时间序列时,基于传统的计量经济分析方法的估计和检验统计量将失去通常的性质,从而推断得出的结论可能是错误的。因此,在建立模型之前有必要检验数据的平稳性。在很长时间里,学者们在分析经济变量时都假定所分析的数据已满足平稳性的要求。然而,近年来,尤其是纳尔逊和普洛瑟(Nelson Plosser ,1982) 的开创性论文发表后,随着计量经济学的发展,学者们对经济时间序列数据,尤其是宏观经济时间序列数据的看法发生了根本的变化。许多经验分析表明,多数宏观经济变量都是非平稳的,由此引发了宏观经济分析方法尤其是周期分析方法的一场革命,即“单位根革命” 。解 决的问题1、如何判别虚假回归(伪回归)问题?2 、怎样检验一组变量存在协整关系?3 、一组变量若存在协整关系,怎样建立误差修正模型?如何更好的通过已有数据反映变量之间的长、短期关系。一、序列相关二、非平稳时间序列时间序列的特征在做多元回归之前,有必要先了解每个时间序列的特性。在很多应用研究中,人们常常对具有增长趋势的时间序列取对数后进行分析。取对数后,这样的序列常常更接近于一条直线。大多数宏观经济数据表现出这一特征。取对数后的变量差分(LnYt-LnYt-1) 近似反映了两个时期之间该序列的增长率。自相关( Autocorrelation ) 对于通常的经济数据序列,原始序列Y的当前值与滞后值之间的相关程度较高,但其差分序列丫的当 前值与滞后值相关程度较低。根据这一性质,我们可以利用过去已知的丫

典型时间序列模型分析..doc

实验1 典型时间序列模型分析 1、实验目的 熟悉三种典型的时间序列模型:AR 模型,MA 模型与ARMA 模型,学会运用Matlab 工具对对上述三种模型进行统计特性分析,通过对2 阶模型的仿真分析,探讨几种模型的适用范围,并且通过实验分析理论分析与实验结果之间的差异。 2、实验原理 AR 模型分析: 设有 AR(2)模型, X(n)=-0.3X(n-1)-0.5X(n-2)+W(n) 其中:W(n)是零均值正态白噪声,方差为4。 (1)用MA TLAB 模拟产生X(n)的500 观测点的样本函数,并绘出波形 (2)用产生的500 个观测点估计X(n)的均值和方差 (3)画出理论的功率谱 (4)估计X(n)的相关函数和功率谱 【分析】给定二阶的AR 过程,可以用递推公式得出最终的输出序列。或者按照一个白噪声 通过线性系统的方式得到,这个系统的传递函数为: 1 2 1 ()10.30.5H z z z --= ++ 这是一个全极点的滤波器,具有无限长的冲激响应。 对于功率谱,可以这样得到, ()() 2 2 12 12exp 11x w z jw P w a z a z σ--==++ 可以看出, () x P w 完全由两个极点位置决定。 对于 AR 模型的自相关函数,有下面的公式: 这称为 Yule-Walker 方程,当相关长度大于p 时,由递推式求出: 这样,就可以求出理论的 AR 模型的自相关序列。

1.产生样本函数,并画出波形 2.题目中的AR 过程相当于一个零均值正态白噪声通过线性系统后的输出,可以按照上面的方法进行描述。 clear all; b=[1]; a=[1 0.3 0.5]; % 由描述的差分方程,得到系统传递函数 h=impz(b,a,20); % 得到系统的单位冲激函数,在20 点处已经可以认为值是0 randn('state',0); w=normrnd(0,2,1,500); % 产生题设的白噪声随机序列,标准差为2 x=filter(b,a,w); % 通过线形系统,得到输出就是题目中要求的2 阶AR 过程 plot(x,'r'); ylabel('x(n)'); title('邹先雄——产生的AR 随机序列'); grid on; 得到的输出序列波形为: 2.估计均值和方差 可以首先计算出理论输出的均值和方差,得到 x m ,对于方差可以先求出理论自相 关输出,然后取零点的值。

时间序列模型的构建和预测

时间序列模型的构建和预测 (Box Jenkins Methodology) ●步骤1:识别。观察相关图和偏相关图 ●步骤2:估计。估计模型中所包含的自回归系数和 移动平均系数,可以用OLS 来估计 ●步骤3:诊断检验。选一个最适合数据的模型,检 查从这模型中估计到的残差是否白噪声,如果不是的话,我们必须从头来过 ●步骤4 :预测。在很多情况下,这种方法得到的预 测结果要比其它计量模型得到的要准确 识别 ●检查时间序列是否平稳 -如果自相关函数衰退的很慢,则序列可能是非平稳 -如果时间序列为一非平稳过程,应该运用差分的形式使它变为平稳过程 -在检验了一个时间序列的平稳性之后,我们应该用相

关图和偏相关图检验ARMA 模型中的阶数p 和q

● 估计 OLS 方法在时间序列分析中的问题: ■ 考虑下面简单的线性回归模型: t t t e X Z +=φ

■ OLS 估计量∑∑=== n t t n t t t X Z X 1 21 ?φ 为一致估计且为最优线性无 偏估计量的条件为:0)(=t t e X E ■ 但时间序列模型t t t e Z Z +=-1φ中可能无法满足以上条件。它取决于误差项e t 的性质。 ■ ∑∑∑∑∑∑=-=-=-=--=-=-+ =+= =n t t n t t t n t t n t t t t n t t n t t t Z e Z Z e Z Z Z Z Z 2 21 212 21 2 11 2 21 2 1 ) (?φφφ ■ 情形1:t t u e = ■ 情形2: t t u L e )1(θ-=, 2 111))(()(u t t t t t u u Z E e Z E θσθ-=-=--- 极大似然估计法: ■ 假设随机变量x t 的概率密度函数为f(x),其参数用}{2 1 k γγγγ,。。。,,=表示,似然函数定义为: )/()/(γγt t x f x L = ■ 对于一组相互独立的随机变量x t ,(t = 1, 2, …, T ),当得到一个样本 (x 1, x 2, …, x T ) 时,似然函数可表示为 L (γ | x 1, x 2, …, x T ) = f (x 1| γ ) f (x 2| γ ) … f (x T | γ ) = ∏=T t t x f 1(| γ )

相关文档
最新文档