混沌时间序列局域偏最小二乘回归多步预测模型

１引言

混沌是指由确定系统在复杂因素作用下产生的、貌似随机的不规则运动，是自然界客观存在的一类重要的形式，人们通常取得该系统的一个特征观察量时间序列进行分析研究。首先混沌现象对初始条件非常敏感，使混沌运动产生了长期不可预测的特性；但是混沌蕴含着有序其运动轨机逃逸不出奇异吸引子的约束，使得短期预测可行。混沌时间序列分析在物理、水文、电力等众多的非线性动力系统的建模及预测中具有很好的应用价值。

可以使用混沌时间序列分析方法来研究非线性动力系统的复杂结构，其前提条件是首先使用该序列重构原混沌系统的相空间。混沌时间序列预测是混沌时间序列分析的重要形式，自Ｆａｍｍｅｒ等提出混沌时间序列零阶局域预测方法以来［１］，混沌时序局域预测得到了广泛的应用。局域预测方法基于相邻的相点具有相似的发展趋势这一假设，选择与预测相点近邻的相点进行预测模型的参数识别。局域预测方法包括零阶和一阶局域预测及其加权形式，其中一阶局域预测在混沌时间序列预测中使用最为普及［２］。以往一阶局域法单步预测模型进行多步预测存在误差累积问题，文献［３］提出了加权一阶局域多步预测模型。但是一阶局域方法没有考虑重构相空间延时坐标维可能存在多重共线性和算法中选择的临近点数少于嵌入维问题，这样普通最小二乘回归将无法很好解决。

文中提出使用局域偏最小二乘回归建立混沌时间序列的直接多步预测模型，不仅提高了模型的适应性，而且在建模预测过程中能同时利用参考相点当前及将来的信息。

２混沌序列分析理论及预测方法

相空间重构理论指出：任一非线性系统的动力

混沌时间序列局域偏最小二乘回归多步预测模型

廖辉传，刘遵雄

（华东交通大学信息工程学院，江西南昌３３００１３）

摘要：针对混沌序列局域一阶多步预测问题，提出了基于偏最小二乘回归的混沌时间序列局域直接多步预测模型，偏最小二乘用于混沌时序重构相空间中演化轨迹前后相点信息间的建模。该模型克服了以往一阶局域单步预测模型进行多步预测时存在的误差累积，而且能抑制重构相空间中多重共线性的影响，提高了预测精度。试验中使用交叉验证方法将偏最小二乘的提取成分数。通过对Ｃｈｅｎ’ｓ混沌序列和Ｍａｃｋｅｙ－Ｇｌａｓｓ混沌序列的多步预测试验，验证了该模型在混沌时序预测方面具有很好的效果。

关键词：混沌序列；多步预测；偏最小二乘回归；局域模型

中图分类号：Ｏ２３文献标识码：Ａ文章编号：１０００－７１８０（２００７）０４－０１９３－０４

Ｍｕｌｔｉ－ＳｔｅｐＬｏｃａｌＰｒｅｄｉｃｔｉｏｎＭｏｄｅｌｗｉｔｈＰａｒｔｉａｌＬｅａｓｔＳｑｕａｒｅｓ

ｆｏｒＣｈａｏｔｉｃＴｉｍｅＳｅｒｉｅｓ

ＬＩＡＯＨｕｉ－ｃｈｕａｎ，ＬＩＵＺｕｎ－ｘｉｏｎｇ

（ＳｃｈｏｏｌｏｆＩｎｆｏｒｍａｔｉｏｎＥｎｇｉｎｅｅｒｉｎｇ，ＥａｓｔＣｈｉｎａＪｉａｏｔｏｎｇＵｎｉｖｅｒｓｉｔｙ，Ｎａｎｃｈａｎｇ３３００１３，Ｃｈｉｎａ）

Ａｂｓｔｒａｃｔ：Ｃｏｎｓｉｄｅｒｉｎｇｃｈａｏｔｉｃｔｉｍｅｓｅｒｉｅｓｍｕｌｔｉ－ｓｔｅｐｐｒｅｄｉｃｔｉｏｎ，Ｍｕｌｔｉ－ｓｔｅｐｄｉｒｅｃｔｐｒｅｄｉｃｔｉｏｎｍｏｄｅｌｂａｓｅｄｏｎｐａｒｔｉａｌｌｅａｓｔｓｑｕａｒｅｓ（ＰＬＳ）ｉｓｐｒｏｐｏｓｅｄｉｎｔｈｉｓｐａｐｅｒ，ｗｈｅｒｅＰＬＳ，ｔｈｅｍｅｔｈｏｄｆｏｒｐｒｅｄｉｃｔｉｎｇａｓｅｔｏｆｄｅｐｅｎｄｅｎｔｖａｒｉａｂｌｅｓｆｏｒｍａｌａｒｇｅｓｅｔｏｆｐｒｅｄｉｃｔｏｒｓ，ｉｓｕｓｅｄｔｏｍｏｄｅｌｔｈｅｄｙｎａｍｉｃｅｖｏｌｕｔｉｏｎｂｅｔｗｅｅｎｔｈｅｓｐａｃｅｐｏｉｎｔｓａｎｄｔｈｅｃｏｒｒｅｓｐｏｎｄｉｎｇｆｕｔｕｒｅｐｏｉｎｔｓ．Ｔｈｅｍｏｄｅｌｃａｎｅｌｉｍｉｎａｔｅｅｒｒｏｒａｃｃｕｍｕｌａｔｉｏｎｗｉｔｈｔｈｅｃｏｍｍｏｎｓｉｎｇｌｅ－ｓｔｅｐｌｏｃａｌｍｏｄｅｌａｌｇｏｒｉｔｈｍ，ａｎｄｒｅｆｒａｉｎｆｒｏｍｔｈｅｈｉｇｈｍｕｌｔｉｃｏｌｌｉｎｅａｒｉｔｙｐｒｏｂｌｅｍｉｎｔｈｅｒｅｃｏｎｓｔｒｕｃｔｅｄｓｔａｔｅｓｐａｃｅｗｉｔｈｔｈｅｉｎｃｒｅａｓｅｏｆｅｍｂｅｄｄｉｎｇｄｉｍｅｎｓｉｏｎ．Ｉｎｔｈｅｅｘｐｅｒｉｍｅｎｔｓ，ｔｈｅｎｕｍｂｅｒｏｆｅｘｔｒａｃｔｅｄｃｏｍｐｏｎｅｎｔｓｉｎＰＬＳｉｓｓｅｔｗｉｔｈｃｒｏｓｓ－ｖａｌｉｄａｔｉｏｎｐｒｏｃｅｄｕｒｅ．ＳｉｍｕｌａｔｉｏｎｐｒｅｄｉｃｔｉｏｎｓａｒｅｄｏｎｅｏｎｔｈｅＣｈｅｎ’ｓａｎｄＭａｃｋｅｙ－Ｇｌａｓｓｃｈａｏｔｉｃｔｉｍｅｓｅｒｉｅｓｗｉｔｈｔｈｅｍｏｄｅｌ，ｔｈｅｓａｔｉｓｆｙｉｎｇｐｒｅｄｉｃｔｉｏｎａｃｃｕｒａｃｙｉｓｏｂｔａｉｎｅｄａｎｄｔｈｅｍｏｄｅｌｅｆｆｉｃｉｅｎｃｙｖｅｒｉｆｉｅｄ．

Ｋｅｙｗｏｒｄｓ：ｃｈａｏｔｉｃｔｉｍｅｓｅｒｉｅｓ；ｍｕｌｔｉ－ｓｔｅｐｐｒｅｄｉｃｔｉｏｎ；ｐａｒｔｉａｌｌｅａｓｔｓｑｕａｒｅｓ；ｌｏｃａｌｍｏｄｅｌ

收稿日期：２００６－０４－２８

学信息包含在该系统任一变量的时间序列中，把单变量的时间序列嵌入到新的坐标系中所得到的状态轨迹（相点轨迹）保留了原空间状态轨迹的最主要特征。

对一个复杂的混沌系统，通常考察一个单维的混沌时间序列｛ｘ

ｔ

，ｔ＝１，２，…，ｎ｝根据相空间重构理论

可以生成该序列在ｍ维相空间的相点为：Ｘ（ｔ）＝（ｘ（ｔ），ｘ（ｔ－τ），…，ｘ（ｔ＝（ｍ－１）τ））；式中ｔ＝（ｍ－１）τ＋１，…，ｎ；τ为时滞；ｍ为嵌入维。

根据Ｔａｋｅｎｓ定理［４］，适当选择τ，ｍ（ｍ≥２ｎ＋１，ｎ，ｎ为混沌吸引子维数），存在确定性映射Ｆ（ｍ）：Ｒｍ→Ｒｍ，使得

Ｘｔ＋１＝Ｆ（ｍ）（Ｘｔ）（１）

为了使用局域预测方法预测时序Ｘ

ｔ

点的下一步值Ｘ!ｔ＋１，通常根据欧式距离：

ｄ２（Ｘｔ，Ｘｔ１）＝∑ｍ

ｉ＝１（ｘｔ－（ｉ－１）τ－ｘｔ１－（ｉ－１）τ）２

$（２）

在相空间中找出一定数目的Ｘ

ｔ近邻相点｛Ｘｎ

ｔｉ｝ｋｉ＝１及其

后续相点的信息对式（１）进行建模处理，求出表征系统动力学演化特征的函数关系Ｆ（ｍ），从而可以求出预测参考点Ｘ（ｔ）的下一演化状态点Ｘ!（ｔ＋１），Ｘ!ｔ＋１就是Ｘ!（ｔ＋１）的一维坐标值。这里建模问题的输入输出为相点信息，使用偏最小二乘回归求解模型。

３偏最小二乘回归

偏最小二乘回归ＰＬＳ（ＰａｒｔｉａｌＬｅａｓｔＳｑｕａｒｅｓ）［５］是一种多因变量对多自变量的回归建模方法，在建模过程中集中了主成分分析，典型相关分析和线性回归分析方法的特点，可以用于处理经典回归无法解决的自变量间多重相关性和观察样本少于变量个数等问题。偏最小二乘回归不仅提供更为合理的回归模型，而且易于辨识系统信息与噪声，对因变量也有较强的解释能力。

考虑使用ＰＬＳ对两组观察变量建模问题，其中ｘ%&Ｎ表示维自变量，ｙ%&Ｍ是Ｍ维因变量。偏最小二乘回归通过使用得分向量组对ｙ和ｘ进行建模。假设存在ｎ个数据样本，从而形成关于自变量和因变量的矩阵，并变换各列使之均值为零，有（ｎ×Ｎ）维自变量矩阵Ｘ和（ｎ×Ｍ）维自变量矩阵Ｙ，ＰＬＳ将这两个矩阵分别进行分解为

Ｘ＝ＴＰＴ＋Ｆ

Ｙ＝ＵＱＴ＋Ｇ（３）其中，Ｔ，Ｕ是Ｘ和Ｙ提取的ｐ个潜在成分的（ｎ×ｐ）维矩阵；Ｐ和Ｑ是分别是Ｘ和Ｙ的荷载矩阵，维数各自为Ｎ×ｐ，Ｍ×ｐ；Ｆ，Ｇ表示残差矩阵。经典的ＰＬＳ算法是ＮＩＰＡＬＳ（ｎｏｎｌｉｎｅａｒｉｔｅｒａｔｅｄｐａｒｔｉａｌｌｅａｓｔｓｑｕａｒｅｓ）算法，需要求取满足下式的投影向量组ｗ

和ｃ：

ｃｏｖ（ｔ，ｕ

’(

）２＝ｃｏｖ（Ｘｗ，Ｙｃ

’)

）２

＝ｍａｘ

ｒ＝ｓ＝１

ｃｏｖ（Ｘｒ，Ｙ

’)

ｓ２（４）其中，ｃｏｖ（ｔ，ｕ

’)

）＝ｔＴｕ／ｎ表示成分向量ｔ与ｕ间的协方差。ＮＩＰＡＬＳ算法首先将Ｙ的成分向量ｕ进行随机初始化，然后重复以下过程直到过程收敛：

①ｗ＝ＸＴｕ／（ｕＴｕ）②‖ｗ‖→１③ｔ＝Ｘｗ

④ｃ＝ＹＴｔ（ｔＴｔ）⑤‖ｃ‖→１⑥ｕ＝Ｙｃ

事实上投影向量ｗ的求解对应着以下特征值问题

ＸＴＹＹＴＸｗ＝"ｗ（５）的第一个特征向量的求解，Ｘ的潜在成分向量ｔ＝Ｘｗ，同理可以求取对应Ｙ的成分向量ｕ和投影向量ｃ［６］。而且成分向量ｔ可以直接通过求解特征值问题ＸＸＴＹＹＴｔ＝"ｔ的第一个特征向量得出，Ｙ的潜在成分向量ｕ可以使用ｕ＝ＹＹＴｔ估计。

最终求的偏最小二乘回归模型是

Ｙ!＝ＸＢｐｌｓ（６）

其中，Ｂ

ｐｌｓ

＝ＷＢＣＴ，Ｗ是求解的ｋ次Ｘ投影向量ｗ组

成Ｗ＝［ｗ

１

，ｗ２，…，ｗｋ］，同样Ｃ是Ｙ的ｋ次投影向量ｃ构成。Ｂ是对角矩阵，其元素是ｋ次Ｘ的潜在成分向量ｔ的模的倒数。

４混沌序列局域偏最小二乘回归直接多步预测算法

文中提出将偏最小二乘回归用于混沌时序的

多步预测，对于给定的混沌时序｛ｏ

ｔ

，ｔ＝１，２，…，ｎ｝，根据有关算法求得其重构相空间的嵌入维ｍ和延时τ后，生成序列相点ｏ（ｔ）＝（ｏ（ｔ），ｏ（ｔ－τ），…，ｏ（ｔ－（ｍ－

１）τ）），标示为｛ｏｉ｝ｎ－（ｍ－１）τ

ｉ＝１

，其中ｔ＝（ｍ－１）τ＋１，…，ｎ。假设需要在ｔ＝ｎ点进行步长为ｌ的多步预测，则预测

中心相点为ｘ

ｐｒｅ

＝ｏｎ－（ｍ－１）τ，其算法如下：

①对于第ｓｔｅｐ步预测（ｓｔｅｐ≤ｌ），根据当前相点和其后续ｓｔｅｐ步相点信息构造相点与其ｓｔｅｐ步相

点对（这里为行向量），ｘ

ｉ

＝ｏｉ，ｙｉ＝ｏｉ＋ｓｔｅｐ，其中ｉ＝１，…，ｎ－（ｍ－１）τ－ｓｔｅｐ。

②在相点集ｘｉ找出一定数目的预测中心相点ｏｎ－（ｍ－１）τ的近邻点，该数目可以根据试算取得（通常与

相点维数ｍ成比例，假设为２ｍ）。将求得的ｘ

ｉ

点与

对应的ｙ

ｉ

点构成偏最小二乘回归的自变量ｘ和因

变量值ｙ对｛ｘｉ，ｙｉ｝２ｍ

ｉ＝１，并形成自变量和因变量矩阵

Ｘ，Ｙ。

③将Ｘ，Ｙ进行标准化处理，调用偏最小二乘回归算法建立局部模型，求得回归系数矩阵Ｂｐｌｓ。

④将预测中心相点ｘｐｌｓ使用与Ｘ处理时相同

的中间数据进行标准化，根据式（６）求值并进行反标准化处理得ｙ!ｐｒｅ，则时序在ｎ＋ｓｔｅｐ点的预测值就是

ｙ

!ｐｒｅ的第一维坐标值。⑤重复以上步骤直到完成了从时序ｎ点始的ｓｔｅｐ步预测。

５预测实例５．１Ｃｈｅｎ’ｓ混沌序列

Ｃｈｅｎ’ｓ混沌吸引子由如下三维自治系统所产

生

ｘ

!＝ａ（ｙ－ｘ）ｙ

!＝（ｃ－ａ）ｘ－ｘｚ＋ｃｙｚ

!＝ｙ－ｂ!

#####"#####$

ｚ（７）

其中，参数ａ＝３５，ｂ＝３，ｃ＝２８。取初值ｘ（０）＝０，ｙ（０）＝１，ｚ（０）＝０；积分时间步长ｈ＝０．００１。用４阶Ｒｕｎｇｅ－Ｋｕｔｔａ法积分方程组（７），除去前面１０００个过渡点，用后面９０００个点作为训练样本，５０００个点作为测

试样本，用局域偏最小二乘回归模型进行多步预测。重构相空间的参数选取为：嵌入维ｍ＝８，时间延迟τ＝１０。图１是局域偏最小二乘回归模型模型对

Ｃｈｅｎ’ｓ混沌序列进行多步预报的结果，可见预测值

拟合真实值效果较好。

５．２

Ｍａｃｋｅｙ－Ｇｌａｓｓ混沌序列

考察Ｍａｃｋｅｙ－Ｇｌａｓｓ延时微分动力学方程

ｘ!（ｔ）＝０．２ｘ（ｔ－τ）

１＋ｘ１０

（ｔ－τ

）－０．１ｘ（ｔ）（８）

产生的这一广泛使用的混沌时间序列的建模预测的用例。使用４阶Ｒｕｎｇｅ－Ｋｕｔｔａ算法求解以上微分方程生成并整数点值后隔１０取样得到需要的时间

序列值｛ｘｔ｝Ｎ

ｔ＝１，取ｘ０＝１．２，τ＝１７；并且当ｔ＜０时，ｘｔ＝０。

根据通常的ＭＧ时间序列预测的惯例有，该序列重构相空间的嵌入维ｍ＝４，延时Δ＝６，所以已知ｔ时时间序列值ｘｔ，构造的相点形式为ｘｔ＝（ｘｔ，ｘｔ－６，ｘｔ－１２，ｘｔ－

１８

），构造１０００个相点点｛ｘｔ｝１１１７ｔ＝１１８。使用局域偏最小二

乘回归模型对该序列进行５次１００步预测，预测起始点分别为序列的５２８、６２８、７２８、８２８和９２８。使用两种指标评价系统的预测性能，第一种为平均绝对

百分误差，ＭＡＰＥ＝

∑ｎｔ＝１

ｘｔ－ｘ

&ｔｘｔｎ

×１００，其中ｎ为进

行多步预测的预测点数，此处ｎ＝１００；第二种绝对百

分误差，ＡＰＥ＝

ｘｔ－ｘ

&ｔｘｔ

×１００，其中ｘｔ，ｘ

"ｔ分别为时间ｔ点的真实值和预测值。将５次预测结果的ＭＡＰＥ指标和ＡＰＥ指标落在［０，１］，［１，３］和［３，∞］三个区间的比率列于表１。

根据表１可看出，使用局域偏最小二乘回归多步预测模型对ＭＧ时间序列进行多大１００步预测，五次预测的ＭＡＰＥ指标最大不超过２，显示了非常理想的预测精度，当然也可以进行更长步数的多步预测，从而也验证了ＭＧ时间序列良好的预测性，图２给出了使用本方法以５１８为起始点进行３００步预测的预测值和真实值曲线，从图中知道使用局域偏最小二乘回归多步预测方法对该ＭＧ时序以５１８为起始点进行２００步预测，预测值曲线和真实值曲线几乎重合，２００点后的１００个点预测值曲线也基本拟合了真实值曲线形态，差别很小。根据图１和图２，随着预测步增大，预测误差相应增大，这符合混沌系统长期行为预测存在局限性特点。

偏最小二乘回归能解决自变量间存在多重共线性的多元回归问题，这对于基于相空间重构的混沌预测具有实在意义，因为在重构混沌序列的相空间时如果选择的嵌入维过大则有可能会存在嵌入

表１５次１００步预测结果的ＭＡＰＥ值和

ＡＰＥ

值落在不同区间的比率

预测起始点

５１８６１８７１８８１８９１８ＭＡＰＥ０．７３９０２１．８０３２１．１７８６１．２３５０．４１４２５

ＡＰＥ≤１（％）６７３６６１６０９４１≤ＡＰＥ≤３（％）３３４３３４２７６ＡＰＥ≥３（％）

０

２１

５

１３

０

维属性间的多重共线性和信息冗余问题，这是一阶局域线性回归无法解决的问题，这里将ＭＧ时序重构相空间的嵌入维定义为４到９时，使用本方法以

５１８为其始点进行３００步预测，比较这几次试验的

预测结果。在试验中偏最小二乘回归提取的成分数根据交叉验证方法给定，使用的近邻点数大约为重构相空间的嵌入维数的２倍，图３给出了嵌入维分别为４，６和８时预测的３００点的绝对百分误差

ＡＰＥ的曲线图。表２给出了在嵌入维不同情况下３００步预测的ＭＡＰＥ指标值。结果显示在嵌入适当

增大的情况下局域偏最小二乘多步预测模型的预测性能没有受到影响，因为ＰＬＳ克服了传统最小二乘回归方法的不足，可以用于处理自变量间的共线性问题。图３说明嵌入维在４，６和８时进行１００步模型预测结果都比较理想，预测步长增大预测性能变差。

使用局域偏最小二乘多步预测模型进行预测时涉及到近邻点选择的问题和ＰＬＳ成分提出的问题，它们一定程度影响了预测效果，这也是其它混沌序列局域预测方法和因子处理方法共有的问题。

６结束语

综上所述，文中提出的局域偏最小二乘回归多

步预测方法在混沌时序预测中获得了很好的精度，借助偏最小二乘回归可以解决多因变量对多自变

量回归问题的特点，使用相点的前后演化规律在相点间建模，用于解决混沌时序的多步预测问题。同时偏最小二乘回归具备处理多重共线性的优点，载嵌入维选择过大的情况下也显示了很好的预测效果。今后，将局域偏最小二乘回归多步预测方法推广到实际的工程应用中，并研究近邻点选取和ＰＬＳ过程中成分数提取的问题。

参考文献：

［１］

ＦｒａｓｅｒＡＭ，ＳｗｉｎｎｅｙＨＬ．Ｉｎｄｅｐｅｎｄｅｎｔｃｏｏｒｄｉｎａｔｅｓｆｏｒｓｔｒａｎｇｅａｔｔｒａｃｔｏｒｓｆｒｏｍｍｕｔｕａｌｉｎｆｏｒｍａｔｉｏｎ［Ｊ］．Ｐｈｙｓ．Ｒｅｖ，Ａ１９８６，３３：１１３４

［２］丁涛，周惠成．混沌时间序列局域预测方法［Ｊ］．系统工程

与电子技术，２００４，２６（３）：３３８￣４００

［３］ＣａｉＭＬ，ＣａｉＦ，ＳｈｉＡＧ，ｅｔａｌ．Ｃｈａｏｔｉｃｔｉｍｅｓｅｒｉｅｓｐｒｅ－

ｄｉｃｔｉｏｎｂａｓｅｄｏｎｌｏｃａｌ－ｒｅｇｉｏｎｍｕｌｔｉ－ｓｔｅｐｓｆｏｒｅｃａｓｔｉｎｇｍｏｄ－ｅｌ［Ｊ］．ＬｅｃｔＮｏｔｅｓＣｏｍｐｕｔＳＣ，２００４，３１７４：４１８￣４２３［４］ＴａｋｅｎｓＦ．Ｄｅｔｅｃｔｉｎｇｓｔｒａｎｇｅａｔｔｒａｃｔｏｒｓｉｎｆｌｕｉｄｔｕｒｂｕｌｅｎｃｅ．

Ｓｐｒｉｎｇｅｒｌｅｃｔｕｒｅｎｏｔｅｓｉｎｍａｔｈｅｍａｔｉｃｓ［Ｊ］．Ｂｅｒｌｉｎ，Ｓｐｒｉｎｇｅｒ，

１９８１，８９８：３６６￣３８１

［５］王惠文．偏最小二乘回归方法及其应用［Ｍ］．北京：国防

工业出版社，１９９９

［６］Ｈ$ｏｓｋｕｌｄｓｓｏｎＡ．ＰＬＳｒｅｇｒｅｓｓｉｏｎｍｅｔｈｏｄｓ［Ｊ］．Ｊｏｕｒｎａｌｏｆ

Ｃｈｅｍｏｍｅｔｒｉｃｓ，１９８８，２：２１１￣２２８

作者简介：

廖辉传

男，硕士，讲师。研究方向为数据库、机器学习、非线性时间序列分析。刘遵雄

男，博士，副教授。研究方向为机器学习、

非线性时间序列分析及其在网络行为分析中的应用

。

表２

不同嵌入维３００步预测ＭＡＰＥ

嵌入维

４５６７８９

ＭＡＰＥ２．０８８９１．６１４１１．７０２７２．０２２５１．５９３３１．３９９９

我国通货膨胀的混合回归和时间序列模型

2000年9月系统工程理论与实践第9期　文章编号:100026788(2000)0920138203 我国通货膨胀的混合回归和时间序列模型叶阿忠,李子奈 (清华大学经济管理学院,北京100084) 摘要:　回归模型的残差项反映了对被解释变量有影响但未列入解释变量的因素所产生的噪音,这部分噪音可由时间序列模型进行拟合Λ本文对通货膨胀建立了一个混合回归和时间序列模型,并将该模型的预测结果与单纯用回归模型的预测结果进行了比较Λ 关键词:　通货膨胀;回归模型;时间序列模型;自相关函数;预测误差中图分类号:　O212 α T he Com b ined R egressi on2ti m e2series M odel of Ch inese Inflati on YE A2zhong,L I Zi2nai (Schoo l of Econom ics&M anagem en t,T singhua U n iversity,Beijing100084) Abstract:　T he residual term in the regressi on model is the no ise generated by the om itted variab les that influen t dependen t variab le in the model.T he ti m e series model can fit th is no ise.W e estab lish the com b ined regressi on-ti m e-series model fo r Ch inese inflati on and compare its fo recast resu lts to that of regressi on model. Keywords:　inflati on;regressi on model;ti m e2series model;au toco rrelati on functi on; fo recast erro r 1　引言一般我们对通货膨胀建立模型或是采用回归模型或是采用时间序列模型,但回归模型中解释变量解释被解释变量的能力总是有限的,且由于存在对被解释变量有影响但未列入解释变量的因素而产生了回归模型无法预测的噪音,因而预测的效果不佳;而时间序列模型只反映时间序列过去行为的规律,没有利用经济现象的因果关系,再加上A R I M A(p,d,q)模型识别的困难,造成预测精度的下降Λ本文将两种方法结合起来,对我国通货膨胀建立一个混合回归和时间序列模型,并进行预测Λ 2　混合回归和时间序列模型假定我们喜欢利用一个回归模型预测变量y tΖ一般地,这样的模型包括可解释的一些解释变量,它们之间不存在共线性Ζ假定我们的回归模型有k个解释变量x1,…,x k,回归模型如下: y t=Β0+Β1x1t+…+Βk x k t+Εt(1)其中误差项Εt反映除了解释变量外其它变量对y t的影响Ζ方程被估计后,R2将小于1,除非y t与解释变量完全相关,R2才等于1Ζ然后,方程可被用于预测y tΖ预测误差的一个来源是附加的噪声项,它的未来不可预测Ζ 时间序列分析的一个有效应用是对该回归的残差Εt序列建立A R I M A模型Ζ我们将原回归方程的误α收稿日期:1999203202 资助项目:国家教委“九五”重点教材基金

时间序列预测模型

时间序列预测模型时间序列是指把某一变量在不同时间上的数值按时间先后顺序排列起来所形成的序列,它的时间单位可以是分、时、日、周、旬、月、季、年等。时间序列模型就是利用时间序列建立的数学模型，它主要被用来对未来进行短期预测，属于趋势预测法。一、简单一次移动平均预测法例1.某企业1月~11月的销售收入时间序列如下表所示.取n 4,试用简单一次移动平均法预测第12月的销售收入,并计算预测的标准误差. 二、加权一次移动平均预测法简单一次移动平均预测法，是把参与平均的数据在预测中所起的作用同等对待，但参与平均的各期数据所起的作用往往是不同的。为此，需要采用加权移动平均法进行预测，加权一次移动平均预测法是其中比较简单的一种。三、指数平滑预测法 1、一次指数平滑预测法一元线性回归模型 * 项数n的数值,要根据时间序列的特点而定,不宜过大或过小.n过大会降低移动平均数的敏感性,影响预测的准确性;n过小,移动平均数易受随机变动的影响,难以反映实际趋势.一般取n的大小能包含季节变动和周期变动的时期为好,这样可消除它们的影响.对于没有季节变动和周期变动的时间序列,项数n的取值可取较大的数;如果历史数据的类型呈上升或下降型的发展趋势,则项数n的数值应取较小的数,这样能取得较好的预测效果. 1102.7 1015.1 963.9 892.7 816.4 772.0 705.1 649.8 606.9 574.6 533.8 销售收入 11 10 9 8 7 6 5 4 3 2 1 月份 t 158542.7 993.6 12 12950.4 19016.4 17662.4 24617.6 27989.3

时间序列分析习题

第8章时间序列分析一、填空题： 1．平稳性检验的方法有__________、__________和__________。 2．单位根检验的方法有：__________和__________。 3．当随机误差项不存在自相关时，用__________进行单位根检验；当随机误差项存在自相关时，用__________进行单位根检验。 4．EG检验拒绝零假设说明______________________________。 5．DF检验的零假设是说被检验时间序列__________。 6．协整性检验的方法有__________和__________。 7．在用一个时间序列对另一个时间序列做回归时，虽然两者之间并无任何有意义的关系，但经常会得到一个很高的2R的值，这种情况说明存在__________问题。 8．结构法建模主要是以______________________________来确定计量经济模型的理论关系形式。 9．数据驱动建模以____________________作为建模的主要准则。 10．建立误差校正模型的步骤为一般采用两步：第一步，____________________；第二步，____________________。二、单项选择题：

1. 某一时间序列经一次差分变换成平稳时间序列，此时间序列称为（）。 A．1阶单整 ??? B．2阶单整??? C．K阶单整 ?? ?D．以上答案均不正确 2.? 如果两个变量都是一阶单整的，则（）。 A．这两个变量一定存在协整关系 B．这两个变量一定不存在协整关系 C．相应的误差修正模型一定成立 D．还需对误差项进行检验 3．当随机误差项存在自相关时，进行单位根检验是由（）来实现。 A DF检验 B．ADF检验 C．EG检验 D．DW检验 4．有关EG检验的说法正确的是（）。 A．拒绝零假设说明被检验变量之间存在协整关系 B．接受零假设说明被检验变量之间存在协整关系 C．拒绝零假设说明被检验变量之间不存在协整关系 D．接受零假设说明被检验变量之间不存在协整关系

第十三章时间序列回归

第十三章时间序列回归本章讨论含有ARMA 项的单方程回归方法，这种方法对于分析时间序列数据（检验序列相关性，估计ARMA 模型，使用分布多重滞后，非平稳时间序列的单位根检验）是很重要的。 §13.1序列相关理论时间序列回归中的一个普遍现象是：残差和它自己的滞后值有关。这种相关性违背了回归理论的标准假设：干扰项互不相关。与序列相关相联系的主要问题有：一、一阶自回归模型最简单且最常用的序列相关模型是一阶自回归AR(1)模型定义如下：t t t u x y +'=β t t t u u ερ+=-1 参数ρ是一阶序列相关系数，实际上，AR(1)模型是将以前观测值的残差包含到现观测值的回归模型中。二、高阶自回归模型：更为一般，带有p 阶自回归的回归，AR(p)误差由下式给出： t t t u x y +'=β t p t p t t t u u u u ερρρ++++=--- 2211 AR(p)的自回归将渐渐衰减至零，同时高于p 阶的偏自相关也是零。 §13.2 检验序列相关在使用估计方程进行统计推断（如假设检验和预测）之前，一般应检验残差（序列相关的证据），Eviews 提供了几种方法来检验当前序列相关。 1．Dubin-Waston 统计量 D-W 统计量用于检验一阶序列相关。 2．相关图和Q-统计量计算相关图和Q-统计量的细节见第七章 3．序列相关LM 检验检验的原假设是：至给定阶数，残差不具有序列相关。 §13.3 估计含AR 项的模型随机误差项存在序列相关说明模型定义存在严重问题。特别的，应注意使用OLS 得出的过分限制的定义。有时，在回归方程中添加不应被排除的变量会消除序列相关。 1．一阶序列相关在EViews 中估计一AR(1)模型，选择Quick/Estimate Equation 打开一个方程，用列表法输入方程后，最后将AR(1)项加到列表中。例如：估计一个带有AR(1)误差的简单消费函数 t t t u GDP c c CS ++=21 t t t u u ερ+=-1 应定义方程为： cs c gdp ar(1) 2．高阶序列相关估计高阶AR 模型稍稍复杂些，为估计AR(k )，应输入模型的定义和所包括的各阶AR 值。如果想估计一个有1-5阶自回归的模型 t t t u GDP c c CS ++=21 t t t t u u u ερρ+++=--5511 应输入： cs c gdp ar(1) ar(2) ar(3) ar(4) ar(5) 3．存在序列相关的非线性模型 EViews 可以估计带有AR 误差项的非线性回归模型。例如：估计如下的带有附加AR(2)误差的非线性方程 t c t t u GDP c CS ++=21

时间序列分析资料报告——ARMA模型实验

基于ARMA模型的社会融资规模增长分析 ————ARMA模型实验

第一部分实验分析目的及方法一般说来,若时间序列满足平稳随机过程的性质,则可用经典的ARMA模型进行建模和预则。但是, 由于金融时间序列随机波动较大,很少满足ARMA模型的适用条件,无法直接采用该模型进行处理。通过对数化及差分处理后,将原本非平稳的序列处理为近似平稳的序列,可以采用ARMA模型进行建模和分析。第二部分实验数据 2.1数据来源数据来源于中经网统计数据库。具体数据见附录表5.1 。 2.2所选数据变量社会融资规模指一定时期（每月、每季或每年）实体经济从金融体系获得的全部资金总额，为一增量概念，即期末余额减去期初余额的差额，或当期发行或发生额扣除当期兑付或偿还额的差额。社会融资规模作为重要的宏观监测指标，由实体经济需求所决定，反映金融体系对实体经济的资金量支持。本实验拟选取2005年11月到2014年9月我国以月为单位的社会融资规模的数据来构建ARMA模型，并利用该模型进行分析预测。第三部分 ARMA模型构建 3.1判断序列的平稳性首先绘制出M的折线图，结果如下图：

图3.1 社会融资规模M曲线图从图中可以看出，社会融资规模M序列具有一定的趋势性，由此可以初步判断该序列是非平稳的。此外，m在每年同时期出现相同的变动趋势，表明m还存在季节特征。下面对m的平稳性和季节性·进行进一步检验。为了减少m的变动趋势以及异方差性，先对m进行对数化处理，记为lm，其时序图如下：图3.2 lm曲线图

对数化后的趋势性减弱，但仍存在一定的趋势性，下面观察lm的自相关图表3.1 lm的自相关图上表可以看出，该lm序列的PACF只在滞后一期、二期和三期是显著的，ACF随着滞后结束的增加慢慢衰减至0，由此可以看出该序列表现出一定的平稳性。进一步进行单位根检验，由于存在较弱的趋势性且均值不为零，选择存在趋势项的形式，并根据AIC自动选择之后结束，单位根检验结果如下：表3.2 单位根输出结果 Null Hypothesis: LM has a unit root Exogenous: Constant, Linear Trend Lag Length: 0 (Automatic - based on SIC, maxlag=12) t-Statistic Prob.*

时间序列分析及VAR模型

Lecture 6 6. Time series analysis: Multivariate models 6.1Learning outcomes ?Vector autoregression (VAR) ?Cointegration ?Vector error correction model (VECM) ?Application: pairs trading 6.2Vector autoregression (VAR)向量自回归 The classical linear regression model assumes strict exogeneity; hence, there is no serial correlation between error terms and any realisation of any independent variable (lead or lag). As we discovered, serial correlation (or autocorrelation) is very common in financial time series and panel data. Furthermore, we assumed a pre-defined relation of causality: explanatory variable affect the dependent variable? 传统的线性回归模型假设严格的外主性，误差项与可实现的独立变量之间没有序列相关性。金融时间序列及面板数据往往都有很强的自相关性，假定解释变量影响因变量。 We now relax bo什］assumptions using a VAR model. VAR models can be regarded as a generalisation of AR(p) processes by adding additional time series. Hence, we enter the field of multivariate time series analysis. VAR模型可以'"l作是在一般的自回归过程中加入时间序列。 Lefs look at a standard AR(p) process for hvo variables (y( and xj? (1)%= Ql + 琅］仇『一 +仏 (2)x t = a2 + - + ￡2t The next step is to allow that lagged values of xt can affect y( and vice versa. This means that we obtain a system of equations for two dependent variables(y(and xj?Both dependent variables are influenced by past realisations of y(and x t. By doing that, we violate strict exogeneity (see Lecture 2); however, we can use a more relaxed concept, namely weak exogeneity?As we use lagged values of bodi dependent variables, we can argue that these lagged values are known to us, as we observed them in the previous period? We call these variables predetermined? Predetermined (lagged) variables fulfil weak exogeneity in the sense that they have to be uncorrelated with the contemporaneoiis error term in t? We can still use OLS to estimate the following system of equations, which is called a VAR in reduced form. (3)+y 仇1化_丫+sr=i ^12 +￡it (4)X t = a2+2X1021”—, + _i + f2t

第九章时间序列计量经济学模型案例

第九章时间序列计量经济学模型案例 1、1949—2001年中国人口时间序列数据见表8，由该数据（1）画时间序列图和差分图；（2）求中国人口序列的相关图和偏相关图，识别模型形式；（3）估计时间序列模型；（4）样本外预测。表9.1 中国人口时间序列数据（单位：亿人）年份人口y t 年份人口y t年份人口y t年份人口y t年份人口y t 1949 5.4167 1960 6.6207 1971 8.5229 1982 10.159 1993 11.8517 1950 5.5196 1961 6.5859 1972 8.7177 1983 10.2764 1994 11.985 1951 5.63 1962 6.7295 1973 8.9211 1984 10.3876 1995 12.1121 1952 5.7482 1963 6.9172 1974 9.0859 1985 10.5851 1996 12.2389 1953 5.8796 1964 7.0499 1975 9.242 1986 10.7507 1997 12.3626 1954 6.0266 1965 7.2538 1976 9.3717 1987 10.93 1998 12.4761 1955 6.1465 1966 7.4542 1977 9.4974 1988 11.1026 1999 12.5786 1956 6.2828 1967 7.6368 1978 9.6259 1989 11.2704 2000 12.6743 1957 6.4653 1968 7.8534 1979 9.7542 1990 11.4333 2001 12.7627 1958 6.5994 1969 8.0671 1980 9.8705 1991 11.5823 1959 6.7207 1970 8.2992 1981 10.0072 1992 11.7171 （1）画时间序列图 y的数据窗口打开 t 得到中国人口序列图

时间序列分析--习题库

说明：答案请答在规定的答题纸或答题卡上，答在本试卷册上的无效。一、填空题（本题总计25分） 1. 常用的时间序列数据，有年度数据、（）数据和（）数据。另外，还有以（）、小时为时间单位计算的数据。 2. 自相关系数j ρ的取值范围为（）；j ρ与j -ρ之间的关系是（）；0ρ=（）。 3.判断下表中各随机过程自相关系数和偏自相关系数的截尾性，并用 2. 如果随机过程{}t ε为白噪音，则 t t Y εμ+= 的数学期望为；j 不等于0时，j 阶自协方差等于，j 阶自相关系数等于。因此，是一个随机过程。 1.（2分）时间序列分析中，一般考虑时间（）的（）的情形。 3. （6分）随机过程{}t y 具有平稳性的条件是：（1）（）和（）是常数，与（）无关。（2）（）只与（）有关，与（）无关。 7. 白噪音的自相关系数是：

1.白噪音{}t y 的性质是：t y 的数学期望为，方差为；t y 与j -t y 之间的协方差为。 1.（4分）移动平均法的特点是：认为历史数据中（）的数据对未来的数值有影响，其权数为（），权数之和为（）；但是，（）的数据对未来的数值没有影响。 2. 指数平滑法中常数α值的选择一般有2种：（1）根据经验判断，α一般取。（2）由确定。 3. （5分）下述随机过程中，自相关系数具有拖尾性的有（），偏自相关系数具有拖尾性的有（）。 ①平稳(2) ②(1) ③平稳(1,2) ④白噪音过程 4.（5分）下述随机过程中，具有平稳性的有（），不具有平稳性的有（）。 ①白噪音 ②t t y 1.23t+ε=+ ③随机漂移过程 ④t t t 1y 16 3.2εε-=++ ⑤t t y 2.8ε=+ 2.（3分）白噪音{}t ε的数学期望为（）；方差为（）；j 不等于0时，j 阶自协方差等于（）。（2）自协方差与（）无关，可能与（）有关。 3. （5分）下述随机过程中，自相关系数具有截尾性的有（），偏自相关系数具有截尾性的有（）。

时间序列模型的构建和预测

时间序列模型的构建和预测 Box Jenkins Methodology) 步骤1：识别。观察相关图和偏相关图步骤2：估计。估计模型中所包含的自回归系数和移动平均系数，可以用OLS 来估计步骤3：诊断检验。选一个最适合数据的模型，检查从这模型中估计到的残差是否白噪声，如果不是的话，我们必须从头来过步骤 4 ：预测。在很多情况下，这种方法得到的预测结果要比其它计量模型得到的要准确识别检查时间序列是否平稳 - 如果自相关函数衰退的很慢，则序列可能是非平稳 - 如果时间序列为一非平稳过程，应该运用差分的形式使它变为平稳过程 - 在检验了一个时间序列的平稳性之后，我们应该用相

关图和偏相关图检验ARMA模型中的阶数p和q 模型 ARIMA（1,1,1） .■: x t = ■ 1. x t-1 + u t + ru t-1 自相关函数特征缓慢地线性衰减 1.0 偏自相关函数特征 AR（ 1） x t = -1 X t-1 + u t 右；1 > 0，平滑地指数衰减若-11 > 0，k=1时有正峰值然后截尾 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 2 - 4 6 - 8 10 12 ?14 MA （ 1） X t = U t + 71 U t- 1 AR（ 2） x t = ；1 x t-1 + 2 X t-2 + u t 若;i < 0，正负交替地指数衰减 0.8 若71 > 0，k=1时有正峰值然后截尾若71 < 0，k=1时有负峰值然后截尾指数或正弦衰减若-11 < 0，k=1时有负峰值然后截尾 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 若?冷> 0，交替式指数衰减 0.8 若3<0，负的平滑式指数衰减 k=1,2时有两个峰值然后截尾

Eviews时间序列分析实例.

Eviews时间序列分析实例时间序列是市场预测中经常涉及的一类数据形式，本书第七章对它进行了比较详细的介绍。通过第七章的学习，读者了解了什么是时间序列，并接触到有关时间序列分析方法的原理和一些分析实例。本节的主要内容是说明如何使用Eviews软件进行分析。一、指数平滑法实例所谓指数平滑实际就是对历史数据的加权平均。它可以用于任何一种没有明显函数规律，但确实存在某种前后关联的时间序列的短期预测。由于其他很多分析方法都不具有这种特点，指数平滑法在时间序列预测中仍然占据着相当重要的位置。（－）一次指数平滑一次指数平滑又称单指数平滑。它最突出的优点是方法非常简单，甚至只要样本末期的平滑值，就可以得到预测结果。一次指数平滑的特点是：能够跟踪数据变化。这一特点所有指数都具有。预测过程中添加最新的样本数据后，新数据应取代老数据的地位，老数据会逐渐居于次要的地位，直至被淘汰。这样，预测值总是反映最新的数据结构。一次指数平滑有局限性。第一，预测值不能反映趋势变动、季节波动等有规律的变动；第二，这种方法多适用于短期预测，而不适合作中长期的预测；第三，由于预测值是历史数据的均值，因此与实际序列的变化相比有滞后现象。指数平滑预测是否理想，很大程度上取决于平滑系数。Eviews提供两种确定指数平滑系数的方法：自动给定和人工确定。选择自动给定，系统将按照预测误差平方和最小原则自动确定系数。如果系数接近1，说明该序列近似纯随机序列，这时最新的观测值就是最理想的预测值。出于预测的考虑，有时系统给定的系数不是很理想，用户需要自己指定平滑系数值。平滑系数取什么值比较合适呢？一般来说，如果序列变化比较平缓，平滑系数值应该比较小，比如小于0.l；如果序列变化比较剧烈，平滑系数值可以取得大一些，如0.3～0.5。若平滑系数值大于0.5才能跟上序列的变化，表明序列有很强的趋势，不能采用一次指数平滑进行预测。［例1］某企业食盐销售量预测。现在拥有最近连续30个月份的历史资料（见表l），试预测下一月份销售量。表1 某企业食盐销售量单位：吨解：使用Eviews对数据进行分析，第一步是建立工作文件和录入数据。有关操作在本

第七章时间序列分析习题

第七章时间序列分析习题一、填空题 1．时间序列有两个组成要素：一是，二是。 2．在一个时间序列中，最早出现的数值称为，最晚出现的数值称为。 3．时间序列可以分为时间序列、时间序列和时间序列三种。其中是最基本的序列。 4．绝对数时间序列可以分为和两种，其中，序列中不同时间的数值相加有实际意义的是序列，不同时间的数值相加没有实际意义的是序列。 5．已知某油田1995年的原油总产量为200万吨，2000年的原油总产量是459万吨，则“九五”计划期间该油田原油总产量年平均增长速度的算式为。 6．发展速度由于采用的基期不同，分为和两种，它们之间的关系可以表达为。 7．设i=1，2，3，…，n，a i为第i个时期经济水平，则a i/a0是发展速度，a i/a i-1是发展速度。 8．计算平均发展速度的常用方法有方程式法和. 9．某产品产量1995年比1990年增长了105%，2000年比1990年增长了306．8％，则该产品2000年比1995增长速度的算式是。 10．如果移动时间长度适当，采用移动平均法能有效地消除循环变动和。 11．时间序列的波动可分解为长期趋势变动、、循环变动和不规则变动。 12．用最小二乘法测定长期趋势，采用的标准方程组是。二、单项选择题 1．时间序列与变量数列( ) A都是根据时间顺序排列的B都是根据变量值大小排列的 C前者是根据时间顺序排列的，后者是根据变量值大小排列的 D前者是根据变量值大小排列的，后者是根据时间顺序排列的 2．时间序列中，数值大小与时间长短有直接关系的是( ) A平均数时间序列B时期序列C时点序列D相对数时间序列 3．发展速度属于( ) A比例相对数B比较相对数C动态相对数D强度相对数 4．计算发展速度的分母是( ) A报告期水平B基期水平C实际水平D计划水平则该车间上半年的平均人数约为( ) A 296人 B 292人 C 295 人 D 300人 6．某地区某年9月末的人口数为150万人，10月末的人口数为150．2万人，该地区10月的人口平均数为( ) A150万人B150．2万人C150．1万人D无法确定 7．由一个9项的时间序列可以计算的环比发展速度( ) A有8个B有9个C有10个D有7个 8．采用几何平均法计算平均发展速度的依据是( )

现代时间序列分析模型

现代时间序列分析模型§1 时间序列平稳性和单位根检验§2 协整与误差修正模型经典时间序列分析模型： MA、AR、ARMA 平稳时间序列模型分析时间序列自身的变化规律现代时间序列分析模型：分析时间序列之间的关系单位根检验、协整检验现代宏观计量经济学§1 时间序列平稳性和单位根检验一、时间序列的平稳性二、单整序列三、单位根检验一、时间序列的平稳性 Stationary Time Series ⒈问题的提出经典计量经济模型常用到的数据有：时间序列数据（time-series data ；截面数据cross-sectional data 平行/面板数据（panel data/time-series cross-section data 时间序列数据是最常见，也是最常用到的数据。经典回归分析暗含着一个重要假设：数据是平稳的。数据非平稳，大样本下的统计推断基础――“一致性”要求――被破怀。数据非平稳，往往导致出现“虚假回归”（Spurious Regression）问题。表现为两个本来没有任何因果关系的变量，却有很高的相关性。例如：如果有两列时间序列数据表现出一致的变化趋势（非平稳的），即使它们没有任何有意义的关系，但进行回归也可表现出较高的可决系数。 2、平稳性的定义假定某个时间序列是由某一随机过程（stochastic process）生成的，即假定时间序列 Xt （t 1, 2, …）的每一个数值都是从一个概率分布中随机得到，如果满足下列条件：均值E Xt ?是与时间t 无关的常数；方差Var Xt ?2是与时间t 无关的常数；协方差Cov Xt,Xt+k ?k 是只与时期间隔k有关，与时间t 无关的常数；则称该随机时间序列是平稳的（stationary ，

时间序列分析法原理及步骤

时间序列分析法原理及步骤 ----目标变量随决策变量随时间序列变化系统一、认识时间序列变动特征认识时间序列所具有的变动特征, 以便在系统预测时选择采用不同的方法 1》随机性:均匀分布、无规则分布,可能符合某统计分布(用因变量的散点图和直方图及其包含的正态分布检验随机性, 大多服从正态分布 2》平稳性:样本序列的自相关函数在某一固定水平线附近摆动, 即方差和数学期望稳定为常数识别序列特征可利用函数 ACF :其中是的 k 阶自协方差,且平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋于 0, 前者测度当前序列与先前序列之间简单和常规的相关程度, 后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。实际上, 预测模型大都难以满足这些条件, 现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。二、选择模型形式和参数检验 1》自回归 AR(p模型

模型意义仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量互相独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性的比你更造成的困难用 PACF 函数判别 (从 p 阶开始的所有偏自相关系数均为 0 2》移动平均 MA(q模型识别条件

平稳时间序列的偏相关系数和自相关系数均不截尾,但较快收敛到 0, 则该时间序列可能是 ARMA(p,q模型。实际问题中,多数要用此模型。因此建模解模的主要工作时求解 p,q 和φ、θ的值,检验和的值。模型阶数实际应用中 p,q 一般不超过 2. 3》自回归综合移动平均 ARIMA(p,d,q模型模型含义模型形式类似 ARMA(p,q模型, 但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用 ARMA(p,q模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中 d (差分次数一般不超过 2. 模型识别平稳时间序列的偏相关系数和自相关系数均不截尾,且缓慢衰减收敛,则该时间序列可能是 ARIMA(p,d,q模型。若时间序列存在周期性波动, 则可按时间周期进

时间序列模型的建立与预测

第六节时间序列模型的建立与预测 ARIMA过程y t用 Φ (L) (Δd y t)= α+Θ(L) u t 表示，其中Φ (L)和Θ (L)分别是p, q阶的以L为变数的多项式，它们的根都在单位圆之外。α为Δd y t过程的漂移项，Δd y t表示对y t 进行d次差分之后可以表达为一个平稳的可逆的ARMA 过程。这是随机过程的一般表达式。它既包括了AR，MA 和ARMA过程，也包括了单整的AR，MA和ARMA过程。可取图建立时间序列模型程序图建立时间序列模型通常包括三个步骤。（1）模型的识别，（2）模型参数的估计，（3）诊断与检验。

模型的识别就是通过对相关图的分析，初步确定适合于给定样本的ARIMA模型形式，即确定d, p, q的取值。模型参数估计就是待初步确定模型形式后对模型参数进行估计。样本容量应该50以上。诊断与检验就是以样本为基础检验拟合的模型，以求发现某些不妥之处。如果模型的某些参数估计值不能通过显著性检验，或者残差序列不能近似为一个白噪声过程，应返回第一步再次对模型进行识别。如果上述两个问题都不存在，就可接受所建立的模型。建摸过程用上图表示。下面对建摸过程做详细论述。 1、模型的识别模型的识别主要依赖于对相关图与偏相关图的分析。在对经济时间序列进行分析之前，首先应对样本数据取对数，目的是消除数据中可能存在的异方差，然后分析其相关图。识别的第1步是判断随机过程是否平稳。由前面知识可知，如果一个随机过程是平稳的，其特征方程的根都应在单位圆之外；如果 (L) = 0的根接近单位圆，自相关函数将衰减的很慢。所以在分析相关图时，如果发现其衰减很慢，即可认为该时间序列是非平稳的。这时应对该时间序列进行差分，同时分析差分序列的相关图以判断差分序列的平稳性，直至得到一个平稳的序列。对于经济时间序列，差分次数d通常只取0，1或2。实际中也要防止过度差分。一般来说平稳序列差分得到的仍然是平稳序列，但当差分次数过多时存在两个缺点，（1）序列的样本容量减小；（2）方差变大；所以建模过程中要防止差分过度。对于一个序列，差分后若数据的极差变大，说明差分过度。第2步是在平稳时间序列基础上识别ARMA模型阶数p, q。表1给出了不同ARMA模型的自相关函数和偏自相关函数。当然一个过程的自相关函数和偏自相关函数通常是未知的。用样本得到的只是估计的自相关函数和偏自相关函数，即相关图和偏相关图。建立ARMA模型，时间序列的相关图与偏相关图可为识别模型参数p, q提供信息。相关图和偏相关图（估计的自相关系数和偏自相关系数）通常比真实的自相关系数和偏自相关系数的方差要大，并表现为更高的自相关。实际中相关图，偏相关图的特征不会像自相关函数与偏自相关函数那样“规范”，所以应该善于从相关图，偏相关图中识别出模型的真实参数p, q。另外，估计的模型形式不是唯一的，所以在模型识别阶段应多选择几种模型形式，以供进一步选择。

时间序列分析习题

第8 章时间序列分析一、填空题： 1．平稳性检验的方法有___________ 、_________ 和__________ 。 2．单位根检验的方法有：__________ 和___________ 。 3．当随机误差项不存在自相关时，用____________ 进行单位根检验；当随机误差项存在自相关时，用___________ 进行单位根检验。 4. ___________________________________________________ EG检验拒绝零假设说明_______________________________________________________ 。 5. __________________________________________ DF检验的零假设是说被检验时间序列___________________________________________ 。 6. ____________________________ 协整性检验的方法有和。 7. 在用一个时间序列对另一个时间序列做回归时，虽然两者之间并无任何有意义的关系，但经常会得到一个很高的R2的值，这种情况说明存在____________ 问题。 8. ________________________________________________ 结构法建模主要是以____________________________________________________________ 来确定计量经济模型的理论关系形式。 9. _________________________________ 数据驱动建模以作为建模的主要准则。 10. 建立误差校正模型的步骤为一般采用两步：第一步，______________________

(整理)8章时间序列分析练习题参考答案.

第八章时间数列分析一、单项选择题 1.时间序列与变量数列 ( ) A 都是根据时间顺序排列的 B 都是根据变量值大小排列的 C 前者是根据时间顺序排列的，后者是根据变量值大小排列的 D 前者是根据变量值大小排列的，后者是根据时间顺序排列的C 2. 时间序列中，数值大小与时间长短有直接关( ) A 平均数时间序列 B 3. 发展速度属 B 时期序列 C 时点序列 D 相对数时间序列 ) B 比较相对数 C 动态相对数 D 强度相对数 C 4. 计算发展速度的分母是 ( ) A 报告期水平 B 基期水平 C 实际水平 D 计划水平 B 5. 某车间月初工人人数资料如下：则该车间上半年的平均人数约为 ( ) A 296 人 B 292 人 C 295 人 D 300 人 C 6.某地区某年 9月末的人口数为 150万人， 10 月末的人口数为 150．2 万人，该地区 10 月的人口平均数为 ( ) A 150 万人 B 150． 2万人 C 150．1 万人 D 无法确定 C 7.由一个 9 项的时间序列可以计算的环比发展速度 ( ) A 有 8个 B有 9个C有 10个D有 7个 A 8.采用几何平均法计算平均发展速度的依据是 ( ) A 各年环比发展速度之积等于总速度 B 各年环比发展速度之和等于总速度 C 各年环比增长速度之积等于总速度 D 各年环比增长速度之和等于总速度 A 9.某企业的科技投入， 2010年比 2005年增长了 58．6％，则该企业 2006—2010 年间科技投入的平均发展速度为 ( ) A 558.6% B 5158.6% C 658.6% D 6158.6% B 10.根据牧区每个月初的牲畜存栏数计算全牧区半年的牲畜平均存栏数，采用的公式是 ( ) A 简单平均法 B 几何平均法 C 加权序时平均法 D 首末折半法 D 11.在测定长期趋势的方法中，可以形成数学模型的是( ) A 时距扩大法 B 移动平均法 C 最小平方法 D 季节指数法

时间序列分析简介与模型

第二篇预测方法与模型预测是研究客观事物未来发展方向与趋势的一门科学。统计预测是以统计调查资料为依据，以经济、社会、科学技术理论为基础，以数学模型为主要手段，对客观事物未来发展所作的定量推断和估计。根据社会、经济、科技的预测结论，人们可以调整发展战略，制定管理措施，平衡市场供求，进行各种各样的决策。预测也是制定政策，编制规划、计划，具体组织生产经营活动的科学基础。20世纪三四十年代以来，随着人类社会生产力水平的不断提高和科学技术的迅猛发展，特别是近年来以计算机为主的信息技术的飞速发展，更进一步推动了预测技术在国民经济、社会发展和科学技术各个领域的应用。预测包含定性预测法、因果关系预测法和时间序列预测法三类。本篇对定性预测法不加以介绍，对后两类方法选择以下几种介绍方法的原理、模型的建立和实际应用，分别为：时间序列分析、微分方程模型、灰色预测模型、人工神经网络。第五章时间序列分析在预测实践中，预测者们发现和总结了许多行之有效的预测理论和方法，但以概率统计理论为基础的预测方法目前仍然是最基本和最常用的方法。本章介绍其中的时间序列分析预测法。此方法是根据预测对象过去的统计数据找到其随时间变化的规律，建立时间序列模型，以推断未来数值的预测方法。时间序列分析在微观经济计量模型、宏观经济计量模型以及经济控制论中有广泛的应用。第一节时间序列简介所谓时间序列是指将同一现象在不同时间的观测值，按时间先后顺序排列所形成的数列。时间序列一般用 ,,,,21n y y y 来表示，可以简记为}{t y 。它的时间单位可以是分钟、时、日、周、旬、月、季、年等。

一、时间序列预测法时间序列预测法就是通过编制和分析时间序列，根据时间序列所反应出来的发展过程、方向和趋势，进行类推或延伸，借以预测下一段时间或以后若干年可能达到的水平。其容包括:收集与整理某种社会现象的历史资料；将这些资料进行检查鉴别，排成数列；分析时间序列，从中寻找该社会现象随时间变化而变化的规律，得出一定的模型，以此模型去预测该社会现象将来的情况。二、时间序列数据的特点通常，时间序列经过合理的函数变换后都可以看作是由三个部分叠加而成，这三个部分是趋势项部分、周期项部分和随机项部分。 1. 趋势性许多序列的一个最主要的特征就是存在趋势。这种趋势可能是向下的也可能是向上的，也许比较陡，也许比较平缓，或者是指数增长，或者近似线性。总之，时间序列的趋势性是依据时间序列进行预测的本质所在。 2. 季节性/周期性当数据按照月或季观测时，通常的情况是这样的:时间序列会呈现出明显的季节性。对季节性也不存在一个非常精确的定义。通常，当某个季节的观测值具有与其它季节的观测值明显不同的特征时，就称之为季节性。 3. 异常观测值异常观测值指那些严重偏离趋势围的特殊点。异常观测值的出现往往是由于某些不可抗 1958 年自然灾害和1966年左右“文化大革命”对我国经拒的外部条件的影响。如1960 济的影响，造成经济指标陡然下降现象；1992年，我国银行紧缩政策造成的房地产业泡沫破灭，而使得房地产业的经济数据发生突然变化的例子等等。 4. 条件异方差性所谓条件异方差性，表现出来就是异常数据观测值成群地出现，故也称为“波动积聚性”。由于方差是风险的测度，因此波动存在的积聚性的预测对于评估投资决策是很有用的，对于期权和其它金融衍生产品的买卖决策也是有益的。 5. 非线性对非线性的最好定义就是“线性以外的一切”。非线性常常表现为“机制转换”(regime witches)或者“状态依赖”(State pendence)。其中状态依赖意味着时间序列的特征依赖于其现时的状态;不同的时刻，其特征不一样。当时间序列的特征在所有的离散状态都不一样时，就成为机制转换特性。三、时间序列的分类 1. 按研究的对象的多少可分为单变量时间序列和多变量时间序列。如果所研究的对象是一个变量，如某个国家的国生产总值，即为单变量时间序列。果所研究的对象是多个变量，如按年、月顺序排列的气温、气压、雨量数据，为多变量时间序列。多变量时间序列不仅描述了各个变量的变化规律，而且还表示了各变量间相互依存关系的动态规律性。 2. 按时间的连续性可将时间序列分为离散时间序列和连续时间序列。如果某一序列中的每一个序列值所对应的时间参数为间断点，则该序列就是一个离散时间序列。如果某一序列中的每个序列值所对应的时间参数为连续函数，则该序列就是一个连续时间序列。 3. 按序列的统计特性可分为平稳时间序列和非平稳时间序列两类。

混沌时间序列局域偏最小二乘回归多步预测模型

我国通货膨胀的混合回归和时间序列模型

时间序列预测模型

时间序列分析习题

第十三章 时间序列回归

时间序列分析资料报告——ARMA模型实验

时间序列分析及VAR模型

第九章时间序列计量经济学模型案例

时间序列分析--习题库

时间序列模型的构建和预测

Eviews时间序列分析实例.

第七章 时间序列分析习题

现代时间序列分析模型

时间序列分析法原理及步骤

时间序列模型的建立与预测

时间序列分析习题

(整理)8章时间序列分析练习题参考答案.

时间序列分析简介与模型

第十三章时间序列回归

第七章时间序列分析习题