神经网络对时间序列的处理(1)

合集下载

《数据挖掘》试题与答案

一、解答题（满分30分，每小题5分）1. 怎样理解数据挖掘和知识发现的关系？请详细阐述之首先从数据源中抽取感兴趣的数据，并把它组织成适合挖掘的数据组织形式；然后，调用相应的算法生成所需的知识；最后对生成的知识模式进行评估，并把有价值的知识集成到企业的智能系统中。

知识发现是一个指出数据中有效、崭新、潜在的、有价值的、一个不可忽视的流程，其最终目标是掌握数据的模式。

流程步骤：先理解要应用的领域、熟悉相关知识，接着建立目标数据集，并专注所选择的数据子集；再作数据预处理，剔除错误或不一致的数据；然后进行数据简化与转换工作；再通过数据挖掘的技术程序成为模式、做回归分析或找出分类模型；最后经过解释和评价成为有用的信息。

2. 时间序列数据挖掘的方法有哪些，请详细阐述之时间序列数据挖掘的方法有：1）、确定性时间序列预测方法:对于平稳变化特征的时间序列来说，假设未来行为与现在的行为有关，利用属性现在的值预测将来的值是可行的。

例如，要预测下周某种商品的销售额，可以用最近一段时间的实际销售量来建立预测模型。

2）、随机时间序列预测方法:通过建立随机模型，对随机时间序列进行分析，可以预测未来值。

若时间序列是平稳的，可以用自回归(Auto Regressive，简称AR)模型、移动回归模型(Moving Average，简称MA)或自回归移动平均(Auto Regressive Moving Average，简称ARMA)模型进行分析预测。

3）、其他方法:可用于时间序列预测的方法很多，其中比较成功的是神经网络。

由于大量的时间序列是非平稳的，因此特征参数和数据分布随着时间的推移而变化。

假如通过对某段历史数据的训练，通过数学统计模型估计神经网络的各层权重参数初值，就可能建立神经网络预测模型，用于时间序列的预测。

3. 数据挖掘的分类方法有哪些，请详细阐述之分类方法归结为四种类型：1）、基于距离的分类方法:距离的计算方法有多种，最常用的是通过计算每个类的中心来完成，在实际的计算中往往用距离来表征，距离越近，相似性越大，距离越远，相似性越小。

BP神经网络和模糊时间序列组合预测模型及其应用

Ｓｉ。ＷＡＮＧＨＩＨｕＹＵ－ａｌｎ，ＷＥＮＧＦｕ．ｉ１（．ｃｏｌｆＭａａｅｅｇｃｎｅＣｅｇｕＵｉｒｔｅｈｏｏｙＣｅｇｕＳｃｕｎ６０５，ｈｎ；１Ｓｈｏｏｎｇｍｎｔｉ，ｈｎｄｎｖｓｙｏｃｎｌ，ｈｎｄｉａ１０９ＣｉａＳｅｃｅｉｆＴｇｈ２ｃｏｌｆＭａｈｍｔａｃｅｃｓＵｉｒｙｏｌｒｎＳｉｃｎｅｈｏｇｈｎ，ＣｅｇｕＳｃｕｎ６１３，ｈｎ）．Ｓｈｏｏｔｅａｉｌｉｎｅ，ｎｖｓｃＳｅ￣ｆＥｅｏ＆ｃｎｅｄＴｃｎｌｙｏｉａｈｎｄｉａ１７１ＣｉａａｅａｏｆＣｈ
ＣｏｍｐｓｔｒｄｃｉｎｍｏｅｆＢＰｎｕａｅｗｏｋｎｏｉｐｅｉｔｏｄｌ０ｅｒｌｎｔｒｓａｄｅ
ｆｚｉｅｓｒｅｎｄｉｓａｕｚｙｔｍｅｉｓａｔｐｐｌａｉｎｉｔｏｃ
０引言
人工神经网络具有很强的非线性映射能力，通过各神经
元的自学能力实现样本数据的输入与输出间的非线性关系，它已广泛应用于矿产开发、农业病虫害预测及农产品品质检测等领域，并且取得了较好的预测效果。在实际应用中，ＰＢ神经网络及其改进形式是经常被采用的神经网络模型。模糊理论本身具有语义变量蕴含特性，以减少在处理可具体问题时可能出现不确定性的困扰。因此，目前模糊理论已经被广泛地用预测方法与模型领域。１９９３年Ｓｎｏｇ等人 ” 提出了模糊时间序列模型；着他们又提出了一个新的模糊接

时间序列特征提取

时间序列特征提取时间序列特征提取：在时间序列分析中，有关时间序列特征提取的研究占有重要的地位，该领域的研究范围包括时间序列特征提取和分类、时间序列回归和统计抽取、时间序列模式分类等。

时间序列特征提取的方法可以分为统计方法、神经网络方法和混合方法。

前两种方法是解决时间序列特征提取最典型的统计和机器学习方法，它们统计分析时间序列数据，从而获得可以反映时间序列特征的度量和指标，以及基于时间序列特征的支持向量机分类模型等。

统计方法是指从时间序列中提取特征的统计方法，其特征提取方法主要是基于时间序列的基本统计特征，如时间序列的均值、标准差、峰值和相位等，以建立时间序列特征提取模型。

例如，它可以利用峰值极值和相位值，以提取时间序列模式的信息特征。

此外，统计方法还可以采用统计图形和图表，以提取时间序列模式的频谱特征。

神经网络方法是指对时间序列进行特征提取的神经网络技术。

这种方法的基本思想是，使用一组多层的神经元网络将时间序列数据拟合，以获得能够反映时间序列特征的参数。

由于神经网络可以模拟复杂的时间序列模式，它可以有效地提取时间序列模式的特征，如均值和方差等。

混合方法是指利用一种时间序列特征提取技术，以混合不同的特征提取方法进行时间序列特征提取。

这种方法可以有效地提取时间序列特征，因为它可以由多种特征提取技术组成，使用各种技术综合进行时间序列特征提取。

例如，可以融合统计、神经网络和支持向量机等技术，建立一种更加强大的时间序列特征提取模型。

此外，在时间序列特征提取的研究中，还存在许多有趣的问题，如自然语言处理、视觉特征提取等，它们可以结合以上特征提取技术进行研究，进一步提高时间序列特征提取的准确率和效率。

总之，时间序列特征提取是一门很有前景的研究领域，研究人员在这一领域的工作也不断受到推广与改进，期待我们在未来的时间序列分析中会有更多精彩的发现。

深度学习中的时间序列分析方法

深度学习中的时间序列分析方法时间序列分析是一种研究随时间变化的数据趋势和模式的方法。

随着数据的爆发式增长和计算能力的提高，时间序列分析在各个领域中得到了广泛应用。

深度学习作为机器学习领域的一个重要分支，在时间序列分析中也发挥着重要的作用。

本文将介绍深度学习中常用的时间序列分析方法，包括循环神经网络（RNN）、长短期记忆网络（LSTM）和卷积神经网络（CNN）。

首先介绍的是循环神经网络（RNN）。

RNN是一种具有反馈连接的神经网络，能够处理时间序列数据。

与传统神经网络不同，RNN通过将当前输入与之前的状态进行融合，具备了记忆之前信息的能力。

这使得RNN非常适合处理带有时间依赖性的数据，例如语音识别、文本生成等。

然而，传统的RNN存在梯度消失和梯度爆炸等问题，导致难以处理长时间依赖的序列。

为了解决这个问题，研究者提出了一种改进的RNN模型，即长短期记忆网络（LSTM）。

长短期记忆网络（LSTM）是一种专门用于处理长时间依赖的循环神经网络模型。

LSTM引入了一种称为“门”的机制，用来控制信息的输入、输出以及遗忘。

通过这种机制，LSTM能够选择性地保留和忘记输入的信息，从而更好地捕捉时间序列中的关键模式。

LSTM已经在机器翻译、语音识别、文本生成等任务中取得了显著的效果。

然而，LSTM模型的参数量较大，训练起来较为耗时，为了加速时间序列分析的过程，研究者提出了一种基于卷积神经网络的时间序列分析方法。

卷积神经网络（CNN）是一种在图像处理领域广泛应用的深度学习模型。

然而，研究者发现CNN在处理时间序列数据时也能取得不错的结果。

CNN通过卷积操作能够捕捉时间序列中的局部模式，并通过池化操作对其进行降维。

这种局部感知能力使得CNN在时间序列分析中非常有效，特别是在处理非常大的时间序列数据时。

例如，通过结合不同时间窗口的卷积核，CNN能够捕捉到不同时间尺度上的模式。

除了上述介绍的三种方法外，还有其他一些深度学习中常用的时间序列分析方法。

数据分析中的时间序列预测方法介绍

数据分析中的时间序列预测方法介绍引言：在当今信息时代，数据的高速增长和广泛应用，使得时间序列分析成为数据科学中的重要领域。

时间序列预测是指通过分析一系列按时间顺序排列的数据，来预测未来的趋势和模式。

时间序列预测在许多领域都有广泛的应用，例如金融预测、销售预测、天气预测等等。

本文将介绍几种常用的时间序列预测方法。

一、移动平均（Moving Average）移动平均是时间序列预测中最简单和常用的方法之一。

它通过计算时间窗口内数据点的平均值来预测未来的值。

移动平均适用于没有明显趋势和季节性变化的数据。

常见的移动平均方法包括简单移动平均（Simple Moving Average，SMA）、加权移动平均（Weighted Moving Average）和指数移动平均（Exponential Moving Average，EMA）。

其中，简单移动平均对时间窗口内的数据给予相同的权重，加权移动平均对数据点进行加权处理，指数移动平均则给予近期数据更高的权重。

二、指数平滑法（Exponential Smoothing）指数平滑法是一种基于加权平均的时间序列预测方法。

它通过对历史数据进行加权平均来预测未来的值，其中较新的数据点权重更高。

指数平滑法适用于数据具有较强的趋势，但没有明显的季节性变化。

常见的指数平滑法包括简单指数平滑（Simple Exponential Smoothing）和Holt-Winters指数平滑。

三、自回归移动平均模型（ARMA）自回归移动平均模型是一种基于时间序列预测的统计模型。

它将时间序列数据分解为自回归（AR）和移动平均（MA）两部分，并通过对这两部分进行建模来预测未来的值。

AR部分表示当前值与过去一段时间的值之间的关系，而MA部分表示当前值与随机误差之间的关系。

ARMA模型的参数可以通过最小化误差来估计，并可以使用ARMA模型来进行长期和短期的预测。

ARMA模型也可以扩展为自回归滑动平均模型（ARIMA），用于处理具有季节性变化的时间序列。

时序数据分析方法综述

时序数据分析方法综述时序数据分析是指对时间序列数据进行建模、分析和预测的一种方法。

时间序列数据是按照时间顺序排列的数据集合，它是许多领域中常见的数据类型，例如金融、经济、气象和交通等。

时序数据分析可以帮助我们了解数据的趋势、周期性和相关性，从而做出更准确的预测和决策。

1.基本统计方法：基本统计方法是时序数据分析的起点，它可以帮助我们了解数据的基本特征和分布情况。

基本统计方法包括均值、方差、标准差、最小值、最大值等指标的计算，以及对数据的可视化分析，如折线图、柱状图和箱线图等。

2.时间序列模型：时间序列模型是对时序数据进行建模和预测的一种方法。

常见的时间序列模型包括自回归平均移动平均模型(ARMA)、自回归集成移动平均模型(ARIMA)、季节性自回归集成移动平均模型(SARIMA)、指数平滑法(ES)和灰色预测模型等。

这些模型可以捕捉到时序数据中的趋势、周期性和季节性等特征，从而进行预测和分析。

3.神经网络模型：神经网络模型是一种强大的时序数据建模方法，它可以处理非线性和复杂的时间序列关系。

常见的神经网络模型包括循环神经网络(RNN)、长短期记忆网络(LSTM)和门控循环单元(GRU)等。

这些模型可以学习时间序列数据中的长期依赖关系和非线性规律，从而提高预测的准确性。

4.波动性分析：波动性分析是对时序数据中波动性进行研究和分析的方法。

常见的波动性分析方法包括波动率计算、频谱分析和小波分析等。

这些方法可以帮助我们了解数据的波动性、周期性和噪声成分，从而进行风险分析和决策。

5.频域分析：频域分析是一种将时序数据转化到频域进行分析的方法。

常见的频域分析方法包括傅里叶变换(FFT)和功率谱分析等。

这些方法可以帮助我们了解数据的频率成分和周期性变化，从而进行信号分析和滤波处理。

6.异常检测：异常检测是对时序数据中异常值进行识别和分析的方法。

常见的异常检测方法包括均方差控制图、灰色关联度分析和支持向量机(SVM)等。

时间序列数据挖掘方法

时间序列数据挖掘方法时间序列数据是指按照时间顺序收集的数据，例如气温变化、股票价格、人口增长等。

这些数据具有时间依赖性和序列性，因此时间序列数据挖掘成为了一门重要的方法。

时间序列数据挖掘被广泛应用于天气预测、股票价格预测、销售预测等领域。

本文将介绍几种常用的时间序列数据挖掘方法。

一、传统时间序列分析方法1. 平滑方法平滑方法是时间序列分析中最常见的方法之一。

它通过对数据进行平均或移动平均等操作来消除噪声和季节性变动，使得数据趋于平稳。

常见的平滑方法包括简单平均法、加权平均法和指数平滑法等。

2. 拆解方法拆解方法是将时间序列数据分解为趋势、季节性和残差三个部分。

趋势表示数据的长期变动趋势，季节性表示数据的周期性变动，残差表示无法被趋势和季节性解释的部分。

拆解方法常用的有加法模型和乘法模型。

3. ARIMA模型ARIMA模型是一种常用的时间序列预测方法，它基于自回归（AR）、移动平均（MA）和差分（I）的方法。

ARIMA模型可以用于对拥有趋势和季节性的数据进行建模和预测。

二、机器学习方法传统的时间序列分析方法在处理复杂的时间序列数据时可能存在局限性。

因此，近年来，越来越多的研究者开始将机器学习方法应用于时间序列数据挖掘中。

1. 循环神经网络（RNN）循环神经网络是一种特殊的神经网络，它能够处理序列数据。

通过添加循环连接，RNN能够在处理每一个数据点时，利用前面所有数据的信息。

RNN在时间序列数据挖掘中应用广泛，尤其在预测和分类任务中表现出色。

2. 卷积神经网络（CNN）卷积神经网络是一种对图像处理非常有效的神经网络。

虽然CNN主要应用于图像处理，但近年来被证明也适用于一维时间序列数据的特征提取。

通过卷积和池化等操作，CNN可以捕捉时间序列数据的局部和全局特征，从而实现有效的时间序列数据挖掘。

3. 长短时记忆网络（LSTM）长短时记忆网络是一种常用的循环神经网络架构，专门用于处理和预测时间序列数据。

LSTM通过引入记忆单元，能够更好地捕捉序列数据中的长期依赖关系。

基于神经网络的风速时间序列动态学习预测分析

基于神经网络的风速时间序列动态学习预测分析[摘要]测风数据的完整性和准确性对正确反应一个地区风资源优劣起着决定性作用，而在测风过程中往往有数据失真和缺失的情况，这些缺失的数据对于正确的评估风资源状况以及计算发电量、机型的选择都有着极为重要的作用；此外风的不确定性和不可控性，风能也随之而变化，从而影响风电场的发电量，如果能对风电场风况进行及时和较为准确的预测，从而就能对风电场风功率以及产量进行预报，进而为电网调度和风电场风机保护提供依据。

本文利用时间序列神经网络对风速的短时间预测，为风电场发电量的预测和测风数据短时间缺失替补提供参考。

[关键词]风速风能资源神经网络时间序列中图分类号：tk81 文献标识码：a 文章编号：1009-914x（2013）22-0204-01引言随着风电在我国风电的高速发展，截止2010年底，我国装机容量已经位居世界首位，伴随我国风电高速发展的同时也暴露出一些制约风电的发展的问题，如电网的制约、电网调度、风电限电的问题。

由于风电受天气的影响非常大，因此功率极不稳定，风电随机性、波动性、间歇性的特点，对电网的运行调度提出了相当高的要求，因此对风况的准确预报显得尤为重要。

我国作为一个风资源极为丰富并且正在大力发展风电的国家[3]。

风电在电网中的比例也必然会达到不可忽视的程度，准确的反映一个地区的风资源状况以及风电产能的预测，对项目的可行性和保护电网，对风电事业的发展及风电场运营维护来说具有重要的意义。

1、模型简介1.1 时间序列预测分析时间序列传统的预测方法主要有：移动平均法、指数平滑法、arima模型（非平稳求和自回归移动平均模型）。

这3种方法预测时都要先假设各变量之间是一种线性关系，这种局限性使其在实际应用中很难准确地进行分析和预测。

因为现实生活中大量的时间序列真实模型大都是非平稳、非线性的[4][5]。

1.2 基于bp神经网络的时间序列预测神经网络用于时间序列预测[8]，是指利用神经网络去逼近一个时间序列或者一个时间序列的变形，可用时间序列的前m个值（x （t-1），x（t-2），…，x（t-m））去预测s个值x（t），x（t+1），…，x（t+s-1）。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

神经网络对时间序列的处理 Georg Dorffner 奥地利维也纳大学人工智能研究所医疗控制论和人工智能部门

摘要：本文介绍了神经网络在时间序列处理的最常见类型，即模式识别和时空模式的预测。重视神经网络模型和更多经典时间序列的处理方法之间的关系，尤其是预测。文章首先通过介绍基本的时间序列加工、讨论了前馈以及递归神经网络,和他们非线性模型在时空模式的依赖能力方面。 1. 介绍

世界是一直在变的。无论我们观察还是措施——个物理价值,诸如温度和自由交易的价格好—在不同的时间点。经典模式识别,并且与它的很大一部分神经网络应用中,主要涉及了检测系统模式以一个数组的形式返回(静态模式)。典型的应用包括输入向量的分类成多个类别之一(判别分析),或近似描述之间的可见的依赖关系(倒退)。当随时间变化而变化也被考虑进去，额外的,时间维就是补充。虽然在很大程度上这一问题仍然可以被经典模式识别,一些附加的重要方面仍然起作用。统计领域的时空数据分析这种关注(例如具有一定的时空维度的数据)，通常是被称为时间序列处理。本文旨在介绍利用神经网络的基本原理为时间序列处理。作为一个教程，它自然只能触及表面的这个行业,留下许多重要的细节都没动。不过,概述最相关方面的工作基础,形成了这个领域的佼佼者。这篇文章是很有参考价值的一个指南,并给出了更远、更详细的文学。关于神经网络学习算法的基本知识建筑已被假定。 2. 时间序列处理

2.1．基本要素在正式的条件,时间序列是一系列向量,根据t：~x(t)：t =0；1；…… (1)。向量的组成部分可以是任何可观察变量,诸如： 1）在一幢建筑里的空气温度 2）在给定的证券交易所的某些产品价格 3）在一个特定城市新出生的人数 4）在一个特定社区的水的总消费金额从理论上讲,x ~可以被看作是时间变量t的连续函数。然而用于实际目的时,时间是通常被看作离散的时间间隔,这就导致在每个时间间隔的终点产生x的实体。这就是为什么一个人说话的时间顺序或系列。时间间隔的尺寸通常依手边问题,可以是任何东西,从几秒,几小时到几天,甚至几年。在许多情况下,可观察量只有在离散的时间间隔(例如，在每一个小时,或天某一商品的价格)必然会形成时间序列。在其他情况下(例一个城市的新出生的人数)，价值观必须累积或均一段时间间隔(如每月引起的出生人数)得到系列。在时间确实是连续的领域(例如当温度在某一地点是可见) 一个人必须点测量变量的藉所选择的时间间隔来获得一个系列（如每个小时的温度）。这就是所谓的抽样。取样频率就是所测量时段的点个数，在这种情况下是一个非常重要的参数，因为不同频率能从本质上改变所获得时间序列的主要特点。值得注意的是,有另一个领域非常密切相关,即加工时间序列信号处理。例如语音识别，即异常模式心电图的发现（ECGs），或脑电图的自动分级（EEGs）。一个信号,当采样成一串值的离散的时间间隔时,构成上述定义的时间序列。因此和时间序列信号处理没有一个正式的区别。在普遍的应用程序中可以发现不同（例如单个信号的识别和滤波;时间序列处理的预测），自然的时间序列(一个采样间隔时间信号通常是一小段时间,而在时间序列处理区间常是小时)。但这只是一个从原型中的应用的观察,并没有明确的边界。因此,时间序列处理可借鉴对信号处理的方法探索,反之亦然。神经网络应用程序在信号处理的概述在文献【54,51】。如果矢量~ x只含有一个组件,在许多应用场合情况中,有的说是一个单变量的时间序列,否则它就是一个多元。它非常仰赖棘手问题的单变量治疗是否会导致图案识别的结果。如果几个可观察量相互影响（例如空气温度和消耗的水量）一个多变量分析治疗（即基于几个可观察量的分析{~x超过一个变量}）将被标明。在大多数讨论中，我们依然遵循单变量的事件序列处理。

2.2处理类型

根据时间序列分析的目的,时间序列分析的典型应用可以分为: 1.时间序列未来发展的预测 2.时间序列的分类或分成几类的一部分 3.根据参数模型对时间序列的描述 4.一个时间序列映射到另一个应用1在文献中肯定是最普遍传播的。从计量能源规划大量的时间序列问题涉及预测未来价值的矢量x -为了决定交易策略或以便优化产品（1.后面参考给出了一个IEEE的程序的例子，这造成一个关于神经网络信号处理的年度会议）。问题描述如下：找到一个函数（K代表x的值）。例如为了获得一个矢量x在时间t+d的估计量，给出了x到t的值，再加上一些额外的自变量π：

d被称为预测的滞后。通常，d=1，也就是说随后的向量应该估算出来,但可以采取任何价值大于1时,(例如5天前能耗的预测)。为了简单起见，我忽略了额外的变量π。虽然如此，我们应该注意加入这些特征（如房间的大小温度是决定因素）在某些应用场合起决定性作用。在这种方式思考的话，选择的方法越来越近似F，函数近似值的估测将很困难。从这个意义上说,它可以比作函数逼近或观测矢量静力的回归问题,有许多方法可以应用领域,以及在这里(见,比如,(18),介绍)。当讨论神经网络的预测方法时，这个观察将很重要。

通常预测效果的评价是由计算一个误差测度E在一些时间序列的元素,例如验证或测试设置: （3） e是一个函数测量之间的误差估计(预测)和实际排序的元素。通常情况下,一个距离度量(欧氏或其他),是在这里用,但会根据问题的作用,任何函数可以使用(如函数计算成本预测造成~ x(t + d)不正确)。在许多预测问题中,~ x(t + d)的准确值并不是必需的,只有说明是否~ x(t + d)变大(上升)或变小（下降）,或基本不变。如果是这样的情况,问题变成了分类问题,映射序列(或部份）上升或下降(也许常量)。

在更广泛的来说，分类时间序列（上次的第二类）可以表示为一个找函数Fc：指使多个类别的时间系列:

C是有效分类的集合。和函数逼近没有本质区别（公式2）。换句话说,分类可以看作是一种特殊的函数逼近,这个函数逼近连续向量。来自不同问题(即是被分离的,而不是寻求向量之间的依赖关系的近似){一个能够影响推导了什么函数公式能被使用},通过关这个方法对性能进行了评价。通常,一个错误函数在这公式上：

输入的百分比表达来自不能很好的分配预期的阶段。是克罗内克尔记号。例如=1 如果i=j，则E=0.否则 Ci是输入量i的已知量。再一次,这之间的区别(倒退)近似分类(歧视)相同的向量模式识别不考虑时域维度。因此,大量的结果与方法可用于领域的时间序列分类。另一个不同时间序列的领域里分类处理(除进入日益分类/下落的)通常是回顾性{即没有时间滞后}而不是预期在未来(预测)。应用类型3 {建模时间序列}被隐含的包含在大多数情况下,1(预测)和2(分类)。2当方程F功能可以被认为是时间序列模型能够产生系列,以连续替代输入量进行评估。为了使信息有用,一个模型应该有更少的参数估计量的自由度比F)时间序列元素。因为后者号码是潜在的无限的,这主要是指功能外应该仅仅依靠一个有限的和固定参数的数量,我们将会(见下面),并不意味着它只能依靠有界一些过去的序列元素)。除了用于预测和分类模型也可用于描述的时间序列,它的参数被视为一种系列的特点,可在后续的分析(如随后的分类,连同定态薛定功能)。这可以与建模过程,目的是在观测矢量压缩的纯空间域(如按实现一个自动组合映射与神经网络,[13])。最后,当建模是一种映射到时间序列模型的参数(如发现自己通过时间序列为复制系列)、一个时间序列映射到另一个,不同的,一个是可以想象的一样(应用类型4)。一个简单的例子是预测系列的价值(例如。石油的价格给了他的价值观的另一个(例如利率)。更复杂的应用可能包括分开的模拟两个时间序列,想找一个函数作图分给他们。因为在这种简单的模式中,时间序列之间的映射是一种特殊的时间序列加工(以上讨论),在更复杂的情况下,它很不常见,这个应用程序类型将不会进一步探讨。然而状态矢量空间模型(下面讨论),可以在此背景下查看。在下文中,我将着重讨论预测问题,而记住其他应用类型的关系很密切这种类型的。 2.3时间序列的特殊转换

上述的考虑隐含假定理论模型的准确时间序列(也就是得出一可以找到最小误差测度到任何想要的学位。在实际的应用实例,这种假设是不现实的。由于测量误差和未知或无法控制的影响因素,一个几乎总是要承担的,即使最优化模型将产生一个残差e所组成,不能被删除。通常,这个错误是认为,噪音过程的结果,即随机产生由一个不知名的来源。因此,方程2有被扩充如下:

这种噪声~ e(t)不能列入模型中。然而,许多方法呈现一定的特征(例如的噪音。高斯白噪声),主要描述的参数(如均值和标准偏差)可以包含在建模过程。这样做,例如,在预测只给一个人不能预测估计估计价值,而且多少这个值可以被噪音。这就是所谓的焦点拱模型研究[4]。 2.4时间序列预处理仅在一些情况下,它将适当的使用可观察量直接进行处理。在大多数情况下,进行预处理是必要的,以及预处理的时间序列以确保理想的结果的处理。一方面,这与平时采用中截取某些种类(即通常那些在数量上表现向量相似之处)。另一方面,要消除那些可能妨碍已知的演出。一个例子是清晰的(线性和非线性的)趋势,如下。序列的平均值的元素是不断上涨的或下降的（看图表1，来至[50]）。

图标1：时间序列呈现出曲线下降的趋势。系列由货币汇率组成(瑞士法郎美元-美国)。来源：ftp://ftp.cs.colorado.edu/pub/Time-Series/SantaFe。用一系列~ x(t)代替x ~(t)，之间的差异,包括随后的值, 拆卸线性趋势(参阅图2)

这个差分过程与连续函数的分化不同。同样的,季节性周期模式,即由于周期影响因素(如一天周在产品销售),都是可以避免的差异计算相应的序列元素:

(例如s = 7如果时间间隔是天,和相应的星期显示相似的模式)。识别趋势和季节性,当他们是明确的无形财产的时间序列,导致先验知识的系列。像任何统计问题,这些相关的知识应该如何处理(维处理后,总结获得原始值)。否则预测方法试图模型主要特点,这些深入离开很少或没有房间,更细的特点。(因此一个天真的气象预报员来说,“例句。\预测今天的价值加上不断增加“可能费用的一样好。)针对非线性趋势,通常是一个参数化模型(例如一个指数曲线)是假设,并在此基础上消除。另一个原因来消除趋势和季节性(或者,在那种情况下,其他清晰可见或知名图案)有许多方法