通过动态非线性偏最小二乘法对非线性模型进行预测以及控制

合集下载

最小二乘法拟合回归直线的注意事项

最小二乘法拟合回归直线的注意事项

最小二乘法是一种常用的回归分析方法,用于拟合一条直线以描述自变量和因变量之间的关系。

在实际应用中,最小二乘法可以帮助我们找到最符合观测数据的线性模型,从而进行预测和分析。

然而,最小二乘法也存在一些注意事项,需要我们在使用时特别留意。

下面将详细介绍最小二乘法拟合回归直线的注意事项。

一、数据的准备在使用最小二乘法拟合回归直线之前,首先需要准备好观测数据。

数据的准备包括收集样本数据、对数据进行清洗和处理,确保数据的准确性和完整性。

还需要对数据进行可视化分析,探索自变量和因变量之间的关系。

只有在数据准备充分的情况下,才能保证最小二乘法的拟合结果具有可靠性和有效性。

二、线性关系的验证在使用最小二乘法进行回归分析时,需要验证自变量和因变量之间是否存上线性关系。

线性关系的验证可以通过散点图、相关系数等统计手段进行分析。

如果自变量和因变量之间呈现非线性关系,那么使用最小二乘法拟合回归直线可能会导致模型拟合不佳,影响数据分析的准确性。

三、异常值的处理在进行最小二乘法拟合回归直线时,需要注意异常值的存在。

异常值可能会对拟合结果产生较大影响,导致模型失真。

需要对异常值进行识别和处理,可以采用箱线图、3σ原则等方法进行异常值的识别,并对异常值进行必要的调整或剔除。

四、多重共线性的检测在多元最小二乘法中,需要特别注意自变量之间是否存在多重共线性。

多重共线性会导致自变量之间存在高度相关性,从而使得最小二乘法的拟合结果不稳定,模型的解释性降低。

需要通过方差膨胀因子(VIF)等方法进行多重共线性的检测,并在必要时进行变量的调整或剔除。

五、残差的验证在进行最小二乘法拟合回归直线后,需要对模型的残差进行验证。

残差是预测值与观测值之间的差异,通过对残差的分析可以检验模型的拟合程度和预测效果。

可以使用残差图、残差分布等方法进行残差的验证,确保模型的残差符合正态分布和独立同分布的假设。

六、模型的解释和评价在使用最小二乘法拟合回归直线后,需要对模型进行解释和评价。

非线性模型预测控制的若干问题研究

非线性模型预测控制的若干问题研究

非线性模型预测控制的若干问题研究一、概述随着现代工业技术的快速发展,非线性模型预测控制(Nonlinear Model Predictive Control,NMPC)已成为控制领域的研究热点。

非线性系统广泛存在于实际工业过程中,其特性复杂、行为多样,且具有不确定性,这使得传统的线性控制策略在面对非线性系统时往往难以取得理想的效果。

研究非线性模型预测控制策略,对于提高控制系统的性能、稳定性和鲁棒性具有重要意义。

非线性模型预测控制是一种基于非线性模型的闭环优化控制策略,其核心思想是在每个采样周期,以系统当前状态为起点,在线求解有限时域开环最优问题,得到一个最优控制序列,并将该序列的第一个控制量作用于被控系统。

这种滚动优化的策略使得非线性模型预测控制能够实时地根据系统的状态变化调整控制策略,从而实现对非线性系统的有效控制。

非线性模型预测控制的研究也面临着诸多挑战。

由于非线性系统的复杂性,其预测模型的建立往往较为困难,且模型的准确性对控制效果的影响较大。

非线性模型预测控制需要在线求解优化问题,这对计算资源的需求较高,限制了其在实时性要求较高的系统中的应用。

非线性模型预测控制的稳定性和鲁棒性也是研究的重点问题。

本文旨在深入研究非线性模型预测控制的若干关键问题,包括非线性模型的建立、优化算法的设计、稳定性和鲁棒性的分析等。

通过对这些问题的研究,旨在提出一种高效、稳定、鲁棒的非线性模型预测控制策略,为实际工业过程的控制提供理论支持和实践指导。

1. 非线性模型预测控制(NMPC)概述非线性模型预测控制(Nonlinear Model Predictive Control,简称NMPC)是一种先进的控制策略,广泛应用于各种动态系统的优化控制问题中。

NMPC的核心思想是在每个控制周期内,利用系统的非线性模型预测未来的动态行为,并通过求解一个优化问题来得到最优控制序列。

这种方法能够显式地处理系统的不确定性和约束,因此非常适合于处理那些对控制性能要求较高、环境复杂多变的实际系统。

递推最小二乘法_协方差矩阵_概述说明以及解释

递推最小二乘法_协方差矩阵_概述说明以及解释

递推最小二乘法协方差矩阵概述说明以及解释1. 引言1.1 概述在统计学和计量经济学中,递推最小二乘法(Recursive Least Squares,简称RLS)是一种常用的参数估计方法。

它通过不断更新样本数据进行参数的估计,并且可以适用于非静态数据场景。

协方差矩阵是统计分析中重要的概念,它描述了变量之间的线性关系强度和方向,并且在许多领域具有广泛应用。

1.2 文章结构本文首先介绍递推最小二乘法的定义和原理,在此基础上详细解释算法的步骤以及其应用领域。

接着,我们将引入协方差矩阵的概念并介绍其计算方法,同时探讨了它在实际问题中所起到的作用和应用场景。

最后,我们将对递推最小二乘法与协方差矩阵之间的关系进行解释,并通过实例分析来说明它们如何相互影响。

1.3 目的本文旨在全面介绍递推最小二乘法和协方差矩阵,并深入探讨它们之间的联系。

通过对这两个概念及其应用的理解,我们可以更好地理解参数估计方法和变量间关系的描述与分析。

此外,我们还将展望相关领域未来可能的研究方向,以促进学术和实践的进一步发展。

2. 递推最小二乘法2.1 定义和原理:递推最小二乘法是一种用于估计线性模型参数的方法。

它可以通过历史数据的不断更新来逐步拟合模型,以使得估计值与观测值之间的误差达到最小化。

该方法可以被形式化地描述为以下步骤:1. 初始化模型参数的初始值。

2. 从历史数据中选择一个样本,并使用当前参数估计出该样本对应的输出值。

3. 计算该样本的预测误差。

4. 根据预测误差对参数进行调整,使得预测误差尽量减小。

5. 重复步骤2至4,直到所有样本都被处理过一遍,或者满足终止条件。

递推最小二乘法是基于最小二乘原理,即将真实观测值与模型预测值之间的差异平方求和并最小化这个目标函数。

通过迭代地更新参数,递推最小二乘法可以逐渐优化模型,并获得更准确的参数估计。

2.2 算法步骤:具体而言,在每次迭代中,递推最小二乘法按照以下步骤进行操作:1. 根据历史数据选择一个样本,并根据当前的参数估计出预测值。

回归分析中的偏最小二乘回归模型应用技巧(Ⅱ)

回归分析中的偏最小二乘回归模型应用技巧(Ⅱ)

回归分析是统计学中一种重要的数据分析方法,它用于研究自变量与因变量之间的关系。

在实际应用中,回归分析可以帮助我们预测未来的趋势、评估影响因素、进行市场预测等。

而偏最小二乘回归模型(Partial Least Squares Regression, PLSR)作为一种回归分析方法,在一些特定领域有着非常明显的应用优势。

本文将探讨偏最小二乘回归模型的应用技巧,帮助读者更好地理解和运用这一方法。

一、理解偏最小二乘回归模型的原理偏最小二乘回归模型是一种多元统计分析方法,它主要用于解决自变量之间存在多重共线性、因变量之间存在相关性等问题。

在传统的多元线性回归中,当自变量之间存在高度相关性时,会导致回归系数的估计不准确,甚至无法进行回归分析。

而偏最小二乘回归模型通过对自变量和因变量进行降维处理,找到最能解释因变量变异的新变量,从而避免了多重共线性和相关性带来的问题。

在偏最小二乘回归模型中,首先会将自变量和因变量进行主成分分析,得到新的主成分变量。

然后,通过最小二乘法对主成分变量进行回归分析,得到了偏最小二乘回归系数。

这些回归系数可以帮助我们理解自变量和因变量之间的关系,同时也可以用于预测和分析。

二、选择合适的偏最小二乘回归模型在应用偏最小二乘回归模型时,选择合适的模型是非常重要的。

首先,我们需要考虑自变量和因变量之间的关系是否符合线性关系。

如果存在非线性关系,可以考虑使用非线性偏最小二乘回归模型,或者对数据进行变换处理。

其次,我们需要考虑自变量和因变量的数量和相关性,以确定模型的复杂度和可解释性。

最后,我们还需要考虑模型的稳定性和预测能力,以确保选择的模型能够有效地解释数据和进行预测。

三、数据预处理在进行偏最小二乘回归分析之前,我们需要对数据进行预处理。

首先,我们需要对数据进行标准化处理,以消除不同变量之间的量纲差异。

其次,我们需要对数据进行缺失值处理和异常值处理,以确保数据的完整性和准确性。

最后,我们还可以考虑对自变量进行降维处理,以减少模型的复杂度和提高计算效率。

最小二乘法和theil-sen趋势估计方法_概述说明以及解释

最小二乘法和theil-sen趋势估计方法_概述说明以及解释

最小二乘法和theil-sen趋势估计方法概述说明以及解释1. 引言1.1 概述引言部分将总体介绍本篇文章的研究主题和方法。

本文将探讨最小二乘法和Theil-Sen趋势估计方法,这两种方法旨在通过拟合数据来寻找变量间的关系,并用于预测和估计未来的趋势。

最小二乘法是一种常见且广泛应用的回归分析方法,而Theil-Sen趋势估计方法是一种鲁棒性更强的非参数统计方法。

1.2 文章结构引言部分还需要简要描述整篇文章的结构以供读者参考。

本文包含以下几个主要部分:引言、最小二乘法、Theil-Sen趋势估计方法、对比与对比分析、结论与展望。

每个部分将详细说明相关概念、原理及其在实际应用中的特点。

1.3 目的引言部分还需明确指出本文的目的。

本文旨在比较和对比最小二乘法和Theil-Sen趋势估计方法,评估它们在不同场景下的优缺点,并为读者提供选择适当方法进行数据拟合和趋势预测的依据。

此外,我们也会展望未来这两种方法的改进和应用领域扩展的可能性。

以上为“1. 引言”部分的详细清晰撰写内容。

2. 最小二乘法:2.1 原理介绍:最小二乘法是一种常用的回归分析方法,用于寻找一个函数(通常是线性函数)来逼近已知数据点的集合。

其基本原理是通过最小化实际观测值与模型预测值之间的残差平方和,寻找到使得残差最小化的系数,并将其作为估计值。

利用最小二乘法可以得到拟合直线、曲线或者更复杂的函数来描述数据点之间的关系。

2.2 应用场景:最小二乘法广泛应用于各种领域和行业,包括经济学、社会科学、物理学等。

例如,在经济学中,最小二乘法可以用于研究变量之间的关系以及预测未来趋势。

在工程领域,它可以用于建立模型并进行参数估计。

2.3 优缺点分析:最小二乘法具有以下优点:- 算法简单易行:只需要对数据进行简单处理即可求解出最佳拟合曲线。

- 表示能力强:可以适应不同类型函数的拟合。

- 结果一致性较好:针对相同数据集,得到的结果通常是一致的。

然而,最小二乘法也存在一些缺点:- 对异常值敏感:在数据集中存在离群值时,会对拟合曲线产生较大影响。

非线性最小二乘问题

非线性最小二乘问题

非线性最小二乘问题非线性最小二乘问题是一种解决实际应用中非线性系统求解最优化问题的有效方法,是研究遥感、机器人导航、机床控制、智能控制等领域的研究的基础。

非线性最小二乘问题具有普遍性,在很多学科和领域中都有广泛的应用。

一般来说,非线性最小二乘问题是一种优化问题,它涉及到求解满足条件的参数及其对应的函数最小值,其函数由基本函数和残差函数两部分组成。

基本函数又称作目标函数,是根据实际问题解题的依据;残差函数又称作约束函数,是根据实际约束条件而确定的。

因此,非线性最小二乘问题的求解步骤有以下几个:(1)确定基本函数和残差函数;(2)确定求解的参数及其范围;(3)对对应的函数最小值,采用梯度下降法等优化方法求解;(4)判断最小值是否满足目标要求,以达到最优化的效果。

其中,梯度下降法是一种常用的优化方法,它可以帮助求解非线性最小二乘问题,梯度下降法的基本思想是,在每次迭代中,根据目标函数对变量的梯度信息,找到该函数局部最小值,通过迭代搜索不断改进求解结果,使得每次迭代都能获得更优的结果。

另外,针对不同问题,还可以采用其他有效的优化方法,如模拟退火算法、粒子群算法等,它们都可以有效解决非线性最小二乘问题。

模拟退火算法是一种迭代算法,它可以有效地控制步长,从而有效改善求解结果;粒子群算法是一种仿生算法,它可以通过考虑各个粒子之间的信息交互,自动学习出有效的优化参数,从而有效求解非线性最小二乘问题。

总之,非线性最小二乘问题是一种常见的优化问题,其解题的基本步骤是确定基本函数和残差函数,然后采用梯度下降法、模拟退火算法、粒子群算法等有效的优化方法,从而求解满足约束条件的非线性最小二乘问题最优解。

研究非线性最小二乘问题,有利于更好地解决遥感、机器人导航、机床控制等工程实际应用中的问题,从而实现更高效的控制和决策。

非线性最小二乘法介绍_跟踪误差最小化

非线性最小二乘法介绍_跟踪误差最小化

非线性最小二乘法—跟踪误差最小化很实用的2010-09-28 | 16:31分类:matlab |在研究分析中,我们常常使用非线性最小二乘法的方法对数据进行回归或归因分析。

数据拟合可以发现数据数据自身逻辑关系、确定回归模型参数或根据已知数据进行预测分析。

数据的非线性最小二乘法是用连续曲线近似的刻画或比拟平面或空间中离散点所表示的坐标之间函数关系的一种数据处理方法,是用解析表达式逼近离散数据的一种方法。

非线性最小二乘法具体分为两个步骤:1.确定拟合模型类型,2确定拟合模型参数。

拟合模型类型有线性方程、指数方程、微分方程、多项式方程、混合方程等等。

拟合方程的选择是一个复杂的问题。

若拟合方程未知,通常使用反复测试的方法,即给定几种备选拟合模型,进行多次拟合,选择拟合效果最好的模型进行拟合。

指数基金(Index Fund),是以指数成份股为投资对象的基金,即通过购买一部分或全部的某指数所包含的股票,来构建指数基金的投资组合,目的就是使这个投资组合的变动趋势与该指数相一致,以取得与指数大致相同的收益率。

1976年美国先锋基金管理公司(Vanguard Fund Co.)推出了世界上第一只真正意义上的指数基金—追踪标准普尔500指数的Vanguard 500指数基金,从此指数化投资开始正式登上金融舞台。

复制指数的方法就有两大类:即完全复制(full replicate)和优化复制(optimized replicate)。

完全复制就是购买标的指数中的所有成份证券,并且按照每种成份证券在标的指数中的权重确定购买的比例以构建指数组合从而达到复制指数的目的。

以标准普尔500 指数为例,按市值比重购入全部500种成分股就可以完全复制指数。

当然,实际情况要复杂的多,因为指数是一个“纸面上的组合”(paper portfolio),每种成份证券在标的指数中的权重时时刻刻在发生变化,以某一时刻的相对权重值来确定组合的结构显然不能保证组合的走势与指数完全一致,因此实务中即便是完全复制也要根据追踪误差的偏离状况对组合进行动态调整。

非线性最小二乘拟合 原理

非线性最小二乘拟合 原理

非线性最小二乘拟合原理
非线性最小二乘拟合是一种常用的非线性参数估计方法,广泛应用于数据分析、曲线拟合和模型优化等领域。

其基本原理是通过最小化残差平方和来确定最优参数估计值。

在非线性最小二乘拟合中,假设存在一个非线性函数模型
y=f(x;θ),其中 x 是自变量向量,θ 是待估计的参数向量,y 是因变量向量。

通过拟合实验数据,我们的目标是找到最优的参数估计值θ,使得模型预测值与实际观测值之间的差异最小。

拟合过程可以通过以下步骤进行:
1. 定义非线性函数模型y=f(x;θ)。

2. 构建残差函数r(θ)=y−f(x;θ),其中r(θ) 是模型预测值与实际观测值之间的差异。

3. 定义目标函数对象S(θ)=Σ[r(θ)]^2,即残差平方和。

4. 通过最小化目标函数S(θ),即求解min S(θ),得到最优的参数估计值θ。

5. 求解最小化问题可以使用各种数值优化算法,如牛顿法、Levenberg-Marquardt 算法等。

非线性最小二乘拟合的关键是构建合适的非线性模型和选择合适的优化算法。

构建模型需要考虑数据特点和问题背景,而选
择优化算法需要根据问题的性质和数据规模进行综合考虑。

需要注意的是,非线性最小二乘拟合对初始参数的选择十分敏感,不同的初始参数可能会导致不同的拟合结果。

因此,在实际应用中,常常需通过多次试验和调整初始参数,以获得更好的拟合结果。

总而言之,非线性最小二乘拟合是一种通过最小化残差平方和的方法来估计参数的有效工具。

通过合理的模型构建和优化算法选择,可以对实验数据进行准确的拟合和参数估计。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

通过动态非线性偏最小二乘法对非线性模型进行预测以及控制G. BAFFI, J. MORRIS and E. MARTIN过程分析与控制技术中心,纽卡斯尔大学,纽卡斯尔,英国通过动态非线性偏最小二乘(PLS )模型,模型预测控制(MPC)技术延伸到了非线性系统。

对于嘈杂的建模,PLS显示有适合它的多元回归方法,相关性以及/或者总线的数据。

在一个“静态”框架内,这种方法已广泛应用于工业过程一些数据的建模和分析中。

本文的贡献是对于非线性动态PLS框架在MPC应用中的发展。

该非线性动态PLS模型利用了一个基于误差的非线性偏最小二乘算法,其中非线性内部模型是建立于自回归与外源输入(ARX )框架。

特别地,我们应该将二次和前馈神经网络内部模型考虑在内。

一个MPC框架内的一个动态的PLS模型的应用开辟了一种基于多元统计基础的预测方法,这一方法不仅应用于过程建模,推理估计和性能监控,同时也可进行模型预测控制。

一个基准仿真的pH值中和系统验证了非线性动态PLS框架在模型预测控制中的应用。

关键词:模型预测控制,非线性动态偏最小二乘引言模型预测控制(MPC )正成为一种常规的采用先进的过程控制策略。

基于线性过程模型的MPC算法已被广泛研究并应用于化工流程工业。

这主要归功于它们处理过程约束,时间延迟和多变量系统的能力。

然而,许多过程是高度非线性的,并且,基于线性过程模型的MPC算法可能会导致控制性能不佳;这样一来,MPC技术就延伸到了非线性过程1-6。

在MPC中,感知的过程动态模型首先发展为预测过程在未来一定时间内的输出值。

这些数值被用来评估未来的控制动作,以减少预定义的代价函数。

基于程控制策略的过程建模和模型都是特别依赖于感兴趣的系统中的适当的数学表达式的可利用性。

一种方法是通过基于详细的化学和物理现象的知识原理的机理原理以及模型的发展来确定过程行为。

虽然一些非线性的MPC方法已经应用于基于非线性的展开机理模型,但是由于他们的发展需要详细知识和时间,这一方法未能受到广泛的应用6。

此外,在现代这个响应式的制造环境中,对于复杂的多产品生产家,精确的理论模型的研发甚至可能不实用。

由于一些正在研究的不具体的过程知识比那些需要制定一个物理原理模型更加具有需求性,从过程操作数据鉴定而来的以经验数据为基础的模型提供了另一种机械建模。

在工业流程上,这使得非线性的MPC算法得到了更广泛的应用。

这种结构包括多项式自回归滑动平均模型(ARMA)3,Volterra级数模型5,7和神经网络模型8,9。

当那些属于基本过程表示的是相关过程变量性质的正在发展的经验表示模型时,一个重要的、潜在的甚至严重的问题产生了。

无视相关结构能够严重影响用于获得该模型的非线性优化技术参数。

一种解决方案是应用基于偏最小二乘(PLS )建模技术的多变量的统计预测,且这种建模技术考虑到了数据底层结构的相关性。

这项工作的目的是评估动态非线性PLS在MPC应用上的适用性。

一个良好已知的基准pH中和模型10已应用于测试动态非线性偏最小二乘回归模型及其在非线性PLS MPC方案中的使用。

严重的非线性特征提供了一个主要的建模挑战。

动态经验建模以经验数据为基础的建模方法是利用数学函数关系和回归工具(例如,最小二乘法或非线性最优化技术)来评估模型参数(回归系数) 。

这些由变量代表进程的行为,以及质量或要被控制的产品,或系统输出的特性收集而来的可以利用到实验性的数据(测量)对于经验建模技术的发展是有必要的。

大量的模型可用于动态经验建模。

最常见的形式包括输入/输出模型,如状态空间,时间序列,卷积,连续和离散时间传递函数模型。

但是这篇文章的范围不是回顾一系列的动态建模技术11,12。

在这项研究中,自回归与外部输入( ARX )模型可用二次结合和神经网络偏最小二乘方法13表示出来。

ARX 模型公式可以写为:11()(1)()()y un n i j i j y k A y k B u k j v k ===∙-+∙-+∑∑ (1)其中,u ( k )和Y ( k )分别是过程输入和输出数据矢量,v ( k )是扰动噪声矢量,根据输入和输出的数目维变量,在时间点K 处采集数据、Ai 和Bj 是模型系数,ny 和nu 矩阵分别是时间滞后的输出和输入变量。

可以看出,该模型结构是基于(时间)过程变量的测量和滞后值,它假定在k 时刻,输出值是一个以之前过程为条件的结果。

这种方法的优点是当过程数据呈现给稳态回归模型是“动态”时,稳态回归技术可以用于动态过程建模。

作为一种简单的矩阵形式,ARX 模型可以表示为回归行向量点x (k ),两个向量点分别为滞后输出和输入值:()[(1)(2)()(1)(2)()]y u x k y k y k y k n u k u k u k n =-∙-∙-∙-∙-∙- (2) 公式(2)可以改写为:()()()y k C x k v k =∙+ (3)其中模型矩阵C 是由C =[A1, A2 ….Any , B1,B2…Bny]给出。

当建立一个ARX 回归模型时,在公式(3)中的矩阵C 从其中被假定可用的输入和输出数据中计算出来,这些数据作为有代表性的典型过程这一条件被操作。

因此,这两个数据集,Xn* p 和Yn*l 其中的n 是样品的数量,P 和l 是流程的数量以及质量变量的数量,这些数据可以用来预测该过程的未来行为。

该过程测量与产品“质量” 、“响应”、或者数据在样品性质(时间上)上被定义和排序成两个矩阵:(1)(2)()x x x x k ⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦和 (1)(2)()y y y y k ⎡⎤⎢⎥⎢⎥⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦ 其中每一行向量点x (k )是根据公式(2)定义的 ,每个行向量y (K )包含相应的输出值是根据公式(3)定义的 。

然后两个数据矩阵X 和Y 可以通过公式Y=X*C+V 联系起来,其中V 是一个包含扰动信号的矩阵v (k ) 。

对于矩阵C 运用普通的最小二乘解出,如下公式给出:1()T T LS C X X X Y -=∙∙∙ (4)在时间点k 上,ARX 模型提供了对于输入和输出数据的一步到位的超前预测,即用于预测在时间点(K +1)的输出。

然而,知道在时间点k 到来之前输入变量的未来值,同时这样使得实现模型形式作为多步超前预测成为可能。

多步超前预测可以使用预测的输出值,而不是在公式(2)计算出的的输出值 ,即回归矢量x 可以被定义为:()[(1)(2)()(1)(2)()]u u x k y k y k y k n u k u k u k n ΛΛΛ=-∙-∙-∙-∙-∙- (5) 其中Y (K )表示在时间点k 的预测输出。

此外,如果测得的输出值是可用的,即使在不规则的时间的基础上,通过回归向量代替预测值x ,它们可以被送入到模型中。

线性的、非线性的经验建模技术的主要缺点与灵敏度回归工具的数据矩阵有关,其中包括变量高度相关或共线。

用最小二乘解方程( 4 )会带来单数,模型估算会不精确和不稳定,即在数据矩阵中的小变化将导致参数估计的重大差距。

特别的,当模型数据被收集在一个显着的因为大量的变量的化学过程因而记录在每个单元的过程中时,这个问题被提出来,其中有许多解释了相同的底层程序的行为。

此外通过闭环控制系统以及对那些当收集这些数据时候不能被打开时进行再回收,作为一个施加在过程变量的结果,相关或总线的数据得到落实。

因此,回归矩阵的过程变量在时间上将显示出自相关和互相关。

也就是说,它们可以与自身或在不同的采样时间点收集到其他变量相关。

如果当数据被用于构建在MPC中的动态经验模型时,这种关系并不为之负责,这将会是特别严重的。

可能将导致控制器性能较差甚至不稳定。

这些问题可以通过使用基于偏最小二乘(PLS )的回归预测技术来克服。

偏最小二乘(PLS)建模对于如何处理在时间上变量同时是自动和交叉相关的流程数据,解决这种问题的一种方法是PLS的多元统计预测技术的应用。

在扰动建模、相关性或共线数据上,PLS一直表现为一个合适的多元回归方法,且它已广泛地用于“静态”框架建模,推理估计以及工业过程数据的性能监测。

这主要是因为该方法把多输入多输出回归问题减少到了许多个单输入单输出回归问题。

在PLS上,Geladi和Kowalski的作品是最清晰和完整的教程之一。

在线性PLS中,输入和输出变量首先是映射到正交潜变量的子空间,得到输入和输出的分向量分别为t和u 。

普通最小二乘回归是在每一对相应的输入和输出分数之间形成。

通过一组权重向量(w)和负载向量(P),输入数据与输入变量有关联,而通过一组负载向量(Q),输出的数据与输出变量有关联。

偏最小二乘法的核心算法是非线性迭代偏最小二乘算法(NIPALS )。

在PLS 的输入和输出数据矩阵中,每对潜变量占据有一定量的可变性。

典型地,如果变量是高度相关或共线的,与两个数据块相联系的大多数的变异可首先由几个潜在的变量捕获,低阶潜变量与在数据中存在的随机噪声有联系。

作为一种数据定义,需要描述过程行为而用到的潜变量的适当数量是通过交叉验证的应用确定的。

附录1提供了一种标准的线性PLS算法总结。

PLS最初是发展为一个线性回归技术。

然而,当线性PLS应用到非线性问题上时,这些只占有少量的总体变异性的潜变量不一定会被丢弃。

实际上,它们相对于描述要建模的系统的潜在的非线性行为可能是很重要的。

因此,理论上,通过选择潜变量的适当数量,非线性结构可以进行线性PLS建模。

然而,最终的PLS模型通常会包含太多的潜变量以至于与目标不合适,例如建模,校准或对于某些行业系统的性能监测。

这个问题的解决方案已经在文献中提出。

最常用的应用程序已经把非线性函数结合在线性PLS框架之内,从而提供了一种保留了线性PLS统计功能的非线性PLS算法。

Wold等人17提出了一种保留线性PLS框架的非线性PLS算法,但对于每一个保留的潜变量,所用的二阶(二次)多项式回归(QPLS )适合每一对相应的输入和输出数据的函数关系。

作为与更新相关的输入变量的投影参数,Wold等人确定了在线性PLS框架内非线性回归技术的主要缺点。

他们继续提出了一个解决方案,并展示了他们的方法是如何校正输入的权重适合于输入和输出数据之间任何连续的,可微的函数关系。

他们还指出,当输入和输出的数据仅仅显示为略微的非线性函数关系时,一个“快速”和“简单”的PLS方法表示可以采用,根据原来的非线性迭代偏最小二乘(NIPALS)算法,其中权重W不列入一个校正程序进行性评估。

在输入和输出潜变量之间的内部映射中掺入神经网络的这条路径是允许的。

在这里,一组神经网络,每个潜变量都是用来确定非线性内回归模型。

通过在输入和输出之间的潜变量的内映射中加入一个径向基网络18,类似的方法有采用过。

相关文档
最新文档