神经网络模型预测控制器

合集下载

控制系统中的神经网络控制方法

控制系统中的神经网络控制方法控制系统是指通过对被控对象进行监测和调节，以达到预定要求的系统。

而神经网络控制方法是指利用神经网络模型和算法对控制系统进行优化和改进的方法。

本文将介绍神经网络控制方法在控制系统中的应用以及其原理和优势。

一、神经网络控制方法的原理神经网络控制方法主要基于人工神经网络模型，它模拟了生物神经系统的结构和功能。

该模型由多个神经元组成，这些神经元相互连接并通过权重参数传递和处理信息。

其原理主要包括以下几个方面：1. 网络拓扑结构：神经网络控制方法中使用的神经网络有多种拓扑结构，如前馈神经网络、循环神经网络和自适应神经网络等。

这些网络结构可以灵活地应用于不同的控制问题。

2. 学习算法：神经网络通过学习算法来调整网络中神经元之间的连接权重，以逐步优化网络的性能。

常见的学习算法包括反向传播算法、遗传算法和模糊神经网络算法等。

3. 控制策略：神经网络控制方法可以基于不同的控制策略，如比例积分微分（PID）控制、模糊控制和自适应控制等。

通过在神经网络中引入相应的控制策略，可以实现对被控对象的精确控制和调节。

二、神经网络控制方法在控制系统中的应用1. 机器人控制：神经网络控制方法在机器人控制中有广泛应用。

通过将神经网络嵌入到机器人的控制系统中，可以实现对机器人运动、感知和决策等方面的智能控制。

这种方法能够提高机器人的自主性和适应性，使其能够更好地适应不同环境和任务的需求。

2. 工业过程控制：神经网络控制方法在工业过程控制中也得到了广泛应用。

通过利用神经网络对工业过程进行建模和优化，可以提高生产效率、降低能耗和减少故障率。

此外，神经网络控制方法还可以应用于故障诊断和预测维护等方面，提高工业系统的可靠性和稳定性。

3. 航天飞行器控制：神经网络控制方法在航天飞行器控制方面也有重要应用。

通过神经网络对航天飞行器的姿态、轨迹和轨道控制进行优化，可以提高飞行器的稳定性和导航精度，降低燃料消耗和飞行风险。

模型预测控制

反馈校正
2 3 y
u
4
yˆ(k1)ym(k
e(k1)yˆ(k
1
k k+1
t/T
1─k时刻的预测输出ym(k) 2─k＋１时刻实际输出y (k+1)
3─预测误差e(k+1)
4─k＋１时刻校正后的预测输出ym(k+1)
反馈校正
y(k) e(k)
y (k+j| k)
y(k-j)
u(k-j) k-j
ym(k )
+ ym(k+j| k)
+
反馈校正
预测模型
y(k|k)
_ +
模型预测控制的基本原理
预测模型
预测模型的功能
根据被控对象的历史信息{ u(k - j), y(k -j) | j≥1 }和未来输入 { u(k + j - 1) | j =1, …, M} ，预测系统未来响应{ y(k + j) | j =1, …, P} 。
i ＝1, 2, 3, …, j
滚动优化
控制目的
▪通过某一性能指标J 的最优, 确定未来的控制作
用u(k+j|k)。指标J希望模型预测输出尽可能趋近
于参考轨迹。
优化过程
▪随时间推移在线优化，每时刻反复进行 ▪优化目标只关心预测时域内系统的动态性能 ▪每周期只将u(k+1|k)或u(k+m|k)施加于被控过程
模型预测控制的发展
理论背景：
新的控制理论得到发展
➢现代控制理论
状态空间分析法最优控制理论系统辨识与参数估计
➢新发展的控制理论
自适应控制非线性控制多变量控制
➢得到应用：航空、机电、军事等

基于神经网络的多变量非线性系统的广义预测控制

中图分类号：Ｐ８Ｔ１３文献标识码：Ａ
１问题的提出
广义预测控制（Ｐ㈨日臻成熟，ＧＣ）在工业过程控制、航空航海导航等实际系统获得了广泛的应用，并且在理论工作上也有深入的研究。然
・
．
一
± 厂
．
一
－３Ｉ ∞ Ｉｑ７ｌ。ｌ３．＇。Ｊ
一
＿一ＩＢｘ，
：
Ｌ
旦Ｌｈ．
—
一
１ “ ・
被
控
对
：
一
而，一方面，虽从原理上说单变量ＧＣ可以平行推广到多变量系统，Ｐ但是在实际工业过程中，系统的多个环节之间有着较强的耦合，只简单地
套用单变量的控制算法，很难使每一回路的输出都得到满意的控制效果。并且计算过程也相当复杂，因此有必要对ＧＣ的控制器进行解耦设Ｐ计］。另一方面，与其他成熟的自适应控制理论一样，广义预测控制理论只能局限于线性系统，对于复杂的非线性系统，义预测控制则显得有广些力不从心。神经网络¨］以其对一般非线性函数的映射和逼近能力，给非线性系统的解耦注入了新的活力，同样也为广义预测控制理论对非这线性系统控制提供了一条新的途径。文先用神经网络对其进行开环解本
充、互相验证。
位测试、岩土试验等）施工检测、＿监测成果进行对比、、施Ｔ验证，建立相对应的经验关系，从而建立定量分析、判定标准，确保工程勘察质量。
（责任编辑：培荣）薛

基于神经网络的闭环控制学习算法

基于神经网络的闭环控制学习算法一、神经网络在闭环控制中的应用概述神经网络作为一种强大的机器学习模型，其在闭环控制系统中的应用日益广泛。

闭环控制系统，又称为反馈控制系统，是指系统输出与期望输出之间存在反馈回路的控制系统。

在这种系统中，控制算法根据系统输出与期望输出之间的误差来调整控制输入，以达到控制目标。

神经网络因其出色的非线性映射能力和自适应学习能力，在处理复杂系统和不确定性环境中显示出了巨大的潜力。

1.1 神经网络的基本原理神经网络是由大量简单的计算单元（称为神经元）组成的网络，这些神经元通过加权连接相互连接。

每个神经元接收输入信号，进行加权求和，并通过激活函数处理后输出。

通过调整神经元之间的连接权重，神经网络可以学习到输入与输出之间的复杂映射关系。

1.2 神经网络在闭环控制中的作用在闭环控制系统中，神经网络可以用于建模、预测、控制和优化等多个方面。

它可以学习系统的动态行为，预测系统的未来状态，或者直接作为控制器来调整控制输入。

此外，神经网络还可以用于处理系统的不确定性和非线性，提高系统的鲁棒性和适应性。

二、基于神经网络的闭环控制学习算法基于神经网络的闭环控制学习算法是一类利用神经网络来实现闭环控制的算法。

这些算法通过训练神经网络来学习控制策略，以实现对系统的精确控制。

以下是几种典型的基于神经网络的闭环控制学习算法：2.1 反向传播算法（Backpropagation）反向传播算法是神经网络中最常用的学习算法之一。

它通过计算网络输出与期望输出之间的误差，并将误差反向传播至网络的输入层，以此调整网络权重。

在闭环控制系统中，反向传播算法可以用来训练神经网络控制器，使其能够根据系统误差来调整控制输入。

2.2 强化学习算法（Reinforcement Learning）强化学习是一种无模型的学习算法，它通过与环境的交互来学习最优策略。

在闭环控制系统中，强化学习算法可以使神经网络控制器通过试错来学习如何控制系统，以达到最优性能。

人工智能控制技术课件：神经网络控制

进行的，这种排列往往反映所感受的外部刺激的某些物理特征。
例如，在听觉系统中，神经细胞和纤维是按照其最敏感的频率分
布而排列的。为此，柯赫仑（Kohonen）认为，神经网络在接受外
界输入时，将会分成不同的区域，不同的区域对不同的模式具有
不同的响应特征，即不同的神经元以最佳方式响应不同性质的信
号激励，从而形成一种拓扑意义上的有序图。这种有序图也称之

,

,
⋯
,

)
若输入向量 X= ( 1
，权值向量
2

W=(1 , 2 , ⋯ , ) ，定义网络神经元期望输出与
实际输出的偏差E为：
E= −
PERCEPTRON学习规则
感知器采用符号函数作为转移函数，当实际输出符合期
望时，不对权值进行调整，否则按照下式对其权值进行
单神经元网络
对生物神经元的结构和功能进行抽象和
模拟，从数学角度抽象模拟得到单神经
元模型，其中是神经元的输入信号，
表示一个神经元同时接收多个外部刺激；
是每个输入所对应的权重，它对应
于每个输入特征，表示其重要程度；
是神经元的内部状态；是外部输入信
号；是一个阈值（Threshold）或称为
第三代神经网络：
2006年，辛顿（Geofrey Hinton）提出了一种深层网络模型——深度
置信网络（Deep Belief Networks，DBN），令神经网络进入了深度
学习大发展的时期。深度学习是机器学习研究中的新领域，采用无
监督训练方法达到模仿人脑的机制来处理文本、图像等数据的目的。
控制方式，通过神经元及其相互连接的权值，逼近系统

一种基于RBF神经网络预测模型的DMC预测控制

用ＲＦ神经网络来辨识和预测对象的模型，Ｂ从而建立一种新型的动态矩阵预测控制算法。在算法中，首先采用动态生成隐层节点的全监督式学习算
法＿训练神经网络，利用神经网络生成的辨识４ ’ 再信号、预测信号及系统的期望值，以动态矩阵算法的
＠２１ＳｉＴｅｈＥｎｎ．００ｃ．ｃ．ｇｇ
计算机技术
一
种基于ＲＦ神经网络预测模型的ＢＤＭＣ预测控制
李志武
（宁石油化工大学职业技术学院，辽抚顺１３０）１０１
摘
要
研究了一种利用ＲＦ神经网络预测模型的动态矩阵控制算法，Ｂ首先利用动态节点生成构造性ＲＦ神经网络辨识对Ｂ
Ｔ１３Ｐ８；
动态矩阵
文献标志码
动态结点生成训练算法
Ａ
非线性模型预测
中图法分类号
基于模型的预测控制始于２纪７０世０年代，已
经发展成熟的动态矩阵控制（Ｍ算法是基于线ＤＣ）
局部极值、练步数多、训隐层节点难于确定等缺点。
而径向基函数（Ｂ）ＲＦ神经网络，恰能弥补这些缺恰
性对象或弱非线性对象而设计的，般是通过获得一
对象的单位阶跃响应数据或者脉冲响应数据，估来
点，它是一种结构简单、练简洁、敛速度快、确训收准

机器人控制器高级算法介绍

机器人控制器的高级算法主要包括以下几个方面：1. 模型预测控制（Model Predictive Control, MPC）：MPC是一种基于模型的控制算法，它通过预测未来一段时间内系统的状态和输出，优化未来的控制输入以达到最佳的控制性能。

在机器人控制中，MPC 可以处理多变量、非线性和约束条件等问题，适用于复杂的运动规划和轨迹跟踪任务。

2. 自适应控制（Adaptive Control）：自适应控制算法能够根据系统参数的变化或者未知环境的影响自动调整控制参数，以保持良好的控制性能。

在机器人控制中，自适应控制可用于处理模型不确定性、外界干扰和机械磨损等问题。

3. 滑模控制（Sliding Mode Control, SMC）：SMC是一种鲁棒控制算法，它通过设计特殊的控制律使得系统状态快速进入并保持在一个所谓的“滑动面”上，从而消除系统中的不确定性影响和外部扰动。

在机器人控制中，SMC常用于保证系统的稳定性和精确跟踪。

4. 神经网络控制（Neural Network Control）：神经网络控制利用人工神经网络的非线性映射能力和学习能力来实现对复杂系统的控制。

在机器人控制中，神经网络可以用于建模未知的动态系统、处理高维和非线性问题，以及实现智能决策和自主学习。

5. 模糊控制（Fuzzy Control）：模糊控制是一种基于模糊逻辑的控制方法，它可以处理不精确、不确定和非线性的控制问题。

在机器人控制中，模糊控制常用于处理语言描述的控制规则和复杂的环境交互。

6. 遗传算法和粒子群优化（Genetic Algorithm and Particle Swarm Optimization, GA & PSO）：这些是两种常用的优化算法，可以用于寻找最优的控制参数或控制策略。

在机器人控制中，GA和PSO可以用于优化路径规划、姿态控制和动作学习等问题。

7. 深度强化学习（Deep Reinforcement Learning, DRL）：DRL结合了深度学习和强化学习的优点，能够在复杂的环境中学习最优的控制策略。

基于广义预测的非线性神经网络控制器

维普资讯
１４
常州工学院学报
２００７年
Ｙ（，，）ＷＩＷＲ，ＷＯ）
（）６
一
１ … ｌｋ＋）（）（２３ｋ＋１）＋… ＋
ｌｋ＋Ｐ一（
式（）５中的Ｗ和式（）６中的ＷＩＷＷＯ分别是，Ｒ，
仿真结果说明了该算法的有效性。
关键词Ｉ义预测控制；线性系统；经网络广非神
中图分类号：Ｐ８．Ｔ３９１
文献标识码：Ａ
文章编号：６１— ４６２０）１０１０１７０３（０７０ — ０３— ３
Ｕ５置Ｉ广义预测控制（Ｐ在工业过程控制中已ＧＣ）获得了广泛的应用，在理论上也有深人的研并究 … 。然而，义预测控制理论只能局限于线性广
维普资讯 ຫໍສະໝຸດ 第２０卷第１期２００７年２月
常州工学院学报
ＪｕｎｌｏａｇｈｕＩｓｉｔｆＴｃｎｌｇｏｒａｆＣｈｎｚｏｎｔｕｅｏｅｈｏｏｙｔ
ＶＯ１２．０Ｎｏ．１Ｆｅ２０ｂ．ｏ７
Ｙｋ＋）＝（（）Ｙｋ一１，，（（１，Ｙｋ，（） … Ｙｋ—ｎ，）
ｕ）比ｋ一１，一比ｋ— ）（，（）・，（ｍ）（）１
基于ＧＰ的策略，预测时域长度为Ｐ，Ｃ设控制时域长度为１控制系统的性能指标为，

神经网络在工业控制中的应用

神经网络在工业控制中的应用随着人工智能技术的不断发展，神经网络已经成为工业控制领域中重要的技术之一。

神经网络模型具有很强的适应性、自学习能力和非线性映射能力，可以应用于控制、诊断和优化等各个方面。

本文将介绍神经网络在工业控制中的应用，并探讨其发展前景。

一、神经网络在控制领域的应用1.1. 过程控制神经网络在过程控制方面的应用是最为广泛的。

例如，在石化、冶金、电力、水泥等行业中，可以利用神经网络对生产过程进行优化。

神经网络模型可以根据工业控制过程中的输入和输出信息，训练出一个适应性比较好的控制器，从而实现对生产过程的控制。

1.2. 机器人控制神经网络模型可以用于机器人控制领域。

例如，可以将神经网络与机器人掌握物体的动作相结合，通过训练网络来识别并掌握不同的物体，实现机器人对物体的掌握与放置。

1.3. 智能制造在智能制造领域中，神经网络可用于质量检测、故障诊断、生产预测等方面。

通过复杂的训练和数据分析，可以建立一个准确、高效的神经网络模型来优化制造流程和提高产品质量。

二、神经网络在工业控制中的优势2.1. 神经网络具有良好的非线性适应能力传统的控制方法主要基于线性模型来描述生产过程和控制系统。

然而，在现实生产过程中，经常会遇到非线性的控制问题。

由于神经网络模型具有很强的非线性特性，可以更有效地适应这些复杂的控制问题。

2.2. 神经网络具有高效的自适应学习能力传统的控制方法需要人工编程来调整系统参数，这需要大量的时间和经验。

而神经网络模型具有自适应学习能力，可以通过学习来适应新的控制环境，避免了传统控制方法的不足之处。

2.3. 神经网络具有高诊断能力神经网络模型可以对生产过程进行监测，同时可以定位和判断工业控制过程中的故障和异常。

相比传统的诊断方法，神经网络具有更高的准确率和故障检测能力。

三、神经网络在工业控制中的发展趋势3.1. 神经网络与云计算、大数据的结合随着云计算和大数据技术的不断发展，神经网络将更加普及和广泛应用。

基于多步预测神经网络的异步电动机控制器设计

ｔｅｅｔｄｄＫｌａｌｒＥＦ）ａｏｉｍ，ｎｈｒｉｉｈｘｎｅａｍｎｆｔ（Ｋｅｉｅｌｒｈａｄｔｅｔｎｎｇｔａｇ
ｓａｔｓｍｕｔｎｏｓｙｌｏｇｗｔｔｅｓｎｈｎｓｔｒｉｌｅｕｌａｎｉｈａｙｅｒｉｓａｈｏｍｍｏｏ．Ｔｅｔｒｈｕｅｕｎｓｎａｉｉｆｔｅｐｐｓｄｍｅｏｌｔｏｕｈｙｓｆｌｅｓａｄｖｌｔｏｈｒｏｅｔｄｗｅｈｒｇｌｄｙｏｈ￣＇ｏｖｒｅｔｓｎｈｎｓｍｏｏｒｅｓｓｍｎｄＰＥ．ｅｅｉｄｗｉａｙｃｒｉｍｔｒｄｉｙｔｉｓＡＣＴｉｆｈｏｖｅｈ
ＳＮａＨＥＹｎ—ｘａ，ＨＥａ一ｇ，ＩＺｈ —ｃｅｇｉＣＮＧｙ，Ｊｉｈｎ
（ｏｔｅｎＹｎｔｎｖｒｔ，ｘ２４２，ｈｎ）ＳｕｈｒａｇｅＵｉｓｙＷｕｉ１１２Ｃｉａｚｅｉ
摘要：在分析交流异步电动机数学模型的基础上，利
控制一般要建立多个网络或复合网络来实现，从而
存在结构复杂、计算量较大和误差放大明显等缺
点。本文针对普通ＢＰ算法容易陷入极小、以在难
‘
ｒｈ，ｏｅｐｅｏｔｌｒｗａｐｐｓｄｆｒｔｅｈｇｅ－ｉｍａｎｖｌｓｅｄｃｎｒｌｓｒｏｅｏｈｉｈｐｒｔｏｅｏ
沈艳霞，永奇，程纪志成
（南大学，江江苏无锡２４２）１１２

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

神经网络模型预测控制器摘要：本文将神经网络控制器应用于受限非线性系统的优化模型预测控制中，控制规则用一个神经网络函数逼近器来表示，该网络是通过最小化一个与控制相关的代价函数来训练的。本文提出的方法可以用于构造任意结构的控制器，如减速优化控制器和分散控制器。关键字：模型预测控制、神经网络、非线性控制

1.介绍由于非线性控制问题的复杂性，通常用逼近方法来获得近似解。在本文中，提出了一种广泛应用的方法即模型预测控制（MPC），这可用于解决在线优化问题，另一种方法是函数逼近器，如人工神经网络，这可用于离线的优化控制规则。在模型预测控制中，控制信号取决于在每个采样时刻时的想要在线最小化的代价函数，它已经广泛地应用于受限的多变量系统和非线性过程等工业控制中[3,11,22]。MPC方法一个潜在的弱点是优化问题必须能严格地按要求推算，尤其是在非线性系统中。模型预测控制已经广泛地应用于线性MPC问题中[5]，但为了减小在线计算时的计算量，该部分的计算为离线。一个非常强大的函数逼近器为神经网络，它能很好地用于表示非线性模型或控制器，如文献[4,13,14]。基于模型跟踪控制的方法已经普遍地应用在神经网络控制，这种方法的一个局限性是它不适合于不稳定地逆系统，基此本文研究了基于优化控制技术的方法。许多基于神经网络的方法已经提出了应用在优化控制问题方面，该优化控制的目标是最小化一个与控制相关的代价函数。一个方法是用一个神经网络来逼近与优化控制问题相关联的动态程式方程的解[6]。一个更直接地方法是模仿MPC方法，用通过最小化预测代价函数来训练神经网络控制器。为了达到精确的MPC技术，用神经网络来逼近模型预测控制策略，且通过离线计算[1,7.9,19]。用一个交替且更直接的方法即直接最小化代价函数训练网络控制器代替通过训练一个神经网络来逼近一个优化模型预测控制策略。这种方法目前已有许多版本，Parisini[20]和Zoppoli[24]等人研究了随机优化控制问题，其中控制器作为神经网络逼近器的输入输出的一个函数。Seong和Widrow[23]研究了一个初始状态为随机分配的优化控制问题，控制器为反馈状态，用一个神经网络来表示。在以上的研究中，应用了一个随机逼近器算法来训练网络。Al-dajani[2]和Nayeri等人[15]提出了一种相似的方法，即用最速下降法来训练神经网络控制器。在许多应用中，设计一个控制器都涉及到一个特殊的结构。对于复杂的系统如减速控制器或分散控制系统，都需要许多输入与输出。在模型预测控制中，模型是用于预测系统未来的运动轨迹，优化控制信号是系统模型的系统的函数。因此，模型预测控制不能用于定结构控制问题。不同的是，基于神经网络函数逼近器的控制器可以应用于优化定结构控制问题。在本文中，主要研究的是应用于非线性优化控制问题的结构受限的MPC类型[20,2,24,23,15]。控制规则用神经网络逼近器表示，最小化一个与控制相关的代价函数来离线训练神经网络。通过将神经网络控制的输入适当特殊化来完成优化低阶控制器的设计，分散和其它定结构神经网络控制器是通过对网络结构加入合适的限制构成的。通过一个数据例子来评价神经网络控制器的性能并与优化模型预测控制器进行比较。

2.问题表述考虑一个离散非线性控制系统：

其中为控制器的输出，为输入，为状态矢量。控制目标是保持输出接近参考轨迹，一般地控制目标是通过最小化代价函数来实现的：同时约束条件为：其中为k时刻预测状态和输出的函数，这里，由将来的输入组成：

为输入增量：在方程（2）中，Q和R输入与输出权值矩阵，为非负终止条件。根据动态编程的优化原则[6]，必须最小化代价函数（2），当终止条件为在K+N时刻时的无穷小，得出当时的无穷优化控制问题的解，同样就能得到有穷优化问题。对于非线性系统，优化控制问题一般无闭式解，因此，本文研究强力和不最理想的方法。

在模型预测控制（MPC）中，控制信号的确定是通过在每个采样时刻输入序列为时，最小化代价函数（2）。只有优化输入序列的第一个元素u（k）作为系统的输入，在下一个采样时刻k+1，新的优化问题是对于给定的优化控制问题而言的。在这种方法中，终止条件

可以看作是一个当时刻K+N趋于无穷时最小化代价函数的逼近器，但实际上更多的是用于保证闭环的稳定性。模型预测控制方法有一个非线性的缺点，且需要通过在每个采样时刻得到受约束的优化问题，同时需要通过在线计算来实现。为了减小模型预测控制的计算量，本文提出了一种精确MPC方法，在这种方法中，计算的部分是离线进行的。对于非线性系统，优化的MPC方法应该由离线计算进行映射，且用一个函数逼近器表示。更准确地，控制策略是通过最小化代价函数（2）定义控制信号，或等

于它的增量：其中作为计算代价函数（2）中的。对于任意，最小化代价函数（2）来评估方程（6）。从而通过离线训练来获得函数逼近器作为优化策略，尽管这种方法非常有用，但仍然存在一些限

制。因为MPC策略是基于信息来计算预测输出，这种不能很好的表示阶次递减或定结构的控制器。另外，计算还要求产生训练的数据非常广泛，这些每个训练数据点都需要一个MPC优化问题的解。

3.神经网络优化控制器在本节中，研究了构成第2节所述的控制问题的一个神经网络模型预测控制器的问题。这里我们采样一个训练数据集作为直接训练代价函数（2）的控制器，而没有计算优化MPC控制信号的离线优化问题。控制器表示如下：

其中为神经网络函数逼近器，I（k）为k时刻控制器的有效信号，W为逼近器参数（即神经网络权值）。

假设状态信息，如I（k）=时，控制器（7）可以看作是优化MPC策略（6）的函数近似。在本文中尽管研究的是这个方法，但控制器并没有完全受到状态信息的限制，而是把I（k）当成由许多输入u（k-i）与输出y（k-i）的过去值组成。，并将其作为参考信号

的设定值。这种方法可以构成高阶系统的较为复杂的控制器。I（k）值的不同选取方法将在第四节通过例子讲述。 Remark 1

为了降低控制器的复杂性，控制器的结构可以利用映射函数来确定，例如，假设

信息I（k）为：，一个分布式控制器为：，控制器的结构为：

为了用控制规则（7），即最小化代价函数（2）来确定控制器的参数W，需要知道训练数据：利用控制策略（7），系统的更新如下所示：用训练数据定义联想代价函数：

逼近器（7）的训练，最小化优化问题的平方为：约束条件为：

训练问题可以通过梯度算法来最小化优化问题的平方，如LM算法，从方程（11）可以得到代价函数的梯度为

其中：其中为神经网络输出关于网络参数的偏导数，它取决于网络的结构，可以根据下式得到： Remark 2 代价函数（11）用于训练神经网络控制器，与模型预测控制中代价函数类似，本文提出的控制器可以作为精确的模型预测控制器。注意到，对于一个给定的控制器的复杂性，计算量取决于优化控制器的参数W，而不是控制器的长度N。因此可以比模型预测控制能更灵活地用控制器的长度，从而被优化的参数也能成比例地增加。

4.仿真例子在本节中，用例子仿真来说明第3节中所讲的神经网络模型预测控制器，在所有例子中，控制规则（7）用一个前馈神经网络来表示，该网络含有一层隐含层，用双曲正切函数作为激

活函数。这种网络可以以任意精度逼近所有连续非线性函数[12]。I（k）作为输入，为输出，训练算法为LM算法[21]，用来解决非线性最小二乘问题（12），利用matlab的优化工具箱中的常规函数lsqnonlin来计算。在所有的例子中，优化范围N为足够大，这样对于闭环系统就能达到平衡，因此，用一个零终止条件作为代价函数（11）。例1 在本例中，我们仿真一个pH中和过程[10,18,17,1]，在文献[1]中，应用了一个神经网络来逼近优化MPC策略的过程。这个过程可以用非线性微分方程来表示，该过程的表达式如下式所示[17,1]：

式中，输出y（k）由pH值控制，u（k）为输入流量，用于控制，系统还有确定性扰动d（k）、相互独立的随机白躁声扰动v（k）和n（k）（分别用Rv和Rn表示）。采样时间为0.2分钟，时延为L=5，系统矩阵表示为输出的函数，如下所示。状态参数表达式为：其中这些系统参数的函数表达式在文献[1]中已有研究。根据方程（17），预测输出根据下式确定：

其中状态参数根据Kalman滤波原理得到：

，其中K（k）为Kalman滤波增益：优化控制策略为预测状态的函数，参考轨迹为，i=1,….N 假设参考轨迹由参考模型给出：

式中为设定值，为阶跃响应。控制策略为在k+L时刻时预测系统状态，参考模型的状态，设定值等的函数，控制器（7）的信息I（k）为：

参数的选取根据文献[1]，代价函数（11）中的权值为：Q=1，R=1。白躁声变量：，用于Kalman滤波方程（19）中，参考模型（20）为一个二阶系统，增益为1，一对极点，均为0.9 由于非线性系统的动态特性，为了在整个操作过程中获得优化控制器的精确特性，需要大量的数据集。与非线性系统辨识相比较，仍需要长的训练集[16]。训练数据（9）用于训练控

制器，包括轨迹跟踪和扰动抑制（将输出pH的范围控制在）。因此训练数据有两种类型。对于轨迹跟踪，训练数据由以下构成：初始状态作为稳定状态响应

，设定值的改变，八个相等的初始pH值，14个设定值，给定的14个参考轨迹。代价函数（11）的控制范围设定为N=150，这个足够使新的设定到达参考模型（20）所定义的参考轨迹。对于扰动抑制，训练数据由以下构成：常量设定值，参

考信号，初始状态对稳定状态的响应。同样有14个不同的常量设定值，用于轨迹跟踪，且有28个初始状态。在这种情况下，控制范围为N=25步，这就使系统能达到设定值的一个初始偏值。初始状态和参考轨迹的总数为M=42。训练集中的每个元素包括了N个数据点，总的数据点数为2800。根据一个独立的测试数据集来选取优化网络的大小，测试数据有36组2400个数据点，均是

均相同的方法产生训练数据， 6个范围在的初始pH值以及6个范围在的设定值。为了找出一个最小测试数据集，网络的大小不同，训练的结果如