智能控制--神经网络控制.答案

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

神经网络与其他算法相结合
将神经网络与专家系统、模糊逻辑、遗传算法等相结合, 可设计新型智能控制系统。
3.5.3 神经网络控制的研究重点

神经网络的稳定性与收敛性问题; 神经网络控制系统的稳定性与收敛性问题; 神经网络学习算法的实时性; 神经网络控制器和辨识器的模型和结构。
神经网络控制系统的结构类型
前向建 模多神 经网络 学习
+ + -

非线性系统 逆向建 模多神 经网络 学习
+
3.8 神经网络控制器的设计


直接逆模型神经网络控制器的设计
直接神经网络控制器的设计

多神经网络自学习控制器的设计
3.8.1 直接逆模型神经网络控制器的设计





神经网络逆
模型辨识

对象
建立逆模型时神经网络的训练示意图

性变化时,神经网络也能通过不断地调整权值和阈值自适应地跟踪对象 系统的变化。)

对于神经网络控制系统,其中的辨识是以系统在闭环 控制下所得到的观测数据进行的,因此一般属在线辨 识。对于时变系统,则只能使用在线辨识。

神经网络建模的考虑因素

模型的选择
精确性和复杂性的权衡;对神经网络辨识而言,权衡 表现为网络隐含层数的选择和隐含层内节点的选择。 权衡的有效途径:进行多次仿真实验。
可确保控制系统的稳定性和鲁棒性,有效提高系 统的精度和自适应能力。
期望输出
神经网络 控制器
+
-
传统控 制器
+
+
对象

(2) 神经网络直接逆控制 将对象的神经网络逆模型直接与被控对象串联起来, 使期望输出与对象实际输出之间的传递函数为1。
神经网络 控制器
对象
缺点:无反馈,用作控制器的神经网络逆模型不准确 时,抗干扰能力差,缺乏鲁棒性。 两种改进结构方案:


建模的两种基本情况
前向建模:建立系统本身的模型,也称正向建模; 逆向建模:建立系统的逆模型。
正向建模
指利用神经网络逼近对象本身的动力学特性。
简化结构图:
对 象 +
-
网络与系统并联; 输出之差用作训练信号; 对网络而言,系统的实 神经网络 际输出构成了期望的导 辨识模型 师信号,故为有导师学 习;可用多层前馈神经 网络实现;可进行离线辨识,也可进行在线辨识。


3.6.2 非线性静态系统的神经网络辨识


非线性动态系统的神经网络辨识


动态系统神经网络辨识的两类网络导致两种辨识 模型:

神 经 网 络 辨 识 模 型

神 经 网 络 辨 识 模 型




TDL
TDL
模型③的 动态系统 + + +





选取具体结构为 1-6-2-1型,则利用上面的学习算法可得到 仿真结果为




神经网络控制的研究领域
基于神经网络的系统辨识
① 将神经网络作为被辨识系统的模型,可在已知常规模 型结构的情况下,估计模型的参数。 ② 利用神经网络的线性、非线性特性,可建立线性、非 线性系统的静态、动态、逆动态及预测模型,实现非 线性系统的建模和辨识。
神经网络控制器
神经网络作为实时控制系统的控制器,对不确定、不确 知系统及扰动进行有效的控制,使控制系统达到所要求 的动态、静态特性。
非线性系统的神经网络辨识
神经网络辨识基础

概念
辨识:是在输入和输出数据的基础上,从一组给定
的模型中,确定一个与所测系统等价的模型。
辨识的三要素:
数据:能量测到的被辨识系统的输入/输出数据, 是辨识的基础。 模型类:要寻找的模型的范围,即所考虑系统的 结构。 等价准则:辨识的优化目标,用来衡量模型接近 实际系统的标准,也称误差准则或损失函数。
如何理解有导师学习与无导师学习?
如何理解神经网络的泛化能力?
基本BP算法的思想是什么?训练样本的流程如何? 主要优点和缺点是什么?
6.
动态 Hopfield 网络处理问题的重点是什么?简述 DHNN网络用于联想记忆时的两个阶段及其任务?
7. 8. 9. 10. 11.
神经网络控制的研究领域包括哪些? 神经网络辨识的两种基本情况是什么?对于一个给 定的未知系统,如何选择神经网络进行建模? 神经网络控制器有导师学习的重点是什么? 结合神经网络控制在线学习方法的结构图,论述在 线学习的思想和系统应满足的条件。 结合多神经网络自学习控制器的结构图,说明多神 经网络自学习控制系统的基本思想、原理和特点。



离线学习法 在线学习法 反馈误差学习法 多网络学习法
(2) 增强式学习(通过某一评价函数指定下的学习)
无导师信号,按照环境所提供数据的某些规则或 适当的评价函数调节网络参数。
(2) 再励学习(强化学习)
介于上述两种情况之间,外部环境只对输出结果 给出评价,而不给出具体答案,学习系统通过强 化那些受奖励的动作来改善自身的性能。

神经网络辨识
用神经网络作为被辨识对象的正模型、逆模型、预 测模型等,也称为神经网络建模。
说明:

本质上,神经网络辨识的目的是建立所考查对象 的模型,因此最简单的情况下,辨识只需利用对 象本身的输入输出数据即可。 神经网络建模本身不涉及诸如某一具体控制任务 之类的其它目的,因此与作为神经网络控制系统 的结构框图相比,辨识的原理结构图要简单得多, 只要能完成建模的任务即可;一般地,辨识结构 图只涉及对象系统本身和所用的神经网络两大主 体。

神经网络辨识的特点(与传统辨识方法相比)

神经网络本身作为一种辨识模型,其可调参数反映在 网络内部的极值上,无需建立实际系统的辨识格式。 借助网络外部的输入 / 输出数据拟合系统的输入 / 输出 关系,可对本质非线性系统进行辨识。(网络内部隐含着
系统的特性)


辨识的收敛速度不依赖于被辨识系统的维数,只与神 经网络本身所采用的学习算法有关。 神经网络具有大量的连接,连接权值构成神经网络模 型的参数,通过调节这些权值使网络输出逼近系统输 出。 神经网络作为实际系统的辨识模型,构成系统的一个 物理实现,可用于在线控制。

神经网络混合控制。
(1) 神经网络监督控制

神经网络控制器是前馈控制器,建立被控对象的 逆模型; 神经网络控制器基于传统控制器的输出,在线学 习调整网络的权值,使反馈控制输入趋近于零, 从而使神经网络控制器逐渐在控制作用中占据主 导地位,最终取消反馈控制器的作用;



一旦系统出现干扰,反馈控制器重新起作用。

输入信号的选择
时域上,要求输入信号持续加在系统对象上,以便在 辨识时间内充分激励系统的所有模态、反映系统对象 的完整动态过程。(这里的输入信号是加在系统上的信号,也
将构成神经网络的输入或输出信号)
频域上,要求输入信号的频谱覆盖系统的频谱。

等价准则的选择
等价意味着按照某种误差评价准则,使确定的神经网 络模型最好地拟合所关心的被辨识系统的静态或动态 特性。

离线学习
对一批实现给定的系统输入输出样本数据进行离线 学习,建立系统的一个逆模型,然后用此逆模型进 行在线控制。
非线性系统 + 适 合 静 态 环 境 神经网络 逆模型 离线学习(建模)
神经网络 控制器
在线控制
非线性系统


非线性系统
+
-

+ -
固定增益 控制器
+
+ 非线性系统

非线性系统
神经网络在控制系统中的作用:充当对象的模型、控制器、优化 计算环节等。 神经网络的结构形式较多,分类标准不统一;对于不同结构的神 经网络控制系统,神经网络本身在系统中的位置和功能各不相同, 学习方法也不尽相同。
几种实际的神经网络控制系统:

神经网络监督控制; 神经网络直接逆控制; 神经网络自适应控制; 神经网络内模控制; 神经网络预测控制; 神经网络自适应评判控制;
神经网络控制器的学习:
就是寻找一种有效的途径进行网络连接权阵或网 络结构的修改,从而使得网络控制器输出的控制 信号能够保证系统输出跟随系统的期望输出。

神经网络控制器的学习类别
(1) 监督式学习(有导师指导下的控制网络学习)
外界提供适当形式的导师信号,学习系统根据导 师信号与相对应的实际输出量之差调节网络参数。
神经网络 控制器1 +
对象
-
神经网络 辨识器2

神经网络 控制器
对象
评价函数



期望输出 神经网络 估计器
+
-
常规控制 器
对象

参考模 型输入 稳定的参 考模型
期望输出
+
+
-
神经网络 控制器
对象

神经网络间接模型参考自适应控制
期望输出 参考模型
+
+
神经网络 控制器
对象
-
+
神经网络 辨识器
神经网络控制
神经网络控制的优越性

神经网络可以处理那些难以用模型或规则描述的过 程或系统。 神经网络采用并行分布式信息处理,具有很强的容 错性。 神经网络是本质非线性系统,可实现任意非线性映 射。 神经网络具有很强的信息综合能力,能同时处理大 量不同类型的输入,并能很好解决输入信息之间的 互补性和冗余性问题。 神经网络的硬件实现愈趋方便。

3.8.3 多神经网络自学习控制器的设计


对象






根据前面的工作原理和学习算法,可以得到仿真 结果为
100个周期的学习效果,误差<1%

思考与习题
1. 2. 3. 4. 5.
神经元的种类有哪些?其输入输出间的函数关系如 何?
神经网络按连接的拓扑结构和信息流向分别应该如 何分类?简述每一类型的特征。
神经网络辨识器向神经网络控制器提供对象的Jacobian信息。
(4) 神经网络内模控制
+ -
+
滤波器 -
神经网络 控制器
对象 神经网络 内模(辨识) +
正向模型作为被控对象的近似模型,与实际对象并联; 控制器与对象的逆有关,可以是对象的逆; 滤波器通常为线性的,可提高系统的鲁棒性。 蓝色实线为基本原理图,加上绿色虚线后可构成内模控制的一种 具体实现。
逆向建模
一般而言,建立逆模型对神经网络控制意义重大。 直接逆建模简化结构图:
对 象
可用于离线辨识,也可 用于在线辨识。
+
神经网络 逆模型
缺点:不是目标导向的,系统输入也不可能预先定义。
实际常采用正-逆建模结构。

神经网络 逆模型 + 神经网络 正向模型 对 象 + -

离线辨识与在线辨识
在线辨识是在对象系统实际运行的过程中进行的,辨 识过程要求实时性,即必须在一个采样周期的时间间 隔内至少进行一次网络权值的调整;离线辨识则是在 取得对象系统的一批输入输出数据后再进行辨识,故 辨识过程与实际系统是分离的,无实时性要求。 ② 离线辨识在系统工作前预先完成网络的学习或训练, 但输入输出训练集很难覆盖对象所有可能的工作范围、 且难以适应系统在工作过程中的参数变化,故最好的 辨识方式是:先进行离线训练、再进行在线学习,将 离线训练得到的权值作为在线学习的初始权,以加快 在线学习的速度。(由于网络具有学习能力,故当被辨识对象的特

系统 P + -

+
-
系统 P
系统 P + -

用什么类型的神经网络建模? 对于静态系统,其输入输出间只是某种非线性映 射关系,因此可以直接利用前向神经网络进行建 模。
对于动态系统,可利用动态神经网络建模,也可 利用静态前向神经网络进行建模。一般而言,后 者更便于分析,但需要将动态系统的神经网络建 模转化为静态系统的神经网络的建模。
直接逆模型网络控制器的控制系统结构示意图
(运行于静态参数环境)

神经网络 对象

神经网络控制器
3.8.2 直接神经网络控制器的设计

解:
构造神经网络结构为5-25-12-1型;直接神经网络 控制器的系统结构图为:
非线性 系统
输出单元线性激励,其余层单元Sigmoid型激励;

仿真结果:
100个周期的 学习后,均 方误差小于 0.005
150 次 迭 代,误差 达0.0133
若使用一个神经网络,Baidu Nhomakorabea构为2-20-10-1型,仿真结果为
300 次 迭 代,误差 达23.06
神经网络控制的学习机制
神经网络控制器的特殊性: 控制器的样本信息通常无法预先知道(如:控制器的期 望输出通常是系统的最佳控制量,一般无法通过测量获得)。 解决控制器的学习问题是关键。
相关文档
最新文档