第6篇 神经网络控制
神经网络控制系统的原理

神经网络控制系统的原理神经网络控制系统是一种基于人工神经网络的控制系统,在工业、交通、航空等各个领域具有广泛的应用。
它的原理是通过构建和训练神经网络模型,实现对待控对象的智能控制。
首先,神经网络控制系统需要建立一个神经网络模型,这个模型通常由节点、神经元和连接权值组成。
节点是模型中的基本单元,神经元是节点的一个实例,连接权值代表神经元之间的连接强度。
在建立模型时,需要确定网络的拓扑结构和各个节点之间的连接方式。
其次,神经网络控制系统需要进行网络的训练。
训练是为了使神经网络模型能够适应特定的控制任务。
训练过程通常包括两个阶段:前向传播和误差反向传播。
前向传播是指从输入层开始,逐层计算神经元的输出值,直到输出层。
误差反向传播是指根据网络的输出和期望输出之间的误差来调整连接权值,以提高网络的性能。
在训练过程中,需要使用一些优化算法来更新连接权值。
常用的优化算法有梯度下降法、反向传播算法和遗传算法等。
这些算法能够根据网络的误差情况,调整连接权值,使网络的输出尽量与期望输出一致。
一旦神经网络模型训练完成,就可以将其应用于实际的控制任务中。
在控制过程中,输入变量会通过网络的输入层传递给网络,经过一系列的计算和传递,最终得到输出结果。
输出结果可以是控制信号,用来调节待控对象的状态,使其达到期望的目标。
需要注意的是,神经网络控制系统的性能不仅取决于网络的结构和参数,还取决于训练数据的质量和数量。
训练数据应该尽可能地覆盖各种情况,以确保网络具有良好的泛化能力。
此外,神经网络控制系统还需要不断地进行监控和调整,以保持其稳定性和性能。
总的来说,神经网络控制系统通过构建和训练神经网络模型,实现对待控对象的智能控制。
它的原理是利用神经网络的拟合和学习能力,将输入变量转化为输出控制信号,从而实现对系统的控制。
神经网络控制系统具有较强的适应性和学习能力,能够适应各种复杂和变化的控制任务,因此在实际应用中具有广泛的潜力和前景。
控制系统中的神经网络控制方法

控制系统中的神经网络控制方法控制系统是指通过对被控对象进行监测和调节,以达到预定要求的系统。
而神经网络控制方法是指利用神经网络模型和算法对控制系统进行优化和改进的方法。
本文将介绍神经网络控制方法在控制系统中的应用以及其原理和优势。
一、神经网络控制方法的原理神经网络控制方法主要基于人工神经网络模型,它模拟了生物神经系统的结构和功能。
该模型由多个神经元组成,这些神经元相互连接并通过权重参数传递和处理信息。
其原理主要包括以下几个方面:1. 网络拓扑结构:神经网络控制方法中使用的神经网络有多种拓扑结构,如前馈神经网络、循环神经网络和自适应神经网络等。
这些网络结构可以灵活地应用于不同的控制问题。
2. 学习算法:神经网络通过学习算法来调整网络中神经元之间的连接权重,以逐步优化网络的性能。
常见的学习算法包括反向传播算法、遗传算法和模糊神经网络算法等。
3. 控制策略:神经网络控制方法可以基于不同的控制策略,如比例积分微分(PID)控制、模糊控制和自适应控制等。
通过在神经网络中引入相应的控制策略,可以实现对被控对象的精确控制和调节。
二、神经网络控制方法在控制系统中的应用1. 机器人控制:神经网络控制方法在机器人控制中有广泛应用。
通过将神经网络嵌入到机器人的控制系统中,可以实现对机器人运动、感知和决策等方面的智能控制。
这种方法能够提高机器人的自主性和适应性,使其能够更好地适应不同环境和任务的需求。
2. 工业过程控制:神经网络控制方法在工业过程控制中也得到了广泛应用。
通过利用神经网络对工业过程进行建模和优化,可以提高生产效率、降低能耗和减少故障率。
此外,神经网络控制方法还可以应用于故障诊断和预测维护等方面,提高工业系统的可靠性和稳定性。
3. 航天飞行器控制:神经网络控制方法在航天飞行器控制方面也有重要应用。
通过神经网络对航天飞行器的姿态、轨迹和轨道控制进行优化,可以提高飞行器的稳定性和导航精度,降低燃料消耗和飞行风险。
第6章(192)

第6章 神经控制系统
6.2.5 神经网络智能方法 神经网络的学习功能是一种智能行为,它与其它智能学
科有相同或相近的设计方式。将神经网络与模糊控制、人工 智能、专家系统相结合,可构成各具特色的模糊神经控制、 智能神经控制、专家神经系统等,它们形成了自己的设计方 法。一种典型的模糊神经控制系统的基本结构如图6-8所示。
第6章 神经控制系统
神经网络从根本上改变了上述设计思路,因为它不需要 被控制对象的数学模型。在控制系统中,神经网络是作为控 制器或辨识器起作用的。
控制器具有智能行为的系统,称为智能控制系统。在 智能控制系统中,有一类具有学习能力的系统,被称为学习 控制系统。学习的过程是一个训练并带有将训练结果记忆的 过程,人工神经网络控制系统就是一种学习控制系统。
第6章 神经控制系统
对于一些在控制过程中存在不确定性、存在非线性、存 在时变的被控对象,由于数学模型不明确,常规PID调节器 往往难以奏效,不能保证系统稳定性。目前能够想到的解决 办法有两个,两个办法都离不开神经网络。一个是对被控对 象使用系统辨识,PID调节器继续使用常规调节器,系统辨 识由神经网络承担;另一个是使用神经PID调节器。在系统 中引入神经网络,相应需要学习训练。
第6章 神经控制系统
由于神经控制器的设计与设计人员的素质、理解能力和 经验有关,因此设计出来的产品都可以成为设计者的成果, 这也是从事神经控制较容易出成果的原因之一。随着时间的 推移,对设计结果的评价体系终会诞生,优劣将更加清晰。
简单综合起来,神经控制器的设计方法大体有如下几种: 模型参考自适应方法、自校正方法、内模方法、常规控制方 法、神经网络智能方法和神经网络优化设计方法。
神经网络控制(RBF)

神经网络控制(RBF)神经网络控制(RBF)是一种基于径向基函数(RBF)的神经网络,用于控制系统,其主要功能是通过对输入信号进行处理来实现对系统输出的控制。
通过神经网络控制,控制器可以学习系统的动态行为和非线性模型,从而使得控制器能够自适应地进行调整和优化,实现对系统的精确控制。
RBF 网络通常由三层组成:输入层、隐藏层和输出层。
输入层接受系统的输入信号,并将其传递到隐藏层,隐藏层对输入数据进行处理并输出中间层的值,其中每个中间层神经元都使用一个基函数来转换输入数据。
最后,输出层根据隐藏层输出以及学习过程中的权重调整,计算并输出最终的控制信号。
RBF 网络的核心是数据集,该数据集由训练数据和测试数据组成。
在训练过程中,通过输入训练数据来调整网络参数和权重。
训练过程分为两个阶段,第一阶段是特征选择,该阶段通过数据挖掘技术来确定最优的基函数数量和位置,并为每个基函数分配一个合适的权重。
第二阶段是更新参数,该阶段通过反向传播算法来更新网络参数和权重,以优化网络的性能和控制精度。
RBF 网络控制的优点在于其对非线性控制问题具有优秀的适应性和泛化性能。
另外,RBF 网络还具有强大的学习和自适应调整能力,能够学习并预测系统的动态行为,同时还可以自动调整参数以提高控制性能。
此外,RBF 网络控制器的结构简单、易于实现,并且具有快速的响应速度,可以满足实时控制应用的要求。
然而,RBF 网络控制也存在一些局限性。
首先,RBF 网络需要大量的训练数据来确定最佳的基函数数量和位置。
此外,由于网络参数和权重的计算量较大,实时性较低,可能存在延迟等问题。
同时,选择合适的基函数以及与其相应的权重也是一项挑战,这需要在控制问题中进行深入的技术和经验探索。
总体而言,RBF 网络控制是一种非常有效的控制方法,可以在广泛的控制问题中使用。
其结构简单,性能稳定,具有很强的适应性和泛化性能,可以实现实时控制,为复杂工业控制问题的解决提供了一个重要的解决方案。
模糊控制与神经网络控制

模糊控制与神经网络控制模糊控制和神经网络控制是现代控制领域中的两个重要研究方向,它们通过不同的方法和理论来解决复杂系统的控制问题。
本文将就这两种控制方法进行介绍和对比,并探讨它们在实际应用中的优劣势。
一、模糊控制模糊控制是一种基于模糊逻辑理论的控制方法,它通过将输入和输出之间的关系进行模糊化来实现系统的控制。
模糊控制器的设计通常包括模糊化、规则库的建立、推理机制以及解模糊化等步骤。
在模糊控制中,输入和输出以模糊集形式表示,通过一系列的模糊规则进行推理得到控制信号。
模糊规则库中存储了专家知识,根据实际问题的需求可以设计不同的规则。
推理机制使用模糊规则进行推理,最后通过解模糊化将模糊输出转化为具体的控制量。
模糊控制的优点之一是适用于非线性和不确定性系统,它能够通过模糊化处理来处理实际系统中的不确定性和模糊性。
此外,模糊控制能够利用专家经验进行控制器的设计,无需准确的系统数学模型。
然而,模糊控制也存在一些局限性。
首先,模糊控制的规则库和参数通常需要由专家进行手动设计,这对专家的经验和知识有一定的要求。
其次,模糊控制的性能也会受到模糊规则的数量和质量的影响,如果规则库设计不当,控制性能可能无法满足要求。
二、神经网络控制神经网络控制是一种基于人工神经网络的控制方法,它通过将系统模型表示为神经网络结构来实现控制。
神经网络是一种模仿生物神经系统结构和功能的计算模型,具有自适应学习和适应性处理的能力。
在神经网络控制中,神经网络被用作控制器来学习系统的映射关系。
通过输入和输出的样本数据,神经网络根据误差信号不断调整权重和阈值,使得输出逼近于期望输出。
神经网络控制通常包括网络的结构设计、学习算法的选择和参数调整等步骤。
与模糊控制相比,神经网络控制具有更好的自适应性和学习能力。
它能够通过学习过程来建立系统的非线性映射关系,并且对于未知系统具有较好的鲁棒性。
此外,神经网络控制不需要准确的系统模型,对系统的数学模型要求相对较低。
人工智能控制技术课件:神经网络控制

例如,在听觉系统中,神经细胞和纤维是按照其最敏感的频率分
布而排列的。为此,柯赫仑(Kohonen)认为,神经网络在接受外
界输入时,将会分成不同的区域,不同的区域对不同的模式具有
不同的响应特征,即不同的神经元以最佳方式响应不同性质的信
号激励,从而形成一种拓扑意义上的有序图。这种有序图也称之
,
,
⋯
,
)
若 输 入 向 量 X= ( 1
, 权 值 向 量
2
W=(1 , 2 , ⋯ , ) ,定义网络神经元期望输出 与
实际输出 的偏差E为:
E= −
PERCEPTRON学习规则
感知器采用符号函数作为转移函数,当实际输出符合期
望时,不对权值进行调整,否则按照下式对其权值进行
单神经元网络
对生物神经元的结构和功能进行抽象和
模拟,从数学角度抽象模拟得到单神经
元模型,其中 是神经元的输入信号,
表示一个神经元同时接收多个外部刺激;
是每个输入所对应的权重,它对应
于每个输入特征,表示其重要程度;
是神经元的内部状态; 是外部输入信
号; 是一个阈值(Threshold)或称为
第三代神经网络:
2006年,辛顿(Geofrey Hinton)提出了一种深层网络模型——深度
置信网络(Deep Belief Networks,DBN),令神经网络进入了深度
学习大发展的时期。深度学习是机器学习研究中的新领域,采用无
监督训练方法达到模仿人脑的机制来处理文本、图像等数据的目的。
控制方式,通过神经元及其相互连接的权值,逼近系统
智能控制--神经网络控制PPT课件

.
71
权衡的有效途径:进行多次仿真实验。
✓ 输入信号的选择
时域上,要求输入信号持续加在系统对象上,以便在辨识 时间内充分激励系统的所有模态、反映系统对象的完整 动态过程。(这里的输入信号是加在系统上的信号,也将构成神经
网络的输入或输出信号)
频域上,要求输入信号的频谱覆盖系统的频谱。
✓ 等价准则的选择
等价意味着按照某种误差评价准则,使确定的神经网络模 型最好地拟合所关心的被辨识系统的静态或动态特性。
.
43
(2) 再励学习(强化学习)
介于上述两种情况之间,外部环境只对输出结果给 出评价,而不给出具体答案,学习系统通过强化那 些受奖励的动作来改善自身的性能。
离线学习
对一批实现给定的系统输入输出样本数据进行离线 学习,建立系统的一个逆模型,然后用此逆模型进 行在线控制。
.
44
非线性系统 +
-
神经网络
.
25
神经网络辨识的特点(与传统辨识方法相比)
✓ 神经网络本身作为一种辨识模型,其可调参数反映在网 络内部的极值上,无需建立实际系统的辨识格式。
✓ 借助网络外部的输入/输出数据拟合系统的输入/输出关 系,可对本质非线性系统进行辨识。(网络内部隐含着系统的
特性)
✓ 辨识的收敛速度不依赖于被辨识系统的维数,只与神经 网络本身所采用的学习算法有关。
神经网络控制
.
1
神经网络控制的优越性
神经网络可以处理那些难以用模型或规则描述的过程 或系统。
神经网络采用并行分布式信息处理,具有很强的容错 性。
神经网络是本质非线性系统,可实现任意非线性映射。
计算机控制技术第6章 先进控制技术

4.模糊逻辑
⑴二值逻辑:建立在取真“1”和取假“ 0”二值基础上的数 理逻辑,是计算机科学的基础理论。
⑵模糊逻辑:模糊逻辑的真值 x 在区间〔0,1〕中连续取值, x越接近1,说明真的程度越大。 模糊逻辑是二值逻辑的直接推广,因此,模糊逻辑是无限 多值逻辑,也就是连续值逻辑。模糊逻辑仍有二值逻辑的逻辑 并(析取)、逻辑交(合取)、逻辑补(否定)的运算。
6.4 预测控制技术 6.5 其它先进控制技术
经典控制理论PID控制和直接数宁控制对解决一般控制和线 性定常系统问题十分有效。但是,在许多控制系统中,一些复 杂被控对象(或过程)的特性很难用一般的物理或化学规律来描 述,也没有适当的测试手段进行测试,并为具建立数学模型。 对于这类被控对象(或过程),用传统控制理论或现代控制理论 很难取得满意的控制效果。然而,这类被控对象(或过程)在人 工操作下却往往能正常运行,并达到一定预期的效果。 人的手动控制策略是通过操作者的学习、试验及长期经验积 累而形成的,它通过人的自然语言来叙述,例如,用自定性的、 不精确的及模糊的条件语句来表达:若炉温偏高,则减少燃料: 若蓄水塔水位偏低,则加大进水流量;若燃烧废气中含氧量偏 向,则减小助燃风量等。 由于自然语言具有模糊性,所以,这种语言控制也被称为模 糊语言控制,简称模糊控制。
2. 人工神经元模型
人工神经网络是利用物理器件或仿真程序来模 拟生物神经网络的某些结构和功能。下图是最典型 的人工神经元模型。
3.人工神经网络
下图表示了两个典型的神经网络结构,图a)为 前馈型网络,图b)为反馈型网络。
6.2.2 神经网络控制
典型的神经网络控制包括神经网络监督控制(或 称神经网络学习控制)、神经网络自适应控制 (自 校正、模型参考控制,含直接与间接自适应控制)、 神经网络内模控制、神经网络预测控制等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
神经网络训练的具体步骤如下
1.获取训练样本集
获取训练样本集合是训练神经网络的第一步,也是十分 重要和关键的一步。它包括训练数据的收集、分析、选择 和预处理等
2.选择网络类型与结构
神经网络的类型很多,需要根据任务的性质和要求来选 择合适的网络类型。
3.训练与测试
最后一步是利用获取的训练样本对网络进行反复训练, 直至得到合适的映射结果。 30
27
3.BP网络学习算法的改进
1). 增加“惯性项 2). 采用动态步长 3). 与其他全局搜索算法相结合 4). 模拟退火算法 目前在神经网络的学习中,基于梯度的 算法都不能从理论上保证收敛结果是全 局最优的。
28
6.2.4 神经网络的训练
可以任意逼近一个紧集上的任意函数这 一特点是神经网络广泛应用的理论基础。 但是,在实际应用中,目前尚未找到较 好的网络构造方法,确定网络的结构和 权值参数,来描述给定的映射或逼近一 个未知的映射,只能通过学习来得到满 足要求的网络模型。
18
6.2.2 BP网络
误差反向传播神经网络,简称BP网络 (Back Propagation),是一种单向传播 的多层前向网络。在模式识别、图像处 自适应控制等领域有着较为 广泛的应用。如图是BP网络的示意图。
19
20
误差反向传播的BP算法简称BP算法,其基本 思想是最小二乘算法。它采用梯度搜索技术, 以期使网络的实际输出值与期望输出值的误差 均方值为最小。 BP算法的学习过程由正向传播和反向传播组 成。在正向传播过程中,输入信息从输入层经 隐含层逐层处理,并传向输出层,每层神经元 (节点)的状态只影响下一层神经元的状态。 如果在输出层不能得到期望的输出,则转人反 向传播,将误差信号沿原来的连接通路返回, 通过修改各层神经元的权值,使误差信号最小。
3
4
其输入、输出关系可描述为
Ii
w
j 1
n
ij
x j i
yi f ( I i )
x j ( j 1,2, , n) 是从其他神经元传来的 其中, 输入信号;wij表示从神经元j到神经元i的 连接权值; f () 称为激发函数 i为阈值; 或作用函数。
5
输出激发函数 f ()又称为变换函数,它决定 神经元(节点)的输出。该输出为1或0, 取决于其输入之和大于或小于内部阈值 i。 函数 f () 一般具有非线性特性。下图表示 了几种常见的激发函数。 1. 阈值型函数(见图(a),(b)) 2. 饱和型函数(见图(c)) 3. 双曲函数(见图(d)) 4. S型函数(见(e)) 5. 高斯函数(见图(f))
6.4.2 改进型BP神经网络控制参数自学习 PID控制
将神经网络用于控制器的设计或直接学 习计算控制器的输出(控制量),一般 都要用到系统的预测输出值或其变化量 来计算权系数的修正量。但实际上,系 统的预测输出值是不易直接测得的,通 常的做法是建立被控对象的预测数学模 型,用该模型所计算的预测输出来取代 预测处的实测值,以提高控制效果。
21
1.BP网络的前馈计算 2.BP网络权值的调整规则 1). 输出层权系数的调整 2). 隐含层节点权系数的调整 3.BP学习算法的计算步骤
22
3.BP学习算法的计算步骤 1). 初始化 置所有权值为较小的随机数 2). 提供训练集 3). 计算实际输出,计算隐含层、输出层各 神经元输出 4). 计算目标值与实际输出的偏差E 5). 计算 p w jk 6). 计算 p wij 7). 返回“2)”重复计算,直到误差满足 要求为止
8
1. 前馈型神经网络
前馈型神经网络,又称前向网络(Feed forward NN)。 如图所示,神经元分层排列,有输入层、隐层(亦称 中间层,可有若干层)和输出层,每一层的神经元只 接受前一层神经元的输入。 从学习的观点来看,前馈网络是一种强有力的学习系 统,其结构简单而易于编程;从系统的观点看,前馈 网络是一静态非线性映射,通过简单非线性处理单元 的复合映射,可获得复杂的非线性处理能力。但从计 算的观点看,缺乏丰富的动力学行为。大部分前馈网 络都是学习网络,它们的分类能力和模式识别能力一 般都强于反馈网络,典型的前馈网络有感知器网络、 BP 网络等。
26
2.多层前向BP网络的问题:
1). BP算法的学习速度很慢 2). 网络训练失败的可能性较大 3). 难以解决应用问题的实例规模和网络规模间的矛 盾 4). 网络结构的选择尚无一种统一而完整的理论指导, 一般只能由经验选定 5). 新加入的样本要影响已学习成功的网络,而且刻 画每个输入样本的特征的数目也必须相同 6). 网络的预测能力(也称泛化能力、推广能力)与 训练能力(也称逼近能力、学习能力)的矛盾
第6章 神经网络控制
1
6.1 概述
6.1.1生物神经元模型 6.1.2 人工神经元模型
6.1.3 人工神经网络模型 6.1.4 神经网络的学习方法
2
6.1.2 人工神经元模型
人工神经元是对生物神经元的一种模拟 与简化。它是神经网络的基本处理单元。 如图所示为一种简化的人工神经元结构。 它是一个多输入、单输出的非线性元件。
11
神经网络中常用的几种最基本的学习方法
1. Hebb学习规则 两个神经元同时处于激发状态时,它们 之间的连接强度将得到加强,这一论述 的数学描述被称为Hebb学习规则 Hebb学习规则是一种无教师的学习方法, 它只根据神经元连接间的激活水平改变 权值,因此这种方法又称为相关学习或 并联学习。
25
6.2.3 BP网络学习算法的改进
1.多层前向BP网络的优点:
1). 网络实质上实现了一个从输入到输出的映 射功能,而数学理论已证明它具有实现任何复 杂非线性映射的功能。这使得它特别适合于求 解内部机制复杂的问题; 2). 网络能通过学习带正确答案的实例集自动 提取“合理的”求解规则,即具有自学习能力;
14
4.竞争式学习 竞争式学习属于无教师学习方式。此种学 习方式利用不同层间的神经元发生兴奋性 联接,以及同一层内距离很近的神经元间 发生同样的兴奋性联接,而距离较远的神 经元产生抑制性联接。在这种联接机制中 引人竟争机制的学习方式称为竟争式学习。 它的本质在于神经网络中高层次的神经元 对低层次神经元的输入模式进行竞争识别。
6.4 神经网络PID控制
尽管神经网络控制技术有许多潜在的优势,但单纯使 用神经网络的控制方法的研究仍有待进一步发展。通 常将人工神经网络技术与传统的控制理论或智能技术 综合使用。神经网络在控制中的作用有以下几种: 1.在传统的控制系统中用以动态系统建模,充当对 象模型; 2.在反馈控制系统中直接充当控制器的作用; 3.在传统控制系统中起优化计算作用; 4.与其他智能控制方法如模糊逻辑、遗传算法、专 家控制等相融合。
32
33
基于BP神经网络的PID控制算法可归纳如下:
1). 事先选定BP神经网络NN的结构,即选定输入层节点数 M和隐含层节点数Q,并给出权系数的初值w(2)ij(0), w(3)li(0), 选定学习速率η和平滑因子α,k=1; 2). 采样得到r(k)和y(k),计算e(k)=z(k)=r(k)-y(k); 3). 对r(i),y(i),u(i-1),e(i)进行归一化处理,作为NN的输入; 4). 前向计算NN的各层神经元的输入和输出,NN输出层的 输出即为PID控制器的三个可调参数KP(k),KI(k),KD(k); 5). 计算PID控制器的控制输出u(k),参与控制和计算; 6). 计算修正输出层的权系数w(3)li(k); 7). 计算修正隐含层的权系数w(2)ij(k); 8). 置k=k+1,返回到“2)”。 34
12
2.Delta(δ)学习规则
δ规则实现了E中的梯度下降,因此使误 差函数达到最小值。但δ学习规则只适用 于线性可分函数,无法用于多层网络。 BP网络的学习算法称为BP算法,是在δ 规则基础上发展起来的,可在多网络上 有效地学习。
13
3.概率式学习 从统计力学、分子热力学和概率论中关于系统 稳态能量的标准出发,进行神经网络学习的方 式称概率式学习。神经网络处于某一状态的概 率主要取决于在此状态下的能量,能量越低, 概率越大。同时,此概率还取决于温度参数T。 T越大,不同状态出现概率的差异便越小,较 容易跳出能量的局部极小点而到全局的极小点; T越小时,情形正相反。概率式学习的典型代 表是Boltzmann机学习规则。它是基于模拟退 火的统计优化方法,因此又称模拟退火算法。
23
24
在使用BP算法时,应注意的几个问题是: 1). 学习开始时,各隐含层连接权系数的初值 应以设置较小的随机数较为适宜。 2). 采用S型激发函数时,由于输出层各神经元 的输出只能趋于1或0,不能达到1或0。在设置 各训练样本时,期望的输出分量dpk不能设置 为1或0,以设置为或0,1较为适宜。 3). 学习速率η的选择,在学习开始阶段,η选 较大的值可以加快学习速度。学习接近优化区 时,η值必须相当小,否则权系数将产生振荡 而不收敛。平滑因子α的选值在左右。
31
6.4.1 基于BP神经网络控制参数自学习PID 控制
BP神经网络具有逼近任意非线性函数的能力,而且结 构和学习算法简单明确。通过神经网络自身的学习, 可以找到某一最优控制律下的P,I,D参数。基于BP 神经网络的PD控制系统结构如图所示,控制器由两个 部分组成:①经典的PID控制器:直接对被控对象进 行闭环控制,并且KP,KI,KD三个参数为在线整定;② 神经网络NN:根据系统的运行状态,调节PID控制器 的参数,以期达到某种性能指标的最优化。即使输出 层神经元的输出状态对应于PID控制器的三个可调参 数KP,KI,KD,通过神经网络的自学习、调整权系数, 从而使其稳定状态对应于某种最优控制律下的PID控 制器参数。