使用强化学习的观测器基于自适应跟踪控制的一类不确定非线性时滞系统小波神经网络(IJISA-V4-N2-3)

合集下载

不确定随机非线性时滞系统的自适应神经网络跟踪控制

不确定随机非线性时滞系统的自适应神经网络跟踪控制
满 足 不 等 式
f ( £ + ()
() ≤ £ )f
f ()f ( () 面 £ 十
() )
() 5
假 设 2 存 在非 负定 的未 知连 续 函数 ( ) 对 于 i 2 3 … , 使 函数 ( ) 足 ・, 一 , , , ・满
(( + ()≤ ∑ l ( (( + () 三£ j ) ) ) 三 £ ) )
W E R ∈ n
假 设 4 对 VA ∈ n存在 最优 常数 权 向量 w , 使
l 1 w ly≤ 7… , l ( 】 . )l U ≤
由式 ( ) 8 得

… >0

青岛大学学 报 ( 程技 术版 ) 工

第 2 7卷
w ( + () s )+ I ∑ l () 7 + ≤邮 () s ) 3 ≤I , W ( I1()≤ I2 s . 2 .
z 一 一 a一 , 1 一 1, 3, , 2, … ( 4)
其中,
是待 定 的虚拟 控制 信号 a 。 。一
假 设 1 对 于 i 1 2 3 … , 存在 一个 非负 定 的未知 连续 函数 ( ) 对 于 z 1 2 … ,使 函数 h ( ) 一 , , , , ・, 一 ,, i ・
第 2 7卷 第 3期
20 1 2年 9月
青 岛 大 学 学 报 ( 程 技 术 版 )’ 工 J UR A F Q N D O UN V RST ( O N L O I G A I E I Y E&T )
Vo. o 1 27 N .3
Se p. 2 0 1 2
器 , 真验 证 了该控 制器 的有效 性 。 仿
1 问题 描 述

一种自适应观测器设计和故障检测方法

一种自适应观测器设计和故障检测方法

一种自适应观测器设计和故障检测方法
闻新
【期刊名称】《北京航空航天大学学报》
【年(卷),期】1998(000)006
【摘要】利用模糊系统和径向高斯函数网络,设计一种具有自适应能力的模糊神经网络.用高斯函数表示模糊规则前件的隶属度函数,然后,构造一种递阶自组织在线学习算法,从输入输出样本数据中,通过学习提取模糊IFTHEN规则;在此基础上,提出一种非线性时变系统的自适应状态观测器设计和故障检测方法,并对其结构及特征进行了讨论,仿真结果表明,这种自适应状态观测器能很好地观测系统的状态,并能有效地应用于系统的故障检测.
【总页数】1页(P676)
【作者】闻新
【作者单位】
【正文语种】中文
【相关文献】
1.一种自适应Morlet小波包络解调的弱故障检测方法 [J], 牛超;侯新国;杨忠林
2.一种基于自适应监测的云计算系统故障检测方法 [J], 王焘;顾泽宇;张文博;徐继伟;魏峻;钟华
3.一种面向可靠云计算的自适应故障检测方法 [J], XIA Min-na;GONG De-liang;XIAO Juan
4.一种自适应观测器设计和故障检测方法 [J], 闻新;王青
5.一种自适应的低负载故障检测方法 [J], 叶进;邓志宇;胡亮青;陈贵豪;李琳
因版权原因,仅展示原文概要,查看原文内容请购买。

北京化工大学 2014年毕设题目选题表-自动化系

北京化工大学 2014年毕设题目选题表-自动化系


李大字
教授
10



李大字
教授
11
质子交换膜燃料电池的滑模控制 设计 针对一类分布参数系统的分段内 模控制研究 非线性模型预测控制在发酵过程 中的应用 基于差分进化算法的时滞系统控 制器优化 基于工业机器人的自动化生产线 系统先进控制技术研究与设计



李大字
教授
12 13 14
② ② ②
② ② ②
逆渗透超滤过程操作优化 供水系统监控设计 供水系统顺序控制系统设计 供水质量软测量 逆渗透膜压差监控 基于情感学习的交互式决策平台 开发 基于情感进化的交互式决策平台 开发 基于实时进化方法的大系统优化 技术 化工生产过程模糊监控器设计 生产过程设备预测维护策略 基于统计监控方法的过程性能评 化工生产过程智能交互式监控组 态设计 基于自优化方法的流程分解技术 基于决策偏好的多属性决策方法 明胶制备过程操作优化技术 Honeywell企业工程设计课题 和利时企业工程设计课题 乙烯裂解炉的建模与生产优化
⑤ ⑤ ⑤
李大字 李大字 李大字
教授 教授 教授
15



李大字
教授
16
微型化荧光纸条读取仪设计
2
3
3
邱宪波
教授
17
基于光敏二极管的荧光光电检测 模块设计
2
2
3
邱宪波
教授
18
荧光检测仪的峰值提取算法研究 及软件设计
2
2
3
邱宪波
教授
19
微流控芯片核酸自动提取系统的 软件设计与实现
2
7
3
邱宪波
教授
20

几类不确定非线性系统的智能控制问题研究

几类不确定非线性系统的智能控制问题研究

几类不确定非线性系统的智能控制问题研究在实际中,大多数系统都是非线性系统,而且通常受到不确定性,时滞以及随机扰动等因素的影响。

自适应控制因其具有辨识对象和在线修改参数的能力,能够有效抑制不确定性的影响,另一方面模糊逻辑系统以及神经网络能以任意精度逼近未知连续函数,因此是处理不确定性特别有效的方法。

近年来,通过将反步递推设计方法与模糊逻辑系统理论或神经网络相结合的反步递推自适应智能控制得到了充分发展,而且取得了很多重要的研究成果,然而仍然存在着很多问题需要进一步研究。

本文将深入研究几类不确定非线性系统的智能控制问题,如具有严格反馈形式的不确定非线性系统,随机非线性系统,以及非线性互联大系统等,并且研究在系统存在时滞情况下的处理方法。

主要研究内容如下:1.针对一类具有严格反馈形式的单输入单输出不确定非线性系统,研究基于滤波器的自适应模糊跟踪控制问题。

首先设计滤波器估计不可测状态,在此基础上结合反步递推设计方法和模糊逻辑系统理论,逐步设计出虚拟控制信号和实际的控制律。

基于Lyapunov函数理论,证明了闭环系统所有信号半全局最终一致有界而且跟踪误差收敛到零的一个小邻域内。

最后通过仿真算例,验证了该方法的有效性。

2.针对一类带有未知时滞且具有严格反馈形式的单输入单输出不确定非线性系统,给出了自适应模糊输出反馈控制方法。

首先设计滤波器估计不可测状态,通过结合反步递推设计方法和动态面控制技术,避免了对虚拟控制器中自变量重复求导,从而降低了计算量,简化了所要设计的控制器。

基于Lyapunov-Krasovskii泛函,证明了闭环系统的所有信号半全局最终一致有界,而且跟踪误差收敛到零的一个小邻域内。

最后通过仿真算例验证了所提方法的有效性。

3.针对一类带有未知时滞且具有严格反馈形式的单输入单输出随机非线性系统,研究了基于观测器的自适应神经网络控制方法。

首先设计状态观测器估计不可测状态,结合反步递推设计方法和动态面控制技术,给出基于观测器的输出反馈控制方法。

时变时滞随机非线性系统的自适应神经网络跟踪控制

时变时滞随机非线性系统的自适应神经网络跟踪控制

时变时滞随机非线性系统的自适应神经网络跟踪控制余昭旭;杜红彬【摘要】This paper focuses on the adaptive neural control for a class of uncertain stochastic nonlinear strict-feedback systems with time-varying delay. Based on the Razumikhin function approach, a novel adaptive neural controller is de- veloped by using the backstepping technique. The proposed adaptive controller guarantees that all the error variables are 4-moment semi-globally uniformly ultimately bounded in a compact set while the tracking error remains in a neighborhood of the origin. The effectiveness of the proposed design is validated by simulation results.%针对一类具有时变时滞的不确定随机非线性严格反馈系统的自适应跟踪问题,利用Razumikhin引理和backstepping方法,提出一种新的自适应神经网络跟踪控制器.该控制器可保证闭环系统的所有误差变量皆四阶矩半全局一致最终有界,并且跟踪误差可以稳定在原点附近的邻域内.仿真例子表明所提出控制方案的有效性.【期刊名称】《控制理论与应用》【年(卷),期】2011(028)012【总页数】5页(P1808-1812)【关键词】自适应跟踪控制;神经网络(NNs);Razumikhin引理;随机系统;时变时滞【作者】余昭旭;杜红彬【作者单位】华东理工大学自动化系,上海200237;华东理工大学自动化系,上海200237【正文语种】中文【中图分类】TP2731 引言(Introduction)随机干扰广泛地存在于各类实际系统中,因此随机非线性系统的稳定性分析及控制器设计受到越来越多的关注[1~6].特别地,对于严格反馈型随机非线性系统,采用backstepping方法提出了许多控制策略[3~6].然而这些控制策略往往要求系统函数已知或满足匹配条件.如果不能获得系统函数的这些先验知识,那么这些方法显然不适用.由于神经网络和模糊系统对未知非线性函数具有良好的逼近性能,采用自适应神经网络控制和自适应模糊控制能较好地避免前面的限制.然而对具有未知系统函数的随机系统的神经网络控制问题和模糊控制问题的研究结果还比较少[6~10]. 时滞现象大量存在于如计算机网络、核反应器等实际系统中,并且往往会导致系统的不稳定,因此时滞系统一直是研究的热点问题[11].Lyapunov-Krasovskii方法和Lyapunov-Razumikhin方法也广泛地应用于时滞随机非线性系统的稳定性分析和控制器设计.文献[12,13]已将Lyapunov-Razumikhin方法应用到时滞不确定随机非线性系统的稳定性分析.对时滞随机非线性系统的镇定与跟踪问题,大多采用Lyapunov-Krasovskii方法[9,14~16]. 相比Lyapunov-Razumikhin方法,Lyapunov-Krasovskii函数则不易构造,且Lyapunov-Krasovskii函数的复杂性使得稳定性分析与控制器设计也更为复杂.此外Lyapunov-Krasovskii对时滞常常不仅要求有界,而且须满足(t)<ς<1(ς为常数),而Lyapunov-Razumikhin方法仅要求时滞有界.因此针对时变时滞随机非线性系统的跟踪控制问题,采用Lyapunov-Razumikhin方法提出一种新的自适应神经网络控制器设计方法具有重要意义.本文利用Razumikhin引理和backstepping方法,针对一类具有时变时滞的不确定随机非线性严格反馈系统,提出一种新的自适应神经网络跟踪控制策略.所提出的控制器可保证跟踪误差四阶矩半全局一致最终有界.同时由于神经网络参数化[10]的应用,使得自适应控制器中所估计的参数大量减少.2 问题描述及准备(Problem formulation and preliminary results)2.1 预备知识(Preliminary results)考虑以下随机非线性系统:其中:x∈Rn为状态,ω为定义完备概率空间(Ω,F,P)上的r维的标准布朗运动,其中:Ω为采样空间,F为σ域以及P为概率测度;f和h为合适维数的向量值函数或矩阵值函数.针对C2函数V(t,x)定义如下算子L:其中tr(A)为A的迹.Razumikhin引理:考虑时滞随机泛函微分方程(retarded stochastic functional differential equation,RSFDE):dx=f(t,xτ)dt+h(t,xτ)dω,令p > 1,如果存在函数V(t,x)∈ C1,2([−τ,∞]× Rn)和常数ci>0(i=1,2),q>1,满足以下不等式:对所有的t≥0,满足那么RSFDE的具有初值ξ的解x(t,ξ)概率意义下一致最终有界,并且满足其中:|ξ(s)|p,γ=µ1∧.由文献[17]中定理4.1.4取κ =0,ψ(t)=e−t,µ = µ1和ζ(t)= µ2可容易得到以上Razumikhin引理,证明略.本文中考虑p=4.引理1 对于ε>0和任意实数η∈R,存在不等式[18]其中k为常数且满足k=e−(k+1),即k=0.2785.引理2 考虑不等式其中λ为正常数,如果初始条件(0)≥0成立,则对所有t≥0有(t)≥0.本文中,高斯径向基函数(RBF)神经网络用来逼近任意的连续函数g(·):Rn→R,也即=TΦ(Z),其中输入向量Z∈ΩNN⊂Rn,权向量=(w1,···,wl)T ∈ Rl以及核向量Φ(Z)=(s1(Z),s2(Z),···,sl(Z))T;激励函数si(Z)采用高斯函数,即其中:µi=(µi1,···,µin)T为接受域的中心,νi为高斯函数的宽度.通过选择足够多的节点,神经网络在紧集ΩNN⊂Rn上可以逼近任意的连续函数,即“理想”的权向量W∗是为了分析而设想的量,定义为W∗:=arg|g(Z)−Z)|}.假设1 ∀Z∈ΩNN,存在“理想”的常数权向量W∗,使得‖W∗‖∞ ≤ wmax和|δ|≤ δmax,其中上界wmax,δmax > 0.由式(7)容易得到其中:β(Z)==max{δmax,wmax}.2.2 问题描述(Problem formulation)考虑由以下方程描述的时滞随机非线性系统:其中:xi∈R(i=1,···,n)为系统的状态,定义i=[x1···xi]T,x=n;u∈R为控制输入;y∈R为系统的输出;Borel可测函数τ(t):R+→ [0,τ]表示未知的时变时滞;ω与系统(1)定义相同;f(·),g(·),q(·):Rn→ R和h(·):Rn→ Rr皆为未知的非线性光滑函数.本文的主要目的是设计一种自适应状态反馈控制率u(x,θ),=Φ(x,),使得对于某紧集内的初始条件x(0),(0),闭环系统的所有误差变量皆四阶矩半全局一致最终有界,且跟踪误差可以稳定在原点附近的邻域内.假设2 未知非线性函数g(x)的符号已知,且存在正常数bm和bM,满足0<bm≤|g(x)|≤bM<∞,∀x∈Rn.不失一般性,可进一步假设0<bm≤g(x)≤bM<∞.假设3 存在未知k∞类函数Q(·)满足以下不等式:|q(x(t− τ(t)))|≤ Q(‖x(t− τ(t))‖).假设 4 未知非线性函数h(x,x(t−τ(t)))满足以下不等式:‖h(x,x(t− τ(t)))‖2 ≤H1(‖x‖)+H2(‖x(t− τ(t))‖),其中:H1(·)为未知非负光滑函数,H2(·)为未知k∞类函数.(t)皆为连续且有界的.进一步,假定存在常数d,假设 5 参考信号yd(t)及其微分(t),···,使得‖[yd···]T‖ ≤ d.3 控制器设计及稳定性分析(Controller design and stability analysis)这一节,针对系统(9),利用backstepping方法及Razumikhin引理设计一种新的自适应神经网络跟踪控制器.首先,需引入以下误差变量:其中:为待定的虚拟控制函数,.对于1≤i≤n−1,选取Lyapunov函数选取虚拟控制函数为其中:Lαi−1=,ki为待定设计常数.则容易得到以下关系式:其中:p1=k1−3/4>0,pi=ki−1>0(2≤i≤n−1).将式(11)可改写为如下形式:系数di,j为常数.另外,α0(yd)=yd.基于以上的介绍,容易得到下面引理3.引理3 存在正常数ρ,υ,使得其中:Z=[z1···zn:=−θ/bm,表示未知常数θ/bm的估计.下面继续控制器的设计.当i=n时,由Itˆo公式可得其中Lαn−1:=.定义Lyapunov函数由式(2)可得由假设3可得由于Q(·)为k∞类函数,利用引理3及Razumikhin引理可得由引理1,||Fn,其中Fn=Q(2ρq‖Z(t)‖)+Q(2υ),可通过以下不等式进行处理: 由假设4,可得以下不等式:其中:Gn=H2(2ρq‖Z‖)+H2(2υ),ϑ1和ϑ2为任意的正常数.定义一个新的函数在紧集ΩZ中可通过RBF神经网络逼近:其中:Zn=[x[n]]∈ ΩZ,W∗TS(Zn)表示的“理想”神经网络近似,而δ(Zn)表示逼近误差.利用神经网络参数化式(8),可得其中: β(·)==max{δmax,wmax}.构造实际控制器及参数调整算法如下:其中kn,σ与λ为待定的正设计参数.利用不等式θ≥,在控制器(20)(21)的作用下,由式(14)~(19)可得其中pn:=knbm−>0.式(22)可改写为其中: µ :=min{4p1,4p2,···,4pn−1,4pn,λ},ν :=θ2+k(θσ + ε)+由式(23)及Razumikhin引理可知,闭环系统的解四阶矩半全局一致最终有界,且对于足够小的ς>0,存在时间T:=,其中:E|Z(s)|4,γ=µ∧,c1 ≤min{},使得∀t≥T,有E|(y(t)−yd)4|≤ (1+ς)基于以上分析,主要结论可由以下定理描述:定理1 对于满足假设(2)~假设(5)的时变时滞不确定随机非线性系统(9),在控制器(20)和参数自适应率(21)作用下,闭环系统的所有误差信号四阶矩半全局一致最终有界,且跟踪误差稳定在以下集合Ω所定义的区域内:注 1 定义如下紧集:初始值集合Ω0、有界紧集ΩZ、稳态紧集Ωs和神经网络逼近的有效集合ΩNN.在控制器设计过程中为了∀t≥0神经网络逼近皆有效,需保证ΩZ⊆ΩNN.为了阐述方便,由式(23)及Razumikhin引理,可将有界紧集ΩZ和稳态紧集Ωs定义如下:这些集合之间的关系如图1所示.在控制器设计的初始阶段首先定义ΩNN,并且ΩNN与控制器的参数和初始集合Ω0均无关.由式(24)(25)可知:i)初始集合Ω0通过‖ξ‖0影响ΩZ,但与Ωs和ΩNN无关;ii)可通过调整参数ki,λ,σ,ε,ϑ1和ϑ2,使得ΩZ和Ωs足够小.图1 各紧集之间的关系Fig.1 The relationship among compact sets由集合ΩZ和Ωs的界可知,对于给定足够大的ΩNN,存在合适的‖ξ‖0,γ和ν使得ΩZ ⊆ ΩNN和Ωs ⊆ ΩNN. 而由γ和ν的定义可知,γ和ν的值依赖于控制参数ki,λ,σ,ε,ϑ1和ϑ2的选择.因此对于给定足够大的ΩNN和‖ξ‖0=ξmax>0,存在合适的控制参数使得ΩZ⊆ΩNN.定义xi(0),zi(0)和(0)的初始值集合Ω0使得‖ξ‖0<ξmax.这时对于属于Ω0的所有xi(0),zi(0)和(0),∀t>0均有ΩZ⊆ΩNN.4 仿真研究(Simulation example)考虑以下时变时滞不确定随机非线性系统:其中:τ(t)=1+sint,初始条件为x1(0)=0.2和x2(0)=0.1,参考输入信号yd=0.5(sint+sin 0.5t).仿真过程中,采用RBF神经网络来逼近未知函数,W∗TS(Z2)包含729个节点,中心分布在[−5,5]×[− 5,5]×[− 5,5]×[− 5,5]×[− 5,5]×[0,5],宽度为1;其他仿真参数给出如下:k1=4.74,k2=15,λ=5,σ=1.采用定理1中的控制器(20)和参数自适应率(21),其中z1=x1−yd,z2=x2− α1,β = β(Z2).仿真结果由图2~4给出,图2表明所提出的自适应跟踪控制器具有良好的跟踪性能,输出响应y能比较快地跟踪参考输入yd;控制输入如图3所示;图4描述了自适应参数曲线.图2 输出响应y(t)和参考输入yd(t)Fig 2 Output responsey(t)and reference inputyd(t)图3 控制输入u(t)Fig 3 Control inputu(t)图4 自适应参数Fig 4 Adaptive parameter5 结论(Conclusion)本文针对一类具有未知时变时滞的不确定随机非线性严格反馈系统,利用Razumikhin引理和backstepping方法,提出了一种新的神经网络自适应控制器,可以保证跟踪误差四阶矩半全局一致最终有界.所给出的控制器结构简单,易于实现.将该方法推广到更一般的严格反馈型随机非线性系统是下一步工作的方向.参考文献(References):【相关文献】[1]FLORCHINGER P.Lyapunov-like techniques for stochastic stability[J].SIAM Journal on Control and Optimization,1995,33(4):1151–1169.[2]FLORCHINGER P.Feedback stabilization of affine in the control stochastic differential systems by the control Lyapunov function method[J].SIAM Journal on Control and Optimization,1997,35(2):500–511.[3]PAN Z G,BASAR T.Adaptive controller design for tracking and disturbance attenuation in parameter-feedback nonlinear systems[J].IEEE Transactions on AutomaticControl,1998,43(8):1066–1083.[4]DENG H,KRISTIC M.Stochastic nonlinear stabilization:part 1:a backsteppingdesign[J].Systems&Control Letters,1997,32(3):143–150.[5]DENG H,KRISTIC M.Stochastic nonlinear stabilization:part 2:inverseoptimality[J].Systems&Control Letters,1997,32(3):151–159.[6]WANG Y C,ZHANG H G,WANG Y Z.Fuzzy adaptive control of stochastic nonlinearsystems with unknown virtual control gainfunction[J].Acta AutomaticaSinica,2006,32(2):170–178.[7]PSILLAKIS H E,ALEXANDRIDIS.NN-based adaptive tracking control of uncertain nonlinear systems disturbed by unknown covariance noise[J].IEEE Transactions on Neural Networks,2007,18(6):1830–1835.[8]YU J J, ZHANG K J, FEI S M. Direct fuzzy tracking control of a class of nonaffine stochastic nonlinear systems with unknown dead-zone input[C] //Proceedings of the 17th World Congress, the International Federation of Automatic Control. Elseviet: International Federation of Accountants, 2008, 12236 – 12241.[9]谢立,何星,熊刚,等,随机非线性时滞大系统的输出反馈分散镇定[J].控制理论与应用,2003,20(6):825–830.(XIE Li,HE Xing,XIONG Gang,et al.Decentralized output feedback stabilization for large scale stochastic nonlinear system with time delays[J].Control Theory&Applications,2003,20(6):825–830.)[10]GE S S,HUANG C C,LEE T,et al.Stable Adaptive Neural Network Control[M].USA:Kluwer Academic,2002.[11]RICHARD J P.Time-delay systems:an overview of some recent advances and open problems[J].Automatica,2003,39(10):1667–1694.[12]MAO X R.Razumikhin-type theorems on exponential stability of stochastic functional differential equataions[J].Stochastic Process and Their Application,1996,65(2):233–250. [13]JANKOVIC S,RANDJELOVIC J,JOVANOVIC M.Razumikhintype exponential stability criteria of neutral stochastic functional differential equations[J].Journal of Mathematical Analysis and Applications,2009,355(2):811–820.[14]CHEN W S,JIAO L C,liJ,et al.Adaptive NN backstepping output-feedback control for stochastic nonlinear strict-feedback systems with time-varying delays[J].IEEE Transations on System,Man and Cybernetics,Part B:Cybernetics,2010,40(3):939–950.[15]LIU S J,GE S S,ZHANG J F.Robust output-feedback stabilization for a class of uncertain stochastic nonlinear systems with timevarying delays[C]//Proceedings of 2007 IEEE International Conference on Control and Automation.Piscataway,NJ:IEEE,2007:2766–2771.[16]余昭旭,杜红彬.基于NN的不确定随机非线性时滞系统自适应有界镇定[J].控制理论与应用,2010,27(7):855–860.(YU Zhaoxu,DU Hongbin.Neural-network-based bounded adaptive stabilization for uncertain stochastic nonlinear systems with timedelay[J].Control Theory&Applications,2010,27(7):855–860.)[17]胡适耕,黄乘明,吴付科.随机微分方程[M].科学出版社,2008:153–156.(HU Shigeng,HUANG Chengming,WU Fuke.Stochastic Differential Equations[M].Beijing:Science Press,2008:153–156.)[18]PLOLYCARPOU M M.Stable adaptive neural control scheme for nonlinearsystems[J].IEEE Transactions on Automatic Control,1996,41(3):447–451.。

时变大时滞系统的控制方法综述

时变大时滞系统的控制方法综述

时变大时滞系统的控制方法综述1 引言在化工、炼油、冶金、玻璃等一些复杂的工业过程当中,广泛地存在着大时滞现象。

由于时滞的存在,使得被控量不能及时地反映系统所承受的扰动,从而产生明显的超调,使得控制系统的稳定性变差,调节时间延长,对系统的设计和控制增加了很大的困难。

而时变时滞的特性则使得问题更加复杂,因而对此类问题的研究具有重要的理论和实际意义。

自从1957年Smith首次提出针对时滞系统的预估控制方法以来,许多学者在这一领域进行了广泛而深入的研究,相继提出了许多行之有效的控制方法。

根据对专统数学模型的依赖程度的不同,这些方法大致可以分为自适应控制和智能控制两大类。

本文即对此进行了总结介绍,分析了各种控制方法的优点及其所存在的局限性,并且探讨了该领域今后的发展方向。

2 Smith预估器Smith预估器是得到广泛应用的时滞系统的控制方法。

该方法的基本思路是:预先估计出系统在基本扰动下的动态特性,然后由预估器对时滞进行补偿,力图使被延迟了的被调量超前反映到调节器,使调节器提前动作,从而抵消掉时滞特性所造成的影响:减小超调量,提高系统的稳定性$加速调节过程,提高系统的快速性。

Smith预估器的原理如图1所示。

图1 Smith预估器控制框图从理论上分析,Smith预估器可以完全消除时滞的影响,从而成为一种对线性、时不变和单输入单输出时滞系统的理想控制方案。

但是在实际应用中却不尽人意,主要原因在于:Smith预估器需要确知被控对象的精确数学模型,而且它只能用于定常系统。

这一条件事实上相当苛刻,因而影响了Smith预估器在实际应用中的控制性能。

在Smith预估器的基础上,许多学者提出了扩展型的或者改进型的方案,这些方案包括:多变量Smith预估控制,非线性系统的Smith预估器,改进的Smith预估器。

这些方法由于并没有减小对系统数学模型的依赖程度,因而同样也具有很大的局限性。

3 自适应控制方法对大多实际控制过程而言,被控对象的参数在整个被控过程中不可能保持定常,对于这一类系统,如果采用常规的控制方法,不仅控制性能会变差,而且还会造成系统发散,然而利用自适应技术却可以获得比较满意的控制效果。

时滞系统几种控制策略研究

时滞系统几种控制策略研究

时滞系统几种控制策略研究时滞系统几种控制策略研究时滞系统是一类在实际控制中常见的系统,其特点是系统状态变量在对应的输出值上受到时间延迟的影响。

时滞系统在工程领域广泛应用,例如飞行器、机器人等。

然而,由于时滞的存在,时滞系统往往容易出现不稳定、震荡和性能下降的问题,因此如何有效地控制时滞系统,降低时滞对系统性能的影响成为了一个重要的研究方向。

针对时滞系统的控制策略研究,主要包括经典控制方法、自适应控制方法和智能控制方法等。

经典控制方法中,最常用的是PID控制器。

PID控制器是一种基于比例、积分、微分控制的经典控制策略,它能够对系统的误差进行调节。

然而,对于时滞系统,传统PID控制器存在不足之处,因为时滞会导致控制信号滞后,从而影响系统的稳定性。

因此,需要对PID控制器进行改进,使其能够对时滞系统进行有效的控制。

自适应控制方法通过根据系统的特性实时调整控制器的参数,从而适应系统的变化。

其中,模型参考自适应控制(Model Reference Adaptive Control, MRAC)是一种常用的方法。

MRAC通过在线估计系统的模型,并根据估计的模型来调整控制器的参数,从而实现对时滞系统的控制。

此外,自适应滑模控制(Adaptive Sliding Mode Control, ASMC)也是一种常用的控制方法。

ASMC通过引入滑模面,并根据系统误差的变化调整滑模面的位置,以降低时滞对系统的影响。

智能控制方法中,模糊控制和神经网络控制是常见的策略。

模糊控制是一种基于模糊逻辑推理的控制方法,通过将人类的经验和知识转化为模糊规则,来对系统进行控制。

神经网络控制是一种通过训练神经网络来实现对系统的控制的方法,神经网络可以学习系统的非线性映射关系,并通过适当的训练来调整权值,从而实现对时滞系统的控制。

在实际应用中,不同的控制策略可以结合使用,以实现更好的控制效果。

例如,可以将PID控制器和模糊控制器结合,利用PID控制器对系统进行粗略调节,再利用模糊控制器进行微调,从而达到更好的控制效果。

基于观测器的受扰非线性系统近似最优跟踪控制

基于观测器的受扰非线性系统近似最优跟踪控制

基于观测器的受扰非线性系统近似最优跟踪控制
唐功友;高德欣;张宝琳
【期刊名称】《控制理论与应用》
【年(卷),期】2007(24)5
【摘要】研究一类受扰非线性系统的最优输出跟踪控制问题.给出了有限时域最优输出跟踪控制律的近似设计算法.首先将求解受扰非线性系统最优跟踪控制问题转换为求解状态向量与伴随向量耦合的非线性两点边值问题,然后利用逐次逼近方法构造序列将其转化为求解两个解耦的线性微分方程序列问题.通过迭代求解伴随向量的序列,可得到由解析的线性前馈-反馈控制部分和伴随向量的极限形式的非线性补偿部分组成的最优输出跟踪控制律.利用参考输入降维观测器和扰动降维观测器,解决了前馈控制的物理可实现问题.最后仿真结果表明了该方法的有效性.
【总页数】7页(P725-731)
【作者】唐功友;高德欣;张宝琳
【作者单位】中国海洋大学,信息科学与工程学院,山东,青岛,266100;青岛科技大学自动化与电子工程学院,山东,青岛,266042;中国计量学院,数学与信息科学系,浙江,杭州,310018
【正文语种】中文
【中图分类】TP273
【相关文献】
1.受扰非线性时滞系统近似最优跟踪控制 [J], 唐功友;胡乃平;赵艳东
2.线性时滞系统基于观测器的最优输出跟踪控制器近似设计 [J], 唐功友;李超;高洪伟
3.基于观测器的受正弦扰动MIMO系统最优跟踪控制 [J], 高德欣;杨佩佩;张文武
4.受正弦扰动时滞非线性系统的近似最优减振控制 [J], 高德欣;唐功友
5.受扰奇异摄动时滞组合大系统的近似最优控制 [J], 张宝琳;唐功友
因版权原因,仅展示原文概要,查看原文内容请购买。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Abstract— This paper is concerned with the observer designing problem for a class of uncertain delayed nonlinear systems using reinforcement learning. Reinforcement learning is used via two Wavelet Neural networks (WNN), critic WNN and action WNN, which are combined to form an adaptive WNN controller. The “strategic” utility function is approximated by the critic WNN and is minimized by the action WNN. Adaptation laws are developed for the online tuning of wavelets parameters. By Lyapunov approach, the uniformly ultimate boundedness of the closed-loop tracking error is verified. Finally, a simulation example is shown to verify the effectiveness and performance of the proposed method.
Copyright © 2012 MECS
I.J. Intelligent Systems and Applications, 2012, 2, 28-34
Байду номын сангаас
Wavelet Neural Network Observer Based
29
Adaptive Tracking Control for a Class of Uncertain Nonlinear Delayed Systems Using Reinforcement Learning
has been devoted to design the observer or observerbased control of time delay systems [4-6].
Reinforcement learning (RL) is a class of algorithms for solving multi-step, sequential decision problems by finding a policy for choosing sequences of actions that optimize the sum of some performance criterion over time[7-9]. In RL problems, an agent interacts with an unknown environment. At each time step, the agent observes the state, takes an action, and receives a reward. The goal of the agent is to learn a policy (i.e., a mapping from states to actions) that maximizes the long-term return. Actor-Critic algorithm is an implementation of RL which has separate structures for perception (critic) and action (actor) [10-12]. Given a specific state, the actor decides what action to take and the critic evaluates the outcome of the action in terms of future reward (goal).
Wavelet Neural Network Observer Based Adaptive Tracking Control for a Class of Uncertain Nonlinear Delayed Systems Using
Reinforcement Learning
Manish Sharma Dept. of Electronics and Instrumentation Engineering, Medicaps Institute of Technology and Management, Indore, India
Index Terms—Wavelet neural networks, adaptive control, optimal control, reinforcement learning, LyapunovKrasovskii functional.
I. INTRODUCTION
In many practical systems, the system model always contains some uncertain elements; these uncertainties may be due to additive unknown internal or external noise, environmental influence, nonlinearities such as hysteresis or friction, poor plant knowledge, reducedorder models, and uncertain or slowly varying parameters. Hence, the state observer for the uncertain system will be useful and apply to reconstruct the states of a dynamic system. The means to design adaptive observers through estimation of states and parameters in linear and nonlinear systems has been actively studied in recent years [1-3].Adaptive observers of nonlinear systems have attracted much attention due to their wide uses in theory and practice.
Recently, wavelet neural networks (WNNs), which absorbs the advantages such as the multi-resolution of wavelets and the learning of NN, were proposed to guarantee the good convergence and were used to identify and control nonlinear systems [13-15].Wavelet networks are feed-forward neural networks using wavelets as activation function. The WNN is suitable for the approximation of unknown nonlinear functions with local nonlinearities and fast variations because of its intrinsic properties of finite support and self-similarity.
The phenomenon of time-delay exists in various engineering systems such as chemical process, long transmission lines in pneumatic systems, etc. Time-delay usually leads to unsatisfactory performances and is frequently a source of instability. Recently, much effort
Incorporating the advantages of WNN, adaptive actorcritic WNN-based control has emerged as a promising approach for the nonlinear systems. A reinforcement signal is used to evaluate the performance of a computational agent interacting with its environment. The aim is to discover a policy for selecting actions that minimize a specified performance index. Reinforcement learning methods are considered potentially useful to feedback control systems since these methods do not require comprehensive information about the system or its behaviour. During supervised learning with a neural network as the computational agent, the weights are adjusted in proportion to the output error of the neurons.
相关文档
最新文档