第1章随机迭代学习控制

合集下载

论述物料称量系统的迭代学习控制算法的研究

论述物料称量系统的迭代学习控制算法的研究

论述物料称量系统的迭代学习控制算法的研究1 迭代学习控制的概述早在上世纪初,就有人提出了迭代学习控制的概念,这个概念是出现在一篇有关控制机器人的文章上面。

当时文章以日文发表,但未能引起人们的重视。

到了20世纪80年代Arimoto和他的合作者们将Uchiyama的初步研究思想进一步完善,建立了实用算法,在理论上证明了迭代学习控制算法的可行性,正是由于这篇论文的发表,这个概念才开始被人们知晓,渐渐人们开始关注迭代学习控制这方面的问题。

由于这个控制算法的目标在于将跟踪任务能在有限的区域内完成,利用的就是运动重复的性质,通过控制信号的原理对被控制系统完整精密控制。

迭代学习控制算法就是首先尝试对被操控系统发送信号,测量与期许目标值有多少偏差,通过修正这些之前没设计到的偏差修正信号,这样才能提升跟踪的可靠性与准确性。

这种控制算法的特征就是测量精度高,对于目前难以建立模型的情况和一些高精度轨迹、非线性耦合的跟踪都有着很好地跟踪效果,目前已经被多领域使用。

2 迭代学习控制算法的数学模型从整个迭代学习控制算法过程来看,被控制的计量系统中的向量函数在一次又一次相同的运动情况下函数关系是确定并相同的,我们应当根据以往控制经验,准确测量期许目标值和输出信号的参数值,这样方便过后对比调整,从中找到最合适的一条输入特性曲线,这样才能尽量符合期望值。

可以说寻找输入特性曲线的整个过程就是被控制系统不断调整尝试的过程。

在数学上可以这样表示,有限时间用t∈(0,T)表示,对于被控制系统的期望值用r(t)表示,利用有限时间和最初的期望值解出uk(t)和t∈(0,T),通过响应修改,调整t∈(0,T),设迭代学习次数为k。

我们可以将这些连续控制的模型这样表示:模型公式中第一个公式x(t)指的是系统的状态向量,属于n维;第二个公式y(t)是系统的输出向量,属于m维,f和g为x(t)和y(t)相互对应的向量函数,控制系统中的变量是u(t)。

迭代学习控制

迭代学习控制

迭代学习控制 1、前言迭代学习控制(Iterative Learning Control ,简称ILC )是指不断重复一个同样的轨迹的控制尝试,并以此修正控制律,以得到非常好的控制效果的控制方法[1]。

迭代学习控制是学习控制的一个重要分支,是一种新型学习控制策略。

它通过反复应用先前试验得到的信息来获得能够产生期望输出轨迹的控制输入,以改善控制质量。

与传统的控制方法不同的是,迭代学习控制能以非常简单的方式处理不确定度相当高的动态系统,且仅需较少的先验知识和计算量,同时适应性强,易于实现;更主要的是,它不依赖于动态系统的精确数学模型,是一种以迭代产生优化输入信号,使系统输出尽可能逼近理想值的算法。

它的研究对那些有着非线性、复杂性、难以建模以及高精度轨迹控制问题有着非常重要的意义。

最初的学习控制-迭代学习控制(ILC ),由日本学者首倡于1978年。

不像其他的的控制方法从线性受控对象起步,迭代学习控制开门见山就把非线性系统作为研究对象,且要在有限区间[0,T]上实现输出完全追踪的控制任务。

这里完全追踪(perfect tracking )指系统的输出自始至终,无论是暂态还是稳态,都和目标轨道保持一致。

显然,迭代学习控制的起点要比其它控制方法高出一截可是,从二十年的发展历程看,起点过高也有不利的一面:发展空间不足以及难以和主流控制方法相融合。

而事实上,只要任务是可重复的,或系统干扰是周期性的,都可用ILC 来解决实际问题。

从迭代学习控制方法的产生至今已有二十多年的历史它已经发展成为智能控制领域的一个新的发展方向,它的研究对那些有着非线性、强耦合、难以建模以及高精度轨迹控制的问题有非常重要的意义。

迭代学习控制适用于具有重复运动性质的被控系统,它的目标是实现有线区间上的完全跟踪任务。

它通过对被控系统进行控制尝试,以输出信号与给定目标的偏差修正不理想的控制信号,使得系统的跟踪性能得以提高。

迭代学习控制的研究对具有较强的非线性耦合、较高的位置重复精度、难以建模和高精度轨迹跟踪控制要求的动力学系统有着非常重要的意义。

13章迭代学习控制解析PPT课件

13章迭代学习控制解析PPT课件

.
3
迭代学习控制(ILC,Iterative Learning Control)的思
想最初由日本学者Uchiyama于1978年提出[23],于1984年
由Arimoto等人[24]做出了开创性的研究。这些学者借鉴人们
在重复过程中追求满意指标达到期望行为的简单原理,成功
地使得具有强耦合非线性多变量的工业机器人快速高精度地
实际控制中存在一类轨迹跟踪问题,它的控制任务 是寻找控制律 u t ,使得被控对象输出 y t 在有限时间 0 , T 上沿着整个期望轨迹实现零误差轨迹跟踪。这列跟踪问 题是具有挑战性的控制问题。
人们在处理实际场合中的重复操作任务时,往往依 据对象的可重复动态行为与期望行为的差距来调整决策。 通过重复操作,使得对象行为与期望行为的配合达到要 求。这时,衡量动态行为的指标是某种满意指标。
执行轨迹跟踪任务。其基本做法是对于一个在有限时间区间
上执行轨迹跟踪任务的机器人,利用前一次或前几次操作时
测得的误差信息修正控制输入,使得该重复任务在下一次操
作过程中做得更好。如此不断重复,直至在整个时间区间上
输出轨迹跟踪上期望轨迹。
.
4
迭代学习控制适合于具有重复运动性质的被控对象, 通过迭代修正达到某种控制目标的改善。迭代学习控制方 法不依赖于系统的精确数学模型,能在给定的时间范围内, 以非常简单的算法实现不确定性高的非线性强耦合动态系 统的控制,并高精度跟踪给定期望轨迹,因而一经推出, 就在运动控制领域得到了广泛的运用。
k 下给出的。而在实际应用场合,学习次数 k 显然是没有 任何实际意义的。因此,如何使迭代学习过程更快地收敛于期望 值是迭代学习控制研究中的另一个重要问题。
迭代学习控制本质上是一种前馈控制技术,大部分学习律尽 管证明了学习收敛的充分条件,但收敛速度还是很慢。可利用多 次学习过程中得到的知识来改进后续学习过程的速度,例如,采 用高阶迭代控制算法、带遗忘因子的学习律、利用当前项或反馈 配置等方法来构造学习律,可使收敛速度大大加快。

15自适应迭代学习控制理论及其

15自适应迭代学习控制理论及其

二、问题的背景及科学意义



自适应控制理论的公开问题:无法处理本质时变 问题,控制系统的动态品质无法保证。 迭代学习控制理论的限制:只能精确跟踪固定目 标。 过程工业稳态优化控制中的关键问题 :如何确 保稳态优化中一次次动态进程具有良好性能? 提出自适应迭代学习控制理论, 为解决上述问题 提供了一个可行的方法。
二、问题的背景及科学意义



自适应控制理论的公开问题:无法处理本质时变 问题,控制系统的动态品质无法保证。 迭代学习控制理论的限制:只能精确跟踪固定目 标。 过程工业稳态优化控制中的关键问题 :如何确 保稳态优化中一次次动态进程具有良好性能? 提出自适应迭代学习控制理论, 为解决上述问题 提供了一个可行的方法。
自适应迭代学习控制理论及其应用
李俊民
自适应迭代学习控制理论及其应用
信息世界中的控制科学 问题的背景及科学意义 研究方法及缺陷 亟待解决的关键问题 应用前景

信息世界中的控制科学
控制指在工程系统中反馈和算法的运用 控制就是把反馈作为处理系统不确定性的 工具。 控制问题和目标: 调节问题和跟踪问题
k
k
单关节机械臂的OILC的仿真图
1.5 1.5
状态 x1 和目标
0.5 0 -0.5 0 15
状态 x2 和目标
50 k 100
1
1 0.5 0 -0.5 0 20
50 k
100
控制 u
5 0 -5 0
控制误差
50 k 100
10
15 10 5 0
0
5
10 15 迭代次数
20
迭代学习控制理论及其限制

控制系统的典型结构图

一类广义系统的迭代学习控制

一类广义系统的迭代学习控制

第33卷第6期自动化学报Vol.33,No.6 2007年6月ACTA AUTOMATICA SINICA June,2007一类广义系统的迭代学习控制朴凤贤1,2张庆灵1王哲峰2摘要在对广义系统进行标准分解的基础上,研究了含脉冲快子系统的迭代学习控制问题.通过Frobenius范数给出了快子系统在P型学习律作用下收敛的充分性条件,同时通过梯度法给出求解增益矩阵的方法.其次,讨论了单输入单输出不确定广义系统的迭代学习控制问题,通过优化方法给出该系统在P型学习律作用下,系统实际输出尽可能快地收敛到理想输出的增益矩阵的选择方法.关键词广义系统,脉冲,不确定性,迭代学习控制,收敛中图分类号TP13Iterative Learning Control for a Class ofSingular SystemsPIAO Feng-Xian1,2ZHANG Qing-Ling1WANG Zhe-Feng2 Abstract In this paper,the problem of iterative learning con-trol for fast subsystem with impulse is investigated based on the Weierstrass canonical form,the sufficient condition that guar-antees the convergence of P-type learning law is derived by the Frobenius norm,and the approach to choose the gain matrix is given by gradientflow approach.Then,the uncertain single input single output singular system is discussed,the method to choose the gain matrix such that the actual output converge to desired trajectory as quickly as possible is given by optimization. Key words Singular system,impulse,uncertainty,iterative learning control,convergence.1引言迭代学习控制方法[1]自提出以来吸引了国内外许多学者的注意力,同时也取得了很多研究成果[2∼5],但广义系统[6]的迭代学习控制文献并不多见.文献[7]研究了时滞广义系统的状态跟踪问题.工业机器人中很多在重复作业时,都或多或少的受到环境的限制,如弧焊机器人,打毛刺机器人等都要受到终端轨迹限制.从广泛意义来说,工业机器人大多数都是由广义系统模型来刻画的,所以有必要研究广义系统的迭代学习控制问题.本文在对广义系统进行标准分解的基础上,研究含脉冲快子系统的迭代学习控制问题.通过Frobenius范数给出了快子系统的迭代学习控制在P型学习律收敛的充分性条件,同时给出求解增益矩阵的方法.其次,讨论了单输入单输出广义系统前馈项中含有区间不确定性的迭代学习控制问题,通过优化方法给出该系统在P型学习律作用下,系统实际输出尽可能快地收敛到理想输出的学习增益的选择方法.收稿日期2005-11-27收修改稿日期2006-4-21Received November27,2005;in revised form April21,2006国家自然科学基金(60574011),辽宁省科技基金(200140104)和辽宁省普通高校学科带头人基金(124210)资助Supported by National Natural Science Foundation of P.R.China (60574011),Science Foundation of Liaoning Province(200140104) and Academic Leaders Foundationn of College and University of Liaoning Province(200140104)1.东北大学系统科学研究所沈阳1100042.沈阳航空工业学院理学系沈阳1100341.Institute of Systems Science,Northeastern University,Shenyang 1100042.Department of Science,Shenyang Institute of Aeronau-tical Engineering,Shenyang110034DOI:10.1360/aas-007-06582问题描述在Weierstrass标准分解基础上[8]考虑含脉冲的快子系统N˙x(t)=x(t)+Bu u(t)y(t)=Cx x(t)+Du u(t)(1)其中t∈[0,T],x(t)∈R n,u(t)∈R m,y(t)∈R q,分别是系统的状态向量、控制输入向量及输出向量,N∈R n×n 是幂零阵(N h−1=0,N h=0),B∈R n×m,C∈R q×n, D∈R q×m均为实矩阵.有时简记为(N,I,B,C,D),它的状态响应为x(t)=−h−1Xi=1δ(i−1)(t)N i x0−h−1Xi=0N i Bu u(i)(t)(2)其中δ(t)为狄拉克脉冲函数.系统(1)满足下列假设.假设1.系统是脉冲能控的.假设2.系统是输出无脉冲的[9].假设3.对给定的理想轨迹yd(t),存在一控制输入u d(t)满足N˙x d(t)=x d(t)+Bu u d(t)yd(t)=Cx x d(t)+Du u d(t)t∈[0,T]假设4.系统的初始定位操作满足x k(0)=x d(0)= 0,k=0,1,2,···动态系统在有限时间区间t∈[0,T]内是可重复的,在迭代学习过程中,重写系统(1)N˙x k(t)=x k(t)+Bu u k(t)yk(t)=Cx x k(t)+Du u k(t),t∈[0,T](3)学习控制的目的是找到适当的学习律,使得迭代学习序列u k(t)一致收敛于理想的控制输入u d(t),∀t∈[0,T],yk(t)一致收敛于理想的输出yd(t),即limk→∞δu u k(t)F=0⇒limk→∞e k(t)F=0(4)其中,δu u k(t)=u d(t)−u k(t),e k(t)=yd(t)−yk(t),δu u k(t)F∆`Tr`δu u k(t)δu u T k(t)´´12.为了估计迭代学习的次数,我们给出收敛速度定义.定义设ρ<1为迭代学习过程的收敛条件,则该学习律收敛速度定义为v=ρ−k−1,其中k为迭代次数.注 1.由迭代速度定义可以得到迭代次数为k≥‰−ln vlnρ−1ı,其中 · 表示向右取整.3收敛分析首先讨论快子系统(1)在P型学习律下收敛问题.考虑P型学习律u k+1(t)=u k(t)+Γe k(t)(5)其中Γ∈R m×q为学习增益矩阵,e k(t)=yd(t)−yk(t)为迭代学习误差,由此得到如下定理:定理1.如果ρ= I−ΓD+ΓCBF<1,满足假设1∼4的系统(1)在P型学习律(5)作用下是收敛的,即yk(t)→yd(t),(k→∞).6期朴凤贤等:一类广义系统的迭代学习控制659证明略.下面给出如何确定增益矩阵Γ,由于I −ΓD +ΓCB F <1⇔ I −ΓD +ΓCB 2F <1(6)根据Frobenius 范数定义,γ= I −ΓD +ΓCB 2F =Tr h (I −ΓD +ΓCB )(I −ΓD +ΓCB )Ti=Tr “I −2Γ(D −CB )+Γ(D −CB )(D −CB )T ΓT”上式两端同时对τij 求偏导得∂γ∂τij =Tr “2∂Γ∂τij (D −CB )+2∂Γ∂τij(D −CB )×(D −CB )T ΓT”其中∂Γij=ζi ηTj (i =1,2,···,m ;j =1,2,···,q ),Γ=(τij )m ×q ,ζi ∈R m (i =1,2,···,m )和ηj ∈R r (j =1,2,···,q )为标准正交基,通过梯度法[10]求解出Γ.注2.此方法给出了如何确定增益矩阵的方法,但也存在着局限性,这种方法不能求时变的增益矩阵,对时变增益矩阵的求法还需探讨.其次,考虑具有如下形式的广义系统N ˙x(t )=x (t )+bu u (t )y (t )=cxx (t )+d u u (t )(7)其中b ∈R n ×1,c ∈R 1×n ,d u ∈[µ1,µ2],µ1,µ2为实数,其它符号定义如前.对此系统采用P 型学习律u k +1(t )=u k (t )+pee k (t )(8)p 为学习增益,在假设1∼4情况下得到收敛条件ρ=|1−pd u +pcb |<1(9)由于前馈项中含有区间不确定性,鲁棒设计通常考虑系统最坏的情况下是收敛的,这样会影响迭代学习控制过程的收敛速度.为了提高学习的收敛速度,所以有必要对它优化设计.从收敛速度定义可知,系统的收敛速度取决于ρ的大小,也就是说,ρ越小,收敛速度越快,反之ρ越大收敛速度越慢,所以,应该设计满足收敛条件的p 使得ρ越小越好.这个问题就归结为如下的min–max 问题:ρ∆min p ∈R max d ∈d u|1−pd +pcb |s.t.0≤|1−pd +pcb |<1(10)由于|1−pd +pcb |是d 的凸函数,它的最大值在边界上达到,即d =µ1及d =µ2.所以可知,它的最小值在顶点达到,即|1−pµ1+pcb |=|1−pµ2+pcb |(11)上式的解为p 1=0,p 2=2µ1+µ2−2cb,可以得出,p 1=0时,ρ=1不满足收敛条件,故舍去,所以p 2为最优解,ρ=|µ2−µ1||µ2+µ1−2cb |.由此得到下面结论.定理2.满足假设1∼4的系统(7)在学习律(8)作用下是收敛的,如果ρ=|1−pd +pcb |<1,而且当p =212,ρ=|µ2−µ1|21时收敛速度最快.4结束语本文主要讨论了广义系统的迭代学习控制问题,给出含脉冲广义系统在P 型学习律下收敛的充分性条件.同时探讨了单输入单输出不确定广义系统的迭代学习控制问题,并给出了如何确定增益矩阵的方法.References1Arimoto S,Kawamura S,Miyazak F.Bettering operation of robots by learning.Journal of Robot Systems ,1984,1(2):123∼1402Xu J X,Tan Y.Robust optimal design and convergence properties analysis of iterative learning control approaches.Automatica ,2002,38(11):1867∼18803Xu Jian-Xin,Hou Zhong-Sheng.On learning control:the state of the art and perspective.Acta Automatica Sinica ,2005,31(6):943∼955(许建新,侯忠生.学习控制的现状与展望.自动化学报,2005,31(6):943∼955)4Sun Ming-Xuan,Huang Bao-Jian.Iterative Learning Con-trol.Beijing:National Defense Industrial Press,1999(孙明轩,黄宝健.迭代学习控制.北京:国防工业出版社,1999)5Lin Hui,Wang Lin.Iterative Learning Control Theory .Xi’an:Northwest University of Technology Press,1998(林辉,王林.迭代学习控制理论.西安:西北工业大学,1998)6Rosenbrock H H.Structural properties of linear dynami-cal systems.International Journal of Control ,1974,20(2):191∼2027Xie S L,Xie Z D,Liu Y Q.Learning control algorithm for state tracking of singular systems with delay.Journal of Sys-tems Engineering and Electronics ,1999,21(5):10∼168Dai L Y.Singular System Control.Lecture Notes in Control and Information Sciences .New York:Springer,19899Zhang Q L,Yang D M.Analysis and Synthesis for Uncer-tain Descriptor Systems .Shenyang:Northeastern University Press,2003(张庆灵,杨冬梅.不确定广义系统的分析和综合.沈阳:东北大学出版社.2003)10Yan W Y,Teo K L,Moore J B.A gradient flow approachto computing LQ optimal feedback gains.Optimal Control Application and Methods ,1994,15(1):67∼75朴凤贤2003年获东北大学应用数学理学硕士学位,现为东北大学控制理论与控制工程专业博士研究生,主要研究方向为广义系统的鲁棒控制和迭代学习控制.本文通信作者.E-mail:fxpiao ln@ (PIAO Feng-Xian Received her M.S.degree from North-eastern University in 2003.She is currently a Ph.D.candidate in control theory and control engineering of Northeastern Uni-versity.Her research interest covers robust control,and iterative learning control of descriptor systems.Corresponding author of this paper.)张庆灵东北大学教授.主要研究方向为广义系统,鲁棒控制和迭代学习控制.E-mail:qlzhang@ (ZHANG Qing-Ling Professor in College of Science at Northeastern University.His research interest covers robust con-trol theory and descriptor systems,iterative learning control.)王哲峰2006年获东北大学博士学位,现为沈阳航空工业学院副教授,主要研究方向为材料成形和自动控制.(W ANG Zhe-Feng Received his Ph.D.degree from North-eastern University in 2006.He is currently an associate professor at Shenyang Institute of Aeronautical Engineering.His research interest covers material forming and automatic control.)。

迭代学习控制

迭代学习控制
第12章 迭代学习控制
实际控制中存在一类轨迹跟踪问题,它的控制任务是寻找控制律 ut ,使得被控对象输出 yt在有限时间 0,T上沿着整个期望轨迹实现零
误差轨迹跟踪。这列跟踪问题是具有挑战性的控制问题。 人们在处理实际场合中的重复操作任务时,往往依据对象的可重复
动态行为与期望行为的差距来调整决策。通过重复操作,使得对象行 为与期望行为的配合达到要求。这时,衡量动态行为的指标是某种满 意指标。
由于迭代学习控制模拟了人脑学习和自我调节的功能,因而是一 种典型的智能控制方法[25]。经历了三十多年的发展,迭代学习控制 已成为智能控制中具有严格数学描述的一个分支。目前,迭代学习控制 在学习算法、收敛性、鲁棒性、学习速度及工程应用研究上取得了很 大的进展。
12.1 基本原理
设被控对象的动态过程为
➢ 电子商务消费者在网上进行交易时,同样享有获得公平交易条件的权利。
➢ 电子商务经营主体销售商品或者提供服务,应当保证商品或者服务的完整性,不 得将商品或者服务不合理拆分,不得另行收取不合理费用。
9.2电子商务消费者权利概述
➢9.2.2电子商务消费者权利Fra bibliotek➢ 4.求偿权
➢ 求偿权是指消费者因购买、使用商品或者接受服务受到人身、财产损害的,享有 依法获得赔偿的权利。
9.2电子商务消费者权利概述
➢9.2.2电子商务消费者权利
➢ 6.获取知识权
➢ 获取知识权是指消费者享有获得有关消费和消费者权益保护方面的知识的权利 ➢ 法律规定消费者享有获知权,一方面,通过各种措施促进电子商务及其他知识的
传播和普及,使消费者掌握所需商品或者服务的知识和使用技能,正确使用商品, 提高自我保护意识; ➢ 另一方面,督促经营者及时、客观、全面地披露有关商品、服务的信息。

迭代学习控制系统仿真及其PID参数整定

迭代学习控制系统仿真及其PID参数整定

摘要本文首先分析了迭代学习控制的特点及其应用场合:迭代学习控制(Iterative Learning Control简称ILC)是智能控制理论的一个重要分支,其结构简单,跟踪效果好,不需要模型,或对模型的先验知识要求不高。

对诸如:具有非线性、强耦合、难建模且对控制精度要求高的机器人、注塑等周期性运动或间歇重复生产过程的对象,迭代学习控制的研究具有重要的意义。

其次,基于Matlab软件,进行了迭代学习控制系统仿真实验。

以注塑机生产过程为背景,进行了注射速度迭代学习控制实际应用仿真;最后,对离散系统的迭代学习控制系统进行了PID参数的优化、对迭代学习控制系统的学习律PID参数整定问题进行了研究,探讨了两种整定方法:利用广义逆阵拟合PID参数、利用神经网络拟合PID参数。

关键词:迭代学习控制;注塑机;注射速度;PID参数整定ABSTRACTThis paper first analyzes the characteristics of iterative learning control and its applications:iterative learning control(ILC) is an important branch of the intelligent control.Its main strategies are simple structure,perfect trajectory tracking,less prior knowledge of model.The research of ILC is significant for plants which are nonlinear, strong coupling, difficult to model,and the remand of high speed and high accuracy for motion control.such as robotic manipulators and so on.Secondly based on the Matlab software, do some simulation work about ILC and injection ram velocity of injection modeling machine; Finally study the tuning of iterative learning controller PID parameters using linear discrete-time systems and PID parameter tuning law of ILC, we use two methods: the generalized inverse matrix and neural network to fitting PID parameters.Keywords: iterative learning control;injection ram velocity;injection modeling machine;PID parameters tuning目录第一章前言 (1)1.1课题研究的背景 (1)1.2注塑机注射速度问题的研究 (1)1.3PID参数整定 (1)1.4课题研究的意义 (1)1.5本文研究的主要内容 (1)第二章迭代学习控制研究 (3)2.1迭代学习控制综述 (3)2.2.迭代学习控制研究现状 (5)2.3迭代学习控制仿真研究 (6)2.3.1 开环迭代学习控制 (6)2.3.2 闭环迭代学习控制 (8)2.4小结 (14)第三章注塑机注射速度仿真研究 (15)3.1注塑机控制 (15)3.1.1 注射阶段 (16)3.1.2 保压阶段 (17)3.1.3 预塑阶段 (17)3.2注射速度数学模型 (18)3.2.1 伺服阀 (18)3.2.2 阀控缸 (19)3.2.3 注射速度模型 (20)3.3注射速度迭代学习控制 (21)第四章迭代学习控制与PID参数整定 (23)4.1PID型离散系统迭代学习控制器参数的优化设计 (23)4.2基于迭代学习控制的PID参数整定 (29)4.2.1 利用广义逆阵拟合PID参数 (29)4.2.2 利用神经网络拟合PID参数 (32)第五章结论 (35)致谢 (36)参考文献 (37)第一章前言1.1 课题研究的背景1984年,Arimoto等人提出了迭代学习控制的概念,迭代学习控制 (I LC,iterative learning control是智能控制中具有严格数学描述的一个分支[1]。

迭代学习控制

迭代学习控制

基本原理
输入变量(控 制量)
输出变量 期望轨迹
误差
通过对被控系统进行控制尝试,以输出信号与给定目标的偏差修正不理想的控制信号, 使得系统的跟踪性能得以提高。新的控制量存入存储器,刷新旧控制量;在施加控制时,需从 存储器中取出控制量。可以看到迭代学习控制算法可利用的信息要多余常规的反馈控制算法。
目标
迭代学习神经网络对非线性系统的控制可 使未知的非线性特性能被线性参数化渐近 仿真模型描述出来。对照早期的全球网络 或本地网络,例如 RBF 神经网络在规定空 间内分布的神经元,给出了一个独立的神 经网络在时间轴上的轨迹。因而,通过迭 代学习控制,轨迹上的每一点的跟踪性能 通过多次跟踪相同轨迹能得到改善。且在 设计中,每一个本地神经系统网络的学习 是独立的。这种结构,使部分学习变成可 能。在很多情况中部分学习是非常有用的。
谢谢大家
应用效果
选取系统参数 m 10kg , l 2.5m, J m
4 1 ml 2 , s ml 。取系统输出为 y (t) x2 (2 sint) ,设理想输 3 5
PD 型 迭 代 学 习 控 制 律
出 为 yd (t) t t 2 , 取 x1 (0) 0, x 2 (0) 0, u1 (t) 1 , 选 取 开 闭 环
强化优势
针对粉碎机生产过程,分析了磨机生产工况变化造成的负荷特 性的非线性,提出将模糊控制与迭代学习控制相结合用于这一 生产过程的控制方法,它克服了常规PID控制中难以适应负荷 特性的非线性,不能及时克服系统扰动等缺陷。实验表明,系 统的稳态精度和动态性能都得到了改善。
在注塑机控 制中的应用
最优迭代学习控制应用于注塑机这样存在干扰和具有不确定初 始设定值的场合,可以使系统达到较好的鲁棒性,并且保证系 统的收敛性,从而使系统取得较好的效果。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
迭代学习控制的概念可以追溯到 Uchiyama 于 1978 年发表的文献 [1], 但该文 为日文文献, 未获得广泛传播. 而在 1984 年的文献 [2]∼[4] 开启了对迭代学习控制 的研究. 自此以后, 大量关于迭代学习控制的文献涌现出来, 尤其是在 20 世纪末 21 世纪初研究活跃. 相关的专著有文献 [5]∼[12], 综述文章包括文献 [13]∼[15] 等. 部 分期刊也组织了一些期刊专号, 如文献 [16]∼[18]. 时至今日, 迭代学习控制已经成 为一个重要的控制分支, 并在多种实际应用中取得了良好的控制效果[9]. 迭代学习 控制在实际中的应用包括机器人[19-22]、硬盘驱动[23, 24]、工业/化工过程[25, 26] 等.
第 1 章 随机迭代学习控制
本章综述了随机迭代学习控制方面的相关研究进展. 迭代学习控制适用于可以 不断重复完成指定任务的系统. 在过去三十年中, 迭代学习控制在理论和实际两方 面都取得了许多重要的进展. 而在迭代学习控制中, 与随机信号有关的研究成果还 比较少. 这里的随机信号包括系统噪声、量测噪声、随机数据丢包等各种在实际系 统中普遍存在的信号. 本章从关键技巧的角度综述了相关进展, 包括三个方面: 线 性随机系统、非线性随机系统和其他随机信号. 进而介绍了几个有潜力的研究方向, 包括点对点迭代学习控制、变轨迹迭代学习控制以及分散式/分布式迭代学习控制.
1.1 迭代学习控制
在生活中, 有这样一种认识, 一件事情重复去做, 通常会做得越来越好. 例如定 点投篮, 当一个人进行定点投篮时, 一开始他可能投不中, 但随着不断练习, 他很有 可能很快就会命中. 这里一个很重要的原因就是, 投篮者可以不断地从已有经验中 学习. 具体地说, 投篮者可以根据之前投篮的偏差来调整下一次投篮的角度和力度, 从而使得篮球逐渐接近篮筐乃至命中. 迭代学习控制便是基于这样一种朴素的想 法发展起来的控制分支. 粗略地说, 迭代学习控制是通过对之前过程信息的学习来 改善系统的表现性能的.
在图 1.1 中, 对跟踪目标 yd, 在第 k + 1 次运行过程中, 根据第 k 次过程的输入 uk 及跟踪情况 ek = yd − yk 构造新的输入 uk+1. 这个输入 uk+1 即应用到第 k + 1 次运行过程的输入, 同时 uk+1 也存储到记忆器中用于下一次运行过程输入的构造, 系统在输入 uk+1 作用下输出信号为 yk+1, 其与跟踪目标 yd 的差值也被用于构造 下一次过程的输入. 至此, 系统沿迭代过程形成闭环反馈.
迭代学习控制的主要优势在于其控制律的设计仅要求系统的跟踪目标及输入/ 输出数据. 换言之, 关于系统自身的信息要求很少, 甚至可以完全未知. 迭代学习 控制算法形式简单且行之有效.
注意到迭代学习控制是一种沿着运行过程调整而非沿运行时间调整的控制方 法, 这恰是迭代学习控制不同于非学习型控制的本质所在. 例如, 反馈控制是一种 典型的非学习型控制, 迭代学习控制与反馈控制的不同之处在于, 反馈控制没有利 用之前运行过程的情况, 仅根据当前运行过程的输入/输出数据进行调整, 在每个 运行过程可能产生相同的跟踪误差, 而迭代学习控制则充分学习之前运行过程的跟 踪情况, 在其控制中包含了对已有信息的学习与利用. 此外, 迭代学习控制与具有 一定学习能力的自适应控制也有区别, 自适应控制通常是针对相对固定的控制器来 不断调整其控制器参数, 而迭代学习控制则是构造新的输入信号.
·2·
随机迭代学习控制
图 1.1 迭代学习控制示意图
将迭代学习控制与现实生活类比来看, 系统当前及以前的输入/输出信息相当 于现实生活中的经验. 在现实生活中, 我们就是根据这些经验制定出下一次执行相 同任务时的策略, 而这种新的策略就相当于在迭代学习控制中应用到下一运行过程 中的输入信号. 在现实中, 以往的经验会改善我们做事的表现, 那么在系统控制之 前的运行情况一定程度上也会帮助改善我们对系统的控制性能.
由于迭代学习控制要求系统能够不断重复运行, 所以系统需要不断重置. 在基 本模型及众多研究中, 需要下述初始值重置条件
x(0, k) = x0, ∀k
(1.2)
系统的跟踪目标为事先给定的目标轨迹 y(t, d), t ∈ [0, N ]. 注意到初始值x0. 迭代学习控制的设计目标即通过不断更新系统的输 入 u(t, k), 使得相应输出 y(t, k) 尽可能地接近于 y(t, d). 为此, ∀t ∈ [0, N ], 记跟踪
1.1.1 迭代学习控制基础
本节给出迭代学习控制的基本模型设定, 并给出一些传统的收敛结果. 考虑如
第 1 章 随机迭代学习控制
·3·
下离散时间线性时不变系统
x(t + 1, k) = Ax(t, k) + Bu(t, k) y(t, k) = Cx(t, k)
(1.1)
其中, x ∈ Rn, u ∈ Rp 和 y ∈ Rq 分别表示系统的状态、输入和输出; 矩阵 A、B 和 C 是具有适当维数的系统矩阵; t 代表一个运行批次内的任意时刻, t = 0, 1, · · · , N , 这里 N 表示系统运行的时间长度; 而 k 表示不同的运行过程, 取值为 k = 0, 1, · · · . 为方便, 对离散时间系统的 t 取值 0 ∼ N , 用记号 t ∈ [0, N ] 表示.
因为要不断重复学习, 迭代学习控制适用于运行过程能够不断重复的系统, 通 常用于跟踪某一给定目标且跟踪目标往往保持不变. 对这样的系统, 迭代学习控制 能够根据之前的输入和输出数据, 结合跟踪目标来构造应用到下一次运行过程的输 入信号, 从而达到逐步改善系统跟踪性能的目标. 由此可知, 迭代学习控制具有如 下几个特点: ① 系统能够在有限的时间长度运行完毕并不断重复; ② 系统能够重 复回到同一初始值; ③ 系统重复跟踪同一目标轨迹等. 迭代学习控制的基本思想 如图 1.1 所示.
相关文档
最新文档