基于优化设计的迭代学习算法研究

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于优化设计的迭代学习算法研究

摘要

迭代学习控制是上世纪80年代提出的一门新兴学科,它在非线性、模型未知等控制问题方面有着独到优势。迭代学习控制针对具有重复运行性质的被控对象,利用对象以前运行的信息,通过迭代的方式修正控制信号,实现在有限时间区间上的完全跟踪任务。它在工业机器人、数控机床等具有重复运行特性的领域有着非常好的应用前景。

目前,作为一门年轻的学科,迭代学习控制的研究分支也较多,而且,在很多方面还有待进一步研究与完善。本文主要在迭代学习控制算法设计与优化方面做了一些工作,主要研究工作体现在如下几个方面:

第一,对迭代学习控制的基本概念、研究现状及应用等内容作一概述,简单介绍了基于优化设计的迭代学习控制算法。最后,对论文的安排及研究内容作了简要说明。

传统迭代学习控制律中的学习系数对迭代学习控制的收敛性和收敛速度的影响非常重要,在PID型迭代学习控制律的实际应用中,算法分析给出的收敛性条件并不能用于指导学习增益的选取,学习增益的设置需要凭借经验选取,因此具有一定的盲目性。为了克服猜测设置学习增益的盲目性,直接的方法是利用系统模型知识。由此引伸出来的一个可行方法就是利用优化指标来设计迭代学习控制律,即所谓的优化迭代学习律。

第二,研究了二次型最优迭代学习算法。在模型确定与不确定两种情况下,针对线性离散系统,分别设计了基于二次型性能指标优化的迭代学习控制算法及参数辨识与估计方法,并得到了系统稳定性、收敛性条件。仿真结果证明了所设计二次型优化迭代学习算法的有效性。

实现二次型性能指标的最优化属最优控制研究的范畴,但该领域

中最优控制器(LQG)的设计必须基于系统精确模型的建立,对于模型未知系统显然无法给出最优控制策略,对于带有不确定项的系统,也只能采用保成本控制等方法得到次优的结果。那么,利用迭代学习控制方法的优点,针对模型未知系统(连续或离散系统),基于二次型性能指标:

dt t Ru t u t Qe t e J T )]()()()([T

0T +=⎰ 或 {}∑=+=N i i Ru i u i Qe i e J 0

T T )()()()( 给出一种最优迭代学习控制(Optimal Iterative learning Control ,OILC)策略,无论从理论上或者实际应用上都是十分有价值、有意义的探讨。然而,对于这一课题的研究,目前仅有少量文献发表。

Phan 和Juang 在假定系统模型已知的情况下得到了最优迭代学习控制方法,其实这已失去了迭代学习控制方法的优越性;M. Norrlof 等人利用可获得的模型标称值替代真实模型给出了一类二次型最优迭代学习控制方法,很显然结果只能是次优的,且性能的好坏很大程度上受到建模精度的影响。引入基函数概念,运用辨识方法,Frueh 和Phan 针对线性离散系统,给出了基于二次性能指标的最优迭代学习控制方法,这一方法要求事先假定一组测试输入量作为激励函数,然后不断产生新的与原基函数正交的新基函数以及基函数的系数,最后以基函数的张集作为系统控制输入量。在这一方法中,控制输入量的求取与系统的实际控制是分开进行的,是一种先激励后控制的方式。而对于非线性系统,目前还没有任何研究结果出现。

第三,提出了一种改进的基于最优化指标的迭代学习算法。对于线性时变系统,将每一次的迭代学习控制信号的增量看成常规反馈控制的信号,都通过求解一个基于一种合理改进的性能指标的最优化问题得到,从而设计最优迭代学习算法。该算法的收敛速度较快,其输出误差序列和控制信号序列的收敛性能够得到保证。对于任意给定的系统期望轨迹,该方法保证迭代控制信号能够收敛于系统的一个线性二次型最优控制解。

Amann 针对线性系统,提出了一个基于最优化指标的迭代学习控制设计方法。该方法首先给出了每次迭代运行的最优化性能指标,然

后采用最大值原理,对给定的性能指标求解,确定迭代学习控制律。这种学习律同时采用前馈与反馈作用,能够保证系统输出误差随着迭代次数的增加按指数收敛速率收敛,且具有一定的鲁棒性。在系统的理想控制存在且理想控制信号幅度有限的情况下,Amann 的方法能够很好地工作,但在系统不存在使系统轨迹与期望轨迹完全一致的理想控制时,该方法将导致控制向一个信号幅度为无穷大的非真控制信号发散。

第四,研究了确定性系统的最优迭代学习算法以及不确定性系统的保性能迭代学习算法。首先定义了迭代域内二次型性能函数,然后基于新的性能函数,讨论以上两种迭代学习算法。特别是针对不确定性系统设计基于LMI 方法的保性能迭代学习算法时,可以很方便地利用MATLAB 工具箱进行求解。

Chang 和Peng 提出了不确定系统的保性能控制问题(Guaranteed Cost Control),其主要思想是对具有参数不确定性的系统,设计一个控制律,不仅使得闭环系统稳定,而且使得闭环系统的性能不超过某个确定的上界。但在很长一段时间里,该问题并没有得到很好的解决。

随着不确定系统鲁棒控制问题研究的深入,不确定系统的保性能控制问题再次受到了关注,并相继取得了一些研究成果。然而,目前,这方面的研究大多局限于连续系统。另有文献研究了一类不确定离散系统的保性能控制问题,导出了保性能控制律存在的条件,通过将保性能控制问题转化为一个辅助线性时不变系统的∞H 控制问题,采用

∞H 控制技术给出了保性能控制律的设计方法。但其仍然存在问题,

例如:保性能控制律存在的条件仅仅是充分的等。

一些文献基于如下性能函数

{}

∑=+++++--+=N i k k k k k k k i u i u R i u i u i Qe i e J 01T 11T 11)]()([)]()([)()(

给出了另一类最优迭代学习控制设计方法。对其设计机理的直观解释就是:给出控制量)(1i u k +的具体形式,使得第1+k 次迭代输出误差在学习区间],0[N 内的均方和达到极小,同时以)(1i u k +相对于)(i u k 增量作为罚函数。

相关文档
最新文档