智能控制第十一章 迭代学习控制 PPT课件
合集下载
智能控制学习控制迭代学习控制PPT课件

0t T
μ a βm /a 2βm , v a a βm /a 2βm,
ud(t)
xd(t)
第27页/共50页
3. 迭代学习控制策略
• 为防止反馈增益系数d 过大,引入一个前馈控制器,并由迭代学习获得。
28/51
第28页/共50页
迭代学习控制的稳定性
• 定理6-3:记控制输入uj(t)为第j次迭代中反馈控制和前馈控制两项的线性组合,即
6.1 迭代学习控制
迭代学习控制的基本思想 线性时变系统的迭代学习控制 一类非线性动态系统的迭代学习控制 多关节机械手的迭代学习控制
迭代学习控制面临的挑战
1/51
第1页/共50页
基本思想
• 迭代学习(Iterative learning)的基本思想在于总结人类学习的方法,即通过多次的训练,从经验中学会某种 技能。
(t))
32/51
第32页/共50页
实际迭代算法
• 问题:
一般不能获取。
ud (t)
• 利用已知的
去代替未知的
:
ubj (t)
udj
(t
)
u
j f
(t
)
u
j 1 f
(t
)
u
j f
(t
)
ubj
(t
)
33/51
第33页/共50页
学习结构图
34/51
第34页/共50页
实际迭代算法的收敛性
• 定理6-4:假设 和
模又需要高精度轨迹控制的场合是非常有意义的。
3/51
第3页/共50页
6.1 迭代学习控制
迭代学习控制的基本思想 线性时变系统的迭代学习控制 一类非线性动态系统的迭代学习控制 多关节机械手的迭代学习控制
μ a βm /a 2βm , v a a βm /a 2βm,
ud(t)
xd(t)
第27页/共50页
3. 迭代学习控制策略
• 为防止反馈增益系数d 过大,引入一个前馈控制器,并由迭代学习获得。
28/51
第28页/共50页
迭代学习控制的稳定性
• 定理6-3:记控制输入uj(t)为第j次迭代中反馈控制和前馈控制两项的线性组合,即
6.1 迭代学习控制
迭代学习控制的基本思想 线性时变系统的迭代学习控制 一类非线性动态系统的迭代学习控制 多关节机械手的迭代学习控制
迭代学习控制面临的挑战
1/51
第1页/共50页
基本思想
• 迭代学习(Iterative learning)的基本思想在于总结人类学习的方法,即通过多次的训练,从经验中学会某种 技能。
(t))
32/51
第32页/共50页
实际迭代算法
• 问题:
一般不能获取。
ud (t)
• 利用已知的
去代替未知的
:
ubj (t)
udj
(t
)
u
j f
(t
)
u
j 1 f
(t
)
u
j f
(t
)
ubj
(t
)
33/51
第33页/共50页
学习结构图
34/51
第34页/共50页
实际迭代算法的收敛性
• 定理6-4:假设 和
模又需要高精度轨迹控制的场合是非常有意义的。
3/51
第3页/共50页
6.1 迭代学习控制
迭代学习控制的基本思想 线性时变系统的迭代学习控制 一类非线性动态系统的迭代学习控制 多关节机械手的迭代学习控制
智能控制理论及应用PPT课件

第15页/共20页
1.4 智能控制的主要形式
基于规则的仿人智能控制 仿人智能控制的核心思想是在控制过程中,利用计算机模拟人的控制行为功 能,最大限度地识别和利用控制系统动态过程提供的特征信息,进行启发和 直觉推理,从而实现对缺乏精确模型的对象迸行有效的控制。其基本原理是 模仿人的启发式直觉推理逻辑,即通过特征辩识判断系统当前所处的特怔状 态,确定控制的策略,进行多模态控制。
模糊控制
神经网络控制
B
A
C
专家控制
智能控制 D
仿人智能控制 F E
各种方法的综合集成
第11页/共20页
分级递阶 智能控制
1.4 智能控制的主要形式
基于信息论的分级递阶智能控制
三级分级递阶智能控制系统是由G.N.Saridis于1977年提出的。该
系统由组织级、协调级和执行级组成,遵循“精度递增伴随智能递减”
第18页/共20页
1.5 智能控制的现状和发展趋 势
• 发展趋势
智能控制理论的进一步研究,尤其是智能控制系统稳定性分析的 理论研究。
结合神经生理学、心理学、认识科学、人工智能等学科的知识, 深入研究人类解决问题时的经验、策略,建立更多的智能控制体 系结构。
研究适合现有计算机资源条件的智能控制方法。
•控制对象由单输入单输出系统转变为多输人多输出系统; •系统信息的获得由借助传感器转变为借助状态模型; •研究方法由积分变换转向矩阵理论、几何方法,由频率方 法转向状态空间的研究; •由机理建模向统计建模转变,开始采用参数估计和系统辨 识理论 •适用大型、复杂、高维、非线性和不确定性严重的对象
•不依赖对象模型,适用于未知或不确定性严重的对象 •具有人类智能的特征 •能够表达定性的知识或具有自学习能力
1.4 智能控制的主要形式
基于规则的仿人智能控制 仿人智能控制的核心思想是在控制过程中,利用计算机模拟人的控制行为功 能,最大限度地识别和利用控制系统动态过程提供的特征信息,进行启发和 直觉推理,从而实现对缺乏精确模型的对象迸行有效的控制。其基本原理是 模仿人的启发式直觉推理逻辑,即通过特征辩识判断系统当前所处的特怔状 态,确定控制的策略,进行多模态控制。
模糊控制
神经网络控制
B
A
C
专家控制
智能控制 D
仿人智能控制 F E
各种方法的综合集成
第11页/共20页
分级递阶 智能控制
1.4 智能控制的主要形式
基于信息论的分级递阶智能控制
三级分级递阶智能控制系统是由G.N.Saridis于1977年提出的。该
系统由组织级、协调级和执行级组成,遵循“精度递增伴随智能递减”
第18页/共20页
1.5 智能控制的现状和发展趋 势
• 发展趋势
智能控制理论的进一步研究,尤其是智能控制系统稳定性分析的 理论研究。
结合神经生理学、心理学、认识科学、人工智能等学科的知识, 深入研究人类解决问题时的经验、策略,建立更多的智能控制体 系结构。
研究适合现有计算机资源条件的智能控制方法。
•控制对象由单输入单输出系统转变为多输人多输出系统; •系统信息的获得由借助传感器转变为借助状态模型; •研究方法由积分变换转向矩阵理论、几何方法,由频率方 法转向状态空间的研究; •由机理建模向统计建模转变,开始采用参数估计和系统辨 识理论 •适用大型、复杂、高维、非线性和不确定性严重的对象
•不依赖对象模型,适用于未知或不确定性严重的对象 •具有人类智能的特征 •能够表达定性的知识或具有自学习能力
智能控制第十一章 迭代学习控制 PPT课件

迭代学习控制本质上是一种前馈控制技术,大部分学习律尽管证 明了学习收敛的充分条件,但收敛速度还是很慢。可利用多次学习过 程中得到的知识来改进后续学习过程的速度,例如,采用高阶迭代控 制算法、带遗忘因子的学习律、利用当前项或反馈配置等方法来构造 学习律,可使收敛速度大大加快。
11.3.4 鲁棒性问题 迭代学习控制理论的提出有浓厚的工程背景,因此仅仅在无干扰
条件下讨论收敛性问题是不够的,还应讨论存在各种干扰的情形下系 统的跟踪性能。一个实际运行的迭代学习控制系统除了存在初始偏移 外,还或多或少存在状态扰动、测量噪声、输入扰动等各种干扰。鲁 棒性问题讨论存在各种干扰时迭代学习控制系统的跟踪性能。具体地 说,一个迭代学习控制系统是鲁棒的,是指系统在各种有界干扰的影 响下,其迭代轨迹能收敛到期望轨迹的邻域内,而当这些干扰消除时 ,迭代轨迹会收敛到期望轨迹。
干扰项为d 0.3sin t
0.1 1 et
T
机器人系统参数为 d1 d2 1 kg ,l1 l2 0.,5m,lc1 lc2 0.25m ,I1 I2 0.1 kg m2
g 9.81 m/s2
采用三种闭环迭代学习控制律,其中M 1 为D型迭代学习控制,M 2
为PD型迭代学习控制,M 3为变增益指数D型迭代学习控制。
t
0
G t,
t
0
CtΦt, B L
ek d
uk1(t) L(uk (t), ek1(t))
式中,L为线性或非线性算子。
(11.5)
11.2 基本迭代学习控制算法
Arimoto 等首先给出了线性时变连续系统的D型迭代学习控制律[24]
uk1(t) uk (t) Γe&k (t)
(11.6)
11.3.4 鲁棒性问题 迭代学习控制理论的提出有浓厚的工程背景,因此仅仅在无干扰
条件下讨论收敛性问题是不够的,还应讨论存在各种干扰的情形下系 统的跟踪性能。一个实际运行的迭代学习控制系统除了存在初始偏移 外,还或多或少存在状态扰动、测量噪声、输入扰动等各种干扰。鲁 棒性问题讨论存在各种干扰时迭代学习控制系统的跟踪性能。具体地 说,一个迭代学习控制系统是鲁棒的,是指系统在各种有界干扰的影 响下,其迭代轨迹能收敛到期望轨迹的邻域内,而当这些干扰消除时 ,迭代轨迹会收敛到期望轨迹。
干扰项为d 0.3sin t
0.1 1 et
T
机器人系统参数为 d1 d2 1 kg ,l1 l2 0.,5m,lc1 lc2 0.25m ,I1 I2 0.1 kg m2
g 9.81 m/s2
采用三种闭环迭代学习控制律,其中M 1 为D型迭代学习控制,M 2
为PD型迭代学习控制,M 3为变增益指数D型迭代学习控制。
t
0
G t,
t
0
CtΦt, B L
ek d
uk1(t) L(uk (t), ek1(t))
式中,L为线性或非线性算子。
(11.5)
11.2 基本迭代学习控制算法
Arimoto 等首先给出了线性时变连续系统的D型迭代学习控制律[24]
uk1(t) uk (t) Γe&k (t)
(11.6)
迭代学习控制PPT课件

x1
0
J
1 m
u
15
应用效果
选取系 ml 2 , s 3
ml
。取系统输出为
y(t)
1 5
x2 (2 sint)
,设理想输
出 为 yd (t) t t2 , 取 x1(0) 0, x2 (0) 0, u1(t) 1 , 选 取 开 闭 环 PD 型 迭 代 学 习 控 制 律
迭代学习控制主要问题之一是鲁棒 性问题,即实际动态过程中存在着各种 不确定的扰动、偏差。
由于被控过程的非线性、高阶次、 时变性以及随机干扰等因素,造成模糊 控制规则或者粗糙或者不完善,而且模 糊控制规则是基于人为经验,更决定其 存在不完善的地方,这些都会不同程度 地影响控制结果。
将迭代学习控制及模糊控制相结合 以弥补相结合,既提高了鲁棒性又保证 了精度。
与模糊控 制相结合
与最优 化原则 相结合
管理指导
22
变结构控制可以保证控制系统在时间轴方向的收敛性,对系统参数和外部扰动的不变性
是其突出的优点,而它的一个明显的缺点是系统存在颤抖。这一明显缺点是由于采用不
连续切换控制规律,系统状态会产生高频颤动,颤动的出现是变结构控制应用中的突出
障碍,它将影响控制的精确性,因此系统的精度不高。因此.考虑把迭代学习和滑模变
( yd (t) 为期望轨迹)
学习律: uk 1(t) L(uk (t), ek (t))
4
基本原理
输入变量(控 制量)
输出变量
期望轨迹
误差
通过对被控系统进行控制尝试,以输出信号与给定目标的偏差修正不理想的控制信号, 使得系统的跟踪性能得以提高。新的控制量存入存储器,刷新旧控制量;在施加控制时,需从 存储器中取出控制量。可以看到迭代学习控制算法可利用的信息要多余常规的反馈控制算法。
智能控制技术概述 ppt课件

1980
形成期
发展期
现在
智能控制思潮出现于60年代,智能控制的产生和发展经历了萌
芽、形成和发展三个阶段。
PPT课件
24
1)萌芽期(1960-1970)
1965年,加利福尼亚大学 的扎德(L.A. Zadeh)教授 提出了模糊集合理论;
1967 年 , 利 昂 德 斯 ( C.T.Leondes ) 和 门 德 尔首先使用“智能 控制”一词。这标志着智 能控制的思想已经萌芽
5
智能家电已成新宠
智能家电已成新宠。在日本,几乎所有家用电器制造厂 商都使用模糊技术。
PPT课件
6
智能洗衣机
松下和日立公司已生产了智能洗衣机,拥有更加人性化的设计, 可以自动调整洗衣服得各项参数,根据衣服来调整洗涤所需水位 及洗涤时间。根据不同衣物的面料调整洗衣过程,更好保护衣物。
目前,很多大型家电集团已开发了国产模糊控制洗衣机 ,如:
汽车与智能交通
日本仙台的地铁使用模糊控制技术,使地铁机车启动和
停车非常平稳,乘客不必抓住扶手也能保持平衡。
PPT课件
11
工业
最早的实用工业过程模糊控制是丹麦F. L. Smith公司研制的水泥窑模糊逻
辑计算机控制系统,它已作为商品投放市场,是模糊控制在工业过程中成
功应用的范例之一。
PPT课件
12
PPT课件
L.A. Zadeh
25
2)形成期(1970-1980)
20世纪70年代可以看做是智能控制的形成期:
➢1974年英国工程师曼德尼(E.H.Mamdani)将模糊集合和模 糊语言用于锅炉和蒸汽机的控制,取得良好的结果。
➢1977年,萨里迪斯(Saridis)提出智能控制三元结构定义。
智能控制--第11章 迭代学习控制

k (t ) uk 1 (t ) uk (t ) Γe
(11.6)
式中,Γ 为常数增益矩阵。在D 型算法的基础上,相继出现了P 型、
PI 型、PD 型迭代学习控制律。从一般意义来看它们都是PID型迭代
学习控制律的特殊形式,PID迭代学习控制律表示为
k (t ) Φek (t ) Ψ ek ( )d uk 1 (t ) uk (t ) Γe
迭代学习控制(ILC,Iterative Learning Control)的思想最初由
日本学者Uchiyama于1978年提出[23],于1984年由Arimoto等人
[24]做出了开创性的研究。这些学者借鉴人们在重复过程中追求满意 指标达到期望行为的简单原理,成功地使得具有强耦合非线性多变量
的工业机器人快速高精度地执行轨迹跟踪任务。其基本做法是对于一
输出误差的校正项,即
uk 1 (t ) L(uk (t ), ek (t ))
(11.4)
闭环学习策略是:取第K+1次运行的误差作为学习的修正项,即
uk 1 (t ) L(uk (t ), ek 1 (t ))
(11.5)
式中,L为线性或非线性算子。
11.2 基本迭代学习控制算法
Arimoto 等首先给出了线性时变连续系统的D型迭代学习控制律[24]
(11.10)
(2)闭环PD型:
d t q k 1 t uk 1 t uk t Kp qd t qk 1 t Kd q
(11.11)
(3)指数变增益D型:
d t q k 1 t (11.12) uk 1 t uk t Kp qd t qk 1 t Kd q
(11.6)
式中,Γ 为常数增益矩阵。在D 型算法的基础上,相继出现了P 型、
PI 型、PD 型迭代学习控制律。从一般意义来看它们都是PID型迭代
学习控制律的特殊形式,PID迭代学习控制律表示为
k (t ) Φek (t ) Ψ ek ( )d uk 1 (t ) uk (t ) Γe
迭代学习控制(ILC,Iterative Learning Control)的思想最初由
日本学者Uchiyama于1978年提出[23],于1984年由Arimoto等人
[24]做出了开创性的研究。这些学者借鉴人们在重复过程中追求满意 指标达到期望行为的简单原理,成功地使得具有强耦合非线性多变量
的工业机器人快速高精度地执行轨迹跟踪任务。其基本做法是对于一
输出误差的校正项,即
uk 1 (t ) L(uk (t ), ek (t ))
(11.4)
闭环学习策略是:取第K+1次运行的误差作为学习的修正项,即
uk 1 (t ) L(uk (t ), ek 1 (t ))
(11.5)
式中,L为线性或非线性算子。
11.2 基本迭代学习控制算法
Arimoto 等首先给出了线性时变连续系统的D型迭代学习控制律[24]
(11.10)
(2)闭环PD型:
d t q k 1 t uk 1 t uk t Kp qd t qk 1 t Kd q
(11.11)
(3)指数变增益D型:
d t q k 1 t (11.12) uk 1 t uk t Kp qd t qk 1 t Kd q
2024版智能控制技术ppt课件

模糊逻辑在智能控制中应用
01
02
03
工业过程控制
应用于化工、冶金、电力 等工业过程控制中,实现 对温度、压力、流量等参 数的智能控制。
智能家居系统
应用于智能家居系统中, 实现对灯光、窗帘、空调 等设备的智能控制,提高 居住舒适度。
自动驾驶技术
应用于自动驾驶技术中, 实现对车辆行驶轨迹、速 度等参数的智能控制,提 高行驶安全性。
神经网络控制
利用神经网络强大的自 学习和自适应能力,实 现对复杂系统的有效控 制。特点:能够处理非 线性、不确定性和时变 系统,具有强大的逼近
能力和容错性。
专家系统控制
基于专家知识和经验, 构建专家系统实现对复 杂系统的有效控制。特 点:能够处理定性和定 量信息,具有较强的推
理和决策能力。
遗传算法控制
现代控制理论的发展背景
01
随着计算机技术的进步和复杂系统的出现,现代控制理论应运
而生。
现代控制理论的核心思想
02
基于状态空间法和最优化原理,实现对复杂系统的有效控制。
现代控制理论的主要方法
03
包括线性系统理论、最优控制、鲁棒控制等。
智能控制方法分类及特点
第一季度
第二季度
第三季度
第四季度
模糊控制
利用模糊数学理论,将 人的控制经验表示为模 糊规则,实现对复杂系 统的有效控制。特点: 不依赖于精确的数学模 型,具有较强的鲁棒性 和适应性。
模拟退火算法实现过程
包括初始化、设置温度参数、生成新解、计算目标函数差、接受准 则判断、降温过程等步骤。
模拟退火算法特点
具有全局搜索能力强、不易陷入局部最优解等特点,但计算时间较 长。
智能优化算法在智能控制中应用案例
人工智能智能控制PPT

AI IC AC
智能控制的二元结构
三元结构
萨里迪斯(Saridis)认为,二
元交集的两元互相支配无助于智
能控制的有效和成功应用,必须 把远筹学的概念引入智能控制,
AI
使它成为三元交集中的一个子集。
对这一问题的争论,在IEEE第
一次智能控制国际讨论会上达到
高潮。
OR IC
CT
萨里迪斯还提出分级智能控 制系统,由3个智能(感知)级组 成:组织级、协调级、执行级。
(4)把任务协商作为控制系统以及控制过程的一 部分来考虑。
在上述讨论的基础上,我们能够给出智能控 制器的一般结构,如下图 所示。
不完全任务描述
任务协商
混合知识表示
多传感器 感知系统
各种传感器
高层规划/控制 常规控制过程
各种驱动器
世界(环境)
智能控制器的一般结构
3. 智能控制的特点
(1)同时具有以知识表示的非数学广义模型 和以数学模型表示的混合控制过程。
智能控制的三元结构
知识组织器
协调器1 硬件控制器1
协调器n 硬件控制器n
组织级 协调级 执行级
过程1
过程n
分级智能控制系统
四元结构 在研究了前述各种智
能控制的结构理论和各相 关学科的关系之后,蔡自 兴提出四元智能控制结构, 把智能控制看做人工智能、 自动控制、运筹学和信息 论四个学科的交集。
AI
1967年,Leondes和Mendel首先正式使用 “智能控制”一词。
智能控制的产生和发展
1985年,在美国首次召开了智能控制学 术讨论会。
1987年又在美国召开了智能控制的首届 国际学术会议,标志着智能控制作为一个 新的学科分支得到承认。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t
0
C
t
Φ
t
,
B
u
k
u
k
1
d
即
ek
1
t
ek
t
t
0
C
t
Φ
t,
B
uk
1
uk
d
将PID型控制律式(11.14)代入上式,则第k+1次输出的误差为:
ek
1
t
ek
t
t
0
C
t
Φ
t,
B
Γ
e&kL源自ekΨ0ek
d
d
(11.15)
利用分部积分公式,令 Gt, CtB Γ ,有
t
0
Ct B
Γ
e&k
d
G t,
ek
t
t
00
G t,
ek
d
Ct
B
Γ
ek
t
0
G
t,
ek
d
将式(11.16)代入式(11.15),得
(11.16)
ek 1
t
I
C
t
B
t
Γ
t
ek
t
t
0
G
t,
ek
d
t
0
Ct
Φ
t,
B
L
ek
d
t
0
0
Ct
Φ
t,
B
ψ
ek
d
d
(11.17)
将式(11.17)两端取范数,有
ek1 t
I CtBtΓt
ek t
11.4.2 仿真实例
针对二关节机械手,介绍一种机器人PD型反馈迭代学习控制的仿 真设计方法。针对二关节机器人控制系统式(11.9),各项表示为:
D dij 22
d11 d1lc21 d2 l12 lc22 2l1lc2 cos q2 I1 I2
d12 d21 d2 lc22 l1lc2 cos q2 l2
干扰项为d 0.3sin t
0.1 1 et
T
机器人系统参数为 d1 d2 1 kg ,l1 l2 0.,5m,lc1 lc2 0.25m ,I1 I2 0.1 kg m2
g 9.81 m/s2
采用三种闭环迭代学习控制律,其中M 1 为D型迭代学习控制,M 2
为PD型迭代学习控制,M 3为变增益指数D型迭代学习控制。
两个关节的位置指令分别为 sin(3t)和 cos(3t),为了保证被控对象初始输
出与指令初值一致,取被控对象的初始状态为 x0 0 3 1 0T。取
PD型迭代学习控制,即 M 3 ,仿真结果如图11-1至图11-3所示。
图11-1 20次迭代学习的跟踪过程
图11-2 第20次迭代学习的位置跟踪
行的初始状态 xk (0),要求在给定的时间 t 0,T 内,按照一定的学习控制
算法通过多次重复的运行,使控制输入 uk (t) ud (t) ,而系统输出 yk (t) yd (t) 第k 次运行时,式(11.1) 表示为:
x&k (t) f (xk (t),uk (t), t) yk (t) g(xk (t), uk (t), t)
PI 型、PD 型迭代学习控制律。从一般意义来看它们都是PID型迭代
学习控制律的特殊形式,PID迭代学习控制律表示为
t
uk1(t) uk (t) Γe&k (t) Φek (t) Ψ 0 ek ( )d
(11.7)
式中, Γ 、Φ 、Ψ 为学习增益矩阵。算法中的误差信息使用称为开环迭
代学习控制,如果使用 则称为闭环迭代学习控制,如果同时使用和
11.4 机械手轨迹跟踪迭代学习控制仿真实例
11.4.1控制器设计
考虑一个关节的机器人,其动态性能可以由以下二阶非线性微分方 程描述:
Dqq&& Cq,q&q& Gq τ τd
(11.9)
式中:q Rn为关节角位移量,DqRnn为机器人的惯性矩阵,Cq,q&Rn
表示离心力和哥氏力,GqRn为重力项,τ R为n 控制力矩,τd Rn 为各
图11-3 20次迭代过程中误差范数的收敛过程
11.5 线性时变连续系统迭代学习控制 11.5.1 系统描述
Arimoto等[24]给出了线性时变连续系统
x&t A t xt Bt u t yt Ctxt
的开环PID型迭代学习控制律:
uk 1
t
uk
t
Γ
d dt
L
Ψ
dt
ek
t
其中 Γ ,L ,Ψ为学习增益矩阵。
第十一章 迭代学习控制
实际控制中存在一类轨迹跟踪问题,它的控制任务是寻找控制律 ut ,使得被控对象输出 yt在有限时间 0,T上沿着整个期望轨迹实现零
误差轨迹跟踪。这列跟踪问题是具有挑战性的控制问题。 人们在处理实际场合中的重复操作任务时,往往依据对象的可重复
动态行为与期望行为的差距来调整决策。通过重复操作,使得对象行 为与期望行为的配合达到要求。这时,衡量动态行为的指标是某种满 意指标。
uk1(t) L(uk (t), ek1(t))
式中,L为线性或非线性算子。
(11.5)
11.2 基本迭代学习控制算法
Arimoto 等首先给出了线性时变连续系统的D型迭代学习控制律[24]
uk1(t) uk (t) Γe&k (t)
(11.6)
式中,Γ 为常数增益矩阵。在D 型算法的基础上,相继出现了P 型、
x&(t) f (x(t),u(t),t) ,y(t) g(x(t),u(t),t)
(11.1)
式中,xRn 、y Rm 、u Rr 分别为系统的状态,输出和输入变量, 、f ()、g() 为适当维数的向量函数,其结构与参数均未知。若期望控 制 ud (t)存在,则迭代学习控制的目标为:给定期望输出 yd (t) 和每次运
Cexp At
exp At
t
0
B
u
exp A
d
Cexp
At
t
0
exp
A
t
B
u
d
取 Φt, expAt ,则
xk
t
x
k
1
t
t
0
Φ
t
,
B
u
k
u
k
1
d
由于 ek t yd t yk t ,ek1 t yd t yk1 t,则
ek1 t ek t yk t yk1 t Ct xk t xk1 t
d22
d
l2
2 c2
I2
C cij 22 c11 hq&2 c12 hq&1 hq&2
c21 hq&1 c22 0
h m2l1lc2 sin q2
G G1 G2 T
G1 d1lc1 d2l1 g cos q1 d2lc2g cosq1 q2 G2 d2lc2g cosq1 q2
种误差和扰动。
设系统所要跟踪的期望轨迹为 yd t ,t 0,T 。系统第次输出为 yi t 令ei t yd t yi t 。
在学习开始时,系统的初始状态为 x0 0 。学习控制的任务为通过学 习控制律设计 ui1 t ,使第 i 1 次运动误差 ei1 t 减少。
采用三种基于反馈的迭代学习控制律:
跟踪误差为
(11.2)
ek (t) yd (t) yk (t)
(11.3)
迭代学习控制可分为开环学习和闭环学习。
开环学习控制的方法是:第k+1次的控制等于第k次控制再加上第k次 输出误差的校正项,即
uk1(t) L(uk (t), ek (t))
(11.4)
闭环学习策略是:取第K+1次运行的误差作为学习的修正项,即
迭代学习控制适合于具有重复运动性质的被控对象,通过迭代修 正达到某种控制目标的改善。迭代学习控制方法不依赖于系统的精确 数学模型,能在给定的时间范围内,以非常简单的算法实现不确定性 高的非线性强耦合动态系统的控制,并高精度跟踪给定期望轨迹,因 而一经推出,就在运动控制领域得到了广泛的运用。
迭代学习控制方法具有很强的工程背景,这些背景包括:执行诸 如焊接、喷涂、装配、搬运等重复任务的工业机器人;指令信号为周 期函数的伺服系统;数控机床;磁盘光盘驱动系统;机械制造中使用 的坐标测量机等。
迭代学习控制本质上是一种前馈控制技术,大部分学习律尽管证 明了学习收敛的充分条件,但收敛速度还是很慢。可利用多次学习过 程中得到的知识来改进后续学习过程的速度,例如,采用高阶迭代控 制算法、带遗忘因子的学习律、利用当前项或反馈配置等方法来构造 学习律,可使收敛速度大大加快。
11.3.4 鲁棒性问题 迭代学习控制理论的提出有浓厚的工程背景,因此仅仅在无干扰
条件下讨论收敛性问题是不够的,还应讨论存在各种干扰的情形下系 统的跟踪性能。一个实际运行的迭代学习控制系统除了存在初始偏移 外,还或多或少存在状态扰动、测量噪声、输入扰动等各种干扰。鲁 棒性问题讨论存在各种干扰时迭代学习控制系统的跟踪性能。具体地 说,一个迭代学习控制系统是鲁棒的,是指系统在各种有界干扰的影 响下,其迭代轨迹能收敛到期望轨迹的邻域内,而当这些干扰消除时 ,迭代轨迹会收敛到期望轨迹。
xk (0) xd (0), k 0,1, 2,…
(11.8)
当系统的初始状态不在期望轨迹上,而在期望轨迹的某一很小的邻域内
时,通常把这类问题归结为学习控制的鲁棒性问题研究。
11.3.3 学习速度问题 在迭代学习算法研究中,其收敛条件基本上都是在学习次数 k