第6章 最优控制

合集下载

第6章 最优控制

第6章 最优控制

(1)F,Q,R是衡量误差分量和控制分量的加权矩阵,可根据各分量 的重要性灵活选取。
(2)采用时变矩阵Q(t),R(t)更能适应各种特殊情况。
例如:并 t 不t0时反刻映e系(t0统)很性大能,的但好误坏差。在系统开始前形成,
Q(t)可开始取值小,而后取值大
第6章 线性二次型的最优控制
线性二次型问题的本质: 用不大的控制,来保持较小的误差,以达到能量和误差综合最优的目的。
)]dt
0
(0 4)
其中g和r都是正的常数。因此在目前情况下,最 优控制问题是:找u(t)的变化规律.使槽中液体
经I小时后从0℃上升到40℃ ,并要求散失的热 量最小,即方程(4)中J(u)取最小值。
第6章 线性二次型的最优控制
2. 最优化问题的分类
静态最优化问题。最优化问题的解不随时间t的变化而变化,则 称为静态最优化(参数最优化)问题。
解:因假定槽中液体处于完全混合状态,故可用x(t)表示其温度。由热力学可知,
槽中液体温度的变化率与温差[u(t)一x(t)]成正比,为简便计,令比例系数为1,于
是有
dx(t) u(t) x(t)
(0 3)
dt
在1小时内散失掉的热量可用下式表示:
J (u)
1
[qx
2
(t
)

ru
2
(t
(5 1)
初始条件 x(t0 ) x0,终端时间 t
假设控制向量 u(t) 不受约束 ,求最优控制 u*(t) ,使系统的二次型
性能指标取极小值。
J
(u)

1 2
xT
(t
f
)Fx(t
f
)

最优控制理论课件

最优控制理论课件

8
最优控制问题
1.1 两个例子
例1.1 飞船软着陆问题
软着陆 过程开 始时刻 t 为零
h& v
v& u g m
m& K u
m 飞船的质量 h 高度 v 垂直速度 g 月球重力加速度常数 M 飞船自身质量 F 燃料的质量 K 为常数
初始状态 h(0) h0 v(0) v0 m(0)MF
f(x(t),u(t),t) 为n维向量函数
22.03.2020
现代控制理论
24
最优控制问题
1.2 问题描述
(1) 状态方程 一般形式为
x&(t) f (x(t),u(t),t)
x(t) Rn
x(t)|tt0 x0
为n维状态向量
u(t) Rr
为r 维控制向量
f(x(t),u(t),t) 为n维向量函数
求解最优控制的变分方法
泛函与函数的几何解释
22.03.2020
现代控制理论
50
求解最优控制的变分方法
泛函与函数的几何解释
宗量的变分
x(t)x(t)x(t)
22.03.2020
现代控制理论
51
求解最优控制的变分方法
泛函与函数的几何解释
宗量的变分
x(t)x(t)x(t)
泛函的增量 J ( x ( g ) ) J ( x ( g ) x ) J ( x ( g ) ) L ( x , x ) r ( x , x )
J x ( T ) ,y ( T ) ,x & ( T ) ,y & ( T ) x & ( T )
控制
(t)
22.03.2020
现代控制理论

第六章 最优控制2012

第六章 最优控制2012

,使J 为极小。
一、性能指标及分类 性能指标函数(又称目标函数、性能泛函),最优控制
问题可归结为求性能指标的极值问题。按照实际控制性能 常见:
⑴ 最短时间问题:
拦截导弹最短时间控制
⑵ 最小消耗问题:控制量u(t)与燃料消耗量成正比
导弹最小燃料控制
(3) 线性调节器问题:考虑在平衡位置 x=0附近的状态调节
导弹稳定控制
在变分法中这类问题称为拉格朗日问题。它要求状态向 量及控制向量在整个动态过程中都满足性能要求。
⑵ 终值型性能指标:
卫星的指向控制
在变分法中称为迈耶尔问题。只要求状态在过程终端时 满足一定要求,而对状态及控制量在整个动态过程中的演变 不作要求。
⑶ 复合型性能指标:
卫星的指向和 稳定控制
的变分是指两个函数间的差
问题:何为两个函数的差?两个函数距离接近?
K阶近似度
定义:设 是线性赋范空间 上的连续泛函,其增量可表示为
其中,
是关于 的线性连续泛函,
是关于 的高
阶无穷小。则
称为泛函 的变分。
泛函的变分等于
3、泛函变分的规则 1) 2) 3) 4)
变分的导数等于导数的变分
4、泛函的极值
寻求在
上的最优控制

,以将系统状
态从
转移到 x(t f ) 或 x(t f ) 的一个集合,并使性能指标
最优。其中
是 x 、u 和t 的连续函数
最优控制问题就是求解一类带有约束条件的条件泛函极值问 题。
泛函与变分法
一、泛函与变分
1、泛函的基本定义: 对于某个函数集合 中的每一个函数 ,变量J 都有一个
在变分法中称为波尔札问题。它要求状态在过程终端 时满足一定要求,而且状态向量及控制向量在整个动态过 程中都应满足一定要求。

第6章 用变分法求解最优控制问题

第6章 用变分法求解最优控制问题

§6-2 泛函与变分的基本概念
3.泛函的变分 ● 泛函的增量 由自变量函数 x(t ) 的变分 x(t ) 引起泛函 J [ x(t )]的增量
J J [ x* (t ) x(t )] J [ x* (t )] 为泛函 J [ x(t )] 的增量。
f {x(t f ); g1[ x(t f )] 0, g 2 [ x(t f )] 0}
3. 容许控制 控制量受客观条件限制所能取值得范围。
U {u (t ); ( x, u ) 0} u (t ) U
§6-1 最优控制问题的一般提法
4. 性能指标 tf L[ x(t ), u (t ), t ]dt (1)积分型性能指标: J t0 反映控制过程中对系统性能的要求。
在容许控制集合 U 中,寻找控制向量 u (t ) U , t [t0 , t f ] ,使系统由 给定的初始状态出发,在 t t0 时刻转移到规定的目标集,并使性能 tf 指标: J [ x(t ), t ] L[ x(t ), u (t ), t ]dt
f f
取得极小值。

t0
1 2
若 x(t ) t 有
t x ( t ) e 若 有
§6-2 泛函与变分的基本概念
2.泛函自变量的变分 泛函 J [ x(t )] 的自变量函数 x(t ) 与标称函数 x* (t )之间的差值函数
x x(t ) x(t ) x* (t ) 称为泛函自变量的变分,记作 x(t )或 x 。 x(t ) x (t ) B 设 x (t ) 为 x(t ) 的容许曲线,即 x(t ) x (t ) x* (t ) (t ) x* (t ) 令 0 1 A 则 x* (t ) x* (t ) (t ) x (t ) t 这样: x(t ) (t ) x(t ) x* (t ) (t ) x* (t ) x(t )

最优控制理论PPT课件.ppt

最优控制理论PPT课件.ppt
J x y J x J y
则称J x为线性泛函
Modern Control Theory
Page: 8
§6-2 最优控制中的变分法

代 (5)泛函的变分
控 制
泛函Jx的增量:Jxt,x Jxt x Jxt
理 论
Lxt,x rxt,x
其中Lxt ,x— J的线性函数
rxt ,x— J的高阶无穷小

J x(t) 0
Modern Control Theory
Page: 12
§6-3 无约束条件的泛函极值问题

代 控
一、t0 , t f 给定的泛函极值问题

理 定理:设

J tf L(x, x,t) t0
求min J的x*(t) ?
x *(t)满足以下条件:L d (L) 0 x dt x ---- 欧拉方程
ut Rp为控制向量,且ut 在t0,t f 上分段连续;
f Rn为连续向量函数,xt连续可微
2.初态和终态: x t0 ,x t f S 目标集
3.容许控制 : ut—控制域
指控制矢量u t 应满足的约束条件
Modern Control Theory
Page: 4
§6-1 一般概念
Page: 6
§6-2 最优控制中的变分法

代 一.泛函与变分的基本概念
控 制 1.泛函与变分的基本概念
理 论
(1)泛函 如果对于自变量t, 存在一类函数x t , 对于每个函数x t ,有一J值
与之对应,则变量J 称为依赖于函数x t 的泛函数,简称泛函,
记作J x t
(2)函数的变分
泛函J x t 的变量x t 变分 x : x x t x0 t , 它表示x t 与x0 t 之间的差

现代控制理论基础 第6章 线性系统的最优控制

现代控制理论基础 第6章 线性系统的最优控制

7
方法的比较
总的来说,当控制量无约束时,‘采用“变分法” ;当控制量有 约束时,采用“极小值原理” 或“动态规划”;如果系统是线性的, 采用“线性二次型”方法最好,因为,一方面,二次型指标反映了大 量实际的工程性能指标的要求;另方面,理论上的分析及求解较简单、 方便、规范,而且还有标准的计算机程序可供使用;得到的控制器易 于通过状态反馈实现闭环最优控制,工程实现方便。在实际的工程控 制中,目前线性二次型最优控制己得到了广泛的成功应用。
J 值为极值 J (最大值或最小值),这种泛函求极值的方法,实际上 就是数学上的“变分”问题,须采用数学中的“变分法” 。
5
采用直接变分法求解最优控制率,难于甚至“无法解决容许控 制属于闭集”的最优控制问题,所以受到实际工程应用上的限制, 例如,每台电动机都有最大功率的限制;船舶或飞机的操纵舵面 也有最大偏转角的限制。况且采用直接变分法设计出的系统,其 抗参数变化的能力,即系统的鲁棒性也不强。因此,工程应用上 有较小的实用价值。
线性系统二次型的最化控制,因为其性能指标具有明确的物理 意义,在大量的工程实际中具有代表性,而且最优控制率的求解 较简单,并具有统一的解析表达式,构成的最优控制系统具有简 单的线性状态反馈的型式,易于工程实现,所以在国内外实际的 工程中目前己得到广泛应用。本章主要介绍其基本概念、基本原 理和设计方法。
下面只介绍线性二次型最优控制的基本概念、求解原理及设 计中的一些主要结论。
8
第三节 线性二次型最优控制
一、控制对象数学模型
线性系统的状态空间表达式
x(t) A(t)x(t) B(t)u(t)
y(t) C(t)x(t)
式中,
n x(t) 为 维状态向量;
(6-4)

最优控制

最优控制

J =
能观,
1 1 x ( t f ) T C T Q 0 Cx ( t f ) + 2 2
tf
[ x T C T Q 1 Cx + u T Q 2 u ] dt ∫
t0
二次型指标最优控制问题
线性系统
二次型性能指标
x = Ax + Bu y = Cx
tf
J =
1 T x (t f )Q 0 x (t f ) + 2
1 二次型性能泛函
1 1 T J = x (t f ) Q 0 x (t f ) + 2 2
半正定
tf
[ x T Q 1 x + u T Q 2 u ] dt ∫
t0
半正定
正定
误差大小的代价函数, qij大表示对应误差要求小 对控制的约束或要求. 表示在区间内消耗的能量, qij大表示对应付出的能量小. 最优控制目标是使性能指标J取得极小值, 其实质是用不大的控制来 保持比较小的误差,从而达到所用能量和误差综合最优的目的.
0 x = 1
1 x a + 2
1
y=x1
1 w( s ) = C ( sI A) B = 2 s + s a + 2 +1
281
6.4 线性二次型最优控制问题
6.4 线性二次型最优控制问题
输出调节问题
x (t ) = A (t ) x (t ) + B (t )u (t ) y ( t ) = C ( t ) x ( t ), x ( t 0 ) = x 0
q1 , q 2 > 0 , q 0 ≥ 0
u * ( t ) = Q 2 1 ( t ) B T ( t ) P ( t ) x ( t ) = q 2 1 p ( t ) x ( t )

清华大学最优控制--课程概述

清华大学最优控制--课程概述
3/4
1. 2. 3. 4. 5. 6.

因材施教:个别讨论、email答疑等
4/4
1
2/4
教学安排

教学安排

教材:最优控制,清华大学出版社
教学管理:作业30% + 开卷笔试70% (课程论文可代替部分或全部笔试) 提交作业要求: 1周内提交

参考书
解学书:最优控制—理论与应用,清华大学出版社 胡中楫等:最优控制原理及应用,浙大出版社 吴受章等:应用最优控制,西交大出版社 王朝珠等:最优控制原理,科学出版社 B.D.O.Anderson and J.B. Moore: Linear Optimal Control, Prentice-Hall F.L. Lewis and V.L. Syrmos: Optimal Control, John Wiley & Sons, INC.
教 学 安 排

最优控制
授课教师:钟宜生

总ห้องสมุดไป่ตู้时 32学时 主要教学内容
第1章 第2章 第3章 第4章 第5章 第6章 第7章 第8章 第9章 最优控制问题的提出和数学描述 函数极值的基本理论 最优控制中的变分法 极大值原理 动态规划 时间最短和燃料最省控制 线性二次型最优调节系统设计 最优状态调节系统的鲁棒稳定性 最优控制系统的渐近特性和加权矩阵的选择
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

6.12.4 输出调节器问题 1.输出调节器的任务是当系统受到外扰时,在不消耗过多能量的前提下, 维持系统的输出矢量接近其平衡状态。 1.线性时变系统输出调节器问题 给定一个能观的线性时变系统:
性能泛函为:
于是可以用状态调节器上式来确定最优控制:
式中,
为下列黎卡提距阵微分方程的解:
边界条件:
2. 线性定常系统输出调节器问题 给定一个完全能控、能观的线性定常系统:
6.1 概述
所谓最优化,原非新鲜概念,人们在从事某项工作时,总是想着采取 最合理的方案或措施,以期收到最好的效果,这里就包含着最优化问题。 求解动态最优化问题的方法主要有古典变分法,极小(大)值原理及动态 规划法等。 动态最优化问题可以分为确定性和随机性两大类。在确定性问题中,没 有随机变量,系统的参数都是确定的。本书只讨论确定性最优控制问题。
(11)
4)协态终值满足横截条件:
(12) 5)满足边界条件:
(13) 这就是著名的极小值原理。
6.9
Bang-Bang控制
线性定常系统∑=(A,B,C),若存在时间最优 是惟一的。
定理69l 控制,则该控制
证明
用反证法。设存在两个控制 广使系统完成从初值
,但都能以 到零状态的转移,因此有:
相同的最小时间
6.1 概述 6.2 研究最优控制的前提条件 6.3 静态最优化问题的解 6.4 离散时间系统的最优控 6.5 离散时间系统最优控制的 离散化处理 泛函及其极值6.6 泛函及其极值-变分法 6.7 用变分法求解连续系统最 优控制问题优控制问题-有约束条件 的泛函极值
6.8 极小值原理 6.9 Bang-Bang控制 Bang-Bang控制 控制 6.11 动态规划法 6.12 线性二次型最优控制问 题 6.1 3 线性二次型次优控制问 题 6.10 双积分系统的时间最优
,把系统从仞态转移到终态,使
为极小。
根据极小值原理确定最优控制
列出哈尔密顿函数
为使H全局最小.呵得最优控制:
由协态方程得:来自即 解得: 故 在 相应的 ,如下图所示。 是一直线,其四种可能形状以及与之
显而易见,可供选择的最优控制序列有下列四种:
切换次数至多一次。切换时刻为:
6.10.2 6.10.3
为极大值点充要条件是:
因为
的极小值和
的极大值等效,所以今后所有推导和
结论,均以圾小化为准。 6.3.2 多元函数的极值 设 元函数 这里 为 维列向量。它取
极值的必要条件是:
或函数的梯度为零矢量。
至于取极小值的充要条件,尚需满足:
即下列海赛矩阵为正定矩阵。
6.3.3
具有等式约束条件的极值
上面讲的是无约束条件极值问题的求解方法。对于具有等式约束条件的 极值问题,则要通过等效变换,化为无约束条件的极值问题来求解。 设罐头桶的几何尺寸:高为 半径为 则容积为: (29) 给定铁皮面积A=常量。要使罐头桶容积为最大,必然要受条件: (30) 的约束: 解此类问题的方法有多种,如嵌入法 嵌入法(消元法)和拉格朗日乘子法 拉格朗日乘子法(增元法) 嵌入法 拉格朗日乘子法 等。
性能泛函为: 式中, 任意取值; 为正定对称矩阵; 为正定或半正定矩阵。
要求在系统方程约束下,寻求 最优控制为: 而 是下列黎卡提代数微分方程的解:
6.12.5 跟踪器问题 1.线性时变系统跟踪器问题 2.线性定常系统
6.1 3
线性二次型次优控制问题
没完全能控、能观系统的动态方程为:
性能指标为二次型:
取哈密顿函数为: (5) 则实现最优控制的必要条件是,最优控制 态矢量 满足下列关系式: 、最优轨线 和最优协
1)沿最优轨线满足正则方程 (6) (7) 若 则为: (8)
2)在最优轨线上,与最优控制
相应的H 函数取绝对极小值,即
或 沿最优轨线,有
(9)
(10) 3)H函数在最优轨线终点处的值决定于:
令 刻也将初值 转移到原点 。即
作用下,系统在

所以w也是最小时间控制,根据前面的结论, Bang.Bang控制,又 等的时刻上,有 最优控制矛盾,因此有:
都是 不相
不是Bang—Bang控制,与w()是
这表明控制
是惟一的。
6.10 双积分系统的时间最优控制
设双积分系统的状态方程为:
求最优控制 6.10.l
6.12.3 无限时间状态调节器问题 对于无限时间状态调节器,这里要强调以下几点: 1)适用于线性定常系统,且要求系统完全能控,而在有限时间状态调节 器中则不强调这一点。 2)在性能泛函中,由于 去了意义,即 3)与有限时间状态调节器一样,最优控制也是全状态的线性反馈,结构 图也与前面的相同。但是,这里的P 是n×n 维的实对称常矩阵,是黎卡捉矩 阵代数方程的解。因此,构成的是一个线性定常闭环系统。 4)闭环系统是渐近稳定的,即系统矩阵 负实部,而不论原受控系统A的特征值如何。 的特征值均具 ,而使终端泛函 失
直接求解。因为式(8)中的P 和K 阵都未知。 一个简单的处理方法是用梯度速降法,由式(5)解出用K 表示的P , 即P【K】,然后代入性能指标式(7),再令:
解出使
的K。
本章完
若不考虑终端指标函数项
则有:
这种形式的性能指标称为积分型或拉格朗日型。若不考虑动态指标函数 项, 则形如:
称为终端型 梅耶型 终端型或梅耶型 终端型 梅耶型。
6.3 静态最优化问题的解
静态最优化问题的目标函数是一个多元普通函数,其最优解可以通过古 典微分法对普通函数求极值的途径解决。动态最优化问题的目标函数是一个 泛函数,确定其最优解要涉及古典变分法求泛函极值的问题。 6.3.1 一元函数的极值 设 点 为定义在闭区间 上的实值连续可做函数,则存在极值 的必要条件是: (21) 为极小值点充要条件是:
(3) 将上式两边求导数,得:
对于渐近稳定的系统,当 为此,令: 式中Q 为正定的实对称阵。 因此 是负定的。比较式(5)和式(3)可得:
必须为负定。 (4)
(5)
(6)
将式(6)代入式(2),得性能指标:
由于A 所有特征值均具负实部,故有
,从而下式成立: (7)
此外,反馈矩阵K 亦不能从李雅普诺夫方程: (8)
6.6.3 多元泛函的极值条件 6.6.4 可变端点问题 6.6.5 具有综合型性能泛函的情况
6.7 用变分法求解连续系统最优控制问题——有约束条件的 泛函极值
6.7.1 拉格朗日问题
6.7.2 波尔札问题
6.8
极小值原理
定理6.8.1 设系统状态方程为: (1) 始端条件为: 控制约束为: 终端约束为: (3) 性能泛函为: (4) (2)
4.明确终端条件 类似于始端条件,固定终端是指终端时刻 定的。 自由端则是在给定 则是指 情况下,
可以任意取值不受限制。可变终端
的情况。其中
是由约束条件
所形成的一个目标集 目标集。 目标集
5.给出目标泛函,即性能指标 对连续时间系统,一般表示为:
对离散时间系统,一般表示为:
上述形式的性能指标,称为综合型或鲍尔扎型 综合型或鲍尔扎型。它由两部分组成,等 综合型或鲍尔扎型 式右边第一项反映对终端性能的要求,例如对目标的允许偏差、脱靶情况等, 称为终端指标函数;第二项中L为状态控制过程中对动态品质及能量或燃料 消耗的要求等,称为动态指标函数。
综上所述,可将连续型动态规划求解最优控制问题的步骤归纳如下: 1)构造哈密尔顿函数:
2)
由上述条件解出的 3)将 4)将
的函数。
代入哈密尔顿一贝尔曼方程,并根据边界条件,解出 代回 ,即得最优控制 它是状
态变量的函数,据此可实现闭环最优控制。 5)将 6)再将 代入状态方程,可进一步解出最优轨线 代人求得最优性能泛函 。
1.嵌入法 先从约束条件式(30) 解出一个变量,例如 数式(29)得: (31) 这样就变成一个没有约束条件的函数式。显然,式(31)取极值的条件为: 等,然后代入目标函
可解出极值点:
又因为 积为: 2.拉格朗日乘子法
故上述极值点为极大值点。罐头桶的最大容
6.4 离散时间系统的最优控
6.4.1 基本形式
(7) 这时,在 空间中,把所有满足上式的点 的集合,记作: (8)
U称为控制集。把满足
(9) 的 称为容许控制。
3.明确初始条件 通常,最优控制系统的初始时刻 定始端。如果 条件: 是给定的。如果初始状态 称固 是任意的,则称自由始端。如果 必须满足某些约束
相应的始端集 始端集为: 始端集 此时, 则称为可变始端。 和终端状态 都是给
6.4.2 具有二次型性能指标的线性系统
6.5 离散时间系统最优控制的离散化处理
设系统状态方程为: (73) 目标函数为: (74) 式中, 为终端代价函数,假定 是自由终端。 使式(74)为最小。
最优控制问题是在式(73)约束条件下,寻求
6.6 泛函及其极值——变分法
6.6.1 变分法的基本概念 1.泛函 变分法是研究泛函极值问题的数学工具。什么叫泛函呢?通俗地说,泛 函就是函数的函数。它是普通函数概念的一种扩充。 2.泛函的极值 3.泛函的变分 4.泛函极值定理 6.6.2 泛函极值的必要条件——欧拉方程 求泛函
状态轨线及开关曲线 最优控制律 转移到终态(0,0)。
为了使系统的状态能以最小时间从初态
当初态所划位置不同时,应当采取的控制规律不同。但是,凡不在开关曲线 上的点,至少要经过一次切换,转到开关曲线后才能沿着 γ+或γ-到达原点(0, 0)。因此,按照初态 所处的位置可得到下列最优控制规律:
若将开关曲线写成:
6.11 动态规划法
动态规划是贝尔曼(Bellman)在 20世纪~ 50年代作为多段(步)决策过程 研究出来的,现已在许多技术领域中获得广泛应用。 动态规划的核心是最优性原理。 6.11.1 多段决策问题
相关文档
最新文档