11讲 最优控制-极小值-总结及习题讲解
最优控制习题及参考问题详解

标准文档1 2f最优控制习题及参考答案习题 1 求通过 x (0) = 1 , x (1) = 2 ,使下列性能指标为极值的曲线:t f J = ∫(x2 +1)dt t 0解: 由已知条件知: t 0 = 0 , t f = 1d由欧拉方程得: (2x ) = 0dtx = C 1x = C 1t + C 2将 x (0) = 1,x (1) = 2 代入,有:C 2 = 1,C 1 = 1得极值轨线: x *(t ) = t +1习题 2 求性能指标: J = ∫ 1(x 2 +1)dt在边界条件 x (0) = 0 , x (1) 是自由情况下的极值曲线。
解:由上题得: x *(t ) = C t + C由 x (0) = 0 得: C 2 = 0∂L由∂xt =t f= 2x (t f ) = 2C 1 t =t = 0 t于是: x *(t ) = 0【分析讨论】对于任意的 x (0) = x 0 ,x (1) 自由。
2 0 1∫⎩ λ = −λ有: C = x , C = 0 ,即: x *(t ) = x 其几何意义: x (1) 自由意味着终点在虚线上任意点。
习题 3 已知系统的状态方程为: x1 (t ) = x2 (t ) , x 2 (t ) = u (t )边界条件为: x 1 (0) = x 2 (0) = 1 , x 1 (3) = x 2 (3) = 0 ,31 试求使性能指标 J =u 2(t )dt 2取极小值的最优控制 u *(t ) 以及最优轨线 x *(t ) 。
⎡ x ⎤解:由已知条件知: f = ⎢ 2⎥⎢⎣ u ⎥⎦Hamiton 函数: H = L + λT f H = 1u 2 + λ x + λ u⎧λ = 0由协态方程: ⎨ 12 121 22⎧λ = C① 得: ⎨11⎩λ2 = −C 1t + C 2②∂H由控制方程: ∂u= u + λ2 = 0得: u = −λ2 = C 1t − C 2 ③由状态方程: x 2 = u = C 1t − C 2得: x (t ) = 1C t 2− C t + C④22 由状态方程: x 1 = x 21 2 3得: x (t ) = 1C t 3− 1C t 2+ C t + C⑤16 122 3 41 ∫⎪⎩=−=−⎡1⎤ ⎡0⎤将 x (0) = ⎪ ⎪ , x (3) = ⎪0⎪ 代入④,⑤,⎣1⎦ ⎣ ⎦10联立解得: C 1 =由③、④、⑤式得:u * (t ) = 10t − 29 , C 2 = 2 , C 3 = C 4 = 1 9x *(t ) = 5 t 3 −t 2 + t +127 x *(t ) = 5 t 2 − 2t +1 29习题 4 已知系统状态方程及初始条件为x =u , x (0) = 1试确定最优控制使下列性能指标取极小值。
11 最优控制1

t0 tf
这是一种积分型泛函,在变分法中这类 问题称为拉格朗日问题。
(2)终值型性能指标
J [ x(t f ), t f ]
在变分法中称为迈耶尔问题。
(3)复合型性能指标。
J [ x(t f ), t f ] F[ x(t ), u(t ), t ]dt
最优控制问题提法
最优控制的问题就是:从所有可供选择 的容许控制中寻找一个最优控制 u (t ) 使状态由x(t 0 )经过一定时间转移到目标集 S,并且沿此轨线转移时,使相应的性能 指标达到极值。
*
任何一个最优控制问题均应包 含以下内容
系统数学模型 边界条件与目标集 容许控制 性能指标
t0
tf
举例
已知人造地球卫星姿态控制系统的状态方程 为 (t ) 0 1 x(t ) 0u (t ) x 0 0 1
1 2 2 性能泛函取为 J 2 0 u (t )dt
边界条件
1 x(0) 1
0 x(2) 0
J ( x) F[ x(t ), x(t ), t ]dt
t0
tf
J ( x) F [ x(t ), x(t ), t ]dt
t0
tf
t * ( t f ) f
t0 t* f
F [ x * (t ) (t ), x * (t ) (t ), t ]dt
求使性能泛函取极值的极值轨线和极值控制
F [ x * (t ) (t ), x * (t ) (t ), t ]dt
第七章极小值原理与典型最优控_...

31
在某些情况下,S矩阵的某些元素大到足 以引起计算上的困难,在此情况下,用 逆Riccati方程求解。 令
P(t ) P (t ) I
P(t ) P 1 (t ) P(t ) P 1 (t ) 0
1
(11)
(12)
32
则逆Riccati方程为
P 1 (t ) A(t ) P 1 (t ) P 1 (t ) AT (t ) B(t ) R 1 (t ) BT (t ) P 1 (t )Q(t ) P 1 (t ) 1 P (t f ) S 1
H x
11
也可以写成
H[ x(t ), u(t ), (t ), t ] min H[ x(t ), v(t ), (t ), t ],
H x f ( x, u , t )
H x
v
12
满足边界条件
x(t 0 ) x 0
33
•最优反馈控制结构
R (t ) B(t )
1
x(t ) A(t ) x(t ) B(t )u(t )
P(t)
34
•P(t)的计算
由
将Riccati方程写成差分格式
P (t t ) P (t ) t[ P (t ) A(t ) AT (t ) P (t ) P (t ) B (t ) R 1 (t ) B T (t ) P (t ) Q (t )
J min
J min 0, 且t0为任意
P(t ) 0
37
•无限时间调节器问题
1 T J [ x (t )Q (t ) x(t ) u T (t ) R (t )u (t )]dt Min 2 t0 u (t ) x(t ) A(t ) x(t ) B (t )u (t ) s.t. x(t0 ) x0
最优控制极小值原理

④在最优轨线末端哈密顿函数应满足
H
[
x*
(t
* f
),
(t*f
),
u*
(t*f
),
t
* f
]
[
x*
(t
* f
t f
),
t*f
]
⑤沿最优轨线哈密顿函数变化率
H[x*(t),(t),u*(t),t] H[x*(t f ),(t f ),u*(t f ),t f ]
tf t
H(x,,u, )d
定理3-2与定理3-1的区别:P61
当 t f自由时
H (x*(tt*f ),u*(tt*f ), (tt*f )) 0
第三章 极小值原理及其应用 3.1 连续系统的极小值原理
最小值原理只是最优控制所满足的必要条件。 但对于线性系统
x&(t) A(t)x(t) B(t)u(t)
,
a11(t) L
A(t)
M
O
an1(t) L
a1n (t)
g
H
x(t)
g
(t)
H
x
式中哈密顿函数 H (x, u, λ) L(x, u) λT (t)f (x, u)
② x(t) 及 (t) 满足边界条件
x(t0 ) x0
(t f ) 0
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
③哈密顿函数相对最优控制为极小值
H[x*(t), (t),u*(t)] min H[x*(t), (t),u(t)] u(t )
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
2、积分型性能指标问题
定理3-3:
min J (u) tf L[x(t),u(t)]dt
11讲 最优控制-极小值-总结及习题讲解

能源与动力学院系统控制与仿真研究室
16
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
17
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
极小值原理与变分法求最优控制的比较
能源与动力学院系统控制与仿真研究室
18
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
33
最优控制——极小值原理 3.4 极小值原理的典型应用
月面软着陆问题
h
v g
月球
能源与动力学院系统控制与仿真研究室
34
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
35
最优控制——极小值原理 3.4 极小值原理的典型应用
时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
7
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
8
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
9
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
27
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
28
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
29
5 最优控制-极小值原理

正常(或平凡)情况、奇异(或非平凡) 正常(或平凡)情况、奇异(或非平凡)情况
Bang-Bang控制原理 控制原理 是问题3 的时间最优控制, 设 u * ( t ) 是问题3-1的时间最优控制,
λ x* ( t ), ( t )
是相应的状态向量和协态向量,若问题是正常的, 是相应的状态向量和协态向量,若问题是正常的,则几乎所有 ),有下式成立 t ∈ t0 , t f (除去有限个开关时间),有下式成立 除去有限个开关时间),
在最优轨线末端哈密尔顿函数应满足的条件 (5)极值条件 极值条件
1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x * ( t ) , t u * ( t ) =
{1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x* ( t ) , t u * ( t )} min
u∈U
(50) ) (51) ) (52) )
或者
H ( x * , u* , λ* , t ) ≤ H [ x * , u, λ* , t ]
哈密顿函数沿最优轨线随时间的变化规律: 哈密顿函数沿最优轨线随时间的变化规律:
* * 在末值时刻 t f 是固定的情况 H (t ) = H (t f ) = const * *
3 极小值原理及其在快速控制中的应用
1 问题的提出 用变分法求解最优控制时, 用变分法求解最优控制时,认 不受限制。 为控制向量 u(t )不受限制。但是 实际的系统, 实际的系统,控制信号都是受到
u(t ) ∈ U ⊂ R r 某种限制的。 某种限制的。
因此, 因此,应用控制方程 ∂H = 0
哈工大现代控制理论基础第十一章 最优控制

11.1.1 最优控制问题的两个例子
[例1] 飞船的月球软着陆问题。 如图所示,飞船 靠其发动机产生一个与月球重力方向相反的推力 , 使得飞船到月球表面时速度为零, 即实现软着陆。 要求设计推力函数 ,使得发动机燃料消耗最少。
月球
[解]
设飞船的质量为 , 其高度和垂直速度分别为 和 ,月球的重力加速度为常数 ,飞船的自身 质量及所带燃料分别为 和 。
其中, 目标集 可表示为 性能指标 可表示为 其中 和 为连续可导的标量函数。
11.2 应用变分法求解无约束条件 的最优控制问题
11.2.1 泛函与变分
一. 泛函与泛函算子
所谓泛函,简单地说就是函数的函数,定义如下:
设
为给定的某类函数,如果对于这类函数中的
每一个函数,有某个数 与之相对应, 则称 为这类
哈工大现代控制理论基 础第十一章 最优控制
2020年4月24日星期五
11.1 最优控制问题的一般提法
最优控制研究的主要问题: 根据已建立的被控 对象的数学模型, 选择一个容许控制律, 使得被控 对象按照预定的规律运动,并使某一个性能指标达到 最大或最小。
从数学的观点来看, 最优控制问题是求解一类 带有约束条件的泛函极值问题, 属于变分学范畴。
经典的变分法只能解决控制无约束的问题, 即容许控制属于开集的一类最优控制问题。 然而, 工程中的控制常常是有约束的, 即容许控制是属于 闭集的。为了解决这个问题, 20世纪50年代,美国 学者贝尔曼和苏联科学院院士庞德里亚金分别独立 地拓展了经典变分法, 分别给出了动态规划方法和 极大值原理。 它们构成了最优控制的理论基础。
证明略
泛函变分的规则 泛函的变分是一种线性映射, 满足下列性质:
1 2 3 4
最优控制最小值原理

2-1 连续系统的最小值原理
问题 2-1 设系统的状态方程是
x f [x(t),u(t),t]
(2-1)
其中 f 是 n 维连续可微的向量函数;状态 x(t) Rn,其初态已
知是
x(t0 ) x0
终态应满足边界条件
(2-2)
[x(t f ),t f ] 0 其中 是 r 维连续可微的向量函数,r n;
tf t0
{L(x,
w,t)
T[
f
(x,
w,t)
x]
T[g(x,
w,t)
z2]}dt
(2-8)
的极值。
为 简 便 计 , 令
H(x,,w ,t)L(x,w ,t)Tf(x,w ,t)
(2-9)
(x,x,w,w ,z,z,,,t) H(x,,w ,t)TxT[g(x,w ,t)z2]
(2-10)
8
于 是 (2-8)式 可 写 成
J(u) [x(tf)t,f]vT[x(tf)t,f]
tt0f (x,x ,w ,w ,z,z,,,t)dt
(2-11)
现 在 求 广 义 性 能 指 标 (2-11)的 一 阶 变 分 :
JJtfJxJwJz
(2-12)
式 中 Jtf, Jx, Jw, Jz分 别 是 由 于tf , x , w和z的 微 变
tf t0
(x,x,w,w ,z,z,,,t)d
=0
分步积分
J w
t f
t0
(wT
w
w T
w )dt
wT
(t
)
w
t
t
f
t f wT t0
d dt
w
dt
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
能源与动力学院系统控制与仿真研究室
27
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
28
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
29
最优控制——极小值原理 3.4 极小值原理的典型应用
给定时间内燃料消耗为最少的控制问题
连续系统的极小值原理 •引例 •连续定常系统极小值原理 •极小值原理与变分法求最优控制的比较 •极小值原理求解最优控制的步骤 •连续时变系统的极小值原理
能源与动力学院系统控制与仿真研究室
3
最优控制——极小值原理 本章内容回顾
离散系统的极小值原理 •离散系统 •离散系统的欧拉方程 •离散极小值原理 •离散极小值原理与连续极小值原理的比较 •离散系统最优控制问题的数值计算
能量最优控制
能源与动力学院系统控制与仿真研究室
39
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
40
最优控制——极小值原理 3.4 极小值原理的室
41
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
7
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
8
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
9
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
42
思考题
3.1 火箭最大射程问题
能源与动力学院系统控制与仿真研究室
43
思考题
3.2 电梯最速上升最优控制
能源与动力学院系统控制与仿真研究室
44
思考题
3.3 简谐振动系统的时间最优控制
能源与动力学院系统控制与仿真研究室
45
肖玲斐 lf i @ lfxiao@ d
36
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
37
最优控制——极小值原理 3.4 极小值原理的典型应用
sgn 2 , u 0 0,
2 1 2 1
能源与动力学院系统控制与仿真研究室
38
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
4
最优控制——极小值原理 本章内容回顾
几类典型最优控制
•时间最短 •燃料最少 •能量最小 •时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
5
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
6
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
10
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
11
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
12
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
肖玲斐 lf i @ lfxiao@ d
最优控制——极小值原理 最 控制 值原 本章内容回顾
连续系统的极小值原理 离散系统的极小值原理 几类典型最优控制
•时间最短 •燃料最少 •能量最小 •时间-燃料最优控制
能源与动力学院系统控制与仿真研究室 2
最优控制——极小值原理 本章内容回顾
33
最优控制——极小值原理 3.4 极小值原理的典型应用
月面软着陆问题
h
v g
月球
能源与动力学院系统控制与仿真研究室
34
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
35
最优控制——极小值原理 3.4 极小值原理的典型应用
时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
16
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
17
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
极小值原理与变分法求最优控制的比较
能源与动力学院系统控制与仿真研究室
18
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
对于标量系统的最优控制
能源与动力学院系统控制与仿真研究室
19
最优控制——极小值原理 最 控制 值原 3.2 连续时变系统极小值原理
连续时变系统的极小值原理
能源与动力学院系统控制与仿真研究室
20
最优控制——极小值原理 最 控制 值原 3.2 连续时变系统极小值原理
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
30
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
31
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
32
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
21
最优控制——极小值原理 最 控制 值原 3.2 连续时变系统极小值原理
H (t ) x
能源与动力学院系统控制与仿真研究室
22
最优控制——极小值原理 最 控制 值原 3.2 连续时变系统极小值原理
能源与动力学院系统控制与仿真研究室
23
最优控制——极小值原理 最 控制 值原 3.2 连续时变系统极小值原理
能源与动力学院系统控制与仿真研究室
24
最优控制——极小值原理 3.3 离散系统极小值原理
离离散系系统极小小值原原理
能源与动力学院系统控制与仿真研究室 25
最优控制——极小值原理 3.4 极小值原理的典型应用
线性定常系统时间最优控制问题的提法
能源与动力学院系统控制与仿真研究室
26
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
13
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
14
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
15
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理