(完整版)最优控制---汉密尔顿函数
合集下载
最优控制02

第四章 最优控制
概述(问题提出、抽象、分类、求解) 变分法(控制 u(t) 不受限制) 极小值原理(u(t) 受限制)
动态规划法(多级决策、最优性原理)
二次型性能指标的线性系统最优控制 (控制的实现)
极小值原理求解最优控制问题
•古典变分法求解最优控制问题:假定控制变量u(t)不受任何限制,即容 许控制集合可以看成整个m维控制空间开集,这时控制变分du可以任取。 同时还严格要求哈密尔顿函数H对u连续可微。在这种情况下,应用变分 法求解最优控制问题是行之有效的.
*T b u 某一 时间 段持 续为 0 ,则 ( 3) i i 为不确定值。
极小值原理求解最优控制问题
1、乒乓(bang-bang)原理 上面的系统如果属于平凡情况,则其最短时间控制为
u* (t ) Msign( BT * (t ))
该原理也适用于非线性系统 x A( x,t ) B( x,t )u(t ) 2、最短时间控制存在定理 设给定的线性系统为完全可控,并且系统矩阵A的特征值均具 有非正实部,控制变量满足不等式约束:u(t ) M 则最短时间控制存在!
极小值原理求解最优控制问题
3、最短时间控制存在唯一性定理 设该系统属于平凡情况,若时间最优控制存在,它必定唯一。
4、开关次数定理 设该系统属于平凡情况, u(t ) M ,并且系统阵A的特征值全部为负实数 ,
则如果最短时间控制存在,必为bang-bang控制,并且每个控制分量在两个 边界值之间的切换次数最多不超过n-1次。
K பைடு நூலகம்0
求最优控制序列,使J极小。
极小值原理求解最优控制问题
拉格朗日乘子法:
J a Q ( x ( N ), N ) F ( x, u, k ) T (k 1)[ f ( x, u, k ) x (k 1)])
概述(问题提出、抽象、分类、求解) 变分法(控制 u(t) 不受限制) 极小值原理(u(t) 受限制)
动态规划法(多级决策、最优性原理)
二次型性能指标的线性系统最优控制 (控制的实现)
极小值原理求解最优控制问题
•古典变分法求解最优控制问题:假定控制变量u(t)不受任何限制,即容 许控制集合可以看成整个m维控制空间开集,这时控制变分du可以任取。 同时还严格要求哈密尔顿函数H对u连续可微。在这种情况下,应用变分 法求解最优控制问题是行之有效的.
*T b u 某一 时间 段持 续为 0 ,则 ( 3) i i 为不确定值。
极小值原理求解最优控制问题
1、乒乓(bang-bang)原理 上面的系统如果属于平凡情况,则其最短时间控制为
u* (t ) Msign( BT * (t ))
该原理也适用于非线性系统 x A( x,t ) B( x,t )u(t ) 2、最短时间控制存在定理 设给定的线性系统为完全可控,并且系统矩阵A的特征值均具 有非正实部,控制变量满足不等式约束:u(t ) M 则最短时间控制存在!
极小值原理求解最优控制问题
3、最短时间控制存在唯一性定理 设该系统属于平凡情况,若时间最优控制存在,它必定唯一。
4、开关次数定理 设该系统属于平凡情况, u(t ) M ,并且系统阵A的特征值全部为负实数 ,
则如果最短时间控制存在,必为bang-bang控制,并且每个控制分量在两个 边界值之间的切换次数最多不超过n-1次。
K பைடு நூலகம்0
求最优控制序列,使J极小。
极小值原理求解最优控制问题
拉格朗日乘子法:
J a Q ( x ( N ), N ) F ( x, u, k ) T (k 1)[ f ( x, u, k ) x (k 1)])
最优控制

j 1,2......r
g:p ×1维函数向量
t f : 自由
dt t f t0
t0
tf
问题:寻求最优控制u*(t),使系统由初态到终态, 目标函数J 为最小
步骤: ⑴列写哈密顿函数 H x(t ), u (t ), (t ), t
应用最小值原理进行问题的求解
1 T (t ) f x(t ), t Bx(t ), t u (t ) 1 T (t ) f x(t ), t T (t ) Bx(t ), t u (t )
q:r ×1维向量函数
_
H [ X (t ), (t ), U (t )] max H [ X * (t ), (t ), u (t )]
* * u (t )
_
_
∴所以有的文献中也称为“极大值原理”。 3、H对u没有可微要求,因此应用拓宽。
4、 极小值原来是求取最优控制的必要条件,非充分条件。
即:满足极小值原理不一定J取极小值,需进一步判断。
[
g T [ X (t f , t f )] X (t f )
]
tf
g T ( ) 0 t f t f
3、与 U * (t ) 对应的哈密顿函数H取极小值。
H [ X * (t ), U * (t ), * (t ), t ] min H [ X * (t ), U (t ), * (t ), t ]
0
tf
J [U ] H
u0 u u 2
U 0 U1 0 1
U
U2
u
若采用经典变分: H 0,U * U1; 实际应为U * U 0。极小值原理。
最优控制课件第3章

第三章 极小值原理及应用
经典变分法局限性: 1、应用前提: a )控制量 u(t)的取值无约束。 b ) f、L、Φ等函数对其自变量二次连续可微,要求哈密 尔顿函数关于控制变量的偏导数存在 。 2、实际控制要求:
a )控制量u受不等式约束,如:M i (u ) 0 ,i=1,2,3……
b )性能指标有时关于u并不可微,要求哈密尔顿函数 关于控制变量的偏导数不存在 。
一般:对于实际系统根据物理意义有最优解 极小值原理 有唯一解-- 最优解
--------
--------
但是,对于线性系统可以证明极小值原理既是泛函取最小 值的必要条件,也是充分条件。
Optimal Control Theory
Dong Jie 2014. All rights reserved.
Date: File:
05.04.2015 OC_CH3.6
Optimal Control Theory & its Application
②在最优轨线上,与最优控制u*相对应的H函数取绝对极小 值,即 或 沿最优轨线
③H函数在最优轨线终点满足
Optimal Control Theory
Dong Jie 2014. All rights reserved.
Optimal Control Theory & its Application
取哈密尔顿函数为
则实现最优控制的必要条件是,最优控制u*、最优轨线x* 和最优协态矢量λ*满足下列关系式: ①沿最优轨线满足正则方程
当g中不含x时
Optimal Control Theory
Dong Jie 2014. All rights reserved.
经典变分法局限性: 1、应用前提: a )控制量 u(t)的取值无约束。 b ) f、L、Φ等函数对其自变量二次连续可微,要求哈密 尔顿函数关于控制变量的偏导数存在 。 2、实际控制要求:
a )控制量u受不等式约束,如:M i (u ) 0 ,i=1,2,3……
b )性能指标有时关于u并不可微,要求哈密尔顿函数 关于控制变量的偏导数不存在 。
一般:对于实际系统根据物理意义有最优解 极小值原理 有唯一解-- 最优解
--------
--------
但是,对于线性系统可以证明极小值原理既是泛函取最小 值的必要条件,也是充分条件。
Optimal Control Theory
Dong Jie 2014. All rights reserved.
Date: File:
05.04.2015 OC_CH3.6
Optimal Control Theory & its Application
②在最优轨线上,与最优控制u*相对应的H函数取绝对极小 值,即 或 沿最优轨线
③H函数在最优轨线终点满足
Optimal Control Theory
Dong Jie 2014. All rights reserved.
Optimal Control Theory & its Application
取哈密尔顿函数为
则实现最优控制的必要条件是,最优控制u*、最优轨线x* 和最优协态矢量λ*满足下列关系式: ①沿最优轨线满足正则方程
当g中不含x时
Optimal Control Theory
Dong Jie 2014. All rights reserved.
最优控制课程课件II-5.HJB方程

Jie, Zhang (CASIA)
Optimal Control
. . . .... .... .... . . . . .... .... .... . .
最优控制的数学理论
. .. . . ..
4 / 67
回顾:Bellman 方程 回顾:Bellman 方程
离散时间最优控制问题
问题 1 (离散时间最优控制问题)
13 / 67
Hamilton-Jacobi-Bellman 方程 HJB 方程是最优控制的必要条件
4/4 HJB 方程必要性-取极限
两边同除 ∆t,取 ∆t → 0,即可得对于 t ∈ [t0, tf ] 都有 HJB 方程
∂V −
(x(t),
t)
=
min{g(x(t),
u(t),
t)
+
∂V [
(x(t),
t)]T f (x(t),
u(t),
t)}
∂t
u(t)
∂x
令 t = tf ,得到边界条件
V (x(tf ), tf ) = h(x(tf ), tf ).
(11)
Jie, Zhang (CASIA)
Optimal Control
. . . .... .... .... . . . . .... .... .... . .
最优控制的数学理论
. .. . . ..
10 / 67
Hamilton-Jacobi-Bellman 方程 HJB 方程是最优控制的必要条件
1/4 HJB 方程必要性-最优性原理
将性能指标分成 [t, t + ∆t] 和 [t + ∆t, tf ] 两段
第十章_具有约束的最优控制问题

G ( t , y , u ) [ 的运动方程
T
]
(t )
在计划时期内的初始值和终结值是:
0 0
( 0 ) G ( , y , u ) d 0
(T ) G ( , y , u ) d k
0
上页的最优控制问题变为:T 最优控制问题: 最大化 0 F ( t , y , u ) dt
T
例2 解以下最优控制问题:
最大化 0 1 dt y yu 满足
y (0) 5 y ( T ) 11 T 自由
T
和
u ( t ) [ 1,1]
它具有一个受约束的控制变量,该控制集合可视为 两个不等式约束:
1 u (t ) 和 u (t ) 1
汉密尔顿函数: H 拉格朗日函数:
u
对于所有 t [ 0 , T ]
]
H y [ 的运动方程 ]
y
H
[ y 的运动方程
(t ) 常数
( T ) 0 [ 横截条件 ]
四、不等式积分约束 T 最优控制问题: 最大化 0 F ( t , y , u ) dt y f (t, y , u ) 满足
y H H
u
F (t, y , u ) f (t, y , u ) G (t, y , u )
[ y 的运动方程
[ 的运动方程
]
[ 的运动方程
]
[ 的运动方程
]
( T ) 0 [ 横截条件 ]
上页的最大值原理可简化为:
Max H
]
]
( T ) 0 , ( T ) k 0 , ( T )[ ( T ) k ] 0 [ 的横截条件
第十章_具有约束的最优控制问题

对于给定的 ,或者 关于( y , u ) 对所有t [ 0 , T ] 是凹 的,或者 H 0 关于 y 对于所有t [ 0 , T ] 是凹的。
如果是无限水平问题,充分性定理仍然适用,但是要 加上一个补充性条件:
T
lim ( t )[ y ( t ) y ( t )] 0
G ( t , y , u ) [ 的运动方程
T
]
(t )
在计划时期内的初始值和终结值是:
0 0
( 0 ) G ( , y , u ) d 0
(T ) G ( , y , u ) d k
0
上页的最优控制问题变为:T 最优控制问题: 最大化 0 F ( t , y , u ) dt
]
H y [ 的运动方程 ]
y
H
[ y 的运动方程
( T ) 0 [ y 的横截条件
( t ) 常数 0
和
]
k
G ( t , y , u ) dt
0
T
0
k
G ( t , y , u ) dt 0 0
T
]
(t )
在计划时期内的初始值和终结值是:
0 0
( 0 ) G ( , y , u ) d 0
(T ) G ( , y , u ) d k
0
上页的最优控制问题变为: 最优控制问题: 最大化 F ( t , y , u ) dt 0 y f (t, y , u ) 满足
(10 . 43 ) (10 . 44 ) (10 . 45 ) (10 . 47 )
【国家自然科学基金】_hamilton函数方法_基金支持热词逐年推荐_【万方软件创新助手】_20140801

推荐指数 2 2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2010年 序号 1 2 3 4 5 6 7 8 9 10 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
2012年 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52
科研热词 推荐指数 首次穿越 2 无网格法 2 hamilton正则方程 2 h-r变分原理 2 鲁棒自适应控制器 1 鲁棒控制 1 鲁棒h∞控制 1 风力机叶片 1 非线性控制系统 1 非线性控制 1 静止无功补偿器 1 随机稳定性 1 随机最优控制 1 随机微分方程 1 阻尼耦合振动 1 阀门控制器 1 辛算法 1 辛时域有限差分法(s-fdtd) 1 辛时域多分辨率 1 1 辛partitioned-runge-kutta算法(sprk) 1 跳扩散过程 1 调谐因子 1 蒸汽 1 自适应励磁控制器 1 自由阻尼 1 自伴随 1 线性三原子分子 1 稳定性 1 矩形薄板 1 瞬态响应 1 电力系统 1 状态反馈 1 灵敏度分析 1 渐近稳定 1 时滞 1 数值色散性 1 振动微分方程 1 挥舞振动 1 径向基插值函数(rpim) 1 形状记忆合金梁 1 弹簧层模型 1 弹性波模拟 1 弱粘接 1 广义耗散hamilton系统 1 广义lorenz系统 1 大挠度 1 多项式平方和 1 坐标变换 1 固有频率 1 哈密顿系统 1 同步发电机 1
最优控制(2)

则满足末态要求的最优轨线方程可表示为
取u*= -1,也可得到满足末态要求的最优轨线方程 曲线 , 组成曲线 ,称为开关曲线,表示为
开关曲线将相平面分成两部分R+和R-
则时间最优控制为
4.2.4 最小能量控制
设线性定常系统
求满足下列不等式约束的容许控制:
使系统从初始状态x0转移到x(tf)=xf,并使性能指标
由横截条件 解出
由极小值条件
由于
可得到
t=1时,u*(t)应该为 零,即不存在最优 控制
定理 对于如下时变系统、末值型性能指标、末端自由、 控制受约束的最优控制问题
式中末端时刻固定或自由,假设同前,则对于最优解 u*,x*,tf*,必存在非零的 (t ) ,使如下必要条件成立: 1) 正则方程
则对于最优解u*,x*,tf*,必存在非零的 (t ),使如下必要条 件成立: 1) 正则方程 其中
2) 边界条件与横截条件
3) 极小值条件
4) 沿最优轨线哈密尔顿函数变化率(tf自由时用)
例子:
解:已知
由协态方程 可得到
2 (t ) c2 , 1 (t ) c1e c2
t
其中
2) 边界条件与横截条件
3) 极小值条件
4) 沿最优轨线哈密尔顿函数变化率(tf自由时用)
于是该问题就变成了如下定常问题:
(16)
利用定常系统的结论,可知协态方程为
即 (17)
横截条件为
即 极小值条件为 (18)
将式(16)代入可得
即得结论3)。沿最优轨线哈密尔顿函数变化率
将(18)代入可得到本定理的结论4)。
极小,其中 tf 固定。
构造
定义开关向量函数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x2* t
9 16
t2
9 4
t
1
u*(t)和x*(t)的图像见图3。
x(t) u(t) 2
x1 *(t )
1
0
0.5
1
1.5
-2
x2*(t)
-4
-6
u*(t) -8
-10
t 2
比较上述结果可见,即使是同一个问题, 如果终端条件不同,其最优解也不同。
二、波尔札问题
设系统状态方程
xt f xt,ut,t
第五章 用变分法求解连续 最优控制问题
—有约束条件的泛函极值
上节讨论没有约束条件的泛函极值问题。但在 最优控制问题中,泛函J所依赖的函数总要受到受控 系统状态方程的约束。解决这类问题的思路是应用 拉格朗日乘子法,将这种有约束条件的泛函极值问 题转化为无约束条件的泛函极值问题。
一、拉格朗日问题
考虑系统
x0
1 1,
x2
0 0
由式(5-7)得
H
L T f
x
1 u2 2
T
0 0
1 0
x
10u
x
由欧拉方程,得
H x
d dt
H x
0 1
01 02
12
0
2101
H u
d dt
H u
u
0
112
0
u 2
H
d dt
H
0 0
1 0
x
0 1u
x
0
x1 x2
x2 u
5个未知数x1, x2, λ1, λ2, u,由5个方程联立求得通解
例如,若始端固定,终态自由时,由于δx(t0)=0, δx(tf)任意,则有
xt0 x0
(5-13)
t f 0
(5-14)
若始端和终端都固定时,δx(t0)=0,δx(tf)=0则以
xt0 x0
(5-15)
x t f x f
(5-16)
作为两个边界条件。
实际上,上述泛函极值的必要条件,亦可
u* t 3t 7
2
x1* t
1 2
t3
7 4
t
2
t
1
x
* 2
t
3 2
t2
7 2
t
1
最优控制u*(t)及最优轨线x*(t)如图2所示。
x(t) u(t) 2 1
x1*(t)
(2,2,5)
0
t
0.5
1 7/6 1.5
2
-1
-2
x2*(t)
u*(t)
-3
例2:设问题同例1。但将终端状态改为θ(2)=0, ω(2)自由,即终端条件改成部分约束、部分自 由。重求u*(t)、x*(t)。
xt f xt,ut,t
(5-1)
式中 xt Rn;ut Rr ;
f xt,ut,t ——n维连续可微的矢量函数。
设给定 t t0 ,t f ,初始状态为x(t0)=x0,
终端状态x(tf)自由。性能泛函为
J
t f
t0
Lxt,ut,td t
(5-2)
寻求最优控制u(t),将系统从初始状态x(t0)=x0 转移到终端状态x(tf),并使性能泛函J取极值。
将状态方程式(5-1)写成约束方程形式
f xt,ut,t xt 0
(5-3)
应用拉格朗日乘子法,构造增广泛函
J
t f
t0
Lxt
,
ut
,
t
T
t
f
xt
,
ut
,
t
xt
d
t
式中λ(t)——待定的n维拉格朗日乘子矢量。
定义纯量函数
Hx,u,,t Lx,u,t T f x,u,t (5-4)
称H[x,u,λ,t]为哈密尔顿函数。则
式(5-9)与式(5-10)联立称为哈密尔顿正则方程。
式(5-11)称为控制方程,
这个方程是在假设δu为任意,控制u(t)取值
不受约束条件下得到的。如果u(t)为容许控制,
受到 utU 的约束,δu变分不能任意取值,
那么,关系式 H 0不成立,这种情况留待极 u
小值原理中讨论。
式(5-12)称为横截条件。常用于补充边界条件。
d
t
xT
tf t0
使J´取极小的必要条件是,对任意的δu和δx,
都有δJ´=0成立。
因此得
H 0
x H x
H 0 u
tf 0 t0
(5-9) (5-10) (5-11) (5-12)
式(5-9)称为动态系统的伴随方程或协态方程, λ又称为伴随矢量或协态矢量。
式(5-10)即系统的状态方程。
1 C1
2 C1t C2
u C1t C2
x1
1 6
C1t
3
1 2
C
2t
2
C3t
C4
x2
1 2
C1t
2
C2t C3
4个积分常数C1, C2, C3, C4由4个边界条件
x10 1, x2 0 1, x12 0, x2 2 0
解得
C1
3, C2
7 2 ,C3
1,C4
1
因此,最优解为
初始状态x(t0)= x0,终始状态x(tf)满足
Nxt f ,t f 0
式中N——q维向量函数,n≥q。
3) 再将x*、λ*代入得 u* u~ x*, * 为所求。
例1:有系统如图1所示。欲使系统在2s内从状态
0 0
1 1
转移到
2 2
0 0
,使性能泛函
J
1 2
2 u 2 td t
0
min
,试求u(t)。
u(t)
ω(t)
θ(t)
1s
1s
x1
x2
解:系统状态方程及边界条件为
x
0 0
1 0 0x 1u
由式(5-6)写出欧拉方程直接导出。
即 H d H
x H
H
u
dt
d dt
d dt
H t f
x t0
x H
H u
0
0
0
0
HxH
H
u
tf t0
x 0 0
0
(5-17)
应用上述条件求解最优控制的步骤如下:
1) 由控制方程
H 0 u
解出 u* u~x,
2) 将u*代入正则方程解两边边值问题,求x*、λ*。
解 正则方程及控制方程与例1完全相同,只是
边界条件改成 t 0时 x10 1, x2 0 1,t 2 时 x12 0,2 2 0 ,代入例1的通解中可确定积分
常数:
9
18
C1 8 ,C2 8 ,C3 1,C4 1
于是得
u* t 6t 12
x1* t
3 16
t3
9 8
t2
t
1
t0
t0
t0
将上式代入式(5-5),得
J t f Hx,u, ,t T x d t T x t f (5-8)
t0
t0
设u(t)和x(t)相对于最优控制u*(t)及最优轨线
u*(t)的变分为δu和δx,计算由δu和δx引起的
J´的变分为:
J
tf t0
xT
H x
uT
H u
J tf Hx,u,,t T x d t t0
(5-5)
或 J tf H x, x,u, ,td t t0
(5-6)
式中
Hx, x,u,,t Lxt,ut,t T tf xt,ut,t xt
(5-7)
对式(5-5)右边第二项作分部积分,得
t f T x d t t f T x d t T x t f