最优控制第四章极小值原理及其应用.ppt

合集下载

最优控制理论课件

最优控制理论课件

8
最优控制问题
1.1 两个例子
例1.1 飞船软着陆问题
软着陆 过程开 始时刻 t 为零
h& v
v& u g m
m& K u
m 飞船的质量 h 高度 v 垂直速度 g 月球重力加速度常数 M 飞船自身质量 F 燃料的质量 K 为常数
初始状态 h(0) h0 v(0) v0 m(0)MF
f(x(t),u(t),t) 为n维向量函数
22.03.2020
现代控制理论
24
最优控制问题
1.2 问题描述
(1) 状态方程 一般形式为
x&(t) f (x(t),u(t),t)
x(t) Rn
x(t)|tt0 x0
为n维状态向量
u(t) Rr
为r 维控制向量
f(x(t),u(t),t) 为n维向量函数
求解最优控制的变分方法
泛函与函数的几何解释
22.03.2020
现代控制理论
50
求解最优控制的变分方法
泛函与函数的几何解释
宗量的变分
x(t)x(t)x(t)
22.03.2020
现代控制理论
51
求解最优控制的变分方法
泛函与函数的几何解释
宗量的变分
x(t)x(t)x(t)
泛函的增量 J ( x ( g ) ) J ( x ( g ) x ) J ( x ( g ) ) L ( x , x ) r ( x , x )
J x ( T ) ,y ( T ) ,x & ( T ) ,y & ( T ) x & ( T )
控制
(t)
22.03.2020
现代控制理论

最优控制

最优控制

j 1,2......r
g:p ×1维函数向量
t f : 自由


dt t f t0
t0
tf
问题:寻求最优控制u*(t),使系统由初态到终态, 目标函数J 为最小
步骤: ⑴列写哈密顿函数 H x(t ), u (t ), (t ), t

应用最小值原理进行问题的求解
1 T (t ) f x(t ), t Bx(t ), t u (t ) 1 T (t ) f x(t ), t T (t ) Bx(t ), t u (t )
q:r ×1维向量函数
_
H [ X (t ), (t ), U (t )] max H [ X * (t ), (t ), u (t )]
* * u (t )
_
_
∴所以有的文献中也称为“极大值原理”。 3、H对u没有可微要求,因此应用拓宽。
4、 极小值原来是求取最优控制的必要条件,非充分条件。
即:满足极小值原理不一定J取极小值,需进一步判断。
[
g T [ X (t f , t f )] X (t f )
]
tf
g T ( ) 0 t f t f
3、与 U * (t ) 对应的哈密顿函数H取极小值。
H [ X * (t ), U * (t ), * (t ), t ] min H [ X * (t ), U (t ), * (t ), t ]
0
tf
J [U ] H
u0 u u 2
U 0 U1 0 1
U
U2
u
若采用经典变分: H 0,U * U1; 实际应为U * U 0。极小值原理。

现代控制理论极小值原理

现代控制理论极小值原理

x*
0
x0,*
N
x* N ,N x N
同理,对不同的边界情况,只需选取相应的边界条件及横截条件,条件1、2不变。 当控制变量不受限制时,则条件2与控制方程
等效。
H
x* k ,u* k ,** k uk
1,k
0
第24页/共62页
第三节 极小值原理解最短时间控制问题
一般情况下,非线性受控系统的最短时间控制问题的解析解是很困难的,本节 只讨论线性定常受控系统的最短时间控制问题导弹舵面的打开时间。
比较上述极小值原理与变分法所得的结果,可以发现两者的差别仅在⑵。 极小值原理的严格证明很复杂,下面的证明将重于物理概念的阐述,尽量避免烦琐 的数学推导。 设系统动态方程为:
xt f xt,ut,t
(8-7)
边控界制条变x件量为t f :受有x界t闭0,集为约简x束0单,起即见,假设u终t端时刻 及终端状态 utU
t0
我们应用极小值原理来求解。这时哈密尔顿函数为
H x,u,t 1 T tAxt T tBut
故得正则方程为
x* t Ax* t Bu* t * t AT* t
第27页/共62页
根据极小值原理可得
1 *T t Ax* t *T tBu* t 1 *T t Ax* t *T tBut

本章介绍的极小值原理是控制变量 受限制的u情t况下求解最优控制问题的有力工
具。它是由苏联学者庞特里亚金于1956年提出的。极小值原理从变分法引伸而来, 它的结论与古典变分法的结论极为相似,但由于它能应用于控制变量 受边界限 制的情况,并不要求哈密尔顿函数H对u连续可微,因此其适用范围扩大了。
ut
L.S.Pontryagin

极小值原理最优控制 现代控制理论 教学PPT课件

极小值原理最优控制 现代控制理论 教学PPT课件
极小值原理
2021年4月30日
第7章第1页
例 7.3.1 给定 1 阶系统
x x u , x(0) 1
求 u ,要求 u 1,并使
1
J 0 x(t)dt
取最小值。 解 使用变分法求解,取哈密顿函数
H x (x u)
则有
H x 1, (1) 0
2021年4月30日
第7章第2页
u(t)
1, 0,
t 0,1
t 1
2021年4月30日
第7章第18页
7.3.2 离散系统的极小值原理
1 离散欧拉方程与离散极小值原理的证明
当控制序列不受约束时,可以采用离散变分法求解离散系统的最优控制问题,得到离 散极值的必要条件,即离散欧拉方程。
设描述离散系统的状态差分方程为
x(k 1) f [x(k), u(k), k], k 0,1, , N 1
第7章第7页
故有
J (u) J (u)
t1[H ( x, u, )
t0
H(x, u, )]dt
T
(x
x)
t1 t0
1
这里 1 (t1 t0 ) 。
已知 t0

x(t0 ) 是固定的,即 ( x
x) t t0
0 ;如果 t1 与 x(t1) 也是不变的,则
(x
x) t t1
0 ;若
根据则方程 因而
式中 c1 和 c2 为待定常数。
1
H x1
1
2
2
H x2
0
1(t) c1et c2 2 (t) c2
2021年4月30日
第7章第17页
根据横截条件,得
1(1)
x1(1)

最优控制ppt课件

最优控制ppt课件
称 J (X ) 在 XX*处有极值(极大值或极小值)。
精品课件
定理(变分预备定理):设 ( t )
是时间区间
[t0, t1]上连续的n维向量( t函) 数,
的连续n维向量函数(t,0)且(t1)0

t1
T
(t)(t)dt
,若
0
t0
是任意
则必有
(t)0,t[t0,t1]
精品课件
4.1.2 欧拉方程
LX,XrX,X
这里,LX,X 是X 的线性泛函,rX,X 是关于 X
的 高阶无穷小,则
JLX,X
称为泛函J[x]的变分。 可知泛函变分就是泛函增量 的线性主部。
精品课件
当一个泛函具有变分时,也称该泛函可微。和函 数的微分一样,泛函的变分可以利用求导的方 法来确定。
定理 设J[x]是线性赋范空间Rn上的连续泛函
返回主目录
精品课件
在动态系统最优控制问题中,性能指标是 一个泛函,性能指标最优即泛函达到极值。解决泛 函极值问题的有力工具是变分法。所以下面就来列 出变分法中的一些主要结果,大部分不加证明,但 读者可对照微分学中的结果来理解。
精品课件
4.1.1 泛函与变分
先来给出下面的一些定义。
1、泛函: 如果对某一类函数X(t)中的每一个函
(1) (L1 L2 ) L1 L2
(2) ( L1L2 ) L2 L1 L1 L2
b
b
(3) a L[ x, x, t]dt a L[ x, x, t]dt
(4) dx d x
dt dt 精品课件
举例:
可见,计算泛函的变分如同计算函数的微分一样。
精品课件
6、泛函的极值:若存在 0 ,对满足的 X X* 一切X,J(X)J(X*)具有同一符号,则

最优控制

最优控制

已知x(t0)=x0, 拉方程和横截条件
* x x(tf)=xf ,则极值曲线 (t ) 应满足如下欧
F d F ( )0 x dt x F F ( )t t f x(t f ) ( )t t0 x(t0 ) 0 x x
其中,
T (t ), t ) L(( x(t ), x(t ), , t )) g ( x(t ), x(t ), t ) f ( x(t ), x
如果t0也自由、x(t0)受约束,即沿着曲线g(t) 则应满足以下横截条件
x(t0 ) g (t0 ) x(t f ) c(t f ) * * T L L ( x , x , t ) ( g x ) 0 t 0 x * * T L L ( x , x , t ) ( c x ) 0 t f x
vdu
t0
tf
J ( )xdt x t t x x dt x
F
d F
F
tf
(4)
0
J取极值的必要条件是 J 等于零。因 x 是 任意的,要使(3-2)中第一项(积分项)为 零,必有
F d F ( )0 x dt x
4.1.1
标是一个 泛函,性能指标最优即泛函达到极值。解决泛函极 值问题的有力工具是变分法。所以下面就来列出变 分法中的一些主要结果,大部分不加证明,但读者 可对照微分学中的结果来理解。
4.1.1 泛函与变分
先来给出下面的一些定义。 1、泛函: 如果对某一类函数X (t )中的每一个函 数 X (t ),有一个实数值J 与之相对应,则称J 为依赖于 函数 X (t ) 的泛函,记为

最优控制ppt第四章

最优控制ppt第四章
第四章 极小值原理及其应用
4.1 经典变分法的局限性 4.2 连续系统的极小值原理 4.3 最短时间控制问题 4.4 最少燃料控制问题 4.5 离散系统的极小值原理 4.6 小结
4.1 经典变分法的局限性
上面我们用经典变分法解最优控制问题时,得出了 最优性的必要条件
H 0 U
在得出这个条件时,作了下面的假定:
两式相减可得这一段的 X (t)
t
X (t)
[ f (X ,U U,t) f (X ,U ,t)]dt
(4-6)
t1
可以对 X (t) 的大小作估计
X (t)
max t1 tt1
f (X ,U U,t)
f (X ,U ,t) (t t1 )
由于 是微量,所以 X (t) 也是微量,因而在精确
到一阶微量的情况下,下式成立
f (X ,U
U )
f (X ,U
U ) f
X
|X X
X
(4-7)
将式(4-7)代入(4-6),并注意到微量 X 在
微小时间间隔上的积分是高阶微量,即得
X (t) t [ f (X ,U U,t) f (X ,U ,t)]dt t1
X (t0 ) X 0
(4-2)
控制向量 U (t) Rm,并受下面的约束
U
(4-3)
末值状态必须满足的约束条件为
G X (t f ),t f 0
性能指标函数为
J X (t f ),t f TG X (t f ),t f
其中 Rn 为待定列向量。
(4-4) (4-5)
H
H
H
u*
u u* u0
u u*
u
(a)

最优控制极小值

最优控制极小值
ɺ x= ∂H = f [ x, u , t ] ∂λ
∂H ∂L ∂ T =− − [λ f ] ∂x ∂x ∂x
(2·1—8) (2·l—9) (2·1—10)
ɺ λ=−
∂H =0 ∂u
(2·1—11) 方程(2·1—8)、(2·1—9)和(2·1—10)是利用哈米尔登函数法导 出的欧拉方程,分别叫做系统方程和控制方程。方程 (2·1—11)是相应的横截条件,式中n维矢量 λ (t )叫做协状态矢量 方程(2·1—8)和(2·1—9)一起叫做规范方程。
∂2H ∂u∂x δx dt ∂ 2 H δu 2 ∂u
(2·3—19)
和(n十m)×(n十m)矩阵, 即
∂2H 2 x ∂2 ∂ H ∂x∂u ∂2H ∂u∂x ∂2H ∂u 2
(2·3—20) 都是正定或半正定(负定或半负定)的。
tf
(2·1—14) υ 式中µ 和 分别是r维和q维的。根据泛函取极值的必要条件,J = 0 δ 可求出初始状态和终端状态受约束时的横截条件为
t0
∂Φ 2 ∂Mµ T + ]t =t0 λ (t0 ) = [ ∂x ∂x
M [ x(t 0 ), t 0 ] = 0
∂Φ1 ∂Nυ T λ (t f ) = [ + ]t =t f ∂x ∂x
t0 tf
(2.1—2) 、Φ 2 和L都是连续可微的纯量函数。假设端点时间 t 0 和 t f
t0
定义一个纯量函数
(2.1—4) 该函数称做哈米尔等函数。利用这个函数,方程(2·1—3)可写成
ɺ J ′ = Φ1[ x(t f ), t f ] − Φ1[ x(t0 ), t0 ] + ∫ {H [ x(t ), u (t ), t ] − λT (t ) x(t )}dt
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
M [x(t f ), t f ] 0
M为q 维连续可微向量函数, q n
性能指标:
J [x(t f ),t f ]
t f F[x(t),u(t),t]dt
t0
最优控制问题就是要寻找最优容许控制u(t)使J为极小

(t) u(t) (t0 ) 0
Z T (t) [z1(t), z2 (t),zm (t)] 且[Z(t)]2 G[x(t),u(t),t] Z (t0 ) 0
4-1.连续时间系统的极小值原理
设系统状态方程为:
x(t) f [x(t),u(t),t]
初始条件 x(t0 ) x(0) , x Rn , u R p , Ω为有界闭集,不等式约束为
G[x(t),u(t),t] 0, G为m维连续可微的向量函数, m p
系统从x0转移到终端状态x(tf),tf未给定,终端状态x(tf)满足等式约束
拉格朗日纯量函数
(x, x, , z, , ,t) H (x, , ,t) T x T [G(x, ,t) Z 2 ]

Ja [x(t f ),t f ] vT M[x(t f ),t f ]
t f (x, x, , z, , , t)dt
t0
4
对Jα取一阶变分得
Ja
[
t
vT
则最优控制u*(t),最优轨线x*(t)和最优伴随向量λ*(t)必须满足下列条件:
(1).沿最优轨线满足正则方程:
x H
H ( G )T
x x
式中Γ是与时间t无关的拉格朗日乘子向量,其维数与G相同,若G中不包含x,则:
(2)横截条件及边界条件:
H
x
(t
f
)
[
x
M (
x
)T
v]t t
x
d dt
x
0
d dt
0
d dt
z
0
5
横截条件:
[H
t
vT
M t ]t t f *
0
[
x
( M )T v x
x ]t t f *
0
t t f *
0
z
t t f *
0
把Φ的表达式代入欧拉方程:
横截条件:
H ( G )T
x x
d dt
0
d dt
z
0
H
(t
f
*)
[
t
vT
于是,系统方程为:
x f (x, ,t) Z 2 G(x, ,t)
x(t0 ) x0 z(t0 ) 0 (t0 ) 0
终端时刻tf 未给定,终端约束 M [x(t f ), t f ] 0
要求确定最优控制 u 使性能指标
为极小
J [x(t f ),t f ]
t f F[x(t), (t),t]dt
M t ]t t f *
(t
f
*)
[
x
( M x
)T
v] t t
f
*
由欧拉方程和横截条件知,最优轨线
z
0
*
z*
0
6
以上为使性能指标Jα取极值的必要条件,为使性能指标为极小,还必须满足维尔斯 特拉斯函数沿最优轨线非负的条件,即:
E (x*, x, , z, *, *,Βιβλιοθήκη )-λ*(x*
,
x*
M t
] t tt f *
f
[ x
( )T
x
vT
M x
] t t
f
*
x(t
f
*
)
(t
f
*)
z
z(t
f
*)
t f * [( d ) x ( d )T ( d )T z]dt
t0 x dt x
dt
dt z
令 J a 0 可得增广性能指标泛函取极值的必要条件为
欧拉方程
第四章 极小值原理及其应用
用古典变分法解最优控制问题时,假定u(t)不受限制,从而得到最优控制应满足 H 0 u
实际上在工程问题中,控制变量总有一定的限制.
设控制变量被限制在某一闭集内 u
即u(t)满足 G[x(t),u(t),t] 0
满足限制条件的u(t)称为容许控制,由于δu不能是任意的, H 0 的条件已不存在 u
上式表明,沿最优轨线函数H相对最优控制u*(t)取绝对极小值,这是极小值原理的一 个重要结论.
7

0
H
(
G
)T
0
H ( G )T
u
u
上式表明,在有不等式约束的情况下,沿最优轨线 H 0 不再成立 u
8
定理:(极小值原理)
设系统的状态方程为
x(t) f [x(t),u(t),t]
控制u(t)是有第一类间断点的分段连续函数,属于p维空间中的有界闭集Ω,满足不 等式约束:
,
*
,
z*
,
*
,
*
,
t
)
(
x
)T
(
x
x*
)
(
*
)(
*)
(
z*
)(z
z* )
0
0
0
或: E (x*, x, , z, *, *, t) *T x
{(x*, x*, *, z*, *, *, t) *x*}
H (x*, *, , t) H (x*, *, *, t) 0
即: H (x*, *, u, t) H (x*, *, u*, t)
u
u
上述条件与不等式约束下的最优控制的必要条件相比较,横截条件及端点边
界条件没有改变,仅
H 0 u
这一条件不成立,而代之以与最优控制相对应的函数为绝对极小,其次是正则 方程略有改变,仅当G中不包含x时, 方程才不改变.
11
当 t0和x(t0)给定,根据tf给定或自由, x(tf)给定,自由或受约束等不同情况下所导 出的最优解必要条件列表如下:
f
[H (x, u, , t)
t
( M t
)T
v]t t f
0
x(t0 ) x0
M [x(t f ),t f ] 0
10
(3)在最优轨线x*(t)上与最优控制u*(t)相对应的H函数取绝对极小值,即
H (x*, *, u*, t) H (x*, *, u, t)
并且沿最优轨线,下式成立
H ( G )T
G[x(t),u(t),t] 0
在终端时刻tf 未知的情况下,为使状态自初态 x(t0 ) x0 转移到满足边界条件
M [x(t f ), t f ] 0的终态,并使性能指标
J [x(t f ),t f ]
t f F[x(t),u(t),t]dt
t0
达极小值.设哈密而顿函数为 H F (x,u,t) T f (x,u,t)
t0
3
引入拉格朗日乘子向量λ及Γ,写出增广性能指标泛函
J a [ x(t f ),t f ] vT M [ x(t f ),t f ]
t f {F[ x(t), (t),t]
t0
T [ f (x, , t) x] T [G( x, , t) Z 2 ]}dt
令哈密而顿函数为
H (x, , ,t) F (x, ,t) T f (x, ,t)
相关文档
最新文档