最优控制极小值原理

合集下载

最优控制极小值原理

最优控制极小值原理

④在最优轨线末端哈密顿函数应满足
H
[
x*
(t
* f
),
(t*f
),
u*
(t*f
),
t
* f
]
[
x*
(t
* f
t f
),
t*f
]
⑤沿最优轨线哈密顿函数变化率
H[x*(t),(t),u*(t),t] H[x*(t f ),(t f ),u*(t f ),t f ]
tf t
H(x,,u, )d
定理3-2与定理3-1的区别:P61
当 t f自由时
H (x*(tt*f ),u*(tt*f ), (tt*f )) 0
第三章 极小值原理及其应用 3.1 连续系统的极小值原理
最小值原理只是最优控制所满足的必要条件。 但对于线性系统
x&(t) A(t)x(t) B(t)u(t)

a11(t) L
A(t)
M
O
an1(t) L
a1n (t)
g
H
x(t)
g
(t)
H
x
式中哈密顿函数 H (x, u, λ) L(x, u) λT (t)f (x, u)
② x(t) 及 (t) 满足边界条件
x(t0 ) x0
(t f ) 0
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
③哈密顿函数相对最优控制为极小值
H[x*(t), (t),u*(t)] min H[x*(t), (t),u(t)] u(t )
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
2、积分型性能指标问题
定理3-3:
min J (u) tf L[x(t),u(t)]dt

最优控制特点

最优控制特点

切换一次,设切换
2t
时间为ts,则令
0
为了求出ts,必须
首先找出状态在
1
平面上的转移轨线。
0
1
ts
tf
t
t
由 则:
设u=1,则
其中
如图(a)所示,为一组抛物线, 当K=0时经过原点[pos]
X2 s
0
t
p
若u=-1,则
X2 N
o
X1
T u=-1
为一组抛物线,如图(b),当K1=0时过原点[NOT]
j =1,2…r
u 最优控制 *(t)是使
为极小,则:
+1 -1 不定
u*(t) +1
-1
奇异
t
可见:当 当
时, 时,
有确定值,正常情况 不定, 奇异情况
我们仅研究正常情况
u*(t)写成符号函数sgn{ }形式

j =1,2…r
向量形式:u*(t)=-sgn{q*(t)}
=-sgn{
}
⑶根据规范方程:
在证明过程中:
与H得符号与这里所定义的相反。
∴所以有的文献中也称为“极大值原理”。 3、H对u没有可微要求,因此应用拓宽。 4、 极小值原来是求取最优控制的必要条件,非充分条件。 即:满足极小值原理不一定J取极小值,需进一步判断。
一般:对于实际系统
有最优解
有唯一解
最优解
三、几种边界条件得讨论:
上面所讨论的是
控制向量约束条件: 末端状态:
g:p ×1维函数向量
目标函数:
: 自由
问题:寻求最优控制u*(t),使系统由初态到终态, 目标函数J 为最小
❖ 步骤:应用最小值原理进行问题的求解

西工大最优控制课程 第五章 极小值原理及其应用-2

西工大最优控制课程 第五章 极小值原理及其应用-2
解得:
x1(t) 1 Rsin(t ) x2(t) Rcos(t )
消去t,得 ( x1 1)2 x22 R2
当 u(t) 1时, x1 x1 1
解得: x1(t) 1 Rsin(t ) x2(t) Rcos(t )
消去t,得 ( x1 1)2 x22 R2
两种情况下的相轨迹如图所示:
使系统从已知初始状态 x(t0 ) x0 转移到目标集中某
一终态x(tf)时,目标泛函取最小值,其中tf未知。
min J
u j (t ) 1
tf t0
dt
tf
t0,
j
1,2,, m
Hamilton函数
H[ x(t), u(t), (t), t] 1 T { f [ x(t), t] B[ x(t), t]u(t)}
U=-1
U=+1
• 最优轨线最后一段必为下列两条开关线之一
0 ( x1, x2 ) ( x1 1)2 x22 1, x2 0 0 ( x1, x2 ) ( x1 1)2 x22 1, x2 0
• 由于控制作用的切换时间为π,倒数第二段的开关线为
1 ( x1, x2 ) ( x1 3)2 x22 1, x2 0 1 ( x1, x2 ) ( x1 3)2 x22 1, x2 0
奇异最短时间控制系统
设在区间
t0
,
t
f
中,至少对一个分量,存在一个(或多
个)子区间 t1, t2
的 t t1 , t2 ,有
且t1
,
t2
j
t0
,
t
f
,使得对所有
n
qj (t ) bij [ x (t ), t]i (t ) 0

最优控制最小值原理

最优控制最小值原理
4
2-1 连续系统的最小值原理
问题 2-1 设系统的状态方程是
x f [x(t),u(t),t]
(2-1)
其中 f 是 n 维连续可微的向量函数;状态 x(t) Rn,其初态已
知是
x(t0 ) x0
终态应满足边界条件
(2-2)
[x(t f ),t f ] 0 其中 是 r 维连续可微的向量函数,r n;
tf t0
{L(x,
w,t)
T[
f
(x,
w,t)
x]
T[g(x,
w,t)
z2]}dt
(2-8)
的极值。
为 简 便 计 , 令
H(x,,w ,t)L(x,w ,t)Tf(x,w ,t)
(2-9)
(x,x,w,w ,z,z,,,t) H(x,,w ,t)TxT[g(x,w ,t)z2]
(2-10)
8
于 是 (2-8)式 可 写 成
J(u) [x(tf)t,f]vT[x(tf)t,f]
tt0f (x,x ,w ,w ,z,z,,,t)dt
(2-11)
现 在 求 广 义 性 能 指 标 (2-11)的 一 阶 变 分 :
JJtfJxJwJz
(2-12)
式 中 Jtf, Jx, Jw, Jz分 别 是 由 于tf , x , w和z的 微 变
tf t0
(x,x,w,w ,z,z,,,t)d
=0
分步积分
J w
t f
t0
(wT
w
w T
w )dt
wT
(t
)
w
t
t
f
t f wT t0
d dt
w
dt

教材第3章极小值原理

教材第3章极小值原理

(3—13) (3—14)
∫ δ J t f
=∂ ∂tf
⎢⎣⎡Φ + μ T N +
tf tf

tf
Ψdt
⎤ ⎥⎦
t=t f
δ
tf
=
⎡ ⎢ ⎢⎣
∂Φ ∂t f
+ ∂N T ∂t f
⎤ μ + Ψ⎥ δ t f
⎥⎦ t =t f
(3—15)
[ ] ∫ δ
Jx
=d
xT (t f
)∂ ∂x
Φ + μT N
dt
∫ δ
Jw
=
δ
wT
(t
f
)
∂Ψ ∂ w
t=t f

tf t0
δ
wT
d dt
∂Ψ ∂ w
dt
∫ δ
Jz

zT
(t f
)
∂Ψ ∂ z
t=t f

tf t0
δ
zT
d dt
∂Ψ ∂ z
dt
把式(3—15)~式(3—19)代入式(3—11)整理可得
(3—17) (3—18) (3—19)
δ J '=δ Jt f +δ Jx +δ Jw +δ Jz
x = f [x(t) , u(t) , t]
x(t) ∈ Rn
(3—44)
始端条件为
x(t0 ) = x0
终端约束为
(3—45)
N [x(t f ) , t f ] = 0 N ∈ Rm m ≤ n
控制约束为
,t f 待定
(3—46)
g[x(t) , u(t) , t] ≥ 0 u(t) ∈ Rr g ∈ Rl l ≤ r ≤ n

第八章 极小值原理

第八章 极小值原理
均自由。经过同变分法中的类似推导,最后得
Ja
x t x
f ,t tf
f
tf
T x
tf
x
tf t f
,t
f
H
x
tf
,u
tf

tf
,t f t f
tf t0
H
x,u,λ,t
x
&T
x
H
x,u,λ,t
u
T
u
H
x,u,λ,t λ
*T tbiu*i t *T tbiui t
由此可得最优控制规律为
L.S.Pontryagin
第一节 连续系统的极小值原理
设连续系统动态方程为:
x&t f xt,ut,t
(8-1)
边界条件可以固定、自由或受轨线约束,控制变量 ut 属于m维 有界闭集U,即
性能指标为:
utU Rm
(8-2)
J x
tf
,t f
tf t0
F
xt,ut,t dt
(8-3)
J x
tf
,t f
tf t0
F
xt,ut,t dt
为极小。
(8-9)
设对应于最优情况的性能指标为 J u* ,仅考虑由于 u* t 偏离 ut
时的性能指标为 J u ,则按最优的定义,下式必然成立
J u J u* J 0
设 u* t 偏离 ut 足够小 ut u* t ut
(8-10)
H x* t,u* t ,λ* t ,t c
t t0,t f
(8-31)
如果终端时刻 t f 自由,则
H x* t,u* t ,λ* t ,t 0

第七章极小值原理与典型最优控...

第七章极小值原理与典型最优控...

故极小值条件为(存在最优控制的充分条件)
Q(t), S 0, R(t) 0
31
在某些情况下,S矩阵的某些元素大到足 以引起计算上的困难,在此情况下,用 逆Riccati方程求解。

P(t)P1(t) I
(11)
P (t)P1(t) P(t)P 1(t) 0
(12)
P(T ) 0
P limP(t,0,T ) T
41
PI调节器
Min J 1

[
xT
(t
)Qx(t
)

u
T
(t
)
R
u(t
)

u
T
(t
)
Su
(t
)]dt
u(t)
2 t0
x(t) Ax(t) Bu(t)
s.t.
x(t0
)

x0
u *(t) K1x(t) K2u *(t)
Min J 1

[
xT
(t
)Q(t
)
x(t
)

u
T
(t
)
R(t
)u(t
)]dt
u(t)
2 t0
x(t) A(t)x(t) B(t)u(t)
s.t.
x(t0
)

x0
上述问题有解的条件:系统完全可控
u *(t) R1(t)BT (t)P (t)x(t)
38
P (t) P(t,0, ) limP(t,0,T ) T
如果 u 是最优控制律
对应于边界条件有
H[x(t), u(t), (t), t] H[x(t), v(t), (t), t], v

最优控制极小值

最优控制极小值
ɺ x= ∂H = f [ x, u , t ] ∂λ
∂H ∂L ∂ T =− − [λ f ] ∂x ∂x ∂x
(2·1—8) (2·l—9) (2·1—10)
ɺ λ=−
∂H =0 ∂u
(2·1—11) 方程(2·1—8)、(2·1—9)和(2·1—10)是利用哈米尔登函数法导 出的欧拉方程,分别叫做系统方程和控制方程。方程 (2·1—11)是相应的横截条件,式中n维矢量 λ (t )叫做协状态矢量 方程(2·1—8)和(2·1—9)一起叫做规范方程。
∂2H ∂u∂x δx dt ∂ 2 H δu 2 ∂u
(2·3—19)
和(n十m)×(n十m)矩阵, 即
∂2H 2 x ∂2 ∂ H ∂x∂u ∂2H ∂u∂x ∂2H ∂u 2
(2·3—20) 都是正定或半正定(负定或半负定)的。
tf
(2·1—14) υ 式中µ 和 分别是r维和q维的。根据泛函取极值的必要条件,J = 0 δ 可求出初始状态和终端状态受约束时的横截条件为
t0
∂Φ 2 ∂Mµ T + ]t =t0 λ (t0 ) = [ ∂x ∂x
M [ x(t 0 ), t 0 ] = 0
∂Φ1 ∂Nυ T λ (t f ) = [ + ]t =t f ∂x ∂x
t0 tf
(2.1—2) 、Φ 2 和L都是连续可微的纯量函数。假设端点时间 t 0 和 t f
t0
定义一个纯量函数
(2.1—4) 该函数称做哈米尔等函数。利用这个函数,方程(2·1—3)可写成
ɺ J ′ = Φ1[ x(t f ), t f ] − Φ1[ x(t0 ), t0 ] + ∫ {H [ x(t ), u (t ), t ] − λT (t ) x(t )}dt
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(t f ) 0
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
③哈密顿函数相对最优控制为极小值 H [ x* (t ), (t ), u* (t )] min H [ x* (t ), (t ), u (t )]
u ( t )
④哈密顿函数沿最优轨迹线保持为常数
当 t f 固定时 H ( x* (t ), u* (t ), (t )) H ( x* (t f ), u* (t f ), (t f )) const 当 t f 自由时
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
说明: 1)极小值原理给出的只是最优控制应该满足的必要条件。 2)极小值原理与用变分法求解最优问题相比,差别仅在于极 值条件。 3)非线性时变系统也有极小值原理。
第三章 极小值原理及其应用 3.1 连续系统的极小值原理
例 3.2 重解例 3.1
0.307
t ( 4 . 37 e 1)dt 8.68
1
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
END 谢谢
0 t 0.307
0.307 t 1
t 4 e 1 * x (t) t 4.37 e 0.5
0 t 0.307
0.307 t 1
t
1.72
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
u*
1
0 .5
1
0 0.307 1
t
6.44
u 受约束。 解:定常系统、积分型t f 固定,末端自由, 取哈密顿函数
H x u x u x1 1 u
1 1 u t 0.5 1
*
注:控制的切换点为λ(ts)=1
H 1 x
1
由协态方程 由边界条件
t

t cet 1
1 ce 1 0 c e
t e1t 1
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
ts 1 0 控制的切换时间: ts 0.307
控制的切换点处
ts e
满足下述正则方程: x (t )
H
(t )
H x
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
式中哈密顿函数
H ( x, u, ) T (t ) f ( x, u)
② x(t ) 及 (t )
满足边界条件
x(t0 ) x0
(t f )
二.自由末端的极小值原理
定理3-1:对应如下定常系统、末值型性能指标、末端自由、控制受约束 的最优控制问题 min J (u ) [ x(t f )]
u ( t )
s.t.
x(t ) f ( x, u ),
x(t0 ) x0 , t [t0 , t f ]
对于最优解和最优末端时刻、最优轨线,存在非零的n维向量函数 (t )使 ① x(t ) 及 (t )
① x(t ) 及 (t ) 满足下述正则方程:
x (t ) H
t [t0 , t f ], t f 未知
H x
(t )
式中哈密顿函数
H (x, u, λ) L( x, u) λ T (t )f (x, u)
② x(t ) 及 (t ) 满足边界条件
x(t0 ) x0
x(t f )
③哈密顿函数相对最优控制为极小值
H ( x* , u* , ) min H ( x* , u, )
u ( t )
④哈密顿函数沿最优轨迹线保持为常数 当 t f 固定时
H ( x* (t ), u* (t ), (t )) H ( x* (t f ), u* (t f ), (t f )) const
第三章 极小值原理及应用
3.1 连续系统的极小值原理 3.2 离散系统的极小值原理 3.3 时间最优控制 3.4 燃料最优控制 3.5 时间-燃料最优控制 小 结
第三章 极小值原理及其应用 3.1 连续系统的极小值原理
一.问题的提出
用变分法求解最优控制时,认
为控制向量 u(t )不受限制。但是
实际的系统,控制信号都是受到 某种限制的。u(t ) U
当控制有约束时,H / u 0
* * * 不再成立,而代之为 H ( x (t ), u (t ), (t )) H ( x (t ), u(t ), (t )) u ( t )
极小值原理的重要意义:(P51) (1)容许控制条件放宽了。 (2)最优控制使哈密顿函数取全局极小值。 (3)极小值原理不要求哈密顿函数对控制的可微性。 (4)极小值原理给出了最优控制的必要而非充分条件。

t f 自由时
H ( x* (tt*f ), u* (tt*f ), (tt*f )) 0
第三章 极小值原理及其应用 3.1 连续系统的极小值原理
最小值原理只是最优控制所满足的必要条件。 但对于线性系统
x(t ) A(t ) x(t ) B(t )u(t )

a11 (t ) A(t ) an1 (t )
H ( x* (tt*f ), u* (tt*f ), (tt*f )) 0
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
例3-2:x t x t u t x 0 5
0.5 u t 1 1 * * u 试求:J 时的 , x x t u t dt J min 0
1ts 1 1

1 * u t 0.5
0 t 0.307
0.307 t 1
0 t 0.307
代入状态方程得
xt 1 t x xt 0.5
0.307 t 1
根据边界条件继续求出:
c1et 1 xt t c2e 0.5
④在最优轨线末端哈密顿函数应满足
* * * * H [ x* (t * ), ( t ), u ( t ), t f f f f] * [ x* (t * ), t f f]
⑤沿最优轨线哈密顿函数变化率
* * * *
t f
tf
H [ x (t ), (t ), u (t ), t ] H [ x (t f ), (t f ), u (t f ), t f ]
0
12.3
0.307
1
t
x* t
5
0
0.307
1
t
最优性能指标为:
1 *
第3章 极小值原理及其应用 3.1 连续系统的极小值原理

0
J x* t u * t dt
0.307

(4e 2)dt
t 0
例3-3: 做法与前面得一样,引入两个拉格朗日乘子向量,构造广义泛函 ,在满足末端约束条件下,泛函取得极值是等价的。 3、末端受约束的情况 定理3-4:(定常系统)(P68) 定理3-5:(时变系统)(P69) 4、复合型性能指标情况 定理3-6: 表3-1,3-2(P73-74)
哈密顿函数
, ,
H x(t ) (t )( x(t ) u(t )) (1 ) x(t ) u(t )
伴随方程
(t )
H (t ) 1 x
(1) 0
由极值必要条件,知
1 0 u sign 1 0
J xdt 2e1 1
0 1

t
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
二、极小值原理的一些推广形式 1、时变问题
定义:描述最优控制问题的相关函数显含时间,称为时变问题。 解决办法:引入新状态变量,将时变问题转为定常问题,利用定理 3-1。 定理3-2: min J (u ) [ x(t f ), t f ]
a1n (t ) ann (t )
b1 (t ) B (t ) bn (t )
最小值原理也是使泛函取最小值得充分条件。
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
上述极小值原理与变分法主要区别在于条件③。
当控制无约束时,相应条件为 H / u 0 ;
定理3-2与定理3-1的区别:P61
t
H ( x, , u, ) d
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
2、积分型性能指标问题 定理3-3:
u ( t )
min J (u) L[ x(t ), u(t )]dt
t0
tf
s.t. x(t ) f ( x, u, t ), x(t0 ) x0
0 t 1

(t ) 1 e t 1 0
于是有
u (t ) 1
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
u (t )
协 态 变 量 与 控 制 变 量 的 关 系 图

(t ) x(t ) 1 x x(0) 1
x (t ) 2e 1
u ( t )
s.t. x(t ) f ( x, u, t ), x(t0 ) x0
① x(t ) 及 (t ) 满足下述正则方程:
x (t ) H
t [t0 , t f ], t f 未知
H x
(t )
T 式中哈密顿函数 H ( x, , u, t ) (t ) f ( x, u, t )
第3章 极小值原理及其应用 3.1 连续系统的极小值原理
相关文档
最新文档