最优控制_第六章_极小值原理
合集下载
第六章 最优控制2012

,使J 为极小。
一、性能指标及分类 性能指标函数(又称目标函数、性能泛函),最优控制
问题可归结为求性能指标的极值问题。按照实际控制性能 常见:
⑴ 最短时间问题:
拦截导弹最短时间控制
⑵ 最小消耗问题:控制量u(t)与燃料消耗量成正比
导弹最小燃料控制
(3) 线性调节器问题:考虑在平衡位置 x=0附近的状态调节
导弹稳定控制
在变分法中这类问题称为拉格朗日问题。它要求状态向 量及控制向量在整个动态过程中都满足性能要求。
⑵ 终值型性能指标:
卫星的指向控制
在变分法中称为迈耶尔问题。只要求状态在过程终端时 满足一定要求,而对状态及控制量在整个动态过程中的演变 不作要求。
⑶ 复合型性能指标:
卫星的指向和 稳定控制
的变分是指两个函数间的差
问题:何为两个函数的差?两个函数距离接近?
K阶近似度
定义:设 是线性赋范空间 上的连续泛函,其增量可表示为
其中,
是关于 的线性连续泛函,
是关于 的高
阶无穷小。则
称为泛函 的变分。
泛函的变分等于
3、泛函变分的规则 1) 2) 3) 4)
变分的导数等于导数的变分
4、泛函的极值
寻求在
上的最优控制
或
,以将系统状
态从
转移到 x(t f ) 或 x(t f ) 的一个集合,并使性能指标
最优。其中
是 x 、u 和t 的连续函数
最优控制问题就是求解一类带有约束条件的条件泛函极值问 题。
泛函与变分法
一、泛函与变分
1、泛函的基本定义: 对于某个函数集合 中的每一个函数 ,变量J 都有一个
在变分法中称为波尔札问题。它要求状态在过程终端 时满足一定要求,而且状态向量及控制向量在整个动态过 程中都应满足一定要求。
最优控制

j 1,2......r
g:p ×1维函数向量
t f : 自由
dt t f t0
t0
tf
问题:寻求最优控制u*(t),使系统由初态到终态, 目标函数J 为最小
步骤: ⑴列写哈密顿函数 H x(t ), u (t ), (t ), t
应用最小值原理进行问题的求解
1 T (t ) f x(t ), t Bx(t ), t u (t ) 1 T (t ) f x(t ), t T (t ) Bx(t ), t u (t )
q:r ×1维向量函数
_
H [ X (t ), (t ), U (t )] max H [ X * (t ), (t ), u (t )]
* * u (t )
_
_
∴所以有的文献中也称为“极大值原理”。 3、H对u没有可微要求,因此应用拓宽。
4、 极小值原来是求取最优控制的必要条件,非充分条件。
即:满足极小值原理不一定J取极小值,需进一步判断。
[
g T [ X (t f , t f )] X (t f )
]
tf
g T ( ) 0 t f t f
3、与 U * (t ) 对应的哈密顿函数H取极小值。
H [ X * (t ), U * (t ), * (t ), t ] min H [ X * (t ), U (t ), * (t ), t ]
0
tf
J [U ] H
u0 u u 2
U 0 U1 0 1
U
U2
u
若采用经典变分: H 0,U * U1; 实际应为U * U 0。极小值原理。
现代控制理论 最优控制

所以它的导数在 = 时应为零,即
[∗ + ]
=
=
由变分引理
[∗
+ ]ቕ
=
= ∗
=
得证
《现代控制理论》MOOC课程
6.2.2 无约束条件的变分问题(1)
6.2.2 无约束条件的变分问题
引理:如果函数() 在区间 ∈ [ , ]上是连Βιβλιοθήκη 的,而且对于只满足某些一般条件的任意
[ + ]
=
+ ]ቕ
=
∆ +
= lim
ቤ
∆→
∆
=
+ −
= lim
→
′
1
1 2
= lim { ඐ +
+}
2
→
2
− ∗
<
则称泛函 在∗ 处是连续的。
其中, , ∗ 表示在函数空间中 与∗ 之间的距离:
泛函的变分
, ∗ = max − ∗
≤≤
泛函 增量∆ 的线性主部称为泛函的一阶变分,简称泛函的变分,记作
选定的函数()有)()(
= , 则在区间 ∈ [ , ]上有: () ≡
一 欧拉方程
讨论一个固定端点时间,固定端点状态的无约束条件变分问题。
问题: 考虑泛函为
ሶ
= න [ , (),
]
ሶ
式中 在 ∈ [ , ]上连续, [ , (),
[∗ + ]
=
=
由变分引理
[∗
+ ]ቕ
=
= ∗
=
得证
《现代控制理论》MOOC课程
6.2.2 无约束条件的变分问题(1)
6.2.2 无约束条件的变分问题
引理:如果函数() 在区间 ∈ [ , ]上是连Βιβλιοθήκη 的,而且对于只满足某些一般条件的任意
[ + ]
=
+ ]ቕ
=
∆ +
= lim
ቤ
∆→
∆
=
+ −
= lim
→
′
1
1 2
= lim { ඐ +
+}
2
→
2
− ∗
<
则称泛函 在∗ 处是连续的。
其中, , ∗ 表示在函数空间中 与∗ 之间的距离:
泛函的变分
, ∗ = max − ∗
≤≤
泛函 增量∆ 的线性主部称为泛函的一阶变分,简称泛函的变分,记作
选定的函数()有)()(
= , 则在区间 ∈ [ , ]上有: () ≡
一 欧拉方程
讨论一个固定端点时间,固定端点状态的无约束条件变分问题。
问题: 考虑泛函为
ሶ
= න [ , (),
]
ሶ
式中 在 ∈ [ , ]上连续, [ , (),
11讲 最优控制-极小值-总结及习题讲解

能源与动力学院系统控制与仿真研究室
16
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
17
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
极小值原理与变分法求最优控制的比较
能源与动力学院系统控制与仿真研究室
18
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
33
最优控制——极小值原理 3.4 极小值原理的典型应用
月面软着陆问题
h
v g
月球
能源与动力学院系统控制与仿真研究室
34
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
35
最优控制——极小值原理 3.4 极小值原理的典型应用
时间-燃料最优控制
能源与动力学院系统控制与仿真研究室
能源与动力学院系统控制与仿真研究室
7
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
8
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
9
最优控制——极小值原理 最 控制 值原 3.2 连续定常系统极小值原理
能源与动力学院系统控制与仿真研究室
27
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
28
最优控制——极小值原理 3.4 极小值原理的典型应用
能源与动力学院系统控制与仿真研究室
29
现代控制理论课件-第六章 极小值原理

⑴ 满足正则方程
x*
k
1
H
x*
k
,u* k ,* k 1
k
1,k
f x* k ,u* k ,k
*
k
H
x*
k
,u* k ,* xk
k
1,k
⑵ 相对于最优控制,哈密尔顿函数达极小值,即
H x* k ,u* k ,* k 1,k H x* k ,uk ,* k 1,k
⑶ 及满足以下边界条件及横截条件
x*
0
x0,*
N
x* N ,N x N
同理,对不同的边界情况,只需选取相应的边界条 件及横截条件,条件1、2不变。当控制变量不受限 制时,则条件2与控制方程
等效。
H
x*
k ,u* k ,* uk
k
1,kபைடு நூலகம்
0
§ 6.3 极小值原理解最短时间控制问题
一般情况下,非线性受控系统的最短时间控制问题的 解析解是很困难的,本节只讨论线性定常受控系统的 最短时间控制问题。
比较上述极小值原理与变分法所得的结果,可以发现 两者的差别仅在⑵。 极小值原理的严格证明很复杂,下面的证明将重于物 理概念的阐述,尽量避免烦琐的数学推导。 设系统动态方程为:
xt f xt,ut,t
边界条件为:xt0 x0 ,为简单起见,假设终端时刻 t f
及终端状态 x t f 均为自由。控制变量 ut 受有界闭集 约束,即 utU
性能指标为:
J x
tf
,t f
tf t0
F
xt,ut,t dt
则使性能指标 J 达到极小的最优控制 u* t 及最优状态 轨线 x* t 必须满足以下条件:
5 最优控制-极小值原理

* j
正常(或平凡)情况、奇异(或非平凡) 正常(或平凡)情况、奇异(或非平凡)情况
Bang-Bang控制原理 控制原理 是问题3 的时间最优控制, 设 u * ( t ) 是问题3-1的时间最优控制,
λ x* ( t ), ( t )
是相应的状态向量和协态向量,若问题是正常的, 是相应的状态向量和协态向量,若问题是正常的,则几乎所有 ),有下式成立 t ∈ t0 , t f (除去有限个开关时间),有下式成立 除去有限个开关时间),
在最优轨线末端哈密尔顿函数应满足的条件 (5)极值条件 极值条件
1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x * ( t ) , t u * ( t ) =
{1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x* ( t ) , t u * ( t )} min
u∈U
(50) ) (51) ) (52) )
或者
H ( x * , u* , λ* , t ) ≤ H [ x * , u, λ* , t ]
哈密顿函数沿最优轨线随时间的变化规律: 哈密顿函数沿最优轨线随时间的变化规律:
* * 在末值时刻 t f 是固定的情况 H (t ) = H (t f ) = const * *
3 极小值原理及其在快速控制中的应用
1 问题的提出 用变分法求解最优控制时, 用变分法求解最优控制时,认 不受限制。 为控制向量 u(t )不受限制。但是 实际的系统, 实际的系统,控制信号都是受到
u(t ) ∈ U ⊂ R r 某种限制的。 某种限制的。
因此, 因此,应用控制方程 ∂H = 0
正常(或平凡)情况、奇异(或非平凡) 正常(或平凡)情况、奇异(或非平凡)情况
Bang-Bang控制原理 控制原理 是问题3 的时间最优控制, 设 u * ( t ) 是问题3-1的时间最优控制,
λ x* ( t ), ( t )
是相应的状态向量和协态向量,若问题是正常的, 是相应的状态向量和协态向量,若问题是正常的,则几乎所有 ),有下式成立 t ∈ t0 , t f (除去有限个开关时间),有下式成立 除去有限个开关时间),
在最优轨线末端哈密尔顿函数应满足的条件 (5)极值条件 极值条件
1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x * ( t ) , t u * ( t ) =
{1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x* ( t ) , t u * ( t )} min
u∈U
(50) ) (51) ) (52) )
或者
H ( x * , u* , λ* , t ) ≤ H [ x * , u, λ* , t ]
哈密顿函数沿最优轨线随时间的变化规律: 哈密顿函数沿最优轨线随时间的变化规律:
* * 在末值时刻 t f 是固定的情况 H (t ) = H (t f ) = const * *
3 极小值原理及其在快速控制中的应用
1 问题的提出 用变分法求解最优控制时, 用变分法求解最优控制时,认 不受限制。 为控制向量 u(t )不受限制。但是 实际的系统, 实际的系统,控制信号都是受到
u(t ) ∈ U ⊂ R r 某种限制的。 某种限制的。
因此, 因此,应用控制方程 ∂H = 0
极小值原理最优控制 现代控制理论 教学PPT课件

极小值原理
2021年4月30日
第7章第1页
例 7.3.1 给定 1 阶系统
x x u , x(0) 1
求 u ,要求 u 1,并使
1
J 0 x(t)dt
取最小值。 解 使用变分法求解,取哈密顿函数
H x (x u)
则有
H x 1, (1) 0
2021年4月30日
第7章第2页
u(t)
1, 0,
t 0,1
t 1
2021年4月30日
第7章第18页
7.3.2 离散系统的极小值原理
1 离散欧拉方程与离散极小值原理的证明
当控制序列不受约束时,可以采用离散变分法求解离散系统的最优控制问题,得到离 散极值的必要条件,即离散欧拉方程。
设描述离散系统的状态差分方程为
x(k 1) f [x(k), u(k), k], k 0,1, , N 1
第7章第7页
故有
J (u) J (u)
t1[H ( x, u, )
t0
H(x, u, )]dt
T
(x
x)
t1 t0
1
这里 1 (t1 t0 ) 。
已知 t0
与
x(t0 ) 是固定的,即 ( x
x) t t0
0 ;如果 t1 与 x(t1) 也是不变的,则
(x
x) t t1
0 ;若
根据则方程 因而
式中 c1 和 c2 为待定常数。
1
H x1
1
2
2
H x2
0
1(t) c1et c2 2 (t) c2
2021年4月30日
第7章第17页
根据横截条件,得
1(1)
x1(1)
2021年4月30日
第7章第1页
例 7.3.1 给定 1 阶系统
x x u , x(0) 1
求 u ,要求 u 1,并使
1
J 0 x(t)dt
取最小值。 解 使用变分法求解,取哈密顿函数
H x (x u)
则有
H x 1, (1) 0
2021年4月30日
第7章第2页
u(t)
1, 0,
t 0,1
t 1
2021年4月30日
第7章第18页
7.3.2 离散系统的极小值原理
1 离散欧拉方程与离散极小值原理的证明
当控制序列不受约束时,可以采用离散变分法求解离散系统的最优控制问题,得到离 散极值的必要条件,即离散欧拉方程。
设描述离散系统的状态差分方程为
x(k 1) f [x(k), u(k), k], k 0,1, , N 1
第7章第7页
故有
J (u) J (u)
t1[H ( x, u, )
t0
H(x, u, )]dt
T
(x
x)
t1 t0
1
这里 1 (t1 t0 ) 。
已知 t0
与
x(t0 ) 是固定的,即 ( x
x) t t0
0 ;如果 t1 与 x(t1) 也是不变的,则
(x
x) t t1
0 ;若
根据则方程 因而
式中 c1 和 c2 为待定常数。
1
H x1
1
2
2
H x2
0
1(t) c1et c2 2 (t) c2
2021年4月30日
第7章第17页
根据横截条件,得
1(1)
x1(1)
第六章 最优控制(2) 现代控制理论

x1(t)
x10
x20t
1t2 2
消去时间变量 t , 可得相应的最优轨线方程为
x1(t)
1 2
x22
(t)
C
(6-256)
在图6-16中用实线表示。
14
由于x2(t)=x20+t随t增大, 故最优轨线行进的方向自 下而上, 如曲线上箭头所示。
15
当 u= -1 时, 状态方程的解为
x2 (t) x20 t
在R-上 在+上
在R+上 到达原点
u 1,1 u 1 u 1, 1 u 0
19
进一步, 可综合为
u 1 当(x1, x2 ) R u 1 当(x1, x2 ) R
u 0 当(x1, x2 ) 0
若将开关曲线方程写成
h (x1, x2 )
x1
1 2
x2
x2
0
则最优控制律可表示成
x2 (t) u(t)
或写成矩阵形式
x(t)
0 0
1 0
x(t)
10u(t
)
初始条件 x(t0) x0
(6-248)
终端条件 x(t f ) 0
控制约束 1 u(t) 1, (t0 t t f )
性能指标
J
t f
t0
1 dt
求 最 优 控 制 u*(t) , 把 系 统 从 初 态 转 移 到 终 态 , 使
x1(t)
x10
x20t
1 2t2Fra bibliotek相应的最优轨线方程为
x1(t)
1 2
x22
(t)
C
在图6-16中用虚线表示。由于x2(t)随t减小, 故 曲线箭头方向自上而下。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
* * * * * * * * *
*Βιβλιοθήκη TΨ x Ψ x , ,
* *
*
, w, z *T x Ψ x * , * , * , x * , w* , z * *T x * 0 ,x
即 E H x * , * , w, t H x * , * , w* , t 0
若g中不包含x,则为
(42)
H x
(43)
2) 在最优轨迹上,与最优控制u*相应的函数取
绝对极小值,即
min H x , , u, t H x , , u , t
* * * * * uU
(44)
或
H x * , * , u, t H x * , * , u * , t
Ψ Φ N T T J 1 Ψ x t f x t f t f t t f
Φ N T Ψ T T Ψ d x t f w x x t t w x f Ψ z z
Φ N T Ψ T 故 J x d x t f x x t t x f
Ψ x x
T
t t f
t f
tf
t0
Ψ d Ψ x d t (13) x d t x
Φ N T T T Ψ d x t f x x t t x x f
t t f
tf
t0
Ψ d Ψ x dt x d t x
T
注意到 d x t f x t f x t f t f
tf t0
(4)
式中,Φ和L——连续可微的矢量函数 tf——待定终端时刻。 最优控制问题就是要寻求最优容许控制u(t)在 满足上列条件下,使J为极小。
与前面讨论过的等式约束条件最优控制问题作
一比较,可知它们之间的主要差别在于:这里的控
制u(t)是属于有界闭集U,受到不等式g[x(t), x(t),t]≥0 约束。为了把这样的不等式约束问题转化为等式约 束问题,采取以下两个措施:
1) 欧拉方程
Ψ d Ψ 0 x d t x Ψ d Ψ 0 即 w d t w Ψ d Ψ 0 即 z d t z d Ψ 0 d t w d Ψ 0 d t z
(17)
(18)
(19)
2) 横截条件
Ψ Φ N T Ψ xT 0 x t f t f t t f
N xt f , t f 0
式中N——q维连续可微的矢量函数,q≤n。
(2)
控制 ut R r 受不等式约束
gxt , ut , t 0
式中g——l维连续可微的矢量函数,l≤r。
(3)
性能泛函
J Φ xt f , t f Lxt , u t , t d t
(20)
Φ N T Ψ 0 x x t t x f
(21)
Ψ w Ψ z
0
t t f
(22)
0
t t f
(23)
Ψ ,便得到 将 Ψ 代入式(17),并注意到 x
1) 欧拉方程
H g x x
的必要条件。为使最优解为极小,则还必须满足维
尔特拉斯 E 函数沿最优轨迹为非负的条件,即
E Ψ x , w , z , x, w, z Ψ x , w , z , x , w , z
* * * * * * * * *
xx
* T
Ψ w* w x
gxt , ut , t 0
在这种情况下,控制方程 H u 0 已不成立, 所以不能再用变分法来处理最优控制问题。
一、连续系统的极小值原理
设系统状态方程为
xt f xt , ut , t
(1)
初始条件为x(t0)=x0,终态x(tf)满足终端约束方程
tf t0
(39)
取哈密尔顿函数为
H Lx, u, t f x, u, t
T
(40)
则实现最优控制的必要条件是,最优控制u*、
最优轨迹x*和最优协态矢量λ*满足下列关系式:
1) 沿最优轨线满足正则方程
H x
(41)
H g T x x
恒有
Ψ Ψ 0 w z
(32)
Ψ 3) 若将 Ψ 代入 0 ,则得 w
H g T 0 w w
即
H g T u u
这表明在有不等式约束情况下,沿最优轨迹
H 0 这个条件已不成立。 u
值得指出的是,式(24)~式(30)只给出了最优解
T
t t f
t t f
tf
t0
T Ψ d Ψ T d Ψ T d Ψ w z x d t (16) x d t x d t w d t z
由于δtf、δxT(tf)、δx、δw、δz都是任意的, 于是由δJ1=0可得增广性能泛函取极值的必要条件, 是下列各关系式成立。
(47)
5) 满足边界条件
xt 0 x0
N xt f , t f 0
这就是著名的极小值原理。
(48)
下面对定理作些说明: 1) 定理的第一、第二个条件,即式(41)~式 (44),普遍适用于求解各种类型的最优控制问题, 且与边界条件形式或终端时刻自由与否无关。其
T tf t0
(10)
现在求增广性能泛函J1的一次变分
J1 J t J x J w J z
f
(11)
式中 J t f、δJx、δJw、δJz分别是由于tf、x、w、z 作微小变化所引起的J1的变分。
J t
f
t f
Φ T N t f t f Ψ d t t f t f t t f
T
(24)
d H g T d t w w
0
(25)
d T z 0 dt
(26)
2) 横截条件
Φ N T H 0 t f t f t t f
(27)
Φ N T 0 x x t t f H g T w w 0 t t f
为简便计,令
Ψ x, x, w, , , z, t H x, w, , t T x T g x, w, t z 2
(9)
于是J1可写成
J 1 Φ xt f , t f N xt f , t f Ψ x, x, w, , , z, t d t
T
Ψ * zz w
T
Ψ 0 z
(33)
Ψ Ψ Ψ 0, 0, 和 由于沿最优轨线有 w x z
z 2 g x, w, t ,所以上式可写成 并且
Ψ x , , , x, w, z Ψ x , , , x , w , z x x
H g u u
T
(45)
沿最优轨迹,有
3) H 函数在最优轨迹终点处的值决定于
Φ T N 0 H t f t f t t f
4) 协态终值满足横截条件
(46)
Φ N T t f xt f xt f t t f
(12)
Φ N T Ψ t f t f t f t t f
T J x d x t f Φ N x
T
t t f
tf
t0
T Ψ T Ψ x x dt x x
tf t0
H x, w, , t T x T g x, w, t z 2 d t (7)
的极值问题。
哈密尔顿函数为
H x, w, , t Lx, w, t f x, w, t
T
(8)
T
Ψ J w w t f w
T
t t f
tf
t0
d Ψ w dt d t w
T
(14)
Ψ J z z t f z
T
t t f
tf
t0
d Ψ z dt d t z
T
(15)
把式(12)~式(15)代入式(11),最后得
(34)
u , * u * w 以w 代入上式,便得
H x , , u, t H x , , u , t
* * * * *
(35)
上式表明,如果哈密尔顿函数H看成 ut U 的
函数,那么最优轨迹上与最优控制u*(t)相对应的
H将取绝对极小值(即最小值)。这是极小值原理的 一个重要结论。
1) 引入一个新的r维控制变量w(t),令
wt ut , wt 0 0
(5)
虽然u(t)不连续,但w(t)是连续的。若u(t)分段 连续,则u(t)是分段光滑连续系统。
*Βιβλιοθήκη TΨ x Ψ x , ,
* *
*
, w, z *T x Ψ x * , * , * , x * , w* , z * *T x * 0 ,x
即 E H x * , * , w, t H x * , * , w* , t 0
若g中不包含x,则为
(42)
H x
(43)
2) 在最优轨迹上,与最优控制u*相应的函数取
绝对极小值,即
min H x , , u, t H x , , u , t
* * * * * uU
(44)
或
H x * , * , u, t H x * , * , u * , t
Ψ Φ N T T J 1 Ψ x t f x t f t f t t f
Φ N T Ψ T T Ψ d x t f w x x t t w x f Ψ z z
Φ N T Ψ T 故 J x d x t f x x t t x f
Ψ x x
T
t t f
t f
tf
t0
Ψ d Ψ x d t (13) x d t x
Φ N T T T Ψ d x t f x x t t x x f
t t f
tf
t0
Ψ d Ψ x dt x d t x
T
注意到 d x t f x t f x t f t f
tf t0
(4)
式中,Φ和L——连续可微的矢量函数 tf——待定终端时刻。 最优控制问题就是要寻求最优容许控制u(t)在 满足上列条件下,使J为极小。
与前面讨论过的等式约束条件最优控制问题作
一比较,可知它们之间的主要差别在于:这里的控
制u(t)是属于有界闭集U,受到不等式g[x(t), x(t),t]≥0 约束。为了把这样的不等式约束问题转化为等式约 束问题,采取以下两个措施:
1) 欧拉方程
Ψ d Ψ 0 x d t x Ψ d Ψ 0 即 w d t w Ψ d Ψ 0 即 z d t z d Ψ 0 d t w d Ψ 0 d t z
(17)
(18)
(19)
2) 横截条件
Ψ Φ N T Ψ xT 0 x t f t f t t f
N xt f , t f 0
式中N——q维连续可微的矢量函数,q≤n。
(2)
控制 ut R r 受不等式约束
gxt , ut , t 0
式中g——l维连续可微的矢量函数,l≤r。
(3)
性能泛函
J Φ xt f , t f Lxt , u t , t d t
(20)
Φ N T Ψ 0 x x t t x f
(21)
Ψ w Ψ z
0
t t f
(22)
0
t t f
(23)
Ψ ,便得到 将 Ψ 代入式(17),并注意到 x
1) 欧拉方程
H g x x
的必要条件。为使最优解为极小,则还必须满足维
尔特拉斯 E 函数沿最优轨迹为非负的条件,即
E Ψ x , w , z , x, w, z Ψ x , w , z , x , w , z
* * * * * * * * *
xx
* T
Ψ w* w x
gxt , ut , t 0
在这种情况下,控制方程 H u 0 已不成立, 所以不能再用变分法来处理最优控制问题。
一、连续系统的极小值原理
设系统状态方程为
xt f xt , ut , t
(1)
初始条件为x(t0)=x0,终态x(tf)满足终端约束方程
tf t0
(39)
取哈密尔顿函数为
H Lx, u, t f x, u, t
T
(40)
则实现最优控制的必要条件是,最优控制u*、
最优轨迹x*和最优协态矢量λ*满足下列关系式:
1) 沿最优轨线满足正则方程
H x
(41)
H g T x x
恒有
Ψ Ψ 0 w z
(32)
Ψ 3) 若将 Ψ 代入 0 ,则得 w
H g T 0 w w
即
H g T u u
这表明在有不等式约束情况下,沿最优轨迹
H 0 这个条件已不成立。 u
值得指出的是,式(24)~式(30)只给出了最优解
T
t t f
t t f
tf
t0
T Ψ d Ψ T d Ψ T d Ψ w z x d t (16) x d t x d t w d t z
由于δtf、δxT(tf)、δx、δw、δz都是任意的, 于是由δJ1=0可得增广性能泛函取极值的必要条件, 是下列各关系式成立。
(47)
5) 满足边界条件
xt 0 x0
N xt f , t f 0
这就是著名的极小值原理。
(48)
下面对定理作些说明: 1) 定理的第一、第二个条件,即式(41)~式 (44),普遍适用于求解各种类型的最优控制问题, 且与边界条件形式或终端时刻自由与否无关。其
T tf t0
(10)
现在求增广性能泛函J1的一次变分
J1 J t J x J w J z
f
(11)
式中 J t f、δJx、δJw、δJz分别是由于tf、x、w、z 作微小变化所引起的J1的变分。
J t
f
t f
Φ T N t f t f Ψ d t t f t f t t f
T
(24)
d H g T d t w w
0
(25)
d T z 0 dt
(26)
2) 横截条件
Φ N T H 0 t f t f t t f
(27)
Φ N T 0 x x t t f H g T w w 0 t t f
为简便计,令
Ψ x, x, w, , , z, t H x, w, , t T x T g x, w, t z 2
(9)
于是J1可写成
J 1 Φ xt f , t f N xt f , t f Ψ x, x, w, , , z, t d t
T
Ψ * zz w
T
Ψ 0 z
(33)
Ψ Ψ Ψ 0, 0, 和 由于沿最优轨线有 w x z
z 2 g x, w, t ,所以上式可写成 并且
Ψ x , , , x, w, z Ψ x , , , x , w , z x x
H g u u
T
(45)
沿最优轨迹,有
3) H 函数在最优轨迹终点处的值决定于
Φ T N 0 H t f t f t t f
4) 协态终值满足横截条件
(46)
Φ N T t f xt f xt f t t f
(12)
Φ N T Ψ t f t f t f t t f
T J x d x t f Φ N x
T
t t f
tf
t0
T Ψ T Ψ x x dt x x
tf t0
H x, w, , t T x T g x, w, t z 2 d t (7)
的极值问题。
哈密尔顿函数为
H x, w, , t Lx, w, t f x, w, t
T
(8)
T
Ψ J w w t f w
T
t t f
tf
t0
d Ψ w dt d t w
T
(14)
Ψ J z z t f z
T
t t f
tf
t0
d Ψ z dt d t z
T
(15)
把式(12)~式(15)代入式(11),最后得
(34)
u , * u * w 以w 代入上式,便得
H x , , u, t H x , , u , t
* * * * *
(35)
上式表明,如果哈密尔顿函数H看成 ut U 的
函数,那么最优轨迹上与最优控制u*(t)相对应的
H将取绝对极小值(即最小值)。这是极小值原理的 一个重要结论。
1) 引入一个新的r维控制变量w(t),令
wt ut , wt 0 0
(5)
虽然u(t)不连续,但w(t)是连续的。若u(t)分段 连续,则u(t)是分段光滑连续系统。