现代控制理论变分法在最优控制中的应用

合集下载

最优控制现代控制理论教学PPT课件

第7章第3页
7.1.1宇宙飞船登月软着陆的实例
实例1：宇宙飞船若实现在月球表面实现软着陆，即登月舱到达月球表面时的速度为
零，要寻求登月舱发动机推力的最优变化率，使燃料消耗最少，以便在完成登月考察任务后，登月舱有足够燃料离开月球与母舱会合，从而返回地球。
m(t) h(t) v(t)
u(t) g
M F h0 v0
如果泛函的变分存在，则
J ( x, x) J ( x x)
2021年4月30日
0
第7章第15页
求证如果泛函的变分存在，则
J ( x, x) J ( x x)
0
证明根据泛函变分的定义
J J (x0 x) J (x0 ) L(x0, x) r(x0, x)
由于 L( x0, x) 时关于 x 的连续线性泛函，故
J (C1x1(t) C2 x2 (t)) C1J ( x1(t)) C2J ( x2 (t)) ，且其增量可以表示为
J J ( x(t) x(t)) J ( x(t)) L( x(t), x(t)) r( x(t), x(t))
2021年4月30日
第7章第14页
其中，第一项是 x(t) 的连续线性泛函，第二项是关于 x(t) 的高阶无穷小，则称上式第
变分 x 表示U 中点 x(t) 与 x0 (t) 之间的差。由于 x 存在，必然引起泛函数值的变化，
并以 J (x x) 表示。其中为参变数，其值 0 1。当 1时，得增加后的泛函值
J ( x x) ；当 0 时，得泛函原来的值 J (x) 。
若泛函 J ( x(t)) 对于任何常数 C1 ， C2 及任何 x1(t) U ， x2 (t) U ，都有

现代控制理论最优控制

所以它的导数在 = 时应为零，即

[∗ + ]቟
=

=
由变分引理

[∗

+ ]ቕ
=
= ∗
=
得证
《现代控制理论》MOOC课程
6.2.2 无约束条件的变分问题(1)
6.2.2 无约束条件的变分问题
引理：如果函数() 在区间 ∈ [ , ]上是连Βιβλιοθήκη 的，而且对于只满足某些一般条件的任意

[ + ]቟

=
+ ]ቕ
=
∆ +
= lim
ቤ
∆→
∆
=
+ −
= lim
→

′

1
1 2

቟
= lim { ඐ +

+}
2
→
2
− ∗
<
则称泛函在∗ 处是连续的。
其中， , ∗ 表示在函数空间中与∗ 之间的距离:

泛函的变分
, ∗ = max − ∗
≤≤
泛函增量∆ 的线性主部称为泛函的一阶变分，简称泛函的变分，记作

选定的函数()有‫)()( ׬‬

= , 则在区间 ∈ [ , ]上有： () ≡
一欧拉方程
讨论一个固定端点时间，固定端点状态的无约束条件变分问题。
问题: 考虑泛函为

ሶ
= න [ , (),
]

ሶ
式中在 ∈ [ , ]上连续， [ , (),

现代控制理论 6 最优控制

（11）
对（11）式中的第三项进行分部积分，得
T J [ x ( t )] H ( x , u , λ , t ) d t λ ( t ) x λ ( t ) x d t f t T t f t 0
0

t f
t f
t 0
（12）
当泛函J 取极值时，其一次变分等于零。即

T
将上式改写成
T T t H H f δ J λ ( t ) δ x ( t ) λ δ x δ u d t 0 f f t x ( t ) x u 0 f （13）
0
tf
( x ,x , t ) 及 x ( t ) 在 [ t 0 , t f ] 上连续可微， t 0 和 t f 给定，其中， L
(t0) x x (tf ) xf ，x(t)Rn ，则极值轨线 x * ( t ) 满足如下欧已知 x 0，拉方程
L d L 0 x dt x
J [ x ( t t ( x , u , t ) d t f), f] L
t f t 0
(x ,u ,t) 是 x 、u 和t 的连续函数最优。其中 L
最优控制问题就是求解一类带有约束条件的条件泛函极值问题。
补充：泛函与变分法
一、泛函与变分
1、泛函的基本定义：如果对于某个函数集合 x(t)中的每一个函数 x (t )，变量J 都有一个值与之对应，则称变量J 为依赖于函数 x (t ) 的泛函，记作 Jx ( t) 可见，泛函为标量，可以理解为“函数的函数” 例如：
由于 δ u 是任意的变分，根据变分法中的辅助引理，由（16）式得（17）（14）式称为伴随方程， λ (t )为伴随变量，（17）式为控制方程。

哈工大现代控制理论基础第十一章最优控制

11.1.1 最优控制问题的两个例子
[例1] 飞船的月球软着陆问题。如图所示，飞船靠其发动机产生一个与月球重力方向相反的推力，使得飞船到月球表面时速度为零，即实现软着陆。要求设计推力函数，使得发动机燃料消耗最少。
月球
[解]
设飞船的质量为，其高度和垂直速度分别为和，月球的重力加速度为常数，飞船的自身质量及所带燃料分别为和。
其中，目标集可表示为性能指标可表示为其中和为连续可导的标量函数。
11.2 应用变分法求解无约束条件的最优控制问题
11.2.1 泛函与变分
一. 泛函与泛函算子
所谓泛函，简单地说就是函数的函数，定义如下：
设
为给定的某类函数，如果对于这类函数中的
每一个函数，有某个数与之相对应，则称为这类
哈工大现代控制理论基础第十一章最优控制
2020年4月24日星期五
11.1 最优控制问题的一般提法
最优控制研究的主要问题：根据已建立的被控对象的数学模型，选择一个容许控制律，使得被控对象按照预定的规律运动，并使某一个性能指标达到最大或最小。
从数学的观点来看，最优控制问题是求解一类带有约束条件的泛函极值问题，属于变分学范畴。
经典的变分法只能解决控制无约束的问题，即容许控制属于开集的一类最优控制问题。然而，工程中的控制常常是有约束的，即容许控制是属于闭集的。为了解决这个问题， 20世纪50年代，美国学者贝尔曼和苏联科学院院士庞德里亚金分别独立地拓展了经典变分法，分别给出了动态规划方法和极大值原理。它们构成了最优控制的理论基础。
证明略
泛函变分的规则泛函的变分是一种线性映射，满足下列性质：
1 2 3 4

现代控制理论 7-2 变分法求泛函极值问题

应用变分法求解最优控制问题()t x x =()[]t J J x =泛函的变分dt xdt 定理10-1返回例2：求泛函的变分tfδJ =∂ J [x + εδx] |ε =0 ∂ε& J = ∫ L[x (t ), x (t ), t ]dtt0解：δJ = ∂ ∂ε=∫tf t0& & ∫ L[x + εδx, x(t ) + εδx, t ]dt |εtf t0=0前页∂ & & L[x + εδx, x(t ) + εδx, t ]dt |ε =0 ∂ε返回t f ⎡ ∂L ∂L ⎤ & = ∫ ⎢ δx + δx ⎥ dt t0 & ∂x ⎦ ⎣ ∂x泛函的极值设 J [x(t)]：Rn→R 是线性赋范空间 Rn 上的连续泛函，对于与x0(t) 接近的宗量x(t) ，泛函J [x(t)] 的增量：ΔJ = J [x(t )] − J [x 0 (t )] ≥ 0或者ΔJ = J [x(t )] − J [x 0 (t )] ≤ 0则称泛函 J [x(t)]在x0(t)处达到极小值（或极大值）11泛函极值的必要条件定理10-2 定理10-2设 J [x(t)]：Rn→R 是线性赋范空间 Rn 上的连续可微泛函，且在x0(t)处达到极值，则泛函J [x(t)]在x0(t)处的变分为零：返回δJ [x 0 , δx] = 0返回变分预备定理设g(t) 是[t0, tf]上连续的n 维向量函数，h(t)是任意的n 维连续向量函数，且 h(t0) = h(tf) = 0。

若满足：∫tft0g T (t )h(t )dt = 0∀t ∈ t0 , t f则必有： g (t ) ≡ 0[]12二、欧拉方程、横截条件二、欧拉方程、横截条件返回1，无等式约束泛函极值的必要条件2，有等式约束泛函极值的必要条件返回最速降线问题确立一条连结定点A和B的曲线，使质点m 在重力作用下从A 滑动到B 所需的时间最短 (忽略摩擦和阻力)。

华中科技大学现代控制理论-7.2 变分法共66页文档

有不等式约束条件的多元函数极值(2/7)
有不等式约束条件的函数极值问题的求解比等式约束条件的函数极值问题复杂。 ➢ 受前面讨论的引入拉格朗日乘子的启发,求解不等式约束的函数极值问题也引入了乘子的概念,其求解基本方法可由如下库恩-塔哈克(Kuhn-Tucker)定理给出。
有不等式约束条件的多元函数极值(3/7)—定理7-1
5
0
解先定义库恩-塔哈克函数如下
L ( x ,y ,1 ,2 ) x 2 2 y 2 1 ( y 2 ) 2 ( y 2 x 5 )
有不等式约束条件的多元函数极值(5/7)
➢ 根据库恩-塔哈克定理,极小值的必要条件如下:
L x
df(x) 0
dx xx*
d2f(x)
dxdx
0
xx*
是x*为该多元函数极值问题的解的一个充分条件。
有等式约束条件的多元函数极值(1/5)
2. 有等式约束条件的多元函数极值
有等式约束条件的多元函数极值问题可描述为
m in f ( x) x
s.t. g ( x ) 0
式中,g(x)为p维的向量变量x的向量函数,并假定其连续可微; ➢ g(x)=0即为等式约束条件。
有不等式约束条件的多元函数极值(1/7)
3. 有不等式约束条件的多元函数极值
有不等式约束条件的多元函数极值问题可描述为
m in f ( x) x
s.t. g ( x ) 0
式中,g(x)为p维的向量变量x的向量函数,并假定其连续可微; ➢ 式g(x)=0即为不等式约束,
✓ 符号“”的意思为函数向量g(x)中每个元素“小于等于0”。
x
➢ 当(A+A)可逆时
x A A 1b H λ

最优控制的基本理论及应用

前苏联学者庞特里亚金等则在1956～1958年间创立了极小值原理, 也发展了经典变分原理,成为处理控制有闭集约束的变分问题的强有力工具。
本章在介绍解决最优控制问题3种基本方法(变分法、极小值原理和动态规划)的基础上，阐述两类典型最优反馈系统的设计,即线性二次型最优控制和最小时间控制。
6.2 最优控制问题的提出及数学描述
6.3.2 用变分法求解无约束条件的泛函极值问题
设积分型性能泛函为
Jtt0f L[x(tx)(,t)]d,tt
(6-24)
在区间[t0 ,t f ]上，被积函数 L[x(t),x(t),t]二次连续可微，轨线x(t)有连续的二阶导数，x(t)Rn ,对x(t)没有任何约束。要求确定极值轨迹 x *(t) ，使泛函J为极值。
级数 ,则
J()tt0f L x Tη(t) L x Tη (t)R dt
(6-29)
式中,R表示泰勒（Taylor）级数展开式中的高阶项。
如果定义x(t)和 x (t) 的一阶变分为 δ x εη (t),δ x εη (t)
由泛函变分的定义，泛函的一阶变分为
(6-30)
6.2.2 最优控制问题的数学描述
构成最优控制问题必须具备以下几个基本条件：
1.被控系统的数学模型，即动态系统的状态方程
状态方程在最优控制中为等式约束条件。
2.控制变量的约束条件(容许控制)
任何实际物理系统，控制变量总是受约束的，一
般可写成
u(t)U
(6-3)
式中,U表示一个封闭的点集合，称为控制域。此时称 u(t)为容许控制。
1)积分型性能泛函
Jtt0f Lx((t)u,(t),dtt)
2)终值型性能泛函
J[x(tf ),tf]

现代控制理论第6章最优控制(校内讲稿)1

2）终端型性能指标（梅耶问题）
J x( t f )或J x( N )
3）综合型性能指标（鲍尔扎问题）
J x ( t f ) Lx t ,ut ,t dt
终端指标

t
f
或J x( N )
N 1 k k 0
t0
L [ x( k ),u( k ),k ]
2.拉格朗日乘子法设目标函数：
n维
x( tk 1 ) f [ x( tk ),u( tk ),tk ] n N倍
N 1 L k 0
J x( N ) 约束条件为：
x( k ), u( k ), k
( k 0 ,1, N 1 )
f [ x( k ), u( k ), k ] x( k 1 ) 0
6.9
Bang-Bang控制
总目录章目录返回
上一页下一页
教学要求： 1. 学习泛函变分法，理解最优控制的一般概念 2. 掌握利用变分法求最优控制方法 3.掌握状态调节器，极小值原理
重点内容： •最优控制的一般问题及类型，泛函与变分，欧拉方程，横截条件。 •变分法求有约束和无约束的最优控制。 •连续系统的极小值原理。 •有限和无限时间状态调节器方法，Riccati方程求解。
爬山法梯度法
总目录章目录返回
上一页下一页
6.3 静态最优化问题的解
6.3.1 一元函数的极值
设： f ( u ) a , b 上的单值连续可微函数 J 则1) u为极小值点的充要条件
f ( u ) |u u 0
f ( u ) |u u 0
f ( u ) |u u 0
H f ( g )T 0 x x x H f ( g )T 0 u u u H g ( x ,u )0

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(7-3)
xt xt x* t t
xf
x0
x* t
t0
tf
tห้องสมุดไป่ตู้
这里，是一个小参变量，但不是时间函数。 t 是时间函数。
且满足
t0 t f 0
(7-4)
即在x* t 的邻区的所有x t 均应满足边界条件
x t0 x* t0 x0
(7-5)
x t f x* t f xf
tt0f
g
F
x*，x&*，t
x&
dt
F x*，x&*，t
x&
tf t0
tt0f
d dt
F
x*，x&*，t
dt
x&
代入式(7-11)则得：
dJ
d
tf t0
F
x*，x&*，t x
(7-10)
为此，我们采用复合求导的方法，将J x在 0处对求
导
dJ
d
| 0
tf
F
g
x*，x&*，t
g
F
x*，x&*，t
dt
t0
x
x&
(7-11)
对于积分号内第二项的变换，利用分步积分的方法：
tt0f
u&vdt
uv
tf t0
tt0f
uv&dt
这样，积分号内第二项作分部积分后可得：
2.可动边界的极值
t0 ,t f 给定，x t0 固定或自由 x t f 自由
3.终端时刻自由的极值
t0 给定， x t0 固定， t f , x t f 自由
一、固定边界的极值问题已知条件：
假定x t 为一维变量，在t t0，t f 区间上二次可
导，并设起始及终端时刻 t0、t f 均给定，且
⑴ 最短时间问题：
J t f t0
t f dt
t0
F xt ，ut ，t 1
拦截导弹最短时间控制
⑵ 最小燃料消耗问题：控制量u(t)与燃料消耗量成正比。
J tf u t dt t0
F xt ，u t ，t u t
导弹最小燃料控制
⑶ 最小能量控制问题：考虑与消耗功率成正比。
J tf u2 t dt t0
⑵ 终值型性能指标:
J x t f ，t f
卫星的指向控制
在变分法中称为迈耶尔问题。它只要求状态在过程终端时满足一定要求，但在整个动态过程中对状态及控制的演变不作要求。
⑶ 复合型性能指标：
J x
tf
，t f
tf t0
F
x t
，u t
，t dt
卫星的指向和稳定控制
在变分法中称为波尔札问题。它要求状态在过程终端时满足一定要求，而且状态向量及控制向量在整个动态过程中都应满足一定要求。
• 最优控制问题的提法 • 性能指标的分类
xt0 x0
一、最优控制问题的提法
设动态系统的状态方程：
x&t f xt ，ut ，t
初始状态：目标集：
xt0 x0
xtf S
控制域：
utU Rm
性能指标：
J x
tf
，t f
tf t0
F
x t
，u t
，t dt
xt0 x0
最优控制的问题就是：从所有可供选择的容许控制中寻找
一个最优控制 u* t ，使状态x t 由x t0 经过一定时间转移
到目标集 S ，并且沿此轨线转移时，使相应的性能指标达到极值（极大或极小）。
二、性能指标的分类
能指标函数(又称价值函数、目标函数、性能泛函)，最优控制问题可归结为求性能指标的极值问题。按照实际控制性能的要求大致可以分为：
(7-6)
并当 0 时，则
xt x* t
(7-7)
对x t 求导得
•
x&t x&* t t
(7-8)
将x t 及 x&* t 的表示式代入指标函数 J x式得
J x
tf t0
F
x*
t
＋
t
，x&* t
g
t
，t
dt
(7-9)
根据性能指标极值的必要条件，应满足
dJ
d
0 0
t
xd
t
⑷、⑸两类性能指标统称为二次型性能指标，这是工程实践
中应用最广的一类性能指标。
性能指标还可以按其数学形式大致分为下列三类： ⑴ 积分型性能指标：
J
tf t0
F
xt ，ut ，t
dt
导弹稳定控制
在变分法中这类问题称为拉格朗日问题。它要求状态向量及控制向量在整个动态过程中都应满足一定要求。
xT
t
Qx
t
uT
t
Ru
t
⑸ 状态跟踪器问题：如果在过程中要求状态x(t)跟踪目
标轨线 xd t 。
弹道导弹的弹道跟踪控制
J 1 tf 2 t0
xt xd t T Q xt xd t uT t Ru t
dt
F
x
t
，u
t
，t
1 2
xt uT t
xd t T Rut
Q
x
本篇主要内容
• 变分法解最优控制 • 极小值原理 • 动态规划法 • 二次型性能指标的最优控制
第七章变分法在最优控制中的应用
主要内容： • 无约束条件的性能指标（泛函）极值问题 • 有约束条件的性能指标（泛函）极值问题 • 变分法法解最优控制问题
§7.1 无约束条件的性能指标（泛函）极值问题
F xt ，u t ，t u2 t
航天飞机最小能量控制
⑷ 线性调节器问题：
n
J
i1
x t f 2
t0 i
t dt
x t f n 2
t0 i1 i
t dt
特别要注意以下的指标形式：
导弹滚动通道调节问题
J
tf t0
1 2
xT
t Qxt
uT
t Rut dt
F
x
t
，u
t
，t
1 2
（从最简单的情况开始）设性能指标为积分型（拉格朗日问题）
J
tf t0
F
x t
，x&t
，t dt
(7-1)
t0
tf
固定或自由
xt0 xt f
固定或自由
xt
xf
A
x0
B
x* t
t0
tf
t
7.1 无约束条件的泛函极值问题
在无约束条件下，按边界条件，极值问题一般分为： 1.固定边界的极值
t0 ,t f 给定，且xt0 x0，x t f x f固定
xt0 x0，x t f xf
(7-2)
要求确定使J x 达极小的 xt 轨线。
现在我们讨论两种解法:复合求导法和变分法
1.复合求导法
设x* t 为满足以上边界条件并使J x达到极小的最优状态轨线，
如图所示。
则其邻区的状态轨迹x t 可用
下式表示：
xt x* t t
第二篇最优控制
线性系统对控制系统的设计方法：极点配置在实际工程应用中不仅仅是极点配置，常常考虑到性能指标最优的问题。
倒立摆控制点击观看
导弹轨迹控制点击观看
航天器控制点击观看
最优控制研究的问题是：对一个控制系统，在给定的性能指标要求下，如何选择控制规律，使性能指标达到最优（极值）。