第6章 用变分法求解最优控制问题

合集下载

最优控制

最优控制

J =
能观,
1 1 x ( t f ) T C T Q 0 Cx ( t f ) + 2 2
tf
[ x T C T Q 1 Cx + u T Q 2 u ] dt ∫
t0
二次型指标最优控制问题
线性系统
二次型性能指标
x = Ax + Bu y = Cx
tf
J =
1 T x (t f )Q 0 x (t f ) + 2
1 二次型性能泛函
1 1 T J = x (t f ) Q 0 x (t f ) + 2 2
半正定
tf
[ x T Q 1 x + u T Q 2 u ] dt ∫
t0
半正定
正定
误差大小的代价函数, qij大表示对应误差要求小 对控制的约束或要求. 表示在区间内消耗的能量, qij大表示对应付出的能量小. 最优控制目标是使性能指标J取得极小值, 其实质是用不大的控制来 保持比较小的误差,从而达到所用能量和误差综合最优的目的.
0 x = 1
1 x a + 2
1
y=x1
1 w( s ) = C ( sI A) B = 2 s + s a + 2 +1
281
6.4 线性二次型最优控制问题
6.4 线性二次型最优控制问题
输出调节问题
x (t ) = A (t ) x (t ) + B (t )u (t ) y ( t ) = C ( t ) x ( t ), x ( t 0 ) = x 0
q1 , q 2 > 0 , q 0 ≥ 0
u * ( t ) = Q 2 1 ( t ) B T ( t ) P ( t ) x ( t ) = q 2 1 p ( t ) x ( t )

第6章 最优控制

第6章 最优控制

1 (t ) x2 (t ) 0 x 2 (t ) u (t ) 0 x
根据边界条件:
x1(0) 1 ,x2 (0) 1 ,x1(2) 0,x2 (2) 0
可解出各待定系数为:
7 a1 3,a2 ,a 3 1,a4 1 2
解:
u a1t a2
刻 T 不固定,终端状态 x(T ) 也不固定,但又必须满足
x(T ) (T )这一约束条件时,终端条件变为横截条件,
即:
F x ) 0 F ( t T x
6.2.4 多元泛函的极值问题
设泛函为:
1, x 2 ,, x n , x1, x2 ,, xn , t )dt J F (x
T
0
) dt (1 x
2
x(t ) 2 t
x(0) 1
其中:F (1 x 2)
T
t
由欧拉方程有
x (t )
2) F (1 x
d 0 dt 1 x
x
F d F 0 x dt x
x(0) 1
x(t ) 2 t
x 1 x
边界条件为:
x1(0) 1 ,x2 (0) 1 ,x1(2) 0,x2 (2) 0
引进乘子: (t ) 1 (t ) 2 (t )T 构造一个新的函数:
1 2 1 x2 ) 2 ( x 2 u ) F F f u 1 ( x 2
* T
y ( x 3)2
求当 x 取何值时, y 有极小值。这一问题的解答结果是一个数值, y 即当 x 时, 有极小值 0。 3 在最优控制中,目标函数J是 u 的函数,而 u 又是时间t的 函数。所以和上述问题不同,最优控制的解答结果是一个函数而 不是一个数值。例如

第6章 最优控制

第6章 最优控制
解出 的表达式。
F * d F * 0 X dt X F * d F * 0 u dt u
解出 u 的表达式。
例题: 约束条件为: 初始条件为:
1 2 2 J Q (t )dt 2 0
Q(t ) u(t )
Q(0) 1 Q(0) 1 Q(2) 0,Q(2) 0 , ,
第六章 最优控制
——泛函及变分法 ——最小值原理
6.1 最优控制问题及其描述
6.1.1 最优控制问题的例子
飞船软着陆问题
宇宙飞船在月球表面上着陆时垂直速度必须为零,即软着陆。 这个问题必须靠控制发动机推力的变化来实现。问题是如何选择 一个推力方案,使燃料消耗最小。
设飞船的总质量为 m ,高度为 的重力加速度为 g ,推力为 u 。
取:x1(t ) Q(t ),x2 (t ) Q(t )
有:
x1 (t ) x2 (t ) x2 (t ) u (t )
x1 (t ) x2 (t ) 0 x2 (t ) u (t ) 0
x1 (t ) x2 (t ) f x2 (t ) u (t )
轨线1
x(t f )
t
此时终端不仅状态可变、终端的时间也是可变的。
F 0 F ( x) x t T
例题:求 x(0)=1 到直线 x(t)=2-t 的距离最短的直线:
解:目标函数为:
积分上限是可变的
x (t )
J
T
0
(1 x ) dt
T
F d F 0 x dt x
这是一个微分方程,其解中含有待定系数,通过给出的边界条件
x(t0 ) x0 , x(T ) x1

变分法与最优控制

变分法与最优控制

2.1 变分法概述
1、泛函定义
定义: 如果变量y对于某一函数类中的每一个函数 x(t),都有一个确定的值与之对应,那么就 称变量y为依赖于函数x(t)的泛函,记为: y=J [x(t)]。
说明:由于函数的值是由自变量的选取而确定的,而泛函 的值是由自变量的函数的选取而确定的,所以将泛函理解 为“函数的函数”。
点向较低的B点滑动,如果不考
虑各种阻力的影响,问应取怎样 的路径,才能使所经历的时间最 短?
结论:最速降线是一条圆滚线。
B(xf,yf)
y
在A、B两点所在的竖
直平面内选择一坐标系,
如上图所示。A点为坐 标原点,水平线为x轴, 铅垂线为y轴。
向量欧拉方程
对于向量空间的泛函,也存在着欧拉方程,不 过是欧拉方程组(即向量欧拉方程)。
若给定曲线x(t)的始端x(t0)= x0和终端x(tf)= xf,
J[x(t) ] tf L[x(t)x ,(t)t,]dt t0
达到极值的必要条件是,曲线x(t)满足欧拉方程
Lx ddtLx0 或
欧拉(Euler)方程
其中x(t)应有连续的二阶导数, L[x(t)x ,(t)t,] 则至少应是二次连续可微的。 (证明略)
2.2 无约束最优化问题
1、无约束固定端点泛函极值必要条件
问题 2-1 无约束固定终端泛函极值问题为:
其中, L[x(t),及x(tx)(,tt)]在[t0,tf]上连续可微, t0及tf固定, x(t0)= x0,x(tf)= xf, x(t)Rn
求满足上式的极值轨线x*(t)。
边界条件
定理2-5 则泛函
(证明略)
定理2-2 连续泛函J(x)的二次变分定义为
(证明略)

现代控制理论 第6章 最优控制(校内讲稿)1

现代控制理论 第6章 最优控制(校内讲稿)1

2)终端型性能指标( 梅耶问题)
J x( t f )或J x( N )
3)综合型性能指标( 鲍尔扎问题)
J x ( t f ) Lx t ,ut ,t dt
终端指标


t
f
或J x( N )
N 1 k k 0
t0
L [ x( k ),u( k ),k ]
2.拉格朗日乘子法 设目标函数:
n维
x( tk 1 ) f [ x( tk ),u( tk ),tk ] n N倍
N 1 L k 0
J x( N ) 约束条件为:
x( k ), u( k ), k
( k 0 ,1, N 1 )
f [ x( k ), u( k ), k ] x( k 1 ) 0
6.9
Bang-Bang控制
总目录 章目录 返回
上一页 下一页
教学要求: 1. 学习泛函变分法,理解最优控制的一般概念 2. 掌握利用变分法求最优控制方法 3.掌握状态调节器,极小值原理
重点内容: •最优控制的一般问题及类型,泛函与变分,欧拉 方程,横截条件。 •变分法求有约束和无约束的最优控制。 •连续系统的极小值原理。 •有限和无限时间状态调节器方法,Riccati方程求 解。
爬山法 梯度法
总目录 章目录 返回
上一页 下一页
6.3 静态最优化问题的解
6.3.1 一元函数的极值
设: f ( u ) a , b 上的单值连续可微函数 J 则1) u为极小值点的充要条件
f ( u ) |u u 0
f ( u ) |u u 0
f ( u ) |u u 0
H f ( g )T 0 x x x H f ( g )T 0 u u u H g ( x ,u )0

第6章 用变分法求解最优控制问题

第6章 用变分法求解最优控制问题

x(t) = x*(t) +εη(t) = x*(t) +δ x(t)
§6-2 泛函与变分的基本概念
3.泛函的变分 ● 泛函的增量 由自变量函数 x(t) 的变分δ x(t)引起泛函 J[ x(t)]的增量
∆J = J[ x*(t) +δ x(t)] − J[x*(t)] 为泛函 J[ x(t)] 的增量。
§6-2 泛函与变分的基本概念
一. 泛函与泛函的变分 1. 泛函的定义 对于某一类函数集合{x(t)} 中的每一个函数 x(t),均有一个确定的数 J 与之对应,则称 J 为依赖于函数 x(t) 的泛函,记作
J = J[x(⋅)] = J[x(t)]
函数值。 例泛函:
J[x(t)] 中的 x(t)应理解为某一特定函数的整体,而不是对应于 t 的
α = ∫ 2[x(t) + δ x(t)]δ x(t)dt α=0
0
1
= ∫ 2x(t)δ x(t)dt
0
1
§6-2 泛函与变分的基本概念
二. 泛函的极值 1. 泛函极值的定义 如果泛函 J[x(t)] 在 x(t) = x (t) 的邻域内,其增量
*
∆J = J[x(t) − x*(t)] = J[x(t)] − J[x*(t)] ≥ 0
∂ J[x*(t) +αδ x(t)] α=0 = 0 ∂α ∂ J[x*(t) +αδ x(t)] α=0 = δ J[x*(t)] = 0 ∂α
§6-3 无约束条件的变分问题
引理:如果函数 F(t) 在区间 [t0, t f ] 上是连续的,而且对于只满足某些 一般条件的任意选定的函数
η(t) 有
第六章 用变分法求解最优控制问题

现代控制理论最优控制(1)

现代控制理论最优控制(1)

1)泛函自变量的变分
δ x x(t ) x (t )
*
2)泛函的变分 泛函的增量:由自变量函数x(t)的变分δx(t)的泛函J[x(t)]
增量为
Δ J [x] J [x(t) δ x(t)] J [x(t)] L[x(t ), δ x(t)] o[x(t), δ x(t)]
泛函的变分:泛函J[x(t)]的增量ΔJ[x(t)]的线性主部称为 泛函的一阶变分,简称泛函变分记为δJ,即
J J [ x(t ) x(t )] 0 L[ x(t ), x(t )]
类比于函数y=f(x),其增量为 Δy= f(x+Δx)-f(x)=f’(x)dx+o(Δx) y=f(x)的微分 dy=f’(x)dx
2. 确定容许控制域
对于r维控制向量u(t),要满足客观约束条件
i ( x, u ) 0 j 1, 2,, m mr 把u {u (t ) i ( x, u ) 0}称为控制域
满足u (t ) u的u (t )称为容许控制
3.确定始端与终端条件 若系统的初始时刻t0确定,则:
3) 泛函的极值
若泛函J[x(t)]在曲线x(t)= x*(t)上达到极值,则有
J J [ x(t ) x(t )] 0 0

ΔJ=J[x(t)]-J[x*(t)] ≥0
则称泛函J[x(t)]在曲线x*(t)上达到极小值;若
ΔJ=J[x(t)]-J[x*(t)] ≤0
3)综合型性能指标( 波尔扎型)
J x t , u t , t dt x(t f ), t f t 0 L 或J x(k f ), k f L[ x (k ), u ( k ), k ]

变分法求解最优控制

变分法求解最优控制
控制的最优化性能指标:
J (u(t )) (t f , x(t f )) F (t, x(t ), u(t ))dt
t0 tf
性能指标J(u(t))在数学上称为泛函,在控 制系统中称为损失函数。
变分法基本概念
1.泛函
设S 为一函数集合,若对于每一个函数 x(t)∈S有一个实数J 与之对应,则称J 是 定义在S 上的泛函,记作J (x(t))。S 称为 J 的容许函数集。
t0
tf
再令 J 1 0 ,由 便得:
dt f ,x(t f ),x,u, 的任意性,
(i) x * , * 必满足正则方程: 1.状态方程
x H f (t, x, u)
2.协态方程
H x
* *
(ii)哈密顿函数 H (t, x , u, ) 作为u的函数,也 必须满足
定义一个标量函数:
H (t, x, u, ) F (t, x, u) T (t ) f (t, x, u)
称为哈密顿函数。所以新的性 能指标为
J 1 ( x, u, ) (t f , x(t f )) [ H (t, x, u, ) T x]dt
t0 tf
t0 tf
d (dt fy) [t f fF xt ,yxdx , t ) t t f F'( ) y ) ( (, ) , u dy a (
T
b( y )
] [x(t f )] x (t f )
T
T tf
[(x) H x (u) H u ( ) H ( ) x]dt (t f )x t t f (x)T dt t0 f y ( x, y)dx f [b( y), y)]b' ( y) f [a( y), y)]at'0( y)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

§6-2 泛函与变分的基本概念
3.泛函的变分 ● 泛函的增量 由自变量函数 x(t ) 的变分 x(t ) 引起泛函 J [ x(t )]的增量
J J [ x* (t ) x(t )] J [ x* (t )] 为泛函 J [ x(t )] 的增量。
f {x(t f ); g1[ x(t f )] 0, g 2 [ x(t f )] 0}
3. 容许控制 控制量受客观条件限制所能取值得范围。
U {u (t ); ( x, u ) 0} u (t ) U
§6-1 最优控制问题的一般提法
4. 性能指标 tf L[ x(t ), u (t ), t ]dt (1)积分型性能指标: J t0 反映控制过程中对系统性能的要求。
在容许控制集合 U 中,寻找控制向量 u (t ) U , t [t0 , t f ] ,使系统由 给定的初始状态出发,在 t t0 时刻转移到规定的目标集,并使性能 tf 指标: J [ x(t ), t ] L[ x(t ), u (t ), t ]dt
f f
取得极小值。

t0
1 2
若 x(t ) t 有
t x ( t ) e 若 有
§6-2 泛函与变分的基本概念
2.泛函自变量的变分 泛函 J [ x(t )] 的自变量函数 x(t ) 与标称函数 x* (t )之间的差值函数
x x(t ) x(t ) x* (t ) 称为泛函自变量的变分,记作 x(t )或 x 。 x(t ) x (t ) B 设 x (t ) 为 x(t ) 的容许曲线,即 x(t ) x (t ) x* (t ) (t ) x* (t ) 令 0 1 A 则 x* (t ) x* (t ) (t ) x (t ) t 这样: x(t ) (t ) x(t ) x* (t ) (t ) x* (t ) x(t )
u (t )
M
g
h(t )
§6-1 最优控制问题的一般提法
系统的状态方程为: dx1 (t )
初始条件为:
x2 (t ) dt dx2 (t ) u (t ) g dt m x1 (t0 ) h0,x2 (t0 ) v0
(6 1)
现在的问题是,寻找一个 u (t ) ,且满足 u(t ) C ,使物体在最短时间内由 状态 (h0 , v0 ) ,转移到 (0, 0) 。
J J [ x()] J [ x(t )]

函数值。 例泛函:
J [ x(t )] 中的 x(t )应理解为某一特定函数的整体,而不是对应于 t 的
dx(t ) J ( x (t ) t )dt 0 dt 1 5 2 J (t t )dt 0 6 2 1 e J (e 2t tet )dt 1 0 2

(2)终值型性能指标:J [ x(t f ), t f ] 反映了系统状态在终端时刻的性能。
J [ x(t f ), t f ] L[ x(t ), u (t ), t ]dt (3)复合型性能指标: t0 反映了控制过程和终端时刻对系统性能的要求。
若:[ x(t f ), t f ]、L[ x(t ), u (t ), t ] 为二次型函数,则复合型性能指 标可表示为二次型性能指标:
§6-1 最优控制问题的一般提法
问题例1:对于给定的动态系统(6-1),寻找满足约束条件 u(t ) C 的最优控制 u (t ) ,使性能指标
J dt t f t0
t0
tf
取得极小值,且满足如下约束条件:
x1 (t f ) 0 x2 (t f ) 0
§6-1 最优控制问题的一般提法
最优控制问题是在多种约束条件下寻找控制 u * (t ),使某个性能指标 J 取得极小值。由于 J 为函数 x(t )、u (t ) 的函数,即泛函。最优控制 问题可归结为求某与泛函的变分 1. 泛函的定义 对于某一类函数集合{x(t )} 中的每一个函数 x(t ),均有一个确定的数 J 与之对应,则称 J 为依赖于函数 x(t ) 的泛函,记作
二. 最优控制问题的一般提法 用数学语言描述最优控制问题,应包括以下几个方面的内容: 1. 受控系统的数学模型 用状态方程描述:x (t ) f [ x(t ), u (t ), t ]
2. 受控系统的始端和终端条件,即状态方程的边界条件 对最优控制问题始端条件通常是已知的:x(t0 ) x0 终端条件可以用一个目标集表示:

tf
1 T 1 tf T J x (t f ) Px(t f ) [ x (t )Qx (t ) u T (t ) Ru (t )]dt 2 2 t0
§6-1 最优控制问题的一般提法
最优控制问题的一般提法: 已知受控系统的状态方程
及给定的始端条件 和规定的目标集
(t ) f [ x(t ), u (t ), t ] x x(t0 ) x0 f {x(t f ); g1[ x(t f )] 0, g 2 [ x(t f )] 0}
§6-1 最优控制问题的一般提法

最优控制问题的提法就是怎样把一个最优控制问题抽象为数学问题。
一. 最优控制问题的实例
例1:最速升降问题 设有一物体M,作垂直升降运动。假定物体M内部 有一控制器,可以产生一个作用力 u (t ) 控制物体 上下运动。作用力满足约束条件 u(t ) C。 若物体在 t t0 时,离地面的高度为 h0 ,垂直 运动的速度为 v0 。寻找作用力 u (t ) ,使物体最 快地到达地面,且到达地面的速度为零。 建模:受控系统的状态方程(数学模型) (t ) v(t ) 令 x1 (t ) h(t ),x2 (t ) h
相关文档
最新文档