最优控制4

合集下载

最优控制理论

最优控制理论
f ( x(t ), u (t ), t )
f ( x(t ), u (t ), t ) 满足一定条件时,方程有唯一解令 Nhomakorabea
H L( x, u, t ) f ( x, u, t )
T
哈密顿函数
性能指标
J L( x, u, t )dt
t0
T

H ( x, , u , t ) (t ) x
时至今日,最优控制理论的研究无论在深度上和广度上都有了很大 的发展,例如发展了对分布参数系统、随机系统、大系统的最优控制理 论的研究等等;在生物领域、市场销售和现代医学成像与高维图像分析 等实际生活中广泛应用 。
解决最优控制问题的方法
一、古典变分法 是研究对泛函求极值的一种数学 方法。古典变分法只能用在控制 变量的取值范围不受限制的情况。 在许多实际控制问题中,控制函 数的取值常常受到封闭性的边界 限制,如方向舵只能在两个极限 值范围内转动,电动机的力矩只 能在正负的最大值范围内产生等。 因此,古典变分法对于解决许多 重要的实际最优控制问题,是无 能为力的。
t [0, t f ]
这里 A>0表示最大生产率,另外为了保证满足需求,必 须有
A r (t )
t [0, t f ]
假定每单位时间的生产成本是生产率 u(t)的函数,即 h[u(t)] 。设 b>0是单位时间储存单位商品的费用,于是, 单位时间的总成本为:
f x(t ), u(t ), t h u(t ) bx(t )

二、极大值原理
是分析力学中哈密顿方法的推广。 极大值原理的突出优点是可用于控 制变量受限制的情况,能给出问题 中最优控制所必须满足的条件。

最优控制

最优控制

四、最优控制在控制领域中的应用
模拟退火算法 1983年,Kirkpatrick与其合作者提出了模拟退火(SA)的方法,它是求解单目标 多变量最优化问题的一项Monte-Caula技术。该法是一种物理过程的人工模 拟,它基于液体结晶或金属的退火过程。液体和金属物体在加热至一定温度 后,它们所有的分子、原子在状态空间D中自由运动。随着温度的下降,这些 分子、原子逐渐停留在不同的状态。当温度降到相当低时,这些分子、原子 则重新以一定的结构排列,形成了一个全部由有序排列的原子构成的晶体结 构。模拟退火法已广泛应用于生产调度、神经网络训练、图像处理等方面。
三、最优控制的研究方法
古典变分法:古典变分法是研究泛函求极值的一种数字方法。古典变分法只能用在控制变量的取值范围不受限制的情况。在许多实际控制问题中,控制函数的取值常常 三、最优控制的研究方法
古典变分法:
古典变分法是研究泛函求极值的一种数字方法。古典变分法只能用在控制 变量的取值范围不受限制的情况。在许多实际控制问题中,控制函数的取 值常常受到封闭性的边界限制,如方向舵只能在2个极限值范围内转动,电动 机的力矩只能在正负的最大值范围内产生等。因此,古典变分法的应用范 围十分有限。
二、最优控制问题的一般性描述
实际上,终端约束规定了状态空间的一个时变或非时变的集合,此满足终 端约束的状态集合称为目标集M,并可表示为:
M {x(t f ) | x(t f ) Rn , N1[ x(t f ), t f ] 0, N2[ x(t f ), t f ] 0}
为简单起见,有时将上式称为目标集。
三、最优控制的研究方法
极小值原理:
极小值原理是对分析力学中古典变分法的推广,能用于处理由于外力源的 限制而使系统的输入(即控制)作用有约束的问题。极小值原理的突出 优点是可用于控制变量受限制的情况,能给出问题中最优控制所必须满足 的条件。如高夯、汪更生、楼红卫等人论述了多种类型的抛物型方程和 退化拟线性、半线性椭圆方程的极小值原理。

最优控制全部PPT课件

最优控制全部PPT课件

J
(x(t f ),t f)
tf t0
F(x(t),u(t),t)dt
为最小。
这就是最优控制问题。
如果问题有解,记为u*(t), t∈ [t0,tf],则u*(t)叫做最优控制(极值控制),相应的轨 线X*(t)称为最优轨线(极值轨线),而性能指标J*=J(u*(·))则称为最优性能指标。
第11页/共184页
目标质心的位置矢量和速度矢量为: xM xM
F(t)为拦截器的推力
x xL xM v xL xM
则拦截器与目标的相对运动方程为:
x v v a(t) F (t)
m(t)
m F (t) c
其中a(t)是除控制加速度外的固有相对加速度,是已知的。
初始条件为: x(t0 ) x0 v(t0 ) v0 m(t0 ) m0 终端条件为: x(t f ) 0 v(t f )任意 m(t f ) me
至于末态时刻,可以事先规定,也可以是未知的。 有时初态也没有完全给定,这时,初态集合可以类似地用初态约束来表示。
第9页/共184页
3:容许控制 在实际控制问题中,大多数控制量受客观条件的限制,只能在一定范围内取 值,这种限制通常可以用如下不等式约束来表示:
0 u(t) umax 或ui i 1,2p
给定一个线性系统,其平衡状态X(0)=0,设计的目的是保持系统处于平衡状态,即 这个系统应能从任何初始状态返回平衡状态。这种系统称为线性调节器。
线性调节器的性能指标为:
J
tf t0
n
xi 2 (t)dt
i 1
加权后的性能指标为:
J
tf t0
n
qi xi 2 (t)dt
i1
对u(t)有约束的性能指标为: J t f 1 [ X T (t)QX (t) uT (t)Ru(t)]dt

最优控制问题介绍

最优控制问题介绍

最优控制问题介绍最优控制问题是现代控制理论的核心内容之一,它研究的主要问题是如何在满足一定约束条件下,使得某一性能指标达到最优。

这类问题广泛存在于各个领域,如航天工程、经济管理、生态系统等。

通过对最优控制问题的研究,我们可以更加科学、合理地进行决策,实现资源的优化配置,提高系统的运行效率。

一、最优控制问题的基本概念最优控制问题通常可以描述为一个动态系统的优化问题。

在这个问题中,我们需要找到一个控制策略,使得系统从初始状态出发,在给定的时间内,通过控制输入,使得系统的某一性能指标达到最优。

这个性能指标可以是时间最短、能量消耗最小、误差最小等。

为了解决这个问题,我们首先需要建立系统的数学模型。

这个模型应该能够准确地描述系统的动态行为,包括状态方程、输出方程以及约束条件等。

然后,我们需要定义一个性能指标函数,这个函数描述了我们希望优化的目标。

最后,我们通过求解一个优化问题,找到使得性能指标函数达到最优的控制策略。

二、最优控制问题的分类根据系统的动态特性和性能指标函数的不同,最优控制问题可以分为多种类型。

其中,最常见的包括线性二次型最优控制问题、最小时间控制问题、最小能量控制问题等。

1. 线性二次型最优控制问题:这类问题中,系统的动态特性是线性的,性能指标函数是状态变量和控制输入的二次型函数。

这类问题在实际应用中非常广泛,因为许多实际系统都可以近似为线性系统,而二次型性能指标函数可以方便地描述许多实际优化目标。

2. 最小时间控制问题:在这类问题中,我们的目标是使得系统从初始状态到达目标状态的时间最短。

这类问题通常出现在对时间要求非常严格的场合,如火箭发射、紧急制动等。

3. 最小能量控制问题:这类问题的目标是使得系统在完成指定任务的过程中消耗的能量最小。

这类问题在能源有限的系统中尤为重要,如无人机、电动汽车等。

三、最优控制问题的求解方法求解最优控制问题的方法主要有两种:解析法和数值法。

1. 解析法:解析法是通过求解系统的动态方程和性能指标函数的极值条件,得到最优控制策略的解析表达式。

最优控制

最优控制

J =
能观,
1 1 x ( t f ) T C T Q 0 Cx ( t f ) + 2 2
tf
[ x T C T Q 1 Cx + u T Q 2 u ] dt ∫
t0
二次型指标最优控制问题
线性系统
二次型性能指标
x = Ax + Bu y = Cx
tf
J =
1 T x (t f )Q 0 x (t f ) + 2
1 二次型性能泛函
1 1 T J = x (t f ) Q 0 x (t f ) + 2 2
半正定
tf
[ x T Q 1 x + u T Q 2 u ] dt ∫
t0
半正定
正定
误差大小的代价函数, qij大表示对应误差要求小 对控制的约束或要求. 表示在区间内消耗的能量, qij大表示对应付出的能量小. 最优控制目标是使性能指标J取得极小值, 其实质是用不大的控制来 保持比较小的误差,从而达到所用能量和误差综合最优的目的.
0 x = 1
1 x a + 2
1
y=x1
1 w( s ) = C ( sI A) B = 2 s + s a + 2 +1
281
6.4 线性二次型最优控制问题
6.4 线性二次型最优控制问题
输出调节问题
x (t ) = A (t ) x (t ) + B (t )u (t ) y ( t ) = C ( t ) x ( t ), x ( t 0 ) = x 0
q1 , q 2 > 0 , q 0 ≥ 0
u * ( t ) = Q 2 1 ( t ) B T ( t ) P ( t ) x ( t ) = q 2 1 p ( t ) x ( t )

最优控制 西安交通大学课件lecture4

最优控制 西安交通大学课件lecture4


例:电动机调速 p25
高峰、吴江 11
求解(1)

转化为无约束优化问题:
(2-3)
高峰、吴江
12
求解(2)

引入Hamilton函数(标量函数)
xt , ut , t t f xt , ut , t
T
具有一些特殊性质。
必要条件的推导:p25-27
高峰、吴江
(2-88)
28
说明(1)

对于同一系统同一性能指标

状态方程 伴随方程 耦合方程
是相同的,可求出通解。
不同的端点条件和终端约束只改变解的 横截条件。
可求出特解。
高峰、吴江
29
说明(2)

进一步研究要考虑对状态和控制增加约束条件

状态有界、控制有界等 最大值原理、动态规划等

经典变分理论无法解决
必要条件推导:p33-35
19
泛函极值存在的必要条件
(2-67)
高峰、吴江
20
举例

例 2-5

p35-36
高峰、吴江
21
提纲

变分法原理回顾 连续系统最优控制问题 时间端点固定 有终端函数约束


终时不指定
内点约束 小结
高峰、吴江
22
终时不指定
必要条件推导:p36-38
高峰、吴江 23

H 0 u
不成立,因为u有约束,不能任意取
H在最优轨线上取得最小值。
高峰、吴江 30
说明(3)

最优控制问题的解一般是控制的容许集合中的某一时 间函数u*(t)。经典控制理论中,设计的目标是寻求一 个控制器结构以改善系统的整体特性。后面这种思路 是更有效的。

4微分博弈介绍

4微分博弈介绍
F源自i-Yue, Wang (CASIA)
Optimal Control
. . . .... .... .... . . . . .... .... .... . .
最优控制介绍
. .. . . ..
17 / 58
微分博弈的发展
1928 年 (On the Theory of Games of Strategy),1944 年 (Theory of games and economic behavior) 两篇著作中,John Von Neumann 和 Osker Morgenstern 创立博弈论
规范方程:∀t ∈ [t0, tf ]
状态 (state) 方程: x˙ ∗(t) = + ∂H (x∗(t), u∗(t), p∗(t), t), ∂p
协态 (costate) 方程: p˙∗(t) = − ∂H (x∗(t), u∗(t), p∗(t), t). ∂x
边界条件 (用于处理目标集):
第四讲:微分博弈介绍
最优控制介绍之四
张杰
复杂系统管理与控制国家重点实验室 中国科学院自动化研究所 计算机与控制学院 中国科学院大学
2016 年 9 月 22 日
Fei-Yue, Wang (CASIA)
Optimal Control
. . . .... .... .... . . . . .... .... .... . .
用极值原理或动态规划求解
Fei-Yue, Wang (CASIA)
Optimal Control
. . . .... .... .... . . . . .... .... .... . .
最优控制介绍
. .. . . ..

最优控制的计算方法

最优控制的计算方法
(2) 的第K步估计值 和给定的 合在一起,从 积分正则方程,求出 ,抽出n个要求的分量的终值 ,若 ,停止计算,否则进行下一步。
可得
3、将 代入协态方程,且由边界条件 从t=1倒向积分可得 这里选步长因子 。如此继续下去,直至指标函数随迭代变化很小为止。 由 ,得
图b 最优状态的求解
图a 用梯度法寻找最优控制 右图表示了控制和状态的初始值和第一次迭代值,可以看到第一次迭代 就几乎收敛到最优值, 与最优值还有差异,而且一般说来愈接近最优值收敛愈慢。
K=1时时,控制量为
所以,这个例子只要两步迭代即可得到最优解。一般说来,共轭梯度法比梯度法收敛快,但接近最优解后收敛性仍是较慢的。一个补救办法是重新启动,即找出几个共轭梯度方向 后,令 ,再重新迭代,寻找共轭梯度方向。
可以证明 ,即为最优控制。这只要证明
2、共轭梯度法
*
用共轭梯度法寻找最优控制时是沿着所谓共轭梯度向量的方向进行的。为了说明共轭梯度的意义,我们先从求函数极值问题的共轭梯度法开始,再推广到求泛函极值问题。
(1) 求函数极值的共轭梯度法
其中,
C为常数, Q为正定阵。
要求寻找X使F(X)取极值。
设F(X)是定义在Rn空间中的二次指标函数
直接法的特点是,在每一步迭代中,U(t)不一定要满足H 取极小的必要条件,而是逐步改善它,在迭代终了使它满足这个必要条件,而且,积分状态方程是从t0到tf ,积分协态方程是从tf到t0,这样就避免了去寻找缺少的协态初值(t0)的困难。常用的直接法有梯度法,二阶梯度法,共轭梯度法。
间接法的特点是,在每一步迭代中都要满足H取极小的必要条件,而且要同时积分状态方程和协态方程,两种方程的积分都从从t0到tf或从tf到t0 。常用的间接法有边界迭代法和拟线性化法。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
* j
1 u* 1 j 不定
qj 0 qj 0 qj 0 (4 9)
u *j
1
0 1
n
q* j
(砰-砰控制)
或简写为:
* u* sgn q sgn{ bij i } j j i 1
(4 10)
Байду номын сангаас
根据 q* j 是否为零,将系统分为两种情形:
第4章
双积分模型时间最优控制工程实现的闭环结构
x1


h 1
1
u 1 x2 1
1
s
s
x1
1 x2 x2 2
第4章
最短时间控制问题 小结: 通过对非线性系统的最短时间控制问题的分析,得到最优控制的 一般形式(砰-砰控制) n
* u* j sgn q j sgn{ bij i } i 1
1 (t ) 10 2 (t ) 10t 20
u* sgn(20 10t ) 1
第4章
u* (t ) sgn(2t ) sgn(20 10t ) 1
(4 25)
由式(4-25)可知,2 (t )为一直线,由于开关次数的限制,其四种可能 的开关序列为:
第4章
4.1 非线性系统的最短时间控制问题
最短时间控制问题的提法: 设受控系统状态方程为
x(t ) f [ x(t ), t ] B[ x(t ), t ]u(t )
给定终端约束条件为 x (t0 ) x0
(4 1)
[ x(t f ), t f ] 0 (4 2) 寻求m维有界闭集中的最优控制u*(t),满足不等式约束
u(t ) 1
(4 23)
使系统以最短时间从任意初态转移到终态。 先判断该系统是否平凡?
0 1 0 x(t ) x(t ) u (t ) 0 0 1
G [B
0 1 AB] 1 0
第4章
由上节重要结论可知: (1)本系统为平凡最短时间控制系统 (2)其时间最优控制存在且唯一 (3)时间最优控制u(t)至多切换一次 最优控制表达式:
4)计算状态转移的最短时间
作业: 秦寿康 教材,第三章 习题1,3
第4章
求解状态转移最短时间t*:
x2 A(x10,x20) O tBO B tAB x1
t * t AB t BO 1 1 x2 x x1 t 2 x20t x10 A B 2 x u 2 x2 t x20 1 x1B t AB 2 x20t AB x10 B点坐标 (1) 2 x2 B t AB x20
第4章
最短时间计算公式:
初态(
x1 , x2
)
终态(0,0)
1 2 x2 4 x1 2 x2 , x1 2 x2 x2 1 * t ( x1 , x2 ) x2 , x1 x2 x2 2 1 2 x2 4 x1 2 x2 , x1 x2 x2 2
第4章
第4章 最短时间和最少燃料控制
本章主要内容:
4.1 非线性系统的 4.2 线性时不变系统 最短时间控制问题
4.3 双积分模型的
4.4 非线性系统的 4.5 线性时不变系统 最少燃料控制问题
4.6 双积分模型的
时间最优控制:导弹以最短时间击毁敌机 最少燃料最优控制:航天航空控制(高度、姿态、交会)
u* sgn{BT λ(t )} sgn[2 (t )] (4 24)
下面利用协态方程求解 2 (t )
H 1 T f 1 1x2 2u
H 1 (t ) 0 x1 (t ) H 2 1 x 2
T B[ x* (t ), t ]u* (t ) min { T B[ x* (t ), t ]u(t )}
u j ( t ) 1
将(4-6)式中的矩阵表达式展开成分量形式
1
2
b11 b12 ... b1m u1 qj b u m n b ... b 21 22 2 m 2 u { b } (4 7) ... n ... j 1 j i 1 ij i ...... b b ... b nm um n1 n 2
* u q min u q j j j 1 * * j j u j 1 j 1 m m
则极值条件可写为:
(4 8)
第4章
* u q min u q j j j 1 * * j j u j 1 j 1 m m
(4 8)
m * j 1
由式(4-8)可见,由于 q 是确定的,故使 u j q j 取极小值的最优控制为
(4 19)
第4章
双积分模型最短时间控制问题的提法: 已知二阶系统的状态方程为
x1 (t ) x2 (t ) x2 (t ) u (t )
给定端点约束条件为
(4 21)
x20 ]T
x(0) [ x10 x(t f ) [0
0]T
(4 22)
寻求有界闭集中的最优控制u*(t),满足不等式约束
u j (t ) 1 ( j 1, 2,..., m) (4 3)
使系统从已知初始状态 x(t0 ) 转移到目标集中某一状态 x(t f ) 时,如
下目标泛函取极小值,其中 t f 未知
J [u (t )]
tf
t0
m C j u j (t ) dt j 1
(4 15)
中全部为非奇异矩阵时,系统是平凡的。(至少有一个为奇异矩阵 时,系统是奇异的)
(2)系统最优解存在的条件:常数矩阵A的特征值全部具有非正实部。
(3)最优解唯一性定理:系统是平凡的且最短时间控制存在,则最短时 间控制必然是唯一的。
(4)开关次数定理:系统是平凡的且最短时间控制存在,又若系统矩阵 A的特征值均为实数,则最优控制u*的任一分量 u* 的切换次数最多为n-1次 j 。(n为系统维数)
第4章
4.3 双积分模型的最短时间控制问题
双积分模型的物理意义:惯性负载在无阻力环境中运动
m 质量,y(t ) 位移,f (t ) 作用力
负载运动方程: 传递函数:
my(t ) f (t )
G( s) Y ( s) 1 2 F ( s) ms
(4 16)
(4 17)
(由两个积分环节组成)
BO 1 1 x2 x x1 t 2 x2 B t x1B 2 x u 2 x2 t x2 B 1 0 t BO 2 x2 B t BO x1B 2 0 t BO x2 B (2)
O点坐标
(1)式带入(2)式即可解出 t AB , t BO
第4章
平凡最短时间控制系统
q* j 只是在各个孤立的 瞬刻才取零值, 是有 u* j
第一类间断点的分段恒 值函数。
奇异(非平凡)最短时间 控制系统。 并不意味着在该区间内最 优控制不存在,仅表明, 从必要条件不能推出确切 关系式。
第4章
4.2 线性时不变系统的最短时间控制问题
线性时间最优调节器问题的提法: 设受控系统状态方程为
为开关曲线
1 2
{( x1 , x2 ) : x1
1 2 x2 , x2 0} 2
第4章
定义
h x1
1 x2 x2 2
x2
R {( x1 , x2 ) : h 0} u 1 ( x1 , x2 ) R
*
0
x1
R {( x1 , x2 ) : h 0} u * 1 ( x1 , x2 ) R
{1}, {1}, {1,1}, {1,1}
下面通过图解法,在相平面上分析相轨迹转移的规律,从而寻找最优 控制u*(t)。首先求解状态轨线的方程:
(1) x1 (t ) x2 (t ) (2) x2 (t ) u (t ) dx x x (1) 1 2 2 , 1 (2) dx2 u (t ) dx1 x2 dx2 2 x1 x 2 c 2 (4 26)
定义u(t)=f(t)/m , 则(4-16)式变为:
y(t ) u(t )
(4 18)
x1 (t ) x2 (t ) (t ) 则有 取状态变量 x1 (t ) y(t ), x2 (t ) y x2 (t ) u (t )
0 1 0 矩阵形式为: x(t ) x(t ) u (t ) 0 0 1 (4 20)
(4 10)
具体到线性时不变系统,得到最短时间控制问题的若干重要结论。 (开关次数定理,非平凡判据) 将上述结论应用于双积分模型的最短时间控制问题,求解过程为:
1)应用最小值原理得出最优控制表达式
u* sgn[2 (t )]
2)解协态方程,结合开关次数定理,列出最优控制的候选函数序列 3)在状态平面上分析状态转移轨线,寻找开关曲线,总结控制规律
(4 27)
第4章
应用最小值原理,系统的哈密尔顿函数为:
H [ x(t ), (t ), u(t ), t ] C j u j T ( f Bu)
j 1
m
(4 28)
在使J最小以实现最优控制的必要条件中,侧重分析极值条件
根据上一节的结论,可得极值条件为:
* T * u* sgn q sgn{ b j j λ (t )} j
(4 14)
第4章
对于线性时不变系统的最短时间控制问题,经过理论推导和证明,可得 如下重要结论: (1)系统平凡的充要条件:当且仅当m个矩阵
相关文档
最新文档