第七章 最优控制
合集下载
第七章--最优控制

第七章– 最优控制理论
Optimal Control Theory
同济大学汽车学院:赵治国 教授 Prof. Zhiguo Zhao School of Automotive Studies, Tongji University Tel:69589117(O) E-mail: Zhiguozhao@
*
x(t ) x* (t )上的变分等于零,即 J [ x* (t )] 0
§7-3 泛函与变分的基本概念
证明:对于任意给定的
x(t ) 来说,J [ x* (t ) x(t )]是实变量 的 * * J [ x ( t )] 函数。泛函 在 x (t ) 达到极值,即函数 J [ x (t ) x(t )] 在 0 时达到极值,所以它的导数在 0 时应为零,即
二. 最优控制问题的一般提法 用数学语言描述最优控制问题,应包括以下几个方面的内容: 1. 受控系统的数学模型 用状态方程描述:x (t ) f [ x(t ), u (t ), t ] 2. 受控系统的始端和终端条件,即状态方程的边界条件 对最优控制问题始端条件通常是已知的:x(t0 ) x0 终端条件可以用一个目标集表示:
J J [ x()] J [ x(t ) x(t )] 中的 x(t ) 应理解为某一特定函数的整体,而不是对应于 的
dx(t ) J ( x (t ) t )dt 0 dt 1 5 2 J (t t )dt 0 6 2 1 e J (e 2t tet )dt 1 0 2
1 2
若 x (t ) t 有
t x ( t ) e 若 有
§7-3 泛函与变分的基本概念
2.泛函自变量的变分 泛函 J [ x (t )] 的自变量函数 x (t ) 与标称函数 x* (t )之间的差值函数
Optimal Control Theory
同济大学汽车学院:赵治国 教授 Prof. Zhiguo Zhao School of Automotive Studies, Tongji University Tel:69589117(O) E-mail: Zhiguozhao@
*
x(t ) x* (t )上的变分等于零,即 J [ x* (t )] 0
§7-3 泛函与变分的基本概念
证明:对于任意给定的
x(t ) 来说,J [ x* (t ) x(t )]是实变量 的 * * J [ x ( t )] 函数。泛函 在 x (t ) 达到极值,即函数 J [ x (t ) x(t )] 在 0 时达到极值,所以它的导数在 0 时应为零,即
二. 最优控制问题的一般提法 用数学语言描述最优控制问题,应包括以下几个方面的内容: 1. 受控系统的数学模型 用状态方程描述:x (t ) f [ x(t ), u (t ), t ] 2. 受控系统的始端和终端条件,即状态方程的边界条件 对最优控制问题始端条件通常是已知的:x(t0 ) x0 终端条件可以用一个目标集表示:
J J [ x()] J [ x(t ) x(t )] 中的 x(t ) 应理解为某一特定函数的整体,而不是对应于 的
dx(t ) J ( x (t ) t )dt 0 dt 1 5 2 J (t t )dt 0 6 2 1 e J (e 2t tet )dt 1 0 2
1 2
若 x (t ) t 有
t x ( t ) e 若 有
§7-3 泛函与变分的基本概念
2.泛函自变量的变分 泛函 J [ x (t )] 的自变量函数 x (t ) 与标称函数 x* (t )之间的差值函数
最优控制-第七章-动态规划法

当∆t很小时,有
t t
t
Lx, u, t d t Lx, u, t t
J x, t min
*
min
uU
uU
tf
t0
Lx, u, t d t Φ xt f
tf t t
t t
t
Lx, u, t d t
Lx, u, t d t Φ xt f
P1 11
7
P2 4 2
P3 4 4
12 A 4 8 Q1
4 3 2 2 Q3 B
5 Q2
第一段:P1、Q1的前站是始发站A。显见从
A到B的最优值为12,故得最优路线为AQ1P2Q3B。
综上可见,动态规划法的特点是: 1) 与穷举算法相比,可使计算量大大减少。如
上述最优路线问题,用动态规划法只须做10次
J x, t min Lx, u, t t J xt t , t t
* * uU
(8)
* J x , t J x, t * * J x x, t t J x, t t (12) x t x * T
A城出发到B城的行车时间最短。
P1 3 A 4 Q1 1
7
P2
2
P3 4
4
6 8 2 Q2
3 3 3
2 Q3 4
2
B
现将A到B分成四段,每一段都要作一最优决 策,使总过程时间为最短。所以这是一个多段最 优决策问题。 由图2可知,所有可能的行车路线共有8条。 如果将各条路线所需的时间都一一计算出来,并 作一比较,便可求得最优路线是AQ1P2Q3B,历时 12。这种一一计算的方法称为穷举算法。这种方 法计算量大,如本例就要做3×23=24次加法和7次 比较。如果决策一个n段过程,则共需(n-1)2n-1次 加法和(2n-1-1)次比较。可见随着段数的增多,计 算量将急剧增加。
最优控制 现代控制理论 教学PPT课件

第7章第3页
7.1.1宇宙飞船登月软着陆的实例
实例1:宇宙飞船若实现在月球表面实现软着陆,即登月舱到达月球表面时的速度为
零,要寻求登月舱发动机推力的最优变化率,使燃料消耗最少,以便在完成登月考察 任务后,登月舱有足够燃料离开月球与母舱会合,从而返回地球。
m(t) h(t) v(t)
u(t) g
M F h0 v0
如果泛函的变分存在,则
J ( x, x) J ( x x)
2021年4月30日
0
第7章第15页
求证 如果泛函的变分存在,则
J ( x, x) J ( x x)
0
证明 根据泛函变分的定义
J J (x0 x) J (x0 ) L(x0, x) r(x0, x)
由于 L( x0, x) 时关于 x 的连续线性泛函,故
J (C1x1(t) C2 x2 (t)) C1J ( x1(t)) C2J ( x2 (t)) ,且其增量可以表示为
J J ( x(t) x(t)) J ( x(t)) L( x(t), x(t)) r( x(t), x(t))
2021年4月30日
第7章第14页
其中,第一项是 x(t) 的连续线性泛函,第二项是关于 x(t) 的高阶无穷小,则称上式第
变分 x 表示U 中点 x(t) 与 x0 (t) 之间的差。由于 x 存在,必然引起泛函数值的变化,
并以 J (x x) 表示。其中 为参变数,其值 0 1。当 1时,得增加后的泛函值
J ( x x) ;当 0 时,得泛函原来的值 J (x) 。
若 泛 函 J ( x(t)) 对 于 任 何 常 数 C1 , C2 及 任 何 x1(t) U , x2 (t) U , 都 有
第七章 最优控制:最大值原理

H u 2u 0 u 1 2
(7.39)
H
2
u
2
2 0
u (t )
的解是最大化 H
例1 最大化
满足 y y u 和 y (0 ) 1
V
1 0
u dt
2
y (1) 0
汉密尔顿函数: H u 2 ( y u )
0
H t , y
(T ) y T ( 0 ) y 0
的第一项对 求导,得:
T ( ) 0
(7.28)
H H q ( t ) dt H y q (t ) p (t ) u y
f (t , y , u ) H
以上两个方程右边相同,因此左边相等:
y
推导得到最大值 原理的条件之一
以上推导得到:
H ( t , y , u , ) y ( t ) dt ( T ) y
T 0
T
(0) y0
步骤3 推导新目标泛函 的另一种形式
推导得到最大值原 理的一般横截条件
第二节 其他终结条件
一般横截条件:
H t T T
(T ) y T 0
(7.30)
y
y Z
• 固定终结点的横截条件:
y (T ) y T
(T 和
y T 给定)
水平终结线的横截条件:
[ H ]t T 0
t
0
T
T2
T
(7.39)
H
2
u
2
2 0
u (t )
的解是最大化 H
例1 最大化
满足 y y u 和 y (0 ) 1
V
1 0
u dt
2
y (1) 0
汉密尔顿函数: H u 2 ( y u )
0
H t , y
(T ) y T ( 0 ) y 0
的第一项对 求导,得:
T ( ) 0
(7.28)
H H q ( t ) dt H y q (t ) p (t ) u y
f (t , y , u ) H
以上两个方程右边相同,因此左边相等:
y
推导得到最大值 原理的条件之一
以上推导得到:
H ( t , y , u , ) y ( t ) dt ( T ) y
T 0
T
(0) y0
步骤3 推导新目标泛函 的另一种形式
推导得到最大值原 理的一般横截条件
第二节 其他终结条件
一般横截条件:
H t T T
(T ) y T 0
(7.30)
y
y Z
• 固定终结点的横截条件:
y (T ) y T
(T 和
y T 给定)
水平终结线的横截条件:
[ H ]t T 0
t
0
T
T2
T
现代控制理论-第7章 最优控制

(3)控制规律:
u* kx(t)
P由黎卡提微分k 方Q2程1BT得P 到 边界条件:P(tf)=Q0
PA AT P PBQ21BT P Q1 P(t)
例:求解使:J最小的u*(t)
0 1 0 x 0 0x 1u,
பைடு நூலகம்
J
第二节 状态调节器
在不消耗过多控制能量的前提下,使系统各状态在受 到外界干扰作用下,维持平衡状态。
一.无限长时间状态调节器
1.原系统:可控系统
2.性能指标: 说明:(1) J
x Ax Bu, y Cx
12表0 (示xTQ1系x u统TQ2要u)d求t 状态变量偏离平衡点的累积
u* kx(t)
3.控制规律
k Q21BT P
正定实对称P由黎卡提代数方程得到:
PA AT P PBQ21BT P Q1 0
例:求使J最小的u*(t)。 0 1 0
解:
x 0 0x 1u,
J
1
(xT
x uTu)dt
误差最小,这xTQ意1x 味着因某种原因系统状态偏离平衡点,控制
作用应使它很快回复到平衡点,调节器的名称由此而来
(2) 表示在控制过程中,消耗的能量最小
J中(3的u)TQ权Q2u1重半正定,Q2正定,用来确定状态变量与控制能量在
即寻求控制规律,使系统的状态变量x(t)按性能指标J的要 求,在无限长的时间内达到平衡点
1.原系统:可控、可观系统
x Ax Bu, y Cx
2.性能指标:J
1 2
[(y
0
现代控制工程-第7章最优控制

8
1.
*问给7定题.3t
变分法求解无约束最优控制
f ,终端自由,即 x(t f ) 任意
增广泛函为
Ja
[x(t f )]
tf [H (x,u,,t) T x]dt
t0
取一阶变分并令其为零,得
J a
(
x
)T
x
t t
f
tf [(H )T x (H )T u (H )T xT Tx]dt 0
J ( x*, x)
d d
J ( x * x)
0
0
在实际问题中,泛函极值问题的最优轨线通常是受到各种约束的。
例如,最优控制性能指标(7.2)中的u和x的选择,要满足状态方 程(7.1),这是一个等式约束。 在等式约束下的泛函极值问题,称为条件泛函极值问题。
用拉格朗日乘子法将条件泛函极值问题转化为无约束条件极值问
3
设7系.1统最的状优态控方程制为的概x 念f (x, u, t)
最优性能指标
J [x(t f ),t f ]
tf
L[ x(t ), u(t ), t ]dt
t0
所谓最优控制,就是要确定在 [t0 , t f ] 中的最优控制,将系统的
状态从 x(t0 )转移到 x(t f ) ,或者 x(t f ) 的一个集合,并使性能指 标最优。 最优控制问题从数学上看,就是求解一类带有约束条件的条件
称为无约束最优控制问题。
无约束最优控制问题是一个求有等式约束的泛函极值问题,可
以用拉格朗日乘子法把有约束条件问题转化为无约束条件问题。
构造增广泛函为
J a [x(t f ),t f ] t f {L[x(t),u(t),t] T [ f (x(t),u(t),t) x(t)]}dt t0
武汉大学自动化专业 《现代控制理论》第七章 最优控制

第七章 最优控制
1
最优控制研究的主要问题是: 根据已建立的被控对象的数学模型,选择一个容许的 控制规律,使得被控对象按预定要求运行,并使给 定的某一性能指标达到极小值(或极大值); 从数学观点看,最优控制研究的是求解一类带有约束 条件的泛函极值问题,属于变分学的范畴。 古典变分理论只能解决控制无约束(即容许控制属于 开集)的一类最优控制问题,为满足工程实际的需 要,在20世纪50年代中期出现了现代变分理论, 常用的数学工具是Bellman(美国)的“动态规划”, 和Pontryagin(苏联)的‘极大值原理“。,又进一步推动了现代控制论的发展
T t0 T tf t0
∴ ..J = {θ [ X (t ), t ] λ (t ) X (t )}
+ ∫ {H [ X (t ), u (t ), t ] + λT (t ) X (t )}dt
t0
tf
9
极大值曲线的充分条件为 δ2 J<0
五 无约束条件的泛函极值
& 求 J ( X ) = ∫t Φ( X , X , t )dt 的极值,就是确定X(t),使 J = min .
0
tf
& 几何意义:寻找一条曲线X(t),使给定的可微函数 Φ ( X , X , t ) 沿X(t) 的积分达到极值,此时X(t)=X*(t)
横截条件: ①两端固定 ②两端状态自由
δX 0 = 0,.....δX f = 0
Φ & X Φ & X
tf
= 0,.....
③始端自由,终端固定 ④始端固定,终端自由 ⑤终端 t f 自由,但状态 X (tf )=c (tf ) 受约束——拦截 问题
Φ & X
1
最优控制研究的主要问题是: 根据已建立的被控对象的数学模型,选择一个容许的 控制规律,使得被控对象按预定要求运行,并使给 定的某一性能指标达到极小值(或极大值); 从数学观点看,最优控制研究的是求解一类带有约束 条件的泛函极值问题,属于变分学的范畴。 古典变分理论只能解决控制无约束(即容许控制属于 开集)的一类最优控制问题,为满足工程实际的需 要,在20世纪50年代中期出现了现代变分理论, 常用的数学工具是Bellman(美国)的“动态规划”, 和Pontryagin(苏联)的‘极大值原理“。,又进一步推动了现代控制论的发展
T t0 T tf t0
∴ ..J = {θ [ X (t ), t ] λ (t ) X (t )}
+ ∫ {H [ X (t ), u (t ), t ] + λT (t ) X (t )}dt
t0
tf
9
极大值曲线的充分条件为 δ2 J<0
五 无约束条件的泛函极值
& 求 J ( X ) = ∫t Φ( X , X , t )dt 的极值,就是确定X(t),使 J = min .
0
tf
& 几何意义:寻找一条曲线X(t),使给定的可微函数 Φ ( X , X , t ) 沿X(t) 的积分达到极值,此时X(t)=X*(t)
横截条件: ①两端固定 ②两端状态自由
δX 0 = 0,.....δX f = 0
Φ & X Φ & X
tf
= 0,.....
③始端自由,终端固定 ④始端固定,终端自由 ⑤终端 t f 自由,但状态 X (tf )=c (tf ) 受约束——拦截 问题
Φ & X
第七章 最优控制

2
x 1 x
2
)T
1 x 1 x
2 T
0
x T 1
所求的极值曲线与约束曲线相正交
7.2.4 含有多个未知函数泛函的极值 泛函
J ( x1 , xn ) F ( x1,, xn ; x1,, xn ; t )dt
t0 T
边界值
xi (t ) xi (t )
若泛函 J (x) 有极值,则必有 J 0
J J [ x x] 0 0 上述方法与结论对多个未知函数的泛数同样适用
7.2.2
欧拉方程
T t0
泛函 J ( x( F ( x, x, t )dt ))
F d F 0 x dt x
边界条件为
x1 (0) 1
x2 (0) 1
x1 (2) 0
x2 (2) 0
引进乘子
(t ) (1 (t ), 2 (t ))T
1 F F T f u 2 1 ( x1 x2 ) 2 ( x2 u ) 构造函数 2
欧拉方程
F * d F * 1 0 x1 dt x1
软着陆过程开始时刻t为零 hv u v g m m Ku
K为常数 ,初始状态
h(0) h0
终点条件
v(0) v0
m(0) M F
h(T ) 0
v(T ) 0
控制目标
J m(T )
推力方案
0 u(t ) umax
例7.1.2
导弹发射问题
令
(t ) H ( x, , u, t ) x
( x(T )) (T ) x(T )
x 1 x
2
)T
1 x 1 x
2 T
0
x T 1
所求的极值曲线与约束曲线相正交
7.2.4 含有多个未知函数泛函的极值 泛函
J ( x1 , xn ) F ( x1,, xn ; x1,, xn ; t )dt
t0 T
边界值
xi (t ) xi (t )
若泛函 J (x) 有极值,则必有 J 0
J J [ x x] 0 0 上述方法与结论对多个未知函数的泛数同样适用
7.2.2
欧拉方程
T t0
泛函 J ( x( F ( x, x, t )dt ))
F d F 0 x dt x
边界条件为
x1 (0) 1
x2 (0) 1
x1 (2) 0
x2 (2) 0
引进乘子
(t ) (1 (t ), 2 (t ))T
1 F F T f u 2 1 ( x1 x2 ) 2 ( x2 u ) 构造函数 2
欧拉方程
F * d F * 1 0 x1 dt x1
软着陆过程开始时刻t为零 hv u v g m m Ku
K为常数 ,初始状态
h(0) h0
终点条件
v(0) v0
m(0) M F
h(T ) 0
v(T ) 0
控制目标
J m(T )
推力方案
0 u(t ) umax
例7.1.2
导弹发射问题
令
(t ) H ( x, , u, t ) x
( x(T )) (T ) x(T )
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
性能指标J是和的函数,而和是t的函数,即J是函数的函数。这在数学上 称“泛函”,泛函的极值要用“变分法”才能求得。
同济大学汽车学院 2010
最优控制问题的举例
J x x
2 1 2 2
t
dt
x1 1, x2 2
求J极值时的
匀减速运动
x t
1 tf 2 t0 u dt 2
g (t0 ) g (t0 )
yr (t )
C T (t )Q(t )
u -
G T (t )
g (t )
B(t ) R 1 (t ) B T (t )
+ +
u
G (t )
x
C (t )
y
同济大学汽车学院 2010
权系数矩阵的选取
同济大学汽车学院 2010
权系数矩阵的选取
同济大学汽车学院 2010
同济大学 汽车学院
College of Automotive, Tongji University
钟再敏
最优控制
Optimized Control 现代控制理论基础7
目录
1. 2. 3. 4.
最优控制问题的表述 最优控制问题举例 二次型性能指标的最优控制 最优跟踪问题
同济大学汽车学院 2010
最优控制问题的表述
1 x 2 x 2 u x
J
3 1 2 1 2 2 3 1 0 x1 3 2 x2 2 x12 4 x2 2 x1 x2 u 2 dt 2 2 2
时间区间为[0,3],求最优控制u*,使J为最小。
u R 1 B T P t x 20 2 P 12 t x1 2 P 22 t x 2
-
x(t0 ) * u A(t )x B (t )u x R 1 (t ) B T (t )
P (t )
C (t )
y
AT PBR 1 B T
t Pt At AT t Pt Pt Bt R 1 t BT Pt C T t Qt Ct 0 P
t
E B
x1
u=M D C
同济大学汽车学院 2010
二次型性能指标的最优控制
状态调节器问题:状态调节器是指采用状态反馈,使状态向量的各分量迅 速趋近于零,而不消耗很多能量的控制系统。
At x Bt u x xt 0 x0
寻找一个最优控制u*,使下面的性能指标为最小。
ˆx u R 1 B T P
• 其中
ˆ P
为常数矩阵,且满足下列黎卡提矩阵代数方程
ˆ A AT P ˆ P ˆ BR1 BT P ˆ Q 0 P
• 为了得到定常的反馈增益,必须满足下列条件: – 系统是定常的,而且是可控的 – 无限时间调节器 t f – J中不包含终值型指标,F=0 MATLAB命令lqr(A,B,Q,R,N)
线性系统无限时间状态调节器
• 线性系统二次型性能指标的最优控制是状态的线性反馈,但反馈增益是时变 的,即使是定常系统也是如此。
Ax Bu x
1 T J x Qx u T Ru dt 2 0
– 如果其中矩阵Q、R为常数阵,且为正定时,其最优控制为:
ˆx u R 1 B T P
J K x t f , t f tt f L x, u, t dt J K x t , t f f 0
• 最优控制问题的表述:
在对象运动方程为 x f x,u, t 的约束下,能够找到一个容许控制u u t 它要满足对控制的约束条件和指定的时间区间边界条件,将系统由初始状态 X0转移到终值状态Xf,使性能指标J为极小(或极大) u u t 开环 u u x 闭环
•
同济大学汽车学院 2010
线性系统无限时间状态调节器
• 线性系统二次型性能指标的最优控制是状态的线性反馈,但反馈增益是时变 的,即使是定常系统也是如此。
Ax Bu x
1 T J x Qx u T Ru dt 2 0
– 如果其中矩阵Q、R为常数阵,且为正定时,其最优控制为:
• 其中
ˆ P
为常数矩阵,且满足下列黎卡提矩阵代数方程
ˆ A AT P ˆ P ˆ BR1 BT P ˆ Q 0 P
• 为了得到定常的反馈增益,必须满足下列条件: – 系统是定常的,而且是可控的 – 无限时间调节器 t f – J中不包含终值型指标,F=0 MATLAB命令lqr(A,B,Q,R,N)
u x
xt 0 x 0
xt f x f 0
J
x0 u t t f t0
x (t )
*
tf t t f t0
x0
物理解释:x-速度
u-力
A x0
x*(t)
O
t0 u*(t)
tf
同济大学汽车学院 2010
最优控制问题的举例
升降机快速降落问题
At x Bt u x xt 0 x0
寻找一个最优控制u*,使下面的性能指标为最小。
1 x 2 x 2 u x
J
3 1 2 1 2 2 2 2 3 1 0 x1 3 2 x2 2 x 4 x 2 x x u dt 1 2 1 2 2 2 2
t Pt A AT Pt Pt BR1 BT Pt Q 0 P
- 计算求得时变P(t)矩阵可以得到闭环状态反馈控制率 - 一般情况下不能求解析解,只能求数值解; - 虽然A、B、Q、R都是常数阵,但最优反馈增益仍是时变的。
同济大学汽车学院 2010
P12 0 1 0 0 P11 P12 0 0 1 0 P P22 12 P22 P12 0 P11 P12 2 1 2 0 1 P 0 P22 1 12 P22 1 4
权系数矩阵的选取
同济大学汽车学院 2010
J 1 T 1 x f Fx f 2 2
x
tf t0
T
Qt x u T R t u dt
其中,Q,R,F均为半正定,Q—要求的过渡过程最快,R—对控制能量的限 制,F—对终端偏差、即稳态控制精度的限制。
R 1 (t ) B T (t )
A(t )x B(t )u x
• 最优控制问题的基本要素
– – – – 系统的状态方程(等式约束条件) 控制变量的限制 初始条件和终值条件 指标函数
2 t T T J J t0f L x,u, t dt J 0 x Qx u Rudt 0 e t dt
• 性能指标的形式
– 积分型 – 终值型 – 复合型
ˆ A AT P ˆ P ˆ BR1 BT P ˆ Q 0 P
ˆ 1 P 12 ˆ P22 a 2 P ˆ 11 a 2 b
u t x1 t a 2 x2 t
同济大学汽车学院 2010
最优跟踪器问题
• 以前的讨论都是系统加一扰动(或设定)已运行于稳定状态,当突然去掉 扰动(或设定)时,使二次型性能指标为最小的最优控制。 • 所谓跟踪问题就是寻找最优控制规律,使系统的实际输出,在给定的时间 区间内,尽量接近理想输出,而又不消耗过多的控制能量。 x A t x B t u
升降机快速降落问题
1 x 2 x 2 u g x
x1 t 0 0 x 2 t 0 0 P
ut M
M g
J 0f dt t f
使升降机在最短时间内由给定的初始状态转移到零状态。
x2
u=-M F A u=-M
P(t )
x
t Pt At AT t Pt Pt Bt R 1 t BT t Pt Qt 0 P
同济大学汽车学院 2010
二次型性能指标的最优控制
状态调节器问题:状态调节器是指采用状态反馈,使状态向量的各分量迅 速趋近于零,而不消耗很多能量的控制系统。
u + -
P t 1 11 12 t P
P 12 t x1 P22 t x2
2 P22 (t )
x2
x1
2 P12 (t )
P 11 P12 P 11 P12
P11 P 12 P P12 22
y C (t ) x
• 定义误差向量为
et y yt
1 T 1 tf e f Fe f e T Qt e u T Rt u dt 2 2 t0
g (t0 )
C T (t )Q(t )
u -
• 跟踪问题的性能指标
J
•
最优解为
yr (t )
g (t )
1 x 2 x 2 u g x
x1 t 0 0 x 2 t 0 0 P
ut M
M g
J 0f dt t f
使升降机在最短时间内由给定的初始状态转移到零状态。
t
同济大学汽车学院 2010
最优控制问题的举例
(t ) [ AT (t ) P(t )B(t )R 1 (t )BT (t )]g(t ) C T t Qt y t 0 g
同济大学汽车学院 2010
最优跟踪器问题的说明
• 跟踪系统的最优反馈部分和理想输出yr(t)无关,估计黎卡提矩阵微分方 程解出P(t),仍为一调节器问题。 • 跟踪部分相当于加入了一个g(t),它可以看出是作用于系统的强迫分量, 从而使调节器变为跟踪器。 • _g(t)的求解与yr(t)的变化有关,这就要求只有在过程开始之前知道yr(t) 的变化规律的情况下才能求出g(t) 。有些系统,例如控制雷达天线跟踪 人造地球卫星,卫星的运行规律是事先清楚的;但对于大多数跟踪系统, 例如随机性随动系统或者拦截导弹,就无法事先知道其运行规律,此时的 求解就会碰到很大困难,只能用大量的经验得出运动的统计规律,再求出 g(t) . 1 T • 如果取 Gt At Bt R t B t Pt 则有