最优控制极大值原理
合集下载
极大值原理

最优控制问题可表述为:寻求一个容许控制u(t),以使受控系统从某个给定的初始状态x(t0)=x0出发,在 末时刻tf达到目标集,并且使性能指标泛函J【u(·)】达到极小值或极大值。如果这个问题是有解的,那么就 称求得的容许控制为最优控制,记为u(t);而系统状态方程在u(t)作用下的解称为最优轨线,记为x(t);相 应的极小或极大性能指标值J【u(·)】,称为最优指标值。在数学上,最优控制问题的实质,是对受约束的泛 函J【u(·)】求极值的问题,其中的约束条件为系统的状态方程、目标集方程和容许控制域。
原理简介
极大值原理
maximum principle
最优控制理论中用以确定使受控系统或运动过程的给定性能指标取极大或极小值的最优控制的主要方法。在 工程领域中很大一类最优控制问题都可采用极大值原理所提供的方法和原则来定出最优控制的规律。在理论上, 极大值原理还是最优控制理论形成和发展的基础。极大值原理是对分析力学中古典变分法的推广,能用于处理由 于外力源的限制而使系统的输入(即控制)作用有约束的问题。极大值原理是20世纪50年代中期苏联学者Л.С. 庞特里亚金提出的,有关这一原理的主要结果及其严格的数学证明,都发表在后来出版的《最优过程的数学理论》 一书中。
式9式11式13LQ问题 线性二次型性能指标的最优控制问题。
次优控制
对于较为复杂的受控系统,即使系统为线性的情况,最优控制问题的求解也常有大量的计算。采用次优控制, 可在保证性能指标值足够接近最优性能值的同时,显著地减少问题求解的计算量。实现次优控制的主要的途径是 把复杂的受控系统通过适当的方法化为两个较为简单的子受控系统,并且针对子系统来计算最优控制,再综合地 作必要的修正。实现系统性能指标值 对最优性能值的接近程度来确定;要求接近的程度越高,修正计算量也就越大。特别是对于要求计算机实时控制 的受控系统,为了避免过大的计算量或避免增加控制系统在组成上的复杂性,常常更宜采用次优控制以代替最优 控制。
基于极大值原理的最优控制

1 h(t f ) 2 v(t f )
3
1 和 2 为待定的拉格朗日乘子 式中,
4)将哈密顿函数整理为
H 1v 2 ( u g ) 3 (ku ) (1v 2 g ) ( 2 k3 )u m m
5)由极小值条件,H相对于 u (t ) 取绝对极小值。因此,最优控制为
2 u , max m k3 0 u (t ) 0, 2 k3 0 m
上述结果表明,只有当发动机推力在最大值和零值之间进行开关 控制,才有可能在实现软着陆的同时,保证燃料消耗最少。
4
thank you !
3 (t )
H 2 (t )u (t ) m m 2 (t )
3)由横截条件
1 (t f )
2 (t f )
1 1 1 h(t f ) h(t f )
J m(t )
2 2 2 v(t f ) v(t f ) 3 (t f ) 1 m(t f )
现代控制理论
实例分析: 基于极大值原理的最优控制
例:设宇宙飞船质量为m(t),高度为h(t),垂直速度为v(t),发动机推力为 u(t),月球表面的重力加速度设为常数g,不带燃料的飞船质量为M,初始燃料 的总质量为F,发动机最大推力为 umax ,发动机飞船的状态方程为:
h(t ) v (t ) , h(0) h0 u (t ) v (t ) g , v (0) v0 m(t ) m(t ) ku(t ),
m(0) M F
要求飞船在月球上实现软着陆,即终端约束为
1 h(t f ) 0 , 2 v(t f ) 0
最优控制--极大值原理

3)
X (t0 ) = X0
:
∂φ Htf + =0 ∂t f
t0 , t f 已知, (t0 ) = X0给定,末端受约束 g[ X (t f ), t f ] = 0 X
边界条件为:
∂φ ∂gT λ(t f ) = µt f tf + ∂X ∂X g[ X (t f ), t f ] = 0 ∂φ ∂gT + µ =0 若 t f 自由:外加: H |t f + ∂t f ∂t f
_
H[ X (t), λ(t),U (t)] = m H[ X * (t), λ(t), u(t)] ax
* * u(t )
_
_
∴所以有的文献中也称为“极大值原理”。 3、H对u没有可微要求,因此应用拓宽。 4、 极小值原来是求取最优控制的必要条件,非充分条件。 即:满足极小值原理不一定J取极小值,需进一步判断。 一般:对于实际系统
1、问题提出(时变系统) 问题提出 时变系统)
ɺ 已知受控系统 X = f ( X (t), t) + B( X (t), t)u(t), X (0) = X0 并设 f 和 B对X(t)和t 连续可微。 和 连续可微。
X:n×1 : × u: r×1 : × f :n×1 × B:n×r : × 状态向量 控制向量 函数向量 函数值矩阵
* 解得: x (t) = 0.1e
2t
+ 9.9e−
2t
2t
λ(t) = −0.1( 2 +1)e
b) |u| ≤ 0.3
+ 9.9( 2 −1)e−
2t
由极小值原理: U * = −sgn{λ} 当t=1时
λ =0
在[0,1]区间
X (t0 ) = X0
:
∂φ Htf + =0 ∂t f
t0 , t f 已知, (t0 ) = X0给定,末端受约束 g[ X (t f ), t f ] = 0 X
边界条件为:
∂φ ∂gT λ(t f ) = µt f tf + ∂X ∂X g[ X (t f ), t f ] = 0 ∂φ ∂gT + µ =0 若 t f 自由:外加: H |t f + ∂t f ∂t f
_
H[ X (t), λ(t),U (t)] = m H[ X * (t), λ(t), u(t)] ax
* * u(t )
_
_
∴所以有的文献中也称为“极大值原理”。 3、H对u没有可微要求,因此应用拓宽。 4、 极小值原来是求取最优控制的必要条件,非充分条件。 即:满足极小值原理不一定J取极小值,需进一步判断。 一般:对于实际系统
1、问题提出(时变系统) 问题提出 时变系统)
ɺ 已知受控系统 X = f ( X (t), t) + B( X (t), t)u(t), X (0) = X0 并设 f 和 B对X(t)和t 连续可微。 和 连续可微。
X:n×1 : × u: r×1 : × f :n×1 × B:n×r : × 状态向量 控制向量 函数向量 函数值矩阵
* 解得: x (t) = 0.1e
2t
+ 9.9e−
2t
2t
λ(t) = −0.1( 2 +1)e
b) |u| ≤ 0.3
+ 9.9( 2 −1)e−
2t
由极小值原理: U * = −sgn{λ} 当t=1时
λ =0
在[0,1]区间
第七章 最优控制:最大值原理

H u 2u 0 u 1 2
(7.39)
H
2
u
2
2 0
u (t )
的解是最大化 H
例1 最大化
满足 y y u 和 y (0 ) 1
V
1 0
u dt
2
y (1) 0
汉密尔顿函数: H u 2 ( y u )
0
H t , y
(T ) y T ( 0 ) y 0
的第一项对 求导,得:
T ( ) 0
(7.28)
H H q ( t ) dt H y q (t ) p (t ) u y
f (t , y , u ) H
以上两个方程右边相同,因此左边相等:
y
推导得到最大值 原理的条件之一
以上推导得到:
H ( t , y , u , ) y ( t ) dt ( T ) y
T 0
T
(0) y0
步骤3 推导新目标泛函 的另一种形式
推导得到最大值原 理的一般横截条件
第二节 其他终结条件
一般横截条件:
H t T T
(T ) y T 0
(7.30)
y
y Z
• 固定终结点的横截条件:
y (T ) y T
(T 和
y T 给定)
水平终结线的横截条件:
[ H ]t T 0
t
0
T
T2
T
(7.39)
H
2
u
2
2 0
u (t )
的解是最大化 H
例1 最大化
满足 y y u 和 y (0 ) 1
V
1 0
u dt
2
y (1) 0
汉密尔顿函数: H u 2 ( y u )
0
H t , y
(T ) y T ( 0 ) y 0
的第一项对 求导,得:
T ( ) 0
(7.28)
H H q ( t ) dt H y q (t ) p (t ) u y
f (t , y , u ) H
以上两个方程右边相同,因此左边相等:
y
推导得到最大值 原理的条件之一
以上推导得到:
H ( t , y , u , ) y ( t ) dt ( T ) y
T 0
T
(0) y0
步骤3 推导新目标泛函 的另一种形式
推导得到最大值原 理的一般横截条件
第二节 其他终结条件
一般横截条件:
H t T T
(T ) y T 0
(7.30)
y
y Z
• 固定终结点的横截条件:
y (T ) y T
(T 和
y T 给定)
水平终结线的横截条件:
[ H ]t T 0
t
0
T
T2
T
最优控制-极大值原理

近似算法
针对极大值原理的求解过程,开 发了一系列近似算法,如梯度法、 牛顿法等,提高了求解效率。
鲁棒性分析
将极大值原理应用于鲁棒性分析, 研究系统在不确定性因素下的最 优控制策略,增强了系统的抗干 扰能力。
极大值原理在工程领域的应用
航空航天控制
在航空航天领域,利用极大值原理进行最优 控制设计,实现无人机、卫星等的高精度姿 态调整和轨道优化。
03
极大值原理还可以应用于经济 学、生物学等领域,为这些领 域的研究提供新的思路和方法 。
02
最优控制理论概述
最优控制问题定义
01
确定一个控制输入,使得某个给定的性能指标达到 最优。
02
性能指标通常由系统状态和控制输入的函数来描述。
03
目标是在满足系统约束的条件下,找到最优的控制 策略。
最优控制问题的分类
1 2
确定型
已知系统的动态模型和控制约束,求最优控制输 入。
随机型
考虑系统的不确定性,如随机干扰、参数不确定 性等。
3
鲁棒型
考虑系统模型的不确定性,设计鲁棒控制策略。
最优控制问题通过求解优化问题得到最优解的解析表达式。
数值法
02
通过迭代或搜索方法找到最优解。
极大值原理
03
基于动态规划的方法,通过求解一系列的子问题来找到最优解。
03
极大值原理
极大值原理的概述
极大值原理是现代控制理论中的基本原理之一,它为解决最 优控制问题提供了一种有效的方法。该原理基于动态系统的 状态和性能之间的关系,通过寻求系统状态的最大或最小变 化,来达到最优的控制效果。
在最优控制问题中,极大值原理关注的是在给定的初始和终 端状态约束下,如何选择控制输入使得某个性能指标达到最 优。它适用于连续和离散时间系统,以及线性或非线性系统 。
《最优控制》第3章庞德里雅金极大值原理解析

3
tf
t0
第3章——庞德里雅金极大值原理
(1)最优轨线 x * (t ) 和协态向量 (t ) 满足规范方程组
x
H H x
(2)在最优轨线 x * (t )上与最优控制 u * (t )上对应的哈密顿 函数取最小值
H ( x*, u*, , t )umin H ( x, u, , t )
目标泛函:
J dt , | f (t ) | 1 0
8
tf
第3章——庞德里雅金极大值原理
1 x2 x 问题:设系统的状态方程 其中控制变量u (t ) 满足约束 x u 2
, 条件 | u(t) | 1 设系统的初始状态 x1 (0) x10 , x2 (0) x20 ;
快速控制系统的这个特性称为有限切换原理,相应的 控制方式称为Bang-bang控制。 (6)求最优轨线
①u 1 2 u dx2 dt x2 t c1 x2 (0) x20 x2 (t ) t x20 x 1 2 1 x2 x1 (t ) t x20t x10 x 2
7
第3章——庞德里雅金极大值原理
2、双积分装置时间最优控制系统 考察惯用语性负荷在一无阻尼环境中运动情况:
Y (s) 1 m y 2 (t ) f (t ) 设m 1 G ( s ) F (s) S
1 x2 x 设 x1 y, x2 x 1 y 得 2 u x
4
第3章——庞德里雅金极大值原理
(3)边界条件
x ( t ) x(t0 ) x0 , (t f ) ①当 f 不受限制, x(t f )
②当存在终端约束条件
[ x(t f ), t f ] 0时,x(t0 ) x0
tf
t0
第3章——庞德里雅金极大值原理
(1)最优轨线 x * (t ) 和协态向量 (t ) 满足规范方程组
x
H H x
(2)在最优轨线 x * (t )上与最优控制 u * (t )上对应的哈密顿 函数取最小值
H ( x*, u*, , t )umin H ( x, u, , t )
目标泛函:
J dt , | f (t ) | 1 0
8
tf
第3章——庞德里雅金极大值原理
1 x2 x 问题:设系统的状态方程 其中控制变量u (t ) 满足约束 x u 2
, 条件 | u(t) | 1 设系统的初始状态 x1 (0) x10 , x2 (0) x20 ;
快速控制系统的这个特性称为有限切换原理,相应的 控制方式称为Bang-bang控制。 (6)求最优轨线
①u 1 2 u dx2 dt x2 t c1 x2 (0) x20 x2 (t ) t x20 x 1 2 1 x2 x1 (t ) t x20t x10 x 2
7
第3章——庞德里雅金极大值原理
2、双积分装置时间最优控制系统 考察惯用语性负荷在一无阻尼环境中运动情况:
Y (s) 1 m y 2 (t ) f (t ) 设m 1 G ( s ) F (s) S
1 x2 x 设 x1 y, x2 x 1 y 得 2 u x
4
第3章——庞德里雅金极大值原理
(3)边界条件
x ( t ) x(t0 ) x0 , (t f ) ①当 f 不受限制, x(t f )
②当存在终端约束条件
[ x(t f ), t f ] 0时,x(t0 ) x0
极大值原理MaximumPrincipleMaximumPrinciple

维尔斯特拉斯E函数 (Weierstrass Erdmann Function)
设有泛函 有 tf ( t ), t ] dt J ( x ) L[ x ( t ), x
t0
若用p(x,t)表示其极值曲线场中极值曲线斜率,则可以证 表示其极值曲线场中极值曲线斜率 则可以证 明泛函增量可表示为
3.1 泛函极值的充分条件
几个有关定义 个有关定义 正常场 定义3 3-1 1:若( x,t )平面某 )平面某一区域 区域D上每 上每一点都有曲线族中一条 点都有曲线族中 条 且仅有一条通过,则称曲线族在区域D上形成一个正常场。曲线族 上点(x,t)处的切线的角系数称为场在点(x,t)的斜率。 中心场 定义3-2:若区域D上曲线族的全部曲线都通过一点(x0,t0),即 它们形成曲线束,且束心也属于 它们形成曲线束,且束 也属于D,同时除束 ,同时除束心外,曲线在 外,曲线在D内不 再相交,曲线布满区域D,则该场为中心场。 极值曲线场 定义3-3 3 3:若正常场或中心场是由某一变分问题的极值曲线族所形 若正常场或中心场是由某 变分问题的极值曲线族所形 成,则称之为极值曲线场。 以上定义可以从平面场拓展到n维空间场。
对于强极值,
① 曲线c应是满足极值条件的极值曲线; ② 极值曲线c能够被包含在极值曲线场中; 能够被包含在极值曲线场中 , p, t ) 值,函数 E ( x , x ③ 对于c近旁所有点(x, t)以及任意的 x 不变号 极小值时E≥0,极大值时 不变号,极小值时 极大值时E≤0。
3.2 连续系统极大值原理
•
J a ( u) [ x ( t f ), t f ] T [ x ( t f ), t f ]
f 2 ]}dt (3-2-8) , t ) T[ f ( x , w , t) x ] T [ g( x , w , t) Z { L( x , w
最优控制理论习题课

2
1, 2 (t) c2et
c1
1 2
u2
(1
2
) x2
2u
S ( x(2))
1 2
[ x1 (2)
5]2
1 2
[ x2
(2)
2]2 ,
G(x(2)) x1(2) 5x2 (2) 15 0
控制方程:
H u
0 u 2
0 u(t) c2et
c1
x2 (t) x2 (t) u
最优控制理论习题
--变分法、极大值原理
例1设系统状态方程为
x& u,
边界条件为
x(0)
1,x(t
f
)
0,
(t
自由)
f
性能指标为
J
tf
1 2
t f u 2 dt
0
要求确定最优控制 u *,使 J 最小。
解:这是 t f 自由问题。终端状态固定,x(t f ) 0 是满足约束集的特殊情况,即
G[ X (t f ), t f ] x(t f ) 0
)T )
v(t f
)
2 (2) x2 (2) 2 5v c2e2 c1
代入 x1 (2), x2 (2)
0.5c2 c3 c1 0.5c2
c4 c3
0 0
7c1 3e2c2 4e2c3 c4 15 x1 (2) 5x2 (2) 15
3c1 0.5e2c2 e2c3 c4 v 5
优控制 u* (t) 2
再由规范方程 x u ,可得
x(t) 2 t c
由初始条件 x(0) 1 ,求得 c 1 ,故最优轨迹为
x* (t) 2 t 1 以终端条件
x*
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
即:设 X * (t), * (t) 为满足状态方程和协状态方程的最优解。
在 H[X * (t),U * (t), * (t),t] 中。把H仅看作U的函数,若J为最小,必要条
件为 U * (t) 使得 H[X * (t),U * (t), * (t),t] 仅看作U的函数时也取最小值。
极小值原பைடு நூலகம்的证明:应用数学基础较多,有些书中用很大篇幅进行
(t f
)
X
tf
g T X
tf
g[ X (t f ), t f ] 0
t 若
f 自由:外加:
H |t f
t f
g T
t f
0
四、例题分析 :设一阶系统状态方程:
•
x(t) x(t) u(t)
x(0)=5
控制约束: 0.5 u 1
试求使性能指标: J
1
[x(t) u(t)]dt
第三章 极小值原理及应用
经典变分法缺陷:
1、应用前提:a 、控制量 u(t)的取值不受任何限制,没有任何 不等式约束。
b 、 f、L、 等函数对其自变量有充分可微性。
2、实际控制要求: a 、控制量u受不等式约束,如:Mi (u) 0 ,i=1,2,3…… b 、性能指标有时并不完全可微
如:燃料最优控制: J t f u(t) dt t0
若在容许控制范围内,J或H有极值且唯一,用极小值 原理与经典变分法,所得
结论一致。
一、<定理>极小值原理:[时变系统]
时变受控系统
•
X
f
(X ,U,t),其中控制向量u(t)
R r,
为容许控制
域, U(t)是在内取值的任何分段连续函数,为使状态向量由初始
X (t0 ) X 0 转移到末端 X (t f ),X (t f ) 满足约束:g[ X (t f ), t f ] 0 ,
4et 1
0 t 0.307
所以 X * (t)
4.34et 0.5 0.307 t 1
将 X * ,U * 代入J可得:
J *
1
[
X
* (t )
U
* (t )]dt
8.64
0
例2: min J (u) 1 1(x2 u2 )dt
J[U ] H
u0 u u2
U 00 U11 U2 u
若采用经典变分:
H U
0,U *
U1;实际应为U *
U
。极小值原理。
0
J[U ] H
u0 u u1
U0
U1 u
若采用经典变分法: H 0 不再适用,求不出解来
U
实际应为 U * U0 极小值原理
J[U ] H
U0 U * U1
u u0 u u1
2) t0 , X (t0 ) X 0 给定,X (t f )自由,t f 未给定,
边界条件:
X
(t0
)
X 0, (t
f
)
X
t |t f 确定 f
:
H tf
t f
0
3) t0 , t f 已知,X (t0 ) X 0给定,末端受约束 g[ X (t f ), t f ] 0
边界条件为: X (t0 ) X 0
0
为极小值的最优控制U *(t)及最优性能指标 J *
t 解:定常系统, f 固定,末端自由问题
H x u (x u) x(1 ) u(1 )
根据极小值原理,使H绝对极小相当于使J为极小
1 1
所以 U * (t)
0.5 1
由协状态方程:
•
(t
)
H
[1 (t)]; (t) cet 1
在证明过程中:
与H得符号与这里所定义的相反。
_
H
H
_
_
H[X * (t), (t),U * (t)] max H[X * (t), (t), u(t)]
u(t)
∴所以有的文献中也称为“极大值原理”。
3、H对u没有可微要求,因此应用拓宽。 4、 极小值原来是求取最优控制的必要条件,非充分条件。 即:满足极小值原理不一定J取极小值,需进一步判断。
X (t0 ) X 0
(t
f
)
[ X (t f ), t
X (t f )
f
]
gT [ X [
X
(t (t
f f
,t )
f
)]
]
H
tf
t f
( gT t f
)
0
3、与 U * (t) 对应的哈密顿函数H取极小值。
H[X *(t),U *(t), *(t), t] min H[X *(t),U (t), *(t), t] u (t )
证明,省略。
二、极小值原理的意义:
1 、容许控制条件放宽
变分法:在整个控制域,对U没有约束 H 0 且即使U不受限制,
有时 H 0 计算不易。
u
u
极小值原理:H在U的约束闭集中取极小值。
变分法仅为极小值原理的一个特例。
2、最优控制 U * 使哈密顿函数H取极小值,极小值原理由此得名。
这一原理是苏联学者 “庞特里亚金”等人首先提出,而后加以证明得
t f 未定, 并使性能指标达
J
[ X (t f ), t f ]
tf t0
L[X (t),U (t), t]dt
到极小值。设
U
*
(t
)
和t
* f
是如上J为最小的最优解,X
*
(t
)为最优状态轨
线,则必存在不为0的n维向量 (t),满足:
1、规范方程:
•
X f (X ,U,t)
•
H
X
2、边界条件:
一般:对于实际系统 有最优解 有唯一解 最优解 根据物理意义 --------
极小值原理
--------
--
三、几种边界条件得讨论:
上面所讨论的是 t0和 X (t0 ) 已知。X (t f )受约束,t f 自由的最一般
情况。若 t f 和末端状态不同,只需改变极小值原理的边界条件即可。
1)t0 , t f已知,X (t0 ) X 0 , X (t f ) X f 边界条件为:X (t0 ) X 0 , X (t f ) X f
X
由横截条件: (1) ce1 1 0;c e;(t) e1t 1
显然:当 (ts ) 1时,U * (t) 产生切换
(ts ) e1ts 1 1,ts 0.307
1 0 t 0.307
所以 U * (t)
0.5 0.307 t 1
•
x(t)
x(t) 1 0 t 0.307
x(t) 0.5 0.307 t 1
x(t)
c1et 1 c2et 0.5
0 t 0.307 0.307 t 1
由x(0)=5代入,得c1 4
所以 x*(t) 4et 1
0 t 0.307
令t=0.307可得0.307≤t≤1时x(t)的初始条件:
x(0.307) 4e0.307 1 6.44 解得 c2 4.34
在 H[X * (t),U * (t), * (t),t] 中。把H仅看作U的函数,若J为最小,必要条
件为 U * (t) 使得 H[X * (t),U * (t), * (t),t] 仅看作U的函数时也取最小值。
极小值原பைடு நூலகம்的证明:应用数学基础较多,有些书中用很大篇幅进行
(t f
)
X
tf
g T X
tf
g[ X (t f ), t f ] 0
t 若
f 自由:外加:
H |t f
t f
g T
t f
0
四、例题分析 :设一阶系统状态方程:
•
x(t) x(t) u(t)
x(0)=5
控制约束: 0.5 u 1
试求使性能指标: J
1
[x(t) u(t)]dt
第三章 极小值原理及应用
经典变分法缺陷:
1、应用前提:a 、控制量 u(t)的取值不受任何限制,没有任何 不等式约束。
b 、 f、L、 等函数对其自变量有充分可微性。
2、实际控制要求: a 、控制量u受不等式约束,如:Mi (u) 0 ,i=1,2,3…… b 、性能指标有时并不完全可微
如:燃料最优控制: J t f u(t) dt t0
若在容许控制范围内,J或H有极值且唯一,用极小值 原理与经典变分法,所得
结论一致。
一、<定理>极小值原理:[时变系统]
时变受控系统
•
X
f
(X ,U,t),其中控制向量u(t)
R r,
为容许控制
域, U(t)是在内取值的任何分段连续函数,为使状态向量由初始
X (t0 ) X 0 转移到末端 X (t f ),X (t f ) 满足约束:g[ X (t f ), t f ] 0 ,
4et 1
0 t 0.307
所以 X * (t)
4.34et 0.5 0.307 t 1
将 X * ,U * 代入J可得:
J *
1
[
X
* (t )
U
* (t )]dt
8.64
0
例2: min J (u) 1 1(x2 u2 )dt
J[U ] H
u0 u u2
U 00 U11 U2 u
若采用经典变分:
H U
0,U *
U1;实际应为U *
U
。极小值原理。
0
J[U ] H
u0 u u1
U0
U1 u
若采用经典变分法: H 0 不再适用,求不出解来
U
实际应为 U * U0 极小值原理
J[U ] H
U0 U * U1
u u0 u u1
2) t0 , X (t0 ) X 0 给定,X (t f )自由,t f 未给定,
边界条件:
X
(t0
)
X 0, (t
f
)
X
t |t f 确定 f
:
H tf
t f
0
3) t0 , t f 已知,X (t0 ) X 0给定,末端受约束 g[ X (t f ), t f ] 0
边界条件为: X (t0 ) X 0
0
为极小值的最优控制U *(t)及最优性能指标 J *
t 解:定常系统, f 固定,末端自由问题
H x u (x u) x(1 ) u(1 )
根据极小值原理,使H绝对极小相当于使J为极小
1 1
所以 U * (t)
0.5 1
由协状态方程:
•
(t
)
H
[1 (t)]; (t) cet 1
在证明过程中:
与H得符号与这里所定义的相反。
_
H
H
_
_
H[X * (t), (t),U * (t)] max H[X * (t), (t), u(t)]
u(t)
∴所以有的文献中也称为“极大值原理”。
3、H对u没有可微要求,因此应用拓宽。 4、 极小值原来是求取最优控制的必要条件,非充分条件。 即:满足极小值原理不一定J取极小值,需进一步判断。
X (t0 ) X 0
(t
f
)
[ X (t f ), t
X (t f )
f
]
gT [ X [
X
(t (t
f f
,t )
f
)]
]
H
tf
t f
( gT t f
)
0
3、与 U * (t) 对应的哈密顿函数H取极小值。
H[X *(t),U *(t), *(t), t] min H[X *(t),U (t), *(t), t] u (t )
证明,省略。
二、极小值原理的意义:
1 、容许控制条件放宽
变分法:在整个控制域,对U没有约束 H 0 且即使U不受限制,
有时 H 0 计算不易。
u
u
极小值原理:H在U的约束闭集中取极小值。
变分法仅为极小值原理的一个特例。
2、最优控制 U * 使哈密顿函数H取极小值,极小值原理由此得名。
这一原理是苏联学者 “庞特里亚金”等人首先提出,而后加以证明得
t f 未定, 并使性能指标达
J
[ X (t f ), t f ]
tf t0
L[X (t),U (t), t]dt
到极小值。设
U
*
(t
)
和t
* f
是如上J为最小的最优解,X
*
(t
)为最优状态轨
线,则必存在不为0的n维向量 (t),满足:
1、规范方程:
•
X f (X ,U,t)
•
H
X
2、边界条件:
一般:对于实际系统 有最优解 有唯一解 最优解 根据物理意义 --------
极小值原理
--------
--
三、几种边界条件得讨论:
上面所讨论的是 t0和 X (t0 ) 已知。X (t f )受约束,t f 自由的最一般
情况。若 t f 和末端状态不同,只需改变极小值原理的边界条件即可。
1)t0 , t f已知,X (t0 ) X 0 , X (t f ) X f 边界条件为:X (t0 ) X 0 , X (t f ) X f
X
由横截条件: (1) ce1 1 0;c e;(t) e1t 1
显然:当 (ts ) 1时,U * (t) 产生切换
(ts ) e1ts 1 1,ts 0.307
1 0 t 0.307
所以 U * (t)
0.5 0.307 t 1
•
x(t)
x(t) 1 0 t 0.307
x(t) 0.5 0.307 t 1
x(t)
c1et 1 c2et 0.5
0 t 0.307 0.307 t 1
由x(0)=5代入,得c1 4
所以 x*(t) 4et 1
0 t 0.307
令t=0.307可得0.307≤t≤1时x(t)的初始条件:
x(0.307) 4e0.307 1 6.44 解得 c2 4.34