时间最优控制

合集下载

输入饱和的双积分系统的复合时间最优控制

输入饱和的双积分系统的复合时间最优控制

输入饱和的双积分系统的复合时间最优控制张义超;黄晨;陆浩然;孙戎【摘要】针对典型的有输入饱和的双积分环节或系统的时间最优控制问题,建立了双积分环节的传递函数和状态空间方程两种数学模型,设计双积分环节的闭环时间最优控制律;对时间最优控制在系统存在干扰和不确定性存在条件下出现的振颤现象进行分析;基于对振颤问题的分析,提出一种对时间最优控制的改进,即一种复合控制方法,当输入作用时,系统先由时间最优控制律控制,当误差达到预定值限,控制律由时间最优控制律切换到另一种线性控制律.采用了比例微分控制律,来解决时间最优控制的振颤问题,响应时间达到最优,并解决振颤问题.%To the issue of time optimal control of double integrating systems with input saturation,the transferring function model and state-space model of double integrating systems are established,and the time optimal controller (TOC) is designed.Unfortunately,it is well known that the classical TOC is not robust with respect to the system uncertainties and measurementnoises.Thus,we,in the paper,study the chatter problem by simulation and introduces a nonlinear composite control,method,i.e.,a combination of time optimal control (TOC) and PID control,for double integrating systems with input saturation.The TOC part is designed to enable the time optimization.In order to solve the drawback of TOC,when the error is small to a certain level,it will switch to the PD part to overcome the chatter problem caused by the TOC.Finally,the simulation results,approximate time optimization and fair robustness demonstrate the effectiveness and feasibility of the proposed method.【期刊名称】《计算机测量与控制》【年(卷),期】2017(025)004【总页数】4页(P51-53,57)【关键词】双积分环节;时间最优控制;振颤;复合控制【作者】张义超;黄晨;陆浩然;孙戎【作者单位】北京宇航系统工程研究所,北京100076;北京宇航系统工程研究所,北京100076;北京宇航系统工程研究所,北京100076;北京宇航系统工程研究所,北京100076【正文语种】中文【中图分类】TP273我们周围的很多实际系统,都可以看作双积分系统,并且具有显著的非线性。

最优控制的计算方法

最优控制的计算方法
5
1、梯度法
3、用UK(t)、XK(t)和横截条件求得的终端值(tf),从tf 到t0反向积分协态方程,求出协态向量K(tf)。 4、计算哈密顿函数H对U的梯度向量 H K g ( )K U H K ( ) K 表示在 U K 、X K 、 处取值。当这些量非最优值 U 时, g K 0 。
U
(iii)边界条件(包括横截条件) 最优控制的计算方法一般是先求出满足上面三个条件中 某两个的解,然后用合适的迭代计算形式逐次改变这个解, 以达到满足剩下的另一个条件的解(即最优解)。
4
一、直接法
1、梯度法 这是一种直接方法,应用比较广泛。它的特点是:先猜 测任意一个控制函数U(t),它可能并不满足H 取极小的必要 条件,然后用迭代算法根据H 梯度减小的方向来改善U(t), 使它最后满足必要条件。 计算步骤如下: 1、先猜测[t0, tf]中的一个控制向量UK(t)=U0(t),K是迭代 步数,初始时K=0。U0 的决定要凭工程经验,猜得合理,计 算收敛得就快 2、在第K步,以估计值UK和给定的初始条件X(t0),从t0 到tf 顺向积分状态方程,求出状态向量XK(t)。
(2) 以 X (t 0 ) 为初值,从 t 0 到 t f 积分状态方程,得出状态 轨迹 X K (t )。 (3) 以 (t f )为终值,从 t f 到 t 0 反向积分协态方程,求得 协态轨迹 K (t ) 。 H (4) 计算梯度向量 g K ( ) u u k u
(5) 计算共轭系数
8
1、梯度法
0 1、选初始估计 u (t ) 0 。
2、将 u 0 (t ) 0 代入状态方程可得 dx dt 2 x 1 t c 积分上式可得 x 代入初始条件: x(0) 10 ,确定积分常数 1 c 10 10 0 可得 x(t ) x (t ) 10t 1

基于最小值原理的壁面攀爬机器人时间最优控制

基于最小值原理的壁面攀爬机器人时间最优控制

·智能控制技术·徐林孙树栋陈立彬等基于最小值原理的壁面攀爬机器人37 基于最小值原理的壁面攀爬机器人时间最优控制徐林,孙树栋,陈立彬,杨建元(西北工业大学机电学院,陕西西安710072)摘要:首先简要介绍了一种新型双索牵引壁面攀爬机器人结构,并建立了该系统的数学模型。

其次,依据庞特里雅金最小值原理推出了机器人本体两点间运动时间最优的控制律,并将该非线性方程组的求解看作是一个两点边值问题,通过引入简单打靶法以及一种初值猜测技术来求解该方程组。

最后,数值仿真表明所建模型及控制规律是可行的。

关键词:壁面攀爬机器人;最小值原理;时间最优控制;两点边值问题;打靶法中图分类号:TP242. 3 文献标识码:A 文章编号:1672 - 1616( 2006) 21 - 0037 - 05随着城市规模的不断扩大,越来越多的高层建筑如雨后春笋般涌现出来,人们在惊叹现代建筑艺术、享受现代生活的同时,又面临着一个关系生命安危的问题———那就是高层消防和救援问题。

研究人员已经提出了利用消防特种机器人和高空作业机器人的方法。

但是,现有的消防特种机器人大多只能在地面作业;而高空作业机器人,由于一部分采用的是吸附的运动方式, 使得其移动速度较慢,可携带的负载也较轻,无法快速进入着火点实施有效的消防和救援作业;另一部分采用楼顶预置水平轨道的吊篮型装置,虽然其运动迅速,且有一定的负载能力,但是预置楼顶轨道的要求致使这种装置不适用于消防、救灾等作业。

针对高空消防、救援等作业的特殊要求,我们提出一种特殊的机器人组合系统,使机器人本体能携带较大负载且能快速到达着火点实施侦察、消防及救援工作。

1 时间最优控制模型建立1 . 1 原理简述和分析攀爬机器人组合系统工作原理可简述为:通过一种无限程攀爬装置将地面动力电机的绕转扭矩经牵引钢丝绳远距离传递给机器人本体,本体利用摩擦力作用将该扭矩转化为其攀升的动力,从而实现了通过地面电机对机器人本体壁面运动的驱动。

5 最优控制-极小值原理

5 最优控制-极小值原理
* j
正常(或平凡)情况、奇异(或非平凡) 正常(或平凡)情况、奇异(或非平凡)情况
Bang-Bang控制原理 控制原理 是问题3 的时间最优控制, 设 u * ( t ) 是问题3-1的时间最优控制,
λ x* ( t ), ( t )
是相应的状态向量和协态向量,若问题是正常的, 是相应的状态向量和协态向量,若问题是正常的,则几乎所有 ),有下式成立 t ∈ t0 , t f (除去有限个开关时间),有下式成立 除去有限个开关时间),
在最优轨线末端哈密尔顿函数应满足的条件 (5)极值条件 极值条件
1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x * ( t ) , t u * ( t ) =
{1 + λ T ( t ) f x* ( t ) , t + λ T ( t ) B x* ( t ) , t u * ( t )} min
u∈U
(50) ) (51) ) (52) )
或者
H ( x * , u* , λ* , t ) ≤ H [ x * , u, λ* , t ]
哈密顿函数沿最优轨线随时间的变化规律: 哈密顿函数沿最优轨线随时间的变化规律:
* * 在末值时刻 t f 是固定的情况 H (t ) = H (t f ) = const * *
3 极小值原理及其在快速控制中的应用
1 问题的提出 用变分法求解最优控制时, 用变分法求解最优控制时,认 不受限制。 为控制向量 u(t )不受限制。但是 实际的系统, 实际的系统,控制信号都是受到
u(t ) ∈ U ⊂ R r 某种限制的。 某种限制的。
因此, 因此,应用控制方程 ∂H = 0

hjb方程

hjb方程

hjb方程对于一个最优控制问题,HJB方程是连续时间最优控制的充分必要条件。

Hamilton-Jacobi-Bellman方程如何理解HJB方程−∂ V ∂ t ( x ( t ) , t ) = min ⁡ u ( t ) ∈ U { g ( x( t ) , u ( t ) , t ) + ∂ V ∂ x ( x ( t ) , t ) ⋅ f ( x ( t ) , u ( t ) , t ) } -\frac{ \partial V }{ \partialt }(x(t),t)=\mathop{\min}_{u(t)\inU}\left\{g(x(t),u(t),t)+\frac{ \partial V }{ \partialx }(x(t),t)\cdot f(x(t),u(t),t) \right\} −∂t∂V(x(t),t)=minu(t)∈U {g(x(t),u(t),t)+∂x∂V(x(t),t)⋅f(x(t),u(t),t)}其中 V V V是值函数, g g g是过程成本, f f f是状态方程公式的理解首先要理解值函数代表什么。

值函数是性能指标(定义在下文)的最优值。

一般性能指标都是由两部分组成,一部分是积分,一部分就是一个和终点有关的值。

比如从A开车去B,那么积分的部分可以是油钱,这取决于你的控制方式和在这段时间的行驶距离。

第二部分就是停止时离终点的距离。

这里的油钱也被称为过程成本。

控制(油门,刹车)用状态方程表示,给定当前位置和控制,就能知道下一时刻的位置在哪里。

这个式子有个隐含条件就是已知全程所用的时间。

那么就是说在给定时间内,每一秒,都对应了应该用什么控制去走多少米。

公式左边对应的是最优值随时间的变动,加负号是因为时间不能返流,满足因果关系。

现在看公式右边,第一项是当前所需要的油钱,第二项的偏导数说的是位置变动会引起最优值变动多少,那么具体移动多少移动到哪里是由状态方程决定的,那么第二项的意思就显而易见了,在当前位置,通过控制,实现移动后,能让最优值改变多少。

时间最优控制

时间最优控制

其 中x(t ) Rn,u(t ) Rm,f ()和B()的 各 元 对x(t )和t连 续 可 微 ,
g() R p, 其 各 元 对x(t f )和t f 连 续 可 微 ,t f 是 状 态 轨 线 首 次 与 目标集相遇的时刻。
为 统 一 起 见 , 时 间 最 优控 制 问 题 的 性 能 指 标 取为 积 分 型
为奇异区间。
7
定 理4.4.1 Bang Bang控 制 原 理 设u*(t )是 问 题4.4.1的 时 间 最 优 控 制 , 且 问题4.4.1是 正 常 的 , 则最优控制
u*(t ) sgnq(t ) sgn BT ( x(t ),t )(t )

u*j (t )= sgn q j (t ) sgn bTj ( x(t ),t )(t )
j 1,2, , m; t t0 , t f
因 此 时 间 最 优 控 制 的 各个 分 量u*j (t )都 是 时 间t的 分 段 常 值 函 数 , 在q j (t )=0的 诸 点 上 ,u*j (t )由 一 个 边 界 值 切 换到另一个边界值。
8
4.4.2 线 性 定 常 系 统 的 时 间 最优 控 制 问 题 4.4.2 已 知 线 性 定 常 系 统x(t ) Ax(t ) Bu(t ) 是 完 全 能 控 的 , 求 满 足约 束
u j (t ) 1
设 q(t) BT (x(t),t)(t)
或 q j (t) bTj (x(t),t)(t), j 1,2, , m
其中bj (x(t),t)是矩阵B的第j个列向量,于是(1)式可写为
m
m
T (t)B(x*(t),t)u*(t)

具有时滞的广义时间最优控制问题的近似最优解

具有时滞的广义时间最优控制问题的近似最优解
里令:Q( = ( ( ) ・∈ J 一 , , { f ・ , ) } ∈[t ) , ) ( V ]
d * m - i - n
f £I
,、 ,
t 卜to e ,]
注意 :本文< ・卜 ・> 1 ,, 分别为欧 氏空间的内积和相应 的诱导范数, (- 表示矩 的共轭转置。这 ・) ,
维普资讯
星塑 !
墨! 塑 竺 墨
墨 堡
竺 苎 竺
..

^ + )C(+  ̄ ;+zc + ( s £ )C(+ )1 (+( ( + c 参 ; T口 T6 1 ) )c 。 ) < ; 9 b a )

( , f) f Q( , I J。 ) ) 而且 =

I O If mi{ [ , ) ,= lf 一, * l ∈ ]
( , )= ; f QO ) ) )
这里 :d ,)if - lV ∈ ∈ =nl z , 尺 , 尺 。同时为了讨论的方便 ,我们假设: x
维普资讯
第l卷第l 4 期 20 0 7年 2月
J OURNAL OF DONGGUAN NI RS Y F T CHNOLOGY U VE n O E
东 莞 理 工 学 院 学 报
V 1 4 o1 o 1 . . N
Fe . 00 b2 7

个近似解。
1 主 要 结 论
先介绍本文 的主要结论 。
定理11 引言假设成立,引理12 . .的条件也成立 ,- e o) 和正整数Ⅳ,  ̄ (,, -6 使得
收稿 日期: 0 6 0 —0 2 0— 4 7
作者简 介: 齐斌(1 7 9 8一) 男 , , 安徽 固镇人 , 师 , 讲 主要从事 泛 函微 分方 程研究 。

最优控制的基本理论及应用

最优控制的基本理论及应用
前苏联学者庞特里亚金等则在1956~1958年间创立 了极小值原理, 也发展了经典变分原理,成为处理控 制有闭集约束的变分问题的强有力工具。
本章在介绍解决最优控制问题3种基本方法(变分 法、极小值原理和动态规划)的基础上,阐述两类典 型最优反馈系统的设计,即线性二次型最优控制和最 小时间控制。
6.2 最优控制问题的提出及数学描述
6.3.2 用变分法求解无约束条件的泛函极值问题
设积分型性能泛函为
Jtt0f L[x(tx)(,t)]d,tt
(6-24)
在区间[t0 ,t f ]上,被积函数 L[x(t),x(t),t]二次连续可微, 轨线x(t)有连续的二阶导数,x(t)Rn ,对x(t)没有任何 约束。要求确定极值轨迹 x *(t) ,使泛函J为极值。
级数 ,则
J()tt0f L x Tη(t) L x Tη (t)R dt
(6-29)
式中,R表示泰勒(Taylor)级数展开式中的高阶项。
如果定义x(t)和 x (t) 的一阶变分为 δ x εη (t),δ x εη (t)
由泛函变分的定义,泛函的一阶变分为
(6-30)
6.2.2 最优控制问题的数学描述
构成最优控制问题必须具备以下几个基本条件:
1.被控系统的数学模型,即动态系统的状态方程
状态方程在最优控制中为等式约束条件。
2.控制变量的约束条件(容许控制)
任何实际物理系统,控制变量总是受约束的,一
般可写成
u(t)U
(6-3)
式中,U表示一个封闭的点集合,称为控制域。此时称 u(t)为容许控制。
1)积分型性能泛函
Jtt0f Lx((t)u,(t),dtt)
2)终值型性能泛函
J[x(tf ),tf]
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

正常情况 当q j ( t ) = 0 奇异情况
6
定义 3.3. 1 若所有的函数 q j ( t ), j = 1, 2, L , m , 在时间 区间 t 0 , t f 上只存在有限个零点, 则对应的时间最优 上只存在有限个零点, 控制问题是正常的。 控制问题是正常的。 定义 3.3. 2 若对所有的 j = 1,2, L , m , 至少存在一个 q j ( t ) 函数,在某一段时间区 间 t1 , t 2 ⊂ t 0 , t f 上取零值,则 函数, 上取零值, 题是奇异的, 对应的时间最优控制问 题是奇异的,并把区间 t 1 , t 2 称 为奇异区间。 为奇异区间。
Gj e
[
j
j
− AT t
λ (0) = 0
]
j
12
也即
λT (0)e − At G = 0
j
( 2)
由矩阵理论可知, 奇异, 由矩阵理论可知, λ (0)有非零解的充要条件是 矩阵e − At G j 奇异, 即 det e − At G j = det e − At det G j = 0 非奇异, 因为e − At 非奇异,所以 det G j = 0,即( 2)式成立的充要条件是 G j 为奇异矩阵。因此问题 4.4.2奇异的充要条件是 G j 为奇异矩阵。 为奇异矩阵。 为奇异矩阵。
u* ( t )= − sgn q j ( t ) = − sgn bT ( x ( t ), t )λ ( t ) j j
{
}
{
}
j = 1,2,L , m; t ∈ t 0 , t f
[
]
5
1, * u j ( t )= − 1, u* ( t ) ≤ 1, j
当q j ( t ) < 0 当q j ( t ) > 0
{
}
u* ( t )= − sgn q j ( t ) = − sgn bT ( x( t ), t )λ ( t ) j j
{
}
{
}
j = 1,2, L , m; t ∈ t 0 , t f 因此时间最优控制的各 个分量 u* ( t )都是时间 t的分段 j
[
]
常值函数, 的诸点上, j 常值函数,在 q j ( t )=0的诸点上, u* ( t )由一个边界值切 换到另一个边界值。 换到另一个边界值。
4.4 时间最优控制
时间最优控制也称为快 速控制或最速控制 4.4.1 一类非线性系统的时间 最优控制 问题 4.4.1
u j ( t ) ≤1
min J =

tf
t0
dt ,
j = 1, 2, L m x(t0 ) = x0
& s .t . (1) x ( t ) = f ( x ( t ), t ) + B ( x ( t ), t )u( t ), ( 2 ) g ( x ( t f ), t f ) = 0
1
H ( x ( t ), u( t ), λ ( t ), t ) = 1 + λT ( t ) f ( x( t ), t ) + λT ( t ) B( x( t ), t )u( t ) 1)正则方程 ∂H = f ( x( t ), t ) + B( x ( t ), t )u( t ) ∂λ T ∂H ∂f T ( x( t ), t ) ∂ [B( x( t ), t )u( t )] & λ ( t )= − λ (t ) − λ (t ) =− ∂x ∂x ( t ) ∂x ( t ) & x ( t )= 2)边界条件 x ( t 0 ) = x0 g ( x ( t f ), t f ) = 0 ∂g T ( x( t f ), t f ) ∂x ( t f )
[ ]
11
假设问题4.4.2是奇异的,则至少存在某一时间区间[t1 , t2 ] ⊂ 0, t f , 使得某一q j (t )满足 q j (t ) = b λ (t ) = b e
T j T j − AT t
[ ]
λ (0) = 0,对∀t ∈ [t1 , t2 ]
(1)
对q j (t ) = b e
m
j = 1,2,L , m
m
其中b j ( x(t ), t )是矩阵B的第j个列向量,于是(1)式可写为
λT (t ) B( x* (t ), t )u * (t ) = ∑ q j (t )u *j (t ) = min
j =1
u j ( t ) ≤1
∑ q (t )u
j =1 j
j
(t )
j = 1,2,L , m
Hale Waihona Puke λ (t f ) =T
µ
T T
3)1 + λ ( t f ) f ( x ( t f ), t f ) + λ ( t f ) B( x ( t f ), t f )u( t f ) = − µ
∂g( x( t f ), t f ) ∂t f
2
H ( x(t ), u (t ), λ (t ), t ) = 1 + λT (t ) f ( x(t ), t ) + λT (t ) B( x(t ), t )u (t ) 令h( x(t ), u (t ), λ (t ), t )= λT (t ) B( x(t ), t )u (t ) 4) 极值条件为:
9
H ( x( t ), u( t ), λ ( t ), t ) = 1 + λT ( t )[ Ax( t ) + Bu( t )] 1)正则方程 ∂H & x( t )= = Ax( t ) + Bu( t ) ∂λ ∂H & λ ( t )= − = − AT λ ( t ) ∂x 2)边界条件 x ( 0) = x0 x( t f ) = 0 3) u* ( t )= − sgn q j ( t ) = − sgn bT λ ( t ) j j
λT (t ) B( x* (t ), t )u * (t ) = min λT (t ) B( x* (t ), t )u (t )
u j ( t ) ≤1
(1)
设 q (t ) = B T ( x(t ), t )λ (t ) 或 q j (t ) = bT ( x(t ), t )λ (t ), j
19
适用于一般目标集。 定理 4.4.2 定理 4.4.5适用于一般目标集。 ~ 存在性定理) 定理 4.4.6 (存在性定理) 对于问题 4.4.2,若A的特征值均具有非正的 实部,那么从任意初态 转移到坐标原点的时间 最 实部, 优控制存在。 优控制存在。
20
8
4.4. 2 线性定常系统的时间最 优控制 & 问题 4.4. 2 已知线性定常系统 x ( t ) = Ax ( t ) + Bu ( t ) 是完全能控的, 是完全能控的,求满足 约束 u j ( t ) ≤ 1, j = 1,2, L m 并使系统从已知初态 x ( 0 ) = x 0 转移到状态空间原点 的时间最短。 的时间最短。
连续可微, 其中 x ( t ) ∈ R n, u( t ) ∈ R m, f (⋅ )和 B (⋅ )的各元对 x ( t )和 t连续可微, 连续可微, g (⋅) ∈ R p,其各元对 x ( t f )和 t f 连续可微, t f 是状态轨线首次与 目标集相遇的时刻。 目标集相遇的时刻。 为统一起见,时间最优 控制问题的性能指标取 为积分型 为统一起见, 性能指标。 性能指标。
15
定理 4.4.3 (问题 4.4.2为正常的充分必要条件) 当且仅当m个矩阵 G j = b j M Ab j M A b j MLLM A b j ,
2
[
n −1
]
j = 1,2,L m
全部都是非奇异矩阵时,则问题 4.4.2是正常的。
16
正常问题要求 A, b j , j = 1,2, L m,都是完全能控的。 单输入完全能控的线性定常系统的时间最优控制问题 是正常的。 正常系统:满足定理4.4.3的受控系统称为正常系统。 正常系统的时间最优控制是正常的。
[
]
[ ] [ ]
[ ]
13
定理 4.4.2 问题 4.4.2为奇异的充分必要条件 当且仅当 m 个矩阵 G j = b j M Ab j M A 2 b j MLLM An −1b j ,
[
]
j = 1,2, L m
阵时, 是奇异的。 中至少有一个是奇异矩 阵时,则问题 4.4.2是奇异的。
14
T j
− AT t
q (jk ) (t ) = (−1) k e − At An −1b j 令G j
2 j T
] λ (0) = 0, k = 0,1,L, n − 1 = [b M Ab M A b MLM A b ],则(1)式可写成矩阵形式:
T n −1
[
λ (0) = 0求导数,根据矩阵指数性质Ae At = e At A, 有
3
因各控制分量的约束是相互独立的,于是有
λT (t ) B( x* (t ), t )u * (t ) = ∑ min q j (t )u j (t )
j =1 u j ( t ) ≤1
m
4
的关系: 从而得到 u* ( t )与q j ( t )的关系: j 1, * u j ( t )= − 1, u* ( t ) ≤ 1, j 或 当q j ( t ) < 0 当q j ( t ) > 0 当q j ( t ) = 0
[
]
17
唯一性定理) 定理 4.4.4 (唯一性定理) 是正常的, 控制存在, 若问题 4.4.2是正常的,且时间最优 控制存在, 则最优控制必定唯一。 则最优控制必定唯一。
相关文档
最新文档