有限推力轨迹优化问题的直接打靶法研究_王华

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

有限推力轨迹优化问题的直接打靶法研究

王华 唐国金 雷勇军

(国防科技大学航天与材料工程学院,长沙410073)

摘要 研究了求解有限推力轨迹优化问题的直接打靶方法。说明了利用直接打靶法将

最优轨迹问题转化为参数优化问题的基本转换方法;给出了状态和控制变量的等式(或不

等式)约束的转化方法;从插值和数值积分两个方面对转换过程中产生的误差进行了深入

分析。最后,以最优交会问题为例,说明了不同节点数目和积分步数对计算结果的影响。

主题词 轨迹 最佳控制 直接打靶法 航天器

1 引言

直接轨迹优化将最优控制问题转化为参数最优化问题来解决,可以避免间接方法产生的两点边值问题的初始值难于估计的缺点,是解决航天器轨迹优化问题的一种重要方法。标准的直接方法将整个最优控制过程分成若干个时间段,时间段之间的端点称为节点。然后选择节点处的控制变量和(或)状态变量作为未知参数,通过插值得到整个最优控制过程的控制变量和(或)状态变量,根据这些变量来积分状态方程形成约束条件,从而得到一个数学规划问题[1]。

文献[2]将节点上的控制变量和状态变量作为优化的参数,利用基于Hermite 插值的隐式积分将轨迹优化问题转化为非线性规划问题,并将这种方法称为非线性规划与配置法。文献[3]提出了一个所谓的直接多重打靶方法,将节点处的控制变量和状态变量作为优化的参数,再选用某种插值法按有关节点上的控制参数插值,求得任意时刻的控制变量,并在每个时间段分别积分状态方程,将最优控制问题转化为非线性规划问题。文献[4]采用节点处的状态变量作为优化参数来研究轨迹优化问题;文献[5]采用节点处的控制变量作为优化参数来研究飞行器的再入和平面转移问题;文献[6]同样采用控制变量作为优化参数来解决最优控制问题。由于状态变量本身没有分段,当对控制节点的参数插值形成控制函数后,状态方程可以从初始端一直积分到终端,所以,这种采用控制参数作为优化变量的方法称为直接打靶法,它所形成的优化变量数目比多重打靶法要少得多。本文对求解有限推力最优轨迹问题的直接打靶法进行了研究,说明了基本的转换方法,对以前很少研究的转换误差进行了分析,并将直接打靶方法应用到空间最优交会问题中,比较了不同节点数目和积分步数对优化结果的影响。

2 有限推力最优轨迹问题描述

求解最优轨迹问题即是寻找控制函数U (t ),使得下面的最优指标最小

J =K (t f ,X f )(1)

收稿日期:2002-12-27。收修改稿日期:2003-03-03512003年10月 中国空间科学技术

第 5 期 CHIN ESE

SPACE SCIENCE AND TECHNOLOGY

X ·

=f (t ,X ,U )

X (t 0)=X 0

ψ(X f )=0

(X (t ),U (t ))≤0

θ(X (t ),U (t ))=0

(2)式中 X 、U 分别是状态和控制向量,下标0和f 分别代表初始和终端的变量,ψ表示终端约束, 和θ表示状态和控制向量的不等式和等式约束。

使用古典变分学中相似问题的术语,指标函数表示为式(1)情况下的最优控制问题称为Mayer 问题。在实际的轨迹优化问题中,有时也会有Lagrange 和Bolza 问题,这两种模型都可以通过扩大状态空间的维数转化为Mayer 问题。所以,我们在这里只研究M ayer 问题。3 直接打靶方法

3.1 基本转换方法

采用直接打靶法研究上述轨迹优化问题时,需要用离散变量来代替原模型中的连续变量,以使原问题变成一个参数优化问题。

首先要将整个飞行时间分为N 个时间段,这些时间段之间的节点处的时间为

t 0

这里的t N 就是终端时间t f 。设节点t k 上的控制参数为U k ,将未知参数写成一个矢量

D ≡[U T 0 … U T N t f ]T (3)

在式(3)中,涉及到时间的优化变量只有一个t f 。这是因为在通常情况下,N 个时间段是相等的,所以已知t f 的值,每个节点的时间就确定了。

知道了每个节点的控制参数后,通过对节点处的控制参数插值就可以得到整个飞行过程的控制,于是,状态方程可以从t 0、X 0积分到t f 得到终端状态

X f =X f (D )

这意味着终端状态由矢量D 完全确定了。于是,性能指标式(1)可以写为

J =F (D )

(4)

终端约束可写为

ψ(X f )=ψ(D )=0(5)

对于状态和控制向量的不等式约束 和等式约束θ,只能选择具有一定代表性的离散点使约束得到满足,这些离散点上的控制和状态向量同样可以由D 完全确定。通常选择节点上的控制和状态向量构成等式约束

(X (t k ),U (t k ))= (D )=0

(6) 不等式约束

θ(X (t k ),U (t k ))=θ(D )≤0(7)

最终得到的数学规划问题就是:寻找最优的设计变量D ,在满足约束式(5)~(7)的条件下,使式(4)表示的性能指标最小。

3.2 误差分析利用直接打靶法将轨迹优化问题转化为数学规划问题,误差的产生主要有两个方面:①节点处52

中国空间科学技术 2003年10月

的控制参数插值得到的控制函数与原控制函数的误差;②对状态方程进行积分的积分误差。

各节点处控制参数插值的目的就是得到一个控制函数V (t ),近似代替原控制函数U (t )。插值函数可以有各种选择,但最常用的是多项式或分段多项式,这是因为代数多项式具有一些很好的特性,如它具有各阶导数,计算多项式的值比较方便,等等。

最基本的插值方式是线性插值,即

V (t )=U k t -t k +1t k -t k +1+U k +1t -t k t k +1-t k

式中 U k 和U k +1分别是时间节点t k 和t k +1处的控制参数。此线性插值的余项为[7]

R (t )=U (t )-V (t )=U ″(ξ)2!

(t -t k )(t -t k +1), ξ∈(t k ,t k +1) 这里要注意的是,插值多项式的阶次高低和它与控制函数的逼近程度不一定成正比,高阶多项式可能会引起控制函数的过分波动,从而影响状态方程的积分结果。同样,三次样条插值也可能会引起控制函数的过分波动。另外,如果采用的是三次样条插值,并且其边界条件取为曲线在两端点的切线斜率,那么这两个斜率也应该作为优化变量来寻优。

求解常微分方程初值问题的数值积分方法的总体截断误差和局部截断误差之间的关系为:总体

截断误差=O (h -1×局部截断误差)。其中,h 是积分步长。一般说来,方法的总体截断误差阶数

越高,则能达到的精度也越高。

优化计算十分耗时,所以对积分方法的快速性和鲁棒性有一定的要求。R -K 方法精度较高,数值稳定性区域较大,所以在积分状态方程的时候经常被采用。四阶R -K 和八阶R -K 积分方法的总

体截断误差分别为O (h 4)和O (h 8)。

四阶以下的R -K 方法每积分一步需要计算相同次数的函数值,五阶R -K 方法积分一步需要计算6次函数值,八阶R -K 方法积分一步需要计算13次函数值。

尽管四阶R -K 方法每积分一步只需要计算4次函数值,但是有时更高阶的R -K 积分方法也有它自己的优势。例如,如果在t f -t 0=1的积分区间内需要的总体截断误差为10-8,那么四阶R -K 和八阶R -K 方法的积分步长分别是h 4=10-2和h 8=10-1,也就是说四阶R -K 方法在整个区间需要100步积分和400次函数值运算,而八阶R -K 方法在整个区间只需要10步积分和130次函数值运算。因此,只基于步长的考虑来说,八阶R -K 方法比四阶R -K 方法需要的计算时间少得多。

近年来许多学者分别提出了一些快速算法的思想,目的是使算法既要减少计算复杂性,又能具有较小的误差和数值稳定性,取得了一些成果[8]。

4 直接打靶法在有限推力最优交会问题中的应用

在目标轨道为圆(或近圆)轨道情况下,目标航天器轨道坐标系中两个邻近共面航天器交会问题的状态方程为[9]

E ·

=AE +Bu

(5) 其中

E =(x y x · y ·)T , u =(u x u y )

T A =0

0100

001000

2ω03ω

2-2ω0 , B =0000a 00a 这里,x 、y 分别是追踪航天器相对目标航天器的矢量在目标轨道坐标系坐标轴上的投影;ω是目标航天器轨道角速度;a 是追踪航天器加速度的大小,对于有限推力航天器来说,它是一个532003年10月 中国空间科学技术

相关文档
最新文档