连续系统的最优控制

合集下载

最优控制-第七章-动态规划法

最优控制-第七章-动态规划法

当∆t很小时,有

t t
t
Lx, u, t d t Lx, u, t t
J x, t min
*
min
uU

uU

tf
t0
Lx, u, t d t Φ xt f
tf t t

t t
t
Lx, u, t d t
Lx, u, t d t Φ xt f
P1 11
7
P2 4 2
P3 4 4
12 A 4 8 Q1
4 3 2 2 Q3 B
5 Q2
第一段:P1、Q1的前站是始发站A。显见从
A到B的最优值为12,故得最优路线为AQ1P2Q3B。
综上可见,动态规划法的特点是: 1) 与穷举算法相比,可使计算量大大减少。如
上述最优路线问题,用动态规划法只须做10次
J x, t min Lx, u, t t J xt t , t t
* * uU


(8)
* J x , t J x, t * * J x x, t t J x, t t (12) x t x * T
A城出发到B城的行车时间最短。
P1 3 A 4 Q1 1
7
P2
2
P3 4
4
6 8 2 Q2
3 3 3
2 Q3 4
2
B
现将A到B分成四段,每一段都要作一最优决 策,使总过程时间为最短。所以这是一个多段最 优决策问题。 由图2可知,所有可能的行车路线共有8条。 如果将各条路线所需的时间都一一计算出来,并 作一比较,便可求得最优路线是AQ1P2Q3B,历时 12。这种一一计算的方法称为穷举算法。这种方 法计算量大,如本例就要做3×23=24次加法和7次 比较。如果决策一个n段过程,则共需(n-1)2n-1次 加法和(2n-1-1)次比较。可见随着段数的增多,计 算量将急剧增加。

第六章 最优控制2012

第六章 最优控制2012

,使J 为极小。
一、性能指标及分类 性能指标函数(又称目标函数、性能泛函),最优控制
问题可归结为求性能指标的极值问题。按照实际控制性能 常见:
⑴ 最短时间问题:
拦截导弹最短时间控制
⑵ 最小消耗问题:控制量u(t)与燃料消耗量成正比
导弹最小燃料控制
(3) 线性调节器问题:考虑在平衡位置 x=0附近的状态调节
导弹稳定控制
在变分法中这类问题称为拉格朗日问题。它要求状态向 量及控制向量在整个动态过程中都满足性能要求。
⑵ 终值型性能指标:
卫星的指向控制
在变分法中称为迈耶尔问题。只要求状态在过程终端时 满足一定要求,而对状态及控制量在整个动态过程中的演变 不作要求。
⑶ 复合型性能指标:
卫星的指向和 稳定控制
的变分是指两个函数间的差
问题:何为两个函数的差?两个函数距离接近?
K阶近似度
定义:设 是线性赋范空间 上的连续泛函,其增量可表示为
其中,
是关于 的线性连续泛函,
是关于 的高
阶无穷小。则
称为泛函 的变分。
泛函的变分等于
3、泛函变分的规则 1) 2) 3) 4)
变分的导数等于导数的变分
4、泛函的极值
寻求在
上的最优控制

,以将系统状
态从
转移到 x(t f ) 或 x(t f ) 的一个集合,并使性能指标
最优。其中
是 x 、u 和t 的连续函数
最优控制问题就是求解一类带有约束条件的条件泛函极值问 题。
泛函与变分法
一、泛函与变分
1、泛函的基本定义: 对于某个函数集合 中的每一个函数 ,变量J 都有一个
在变分法中称为波尔札问题。它要求状态在过程终端 时满足一定要求,而且状态向量及控制向量在整个动态过 程中都应满足一定要求。

可化为规范形式的问题

可化为规范形式的问题

线性连续系统最优控制补充讲义(2004-03-09)3.6 可化为规范形式的LQ 问题3.6.1 具有规定衰减速度(稳定度)的调节器系统稳定条件,极点在左半复平面。

衰减速度:系统离虚轴最近的闭环极点与虚轴间的距离,σ。

σ 越大,系统的非零初态响应的衰减速度愈快。

若闭环系统的极点都在距离虚轴为σ的直线左边,则称闭环系统有至少不低于σ 的衰减速度。

最优化问题I :()()()()[]⎰∞+=0221min dt t Ru t u t Qx t x e J TT t α t s . ()()()t Bu t Ax t x+=& ()00x x = 式中,R 正定,Q 半正定,α为正常量,(A,B )为能控对,(A,D )为能观对,T DD Q =令,()()t x e t x t α= ()()t u e t u t α= 则有()()uBe x e I A x e Bu Ax e x e x e x t t t t t t ααααααααα++=++=+=&& 转化为最优化问题II :()()()()[]⎰∞+=021min dt t u R t u t x Q t x J T Tut s .()()()000x x x u B x I A x==++=α& 可以证明:[A,B ]完全能控[]B I A ,α+⇒完全能控。

[A,D ]完全能观[]D I A ,α+⇒完全能观。

则,最优化问题II 有唯一解:()()t x K t u α-=其中ααP B R K T 1-=()()01=+-+++-Q P B BR P P I A I A P TT αααααα又由于()()t x K t x e K u e u t t αααα-=-==--所以,两个最优控制问题的反馈增益阵是相同的,又由于最优控制问题II的闭环系统 ()x BK I A xαα-+=& 渐近稳定,即 ()()0lim lim ==∞→∞→t x e t x t t t α所以,()t x 也是渐近稳定的,且其衰减速度不低于t e α-。

最优控制基本原理

最优控制基本原理

最优控制基本原理
最优控制基本原理是控制理论中的一个重要分支,它主要研究如何设计最优控制器以实现系统的最优性能。

最优控制的基本原理包括动态规划、变分法和最优化理论等。

动态规划是一种通过将问题分解成子问题并递归地解决这些子问题来求解最优控制问题的方法。

它通过构建最优化问题的状态转移方程和边界条件来寻找最优控制策略。

变分法则是一种数学方法,它通过将最优控制问题转化为弱形式的变分问题来寻找最优控制策略。

变分法运用泛函分析中的概念和方法,可以得到对动力学过程进行最优控制的必要条件。

最优化理论是一种通过最小化或最大化目标函数来寻找最优控制策略的方法,它主要应用于连续系统和非线性系统的最优控制问题中。

最优化理论的方法包括拉格朗日乘数法、Kuhn-Tucker条件和梯度下降法等。

最优控制基本原理在实际应用中有着广泛的应用,例如控制机器人、导弹、航天器和工业过程等。

通过研究最优控制基本原理,可以提高控制系统的性能,提高工业过程的效率,优化资源利用等。

- 1 -。

最优控制-极大值原理

最优控制-极大值原理

近似算法
针对极大值原理的求解过程,开 发了一系列近似算法,如梯度法、 牛顿法等,提高了求解效率。
鲁棒性分析
将极大值原理应用于鲁棒性分析, 研究系统在不确定性因素下的最 优控制策略,增强了系统的抗干 扰能力。
极大值原理在工程领域的应用
航空航天控制
在航空航天领域,利用极大值原理进行最优 控制设计,实现无人机、卫星等的高精度姿 态调整和轨道优化。
03
极大值原理还可以应用于经济 学、生物学等领域,为这些领 域的研究提供新的思路和方法 。
02
最优控制理论概述
最优控制问题定义
01
确定一个控制输入,使得某个给定的性能指标达到 最优。
02
性能指标通常由系统状态和控制输入的函数来描述。
03
目标是在满足系统约束的条件下,找到最优的控制 策略。
最优控制问题的分类
1 2
确定型
已知系统的动态模型和控制约束,求最优控制输 入。
随机型
考虑系统的不确定性,如随机干扰、参数不确定 性等。
3
鲁棒型
考虑系统模型的不确定性,设计鲁棒控制策略。
最优控制问题通过求解优化问题得到最优解的解析表达式。
数值法
02
通过迭代或搜索方法找到最优解。
极大值原理
03
基于动态规划的方法,通过求解一系列的子问题来找到最优解。
03
极大值原理
极大值原理的概述
极大值原理是现代控制理论中的基本原理之一,它为解决最 优控制问题提供了一种有效的方法。该原理基于动态系统的 状态和性能之间的关系,通过寻求系统状态的最大或最小变 化,来达到最优的控制效果。
在最优控制问题中,极大值原理关注的是在给定的初始和终 端状态约束下,如何选择控制输入使得某个性能指标达到最 优。它适用于连续和离散时间系统,以及线性或非线性系统 。

现代控制理论》电子

现代控制理论》电子
由S站出发至终点F站可有多种不同的行车路线, 沿各种行车路线所耗费的时间不同。 为使总的行车时间最短,司机在路程的前3段 要作出3次决策。
➢ 也就是说,一开始司机要在经过x1(1)站还是x2(1)站两种
情况中作出决策。
✓ 到x1(1)站或x2(1)后,又面临下一站是经过x1(2)站 还是x2(2)站的第2次决策。
最优性原理与离散系统的动态规划 7.6.1 最优性原理与法离(1散/系3)统的动态规划法
基于对多阶段决策过程的研究,贝尔曼在20世纪50年代首先提出了求解离散多阶 段决策优化问题的动态规划法。 如今,这种决策优化方法在许多领域得到应用和发展,如在生产计划、资源配 置、信息处理、模式识别等方面都有成功的应用。 下面要介绍的是,贝尔曼本人将动态规划优化方法成功地应用于动态系统的 最优控制问题,即构成最优控制的两种主要求解方法之一的最优控制动态规 划法。
映了该问题的一种规律性,即所谓的贝尔曼的最优性原理。
它是动态规划法的核心。
最优性原理一般问题的问题描述 2. 最优性原理一般(问1题/2的2问)题描述
现在正式阐述动态规划的基本原理。 在引进一些专门的名词之后,先叙述所要求解的多阶段决策问题,接着给出和 证明动态规划法的核心问题最优性原理,并应用这一基本原理求解多阶段决 策过程,并将该求解方法推广至在离散系统最优控制问题。
的是: 从最后一段开始,先分别算出x1(3)站和x2(3)
站到终点F的最短时间,并分别记为J[x1(3)] 和J[x2(3)]。
实际上,最后一段没有选择的余地。 ✓ 因此,由图7-10可求得
J[x1(3)]=4, J[x2(3)]=3
多阶段决策问题(5/12)
为便于今后求解过程的应用,可将 从x1(3)站和x2(3)站到终点的最短 时间J[x1(3)]和J[x2(3)]的数值标 记于代表该站的小圆圈内,如图711所示。

最优控制的基本理论及应用

最优控制的基本理论及应用
前苏联学者庞特里亚金等则在1956~1958年间创立 了极小值原理, 也发展了经典变分原理,成为处理控 制有闭集约束的变分问题的强有力工具。
本章在介绍解决最优控制问题3种基本方法(变分 法、极小值原理和动态规划)的基础上,阐述两类典 型最优反馈系统的设计,即线性二次型最优控制和最 小时间控制。
6.2 最优控制问题的提出及数学描述
6.3.2 用变分法求解无约束条件的泛函极值问题
设积分型性能泛函为
Jtt0f L[x(tx)(,t)]d,tt
(6-24)
在区间[t0 ,t f ]上,被积函数 L[x(t),x(t),t]二次连续可微, 轨线x(t)有连续的二阶导数,x(t)Rn ,对x(t)没有任何 约束。要求确定极值轨迹 x *(t) ,使泛函J为极值。
级数 ,则
J()tt0f L x Tη(t) L x Tη (t)R dt
(6-29)
式中,R表示泰勒(Taylor)级数展开式中的高阶项。
如果定义x(t)和 x (t) 的一阶变分为 δ x εη (t),δ x εη (t)
由泛函变分的定义,泛函的一阶变分为
(6-30)
6.2.2 最优控制问题的数学描述
构成最优控制问题必须具备以下几个基本条件:
1.被控系统的数学模型,即动态系统的状态方程
状态方程在最优控制中为等式约束条件。
2.控制变量的约束条件(容许控制)
任何实际物理系统,控制变量总是受约束的,一
般可写成
u(t)U
(6-3)
式中,U表示一个封闭的点集合,称为控制域。此时称 u(t)为容许控制。
1)积分型性能泛函
Jtt0f Lx((t)u,(t),dtt)
2)终值型性能泛函
J[x(tf ),tf]

线性二次型最优控制器设计

线性二次型最优控制器设计

程序运行结果如下: K =0.4142 0.6104 0.1009 同时得到闭环阶跃响应曲线,如图1-2所示。
图1-2 闭环系统阶跃响应曲线 由图1-1和图1-2知,经最优输出反馈后,闭环系统阶跃响应曲线与经最优状态反 馈后的阶跃响应曲线很接近。
三、离散系统线性二次型最优控制
下面对离散系统线性二次型最优控制进行详细介绍。
其中,A为系统的状态矩阵;B为系统的输出矩 阵;Q为给定的半正定实对称常数矩阵;R为给 定的正定实对称常数矩阵;N代表更一般化性 能指标中交叉乘积项的加权矩阵;K为最优反馈 增益矩阵;S为对应Riccati方程的唯一正定解P (若矩阵A-BK是稳定矩阵,则总有正定解P存 在);E为矩阵A-BK的特征值。
1000 Q= 取 0
,R=1。 用MATLAB函数dlqr()来求解最优控制器,给出程序清 单如下: %求解最优控制器 a=2;b=1;c=1;d=0; Q=[1000,0;0,1]; R=1; A=[a,0;-c*a,1]; B=[b;-c*b]; Kx=dlqr(A,B,Q,R) k1=-Kx(2);k2=Kx(1); axc=[(a-b*k2),b*k1;(-c*a+c*b*k2),(1-c*b*k1)]; bxc=[0;1];cxc=[1,0];dxc=0; dstep(axc,bxc,cxc,dxc,1,100)

1.LQG最优控制原理 最优控制原理
x(t ) = Ax(t ) + Bu (t ) + Gw(t ) 假设对象模型的状态方程表示为:
y (t ) = Cx(t ) + v(t )
T
式中,ω(t)和ν(t)为白噪声信号,ω(t)为系统干扰噪声,ν(t)为传感器带来的 量测噪声。假设这些信号为零均值的Gauss过程,它们的协方差矩阵为:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第6章 连续系统的最优控制6.1 最优化问题6.2 最优控制的变分法求解6.3 线性系统二次型性能指标的最优控制1、线性系统有限时间最优状态调节系统 ◆二次型性能指标设受控系统对平衡点的增量方程为()()()()()x t A t x t B t u t ∆=∆+∆,00()x t x ∆=∆简记为()()()()()x t A t x t B t u t =+,00()x t x =最优状态调节是指:对上述系统,在时间区间0[,]f t t t ∈,寻求最优状态反馈控制,使初始状态偏差00()x t x =迅速衰减,且同时使二次型性能泛函11()()[()()()()]d 22ft t t tf f f x u t J x t Q x t x t Q x t u t Q u t t =++⎰*min f x u J J J J J =++→=式中 ()0f n n Q ⨯≥——终端加权矩阵。

()0x n n Q ⨯≥——状态加权矩阵。

()0u r r Q ⨯>——控制加权矩阵。

三个加权矩阵均为对称矩阵,为简单,一般取为对角矩阵。

●1()()2tf f f f J x t Q x t =表示对终端状态偏差即稳态控制精度的限制。

当1diag[]f f fn Q q q =,211()2n f fi i f i J q x t ==∑●01()()d 2ft tx xt J x t Q x t t =⎰表示对控制过程中状态偏差衰减速度的要求。

当1diag[]x x xn Q q q =,0211()d 2ft nx xi i i t J q x t t ==∑⎰●01()()d 2ft tu u t J u t Q u t t =⎰表示对控制过程中所消耗的能量的限制,以避免状态偏差过快衰减导致控制量超过允许数值。

当1diag[]u u ur Q q q =,0211()d 2ft ru ui i i t J q u t t ==∑⎰,2()i u t 可理解为功率。

实际上,在性能指标中,x J 已经对控制的稳态精度有所要求。

当对稳态精度有更高的要求时,才增加f J 项。

由上可知,上述二次型性能指标的物理意义是,在整个时间区间0[,]f t t t ∈,特别是终值时刻f t t =上状态变量尽量接近于0而又不消耗过大的控制能量。

◆f t 有限时的最优状态控制最优状态调节器问题是始端固定、终端自由的泛函极值问题,即0t 给定,00)x t x =(,f t 给定, )f t x (自由的泛函极值问题。

黎卡提(Riccati )矩阵微分方程(一阶非线性矩阵微分方程):1()()()()()()()()()ttux P t P t A t A t P t P t B t Q B t P t Q -++-+=0其终值条件为()f f P t Q =可以证明,当矩阵(),(),(),()u x A t B t Q t Q t 的各元素在0[,]f t t 上都是t 的连续函数时,黎卡提方程在0[,]f t t 上满足终值条件的解存在且唯一。

当()P t 解出后,便有最优控制为*1()()()()()()tuu t K t x t Q B t P t x t -==-式中,1()()()tuK t Q B t P t -=-为时变状态反馈矩阵。

最优性能指标为*0001()()()2tJ x t P t x t =闭环系统结构如图:⊗x◆()P t 的特征*()P t 的时变性:即使,,,u x A B Q Q 都是定常矩阵,此时黎卡提方程为定常系数矩阵微分方程,()P t 也是时变的。

*()P t 的对称性()P t 是对称矩阵,共含有(1)/2n n +个不同的元素。

*()P t 0[,]f t t t ∈的非负定性由于,,f u x Q Q Q 均为非负定矩阵,所以对任意的()u t 和相应的()x t ,总有0J ≥,*1()()()02tJ x t P t x t =≥,因()x t 是任意的,可知()0P t ≥。

*当f t t <<=∞,()P t 为常数矩阵在这种情况下,在动态过程的大多数时间内,()P t 为常数矩阵,从而最优控制的时变状态反馈简化为定常状态反馈。

说明后列。

例:系统状态方程为x x u =-+,0(0)x x =求最优控制,使1022211()()d min 22f J x t x u t =++→⎰解:1A =-,1B =,1f Q =,1x Q =,1u Q =,00t =,10f t = 矩阵黎卡提微分方程为2()()2()10P t P t P t -++=,()(10)1f f P t P Q ===对1f Q =,10f t =,解得))(21)1)(2()(2(2t t eP t e----+-++-=+--最优控制为*1()()()()()()tuu t Q B t P t x t P t x t -=-=-数值计算表明:(0)(1)(6)0.4140P P P ====,(7)0.4141P =,(8)0.4157P =(9)0.4430P =,(9.5)0.5372P =,(10)1f P Q ==1f Q =和0f Q =时的()P t 曲线如图所示。

t2、f t →∞时的线性定常系统最优状态调节器f t 有限时的最优状态调节器,由于()P t 是时变的。

若f t →∞,()P t 将趋于常数矩阵,最优状态反馈矩阵也将随之转化为常数矩阵。

◆无限时间(f t →∞)状态调节器问题 若线性定常系统x Ax Bu =+,00()x t x =能控,u 不受限制,二次型性能泛函为1[]d 2t tx u t J x Q x u Q u t ∞=+⎰式中 ()0x n n Q ⨯≥——状态加权对称常矩阵;()0u r r Q ⨯>——控制加权对称常矩阵。

当0x Q >或0x Q ≥但{,}A H 能观(其中tx H H Q =),则最优状态反馈控制存在且唯一:*1()()()tuu t Kx t Q B Px t -==-式中 1()tn n uK Q B P -⨯=-为最优定常状态反馈矩阵()n n P ⨯是满足满足下列黎卡提矩阵代数方程的正定对称常数矩阵:1ttux PA A P PBQ B P Q -+-+=0最优轨线*()x t 是下列奇次状态方程的解:()x A BK x =+ , 00()x t x =性能泛函的最小值为*001()()2tJ x t Px t =说明:*表面上u 不受限制,但由于性能泛函中含有1()()d 2tu t u t Q u t t ∞⎰,通过u Q 的选择,可把i u 控制在允许范围内。

* f t →∞最优调节闭环系统是定常系统。

结构图为⊗x*由于f t →∞,要求线性定常系统能控,否则不可控模态将使()x ∞→∞。

*无限时间最优调节系统必是大范围渐近稳定的。

证明:由前知,0P >.故标量函数()0tV x x Px =>。

而()[()]()tttt V x x Px x Px A BK x Px x P A BK x =+=+++11()()tt t ttuux A BQ B P Px x P A BQ B P x --=-+-11()tut tutA P PBQB P x PB x A Q P P B --=-+- 1()ttux x PBQ B Q P x -=+-由于0x Q >,0u Q >,故()0V x <。

此外,当x →∞,()V x →∞。

根据李亚普诺夫稳定性定理,无限时间最优调节系统是大范围渐近稳定的。

*无限时间最优调节系统是渐近稳定的,当f t →∞,*()0f e x t x ==。

故在性能泛函中,终端泛函1()()2tf f f x t Q x t 失去意义,予以取消,或认为f Q =0。

例:简化的同步发电机—无穷大系统机电模型如图。

模型数据为:10s M =,0.5T =,377rad/s N ω=。

二次型性能泛函权矩阵diag[0.251]x Q =,1u Q =。

求最优状态控制。

解:系统状态方程x Ax Bu =+为0/01/N u T MM ωδδωω∆⎡⎤∆⎡⎤⎡⎤⎡⎤=+⎢⎥⎢⎥⎢⎥⎢⎥-∆∆⎣⎦⎣⎦⎣⎦⎣⎦ 对于所给数据37700.0500.1u δδωω∆⎡⎤∆⎡⎤⎡⎤⎡⎤=+⎢⎥⎢⎥⎢⎥⎢⎥-∆∆⎣⎦⎣⎦⎣⎦⎣⎦ 展开黎卡提方程1ttux PA A P PBQ B P Q -+-+=0得1112111212221222037700.050.0503770p p p p p p p p -⎡⎤⎡⎤⎡⎤⎡⎤+⎢⎥⎢⎥⎢⎥⎢⎥-⎣⎦⎣⎦⎣⎦⎣⎦1112111212221222000.2500000.010100p p p p p p p p ⎡⎤⎡⎤⎡⎤⎡⎤⎡⎤-+=⎢⎥⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦⎣⎦⎣⎦ 由于111212221222[00.1]0.1[]tp p B P p p p p ⎡⎤==⨯⎢⎥⎣⎦,因此,只需求出12p 和22p 。

将黎卡提方程展开,有212p +1012p -25=0,2220.01p +75422p +1=0解得12 2.071,12.07p =-;22p =满足0P >的解为12 2.071p =,22395.3p ==最优状态反馈矩阵为11222[]0.1[][0.207139.53]tuK k k Q B P p p δω-==-=-⨯=--闭环系统结构无控制时,特征方程和特征值分别为37700.05s sI A s--==,1,2j4.342rad/s λ=±系统临界稳定。

施加最优控制后377()00.0707 3.953s sI A bK s ---==+1,2 1.9765j4.769rad/s λ=-±系统渐近稳定,且阻尼良好。

阻尼比为Re /0.383ζλλ==3、f t →∞时的线性定常系统最优输出调节器若线性定常系统x Ax Bu =+,00()x t x =y C x =能控且能观,u 不受限制,二次型性能泛函为1[]d 2t ty u t J y Q y u Q u t ∞=+⎰式中 ()0y m m Q ⨯≥——输出加权对称常矩阵;()0u r r Q ⨯>——控制加权对称常数矩阵。

求最优控制*()u t ,使min J J →。

参照最优状态调节器的结果,最优输出调节器的最优控制为*1()()()tuu t Kx t Q B Px t -==-式中 1()tn n uK Q B P -⨯=-为最优定常状态反馈矩阵()n n P ⨯是满足满足下列黎卡提矩阵代数方程的正定对称常数矩阵:1uty ttPA A P PBQ B P C Q C -+-+=0注意:因黎卡提矩阵代数方程不同,此处所得P 阵与最优状态调节器时的不同,从而最优控制也不同。

相关文档
最新文档