基于乘性噪声的随机线性二次型最优控制

合集下载

控制方法

控制方法

回路传函恢复控制
• 线性二次高斯(Linear Quadratic Gaussian—LQG)方法是 以最优线性二次型调节器(LQR)和Kalman滤波器为中心的 反馈控制系统优化设计方法。由于其理论比较成熟,所以 在工程上被广泛应用。但是由于LQG设计的被控对象没有 考虑模型不确定性,带有Kalman滤波器的LQG方法设计 的控制系统鲁棒性差,模型若存在微小偏差或扰动,闭环 系统就可能出现不稳定的现象。因此,为弥补LQG设计方 法的缺陷,1979年Doyle和Stein提出了回路传函恢复方法。 • LQG/LTR回路传函恢复方法是把虚拟的过程噪声作为设 计参数加到设计模型输入端的鲁棒性恢复方法,能使LQG 设计具有最优线性二次调节器LQR所具有的稳定储备。其 设计思想就是设计滤波器增益,使得全状态LQR调节器自 然拥有的鲁棒特性在系统的输入端通过动态调节器得到基 本恢复。根据LQG/LTR理论,回路传递恢复后的系统具 有接近最优反馈控制系统的鲁棒性。
1. 极点配置法:
yp
y1
y2
y3
A1 P1 Q1 i A Ps B P0
A2 P2 Q2
k1 m m1
k2
k3 m2
m3
Fd
1. 极点配置法:
液压源 加速度 信号输入 加速度 三状态 输入回路 速度 位移 伺服控 制电路 控制 信号 负载 伺服阀 与液压缸 加速度计 速度调理 位移计 振动台 位置 输出
鲁棒控制方法概述
鲁棒控制方法弥补现代控制理论对数学模型的过分依赖,在设计过程 中考虑了对象模型的不确定性,使得在一定误差范围内的所有被控对象均 能满足理想的性能要求。 在设计鲁棒控制器时,仍存在以下的问题需要解决 : 结构数学模型的不确定性估计较为困难,因此准确的分析和刻画不确定 性的大小是进行鲁棒控制器设计的基础。 在鲁棒控制器设计过程中,通常需要依靠权函数的选择来实现控制器对 不确定性的鲁棒性,一般情况下,这种权函数的选择是没有通用的公 式,因此要经过反复多次的试凑才能确定。 设计鲁棒控制器时,往往需要同时满足包括时域、频域在内的多个性能 指标要求。

【国家自然科学基金】_线性二次最优控制_基金支持热词逐年推荐_【万方软件创新助手】_20140730

【国家自然科学基金】_线性二次最优控制_基金支持热词逐年推荐_【万方软件创新助手】_20140730

推荐指数 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2011年 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
2011年 科研热词 频率稳定 随机系统 重叠分解 负荷/频率控制(lfc) 线性二次最优控制 线性二次型最优控制器 模糊控制器 时滞 协调控制 伸缩因子 交直流系统 二次滤波器 乘性噪声 三级倒立摆 推荐指数 1 1 1 1 1 1 1 1 1 1 1 1 1 1
2012年 序号 1 2 3 4
科研热词 有理haar函数 最优控制 二次规划 不等式约束
推荐指数 1 1 1 1
2013年 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
பைடு நூலகம்
科研热词 线性二次最优控制 路径跟踪算法 线性系统 线性二次问题 最大值原理 最优控制 拉格朗日方程 平面倒立摆 干扰抑制 双线性矩阵不等式 动态补偿 倒向 poisson过程 ito积分
科研热词 最优控制 颤振抑制 通货膨胀 输出微分 计算方法 线性二次最优控制理论 线性二次最优控制器 线性-非二次 特征线 混杂动态 死区时间 柔性机械臂 效用最大化 振动控制 投资组合 并联有源滤波器 常数相对风险厌恶(crra) 居民消费价格总指数 加权矩阵
推荐指数 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
推荐指数 2 1 1 1 1 1 1 1 1 1 1 1 1 1
2014年 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
2014年 科研热词 随机最大值原理 随机控制 碰撞动力学 正倒向随机微分方程 柔性空间机械臂 捕获卫星 teugels鞅 levy过程 镇定运动控制 镇定控制 线性二次最优 漂浮基 柔性振动抑制 振动抑制 推荐指数 2 2 2 2 2 2 2 2 1 1 1 1 1 1

自适应滤波器的设计(终极版)

自适应滤波器的设计(终极版)

目录摘要 (I)第1章绪论....................................................................................................................错误!未定义书签。

1.1引言……………………………………………...…..…………...……………...错误!未定义书签。

1.2课题研究意义和目的 (1)1.3国内外研究发展状况 (2)1.4本文研究思路与主要工作 (4)第2章自适应滤波器理论基础 (5)2.1自适应滤波器简介 (5)2.2自适应滤波器的原理 (5)2.3自适应滤波算法 (7)2.4TMS320VC5402的简介 (8)第3章总体方案设计 (10)3.1无限冲激响应(IIR)滤波器 (10)3.2有限冲激响应(FIR)滤波器 (11)3.3电路设计 (11)4基于软件设计及仿真 (17)4.3 DSP的理论基础 (17)4.4自适应滤波算法的DSP实现 (18)5总结 (21)参考文献 (22)致谢 (23)附录自适应滤波源代码 (24)第1章绪论1.1引言随着微电子技术和计算机技术的迅速发展,具备了实现自适应滤波器技术的各种软硬件条件,有关自适应滤波器的新算法、新理论和新的实施方法不断涌现,对自适应滤波的稳定性、收敛速度和跟踪特性的研究也不断深入,这一切使该技术越来越成熟,并且在系统辨识、通信均衡、回波抵消、谱线增强、噪声抑制、系统模拟语音信号处理、生物医学电子等方面都获得了广泛应用口。

自适应滤波器实现的复杂性通常用它所需的乘法次数和阶数来衡量,而DSP强大的数据吞吐量和数据处理能力使得自适应滤波器的实现更容易。

目前绝大多数的自适应滤波器应用是基于最新发展的DSP 来设计的.滤波技术是信号处理中的一种基本方法和技术,尤其数字滤波技术使用广泛,数字滤波理论的研究及其产品的开发一直受到很多国家的重视。

现代控制理论二次型性能指标的线性系统最优控制-西工大

现代控制理论二次型性能指标的线性系统最优控制-西工大

而常设u(t)
为自由的;指标函数的第一项
1 2
eT
(tl
)
Fe(tl
)
表示终值误差。从理论上讲,被积函数的第一项已
经包括了终端误差的成分,但如需特别强调终值误
差,则可加上此项。
矩阵 F Q(t) R(t) 则是用来权衡各个误差成分及控制 分量相对重要程度的加权阵。这里,Q 及 R 可以是时 间函数,以表示在不同时刻的不同加权。
指标J 为最小。
这个问题的求解可以用极小值原理或动态规划法,这
里,我们应用极小值原理来求解。首先列写哈密尔顿函

H (x,u,,t) 1 xT (t)Q(t)x(t) 1 uT (t)R(t)u(t) T (t) A(t)x(t) T (t)B(t)u(t)
2
2
由此可得正则方程
x (t) A(t)x (t) B(t)u(t)
上式应对任何 x 均成立,故有
P(t) P(t) A(t) AT (t)P(t) P(t)B(t)R1(t)BT (t)P(t)] Q(t)
该式称为矩阵黎卡提微分方程,它是一个一阶非 线性矩阵微分方程。
它是一个阶非线性矩阵微分方程。
边界条件为:
P(t f ) F
由黎卡提微分方程解出P(t) 后,可得最优控制规 律为:
因此二次型性能指标的线形系统最优控制问题被广 泛应用到各种工程实际中,例如:导弹的制导控制、航 天器控制等。
导弹制导控制
航天器控制
二次型性能指标线性系统最优控制问题可以描述如下:
设线性系统状态方程及输出方程为:
x(t) A(t)x(t) B(t)u(t)
y(t) C(t)x(t)
式中, x(t) 为n 维状态向量,u(t) 为m 维控制向量,y(t) 为r 维输出向量。假设: n m r 0 ; u(t) 不受约束;

线性二次型最优控制器的设计

线性二次型最优控制器的设计

99
线性二次型最优控制器的设计
u
B
﹢ ∑ x ﹢
.

A
x
C ﹢ ∑ ﹣∧ C
y
B
﹢ ∑ x ﹢﹢
. ∧

A G
x

y
Figure 2. Reconstruction of state x ( t ) 图 2. 状态 x ( t ) 的重构示意图
u u u
系统
y
控制器
x

u
观测器
y
Figure 3. An optimal controller with a state observer 图 3. 带有观测器的最优控制器
根据以上步骤,得出线性二次型最优控制器结构图如图 1 所示。 线性二次型最优控制器的特点如下所示: 1) 最优控制式 u ∗ ( t ) 是线性状态反馈控制律,便于实现闭环最优控制;
2) 黎卡提方程是非线性矩阵微分方程,通常只能采用计算机逆时间方向求数值解。由于黎卡提方程 与状态及控制变量无关,因而在定常系统情况下可以离线算出 P ( t ) ; 3) 只要时间区间 黎卡提矩阵微分方程的解 P ( t ) 就是时变的, 最优反馈系统将成为 t0 , t f 是有限的, 线性时变系统,即使对于线性定常系统,加权阵为常阵,求出的 P ( t ) 也是时变的。
关键词
最优控制,线性系统,状态反馈
1. 引言
线性二次型最优控制问题属于线性系统综合理论中简单而又应用广泛的一类优化型综合问题,是现 代控制理论中的最重要的成果之一。优化型综合问题的特点是通过使全面表征系统性能好坏程度的性能 指标函数取极大或极小值来确定系统的控制规律。如果系统是线性的,性能指标是状态变量和控制变量 的二次型函数的积分,则这样的最优控制问题称为二次型最优控制问题。二次型性能指标具有明显物理 意义,代表了大量工程实际问题中提出的性能指标要求。 线性二次型调节器(Linear Quadratic Regulator, LQR)的最优解可以用统一的解析式表示,且可得到一 个简单的线性状态反馈控制律而构成闭环最优控制,这对最优控制在工程应用中的实现具有十分重要的 意义。同时,线性二次型问题还可以兼顾系统性能指标如快速性、准确性、稳定性和灵敏度等多方面因 素。线性二次型问题是最优控制问题中简单而且应用广泛的一类优化问题。线性二次型最优控制器的实 现是先计算出使性能指标泛函取极小值的输入量 u ∗ ( t ) , 而 u ∗ ( t ) 的作用是通过状态的线性反馈来实现的, 即通过确定状态的最优反馈系数来实现最优控制。在 20 世纪 60 年代之前,控制系统的设计风格为:手 算,利用作图,反复试凑;而在 20 世纪 60 年代之后,控制系统的设计风格为:提出目标函数,采用优 化方法,使用数字计算机,重视算法。LQR 控制器的研究具有普遍意义,易于获得解析解,最为可贵的 是能获得线性反馈的结构[1] [2]。 LQR 控制即线性二次型调节器,其对象是现代控制理论中以状态空间形式给出的线性系统,而目标函

主动悬架控制器算法及应用

主动悬架控制器算法及应用
图 1 单轮主动悬架受力 图
轻 型汽 车技 术
21 ( ) 22 02 4 总 7
技 术纵横
1 3
直 接 控 制算 法 仅 需 测 量 悬 架 的相 对 速 度 和 相 对 位
广泛应用。 hm s 首先将随机最优控制理论应用 T o po n 于主动悬架 的研究 , 对线性最优控制算法有 以下几 点要求 :
F 一 主动悬架作用力 为 了使簧载质量具有理想 的隔振效果 ,只要主
动力 F 与被 动力 F 的大小 相 同 , 向相 反 , : 。 方 即
F= F= x+ x .- pk x 0 C(一 t (- x ) ( 2)
就可以完全消除簧载质量与非簧载质量之间的 耦合 效 应 , 为达 到理想 的隔振 效果 , 利用 直接 控 N(1 2 式, 得到 单轮 悬架 闭环系统 方 程为 :
好坏 , 对汽车的使用性能影响很大 。 悬架 弹性 系数 对行 驶平顺 性 的影 响 :当 弹性 系 数过大时, 悬架 的减振性能减弱 , 轮胎的振动直接传 递 到车 身 ;当弹性 系数 过小 时悬 架 系统 的 固有 振 动
频率 接 近路 面 的激 励频 率 , 容易 引起 车身共 振 。 阻 尼对 汽车 行驶平 顺 性 的影 响 :为衰 减 车身 的
尼 系数 。
这 种 算 法 的设 计 实 际 上是 滤波 器 结 构 的设 计
和滤波器上 下频率 的选择 。一般结论是上 限频率 高, 悬架对路面冲击的隔振效果好 , 但悬架 的动挠 度增 加 , 胎 的接 地 性能 差 , 之亦 然 , 限 频 率影 轮 反 下
2 可控 悬架
从上述分析我们知道悬架刚度、阻尼系数等悬 架 系统 的各项参 数 对车 辆 的行驶平 顺 性和操 纵 稳定

线性二次型最优控制器设计

线性二次型最优控制器设计

程序运行结果如下: K =0.4142 0.6104 0.1009 同时得到闭环阶跃响应曲线,如图1-2所示。
图1-2 闭环系统阶跃响应曲线 由图1-1和图1-2知,经最优输出反馈后,闭环系统阶跃响应曲线与经最优状态反 馈后的阶跃响应曲线很接近。
三、离散系统线性二次型最优控制
下面对离散系统线性二次型最优控制进行详细介绍。
其中,A为系统的状态矩阵;B为系统的输出矩 阵;Q为给定的半正定实对称常数矩阵;R为给 定的正定实对称常数矩阵;N代表更一般化性 能指标中交叉乘积项的加权矩阵;K为最优反馈 增益矩阵;S为对应Riccati方程的唯一正定解P (若矩阵A-BK是稳定矩阵,则总有正定解P存 在);E为矩阵A-BK的特征值。
1000 Q= 取 0
,R=1。 用MATLAB函数dlqr()来求解最优控制器,给出程序清 单如下: %求解最优控制器 a=2;b=1;c=1;d=0; Q=[1000,0;0,1]; R=1; A=[a,0;-c*a,1]; B=[b;-c*b]; Kx=dlqr(A,B,Q,R) k1=-Kx(2);k2=Kx(1); axc=[(a-b*k2),b*k1;(-c*a+c*b*k2),(1-c*b*k1)]; bxc=[0;1];cxc=[1,0];dxc=0; dstep(axc,bxc,cxc,dxc,1,100)

1.LQG最优控制原理 最优控制原理
x(t ) = Ax(t ) + Bu (t ) + Gw(t ) 假设对象模型的状态方程表示为:
y (t ) = Cx(t ) + v(t )
T
式中,ω(t)和ν(t)为白噪声信号,ω(t)为系统干扰噪声,ν(t)为传感器带来的 量测噪声。假设这些信号为零均值的Gauss过程,它们的协方差矩阵为:

汽车主动悬架系统的线性二次最优控制研究

汽车主动悬架系统的线性二次最优控制研究

() 4
() 5
取车轮速度克、 。 轮胎动载 J 。 }、 车身速度茏 和悬架动行程 ( 。 ) 为状态变量 , 则系统的状态空间方程为:
f 佃口
L= x Du y C +
( 6

广西 工 学 院 学 报
第2 2卷
式() [lj 1 2 6 中:= ,1 , ( 1] . 茏 ) }
( > 或 Q OR O 且为对称矩阵 ) QO = ,> ,
() 8
式( ) 第一项就是要使 系统尽快从非稳定状态转移 到稳定状态. 二项 就是抑制控制过程 中的控 8 中: 第 制量 , 使控制量在允许的范围内. 冠都是加权矩阵 , Q、 可用随机 的方法确定 , 取不同的值就允许对不 同的分 量加不 同的权系数[如认 为某一个分量特别需要约束 , 7 ] . 就加大对它所加 的权系数 ; 如认为某一个分量无关 紧要 , 以不加约束。 可 根据最优控 制极小值原理 , 在时间 0 ∞范 围内, 一 当系统完全能控 时 , 线性 系统在最优控制律作用下 ,

3 2 i l k建模及仿真结果 . Smu n i
S u n 环境下建立 的主动悬架 系统仿真模型框 图如图 4 i lk m i 所示 。 被动悬架系统仿真模型如图 5 所示.





图 4 主 动 悬 架 系 统 仿 真 模 型
图 5 被 动 悬 架 系统 仿 真 模 型
根据系统仿真模 型 , 代入具体参 数 , 得到系统仿真结果 如图 6 图 1 所示. ~ 1

m l
m l

l . 25

00 25 .1 0
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

基于乘性噪声的随机线性二次型最优控制
摘要:本文研究了基于乘性噪声的随机线性二次型最优控制。

由于参数的不确定性,此类问题很难求得解析的最优控制策略。

然而,利用动态规划方法,此类问题的解析解被成功地求解。

得到的最优控制策略是一个线性状态反馈策略,其系数可以通过一个扩展黎卡提方程离线计算求得。

关键词:随机线性二次型;动态规划;乘性噪声基金项目:基金项目1全称(基金项目号);
0 引言
本文致力于研究基于乘性噪声的随机线性二次型最优控制(Linear-Quadratic,简称LQ)。

近年来,由于线性二次型最优控制问题具有非常广泛的应用,此类问题吸引了国内外学者大量的研究,例如,金融衍
生品定价,人口模型,动态投资组合管理。

Kalman[1]最先提出了经典的确定性线性二次型最优控制问题。

此后,Wonham[2] 和Bismut[3] 分别将此类问题扩展到确定性参数的和随机性参数的随机线性二次型最优控制问题。

从此,关于确定性和随机性的LQ最优控制问题被大量的研究,特别是由Chen 等人[4] 提出来的所谓的不定随机LQ控制,其关于控制量和状态量的惩罚矩阵是不定的,此类问题在某些特定条件下仍然是适定的,引起广大学者的研究兴趣[5][6]。

目前研究随机LQ最优控制问题的文献中,其不同阶段的参数是被假设为独立的,但是实际应用中,不同阶段的系统参数可能是相关的。

Costa等[5] 研究了参数是带Markov跳跃的随机LQ控制问题并得到了最优控制策略和最优目标值的解析表达式。

Chen
等[7] 提出了一类参数服从Markov链的随机LQ最优控制问题,并提出有效算法以求得此类问题的最优控制。

在实际应用中,不同阶段参数相关性具有多样性的特点,例如,Markov链、二叉树模型、布朗运动及其它时间序列模型。

这要求研究者能提出对大部分时间序列模型都能适用的随机LQ控制模型,并寻找有效的理论和算法得到此类问题最优控制策略的解析解或数值解。

然而,此类随机LQ控制模型一直还未能得到突破。

本文的主要贡献在于以下:基于不同阶段参数相关性具有多样性的特点,提出了一类基于乘性噪声的随机线性二次型最优控制问题,其参数具有一般相关性且适用大部分的随机过程。

利用著名的动态规划求得此类问题的最优控制策略和最优目标值的解析表达式。

1 建立模型
本文中,考虑如下的离散时间随机线性动态系统:为了对问题P(LQ)进行求解,我们需要以下假设。

2模型求解
本节中,我们应用动态规划的方法来求解问题P (LQ)。

定理1 问题(LQ)在t时刻的最优控制策略是一个线性状态反馈策略,
其中,Lt被定义为Lt,对于t=0,1,...,T-1,
而且,问题P(LQ)的最优目标值为
其中,Kt被定义为,对于t=0,1,...,T-1,
最后,根据假设1,我们可以得到最优控制策略如公式(1.3)。

而且,我们还可以得到t时刻的值函数为公式(1.5)。

结束语
本文研究了基于乘性噪声的随机线性二次型最优控制问题。

与现有的文献相比,本文中的参数是序列相关的,造成了此类问题很难求得相应的解析解。

然而,利用动态规划方法,此类问题的解析解被成功地求解。

得到的最优控制策略是一个线性状态反馈策略。

参考文献
[1] R. E. Kalman. Contribution to the theory of optimal control [J]. Bol. Soc. Mat. Mexicana,1960,5(63):102-119.
[2] W. M. Wonham. On a matrix riccati equation of stochastic control [J]. SIAM J. Control,1969,6(4):681-697.
[3] J. M. Bismut. Linear quadratic optimal stochastic control with random coefficients[J]. SIAM
J. Control Optim,1976,14(3):419-444.
[4] S. P. Chen,X. J. Li,and X. Y. Zhou. Stochastic linear quadratic regulators with indefinite control weight costs. SIAM J. Control Optim.,1998,36(5):1685-1702.
[5] O. L. V. Costa and W. L. Paulo. Indefinite quadratic with linear cost optimal control of markovian jump with multiplicative noise systems. Automatica,2007,43(4):587-597.
[6] D. D. Yao,S. Z. Zhang,and X. Y. Zhou. Stochastic linear quadratic control via semidefinite programming. SIAM J. Control Optim.,2001,40(3):801-823.
[7] N. Y. Chen,S. Kou,and C. Wang. A partitioning algorithm for markov decision processes
with applications to market microstructure[J]. Management Science,2017.
[8] J. A. Primbs and C. H. Sung. Stochastic receding horizon control of constrained linear systems with state and control multiplicative noise[J]. IEEE Transactions on Automatic Control,2009,54(2):221-230.
[9] O. L. V. Costa and M. V. Araujo. A generalized multi-period mean-variance portfolio with markov switching parameters[J]. Automatica,2008,44:2487-2497.
作者?介:庞珊(1989-),女(汉族),陕西西安人,助教,硕士,主要研究方向为优化理论,随机最优控制在金融与刑事科学中的应用.。

相关文档
最新文档