自抗扰算法介绍报告

合集下载

自抗扰控制技术

自抗扰控制技术

自抗扰控制技术一、本文概述自抗扰控制技术是一种先进的控制策略,其核心在于通过内部机制的设计,使系统能够自动抵御和补偿外部干扰和内部参数变化对系统性能的影响。

随着现代工业系统的日益复杂,对控制系统的鲁棒性和稳定性的要求也越来越高,自抗扰控制技术的出现为解决这些问题提供了新的思路和方法。

本文将对自抗扰控制技术进行详细的介绍和分析。

我们将阐述自抗扰控制的基本原理和核心思想,包括其与传统控制方法的主要区别和优势。

我们将介绍自抗扰控制技术的关键组成部分,如扩展状态观测器、非线性状态误差反馈控制律等,并详细解析其在控制系统中的作用和实现方式。

我们将通过实例分析和仿真实验,验证自抗扰控制技术在提高系统鲁棒性和稳定性方面的实际效果,并探讨其在实际工业应用中的潜力和前景。

本文旨在为从事控制系统设计、分析和优化的工程师和研究人员提供一种新的思路和方法,以应对日益复杂的工业控制问题。

也希望通过对自抗扰控制技术的深入研究和应用,为现代工业系统的智能化和自主化提供有力的技术支持。

二、自抗扰控制技术的基本原理自抗扰控制技术是一种先进的控制方法,其基本原理可以概括为对系统内部和外部扰动的主动抑制和补偿。

该技术的核心在于通过特定的控制策略,使系统在面对各种扰动时能够保持其稳定性和性能。

自抗扰控制技术的基本原理主要包括三个部分:扩张状态观测器(ESO)、非线性状态误差反馈(NLSEF)和跟踪微分器(TD)。

扩张状态观测器用于实时估计系统的总扰动,包括内部不确定性和外部干扰。

通过观测并提取这些扰动信息,系统能够在控制过程中主动抵消这些不利影响。

非线性状态误差反馈部分则根据观测到的扰动信息,通过非线性控制律的设计,实现对系统状态的快速调整。

这种非线性控制策略使得系统在面对扰动时能够迅速作出反应,从而保持其稳定性和性能。

跟踪微分器是自抗扰控制技术的另一个重要组成部分,它通过对期望信号的微分处理,生成一系列连续的指令信号。

这些指令信号能够引导系统以平滑、稳定的方式跟踪期望轨迹,进一步提高系统的控制精度和鲁棒性。

《自抗扰控制器研究及其应用》

《自抗扰控制器研究及其应用》

《自抗扰控制器研究及其应用》篇一一、引言自抗扰控制器(Active Disturbance Rejection Control, ADRC)作为一种先进的控制算法,其在实际工程中的广泛应用受到了越来越多的关注。

ADRC控制策略通过有效地对外部扰动进行抑制,以及对系统内部干扰的抵抗,展现出了其出色的控制性能。

本文将深入探讨自抗扰控制器的理论基础、设计方法及其在各种领域的应用。

二、自抗扰控制器的理论基础自抗扰控制器是一种基于现代控制理论的算法,其基本思想是通过引入适当的控制策略,对系统中的各种扰动进行抑制和消除,以达到提高系统稳定性和性能的目的。

该算法的核心在于对系统模型进行精确的描述,并在此基础上设计出合适的控制器。

三、自抗扰控制器的设计方法自抗扰控制器的设计主要包括以下几个步骤:系统建模、扰动分析、控制器设计及参数优化。

首先,需要建立系统的精确数学模型,包括系统的状态空间模型或传递函数等。

然后,对系统中的各种扰动进行分析,确定扰动的来源和性质。

接着,根据分析结果设计出合适的控制器,包括控制器的结构、参数和算法等。

最后,通过参数优化方法对控制器进行优化,以获得更好的控制性能。

四、自抗扰控制器的应用自抗扰控制器在各种领域都有广泛的应用,包括电力系统、航空航天、机器人控制、汽车工业等。

在电力系统中,ADRC可以有效地抑制电网中的各种扰动,提高电力系统的稳定性和供电质量。

在航空航天领域,ADRC可以实现对飞行器的精确控制,提高飞行安全性和飞行性能。

在机器人控制和汽车工业中,ADRC可以实现对机器人和汽车的精确运动控制,提高其运动性能和稳定性。

五、实例分析以电力系统的应用为例,介绍自抗扰控制器的实际应用。

在电力系统中,由于各种因素的影响,电网中常常会出现各种扰动,如负载扰动、电压扰动等。

这些扰动会导致电力系统的不稳定,甚至可能导致系统崩溃。

而通过引入自抗扰控制器,可以有效地抑制这些扰动的影响,提高电力系统的稳定性和供电质量。

自抗扰控制介绍

自抗扰控制介绍

x&2
r
2
x1
u
2rx2
x1 k 1 x1 k hx2 k
x2
k
1
x2
k
h
r
2
x1
k
u
k
2rx2
k
上式只是能无超调的跟踪输入信号,但是还不是最快 地跟踪输入信号。 为此寻求快速最优控制综合函数。
19
针对二阶积分器串联对象
x&1 x&2
x2 u,
|
u
|
r
以原点为终点的快速最优控制综合函数为
只需根据系统带宽要求确定或在线整定 o
对于一阶、二阶、三阶对象来说分别将特征值配置成
s o 2 , s o 3 , s o 4 即可
38
目录
• ADRC的产生 • ADRC的结构 • 安排过渡过程TD • 扩张状态观测器 • 非线性反馈 • 参数整定方法 • 应用
39
五、非线性反馈
• 线性组合 • 非线性组合
27
目录
• ADRC的产生 • ADRC的结构 • 安排过渡过程TD • 扩张状态观测器 • 非线性反馈 • 参数整定方法 • 应用
28
四、扩张状态观测器(ESO)
• 线性扩张状态观测器 • 非线性扩张状态观测器 • ESO参数整定
29
• 根据测量到的系统输入(控制量) 和系统输出(部分状态变量或状 态变量的函数)来确定系统所有 内部状态信息的装置就是状态观 测器。
因为连续函数的最优函数不再是该函数离散化后的最优函数。
22
改进的算法fhan
u fhan x1, x2, r, h
d rh
d0 hd
y

自抗扰控制技术简介

自抗扰控制技术简介

自抗扰控制技术简介1.自抗扰控制技术概述1.1 什么是自抗扰控制技术自抗扰控制器(Auto/Active Disturbances Rejection Controler,ADRC)技术,是发扬PID控制技术的精髓并吸取现代控制理论的成就,运用计算机仿真实验结果的归纳和总结和综合中探索而来的,是不依赖被控对象精确模型的、能够替代PID控制技术的、新型实用数字控制技术。

1.2 自抗扰控制技术的提出者——韩京清韩京清,朝鲜族, 1937生,系统与控制专家,中国科学院数学与系统科学研究院系统科学研究所研究员、博士生导师,长期从事控制理论与应用研究工作,是我国控制理论和应用早期开拓者之一。

韩京清先生于1998年正式提出自抗扰控制这一思想。

在这个思想提出之后,国内外许多研究者都围绕着“自抗扰控制”展开实际工程应用的研究。

同时,自抗扰控制的理论分析的研究也在不断的深入。

1.3 自抗扰控制技术的特点和优点(1)自抗扰控制器采用“观测+补偿”的方法来处理控制系统中的非线性与不确定性,同时配合非线性的反馈方式,提高控制器的动态性能。

(2)自抗扰控制器算法简单、易于实现、精度高、速度快、抗扰能力强。

(3)统一处理确定系统和不确定系统的控制问题;扰动抑制不需外扰模型或者外扰是否观测;控制算法不需辨识控制对象;统一处理非线性和线性系统;可以进行时滞系统控制;解耦控制只要考虑静态耦合,不用考虑动态耦合等。

2.自抗扰控制技术提出的背景2.1 现代控制理论的缺点和改进现代控制理论以状态变量描述为基础,以状态反馈实现极点配置来改善全局动态特性的问题。

因而,此种控制的主要手段是状态反馈。

“这种全局控制方法需要知道关于开环动态特性的先验知识和状态变量的信息,这在许多工程实际中是很不现实的,因为工程实际提供不了有关开环动态特性的多少先念知识,因此这种全局控制方法是很难在实际中得到应用。

”这就是现代控制理论的缺点,这也限制了这种控制方法在工程实际中的应用。

自抗扰技术

自抗扰技术
靠控制目标与实际行为之间的误差来确定消除此误差的 控制策略。
缺点
误差的取法不合理。 没有合理提取误差微分的办法。 加权和不一定是最好的组合方式。 积分反馈有许多副作用。
从PID到自抗扰控制(ADRC)
安排合适的“过渡过程” 合理提取“微分”-“跟踪微分器”(Tracking Differentiator,TD); 探讨合适的组合方法-“非线性组合”(NF); 探讨扰动估计办法-“扩张状态观测器”(Extended State Observer,ESO)。
从PID到自抗扰控制(ADRC) 考察一阶误差系统:

.
.
w u
(2.6.1)
u k , k 0 ,则 对上式实施误差的线性反馈,
如果存在一常数 w0 0满足
k w,1 / 2(d 2 / dt ) k 2 w
w w0 ,1 / 2(d 2 / dt ) k ( w0 / k )
(2.4.16)
上式是很好的数值微分器,称作“快速离散跟踪微 分器”。把函数 fst ()中的变量 h 取成与步长 h 相互 独立的新变量 h0 ,得:
x1 (t h) x1 (t ) hx2 (t ) x2 (t h) x2 (t ) hfst ( x1 (t ) v(t ), x2 (t ), r , h0 )
(2.4.17)
h0 。 r 决定着跟踪速度,称作 上式有两个可调参数 r , “速度因子”;h0 起对噪声的滤波作用,称作“滤 波因子”。
从PID到自抗扰控制(ADRC) 在一般的控制系统中,误差直接取成:
ev y
(2.5.1)
误差的这种取法使初始误差很大,易引起“超调”, 很不合理。 改进:根据对象的承受能力,我们考虑先安排合理 的过渡过程v1 (t ) ,然后将误差取为:

自抗扰控制简介

自抗扰控制简介
以原点为终点的快速最优控制综合函数为: (2)
u ( x1 , x2 ) r sign( x1
将式(3)代入式(2)可得:
x1 x2 x2 r sign( x 1 v0 (t )
x2 x2 ) 2r
(3)
x2 x2 2r
)
(4)
这个系统的解的分量
x1 (t )
在加速度
(7)
扩张状态观测器对被观测系统有较好的跟踪能力, 响应速度快, 估计精度高, 但是对总扰动的实时估计受到某些条件的限制。当外扰频率较高时,扩张状态观 测器对于总扰动的跟踪能力较差。
3.3 自抗扰控制律
在韩京清先生的《自抗扰控制技术》第五章中,介绍了改进过的非线性 PID 与由线性跟踪微分器以及状态观测器实现的“线性 PID”。并且谈及了为给定安 排过渡函数,以及按不同误差组合构成的“非线性 PID”。而之后的“自抗扰控 制器”是跟踪微分器和扩展状态观测器产生的状态变量估计之间的误差的非线 性组合,并且与扩张状态观测器对总扰动的补偿量一起组成控制量:
5
参考文献
[1] 韩京清. 控制理论—–模型论还是控制论 [J]. 系统科学与数学, 1989, 9(4): 328 – 335. [2] 韩京清. 线性控制系统的结构与反馈系统计算 [C] //全国控制理论 及其应用论文集. 北京: 科学出版社, 1981: 43 – 55. [3] 韩京清. 控制系统的鲁棒性与 Gö del 不完备性定理 [J]. 控制理论与 应用, 1999, 16(增刊): 149 – 155. [4] 韩京清. 抗扰控制技术—–估计补偿不确定因素的控制技术 [M]. 北 京: 国防工业出版社, 2008. [5] HAN Jingqing. From PID to active disturbance rejection control [J]. IEEE Transactions on Industrial Electronics, 2009, 56(3): 900 – 906. [6]杨晟萱. 四旋翼飞行器自抗扰控制方法研究[D].大连理工大学,2014. [7]朱晓光. 航天器交会对接逼近段自抗扰控制研究[D].吉林大学,2015. [8]吴丹,赵彤,陈恳. 快速刀具伺服系统自抗扰控制的研究与实践[J]. 控制理论与 应用,2013,12:1534-1542. [9] 马幼捷 ,刘增高 , 周雪松 ,王新志 . 基于自抗扰控制技术的发电机励磁控制系统 [J]. 控制工程,2008,06:627-629+695. [10]TIAN G, GAO Z Q. Benchmark tests of active disturbance rejection control on an industrial motion control platform [C].Proceedings of the 2009 American Control Conference. St. Louis, MO: IEEE, 2009:5552 – 5557 [11] Achieve improved motion and efficiency for advanced motor control designs in minutes with TI’s new InstaSPIN(TM)–MOTION technology, The Wall Street Journal, April 18, 2013 at http: ///article/PR – CO – 20130418 – 907338.html ? mod = googlenews_wsj. [12] 李 海 生 , 朱 学 峰 . 自 抗 扰 控 制 器 参 数 整 定 与 优 化 方 法 研 究 [J]. 控 制 工 程 ,2004,11(5):419-423. [13] 张文革 . 时间尺度与自抗扰控制器 [D]. 北京 : 中国科学院系统科学研究 所 ,1999.

自抗扰控制简介

自抗扰控制简介

目录目录目录 (1)1 绪论 (1)2 问题描述 (1)3 发展现状 (2)3.1 非线性跟踪微分器 (2)3.2 扩张状态观测器 (3)3.3 自抗扰控制律 (4)3.4 参数整定问题 (4)4 未来展望 (15分) (4)5 结论 (5)参考文献 (6)1 绪论自抗扰控制是韩京清先生以对控制理论的反思为开端提出的以反馈系统的标准型(积分器串联型)为基础,以工程控制的鲁棒性为目标的控制技术[1-5]。

其思想是以工业界占主导地位的PID控制为出发点,在改进非线性PID的基础上提出自抗扰的概念,算法简单,在未知强非线性和不确定强扰动的作用下仍能够保持控制精度。

在国内,自抗扰控制技术在四旋翼无人机控制[6]、航天器姿态控制[7]、精密车床中快速刀具的伺服控制[8]、电机的励磁控制[9]等方面均有应用案例。

在国外,自抗扰控制于2009年通过了运动控制的工业评估[10];2013年,德州仪器开始在全球发布以自抗扰为技术核心的运动控制芯片[11]。

可见,自抗扰控制技术具备巨大的潜力与工程应用前景。

2 问题描述1989年,韩京清先生提出了对控制领域的疑问——模型论还是控制论。

模型论“靠系统的数学模型去找控制率”,后者依靠的是系统的“某些响应特征或过程的某些实时信息”。

而“通过误差来消除误差”正是简单的线性PID所蕴含的朴素思想,也是PID能够在工业界获得广泛应用的原因。

而以现代控制理论为代表的控制理论虽然在数学上严密可证,然而在实际应用中却较少,因为实际的控制对象总是不可避免地存在未知与不确定性。

因此,反思控制理论数学化带来的理论与工业实践的脱节,探索新的控制技术与理论是有必要的。

而自抗扰控制技术就是基于以上的问题,以PID为出发点,探索控制技术与理论的新方向。

3 发展现状3.1 非线性跟踪微分器自抗扰控制目前主要包括三方面的内容:非线性跟踪微分器,扩张状态观测器以及一系列自抗扰控制律的设计。

非线性跟踪微分器能够抑制噪声信号的放大效应,得到较好的微分近似信号。

一种自抗扰控制器参数的学习算法

一种自抗扰控制器参数的学习算法

第40卷第3期自动化学报Vol.40,No.3 2014年3月ACTA AUTOMATICA SINICA March,2014一种自抗扰控制器参数的学习算法武雷1,2保宏1杜敬利1王从思1摘要针对自抗扰控制器(Automatic disturbance rejection con-troller,ADRC)参数多且耦合性强,参数难于被确定的问题,提出了一种ADRC参数的自动调整算法.该算法以构造的控制性能函数为学习目标,根据参数对性能指标的影响,通过惩罚函数在线不断更新参数在有界区间内的概率密度分布,使得控制参数最优值的概率密度值最大.通过开环不稳定系统算例和对工业机电驱动器单元(Industrial mecha-tronic drives unit,IMDU)的控制实验,仿真和实验结果证明了该算法的有效性.关键词自抗扰控制器,自动调整,控制参数,工业机电驱动器单元引用格式武雷,保宏,杜敬利,王从思.一种自抗扰控制器参数的学习算法.自动化学报,2014,40(3):556−560DOI10.3724/SP.J.1004.2014.00556A Learning Algorithm for Parameters ofAutomatic Disturbances RejectionControllerWU Lei1,2BAO Hong1DU Jing-Li1WANG Cong-Si1Abstract Considering the special characteristics of the auto-matic disturbance rejection controller(ADRC),with emphasis on the parameters and strong coupling among them,an algo-rithm is presented in this paper for tuning the parameters of the ADRC automatically.Aiming at the minimization of the con-trol performance function,the algorithm learns an optimal set of controller parameter values of the ADRC by cost function, updating each parameter of the controller within a bounded in-terval probability density distribution constantly and making the probability density of the optimal control parameter maximum. The algorithm is applied to an open-loop unstable system and the industrial mechatronic drives unit(IMDU),the results of simulation and experiment show its validity.Key words Automatic disturbance rejection controller (ADRC),tuning automatically,control parameter,industrial mechatronic drives unit(IMDU)Citation Wu Lei,Bao Hong,Du Jing-Li,Wang Cong-Si.A learning algorithm for parameters of automatic disturbances rejection controller.Acta Automatica Sinica,2014,40(3): 556−560经典线性控制算法中,PID控制器在工业控制中占有重要的地位,随着应用的广泛性增加及现代工业对控制性能要求的不断提高,其存在的缺点也不断地凸显出来,为了克服PID控制器的缺点,韩京清提出了一种非线性PID控制器(Nonlinear PID,NLPID),该控制器具有更强的误差衰减能力和抗干扰能力[1],并经过一般化处理后,设计了独立于对象数学描述的状态误差反馈控制律[2],最终,在文献[3]收稿日期2012-08-22录用日期2013-03-04Manuscript received August22,2013;accepted March4,2013国家自然科学基金(50775170,51105290,51035006,50805111, 51175398)资助Supported by National Natural Science Foundation of China (50775170,51105290,51035006,50805111,51175398)本文责任编委王聪Recommended by Associate Editor W ANG Cong1.西安电子科技大学电子装备结构教育部重点实验室西安7100712.中国电子科技集团第十四研究所南京2100391.Electronic Equipment Structure Key Laboratory of Education Ministry,Xidian University,Xi an7100712.14th Institute of China Electronics Technology Group Corporation,Nanjing210039中,提出了自抗扰控制器(Automatic disturbance rejection controller,ADRC)的基本概念.文献[4]详细阐述了从经典PID到自抗扰控制器的推导过程.由于该算法控制精度高、自抗扰能力强,ADRC也不断被学者在实践中进行应用.例如,NLPID被应用在电加热炉集散控制系统中,实时控制结果证明,NLPID具有控制精度高、调节时间短和抗干扰能力强的优点[5].Hou等将ADRC应用到卷纸机控制系统中,克服了因系统模型动态变化对控制性能的影响[6];Wu等将其应用于非圆车削中刀架伺服系统,提高刀架跟踪速度和抗干扰性[7].然而,在实际应用中[5−12],ADRC相对于PID有更多参数需要调整,且这些参数互相影响,使得ADRC的应用受到了很大的限制.为此,文献[4]给出了部分参数取值原则,但是该方法是针对特定系统,适应范围小.Sun和Gao针对线性化的ADRC参数,提出了基于频率方法的ADRC参数自调整算法[12−13],但是线性化使得ADRC的鲁棒性降低,降低了算法的优势.文献[14]给出了基于混沌粒子群算法(Chaos particle swarm optimization,CPSO)的ADRC参数自适应,降低了基本粒子群算法易陷入局部最优解的可能性,并保持了该算法的优势,但是这种算法耗费时间长,不利于实际应用.可见,有效地解决ADRC参数的调整问题,能够推动ADRC的实际应用.据此,本文结合连续动作强化学习器(Continuous action reinforcement learning automata,CARLA)的架构[15−17],提出了一种ADRC参数自学习算法–CARLA-ADRC.该方法依据构造性能目标函数,更新ADRC参数取值空间的概率密度函数,确定出满足性能要求的ADRC参数.针对ADRC 参数难于整定的问题,该方法的最大优点是在保持ADRC优势的情况下,快速自动确定其参数.1自抗扰控制器以二阶系统为例,图1给出了自抗扰控制器的原理框图,图中虚线部分为自抗扰控制器(ADRC),主要由非线性跟踪–微分器(Tracking differentiator,TD)、扩张状态观测器(Extended state observer,ESO)、非线性误差反馈律(Nonlinear PD,NPD)和扰动补偿过程所组成.其完整表达式为:1)以v为设定输入的TD表达式v1=v1+h×v2v2=v2+h×fhan(v1−v,v2,r0,δ0)(1)2)以系统输出y和输入u来估计系统状态和总扰动的ESOe=z1−yfe=fal(e,α1,δ1)fe1=fal(e,α2,δ1)z1=z1+h(z2−β01e)z2=z2+h(z3−β02fe+b0u)z3=z3+h(−β03fe1)(2)3)非线性误差反馈律(NPD)和扰动补偿过程e1=v1−z1e2=v2−z2u0=β1fal(e1,α3,δ2)+β2fal(e2,α4,δ2)u=u0−z3b0(3)其中,β01,β02,β03,β1,β2为可调参数,h为系统采样周期,非线性函数fhan和fal的具体表达式及其参数在文献[4]3期武雷等:一种自抗扰控制器参数的学习算法557中被详细地描述出来.由式(1)∼(3)可以看出该方法共有14个参数需要调整,且这些参数相互耦合,如何针对控制系统给出合理的参数,成为阻碍ADRC在实际中应用的关键.图1ADRC原理框图Fig.1Schematic diagram of ADRC2CARLA-ADRC算法在CARLA-ADRC算法中,依据CARLA强化学习算法中的更新机制[15−17],对于ADRC的第i参数,定义一个相应的学习区间X i={x i|x i min≤x i≤x i max}和第k次学习迭代的概率密度分布函数f i(x i,k),对于该区间的选区,可根据文献[4]提出的方法先初步确定一组参数,根据这些参数扩展出一个学习区间.区间的x i max和x i min分别表示参数可取的最大值和最小值.初始情况下,其概率密度分布函数服从于均匀分布为:f i(x i,1)=1x i max−x i min,x i∈X i0,其他(4)每次进行学习时,都需要从参数区间中确定出一组参数, CARLA-ADRC采用随机的方式来提取每次学习迭代所使用的参数:x i(k)x i minf i(x i,k)d x i=z i(k)(5)式中,z i(k)属于区间[0,1]的随机数,x i(k)为ADRC第k 次学习时第i个参数值.随机的方式能够保证ADRC参数得到足够的学习机会,避免了CARLA-ADRC学习的参数陷于局部最优解.将选择出的ADRC参数应用到被控制系统中,求出与之相对应的目标函数值J(k),将J(k)与先前目标函数值的最小值J min和均值J mean进行比较,便可以对该组参数进行性能评估,即β(k)=minmax0,J mean−J(k)J mean−J min,1(6)这里,β(k)为惩罚函数.若本次学习目标值小于以前最小值则给予奖励,若本次学习的消耗值大于均值,则给予惩罚值为0.计算出β(k)后,ADRC的每个参数的概率密度分布函数则进行相互独立的更新:f i(x i,k+1)=α(k)[f i(x i,k)+β(k)H(x i,r)],x i∈X i 0,其他(7)式中,H(x,r)是以本次学习每个参数值r=x i(k)为中心的高斯分布函数,其具体表达式为H(x,r)=g hx max−x minexp−(x−r)22(g w(x max−x min))2(8)式中,g h和g w分别决定了算法学习ADRC参数的速度和分辨能力.为了保证ADRC每个参数的概率密度分布函数在其区间积分为1,式(7)中定义了归一化因子,其计算表达式为α(k)=1x i maxx i min[f i(x i,k)+β(k)H(x i,r)]d x i(9)图2给出了算法总体流程图.算法结束条件为迭代到一定次数或目标函数均值J mean收敛到一个特定值.随着系统学习的进行,每个ADRC参数的概率密度分布不断被以能提高系统控制性能的参数值为中心的高斯函数所更新,最终, ADRC的每个参数的概率密度分布将收敛到以最优值为中心的高斯分布.图2CARLA-ADRC算法流程图Fig.2Flow chat of CARLA-ADRC3仿真与实验3.1仿真对于式(10)所示开环不稳定系统,该系统含有符号非线558自动化学报40卷性项,因此,此系统相当于线性系统加入一个周期为4π的跳动干扰.˙x 1=x 2˙x 2=x 1+x 2+sgn sin t2 +u y =x 1(10)CARLA-ADRC 算法的目标函数定义为系统误差绝对值对时间的积分:J (k )=T0|e (t,k )|d t (11)其中,学习参数设为g w =0.3和g h =0.02,存储空间为R =500.TD 模块参数可以根据控制系统性能要求而定,本次仿真TD 参数为r 0=50和h 0=0.001,其余参数取值范围见表1.表1ADRC 的参数范围及最优值Table 1Parameter range and optimal value of ADRCADRC 参数参数范围最优值δ1[00.01]0.0016α1[01.0]0.5872α2[01.0]0.0869β01[0100]37.8646β02[010000]4921.3β03[0100000]66611δ2[00.01]0.008α3[01.0]0.2977α4[01.0]0.7023β1[0200]25.058β2[0200]172.091b 0[0100] 5.3455图3显示了平均目标函数值的变化趋势,由图3可以看出,J mean 在500次以后开始收敛,2000次后,J mean 下降速度减慢,5000次后,J mean 收敛到特定值.图4(a)为ESO 参数α2概率密度f (α2)的变化趋势,图4(b)为NPD 参数α4概率密度f (α4)的变化趋势,图4(c)为扰动补偿参数b 0概率密度f (b 0)的变化趋势,从图中可以看出,由于惩罚函数的作用,使得参数概率密度函数收敛到一个特定概率密度分布,限于篇幅原因,其他参数概率密度变化趋势不再给出.选取每个参数概率密度最大对应的参数值,即为相应ADRC 参数最优值(见表1),图5给出了所选取的ADRC 参数对系统(10)的阶跃响应图,由图可以看出,学习后的ADRC 参数使得系统(10)具有很好的跟踪性能.图3目标函数平均值的变化趋势Fig.3Tendency of the mean of costfunction(a)(b)(c)图4ADRC 部分参数的概率密度变化趋势Fig.4Tendency of probability density ofpart of ADRCparameters 图5ADRC 的阶跃响应Fig.5Step response of ADRC3.2实验为了检验CARLA-ADRC 算法在实际控制系统中应用,将其应用于IMDU 实验平台中进行半实物仿真.如图6所示,IMDU 实验平台主要包括驱动电机1,负载电机2,以及摩擦模块3.在IMDU 系统的被控轴上加入摩擦模块3,作为控制系统的内部干扰,通过负载电机2可以模拟系统的外部干扰,因此IMDU 实验平台可以同时模拟控制系统的内外部干扰.该实验采用dSPACE 系统作为控制器快速生成和数据采集平台.3期武雷等:一种自抗扰控制器参数的学习算法559图6IMDU 系统Fig.6Industrial mechatronic drives unit systemADRC 的参数范围设定如表2所示,设定系统采样周期为0.001s,每次学习的时间为5s,设定目标函数为J =5000 k =0t k e k 2(12)TD 的参数为r 0=100和h 0=0.001.经过在线学习,图7给出了目标函数均值的变化趋势,图8给出了部分参数的概率f (β01),f (β2),f (b 0)的变化趋势.选取ADRC 参数概率密度最大的值(见如表2),对IMDU 系统进行控制,图9给出了跟踪方波信号的控制效果,从图中可以看出,经CARLA-ADRC 算法学习出的控制器,能够无超调且快速跟踪方波信号,并且能够消除系统中干扰对控制性能的影响.对比文献[14]的方法,该方法学习出的参数控制性能更好,表3给出了相同情况下自动确定ADRC 参数两种算法所需要的时间,可以看出本算法具有更快的速度.表2ADRC 的参数范围及最优值Table 2Parameter range and optimal value of ADRCADRC 参数参数范围最优值δ1[00.001]0.00023α1[01.0]0.3764α2[01.0]0.4315β01[1200]143.3β02[900012000]11469β03[6000090000]75163δ2[0.0010.01]0.0049α3[01.0]0.5570α4[01.0]0.2427β1[2050]27.8749β2[5.015] 6.5993b 0[50150]90.8251表3自动确定ADRC 参数所需时间对比(小时)Table 3Comparison of the time needed for tunning theparameters of ADRC (hour)算法CARLA-ADRCCPSO-ADRC消耗时间4.321图7平均消耗值的变化趋势Fig.7Tendency of the mean of cost function(a)(b)(c)图8ADRC 部分参数的概率密度变化趋势Fig.8Tendency of probability density of part ofADRC parameters4结论为了解决ADRC 控制器参数难于整定的问题,本文提出了CARLA-ADRC 算法,该算法只需在给定系统参数范围的情况下,可自动学习一组满足性能指标的控制参数,通过对开环不稳定系统仿真和IMDU 系统的实际控制,证明了该算法的有效性.但是如何更有效地确定ADRC 控制器参数学习区间还需要进一步研究.对于大于二阶的系统,ADRC 参560自动化学报40卷数数目的增加也会影响本算法的学习效率,因此对于本算法,还有研究的空间和必要性.图9ADRC 的控制效果Fig.9Control effect of ADRCReferences1Han Jing-Qing.A new type of controller:NLPID.Control and Decision ,1994,9(6):403−407(韩京清.一种新型控制器—NLPID.控制与决策,1994,9(6):403−407)2Han Jing-Qing.Nonlinear state error feedback control law —NLSEF.Control and Decision ,1995,10(3):221−225(韩京清.非线性状态误差反馈控制律—NLSEF.控制与决策,1995,10(3):221−225)3Han Jing-Qing.Auto-disturbances-rejection controller and its applications.Control and Decision ,1998,13(1):19−23(韩京清.自抗扰控制器及其应用.控制与决策,1998,13(1):19−23)4Han Jing-Qing.From PID to active disturbance rejection control.IEEE Transactions on Industrial Electronics ,2009,56(3):900−9065Wang Shun-Huang,Li Xiao-Tian,Zheng Qiu-Bao,Zheng Bao-Yuan,Deng Rui-Lan,Hu Yi-Shun.Nonlinear PID algo-rithm and its application in distributed system of the elec-tronic heating furnace.Acta Automatica Sinica ,1995,21(6):675−680(王顺晃,李晓天,郑秋宝,郑保元,邓芮岚,轷一顺.非线性PID 算法及其在电加热炉集散控制系统中的应用.自动化学报,1995,21(6):675−680)6Hou Y,Gao Z Q,Jiang F,Boulter B T.Active disturbance rejection control for web tension regulation.In:Proceedings of the 40th IEEE Conference on Decision and Control.Or-lando,USA:IEEE,2001.4974−49797Wu Dan,Wang Xian-Kui,Zhao Tong,Lv Wei-Long.Appli-cation of active disturbance rejection to tracking control of a fast tool servo system.In:Proceedings of the 2005IEEE International Conference on Control Application.Toronto,Canada:IEEE,2005.547−5528Zhang Rong.An economic interpretation of ADRC.In:Pro-ceedings of the 2011Chinese Control and Decision Confer-ence.Mianyang,China:IEEE,2011.2731−27359Talole S E,Kolhe J P,Phadke S B.Extended-state-observer-based control of flexible-joint system with experimental val-idation.IEEE Transactions on Industrial Electronics ,2010,57(4):1411−141910Li Xing-Hua,Chen Wen-Lei.Application of active distur-bance rejection controller for high precision servo system.In:Proceedings of International Conference on Mechatronic Science,Electric Engineering and Computer.Jilin,China:IEEE,2011.2467−247011Zhao Yang,Zhao Zhi-Gang,Zhao Bao-Shan,Li Wen-Bo.Active disturbance rejection control for manipulator flexi-ble joint with dynamic friction and uncertainties compensa-tion.In:Proceedings of the 4th International Symposium on Computational Intelligence and Design.Hangzhou,China:IEEE,2011.248−25112Sun Bao-Sheng,Gao Zhi-Qiang.A DSP-based active distur-bance rejection control design for a 1-kW H-bridge DC-DC power converters.IEEE Transactions on Industrial Electron-ics ,2005,52(5):1271−127713Zheng Qing,Gao L Q,Gao Zhi-Qiang.On validation of ex-tended state observer through analysis and experimentation.Journal of Dynamic Systems,Measurement,and Control ,2012,134(2):024505.1−024505.614Liu Chun-Fang,Zang Bin.Application and the parametertuning of ADRC based on CPSO.In:Proceedings of 24th Chinese Control and Decision Conference.Taiyuan,China:IEEE,2012.3277−328115Howell M N,Frost G P,Gordon T J,Wu Q H.Continuousaction reinforcement learning applied to vehicle suspension control.Mechatronics ,1997,7(3):263−27616Mohammadi S M A,Gharaveisi A A,Mashinchi M R,RafieiS M R.New evolutionary methods for optimal design of PID controllers for AVR system.In:Proceedings of 2009IEEE Bucharest Power Tech Conference.Bucharest,Roma-nia:IEEE,2009.1−817Gurzi P,Steenhaut K,Nowe A,Vrancx P.Learning a pricingstrategy in multi-domain DWDM networks.In:Proceedings of 201118th IEEE Workshop on Local &Metropolitan Area Networks.Chapel Hill,USA:IEEE,2011.1−6武雷西安电子科技大学电子装备结构教育部重点实验室硕士研究生.主要研究方向为机器学习和非线性控制.本文通信作者.E-mail:leiwu **************(WU Lei Master student at the Electronic Equipment Struc-ture Key Laboratory of Education Ministry,Xidian University.His research interest covers machine learning and nonlinear con-trol.Corresponding author of this paper.)保宏西安电子科技大学电子装备结构教育部重点实验室教授.主要研究方向为天线结构的分析、优化与控制.E-mail:********************(BAO Hong Professor at the Electronic Equipment Structure Key Laboratory of Education Ministry,Xidian University.His research interest covers analysis,optimization and control of an-tenna driven systems and antenna structures.)杜敬利西安电子科技大学电子装备结构教育部重点实验室教授.主要研究方向为索牵引系统与索网结构的分析、优化与控制.E-mail:****************(DU Jing-Li Professor at the Electronic Equipment Structure Key Laboratory of Education Ministry,Xidian University.His research interest covers amechanical analysis,optimization,and control of cable-driven systems and cable network structures.)王从思西安电子科技大学电子装备结构教育部重点实验室教授.主要研究方向为电子装备机电耦合,天线机电热耦合设计.E-mail:********************(W ANG Cong-Si Professor at the Electronic Equipment Structure Key Laboratory of Education Ministry,Xidian Uni-versity.His research interest covers electromechanical cou-pling of electronic equipments with emphasis on the structural-electromagnetic-thermal coupling of antennas.)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

自抗扰算法(ADRC )介绍报告
自抗扰控制器自PID 控制器演变过来,采取了PID 误差反馈控制的核心理念。

传统PID 控制直接引取输出于参考输入做差作为控制信号,导致出现响应快速性与超调性的矛盾出现。

自抗扰控制器主要由三部分组成:跟踪微分器(tracking differentiator),扩展状态观测器 (extended state observer) 和非线性状态误差反馈控制律(nonlinear state error feedback law)。

跟踪微分器的作用是安排过渡过程,给出合理的控制信号,解决了响应速度与超调性之间的矛盾。

扩展状态观测器用来解决模型未知部分和外部未知扰动综合对控制对象的影响。

虽然叫做扩展状态观测器,但与普通的状态观测器不同。

扩展状态观测器设计了一个扩展的状态量来跟踪模型未知部分和外部未知扰动的影响。

然后给出控制量补偿这些扰动。

将控制对象变为普通的积分串联型控制对象。

设计扩展状态观测器的目的就是观测扩展出来的状态变量,用来估计未知扰动和控制对象未建模部分,实现动态系统的反馈线性化,将控制对象变为积分串联型。

非线性误差反馈控制律给出被控对象的控制策略。

系统结构框图如图1
图1
过程和扩张状态观测器方程:
1y x =22302220(1)()*(()*(,,)*())z k z k h z k fal b u k βεαδ+=+-+1120111(1)()*(()*(,,))
z k z k h z k fal βεαδ+=+-12212;()();()(,,,)x x x a t u t a t f x x t ω==+=330312(1)**(,,)
z k z h fal βεαδ+=-
非线性控制策略方程:
二阶微分控制器:
112(1)()*()v k v k h v k +=+
2212(1)()*(()(),(),,)v k v k h fhan v k v k v k r h +=+-
其中,h 为积分步长,r 为跟踪算子。

其中fal 函数的曲线如下,近似一个分段线性函数,间断点为0δ。

由于控制信号一般认为是一阶跃,然而阶跃信号对于系统而言,不可能实现跟踪,因此,将阶跃引入控制器输入端本身就不合理[1],并且容易产生超调。

所以,在ADRC 算法中,特意引入了一二阶微分跟踪器来实现将控制信号平滑的功能,其中,V1能够很快速无超调地跟踪上输入信号,V2可以看成是V1的一个微分信号。

这样就使得系统只需要跟踪V1信号即可实现对V 的快速跟踪。

在ADRC 算法中,最核心的就是扩张状态观测器。

它除了可以根据对象的输入,输出来观测出系统的2维状态外,还可以观测出系统所受到的扰动、系统参数的时变性、系统的非线性的对系统的影响,从而将此状态输出送给控制器的输出,补偿系统中的这些部分。

通过这种补偿,一个2阶系统就可以等效成一个积分串联环节,这对于控制器算法的设计就大大方便了。

Z1为控制器的x1状态的观测量,也就是y 的观测量,Z2为X2的观测量,也就是输出y 的微分的观测量。

非线性组合是指不再将传统的e ,sum(e),de 进行线性的组合,而是采取一个非线性的结合,在很多实践过程中,我们发现,非线性组合比线性的组合要更加优越。

在原理的了解基础上,我们进行了算法的仿真。

111()()()e k v k z k =-222()()()e k v k z k =-0102010()*((),,)*((),,)*(,,)p p d D i u k k fal e k k fal e k ki fal e αδαδαδ=++030()()()/u k u k z k b =-
仿真过程对象是一个大滞后纯积分过程。

采样时间为Ts=0.01s 。

图 2
图3
图2,图3为采用了ADRC 控制算法后,对象在干扰0.01的噪声影响下的输出。

输入为单位阶跃。

且图2是在纯滞后时间为5s 的情况下,将ADRC 参数调整好之后,把纯滞后时间加大为8s 、9s 再次进行的仿真结果曲线图。

可以看出引入了ADRC 控制算法后,系统无论是抗干扰能力,对系统参数变化后的鲁棒性,都是非常良好的。

图3是在纯滞后时间为10s 情况下,减小滞后时间为5s 后的仿真结果图。

同时在此控制对象中,我们将ADRC 算法与PID 控制算法进行了对比。

图4为采用了PI 控制算法后的仿真结果图,此时无干扰。

其中,kp=0.145,ki=0.002,因为在纯滞后系统中,对象的反应有死区,如果KI 的值稍大,则在死区累积过程后,必然会存在非常大的控制量输出,必然会引起系统的大超调,甚至是震荡。

因此,我们选了很小的ki 参数值,并且此KP,KI 参数是根据Z-N 整定法得出的,并进行了稍微的调整,通过改变参数,我们发现此KP,KI 参数为一个很不错的控制器参数。

5()0.01
s
e G s s -=+
图4 图5
图6
图5是在图4的仿真基础上引入了幅值为0.01的干扰后系统的响应图。

图六是也是在图4的仿真基础上,将对象的纯滞后参数改成10s后的仿真结果图。

可以看出PI控制器虽然在对此过程对象也能有比较好的控制效果,但是,系统对于噪声干扰,模型参数变化影响的抑制能力是非常弱的。

因此,对于此对象,PI 控制器构成的控制系统的鲁棒性是远远不如ADRC控制器的。

通过对比,我们可以看出ADRC在系统抗干扰,模型参数变化时的控制性能比传统的PID控制器有很强的优势。

总结:自抗扰因为引入了二阶微分跟踪器,扩张状态观测器,使得高频噪声能够很好的抑制。

非线性控制策略对一些负载对象具有很好的应用前景。

并且,扩张状态观测器能够较好的补偿模型参数的变化,以及扰动量对输出的影响。

但是,ADRC的一个非常重要的缺点就是参数太多,有13个,相比于传统的PID的3
个参数,系统参数的调节将非常复杂,在实际使用时,会非常麻烦。

β相当于是会接把误在此,我将此次仿真调节参数的一些理解进行阐述。

03
β后加到了u(t)上,相当于Kp,并且此参数对系统性能影响非常大,差乘以了h*
03
如果系统震荡加剧,则可以首先减少此参数,然后再调节控制器的比例增益Kp,b0对于大惯性环节或者大滞后环节很有效,越大的滞后则需要越大的b0,且b0
δ,δ太大,则ADRC工作在线性区,非线性控制器即对于震荡也有一定的抑制作用。

为一个线性PID控制器,如果其太小,则控制器的输出容易震颤,其大小与被控对象和控制
精度有关。

参考文献:
[1] 自抗扰控制器及其应用,韩京清,控制与决策,1998。

[2] 大纯滞后纯积分对象的二阶自抗扰控制,要晓梅,王庆林,韩京清,控制工程,2002。

相关文档
最新文档