基于扰动观测器的机器人自适应神经网络跟踪控制研究
基于观测器的受正弦扰动MIMO系统最优跟踪控制

≤ 2≤ … ≤ ≤ 丌, 幅值 f 和相位 ( i=1 ,
2 … ,) , P 可以为未知 , 但 ( =12 … ,) i ,, P 是可测量
的。
统 , 运行 中承受规则海浪力近似为正弦扰 动力等 。 在跟踪控 制工 程 中由于对 控制 精 度的要 求 越来 越 高, 如果用无扰动初值 问题 的最优跟踪控制方法 设计受扰 系统 , 得到的跟踪控制律不是最优 的 , 且设 计的控制律对外 部扰动影 响的鲁棒性 较差 , 以必 所
y £ = C () () x £
() 1
收稿 1 20 — -9 修改稿) 3期:071 2 ( 0 基金项 目: 国家 自然科 学基 金项 目(0 7 0 3 ; 岛科 技大 6 54 2 ) 青 学科研启 动基金资助项 目
维普资讯
第 6期
(), ,取得极小值 。 t 使
在实 际应用 中, 控制 系统总是 在各种 外部干 扰
∈R ; ——外部 干扰 向量 , ∈R Y ; ——输 出向
量, Y∈R A B, , ; , C D——适 当维数 的常量矩 阵。
假 设 可 以表 示 为 :
Ⅱ1i(【t sn (l +妒1 J ) Ⅱ sn (2 +妒 ) 2i(【t 2 J () 2
维普资讯
过 程 控 制
化 自 化 仪 ,0 ,4 )2 1 工 动 及 表 273 6: —5 0 ( 1
C nr l n n t me t i h mia n u t o t d I s u ns n C e c lI d sr oa r y
基 于 观 测 器 的 受 正 弦 扰 动 MI MO 系 统 最 优 跟 踪 控 制
高德 欣 杨佩 佩 张文 武 , ,
不确定非完整轮式移动机器人的运动控制研究

不确定非完整轮式移动机器人的运动控制研究非完整轮式移动机器人(wheeled mobile robot,WMR)是典型的多输入多输出耦合欠驱动非线性系统, 其运动控制问题极具挑战性。
轮式移动机器人大多工作在复杂未知环境之下, 容易受到多种不确定性和扰动的综合影响, 因此, 解决复杂不确定下非完整轮式移动机器人的运动控制问题意义深刻且现实需求迫切。
本文研究了轮式机器人包含定位不确定性、参数和非参数不确定性、侧滑和打滑干扰等情形下的运动控制策略, 探讨了非完整单链系统的有限时间控制以及力矩受限下轮式移动机器人的动力学控制。
主要的研究成果包括: (1)研究了定位不确定的轮式移动机器人路径跟随问题, 提出一种基于改进遗传算法优化自适应扩展卡尔曼滤波的全局一致渐进稳定控制器。
(2)提出了一类n维不确定非完整单链系统的鲁棒有限时间镇定控制律。
通过不连续变换将原系统分解为1阶和n-1阶两个解耦的独立子系统, 对1阶子系统采用分段控制策略解决不连续变换引起n-1阶子系统奇异问题, 保证控制律的全局性, 对n-1阶子系统采用反演(backstepping)设计方法, 降低设计复杂度, 设计过程基于有限时间Lyapunov理论, 保证系统的有限时间稳定。
(3)研究了本体动力学模型包含参数和非参数不确定性的轮式移动机器人轨迹跟踪问题, 提出基于自适应反演滑模控制的全局渐进稳定饱和控制方案。
通过运动学输入-输出非线性反馈和动力学输入变换, 建立包含系统总体不确定性项的线性模型, 采用一种动态调整机制实现控制输入饱和约束, 基于幂次趋近律提高了滑模控制的平滑性和快速性, 自适应估计总体不确定性的上界有效削弱了滑模控制的抖振现象。
(4)提出了执行器动力学模型包含参数和非参数不确定性的轮式移动机器人轨迹跟踪与镇定统一控制方法。
通过backstepping分别设计系统的运动学、本体动力学和执行器动力学控制器, 运动学控制器引入了时变控制量, 使跟踪误差模型用于镇定控制时不存在奇异, 本体和执行器动力学控制器分别采用带鲁棒项的强化学习自适应模糊控制补偿系统的复杂不确定性, 采用非线性跟踪-微分器避免了backstepping过程的“计算膨胀”, 闭环系统为最终一致有界收敛。
基于人工智能技术的机器人自适应控制方法研究

基于人工智能技术的机器人自适应控制方法研究随着科技的不断进步和发展,人工智能技术的应用范围也越来越广泛。
其中,机器人自适应控制方法是一个备受研究和关注的领域。
该领域的研究旨在解决机器人在实际运行过程中出现的偏差和误差等问题,提高机器人的精度和稳定性。
本文将介绍基于人工智能技术的机器人自适应控制方法的研究现状和发展趋势。
一、机器人自适应控制方法的研究现状机器人自适应控制方法是指机器人通过学习和自身调节,使其能够适应环境和任务的变化,从而保持其稳定性和准确性。
在过去的几十年里,学者们已经提出了各种机器人自适应控制方法,如自适应模糊控制(AFC)、自适应神经网络控制(ANNC)、自适应PID控制(APC)等。
这些方法各有特点,但都存在一定的限制条件和缺陷。
近年来,随着深度学习和强化学习等人工智能技术的兴起,机器人自适应控制方法也得到了极大的发展。
深度强化学习(DRL)是一种基于模型的方法,不需要外部输入,从而使机器人能够适应复杂的环境和任务。
该方法已经被广泛应用于机器人控制领域,并取得了很好的效果。
二、基于人工智能技术的机器人自适应控制方法的发展趋势随着人工智能技术的不断发展,机器人自适应控制方法也将自然而然地得到更多的发展。
未来,基于人工智能技术的机器人自适应控制方法将呈现出以下几个趋势。
1、多传感器数据融合技术的应用在实际场景下,机器人需要根据多个传感器的信息来实现自适应控制。
因此,未来的机器人自适应控制方法将会采用多传感器数据融合技术,来获得更准确和可靠的信息,从而提高机器人的控制能力和稳定性。
2、强化学习算法的不断更新和改进强化学习算法已经成为基于人工智能技术的机器人自适应控制方法中的主流算法。
未来,该算法将进一步得到改进和优化,使其更好地适应实际场景中的复杂问题,从而提高机器人的控制能力和智能水平。
3、机器人的感知和认知能力的提升机器人的感知和认知能力是实现自适应控制的重要基础。
未来,随着深度学习、计算机视觉、自然语言处理等人工智能技术的发展,机器人的感知和认知能力将不断提升,从而使其更好地适应复杂和多变的环境和任务。
基于神经网络的机器人运动控制技术研究

基于神经网络的机器人运动控制技术研究一、引言随着人工智能技术的不断发展,基于神经网络的机器人运动控制技术也逐渐成为研究的热点之一。
本文将围绕这一领域展开深入的研究,从神经网络的基本原理和机器人运动控制的核心技术入手,分析神经网络在机器人运动控制中的应用和优化方法,为相关领域的研究提供参考。
二、神经网络基本原理神经网络是一种模拟人类大脑神经元之间信息传递的系统,由于其具有自学习、自适应和非线性映射等特点,在机器学习和人工智能领域中得到广泛应用。
神经网络的核心组成部分为神经元,神经元之间的连接关系和权值则是神经网络模型的学习和决策依据。
三、机器人运动控制技术机器人运动控制技术是指通过对机器人动力学和控制系统的建模与仿真,控制机器人在特定环境下完成预定的运动任务。
机器人运动控制技术可分为两大类,一类是基于机器人动力学模型的控制方法,另一类则是基于机器人传感器和环境信息的控制方法。
四、神经网络在机器人运动控制中的应用神经网络为机器人运动控制提供了一种新的方法,通过对机器人运动状态和环境的实时感知和识别,神经网络能够自适应调节机器人的动作和姿态,从而更加精准地完成任务。
例如,在机器人行走控制中,神经网络可以对机器人的步态和姿态进行实时的感知和调整,提高机器人的稳定性和行走效率。
五、优化神经网络在机器人运动控制中的应用虽然神经网络在机器人运动控制中具有广泛的应用前景,但是神经网络的复杂性和不确定性也给其应用带来了一定的挑战。
因此,如何优化神经网络在机器人运动控制中的建模和学习成为当前研究的重点之一。
研究表明,通过对神经网络的拓扑结构、学习算法和参数优化等方面进行优化,可以有效提高神经网络在机器人运动控制中的准确性和时间效率。
六、结论机器人运动控制是机器人技术领域中的一个重要方向,而神经网络作为一种新型的控制方法则为其提供了广阔的应用前景。
在未来的发展中,应该进一步深入研究神经网络与机器人运动控制的关系,加强神经网络的建模和学习算法的优化,推动其在机器人运动控制中的进一步应用和发展。
基于HJI理论的移动机器人神经网络自适应控制

基于HJI理论的移动机器人神经网络自适应控制移动机器人技术的发展给现代社会带来了许多便利和创新。
为了使移动机器人在各种环境中能够实现高效且安全的自主行为,控制算法的设计成为了一个重要的研究领域。
本文将介绍基于HJI(哈密顿-雅可比-伊凡斯)理论的移动机器人神经网络自适应控制算法,以提高移动机器人的自主性和适应性。
一、HJI理论简介HJI理论是一种在非线性系统控制中广泛应用的数学工具。
它基于动态规划和最优控制的思想,通过解决哈密顿-雅可比-伊凡斯偏微分方程,得到系统的最优控制输入。
应用HJI理论可以使得移动机器人在复杂和不确定的环境中做出最优的决策,从而实现精确而高效的控制。
二、移动机器人神经网络自适应控制的基本原理神经网络是一种模拟人脑神经元网络结构的数学模型。
通过对大量样本数据的学习和训练,神经网络可以实现对输入和输出之间的映射关系建模。
在移动机器人控制中,结合神经网络和HJI理论,可以实现自适应控制,使机器人能够根据环境的变化动态调整控制策略。
具体而言,移动机器人的控制器可以通过神经网络学习和适应环境中的变化。
神经网络的输入可以是机器人周围环境的传感器信息,如视觉、声音等,输出则为机器人的控制指令,如速度、方向等。
通过不断地更新神经网络的权重和偏置,使其能够根据环境反馈的信息调整控制策略,并在动态环境中实时响应。
三、基于HJI理论的移动机器人神经网络自适应控制方法1. 确定系统动态模型:首先需要根据移动机器人的物理特性和运动学方程建立系统的动态模型。
这个模型将用于计算HJI偏微分方程的解,并作为神经网络的训练样本。
2. 建立神经网络模型:在确定系统动态模型之后,可以构建适当的神经网络结构来建模控制器。
选择合适的网络拓扑和激活函数,并根据需要确定网络的层数和神经元个数。
3. 学习与适应:将机器人在真实环境中采集到的传感器数据作为神经网络的输入,并利用系统动态模型计算出的最优控制指令作为输出,进行神经网络的训练和学习。
几类不确定非线性系统的智能控制问题研究

几类不确定非线性系统的智能控制问题研究在实际中,大多数系统都是非线性系统,而且通常受到不确定性,时滞以及随机扰动等因素的影响。
自适应控制因其具有辨识对象和在线修改参数的能力,能够有效抑制不确定性的影响,另一方面模糊逻辑系统以及神经网络能以任意精度逼近未知连续函数,因此是处理不确定性特别有效的方法。
近年来,通过将反步递推设计方法与模糊逻辑系统理论或神经网络相结合的反步递推自适应智能控制得到了充分发展,而且取得了很多重要的研究成果,然而仍然存在着很多问题需要进一步研究。
本文将深入研究几类不确定非线性系统的智能控制问题,如具有严格反馈形式的不确定非线性系统,随机非线性系统,以及非线性互联大系统等,并且研究在系统存在时滞情况下的处理方法。
主要研究内容如下:1.针对一类具有严格反馈形式的单输入单输出不确定非线性系统,研究基于滤波器的自适应模糊跟踪控制问题。
首先设计滤波器估计不可测状态,在此基础上结合反步递推设计方法和模糊逻辑系统理论,逐步设计出虚拟控制信号和实际的控制律。
基于Lyapunov函数理论,证明了闭环系统所有信号半全局最终一致有界而且跟踪误差收敛到零的一个小邻域内。
最后通过仿真算例,验证了该方法的有效性。
2.针对一类带有未知时滞且具有严格反馈形式的单输入单输出不确定非线性系统,给出了自适应模糊输出反馈控制方法。
首先设计滤波器估计不可测状态,通过结合反步递推设计方法和动态面控制技术,避免了对虚拟控制器中自变量重复求导,从而降低了计算量,简化了所要设计的控制器。
基于Lyapunov-Krasovskii泛函,证明了闭环系统的所有信号半全局最终一致有界,而且跟踪误差收敛到零的一个小邻域内。
最后通过仿真算例验证了所提方法的有效性。
3.针对一类带有未知时滞且具有严格反馈形式的单输入单输出随机非线性系统,研究了基于观测器的自适应神经网络控制方法。
首先设计状态观测器估计不可测状态,结合反步递推设计方法和动态面控制技术,给出基于观测器的输出反馈控制方法。
基于LMI和扰动观测器的电动伺服系统RBF神经网络控制

基于LMI和扰动观测器的电动伺服系统RBF神经网络控制李晓飞;范元勋;许鹿辉
【期刊名称】《机械制造与自动化》
【年(卷),期】2024(53)1
【摘要】为了提高电动伺服系统的加载力跟踪精度,基于线性矩阵不等式(LMI)设计扰动观测器和控制器。
针对系统中的非线性因素,采用RBF神经网络逼近系统的数学模型;在建立系统跟踪目标模型的基础上,根据LMI设计扰动观测器对控制器进行多余力的补偿,利用李雅普诺夫函数证明扰动观测器和控制器的收敛;在MATLAB/Simulink中搭建仿真模型,分析扰动观测器和RBF神经网络在不同工况下对系统相应量的精准估计,且误差均满足所设定的性能指标,同时与PID控制相比较,证明所提控制策略的控制性能更优。
【总页数】5页(P113-117)
【作者】李晓飞;范元勋;许鹿辉
【作者单位】南京理工大学机械工程学院
【正文语种】中文
【中图分类】TM351
【相关文献】
1.带扰动观测器的RBF神经滑模控制用于PMSM伺服系统
2.RBF神经网络和FC 复合控制在电动伺服系统中的应用
3.基于小波神经网络和非线性扰动观测器的
直线伺服系统控制4.基于RBF神经网络和扰动观测器的PMLSM位置控制5.基于ESO的电动伺服系统RBF神经网络滑模控制
因版权原因,仅展示原文概要,查看原文内容请购买。
基于干扰观测器的机械臂广义模型预测轨迹跟踪控制

收稿日期:2022-12-04基金项目:国家自然科学基金(61903025);北京科技大学青年教师学科交叉研究项目(FRF IDRY GD22 002)引用格式:卢紫超,李通,孙泽文,等.基于干扰观测器的机械臂广义模型预测轨迹跟踪控制[J].测控技术,2023,42(9):81-87.LUZC,LIT,SUNZW,etal.DisturbanceObserver BasedGeneralizedModelPredictiveTrajectoryTrackingControlforRoboticManipulators[J].Measurement&ControlTechnology,2023,42(9):81-87.基于干扰观测器的机械臂广义模型预测轨迹跟踪控制卢紫超1,李 通1,孙泽文1,田 霖2,孙 亮1,刘冀伟3(1.北京科技大学智能科学与技术学院,北京 100083;2.中华人民共和国民政部一零一研究所,北京 100070;3.北京科技大学自动化学院,北京 100083)摘要:为实现对多自由度机械臂关节运动精确轨迹跟踪,提出一种基于非线性干扰观测器的广义模型预测轨迹跟踪控制方法。
针对机械臂轨迹跟踪运动学子系统,采用广义预测控制(GeneralizedPredictiveControl,GPC)方法设计期望的虚拟关节角速度。
对于机械臂轨迹跟踪动力学子系统,考虑机械臂的参数不确定性和未知外界扰动,利用GPC方法设计关节力矩控制输入,基于非线性干扰观测器方法实时估计和补偿系统模型中的不确定性。
在李雅普诺夫稳定性理论框架下证明了机械臂关节角位置和角速度的跟踪误差最终收敛于零的小邻域。
数值仿真验证了所提出控制方法的有效性和优越性。
关键词:机械臂控制;轨迹跟踪;广义预测控制;干扰观测器;稳定性分析中图分类号:TP391.9 文献标志码:A 文章编号:1000-8829(2023)09-0081-07doi:10.19708/j.ckjs.2023.09.012DisturbanceObserver BasedGeneralizedModelPredictiveTrajectoryTrackingControlforRoboticManipulatorsLUZichao1牞LITong1牞SUNZewen1牞TIANLin2牞SUNLiang1牞LIUJiwei3牗1.SchoolofIntelligenceScienceandTechnology牞UniversityofScienceandTechnologyBeijing牞Beijing100083牞Cina牷2.The101ResearchInstitute牞MinistryofCivilAffairsofthePeople sRepublicofChina牞Beijing100070牞Cina牷3.SchoolofAutomationandElectricalEngineering牞UniversityofScienceandTechnologyBeijing牞Beijing100083牞Cina牘Abstract牶Inordertorealizetheaccuratetrajectorytrackingofthemulti degreesoffreedomroboticmanipula torsinthejointmotionspace牞arobustgeneralizedpredictivecontrolmethodbasedonthenonlineardisturb anceobservermethodisproposed.Forthekinematicsubsystemoftheroboticmanipulatortrajectorytrackingmissions牞thedesiredangularvelocitytrajectoryisdevelopedbythegeneralizedmodelpredictivecontroltheo ry.Then牞consideringtheparametricuncertaintiesandunknownexternaldisturbancesforthedynamicsubsys temoftheroboticmanipulatortrajectorytrackingmissions牞theGPCmethodisadoptedtodesignthetorquecontrolinput牞thenonlineardisturbanceobserverisemployedtocompensatethelumpedunknownperturbationsinthedynamics.UndertheframeworkofLyapunovstabilitytheory牞itisprovedthatthejointangletrajectorytrackingerrorsandangularvelocitytrackingerrorsultimatelyconvergetothesmallneighborhoodsofzero.Theeffectivenessandadvantagesoftheproposedmethodarefinallyverifiedbynumericalsimulations.Keywords牶roboticmanipulatorcontrol牷trajectorytracking牷GPC牷disturbanceobserver牷stabilityanalysis 机械臂是高精度、多输入多输出、高度非线性、强耦合的复杂系统。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基于扰动观测器的机器人自适应神经网络跟踪控制研究于欣波;贺威;薛程谦;孙永坤;孙长银【摘要】为解决机器人动力学模型未知问题并提升系统鲁棒性,本文基于扰动观测器,考虑动力学模型未知的情况,设计了一种自适应神经网络(Neural network,NN)跟踪控制器.首先分析了机器人运动学和动力学模型,针对模型已知的情况,提出了刚体机械臂通用模型跟踪控制策略;在考虑动力学模型未知的情况下,利用径向基函数(Radial basis function,RBF)神经网络设计基于全状态反馈的自适应神经网络跟踪控制器,并通过设计扰动观测器补偿系统中的未知扰动.利用李雅普诺夫理论证明所提出的控制策略可以使闭环系统误差信号半全局一致有界(Semi-globally uniformly bounded,SGUB),并通过选择合适的增益参数可以将跟踪误差收敛到零域.仿真结果证明所提出算法的有效性并且所提出的控制器在Baxter机器人平台上得到了实验验证.【期刊名称】《自动化学报》【年(卷),期】2019(045)007【总页数】18页(P1307-1324)【关键词】神经网络控制;全状态反馈;扰动观测器;李雅普诺夫理论;Baxter机器人【作者】于欣波;贺威;薛程谦;孙永坤;孙长银【作者单位】北京科技大学自动化学院、人工智能研究院北京 100083;北京科技大学自动化学院、人工智能研究院北京 100083;北京科技大学自动化学院、人工智能研究院北京 100083;北京科技大学自动化学院、人工智能研究院北京100083;东南大学自动化学院南京 211189【正文语种】中文在国内传统制造业发展过程中,机器人技术的应用将极大程度地带动传统装备制造业的转型升级[1].机器人的应用可以降低生产成本、提高生产效率,替代人在复杂、危险工业环境中完成任务,可以从事程序化、高强度、易疲劳的工作.除工业领域外,机器人还在军事、航天、消防救灾、家庭、社会服务和医疗中得到广泛应用[2−5].机器人是一类典型的非线性、强耦合、时变多输入多输出系统[6−8],这种复杂系统给控制器设计带来一定的难度.因为实际情况存在多种不确定因素,机器人系统难以获取精确的动力学模型[9],通常会出现模型失配、模型完全未知等情况,此时基于模型的非线性控制策略将失效.另外,传统控制策略通常对非线性系统进行了线性假设,而这种控制设计也将一定程度影响系统稳定性和控制精度.神经网络具有一致逼近和自适应能力,能够起到非线性补偿、参数辨识等作用[10−12],也可以作为控制器直接控制机器人系统,在机器人系统中得到广泛应用[13−16].神经网络的早期研究缺乏对机器人闭环系统稳定性分析,以梯度学习算法(Error back propagation,BP)为例,需要通过一定时间的离线训练才能将神经网络应用于机器人闭环系统中.反步法通过迭代设计与坐标变换[17],并设置虚拟镇定变量,结合自适应控制,可以应用于含不确定参数的非线性系统并通过选取合适参数调整瞬态特性[18],实现渐近稳定或一致有界[19].本文采用径向基函数(Radial basis function,RBF)[20]作为神经网络(Neural network,NN)[21]隐含层激活函数,通过RBF神经网络估计控制器中不确定项,利用李雅普诺夫稳定性理论反推得到神经网络权重自适应律,避免离线训练,通过在线反馈系统输入输出数据,构造合适的神经网络结构,使机器人系统达到跟踪精度并满足稳定性条件,实现系统误差信号的半全局一致有界.文献[22]提出了一种基于神经网络估计未知动态模型的自适应控制策略,并通过反向传播算法对系统静态和动态参数进行了调整.文献[23]以双臂机器人为研究平台,利用神经网络技术估计多机械臂协调控制中的不确定非线性项,以提高协调控制位置精度.文献[24]提出了一种基于神经网络的自适应阻抗控制策略,通过神经网络补偿机器人中的部分不确定项,在控制作用下使外界交互力呈现出给定的理想阻抗关系.在文献[25]中,神经网络技术被应用于补偿一种欠驱动轮式移动机器人动力学模型,解决一类自平衡移动小车的跟踪控制问题,并基于扰动观测器提出了一种鲁棒跟踪控制策略.除神经网络具有一致逼近能力外,模糊控制对任意非线性系统也具有很好的拟合效果,文献[26]利用模糊控制设计了一种含扰动观测器的外骨骼控制系统,通过实验验证了控制器有效性.大多数文献提出的控制方法在线计算量大,针对不确定性较大的机器人系统控制难度较高,并且对于考虑非参数的不确定系统控制研究较少.扰动观测器被广泛应用于处理非线性系统中的不确定扰动[27−29],设计扰动观测器的目的是不依靠附加的力传感器来估计未知不确定扰动[30].文献[31]利用扰动观测器处理机器人系统的摩擦力补偿问题,并通过仿真得到验证.在文献[32]中,扰动观测器被用来处理非匹配不确定性带来的扰动.文献[33]设计了一种含有扰动观测器的自适应神经网络控制策略,以解决机器人系统中的时滞效应.如果在控制器设计过程中不考虑未知扰动带来的影响,将会在一定程度上影响机械臂跟踪精度.大多数研究多结合非线性系统设计扰动观测器,对于机器人系统利用反推方法设计扰动观测器并且将理论方法应用到实际机器人系统的研究较少.近几年提出的神经网络控制方法结合传统自适应控制、反演控制能够解决含有线性参数的不确定非线性系统,但神经网络难以处理含有非参数的系统不确定性.本文与其他方法不同的创新点是:本文主要结合自适应神经网络和扰动观测器同时解决系统模型未知部分和系统未知扰动,通过RBF神经网络在线学习不确定模型并根据李雅普诺夫函数反推设计权重自适应律,证明了闭环系统误差信号半全局一致有界.本文同时将跟踪控制算法应用于仿真与实际Baxter机器人中,通过两台计算机互相配合,即一台计算神经网络未知补偿量,一台通过用户数据报协议(User datagram protocol,UDP)接收信息并产生Baxter机器人控制信号,一定程度上提升整个系统的运算和响应能力,并通过实验对比PD控制验证了所提出控制算法的有效性和优势.以下几章将对本文所提出的控制算法进行详细介绍与分析.文章具体安排如下:第1节通过D-H(Denavit-Hartenberg)建模方法对Baxter机器人运动学进行分析,通过Lagrange-Euler方法建立机器人动力学模型;第2节考虑动力学模型已知的情况,设计一种基于模型的通用跟踪控制器和扰动观测器并对闭环系统进行稳定性分析;第3节考虑机器人模型未知的情况,提出一种基于扰动观测器的自适应神经网络全状态反馈跟踪控制策略,并通过构造李雅普诺夫函数分析机器人系统稳定性;第4节通过数值仿真验证所提出的控制算法的有效性与通用性,仿真考虑了不同关节连接方式的机器人,分别利用机器人工具箱和数值仿真验证跟踪控制算法的有效性和控制精度;第5节简述了Baxter机器人的硬件及软件结构,将控制算法应用于Baxter机器人实验平台上并与比例微分(Proportion derivative,PD)控制进行对比以验证所提出控制算法的跟踪精度.1 运动学与动力学分析1.1 Baxter机器人运动学分析以Baxter机器人底座中心为基坐标,将连杆坐标系原点位置设置在关节连杆末端,利用 D-H建模方法,通过 D-H参数表 (如表 1所示)可以实现各关节处坐标点的变换矩阵所以基坐标与关节坐标变换矩阵A为:式中,变换矩阵将连杆坐标系原点建立在连杆的关节连杆末端,其中变换矩阵表示为:其中,c代表余弦运算cos,s代表正弦运算sin.di表示平移距离,αi表示扭转角,ai表示长度,θi表示关节角度.表1 Baxter机器人D-H参数和连杆质量Table 1 D-H parameter and link mass of Baxter robotLink θ d(m) a(m) α(rad) m(kg)1 θ1 0.2703 0.069 −π5.70044 2 θ2 0 0 π2 3.22698 3 θ3 0.3644 0.069 −π 2 4.31272 4 θ4 0 0 π2 2.07206 5 θ5 0.3743 0.01 −π 2 2.24665 6 θ6 0 0 π2 1.60979 7 θ7 0.2295 0 0 0.54218 2通过Baxter机器人制造商Rethink robotics在Github网站上提供的相关信息,可以从中获取刚性连杆i的质量如表1所示,其中连杆惯性矩阵、转动惯量以及相对坐标中心位置都可以从中获得.1.2 机器人动力学分析通过拉格朗日动力学方程,建立机械臂n关节通用动力学模型:其中,分别表示机械臂角度,角速度,角加速度向量,Mj(q)∈Rn×n表示机械臂惯性矩阵,表示机械臂科氏力矩向量,Gj(q)∈Rn表示机械臂重力矩向量.τ∈Rn表示机械臂控制力矩向量,τd∈Rn表示外部环境的未知扰动力矩向量.机械臂前向运动学可由下式关系表示:机械臂逆向运动学可由下式关系表示:式中,J(q)∈Rm×n为机械臂雅克比转换矩阵,雅克比转换矩阵中的m为机械臂操作空间向量维数,J+(q)∈Rn×m代表雅克比转换矩阵的广义逆矩阵,分别代表任务空间的位移,速度,加速度,通过上式可以得到m维机械臂任务空间通用动力学模型如下:式中,Mt(x)∈Rm×m,Gt(x)∈Rm分别代表机械臂任务空间的惯性矩阵,科氏力矩阵和重力矩阵,u∈Rm为机械臂控制力,f∈Rm为机械臂未知外界扰动力.其关节空间到任务空间相关矩阵具有如下关系:以下为本文利用的相关定义、引理与性质:定义1[34].半全局一致有界(Semi-globally uniformly bounded,SGUB):考虑广义非线性系统对任意初始紧集Ωi,初始状态ε(t0)∈Ωi,若存在常数ξ>0以及时间常数T(ξ,ε(t0)), 对任意t ≥ t0+T(ξ,ε(t0)) 都满足||ε(t)||≤ ξ.我们定义系统状态ε(t)为半全局一致有界(SGUB).引理1[24].若存在连续正定可微函数V(x)满足κ1(||x||)<V(x)< κ2(||x||)(κ1,κ2属于K 类函数)且具有有界初始条件,若其中,C和ρ为正常数,那么解ε(t)为一致有界.性质1[35].惯性矩阵Mj(q)、Mt(q)在式(3)与式(6)中为正定对称矩阵,且和为斜对称矩阵.引理2[26].若连续可微函数Ξ是有界函数,即对于任一时刻t∈[t1,t2],如果Ξ(t)满足Ξ(t)≤ξ1,其中,ξ1为正常数,那么我们能够得出也为有界函数.2 含扰动观测器的模型控制器设计以关节空间为例,设计基于机器人动力学模型的控制器.在本节考虑机器人动力学模型已知,定义为便于分析,将式(3)转换为状态空间形式:定义xd为关节空间期望轨迹向量,定义状态误差如下式:为设计扰动观测器我们定义一个辅助变量e3表示为:其中,%(e2)代表非线性函数向量,同时我们定义式(9)中α1为虚拟镇定信号,e1为角度误差,e2为虚拟速度误差,其中,α1定义如下:通过式(9)分析得到和可以表示为:通过式(10)分析得到表示为:其中,Y(e2)为%(e2)的对e2的导数,我们简化%(e2)为线性函数向量,所以在这种假设下Y(e2)为一个常数.通过分析我们可得并定义为:通过以上分析,我们可以得到以下变量估计误差与扰动估计误差之间的关系为:通过式(15)可以得到:由以上分析设计基于模型的控制器τ0为:下面对系统稳定性进行分析,构造如下李雅普诺夫函数V1:将模型控制器τo代入上式可得:其中,ς为的最大值,ρ1和C1分别表示为:式中,λmin,λmax分别代表矩阵的最小和最大特征值.K1,和为正定对称矩阵,由引理1可知:在模型控制器τo的作用下,闭环系统误差一致有界,可以保证系统稳定.如果使用非线性函数作为%(e2)的表达形式,那么Y(e2)可以描述为,由式(20)可以得出,选取合适的%(e2)保证为正定矩阵,即可保证闭环系统稳定性.所以选取非线性函数或由线性函数近似,对于系统性能没有影响,但是非线性函数需要考虑更为复杂的动态关系,其实际函数选择较线性函数更为复杂.在选取Y(e2)时,由于Mj(x1)矩阵为对称正定矩阵,所以其最大特征值为λmax(Mj(x1))>0.Mj(x1)矩阵的逆矩阵最小特征值为1/λmax(Mj(x1))>0,因此选择合适的 Y(e2)使矩阵的最小特征值Y(e2)/λmax(Mj(x1))− 1>0.当选取Y(e2)>λmax(Mj(x1))时,就可以保证Y(e2)/λmax(Mj(x1))−1>0,即保证矩阵为正定矩阵.以上分析同样应用于式 (38)中,通过选取 R(e2),ι和和Mjk(x1)共同保证3 含扰动观测器的自适应神经网络控制器设计实际情况中,机械臂惯性矩阵Mj(q),机械臂科氏力矩矩阵存在不确定性,我们用Mjk(q)和Cjk(q,)表示动力学模型中的设定参考部分,其中用Mju(q)和Cju(q,)表示其他未知部分,其动态关系可以描述为:利用神经网络一致逼近性能,设计一种在线自适应神经网络控制器以补偿未知动力学模型参数.自适应神经网络控制器τf设计为:式中,ψ(Z)代表RBF神经网络径向基函数,代表神经网络权重估计,其中,$∗代表神经网络实际最优权重,最优权重是为便于推导分析人为构造的,其定义如下:式中,νi(Z)∈Rn为神经网络的估计误差,神经网络权值误差我们用用来估计$∗Tψ(Z),设计神经网络权重自适应律为:式中,σi为小的正常数,Γi为正定对称矩阵.把式(25)代入式(12)可得:同模型控制类似,我们定义辅助变量e4为:对e4求导可得:式中,R(e2)为χ(e2)对e2求导的结果,同理为便于分析,令χ(e2)为线性方程,因此在该假设下R(e2)为常数.同时我们定义如下:其中,为e4的估计值.通过式(28)可以得出:通过式(28)和(31)可以得出:由以上分析可以得到下面对神经网络控制器的闭环系统进行稳定性分析,构造如下李雅普诺夫函数V2:对V2求导,并将神经网络控制器代入可得到如下式所示结果:利用如下不等式性质:可以得到:式中,ρ2和C2分别为:为使ρ2>0,控制增益需满足以下条件:通过以上分析,我们可以证明误差e1,e2,和为半全局一致有界.定理1.对于式(3)描述的闭环系统,在控制(23)的作用下,所有状态量均可测得,对于初始紧集Ω0,其中,则闭环系统误差信号将始终在紧集内:其中,D=2(V2(0)+C2/ρ2),l为神经网络节点数,ρ2和C2为正常数.证明. 在式(37)左右两端乘以eρ2t,可以得到:由以上分析可以得出:通过上式可以发现,e1收敛于紧集同理可以证明e2和分别收敛于紧集和内,收敛于紧集内.4 数值仿真4.1 3旋转关节机器人仿真本节通过Matlab机器人工具箱(Robotic toolbox)程序对具有3旋转关节的机器人进行数值仿真.如图1所示,刚性连杆1质量与长度:mt1=0.5kg,lt1=0.114m;刚性连杆2质量与长度:mt2=0.5kg,lt2=0.144m;刚性连杆3质量与长度:mt3=1kg,lt3=0.241m.初始关节角矩阵设置为[0.0714rad;1.6718rad;−1.7432rad].设置任务空间期望轨迹为:其中,RBF参数节点数选择为28=256,镇定参数为0.02,正定增益矩阵为Γi=10I256×256.神经网络中心选择为[−1,1]×[−1,1]×[−1,1]×[−1,1]×[−1,1]× [−1,1]× [−1,1]× [−1,1],其中控制增益K1=diag{40,40,40},K2=diag{30,30,30},扰动设置为[0.02sin(t)+0.06,0.01cos(t)+0.02,0]T,扰动观测器χ(e2)设置为[25e21,25e22,25e23]T.图2、3分别为关节空间、任务空间中3关节神经网络控制与PD控制跟踪对比图.图4为任务空间中神经网络与PD控制对比效果图,图5为神经网络控制器控制输入.由上图可知,所提出的控制算法可以保证跟踪误差收敛到较小的零域内,较PD控制而言,所提出的神经网络控制具有更好的跟踪控制效果.4.2 2旋转关节1伸长关节机器人仿真本节通过Matlab数值仿真对具有2旋转关节1伸长关节的机器人系统进行仿真.其中刚性连杆1质量与长度:mt1=2.0kg,lt1=0.3m;刚性连杆2质量与长度:mt2=2.0kg,lt2=0.4m;刚性连杆3质量与长度:mt3=1.0kg,lt3=0.25m.初始状态矩阵为[0.5rad;0.9rad;0.4m].设置期望跟踪轨迹为:其中,RBF参数节点数为212,镇定参数为0.02,正定增益矩阵为Γi=10I212×212.神经网络中心选择为[−1,1]× [−1,1]× [−1,1]× [−1,1]×[−1,1]×[−1,1]×[−1,1]×[−1,1]×[−1,1]×[−1,1]×[−1,1]×[−1,1],其中控制增益K1=diag{6,6,6},K2=diag{12,12,12}.图6,8,10分别为3关节含扰动观测器的神经网络控制与不含扰动观测器角度跟踪控制对比图,图7,9,11分别为3关节含扰动观测器的神经网络控制与不含扰动观测器速度跟踪控制对比图.真实扰动设置为[sin(t)+1,2cos(t)+0.5,2sin(t)+1]T.扰动观测器χ(e2)设置为[25e21,25e22,25e23]T.图1 3旋转关节自由度机器人Robotic toolbox中的模型Fig.1 Model of 3revolute joint robot in robotic toolbox图2 NN与PD控制角度跟踪Fig.2 Joint tracking of NN and PD control图3 NN与PD控制位置跟踪Fig.3 Position tracking of NN and PD control 图4 NN与PD轨迹跟踪效果Fig.4 NN and PD trajectory tracking performance图5 NN控制输入Fig.5 NN control input由上图可知,所提出的带扰动观测器的控制算法可以保证跟踪误差收敛到较小的零域内,较不加扰动观测器控制而言,所提出的带扰动观测器神经网络控制器具有更好的跟踪控制效果.图12为扰动观测器与真实扰动误差对比图,图13为控制输入对比图,图14为神经网络估计权值与权值估计误差图,图15为神经网络逼近函数与被逼近函数.由图12、14和15可知,扰动观测器观测误差和神经网络估计误差都将收敛到较小的零域内.图6 关节1含扰动观测器和不加扰动观测器角度跟踪控制Fig.6 Joint 1 angle tracking control with and without disturbance observer图7 关节1含扰动观测器和不加扰动观测器速度跟踪控制Fig.7 Joint 1 velocity tracking control with and without disturbance observer图8 关节2含扰动观测器和不加扰动观测器角度跟踪控制Fig.8 Joint 2 angle tracking control with and without disturbance observer图9 关节2含扰动观测器和不加扰动观测器速度跟踪控制Fig.9 Joint 2 velocity tracking control with and without disturbance observer图10 关节3含扰动观测器和不加扰动观测器角度跟踪控制Fig.10 Joint 3 angle tracking control with and without disturbance observer图11 关节3含扰动观测器和不加扰动观测器速度跟踪控制Fig.11 Joint 3 velocity tracking control with and without disturbance observer图12 扰动与扰动观测误差Fig.12 Disturbance and disturbance observer error 图13 控制输入Fig.13 Control input图14 NN权值估计与误差Fig.14 Weight estimation and error of NN图15 逼近函数与被逼近函数Fig.15 Approximation and approximated function5 基于Baxter机器人的跟踪实验验证本文基于Baxter机器人对自适应神经网络跟踪控制策略进行实验验证.Baxter机器人是美国Rethink robotics公司研发的一款双臂机器人[36],其单机械臂是一种具有七自由度的冗余柔性关节机械臂[37].Baxter机械臂存在的摩擦力等未知扰动也会影响到机器人的控制精度.因此,对于Baxter机器人需要提高其定位精度以完成精确的跟踪任务[38].图16为Baxter机器人结构示意图.通过移动底座支撑机器人本体,机器人手臂采用旋转关节连接刚性连杆,关节处采用弹性制动器连接,即通过电机、减速器串联弹簧带动负载,在人机协作或外部冲击下起到保护人或机器人本体的作用.柔性关节还可通过霍尔效应检测角度偏差,由于弹簧具有固定刚度,通过胡克定律可检测关节处力矩,即在Baxter关节处都具有力矩传感器.手臂前后端通过26W 和63W 伺服电机驱动,通过14bit编码器实现关节角度的读取.Baxter机器人为基于ROS(Robot operating system)操作系统的开源机器人,通过Linux平台运行,用户可通过网络与机器人内部计算机互联读取信息或发送指令,或通过SSH(Secure shell)远程控制在内部计算机运行相关程序.利用Baxter相关的SDK(Software development kit),通过ROS的API(Application programming interface)可以实现对Baxter机器人的信息读取与实时控制.Baxter中的SDK可以提供相关函数接口与重要工具:如Gazebo仿真器及Moveit移动软件包等.Baxter 机器人在力矩控制模式下,还需设置补偿力矩以抵消机械臂重力和肩关节支撑弹簧形变带来的影响.本节通过Baxter机器人实现机器人轨迹跟踪实验.图17为Baxter机器人实验平台.计算机A通过Windows MATLAB simulink模块计算神经网络未知补偿量并通过UDP传输至另一台用于接收机器人状态信号并提供控制信号的计算机B中.计算机B利用Ubuntu 14.04 LTS平台下的Baxter RSDK(Robot operating system SDK)实现对Baxter机器人的编程与控制.其中RBF神经网络参数节点数为73,镇定参数为0.02,正定增益矩阵Γi=500I.协方差为0.75,其中控制增益K1=diag{17.7,20,15.7,22,20.3,12.6,15},K2=diag{2.1,2.2,1.2,2,5.1,10.1,4.5}.利用Moveit软件令Baxter机器人单臂移动一段距离,通过实时位置反馈信息,记录下移动过程中各关节轨迹.之后通过设计控制器令关节跟踪这条期望轨迹,并将所提出的控制方法与PD控制对比轨迹跟踪效果.表2所示为Baxter机器人PD控制参数.图18∼24分别为Baxter机器人S0,S1,E0,E1,W0,W1,W2关节含扰动观测器的神经网络与PD控制角度跟踪效果对比图.图25为Baxter机器人七关节神经网络控制输入.由图18∼24通过与PD控制对比可以得出,所提出的控制算法与PD控制相比具有更好的跟踪控制效果.图16 Baxter机器人系统结构:1.肩S0关节;2.肩S1关节;3.肘E0关节;4.肘E1关节;5.腕W0关节;6.腕W1关节;7.腕W2关节;8.声纳传感器;9.面部摄像头;10.显示屏;11.末端摄像头;12.末端抓手;13.操作旋钮;14.柔性关节;15.肩关节支撑弹簧;16.吸盘Fig.16 The system structure of Baxter robot:1.shoulder jointS0;2.shoulder jointS1;3.elbow jointE0;4.elbow jointE1;5.wrist jointW0;6.wrist jointW1;7.wrist jointW2;8.sonar sensor;9.facial camera;10.screen;11.end-effector camera;12.gripper;13.operating knob;14.flexiblejoint;15.S1shoulder support spring;16.sucker图17 Baxter机器人实验平台Fig.17 Experimental platform of Baxter robot 表2 Baxter机器人PD控制参数Table 2 PD control parameter of BaxterrobotJoint P D S0 50.01 2.5 S1 60 1.3 E0 15.1 2.5 E1 14 3 W0 25.2 3 W1 12 10 W2 12.3 10图18 NN与PD控制S0关节角度跟踪Fig.18 S0 joint tracking of NN and PD control图19 NN与PD控制S1关节角度跟踪Fig.19 S1 joint tracking of NN and PD control图20 NN与PD控制E0关节角度跟踪Fig.20 E0 joint tracking of NN and PD control图21 NN与PD控制E1关节角度跟踪Fig.21 E1 joint tracking of NN and PD control图22 NN与PD控制W0关节角度跟踪Fig.22 W0 joint tracking of NN and PD control图23 NN与PID控制W1关节角度跟踪Fig.23 W1 joint tracking of NN and PID control图24 NN与PD控制W2关节角度跟踪Fig.24 W2 joint tracking of NN and PD control图25 Baxter机器人NN控制输入Fig.25 NN control input to Baxter robot6 结论本文提出了一种基于扰动观测器的自适应神经网络跟踪控制策略,以解决机器人动力学模型未知问题并提升系统鲁棒性.针对模型已知的情况,通过研究机器人运动学和动力学模型,提出了刚体机械臂通用模型跟踪控制策略;针对动力学模型未知情况下,设计了基于全状态反馈的自适应RBF神经网络跟踪控制器,并通过设计扰动观测器补偿系统中的未知扰动.通过选择合适的增益参数可以将跟踪误差收敛到零域,并利用李雅普诺夫理论证明所提出的控制策略能使闭环系统误差信号半全局一致有界.最后通过对比仿真证明所提出算法的有效性并且将控制算法在Baxter机器人平台上进行验证.References【相关文献】1 He W,Li Z J,Chen C L P.A survey of human-centered intelligent robots:issues and challenges.IEEE/CAA Journal of Automatica Sinica,2017,4(4):602−6092 Li Y N,Ge S S.Human-robot collaboration based on motion intentionestimation.IEEE/ASME Transactions on Mechatronics,2014,19(3):1007−10143 Li H Y,Chen Z R,Wu L G,Lam H-K.Event-triggered control for nonlinear systems under unreliable communication links.IEEE Transactions on Fuzzy Systems,2017,25(4):813−8244 Hou Zeng-Guang,Zhao Xin-Gang,Cheng Long,Wang Qi-Ning,Wang Wei-Qun.Recent advances in rehabilitation robots and intelligent assistance systems.Acta Automatica Sinica,2016,42(12):1765−1779(侯增广,赵新刚,程龙,王启宁,王卫群.康复机器人与智能辅助系统的研究进展.自动化学报,2016,42(12):1765−1779)5 He Wei,Ding Shi-Qiang,Sun Chang-Yin.Research progress on modeling and control of flapping-wing air vehicles.Acta Automatica Sinica,2017,43(5):685−696(贺威,丁施强,孙长银.扑翼飞行器的建模与控制研究进展.自动化学报,2017,43(5):685−696)6 Wei Qing-Lai,Zhang Hua-Guang,Liu De-Rong,Zhao Yan.An optimal control scheme for a class of discrete-time nonlinear systems with time delays using adaptive dynamic programming.Acta Automatica Sinica,2010,36(1):121−129(魏庆来,张化光,刘德荣,赵琰.基于自适应动态规划的一类带有时滞的离散时间非线性系统的最优控制策略.自动化学报,2010,36(1):121−129)7 Xu B,Shi Z K,Yang C G,Sun F posite neural dynamic surface control of a class of uncertain nonlinear systems in strict-feedback form.IEEE Transactions on Cybernetics,2014,44(12):2626−26348 Tie Lin,Cai Kai-Yuan,Lin-Yan.A survey on the controllability of bilinear systems.Acta Automatica Sinica,2011,37(9):1040−1049(铁林,蔡开元,林岩.双线性系统可控性综述.自动化学报,2011,37(9):1040−1049)9 Shen Fei,Cao Zhi-Qiang,Xu De,Zhou Chao.A dynamic model of robotic dolphin based on Kane method and its speed optimization method.Acta AutomaticaSinica,2012,38(8):1247−1256(沈飞,曹志强,徐德,周超.基于Kane方法的机器海豚动力学建模及速度优化方法.自动化学报,2012,38(8):1247−1256)10 Modares H,Ranatunga I,Lewis F L,Popa D O.Optimized assistive human-robot interaction using reinforcement learning.IEEE Transactions onCybernetics,2016,46(3):655−66711 Sun Fu-Chun,Sun Zeng-Qi,Zhang Bo.Observer-based adaptive control for robot trajectory tracking using neural networks.Acta Automatica Sinica,1999,25(3):295−302(孙富春,孙增圻,张钹.基于观测器的机械手神经网络自适应控制.自动化学报,1999,25(3):295−302)12 Li Y N,Ge S S.Impedance learning for robots interacting with unknown environments.IEEE Transactions on Control Systems Technology,2014,22(4):1422−143213 He W,Dong Y T.Adaptive fuzzy neural network control for a constrained robot using impedance learning.IEEE Transactions on Neural Networks and LearningSystems,2017,29(4):1174−118614 De Santis A,Siciliano B,De Luca A,Bicchi A.An atlas of physical human-robot interaction.Mechanism and Machine Theory,2008,43(3):253−27015 Liu Y J,Tong S C,Li D J,Gao Y.Fuzzy adaptive control with state observer for a class of nonlinear discrete-time systems with input constraint.IEEE Transactions on Fuzzy Systems,2016,24(5):1147−115816 Wang F Y,Zhang J,Wei Q L,Zheng X H,Li L.PDP:parallel dynamic programming.IEEE/CAA Journal of Automatica Sinica,2017,4(1):1−517 Tong S C,Wang T,Li Y M,Chen B.A combined backstepping and stochastic small-gain approach to robust adaptive fuzzy output feedback control.IEEE Transactions on Fuzzy Systems,2013,21(2):314−32718 Liu Y J,Tong S C.Adaptive NN tracking control of uncertain nonlinear discrete-time systems with nonaffine deadzone input.IEEE Transactions onCybernetics,2015,45(3):497−50519 Chen C L P,Wen G X,Liu Y J,Wang F Y.Adaptive consensus control for a class of nonlinear multiagent time-delay systems using neural networks.IEEE Transactions on Neural Networks and Learning Systems,2014,25(6):1217−122620 Han Hong-Gui,Qiao Jun-Fei,Bo Ying-Chun.On structure design for RBF neural network based on information strength.Acta Automatica Sinica,2012,38(7):1083−1090(韩红桂,乔俊飞,薄迎春.基于信息强度的RBF神经网络结构设计研究.自动化学报,2012,38(7):1083−1090)21 Ding S B,Wang Z S,Zhang H G.Event-triggered stabilization of neural networks with time-varying switching gains and input saturation.IEEE Transactions on Neural Networks and Learning Systems,2018,29(10):5045−505622 Narendra K S,Parthasarathy K.identification and control of dynamical systems using neural networks.IEEE Transactions on Neural Networks,1990,1(1):4−2723 Yang C G,Jiang Y M,Li Z J,He W,Su C Y.Neural control of bimanual robots with。