神经网络α阶逆系统控制方法在机器人解耦控制中的应用

文章编号 2 2 2

神经网络Α阶逆系统控制方法在机器人解耦控制中的应用Ξ

戴先中孟正大沈建强阮建山

东南大学自动控制系南京

摘要本文利用神经网络Α阶逆系统线性化解耦能力将严重耦合的多自由度机械手解耦成多个二阶积分子系统进一步采用线性系统设计方法对已解耦系统设计闭环控制器成功地实现了位置快速跟踪该控制方法不需要知道机器人系统的精确数学模型并且结构简单易于工程实现

关键词机器人神经网络逆系统多变量解耦

中图分类号 ×° 文献标识码

ΡΟΒΟΤΔΕΧΟΥΠΛΙΝΓΧΟΝΤΡΟΛΒΑΣΕΔΟΝΑΝΝ

ΑΤΗ?ΟΡΔΕΡΙΝ?ΕΡΣΕΣΨΣΤΕΜΜΕΤΗΟΔ

? ÷ 2 ∞ 2 ≥ ∞ 2 2

ΑυτοματιχΧοντρολΕνγ Δεπτ οφΣουτηεαστΥνι? Ναν?ινγ

Αβστραχτ Α 2 √ √ ? ∏ ?? ∏ ≥ ≥ ∏ × √ ∏ ∏ ∏

2 √

√ ∞? ∏ √ ∏ ? ∏ ∏ ∏

Κεψωορδσ ∏ √ ∏ √ ∏

1引言 Ιντροδυχτιον

由于多自由度机械手模型的非线性和强耦合性机械手的轨迹快速跟踪控制一直是控制领域中富有挑战性的课题之一基于局部线性化理论的传统°?和° ?控制器仅能使得系统在一个很小的工作空间内获得较好的跟踪性能基于非线性全局线性化理论而提出的计算力矩法由于可以使闭环系统获得完全的解耦和线性化从而能在整个工作空间中获得良好的跟踪特性但是计算力矩法所需的模型参数完全准确以及不存在测量误差等条件在工程实际中较难得到满足为此一些学者又先后提出了自适应控制等方案

本文利用神经网络Α阶逆系统线性化解耦能力≈ 将严重耦合的多自由度机械手解耦成多个二阶积分子系统进一步采用线性系统设计方法对已解耦系统设计闭环控制器成功地实现了位置快速跟踪

2多变量系统的神经网络Α阶逆系统解耦控制方法 ΔεχουπλινγχοντρολμετηοδοφΜΙΜΟσψστεμβασεδονΑΝΝΑτη?ορδεριν?ερσεσψστεμ

考察一个用输入输出微分方程表示的 ρ

个输入Υ ρ个输出Ψ 非线性系统Ε

Φ Ψ Α Ψ2 Υ 其中

第卷第期年月机器人ΡΟΒΟΤ?

∏

Ξ基金项目国家自然科学基金资助项目收稿日期

Ψ Α ≈ψ Α ψ Α , ψ Αρ ρ

ΤΥ ≈υ υ , υρ Τ

Ψ2 ≈Ψ Ψ , Ψι , Ψρ Τ

Ψι ≈ψι ψ ι , ψ Αι ι

ι , ρ

若系统可逆其Α Α ≈Α Α , Αρ 阶积分逆系

统可表示为

Υ Θ Ψ Α Ψ2

若将系统的Α阶积分逆系统串联在原系统之前重新定义输入

Υ Ψ Α Υ ψ Α , Υρ

ψ Αρ ρ

组成一伪线性复合系统其传递函数为

Γ σ Δ Α Δ Α , Δ Αρ

由上式可以看出只要能构造出多变量系统的Α阶逆

系统它与原系统组成的复合系统就变成多个≥ ≥ 伪线性积分系统这样就实现了对原系统的解耦再利用已经成熟的线性系统控制方法可以实现对原系统的控制但在很多情况下即使知道系统是可逆的若不知道原系统的精确数学模型也不可能得到其Α阶逆系统解耦也就无从谈起利用神经网络对非线性系统的逼近能力≈ 构造如图虚线框所示的动态神经网络即用静态神经网络来逼近逆系统对应的静态非线性函数用积分器来反映逆系统各变量之间的动态关系构造这样的神经网络Α阶逆系统既不需要知道系统的数学模型除相对阶数Α外并且结构简单!具有很强的对逆系统的动态非线性

逼近能力易于工程实现例如对某一输入输出

Α ≈ 非线性系统完整的控制框图如图所示

图多变量系统的神经网络Α阶逆系统复合控制系统

? × ∏ Α 2 √

3 神经网络Α阶逆系统控制方法在机器人

解耦控制中的应用 ΑππλιχατιονοφΑΝΝ

Ατη?ορδεριν?ερσεσψστενμετηοδινροβοτδεχουπλινγχοντρολ

3 1 多自由度机械手线性化解耦可行性

一个ρ自由度的机器人的动力学模型可以表示为

Δ Η Ηβ Η Η Ηα Γ Η Σ

其中Σ为 ρ? 维控制力矩向量 Η为 ρ? 维关节

角向量 Δ Η 为 ρ?ρ 维惯性矩阵 Η Η Ηα 为哥氏及离心力矩向量 Γ Η 为 ρ? 维重力力矩向量当

以控制力矩Σ为输入关节角Η为输出时原系统显然是一个可逆系统在实际机械手控制系统中当采用直流电机作为驱动电机时力矩与电机电流成正

比在实验中电机控制采用速度!电流双环控制方式如图所示而将逆系统的输出作为速度环的输入因此下面仅讨论包括双环在内的原系统的动力学模型忽略漏感直流电机方程为

Υ Ρι ΧΕΥν

由图双环控制系统的关系式为

νδ

Υ ΚιΠιι

ΠιΠν Κνν

注意到驱动力矩Σ正比于电机电流ι

Σ ΙΧΜ5ι

或

κΣΣ ι

式中Ι为传动比联合式有

机器人年月

νδ

Ρ ΚιΠιΠιΠνΚΣΣ ΧΕΥ

ΠιΠν

Κν ν

ΧΣΣ Χνν

对ρ自由度机械手有

νδ νδρ

ΧΣ , ΧΣ

,ω ,ΧΣρΣ Σρ

Χν , Χν

,ω

Χνρ

ν ν νρ

将式代入式并注意到ν与Η间的关系可知以速度给定Ηδ为输入关节角Η为输出的系统是

可逆的因而可构造神经网络Α阶逆系统 Α ≈

, ?ρ 与原系统复合实现线性化解耦如图所

示

3 2 神经网络Α阶逆系统工程实现与辨识

试验针对 2 工业机器人的腕一与腕二进行对此两连杆机械手

神经网络Α阶逆系统由一个

层前馈神经网络和个积分因子组成如图所

示神经网络有个输入结点!两个输出结点和一个隐层隐层的结点数为

图包括电流!速度双环在内的机械手结构示意图

? ∏

∏

图多自由度机械手Α阶逆系统解耦示意图

? ? ∏ ?? Α 2 √

在确定了神经网络Α阶逆系统结构之后逆系统辨识以及神经网络训练过程如下注在训练辨识过程中不需要知道被控系统的模型与参数

给机械手输入具有不同幅值周期为秒的

方波 νδ νδ 以秒的周期采样给定速度 νδ

νδ 和相应的关节角位置 Η 和Η 获得组输

入输出数据

经过滤去高频噪声后计算输出Η !Η 的一

阶!二阶数值微分重组以上数据得到训练数据集

Ηβ Ηα Η Ηβ Ηα Η

和 νδ νδ 用于网络训练直到逆系统达到给定的训练精度 3 3 复合控制器设计

对已解耦的两个子系统分别附加超前滞后控制器

如图所示就完成了整个跟踪控

第卷第期戴先中等神经网络Α阶逆系统控制方法在机器人解耦控制中的应用

制器的设计

图自由度机械手神经网络复合控制系统

? 2? ? ∏ Α 2 √

4 实验结果及分析 Εξπεριμεντρεσυλτσ

机械手初始工作点即机器人的电气零位

Η τ Π

Ηα

τ Ηα τ

为了检验控制方法的跟踪性能给被控系统以不同

的期望轨迹作为参考输入采用同一控制器参数考察机械手关节角位置的响应曲线从而检验控制效果图为实际系统对方波给定的响应图为对三角波给定的响应从图中可以看到当给定信号幅值与频率都改变时系统基本上能对给定信号实现有效的跟踪

图对方波的跟踪响应特性为腕一为腕二实线为给定虚线为跟踪

? ≥ ∏ √ ?

∏ √ √

机器人年月

图对三角波的跟踪响应特性为腕一为腕二实线为给定虚线为跟踪

? × ∏ √ ?

∏ √ √

参考文献 Ρεφερενχεσ

÷ ? ? Α 2 √ ≥ ≤ ≥ ≤ ° × ? ∏ ≤ ? ≤ ∞× ∏ ≥ 3

÷ ? ∏ ∏ ≤ ∏ ? ? ∏ Α 2 √ ≥ ≤ ≤ ∏ ∏ ≥ ∞∞∞° 2≤ × 145 √ ≤ ∏ ∞∞∞× ∏ ≠ ≤ ≤ ∏ ∏ √ ∏ ≥ 14

作者简介

戴先中 2 男年清华大学工学博士现为东南大学自控系教授博士生导师研究领域神经网

络非线性控制机器人控制与电力系统控制

孟正大 2 男研究领域机器人控制与自动化

上接第页

参考文献 Ρεφερενχεσ

≥ √ ? ÷网络编程清华大学出版社

× ?

日本机器人学会机器人技术手册科学出版社北京

∞ 开发 ∏?应用用 × 和 ? 开发 ∏?图形界面应用电子工业出版社

∏ ∏ ∏ ?

? ? ≥ ÷编程指南清华大学出版社

≠ ∏ ∏ ≥ × × ∏ ? ? ∏ ≥

° ∞∞∞ ≤ ∏ ∏ ∏ ∏ ∞? ?

贾志刚精通电子工业出版社

周巍松 ∏?系统分析与高级编程技术机械工业出版社

周远清张再兴智能机器人系统清华大学出版社北京作者简介

陈一民 2 男教授研究领域计算机控制网络与多媒体技术的研究

张涛 2 男硕士生研究领域多媒体技术

薛广涛 2 男硕士生研究领域多媒体技术

第卷第期戴先中等神经网络Α阶逆系统控制方法在机器人解耦控制中的应用

基于BP神经网络的PID控制器的设计

基于BP神经网络的PID控制器的研究与实现课程名称：人工神经网络

目录前言 (3) 一、BP神经网络 (4) 二、模拟PID控制系统 (5) 三、基于BP神经网络的PID控制器 (6) 四、仿真程序 (10) 五、运行结果 (17) 六、总结 (18) 参考文献 (19)

前言人工神经网络是以一种简单神经元为节点，采用某种网络拓扑结构构成的活性网络，可以用来描述几乎任意的非线性系统。不仅如此，人工神经网络还具有学习能力、记忆能力、计算能力以及各种智能处理能力，在不同程度和层次上模仿人脑神经系统的信息处理、存储和检索的功能。不同领域的科学家，对人工神经网络有着不同的理解、不同的研究内容，并且采用不同的研究方法。对于控制领域的研究工作者来说，人工神经网络的魅力在于：①能够充分逼近任意复杂的非线性关系，从而形成非线性动力学系统，以表示某种被控对象的模型或控制器模型；②能够学习和适应不确定性系统的动态特性；③所有定量或定性的信息都分布储存于网络内的各神经单元，从而具有很强的容错性和鲁棒性；④采用信息的分布式并行处理，可以进行快速大量运算。对于长期困扰控制界的非线性系统和不确定性系统来说，人工神经网络无疑是一种解决问题的有效途径。正因为如此，把人工神经网络引入传统的PID 控制，将这两者结合，则可以在一定程度上解决传统PID 调节器不易在线实时整定参数、难于对一些复杂过程和参数慢时变系统进行有效控制的不足。

一、BP神经网络 BP神经网络是一种有隐含层的多层前馈网络，其结构如图1-1所示。如果把具有M个输入节点和L个输出节点的BP神经网络看成是从M维欧氏空间到L维欧氏空间的非线性映射，则对于具有一定非线性因数的工业过程被控对象，采用BP网络来描述，不失为一种好的选择。在BP神经网络中的神经元多采用S型函数作为活化函数，利用其连续可导性，便于引入最小二乘学习算法，即在网络学习过程中，使网络的输出与期望输出的误差边向后传播边修正加权系数，以期使误差均方值最小。BP神经网络的学习过程可分为前向网络计算和反向误差传播——连接加权系数修正两个部分，这两个部分是相继连续反复进行的，直至误差满足要求。不论学习过程是否已经结束，只要在网络的输入节点加入输入信号，则这些信号将一层一层向前传播；通过每一层时要根据当时的连接加权系数和节点的活化函数与阈值进行相应计算，所得的输出再继续向下一层传输。这个前向网络计算过程，既是网络学习过程的一部分，也是将来网络的工作模式。在学习过程结束之前，如果前向网络计算的输出和期望输出之间存在误差，则转入反向传播，将误差沿着原来的连接通路回送，作为修改加权系数的依据，目标是使误差减小。

9.7 机器人神经网络自适应控制

声明：应部分读者的要求，本书第9章增加“机器人神经网络自适应控制”一节，图序、公式序顺延。 9.7 机器人神经网络自适应控制机器人学科是一门迅速发展的综合性前沿学科，受到工业界和学术界的高度重视。机器人的核心是机器人控制系统，从控制工程的角度来看，机器人是一个非线性和不确定性系统，机器人智能控制是近年来机器人控制领域研究的前沿课题，已取得了相当丰富的成果。机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩，使得机器人的位置、速度等状态变量跟踪给定的理想轨迹。与一般的机械系统一样，当机器人的结构及其机械参数确定后，其动态特性将由动力学方程即数学模型来描述。因此，可以采用自动控制理论所提供的设计方法，采用基于数学模型的方法设计机器人控制器。但是在实际工程中，由于机器人是一个非线性和不确定性系统，很难得到机器人精确的数学模型。采用神经网络，可实现对机器人动力学方程中未知部分的精确逼近，从而实现无需建模的控制。本节讨论如何利用神经网络控制和李雅普诺夫（Lyapunov ）方法设计机器人轨迹跟踪控制的问题，以及如何分析控制系统的稳定性和收敛性。 9.7.1 机器人动力学模型及其结构特性 n 关节机械手动态方程可表示为： ()()()(),d ++++=M q q V q q q G q F q ττ （9.30）其中，n R ∈q 为关节转动角度向量，()M q 为n n ?维正定惯性矩阵，(),V q q 为n n ?维向心哥氏力矩，()G q 为1?n 维惯性矩阵，()F q 为1?n 维摩擦力，d τ为未知有界的外加干扰，n R ∈τ为各个关节运动的转矩向量，即控制输入。机器人动力学系统具有如下动力学特性：特性1：惯量矩阵M(q)是对称正定阵且有界；特性2：矩阵(),V q q 有界；特性3：()()2,-M q C q q 是一个斜对称矩阵，即对任意向量ξ，有 ()()()2,0T -=ξ M q C q q ξ (9.31)

神经网络控制

人工神经网络控制摘要: 神经网络控制，即基于神经网络控制或简称神经控制，是指在控制系统中采用神经网络这一工具对难以精确描述的复杂的非线性对象进行建模，或充当控制器，或优化计算，或进行推理，或故障诊断等，亦即同时兼有上述某些功能的适应组合，将这样的系统统称为神经网络的控制系统。本文从人工神经网络，以及控制理论如何与神经网络相结合，详细的论述了神经网络控制的应用以及发展。关键词: 神经网络控制；控制系统；人工神经网络人工神经网络的发展过程神经网络控制是20世纪80年代末期发展起来的自动控制领域的前沿学科之一。它是智能控制的一个新的分支，为解决复杂的非线性、不确定、不确知系统的控制问题开辟了新途径。是（人工）神经网络理论与控制理论相结合的产物，是发展中的学科。它汇集了包括数学、生物学、神经生理学、脑科学、遗传学、人工智能、计算机科学、自动控制等学科的理论、技术、方法及研究成果。在控制领域，将具有学习能力的控制系统称为学习控制系统，属于智能控制系统。神经控制是有学习能力的，属于学习控制，是智能控制的一个分支。神经控制发展至今，虽仅有十余年的历史，已有了多种控制结构。如神经预测控制、神经逆系统控制等。生物神经元模型神经元是大脑处理信息的基本单元，人脑大约含1012个神经元，分成约1000种类型，每个神经元大约与102~104个其他神经元相连接，形成极为错综复杂而又灵活多变的神经网络。每个神经元虽然都十分简单，但是如此大量的神经元之间、如此复杂的连接却可以演化出丰富多彩的行为方式，同时，如此大量的神经元与外部感受器之间的多种多样的连接方式也蕴含了变化莫测的反应方式。图1 生物神经元传递信息的过程为多输入、单输出，神经元各组成部分的功能来看，信息的处理与传递主要发生在突触附近，当神经元细胞体通过轴突传到突触前膜的脉冲幅度达到一定强度，即超过其阈值电位后，突触前膜将向突触间隙释放神经传递的化学物质，突触有两

基于神经网络的机器人模型辨识-自动化专业

第二章神经网络 2.1神经网络基础人的大脑中有众多神经元，它们连接在一起组成复杂的神经网络，因此大脑拥有高级的认知能力。人工神经网络实际上是对人大脑处理信息方法的简单化。 2.1.1神经网络概述神经网络是推广众多简单处理单元构成的一种非线性动力学系统，能够大规模地进行信息分布式存储和并行处理。同时神经网络具有自学习的能力，当外界的环境发生了改变，神经网络经过训练能够在外界信息的基础上自动调整内部结构，对于给定的输入可以得到期望输出。由图可知，神经元是一种性质为多输入单输出的系统，是由n 个输入i x 和一个输出j y 组成。图2-1 神经元结构 j u ：第j 个神经元的状态； j ：第j 个神经元的阈值； i x ：第i 个神经元的输入信号； ji w ：第i 个神经元到第j 个神经元的连接权系数；其中：激发状态时ji w 取正数，抑制情况下ji w 取的是负值；

j s ：第j 个神经元的外部输入信号。输出可以表示为 1n j ji i j j i Net w x s θ==+-∑ (2.1） ()j j u f Net = (2.2） ()()j j j y g u h Net == （2.3）一般(.)g 是单位映射，也就是说()j j g u u = 。 j Net 表示第j 个神经元的输入； (.)f 表示第j 个神经元的激励函数； (.)g 表示第j 个神经元的输出函数。激活函数往往采用这三种函数：（1）二值函数（阈值型）： 1,0()0,0x f x x >?=?≤? （2.4） (2) S 型函数： 1 ()1x f x e α-= +，0()1f x << （2.5）（3）双曲正切函数: 1()1x x e f x e αα---=+，1()1f x -<< （2.6） 2.1.2神经网络的分类以连接方式对神经网络可分为两大类：一是没有反馈的前向网络，二是相互结合型网络（含有反馈网络）[10]。（1）前向神经网络

神经网络α阶逆系统控制方法在机器人解耦控制中的应用

文章编号 2 2 2 神经网络Α阶逆系统控制方法在机器人解耦控制中的应用Ξ 戴先中孟正大沈建强阮建山东南大学自动控制系南京摘要本文利用神经网络Α阶逆系统线性化解耦能力将严重耦合的多自由度机械手解耦成多个二阶积分子系统进一步采用线性系统设计方法对已解耦系统设计闭环控制器成功地实现了位置快速跟踪该控制方法不需要知道机器人系统的精确数学模型并且结构简单易于工程实现关键词机器人神经网络逆系统多变量解耦中图分类号 ×° 文献标识码 ΡΟΒΟΤΔΕΧΟΥΠΛΙΝΓΧΟΝΤΡΟΛΒΑΣΕΔΟΝΑΝΝ ΑΤΗ?ΟΡΔΕΡΙΝ?ΕΡΣΕΣΨΣΤΕΜΜΕΤΗΟΔ ? ÷ 2 ∞ 2 ≥ ∞ 2 2 ΑυτοματιχΧοντρολΕνγ Δεπτ οφΣουτηεαστΥνι? Ναν?ινγ Αβστραχτ Α 2 √ √ ? ∏ ?? ∏ ≥ ≥ ∏ × √ ∏ ∏ ∏ 2 √ √ ∞? ∏ √ ∏ ? ∏ ∏ ∏ Κεψωορδσ ∏ √ ∏ √ ∏ 1引言 Ιντροδυχτιον 由于多自由度机械手模型的非线性和强耦合性机械手的轨迹快速跟踪控制一直是控制领域中富有挑战性的课题之一基于局部线性化理论的传统°?和° ?控制器仅能使得系统在一个很小的工作空间内获得较好的跟踪性能基于非线性全局线性化理论而提出的计算力矩法由于可以使闭环系统获得完全的解耦和线性化从而能在整个工作空间中获得良好的跟踪特性但是计算力矩法所需的模型参数完全准确以及不存在测量误差等条件在工程实际中较难得到满足为此一些学者又先后提出了自适应控制等方案本文利用神经网络Α阶逆系统线性化解耦能力≈ 将严重耦合的多自由度机械手解耦成多个二阶积分子系统进一步采用线性系统设计方法对已解耦系统设计闭环控制器成功地实现了位置快速跟踪 2多变量系统的神经网络Α阶逆系统解耦控制方法 ΔεχουπλινγχοντρολμετηοδοφΜΙΜΟσψστεμβασεδονΑΝΝΑτη?ορδεριν?ερσεσψστεμ 考察一个用输入输出微分方程表示的 ρ 个输入Υ ρ个输出Ψ 非线性系统Ε Φ Ψ Α Ψ2 Υ 其中第卷第期年月机器人ΡΟΒΟΤ? ∏ Ξ基金项目国家自然科学基金资助项目收稿日期

神经网络模型预测控制器

神经网络模型预测控制器摘要：本文将神经网络控制器应用于受限非线性系统的优化模型预测控制中，控制规则用一个神经网络函数逼近器来表示，该网络是通过最小化一个与控制相关的代价函数来训练的。本文提出的方法可以用于构造任意结构的控制器，如减速优化控制器和分散控制器。关键字：模型预测控制、神经网络、非线性控制 1.介绍由于非线性控制问题的复杂性，通常用逼近方法来获得近似解。在本文中，提出了一种广泛应用的方法即模型预测控制（MPC），这可用于解决在线优化问题，另一种方法是函数逼近器，如人工神经网络，这可用于离线的优化控制规则。在模型预测控制中，控制信号取决于在每个采样时刻时的想要在线最小化的代价函数，它已经广泛地应用于受限的多变量系统和非线性过程等工业控制中[3,11,22]。MPC方法一个潜在的弱点是优化问题必须能严格地按要求推算，尤其是在非线性系统中。模型预测控制已经广泛地应用于线性MPC问题中[5]，但为了减小在线计算时的计算量，该部分的计算为离线。一个非常强大的函数逼近器为神经网络，它能很好地用于表示非线性模型或控制器，如文献[4,13,14]。基于模型跟踪控制的方法已经普遍地应用在神经网络控制，这种方法的一个局限性是它不适合于不稳定地逆系统，基此本文研究了基于优化控制技术的方法。许多基于神经网络的方法已经提出了应用在优化控制问题方面，该优化控制的目标是最小化一个与控制相关的代价函数。一个方法是用一个神经网络来逼近与优化控制问题相关联的动态程式方程的解[6]。一个更直接地方法是模仿MPC方法，用通过最小化预测代价函数来训练神经网络控制器。为了达到精确的MPC技术，用神经网络来逼近模型预测控制策略，且通过离线计算[1,7.9,19]。用一个交替且更直接的方法即直接最小化代价函数训练网络控制器代替通过训练一个神经网络来逼近一个优化模型预测控制策略。这种方法目前已有许多版本，Parisini[20]和Zoppoli[24]等人研究了随机优化控制问题，其中控制器作为神经网络逼近器的输入输出的一个函数。Seong和Widrow[23]研究了一个初始状态为随机分配的优化控制问题，控制器为反馈状态，用一个神经网络来表示。在以上的研究中，应用了一个随机逼近器算法来训练网络。Al-dajani[2]和Nayeri等人[15]提出了一种相似的方法，即用最速下降法来训练神经网络控制器。在许多应用中，设计一个控制器都涉及到一个特殊的结构。对于复杂的系统如减速控制器或分散控制系统，都需要许多输入与输出。在模型预测控制中，模型是用于预测系统未来的运动轨迹，优化控制信号是系统模型的系统的函数。因此，模型预测控制不能用于定结构控制问题。不同的是，基于神经网络函数逼近器的控制器可以应用于优化定结构控制问题。在本文中，主要研究的是应用于非线性优化控制问题的结构受限的MPC类型[20,2,24,23,15]。控制规则用神经网络逼近器表示，最小化一个与控制相关的代价函数来离线训练神经网络。通过将神经网络控制的输入适当特殊化来完成优化低阶控制器的设计，分散和其它定结构神经网络控制器是通过对网络结构加入合适的限制构成的。通过一个数据例子来评价神经网络控制器的性能并与优化模型预测控制器进行比较。 2.问题表述考虑一个离散非线性控制系统：其中为控制器的输出，为输入，为状态矢量。控制

基于S函数的RBF神经网络PID控制器

基于径向基函数的神经网络的PID控制器摘要 RBF神经网络在分类问题中得到了广泛的应用，尤其是模式识别的问题。许多模式识别实验证明，RBF具有更有效的非线性逼近能力，并且RBF神经网络的学习速度较其他网络快。本文在具有复杂控制规律的S函数构造方法的基础上，给出了基于MATLAB语言的RBF神经网络PID控制器，及该模型的一非线性对象的仿真结果。关键词：S函数；RBF神经网络PID控制器；Simulink仿真模型径向基函数（RBF-Radial Basis Function）神经网络是由J.Moody和C.Darken 在20世纪80年代末提出的一种神经网络，它具有单隐层的三层前馈网络。由于它模拟了人脑中局部调整、相互覆盖接受域（或称野-Receptive Field）的神经网络结构，因此，RBF神经网络是一种局部逼近网络，已证明它能以任意精度逼近任意连续函数。 1.S函数的编写方法 S函数是Simulink中的高级功能模块，Simulink是运行在MATLAB环境下用于建模、仿真和分析动态系统的软件包。只要所研究的系统模型能够由MATLAB语言加以描述，就可构造出相应的S函数，从而借助Simulink中的S 函数功能模块实现MATLAB与Simulink之间的沟通与联系，这样处理可以充分发挥MATLAB编程灵活与Simulink简单直观的各自优势。当系统采用较复杂的控制规律时，Simulink中没有现成功能模块可用，通常都要采用MATLAB编程语言，编写大量复杂而繁琐的源程序代码进行仿真，一是编程复杂、工作量较大，二来也很不直观。如果能利用Simulink提供的S函数来实现这种控制规律，就可以避免原来直接采取编程的方法，不需要编写大量复杂而繁琐的源程序，编程快速、简捷，调试方便，则所要完成的系统仿真工作量会大大减少。 RBF神经网络PID控制器的核心部分的S函数为： function [sys,x0,str,ts]=nnrbf_pid(t,x,u,flag,T,nn,K_pid,eta_pid,xite,alfa,beta0,w0) switch flag,

机器人神经网络控制

第一部分机器人手臂的自适应神经网络控制机器人是一具有高度非线性和不确定性的复杂系统，近年来各研究单位对机器人智能控制的研究非常热门，并已取得相当丰富的成果。机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩，使得机器人的位置、速度等状态变量跟踪给定的理想轨迹。与一般的机械系统一样，当机器人的结构及其机械参数确定后，其动态特性将由动力学方程即数学模型来描述。因此，可采用经典控制理论的设计方法——基于数学模型的方法设计机器人控制器。但是在实际工程中，由于机器人模型的不确定性，使得研究工作者很难得到机器人精确的数学模型。采用自适应神经网络，可实现对机器人动力学方程中未知部分的精确逼近，从而实现无需建模的控制。下面将讨论如何利用自适应神经网络和李雅普诺夫（Lyapunov ）方法设计机器人手臂跟踪控制的问题。 1、控制对象描述：选二关节机器人力臂系统（图1），其动力学模型为：图1 二关节机器人力臂系统物理模型 ()()()()d ++++=M q q V q,q q G q F q ττ （1）其中 1232 232232 22cos cos ()cos p p p q p p q p p q p +++??=? ?+??M q ，322 3122312 sin ()sin (,)sin 0p q q p q q q p q q --+?? =???? V q q

41512512cos cos()()cos()p g q p g q q p g q q ++??=??+?? G q ，()()0.02sgn =F q q ，()()0.2sin 0.2sin T d t t =????τ。其中，q 为关节转动角度向量，()M q 为2乘2维正定惯性矩阵，(),V q q 为2乘2维向心哥氏力矩，()G q 为2维惯性矩阵，()F q 为2维摩擦力矩阵，d τ为未知有界的外加干扰，τ为各个关节运动的转矩向量，即控制输入。已知机器人动力学系统具有如下动力学特性：特性1：惯量矩阵M(q)是对称正定阵且有界；特性2：矩阵 () ,V q q 有界；特性3：()()2,-M q C q q 是一个斜对称矩阵，即对任意向量ξ，有 ()()()2,0T -=ξ M q C q q ξ (2) 特性4：未知外加干扰d τ 满足 d d b ≤τ， d b 为正常数。我们取[][]2 12345,,,, 2.9,0.76,0.87,3.04,0.87p p p p p kgm ==p ，两个关节的位置指令分别为()10.1sin d q t =，()20.1cos d q t =，即设计控制器驱动两关节电机使对应的手臂段角度分别跟踪这两个位置指令。 2、传统控制器的设计及分析：定义跟踪误差为： ()()()d t t t =-e q q （3）定义误差函数为： =+∧r e e （4）其中0>∧=∧T 。则 d =-++∧q r q e

神经网络控制完整版

神经网络控制 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

人工神经网络控制摘要: 神经网络控制，即基于神经网络控制或简称神经控制，是指在控制系统中采用神经网络这一工具对难以精确描述的复杂的非线性对象进行建模，或充当控制器，或优化计算，或进行推理，或故障诊断等，亦即同时兼有上述某些功能的适应组合，将这样的系统统称为神经网络的控制系统。本文从人工神经网络，以及控制理论如何与神经网络相结合，详细的论述了神经网络控制的应用以及发展。关键词: 神经网络控制；控制系统；人工神经网络人工神经网络的发展过程神经网络控制是20世纪80年代末期发展起来的自动控制领域的前沿学科之一。它是智能控制的一个新的分支，为解决复杂的非线性、不确定、不确知系统的控制问题开辟了新途径。是（人工）神经网络理论与控制理论相结合的产物，是发展中的学科。它汇集了包括数学、生物学、神经生理学、脑科学、遗传学、人工智能、计算机科学、自动控制等学科的理论、技术、方法及研究成果。在控制领域，将具有学习能力的控制系统称为学习控制系统，属于智能控制系统。神经控制是有学习能力的，属于学习控制，是智能控制的一个分支。神经控制发展至今，虽仅有十余年的历史，已有了多种控制结构。如神经预测控制、神经逆系统控制等。生物神经元模型神经元是大脑处理信息的基本单元，人脑大约含1012个神经元，分成约1000种类型，每个神经元大约与 102~104个其他神经元相连接，形成极为错综复杂而又灵活多变的神经网络。每个神经元虽然都十分简单，但是如此大量的神经元之间、如此复杂的连接却可以演化出丰富多彩的行为方式，同时，如此大量的神经元与外部感受器之间的多种多样的连接方式也蕴含了变化莫测的反应方式。图1 生物神经元传递信息的过程为多输入、单输出，神经元各组成部分的功能来看，信息的处理与传递主要发生在突触附近，当神经元细胞体通过轴突传到突触前膜的脉

基于神经网络的多任务学习机器人

基于神经网络的多任务学习机器人目前绝大多数智能机器人具有较高的鲁棒性，但其基于具体行为的实现方法都需要程序员对相应的任务进行手工编程。然而，环境是复杂多样的，而要使得机器人能够在多种环境下进行任务，需要程序员将各种情况考虑在内，这样的系统对环境并不具有适应性，让机器人的应用受到了局限。基于此，提出的自主学习机器人以类人形机器人为基本模型，以神经网络为基础，通过人体对机器人进行示范，训练一个能识别人关节姿态的完备的神经网络。当机器人身处不同环境执行任务时，能够做出适应环境变化的动作。为此所设计的学习机器人系统的特色就在于使用神经网络具有学习能力，提高机器人对环境的适应能力，从而让任务执行更加灵活，使得机器人拥有更广阔的应用前景。标签：自主学习；神经网络；姿態识别；机器人 doi：10.19311/https://www.360docs.net/doc/25957636.html,ki.16723198.2017.01.092 1引言 1.1机器人在现代社会中的重要性随着城乡居民消费结构的持续升级，以及智慧中国战略的不断推进，智能机器人在家庭、农业、工业等生活的方方面面都有着极其广泛的应用。随着社会的不断发展，社会分工越来越细，与此同时工作也变得越来越单调。另外，社会上有些工作风险较高，若让人去做，不仅效率不高，而且更会产生生命危险。在这样高风险的作业领域，对机器人的需求越来越高。在这一背景下，各种各样的机器人被研制了出来，用它们代替人来完成枯燥、单调、高风险的工作。这极大的提高了劳动生产率和生产质量，创造出了更多的社会财富。同时，社会服务也对机器人产生了大量的需求。从公共服务方面来说，目前我国老龄人口已超过总人口的10%，人口老龄化问题已成为中国需要面临的重大课题。此外，我国残疾人口占总人口的比重也位居世界较高国家之列。机器人的运用，可以为他们提供大量的护理服务，提高他们的生活质量。在医疗服务方面机器人也有很大的优势，手术机器人凭借其操作的精度及可长期工作等特性广泛应用于手术操作中。总而言之，机器人已成为我们的社会不可取代的一部分。 1.2当前机器人领域的现状及弊端目前机器人正处于快速发展的阶段，但目前市场上的机器人仍存在着许多弊端。传统机器人需要设计者针对具体的任务进行手工编程，为了使机器人在环境改变时也能完成任务，设计者就需要尽量将各种情况考虑在内。但是这样的机器人存在一些问题：一方面程序员无法穷尽所有的可能情况，另一方面环境的复杂性也无形中加大了机器人可能出故障的概率，这使得机器人缺乏良好的环境自适应能力，给机器人的广泛应用带来了很大的限制。

pid神经网络控制器的设计

第三章 PID 神经网络结构及控制器的设计在控制系统中，PID 控制是历史最悠久，生命力最强的控制方式，具有直观、实现简单和鲁棒性能好等一系列优点。但近年来随着计算机的广泛应用，智能控制被越来越广泛的应用到各种控制系统中。智能控制方法以神经元网络为代表，由于神经网络可实现以任意精度逼近任意函数，并具有自学习功能，因此适用于时变、非线性等特性未知的对象，容易弥补常规PID 控制的不足。将常规PID 控制同神经网络相结合是现代控制理论的一个发展趋势。 3.1 常规PID 控制算法和理论基础 3.1.1 模拟PID 控制系统 PID(Proportional 、Integral and Differential)控制是最早发展起来的控制策略之一，它以算法简单、鲁捧性好、可靠性高等优点而梭广泛应用于工业过程控制中。 PID 控制系统结构如图3．1所示：图3.1 模拟PID 控制系统结构图它主要由PID 控制器和被控对象所组成。而PID 控制器则由比例、积分、微分三个环节组成。它的数学描述为： 1() ()[()()]t p D i de t u t K e t e d T T dt ττ=+ +? （3.1）式中，p K 为比例系数； i K 为积分时间常数： d K 为微分时间常数。简单说来，PID 控制器各校正环节的主要控制作用如下： 1．比例环节即时成比例地反映控制系统的偏差信号()e t ，偏差一旦产生，控制器立即产生控制作用，以减少偏差。

2．积分环节主要用于消除静差，提高系统的无差度。积分作用的强弱取决于积分时间常数i T ，i T 越大，积分作用越弱，反之则越强。 3．微分环节能反映偏差信号的变化趋势(变化速率)，并能在偏差信号值变得太大之前，在系统中引入一个有效的早期修正信号，从而加快系统的动作速度，减少调节时间。具体说来，PID 控制器有如下特点： (1)原理简单，实现方便，是一种能够满足大多数实际需要的基本控制器； (2)控制器能适用于多种截然不同的对象，算法在结构上具有较强的鲁棒性，在很多情况下，其控制品质对被控对象的结构和参数摄动不敏感。 3.1.2 数字PID 控制算法在计算机控制系统中，使用的是数字PID 控制器，数字PID 控制算法通常又分为位置式PID 控制算法和增量式PID 控制算法。 1．位置式PID 控制算法由于计算机控制是一种采样控制，它只能根据采样时刻的偏差值计算控制量，故对式(3．1)中的积分和微分项不能直接使用，需要进行离散化处理。按模拟PID 控制算法的算式(3．1)，现以一系列的采样时刻点kT 代表连续时间t ，以和式代替积分，以增量代替微分，则可以作如下的近似变换： t kT = （0,1,2,3...)k = ()()()k k t j j e t dt T e jT T e j ==≈=∑∑? ()()[(1)]()(1) de t e kT e k T e k e k dt T T ----≈= (3.2) 式中，T 表示采样周期。显然，上述离散化过程中，采样周期T 必须足够短，才能保证有足够的精度。为了书写方便，将()e kT 简化表示()e k 成等，即省去T 。将式（3.2）代入到（3.1）中可以得到离散的PID 表达式为： 0(){()()[()(1)]}k D p j I T T u k K e k e j e k e k T T ==+ + --∑ （3.3）或 0 ()()()[()(1)]}k p I D j u k K e k K e j K e k e k ==++--∑ （3.4）式中，k ——采样序号，0,1,2...k =； ()u k ——第k 次采样时刻的计算机输出值；

基于卷积神经网络算法的机器人系统控制

第２９卷一第４期长一春一大一学一学一报Ｖｏｌ.２９一Ｎｏ.４一２０１９年４月ＪＯＵＲＮＡＬＯＦＣＨＡＮＧＣＨＵＮＵＮＩＶＥＲＳＩＴＹＡｐｒ.２０１９一收稿日期:２０１８－０１－２０基金项目:安徽省科技厅项目(１７０３０９０１０３３) 作者简介:张松林(１９８１－)?男?安徽皖寿人?工程师?硕士?主要从事电子信息工程方面研究?基于卷积神经网络算法的机器人系统控制张松林 (安徽信息工程学院信息系?安徽芜湖２４１０００) 摘一要:随着计算机技术的不断成熟和数据分析技术的不断完善?近年来突出机器深度学习功能的智能算法取得重大突破?其中以卷积神经网络为代表的技术?可根据不同的控制要求进行相应数据训练?从而提高系统的控制效果?在机器人控制二目标识别等领域得到广泛应用?随着机器人应用环境的复杂化?设计基于卷积神经网络机器人控制算法在非结构化环境中实现精准化物体抓取?建立一个完整的机器人自动抓取规划系统? 关键词:机械臂?深度强化学习?策略搜索?卷积神经网络中图分类号:ＴＰ１８３一一文献标志码:Ａ一一文章编号:１００９－３９０７(２０１９)０４－００１４－０４一一自２０世纪中期开始?机器人系统逐步得到发展?从简单的机械结构到具有感知识别功能的智能机器人系统?已经在多个领域广泛应用?其中?物体抓取操作是机器人的重要功能?随着硬件技术的不断成熟?机器人系统通过传感器实现环境感知?并通过智能算法的设计来实现物体的任意抓取?由于机器人系统应用领域的复杂化?对机器人的控制算法提出了更高的要求?目前?工业机器人的抓取算法设计需要依赖预先建立好的物体抓取模型并整理为数据库?但对于在非结构化的环境中进行抓取的机器人来说?建立准确的数学模型难以实现?因此?要建立起能够对环境实时预测并快速整定的抓取规划算法?为优化这一问题?引入基于卷积神经网络的机器人规划算法?机器人通过传感器获取的环境信息?建立对应的抓取位姿映射关系?即通过环境模型库来存储机器人抓取经验?相比与传统的抓取控制算法而言?基于卷积神经网络的算法可以实现对未知物体的抓取经验迁移? １一机器人抓取模型设计机器人物体抓取可以视为机械臂对物体表面上一组接触点的施加力?以防止物体在外界扰动下发生运动?为提高机器人对物体抓取的控制性能?首先?需要建立机器人物体抓取的接触力数学模型[１]? 图１一物体与末端执行器接触模型的坐标系关系１.１一机器人与物体之间的接触力当需要通过机器人的机械臂进行物体抓取时?机械臂的末端抓手会通过若干个接触点与物体进行关联?一般情况下?在接触点上定义坐标系?并沿３个不同维度设立坐标轴ｎｌ二ｐｌ二ｑｌ?其中?接触点上切平面的单位法向量定义为ｎｌ?而ｐｌ二ｑｌ为符合右手定则的在切平面相互垂直的两个单位向量?在接触点建立坐标系如图１所示?机器人的物体抓取定义为爪手与物体之间的运动?而接触面的形状以及爪手与物体之间的摩擦系数共同决定了该运动的性质?在物体的接触点上会提供一个单方向的约束[２]?以此防止物体向接触向量的方向偏移?机械臂爪手对物体施加的力和力

智能控制大作业-神经网络

智能控制与应用实验报告神经网络控制器设计

一、实验内容考虑一个单连杆机器人控制系统，其可以描述为： 0.5sin()Mq mgl q y q τ+== 其中20.5M kgm =为杆的转动惯量，1m kg =为杆的质量，1l m =为杆长， 29.8/g m s =，q 为杆的角位置，q 为杆的角速度，q 为杆的角加速度， τ为系统的控制输入。具体要求： 1、设计神经网络控制器，对期望角度进行跟踪。 2、分析神经网络层数和神经元个数对控制性能的影响。 3、分析系统在神经网络控制和PID 控制作用下的抗干扰能力(加噪声干扰、加参数不确定)、抗非线性能力(加死区和饱和特性)、抗时滞的能力(对时滞大小加以改变)。 4、为系统设计神经网络PID 控制器(选作)。二、对象模型建立根据公式(1)，令状态量121=,x q x x = 得到系统状态方程为： 12121 0.5**sin() x x mgl x x M y x τ=-= = (1) 由此建立单连杆机器人的模型如图1所示。

图1 单连杆机器人模型三、系统结构搭建及神经网络训练 1.系统PID结构如图2所示: 图2 系统PID结构图 PID参数设置为Kp=16，Ki=10，Kd=8得到响应曲线如图3所示：

01234 5678910 0.2 0.4 0.6 0.8 1 1.2 1.4 t/s a n g l e /r a d 图3 PID 控制响应曲线采样PID 控制器的输入和输出进行神经网络训练 p=[a1';a2';a3']; t=b'; net=newff([-1 1;-1 1;-1 1],[3 8 16 8 1],{'tansig' 'tansig' 'tansig' 'logsig' 'purelin'}); net.trainparam.epochs=2500; net.trainparam.goal=0.00001; net=train(net,p,t); gensim(net,-1) 产生的神经网络控制器如图4所示：

基于机器人的递归神经网络运动规划

基于机器人的递归神经网络运动规划文章研究机器手臂的重复运动规划问题，在考虑关节角度极限和关节速度极限的情况下，将此模型转化为一个含不等式约束的二次规划问题，并利用简化对偶神经网络来求解该问题，从而实现机器手臂的关节重复运动。标签：冗余机械臂；重复运动规划；二次规划；对偶神经网络 4 数值仿真本节以平面六连杆冗余机械臂末端执行器作来回直线运动为例进行计算机仿真验证。直线长度为1m，观察其关节轨迹能否重合。末端执行器的运动周期为8s，关节变量的初始状态为：？兹（0）=（0，-？仔/4，0，？仔/2，0，-？仔/4）T弧度。仿真结果如图1所示，从图1也可以看出，在经过8s周期运动之后，平面六连杆机器手臂的各自关节状态都回到初始状态；仿真结果达到预期的目的，且其最大位置误差不大于1.79×10-6。可见，利用所提出的规划解析方案对带关节物理约束的机械臂进行重复运动规划是可行、有效的。 5 结束语针对平面冗余机械臂重复运动规划问题，文章首先将机械臂重复运动问题转化为一个二次型规划问题，该二次规划方案可避开传统的伪逆解析方案难以求逆的问题，然后利用一种简单对偶神经网络来求解该含不等式约束的二次规划问题，该实现算法具有并行性、快速实时处理能力和电路实现性。 6 致谢感谢中山大学张雨浓教授提供相关源程序。参考文献 [1]Malysz P，Sirouspour S.A kinematic control framework for single-slave asymmetric teleoperation systems. IEEE Transactions on Robotics，2011，27（5）：901-917. [2]张智军，张雨浓.重复运动速度层和加速度层方案的等效性[J].自动化学报，2013，39（1）：88-91. [3]Zhang Y N，Xie L，Zhang Z J，Li K N，Xiao L.Real-time joystick control and experiments of redundant manipulators using cosine-based velocity mapping. Proceedings of the 2011 IEEE International Conference on Automation and Logistics.

机器人神经网络控制汇总

(1) 第一部分机器人手臂的自适应神经网络控制机器人智能控制的研究非常热门，并已取得相当丰富的成果。机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩, 机器人的位置、速度等状态变量跟踪给定的理想轨迹。与一般的机械系统一样, 当机器人的结构及其机械参数确定后，其动态特性将由动力学方程即数学模型来描述。因此，可采用经典控制理论的设计方法一一基于数学模型的方法设计机器人控制器。但是在实际工程中，由于机器人模型的不确定性，使得研究工作者很难得到机器人精确的数学模型。采用自适应神经网络，可实现对机器人动力学方程中未知部分的精确逼近，从而实现无需建模的控制。下面将讨论如何利用自适应神经网络和李雅普诺夫(Lyapunov )方法设计机器人手臂跟踪控制的问题。 1、控制对象描述: 选二关节机器人力臂系统(图 1)，其动力学模型为: 图1 二关节机器人力臂系统物理模型 M (q )q+V (q,d )q+G (q ) + F(q)+ T 其中 M (q )屮 1"P ；"2P 3COSq 2 P2+ P 3COSq2］，V (q , q )斗一 P q q 2Sinq 2 L P2+P 3cosq 2 P 2 」 L 9361 Sinq 2 机器人是一具有高度非线性和不确定性的复杂系统, 近年来各研究单位对使得 -P 3仙1 +q 2)sin q 2 P 2

6计鶯：鶯?］，FZsgnq …W 0.2血。其中，q 为关节转动角度向量，M （q ）为2乘2维正定惯性矩阵，V （q q ）为 2乘2维向心哥氏力矩，G （q ）为2维惯性矩阵，F （q ）为2维摩擦力矩阵，T 为未知有界的外加干扰， T 为各个关节运动的转矩向量，即控制输入。已知机器人动力学系统具有如下动力学特性: E T (M(q)-2C(q ,q ))E = 0 我们取 P =〔Pi, P 2, P 3, P 4, P ＞〔2.9, 0.76, 0.87, 3.04, ，两个关节的位置指令分别为q id =0.1sin （t ）, q 2d=0.1coSt ），即设计控制器驱动两关节电机使对应的手臂段角度分别跟踪这两个位置指令。 2、传统控制器的设计及分析: 定义跟踪误差为: e (t ) = qd (t )— q(t ) 定义误差函数为: r =e +A e 其中八=A T > 0。贝U q=-r+q d + Ae 特性 1：惯量矩阵M （q ）是对称正定阵且有界; 特性 2：矩阵V （q q ）有界; 特性 3： M （q ）-2C （q,q ）是一个斜对称矩阵，即对任意向量，有特性 4:未知外加干扰 T 满足 T - b d ，b d 为正常数。 (4)

一种递归模糊神经网络自适应控制方法

一种递归模糊神经网络自适应控制方法毛六平,王耀南,孙　炜,戴瑜兴 (湖南大学电气与信息工程学院,湖南长沙410082) 摘　要:　构造了一种递归模糊神经网络(RFNN ),该RFNN 利用递归神经网络实现模糊推理,并通过在网络的第一层添加了反馈连接,使网络具有了动态信息处理能力.基于所设计的RFNN ,提出了一种自适应控制方案,在该控制方案中,采用了两个RFNN 分别用于对被控对象进行辨识和控制.将所提出的自适应控制方案应用于交流伺服系统,并给出了仿真实验结果,验证了所提方法的有效性. 关键词:　递归模糊神经网络;自适应控制;交流伺服中图分类号:　TP183 文献标识码:　A 文章编号:　037222112(2006)1222285203 An Adaptive Control Using Recurrent Fuzzy Neural Network M AO Liu 2ping ,W ANG Y ao 2nan ,S UN Wei ,DAI Y u 2xin (College o f Electrical and Information Engineering ,Hunan University ,Changsha ,Hunan 410082,China ) Abstract :　A kind of recurrent fuzzy neural network (RFNN )is constructed ,in which ,recurrent neural network is used to re 2alize fuzzy inference temporal relations are embedded in the network by adding feedback connections on the first layer of the network.On the basis of the proposed RFNN ,an adaptive control scheme is proposed ,in which ,two proposed RFNNs are used to i 2dentify and control plant respectively.Simulation experiments are made by applying proposed adaptive control scheme on AC servo control problem to confirm its effectiveness. K ey words :　recurrent fuzzy neural network ;adaptive control ;AC servo 1　引言近年来,人们开始越来越多地将神经网络用于辨识和控制动态系统[1～3].神经网络在信号的传播方向上,可以分为前馈神经网络和递归神经网络.前馈神经网络能够以任意精度逼近任意的连续函数,但是前馈神经网络是一个静态的映射,它不能反映动态的映射.尽管这个问题可以通过增加延时环节来解决,但是那样会使前馈神经网络增加大量的神经元来代表时域的动态响应.而且,由于前馈神经网络的权值修正与网络的内部信息无关,使得网络对函数的逼近效果过分依赖于训练数据的好坏.而另一方面,递归神经网络[4～7]能够很好地反映动态映射关系,并且能够存储网络的内部信息用于训练网络的权值.递归神经网络有一个内部的反馈环,它能够捕获系统的动态响应而不必在外部添加延时反馈环节.由于递归神经网络能够反映动态映射关系,它在处理参数漂移、强干扰、非线性、不确定性等问题时表现出了优异的性能.然而递归神经网络也有它的缺陷,和前馈神经网络一样,它的知识表达能力也很差,并且缺乏有效的构造方法来选择网络结构和确定神经元的参数. 递归模糊神经网络(RFNN )[8,9]是一种改进的递归神经网络,它利用递归网络来实现模糊推理,从而同时具有递归神经网络和模糊逻辑的优点.它不仅可以很好地反映动态映射关系,还具有定性知识表达的能力,可以用人类专家的语言控制规则来训练网络,并且使网络的内部知识具有明确的物理意义,从而可以很容易地确定网络的结构和神经元的参数. 本文构造了一种RFNN ,在所设计的网络中,通过在网络的第一层加入反馈连接来存储暂态信息.基于该RFNN ,本文还提出了一种自适应控制方法,在该控制方法中,两个RFNN 被分别用于对被控对象进行辨识和控制.为了验证所提方法的有效性,本文将所提控制方法用于交流伺服系统的控制,并给出了仿真实验结果. 2　RFNN 的结构所提RFNN 的结构如图1所示,网络包含n 个输入节点,对每个输入定义了m 个语言词集节点,另外有l 条控制规则节点和p 个输出节点.用u (k )i 、O (k ) i 分别代表第k 层的第i 个节点的输入和输出,则网络内部的信号传递过程和各层之间的输入输出关系可以描述如下: 第一层:这一层的节点将输入变量引入网络.与以往国内外的研究不同,本文将反馈连接加入这一层中.第一层的输入输出关系可以描述为:O (1)i (k )=u (1)i (k )=x (1)i (k )+w (1)i (k )?O (1)i (k -1), i =1,…,n (1) 之所以将反馈连接加入这一层,是因为在以往的模糊神经网络控制器中,控制器往往是根据系统的误差及其对时间的导数来决定控制的行为,在第一层中加入暂态反馈环,则只需要以系统的误差作为网络的输入就可以反映这种关系,这样做不仅可以简化网络的结构,而且具有明显的物理意义,使收稿日期:2005207201;修回日期:2006206218 基金项目:国家自然科学基金项目(N o.60075008);湖南省自然科学基金(N o.06JJ50121) 　第12期2006年12月电子学报 ACT A E LECTRONICA SINICA V ol.34　N o.12 Dec.　2006