基于神经网络的机器人模型辨识-自动化专业

基于神经网络的机器人模型辨识-自动化专业
基于神经网络的机器人模型辨识-自动化专业

第二章 神经网络

2.1神经网络基础

人的大脑中有众多神经元,它们连接在一起组成复杂的神经网络,因此大脑拥有高级的认知能力。人工神经网络实际上是对人大脑处理信息方法的简单化。 2.1.1神经网络概述

神经网络是推广众多简单处理单元构成的一种非线性动力学系统,能够大规模地进行信息分布式存储和并行处理。同时神经网络具有自学习的能力,当外界的环境发生了改变,神经网络经过训练能够在外界信息的基础上自动调整内部结构,对于给定的输入可以得到期望输出。

由图可知,神经元是一种性质为多输入单输出的系统,是由n 个输入i x 和一个输出j y 组成。

图2-1 神经元结构

j u :第j 个神经元的状态;

j :第j 个神经元的阈值;

i x :第i 个神经元的输入信号;

ji w :第i 个神经元到第j 个神经元的连接权系数;

其中:激发状态时ji w 取正数,抑制情况下ji w 取的是负值;

j s :第j 个神经元的外部输入信号。 输出可以表示为 1n

j ji i j j i Net w x s θ==+-∑ (2.1)

()j j u f Net = (2.2)

()()j j j y g u h Net == (2.3)

一般(.)g 是单位映射,也就是说()j j g u u = 。

j Net 表示第j 个神经元的输入; (.)f 表示第j 个神经元的激励函数;

(.)g 表示第j 个神经元的输出函数。

激活函数往往采用这三种函数: (1)二值函数(阈值型): 1,0()0,0x f x x >?=?≤?

(2.4)

(2) S 型函数:

1

()1x f x e

α-=

+,0()1f x << (2.5)

(3)双曲正切函数:

1()1x

x

e f x e

αα---=+,1()1f x -<< (2.6) 2.1.2神经网络的分类

以连接方式对神经网络可分为两大类:一是没有反馈的前向网络,二是相互结合型网络(含有反馈网络)[10]。 (1)前向神经网络

每层的神经元仅仅会接受源于上一层神经元的输入,结构如图2-2:

输入层隐含层输出层

图2-2前向网络

(2)反馈型神经网络

如下图2-3所示,任一个神经元既能接收前一层节点的输入,也能接收后面节点的反馈输入。

图2-3反馈型神经网络

2.1.3神经网络的特性

(1)具有学习和自适应性。

神经网络是先通过系统实际数据以达到训练网络的目的。在经过训练之后,后期如果输入中无训练时的数据情况下,网络也可以完成辨识功能。这个功能特性在预测分析趋势方面上有重大意义和广泛应用。

(2)非线性特性。

神经网络能够对任意的非线函数进行趋近,所以一般将其用于复杂的非线性系统当中。

(3)高速寻优特性。

在复杂问题中,如果要找到一个最优解,一般要通过繁重的计算量,然而通过神经网络,就可能快速得到优化解,这样比其他方法快捷实用。 (4)硬件处理。

神经网络除了可以通过软件,还能借助硬件来达到并行处理的目的。

2.2神经网络基础

2.2.1单神经元感知器

单层感知器只有一个神经元模型,如图2-2显示:

图2-2单层神经元感知器

n 个输入构成的输入向量X ,[]1

2

T

n X x x x =

神经元的净输入表示为:

1n

i i i Net w x θ==-∑ (2.7)

当感知器的激发函数取阈值型函数时,此时,神经元的输出为:

10

()00Net y Net Net >?=?≤?

(2.8)

激活函数采用值域为[-1,+1]的符号函数时,输出取:

1,0

()1,0Net y Net Net +≥?=?-

(2.9)

如果把偏置θ也看为权值,那么感知器的矢量形式可以表示为:

T Net w X = (2.10)

感知器将X 分成1χ和2χ两种,以激活函数取符号函数为例:若感知器输出是

1+,就把[]12,,...,m X x x x =表示的点放入1χ类,同样,输出是1-的话,就分入2χ类。

如果1χ和2χ可分的话,那么方程10n

i i i w x θ=-=∑就定义了一个n 维空间上的超

平面(处在二维空间时超平面是一条直线),这个方程叫作线性方程。若这两类输入向量能通过超平面区开,就是线性可分,否则是不可分。

一些具有非线性可分的集合分类问题大大超出了感知器的计算能力,也就是说感知器只能在简单分类问题上发挥作用。 2.2.2多层感知器

实质上是在输入层和输出层中间增加一个或者多个隐含层。输入向量从外部进到第一层中,然后该层的各个神经元的输出会被传递到第二层各神经元,依次类推,直至网络的输出。其结构如图2-2所示。

输入层隐含层输出层

图2-2多层感知器结构图

每一个神经元都能由单个的M-P 模型来表示,采用的激活函数中比较常用的为Sigmoid 函数:

1

()1Net

y Net e β-?=

+ (2.11)

式中:0β>,是用来控制函数上升的陡峭程度,一般常取1β=使得函数简单化。

因为 Sigmoid 函数是可微的,这就使得通过权值向量调整的自适应算法成为可能。感知器的训练算法使用δ规则,若有目标向量,经过有限时间的训练后,能够收敛至正确的目标向量。训练学习结束以后,样本的模式是通过权值、阈值的形式存储在网络中。 多层感知器网络特点:

(1) 层跟层之间是有联系的,第l 层的任何的一个节点和第1l +层的任一个节点为前馈相连的。

(2)输入层有n 个节点,它仅被用来获取外部信息的,因为其自身是没有函数处理这一能力的。

(3) 信息在层跟层中的传递是有目的性的,信息传递在同层之间无影响的,只会对下一层神经元产生影响。 2.2.3 BP 神经网络

BP 网络的学习过程: (1)信号的正向传输; (2)偏差的反向传播。

图2-3 BP 神经网络结构图

在进行正向传输阶段时,输入样本数据在经过各个隐层逐一处理之后,最后向输出层传播。把输出层实际输出和期望输出相比较,如果这两个输出值不相等的话,则会步入反向传输阶段。反向传播过程的意义是把误差以某种形式,经由隐含层再到输入层逐层传播,最后把输出误差平均分到各层的全部单元,得出各层神经元的误差信号,这个信号就是修正各个神经元连接权值的依据[11]。

上面所说的两个过程不断循环往复,直至网络输出的误差达到要求,或者是到达规定的学习次数就可以结束训练。

(1)前向传输过程

为了方便计算,采用Sigmoid 函数,其表达式为:

1

()1Net f Net e

-=

+

(2.12) 其导数为:

'()

()()(1())df Net f Net f Net f Net dNet

=

=- (2.13) 根据上面的公式:

网络第l 层第j 个节点的输入:

1

,,,1,0,

1,2l N l j l j i l i i Net w u l --===∑ (2.14)

输出,l j u 为:

1,,,1,0l N l j

l j i l i i u f w u --=??

=????

∑ (2.15)

其中:,l j u 是第l 层第j 个节点的输出;

,,l j i w 是第1l -层中第i 个节点和第l 层中第j 个神经元节点的连接权值; (2)偏差的反向传播

网络的输出和期望输出不尽相同的情况下,偏差E 产生,表示为:

1

P

p p E E ==∑ (2.16)

其中:P 是所训练样本的个数;

()2,1

1()()2L

N p L q p q p q E u x d x ==-∑

()j p d x :训练样本p x 在第j 个输出节点的期望输出;

L N :输出层节点的个数。

将上面公式展开到隐层:

1

12

2,,1,101()2N N p j i i q p q i E f w u d x ==????

=-

??????

?

∑∑ (2.17) 进而再把上面的式子展开到输入层:

0112

2,,1,,1001()2N N N p j i j i i q p q i i E f w f w x d x ===????

??=?-

????? ??????

?

∑∑∑ (2.18)

从上面那个公式,我们能够得到,网络输出的偏差是关于权值,,l j i w 的函数,所以调节偏差能够采用调整权值的手段。权值调节是根据使偏差逐渐减小为规则的,也就是让权值的变化量和误差的梯度下降成为正比,即:

,,,,l j i l j i E

w w η

??=-?

(2.19)

其中,η叫作学习率,表示比例系数,(0,1)η∈。调节之后的权值是

,,,,,,(1)()()l j i l j i l j i w k w k w k +=+?

推导如何得到式子(2.19)的理论过程。

由式(2.16),有

1,,,,P p p l j i l j i

E E

w w =??=??∑ (2.20) 借由链式求导规则:

,,,,,,p p

l j

l j i

l j l j i

E E u w u w ???=

?

??? (2.21)

考虑右端第二个因子,由式(2.17)有:

()11

,,,1,0,,,,'',,1,1,,1,0 l l N l j l j k l k k l j i

l j i N l j k l k l i l j l i

k u f w u w w f w u u f u u ---=---=????

= ?????

??== ???

∑∑ (2.22)

把公式(2.13)代进入式子(2.20),得到: (),,,1,,,1l j l j l j l i l j i

u u u u w -?=-? (2.23) 对于

,p l j

E u ??这一项,定义,,,p p l j l j

E u δ?=-

?为广义偏差以方便说明。这一项的计算

过程可以看作是系统偏差进行反向传播的过程。

起初,由定义 2,1

1()()2L

N p L q p q p q E u x d x =??=-??∑ ,能直接得到输出层的,,p L j δ,有:

,,,,()()p p L q q p L q p L q

E d x u x u δ?=-

=-? (2.24)

在第l 个隐含层,有: (2.25)

由公式(2.25)得到:如果想要求出第l 层的广义偏差,就要先得到下一层的广义偏差,依次类推一直到输出层。 用三层BP 神经网络当例子:

由式(2.24),,2,2,()()p m m p m p d x u x δ=-,得到隐含层的,1,p j δ为:

2

,1,2,2,2,2,,1

(()())(1)N p j m p m p m m m j m d x u x u u w δ==-?-?∑ (2.26)

下面是权值调整的思路:

从隐到输出层:

()2,,,2,2,2,1,11P

q j p q q q j

p w u u u ηδ=?=-∑ (2.27)

其中: 120,1,2,

,;1,2,j N q N ==

从输入层到隐层:

1

1

11

1,,,1

,1,,1,,,101,,'1,,,1,,,1001,1, l l l

l N p p l m p l j m l j

l m

l j

N N p

l m k l k m k l m l j N N p l m k l k l m k l k m k k l m

j E E u u u u E f w u u u E f w u w u u u δ++++=++==+++===+???=-

=-?

?????????=-? ?

???????????=-?? ?????∑

∑∑∑∑11

,1,1,1,1,,1(1)l N N p l m l m l m l m j

m u u w δ+++++=?? ???=?-?∑∑

()1,,,1,1,1,0,1

1P

j i p j j j i

p w u u u ηδ=?=-∑ (2.28)

其中:010,1,2,

,;1,2,,i N j N ==

对上述公式几点说明:

1)式子(2.27)还有(2.28)当中的(),,1l j l j u u -项,它的激活函数取的是

Sigmoid 类型,如果激活函数想取为别的类型的时候,由式子1'

,,1,0l N l j k l k k f w u --=?? ???

∑求;

2)当激活函数为Sigmoid 型时,权值的调节方法是:

(),,,,,,,1,11,,,,,1P P p

l j l j i

p l j l j l j l i p p l j i l j l j i

E u E w u u u w u w ηηδ-==????=-=-?=-???∑∑ (2.29)

输出层:(l L =)

,,,()()p L j j p L j p d x u x δ=- (2.30)

隐含层:(1,2,,1l L =-)

1

,,,1,1,1,1,,1

(1)l N p l j p l m l m l m l m j m u u w δδ+++++==?-?∑ (2.31)

权值调整公式为:

,,,,,,,,1,1(1)()(1)P

l j i l j i p l j l j l j l i p w k w k u u u ηδ-=+=+?-∑ (2.32)

BP 算法中,每个层的权值调节的形式基本上都差不多。该学习算法本质是把训练样本的输入输出问题变化为逼近非线性函数的问题。

在解决难题时,怎样选择参数并确定这个参数是合适的,能够作为网络结构是个大问题,这就需要我们在实际问题中通过不断地尝试修改隐层和隐含层节点数目。

(3) 影响因素和一般改进方法

对训练有较大影响的因素:

1)初始权值 :权系数一般初始化为小的随机数。

2)激发函数: 激发函数对训练样本从而更新权值有重要的影响,在Sigmoid 函数输入接近1的时候,它的导数也就和0相近,这样就容易发生饱和,减缓了权值更新的速度。

3)学习率: η较大的话,网络可以快速达到收敛 ,但是这样会网络出现振荡的现象;但是如果学习率的值取的较小的话,网络收敛会很缓慢,这样增加了网络了计算时间。如何选取较好学习率没有固定说法,一般遵循经验来定:η和该神经元节点总输入的平均成反比。

最常用的改进办法是给它增加一个惯性项,这样权值更新公式为:

,,,,,,,,,,(1)()(()(1))

l j i l j i l j i l j i l j i

E

w k w k w k w k w η

α?+=-+--?(2.33)

其中: 01α<<

加惯性项的作用:使得当前梯度保持和前一次调整方向相同,也能够消除因为在误差曲面陡变部分造成的错误调整。通过添加惯性项叫作标准BP 算法。 (4)编程实现步骤

第一步:对神经网络的连接权系数和阈值、学习率η进行初始化。权值取较小的随机数;η一般取[0,1]中间的较小数;达到最大的学习次数或 min E E ≤,停止算法学习。

第二步:计算各层的输入和输出。

第三步:通过公式(2.17)来计算网络的输出误差。

第四步:通过公式(2.20)和(2.31),计算得出每个层的偏差信号,获得

,,p l j δ。

第五步:通过公式(2.32)调节各层权值。

第六步:是否满足min E E ≤,满足则算法结束,不然就回到第二步。

第三章 系统辨识

3.1辨识原理

辨识是以试验测量得到的输入和输出数据为依据,由规定的一组模型中,确定一个跟所测量系统等价的模型[12]。系统辨识要素含有: (1)数据:能测量到的输入、输出数据。 (2)模型类:在一定范围内寻觅模型。

(3)等价准则:模型和被测的系统通过相同标准应该是等价的。

因为在实际当中找到一个跟被测系统完全等价的模型是不可能的,所以,辨识本质上来说就是按某一种准则,从一组已经知道的模型类当中选择一个模型,使之能最好地拟合实际过程的动态或者静态特性。

3.2辨识步骤

通过上述内容对系统辨识进行简单的了解,我们知道在系统模型结构根据经验确定了之后,剩下需要解决的问题主要就是对于模型中的未知参数进行估计

[13]

。系统辨识实验设计主要步骤:

(1)获取系统输入输出数据 (2)实验输入信号的选择

实验进行当中要求信号是持续激励的,同时选择输入信号时也要对系统安全运行进行考虑。 (3)采样间隔的设计

采样间隔△太大的话,系统辨识的精准度就会降低,可能达不到我们对网络的要求。如果选取的值太小,则会增加存储量使得计算量繁重。 一般经验规则是

5~15oc T ?≈ (3.1)

其中,oc T 叫作系统过渡时间的95% ;

另一个规则是:

(0.05~1)a T ?≈ (3.2)

a T 叫作该系统的主要时间常数。

(4)误差准则的选择

偏差准则定义为判断模型是否相接近系统的标准,一般用误差的泛函来表示:

1(())L

k J f e k ==∑ (3.3)

其中,()f ?是关于()e k 的函数,而()e k 是定义在[]1,L 上的误差函数,常用的是平方函数:

()()()2||||f e k e k = (3.4)

此刻的偏差e (k )说的是广义偏差。 1)输出误差准则

?()()y(

)e k y k k =- (3.5) 上式:()y k 是实际系统的输出;

?()y

k 是模型的输出。 若把系统模型的形式取脉冲传递函数

11

1()

()()

B q G q A q ---= (3.6)

注:11()1...n n A q a q a q --=+++,11212()...m m B q b q b q b q ----=+++ 那么输出误差是

11()

()()()()

B q e k y k u k A q --=- (3.7)

误差准则函数表示为

2

11

1()()()()L

k B q J y k u k A q --=??=-????

∑ (3.8) 2)输入误差准则 定义输入误差:

[]1??()()()()()e k u k u

k u k P y k -=-=- (3.9)

注明:?()u

k 是产生输出()y k 的模型输入;1?P -表示模型可逆。 3)广义误差准则 广义误差被定义是:

121

??()[()][()]e k P y k P u k -=- (3.10) 上式当中,112??,P P -叫作广义模型; 2

?P 是可逆的。 3.3经典辨识方法

古典的系统辨识方法一般是在连续时间性的输入信号下,观察被辨识系统对此做出的输出响应,再通过这些输出响应特性解出系统模型的参数[14],这就表明辨识问题实际上是对系统模型参数的求取问题。 3.3.1最小二乘法

在线性定常系统,利用最小二乘法能够完成快速的辨识。最小二乘法工作原理是通过极小化广义误差的平方和函数来确定系统模型的参数[14],线性系统一般可以通过一定的数字转变成最小二乘格式,但这样就要求要有已知输人信号,且信号的变化要多。所以这个方法在实际生活中没办法直接使用。 设单输入单输出系统的数学模型:

11()()()()()A z z k B z u k e k --=+ (3.11)

其中,()u k 和()z k 是系统的输入输出量;()e k 是噪声;

112

12112

12()1...()1...a a b b n n n n A z a z a z a z

B z b z b z b z --------?=++++??=++++?? (3.12)

先设定模型阶次a n 和b n ,当两者取值相同时,式(3.11)改为最小二乘格式

()()()T z k h k e k θ=+ (3.13)

式中:

1212()[(1),...,(),(1),...,()]

[,,...,,,,...,]a a T

a b T

n n h k z k z k n u k u k n a a a b b b θ?=------??=??

(3.14)

()z k 和()h k 是能够观测出来的数据,θ是待估计的参数值;

准则函数取:

[]2

2

1

1

()()()()()()L

L

T

T

L L L L k k J e k z k h k z H z H θθθθ==??==-=--??

∑∑ (3.15) 如果要得到θ的估计值,需要对()J θ极小化,这样的话模型的输出就能够相对准确地预测出系统输出。

设?LS θ能让?()min LS

J θθ=,那么

?()

()()0LS

T L L L L J z H z H θθθθθ

θ

??

=

--=?? (3.16) 利用下面向量微分公式 ()T

T a x a x

?=? (3.17a )

()2T

T x Ax x A x

?=? (3.17b) A 为对称阵

再展开式(3.16),得到正则方程

?()T T L L LS L L

H H H z θ= (3.18) T L L H H 是正则矩阵时,有

1?()T T LS L L L L

H H H z θ-= (3.19) 因此满足公式(3.19)的?LS

θ使得?()min LS

J θθ=,且该值唯一。通过上面式子

(3.15)理论算出?LS θ的方法被叫作最小二乘法,?LS θ就被称为最小二乘估计值。 3.3.2极大似然估计法

极大似然估计是以观测数据和未知参数一般具有随机统计特性这一特性为基础,然后引入观测量的条件概率密度,建立一个以量测数据和未知参数作为自变量的似然函数,估计准则是选取观测值出现的概率最大,以此获取系统统模型的参数估计

[15]

3.3.3 经典辨识方法不足

(1)计算量比较大,容易得到局部极小值。

(2)传统的系统辨识方法在线性系统中能得到很好的应用,然而在处理非线性系统问题就显得苍白无力。

(3)系统的结构和参数不容易被准确确定,得到的模型精度也不是很高,不一定能满足我们的要求。

3.4神经网络辨识

以神经网络为基础的辨识,可以理解为通过一个合理的神经网络以达到趋近于实际系统的目的。 3.4.1神经网络模型辨识结构

神经网络建立模型主要分为两类:正向和逆向建模。

神经网络辨识的过程:在确定模型结构以后,通过已知的被辨识系统的输入输出数据,经过训练学习神经网络会不断调整权值,使给定的误差准则函数最

优,如此得到的网络就是被辨识系统的正模型?P

或逆模型1?P -。辨识是根据辨识模型系统进程的输出误差,利用神经网络的学习算法对网络的参数进行调整,过程一直进行到参数收敛到期望值为止[16]。

在?P

辨识中,误差准则函数就是和输出误差有关的函数:

2211

?()(()()())22

J e k y k v k y

k ==+- (3.20) 在逆模型1?P -辨识中,误差准则函数是和输入误差相关: 2221111??()(()())()(()())222

J e k u k u k u k P y k v k -??==-=-+?? (3.21) 其中,()v k 为系统输出端的干扰和白噪声。

图3-1 NN对系统正模型辨识原理图(串并联型)

v(k)

图3-2 NN对系统逆模型辨识结构图(并联型)

3.4.2非线性动态系统的神经网络辨识

依据模型的表示方式不同分为前向建模和逆模型法两类。

(1)前向建模

通过训练神经网络以逼近非线性系统,使其能够表达系统前向动力学模型。结构图如图3-3示意。

将系统的实际输出和网络输出形成的误差作为网络训练的信号,所以说,该过程是有导师学习过程,导师指的是实际系统,它为神经网络提供了算法学习必需的期望输出[17]。

图3-3 前向建模结构图

TDL :表示延迟抽头。

考虑到被辨识的系统是动态的,是以,该怎么对这个系统进行建模就成为亟待解决的问题。动态系统的建模方法主要有两个:一个是把动力环节引到网络自身。还有一个办法就是把输入、输出的滞后信号给它加到网络输入中来,从而模拟一种动态系统[18]。

人们一般会选择BP 学习算法或在BP 的基础上对该动力学模型做一定的改进。

选取非线性离散时间系统作为被辨识对象:

()()()()()()1,

,1,,1,

,1y k f y k y k n u k u k u k m +=-+--+????

(3.22) 从上面公式可以看出:

(),(1),...,(1),(),(1),...,(1)u k u k u k m y k y k y k n --+--+是网络的输入,(1)

y k +作为系统输出。

记N y 是神经网络的输出:

()()()()()?1,,1,,

,1N y k f y k y k n u k u k m +=-+-+???

?

(3.23)

?f :神经网络的输入输出非线性映射。

这个时候网络的输入就含有之前时间实际系统的输出:

()()()

--+

y k y k y k n

,1,,1

通过上述方法得到的模型,u是经由前向网络传播后获取y。对于同一个非线性动态系统,会有许多神经网络结构可以用来逼近这个系统模型。

然而,前向建模过程中没有办法表现出对系统有干扰的部分。

(2)逆模型法

逆建模方法一般分为两种:直接逆建模、正-逆建模。

如图3-4,直接逆建模实现结构图:

该方法比较简单,把辨识系统的输出当作网络的输入部分,再把网络输出和系统的输入这两者进行对比,将比较得出的误差用来进行训练[19],这样就能够建立出系统的逆模型。

图3-4逆模型结构图

直接逆模型建模方法不适合广泛地在实际中应用,它的不足之处在于:

1)一般无法确定实际工作时的输入信号,而且控制信号是针对其中一个过程来说的,那么,对于期望得到的输出就不可能得到了。

2)因为并不是所有的非线性系统都是可逆的,那么这样的话,建立的模型就不准确。

为了解决得不到期望输出的问题,我们可以在系统稳定工作的状况下,增加一个范围较小的随机输入信号。

3.4.3神经网络辨识优点

(1)建模时不需要有函数的具体表达形式。神经网络作为辨识器,可以经由内部的连接权值对参数进行调节。

9.7 机器人神经网络自适应控制

声明:应部分读者的要求,本书第9章增加“机器人神经网络自适应控制”一节,图序、公式序顺延。 9.7 机器人神经网络自适应控制 机器人学科是一门迅速发展的综合性前沿学科,受到工业界和学术界的高度重视。机器人的核心是机器人控制系统,从控制工程的角度来看,机器人是一个非线性和不确定性系统,机器人智能控制是近年来机器人控制领域研究的前沿课题,已取得了相当丰富的成果。 机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩,使得机器人的位置、速度等状态变量跟踪给定的理想轨迹。与一般的机械系统一样,当机器人的结构及其机械参数确定后,其动态特性将由动力学方程即数学模型来描述。因此,可以采用自动控制理论所提供的设计方法,采用基于数学模型的方法设计机器人控制器。但是在实际工程中,由于机器人是一个非线性和不确定性系统,很难得到机器人精确的数学模型。 采用神经网络,可实现对机器人动力学方程中未知部分的精确逼近,从而实现无需建模的控制。本节讨论如何利用神经网络控制和李雅普诺夫(Lyapunov )方法设计机器人轨迹跟踪控制的问题,以及如何分析控制系统的稳定性和收敛性。 9.7.1 机器人动力学模型及其结构特性 n 关节机械手动态方程可表示为: ()()()(),d ++++=M q q V q q q G q F q ττ (9.30) 其中,n R ∈q 为关节转动角度向量,()M q 为n n ?维正定惯性矩阵,(),V q q 为n n ?维向心哥氏力矩,()G q 为1?n 维惯性矩阵,()F q 为1?n 维摩擦力,d τ为未知有界的外加干扰,n R ∈τ为各个关节运动的转矩向量,即控制输入。 机器人动力学系统具有如下动力学特性: 特性1:惯量矩阵M(q)是对称正定阵且有界; 特性2:矩阵(),V q q 有界; 特性3:()()2,-M q C q q 是一个斜对称矩阵,即对任意向量ξ,有 ()()()2,0T -=ξ M q C q q ξ (9.31)

基于神经网络的机器人模型辨识-自动化专业

第二章 神经网络 2.1神经网络基础 人的大脑中有众多神经元,它们连接在一起组成复杂的神经网络,因此大脑拥有高级的认知能力。人工神经网络实际上是对人大脑处理信息方法的简单化。 2.1.1神经网络概述 神经网络是推广众多简单处理单元构成的一种非线性动力学系统,能够大规模地进行信息分布式存储和并行处理。同时神经网络具有自学习的能力,当外界的环境发生了改变,神经网络经过训练能够在外界信息的基础上自动调整内部结构,对于给定的输入可以得到期望输出。 由图可知,神经元是一种性质为多输入单输出的系统,是由n 个输入i x 和一个输出j y 组成。 图2-1 神经元结构 j u :第j 个神经元的状态; j :第j 个神经元的阈值; i x :第i 个神经元的输入信号; ji w :第i 个神经元到第j 个神经元的连接权系数; 其中:激发状态时ji w 取正数,抑制情况下ji w 取的是负值;

j s :第j 个神经元的外部输入信号。 输出可以表示为 1n j ji i j j i Net w x s θ==+-∑ (2.1) ()j j u f Net = (2.2) ()()j j j y g u h Net == (2.3) 一般(.)g 是单位映射,也就是说()j j g u u = 。 j Net 表示第j 个神经元的输入; (.)f 表示第j 个神经元的激励函数; (.)g 表示第j 个神经元的输出函数。 激活函数往往采用这三种函数: (1)二值函数(阈值型): 1,0()0,0x f x x >?=?≤? (2.4) (2) S 型函数: 1 ()1x f x e α-= +,0()1f x << (2.5) (3)双曲正切函数: 1()1x x e f x e αα---=+,1()1f x -<< (2.6) 2.1.2神经网络的分类 以连接方式对神经网络可分为两大类:一是没有反馈的前向网络,二是相互结合型网络(含有反馈网络)[10]。 (1)前向神经网络

模糊神经网络技术研究的现状及展望

模糊神经网络技术研究的现状及展望 摘要:本文对模糊神经网络技术研究的现状进行了综述,首先介绍了模糊控制技术和神经网络技术的发展,然后结合各自的特点讨论了模糊神经网络协作体的产生以及优越性,接着对模糊神经网络的常见算法、结构确定、规则的提取等进行了阐述,指出了目前模糊神经网络的研究发展中还存在的一些问题,并对模糊神经网络的发展进行了展望。 关键字:模糊控制;神经网络;模糊神经网络 引言 系统的复杂性与所要求的精确性之间存在尖锐的矛盾。为此,通过模拟人类学习和自适应能力,人们提出了智能控制的思想。控制理论专家Austrom(1991)在IFAC大会上指出:模糊逻辑控制、神经网络与专家控制是三种典型的智能控制方法。通常专家系统建立在专家经验上,并非建立在工业过程所产生的操作数据上,且一般复杂系统所具有的不精确性、不确定性就算领域专家也很难把握,这使建立专家系统非常困难。而模糊逻辑和神经网络作为两种典型的智能控制方法,各有优缺点。模糊逻辑与神经网络的融合——模糊神经网络由于吸取了模糊逻辑和神经网络的优点,避免了两者的缺点,已成为当今智能控制研究的热点之一了。 1 模糊神经网络的提出 模糊集理论由美国著名控制论专家L.A.Zadeh于1965年创立[1]。1974年,英国著名学者E.H.Mamdani将模糊逻辑和模糊语言用于工业控制,提出了模糊控制论。至今,模糊控制已成功应用在被控对象缺乏精确数学描述及系统时滞、非线性严重的场合。 人工神经网络理论萌芽于上世纪40年代并于80年代中后期重掀热潮,其基本思想是从仿生学的角度对人脑的神经系统进行功能化模拟。人工神经网络可实现联想记忆,分类和优化计算等功能,在解决高度非线性和严重不确定系统的控制问题方面,显示了巨大的优势和潜力模糊控制系统与神经网络系统具有整体功能的等效性[2],两者都是无模型的估计器,都不需要建立任何的数学模型,只需要根据输入的采样数据去估计其需要的决策:神经网络根据学习算法,而模糊控制系统则根据专家提出的一些语言规则来进行推理决策。实际上,两者具有相同的正规数学特性,且共享同一状态空间[3]。 另一方面,模糊控制系统与神经网络系统具有各自特性的互补性[。神经网络系统完成的是从输入到输出的“黑箱式”非线性映射,但不具备像模糊控制那样的因果规律以及模糊逻辑推理的将强的知识表达能力。将两者结合,后者正好弥补前者的这点不足,而神经网络的强大自学习能力则可避免模糊控制规则和隶属函数的主观性,从而提高模糊控制的置信度。因此,模糊逻辑和神经网络虽然有着本质上的不同,但由于两者都是用于处理不确定性问题,不精确性问题,两者又有着天然的联系。Hornik和White(1989)证明了神经网络的函数映射能力[4];Kosko(1992)证明了可加性模糊系统的模糊逼近定理(FAT,Fuzzy Approximation Theorem)[5];Wang和Mendel(1992)、Buckley和Hayashi(1993)、Dubots和Grabish(1993)、Watkins(1994)证明了各种可加性和非可加性模糊系统的模糊逼近定理[6]。这说明模糊逻辑和神经网络有着密切联系,正是由于这类理论上的共性,才使模糊逻辑和神经网络的结合成为可能。 2 模糊神经网络的学习算法 各种类型的模糊神经网络学习算法的共同方面是结构学习和参数学习两部分。结构学习是指按照一定的性能要求确定模糊系统的推理规则的条数,每条规则的前提和结论的隶属度函数以及由清晰化得到具体的规则数。参数学习是指进一步细化各隶属函数的参数以及模糊规则的其他参数,以使系统达到最优。结构学习主要是从输入输出数据中提取规则或由输入空间模糊划分获得规则,主要有启发式搜索、模糊网格法、树形划分法、基于模糊聚类的学习算

BP神经网络模型应用实例

BP神经网络模型 第1节基本原理简介 近年来全球性的神经网络研究热潮的再度兴起,不仅仅是因为神经科学本身取得了巨大的进展.更主要的原因在于发展新型计算机和人工智能新途径的迫切需要.迄今为止在需要人工智能解决的许多问题中,人脑远比计算机聪明的多,要开创具有智能的新一代计算机,就必须了解人脑,研究人脑神经网络系统信息处理的机制.另一方面,基于神经科学研究成果基础上发展出来的人工神经网络模型,反映了人脑功能的若干基本特性,开拓了神经网络用于计算机的新途径.它对传统的计算机结构和人工智能是一个有力的挑战,引起了各方面专家的极大关注. 目前,已发展了几十种神经网络,例如Hopficld模型,Feldmann等的连接型网络模型,Hinton等的玻尔茨曼机模型,以及Rumelhart等的多层感知机模型和Kohonen的自组织网络模型等等。在这众多神经网络模型中,应用最广泛的是多层感知机神经网络。多层感知机神经网络的研究始于50年代,但一直进展不大。直到1985年,Rumelhart等人提出了误差反向传递学习算法(即BP算),实现了Minsky的多层网络

设想,如图34-1所示。 BP 算法不仅有输入层节点、输出层节点,还可有1个或多个隐含层节点。对于输入信号,要先向前传播到隐含层节点,经作用函数后,再把隐节点的输出信号传播到输出节点,最后给出输出结果。节点的作用的激励函数通常选取S 型函数,如 Q x e x f /11)(-+= 式中Q 为调整激励函数形式的Sigmoid 参数。该算法的学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐含层逐层处理,并 传向输出层。每一层神经元的状态只影响下一层神经

基于神经网络理论的系统安全评价模型

(神经网络,安全评价) 基于神经网络理论的系统安全评价模型 王三明 蒋军成 (南京化工大学,南京,210009) 摘要 本文阐述了人工神经网络基本原理,研究分析了BP神经网络模型的缺陷并提出了优化策略。在此基础上,将神经网络理论应用于系统安全评价之中,提出了基于此理论的系统安全评价模型、实现方法和优点;评价实例证明此方法的可行性。 关键词 神经网络 网络优化 安全评价  1. 引言 人工神经网络模拟人的大脑活动,具有极强的非线形逼近、大规模并行处理、自训练学习、自组织和容错能力等优点,将神经网络理论应用于系统安全评价之中,能克服传统安全评价方法的一些缺陷,能快速、准确地得到安全评价结果。这将为企业安全生产管理与控制提供快捷和科学的决策信息,从而及时预测、控制事故,减少事故损失。   2. 神经网络理论及其典型网络模型 人工神经网络是由大量简单的基本元件-神经元相互联结,模拟人的大脑神经处理信息的方式,进行信息并行处理和非线形转换的复杂网络系统。人工神经网络处理信息是通过信息样本对神经网络的训练,使其具有人的大脑的记忆、辨识能力,完成各种信息处理功能。人工神经网络具有良好的自学习、自适应、联想记忆、并行处理和非线形转换的能力,避免了复杂数学推导,在样本缺损和参数漂移的情况下,仍能保证稳定的输出。人工神经网络这种模拟人脑智力的特性,受到学术界的高度重视和广泛研究,已经成功地应用于众多领域,如模式识别、图象处理、语音识别、智能控制、虚拟现实、优化计算、人工智能等领域。 按照网络的拓扑结构和运行方式,神经网络模型分为前馈多层式网络模型、反馈递归式网络模型、随机型网络模型等。目前在模式识别中应用成熟较多的模型是前馈多层式网络中的BP反向传播模型,其模型结构如图1。 2.1 BP神经网络基本原理 BP网络模型处理信息的基本原理是:输入信号X i通过中间节点(隐层点)作用于输出节点,经过非线形变换,产生输出信号Y k,网络训练的每个样本包括输入向量X和期望输出量t,网络输出值Y与期望输出值t之间的偏差,通过调整输入节点与隐层节点的联接强度取值W ij和隐层节点与输出节点之间的联接强度T jk以及阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数(权值和

神经网络α阶逆系统控制方法在机器人解耦控制中的应用

文章编号 2 2 2 神经网络Α阶逆系统控制方法在机器人解耦控制中的应用Ξ 戴先中孟正大沈建强阮建山 东南大学自动控制系南京 摘要 本文利用神经网络Α阶逆系统线性化解耦能力 将严重耦合的多自由度机械手解耦成多个二阶积分子系统 进一步采用线性系统设计方法对已解耦系统设计闭环控制器 成功地实现了位置快速跟踪 该控制方法不需要知道机器人系统的精确数学模型 并且结构简单 易于工程实现 关键词 机器人 神经网络 逆系统 多变量解耦 中图分类号 ×° 文献标识码 ΡΟΒΟΤΔΕΧΟΥΠΛΙΝΓΧΟΝΤΡΟΛΒΑΣΕΔΟΝΑΝΝ ΑΤΗ?ΟΡΔΕΡΙΝ?ΕΡΣΕΣΨΣΤΕΜΜΕΤΗΟΔ ? ÷ 2 ∞ 2 ≥ ∞ 2 2 ΑυτοματιχΧοντρολΕνγ Δεπτ οφΣουτηεαστΥνι? Ναν?ινγ Αβστραχτ Α 2 √ √ ? ∏ ?? ∏ ≥ ≥ ∏ × √ ∏ ∏ ∏ 2 √ √ ∞? ∏ √ ∏ ? ∏ ∏ ∏ Κεψωορδσ ∏ √ ∏ √ ∏ 1引言 Ιντροδυχτιον 由于多自由度机械手模型的非线性和强耦合性 机械手的轨迹快速跟踪控制一直是控制领域中富有挑战性的课题之一 基于局部线性化理论的传统°?和° ?控制器仅能使得系统在一个很小的工作空间内获得较好的跟踪性能 基于非线性全局线性化理论而提出的计算力矩法由于可以使闭环系统获得完全的解耦和线性化 从而能在整个工作空间中获得良好的跟踪特性 但是计算力矩法所需的模型参数完全准确以及不存在测量误差等条件在工程实际中较难得到满足 为此 一些学者又先后提出了自适应控制等方案 本文利用神经网络Α阶逆系统线性化解耦能力≈ 将严重耦合的多自由度机械手解耦成多个二阶积分子系统 进一步采用线性系统设计方法对已解耦系统设计闭环控制器 成功地实现了位置快速跟踪 2多变量系统的神经网络Α阶逆系统解耦控制方法 ΔεχουπλινγχοντρολμετηοδοφΜΙΜΟσψστεμβασεδονΑΝΝΑτη?ορδεριν?ερσεσψστεμ 考察一个用输入输出微分方程表示的 ρ 个输入Υ ρ个输出Ψ 非线性系统Ε Φ Ψ Α Ψ2 Υ 其中 第 卷第 期 年 月机器人ΡΟΒΟΤ? ∏ Ξ基金项目 国家自然科学基金资助项目 收稿日期

神经网络模型预测控制器

神经网络模型预测控制器 摘要:本文将神经网络控制器应用于受限非线性系统的优化模型预测控制中,控制规则用一个神经网络函数逼近器来表示,该网络是通过最小化一个与控制相关的代价函数来训练的。本文提出的方法可以用于构造任意结构的控制器,如减速优化控制器和分散控制器。 关键字:模型预测控制、神经网络、非线性控制 1.介绍 由于非线性控制问题的复杂性,通常用逼近方法来获得近似解。在本文中,提出了一种广泛应用的方法即模型预测控制(MPC),这可用于解决在线优化问题,另一种方法是函数逼近器,如人工神经网络,这可用于离线的优化控制规则。 在模型预测控制中,控制信号取决于在每个采样时刻时的想要在线最小化的代价函数,它已经广泛地应用于受限的多变量系统和非线性过程等工业控制中[3,11,22]。MPC方法一个潜在的弱点是优化问题必须能严格地按要求推算,尤其是在非线性系统中。模型预测控制已经广泛地应用于线性MPC问题中[5],但为了减小在线计算时的计算量,该部分的计算为离线。一个非常强大的函数逼近器为神经网络,它能很好地用于表示非线性模型或控制器,如文献[4,13,14]。基于模型跟踪控制的方法已经普遍地应用在神经网络控制,这种方法的一个局限性是它不适合于不稳定地逆系统,基此本文研究了基于优化控制技术的方法。 许多基于神经网络的方法已经提出了应用在优化控制问题方面,该优化控制的目标是最小化一个与控制相关的代价函数。一个方法是用一个神经网络来逼近与优化控制问题相关联的动态程式方程的解[6]。一个更直接地方法是模仿MPC方法,用通过最小化预测代价函数来训练神经网络控制器。为了达到精确的MPC技术,用神经网络来逼近模型预测控制策略,且通过离线计算[1,7.9,19]。用一个交替且更直接的方法即直接最小化代价函数训练网络控制器代替通过训练一个神经网络来逼近一个优化模型预测控制策略。这种方法目前已有许多版本,Parisini[20]和Zoppoli[24]等人研究了随机优化控制问题,其中控制器作为神经网络逼近器的输入输出的一个函数。Seong和Widrow[23]研究了一个初始状态为随机分配的优化控制问题,控制器为反馈状态,用一个神经网络来表示。在以上的研究中,应用了一个随机逼近器算法来训练网络。Al-dajani[2]和Nayeri等人[15]提出了一种相似的方法,即用最速下降法来训练神经网络控制器。 在许多应用中,设计一个控制器都涉及到一个特殊的结构。对于复杂的系统如减速控制器或分散控制系统,都需要许多输入与输出。在模型预测控制中,模型是用于预测系统未来的运动轨迹,优化控制信号是系统模型的系统的函数。因此,模型预测控制不能用于定结构控制问题。不同的是,基于神经网络函数逼近器的控制器可以应用于优化定结构控制问题。 在本文中,主要研究的是应用于非线性优化控制问题的结构受限的MPC类型[20,2,24,23,15]。控制规则用神经网络逼近器表示,最小化一个与控制相关的代价函数来离线训练神经网络。通过将神经网络控制的输入适当特殊化来完成优化低阶控制器的设计,分散和其它定结构神经网络控制器是通过对网络结构加入合适的限制构成的。通过一个数据例子来评价神经网络控制器的性能并与优化模型预测控制器进行比较。 2.问题表述 考虑一个离散非线性控制系统: 其中为控制器的输出,为输入,为状态矢量。控制

神经网络预测控制综述

神经网络预测控制综述 摘要:近年来,神经网络预测控制在工业过程控制中不仅得到广泛的应用,而且其理论研究也取得了很大进展。对当前各种神经刚络预测控制方法的现状及其工业应用进行了较深入地分析,并对其存在的问题和今后可能的发展趋势作了进一步探讨。 关键词:神经网络;预测控制:非线性系统;工业过程控制 Abstract: In recent years, neural network predictive control has not only been widely used in industrial process control, but also has made great progress in theoretical research. The current status of various neural network prediction control methods and their industrial applications are analyzed in depth, and the existing question and possible future development trends are further discussed. Keywords: neural network; predictive control: nonlinear system; industrial process control

20世纪70年代以来,人们从工业过程的特点出发,寻找对模型精度要去不高而同样能实现高质量控制性能的方法,预测控制就是在这种背景下发展起的[1]。预测控制技术最初山Richalet和Cutler提出[2],具有多步预测、滚动优化、反馈校正等机理,因此能够克服过程模型的不确定性,体现出优良的控制性能,在工业过程控制中取得了成功的应用。如Shell公司、Honeywell公司、Centum 公司,都在它们的分布式控制系统DCS上装备了商业化的预测控制软件包.并广泛地将其应用于石油、化工、冶金等工业过程中[3]。但是,预测函数控制是以被控对象的基函数的输出响应可以叠加为前提的,因而只适用于线性动态系统控制。对于实际中大量的复杂的非线性工业过程。不能取得理想的控制效果。而神经网络具有分布存储、并行处理、联想记忆、自组织和自学习等功能,以神经元组成的神经网络可以逼近任意的:线性系统。使控制系统具有智能化、鲁棒性和适应性,能处理高维数、非线性、干扰强、难建模的复杂工业过程。因此,将神经网络应用于预测控制,既是实际应用的需要,同时也为预测控制理论的发展开辟了广阔的前景。本文对基于神经网络的预测控制的研究现状进行总结,并展望未来的发展趋势。 l神经网络预测控制的基本算法的发展[4] 实际中的控制对象都带有一定的菲线性,大多数具有弱非线性的对象可用线性化模型近似,并应用已有的线性控制理论的研究成果来获得较好的控制效果。而对具有强非线性的系统的控制则一直是控制界研究的热点和难点。 就预测控制的基本原理而言,只要从被控对象能够抽取出满足要求的预测模型,它便可以应用于任何类型的系统,包括线性和非线性系统。 由于神经网络理论在求解非线性方面的巨大优势,很快被应用于非线性预测控制中。其主要设计思想是:利用一个或多个神经刚络,对非线性系统的过程信息进行前向多步预测,然后通过优化一个含有这些预测信息的多步优化目标函数,获得非线性预测控制律。在实际应用与理论研究中形成了许多不同的算法。如神经网络的内模控制、神经网络的增量型模型算法控制等,近来一些学者对有约束神经网络的预测控制也作了相应的研究。文献[5]设计了多层前馈神经网络,使控制律离线求解。文献[6]采用两个网络进行预测,但结构复杂,距离实际应用还有一定的距离,文献[7]利用递阶遗传算法,经训练得出离线神经网络模型.经多步预测得出对象的预测模型,给出了具有时延的非线性系统的优化预测控制。将神经网络用于GPC的研究成果有利用Tank.Hopfield网络处理GPC矩阵求逆的算法,基于神经网络误差修正的GPC算法、利用小脑模型进行提前计算的GPC 算法、基于GPC的对角递归神经网络控制方法以及用神经网络处理约束情形的预

机器人神经网络控制

第一部分 机器人手臂的自适应神经网络控制 机器人是一具有高度非线性和不确定性的复杂系统,近年来各研究单位对机器人智能控制的研究非常热门,并已取得相当丰富的成果。 机器人轨迹跟踪控制系统的主要目的是通过给定各关节的驱动力矩,使得机器人的位置、速度等状态变量跟踪给定的理想轨迹。与一般的机械系统一样,当机器人的结构及其机械参数确定后,其动态特性将由动力学方程即数学模型来描述。因此,可采用经典控制理论的设计方法——基于数学模型的方法设计机器人控制器。但是在实际工程中,由于机器人模型的不确定性,使得研究工作者很难得到机器人精确的数学模型。 采用自适应神经网络,可实现对机器人动力学方程中未知部分的精确逼近,从而实现无需建模的控制。下面将讨论如何利用自适应神经网络和李雅普诺夫(Lyapunov )方法设计机器人手臂跟踪控制的问题。 1、控制对象描述: 选二关节机器人力臂系统(图1),其动力学模型为: 图1 二关节机器人力臂系统物理模型 ()()()()d ++++=M q q V q,q q G q F q ττ (1) 其中 1232 232232 22cos cos ()cos p p p q p p q p p q p +++??=? ?+??M q ,322 3122312 sin ()sin (,)sin 0p q q p q q q p q q --+?? =???? V q q

41512512cos cos()()cos()p g q p g q q p g q q ++??=??+?? G q ,()()0.02sgn =F q q ,()()0.2sin 0.2sin T d t t =????τ。 其中,q 为关节转动角度向量,()M q 为2乘2维正定惯性矩阵,(),V q q 为2乘2维向心哥氏力矩,()G q 为2维惯性矩阵,()F q 为2维摩擦力矩阵,d τ为 未知有界的外加干扰,τ为各个关节运动的转矩向量,即控制输入。 已知机器人动力学系统具有如下动力学特性: 特性1:惯量矩阵M(q)是对称正定阵且有界; 特性2:矩阵 () ,V q q 有界; 特性3:()()2,-M q C q q 是一个斜对称矩阵,即对任意向量ξ,有 ()()()2,0T -=ξ M q C q q ξ (2) 特性4:未知外加干扰d τ 满足 d d b ≤τ, d b 为正常数。 我们取[][]2 12345,,,, 2.9,0.76,0.87,3.04,0.87p p p p p kgm ==p ,两个关节的位置 指令分别为()10.1sin d q t =,()20.1cos d q t =,即设计控制器驱动两关节电 机使对应的手臂段角度分别跟踪这两个位置指令。 2、传统控制器的设计及分析: 定义跟踪误差为: ()()()d t t t =-e q q (3) 定义误差函数为: =+∧r e e (4) 其中0>∧=∧T 。 则 d =-++∧q r q e

几种神经网络模型及其应用

几种神经网络模型及其应用 摘要:本文介绍了径向基网络,支撑矢量机,小波神经网络,反馈神经网络这几种神经网络结构的基本概念与特点,并对它们在科研方面的具体应用做了一些介绍。 关键词:神经网络径向基网络支撑矢量机小波神经网络反馈神经网络Several neural network models and their application Abstract: This paper introduced the RBF networks, support vector machines, wavelet neural networks, feedback neural networks with their concepts and features, as well as their applications in scientific research field. Key words: neural networks RBF networks support vector machines wavelet neural networks feedback neural networks 2 引言 随着对神经网络理论的不断深入研究,其应用目前已经渗透到各个领域。并在智能控制,模式识别,计算机视觉,自适应滤波和信号处理,非线性优化,语音识别,传感技术与机器人,生物医学工程等方面取得了令人吃惊的成绩。本文介绍几种典型的神经网络,径向基神经网络,支撑矢量机,小波神经网络和反馈神经网络的概念及它们在科研中的一些具体应用。 1. 径向基网络 1.1 径向基网络的概念 径向基的理论最早由Hardy,Harder和Desmarais 等人提出。径向基函数(Radial Basis Function,RBF)神经网络,它的输出与连接权之间呈线性关系,因此可采用保证全局收敛的线性优化算法。径向基神经网络(RBFNN)是 3 层单元的神经网络,它是一种静态的神经网络,与函数逼近理论相吻合并且具有唯一的最佳逼近点。由于其结构简单且神经元的敏感区较小,因此可以广泛地应用于非线性函数的局部逼近中。主要影响其网络性能的参数有3 个:输出层权值向量,隐层神经元的中心以及隐层神经元的宽度(方差)。一般径向基网络的学习总是从网络的权值入手,然后逐步调整网络的其它参数,由于权值与神经元中心及宽度有着直接关系,一旦权值确定,其它两个参数的调整就相对困难。 其一般结构如下: 如图 1 所示,该网络由三层构成,各层含义如下: 第一层:输入层:输入层神经元只起连接作用。 第二层:隐含层:隐含层神经元的变换函数为高斯核. 第三层:输出层:它对输入模式的作用做出响应. 图 1. 径向基神经网络拓扑结构 其数学模型通常如下: 设网络的输入为x = ( x1 , x2 , ?, xH ) T,输入层神经元至隐含层第j 个神经元的中心矢 为vj = ( v1 j , v2 j , ?, vIj ) T (1 ≤j ≤H),隐含层第j 个神经元对应输入x的状态为:zj = φ= ‖x - vj ‖= exp Σx1 - vij ) 2 / (2σ2j ) ,其中σ(1≤j ≤H)为隐含层第j个神

基于神经网络的多任务学习机器人

基于神经网络的多任务学习机器人 目前绝大多数智能机器人具有较高的鲁棒性,但其基于具体行为的实现方法都需要程序员对相应的任务进行手工编程。然而,环境是复杂多样的,而要使得机器人能够在多种环境下进行任务,需要程序员将各种情况考虑在内,这样的系统对环境并不具有适应性,让机器人的应用受到了局限。基于此,提出的自主学习机器人以类人形机器人为基本模型,以神经网络为基础,通过人体对机器人进行示范,训练一个能识别人关节姿态的完备的神经网络。当机器人身处不同环境执行任务时,能够做出适应环境变化的动作。为此所设计的学习机器人系统的特色就在于使用神经网络具有学习能力,提高机器人对环境的适应能力,从而让任务执行更加灵活,使得机器人拥有更广阔的应用前景。 标签:自主学习;神经网络;姿態识别;机器人 doi:10.19311/https://www.360docs.net/doc/0f16684441.html,ki.16723198.2017.01.092 1引言 1.1机器人在现代社会中的重要性 随着城乡居民消费结构的持续升级,以及智慧中国战略的不断推进,智能机器人在家庭、农业、工业等生活的方方面面都有着极其广泛的应用。随着社会的不断发展,社会分工越来越细,与此同时工作也变得越来越单调。另外,社会上有些工作风险较高,若让人去做,不仅效率不高,而且更会产生生命危险。在这样高风险的作业领域,对机器人的需求越来越高。在这一背景下,各种各样的机器人被研制了出来,用它们代替人来完成枯燥、单调、高风险的工作。这极大的提高了劳动生产率和生产质量,创造出了更多的社会财富。 同时,社会服务也对机器人产生了大量的需求。从公共服务方面来说,目前我国老龄人口已超过总人口的10%,人口老龄化问题已成为中国需要面临的重大课题。此外,我国残疾人口占总人口的比重也位居世界较高国家之列。机器人的运用,可以为他们提供大量的护理服务,提高他们的生活质量。在医疗服务方面机器人也有很大的优势,手术机器人凭借其操作的精度及可长期工作等特性广泛应用于手术操作中。总而言之,机器人已成为我们的社会不可取代的一部分。 1.2当前机器人领域的现状及弊端 目前机器人正处于快速发展的阶段,但目前市场上的机器人仍存在着许多弊端。传统机器人需要设计者针对具体的任务进行手工编程,为了使机器人在环境改变时也能完成任务,设计者就需要尽量将各种情况考虑在内。但是这样的机器人存在一些问题:一方面程序员无法穷尽所有的可能情况,另一方面环境的复杂性也无形中加大了机器人可能出故障的概率,这使得机器人缺乏良好的环境自适应能力,给机器人的广泛应用带来了很大的限制。

基于卷积神经网络算法的机器人系统控制

第29卷一第4期 长一春一大一学一学一报 Vol.29一No.4 一2019年4月JOURNALOFCHANGCHUNUNIVERSITYApr.2019一 收稿日期:2018-01-20 基金项目:安徽省科技厅项目(17030901033) 作者简介:张松林(1981-)?男?安徽皖寿人?工程师?硕士?主要从事电子信息工程方面研究?基于卷积神经网络算法的机器人系统控制 张松林 (安徽信息工程学院信息系?安徽芜湖241000) 摘一要:随着计算机技术的不断成熟和数据分析技术的不断完善?近年来突出机器深度学习功能的智能算法取得重大突破?其中以卷积神经网络为代表的技术?可根据不同的控制要求进行相应数据训练?从而提高系统的控制效果?在机器人控制二目标识别等领域得到广泛应用?随着机器人应用环境的复杂化?设计基于卷积神经网络机器人控制算法在非结构化环境中实现精准化物体抓取?建立一个完整的机器人自动抓取规划系统? 关键词:机械臂?深度强化学习?策略搜索?卷积神经网络 中图分类号:TP183一一文献标志码:A一一文章编号:1009-3907(2019)04-0014-04 一一自20世纪中期开始?机器人系统逐步得到发展?从简单的机械结构到具有感知识别功能的智能机器人系统?已经在多个领域广泛应用?其中?物体抓取操作是机器人的重要功能?随着硬件技术的不断成熟?机器人系统通过传感器实现环境感知?并通过智能算法的设计来实现物体的任意抓取?由于机器人系统应用领域的复杂化?对机器人的控制算法提出了更高的要求?目前?工业机器人的抓取算法设计需要依赖预先建立好的物体抓取模型并整理为数据库?但对于在非结构化的环境中进行抓取的机器人来说?建立准确的数学模型难以实现?因此?要建立起能够对环境实时预测并快速整定的抓取规划算法?为优化这一问题?引入基于卷积神经网络的机器人规划算法?机器人通过传感器获取的环境信息?建立对应的抓取位姿映射关系?即通过环境模型库来存储机器人抓取经验?相比与传统的抓取控制算法而言?基于卷积神经网络的算法可以实现对未知物体的抓取经验迁移? 1一机器人抓取模型设计 机器人物体抓取可以视为机械臂对物体表面上一组接触点的施加力?以防止物体在外界扰动下发生运动?为提高机器人对物体抓取的控制性能?首先?需要建立机器人物体抓取的接触力数学模型[1]? 图1一物体与末端执行器接触模型的坐标系关系1.1一机器人与物体之间的接触力当需要通过机器人的机械臂进行物体抓取时?机 械臂的末端抓手会通过若干个接触点与物体进行关 联?一般情况下?在接触点上定义坐标系?并沿3个不 同维度设立坐标轴nl二pl二ql?其中?接触点上切平面 的单位法向量定义为nl?而pl二ql为符合右手定则的 在切平面相互垂直的两个单位向量?在接触点建立坐 标系如图1所示?机器人的物体抓取定义为爪手与物 体之间的运动?而接触面的形状以及爪手与物体之间 的摩擦系数共同决定了该运动的性质?在物体的接触 点上会提供一个单方向的约束[2]?以此防止物体向接触向量的方向偏移?机械臂爪手对物体施加的力和力

BP神经网络模型简介及相关优化案例

华东理工大学 2016-2017学年第2学期 研究生《石油化工单元数学模型》课程论文2017年6月 开课学院:化工学院任课教师:欧阳福生 考生姓名:丁桂宾学号:Y45160205 成绩:

BP 神经网络模型简介及相关优化案例 一、神经网络模型简介 现代神经生理学和神经解剖学的研究结果表明,人脑是极其复杂的,由约1010个神经元交织在一起,构成一个网状结构。它能完成诸如智能、思维、情绪等高级精神活动,被认为是最复杂、最完美、最有效的一种信息处理系统。人工神经网络(Artificial Neural Networks ,以下简写为 NN )是指模拟人脑神经系统的结构和功能,运用大量的处理部件,通过数学方法,由人工方式构造的网络系统[1] 。 图1表示作为 NN 基本单元的神经元模型,它有三个基本要素[2]: (1) 一组连接权(对应于生物神经元的突触),连接强度由各连接上的权值表示,权值为正表示激励,为负表示抑制。 (2) 一个求和单元,用于求取各输入信息的加权和(线性组合)。 (3) 一个非线性激励函数,起非线性映射作用并限制神经元输出幅度在一定的范围内(一般限制在[0,1]或[?1,+1]之间)。 图1 神经元模型 此外还有一个阈值k θ(或偏置 k k b θ-=)。以上作用可以用数学式表达为: ∑= =P j kj k j x w u ;

k k k u θν-=; ) (k k v y ?= 式中 P x x x x ,...,,,321为输入信号, kP k k k w w w w ,...,,,321为神经元k 的权值, k u 为 线性组合结果, k θ为阈值。(.)?为激励函数,k y 为神经元k 的输出。 神经网络理论突破了传统的、串行处理的数字电子计算机的局限,是一个非线性动力学系统,并以分布式存储和并行协同处理为特色,虽然单个神经元的结构和功能极其简单有限,但是大量的神经元构成的网络系统所实现的行为却是极其丰富多彩的。

模糊神经网络的基本原理与应用概述

模糊神经网络的基本原理与应用概述 摘要:模糊神经网络(FNN)是将人工神经网络与模糊逻辑系统相结合的一种具有强大的自学习和自整定功能的网络,是智能控制理论研究领域中一个十分活跃的分支,因此模糊神经网络控制的研究具有重要的意义。本文旨在分析模糊神经网络的基本原理及相关应用。 关键字:模糊神经网络,模糊控制,神经网络控制,BP算法。 Abstract:A fuzzy neural network is a neural network and fuzzy logic system with the combination of a powerful. The self-learning and self-tuning function of the network, is a very intelligent control theory research in the field of active branches. So the fuzzy neural network control research has the vital significance. The purpose of this paper is to analysis the basic principle of fuzzy neural networks and related applications. Key Words: Fuzzy Neural Network, Fuzzy Control, Neural Network Control, BP Algorithm.

1人工神经网络的基本原理与应用概述 人工神经网络的概念 人工神经网络(Artificial Neural Network,简称ANN)是由大量神经元通过极其丰富和完善的联接而构成的自适应非线性动态系统,它使用大量简单的相连的人工神经元来模仿生物神经网络的能力,从外界环境或其它神经元获得信息,同时加以简单的运算,将结果输出到外界或其它人工神经元。神经网络在输入信息的影响下进入一定状态,由于神经元之间相互联系以及神经元本身的动力学特性,这种外界刺激的兴奋模式会自动地迅速演变成新的平衡状态,这样具有特定结构的神经网络就可定义出一类模式变换即实现一种映射关系。由于人工神经元在网络中不同的联接方式,就形成了不同的人工神经网络模式,其中误差反向传播网络(Back-Propagation Network,简称BP网络)是目前人工神经网络模式中最具代表性,应用得最广泛的一种模型【1,2】。 人工神经网络研究的发展简史 人工神经网络的研究己有近半个世纪的历史但它的发展并不是一帆风顺的,神经网络的研究大体上可分为以下五个阶段[3]。 (1) 孕育期(1956年之前):1943年Mcculloch与Pitts共同合作发表了“A logical calculus of ideas immanent in Nervous Activity”一文,提出了神经元数学模型(即MP模型)。1949年Hebb提出Hebb学习法则,对神经网络的发展做出了重大贡献。可以说,MP模型与学习规则为神经科学与电脑科学之间架起了沟通的桥梁,也为后来人工神经网络的迅速发展奠定了坚实的基础。 (2)诞生期(1957年一1968年):1960年Widrow提出了自适应线性元件模型,Rossenbaltt在1957年提出了第一种人工神经网络模式一感知机模式,由二元值神经元组成,该模式的产生激起了人工神经网络研究的又一次新高潮。(3)挫折期(1969年一1981年):1969年Minsky等人写的《感知机》一书以数学方法证明了当时的人工神经网络模式的学习能力受到很大限制。之后,人工神经网络的研究一直处于低潮。

神经网络模型应用实例

BP 神经网络模型 近年来全球性的神经网络研究热潮的再度兴起,不仅仅是因为神经科学本身取得了巨大的进展.更主要的原因在于发展新型计算机和人工智能新途径的迫切需要.迄今为止在需要人工智能解决的许多问题中,人脑远比计算机聪明的多,要开创具有智能的新一代计算机,就必须了解人脑,研究人脑神经网络系统信息处理的机制.另一方面,基于神经科学研究成果基础上发展出来的人工神经网络模型,反映了人脑功能的若干基本特性,开拓了神经网络用于计算机的新途径.它对传统的计算机结构和人工智能是一个有力的挑战,引起了各方面专家的极大关注. 目前,已发展了几十种神经网络,例如Hopficld 模型,Feldmann 等的连接型网络模型,Hinton 等的玻尔茨曼机模型,以及Rumelhart 等的多层感知机模型和Kohonen 的自组织网络模型等等。在这众多神经网络模型中,应用最广泛的是多层感知机神经网络。多层感知机神经网络的研究始于50年代,但一直进展不大。直到1985年,Rumelhart 等人提出了误差反向传递学习算法(即BP 算),实现了Minsky 的多层网络设想,如图34-1所示。 BP 算法不仅有输入层节点、输出层节点,还可有1个或多个隐含层节点。对于输入信号,要先向前传播到隐含层节点,经作用函数后,再把隐节点的输出信号传播到输出节点,最后给出输出结果。节点的作用的激励函数通常选取S 型函数,如 Q x e x f /11 )(-+= 式中Q 为调整激励函数形式的Sigmoid 参数。该算法的学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐含层逐层处理,并传向输出层。每一层神经元的状态只影响下一层神经元的状态。如果输出层得不到期望的输出,则转入反向传播,将误差信号沿原来的连接通道返回,通过修改各层神经元的权值,使得误差信号最小。 社含有n 个节点的任意网络,各节点之特性为Sigmoid 型。为简便起见,指定网络只有一个输出y ,任一节点i 的输出为O i ,并设有N 个样本(x k ,y k )(k =1,2,3,…,N ),对某一输入x k ,网络输出为y k 节点i 的输出为O ik ,节点j 的输入为net jk = ∑i ik ij O W 并将误差函数定义为∑=-=N k k k y y E 12 )(21

基于机器人的递归神经网络运动规划

基于机器人的递归神经网络运动规划 文章研究机器手臂的重复运动规划问题,在考虑关节角度极限和关节速度极限的情况下,将此模型转化为一个含不等式约束的二次规划问题,并利用简化对偶神经网络来求解该问题,从而实现机器手臂的关节重复运动。 标签:冗余机械臂;重复运动规划;二次规划;对偶神经网络 4 数值仿真 本节以平面六连杆冗余机械臂末端执行器作来回直线运动为例进行计算机仿真验证。直线长度为1m,观察其关节轨迹能否重合。末端执行器的运动周期为8s,关节变量的初始状态为:?兹(0)=(0,-?仔/4,0,?仔/2,0,-?仔/4)T弧度。仿真结果如图1所示,从图1也可以看出,在经过8s周期运动之后,平面六连杆机器手臂的各自关节状态都回到初始状态;仿真结果达到预期的目的,且其最大位置误差不大于1.79×10-6。可见,利用所提出的规划解析方案对带关节物理约束的机械臂进行重复运动规划是可行、有效的。 5 结束语 针对平面冗余机械臂重复运动规划问题,文章首先将机械臂重复运动问题转化为一个二次型规划问题,该二次规划方案可避开传统的伪逆解析方案难以求逆的问题,然后利用一种简单对偶神经网络来求解该含不等式约束的二次规划问题,该实现算法具有并行 性、快速实时处理能力和电路实现性。 6 致谢 感谢中山大学张雨浓教授提供相关源程序。 参考文献 [1]Malysz P,Sirouspour S.A kinematic control framework for single-slave asymmetric teleoperation systems. IEEE Transactions on Robotics,2011,27(5):901-917. [2]张智军,张雨浓.重复运动速度层和加速度层方案的等效性[J].自动化学报,2013,39(1):88-91. [3]Zhang Y N,Xie L,Zhang Z J,Li K N,Xiao L.Real-time joystick control and experiments of redundant manipulators using cosine-based velocity mapping. Proceedings of the 2011 IEEE International Conference on Automation and Logistics.

相关文档
最新文档