BP神经网络的应用

合集下载

bp使用方法

bp使用方法
BP（Back Propagation）是一种常用的神经网络训练算法，用于训练多层感知器（MLP）等神经网络。

以下是BP的用方法：
1.初始化神经网络：首先，需要初始化一个神经网络，包括输入层、隐藏层和输出层。

每个层包含一定数量的神经元，每个神经元都通过权重与其他神经元相连。

权重初始化为随机值。

2.前向传播：输入数据通过输入层进入神经网络，然后依次经过隐藏层和输出层，最终得到输出结果。

在前向传播过程中，每个神经元将输入值与其权重相乘，加上偏置项，然后通过激活函数得到输出值。

3.计算误差：根据实际标签和神经网络的输出结果，计算误差。

误差是实际标签与输出结果之间的差异，通常使用平方误差或交叉熵误差等函数计算。

4.反向传播：根据计算出的误差，通过反向传播算法更新神经网络的权重。

反向传播算法将误差从输出层逐层反向传播到输入层，并根据梯度下降法更新权重。

5.迭代训练：重复步骤2-4多次，直到神经网络的输出结果收敛或达到预设的训练轮数。

在每次迭代中，权重都会被更新以减小误差。

6.测试与预测：训练完成后，可以使用测试数据对神经网络进行测试或进行预测。

将测试数据输入神经网络，得到输出结果，并根据输出结果进行评估和比较。

BP算法是一种监督学习算法，需要使用已知标签的数据进行训练。

在训练过程中，需要注意选择合适的激活函数、学习率和迭代次数等参数，以获得最佳的训练效果。

同时，为了避免过拟合和欠拟合等问题，可以使用正则化、Dropout 等技术来优化神经网络的性能。

LabVIEW中BP神经网络的实现及应用

LabVIEW中BP神经网络的实现及应用
0 引言LabVIEW 是美国NI 公司开发的高效图形化虚拟仪器开发平台，它的图形化编程具有直观、简便、快速、易于开发和维护等优点，在虚拟仪器设计和测控系统开发等相关领域得到了日益广泛的应用，它无需任何文本程序代码，而是把复杂、繁琐的语言编程简化成图形，用线条把各种图形连接起来。

BP 神经网络属于前馈神经网络，它广泛应用函数逼近、模式识别、分类和数
据压缩等领域，若将神经网络与虚拟仪器有机结合，则可以为提高虚拟仪器测控系统的性能提供重要的依据。

1 BP 神经网络学习算法BP 模型是一种应用最广泛的多层前向拓扑结构，以三层BP 神经网络作为理论依据进行编程，它由输入层、隐层和输出层构成。

设输入层神经元个数为I，隐层神经元个数为J，输出层神经元个数为K，学习样本有N 个(x，Y，)向量，表示为：输入向量
X{x1，x2，…，xI}，输出向量l，{Y1，Y2，…，Yx)，理想输出向量为
T{tl，t2，…，tK}。

(1)输入层节点i，其输出等于xi(i=1，2，…，I，将控制变量值传输到隐含层，则隐层第j 个神经元的输入：
其中：Wji 是隐层第J 个神经元到输入层第i 个神经元的连接权值。

(2)隐层第J 个神经元的输出：
(3)神经网络输出层，第k 个神经元的输入为：
其中：Vkj 是输出层第k 个神经元到隐层第j 个神经元的连接权值。

(4)神经网络输出层，第志个神经元的输出为：
(5)设定网络误差函数E：
(6)输出层到隐层的连接权值调整量△Vkj：
(7)隐层到输入层的连接权值调整量wji：。

BP神经网络的应用

基于MATLAB的BP神经网络应用人工神经网络（Artificial Neural Networks，NN）是由大量的、简单的处理单元（称为神经元）广泛地互相连接而形成的复杂网络系统，它反映了人脑功能的许多基本特征，是一个高度复杂的非线性动力学系统。

神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学习能力，特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。

神经网络的发展与神经科学、数理科学、认知科学、计算机科学、人工智能、信息科学、控制论、机器人学、微电子学、心理学、微电子学、心理学、光计算、分子生物学等有关，是一门新兴的边缘交叉学科。

神经网络具有非线性自适应的信息处理能力，克服了传统人工智能方法对于直觉的缺陷，因而在神经专家系统、模式识别、智能控制、组合优化、预测等领域得到成功应用。

神经网络与其他传统方法相组合，将推动人工智能和信息处理技术不断发展。

近年来，神经网络在模拟人类认知的道路上更加深入发展，并与模糊系统、遗传算法、进化机制等组合，形成计算智能，成为人工智能的一个重要方向。

MATLAB是一种科学与工程计算的高级语言，广泛地运用于包括信号与图像处理，控制系统设计，系统仿真等诸多领域。

为了解决神经网络问题中的研究工作量和编程计算工作量问题，目前工程领域中较为流行的软件MATLAB，提供了现成的神经网络工具箱（Neural Network Toolbox，简称NNbox），为解决这个矛盾提供了便利条件。

神经网络工具箱提供了很多经典的学习算法，使用它能够快速实现对实际问题的建模求解。

在解决实际问题中，应用MATLAB 语言构造典型神经网络的激活传递函数，编写各种网络设计与训练的子程序，网络的设计者可以根据需要调用工具箱中有关神经网络的设计训练程序，使自己能够从烦琐的编程中解脱出来，减轻工程人员的负担，从而提高工作效率。

一、人工神经网络的研究背景和意义人工神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。

分数阶理论在BP神经网络中的应用

分数阶微积分的概念与性质
分数阶微积分是一种扩展的微积分理论，它允许我们使用非整数值的阶数进行微分和积分运算。与传统的整数阶微积分相比，分数阶微积分具有更强的非线性描述能力，能够更好地处理具有记忆和遗传性质的问题。
在分数阶微积分理论中，Riemann-Liouville定义是最常用的定义方式。通过该定义，我们可以将传统的整数阶导数扩展到分数阶导数。分数阶导数具有一些独特的性质，例如非局部性、非对称性和非马尔科夫性等，这些性质使得分数阶微积分在描述复杂系统和现象方面更具优势。
分数阶微积分的算法
分数阶微积分的常见算法包括多项式插值、傅里叶变换和拉格朗日乘子等。在多项式插值中，我们通过已知的一些点来构造一个多项式函数，然后根据这个函数来计算分数阶导数。傅里叶变换则是一种将函数从时域转换到频域的数学工具，它可以用于计算分数阶导数。拉格朗日乘子是一种求解分数阶微分方程的方法，它通过引入一些辅助变量将分数阶微分方程转化为整数阶微分方程。
将分数阶微积分引入BP神经网络，可以扩展网络的动态范围，增强其对非线性模式的描述能力。通过使用分数阶导数，我们可以更好地捕捉网络中的记忆效应和遗传机制，从而改进网络的性能。此外，分数阶导数还具有一些特殊的性质，例如非局部性，这有助于我们更好地理解网络的内部工作机制。
分数阶BP神经网络的实现与优势
分数阶微积分的理论
分数阶微积分的基本理论主要涉及幂级数、勒让德符号和矩阵表示等方法。幂级数是一种通过无穷级数展开函数的数学工具，它可以用来表示分数阶导数。勒让德符号是一种描述函数在某一点的变化率的数学工具，它可以用于计算分数阶导数。矩阵表示则是用矩阵形式表示分数阶导数的一种方法。
在分数阶量子力学中，幂级数、勒让德符号和矩阵表示等方法的应用尤为常见。例如，在处理分数阶拉普拉斯算子时，幂级数和勒让德符号被用来描述粒子的行为；而在处理分数阶哈密顿算子时，矩阵表示被用来描述系统的能量等级。

bp神经网络的应用综述

bp神经网络的应用综述近年来，人工神经网络（ANN）作为一种神经网络形式在不断发展，因其计算能力强，对现实世界较好地识别和适应能力，已得到越来越广泛的应用，其中，BP神经网络是最典型的人工神经网络之一。

BP神经网络是指以马尔可夫随机过程为基础的反向传播算法，具有自组织学习、泛化、模糊推理的特点，具有非常广泛的应用场景。

它可以用来解决实际问题。

首先，BP神经网络可以用来解决分类问题。

它可以根据给定的输入向量和输出向量，训练模型以分类相关的输入特征。

这种模型可以用来解决工业控制问题、专家系统任务等。

例如，BP神经网络可以用来识别照片中的面孔，帮助改进自动门的判断等。

此外，BP神经网络还可以用于计算机视觉，即以计算机图像识别的形式进行图像处理。

通常，计算机视觉技术需要两个步骤，即识别和分析。

在识别步骤中，BP神经网络可以被用来识别图片中的特征，例如物体的形状、大小、颜色等；在分析步骤中，BP神经网络可以用来分析和判断图片中的特征是否满足要求。

此外，BP神经网络还可以用于机器人技术。

它可以用来识别机器人环境中的物体，从而帮助机器人做出正确的动作。

例如，利用BP神经网络，机器人可以识别障碍物并做出正确的行动。

最后，BP神经网络还可以用于未来的驾驶辅助系统中。

这种系统可以利用各种传感器和摄像机，搜集周围环境的信息，经过BP神经网络分析，判断当前环境的安全程度，及时采取措施，以达到更好的安全驾驶作用。

综上所述，BP神经网络具有自组织学习、泛化、模糊推理的特点，拥有非常广泛的应用场景，可以用于分类问题、计算机视觉、机器人技术和驾驶辅助系统等。

然而，BP神经网络也存在一些问题，例如训练时间长，需要大量的训练数据，容易受到噪声攻击等。

因此，研究人员正在积极改进BP神经网络，使其能够更好地解决各种问题。

BP神经网络模型应用实例

BP神经网络模型第1节基本原理简介近年来全球性的神经网络研究热潮的再度兴起，不仅仅是因为神经科学本身取得了巨大的进展．更主要的原因在于发展新型计算机和人工智能新途径的迫切需要．迄今为止在需要人工智能解决的许多问题中，人脑远比计算机聪明的多，要开创具有智能的新一代计算机，就必须了解人脑，研究人脑神经网络系统信息处理的机制．另一方面，基于神经科学研究成果基础上发展出来的人工神经网络模型，反映了人脑功能的若干基本特性，开拓了神经网络用于计算机的新途径．它对传统的计算机结构和人工智能是一个有力的挑战，引起了各方面专家的极大关注．目前，已发展了几十种神经网络，例如Hopficld模型，Feldmann等的连接型网络模型，Hinton等的玻尔茨曼机模型，以及Rumelhart等的多层感知机模型和Kohonen的自组织网络模型等等。

在这众多神经网络模型中，应用最广泛的是多层感知机神经网络。

多层感知机神经网络的研究始于50年代，但一直进展不大。

直到1985年，Rumelhart等人提出了误差反向传递学习算法（即BP算），实现了Minsky的多层网络设想，如图34-1所示。

BP 算法不仅有输入层节点、输出层节点，还可有1个或多个隐含层节点。

对于输入信号，要先向前传播到隐含层节点，经作用函数后，再把隐节点的输出信号传播到输出节点，最后给出输出结果。

节点的作用的激励函数通常选取S 型函数，如Qx e x f /11)(-+=式中Q 为调整激励函数形式的Sigmoid 参数。

该算法的学习过程由正向传播和反向传播组成。

在正向传播过程中，输入信息从输入层经隐含层逐层处理，并传向输出层。

每一层神经元的状态只影响下一层神经输入层中间层输出层图34-1 BP 神经网络模型元的状态。

如果输出层得不到期望的输出，则转入反向传播，将误差信号沿原来的连接通道返回，通过修改各层神经元的权值，使得误差信号最小。

社含有n 个节点的任意网络，各节点之特性为Sigmoid 型。

bp使用方法

bp使用方法BP（反向传播算法）是一种用于训练神经网络的算法。

它通过反向传播误差来调整神经网络中的权重和偏差，以使其能够更好地逼近目标函数。

BP算法是一种有监督学习算法，它需要有标记的训练集作为输入，并且可以通过梯度下降法来最小化目标函数的误差。

BP算法的基本思想是在神经网络中，从输入层到输出层的正向传播过程中，通过计算网络的输出值与目标值之间的差异（即误差），然后将这个误差反向传播到网络的每一层，在每一层中调整权重和偏差，以最小化误差。

这个反向传播的过程将误差逐层传递，使得网络的每一层都能对误差进行一定程度的“贡献”，并根据这个贡献来调整自己的权重和偏差。

具体来说，BP算法可以分为以下几个步骤：1. 初始化网络：首先需要确定神经网络的结构，包括输入层、隐藏层和输出层的神经元个数，以及每层之间的连接权重和偏差。

这些权重和偏差可以初始化为随机值。

2. 前向传播：将输入样本送入网络，按照从输入层到输出层的顺序，逐层计算每个神经元的输出值。

具体计算的方法是将输入值和各个连接的权重相乘，然后将结果求和，并通过一个非线性激活函数（如Sigmoid函数）进行映射得到最终的输出值。

3. 计算误差：将网络的输出值与目标值进行比较，计算误差。

常用的误差函数有均方误差函数（Mean Squared Error，MSE）和交叉熵函数（Cross Entropy），可以根据具体问题选择合适的误差函数。

4. 反向传播：从输出层开始，根据误差对权重和偏差进行调整。

首先计算输出层神经元的误差，然后根据误差和激活函数的导数计算输出层的敏感度（即对权重的影响），并根据敏感度和学习率更新输出层的权重和偏差。

5. 更新隐藏层权重：同样地，根据输出层的敏感度，计算隐藏层的敏感度，并更新隐藏层的权重和偏差。

隐藏层的敏感度可以通过将输出层的敏感度按权重加权求和得到。

6. 重复步骤4和5：重复执行步骤4和5，将误差逐层传播，更新每一层的权重和偏差，直到达到训练的停止条件（如达到最大迭代次数或误差降至某个阈值）。

BP神经网络原理与应用实习论文

学年论文（本科）学院数学与信息科学学院专业信息与计算科学专业年级10级4班姓名徐玉琳于正平马孝慧李运凤郭双双任培培论文题目BP神经网络原理与应用指导教师冯志敏成绩2013年 9月 24日BP神经网络的原理与应用1.BP神经网络的原理1.1 BP神经网络的结构BP神经网络模型是一个三层网络,它的拓扑结构可被划分为:输入层(InputLayer )、输出层(Outp ut Layer ) ,隐含层(Hide Layer )．其中,输入层与输出层具有更重要的意义,因此也可以为两层网络结构(把隐含层划入输入层,或者把隐含层去掉)每层都有许多简单的能够执行并行运算的神经元组成,这些神经元与生物系统中的那些神经元非常类似,但其并行性并没有生物神经元的并行性高．BP神经网络的特点：1）网络由多层构成,层与层之间全连接,同一层之间的神经元无连接．2）BP网络的传递函数必须可微．因此,感知器的传递函数-——二值函数在这里没有用武之地．BP网络一般使用Sigmoid函数或线性函数作为传递函数．3）采用误差反向传播算法(Back-Propagation Algorithm)进行学习．在BP 网络中,数据从输入层隐含层逐层向后传播,训练网络权值时,则沿着减少误差的方向,从输出层经过中间各层逐层向前修正网络的连接权值．随着学习的不断进行,最终的误差越来越来小．BP神经网络的学习过程BP神经网络的学习算法实际上就是对误差函数求极小值的算法,它采用的算法是最速下降法,使它对多个样本进行反复的学习训练并通过误差的反向传播来修改连接权系数,它是沿着输出误差函数的负梯度方向对其进行改变的,并且到最后使误差函数收敛于该函数的最小点．1.3 BP网络的学习算法BP网络的学习属于有监督学习,需要一组已知目标输出的学习样本集．训练时先使用随机值作为权值,修改权值有不同的规则．标准的BP神经网络沿着误差性能函数梯度的反向修改权值,原理与LMS算法比较类似,属于最速下降法．拟牛顿算法牛顿法是一种基于二阶泰勒级数的快速优化算法．其基本方法是1(1)()()()x k x k A k g k -+=-式中 ()A k ----误差性能函数在当前权值和阀值下的Hessian 矩阵（二阶导数）,即2()()()x x k A k F x ==∇牛顿法通常比较梯度法的收敛速度快,但对于前向型神经网络计算Hessian 矩阵是很复杂的,付出的代价也很大．有一类基于牛顿法的算法不需要二阶导数,此类方法称为拟牛顿法（或正切法）,在算法中的Hessian 矩阵用其近似值进行修正,修正值被看成梯度的函数． 1）BFGS 算法在公开发表的研究成果中,你牛顿法应用最为成功得有Boryden,Fletcher,Goldfard 和Shanno 修正算法,合称为BFG 算法．该算法虽然收敛所需的步长通常较少,但在每次迭代过程所需要的计算量和存储空间比变梯度算法都要大,对近似Hessian 矩阵必须进行存储,其大小为n n ⨯,这里n 网络的链接权和阀值的数量．所以对于规模很大的网络用RPROP 算法或任何一种梯度算法可能好些；而对于规模较小的网络则用BFGS 算法可能更有效． 2）OSS 算法由于BFGS 算法在每次迭代时比变梯度算法需要更多的存储空间和计算量,所以对于正切近似法减少其存储量和计算量是必要的．OSS 算法试图解决变梯度法和拟牛顿（正切）法之间的矛盾,该算法不必存储全部Hessian 矩阵,它假设每一次迭代时与前一次迭代的Hessian 矩阵具有一致性,这样做的一个有点是,在新的搜索方向进行计算时不必计算矩阵的逆．该算法每次迭代所需要的存储量和计算量介于梯度算法和完全拟牛顿算法之间．最速下降BP 法最速下降BP 算法的BP 神经网络,设k 为迭代次数,则每一层权值和阀值的修正按下式进行(1)()()x k x k g k α+=-式中()x k —第k 次迭代各层之间的连接权向量或阀值向量；()g k =()()E k x k ∂∂—第k 次迭代的神经网络输出误差对各权值或阀值的梯度向量．负号表示梯度的反方向,即梯度的最速下降方向；α—学习效率,在训练时是一常数．在MATLAB 神经网络工具箱中,,可以通过改变训练参数进行设置；()E K —第k 次迭代的网络输出的总误差性能函数,在MATLAB 神经网络工具箱中BP 网络误差性能函数默认值为均方误差MSE,以二层BP 网络为例,只有一个输入样本时,有2()()E K E e k ⎡⎤=⎣⎦21S≈22221()S i i i t a k =⎡⎤-⎣⎦∑ 222212,1()()()()s ii j i i j a k f w k a k b k =⎧⎫⎪⎪⎡⎤=-⎨⎬⎣⎦⎪⎪⎩⎭∑21221112,,11()(()())()s s i j i j i i i j j f w k f iw k p ib k b k ==⎧⎫⎡⎤⎛⎫⎪⎪=++⎢⎥ ⎪⎨⎬⎢⎥⎝⎭⎪⎪⎣⎦⎩⎭∑∑若有n 个输入样本2()()E K E e k ⎡⎤=⎣⎦21nS ≈22221()S ii i ta k =⎡⎤-⎣⎦∑根据公式和各层的传输函数,可以求出第k 次迭代总误差曲面的梯度()g k =()()E k x k ∂∂,分别代入式子便可以逐次修正其权值和阀值,并是总的误差向减小的方向变化,直到达到所需要的误差性能为止． 1.4 BP 算法的改进BP 算法理论具有依据可靠、推导过程严谨、精度较高、通用性较好等优点,但标准BP 算法存在以下缺点：收敛速度缓慢；容易陷入局部极小值；难以确定隐层数和隐层节点个数．在实际应用中,BP 算法很难胜任,因此出现了很多改进算．利用动量法改进BP 算法标准BP 算法实质上是一种简单的最速下降静态寻优方法,在修正W(K)时,只按照第K 步的负梯度方向进行修正,而没有考虑到以前积累的经验,即以前时刻的梯度方向,从而常常使学习过程发生振荡,收敛缓慢．动量法权值调整算法的具体做法是：将上一次权值调整量的一部分迭加到按本次误差计算所得的权值调整量上,作为本次的实际权值调整量,即：其中：α为动量系数,通常0＜α＜0．9；η—学习率,范围在0．001～10之间．这种方法所加的动量因子实际上相当于阻尼项,它减小了学习过程中的振荡趋势,从而改善了收敛性．动量法降低了网络对于误差曲面局部细节的敏感性,有效的抑制了网络陷入局部极小．自适应调整学习速率标准BP算法收敛速度缓慢的一个重要原因是学习率选择不当,学习率选得太小,收敛太慢；学习率选得太大,则有可能修正过头,导致振荡甚至发散．可采用图所示的自适应方法调整学习率．调整的基本指导思想是：在学习收敛的情况下,增大η,以缩短学习时间；当η偏大致使不能收敛时,要及时减小η,直到收敛为止．动量-自适应学习速率调整算法采用动量法时,BP算法可以找到更优的解；采用自适应学习速率法时,BP算法可以缩短训练时间．将以上两种方法结合起来,就得到动量-自适应学习速率调整算法．1. L-M学习规则L-M（Levenberg-Marquardt）算法比前述几种使用梯度下降法的BP算法要快得多,但对于复杂问题,这种方法需要相当大的存储空间L-M(Levenberg-Marquardt)优化方法的权值调整率选为:其中：e —误差向量；J —网络误差对权值导数的雅可比（Jacobian ）矩阵；μ—标量,当μ很大时上式接近于梯度法,当μ很小时上式变成了Gauss-Newton 法,在这种方法中,μ也是自适应调整的． 1.5 BP 神经网络的设计网络的层数输入层节点数取决于输入向量的维数．应用神经网络解决实际问题时,首先应从问题中提炼出一个抽象模型,形成输入空间和输出空间．因此,数据的表达方式会影响输入向量的维数大小.例如,如果输入的是64*64的图像,则输入的向量应为图像中所有的像素形成的4096维向量．如果待解决的问题是二元函数拟合,则输入向量应为二维向量．理论上已证明：具有偏差和至少一个S 型隐含层加上一个线性输出层的网络,能够逼近任何有理数．增加层数可以更进一步的降低误差,提高精度,但同时也使网络复杂化,从而增加了网络权值的训练时间．而误差精度的提高实际上也可以通过增加神经元数目来获得,其训练效果也比增加层数更容易观察和调整.所以一般情况下,应优先考虑增加隐含层中的神经元数. 隐含层的神经元数网络训练精度的提高,可以通过采用一个隐含层,而增加神经元数了的方法来获得．这在结构实现上,要比增加隐含层数要简单得多．那么究竟选取多少隐含层节点才合适？这在理论上并没有一个明确的规定．在具体设计时,比较实际的做法是通过对不同神经元数进行训练对比,然后适当地加上一点余量．1）0niMi C k =>∑,k 为样本数,M 为隐含层神经元个数,n 为输入层神经元个数．如i>M,规定C i M =0．2）和n 分别是输出层和输入层的神经元数,a 是[0.10]之间的常量．3）M=2log n ,n 为输入层神经元个数．初始权值的选取由于系统是非线性的,初始值对于学习是否达到局部最小、是否能够收敛及训练时间的长短关系很大．如果初始值太大,使得加权后的输入和n落在了S型激活函数的饱和区,从而导致其导数f (n)非常小,从而使得调节过程几乎停顿下来．所以一般总是希望经过初始加权后的每个神经元的输出值都接近于零,这样可以保证每个神经元的权值都能够在它们的S型激活函数变化最大之处进行调节．所以,一般取初始权值在（-1,1）之间的随机数．学习速率学习速率决定每一次循环训练中所产生的权值变化量．大的学习速率可能导致系统的不稳定；但小的学习速率导致较长的训练时间,可能收敛很慢,不过能保证网络的误差值不跳出误差表面的低谷而最终趋于最小误差值．所以在一般情况下,倾向于选取较小的学习速率以保证系统的稳定性．学习速率的选取范围在0．01-0．8之间．1.6BP神经网络局限性需要参数多且参数选择没有有效的方法对于一些复杂问题 ,BP 算法可能要进行几小时甚至更长的时间训练,这主要是由于学习速率太小所造成的．标准BP 网络学习过程缓慢,易出现平台,这与学习参数率l r的选取有很大关系．当l r较时,权值修改量大,学习速率也快,但可能产生振荡;当l r较小时,虽然学习比较平稳,但速度十分缓慢．容易陷入局部最优BP网络易陷入局部最小, 使 BP网络不能以高精度逼近实际系统．目前对于这一问题的解决有加入动量项以及其它一些方法．BP 算法本质上是以误差平方和为目标函数 , 用梯度法求其最小值的算法．于是除非误差平方和函数是正定的, 否则必然产生局部极小点, 当局部极小点产生时 , BP算法所求的就不是解．1.6.3 样本依赖性这主要表现在网络出现的麻痹现象上．在网络的训练过程中,如其权值调的过大,可能使得所有的或大部分神经元的加权值偏大,这使得激活函数的输入工作在S型转移函数的饱和区,从而导致其导函数非常小,使得对网络权值的调节过程几乎停顿下来．通常为避免这种现象的发生,一是选取较小的初始权值,二是采用较小的学习速率,但又要增加时间训练．初始权敏感对于一些复杂的问题,BP算法可能要进行几个小时甚至更长时间的训练．这主要是由于学习速率太小造成的．可采用变化的学习速率或自适应的学习速率来加以改进．2．BP神经网络应用2.1 手算实现二值逻辑—异或这个例子中,采用手算实现基于BP网络的异或逻辑．训练时采用批量训练的方法,训练算法使用带动量因子的最速下降法．在MATLAB中新建脚本文件main_xor.m,输入代码如下：%脚本%批量训练方式．BP网络实现异或逻辑%%清理clear allclcrand('seed',2)eb = 0.01; %误差容限eta = 0.6; %学习率mc = 0.8; %动量因子maxiter = 1000; %最大迭代次数%% 初始化网络nSampNum = 4;nSampDim = 2;nHidden = 3;nOut = 1;w = 2*(rand(nHidden,nSampDim)-1/2);b = 2*(rand(nHidden,1)-1/2);wex = [w,b];W = 2*(rand(nOut,nHidden)-1/2);B = 2*(rand(nOut,1)-1/2);WEX = [W,B];%%数据SampIn=[0,0,1,1;...0,1,0,1;…1,1,1,1];expected = [0,1,1,0];%%训练iteration = 0;errRec = [];outRec =[];for i = 1:maxiter% 工作信号正向传播hp = wex*SampIn;tau = logsig(hp);tauex = [tau',1*ones(nSampNum,1)]';HM = WEX*tauex;out = logsig(HM);outRec = [outRec,out'];err = expected - out;sse = sumsqr(err);errRec = [errRec,sse];fprintf('第%d 次迭代,误差：%f \n',i,sse);% 判断是否收敛iteration = iteration + 1;if sse <= ebbreak;end% 误差信号反向传播% DELTA 和delta 为局部梯度DELTA = err.*dlogsig(HM,out);delta = W' * DELTA.*dlogsig(hp,tau);dWEX = DELTA*tauex';dwex = delta*SampIn';% 更新权值if i == 1WEX = WEX + eta*dWEX;wex = wex + eta*dwex;elseWEX = WEX + (1-mc)*eta*dWEX + mc*dWEXold;wex = wex + (1-mc)*eta*dwex+mc*dwexold;enddWEXold = dWEX;dwexold = dwex;W = WEX(:,1:nHidden);end%%显示figure(1)grid[nRow,nCol]=size(errRec);semilogy(1:nCol,errRec,'LineWidth',1.5);title('误差曲线');xlabel('迭代次数');x=-0.2:.05:1.2;[xx,yy] = meshgrid(x);for i=1:length(xx)for j=1:length(yy)xi=[xx(i,j),yy(i,j),1];hp = wex*xi';tau = logsig(hp);tauex = [tau',1]';HM = WEX*tauex;out = logsig(HM);z (i,j) =out;endendfigure(2)mesh(x,x,z);figure(3)plot([0,1],[0,1],'*','LineWidth',2);hold onplot([0,1],[1,0],'O','LineWidth',2);[c,h]=contour(x,x,z,0.5,'b');clabel(c,h);legend('0','1','分类面');title('分类面')2.2 误差下降曲线如下图所示：Finger 1010*******400500600700800900100010-210-110误差曲线迭代次数网格上的点在BP 网络映射下的输出如下图：Finger 2异或本质上是一个分类问题,,分类面如图：Finger 3分类面-0.200.20.40.60.81 1.2本文介绍了神经网络的研究背景和现状,分析了目前神经网络研究中存在的问题．然后描述了BP神经网络算法的实现以及BP神经网络的工作原理,给出了BP网络的局限性．本文虽然总结分析了BP神经网络算法的实现,给出了实例分析,但是还有很多的不足．所总结的BP神经网络和目前研究的现状都还不够全面,经过程序调试的图形有可能都还存在很多细节上的问题,而图形曲线所实现效果都还不够好,以及结果分析不够全面、正确、缺乏科学性等,这些都还是需加强提高的．近几年的不断发展,神经网络更是取得了非常广泛的应用,和令人瞩目的发展．在很多方面都发挥了其独特的作用,特别是在人工智能、自动控制、计算机科学、信息处理、机器人、模式识别等众多方面的应用实例,给人们带来了很多应用上到思考,和解决方法的研究．但是神经网络的研究最近几年还没有达到非常热门的阶段,这还需有很多热爱神经网络和研究神经网络人员的不断研究和创新,在科技高度发达的现在,我们有理由期待,也有理由相信．我想在不久的将来神经网络会应用到更多更广的方面,人们的生活会更加便捷．学年论文成绩评定表。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

BP神经网络在分类与预测中的应用
一、 BP神经网络二、徽章的分类三、光催化臭氧氧化处理自来水
BP神经网络模型
三层BP网络的拓扑结构
1.2.3 BP神经网络模型
(1) 激活函数(传输函数）必须处处可导一般都使用S型函数
Sigmoid函数
1
对数Sigmoid函数
0.8
0.5
0.6
-2
-1 -0.5
Jean Gabriel Ganascia
Ricard Gavalda Melinda T. Gervasio Attilio Giordana Paul W. Goldberg Diana Gordon Jonathan Gratch
BP神经网络在分类与预测中的应用
二、徽章的分类
14名未参加会议的代表徽章代表姓名徽章代表姓名 ? Merrick L. Furst ? Jean Gabriel Ganascia ? William Gasarch ? Ricard Gavalda ? Yolanda Gil ? Melinda T. Gervasio ? David Gillman ? Attilio Giordana ? Kate Goelz ? Paul W. Goldberg ? Sally Goldman ? Diana Gordon ? Geoffrey Gordon ? Jonathan Gratch 徽章问题的背景
从训练情况可以看出，在误差值比较大的时候训练就停止了，将输入p带入训练后的矩阵，发现输出结果与t很不一致，说明这里找不到分类的规律。
可以看到,这个结果不是很好, 由很多介于0和1之间的数字,从这里的分析可以看出,选取字母的编码作为特征值是合理的，但需要对特征值的选取方案进行细化。
BP神经网络在分类与预测中的应用
模型二
对所给出的280个人名取特征值,我们将人名的第一
个字母的进行编号，a ~ z分别对应 0 ~ 25，并将这些特征值带入到BP网络中去进行训练，具体程序如下：
•
• • • • •
1.2.4 BP网络学习算法的MATLAB实现
(2) 实例 BP网络应用于药品预测对比图
由对比图可以看出预测效果与实际存在一定误差，此误差可以通过增加运行步数和提高预设误差精度使其进一步缩小
BP神经网络在分类与预测中的应用
二、徽章的分类
徽章问题的背景徽章问题是一个典型的分类问题。我们可以用一个具体的例子描述：在某个国际会议上，参加会议的 280名代表每人收到会议组织者发给一枚徽章，徽章的标记为“＋”或“－”。会议的组织者声明：每位代表得到徽章“＋”或“－”的标记只与他们的姓名有关，并希望代表们能够找出徽章“＋”与“－”的分类方法。由于客观原因，有14名代表没能参加此次会议。按照代表们找出的方法判断，如果他们参加会议将得到的徽章类型。
x1
x2
w1 w2

xk
wk wn

net
传输函数 f ( )
y f ( net )
输出端y

xn
输入端
1.2.3 BP神经网络模型
(2)使用S型激活函数时BP网络输入与输出关系输入 net x1w1 x2 w2 ... xn wn b 1 输出 y f (net ) 1 e net 1 1 输出的导数 f '(net ) y (1 y ) - net net 2 1 e (1 e ) 根据S型激活函数的图形可知,对神经网络进行训练，应该将net的值尽量控制在收敛比较快的范围内.
BP神经网络在分类与预测中的应用
模型一
训练次数与训练精度的关系图
BP神经网络在分类与预测中的应用
模型一将用于训练的输入数据p代入训练后的神经网络，输出结果为a矩阵将它和用于训练的目标输出矩 a=sim(net,p) 阵t对比可以看出，吻合得很好 a= Columns 1 through 9 1.0000 0.0000 1.0000 1.0000 0.0000 1.0000 -0.0000 1.0000 1.0000 Columns 10 through 18 1.0000 1.0000 1.0000 1.0000 1.0000 -0.0000 1.0000 -0.0000 1.0000（后面数据略）
1
2
0.4
0.2
-1
-2
-1
1
1 e f ( x) 1 e 2 x
2 x
1 f ( x) 1 e 2 x
1.2.3 BP神经网络模型
(2)使用S型激活函数时BP网络输入与输出关系输入 net x1w1 x2 w2 ... xn wn b 1 输出 y f (net ) 1 e net
BP神经网络在分类与预测中的应用
初始化给定导师信号
计算个节点网络输出
计算反向误差权值学习 N
学习结束？ Y 对测试样本分类
结束
BP神经网络在分类与预测中的应用
模型一我们先做第一种尝试，将人名的前五个字母进行编号，a ~ z 分别对应 0 ~ 25，即每个人名的特征值是一个长度为5的一维列向量,总共280个人名就是个5*280 的矩阵p，作为网络输入。将题目中的徽章问题量化，假设徽章为＋则为1, 徽章为－则为0, 就形成一个1*280 的矩阵t，作为目标输出。将这些特征值作为训练样本, 通过Matlab的工具箱对BP分类算法进行训练，并确定权值，具体程序，注释及结果如下：
BP神经网络在分类与预测中的应用
模型一将14个待分类的人名的前五个字母编码输入神经网络，得到的结果如下：
a=sim(net,n) a= Columns 1 through 8 1.3889 0.8504 1.0000 0.9551 -0.0006 -0.0515 1.0000 -0.7714 Columns 9 through 14 1.0776 0.9977 2.0655 0.4673 0.4794 1.0000
1.2.4 BP网络学习算法的MATLAB实现
(2) 实例
•
– %以每三个月的销售量经归一化处理后作为输入 P=[0.5152 0.8173 1.0000 ; 0.8173 1.0000 0.7308பைடு நூலகம் 1.0000 0.7308 0.1390; 0.7308 0.1390 0.1087; 0.1390 0.1087 0.3520; 0.1087 0.3520 0.1065; ]'; – %以第四个月的销售量归一化处理后作为目标向量 T=[0.7308 0.1390 0.1087 0.3520 0.1065 0.3761]; – %创建一个BP神经网络，每一个输入向量的取值范围为[0 ,1],隐含层有5个神经%元，输出层有一个神经元，隐含层的激活函数为tansig，输出层的激活函数为%logsig，训练函数为梯度下降函数. net=newff([0 1;0 1;0 1],[5,1],{'tansig','logsig'},'traingd'); net.trainParam.epochs=15000; net.trainParam.goal=0.01; – %设置学习速率为0.1 LP.lr=0.1; net=train(net,P,T);
BP神经网络在分类与预测中的应用
二、徽章的分类
徽章问题的背景徽章代表姓名 Merrick L. Furst William Gasarch Yolanda Gil David Gillman Kate Goelz Sally Goldman Geoffrey Gordon 14名未参加会议的代表徽章代表姓名
BP神经网络在分类与预测中的应用
二、徽章的分类
徽章问题的背景
徽章代表姓名徽章代表姓名 + Welton Becket + Michael W. Barley - Cristina Baroglio + Haralabos Athanassiou … … … … - Eric Baum + Timothy P. Barber
BP神经网络在分类与预测中的应用
二、徽章的分类
徽章问题的背景徽章 + + + + + + 代表姓名 Naoki Abe David W. Aha Eric Allender Minoru Asada Lars Asker Peter Bartlett Peter Bartlett 徽章 + + + + + 代表姓名 Myriam Abramson Kamal M. Ali Dana Angluin Chidanand Apte Javed Aslam Jose L. Balcazar Jose L. Balcazar
BP神经网络在分类与预测中的应用
模型二
>> net=newff([0 25],[100,1],{'logsig','purelin'},'trainlm'); >> net=train(net,p,t); TRAINLM, Epoch 0/100, MSE 36.4541/0, Gradient 10111.3/1e-010 TRAINLM, Epoch 6/100, MSE 0.115783/0, Gradient 7.80296e-013/1e-010 TRAINLM, Minimum gradient reached, performance goal was not met. >> net.trainParam.min_grad= 1e-020; >> net=train(net,p,t); TRAINLM, Epoch 0/100, MSE 0.115783/0, Gradient 7.80296e-013/1e-020 TRAINLM, Epoch 3/100, MSE 0.115783/0, Gradient 1.18794e-012/1e-020 TRAINLM, Maximum MU reached, performance goal was not met.