(完整版)BP神经网络的基本原理_一看就懂
BP神经网络基本原理与应用

BP神经网络基本原理与应用BP神经网络,即反向传播神经网络(BackPropagation Neural Network),是一种常用的人工神经网络模型,由几层节点相互连接而成,通过输入与输出之间的连接进行信息传递与处理。
BP神经网络广泛应用于模式识别、数据挖掘、预测分析等领域,具有较好的非线性映射能力和逼近复杂函数的能力。
BP神经网络的基本原理是参考人脑神经元的工作方式,通过模拟大量神经元之间的连接与传递信息的方式进行数据处理。
BP神经网络通常由输入层、隐藏层和输出层组成,其中输入层接收外部输入的数据,输出层返回网络最终的结果,隐藏层通过多个节点进行信息传递和加工。
在前向传播阶段,输入数据从输入层进入神经网络,通过各层节点之间的连接,经过各层节点的加权和激活函数处理,最终输出到输出层。
此过程权值是固定的,只有输入数据在网络中的传递。
在反向传播阶段,通过计算输出层的误差与目标输出之间的差异,反向传播至隐藏层和输入层,根据误差大小调整各层节点之间的权值。
这种反向传播误差的方式可以不断减小输出误差,并逐渐调整网络的权值,使得网络的输出结果更加准确。
BP神经网络的应用非常广泛,可以有效地处理非线性问题。
例如,在模式识别领域,可以用于人脸识别、声纹识别等方面,通过学习大量的样本数据,提取出特征并建立模型,实现对特定模式的识别和分类。
在数据挖掘领域,可以用于聚类分析、分类预测等方面,通过训练网络,建立数据模型,对未知数据进行分类或者预测。
在预测分析领域,可以用于股票预测、销售预测等方面,通过学习历史数据,建立预测模型,对未来的趋势进行预测。
总的来说,BP神经网络作为一种常用的人工神经网络模型,具有强大的非线性映射能力和逼近复杂函数的能力,其基本原理是通过输入与输出之间的连接进行信息传递与处理,并通过不断调整权值来减小输出误差。
在实际应用中,可以广泛应用于模式识别、数据挖掘、预测分析等领域,为我们解决复杂问题提供了有力的工具和方法。
BP神经网络的基本原理_一看就懂.

5.4 BP神经网络的基本原理BP(Back Propagation)网络是1986年由Rinehart和McClelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。
BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。
它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)(如图5.2所示)。
5.4.1 BP神经元图5.3给出了第j个基本BP神经元(节点),它只模仿了生物神经元所具有的三个最基本也是最重要的功能:加权、求和与转移。
其中x1、x2…xi…xn分别代表来自神经元1、2…i…n的输入;wj1、wj2…wji…wjn则分别表示神经元1、2…i…n与第j个神经元的连接强度,即权值;bj 为阈值;f(·)为传递函数;yj为第j个神经元的输出。
第j个神经元的净输入值为:(5.12)其中:若视,,即令及包括及,则于是节点j的净输入可表示为:(5.13)净输入通过传递函数(Transfer Function)f (·)后,便得到第j个神经元的输出:(5.14)式中f(·)是单调上升函数,而且必须是有界函数,因为细胞传递的信号不可能无限增加,必有一最大值。
5.4.2 BP网络BP算法由数据流的前向计算(正向传播)和误差信号的反向传播两个过程构成。
正向传播时,传播方向为输入层→隐层→输出层,每层神经元的状态只影响下一层神经元。
若在输出层得不到期望的输出,则转向误差信号的反向传播流程。
通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程。
5.4.2.1 正向传播设 BP网络的输入层有n个节点,隐层有q个节点,输出层有m个节点,输入层与隐层之间的权值为,隐层与输出层之间的权值为,如图5.4所示。
bp神经网络的原理

bp神经网络的原理BP神经网络(也称为反向传播神经网络)是一种基于多层前馈网络的强大机器学习模型。
它可以用于分类、回归和其他许多任务。
BP神经网络的原理基于反向传播算法,通过反向传播误差来调整神经网络的权重和偏差,从而使网络能够学习和适应输入数据。
BP神经网络的基本结构包括输入层、隐藏层和输出层。
每个层都由神经元组成,每个神经元都与上一层的所有神经元连接,并具有一个权重值。
神经元的输入是上一层的输出,通过加权和和激活函数后得到输出。
通过网络中的连接和权重,每层的输出被传递到下一层,最终得到输出层的结果。
BP神经网络的训练包括两个关键步骤:前向传播和反向传播。
前向传播是指通过网络将输入数据从输入层传递到输出层,计算网络的输出结果。
反向传播是基于网络输出结果与真实标签的误差,从输出层向输入层逆向传播误差,并根据误差调整权重和偏差。
在反向传播过程中,通过计算每个神经元的误差梯度,我们可以使用梯度下降算法更新网络中的权重和偏差。
误差梯度是指误差对权重和偏差的偏导数,衡量了误差对于权重和偏差的影响程度。
利用误差梯度,我们可以将误差从输出层反向传播到隐藏层和输入层,同时更新每层的权重和偏差,从而不断优化网络的性能。
通过多次迭代训练,BP神经网络可以逐渐减少误差,并提高对输入数据的泛化能力。
然而,BP神经网络也存在一些问题,如容易陷入局部最优解、过拟合等。
为了克服这些问题,可以采用一些技巧,如正则化、随机初始权重、早停等方法。
总结而言,BP神经网络的原理是通过前向传播和反向传播算法来训练网络,实现对输入数据的学习和预测。
通过调整权重和偏差,网络可以逐渐减少误差,提高准确性。
BP人工神经网络的基本原理模型与实例

BP人工神经网络的基本原理模型与实例BP(Back Propagation)人工神经网络是一种常见的人工神经网络模型,其基本原理是模拟人脑神经元之间的连接和信息传递过程,通过学习和调整权重,来实现输入和输出之间的映射关系。
BP神经网络模型基本上由三层神经元组成:输入层、隐藏层和输出层。
每个神经元都与下一层的所有神经元连接,并通过带有权重的连接传递信息。
BP神经网络的训练基于误差的反向传播,即首先通过前向传播计算输出值,然后通过计算输出误差来更新连接权重,最后通过反向传播调整隐藏层和输入层的权重。
具体来说,BP神经网络的训练过程包括以下步骤:1.初始化连接权重:随机初始化输入层与隐藏层、隐藏层与输出层之间的连接权重。
2.前向传播:将输入向量喂给输入层,通过带有权重的连接传递到隐藏层和输出层,计算得到输出值。
3.计算输出误差:将期望输出值与实际输出值进行比较,计算得到输出误差。
4.反向传播:从输出层开始,将输出误差逆向传播到隐藏层和输入层,根据误差的贡献程度,调整连接权重。
5.更新权重:根据反向传播得到的误差梯度,使用梯度下降法或其他优化算法更新连接权重。
6.重复步骤2-5直到达到停止条件,如达到最大迭代次数或误差小于一些阈值。
BP神经网络的训练过程是一个迭代的过程,通过不断调整连接权重,逐渐减小输出误差,使网络能够更好地拟合输入与输出之间的映射关系。
下面以一个简单的实例来说明BP神经网络的应用:假设我们要建立一个三层BP神经网络来预测房价,输入为房屋面积和房间数,输出为价格。
我们训练集中包含一些房屋信息和对应的价格。
1.初始化连接权重:随机初始化输入层与隐藏层、隐藏层与输出层之间的连接权重。
2.前向传播:将输入的房屋面积和房间数喂给输入层,通过带有权重的连接传递到隐藏层和输出层,计算得到价格的预测值。
3.计算输出误差:将预测的价格与实际价格进行比较,计算得到输出误差。
4.反向传播:从输出层开始,将输出误差逆向传播到隐藏层和输入层,根据误差的贡献程度,调整连接权重。
BP神经网络基本原理

BP神经网络基本原理2.1 BP神经网络基本原理BP网络模型处理信息的基本原理是:输入信号Xi通过中间节点(隐层点)作用于输出节点,经过非线形变换,产生输出信号Yk,网络训练的每个样本包括输入向量X和期望输出量t,网络输出值Y与期望输出值t之间的偏差,通过调整输入节点与隐层节点的联接强度取值Wij和隐层节点与输出节点之间的联接强度Tjk以及阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数(权值和阈值),训练即告停止。
此时经过训练的神经网络即能对类似样本的输入信息,自行处理输出误差最小的经过非线形转换的信息。
2.2 BP神经网络模型BP网络模型包括其输入输出模型、作用函数模型、误差计算模型和自学习模型。
(1)节点输出模型隐节点输出模型:Oj =f(∑Wij×Xi-qj) (1)输出节点输出模型:Yk =f(∑Tjk×Oj-qk) (2)f-非线形作用函数;q -神经单元阈值。
图1典型BP网络结构模型(2)作用函数模型作用函数是反映下层输入对上层节点刺激脉冲强度的函数又称刺激函数,一般取为(0,1)内连续取值Sigmoid函数: f(x)=1/(1+e-x)(3)(3)误差计算模型误差计算模型是反映神经网络期望输出与计算输出之间误差大小的函数: E p =1/2×∑(t pi -O pi )2 (4)t pi - i 节点的期望输出值;O pi -i 节点计算输出值。
(4)自学习模型神经网络的学习过程,即连接下层节点和上层节点之间的权重拒阵W ij 的设定和误差修正过程。
BP 网络有师学习方式-需要设定期望值和无师学习方式-只需输入模式之分。
自学习模型为△W ij (n+1)= h ×Фi ×O j +a ×△W ij (n) (5)h -学习因子;Фi -输出节点i 的计算误差;O j -输出节点j 的计算输出;a-动量因子。
BP神经网络的基本原理_一看就懂

BP神经网络的基本原理_一看就懂BP神经网络(Back Propagation Neural Network)是一种常用的人工神经网络模型,用于解决分类、回归和模式识别问题。
它的基本原理是通过反向传播算法来训练和调整网络中的权重和偏置,以使网络能够逐渐逼近目标输出。
1.前向传播:在训练之前,需要对网络进行初始化,包括随机初始化权重和偏置。
输入数据通过输入层传递到隐藏层,在隐藏层中进行线性加权和非线性激活运算,然后传递给输出层。
线性加权运算指的是将输入数据与对应的权重相乘,然后将结果进行求和。
非线性激活指的是对线性加权和的结果应用一个激活函数,常见的激活函数有sigmoid函数、ReLU函数等。
激活函数的作用是将线性运算的结果映射到一个非线性的范围内,增加模型的非线性表达能力。
2.计算损失:将网络输出的结果与真实值进行比较,计算损失函数。
常用的损失函数有均方误差(Mean Squared Error)和交叉熵(Cross Entropy)等,用于衡量模型的输出与真实值之间的差异程度。
3.反向传播:通过反向传播算法,将损失函数的梯度从输出层传播回隐藏层和输入层,以便调整网络的权重和偏置。
反向传播算法的核心思想是使用链式法则。
首先计算输出层的梯度,即损失函数对输出层输出的导数。
然后将该梯度传递回隐藏层,更新隐藏层的权重和偏置。
接着继续向输入层传播,直到更新输入层的权重和偏置。
在传播过程中,需要选择一个优化算法来更新网络参数,常用的优化算法有梯度下降(Gradient Descent)和随机梯度下降(Stochastic Gradient Descent)等。
4.权重和偏置更新:根据反向传播计算得到的梯度,使用优化算法更新网络中的权重和偏置,逐步减小损失函数的值。
权重的更新通常按照以下公式进行:新权重=旧权重-学习率×梯度其中,学习率是一个超参数,控制更新的步长大小。
梯度是损失函数对权重的导数,表示了损失函数关于权重的变化率。
BP神经网络的基本原理_一看就懂

5.4 BP神经网络的基本原理BP(Back Propagation)网络是1986年由Rinehart和McClelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。
BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。
它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)(如图5.2所示)。
5.4.1 BP神经元图5.3给出了第j个基本BP神经元(节点),它只模仿了生物神经元所具有的三个最基本也是最重要的功能:加权、求和与转移。
其中x1、x2…xi…xn分别代表来自神经元1、2…i…n的输入;wj1、wj2…wji…wjn则分别表示神经元1、2…i…n与第j个神经元的连接强度,即权值;bj 为阈值;f(·)为传递函数;yj为第j个神经元的输出。
第j个神经元的净输入值为:(5.12)其中:若视,,即令及包括及,则于是节点j的净输入可表示为:(5.13)净输入通过传递函数(Transfer Function)f (·)后,便得到第j个神经元的输出:(5.14)式中f(·)是单调上升函数,而且必须是有界函数,因为细胞传递的信号不可能无限增加,必有一最大值。
5.4.2 BP网络BP算法由数据流的前向计算(正向传播)和误差信号的反向传播两个过程构成。
正向传播时,传播方向为输入层→隐层→输出层,每层神经元的状态只影响下一层神经元。
若在输出层得不到期望的输出,则转向误差信号的反向传播流程。
通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程。
5.4.2.1 正向传播设 BP网络的输入层有n个节点,隐层有q个节点,输出层有m个节点,输入层与隐层之间(·),的权值为,隐层与输出层之间的权值为,如图5.4所示。
BP神经网络数学原理及推导过程

BP神经网络数学原理及推导过程BP神经网络(Backpropagation Neural Network),也称为反向传播神经网络,是一种常见的人工神经网络模型,主要用于解决回归和分类问题。
它在数学上涉及到多元微积分、线性代数和概率论等方面的知识。
本文将从数学原理和推导过程两个方面进行阐述。
一、数学原理:1. 激活函数(Activation Function):激活函数是神经网络中非线性变换的数学函数,用于引入非线性因素,增加神经网络的表达能力。
常见的激活函数有Sigmoid函数、ReLU函数等。
2. 前向传播(Forward Propagation):神经网络的前向传播是指将输入数据从输入层依次传递到输出层的过程。
在前向传播中,每个神经元接收上一层神经元传递过来的激活值和权重,计算出当前神经元的输出值,并将输出值传递给下一层神经元。
3. 反向传播(Backward Propagation):神经网络的反向传播是指根据损失函数的值,从输出层开始,沿着网络的反方向不断调整神经元的权重,以达到最小化损失函数的目的。
在反向传播中,通过链式法则计算每个神经元对损失函数的导数,进而利用梯度下降算法更新权重。
4. 误差函数(Error Function):误差函数用于衡量神经网络输出结果和真实值之间的差异,常见的误差函数有均方差(Mean Squared Error)函数和交叉熵(Cross Entropy)函数。
5.权重更新规则:反向传播算法中的核心部分就是权重的更新。
权重更新通常采用梯度下降算法,通过计算损失函数对权重的偏导数,按照负梯度方向更新权重值,使得损失函数逐渐减小。
二、推导过程:下面将以一个简单的多层感知机为例,推导BP神经网络的权重更新规则。
假设我们有一个三层的神经网络,第一层为输入层,第二层为隐藏层,第三层为输出层,隐藏层和输出层都使用Sigmoid激活函数。
1.前向传播:首先,我们根据输入层的输入值X和权重W1,计算隐藏层的输入值H1:H1=X*W1然后,将隐藏层的输入值H1带入到Sigmoid函数中,得到隐藏层的输出值A1:A1=σ(H1)接下来,根据隐藏层的输出值A1和权重W2,计算输出层的输入值H2:H2=A1*W2最后,将输出层的输入值H2带入到Sigmoid函数中,得到输出层的输出值A2:A2=σ(H2)2.反向传播:设输出层的输出值为Y,隐藏层的输出值为A1,损失函数为L。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.4 BP神经网络的基本原理BP(Back Propagation)网络是1986年由Rinehart和McClelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。
BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。
它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)(如图5.2所示)。
5.4.1 BP神经元图5.3给出了第j个基本BP神经元(节点),它只模仿了生物神经元所具有的三个最基本也是最重要的功能:加权、求和与转移。
其中x1、x2…xi…xn分别代表来自神经元1、2…i…n的输入;wj1、wj2…wji…wjn则分别表示神经元1、2…i…n与第j个神经元的连接强度,即权值;bj 为阈值;f(·)为传递函数;yj为第j个神经元的输出。
第j个神经元的净输入值为:(5.12)其中:若视,,即令及包括及,则于是节点j的净输入可表示为:(5.13)净输入通过传递函数(Transfer Function)f (·)后,便得到第j个神经元的输出:(5.14)式中f(·)是单调上升函数,而且必须是有界函数,因为细胞传递的信号不可能无限增加,必有一最大值。
5.4.2 BP网络BP算法由数据流的前向计算(正向传播)和误差信号的反向传播两个过程构成。
正向传播时,传播方向为输入层→隐层→输出层,每层神经元的状态只影响下一层神经元。
若在输出层得不到期望的输出,则转向误差信号的反向传播流程。
通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程。
5.4.2.1 正向传播设 BP网络的输入层有n个节点,隐层有q个节点,输出层有m个节点,输入层与隐层之间(·),的权值为,隐层与输出层之间的权值为,如图5.4所示。
隐层的传递函数为f1(·),则隐层节点的输出为(将阈值写入求和项中):输出层的传递函数为f2k=1,2,……q (5.15)输出层节点的输出为:j=1,2,……m (5.16)至此B-P网络就完成了n维空间向量对m维空间的近似映射。
5.4.2.2 反向传播1)定义误差函数输入个学习样本,用来表示。
第个样本输入到网络后得到输出(j=1,2,…m)。
采用平方型误差函数,于是得到第p个样本的误差E p:(5.17)式中:为期望输出。
对于个样本,全局误差为:(5.18)2)输出层权值的变化采用累计误差BP算法调整,使全局误差变小,即(5.19)式中:—学习率定义误差信号为:其中第一项:(5.21)第二项:(5.22)是输出层传递函数的偏微分。
于是:(5.23)由链定理得:(5.24)于是输出层各神经元的权值调整公式为:(5.25)3)隐层权值的变化(5.26)定义误差信号为:其中第一项:(5.28)依链定理有:(5.29)第二项:(5.30)是隐层传递函数的偏微分。
于是:(5.31)由链定理得:(5.32)从而得到隐层各神经元的权值调整公式为:(5.33)5.4.3 BP算法的改进BP算法理论具有依据可靠、推导过程严谨、精度较高、通用性较好等优点,但标准BP算法存在以下缺点:收敛速度缓慢;容易陷入局部极小值;难以确定隐层数和隐层节点个数。
在实际应用中,BP算法很难胜任,因此出现了很多改进算法。
1)利用动量法改进BP算法标准BP算法实质上是一种简单的最速下降静态寻优方法,在修正W(K)时,只按照第K步的负梯度方向进行修正,而没有考虑到以前积累的经验,即以前时刻的梯度方向,从而常常使学习过程发生振荡,收敛缓慢。
动量法权值调整算法的具体做法是:将上一次权值调整量的一部分迭加到按本次误差计算所得的权值调整量上,作为本次的实际权值调整量,即:(5.34)其中:α为动量系数,通常0<α<0.9;η—学习率,范围在0.001~10之间。
这种方法所加的动量因子实际上相当于阻尼项,它减小了学习过程中的振荡趋势,从而改善了收敛性。
动量法降低了网络对于误差曲面局部细节的敏感性,有效的抑制了网络陷入局部极小。
2)自适应调整学习速率标准BP算法收敛速度缓慢的一个重要原因是学习率选择不当,学习率选得太小,收敛太慢;学习率选得太大,则有可能修正过头,导致振荡甚至发散。
可采用图5.5所示的自适应方法调整学习率。
调整的基本指导思想是:在学习收敛的情况下,增大η,以缩短学习时间;当η偏大致使不能收敛时,要及时减小η,直到收敛为止。
3)动量-自适应学习速率调整算法采用动量法时,BP算法可以找到更优的解;采用自适应学习速率法时,BP算法可以缩短训练时间。
将以上两种方法结合起来,就得到动量-自适应学习速率调整算法。
4)L-M学习规则L-M(Levenberg-Marquardt)算法比前述几种使用梯度下降法的BP算法要快得多,但对于复杂问题,这种方法需要相当大的存储空间。
L-M(Levenberg-Marquardt)优化方法的权值调整率选为:(5.35)其中:e—误差向量;J—网络误差对权值导数的雅可比(Jacobian)矩阵;μ—标量,当μ很大时上式接近于梯度法,当μ很小时上式变成了Gauss-Newton法,在这种方法中,μ也是自适应调整的。
综合考虑,拟采用L-M学习规则和动量法分别作为神经网络的训练函数和学习函数。
5.5 BP神经网络的训练策略及结果本文借助于MATLAB神经网络工具箱来实现多层前馈BP网络(Multi-layer feed-forward backpropagation network)的颜色空间转换,免去了许多编写计算机程序的烦恼。
神经网络的实际输出值与输入值以及各权值和阈值有关,为了使实际输出值与网络期望输出值相吻合,可用含有一定数量学习样本的样本集和相应期望输出值的集合来训练网络。
训练时仍然使用本章5.2节中所述的实测样本数据。
另外,目前尚未找到较好的网络构造方法。
确定神经网络的结构和权系数来描述给定的映射或逼近一个未知的映射,只能通过学习方式得到满足要求的网络模型。
神经网络的学习可以理解为:对确定的网络结构,寻找一组满足要求的权系数,使给定的误差函数最小。
设计多层前馈网络时,主要侧重试验、探讨多种模型方案,在实验中改进,直到选取一个满意方案为止,可按下列步骤进行:对任何实际问题先都只选用一个隐层;使用很少的隐层节点数;不断增加隐层节点数,直到获得满意性能为止;否则再采用两个隐层重复上述过程。
训练过程实际上是根据目标值与网络输出值之间误差的大小反复调整权值和阈值,直到此误差达到预定值为止。
5.5.1 确定BP网络的结构确定了网络层数、每层节点数、传递函数、初始权系数、学习算法等也就确定了BP网络。
确定这些选项时有一定的指导原则,但更多的是靠经验和试凑。
1)隐层数的确定:1998年Robert Hecht-Nielson证明了对任何在闭区间内的连续函数,都可以用一个隐层的BP网络来逼近,因而一个三层的BP网络可以完成任意的n维到m维的映照。
因此我们从含有一个隐层的网络开始进行训练。
2) BP网络常用传递函数:BP网络的传递函数有多种。
Log-sigmoid型函数的输入值可取任意值,输出值在0和1之间;tan-sigmod型传递函数tansig的输入值可取任意值,输出值在-1到+1之间;线性传递函数purelin的输入与输出值可取任意值。
BP网络通常有一个或多个隐层,该层中的神经元均采用sigmoid型传递函数,输出层的神经元则采用线性传递函数,整个网络的输出可以取任意值。
各种传递函数如图5.6所示。
只改变传递函数而其余参数均固定,用本章5.2节所述的样本集训练BP网络时发现,传递函数使用tansig函数时要比logsig函数的误差小。
于是在以后的训练中隐层传递函数改用tansig函数,输出层传递函数仍选用purelin函数。
3)每层节点数的确定:使用神经网络的目的是实现摄像机输出RGB颜色空间与CIE-XYZ色空间转换,因此BP网络的输入层和输出层的节点个数分别为3。
下面主要介绍隐层节点数量的确定。
对于多层前馈网络来说,隐层节点数的确定是成败的关键。
若数量太少,则网络所能获取的用以解决问题的信息太少;若数量太多,不仅增加训练时间,更重要的是隐层节点过多还可能出现所谓“过渡吻合”(Overfitting)问题,即测试误差增大导致泛化能力下降,因此合理选择隐层节点数非常重要。
关于隐层数及其节点数的选择比较复杂,一般原则是:在能正确反映输入输出关系的基础上,应选用较少的隐层节点数,以使网络结构尽量简单。
本论文中采用网络结构增长型方法,即先设置较少的节点数,对网络进行训练,并测试学习误差,然后逐渐增加节点数,直到学习误差不再有明显减少为止。
5.5.2 误差的选取在神经网络训练过程中选择均方误差MSE较为合理,原因如下:①标准BP算法中,误差定义为:(5.36)每个样本作用时,都对权矩阵进行了一次修改。
由于每次权矩阵的修改都没有考虑权值修改后其它样本作用的输出误差是否也减小,因此将导致迭代次数增加。
②累计误差BP算法的全局误差定义为:(5.37)这种算法是为了减小整个训练集的全局误差,而不针对某一特定样本,因此如果作某种修改能使全局误差减小,并不等于说每一个特定样本的误差也都能同时减小。
它不能用来比较P和m不同的网络性能。
因为对于同一网络来说,P越大,E也越大; P值相同,m越大E也越大。
③均方误差MSE:(5.38)其中:—输出节点的个数,—训练样本数目,—网络期望输出值,—网络实际输出值。
均方误差克服了上述两种算法的缺点,所以选用均方误差算法较合理。
5.5.3 训练结果训练一个单隐层的三层BP网络,根据如下经验公式选择隐层节点数[125]:(5.39)取式中:n为输入节点个数,m为输出节点个数,a为1到10之间的常数。
针对本论文n1值范围为3~13。
训练结果如表5.1所示。
表5.1 隐层节点数与误差的关系隐层神经元个数训练误差测试误差3 1.25661 1.12754 0.797746 0.82325 0.631849 0.72786 0.570214 0.67077 0.552873 0.68958 0.445118 0.65759 0.385578 0.649710 0.259624 0.455511 0.185749 0.664412 0.183878 0.4813 0.168587 0.6671由上表可以看出:①增加隐层节点数可以减少训练误差,但超过10以后测试误差产生波动,即泛化能力发生变化。