卷积神经网络
简述卷积神经网络(CNN)和循环神经网络(RNN)的原理及应用场景

简述卷积神经网络(CNN)和循环神经网络(RNN)的原理及应用场景卷积神经网络(CNN)和循环神经网络(RNN)是当前深度学习领域最为重要和广泛应用的两种神经网络模型。
它们分别在计算机视觉和自然语言处理等领域取得了巨大的成功。
本文将从原理和应用场景两个方面进行详细介绍。
一、卷积神经网络(CNN)的原理及应用场景卷积神经网络(CNN)是一种专门用于处理具有网格结构数据的深度学习模型。
它最初是为了解决计算机视觉中的图像分类问题而提出的,但现在已经广泛应用于图像识别、目标检测、语义分割等多个领域。
1.1 原理卷积神经网络(CNN)主要由卷积层、池化层和全连接层组成。
其中,卷积层是CNN最重要的组成部分,它通过一系列滤波器对输入数据进行特征提取。
滤波器通过与输入数据进行点乘操作,得到特征图(feature map),从而捕捉到输入数据中的局部特征。
池化层用于减小特征图的尺寸,并保留重要特征。
常见的池化操作有最大池化和平均池化。
最大池化选择每个区域中的最大值作为输出,平均池化则选择每个区域的平均值作为输出。
这样可以减小特征图的尺寸,减少参数数量,从而降低计算复杂度。
全连接层将特征图转换为一维向量,并通过一系列全连接层进行分类或回归等任务。
全连接层中的每个神经元都与上一层中所有神经元相连,这样可以充分利用上一层提取到的特征进行分类。
1.2 应用场景卷积神经网络(CNN)在计算机视觉领域有着广泛应用。
其中最典型的应用场景是图像分类和目标检测。
在图像分类任务中,CNN可以通过学习到的特征提取器将输入图像分为不同类别。
例如,在ImageNet数据集上进行分类任务时,CNN可以实现对1000个不同类别进行准确分类。
在目标检测任务中,CNN可以识别并定位输入图像中存在的多个目标。
通过在卷积网络之后加入额外的回归和分类层,可以实现对目标位置和类别进行同时预测。
此外,在语义分割、人脸识别、图像生成等领域,CNN也有着广泛的应用。
卷积神经网络与循环神经网络

卷积神经网络与循环神经网络卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)是目前深度学习领域最为流行的两种神经网络架构。
它们分别适用于不同的数据类型和任务,能够有效地处理图像、语音、文本等各种形式的数据。
一、卷积神经网络卷积神经网络是一种专门用于处理格状数据(如图像)的神经网络模型。
它的核心思想是利用卷积操作对输入数据进行特征提取,然后通过池化操作减小特征图的尺寸,最后将提取到的特征输入全连接层进行分类或回归。
卷积神经网络的结构主要包括卷积层、池化层和全连接层。
1.1卷积层卷积层是卷积神经网络的核心组件,它通过卷积操作对输入数据进行特征提取。
卷积操作是指使用一个滤波器(也称为卷积核)在输入数据上进行滑动计算,得到对应位置的输出。
滤波器的参数是在训练过程中通过反向传播算法学习得到的。
在图像处理中,卷积操作可以帮助提取图像中的边缘、纹理、角点等特征。
卷积层一般会使用多个不同的滤波器,从而提取多个不同的特征。
1.2池化层池化层是利用池化操作对卷积层的输出进行降采样,从而减小特征图的尺寸。
常见的池化操作有最大池化和平均池化。
最大池化是保留每个区域内的最大值作为输出,平均池化是计算每个区域内的平均值作为输出。
池化操作的目的是减少计算复杂度和减小过拟合。
1.3全连接层全连接层是卷积神经网络的最后一层,它将池化层的输出作为输入进行分类或回归。
全连接层的每个神经元都与上一层的所有神经元相连,输出一个标量值。
全连接层通常使用一种称为softmax的函数将输出转化为概率分布,再根据不同任务进行相应的损失函数计算和优化。
卷积神经网络通过共享权重和局部感知野的设计,大大减少了模型参数的数量,同时也能够保留输入数据的局部结构特征。
这使得卷积神经网络在图像识别、目标检测、语义分割等计算机视觉任务中取得了很大的成功。
二、循环神经网络循环神经网络是一种专门用于处理序列数据(如语音、文本)的神经网络模型。
卷积神经网络概述

卷积神经⽹络
卷积神经⽹络(Convolutional Neural Network, CNN)是⼀种⽤于图像分类和识别的⼈⼯神经⽹络。
它通过使⽤卷积运算来提取图像的特征,从⽽实现对图像的分类。
CNN由输⼊层、卷积层、池化层、全连接层和输出层组成。
输⼊层⽤于接收图像数据,并将其转换为神经⽹络可以处理的形式。
卷积层则使⽤卷积核对图像进⾏卷积运算,从⽽提取图像的特征。
池化层则使⽤池化算法对卷积层的输出进⾏下采样,从⽽减少参数数量。
全连接层则将池化层的输出连接到输出层,从⽽实现图像的分类。
CNN的优点在于它可以有效地提取图像的特征,并且在计算量⽅⾯相对较⼩。
此外,CNN还可以通过调整卷积核的⼤⼩和数量来控制⽹络的复杂度。
然⽽,CNN也有⼀些缺点。
⾸先,它对数据的要求较⾼,需要⼤量的⾼质量数据才能达到较好的效果。
其次,CNN在处理⾮结构化数据⽅⾯的表现并不是很好。
总的来说,CNN是⼀种有效的图像分类⽅法,但它也有⼀些局限性。
在使⽤CNN 时,应该考虑到数据的质量和类型,并选择合适的⽹络结构和超参数。
此外,CNN也可以⽤于其他领域,例如⾃然语⾔处理、语⾳识别等。
在这些领域中,CNN可以通过使⽤卷积运算来提取序列数据的特征,从⽽实现对序列数据的分类。
在未来,CNN仍然有很⼤的发展潜⼒。
研究⼈员正在探索新的⽹络结构和训练⽅法,以提⾼CNN的准确率和效率。
此外,⼈⼯智能技术的发展也为CNN的发展提供了新的机会。
随着⼈⼯智能技术的不断发展,CNN有望在更多领域得到⼴泛应⽤。
卷积神经网络

卷积神经网络是一种用于图像、音频、文本等大量数据处理的神经网络,它通过对数据进行多层次的卷积和池化操作,从而提取出数据中的特征信息。
在近年来,已经成为人工智能领域中最具有影响力的技术之一,被广泛应用于计算机视觉、自然语言处理、语音识别等领域。
一、的基本结构(Convolutional Neural Networks,CNN)由多个卷积层、激活函数层、池化层和全连接层组成。
卷积层是CNN的核心部分,它以一定的步长在输入数据上进行卷积操作,从而提取出数据中的局部特征。
激活函数层通过非线性函数对卷积层的输出进行激活,提高了网络的非线性表达能力。
池化层通过将卷积层的输出进行降采样操作,降低了网络的计算复杂度,并保留了一定特征信息。
全连接层将网络的输出映射到目标值的空间中,输出最终的预测结果。
二、的优势相较于传统的机器学习算法,在图像、音频、文本等大量数据处理方面有着很多优势。
首先,能够自动提取数据中的特征信息,减少了人工干预的需求。
其次,具有较强的泛化能力,能够适应多种不同的数据。
另外,的计算量相对较小,适用于处理大规模数据。
三、的应用已经被广泛应用于计算机视觉、自然语言处理、语音识别等领域。
在计算机视觉方面,被用于图像分类、目标检测、图像分割等任务。
在自然语言处理方面,被用于文本分类、情感分析、机器翻译等任务。
在语音识别方面,被用于语音识别、语音情感识别等任务。
四、的未来随着人工智能技术的不断发展,将会成为人工智能领域中最为重要的技术之一。
未来,将会在更多的领域得到应用,在医疗、金融、教育等领域带来更多的改变。
同时,的算法和架构也将不断进行优化和改进,提供更好的性能和更高的效率。
总之,是一种重要的神经网络模型,具有很强的泛化能力和适应性,已经成为人工智能领域中的核心技术之一。
随着技术的不断发展与完善,将会在更广泛的领域得到应用,带来更多的改变和创新。
卷积神经网络(CNN)介绍

卷积神经网络(CNN)介绍一、基本概念CNN是卷积神经网络(Convolutional Neural Network)的缩写,是目前深度学习中应用广泛的一种神经网络型号,它是一种能够处理序列数据的深度学习模型,如语音识别、自然语言处理等在许多应用中被广泛使用。
CNN是一种前馈神经网络,每个神经元只与与其之前一段距离之内的神经元相连。
它具有强大的特征提取能力和权值共享机制,可以帮助识别出图像、音频和文本中的重要特征。
CNN将输入图像分成若干个子区域,每个子区域被称为卷积核,每个卷积核由若干个神经元组成。
每个卷积核得出一个特征图,这些特征图被拼接起来形成下一层的输入。
CNN在应用中通常包含卷积层、池化层、全连接层和Softmax 层等。
卷积层用于提取图像特征,池化层用于减少特征数量,全连接层用于分类,Softmax层用于输出最终分类结果。
然而,就像其他的技术一样,CNN在实践中也会遇到各种问题。
人工智能工程师在设计和调试CNN时,经常遇到的问题包括过拟合、欠拟合、梯度消失、训练速度慢等。
此外,当CNN 不起作用时,如何快速而准确地诊断相关问题也是一个极其重要的挑战。
二、故障分析与解决方案面对CNN故障,我们可以通过以下几个方面来进行诊断,并尝试找到解决方案。
1. 数据集问题CNN模型需要大量的数据才能训练出准确的模型。
如果训练集不够大,其结果可能会出现不准确的情况。
同时,过拟合也可能出现在训练集数据少,但是特征比较多时。
解决方案:增加训练集,尽可能丰富数据覆盖的范围。
此外,有效的数据预处理方法,如旋转、翻转、缩放等,也能有效地增加训练集的样本。
2. 设计问题CNN模型的设计非常重要,关系到CNN在应用中的准确性。
解决方案:对于CNN的设计,可以采用预训练模型,或选择较好的网络结构和优化算法。
3. 训练问题CNN模型需要进行“拟合”和“调整”,使其能够正确的分类图像。
解决方案:可以尝试增加训练次数或者采用其他的优化方法,如随机梯度下降(SGD)。
卷积神经网络简介及基本概念解析

卷积神经网络简介及基本概念解析近年来,卷积神经网络(Convolutional Neural Network,CNN)在计算机视觉领域取得了巨大的成功。
它是一种深度学习模型,通过模仿人脑的视觉处理方式,能够自动从图像中提取特征,并进行分类、识别等任务。
本文将对卷积神经网络的基本概念进行解析。
一、卷积神经网络的基本结构卷积神经网络由多个层次组成,包括输入层、卷积层、池化层和全连接层。
其中,输入层接收原始图像数据,卷积层通过卷积操作提取图像的特征,池化层用于减少特征图的大小,全连接层则将特征映射到具体的类别。
二、卷积操作卷积操作是卷积神经网络的核心。
它通过滑动一个卷积核(也称为过滤器)在输入图像上进行计算,从而提取图像的特征。
卷积操作可以捕捉到图像的局部信息,并且具有平移不变性,即对于图像的不同位置,卷积操作得到的特征是相同的。
三、激活函数在卷积神经网络中,激活函数被用于引入非线性。
常用的激活函数包括ReLU函数和Sigmoid函数。
ReLU函数在输入大于0时输出输入值,否则输出0,能够有效地解决梯度消失问题;Sigmoid函数将输入值映射到0到1之间,用于二分类问题。
四、池化操作池化操作用于减少特征图的大小,从而减少计算量,同时保留重要的特征。
常用的池化操作有最大池化和平均池化。
最大池化选取特定区域内的最大值作为输出,能够保留图像中的边缘和纹理等重要特征;平均池化计算特定区域内的平均值作为输出,能够平滑图像。
五、全连接层全连接层将卷积层和池化层得到的特征映射到具体的类别。
它将特征图展开成一维向量,并通过权重矩阵与偏置向量进行线性变换,然后通过激活函数得到最终的输出。
六、损失函数损失函数用于衡量模型输出与真实标签之间的差异。
常用的损失函数有交叉熵损失函数和均方误差损失函数。
交叉熵损失函数适用于分类问题,能够衡量模型输出的概率与真实标签的差异;均方误差损失函数适用于回归问题,能够衡量模型输出与真实值之间的差异。
卷积神经网络CNN

卷积神经网络CNN一、引言卷积神经网络(Convolutional Neural Network, CNN)是一种常用的深度学习算法,特别适合于处理图像、语音、自然语言等多维度数据。
其重要特点是局部感知和参数共享,这使得它能够快速准确地识别图像特征,并在不同的任务和场景中取得良好的表现。
本文主要介绍卷积神经网络的基本结构、原理和应用。
二、卷积神经网络结构卷积神经网络的基本结构包括输入层、卷积层、池化层、全连接层和输出层等部分。
其中,输入层用来接收原始图像或数据,卷积层和池化层用来提取图像特征,全连接层用来进行分类和回归等任务,输出层则表示最终的输出结果。
下面详细介绍每个部分的作用和特点。
1. 输入层输入层是卷积神经网络的第一层,主要用来接收原始图像或数据。
通常情况下,输入层的数据是二维图像,即图像的宽度、高度和颜色通道。
例如,一张彩色图片的宽度和高度都是像素的数量,而颜色通道就是RGB三个通道。
2. 卷积层卷积层是卷积神经网络的核心层,负责提取图像特征。
它主要通过卷积运算的方式,对输入层的数据进行处理,产生新的特征图。
卷积操作的核心思想是权重共享,即同一个卷积核在不同的位置上进行卷积操作,得到的特征图是一样的,这样能够大大减少网络参数量,防止过拟合现象出现。
卷积操作的数学表达式如下:$$Y = W*X + b$$其中,$W$是卷积核,$X$是输入特征图,$b$是偏置项,$Y$是输出特征图。
在卷积操作中,卷积核的参数是需要学习的参数,它的大小通常为$K*K$($K$是卷积核的大小),步幅通常为$S$。
卷积操作的结果是一个二维数组,它被称为输出特征图。
在实际应用中,卷积核的大小和步幅需要根据不同的数据类型和任务而定。
3. 池化层池化层是卷积神经网络的一个可选层,主要用来减少特征图的大小和数量,从而提高网络性能。
它通常有两种类型:最大池化和平均池化。
最大池化是取一个特征图中的最大值作为输出,而平均池化是取一个特征图中的平均值作为输出。
深度学习知识:卷积神经网络与循环神经网络的比较

深度学习知识:卷积神经网络与循环神经网络的比较深度学习(Deep Learning)是一种机器学习的方法,它旨在通过彼此之间有关的多层神经网络相互作用来解决复杂的模式识别问题。
在深度学习领域中,卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)是两种最常用的神经网络架构。
它们分别适用于不同类型的任务,且各有优劣。
本文将对卷积神经网络和循环神经网络进行较为全面的比较。
我们将首先分别介绍这两种网络的基本原理和结构,然后从不同的角度对它们进行比较,包括适用领域、处理长期依赖性、参数共享、计算效率等方面。
1.卷积神经网络卷积神经网络是一种专门用于处理图像、语音识别、自然语言处理等高维数据的神经网络。
其核心思想是局部感知(local perception)和参数共享(parameter sharing)。
卷积层通过滤波器(filter)来提取数据的特征,池化层(pooling layer)通过降采样(down-sampling)来减少数据维度,全连接层(fully connected layer)则用于输出分类结果。
1.1卷积层:卷积层通过一系列的滤波器对输入数据进行卷积运算,从而提取数据的空间信息。
卷积运算的优势在于参数共享,使得网络对于输入的平移、旋转、尺度变化具有一定的不变性。
1.2池化层:池化层用于减少数据维度,提高模型的鲁棒性。
常用的池化操作包括最大池化(max pooling)、平均池化(average pooling)等。
1.3全连接层:全连接层将卷积层和池化层提取的特征映射到具体的分类结果上。
2.循环神经网络循环神经网络是一种适用于处理序列数据的神经网络结构。
其核心特点是具有循环连接(recurrent connection),能够在网络内部建立记忆,从而处理不定长的输入序列。
为了解决长期依赖性(long-term dependency)的问题,循环神经网络引入了门控机制,其中最典型的模型是长短期记忆网络(Long Short-Term Memory,LSTM)和门控循环单元(Gated Recurrent Unit,GRU)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卷积神经网络摘要:卷积神经网络是近年来广泛应用于模式识别、图像处理等领域的一种高效识别算法,它具有结构简单、训练参数少和适应性强等特点。
本文从卷积神经网络的发展历史开始,详细阐述了卷积神经网络的网络结构、神经元模型和训练算法。
在此基础上以卷积神经网络在人脸检测和形状识别方面的应用为例,简单介绍了卷积神经网络在工程上的应用,并给出了设计思路和网络结构。
关键字:模型;结构;训练算法;人脸检测;形状识别0 引言卷积神经网络是人工神经网络的一种已成为当前语音分析和图像识别领域的研究热点,它的权值共享网络结构使之更类似于生物神经网络,降低了网络模型的复杂度,减少了权值的数量。
该优点在网络的输入是多维图像时表现的更为明显,使图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。
卷积网络是为识别二维形状而特殊设计的一个多层感知器,这种网络结构对平移、比例缩放、倾斜或者共他形式的变形具有高度不变性。
1 卷积神经网络的发展历史1962年Hubel和Wiesel通过对猫视觉皮层细胞的研究,提出了感受野(receptive field)的概念,1984年日本学者Fukushima基于感受野概念提出的神经认知机(neocognitron)可以看作是卷积神经网络的第一个实现网络,也是感受野概念在人工神经网络领域的首次应用。
神经认知机将一个视觉模式分解成许多子模式(特征),然后进入分层递阶式相连的特征平面进行处理,它试图将视觉系统模型化,使其能够在即使物体有位移或轻微变形的时候,也能完成识别。
神经认知机能够利用位移恒定能力从激励模式中学习,并且可识别这些模式的变化形,在其后的应用研究中,Fukushima将神经认知机主要用于手写数字的识别。
随后,国内外的研究人员提出多种卷积神经网络形式,在邮政编码识别和人脸识别方面得到了大规模的应用。
通常神经认知机包含两类神经元,即承担特征抽取的S-元和抗变形的C-元。
S-元中涉及两个重要参数,即感受野与阈值参数,前者确定输入连接的数目,后者则控制对特征子模式的反应程度。
许多学者一直致力于提高神经认知机的性能的研究:在传统的神经认知机中,每个S-元的感光区中由C-元带来的视觉模糊量呈正态分布。
如果感光区的边缘所产生的模糊效果要比中央来得大,S-元将会接受这种非正态模糊所导致的更大的变形容忍性。
我们希望得到的是,训练模式与变形刺激模式在感受野的边缘与其中心所产生的效果之间的差异变得越来越大。
为了有效地形成这种非正态模糊,Fukushima提出了带双C-元层的改进型神经认知机。
Trotin 等人提出了动态构造神经认知机并自动降低闭值的方法[1],初始态的神经认知机各层的神经元数目设为零,然后会对于给定的应用找到合适的网络规模。
在构造网络过程中,利用一个反馈信号来预测降低阈值的效果,再基于这种预测来调节阈值。
他们指出这种自动阈值调节后的识别率与手工设置阈值的识别率相若,然而,上述反馈信号的具体机制并未给出,并且在他们后来的研究中承认这种自动阈值调节是很困难的【8】。
Hildebrandt将神经认知机看作是一种线性相关分类器,也通过修改阈值以使神经认知机成为最优的分类器。
Lovell应用Hildebrandt的训练方法却没有成功。
对此,Hildebrandt 解释的是,该方法只能应用于输出层,而不能应用于网络的每一层。
事实上,Hildebrandt 没有考虑信息在网络传播中会逐层丢失。
Van Ooyen和Niehuis为提高神经认知机的区别能力引入了一个新的参数。
事实上,该参数作为一种抑制信号,抑制了神经元对重复激励特征的激励。
多数神经网络在权值中记忆训练信息。
根据Hebb学习规则,某种特征训练的次数越多,在以后的识别过程中就越容易被检测。
也有学者将进化计算理论与神经认知机结合【9】,通过减弱对重复性激励特征的训练学习,而使得网络注意那些不同的特征以助于提高区分能力。
上述都是神经认知机的发展过程,而卷积神经网络可看作是神经认知机的推广形式,神经认知机是卷积神经网络的一种特例。
卷积神经网络本身可采用不同的神经元和学习规则的组合形式。
其中一种方法是采用M-P神经元和BP学习规则的组合,常用于邮政编码识别中。
还有一种是先归一化卷积神经网络,然后神经元计算出用输入信号将权值和归一化处理后的值,再单独训练每个隐层得到权值,最后获胜的神经元输出活性,这个方法在处理二值数字图像时比较可行,但没有在大数据库中得到验证。
第三种方法综合前两种方法的优势,即采用McCulloch-Pitts神经元代替复杂的基于神经认知机的神经元。
在该方法中,网络的隐层和神经认知机一样,是一层一层训练的,但是回避了耗时的误差反向传播算法。
这种神经网络被称为改进的神经认知机。
随后神经认知机和改进的神经认知机作为卷积神经网络的例子,广泛用于各种识别任务中,比如大数据库的人脸识别和数字识别。
下面详细介绍卷积神经网络的原理、网络结构及训练算法。
2 卷积神经网络网络结构卷积神经网络是一个多层的神经网络,每层由多个二维平面组成,而每个平面由多个独立神经元组成。
网络中包含一些简单元和复杂元,分别记为S-元和C-元。
S-元聚合在一起组成S-面,S-面聚合在一起组成S-层,用U s表示。
C-元、C-面和C-层(U s)之间存在类似的关系。
网络的任一中间级由S-层与C-层串接而成,而输入级只含一层,它直接接受二维视觉模式,样本特征提取步骤已嵌入到卷积神经网络模型的互联结构中。
一般地,U s为特征提取层,每个神经元的输入与前一层的局部感受野相连,并提取该局部的特征,一旦该局部特征被提取后,它与其他特征间的位置关系也随之确定下来;U c是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射为一个平面,平面上所有神经元的权值相等。
特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。
此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数,降低了网络参数选择的复杂度。
卷积神经网络中的每一个特征提取层(S-层)都紧跟着一个用来求局部平均与二次提取的计算层(C-层),这种特有的两次特征提取结构使网络在识别时对输入样本有较高的畸变容忍能力【10】。
网络中神经元的输出连接值符合“最大值检出假说”【15】,即在某一小区域内存在的一个神经元集合中,只有输出最大的神经元才强化输出连接值。
所以若神经元近旁存在有输出比其更强的神经元时,其输出连接值将不被强化。
根据上述假说,就限定了只有一个神经元会发生强化。
卷积神经网络的种元就是某S-面上最大输出的S-元,它不仅可以使其自身强化,而且还控制了邻近元的强化结果。
因而,所有的S-元渐渐提取了几乎所有位置上相同的特征。
在卷积神经网络早期研究中占主导的无监督学习中,训练一种模式时需花费相当长的时间去自动搜索一层上所有元中具有最大输出的种元,而现在的有监督学习方式中,训练模式同它们的种元皆由教师设定。
图1是文献[12]中卷积神经网络的典型结构图。
将原始图像直接输入到输入层(U c1),原始图像的大小决定了输入向量的尺寸,神经元提取图像的局部特征,因此每个神经元都与前一层的局部感受野相连。
文中使用了4层网络结构,隐层由S-层和C-层组成。
每层均包含多个平面,输入层直接映射到U s2层包含的多个平面上。
每层中各平面的神经元提取图像中特定区域的局部特征,如边缘特征,方向特征等,在训练时不断修正S-层神经元的权值。
同一平面上的神经元权值相同,这样可以有相同程度的位移、旋转不变性。
S-层中每个神经元局部输入窗口的大小均为5x5,由于同一个平面上的神经元共享一个权值向量,所以从一个平面到下一个平面的映射可以看作是作卷积运算,S-层可看作是模糊滤波器,起到二次特征提取的作用。
隐层与隐层之间空间分辨率递减,而每层所含的平面数递增,这样可用于检测更多的特征信息。
图1 卷积神经网络结构图The structure of convolutional neural network神经元模型在卷积神经网络中,只有S-元间的输入连接是可变的,而其他元的输入连接是固定的。
用U sl (k l ,n )表示第l 级,第k l 个S-面上,一个S-元的输出,用U cl (k l ,n)表示在该级第k l 个C-面上一个C-元的输出。
其中,n 是一个二维坐标,代表输入层中神经元的感受野所在位置,在第一级,感受野的面积较小,随后随着l 的增大而增加。
()()()()()()()()⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-++++=∑∑--∈---111,,,1,111111n u k b k r k r v n k u k k v a k r n k u vl l l K k A v l cl l l l sl l l l φ 式中a l (v ,k l-1,k )和b l (k)分别表示兴奋性输入和抑制性输入的连接系数;r l (k)控制特征提取的选择性,其值越大,对噪音和特征畸变的容错性越差,它是一常量,它控制着位于每一S-层处的单个抑制子平面中每个神经元的输入: r l (k)的值越大,与抑制性成比例的兴奋性就得越大,以便能产生一个非零输出,换句话说就是相当好的匹配才一能激活神经元,然而因为r l (k)还需乘以φ(),所以r l 值越大就能产生越大的输出,相反,小的r l (k)值允许不太匹配的神经元兴奋,但它只能产生一个比较小的输出;φ(x)为非线性函数。
v 是一个矢量,表示处于n 感受野中的前层神经元n 的相对位置,A l 确定S 神经元要提取特征的大小,代表n 的感受野。
所以式中对v 的求和也就包含了指定区域当中所有的神经元;外面对于勺k l-1的求和,也就包含了前一级的所有子平面,因此在分子中的求和项有时也被称作兴奋项,实际上为乘积的和,输入到n 的神经元的输出都乘上它们相应的权值然后再输出到n c 。
()⎩⎨⎧<≥=0,00,x x x x φ 式表示的是指定某级(第l 级)、某层(S-层)、某面(第k l 个S-面)、某元(向量为n 处)的一个输出。
对于一个S-元的作用函数可分为两部分,即兴奋性作用函数和抑制性作用函数。
兴奋性作用使得膜电位上升,而抑制性作用起分流作用。
兴奋性作用为:()()∑∑--∈---+11,,,111l l l K k A v l cl l lv n k u k k v aS-元与其前一级C-层的所有C-面均有连接,所连接的C-元个数由该S-级的参数感受野A l 唯一确定。
网络中另一个重要的神经元是假设存在的抑制性神经元V-元U vl (n),它位于S-面上满足以下三个条件:环元的抑制作用影响整个网络的运作;C-元与V-元间存在着固定的连接;V-元的输出事先设为多个C-元输出的平均值。