基于神经网络的印刷体数字字符的识别_周泽华

合集下载

基于神经网络的印刷体数字识别算法的研究

基于神经网络的印刷体数字识别算法的研究

基于神经网络的印刷体数字识别算法的研究摘要印刷体数字识别(Printed Numeral Recognition)是光学字符识别技术(Optical Character Recognition, OCR)的一个分支,是文字识别的重要组成部分。

本文以VC为平台,运用人工神经网络的思想(主要采用BP神经网络),实现了对印刷体数字识别。

关键词数字识别;图像预处理;特征提取;神经网络引言目前,识别技术已经广泛地应用到了各个领域中。

为了达到对一幅图像中的数字进行识别的目的,我们要对图像进行一些处理,这些处理工作的好坏直接决定了识别的质量,这些处理技术依次为图像的读取、对读取的图像进行灰度变换、按照量化指标对灰度变换后的图像进行二值化、然后对二值化后的图像中的字符信息进行切分等。

在进行完上述预处理工作后进行特征提取,再输入到已经训练好的BP网络进行识别。

1 识别的流程识别的流程按照引言中的步骤进行,主要分为两大部分,第一部分为图像的预处理、第二部分为通过神经网络进行印刷体数字的识别。

预处理部分的流程:图像输入-灰度变换-图像二值化-紧缩重排-归一化调整-图像分割-特征提取。

神经网络数字识别的具体流程:样本训练-字符特征输入-识别并给出结果。

2 基于神经网络的特征提取算法概述图像在经过了前期的预处理后,由原来杂乱无章的字符变为了整齐排列的、大小相同的一列字符,在这里图像归一化后的宽度为8像素,高度为16像素,这样就大大方便了对字符特征的提取。

我们把提取的特征存储在特征向量里,然后把特征向量输入到神经网络中,这样就可以对字符进行识别了。

由以上的论述我们可以得出结论,特征提取的算法是整个识别过程的关键,它的好坏直接决定了识别的成败。

对图像中的字符进行特征提取的算法有很多,下面对几种重要的分别进行介绍。

2.1骨架特征提取法由于图像的来源不同,这就使得图像的线条所使用的像素不同,在图像上表现出来就是线条的粗细的不同,这样就使得它们的差别很大。

基于BP神经网络的手写数字识别系统研究

基于BP神经网络的手写数字识别系统研究

基于BP神经网络的手写数字识别系统研究一、概述随着信息技术的快速发展,手写数字识别技术已成为人工智能领域的一个重要研究方向。

手写数字识别系统能够自动地将手写数字图像转化为计算机可识别的数字信息,广泛应用于银行票据处理、邮政编码识别、移动支付等领域,极大地提高了工作效率和准确性。

BP神经网络作为一种强大的机器学习方法,在手写数字识别中展现出了显著的优势。

BP神经网络通过模拟人脑神经元的连接方式和信息处理机制,能够自动学习和提取手写数字图像中的特征,并通过不断调整网络参数来优化识别性能。

基于BP神经网络的手写数字识别系统具有较高的识别精度和鲁棒性。

BP神经网络在手写数字识别中的应用也面临着一些挑战。

手写数字的形态各异,存在大量的噪声和干扰因素,这要求神经网络具备强大的特征提取和抗干扰能力。

如何设计合理的网络结构、选择适当的训练算法以及优化网络参数,也是提高手写数字识别性能的关键问题。

本文旨在研究基于BP神经网络的手写数字识别系统,通过深入分析手写数字图像的特点和神经网络的原理,探索有效的特征提取和识别方法,以提高手写数字识别的准确性和稳定性。

本文还将对神经网络的优化算法进行研究,以进一步提高系统的性能。

1. 手写数字识别的背景与意义随着信息技术的迅猛发展,手写数字识别技术作为计算机视觉和模式识别领域的重要分支,逐渐受到广泛关注。

手写数字识别技术旨在通过计算机自动解析和识别手写数字,将其转化为计算机可处理的数字信息,从而实现信息的快速录入和处理。

手写数字识别技术具有广泛的应用场景和深远的意义。

在金融行业,手写数字识别技术可以应用于支票、汇票等票据的自动处理,提高业务处理效率,降低人为错误率。

在邮政行业,该技术可以辅助实现邮政编码的自动识别,提升邮件分拣速度和准确性。

在考试评分、数据录入、表单处理等场景中,手写数字识别技术也能发挥重要作用,显著提高工作效率和质量。

基于BP神经网络的手写数字识别系统研究具有重要的理论和实践价值。

基于神经网络的手写体识别技术研究

基于神经网络的手写体识别技术研究

基于神经网络的手写体识别技术研究手写体识别技术是一种通过计算机识别手写文字的技术。

随着人工智能技术的发展,基于神经网络的手写体识别技术逐渐得到了广泛应用。

本文将对基于神经网络的手写体识别技术进行研究,并介绍其原理、应用和挑战。

一、技术原理基于神经网络的手写体识别技术主要基于深度学习算法,其核心是卷积神经网络(CNN)。

CNN是一种通过模仿人类视觉系统工作原理设计的神经网络,通过多层卷积层和池化层的组合,可以有效提取图片特征。

在手写体识别中,首先需要建立一个训练集,包含大量的手写体样本和对应的标签。

然后,将这些样本输入到CNN模型中进行训练。

训练过程中,CNN模型会自动学习手写体字母和数字的特征,并建立内部的模式识别规则。

训练完成后,就可以使用已经训练好的CNN模型来识别新的手写体样本。

将新的手写体样本输入到CNN模型中,模型会根据学习到的特征进行判断,并输出对应的标签。

通过与训练集中的标签进行比较,就可以得到手写体样本的识别结果。

二、应用领域基于神经网络的手写体识别技术在多个领域有着广泛的应用。

1. 银行与金融:手写体识别技术可应用于支票的自动识读,减少人工劳动和错误率。

在银行行业,手写体识别技术可以用于自动填写客户信息,提高工作效率。

2. 邮政与物流:手写体识别技术可用于自动识别地址信息,提高邮件和包裹的分拣速度和准确性。

在物流行业,手写体识别技术可以用于自动识别快递单号,实现追踪查询。

3. 文字输入与编辑:手写体识别技术可以用于智能手机和平板电脑的手写输入,提高用户输入速度和方便性。

此外,手写体识别技术还可以用于手写文字的转换和编辑,方便文档整理和修改。

三、技术挑战在实际应用中,基于神经网络的手写体识别技术还面临一些挑战。

1. 数据采集与标注:为了训练一个准确的手写体识别模型,需要收集大量的手写体样本并进行标注。

手写体样本的采集和标注过程比较复杂和耗时,需要借助专业人员和设备。

2. 多样性与干扰:手写体的形状和风格千差万别,同时还可能受到噪声、倾斜、错位等因素的干扰。

基于BP神经网络的手写数字识别(Java)

基于BP神经网络的手写数字识别(Java)

基于BP神经网络的手写数字识别(Java)——大连东软信息学院陈思奇一、过程与步骤(一)、整体架构(制图使用processon)(二)、BP神经网络(摘自《机器学习》周志华)1.神经元模型神经网络:神经网络是由具有适应性的简单单元组成的广泛并行互联的网络,它的组织可以模拟生物神经系统对真实世界所做出的交互反应。

简单说来,神经网络是由多个基本的神经元组成的网络系统,每一个神经元有对应的输入和相应的输出。

利用下面的这幅图来说明单一的神经元的工作过程。

如图所示,此神经元有n个输入(x1,x2……xn),每一个输入都有一个对应的权重w,神经元会有一个阈值,将输入和权重进行乘积之后再与阈值相比较,作用于f函数之后得到输出。

在实际应用中,这里的f函数往往采用Sigmoid函数,这样可以将输出映射到0,1范围。

2.BP神经网络误差逆向传播(err BackPropagation)简称BP算法是神经网络中常见的训练算法。

BP 神经网络模型拓扑结构包括输入层(input),隐层(hidden layer)和输出层(output layer)。

它的学习规则是使用梯度下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。

现在给定数据集D={(),…..()},其中,输入样本是有d维的向量组成,输出样本是由L维的向量。

所以现在可以规划这样的一个神经网络,其中有d个输入,L个输出,中间的隐层可以设置成q个,如下图(图片来自《机器学习》)所示:如图所示,第h个隐层神经元的输入为d个输入神经元与各自对应的权值v的乘积之和,第j个输出神经元的输入为全部的q个隐层神经元的输出与各自对应的权值乘积之和。

隐层第h个神经元的阈值用表示,输出层第j 个神经元的阈值用表示。

现在假设神经元的输出表示为,即:采用均方误差最小化来最优化系数:BP神经网络采用梯度下降算法进行最优化对于优化目标的Ek,给定一个学习率,可以这样来进行优化:由于先影响到输出层第j个神经元的输入,再影响到其输出,最后影响到Ek,所以采用链式求导法则可得:其中,注意到Sigmoid函数求导之后有所以综合可得:所以类似可得:其中的表示为:对于每个训练样本,BP算法先将输入样例提供给输入神经元,然后逐层的将信号向前传播,直到产生输出层的结果,然后计算输出层的误差,再将误差逆向传播到隐层神经元,然后根据神经元的误差来对连接权值和与之进行调整优化,知道训练达到很小的误差值或者迭代到一定的次数。

基于神经网络的手写体数字的识别

基于神经网络的手写体数字的识别

基于神经网络的手写体数字的识别作者:宋季泽来源:《中国科技纵横》2019年第05期摘要:随着人工智能时代的到来,科研人员都开始思考如何提高现有的信息处理技术。

改善手写体数字的识别效果对信息技术发展有很大的推动作用。

卷积神经网络(CNN)是近年发展起来的一种高效识别方法,是多层感知机的一个变种模型,也是对BP神经网络的优化。

本文提出了一种基于CNN神经网络的手写体数字自动识别方法,利用从学习样本中提取的特征向量对分类器进行训练,并实现了分类识别。

本文重点阐述了支持神经网络的基本原理和该方法的实现过程,实验结果表明基于卷积神经网络的识别方法具有较好的效果。

关键词:手写体数字识别;BP神经网络;卷积神经网络中图分类号:TP182 文献标识码:A 文章编号:1671-2064(2019)05-0028-020 引言手写体数字识别问题源自邮政编码、统计报表、财务报表、银行票据处理等实际应用。

因此手写数字的识别研究一旦能够有效提升其精度并应用在实际工业经济领域中,可以减少很大人工工作量。

本文所使用的BP神经网络算法是应用于前馈型神经网络训练的著名算法,在原理上依赖于最优化理论中成熟的梯度下降算法。

CNN卷积神经网络是对BP神经网络的优化,它具有局部权值共享的特殊结构,减少了网络自由参数的个数,避免了对图像的复杂前期预处理,最明显的是在运行速度上明显高于BP神经网络。

本文首先对数字样本进行特征提取,然后分别通过BP神经网络和CNN卷积神经网络的方法进行识别,最后与采取KNN传统方法的实验结果进行了比较。

1 算法介绍1.1 BP神经网络BP网络(Back Propagation),是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。

前馈神经网络由输入层、中间层(隐层)和输出层组成。

相邻层之间的节点采取全连接方式。

这三个层分别有不同的功能,输入层负责处理输入的数据,数据形式往往是向量。

中间层是多层的神经网络,进行特征表示,最后的输出层输出符合实际需求的数据形式的数据。

【免费下载】基于神经网络的印刷体字母识别

【免费下载】基于神经网络的印刷体字母识别

层。若输出层的实际输出与期望的输出(教师信号)不符,则转入误差的反向传播 阶段。误差反传是将输出误差以某种形式通过隐藏层向输入层反传,并将误差分 摊给各层的所有单元,从而获得各层单元的误差信号,此误差信号即作为修正各 单元权值的依据。这种信号正向传播与误差反向传的各层权值调整过程,是周而 复始地进行的。权值不断调整的过程,也就是网络的学习训练过程。此过程一直 进行到网络输出的误差减少到可接受到的程度,或进行到预先设定的学习次数为 此。
2 BP 网络介绍
BP 神经网络又称误差反向传递神经网络。它是一种依靠反馈值来不断调整 节点之间的连接权值而构建的一种网络模型。它的整个体系结构分为输入层、 隐藏层和输出层,其中隐藏层根据具体情况的需要,可以是一层结构也可为多层 结构。 BP 算法的基本思想是:学习过程由信号的正向传播与误差的反向传播两个过程 组成。正向传播时,输入样本从输入层传入,经各隐藏层逐层处理后,传向输出
对全部高中资料试卷电气设备,在安装过程中以及安装结束后进行高中资料试卷调整试验;通电检查所有设备高中资料电试力卷保相护互装作置用调与试相技互术关,系电,力根保通据护过生高管产中线工资敷艺料设高试技中卷术资0配料不置试仅技卷可术要以是求解指,决机对吊组电顶在气层进设配行备置继进不电行规保空范护载高高与中中带资资负料料荷试试下卷卷高问总中题体资,配料而置试且时卷可,调保需控障要试各在验类最;管大对路限设习度备题内进到来行位确调。保整在机使管组其路高在敷中正设资常过料工程试况中卷下,安与要全过加,度强并工看且作护尽下关可都于能可管地以路缩正高小常中故工资障作料高;试中对卷资于连料继接试电管卷保口破护处坏进理范行高围整中,核资或对料者定试对值卷某,弯些审扁异核度常与固高校定中对盒资图位料纸置试.,卷保编工护写况层复进防杂行腐设自跨备动接与处地装理线置,弯高尤曲中其半资要径料避标试免高卷错等调误,试高要方中求案资技,料术编试5交写卷、底重保电。要护气管设装设线备置备4敷高动调、设中作试电技资,高气术料并中课3中试且资件、包卷拒料中管含试绝试调路线验动卷试敷槽方作技设、案,术技管以来术架及避等系免多统不项启必方动要式方高,案中为;资解对料决整试高套卷中启突语动然文过停电程机气中。课高因件中此中资,管料电壁试力薄卷高、电中接气资口设料不备试严进卷等行保问调护题试装,工置合作调理并试利且技用进术管行,线过要敷关求设运电技行力术高保。中护线资装缆料置敷试做设卷到原技准则术确:指灵在导活分。。线对对盒于于处调差,试动当过保不程护同中装电高置压中高回资中路料资交试料叉卷试时技卷,术调应问试采题技用,术金作是属为指隔调发板试电进人机行员一隔,变开需压处要器理在组;事在同前发一掌生线握内槽图部内纸故,资障强料时电、,回设需路备要须制进同造行时厂外切家部断出电习具源题高高电中中源资资,料料线试试缆卷卷敷试切设验除完报从毕告而,与采要相用进关高行技中检术资查资料和料试检,卷测并主处且要理了保。解护现装场置设。备高中资料试卷布置情况与有关高中资料试卷电气系统接线等情况,然后根据规范与规程规定,制定设备调试高中资料试卷方案。

基于神经网络的手写字体识别系统设计与实现

基于神经网络的手写字体识别系统设计与实现

基于神经网络的手写字体识别系统设计与实现Ⅰ.引言手写字体识别是一项重要的研究领域,它应用广泛,如优化自然语言处理,权重调整和电子商务等方面。

近年来,神经网络在手写字体识别领域得到了广泛应用,因为它可以从输入数据中自动进行特征提取,并能够学习复杂的非线性映射关系。

本文将介绍基于神经网络的手写字体识别系统的设计与实现。

Ⅱ.方法A. 数据处理本文利用EMNIST数据集进行实验,该数据集是一个包含28 x 28像素图像的大型手写数字和字符数据集。

经过处理,数据集被划分为训练集、验证集和测试集。

训练集包含85,000个样本,验证集包含15,000个样本,测试集包含10,000个样本。

B. 神经网络模型我们设计了一种基于卷积神经网络(CNN)的手写字体识别模型。

它包括两个卷积层和两个池化层,随后是两个全连接层和一个输出层。

每个卷积层后面跟着一个ReLU激活函数,全连接层也是如此。

在最后一层,输出层包括10个神经元,每个神经元对应一个数字类别。

C. 模型训练本文使用Adam优化器和交叉熵损失函数进行了模型的训练。

经过调整,当学习率设置为0.001时,模型可以有较好的训练效果。

在训练期间,我们在验证集上监控了分类准确率,从而选择最优的模型。

D. 模型评价我们评估了我们所建立的手写字体识别系统,在测试集上的分类准确率。

结果表明,该模型能够实现92%以上的分类准确率。

Ⅲ.结果本文所建立的手写字体识别系统采用了基于卷积神经网络的方法。

我们将EMNIST数据集分为三个部分:训练集,验证集和测试集。

训练集用于训练模型,验证集用于选择最优模型,测试集用于评价最终的分类效果。

结果表明,该系统具有较高的分类准确率。

Ⅳ.讨论与结论本文介绍了一种基于神经网络的手写字体识别系统的设计与实现。

通过对EMNIST数据集进行训练和测试,我们发现该系统具有较好的分类效果。

我们还发现,比较模型的准确性和速度非常重要。

我们需要在保证准确性的基础上,不断寻找更快速的模型,以提高识别效率。

基于神经网络的手写英文字母识别技术研究

基于神经网络的手写英文字母识别技术研究

基于神经网络的手写英文字母识别技术研究随着人工智能技术的不断发展,基于神经网络的手写英文字母识别技术在近年来得到了众多关注和研究。

该技术能够将手写的英文字母图像转化为可识别的数字,从而实现自动化识别和处理。

本文将就该技术的原理、发展历程、应用场景等方面进行探讨。

一、基本原理基于神经网络的手写英文字母识别技术,其主要原理是将手写的字母图像进行数字化处理和特征提取。

这一过程中,我们需要将一幅字母图像进行抽象,将其转换为数字信号,以便进行神经网络的学习和训练。

在这个过程中,涉及到的主要技术包括图像数字化、信号处理、特征提取、神经网络训练等。

二、发展历程随着计算机技术的不断发展和深入,基于神经网络的手写英文字母识别技术得到了广泛的应用和研究。

早在20世纪80年代,就有学者开始研究基于神经网络的手写英文字母识别技术。

当时技术还比较落后,图像处理和特征提取等环节存在较大的误差和漏洞。

不过,随着计算机技术的不断提升和神经网络算法的不断改进,该技术开始逐渐被应用在各种场景中。

比如,银行业务中的手写数字识别、邮政业务中的邮政编码识别、签名识别、车牌识别、手写数字输入等。

同时,在科技领域的不断发展,大数据和云计算等技术也为该技术的优化和提升提供了充足的支撑。

三、应用场景基于神经网络的手写英文字母识别技术具有广泛的应用场景。

其主要应用于以下方面:1、邮政编码识别:在现代物流业性中,邮政编码的自动识别是必不可少的一项基础工作。

而基于神经网络的邮政编码识别技术,可以准确地从手写体中识别出邮政编码。

2、签名识别:在现代社会中,签名已成为诸多行业中处理文件的必备手段。

而基于神经网络的签名识别技术,可以对签名进行可靠地自动识别。

3、车牌识别:在现代交通管理和监控系统中,车牌识别是非常重要的一项技术。

基于神经网络的车牌识别技术,可以在车辆通行过程中实时自动识别车牌号码以及车辆基本信息。

4、手写数字识别:现代数字输入技术中,手写数字输入已成为相当普遍的一种方式。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

110基于神经网络的印刷体数字字符的识别*周泽华,胡学友,谭 敏,张为堂(合肥学院电子信息与电气工程系 合肥,230601)摘 要:提出了一种基于BP网络的印刷体数字字符的识别方法。

通过对BP网络的研究与学习,设计了一种结构合理,收敛速率快的BP网络。

实验结果表明,该方法对标准的印刷体数字字符的识别率达到了100%,对有1~3度倾斜角度的字符识别率也达到了96%以上。

关键词:神经网络;BP网络;印刷体数字字符识别Abstract: A method based on BP neural network was put forward to realize printed numeric character diagnosis, with satisfied resultsin experimental test. The rate reaches 100% for standard printed numbers and more than 96% for tilt character with 1-3 angles.Key words: Neural network ; BP network ; Printed numeric character中图分类号:TP181 文献标识码:B 文章编号:1001-9227(2009)05-0110-030 引 言印刷体数字识别有极大的实用价值,它可以应用于身份证号码识别、汽车牌照识别、银行票据识别等各种印刷体编号的识别,涉及到交通、银行、教育和邮政等多个领域。

它是字符识别的一个重要分支,现有的识别方法主要可分为两类:基于统计特征的方法[1]和基于结构特征的方法[2]。

由于印刷体数字恰是一种结构性字符,一般采用“特征提取+分类器”的方法[3-5]进行分类识别。

近年来,人工神经网络以其高度并行性、良好的容错性、联想记忆功能力、自适应和自学习等特点,备受人们重视,在字符识别领域得到了广泛的应用。

本文对神经网络分类器进行研究,提出了一种基于BP网络的印刷体数字字符识别系统的实现方法,为印刷体数字字符识别提供了一条识别率高,识别速度快的新途径。

1 人工神经网络神经网络是由大量处理单元(神经元、处理元件、电子元件、光电元件等)广泛互连而成的网络,它是在现代神经科学研究成果的基础上提出的,反映了人脑功能的基本特征。

人工神经网络是一个并行的分布处理结构,它的工作原理是以人脑的组织结构和活动规律为背景,反映了人脑的很多特征,但并不是对人脑部分的真实实现。

人工神经网络是通过人工神经元模型来实现模拟生物神经元,人工神经元相当于一个多输入单输出的非线性阈值器件。

BP神经网络是指采用了BP算法的多层前向神经网络。

典型的三层BP神经网络结构如图1所示。

它由输入层、隐含层(中间层)和输出层组成。

其中,X 1,X 2,…X 3为输入向量,T 1,T 2,…T n 为神经元的阈值,W ij ,W jp 为连接权值,Y 1,Y 2,…Y n 为输出向量。

网络按有导师指导的方式进行学习,输入信息传播到隐含层结点上,经过logsig型(也可以是其他函数)的激活函数运算后,将隐含结点的输出信息传播到输出结点,在输出层的各神经元获得网络的输入响应。

如果输出层不能得到期望输出,即实际输出值与期望输出值之间有误差,那么就将误差信号沿原来的连接通路返回,逐次向输入层传播并进行计算,逐层修正各连接权,再经过正向传播过程。

这两个过程反复进行,使得误差信号不断减小,网络对输入信息响应的正确率不断提高。

当误差达到所期望的要求时,网络的学习过程就结束。

图1 典型的三层BP神经网络结构2 BP网络的设计与实现2.1 字符特征提取在进行BP网络设计之前,我们要对待识别的字符进行特征提取,本设计是选取字符的网格特征作为识别的特收稿日期:2009-05-20*基金项目:安徽省教育厅自然科学研究重点项目(KJ2009A55)、合肥学院科研发展基金重点项目(09KY02ZD)、合肥学院自然科学研究发展基金一般项目(09KY02ZR)资助。

作者简介:周泽华(1982-),男,安徽宿松人,助教,硕士,主要研究方向为数字图像处理。

基于神经网络的印刷体数字字符的识别 周泽华,等《自动化与仪器仪表》2009年第5期(总第145期)111征,将提取的字符特征直接输入到BP神经网络分类器进行训练。

图2是一个归一化后的二值数字0字符点阵图像,图3是0字符的32×24象素网格特征图,白象素1表示该点有笔划,黑象素0表示该点没有笔划。

图2 待识别的0字符2.2 BP网络的设计BP网络设计的最大特点就是网络的权值是通过使网络输出与样本输出之间的误差平方和达到期望值而不断调整网络的权值训练出来的。

进行神经网络设计的首要任务就是网络结构的确定,一般情况下,网络结构的设计包括:输入输出神经元个数、隐含层个数、隐含层中神经元数目以及每层传递函数来确定。

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 00 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 00 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 00 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 1 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 00 0 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0图3 32×24的网络特征图(1)输入层神经元个数输入层神经元个数根据待识别字符所提取的网格像素特征的维数大小确定。

在本系统中,对归一化为32×24点阵大小的字符,以每一个像素点为一个网格,故输入层神经元个数取768。

(2)输出层神经元个数如果BP网络用作分类器,其类别数为m个,那么输出一般也就取m个神经元。

本系统是对0~9这10个数字进行识别,故输出层应为10个神经元。

(3)隐含层个数神经网络的许多特性正是由于隐含层的存在才具备,然而,具体取多少隐含层合适却没有确定的规律可循,不同的应用对象,与其相适应的网络结构差别很大。

理论上已经证明:具有偏差和至少一个S型隐含层加上一个线性输出层的网络,能够逼近任何有理函数,也即含有一个隐含层的三层BP网络即可完成非线性函数的逼近。

由于BP网络的功能实际上是通过网络输入到网络输出的计算来完成的,所以多于一个隐含层的BP网络虽然具有更快的训练速度,但在实际中需要较多的计算时间;另一方面,训练速度也可以通过增加隐含层神经元数来达到。

因此,本系统采用具有一个隐含层的三层BP神经网络。

(4)隐含层中神经元数目在实际设计中,确定隐含层神经元个数的办法是:对于给定的输入输出模式,通过反复调试和对不同神经元数进行训练对比得到合适的值。

下面为隐含层神经元个数选择的经验公式: (1)式中,h_num 为隐藏层神经元个数,i_num 为输入层神经元个数,o_num 为输出层神经元个数。

由此公式可得本系统的隐含层神经元个数h_num 应为92个。

(5)每层传递函数由于logsig函数不仅具有光滑、可微、非线性和饱和等特性,而且导函数容易用其本身来表达,简化了计算。

故本系统中采用了logsig函数作为传递函数,其算法是: (2)2.3 BP网络的训练和字符识别本系统主要包括两个部分:一是训练网络;二是运用已训练好的网络对待测试字符进行识别处理,整个系统框图如图4所示。

a)样本训练 b)字符测试图4 字符识别系统框图训练的样本是从已归一化好的单个数字字符数据库中所随机抽取的100个样本,即0~9中每个字符的样本数112都为10个。

相关文档
最新文档