(完整版)基于神经网络的手写数字识别系统的设计与实现毕业论文
理工科毕业设计范文

理工科毕业设计范文毕业设计是学生在大学阶段完成自己专业学习的重要环节之一,它旨在让学生通过独立思考、独立设计和实践操作等一系列过程,培养其综合运用所学知识和能力解决问题的能力,并为进一步深入学习和就业做好充分准备。
下面是一篇理工科毕业设计范文,供参考。
题目:基于机器学习的手写数字识别系统设计与实现摘要:本文介绍了一种基于机器学习的手写数字识别系统设计和实现方法。
该系统使用MNIST手写数字数据集进行训练和测试,并采用Python编程语言和Scikit-learn机器学习库进行开发。
在系统开发过程中,我们首先对数据集进行了预处理和特征提取,并采用支持向量机算法进行分类和预测。
实验结果表明,该系统能够高效地对手写数字进行准确识别,具有较高的实用价值和应用前景。
关键词:机器学习;手写数字识别;支持向量机;Python1.引言手写数字识别是人工智能技术应用的一个重要领域,它广泛应用于自动化识别、计算机视觉、人机交互等领域。
传统的手写数字识别方法基于特征提取和分类器设计,但这种方法需要手工提取特征,缺乏普适性和可扩展性。
近年来,随着深度学习和机器学习技术的不断发展,基于神经网络的手写数字识别方法逐渐成为研究热点。
本文旨在介绍一种基于机器学习的手写数字识别系统设计和实现方法,以提高识别准确率和效率。
2.相关技术2.1 机器学习机器学习是人工智能领域中最有前途和最实用的技术之一。
它旨在让计算机通过数据学习规律和模式,从而更好地完成任务。
通常,机器学习可以分为有监督学习、无监督学习和增强学习三种类型,其中有监督学习是手写数字识别问题的主要解决方法。
2.2 手写数字识别数据集MNIST是一个基于手写数字的图像数据集,由60,000个训练样本和10,000个测试样本组成。
每个样本大小为28*28像素,表示0-9十个数字之一。
该数据集是手写数字识别领域最为常用和基础的数据集之一,可供研究者进行算法研究和评估。
2.3 支持向量机支持向量机(Support Vector Machine, SVM)是一种监督学习算法,可用于分类和回归问题。
基于BP神经网络的手写数字识别系统研究

基于BP神经网络的手写数字识别系统研究一、概述随着信息技术的快速发展,手写数字识别技术已成为人工智能领域的一个重要研究方向。
手写数字识别系统能够自动地将手写数字图像转化为计算机可识别的数字信息,广泛应用于银行票据处理、邮政编码识别、移动支付等领域,极大地提高了工作效率和准确性。
BP神经网络作为一种强大的机器学习方法,在手写数字识别中展现出了显著的优势。
BP神经网络通过模拟人脑神经元的连接方式和信息处理机制,能够自动学习和提取手写数字图像中的特征,并通过不断调整网络参数来优化识别性能。
基于BP神经网络的手写数字识别系统具有较高的识别精度和鲁棒性。
BP神经网络在手写数字识别中的应用也面临着一些挑战。
手写数字的形态各异,存在大量的噪声和干扰因素,这要求神经网络具备强大的特征提取和抗干扰能力。
如何设计合理的网络结构、选择适当的训练算法以及优化网络参数,也是提高手写数字识别性能的关键问题。
本文旨在研究基于BP神经网络的手写数字识别系统,通过深入分析手写数字图像的特点和神经网络的原理,探索有效的特征提取和识别方法,以提高手写数字识别的准确性和稳定性。
本文还将对神经网络的优化算法进行研究,以进一步提高系统的性能。
1. 手写数字识别的背景与意义随着信息技术的迅猛发展,手写数字识别技术作为计算机视觉和模式识别领域的重要分支,逐渐受到广泛关注。
手写数字识别技术旨在通过计算机自动解析和识别手写数字,将其转化为计算机可处理的数字信息,从而实现信息的快速录入和处理。
手写数字识别技术具有广泛的应用场景和深远的意义。
在金融行业,手写数字识别技术可以应用于支票、汇票等票据的自动处理,提高业务处理效率,降低人为错误率。
在邮政行业,该技术可以辅助实现邮政编码的自动识别,提升邮件分拣速度和准确性。
在考试评分、数据录入、表单处理等场景中,手写数字识别技术也能发挥重要作用,显著提高工作效率和质量。
基于BP神经网络的手写数字识别系统研究具有重要的理论和实践价值。
基于神经网络的手写字符识别系统设计与优化

基于神经网络的手写字符识别系统设计与优化手写字符识别是指通过计算机视觉技术将手写的字符转化为计算机可识别的数字或字母。
神经网络作为一种常用的机器学习算法,已被广泛应用于手写字符识别系统中。
本文将围绕如何设计和优化基于神经网络的手写字符识别系统展开论述。
首先,设计一个基于神经网络的手写字符识别系统需要考虑以下几个关键步骤:数据集的预处理、网络架构的选择、模型训练和优化。
在数据集的预处理阶段,首先收集足够多的手写字符样本,并将其进行标注。
然后,对这些样本进行图像处理,例如去噪、灰度化、归一化等,以提高模型的鲁棒性和准确性。
此外,可以采用数据增强技术如旋转、缩放、平移等操作,扩充训练样本的多样性,以提高模型的泛化能力。
接下来,选择合适的神经网络架构对手写字符进行识别。
常用的神经网络包括多层感知机(MLP)、卷积神经网络(CNN)和循环神经网络(RNN)等。
针对手写字符识别任务,通常选择卷积神经网络作为基础架构,因其在图像处理领域具有较好的性能。
可以选用已经在手写字符识别任务上得到验证的经典网络,如LeNet-5、AlexNet、ResNet等,也可以通过网络调整和改进来满足特定需求。
在模型训练阶段,需要将数据集划分为训练集、验证集和测试集,并采用适当的损失函数和优化算法对模型进行训练。
常用的损失函数有交叉熵损失、均方误差等,优化算法包括梯度下降法、Adam等。
此外,可以采用学习率衰减、正则化、dropout等技术来缓解过拟合问题,进一步提升模型的泛化能力。
在模型训练完成后,需要对模型进行评估和优化。
可以使用准确率、精确率、召回率等指标来评估模型的性能,并针对性地进行优化。
优化的方法包括调整超参数(如学习率、批量大小、网络深度等)、集成学习、模型融合等。
此外,还可以尝试一些先进的技术来提升手写字符识别系统的性能。
例如,可以引入循环神经网络来处理序列信息,利用注意力机制来提高对关键特征的关注度,使用迁移学习来适应不同场景的手写字符识别等。
手写体数字识别系统的设计与实现

手写体数字识别系统的设计与实现1. 简介手写体数字识别系统是指能够通过计算机对手写数字进行自动识别的一种系统,是人工智能领域的重要应用之一。
本文将介绍一个基于卷积神经网络的手写体数字识别系统的设计与实现。
2. 数据集首先,我们需要收集手写数字图像作为训练数据和测试数据。
可以使用已有的开源数据集,如MNIST数据集,也可以自己手写一些数字进行图像采集。
经过数据预处理和清洗后,我们得到了包含10000张28x28像素的手写数字图像作为训练集,5000张图像作为测试集。
3. 模型设计本文使用了一个卷积神经网络模型进行手写数字识别。
该模型包括三个卷积层、三个池化层和两个全连接层。
3.1 卷积层和池化层卷积层可以通过滑动一个卷积核提取图像的重要特征,池化层则可以进行特征的降维和压缩。
同时,使用卷积层和池化层可以大大减少参数数量,加快模型训练速度。
3.2 全连接层全连接层通过将所有卷积层和池化层的输出展开为一维向量,再进行分类,得出预测结果。
全连接层参数量较大,容易出现过拟合和训练时间长的问题。
3.3 Dropout过拟合是机器学习中的常见问题,为了避免模型过拟合,我们使用了dropout方法。
dropout是指在训练过程中以一定的概率随机选择一些节点并将其权重设置为0,这样可以让模型更加健壮。
4. 实现模型的实现使用Python语言和Keras深度学习框架。
我们将数据集的图像转换为28x28的矩阵,并进行归一化处理。
接着,我们定义了一个卷积神经网络模型,并进行模型的编译和训练。
训练过程中,我们使用了Adam优化器和交叉熵损失函数,并进行了10轮的迭代训练。
实际测试中,该模型的准确率达到了98%以上。
5. 结论本文介绍了一个基于卷积神经网络的手写体数字识别系统,并实现了该系统。
该模型在测试集上取得了很好的识别效果,能够对手写数字进行准确识别。
同时,我们也讨论了卷积神经网络中的关键概念和技术要点,希望读者能够对深度学习和计算机视觉有更深入的了解。
基于神经网络的手写数字识别算法设计与实现

基于神经网络的手写数字识别算法设计与实现手写数字识别是计算机视觉和人工智能领域的经典问题之一。
在过去的几十年中,神经网络被广泛应用于手写数字识别任务,并取得了显著的成果。
本文将介绍一种基于神经网络的手写数字识别算法的设计和实现。
一、介绍手写数字识别是指将手写的数字图像转化为计算机可识别的数字。
目前,神经网络是最常用的用于手写数字识别的算法之一。
神经网络可以通过训练样本学习并自动提取特征,从而实现对手写数字的识别。
二、算法设计1. 数据集准备手写数字识别算法的训练离不开一个具有标签的大型数据集。
常用的数据集包括MNIST和自定义的数据集。
在这里,我们选择使用MNIST数据集作为训练和测试数据。
2. 神经网络结构设计神经网络的结构是手写数字识别算法的核心。
传统的神经网络结构包括输入层、隐藏层和输出层。
其中,输入层的神经元数量为输入图像的像素数,输出层的神经元数量为0-9的10个数字。
隐藏层的数量和每一层的神经元数量可以根据实际需求进行设计。
3. 特征提取神经网络可以通过前向传播的过程自动地提取输入图像的特征。
这些特征可以帮助神经网络更好地理解和区分不同的手写数字。
4. 权重训练神经网络中的权重是连接不同神经元之间的参数。
通过反向传播算法,可以根据损失函数来优化权重参数。
训练的目标是使神经网络能够准确地预测输入图像的数字标签。
5. 模型评估在训练完成后,我们需要对模型进行评估。
常用的评估指标包括准确率、精确率、召回率和F1分数等。
这些指标可以帮助我们了解模型在不同情况下的性能。
三、算法实现手写数字识别算法的实现可以使用编程语言如Python、MATLAB 等。
以下是一种Python实现的伪代码:```pythonimport numpy as np# 神经网络结构设计input_size = 784hidden_size = 100output_size = 10# 权重初始化w1 = np.random.randn(input_size, hidden_size) w2 = np.random.randn(hidden_size, output_size) # 前向传播def forward(x):# 输入层到隐藏层z1 = np.dot(x, w1)h1 = sigmoid(z1)# 隐藏层到输出层z2 = np.dot(h1, w2)out = sigmoid(z2)return out# 反向传播def backward(x, out, y):# 计算损失函数的导数delta2 = (out - y) * sigmoid_derivative(out)# 更新权重w2 -= learning_rate * np.dot(h1.T, delta2)w1 -= learning_rate * np.dot(x.T, np.dot(delta2, w2.T) * sigmoid_derivative(h1))# 模型训练for epoch in range(num_epochs):for i, (x, y) in enumerate(train_data):# 前向传播out = forward(x)# 反向传播backward(x, out, y)# 模型评估correct = 0total = 0for x, y in test_data:out = forward(x)prediction = np.argmax(out)if prediction == y:correct += 1total += 1accuracy = correct / total```四、总结本文介绍了基于神经网络的手写数字识别算法的设计和实现。
基于神经网络的手写汉字识别技术研究与实现

基于神经网络的手写汉字识别技术研究与实现手写汉字识别技术的发展在近年来取得了重要突破,以神经网络为基础的识别方法被广泛应用和研究。
本文将对基于神经网络的手写汉字识别技术进行深入研究和实现。
一、引言手写汉字识别是计算机视觉领域中的一个重要问题,其应用广泛涵盖了人机交互、文本识别、自然语言处理等领域。
传统的手写汉字识别技术通常采用特征提取和模式识别方法,但其面对复杂的汉字结构和不同书写风格时,识别准确率较低。
近年来,随着深度学习和神经网络的快速发展,基于神经网络的手写汉字识别技术逐渐成为研究热点。
二、神经网络的原理神经网络是一种模拟人脑神经元网络的计算模型,其核心思想是通过模拟人脑神经元之间的连接,实现信息的自动处理和学习。
在手写汉字识别中,我们可以将每个汉字看作是一个模式,通过训练神经网络,使其能够准确地识别不同汉字模式。
神经网络的核心组件是神经元,每个神经元接收来自其他神经元的输入,并通过激活函数处理后生成输出。
神经网络的结构由多层神经元组成,包括输入层、隐藏层和输出层。
输入层接收手写汉字图像的像素作为输入,隐藏层通过一系列的加权和激活函数运算提取汉字的抽象特征,输出层则给出每个汉字的识别结果。
三、基于神经网络的手写汉字识别方法基于神经网络的手写汉字识别方法主要分为训练和测试两个阶段。
在训练阶段,我们首先构建神经网络的结构,并准备一批手写汉字的训练样本。
样本应包含多种不同书写风格和字体的汉字,并进行标记以便于后续的训练。
然后,我们通过反向传播算法不断调整神经网络的参数,使其能够准确地学习和识别手写汉字。
在测试阶段,我们使用另外一批手写汉字的测试样本来验证神经网络的泛化能力和准确率。
测试样本应包含未出现在训练集中的汉字,以检测神经网络是否能够正确识别新样本。
通过计算识别结果与标准结果的误差,评估神经网络的性能。
四、基于神经网络的手写汉字识别技术的实现为了实现基于神经网络的手写汉字识别技术,我们可以使用各种深度学习框架和工具,如TensorFlow、PyTorch等。
手写识别模式识别实验论文

手写数字识别系统的设计与实现摘要手写体数字识别是文字识别中的一个研究课题,是多年来的研究热点,也是模式识别领域中最成功的应用之一。
主要功能是通过在点击手写数字识别菜单下的绘制数字标签弹出的绘制数字窗口中完成数字的手写,在此窗口中可以进行数字的保存及清屏,然后通过文件菜单中的打开标签打开所绘制的数字,从而进行数字的预处理,其中包括灰度化及二值化处理,然后进行特征提取,最后实现数字的识别。
利用Matlab程序设计的相关知识,运用模块设计等相关技术,最终完成手写体识别综合设计。
实验结果表明,本系统具有较高的识别率。
关键词:绘制数字;预处理;特征提取;特征库;数字识别1前言自上世纪六十年代以来,计算机视觉与图像处理越来越受到人们的关注,并逐渐成为一门重要的学科领域。
而作为它们的研究对象的数字图像,也因为它含有研究目标的丰富信息而成为越来越重要的研究对象。
图像识别的目标是用计算机自动完成某些信息的处理,用来替代人工去处理图像分类及识别的任务。
手写数字识别是图像识别学科下的一个分支,是图像处理和模式识别领域研究的课题之一,由于其具有很强的实用性一直是多年来的研究热点。
由于手写体数字的随意性很大,例如,笔画的粗细,字体的大小,倾斜等等都直接影响到字符的正确识别,所以手写体数字识别是一个很有挑战性的课题。
在过去的数十年中,研究者们提出了许多的识别方法,取得了较大的成果。
手写体数字识别实用性很强,在大规模数据统计(如例行年检,人口普查),财务,税务,邮件分拣等等应用领域中都有广阔的应用前景。
本课题拟研究手写体数字识别的理论和方法,开发一个小型的手写体数字识别系统。
在研究手写体数字识别理论和方法的基础上,开发这样一个小型的手写体数字识别系统需要完成以下主要方面的研究与设计工作:手写数字绘制的问题、数字的预处理问题、特征提取问题、特征库的建立问题、数字识别问2课题的背景2.1手写数字识别的发展模式识别是六十年代初迅速发展起来的一门学科。
毕业论文计算机手写数字识别技术完整版

毕业论⽂计算机⼿写数字识别技术完整版毕业论⽂计算机⼿写数字识别技术HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】合肥学院2007届毕业设计(论⽂)基于模板匹配算法的字符识别系设计(论⽂)题⽬统研究与实现院系名称计算机科学与技术系专业(班级)计算机科学与技术2003级1班姓名(学号)宋飞(0)指导教师赵⼤政系负责⼈袁暋⼆O O七年五⽉⼆⼗三⽇摘要⾃从计算机问世以来,让机器具有模式识别能⼒⼀直是计算机科学家们的努⼒⽅向。
研究表明,对视觉和听觉信息的处理过程,不仅仅是⼀个感知过程,也是⼀个认知过程。
因此,研究模式识别,是理解⼈类智能的本质的重要途径。
字符识别是⼀个传统和典型的模式识别问题,脱机⼿写数字识别是⼀个典型的⼤类别的模式识别问题。
⼿写体数字具有不同字符字型相差不⼤、相同字符有多种不同写法、数字没有上下⽂关系等等特点,使得脱机⼿写体数字识别成为识别领域最⼤的难题和最终的⽬标。
在这种⼤类别识别的研究中,传统上⼤多采⽤模板匹配的⽅法来解决问题。
⽽在模板匹配算法中,得计算其特征值。
图像需要经过⼆值化,细化等预处理。
关键字模板匹配;特征值;细化;⼆值化ABSTRACTSince computer appeared, it has been an effort direction for scientist to let the computer has the ability of pattern recognition. Researching indicates that the procedure to deal with seeing and hearing not only a procedure of perception but also cognition. Therefore, studying pattern recognition is an important way in understanding the mankind’s intelligenceand ability. Character recognition is a traditional and typical pattern recognition problem, and Handwritten Numeral Recognition is a typical large vocabulary pattern recognition problem. Different characters do not vary much, the same character can be written in many ways, there is no context between characters, and so on. Because of so many characteristics, Handwritten Numeral Recognition is a very difficult problem and commonly regarded as one of the ultimate goals of character recognition research. And the template matching algorithm, in its calculation of eigenvalues. Image require two value,thinning and other pretreatment.引⾔⼿写数字识别(Handwritten Numeral Recognition)是光学字符识别技术(Optical Character Recognition,简称OCR)的⼀个分⽀,它研究的对象是:如何利⽤电⼦计算机⾃动辨认⼈⼿写在纸上的阿拉伯数字。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中南大学本科生毕业论文(设计)题目基于神经网络的手写数字识别系统的设计与实现目录摘要 (Ⅰ)ABSTRACT (Ⅱ)第一章绪论 (1)1.1手写体数字识别研究的发展及研究现状 (1)1.2神经网络在手写体数字识别中的应用 (3)1.3 论文结构简介 (4)第二章手写体数字识别 (5)2.1手写体数字识别的一般方法及难点 (5)2.2 图像预处理概述 (6)2.3 图像预处理的处理步骤 (6)2.3.1 图像的平滑去噪 (6)2.3.2 二值话处理 (7)2.3.3 归一化 (8)2.3.4 细化 (10)2.4 小结 (11)第三章特征提取 (12)3.1 特征提取的概述 (12)3.2 统计特征 (12)3.3 结构特征 (13)3.3.1 结构特征提取 (14)3.3.2 笔划特征的提取 (14)3.3.3 数字的特征向量说明 (15)3.3 知识库的建立 (15)第四章神经网络在数字识别中的应用 (17)4.1 神经网络简介及其工作原理 (17)4.1.1神经网络概述[14] (17)4.1.2神经网络的工作原理 (17)4.2神经网络的学习与训练[15] (18)4.3 BP神经网络 (20)4.3.1 BP算法 (20)4.3.2 BP网络的一般学习算法 (21)4.3.3 BP网络的设计 (22)4.4 BP学习算法的局限性与对策 (26)4.5 对BP算法的改进 (27)第五章系统的实现与结果分析 (29)5.1 软件开发平台 (29)5.1.1 MATLAB简介 (29)5.1.2 MATLAB的特点 (29)5.1.3 使用MATLAB的优势 (30)5.2 系统设计思路 (30)5.3 系统流程图 (31)5.4 MATLAB程序设计 (31)5.5 实验数据及结果分析 (32)结论 (27)参考文献 (28)致谢 (30)附录 (31)摘要手写体数字识别是模式识别中一个非常重要和活跃的研究领域,数字识别也不是一项孤立的技术,它所涉及的问题是模式识别的其他领域都无法回避的;应用上,作为一种信息处理手段,字符识别有广阔的应用背景和巨大的市场需求。
因此,对数字识别的研究具有理论和应用的双重意义。
人工神经网络识别方法是近年该研究领域的一种新方法,该方法具有一些传统技术所没有的优点:良好的容错能力、分类能力强、并行处理和自学习能力,并且是离线训练和在线识别的。
这些优点使它在手写体字符的识别中能对大量数据进行快速实时处理,并达到良好的识别效果。
由于手写体数字识别难于建立精确的数学模型,所以本文采用BP神经网络对这一问题进行处理。
神经网络模式识别的一个关键步骤是预处理和特征提取,对于手写体数字识别,本文采用了一种基于结构特征和统计特征的提取方法,并用程序实现了这一特征提取过程。
通过测试,本识别系统对于较规范的手写体数字的识别达到了很好的识别效果。
关键词:手写体数字识别,特征提取,人工神经网络,MATLABABSTRACTHandwritten character recognition is a very important and active research in pattern recognition. Theoretically, it is not an isolated technique. It concerns with the problem that all the other areas of pattern recognition must confronted; practically, being a kind of information processing measured, character recognition has a very broad application background and vast need of market. Thus, it is of both theoretical and practical significance.Artificial neural network recognition method is a new method of theresearch field in recent years, and this method has some merit that traditional technique do not have; good tolerance for error, strong sorting ability, strong parallel handling ability and strong self-learning ability as well as its off-line training and on-line recognizing. All these merits contribute its perfect performance in handling vast data set and handling in timely manner.It’s difficult to make accurate mathematics model for handwritten numeral recognition, so BP neural networks is used here. The key steps of neural networks pattern recognition are preprocessing and feature subset selection. In this paper, algorithm of feature subset selection basing on structural characteristics and statistical characteristics has been adopted in handwritten numeral recognition, and the process of feature subset selection had been realized in program.Recognition system in this paper has achieved a good rate of recognition in random handwritten numeral by test.Keyword: handwritten numeral recognition, feature extraction, artificial neural network, MATLAB第一章绪论1.1手写体数字识别研究的发展及研究现状模式识别[2]是六十年代初迅速发展起来的一门学科。
由于它研究的是如何用机器来实现人(及某些动物)对事物的学习、识别和判断能力,因而受到了很多科技领域研究人员的注意,成为人工智能研究的一个重要方面。
一个模式识别系统的基本职能是对系统所要处理的模式归属于哪一类做出判别,从该系统的模式输入到系统做出判别之间,主要包括信息检测、预处理、特征提取和分类几大环节。
字符识别是模式识别领域中的一个非常活跃的分支。
一方面是由于问题本身的难度使之成为一个极具挑战性的课题;另一方面,是因为字符识别不是一项孤立的应用技术,其中包含的模式识别领域中其他分支都会遇到的一些基本和共性的问题。
从50年代开始,许多的研究者就在这一研究领域开展了广泛的探索并为模式识别的发展产生了积极的影响。
字符识别,从采用的输入设备来分,可分为脱机识别(又称为光学字符识别Optical Character Recognition ,OCR)和联机识别,脱机字符又分为印刷体和手写字符识别,从对书写者要求来分,手写字符又分为限制性和非限制性的手写字符识别。
在联机手写字符识别中,计算机能够通过与计算机相连的手写输入设备获得输入字符笔划的顺序、笔划的方向以及字符的形状,所以相对OCR来说它更容易识别一些。
但联机字符识别有一个重要的不足就是要求输入者必须在指定的设备上书写,然而人们在生活中大部分的书写情况是不满足这一要求的,比如人们填写各种表格资料,开具支票等。
如果需要计算机去认识这些已经成为文字的东西,就需要OCR技术。
比起联机字符识别来,OCR不要求书写者在特定输入设备上书写,它可以与平常一样书写,所以OCR的应用更为广泛。
OCR所使用的输入设备可以是任何一种图像采集设备,如扫描仪、数字相机等。
通过使用这类采集设备,OCR系统将书写者已经写好的文字作为图像输入到计算机中,然后由计算机去识别。
由于OCR的输入只是简单的一副图像,它就不能像联机输入那样比较容易的从物理上获得字符笔划的顺序信息,因此OCR是一个更具挑战性的问题。
脱机字符识别(OCR)分为印刷体OCR和手写OCR。
印刷体字符比手写体字符少了随机性,它的识别相对容易些,难点已经不在识别环节,而在于字符的分割上。
印刷体识别的错误绝大多数都是错误的分割引起的[3]。
对于手写体OCR,无论是联机还是脱机识别,手写体的识别都要经历由限制性手写体识别到非限制性手写体识别两个阶段。
本文将以手写体数字为代表,讨论非限制性手写体字符的识别。
脱机字符识别的研究最早始于上个世纪六十年代,是为了应付汉英翻译的需要。
八十年代后的研究重心转移到脱机手写字符的识别上。
对于小类别数的字符集如数字、字母的识别,已经可以做到对书写不加任何的限制。
非限制性手写OCR的研究始终以阿拉伯数字为主导。
这事因为,第一,十个阿拉伯数字是全世界的一套通用字符。
第二,在数字的许多应用场合,如报表、账单、支票等,手写体还难以被印刷体所替代,而且对识别的可靠性要求极高。
三,由于类别数少,所以模式识别中的许多方法研究均可以以数字识别作为实验背景。
对脱机手写体字符的研究,人们由简单集成笔画密度、笔画方向和背景特征方法过渡到特征匹配方法,进而过渡到结合神经网络方法,随着对识别可靠性要求的提高,九十年代以后,多分类器集成方法成为了一个研究重点。
1.2神经网络在手写体数字识别中的应用目前,随着计算机的迅速发展,性能价格比的不断提高,模式识别技术已经从理论探讨为主发展到大量的实际应用,人们将更多的注意力开始转向那些用于语音、图像、机器人以及人工智能等的模式识别实际问题。
解决这些问题的关键是需要进行复杂而庞大的实时数据处理,而现有计算机的存贮容量及计算复杂性的局限,使得真正实时化的应用受阻。
这种面向实时应用的模式识别问题促使人们开始将并行处理的神经网络[4]应用到模式识别,而神经网络模式识别技术又将模式识别实时应用推进了一大步,手写体数字识别就是这种应用的一个很重要的领域。