手写体数字识别系统的设计与实现
手写体数字识别研究及系统实现

手写体数字识别研究及系统实现随着人工智能的快速发展,机器学习和深度学习等技术正在飞速发展。
手写体数字识别作为人工智能的一个重要应用领域,正在得到越来越广泛的关注。
手写体数字识别技术的核心是构建一个准确、高效的数字识别算法。
本文将从手写体数字识别的必要性、技术原理、算法实现和应用场景四个方面,探讨手写体数字识别研究及系统实现。
一、手写体数字识别的必要性手写体数字识别的最初应用是在邮政系统中。
随着互联网的普及和电子商务的兴起,手写体数字识别逐渐成为数字图像处理领域的一个重要技术。
手写体数字识别的应用领域非常广泛,例如智能化识别信用卡、护照、身份证、驾驶证、学生证等证件上的手写数字信息,以及检测、追踪和分类许多与手写数字密切相关的信息。
手写体数字识别的技术研究和发展能有效促进数字信息技术的发展,提高数字信息技术在各行各业中的应用。
二、手写体数字识别的技术原理手写体数字识别技术原理主要是数字图像处理技术。
数字图像处理技术是一门研究数字图像的获取、处理、传输和显示的学科,主要包括图像获取、预处理、特征提取与选择、分类与识别等四个方面。
图像获取是数字图像处理技术的第一步,通过将纸质文档或图像数字化,即根据摄影原理或扫描原理将成像的二维图像转换成数字信号。
预处理是指对图像进行增强、滤波、降噪等操作,以使原始图像能够更好地适应后续处理需求。
特征提取与选择是指从图像中提取有助于识别和分类的特征,以还原图像中的数字信息。
分类与识别是指学习和选择分类器,正确分类和识别数字图像。
三、手写体数字识别的算法实现手写体数字识别的算法实现可以分为三个阶段:前端特征提取、分类器设计和后处理。
前端特征提取是将手写数字转换成具有辨别性的数学向量的过程,即将手写数字的图像进行预处理和特征提取,产生用于后续处理的特征向量。
常用的特征提取方法包括灰度直方图、傅里叶描述符、Zernike描述符、矩形描述符等。
分类器设计是定义分类器的类型和参数并进行训练的过程。
手写数字识别系统的设计与实现

手写数字识别系统的设计与实现随着数字化时代的到来,智能化已经成为了趋势,人工智能的发展需要更精准有效的数据判别处理。
实现手写数字识别系统,可以广泛应用于智能交互、机器人、OCR等领域。
本文将描述手写数字识别系统的设计和实现过程。
一、系统设计手写数字识别系统输入手写数字图像,输出代表数字的数值。
总体设计思路如下:1.数据采集与存储用户输入手写数字图像后,通过归一化等方法去除噪点,存储为图片格式,可以使用20x20像素,黑白二值化的PNG格式存储。
2.特征提取与向量化将图片转化为向量,提取手写数字特征。
常用的特征提取方法是SIFT描述符提取和HOG特征提取,本文采用HOG特征提取方法。
基本步骤如下:a. 图像预处理:将彩色图片转化为灰度图片b. 局部块划分:将图片分为若干块c. 计算梯度直方图:对每一个块进行梯度直方图的计算d. 归一化:将梯度直方图归一化,得到HOG向量3.分类模型及算法采用深度学习神经网络模型进行分类,训练集采用MNIST公开数据集,由于输入的都是28*28的黑白图片,最后需要对数据进行调整,不符合识别输入数据的标准,将输入大小调整为20*20。
采用神经网络库tensorflow,设计softmax回归模型,定义交叉熵损失函数并使用梯度下降法或Adam优化算法最小化损失。
4.模型评估和调优使用测试集对模型进行评估,计算准确率、精度、召回率、F1值等,并采用正则化、dropout等技术对模型进行优化和调整。
5.系统集成与优化将OCR识别模型和手写数字识别系统进行整合,并加入人机交互的界面设计,实现常规数字识别等操作。
二、系统实现整套系统使用python语言实现,通过tensorflow实现深度神经网络模型的训练和预测。
主要步骤如下:1.数据采集与存储:从kaggle网站上下载手写数字数据集,并使用python pandas库对数据集进行处理和存储,确保数据安全、方便、快速可靠的存储和使用。
手写数字识别系统的设计与实现

手写数字识别系统的设计与实现摘要本手写数字识别系统是一个以VISUAL STUDIO C++ 6.0为编译环境,使用MFC进行图形图像界面开发的系统。
主要功能是通过在点击手写数字识别菜单下的绘制数字标签弹出的绘制数字窗口中完成数字的手写,在此窗口中可以进行数字的保存及清屏,然后通过文件菜单中的打开标签打开所绘制的数字,从而进行数字的预处理,其中包括灰度化及二值化处理,然后进行特征提取,最后实现数字的识别。
本系统的界面设计友好,流程正确,功能也较为完善。
实验结果表明,本系统具有较高的识别率。
关键词:绘制数字;预处理;特征提取;特征库;数字识别目录前言 (4)概述 (5)1 需求分析 (6)1.1 功能需求分析 (7)1.2 性能需求分析 (7)1.3 数据需求分析 (8)1.4 相关软件介绍 (8)2 手写数字识别系统的设计与基本原理 (8)2.1 系统整体功能模块设计 (8)2.2 手写数字识别系统的基本原理 (9)2.2.1 数字图像的绘制 (9)2.2.2 图像的预处理 (9)2.2.3 图像的特征提取 (10)2.2.4 特征库的建立 (10)2.2.5 图像数字的识别 (11)3 手写数字识别系统程序设计 (11)3.1 数字图像的绘制 (11)3.2数字的特征提取 (17)3.3 模板特征库的建立 (20)3.4 数字的识别 (22)总结 (25)致谢..................................... 错误!未定义书签。
参考文献 (25)前言自上世纪六十年代以来,计算机视觉与图像处理越来越受到人们的关注,并逐渐成为一门重要的学科领域。
而作为它们的研究对象的数字图像,也因为它含有研究目标的丰富信息而成为越来越重要的研究对象。
图像识别的目标是用计算机自动完成某些信息的处理,用来替代人工去处理图像分类及识别的任务。
手写数字识别是图像识别学科下的一个分支,是图像处理和模式识别领域研究的课题之一,由于其具有很强的实用性一直是多年来的研究热点。
手写字体识别系统的设计与实现

手写字体识别系统的设计与实现随着科技的不断进步,手写字体识别技术也在不断发展。
手写字体识别系统可以将手写字体转换成可编辑的电子文本,方便用户进行编辑和处理。
在本文中,我们将学习手写字体识别系统的设计与实现。
一、手写字体识别系统的基本原理手写字体识别系统的基本原理是将手写字体转化成数字信号,然后通过模式识别技术对数字信号进行分析和处理,最终得到手写文字的识别结果。
具体的步骤如下:1. 手写输入:用户通过手写板、电子笔等设备将手写文字输入到计算机中。
2. 数字信号转换:手写文字被转换成数字信号,这个过程称为采样。
采样的目的是将连续的信号转换成离散的信号。
3. 特征提取:从采样得到的离散信号中提取出特征,这个过程称为特征提取。
特征提取的目的是从众多的数字信号中提取出与手写字符相关的特征。
4. 模式匹配:将特征提取出来的信号与存储在数据库中的标准手写字符进行比较,找到最匹配的字符作为识别结果。
二、在实际应用中,手写字体识别系统的设计与实现是一个非常复杂的过程。
下面我们将从数据采集、特征提取、分类器设计和系统优化等几个方面讨论手写字体识别系统的设计与实现。
1. 数据采集数据采集是手写字体识别系统的开端,对于手写字体识别系统的准确性和鲁棒性有着重要的影响。
因此,需要收集大量的手写字符数据,以构建一个完整的数据集。
数据集应包括不同字体、不同大小、不同风格的手写字符。
2. 特征提取特征提取是手写字体识别系统的核心环节。
常用的特征提取方法包括端点检测、曲率检测、方向检测、HOG特征提取等。
每个方法都有其优缺点,需要根据实际情况进行选择和组合。
3. 分类器设计分类器是手写字体识别系统中用于模式匹配的关键组件。
常用的分类器包括逻辑回归、支持向量机、神经网络等。
每个分类器都有其优缺点,需要根据实际情况进行选择和优化。
4. 系统优化手写字体识别系统涉及到多个环节,每个环节都会影响系统的准确性和鲁棒性。
因此,在设计和实现完整的系统后,需要对系统进行优化和调试。
手写体数字识别系统的设计与实现

手写体数字识别系统的设计与实现1. 简介手写体数字识别系统是指能够通过计算机对手写数字进行自动识别的一种系统,是人工智能领域的重要应用之一。
本文将介绍一个基于卷积神经网络的手写体数字识别系统的设计与实现。
2. 数据集首先,我们需要收集手写数字图像作为训练数据和测试数据。
可以使用已有的开源数据集,如MNIST数据集,也可以自己手写一些数字进行图像采集。
经过数据预处理和清洗后,我们得到了包含10000张28x28像素的手写数字图像作为训练集,5000张图像作为测试集。
3. 模型设计本文使用了一个卷积神经网络模型进行手写数字识别。
该模型包括三个卷积层、三个池化层和两个全连接层。
3.1 卷积层和池化层卷积层可以通过滑动一个卷积核提取图像的重要特征,池化层则可以进行特征的降维和压缩。
同时,使用卷积层和池化层可以大大减少参数数量,加快模型训练速度。
3.2 全连接层全连接层通过将所有卷积层和池化层的输出展开为一维向量,再进行分类,得出预测结果。
全连接层参数量较大,容易出现过拟合和训练时间长的问题。
3.3 Dropout过拟合是机器学习中的常见问题,为了避免模型过拟合,我们使用了dropout方法。
dropout是指在训练过程中以一定的概率随机选择一些节点并将其权重设置为0,这样可以让模型更加健壮。
4. 实现模型的实现使用Python语言和Keras深度学习框架。
我们将数据集的图像转换为28x28的矩阵,并进行归一化处理。
接着,我们定义了一个卷积神经网络模型,并进行模型的编译和训练。
训练过程中,我们使用了Adam优化器和交叉熵损失函数,并进行了10轮的迭代训练。
实际测试中,该模型的准确率达到了98%以上。
5. 结论本文介绍了一个基于卷积神经网络的手写体数字识别系统,并实现了该系统。
该模型在测试集上取得了很好的识别效果,能够对手写数字进行准确识别。
同时,我们也讨论了卷积神经网络中的关键概念和技术要点,希望读者能够对深度学习和计算机视觉有更深入的了解。
手写数字识别系统的设计与实现

手写数字识别系统的设计与实现一、绪论随着机器学习及神经网络技术的发展,人工智能正在不断向更广泛的领域渗透,尤其是在图像处理领域。
手写数字识别系统也因此应运而生,被广泛应用于各种场景中,例如验证码识别、手写板输入、银行支票识别等。
本文将介绍一种手写数字识别系统的设计与实现,以帮助读者深入了解该领域的技术。
二、系统设计本手写数字识别系统采用支持向量机(SVM)算法。
系统开发基于Python编程语言和OpenCV图像处理库进行,共分为以下四个模块:2.1 数据采集模块数据采集模块通过获取手写数字原始图像,采集大量的训练数据集和测试数据集。
该模块通过调用计算机的摄像头进行数据采集,将原始图像转化为数字图像,表示手写数字的像素。
在采集数据时,需要注意手写数字应该尽可能接近正方形,大小需要尽量一致,以保证后续的数字处理和识别效果。
数据采集完成后,需要对采集到的数据进行分类标注,即手写数字的分类,一般采用数字0-9进行标注。
2.2 特征提取模块在特征提取模块中,我们需要将数字图像转化为一组数字特征,以便于后续的数字图像比较和分类识别。
目前最常用的数字特征是手写数字的边界轮廓。
该模块通过调用OpenCV库中的边界检测函数获取数字的边界轮廓。
检测出轮廓后,我们可以使用等高线函数对其进行平滑处理,再通过描绘轮廓的关键点获取有效特征向量。
2.3 训练模型模块在训练模型模块中,我们需要将已经提取出的数字特征向量和其分类标注进行学习,训练得到一个能够正确识别数字的模型。
本系统采用了支持向量机(SVM)算法来实现数字的分类识别。
SVM算法有着很好的泛化性能和分类性能,并且适用于高维特征的数据集。
在训练模型时,我们首先对原始数据进行归一化处理,使其在相同量级内。
然后使用SVM训练模型,通过交叉验证的方式调整模型超参数,以达到最优分类效果。
2.4 数字识别模块数字识别模块是手写数字识别系统最核心的部分。
在该模块中,输入待识别的数字,对它进行特征提取,然后将其送入训练得到的SVM分类模型中进行分类,最终输出数字的识别结果。
基于深度学习的手写体识别系统设计与实现

基于深度学习的手写体识别系统设计与实现手写体识别是计算机视觉领域中一项重要的技术,它在很多应用中都扮演着重要的角色。
传统的手写体识别算法往往依赖于特征提取和分类器的组合,不仅复杂度高,而且对于不同的手写体样本泛化能力弱。
而基于深度学习的手写体识别系统则能够通过大规模数据的训练,自动发现并提取手写体的特征,从而取得更好的效果。
深度学习主要依赖于神经网络模型,在手写体识别中,卷积神经网络(Convolutional Neural Network,CNN)是被广泛使用的模型。
一个典型的基于CNN的手写体识别系统包含以下几个关键步骤:数据集准备、网络模型构建、训练优化和测试评估。
首先,数据集准备是建立一个优秀手写体识别系统的基础。
我们需要收集大规模的手写体样本,保证数据集的多样性和覆盖性。
同时,为了避免过拟合,我们需要对数据集进行预处理,例如对图像进行缩放、旋转和扭曲等操作,增加数据集的多样性。
接下来,网络模型的构建是非常重要的。
我们可以选择一个经典的CNN网络模型,如LeNet或AlexNet作为基本框架,并根据手写体识别的具体需求对其进行调整和改进,例如增加网络的深度或宽度,引入注意力机制等。
构建网络模型时,我们还需要设置合适的超参数,例如学习率、权重衰减等,以及选择合适的激活函数、损失函数和优化方法。
在网络模型构建完成后,就可以通过训练和优化来提高手写体识别系统的性能了。
我们通过将训练集输入网络模型进行前向传播和反向传播,通过梯度下降法不断调整网络参数,优化网络模型的拟合能力。
此外,针对大规模数据的训练,可以采用分布式训练和数据并行的方式,加速训练过程。
最后,测试评估是评价手写体识别系统准确性的关键步骤。
我们可以把测试集输入训练好的网络模型,得到模型的输出结果,并与标签进行对比,计算准确率、召回率等指标。
为了更全面地评估系统的性能,我们还可以进行交叉验证、混淆矩阵分析以及ROC曲线等评估方法,进一步优化系统的性能。
手写体汉字识别系统的设计与实现

手写体汉字识别系统的设计与实现1. 系统简介手写体汉字识别系统是一种将手写汉字图像识别为文字的技术,可以广泛应用于自然语言处理、OCR识别、智能手写输入、数字化文档等领域。
本系统采用卷积神经网络(CNN)进行手写汉字的分类识别。
2. 数据预处理为了提高识别率,需要对手写汉字图片进行预处理。
常见的预处理方法包括二值化、去噪、裁剪、拉伸等,以消除干扰噪声,使图像更具有对比度。
在本系统中,采用了以下预处理过程:2.1 二值化将彩色或灰度图像转换为黑白二值图像,目的是为了方便后续图像处理和分类。
本系统采用自适应阈值二值化算法,可根据图像局部分布自适应地确定二值化阈值,能有效改善不同光照条件下的图像质量。
2.2 去噪噪声是影响图像质量和分类结果的主要因素之一。
本系统采用中值滤波算法,能够有效地去除高斯噪声,保留汉字图像的边缘信息和特征。
2.3 裁剪为便于分类器对手写汉字进行识别,需要将图像按照边缘进行裁剪,去除多余背景信息。
本系统采用轮廓检测算法进行边缘提取和裁剪,以确保分类精度和速度。
2.4 拉伸为解决汉字字符样式和尺寸不一致的问题,需要将图像进行拉伸,使每个字符的尺寸和比例保持一致。
本系统采用等比例缩放算法,能够有效保留汉字特征和风格。
3. 特征提取特征提取是识别系统的核心步骤之一,目的是将原始汉字图像转换成一组可以用于分类的特征向量。
本系统采用卷积神经网络(CNN)对手写汉字进行特征提取和分类,其特点是可以从原始数据中进行自动学习,减少特征处理的复杂度。
4. 分类识别分类识别是系统的最后一步,目的是将手写汉字图像判定为特定的汉字字符,同时提供显著性分值和置信度。
本系统采用softmax分类器和交叉熵损失函数对手写汉字进行分类和识别,能够有效地提高识别精度和鲁棒性。
5. 总结手写体汉字识别系统是一项关键技术,具有广泛应用前景。
本系统采用卷积神经网络进行特征提取和分类识别,通过数据预处理、特征提取、分类识别等步骤,能够实现高效准确的手写汉字识别。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
大学生研究计划项目论文报告项目名称:_手写体数字识别系统的设计与实现负责人:_________ _______________学院/专业:_____ ______学号:____ ________申请经费:_____ _________________指导教师:______ _______项目起止时间:2011年6月-2012年3月摘要手写体数字识别系统依托计算机应用软件为载体,利用C++程序设计的相关知识,运用模块设计等相关技术,最终完成手写体设计系统的程序综合设计。
关键字:手写体数字处理模式识别程序设计一、论题概述模式识别是六十年代初迅速发展起来的一门学科。
由于它研究的是如何用机器来实现人(及某些动物)对事物的学习、识别和判断能力,因而受到了很多科技领域研究人员的注意,成为人工智能研究的一个重要方面。
字符识别是模式识别的一个传统研究领域。
从50年代开始,许多的研究者就在这一研究领域开展了广泛的探索,并为模式识别的发展产生了积极的影响。
字符识别一般可以分为两类:1.联机字符识别;2.光学字符识别(Optical Chara- cter Recognition,OCR)或称离线字符识别。
在联机字符识别中,计算机能够通过与计算机相连的输入设备获得输入字符笔划的顺序、笔划的方向以及字符的形状,所以相对OCR来说它更容易识别一些。
但联机字符识别有一个重要的不足就是要求输入者必须在指定的设备上书写,然而人们在生活中大部分的书写情况是不满足这一要求的,比如人们填写各种表格资料,开具支票等。
如果需要计算机去认识这些己经成为文字的东西,就需要OCR技术。
比起联机字符识别来,OCR不要求书写者在特定输入设备上书写,它可以与平常一样书写,所以OCR 的应用更为广泛。
OCR所使用的输入设备可以是任何一种图像采集设备,如CCD、扫描仪、数字相机等。
通过使用这类采集设备,OCR系统将书写者已写好的文字作为图像输入到计算机中,然后由计算机去识别。
由于OCR的输入只是简单的一副图像,它就不能像联机输入那样比较容易的从物理特性上获得字符笔划的顺序信息,因此OCR是一个更具挑战性的问题。
数字识别是多年来的研究热点,也是字符识别中的一个特别问题,它是本文研究的重点。
数字识别在特定的环境下应用特别广泛,如邮政编码自动识别系统,税表和银行支票自动处理系统等。
一般情况下,当涉及到数字识别时,人们往往要求识别器有很高的识别可靠性,特别是有关金额的数字识别时,如支票中填写的金额部分,更是如此。
因此针对这类问题的处理系统设计的关键环节之一就是设计出高可靠性和高识别率的数字识别方法。
然而可以说还没有哪个数字识别器达到完美的识别效果。
在过去的数十年中,研究者们提出了许许多多的识别方法。
按使用的特征不同,这些方法可以分为两类:基于结构特征的方法和基于统计特征的方法。
结构特征通常包括圆、端点、交叉点、笔划、轮廓等,统计特征通常包括点密度的测量、矩、特征区域等,一般来说,两类特征各有优势。
例如,使用统计特征的分类器易于训练,而且对于使用统计特征的分类器,在给定的训练集上能够得到相对较高的识别率,而结构特征的主要优点之一是能描述字符的结构,在识别过程中能有效地结合几何和结构的知识,因此能够得到可靠性较高的识别结果。
二、模式识别与BP神经网络在观察各种事物或接受各种客观现象时,人们总是不断地进行模式识别。
各种具有相似的特征又不完全相同的事物和现象组成不同的类别。
在同一类别中,事物和现象不尽相同,但它们总是表现出某些方面的相近之处。
例如,每个人写出来的数字“8”可能千差万别,但它们的共同之处在于,它们都属于数字,“8”这个范畴。
也就是说,这些千差万别的数字“8”的共性是它们具有相同的属性特征。
人的思维可以对初次见到的事物进行分类。
比如,即使人们初到一个城市,也可以轻易地辨认出“街道”、“房屋”、“汽车”这样的事物。
同样,看到另外一种写法的“8”,人们仍然可以清楚地知道它的含义。
正是人脑的这种推广能力,使得人们利用见到过的有限事物和现象,形成各种事物类别的概念。
这些有限的、个别的事物和现象就可以称为模式,而整个类别的现象和事物则可以称为模式类,或者简称为类。
人们根据所见模式的特性,将其划归为某一类的过程,实际上就是模式识别的过程。
模式识别这个词既可以是指人对事物的,一个分析、描述、判断和识别的过程,也可以是指利用计算机对某些物理对象进行分类的这门学科。
模式和集合的概念是分不开的,模式可以看作是集合论中的元素,而类则可以看作是子集。
神经网络的概念、原理和设计是受生物、特别是人脑神经系统的启发提出的. 神经网络由大量简单的处理单元来模拟真实人脑神经网络的机构和功能以及若干基本特性,是一个高度复杂的非线性自适应动态处理系统.BP网络是1986年由Rinehart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一. BP网络能学习和存贮大量的输入- 输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程. 它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小. BP神经网络模型拓扑结构包括输入( input) 、隐层( hide layer)和输出层(output layer) ,如图1所示:三、基于BP神经网络的手写数字识别(一)输入向量与目标向量首先对手写数字图像进行预处理,包括二值化、去噪、倾斜校正、归一化和特征提取,生成BP神经网络的输入向量Alphabet和目标向量Tar2get. 其中Alphabet选取40 ×10的矩阵,第1列到第10列代表0~9的数字. Target为10 ×10的单位矩阵,每个数字在其所排顺序位置输出1,其他位置输出0.(二)BP神经网络的构建BP算法由数据流的前向计算(正向传播)和误差信号的反向传播两个过程构成. 正向传播时,传播方向为输入层→隐层→输出层,每层神经元的状态只影响下一层神经元. 若在输出层得不到期望的输出,则转向误差信号的反向传播流程. 通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程.首先考虑正向传播,设输入层有n个节点,隐层有p个节点,输出层有q个节点. 输入层与隐层之间的权值为vk i, 隐层与输出层之间的权值为w jk. 隐层的传递函数为f1 ( x) ,输出层的传递函数为f2 ( x) ,则隐层节点的输出为输出层节点的输出为通过式(1) 和(2) 可得BP神经网络完成n维到q维的映射. 其次考虑反向传播. 在反向传播中,需要对不理想的权值进行调整, B P神经网络的核心要务即在于调权. 定义误差函数, 设输入P个学习样本,用x1 , x2 , ⋯, xp 来表示. 第p个样本输入网络得到输出ypj ( j = 1, 2, ⋯, q) ,其误差为式中为期望输出. P个样本的全局误差为将式(3) 代入得输出层权值的变化采用累计误差BP算法调整wjk 使全局误差E变小,即式(5) 中η为学习率. 现定义误差信号为将式(3) 代入可得第一项为第二项为输出层传递函数f2 ( x) 的偏微分将式(7) 和(8) 代入可得误差信号为则输出层各神经元权值△wjk 调整公式将式(9)代入可定义为在得到输出层权值调整公式后, 需要定义隐层权值△vk i 调整公式根据输出层各神经元权值△wjk 调整公式推导过程,可得△vk i 为四、数字识别系统的设计与实现(一)设计基本原理程序设计过程,将整个系统问题分割成若干个子问题来做,主要包括图像数据输入模块GetDIB()、二值化模块Threshold()、平滑滤波模块Smooth()、分割模块divide()、字符切分模块CharSegment()、字符识别模块CharRecognition()。
首先分别对每个模块进行单元测试分析和模块测试,然后再组合成系统,进行系统测试。
图 4-1 系统逻辑模型流程图此图为系统逻辑模型流程图,其中细箭头代表程序的进程,整个程序就是按上图所示流程编写的。
(一)数字识别中的图像预处理神经网络为数字识别提供一个强有力的手段。
目前,在神经网络模式识别中根据对输入样本的表达方式的选择有下面两大类:一类是直接将数字图像经数值化处理之后得到的像素点原始样本作为神经网络的输入;另一类则是对这种原始像素点构成的原始输入样本再作进一步的预处理或变换。
虽然,在某些情况下,人们采用第一类样本表达获得了较好的识别结果,但这种输入方式,通常使得网络分类器结构的复杂程度大大增加,所以,对原始样本进行预处理,已成为神经网络模式识别成功的一个很重要的方面。
对于数字的预处理,人们己作了许多工作,但归根结底有下面几步:首先是将数字转化为n*n像素点矩阵形式,再经二值化处理,可以得到原始的输入表达方式。
接下来,对原始样本表达进行一些常规变换,包括平滑、锐化、规格化和细化。
而本文是通过大量的样本训练网络,以达到预期的识别率。
1.数值化数字识别时,首先将印在纸上的数字经过光电扫描产生模拟信号,再通过模数转换变成表示灰度值的数字信号输入计算机。
纸张薄厚、洁白度、光洁度、书写力度和笔划质量都要造成字形的变化,产生污点、飞白、断笔、交连等干扰。
因此,一般由扫描得到的数值化的字符还需要多种进一步的处理。
2.二值化二值化处理是将数字图像转化为由0和1表示的值像素矩阵形式,最简单也是最原始的作法是将整个数字所在区域用n*n网格划分,然后将数字笔划通过的网格内填1,不通过的网格内填0,这样就将整个数字变为一个由二值构成的矩阵。
而在采用光电扫描仪对数字进行扫描输入时,通常是将数字转换为带灰度值的数字信号输入计算机。
因而,二值化的工作不再是简单的笔划通过与否。
3. 平滑实际获得的图像在形成、传输、接受和处理的过程中,不可避免地存在着外部干扰和内部干扰,如光点转换过程中敏感元件灵敏度的不均匀性,数字化过程的量化噪声,传输过程中的误差以及人为因素等,均会使图像质量变差,使图像模糊。
因此,消除噪声,恢复原始图像是图像处理中的一个重要内容。
图像平滑的目的有两个:改善图像的质量和抽出对象的特征。
平滑的办法有中值滤波,均值滤波等很多方法,本设计选择的平滑技术是中值滤波法。
4. 锐化图像的锐化处理主要用于增强图像中的轮廓边缘,细化以及灰度跳变部分,形成完整的物体边界,达到将物体从图像中分离出来或将表示同一物体表面的区域检测出来的目的。
它是早期视觉理论和算法中的基本问题,也是中期和后期视觉成败的重要因素之一。
与图像的平滑处理一样,图像的锐化也有很多处理方法,如针对平均或积分运算使图像模糊,可逆其道而采取微分运算,使用高通滤波器优化高频分量,抑制低频分量,提高图像边界清晰度等。