数字识别论文

合集下载

基于特征提取的数字识别算法研究

基于特征提取的数字识别算法研究

基于特征提取的数字识别算法研究
赵丽
【期刊名称】《信息记录材料》
【年(卷),期】2024(25)3
【摘要】基于模板匹配的数字识别算法需要保证训练样本和模板样本一致,基于深度学习的数字识别算法需要保证有大量的训练样本。

然而户外环境复杂,很难找到所有与训练样本相匹配的模板样本,搜集到的图像也比较有限,很难建立一个大的数据集,因此识别准确率欠佳。

基于这种情况,本文提出了一种采用方向梯度直方图(histogram of oriented gradients,HOG)特征提取和支持向量机(support vector machine,SVM)分类器训练的方法对数字进行识别。

为了增强复杂样本识别的鲁棒性,本文还对获取的图像进行了一系列的投影分割操作。

实验后发现,本文所提算法可以有效避免模板匹配和深度学习方法的缺点,具有较高的识别准确率,且运行速度较快。

【总页数】3页(P243-245)
【作者】赵丽
【作者单位】河南工业贸易职业学院信息工程学院
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于自编码特征提取及弹性学习的手写数字识别
2.基于Zernike矩特征提取的改进FCM手写体数字识别
3.基于多尺度卷积核特征提取算法的手写数字识别研究
4.基于分块LBP特征提取和改进KNN的手写数字识别
5.基于新特征提取法和量子神经网络的手写数字识别
因版权原因,仅展示原文概要,查看原文内容请购买。

基于深度学习的手写数字识别与文字识别技术研究

基于深度学习的手写数字识别与文字识别技术研究

基于深度学习的手写数字识别与文字识别技术研究I. 选题背景及意义随着深度学习技术的逐渐成熟,手写数字识别和文字识别技术已经被广泛应用于各种领域。

手写数字识别技术可以用于快速识别银行卡号、车牌号等数字,而文字识别技术则可以用于扫描文档、翻译等任务。

这些技术的应用使得人们的工作和生活变得更加便利和高效。

因此,本文旨在研究基于深度学习的手写数字识别和文字识别技术,探讨其实现方法和优化手段。

II. 深度学习手写数字识别技术1. 数据集的选择为了构建数字识别模型,需要准备足够的训练数据集。

在数字识别领域,MNIST数据集是最常用的数据集之一。

MNIST数据集包含6万张28x28像素的手写数字图像,其中50,000张是用于训练的,10,000张用于测试。

MNIST数据集是一个具有挑战性的任务,因为有些数字的区分度比较小,例如1和7。

2. 模型的构建深度学习模型一般采用卷积神经网络,常用的包括LeNet-5和AlexNet等。

这里以LeNet-5为例,简要介绍其结构。

(1)卷积层:包括6个卷积核,每个大小为5x5,步长为1,输出6张14x14的特征图。

(2)池化层:采用2x2的最大池化,步长为2,输出6张7x7的特征图。

(3)卷积层:包括16个卷积核,每个大小为5x5,步长为1,输出16张5x5的特征图。

(4)池化层:采用2x2的最大池化,步长为2,输出16张3x3的特征图。

(5)全连接层:包括120个神经元,用于将卷积层输出的特征图进行分类。

(6)全连接层:包括84个神经元,用于进一步处理分类结果。

(7)输出层:包括10个神经元,用于输出最终的分类结果。

3. 模型的训练和优化为了训练模型,需要选择一个适合的损失函数和优化算法。

针对手写数字识别任务,最常用的损失函数是交叉熵损失函数,同时可以采用动量梯度下降、Adam等优化算法来加速模型的训练。

此外,模型的性能还可以通过改变网络结构、增加数据量、数据增强等手段来进一步提升。

手写体数字识别方法的研究与实现.doc

手写体数字识别方法的研究与实现.doc

手写体数字识别方法的研究与实现摘要1引言手写体数字识别是文字识别中的一个研究课题,是多年来的研究热点,也是模式识别领域中最成功的应用之一。

由于识别类型较少,在实际生活中有深远的应用需求,一直得到广泛的重视。

近年来随着计算机技术和数字图像处理技术的飞速发展,数字识别在电子商务、机器自动输入等场合已经获得成功的实际应用。

尽管人们对手写数字的研究己从事了很长时间的研究,并己取得了很多成果,但到目前为止,机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题,所以对手写数字识别的进一步研究,寻求如何更高效更准确更节能地实现手写数字的自动录入和识别的解决方案对提高经济效益、推动社会发展都有深远的意义。

近年来, 人工神经网技术发展十分迅速, 它具有模拟人类部分形象思维的能力, 为模式识别开辟了新的途径, 成了模拟人工智能的一种重要方法,特别是它的信息并行分布式处理能力和自学习效用等显著优点, 更是激起了人们对它的极大的兴趣。

BP(Back Propagation)网络是神经网络中一种,是1986年由Rumelhart和McCelland 为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,可以很好地解决非线性问题,在函数逼近、模式识别和数据压缩等方面都有很广泛的应用。

我们在认真地研究了神经网络的基本原理和机制的基础上, 结合手写体数字识别这一具体课题, 提出了用BP神经网络方法来实现手写体数字识别的方案。

2手写体数字识别概述2.1手写数字识别简述模式识别是六十年代初迅速发展起来的一门学科。

由于它研究的是如何用机器来实现人及某些动物对事物的学习、识别和判断能力,因而受到了很多科技领域研究人员的注意,成为人工智能研究的一个重要方面。

字符识别是模式识别的一个传统研究领域。

从50年代开始,许多的研究者就在这一研究领域开展了广泛的探索,并为模式识别的发展产生了积极的影响。

手写体数字识别是多年来的研究热点也是字符识别中的一个特别问题。

基于人工智能的手写数字识别技术研究

基于人工智能的手写数字识别技术研究

基于人工智能的手写数字识别技术研究随着人工智能技术的发展,越来越多的应用场景开始采用AI技术来解决实际问题。

其中,手写数字识别技术是一个非常典型的例子。

手写数字识别技术指的是通过计算机程序,将手写数字转换成数字字符的过程。

这种技术在实际应用中有着广泛的应用,比如字符识别、自动填表、手写邮箱等。

手写数字识别技术的研究历程可以追溯到上个世纪。

最初的手写数字识别系统采用的是模板匹配的方法,即将数字转化为模板后再与输入的数字进行比较,但是这种方法对于写法稍有不同的数字无法进行准确匹配,难以应对实际应用中的多变的手写数字。

随着计算机性能的提升和深度学习技术的出现,手写数字识别技术得到极大的提升。

目前,基于深度学习的手写数字识别技术已经达到了非常高的准确率,甚至能够超过人类的识别水平。

基于深度学习的手写数字识别技术主要采用卷积神经网络(CNN)和循环神经网络(RNN)等模型来进行学习和识别。

其中,CNN被广泛应用于图像分类领域,可以提取图像中的局部特征并进行高效的特征提取和分类。

而RNN则主要用于序列数据的处理,具有较好的时序特征提取能力。

在进行深度学习模型训练时,需要大量的数据集来进行训练和验证。

手写数字识别技术的数据集有很多,比如著名的MNIST数据集、EMNIST数据集、NIST数据集等。

这些数据集包含了大量的手写数字图片和对应的数字标签,可以用于模型的训练和测试。

除了基于深度学习的手写数字识别技术,还有一些其他的方法也被应用到手写数字识别中。

比如基于传统机器学习算法的手写数字识别方法,比如支持向量机、随机森林、K近邻等,这些方法在一些特定的数据集上也能取得不错的效果。

总之,基于人工智能的手写数字识别技术是一个非常有前途的方向。

通过不断地研究和探索,我们相信将会有更多的优秀方法应用到手写数字识别领域,让这个领域能够更好地服务于人们的生活和工作。

手写体数字的识别

手写体数字的识别

手写体数字识别第一章绪论 (3)1.1课题研究的意义 (3)1.2国内外究动态目前水平 (4)1.3手写体数字识别简介 (4)1.4识别的技术难点 (5)1.5主要研究工作 (5)第二章手写体数字识别基本过程: (6)2.1手写体数字识别系统结构 (6)2.2分类器设计 (7)2.2.1 特征空间优化设计问题 (7)2.2.2分类器设计准则 (7)2.2.3分类器设计基本方法 (8)3.4 判别函数 (9)3.5训练与学习 (10)第三章贝叶斯方法应用于手写体数字识别 (10)3.1贝叶斯由来 (10)3.2贝叶斯公式 (11)3.3贝叶斯公式Bayes决策理论: (12)3.4贝叶斯应用于的手写体数字理论部分: (15)3.4.1.特征描述: (15)3.4.2最小错误分类器进行判别分类 (17)第四章手写体数字识别的设计流程及功能的具体实现 (18)4.1 手写体数字识别的流程图 (18)4.2具体功能实现方法如下: (19)结束语 (25)致谢词 (25)参考文献 (26)附录 (27)摘要数字识别就是通过计算机用数学技术方法来研究模式的自动处理和识别。

随着计算机技术的发展,人类对模式识别技术提出了更高的要求。

特别是对于大量己有的印刷资料和手稿,计算机自动识别输入己成为必须研究的课题,所以数字识别在文献检索、办公自动化、邮政系统、银行票据处理等方面有着广阔的应用前景。

对手写数字进行识别,首先将汉字图像进行处理,抽取主要表达特征并将特征与数字的代码存储在计算机中,这一过程叫做“训练”。

识别过程就是将输入的数字图像经处理后与计算机中的所有字进行比较,找出最相近的字就是识别结果。

本文主要介绍了数字识别的基本原理和手写的10个数字字符的识别系统的设计实现过程。

第一章介绍了数字识别学科的发展状况。

第二章手写体数字识别基本过程。

第三章贝叶斯方法应用于手写体数字识别。

第四章手写体数字识别的设计流程及功能的具体实现,并对实验结果做出简单的分析。

手写数字识别的研究与应用

手写数字识别的研究与应用

手写数字识别的研究与应用一、概述手写数字识别是计算机视觉和模式识别领域的重要研究内容,具有广泛的应用前景。

随着信息化和数字化的发展,手写数字识别技术在银行票据处理、邮政编码识别、税务表单处理、移动支付以及智能设备交互等方面发挥着越来越重要的作用。

手写数字识别的主要任务是将手写输入的数字转化为计算机可理解的数字信息。

由于手写数字存在书写风格多样、笔迹变化大、书写不规范等问题,使得手写数字识别成为一项具有挑战性的任务。

研究手写数字识别的算法和技术,提高识别的准确性和鲁棒性,具有重要的理论价值和实际应用意义。

近年来,随着深度学习技术的发展,基于神经网络的手写数字识别方法取得了显著的进步。

这些方法通过构建复杂的网络结构,自动学习手写数字的特征表示和分类器,从而实现了较高的识别性能。

同时,随着大数据和计算资源的不断丰富,基于深度学习的手写数字识别方法在实际应用中也越来越广泛。

本文旨在探讨手写数字识别的研究与应用,首先介绍手写数字识别的基本原理和常用方法,然后分析深度学习在手写数字识别中的应用及最新进展,最后讨论手写数字识别在实际场景中的应用案例和未来发展趋势。

通过本文的研究,期望能够为手写数字识别领域的研究者和应用开发者提供一定的参考和借鉴。

1. 手写数字识别的背景与意义随着信息技术的飞速发展,数字化、自动化和智能化已经成为现代社会的重要特征。

在这一背景下,手写数字识别技术应运而生,成为人工智能和计算机视觉领域的重要研究方向。

手写数字识别技术的主要目标是将手写输入的数字信息自动转换为计算机可识别的数字编码,从而实现信息的快速、准确录入和处理。

手写数字识别的研究具有重要意义。

它在实际应用中具有广泛的需求。

例如,在金融、邮政、税务、交通等领域,大量手写数字信息需要被快速、准确地录入和处理。

手写数字识别技术能够大大提高这些工作的效率和准确性,减少人为错误和劳动强度。

手写数字识别技术的研究有助于推动人工智能和计算机视觉领域的发展。

模式识别人工智能论文【范本模板】

模式识别人工智能论文【范本模板】

浅谈人工智能与模式识别的应用一、引言随着计算机应用范围不断的拓宽,我们对于计算机具有更加有效的感知“能力”,诸如对声音、文字、图像、温度以及震动等外界信息,这样就可以依靠计算机来对人类的生存环境进行数字化改造.但是从一般的意义上来讲,当前的计算机都无法直接感知这些信息,而只能通过人在键盘、鼠标等外设上的操作才能感知外部信息。

虽然摄像仪、图文扫描仪和话筒等相关设备已经部分的解决了非电信号的转换问题,但是仍然存在着识别技术不高,不能确保计算机真正的感知所采录的究竟是什么信息。

这直接使得计算机对外部世界的感知能力低下,成为计算机应用发展的瓶颈。

这时,能够提高计算机外部感知能力的学科—-模式识别应运而生,并得到了快速的发展,同时也成为了未来电子信息产业发展的必然趋势。

人工智能中所提到的模式识别是指采用计算机来代替人类或者是帮助人类来感知外部信息,可以说是一种对人类感知能力的一种仿真模拟。

近年来电子产品中也加入了诸多此类的功能:如手机中的指纹识别解锁功能;眼球识别解锁技术;手势拍照功能亦或是机场先进的人耳识别技术等等.这些功能看起来纷繁复杂,但如果需要一个概括的话,可以说这都是模式识别技术给现代生活带来的福分.它探讨的是计算机模式识别系统的建立,通过计算机系统来模拟人类感官对外界信息的识别和感知,从而将非电信号转化为计算机可以识别的电信号.二、人工智能和模式识别(一)人工智能。

人工智能(Artificial Intelligence),是相对与人的自然智能而言的,它是指采用人工的方法及技术,对人工智能进行模仿、延伸及扩展,进而实现“机器思维"式的人工智能.简而言之,人工智能是一门研究具有智能行为的计算模型,其最终的目的在于建立一个具有感知、推理、学习和联想,甚至是决策能力的计算机系统,快速的解决一些需要专业人才能解决的问题。

从本质上来讲,人工智能是一种对人类思维及信息处理过程的模拟和仿真。

(二)模式识别。

基于模式识别的手写体数字识别技术研究

基于模式识别的手写体数字识别技术研究

基于模式识别的手写体数字识别技术研究手写体数字识别技术是一项关键的人工智能技术,它在日常生活中得到了广泛应用。

本文将研究基于模式识别的手写体数字识别技术,通过深入分析现有的研究成果,总结这一技术的原理、方法和应用,并探讨其存在的挑战和未来发展方向。

一、手写体数字识别技术的原理手写体数字识别技术的原理是模式识别。

它通过分析手写数字的笔画特征和形状,提取出数字的特征向量,并将其与已有的数字模板进行比对和匹配,最终确定数字的类别。

手写体数字识别技术的关键是构建有效的特征提取和匹配算法。

二、手写体数字识别技术的方法手写体数字识别技术的方法可以分为两个主要步骤:预处理和特征提取。

预处理阶段主要包括图像二值化、降噪和分割等操作,旨在提高图像质量和准确性。

特征提取阶段则是提取图像的特征向量,常用的方法包括经典的统计学特征提取法、基于神经网络的方法以及基于深度学习的方法等。

三、手写体数字识别技术的应用手写体数字识别技术具有广泛的应用前景。

首先,它可以应用于邮政和快递行业,自动识别信件和包裹上的手写数字,提高处理效率和准确性。

其次,手写体数字识别技术还可以用于银行和金融机构,实现自动化的支票和票据处理。

此外,它还可以应用于教育领域,用于批改学生的试卷和作业。

四、手写体数字识别技术存在的挑战尽管手写体数字识别技术已取得了一些进展,但仍然存在一些挑战。

首先,手写体数字的多样性和变异性导致了识别的复杂性。

不同人的手写风格差异较大,需要建立较大规模的数字模板库以适应各种手写样式。

其次,噪声和干扰也会对手写体数字的识别造成干扰,需要提出更加鲁棒和稳健的算法。

此外,手写体数字的识别速度也需要进一步提高,以满足实时识别的需求。

五、手写体数字识别技术的未来发展方向随着人工智能技术的不断发展,手写体数字识别技术也将得到进一步的改进和推广。

未来,手写体数字识别技术有望结合高级机器学习算法,如卷积神经网络和循环神经网络,实现更高的准确性和鲁棒性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

保密类别编号毕业论文数字识别实现学院计算机学院专业软件工程班级2班姓名王茜指导教师黄祥林中国传媒大学年月日数字识别实现王茜摘要在信息化飞速发展的时代,光学字符识别是一种重要的信息录入与信息转化的手段。

数字识别作为光学字符识别中的一个分支,在车牌识别、邮政编码识别、统计报中等领域有着非常广泛的应用,用数字识别系统代替手工录入,可节约大量的人力和财力。

因此,数字识别的研究有着重大的现实意义。

本文主要研究的即数字识别问题。

首先,对数字图像的预处理工作进行了详细的介绍,其中包括:二值化、字符切分、归一化等。

接着介绍了当前数字识别的几种常用方法。

然后重点描述了用于印刷体数字识别的模板匹配法和基于整体特征的快速手写体数字识别法的原理,并给出了算法实现的过程。

实验结果证明,上述算法能取得较好的识别效果。

关键词:数字识别,图像预处理,模板匹配,整体特征Xi. WangABSTRACTOCR (Optical Character Recognition) has become one of the important methods in gathering information and information transformation. Digit recognition has a promising business feature in many fields in society, for example the car license plate recognition、postcode recognition, the statistics of report forms, financial report forms. So the researching on the Digit recognition is one of the important things.The paper describes the basic process and methods of numeral recognition system. First,Keywords: Numeral recognition \一、绪论(一)问题的提出光学字符识别(Optical Character Recognition),是属于图型识别的范畴。

一个OCR识别系统,其目的是把图像中的内容转化为文本格式,便于计算机进行后续处理,使图像资料的储存量减少,同时也可节省因键盘输入的人力与时间。

数字识别技术作为光学字符识别中的一个分支,也是现在非常受人们关注的问题。

目前,数字识别技术主要分为印刷体数字识别技术和手写体数字识别技术。

印刷体数字识别在许多领域都有广泛的应用价值。

如印刷字体的邮政编码识别系统,通过印刷体识别技术识别邮件上的邮政编码,帮助邮局做快速区域分信的作业;另外,身份证号码的识别、汽车牌照的识别、电话号码识别等[1]也是印刷体数字识别技术的应用领域,通过此技术的应用,可以节约大量的人力录入时间和财力。

手写体数字识别,是使计算机能够识别手写的数字,包括联机手写体数字识别和脱机手写体数字识别。

联机手写数字的识别目前在实际生活中已经有了很多的应用,如在带有写字板的手机中,电话号码的写入,及各种商务伴侣中手写字符的录入等。

脱机手写体数字识别是整个数字识别领域中最为困难的部分,但经过多年的研究,研究者们已经开始把各种理论方法实用化,为手写数据的高速自动录入提供了一种解决方案。

近些年来,我国开始大力推广的“三金”工程在很大程度上要依赖数据信息的输入,如果能通过手写数字识别技术实现信息的自动录入,无疑会促使这一事业的进展。

因此,手写数字的识别研究有着重大的实现意义,一旦研究成功并投入使用,将产生巨大的社会和经济效益。

[2]在各种应用领域,由于相关软硬件技术性能的不断提升,新的方法理论不断涌现并应用,同时原有方法也不断被重新组合利用以达到更好的性能。

因此,该问题的提出有很大的现实意义。

(二)论文的内容本文主要研究的是数字识别技术。

数字识别技术通过提取代表数字的特征,再根据提取的特征设计相应的分类器进行分类识别,得到正确的识别结果。

根据印刷体和手写体的特点,本文分别提出了相应地特征提取技术和分类方法,主要内容包括一下几个方面:1、介绍了数字识别技术的主要流程,对流程中的各个功能模块进行了系统的阐述,并对目前常用的方法进行了概括。

2、详细介绍了基于模板匹配的印刷体数字识别方法,对原理和算法实现都进行了细致的描述。

3、分析了手写数字的特点,提出一种基于整体特征的手写体数字快速识别方法,并详细阐述了其算法思想和实现方法。

(三)论文结构根据论文的主要内容,安排论文的结构如下:第一章绪论,介绍了数字识别问题的研究意义,论文的主要内容与结构安排。

第二章数字识别技术的概述,对各个功能模块进行详细的介绍。

第三章介绍基于模板匹配的印刷体数字识别技术的实现过程及实验结果。

第四章介绍基于整体特征的快速手写识别的原理和算法实现过程及实验结果。

第五章对整个研究工作做出总结回顾,并做出一些后续工作的难点和展望,以作为论文的结束语。

二、数字识别概述数字识别,其目的是实现数字识别,首先要对数字图像进行预处理,然后提取数字的特征,最后进行分类识别,输出识别结果,基本流程图如图2.1所示:字符图像输入图像预处理特征提取分类识别字符输出2.1 计算机数字识别流程图下面对数字识别中的每个功能模块进行详细的阐述:(一)图像的输入图像的输入就是图像数字化的过程。

BMP文件格式是微软公司定义的一种广泛使用的图像文件格式,本文所讨论的数字识别的识别对象—字符点阵图像就是BMP文件格式。

(二)图像预处理预处理作为后续工作的基础,是一个相当重要的部分,图像预处理工作的好坏直接影响到识别的效率。

预处理一般包括二值化,行字切分、归一化和细化等。

不同的识别方法,对预处理的项目和要求有所差别。

1.二值化字符图像的二值化即把字符灰度图像处理成二值图像的过程。

二值化的关键是要找到合适的阈值来区分对象和背景。

灰度图像二值化能显著减小数据存储的容量,并能够降低后续处理的复杂度。

根据阈值选取方法的不同,二值化方法主要分为三类:全局阈值法、局部阈值法和动态阈值法。

(1)全局阈值二值化全局阈值二值化方法是根据图像的直方图或灰度空间分布确定一个阈值,并根据此阈值实现灰度图像到二值化图像的转化。

典型的全局阈值法包括Ostu[13]方法、最大熵方法[14]等。

全局阈值方法的优点在于算法简单,对目标和背景明显分离、直方图分布是双峰的图像效果良好,但对输入图像量化噪声或不均匀光照等情况抵抗力差,应用受到限制。

(2)局部阈值二值化由像素()j i,的灰度值()j i f,和像素周围点的局部灰度特性确定阈值的方法称为局部阈值选择法。

非均匀光照条件等情况虽然影响整体图像的灰度分布却不影响局部的图像性质。

邻域的规定及邻域计算模板的选取都是决定算法效果的关键因素。

局部阈值法也存在缺点和问题,如实现速度慢,不能保证字符笔画连通性,以及容易出现伪影现象等。

(3)动态阈值二值化当阈值选择不仅取决于该像素阈值以及其周围像素的灰度值,而且还和该像素坐标位置有关时,称之为动态阈值选择法。

由于充分考虑了每个像素邻域的特征,能更好的突出背景和目标的边界,使相距很近的两条线不会产生粘连现象,可以处理低质量甚至单峰值直方图图像。

但是,这种方法的计算量很大,运算速度一般比较慢。

2.字符的切分灰度图像经过二值化处理后,文字图像就变成了一些二值数字信号,它是一个整体,要想识别单个文字,就需要把每个文字从文字图像中分离出来,这就是所谓的切分。

目前,已提出的字符切分方法有很多种,下面对几种比较常用的方法作简单的介绍:(1)垂直投影法垂直投影法是最常用的一种切分方法,利用字符间的空隙在直方图上呈现波谷状进行字符的切分,该方法速度快,实现简单。

但简单的投影图法存在很大的缺陷,由于字符中经常存在的空洞或者字符的粘连,导致字符的垂直投影有多处波谷,因此在进行分割时难以依据波谷来确定字符的分割点。

(2)基于多行的垂直投影法这种切分方法实际上是垂直投影法的变形形式。

它通过多行文字在垂直扫描中进行多行信息点个数的统计,然后根据统计特征进行字符切分。

这种方法可以有效的解决由于个别字符断裂产生的错误切分问题。

但是这种方法主要用于字符排列很规整的文本图像,因而该种方法的局限性也很大。

(3)连通域法连通域法是一种应用比较普遍的字符切分方法。

字符的根本特征在于其连通性,无论字符如何倾斜或变形,其连通特征不会改变。

如果把书写的笔画看成连通域,那么数字和英文字母都是由一个连通域构成。

依据字符的这一特点,连通域方法可以实现字符的分割。

总体来说,上述的切分方法各有利弊,但没有一种通用的切分方法能够实现字符的精确切分。

因此,我们可以考虑将几种方法结合起来,以提高切分的速度和准确度。

3.字符的归一化字符图像的归一化包括位置,大小,旋转和倾斜归一化。

下面主要介绍位置归一化和大小归一化。

(1)位置归一化位置归一化就是把数字图像都放到某一固定的位置,能够消除数字点阵位置上的偏差,并能方便数字特征描述、提取。

位置归一化后的数字图像图2.3所示(图中以数字图像外围框的左上角作为归一化基准位置):2.3 数字位置归一化前后图像(2)大小归一化[12]大小归一化是指对不同大小的数字图像作变换,使之成为同一尺寸大小的文字,图像大小归一化方法分为两大类:线性归一化和非线性归一化。

1)线性归一化线性归一化是将数字图像的笔画按比例线性放缩或缩小到规定尺寸的图像,仅与原始数字图像和归一化后图像的大小有关系。

设()y x ,为原图像像素点坐标,()n m ,为归一化后的像素点坐标,则其变换关系如式2-1所示: ⎪⎪⎭⎫ ⎝⎛n m =⎝⎛21a a ⎪⎪⎭⎫21b b ⎪⎪⎭⎫ ⎝⎛y x + ⎪⎪⎭⎫ ⎝⎛21c c (2-1) 其中系数矩阵 ⎝⎛21a a ⎪⎪⎭⎫21b b 决定了图像的比例和旋转变换尺度,⎪⎪⎭⎫ ⎝⎛21c c 体现了图像的平移变换。

如果数字图像已经经过位置归一化,且没有旋转,则上述公式可简化为式2-2: ⎪⎪⎭⎫ ⎝⎛n m = ⎝⎛0x f ⎪⎪⎭⎫y f 0⎪⎪⎭⎫⎝⎛y x (2-2) 其结果如图2.4:2.4 大小归一化前后图像2)非线性归一化。

线性归一化的变换函数为线性函数,不能解决图像的变形问题,故提出了非线性归一化方法。

非线性归一化是通过密度均衡的方法实现大小归一化,以消除输入模式的各种变形,这些方法大致分以下三种:点密度均衡法、线密度均衡法和笔画穿透数均衡法。

4.字符的细化细化是指在保持原图像拓扑结构的情况下,尽可能快地抽取出单像素宽的骨架的过程。

相关文档
最新文档