基于相关系数的磁墨字符信号识别算法

合集下载

基于模板匹配算法的字符识别系统研究与实现_毕业论文

基于模板匹配算法的字符识别系统研究与实现_毕业论文

合肥学院毕业设计(论文)设计(论文)题目基于模板匹配算法的字符识别系统研究与实现院系名称计算机科学与技术系专业(班级)计算机科学与技术姓名(学号)指导教师系负责人摘要自从计算机问世以来,让机器具有模式识别能力一直是计算机科学家们的努力方向。

研究表明,对视觉和听觉信息的处理过程,不仅仅是一个感知过程,也是一个认知过程。

因此,研究模式识别,是理解人类智能的本质的重要途径。

字符识别是一个传统和典型的模式识别问题,脱机手写数字识别是一个典型的大类别的模式识别问题。

手写体数字具有不同字符字型相差不大、相同字符有多种不同写法、数字没有上下文关系等等特点,使得脱机手写体数字识别成为识别领域最大的难题和最终的目标。

在这种大类别识别的研究中,传统上大多采用模板匹配的方法来解决问题。

而在模板匹配算法中,得计算其特征值。

图像需要经过二值化,细化等预处理。

关键字模板匹配;特征值;细化;二值化ABSTRACTSince computer appeared, it has been an effort direction for scientist to let the computer has the ability of pattern recognition. Researching indicates that the procedure to deal with seeing and hearing not only a procedure of perception but also cognition. Therefore, studying pattern recognition is an important way in understanding the mankind’s intelligence and ability. Character recognition is a traditional and typical pattern recognition problem, and Handwritten Numeral Recognition is a typical large vocabulary pattern recognition problem. Different characters do not vary much, the same character can be written in many ways, there is no context between characters, and so on. Because of so many characteristics, Handwritten Numeral Recognition is a very difficult problem and commonly regarded as one of the ultimate goals of character recognition research. And the template matching algorithm, in its calculation of eigenvalues. Image require two value, thinning and other pretreatment.引言手写数字识别(Handwritten Numeral Recognition)是光学字符识别技术(Optical Character Recognition,简称OCR)的一个分支,它研究的对象是:如何利用电子计算机自动辨认人手写在纸上的阿拉伯数字。

基于RBF神经网络的字符识别

基于RBF神经网络的字符识别

基于RBF神经网络的字符识别由于工业领域中机器视觉快速发展的需要,针对印刷体字符,建立字符识别模型将图像中的文字处理成文本格式。

对已有的数据建立变量的相关系数矩阵,进行主成分分析提取出字符图像特征。

采用RBF径向基函数神经网络作为模式分类器,并建立对于光学字符识别系统适用的网络模型,加以改进原有的两阶段方法。

通过最速下降法快速求解输出权值识别字符。

对建立的字符模型进行了检验,达到了预期目标。

标签:机器视觉;RBF径向基函数神经网络;光学字符识别引言随着机器视觉的快速发展,在许多工业领域中越来越多地应用到光学字符识别系统,针对印刷体字符,建立字符识别模型将图像中的文字处理成文本格式,对输出结果分析,判断是否需要图像数据的预处理,将已有图像数据集进行处理,提取恰当的字符特征来识别字符。

而字符识别就是从原始数据当中找出最能代表同类数据特点及不同类别数据间差异的特征,从而提取出区分度,鲁棒性较好且易于提取的字符特征。

1基于主成分分析的字符特征提取建立变量(即观测指标)的相关系数矩阵:对已有数据提取若干无关的主成分进行降维,对输出结果进行因子分析,建立起变量的相关系数矩阵。

规格化特征向量:对数据进行处理,算出特征根及对应的特征向量和累计贡献率。

得出主成分,即字符特征:对提取的若干主成分进行多元线性回归,得出特征值累计贡献率远超其他特征值的字符特征[1]。

2基于RBF网络的光学字符识别模型基于径向基函数神经网络[1]的模式分类识别字符,各层的权值向量维数等于神经元节点个数[2]。

假设隐藏层有M个节点,x为输入向量,基函数为高斯函数,则隐藏层的输出结果为(1)若输出层有c个节点,权值向量为wm,且神经元的判别函数为线性判别函数,则输出层的结果为各基函数的线性叠加:i=1,2,…M(2)将式(2)写成矩阵形式则为(3)由于输出层神经元采用线性判别函数[4],故其权值向量的求解问题转化为如式(3)所示的线性方程。

使用Goertzel算法识别DTMF信号

使用Goertzel算法识别DTMF信号

使用Goertzel算法识别DTMF信号Goertzel算法Goertzel算法由Gerald Goertzel在1958年提出,用于数字信号处理,是属于离散傅里叶变换的范畴,目的是从给定的采样中求出某一特定频率信号的能量,用于有效性的评价。

这个算法有几个关键的参数:•采样率R,指的是需要分析的数据每秒钟有多少个采样•目标频率f,指的是需要检测并评价的这个频率的值•检测区段采样值数量N,也就是每N个采样这个算法会对频率f 给出评价•检测区段包含目标频率的完整周期个数K很显然,上述参数应该有这样的关系:K = Nf / R这个K值应该是一个整数,而且要大小合适。

如果太大,不利于检测的时效,如果太小,则检测可能不准确。

例如十几甚至二十几左右应该相对合理。

例如R为8000,需要检测800hz的频率,N取值100,那么K为10,很不错。

但是,需要检测的频率有时候并不那么整,例如697,那么N应该取值多少呢?N在1000以内,无法得到一个整数K,我们只能退而求其次,找一个四舍五入误差最小的。

例如N取115,K的计算结果为10.019375,四舍五入为10,而且有较小的误差。

有了上述的参数,然后我们来计算每个采样在一个目标频率一个周期中所占的弧度ω。

既然N个采样表达了K个周期(2π),那么ω应该这样计算:ω = 2πK / N这里需要注意的是,因为K值可能经过了四舍五入,所以上述两个公式必须先后计算,一定不能合在一起化简把K约掉!然后,我们可以得到后期计算会频繁遇到的系数C:C = 2cos(ω) = 2cos(2πK / N)以上参数,我们都可以事先计算好,不必在每个采样分析中再次计算。

之后,就开始针对N个采样进行分析计算首先初始化:Q1 = 0Q2 = 0然后按照顺序针对N个采样每一个值S(我认为这个S一般是一个16位的有符号整数,取值范围在-32768到32767之间,如果你得到的是已经进行过编码的媒体流,例如G.711编码,那么需要首先解码。

基于BP神经网络的字符识别算法的实现设计

基于BP神经网络的字符识别算法的实现设计

摘要人工神经网络是通过对人脑生物神经机理进行简化,抽象和模拟之后建立起来的一种计算模型,属于机器学习的重要研究领域。

本设计主要提出一种用神经网络来识别含有数字字符的方法。

神经网络采用带有动量项和自适应学习率的反向传播算法(BP)进行训练。

在识别之前要对图像进行一系列的预处理,主要包含灰度化、二值化、锐化、噪声去除、字符分割、字符归一化、字符骨架提取等。

经过预处理的图片适合后续的训练及识别。

预处理后对图片上的字符进行特征提取,特征提取的方法很多,这里选择效果较好的十三特征提取法来进行特征提取。

最后采用BP神经网络来对待检测的图片上的数字进行识别。

关键词:反向传播算法;BP网络;人工神经网络;图像处理;特征提取ABSTRACTArtificial neural network is a computational model which is established after the simplification of the biological neural mechanism of human brain and abstract and simulation. It belongs to the important research field of machine learning.In this design, a neural network is proposed to identify the method of containing digital character. The neural network is trained by the back propagation (BP) algorithm with momentum and adaptive learning rate. Before identification, there are a series of image pretreatment which are graying, binarization, sharpening, noise removal, character segmentation, character normalization and character skeleton extraction. Images which are pretreated will be more suitable for the later training and recognition. After pretreatment, feature extraction is performed. There are a lot of ways of feature extraction, the extraction method of thirteen features which has better evaluation was chosen here. Finally, it uses BP neural network to identify the numbers on the pictures which are to be tested.Keywords: BP algorithm; BP Neural Network; ANN; image processing;Feature Extraction.目录第一章绪论 (1)1.1字符识别的简介 (1)1.2文字识别方法及研究现状 (1)1.3课题研究内容 (2)第二章人工神经网络 (3)2.1人工神经网络算法 (3)2.2BP网络 (6)第三章图像的预处理 (12)3.1256色位图灰度化 (12)3.2灰度图像二值化 (12)3.3图像的梯度锐化 (13)3.4去除离散的杂点噪声 (14)3.5整体倾斜度调整 (15)3.6字符分割 (16)3.7标准归一化 (18)3.8紧缩的紧缩重排 (19)3.9特征提取 (20)第四章基于人工神经网络的数字识别 (21)4.1系统框架 (21)4.2基于神经网络的数字识别的基本过程 (22)4.3程序的运行 (25)第五章总结与展望 (28)5.1总结 (28)5.2后续工作及展望 (28)参考文献外文资料中文译文致谢第一章绪论1.1 字符识别的简介字符识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。

基于各向异性磁阻的车型识别算法

基于各向异性磁阻的车型识别算法

科技与创新┃Science and Technology&Innovation ·58·2017年第19期文章编号:2095-6835(2017)19-0058-03基于各向异性磁阻的车型识别算法*孙晓,夏运贵(湖南工业大学电气与信息工程学院,湖南株洲412007)摘要:在分析已有的各种车辆检测技术和车型识别算法的基础上,为了提高车型识别的高效性和准确度,提出采用各向异性磁阻传感器检测技术。

首先,利用动态基值法来抑制AMR的漂移,然后对原始波形进行小波转换来滤波降噪,再从处理后平稳光滑的波形中提取特征向量,最后代入模糊识别算法计算得出车型。

实验结果表明,基于各向异性磁阻的车型模糊识别算法对车型识别准确率达99%.关键词:各向异性磁阻检测器;小波转换处理;特征提取;模糊识别中图分类号:U495文献标识码:A DOI:10.15913/ki.kjycx.2017.19.058当前,我国的交通信息检测技术主要有超声波、红外、视频传感器以及地磁线圈探测仪[1],但存在易受环境影响或安装维护不便等缺陷,而各向异性磁阻传感器(Anisotropic Magneto Resistive,AMR)作为一种先进的、稳定准确的传感系统,以体积小、低功耗、低成本、安装维护方便灵活、可靠性高等优点,能较好地弥补以上检测技术的不足。

车型识别方法有计算车长归类法、模式匹配法、人工神经网路算法等,这些方法要么粗糙,要么实时性不好,其识别的准确率均偏低。

现介绍一种能充分利用AMR检测波形各种信息的模糊识别算法,实现车型快速、准确识别。

1AMR传感器检测技术1.1检测原理AMR磁阻传感器是利用镍铁导磁合金的磁阻效应,镍铁导磁合金的电阻值与偏置电流(I)和磁场矢量(M)之间的夹角存在函数关系,由镍铁合金薄膜片沉积于硅晶片表面的电阻组成惠斯通电桥,从而将磁场的变化转换为差分电压的形式输出[2]。

AMR传感器能准确检测出地磁场强度和方向上万分之一的变化。

光学字符识别的原理和技术

光学字符识别的原理和技术

光学字符识别的原理和技术光学字符识别(OCR)是一种将印刷字符转化为机器可读文本的技术。

在过去,人们需要手动输入和处理大量的文本,这是一项耗时且容易出错的工作。

OCR的出现解决了这一问题,且在当今数字化信息化的时代已经被广泛应用。

1. OCR的原理OCR识别字符的原理跟人类阅读的过程类似,都是从文字的形状和内部特征入手。

OCR系统主要包含两个部分:图像处理和字符识别。

图像处理的任务是将原始图像转化为标准格式,如二值图像或灰度图像。

字符识别采用特定的算法将那些基于图像处理后的文字形状和特征提取进行匹配。

2. OCR的技术在OCR技术方面,目前存在两种主流的技术:传统OCR和深度学习OCR。

传统OCR主要是使用模板匹配和特征匹配技术,是一种基于特征提取的方法。

而深度学习OCR则是应用卷积神经网络和循环神经网络等技术,利用深度学习的方法进行优化。

2.1 传统OCR传统OCR作为OCR技术的先锋,其数据处理方法基本上是高度针对性的。

这样做的缺点在于人工制作样本的成本过高,尤其是在如今在各个领域需要大量文本数据的情况下,制作的成本会更加高昂。

传统OCR技术也有一些缺陷,如在较为复杂的背景下容易出现错误等。

2.2 深度学习OCR随着人工智能技术的发展,深度学习OCR应运而生。

深度学习OCR的主要特点是基于深度学习,而非传统OCR采用的特征匹配技术。

深度学习OCR不再需要我们手动提取文本的某些特征。

相反,它使用神经网络来构建每个字符之间的差异,并将其转换为向量。

同样,深度学习OCR扫描文本时不会受到复杂的背景干扰,也会更加准确。

3. OCR在实际应用中的发展OCR技术现在已被普遍应用于文档处理、自动驾驶、金融、安全等多个领域。

特别是在金融行业,OCR技术能够快速识别银行卡复杂的字符数据,提高金融业务的处理效率。

在医疗领域,OCR技术可应用于电子病历转换,以及药品说明书及病人处方等文本的自动读取和分析,减轻医护人员的工作负担。

字符识别技术研究与应用

字符识别技术研究与应用近年来,随着智能化技术的不断发展,字符识别技术也迅速发展。

字符识别技术是一项将印刷或手写字符翻译成可编辑文本的重要技术。

它可以通过图像处理、模式匹配、机器学习等多种方式识别图像中的字符,将其转化为数字形式,进而方便地进行文字检索、文档管理、自动填表等工作。

本文将就字符识别技术的研究与应用展开阐述。

一、字符识别技术的研究1. 图像预处理字符识别技术的一项重要前置处理是对包含字符的图片进行处理,提取出字符特征。

这一步骤十分关键,因为字符图片可能存在光照、角度、尺度等方面的干扰,而这些干扰会对后续的字符边界定位和识别造成不良影响。

图片的预处理是为了减小这些干扰。

2. 字符边界定位和分割字符边界定位是指首先确定字符在图片中的位置,然后将字符从图片中分离出来。

字符边界定位是字符识别的前提条件,因为字符中不同部分的特征表现不同,需要分别处理。

字符边界定位常常借助于卷积神经网络(CNN)等深度学习模型来完成。

而字符分割是指将字符中的每一个字符分割为不同的图片,方便后续的字符识别。

3. 字符识别字符识别是字符识别技术最核心的部分,其目标是将图片中的字符转化为可编辑的文本。

目前最常用的方法是使用卷积神经网络(CNN)进行字符识别。

二、字符识别技术的应用1. 文字检索文字检索是指在一定的文本库中,通过搜索引擎等工具进行关键词检索,并快速找到相关的文本。

而字符识别技术的应用可以直接将印刷或手写的文本转化为可编辑的文本,进而被纳入到文本库内。

由此可以实现更加精准的检索。

2. 自动填表自动填表是指利用人工智能技术,将印刷或手写文本迅速转化为可编辑文本,自动填充到需要的文本框中。

在银行、法院等需要大量填表而不想浪费时间的机构中,自动填表可以大大提高工作效率。

3. OCR技术OCR即光学字符识别技术。

OCR技术利用字符识别技术将图片中的字符转换为数字形式,可以方便的实现读取身份证、阅读書籍等工作,同时也可以帮助图片编辑、图片识别、仿真等工作。

基于注意力特征融合的漏磁缺陷识别方法

第46卷第2期2024年3月沈 阳 工 业 大 学 学 报JournalofShenyangUniversityofTechnologyVol 46No 2Mar 2024收稿日期:2022-12-08基金项目:中国博士后科学基金项目(2020M670796)。

作者简介:郭 磊(1985—),男,湖北武汉人,高级工程师,硕士,主要从事油气储运工程等方面的研究。

檪檪檪檪檪檪檪檪檪檪殏殏殏殏控制工程 DOI:10.7688/j.issn.1000-1646.2024.02.15基于注意力特征融合的漏磁缺陷识别方法郭 磊1,丁疆强1,李智文1,李洪伟2(1 国家石油天然气管网集团有限公司西气东输分公司,上海200122;2 沈阳国仪检测技术有限公司,辽宁沈阳110043)摘 要:针对漏磁缺陷识别率低、检测速度慢等问题,提出了一种基于注意力特征融合的漏磁缺陷识别方法。

所提算法以CenterNet为基础进行修改,主干网络选取了一种轻量级网络PP LCNet,相较于现在流行的主干特征提取网络既保证了低计算量又保证了高精度。

采用注意力网络CBAM主动学习低层特征中的重要信息并与高层特征进行融合,使模型同时获得低层细粒度信息与高层语义信息,进而提升小缺陷识别的准确率。

结果表明,当IOU大于0 5时,所提算法的准确率为94 3%,推理时间为9 6ms。

关 键 词:注意力机制;缺陷识别;深度学习;深度可分离卷积;特征融合;轻量级网络;漏磁;目标检测中图分类号:TE973 6 文献标志码:A 文章编号:1000-1646(2024)02-0212-07MagneticfluxleakagedefectrecognitionmethodbasedonattentionfeaturefusionGUOLei1,DINGJiangqiang1,LIZhiwen1,LIHongwei2(1.WesttoEastGasTransmissionBranch,NationalPetroleumPipelineNetworkGroupCo.,Ltd.,Shanghai200122,China;2.GuoyiTestingTechnology(Shengyang)Co.,Ltd.,Shenyang110043,Liaoning,China)Abstract:Aimingattheproblemoflowrecognitionrateandslowdetectionspeedofmagneticfluxleakage(MFL)defects,aMFLdefectrecognitionmethodbasedonattentionfeaturefusionwasproposed.ThealgorithmwasmodifiedonthebasisofCenterNet.AlightweightnetworkPP LCNetwasselectedasthebackbonenetwork,whichcouldsimultaneouslyguaranteelowcomputationandhighaccuracy,comparedwiththepopularbackbonefeatureextractionnetwork.Atthesametime,theattentionnetworkCBAMwasusedtopositivelylearntheimportantinformationaboutthelow levelfeaturesandintegrateitwiththehigh levelfeatures.Themodelcouldobtainbothlow levelfine grainedinformationandhigh levelsemanticinformationtoimprovetheaccuracyofsmalldefectrecognition.Theexperimentalresultsshowthattheaccuracyofas proposedalgorithmis94 3%andtheinferencetimeis9 6ms,respectively,whentheIOUisgreaterthan0 5.Keywords:attentionmechanism;defectrecognition;deeplearning;depthwiseseparableconvolution;featurefusion;lightweightnetwork;magneticfluxleakage;objectdetection 管道因其运量大,成本低等优点一直作为输送天然气的主要载体。

基于TMR传感器的冠字码提取与识别算法

第35卷第3期 2015年5月 杭州电子科技大学学报(自然科学版) Journal of Hangzhou Dianzi University(Natural Sciences) Vo1.35 NO.3 

Mav.2015 

DOI:10.13954/j.cnki.hdu.2015.03.015 

基于TMR传感器的冠字码提取与识别算法 薛凌云 ,李欣 (1.杭州电子科技大学生命信息与仪器工程学院,浙江杭州310018; 2.杭州电子科技大学自动化学院,浙江杭州310018) 

摘要:针对第5套人民币冠字码,采用TMR传感器获取冠字码磁信号,经小波变换对信号降噪,采 用能量差法截取冠字码有效磁信号,对其提取多个时域特征,构建特征判据样本库,利用BP神经 网络识别冠字码磁信号,实现真假币分类。实验结果表明,所采集的不同面额纸币的冠字码磁信 号稳定饱和,小波变换对磁信号降噪效果良好,能量差法可以获取完整、有效的冠字码磁信号,BP 神经网络算法运算速度快、识别率达100%。 关键词:冠字码;小波变换;能量差;特征提取与选择 中图分类号:TP274 文献标识码:A 文章编号:1001—9146(2015)03—0073—04 

0 引 言 随着经济的发展,人民币发行量和流通量不断增加,假币严重影响了日常生活和社会秩序¨J,因此 鉴伪工作具有重要的应用意义。在人民币防伪标志中,冠字码是磁特征鉴别技术的重要标志之一。在 冠字码检测传感器中,磁感应线圈检测灵敏度低、抗干扰性能差,锑化铟和非晶态合金丝传感器温度特 性差、信号处理电路复杂 j。而隧道磁电阻(Tunnel Magneto Resistance,TMR)具有灵敏度高、温度特性 好、输出信号强等特点 ,因此采用TMR传感器检测纸币冠字码磁信号。采用小波变换方法滤除所 测磁信号噪声,既可重现信号细节又可弥补上述滤波方法的不足 J。由于时窗瞬时强度比法、能量比 法等计算复杂度高,对噪声敏感,截取精度低 卜m ,本文对滤波后信号采用能量差法准确、高效截取有 效信号,再提取信号时域特征,选择并构建特征判据样本库,运用BP神经网络识别冠字码磁信号,与多 数鉴伪设备仅能识别冠字码信号有无或强弱的性能相比,算法提高了真伪币区分能力。 

基于卷积神经网络的OCR字符识别技术研究

基于卷积神经网络的OCR字符识别技术研究一、前言OCR(Optical Character Recognition)即光学字符识别技术,是将图像或纸质文档中的字符转化为计算机能够处理的文字格式的一种技术。

OCR技术的应用范围十分广泛,例如文本扫描、数字化档案管理、自动识别、智能车辆等,为现代社会的数字化建设做出了巨大的贡献。

基于卷积神经网络的OCR字符识别技术是目前OCR领域中最为先进的技术。

二、OCR字符识别技术概述OCR技术可以分为两个阶段:图像预处理和字符识别。

图像预处理主要包括图像二值化、去噪、字体大小归一化等操作,以便后续处理更容易和准确。

字符识别是将预处理后的图像中各个字符分别识别出来,一般采用模式匹配的方法,即将模板与待识别字符进行匹配,最后得到识别结果。

目前的OCR字符识别技术有基于特征的方法和基于卷积神经网络的方法。

基于特征的方法首先会将字符图像进行预处理,然后提取出人工设计的特征(如HOG、SIFT等),最终将特征传入分类器中进行分类识别。

相比而言,基于卷积神经网络的OCR字符识别技术在训练和识别过程中,不需要人工干预设计特征,而是直接使用图像本身作为输入,由神经网络自动学习特征,最后输出识别结果。

基于卷积神经网络的OCR字符识别技术因其准确率高、可靠性好、泛化能力强等优点,被广泛应用于OCR领域。

三、基于卷积神经网络的OCR字符识别技术1.卷积神经网络简介卷积神经网络(Convolutional Neural Network,CNN),是一种常见的深度神经网络模型,其在图像、语音、文本处理领域有广泛的应用。

CNN一般由卷积层、池化层、全连接层等组成。

其中,卷积层和池化层是CNN的核心组件,分别用于提取图像的特征和降低数据维度。

2.基于卷积神经网络的OCR字符识别技术流程基于卷积神经网络的OCR字符识别技术主要分为三个步骤:图像预处理、卷积神经网络训练和字符识别。

(1)图像预处理图像预处理是OCR字符识别技术的前置步骤。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

总第272期 2012年第6期 计算机与数字工程 

Computer&Digital Engineering Vo1.40 No.6 

18 

基于相关系数的磁墨字符信号识别算法 张新华 范宝德 (1.烟台大学计算机学院烟台 264000)(2.山东莱阳卫生学校莱阳 265200) 

摘要通过研究当前国内磁码的识别方法,提出了一种基于相关系数的磁墨字符信号快速识别算法。该算法是以支票磁码信号为识 别目标,以统计分析方法,确立了检测阈值,运用Matlab软件将采集到的整张支票的磁码长信号进行一系列的预处理及信号分离,把分离出 的单个磁墨字符信号与每个标准磁墨字符信号求相关,以相关系数作为待识别磁码与标准磁码的相似性度量标准,以最大相关系数所对应 的标准磁墨字符符号作为最终识别结果,实现整个磁码信号的识别。对大量的实验结果进行统计分析得出,该识别算法运算速度快、实时性 好,识别精度达99.9 以上。 关键词支票;磁墨字符信号;磁码识别;相关系数 中图分类号TP391.4,TN911.7 

Recognition Algorithm of Magnetic Ink Character Signal Based on Correlation Coefficient 

ZHANG Xinhuaa,2 FAN Baode1 (1.Department of Computer,Yantai University,Yantai 264000)(2.Shandong Laiyang Health School,Laiyang 265200) 

Abstract Through the research of the current domestic magnetic code identification methods,the fast recognition algorithm of magnetic ink character signal on basis of a correlation coefficient was proposed.The algorithm regards the magnetic code signal of the check as the i dentification target,using the statistical analysis methods to establish the detection thresholds,and using Matlab software to have a series of pre processing and signal separation for the collected magnetic code signal of the whole check.In correlation recognition algorithm,the maxi mum correlation coefficient between the isolated single magnetic ink character signal and each standard magnetic ink character signa1 is used to determine the recognition result.The statistical analysis from a large number of experimental results prove that the recognition algorithm has a high operation speed,a good real time,and it’s recognition accuracy can reach 99.9 . Key Words cheque,magnetic ink character signal,magnetic code identification,correlation coefficient Class Number TP391.4,TN911.7 

1 引言 随着金融部门票据处理量的增加,票据账号及其他需 要输入的信息的增加及中国加入WTO后金融行业竞争的 加剧,给银行业务带来很大的工作量和压力。运用电子系 统自动处理金融票据的要求日益迫切。利用计算机技术对 支票进行自动分析、识别、存储、检索的支票自动处理系统, 它可代替传统的手工方式,大大提高支票的自动化处理效 率,确保金融业务安全、提高工作效率、减轻劳动强度和增 强处理准确性,加快资金流转,这对银行控制金融风险,推 动业务自动化的历史进程,都具有极其重要的现实意义。 所以,该系统以其较高的学术价值和应用价值受到国内外 众多著名研究机构以及学者的广泛重视。而在支票识别系 统中识别算法性能好坏会直接关系到识别系统的优劣,因 此,对于支票识别系统中识别算法的研究是有着非常现实 的应用价值和意义。 磁码在支票、证券、税发票、各种门票、车票或在一些高 级证件上等广泛使用l1 ]。本文通过分析我国现行标准中 支票磁码信号特点,提出了一种基于相关系数的磁墨字符 信号快速识别算法。该算法先对整张磁码信号进行预处 理、阈值化后截取出单个磁墨字符信号,是以磁墨字符信号 为识别目标,以统计分析方法,确立了检测阈值,将采集到 的整张支票的磁码长信号进行一系列的预处理后,分离成 单个的磁墨字符信号,将每一个磁墨字符信号与标准信号 标准磁墨字符信号做相关,运用Matlab软件计算待测信号 与标准信号间的相关系数,并以最大相关系数所对应的标 准磁墨字符信号作为识别结果,按照此方法依次实现整个 磁码信号的识别。通过大量的实验获得了识别结果及其统 计参数,结果分析表明,本文提出的识别算法运算速度快、 识别率均达到99.9 以上、鲁棒性好。 

2磁码信号预处理及分离 

一张支票有34个磁墨字符组成,对采集到的整张支票 的磁码信号进行信号识别,首先要对整个磁码序列长信号 进行预处理和信号的分离和提取,分离出34个待检测的单 个磁墨字符信号,并且提取出标准磁码信号。这在整个算 

*收稿日期:2011年11月16日,修回日期:2012年1月31日 作者简介:张新华,女,硕士,讲师,研究方向:计算机应用。范宝德,男,教授,研究方向:计算机应用。 2012年第6期 计算机与数字工程 19 法编写中起着重要的作用,直接关系到识别算法的识别精 度。 2.1信号预处理 信号的预处理包括对信号进行适当的截取,求取磁码 信号的平均,设定信号的阈值。在整个的磁码信号识别算 法中可以滤除两部分的干扰:一部分是在采集设备启动到 真正进行信号采集之前产生的噪声干扰;另一部分是在磁 码信号采集过程中,由外部环境和设备产生的噪声干扰。 根据观察可以看出,第一部分的噪声干扰中没有待识别的 磁码信号,因而产生的信号幅值明显小,因而可以通过适当 的截取信号,即选择磁码信号处理的起始位置。可以轻易 地滤除第一部分产生的干扰。第二部分产生的干扰,则可 以通过合理选取信号的检测阈值滤除或者忽略噪声干扰对 结果的影响。 2.2磁码信号分离 以中国农业银行上海市分行支票CM40715866作为例 子。首先读取该支票磁码信号图如图1。 

一张支票的磁码信号 

图1设备采集的整张支票的磁码信号 由于信号是从采集设备送过来的,所以,这些采集数据 点就反映了被识别支票的磁码波形的全部信息。然后将读 取的磁码信号去除直流分量和滤除采集过程中明显的噪声 干扰,对于每个磁码波形w,可以用含有 个元素的向量 表示: — l, 2,Y 一,Y 。其中,Y (i一1,2,…, )代表波 形某点的幅值,用符号函数产生一定阈值内的正、负向波形 信号,对其进行二值化,产生脉冲,从正向波形的左边开始, 脉冲的最小值与单个波形内部的脉冲信号的最大值之间必 有一个波峰,取脉冲最小值与最大值之间的最大值点就是 相应的波峰点,根据统一的国家标准GB 12184—9O《信息处 理磁墨水字符识别印刷规范》 ]中规定的标准磁墨水字符 的采集波形图2。 

.j 天  ̄ ̄ 

- ●l , 

I ● 图2 GB12184—90标准中磁墨水字符波形 由图2我们可以观察到,每个磁墨水字符的采集波 形,均是有波峰开始,波谷结束。所以找到波峰位置后,再 向前查找一定的点数是波形的起始点。将负向的脉冲信 号左右翻转,则在脉冲信号的最大值与最小值间必有一个 波谷,求出波谷点后,再向后一定的点数就是单个波形的 终止点。这样就把波形分解成了多个独立的磁墨水字符 波形图如图3所示。 

网.网.i网二圈 符号II。 符号-: 符号0 符号1 

. 二阳 

符号2 符号3 符号4 符号5 田.:圈.觋.网 

符号5 符号7 符号8 符号9 图3 12种分离提取后的磁墨字符信号 3识别算法 目前,波形识别算法主要可以分成基于相关系数的算 法和特征提取这两类 ],特征提取的方法有很多,如迭代 法、奇异值分解法等,可是无论哪一种方法特征提取的过程 都比较复杂,并且识别结果与特征提取的好坏密切相关。 基于相关系数的识别算法 在波形识别中应用最广泛, 有很多算法可以计算两个信号间的相关性,但在这些算法 中相关方法由于具有抗干扰性和健壮性的特点是一种优先 选择的算法,但是如果在时域中直接利用皮尔逊相关系数 公式嘲计算两个曲线的相关函数,计算过程中将涉及大量 的平方和乘法运算。皮尔逊相关系数的计算公式: 

一— (1) r一.一——===============■—==============二 1, 。 √∑(z 一 √∑( 一 ) 

式中, 是曲线z与Y的相关系数,取值区间为[一1,1], 的绝对值越大,即 越接近于l或一1,就说明z, 两条 曲线之间相似度越高, 越接近于0,相关度越弱。 本文中我们充分运用快速傅里叶变换(简称FFT)快 速、高效的特点实现离散卷积和相关计算使本算法的计算 时间大大减少,这在进行大量数据检测时效果更加明显。 依据相关定理和维纳一辛钦关系ll ,本文的基于相关系数识 别算法过程可按照以下步骤进行: 1)对分离提取出的12个标准磁墨字符信号的序列bi ( 一1,2,…,12)和34个待测磁墨字符序列z ( 一1,2,…, 34)拓展成相同长度的序列。 2)利用FFT和IFFT分别计算每一个待检测的磁墨 字符与每一个标准磁墨字符的相关系数,并将这些相关系 数存人矩阵r,( 一1,2,…,12)中。 3)以r,( —l,2,…,12)中最大的相关系数所对应的 标准磁墨字符信号作为识别结果。 

4实验结果与分析 在整个识别算法完成之后,我们用了大量的支票为样 本进行测试。表1是根据实验数据统计的待测磁墨字符信 号有标准磁墨字符信号的相关系数(保留两位小数)。 (下转第26页)

相关文档
最新文档