一种字符识别算法在自动识别系统中的应用_刘春雨

一种字符识别算法在自动识别系统中的应用_刘春雨
一种字符识别算法在自动识别系统中的应用_刘春雨

25卷 第3期2008年3月

微电子学与计算机

MICROELECTRONICS &COMPUTER

Vol.25 No.3March 2008

收稿日期:2007-05-08

一种字符识别算法在自动识别系统中的应用

刘春雨,李 俊

(中国科学院计算机网络信息中心,北京100080)

摘 要:基于车牌识别系统的开发,提出一种基于二值图像的字符识别算法.在该算法中,提取字符的点阵特征、特征线和网格特征,分类器采用神经网络.为充分利用各组特征向量的互补作用,采取层次结构来获得系统的最佳性能.实验表明此算法非常有效.

关键词:字符识别;网格特征;神经网络

中图分类号:TP393 文献标识码:A 文章编号:1000-7180(2008)03-0071-03

A Character Recognition Algorithm in the Application of

Vehicle License Plate Recognition System

LIU Chun 2yu,LI Jun

(Computer Network Information Center,Chinese Academy of Sciences,Beijing 100080,China)

Abstr act:We extract the features including the Lattice Structure,Key Line and Gr id F eatures.T he network is used as t he classificat ion.To make full of use of all kinds of featur e vectors,the hierarchical algorithm is adapted for optimal per 2formance.We test our algorithms in car number plate database.As the experimental results show,our algor ithm is very efficient.

Key words:OCR;grid featur es;nerve network

1 引言

车牌识别系统就是利用光学字符识别技术解决汽车牌照识别的典型系统,它的开发与应用有利于交通的控制与管理,是智能交通系统(IT S)中一个重要组成部分.车牌识别系统的软件部分主要由四部分组成,包括预处理、车牌定位、字符定位与字符识别.这四部分是顺序执行,而每个处理模块都为下一步处理作铺垫,其中字符识别模块是最后一步,也是衡量系统整体性能的一步.

字符识别涉及两个方面,即特征提取和识别方法,二者是继承互补的关系.关于字符的特征提取,目前已有许多经典的算法被提出来.根据字符的图像类型不同,特征提取可以分为彩色特征提取、灰度特征提取和二值特征提取;根据字符特征提取的基础可以分为点阵式统计特征提取,骨架或者细化特

征提取;根据字符特征提取的内容可以分为统计特征的提取,逻辑特征或者笔画特征提取等.

利用二值图像进行字符识别已提出多种算法[126],但识别效率和计算复杂度尚不能令人满意.为此提出新的字符识别算法.

2 算法

经过以上的字符预处理,将二值字符图像送入识别模块,完成字符识别任务.对于二值图像作如下几个步骤:归一化、细化和识别.

2.1 归一化和细化

把分割的二值图像进行线性缩放归一化,这样有利于特征提取和字符识别.归一化就是对实际提取的字符进行缩放操作,最后得到预定大小的字符图像.根据车牌号图片库中提取的4万多个字符样本,统计出样本的平均宽高为:20@16像素,因此利

用式(1)将字符都归一化到20@16大小.

[x c,y c]=

0,if(ori[x,y]==0+[x,y]|Rect)

1,else

(1)

v Ratio=OriHeight/PreHeight

h Ratio=OriWidth/PreWidth

x c=OriWidth/2+(x-PreWidth/2)*

h Ratio

y c=y*v Ratio(2)式中,OriH eight表示原始字符高度,PreH eight表示预定义字符高度,OriWidth表示原始字符宽度, Pre H eight表示预定义字符宽度;v Ratio与h Ratio 分别表示竖直和水平放缩比例;x与y表示在原始图像上的坐标,X c与Y c表示归一化图像上的坐标; ori[x,y]表示原始图像在(x,y)处的像素值,[x c, y c]表示归一化图像下(x c,y c)处的像素值;Rect表示原始图像所在的矩形框,[x,y]|Rect表示该像素点不在图像的矩形框内,则归一化后的像素点值为0.通过归一化处理,得到PreHeight*PreWidth 大小的字符图像.

根据形态学操作中的/中与丢0(hit and mass)原理,对归一化的二值图像进行细化,得到字符的骨架.

2.2识别算法

提取字符的笔画特征,利用模板匹配进行分类,这种方法主要应用于混淆字符或者难以辨别的字符的识别.

2.2.1特征提取

(1)点阵特征:该组特征基于细化的二值图像.二值细化字符图像的点阵结构反映了一个字符的整体结构特征,如果细化效果很好并且待识别的字符字体变换不大,不经过任何处理的点阵特征向量能够作为特征用于识别.通常,分类器采用模板匹配,利用距离函数计算模板与当前字符之间的相似度,其中相似度最小的那个模板所代表的字符即为识别出的字符.这种方法简单易行,并且计算复杂度低,适合印刷体的实时识别.

(2)特征线:如图1所示,统计偶数行和列的线段数目,组成(PreWidth+PreHeight)/2维特征向量.该组特征基于原始图像.这种方法的特点是将点阵结构进行重组,更有效地表达字符.但如果细化效果不好

,或者字符字体变化很大,这种方法就失效了.

图中,1表示前景像素,0表示背景像素;H line1~H line8表示统计的偶数行中所含的线段个

图1偶数行特征线段提取示意图

(H line i表示第i行的线段个数)

数.同样,也统计竖直方向偶数行中线段个数.线段在一定程度上反映了字符在某一方向的笔画密度,而字符笔画是联贯的,所以只需要统计单数行的线段数就能表示一个字符.

(3)网格特征:该组特征基于细化的二值特征.对字符进行分块,然后统计每一个块内前景像素的个数作为统计特征,组成PreWidth/BLOCKSIZEH *Pre H eight/BLOCKSIZEV维向量(其中,BLOCK2 SIZEH和BLOCKSIZEV表示水平和竖直方向划分块的尺寸).这种方法是对点阵结构的分区,也在一定程度上缩小了特征向量的维数.网格特征与特征线都反映了字符的局部特征如图2所示.

以上特征是有互补关系的:点阵特征反映字符的整体特征;特征线和网格特征反映字符的局部特征.所以,有效地利用上述特征,充分发挥各个特征向量的作用,系统性能就会提高.

2.2.2识别算法

利用BP神经网络来分类字符.BP神经网络包括3层:输入层、隐藏层和输出层.输入神经元的个数与特征向量的的尺寸有关,即点阵特征有PreWidth@PreHeight个输入神经元,特征线共有12+(PreWidth+PreH eight)/2个输入,网格特征共有PreWidth/BLOCKSIZEH*PreHeight/BLOCK2 SIZEV个输入,而霍夫矩共有7个输入.隐藏层包括16个神经元,而输出层的神经元个数为数字10个,字母26个.使用log sigmode作为学习函数来训练样本,设置最大叠代次数为1200.为了降低算法的计算复杂度,采取层次识别算法,即先用一些特征

72微电子学与计算机2008年

图2网格特征提取示意图

(block i表示第i块中前景点像素个数)

进行粗分类,然后再用些特征进行细分类,得出识别结果.实验证明,特征线具有较好的粗分类特点,而网格特征具有很好的细分类特点.在系统中,先用点阵特征进行识别,如果识别概率大于一定的阈值,不进行其他特征的分类;如果识别率低于该阈值,则进行二级分类,包括粗分类的特征线,细分类的网格特征和霍夫矩,最后将各个分类的结果融合,得到最佳匹配字符.分类结果融合方法很多,有投票法,也有加权和最大方法等.采用加权和最大方法,其中各个分类结果的权值根据实验得到.

3实验

从两个方面来验证算法性能:识别率和平均运行时间.用车牌图片数据库来检验文中的算法.

在该数据库中,总共有8902个字符,其中有字母2944个,数字5752个,图像大小为16@16.用8136个字符作为训练集,766个字符用于测试.对于网格特征的提取,采取的分块大小为4@4,这样一个字符图像就可以得到16个块.正如识别算法一节描述的那样,点阵特征经过大量样本的训练具有较强的识别能力,表1是基于点阵特征的整体车牌的识别结果.

在表1中,可以看点阵特征比其他特征识别率高,并且多个特征的层次分类及融合能够提高系统性能.从上面的表格可以看出,文中算法在识别率上基本能达到97%以上,并且时间上都不超过50ms,这种系统性能是能够满足车牌识别系统的实时要求.

表1各种特征识别结果

识别结果特征识别率/%平均时间/ms 点阵特征98.1640

特征线95.8235

网格特征89.9836

融合98.9443

4结束语

针对车牌识别提出了基于二值图像统计特征提取的车牌字符识别算法,提出的层次结构算法,融合各个特征向量分类结果得出最佳匹配字符,识别率很高,计算复杂度低,能够满足车牌识别系统的实时要求.

参考文献:

[1]Pratt W K.Digital Image P rocessing[M].2th ed.New

York:John Wiley&Sons,1991.

[2]Egmont-Petersen M,Ridder D de,Handels H.Image

processing using neural networks-a review[J].Pattern Recognition,2002,35(10):2279-301.

[3]Khotanzad A,Hong Y H.Invariant image recognition by

zernike moments[J].I EEE T rans,Patter n Analysis and Machine Intelligence,1990,12(5):489-497.

[4]高珊,刘万春,朱玉文.基于SVM的车牌字符分隔和识

别方法[J].微电子学与计算机,2005,22(6):34-36. [5]张春梅,田玉宝,王尚锦.具有领域独立性的通用模式识

别方法的研究[J].微电子学与计算机,2006,23(8):35 -37.

[6]Kimura F,Shr idhar M.Handwritten numerical recognition

based on mult iple algor ithms[J].Pattern Recognition,

1991,24(10):969-983.

作者简介:

刘春雨男,(1979-),硕士研究生.研究方向为网络管理、模式识别.

李俊男,研究员,硕士生导师.研究方向为下一代互联网技术、网络安全技术、多媒体通信.

73

第3期刘春雨,等:一种字符识别算法在自动识别系统中的应用

基于模板匹配算法的数字识别讲解

中南民族大学 毕业论文(设计) 学院: 计算机科学学院 专业: 软件工程年级:2009 题目: 基于模板匹配算法的数字识别学生姓名: 李成学号:09065093指导教师姓名: 李波职称: 讲师 2013年5月

中南民族大学本科毕业论文(设计)原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承担。 作者签名:2013年月日

摘要 (1) Abstract (1) 1 绪论 (2) 1.1 研究目的和意义 (2) 1.2 国内外研究现状 (2) 2 本文基本理论介绍 (3) 2.1 位图格式介绍 (3) 2.2 二值化 (3) 2.3 去噪 (3) 2.4 细化 (4) 2.5 提取骨架 (4) 3 图像的预处理 (5) 3.1 位图读取 (5) 3.2 二值化及去噪声 (5) 3.3 提取骨架 (6) 4 基于模板匹配的字符识别 (8) 4.1 样本训练 (8) 4.2 特征提取 (8) 4.3 模板匹配 (9) 4.4 加权特征模板匹配 (10) 4.5 实验流程与结果 (10) 5 结论 (16) 5.1 小结 (16) 5.2 不足 (16) 6 参考文献 (17)

基于模板匹配算法的数字识别 摘要 数字识别已经广泛的应用到日常生活中,典型的数字自动识别系统由图像采集、预处理、二值化、字符定位、字符分割和字符识别等几部分组成, 这些过程存在着紧密的联系。传统的模板匹配算法因为图像在预处理之后可能仍然存在较大的干扰,数字笔画粗细不均匀,有较大的噪声,识别效率不高。本文采的主要思想就是对字符进行分类,之后对字符进行细化,提取细化后字符的特征矢量,与模板的特征矢量进行加权匹配,误差最小的作为识别结果。本文在模板匹配法的基础上, 采用了特征值加权模板匹配法, 并且改进了匹配系数的求法。应用该法取得了满意的效果, 提高了识别率。 关键词:模板匹配;数字识别;特征值加权;字符识别; Template matching algorithm-based digital identification Abstract Digital identification has been widely applied to daily life, the typical digital automatic identification system by the image acquisition, pre-processing, binarization, character positioning, character segmentation and character recognition several parts, there is a close link these processes. Traditional template matching algorithm because the image may still exist after pre-greater interference, digital strokes uneven thickness, the noise, the identification efficiency is not high. Adopted herein main idea is to classify the character after character refinement, the characters feature vector extraction refinement, and the template feature vector is weighted matching, the minimum error as a recognition result. Template matching method based on feature weighted template matching method, and improve the matching coefficient method. The application of the method to obtain satisfactory results, to improve the recognition rate. Key words:Template matching; digital identification; characteristic value weighted; character recognition;

一种字符识别算法在自动识别系统中的应用_刘春雨

25卷 第3期2008年3月 微电子学与计算机 MICROELECTRONICS &COMPUTER Vol.25 No.3March 2008 收稿日期:2007-05-08 一种字符识别算法在自动识别系统中的应用 刘春雨,李 俊 (中国科学院计算机网络信息中心,北京100080) 摘 要:基于车牌识别系统的开发,提出一种基于二值图像的字符识别算法.在该算法中,提取字符的点阵特征、特征线和网格特征,分类器采用神经网络.为充分利用各组特征向量的互补作用,采取层次结构来获得系统的最佳性能.实验表明此算法非常有效. 关键词:字符识别;网格特征;神经网络 中图分类号:TP393 文献标识码:A 文章编号:1000-7180(2008)03-0071-03 A Character Recognition Algorithm in the Application of Vehicle License Plate Recognition System LIU Chun 2yu,LI Jun (Computer Network Information Center,Chinese Academy of Sciences,Beijing 100080,China) Abstr act:We extract the features including the Lattice Structure,Key Line and Gr id F eatures.T he network is used as t he classificat ion.To make full of use of all kinds of featur e vectors,the hierarchical algorithm is adapted for optimal per 2formance.We test our algorithms in car number plate database.As the experimental results show,our algor ithm is very efficient. Key words:OCR;grid featur es;nerve network 1 引言 车牌识别系统就是利用光学字符识别技术解决汽车牌照识别的典型系统,它的开发与应用有利于交通的控制与管理,是智能交通系统(IT S)中一个重要组成部分.车牌识别系统的软件部分主要由四部分组成,包括预处理、车牌定位、字符定位与字符识别.这四部分是顺序执行,而每个处理模块都为下一步处理作铺垫,其中字符识别模块是最后一步,也是衡量系统整体性能的一步. 字符识别涉及两个方面,即特征提取和识别方法,二者是继承互补的关系.关于字符的特征提取,目前已有许多经典的算法被提出来.根据字符的图像类型不同,特征提取可以分为彩色特征提取、灰度特征提取和二值特征提取;根据字符特征提取的基础可以分为点阵式统计特征提取,骨架或者细化特 征提取;根据字符特征提取的内容可以分为统计特征的提取,逻辑特征或者笔画特征提取等. 利用二值图像进行字符识别已提出多种算法[126],但识别效率和计算复杂度尚不能令人满意.为此提出新的字符识别算法. 2 算法 经过以上的字符预处理,将二值字符图像送入识别模块,完成字符识别任务.对于二值图像作如下几个步骤:归一化、细化和识别. 2.1 归一化和细化 把分割的二值图像进行线性缩放归一化,这样有利于特征提取和字符识别.归一化就是对实际提取的字符进行缩放操作,最后得到预定大小的字符图像.根据车牌号图片库中提取的4万多个字符样本,统计出样本的平均宽高为:20@16像素,因此利

现代数字信号处理及其应用——LMS算法结果及分析

LMS 算法MATLAB 实现结果及其分析 一、LMS :为课本155页例题 图1.1:LMS 算法学习曲线(初始权向量[]T 00w ?=) 图1.2滤波器权系数迭代更新过程曲线(步长075.0=μ) 图1.3滤波器权系数迭代更新过程曲线(步长025.0=μ)图1.4滤波器权系数迭代更新过程曲线(步长015.0=μ) 分析解释: 在图1.1中,收敛速度最慢的是步长为015.0=μ的曲线,收敛速度最快的是步长075.0=μ的曲线,所以可以看出LMS 算法的收敛速度随着步长参数的减小而相应变慢。图1.2、1.3、1.4分别给出了步长为075.0=μ、025.0=μ、025.0=μ的滤波器权系数迭代更新过程曲线,可以发现其不是平滑的过程,跟最抖下降法不一样,体现了其权向量是一个随机过程向量。

LMS2:为课本155页例题,156页图显示结果 图2.1:LMS 算法学习曲线(初始权向量[]T 00w ?=) 图2.2滤波器权系数迭代更新过程曲线(步长025.0=μ) 图2.3滤波器权系数迭代更新过程曲线(步长025.0=μ)图2.4最陡下降法权值变化曲线(步长025.0=μ) 分析解释: 图2.1给出了步长为025.0=μ的学习曲线,图2.2给出了滤波器权向量的单次迭代结果。图2.3给出了一 次典型实验中所得到的权向量估计()n w ?=,以及500次独立实验得到的平均权向量()}n w ?E{=的估计,即()∑==T t n w T 1 t )(?1n w ?,其中)(?n w t 是第t 次独立实验中第n 次迭代得到的权向量,T 是独立实验次数。可以发现,多次独立实验得到的平均权向量()}n w ?E{=的估计平滑了随机梯度引入的梯度噪声,使得其结果与使用最陡下降法(图2.4)得到的权向量趋于一致,十分接近理论最优权向量[]T 7853.08361.0w 0-=。 LMS3:为课本172页习题答案

车辆牌照图像识别算法研究与实现本科毕设论文

Q260046902 专业做论文 西南科技大学 毕业设计(论文)题目名称:车辆牌照图像识别算法研究与实现

车辆牌照图像识别算法研究与实现 摘要:近年来随着国民经济的蓬勃发展,国内高速公路、城市道路、停车场建设越来越多,对交通控制、安全管理的要求也日益提高。因此,汽车牌照识别技术在公共安全及交通管理中具有特别重要的实际应用意义。本文对车牌识别系统中的车牌定位、字符分割和字符识别进行了初步研究。对车牌定位,本文采用投影法对车牌进行定位;在字符分割方面,本文使用阈值规则进行字符分割;针对车牌图像中数字字符识别的问题,本文采用了基于BP神经网络的识别方法。在学习并掌握了数字图像处理和模式识别的一些基本原理后,使用VC++6.0软件利用以上原理针对车牌识别任务进行编程。实现了对车牌的定位和车牌中数字字符的识别。 关键词:车牌定位;字符分割;BP神经网络;车牌识别;VC++

Research and Realization of License Plate Recognition Algorithm Abstract:In recent years, with the vigorous development of the national economy,there are more and more construct in the domestic expressway, urban road, and parking area. The requisition on the traffic control, safety management improves day by day. Therefore, license plate recognition technology has the particularly important practical application value in the public security and the traffic control. In the paper, a preliminary research was made on the license location, characters segment and characters recognition of the license plate recognition. On the license location,the projection was used to locate the license plate; On the characters segmentation, the liminal rule was used to divide the characters; In order to solve the problem of the digital characters recognition in the plate, BP nerve network was used to recognize the digital characters. After studying and mastering some basic principles of the digital image processing and pattern recognition, the task of license plate recognition was programmed with VC++ 6.0 using above principles. The license location and the digital characters recognition in the license plate were implemented. Keywords: license location, characters segmentation, BP nerve network, license plate recognition, VC++

数字信号处理期末论文

题目:基于DSP的FFT程序设计的研究 作者届别 系别专业 指导老师职称 完成时间2013.06

内容摘要 快速傅里叶变(Fas Fourier Tranformation,FFT)是将一个大点数N的DFT分解为若干小点的D F T的组合。将用运算工作量明显降低,从而大大提高离散傅里叶变换(D F T) 的计算速度。因各个科学技术领域广泛的使用了FFT 技术它大大推动了信号处理技术的进步,现已成为数字信号处理强有力的工具,本论文将比较全面的叙述各种快速傅里叶变换算法原理、特点,并完成了基于MATLAB的实现。 关键词:频谱分析;数字信号处理;MATLAB;DSP281x

引言: 1965年,库利(J.W.Cooley)和图基(J.W.Tukey)在《计算数学》杂志上发表了“机器计算傅立叶级数的一种算法”的文章,这是一篇关于计算DFT的一种快速有效的计算方法的文章。它的思路建立在对DFT运算内在规律的认识之上。这篇文章的发表使DFT的计算量大大减少,并导致了许多计算方法的发现。这些算法统称为快速傅立叶变换(Fast Fourier Transform),简称FFT,1984年,法国的杜哈梅尔(P.Dohamel)和霍尔曼(H.Hollmann)提出的分裂基快速算法,使运算效率进一步提高。FFT即为快速傅氏变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进行改进获得的。它对傅氏变换的理论并没有新的发现,但是对于在计算机系统或者说数字系统中应用离散傅立叶变换,可以说是进了一大步。 随着科学的进步,FFT算法的重要意义已经远远超过傅里叶分析本身的应用。FFT算法之所以快速,其根本原因在于原始变化矩阵的多余行,此特性也适用于傅里叶变换外的其他一些正交变换,例如,快速沃尔什变换、数论变换等等。在FFT的影响下,人们对于广义的快速正交变换进行了深入研究,使各种快速变换在数字信号处理中占据了重要地位。因此说FFT对数字信号处理技术的发展起了重大推动作用。 信号处理中和频谱分析最为密切的理论基础是傅立叶变换(Fouriertransform,FT)。快速傅立叶变换(FFT)和数字滤波是数字信号处理的基本内容。信号时域采样理论实现了信号时域的离散化,而离散傅里叶变换理论实现了频域离散化,因而开辟了数字技术在频域处理信号的新途径,推进了信号的频谱分析技术向更广的领域发展。 1.信号的频谱分析 如果信号频域是离散的,则信号在时域就表现为周期性的时间函数;相反信号在时域上是离散的,则该信号在频域必然表现为周期的频率函数。不难设想,一个离散周期序列,它一定具有既是周期又是离散的频谱。有限长序列的离散傅里叶变换和周期序列的离散傅里叶级数本质是一样的。因而有限长序列的离散傅里叶变换的定义为:x(n)和X(k)是一个有限长序列的离散傅里叶变换对。

基于神经网络方法的字符识别方法

论文写作与规范 题目:基于神经网络方法的字符识别方法 学号: 210802102 专业:计算机系统结构 姓名:靳飞飞 2009 年 1 月 9日

基于神经网络方法的字符识别方法 靳飞飞 (中国海洋大学信息科学与工程学院, 山东青岛266071) 摘要:字符识别是模式识别领域的一项传统的课题,这是因为字符识别不是一个孤立的问题,而是模式识别领域中大多数课题都会遇到的基本问题,并且在不同的课题中,由于具体的条件不同,解决的方法也不尽相同,因而字符识别的研究仍具有理论和实践意义。这里讨论的是用神经网络方法实现基于照相的数字图像的字符识别的问题。并且通过模板匹配的方法作为参照,以体现神经网络在处理模式识别问题上的优势。由于人工神经网络的非线性以及并行性和鲁棒性等特点,在上述领域,其取得了以往传统算法无法获得的成功。 关键词:神经网络;字符识别;图像处理 Character recognition based on neural network Jin Feifei (College of Information Science and Engineering,Ocean University of China,Qingdao 266071,China) Abstract:Character recognition is a traditional problem in the field of pattern recognition, for it is rather an isolated task than a fundamental problem in most work of pattern recognition area, with which we have various methods to deal in terms of specific conditions. That means the pursuit of character recognition is of great significance both in theory and in practice .The goal of this paper is using neural network to recognize characters on digital image based on camera. It also can be seen, in the paper, the advantage of neural network compared with the template matching method. Because its nonlinearity, parallel and strong, in these fields mentioned above, artificial neural network has achieved the success which other traditional algorithms can not reach. Key word: neural network, character recognition, image processing 1引言 字符识别是模式识别领域的一项传统的课题,这是因为字符识别不是一个孤立的问题,

数字验证码识别算法的研究与设计

数字验证码识别算法的研究和设计 王虎, 冯林, 孙宇哲 Wang Hu, Feng Lin, Sun Yuzhe 大连理工大学大学生创新院,大连116023 Institute of University Students’ Innovation, Dalian University of Technology, Dalian 116023, China E-mail: wlys111@https://www.360docs.net/doc/099861187.html, Research and Design of Digital character-based CAPTCHA Recognition Abstract:CAPTCHA Recognition can be used in multi-send technology. Digital character-based CAPTCHA Recognition, which is foundation of pattern recognition research, is a kind of OCR. In this paper, we proposed a CAPTCHA Recognition System based on simple distortion and its architecture is template matching. Hilditch thinning algorithm, circle structure searching algorithm and dynamic template analyzing algorithm is chose and the weigh of template is also used to improve the recognition accuracy. The advantage of the system is that the recognition precision is perfect. Key words:Template matching, Weighted Template, dynamic template, grid feature, crossing points feature 摘要:验证码识别技术可以用于网站的群发软件,数字验证码识别是光学字符识别(OCR)的一种,是进行模式识别研究的基础。论文提出了以简单变形的数字字符为理论研究素材,将模板匹配作为基本框架的验证码识别系统。系统采用图像的Hilditch细化算法、环结构的搜索算法、活动模板分析算法,加入模板分量的权值。其优点在于能够对特定数字验证码精确识别,实验中识别准确率基本达到100%。 关键字:模板匹配,加权模板,活动模板,网格特征,交叉点特征 文章编号:文献标识码:A 中图分类号:TP391.43 引言 目前,网络上出现了很多以图片形式出现的基于文本的验证码。所谓验证码,就是将一串随机产生的字符,生成一幅图片,图片里随机的加入一些像素干扰、颜色干扰和形变干扰等等,以达到防止恶意注册等目的。有的验证码是无像素干扰的、大小固定的、质心位置居中,含有形变干扰的数字字符,我们称之为简单变形体。反之,我们称加入了更多干扰的字符为复杂变形体。 验证码千变万化,而当前的识别系统都具有很强针对性,只能够识别一种类型的验证码,而且验证码的技术不断发展,出现了更加复杂的基于图像的验证码系统[5],并且目前人工智能(机器智能)还远未赶上人类智能,但是对于给定的验证码系统,在获知其特点之后,基本能够以一定的准确率进行识别[6、7]。 基金项目: 国家自然科学基金( the National Foundation of China under Grant No.10471051 )。 作者简介: 王虎(1984-),学士,研究方向:计算机图形处理,模式识别与智能控制; 冯林(1969-),博士,教授,研究方向:图像压缩、配准及融合和演化算法; 孙宇哲(-),硕士,研究方向:.

数字信号处理技术及发展趋势

数字信号处理技术及发展趋势 贵州师范大学物电学院电子信息科学与技术 罗滨志 120802010051 摘要 数字信号处理的英文缩写是DSP,而数字信号处理又是电子设计领域的术语,其实现的功能即是用离散(在时间和幅度两个方面)所采样出来的数据集合来表示和处理信号和系统,其中包括滤波、变换、压缩、扩展、增强、复原、估计、识别、分析、综合等的加工处理,从而达到可以方便获得有用的信息,方便应用的目的【1】。而DPS实现的功能即是对信号进行数字处理,数字信号又是离散的,所以DSP大多应用在离散信号处理当中。 从DSP的功能上来看,其发展趋势日益改变着我们的科技的进步,也给世界带来了巨大的变化。从移动通信到消费电子领域,从汽车电子到医疗仪器,从自动控制到军用电子系统中都可以发现它的身影【2】。拥有无限精彩的数字信号处理技术让我们这个世界充满变化,充满挑战。 In this paper Is the abbreviation of digital signal processing DSP, the digital signal processing (DSP) is the term in the field of electronic design, the function of its implementation is to use discrete (both in time and amplitude) sampling represented data collection and processing of signals and systems, including filtering, transformation, compression, extension, enhancement, restoration, estimation, identification, analysis, and comprehensive processing, thus can get useful information, convenient for the purpose of convenient application [1]. And DPS the functions is to digital signal processing, digital signal is discrete, so most of DSP applications in discrete signal processing. From the perspective of the function of DSP, and its development trend is increasingly changing our of the progress of science and technology, great changes have also brought the world. From mobile communication in the field of consumer electronics, from automotive electronics to medical equipment, from automatic control to the military electronic systems can be found in the figure of it [2]. Infinite wonderful digital signal processing technology to let our world full of changes, full of challenges

基于MATLAB的字符识别研究

基于MATLAB的字符识别研究 汽车牌照识别程序的设计 摘要:本次课程设计的目的是通过对基于MATLAB的字符识别的研究,以汽车牌照识别的设计为实例,详细介绍字符识别的相关原理。整个汽车牌照识别的过程分为预处理、边缘提取、车牌定位、字符分割、字符识别五大模块,用MATLAB软件编程来实现每一个部分,最后识别出汽车牌照。在研究的同时对其中出现的问题进行了具体分析,处理。寻找出对于具体的汽车牌照识别过程的最好的方法。 关键词:MATLAB 字符识别车牌识别神经网络图像处理 引言 在MATLAB的字符识别研究中,汽车牌照的识别是最经典的样例,因为车辆牌照识别系统(License Plate Recognition System,简称LPRS)是建设智能交通系统不可或缺的部分。基于 MATLAB 图像处理的汽车牌照识别系统是通过引入数字摄像技术和计算机信息管理技术,采用先进的图像处理模式识别和人工智能技术,通过对图像的采集和处理,获得更多的信息,从而达到更高的智能化管理程度。车牌识别系统整个处理过程分为预处理、边缘提取、车牌定位、字符分割、字符识别五大模块,用 MATLAB软件编程来实现每一个部分处理工程,最后识别出汽车牌照。 一、MATLAB及其图像处理工具概述 MATLAB 是 MATrix LABoratory (矩阵实验室)的缩写,是 Math Works 公司开发的一种功能强效率高简单易学的数学软件。MATLAB 的图像处理工具箱,功能十分强大,支持的图像文件格式丰富,如 *.BMP、*.JPG、 *.JPEG、 *.GIF、 *.TIF 、*.TIFF、 *.PNG 、*.PCX、*.XWD、 *.HDF、*.ICO 、*.CUR 等。MATLAB 7.X 提供了20 多类的图像处理函数,几乎涵盖了图像处理的所有技术方法,是学习和研究图像处理的人员难得的宝贵资料和加工工具箱。这些函数按其功能可分为:图像显示、图像文件 I/O、图像算术运算、几何变换、图像登记、像素值与统计图像分析、图像增强、线性滤波、线性二元滤波设计、图像去模糊、图像变换、邻域与块处理、灰度与二值图像的形态学运算、基于边缘的处理、色彩映射表操作色彩空间变换图像类型与类型转换。MATLAB 还着重在图形用户界面(GUI)的制作上作了很大的改善,对这方面有特殊要求的用户也可以得到满足。本文将给出 MATLAB 的图像处理工具箱中的图像处理函数实现图像处理与分析的应用技术实例。 二、基于 MATLAB图像处理的汽车牌照识别系统 1.系统组成 基于 MATLAB图像处理的汽车牌照识别系统主要包括车牌定位字符车牌分割和车牌字符识别三个关键环节其识别流程图如图 1所示。 图1 识别流程图

一种基于多模板匹配的字符识别方法

一种基于多模板匹配的字符识别方法 李 婧,龚晓峰,王瑞辉 (四川大学 电气信息学院 成都 610065) 摘要:本文在对字符进行各种预处理,包括倾斜校正,归一化,分割的基础上,依据字符的高度,宽度范围,提出了一种基于多模板匹配的字符识别方法,并将该算法运用于仿宋_GB2312字体,识别率达到98%以上,有效的提高了识别正确率,简单易实现。 关键词:倾斜校正;字符分割;多模板匹配 中图分类号:TP391.41 文献标识码:A A recognition method of characters based on Multi-Template Matching LI Jing, GONG Xiao-feng, Wang Rui-hui (College of Electrical Information, Sichuan University, Chengdu 610065, China) Abstract: This paper first do pretreatment such as skew correction, normalization, segmentation of characters, etc. Then it presented a new muti-template matching method according to the range of the character’s width and height. At last, the experiment used in the FangSong_GB2312 font show that this method can improve recognition accuracy and is easy to put into practice. Keywords: skew correction; character segmentation; multi-template matching 0 引言 字符识别是图像处理和模式识别领域中的研究课题之一,它涉及模式识别、图像处理、人工智能、中文信息处理等学科,是一门综合性技术,在中文信息处理、办公室自动化、人工智能、车牌识别、交通管理等高技术领域都有着重要的实用价值和理论意义[1]。目前字符识别主要有以下几种方法:1)利用字符的统计特征进行特征提取,2)基于字符结构分析的识别方法,3)利用字符的结构特征和变换进行特征提取,4)基于模板匹配的方法进行字符识别,5)近年来又出现了基于神经网络的算法和基于矩和小波变换的识别算法。但由于同一字体的字符有各种字号的差异,单一的运用上述某一种方法的效果都不理想[2]。为了提高识别率,本文从识别率较高的模板匹配法入手,对单模板匹配和特征模板进行改进,提出了一种根据字符高度,宽度值为每个字聚类多个模板,最后采用海明距离实现多模板的匹配。通过将该算法运用于仿宋_GB2312字体,发现这一方法能有效解决相似度高的字符的正确识别问题,有一定的实用价值。 1 识别系统总体方案 字符识别系统一般包括字符预处理,字符分割,字符识别三个环节,系统框图如图1所示。

DSP数字信号处理

数字信号处理是将信号以数字方式表示并处理的理论和技术。数字信号处理与模拟信号处理是信号处理的子集。 简介 简单地说,数字信号处理就是用数值计算的方式对信号进行加工的理论和技术,它的英文原名叫digital signal processing,简称DSP。另外DSP也是digital signal processor的简称,即数字信号处理器,它是集成专用计算机的一种芯片,只有一枚硬币那么大。有时人们也将DSP看作是一门应用技术,称为DSP 技术与应用。 《数字信号处理》这门课介绍的是:将事物的运动变化转变为一串数字,并用计算的方法从中提取有用的信息,以满足我们实际应用的需求。 本定义来自《数字信号处理》杨毅明著,由机械工业出版社2012年发行。 特征和分类 信号(signal)是信息的物理体现形式,或是传递信息的函数,而信息则是信号的具体内容。 模拟信号(analog signal):指时间连续、幅度连续的信号。 数字信号(digital signal):时间和幅度上都是离散(量化)的信号。 数字信号可用一序列的数表示,而每个数又可表示为二制码的形式,适合计算机处理。 一维(1-D)信号: 一个自变量的函数。 二维(2-D)信号: 两个自变量的函数。 多维(M-D)信号: 多个自变量的函数。 系统:处理信号的物理设备。或者说,凡是能将信号加以变换以达到人们要求的各种设备。模拟系统与数字系统。 信号处理的内容:滤波、变换、检测、谱分析、估计、压缩、识别等一系列的加工处理。 多数科学和工程中遇到的是模拟信号。以前都是研究模拟信号处理的理论和实现。 模拟信号处理缺点:难以做到高精度,受环境影响较大,可靠性差,且不灵活等。数字系统的优点:体积小、功耗低、精度高、可靠性高、灵活性大、易于大规模集成、可进行二维与多维处理 随着大规模集成电路以及数字计算机的飞速发展,加之从60年代末以来数字信号处理理论和技术的成熟和完善,用数字方法来处理信号,即数字信号处理,已逐渐取代模拟信号处理。 随着信息时代、数字世界的到来,数字信号处理已成为一门极其重要的学科和技术领域。 数字信号处理器 DSP芯片,也称数字信号处理器,是一种特别适合于进行数字信号处理运算的微处理器,其主要应用是实时快速地实现各种数字信号处理算法。根据数字信号处理的要求,DSP芯片一般具有如下主要特点: (1)在一个指令周期内可完成一次乘法和一次加法;

光学字符识别

光学字符识别 OCR是英文Optical Character Recognition的缩写,意思是光学字符识别,也可简单地称为文字识别,是文字自动输入的一种方法。它通过扫描和摄像等光学输入方式获取纸张上的文字图像信息,利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中,从根本上改变了人们对计算机汉字人工编码录入的概念。使人们从繁重的键盘录入汉字的劳动中解脱出来。只要用扫描仪将整页文本图像输入到计算机,就能通过OCR软件自动产生汉字文本文件,这与人手工键入的汉字效果是一样的,但速度比手工快几十倍。比如用手机给名片拍照,名片中的姓名、电话号码等信息就会自动识别进入到手机中,从此查询、拨打轻而易举。目前支持该功能的手机主要有摩托罗拉A1200、索爱P990和LG G832等。所以,OCR是一种非常快捷、省力的文字输入方式,也是在文字量比较大的今天,很受人们欢迎的一种输入方式。 由于OCR是一门与识别率拔河的技术,因此如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。而根据文字资料存在的媒体介质不同,及取得这些资料的方式不同,就衍生出各式各样、各种不同的应用。 在此对OCR作一基本介绍,包括其技术简介以及其应用介绍。 OCR的发展 要谈OCR的发展,早在60、70年代,世界各国就开始有OCR的研究,而研究的初期,多以文字的识别方法研究为主,且识别的文字仅为0至9的数字。以同样拥有方块文字的日本为例,1960年左右开始研究OCR的基本识别理论,初期以数字为对象,直至1965至1970年之间开始有一些简单的产品,如印刷文字的邮政编码识别系统,识别邮件上的邮政编码,帮助邮局作区域分信的作业;也因此至今邮政编码一直是各国所倡导的地址书写方式。 OCR可以说是一种不确定的技术研究,正确率就像是一个无穷趋近函数,知道其趋近值,却只能靠近而无法达到,永远在与100%作拉锯战。因为其牵扯的因素太多了,书写者的习惯或文件印刷品质、扫描仪的扫瞄品质、识别的方法、学习及测试的样本……等等,多少都会影响其正确率,也因此,OCR的产品除了需有一个强有力的识别核心外,产品的操作使用方便性、所提供的除错功能及方法,亦是决定产品好坏的重要因素。 一个OCR识别系统,其目的很简单,只是要把影像作一个转换,使影像内的图形继续保存、有表格则表格内资料及影像内的文字,一律变成计算机文字,使能达到影像资料的储存量减少、识别出的文字可再使用及分析,当然也可节省因键盘输入的人力与时间。其处理流程如下图:

字符识别方法归纳

字符识别 一、理论 1.结构模式识别:根据字符结构特征进行识别,可用来识别汉字,但抗干扰能力差。可用来识别少量和简单的字符,如数字。 2.统计模式识别:其要点是提取待识别模式的的一组统计特征,然后按照一定准则所确定的决策函数进行分类判决。 常见的统计模式识别方法有: (1) 模板匹配。模板匹配并不需要特征提取过程。字符的图象直接作为特征,与字典中的模板相比,相似度最高的模板类即为识别结果。这种方法简单易行,可以并行处理;但是一个模板只能识别同样大小、同种字体的字符,对于倾斜、笔划变粗变细均无良好的适应能力。 (2)利用变换特征的方法。对字符图象进行二进制变换(如Walsh, Hardama变换)或更复杂的变换(如Karhunen-Loeve, Fourier,Cosine,Slant变换等),变换后的特征的维数大大降低。但是这些变换不是旋转不变的,因此对于倾斜变形的字符的识别会有较大的偏差。二进制变换的计算虽然简单,但变换后的特征没有明显的物理意义。K-L变换虽然从最小均方误差角度来说是最佳的,但是运算量太大,难以实用。总之,变换特征的运算复杂度较高。 (3)投影直方图法。利用字符图象在水平及垂直方向的投影作为特征。该方法对倾斜旋转非常敏感,细分能力差。 (4)几何矩(Geometric Moment)特征。M. K. Hu提出利用矩不变量

作为特征的想法,引起了研究矩的热潮。研究人员又确定了数十个移不变、比例不变的矩。我们都希望找到稳定可靠的、对各种干扰适应能力很强的特征,在几何矩方面的研究正反映了这一愿望。以上所涉及到的几何矩均在线性变换下保持不变。但在实际环境中,很难保证线性变换这一前提条件。 (5)Spline曲线近似与傅立叶描绘子(Fourier Descriptor)。两种方法都是针对字符图象轮廓的。Spline曲线近似是在轮廓上找到曲率大的折点,利用Spline曲线来近似相邻折点之间的轮廓线。而傅立叶描绘子则是利用傅立叶函数模拟封闭的轮廓线,将傅立叶函数的各个系数作为特征的。前者对于旋转很敏感。后者对于轮廓线不封闭的字符图象不适用,因此很难用于笔划断裂的字符的识别。 (6)笔划密度特征。笔划密度的描述有许多种,这里采用如下定义:字符图象某一特定范围的笔划密度是在该范围内,以固定扫描次数沿水平、垂直或对角线方向扫描时的穿透次数。这种特征描述了汉字的各部分笔划的疏密程度,提供了比较完整的信息。在图象质量可以保证的情况下,这种特征相当稳定。在脱机手写体的识别中也经常用到这种特征。但是在字符内部笔划粘连时误差较大。 (7)外围特征。汉字的轮廓包含了丰富的特征,即使在字符内部笔划粘连的情况下,轮廓部分的信息也还是比较完整的。这种特征非常适合于作为粗分类的特征。 (8)基于微结构特征的方法。这种方法的出发点在于,汉字是由笔划组成的,而笔划是由一定方向,一定位置关系与长宽比的矩形段组

基于bp神经网络的字符识别算法的实现毕业(设计)论文正文

一、原始依据(包括设计或论文的工作基础、研究条件、应用环境、工作目 的等。) 工作基础:了解C++的基本概念和语法,熟练使用Visual C++6.0软件。 研究条件:BP神经网络的基本原理以及图像处理的基本常识。 应用环境:基于BP神经网络的图片图像文件中的字符识别。 工作目的:掌握基于Visual C++6.0应用程序的开发。 了解人工智能的基本概念并掌握神经网络算法的基本原理。 掌握Visual C++6.0中的图片处理的基本过程。 二、参考文献 [1]人工智能原理及其应用,王万森,电子工业出版社,2007. [2]VC++深入详解,孙鑫,电子工业出版社,2006. [3]人工神经网络原理, 马锐,机械工业出版社,2010. [4]Visual C++数字图像处理典型案例详解,沈晶,机械工业出版社,2012. [5]Application of Image Processing to the Characterization of Nanostructures Manuel F. M. Costa,Reviews on Advanced Materials Science,2004. 三、设计(研究)内容和要求(包括设计或研究内容、主要指标与技术参数,并根据课题性质对学生提出具体要求。) 1、掌握C++的基本概念和语法。 2、掌握二维神经网络的基本原理。了解BP神经网络的基本概念。 3、完成Visual C++中对于图像的灰度、二值化等预处理。 4、完成基于样本的神经网络的训练以及图像中数字的识别,并对其性能进 行统计和总结,分析其中的不足。 指导教师(签字) 年月日 审题小组组长(签字) 年月日

相关文档
最新文档