字符识别,算法

合集下载

ocr 常用算法

ocr 常用算法
OCR（Optical Character Recognition，光学字符识别）常用的算法包括：
1. 模板匹配法：将待识别字符与预设字符库模板进行比较，找出最相似的模板作为识别结果。

2. 特征提取法：基于字符的结构特征如连通域、端点、角点等进行分析，并通过训练得到的分类器识别字符。

3. 神经网络模型：尤其是深度学习技术广泛应用后，卷积神经网络（CNN）结合循环神经网络（RNN）或长短时记忆网络（LSTM）在OCR中表现优秀，通过大量标注数据训练，能够自动学习并提取字符特征进行识别。

4. 隐藏马尔可夫模型(HMM)：通过统计学习方法，对字符序列的概率分布进行建模，实现连续字符序列的识别。

以上各算法常结合使用，以提升OCR系统的准确性和鲁棒性。

基于BFGS拟牛顿算法的含噪数字字符识别

ＹＡＮＧａ，ＮＩａｅＣｈｏＥＸｉｎ．，ＺＨＡＯ — ｎ，Ｈｅｍｉｇ‘
（．ｏｌｅｆＭｅｈＥｇ，ｏｔＵｉｏＣｉａＴｉｕｎ００５，ｈｎ；１Ｃｌｇｅｏｃ．ｎ．Ｎｒｎ．ｈｎ，ａａ３０１Ｃｉｈｖｆｙａ
ｔｅｅｗｏｋｗａｒｉｅｙｃｌｎｒｉｂｇｏｔａ．ｅａｇｒｔｍａｇｃｕｒｃｆｓｏｖｒｅｃｈｎｎｔｒｓｔａｎｄｂａｉｇｔａｎｆｎＭａｌｂＴｈｌｏｉｌｈｈｓｈｉｈａｃａｙ，ａｔｃｎｅｇｎｅ，ｃｎｒｃｇｚｈｕｍｅｃｃａａｔｒｔｏｓｆｉｉｎｌＳｔｈｓｂｏｄａｌａｉｎｐｏｐｃｓａｅｏｎｉｅｔｅｎｉｒｈｒｃｅｓｗｉｈｎｉｅｅｆｃｅｔｙ，Ｏｉａｒａｐｐｉｔｒｓｅｔ．ｃｏＫｅｙｗｏｒｓ：ｍｅｃｃａａｔｒｒｃｇｉｉｎ；ｅｒｌｎｔｒＢＦｕｓ－ｗｔｎａｇｒｔｄｎｕｒｈｒｃｅｅｏｎｔｉｏｎｕａｅｗｏｋ；ＧＳｑａｉＮｅｏｌｏｉｈｍ；ｔａＭａｌｂ
中图分类号：Ｐ９Ｔ３３文献标志码：Ａ
Ｒｅｏｎｔｏｆｎｃｇｉｉｎｏｕｍｅｉｈｒｃｅｓｗｉｈｎｏｓｓｄｏｒｃｃａａｔｒｔｉｅｂａｅｎ
ＢＦＧＳｑａｉＮｅｏｌｏห้องสมุดไป่ตู้ｉｈｍｕｓ－ｗｔｎａｇｒｔ
２ＳａｘｕｅｇＥｅｔＭｅｈＣ．Ｌｄ，ｈｎｚｉ４０２Ｃｉ）．ｈｎｉｉｎｌｒｃｏ，ｔ．Ｃａｇｈ６１，ｈｎＨｆｃ．０ａ

基于笔画细化及图形化的牌照数字字符识别预处理算法

ＳＭ＝（ＵＨ１Ｊ＋Ｈ（ … ＋Ｈ（，Ｕ２Ｊ８ＳＭ１＝Ｈ（）＋Ｊ１
Ｈ｛＋Ｈｆ１＋Ｈ（）３１５７
③ ＳＭ＝４，ＵＵＳＭｌ＝０或ＳＭｌ：ｌ或Ｕ【ＳＭｌ【Ｕ＝２且
：
Ｈｌ＋Ｈ（Ｎ）Ｎ＋２＋Ｈｆ５＝．１Ｎ＋）３
１引言
当前，数字字符的识别理论已经比较成熟，可用穿线法、板匹配法等来识别字符。由于牌照模经常暴露在复杂的环境中．照字符笔画可能有断牌
裂、毛刺等退化现象，使得一般的穿线方法不可用。而多模板匹配方法显然又影响识别的速度．不
④ 保持笔画图象的连续性。（如其它的几点情况）算法细化的结果验证如图２～５所示。图
图２原图象
图３细化图象
（Ｉ符目标象素点ＰＪ字Ｏ不可除去的条件
西球
（安７０５ｊ西１０５
要：文章介绍了一种牌照数字字符只别预处理算法一该方法根据数字字符笔画的特点行模板细化进依
据数字笔画的结构信息，构造笔画控制模板，得到图形化的单象素宽字符笔画。
关键词：模板细化，图形化．自适应。处理，符识别预字
⑨ ＳＭ＝，ＳＭ１＝３Ｕ６非Ｕ。
上述５个条件中，当有一个条件成立时．Ｐｏ就不可除去，则，ｏ就要除去实现中，法对超出否Ｐ算图象细化模板的部分按背景对待，增减后所得数Ｍ如超出１，Ｍ取Ｍ／～８则８的余数。

文本查重算法

文本查重算法
文本查重算法主要用于检测文本的相似度或重复度，以下是几种常见的文本查重算法：
字符串匹配算法：这是最基本的文本相似度计算方法，主要通过将两个文本字符串进行逐个字符的比较，计算相同字符的数量占总字符数的比例来判断文本的相似度。

但是，这种方法对于大量文本的比对速度较慢，且只能检测出完全相同的文本。

哈希算法：哈希算法可以快速计算出文本的哈希值，然后通过比对哈希值来判断文本的相似度。

但是，哈希算法存在哈希冲突的问题，即不同的文本可能会产生相同的哈希值，从而导致误判。

N-gram算法：N-gram算法是一种基于文本分词的方法，将文本分成N个连续的词组，然后比对词组的相似度来判断文本的相似度。

N-gram算法可以识别出部分相似的文本，相对于字符串匹配算法和哈希算法，其检测精度更高。

向量空间模型算法：向量空间模型算法是一种基于文本向量化的方法，将文本转换成向量，然后计算向量之间的相似度来判断文本的相似度。

这种方法可以识别出语义相似的文本，相对于其他算法，其检测精度更高。

此外，还有一些其他的文本查重算法，如Jaccard相似度算法、MinHash算法、SimHash算法等。

这些算法各有优缺点，可
以根据具体的应用场景和需求选择合适的算法进行文本查重。

请注意，文本查重算法的选择和使用需要考虑到文本的长度、复杂度、语言特性等因素，以及算法的准确性、效率和可扩展性等因素。

在实际应用中，可能需要结合多种算法和技术来提高查重的准确性和效率。

字符识别技术的研究及应用

字符识别技术的研究及应用随着科技的不断发展，人工智能、机器学习等技术正在影响着我们的日常生活。

其中的一个重要应用就是字符识别技术，它的应用范围非常广泛，例如手写数字识别、光学字符识别、自然场景文字识别等等。

本文就探究字符识别技术的研究现状及其应用。

一、字符识别技术的研究现状字符识别技术是指通过技术手段自动识别二维图像里面的字符和文字，即将字体、手写、光学、语音、人脸等信息转换成计算机可以理解的数字形式。

目前，字符识别技术已经得到了极大的发展，而最先进的技术则是基于深度学习的方法。

深度学习是一种通过构建具有多层的人工神经网络（ANN）来模拟人类大脑的神经网络模型的技术。

该方法可以在大量数据学习的基础上，更精确地进行字符识别。

它通过多次层层训练，使神经网络具备了深层次的抽象特征表达能力，从而更好地识别出输入图像的内容。

深度学习在字符识别技术领域的应用也被称为深度字符识别。

二、字符识别技术的应用字符识别技术在日常生活中有很多应用。

1. 手写数字识别手写数字识别是字符识别技术应用的重要领域之一。

它可用于银行支票的识别、手写数字的文本转换、自动化辨识验证码等方面的应用。

在此应用中，深度学习技术的应用不仅可以识别手写数字，还可以有效地区分出相似的数字，以提高识别率。

2. 光学字符识别光学字符识别（OCR）是另一个重要的字符识别领域。

用于将印刷体字符或手写体字符转为可编辑电子文本时经常使用OCR技术。

OCR技术可以用于很多场合，譬如银行选用OCR技术来读取支票上面的信息、工业界采用OCR技术来追溯出厂日期等信息。

3. 自然场景文字识别自然场景文字识别是将现实世界中的文本提取成为计算机可以使用的文本的技术。

与OCR技术不同的是，自然场景文字包括各种复杂的布局、背景干扰、字体变化、光照不均衡等情况的处理。

4. 人脸识别人脸识别技术是应用最为广泛的一种人工智能技术。

应用该技术可以进行人脸搜索、人脸识别等操作。

在人脸识别的应用中，字符识别技术可以用于提取人脸部分的关键信息，以更准确地进行人脸识别。

常用的车牌识别算法

常用的车牌识别算法包括以下几种：
1. 车牌定位算法：用于确定车辆图像中车牌的位置。

这种算法通常会使用图像处理技术，如梯度信息投影统计、小波变换、车牌区域扫描连线算法等，以识别图像中的车牌区域。

2. 字符分割算法：在车牌定位后，需要将车牌中的字符进行分割。

这种算法通常会使用图像处理技术和机器学习算法，如基于深度学习的字符分割算法，以准确地将各个字符分割开来。

3. 字符识别算法：用于识别分割后的字符。

这种算法通常会使用机器学习算法，如卷积神经网络（CNN）或循环神经网络（RNN），以对字符进行分类和识别。

4. 神经网络识别算法：大规模神经网络识别算法是一种深度学习算法，它能够同时处理车牌定位和字符识别两个任务，具有更高的准确性和鲁棒性。

5. 启发式车牌定位算法：综合利用了图像处理技术和机器学习算法，以提高车牌定位的准确性。

这种算法通常会使用一些特征选择方法，如SVM、HOG等，以将车牌区域和非车牌区域进行区分。

6. 角度偏差和光照波动控制算法：在车牌定位和字符识别过程中，车辆的角度偏差和光照波动会影响算法的准确性。

这种算法通常会使用一些图像处理技术，如滤波、归一化等，以减小这些因素的影响。

这些算法在车牌识别过程中相互配合，以实现准确的车牌识别。

一种基于多级分类的西夏文字识别算法

Ｉ — ］厂西 — ｌ夏 — 文
Ｉ像ｌ图Ｉ字
１．．．．．．．．．．．．．．＿＿Ｊ．．．．．．．
图１西夏文字预处理过程
１１灰度滤波．
灰度滤波的目的是对输入噪音较多的西夏文字灰度图像进行滤波，去除图像中的叉连、断点及模糊不清的部分，得到一幅较清晰的西夏文字灰度图像．本文选用灰度空间中值滤波法，具体算法是将图像中所
字以及提取每个西夏文字的特征，很大程度上影响到西夏文字的识别效率．本文提出的基于多级分类的西夏文字识别算法是一种在保证一定的识别率的基础上，能够快速并且以较低的硬件代价，实现西夏文字的
特征提取与选择的方法．
１图像预处理
西夏文字的图像预处理是其识别过程中的第一步，它的好坏直接影响西夏文字识别的效果．当今的文
的记载很少．近年来对西夏学的研究在国内外引起了广泛的关注，西夏学作为－Ｉ新兴的学科，－＇－Ｊ其学科系统已经形成，学科理论也正在产生和发展，西夏学的研究已取得了不少成果．西夏文字¨ ，是我国古代少数民族文字之一，其笔划繁琐，但结构严谨、合理，字形优美，其结构形态与汉字相仿，现已挖掘整理出的
有像素点的３３＊邻域内灰度值的中值代替该像素的值得到中值滤波后的图像．
１２二值化－
将灰度滤波后的西夏文字图像二值化变为一幅二值的西夏文字图像．
设原始图像为ｆｘＹ，（）阈值ｔ１７则二值化后的图ｇｘ）为，＝２，像（，，）源自，ｇ）１【，ｏ）
第４期
门光福：一种基于多级分类的西夏文字识别算法
４５

ocr识别原理

ocr识别原理OCR是OpticalCharacterRecognition的缩写，中文叫做光学字符识别，是指利用光学传感器或者特殊的绘图设备以及软件去识别字符的文字识别技术。

它能够将各种形式的文字内容，如手写文字、打印文字、画图文字等，识别成魔表格式的文本文件或者转换成图形，有效地解决人类从图像中识别文字的繁难任务。

OCR识别技术是利用电脑及相应算法来解决各种文本识别难题的有效手段，它具有识别度高、准确性好、快速、不受外来干扰等特点。

在解决文字识别问题的主流技术中，OCR是一个最主要的。

只要有相关的软件，就可以自动识别各种形式的文字，从而可以大大提高工作效率，是解决文本识别难题的一种效能极其高的手段。

一、OCR识别原理1、字符识别的基本原理字符识别是一种非常难的计算机视觉问题，原理是以特定的特征工程方法来分析输入图像数据，提取有用的信息，构建分类器，然后对图像中的字符进行识别分类，最终获得文字识别结果。

一般情况下，字符识别主要分为四个步骤：文字获取、滤波、特征提取及字符分类。

（1）文字获取：文字获取步骤通常是使用扫描仪或摄像头将文字及其他文档内容转换为图像格式，以便进行计算机处理。

（2）滤波：滤波步骤是对得到的图像进行处理，减少干扰性背景，纠正像素缺失问题，模糊图像等，以便有效地提取字符信息。

（3）特征提取：特征提取步骤是将滤波结果的图像转换成建模所需的特征，通常是采用边缘检测技术，将字符转换为向量，然后对向量进行建模和训练。

（4）字符分类：字符分类步骤是指根据已提取到的特征，使用聚类分析或机器学习等算法进行字符分类，从而获得文字识别结果。

2、特征提取规则特征提取是指将文字图像转换为建模及分类所需的特征，是文字识别的关键原理。

特征提取一般使用三种方法：边缘检测、分形分析和特征提取规则。

（1）边缘检测：边缘检测是指利用梯度和图像变化率来检测图像边缘的方法，是图像处理中一种重要的概念。

图像边缘是指图像中能够有效分割内部和外部的部分，能够从抽象的图像中提取出有价值信息的重要区域，具有重要意义。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

字符进行缩放操作，最后得到预定大小的字符图像。
根据车牌号图片库中提取的４万多个字符样本，我们
统计出样本的平均宽高为：２０×１６像素，因此，我
们利用公式１将字符都归一化到２０×１６大小。
$ !ｘ′，ｙ′"＝
０，ｉｆ（Ｏｒｉ［ｘ，ｙ］＝＝０１，ｅｌｓｅ
［ｘ，ｙ］#Ｒｅｃｔ）（１）
识别率（％）Ｒｅｃｏｇｎｉｚｅｒａｔｅ
９８．５４９７．２０９８．４４９７．３８９５．６６９４．６８９７．５８９７．７２９２．６２９６．２７９６．２２９８．１３
字符Ｃｈａｒａｃｔｅｒ
ＣＤＥＦＧＨＩＪＫＬＭＮ
识别率（％）Ｒｅｃｏｇｎｉｚｅｒａｔｅ
始字符宽度，ＰｒｅＷｉｄｔｈ表示预定义字符宽度；
ｖＲａｔｉｏ与ｈＲａｔｉｏ分别表示竖直和水平放缩比例；ｘ
与ｙ表示在原始图像上的坐标，Ｘ′与Ｙ′表示归一
化图像上的坐标；表示原始图像在（ｘ，ｙ）处的像素
值，表示归一化图像下（ｘ′，ｙ′）处的像素值；Ｒｅｃｔ
第３７卷第４期２００６年８月文章编号１００５－９３６（９２００６）０４－０５７２－０５
东北农业大学学报ＪｏｕｒｎａｌｏｆＮｏｒｔｈｅａｓｔＡｇｒｉｃｕｌｔｕｒａｌＵｎｉｖｅｒｓｉｔｙ
３７（４）：５７２￣５７６Ａｕｇ．２００６
一种字符识别算法在自动识别系统中的应用
字符识别涉及两个方面，即特征提取和识别方法，二者是继承互补的关系。关于字符的特征提取，目前已有许多经典的算法被提出来。根据字符的图像类型不同，特征提取可以分为彩色特征提取、灰度特征提取和二值特征提取；根据字符特征提取的基础可以分为点阵式统计特征提取，骨架或者细化特征提取；根据字符特征提取的内容可以分为统计特征的提取，逻辑特征或者笔画特征提取等。
１．２．１．３网格特征
网络特征提取结果见图２。
图２网格特征提取Ｆｉｇ．２Ｇｒｉｄｆｅａｔｕｒｅｅｘｔｒａｃｔ
该组特征基于细化的二值特征。我们对字符进行分块，然后统计每一个块内前景象素的个数作为统计特征，组成ＰｒｅＷｉｄｔｈ／ＢＬＯＣＫＳＩＺＥＨ＊ＰｒｅＨｅｉｇｈｔ／ＢＬＯＣＫＳＩＺＥＶ维向量（其中，ＢＬＯＣＫＳＩＺＥＨ和ＢＬ－ＯＣＫＳＩＺＥＶ表示水平和竖直方向划分块的尺寸）。这种方法是对点阵结构的分区，也在一定程度上缩小了特征向量的维数。网格特征与特征线都反映了字符的局部特征。
取层次结构来获得系统的最佳性能。在车牌号图片库中测试其算法。实验表明，算法非常有效。
关键词：字符识别；细化；几何不变矩；网格特征；神经网络；分类器的融合
中图分类号：ＴＰ３
文献标识码：Ａ
车牌识别系统就是利用光学字符识别技术解决汽车牌照识别的典型系统，其开发与应用有利于交通的控制与管理，是智能交通系统（ＩＴＳ）中一个重要组成部分。车牌识别系统的软件部分主要由４部分组成，其中包括预处理、车牌定位、字符定位、字符识别。这４部分是顺序执行，而每个处理模块都为下一步处理作铺垫，其中字符识别模块是最后一步，也是衡量系统整体性能的一步。
表１各种特征识别结果Ｔａｂｌｅ１Ａｌｌｋｉｎｄｓｏｆｆｅａｔｕｒｅｒｅｃｏｇｎｉｔｉｏｎｒｅｓｕｌｔｓ
特征Ｆｅａｔｕｒｅｓ
点阵特征Ｌａｔｔｉｃｅｆｅａｔｕｒｅ特征线Ｌｉｎｅｆｅａｔｕｒｅ网格特征Ｇｒｉｄｆｅａｔｕｒｅ融合Ａｍａｌｇａｔｅｄ
识别结果Ｒｅｃｏｇｎｉｚｅｄｒｅｓｕｌｔ
徐为
（黑龙江大学计算机科学与技术学院，黑龙江哈尔滨１５００８０）
摘要：光学字符识别是模式识别领域中最经典也是得到最广泛应用的方向之一，而车牌识别系统是应用光
学字符识别技术的典型系统。文章基于车牌识别系统的开发，提出一种基于二值图像的字符识别算法。在该算法
中，提取字符的点阵特征、特征线和网格特征，分类器采用神经网络。为充分利用各组特征向量的互补作用，采
第４期
徐为：一种字符识别算法在自动识别系统中的应用
· ５７３ ·
的阈值对字符进行二值化。
经过以上的字符预处理，我们将二值字符图像
送入识别模块，完成字符识别任务。对于二值图像
我们作如下步骤：归一化，细化和识别。
１．１归一化和细化
本文把分割的二值图像进行线性缩放归一化，可
有利于特征提取和字符识别。归一化即对实际提取的
有８９０２个字符，其中有字母２９４４个，数字５７５２个，图象大小为１６×１６。我们用８１３６个字符作为训练集，７６６个字符用于测试。对于网格特征的提取，我们采取的分块大小为４×４，这样一个字符图像就可以得到１６个块。
正如识别算法一节描述的那样，点阵特征经过大量样本的训练具有较强的识别能力，表１和表２分别是基于点阵特征的整体车牌和单个字符的识别结果。
表示原始图像所在的矩形框，表示该像素点不在图像的矩形框内，则归一化后的象素点值为０。通过归一化处理，我们得到Ｐ根据形态学操作中的“ 中与丢 ”（ｈｉｔａｎｄｍａｓｓ）原理，对归一化的二值图像进行细化，得到字符的骨架。１．２识别算法
第４期
徐为：一种字符识别算法在自动识别系统中的应用
· ５７５ ·
果融合方法很多，有投票法，也有加权和最大方法等。我们采用加权和最大方法，其中各个分类结果的权值根据实验得到。
２实验
实验从两方面来验证算法性能：识别率（正确识别的字符个数与总共识别字符的个数比值）和平均运行时间（单个字符识别的平均时间）。用车牌图片数据库来检验我们的算法。在该数据库中，总共
提取字符的笔画特征，利用模板匹配进行分类，此法主要应用于混淆字符或者难以辨别的字符的识别。１．２．１特征提取１．２．１．１点阵特征
该组特征基于细化的二值图像。二值细化字符图像的点阵结构反映了一个字符的整体结构特征，如果细化效果很好并且待识别的字符字体变换不大，不经过任何处理的点阵特征向量能够作为特征用于识别。通常，分类器采用模板匹配，利用距离函数计算模板与当前字符之间的相似度，其中相似度最小的那个模板所代表的字符即为识别出的字符。这种方法简单易行，并且计算复杂度低，适合印刷体的实时识别。１．２．１．２特征线
以上特征是有互补关系的：点阵特征反映字符的整体特征；特征线和网格特征反映字符的局部特征。所以，有效的利用上述特征，充分发挥各个特征向量的作用，系统性能就会提高。１．２．１．４识别算法
利用ＢＰ神经网络来分类字符。ＢＰ神经网络包括３层：输入层，隐藏层和输出层。输入神经元的个数与特征向量的的尺寸有关，即点阵特征有
但如果细化效果不好，或者字符字体变化很大，这种方法就失效了。
其中１表示前景象素，０表示背景象素；
Ｈ＿ｌｉｎｅ１－Ｈ＿ｌｉｎｅ８表示统计的偶数行中所含的线段个数。同样，我们也统计竖直方向偶数行中线段个数。线段在一定程度上反映了字符在某一方向的笔画密度，而字符笔画是联贯的，所以我们只需要统计单数行的线段数就能表示一个字符。
收稿日期：２００５－０４－０８作者简介：徐为（１９７９－），山东人，学士，助教，主要从事计算机应用方面的教学与研究工作。
大的情况非常有效。另外，基于统计的特征，如特征点，特征线，网格特征以及几何不变矩像Ｚｅｒｎｉｋｅ矩等都在一定程度上表示字符，结合这些特征，实现特征之间的互补就能提高系统性能［５－６］。有时候，二值图像由于二值化过程中阈值选择不当，可能会造成字符笔画的粗细方向有偏差，即使偏差很小也会对统计特征造成很大影响。所以，人们经常把二值化的字符进行细化或者骨架提取操作，这样得到的单象素笔画字符就不会有笔画粗细方面的干扰，但是细化算法的好坏是影响最后统计特征提取是否准确的主要原因。其他特征还包括投影直方图特，几何不变矩，边缘框架曲线特征，仿射曲线估计特征以及傅立叶和余弦等变换特征［７－１２］。
偶数行特征线段提取见图１。
图１偶数行特征线段提取Ｆｉｇ．１Ｓｔｒｏｋｅｓｆｅａｔｕｒｅｉｎｅｖｅｎｌｉｎｅｓ
· ５７４ ·
东北农业大学学报
第３７卷
如图１所示，我们统计偶数行和列的线段数目，组成（ＰｒｅＷｉｄｔｈ＋ＰｒｅＨｅｉｇｈｔ）／２维特征向量。该组特征基于原始图像。这种方法的特点是将点阵结构进行重组，更有效的表达字符。
ｖＲａｔｉｏ＝ＯｒｉＨｅｉｇｈｔ／ＰｒｅＨｅｉｇｈｔ
ｈＲａｔｉｏ＝ＯｒｉＷｉｄｔｈ／ＰｒｅＷｉｄｔｈ
（２）
ｘ′＝ＯｒｉＷｉｄｔｈ／２＋（ｘ－ＰｒｅＷｉｄｔｈ／２）＊ｈＲａｔｉｏ
ｙ′＝ｙ＊ｖＲａｔｉｏ
其中，ＯｒｉＨｅｉｇｈｔ表示原始字符高度，
ＰｒｅＨｅｉｇｈｔ表示预定义字符高度，ＯｒｉＨｅｉｇｈｔ表示原
１算法
车牌识别系统中，车牌正确定位是字符识别的首要条件。通常的车牌定位算法有Ｓｏｂｅｌ边缘过滤法，模板匹配以及神经网络查找等方法。本系统采用Ｓｏｂｅｌ边缘过滤查找边缘密集的区域，一般来说在同一条件下拍摄的车牌区域大小都在一定范围内，这样我们选择与最佳车牌大小最近的区域作为车牌所在的区域。实验表明这种方法能够有效的找到车牌区域，车牌定位正确率能够达到９９％以上。在车牌正确定位基础上，我们对车牌所在的区域进行竖直投影，根据投影直方图，我们可以对字符进行分割。最后根据每个字符的灰度分布确定二值化