面向车牌照识别数据的预处理方法研究
利用图像处理技术进行车牌识别研究

利用图像处理技术进行车牌识别研究车牌识别技术是利用图像处理技术对车辆的车牌进行自动识别的一项重要研究。
随着交通工具的激增和城市交通拥堵的加剧,车牌识别技术在交通管理、车辆追踪、停车场管理等领域具有极高的应用价值和广泛的前景。
车牌识别技术的研究和发展主要包括以下几个方面:首先,图像采集与预处理是车牌识别技术的基础。
在图像采集方面,可以利用摄像机、监控摄像头等设备对车辆进行拍摄,获取车牌图像。
而在预处理方面,主要包括图像的灰度化、二值化、去噪和增强等处理过程。
通过这些处理,可以有效提高车牌图像的质量,为后续的识别提供更好的条件。
其次,特征提取是车牌识别技术的关键。
车牌图像中包含了大量的特征信息,包括字符的大小、形状、颜色等。
通过对车牌图像进行特征提取,可以将车牌图像转化为与车牌中字符信息有关的特征向量。
常用的特征提取方法包括垂直和水平投影、边缘检测、形态学操作等。
这些方法能够有效地提取出车牌图像中的特征信息,从而实现对车牌的快速而准确的识别。
此外,字符识别是车牌识别技术的核心环节。
在字符识别中,可以利用机器学习等模式识别方法,将车牌图像中的字符与预先训练好的字符模板进行比较,从而实现对车牌中字符的识别。
常用的字符识别算法包括基于模板的匹配算法、基于统计的方法、基于神经网络的方法等。
这些算法通过对字符进行特征提取和分类,能够实现对车牌中字符的准确识别。
最后,车牌的整体识别和车辆追踪是车牌识别技术的延伸应用。
在整体识别中,可以通过对车牌图像进行连通区域分析、边界检测等处理,将车牌与车辆进行区分,实现对车牌整体的识别。
而在车辆追踪中,可以通过对车牌的连续识别和匹配,实现对车辆在不同摄像头下的准确追踪,为交通监管和车辆管理提供更全面的支持。
综上所述,车牌识别技术是一项具有重要应用价值的图像处理技术。
通过对车牌图像的采集、预处理、特征提取和字符识别等步骤的研究,可以实现对车牌的准确识别和车辆的追踪。
车牌识别技术在交通管理、车辆追踪、停车场管理等领域具有广泛的应用前景,为城市交通的智能化发展提供了重要的技术支撑。
《2024年基于深度学习的车牌检测识别系统研究》范文

《基于深度学习的车牌检测识别系统研究》篇一一、引言随着人工智能和深度学习技术的快速发展,车牌检测识别系统在智能交通、安防监控、自动驾驶等领域得到了广泛应用。
本文旨在研究基于深度学习的车牌检测识别系统,通过分析其原理、方法及实现过程,探讨其在实际应用中的优势与挑战。
二、车牌检测识别系统的基本原理车牌检测识别系统主要涉及图像处理、计算机视觉和深度学习等技术。
系统首先通过摄像头等设备获取包含车牌的图像,然后利用图像处理技术对图像进行预处理,提取出车牌区域。
接着,通过深度学习算法对车牌进行识别,最终输出车牌号码、颜色等信息。
三、深度学习在车牌检测识别中的应用深度学习通过模拟人脑神经网络的工作方式,可以自动提取图像中的特征,提高车牌检测识别的准确率。
在车牌检测阶段,深度学习可以自动学习车牌的形状、颜色、纹理等特征,实现精准的车牌定位。
在车牌识别阶段,深度学习可以通过卷积神经网络(CNN)等模型对车牌号码进行识别,提高识别的准确性和速度。
四、车牌检测识别系统的实现方法车牌检测识别系统的实现主要包括以下几个步骤:1. 图像预处理:对获取的图像进行灰度化、二值化、去噪等处理,以便更好地提取车牌区域。
2. 车牌定位:利用深度学习算法对预处理后的图像进行车牌定位,提取出车牌区域。
3. 车牌识别:对提取出的车牌区域进行特征提取和分类识别,输出车牌号码、颜色等信息。
4. 系统优化:通过优化算法和模型,提高车牌检测识别的准确率和速度。
五、系统优势与挑战基于深度学习的车牌检测识别系统具有以下优势:1. 高准确性:深度学习可以自动提取图像中的特征,提高车牌检测识别的准确率。
2. 高速度:深度学习算法具有较高的计算速度,可以实时处理大量图像数据。
3. 适应性强:深度学习模型可以适应不同场景、不同类型的车牌,具有较好的泛化能力。
然而,该系统也面临一些挑战:1. 数据集问题:需要大量的标注数据来训练模型,数据集的质量和数量对模型的性能有较大影响。
车辆牌照字符识别方法的研究与实现

车辆牌照字符识别方法的研究与实现车辆牌照字符识别是计算机视觉领域的一个重要研究方向,它主要用来实现自动化的车辆识别和监控。
随着智能交通系统的发展,车辆牌照字符识别的需求也越来越大。
本文将介绍车辆牌照字符识别的研究方法和实现技术。
一、传统的车辆牌照字符识别方法传统的车辆牌照字符识别方法主要包括图像预处理、特征提取和字符识别三个步骤。
1.图像预处理:车辆牌照图像往往存在光照不均、噪声干扰等问题,因此需要对图像进行预处理。
常用的预处理方法包括灰度化、二值化、去噪等。
灰度化将彩色图像转为灰度图像,简化后续处理过程。
二值化将灰度图像转为黑白图像,便于字符的分割和识别。
去噪可以通过滤波器、形态学操作等方法来消除图像中的噪声干扰。
2.特征提取:特征提取是车辆牌照字符识别的核心步骤,它通过提取图像中的关键特征来进行字符的分类和识别。
常用的特征提取方法有模板匹配、统计特征、形态学特征等。
其中,模板匹配是将待识别字符与预先定义的模板进行匹配,找出最相似的字符。
统计特征是利用字符图像的几何形状、光亮度等信息进行描述,常见的统计特征有垂直投影、水平投影、方向梯度直方图等。
形态学特征则是通过形态学处理,提取字符的形状和结构信息。
3.字符识别:字符识别是将预处理后的图像输入分类器或模型进行识别的过程。
常用的字符识别方法有模板匹配、支持向量机(SVM)、卷积神经网络(CNN)等。
模板匹配是将待识别字符与多个字符模板进行匹配,计算出最相似的模板。
SVM是一种二分类模型,通过训练一系列样本数据来构建一个能够将字符分类的模型。
CNN是近年来较为热门的字符识别方法,它通过多层卷积和池化操作来提取图像特征,并通过全连接层进行分类。
二、基于深度学习的车辆牌照字符识别方法近年来,基于深度学习的车辆牌照字符识别方法取得了很大的突破,取代了传统方法的地位。
1.数据准备:基于深度学习的字符识别方法需要大量的标注数据进行训练,因此需要准备一批具有标注的车辆牌照图像。
基于图像处理的车牌号码识别技术研究

基于图像处理的车牌号码识别技术研究近年来,随着科技的发展和进步,图像处理技术在各个领域都有着广泛的应用。
其中,基于图像处理的车牌号码识别技术在交通管理、公安安防等方面起到了重要的作用。
本文将就基于图像处理的车牌号码识别技术展开研究和讨论。
一、车牌号码识别技术的意义与作用现如今,车辆数量快速增加,交通管理变得越来越重要。
而车牌号码作为唯一的车辆标识,可以方便交通管理部门进行车辆追踪和管理,提高交通管理的效率。
因此,开发一种快速、准确的车牌号码识别技术对于交通管理有着重要的意义。
基于图像处理的车牌号码识别技术主要从图像获取、图像预处理、车牌定位、字符分割和字符识别等几个方面组成。
下面将对这几个方面分别进行介绍。
二、图像获取与图像预处理车牌号码识别的第一步是获取车辆图像。
传统的方法是使用摄像机对车辆进行拍摄,然后将图像传输到计算机进行处理。
近年来,随着智能手机的普及,也可以使用手机进行车牌图像的获取。
不过,对于智能手机拍摄的车牌图像,会受到图像质量、光照条件等因素的影响。
在获取车牌图像后,还需要进行图像预处理。
图像预处理的目的是增强车牌图像的对比度,去除噪声、模糊等干扰,以方便后续的处理。
常用的图像预处理方法包括灰度化、二值化、滤波等。
三、车牌定位与字符分割车牌定位是车牌号码识别的关键步骤之一。
其目的是从整个图像中准确定位出车牌的区域。
常用的车牌定位方法包括基于颜色信息的车牌定位和基于边缘信息的车牌定位。
基于颜色信息的车牌定位方法通过车牌区域的颜色特征进行检测,而基于边缘信息的车牌定位方法则通过检测图像中的边缘来实现。
在车牌定位后,需要进行字符分割。
字符分割的目的是将车牌号码中的字符单独分离出来,便于后续的字符识别。
字符分割的难度在于车牌号码的字符数量和字符之间的粘连程度。
四、字符识别字符识别是车牌号码识别的最后一步,也是最为关键的步骤。
常见的字符识别方法有基于模板匹配、基于神经网络、基于支持向量机等。
车牌识别系统方法的研究和实现

车牌识别系统方法的研究和实现工程领域:软件工程研究生指导老师随着社会经济的不断发展和人们生活水平的普遍提高,交通变得越来越拥挤,智能交通系统已经成为交通管理的主要方向,而车牌识别系统是智能交通管理系统的核心内容,研究车牌自动识别技术具有重要的实用价值。
论文主要完成了车牌识别系统的方法研究和设计工作。
车牌识别过程主要包括:车牌预处理、车牌倾斜校正、数字字符分割和字符识别。
车牌预处理方法,首先通过中值滤波对图像进行平滑处理,再用寻求最佳阈值的方法对图像进行二值化的处理。
车牌倾斜校正方法,首先利用Hough 变换提取车牌边框的直线,并对结果进行统计平均求出车牌的倾斜角度,再采用仿射变换得到校正后的图像。
数字字符分割方法,首先利用先验知识去除边框和去除孤立单元面积,然后利用投影分割法对车牌图像进行分割,从而得到数字字符的精确位置。
字符识别方法,采用基于细化图像的Hausdorff距离模板匹配识别方法,识别之前首先进行图像的归一化和细化预处理,然后建立细化图像的标准模板库,用Hausdorff距离匹配,将车牌字符识别出来。
试验结果表明,论文所提出的多种预处理与识别技术有机结合的车牌识别方法能较准确地识别车牌,整个系统的识别能力和运行性能良好。
关键词:图像去噪,二值化,字符分割,模板匹配,字符识别License Plate Recognition Research andImplementationField: Software EngineeringGraduate Student:Han Rui Advisors:Ruan Shuhua Tang SanpingWith the social economic development and people's standard of living are general improving,traffic has become more and more congestion.Intelligent Transportation System(ITS) is the main way to solve the traffic congestion and blocking,LPR is an important field in the ITS,and it has great application value.On the basis of other people's research,this paper has researched and designed LPR, This paper has mainly the following four parts: image preprocessing,tilt correction, character segmentation and character recognition. Image preprocessing described the pretreatment work of the image, including smooth the image by making use of the template of median filter, and binarize the image by using the method of seeking the best threshold value. Image tilt correction uses Hough transform to extract license plate line, and the results are statistical average, and then calculate the tilt angle. Finally, the image can be corrected by affine transform.character segmentation gets rid of the plate lines and sound areas through calculating the area,and then uses traditional projection to find the exact location of the characters.character recognition uses template matching to identify which is according to Hamming distance.The experiments show that the method is effective and feasible,it can lacate the licence plate and recognize characters.Keywords:Image Denoising,Binarization,Character Segmentation,Template Matching, Character Recognition目录1绪论 (4)1.1课题背景及意义 (4)1.2车牌识别技术的国内外发展现状 (5)1.3车牌自动识别技术的使用范围 (5)1.4我国车牌识别技术的特殊性 (6)1.5车牌识别技术组成.............................................. 错误!未定义书签。
车牌识别中的图像预处理研究

车牌识别中的图像预处理研究【摘要】车牌图像预处理是提高车牌识别系统后续环节运算效率的重要步骤,尤其对车牌定位起着至关重要的作用。
分析现有的图像预处理方法的特点及作用,比较不同方法的处理效果。
有效的预处理方法,不仅能够提高图像对比度、消除噪声,还有助于去除多余的干扰、背景等信息,降低伪车牌区域出现的概率。
【关键词】图像预处理;车牌识别;对比度;识别率1.引言自1990 年美国智能交通学会提出智能交通系统(ITS)以来,智能交通系统得到了不断研究和发展。
伴随着我国汽车业和交通运输业的快速发展,车辆数目迅速增长,交通拥堵和交通事故已成为我国道路交通运输中的突出问题,发展智能交通系统是解决问题的有效办法。
车牌识别(LPR)作为智能交通系统的核心环节,是交通系统能否实现智能化、现代化的关键。
车牌识别主要是综合利用通信技术、电子信息、图像处理、模式识别、自动化或人工智能等技术,实现车牌的自动监控和识别。
2.车牌识别系统车牌识别系统主要由图像采集、图像预处理、车牌定位、车牌字符分割和车牌字符识别等步骤组成。
进行车牌识别首先需要获得高质量的车牌图像。
经图像采集得到的车辆图像,由于采集设备本身成像质量不同,以及所处环境复杂多变,会受到光照条件不均匀、天气(如晴天、雾天、傍晚、夜晚等)的影响,使得车辆图像可能会出现模糊、带有噪声的现象。
车辆牌照本身的褪色、污损、变形以及倾斜,成像设备与牌照的距离或拍摄角度不合适以及车速较快等因素,都会造成车辆图像质量下降。
因此,为了更好地进行车牌识别,在车牌定位前,很有必要对车辆图像进行预处理,以降低干扰或噪声的影响,同时亦能够减少后续计算量。
3.图像预处理3.1 图像灰度化车辆图像样本大多都是通过摄像机、数码相机等设备拍摄获取的,采集得到的车辆原始图像是真彩色RGB图像。
RGB图像中的每个像素值都是由R(红)、G(绿)、B(蓝)三个基色分量组成,存储每个像素的颜色都需要24比特。
关于车牌识别图像预处理技术的研究

关于车牌识别图像预处理技术的研究【摘要】随着交通事业的飞速发展,ITS系统在道路交通领域占有极其重要的位置。
通过智能化的车牌识别方式,可以对机动车进行自动进行记录、查验、监控、报警,在很多情况下可以有很好的适用性。
本文主要介绍了在图像预处理阶段利用图像灰度化以及一种图像灰度增强方法初步处理被捕捉图像,随后叙述了边缘检测的工作原理及意义,并对传统边缘检测算子进行了分析和介绍,并描述了各个算子在实际应用的优点和不足。
【关键词】车牌识别;图像处理;灰度拉伸;边缘检测1.引言在摄像机捕获图像的过程中,因受环境因素的影响,图片预处理通过必要的技术手段把被识别车牌图像进行标注,以提高车牌识别系统的性能。
相应的技术手段有车牌图像的灰度图转换、边缘检测、二值化处理、图像增强、形态学处理等技术[1-3]。
2.灰度化(Image grizzled processing)灰度化的基本方法是将彩色图片的各个颜色分量R、G、B分量取其最大值或平均值并代替之这样就消除了图像中每个像素点的颜色差异,仅仅通过亮度值大小来区别像素点。
对于现有主流的图像像素颜色划分有256个亮度级的灰度图像,其灰度值最高值为255就代表白色,灰度值最低值为0就代表黑色[2]。
使用函数H(x,y)描述像素点(x,y)的灰度值,R(x,y)表示像素点(x,y)的红色分量的色度值,G(x,y)表示像素点(x,y)的绿色分量的色度值,B(x,y)表示像素点(x,y)的蓝色分量色度值。
可用如下公式进行灰度转换。
3.灰度拉伸(Gray stretch)灰度拉伸主要是以图像中的像素点为着眼点对图像进行适当的变换从而达到对噪声的去除或者削弱的目的。
通过一系列的变换处理,从而使得图像能够被计算机更好地识别。
5.总结本文详细叙述了图像灰度化以及一种图像灰度增强方法初步处理被捕捉图像,随后叙述了边缘检测的工作原理及意义。
在本文中采用Canny算子对图像边缘进行纹理、轮廓、区域定位等特征的提取的同时对图像中的噪声进行抑制。
基于数字图像处理的车牌识别技术研究报告

基于数字图像处理的车牌识别技术研究报告随着计算机和视频技术的发展,车牌自动识别系统己成为智能交通系统的重要组成部分,并已广泛应用于车辆追查和跟踪、车辆出入控制、公路收费监控等领域。
完整的车牌自动识别系统由图像采集、图像处理、模糊识别等模块组成,其中对一幅已知车辆数字图像进行预处理、车牌定位、二值转换、车牌分类、车牌分割、字符识别、结果优化的过程简称车牌模糊识别。
目前国内已有众多单位开展了车牌识别技术研发,虽然各家都取得一定的成功,但车牌识别技术本身毕竟要符合实战要求,为此笔者综观各家实际车牌识别系统后提出了车牌识别系统的几点不足之处和改进方法,供该领域的专业人士和领导参考。
一、图像预处理根据三基色原理,世界上任何色彩都可以由红绿蓝(RGB)三色不同比例的混合来表示,如果红绿蓝(RGB)三个信号分别由一个字节表示,则该图像颜色位数就达到二十四位真彩,也就是说在二十四位真彩的数字图像中每个像素点由三个字节来表示,根据数字图像水平和垂直方向像素点数(即图像分辨率)可计算出一幅图像实际位图大小。
事实上,在车牌自动识别系统中车辆图像是通过图像采集卡将运动的车辆图像抓拍下来,并以位图的格式存放在系统内存中。
这时的车辆数字图像虽然没有被人为损伤过,但在实际道路上行驶的车辆常会因为各种各样的原因使得所拍摄的车辆图像效果不理想,如外界光线对车牌的不均匀反射、极强阳光形成的车牌处阴影、摄像机快门值设置过大而引起的车辆图像拖影、摄像头聚焦或后背焦没有调整到位而形成的车辆图像不清晰、由于视频传输线而引起的图像质量下降、所拍摄图像中存在的噪声干扰、所安装的车牌不规范或车辆行驶变形等等。
这些都给车牌的模糊识别增加了难度,在现有的技术条件下任何优秀、先进的车牌识别软件也是无法达到百分之百车牌正确识别率。
但我们可以对车辆图像根据不同应用特点进行识别前的预处理,尽最大可能提高车牌正确识别率,这些图像预处理包括图像平滑、倾斜校正、灰度修正等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘
要
为了实现对车牌照识别数据的有效利用,本文在分析车牌照识别数据特点和数据异常情况的基础上,结
文章引用: 黎文皓, 万红, 张钧浩, 尤晨星. 面向车牌照识别数据的预处理方法研究[J]. 交通技术, 2019, 8(2): 86-93. DOI: 10.12677/ojtt.2019.82011
黎文皓 等
Keywords
License Plate Recognition Data, Data Mining,法研究
黎文皓1,2,万
1 2
红2,张钧浩1,尤晨星1
桂林电子科技大学,建筑与交通工程学院,广西 桂林 北部湾大学,海运学院,广西 钦州
收稿日期:2019年1月31日;录用日期:2019年2月14日;发布日期:2019年2月21日
Open Journal of Transportation Technologies 交通技术, 2019, 8(2), 86-93 Published Online March 2019 in Hans. /journal/ojtt https:///10.12677/ojtt.2019.82011
st th st
Received: Jan. 31 , 2019; accepted: Feb. 14 , 2019; published: Feb. 21 , 2019
Abstract
In order to distinguish the effective use of license plate recognition data, this paper analyzes the characteristics of vehicle license plate recognition data and data anomaly, combining data preprocessing strategies in data mining technology to design a vehicle license plate recognition data. This preprocessing method includes four processes of data cleaning, data integration, data conversion, and data reduction. The effectiveness of the method is demonstrated by using the license plate recognition data of the detection bayonet in Guilin. The results show that the method can improve the utilization quality of license plate identification data effectively and reduce the impact of data anomaly on the model.
DOI: 10.12677/ojtt.2019.82011 88 交通技术
黎文皓 等
该方法可以有效地对车牌照识别数据进行汇总、计算、校验等操作,具体方法如下:
Table 1. Abnormal situation of license plate identification data 表 1. 车牌识别数据的异常情况
合数据挖掘技术中的数据预处理策略,设计了一种针对问题车牌照识别数据的预处理方法,该方法包括 数据清理、数据集成、数据转换、数据归约4个过程。利用桂林市检测卡口的车牌照识别数据对该方法的 有效性进行论证, 结果表明该方法可以有效提升车牌照识别数据利用质量, 降低数据异常对模型的影响。
关键词
车牌照识别数据,数据挖掘,预处理
2. 数据描述
车牌照识别数据通过 VLPR 系统采集,车牌识别是现代智能交通系统中的重要组成部分之一,应用 十分广泛。它以数字图像处理、模式识别、计算机视觉等技术为基础,对摄像机所拍摄的车辆图像或者 视频序列进行分析,得到每一辆汽车唯一的车牌号码,从而完成识别过程。VLPR 系统一般由车辆到达 触发模块、车牌捕获摄像头、识别系统处理器等部分组成[5]。数据获取过程可以描述如下:首先,当车 辆通过时,会触发系统开始工作,识别系统在接收到信号后给摄像头发送图像采集信号,摄像头在车辆 通过瞬间拍下带有车牌的车辆通过照片,接着识别系统终端会将此照片上传到系统处理器,在图片中将 车牌提取出来,对车牌中的详细字符进行分割识别,给出车牌具体的识别结果,车牌识别数据的过程如 下图 1 所示。VLPR 系统识别的数据构成除了车牌号码外,一般还应包括车牌号种类、车辆经过检测设 备的时间、车辆类型、车道编号、地点编号、地点描述、行驶方向等内容。
Open Access
1. 前言
车牌识别技术(Vehicle License Plate Recognition, VLPR)能够对检测路段通过的车辆自动识别并获取 车辆牌照信息进行处理[1]。城市路网和高速公路网每天都在获取数以百万计的车牌照信息,与其它交通 信息采集技术相比,车牌自动识别系统工作具有连续性强、数据精确度高、检测样本量大等优点。目前 车牌照识别数据已经广泛应用于监测报警、超速违章处罚、车辆出入管理等方面,具有十分重要的现实 意义和经济价值。 近年来国内外学者越来越多对车牌照识别数据进行深入挖掘,余丰茹等[2]通过车牌照识别数据,给 出了适应于不同设计速度的高速公路交通拥挤识别方法。刘泉[3]探讨了车牌照识别数据提取交通流参数 的基本方法,基于 J2EE 架构开发了交通流数据获取、处理和提取一体化数据共享平台。陈熙怡[4]在传 统 OD 估计的基础上,提出了一种基于车牌照数据获取路网 OD 的方法。但目前关于车牌照识别数据的 研究主要集中在车牌照数据的应用模型研究上,忽视了对车牌照数据预处理的研究。现有文献中鲜有涉 及车牌照数据异常的研究,作为模型的基础,数据质量直接影响最终的建模效果,因此车牌照数据的预 处理显得尤为重要,基于上述问题,本文针对车牌照识别数据海量性、多样性、实时性的特点,提出一 种面向车牌照识别数据的预处理方法,包含数据清理、数据集成、数据转换、数据归约 4 种策略。
主要异常情况 设备漏检 数据乱码 检测错误 数据逻辑关系混乱 样例 车辆经过时未被检测到 车牌号“&@! ” 车牌号“桂 A281F4”识别成“桂 A281P5” 车辆的时空关系不合理 数据错误 归类 数据缺失
Step 1:数据集成 通常情况下车牌照识别系统可能涉及数十个甚至上百个信息采集点,就一个采集点而言,在正常交 通状态下,平均每个车道每 3 秒通过一辆机动车,按 3 车道计算,每 1 秒钟便会产生两条记录。我们需 要采用数据库技术对所有采集点的多种数据类型进行汇总和信息计算处理,数据库可以通过 SQL 语言很 方便地对不符合规格的异常数据进行校验、清洗、补充,以最大限度地满足数据处理的基本需求。一条 车牌照识别数据包括:序号、日期、车牌号、车型、调查点编号、交叉口、流向、通过时间、备注等信 息,针对车牌照识别数据结构,本文设计的车牌照识别数据库由城区编码数据表、道路信息数据表、检 测点数据表、检测车辆数据表 4 个表组成。图 1 为本文设计的车牌照识别数据库的 E-R 关系图; Step 2:数据归约 车牌识别数据即所有车辆的检测记录集合,其包含多种属性,根据不同任务的需求,可以删除与任 务不相关的属性或合并相似属性,即对车牌识别数据进行维归约。例如,基于车牌照识别数据的车辆出 行轨迹挖掘算法中利用到的属性数据为车牌号、车牌号类型、检测时间、车辆类型、设备点位地址、设 备点位编号、行驶方向及车道编号 8 项属性,其他的属性数据可作为“冗杂”数据剔除掉。同时,由于 设备点位地址及设备点位编号均表征设备的空间信息,可进行合并,后期算法统一采用设备点位编号。 Step 3:数据清理 在车牌照识别数据采集过程中, 受到设备识别率、 信号传输干扰、 套牌车等的影响, 存在设备漏检、 数据乱码、检测错误、数据逻辑关系混乱等问题。针对数据乱码、检测错误 2 种数据异常情况,传统处 理方法会将车牌照识别数据舍去,但若问题车牌总量较多,舍弃问题车牌照识别数据将会对数据处理结 果的准确性造成很大的影响。为充分利用问题车牌照识别数据,可基于调查点之间相邻关系和车辆途经 调查点之间的时距关系,采用模糊匹配中的编辑距离算法来校核问题车牌。编辑距离是针对二个字符串 的差异程度的量化量测,如 sun 到 son 编辑距离为 1,而 foot 到 feet 的编辑距离即为 2,编辑距离越小, 相似度越高[7]。有如下计算公式:
3.2. 车牌照识别数据的预处理方法
在海量的原始车牌照识别数据中,由于调查点上的设备工作、人工操作、交通状况以及天气因素等 原因的影响,很难确保数据的获取质量,往往存在冗杂数据、重复数据、缺失数据及错误数据等,车牌 照识别数据主要异常情况如表 1 所示[6]。同时,在实际应用中,数据来自众多系统,具有多种形式和类 型,其总是杂乱无章、不完全的,原有数据特征有时不能足够地体现隐藏在其后的规律,将严重影响到 数据的实际应用。因此,有必要通过预处理来提高数据的“质量”。 根据车牌照识别数据自身特点来看,车牌照识别数据本身来源于不同位置的检测卡口设备,这样在 每个调查点都会形成几个车牌照数据文件,除次之外,每天采集到的车牌照识别数据都是数以万计的, 具有海量的数据规模,并且每条数据不仅是对车牌号的描述,同时包含车型、调查点、日期等信息具有 多个维度, 同时,由于检测设备的局限性, 识别到的数据不可避免的会存在数据错误、 数据漏检等问题。 针对车牌照识别数据的特点和存在的问题,我们设计了一种基于 mysql 数据库和 C#的数据预处理方法,
Research on Preprocessing Method for Vehicle License Plate Recognition Data
Wenhao Li1,2, Hong Wan2, Junhao Zhang1, Chenxing You1