图像识别技术的研究现状

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

图像识别技术研究现状综述

简介:

图像识别是指图形刺激作用于感觉器官,人们辨认出它是经验过的某一图形的过程,也叫图像再认。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。图像识别技术是以图像的主要特征为基础的,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。对于熟悉的图形,由于掌握了它的主要特征,就会把它当作一个单元来识别,而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫做组块,每一个组块是同时被感知的。图像在人类的感知中扮演着非常重要的角色,人类随时随处都要接触图像。随着数字图像技术的发展和实际应用的需要,出现了另一类问题,就是不要求其结果输出是一幅完整的图像,而是将经过图像处理后的图像,再经过分割和描述提取有效的特征,进而加以判决分类,这就是近20年来发展起来的一门新兴技术科学一图像识别。它以研究某些对象或过程的分类与描述为主要内容,以研制能够自动处理某些信息的机器视觉系统,代替传统的人工完成分类和辨识的任务为目的。

图像识别的发展大致经历了三个阶段:文字识别、图像处理和识别及物体识别:文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,并从印刷文字识别到手写文字识别,应用非常广泛,并且已经研制了许多专用设备。图像处理和识别的研究,是从1965年开始的。过去人们主要是对照相技术、光学技术的研究,而现在则是利用计算技术、通过计算机来完成。计算机图像处理不但可以消除图像的失真、噪声,同时还可以进行图像的增强与复原,然后进行图像的判读、解析与识别,如航空照片的解析、遥感图像的处理与识别等,其用途之广,不胜枚举。物体识别也就是对三维世界的认识,它是和机器人研究有着密切关系的一个领域,在图像处理上没有特殊的难点,但必须知道距离信息,并且必须将环境模型化。在自动化技术已从体力劳动向部分智力劳动自动化发展的今天,尽管机器人的研究非常盛行,还只限于视觉能够观察到的场景。进入80年代,随着计算机和信息科学的发展,计算机视觉、人工智能的研究已成为新的动向

图像识别与图像处理的关系:

在研究图像时,首先要对获得的图像信息进行预处理(前处理)以滤去干扰、噪声,作几何、彩色校正等,以提供一个满足要求的图像。图像处理包括图像编码,图像增强、图像压缩、图像复原、图像分割等。对于图像处理来说,输入是图像,输出(即经过处理后的结果)也是图像。图像处理主要用来解决两个问题:一是判断图像中有无需要的信息;二是确定这些信息是什么。图像识别是指对上述处理后的图像进行分类,确定类别名称,它可以在分割的基础上选择需要提取的特征,并对某些参数进行测量,再提取这些特征,然后根据测量结果做出分类。为了更好地识别图像,还要对整个图像做结构上的分析,对图像进行描述,以便对图像的主要信息做一个好的解释,并通过许多对象相互间的结构关系对图像加深理解,以便更好帮助和识别。故图像识别是在上述分割后的每个部分中,找出它的形状及纹理特征,以便对图像进行分类,并对整个图像做结构上的分析。因而对图像识别环节来说,输入是图像(经过上述处理后的图像),输出是类别和图像的结构分析,而结构分析的结果则

是对图像做描述,以获得对图像的重要信息的解释。下图是图像处理(图1)和图像识别(图2)的示意图:

图像获取技术的研究:

图像获取系统在整个图像处理系统中具有重要的作用。它负责将现实中的物体图像通过输入设备采集下来,将图像的模拟信号转换为数字信号,最终输入计算机,为计算机处理程序库提供准备处理的现场采集的实时数据,并在输出设备中显示出来。图像获取系统直接影响采集到的图像品质和后续的图像处理效果。目前,有很多传感技术已经运用到该领域中,如光学传感器、固态传感器、超声波传感器。光学传感器是用的最普遍的传感器,光学传感器采集的图像质量好、成本低,比较耐用;缺点是采集设备体积大,图像的质量容易受到影响。固态传感器体积小,耗电量低,但容易受到静电的影响,容易破坏,成本比光学传感器高。超声波传感器利用超声波扫描图像表面并获取反射信号,根据反射信号绘制指纹图像,采集的图像质量较好,但成本很高。目前,随着数码相机和CCD 技术的成熟和价格的下降,已经被广泛应用在图像获取方面。而基于DSP 的嵌入式高速数字图像获取技术,因其体积小、处理速度快、精度高,具有广泛的应用前景。

图像预处理的研究:

为了保证特征提取的准确性,必须对图像进行预处理来去除噪声干扰,做几何、彩色校正等改善图像,这样才能准确的进行后续的特征提取和匹配等操作。在采集技术相同的条件下,特征提取技术的好坏直接影响识别效果的好坏,而特征提取的好坏又直接受图像预处理好坏的影响,图像预处理可以减少低质量图像对识别效果的影响,所以研究图像的预处理技术是十分重要的。图像的预处理一般包括:图像分割、图像增强、图像压缩、图像复原、图像细化、二值化等。目前的图像处理一般指的是对于数字图像的处理。

(1)图像分割:图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴

趣目标的技术和过程,它是由图像处理到图像分析的关键步骤。现有的图像分割方法如下:

⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎩⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎨⎧⎪⎪⎪⎩⎪⎪⎪⎨⎧⎩⎨⎧⎪⎩⎪⎨⎧⎪⎪⎩⎪⎪⎨⎧⎪⎪⎪⎩⎪⎪⎪⎨⎧小波分析和变换遗传算法人工神经网络模糊理论数字形态学理论基于特定理论的分割模型)几何可变模型法(如模型)参数可变模型法(如基于可变模型的分割合并—分裂区域分裂区域生长基于区域的分割基于边界曲线拟合方法多分辨方法多尺度方法边缘检测基于边缘的分割均值化误差法最小误差法最大类空间方差法直方图变换法直方图法基于阈值的分割图像分割LevelSet Snake Canny

在这几种算法中前四种算法最为基础和成熟,阈值分割与边缘检测方法处理方法简单速度

快,比较适合处理较小图像,而对于较大的图像基于区域的方法较适合。对于后两种算法都属于前沿方法,还有待于实验检验。

(2)图像增强

图像增强就是通过选择适当的滤波算法对原始图像进行滤波处理,滤掉图像中不必要的高频部分,其主要目的是在尽量保持图像中纹线边缘完好的前提下,去掉图像中的粘连、断点及模糊的部分,以改善图像的质量,便于细化和特征提取。图像增强的方法主要有纹理滤波、傅里叶分析、小波分析等LinHong 等人提出了一种基于Gabor 滤波器的指纹增强方法,同时利用了Gabor 函数的方向和频率选择特性。但该方法存在块效应和方向效应,并且对不同频率的图像有不同的增强程度。李小白等研究了一种改进的Gabor 小波的指纹增强方法,通过分析Gabor 小波的原理,结合指纹图像的特点对Gabor 小波的参数进行选择,选择一个均衡的频率对图像进行Gabor 滤波,该方法在对指纹纹线方向提取算法进行研究的基础上,改进了纹线频率的提取方法,提取使Gabor 滤波器的频率方差平方和最小的频率作为过滤频率,消除了指纹图像增强过程中的出现的块效应。并且将Gabor 函数制成模板,用模板来拟合Gabor 函数,并将矩形模板变为两条相交的线段模板,运算量减少了很多。

(3)图像细化

对图像进行细化的主要目的是去掉不必要的纹线宽度信息,减少图像的数据量,使连接结构变得简单明了,便于从图像中提取细节特征,从而大大提高图像的处理速度和效掣。细化算法有很多种,按照细化顺序来看主要分为3类:串行细化、并行细化和混合细化。改进的OPTA 算法是目前使用频率很高的一种细化算法。改进的OPTA 算法是串行细化算法,这种算法能够保证脊线宽度为单像素,但是细化后会产生很多毛刺,并且对纹线上的孔洞效果较差,导致出现很多的伪特征点,影响了指纹识别的准确性。为了解决这些问题,《残缺指纹识别的算法研究》研究采用一种基于数学形态学的查表细化算法,实验证明,改进的OPTA 算法整体效果还可以,不过在三角点附近的细化不准确,粘连较多,与原图有较大差异;

(4)二值化

图像的二值化是指通过设定阈值把灰度图像变成只用两个值来表示图像的目标和背景的二值图像。算法的关键在阈值T 的选择,如果指纹图像的像素点的灰度值大于等于阈值T,则设为1;小于阈值T 的像素点设为0,如下面公式所示:

⎩⎨⎧<≥=T j i f T j i f j i f ),(,0),(,1),(

阈值主要分为两类:全局阈值和局部阈值。全局阈值是对整个指纹图像采用一个阈值来进行二值化,常用基于扶度直方图的阈值法;局部阈值是将图像分为若干个小块,对每个小块选择一个适合的阈值。由于全局阈值二极化不能处理复杂图像,为了提高二值化后图像的质量,就提出了局部阈值二极化,就是每一个或者每一块像素的阈值的确定是同周围像素有关而与其他位置的像素无关。此法处理图像的效果好,适用范围广,但是处理速度较低。目前比较简单、高效的局部阈值方法有以下几种:Yasuda 法,Niblack 法,J.M.White 法(非线性动态窗口阈值法)。

(5)图像压缩

在实际处理中,由于图像信息量非常大,在存储及传送时,需要对图像信息进行压缩。图像压缩已研究了几十年,提出了诸如DPCM 、DCT 、VQ 等压缩方法,并已出台了基于DCT 等技术的国际压缩标准,如JPEG 、MPEG 等。人们逐渐发现了这些方法的许多缺点:比如高压缩比时图像 出现严重的方块效应、人眼视觉系统的特性不易被引入到压缩算法中

相关文档
最新文档