图像识别技术的研究现状论文

图像识别技术的研究现状论文
图像识别技术的研究现状论文

图像识别技术研究现状综述

简介:

图像识别是指图形刺激作用于感觉器官,人们辨认出它是经验过的某一图形的过程,也叫图像再认。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。图像识别技术是以图像的主要特征为基础的,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。对于熟悉的图形,由于掌握了它的主要特征,就会把它当作一个单元来识别,而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫做组块,每一个组块是同时被感知的。图像在人类的感知中扮演着非常重要的角色,人类随时随处都要接触图像。随着数字图像技术的发展和实际应用的需要,出现了另一类问题,就是不要求其结果输出是一幅完整的图像,而是将经过图像处理后的图像,再经过分割和描述提取有效的特征,进而加以判决分类,这就是近20年来发展起来的一门新兴技术科学一图像识别。它以研究某些对象或过程的分类与描述为主要内容,以研制能够自动处理某些信息的机器视觉系统,代替传统的人工完成分类和辨识的任务为目的。

图像识别的发展大致经历了三个阶段:文字识别、图像处理和识别及物体识别:文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,并从印刷文字识别到手写文字识别,应用非常广泛,并且已经研制了许多专用设备。图像处理和识别的研究,是从1965年开始的。过去人们主要是对照相技术、光学技术的研究,而现在则是利用计算技术、通过计算机来完成。计算机图像处理不但可以消除图像的失真、噪声,同时还可以进行图像的增强与复原,然后进行图像的判读、解析与识别,如航空照片的解析、遥感图像的处理与识别等,其用途之广,不胜枚举。物体识别也就是对三维世界的认识,它是和机器人研究有着密切关系的一个领域,在图像处理上没有特殊的难点,但必须知道距离信息,并且必须将环境模型化。在自动化技术已从体力劳动向部分智力劳动自动化发展的今天,尽管机器人的研究非常盛行,还只限于视觉能够观察到的场景。进入80年代,随着计算机和信息科学的发展,计算机视觉、人工智能的研究已成为新的动向

图像识别与图像处理的关系:

在研究图像时,首先要对获得的图像信息进行预处理(前处理)以滤去干扰、噪声,作几何、彩色校正等,以提供一个满足要求的图像。图像处理包括图像编码,图像增强、图像压缩、图像复原、图像分割等。对于图像处理来说,输入是图像,输出(即经过处理后的结果)也是图像。图像处理主要用来解决两个问题:一是判断图像中有无需要的信息;二是确定这些信息是什么。图像识别是指对上述处理后的图像进行分类,确定类别名称,它可以在分割的基础上选择需要提取的特征,并对某些参数进行测量,再提取这些特征,然后根据测量结果做出分类。为了更好地识别图像,还要对整个图像做结构上的分析,对图像进行描述,以便对图像的主要信息做一个好的解释,并通过许多对象相互间的结构关系对图像加深理解,以便更好帮助和识别。故图像识别是在上述分割后的每个部分中,找出它的形状及纹理特征,以便对图像进行分类,并对整个图像做结构上的分析。因而对图像识别环节来说,输入是图像(经过上述处理后的图像),输出是类别和图像的结构分析,而结构分析的结果则

是对图像做描述,以获得对图像的重要信息的解释。下图是图像处理(图1)和图像识别(图2)的示意图:

图像处理

图像输入图像输出

编码、增强,压

缩,复原,分割

图1:图像处理示意图

图像识别

图像输入类别+结构分析

特征抽取、分类、

分析

图2:图像识别示意图

图像识别系统:

图像识别,简单地说,就是要把一种研究对象,根据其某些特征进行识别并分类。

可以认为,对数字图像进行区别分类其实质就是对图像进行模式识别。这种识别早已存在人

们的生活实践中。然而,随着实践活动的扩大、深入和社会化的需要,人们不仅需要识别分

类数很多的事物,而且被识别的对象内容也越来越复杂。特别是由于科学技术水平的提高,使得各种不同的研究对象“图像化”或“数字化”,可采用某种技术把考察的对象转换成图片、波形图以及若干数据,这些数据就可以代表所研究的对象。但是对于模式识别来说,无论是

数据、信号还是平面图像或立体景物都是除掉它们的物理内容而找出它们的共性,把具有同

一共性的归为一类,而具有另一种共性者归为另一类。图像模式识别的目的就是研制采用某

种仪器或设备,自动处理某些信息,代替人完成分类和辨识的任务,并且能够快速而准确地

进行图形识别。一般来说,一个图像识别系统由以下几个部分组成,其框图如图3所示。

原始图像预处理特征提取模式分类识别结果

图3:图像识别系统框图

第一部分是图像信息的获取。它相当于对被研究对象的调查和了解,从中得到数据和材料,对图像识别来说就是把图片、底片和文字图形等用光电扫描设备转换为电信号以备后续处理。

第二部分是图像的预处理。这个处理过程的工作包括采用数字图像处理的各种方法来消除

原始图像的噪声和畸变,消减无关特征而加强图像的系统感兴趣的特征,如果图像包含多个

目标的,还要对图像进行分割,将其分为多个每个只包含一个目标的区域。

第三部分特征提取。通常能描述对象的元素很多,为了节约资源,节省计算机存储空间、机时、特征提取费用,在满足分类识别正确率要求的条件下,按某种准则尽量选用对正确分

类识别作用大得特征,使得用较少的特征就能完成分类识别任务。这项工作的表现为减少特

征矢量的维数、符号、串字符数或简化图的结构。

第四部分是判决或分类。即依据所提取的特征,将前一部分的特征向量空间映射到类型空间,把相应原图归属已知的一类模式,相当于人们从感性认识升到理性认识而做出结论的过程。第四部分与特征提取的方式密切相关,它的复杂程度也依赖于特征提取的方式,例如,类似度、相关性、最小距离等等。其中前三部分是属于图像处理范畴,第四部分为模式识别

范畴。我们也把预处理和特征提取部分称为低级处理,而判决和分类部分称为高级处理。其中,每一阶段都会对识别结果产生严重影响,所以每一阶段都应争取尽可能完美的结果。

图像获取技术的研究:

图像获取系统在整个图像处理系统中具有重要的作用。它负责将现实中的物体图像通过输入设备采集下来,将图像的模拟信号转换为数字信号,最终输入计算机,为计算机处理程序库提供准备处理的现场采集的实时数据,并在输出设备中显示出来。图像获取系统直接影响采集到的图像品质和后续的图像处理效果。目前,有很多传感技术已经运用到该领域中,如光学传感器、固态传感器、超声波传感器。光学传感器是用的最普遍的传感器,光学传感器采集的图像质量好、成本低,比较耐用;缺点是采集设备体积大,图像的质量容易受到影响。固态传感器体积小,耗电量低,但容易受到静电的影响,容易破坏,成本比光学传感器高。超声波传感器利用超声波扫描图像表面并获取反射信号,根据反射信号绘制指纹图像,采集的图像质量较好,但成本很高。目前,随着数码相机和CCD 技术的成熟和价格的下降,已经被广泛应用在图像获取方面。而基于DSP 的嵌入式高速数字图像获取技术,因其体积小、处理速度快、精度高,具有广泛的应用前景。

图像预处理的研究:

为了保证特征提取的准确性,必须对图像进行预处理来去除噪声干扰,做几何、彩色校正等改善图像,这样才能准确的进行后续的特征提取和匹配等操作。在采集技术相同的条件下,特征提取技术的好坏直接影响识别效果的好坏,而特征提取的好坏又直接受图像预处理好坏的影响,图像预处理可以减少低质量图像对识别效果的影响,所以研究图像的预处理技术是十分重要的。图像的预处理一般包括:图像分割、图像增强、图像压缩、图像复原、图像细化、二值化等。目前的图像处理一般指的是对于数字图像的处理。

(1)图像分割:图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴

趣目标的技术和过程,它是由图像处理到图像分析的关键步骤。现有的图像分割方法如下:

????????????????????????????????????????????????????????????????小波分析和变换遗传算法人工神经网络模糊理论数字形态学理论基于特定理论的分割模型)几何可变模型法(如模型)参数可变模型法(如基于可变模型的分割合并—分裂区域分裂区域生长基于区域的分割基于边界曲线拟合方法多分辨方法多尺度方法边缘检测基于边缘的分割均值化误差法最小误差法最大类空间方差法直方图变换法直方图法基于阈值的分割图像分割LevelSet Snake Canny

在这几种算法中前四种算法最为基础和成熟,阈值分割与边缘检测方法处理方法简单速度

快,比较适合处理较小图像,而对于较大的图像基于区域的方法较适合。对于后两种算法都属于前沿方法,还有待于实验检验。

(2)图像增强

图像增强就是通过选择适当的滤波算法对原始图像进行滤波处理,滤掉图像中不必要的高频部分,其主要目的是在尽量保持图像中纹线边缘完好的前提下,去掉图像中的粘连、断点及模糊的部分,以改善图像的质量,便于细化和特征提取。图像增强的方法主要有纹理滤波、傅里叶分析、小波分析等LinHong 等人提出了一种基于Gabor 滤波器的指纹增强方法,同时利用了Gabor 函数的方向和频率选择特性。但该方法存在块效应和方向效应,并且对不同频率的图像有不同的增强程度。李小白等研究了一种改进的Gabor 小波的指纹增强方法,通过分析Gabor 小波的原理,结合指纹图像的特点对Gabor 小波的参数进行选择,选择一个均衡的频率对图像进行Gabor 滤波,该方法在对指纹纹线方向提取算法进行研究的基础上,改进了纹线频率的提取方法,提取使Gabor 滤波器的频率方差平方和最小的频率作为过滤频率,消除了指纹图像增强过程中的出现的块效应。并且将Gabor 函数制成模板,用模板来拟合Gabor 函数,并将矩形模板变为两条相交的线段模板,运算量减少了很多。

(3)图像细化

对图像进行细化的主要目的是去掉不必要的纹线宽度信息,减少图像的数据量,使连接结构变得简单明了,便于从图像中提取细节特征,从而大大提高图像的处理速度和效掣。细化算法有很多种,按照细化顺序来看主要分为3类:串行细化、并行细化和混合细化。改进的OPTA 算法是目前使用频率很高的一种细化算法。改进的OPTA 算法是串行细化算法,这种算法能够保证脊线宽度为单像素,但是细化后会产生很多毛刺,并且对纹线上的孔洞效果较差,导致出现很多的伪特征点,影响了指纹识别的准确性。为了解决这些问题,《残缺指纹识别的算法研究》研究采用一种基于数学形态学的查表细化算法,实验证明,改进的OPTA 算法整体效果还可以,不过在三角点附近的细化不准确,粘连较多,与原图有较大差异;

(4)二值化

图像的二值化是指通过设定阈值把灰度图像变成只用两个值来表示图像的目标和背景的二值图像。算法的关键在阈值T 的选择,如果指纹图像的像素点的灰度值大于等于阈值T,则设为1;小于阈值T 的像素点设为0,如下面公式所示:

???<≥=T j i f T j i f j i f ),(,0),(,1),(

阈值主要分为两类:全局阈值和局部阈值。全局阈值是对整个指纹图像采用一个阈值来进行二值化,常用基于扶度直方图的阈值法;局部阈值是将图像分为若干个小块,对每个小块选择一个适合的阈值。由于全局阈值二极化不能处理复杂图像,为了提高二值化后图像的质量,就提出了局部阈值二极化,就是每一个或者每一块像素的阈值的确定是同周围像素有关而与其他位置的像素无关。此法处理图像的效果好,适用范围广,但是处理速度较低。目前比较简单、高效的局部阈值方法有以下几种:Yasuda 法,Niblack 法,J.M.White 法(非线性动态窗口阈值法)。

(5)图像压缩

在实际处理中,由于图像信息量非常大,在存储及传送时,需要对图像信息进行压缩。图像压缩已研究了几十年,提出了诸如DPCM 、DCT 、VQ 等压缩方法,并已出台了基于DCT 等技术的国际压缩标准,如JPEG 、MPEG 等。人们逐渐发现了这些方法的许多缺点:比如高压缩比时图像 出现严重的方块效应、人眼视觉系统的特性不易被引入到压缩算法中

等等。目前,许多人正在致力于第二代图像编码技术的研究。第二代图像编码技术是指不局限于SHANN0N信息论的框架,要求充分利用人的视觉生理心理特性和图像信源的各种特性,能获得高压缩比的一类编码技术。这其中以小波变换编码、分形编码和模型基编码最具有代表性,也很有可能成为新一代国际图像压缩标准的核心理论。

(6)图像复原

在获取数字图像过程中经常发生图像质量下降或者退化,为了给观察者以清晰的图像,还要对图像进行改善,即进行复原处理,它是把已经退化了的图像加以重建或者恢复的过程,以便改进图像的保真度。比较古老的数字图像处理技术有逆滤波图像复原和维纳滤波图像复原。退化图像中小噪声的干扰会对逆滤波恢复的图像产生很大的影响,直接求逆法一般用于信噪比较高的图像。维纳滤波图像复原数学表达式简单,但当图像的信噪比较低时,处理结果不能令人满意。小波分析是近年来发展起来的一种新的时频分方法,在图像处理中有非常重要的作用,Mallat和Meyer对小波分析做了相应的究和搜索,提出了多分辨分析的理论框架,人利用小波变换具有对信号自适应的特点将小波分析用于图像复原,能够及时地反馈图像特征值来指导复原操作,研究表明基于小波的图像复原算法具有良好的复原性能,在时域和频域具有很好的局部化性质。支持向量机是由Vapnik 首先提出的,Peng D Q,Tian JW.Im提出了一种基于局部自适应最小方差支持向量机的图像复原方法,该方法最大的优点就是在小样本情况下依然可以保持很好的推广泛化能力。近些年来基于人工神经网络的图像处理复原技术引起了广泛的关注,目前Hopfield神经网络是复原技术中常用的神经网络,该方法复原精度也比其他方法要高,Wu等人最先提出一种基于神经网络的复原算法,该方法克服其他方法复原后丢失图像信息的缺点能够保护图像边缘,基于模式识别的神经网络复原算法是由Wang等人提出的,该算法能够实现快速稳定的收敛,其并行处理特性改善了算法的实时性。Bao等人用多层感知模型神经网络进行图像复原,该方法具有较好的噪声抑制效果适用于具有高对比度的图像复原,虽然人工神经网络已经广泛应用于数字图像处理复原技术,但是由于本身的复杂性,人工神经网络的规模会很大,结构也很复杂还远未达到理想的程度。虽然近年来图像复原的研究成果越来越多,但由于图像复原本身所具有的难度,使研究仍然存在一些问题,现有的退化模型大都基于线性而实际情况并非如此,伴随着数字图像处理的应用领域不断扩大,实时处理技术已成研究的热点。实时性是很多算法应用的前提,在实时图像处理系统中算法运行时间也成为今后研究的方向和目标。

特征抽取的研究:

特征抽取是图像识别的基本问题,其任务是从大量原始数据中找出最能代表该模式的少量特征,以便于进行分类和识别。特征抽取的本质是降维,同时尽量不丢失模式的分类信息。(1)主成分分析(PCA)

PCA是线性维数约简方法最为重要的技术之一,广泛地应用在人脸等模式识别领域,PCA的意义是在重构时其平方误差最小。TurkM和Pentland A所提出的Eigenfaces方法是采用PCA进行人脸识别最著名的方法。Yang等针对Eigenfaces方法的弱点提出了一种图像投影主分量分析方法,实验证明其特征抽取的速度比传统的主分量分析提高了十几倍。基于PCA,陈伏兵等提出了分块PCA的图像识别,该方法特点是能有效地抽取图像的局部特征。在Yale和NUST603人脸库上的试验结果表明,所提出的方法在识别性能上明显优于经典的PCA方法,识别率可以分别提高6.7和4个百分点。

(2)线性鉴别分析(LDA)

线性鉴别分析(LDA)的基本思想是选择使得Fisher准则函数达到极值的向量作为最佳投影方向,从而使得样本投影到该方向上后,类间离散度最大,而类内离散度最小。在此基础上,Wilksl和Duda分别提出了鉴别矢量集的概念,即寻找一组鉴别矢量构成子空间,以

原始样本在该子空间内的投影矢量作为鉴别特征用于识别。该方法被称为经典的Fisher线性鉴别分析方法(FDA)。除了经典的Fisher线性鉴别分析方法外,Sammon提出了基于Fisher鉴别准则的最佳鉴别平面的概念,Foley和Sammon进一步提出了采用一组满足正交条件的最佳鉴别矢量集进行特征抽取的方法。Z.Jin和J.Y.Yang等从统计不相关的角度,提出了具有统计不相关性的最优鉴别矢量集的概念,与Foley-Sammon鉴别矢量集不同的是,具有统计不相关性的最优鉴别矢量集是满足共轭正交条件的。Jin和Yang的方法被称为不相关的鉴别分析或Jin-Yang线性鉴别法。在线性鉴别分析中,由于Fisher准则的内在缺陷,使得在处理人脸识别等高维小样本模式识别问题的时候,面临着类内散布矩阵奇异的问题,不少解决该类问题的方法相继提出,主要可分为以下两类:一是基于变换的方法:Fisherfaces方法、最具有鉴别能力的特征抽取方法、增强Fisher线性鉴别模型法。另一种是基于算法的(algorithmbased)方法:扰动法、正交补空间法、广义的Fisher鉴别准则函数、直接的线性鉴别分析方法。

(3)基于散度差的无监督鉴别特征抽取

由于PCA和LDA都是基于样本整体特征的算法,忽略了样本的局部特征。无监督的鉴别投影(UDP)技术,用于对高维数据进行维数缩减,它同时考虑到样本的局部特征和非局部特征,但是在人脸等高维图像识别的应用中,不可避免地会出现小样本问题。大散度差准则是对Fisher准则的改进,消除了小样本问题,但是该方法是基于整体特征的图像识别方法,没有考虑到样本的局部特性。曹丽,陈才扣等提出一种基于散度差的无监督鉴别特征抽取,避免了局部协方差奇异所产生的问题。该方法通过修正Fisher鉴别准则,将Fisher鉴别准则中的散度比换为散度差,就物理意义而言没有发生任何改变,但是从理论上消除了Fisher 鉴别准则中存在的因类内散布矩阵奇异而无法求解最优投影轴的问题;同时将对一个庞大的类内散布矩阵求逆的过程变为求散差,使算法简单易行,速度也有一定提高。

(4)基于图像矩阵的主分量分析方法

PCA、LDA和Fisherfaces等一维方法在处理图像识别时存在固有的弊病,其弱点也很明显,以人脸识别为例,人脸图像转换成向量后维数常常高达上万维,这会给随后的计算造成很大困难。虽然样本数较少时可以用奇异值分解(SVD)理论,将计算矩阵R的本征值本征向量问题转换为求解矩阵R的问题减少计算量,但实际中训练样本数可能同样很大,利用SVD理论也无法减少计算量。对图像识别来说,近年来新出现的二维方法更直观,计算量更小,特征抽取的速度和效率更高。针对一维方法所遇到的问题,杨静宇带领的研究人员进行了卓有成效的工作。刘克等人提出了基于图像矩阵投影的二维方法,其基本思想是利用数字图像矩阵直接构造图像散布矩阵,并在此基础上进行鉴别分析。杨健等人提出了二维主分量分析,并用此方法进行图像重构,取得了很好的效果。二维线性鉴别分析(2DLDA)是LDA 在矩阵模式下的平行推广,它相当于按行分块的PCA。二维投影抽取出的特征是矩阵,特征之间的冗余度仍然很大,但具有一个很大的优点:特征抽取的速度提高了近26倍。(5)非线性特征抽取法

Fisher准则在实际使用中经常会遇到小样本问题,即类内散布矩阵通常为奇异矩阵,目前研究人员已经提出了很多特征抽取方法来解决这种奇异性问题.但是,无论对Fisher线性鉴别分析方法(FDA)怎么改进,其始终是基于线性变换的特征抽取方法,最终抽取得到的是线性特征.现实中许多问题都是非线性可分的,如人脸识别问题中,所以经典的FDA 在处理类似人脸等图像识别任务时不能取得令人满意的结果.支持向量机在模式识别领域得就是使用了核技术,其基本思想是通过适当的非线性映射Ф将非线性可分的原始样本输入空间变换到某一线性可分的高维特征空间H,而这种非线性映射Ф是通过定义适当的内积函数实现的,该技术提供了一种抽取样本非线性特征的有效方法,即核特征抽取法。目前,基于图像矩阵的核主分量分析法(KPCA)已经作为一种新的特征抽取方法广泛应用于图像识别技

术中。实验结果表明,KPCA不仅能够抽取非线性特征,而且具有更优的识别结果.

(5)基于特征加权的Gabor特征抽取算法

《Gabor滤波器在车辆检测和车型识别中的应用研究》提出了基于特征加权的Gabor特征抽取算法,该算法对Gabor特征矢量根据其邻近分量的离教程度进行加权处理,有效增强离散程度相对较小的特征分量在分类中的作用,同时充分利用样本图像的统计信息,具有较强的鲁棒性和类别表征能力。实验数据表明,与传统方法相比,这种特征抽取算法能够有效降低图像识别的错误率,增强鲁棒性,适于对质量较差的图像进行识别。

判决与分类方法的研究:

线性判决分析方法是一种有效的分类方法,它提取的特征描述使各类之间差异散布尽量大、每一类之内的差异散布尽量的小。但是传统的线性判决方法为了达到较好的泛化能力需要较多的训练样本;而且线性判决方法没有运用到特征量中的非线性部分进行分类和识别,因此应该引入非线性的方法对该问题进行分析处理。

核方法是当前模式识别领域中一个新的方向,它通过非线性变换将样本从输入空间映射到一个高维特征空间,能够不需要知道这个非线性变换的具体表达式,利用核函数技巧,各分量之间仅通过内积运算得到数据映射到高维空间的特征。在高维特征空间,线性不可分的数据通过升维,得到高维线性可分的数据,这样就可以在高维特征空间使用各种线性分析方法提取数据特征、进行降维优化处理。Vapnik提出了通过控制学习机器的容量实现其泛化能力的控制的统计学习理论,并基于此提出了支持向量机,随着核技巧在支持向量机方法中的成功运用,涌现出很多基于核的子空间方法,广泛应用于非线性模式分类问题,其中最具代表性有:核主成分分析、核线性判别分析,广义判别分析以及核直接线性判别分析。理论和实验均表明基于核的LDA方法对于人脸识别等非线性分类问题的有效性.然而,基于核的LDA方法的性能对核函数及其参数的选择甚为敏感.现有的核选择方法主要是预先指定核函数的类型,然后使用交差验证或梯度下降法进行核参数选择,计算颇为耗时,而且仍然不能保证选出最优的核函数或核参数;此外,单个固定核只能表现出输入数据某一方面的几何结构,对于涉及到多重、异质数据源的应用就未必适合。近来,基于支持向量机的应用与开发显示,在某些应用中使用多重核可以提高分类性能,由此产生了所谓的多重核学习(MKL)方法,《核方法的若干关键问题研究及其在人脸图像分析中的应用》一文提出了多重核线性判别分析(MKDA)方法,首先针对基于核的LDA给出了一种多重核的构造方法,继而通过使用拉格朗日乘子法优化最大边缘准则,在基于核的LDA的框架下导出了MKDA权值优化的迭代算法.在实验部分,一方面,优化权值后的MKDA在几个UCI标准数据集上显示了高于单个核KDDA的鉴别性能;另一方面,将MKDA的权值优化算法用于核选择,为图像识别有效地选取出了鉴别能力最强的核。

前景展望

图像识别是立体视觉、运动分析、数据融合等实用技术的基础,已经广泛应用在各个领域,如:遥感图像识别领域、通讯领域、军事、公安刑侦领域、生物医学图像识别领域、机器视觉领域等。可以预期,在不久的将来,图像技术将经历一个飞跃发展的成熟阶段,为深入人民生活创造新的文化环境,成为提高生产的自动化、智能化水平的基础科学之一。图像技术的基础性研究,特别是结合人工智能与视觉处理的新算法,从更高水平提取图像信息的丰富内涵,成为人类运算量最大、直观性最强,与现实世界直接联系的视觉和“形象思维”这一智能的模拟和复现,是一个很难而重要的任务。“图像识别技术”这一上世纪后期诞生的高科技之花,其前途是不可限量的。

参考文献:

李月景图像识别技术及其应用1985 9~11 ,20~21 6~8

王积分计算机图像识别1986年06月第1版2~3

屠珺,苗玉彬移动机器人目标图像识别技术研究农机化研究2011,33(5)

韩浩,董砚秋,张娟基于湖面清扫机器人的图像识别技术研究科技资讯2006(33)Vytautas Perlibakas Distance measures for PCA-based face recognition[外文期刊] 2004(02)

Rajkiran Gottumukkal;Vijayan K Asari An improved face recognition technique based on modular PCAapproach[外文期刊] 2004(04)

张生亮,杨静宇;2DPCA及2DLDA相关研究综述;世界科技研究与发展;2008,30(3)赵英男;Gabor滤波器在车辆检测和车型识别中的应用研究南京理工大学博士学位论文,20041201

高秀梅,杨静宇,袁小华,杨健;广义主分量分析及人脸识别;计算机工程与应用;2003,39(11)

李小白,残缺指纹识别的算法研究;大连理工大学硕士学位论文;20091201

陈伏兵,陈秀宏,王文胜,杨静宇,人脸识别中PCA方法的推广计算机工程与应用2005,41(34)

曹丽,陈才扣,最大散度差无监督鉴别特征抽取与人脸识别,计算机应用,2008,28(z2)林宇生,郑宇杰,杨静宇;一种改进的核特征抽取方法及其在人脸识别中的应用;计算机辅助设计与图形学学报;2008,20(1)

宋寅卯,蔡开穗,刘磊图像复原研究方法及进展,应用技术,1674-9146(2011)10-0086-03 刘笑嶂,核方法的若干关键问题研究及其在人脸图像分析中的应用,中山大学博士学位论文20100530

刘靖,基于视觉特征提取和核判决分析方法的人脸识别,四川大学博士学位论文,20060425 江洁,CCD尺寸在线检测系统的图像获取系统设计,机械制造与自动化,2010,39(4)

黄涛,胡以华,赵钢,赵楠翔,瞿福琪,吴永华,基于激光成像雷达距离图像的目标提取与分类技术红外与毫米波学报2011,30(2)

栾璟明,基于DSP的高速数字图像获取技术研究,西安工业大学硕士学位论文,20080516 王莉利,基于神经网络的图像识别技术的研究,大庆石油学院硕士学位论文,20070312

图像识别技术的研究现状论文

图像识别技术研究现状综述 简介: 图像识别是指图形刺激作用于感觉器官,人们辨认出它是经验过的某一图形的过程,也叫图像再认。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。图像识别技术是以图像的主要特征为基础的,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。对于熟悉的图形,由于掌握了它的主要特征,就会把它当作一个单元来识别,而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫做组块,每一个组块是同时被感知的。图像在人类的感知中扮演着非常重要的角色,人类随时随处都要接触图像。随着数字图像技术的发展和实际应用的需要,出现了另一类问题,就是不要求其结果输出是一幅完整的图像,而是将经过图像处理后的图像,再经过分割和描述提取有效的特征,进而加以判决分类,这就是近20年来发展起来的一门新兴技术科学一图像识别。它以研究某些对象或过程的分类与描述为主要内容,以研制能够自动处理某些信息的机器视觉系统,代替传统的人工完成分类和辨识的任务为目的。 图像识别的发展大致经历了三个阶段:文字识别、图像处理和识别及物体识别:文字识别的研究是从1950年开始的,一般是识别字母、数字和符号,并从印刷文字识别到手写文字识别,应用非常广泛,并且已经研制了许多专用设备。图像处理和识别的研究,是从1965年开始的。过去人们主要是对照相技术、光学技术的研究,而现在则是利用计算技术、通过计算机来完成。计算机图像处理不但可以消除图像的失真、噪声,同时还可以进行图像的增强与复原,然后进行图像的判读、解析与识别,如航空照片的解析、遥感图像的处理与识别等,其用途之广,不胜枚举。物体识别也就是对三维世界的认识,它是和机器人研究有着密切关系的一个领域,在图像处理上没有特殊的难点,但必须知道距离信息,并且必须将环境模型化。在自动化技术已从体力劳动向部分智力劳动自动化发展的今天,尽管机器人的研究非常盛行,还只限于视觉能够观察到的场景。进入80年代,随着计算机和信息科学的发展,计算机视觉、人工智能的研究已成为新的动向 图像识别与图像处理的关系: 在研究图像时,首先要对获得的图像信息进行预处理(前处理)以滤去干扰、噪声,作几何、彩色校正等,以提供一个满足要求的图像。图像处理包括图像编码,图像增强、图像压缩、图像复原、图像分割等。对于图像处理来说,输入是图像,输出(即经过处理后的结果)也是图像。图像处理主要用来解决两个问题:一是判断图像中有无需要的信息;二是确定这些信息是什么。图像识别是指对上述处理后的图像进行分类,确定类别名称,它可以在分割的基础上选择需要提取的特征,并对某些参数进行测量,再提取这些特征,然后根据测量结果做出分类。为了更好地识别图像,还要对整个图像做结构上的分析,对图像进行描述,以便对图像的主要信息做一个好的解释,并通过许多对象相互间的结构关系对图像加深理解,以便更好帮助和识别。故图像识别是在上述分割后的每个部分中,找出它的形状及纹理特征,以便对图像进行分类,并对整个图像做结构上的分析。因而对图像识别环节来说,输入是图像(经过上述处理后的图像),输出是类别和图像的结构分析,而结构分析的结果则

关于人脸识别技术的发展研究

人脸识别技术优势 863计划、国家科技支撑计划、自然科学基金都拨出专款资助人脸识别的相关研究。国家“十一五”科技发展规划中也将人脸识别技术的研究与发展列入其中[4],明确指出:“要在生物特征识别技术领域缩小与世界先进水平的差距,开展生物特征识别应用技术研究,人脸识别具有高安全性、低误报率的出入口控制新产品。”在这种环境下,国内一些科研院所和院校在人脸识别技术方面取得了很大进展。如中科院自动化所,清华大学,中科院计算所自主开发的人脸识别技术已经达到了国际先进的水平。人脸识别作为一种新兴的生物特征识别技术(Biometrics),与虹膜识别、指纹扫描、掌形扫描等技术相比,人脸识别技术在应用方面具有独到的优势: 1.人脸识别使用方便,用户接受度高。人脸识别技术使用通用的摄像机作为识别信息获取装置,以非接触的方式在识别对象未察觉的情况下完成识别过程。 2.直观性突出。人脸识别技术所使用的依据是人的面部图像,而人脸无疑是肉眼能够判别的最直观的信息源,方便人工确认、审计,“以貌取人”符合人的认知规律。 3.识别精确度高,速度快。与其它生物识别技术相比,人脸识别技术的识别精度处于较高的水平,误识率、拒认率较低。 4.不易仿冒。在安全性要求高的应用场合,人脸识别技术要求识别对象必须亲临识别现场,他人难以仿冒。人脸识别技术所独具的活性判别能力保证了他人无法以非活性的照片、木偶、蜡像来欺骗识别系统。这是指纹等生物特征识别技术所很难做到的。举例来说,用合法用户的断指即可仿冒合法用户的身份而使识别系统无从觉察。 5.使用通用性设备。人脸识别技术所使用的设备为一般的PC、摄像机等常规设备,由于目前计算机、闭路电视监控系统等已经得到了广泛的应用,因此对于多数用户而言使用人脸识别技术无需添置大量专用设备,从而既保护了用户的原有投资又扩展了用户已有设备的功能,满足了用户安全防范的需求。 6.基础资料易于获得。人脸识别技术所采用的依据是人脸照片或实时摄取的人脸图像,因而无疑是最容易获得的。 7.成本较低,易于推广使用。由于人脸识别技术所使用的是常规通用设备,价格均在一般用户可接受的范围之内,与其它生物识别技术相比,人脸识别产品具有很高的性能价格比。 概括地说,人脸识别技术是一种高精度、易于使用、稳定性高、难仿冒、性价比高的生物特征识别技术,具有极其广阔的市场应用前景。 我将人脸识别的一些应用列举出来,希望抛转引玉,大家不断完善,开拓更多的应用领域。 1)监控布控

基于matlab的图像预处理技术研究文献综述

毕业设计文献综述 题目:基于matlab的图像预处理技术研究 专业:电子信息工程 1前言部分 众所周知,MATLAB在数值计算、数据处理、自动控制、图像、信号处理、神经网络、优化计算、模糊逻辑、小波分析等众多领域有着广泛的用途,特别是MATLAB的图像处理和分析工具箱支持索引图像、RGB 图像、灰度图像、二进制图像,并能操作*.bmp、*.jpg、*.tif等多种图像格式文件如。果能灵活地运用MATLAB提供的图像处理分析函数及工具箱,会大大简化具体的编程工作,充分体现在图像处理和分析中的优越性。 图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。视觉是人类从大自然中获取信息的最主要的手段。拒统计,在人类获取的信息中,视觉信息约占60%,听觉信息约占20%,其他方式加起来才约占20%。由此可见,视觉信息对人类非常重要。同时,图像又是人类获取视觉信息的主要途径,是人类能体验的最重要、最丰富、信息量最大的信息源。通常,客观事物在空间上都是三维的(3D)的,但是从客观景物获得的图像却是属于二维(2D)平面的。 图像存在方式多种多样,可以是可视的或者非可视的,抽象的或者实际的,适于计算机处理的和不适于计算机处理的。 图像处理它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在 1964 年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动

浅析人工智能中的图像识别技术

浅析人工智能中的图像识别技术 本文从网络收集而来,上传到平台为了帮到更多的人,如果您需要使用本文档,请点击下载按钮下载本文档(有偿下载),另外祝您生活愉快,工作顺利,万事如意! 图像识别技术是信息时代的一门重要的技术,其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展,人类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。文章简单分析了图像识别技术的引入、其技术原理以及模式识别等,之后介绍了神经网络的图像识别技术和非线性降维的图像识别技术及图像识别技术的应用。从中可以总结出图像处理技术的应用广泛,人类的生活将无法离开图像识别技术,研究图像识别技术具有重大意义。 1 图像识别技术的引入 图像识别是人工智能科技的一个重要领域。图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。图像识别,顾名思义,就是对图像做出各种处理、分析,最终识别我们所要研究的

目标。今天所指的图像识别并不仅仅是用人类的肉眼,而是借助计算机技术进行识别。虽然人类的识别能力很强大,但是对于高速发展的社会,人类自身识别能力已经满足不了我们的需求,于是就产生了基于计算机的图像识别技术。这就像人类研究生物细胞,完全靠肉眼观察细胞是不现实的,这样自然就产生了显微镜等用于精确观测的仪器。通常一个领域有固有技术无法解决的需求时,就会产生相应的新技术。图像识别技术也是如此,此技术的产生就是为了让计算机代替人类去处理大量的物理信息,解决人类无法识别或者识别率特别低的信息。 图像识别技术原理 其实,图像识别技术背后的原理并不是很难,只是其要处理的信息比较繁琐。计算机的任何处理技术都不是凭空产生的,它都是学者们从生活实践中得到启发而利用程序将其模拟实现的。计算机的图像识别技术和人类的图像识别在原理上并没有本质的区别,只是机器缺少人类在感觉与视觉差上的影响罢了。人类的图像识别也不单单是凭借整个图像存储在脑海中的记忆来识别的,我们识别图像都是依靠图像所具有

仪表显示的图像识别算法研究

仪表显示的图像识别算法研究 摘要:随着社会的逐渐发展,人类的生活越来越趋于智能化。本文根据当今社会对于图像识别研究的发展现状,针对目前人们生活中人工读表的弊端,提出了通过采集仪表显示的图像并进行图像识别算法处理来达到智能自动读表的方法。 为了能快速获得采集数据,减少人们生活中繁复的人工作业。本文通过多样的图像处理来代替人眼识别图像。只需要得到采集到的图像,就可以利用计算机来进行计算和识别,得出最后的数字。本文采用了一系列的图像处理方法,包括图像的去噪,二值化分割,边缘检测和基于数学形态学的膨胀腐蚀操作等。同时通过多种尝试和比较各种方法的优缺点得到了一套简易而又完善,快速的图像识别算法。 在进行多次测试试验后,本文采用数码相机来进行图像的采集,同时经过图像预处理、图像分割、图像识别等一系列流程得出了较为完善的图像采集和识别系统,为未来信息传递智能化提供了基础,对于促进工业发展或是改善生活水平都有重要的意义。 关键词:图像预处理、二值化、边缘检测、形态学、去噪、图像分割、图像匹配 The research of image recognition displayed by the instrument Abstract: With the continuous development of society, people's lives become more and more intelligent. Based on the current development in today's society for the study of image recognition, according to the present disadvantages of manual meter reading in peop le’s lives, this page proposed the way by collecting the instruments display image and then deals it with image recognizing algorithms to achieve intelligent automatic meter. In order to quickly gather data, reducing manual work in people’s lives complicated. The page uses a series of image processing to replace human eye image recognition. Just need the collected images, we can use a computer to calculate and identify, then we will arrive at a final figure. We used a variety of image processing methods, including image denoising, thresholding segmentation, expansion of edge-detection based on mathematical morphology and corrosion and so on. And

图像处理技术的研究现状和发展趋势

图像处理技术的研究现状和发展趋势 庄振帅 数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代,当时的电子计算机已经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像,常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室(JPL)。他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术,如几何校正、灰度变换、去除噪声等方法进行处理,并考虑了太阳位置和月球环境的影响,由计算机成功地绘制出月球表面地图,获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理,以致获得了月球的地形图、彩色图及全景镶嵌图,获得了非凡的成果,为人类登月创举奠定了坚实的基础,也推动了数字图像处理这门学科的诞生。在以后的宇航空间技术,如对火星、土星等星球的探测研究中,数字图像处理都发挥了巨大的作用。数字图像处理取得的另一个巨大成就是在医学上获得的成果。1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置,也就是我们通常所说的CT(Computer Tomograph)。CT的基本方法是根据人的头部截面的投影,经计算机处理来重建截面图像,称为图像重建。1975年EMI公司又成功研制出全身用的CT 装置,获得了人体各个部位鲜明清晰的断层图像。1979年,这项无损伤诊断技术获得了诺贝尔奖,说明它对人类作出了划时代的贡献。与此同时,图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就,属于这些领域的有航空航天、生物医学过程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等,使图像处理成为一门引人注目、前景远大的新型学科。随着图像处理技术的深入发展,从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向

图像识别技术发展状况及前景

医学图像配准技术 罗述谦综述 首都医科大学生物医学工程系(100054) 吕维雪审 浙江大学生物医学工程研究所(310027) 摘要医学图像配准是医学图像分析的基本课题,具有重要理论研究和临床应用价 值。本文较全面地介绍了医学图像配准的概念、分类、配准原理、主要的配准技术及评 估方法。 关键词医学图像配准多模 1 医学图像配准的概念 在做医学图像分析时,经常要将同一患者的几幅图像放在一起分析,从而得到该患者的多方面的综合信息,提高医学诊断和治疗的水平。对几幅不同的图像作定量分析,首先要解决这几幅图像的严格对齐问题,这就是我们所说的图像的配准。 医学图像配准是指对于一幅医学图像寻求一种(或一系列)空间变换,使它与另一幅医学图像上的对应点达到空间上的一致。这种一致是指人体上的同一解剖点在两张匹配图像上有相的空间位置。配准的结果应使两幅图像上所有的解剖点,或至少是所有具有诊断意义的点及手术感兴趣的点都达到匹配。 医学图像配准技术是90年代才发展起来的医学图像处理的一个重要分支。涉及“配准”的技术名词除registration外,mapping、matching、co-registration、integration、align-ment和fusion 等说法也经常使用。从多数文章的内容看,mapping偏重于空间映射;fu-sion指图像融合,即不仅包括配准,而且包括数据集成后的图像显示。虽然在成像过程之前也可以采取一些措施减小由身体移动等因素引起的空间位置误差,提高配准精度(称作数据获取前的配准preacquisition),但医学图像配准技术主要讨论的是数据获取后的(post-acquisition)配准,也称作回顾式配准(retrospective registration)。当前,国际上关于医学图像配准的研究集中在断层扫描图像( tomographic images,例如CT、MRI、SPECT、PET等)及时序图像(time seriesimages,例如fMRI及4D心动图像)的配准问题。 2 医学图像基本变换 对于在不同时间或/和不同条件下获取的两幅图像I1(x1,y1,z1)和I2(x2,y2,z2)配准,就是寻找一个映射关系P:(x1,y1,z1) (x2,y2,z2),使I1的每一个点在I2上都有唯一的点与之相对应。并且这两点应对应同一解剖位置。映射关系P表现为一组连续的空间变换。常用的空间几何变换有刚体变换(Rigid body transformation)、仿射变换(Affine transformation)、投影变换(Projec-tive transformation)和非线性变换(Nonlin-ear transformation)。 (1)刚体变换: 所谓刚体,是指物体内部任意两点间的距离保持不变。例如,可将人脑看作是一个刚体。 处理人脑图像,对不同方向成像的图像配准常使用刚体变换。刚体变换可以分解为旋转和平移:P(x)=Ax+b(1) x=(x,y,z)是像素的空间位置;A是3×3的旋转矩阵,b是3×1的平移向量。

车辆牌照图像识别算法研究与实现本科毕设论文

Q260046902 专业做论文 西南科技大学 毕业设计(论文)题目名称:车辆牌照图像识别算法研究与实现

车辆牌照图像识别算法研究与实现 摘要:近年来随着国民经济的蓬勃发展,国内高速公路、城市道路、停车场建设越来越多,对交通控制、安全管理的要求也日益提高。因此,汽车牌照识别技术在公共安全及交通管理中具有特别重要的实际应用意义。本文对车牌识别系统中的车牌定位、字符分割和字符识别进行了初步研究。对车牌定位,本文采用投影法对车牌进行定位;在字符分割方面,本文使用阈值规则进行字符分割;针对车牌图像中数字字符识别的问题,本文采用了基于BP神经网络的识别方法。在学习并掌握了数字图像处理和模式识别的一些基本原理后,使用VC++6.0软件利用以上原理针对车牌识别任务进行编程。实现了对车牌的定位和车牌中数字字符的识别。 关键词:车牌定位;字符分割;BP神经网络;车牌识别;VC++

Research and Realization of License Plate Recognition Algorithm Abstract:In recent years, with the vigorous development of the national economy,there are more and more construct in the domestic expressway, urban road, and parking area. The requisition on the traffic control, safety management improves day by day. Therefore, license plate recognition technology has the particularly important practical application value in the public security and the traffic control. In the paper, a preliminary research was made on the license location, characters segment and characters recognition of the license plate recognition. On the license location,the projection was used to locate the license plate; On the characters segmentation, the liminal rule was used to divide the characters; In order to solve the problem of the digital characters recognition in the plate, BP nerve network was used to recognize the digital characters. After studying and mastering some basic principles of the digital image processing and pattern recognition, the task of license plate recognition was programmed with VC++ 6.0 using above principles. The license location and the digital characters recognition in the license plate were implemented. Keywords: license location, characters segmentation, BP nerve network, license plate recognition, VC++

图像识别与人工智能研究所发展规划报告

图像所学科建设与发展规划 根据学校建设世界知名高水平大学的发展目标,特制定图像所相应的学科建设与发展规划,以推动本学科的跨越式发展。 一、学科建设总体目标 (一)学科基础 图像识别与人工智能研究所(简称图像所)将继续以跻身于我国的国防科技的发展为切入点,从事发展巡航导弹中制导、末制导关键技术,承担相关预先研究和攻关科研任务为学科建设的主攻方向。 (1)目前本学科点共有五个研究方向: “计算机视觉与应用”、 “成像自动目标识别与精确制导技术”、 “多谱成像与遥感图像处理”、 “人工智能与思维科学” “面向模式识别的专用处理机与IC芯片设计”。 (2)本学科点现有科研人员26人,其中教授(含博士生导师)7人,副教授7人。科研教学梯队层次高,年龄、专业结构合理。现有教学科研用房4000 平方米。实验设备固定资产5000余万元,已初步形成先进、配套的教学、科研、开发环境和雄厚的技术储备。 (3)学科特点 模式识别与智能系统是信息科学技术领域中发展最迅速的前沿领域之一。

来自不同成像传感器的不同谱段的图像信号能全面揭示客观世界的各种特性,智能控制是人工智能与自动控制相结合的现代控制理论和技术,图像模式处理、识别与智能控制的结合构成了智能信息系统和智能自动化系统发展的基础,不仅科学意义深远而且有十分广阔的应用前景。本学科点的主要特色是紧密结合航天、航空和信息技术领域的国家目标,进行应用基础和应用技术的研究和开发,重点研究多谱段图像模式信息的获取、表示、处理、分析与智能系统领域的基础理论与关键技术,同时培养和造就本领域高层次、高质量的科技人才。本学科点具有特色和优势的研究方向是: ·计算机视觉与应用 在基于信息融合的信号处理、基于视觉、力觉和超声波接近觉的多传感器机器人系统和飞行器三维航迹规划技术方面具有特色,承担了国家重大型号XY-20末制导航迹规划攻关项目并进入型号研制。 ·成像自动目标识别与精确制导技术 开展面向复杂背景和随机环境下成像自动目标检测、识别、跟踪的新理论、新方法、新算法和新系统的研究,其特色是瞄准有关国家安全的国家目标,紧密结合航天航空高技术发展,在基于图象和图象序列的自动目标识别,景象匹配定位等精确制导领域开展应用基础和高技术的研究,并将一系列高水平成果应用于国防高技术武器系统中。 ·多谱成像与遥感图像处理 研究微波辐射特性及成像技术、激光雷达成像信号处理和遥感图像处理与

森林防火系统中图像识别算法的研究

哈尔滨工业大学工学硕士学位论文 摘要 森林是陆地生态的主体,具有很高的生态效益和经济效益。鉴于目前我国森林防火的严峻形势,必须开发有效技术解决森林火灾的监测问题。传统火灾探测器多采用单一时刻的火灾参量作为判断标准,在外界干扰下易引起频繁误报或漏报。近年来提出的基于机器视觉的火灾报警系统,利用数字图像处理技术来实现火灾自动报警。 基于火焰和烟雾的图像特征,本文研究了一种识别自然环境下火灾的机器视觉方法。火灾发生过程中,主要的图像信息是燃烧时产生的烟雾和火焰,通过对烟雾和火焰的图像信息研究发现,烟雾和火焰本身具有一定的规律性,以此为依据设计有针对性的算法,从图像中识别出烟雾和火焰,判断火灾是否发生。 首先,论文阐述了森林防火技术及图像型火灾检测技术的发展和现状,并对图像分割和滤波方法中的关键技术进行了详细介绍,在此基础上,本文分别讨论了火焰和烟雾的分割与识别。 然后,对于火焰分割,针对不同情况下的火焰研究了三种不同的分割技术,实现了火焰区域的准确分割。对于火焰的特征检测,主要进行颜色和动态特征的分析,通过建立火焰颜色模型进行颜色识别,再进一步进行火焰的四个动态特征的识别。对于烟雾分割,由于烟雾颜色的复杂性,采取颜色提取法进行分割,并运用视觉一致性的聚类算法对其进行了改进。对于烟雾的特征检测,主要进行小波特征及动态特征的分析,通过对比烟雾图像与背景图像小波系数进行小波特征识别,再对识别结果进一步进行动态特征识别,包括烟雾的不规则性和扩散性,最终确定视频中是否存在烟雾。 最后,综合以上分析,给出了森林防火系统中火灾的识别的整体流程以及火焰和烟雾分别的识别流程。 实验证明,综合火焰和烟雾的静态特征及动态特征的火灾识别方法,识别率高。在火灾检测技术中,具有较好的发展前景。 关键词火焰识别;烟雾识别;图像分割;动态特征 - I -

数字图像处理技术的现状及其发展方向(笔记)

数字图像处理技术的现状及其发展方向 一、数字图像处理历史发展 数字图像处理(Digital Image Processing)将图像信号转换成数字信号并利用计算机对其进行处理。 1.起源于20世纪20年代。 2.数字图像处理作为一门学科形成于20世纪60年代初期,美国喷气推进实验室(JPL)推动了数字图像处理这门学科的诞生。 3.1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置即CT(Computer Tomograph),1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。 4.从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展,人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论。 二、数字图像处理的主要特点 1.目前数字图像处理的信息大多是二维信息,处理信息量很大,对计算机的计算速度、存储容量等要求较高。 2.数字图像处理占用的频带较宽,在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本也高,这就对频带压缩技术提出了更高的要求。 3.数字图像中各个像素是不独立的,其相关性大。因此,图像处理中信息压缩的潜力很大。 4.由于图像是三维景物的二维投影,一幅图像本身不具备复现三维景物的全部几何信息的能力,要分析和理解三维景物必须作合适的假定或附加新的测量。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。 5.一方面,数字图像处理后的图像一般是给人观察和评价的,因此受人的因素影响较大,作为图像质量的评价还有待进一步深入的研究;另一方面,计算机视觉是模仿人的视觉,人的感知机理必然影响着计算机视觉的研究,这些都是心理学和神经心理学正在着力研究的课题。 三、数字图像处理的优点 1.再现性好;图像的存储、传输或复制等一系列变换操作不会导致图像质量的退化。 2.处理精度高;可将一幅模拟图像数字化为任意大小的二维数组,现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高。 3.适用面宽;图像可以来自多种信息源,图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像组合而成,因而均可用计算机来处理。 4.灵活性高;数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。 四、数字图像处理过程及其主要进展 常见的数字图像处理有:图像的采集、数字化、编码、增强、恢复、变换、

数字图像处理技术的研究现状与发展方向

数字图像处理技术的研究现状与发展方向 孔大力崔洋 (山东水利职业学院,山东日照276826) 摘要:随着计算机技术的不断发展,数字图像处理技术的应用领域越来越广泛。本文主要对数字图像处理技术的方法、优点、数字图像处理的传统领域及热门领域及其未来的发展等进行相关的讨论。 关键词:数字图像处理;特征提取;分割;检索 引言 图像是指物体的描述信息,数字图像是一个物体的数字表示,图像处理则是对图像信息进行加工以满足人的视觉心理和应用需求的行为。数字图像处理是指利用计算机或其他数字设备对图像信息进行各种加工和处理,它是一门新兴的应用学科,其发展速度异常迅速,应用领域极为广泛。 数字图像处理的早期应用是对宇宙飞船发回的图像所进行的各种处理。到了70年代,图像处理技术的应用迅速从宇航领域扩展到生物医学、信息科学、资源环境科学、天文学、物理学、工业、农业、国防、教育、艺术等各个领域与行业,对经济、军事、文化及人们的日常生活产生重大的影响。 数字图像处理技术发展速度快、应用范围广的主要原因有两个。最初由于数字图像处理的数据量非常庞大,而计算机运行处理速度相对较慢,这就限制了数字图像处理的发展。现在计算机的计算能力迅速提高,运行速度大大提高,价格迅速下降,图像处理设备从中、小型计算机迅速过渡到个人计算机,为图像处理在各个领域的应用准备了条件。第二个原因是由于视觉是人类感知外部世界最重要的手段。据统计,在人类获取的信息中,视觉信息占60%,而图像正是人类获取信息的主要途径,因此,和视觉紧密相关的数字图像处理技术的潜在应用范围自然十分广阔。 1数字图像处理的目的 一般而言,对图像进行加工和分析主要有以下三方面的目的[1]: (1)提高图像的视感质量,以达到赏心悦目的目的。如去除图像中的噪声,改变图像中的亮度和颜色,增强图像中的某些成分与抑制某些成分,对图像进行几何变换等,从而改善图像的质量,以达到或真实的、或清晰的、或色彩丰富的、或意想不到的艺术效果。 (2)提取图像中所包含的某些特征或特殊信息,以便于计算机进行分析,例如,常用做模式识别和计算机视觉的预处理等。这些特征包含很多方面,如频域特性、灰度/颜色特性、边界/区域特性、纹理特性、形状/拓扑特性以及关系结构等。 (3)对图像数据进行变换、编码和压缩,以便于图像的存储和传输。 2数字图像处理的方法 数字图像处理按处理方法分,主要有以下三类,即图像到图像的处理、图像到数据的处理和数据到图像的处理[2]。 (1)图像到图像。图像到图像的处理,其输入和输出均为图像。这种处理技术主要有图像增强、图像复原和图像编码。 首先,各类图像系统中图像的传送和转换中,总要造成图像的某些降质。第一类解决方法不考虑图像降质的原因,只将图像中感兴趣的特征有选择地突出,衰减次要信息,提高图像的可读性,增强图像中某些特征,使处理后的图像更适合人眼观察和机器分析。这类方法就是图像增强。例如,对图像的灰度值进行修正,可以增强图像的对比度;对图像进行平滑,可以抑制混入图像的噪声;利用锐化技

关于人工智能中的图像识别技术的研究

191 关于人工智能中的图像识别技术的研究 翁和王 (武夷学院数学与计算机学院,福建武夷山354300) 摘要:图像识别技术作为在信息时代发展起来的一项信息技术,其主要是利用计算机对人工进行替代,实现对众多的物 理信息进行处理。计算机技术快速发展也推动了图像识别技术得以迅猛的发展。文章就图像识别的技术原理、模式识别进行图像识别技术概述,并对其识别过程进行一定的分析,重点对神经网络以及非线性降维两个形式的图像识别技术加以分析。以期对图像识别有关的研究人员与应用人士有所参考。关键词:人工智能;原理与过程;图像识别技术;非线性;神经网络中图分类号:TP18文献标识码:A 文章编号:1673-1131(2016)10-0191-02 0引言 图像识别技术作为人工智能内的重要领域之一,在计算机技术和信息技术快速发展的背景下,其也得到了愈发广泛的使用,其在医疗诊断、指纹识别、面部识别以及卫星云图识别等方面具有着很好的应用。图像识别技术通常是指利用计算机对系统前端捕获的图片根据既定的目标对其进行处理。图像识别在人们日常的生活中也得到普遍的应用,诸如条码识别、车牌捕捉以及手写识别等。随着其不断的发展与完善,其今后的应用领域也会更加的广泛。 1图像识别技术的概述1.1图像识别的技术原理 事实上,图像识别具有的原理并非很深奥,主要是图像识别所需处理的信息非常的复杂。计算机中的所有处理技术均不能随意出现,是众多学者通过实践获得的启示,通过程序使其得到模拟与实现。计算机实现图像识别所需的原理与人类进行图像识别所需的原理基本上是一致的,仅仅是计算机不存在人类视觉和感觉方面的影响。人类在进行图像识别过程中并非仅是利用这一图像存在于脑海内的记忆加以识别,而是通过图像自身拥有的特征对其进行相应的分类,之后利用各个类别拥有的特征使图片被识别出来。当我们看到图片时,大脑便会快速感知出以前见过这张或与之相类似的图片与否。事实上在看到和感知间已经实现了快速的识别,这一识别与搜索存在一定的相似性[1]。在识别过程中,大脑将会按照存储记忆内被分好类的图片展开识别,检查其是否和这一图像存在相同或者是类似特征记忆存储,便识别出以往时候看见过这一图片。计算机进行图像识别的原理也是这样,利用分类和提取出图像的重要特征,并对多余的无用特征加以有效地排除,以此实现对图像的识别。计算机所能提取出来的上述特征有时会较为明显,而有时也会非常的普通,这在极大程度上对计算机识别效率造成一定的影响。总而言之,利用计算机进行视觉识别时,图像中的内容一般是通过图像特征对其加以描述的[2]。 1.2模式识别 模式识别作为信息科学与人工智能中的重要组成,其通 常是对现象和事物处于不同形式中信息实现处理与分析,以便能够达到对现象与事物进行分类、描述以及辨认等目标。而计算机能够实现图像识别便是对人类进行图像识别时的一种模拟,在实现图像识别时,能够展开模式识别是不可或缺的。以往的模式识别仅仅是人类所掌握基本智能之一,伴随人工智能以及计算机技术得到兴起与发展,人类自身具有的识别 模式便无法再满足人类的生活需求,对此人们便需要利用计算机来对人类脑力劳动进行一定程度的替代与扩展。这也就产生了计算机形式的模式识别。简而言之,模式识别便是对数据实现分类,其是一门和数学有着密切联系的科学,其所运 用的大量思想便是数学中的统计和概率[3] 。可以将模式识别分成统计模糊模式、识别模式识别以及句法模式识别三类。 2图像识别技术的识别过程 由于计算机进行图像识别和人类进行图像识别所采用的是一样的原理,因此上述两种识别过程也会存在一定的相似性。可以将图像识别技术划分为如下几步:第一步,信息的获取,其是指利用传感器将声音和光等信息装换为电信号,简而言之便是获取识别对象具有的基本信息,同时将其装换成为计算机可以识别的信息。第二步,预处理,其是指对图像进行去噪、变换以及平滑等处理操作,以此来提升图像所具有的重要特点。第三步,特征抽取与选择,其是在模式识别过程中,要对图像进行特征的抽取与选择,简而言之便是识别的图像是多种多样的,若想通过一定的方式将其分离开,便要对图像中拥有的自身特征进行识别,在特征的获取时便称为特征抽取[4]。在进行特征抽取过程中,获取的特征并非一定对本次识别有所价值,此时便要对所获取的特征进行一定的提取,这便是特征选择。对于图像识别整个过程而言,特征抽取与选择时期中最为关键的步骤之一,因此,这一步使进行图像识别理解时的重点内容。第四步,分类器设计与分类决策,其中分类器设计即利用训练来制定出一个识别规则,借此识别规则便能够获得一个特征种类,从而让图像识别可以达到更高的辨识率。而分类决策则是对特征空间内的被识别对象实现分类的最佳识别方法。 3图像识别技术的研究分析 3.1神经网络形式的图像识别技术 神经网络形式的图像识别是目前较为新型的技术,其是基于以往的图像识别方式,并将神经网络算法进行有效的融合。这里所说的神经网络指的是人工神经网络,换句话说便是该神经网络并非是动物体所拥有的神经网络,而是人类根据动物神经网络进行人工模拟的一种神经网络。对于神经网络形式的图像识别技术而言,遗传算法和BP 神经网络进行有效的结合是目前基于神经网络形式的图像识别技术内最为经典的模型,其在诸多的领域之中均有所应用。对图像识别系统运用神经网络系统,通常先对图像特征进行提取,之后将图像特征向神经网络中加以映射,以此实现对图像的识别与分类。例如,对于智能汽车监控中拍照识别技术而言, 2016 (Sum.No 166) 信息通信 INFORMATION &COMMUNICATIONS 2016年第10期(总第166期)

图像识别匹配技术原理

第1章绪论 1.1研究背景及意义 数字图像,又称数码图像或数位图像,是二维图像用有限数字数值像素的表示。通常,像素在计算机中保存为二维整数数组的光栅图像,这些值经常用压缩格式进行传输和储存。数字图像可以由许多不同的输入设备和技术生成,例如数码相机、扫描仪、坐标测量机等,也可以从任意的非图像数据合成得到,例如数学函数或者三维几何模型,三维几何模型是计算机图形学的一个主要分支。数字图像处理领域就是研究它们的变换算法。 数字图像处理(Digital Image Processing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理的产生和迅速发展主要受三个因素的影响:一是计算机的发展;二是数学的发展(特别是离散数学理论的创立和完善);三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。 图像配准(Image registration)就是将不同时间、不同传感器(成像设备)或不同条件下(天候、照度、摄像位置和角度等)获取的两幅或多幅图像进行匹配、叠加的过程,它已经被广泛地应用于遥感数据分析、计算机视觉、图像处理等领域。 图像配准的方法迄今为止,在国内外的图像处理研究领域,已经报道了相当多的图像配准研究工作,产生了不少图像配准方法。总的来说,各种方法都是面向一定范围的应用领域,也具有各自的特点。比如计算机视觉中的景物匹配和飞行器定位系统中的地图匹配,依据其完成的主要功能而被称为目标检测与定位,根据其所采用的算法称之为图像相关等等。 基于灰度信息的图像配准方法一般不需要对图像进行复杂的预先处理,而是利用图像本身具有灰度的一些统计信息来度量图像的相似程度。主要特点是实现简单,但应用范围较窄,不能直接用于校正图像的非线性形变,在最优变换的搜索过程中往往需要巨大的运算量。经过几十年的发展,人们提出了许多基于灰度信息的图像配准方法,大致可以分为三类:互相关法(也称模板匹配法)、序贯相似度检测匹配法、交互信息法。 目前主要图像配准方法有基于互信息的配准方法,基于相关性的配准方法和基于梯度的配准方法。其中基于梯度的方法基本很少单独使用,而作为一个辅助

图像识别技术浅析

图像识别技术浅析 Analysis of Image Recognition Technology 刘峰伯软件学院2010544029 【摘要】:本文描述了图像识别系统的结构与工作原理,在对图像预处理、特征提取、分类、图像匹配算法进行深入研究和分析的基础上,分析和比较了各种算法的优缺点,并讨论了其中的关键技术。 【关键词】:图像识别;预处理;特征提取;匹配 【Abstract】This paper describes the structure and working principle of an image recognition system. The advantages and disadvantages of various a1gorithms are compared on the basis of in-depth analysis of the image pre-processing, feature extraction, classification and image matching algorithms, and discussed the key technology. 【Key Word】Image Recognition;Pre-Processing;Feature Extraction;Matchi ng. 一、引言 图像识别,是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。随着计算机技术与信息技术的发展,图像识别技术获得了越来越广泛的应用。例如医疗诊断中各种医学图片的分析与识别、天气预报中的卫星云图识别、遥感图片识别、指纹识别、脸谱识别等,图像识别技术越来越多地渗透到我们的日常生活中。 二、图像识别系统 1、概述 自动图像识别系统的过程分为五部分:图像输入、预处理、特征提取、分类和匹配,其中预处理又可分为图像分割、图像增强、二值化和细化等几个部分。 (1)图像输入 将图像采集下来输入计算机进行处理是图像识别的首要步骤。 (2)预处理 为了减少后续算法的复杂度和提高效率,图像的预处理是必不可少的。其中

人脸检测和识别技术的文献综述

人脸识别技术综述 摘要:在阅读关于人脸检测识别技术方面文献后,本文主要讨论了人脸识别技术的基本介绍、研究历史,人脸检测和人脸识别的主要研究方法,人脸识别技术的应用前景,并且总结了人脸识别技术的优越性和当下研究存在的困难。 关键词:人脸识别;人脸检测;几何特征方法;模板匹配方法;神经网络方法;统计方法;模板匹配;基于外观方法; 随着社会的发展,信息化程度的不断提高,人们对身份鉴别的准确性和实用性提出了更高的要求,传统的身份识别方式已经不能满足这些要求。人脸识别技术(FRT)是当今模式识别和人工智能领域的一个重要研究方向.虽然人脸识别的研究已有很长的历史,各种人脸识别的技术也很多,但由于人脸属于复杂模式而且容易受表情、肤色和衣着的影响,目前还没有一种人脸识别技术是公认快速有效的[1]基于生物特征的身份认证技术是一项新兴的安全技术,也是本世纪最有发展潜力的技术之一[2]。 1. 人脸识别技术基本介绍 人脸识别技术是基于人的脸部特征,一个完整的人脸识别过程一般包括人脸检测和人脸识别两大部分,人脸检测是指计算机在包含有人脸的图像中检测出人脸,并给出人脸所在区域的位置和大小等信息的过程[3],人脸识别就是将待识别的人脸与已知人脸进行比较,得

出相似程度的相关信息。 计算机人脸识别技术也就是利用计算机分析人脸图象, 进而从中出有效的识别信息, 用来“辨认”身份的一门技术.人脸自动识别系统包括三个主要技术环节[4]。首先是图像预处理,由于实际成像系统多少存在不完善的地方以及外界光照条件等因素的影响,在一定程度上增加了图像的噪声,使图像变得模糊、对比度低、区域灰度不平衡等。为了提高图像的质量,保证提取特征的有有效性,进而提高识别系统的识别率,在提取特征之前,有必要对图像进行预处理操作;人脸的检测和定位,即从输入图像中找出人脸及人脸所在的位置,并将人脸从背景中分割出来,对库中所有的人脸图像大小和各器官的位置归一化;最后是对归一化的人脸图像应用人脸识别技术进行特征提取与识别。 2. 人脸识别技术的研究历史 国内关于人脸自动识别的研究始于二十世纪80年代,由于人脸识别系统和视频解码的大量运用,人脸检测的研究才得到了新的发展利用运动、颜色和综合信息等更具有鲁棒性的方法被提出来变形模板,弹性曲线等在特征提取方面的许多进展使得人脸特征的定位变得更为准确。 人脸识别的研究大致可分为四个阶段。第一个阶段以Bertillon,Allen和Parke为代表,主要研究人脸识别所需要的面部特征;第二个阶段是人机交互识别阶段;第三个阶段是真正的机器自动识别阶段;第四个阶段是鲁棒的人脸识别技术的研究阶段。目前,国外多所

相关文档
最新文档