图像识别匹配技术原理

图像识别匹配技术原理
图像识别匹配技术原理

第1章绪论

1.1研究背景及意义

数字图像,又称数码图像或数位图像,是二维图像用有限数字数值像素的表示。通常,像素在计算机中保存为二维整数数组的光栅图像,这些值经常用压缩格式进行传输和储存。数字图像可以由许多不同的输入设备和技术生成,例如数码相机、扫描仪、坐标测量机等,也可以从任意的非图像数据合成得到,例如数学函数或者三维几何模型,三维几何模型是计算机图形学的一个主要分支。数字图像处理领域就是研究它们的变换算法。

数字图像处理(Digital Image Processing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理的产生和迅速发展主要受三个因素的影响:一是计算机的发展;二是数学的发展(特别是离散数学理论的创立和完善);三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。

图像配准(Image registration)就是将不同时间、不同传感器(成像设备)或不同条件下(天候、照度、摄像位置和角度等)获取的两幅或多幅图像进行匹配、叠加的过程,它已经被广泛地应用于遥感数据分析、计算机视觉、图像处理等领域。

图像配准的方法迄今为止,在国内外的图像处理研究领域,已经报道了相当多的图像配准研究工作,产生了不少图像配准方法。总的来说,各种方法都是面向一定范围的应用领域,也具有各自的特点。比如计算机视觉中的景物匹配和飞行器定位系统中的地图匹配,依据其完成的主要功能而被称为目标检测与定位,根据其所采用的算法称之为图像相关等等。

基于灰度信息的图像配准方法一般不需要对图像进行复杂的预先处理,而是利用图像本身具有灰度的一些统计信息来度量图像的相似程度。主要特点是实现简单,但应用范围较窄,不能直接用于校正图像的非线性形变,在最优变换的搜索过程中往往需要巨大的运算量。经过几十年的发展,人们提出了许多基于灰度信息的图像配准方法,大致可以分为三类:互相关法(也称模板匹配法)、序贯相似度检测匹配法、交互信息法。

目前主要图像配准方法有基于互信息的配准方法,基于相关性的配准方法和

基于梯度的配准方法。其中基于梯度的方法基本很少单独使用,而作为一个辅助性的测度与其它方法相结合起来使用。基于灰度的配准算法是医学图像配准研究的发展方向,也是目前研究的热点之一。基于灰度的配准方法与基于特征的配准方法的区别在于前者没有提取图像特征的步骤,直接对图像中的灰度进行处理。基于灰度的配准方法计算复杂度高、对图像的灰度、旋转、形变以及遮挡都比较敏感。

灰度相关的配准方法是从待拼接图像的灰度值出发,图像拼接故而成为灰度相关的配准算法的一个基础。图像拼接(image mosaic)技术是将一组相互间重叠部分的图像序列进行空间匹配对准,经重采样合成后形成一幅包含各图像序列信息的宽视角场景的、完整的、高清晰的新图像的技术。图像拼接在摄影测量学、计算机视觉、遥感图像处理、医学图像分析、计算机图形学等领域有着广泛的应用价值。

灰度相关的图像配准算法在图像处理技术中起着十分关键的作用,它是图像处理技术得以发展的一个重要基础。它推动着图像处理技术在医学、生物、信息处理和其他很多高科技领域内的应用,它已渐渐发展成社会生活中不可分离的一种技术,对于图像处理技术发展及应用具有重要意义。

1.2图像配准方法概述

配准技术的流程如下:首先对两幅图像进行特征提取得到特征点;通过进行相似性度量找到匹配的特征点对;然后通过匹配的特征点对得到图像空间坐标变换参数:最后由坐标变换参数进行图像配准。而特征提取是配准技术中的关键,准确的特征提取为特征匹配的成功进行提供了保障。因此,寻求具有良好不变性和准确性的特征提取方法,对于匹配精度至关重要。

图像配准的方式可以概括为相对配准和绝对配准两种:相对配准是指选择多图像中的一张图像作为参考图像,将其它的相关图像与之配准,其坐标系统是任意的。绝对配准是指先定义一个控制网格,所有的图像相对于这个网格来进行配准,也就是分别完成各分量图像的几何校正来实现坐标系的统一。本文主要研究大幅面多图像的相对配准,因此如何确定多图像之间的配准函数映射关系是图像配准的关键。通常通过一个适当的多项式来拟合两图像之间的平移、旋转和仿射变换,由此将图像配准函数映射关系转化为如何确定多项式的系数,最终转化为如何确定配准控制RCP。

目前,根据如何确定RCP的方法和图像配准中利用的图像信息区别可将图像配准方法分为三个主要类别:基于灰度信息法、变换域法和基于特征法,其中基于特征法又可以根据所用的特征属性的不同而细分为若干类别。以下将根据这一分类原则来讨论目前已经报道的各种图像配准方法和原理。

1.3研究现状

国外从20世纪60年代就开始在图像配准领域进行研究,但直到1980年代才开始引起学者们的关注。到上世纪末,单模图像配准问题已基本解决,但多模图像配准由于涉及模式和领域的复杂性,仍需密切关注。国际上对图像配准技术曾做过调查,其结论是1990年代初技术就明显增加。而国内从1990年代初才开始涉足此领域。与灰度相关的图像配准算法是图像配准算法中比较经典的一种,很多配准技术都以它为基础进行延伸和扩展。

针对多光谱遥感图像,提出了一种基于局部灰度极值的配准方法:通过在基准图像和待配准图像中同步寻找含有灰度极值的小区域,再用多项式对极值区域进行曲面拟合,最后,分别计算小区域的极值点作为特征点进行配准。并用真实和模拟多光谱图像进行了试验结果显示该课题提出具有算法简单和配准精度高的特点。这是与灰度相关图像配准算法有关的一个扩展应用。

1.4研究问题及内容

本文在分析了灰度相关的图像配准算法中的线匹配法、比值匹配法和块匹配法,利用这三种方法分别实现两幅图像在水平垂直位移上的配准,而本课题研究的内容是提出一种基于灰度相关的算法,不仅能实现两幅图在水平和垂直位移的配准,同时也能实现在绕光轴旋转情况下的图像配准。这里提出了一种方法,多尺度模块匹配法。在这三种匹配的环境下,它能实现水平垂直位移上的匹配、缩放以及旋转。同时通过在Matlab编程环境下编程实现相关算法,通过实际图像的配准试验,利用这些结论最终得到精确地配准结果。

第2章图像配准基本理论

2.1图像配准的基本介绍

2.1.1图像配准的描述

图像配准是对取自不同时间,不同传感器或不同视角的同一场景的两幅图像或者多幅图像匹配的过程。图像配准广泛用于多模态图像分析,是医学图像处理的一个重要分支,也是遥感图像处理,目标识别,图像重建,机器人视觉等领域中的关键技术之一,也是图像融合中要预处理的问题,待融合图像之间往往存在偏移、旋转、比例等空间变换关系,图像配准就是将这些图像变换到同一坐标系下,以供融合使用。

2.1.2图像配准的定义

对于二维图像配准可定义为两幅图像在空间和灰度上的映射[4],如果给定尺寸的二维矩阵1

F代表两幅图像,1(,)

F和2

F X Y和2(,)

F X Y分别表示相应位置

=,式中

F X Y

G F

H X Y

X Y上的灰度值,则图像间的映射可表示为:2(,)(1((,))) (,)

H表示一个二维空间坐标变换,即(',')(,)

=,且G是一维灰度变换。

X Y H X Y

2.1.3图像配准的步骤

图像配准的基本过程可以分为三个步骤:第一步是为每一个图像信息模式各定义一个坐标系(,)

F X Y,然后再定义这些参考特征之间的失调或相似函数;第二步是分割出图像的参考特征,再定义这些参数特征之间的失调或相似函数;第三步是应用优化算法,使第二步中失调(相似)函数达到全局最小(最大)值,达到两幅图像的配准。其中参考特征和对应优化算法的选择是配准的核心,也是不同配准算法的差异所在。

2.2图像配准的相关概念

2.2.1配准基准

通常,图像配准中根据配准基准的特性,可分为基于外部基准的配准和基于内部基准的配准[5],外部基准是指强加于待配准对象的各种人造标记,这些标记必须在各种配准模式中都清晰可见且可准确检测到。内部基准是指由图像本身得到的位置相对固定且图像特征明晰的各种配准标识。

2.2.2 映射变换与配准区域

设1f 和2f 表示两幅待匹配的图像,1()1(,)I x I x y =和2(')2(',')I x I x y =分别表示两幅图像的密度函数,其中(,)x x y =和'(',')x x y =分别表示在图像1D 和2D 中的像素坐标。图像匹配就是要找到一个把图像1f 映射到图像2f 的变换

()((,),(,))

M x U x y V x y =,使得变换后的图像3(())I M x 和2(')I x 具有几何对应性。这种映射变换有刚体变换、仿射变换、投影变换以及曲线变换等。配准时的变换区域根据实际需要又分为局部配准和全局配准。局部变换一般很少直接使用,因为它会破坏图像的局部连续性,且变换的双映射性会影响图像的再采样。从近期关于图像配准方面的文章看,一般刚性和仿射多用于全局变换,而曲线变换多用于局部变换。

2.2.3 配准的交互性与优化

根据人的参与程序配准又可分为全自动式,交互式和半自动式三种。全自动式中使用者仅需给相应算法提供图像数据以及图像获取的一些可能信息;交互式中使用者必须亲自进行配准,软件仅给目前变换提供一个可视的或数字的感官印象以及初始变换的一个可能参数;半自动式中,交互式有两种方式:一种是使用者须初始化算法,如分割数据,另一种是指导算法,如拒绝或接受配准假设。

配准变换的参数可以是直接计算出的,也可以是搜索计算出的。直接计算的最优化方法一般已完全由实例决定,所能研究的工作也仅限于如何使用非常少的信息把此计算方法应用于实际。搜索计算的最优化方法大多都可以用待优化的变换参数的一个标准数学函数来表达配准实例,此函数力图使图像在某一变换时两幅图像可达到最大相似。这些函数通常在单模配准中能简单一些,因为此时图像的相似性更能容易直接定义。我们可以通过使用一个标准的、合适的最优化方法使相似函数达到最优。

目前应用比较广泛的方法有Powell 的方法、Downhill Simplex 方法、Brent 的方法以及一系列一维搜索算法、Levenberg-Marquardt 最优化算法、Newton-Raph son 迭代算法、stochastic 搜索算法、梯度下降法(gradient descent methods )、遗传算法(genetic methods )、模拟退火法(simulated annealing ),粒子群算法(partice sworm ),蚁群算法(ant ),几何散列法(geometric hashing )。多分辨率(如金字塔)和多尺度方法可以加速最优化的收敛速度。许多实际应用中使用了不止一种最优化方法,一般是先使用一种粗糙但快速的算法,然后再接着使用一种准确但运算速度慢的算法。

2.2.4 图像成像模式与配准方法的分类

有单模式和多模式等,单模(monomodality)图像配准是指待配准的两幅图像是同一种成像设备获取的。多模(multimodality)图像配准[6]是指待配准的两幅图像来源于不同的成像设备。基于灰度信息的图像配准方法一般不需要对图像进行复杂的预先处理,而是利用图像本身具有灰度的一些统计信息来度量图像的相似程度。主要特点是实现简单,但应用范围较窄,不能直接用于校正图像的非线性形变,在最优变换的搜索过程中往往需要巨大的运算量。经过几十年的发展,人们提出了许多基于灰度信息的图像配准方法,大致可以分为三类:互相关法(也称模板匹配法)、最大互信息法和基于小波变换的图像配准法。

(1) 互相关法

对于同一物体由于各种图像获取条件的差异或物体自身发生的空间位置的改变而产生的单模图像配准问题常常应用互相关法。在互相关法中互相关值的大小反映了配准的效果。互相关法的思路是找出使各图像之间相关性最大的空间变换参数来实现图像的配准。该方法通过优化两幅图像间的相似性测度来估计空间变换参数(刚体的平移和旋转参数),采用的相似性测度可以是多种多样的,例如相关系数,差值的平方和及相关函数等。其中最经典的相似性测度是归一化的相关系数(correlation coefficient , CC ),

即:

, (2.1)

式中,F 为模板图像,{}1

1N n n F f -==,n f 为图像F 的灰度;G 为与F 有相同大小的目标图像{}11N n n G g -==,n g 为图像G 的灰度;f 和g 分别为图像F 和G 灰度的均方值。由于要对每种变换参数可能的取值都要计算一次相似性测度,互相关法的计算量比较庞大,因此近年来发展了快速搜索算法,例如,用相位相关傅立叶法估算平移和旋转参数;用遗传算法和模拟退火技术减少搜索时间和克服局部极值问题。

尤其注意的是互相关法受到不同模态成像特点的影响,例如同一物体在不同的模态图像中表现出纹理和密度的非线性差异,使相关性计算无意义,故互相关性法主要局限于单模图像配准[7]。对于条件不好或曲线不完全闭合的图像配准,

Kaneko 等提出了一种选择性相关系数法(selective correlation coefficient ,即SCC ),SCC 实际上是CC 的扩展,SCC 在每次为其计算时间仅仅依靠两幅图像灰度的比较过程,故其代价非常小甚至可以忽略不计。

(2) 最大互信息法(Maximization of Mutual Information)

互信息是信息论的一个基本概念,是两个随机变量统计相关性的测度。最大互信息法几乎可以用在任何不同模式图像的配准,特别是当其中一个图像的数据部分缺损时也能得到很好的配准效果。当含有相同内容的两幅图像通过几何变换在空间对齐时,它们所包含的灰度值的互信息量最大。因此最大化的互信息量可以作为图像配准准则。

基于最大互信息[8]的配准过程实质上是搜索最佳的几何变换参数,使两幅图像的互信息达到最大。该方法采用整幅图像的所有像素共同组成特征空间,再根据特征空间确定一种空间变换,使一幅图像经过该变换后和另一幅图像的互信息最大,最终实现配准。

互信息(Mutual Information ,MI )是信息论中的一个测度,用于描述两个变量间的统计相关性,或一个变量中包含的另一个变量中的信息的多少,表示两个随机变量之间的依赖程度,一般用熵来表示。熵表达的是一个系数的复杂性和不确定性。变量A 的熵定义为: ()()log ()A A a

H A P a P a -=∑, (2.2)

,(,)(,).log (,)AB AB a b

H A B P a b P a b =∑, (2.3)

将待配准的两幅医学图像定义为浮动图像A 和参考图像B ,它们是关于图像灰度的两个随机变量集。设它们的边缘概率分布分别为()PA a 、()PB b ,联合概率分布(,)PAB a b ,则它们的互信息(,)MI A B 为:

, (2.4)

当两幅图像的空间位置达到一致时,其中一幅图像表达另一幅图像的信息,即其互信息应为最大。继互信息测度提出后,学者们对基于Shannon 熵的方法做了进一步的研究,相继提出了比互信息更为稳定的,其它一些形式的熵测度,称为归一化的互信息,例如Studholme 提出了归一化互信息测度(nrimalized mutual information, NMI ):

, (2.5)(3)基于小波的图像配准方法

近年来图像配准的重要发展之一是采用小波变换进行图像局部特征提取,该

f xi yi,方法的关键技术是二维离散小波分解。设在,x y平面内的二维图像(,)

基于二维离散小波变换的图像分解是将该原始图像在某一尺度上分别在,x y方

向上进行小波分解,每次分解后的低频部分用L表示,高频部分用H表示。

在某一尺度上,图像可以经过x方向和y方向的离散小波变换后分解为4个

子图像,在x方向和y方向都是高频子图像(,)

fHH xi yi,在x方向是低频,在y方

向是高频子图像(,)

fLH xi yi和在x方向是高频y方向是低频的子图像

fHL xi yi。低频子图像给出了原图像的概貌,高频子图像给出了原图像的细貌。

(,)

对于二维正交小波变换有其快速算法-Mallat算法,它把小波变换的计算问

题转化为小波变换后系数的计算问题:在实际操作中,给出1

M+尺度层上的离

散采样值{1(,)}

fM m n

+数据,要计算M尺度层上的小波变换系数,即分解算法

的问题。基于小波变换的图像配准方法有多分辨率分析的优势,能够提高配准的

速度。

2.3灰度相关的配准方法

基于灰度信息的图像配准方法一般不需要对图像进行复杂的预先处理,而是

利用图像本身具有灰度的一些统计信息来度量图像的相似程度。主要特点是实现

简单,但应用范围较窄,不能直接用于校正图像的非线性形变,在最优变换的搜

索过程中往往需要巨大的运算量。经过几十年的发展,人们提出了许多基于灰度

信息的图像配准方法,大致可以分为三类:互相关法(也称模板匹配法)、序贯

相似度检测匹配法、交互信息法。

互相关法是最基本的基于灰度统计的图像配准[9]方法,通常被用于进行模板

匹配和模式识别。它是一种匹配度量,通过计算模板图像和搜索窗口之间的互相

关值,来确定匹配的程度,互相关值最大时的搜索窗口位置决定了模板图像在待

配准图像中的位置。

序贯相似度检测匹配法(Sequential Similarity Detection Algorithms,SSDA)

是由Barnea等人提出来的。SSDA方法的最主要的特点是处理速度快。该方法先

选择一个简单的固定门限T,若在某点上计算两幅图像残差和的过程中,残差和

大于该固定门限T,就认为当前点不是匹配点,从而终止当前的残差和的计算,转向别的点去计算残差和,最后认为残差和增长最慢的点就是匹配点。这种方法的基本思想是基于对误差的积累进行分析。所以对于大部分非匹配点来说,只需计算模板中的前几个像素点,而只有匹配点附近的点才需要计算整个模板。这样平均起来每一点的运算次数将远远小于实测图像的点数,从而达到减少整个匹配过程计算量的目的。

交互信息法最初是Viola等人于1995年把交互信息引入到图像配准的领域的,它是基于信息理论的交互信息相似性准则。初衷是为了解决多模态医学图像的配准问题。

交互信息用来比较两幅图像的统计依赖性。首先将图像的灰度视作具有独立样本的空间均匀随机过程,相关的随机场可以采用高斯—马尔科夫随机场模型建立,用统计特征[10]概率密度函数来描述图像的统计性质。交互信息是两个随机变量A和B之间统计相关性的量度,或是一个变量包含另一个变量的信息量的量度。交互信息图像配准方法一经提出,有不少基于此类的研究,尤其在医学图像的配准问题上。比如将交互信息和梯度结合起来改善其极值性能的算法、多分辨率图像金字塔法等等。但交互信息是建立在概率密度估计的基础上的,有时需要建立参数化的概率密度模型,它要求的计算量很大,并且要求图像之间有很大的重叠区域,由此函数可能出现病态,且有大量的局部极值。

本文接下来将要陈述灰度相关的几种配准方法,大致可分为:线匹配法、比值匹配法和块匹配法。比值匹配法是指将待配准图像的一定间隔的行或列的像素的比值作为模板;块匹配法是指将待配准图像的正方形区域的像素的集合作为模板。比值匹配法是从一幅图像的重叠区域中部分相邻的两列上取出部分像素,然后以它们的比值作为模板,在另一幅图像中搜索最佳匹配,这种算法计算量较小,但精度低;块匹配法是以一幅图像重叠区域中的一块作为模板,在另一幅图像中搜索与此模板最相似的匹配块,这种算法精度较高,但计算量过大。而设计一种基于灰度相关的算法,既能实现水平、垂直位移上的配准,同时也能实现绕光轴旋转这种情况是本文的核心。

第3章 线匹配法

3.1 线匹配法基本介绍及原理

针对图像的平移、旋转、尺度变换等整体匹配,提出了一种图像线性变换的匹配算法[11]。首先定义待匹配图像匹配点间的线性变换模型,以对应像素灰度差平方和作为图像匹配误差函数,然后借助最小化误差函数确定参数迭代增量,由迭代法求得最佳线性变换参数。为减少计算量与提高收敛速度提出了三种改进策略:增加权函数、图像网格点采样和增加加速运动量。实验显示对于小范围平移、旋转及尺度变换的图像能进行准确快速的整体匹配,而改进策略能有效提高匹配速度。

3.2 线性变换图像匹配模型

令待匹配的两幅二维图像为F 和G ,两幅图像中任意一对匹配点的坐标满足线性变换关系。令图像G 中某一坐标为[,]T X x y =,它与图像F 中的坐标Y 对应21(,)X Y R ?∈。上式中上标T 表示转置运算。坐标X 与Y 之间存在一个偏移量T ,定义如下:

~123456,a a x a y T X a a a x a y ++??=??++??

(3.1) ~

1,,,0,0,0,0,0,0,1,,x y X x y ??=???? (3.2) []123456,,,,,T

a a a a a a a = (3.3) 因此坐标变换可以表示为Y X T =+,即像素()G X 与()F X T +对应。

3.3 线匹配法具体的算法实现

如果给定条件,两幅图像内容整体间存在某种线性变换,则通过求解变换系数能实现配准。这对很多问题是一种合理假设。基于这一思想,为解决图像整体匹配问题,本文针对图像的平移、旋转、尺度变换等整体匹配,提出一种带6个参数的坐标线性变换图像匹配新模型,该模型将匹配误差定义为图像整体误

差,通过最小化误差函数确定参数迭代增量,由迭代法求得最佳线性变换参数。并且针对收敛速度提出了增加权函数、图像网格点采样和增加加速动量项三种策略及具体实现方法。

(1)误差函数及参数求解算法

图像匹配的误差函数定义为:

2[()()]x R

E F X T G X ∈=+-∑, (3.4)

该公式中领域R 与图像G 的分辨率一致。这种领域设置与光流模型的领域设置存在显著不同,它对噪声更不敏感。通过最小化误差函数可以求出变换参数a ,它决定各像素的偏移量0T 为建立迭代求解模型,引入增量a ?,代入式(3.1)得到T ?,新的模型如下:

6121,,a R T R ???∈?∈ (3.5)

2[()()]x R

E F X T T G X ∈=++?-∑ (3.6)

为求解增量a ?,上述函数需要对a ?求偏导。一种可行方法是将F 函数一阶泰勒展开:

'()()()F X T T F X T F X T T ++?≈+++?? (3.7)

上式中点号表示积。将(3.7)代入(3.6),对a ?求偏导,并令偏导为零,则得到下式:

~~~'[(')(')](()())T T T

T

X R X R X F X F a G X F X T X F ∈∈?=-+∑∑ (3.8) 上式中'F 表示'()F X T +,它用图像F 中坐标X+T 处得灰度梯度近似。~'T

X F 表示六维列向量。求a ?只需对方程(3.8)乘以~~[(')(')]T T T X R X F X F ∈∑的逆矩阵即可。

(2)迭代方法求解变换参数

求解图像G 与图像F 间的匹配,可以用增量迭代法计算变换参数a 向量,算法如下:

①初始化a 向量为零向量;

②按式(3.8)计算参数增量a ?;

③更新参数:a a a a =+?;

④如果a ?的二范数小于某一阈值,则表示迭代收敛,程序退出;若大于该阈值则转到步骤②继续迭代;如果迭代次数超过最多限定次数则程序退出,提示不

收敛。判断收敛的条件也可设置为最近n次迭代a

?的二范数之和小于某一阈值,n的典型取值为3。

3.4实验结果和分析

首先利用配准图像库中的图像,生成具有不同相对位移的子图像;平移配准参数可以在程序中进行调整,图3.1及图3.2为配准参数为112,112

==时生

rx cy

成一对尺寸为400×400的两幅图像。

图3.1 Lena参考图像图3.2 Lena 待配准图像图3.3及图3.4为配准参数为224;224

==时生成尺寸为288×288的两

rx cy

幅图像。

图3.3 Lena参考图像图3.4 Lena 待配准图像

图3.5及图3.6为配准参数为56;56

==生成尺寸为456×456的两幅图

rx cy

像。

图3.5 Lena参考图像图3.6 Lena 待配准图像图3.7为采用线模板匹配方法的实验结果。黑色线段表示选取的线模板,连线表示线段两端点为匹配点对。

图3.7 Lena线匹配效果图

由实验可知,线模板匹配是在参考图像中选定一行上取出部分像素的灰度值,在搜索图中搜索最佳匹配。线匹配法的优点是精确直观,缺点是操作复杂,重复步骤较多,实用性不强。它只能处理简单的平移变换下的图像配准,容易受光照的影响,不能实现图像旋转和缩放情况下的配准,故而存在一定的局限性,适用性不强。

第4章 比值匹配法

4.1 比值匹配法基本介绍及原理

比值匹配法[12]算法思路是利用图像中两列上的部分像素的比值作为模板,即在参考图像()a 的重叠区域中分别在两列上取出部分像素,用它们的比值作为模板,然后在搜索图()b 中搜索最佳的匹配。匹配的过程是在搜索图()b 中,由左至右依次从间距相同的两列上取出部分像素,并逐一计算其对应像素值比值;然后将这些比值依次与模板进行比较,其最小差值对应的列就是最佳匹配。这样在比较中只利用了一组数据,而这组数据利用了两列像素及其所包含的信息。

图4.1为图像模板选取示意图,其中,图1 ()a 为1()W H ?像素的图像,图1 ()b 为2()W H ?像素的图像,1W 和2W 可相等,也可不等。图1()a 和图1()b 为左右重叠关系,图1()a 在图1()b 的左边。

j j+span j j+span

()a 1()W H ?像素的图像 ()b 2()W H ?像素的图像

图4.1 图像模板选取示意图

在图4.1()a 的重叠区域选取间隔为span 的2列像素(第j 列和第j span +列),计算其对应像素比值,即a 为模板。

11()(,)/(,())a i P i j P i j span =+ (4.1)

式中,(1,)i H ∈,j 为选定的列。

在图4.1()b 中从第1列开始依次取间隔为span 的2列,计算其对应像素的比值,即为b 模板。

2122(,)(,)/(,)b i j P i j P i j = (4.2)

计算a 模板与b 模板差值,即为c 模板,函数表达式为:

2(,)((,)/(,))c i j a i j b i j = (4.3)

式中,(1,)i H ∈,2(1,)j W span ∈-。c 为二维数组,对c 对应的列向量求得到sum 。

1()(,)H

i sum j c i j ==∑ (4.4)

()sum j 的大小就反映图1所示图像选定像素对应列的差异,()sum j 的最小值min sum 对应的列坐标min Collable 即为最佳匹配。

4.2 比值匹配法具体的算法实现

该算法的具体实现步骤如下:

(1) 在参考图像()a 中间隔为c 个像素的距离上的两列像素中,各取m 个像素,计算这m 个像素的比值,将m 个比值存入数组中,将其作为比较的模板。

(2) 从搜索图()b 中在同样相隔c 个像素的距离上的两列,各取出m n +个像素,计算其比值,将m n +个比值存入数组。假定垂直错开距离不超过n 个像素,多取的n 个像素则可以解决图像垂直方向上的交错问题。

(3) 利用参考图像()a 中的比值模板在搜索图()b 中寻找相应的匹配。首先进行垂直方向上的比较,即记录下搜索图()b 中每个比值数组内的最佳匹配。再将每个数组的组内最佳匹配进行比较,即进行水平方向的比较,得到的最小值就认为是全局最佳匹配。此时全局最佳匹配即为图像间在水平方向上的偏移距离,该全局最佳匹配队应的组内最佳匹配即为图像间垂直方向上的偏移距离。

本算法的思路是在第1幅图像的重叠区域中分别在2列取出部分像素,用它们的比值作为模板;在第2幅图像中由左至右依次从间距相同2列取出部分像素,并逐一计算其对应像素值比值;然后将这些比值依次与模板进行比较,其最小差值所对应的列就是最佳匹配。

4.3 实验结果和分析

以下是光照效果由弱到强的比值匹配仿真实验结果图。比值匹配和线匹配相比不同之处是通过不同亮度的调节可检测到配准参数,由此可以看出它们的区别。比值匹配是利用两条线段的比值进行匹配。灰度比值匹配法较线匹配法多了一项光照对平移参数的影响,下面我们以平移参数为主,着重研究输入图

像存在亮度差异时,仿真图像配准的实验效果。

图4.2为待配准图像与参考图像之间存在亮度差异为-20%时的配准效果图。

图4.2 Lena灰度比值匹配图(亮度差异-20%)

图4.3为待配准图像与参考图像之间存在亮度差异为+5%时的配准效果图。

图4.3 Lena灰度比值匹配图(亮度差异+5%)

图4.4为待配准图像与参考图像之间存在亮度差异为+20%时的配准效果图。

图4.4 Lena灰度比值匹配图(亮度差异+20%)

由图4.2-图4.4可以看出灰度比值匹配的优缺点如下:

(1)比值匹配法的优点:

a.算法思路清晰简单,容易理解,实现起来比较方便。

b.匹配计算的时候,计算量小,速度快。

(2) 比值匹配法的缺点:

a.利用图像的特征信息太少。只利用了两条竖直的平行特征线段的像素的信息,没有能够充分利用了图像重叠区域的大部分特征信息。虽然算法提到,在搜索图()b中由左至右依次从间距相同的两列上取出部分像素,计算其对应像素的比值,然后将这些比值依次与模版进行比较,好像是利用了搜索图()b中的重叠区域的大部分图像信息,但在参考图像()a中,只是任意选择了两条特征线,没有充分利用到参考图像()a的重叠区域的特征信息。

b.对图片的采集提出了较高的要求。此算法对照片先进行垂直方向上的比较,然后再进行水平方向上的比较,这样可以解决上下较小的错开问题。在采集的时候只能使照相机在水平方向上移动。然而,有时候不可避免的照相机镜头会有小角度的旋转,使得拍摄出来的照片有一定的旋转,在这个算法中是无法解决的。而且对重叠区域无明显特征的图像,比较背景是海洋或者天空,这样在选取特征模版的时候存在很大的问题。由于照片中存在大块纹理相同的部分,所以与模版的差别就不大,这样有很多匹配点,很容易造成误匹配。

c.不易对两条特征线以及特征线之间的距离进行确定。算法中在参考图像()a的重叠区域中取出两列像素上的部分像素,并没有给出选择的限制。然而在利用拼接算法实现自动拼接的时候,如果选取的特征线不是很恰当,那么这样的特征线算出来的模版就失去了作为模版的意义。同时,在确定特征线间距时,选的过大,则不能充分利用重叠区域的图像信息。选择的过小,则计算量太大。

第5章 块匹配法

5.1 块匹配法基本介绍及原理

块匹配法[13]是指将待配准图像的正方形区域的像素的集合作为模板。块匹配法是以一幅图像重叠区域中的一块作为模板,在另一幅图像中搜索与此模板最相似的匹配块,这种算法精度较高,但计算量过大。

灰度信息包含了最大量的图像信息,而边缘信息则反映了图像内在的性质,它不易受外界光照条件的影响而产生剧烈的变化。因此相比灰度信息,边缘信息,使得其抗灰度和几何畸变能力强,采用边缘信息构建模板在图像拼接[17]中可获得更加可靠的稳定性。因此我们以图像的边缘为特征寻找基准块。

应用块匹配算法,首先要有搜索最佳匹配的标准,这里称之为价值函数:均方误差(MSE)、绝对误差和(SAD)、平均绝对误差(MAD)、方差和(SSE)、绝对变化误差和(SATD)都可以作为价值函数。其中常用的是均方误差(MSE)和平均绝对误差(MAD),如方程(1)和(2)。其中N 为块边长像素数(为方便搜索块一般划分为正方形),Cij 和Rij 分别为当前宏块和参考宏块相应像素的灰度。

11

2200

1()N N ij ij i j MSE C R N --===-∑∑, (5.1) 11

200

1N N ij ij i j MAD C R N --===-∑∑, (5.2) 具体步骤首先要将当前和参考帧图像分块,选取的参考帧为当前帧的前一帧,一般宏块为16×16 像素大小,然后确定搜索范围大小,一般为以宏块为中心的30×30 像素区域,最后在参考图像相应搜索区域中寻找价值函数最小的宏块,运动矢量从参考宏块位置指向当前宏块位置,如图5.1所示。

图5.1 块匹配原理

5.2 块匹配法具体的算法实现

首先需要对图像进行边缘检测,这里我们使用sobel 算子获得原图像的边缘图(,)E i j ,然后我们以图像中每个像素点的邻域边缘量()NEA 来定义此位置的边缘信息大小:

(,)(,)A A

m A n A NEA i j E i m j n =-=-=

++∑∑, (5.3) 其中,(,)E i j 为原图像所对应的二值边缘图,A 为在点(,)i j 处所取邻域的1/2边长。以(,)NEA i j 值为依据,找出最大值所对应的点(,)i j 作为基准点,然后以此点为中心点选择大小适中的块就可以找到基准特征块[14]。这种算法我们可以称之为传统的块匹配算法。

具体步骤首先要将当前和参考帧图像分块,选取的参考帧为当前帧的前一帧,一般宏块为16×16 像素大小,然后确定搜索范围大小,一般为以宏块为中心的30×30 像素区域,最后在参考图像相应搜索区域中寻找价值函数最小的宏块,运动矢量从参考宏块位置指向当前宏块位置。

5.3 实验结果和分析

通过三、四章的阐述,我们已经得出线匹配法只能处理平移操作下的图像配准,而灰度比值法在线匹配法的基础上多了一个光照变换对平移参数的影

响。这两种算法都存在自身的不足,那就是不能实现图像在旋转、缩放情况下的配准。由此我们研究一种更加完善的匹配法——块匹配法,它不仅能实现水平、垂直方向上位移变化的图像配准,同时也能在小的图像旋转缩放变形的情况下的实现配准。图5.2是块匹配的效果图,接下来我们将具体描述平移、旋转和缩放情况下的图像配准。首先利用对图像做小的旋转、缩放,再进行配准,旋转情况下研究旋转对求得平移参数的影响,缩放情况下研究配准参数的误差情况。

图5.2 Lena块匹配效果图

5.3.1构造平移、旋转、缩放图像

利用Lena彩色图像的灰度处理,将生成的灰度图像做小的旋转,缩放,在Matlab上实现图像的微小变化,运行结果如下:

图5.2 选用Lena原图图5.3 Lena灰度处理后

赵宇凡开题报告-基于图像特征提取与匹配的目标识别系统设计

北京联合大学毕业设计(论文)开题报告 题目:基于图像特征提取与匹配的目标识别系统设计 专业:通信工程指导教师:韩玺 学院:信息学院学号:30 班级:2008080304430姓名:赵宇凡 一、课题任务与目的 1、课题的主要任务:以DSP平台为系统硬件平台,并基于DM6437为处理器核心,设计硬件原理图,编写特征点提取算法,使系统通过特征点匹配对静态目标进行识别。 2、课题的主要目的:设计并实现一个功能完整,操作简单的目标识别系统,使其能够对静态图像目标进行特征提取与匹配,从而进行目标识别。 二、调研资料情况 1、课题的学术状态: (1)DM6437关键特性 时钟频率达600MHz,1个TVP5146M2视频解码器4个视频DACV输出,128MDDR2DRAM,提供16M non-volatile flash memory, 64M NAND flash, 2M SRAM 提供UART, CAN,I/O接口,AIC33立体音频编码器,10/100 MBS以太网接口,可配置的boot load选项,嵌入式的JTAG仿真器接口,4个用户LEDs及4个用户切换点,提供子板扩展插槽,VLYNQ接口,提供S/PDIF接口。 (2)SIFT算法 从理论上说,SIFT是一种相似不变量,即对图像尺度变化和旋转是不变量。然而,由于构造SIFT特征时,在很多细节上进行了特殊处理,使得SIFT对图像的复杂变形和光照变化具有了较强的适应性,同时运算速度比较快,定位精度比较高。如:在多尺度空间采用DOG算子检测关键点,运算速度大大加快;关键点的精确定位不仅提高了精度,而且大大提高了关键点的稳定性;在构造描述子时,以子区域的统计特性,而不是以单个像素作为研究对象,提高了对图像局部变形的适应能力;对于16*16的关键点邻域和4*4的子区域,在处理梯度幅度时都进行了类似于高斯函数的加权处理,强化了中心区域,淡化了边缘区域的影响,从而提高了算法对几何变形的适应性;该方法不仅对通用的线

数字图像处理技术试题答案

数字图像处理技术试题库 一、单项选择题:(本大题 小题, 2分/每小题,共 分) 1.自然界中的所有颜色都可以由()组成 A.红蓝绿 B.红黄绿 C.红黄蓝绿 D.红黄蓝紫白 2. 有一个长宽各为200个象素,颜色数为16色的彩色图,每一个象素都用R(红)、G(绿)、B(蓝)三个分量表示,则需要()字节来表示 A.100 B.200 C.300 D. 400 3.颜色数为16种的彩色图,R(红)、G(绿)、B(蓝)三个分量分别由1个字节表示,则调色板需要()字节来表示 A.48 B.60 C.30 D. 40 4.下面哪一个不属于bmp 文件的组成部分 A .位图文件信息头 B. 位图文件头 C.调色板 D. 数据库标示 5.位图中,最小分辨单元是 A.像素 B.图元 C.文件头 D.厘米 6.真彩色的颜色数为 A.888?? B. 161616?? C.128128128?? D.256256256?? 7.如果图像中出现了与相邻像素点值区别很大的一个点,即噪声,则可以通过以下方式去除 A.平滑 B.锐化 C. 坐标旋转 D. 坐标平移 8.下面哪一个选项不属于图像的几何变换() A.平移 B.旋转 C. 镜像 D. 锐化 9.设平移量为x x t t (,),则平移矩阵为() A .1 0 00 1 0 1x y t t ?????????? B. 1 0 00 -1 0 1x y t t ??-???????? C.1 0 00 1 0 - 1x y t t ????????-?? D.1 0 00 1 0 - -1x y t t ?????????? 10.设旋转角度为a ,则旋转变换矩阵为() A .cos() sin() 0sin() cos() 00 0 1a a a a -?????????? B .cos() sin() 0sin() cos() 00 0 1a a a a ?????????? C .sin() cos() 0 sin() cos() 0 0 0 1a a a a -?????????? D .cos() sin() 0sin() cos() 00 0 1a a a a -????-?????? 11.下面哪一个选项是锐化模板 A .-1 -1 -1-1 9 -1-1 -1 -1??????????g B .-1 -1 -1-1 -9 -1-1 -1 -1??????????g C .-1 -1 -1-1 8 -1-1 -1 -1??????????g D .-1 -1 -1-1 6 -1-1 -1 -1?????????? g 12.真彩色所能表示的颜色数目是 A .128128? B .256256256 ?? C .256 D .6059

基于matlab的图像识别与匹配

基于matlab的图像识别与匹配 摘要 图像的识别与匹配是立体视觉的一个重要分支,该项技术被广泛应用在航空测绘,星球探测机器人导航以及三维重建等领域。 本文意在熟练运用图像的识别与匹配的方法,为此本文使用一个包装袋并对上面的数字进行识别与匹配。首先在包装袋上提取出来要用的数字,然后提取出该数字与包装袋上的特征点,用SIFT方法对两幅图进行识别与匹配,最终得到对应匹配数字的匹配点。仿真结果表明,该方法能够把给定数字与包装袋上的相同数字进行识别与匹配,得到了良好的实验结果,基本完成了识别与匹配的任务。

1 研究内容 图像识别中的模式识别是一种从大量信息和数据出发,利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别、评价的过程。 图形辨别是图像识别技术的一个重要分支,图形辨别指通过对图形的图像采用特定算法,从而辨别图形或者数字,通过特征点检测,精确定位特征点,通过将模板与图形或数字匹配,根据匹配结果进行辨别。 2 研究意义 数字图像处理在各个领域都有着非常重要的应用,随着数字时代的到来,视频领域的数字化也必将到来,视频图像处理技术也将会发生日新月异的变化。在多媒体技术的各个领域中,视频处理技术占有非常重要的地位,被广泛的使用于农业,智能交通,汽车电子,网络多媒体通信,实时监控系统等诸多方面。因此,现今对技术领域的研究已日趋活跃和繁荣。而图像识别也同样有着更重要的作用。 3 设计原理 3.1 算法选择 Harris 角点检测器对于图像尺度变化非常敏感,这在很大程度上限制了它的应用范围。对于仅存在平移、旋转以及很小尺度变换的图像,基于Harris 特征点的方法都可以得到准确的配准结果,但是对于存在大尺度变换的图像,这一类方法将无法保证正确的配准和拼接。后来,研究人员相继提出了具有尺度不变性的特征点检测方法,具有仿射不变性的特征点检测方法,局部不变性的特征检测方法等大量的基于不变量技术的特征检测方法。 David.Lowe 于2004年在上述算法的基础上,总结了现有的基于不变量技术的特征检测方法,正式提出了一种基于尺度空间的,对图像平移、旋转、缩放、甚至仿射变换保持不变性的图像局部特征,以及基于该特征的描述符。并将这种方法命名为尺度不变特征变换(Scale Invariant Feature Transform),以下简称SIFT 算法。SIFT 算法首先在尺度空间进行特征检测,并确定特征点的位置和特征点所处的尺度,然后使用特征点邻域梯度的主方向作为该特征点的方向特征,以实现算子对尺度和方向的无关性。利用SIFT 算法从图像中提取出的特征可用于同一个物体或场景的可靠匹配,对图像尺度和旋转具有不变性,对光照变化、

非常全非常详细的MATLAB数字图像处理技术

MATLAB数字图像处理 1 概述 BW=dither(I)灰度转成二值图; X=dither(RGB,map)RGB转成灰度图,用户需要提供一个Colormap; [X,map]=gray2ind(I,n)灰度到索引; [X,map]=gray2ind(BW,n)二值图到索引,map可由gray(n)产生。灰度图n默认64,二值图默认2; X=graylice(I,n)灰度图到索引图,门限1/n,2/n,…,(n-1)/n,X=graylice(I,v)给定门限向量v; BW=im2bw(I,level)灰度图I到二值图; BW=im2bw(X,map,level)索引图X到二值图;level是阈值门限,超过像素为1,其余置0,level在[0,1]之间。 BW=im2bw(RGB,level)RGB到二值图; I=ind2gray(X,map)索引图到灰度图; RGB=ind2rgb(X,map)索引图到RGB; I=rgb2gray(RGB)RGB到灰度图。 2 图像运算 2.1 图像的读写 MATLAB支持的图像格式有bmp,gif,ico,jpg,png,cur,pcx,xwd和tif。 读取(imread): [1] A=imread(filename,fmt) [2] [X,map]=imread(filename,fmt) [3] […]=imread(filename) [4] […]=imread(URL,…) 说明:filename是图像文件名,如果不在搜索路径下应是图像的全路径,fmt是图像文件扩展名字符串。前者可读入二值图、灰度图、彩图(主要是RGB);第二个读入索引图,map 为索引图对应的Colormap,即其相关联的颜色映射表,若不是索引图则map为空。URL表示引自Internet URL中的图像。 写入(imwrite): [1] R=imwrite(A,filename,fmt); [2] R=imwrite(X,map,filename,fmt); [3] R=imwrite(…,filename); [4] R=imwrite(…,Param1,V al1,Param2,Val2) 说明:针对第四个,该语句用于指定HDF,JPEG,PBM,PGM,PNG,PPM,TIFF等类型输出文件的不同参数。例如HDF的Quality,Compression,WriteMode;JPEG的BitDepth,Comment:Empty or not,Mode:lossy or lossless,Quality等。 2.2 图像的显示 方法1:使用Image Viewer(图像浏览器),即运用imview函数。 同时显示多帧图像的所有帧,可用到montage函数。

(完整版)图像特征特点及常用的特征提取与匹配方法

图像特征特点及常用的特征提取与匹配方法 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一颜色特征 (一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。 (二)常用的特征提取与匹配方法 (1) 颜色直方图 其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。 最常用的颜色空间:RGB颜色空间、HSV颜色空间。 颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。 (2) 颜色集 颜色直方图法是一种全局颜色特征提取与匹配方法,无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从RGB颜色空间转化成视觉均衡 的颜色空间(如HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进制的颜色索引集。在图像匹配中,比较不同图像颜色集之间的距离和色彩区域的空间关系 (3) 颜色矩

数字图像处理技术练习

数字图像处理技术练习

1. 图像中每个像素点的灰度值如下图所示: 分别求经过邻域平滑模板、邻域高通模板和中值滤波处理后的结果。其中不能 处理的点保持不变如果处理后的值为负数则变为0。邻域平滑模 板01011 14010H ????=??????,邻域高通模板010141010H -????=--????-?? ,中值滤波窗口取3×3矩阵,窗口中心为原点。 2. 图像中每个像素点的灰度值如下图所示: 分别求经过邻域平滑模板、邻域高通模板和中值滤波处理后的结果。其 中不能处理的点保持不变如果处理后的值为负数则变为0。邻域平滑模 板11111018111H ????=??????,邻域高通模板111181111H ---????=--????---?? ,中值滤波窗口取3×3矩阵,窗口中心为原点。 3.设有以下信源符号w1,w2,w3,w4,w5和概率P(w1)=0.3, P(w2)=0.2, P(w3)=0.2, P(w4)=0.2, P(w5)=0.1。请对此信源进行Huffman 编码,并计 算熵,平均码长和编码效率。 (log 20.3= -1.737,log 20.2= -2.322,log 20.1=-3.322) 4.设有以下信源符号w1,w2,w3,w4,w5和概率P(w1)=0.5, P(w2)=0.2, P(w3)=0.1, P(w4)=0.1, P(w5)=0.1, 请对此信源进行Huffman 编码,并计算熵,平均码

幅 4.一个灰度变换形式如下图所示,该灰度变换的作用是( B )。 A .灰度反转 B .二值化 C .灰度均衡 D .对比度增强 5.一个灰度变换形式如下图所示,该灰度变换的作用是( A )。 A .灰度反转 B .二值化 C .灰度均衡 D .对比度增强 6.一个三段线性变换如下图所示,横轴表示原始灰度,纵轴表示变换后灰度。以下关于该变换的说法错误的是( A )。 A .(0,80)区间的灰度对比度增强 B .(80,130)区间的灰度对比度增强 C .(130,255)区间的灰度对比度降低 D .变换后的灰度的区间还是(0,255) 7.将灰度或单一波段的图像变换为彩色图像,从而把人眼不能区分的微小的灰度差别显示为明显的彩色差异。这种处理方法称为( C )。 A .真彩色增强 B .假彩色增强 C .伪彩色增强 D .彩色图像灰度化 8.灰度图像的高帽变换的定义为THT()()f f f g =-,该变换的作用是0 320255

仪表显示的图像识别算法研究

仪表显示的图像识别算法研究 摘要:随着社会的逐渐发展,人类的生活越来越趋于智能化。本文根据当今社会对于图像识别研究的发展现状,针对目前人们生活中人工读表的弊端,提出了通过采集仪表显示的图像并进行图像识别算法处理来达到智能自动读表的方法。 为了能快速获得采集数据,减少人们生活中繁复的人工作业。本文通过多样的图像处理来代替人眼识别图像。只需要得到采集到的图像,就可以利用计算机来进行计算和识别,得出最后的数字。本文采用了一系列的图像处理方法,包括图像的去噪,二值化分割,边缘检测和基于数学形态学的膨胀腐蚀操作等。同时通过多种尝试和比较各种方法的优缺点得到了一套简易而又完善,快速的图像识别算法。 在进行多次测试试验后,本文采用数码相机来进行图像的采集,同时经过图像预处理、图像分割、图像识别等一系列流程得出了较为完善的图像采集和识别系统,为未来信息传递智能化提供了基础,对于促进工业发展或是改善生活水平都有重要的意义。 关键词:图像预处理、二值化、边缘检测、形态学、去噪、图像分割、图像匹配 The research of image recognition displayed by the instrument Abstract: With the continuous development of society, people's lives become more and more intelligent. Based on the current development in today's society for the study of image recognition, according to the present disadvantages of manual meter reading in peop le’s lives, this page proposed the way by collecting the instruments display image and then deals it with image recognizing algorithms to achieve intelligent automatic meter. In order to quickly gather data, reducing manual work in people’s lives complicated. The page uses a series of image processing to replace human eye image recognition. Just need the collected images, we can use a computer to calculate and identify, then we will arrive at a final figure. We used a variety of image processing methods, including image denoising, thresholding segmentation, expansion of edge-detection based on mathematical morphology and corrosion and so on. And

视觉检测原理介绍

技术细节 本项目应用了嵌入式中央控制及工业级图像高速传输控制技术,基于CCD/CMOS与DSP/FPGA的图像识别与处理技术,成功建立了光电检测系统。应用模糊控制的精选参数自整定技术,使系统具有对精确检测的自适应调整,实现产品的自动分选功能。 图1 控制系统流程图 光电检测系统主要通过检测被检物的一些特征参数(灰度分布,RGB分值等),从而将缺陷信息从物体中准确地识别出来,通过后续的系统进行下一步操作,主要分为以下几部分 CCD/CMOS图像采集部分 系统图像数据采集处理板中光信号检测元件CCD/CMOS采用进口的适合于高精度检测的动态分析单路输出型、保证实际数据输出速率为320MB/s的面阵CCD/CMOS。像素分别为4000*3000和1600*1200,帧率达到10FPS。使用CCD/CMOS 作为输入图像传感器,从而实现了图像信息从空间域到时间域的变换。为了保证所需的检测精度,需要确定合理的分辨率。根据被检测产品的大小,初步确定系统设计分辨率为像素为0.2mm。将CCD/CMOS接收的光强信号转换成电压幅值,再经过A/D转换后由DSP/ FPGA芯片进行信号采集,即视频信号的量化处理过程,图像采集处理过程如图所示:

图2 图像采集处理过程 数据处理部分 在自动检测中,是利用基于分割的图像匹配算法来进行图像的配对为基础的。图像分割的任务是将图像分解成互不相交的一些区域,每一个区域都满足特定区域的一致性,且是连通的,不同的区域有某种显著的差异性。分割后根据每个区域的特征来进行图像匹配,基于特征的匹配方法一般分为四个步骤:特征检测、建立特征描述、特征匹配、利用匹配的“特征对”求取图像配准模型参数。 算法基本步骤如下: 1)利用图像的色彩、灰度、边缘、纹理等信息对异源图像分别进行分割,提取区域特征; 2)进行搜索匹配,在每一匹配位置将实时图与基准图的分割结果进行融合,得到综合分割结果; 3)利用分割相似度描述或最小新增边缘准则找出正确匹配位置。 设实时图像分割为m个区域,用符号{A1,A2,… Am}表示,其异源基准图像分割为n个区域,用符号{B1,B2,…Bn}表示。分割结果融合方法如下: 在每一个匹配位置,即假设的图像点对应关系成立时,图像点既位于实时图中,又位于其异源基准图像中,则融合后区域点的标识记为:(A1B1,A1B2,…,A2B1,A2B2,…)。标识AiBj表示该点在实时图中位于区域i,在基准图中位于区域j。算法匹配过程如下图所示:

图像特征特点及其常用的特征提取与匹配方法

图像特征特点及其常用的特征提取与匹配方法 [ 2006-9-22 15:53:00 | By: 天若有情 ] 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一颜色特征 (一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。 (二)常用的特征提取与匹配方法 (1)颜色直方图 其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。 最常用的颜色空间:RGB颜色空间、HSV颜色空间。 颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。 (2)颜色集 颜色直方图法是一种全局颜色特征提取与匹配方法,无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从RGB颜色空间转化成视觉均衡的颜色空间(如HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进制的颜色索引集。在图像匹配中,比较不同图像颜色集之间的距离和色彩区域的空间关系 (3)颜色矩 这种方法的数学基础在于:图像中任何的颜色分布均可以用它的矩来表示。此外,由于颜色分布信息主要集中在低阶矩中,因此,仅采用颜色的一阶矩(m ean)、二阶矩(variance)和三阶矩(skewness)就足以表达图像的颜色分布。(4)颜色聚合向量 其核心思想是:将属于直方图每一个柄的像素分成两部分,如果该柄内的某些像素所占据的连续区域的面积大于给定的阈值,则该区域内的像素作为聚合像素,否则作为非聚合像素。 (5)颜色相关图 二纹理特征 (一)特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局

数字图像处理技术现状及发展趋势

数字图像处理技术现状及发展趋势 摘要现今是计算机技术、网络技术以及多媒体技术高速发展的时代,更多高科技技术正在全面发展,数字图像处理技术作为一种新式技术,如今已经广泛地应用于人们的生产生活中。数字图像处理技术的应用和发展为人们的生活发展带来了很多的便利,在遥感技术、工业检测方面发展迅速,在医学领域,气象通信领域也有很大的成就。由此,本文主要探讨数字图像处理技术的现状及发展趋势。 关键词数字图像处理技术;现状;发展趋势 现今是计算机和网络技术高速发展的时代,计算机的应用给人们的生产生活带来了很大的便利,人们应用计算机处理各种复杂的数据,将传统方式不能处理的问题以全新的技术和方式有效解决[1]。数字图像处理技术是应用较为广泛的一种技术,在具体应用过程中,能够经过增强、复原、分割等过程对数据进行处理,且具有多样性、精度高、处理量大的显著优势,本文对数字图像处理技术的现状及发展趋势进行研究和探讨。 1 数字图像处理技术发展现状 数字图像处理技术是近年来发展较为迅速的一种技术,具体是指应用计算机对图像进行一系列的处理,最终达到人们要求的水平,在具体的处理过程中,以改善图像的视觉效果为核心,最终呈现出人们想要表达的意思。笔者查阅国内外诸多文献库,发现对数字图像处理技术的研究多数集中于图像数字化、图像增强、图像还原、图像分割等领域[2]。最初数字图像处理技术产生于20世纪20年代,当时普遍将其应用于报纸业,发展至20世纪50年代,图像处理技术跟随着计算机的发展而迅速发展,也有更多的人开始关注和应用该技术,当时在各国的太空计划中发挥了巨大作用,尤其是对月球照片的处理,获得了很大的成功。发展到20世纪70年代时,数字图像处理技术的应用已经很普遍了,尤其是在计算机断层扫面(CT)等方面,该技术的应用得到了一致好评,而现今,数字图像处理技术随处可见,已广泛应用在各行各业中。 2 数字图像处理技术的特点 数字图像处理技术有以下几个特点:①图像处理的多样性特点。数字图像处理技术可以编写多样的算法,以不同的程序模式施加于数字图像技术上,根据实际需求对图像进行处理,因此最终获取的图像效果也截然不同。②图像处理精度高。应用数字图像处理技术处理的图像,其精度和再现性都提高了一个层次,尤其是在各种算法和程序的支撑下,进一步确保了计算的精度和正确性。③交叉融合了多门学科和新技术。数字图像处理的应用基础包含了众多学科和技术,其中数学和物理是关键,而通信、计算机、电子等技术则是确保其处理质量的关键技术。④数据处理量大[3]。图像本身就包含了大量的信息,数字图像处理技术可以更好地区分有用信息和冗余信息,从而获取处理的关键性信息。

数字图像处理中的边缘检测技术

课程设计报告 设计题目:数字图像处理中的边缘检测技术学院: 专业: 班级:学号: 学生姓名: 电子邮件: 时间:年月 成绩: 指导教师:

数字图像处理中的边缘检测技术课程设计报告I 目录 1 前言:查阅相关文献资料,了解和掌握基本原理、方法和研究现状,以及实际应用的背景意义 (1) 1.1理论背景 (1) 1.2图像边缘检测技术研究的目的和意义 (1) 1.3国内外研究现状分析 (2) 1.4常用边缘检测方法的基本原理 (3) 2 小波变换和小波包的边缘检测、基于数学形态学的边缘检测法算法原理 (7) 2.1 小波边缘检测的原理 (7) 2.2 数学形态学的边缘检测方法的原理 (7) 3 算法实现部分:程序设计的流程图及其描述 (9) 3.1 小波变换的多尺度边缘检测程序设计算法流程图 (9) 3.2 数学形态学的边缘检测方法程序设计算法描述 (10) 4实验部分:对所给的原始图像进行对比实验,给出相应的实验数据和处理结果 (11) 5分析及结论:对实验结果进行分析比较,最后得出相应的结论 (15) 参考文献 (17) 附录:代码 (18)

1前言 查阅相关文献资料,了解和掌握基本原理、方法和研究现状,以及实际应用的背景意义 1.1 理论背景 图像处理就是对图像信息加工以满足人的视觉心理或应用需求的方法。图像处理方法有光学方法和电子学方法。从20世纪60年代起随着电子计算机和计算技术的不断提高和普及,数字图像处理进入了高速发展时期,而数字图像处理就是利用数字计算机或其它的硬件设备对图像信息转换而得到的电信号进行某些数学处理以提高图像的实用性。 图像处理在遥感技术,医学领域,安全领域,工业生产中有着广泛的应用,其中在医学应用中的超声、核磁共振和CT等技术,安全领域的模式识别技术,工业中的无损检测技术尤其引人注目。 计算机进行图像处理一般有两个目的:(1)产生更适合人观察和识别的图像。 (2)希望能由计算机自动识别和理解图像。数字图像的边缘检测是图像分割、目标区域的识别、区域形状提取等图像分析领域的重要基础,图像处理和分析的第一步往往就是边缘检测。 物体的边缘是以图像的局部特征不连续的形式出现的,也就是指图像局部亮度变化最显著的部分,例如灰度值的突变、颜色的突变、纹理结构的突变等,同时物体的边缘也是不同区域的分界处。图像边缘有方向和幅度两个特性,通常沿边缘的走向灰度变化平缓,垂直于边缘走向的像素灰度变化剧烈。根据灰度变化的特点,图像边缘可分为阶跃型、房顶型和凸缘型。 1.2 图像边缘检测技术研究的目的和意义 数字图像处理是伴随着计算机发展起来的一门新兴学科,随着计算机硬件、软件的高度发展,数字图像处理也在生活中的各个领域得到了广泛的应用。边缘检测技术是图像处理和计算机视觉等领域最基本的技术,如何快速、精确的提取图像边缘信息一直是国内外研究的热点,然而边缘检测也是图像处理中的一个难题。 首先要研究图像边缘检测,就要先研究图像去噪和图像锐化。前者是为了得到飞更真实的图像,排除外界的干扰,后者则是为我们的边缘检测提供图像特征更加明显的图片,即加大图像特征。两者虽然在图像处理中都有重要地位,但本次研究主要是针对图像边缘检测的研究,我们最终所要达到的目的是为了处理速

基于特征的图像匹配算法-毕业论文含源代码

诚信声明 本人声明: 我所呈交的本科毕业设计论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致中所罗列的容以外,论文中不包含其他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了意。本人完全意识到本声明的法律结果由本人承担。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:日期:2010 年05 月20日

毕业设计(论文)任务书 设计(论文)题目: 学院:专业:班级: 学生指导教师(含职称):专业负责人: 1.设计(论文)的主要任务及目标 (1) 了解图象匹配技术的发展和应用情况,尤其是基于特征的图象匹配技术的发展和应用。 (2) 学习并掌握图像匹配方法,按要求完成算法 2.设计(论文)的基本要求和容 (1)查阅相关中、英文文献,完成5000汉字的与设计容有关的英文资料的翻译。(2)查阅15篇以上参考文献,其中至少5篇为外文文献,对目前国外图象匹配技术的发展和应用进行全面综述。 (3)学习图象匹配算法,尤其是基于特征的图象匹配算法。 (4)实现并分析至少两种基于特征的图象匹配算法,并分析算法性能。 3.主要参考文献 [1]谭磊, 桦, 薛彦斌.一种基于特征点的图像匹配算法[J].天津理工大学报,2006, 22(6),66-69. [2]甘进,王晓丹,权文.基于特征点的快速匹配算法[J].电光与控制,2009,16(2), 65-66. [3]王军,明柱.图像匹配算法的研究进展[J].大气与环境光学学报,2007,2(1), 12-15.

4

数字图像处理技术的现状及其发展方向(笔记)

数字图像处理技术的现状及其发展方向 一、数字图像处理历史发展 数字图像处理(Digital Image Processing)将图像信号转换成数字信号并利用计算机对其进行处理。 1.起源于20世纪20年代。 2.数字图像处理作为一门学科形成于20世纪60年代初期,美国喷气推进实验室(JPL)推动了数字图像处理这门学科的诞生。 3.1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置即CT(Computer Tomograph),1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。 4.从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展,人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论。 二、数字图像处理的主要特点 1.目前数字图像处理的信息大多是二维信息,处理信息量很大,对计算机的计算速度、存储容量等要求较高。 2.数字图像处理占用的频带较宽,在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本也高,这就对频带压缩技术提出了更高的要求。 3.数字图像中各个像素是不独立的,其相关性大。因此,图像处理中信息压缩的潜力很大。 4.由于图像是三维景物的二维投影,一幅图像本身不具备复现三维景物的全部几何信息的能力,要分析和理解三维景物必须作合适的假定或附加新的测量。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。 5.一方面,数字图像处理后的图像一般是给人观察和评价的,因此受人的因素影响较大,作为图像质量的评价还有待进一步深入的研究;另一方面,计算机视觉是模仿人的视觉,人的感知机理必然影响着计算机视觉的研究,这些都是心理学和神经心理学正在着力研究的课题。 三、数字图像处理的优点 1.再现性好;图像的存储、传输或复制等一系列变换操作不会导致图像质量的退化。 2.处理精度高;可将一幅模拟图像数字化为任意大小的二维数组,现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高。 3.适用面宽;图像可以来自多种信息源,图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像组合而成,因而均可用计算机来处理。 4.灵活性高;数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。 四、数字图像处理过程及其主要进展 常见的数字图像处理有:图像的采集、数字化、编码、增强、恢复、变换、

图像识别匹配技术原理

第1章绪论 1?1研究背景及意义 数字图像,又称数码图像或数位图像,是二维图像用有限数字数值像素的表示。通常,像素在计算机中保存为二维整数数组的光栅图像,这些值经常用压缩格式进行传输和储存。数字图像可以由许多不同的输入设备和技术生成,例如数码相机、扫描仪、坐标测量机等,也可以从任意的非图像数据合成得到,例如数学函数或者三维几何模型,三维几何模型是计算机图形学的一个主要分支。数字图像处理领域就是研究它们的变换算法。 数字图像处理(Digital Image Process in g)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理的产生和迅速发展主要受三个因素的影响:一是计算机的发展;二是数学的发展(特别是离散数学理论的创立和完善);三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。 图像配准(Image registration)就是将不同时间、不同传感器(成像设备)或不同条件下(天候、照度、摄像位置和角度等)获取的两幅或多幅图像进行匹配、叠加的过程,它已经被广泛地应用于遥感数据分析、计算机视觉、图像处理等领域。 图像配准的方法迄今为止,在国内外的图像处理研究领域,已经报道了相当多的图像配准研究工作,产生了不少图像配准方法。总的来说,各种方法都是面向一定范围的应用领域,也具有各自的特点。比如计算机视觉中的景物匹配和飞行器定位系统中的地图匹配,依据其完成的主要功能而被称为目标检测与定位,根据其所采用的算法称之为图像相关等等。 基于灰度信息的图像配准方法一般不需要对图像进行复杂的预先处理,而是利用图像本身具有灰度的一些统计信息来度量图像的相似程度。主要特点是实现简单,但应用范围较窄,不能直接用于校正图像的非线性形变,在最优变换的搜索过程中往往需要巨大的运算量。经过几十年的发展,人们提出了许多基于灰度信息的图像配准方法,大致可以分为三类:互相关法(也称模板匹配法)、序贯相似度检测匹配法、交互信息法。 目前主要图像配准方法有基于互信息的配准方法,基于相关性的配准方法和基

数字图像处理参考教材

数字图像处理参考教材 (Digital Image Processing ,Computer Image Processing)I.通用教材 I.1 容观澳,清华讲义,计算机图像处理, 2000年版, Pages 351 这是清华一本较早的教材,针对基本概念和方法,系统知识。 特点:1)着重本领域的基本概念、基本方法和系统知识。 2)理论结合实验,避开过多数学推导, 3) 重点介绍算法,免编程。这也是我们本科采取的策略。 内容:1)基本内容(有关图像数学、视觉、光学以及二维变换的基本理论2)图像改善:重点介绍图像增强,图像复原,还有图像重建 3)图像的上网、传输、压缩 4)图像的理解、分割、描述 5)图像的硬件系统设计 I.2 李介谷等,上海交大版,88年版,数字图像处理Pages 278 较早。全面介绍了图像处理的一些模型和算法,主要内容;数字图像的特征、品质及视觉;图像的增强处理;图像修复;图像重建;图像分析和理解;图像信息的编码和压缩。 对基本理论和基本技术介绍全面。 I.3 阮秋琦,电子工业版,01年版,数字图像处理学 Pages 562 主要内容:图像处理中的正交变换、图像增强、图像编码、图像复原、图像重建、图像分析、模式识别等。偏重于基本理论和方法。这本书强调了编码的内容。 全书强调基本理论和基本技术,有较多习题,附一套实验演示软件。 北方交大教材。 I.4 黄贤武等,电子科技大学版,2000年,数字图像处理与压缩编码技术, Pages538 主要加重了图像数据压缩技术的份量-这是多媒体处理技术的关键技术之一。对图形模式识别技术、无损压缩编码技术、预测编码、图像的变换编码、神

人脸识别主要算法原理

人脸识别主要算法原理 主流的技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他结合才能有比较好的效果; 2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。 1. 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。

可变形模板法可以视为几何特征方法的一种改进,其基本思想是:设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。 2. 局部特征分析方法(Local Face Analysis) 主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识别方法。这种方法在实际应用取得了很好的效果,它构成了FaceIt人脸识别软件的基础。 3. 特征脸方法(Eigenface或PCA)

人脸识别主要算法原理

人脸识别主要算法原理 主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果; 2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。 1. 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧 面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。

可变形模板法可以视为几何特征方法的一种改进,其基本思想是: 设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。 2. 局部特征分析方法(Local Face Analysis) 主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识别方法。这种方法在实际应用取得了很好的效果,它构成了FaceIt人脸识别软件的 基础。 3. 特征脸方法(Eigenface或PCA)

数字图像处理课程心得讲课讲稿

数字图像处理课程心得 本学期,我有幸学习了数字图像处理这门课程,这也是我大学学习中的最后一门课程,因此这门课有着特殊的意义。人类传递信息的主要媒介是语音和图像。据统计,在人类接受的信息中,听觉信息占20%,视觉信息占60%,其它如味觉、触觉、嗅觉信息总的加起来不过占20%。可见图像信息是十分重要的。通过十二周的努力学习,我深刻认识到数字图像处理对于我的专业能力提升有着比较重要的作用,我们可以运用Matlab对图像信息进行加工,从而满足了我们的心理、视觉或者应用的需求,达到所需图像效果。 数字图像处理起源于20世纪20年代,当时通过海底电缆从英国伦敦到美国纽约采用数字压缩技术传输了第一幅数字照片。此后,由于遥感等领域的应用,使得图像处理技术逐步受到关注并得到了相应的发展。第三代计算机问世后,数字图像处理便开始迅速发展并得到普遍应用。由于CT的发明、应用及获得了备受科技界瞩目的诺贝尔奖,使得数字图像处理技术大放异彩。目前数字图像处理科学已成为工程学、计算机科学、信息科学、统计学、物理、化学、生物学、医学甚至社会科学等领域中各学科之间学习和研究的对象。随着信息高速公路、数字地球概念的提出以及Internet的广泛应用,数字图像处理技术的需求与日俱增。其中,图像信息以其信息量大、传输速度快、作用距离远等一系列优点成为人类获取信息的重要来源及利用信息的重要手段,因此图像处理科学与技术逐步向其他学科领域渗透并为其它学科所利用是必然的。 数字图像处理是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理的产生和迅速发展主要受三个因素的影响:一是计算机的发展;二是数学的发展(特别是离散数学理论的创立和完善);三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。图像处理科学是一门与国计民生紧密相联的应用科学,它给人类带来了巨大的经济和社会效益,不久的将来它不仅在理论上会有更深入的发展,在应用上亦是科学研究、社会生产乃至人类生活中不可缺少的强有力的工具。它的发展及应用与我国的现代化建设联系之密切、影响之深远是不可估量的。在信息社会中,数字图象处理科学无论是在理论上还是在实践中都存在着巨大的潜力。近几十年,数字图像处理技术在数字信号处理技术和计算机技术发展的推动下得到了飞速的发展,正逐渐成为其他科学技术领域中不可缺少的一项重要工具。数字图像处理的应用领域越来越广泛,从空间探索到微观研究,从军事领域到工农业生产,从科学教育到娱乐游戏,越来越多的领域用到了数字图像处理技术。 虽然通过一学期的课程学习我们还没有完全掌握数字图像处理技术,但也收获了不少,对于数字图像处理方面的知识有了比较深入的了解,当然也更加理解了数字图像的本质,即是一些数字矩阵,但灰度图像和彩色图像的矩阵形式是不同的。对于一些耳熟能详的数字图像相关术语有了明确的认识,比如常见的:像素(衡量图像的大小)、分辨率(衡量图像的清晰程度)、位图(放大后会失真)、矢量图(经过放大不会失真)等大家都能叫上口却知识模糊的名词。也了解图像处理技术中一些常用处理技术的实质,比如锐化处理是使模糊的图像变清晰,增

相关文档
最新文档