SIFT算法分析报告

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SIFT算法分析

1 SIFT主要思想

SIFT算法是一种提取局部特征的算法,在尺度空间寻找极值点,提取位置,尺度,旋转不变量。

2 SIFT算法的主要特点:

a) SIFT特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。

b) 独特性(Distinctiveness)好,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配。

c) 多量性,即使少数的几个物体也可以产生大量SIFT特征向量。

d) 高速性,经优化的SIFT匹配算法甚至可以达到实时的要求。

e) 可扩展性,可以很方便的与其他形式的特征向量进行联合。

3 SIFT算法流程图:

4 SIFT 算法详细

1)尺度空间的生成

尺度空间理论目的是模拟图像数据的多尺度特征。 高斯卷积核是实现尺度变换的唯一线性核,于是一副二维图像的尺度空间定义为:

),(),,(),,(y x I y x G y x L *=σσ

其中 ),,(σy x G 是尺度可变高斯函数,2)

(2

2/21

),,(22

σπσσy x

e y x G +-=

(x ,y )是空间坐标,σ是尺度坐标。σ大小决定图像的平滑程度,大尺度对应图像的概貌特征,小尺度对应图像的细节特征。大的σ值对应粗糙尺度(低分辨率),反之,对应精细尺度(高分辨率)。

为了有效的在尺度空间检测到稳定的关键点,提出了高斯差分尺度空间(DOG scale-space )。利用不同尺度的高斯差分核与图像卷积生成。

),,(),,(),()),,(),,((),,(σσσσσy x L k y x L y x I y x G k y x G y x D -=*-= DOG 算子计算简单,是尺度归一化的LoG 算子的近似。

图像金字塔的构建:图像金字塔共O 组,每组有S 层,下一组的图像由上一组图像降采样得到。

图1由两组高斯尺度空间图像示例金字塔的构建, 第二组的第一副图像由第一组的第一副到最后一副图像由一个因子2降采样得到。图2 DoG 算子的构建:

图1 Two octaves of a Gaussian scale-space image pyramid with s =2 intervals. The first image in the second octave is created by down sampling to last image in the previous

图2 The difference of two adjacent intervals in the Gaussian scale-space pyramid create an interval in the difference-of-Gaussian pyramid (shown in green).

2) 空间极值点检测

为了寻找尺度空间的极值点,每一个采样点要和它所有的相邻点比较,看其是否比它的图像域和尺度域的相邻点大或者小。如图3所示,中间的检测点和它同尺度的8个相邻点和上下相邻尺度对应的9×2个点共26个点比较,以确保在尺度空间和二维图像空间都检测到极值点。一个点如果在DOG尺度空间本层以及上下两层的26个领域中是最大或最小值时,就认为该点是图像在该尺度下的一个特征点,如图1所示。

3) 构建尺度空间需确定的参数

σ-尺度空间坐标

O-octave坐标

S- sub-level 坐标

σ和O、S的关系S s o

s

o/

2

)

,

(+

σ,],1

,...,

0[

min

-

+

∈O

o

o]1

,...,

0[-

∈S

s

图3 DoG尺度空间局部极值检测

其中0σ是基准层尺度。o -octave 坐标,s - sub-level 坐标。注:octaves 的索引可能是负的。第一组索引常常设为0或者-1,当设为-1的时候,图像在计算高斯尺度空间前先扩大一倍。

空间坐标x 是组octave 的函数,设0x 是0组的空间坐标,则

[][]1,...,01,...,0,,20000-⨯-∈Z ∈=M N x o x x o

如果()00,M N 是基础组o=0的分辨率,则其他组的分辨率由下式获得:

0000,22o o N M N M ⎢⎥⎢⎥==⎢⎥⎢⎥⎣⎦⎣⎦

注:在Lowe 的文章中,Lowe 使用了如下的参数: 1/0min 0.5, 1.62,1,3S n o S σσ==⋅=-=

在组o=-1,图像用双线性插值扩大一倍(对于扩大的图像1n σ=)。

4)精确确定极值点位置

通过拟和三维二次函数以精确确定关键点的位置和尺度(达到亚像素精度),

同时去除低对比度的关键点和不稳定的边缘响应点(因为DoG 算子会产生较强的边缘响应),以增强匹配稳定性、提高抗噪声能力。

①空间尺度函数),,(σy x D

()X X D

X X X D y x D y x D T T 2

200021,,),,(∂∂+∂∂+=σσ)泰勒展开式如下: ()x x D

x x x D y x D y x D T T 2

221,,),,(∂∂+∂∂+=σσ

对上式求导,并令其为0,得到精确的位置x ˆ,x

D x D x ∂∂∂∂-=-2

1

2ˆ ②在已经检测到的特征点中,要去掉低对比度的特征点和不稳定的边缘响应点。去除低对比度的点:把公式(4)代入公式(3),只取前两项可得:

()x

x

D y x D x D T

ˆ21,,)ˆ(∂∂+=σ 若()03.0ˆ≥x

D ,该特征点就保留下来,否则丢弃。 ③边缘响应的去除

一个定义不好的高斯差分算子的极值在横跨边缘的地方有较大的主曲率,而

相关文档
最新文档