基于SIFT算子的双目视觉立体匹配算法研究
基于PCA-SIFT的立体匹配算法

会导致 错误的 匹配 而且 S I F T的算法计算 量大 . 不 适
用 于 实 时性 要 求 较 高 的系 统 针 对 以 上 的 问 题 .本 文 提 出 一 种 基 于 小 波 变换 和
信号的近似公式 .也就是用基 函数来表示或 者逼近信
号 母 小 波 可 以通 过 伸 缩 和平 移 得 到 基 础 函数 [ 5 1 。 先 将 母 函数 缩放 a 倍. 然后平移 b : ( t ) = 1 / 、 / 0( 一 b / a )
在 小 波变 换 中 .首 先 需 要 对 它 的两 个 因子 进 行 离
P C A — S I F T算 法 的立 体 匹 配 算 法 . 其 目的 是 提 高 图像 匹 配 的 速 度 和 精 度 图 像 经 过 小 波 变 换 之 后 得 到 的低 分 辨 率 成 分 受 图像 局 部 细 节 的影 响 降低 .提 高 了特 征 提
( 1 ) 文 中提 出 的算 法 采 用 基 于 P C A— S I T 的特 征 匹 F 配, 在保 证 匹 配 结 果 有 效 性 和 准确 性 的 同 时 . 极 大 提 高
降低 了 特 征 提 取 和 特 征 匹配 的 复杂 度 的 同 时 .提 高 了
图像 特 征 点 的 正 确 匹 配 率 .最 终 大 大 增 强 了 算 法 的实 时性 。
宋 淳 恺
( 同济 大 学 电子 与 信 息 工 程 学 院 , 上海 2 0 1 8 0 4 )
摘要 :
在双 目立 体视觉技术 中 . 立体匹配算法研究 是最基本 的问题 . S I F T算 法 由于对存在尺度 变化等情况下 的图像都 能够 实现 图像 的准确 匹配 而受 到广泛的使用 。然 而 , S I F T算法 比较复杂 , 导致算法耗 时效率低 。为 了降低算法 的复杂度 , 满足研究对于实 时性 的要求 . 提 出一 种小波变换结 合 P C A — S I F T算法的综合 的立体 匹配算法 。采用这种综 合算法能
基于SIFT算法的图像匹配研究

基于SIFT算法的图像匹配研究近年来,随着计算机视觉领域的发展,图像匹配成为一个热门的研究领域。
图像匹配是指在两个或多个图像之间找到相同或相似的内容。
在许多应用程序中,如图像检索、物体识别、拼接和增强,图像匹配是一个至关重要的问题。
其中,SIFT算法是一种流行的技术,它已被广泛应用于图像拼接、物体识别等各种领域。
SIFT算法是由David Lowe于1999年提出的一种图像特征提取算法。
它的主要思想是通过从图像中提取出具有唯一性和不变性的特征点,来进行图像匹配。
在提取特征点时,SIFT算法涉及到多个步骤,如高斯差分金字塔和尺度空间极值点检测。
特征点提取完成后,SIFT算法使用局部图像描述符来描述这些特征点,这些描述符对图像旋转、尺度和亮度变化具有不变性。
在使用SIFT算法进行图像匹配时,首先需要在两个图像中提取特征点。
然后,通过匹配这些特征点来计算它们之间的相似性。
如果特征点的相似性得分高于阈值,则认为它们是匹配的。
在实践中,SIFT算法虽然非常流行,但也存在一些缺点。
由于SIFT算法需要计算复杂的高斯差分金字塔和尺度空间极值点检测,因此它的计算复杂度非常高。
此外,SIFT算法对于光照变化和旋转变换比较敏感,这会导致匹配结果的不准确。
为了克服这些缺点,研究人员提出了一些改进的SIFT算法。
例如,SURF算法使用快速的Hessian矩阵检测技术代替了SIFT算法中的高斯卷积和Laplacian检测。
这使得SURF算法具有更快的计算速度和更高的稳定性。
此外,ORB算法使用快速响应二进制特征来代替SIFT算法中的变量高斯模板和Haar小波变换。
这使得ORB算法在特征提取和匹配方面更加高效和准确。
除了SIFT算法,还有许多其他的图像特征提取算法,如SURF、ORB、FAST、BRIEF等。
每种算法都有其优缺点,研究人员需要在不同应用场景下选择最适合的算法。
总之,基于SIFT算法的图像匹配研究在计算机视觉领域发挥了重要作用。
《2024年基于双目立体视觉的测距算法研究》范文

《基于双目立体视觉的测距算法研究》篇一一、引言随着计算机视觉技术的快速发展,双目立体视觉在机器人导航、自动驾驶、三维重建等领域得到了广泛应用。
其中,测距技术作为双目立体视觉的核心技术之一,其准确性和实时性直接影响到整个系统的性能。
本文旨在研究基于双目立体视觉的测距算法,以提高测距的准确性和稳定性。
二、双目立体视觉基本原理双目立体视觉通过模拟人眼立体视觉的原理,利用两个相机从不同角度获取同一场景的图像,然后通过图像处理技术恢复出场景的三维信息。
其基本原理包括摄像机标定、图像获取、特征提取、立体匹配和三维重建等步骤。
三、测距算法研究现状目前,基于双目立体视觉的测距算法主要包括基于特征匹配的测距算法和基于深度学习的测距算法。
其中,基于特征匹配的测距算法通过提取图像中的特征点,然后利用立体匹配技术计算特征点在两个相机中的视差,从而得到物体的距离信息。
而基于深度学习的测距算法则通过训练深度学习模型,从图像中直接学习出距离信息。
四、本文提出的测距算法本文提出了一种基于特征匹配和深度学习的混合测距算法。
该算法首先通过摄像机标定获取相机的内外参数,然后利用特征提取算法提取图像中的特征点。
接着,采用一种改进的立体匹配算法对特征点进行匹配,得到视差图。
最后,结合深度学习模型对视差图进行优化,得到更加准确的距离信息。
五、算法实现与实验结果在算法实现方面,我们采用了OpenCV等开源库进行图像处理和摄像机标定。
在特征提取和立体匹配方面,我们使用了一种改进的SIFT算法和基于区域的立体匹配算法。
在深度学习模型方面,我们采用了卷积神经网络(CNN)对视差图进行优化。
在实验方面,我们使用了多种场景下的实际图像进行测试。
实验结果表明,本文提出的混合测距算法在各种场景下均能取得较好的测距效果,且准确性和稳定性均优于传统的基于特征匹配的测距算法和基于深度学习的测距算法。
六、结论与展望本文提出了一种基于双目立体视觉的混合测距算法,通过结合特征匹配和深度学习的优势,提高了测距的准确性和稳定性。
《双目立体视觉三维重建的立体匹配算法研究》范文

《双目立体视觉三维重建的立体匹配算法研究》篇一一、引言双目立体视觉作为计算机视觉领域中的一种重要技术,通过模拟人眼视觉系统的双目原理,获取物体的深度信息并实现三维重建。
其中,立体匹配算法作为双目立体视觉的核心技术之一,其性能直接决定了三维重建的精度和效果。
本文将重点研究双目立体视觉中的立体匹配算法,并对其原理、方法和优化进行详细分析。
二、双目立体视觉基本原理双目立体视觉基于视差原理,通过两个或多个摄像头从不同角度获取同一场景的图像信息,再通过计算图像间的视差来获取物体的深度信息。
双目立体视觉系统主要由摄像头、图像获取、预处理、特征提取、立体匹配和三维重建等部分组成。
其中,立体匹配是整个系统中最关键的一环。
三、立体匹配算法概述立体匹配算法是双目立体视觉中用于计算左右图像间对应点(即视差)的算法。
它通过在左右图像中寻找相同的特征点或像素点,从而得到视差信息,进而实现三维重建。
目前,常见的立体匹配算法包括基于区域的匹配算法、基于特征的匹配算法和基于相位的匹配算法等。
四、常见立体匹配算法分析1. 基于区域的匹配算法:该类算法通过计算左右图像中一定区域内的像素相似度来确定视差。
其优点是简单易行,但容易受到光照变化、噪声等因素的影响,导致匹配精度不高。
2. 基于特征的匹配算法:该类算法先提取图像中的特征(如边缘、角点等),再在左右图像中寻找相应的特征进行匹配。
该方法提高了匹配的准确性和效率,但对特征的提取和匹配方法要求较高。
3. 基于相位的匹配算法:该类算法利用相位信息进行匹配,具有较高的精度和抗干扰能力。
但计算复杂度较高,对硬件要求较高。
五、本文研究重点:基于深度学习的立体匹配算法随着深度学习技术的发展,基于深度学习的立体匹配算法成为了研究热点。
该方法通过训练神经网络来学习图像间的映射关系,从而实现精确的立体匹配。
本文重点研究了基于卷积神经网络的立体匹配算法,包括网络结构的设计、损失函数的选择和训练方法的优化等方面。
双目视觉立体匹配算法研究

双目视觉立体匹配算法研究双目视觉立体匹配算法是计算机视觉领域中的一项重要研究内容,主要是通过分析两个视野稍有不同的图像,来确定每个像素点在三维空间中的位置。
立体匹配算法的研究旨在通过计算机模拟人眼的视觉感知能力,实现深度信息的获取和三维重建,为许多计算机视觉应用提供基础支持。
目前,双目视觉立体匹配算法主要包括了基于图像的局部匹配算法和全局匹配算法两类。
基于图像的局部匹配算法是立体匹配算法中最简单的一种方法,它主要通过比对两个图像中的像素,寻找最佳的匹配对应点。
常见的方法包括以下几种:1.窗口匹配算法:将两个图像中的局部窗口进行匹配,通过比较窗口中像素的相似性来确定最佳匹配。
2.匹配代价算法:基于窗口匹配的原理,通过定义匹配误差度量指标(如均方差、绝对差等),计算每个像素点的匹配代价。
3.匹配代价聚合算法:将匹配代价进行聚合,通过横向、纵向或斜向的扫描来减少误差,并提高匹配效率。
然而,基于图像的局部匹配算法存在几个问题,如像素间的不连续性、边界的不唯一性等。
因此,全局匹配算法应运而生,主要用于解决这些问题。
常见的全局匹配算法包括以下几种:1.动态规划算法:以图像像素为节点构建图,通过最小化能量函数来寻找最佳匹配点。
2.基于图割算法:将图像像素看作图中顶点,以像素之间的关系为边,通过割集的划分来确定最佳匹配点。
3.代价聚合算法:通过代价聚合来减少匹配误差,常用的方法有图像金字塔、多尺度匹配等。
此外,近年来,深度学习技术的快速发展,也为双目视觉立体匹配算法的研究带来了新的思路。
采用深度学习模型进行立体匹配可以有效地解决传统算法中存在的问题,提高匹配的准确性和鲁棒性。
常见的深度学习方法包括使用卷积神经网络(CNN)进行特征提取和匹配,使用生成对抗网络(GAN)进行深度图像估计等。
总之,双目视觉立体匹配算法的研究涉及到图像处理、计算机视觉、优化算法等多个领域,目前已经取得了很多重要的研究成果。
随着计算机硬件性能的不断提高和深度学习技术的迅速发展,双目视觉立体匹配算法将在未来更广泛地应用于三维重建、虚拟现实、自动驾驶等领域。
《双目立体视觉三维重建的立体匹配算法研究》

《双目立体视觉三维重建的立体匹配算法研究》一、引言双目立体视觉技术是计算机视觉领域中重要的三维重建技术之一。
它通过模拟人类双眼的视觉系统,利用两个相机从不同角度获取同一场景的图像,然后通过立体匹配算法对两幅图像进行匹配,从而获取场景的三维信息。
本文旨在研究双目立体视觉三维重建中的立体匹配算法,探讨其原理、方法及优化策略。
二、双目立体视觉基本原理双目立体视觉的基本原理是基于视差原理,即人类双眼从不同角度观察同一物体时,会在大脑中形成立体的视觉效果。
在双目立体视觉系统中,两个相机从不同位置和角度拍摄同一场景,得到两幅具有一定视差的图像。
通过分析这两幅图像中的对应点,可以计算出场景中物体的三维信息。
三、立体匹配算法研究立体匹配算法是双目立体视觉三维重建的核心。
其基本思想是在两个视图中寻找对应点,然后根据对应点的位置差异计算视差图。
目前,常见的立体匹配算法包括基于区域、基于特征、基于相位和基于全局优化等方法。
3.1 基于区域的立体匹配算法基于区域的立体匹配算法通过比较两个视图中的像素或区域来寻找对应点。
其优点是简单易行,但容易受到光照、遮挡、噪声等因素的影响。
为了提高匹配精度和鲁棒性,研究者们提出了多种改进方法,如引入多尺度、多方向信息、使用自适应阈值等。
3.2 基于特征的立体匹配算法基于特征的立体匹配算法首先提取两个视图中的特征点,然后根据特征点的匹配关系计算视差图。
该类算法具有较高的鲁棒性和精度,尤其在处理复杂场景和动态场景时表现出较好的性能。
为了提高特征提取和匹配的效率,研究者们不断探索新的特征描述符和匹配策略。
3.3 优化策略为了提高立体匹配算法的性能,研究者们提出了多种优化策略。
其中包括引入半全局匹配算法、使用多视差图融合技术、引入深度学习等方法。
这些优化策略可以有效提高匹配精度、降低误匹配率,并提高算法的鲁棒性。
四、实验与分析为了验证本文所研究的立体匹配算法的性能,我们进行了大量实验。
实验结果表明,基于特征的立体匹配算法在处理复杂场景和动态场景时具有较高的精度和鲁棒性。
基于SIFT算法的双目立体视觉测距系统
基于SIFT算法的双目立体视觉测距系统作者:潘庆甫潘庆茹来源:《卷宗》2018年第31期摘要:针对双目立体视觉中的特征点提取与匹配时计算复杂度大、图像匹配时间较长的问题,提出用SIFT算法进行特征点的提取与匹配。
利用张正友标定法确定摄像机的内外参数,利用Bouguet算法进行图像的立体矫正。
建立以图像获取、立体矫正、目标检测与特征提取、立体匹配与三维重建为主要步骤的双目立体视觉测距。
实验表明,在保持原有匹配率的前提下,一定程度上提高了运算速度。
关键词:双目立体视觉测距,SIFT算法,图像匹配一个完整的双目立体视觉系统一般由摄像机标定、图像获取、图像预处理、目标检测与特征提取、立体匹配和三维测距组成。
与普通图像配准不同的是,立体像对之间的差异是由拍摄点的不同一起的,而不是由被拍摄图像的变换或运动引起的。
1 四个坐标系的转换如图1所示,图中有四个坐标系分别为世界坐标系(Ow-XwYwZw),摄像机坐标系(Oc-XcYcZc),像素坐标系(O0-uv)和图像坐标系(O1-xy)。
其中O1为摄像机光轴与图像平面的交点,称为主点,该点的坐标为O1(u0,v0),dx和dy分别为每一个像素在x轴和y轴上的尺寸,则图像中任意一点的像素在两个坐标系下的关系可以表示成:dx、dy、u0、v0其实都是我们假设出来的参数,dx、dy表示感光芯片上像素的实际大小,u0、v0是图像平面中心,最终是要我们求的内外参数。
设空间一点P在摄像机坐标系Oc-XcYcZc下的坐标为,在世界坐标系Ow-XwYwZw下的坐标为,该点在图像坐标系下的成像点为p,p点的图像坐标和像素坐标分别为和R为旋转矩阵,T为平移向量:其中,称为u轴上的尺度因子,称为v轴上的尺度因子,M1称为摄像机的内部参数,M2称为摄像机的外部参数,确定内外参数的过程称为摄像机的标定。
2 双目立体视觉的测距模型简易的双目立体视觉测距模型如图2所示,假设两摄像头的光轴平行,Ol和Or分别为左右摄像头的光心,两摄像头的光心之间的距离为b,P为目标点,根据图1建立的坐标模型可知P到两摄像头之间的距离可看作Z轴上的坐标即为Z,P在左右摄像头的成像点分别为Xl和Xr,因此,可建立以X-Z的平面模型。
《双目立体视觉三维重建的立体匹配算法研究》
《双目立体视觉三维重建的立体匹配算法研究》篇一一、引言双目立体视觉技术是计算机视觉领域中的一项重要技术,它通过模拟人类双眼的视觉系统,利用两个相机从不同角度获取同一场景的图像信息,再通过一系列的图像处理技术,实现三维重建。
其中,立体匹配算法是双目立体视觉三维重建的关键技术之一。
本文将重点研究双目立体视觉三维重建中的立体匹配算法,并分析其原理、方法和存在的问题及解决方法。
二、立体匹配算法的基本原理和常用方法1. 立体匹配算法的基本原理立体匹配算法是利用双目相机获取的左右两幅图像中的视差信息,通过匹配算法找出同一场景在不同视角下的对应点,进而实现三维重建。
其基本原理包括四个步骤:图像预处理、特征提取、立体匹配和三维重建。
2. 常用立体匹配算法(1)基于区域的立体匹配算法:该算法通过计算左右图像中每个像素点周围的区域相似度来确定视差值。
其优点是精度高,但计算量大,实时性较差。
(2)基于特征的立体匹配算法:该算法先提取左右图像中的特征点,再通过特征匹配来计算视差值。
其优点是计算量小,实时性好,但需要较好的特征提取算法。
(3)基于相位的立体匹配算法:该算法利用相位信息来计算视差值,具有较高的精度和稳定性。
但其对噪声敏感,且计算量较大。
三、存在的问题及解决方法1. 匹配精度问题:由于光照、遮挡、透视畸变等因素的影响,立体匹配算法的精度会受到影响。
为了提高匹配精度,可以采用多尺度、多特征融合的方法,提高特征提取的准确性和鲁棒性。
2. 实时性问题:在实际应用中,要求立体匹配算法具有较高的实时性。
为了解决这一问题,可以采用优化算法、硬件加速等方法来降低计算量,提高运算速度。
3. 视差图问题:视差图是立体匹配算法的重要输出结果之一。
视差图的质量直接影响着三维重建的精度和效果。
为了提高视差图的质量,可以采用多约束条件下的优化算法、后处理等方法来优化视差图。
四、研究进展与展望近年来,随着计算机视觉技术的不断发展,双目立体视觉三维重建技术也取得了较大的进展。
《基于双目视觉的三维重建关键技术研究》
《基于双目视觉的三维重建关键技术研究》一、引言三维重建技术在现代社会具有广泛的应用场景,包括虚拟现实、机器人导航、无人驾驶等领域。
其中,基于双目视觉的三维重建技术因其高效、准确的特点,成为了研究的热点。
本文将深入探讨基于双目视觉的三维重建的关键技术,分析其原理、方法及挑战,旨在为相关研究提供参考。
二、双目视觉三维重建原理双目视觉三维重建技术基于人类双眼的视觉原理,通过模拟人眼的视觉系统,利用两个相机从不同角度获取同一场景的图像信息,进而计算得到场景中物体的三维结构信息。
其基本原理包括图像获取、图像预处理、特征提取、立体匹配、三维重建等步骤。
三、关键技术研究1. 图像获取与预处理图像获取是双目视觉三维重建的基础。
在获取图像时,需要保证两个相机的参数一致,以减小后续处理的难度。
预处理阶段主要包括图像去噪、灰度化、二值化等操作,以提高图像的质量,为后续的特征提取和立体匹配提供良好的基础。
2. 特征提取特征提取是双目视觉三维重建的关键步骤之一。
通过提取图像中的特征点,可以减小立体匹配的计算量,提高匹配的准确性。
目前常用的特征提取方法包括SIFT、SURF、ORB等。
这些方法可以在不同的尺度、旋转和光照条件下提取稳定的特征点,为后续的立体匹配提供可靠的基础。
3. 立体匹配立体匹配是双目视觉三维重建的核心步骤。
其目的是在两个相机的视图中找到对应的特征点,从而计算视差图。
视差图反映了场景中各点在两个相机视图中的位置差异,是计算三维结构信息的基础。
目前常用的立体匹配方法包括基于区域的匹配、基于特征的匹配和基于全局优化的匹配等。
这些方法各有优缺点,需要根据具体的应用场景选择合适的匹配方法。
4. 三维重建三维重建是根据视差图和相机参数计算场景中物体的三维结构信息的过程。
常见的三维重建方法包括深度图法、三角测量法等。
深度图法通过计算视差图与深度信息之间的关系得到深度图,进而得到物体的三维结构信息。
三角测量法则是通过两个相机的位置和视角信息,结合视差图计算得到物体的三维坐标信息。
《基于双目立体视觉的测距算法研究》范文
《基于双目立体视觉的测距算法研究》篇一一、引言在现今的自动驾驶、机器人技术、以及3D计算机视觉领域,双目立体视觉测距算法以其准确度高、鲁棒性强的特点得到了广泛的应用。
本文旨在研究基于双目立体视觉的测距算法,深入探讨其原理、应用及其优缺点,并通过实验分析验证其有效性。
二、双目立体视觉原理双目立体视觉是通过模拟人类双眼的视觉过程,利用两个相机从不同角度获取同一场景的图像,再通过图像处理技术恢复出场景的三维信息。
其基本原理包括图像获取、图像校正、特征提取、立体匹配和三维重建等步骤。
三、测距算法研究基于双目立体视觉的测距算法主要分为以下几个步骤:1. 图像获取与预处理:首先,通过两个相机获取同一场景的左右图像,然后进行预处理,包括去噪、灰度化等操作,以便后续处理。
2. 特征提取与匹配:在预处理后的图像中提取特征点,如SIFT、SURF等算法。
然后,通过立体匹配算法找到对应点,如基于区域的匹配算法、基于特征的匹配算法等。
3. 计算视差:通过立体匹配得到的对应点计算视差,即同一物体在不同相机图像中的位置差异。
视差反映了物体在空间中的深度信息。
4. 深度信息恢复与测距:根据视差和双目相机的基线距离计算深度信息,从而得到物体的三维坐标。
再结合相关算法计算得到物体与相机的距离。
四、算法优化与改进为了提高测距精度和鲁棒性,可以采取以下措施对算法进行优化和改进:1. 优化特征提取与匹配算法:采用更先进的特征提取与匹配算法,如深度学习算法等,提高匹配精度和速度。
2. 引入约束条件:利用先验知识或已知信息引入约束条件,如顺序一致性约束、极线约束等,以减少错误匹配的概率。
3. 深度学习算法的融合:将深度学习算法与双目立体视觉测距算法相结合,通过大量数据训练得到更准确的模型。
4. 多重校正技术:在图像获取阶段引入多重校正技术,以消除相机之间的几何畸变和光畸变等影响测距精度的因素。
五、实验分析本文通过实验验证了基于双目立体视觉的测距算法的有效性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
西安电子科技大学硕士学位论文基于SIFT算子的双目视觉立体匹配算法研究姓名:李岩琪申请学位级别:硕士专业:计算机系统结构指导教师:曹伯燕20100101摘要双目立体视觉技术是根据两幅不同角度拍摄的图像,获取图像中物体三维几何信息的技术。
该技术近年来发展迅速,在军事和民事的各个领域都得到了广泛的应用。
图像匹配技术又是双目视觉领域中最为关键的技术,一个好的匹配方法,要同时达到速度快、精度高的要求,从而满足实时性和实用性。
但是图像匹配强依赖于图像本身,因此,图像匹配技术也是双目视觉发展中最难彻底解决的问题,该技术一直在不断发展与完善之中。
本文阐述了双目立体视觉技术的原理和具体内容,对立体匹配技术作了深入的研究。
重点分析了基于SIFT(Scale Invariant Feature Transform尺度不变特征变换算子的立体匹配算法,该算法基于尺度空间的图像特征进行匹配。
SIFT算子对特征点进行检测和描述,对图像变换和噪声具有很好的鲁棒性。
为提高该算法匹配的精度,本文针对其算子设计进行了改进,提出了改进算法并编程实现。
通过对不同类型图像的匹配验证实验,证明改进算法的结果可以定性的反映出图像中物体真实的三维形状和相对位置关系,视差效果好,匹配率较高且稳定。
关键词:双目视觉立体匹配视差SIFT特征值AbstractBinocular stereo vision is a technique on how to possible understand and perceive the objective world by computer rather than human beings. It can require the three-dimensional (3D geometry information of objects form two images that shooting from two different angles. This technique has a rapidly development these years, it has been successfully used in many fields of civil and martial.Image stereo matching is the most significant part in binocular stereo vision technique. A perfect matching algorithm is fast and accurately, it should have good practicability. But image matching algorithm strongly depends on image itself, that is, every stereo image stereo matching algorithm is proposed aiming at matching certain type of images, there is no such a stereo matching algorithm can process any type of images nowadays, so it is difficult to solve this problem completely. Sometimes, the matching algorithm even can not reach the requirement of applications, so this issue has always been developed and improved.This paper introduces and analyzes theory of binocular stereo vision technique detailedly, then makes a deep research on image matching algorithm. The focus on this paper is an image feature matching algorithm based on scale invariant features transform (SIFT operator. The principle of SIFT matching algorithm is researched. In this algorithm, SIFT operator is used to detect the feature points, and each feature point is assigned a feature descriptor. It is accurate and robust towards image distortion and noise. In orderto improve the matching rate of SIFT algorithm, an improved SIFT matching algorithm is proposed and implemented. Taking many different types of images as experiment images, with the improved algorithm, the shape character and relative position of objects in the image can be shown well, the method is stable and fast, the matching rate is improved.Keyword:Binocular stereo vision Image matching SIFT Feature point西安电子科技大学学位论文创新性声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。
尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。
与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。
申请学位论文与资料若有不实之处,本人承担一切的法律责任。
本人签名:日期西安电子科技大学关于论文使用授权的说明本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。
学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。
同时本人保证,毕业后结合学位论文研究课题再撰写的文章一律署名单位为西安电子科技大学。
(保密的论文在解密后遵守此规定本学位论文属于保密,在年解密后适用本授权书。
本人签名:日期导师签名:日期第一章绪论1第一章绪论1.1 引言视觉是人类与生俱来的一种观察世界、认知世界的重要功能手段。
人类从外界获得的信息约有75%来自视觉系统[1] [2]。
人类的视觉系统是迄今为止,人们所知道的生物界中功能最为强大和完善的视觉系统。
人类通过眼睛获取图像,运用大脑处理和理解从眼睛得到的视觉信息,对两眼看到的图像自动分辨它们的差别并加以融合,最终展示在我们眼前的是一个具有深度感的立体的三维的世界。
人类大脑复杂且功能强大,若机器能够很好的模拟眼睛和大脑的合作,完成这一信息处理过程,那么很多的工作将会大大地简化。
因此,计算机视觉成为各个应用领域,如制造业、检验、文档分析、医疗诊断和军事等领域的各种系统中不可分割的一部分,是工程领域,也是科学领域中的一个富有挑战性的重要研究内容[3]。
计算机视觉的挑战就是要为计算机和机器人开发具有与人类水平相当的视觉能力。
1.2 课题背景作为一门学科,计算机视觉开始于二十世纪60年代初,但计算机视觉研究中的许多重要进展和成果是在二十世纪80年代取得的。
从20世纪70年代中期开始,以Marr等人为代表的研究学者提出了一整套视觉计算的理论来描述视觉过程,理论核心就是从图像中恢复物体的三维形状[4],其中,Marr的理论影响最为深远。
二十世纪80年代中后期,机器人研究使得视觉研究中大量运用了空间几何的方法。
到二十世纪90年代初到二十一世纪,关于立体视觉的研究在许多方面开始趋于成熟。
最近十多年来,计算机立体视觉在多个领域内取得了重要进展,包括区域匹配和特征匹配的新的算法技术、多摄像机立体视觉等。
目前,随着计算机科学、人工智能以及相关学科的进一步发展,计算机视觉的研究也相应的得到了更深入的发展,它正广泛的应用于各个领域中,在很多特殊环境的应用中,已经可以逐步代替人类视觉起到关键的作用[5]。
包括在航空、航天、卫星拍摄等应用中,计算机视觉已经成为不可替代的关键技术。
我国的计算机视觉发展快速,无论军事领域还是民用工业、农业,计算机视觉都有着广阔的应用领域和非常好的发展前景。
双目立体视觉技术是用并排的两部或多部图像采集装置对同一物体或场景进2 基于SIFT算子的双目视觉立体匹配算法研究行拍摄,或者用一部采集装置在对应的不同的角度拍摄同一物体,生成至少左、右两幅图像。
这一过程模拟人眼成像,同一物体在不同角度图像中的位置不同称为视差。
利用视差及拍摄的角度,就可以计算得到该物体在真实世界中的位置相关信息。
计算机要完成模拟人类视觉的过程,首先要有类似人类眼睛的对外界信息采集的工具,当前这方面的硬件的发展已经相当进步,各种的图像或视频采集设备层出不穷,如光学摄像机或红外、超声、激光等对周围场景或物体进行探测成像,可以得到关于场景或物体的二维或三维数字化图像。
接下来是更为困难的一部分,就是计算机得到采集到的图像之后,模拟人类大脑处理图像信息的过程,这一部分是实现计算机视觉的关键。
首先,可以对图像进行初步的预先处理,涉及到的技术有图像滤波、图像增强、边缘检测等;其次,可对图像的明暗特征、纹理特征等特征进行描述和提取,这之中也涉及到标定、匹配等等的工作,这对于恢复物体的深度信息非常关键;最后,可根据原始图像、图像基本特征、深度特征等,利用重建技术对物体或场景进行三维描述和三维重建,从而更好的识别物体的位置和方向。
立体匹配技术在以上过程中起到的关键作用就在于,将两幅图像进行匹配,在右图像上,利用匹配算法找出与左图像中相应点相匹配的点,利用每对点之间的位置差异,进行视差的计算,从而得到所需要的数据信息。