基于双视线感知编组的影像匹配方法
双目立体视觉中的图像匹配技术研究

双目立体视觉系统中的图像匹配技术研究
图表清单
图 1.1 Marr 框架的视觉三阶段 ........................................................................... 3 图 1.2 立体视觉应用示例 .................................................................................... 4 图 1.3 立体视觉三维信息感知示意图 ................................................................ 5 图 2.1 针孔成像模型 .......................................................................................... 11 图 2.2 世界坐标与计算机图像坐标之间的转换步骤示意图 .......................... 12 图 2.3 平行式双目立体视觉模型 ...................................................................... 15 图 2.4 汇聚式双目立体视觉模型 ...................................................................... 15 图 2.5 立体视觉中的极线几何 .......................................................................... 19 图 2.6 极线校正示意图 ...................................................................................... 20 图 2.7 立体图像对校正实验结果 ...................................................................... 24 图 3.1 平行式立体视觉模型视差矢量图示 ...................................................... 26 图 3.2 汇聚式立体视觉模型视差矢量图示 ...................................................... 26 图 3.3 Tsukuba 合成图像对的原图和视差图.................................................... 27 图 3.4 视差空间(DSI)示意图 ............................................................................. 27 图 3.5 本文实验所采用的立体图像对 .............................................................. 29 图 3.6 Bank/Cencus 测度函数示意 .................................................................... 33 图 3.7 视差图在不同测度函数时的性能比较图示 .......................................... 36 图 4.1 区域匹配算法图示 .................................................................................. 38 图 4.2 子窗口分割示意图 .................................................................................. 42 图 4.3 多窗口匹配示意图 .................................................................................. 42 图 4.4 Tsukuba 图像对在不同窗口大小下的视差图........................................ 43 图 4.5 Tsukuba 图像对在不同窗口大小下的误匹配百分比曲线图................ 43 图 4.6 Tree 图像对在不同窗口大小下的视差图 .............................................. 44 图 4.7 不同窗口选择策略实验结果图 .............................................................. 45 图 4.8 动态规划算法产生的视差图(OpenCV) ................................................ 47 图 4.9 不同区域的匹配代价曲线图 .................................................................. 48 图 4.10 遮挡示意图 ............................................................................................ 49 图 5.1 区域增长匹配算法流程图 ...................................................................... 51 图 5.2 线形插值减少采样效应 .......................................................................... 53 图 5.3 经 Birchfield 方法处理后的 Tsukuba 合成图像匹配结果 .................... 54
双目立体视觉匹配

双目立体视觉匹配双目立体视觉匹配是一种用于处理双眼图像的技术,它可以获取物体的深度信息,实现视线的立体感知,从而实现更真实、更生动的视觉感受。
在视觉感知中,双目立体视觉匹配是一个非常重要的问题,因为通过双目立体视觉匹配可以实现对场景的深度信息的获取和重构,为机器视觉和人工智能技术的发展提供了重要的工具。
双目立体视觉匹配是利用成对的左右眼视角图像,通过匹配两幅图像中的对应像素点,来获取物体的深度信息和三维形状信息。
在这个过程中,双目立体视觉匹配主要包括了一些关键的步骤,例如:特征提取、特征匹配、深度信息计算等。
在这些步骤中,特征提取是最基本的操作,它能够从图像中提取出一些重要的特征点和特征描述子。
而特征匹配则是通过匹配两幅图像中的特征点,来建立两幅图像之间的对应关系。
通过深度信息计算,可以得到每一个像素点的深度信息,从而实现对物体的深度感知。
整个过程中会有很多技术手段和算法用来解决双目立体视觉匹配的各种挑战,比如光照变化、遮挡、噪声等问题。
双目立体视觉匹配在许多领域都有着广泛的应用,如机器人导航、无人驾驶、虚拟现实、医疗影像等。
在无人驾驶领域,利用双目立体视觉匹配可以实现对周围环境的感知,帮助无人车辆实现安全行驶。
在医疗影像领域,双目立体视觉匹配可以帮助医生对病患的体表形态和内部结构进行更加精确的分析和诊断。
在虚拟现实领域,利用双目立体视觉匹配可以实现更加真实的场景重构,从而提供更加生动、更加沉浸式的虚拟现实体验。
双目立体视觉匹配技术的发展,在一定程度上受到了神经科学的启发。
在生物中,双眼视觉是通过两只眼睛向不同方向看的方式获取的。
人类的视觉系统能够通过左右眼的分别获取的图像,来对物体的深度信息进行感知。
这种生物视觉系统的优点是:可以避开遮挡难题,减少由于单一摄像机视角所引发的深度信息获取不准确问题。
而双目立体视觉匹配技术正是受到了这一生物系统的启发,通过模拟人类的双目视觉来实现对场景的深度信息获取。
双目视觉立体匹配算法研究

双目视觉立体匹配算法研究双目视觉立体匹配算法是计算机视觉领域中的一项重要研究内容,主要是通过分析两个视野稍有不同的图像,来确定每个像素点在三维空间中的位置。
立体匹配算法的研究旨在通过计算机模拟人眼的视觉感知能力,实现深度信息的获取和三维重建,为许多计算机视觉应用提供基础支持。
目前,双目视觉立体匹配算法主要包括了基于图像的局部匹配算法和全局匹配算法两类。
基于图像的局部匹配算法是立体匹配算法中最简单的一种方法,它主要通过比对两个图像中的像素,寻找最佳的匹配对应点。
常见的方法包括以下几种:1.窗口匹配算法:将两个图像中的局部窗口进行匹配,通过比较窗口中像素的相似性来确定最佳匹配。
2.匹配代价算法:基于窗口匹配的原理,通过定义匹配误差度量指标(如均方差、绝对差等),计算每个像素点的匹配代价。
3.匹配代价聚合算法:将匹配代价进行聚合,通过横向、纵向或斜向的扫描来减少误差,并提高匹配效率。
然而,基于图像的局部匹配算法存在几个问题,如像素间的不连续性、边界的不唯一性等。
因此,全局匹配算法应运而生,主要用于解决这些问题。
常见的全局匹配算法包括以下几种:1.动态规划算法:以图像像素为节点构建图,通过最小化能量函数来寻找最佳匹配点。
2.基于图割算法:将图像像素看作图中顶点,以像素之间的关系为边,通过割集的划分来确定最佳匹配点。
3.代价聚合算法:通过代价聚合来减少匹配误差,常用的方法有图像金字塔、多尺度匹配等。
此外,近年来,深度学习技术的快速发展,也为双目视觉立体匹配算法的研究带来了新的思路。
采用深度学习模型进行立体匹配可以有效地解决传统算法中存在的问题,提高匹配的准确性和鲁棒性。
常见的深度学习方法包括使用卷积神经网络(CNN)进行特征提取和匹配,使用生成对抗网络(GAN)进行深度图像估计等。
总之,双目视觉立体匹配算法的研究涉及到图像处理、计算机视觉、优化算法等多个领域,目前已经取得了很多重要的研究成果。
随着计算机硬件性能的不断提高和深度学习技术的迅速发展,双目视觉立体匹配算法将在未来更广泛地应用于三维重建、虚拟现实、自动驾驶等领域。
双目立体视觉匹配

双目立体视觉匹配双目立体视觉匹配是现代计算机视觉领域中的一项重要技术。
人类视觉系统能够通过两只眼睛获取到不同的视角,从而对空间场景有更加深入的了解。
而计算机视觉系统也可以通过双目视觉技术实现类似的效果,从而实现3D场景的感知、识别和重建。
双目立体视觉匹配的基本原理是通过计算两个视角图像之间的差异,从而确定像素点在3D空间中的位置。
这种差异可以通过计算两个图像之间的视差(即两个像素点之间的水平距离)来实现。
因此,双目立体视觉匹配需要寻找一种合适的方法来计算两个图像之间的匹配点。
在双目立体视觉匹配技术中,一般采用以下几种方法来实现:1、全匹配法全匹配法是双目立体视觉匹配技术中最简单的方法之一。
该方法首先对参考图像中的每个像素点在目标图像中进行搜索,然后比较两个像素点之间的相似度。
如果相似度高于某个阈值,则认为两个像素点匹配成功,确定它们在3D空间中的位置。
由于全匹配法计算量较大,因此很难应用于实际场景下的实时计算。
2、相似性度量法3、特征点匹配法特征点匹配法是一种基于关键点匹配的方法。
该方法首先使用特征检测算法(如SIFT 或SURF)在两张图像中提取出关键点,并计算它们的描述子。
然后通过计算描述子之间的相似度,从而将参考图像中的关键点与目标图像中的关键点进行匹配。
在匹配成功之后,根据匹配的关键点确定两个图像之间的视差,从而确定像素点在3D空间中的位置。
相比于前两种方法,特征点匹配法具有更高的准确性和鲁棒性,但是计算量也更大。
双目立体视觉匹配技术在实际应用中有着广泛的应用场景。
比如在智能驾驶领域,双目立体视觉可以通过获取3D场景信息来实现车辆的自动导航和避障。
另外,在工业制造领域,双目立体视觉可以用于3D物体的反复制造和检测。
因此,双目立体视觉匹配技术的研究和应用具有非常重要的意义。
《2024年基于双目视觉的立体匹配算法研究及应用》范文

《基于双目视觉的立体匹配算法研究及应用》篇一一、引言随着计算机视觉技术的不断发展,双目视觉技术已成为三维重建、机器人导航、自动驾驶等领域的重要技术手段。
其中,立体匹配算法作为双目视觉技术的核心,其性能的优劣直接影响到整个系统的准确性和稳定性。
本文旨在研究基于双目视觉的立体匹配算法,探讨其原理、方法及应用,以期为相关领域的研究和应用提供参考。
二、双目视觉技术概述双目视觉技术是通过模拟人类双眼的视觉系统,利用两个相机从不同角度获取场景的图像信息,然后通过计算图像间的视差,恢复出场景的三维信息。
其核心在于立体匹配算法,即从两个相机的视角出发,找到同一场景在不同视角下的对应点。
三、立体匹配算法研究1. 算法原理立体匹配算法主要通过以下步骤实现:特征提取、特征匹配、视差计算和优化。
其中,特征提取是关键步骤,它决定了算法的准确性和鲁棒性。
特征匹配则是通过计算两个图像中特征的相似性,找到对应点。
视差计算则是根据匹配结果,计算每个点的视差值。
最后,通过优化算法,进一步提高匹配的准确性和稳定性。
2. 算法方法目前,常见的立体匹配算法包括基于区域的匹配算法、基于特征的匹配算法和基于相位的匹配算法等。
其中,基于特征的匹配算法因其计算量小、抗干扰能力强等优点,得到了广泛的应用。
该类算法首先提取图像中的特征点,如SIFT、SURF等,然后通过计算特征点之间的相似性,找到对应点。
四、立体匹配算法的应用1. 三维重建通过双目视觉技术,可以获取场景的三维信息,实现三维重建。
在机器人导航、虚拟现实、游戏制作等领域,三维重建技术得到了广泛的应用。
2. 自动驾驶在自动驾驶领域,双目视觉技术可用于道路检测、车辆识别、行人检测等任务。
通过立体匹配算法,可以准确地识别道路上的障碍物和行人,为自动驾驶系统提供可靠的决策依据。
3. 医学影像处理在医学影像处理领域,双目视觉技术可用于三维重建、测量和分析等任务。
通过立体匹配算法,可以准确地提取医学影像中的特征信息,为医生提供更准确的诊断依据。
基于双目图像多特征点融合匹配物体识别与定位研究

基于双目图像多特征点融合匹配物体识别与定位研究王霖郁;蒋强卫;李爽【摘要】针对传统的特征点匹配算法对于纹理少的识别目标特征点检测不理想的问题,基于任何物体都具有边缘特征,通过匹配边缘特征点,实现物体的边缘特征点匹配,采用Canny检测算法,提取边缘特征点.在此基础上,增加FAST角点检测算法,采用BRIEF描述算法实现对特征点构建描述子,通过2种检测算法融合,解决了纹理少的物体检测特征少的问题,并增加了物体特征点匹配数量.采用YOLO网络模型实现物体识别和框出物体区域.实验结果表明,基于双目图像多特征点融合匹配算法,很好地解决了纹理少的物体匹配特征少的问题,构建的物体识别和定位系统可以实现对训练的物体识别与定位.【期刊名称】《无线电工程》【年(卷),期】2018(048)008【总页数】6页(P628-633)【关键词】YOLO网络;双目视觉;双目图像特征点匹配;物体识别与定位【作者】王霖郁;蒋强卫;李爽【作者单位】哈尔滨工程大学信息与通信工程学院, 黑龙江哈尔滨 150000;哈尔滨工程大学信息与通信工程学院, 黑龙江哈尔滨 150000;卫星导航系统与装备技术国家重点实验室, 河北石家庄 050081【正文语种】中文【中图分类】TP751.10 引言工业自动化水平的提高、计算机视觉的进步[1]以及人工智能领域内双目视觉物体识别与定位等成为近年来人们研究的热门问题。
物体识别与定位在众多领域有着广阔的应用前景和非常巨大的应用价值。
该技术可应用在智能辅助驾驶技术、无人机、工业机器人、服务机器人、军事侦察、仿生机器人和星球探测车等领域。
在这些领域的应用中,通常需要通过双目相机获取场景中物体的类别和位置信息。
基于此,本文设计实现了基于卷积神经网络和双目视觉物体识别与定位系统。
对于传统的物体识别和定位算系统,采用人工设计特征和支持向量机结合的方式实现物体识别,但存在识别物体单一和识别准确率低的问题[2-4],本文提出了YOLO卷积神经网络和双目视觉结合方式实现物体定位,以提高物体识别种类和识别准确率,使得系统具有扩展性,可以根据需要训练物体。
双目立体视觉匹配
双目立体视觉匹配双目立体视觉匹配是指通过两个摄像头同时拍摄同一场景,在计算机图像处理领域中,利用计算机算法实现双目视觉融合,将两个不同摄像头捕获的图像进行匹配与融合,从而得到具有立体感的图像或视频。
这种技术模拟人类的视觉系统,通过两个独立的摄像头获取两个不同的视角,从而获得更加丰富的信息,增强图像或视频的感知效果。
在双目立体视觉匹配中,主要包括以下几个步骤:1. 图像获取:通过两个摄像头同时获取同一场景的图像,保持两个摄像头之间的位置和姿态相对固定,以保证后续的匹配和融合准确性。
2. 图像预处理:对两个摄像头捕获的图像进行预处理,包括去噪、图像增强、图像配准等步骤。
预处理能够提高双目图像的质量和匹配准确度。
3. 特征提取:从两个摄像头捕获的图像中提取特征点。
特征点具有唯一性和稳定性,通常包括角点、边缘等。
通过提取特征点可以辨别出图像中的物体边界和纹理,为后续的匹配提供基础。
4. 特征匹配:将两个图像中提取出的特征点进行匹配。
常用的特征匹配算法包括SIFT(尺度不变特征转换)、SURF(快速稳健特征)、ORB(Oriented FAST and Rotated BRIEF)等。
特征匹配算法能够根据特征点的位置、尺度和方向等信息,将两幅图像中相似的特征点进行匹配,从而获得两个图像之间的对应关系。
5. 视差计算:根据两个匹配的特征点的位置,计算出它们之间的视差。
视差是指两个图像中对应点的水平位置差异。
通过视差计算,可以得到两个摄像头之间的相对深度信息,也就是目标物体与摄像头的距离。
6. 三维重建:根据视差和两个摄像头之间的相对位置,可以进行三维重建。
三维重建将视差图转化为三维坐标,从而得到场景中物体的三维形状和位置信息。
7. 视差修复:由于双目立体视觉匹配存在一定的误差,需要对视差进行修复,以提高匹配的准确性和稳定性。
视差修复的方法包括:基于一致性约束的全局优化、基于图割的图像分割等。
8. 双目图像融合:将两个摄像头捕获的图像进行融合,得到立体感强的图像或视频。
双目立体匹配ncc算法
双目立体匹配的NCC算法是一种常用的图像处理技术,用于在双目立体视觉系统中实现图像匹配。
双目立体视觉是一种通过分析两个不同视角的图像来确定物体三维信息的技术。
在双目立体匹配过程中,NCC算法被广泛应用于寻找两幅图像之间的相似区域。
NCC算法的基本原理是通过计算两个图像之间的相关系数来匹配图像。
相关系数是一种衡量两个变量之间相似性的度量,其值范围在-1到1之间。
当两个图像之间的相似区域越大时,相关系数值越大。
NCC算法的基本步骤包括:1. 计算两幅图像的卷积:使用一个滤波器(如高斯滤波器)对两幅图像进行卷积,以提取图像中的特征。
2. 计算相关系数:将卷积后的结果进行求和,并除以图像大小和卷积核大小的内积,得到相关系数矩阵。
3. 阈值处理:对相关系数矩阵进行阈值处理,以排除不相关区域的影响。
通常使用软阈值处理方法,以保证匹配质量的同时减小计算量。
4. 找到匹配区域:根据阈值处理后的相关系数矩阵,找到匹配区域。
通常采用自适应阈值法,根据图像的局部特征动态调整阈值,以提高匹配精度。
5. 优化匹配结果:对找到的匹配区域进行优化,如平滑、锐化等操作,以提高立体匹配的质量。
在双目立体匹配中,NCC算法的应用优势在于其计算速度快、精度较高。
通过使用合适的滤波器和阈值处理方法,NCC算法可以在保证匹配精度的同时减小计算量,提高处理速度。
此外,NCC算法还可以处理不同视角、光照和噪声条件下的图像,具有较强的鲁棒性。
在实际应用中,双目立体匹配的NCC算法通常与其他技术相结合,如特征点提取、特征匹配和三角测量等,以实现精确的立体视觉应用,如自动驾驶、机器人导航和医学影像等。
通过双目立体匹配技术,可以获取更加精确的三维信息,为各种应用提供更可靠的支撑。
总之,双目立体匹配的NCC算法是一种常用的图像处理技术,用于在双目立体视觉系统中实现图像匹配。
通过使用合适的滤波器和阈值处理方法,NCC算法可以在保证匹配精度的同时提高处理速度和鲁棒性。
双目立体视觉匹配
双目立体视觉匹配双目立体视觉匹配是指通过两只眼睛同时观察到的图像,通过视觉系统对两个图像进行匹配,并根据匹配结果确定物体在三维空间中的位置和形状。
双目立体视觉匹配是一种基于人类视觉系统的方法,人类通过两只眼睛分别观察到的图像,通过视觉系统对两个图像进行匹配,并将两个图像的匹配点映射到同一坐标系中,从而获取物体在三维空间中的位置和形状信息。
在人类视觉系统中,双眼之间的距离产生了视差,即两只眼睛在观察到同一物体时,由于视角的差异,物体在两个眼睛的图像上的位置会有一定的偏移。
基于这种视差信息,人类能够通过视觉将物体分辨为不同的立体结构,并判断其位置和形状。
在计算机视觉领域,双目立体视觉匹配是一种常用的三维重建方法,通过计算机对两个眼睛观察到的图像进行匹配,可以获取物体的深度信息,实现对三维物体的识别、分割和重建。
双目立体视觉匹配的基本原理是通过像素级别的图像匹配,找到两个图像中对应点的位置关系,进而利用视差信息计算物体的三维位置。
在双目立体视觉匹配中,常用的算法包括基于区域的方法和基于特征的方法。
基于区域的方法将图像分成若干个区域,在每个区域内进行像素级别的匹配,计算出视差图。
而基于特征的方法通过对图像提取特征点,然后进行特征点匹配,计算出视差图。
常用的特征点包括角点、边缘和纹理点等。
双目立体视觉匹配的应用非常广泛,包括机器人导航、自动驾驶、三维重建、虚拟现实等领域。
比如在机器人导航中,双目立体视觉匹配可以用于确定机器人相对于环境的位置,避免障碍物;在自动驾驶中,双目立体视觉匹配可以用于感知周围车辆和行人,提供环境信息;在三维重建中,双目立体视觉匹配可以用于捕捉物体的形状、大小和位置;在虚拟现实中,双目立体视觉匹配可以用于生成逼真的立体效果。
基于双视线特征感知编组的影像匹配方法
摘
要 : 点特征相 比 , 与 高级 别 的 特 征 , 别是 自 由形 状 线 特 征 包含 了更 加 丰 富的 信 息 , 对 于其 后 的 影像 解 译 特 这
和表面重建等处理是更为有利的。针对传统 自由形状线特征 匹配方法的弊端—— 匹配成功 的线特征数量较 少, 引入 了感知 编组理论 , 出了一种基 于双视 线特征 感知编组的影像 匹配方法 。实验证 明该 方法不仅 可以提 高成功匹配的 提
p r e ta ra iain t e r si t d c d it h thn r c s , a d a ma e ma c ig meh d b s d o e c p u e c p u lo g n z t h oy wa r u e n o t emac i g p o e s n n i g th n t o a e n p r e ta o n o l o g n z t n o n a e t r s i t ro c p c i g s w sp o o e .A c r i g t e r s l ft e e p rme t hs ag rtm ra iai f i e rf au e n se e so i ma e a rp s d o l c o d n o t e u t o x ei n ,t i l o i h s h h a v n e h u c s ai ff e fr l e e t r s ma c ig a d i ce s st e ln t ffe — r i e rf au e ,wh c d a c st e S c e s rto o e — m i a f au e th n n n ra e h e gh o r e fm l a e tr s r o nr o n ih
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第30卷第8期2010年8月计算机应用JournalofComputerApplicationsV01.30No.8Aug.2010文章编号:1001—9081(20LO)08—2088—03基于双视线特征感知编组的影像匹配方法郭海涛1,徐青1,丛凤波2,张保明1(1.信息工程大学测绘学院,郑州450052;2.65015部队,辽宁大连116023)(ght7776@163.con)摘要:与点特征相比,高级别的特征,特别是自由形状线特征包含了更加丰富的信息,这对于其后的影像解译和表面重建等处理是更为有利的。
针对传统自由形状线特征匹配方法的弊端——匹配成功的线特征数量较少,引入了感知编组理论,提出了一种基于双视线特征感知编组的影像匹配方法。
实验证明该方法不仅可以提高成功匹配的自由形状线特征数量,还可增加自由形状线特征的长度,方便后续人工地物(如建筑物)的提取。
关键词:线特征;影像匹配;感知编组中图分类号:TP391.41文献标志码:AImagematchingmethodbasedonperceptualorganizationoflinearfeaturesinstereoscopicimagesGUOHai—ta01,XUQin91,CONGFeng—b02,ZHANGBao—min91(1.InstituteofSuwe—ngandMapping,InformationEngineeringUnivemit如ZhengzhouHenan450052,China;2.Unit65015ofPLA,DalianLiaoning116023,China)Abstract:Comparedwithpointfeatures,high—levelfeatures,especiallyfree—formlinearfeatures,containabundantinformation,whicharemorebenefieialtotheconsequentimageinterpretationandsurfaeereconstruction,ete.But,thelinearfeaturesthatcanbematchedsuccessfullywithtypicalmethodarefew.Concerningtheweaknessoftypicalmatchingmethods,perceptualorganizationtheorywasintroducedintothematchingprocess,andanimagematchingmethodbasedonperceptualorganizationoflinearfeaturesinstereoscopicimageswasproposed.Accordingtotheresultsoftheexperiment,thisalgorithmadvancesthesuccessratiooffree—formlinearfeaturesmatchingandincreasesthelengthoffree—formlinearfeatures,whichfacilitatesthesubsequentmanualobjectsextraction.Keywords:linearfeature;imagematching;perceptualorganization0引言在计算机视觉和摄影测量界,立体视觉是获取物体三维信息的重要手段。
而实现立体视觉的关键技术问题就是如何快速、准确地实现影像匹配。
影像匹配问题的挑战性、学科的交叉特色和诱人的应用前景,使得影像匹配技术仍然是当前和今后相当长一段时间内研究的热点问题。
1J。
特征匹配现在被认为比灰度匹配具有更广阔的应用前景。
同其他特征相比,自由形状线特征包含了更加丰富的信息,解决匹配模糊性的能力更强,这样也就使得匹配更加稳健,对影像匹配后的影像解译和表面重建等处理也更为有利。
因此研究自由形状线特征匹配具有重要的实用价值。
2o。
目前,国内外已出现了一些用于自由形状线特征匹配的方法,特别是在国外的计算机视觉领域已有一些研究成果。
如Toth等人研究的匹配算法是首先通过边缘检测算子提取影像边缘信息,然后对边缘进行参数描述,最后利用特征参数进行匹配从而形成一一对应的特征匹配表。
3“o。
文献[5]在研究自由形状线特征描述、匹配实体选取、相似性测度的确定等自由形状线特征匹配的关键问题的基础上,提出了一种针对自由形状线特征的影像匹配方法。
但这些方法都存在一个弊端——匹配成功的线特征数量是非常有限的,占总特征的小部分,这样的结果必然会造成后续表面重建的困难。
本文在对上述困难进行分析的基础上,提出了一种基于双视线特征感知编组的影像匹配方法,大大提高了成功匹配的自由形状线特征数量。
1感知编组感知编组,也称感知组织或知觉组织,其概念起源于心理学的Gestalt学派,由Wertheimer等人始建于20世纪20年代。
在计算机视觉领域,感知编组是一种基于人类认知事物规律进行推演的理论。
它可以使得大多数视觉系统将原始数据(包括边缘、直线、区域等)组织成为有意义的组合或结构,而且这种组合或结构不随视点的变化而变化。
计算机视觉领域早已公认感知编组在计算机视觉领域中具有相当重要的意义,而感知编组能用最少的领域知识形成目标假设,降低视觉识别过程的计算复杂度。
6。
7o。
由于感知编组过程既涉及到下层的特征提取等初级视觉信息加工,又涉及到上层的检测、识别、语义理解等高级任务,在视知觉中起着承上启下的作用,在立体视觉、图像重建、运动分析、轮廓提取、图像分割、目标识别等许多方面得到广泛应用,当然它也是计算机视觉处理中最重要也是最困难的问题之一。
收稿日期:2010—02—26;修回日期:2010—03—30。
基金项目:总装备部“十一五”预研项目(40601030404)。
作者简介:郭海涛(1976一),男,河南新安人,讲师,博士,主要研究方向:数字摄影测量、数字图像处理;徐青(1964一),男,浙江磬安人,教授,博士生导师,主要研究方向:数字摄影测量、三维仿真;丛风波(1976一),女,吉林海龙人,工程师,主要研究方向:数字图像处理、数字摄影测量;张保明(1961一),男,河北安国人,教授,博士生导师,主要研究方向:数字摄影测量、数字图像处理。
万方数据第8期郭海涛等:基于双视线特征感知编组的影像匹配方法2089感知编组模仿人类视觉系统的感知组织能力并借鉴其若干基本的组合规则,将图像中的几何要素(如线段、角点等)逐步地组合出有意义的图像特征,最终生成稳定的、非偶然的图像特征组合,达到感知场景目标的目的。
Gestalt心理学家早在20世纪初就提出了一些感知编组的规则,这些规则反映了环境信息以何种方式组合成能被感知的单元整体,因此也被当做拓扑知觉理论中整体性质的元素。
这些规则包括邻近性规则、相似性规则、封闭性规则、对称性规则、连续性规则、同一区域性规则、连接性规则、平行性规则、垂直性规则、共圆性规则等¨o。
本文将感知编组理论引入到遥感影像自由形状线特征的匹配中,依据感知编组的邻近性、连接性和封闭性等规则,在匹配中编组,在编组中匹配,既提高了匹配成功的线特征数量,又增加了自由形状线特征的长度,方便了后续人工地物(如建筑物)的提取。
2传统方法的不足和解决方案传统的线特征匹配算法匹配成功的线特征数量较少,主要有两方面的原因:一是基于单像的特征提取不可避免地会导致同名线特征不一定存在;二是对于那些长度较短,特征本身包含信息量较少的线特征,在线特征匹配时考虑到其匹配的可靠性可能不高,往往进行了舍弃。
如果是因影像遮蔽等造成同名线特征本身就不存在的(与特征提取算法无关),这种情况往往是无法正确匹配的。
但如果同名线特征本身存在,由于受摄影条件及其他因素影响,以及基于单像特征提取算法的影响,造成同名线特征没有得到正确提取或提取不一致而无法成功匹配的,这些情况下认为仍然是可以匹配的。
另外,长度较短,本身包含信息量较少的线特征也认为仍然是可以匹配的。
如果能将这部分线特征得到成功匹配,将会极大地提高匹配成功的自由形状线特征的数量。
针对那些因长度较短,本身包含的信息量较少的线特征的匹配,本文引入严格的平均左右视差约束,实际上相当于将那些信息量较少的线特征绑定在已成功匹配的信息量较大的线特征上一起进行匹配;针对那些因单像特征提取算法的影响或其他因素的影响造成同名线特征没有得到正确提取或提取不一致情况下的线特征匹配,提出了一种对构成立体像对的左右影像(双视)已匹配的线特征和原始提取的线特征进行感知编组的方法来实现这类线特征的匹配。
3基于双视线特征感知编组的影像匹配方法这里的基于双视线特征融合编组的影像匹配是以文献[5]的自由形状线特征匹配为基础的。
首先依据文献[5]的匹配方法进行自由形状线特征匹配,以线特征匹配的结果作为基础,计算已匹配的每对线特征的平均左右视差值;接着对影像中的线特征进行分组,将位置上相邻,平均左右视差值又相近的线特征分为一组;对每一组线特征,在左右影像上确定其作用窗口,然后引入平均视差约束,在左右窗口内利用自由形状线特征匹配方法。
5o匹配其他长度较短(信息量较少)的线特征;然后结合左影像作用窗口内原特征提取结果与现匹配结果对右影像作用窗口内的特征进行编组,反过来,再结合右影像作用窗口内原特征提取结果与现匹配结果对左影像作用窗口内的特征进行编组;最后融合左右影像作用窗口内的线特征进行编组匹配。
具体步骤如下。
1)计算已匹配的每对线特征的平均左右视差值。
自由形状线特征的匹配方法见文献[5],已匹配的每对线特征的平均左右视差值的计算方法是将每对线特征首尾两点的左右视差取平均值。
2)线特征分组。
将已匹配的,位置上相邻,平均左右视差值又相近的线特征分为一组。
对左影像上的某一已得到匹配的线特征,在其周围一定范围内搜索与其平均左右视差值相近的线特征(可能不止一条),将这些线特征分为一组,并记录下其共同的平均左右视差值。
同样方法,对其他没有分组的线特征也进行分组。
3)在左右作用窗口内对信息量较少的线特征进行匹配。
对每一组的线特征,在左右影像上确定其作用窗口。
影像上假设有/7,条线特征被分为一组,首先,要找出这/7,条线特征所围区域的外接矩形(如图1中的虚线矩形),然后再将外接矩形的四条边各向外扩一定距离(本实验中取10个像素)构成作用窗口(如图1中的实线矩形)。
(a)左影像上线特征组的作用窗VI(b)右影像上对应的作用窗图1左右影像上某线特征组的作用窗口的确定引入这组线特征的平均左右视差约束,在左右作用窗口内匹配其他长度较短(信息量较少)的线特征。