立体视觉匹配.

合集下载

《基于双目视觉的立体匹配算法研究及应用》范文

《基于双目视觉的立体匹配算法研究及应用》篇一一、引言随着计算机视觉技术的不断发展，双目视觉技术已成为三维重建、机器人导航、自动驾驶等领域的重要技术手段。

其中，立体匹配算法是双目视觉技术的核心，其精度和稳定性直接影响着双目视觉系统的性能。

本文将介绍基于双目视觉的立体匹配算法的研究现状、原理及应用，并探讨其在实际应用中的优化与改进。

二、双目视觉的立体匹配算法研究1. 算法概述双目视觉的立体匹配算法是通过分析两个相机从不同视角获取的图像，从而恢复出场景的三维信息。

立体匹配算法主要包括特征提取、特征匹配和视差计算三个步骤。

其中，特征提取是提取出两幅图像中的有用信息，特征匹配则是根据一定的匹配准则，将两幅图像中的特征进行匹配，最后通过视差计算得到场景的三维信息。

2. 算法原理立体匹配算法的原理是基于视差原理，即同一场景从不同视角观察时，物体在左右图像中的位置会有所偏差。

通过比较两幅图像中对应位置的像素或特征，可以计算出视差，从而得到场景的三维信息。

在特征提取阶段，算法会提取出两幅图像中的关键点或特征描述符，如SIFT、SURF等；在特征匹配阶段，算法会根据一定的匹配准则，如欧氏距离、互信息等，将两幅图像中的特征进行匹配；在视差计算阶段，算法会根据匹配结果计算出视差图，从而得到场景的三维信息。

三、立体匹配算法的应用双目视觉的立体匹配算法在多个领域得到了广泛应用。

在机器人导航领域，可以通过双目视觉系统实现机器人的三维环境感知和避障；在自动驾驶领域，可以通过双目视觉系统实现车辆的自主驾驶和道路识别；在三维重建领域，可以通过双目视觉系统实现场景的三维重建和模型构建。

此外，立体匹配算法还可以应用于虚拟现实、人机交互等领域。

四、立体匹配算法的优化与改进针对立体匹配算法在实际应用中存在的问题，如匹配精度低、计算量大等，研究人员提出了多种优化与改进方法。

首先，可以通过改进特征提取算法，提取出更鲁棒、更丰富的特征信息；其次，可以通过优化匹配准则和匹配策略，提高匹配精度和计算效率；此外，还可以通过引入深度学习等技术，实现更准确的特征匹配和视差计算。

特征点立体匹配算法

特征点立体匹配算法全文共四篇示例，供读者参考第一篇示例：特征点立体匹配算法是计算机视觉领域一个重要的研究方向，它主要用于解决立体视觉中的三维重建问题。

在立体视觉中，我们通常会使用两个或多个摄像头来拍摄同一个场景，然后通过立体匹配算法来计算出图像中每个像素点的深度信息，从而实现对场景的三维重建。

在立体视觉中，特征点是图像中具有独特性质的像素点，通常通过局部特征描述子来描述。

特征点立体匹配算法的核心思想是通过在图像中提取特征点，并通过这些特征点之间的匹配关系来计算出像素点的深度信息。

特征点的提取和匹配是整个算法的关键步骤，下面我们将分别介绍这两个方面。

特征点的提取是指在图像中寻找具有独特性质的像素点，这些点在不同图像中具有相似的位置和特征描述子。

常见的特征点提取算法包括SIFT、SURF、ORB等。

这些算法都能够提取出图像中具有独特性质的像素点，并生成描述这些特征点的局部特征描述子。

在立体匹配算法中，我们通常会使用这些特征点来进行匹配，从而计算出图像中像素点的深度信息。

特征点的匹配是指在两幅图像中找到具有相似特征描述子的特征点，并建立它们之间的对应关系。

常见的特征点匹配算法包括最近邻匹配、RANSAC算法等。

在立体匹配算法中，我们通常会通过计算特征点之间的距离或相似性来确定它们之间的匹配关系，然后通过这些匹配关系来计算出像素点的深度信息。

特征点立体匹配算法在三维重建领域有着广泛的应用，例如在机器人导航、三维建模、虚拟现实等领域。

通过对图像中特征点的提取和匹配，我们可以实现对场景的精确重建，从而为机器人导航、虚拟现实等应用提供有力的支持。

第二篇示例：特征点立体匹配算法是计算机视觉领域中一种重要的算法，用于解决立体视觉中的匹配问题。

在立体视觉中，通过两个摄像头或者两个视点获取的图像来获取景深信息。

而特征点立体匹配算法则是一种通过提取图像中的特征点，然后在两个图像中找到相互对应的特征点，从而得到图像的对应关系，从而计算出景深的算法。

计算机视觉立体匹配方法

计算机视觉立体匹配方法摘要:立体匹配技术是计算机视觉研究中的关键技术之一。

本文根据立体匹配的内容,从基元选择、匹配准则、算法结构三个方面进行了阐述。

指出了主要匹配算法的特点和研究的发展趋势。

关键词:立体匹配基线极线计算机视觉研究是通过从二维平面的图像中获得三维空间的结构和属性等信息,从而完成在复杂多变的环境中导航和识别等一系列工作。

随着技术的不断升级和新产品的快速引入,计算机视觉技术的研究越来越受到科技界的重视,而随着研究的不断深入,计算机视觉技术的应用领域也得到进一步的拓展[1]。

计算机视觉技术是用计算机来模拟生物外显或宏观视觉功能的科学和技术,用计算机图像创建或恢复现实世界的模型,反过来认知现实的世界。

目前,计算机视觉技术的应用领域包括对照片特别是航拍照片和卫星照片的解析、武器的精确制导、移动设备的立体视觉导航、医学辅助诊断、工业机器人的控制系统、地理地图的绘制、物体三维形状分析与识别以及智能人机接口等,在立体视觉的应用中非常广泛的应用。

立体匹配是立体视觉中最重的也是最困难的问题。

选择正确的匹配特征、寻找特征间的本质属性及建立能正确匹配所特征的稳定算法。

1 立体视觉匹配的内容立体视觉是由多幅图像获取的物体三维几何的信息方法,立体匹配是三维声景结构信息获取的研究热点之一,是从两上视点观察同一景物以获取立体像对匹配出相应像点,从而计算出视差并获得三维信息。

点、线和区域特征等是常用匹配特征。

其中最为基本和简单的是点状特征,具有定位准确、检测和描述容易重建精度高优点。

区域基元和线状基元含有更丰富的图像信息,在图像中数目较少,匹配快速,其中区域基元具有最好的全局属性。

对于匹配基元类型的选择取决于匹配图像对本身的属性特点和应用要求。

匹配合理地选择是立体视觉匹配问题的解决主要方法,要求具有性能稳定、抗噪性强、易于检测和描述。

通过抽取图像局部结构较为丰富的描述来减少错误对应的可能性。

在两幅图的共轭点间作匹配时应用选择性规则来限制搜索空间。

双目立体视觉匹配

双目立体视觉匹配双目立体视觉匹配是现代计算机视觉领域中的一项重要技术。

人类视觉系统能够通过两只眼睛获取到不同的视角，从而对空间场景有更加深入的了解。

而计算机视觉系统也可以通过双目视觉技术实现类似的效果，从而实现3D场景的感知、识别和重建。

双目立体视觉匹配的基本原理是通过计算两个视角图像之间的差异，从而确定像素点在3D空间中的位置。

这种差异可以通过计算两个图像之间的视差（即两个像素点之间的水平距离）来实现。

因此，双目立体视觉匹配需要寻找一种合适的方法来计算两个图像之间的匹配点。

在双目立体视觉匹配技术中，一般采用以下几种方法来实现：1、全匹配法全匹配法是双目立体视觉匹配技术中最简单的方法之一。

该方法首先对参考图像中的每个像素点在目标图像中进行搜索，然后比较两个像素点之间的相似度。

如果相似度高于某个阈值，则认为两个像素点匹配成功，确定它们在3D空间中的位置。

由于全匹配法计算量较大，因此很难应用于实际场景下的实时计算。

2、相似性度量法3、特征点匹配法特征点匹配法是一种基于关键点匹配的方法。

该方法首先使用特征检测算法（如SIFT 或SURF）在两张图像中提取出关键点，并计算它们的描述子。

然后通过计算描述子之间的相似度，从而将参考图像中的关键点与目标图像中的关键点进行匹配。

在匹配成功之后，根据匹配的关键点确定两个图像之间的视差，从而确定像素点在3D空间中的位置。

相比于前两种方法，特征点匹配法具有更高的准确性和鲁棒性，但是计算量也更大。

双目立体视觉匹配技术在实际应用中有着广泛的应用场景。

比如在智能驾驶领域，双目立体视觉可以通过获取3D场景信息来实现车辆的自动导航和避障。

另外，在工业制造领域，双目立体视觉可以用于3D物体的反复制造和检测。

因此，双目立体视觉匹配技术的研究和应用具有非常重要的意义。

3D视觉中的立体匹配算法研究与改进

3D视觉中的立体匹配算法研究与改进在3D视觉领域中，立体匹配算法是一项重要的技术，用于处理立体图像的深度信息。

立体匹配算法旨在通过对图像中的对应点进行匹配，确定它们之间的距离，从而重构场景的三维结构。

本文将对3D视觉中的立体匹配算法进行研究与改进。

一、立体匹配算法的基本原理立体匹配算法的基本原理是通过比较左右两幅立体图像的像素信息，找到它们之间的对应点，并计算出距离或深度信息。

常用的立体匹配算法包括视差法、基于特征的立体匹配、图割算法等。

视差法是最传统的立体匹配算法之一。

它通过比较左右图像中像素的灰度值差异来确定对应点的视差值，再通过一定的几何关系计算出深度信息。

视差法简单易实现，但对于纹理丰富、边缘模糊等情况下的图像匹配效果不佳。

基于特征的立体匹配算法利用图像中的特征点（如角点、边缘等）进行匹配，以获得更准确的结果。

该算法通常包括特征提取、特征匹配和深度计算等步骤。

特征点的选择和匹配精度对立体匹配结果的准确性有着重要影响。

图割算法是一种基于图论的立体匹配算法，它将立体匹配问题转化为图割问题。

通过构建能量函数，利用图割算法来计算最小代价的匹配结果。

图割算法具有较高的准确性和鲁棒性，但计算复杂度较高，不适用于实时系统。

二、立体匹配算法的常见问题在实际应用中，立体匹配算法仍然存在一些问题，限制了其性能和应用范围。

主要问题包括视差失真、运动物体处理、低纹理区域匹配等。

视差失真是指由于视角变化或透视变换等原因导致匹配误差增大。

特别是在远处或大角度情况下，视差估计会出现积累误差，使得深度信息不准确。

解决视差失真问题的方法包括视角校正、立体图像重建等。

运动物体处理是指当场景中存在运动物体时，立体匹配算法难以准确地匹配对应点。

运动物体造成图像中的对应点轻微偏移，导致匹配错误。

针对这个问题，可以采用背景建模、光流估计等方法来提高立体匹配的稳定性。

低纹理区域匹配是立体匹配中的一个挑战性问题。

在低纹理区域，图像中的对应点很少或没有，难以准确匹配。

双目立体视觉匹配

双目立体视觉匹配
双目立体视觉匹配是指人眼通过观察同一物体时，通过两只眼睛的视差差异来确定物
体的深度信息。

在双目立体视觉匹配中，人眼的左右眼分别拍摄到不同的图像，这些图像
经过处理后可以生成3D影像，使观看者可以感受到物体的深度、高低、远近等空间信息。

在双目立体视觉匹配中，眼睛的视差是非常重要的因素。

视差是指两只眼睛观察同一
物体时产生的差异，它是测量物体深度的重要指标。

视差越大，表示物体越近；视差越小，表示物体越远。

双目立体视觉匹配的过程，就是通过计算两只眼睛的视差来确定物体的深
度信息。

为了实现双目立体视觉匹配，需要通过计算机视觉算法来处理图像。

其中一个重要的
算法是视差算法。

视差算法是通过计算两个图像像素之间的差异来确定眼睛的视差。

这种
算法可以应用于机器视觉中，用于检测目标的深度信息。

双目立体视觉匹配的应用非常广泛，特别是在机器人视觉和自动驾驶领域。

例如，在
机器人视觉中，可以通过双目立体视觉匹配来定位和识别目标物体，以实现机器人的自主
导航和操作。

在自动驾驶领域，可以利用双目立体视觉匹配来提高车辆的行驶安全性，避
免与前方障碍物的碰撞。

总之，双目立体视觉匹配是一项非常重要的技术，它可以使计算机和机器人更接近人
类的视觉感受和思维方式。

随着计算机技术和人工智能的不断进步，双目立体视觉匹配将
会在更广泛的应用领域得到推广和发展。

双目立体视觉系统分类

双目立体视觉系统分类一、引言双目立体视觉系统是一种通过模拟人类双眼来感知物体深度的计算机视觉技术。

它模仿了人类的双眼视觉系统，并利用两个相机采集不同视角的图像，通过计算两个图像之间的视差（视点之间的差异），从而获取物体的三维信息。

本文将对双目立体视觉系统的分类进行全面、详细、完整且深入地探讨。

二、传统方法传统的双目立体视觉系统主要包括以下几种分类：1. 匹配算法匹配算法是双目立体视觉系统的核心算法之一。

它通过比较两个图像中对应的像素点（称为对极约束），找到它们之间的匹配关系，在此基础上计算视差。

常见的匹配算法包括：•基于灰度的匹配算法：使用像素灰度值进行匹配，如SAD（Sum of Absolute Differences）和SSD（Sum of Squared Differences）等。

•基于特征点的匹配算法：使用特征点提取算法，如SIFT（Scale-Invariant Feature Transform）和SURF（Speeded Up Robust Features）等，进行匹配。

2. 深度计算深度计算是双目立体视觉系统的另一个重要任务。

它通过视差计算得到每个像素点的深度信息。

常见的深度计算方法包括：•三角测量法：利用成像几何关系，利用相机的内外参，计算出像素点的三维坐标，从而得到深度信息。

•基于视差图的深度计算：根据视差图，通过一定的数学模型和滤波方法，计算出每个像素点的深度。

3. 重建方法重建方法是将双目立体视觉系统获取的二维图像信息转换为三维点云或三维模型的过程。

常见的重建方法包括：•点云重建：利用深度信息，将每个像素点转化为三维空间中的点，并通过点云生成算法，生成完整的点云模型。

•三维模型重建：利用深度信息，将每个像素点转换为三维空间中的点，并通过三维模型重建算法（如表面重建算法），生成连续的三维模型。

三、深度学习方法随着深度学习的发展，越来越多的研究者开始探索使用深度学习方法解决双目立体视觉任务。

基于RANSAC算法的极线约束立体视觉匹配方法研究

摘要：立体视觉匹配一直是机器视觉和模式识别领域中的一个重要问题。极线约束是立体匹配中的基
本约束之一，为进一步提高立体匹配精度和效率，在对极线约束数学描述推导的基础上，通过求解基本矩阵得到相应匹配点的极线，提出了求解基本矩阵的一般算法，即采用ＲＡＮＳＡＣ算法。首先得到特征点的初始匹配点对，然后运用７点算法将初始匹配点对划分为内点和外点，最后用所有的内点来重新计算优化基本矩阵，并通过对实际图像的立体视觉匹配实验，以验证该匹配算法的有效性。关键词：极线约束；基本矩阵；ＲＡＮＳＡＣ算法；立体匹配
Ｅｐｉｐｏｌａｒｌｉｎｅｃｏｎｓｔｒａｉｎｔｓａｒｅｏｆｔｅｎｅｍｐｌｏｙｅｄｉｎｔｈｅｓｔｅｒｅｏｍａｔｃｈｉｎｇ．Ｔｈｅｍａｔｈｅｍａｔｉｃｄｅｓｃｉｐｔｒｉｏｎｏｆｔｈｅｅｐｉ・
第ｌ１期
２０１３年ｌ１月
组合机床与自动化加工技术
ＭｏｄｕｌａｒＭａｃｈｉｎｅＴｏｏｌ＆ＡｕｔｏｍａｔｉｃＭａｎｕｆａｃｔｕｒｉｎｇＴｅｃｈｎｉｑｕｅ
ＮＯ．１１
ＺＨＡＮＧＰｅｉ — ｙｕｎ，ＨＵＡＸｉ — ｊｕｎ，ＸＩＡＬｅ — ｃｈｕｎ，ＦＵＹｏｎｇ — ｈｏｎｇ（ＣｏｌｌｅｇｅｏｆＭｅｃｈａｎｉｃａｌＥｎｇｉｎｅｅｒｉｎｇ，ＪｉａｎｇｓｕＵｎｉｖｅｒｓｉｔｙ，ＺｈｅｎｊｉａｎｇＪｉａｎｇｓｕ２１２０１３，Ｃｈｉｎａ）

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

立体视觉匹配
4分
开放分类：人工智能图像处理计算机视觉
收藏分享到顶[2]
目录
•
1 背景

•
2 发展与现状

•
3 问题描述

•
展开全部

摘要纠错编辑摘要
立体视觉匹配（Stereo Correspondence）的目标是从不同视点图像中找到匹配的对应点。
立体视觉匹配（Stereo Correspondence）是计算机视觉中的一个重要而又非常困难的问题，
它的目标是从不同视点图像中找到匹配的对应点。
立体视觉匹配- 背景

人类的双目立体视觉系统是一个非常智能的系统。场景中的光线在人眼这个精密的成像系统
中被采集，通过神经中枢被送入包含有数以亿计的神经元的大脑中被并行的处理，得到了实
时的高清晰度的准确的深度感觉信息。凭借着大脑的智能与人类的知识，即使是高度近视的
人，在摘掉眼镜之后仍然能够得到比较准确的深度感。这样智能的系统，使得人类对环境的
适应能力大大提高，很多复杂的动作能够得以完成：如行走、体育运动、驾驶车辆以及进
行科学实验等。

相比之下，机器的立体视觉系统则要落后得多。相机采集到的图像数据中可能存在较大的噪
声，相机参数也有可能不对称；用于处理图像的计算机大部分还是冯~$\cdot$~诺依曼结
构的串行计算机，处理能力与人脑相差甚远。计算机视觉的研究历史也不长：上世纪七十年
代末之前的视觉研究主要集中于生理学和心理学上；在大卫·马尔提出了视觉计算模型以后，
人们才慢慢的开始利用计算机和数学模型进行视觉处理。早期的立体视觉，由于受限于硬件
条件，只能对图像上的特征点进行匹配，得到离散点的深度信息。然而，计算机硬件
的发展非常迅速，正如摩尔定律所指出的，每 18 个月，计算机的硬件价格就下降一半，而
性能则提高一倍。当计算机的处理能力不断提高的时候，人们开始尝试计算整幅图的稠密对
应关系，同时也开始采用一些更加复杂更加准确的数学工具进行计算。

当前计算机立体视觉的水平与人类的双目视觉水平还相距甚远，对它的研究仍然是一个非常
活跃的领域。大量的学校、公司以及研究机构的研究人员仍然在进行着对计算机立体视觉的
研究，这是因为计算机立体视觉与人眼立体视觉相比，主要有以下不可替代的优点：
* 精度高。人眼的立体感知能力虽然很强，能够很轻松的正确判断出两个物体的深度顺
序，但是却无法得到其精确的距离信息。然而，使用计算机立体视觉，通过精确的标定，使
用合适的计算方法，在匹配正确的情况下可以得到非常精确的深度和位置等数值信息，这使
得机器人的精密控制、三维模型重建等工作可以更好的完成。

* 扩展能力强大。由于计算机硬件和软件不像人类的器官那样不可改变，计算机立体视
觉可以从各个方面对其进行扩展，以满足不同应用的需求。首先，计算机立体视觉并不限于
双目视觉，很多系统使用了三相机、多相机甚至相机矩阵采集图像。相机的摆放方式除了类
似人眼的水平摆放，还可以采用垂直摆放、环绕摆放以及立体摆放等多种灵活的方式，有一
些系统的相机间的关系还可以根据需要进行动态变化。此外，除了可见光，使用特殊的相机，
还可以采集到其它各种类型的输入数据，如红外线、核磁共振等。所以说，计算机立体视觉
技术具有强大的扩展能力，能够提供比人眼立体视觉系统更丰富的信息。

* 除了以上的两个特点，计算机还具有连续工作时间长、不易损坏、保密性好、没有培
训成本、结果易于保存和复制等优点。

由此看来，对于立体视觉匹配的研究，能够大大的增强计算机或机器人对环境的感知能力，
使得机器人能够更好的适应环境、更加智能，从而能够更好的为人们服务。

如今立体视觉技术主要应用于如下一些领域：三维环境感知与建模、机器人导航、物体跟踪
与检测以及图像分割等。随着立体视觉技术的进一步发展，可能会有更多的领域使用这项技
术。
立体视觉匹配-发展与现状

如前所述，计算机视觉起始于大卫·马尔等人提出的视觉的可计算模型。最简单的的匹配算
法利用匹配点周围一个固定大小的窗口的灰度分布，在一个可能的视差范围内，通过寻找两
个对应窗口图像向量的归一化相关值的最大值得到视差，这一类方法也被称为“区域匹配”
方法（Area Matching）。区域匹配的一个假设是空间的平面是所谓的正平面，也就是与相
机平面平行的平面，而实际的场景中存在着大量的非正平面，因此人们开始考虑利用一些更
有意义的特征点（感兴趣点）来进行匹配，这种方法也被称为特征匹配（Feature Matching）
方法，如 Marr和 Poggio 提出了多尺度的匹配算法，利用不同的 Laplacian 过零点以及
梯度进行匹配。

立体视觉匹配的另一个挑战在于匹配的歧义性：对于一幅图上的某个像素或特征，另一幅图
像可能有若干特征与之相似，如何选择正确的匹配是一个困难而又必须解决的问题。Barn 提
出了松弛标号法（Relaxation-Labeling），利用平滑性和投票的策略解决歧义性问题；
Pollard 等人定义了离散视差的视差梯度，通过限制视差梯度减小歧义情况下的错匹配；
Marr 和 Poggio 以及 Zitnick 和 Kanade 采用了合作的匹配框架，试图通过多个特征的匹
配信息以及唯一性假设来解决歧义。更好的方法是采用全局的方法进行求解，把多个像素
或特征的视差求解归一到一个能量框架下。使用了能量优化的框架之后，能量函数的定义和
优化变成了两个较为独立的问题，可以分别加以研究和解决。在定义能量函数方面，不同
的算法采用不同的匹配信息和不同的先验假设来描述能量函数中的不同部分，通过这些假设
把大量的特征联系起来，联合求解以消除歧义。在能量优化方法方面，较传统的有模拟退火
（Simulated Annealing）算法、最可靠有限算法等。近些年，基于图切割（Graph-Cuts）
和置信度传递（Belief-Propogation）的优化算法逐渐被广泛采用。以上算法的速度都较慢，
主要原因在于当平滑函数为一般函数的时候，以上的能量优化函数是一个 NP难题。为了
提高效率，一些研究人员考虑采用具有低阶多项式复杂度的动态规划算法，此时需要把优化
局限于单条扫描线或把多连通的图变成一棵树。
立体视觉匹配-问题描述

图 1：标准配置下双目立体视觉的几何模型和视差的
定义。图中 c 和 c' 分别为参考相机和匹配相机的光心， Z 为空间中点 P 的深度，B 为基线长度，视差
定义为 P 点在两相机中成像的水平坐标的差值 x - x'。
立体视觉匹配问题的输入为若干不同视角的相机采集的图像，输出是这些图像上的点的对应
关系。图 1 为标准配置下双目立体视觉的几何模型。c 和 c' 为两相机的光心，f 为焦距，
B 为两光心的连线，也称为基线，过光心且垂直于成像平面的直线称为光轴。所谓
标准配置
是指两个相机的光轴垂直于基线且互相平行。设两相机的焦距相等，且相机的坐标系的水平
坐标与基线方向平行，则空间中的点 P 在两相机上成的像具有相同的竖直坐标，这个特
点也叫立体视觉的外极线（Epipolar Line）(所谓的外极线是指外极平面和图像平面的交
线，其中外极平面是包含两个焦点和空间点的平面)约束。对于一般配置的相机（如图 2），
通过相机标定和配准，可以得到标准配置下的图像。如无特殊说明，本文余下的部分所涉
及的立体匹配问题，都是建立在标准配置下的几何模型。

图 2：一般位置的相机的立体成像几何模型。通过相机的标定和配准，我们可以得到标准配置下的图像，
如图中的虚线所示。图中的~$c$~和~$c'$~为左右相机的光心，e 和 e' 称为外极点，M 为三维空间中的一
点，m 和 m' 分别为 M 在两相机上的成的像。
设 P 点投影到两相机后的图像分别为 x 和 x'，我们说 x 和 x' 是一对对应点。如果我
们用 x 和 x' 来表示它们的水平坐标，这两个点的对应关系可以由如下定义的视差来描述：
d = x - x'
通过简单的几何关系推导，我们可以得到如下等式：
d = Bf / Z
可见当基线和焦距固定的时候，也就是相机的参数以及相机之间的相对位置和姿态固定不变
的时候，视差与空间的点的深度成反比。因此，只需要知道了视差就可以得到物体的深度，
从而立体视觉匹配问题可以定义为根据来自于不同的相机的图像求解视差的问题。