基于透视投影和坐标变换的相机成像原理分析

合集下载

透视变换法相机标定

透视变换法相机标定
透视变换法是一种相机标定的方法，用于确定相机的内参和外参矩阵。

相机标定是指给定一组已知世界坐标系和相应的相机坐标系的点对，通过计算相机的内参和外参，使得相机能够准确地从相机坐标系转换到世界坐标系。

透视变换法的基本原理是通过相机的投影变换将3D世界坐标系中的点映射到2D相机坐标系中的点。

这个投影变换可以用一个4×4的变换矩阵来表示，其中包含相机的旋转矩阵、平移向量和尺度因子。

相机标定的步骤如下：
1. 准备标定板：使用一个已知尺寸的棋盘格标定板，并在标定板上标记出已知坐标点。

2. 拍摄标定图像：将标定板固定在不同位置和角度，并使用相机拍摄至少10-20张不同角度的标定图像。

3. 检测角点：对于每个标定图像，使用图像处理技术检测标定板上的角点。

4. 提取角点坐标：对于检测到的角点，将其在图像坐标系下的坐标记录下来。

5. 计算相机的内参：使用角点的世界坐标和对应的图像坐标，利用最小二乘法估计相机的内参矩阵，包括焦距、主点坐标和
畸变系数等。

6. 估计相机的外参：使用内参矩阵和角点的世界坐标和图像坐标，通过RANSAC等方法估计相机的旋转矩阵和平移向量。

7. 评估标定结果：使用留一法或重投影误差等方法评估标定结果的准确性。

透视变换法相机标定可以用于计算相机的内参和外参，以及矫正相机的畸变等。

这些参数对于计算机视觉应用中的3D重建、姿态估计和目标跟踪等任务非常重要。

透视成像的原理

透视成像的原理
透视成像的原理是基于光学的原理。

当光线从物体上发出或反射时，经过透镜或凹凸面镜的折射或反射，最终到达观察者的眼睛。

观察者的眼睛接收到这些光线，形成图像在视网膜上。

透视成像的原理可以从以下几个方面解释：
1. 视差：物体距离观察者越近，眼睛接收到的光线强度越大，造成视网膜上图像对应的位置越亮，物体距离观察者越远，眼睛接收到的光线强度越小，造成视网膜上图像对应的位置越暗。

这种差异使得人眼能够感知到物体的远近。

2. 直线透视：当物体远离观察者时，远离的部分相对较小，接近观察者时，接近的部分相对较大。

这是由于眼睛与物体间的角度不同，造成了图像的拉伸和压缩。

3. 锥体投影：透视成像实际上是一种以观察者为中心的锥体投影。

当物体位于锥体的顶点上时，图像非常清晰，但当物体位于锥体的边缘时，图像变得模糊。

这是因为在物体离开焦点区域时，光线不再汇聚在视网膜上形成一个清晰的图像。

这些光学原理共同作用，使得人眼能够感知到透视成像，从而认识到物体的形状、大小和远近。

透视成像在绘画、摄影和建筑设计等领域具有重要的应用。

透视投影矩阵深入原理剖析（转载）

透视投影矩阵深入原理剖析（转载）透视投影是3D固定流水线的重要组成部分，是将相机空间中的点从视锥体(frustum)变换到规则观察体(Canonical View Volume)中，待裁剪完毕后进行透视除法的行为。

在算法中它是通过透视矩阵乘法和透视除法两步完成的。

透视投影变换是令很多刚刚进入3D图形领域的开发人员感到迷惑乃至神秘的一个图形技术。

其中的理解困难在于步骤繁琐，对一些基础知识过分依赖，一旦对它们中的任何地方感到陌生，立刻导致理解停止不前。

没错，主流的3D APIs如OpenGL、D3D的确把具体的透视投影细节封装起来，比如gluPerspective(…)就可以根据输入生成一个透视投影矩阵。

而且在大多数情况下不需要了解具体的内幕算法也可以完成任务。

但是你不觉得，如果想要成为一个职业的图形程序员或游戏开发者，就应该真正降伏透视投影这个家伙么？我们先从必需的基础知识着手，一步一步深入下去（这些知识在很多地方可以单独找到，但我从来没有在同一个地方全部找到，但是你现在找到了J）。

我们首先介绍两个必须掌握的知识。

有了它们，我们才不至于在理解透视投影变换的过程中迷失方向（这里会使用到向量几何、矩阵的部分知识，如果你对此不是很熟悉，可以参考《向量几何在游戏编程中的使用》系列文章）。

齐次坐标表示透视投影变换是在齐次坐标下进行的，而齐次坐标本身就是一个令人迷惑的概念，这里我们先把它理解清楚。

根据《向量几何在游戏编程中的使用6》中关于基的概念。

对于一个向量v以及基oabc，可以找到一组坐标(v1,v2,v3)，使得v = v1 a + v2 b + v3 c （1）而对于一个点p，则可以找到一组坐标（p1,p2,p3），使得p – o = p1 a + p2 b + p3 c （2）从上面对向量和点的表达，我们可以看出为了在坐标系中表示一个点（如p），我们把点的位置看作是对这个基的原点o所进行的一个位移，即一个向量——p – o（有的书中把这样的向量叫做位置向量——起始于坐标原点的特殊向量），我们在表达这个向量的同时用等价的方式表达出了点p:p = o + p1 a + p2 b + p3 c (3)(1)(3)是坐标系下表达一个向量和点的不同表达方式。

基于透视投影和坐标变换的相机成像原理分析

照相设备与原始图像之间不确定度为 5，即 x,y,z 方向上的平移，以及在两个方向之间的转动。而投影平面和照相设备之间不确定都为 2，因为投影设备垂直与照相设备的光轴，消除了 2 个不确定度，且焦距确定，又消除了 1 个不确定度。因此，而每个点以及其投影的之间的对应可以消除 2 个不确定度，因此我们可以根据此方法来求出照相设备的参数。
则
若 M,N 为圆形区域时，L 为 M,N 的公切线。因此 L’为公切线的投影。其中， L’,M’,N’,A’,B’为 L,M,N,A,B 的投影,A,B,A’,B’均为单点。因此我们可以通过“外公切线法定心法”求出靶心在投影平面的投影，方法如图 2 ：
4
图 2 外公切线定心法原理
右图中作出一些直线，这些直线与各个图形仅有 1 个公共点，l , l , l , l ，四条切线交于 A’,B’,C’,D’,如右图，连接 A’C’和 B’D’交与 O’，O’即为靶心所在位置的投影。其对应原图像如左图。
0.491 0.747
0.259 0.598
De Ee
0.528 0.800
4.2.2 两种圆心确定方法的比较
由此可见：使用外公切线定心法时，其精准度和稳定性都比较好，这是因为外公切线定心法可以利用几何特点，更好地锁定靶心的位置。在不利情况下，例如φ接近时，或者 D 教大时，也能较好地算出靶心，因此其稳定性较高。但这种算法需要在数字化图像上计算公切线，计算的时间复杂度较大。
3.2 透视投影原理及坐标变换由于问题涉及到自然坐标系向投影平面的转换，首先我们说明坐标变换的原
理，图 1 为坐标系变换示意图。X Y Z 为观察坐标系，定义为左手坐标系。X’O’Y’ 为投影平面。XYZ 为自然坐标系，定义为右手坐标系。XOY 为原图像所在平面。根据中心透视投影的性质，可以说明物的位置 P、P 的像 P’和O 在一条直线上。

透视投影的原理和实现

透视投影的原理和实现透视投影的原理和实现摘要：透视投影是3D渲染的基本概念，也是3D程序设计的基础。

掌握透视投影的原理对于深⼊理解其他3D渲染管线具有重要作⽤。

本⽂详细介绍了透视投影的原理和算法实现，包括透视投影的标准模型、⼀般模型和屏幕坐标变换等，并通过VC实现了⼀个演⽰程序。

1 概述在计算机三维图像中，投影可以看作是⼀种将三维坐标变换为⼆维坐标的⽅法，常⽤到的有正交投影和透视投影。

正交投影多⽤于三维健模，透视投影则由于和⼈的视觉系统相似，多⽤于在⼆维平⾯中对三维世界的呈现。

透视投影（Perspective Projection）是为了获得接近真实三维物体的视觉效果⽽在⼆维的纸或者画布平⾯上绘图或者渲染的⼀种⽅法，也称为透视图[1]。

它具有消失感、距离感、相同⼤⼩的形体呈现出有规律的变化等⼀系列的透视特性，能逼真地反映形体的空间形象。

透视投影通常⽤于动画、视觉仿真以及其它许多具有真实性反映的⽅⾯。

2 透视投影的原理基本的透视投影模型由视点E和视平⾯P两部分构成（要求 E不在平⾯P上）。

视点可以认为是观察者的位置，也是观察三维世界的⾓度。

视平⾯就是渲染三维对象透视图的⼆维平⾯。

如图1所⽰。

对于世界中的任⼀点X，构造⼀条起点为E并经过X点的射线R，R与平⾯P的交点Xp即是X点的透视投影结果。

三维世界的物体可以看作是由点集合 { Xi} 构成的，这样依次构造起点为E，并经过点Xi的射线Ri，这些射线与视平⾯P的交点集合便是三维世界在当前视点的透视图，如图2所⽰。

图1 透视投影的基本模型图2 透视图成像原理基本透视投影模型对视点E的位置和视平⾯P的⼤⼩都没有限制，只要视点不在视平⾯上即可。

P⽆限⼤只适⽤于理论分析，实际情况总是限定P为⼀定⼤⼩的矩形平⾯，透视结果位于P之外的透视结果将被裁减。

可以想象视平⾯为透明的玻璃窗，视点为玻璃窗前的观察者，观察者透过玻璃窗看到的外部世界，便等同于外部世界在玻璃窗上的透视投影（总感觉不是很恰当，但想不出更好的⽐喻了）。

透视成像的原理

透视成像的原理
透视成像是一种模拟人眼视觉的效果，通过描绘远处物体比近处物体小的特征，给人以深度感和立体感。

这种效果是由于人眼观察物体时，远处物体在视网膜上所占的面积比近处物体小，从而产生的一种视错觉。

透视成像的原理可以通过以下几个方面来理解：
1. 平行投影：在透视成像中，我们通常使用平行投影来描绘远处物体和近处物体。

平行投影是指从观察者的位置，物体沿着平行线投射到画面上，使得远处物体的大小较近处物体小。

2. 透视中心：透视成像的核心概念是透视中心，也被称为视点。

观察者的眼睛位置即为透视中心，通过这个中心可以确定物体的位置和大小。

在透视成像中，物体与透视中心的距离越远，其在画面上的大小就越小。

3. 距离和位置：透视成像中，远离透视中心的物体在画面上会被绘制为较小的尺寸，而靠近透视中心的物体则会被绘制为较大的尺寸。

这种差异性给我们一种深度感和立体感。

总而言之，透视成像的原理是基于人眼观察物体时在视觉上的特征。

通过使用平行投影，确定透视中心以及物体的距离和位置，可以模拟出远近物体的大小差异，从而呈现出真实的深度和立体感。

三维图像投影变换——透视投影

三维图像投影变换——透视投影⼆、投影变换1、平⾯⼏何投影投影变换就是把三维物体投射到投影⾯上得到⼆维平⾯图形。

【计算机绘图是产⽣三维物体的⼆维图象，但屏幕上绘制图形的时候，必须在三维坐标系下考虑画法。

】常⽤的投影法有两⼤类两种投影法的本质区别在于【透视投影】的投影中⼼到投影⾯之间的距离是【有限的】，⽽【平⾏投影】的投影中⼼到投影⾯之间的距离是【⽆限的】。

（1）中⼼（透视）投影透视投影是3D渲染的基本概念，也是3D程序设计的基础。

其中的[p,q,r]能产⽣透视变换的效果1、透视基本原理因为⼀条直线段是由两点确定，多边形平⾯由围城该多边形的各顶点和边框线段确定，⽽任何⽴体也可以看成是由它的顶点和各棱边所构成的⼀个框体。

也就是说，可以通过求出这些【顶点的透视投影】⽽获得空间【任意⽴体的透视投影】。

三维世界的物体可以看作是由点集{X i}构成的，这样依次构造起点为E，并经过点X i的射线R i，这些射线与投影⾯P的交点集合便是三维世界在当前视点的透视图。

投影线均通过投影中⼼，在投影中⼼【相对】投影⾯【确定的】情况下，空间的⼀个点在投影⾯上只存在【唯⼀⼀个】投影。

2、⼀点透视先假设q≠0，p=r=0。

然后对点(x,y,z)进⾏变换图70对其结果进⾏齐次化处理得：A、当y=0时，有说明处于y=0平⾯内的点，经过变换以后没有发⽣变化B、当y→∞时，有说明当y→∞时，所有点的变换结果都集中到了y轴上的1/q处，即所有平⾏于y轴的直线将延伸相较于(0,1/q,0)，该点称为【灭点】，⽽像这样形成⼀个灭点的透视变换称为【⼀点透视】。

同理可知，当p≠0，q=r=0时，则将在x轴上的1/p处产⽣⼀个灭点，坐标为(1/p,0,0)，在这种情况下，所有平⾏于x轴的直线将延伸交于该点。

同理，当r≠0,q=p=0时，则将在z轴上的1/r处产⽣⼀个灭点，其坐标为(0,0,1/r)，这种情况下，所有平⾏于z轴的直线将延伸交于该点。

深度探讨透视投影坐标系

3d图形程序，就一定会做坐标变换.而谈到坐标变换,就不得不提起投影变换，因为它是所有变换中最不容易弄懂的。

但有趣的是,各种关于透视变换的文档却依然是简之又简，甚至还有前后矛盾的地方。

看来如此这般光景，想要弄清楚它,非得自己动手不可了。

所以在下面的文章里,作者尝试推导一遍这个难缠的透视变换，然后把它套用到DX和PS2lib 的实例中去。

1.一般概念所谓透视投影变换,就是view 空间到project 空间的带透视性质的坐标变换步骤（这两个空间的定义可以参考其他文档和书籍）.我们首先来考虑它应该具有那些变换性质。

很显然,它至少要保证我们在view空间中所有处于可视范围内的点通过变换之后，统统落在project空间的可视区域内。

好极了，我们就从这里着手—-先来看看两个空间的可视区域.由于是透视变换，view空间中的可见范围既是常说的视平截体(view frustum).如图，（图1)它就是由前后两个截面截成的这个棱台。

从view空间的x正半轴看过去是下图这个样子。

（图2)接下来是project空间的可视范围。

这个空间应当是处于你所见到的屏幕上。

实际上将屏幕表面视作project空间的xoy平面，再加一条垂直屏幕向里(或向外）的z轴（这取决于你的坐标系是左手系还是右手系），这样就构成了我们想要的坐标系。

好了,现在我们可以用视口（view port）的大小来描述这个可视范围了.比如说全屏幕640*480的分辨率，原点在屏幕中心，那我们得到的可视区域为一个长方体,它如下图（a）所示。

（图3）但是，这样会带来一些设备相关性而分散我们的注意力，所以不妨先向DirectX文档学学,将project空间的可视范围定义为x∈［—1,1］, y∈[-1,1]，z∈[0,1]的一个立方体（上图b）。

这实际上可看作一个中间坐标系，从这个坐标系到上面我们由视口得出的坐标系，只需要对三个轴向做一些放缩和平移操作即可。

另外，这个project坐标系对clip操作来说，也是比较方便的。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

X’坐标 Y’坐标
A ‐188.75 ‐193.88
B ‐88.85 ‐186.34
C 128.05 ‐170.31
D 70.9 119.29
E ‐226.79 118.47
4.1.2 改进的外公切线定心法
由于受到图像质量的影响，上述基于外公切线的定心法在所给图像较为粗糙时无法准确在凸图形的边缘上做出切线。考虑到提高模型与算法的普遍适用性，我们进一步提出改进的外公切线定心法。
2
图 1 坐标系转换示意图
由透视投影坐标变换公式：
1
1
–
–
0
0
0
因此展开成为标量形式，有:
·
·
··
··
··
··
0 0 0 1
·
1
·
· 2
· 3
其中
我们令原平面保持在 XOY 平面，因此有 z=0
·
·
4
··
··
3
··
··
··
··
5
在已知x , y 情况下反解x, y如下
’
‘
6
’
‘
’
7
‘
至此，我们建立起透视投影坐标，完成了自然坐标系向透视投影坐标系的转换。
心 1.1.4 使用坐标反变换公式求出所求靶心的原像 1.1.5 对靶心的原像和原靶心进行比对，求出误差 e
1.2 对 1.1.1‐1.1.5 重复多次（设定为 100 次） 2.1 对 1.1‐1.2 重复多次（设定为 100 次）
其中，(x , y )为第 i 次实验的第 j 个靶心的的算法求解值，(X , Y ) 为第 i 次实验
对于重心法，我们仅使用其对靶心进行估算，因此其必然存在一些误差。此外，由于图像具有分辨率有限，因此重心的计算的误差则相对较大。在不利情况下，例如φ接近时，圆的投影拉伸为一个“长条形”形状（见下图）
图 9 重心法中“长条形”的出现
此时，图像投影实际值与数字化之后的值误差较大，因此，在这种情况下重心法求解比在一般情况下用重心法求假效果差得多，因此 D 较大，即重心法的稳
E
(‐226.79,118.47)
(‐227.33,117.77)
4.2 问题三的分析（模型精确度与稳定性的分析）
4.2.1 蒙特卡洛模拟法
为了对建立的模型进行进一步有意义的分析，我们采取蒙特卡洛模拟法对模型的精确度和稳定性进行估测。下面首先给出模拟步骤：
1.1. 在平面上随机产生若干个半径相同的圆，参数如下: 圆心x~N 0, 500 , y~N 0, 500 半径r~U 20,60 ，圆的个数为 3,4,5,6,7,8
x , y x’ , y‘
x’ , y‘ ,则多提供 4 组方程，但同时增加了 2 个未知数 x , y 。 x’ , y‘ 仅能提供 2 组方程(8)(9)，不能给出(10)(11)，且θ,φ, D未
方程个数：4n 2
未知数个数：2n＋3
因此n 3时，可以对其求解。这个结论也可以用如下方法解释：
3.3 外公切线定心法基础
由式(6),(7)，在φ 时， x, y 与 x , y 存在一一对应关系。
因此我们可以得出以下结论：原图像为一个圆和一条直线且他们的位置关系为相切，则圆的透视投影和直线的透视投影有且仅有一个公共点，且该公共点为原图像切点的投影。
由此我们可以推论：在投影平面上，有直线 L’,图形区域 M’,N，若
5
图 3 待求二值图像
其中包含两个凸形连通域 , ，设 , 、
, 为相应连通域的边界
坐标集合。目的是求解两个凸图形的一条外公切线
。模型可描述如下：
对于二值图像
, , 0,1
有目标函数
满足
,
,
总有
0或
0
4.1.1.2 求解外公切线模型
模型求解的算法可作以下描述：
Step1. 令A
, ,B
,
，作直线 AB 将图像
4 模型求解
4.1 问题一、二的求解
4.1.1 外公切线定心法在外公切线定心法基础中，已经阐明了其基本原理，但在实际求解过程中，
由于图像被数字化(离散化)。因此在使用外公切线定心法时，还需要考虑到这个因素。 4.1.1.1 求外公切线模型的建立
在一张二值图像上求解两凸图形切线的数学模型可以建立如下：待求二值图像 , （如下图）
4.3.1 求解模型的建立
由式（1）~式（3）以及自然坐标系中靶心间的相对位置关系，可以给出下
列一组方程(8)~(11),
d x · sinθ y · cosθ
x
8
x · cosθ · sinφ y · sinθ · sinφ D
d x · cosθ · cosφ y · sinθ · cosφ
y
9
2 模型假设
相机的主光轴只有一条，其通过光学中心并且对准图像中的某一点两台相机拍摄同一画面时的主光轴都只对准画面的同一点相机拍摄符合透视投影原理
3 模型建立
3.1 模型预备
P F P, θ, φ, D 则P 为P在参数θ, φ, D下的透视投影图像，由于F为可逆的，因此记
P F P , θ, φ, D Q＝Q P 对P提取靶心后的图像
图 8 重心法确定通域)中的所有点的横纵坐标分别取平均来估算靶心的位置：
x E x 为x 的平均值(对所有连通域中的点) y E x 为y 的平均值(对所有连通域中的点) 最后， x, y 为所求靶心的横纵坐标值。
4.1.4 求解结果
处理时坐标原点选在光心处，利用不同方法解得的各个圆心在像平面 X’O’Y’ 的坐标归纳如下:（单位像素单位）
关键字：空间定位成像原理透视投影坐标变换
1
1 问题重述
系统标定在实际的生产生活中有着极为广泛的应用，其基本概念是利用两部相机在固定位置记录的影像确定这两部相机在空间中的相对位置。系统标定的方法多种多样，其中一种是利用多圆形组合的标靶进行拍照，确定标靶上圆的圆心在像平面上的位置，从而通过两台相机记录像平面上圆心的位置完成系统标定过程。本文所要研究的问题就是如何在像平面上精确的定位圆心，并利用相关信息确定相机的拍摄参数以及两台相机间相对位置的方法。
x · cosθ · sinφ y · sinθ · sinφ D
x x d 10
y y d 11
其中d已知， d , d 为在原图像上靶心 i 相对于靶心 j 的相对坐标，因此在原图
像已知的情况下任意d , d 都是已知量。
设给出映射
的组数为 n 每给出一组 x , y 但第一组 x , y 知。因此：
的第 j 个靶心的实际值，n 为第 i 次实验的靶心个数，第 i 次实验的误差为，N 为总实验次数(100 100=10000)：
∑ xX
xY
e
n
∑e
Ee
N
E e 为衡量精准度的标准 De
∑ e Ee N1
10
D 为衡量稳定性的标准
E
表 3 两种圆心确定方法精确度与稳定性的判定
Ee De
外公切线定心法重心法
0.491 0.747
0.259 0.598
De Ee
0.528 0.800
4.2.2 两种圆心确定方法的比较
由此可见：使用外公切线定心法时，其精准度和稳定性都比较好，这是因为外公切线定心法可以利用几何特点，更好地锁定靶心的位置。在不利情况下，例如φ接近时，或者 D 教大时，也能较好地算出靶心，因此其稳定性较高。但这种算法需要在数字化图像上计算公切线，计算的时间复杂度较大。
3.2 透视投影原理及坐标变换由于问题涉及到自然坐标系向投影平面的转换，首先我们说明坐标变换的原
理，图 1 为坐标系变换示意图。X Y Z 为观察坐标系，定义为左手坐标系。X’O’Y’ 为投影平面。XYZ 为自然坐标系，定义为右手坐标系。XOY 为原图像所在平面。根据中心透视投影的性质，可以说明物的位置 P、P 的像 P’和O 在一条直线上。
照相设备与原始图像之间不确定度为 5，即 x,y,z 方向上的平移，以及在两个方向之间的转动。而投影平面和照相设备之间不确定都为 2，因为投影设备垂直与照相设备的光轴，消除了 2 个不确定度，且焦距确定，又消除了 1 个不确定度。因此，而每个点以及其投影的之间的对应可以消除 2 个不确定度，因此我们可以根据此方法来求出照相设备的参数。
的概率均为，并且要求所有圆必须两两相离(不满足时重新产生随机数)。作出原图像P
1.1.1 随机产生参数L~U 500,2000 , θ~U , , φ~U 0, , d~U 300,700
且要求L (不满足时重新产生随机数)。 1.1.2 使用坐标变换公式作出投影图P F P 1.1.3 使用算法（外公切线定心法，重心法），根据投影图求出投影图中的靶
则
若 M,N 为圆形区域时，L 为 M,N 的公切线。因此 L’为公切线的投影。其中， L’,M’,N’,A’,B’为 L,M,N,A,B 的投影,A,B,A’,B’均为单点。因此我们可以通过“外公切线法定心法”求出靶心在投影平面的投影，方法如图 2 ：
4
图 2 外公切线定心法原理
右图中作出一些直线，这些直线与各个图形仅有 1 个公共点，l , l , l , l ，四条切线交于 A’,B’,C’,D’,如右图，连接 A’C’和 B’D’交与 O’，O’即为靶心所在位置的投影。其对应原图像如左图。
表 2 两种圆心确定方法结果的比较
外公切线定心法
重心法
A
(‐188.75，‐193.88)
(‐189.11,‐194.51)
9
B
(‐88.85,‐186.34)
(‐89.00,‐187.058)