深入探索透视投影变换

合集下载

计算机图形学中的透视和投影变换

计算机图形学中的透视和投影变换计算机图形学是机器图像处理和计算机视觉的理论基础，主要研究计算机生成的三维图形的数学表示和渲染技术。

在计算机生成的三维图形中，透视和投影变换是非常重要的技术，它们可以使三维图形更加直观逼真地呈现出来。

本文将对透视和投影变换进行详细讲解。

一、透视变换透视变换是一种三维立体图像转换为二维平面图像的方法，它可以模拟出现实中的透视效果。

在透视变换中，被变换的三维场景需要经过以下几个步骤：1. 建立三维场景模型。

在建立三维场景模型时，需要确定物体的位置、大小、形状和材质等参数，并将这些参数用数学公式表示出来。

2. 确定观察点位置和视线方向。

观察点是放置在场景外的假想点，用于观察场景中的物体。

视线方向是从观察点指向场景中的物体。

3. 定义投影平面。

投影平面是垂直于视线方向的平面，它用于将三维物体投影到二维平面上。

4. 进行透视变换。

在透视变换中，需要用到透视投影矩阵，它可以将三维图形投影到二维平面上，并使得远离观察点的物体变得更小。

透视变换可以使得生成的二维平面图像更加逼真，同时也可以减少计算量，提高渲染效率。

但是透视变换也有一些缺点，例如不能完全保持原图像的形状和大小，因此在实际应用中需要进行调整。

二、投影变换投影变换是一种将三维物体投影到二维平面上的方法，它可以用于生成平面图像、制作立体影像和建立虚拟现实等应用。

在投影变换中，被变换的三维场景需要经过以下几个步骤：1. 建立三维物体模型。

在建立三维物体模型时，需要确定物体的位置、大小、形状和材质等参数，并将这些参数用数学公式表示出来。

2. 确定相机位置和视线方向。

相机位置是放置在场景外的假想点，用于观察场景中的物体。

视线方向是从相机指向场景中的物体。

3. 定义投影平面。

投影平面是垂直于视线方向的平面，它用于将三维物体投影到二维平面上。

4. 进行投影变换。

在投影变换中，需要用到投影矩阵，它可以将三维图形投影到二维平面上，并保持原图形的形状和大小。

空间投影与正交变换

空间投影与正交变换空间投影与正交变换是数学中的重要概念和工具，用于描述空间中的几何变换和投影操作。

本文将简要介绍空间投影和正交变换的概念、应用以及相关的数学原理。

一、空间投影的概念和应用在几何学中，空间投影是指将一个点或一个物体映射到另一个平面或直线上的操作。

空间投影常被应用于计算机图形学、机器视觉等领域。

它可以用来创建三维模型、实现立体显示等。

空间投影的基本思想是利用一个中心投影点将三维空间中的点映射到一个平面上。

根据投影平面与投影中心的位置不同，可以得到不同类型的投影，如平行投影、透视投影等。

平行投影是指投影线与投影平面平行的投影方式，透视投影则是投影线通过一个中心点的投影方式。

在实际应用中，透视投影更为常见。

二、正交变换的概念和应用正交变换是指在三维空间中，通过旋转、平移和伸缩等操作将一个坐标系变换为另一个坐标系的线性变换。

正交变换具有保距离和保角度的特性，因此在几何学和物理学中得到广泛应用。

正交变换的基本操作包括旋转、平移和伸缩。

旋转是指将一个坐标系绕某一轴旋转一定角度；平移是指将坐标系沿着某个方向平移一定距离；伸缩是指通过缩放系数改变坐标系的比例关系。

正交变换在计算机图形学中扮演着重要的角色，它可以用来实现三维模型的变换、视点的变换等。

在物理学中，正交变换被广泛应用于刚体运动分析、光学现象研究等领域。

三、数学原理与公式推导空间投影和正交变换都涉及到一些数学原理和公式推导。

在此不展开详细推导，但是为了完整性，我将简要介绍一些基本的概念和公式。

1. 点到平面的投影距离公式：假设投影平面为 Ax+By+Cz+D=0，点 P=(x0,y0,z0) 到平面的投影点为 P'=(x',y',z')，则 P 到平面的距离为 d = (Ax0+By0+Cz0+D) / sqrt(A^2 + B^2 + C^2)。

2. 三维空间中的基本变换矩阵：对于一个三维点 P=(x,y,z)，做正交变换可以表示为 P' = T * P，其中T 是一个 4x4 的变换矩阵。

深入探索透视投影变换

深入探索透视投影变换最近更新：2013年11月22日-Twinsen编写-本人水平有限，疏忽错误在所难免，还请各位数学高手、编程高手不吝赐教-email: popyy@透视投影是3D固定流水线的重要组成部分，是将相机空间中的点从视锥体(frustum)变换到规则观察体(Canonical View Volume)中，待裁剪完毕后进行透视除法的行为。

在算法中它是通过透视矩阵乘法和透视除法两步完成的。

透视投影变换是令很多刚刚进入3D图形领域的开发人员感到迷惑乃至神秘的一个图形技术。

其中的理解困难在于步骤繁琐，对一些基础知识过分依赖，一旦对它们中的任何地方感到陌生，立刻导致理解停止不前。

没错，主流的3D APIs如OpenGL、D3D的确把具体的透视投影细节封装起来，比如gluPerspective(…)就可以根据输入生成一个透视投影矩阵。

而且在大多数情况下不需要了解具体的内幕算法也可以完成任务。

但是你不觉得，如果想要成为一个职业的图形程序员或游戏开发者，就应该真正降伏透视投影这个家伙么？我们先从必需的基础知识着手，一步一步深入下去（这些知识在很多地方可以单独找到，但我从来没有在同一个地方全部找到，但是你现在找到了）。

我们首先介绍两个必须掌握的知识。

有了它们，我们才不至于在理解透视投影变换的过程中迷失方向（这里会使用到向量几何、矩阵的部分知识，如果你对此不是很熟悉，可以参考《向量几何在游戏编程中的使用》系列文章）。

齐次坐标表示透视投影变换是在齐次坐标下进行的，而齐次坐标本身就是一个令人迷惑的概念，这里我们先把它理解清楚。

根据《向量几何在游戏编程中的使用6》中关于基的概念。

对于一个向量v以及基oabc，可以找到一组坐标(v1,v2,v3)，使得v = v1 a + v2 b + v3 c （1）而对于一个点p，则可以找到一组坐标（p1,p2,p3），使得p – o = p1 a + p2 b + p3 c （2）从上面对向量和点的表达，我们可以看出为了在坐标系中表示一个点（如p），我们把点的位置看作是对这个基的原点o所进行的一个位移，即一个向量——p – o（有的书中把这样的向量叫做位置向量——起始于坐标原点的特殊向量），我们在表达这个向量的同时用等价的方式表达出了点p:p = o + p1 a + p2 b + p3 c (3)(1)(3)是坐标系下表达一个向量和点的不同表达方式。

透射变换非矩形-概述说明以及解释

透射变换非矩形-概述说明以及解释1.引言1.1 概述透射变换和非矩形是计算机图形学领域中重要且广泛应用的概念。

透射变换是指将一个平面上的点或物体映射到另一个平面上的过程，同时保持点之间的相对位置关系不变。

非矩形则是指不规则形状的图形或区域，与传统的矩形或正方形不同。

透射变换在计算机图形学中扮演着至关重要的角色。

它可以用于实现平面到平面的映射，例如在计算机视觉中的图像校正和旋转、投影显示中的图像变形等。

通过透射变换，我们可以将一个平面上的点或物体按照预定的规则映射到另一个平面上，达到我们所期望的效果。

非矩形图形是在计算机图形学中广泛存在的一种图形形式。

与传统的矩形或正方形不同，非矩形图形可以具有任意的形状、曲线或不规则的外观。

这使得非矩形图形能够更加贴近实际物体或自然环境的形状，并呈现出更加生动与丰富的视觉效果。

非矩形图形广泛应用于动画制作、游戏设计以及应用界面的设计等领域。

通过本文的研究，我们将探讨透射变换和非矩形图形的定义、特点以及其在实际应用中的应用领域。

对于计算机图形学领域的研究者和从业者而言，深入理解和掌握透射变换和非矩形图形的相关知识，对于提高图形处理的效率和质量具有重要意义。

文章结构部分的内容可以按照以下方式编写：1.2 文章结构本文的结构如下：引言部分会对透射变换和非矩形进行概述，并明确文章的目的。

然后，正文部分将主要分为两个部分，分别是透射变换和非矩形。

在透射变换部分中，将对其定义和应用领域进行介绍；而在非矩形部分中，则会阐述其定义和特点。

最后，结论部分会对全文进行总结，并对未来的发展进行展望。

通过以上结构的安排，读者可以清晰地了解整篇文章的组织结构，方便阅读和理解。

1.3 目的透射变换是一种在计算机视觉和图形学领域中广泛应用的技术。

它可以通过一系列的数学变换将一个二维物体映射到另一个二维空间中，并保持物体内部的几何关系。

透射变换的应用领域非常广泛，包括图像处理、计算机辅助设计、虚拟现实等等。

CG透视变换推导汇总

透视投影是3D固定流水线的重要组成部分，是将相机空间中的点从视锥体(frustum)变换到规则观察体(Canonical View Volume)中，待裁剪完毕后进行透视除法的行为。

在算法中它是通过透视矩阵乘法和透视除法两步完成的。

透视投影变换是令很多刚刚进入3D图形领域的开发人员感到迷惑乃至神秘的一个图形技术。

其中的理解困难在于步骤繁琐，对一些基础知识过分依赖，一旦对它们中的任何地方感到陌生，立刻导致理解停止不前。

没错，主流的3D APIs如OpenGL、D3D的确把具体的透视投影细节封装起来，比如gluPerspective(…) 就可以根据输入生成一个透视投影矩阵。

而且在大多数情况下不需要了解具体的内幕算法也可以完成任务。

我们首先介绍两个必须掌握的知识。

有了它们，我们才不至于在理解透视投影变换的过程中迷失方向（这里会使用到向量几何、矩阵的部分知识，如果你对此不是很熟悉，可以参考可以找到一组坐标(v1,v2,v3)，使得v = v1 a + v2 b + v3 c （1）而对于一个点p，则可以找到一组坐标（p1,p2,p3），使得p – o = p1 a + p2 b + p3 c （2）从上面对向量和点的表达，我们可以看出为了在坐标系中表示一个点（如p），我们把点的位置看作是对这个基的原点o所进行的一个位移，即一个向量——p – o（有的书中把这样的向量叫做位置向量——起始于坐标原点的特殊向量），我们在表达这个向量的同时用等价的方式表达出了点p:p = o + p1 a + p2 b + p3 c (3)(1)(3)是坐标系下表达一个向量和点的不同表达方式。

这里可以看出，虽然都是用代数分量的形式表达向量和点，但表达一个点比一个向量需要额外的信息。

计算机图形学中的透视变换算法研究

计算机图形学中的透视变换算法研究计算机图形学是一门应用广泛且发展迅速的学科，其中透视变换算法是其中的重要内容之一。

透视变换算法是用于将三维场景投影到二维平面上的一种技术，可以用于制作三维建模、游戏开发、虚拟现实等诸多场景。

本文将对透视变换算法进行深入探讨。

一、透视变换的基本原理透视变换是一种投影变换，实际上是将原本三维的场景投影到一个二维平面上，使得相机所看到的场景保持透视关系。

我们以一个简单的场景为例，来说明透视变换的基本原理。

图一：一个简单的场景如图一所示，我们需要将这个三维场景投影到一个平面上。

我们假设相机位置在(0,0,0)，相机朝向为Z轴正方向。

首先，我们需要将相机坐标系转换为世界坐标系。

我们可以通过相机的位置、视线方向、以及上方向来得到相机坐标系的X、Y、Z轴方向向量，进而得到相机矩阵(Camera Matrix)。

接下来，我们需要将物体坐标系转换为相机坐标系。

我们可以通过将物体的顶点坐标乘以一个变换矩阵(Model Matrix)，将物体从模型空间转换到世界空间，然后将其乘以相机矩阵，将其从世界空间转换到相机空间。

最后，我们对相机空间中的坐标进行透视变换，得到最终的图像。

透视变换的过程如下：(1) 将相机空间中的坐标投影到相机平面上。

这一步称作投影变换(Projection transformation)，通常使用投影矩阵(Projection Matrix)来实现。

(2) 对投影后的坐标进行归一化(Normalization)处理，使得所有坐标的Z值都等于1。

(3) 将归一化后的坐标变换到屏幕空间(Screen Space)。

屏幕空间是二维的，并且以屏幕左上角为原点，以屏幕右下角为坐标系的正方向。

这一步通常使用视口变换(Viewport Transformation)来实现。

二、透视变换算法的具体实现透视变换算法是计算机图形学中的重要内容之一，其核心在于将三维场景转换为二维图像。

透视成像的原理

透视成像的原理
透视成像是一种模拟人眼视觉的效果，通过描绘远处物体比近处物体小的特征，给人以深度感和立体感。

这种效果是由于人眼观察物体时，远处物体在视网膜上所占的面积比近处物体小，从而产生的一种视错觉。

透视成像的原理可以通过以下几个方面来理解：
1. 平行投影：在透视成像中，我们通常使用平行投影来描绘远处物体和近处物体。

平行投影是指从观察者的位置，物体沿着平行线投射到画面上，使得远处物体的大小较近处物体小。

2. 透视中心：透视成像的核心概念是透视中心，也被称为视点。

观察者的眼睛位置即为透视中心，通过这个中心可以确定物体的位置和大小。

在透视成像中，物体与透视中心的距离越远，其在画面上的大小就越小。

3. 距离和位置：透视成像中，远离透视中心的物体在画面上会被绘制为较小的尺寸，而靠近透视中心的物体则会被绘制为较大的尺寸。

这种差异性给我们一种深度感和立体感。

总而言之，透视成像的原理是基于人眼观察物体时在视觉上的特征。

通过使用平行投影，确定透视中心以及物体的距离和位置，可以模拟出远近物体的大小差异，从而呈现出真实的深度和立体感。

深入探索3D拾取技术

深入探索3D拾取技术在游戏中，玩家需要通过点击2D屏幕来选择3D物体，这个过程就是拾取（picking）。

拾取是3D游戏必不可少的基本操作，它实现了玩家和游戏世界内对象的交互。

虽然拾取技术很基本，但它却迷惑了很多3D初学者。

很多朋友都问过我关于拾取的细节问题，这让我觉得很有必要具体探讨一下该技术。

其实，拾取之所以让很多开发者感到复杂，主要原因在于它跨域了流水线的多个阶段，并且是逆流水线上行。

另外，它是一个2D信息扩展到3D的过程，必须对信息做相应的扩展和额外的计算才能够得到正确的结果。

下面我门具体分析一下这个技术。

水流线主要阶段分析我们来直观地看一下从相机空间到viewport的变换相机空间中的一个顶点v，经过透视变换后进入了CVV中。

这个变换矩阵实际上完成了两个工作：1）将顶点从3D空间投影到2D的投影平面（Projection Plane）上。

2）将投影平面上的2D投影点通过线性插值变换到齐次裁剪空间CVV中。

这些变换都通过透视矩阵一次完成。

我之所以把这一步分解为两步，因为这对于分析拾取很重要。

顶点进入齐次裁剪空间并经过CVV裁剪，最终进行透视除法从4D齐次形式变回成3D形式。

然后经过一个线性插值（被封装在视口（viewport）变换中），变换到viewport中，多个点以三角形的形式经过光栅化后被玩家看到。

最后一步的点变换可以描述为：3）将CVV中的点通过线性插值变换到viewport中。

分析了这个变换过程之后，我们知道了从相机空间开始实际处理点位置信息的操作，就是上面的三个步骤。

这样，我们可以先把顶点从viewport中先变换回投影平面上，也就是我们可以先完成（2）和（3）的逆处理。

这里我们不用考虑裁剪和透视除法这些操作，因为反推的时候，处于视口中的点，已经是经过裁剪后留下的有效点了，必定处于CVV内，也必定处于projection plane内！而且从viewport逆变换到projection plane，点一直保持2D形式。

三维空间 rrt算法 python-详细解释说明

三维空间rrt算法python-概述说明以及解释1.引言1.1 概述在计算机科学和机器人学领域中，三维空间具有广泛的应用和研究价值。

三维空间是指由三个坐标轴（x、y和z）构成的空间，它可以用来描述和模拟真实世界中的物体和环境。

Rapidly-Exploring Random Trees (RRT) 算法是一种用于路径规划的重要算法，它可以在复杂的环境中找到可行的路径，并且具有快速、高效、自适应的特点。

RRT算法通过随机采样和不断生长树结构的方式搜索可行解，其主要思想是通过对搜索空间的随机探索，逐渐扩展搜索树，直到达到目标位置。

本文主要介绍三维空间和RRT算法的概念、特点以及在路径规划中的应用。

同时，我们还将针对Python语言进行讨论，介绍如何使用Python 实现RRT算法，并提供相应的方法和步骤。

通过阅读本文，读者将了解到三维空间的基本概念和特点，以及RRT 算法的原理和应用。

此外，对于具有Python编程基础的读者来说，我们还提供了使用Python实现RRT算法的详细方法和步骤，以帮助读者更好地理解和应用RRT算法。

最后，本文将总结三维空间和RRT算法的重要性，评价Python实现RRT算法的优势和挑战，并展望未来在三维空间RRT算法研究方面的发展。

无论是在实际应用中还是在学术研究领域，三维空间和RRT算法都具有重要的价值和潜力，值得我们深入探索和研究。

1.2文章结构1.2 文章结构本文将按照以下结构进行论述：第一部分是引言，包括概述、文章结构和目的。

在这一部分中，我们将介绍本文的主要内容和研究目的，为读者提供一个清晰的导读。

第二部分是正文，共分为三个小节。

2.1 三维空间的概念和特点。

我们将首先介绍三维空间的基本概念，包括其坐标系、表示方法以及在现实世界中的应用。

同时，我们将探讨三维空间相较于二维空间的特点和挑战。

2.2 RRT算法的原理和应用。

在这一小节中，我们将详细介绍RRT （Rapidly-exploring Random Tree）算法的原理和应用。

OpenGL空间（坐标系）变换

OpenGL空间（坐标系）变换⽹友的《3D图形学的学习策略》⼀⽂使我深受启发，在图形学以及openGL学习⽅⾯给了我很有价值的指导性意见，在此对前辈们的不吝赐教表⽰感激，谢谢你们的⽆私分享。

如⽂章所说，API是⼯具，不是本质，OpenGL/Direct3D的本质是图形学,⽽不是OpenGL/Direct3D的本⾝,API的本⾝只是⼀些Interface⽽已。

最重要的,最根本的是,你要明⽩这些API背后的图形学的原理---因为那才是根本中的根本。

其实很多事情，包括学习也涉及到⽣活，只有抓住了本质，才能体会到其中的真谛。

带着这种希望探究本质的学习⽅法，结合图形学原理，通过阅读书⽬和⽹友们的⽂章，我对OpenGL⼏何空间变换进⾏了总结性的学习。

OpenGL处理管线的⽬的是将对象的三维描述转换为可以显⽰的⼆维图像。

为了完成这个从三维到⼆维的转换，OpenGL 使⽤了多个空间（坐标系），每个空间完成特定的任务，从⼀个空间到另⼀个空间需要进⾏空间转换。

理解OpenGL所使⽤的各种空间以及它们间的变换是⾮常重要的。

如上图所⽰，openGL中使⽤的空间依次是：对象空间、世界空间、视点空间、裁剪空间、归⼀化设备空间、窗⼝空间、屏幕空间。

结合⾃⼰的理解，就每个空间完成的基本任务和空间的变换关系，总结如下。

对象空间。

对象空间中完成的最⼤任务是对象建模，三维对象的属性，包括顶点位置和表⾯法线等是在这个空间内指定的。

这个空间的坐标原点⼀般在对象上，有时候也在其他地⽅，主要是为了建模⽅便。

每⼀个对象都有⼀个⾃⼰的对象空间。

就openGL⽽⾔，我⽬前还没有接触到建⽴很复杂模型的应⽤，建模⼀般在其他地⽅如3DMAX中完成，然后读⼊openGL进⾏处理。

世界空间。

对象空间之后是世界空间，我理解为世界坐标系是固定不变的。

世界空间主要是对三维场景进⾏描述，就是把已经建⽴的各种对象摆放在三维空间中，空间的转换是通过模型变换完成的。

可以通过平移、旋转、⽐例缩放等把对象摆放在需要的位置，就好像买好家具以后设计房间布局⼀样。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

深入探索透视投影变换-Twinsen编写-本人水平有限，疏忽错误在所难免，还请各位数学高手、编程高手不吝赐教-email: popyy@透视投影是3D固定流水线的重要组成部分，是将相机空间中的点从视锥体(frustum)变换到规则观察体(Canonical View Volume)中，待裁剪完毕后进行透视除法的行为。

在算法中它是通过透视矩阵乘法和透视除法两步完成的。

透视投影变换是令很多刚刚进入3D图形领域的开发人员感到迷惑乃至神秘的一个图形技术。

其中的理解困难在于步骤繁琐，对一些基础知识过分依赖，一旦对它们中的任何地方感到陌生，立刻导致理解停止不前。

没错，主流的3D APIs如OpenGL、D3D的确把具体的透视投影细节封装起来，比如gluPerspective(…)就可以根据输入生成一个透视投影矩阵。

而且在大多数情况下不需要了解具体的内幕算法也可以完成任务。

我们首先介绍两个必须掌握的知识。

齐次坐标表示透视投影变换是在齐次坐标下进行的，而齐次坐标本身就是一个令人迷惑的概念，这里我们先把它理解清楚。

根据《向量几何在游戏编程中的使用6》中关于基的概念。

对于一个向量v以及基oabc，可以找到一组坐标(v1,v2,v3)，使得v = v1 a + v2 b + v3 c （1）而对于一个点p，则可以找到一组坐标（p1,p2,p3），使得p–o = p1 a + p2 b + p3 c （2）从上面对向量和点的表达，我们可以看出为了在坐标系中表示一个点（如p），我们把点的位置看作是对这个基的原点o所进行的一个位移，即一个向量——p –o（有的书中把这样的向量叫做位置向量——起始于坐标原点的特殊向量），我们在表达这个向量的同时用等价的方式表达出了点p:p = o + p1 a + p2 b + p3 c (3)(1)(3)是坐标系下表达一个向量和点的不同表达方式。

这里可以看出，虽然都是用代数分量的形式表达向量和点，但表达一个点比一个向量需要额外的信息。

如果我写出一个代数分量表达(1, 4, 7)，谁知道它是个向量还是个点！我们现在把（1）（3）写成矩阵的形式：这里(a,b,c,o)是坐标基矩阵，右边的列向量分别是向量v和点p在基下的坐标。

这样，向量和点在同一个基下就有了不同的表达：3D向量的第4个代数分量是0，而3D点的第4个代数分量是1。

像这种这种用4个代数分量表示3D几何概念的方式是一种齐次坐标表示。

“齐次坐标表示是计算机图形学的重要手段之一，它既能够用来明确区分向量和点，同时也更易用于进行仿射（线性）几何变换。

”—— F.S. Hill, JR这样，上面的(1, 4, 7)如果写成（1,4,7,0），它就是个向量；如果是(1,4,7,1)，它就是个点。

下面是如何在普通坐标(Ordinary Coordinate)和齐次坐标(Homogeneous Coordinate)之间进行转换：从普通坐标转换成齐次坐标时，如果(x,y,z)是个点，则变为(x,y,z,1);如果(x,y,z)是个向量，则变为(x,y,z,0)从齐次坐标转换成普通坐标时，如果是(x,y,z,1)，则知道它是个点，变成(x,y,z);如果是(x,y,z,0)，则知道它是个向量，仍然变成(x,y,z)以上是通过齐次坐标来区分向量和点的方式。

从中可以思考得知，对于平移T、旋转R、缩放S这3个最常见的仿射变换，平移变换只对于点才有意义，因为普通向量没有位置概念，只有大小和方向，这可以通过下面的式子清楚地看出：而旋转和缩放对于向量和点都有意义，你可以用类似上面齐次表示来检测。

从中可以看出，齐次坐标用于仿射变换非常方便。

此外，对于一个普通坐标的点P=(Px, Py, Pz)，有对应的一族齐次坐标(wPx, wPy, wPz, w)，其中w不等于零。

比如，P(1, 4, 7)的齐次坐标有(1, 4, 7, 1)、（2, 8, 14, 2）、（-0.1, -0.4, -0.7, -0.1）等等。

因此，如果把一个点从普通坐标变成齐次坐标，给x,y,z乘上同一个非零数w，然后增加第4个分量w；如果把一个齐次坐标转换成普通坐标，把前三个坐标同时除以第4个坐标，然后去掉第4个分量。

由于齐次坐标使用了4个分量来表达3D概念，使得平移变换可以使用矩阵进行，从而如F.S. Hill, JR所说，仿射（线性）变换的进行更加方便。

由于图形硬件已经普遍地支持齐次坐标与矩阵乘法，因此更加促进了齐次坐标使用，使得它似乎成为图形学中的一个标准。

简单的线性插值这是在图形学中普遍使用的基本技巧，我们在很多地方都会用到，比如2D位图的放大、缩小，Tweening变换，以及我们即将看到的透视投影变换等等。

基本思想是：给一个x属于[a, b]，找到y属于[c, d]，使得x与a的距离比上ab长度所得到的比例，等于y与c的距离比上cd长度所得到的比例，用数学表达式描述很容易理解：这样，从a到b的每一个点都与c到d上的唯一一个点对应。

有一个x，就可以求得一个y。

此外，如果x不在[a, b]内，比如x < a或者x > b，则得到的y也是符合y < c或者y > d，比例仍然不变，插值同样适用。

透视投影变换好，有了上面两个理论知识，我们开始分析这次的主角——透视投影变换。

这里我们选择OpenGL的透视投影变换进行分析，其他的APIs会存在一些差异，但主体思想是相似的，可以类似地推导。

经过相机矩阵的变换，顶点被变换到了相机空间。

这个时候的多边形也许会被视锥体裁剪，但在这个不规则的体中进行裁剪并非那么容易的事情，所以经过图形学前辈们的精心分析，裁剪被安排到规则观察体(Canonical View Volume, CVV)中进行，CVV是一个正方体，x, y, z的范围都是[-1，1]，多边形裁剪就是用这个规则体完成的。

所以，事实上是透视投影变换由两步组成：1）用透视变换矩阵把顶点从视锥体中变换到裁剪空间的CVV中。

2）CVV裁剪完成后进行透视除法（一会进行解释）。

我们一步一步来，我们先从一个方向考察投影关系。

上图是右手坐标系中顶点在相机空间中的情形。

设P(x,z)是经过相机变换之后的点，视锥体由eye——眼睛位置，np——近裁剪平面，fp——远裁剪平面组成。

N是眼睛到近裁剪平面的距离，F是眼睛到远裁剪平面的距离。

投影面可以选择任何平行于近裁剪平面的平面，这里我们选择近裁剪平面作为投影平面。

设P’(x’,z’)是投影之后的点，则有z’ = -N。

通过相似三角形性质，我们有关系：同理，有这样，我们便得到了P投影后的点P’从上面可以看出，投影的结果z’始终等于-N，在投影面上。

实际上，z’对于投影后的P’已经没有意义了，这个信息点已经没用了。

但对于3D图形管线来说，为了便于进行后面的片元操作，例如z缓冲消隐算法，有必要把投影之前的z保存下来，方便后面使用。

因此，我们利用这个没用的信息点存储z，处理成：这个形式最大化地使用了3个信息点，达到了最原始的投影变换的目的，但是它太直白了，有一点蛮干的意味，我感觉我们最终的结果不应该是它，你说呢？我们开始结合CVV进行思考，把它写得在数学上更优雅一致，更易于程序处理。

假入能够把上面写成这个形式：那么我们就可以非常方便的用矩阵以及齐次坐标理论来表达投影变换：其中哈，看到了齐次坐标的使用，这对于你来说已经不陌生了吧？这个新的形式不仅达到了上面原始投影变换的目的，而且使用了齐次坐标理论，使得处理更加规范化。

注意在把变成的一步我们是使用齐次坐标变普通坐标的规则完成的。

这一步在透视投影过程中称为透视除法（Perspective Division），这是透视投影变换的第2步，经过这一步，就丢弃了原始的z值（得到了CVV 中对应的z值，后面解释），顶点才算完成了投影。

而在这两步之间的就是CVV裁剪过程，所以裁剪空间使用的是齐次坐标，主要原因在于透视除法会损失一些必要的信息（如原始z，第4个-z保留的）从而使裁剪变得更加难以处理，这里我们不讨论CVV裁剪的细节，只关注透视投影变换的两步。

矩阵就是我们投影矩阵的第一个版本。

你一定会问为什么要把z写成有两个原因：1）P’的3个代数分量统一地除以分母-z，易于使用齐次坐标变为普通坐标来完成，使得处理更加一致、高效。

2）后面的CVV是一个x,y,z的范围都为[-1，1]的规则体，便于进行多边形裁剪。

而我们可以适当的选择系数a和b，使得这个式子在z = -N的时候值为-1，而在z = -F的时候值为1，从而在z方向上构建CVV。

接下来我们就求出a和b：这样我们就得到了透视投影矩阵的第一个版本：使用这个版本的透视投影矩阵可以从z方向上构建CVV，但是x和y方向仍然没有限制在[-1,1]中，我们的透视投影矩阵的下一个版本就要解决这个问题。

为了能在x和y方向把顶点从Frustum情形变成CVV情形，我们开始对x和y 进行处理。

先来观察我们目前得到的最终变换结果：我们知道-Nx / z的有效范围是投影平面的左边界值（记为left）和右边界值（记为right），即[left, right]，-Ny / z则为[bottom, top]。

而现在我们想把-Nx / z属于[left, right]映射到x属于[-1, 1]中，-Ny / z属于[bottom, top]映射到y属于[-1, 1]中。

你想到了什么？哈，就是我们简单的线性插值，你都已经掌握了！我们解决掉它：则我们得到了最终的投影点：下面要做的就是从这个新形式出发反推出下一个版本的透视投影矩阵。

注意到是经过透视除法的形式，而P’只变化了x和y分量的形式，az+b和-z是不变的，则我们做透视除法的逆处理——给P’每个分量乘上-z，得到而这个结果又是这么来的：则我们最终得到：M就是最终的透视变换矩阵。

相机空间中的顶点，如果在视锥体中，则变换后就在CVV中。

如果在视锥体外，变换后就在CVV外。

而CVV本身的规则性对于多边形的裁剪很有利。

OpenGL在构建透视投影矩阵的时候就使用了M的形式。

注意到M的最后一行不是(0 0 0 1)而是(0 0 -1 0)，因此可以看出透视变换不是一种仿射变换，它是非线性的。

另外一点你可能已经想到，对于投影面来说，它的宽和高大多数情况下不同，即宽高比不为1，比如640/480。

深入探索透视投影变换

计算机图形学中的透视和投影变换

空间投影与正交变换

深入探索透视投影变换

透射变换 非矩形-概述说明以及解释

CG透视变换推导汇总

计算机图形学中的透视变换算法研究

透视成像的原理

深入探索3D拾取技术

三维空间 rrt算法 python-详细解释说明

OpenGL空间（坐标系）变换

透射变换非矩形-概述说明以及解释