电子科技大学计算机视觉作业答案
计算机视觉期末考试题及答案

计算机视觉期末考试题及答案一、选择题1. 下列哪个是计算机视觉的基本任务?A. 物体识别B. 图像去噪C. 特征提取D. 图像压缩答案:A2. 图像分割的目标是什么?A. 将图像分成若干不重叠的区域B. 提取图像中的边缘和角点C. 对图像进行降噪处理D. 对图像进行缩放和旋转答案:A3. 下列哪个不属于计算机视觉中的特征提取方法?A. 边缘检测B. 霍夫变换C. SIFTD. 形态学操作答案:D4. 目标识别中最常用的算法是?A. 支持向量机(SVM)B. 卷积神经网络(CNN)C. 决策树D. 随机森林答案:B5. 计算机视觉中的光照问题指的是什么?A. 图像中的曝光问题B. 图像中的阴影和反射问题C. 图像中的亮度和对比度问题D. 图像中的色彩平衡问题答案:B二、填空题1. 图像的分辨率是指图像中的像素数量()图像的单位面积。
答案:除以2. 特征匹配算法中常用的匹配度量指标是()。
答案:距离3. 边缘检测算法中,经典的Sobel算子是基于()的。
答案:梯度4. 目标检测中的非极大值抑制是用来()。
答案:过滤掉重复的检测结果5. 目标跟踪中最常用的方法是()。
答案:卡尔曼滤波三、简答题1. 请简要解释计算机视觉中的图像金字塔是什么,并说明其应用场景。
答案:图像金字塔是一种多尺度表示的方法,通过对原始图像进行多次模糊和下采样,得到一系列分辨率不同的图像。
它的应用场景包括图像缩放、图像融合、目标检测等。
图像金字塔可以在不同尺度下对图像进行处理,以适应不同场景的需求。
2. 请简要介绍计算机视觉中的物体识别技术,并指出其挑战和解决方案。
答案:物体识别是指在图像或视频中自动识别出特定物体的技术。
其挑战包括光照变化、视角变化、遮挡等因素的影响。
解决方案包括利用深度学习方法进行特征提取和分类,使用数据增强技术增加训练数据,以及采用多模态融合的方法提高识别准确率。
3. 请简要解释计算机视觉中的图像分割技术,并说明常用的分割方法。
计算机视觉考试题及答案解析

计算机视觉考试题及答案解析计算机视觉(Computer Vision),是研究如何使机器“看”的一门学科。
它涵盖了图像处理、模式识别、机器学习等多个领域。
作为计算机科学的重要分支之一,计算机视觉已经在各个领域得到了广泛的应用,包括人脸识别、图像搜索、无人驾驶等。
本文将介绍一些常见的计算机视觉考试题,并对答案进行解析。
一、选择题1.下列哪种方法可以实现图像分割?A. 边缘检测B. 直方图均衡化C. 图像降噪D. 全局阈值法答案:D。
图像分割是将图像划分为多个区域的过程,全局阈值法是一种常用的图像分割方法,通过设置一个合适的全局阈值,将图像中的像素分为两个类别。
2.计算机视觉中常用的特征描述子是什么?A. SIFTB. SURFC. HOGD. All of the above答案:D。
在计算机视觉中,SIFT(尺度不变特征变换)、SURF (加速稳健特征)和HOG(方向梯度直方图)都是常用的特征描述子,用于提取图像中的关键特征。
3.以下哪项不是深度学习在计算机视觉中的应用?A. 目标检测B. 图像分类C. 图像修复D. 人脸识别答案:C。
深度学习在计算机视觉中的应用非常广泛,包括目标检测、图像分类、人脸识别等,但不包括图像修复。
二、填空题1.卷积神经网络(CNN)是一种_________学习模型。
答案:深度。
2.在图像处理中,直方图均衡化是一种用于_____________的方法。
答案:增强图像对比度。
3.在目标检测中,R-CNN的全称是_________________。
答案:Region-based CNN。
三、解答题1.请简要解释计算机视觉中的目标跟踪是指什么?答:目标跟踪是指在连续的图像序列中,根据已有的目标位置信息,在下一帧图像中准确定位并跟踪目标的过程。
目标跟踪在视频监控、无人驾驶等领域中有着广泛的应用。
常用的目标跟踪方法包括基于特征的跟踪(如颜色、纹理等特征)和基于深度学习的跟踪(如Siamese网络、深度学习特征提取等)。
西安电子科技大学2016-2017年度上学期期末考试《图像理解与计算机视觉》试题及答案

西安电子科技大学2016-2017年度上学期期末考试《图像理解与计算机视觉》试题及答案学号:姓名:班级:1. 一幅图像的象素灰度级为256、大小为1024×1024的图象的数据量多少MB?假设网络的平均传输速率为1Mbit/s,需要多少秒才能传送完毕?每个像素可以用8比特表示。
解答:图像的数据量是1024×1024×8/8=1 MB,需要8 秒才能传送完毕。
2. 通过你对生活的观察,举出一个书本描述之外的图像处理应用的领域和例子。
解答:医院CT检查,等。
I f x y z t的各个参数的具体含义,反映的图像类型有多3. 请说明图像亮度函数(,,,,)少?解答:I f x y z t中,(x,y,z)是空间坐标,λ是波长,t 是时间,I 是图像数学表达式(,,,,)光点(x,y,z)的强度(幅度)。
上式表示一幅运动(t) 的、彩色/多光谱(λ) 的、立体(x,y,z)图像。
I f x y z t表示一幅运动(t) 的、彩色/多光谱(λ) 的、立体(x,y,z)图像。
对(,,,,)于静止图像,则与时间t 无关;对于单色图像(也称灰度图像),则波长λ为一常数;对于平面图像,则与坐标z 无关,故f(x,y)表示平面上的静止灰度图像,它是一般图像I f x y z t的一个特例。
(,,,,)4. 色彩具有哪几个基本属性,表述这些属性的含义。
解答:色相(H):色相是与颜色主波长有关的颜色物理和心理特性,它们就是所有的色相,有时色相也称为色调。
饱和度(S):饱和度指颜色的强度或纯度,表示色相中灰色成分所占的比例,用0%-100%(纯色)来表示。
亮度(B):亮度是颜色的相对明暗程度,通常用0%(黑)-100%(白)来度量。
5. 请解释马赫带效应。
解答:所谓“马赫带效应(Mach band effect)”是指视觉的主观感受在亮度有变化的地方出现虚幻的明亮或黑暗的条纹,马赫带效应的出现是人类的视觉系统造成的。
计算机视觉试题及答案大全

计算机视觉试题及答案大全一、选择题1. 计算机视觉是利用计算机对图像、视频等视觉信息进行分析和处理的一门学科。
以下哪项不属于计算机视觉的应用领域?A. 人脸识别B. 遥感图像分析C. 智能车辆导航D. 机器学习算法答案:D2. 在计算机视觉中,图像分类是指将输入的图像分到预先定义的类别中。
以下哪项不属于常见的图像分类方法?A. 支持向量机(SVM)B. 卷积神经网络(CNN)C. 高斯混合模型(GMM)D. 循环神经网络(RNN)答案:D3. 目标检测是计算机视觉中的关键任务之一,其目标是在图像或视频中准确地找出目标的位置和类别。
以下哪个是常用的目标检测算法?A. 基于颜色空间的图像分割B. 基于特征点的匹配算法C. 卷积神经网络(CNN)D. 基于相似度的模板匹配答案:C4. 图像分割是计算机视觉中的基础问题,其目标是将图像分成若干个具有语义意义的区域。
以下哪项不属于图像分割的常用方法?A. 边缘检测B. 区域生长C. K均值聚类D. 图像去噪答案:D5. 三维重建是计算机视觉中的重要研究方向,其目标是通过图像或视频等二维输入重建出对应的三维场景。
以下哪个是常用的三维重建方法?A. 模板匹配B. 直方图均衡化C. 结构光扫描D. 高斯金字塔答案:C二、填空题1. 在图像处理中,____________是指通过一系列像素操作来改变图像的外观或信息。
答案:图像增强2. 在计算机视觉中,特征提取是指从输入的图像或视频中提取出____________的信息。
答案:有用或有区别的特征3. 计算机视觉中常用的评价标准之一是____________,它可以衡量目标检测算法的准确率和召回率。
答案:精确度(precision)4. 在目标跟踪中,____________是指通过预测目标的位置来跟踪目标。
答案:滤波器三、简答题1. 简要介绍计算机视觉中的图像分类任务,并说明其应用。
答案:图像分类是计算机视觉中的一个基本任务,其目标是将输入的图像分到预先定义的类别中。
计算机视觉考试试题及答案

计算机视觉考试试题及答案一、选择题1.计算机视觉是指()。
A. 让计算机识别图像B. 让计算机生成图像C. 让计算机处理音频D. 让计算机播放视频答案:A. 让计算机识别图像2.在计算机视觉中,常用的图像处理技术包括()。
A. 图像去噪B. 图像分割C. 物体检测D. 所有选项都对答案:D. 所有选项都对3.以下哪项不是常用的计算机视觉库?A. OpenCVB. TensorFlowC. PyTorchD. Spring答案:D. Spring4.在计算机视觉中,卷积神经网络(CNN)常用于()。
A. 图像分类B. 文本处理C. 音频合成D. 数字识别答案:A. 图像分类二、判断题1.图像处理和计算机视觉是完全不同的两个领域。
答案:错2.计算机视觉只能应用于静态图像,无法处理视频流。
答案:错3.深度学习在计算机视觉领域取得了很大的成功。
答案:对三、简答题1.请简要介绍一下计算机视觉在实际生活中的应用场景。
答:计算机视觉在实际生活中有很多应用场景,比如人脸识别技术可以用于人脸解锁手机、安防监控等领域;医学影像分析可以帮助医生快速准确地诊断疾病;无人驾驶技术需要计算机视觉来实现障碍物检测和车道识别等功能。
2.简要说明卷积神经网络(CNN)在计算机视觉中的作用。
答:卷积神经网络(CNN)在计算机视觉中被广泛应用于图像分类、目标检测和图像分割等任务。
通过卷积层和池化层的组合,CNN可以提取图像的特征并实现对图像的有效处理和识别。
四、综合题1.请设计一个简单的计算机视觉项目,描述项目的实现步骤及预期效果。
答:设计一个人脸识别系统。
实现步骤包括收集人脸数据集、训练神经网络模型、部署模型到实际系统中。
预期效果是能够准确快速地识别不同人的人脸,并实现相关功能,比如门禁系统或会议签到系统等。
以上是计算机视觉考试试题及答案,希朓可以帮助您更好地理解和掌握计算机视觉领域的知识。
祝您考试顺利!。
计算机视觉考试题库及答案

计算机视觉考试题库及答案计算机视觉是人工智能领域的重要分支,它致力于使计算机具备类似人类视觉系统的能力,从图像或视频中理解和解释信息。
随着计算机视觉的发展和应用日益广泛,许多机构和个人都对该领域的知识和技能进行考核。
为了帮助考生更好地准备和备考计算机视觉考试,本文将提供一份计算机视觉考试题库及答案,供学习和参考。
题目一:1. 请简要解释计算机视觉的定义和作用。
答案一:计算机视觉是一种模拟和复制人类视觉系统的技术与科学。
它利用计算机和相应的算法来获取、处理、分析和理解图像和视频数据,从而让计算机具备类似人类视觉系统的能力。
计算机视觉的作用包括目标检测与跟踪、图像识别与分类、场景理解与解释、三维重构与建模等。
题目二:2. 请列举计算机视觉中常用的图像处理技术,并简要说明其原理和应用场景。
答案二:(1)灰度变换:通过对图像的亮度进行变换,改变图像的对比度和亮度,常用的灰度变换包括直方图均衡化和伽马校正。
应用场景包括图像增强和色彩校正等。
(2)图像滤波:通过对图像进行空域或频域滤波,实现图像平滑或增强。
常用的图像滤波方法包括均值滤波、中值滤波和高斯滤波等。
应用场景包括图像去噪和边缘检测等。
(3)边缘检测:通过检测图像中的边缘和轮廓,获得图像的结构信息。
常用的边缘检测算法包括Sobel算子、Canny算子和Laplacian算子等。
应用场景包括目标检测和图像分割等。
(4)图像分割:将图像分成若干个具有独立意义的区域。
常用的图像分割算法包括阈值分割、基于区域的分割和基于边缘的分割等。
应用场景包括目标提取和图像分析等。
题目三:3. 请简要介绍计算机视觉中的机器学习方法,并说明其在物体识别中的应用。
答案三:计算机视觉中的机器学习方法包括监督学习、无监督学习和强化学习。
监督学习通过提供标记的训练样本来训练模型,从而实现对未知样本的判别和分类。
无监督学习通过从未标记数据中学习数据的统计特性和结构,进行数据聚类和降维等任务。
计算机视觉测试题目及答案

计算机视觉测试题目及答案在计算机视觉领域,测试题目是评估一个人对于图像处理、模式识别和计算机视觉理论的理解和应用能力的重要方法。
下面将给出一些常见的计算机视觉测试题目及其答案,希望能够帮助您更好地了解和掌握相关知识。
1. 图像处理题目:请简要说明什么是图像处理,并列举三种常见的图像处理操作。
答案:图像处理是指对于数字图像进行一系列的操作,以改善图像质量、提取图像特征或实现其他目标的过程。
常见的图像处理操作包括:灰度化、平滑滤波、边缘检测、直方图均衡化、二值化、图像加减运算、图像变换等。
2. 模式识别题目:请简要说明什么是模式识别,并列举三种常用的模式识别方法。
答案:模式识别是指通过对输入模式进行学习和分类,从而实现对未知模式的自动识别的过程。
常用的模式识别方法包括:最近邻算法(K-Nearest Neighbor,KNN)、支持向量机(Support Vector Machine,SVM)、人工神经网络(Artificial Neural Network,ANN)、决策树(Decision Tree)、隐马尔可夫模型(Hidden Markov Model,HMM)等。
3. 计算机视觉理论题目:请简要说明什么是计算机视觉,并介绍计算机视觉的应用领域。
答案:计算机视觉是指通过计算机模拟人类视觉系统的信息处理机制,实现对数字图像或视频的自动分析、理解和处理的学科。
计算机视觉的应用领域非常广泛,包括目标检测与跟踪、人脸识别、视频监控、机器人导航、医学影像分析、自动驾驶等。
4. 图像特征提取题目:请简要说明什么是图像特征提取,并列举三种常用的图像特征。
答案:图像特征提取是指通过对图像进行一系列数学或统计操作,提取出图像中携带有重要信息的特征表示的过程。
常用的图像特征包括:颜色直方图、纹理特征(如灰度共生矩阵)、形状特征(如边缘直方图、轮廓描述子)以及局部特征(如SIFT、SURF等)。
5. 图像分类题目:请简要说明什么是图像分类,并介绍图像分类的主要步骤。
电子科技大学智慧树知到“计算机应用技术”《平面图像软件设计与应用》网课测试题答案1

电子科技大学智慧树知到“计算机应用技术”《平面图像软件设计与应用》网课测试题答案(图片大小可自由调整)第1卷一.综合考核(共15题)1.下列哪些操作可以实现选区的羽化?A.对于图像中一个已经创建好的没有羽化边缘的选区,可通过“选择>羽化”命令来实现羽化程度的数字化控制B.对于图像中一个已经创建好的没有羽化边缘的选区,可以先将其存储在Alpha通道中,然后对Alpha通道执行“滤镜>模糊>高斯模糊”,然后再载入选区C.如果使用魔棒工具,可以先在其工具选项栏中设定“羽化”数值,然后在图像中单击创建选区D.如果使用矩形选框工具,可以先在其工具选项栏中设定“羽化”数值,然后再在图像中拖拉创建选区2.如果在图层上增加一个蒙版,当要单独移动蒙版时下面哪种操作是正确的?()A.首先要解掉图层与蒙版之间的锁,然后选择移动工具就可移动了B.首先要解掉图层与蒙版之间的锁,再选择蒙版,然后选择移动工具就可移动了C.首先单击图层上面的蒙版,然后选择移动工具就可移动了D.首先单击图层上面的蒙版,然后执行“选择>全选”命令,用选择工具拖拉3.如果有一些滤镜功能不在“滤镜”(Filter)菜单下,应执行下列哪个操作来恢复其在菜单中的显示?()A.将Plug-in文件放在Plug-In(增效工具)文件夹中,然后重新启动PhotoshopB.删除Photoshop的预置文件,然后重新启动PhotoshopC.关闭虚拟内存后重新启动PhotoshopD.使用Photoshop安装光盘重新安装滤镜功能4.下面对图层组描述正确的是:()A.在图层选项栏中单击“创建新组”按钮可以新建一个图层组B.可以将所有链接图层放到一个新的图层组中C.按住Command/(Mac)Ctrl(Win)键的同时用鼠标单击图层选项栏中的图层组,可以弹出“图层组属性”对话框D.在图层组内可以对图层进行删除和复制5.如果在图层上增加一个蒙版,当要单独移动蒙版时下面哪种操作是正确的?A.首先要解掉图层与蒙版之间的锁,然后选择移动工具就可移动了B.首先要解掉图层与蒙版之间的锁,再选择蒙版,然后选择移动工具就可移动了C.首先单击图层上面的蒙版,然后选择移动工具就可移动了D.首先单击图层上面的蒙版,然后执行“选择>全选”命令,用选择工具拖拉6.打开一幅图象,如果要在它的上面加一个图层,可是图层调板上的新建图层按钮却不可选,出现这样情况的可能原因是()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
,在 matlab 中模拟可以得
clear; clc; a=linspace(0,pi); b=linspace(0,2*pi); [theta,phi]=meshgrid(a,b);
r=4; z0=40; x0=40; f=24; x=f*((r*sin(phi).*cos(theta)+x0).)/(r*cos(phi)+z0); y=f*((r*sin(phi).*sin(theta)).)/(r*cos(phi)+z0);
plot(x,y,'b') 所以在透视映射下球的投影不是圆。
3.Camera Calibration 无法找到这个数据:/cs766-1/public/html/fall06/hw/hw1/Feature2D.txt。 以下仅为题目所给的参考答案。
⎜⎛ − 0.2905 − 0.0532 0.1866 0.6283⎟⎞ (a).CamMatrix = ⎜ 0.0881 − 0.3264 0.0881 0.6010⎟
⎜⎝ − 0.0002 − 0.0002 − 0.0002 0.0021⎟⎠
在定义一个 2N*12 的矩阵 P 之后,通过寻找 P’*P 的特征向量对应的最小特征值的方法建立 要求的映射矩阵,并且把这个向量重构为一个 3*4 的矩阵。这和 3.1 节所描述的方法一致。 通过获得矩阵的方法打印出输入(u,v)的值和产生的结果,二者看起来与空间中等价立方 体的投影一致,所以该矩阵是可行的。
所以线的投影仍为线。
(b).证明:相机坐标系中球坐标:
。由第一题的知识我们知道它
在像平面上X的c 投=影(r为sin:ϕ cosθ + x0, r sin ϕ sin θ , r cosϕ + z0)
到:
x
=
r sin ϕ cosθ f(
+ x0
r sin ϕ sin ,
θ
)
r cos ϕ + z0 r cosϕ + z0
1
⎟⎜ ⎠⎝
0
0
0
0
⎛ ⎞⎜
Xc
⎞ ⎟
f 0
0 1
0⎟⎟⎜⎜ 0⎟⎠⎜⎜
⎝
Yc Zc 1
⎟ ⎟
⎟⎟ ⎠
(5). 当物坐标点为 (12m,7m,103m) 时,且 (u0, v0) = (250,250), (ku , kv ) = (41.7,−31.3) 带
入(4)中矩阵可得: w = (367,199) 。
=
2 arctan(
d 2f
)
= 2 arctan(
1), 3
FOVV
= 2 arctan(
h 2f
)
= 2 arctan(
1)。 4
(3).视场对分辨率的影响为:视场越大分辨率越低,视场越小分辨率越高。
(4).应用:假设空间中一点在相机坐标系中的坐标为 X = ( Xc ,Yc , Zc ) ,其在像平面的投影
R = ⎜ 0.0000 − 0.8097 − 0.5869⎟
⎜ ⎝
−
0.7071
0.4150
− 0.5725⎟⎠
⎜⎛ 0.0000 ⎟⎞ T = ⎜ − 0.0810⎟
⎜⎝ 6.9277 ⎟⎠
(b). 因为在同一直线上,所以点(0,0,0),(1,1,1),和(5,5,5)都可以近似映射为点(300.5,287.4363)。 此外,第二坐标值为 287.4631,287.4363 和值 287.4337 都已精确到小数点后第三位。其它对 应点为:
结果为:
4b.
使用与 a 中一致的 H 矩阵,并左乘矩阵 T −1 ,右乘矩阵 U。其中 T 矩阵将图像数据旋转变换 为中心点为(0,0),并且离起始点的平均距离为 (2) ,而 U 矩阵对场景点采取与 T 同样的
变换。⎟⎞
T = ⎜ 0 0.0038 −1.8793⎟
⎛ 0.0028 − 0.0003 0.2182⎞
⎜
⎟
H = ⎜ 0.0009 − 0.0048 0.0759⎟
⎜⎝ 0.0000 − 0.0000 0.0011⎟⎠
对输入的图像采用矩阵的逆矩阵,可以得到以下的结果,从这个结果可以看到,图像的失真
表现为尺寸的拉伸。
使用同样的方法和以下数据点处理 edwardVI.pgm:
⎜⎝ 0
0 1.0000 ⎟⎠
⎛ 0.0139 0 − 0.6394⎞
⎜
⎟
U = ⎜ 0 0.0139 −1.2649 ⎟
⎜⎝ 0
0
1.0000 ⎟⎠
图像处理结果与(a)中三个问题完全一致,此处略。
4c. 这种方法比(a)和(b)部分包含了更多的误差。对于教学图像,标定图像中平面上矩形的 四个角上的四个点,并采用矩形的两组平行线来定义并找到两个消失点。这两组平行线的交 点就是消失点,平行线用 ax+by+c=0 来表示,然后用给定的矩阵公式来修正图像。其中所 使用的值对于结果图像的精确性非常重要。长焦距会导致图像坐标远大于期望的结果图像。 当 f 取 0.3 到 0.5 范围内的值时,产生的图像较为合理。即使是像素值以起始点为中心,用 这种方法产生的图像仍然没有(a)部分和(b)部分中的精确。但产生的图像的确与期望的结 果近似。对图像 hall1.pgm,产生矩阵为:
u = [183,361,205,358];
v = [109,155,917,805];
x = [0,91,0,91];
y = [182,182,0,0];
这些点在本文中定义为一个 8*9 的矩阵,矩阵的特征向量对应的最小特征值定义为所要求的 H 矩阵。把 H 矩阵重构为一个 3*3 的矩阵可以得到:
管在面到面的变换中映射变换失去了 3 个自由度,但仿射变换却仅仅失去了 2 个自由度,因 为它已经被限制于它能执行的变换中。
对于映射变换,它可以使平面方形两个平行边的投影线在极限条件下交于一个消失点,从而 使平面方形映射为三角形。而仿射变换保留了平行性,因此这种情况不会在仿射变换中发生。 当场景中“前”“后”之间的距离较小时,仿射变换是较为理想的模型。因此,对于仿射变 换来说由透视导致的尺寸的改变可以小到忽略不计。
Computer Vision Homework1
1、CCD to Camera Transformation (1).假设像 平面的宽度 为 d,高度 为 h,相机 的焦距为 f,则横 向和纵向的 视场为:
FOVH
=
2 arctan(
d 2f
) , FOVV
=
2 arctan(
h 2f
)。
(2). FOVH
为 x = (xc , yc ) ,而像点在像素坐标系中的位置为 w = (u,v) ,根据相机投影矩阵及齐次坐标
系的知识可得:
⎛ sx ⎞ ⎛ f
0
0
0
⎛ ⎞⎜
X
c
⎞ ⎟
⎜⎟⎜ ⎜ sy ⎟ = ⎜ 0 ⎜⎝ s ⎟⎠ ⎜⎝ 0
f 0
0 1
0 0
⎟⎜ ⎟⎜ ⎟⎠⎜⎜⎝
Yc Zc 1
⎟ ⎟
,
⎟⎟⎠
将投影点变换到像素坐标系中可以得到:
最终我们可得:
⎜⎛ su ⎟⎞ ⎜⎛ ku 0 u0 ⎟⎞⎜⎛ sx ⎟⎞ ⎜ sv ⎟ = ⎜ 0 kv v0 ⎟⎜ sy ⎟ ⎜⎝ s ⎟⎠ ⎜⎝ 0 0 1 ⎟⎠⎜⎝ s ⎟⎠
⎜⎛ su ⎟⎞ ⎜⎛ ku
⎜ sv ⎟ = ⎜ 0
⎜ ⎝
s
⎟ ⎠
⎜ ⎝
0
0 kv 0
u0 ⎟⎞⎜⎛ f
v0 ⎟⎜ 0
(−1,1,1) → (549.7931,143.4970) (1,−1,1) → (300.5,574.0207) (−1,−1,1) → (510.8559,408.8933)
考虑到没有任何径向失真的条件下,这三个角点变换得到的值表明该矩阵能精确到恰当的精 度。
4a. 对于图像 hall1.pgm,门的四个角在像坐标和物坐标中的值分别为:
把矩阵分解成 K[R,T]的形式,并用 LinearCalib.mat 这个文件产生代码,可以得到几个相关 参数:
rho = 3.3134e + 003
u0 = 300.5
v0 = 300.5
theta = π 2
alpha = 1.1177e + 003
beta = 1.1177e + 003
⎜⎛ 0.7071 0.4150 − 0.5725⎟⎞
u = [0,607,0,170]; v = [0,0,170,170]; x = [200,0,200,0]; y = [200,200,0,0];
可以得到以下图像,从这副图可以看到,失真表现为图像朝向观察者方向的拉伸。
类似的,使用这个方法和以下数据处理 Checkerboard.pgm:
u = [113,114,504,471]; v = [305,183,295,174]; x = [0,0,200,200]; y = [0,100,0,100];
⎜⎛ − 0.3419 0.1040 0.0005 ⎟⎞ ⎜ 0.1040 0.9919 − 0.0000⎟ ⎜⎝ − 0.0005 0.0000 − 0.3500⎟⎠
由 hall1.pgm 产生的图像如下,结果显示其不如前两种方法精确。
对图像 Checkerboard.pgm 和 Railroad.pgm 采用同样的方法,每次选取场景中平面上的四个 点来确定消失点。对于铁路图像,花费了很长时间来生成。与 hall1 类似,我们可以看到 checkerboard 的图像与(a)部分和(b)部分相比较“扁”一些。结果如下:
像
物
焦距