机器视觉课件_讲座

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

北京邮电大学自动化学院
2013年8月15日星期四
26
Sojourner 火星车前部 图,中部的 两个小突出 是两个黑白 CCD摄像机
北京邮电大学自动化学院
2013年8月15日星期四
27
北京邮电大学自动化学院
2013年8月15日星期四
28
Rocky 7 火星机器人
北京邮电大学自动化学院
2013年8月15日星期四
北京邮电大学自动化学院 2013年8月15日星期四 33
足球机器人 昆虫机器人
足球机器人
北京邮电大学自动化学院 2013年8月15日星期四 34
日本
Honda
仿人机器人
2013年8月15日星期四 35
y` ftg y` 0.006 f tgmin min 0.006 f
一般人眼在自然状态下 物方焦距为





眼睛的分辨率是眼睛的重要光 学特性,也是设计目视光学仪 器的重要依据之一; 眼睛分辨率:将眼睛刚能分辨 的两物点在网膜上成的两像点 间的距离称为 眼的分辨率与网膜上神经细胞 大小有关。要使两像点能被分 辨,它们间距离至少要大于两 个神经细胞的直径。 黄斑上视神经细胞直径约为 0.001~0.003mm,所以一般 取0.006mm为人眼的分辨率。 另外一个最常用的描述人眼分 辨能力的是0.006mm对人眼的 物空间张角
2.5维图
3维模型表示
北京邮电大学自动化学院
2013年8月15日星期四
23
3.3 Marr 视觉理论的不足
Marr理论是计算机视觉研究领域的划时代成就,但该 理论不是十分完善的,许多方面还有争议.比如:
视觉处理框架基本上是自下而上,没有反馈;
没有足够地重视知识的应用.
Marr理论给了我们研究计算机视觉许多珍贵的哲学思 想和研究方法,同时也给计算机视觉研究领域创造了 许多研究起点。
•智能机器: 能模拟人类的功能,能感知外部世界并有效地解决人所能解决问 题. •感知系统:人类感知外部世界主要是通过视觉、触觉、听觉和嗅觉等感觉器 官,其中约80%的信息是由视觉获取的.因此,对于智能机器来说,赋予机器 以人类视觉功能对发展智能机器是及其重要的,也由此形成了一门新的学科 —计算机视觉(也称机器视觉或图像分析与理解等).计算机视觉的发展不仅 将大大推动智能系统的发展,也将拓宽计算机与各种智能机器的研究范围和 应用领域. • 计算机视觉:研究用计算机来模拟生物视觉功能的科学和技术.计算机视 觉系统的首要目标是用图像创建或恢复现实世界模型,然后认知现实世界.
北京邮电大学自动化学院 2013年8月15日星期四 17
研究热潮是从 20世纪80年代开始的,到了80 年代中期,计算机视觉获得了蓬勃发展,新 概念、新方法、新理论不断涌现,比如,基 于感知特征群的物体识别理论框架,主动视 觉理论框架,视觉集成理论框架等. Marr的计算理论
北京邮电大学自动化学院
北京邮电大学自动化学院
2013年8月15日星期四
19
3. Marr的视觉计算理论
Marr 的视觉计算理论[Marr1982]立足于计算机科学,系统地概括了心理生理学、 神经生理学等方面取得的所有重要成果,是视觉研究中迄今为止最为完善的视 觉理论. Marr 建立的视觉计算理论,使计算机视觉研究有了一个比较明确的体 系,并大大推动了计算机视觉研究的发展.人们普遍认为,计算机视觉这门学 科的形成与Marr的视觉理论有着密切的关系.
(1)、人眼的光学构造:




角膜:由角质构成的透明的 球面薄膜,厚度为0.55mm, 折射率为1.3771; 前室:角膜后的空间,充满 折射率为1.3774的水状液体; 虹彩:位于前室后,中间有 一圆孔,称为瞳孔,它限制 了进入人眼的光束口径,可 随景物的亮暗随时进行大小 调节; 水晶体:由多层薄膜组成的 双凸透镜,中间硬外层软, 各层折射率不同,中心为 1.42,最外层为1.373,自 然状态下其前表面半径为 10.2mm,后表面半径为 6mm,水晶体周围肌肉的紧 张和松驰可改变前表面的曲 率半径,从而改变水晶体焦 距;
29
北京邮电大学自动化学院
2013年8月15日星期四
30
Rocky7视觉系统获取的立体图象对
障碍物探测示意图 Rocky7 视觉系统对场景的深度恢复
北京邮电大学自动化学院 2013年8月15日星期四 31
CMU月球探测实验车Nomad漫游者
北京邮电大学自动化学院
2013年8月15日星期四
32
月球探测实验车Nomad漫游者
在以观测者为中心的坐标系中 局部表面朝向(“针”基元) ,表示可见表面的方向、深度 离观测者的距离 值和不连续的轮廓 深度上的不连续点 表面朝向的不连续点 在以物体为中心的坐标系中, 用由体积基元和面积基元构成 的模块化多层次表示,描述形 状及其空间组织形式. 分层次组成若干三维模型,每 个三维模型都是在几个轴线空 间的基础上构成的,所有体积 基元或面积形状基元都附着在 轴线上.
北京邮电大学自动化学院
2013年8月15日星期四
20
3.1 信息处理三个层 次
表 1-1 计算理论
表示和算法
硬件实现
计算的目的是什么? 为什么这一计算是合适的? 执行计算的策略是什么?
如何实现这个计算理论? 在物理上如何实现 输入、输出的表示是什么? 这些表示和算法? 表示与表示之间的变换是什么?
北京邮电大学自动化学院
2013年8月15日星期四
21
3.2 视觉表示框架
第一阶段(也称为早期阶段)是将输入的原始图像进行处理,抽取图像中诸如 角点、边缘、纹理、线条、边界等基本特征,这些特征的集合称为基元图 (primitive sketch); 第二阶段(中期阶段)是指在以观测者为中心的坐标系中,由输入图像和基元 图恢复场景可见部分的深度、法线方向、轮廓等,这些信息的包含了深度信 息,但不是真正的物体三维表示,因此,称为二维半图(2.5 dimensional sketch); 第三阶段(后期阶段)是在以物体为中心的坐标系中,由输入图像、基元图、 二维半图来恢复、表示和识别三维物体。



人眼有两类调节:视度调节和瞳孔调节 视度调节:用眼观察一物时,物通过眼在网膜上形成一个清晰像,视 神经细胞受到光刺激引起了视觉,于是看清了这一物体;此时,物像 眼睛光学系统三者间满足共轭方程式。其它不同远近的物的像不在网 膜上,因此看不清。要看清其它物,人眼要自动调节焦距。 正常人眼在完全放松的自然状态下,无限远处的物成像在网膜上。即 眼的像方焦点在网膜上;当观察近处物时,水晶体周围肌肉收缩,水 晶体前表面半径变小,眼睛光学系统焦距变短,后焦点前移,从而使 该物体的像成在网膜上。 为描述人眼调节的程度,引入了视度的概念,与网膜共轭的物面到眼 睛距离的倒数称为视度,用SD表示 SD有正有负 如观察眼前2米处的目标时,l=-2,SD=-0.5,即眼睛视度为-0.5,如 物在无穷远处时,SD=0;可见,视度绝对值越大,说明眼的调节量越 大。
1 SD l
明视距离:
对应的SD=-4 人眼的近点距离 远点距离: 人眼的调节范围:远点与近点视度差。
瞳孔调节 眼睛的虹彩可自动改变瞳孔大小,以控制眼睛的 进光量,一般人眼在白天光线较强时,瞳孔缩到 2mm左右,夜晚光线较暗时,瞳孔扩大到8mm 左右。 设计目视光学系统时,要考虑仪器与人眼瞳孔的 配合。
从光学角度,眼中最重要的三样东西:水晶体、网膜、瞳孔 人眼——照相机 水晶体——镜头 网膜——感光底片 瞳孔——光阑 人眼可以自动对目标调焦,可以根据景物的亮暗自动调节进
入眼光能量; 照相机中,底片上成倒像,人眼成像也是倒像,但由于人的 神经系统作用,看到的还是正像。 眼睛的视角可达150°,只有黄斑附近人眼方可清晰识别, 其它地方较模糊,要看清其它地方的景物,人眼要转动,将 黄斑和眼睛光学系统像方节点边线(视轴)对向该景物。
北京邮电大学自动化学院
2013年8月15日星期四
24
计算机视觉应用系统 照明
成像装置
计算机视觉
场景
图象
wenku.baidu.com描述
应用反馈
北京邮电大学自动化学院 2013年8月15日星期四 25
4. 计算机视觉的应用
• • • • • • • • 零件识别与定位 (工业生产线) 产品检验 (纺织工业棉花质量检验) 移动机器人导航(星球机器人) 遥感图像分析(植被分析) 医学图像分析(骨骼定位) 安全鉴别、监视与跟踪(门禁系统) 国防系统(目标自动识别ATR与目标跟踪) 其它(动画、体育、考古)
2013年8月15日星期四
18
许多会议论文集都反应了该领域的最新进展,比如:
Int. Conf. on Computer Vision and Pattern Recognition (CVPR); Int. Conf. on Computer Vision(ICCV); Int. Conf. on Pattern Recognition(ICPR); Int. Conf. on Robotics and Automation(ICRA); Workshop on Computer Vision, SPIE.
北京邮电大学自动化学院
2013年8月15日星期四
16
MIT AI 实验室吸引了国际上许多知名学者 参与计算机视觉的理论、算法、系统设计的 研究,David Marr教授就是其中的一位.他 于1973年应邀在MIT AI 实验室领导一个以博 士生为主体的研究小组,1977年提出了不同 于“积木世界”分析方法的计算视觉理论 (computational vision),该理论在80年代成为 计算机视觉研究领域中的一个十分重要的理 论框架.
北京邮电大学自动化学院
2013年8月15日星期四
22
表1-2 由图像恢复形状信息的表示框架
名 称 图像 光强表示 目 的 基 元 图像中每一点的强度值
基元图
表示二维图像中的重要信息, 零交叉,斑点,端点和不连续 主要是图像中的强度变化位置 点,边缘片断,有效线段,组 及其几何分布和组织结构 合群,曲线组织,边界
1. 引 言
北京邮电大学自动化学院
2013年8月15日星期四
15
2. 计算机视觉发展
• 20世纪50年代归入模式识别----主要集中在二维图像分析和识别上,如,光学字符 识别,工件表面、显微图片和航空图片的分析和解释等. •60年代MIT 的Roberts通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱 柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述.Roberts 的研 究工作开创了以理解三维场景为目的的三维计算机视觉的研究.Roberts对积木世界 的创造性研究给人们以极大的启发,许多人相信,一旦由白色积木玩具组成的三维 世界可以被理解,则可以推广到理解更复杂的三维场景. •70年代,已经出现了一些视觉应用系统.70年代中期,麻省理工学院(MIT)人工智 能(AI)实验室正式开设“计算机视觉” ( Machine Vision) 课程,由B.K.P.Horn教 授讲授.
min
f 16.68m m, 代入上式:
min
0.006 206000' 60' ' ' 16.68
前面讨论的是人眼对两物点的分辨率。如果被 观察的对象是两条直线,分辨率可以提高到10’’, 其原因见图。 因此,一些测量仪器中都采用如图所示的对准 方式,来提高测量精度。
还有许多学术期刊也包含了这一领域的最新研究成果, 如:
IEEE Trans. on Pattern Analysis and Machine Intelligence(PAMI); Computer Vision, Graphics, and Image Processing(CVGIP); IEEE Trans. on Image Processing; IEEE Trans. on Systems, Man, and Cybernetics(SMC); Machine Vision and Applications; Int. J on Computer Vision(IJCV); Image and Vision Computing; Pattern Recognition.
相关文档
最新文档