计算机视觉检测技术在工件检测中的应用研究

本科毕业设计论文题目计算机视觉检测技术在工件检测中的应用研究专业名称

学生姓名

指导教师

毕业时间2015.7

摘要

为了实现工件的快速、高精度在线检测, 将计算机视觉技术应用到工件尺寸在线检测系统中, 本文设计了工件尺寸在线检测系统的硬件结构和软件功能模块, 并使用VC++6.0开发了基于计算机视觉的工件尺寸在线检测系统.

本文在以下方面进行了主要的研究;

(1)对计算机视觉的概念、工作过程、发展历程做了简单介绍,论述了计算机视觉检测技术的研究内容及国内外应用现状。后面讨论了基于计算机视觉检测技术在工件检测中的应用及发展趋势。

(2)主要研讨了工件在线检测系统的硬件结构,并分析了该计算机视觉系统对光源、光学系统及工业相机和图像采集卡的要求,根据要求给出了适合计算机视觉在线工件检测系统的各个组件的选择。

(3)讨论了利用相机和标定点对之间的几何关系,实现立体视觉标定系统的方法。在使用工件在线检测系统的过程中,相机的外部角元素会产生微小的变化,为此,本文以面阵CCD相机的数学模型为基础,分析了角元素的变化引起的像点移位的规律。

(4)本文结合实际应用,研究了计算机视觉检测系统中部分常用的图像处理算法,包括图像滤波及增强、图像阈值分割算法、边缘检测等等。

(5)基于VC++6.0软件,开发了在线工件检测系统。

[ 关键词 ] 计算机视觉;工件;检测系统

ABSTRACT

Order to achieve workpiece's rapid and high-precision line detection ,The application of computer vision technology to the workpiece size line detection system,We design the hardware and software function module in workpiece size line detection system,Using VC ++ 6.0 development size line detection system based on computer vision artifacts.

This paper discusses the major studies conducted in the following areas:

(1)The concept of computer vision, work processes, the history gives a brief introduction,And then discuss the contents and present situation of Application of Computer Vision Detection Technique。We discussed later based on Computer Vision Detection Technology Application and Development of the workpiece detection . (2)The paper discusses the hardware structure of the workpiece-line detection system, and analyzes the computer vision system's requirements for light source, optical systems and industrial cameras and frame grabbers, gives for computer vision line part inspection system the choice ,according to the requirements of the various components.

(3)We discuss the use of the geometric relationship between the camera and the calibration points, to achieve stereoscopic calibration systems. In-line detection system using a piece of the process, the external diagonal elements of the camera will produce minor changes, this paper analysis of the image point caused by the change of the diagonal elements of the law of displacement the model plane array CCD camera is based on.

(4)In this paper, we do the practical application of research in computer vision inspection system some common image processing algorithms, including image filtering and enhancement, image thresholding algorithm, edge detection and so on. (5)Based on VC++6.0 software, developed an online workpiece detection system。

KEYWORDS:computer vision;workpiece;detecting system

目录

第一章绪论 (6)

1.1计算机视觉技术概述 (6)

1.1.1计算机视觉技术概念 (6)

1.1.2计算机视觉系统的工作过程 (6)

1.1.3计算机视觉的发展历程 (7)

1.1.4计算机视觉的研究内容 (8)

1.1.5计算机视觉的应用现状 (9)

1.2基于计算机视觉的工件检测 (10)

1.2.1基于计算机视觉的工件检测研究现状及其应用 (10)

1.2.2基于计算机视觉的工件检测面临的问题及发展趋势 (11)

1.3本章小结 (12)

第二章计算机视觉在线检测系统的硬件构成 (13)

2.1计算机视觉在线工件检测系统的构成 (13)

2.2光源及照明方式 (13)

2.2.1如何合理选择光源 (13)

2.2.2计算机视觉检测系统常用光源分类 (14)

2.2.3光源照明方式分类 (15)

2.2.4颜色对拍摄的影响 (17)

2.3光学系统 (17)

2.3.1计算机视觉检测系统中常用镜头分类 (17)

2.3.2镜头主要参数对成像质量的影响 (18)

2.3.3镜头各参数间的相互影响关系 (18)

2.3.4工业CCD相机的功能及参数设置 (19)

2.3.5工业相机的接口介绍 (20)

2.4图像采集卡 (20)

2.4.1图像采集原理 (20)

2.4.2图像采集卡简介 (21)

2.4.3用于计算机视觉的图像采集卡的要求 (22)

2.5本章小结 (23)

第三章相机的标定 (24)

3.1立体视觉标定系统的分析与设计 (24)

3.1.1单摄像机标定 (24)

3.1.1.1非线性摄像机模型 (24)

3.1.1.2圆心标定点提取 (26)

3.1.1.3“两步法”标定算法实现 (27)

3.2角元素的变化对像点移位影响的分析 (27)

3.2.1利用偏微分推导角元素变化与像点移位的关系 (27)

3.2.2实验与分析 (30)

3.3本章小结 (34)

第四章计算机视觉检测系统常用算法 (35)

4.1图像滤波及增强 (35)

4.2图像阈值分割算法 (37)

4.3边缘检测 (40)

4.3.1使用梯度进行边缘检测 (41)

4.3.2 Canny边缘检测算子 (41)

4.3.3亚像素边缘检测 (42)

4.3.3.1亚像素定位原理 (42)

4.3.3.2亚像素边缘提取算法 (43)

4.3.4计算机视觉检测系统中其他常用的算法 (44)

4.4本章小结 (44)

第五章工件检测系统 (45)

5.1硬件实验平台 (45)

5.2软件设计与实现 (48)

5.3系统标定 (50)

5.4几何参数测量及算法研究 (51)

5.4.1重心法圆度检测 (51)

5.4.2插值法圆度检测 (54)

5.5实验数据及测量误差分析 (56)

5.5.1实验数据分析 (56)

5.5.2测量误差分析 (57)

5.6本章小结 (58)

第六章总结与展望 (59)

6.1本文工作总结 (59)

6.2 前景展望 (59)

参考文献 (60)

致谢 (61)

第一章 绪论

1.1 计算机视觉技术概述

1.1.1计算机视觉技术概念

计算机视觉技术是计算机学科的一个重要分支,它综合了光学、机械、电子、计算机软硬件等方面的技术,涉及到计算机、图像处理、模式识别、人工智能、信号处理、光机电一体化等多个领域。自起步发展至今,已经有20多年的历史,其功能以及应用范围随着工业自动化的发展逐渐完善和推广,特别是数字图像传感器、CMOS 和CCD 摄像机、DSP 、FPGA 、ARM 嵌入式技术、图像处理和模式识别等技术的快速发展,大大地推动了计算机视觉技术的发展。

计算机视觉技术,是对图像进行自动处理并报告“图像中有什么”的过程,也就是说它识别图像中的内容。简单的说,计算机视觉就是使机器具备“看”的功能,使机器能认识和看懂所要看的东西,能确定它所见范围内目标的位置,即摄像机和计算机等机器代替人眼对目标进行测量、跟踪和识别,并加以判断。一个典型的工业计算机视觉应用系统包括光源、光学系统、图像捕捉系统、图像数字化模块、数字图像处理模块、智能判断决策模块和机械控制执行模块。如图1.1所示,首先采用CCD 摄像机或其它图像拍摄装置将目标转换成图像信号,然后转变成数字化信号并传送给专用的图像处理系统,根据像素分布、亮度和颜色等信息,进行各种运算来抽取目标的特征,根据预设的容许度和其他条件输出判断结果。

图1.1计算机视觉系统的构成

1.1.2 计算机视觉系统的工作过程

一个完整的计算机视觉系统的主要工作过程如下:

1.工件定位检测器探测到物体已经运动至接近摄像系统的视野中心,向图像采集部分发送触发脉冲。

2.图像采集部分按照事先设定的程序和延时,分别向摄像机和照明系统发出启动脉冲。

3.摄像机停止目前的扫描,重新开始新的一帧扫描,或者摄像机在启动脉冲来到之前处于等待状态,启动脉冲到来后启动一帧扫描。

4.摄像机开始新的一帧扫描之前打开曝光机构,曝光时间可以事先设定。 图像采集 判决与控制

图像处理 特征提取

另一个启动脉冲打开灯光照明,灯光的开启时间应该与摄像机的曝光时间匹配。

5.摄像机曝光后,正式开始一帧图像的扫描和输出。

6.图像采集部分接收模拟视频信号后通过A/D转化将采集的图像数字化,或者是直接接收摄像机数字化后的视频数据。

7.图像采集部分将数字图像存放在处理器或计算机的内存中。

8.处理器对图像进行识别、分析、处理,获得测量结果或逻辑控制值。

9.处理结果控制流水线的动作、进行定位、纠正运动误差等。

从上述的工作流程可以看出,计算机视觉检测系统是一个比较复杂的系统。因为大多数监控对象都是运动物体,系统与运动物体的匹配尤为重要,所以给系统各部分的运作时间和处理速度带来了严格的要求。在某些应用领域,例如机器人、飞行物体导航等,对整个系统或者系统的一部分的重量、体积和功耗都会有严格的要求。

1.1.3计算机视觉的发展历程

计算机视觉从20世纪50年代从统计模式识别开始的,当时的工作主要集中在二维图像分析和识别上,如光学字符识别、工件表面、显微图片和航空图片的分析以及解释等。

60年代,Roberts(1965)通过计算机程序从数字图像中提取诸如立方体、楔形体、棱柱等多面体的三维结构,并对物体形状及物体的空间关系进行描述。Roberts对积木世界的创造性研究带给人们极大的启发,许多人相信,一旦由白色积木玩具组成的三维世界可以被理解,则可以推广到理解更复杂的三维场景。于是人们对积木世界进行了深入的研究,研究范围从边缘、角点等特征的提取,到线条、平面、曲面等几何要素的分析,一直到图像明暗、纹理、运动以及几何成像等,并建立了各种数据结构和推理规则。到了70年代,已经出现了一些视觉应用系统(Guzman1969,Mack worth 1973)。70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“计算机视觉”(Machine Vision)课程,由国际著名学者B.K.P.Horn教授讲授。同时,MITAI实验室吸引了国际上许多知名学者参与计算机视觉的理论、算法、系统设计的研究。1977年,David Mare 教授提出了不同于“积木世界”分析方法的计算机视觉(Computational Vision)理论,该理论成为80年代计算机视觉研究领域中的一个十分重要的理论框架。

可以说,对于计算机视觉的全球性的研究热潮是从20世纪80年代开始的,到80年代中期,计算机视觉获得了蓬勃的发展,新概念、新方法、新理论不断涌现。例如,基于感知特征群的物体识别理论框架、主动视觉理论框架、视觉集成理论框架等。到目前为止,计算机视觉仍然是一个非常活跃的研究领域,许多会议、论文都反映了该领域的最新进展。例如,国际计算机视觉与模式识别会议(International Conference on Computer Vision and Pattern Recognition,

CVPR);国际计算机视觉会议(International Conference on Computer Vision,ICCV);国际模式识别会议(International Conference on Robots and Automaton,ICRA);计算机视觉研讨会(Workshop on Computer Vision,WCA)以及许多SPIE 的会议,还有许多学术期刊也包含了这一领域的最新成果,如,IEEE Transaction on Pattern Analysis and Machine Intelligence(PAMI):Computer Vision,Graphics,and Image Processing(CVGIP):IEEE Transaction on Image Processing;IEEE Transaction on Systems,Man,and Cybernetics(SMC):Machine Vision and Application;International Journal on Computer Vision(IJCV);Image and Vision Computing;Pattern Recognition。

1.1.4计算机视觉的研究内容

计算机视觉研究可分为如下五大研究内容:

(1)输入设备

输入设备(Input Device)包括成像设备和数字化设备。成像设备是指通过光学摄像机或红外、激光、超声、x射线对周围场景或物体进行探测成像,得到关于场景或物体的二维、三维数字化图像。目前应用于视觉研究的大多数输入设备是商品化的产品,如,CCD黑白或彩色摄像机、数字扫描仪、超声成像探测仪、CT成像设备等。

(2)底层视觉

底层视觉(1ow level)主要是对输入的原始图像进行处理,这一过程借用了大量图像处理技术和算法,如图像滤波、图像增强、边缘检测等,以便从图像中抽取诸如角点、边缘、线条以及色彩等场景的基本特征。

(3)中层视觉

中层视觉(Middle level)的主要任务是恢复场景的深度、表面法线方向、轮廓等有关场景的2.5维信息,实现的途径有立体视觉(stereo vision)、测距成像(range finder)、运动估计(motion estimation)、明暗特征、纹理特征等。

(4)高层视觉

高层视觉(high level)的任务是在以物体为中心的坐标系中,在输入原始图像、图像基本特征、2.5维图的基础上,恢复物体的完整三维图,建立物体的三维描述,识别三维物体并确定物体的位置和方向。

(5)体系结构

体系结构(system architecture)这一术语最通常的含义是指在高层抽象的层次上,根据系统模型,而不是根据实际设计的具体例子来研究系统的结构体系。结构研究涉及一系列相关的课题:并行结构、分层结构、信息流结构、拓扑结构以及从设计到实现的途径。

1.1.5计算机视觉的应用现状

计算机视觉技术正广泛地应用于各个方面,从医学影像到遥感图像,从工业检测到文件处理,从毫微米技术到多媒体数据库,不一而足。可以说需要人类视觉的场合几乎都需要计算机视觉。计算机视觉不会有人眼的疲劳,有着比人眼更高的分辨精度和速度,借助红外线、紫外线、x射线、超声波等高新探测技术,它在探测不可视物体和高危险场景时,更具有其突出优点。下面是计算机视觉技术的典型应用:

(1)在工业检测中的应用

目前,计算机视觉已成功地应用于工业检测领域,大幅度地提高了产品的质量和可靠性,保证了生产的速度。例如产品包装,印刷质量的检测,饮料行业的容器质量、饮料填充、饮料瓶封口检测,木材厂木料检测,半导体集成块封装质量检测,卷钢质量检测,关键机械零件的工业CT等。在海关,应用x射线和计算机视觉技术的不开箱货物通关检验,大大提高了通关速度,节约了大量的人力和物力。在制药生产线上,计算机视觉技术可以对药品包装进行检测,以确定是否装入正确数量的药粒。

(2)在农产品分选中的应用

我国是一个农业大国,农产品十分丰富,对农产品进行自动分级,实行优质优价,以产生更好的经济效益,其意义十分重大。如水果,根据颜色、形状、大小等特征参数。禽蛋,根据色泽、重量、形状、大小等外部特征;烟叶,根据其颜色、形状、纹理、面积等进行综合分级限”。此外,为了提高加工后农产品的品质,对水果的坏损部分、粮食中混杂的杂质、烟叶茶叶中存在的异物等都可以计算机视觉系统进行检测并准确去除。随着工厂化农业的快速发展,利用计算机视觉技术对作物生长状况进行监测,实现科学浇灌和施肥,也是一种重要应用。

(3)在机器人导航系统中的应用

赋予机器人视觉是机器人研究的重要课题之一,其目的是要通过图像定位、图像理解,向机器人运动控制系统反馈目标或自身的状态与位置信息,使其具有在复杂、变化的环境中适应的能力。例如机械手在一定范围内抓取和移动工件,摄像机利用动态图像识别与跟踪算法,跟踪被移动工件,始终保持其处于视野的正中位置。

(4)在医学中的应用

在医学领域,计算机视觉用于辅助医生进行医学影像的分析,主要利用数字图像处理技术、信息融合技术对X射线透视图、核磁共振图像、CT图像进行适当叠加,然后进行综合分析;还有对其它医学影像数据进行统计和分析,如利用数字图像的边缘提取与图像分割技术,自动完成细胞个数的计数或统计,

这样不仅节省了人力,而且大大提高准确率和效率。

(5)其它方面

在闭路电视监控系统中,计算机视觉技术被用于增强图像质量,捕捉突发事件,监控复杂场景,鉴别身份,跟踪可疑目标等,它能大幅度地提高监控效率,减少危险事件发生的概率。在交通管理系统中,计算机视觉技术被用于车辆识别、调度,向交通管理与指挥系统提供相关信息。在卫星遥感系统中,计算机视觉技术被用于分析各种遥感图像,进行环境监测、地理测量,根据地形、地貌的图像和图形特征,对地面目标进行自动识别、理解和分类等。

1.2基于计算机视觉的工件检测

1.2.1基于计算机视觉的工件检测研究现状及其应用

计算机视觉在工业中的应用主要包括视觉检测和视觉控制机器人导航。视觉检测包括对图像与预定义的标准进行比较,获取被测对象的几何特征参数、形位参数。机器人导航包括道路规划、避免碰撞、自适应位置控制和机器人相对于特定目标在三维空间中准确定位等。国外计算机视觉检测从上个世纪八十年代初开始已得到了广泛的研究,而国内视觉检测技术从上世纪九十年代才开始得到重视。下面主要针对工业应用中的工件检测方面进行介绍。

在工件尺寸检测民事应用中,典型的应用包括通用汽车研究实验室开发的用于汽车零件检测的视觉原型系统;由Totalists和FU描述的用于电力方向阀的16齿工件部件的检测;Gregory和Taylor描述的一种使用知识库的方法来检测汽车制动零件;Schlumbergera和Ashlers提出的一种不同的汽车检测方法,即用一个装配在机器人上的照相机来检测大尺寸平面上的信息,照相机移动到感兴趣的区域点进行图像摄取,然后对图像进行增强处理和二值化处理,把描绘出的轮廓与参照轮廓进行比较来检测裂痕、折叠、孔洞丢失和其他缺陷Mills报道过通过线扫描相机来获取检测图像,分析处理后得到被检圆柱零件的精确尺寸公式的金属组件尺寸测量系统;Lima研究的是三维曲面阀的尺寸测量系统;Clements设计了一个用于检测刀具破损的CNC视觉系统来替代以往的电子机械探测器。天津大学研究和开发了汽车车身计算机视觉检测系统;国内在机械零件形状参数的视觉检测方面也做了大量的研究和探索。

在军事上的应用主要体现在武器装备无损检测中,比如装甲车辆焊接部位的检查,飞机零件、发动机曲轴质量的探视等。通常,这类检查是采用高压(几百千伏)产生的硬x射线穿透零件进行拍片观察的,由于这种硬射线对人体的危害极大,弊端很多,在实际应用中很不方便。采用计算机视觉对武器装备进行探伤检测既实现了检测工作的流水作业又具有安全、迅速、节约等优越性,是一种较为理想的检测方法。

1.2.2基于计算机视觉的工件检测面临的问题及发展趋势

近年来人们对于计算机视觉进行了卓有成效的研究并研究出大量的技术和算法,但计算机视觉仍然处于不成熟的阶段,远未达到所寄予的水平。在目前的工业环境中,工件检测技术所面临的最大障碍是精度和算法复杂性之间的矛盾。目前大部分工件检测主要依赖于简单的二值图像,并且在对具体任务所设计的结构光下才能正常工作,而且在不同角度获取的同一工件的图像也会有很大的差异,图像容易出现多义性。由于图像处理的重复精度较低、处理时间较长、视觉系统昂贵以及没有现成的视觉系统等原因,使基于二维灰度图像的处理还没有广泛应用到工件检测中去。

未来的工件视觉检测研究方向主要在以下几点:

(1)实现在线实时检测。视觉检测执行时间在很大程度上取决于低层图像处理(图像平滑、滤波、分割等)速度。因此,可以使用专用硬件实现独立于环境的处理算法,可大大提高图像处理速度。另外也可以改进图像处理算法来提高处理速度,实现实时检测。

(2)实现智能化检测,从CAD系统中提取零件视觉模型与检测信息(包括零件位置与方向、摄像机视角等),选定检测项目、检测点和检测路径,建立智能检测规划,并控制工业机器人抓取零件并放置到合适的位置进行检测。

(3)实现高精度检测。与视觉系统相比,CMM在检测精度和测量空间范围上占有很大优势.因此,基于CMM的视觉检测系统已经成为视觉检测技术的一种新趋势。集成化的CMM和视觉检测系统可以利用视觉系统迅速识别零件的形状及其在测量平台上的位置和状态,完成机器坐标系、零件坐标系、摄像机坐标系之间的转换,帮助CMM实现检测路径自动形成与测量结果判断。同时深入研究亚像素定位技术,使之应用到实际的检测系统中,以提高检测精度和降低系统成本。

(4)计算机视觉柔性检测技术。目前几乎所有的计算机视觉检测系统都只适用于解决特定的检测任务,建立一种较为通用的视觉检测系统,以适用于不同条件下的检测任务,进而实现对目标进行“完全检测”,是目前和将来视觉检测系统的一个发展方向。

(5)研究开发彩色图像、灰度图像和多谱图像的处理算法,拓展视觉检测的应用。

(6)智能相机:智能相机拥有体积小、价格低、使用安装方便、用户二次开发周期短等优点,非常适合生产线上安装使用。视觉检测技术作为一种新兴的检测技术,现代工业为其提供了巨大的需求空间。工业检测的复杂性和多样性,也必然使工业图像检测技术呈现出复杂性和多样性,这种复杂性和多样性为我们提供了广阔的研究领域。总之,我们相信,随着计算机视觉技术自身的

成熟和发展.计算机视觉检测技术必将在现代和未来制造企业中得到越来越广泛的应用。

1.3本章小结

本章主要对计算机视觉技术进行了概述,论述了其概念,工作过程等。并对计算机视觉技术在国内外的发展过程、应用现状和未来发展做了简要描述。

第二章计算机视觉在线检测系统的硬件构成

2.1计算机视觉在线工件检测系统的构成

计算机视觉技术是用计算机来分析一个图像,并根据分析得出结论。根据不同的应用方向,计算机视觉系统各有差异。尽管实际应用中的计算机视觉各有不同,但都包括以下几个过程:

●图像采集:光学系统采集图像,图像转换成数字格式并传入计算机存储器;

●图像处理:处理器运用不同的算法来提高对结论有重要影响的图像要素;●特征提取:处理器识别并量化图像的关键特征;

●判决和控制:处理器的控制程序根据收到的数据做出结论。

计算机视觉在线工件检测系统属于计算机视觉系统在探测部件方面的应用,系统要求能够精确的观测目标,并对哪些部件可以通过检测,哪些需要废弃做出有效的决定。因此,如图2.1所示,计算机视觉在线工件检测系统应包括光源、光学系统、CCD相机、图像采集卡、图像处理模块和快速准确的执行机构等几部分。

检测目标光学成像图像获取系统图像采集与数字

控制执行模块

图像处理模块光源

图2.1计算机视觉在线工件检测系统结构

2.2光源及照明方式

2.2.1如何合理选择光源

光源是影响计算机视觉系统输入的重要因素,因为它直接影响输入数据至少30%的应用效果。一个稳定的、可靠的机器系统不能仅仅局限于在试验室的严格条件下才能应用,而应该在真正的工业制造环境中,在不断变化的环境中,对于不同的材料、不同的机器都可以实时摄取到高质量、高对比度的图像。基于这种情况,选择合适的,能够克服这些因素的光源非常重要。视觉检测系统与其它传感器的工作情况不同,它对光线的依赖性很大,往往需要很好的照明条件,使物体形成的图像最为清晰,复杂程度最低,得到最多的有用信息,消除不必要的阴影、低反差和镜面反射等。

在计算机视觉应用系统中,好的光源与照明方案往往是整个系统成败的关键,起着非常重要的作用。光源与照明方案的配合应尽可能地突出物体特征量,在物体需要检测的部分与那些不重要的部份之间应尽可能地产生明显的区别,增加对比度。同时还应保证足够的整体亮度,物体位置的变化不应该影响成像的质量。在视觉检测应用系统中一般使用透射光和反射光。对于反射光情况应充分考虑光源和光学镜头的相对位置、物体表面的纹理,物体的几何形状等要素。光源设备的选择必须符合所需的几何形状、照明亮度、均匀度,发光的光谱特性也必须符合实际的要求,同时还要考虑光源的发光效率和使用寿命。总之,应该根据实际的任务,选择和设计不同的光源形式,以达到物体成像的最佳状态。

2.2.2计算机视觉检测系统常用光源分类

在目前的计算机视觉检测系统中常用的光源有以下几种:

●荧光灯:即日常使用的荧光灯。

●卤素灯+光纤导管:这是由一个卤素灯泡,在一个装置(通常称为灯箱)中发光。再由光纤导管将卤素灯所产生的强光,转向被测物进行照明。

●LED光源:即由多个LED发光二极管以某种特定的形状,综合对被测物进行照明。这是目前最普遍采用的照明方式。

表2.2列出了这几种光源的相关特性

复杂设计使用寿命温度影响稳定度成本亮度荧光灯低一般一般差低低

卤素灯+ 光纤导管一般差差一般高高LED光源高好低好一般一般

其中我们主要介绍目前计算机视觉检测系统中最常用LED光源,LED光源凭借下面几个显著特点成为最适合计算机视觉检测系统应用的专用光源:

(I)形状的自由度

一个LED光源是由许多单个LED发光管组合而成的,因而比其他光源可做成更多的形状,更容易针对用户的情况,设计光源的形状和尺寸。

(2)使用寿命长

为了使图像处理单元得到精确的,重复性好的测量结果,照明系统必须保证相当长的时间内能够提供稳定的图像输入。LED光源在连续工作10,000到30,000小时后,亮度衰减,但远比其他型式的光源效果好。此外,用控制系统使其间断工作,可抑制发光管发热,寿命将延长一倍。

(3)应答速度快

LED发光管响应时间很短,响应时间的真正意义是能按要求保证多个光源之间或一个光源不同区域之间的工作切换。采用专用电源给LED光源供电时,

达到最大照度的时间小于10us。

(4)可自由选择颜色

除了光源的形状以外,欲得到稳定图像输入的另一方面就是选择光源的颜色。甚至相同形状的光源,由于颜色的不同得到的图像也会有很大的差别。实际上,如何利用光源颜色的技术特性得到最佳对比度的图像效果一直是光源开发的主要方向。

(5)综合性运转成本低

选用低廉而性能没有保证的产品,初次投资的节省很快会被日常的维护、维修费用抵消。其他光源不仅耗电是LED光源的2—10倍,而且几乎每月就要更换,浪费了维修工程师许多宝贵的时间。而且投入使用的光源越多,在器件更换和人工方面的花费就越大,因此选用寿命长的LED光源从长远看是很经济的。

2.2.3光源照明方式分类

由光源构成的照明系统按其照射方法可分为:背向照明、前向照明、结构光和频闪光照明等。其中,背向照明是被测物放在光源和相机之间,它的优点是能获得高对比度的图像;前向照明是光源和相机位于被测物的同侧,这种方式便于安装;结构光照明是将光栅或线光源等投射到被测物上,根据它们产生的畸变,解调出被测物的三维信息;频闪光照明是将高频率的光脉冲照射到物体上,要求相机的扫描速度与光源的频闪速度同步。

在使用计算机视觉检测系统进行产品检测时,最重要的是如何使被测物与背景灰度值区别开。目前在图像处理领域最广泛应用阈值分割技术来达到这一效果,通过阈值分割得到的二值化图像可大大缩短处理时间、简化处理过程。下面列举几个在光源选型中非常重要的几个基本技术:

(1)明视野、暗视野照明

(a)暗视野拍摄手法(b)明视野拍摄手法

图2.2 明视野与暗视野照明技术原理图

明视野拍摄方式就是使反射光被摄像机获取,用直射光来观察被测物体,

因此发生散射的部分成黑色。而暗视野拍摄方式就是用散射光来观察被测物体,散射光的部分成白色。如图2.3所示。

(a )图 (b )图

图2.3(a )图采用明视野手法拍摄,(b )图使用暗视野手法拍摄 (2)漫射光照明

由于某些被测物的表面反光现象非常严重,可以使用漫反射光照明方式进行照明。既避免反光的出现,也便于进行后续的各种图像处理算法。Lambert 定律指出,漫反射的效果与表面相对于光源的取向有关,即:

θc o s ??=d p d K I I (2.1)

其中d I 是漫反射引起的可见表面上的一点亮度。p I 是点光源发出的入射光线引起的亮度。d K 是漫反射系数,它的取值在0到1之间,随物体材料不同而不同。是可见表面法向N 和点光源方向L 之间的夹角,即入射角,它应该在0°到90°之间。

(3)透射照明

被测物因材料和厚度的不同对光的透过性能(透明度)各异。而光根据其波长的长短也具有不同的穿透力,光的波长越长,它的穿透能力就越强。透射照明就是使光线穿过被测物并观察其透过光的照明方法。图2.4和图2.5为透射照明的实际用例。

图2.4 透射照明示例:检查包装内药片的个数及完整性

图2.5 透射照明示例:树脂型材的轮廓及尺寸测量

2.2.4颜色对拍摄的影响

由于不同颜色的被测物可以吸收不同颜色的光,如红色可以吸收红色以外的所有光等,因此巧妙地选择照明光源的颜色,可以使难以获取的图像一举成功或使获取的图像变得更为优质。

总而言之,在现实应用中,每个计算机视觉检测系统的工件都有所不同,各有特点。因此必须选择合适的光源,拍摄得到合适的图像才能进行后续工作。这样可以提高系统稳定性并且降低算法复杂度,提高算法速度。

2.3光学系统

在计算机视觉系统中,镜头的主要作用是将成像目标聚焦在图像传感器的光敏面上。镜头的质量直接影响到计算机视觉系统的整体性能,合理选择并正确安装光学镜头,是计算机视觉系统设计的一个重要环节。

2.3.1计算机视觉检测系统中常用镜头分类

(1)根据视场的大小划分

每个镜头都有一个视场,在这个区域内可以使无限远处的景物结成清晰影像。照相机或摄像机的靶面一般都位于视场之内,这一限定范围称为有效像场。由于视觉系统中选用的摄像机靶面尺寸有各种型号,所以在选择镜头时一定要注意镜头的有效视场应该大于或等于摄像机的靶面尺寸,否则成像的边角部分会模糊甚至没有影像。

(2)根据焦距分类

根据焦距能否调节,可分为定焦镜头和变焦镜头两大类。依据焦距的长短,定焦距的镜头又可分为鱼眼镜头、短焦镜头、标准镜头、长焦镜头、超长焦镜头五大类。需要注意的是焦距的长短划分并不是以焦距的绝对值为首要标准,而是以像角的大小为主要区分依据,所以当靶面的大小不等时,其标准镜头的焦距大小也不相同。变焦镜头上都有变焦环,调节该环可以使镜头的焦距值在预定的范围内灵活改变。变焦距镜头最长焦距值和最短焦距值的比值称为该镜头的变焦倍率。变焦镜头又可分为手动变焦和电动变焦两大类。

变焦镜头由于可连续改变焦距值的特点,在需要经常改变摄影视场的情况

下非常方便,所以在摄影领域内应用非常广泛。但由于变焦距镜头的透镜片数多、结构复杂,所以最大相对孔径不能做的太大,致使图像亮度较低、图像质量变差,同时在设计中也很难针对各种焦距、各种调焦距离做像差校正,所以其成像质量无法和同档次的定焦距镜头相比。

(3)根据镜头接口类型划分

镜头和摄像机之间的接口有许多不同的类型,工业摄像机常用的包括C 接口、CS 接口、F 接口、V 接口等。接口类型的不同和镜头性能及质量并无直接关系,一般可以找到各种常用接口之间的转换口。

2.3.2 镜头主要参数对成像质量的影响

以上介绍了不同类型的镜头,即使对于同一类型的镜头其成像质量也有着相当大的差距,这主要是由于材质、加工精度和镜片结构的不同等因素造成的,同时也导致不同档次的镜头价格从几百元到几万元的巨大差异。

像差是影响图像质量的重要方面,常见的像差有如下六种:球差、慧差、像散、场曲、色差、畸变。其中畸变与另外五个之间的根本区别是,畸变像差只影响影像的几何形状,而不影响影像的清晰度。

在评价镜头质量时一般还会从分辨率、明锐度和景深等几个实用参数判断。

(1)分辨率(Resolution ):又称鉴别率、解像力,指镜头清晰分辨被摄景物纤维细节的能力。分辨率的单位为“线对/毫米”(1p /mm)。

(2)明锐度(Acutance ),也称对比度,是指图像中最亮和最暗部分的对比度。

(3)景深(DOF ):在景物空间中,位于调焦物平面前后一定距离内的景物,还能够结成相对清晰的影像。上述位于调焦物平面前后的能结成相对清晰影像的景物间的纵深距离,也就是能在实际像平面上获得相对清晰影像的景物空间的深度范围,称为景深。

(4)最大相对孔径与光圈系数:相对孔径是指该镜头的入射光孔直径(D)与焦距(0f )之比,相对孔径=0f D 相对孔径的倒数称为光圈系数。一般镜头的光圈

系数是可以调节的,其最大相对孔径或光圈系数往往标示在镜头上,如果拍摄现场的光线较暗或曝光时间很短,则需要尽量选择最大相对孔径较大的镜头。

2.3.3镜头各参数间的相互影响关系

(1)焦距大小的影响情况

焦距越小,景深越大;焦距越小,畸变越大;焦距越小,渐晕现象越严重,使像差边缘的照度降低。

(2)光圈大小的影响情况

光圈越大,图像亮度越高;光圈越大,景深越小;光圈越大,分辨率越高;光圈越大,球差和慧差越严重;光圈越大,渐晕现象越严重,光场照度越不均匀。

(3)像场中央与边缘

一般像场中心较边缘分辨率高;一般像场中心较边缘光场照度高。

(4)光波长度影响

在相同摄像机及镜头参数条件下,照明光源的光波波长越短,得到的图像分辨率越高。所以在需要精密尺寸及位置测量的视觉系统中,尽量采用短波长的单色光做为照明光源,对提高系统精度有很大的作用。

2.3.4工业CCD相机的功能及参数设置

1.同步方式的选择

对单台工业CCD相机而言,主要的同步方式有:内同步、外同步、电源同步等。其具体功能如下:

内同步:利用相机内置的同步信号发生电路产生的同步信号来完成同步信号控制;

外同步:通过外置同步信号发生器将特定的同步信号送入相机的外同步输入端,完成满足对相机的特殊控制需要;

电源同步(线性锁定,line lock):用相机的AC电源完成垂直同步。

对于由多个CCD相机构成的图像采集系统,希望所有的视频输入信号是垂直同步的,以避免变换相机输出时出现的图像失真。此时,可利用同一个外同步信号发生器产生的同步信号驱动多台相机,以实现多相机的同步图像采集。

2.自动增益控制

CCD相机通常具有一个对CCD的信号进行放大的视频放大器,其放大倍数称为增益。若放大器的增益保持不变,则在高亮度环境下将使视频信号饱合。利用相机的自动增益控制(AGC)电路可以随着环境内外照度的变化自动的调整放大器的增益,从而可以使相机能够在较大的光照范围内工作。

3.背光补偿

通常,CCD相机的AGC工作点是以通过对整个视场的信号的平均值来确定的。当视场中包含一个很亮的背景区域和一个很暗的前景目标时,所确定的AGC工作点并不完全适合于前景目标。当启动背景光补偿时,CCD相机仅对前景目标所在的子区域求平均来确定其AGC工作点,从而提高了成像质量。

4.电子快门

CCD相机一般都具备电子快门特性,电子快门不需任何机械部件。CCD相机采用电子快门控制CCD的累积时间。当开启电子快门时,CCD相机输出的仅是电子快门开启时的光电荷信号,其余光电荷信号则被泄放。目前,CCD相机的最短电子快门时间一般为1/10000秒;当电子快门关闭时,对NTSC制式相机,其CCD 累积时间为1/60秒;对于PAL制式相机,则为1/50秒。较高的快门速度对于观察运动图像会产生一个“停顿动作”效应,从而大大地增加了相机的动态分

辨率。同时,当电子快门速度增加时,在CCD积分时间内,聚焦在CCD上的光通量减少,将会降低相机的灵敏度。

5.γ(伽玛)校正

在整个视觉系统中需要进行两次转换:CCD传感器将光图像转换为电信号,即所谓光电转换;电信号经传输后,在接收端由显示设备将电信号还原为光图像,即所谓电光转换。为了使接收端再现的图像与输出端原图像相一致,必须保证两次转换中的综合特性具有线性特征。

CCD传感器上的光(L)和从相机出来的信号电压(V)之间的关系为V=Lγ。在一个标准的TV系统中,相机的γ系数为0.45。对于计算机视觉应用,γ系数应为1.0,从而为光和电压之间提供了线性关系。

6.白平衡

白平衡功能仅用于彩色CCD相机,其主要功能是实现相机图像对实际景物的精确反映。一般分为手动白平衡和自动白平衡两种方式。CCD相机的自动白平衡功能一般分为连续方式和按钮方式。处于连续方式时,相机的白平衡设置将随着景物色温的改变而连续地调整,范围一般为2800~6000K。这种方式适宜于对于景物的色彩温度在成像期间不断改变的场合,可使色彩表现更加自然。但对于景物中很少甚至没有白色时,连续的白平衡功能不能产生最佳的彩色效果;处于按钮方式时,可先将相机对准白色目标,然后设置自动方式开关,并保留在该位置几秒钟或至图像呈现白色为止。在执行白平衡后,重新设置自动方式开关以锁定白平衡设置,此时白平衡设置将存储于相机的存储器中,其范围为2300~10000K。以按钮方式设置白平衡最为精确和可用,适用于大部分应用场合。CCD相机处于手动白平衡状态时,可通过手动方式改变图像的红色或蓝色状况,有多达107个等级供调节。如增加或减少红色各一个等级、增加或减少蓝色各一个等级等。

2.3.5工业相机的接口介绍

Camera Link:高速,高可靠性。不便于多相机连接和集中控制,电缆价格高。IEEE1394:灵活新高,成本低。传输距离短,可靠性低。

USB 2.0:灵活性高,成本低。传输距离短,可靠性低,技术不成熟。

Gigabit Ethernet:灵活性高,可扩充性强,支持远距离传输,支持多点传输,技术成熟,鲁棒性强,成本低。

2.4图像采集卡

图像采集卡是计算机视觉系统的重要组成部分,其主要功能是对相机所输出的视频数据进行实时地采集,并提供与PC的高速接口

2.4.1 图像采集原理

视频采集即将视频转换成PC机可使用的数字格式。

人工智能与计算机视觉

过去几年,全球的互联网公司包括谷歌、微软、Facebook以及中国的百度、阿里巴巴都在加强人工智能领域的投资,设立自己的人工智能研究院。vivo是第一家设立专攻人工智能方向研究院的中国手机公司。此举是vivo内部已经确立的一份3-5年的中长期发展的战略规划,未来对人工智能的发展研究是必然趋势,vivo公司创始人兼CEO沈炜曾表示“人工智能和5G的结合将会是5G时代手机发展的趋势”。 今年我们看到vivo在产品上不少创新,比如AI拍照、商用屏下指纹技术等等,这些都是基于生物特征(biometrics)的鉴别技术,除此之外还有对人脸、虹膜、指纹、声音等特征上的识别,这些大多涉及到视觉信息,正是体现了计算机视觉的应用性,那什么是计算机视觉呢? 计算机视觉技术的概念 正像其它学科一样,一个大量人员研究了多年的学科,却很难给出一个严格的定义,模式识别如此,目前火热的人工智能如此,计算机视觉亦如此。与计算机视觉密切相关的概念有视觉感知(visual perception),视觉认知(visual cognition),图像和视频理解( image and video understanding)。这些概念有一些共性之处,也有本质不同。 从广义上说,计算机视觉就是“赋予机器自然视觉能力”的学科。自然视觉能力,就是指生物视觉系统体现的视觉能力。一则生物自然视觉无法严格定义,在加上这种广义视觉定义又“包罗万象”,同时也不太符合40多年来计算机视觉的研究状况,所以这种“广义计算机视觉定义”,虽无可挑剔,但也缺乏实质性内容,不过是一种“循环式游戏定义”而已。 实际上,计算机视觉本质上就是研究视觉感知问题。视觉感知,根据维科百基(Wikipedia)的定义, 是指对“环境表达和理解中,对视觉信息的组织、识别和解释的过程”。根据这种定

计算机视觉与数字摄影测量的结合展望

计算机视觉与数字摄影测量的结合展望摘要:摄影测量在进入数字摄影测量时代就已经与计算机视觉技术紧密的联系在了一起,计算机视觉技术的快速发展给近景摄影测量带来了巨大的变革。本文分别简要介绍了摄影测量和计算机视觉技术,重点阐述了两者的异同点,最后做出总结。 关键字:计算机视觉;数字摄影测量;差异;影响匹配 1前言 摄影测量的发展经过了三个阶段,现已进入数字摄影测量阶段。数字摄影测量以数字影像为基础,通过计算机分析和量测来获取被摄物体的三维空间信息,正在成为国际公认的地球空间数据获取的重要手段[1]。数字摄影测量利用一台计算机,加上专业的摄影测量软件,就代替了过去传统的、所有的摄影测量的仪器。其中包括纠正仪、正射投影仪、立体坐标仪、转点仪、各种类型的模拟测量仪以及解析测量仪。数字摄影测量的发展,计算机不仅可以代替人工进行大量的计算,而且已经完全可能代替人眼来识别同名点,从而为摄影测量开辟了真正的自动化道路[2]。 计算机视觉是一个相对年轻而又发展迅速的领域。80年代以来,计算机视觉的研究已经历了从实验室走向实际应用的发展阶段,而计算机工业水平的飞速提高以及人工智能、并行处理和神经元网络等学科的发展,更促进了计算机视觉系统的实用化和涉足许多复杂视觉过程的研究[3]。其目标是使计算机具有通过二维图像认知三维环境信息的能力,这种能力将不仅使机器能感知三维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解[4]。数字摄影测量具有类似的目标,也面临着相同的基本问题。数字摄影测量学涉及多个学科,如图像处理、模式识别以及计算机图形学等。由于它与计算机视觉的联系十分紧密,有些专家将其看成是计算机视觉的分支。 2数字摄影测量与计算机视觉的差异 2.1出发点不同导致基本参数物理意义不同 计算机视觉是研究怎样用计算机模拟人的眼睛,实现机器人的视觉,它是以眼睛(摄影机)中心与光轴构成的坐标系为准,它定义的平移量是空间坐标系相对于摄影机坐标系的平移量。而摄影测量是测绘地形图的重要生产手段,它以空间(地面)统一坐标系为基准,如在一个地区进行航空摄影测量,所有摄影机的空间位置与影像的坐标都相对于该空间坐标系。因此,在摄影测量中的“外定向”是确定影像在空间相对于物体的位置与方位;而计算机视觉通常从另一个方向描述这个问题:搜索物体相对于影像的位置与方位。 2.2出发点不同导致基本公式的不同 由于物体与影像基本关系之间的差异,从而引起计算机视觉与摄影测量之间的基本公式的差异。计算机视觉与摄影测量都是研究物体与影像关系的,因此,描述三维物体与二维影像坐标之间的关系公式是它们的基本公式。计算机视觉最基本的公式用齐次坐标的投影方程表达为[5,6]:

计算机视觉检测技术及其在机械零件检测中的应用_张文景

第33卷第5期 1999年5月 上海交通大学学报 JO U RN A L O F SHA N GHA I JIA O T O NG U N IV ERSIT Y Vol.33No.5 M ay 1999  收稿日期:1998-03-16 基金项目:上海市科技发展基金资助项目(951111052)作者简介:张文景(1971~),男,博士生. 文章编号:1006-2467(1999)05-0635-04 计算机视觉检测技术及其在机械零件检测中的应用 张文景, 张文渊, 苏键锋, 许晓鸣 (上海交通大学自动化系,上海200030) 摘 要:基于计算机视觉检测(A VI)技术在检测系统的智能化、柔性、快速性等方面较接触式检测方法具有更大的优越性,综述了其基本原理和分类以及近年来此方面的研究成果.分析了利用AVI 技术对机械零件进行检测的一般方法和系统构成,并探讨了基于CAD 的AV I 的关键环节.最后对AVI 技术的发展趋势提出了作者的观点. 关键词:计算机视觉;计算机视觉检测;计算机辅助设计;机械零件中图分类号:TP 391 文献标识码:A Automated Visual Inspection and Its Application on Inspection of Machined Parts ZH A N G Wen -j ing , ZH AN G W en -y uan , SU J ian -f eng , X U X iao -ming Dept.of Automation,Shang hai Jiaotong Univ.,Shanghai 200030,China Abstract :With development of co mputer vision ,automated visual inspection (AV I )has mor e applications in a variety of fields in industry.AVI takes more advantages in intellig ence,flex ibility and speed o f inspec-tio n sy stem than contacted inspection.T he recent achievemens r esearched by internatio nal scholars in the field of AVI w ere surveyed .Principle and classificatio n o f inspection techniques w ere intro duced .T he anal-ysis for g ener al methods and sy stem of AVI o f machined par ts w as presented.Key technolo gy o f AVI based on CAD w as also discussed.Some o pinio ns about development of AVI w ere proposed at last. Key words :com puter vision;autom ated visual inspection(AVI);com puter aided design (CAD);m achine parts 随着CIM S 的推广应用,企业在向柔性化、自动化发展的进程中,提出了对计算机辅助质量(CAQ )系统的需求.目前,计算机辅助检测计划(CAIP)系统已成为CAQ 系统的重要组成部分,它的核心问题是解决如何检测零件.在柔性制造中坐标测量机(CM M )是重要的检测手段,在制造企业中得到广泛的应用.随着柔性制造系统(FM S)的推广,人们对 检测系统的智能化、柔性、快速性等方面提出了更高的要求,以适应多品种、小批量生产的需要.计算机视觉技术得到不断发展,由于计算机视觉系统可以快速获取大量信息,且易于同设计信息及加工控制信息集成,用于工况监视、现场监控的计算机视觉系统已广泛地应用在工业、商业等领域[1,2].计算机视觉作为一种检测手段已经越来越引起人们的重视,逐步形成一种新的检测技术——计算机视觉检测(Autom ated Visual Inspectio n ,AVI )技术. 本文综合了国内外在AVI 方面的研究成果,总结了利用AVI 技术检测机械零件的一般方法和系

计算机视觉技术

目录 1立体视觉 (1) 1.1计算机视觉技术 (1) 2立体视觉技术 (3) 2.1双目立体视觉技术 (3) 致谢 (8) 附录: (9)

立体视觉 我的毕业论文排版样文 1立体视觉 1.1计算机视觉技术 计算机视觉既是工程领域也是科学领域中的一个富有挑战性的重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中,其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学、神经生理学和认知科学等[18]。 视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断和军事等领域中各种智能自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战。“计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图像信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起[19]。”作为一门学科,计算机视觉开始于60 年代初,但在计算机视觉的基本研究中的许多重要进展是在80 年代取得的。现在计算机视觉已成为一门不同于人工智能、图象处理、模式识别等相关领域的成熟学科[20]。 不少学科的研究目标与计算机视觉相近。这些学科包括图像处理、图像识别、景物分析、图像理解等。由于历史发展或领域本身的特点这些学科互有差别,但又有某种程度的相互重叠。为了清晰起见,把这些与计算机视觉有关的学科从研究目标和方法角度加以归纳[21]。 (1)图像处理 图像处理技术把输入图像转换成具有所希望特性的另一幅图像。例如,可通过处理使输出图像有较高的信噪比,或通过增强处理突出图像的细节,以便于操作员的检验。在计算机视觉研究中经常利用图像处理技术进行预处理和特征抽取。 (2)图像识别 图像识别技术根据从图像抽取的统计特性或结构信息,把图像分成预定的类别。在计算机视觉中图像识别技术经常用于对图像中的某些部分(例如分割区域)的识别和分类。 第 1 页(共9页)

计算机视觉的应用

运动目标检测 目录 基于统计背景模型的运动目标检测方法 背景模型提取 运动目标检测 后处理 基于统计背景模型的运动目标检测方法 问题:(1)背景获取:需要在场景存在运动目标的情况下获得背景图像(2)背景扰动:背景中可以含有轻微扰动的对象,如树枝、树叶的摇动,扰动部分不应该被看做是前景运动目标(3)外界光照变化:一天中不同时间段光线、天气等的变化对检测结果的影响(4)背景中固定对象的移动:背景里的固定对象可能移动,如场景中的一辆车开走、一把椅子移走,对象移走后的区域在一段时间内可能被误认为是运动目标,但不应该永远被看做是前景运动目标(5)背景的更新:背景中固定对象的移动和外界光照条件的变化会使背景图像发生变化,需要及时对背景模型进行更新,以适应这种变化(6)阴影的影响:通常前景目标的阴影也被检测为运动目标的一部分,这样讲影响对运动目标的进一步处理和分析首先利用统计的方法得到背景模型,并实时地对背景模型进行更新以适应光线变化和场景本身的变化,用形态学方法和检测连通域面积进行后处理,消除噪声和背景扰动带来的影响,在HSV色度空间下检测阴影,得到准确的运动目标。 背景模型提取 前提假设在背景模型提取阶段,运动目标在场景区域中运动,不会长时间停留在某一位置视频流中某一像素点只有在前景运动目标通过时,它的亮度值才发生大的变化,在一段时间内,亮度值主要集中在很小的一个区域中,可以用这个区域内的平均值作为该点的背景值。具体实现过程:在YUV颜色空间下,Y值的变化范围为0~255,将该范围划分成若干区间[0,T][T,2T]…[Nt,255],n=255/T,对于每个像素点,统计一段时间内每个区间内亮度值的出现的次数。找出出现次数最多的那个区间,将该区间内所有值的平均值作为背景模型在该点的亮度值。这种方法不受前景运动目标的影响。 运动目标检测 检测当前图像和背景图像中对应像素点的差异,如果差值大于一定阈值,则判定该像素为前景运动目标

人机交互中的计算机视觉技术.

人机交互中的计算机视觉技术 基于视觉的接口概念 计算机视觉是一门试图通过图像处理或视频处理而使计算机具备“ 看” 的能力的计算学科。通过理解图像形成的几何和辐射线测定, 接受器(相机的属性和物理世界的属性, 就有可能 (至少在某些情况下从图像中推断出关于事物的有用信息, 例如一块织物的颜色、一圈染了色的痕迹的宽度、火星上一个移动机器人面前的障碍物的大小、监防系统中一张人脸的身份、海底植物的类型或者是 MRI 扫描图中的肿瘤位置。计算机视觉研究的就是如何能健壮、有效地完成这类的任务。最初计算机视觉被看作是人工智能的一个子方向, 现在已成为一个活跃的研究领域并长达 40年了。 基于视觉的接口任务 至今,计算机视觉技术应用到人机交互中已取得了显著的成功,并在其它领域中也显示其前景。人脸检测和人脸识别获得了最多的关注, 也取得了最多的进展。第一批用于人脸识别的计算机程序出现在 60年代末和 70年代初,但直到 90年代初,计算机运算才足够快,以支持这些实时任务。人脸识别的问题产生了许多基于特征位置、人脸形状、人脸纹理以及它们间组合的计算模型, 包括主成分分析、线性判别式分析、 Gabor 小波网络和 .Active Appearance Model(AAM . 许多公司,例如Identix,Viisage Technology和 Cognitec System,正在为出入、安全和监防等应用开发和出售人脸识别技术。这些系统已经被部署到公共场所, 例如机场、城市广场以及私人的出入受限的环境。要想对人脸识别研究有一个全面的认识,见。 基于视觉的接口技术进展 尽管在一些个别应用中取得了成功,但纵使在几十年的研究之后,计算机视觉还没有在商业上被广泛使用。几种趋势似乎表明了这种情形即将会发生改变。硬件界的摩尔定律的发展, 相机技术的进步, 数码视频安装的快速增长以及软件工具的可获取性(例如 intel 的 OpenCV libraray使视觉系统能够变得小巧、灵

关于计算机视觉的若干思考

浅谈计算机视觉 当看到幻灯片上播放的两张看上去相同的图片,一张毫无秘密,一张却隐藏着机密的时候,我觉得很是神奇,原来还会有这种加密方式。不同于摩斯密码,我觉得这种加密方式正是计算机时代的一个代表。 机器视觉,计算机视觉,图像处理,图像分析,这些名词好像都出现在了 老师的课堂上,通过查阅资料得知,这些名词在技术和应用领域上他们都有着相当大部分的重叠,这些学科的基础理论大致是相同的,甚至让人怀疑他们是同一学科被冠以不同的名称。 但是,又好像存在着一些细小的不同。例如,机器视觉主要是指工业领域 的视觉研究,例如自主机器人的视觉,用于检测和测量的视觉。这表明在这一领域通过软件硬件,图像感知与控制理论往往与图像处理得到紧密结合来实现高效的机器人控制或各种实时操作。计算机视觉的研究对象主要是映射到单幅或多幅图像上的三维场景,例如三维场景的重建。计算机视觉的研究很大程度上针对图像的内容。图像处理与图像分析的研究对象主要是二维图像,实现图像的转化,尤其针对像素级的操作,例如提高图像对比度,边缘提取,去噪声和几何变换如图像旋转。这一特征表明无论是图像处理还是图像分析其研究内容都和图像的具体内容无关。这里,我就计算机视觉进行初步的了解与分析。 计算机视觉,顾名思义,即为利用计算机对图像进行处理的过程。不管进 行何种场景的应用,都必须进行识别,运动,场景重现,图像恢复等基本问题的算法处理。其系统主要包括:图像获取,预处理,特征提取,检测分割,高级处理等基本组成。

下面就图像加密过程进行初步分析:首先,进行图像的获取,拿到一张图片利用一个或多个图像感知器提取数字图像,根据感知器的类型会得到不同类型的数字图像;接着,进行预处理,在对图像实施具体的计算机视觉方法来提取某种特定的信息前,一种或一些预处理往往被采用来使图像满足后继方法的要求。例如:二次取样保证图像坐标的正确;平滑去噪滤除感知器引入的设备噪声等;然后,进行特征提取,提取出这幅图像的特征要素;进行检测分割,分割出所要进行隐藏图像的部分,以便于进行后续操作;再进行高级处理,及隐藏信息。 通过查阅资料得知,其中一种隐藏信息的方式为将数字图像转化为二值图像,即只有黑和白的像素,不存在灰色过度的图像,进行处理。利用二值图像的算法主要有图像分块嵌入法,流程修改嵌入法,基于图像特征嵌入法等。但是,利用二值图像嵌入信息,也有不足:在黑白图像中,若把一片全是“0”像素中间突然嵌入一个“1”像素,相当于在一片黑图片当中突然点了一个白点,这会很容易引起人眼的察觉,故而不是很好的信息嵌入策略。 通过了解,我发现有关这一方面的研究还有更深的发展空间,而且在信息化的今天,利用计算机视觉进行图像的处理以及信息的嵌入可以更好的为我们的工作生活提供便利。 且计算机视觉是一个交叉学科,需要多种学科的共同发展,符合当今时代特征。所以,在我看来,计算机视觉是一个未来前景广阔,信息集成度高,市场认可度高的研究方向。

计算机视觉检测技术及其在机械零件检测中的应用

泰山职业技术学院2006级毕业论文 目录 摘要 (1) 1自动检测的原理和方法 (2) 1.1检测和检验的不同意义 (2) 1.1.1质量控制中的检测 (2) 1.1.2质量控制中的检验 (3) 1.2统计质量控制基础 (3) 1.2.1统计质量控制的推断 (3) 1.2.2制造中的偏差 (4) 2计算机视觉检测技 (4) 2.1 AVI技术 (4) 2.1.1视觉检测分类 (5) 2.1.2视觉检测方法 (5) 2.1.3视觉检验方法 (5) 2.2机械零件的AVI (5) 2.3基于CAD的AVI (6) 2.4 AVI技术展望 (7) 参考文献 (8) 致谢 (9)

计算机视觉检测技术及其在机械零件检测中的应用 张文景,张文渊,苏键锋,许晓鸣 摘要:基于计算机视觉检测(AVI)技术在检测系统的智能化、柔性、快速性等方面较接触式检测方法具有更大的优越性,综述了其基本原理和分类以及近年来此方面的研究成果.分析了利用AVI技术对机械零件进行检测的一般方法和系统构成,并探讨了基于CAD的AVI的关键环节.最后对AVI技术的发展趋势提出了作者的观点. 关键词:计算机视觉;计算机视觉检测;计算机辅助设计;机械零件 中图分类号:TP 391 文献标识码:A Automated Visual Inspection and Its Application on Inspection of Machined Parts ZHANG Wen-jing,ZHANG Wen-yuan,SU Jian-feng, XU Xiao-ming Dept. of Automation, Shanghai Jiaotong Univ., Shanghai 200030, China Abstract:With development of computer vision,automated visual inspection (AVI) has more applications in a variety of fields in industry.AVI takes more advantages in intelligence,flexibility and speed of inspection system than contacted inspection.The recent achievemens researched by international scholars in the field of AVI were surveyed.Principle and classification of inspection techniques were introduced.The analysis for general methods and system of AVI of machined parts was presented.Key technology of AVI based on CAD was also discussed.Some opinions about development of AVI were proposed at last. Key words:computer vision;automated visual inspection(AVI);computer aided design(CAD);machine parts

计算机视觉期末考点

计算机视觉重点考点集锦 手工整理,如有错误,慎之! 第一章 1、计算机视觉:研究用计算机来模拟生物视觉功能的科学和技术. 2、视觉表示框架的三个阶段(也就是提取三阶段):1)第一阶段是将输入的原始图像进行处理,抽取基本特征形成基元图。2)第二阶段(中期阶段)是指在以观测者为中心的坐标系中,由输入图像和基元图恢复场景可见部分的深度、法线方向、轮廓等,形成二维半图。3)第三阶段(后期阶段)是在以物体为中心的坐标系中,由输入图像、基元图、二维半图来恢复、表示和识别三维物体。 第三章 1、二值图像的特点:a.假定二值图像大小为mxn,其中物体像素值为1,背景像素值0;b.二值图像处理的算法简单,易于理解和实现,计算速度快;c. 二值视觉所需的内存小,对计算设备要求低;d.二值视觉系统技术可用于灰度图像视觉系统 2、二值图像的获取:1)通过图像的阙值2)通过硬件实现3)通过软件实现 3、图像分割:把图像划分成区域,使每一个区域都对应一个候选的目标。 4、图像二值化:设一副灰度图像中物体的灰度分布在某一区间内,通过阙值运算后的图像为二值图像 5、投影分类及作用:1)水平/垂直投影;给定直线上的投影;对角线投影(仿射变换)2)投影能表现图像的某种信息。 6、4-连通成分序贯法(标记算法)步骤: 1)从左到右,从上到下扫描图像 2)①如果上面点和左面点有一个标记,复制这一标记②如果两点相同的标记,复制这一标记③如果两点有不同标记,则复制上点标记且将两个标记输入到等价表中作为等价标记④否则给这一像素点分配一个新的标记并将这个标记输入到等价表 3)如考虑更多的点,回到第二步 4)在等价表中的每一等价集中找到最低的标记 5)扫描图像,用等价表中的最低标记取代每一个标记 7、欧拉数:E=C—H,连通成分数(C)—空洞数(H) 8、扩展与收缩:1)要掌握用结构元进行扩展与收缩 2)先扩展后收缩:补上不希望存在的洞 3)先收缩后扩展:去除孤立的噪声点 4)定义:①扩展:如果背景和洞的像素点临点显1,则该点从0变为1 ②收缩:如果物体像素点连点为0,则将该点从1变为0 9、开、关运算:1)开运算:先腐蚀后膨胀,去除比结构元小的区域的像素点 2)关运算:显膨胀后腐蚀,填充比结构元小的孔洞 第四章

计算机视觉简介

人们常说:眼睛是心灵的窗户,通过眼睛人们可以轻易地交流情感,眼睛也是与外界交流的窗口,这些都是通过“看”来完成的。 人们可以很容易“看到”一幅画,但这一“简单”过程并不如此简单,大致上它可以分为以下几个阶段:首先是通过眼睛将图成像在视网膜上;其次大脑对图像进行理解;最后根据处理的结果做出反应。用比较专业一点的语言来描述,该过程包括了识别、描述与理解三个层次;这其中还隐含了边缘检测(各物体的轮廓等)、图像的分割(各物体区域的划分)等阶段。以上实际上概述了视觉系统的三个层次,即低层阶段:基于图像特征提取及分割阶段;中层阶段:基于物体的几何模型与图像特性表达阶段;高层阶段:基于景物知识的描述、识别与理解阶段,这是根据先验知识介入的程度划分的,且实现起来也越来越困难。 毫无疑问,如何人工实现这一过程是极具挑战性和应用前景的一项工作,计算机视觉也因此而应运而生。计算机视觉是研究用计算机和成像设备来模拟人和生物视觉系统功能的技术学科,其目标是从图像或图像序列中获取对外部世界的认知和理解,即利用二维图像恢复三维环境中物体的几何信息,比如形状、位置、姿态、运动等,并能描述、识别与理解。 计算机视觉的基础是各种成像设备,例如CCD(Charge Coupled Device )摄像机(数码相机属于此类型)、红外摄像机、医学上常用的核磁共振成像、X射线成像等,这些设备不仅可以成像,还可以获取比人眼更丰富的图像,人们可以形象地把摄像机看成计算机视觉的视网膜部分。可以说从人类拍摄出第一幅图像开始,就为计算机视觉的诞生奠定了基础。 而计算机视觉的核心是数字电子计算机,其发展可谓突飞猛进,在计算和存储能力上,人脑已经无法与之相比,人们的目标就是利用计算机非凡的计算处理能力来代替人脑实现对图像的理解,而计算机日新月异的发展也使得这一愿望越来越成为可能。 用于指导“计算机”这个大脑运作的核心是计算机视觉的理论方法,计算机视觉使用的理论方法主要基于几何、概率和运动学计算与三维重构的视觉计算理论,它的基础包括射影几何学、刚体运动力学、概率论与随机过程、图像处理、人工智能等理论。在20世纪70年代,视觉研究大多采用模式识别的方法;80年代,开始采用空间几何的方法以及物理知识进行视觉研究;90年代以后,随着智能机器人视觉研究的发展,引入了许多新的理论与技术如主动视觉理论、不变量理论、融合技术等,并应用于许多计算机视觉系统中。 研究计算机视觉,不得不提的是英国已故科学家戴维·马尔(David Marr),他在计算机视觉发展史上可谓写下了浓重的一笔。在20世纪70年代末,他提出了第一个

浅谈机器人视觉技术

浅谈机器人视觉技术 摘要 机器人视觉是使机器人具有视觉感知功能的系统,是机器人系统组成的重要部分之一。机器人视觉可以通过视觉传感器获取环境的二维图像,并通过视觉处理器进行分析和解释,进而转换为符号,让机器人能够辨识物体,并确定其位置。机器人视觉广义上称为机器视觉,其基本原理与计算机视觉类似。计算机视觉研究视觉感知的通用理论,研究视觉过程的分层信息表示和视觉处理各功能模块的计算方法。而机器视觉侧重于研究以应用为背景的专用视觉系统,只提供对执行某一特定任务相关的景物描述。机器人视觉硬件主要包括图像获取和视觉处理两部分,而图像获取由照明系统、视觉传感器、模拟-数字转换器和帧存储器等组成。本文介绍了机器人的发展以及视觉计算理论和视觉的关键技术。 关键词:机器人、视觉、计算、关键技术 一、机器人发展概述 科学技术的发展,诞生了机器人。社会的进步也提出要求,希望创造出一种能够代替人进行各种工作的机器,甚至从事人类不能及的事情。自从1959年诞生第一台机器人以来,机器人技术取得了很大的进步和发展,至今已成为一门集机械、电子、计算机、控制、传感器、信号处理等多学科门类为一体的综合性尖端科学。当今机器人技术的发展趋势主要有两个突出的特点:一个是在横向上,机器人的应用领域在不断扩大,机器人的种类日趋增多;另一个是在纵向上,机器人的性能不 断提高,并逐步向智能化方向发展。前者是指应用领域的横向拓宽,后者是在性能及水平上的纵向提高。机器人应用领域的拓宽和性能水平的提高,二者相辅相成、相互促进。 智能机器人是具有感知、思维和行动功能的机器,是机构学、自动控制、计算机、人工智能、微电子学、光学、通讯技术、传感技术、仿生学等多种学科和技术的综合成果阎。智能机器人可获取、处理和识别多种信息,自主地完成较为复杂的操作任务,比一般的工业机器人具有更大的灵活性、机动性和更广泛的应用领域。要使机器人拥有智能,对环境变化做出反应,首先,必须使机器人具有感知

计算机视觉各种方法

第33卷第1期自动化学报Vol.33,No.1 2007年1月ACTA AUTOMATICA SINICA January,2007 车辆辅助驾驶系统中基于计算机视觉的 行人检测研究综述 贾慧星1章毓晋1 摘要基于计算机视觉的行人检测由于其在车辆辅助驾驶系统中的重要应用价值成为当前计算机视觉和智能车辆领域最为活跃的研究课题之一.其核心是利用安装在运动车辆上的摄像机检测行人,从而估计出潜在的危险以便采取策略保护行人.本文在对这一问题存在的困难进行分析的基础上,对相关文献进行综述.基于视觉的行人检测系统一般包括两个模块:感兴趣区分割和目标识别,本文介绍了这两个模块所采用的一些典型方法,分析了每种方法的原理和优缺点.最后对性能评估和未来的研究方向等一系列关键问题给予了介绍. 关键词行人检测,车辆辅助驾驶系统,感兴趣区分割,目标识别 中图分类号TP391.41 A Survey of Computer Vision Based Pedestrian Detection for Driver Assistance Systems JIA Hui-Xing ZHANG Yu-Jin Abstract Computer vision based pedestrian detection has become one of the hottest topics in the domain of computer vision and intelligent vehicle because of its potential applications in driver assistance systems.It aims at detecting pedestrians appearing ahead of the vehicle using a vehicle-mounted camera,so as to assess the danger and take actions to protect pedestrians in case of danger.In this paper,we give detailed analysis of the di?culties lying in the problem and review most of the literature.A typical pedestrian detection system includes two modules:regions of interest(ROIs) segmentation and object recognition.This paper introduces the principle of typical methods of the two modules and analyzes their respective pros and cons.Finally,we give detailed analysis of performance evaluation and propose some research directions. Key words Pedestrian detection,driver assistance system,ROIs segmentation,object recognition 1引言 车辆辅助驾驶系统中基于计算机视觉的行人检测是指利用安装在运动车辆上的摄像机获取车辆前面的视频信息,然后从视频序列中检测出行人的位置.由于它在行人安全方面的巨大应用前景,成为智能车辆、计算机视觉和模式识别领域的前沿研究课题.欧盟从2000年到2005年连续资助了PROTECTOR[1]和SAVE-U[2]项目,开发了两个以计算机视觉为核心的行人检测系统;意大利Parma[3]大学开发的ARGO智能车也包括一个行人检测模块;以色列的MobilEye[4]公司开发了芯 收稿日期2006-3-14收修改稿日期2006-6-17 Received March14,2006;in revised form June17,2006 国家自然科学基金(60573148),教育部高等学校博士学科点专项科研基金(20060003102)资助 Supported by National Natural Science Foundation of P.R.China(60573148),Specialized Research Fund for the Doc-toral Program of Higher Education(20060003102) 1.清华大学电子工程系北京100084 1.Department of Electronic Engineering,Tsinghua University, Beijing100084 DOI:10.1360/aas-007-0084片级的行人检测系统;日本本田汽车公司[5]开发了基于红外摄像机的行人检测系统;国外的大学如CMU[6]、MIT[7,8]和国内的西安交通大学[9]、清华大学[10]也在该领域做了许多研究工作. 车辆辅助驾驶系统中基于计算机视觉的行人检测属于计算机视觉中人体运动分析的研究范畴,其主要任务是在运动摄像机下快速准确地检测行人.本文主要针对这一特定领域对相关的文献进行综述,重点分析常用方法的原理和优缺点,以期对相关的科技人员起到指导作用.对监控系统和体育运动分析领域中人体检测感兴趣的读者可以参考综述文献[11~14]. 行人检测除了具有一般人体检测具有的服饰变化、姿态变化等难点外,由于其特定的应用领域还具有以下难点:摄像机是运动的,这样广泛应用于智能监控领域中检测动态目标的方法便不能直接使用;行人检测面临的是一个开放的环境,要考虑不同的路况、天气和光线变化,对算法的鲁棒性提出了很高的要求;实时性是系统必须满足的要求,这 c 2007by Acta Automatica Sinica.All rights reserved.

计算机视觉

计算机视觉 计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。 目录 1定义 2解析 3原理 4相关 5现状 6用途 7异同 8问题

9系统 10要件 11会议 12期刊 1定义 计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就像人类和许多其他类生物每天所做的那样。 计算机视觉是一门关于如何运用照相机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机)和大脑(算法),让计算机能够感知环境。我们中国人的成语"眼见为实"和西方人常说的"One picture is worth ten thousand words"表达了视觉对人类的重要性。不难想象,具有视觉的机器的应用前景能有多么地宽广。 计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它

的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。 2解析 视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的 计算机视觉与其他领域的关系 研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战(grand challenge)。计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图象信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。作为一门学科,计算机视觉开始于60年代初,但在计算机视觉的基本研究中的许多重要进展是在80年代取得的。计算机视觉与人类视觉密切相关,对人类视觉有一个正确的认识将对计算机视觉的研究非常有益。为此我们将先介绍人类视觉。 3原理 计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,还没有条件实现象人那样能识别和理解任何环境,完成自主导航的系统。因此,人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意味

计算机视觉期末复习

一、 1.什么是计算机视觉?理解计算机视觉问题的产生原理。 研究用计算机来模拟生物视觉功能的技术学科。具体来说,就是让计算机具有对周围世界的空间物体进行传感、抽象、分析判断、决策的能力,从而达到识别、理解的目的。 2.直方图的均衡化 处理的“中心思想”是把原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围内的均匀分布。直方图均衡化就是对图像进行非线性拉伸,重新分配图像像素值,使一定灰度范围内的像素数量大致相同。直方图均衡化就是把给定图像的直方图分布改变成“均匀”分布直方图分布。 是将原图像通过某种变换,得到一幅灰度直方图更为均匀分布的新图像的方法。设图像均衡化处理后,图像的直方图是平直的,即各灰度级具有相同的出现频数,那么由于灰度级具有均匀的概率分布,图像看起来就更清晰了。 二、 1.常见的几何变换:平移T x 为点(x ,y )在x 方向要平移的量。 旋转 变尺度:x 轴变大a 倍,y 轴变大b 倍。 2.卷积掩膜技术:(,)(,)(,)(,)m n f i j h i m j n g m n =--∑∑ 对应相乘再相加 掩膜的有效应用——去噪问题 3. 均值滤波器(低通):抑制噪声 主要用于抑制噪声,对每一个目标像素值用其局部邻域内所有像素值的加权均值置换。con 命令 高斯滤波器:一个朴素的道理,距离目标像素越近的点,往往相关性越大,越远则越不相干。所以,高斯 滤波器根据高斯函数选择邻域内各像素的权值 medfilt1 。 区别方法是:高通滤波器模板的和为0,低通滤波器模板的和为1 常用的非线性滤波器:中值滤波;双边滤波;非局部滤波 4.边缘检测算子:通过一组定义好的函数,定位图像中局部变换剧烈的部分(寻找图像边缘)。主要方法有:Robert 交叉梯度,Sobel 梯度,拉普拉斯算子,高提升滤波,高斯-拉普拉斯变换(都是高通滤波器) Canny 边缘检测 算法步骤:1. 用高斯滤波器平滑图像. 2. 用一阶偏导有限差分计算梯度幅值和方向. 3. 对梯度幅值进行非极大值抑制 . 4. 用双阈值算法检测和连接边缘. 5.分割(大题 伪码?) (1)经典方法是基于灰度阈值的分割方法 *介绍单值阈值,它把一幅灰度图像转换成二值图像 *求T 的常用的方法是求解灰度直方图中的双峰或者多峰,并以两峰之间的谷底作为阈值。 *全局阈值是指整幅图像使用同一个阈值做分割处理,并产生一个二值图,区分出前景对象和背景。适用于背景和前景对比度大的图像 算法实现:-- 选取一个合适的阈值T ,逐行扫描图像 – 凡灰度级大于T 的,颜色置为255;凡灰度级小于T 的,颜色置为0 (2)自适应阈值:解决单值阈值无法工作的一个方法是将图像分割为子图像,并分别进行阈值化处理 6.Hough 变换:可用于将边缘像素连接起来得到边界曲线,主要优点在于受噪声和曲线间断的影响较小(鲁棒性好) ???≤>=T y x f T y x f y x g ),( 0),( 1),(如果如果1100cos sin 0[1][1]sin cos 0001x y x y θθθθ-?? ? = ? ???110000[1][1]0000a x y x y b ab ?? ?= ? ???(,)1[,][,]k l N h i j f k l M ∈=∑????? ??=1010001]1[]1[0011y x T T y x y x

浅谈计算机视觉与数字摄影测量

浅谈计算机视觉与数字摄影测量 发表时间:2018-06-19T16:47:42.070Z 来源:《基层建设》2018年第12期作者:熊健1 汪军2 施航3 [导读] 摘要:计算机视觉是数字摄影测量的重要组成部分,研究其相关课题有着重要意义。 1江苏省地质勘查技术院江苏南京 210000;2安徽省第四测绘院安徽合肥 230000 3华东冶金地质勘查局八一一地质队安徽滁州 239000 摘要:计算机视觉是数字摄影测量的重要组成部分,研究其相关课题有着重要意义。本文首先对相关内容做了概述,分析了计算机视觉与数字摄影测量的处理流程,并结合相关实践经验,分别从多个角度与方面就计算机视觉技术在影像处理系统中的实际应用展开了研究,阐述了个人对此的几点看法与认识,望有助于相关工作的实践。 关键词:计算机;视觉;数字摄影;测量 1前言 计算机视觉与数字摄影测量是一项实践性较强的综合性工作,其具体实施方法的特殊性不言而喻。该项课题的研究,将会更好地提升对计算机视觉的分析与掌控力度,从而通过合理化的措施与途径,进一步优化该项工作的最终整体效果。 2计算机视觉技术核心问题 视觉问题复杂性的本质在于相对声音等物理信号的描述,视觉信号充满了非常丰富的信息,描述起来也更加困难。比如,很多图像中蕴含了大量简单(如颜色、形状、纹理、几何特征等)及复杂(如场景、字符、物体分布、人物而部特征、人体姿势等)信息并具有较大的动态范围和主观性,如何攻克图像信息提取过程中的各种难题一直是当今计算機图像学研究的热点问题。而且,在科学家们还未完全破译生物视觉系统的奥秘的前提下,大多数CV问题只能采用“逆向推导机制”—依据己知或假设的关联将视觉系统的输入(数字图像)和输出(语义描述)对应起来,通过图片猜测真实世界物体具有的形状,照明度以及颜色分布。因此,基于概率论和数理统计的数学模型是最适合解决这类逆推问题的工具,这也是目前CV领域普遍采用各种统计模型和机器学习算法的本质原因。由于各种学习机制和统计模型需要基于先验知识并建立在对待测图像内容的约束、简化及假设的基础上,和生物视觉几亿年的发展进化相比,其建立的数学模型也只能片而而且粗糙地描绘出视觉系统输入与输出之间的关系。因此,对某组特定图像检测时表现十分优秀的系统,往往对另一组语义相同的图片素手无策;很多看似稳定的机器学习机制,在增加样本种类和数量后,检测率反而会下降;很多设计复杂的检测算法在实际应用中的表现反而不如一些简单且基本的数学描述困。 3计算机视觉与数字摄影测量的处理流程 3.1立体视觉 立体视觉是计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点之一,在20多年的发展过程中,逐渐形成了自己的方法和理论。立体视觉的基本原理是从两个(或多个)视点观察同一景物,以获取在不同视角下的感知图像,通过三角测量原理计算像像素间的位置偏差(即视差)来获取景物的三维信息,这一过程与人类视觉的立体感知过程是类似的。一个完整的立体视觉系统通常可分为图像获取、摄像机定标、特征提取、影像匹配、深度确定及内插等6个大部分。其中影像匹配是立体视觉中最重要也是最困难的问题,也是计算机视觉和数字摄影测量的核心问题。 3.2影像匹配 立体视觉的最终目的是为了恢复景物可视表面的完整信息。当空间三维场景被投影为二维图像时,同一景物在不同视点下的图像会有很大不同,而且场景中的诸多因素,如光照条件,景物几何形状和物理特性、噪声干扰和畸变以及摄像机特性等,都被综合成单一的图像中的灰度值。因此,要准确地对包含了如此之多不利因素的图像进行无歧义的匹配,显然是十分困难的。 在摄影测量中最基本的过程之一就是在两幅或者更多幅的重叠影像中识别并定位同名点,以产生立体影像。在模拟摄影测量和解析摄影测量中,同名点的识别是通过人工操作方式完成的;而在数字摄影测量中则利用计算机代替人工解决同名点识别的问题,即采用影像匹配的方法。 3.3多目立体视觉 根据单张相片只能确定地面某个点的方向,不能确定地面点的三维空间位置,而有了立体像对则可构成与地面相似的立体模型,解求地面点的空间位置。双目立体视觉由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,就像人有了两只眼睛,才能看三维立体景观一样,然后通过计算空间点在两幅图像中的视差,获得该点的三维坐标值。现在的数字摄影测量中的立体像对技术通常是在一条基线上进行的,但是由于采用计算机匹配替代人眼测定影像同名像对时存在大量的误匹配,使自动匹配的结果很不可靠。其存在的问题主要是,对存在特殊结构的景物,如平坦、缺乏纹理细节、周期性的重复特征等易产生假匹配;在摄像机基线距离增大时,遮挡严重,能重建的空间点减少。为了解决这些问题,降低双目匹配的难度,自1986年以来出现了三目立体视觉系统,即采用3个摄像机同时摄取空间景物,通过利用第三目图像提供的信息来消除匹配的歧义性。采用“多目立体视觉技术”可以利用摄影测量的空中三角测量原理,对多度重叠点进行“多方向的前方交会”,既能较有效地解决随机的误匹配问题,同时又能增加交会角,提高高程测量的精度。这项技术的应用,将很大程度地解决自动匹配结果的不可靠性,提高数字摄影测量系统的准确性。 4计算机视觉技术在影像处理系统中的实际应用 4.1计算机视觉技术关于图像的预处理的應用 影像测量系统在采集图像的时候,很容易受到周围环境的影响,例如:电磁波的干扰,光的折射,温度的影响等,这将很容易导致测量系统采集到事物图像在播发过程中都会夹杂着刺耳的噪声,对测量物品的边缘描述过于模糊,使得零件的精准度的测量受到了影响。因此需要把计算机视觉技术和影响测量系统的应用结合在一起,在测量产品,处理图像过程中,需要进行原始图像的修改和清晰度的矫正并且选择性的过滤影响产品测量的噪声。由于在测量过程中结合了计算机视觉技术,所以在图像的预处理的时候,不需要对图画质量的降低,可以运用计算机视觉技术对于图像进行修改,重要的部位采用灰色直方图修改技术特别标出,其他部位选择性消除。虽然计算机技术跟影像测量系统的结合很好的处理了这些的问题,但是也要避免在测量过程中受到噪音的干扰,从而使得图像变质。因此,在测量的时候可以先对周围环境进行预处理,采用计算机视觉技术中的边缘保持滤波算法降低周围环境的噪声影响,从而保证了测量图像的精确性。 4.2计算机视觉技术关于图像边缘处理的应用

相关文档
最新文档