基于计算机视觉的车辆单目测距系统研究

基于计算机视觉的车辆单目测距系统研究
基于计算机视觉的车辆单目测距系统研究

基于计算机视觉的车辆单目测距系统研究

Research of Vehicle Monocular

Measurement System

Based on Computer Vision

学科专业:控制科学与工程

研究生:王士明

指导教师:薛俊韬副教授

天津大学自动化学院

二零一二年十二月

独创性声明

本人声明所呈交的学位论文是本人在导师指导下进行的研究工作和取得的研究成果,除了文中特别加以标注和致谢之处外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得天津大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。

学位论文作者签名:签字日期:年月日

学位论文版权使用授权书

本学位论文作者完全了解天津大学有关保留、使用学位论文的规定。特授权天津大学可以将学位论文的全部或部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁盘。

(保密的学位论文在解密后适用本授权说明)

学位论文作者签名:导师签名:

签字日期:年月日签字日期:年月日

摘要

随着现代社会经济的飞速增长,人们的物质生活水平日益提高,表现之一就是汽车保有量的大大增加,但是随之而来的交通事故也日益频繁。智能交通系统和智能车辆是解决交通问题的重要手段之一,因此也成为了现代社会和政府所关注的重要研究课题。无论车辆检测还是测距技术都是智能交通系统和智能车辆中的重要组成部分,都有着广泛的应用基础。

本文针对基于计算机视觉的车辆检测和单目测距系统中的相关问题进行具体研究,在总结和分析了现有的方法和技术的基础上,针对前车检测和测距模型进行了分析研究和部分改进。

本文的主要工作如下:

1、基于计算机视觉实现车辆检测。通过感兴趣区域(ROI)的设定,以图像中的阴影部分作为可能的车辆区域,对车辆进行初步定位,然后在图像中定位出车牌。再根据阴影区域和车牌定位的结果确定出图像中车辆尾部的位置,以车辆尾部矩形中心点和4邻域的点为参考点。

2、构建单目测距系统模型。利用小孔成像原理建立测距的理论模型,根据模型的需要对摄像机进行标定,实现摄像机内参数的配置。基于几何关系推导出实际模型的坐标转化表达式,建立像素坐标和世界坐标之间的转换关系,进而计算出两车之间的距离。

3、软件系统的设计与实现。基于开源计算机视觉库 OpenCV,在Visual C++ 6.0 环境下,设计并实现了车辆检测和测距系统。并针对静态实验数据进行了误差分析,采用最小二乘法实现了数据校正,从而大大提高了测距的精度。

实验结果表明本文所设计的方法在一定程度上具有有效性和可行性,并具有较高的运算效率和精度。

关键词:车辆检测阴影检测车牌定位单目测距模型智能交通

ABSTRACT

With the rapid development of the modern social economy, the standard of people’s material requirement is improving and the number of vehicles increases gradually. This will bring about a consequence that traffic accidents occur frequently. Under the circumstances,Intelligent Transportation Systems and Intelligent Vehicles are one of the major means to solve the traffic problem. They not only draw the comprehensive attention of the society and the government, but also become a significant research topic of public concern. As an important component of Intelligent Transportation Systems and Intelligent Vehicle,both vehicle detection and distance measurement technique have a broad application area.

In this paper, related issues about vehicle detection and monocular measurement system are studied. Improved vehicle detection method and ranging model are given based on the summary and analysis of the existing methods and technologies.

The main contents and results of this paper are as follows:

(1) Vehicle detection based on computer vision. To reduce the system workload,region of interest in the image must be set at first. The preliminary location of the forward car can be achieved after finding the shadow portion as a possible vehicle region in the ROI,and then the location of the license plate is detected. Thus the rear of front car can be ascertained,and takes the middle of the rear of front car and its 4-neighborhood points as reference points.

(2) Construction of monocular measurement system. Pinhole imaging principle is the basis of the theoretical ranging model. It needs to calibrate the camera according to the model in order to make sure the parameters of the camera. The actual model is deduced by geometric method and it can build a conversion relationship between pixel coordinates and real world coordinates. So the distance between two cars can be calculated by this relationship.

(3) Design and implementation of the software system. Application of vehicle detection and ranging system is developed using open source computer vision library OpenCV in Visual C++ 6.0 environment. It carries on error analysis for the static experiment data,and also corrects the data with the least square method.

Experiments show that the method of this paper has certain effectiveness and feasibility,and has higher efficiency and accuracy.

KEY WORDS:Vehicle detection, Shadow detection, License location,Monocular measurement model, Intelligent Transportation

目 录

第一章绪论 (1)

1.1研究背景 (1)

1.1.1计算机视觉技术 (1)

1.1.2智能交通系统和智能车辆 (2)

1.2车辆检测 (4)

1.3测距方法 (4)

1.4国内外发展现状 (6)

1.5本文的结构安排 (8)

第二章车辆检测 (9)

2.1车辆检测综述 (9)

2.2基于车辆底部阴影的车辆检测 (9)

2.2.1阴影的提取 (10)

2.3车牌定位 (18)

2.3.1车牌特征 (19)

2.3.2车牌定位的常用方法 (19)

2.3.3车牌的粗定位 (20)

2.4阴影检测与车牌定位相结合的车辆检测 (26)

2.5本章小结 (27)

第三章基于单目视觉的距离测量 (28)

3.1单目测距模型的建立 (28)

3.1.1坐标系 (28)

3.1.2小孔模型 (29)

3.1.3摄像机内参数模型 (30)

3.1.4摄像机外参数模型 (31)

3.1.5测距模型 (32)

3.2摄像机的参数标定 (32)

3.3单目测距的几何模型 (34)

3.4本章小结 (39)

第四章测距实验与校正 (40)

4.1系统设计 (40)

4.2测距实验与数据校正 (41)

4.3本章小结 (44)

第五章总结与展望 (45)

5.1总结 (45)

5.2展望 (45)

参考文献 (47)

发表论文和参加科研情况说明 (51)

致谢 (52)

第一章

绪论

1.1 研究背景

随着全球范围内经济的发展,人们的生活质量越来越高,汽车的保有量也逐年大幅度的增长。作为衣食住行中不可或缺的一部分,交通与人的联系越来越密切,同时交通问题也日益凸显,备受人们关注。交通建设和运输所取得的成就是一把双刃剑,一方面,庞大、方便、快速的交通运输网络为经济的增长提供了有利的条件,为人们的生活带来了便利;但是,另一方面,交通拥挤阻碍经济发展和导致资源浪费,交通事故危机人们的生命安全;交通污染,尾气的排放也是全球变暖的罪魁祸首之一,并严重威胁人们的身体健康。交通负荷和环境压力日益严重,与有限的资源的冲突也不断提升,这些都是迫切需要解决的问题。交通问题不管是在发达国家还是在发展中国家都是社会和政府普遍关注和重视的问题。运用高新技术的智能交通系统和智能车辆应运而生,它们是解决交通问题的有效措施之一。

随着电子计算机问世,由计算机带动的信息技术引发了第三次科技革命并带来了巨大的产业变革。将通信、传感、控制和计算机等先进的技术有效的集成融为一体,并将之应用在一个具有实时、准确、高效、覆盖范围广等特点的交通运输管理体系中,这就是智能交通系统。智能车辆作为智能交通系统中不可分割的重要组成部分,已经逐渐成为了车辆研究领域的重点和热点,并将引领汽车发展的潮流。

1.1.1 计算机视觉技术

经济飞速发展的同时也推动着科技的快速进步。进入信息时代以来,计算机已经家喻户晓,计算机的应用也涉及到各个领域。随着计算机的普遍应用,人们对计算机的要求也越来越高,已经不再局限于过去那种要严格按照计算机的使用规则,严格按照各种设定的程序死板的执行命令,人们越来越希望计算机能够以人习惯的方式与人进行信息的交换,也就是说让计算机能够看到、听到并表达出自己的看法。

计算机视觉[1]就是一门研究如何让机器“看”的科学,换句话说就是使计算机具有人一样的视觉系统。它利用摄像机和电脑,来代替人眼和大脑,通过对

采集的图片或视频进行处理以获得相应场景的三维信息,从而实现对目标的识别,跟踪和测量等功能。计算机视觉的最终研究目标就是给计算机赋予“眼睛”,使计算机能像人一样通过“看”和“感知”去观察世界和理解世界,对周围环境的变化做出回应,具有一定的自主适应能力。

计算机视觉最早是于20世纪60年代初提出的,但是由于技术等原因限制了计算机视觉的研究进展。一直到20世纪70年代后期,计算机的性能得到了很大的提高,并且能够对诸如图像等大型数据进行处理,这时计算机视觉这个基于图像的学科才得到人们的普遍关注并逐渐取得了蓬勃的发展。然而这些发展往往起源于不同领域的需要,因而何谓“计算机视觉问题”始终没有得到正式的定义,很自然地,“计算机视觉问题”应当被如何解决也没有成型的方法。尽管如此,计算机视觉还是得到了广泛的应用,比如工业自动化生产线中质量控制与测量、医学图像的处理、视觉导航、人工智能等方面。

1.1.2 智能交通系统和智能车辆

智能交通系统(Intelligent Transportation Systems,ITS)[2],顾名思义就是智能化与交通运输相结合的系统。准确的说,它是在整个交通运输管理体系中,综合应用了很多先进的信息技术手段(例如智能控制技术、计算机视觉技术、模式识别技术、人工智能技术和传感通讯技术等等)和算法,然后利用摄像机等视频采集装置获取当前的交通状况并进行实时地分析处理,为方便道路使用者和管理者而建立起的一种实时、准确、高效的并能全方位发挥作用的现代化综合运输管理系统。智能交通系统通过协调行人、车辆、道路之间的关系,能够提高交通运输的效率,对交通进行合理的规划,缓解交通拥挤和堵塞,提高道路网的容量,从而减少交通事故的发生,保障交通安全,降低能源消耗,减轻对环境造成的污染等。

智能交通系统自问世距今已有40多年的发展历史。早在上个世纪60、70年代,当美国、欧洲等国家意识到交通快速发展带来的能源与环境问题之后,就已经开始了对智能交通的研究。日本是目前世界上应用 ITS 最为广泛的国家,其次就是美国、欧洲等地。我国对智能交通系统研究的起步相较与世界其他国家而言就要晚一些。1994年我国学者参加了在法国巴黎召开的第一届智能交通系统世界大会,这标志着我国对智能交通系统的研究开始起步[3]。其后数十年,随着我国经济的飞速发展和科学技术水平的快速提高,以及各个方面全面的与国际接轨,我国 ITS 的研究、开发与应用都取得了显著的成果。2008年北京奥运会期间,建立了一个包括视频监控、交通流检测和交通违法检测在内的交通综合监控系统,对奥运会场馆周边和相关道路交通状况进行实时的监控和调控。

智能交通是当今世界交通运输发展的热点和前沿,一方面管理着整个交通运输体系,另一方面更加注重满足人们出行和公共交通出行的需求,旨在建立一个绿色、安全的交通系统。智能交通是未来交通系统的发展方向,也日益受到各国的重视。

智能车辆(Intelligent Vehicle,IV)[4,5]是智能交通系统中的重要组成部分,它是一个将计算机、人工智能和自动控制等高新技术集于一身的,具有环境感知,路径规划,自主导航和辅助驾驶等功能的综合体。智能车辆要突显“智能”的作用,让汽车具有人性化思维,能够及人所不及,弥补由于人的主观原因而造成的缺陷,最终目标是要实现智能汽车自动驾驶。智能车辆的特点是通过车辆的智能化、信息化,对车辆的行车路线进行规划,自主导航;提高车辆的可控性,即使在复杂的路况下,汽车也能高效、快速、安全的行驶。另一方面,智能车辆提高车辆的驾驶能力,使驾驶更人性,更舒服,极大的缓解了驾驶员的负担,避免一些人为因素而造成的交通意外,确保行车安全、畅通。同时,智能车辆之间形成一个网络,覆盖范围广,与交通控制系统相结合,能够对城市交通进行合理的规划和调控,使交通顺畅,缓解交通压力,提高人们的生活质量。

智能车辆的研究内容很多,主要是碰撞预警系统、导航系统,辅助驾驶系统等[6]。碰撞预警系统是车辆主动辅助驾驶系统和车辆必要的安全系统,利用安装于车上的各种传感器,对车辆行驶时周围的障碍物,危险态势进行实时监测,并对采集的信息进行分析与处理,当发现某种行为或者状态对本车行驶的安全产生威胁时,系统会及时发出警报信号,提醒司机注意并进行处理。此外,对驾驶员的实时监控也是该系统的研究内容。通过对驾驶员的监控,对于驾驶员的某些可能存在安全隐患的行为进行警报警告,如果驾驶员没有或者不能做出相应的行为,系统就会强行控制车辆,从而使车辆转换到安全状态,碰撞预警系统能够为驾驶员获得足够的安全时间,从而阻止或减少危险状况的发生,进而达到安全行车的目的。目前,夜视和后视碰撞预警系统已经得到了应用,并取得了不错的效果。车载导航系统是智能车辆不可或缺的一部分,它是融合了 GPS 全球定位系统, GIS 地理信息系统和无线数字通信技术的跨学科、跨行业的一个新兴的高科技产业。导航系统就是要为驾驶员寻找到一条最经济、最安全、最可靠的行车路线。辅助驾驶系统又被称为智能巡航控制系统,是智能车辆中的主要组成。为了缓解驾驶疲劳,预防事故发生,提高驾驶安全,辅助驾驶系统应运而生。其主要功能就是系统在计算机的精准控制下,调节车辆油门的开度,从而使车辆在不同路况下始终行驶在预定的车速。

正是因为智能车辆有了这些系统的共同作用,从而使得汽车可以不需要人去驾驶,形象的说,人为的给汽车安装上了“大脑”、“眼睛”、“脚”等装置,

使得汽车可以像人一样“思考”、“判断”、“行走”,可以自动的启动,刹车,行驶,可以规避地面障碍,能够对复杂多变的情况做出相应的变化,根据实际情况自主选择最佳的可行方案,使汽车正常,顺利,安全的行驶。

1.2 车辆检测

车辆检测是智能交通系统中的核心内容和关键技术,同时也为智能交通系统提供了必要的数据源和分析的基础与前提。它要求具有较高的实时性、鲁棒性和准确性,其主要目的是将图像中的运动目标和背景分离开来。目前车辆检测的方法有很多,如感应线圈检测、数字视频检测、测力计检测、超声波检测等。感应线圈检测[7]是预先在公路路面下铺设一个电磁线圈并通以高频电流。在车辆通过线圈时线圈内部因为电磁感应会出现涡流,使线圈的电感量变小,从而可以通过这种变化得到车辆信息。但是,这种方法获得的交通数据较为单一,无法准确的识别车辆的行为,而且安装和检修线圈的时候要对路面进行破坏才能进行安装和检修,代价太大,具有很大的局限性。其他方法也有这样或那样的缺点,相比较而言,基于视频的车辆检测方法具有诸多的优点。尤其是随着近些年图像处理技术的不断发展,在智能交通方面采用计算机视觉和图像处理技术越来越广泛,并取得了不错的成绩。与其他检测技术相比,视频检测有着很大的优势[8]:

(1) 从数字图像中利用图像处理技术能够提取出高质量的数据信息,从而能够直观、准确、快速、安全可靠的监控道路交通,获得更多的交通参数。

(2) 利用视频进行监控,可以监控多个车道,监控范围广,是面式检测;而且随着计算机处理速度的不断提高,视频检测的处理速度会越来越快;安装视频监控摄像机比安装其他传感器更方便快捷,破坏性低,费用低,维护也比较方便省时省力。其软件可以在线升级,可扩展性好,使用寿命长。

(3) 通过计算机网络能够使得到的交通数据进行联网操作,从而可以对整个道路交通网络进行监控和合理的布局,而且通过摄像机对道路进行监控,不仅能够获取数据信息,还能够为道路事故提供视频图像参考,一举两得。

基于视频的车辆检测是一种简单而有效的方法,能够很好的解决其他检测方法不能解决的诸多难题,并实现道路交通的实时监控,随着技术的发展,将会逐渐提高系统实时性、可靠性和安全性,其应用也将越来越广泛。

1.3 测距方法

目前智能车辆中常用的测距方法有以下几种[9-13]:

(1) 超声波测距

在目前的几种测距技术中超声波测距应用最早,技术也最为成熟,其工作原理较为简单,在一定距离内具有很好的测距效果。超声波测距是根据超声波在传播过程中遇到障碍物会进行反射这一原理来测量距离的。即利用超声波发射和接受的时间差进行计算,从而得到实际距离。超声波的纵向分辨率高,对色彩和光照不敏感,对外界光线变化和电磁场变化不敏感,在烟雾,灰尘或强磁场干扰等环境中都能稳定工作。但是超声波测距最大的缺点是可测量距离较短,最佳距离仅为4-5米,这个距离相对高速公路上的汽车而言距离太短,不能达到安全制动距离,因此超声波测距多用于测量与路旁高大物体的距离。另外超声波的传播速度相对较慢,易受外界温度等因素的干扰,当汽车高速行驶时,使用超声波测距无法跟上车距的实时变化,这样测量准确度比较差,不能精确的测量。而且,利用超声波进行距离测量时方向性差,比较发散,这样就造成反射的超声波比较微弱,灵敏度下降。

(2) 微波雷达测距

微波雷达主要有脉冲多普勒式雷达、双频连续波式(CW)雷达和调频式(FM)雷达。目前应用较多的是 FM 雷达。微波雷达测距系统具有体积小,测量距离长,精度高,可靠性高等特点,可以同时检测多个目标,而且雷达测距受气候条件影响小,在恶劣条件下也能够及时发现目标,保证车辆的行车安全。但是雷达测距也有其不足之处。雷达测距也是利用微波反射来进行测距的,但是有些物体比如房屋,塑料,水泥,行人等不能反射或者极弱反射雷达波,这就造成不能分辨和测量或者测量的准确性很低。而且雷达测距较为致命的缺点是雷达极容易受干扰。如果车辆上有多个雷达测距仪的话,相互之间的干扰非常严重,甚至于无法正常工作。

(3) 激光雷达测距

激光测距从原理上说比较简单,其工作原理与微波雷达测距相似,有连续波和脉冲波两种测距方式。激光测距开始于20世纪70年代,最早应用于机器人领域,如今在智能车辆领域中,激光测距主要用于检测障碍物和获取周围环境信息。激光测距的优点是测量时间短、量程高、准确性好。但是由于光的波长很短,传播速度又很快,这就要求器件的性能非常好,对信号处理的要求也很高。而且在实际应用中,要想测量距离就必须将激光发射头对准被测物体,这对于处于高速行驶的车辆又需要测量远处高速行驶的车辆来说是比较难以对准的,这也是制约激光测距的原因之一。

(4) 红外测距

红外测距是利用红外线来进行测距的,用目标发出的或反射的红外线进行检测,并确定与目标的距离,主要适用于黑夜或者能见度较低的环境。红外测距具有体积小,重量轻,功耗低、易制、安全等特性,与超声波测距相比,其探视角更小,方向性更强,而且测量精度也有所提高。但是与超声波测距有同样的缺点就是作用距离短。另外红外线的反射较弱,因此需要棱镜进行配合精确测量,增加花销费用,而且被测物体平面必须与光线垂直,才能保证光反射回来的强度足够大,否则,返回信号过于微弱无法得到精准测量。红外侧距还需要考虑被测物体平面漫反射的影响。

(5) 视频测距

视频测距是利用摄像机进行实时监控,计算机对摄像机监控采集的视频或者图像进行处理、分析和计算,利用预先建立的数学模型进行距离计算的技术。与前面介绍的几种算法相比较,视频测距最大的不同是被动式的测距,它不需要向被测物体发射任何信号或接收信号,只需要拍摄下包含所需要目标的视频或者图片就可以根据需要对目标进行距离的测量。另外,由于图像中往往包含的信息量很大,比如车辆,行人,道路两侧的建筑,交通标志等等,利用图像处理技术识别和提取出这些信息,能够获得更多的数据信息,不但能提高判断的精度,同时也能有助于车辆智能程度的提高。随着图像处理速度的提高和技术的不断完善,视频测距技术的应用前景也越来越广阔。

1.4 国内外发展现状

进入20世纪90年代以来,世界汽车市场的竞争日益激烈,与此同时人们对于智能运输的研究也越来越重视,越来越关注,国际上对于智能车辆和与其相关的技术的研究也日益火爆,一大批有实力的著名汽车行业的大亨、研究所和高校也相继展开了对智能汽车的研究。

美国交通部门制定了一个五年规划,投入一笔庞大的资金,和通用汽车公司合作共同研发出了一种应用于汽车的防撞系统;美国的一些大学和研究机构也都纷纷投入到了对全自动汽车技术的研究改进中来;美国某机构研究成功的移动导航系统能计算出最佳的行驶路径,还能根据接收到的现场的实际交通状况,对路线进行更新改进,使车辆能够沿着最理想的行车路线行驶。美国还将智能汽车技术应用于军事上,使用无人车到危险地带执行巡逻任务。德国,意大利,日本等国家还有一些世界著名的大学,如麻省理工学院、剑桥大学等,都在机器视觉、自动驾驶等领域有着深入的研究。

清华大学可以说是我国对智能汽车研究的领导者。我国最早建立的主要从事研究智能汽车的研究所之中就有清华大学的汽车研究所,该所对汽车导航等技术的研究均取得了不错的成绩。2000年7月19日,上海市科委通过了对一款带有智能汽车车内自主导航系统的汽车的鉴定,标志着上海市智能交通系统进入到了实质性实施阶段。国防科技大学在无人驾驶汽车的研制上创下了多项国内记录;西北工业大学、吉林交通大学、重庆大学等高校都对这一新兴学科展开了研究[14]。

视觉定位技术最早是在 H.Moravec[15] 的博士论文中提出的,他阐述了利用相机测定机器人移动的问题,被认为是视觉定位的雏形。视觉定位主要应用于机器人导航、微操作系统的参数检测、三维测量和虚拟视觉。1967年,美国斯坦福大学的 Wichman 等人利用电视摄像机作为视觉输入设备,控制一个机械手对桌面上的两个正方体进行抓取和叠放[16]。20世纪80年代,Matthies 和 Shafer 等学者设计了视觉里程计,从特征提取,特征匹配与跟踪到运动估计的框架,进行了室内短距离的实验,并取得了良好的效果。日本刚山大学成功研制出了使用立体视觉定位技术控制微操作器的视觉反馈系统,该系统可以对细胞和微装备等进行微操作[17]。

20世纪80年代国内开始了对视觉定位的研究。80年代末期,清华大学计算机系成功研制出了 Eye-in-Hand 视觉系统,整个系统由 PUMA560 机械手、图像系统、工作站等组成,能够通过摄像机观测工作台的情况,从而控制机械手完成多种精密的装配任务[18]。东南大学电子工程系提出了一种基于立体视觉匹配方法,实现了对不规则物体的非接触精密测量。

德国和美国早在上个世纪70年代末期就开始了对车载视觉系统的研究。美国国防先进研究项目局(DARPA)将机器视觉导航列入其资助的自动陆地车辆(Autonomous Land Vehicle)的研究重点[19]。1978年,德国联邦大学研制的无人驾驶汽车VaMoRs—M利用机器视觉识别车道线进行辅助自动导航,成功的实现了高速公路自动驾驶实验[20]。美国、日本等发达国家也都不断的开始和加强智能车辆视觉系统的研究,大量的倾注人力财力,鼓励和支持智能车载视觉导航系统的进步和发展。德国戴姆勒—奔驰公司的 VITAⅡ系统、美国卡内基梅隆大学的NA VLAB 系统[21]、意大利帕尔玛大学的 ARGO 系统[22]等都是目前世界上较为成功和典型的车载视觉系统。

国内对于车载视觉系统的研究起步较晚,研究水平仍然与国际上存在着差距,但是随着国内各大高校和科研机构的加入,也有了大批成果的出现。清华大学同样是我国最早从事智能车载视觉系统导航研究工作的单位之一,其智能技术与系统实验室从1988年就开始研制移动机器人系统。该实验室成功研制的第五代智能汽车通过对路面的实时监控,在车辆行驶的过程中对前方道路状况进行识

别和判断,并对前方障碍物进行碰撞预警。20世纪90年代至今,吉林大学智能车辆课题组先后研制了四代智能车辆,车辆采用视觉导航系统,可以将前方地面上设置的路标作为标识符,运用计算机视觉快速识别路径,进而跟踪和导航。

1.5 本文的结构安排

第一章绪论。主要介绍课题的研究背景,对车辆检测和测距技术进行了简单的介绍,对现有的一些检测和测距方法进行了对比。针对智能车辆、视觉定位和车载视觉系统介绍了国内外发展的现状。

第二章车辆检测。对现有的车辆检测方法进行了总结和类比,介绍了基于阴影特征的车辆检测方法和车牌定位方法,并将二者进行有效的结合,提出了前车车辆检测的方法。

第三章基于单目视觉的距离测量。首先介绍了单目测距的理论基础和理论模型,并对摄像机的标定进行了研究和实验。根据实际情况,建立了几何关系模型,推导出了坐标转换公式和本文的距离求解方法。

第四章测距实验和校正。根据前文的介绍给出了整个测距系统的框架结构,对本文提出的方案进行了静态实验,得出了几何模型的计算结果。针对实验数据进行了误差分析,并利用最小二乘法进行了数据校正。

第五章总结与展望。

第二章车辆检测

整个系统的目的是为了计算距离,那么就需要有一个测量目标。在这一章里,主要讲述怎样在一张复杂的图片中找到所要的目标,针对高速公路而言,最关心的也是所要寻找的目标就是行驶的车辆。能否从一幅图像中将目标车辆检测出来,其结果将直接影响到后续距离测量准确与否,因此车辆检测是整个测距系统的基础也是关键步骤。

2.1 车辆检测综述

车辆检测就是要将车辆从复杂的背景中检测出来。检测出车辆后就可以进行后续的一些处理,比如定位、跟踪等,而且车辆检测还能提供车流量等信息,是很多智能车辆系统的基础和关键。车辆检测的算法有很多,比如帧间差分法[23],光流法[24,25]等等。

在运动图像序列中,相邻的两张或多张图像中具有很强的相关性,这就使帧间差分成为了可能。帧间差分法是将两张或多张连续图像的对应像素点的灰度值相减,这样就可以除掉静止或者运动缓慢的物体和背景。帧间差分法算法简单,容易实现,不受光照变化的影响,适合不断变化的场景。但是它不能用来检验静止或者运动缓慢的目标,而且使用这种方法要考虑选择一个合适的时间间隔进行差分,否则运算量很大,时间间隔的选择与车辆的运动速度有很大的关系。另外利用帧间差分对运动的车辆进行检测时会在车辆内部产生空洞。

光流的理论是 Gibson 于1950年首次提出的。光流法是把待检测的图像区域转化为关于速度的矢量场,每个矢量表示了场景中每个点在图像中的运动产生的瞬时速度场。光流场中携带了有关物体结构和运动的重要信息,通过光流场的分析可以确定运动目标的数量、表面结构等。光流场的计算一直以来都是计算机视觉领域中的一个研究重点。然而,大多数的光流计算方法都很复杂,计算量较大,且抗噪性能差,易受光照变化的影响,另外对设备要求较高,实时性较差。

2.2 基于车辆底部阴影的车辆检测[26,27]

通过实验观察会发现,公路上行驶的车辆其灰度图像中往往具有一些比较明显的特征,这些特征就可以成为将汽车从图像中提取出来的标志和手段。车辆的

形状大体上可以看成是矩形,而且左右是对称的。在图像中会发现,车量底部的水平线、左右两侧的边界和车牌等都呈现出较为规则和密集的垂直边缘或者水平边缘[28]。而且,一般情况下,在图像中,车辆的灰度和背景的灰度有明显的差异,尤其是车辆底部的阴影部分其灰度值更是偏小(近似黑色,颜色较深,较暗),区别十分明显。因此,基于阴影区域的明显特征,在本文中对车辆的初步检测就是通过检测车辆底部阴影区域来实现的。当然仅靠阴影是不能确定车辆的位置的,后面还要使用其他的方法与阴影检测共同合作来确定车辆的位置。

那么又该用什么样的方法在一幅图像中检测出阴影呢?

在灰度图像中,路面的灰度变化不太明显,灰度信息分布较为均匀。阴影区域的灰度值较小,而且在路面到阴影区域中,灰度值发生突变,会产生边缘,可以利用这两点将阴影区域从路面中分割出来。由于本文较为关注的是在图像中车辆正前方的图像信息,因此在寻找阴影区域之前,先划分一个感兴趣区域(Regions of Interest,ROI)[29,30],缩小搜索阴影的范围。一般感兴趣区域设定为车辆正前方的矩形区域。另外,ROI的底边一般是贴近本车的,这在后面距离的测量中会有一定的作用。对于经过处理的图片,从ROI的底边开始向上逐行搜索,如果在某一行中出现连续像素灰度值为0的个数超过某一数值时,就以该段像素个数的十分之一为宽,构建一个矩形区域。如果该矩形区域中,黑色像素点的个数满足一定的条件就认为该矩形区域为车辆底部的阴影。

2.2.1 阴影的提取

根据上述的介绍,车辆底部阴影的提取,主要可以分解为如下几个部分。

(1) 感兴趣区域(ROI)和灰度化

对于不同的车辆,感兴趣区域的底边位置也是不同的,这就需要预先进行设定。由于摄像头安装在车辆内部,这样对于不同的车辆,摄像头到本车最前方的距离是不同的,反应到图像中,这部分区域对于后续的测量是无用的,为了减少工作量,可以将这部分从图像中划分出去,并不会影响后面的检测。而且,图像两侧也会有多余的信息,比如建筑等,也不是关注的部分,可以在设定感兴趣区域的时候一并划分开,这样在进行图像处理和阴影搜索的时候会减少很大的工作量,能够提高运算效率,从而缩短整个前期识别所占用的时间。

灰度图像是数字图像的最基本形式,灰度图像也是大多数图像处理的基础、前提和必要手段。灰度图像大多数情况下有两种来源:一是从黑白照片数字化得到,二是将彩色图片进行去色处理(即灰度化)得到。灰度图像表达的是图像的亮度信息,并不能阐述图像的颜色信息,灰度图像的每个像素点只是表示该点的亮度水平灰度级的量化信息,即灰度值,通常用1个字节来存储灰度值。1个字

节可以表示的整数范围是0,也就是说一个像素的灰度值的取值范围是,

~2550~255即灰度级为256。

在彩色图像的RGB(Red/红色分量,Green/绿色分量,Blue/蓝色分量)三基色模型中,常见的灰度化有以下四种方式[31]:

1) 分量法

分量法是将彩色图像中某像素点的R G B 、、三分量根据实际需要任选其中一种分量的数值作为该点像素灰度图像的灰度值。

()(1,,)f i j R i j = ()()2,,f i j G i j = ()()3,,f i j B i j = (2-1)

其中是图像灰度化之后灰度图像在点()(,1,2k f i j k =),3(),i j 处的像素值(灰度值)。

2) 最大值法

最大值法是将彩色图像中的三色分量R G B 、、中数值最大的亮度值作为该点的像素灰度图像的灰度值。

()()()()(),max ,,,,,f i j R i j G i j B i j = (2-2) 3) 平均值法

平均值法是将彩色图像中三色分量R G B 、、数值之和的平均值代替该点像素的原灰度值。

()()()()(),,,,f i j R i j G i j B i j =++3 (2-3)

4) 加权平均值法

人眼对颜色的敏感程度不同,对于RGB 三基色模型中的R G B 、、三种颜色来说,人眼对绿色的敏感度最高,对蓝色的敏感度最低。根据这一原理,再结合其他指标,将R G B 、、三个分量按不同的权值进行加权平均,这就是加权平均值法。一般,可以按照公式(2-4)对R G B 、、三分量进行加权平均,这样得到灰度图像较为合理。

()()()(,0.59*,0.30*,0.11*,)f i j G i j R i j B i j =++ (2-4)

图2-1 感兴趣区域和加权灰度化

(2) 图像平滑

实际得到的图像由于在采集、转换和传输过程中,不可避免的会受到成像设备、设备以及外部环境等的影响,从而在图像中包含有噪声。噪声是图像中的无用信息,它与文中所要研究的对象无关,其表现形式包括白噪声、杂散噪声等。噪声将严重影响图像中包含的信息,而且极大降低了图像质量,甚至会掩盖住图像的重要特征,给图像分析带来困难,影响图像分割,图像识别等后续图像处理工作的进行。因而,去除噪声是图像处理中非常必要的前提准备工作。

传输

一般情况下,一幅图像的能量主要集中在低频段,而噪声则主要集中在高频区域中。图像平滑[32]是一种实用的图像处理技术,它主要的目的就是消除或者尽量减少噪声的影响,改善图像的质量,也就是说要减弱或消除图像中高频率分量,但不影响低频率分量,图像平滑又可以称为低通滤波。图像中的高频分量主要存在于区域的边缘部分,这部分的灰度值变化较为剧烈,可以利用图像平滑减弱其灰度值变化,减少图像中的尖锐部分,使图像变得比较平滑。

实际应用中,平滑滤波不仅可以消除噪声,还可以在目标提取之前去除图像中的微小细节或者连接目标内的小间断。从分析域上将图像平滑算法分成两类:频域滤波和空域滤波。在频率域内,由于噪声以高频形式出现在图像中,因此可以使用低通滤波的方式减少噪声的影响,但是需要进行正反两次正交变换,所需的计算量很大,不能很好地满足系统的实时性要求。空域法主要是在空间域内直接对图像的灰度值进行处理,常见的算法有邻域平均值法、中值滤波法等。

1) 邻域平均值法

邻域平均值滤波法是最简单的图像平滑方法,将原图中的像素用以它为中心的一个小区域内的像素平均值作为新图中该点的灰度值。如果当前像素处在一个均匀区域内,则其邻域像素的真实值与它是相同的,由于叠加了不同幅度的噪声使这些像素值各有不同,但是如果经过算术平均,则数学期望就是真实像素值。

邻域均值法利用模板卷积对图像进行处理,由模板定义了一个邻域,这样对某个像素点进行滤波的结果将与该像素点的灰度值和邻域点的像素的灰度值有关。设当前待处理像素为(,)

f m n,给出一个处理模板,大小为3。

3

×

图2-2 均值滤波模板示意图

设(,)f i j 为给定的含有噪声的图像,经过邻域均值法处理后得到的图像为,则邻域均值法的数学表达方式为:

(,g i j ) ()(1

,,g i j f i j N =∑),(),i j M ∈ (2-5)

其中,M 是所取模板中对应像素的坐标,是模板中像素的个数。在实际应用中可以根据实际需要选择不同的模板尺寸,如3N 3×,55×等或者用来近似表示

圆或椭圆等形状的多边形。如矩形邻域模板和圆形邻域模板。 3T c T 3111111*19111T ????=?????? 010111*15010c T ????=??????

需要特别指出的是,邻域均值法在减小噪声影响的同时会使图像变得模糊,破坏图像的特征信息,这也是均值滤波的最大弊端。可以利用不同位置的像素点对中心点像素影响的不同,引入加权系数对模板进行修改,来降低邻域法导致的图像模糊。

2) 中值滤波

1971年图基(Turky)首次提出了中值滤波[33]方法,它是一种非线性滤波技术。中值滤波最早是用于分析时间序列,后来逐渐在图像处理中得到了应用,尤其是它的去噪效果很好,而且在滤除噪声的时候也不会导致图像变得模糊,这也是中值滤波比均值滤波应用广泛的原因之一。而且在处理过程中不需要对图像统计特征进行计算,使用方便,运算速度快,适合于对实时性要求高的系统。

中值滤波的基本原理是将以当前像素为中心的一个小区域内的所有像素 值

进行排序,取

区域中各点灰度值的中值作为滤波的结果。如果中值滤波选用的窗口的大小为奇数,中值就是按像素灰度值大小进行排序后排在中间的像素的灰度值;与之对应,若窗口元素数量为偶数,中值就是取排序后中间的两个数值的平均值作为最后的中值,并将它代替原像素的灰度值。其数学表达式为:

人工智能与计算机视觉

过去几年,全球的互联网公司包括谷歌、微软、Facebook以及中国的百度、阿里巴巴都在加强人工智能领域的投资,设立自己的人工智能研究院。vivo是第一家设立专攻人工智能方向研究院的中国手机公司。此举是vivo内部已经确立的一份3-5年的中长期发展的战略规划,未来对人工智能的发展研究是必然趋势,vivo公司创始人兼CEO沈炜曾表示“人工智能和5G的结合将会是5G时代手机发展的趋势”。 今年我们看到vivo在产品上不少创新,比如AI拍照、商用屏下指纹技术等等,这些都是基于生物特征(biometrics)的鉴别技术,除此之外还有对人脸、虹膜、指纹、声音等特征上的识别,这些大多涉及到视觉信息,正是体现了计算机视觉的应用性,那什么是计算机视觉呢? 计算机视觉技术的概念 正像其它学科一样,一个大量人员研究了多年的学科,却很难给出一个严格的定义,模式识别如此,目前火热的人工智能如此,计算机视觉亦如此。与计算机视觉密切相关的概念有视觉感知(visual perception),视觉认知(visual cognition),图像和视频理解( image and video understanding)。这些概念有一些共性之处,也有本质不同。 从广义上说,计算机视觉就是“赋予机器自然视觉能力”的学科。自然视觉能力,就是指生物视觉系统体现的视觉能力。一则生物自然视觉无法严格定义,在加上这种广义视觉定义又“包罗万象”,同时也不太符合40多年来计算机视觉的研究状况,所以这种“广义计算机视觉定义”,虽无可挑剔,但也缺乏实质性内容,不过是一种“循环式游戏定义”而已。 实际上,计算机视觉本质上就是研究视觉感知问题。视觉感知,根据维科百基(Wikipedia)的定义, 是指对“环境表达和理解中,对视觉信息的组织、识别和解释的过程”。根据这种定

视觉测量系统技术及应用

视觉测量系统技术及应用 1 引言 基于计算机的视觉检测系统是指通过计算机视觉产品将被摄取目标转换成图像信号,传送给图像处理系统,图像处理系统再根据像素分布和亮度、颜色等信息,转变成数字化信号,计算机图像系统对这些信号进行复杂运算来抽取目标的特征,进而根据判别的结果来控制设备动作。它具有非接触、速度快等优点,是一种先进的检测手段,非常适合现代制造业。可用于视觉检测的试验原理很多,如纹理梯度法、莫尔条纹法、飞行时间法等,然而诸多测试原理中,尤其基于三角法的主动和被动视觉测量原理具有抗干扰能力强、效率高、精度合适等优点,非常适合在线非接触测量。本文主要从视觉测量系统在实际中应用出发,展示视觉检测技术在制造业中的广阔应用[1-4]。 2 视觉测量系统技术的应用 2.1 汽车车身视觉检测系统 在汽车制造过程中,车身上总有很多关键的三维尺寸进行测量,采用传统的三坐标测量机只能离线抽样检测,效率低,更不能满足现代汽车制造在线检测的需要,而视觉检测系统能很好的适应该需要,典型的汽车车身视觉检测系统如图1所示[5]。 图1 车身视觉检测系统 车身检测系统主要依靠的是数个视觉传感器,其中还包括传送机构、定位机构,计算机图像采集、网络控制部分。每个传感器对应一个被测区域,然后通过传输总线传至计算机,通过计算机对每个视觉传感器进行过程控制。 汽车车身检测系统的测量效率很高,精度式中,并且可以在完全自动情况下完成,这个包含几十个测点的系统都能再几分钟内测量完成,因此可以适应汽车制造的在线检测。而且传感器的布置可以根据不同车型来布置,增加了应用要求,

因此减少了车身视觉系统的维护费用。 2.2 拔丝模孔形视觉检测系统 使用计算机视觉检测技术开发出的拔丝模孔形检测系统由光学成像系统、工业用摄像机图像采集卡、计算机及监视器组成,可以解决生产实际中的模具孔形检测问题.工作原理如下:先采用注入硅胶方法获得反映待检拔丝模尺寸及形状的硅胶凸模,然后把硅胶凸模放在光学系统的载物台上.硅胶凸模经光学成像放大,成像于CCD像面上,然后用图像采集卡采集CCD图像信息,最后由计算机视觉检测软件完成对孔形尺寸的自动计算,此时图像采集时需要配置特殊的光照系统.系统实现了自动数据采集、处理,实现采样、进样、结果一条龙,形成检测的自动化. 2.3 无缝钢管直线度和截面在线视觉检测 无缝钢管是一类重要的工业产品,在反应无缝钢管质量中,钢管直线度及截面尺寸是主要的几何参数。现代工业已经可以实现无缝钢管的大批量大规模生产,并且并无成熟的直线度、截面尺寸高效率的检测系统,主要原因为:无缝钢管空间尺寸大,需要很大的测量空间,一般的检测手段很难实现如此大尺度的检测。然而视觉检测却非常适合无缝钢管及截面尺寸的测量,其测量原理图如图2所示。 多个传感器组成了视觉检测系统,传感器的结构光所投射的光平面与被测钢管相交,从而得到钢管的部分圆周,传感器测量圆周在传感器三维空间位置,每一个传感器实现一个截面圆周测测量,然后通过拟合得到截面的圆心和其空间位置,从而实现对无缝钢管截面和直径的测量。 图2 无缝钢管在线检测 2.4 视觉测量在逆向工程中的应用 逆向工程是针对现有的工件,利用3D数字化测量仪准确快速地测量出轮廓坐标值,并建构曲面,经过编辑、修改后,将图形存档形成一般的CAD/CAM系统,再由CAM所产生刀具的NC加工路径送至CNC加工机制所需模具,或者以快速成型将物品模型制作出来。视觉测量一般使用三种激光光源:点结构光、线结构光、面结构光,图3为使用线结构光测量物体表面轮廓的结构示意图[6]。

基于计算机视觉的测距算法研究

电子科技大学 2012级本科毕业设计(论文)开题报告表

只有这样计算机才能运行。为使更多的人能使用复杂的计算机,必须改变过去的那种让人来适应计算机,来死记硬背计算机的使用规则的情况。而是反过来让计算机来适应人的习惯和要求,以人所习惯的方式与人进行信息交换,也就是让计算机具有视觉、听觉和说话等能力。这时计算机必须具有逻辑推理和决策的能力。具有上述能力的计算机就是智能计算机。 智能计算机不但使计算机更便于为人们所使用,同时如果用这样的计算机来控制各种自动化装置特别是智能机器人,就可以使这些自动化系统和智能机器人具有适应环境,和自主作出决策的能力。这就可以在各种场合取代人的繁重工作,或代替人到各种危险和恶劣环境中完成任务。 3、课题研究内容 将计算机视觉和图像处理技术应用到车辆驾驶辅助系统当中可以有效地为车辆行驶提供安全保障。而在计算机视觉中,利用视觉信息感知环境,由单幅二维投影图像确定目标与装载摄像机物体之间距离信息的研究,是目前智能交通系统(ITS)和智能车辆系统(IVS)的关键技术之一。本文主要研究针对ITS和IVS的单目视觉测距方法。基于单目视觉的测量技术是从计算机视觉领域中发展起来的新型非接触测量技术,它是一种结合图像处理技术,把图像当作检测和传递信息的手段或载体而加以利用的测量方法。本文利用投影几何原理和图像处理方法研究了单目测距算法,重点研究了摄像机标定技术、图像预处理方法、障碍物体检测及计算障碍物体距离的算法。本文首先采用了一种在照、摄像机内外部参数未知的条件下,利用图像平面中的平行线,以及它们形成的消隐点具有几何约束关系来实现摄像机标定的新方法。该方法与以前方法相比,计算复杂性不高,但相对而言,准确性和鲁棒性较高,且无须在使用前标定相机,更符合实际需要(因现今的照、摄像机都是变焦距的),从而具有广泛的推广价值。其次,对多种图像预处理方法进行了分析、比较和选择,采用的方法兼顾了图像处理效果和实时性要求。最后,在分析道路特征的基础上建立了道路几何模型,并利用改进的Hough变换提取出道路边缘曲线模型。并在现有单一道路模型测距算法的基础上做了改进,提出了混合几何模型的单目测距算法。模拟试验结果表明该算法对视觉测距领域的研究有一定的借鉴意义。 4、关键问题及研究目标 本次研究目标主要是通过对已有基于计算机视觉的测距算法的实现和评估。关键问题在于如何用OpenCV实现这些算法并对其进行合适的评估。 5、研究特点 基于计算机视觉的距离测量主要是单目测距和多目测距,它们都有各自的优点,也

计算机视觉技术

目录 1立体视觉 (1) 1.1计算机视觉技术 (1) 2立体视觉技术 (3) 2.1双目立体视觉技术 (3) 致谢 (8) 附录: (9)

立体视觉 我的毕业论文排版样文 1立体视觉 1.1计算机视觉技术 计算机视觉既是工程领域也是科学领域中的一个富有挑战性的重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中,其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学、神经生理学和认知科学等[18]。 视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断和军事等领域中各种智能自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战。“计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图像信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起[19]。”作为一门学科,计算机视觉开始于60 年代初,但在计算机视觉的基本研究中的许多重要进展是在80 年代取得的。现在计算机视觉已成为一门不同于人工智能、图象处理、模式识别等相关领域的成熟学科[20]。 不少学科的研究目标与计算机视觉相近。这些学科包括图像处理、图像识别、景物分析、图像理解等。由于历史发展或领域本身的特点这些学科互有差别,但又有某种程度的相互重叠。为了清晰起见,把这些与计算机视觉有关的学科从研究目标和方法角度加以归纳[21]。 (1)图像处理 图像处理技术把输入图像转换成具有所希望特性的另一幅图像。例如,可通过处理使输出图像有较高的信噪比,或通过增强处理突出图像的细节,以便于操作员的检验。在计算机视觉研究中经常利用图像处理技术进行预处理和特征抽取。 (2)图像识别 图像识别技术根据从图像抽取的统计特性或结构信息,把图像分成预定的类别。在计算机视觉中图像识别技术经常用于对图像中的某些部分(例如分割区域)的识别和分类。 第 1 页(共9页)

计算机视觉系统及其应用

课程设计 课程名称工业自动化专题 题目名称_计算机视觉系统及其应用学生学院_____自动化________ 专业班级______ 学号 学生姓名____ 指导教师___________ 2013 年 6月 25日

机器视觉系统及其应用 摘要:主要介绍机器视觉系统的概要,简要分析机器视觉的特点、优越性和应用,具体介绍了机器视觉技术在印刷行业、农业、工业、医学中的实际应用,并且分别举例说明。机器视觉的诞生和应用在理论和实际中均具有重要意义。 关键词:机器视觉;标签检测;药物检测;水果品质检测;硬币检测。 1. 机器视觉系统 1.1 机器视觉系统简介 机器视觉系统是指利用机器替代人眼做出各种测量和判断。机器视觉是工程领域和科学领域中的一个非常重要的研究领域,它是一门涉及光学、机械、计算机、模式识别、图像处理、人工智能、信号处理以及光电一体化等多个领域的综合性学科。 机器视觉系统通过图像摄取装置将被摄取目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号。机器视觉系统可以快速获取大量信息,而且易于自动处理,也易于同设计信息以及加工控制信息集成。 机器视觉系统的优点有:1.非接触测量,对于被检测对象不会产生任何损伤,而且提高了系统能够的可靠性;2.较宽的光谱响应范围,例如使用人眼看不见的红外测量,扩展人眼的视觉范围;3.长时间稳定工作,人类难以长时间对同一对象进行观察,而机器视觉系统则可以长时间地作测量、分析和识别任务。 现在,机器视觉系统在工业、农业、国防、交通、医疗、金融甚至体育、娱乐等等行业都获得了广泛的应用,可以说已经深入到我们的生活、生产和工作的方方面面。 1.2 基本原理 图 1 是机器视觉系统的基本结构,在一定的光照(包括可见光,红外线甚至超声波等各种成象手段)条件下,成象设备(摄象机,图像采集板等)把三维场景的图像采集到计算机内部,形成强度的二维阵列——原始图象;然后,运用图像处理技术对采集到的原始图像进行预处理以得到质量改善了的图像;其次,运用机器视觉技术从图像中提取感兴趣的特征分类整理;,构成对图像的进一步,运用模式识别技术对抽取到的特征进行描述;最后,运用人工智能得到更高层次的抽象描述。完成视觉系统的任务。 图1机器视觉的基本结构

单目视觉图像深度测量方法研究

单目视觉图像深度测量方法研究 相机与其它传感器相比,具有能够直观反映客观世界、数据量大、信息丰富等特点,而且通常价格较低、配置方便,是自动化装置和机器人感知环境传感器中的优先选择之一。但由于普通相机在拍摄时获得的是被拍摄场景投影到成像平面上的二维图像,丢失了场景的深度信息,这使得机器无法通过图像直接得到场景中物体的远近、大小和运动速度等信息,因此需要从二维图像中恢复深度信息,即深度测量。深度测量在工业自动化、智能机器人、目标检测和跟踪、智能交通、三维建模和3D视频制作等领域都有广泛的应用。深度测量方法有很多种,其中基于单目视觉的图像深度测量方法具有设备简单、成本低廉、操作方便等特点而成为研究热点,并且单目相机体积小,重量轻,在一些有空间大小或载荷限制的特定场合以及手眼系统等应用中,需要或只能使用基于单目视觉的图像深度测量方法,而目前该测量方法还很不成熟,有必要对其计算原理、技术方法等方面进行研究。 因此本文对基于单目视觉的图像深度测量方法开展研究,主要工作和创新点如下:(1)提出一种基于熵和加权Hu氏不变矩的目标物体绝对深度的测量方法。该方法用普通单目相机拍摄同一场景的两幅图像,拍摄时保持相机的参数不变,将相机沿光轴方向移动,分别在物距间隔为d的前后两处各拍摄一幅图像,然后采用LBF模型的方法分割出图像中的物体,并求出各个目标物体像的面积,再将物体像的熵的相对变化率和加权Hu氏不变矩结合起来实现图像内物体的自动匹配,最后运用本文推导的公式计算出各个目标物体的绝对深度。文中采用真实场景图像对该方法进行了实验验证并与其他方法进行了对比,结果表明了该方法的有效性。(2)提出一种基于SIFT特征的目标物体绝对深度的测量方法,该方法同样需要按照上面的方法获取同一场景的两幅图像,然后分别对这两幅图像进行图像分割和SIFT特征点提取,并进行图像中的目标物体匹配,接着用凸包和几何形状约束从匹配物体中选出一对最佳直线段,最后根据光学成像原理利用直线段长度计算出场景中静态目标物体的绝对深度信息。 由于是通过被测量物体上的两个SIFT特征点所成的直线段长度来计算出物体的绝对深度信息的,所以该方法鲁棒性较好,不受场景中被测量目标物体部分遮挡或缺失的限制,对比实验表明该方法测量精度高于现有其他方法。(3)提出一种基于梯度信息和小波分析的单幅图像相对深度测量方法。该方法首先利用图像

人机交互中的计算机视觉技术.

人机交互中的计算机视觉技术 基于视觉的接口概念 计算机视觉是一门试图通过图像处理或视频处理而使计算机具备“ 看” 的能力的计算学科。通过理解图像形成的几何和辐射线测定, 接受器(相机的属性和物理世界的属性, 就有可能 (至少在某些情况下从图像中推断出关于事物的有用信息, 例如一块织物的颜色、一圈染了色的痕迹的宽度、火星上一个移动机器人面前的障碍物的大小、监防系统中一张人脸的身份、海底植物的类型或者是 MRI 扫描图中的肿瘤位置。计算机视觉研究的就是如何能健壮、有效地完成这类的任务。最初计算机视觉被看作是人工智能的一个子方向, 现在已成为一个活跃的研究领域并长达 40年了。 基于视觉的接口任务 至今,计算机视觉技术应用到人机交互中已取得了显著的成功,并在其它领域中也显示其前景。人脸检测和人脸识别获得了最多的关注, 也取得了最多的进展。第一批用于人脸识别的计算机程序出现在 60年代末和 70年代初,但直到 90年代初,计算机运算才足够快,以支持这些实时任务。人脸识别的问题产生了许多基于特征位置、人脸形状、人脸纹理以及它们间组合的计算模型, 包括主成分分析、线性判别式分析、 Gabor 小波网络和 .Active Appearance Model(AAM . 许多公司,例如Identix,Viisage Technology和 Cognitec System,正在为出入、安全和监防等应用开发和出售人脸识别技术。这些系统已经被部署到公共场所, 例如机场、城市广场以及私人的出入受限的环境。要想对人脸识别研究有一个全面的认识,见。 基于视觉的接口技术进展 尽管在一些个别应用中取得了成功,但纵使在几十年的研究之后,计算机视觉还没有在商业上被广泛使用。几种趋势似乎表明了这种情形即将会发生改变。硬件界的摩尔定律的发展, 相机技术的进步, 数码视频安装的快速增长以及软件工具的可获取性(例如 intel 的 OpenCV libraray使视觉系统能够变得小巧、灵

基于单目视觉的车辆测距系统研究

基于单目视觉的车辆测距系统研究 【摘要】本文,针对智能汽车单目视觉提出了通过镜头跟随汽车移动导致图像放大倍数的改变,然后根据图像大小的变化和移动距离来计算车辆与前方障碍物之间距离的方法,有效提高了车距测量的精确度。 【关键词】单目视觉;汽车测距系统 随着现代汽车智能化程度不断提高,利用机器视觉获取路况环境信息,进而对汽车实时控制是实现汽车智能化的重要方法之一,而通过单目视觉系统来监测本车与前方障碍物的距离是为汽车智能化纵向控制提供输入参数最常用的方法。 单目视觉系统通常使用对应点标定法来获取相关的参数,但由于汽车行驶过程中摄像机位置经常发生变化,进而引起系统参数发生变化,使得本方法的精确度经常发生变化。本文提出通过镜头跟随汽车移动导致图像放大倍数的改变,然后根据图像大小的变化和移动距离来计算车辆与前方障碍物之间的距离。 一、障碍物距离计算方法 本测量方法的理论依据是物体成像关系,汽车带动摄像头移动,摄像头对前方障碍物进行拍摄,拍摄图片由图像处理机处理,计算出障碍物距离。 假设汽车行驶在相对平整的路面上,我们采用计算机视觉中常用的透视投影,路况的光线均通过透镜的中心。经过透镜的中心且垂直于图像平面的直线可称之为光轴。下面我们分平行和垂直于光轴移动两种情况计算障碍物的移动。 1.障碍物平行于光轴移动的计算 图1 障碍物向镜头移动成像图 障碍物在AB位置时成像为CD;随着障碍物与摄像头距离变化后,障碍物在A’B’位置成像为C’D’;C’D’/CD=k;k为障碍物的图像放大率。假设障碍物在AB位置时的物距为U,像距为V,障碍物在A’B’位置时的物距为U’,像距仍然为V,则有式①和式②。 ①② ②式除以①式得: ③ 因为AB=A’B’,由③式得:

计算机视觉技术在零件尺寸测量中的应用_王晓翠

计算机视觉技术在零件尺寸测量中的应用 王晓翠1,王艳秋1,麻恒阔2 (1.北京航空精密机械研究所,北京100076; 2.A BB电气传动系统有限公司,北京100015) 摘要:介绍了一种应用计算机视觉技术检测机械零件参数的测量方法。以面阵CCD为图像传感器,通过图像采集卡将机械零件的二维图像输入到计算机中。在对原始输入图像进行直方图校正和边缘保持滤波处理后,对得到的较为平滑的零件图像进行边缘检测。利用图像边缘灰度突变的特性,提出了一种结合梯度算子的快速边缘检测方法。并据此计算出零件的各参数值。此种测量方法非常适合于微小、易形变等接触测量难以准确测量的机械零件的参数检测,具有广阔的应用前景。 关键词:直方图校正;边缘保持滤波;边缘检测 中图分类号:T P391.41文献标志码:A Application of Measurement of Mechanical Accessory Size based on C omputer Vision Technology WA N G Xiaocui1,W AN G Y anqiu1,M A H eng kuo2 (1.Beijing Pr ecision Eng ineering Institut e fo r A ircraft Industr y,Beijing100076,China; 2.ABB Beijing Dr ive Systems Co.,L td,Beijing100015,China) Abstract:T he accessor y parameter measurement met ho d w as presented based on co mputer v ision technolog y.By taking CCD as imag e senso r,the accesso ry image is put into the co mputer via imag e co llection card.T he edge detectio n of smoot her accessor y imag e attained after histo gr am adjusting the or ig inal imag e and holding edg e filter.Co nsider ing the sudden chang e of the gr ay scale o f the image edge,a rapid edge-detectio n technique is pr esented which uses gr adient operato r,and then wo rked o ut t he accesso ry parameters.T his metho d is pr opitio us to measure mechanical accesso ry accur ately,such as m-i nuteness,mo re defo rmable that unfit for tangency measur ement,and has a w ide applicatio n fo reg round. Key words:Histo gr am adjusting,Edge keeping filter,Edg e detectio n 基于图像处理的计算机视觉技术是把被测零件的图像当作检测和传递信息的手段,从中提取有用的信号来获得待测的参数。该测量方法具有非接触、高速度、动态范围大、信息量丰富等优点,非常适合传统方法难以测量的场合,如易变形零件尺寸、微小尺寸及零件孔心距等的测量。本文介绍了一种以CCD作为图像传感器的图像测量系统,并可实现对微小零件的几何量(如薄板零件的小孔和孔心距等)进行自动测量。 1计算机视觉检测系统的构成 计算机视觉检测系统是集光学、光电子学、精密机械及计算机技术为一体的综合系统。该测量系统基本上由平行光照明系统、CCD图像采集系统以及相应的图像处理软件组成。为了达到良好的照明效果,并适当提高被测图像的对比度,从而提高图像处理中边缘提取的精度,采用光照均匀的柯拉照明方式,并对被测物进行平行光背光照射。由于被测对象多为板型零件,因而可以较好地利用光照条件提取被测物的有效轮廓,有利于图像测量算法精度的提高。结构框图如图1所示。其工作过程为:将被测零件置于尽可能均匀照明的可控背景前,CCD和图像卡将被测零件图像采集到计算机里,计算机按一定的算法计算出被测物体的几何参数,最后计算机对这些数据进行各种处理,并将结果按一定要求 予以显示和存储。 图1图像测量系统结构框图 2图像预处理 由于光的散射、空间电磁干扰、电路杂波等原因,得到的图像中通常含有如椒盐、脉冲和高斯等噪声。噪声会影响图像质量,造成零件边缘模糊,降低系统测量精度,因此,必须对原始图像进行灰度校正、噪声过滤等预处理。对图像测量系统来说,所用的图像预处理方法可不考虑图像降质,只将图像中感兴趣的部分有选择地突出,衰减不需要的特征。考虑到待测物体参数大多由其外形轮廓决定,本文首先对原始图像进行直方图均衡化处理,然后采用边缘保持滤波算法对图像进行降噪。 2.1直方图修正 原始图像的灰度值分布是不均匀的,其灰度值

计算机视觉简介

人们常说:眼睛是心灵的窗户,通过眼睛人们可以轻易地交流情感,眼睛也是与外界交流的窗口,这些都是通过“看”来完成的。 人们可以很容易“看到”一幅画,但这一“简单”过程并不如此简单,大致上它可以分为以下几个阶段:首先是通过眼睛将图成像在视网膜上;其次大脑对图像进行理解;最后根据处理的结果做出反应。用比较专业一点的语言来描述,该过程包括了识别、描述与理解三个层次;这其中还隐含了边缘检测(各物体的轮廓等)、图像的分割(各物体区域的划分)等阶段。以上实际上概述了视觉系统的三个层次,即低层阶段:基于图像特征提取及分割阶段;中层阶段:基于物体的几何模型与图像特性表达阶段;高层阶段:基于景物知识的描述、识别与理解阶段,这是根据先验知识介入的程度划分的,且实现起来也越来越困难。 毫无疑问,如何人工实现这一过程是极具挑战性和应用前景的一项工作,计算机视觉也因此而应运而生。计算机视觉是研究用计算机和成像设备来模拟人和生物视觉系统功能的技术学科,其目标是从图像或图像序列中获取对外部世界的认知和理解,即利用二维图像恢复三维环境中物体的几何信息,比如形状、位置、姿态、运动等,并能描述、识别与理解。 计算机视觉的基础是各种成像设备,例如CCD(Charge Coupled Device )摄像机(数码相机属于此类型)、红外摄像机、医学上常用的核磁共振成像、X射线成像等,这些设备不仅可以成像,还可以获取比人眼更丰富的图像,人们可以形象地把摄像机看成计算机视觉的视网膜部分。可以说从人类拍摄出第一幅图像开始,就为计算机视觉的诞生奠定了基础。 而计算机视觉的核心是数字电子计算机,其发展可谓突飞猛进,在计算和存储能力上,人脑已经无法与之相比,人们的目标就是利用计算机非凡的计算处理能力来代替人脑实现对图像的理解,而计算机日新月异的发展也使得这一愿望越来越成为可能。 用于指导“计算机”这个大脑运作的核心是计算机视觉的理论方法,计算机视觉使用的理论方法主要基于几何、概率和运动学计算与三维重构的视觉计算理论,它的基础包括射影几何学、刚体运动力学、概率论与随机过程、图像处理、人工智能等理论。在20世纪70年代,视觉研究大多采用模式识别的方法;80年代,开始采用空间几何的方法以及物理知识进行视觉研究;90年代以后,随着智能机器人视觉研究的发展,引入了许多新的理论与技术如主动视觉理论、不变量理论、融合技术等,并应用于许多计算机视觉系统中。 研究计算机视觉,不得不提的是英国已故科学家戴维·马尔(David Marr),他在计算机视觉发展史上可谓写下了浓重的一笔。在20世纪70年代末,他提出了第一个

【CN110031829A】一种基于单目视觉的目标精准测距方法【专利】

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910311557.X (22)申请日 2019.04.18 (71)申请人 北京联合大学 地址 100101 北京市朝阳区北四环东路97 号 (72)发明人 刘宏哲 王永森  (74)专利代理机构 北京思海天达知识产权代理 有限公司 11203 代理人 刘萍 (51)Int.Cl. G01S 11/12(2006.01) (54)发明名称 一种基于单目视觉的目标精准测距方法 (57)摘要 一种基于单目视觉的目标精准测距方法属 于计算机视觉计算领域,主要应用于智能驾驶场 景感知中前方车辆目标测距技术中。该方法主要 分为相机标定、目标测距关键点选取、目标测距、 误差修正四大部分。通过选取合适的测距关键 点,结合多种测距算法以及对测距误差进行修 正,最终得到目标的精准距离。该方法可以应用 在基于视觉计算的很多行业中,如应用于无人驾 驶汽车前方车辆目标测距,城市交通车辆检测与 行为意图分析,智能机器人目标测距等应用中。 本方法较其他视觉测距方法精度更高。权利要求书2页 说明书4页 附图6页CN 110031829 A 2019.07.19 C N 110031829 A

1.一种基于单目视觉的目标精准测距方法,其特征在于,包括以下步骤: 步骤1:相机标定; 步骤1-1:打印一张用于相机标定的黑白相间的棋盘格,把它贴在一个平面上,作为标定物; 步骤1-2:使用需要标定的相机捕获棋盘格图像,要求整张棋盘格在图像内,每个棋盘格边长不能少于10个像素,并且捕获从不同角度拍摄的N张图像; 步骤1-3:打开MATLAB软件中相机标定模块,点击“add images ”,然后输入模板的方格大小d mm,选中步骤1-2中获取到的N张图像; 步骤1-4:添加完N张图像之后,选择“calibrate ”命令,出现标定结果统计图,点击保存calibration.mat文件,相机标定完成; 步骤1-5:从calibration. mat中取出内参矩阵其中,f x 、f y 分别是相机水平方向和垂直方向相对单位像素的焦距,(u 0,v 0)是光学中心坐标, 外参矩阵其中,分别是世界坐标到相机坐标的旋转 矩阵、平移矩阵; 步骤2:目标测距关键点选取; 步骤2-1:由已知的目标检测结果得到待测目标的矩形框位置(u v w h),其中(u v)表示矩形框在图像中左上角顶点的坐标值,(w h)表示矩形框的宽度和高度像素值; 步骤2-2: 计算目标测距关键点C的像素坐标 步骤2-3:校验测距关键点坐标合法性,需要满足条件C={(x ,y)|0<x<W ,0<y<H},其中W是图像总的像素宽度,H是图像总的像素高度; 步骤3:目标测距; 步骤3-1:选取世界坐标系,世界坐标系的坐标原点在相机正下方的水平路面上,x轴方向为正前方,y轴方向为正左方,z轴方向为正上方,符合右手定则; 步骤3-2:从步骤1中得到相机参数的内参矩阵K和外参矩阵P,从步骤2中得到待测目标的测距关键点C的像素坐标(u 1,v 1), 其中令测距关键点C的世界坐标为(X w ,Y w ,Z w ),由于所计算的关键点C的世界坐标点位于水平地面上,所以Z w =0,最后通 过矩阵变换公式计算得到关键点C的相关性未知尺度因子s; 步骤3-3:根据步骤3-2所求的相关性未知尺度因子s ,关键点C 的像素坐标 权 利 要 求 书1/2页2CN 110031829 A

计算机视觉

计算机视觉 计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。 目录 1定义 2解析 3原理 4相关 5现状 6用途 7异同 8问题

9系统 10要件 11会议 12期刊 1定义 计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就像人类和许多其他类生物每天所做的那样。 计算机视觉是一门关于如何运用照相机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机)和大脑(算法),让计算机能够感知环境。我们中国人的成语"眼见为实"和西方人常说的"One picture is worth ten thousand words"表达了视觉对人类的重要性。不难想象,具有视觉的机器的应用前景能有多么地宽广。 计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它

的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。 2解析 视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的 计算机视觉与其他领域的关系 研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战(grand challenge)。计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图象信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。作为一门学科,计算机视觉开始于60年代初,但在计算机视觉的基本研究中的许多重要进展是在80年代取得的。计算机视觉与人类视觉密切相关,对人类视觉有一个正确的认识将对计算机视觉的研究非常有益。为此我们将先介绍人类视觉。 3原理 计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,还没有条件实现象人那样能识别和理解任何环境,完成自主导航的系统。因此,人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意味

基于计算机视觉水火弯板的三维测量系统

基于计算机视觉水火弯板的三维测量系统 赵猛,王直 (江苏科技大学江苏镇江212003) 摘要:将激光测量技术和多目视觉照相测量技术相融合,分别发挥激光测量精度高、定位准,照相测量速度快、密度高的特点,研制曲面板三维形状的自动测量以及划线定位系统,实现曲面板上的关键点的位置精确、快速的测量,该系统可基本实现工业船舶行业对曲面板技术的要求,对造船业的发展具有重要的现实意义。关键词:水火弯板;计算机视觉;激光测量;三维测量中图分类号:TP29 文献标识码:A 文章编号:1674-6236(2013)02-0063-04 Three -dimensional measurement system based on computer vision line heating plate ZHAO Meng ,WANG Zhi (Jiangsu University of Science and Technology ,Zhenjiang 212003,China ) Abstract:This article will laser measurement technology and visual camera measuring technology integration ,are played by laser high measuring precision ,accurate positioning ,photographic measurement speed ,high density characteristics ,development of curved plate shape measurement and scribing positioning system ,realize the curved panel on the key points of the position accuracy ,rapid measurement ,the system can realize the basic industry of shipbuilding industry on the curved panel technology requirements ,the development of shipbuilding industry has the important practical significance.Key words:plate bending ;computer vision ;laser measurement ;three-dimensional measurement 收稿日期:2012-09-19 稿件编号:201209139 作者简介:赵猛(1987—),男,山东济南人,硕士研究生。研究方向:复杂系统分析与建模、导航技术应用等。 大型曲面板的高精度快速测量及定位自动化,不仅是目前船舶建造所急需的,也是未来船舶建造测量装备发展的必然趋势。传统的研究方法对板子加工后位移大小的计算测量精度都不高,关键原因是在板子上标记具有难度。长期以来,对于船体双曲度外板的加工,国内外造船厂都是依靠有经验的工人采用水火弯板的方法手工作业完成。船体外板曲面的成型加工是船舶制造的关键及重要环节之一。各种船舶的外表面大多都是由复杂的、不可展的空间曲面构成,把钢板加工成这样的曲面,目前在国内外大部分船厂主要还是采用燃气火焰在钢板表面局部进行加热,当加热区达到一定温度后再降温,利用金属的热弹塑性收缩变形原理,以获得良好的整体变形,这就是所说的水火弯板工艺[1]。 1 曲面板测量、定位系统的整体设计与原理 1.1 整体架构图 该系统主要是由服务器、工控机、工业照相机、激光扫描 机以及传输信号的数据线组成的如图1所示。 服务器主要是接受处理伺服控制器的控制信号,通过伺服控制器来控制激光扫描机跟工业摄像机,对曲面板立体拍照、测量,通过嵌入式计算机收集反馈来的控制信号通过比较相机跟激光扫描机的来准确的定位划线装置的位移。 1.2相机成像原理 该测量系统采用了4台高分辨率家用单反相机、以及一 个高精度激光测量装置,系统将激光与照相相结合进行测量。目前该系统能比较准确地测量曲面板的三维形状,测量精度可以达到±2mm 。根据物理学中光学的原理摄像机成像 模型如图2所示[2]。 电子设计工程 Electronic Design Engineering 第21卷 Vol.21 第2期No.22013年1月Jan.2013 图1 整体架构图 Fig.1Overall chart 图2 摄像机成像模型 Fig.2Camera imaging model

基于计算机视觉技术的人脸检测系统设计

基于计算机视觉技术的人脸检测系统设计 王斌,郭攀,张坤,黄乐 (长安大学信息工程学院,陕西西安710064) 摘要:通过对基于Haar-like 特征的AdaBoost 人脸检测算法研究,利用由该算法训练的级联分类器和计算机视觉类库OpenCV 进行人脸检测系统设计,实现了基于静态图像、摄像头视频和avi 视频的人脸检测与标记,以及标记后的人脸区域图像实时显示和存盘。此外,在VC++6.0环境下实现了对人脸检测系统软件界面的开发。实验结果表明,该检测系统开发周期短,检测速度快,实时性强,检测率高,可作为人脸识别和人脸跟踪系统的开发基础。关键词:计算机视觉;人脸检测;AdaBoost 算法;Haar-like 特征;OpenCV 中图分类号:TP391.4 文献标识码:A 文章编号:1674-6236(2011)16-0038-04 The design of face detection system based on computer vision technology WANG Bin ,GUO Pan ,ZHANG Kun ,HUANG Le (College of Information Engineering ,Chang ’an University ,Xi ’an 710064,China ) Abstract:Through the research for AdaBoost face detection algorithm based on Haar -like features ,make use of the cascade classifier trained by this algorithm and computer vision library OpenCV to design a face detection system ,realize face detection and mark based on static image ,camera video and avi video ,finish displaying and saving the face region images marked by rectangles real -timely.Besides ,achieve the development of software interface by VC++6.0.The experiment result shows that the face detection system has features of short develop cycle ,rapid detection ,real -time and high detection rate ,which can be used for the bases of face recognition system and face tracking system. Key words:computer vision ;face detection ;AdaBoost algorithm ;Haar -like feature ;OpenCV 收稿日期:2011-06-19 稿件编号:201106084 作者简介:王斌(1985—),男,河南南阳人,硕士研究生。研究方向:信号与信息处理及智能控制。 随着计算机技术和数字信号处理技术的快速发展,计算机视觉技术逐渐应运而生,并得到了广泛的应用。OpenCV [1](Open Source Computer Vision Library )是由Intel 提供的由一系列C 函数和少量C++类构成的计算机视觉开源软件包,它拥有数百个可实现图像处理和计算机视觉方面的中、高层 API ,可以十分方便地搭建基于计算机视觉技术的静态图像 和视频流处理软件平台,可作为二次开发的理想工具。由于基于Haar-like 特征的AdaBoost 人脸检测算法具有检测速度快、实时性强、鲁棒性好等优点,本文采用基于Haar-like 特征的AdaBoost 人脸检测算法和OpenCV 相结合的方法在 VC++6.0软件开发平台上分别对基于静态图像、摄像头视频 和avi 视频的人脸检测系统进行设计,实现了从静态图像中检测出人脸并标记出人脸位置、从摄像头视频中实时检测和标记出人脸的位置和从avi 视频中提取检测出有人脸的帧并实时标记人脸,同时还实现了对标记后的人脸区域图像进行实时显示和存盘。 1AdaBoost 人脸检测算法 人脸检测的目的就是把静态图像或视频帧中的人脸区 域和非人脸区域区分开。Viola 等人提出的人脸检测方法是一种基于积分图、级联分类器和AdaBoost 算法的方法,该方法可分为以下3个步骤实现[2]。 1)使用Haar-like 特征表示人脸,并采用一种新的图像 表示方式—“积分图”快速计算其特征值。 2)利用AdaBoost 机器学习算法挑选出一些最能代表人 脸的矩形特征(弱分类器)并按照加权投票的方式将弱分类器构造成一个强分类器。 3)将训练得到的若干个强分类器串联起来构造成一个 级联结构的分类器,从而提高分类器的检测速度。 1.1Haar-like 特征 用一些简单的矩形特征来表示人脸特征,因其类似于 Viola 等人提出的Haar-like 小波而得名[3]。常用的Haar-like 特征有边缘特征、线性特征和中心特征,如图1所示。 其中特征值是指图像上两个或者多个形状大小相同的矩形内部所有像素灰度值之和的差值,在系统中统一采用白 电子设计工程 Electronic Design Engineering 第19卷Vol.19第16期No.162011年8月Aug.2011 图1 Haar -like 特征Fig.1 Haar -like features -38-

相关文档
最新文档