行人检测方法研究

行人检测方法研究
行人检测方法研究

1 绪论

1.1 研究背景

在信息高速发展的今天,几乎所有领域都离不开计算机,在满足人们的习惯方式和生活习惯下,让计算机进行很好的通信,是计算机智能的一个必备的条件。

其中,计算机智能视觉是其应用的重要方向,它是研究使用各种成像输入设备替换人类视觉器官的领域叫智能视觉,并使用智能设备来替代人们完成识别和分析。让智能设备能够像人类一样观察和理解是人们研究计算机视觉,而且智能设备还能随着环境的变化而做出相应的改变。行人检测是计算机视觉的一个具体表现形式,并应用在以下方面:智能监控

目前,为了防止财产安全和留下有效的证据,大部分的公众场所都装备了摄像监控设备。但是,这些监控设备大部分还是有专人进行的查看的,这会导致以下问题的出现,一方面长时间的监控,监控人员很可能出现疲惫,可能导致某些重要信息的遗漏,另一方面不能充分的把监控信息利用起来。然而人工的不足可以利用行人检测相关技术很好的解决,这样不仅可以减少各种资源的投入,又可以让监控的精确度得到很好的改善,当遇到紧急情况有可以及时预警。

车辆辅助系统

随着社会的发展,人民的经济水平不断提高,汽车逐渐走入了千家万户,然而汽车数量的急剧增长也导致了频繁的交通事故,无情的夺去了人们的生命财产安全。如果我们将行人检测系统加入到汽车控制系统中,这样在行驶过程中车辆附近的人们可以被识别出来,极大了避免的交通事故的发生。这样不仅可以有效的降低交通事故,而且这也可以带来汽车行业的革命式变化。实际上,现在有许多公司已经研制出了无人驾驶的汽车,这些车的使用都需要行人检测技术,当然现在的能智能还没进入市场,目前还在试验当中。

高级人机接口

在21世纪,计算机技术得到了迅猛发展,并且愈加趋于智能化的特点,极大地改变了我们的生活方式。我们不仅要求计算机能够快速准确的接收到外界输入的信息,而且能够高效地对信息进行处理并得到最合适的输出信息,作出的相应的反应。人脸识别技术和物体检测技术的发展,可以很好的帮助计算机去获取和处理外界的信息。这不仅

需要良好的智能设备,同时也需要行人检测技术去协助完成。

1.2 研究现状

行人检测在汽车领域具有很大的应用前景,近年来是模式识别领域研究的热点课题方向之一。并且国内外也有了很多了研究成果,如由本田公司研发的基于红外摄像机的行人检测系统[1]; CMU[2]、MIT[3]等国外的大学在这方面取得了很大的进步,清华大学[4]等也进行了相关方面的研究。

行人检测技术实际上为图像处理技术的分支,其核心思想就是利用计算机视觉技术和数字图像处理技术,去分析监控设备获取的信息,分析处理行人的行为。

行人检测的成功开发具有很大的应用前景,可以在各个领域得到发展。而且由于检测的行人外形不同,加上周围的复杂混乱的环境,给行人检测系统的运行带来了很大的挑战。

早期的行人检测以静态图像处理中的分割、边缘提取、运动检测等方法为主。例如:(1)以Gavrila为代表的全局模板方法[5];

(2)以Broggi为代表的局部模板方法[6];

(3)以Lipton为代表的光流检测方法[7];

(4)以Heisele为代表的运动检测方法[8];

(5)以Wohler为代表的神经网络方法[9];

但是这些方法的检测速度很慢,而且普遍存在着误报、漏检率高的特点。

行人检测的现状:大体可以分为两类:(1)基于背景建模的方法:分割出前景,提取运动目标,在进一步提取特征,分类判别。然而这个方法构建了很复杂的模型,因此系统很容易受到干扰。(2)基于统计学习的方法:根据大量训练样本来构建行人检测分类器,提取样本的特征,一般分类器包括SVM[10],AdaBoost[11]。

目前,基于学习的行人检测方法得到了很大的发展,如基于AdaBoost、基于SVM、基于HOG等行人检测方法。首先,这些方法都是学习正样本和负样本的变化,再根据大量的训练样本对不同的特征进行分类,因此,基于统计学习的方法有广泛的适用性。

在行人检测系统中,目标识别和ROIs分割是两个重要的部分。目标识别依据监测信息的不同分为基于形状的方法和基于运动的方法。ROIs分割可分为基于运动、基于距离、基于图像特征和基于摄像机参数四种方法。在具体操作中,一般将这四种方法综合起来使用,能取得更好的结果。

1.3研究难点

目前行人检测技术面临着如下的技术难点:

(a)每个人都有各自的姿态,着装各异;

(b)特征空间的待提取的特征分布不集中;

(c)受训练的样本变化大,造成系统分类效果的好坏;

(d)受训练的样本很难包含各种复杂的真实环境;

现在的行人检测技术正处于发展的关键时期,已经取得了一些可喜的进步,但许多难点问题急待解决。在一些环境背景良好的情况下,行人检测算法检测效果很好,但是实际中很多环境是很复杂的,检测的效果并不能满足要求。另外,检测时会有延时也降低了系统的实用性,而且目前还缺乏标准的测试方法和数据库的建立。

1.4本文研究的主要内容

首先,本文简要地介绍了目前的各种算法,并相互对比,指出其中的优点和存在的问题。其次,介绍本文研究的重要算法HOG算法原理,并进行改进,并比较改进前后,算法性能的变化。最后,本文提出HOG+SVM算法,通过将现有的HOG算法和SVM分类器,巧妙的将两者结合改进,使之满足各种复杂条件。本文的创新之处在于,通过将HOG和SVM算法结合并加以改进,使检测效率大大提高,并且实时性更强。本文结构:第一章是绪论,介绍了行人检测的背景和意义,并阐述了其研究现状,给出了本文的研究内容;第二章详细介绍了行人检测主要算法,并相互比较,得到其中的优缺点;第三章主要介绍HOG算法原理以及该算法的优缺点;第四章研究了基于HOG和SVM算法的行人检测算法,并进行了改进得到试验结果,详细分析后得到结论;第五章主要是对本文研究的总结以及未来技术发展的展望。

2 行人检测主要方法介绍及比较

2.1 引言

目前,随着智能交通的发展,行人检测这方面的算法的研究也在不断的深入,每年都会涌现出很多优秀的文论,有的是对行人检测进行全新的研究,或者是对原有算法进行深入的改善,提高检测的准确度以及检测的速度,加快了行人检测的实用化进程。以下是对两类算法的详细介绍:

第一类为基于特征的算法。

在将矩形框范围内的行人作为一个整体的前提下,它的关键在于找到能够代表框内

行人的特征信号参数,然后利用机器学习算法将这种参数进行分类,这样就可以区分行人和非行人,达到识别的目的。从这个过程中,我们可以知道基于特征的算法分为分类器的学习和特征的提取,所以一个好的特征提取算法变得很重要。比如HOG特征、wavelet 特征、shapelet特征,LBP等。该类方法的实现的算法比较简单,架构容易,当使用不同特征方法时,也不用更改原来的架构,且易于实现。然而能够使用分类效果好的特征,就可以很好地从被检测目标很好的检测出行人目标。前面我们提到行人都有各自的特点,所以目前很难找到一个完美的算法来描述行人的特征。尤其是在行人行走过程中,行人的姿势不断变化、监控设备的视角也在变化、同时行人也会被其他物体遮掩。现在的所有特征参数不能取得很好的效果。目前,被研究人员认为最稳定的特征是行人的轮廓,因此很多研究人员都将重点放在了提取行人的轮廓信息。

第二类为基于多部位的方法,就是分别取检测人的各个部位,然后综合起来判断是否是行人。通过一定的算法,来分析各个部位的关系,从而判断是否为行人目标。当行人在行走过程中发生部分遮掩,使用该类方法能够很好的解决,而且处理效果要比第一类方法好许多。但是,该类方法的核心在于,如何通过一个有效的机制,将各部分的检测结果合成一个整体,来判断是否为检测的目标。

受到人脸识别的启发,将人脸的正侧面分别作为训练样本,减少类内差别,可以使训练难度降低。在这里,我们可以将行人分为正面和侧面,按照类似的处理方法,同样得到了一定的成果。但是,在无形之中需要增加很多的训练样本值,使得工作量变大很多。但是处理效果很好。

2.2 基于特征的方法

2.2.1 wavelet特征

在1997年,机器学习的思想被Oren[18]第一次引进到行人检测领域,该方法的大致是通过大量的训练样本,然后对样本进行学习,形成合适的模型,使得机器能够通过自动学习来建立模型。这种方法使行人检测取得了很大的突破,开创了行人检测的新局面。但是随着时间的变化,行人检测的技术在不断的发展,该算法的效果并不能满足人们的要求。理解它,可以帮助我们很好的学习后续的复杂的算法。

该方法的提出主要有以下的贡献:第一,该方法实验结果表明,在行人检测领域引入机器学习是很有必要的通过吧一些简单的特征进行分类训练,然后加以分类是一个很好的方案。第二,该方法对负样本的规范定义,在Oren提出该方法之前,负样本还没用统一的标准。如何选取准确的负样本,是许多研究人员关心的问题,但是一直都没有

找到很好的方案。由于这种方法的出现,负样本的训练对系统的益处大大地增加。在此之后,许多研究人员沿着这一方向继续研究,并出现了新算法。

2.2.2 Adaboost 算法

Adaboost算法是通过改变数据的分布实现的,是一种迭代算法。在每次进行训练之前,都会对之前所有训练的样本进行初始化权重,判断上一轮分类器的总体准确率。在对样本就行训练时,对完全能够准确分类的样本,就降低它的权值。在下一轮训练时,被选中的概率就会降低。与之相反的是,如果被判断错误的分类样本,在下一次训练时,被选中作为样本的概率就会变大。这样,在每次训练时,都会训练上一次被判断为错误分类的样本,学习了正确的样本。最终由各个弱分类器级联成强分类器。Adaboost算法不仅有计算效率高,弱分类器的兼容性好、参数少等特点被广泛应用。

2.2.3 shapelet特征

该算法是基于boosting算法进行两次处理。第一次提取一些简单的的特征,然后对提取出的特征进行训练,将训练的结果进行加权,得到shapelet。接下来第二次,是将得到的shapelet通过训练器再进行训练,得到最终的训练分类器。该算法的优点在于,通过简单的特征作为基础,通过学习、训练得到比较好的训练分类器。因此该算法的性能比较良好,在检测效率上,shapelet也高于与之相似的edgelet算法,应用也很广泛。

2.3 基于多部位的方法

2.3.1 自适应组合分类器

首先,该算法将人分为头肩、左肩、右肩和下半身四个部分,然后利用算法分别训练出每个部位的模型,得到各自的分类器。该算法使用了基于小波的算法,但是特征的维数更高,因此性能也有了一定的提升。然后将这四个分类器的参数作为最终分类器的参数输入,利用算法再做训练,得到最终分类器的模型。需要指出的是,必须在一定范围内对四个部位的分类器进行搜索,得到最优的返回值。

2.3.2 基于贝叶斯推断的组合算法

基于贝叶斯推断的方法是由Bo Wu从概率角度出发提出的,然后通过一系列计算,得到最大概率解。在这个算法中,将人分成头肩、躯干、腿部三个主要部分。类似于2.3.1的方法,首先,对检测对象的三个部位进行训练,得到训练分类器,并进行检测。最后,将各个部分得到的实验结果比较分析,以贝叶斯为依据来判断是否出现了行人。

2.3.3 隐式形状模型

该算法在训练阶段,首先建立图片块字典,也就是为所有的图片块建一个索引。随后,要得到图片块的任何信息时,通过前面建立的索引,进行查询。首先,我们需要获得在兴趣点附近的图片信息,并在对应的字典中找到相应的匹配项,通过比对相关信息,对中心位置进行分析即投票。毋庸置疑,那些得到票数最高将作为结果。最后,分析实验数据,确定实验结果。

2.4 基于多视角的方法

基于多视角的方法在人脸识别的领域应用很广泛,但是将该方法引入行人检测方向的方法目前还不是很多。这是因为在不同视角下,人脸的差别是很大,但是对于行人来讲该特征确要小很多。另外,目前的训练样本还不够充足,不能得到理想的试验效果。目前多视角的方法有以下几种:

第一种方法是对于视角的差异,我们并不做不同处理,而是将它们统一处理。正因为这样处理,这种方法的难点是假如不同的视角的物体差别很大,那将导致类间差别很大,使得训练出来的分类器是无效的。对于行人来说,有些情况很特殊,虽然各个视角的行人也有差别。但是那些差别还不足以导致训练无法正常进行,例如一些基于特征的方法,并没有考虑多视角问题,但是检测效果和识别效果一样很好。

第二种方法是通过视角将样本进行分开,将不同分组的样本分别训练成一个个分类器,并分别检测所有的分类器。这个方法的弊端在于,视角分的越多复杂度就越大,并且大大增加了人工的负担。

第三种方法是提取不同视角之间的共同特点,这样可以降低算法的复杂度,提高速度。这类方法不仅考虑了多视角的行人特征的不同,也考虑到了视角分类太多类内变化大的缺点。因此,第三种方法是目前研究的大趋势。现在,基于树的结构的分类器已经受到了越来越多人的关注,因为它可以处理不同的试验样本,提高了系统的性能。这样既可以有效的避免类内变化大的缺点,又可以解决视角特征不同带来的误差,这样的可以大大缩减算法的复杂度。

3 基于HOG特征的行人检测

3.1 引言

行人检测的目标是将每一帧图像中行人识别出来,并得到其空间位置。由于描述行人的方法不同,一般将行人检测算法分为以下三类:基于特征表述的方法、基于模板匹配的方法、基于纹理和形状结合的方法。另一种划分方式是根据将行人是否作为整体进行检测,可以分为基于整体的检测和基于部位的检测。前面我们在第二章已经学习到了HOG算法,在这一章,我们将进一步研究HOG算法。首先,我们需要对每帧图像进行特征提取,然后将提取的特征训练生成分类器。根据提取特征的映射分类不同,分类器模型有可以分为判别模型和生成模型。由于利用的是特征之间的近似性,生成模型主要从统计分类学角度计算特征的联合概率。它所针对的是特征之间的相似性,与之相反的是判别模型,判别模型是根据特征之间的差异性进行的。在训练分类的过程中,不停寻找不同特征所对应的最优分类方法。

判别模式最典型的代表是SVM算法,该方法从样本学习带检测,目标的相关分类特征。经过样本学习、样本训练之后,生成最优的分类面,在不同环境条件下,SVM均有比较好的适应性。目前,针对SVM算法进行改进的算法很多,该算法的优越性使之越来越流行。

3.2 HOG特征原理

3.2.1 HOG特征算法思想

2005年,Dalal在CVPR会议上提出方向梯度直方图(HOG),该算法的特征是通过统计和计算图像局部区域的HOG来获取的,在图像处理与识别领域被称为描述物体的特征算子。

该算法的核心思想为:假设训练的样本大小为 64*64 像素。第一步,将该64*64像素的样本划分成小的连通区域即cell,每个cell的大小不妨设为 8*8 像素,这样样本图像就被划分成 8×8=64 个cell。二步将每个cell中的各像素点的边缘或者梯度的直方图采集出来。接下来把这些采集来的直方图进行整合形成特征描述算子。然而为了提高HOG算法的性能,一般将相邻的4个cell划分为一个block。图3-1为 HOG 特征

模板,其中宽W:H之比为1:1。

图3-1 HOG特征模板

随着每个细胞单元的滑动而形成block,block每一次滑动一个cell的宽度,对于一个64*64的图我们可以得到49个block。图3-2是描述block与cell的关系:

图3-2 block与cell的关系

在划分大小为8*8像素的cell后,接下来采用9个bin的直方图去统计cell的每个像素的梯度信息。用梯度方向对cell内每个像素在直方图中进行加权投影,就得到了该cell的梯度方向直方图,如图3-3所示。最后将各个cell组合成大的、连通的blocks。就这样,在一个 block 内四个 cell 的特征向量可以串联起来就可以得到该block 的 HOG 特征。因此,每个cell的特征以不同的特征出现在最终的HOG特征向量中。归一化之后的block描述符就是 HOG 特征描述算子。

图3-3 梯度划分

3.2.2 HOG特征算法的实现

HOG特征算法实现用下面流程图如图3-4表示

图3-4 HOG算法流程图

首先第一步将图片进行归一化处理,由于图片的颜色信息作用并不大,加上压缩处理能够有效的改善图片局部阴影和光照的影响。通常首先将待检测的图片转化为灰度图,压缩公式为:

gamma ),(),(y x I y x I = 3-(1)

其中gamma=1/2;接下来计算进一步计算梯度方向值,这样不仅可以进一步减小光照的影响,而且可以获得图像的各个轮廓,各个像素点的梯度计算公式为:

),1(),1(),(y x H y x H y x G x --+= 3-(2)

)1,()1,(),(--+=y x H y x H y x G y 3-(3)

式中G x (x,y)、G y (x,y)、H(x,y)分别表示输入图片的像素的水平梯度、垂直梯度、和像

素点。像素点(x,y )处得幅度值和梯度方向分别为: 22),(),(),(y x G y x G y x G y x += 3-(4)

)),()

,((tan ),(1y x G y x G y x x y -=α 3-(5)

第三步是计算每个cell 的梯度直方图,并进行规定的权重投影。

第四步是将单一的cell 合成大的block ,并计算块内梯度直方图。用来进一步解决部分关照的变化以及对比度的变化。并且归一化形成HOG 描述符。

第五步是对于每一个重叠block 块内cell 进行对比度归一化,并把所有block 内的直方图向量一起组合成一个大的HOG 特征向量

3.2.3 HOG 特征算法的实验结果

实验一:在正常条件下,行人特征比较明显的条件下,使用标准库的HOG 算法对输入

图片进行处理,结果如图:

图3-5 HOG 检测实验一

从图中可知,在特征明显的条件下,HOG 算法检测效果很好,图中所有人都能够检测出来。

实验二:行人特征为侧面时,HOG算法检测结果如图:

图3-6 HOG检测实验二

从图3-6中的检测结果可以看出,当行人侧面出现,并且身体部分遮掩时,hog算法出现漏检现象。这与检测的精确度有关同时也与样本数量以及行人特征的多样性有关。

实验三:夜间图片检测,检测结果如图:

图3-7 HOG检测实验三

从图中检测结果可知在夜间行人特征不明显的条件下,hog算法检测效果不太好,这因为夜间环境复杂,行人的特征与周围的环境背景很相似,很容易造成漏检的情况。目前这些都是很多学者正在解决的问题。

实验四:当图像像素模糊,但特征明显的情况下,检测的结果,如图所示

图3-8 HOG检测实验四

从图中的检测结果可知,及时像素不太好的情况下,只要行人特征明显,hog检测效果明显。

3.3 HOG特征算法的优缺点

HOG特征算法想对于其他特征描述算法有很多优点。首先,在图片的局部细胞单元格上操作是HOG的一大特点,这样它对图片的光学和几何的变化都有很好的适应性,因此,HOG算法对这两种形变的处理是其他算法无法比拟的。其次,在一些特定环境条件下,只要行人的特征大致上比较明显,即使行人在动作特征上有一些细小的改变,检测结果也一样不会受到任何的影响。因此,HOG特征算法在行人检测领域特别受欢迎,但是HOG算法设计复杂,训练时间较长,检测时间也很长,给检测带来很大的延时,不符合行人检测实时性的要求。

4 基于HOG和SVM的行人检测

4.1 引言

经过前两章的介绍,我们对HOG算法和SVM算法有了初步的了解。在这一章,我们将要进一步学习HOG算法和SVM算法。在前两章,我们学习到,HOG算法和SVM算法都有各自的优点和缺点,那么这一章我们将研究如何将二者巧妙的结合,发挥各自的优势,很好的解决在各种条件下,行人检测的效果。使检测的效果更加精确,实时性更高,算法实现更容易。

4.2 SVM分类器的简介

在机器学习中,支持向量机(SVM)是与相关的学习算法有关的监督学习模型,主要用于分类和回归分析。例如现在在一个p维的空间中有两个由一系列的数据形成的数据集合,每个数据仅属于其中一个集合,为了确定新的数据点事属于哪一个集合,支持向量机会将将每一个数据都看成一个p维向量,然后通过计算分类,找出能够将两个数据集合分开的p-1维的超平面。所以支持向量机也叫做线性分类器。还有许多超平面,可能对数据进行分类。如果存在一个超平面使所有的数据不出错地分类,同时每类数据与超平面的距离最近的向量距离最大,那么这个超平面称之为最优超平面。基于SVM的算法不仅有运算速度快的优点,而且实现较容易、运算效率高的特点,但是SVM算法也有一些不足之处:(1)通常,行人检测中的正样本和负样本在数量上有很大的不同,就会出现样本不均衡的问题,分类器的分类面偏向于样本少的一方,而过于关注样本多的一方,这样会使分类器的精度大大降低。(2)由于过于关注弱分类器的精度,这样导致过拟合现象。

4.3 HOG和SVM的改进及结合

通常SVM 算法关注的是在正样本和负样本数量相隔不大条件下的问题,但是当正样本和负样本数量相差很大时,直接使用 SVM 算法,会导致降分类器的分类精度降低很多。针对这一问题,本文做的的处理是,首先通过HOG特征提取足够的正负样本,通过大量HOG提取的样本并使用SVM进行分类,这样可以解决分类器处理精度,进而提高行人检测的精度。通过HOG特征提取的训练样本可以很好适应各种情况下检测和识别。

其次,通过HOG特征提取的样本投入SVM分类器进行样本训练。通过将大量的正负样本进行训练,可以得到model,然后由得到的model生成检测因子,接下来使用生成的检测因子去检测负样本,得到hardexample,最后提取hardexample中的hog特征,并与hog特征的负样本一起投入训练生成最终的检测因子。

改进的hog+svm算法,通过增加训练的样本、改进hog算法的各种参数,以及改善svm分类器的各个参数,这样可以达到两种算法结合的最优状态。检测的效果可以适应各种环境,并且检测速度也更加迅速,实时性更强。

4.4 实验过程及处理

整个实验过程大致如图4-1所示:

图4-1 实验结果流程图

实验过程中的部分正负样本如图4-2、图4-3,实验过程中的代码部分见附录。

图4-2 训练的正样本

图4-3 训练的负样本

4.5 实验结果及分析

实验一:在正常条件下,行人特征比较明显的条件下,使用本文算法对图片就行检测得到如下结果:

图4-4 实验一结果

从图中我们可以看到,检测矩形窗口很好地识别了每一位行人,当然,在这里所有人的特征比较明显,并且背景干扰也比较小。因此在整个处理效果上是非常好的,并且也比较符合通常的行人特征。同时也说明了本文所涉及的算法的检测效果是非常好的,在正常情况下,不会产生错误的识别或者漏掉一些行人。并且训练时间比HOG算法短了许多,检测时间实时性更高。

实验二:行人侧面特征检测效果。从图中我们看到,被摄像头侧面抓拍的行人,在经过HOG+SVM算法处理之后,可以准确的识别出来。同时,我们也能注意到距离较远的两个行人并未识别。这与算法本身精度有关,以及那两位行人距离较远特征识别不明

显,导致漏检。

图4-5 实验二结果图

实验三:在图片清晰度不高的条件下,训练特征对图片的检测效果。

图4-6 实验三结果图

从图中检测的结果,我们可以轻易的看出即使在图片清晰度不高的条件下,只要行人的特征比较明显,本文的算法检测显示了极大的优势,在较短时间里就能完全识别所有行人。HOG+SVM显示了其良好的性能及处理的效果。比较符合实际生活中各种情况下的行人检测,因此该算法兼备了HOG和SVM特征的优点,同时,我在设计算法时巧妙的选取合适的参数,是的处理精度更加完善。

实验四:在此实验中,我选取得图片是一张夜间行人图片,用于对比分析白天的处理效果。在夜间,图像的亮度和光度较差,很容易造成误检以及漏检,夜间的背景环境也比白天复杂的多。处理效果如图所示:

图 4-7 实验四结果图

从图中可以看到,左边两个人被楼检了,分析其原因,有两点。第一,在夜间灯光不明显,图片本身效果比较差,导致训练样本在检测图片时出现了漏检。第二,两个均穿的黑色的衣服,整体效果与左边墙体相融,导致特征判断出现错误,误将行人当成墙体。对于处理这一类问题,目前有许多研究人员正在进行研究,都在尝试找到最好的解决方法去改善特征不明显,被误判漏检的情况。

将改进的HOG+SVM算法在INRIA库上进行测试,测试结果如图4-8:

图4-8 HOG+SVM在INRIA库上测试结果

经过多次试验,通过本文改进的算法检测各种环境下大量的行人图片,我们经过对

比,我们会发现,改进后的HOG+SVM,不仅在精确度上有了很好的改善而且在检测时间大大减小。改进后的算法在检测准确度上为95%,基本处于误差允许范围内,充分说明本文改进的算法的性能较好。

5 总结与展望

随着计算机科学技术与计算机视觉技术的发展,行人检测技术会越来越成熟。在计算机技术高速发展的今天,机器学习更加智能,在生活各个方面,都会应用行人检测技术。比如,智能交通方面、交通安全领域、公共场所的智能监控等各个领域都会涉及行人检测技术。因此,行人检测技术会不断发展,识别和检测的精度会越来越高,处理的速度会越来越快,这必将是一个趋势,行人检测技术必将更好的造福于我们每一个人。

在本文中,我们首先介绍了行人检测的相关技术,以及目前存在的主流算法,以及研究的成果。接着,我介绍了目前行人检测的主要相关算法,并对各个算法进行了比较。随后,我们介绍了HOG+SVM算法,并在本文中进行了改进。最后使用我们改进的算法处理具有各种特征的行人图片,并对处理结果进行了分析与对比。

简单来讲,本论文的创新点在于以下几点:

1、在本文中,通过使用HOG特征,SVM分类器结合的方法来实现行人检测。

2、通过改进HOG特征与SVM分类器,是结合的算法有更好的兼容性,并发挥各自算法的优点,使得识别效果与检测效果更加良好。

3、改进后的算法不仅具备检测精度高,整体的识别效果也更加完备,实时性更强,检测时间和训练时间都有减短。

但是,本文所研究的HOG+SVM算法仍有一些不足,虽然这一改进的算法在处理速度和精度上有了很好的提高,但是在一些条件下,比如对黑夜里拍摄的图片,会出现漏检现象,这些问题仍需要进一步解决。

接下来需要进一步的研究有两个方面,一是找到更好的特征算法,以提供检测的精度,能够很好的解决漏检现象;二是找到更好的的算法,在检测之后,使用更好的算法来判断和评估特征是否符合。

参考文献

[1]Xu F L ,Liu X, Fujimura K. Pedestrian detection and tracking with night vision [J] . IEEE Transactions on Intelligent Transportation Systems ,2005 ,6

(1) :63 - 71

[2]Zhao L , Thorpe C. Stereo and neural network2based pedestrian detection [J] . IEEE Transactions on Intelligent Transportation Systems ,2000 ,1 (3) :148 - 154 [3]Mohan A , Papageorgiou C , Poggio T. Example2based object detection in images by components [J] . IEEE Transactions on Pattern Analysis and Machine Intelligence , 2001 ,23(4) :349 – 361

[4]贾慧星,章毓晋. 车辆辅助驾驶系统中基于计算机视觉的行人检测研究综述[J] . 自动化学报,2007 ,33 (1) :84 - 90

[5] Gavrila D M. Pedestrian detection from a moving vehicle [A] .Proceedings of European conference on Computer Vision[C] .London ,UK:Springer ,2000. 1843.

37 - 49

[6] Bertozzi M ,Broggi A ,Lasagni A , Rose M D. Infrared stereo vision-based pedestrian detection[A] . Proceedings of IEEE International Conference on Intelligent Vehicles Symposium[ C] .Las Vegas ,USA :IEEE ,2005. 24 - 29

[7]Lipton A. Local application of optic flow to analyze rigid versus non2rigid motion[A]. Proceedings of International Conference on Computer Vision Workshop on Frame-RateVision[C]. Corfu, Greece : IEEE, 1999 ,

https://www.360docs.net/doc/c02214120.html,/pubs/pub-2934.html.

[8]Heisele B ,Wohler C. Motion-based recognition of pedestrians[A] . Proceedings of IEEE International Conference on PatternRecognition[C] . Brisbane , Australia : IEEE , 1998. 2. 1325 -1330

[9] Wohler C,Anlanf J K.Real-time object recognition on image sequences with the adaptable time delay neural network algorithm—applications for autonomous vehicles[J].

Image and Vision Computing,2001,19(9/10):593.618

[10]Tian Q M ,Sun H,Luo Y P , Hu D C. Nighttime pedestrian detection with a normal camera using SVM classifier [A] . Proceedings of International Symposium on Neural Networks [ C ] .Chongqing ,China :Springer ,2005. 3497. 189 - 194 [11]Viola P ,J ones M ,Snow D. Detecting pedestrians using patterns of motion and appearance [A] . Proceedings of International Conference on Computer Vision

[C] . Washington DC , USA :IEEE ,2003. 734 - 741

[12] 王根岭行人检测与跟踪中若干关键技术的研究[D],浙江理工大学,2014

[13] 石娟峰基于视频的行人检测和跟踪[D],北京邮电大学,2012

[14] 周千昊自然背景下的行人检测[D],上海交通大学,2009

[15] 徐翠基于计算机视觉的汽车安全辅助驾驶若干关键问题研究[D],中国科学技术大学,2009

[16] Gavrila D M, ABayesian, Exemplar pedestrian detection: survey and experiments. IEEE Pattern Analysis and Machine Intelligence, 2009

恶意代码技术和检测方法

恶意代码及其检测技术 1.恶意代码概述 1.1定义 恶意代码也可以称为Malware,目前已经有许多定义。例如Ed Skoudis将Malware定义为运行在计算机上,使系统按照攻击者的意愿执行任务的一组指令。微软“计算机病毒防护指南”中奖术语“恶意软件”用作一个集合名词,指代故意在计算机系统上执行恶意任务的病毒、蠕虫和特洛伊木马。随着网络和计算机技术的快速发展,恶意代码的传播速度也已超出人们想象,特别是人们可以直接从网站获得恶意代码源码或通过网络交流代码。很多编程爱好者把自己编写的恶意代码放在网上公开讨论,发布自己的研究成果,直接推动了恶意代码编写技术发展。所以目前网络上流行的恶意代码及其变种层出不穷,攻击特点多样化。 1.2类型 按照恶意代码的运行特点,可以将其分为两类:需要宿主的程序和独立运行的程序。前者实际上是程序片段,他们不能脱离某些特定的应用程序或系统环境而独立存在;而独立程序是完整的程序,操作系统能够调度和运行他们;按照恶意代码的传播特点,还可以把恶意程序分成不能自我复制和能够自我复制的两类。不能自我复制的是程序片段,当调用主程序完成特定功能时,就会激活它们;能够自我复制的可能是程序片段(如病毒),也可能是一个独立的程序(如蠕虫)。

2.分析与检测的方法 恶意代码与其检测是一个猫捉老鼠的游戏,单从检测的角度来说。反恶意代码的脚步总是落后于恶意代码的发展,是被动的.目前基于主机的恶意代码检测方法主要有反恶意代码软件、完整性校验法以及手动检测,基于网络的检测方法主要有基于神经网络”、基于模糊识别“等方法,本文主要讨论基于主机的检测。 2.1 恶意代码分析方法 2.1.1 静态分析方法 是指在不执行二进制程序的条件下进行分析,如反汇编分析,源代码分析,二进制统计分析,反编译等,属于逆向工程分析方法。 (1)静态反汇编分析,是指分析人员借助调试器来对而已代码样本进行反汇编出来的程序清单上根据汇编指令码和提示信息着手分析。 (2)静态源代码分析,在拥有二进制程序的源代码的前提下,通过分析源代码来理解程序的功能、流程、逻辑判定以及程序的企图等。 (3)反编译分析,是指经过优化的机器代码恢复到源代码形式,再对源代码进行程序执行流程的分析。 2.1.2 动态分析方法 是指恶意代码执行的情况下利用程序调试工具对恶意代码实施跟踪和观察,确定恶意代码的工作过程对静态分析结果进行验证。

维生素E检测方法研究

液相色谱法检测的生育酚方法报告 一、生育酚简介 又称维生素E,是一种脂溶性维生素,是最主要的抗氧化剂之一。溶于脂肪和乙醇等有机溶剂中,不溶于水,对热、酸稳定,对碱不稳定,对氧敏感,对热不敏感。 维生素E为微带粘性的淡黄色油状物,在无氧条件下较为稳定,甚至加热至200℃以上也不被破坏。但在空气中维生素E极易被氧化,颜色变深。维生素E易于氧化,故能保护其他易被氧化的物质(如维生素A及不饱和脂肪酸等)不被破坏。 维生素E的化学名称为(1)-2、5、7、8-四甲基2-(-4、8、12-三甲基十三烷基)-6-苯并二氢吡喃醇醋酸酯,分子式为C31H52O3,结构式为: 根据其化学结构可分为生育酚及生育三烯酚两类。生育酚主要有四种衍生物,按甲基位置分为α、β、γ和δ四种。其中,α-生育酚:R1,R2=CH3;β-生育酚:R1=H,R2=CH3;γ-生育酚:R1=CH3,R2=H;δ-生育酚:R1,R2=H。维生素E以α-生育酚生理活性最高,β-及γ-生育酚仅为α-生育酚的40%和8%。 二、色谱方法的选择 现行标准中维生素E的检测仅有两个标准——《食品中维生素A和维生素E的测定》(GB/T 5009.82-2003)和《食用植物油中维生素E组分和含量的测定高效液相色谱法》(NY/T 1598-2008),其中前者介绍了液相色谱法和比色法两种方法。 目前有的文献[1]中指出,气相色谱法虽能正确定量维生素E,但是对不同型分离困难,为了使α-维生素E与β-维生素E及γ-维生素E分离,预先要将试样进行三甲基硅烷化或酯化,同时胆同醇等硬脂类对测定有干扰。另外,如果前期样品处理不好,很容易对毛细管柱造成污染。故建议使用液相色谱法。 三、内标法和外标法的选择 1、两种方法的区别: 内标法外标法内标物与待测物相似,且均出峰不需要 标准曲线需要,可两点需要,需多点 优点定量准确操作简便 缺点不容易选择内标物;操作精度高与标准品严格相同的操作条件 2、在《食品中维生素A和维生素E的测定》中采用了内标法,内标物为苯并[a]芘,另外 文献中也有使用正三十二烷及十六酸十六醇酯等。《食用植物油中维生素E组分和含量的测定高效液相色谱法》中使用的外标法,国内大多数检测维生素E的文献中都用的是外标法。根据我部门的实际情况,维生素E的检测一般用于豆油脂肪酸的日常检测和协助营销部门的发货定价,故精度要求不是非常高,而内标法每次检测需用到内标物,而内标物的成本通常偏高,因此,外标法可以满足我部门日常检测的需求。

人脸识别技术的主要研究方法

1、绪论 人脸识别是通过分析脸部器官的唯一形状和位置来进行身份鉴别。人脸识别是一种重要的生物特征识别技术,应用非常广泛。与其它身份识别方法相比,人脸识别具有直接、友好和方便等特点,因而,人脸识别问题的研究不仅有重要的应用价值,而且在模式识别中具有重要的理论意义,目前人脸识别已成为当前模式识别和人工智能领域的研究热点。本章将简单介绍几种人脸识别技术的研究方法。 关键词:人脸识别 2、人脸识别技术的主要研究方法 目前在国内和国外研究人脸识别的方法有很多,常用的方法有:基于几何特征的人脸识别方法、基于代数特征的人脸识别方法、基于连接机制的人脸识别方法以及基于三维数据的人脸识别方法。人脸识别流程图如图2.1所示: 图2.1人脸识别流程图 3、基于几何特征的人脸识别方法 基于特征的方法是一种自下而上的人脸检测方法,由于人眼可以将人脸在不此研究人员认为有一个潜在的假设:人脸或人脸的部件可能具有在各种条件下都不会改变的特征或属性,如形状、肤色、纹理、边缘信息等。基于特征的方法的目标就是寻找上述这些不变特征,并利用这些特征来定位入脸。这类方法在特定的环境下非常有效且检测速度较高,对人脸姿态、表情、旋转都不敏感。但是由于人脸部件的提取通常都借助于边缘算子,因此,这类方法对图像质量要求较高,对光照和背景等有较高的要求,因为光照、噪音、阴影都极有可能破坏人脸部件的边缘,从而影响算法的有效性。 模板匹配算法首先需要人TN作标准模板(固定模板)或将模板先行参数化(可变模板),然后在检测人脸时,计算输入图像与模板之间的相关值,这个相关值通常都是独立计算脸部轮廓、眼睛、鼻子和嘴各自的匹配程度后得出的综合描述,最后再根据相关值和预先设定的阈值来确定图像中是否存在人脸。基于可变模板的人脸检测算法比固定模板算法检测效果要好很多,但是它仍不能有效地处理人脸尺度、姿态和形状等方面的变化。 基于外观形状的方法并不对输入图像进行复杂的预处理,也不需要人工的对人脸特征进行分析或是抽取模板,而是通过使用特定的方法(如主成分分析方法(PCA)、支持向量机(SVM)、神经网络方法(ANN)等)对大量的人脸和非人脸样本组成的训练集(一般为了保证训练得到的检测器精度,非人脸样本集的容量要为人脸样本集的两倍以上)进行学习,再将学习而成的模板或者说分类器用于人脸检测。因此,这也是j 种自下而上的方法。这种方法的优点是利用强大的机器学习算法快速稳定地实现了很好的检测结果,并且

基于神经网络的人脸检测方法

基于神经网络的人脸检测方法 摘要:自动人脸检测应用十分广泛,如安全访问控制,基于模型的视频编码或基于内容的视频索引,所以它正在成为一个非常重要的研究课题。在本文中,我们在假设不考虑内容,场景的照明条件,大小,方向和外观的前提下,提出了一种检测复杂图像和精确本地半正面人脸的方法。这就是卷积神经网络结构,这种方法不像其他系统,其他系统需要一个手工检测的阶段或特征分类阶段。卷积神经网络结构是从一个大的训练集中自动合成自己的一套特征提取方法,所以它可以直接从未预处理的照片中提取变化的人脸模型,而且可以在神经元模型中利用感受区域,共享权数和空间采样对人脸进行一定程度的旋转,缩放和变形。我们将会对我们的结构,研究策略和检测过程进行详细的描述。最后我们将证明在环境和人脸变化的情况下这种方法相当稳健,具有精确检测的能力。 1简介 因为其广泛的应用范围,人脸检测正在成为一个非常重要的的研究课题。比如在安全访问控制,基于模型的视频编码,基于内容的视频索引等方面。相对于人脸检测,脸部识别和表情分析算法已经得到学术方面的足够关注。近年来,在光线,面部表情和姿势微小变化的情况下,对人脸的识别已经取得相当大的进展。在[1]中你会发现一个现象。就是大多数的人脸识别和表情分析算法是在特定条件下得到的,要么是在同一背景下要么是出现过的图像要么直接是“人脸照片”,在这种情况下,人脸识别相对比较容易。然而,多数情况人脸检测是在复杂的场景下,这并不简单。由于面部表情,表现力和方位的改变面部模型也会呈现巨大的变化。 最近一些检测非人脸照片的技术已经得到了提高。这些方法可大致分为三大类:本地的面部特征检测,模板匹配和图像不变性。第一种方法,低层次的计算机视觉算法[3,7,13]用于检测的面部特征,如眼睛,嘴巴,鼻子,下巴和其他特征部位。第二种方法,几个相关模板用来进一步检测本地特征。这些人脸特征将被作为硬性模板(基于eigenspaces [8])或(模板 [12, 5])。这些方法有很大的缺点,就是即使是很小的约束全局条件被改变也会对人脸模型和提取特征造成强烈的影响,比如噪声,表情的变化和焦点的改变等。最后一种方法,即使在不同的成像条件下图像不变方案也假定图像存在一定空间关系,比如亮度分布,相似点,人脸模型[10]的唯一性。在场景不受限制的情况下,这些算法都不是很健壮。 肤色信息的使用是制约搜索空间的一个重要线索。在[4]中,Garcia and Tziritas提出一个快速检测到人脸的方法,即皮肤颜色过滤和概率分布方法,而所用到的统计数据是从小波包中分解提取得到的。在[5]中,Garcia 将可变的脸部模板进行扩展,从而使这种方法可以精确的定位面部特征。 对于一般灰度图像,不需要遵守人为设定的规则,事实证明,类似于[11,9]中提到的基于神经网络的方法,效果最好。在本文中,我们提出一种新的检测方法,这种方法是基于神经网络的检测方法,这种方法可以对复杂的照片即使是半正面的人脸进行准确的检测。不需要考虑场景的照明条件,人脸大小,方向和人的外貌特征等因素。

行人检测与跟踪国内外研究现状

行人检测与跟踪国内外研究现状 1.2行人检测与跟踪国内外研究现状 视觉跟踪和目标检测是计算机视觉领域内较早开始的研究方向。经过几十年的积累,这两个方向已经取得了显著的发展。然而,很多方法只是在相对较好地程度上解决了一些关键问题。并且仍旧有不少一般性的关键问题未得到有效的解决。国内外很多研究机构都在致力于研究和发展这两个方向。近些年这两个方向持续发展,涌现了很多比较优秀的方法。国外的很多大学和研究机构(如卡内基梅隆大学、南加州大学和法国国家计算机科学与控制研究所等)都有计算机视觉小组,长期地研究视频跟踪和目标检测。国内的很多大学和研究所等(如清华大学、上海交大和自动化所等)也有相关的研究小组,并取得了一些优秀的研究成果。 1.2.1行人检测技术国内外研究现状 中科院计算机科学重点实验室孙庆杰等人利用基于侧影的人体模型及其对应的概率模型,提出了一种基于矩形拟合的人体检测算法。中科院自动化所谭铁牛等对人运动进行视觉分析,其核心是利用计算机视觉技术从图像序列中检测、跟踪、识别人并对其行为进行理解与描述,它主要应用在视觉监控领域和基于步态的身份鉴定。步态识别就是根据人们走路的姿势进行身份鉴定,依据人体行走运动很大程度上依赖于轮廓随着时间的形状变化的直观想法,提出一种基于时空轮廓分析的步态识别算法;基于行走运动的关节角度变化包含着丰富的个体识别信息的思想,提出一种基于模型的步态识别算法。实验结果表明该算法不仅获得了令人鼓舞的识别性能,而且拥有相对较低的计算代价。但是该方法只能检测出运动的行人。 西安交通大学郑南宁等研究了利用支持向量机识别行人的方法,通过稀疏Gabor滤波器提取行人样本图像中行人的特征,然后利用支持向量机来训练所提取的样本特征,并用训练得到的分类器通过遍历图像的方式将图像中可能属于行人的窗口提取出来。尽管用Gabor滤波器提取特征效果相对较好,但耗时很长,不适合于实时图像的处理。 上海交通大学田广等提出了一种coarse-to-fine的行人检测方法,将一个人建模成人体自然部位的组装,人体的所有部位包括头肩、躯干和腿、采用绝对值类Haar特征集和Edgelet特征集,在这些特征集上,采用softcascade训练各个部位的检测器和全身检测器。首先采用全身检测器在整个图像中产生候选行人区域,然后用基于贝叶斯决策的组合算法进一步确定候选区域中的行人。实验结果表明该算法有很好的检测性能能在杂乱的自然场景中有效的检测行人。但该方法的识别率是78.3%,识别率不高,且该模型比较难构建,模型求解也比较复杂。 目前,在国外许多文献中提出了基于机器视觉的行人检测方法,意大利帕尔玛大学的AlbertoBroggi教授在ARGO项目中采用一种基于外形的行人检测算法。算法首先根据行人相对于垂直轴有很强的垂直边缘对称性、尺寸和外貌比例等在

人脸识别的主要方法

1.1 人脸识别的主要方法 目前,国内外人脸识别的方法很多,并且不断有新的研究成果出现。人脸识别的方法根据研究角度的不同,有不同的分类方法。根据输入图像中人脸的角度不同,可以分为正面,侧面,倾斜的人脸图像的识别;根据图像来源的不同,可分为静态和动态的人脸识别;根据输入图像的特点,又可分为灰度图像和彩色图像的人脸识别等等。本文重点研究基于正面的、静态的灰度图像的识别方法。 对于静态的人脸识别方法从总体上看可以分为三大类:一是基于统计的识别方法,主要包括特征脸(Eigenface)方法和隐马尔科夫模型(Hidden Markov Model 简称HMM)方法等;二是基于连接机制的识别方法,包括人工神经网路(Artifical Neural Network 简称ANN)方法和弹性图匹配(Elastic Bunch Graph Matching 简称EBGM)方法等;三是一些其他的综合方法及处理非二维灰度图像的方法。下面分别进行介绍。 1.1.1 基于特征脸的方法 特征脸方法[5],又称为主成份分析法(Principal Component Analysis 简称PCA),它是20 世纪90 年代初期由Turk 和Pentland 提出的,是一种经典的算法。它根据图像的统计特征进行正交变换(即K-L 变换),以消除原有向量各个分量之间的相关性。变换得到对应特征值依次递减的特征向量,即特征脸。 特征脸方法的基本思想是将图像经过K-L 变换后由高维向量转换为低维向量,并形成低维线性向量空间,利用人脸投影到这个低维空间所得到的投影系数作为识别的特征矢量。这样,就产生了一个由“特征脸”矢量张成的子空间,称为“人脸子空间”或“特征子空间”,每一幅人脸图像向其投影都可以获得一组坐标系数,这组坐标系数表明了人脸在子空间中的位置,因此利用特征脸方法可以重建和识别人脸。 通过人脸向量向特征子空间作投影得到的向量称之为主分量或特征主分量。主分量特征

人脸识别技术的主要研究方法

人脸识别技术的主要研 究方法 The manuscript was revised on the evening of 2021

1、绪论 人脸识别是通过分析脸部器官的唯一形状和位置来进行身份鉴别。人脸识别是一种重要的生物特征识别技术,应用非常广泛。与其它身份识别方法相比,人脸识别具有直接、友好和方便等特点,因而,人脸识别问题的研究不仅有重要的应用价值,而且在模式识别中具有重要的理论意义,目前人脸识别已成为当前模式识别和人工智能领域的研究热点。本章将简单介绍几种人脸识别技术的研究方法。 关键词:人脸识别 2、人脸识别技术的主要研究方法 目前在国内和国外研究人脸识别的方法有很多,常用的方法有:基于几何特征的人脸识别方法、基于代数特征的人脸识别方法、基于连接机制的人脸识别方法以及基于三维数据的人脸识别方法。人脸识别流程图如图2.1所示: 图2.1人脸识别流程图 3、基于几何特征的人脸识别方法 基于特征的方法是一种自下而上的人脸检测方法,由于人眼可以将人脸在不此研究人员认为有一个潜在的假设:人脸或人脸的部件可能具有在各种条件下都不会改变的特征或属性,如形状、肤色、纹理、边缘信息等。基于特征的方法的目标就是寻找上述这些不变特征,并利用这些特征来定位入脸。这类方法在特定的环境下非常有效且检测速度较高,对人脸姿态、表情、旋转都不敏感。但是由于人脸部件的提取通常都借助于边缘算子,因此,这类方法对图像质量要求较高,对光照和背景等有较高的要求,因为光照、噪音、阴影都极有可能破坏人脸部件的边缘,从而影响算法的有效性。 模板匹配算法首先需要人TN作标准模板(固定模板)或将模板先行参数化(可变模板),然后在检测人脸时,计算输入图像与模板之间的相关值,这个相关值通常都是独立计算脸部轮廓、眼睛、鼻子和嘴各自的匹配程度后得出的综合描述,最后再根据相关值和预先设定的阈值来确定图像中是否存在人脸。基于可变模板的人脸检测算法比固定模板算法检测效果要好很多,但是它仍不能有效地处理人脸尺度、姿态和形状等方面的变化。 基于外观形状的方法并不对输入图像进行复杂的预处理,也不需要人工的对人脸特征进行分析或是抽取模板,而是通过使用特定的方法(如主成分分析方法(PCA)、支持向量机(SVM)、神经网络方法(ANN)等)对大量的人脸和非人脸样本组成的训练集(一般为了保证训练得到的检测器精度,非人脸样本集的容量要为人脸样本集的两倍以上)进行学习,再将学习而成的模板或者说分类器用于人脸检测。因此,这也是j种自下而上的方法。这种方法的优点是利用强大的机器学习算法快速稳定地实现了很好的检测结果,并且该方法在复杂背景下,多姿态的人脸图像中也能得到有效的检测结果。但是这种方法通常需要遍历整个图片才能得到检测结果,并且在训练过程中需要大量的人脸与非人脸样本,以及较长的训练时间。近几年来,针对该方法的人脸检测研究相对比较活跃。 4、基于代数特征的人脸识别方法

行人检测方法研究

1绪论 1.1 研究背景 在信息高速发展的今天,几乎所有领域都离不开计算机,在满足人们的习惯方式和生活习惯下,让计算机进行很好的通信,是计算机智能的一个必备的条件。 其中,计算机智能视觉是其应用的重要方向,它是研究使用各种成像输入设备替换人类视觉器官的领域叫智能视觉,并使用智能设备来替代人们完成识别和分析。让智能设备能够像人类一样观察和理解是人们研究计算机视觉,而且智能设备还能随着环境的变化而做出相应的改变。行人检测是计算机视觉的一个具体表现形式,并应用在以下方面:智能监控 目前,为了防止财产安全和留下有效的证据,大部分的公众场所都装备了摄像监控设备。但是,这些监控设备大部分还是有专人进行的查看的,这会导致以下问题的出现,一方面长时间的监控,监控人员很可能出现疲惫,可能导致某些重要信息的遗漏,另一方面不能充分的把监控信息利用起来。然而人工的不足可以利用行人检测相关技术很好的解决,这样不仅可以减少各种资源的投入,又可以让监控的精确度得到很好的改善,当遇到紧急情况有可以及时预警。 车辆辅助系统 随着社会的发展,人民的经济水平不断提高,汽车逐渐走入了千家万户,然而汽车数量的急剧增长也导致了频繁的交通事故,无情的夺去了人们的生命财产安全。如果我们将行人检测系统加入到汽车控制系统中,这样在行驶过程中车辆附近的人们可以被识别出来,极大了避免的交通事故的发生。这样不仅可以有效的降低交通事故,而且这也可以带来汽车行业的革命式变化。实际上,现在有许多公司已经研制出了无人驾驶的汽车,这些车的使用都需要行人检测技术,当然现在的能智能还没进入市场,目前还在试验当中。 高级人机接口 在21世纪,计算机技术得到了迅猛发展,并且愈加趋于智能化的特点,极大地改变了我们的生活方式。我们不仅要求计算机能够快速准确的接收到外界输入的信息,而且能够高效地对信息进行处理并得到最合适的输出信息,作出的相应的反应。人脸识别技术和物体检测技术的发展,可以很好的帮助计算机去获取和处理外界的信息。这不仅

人脸识别技术的几个主要研究方向

人脸识别技术的几个主要研究方向 1 引言 计算机人脸识别是指基于已知的人脸样本库,利用计算机分析图像和模式识别技术从静态或动态场景中,识别或验证一个或多个人脸。通常识别处理后可得到的基本信息包括人脸的位置、尺度和姿态信息。利用特征提取技术还可进一步抽取出更多的生物特征(如:种族、性别、年龄..) 。计算机人脸识别是目前一个非常活跃的研究课题,它可以广泛应用于保安系统、罪犯识别以及身份证明等重要场合。虽然人类对于人脸的识别能力很强,能够记住并辨识上千个不同的人脸,可是对于计算机则困难多了,其表现在:人脸表情丰富;人脸随年龄的增长而变化;发型、胡须、眼镜等装饰对人脸造成的影响;人脸所成图像受光照、成像角度以及成像距离等影响。 计算机人脸识别技术是近20年发展起来的,90年代更成为科研热点,仅从1990 年到1999年之间,EI 可检索到的相关文献多达数千篇,关于人脸识别的综述也屡屡可见[1] 。自动人脸识别系统包括两个主要技术环节首先是人脸检测和定位,然后是对人脸进行特征提取和识别(匹配)。本文着重介绍人脸识别技术的各类方法,通过对比指出各类方法的优缺点及今后的发展方向。 2 人脸检测和定位 人脸检测和定位即对于给定的一幅图像检测图像中是否有人脸,若有则确定其在图像中的位置,并从背景中分割出来。这是个极富挑战性的问题,因为人脸是非刚体,且人脸在图像中的大小和方向以及人的肤色和纹理等方面有很大的可变形。人脸检测问题主要有四种:(1)对于给定的一幅人脸图像,将其中的人脸定位并给出其位置;(2)在一幅混乱的单色场景图中检测出所有的人脸;(3)在彩色图像中检测(定位)所有人脸;(4)在某一视频序列中,检测和定位出所有人脸。文献[2]对人脸检测进行了较为详细的综述,指出常用的人脸检测方法有四种:(1)基于知识的方法;(2)基于人脸固定特征的方法;(3)基于模板匹配的方法;(4)基于外貌的方法(Appearance-based methods),在基于模板匹配的方法中所采用的是预先确定的模板,而在基于外貌的方法中其模板的选择是通过对一系列图像的学习而确定的。一般来说,基于外貌的方法依靠统计和学习技术来找出人脸和非人脸图像的相关特征。在该方法中有特征脸法、基于聚类的方法、神经网络方法和支持向量机的方法。CMU库是常用的人脸检测库,主要的算法评定指标为错误接受率(FAR)和错误拒绝率(ARR)。 3 人脸特征提取和识别 目前大部分研究主要是针对二维正面人脸图像,也有基于三维人脸模型的方法,还有一种所谓的混合系统的身份鉴定系统。 3.1 二维正面人脸识别 在对人脸图像进行特征提取和分类之前一般需要做几何归一化和灰度归一化。几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大

机器视觉的辅助驾驶系统的视频中行人检测跟踪

机器视觉的辅助驾驶系统的视频中行人 实时检测识别研究文献综述 1机器视觉发展 国外机器视觉发展的起点难以准确考证,其大致的发展历程是:20世纪50年代提出机器视觉概念,20世纪70年代真正开始发展,20世纪80年代进入发展正轨,20世纪90年代发展趋于成熟,20世纪90年代后高速发展。在机器视觉发展的历程中,有3个明显的标志点,一是机器视觉最先的应用来自“机器人”的研制,也就是说,机器视觉首先是在机器人的研究中发展起来的;二是20世纪70年代CCD图像传感器的出现,CCD摄像机替代硅靶摄像是机器视觉发展历程中的一个重要转折点;三是20世纪80年代CPU、DSP等图像处理硬件技术的飞速进步,为机器视觉飞速发展提供了基础条件。 国内机器视觉发展的大致历程:真正开始起步是20世纪80年代,20世纪90年代进入发展期,加速发展则是近几年的事情。中国正在成为世界机器视觉发展最活跃的地区之一,其中最主要的原因是中国已经成为全球的加工中心,许许多多先进生产线己经或正在迁移至中国,伴随这些先进生产线的迁移,许多具有国际先进水平的机器视觉系统也进入中国。对这些机器视觉系统的维护和提升而产生的市场需求也将国际机器视觉企业吸引而至,国内的机器视觉企业在与国际机器视觉企业的学习与竞争中不断成长。 未来机器视觉的发展将呈现下列趋势: (1)技术方面的趋势是数字化、实时化、智能化 图像采集与传输的数字化是机器视觉在技术方面发展的必然趋势。更多的数字摄像机,更宽的图像数据传输带宽,更高的图像处理速度,以及更先进的图像处理算法将会推出,将会得到更广泛的应用。这样的技术发展趋势将使机器视觉系统向着实时性更好和智能程度更高的方向不断发展。 (2)产品方面:智能摄像机将会占据市场主要地位 智能摄像机具有体积小、价格低、使用安装方便、用户二次开发周期短的优点,非常适合生产线安装使用,越来越受到用户的青睐,智能摄像机所采用的许多部件与技术都来自IT行业,其价格会不断降低,逐渐会为最终用户所接受。因此,

人脸识别技术研究背景与方法

人脸识别技术研究背景与方法 1人脸识别技术研究背景 .................................................................................... 错误!未定义书签。 1.1人脸检测技术概述 ................................................................................. 错误!未定义书签。 1.2人脸检测的研究内容 ............................................................................. 错误!未定义书签。 2 人脸检测方法 ................................................................................................... 错误!未定义书签。 2.1基于知识的方法 ..................................................................................... 错误!未定义书签。 2.2基于特征的方法 ..................................................................................... 错误!未定义书签。 2.3模板匹配 ................................................................................................. 错误!未定义书签。 2.4基于外观的方法 ..................................................................................... 错误!未定义书签。 2.5 其他方法 ................................................................................................ 错误!未定义书签。 2.6人脸检测方法评析 ................................................................................. 错误!未定义书签。1人脸识别技术研究背景 在计算机及网络技术高速发展的现代社会中,信息安全显示出前所未有的重要性。身份识别及鉴定是保证系统安全的重要前提,在国家安全、公安、司法、电子商务、电子政务、安全检查、保安监控等应用领域,都需要准确的身份识别及鉴定。目前,个人身份鉴别主要依靠ID卡(如身份证、工作证、智能卡和储蓄卡等)和密码等手段,然而这些手段存在携带不便、容易遗失、由于使用过多或不当而损坏、密码易被遗忘和破解等诸多问题。由于技术的发展,犯罪分子伪造假证件的手段越来越高明,如假身份证、假工作证、假文凭等在现实社会中也不时发生;在信息界,黑客攻击别人的计算机系统,破译计算机口令亦常有之。美国每年在福利发放、信用卡交易、移动电话以及ATM交易方面由于身份诈骗而造成的经济损失高达60亿美元。因此,目前广泛使用的依靠证件、个人识别号码(PIN)、口令等传统方法来确认个人身份的技术面临着严峻的挑战,已不能适应现代科技发展和社会进步的需要。 人们希望有一种更加方便可靠的办法来进行身份鉴别,生物特征识别技术给这一愿望带来了实现的可能。早在古埃及时人们就开始通过人体生物特征的测量(如人脸、人手等)来鉴别人的身份;在刑侦领域,人们也早已使用最有效的人体生物特征之一—指纹来确定罪犯。人们可能会遗忘或丢失他们的卡片或密码,但绝不会遗忘或者丢失自己的生物特征,如人脸、指纹、虹膜、掌纹等。因此基于生物特征识别技术的个人身份识别系统具有更好的安全性、可靠性和有效性,正越来越受到人们的重视,并开始进入人们社会生活的各个领域,迎接新时代的挑战。美国政府在“9.11”事件以后连续签署了三个国家安全法案,要求采用生物识别技术。2003年6月,联合国国际民用航空组织公布了其生物技术的应用规划,将

人脸检测方法综述

0引言 人脸检测是模式识别的一个新近的发展方向和重要应用,人脸检测和识别在安全识别、身份鉴定、以及公安部门的稽查活动中都有广泛而重要的应用前景。 就人脸检测这一部分,它是人脸识别的首要步骤,长久以来人们都在致力于找到一个能够快速定位人脸的算法。目前人脸检测的方法主要有两种,基于启发式模型的方法和基于统计式模型的方法,而近些年,基于统计模型的模式识别方法被广泛运用,比如基于神经网络的模式识别等。本文将介绍人脸检测中遇到的一系列问题,并列举数据比较各种人脸检测方法的检测效果,以作参考。 1人脸检测和人脸识别 说到人脸检测就不能不提到人脸识别问题,人脸识别问题是指:对输入的人脸图像或者视频,首先判断其中是否存在人脸,如果存在人脸,则进一步的给出每个人脸的位置、大小和各个主要面部器官的位置信息,并依据这些信息,进一步提取每个人脸中所蕴含的身份特征,并将其与已知人脸库中的人脸进行对比,从而识别每个人脸的身份。 人脸识别的过程可以分为以下三个部分: (1)人脸检测:判断输入图像中是否存在人脸,如果有,给出每个人脸的位置,大小; (2)面部特征定位:对找到的每个人脸,检测其主要器官的位置和形状等信息; (3)人脸比对:根据面部特征定位的结果,与库中人 脸对比,判断该人脸的身份信息 人脸识别技术具有广泛的应用前景,在国家安全、军事安全和公共安全领域,智能门禁、智能视频监控、公安布控、海关身份验证、司机驾照验证等是典型的应用;在民事和经济领域,各类银行卡、金融卡、信用卡、储蓄卡的持卡人的身份验证,社会保险人的身份验证等具有重要的应用价值;在家庭娱乐等领域,人脸识别也具有一些有趣有益的应用,比如能够识别主人身份的智能玩具、家政机器人,具有真实面像的虚拟游戏玩家等等。 本文提出的人脸检测问题是人脸识别这个问题下的一个子问题,这也是人脸识别的前提。 人脸检测研究具有重要的学术价值,人脸是一类具有复杂细节变化的自然结构目标,由于人脸的特殊性,人脸检测面临如下几个难题: (1)人脸外貌、 表情、肤色的不同,造成模式的可变性; (2)人脸可能存在眼睛、 胡须等附属物;(3)人脸影像收到光照产生的阴影影响。 因此,如果能够找到解决此类问题的方法,构造人脸检测和跟踪系统,将为人脸识别以及类似的复杂模式检测问题提供重要启发。 目前国内外针对人脸检测问题的研究很多,比如著名的MIT、CMU等,国内的又清华大学、 北京工业大学、中科院计算技术研究所等,而且,MPEG7标准组织已经建立了人脸识别草案小组,人脸检测算法也是征集内容之一。随着人脸检测问题研究的深入,国际上在此项目上发表的相关论文数也大幅度增长,本文针对人脸检测 收稿日期:2005-10 作者简介:吕琳(1982-),男,同济大学嘉定校区软件学院硕士在读。 人脸检测方法综述 吕琳 (同济大学软件学院,上海201804) 摘要:随着计算机科学的发展和社会的进步,人脸检测的研究和应用越来越得到广泛的关注。但是设计快速有效的人脸检测方法仍然是一个难度很大的问题。本文将从人脸检测方法的两个主要模式出发,分析了当前人脸检测的主要问题和方法,并对这些方法进行比较。 关键词:人脸检测;启发式模型;统计式模型 中图分类号:TP391文献标识码:A文章编号:1009-3044(2005)36-0159-04 SurveyonHumanFaceDetectMethod LVLin (SchoolofSoftwareEngineering,TongjiUniversity,Shanghai201804,China) Abstract:Withthedevelopmentofcomputerscienceandthesociety,thefacedetectionresearchandapplicationdrewmoreandmoreattention.Buthowtodesignfastandefficientfacedetectionmethodisstillabigproblem.Thispa-perwillanalyzetheprimaryproblemandmethodoffacedetection,whichbasedontwoprimaryfacedetectionpatterns,andmakeacomparisonbetweenthesemethods. Keyword:Facedetection;Heuristicmodel;StatisticalModel

金属硫蛋白检测方法研究进展

金属硫蛋白检测方法研究进展 梁 鹏,吴晓萍,廖爱琳 (广东海洋大学食品科技学院,湛江 524025) 作者:梁鹏(1985~ ),硕士研究生,研究方向:食品质量与安全。通讯作者:吴晓萍 摘 要:金属硫蛋白是一种富含金属和半胱氨酸的低分子蛋白质,主要包括A g、A u、B i、C d、H g、Z n等硫蛋白,具有在体内可被金属和其他因素诱导合成的生物学特性。本文综述了目前7种常用的金属硫蛋白检测方法。 关键词:金属硫蛋白;金属结合法;电化学法金属硫蛋白(Metallothionein,简称MT)是一类广泛存在于生物体内的低分子量(约6500D a)金属结合蛋白,富含半胱氨酸,又叫金属硫氨酸甲基内盐,能被金属诱导。主要存在于动物的肝脏、肾脏、胰腺和小肠中。近年来,很多实验表明,金属硫蛋白参与体内微量元素的储存、转运和代谢,具有拮抗电离辐射、清除自由基以及对重金属解毒的作用,还与机体生长发育、延缓衰老及某些疾病有关。到目前有几种方法已用于生物组织和体液中M T的定量,但尚无标准方法。本文重点综述7种方法,介绍其特点,有助于在进行有关研究时选择和建立适宜的检测方法。 1 金属结合法 金属结合法(Metal binding )主要基于MT对金属的高亲合力、且不同金属的亲合力具有差异性及其热稳定性而建立。主要通过测定M T结合金属—竞争性替换金属含量来检测M T中金属含量的增高,从而计算出MT的含量。 1973年,P i o t r o w s k i等首先建立了金属结合法(203H g-T C A法)用于测定组织中的M T。由于H g 2+在酸性环境下不仅可与M T结合而且还可置换其他金属离子(如p H=2.1时,分别有98%的H g 2+和1%的C d 2+与M T 结合)。因此,本法适用于在利用酸沉淀其他蛋白而将M T分离出来时的测定[1]。但此法的203H g的加入量极其重要,如加入量过小,反应体系中尚有未与203H g结合的M T,而导致测定结果偏低;相反,加入量过大, 则 203 H g呈游离状态或与不被T C A所沉淀的低分子量组分 相结合,又可使测定结果偏高。 张保林等[2]运用银饱和分析法结合原子吸收光谱(A A S)检测了兔肝Z n-M T,具体方法为:向含M T的溶液中加入过量的A g +,待反应完全后,再逐次加入血红蛋白,以结合剩余的A g +,加热使血红蛋白沉淀,与M T结合的A g +则完全存在于上清液中,通过A A S测定其中A g +含量,便可计算出M T的浓度。该方法与其他方法比较,不需要去除样品中共存的其它蛋白质和含S H基剂,可直接计算出M T含量,且不需特殊的仪器设备,操作简便,具有很高的重复性和准确性,该法检测的最低限为1μg/ml。 金属结合法具有一定的缺陷,如H g饱和法中H g + 除与M T结合外, 还与其他一些小分子量化合物结合;A g +不能置换已与M T结合的H g,且由于利用金属含量间接推算MT含量,特异性较差。 2 电化学法 电化学方法(Electrochemical )是利用巯基(-SH)在汞滴电极表面产生氧化还原反应出现的电位变化建立的,通过测定巯基以计算M T的含量。运用检测M T 的电化学方法有:示差脉冲极谱法(DPP)、微分脉冲极谱法、示差脉冲阳极溶出伏安法(DPASV) 和循环伏安法(CV)等。1979年Olafson等建立了示差脉冲极谱法[3]测定M T,检出限为10-8M,且不受分子中金属含量的影响。因此, 此法或许更能特异地反映M T而不是金属的量。1992年,Bebianno等人应用差分微分脉冲极谱法测定了贻贝组织中MT的浓度[4];后来Bordin等通过改变体系的p H值,利用D D P方便的检出了多种形式的M T,并快速分析出还原型的M T;B e b i a n n应用微分脉 2010年第09期 No.09,2010 中国食物与营养Food and Nutrition in China

人脸检测综述_孙宁

2006 年 12 月JOURNAL OF CIRCUITS AND SYSTEMS December, 2006 文章编号:1007-0249 (2006) 06-0101-08 人脸检测综述* 孙宁1,2,邹采荣2,赵力1,2 (1. 东南大学学习科学研究中心,江苏南京 210096;2. 东南大学无线电工程系,江苏南京 210096) 摘要:人脸检测研究在近二十年的时间内取得了长足的进步,并且作为安控、人机界面、人类情感研究系统的重要组成部分得到了广泛的应用。该文首先对人脸检测所面临的问题进行了探讨,并将人脸检测方法分为:基于几何特征的方法、基于肤色模型的方法、基于统计理论的方法三个方面进行了阐述。分析了相关的理论及算法,对各个方法的优缺点进行了比较。最后,对人脸检测今后的研究方向进行了讨论。 关键词:人脸检测;人脸识别;机器学习;模式识别; 中图分类号:TP391 文献标识码:A 1 引言 观察一个人的面部可以自然的,无侵犯性的了解到一个人的很多信息,比如:身份,性别,年龄,情感等等。因此,在过去三十多年[1]的时间里人们对人脸检测和人脸识别始终保持着浓厚的研究兴趣。随着近些年来国际形势的变化,特别是9.11事件之后,各国对自身重要设施的安保性能越发重视,也积极研发了一些自动人脸识别系统并投入实用。比如,美国Identix公司的FaceIt[2]系统,该系统基于局部特征分析(LFA),能在不同的光照,肤色,姿态,表情情况下得到良好的检测性能。我国的生物特征认证与安全技术研究中心(CBSR)则在2004年成功研制出了基于人脸、指纹、虹膜三种识别方法的快速通关系统(MRTD)[3],取得了国际先进的整体性能。 任何人脸识别系统首先都需要从输入信息中获取人脸的位置、大小。因此,人脸检测是人脸识别系统的第一个步骤,这一步骤的所获得的精度与速度直接影响整个系统的性能。此外,人脸检测的应用也大大超越了人脸识别系统的范畴,在人脸表情识别系统,基于内容的检索,视频会议,三维人脸模型等方面也有重要的应用价值。 人脸的自动检测是一类具有很大挑战性的问题,其主要难点在于:(1)人脸是一类高度非刚性的目标,存在相貌,表情,肤色等差异,(2)人脸上可能会存在一些附属物,诸如,眼镜,胡须等。(3)人脸的姿态变化万千,并且可能存在遮挡物。(4)待检测图像性质的差异。比如:待检图像的分辨率;摄录器材的质量等;(5)光源的种类和角度。不同种类和角度的光源会对待检测的人脸产生不同性质的反射和不同区域的阴影。 针对以上问题,各国的科研人员作了很多的研究,国外比较著名的有CMU,MIT,UIUC等,国内的有微软亚洲研究院、中科院自动化研究所、清华大学等。此外,每年在国际国内的相关期刊和会议上都有大量的关于人脸检测的论文,其中综述性质的文章对近期人脸检测的研究进展进行总结,对人脸检测的研究方向进行展望。Chellappa、Zhao等人分别于1995和2003年发表的两篇人脸识别的综述论文[4,5],其中列出专门章节将人脸检测作为人脸识别系统的一部分进行了综述。前者总结了上世纪九十年代中期之前人脸检测技术的状况和发展,后者则着重介绍了最新的人脸检测技术的发展情况。2001年,E. Hjelmas等人发表的文章[6]将人脸检测技术分为基于图像的方法和基于特征的方法这两类进行了综述。2002年,M .H. Yang等在IEEE Trans. PAMI上发表了名为:Detecting Faces in Images: A Survey[7]的人脸检测技术综述文章,该文将人脸检测技术分为四类进行了详细介绍,并且针对以往关于人脸检测论文中检测性能估计方面的混乱情况,提出了较明确的估计准则。此外,还给出了许多用于人脸检 * 收稿日期:2005-04-11 修订日期:2005-08-17

人脸识别技术的应用背景及研究现状

人脸识别技术的应用背景及研究现状 1.人脸识别技术的应用 随着社会的不断进步以及各方面对于快速有效的自动身份验证的迫切要求,生物特征识别技术在近几十年中得到了飞速的发展。作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为了自动身份验证的最理想依据。当前的生物特征识别技术主要包括有:指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。与其他识别方法相比,人脸识别由于具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受,从而得到了广泛的研究与应用。除此之外,我们还能够对人脸识别的结果作进一步的分析,得到有关人的性别,表情,年龄等诸多额外的丰富信息,扩展了人脸识别的应用前景。当前的人脸识别技术主要被应用到了以下几个方面:(1)刑侦破案公安部门在档案系统里存储有嫌疑犯的照片,当作案现场或通过其他途径获得某一嫌疑犯的照片或其面部特征的描述之后,可以从数据库中迅速查找确认,大大提高了刑侦破案的准确性和效率。 (2)证件验证在许多场合(如海口,机场,机密部门等)证件验证是检验某人身份的一种常用手段,而身份证,驾驶证等很多其他证件上都有照片,使用人脸识别技术,就可以由机器完成验证识别工作,从而实现自动化智能管理。 (3)视频监控在许多银行,公司,公共场所等处都设有24小时的视频监控。当有异常情况或有陌生人闯入时,需要实时跟踪,监控,识别和报警等。这需要对采集到的图像进行具体分析,且要用到人脸的检测,跟踪和识别技术。 (4)入口控制入口控制的范围很广,既包括了在楼宇,住宅等入口处的安全检查,也包括了在进入计算机系统或情报系统前的身份验证。 (5)表情分析根据人脸图像中的面部变化特征,识别和分析人的情感状态,如高兴,生气等。此外,人脸识别技术还在医学,档案管理,人脸动画,人脸建模,视频会议等方面也有着巨大的应用前景。 2.人脸识别技术在国外的研究现状 当前很多国家展开了有关人脸识别的研究,主要有美国,欧洲国家,日本等,著名的研究机构有美国MIT的Media lab,AI lab,CMU的Human-Computer Interface Institute,Microsoft Research,英国的Department of Engineering in Uni versity of Cambridge等。综合有关文献,目前的方法主要集中在以下几个方面:(1)模板匹配 主要有两种方法,固定模板和变形模板。固定模板的方法是首先设计一个或几个参考模板,然后计算测试样本与参考模板之间的某种度量,以是否大于阈值来判断测试样本是否人脸。这种方法比较简单,在早期的系统中采用得比较多。但是由于人脸特征的变化很大,很难得到有效的模板来表示人脸的共性。变形模板在原理上与固定模板相同,但其中包含一些非固定的元素,一种方法是手工构造参数化的曲线和曲面以表征人脸中的某些非固定特征,如眼睛,鼻子和嘴

相关文档
最新文档