毕设-人脸识别-外文文献翻译-Feature-Centric Evaluation for Efficient Cascaded Object Detection

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

以中心为主且适合有效率层级目标检测的评估

概述

我们描述一个进行目标识别的级联方法。该方法应用了“以中心为特色”的评估中一种新颖结构，该评估方法通过多级窗口来重用面部特征评估。我们通过以下几种简化将评估的费用减至最小： (1) 局限照明标准化，(2) 分离特征作为一附加模式和(3)离散型的特征。该方法也结合了一种独特的特征表现方法。在该层叠方法的初期使用简单快捷的特征评估，后期则使用更复杂的具有判别能力的特征。尤其，我们推荐基于稀疏编码和过滤器回应之间的顺序关系的特征。层叠且以面部为主的评估与越来越具复杂性的特征结合起来可以提高计算效率和精确度。我们对在十个目标上进行的实验情况做一描述，实验对象包括面部以及汽车。这些结果包括在和对汽车识别的UIUC 图片数据库的同等错误率下对97%的目标进行了识别。

1 引言

进行目标识别的难题之一是应付目标大小和方位的多样化。一个目标可以以任意大小出现在一副画的任何地方，这里有两个解决该问题的一般方法。“不变式”方法试图使用特征几何量[6][7][25][28]或光度测定道具[4][15][22]的过滤器，该方法的最关键之处是找出具有不变性和具有判别力的特征，尤其是对象面部之类的自然物体。另一个方面，“穷举搜索“法包括在只有忍受目标位置和大小的有界变差的情况下建立对目标和”非目标“进行区分的分类器。该方法通过

一副图中的方位和大小进行详尽的扫描，以此来找出目标。图1图解

了该方法，分离器对图片中的所有“窗口”进行评估。该方法的缺点是象这样详尽式的搜索很耗时。

Figure 1。目标检测的详细搜索

减少详细搜索计算成本的一个方法就是如图2所示那样来将分离过程细分成子过程，每一个子分类阶段对是否拒绝输入，并将其分类到非目标中去或继续用下一个子分类阶段对其进行评估。最后被筛选出来的就被归类到所属的目标中。该策略是以最少的计算量来分离出大量的非目标窗口。

Figure 2 子分类的层叠

使用类似层叠方法的思想已经沿用了数十年，而且于70，80年代，在自动目标识别技术上广泛使用[3]。近来大量的相关技术已经应用于面部检测，包括[2][9][10][14][17][19][21][23][24][26]。尤其，Viola和Jones[24]和他们在研究方法上将层叠和基于整体图象的有利计算的特征相结合，并在各方面都取得了进展，使面部检测的效率提高。

类似Viola和Jones[24]的大部分层叠法应用了我们所介绍过的“基于窗口”的评估法。这些方法对各个窗口进行亮度修正和特征

评估。在该论文中，我们介绍另一个可供选择的“以中心为特点”评估方法，该方法在相互重叠的窗口中重用特征评估。象一个子分类此时可以在不用花费特征评估的成本的情况下使用更多的信息。在一个层叠中的初期，一个子类通常可以将层叠窗口的初始数量减少99%以上，在基于少许合理假设下，我们将说明如何以计算的效率来我们使用最初基于面部的子分类阶段作为目标识别完整系统中的一部分，层叠法的最初阶段使用简单快捷的特征，而在后面阶段将使用较之复杂，且有判别力的特征。实际上，我们推荐基于稀疏代码和过滤器回应之间顺序关系的新颖特征。最后，我们将讲述如何利用（）[20]，我们将论证计算的效率和精确度，并且展示对含有面部和汽车之类十个物体的检测方法的一般性。

2 基于中心的评估

大部分层叠法基于分类运算法则，并应用“基于窗口“评估方法，在这类方法中所有的评估都和分类窗口有关。这可用如下公式表示：

其中r[k]代表长方形窗口在位置k的中心且该窗口由函数w[k]从输入的图中选择出来，I[k]。I（。）在该窗口区域内进行光度修正计算。

每个窗口的特征值各自由下列式子所式：

图3 。1-D中的基于窗口评估。Fk0表示一个窗口居中于位置k0，c（．）是一个积分函数。它输出一连串连续值，正值表示该目标存在，而负值则表示目标不存在，c[k0]表示输出窗口在位置k0。

在该部分我们描述一个可供选择的“基于中心”评估策略，这些方法共享重叠窗口之间的特征值。第一步通过图中的长方形格子来计算特征值：

F[k0]表示对位置k0进行特征评估。

第二步使用窗口区域内的所有特征值进行分类，

图4。1-D中的基于面部评估。窗口的支撑区域跨越了m个特征位置。

图3和图4 中的方法应用了同样数量的特征计算，但是每个基于面部评估函数使用的特征量比基于窗口评估函数使用到的多，这些附加信息是层叠识别初级阶段中的一个优势，没有单一的哪个特征

可以因足够可靠而可以检测出所有目标并排除非目标中的一显著部分，通过应用多特征值，基于特征评估将会获得更佳的成绩。

基于特征方法只有在较复杂的积分函数中会带来额外的计算成本，c（.）。在一些合理的简化下该成本可以减少到最低，第一个简化方法就是做一积分函数并将其作为附加模式，该附加模式中的每个条件都依赖一单一的特征值：

注意到，h（·）的第二个参数详细指明了窗口中特征的位置，也就是说，即使在任何位置都使用同一特征函数来进行计算，它们的值将会随着窗口中每个位置上h（·）值的不同而不同，这些表示法保存了几何结构。

该附加模式设想将维数从m维减少到一维的m种模式，这样大大的减少了实际成本和计算所需。然而，附加模式的限制并不严格，类似Bayesian网络和Markov Random Filed的绘图概率模式可以表示为附加数，同样，由增压而产生的附加模式功能也很强大。

第二个简化方式表示特征，f（·）作为离散值，在该设想下，函数h（·）是由特征值和窗口中的位置值来进行设定成的一个表，离散值的优势是仅仅需要实行表中的查找（内存访问）以及添加。

每个窗口的积分函数可以分别如下式计算：

在这个公式中，积分函数令nm的值随机产生（不一定要连续），

Nm越过n个窗口，其中每个窗口所支持的区域内含有m个特征，然而，我们可以重新组织这些计算结果以致大部分记忆存取顺序化。实际上，f[k]的每个值有助于m个窗口的分类。我们就此可以存储到连续的记忆空间中的m个值，h（f[k]，·）。每个值都可以顺序地添加到合适的m个窗口中的分类值上。在我们的执行中对这些值的顺序访存可以将计算时间至少减少至原来的60%。

基于特征的评估在层叠法的初期是最有用的，该阶段的目标是尽可能快的移动更多的窗口。然而，一旦这个目标达到了，基于特征评估法的几个限制将会使其在后期阶段中不适用。尤其，它在窗口中的所有位置计算同一特征函数f（·），尽管它可能有利于在不同位置计算不同的特征值，例如，在一张脸面上，它可能有利于对眼睛周围的器官以及鼻子周围的突出器官的计算，同样，亮度修正的计算也和局部区域的特征值有关，正如我们下节要讲述的。

基于窗口的评估法提供了一个比第一个方程式更全面的式子，它更适合层叠法的后期阶段，

在此，不同的特征可以在窗口中不同的位置上进行计算，例如，每个ff（·）可能在分类窗口中有一个不同的支持区域：