卷积神经网络级联

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

组员：刘波、金壮、陈楠、松寨
.
一、介绍CNN 二、如何实现基于CNN来检测人脸三、最终结果展示
.
一、介绍CNN
1.1CNN的原理
1-1
.
.
ቤተ መጻሕፍቲ ባይዱ
1.2CNN的模型
（1）卷积能够将一个很多权值参数的图像经过卷积核之后变为一个权值参数很少的图像。如图1-1所示，
在5×5的图像和3×3的卷积核作卷积操作后，重新输出一个3×3的矩阵，称为特征图。这个扫描是可以有重叠部分的，就如同你的目光扫视也是连续一样。
.
三最终结果展示
.
结束放映谢谢观看
.
图1-2
.
（3）光栅化图像经过卷积、池化之后得到的是一些列的特征图，而感知器输入的是一个向量，因此需要将
这些特征图中的像素依次取出，排成一列向量。
.
1.3 CNN的优点
传统的检测人脸都是基于各种模型的检测方法，然后再经过一系列的训练和验证来改价原有模型进而实现更加先进的检测精度。
而CNN则与传统的基于模型的方法不同，由于CNN具有强大的学习功能，它可以直接从图像中学习分类器，而不是手工制作模型，可以更好的区分来自高度混乱背景的面孔同时，我们的检测器比基于模型和基于示例的检测系统快了许多倍。
.
（2）池化池化的作用就是减小特征图，也就是压缩，池化规模一般为2×2。常用的池化方法有：
最大值池化和均值池化。其中最大值池化就是就是取2×2中四个点的最大值；均值池化就是取 2×2中四个点的平均值。图1-2就是池化规模10×10对特征图处理，取其中最大一个特征值代表那一区域的特征值即图中1。
CNN结构图 .
2.3 12校准网络
12校准网络是指在12网络之后的CNN用于人脸方框的校准，是一个浅的CNN。首先定义一个
N，它是N个校准模式的三维缩放变化和偏离设置向量。
{[sn,xn,yn]}N n=1
sn∈{0.83,0.91,1.0,1.10,1.21}
xn∈{−0.17,0,0.17}
N=5×3×3=45
yn∈{−0.17,0,0.17}
.
12校准网络的输入图像为N模式其中一个模式参数校准方框后的图片。经过12网络校准后可以得到一个信度分数C1，经过N次后可以得到[C1,C2.....Cn]，我们可以把高信度分数留下来并且取平均值最为最后人脸方框调整。t是除掉低信度分数的阈值。
.
二如何实现基于CNN来检测人脸
2.1总体介绍检测结构
一共为三阶级联
上图就是人间检测的过程：（1）是原始图片经过12网络和12校准网络先后使用NMS去掉重合方框，剩余图片经过裁剪和
整理。（2）整理过的图片再经过24网络和24校准网络后再使用NMS去掉重合方框，再次经过裁剪和
整理。（3）整理过的图片经过48网络之后进行全局NMS得到了唯一人脸方框，经过48校准网络后得
出最终人脸框。
.
2.2 12网络
12网络是指第一个CNN，12网络是一种非常浅的二进制分类CNN，是用于快速扫描测试图像。它的检测窗口是12×12，以4像素为间隔扫描尺寸为W×H的图像等价于用12网络扫描整个图像将会获得((W-12）/4+1)×((H-12)/4+1)信度分数图，信度分数图上面的每个点都是12×12的检测窗口。
卷积神经网络级联的人脸测试
来源CVPR 2015 paper A Convolutional Neural Network Cascade for Face Detection Haoxiang Li, Zhe Lin, Xiaohui Shen, Jonathan Brandt, Gang Hua