判别学习卷积特征描述子,应用于人脸认证.pdf

合集下载

应用于人脸识别的卷积神经网络模型

应用于人脸识别的卷积神经网络模型

应用于人脸识别的卷积神经网络模型人工智能技术的快速发展使得人脸识别技术的应用逐渐成熟起来。

卷积神经网络模型是一种能够进行深度学习的人工神经网络,而它的应用也在不断地扩展。

在人脸识别领域中,卷积神经网络模型能够识别多种人脸特征,从而提高人脸识别的准确度。

一、卷积神经网络模型的基本结构卷积神经网络是由一系列的卷积层和池化层交替组成的。

在图像识别领域中,将输入图像作为卷积神经网络的输入层。

之后,多个卷积层和池化层进行交替连接,最终生成输出层,输出的结果即为识别结果。

卷积层是卷积神经网络模型的基本组成部分。

其主要作用是通过卷积核对输入的图像进行卷积计算,从而生成特征图。

卷积核是一个小的权值矩阵,其大小和步长是可以设置的。

卷积层的作用就是通过多个不同的卷积核,对输入的图像进行卷积运算,从而生成更高维度、更具区分性的特征图。

池化层是卷积神经网络中的另一个关键组件。

其作用是对输入的特征图进行降维,减小特征图的大小,从而减少计算量。

池化层有两种类型,分别为最大池化和平均池化,它们的作用是通过不同的计算方式对特征图进行降维操作,得到更为简洁的特征图数据。

二、卷积神经网络模型在人脸识别领域中的应用1、人脸检测卷积神经网络模型可以被用于人脸检测。

在人脸检测中,卷积神经网络模型的作用是通过训练集中的图片数据进行学习,从而学习到不同的人脸特征。

在测试阶段,卷积神经网络模型将被用于检测测试集中的图片数据中是否存在人脸,而其准确率常常能够达到90%以上。

2、人脸验证卷积神经网络模型可以被用于人脸验证。

在人脸验证中,卷积神经网络模型的作用是将输入的图片数据进行学习,之后对两张图片进行比较,得出它们是否为同一个人的识别结果。

而卷积神经网络模型训练的准确率高,能够区分出人脸的微妙差别,从而提高人脸识别的准确度。

3、人脸识别卷积神经网络模型可以被用于人脸识别。

在人脸识别中,卷积神经网络模型的作用是训练人脸识别模型,从而学习到不同的人脸特征。

使用卷积神经网络进行人脸表情识别

使用卷积神经网络进行人脸表情识别

使用卷积神经网络进行人脸表情识别人脸表情识别是计算机视觉领域的一个重要研究方向,它有着广泛的应用前景。

人脸表情识别可以帮助我们了解他人的情绪状态,例如判断某个人是否高兴、悲伤或者生气。

卷积神经网络(Convolutional Neural Network,CNN)作为一种深度学习的模型,已经在人脸表情识别领域取得了很好的效果。

本文将介绍卷积神经网络在人脸表情识别中的应用。

一、背景介绍人脸表情识别是指通过对人脸图像进行分析和处理,预测人脸所表达的情绪类别。

人脸表情识别具有广泛的应用场景,例如情感分析、人机交互、虚拟现实等。

传统的人脸表情识别方法主要是利用人工设计的特征提取器和分类器,但这些方法在复杂情况下往往效果不佳。

而卷积神经网络通过自动学习图像的特征表示,使得在人脸表情识别任务上能够得到更好的表现。

二、卷积神经网络在人脸表情识别中的应用卷积神经网络是一种深度学习模型,它采用了卷积层和池化层来提取输入图像的特征,并通过全连接层进行分类。

在人脸表情识别任务中,卷积神经网络能够自动学习人脸图像的表情特征,从而实现自动分类。

1. 数据集准备在进行人脸表情识别之前,需要准备一个包含标注的人脸表情图像数据集。

常用的数据集有FER-2013、CK+和JAFFE等。

这些数据集通常包含不同情绪类别的人脸图像,例如高兴、悲伤、生气等。

通过使用这些数据集,我们可以训练卷积神经网络来学习不同表情之间的区别。

2. 网络结构设计卷积神经网络的结构设计对于人脸表情识别任务至关重要。

常见的网络结构包括LeNet-5、VGGNet和ResNet等。

在设计网络结构时,需要考虑到模型的深度和复杂度,以及模型的训练时间和计算资源的需求。

3. 特征提取和分类卷积层和池化层是卷积神经网络的核心组成部分,它们能够自动提取输入图像的特征。

通过堆叠多个卷积层和池化层,可以逐渐提取出更加抽象和高级的特征表示。

最后通过全连接层将提取到的特征进行分类,得到人脸表情的预测结果。

使用卷积神经网络实现人脸识别

使用卷积神经网络实现人脸识别

使用卷积神经网络实现人脸识别随着科技的快速发展,机器学习已经成为了当今社会的热门话题。

其中,人脸识别技术是机器学习领域中最实用的技术之一。

人脸识别技术能够将人脸图像与已知的人脸库进行比对,用以识别出人脸图像所对应的人物身份信息。

由于其具有高度自动化和高准确率的特点,人脸识别技术在现代社会中被广泛应用于安全监控、考勤签到、金融交易等领域。

本文将介绍如何通过卷积神经网络实现人脸识别技术,为读者带来全新的学习体验。

一、人脸识别技术的基本原理人脸识别技术的实现需要解决两个关键问题,即:图像特征提取和人脸匹配。

在图像特征提取阶段,计算机需要对图像进行数字化处理,将图像中的每个像素点表示成具有实际含义的数字,这代表了图像的特征。

在人脸匹配阶段,计算机需要将图像的特征值与已知的人脸库中的特征值进行比对,并找到最佳匹配。

由于每个人的面部特征都是独一无二的,因此基于面部特征的人脸识别技术被广泛应用于安全认证、身份识别等领域。

二、卷积神经网络在人脸识别中的应用卷积神经网络是一种强大的深度学习模型,它能够对图像进行高效而准确的特征提取。

通过卷积神经网络,可以将图像中的不同特征进行分层处理,其中每一层的卷积核都能够捕捉到图像中的不同特征信息。

因此,卷积神经网络是实现人脸识别技术的理想选择。

三、卷积神经网络的实现步骤实现基于卷积神经网络的人脸识别技术,需要通过多项技术实现以下步骤:1.数据预处理。

在人脸识别中,网络需要学习的数据通常都比较庞大。

因此,在训练网络之前需要对图像数据进行预处理。

预处理通常包括图像的缩放、裁剪、旋转等操作,以确保机器学习算法能够在训练中更快更准确地提取图像特征。

2.建立卷积神经网络模型。

在建立卷积神经网络模型之前,需要明确网络的输入和输出。

针对人脸识别任务,网络的输入应该是人脸图像的像素值,输出则应该是人脸所对应的身份信息。

而卷积神经网络通常采用多个卷积层和池化层来提取图像特征。

特别是在人脸识别任务中,卷积层可以通过不同的卷积核来提取不同的图像特征,池化层则可以将图像特征进行下采样,减少网络的计算复杂度。

卷积神经网络在人脸识别中的应用

卷积神经网络在人脸识别中的应用

卷积神经网络在人脸识别中的应用一、人脸识别与卷积神经网络人脸识别是一项基于生物特征的自动识别技术,也是当前人工智能领域中的热门研究方向之一。

卷积神经网络(Convolutional Neural Network, CNN)是深度学习中常用的一种神经网络,具有良好的图像处理能力。

近年来,卷积神经网络在人脸识别领域的应用越来越受到重视。

二、卷积神经网络原理卷积神经网络是一种前向传播的神经网络模型,由卷积层、池化层、全连接层等模块组成。

卷积层是卷积神经网络的核心模块,它通过卷积运算提取图像中的特征信息。

池化层是用于减小特征图的尺寸,降低计算复杂度的模块。

全连接层则将卷积层和池化层提取的特征进行分类。

三、卷积神经网络在人脸识别中的应用卷积神经网络在人脸识别中的应用主要包括人脸识别、人脸检测和人脸跟踪等方面。

在人脸识别中,卷积神经网络通过提取人脸图像中的特征信息,识别人脸并验证身份。

在人脸识别的应用场景中,卷积神经网络可以实现高精度、高效率的人脸识别,例如安全门禁、移动支付等。

在人脸检测方面,卷积神经网络可以快速地检测出图像中的人脸,从而进行后续的人脸识别工作。

人脸跟踪则是指在视频流中跟踪人脸的位置,卷积神经网络可以通过卷积操作和快速的运算速度,实现实时的人脸跟踪。

四、卷积神经网络应用案例1. FaceNetFaceNet是Google在2015年提出的一种基于深度学习的人脸识别模型,其中卷积神经网络是核心部分。

该模型通过将卷积神经网络中的特征向量映射到多维空间中,实现人脸识别的任务。

FaceNet的优势在于可以在不同的人脸图像中学习到良好的特征,从而提高识别的精度和鲁棒性,同时能够实现较高的识别速度。

2. DeepID3DeepID3是香港中文大学的研究团队于2015年提出的一种人脸识别模型,采用了一种新的卷积神经网络结构。

该模型将人脸图像分为不同的区域,利用卷积神经网络提取每个区域的特征,并将这些特征向量拼接起来,最终实现人脸识别任务。

多任务学习及卷积神经网络在人脸识别中的运用

多任务学习及卷积神经网络在人脸识别中的运用
【关键词 】多任务学 习 卷积神 经网络 人脸识

人 脸 识 别 就 是 一 种 对 人 脸 面 部 特 征 进 行 身份识别 的技术手段 。在 教育以及安全等领域 中应 用 较 为 广 泛 。传 统 的 人 脸 识 别 算 法 虽 然 其 获得 了 良好 的效果,但是因为这些数据集 中人 脸 个 体 相 对 较 小 , 不 同 个 体 拥 有 的 信 息 也 相 对 较小 ,其还有 一定的完善空间。而通过多任务 学 习机制对其进行分析 ,具有一定的实践价值 。
mage&Multimedia Technology· 图像与 多媒体技术
多任务学 习及卷积神经 网络在人ห้องสมุดไป่ตู้识别 中的运 用
文 /任 成 娟
而 3D 矫 正 则 就 是 正 脸 化 ,通 过 标 定 点 配 对 的 性 进 行 分 析 ,对 其 进 行 水 平 方 向 的翻 折 处 理 。
人 脸 认 证 就 是 对 两 张 人 脸 进 行 判 定 , 分 析 其 是 否属 于 同 一 个 人 。在 认 证 鉴 别 中三 元 组 损失相对较 为直接,在操作中将其获得 的鉴别 网络 作 为 初 值在 通 过 三 元 组 件 加 强 监 督 ,可 以
效 率也 相 对较 低。 而通 过 多任 框 架 的深度 卷 积 网络对 其 进行 析 , 可 以 通 过 端 到 端 的 训 练 , 提 升 深度 卷 积 网络算 法 的 简洁性 以及 高效性 。对 此, 文章 主要 对 多任 务 学 习及卷 积神 经 网络 在人 脸 识别 中的运 用 进行 了简单的探 究分析 。
在深度 学 习的持 续发展 过程 , 现 阶 段 人 脸 识 别 在 深 度 学 习 支持之 下 获得 了 巨大的 突破。 加 强 对 人 脸 鉴 别 、 认 证 、 属 性 类 等 不 同任务 的 分析 ,通 过独 的设 计 与运 作模 式 对其 进行 处 , 会 导 致 其耗 费大量 的 时 间,

使用卷积神经网络进行人脸识别的教程(九)

使用卷积神经网络进行人脸识别的教程(九)

人脸识别技术在当今社会得到了广泛应用,无论是手机解锁、人脸支付还是安防监控都离不开这项技术的支持。

而卷积神经网络(Convolutional Neural Network,CNN)作为一种深度学习模型,在人脸识别领域也发挥着重要作用。

本文将介绍使用卷积神经网络进行人脸识别的基本步骤和技巧。

一、数据集准备进行人脸识别任务首先需要一个包含人脸图像的数据集。

可以选择已有的公开数据集,如Labeled Faces in the Wild(LFW)或CelebA,也可以自己采集和标注数据。

数据集的质量对模型的训练和性能有重要影响,因此在选择和准备数据集时需要格外注意。

在准备数据集时,要确保数据集中的人脸图像质量高,且覆盖了各种不同的人种、年龄和姿态。

此外,还需要对图像进行标注,即为每张图像打上标签,标明人脸的位置和身份信息。

这样才能保证训练出来的模型具有较好的泛化能力。

二、数据预处理在将数据输入到卷积神经网络之前,需要对数据进行预处理。

预处理的目的是使数据符合网络的输入要求,并且能够提高模型的训练效果。

常见的数据预处理操作包括图像的尺寸调整、归一化、灰度化等。

尤其是人脸识别任务中,由于人脸的位置和姿态各异,因此需要对图像进行对齐和裁剪,以提高模型的鲁棒性。

另外,还可以对图像进行增强操作,如旋转、翻转、加噪声等,以扩充数据集,增加模型的泛化能力。

三、构建卷积神经网络模型构建卷积神经网络模型是进行人脸识别任务的核心步骤。

卷积神经网络是一种专门处理图像数据的深度学习模型,具有良好的特征提取能力和分类性能。

在构建模型时,可以选择一些经典的卷积神经网络结构,如AlexNet、VGG、ResNet等,也可以根据实际情况设计自己的网络结构。

值得一提的是,在人脸识别任务中,一般会使用一些额外的技巧来增强模型的性能,如人脸对齐、特征融合等。

四、模型训练模型训练是人脸识别任务中至关重要的一步。

在进行模型训练时,需要将数据集划分为训练集、验证集和测试集,用于训练模型、调参和评估模型性能。

基于卷积神经网络的人脸识别研究共3篇

基于卷积神经网络的人脸识别研究共3篇

基于卷积神经网络的人脸识别研究共3篇基于卷积神经网络的人脸识别研究1随着人工智能领域的持续发展,人脸识别技术已经成为其中的一个热门领域。

使用人脸识别技术可以极大地提高生活和工作效率,如:在公共场所追踪犯罪嫌疑人,访问安全与隐私保护,以及人机交互等方面都可以得到广泛应用。

近年来,卷积神经网络作为一种有效的深度学习算法,被广泛应用于人脸识别领域。

利用卷积神经网络的特点,可以从大量的人像图片中自动提取特征,并根据这些特征进行人脸的识别和判别。

本文主要介绍了一种基于卷积神经网络的人脸识别方法,该方法主要分为四个部分:数据预处理、卷积神经网络的构建、特征提取与分类。

该方法基于公开的人脸识别数据库进行实验,取得了良好的实验结果。

(一)数据预处理在训练神经网络之前,需要将人脸图像进行预处理。

在此过程中,我们需要对图像进行归一化、缩放、灰度处理等操作,以便提供给神经网络进行有效的训练。

这些处理步骤不仅可以提高网络的泛化能力,而且还可以加快训练速度。

(二)卷积神经网络的构建卷积神经网络由多层卷积层、池化层、全连接层等组成。

在构建网络的过程中,我们首先需要确定网络的总体结构和参数,这些参数包括卷积核数量、卷积核大小、池化大小、全连接层的神经元数量等。

在确定这些参数之后,我们便可以开始进行神经网络的训练与调整。

(三)特征提取与分类在训练神经网络之后,我们需要对新的人像图片进行识别分类。

在这个过程中,我们可以利用前面提取的卷积特征,通过全连接层对图片进行分类。

该过程一般采用softmax分类器进行实现,以便将识别结果表示为一个概率值。

(四)实验与结果分析我们使用了公开的人像数据库,包括LFW人脸数据库和Yale人脸数据库,测试了该方法的识别与分类性能。

实验结果表明,该方法具有较高的识别准确率和良好的分类性能。

而且,该方法不仅提高了人脸识别的准确率,还可以简化实现过程和提高工作效率。

总结:本文介绍了一种基于卷积神经网络的人脸识别方法。

使用卷积神经网络(CNN)做人脸识别的示例代码

使用卷积神经网络(CNN)做人脸识别的示例代码

使⽤卷积神经⽹络(CNN)做⼈脸识别的⽰例代码上回书说到了对⼈脸的检测,这回就开始正式进⼊⼈脸识别的阶段。

关于⼈脸识别,⽬前有很多经典的算法,当我⼤学时代,我的⽼师给我推荐的第⼀个算法是特征脸法,原理是先将图像灰度化,然后将图像每⾏⾸尾相接拉成⼀个列向量,接下来为了降低运算量要⽤PCA降维,最后进分类器分类,可以使⽤KNN、SVM、神经⽹络等等,甚⾄可以⽤最简单的欧⽒距离来度量每个列向量之间的相似度。

OpenCV中也提供了相应的EigenFaceRecognizer库来实现该算法,除此之外还有FisherFaceRecognizer、LBPHFaceRecognizer以及最近⼏年兴起的卷积神经⽹络等。

卷积神经⽹络(CNN)的前级包含了卷积和池化操作,可以实现图⽚的特征提取和降维,最近⼏年由于计算机算⼒的提升,很多⼈都开始转向这个⽅向,所以我这次打算使⽤它来试试效果。

⽼规矩,先配置下编程的环境:系统:windows / linux解释器:python 3.6依赖库:numpy、opencv-python 3、tensorflow、keras、scikit-learnpip3 install numpypip3 install opencv-pythonpip3 install keraspip3 install scikit-learnpip3 install tensorflow如果⼿中有⼀块⽀持Cuda加速的GPU建议安装GPU版本:pip3 install tensorflow-gpu上次⽂章有位读者评论说:所以,为了照顾初学者,这⾥简单介绍下Anaconda的安装⽅法,Anaconda是⼀个开源的Python发⾏版本,其包含了Conda、Python等180多个科学包及其依赖项。

因为包含了⼤量的科学包,Anaconda 的下载⽂件⽐较⼤,所以有python包安装基础的⼈还是建议通过pip来安装所需的依赖。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

判别学习卷积特征描述子,应用于人脸认证特征描述子广泛应用在计算机视觉领域,如运动恢复结构(SfM),三角化(Triangulation),3D重建,全景图拼接,图像特征点匹配,图像匹配,虚拟现实(VR),全息投影,图像搜索,目标识别,目标追踪等等。

经典的特征描述子如SIFT,SURF等对计算机视觉的发展起到了重要作用。

当前的特征特征描述子需要精心的手工设计,主要表示图像的低级特征,容易受场景光照变化,拍摄视角差异,传感器设置不同的影响。

从谷歌学术引用量看行业趋势Distinctive image features from scale-invariant keypoints. [2004]浅层特征引用量已经趋于稳定Imagenet classification with deep convolutional neural networks. [2012]深度特征引用量快速上升下面先通过计算机视觉方面的应用介绍特征描述子的重要性。

☐运动恢复结构(SfM),也可以称为稀疏重建。

☐三角化(Triangulation )。

☐3D重建。

☐全景图拼接。

☐图像特征点匹配。

☐图像匹配。

☐图像搜索。

☐视频检索。

☐人脸认证。

运动恢复结构(稀疏重建)多视角图像相机位姿+场景结构网络上众多罗马斗兽场的图像,如何寻找有重叠区域的相邻图像进行稀疏重建?局部特征描述子三角化(Triangulation )已知x、K、R、t, 求X如何判断点x1和点x2是同一个点?SIFT描述子SURF描述子三角化(Triangulation )同一个点不同点Triangulation 的应用一、选题的意义3D重建多视角图像相机位姿3D模型如何从多视角图像序列中获取相邻视角的图像,并计算相机精确位姿?特征描述子一、选题的意义3D重建应用-古建筑数字保护颐和园石舫(第二行图为重建结果)3D重建应用-三维地图生成通过载人机或无人机航拍图像自动获取高精度三维地形数据,可应用于智慧城市建设。

使用移动设备的3D重建图像特征点匹配通过特征点描述子向量匹配特征点,因此特征描述子必须具有尺度不变,旋转不变,一定范围内的视角不变,对光照变化不敏感等特性通过对多幅航拍图像或者无人机拍摄的图像进行全景拼接,获取大范围广角地面图像,如何获取多福图像的重叠区域?图像特征描述子对移动手持设备获取的图像进行拼接,显著扩大可视化范围图像匹配非匹配图像对匹配图像对如何判断两幅图像是否是同一个场景?局部图像描述子图像匹配光照,对比度,尺度不同,如何增强匹配性能?一、选题的意义图像搜索通过使用局部不变特征描述子进行图像搜索InputOutputData Base视频检索查询输入Top 4 输出结果人脸认证match matchmismatch 如何使学习到的特征描述子对光照变化,局部变形不敏感?使用深度神经网络学习局部的,抽象的高级特征。

从上面介绍的例子看出,图像描述子已经广泛应用在计算机视觉领域,而且会对人们的生活方式产生非常深远的影响。

大数据时代已经带来,也给我们带来了全新的图像描述子获取方法:深度神经网络。

通过深度神经网络学习区别的特征描述子,相比传统手工精心设计的描述子,深度特征描述子能够表示更加抽象的特征,对场景光照变换,视角变换,图像传感器设置不同,色差,局部区域变形具有较高的不变性。

目前,国内在深度学习领域做得比较出色的公司有百度,阿里巴巴,腾讯,地平线,格林深瞳等。

其中,百度识图推出了一系列图像搜索产品,如相同检索,人脸检索,相似检索,图像识别,识图APP等。

百度这些产品背后都离不开基于深度神经网络的区别特征学习。

计算机视觉计算机视觉=特征学习我们从深度卷积神经网络成功应用于大规模图像分类任务中吸取灵感,利用机器学习方法构建卷积神经网络学习图像特征描述子,并应用于人脸验证。

但是我们的框架并不仅仅局限于人脸认证。

在这个框架下,可以学习到图像的深度区别特征描述子,并应用特征描述子完成其他计算机视觉任务,如图像搜索,特征点匹配,相似人脸检索等。

接下来第二部分介绍我们的算法框架。

开发平台计算机型号联想Lenove Y460c(PC) CPU Intel(R) Core(TM) i3-380M@2.53GHz GPU NVIDIA GeForce GT 425M独立显卡内存6GB(DDR3)显存1GB(DDR3)操作系统Windows 7(64位)旗舰版开发环境Matlab R2012a原理框图x1 x 2CNN1CNN2WD(x1)D(x2)L(x1,x2)CNN1和CNN2共享同样的参数,算法中CNN1和CNN2是同一个CNN网络L2D(x1)和D(x2)表示网络学习到的输入图像的区别特征,L(x1,x2)表示网络训练过程中的损失函数。

技术思路由于我们希望网络能够学习到图像特征的区别表示,对于人脸验证即同一个人在不同时刻,不同光照条件,不同表情下获取的图像需要有尽可能相似的特征表示。

因此,我们通过最小化损失函数强迫两幅同一个人脸图像特征之间的欧几里得距离尽可能小。

同时,对于两幅不是同一个人的图像,我们通过最小化损失函数强迫其特征之间的欧几里得距离尽可能大。

令E x1,x2=D x1−D(x2)2,表示两幅图像的特征之间的欧几里得距离,根据上面的分析,损失函数的选择必须满足下面的条件:1. 如果x1和x2是同一个人脸图像,则L x1,x2是E x1,x2的单调递增函数。

2. 如果x1和x2是不同人脸的图像,则L x1,x2是E x1,x2的单调递减函数。

损失函数L x1,x2=ቊD x1−D x22,max0,C−D x1−D x22,x1和x2指的是同一个人x1和x2指的不是同一个人C是一个常量,表示欧氏距离D x1−D x22的上界,实验中C值取为1,取得了较好的效果。

从上面的损失函数可以看出,如果输入两幅图像是同一个人,网络会不断学习减少这两个图像的特征之间的欧式距离。

如果输入的两幅图像不是同一个人,网络会学习增大这两个图像的特征之间的欧式距离。

二、技术方案CNN网络架构Input C1S2C3S4全连接输出层28 x 28@124 x 24@612 x 12@68 x 8@12 4 x 4@12192 x 148 x 15 x 5卷积2x2下采样5 x 5卷积2x2下采样输出层节点个数设置为48,因此,特征描述子向量的维度是48。

CNN网络架构C1层和C3层的激活函数使用sigmoid函数,S2层和S4层采用mean-pooling 策略,即对邻域内值求平均。

C1层:5*5*6+6=156S2层:0C3层:12*(5*5*6)+12=1812S4层:0输出层:192*48+48=9264网络所有参数个数:156+1812+9264=11232数据集和数据预处理网络上获取的AR数据集包含120个人,每人14幅图像,其中男性60人,女性60人。

每个人的14幅图像之间存在光照变化,表情变化等,非常接近现实中情况。

我们选择其中50个男性和50个女性的数据集作为训练数据集,剩下的10位男性和10位女性的数据集作为测试数据。

原始图像的分辨率为40 x 50,为了加快算法的训练过程和简化模型的复杂度,我们下采样所有数据集为28 x 28。

我们承认,下采样丢失了细节信息,肯定会增大算法的误差率。

但是,在目前的模型下,我们的算法已经表现出了出色的性能。

我们相信,通过输入原始数据并加大数据量,同时增加网络的复杂度,一定会获得更好的结果。

二、技术方案AR数据集训练样本展示不同于通常的网络训练过程,在我们的模型训练过程中输入的是一对图像,这两幅图像或者是同一个人,或者是不同的人,因此我们必须从训练集合中生成足够的同一个人的图像对(一致图像对)和不是一个人的图像对(非一致图像对)。

在测试图像集合中也这样做。

前面讲到,训练集合共100人,每人14幅图像,因此对于每个人的图像共有C142组合构成一致图像对,因此训练集共有一致图像对数为C142*100=9100。

然而,不同人的组合方式是巨大的,此数值是14*(99*14)*100/2=970200。

因此,为了减少非一致图像对的个数,对每个人的每幅图像,首先从剩余的99人中的随机选择50个人,然后从这50个人各自随机选择一副图像,这样对于任意一副图像和其他50幅可以组成50个不同的非一致图像对,最终非一致图像对个数是100*14*50=70000。

从上面可以看出训练数据集中非一致图像对个数大约是一致图像对个数的7倍,在实验过程中我们发现这个比例关系是合理的。

由于非一致图像对是通过随机采样获取的,因此存在采样重叠,然而一致图像对不会出现重叠,因此非一致图像对个数多于一致图像对个数也是必须的。

为了评估训练的模型,我们必须生成测试数据集,这些测试数据集是由前面提到的不在训练集中的另外20人组成的。

不同于训练集中非一致图像对个数多于一致图像对个数,测试集中一致图像对个数和非一致图像对个数大约相等。

一致图像对个数是C142*20=1820。

不同于训练集中随机采样50人,测试集中随机采样8人,因此采样重叠率大大降低,可知测试集中非一致图像对个数是20*14*8=2240。

训练和测试数据集生成一致图像对个数非一致图像对个数总数训练集91007000079100测试集182022404060训练集和测试集数据是相互独立的,测试集中的数据并未在训练集中出现过。

网络训练w t+1=w t -∆w t 前向传播w t ,b tx 1x 2b t+1=b t -∆b t反向传播∆w t =γ∗ðL(w t ,b t ,x 1,x 2)ðw t+μ∗w t +α∗∆w t−1D w t ,b t ,x 1D w t ,b t ,x 2∆b t =γ∗ðL(w t ,b t ,x 1,x 2)ðb t其中,γ表示学习系数,该模型设置为0.01。

μ表示权重衰减项,该模型设置为0.0001。

α表示冲量系数,该模型设置为0.9。

mini-batches 设置为50。

特征描述子向量归一化不同于训练过程中的损失函数直接计算两个图像描述子向量之间的欧式距离,在测试阶段,我们首先各自归一化两幅图的描述子向量,然后计算归一化之后的向量之间的欧式距离。

D′x1=D x1D x12D′x2=D x2D x22判决条件dis=D′x1−D′x22IF dis<thx1和x2是同一个人。

ELSEx1和x2不是同一个人。

End IF其中dis表示归一化描述子向量之间的欧式距离,th是设置的阈值。

三、实验结果网络对于特定输入的内部状态InputC1S2C3S4全连接层输出层48维192维三、实验结果训练集损失曲线误差快速下降误差缓慢下降共迭代205次三、实验结果训练集损失曲线局部放大误差迅速下降为了清晰显示迭代初期误差曲线,进行了局部截图训练过程中在测试集上的误差率测试误差快速下降测试误差缓慢下降误差稳定在0.06-0.08之间算法共迭代了205次训练过程中设置阈值为0.18测试集ROC曲线迅速上升,包含更大的面积性能更优ROC曲线包含的面积越大性能越好从曲线可以看出最优阈值应该选择为0.2红色曲线表示实际是不一致人脸对但是被判断为一致人脸对的个数占测试样本集中实际是不一致人脸对的总个数的百分比。

相关文档
最新文档