人脸识别文献综述解读

人脸识别文献综述解读
人脸识别文献综述解读

文献综述

1 引言

在计算机视觉和模式识别领域,人脸识别技术(Face Recognition Technology,简称FRT)是极具挑战性的课题之一。近年来,随着相关技术的飞速发展和实际需求的日益增长,它已逐渐引起越来越多研究人员的关注。人脸识别在许多领域有实际的和潜在的应用,在诸如证件检验、银行系统、军队安全、安全检查等方面都有相当广阔的应用前景。人脸识别技术用于司法领域,作为辅助手段,进行身份验证,罪犯识别等;用于商业领域,如银行信用卡的身份识别、安全识别系统等等。正是由于人脸识别有着广阔的应用前景,它才越来越成为当前模式识别和人工智能领域的一个研究热点。

虽然人类能够毫不费力的识别出人脸及其表情,但是人脸的机器自动识别仍然是一个高难度的课题。它牵涉到模式识别、图像处理及生理、心理等方面的诸多知识。与指纹、视网膜、虹膜、基因、声音等其他人体生物特征识别系统相比,人脸识别系统更加友好、直接,使用者也没有心理障碍。并且通过人脸的表情/姿态分析,还能获得其他识别系统难以获得的一些信息。

自动人脸识别可以表述为:对给定场景的静态或视频序列图像,利用人脸数据库验证、比对或指认校验场景中存在的人像,同时可以利用其他的间接信息,比如人种、年龄、性别、面部表情、语音等,以减小搜索范围提高识别效率。自上世纪90年代以来,人脸识别研究得到了长足发展,国内外许多知名的理工大学及TT公司都成立了专门的人脸识别研究组,相关的研究综述见文献[1-3]。

本文对近年来自动人脸识别研究进行了综述,分别从人脸识别涉及的理论,人脸检测与定位相关算法及人脸识别核心算法等方面进行了分类整理,并对具有典型意义的方法进行了较为详尽的分析对比。此外,本文还分析介绍了当前人脸识别的优势与困难。

2 人脸识别相关理论

图像是人们出生以来体验最丰富最重要的部分,图像可以以各种各样的形式出现,我们只有意识到不同种类图像的区别,才能更好的理解图像。要建立一套完整的人脸识别系统(Face Recognetion System,简称FRS),必然要综合运用以下几大学科领域的知识:

2.1 数字图像处理技术

数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机

对其进行处理的过程,数字图像处理最早出现于20世纪50年代,当时的电子计算机己经发展到一定水平,人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。与人类对视觉机理研究的历史相比,数字图像处理是一门相对年轻的学科,但在其短短的历史中,它却以不同程度的成功使用于几乎所有与成像有关的领域。

目前,数字图像处理技术己被广泛应用于办公自动化、工业机器人、地理数据处理、医学数据处理、地球资源遥感、交互式计算机辅助设计等领域,尤其在机器视觉应用系统中成为关键技术之一。一般的图像都是模拟图像,对于模拟图像只能采用模拟处理方式进行处理,计算机不能接受和处理模拟信号,只有将连续的模拟信号变换为离散的数字信号,或者说将模拟图像变换为数字图像才能接受。数字图像处理就是对给定的数字图像进行某些变换的过程。对含有噪声的图像,要除去噪声、滤去干扰,提高信噪比;对信息微弱的图像要进行灰度变换等增强处理;对已经退化的模糊图像要进行各种复原的处理;对失真的图像要进行几何校正等变换。除此之外,图像的合成,图像的边缘提取与分割,图像的编码、压缩与传输,图像的分析等技术也属于图像处理的内容。由此可见,图像处理就是为了达到改善图像的质量,将图像变换成便于人们观察和适于机器识别的目的[4]。

2.2 神经网络

人工神经网络是一门以对大脑的生理研究成果为基础,以用机器模拟大脑的某些生理与机制,实现某方面功能为目的的学科[6]。研究神经网络,特别是神经学习的机理,对认识和促进人自身发展有特殊的意义。

神经网络有许多具有非线性映射能力的神经元组成,神经元之间通过权系数连接。网络的信息分布式就存在连接系数中,使网络具有很高的容错性和鲁棒性。神经网络技术已经被有效地用到组合优化、图像处理、模式识别、自动控制等方面。基于神经网络技术的人脸识别方法是人脸识别研究领域中的一大重要分支。

2.3 模式识别

模式识别[7],就是通过计算机用数学技术方法来研究模式的自动处理和判读。这门学科使用计算机的方法实现人的模式识别能力,即对各种事物或现象进行分析、描述、判别和识别。在人脸识别中,如果是个人识别,则每一个人就是一个模式,预先存在数据库里的图像就是样本;如果是性别识别、种族识别或年龄识别,则不同的性别、种族或年龄就构成一个模式;如果是表情识别,则不同的表情就是一个模式。人脸识别重在讨论个人识别,人脸识

别的最终目的就是利用人脸图像确定待识别的人究竟与数据库里的哪个人是同一个人,这是一个“是谁”的问题;或要判断这个人与库里的某个人是不是同一个人,这是一个“认识或不认识”的问题。

图像识别是指对视觉图像目标按其物理特征进行分类,属于模式识别的范畴。图像识别系统的基本结构如图1所示。

图1 图像识别系统的基本结构

2.4 计算机视觉

在客观世界中,人类通过视觉识别文字和周围环境,感知外界信息。人们75%的信息量都来自视觉,因此让计算机或机器人具有视觉,是人工智能的重要环节,也是人类多年以来的梦想。在信号处理理论与高性能计算机出现后,这种希望正在逐步实现。用计算机实现对视觉信息的处理形成了一门新兴的学科——计算机视觉。

计算机视觉是一门用计算机来实现人的视觉功能,实现客观三维世界的识别的学科。计算机视觉的最终目标是模拟人类的视觉能力,理解并解释周围的世界,其研究的一个关键内容是图像的识别。

3 人脸检测与定位

人脸检测与定位是自动人脸识别系统首先需要解决的关键问题,也即检测图像中是否有人脸存在,若有,则将其从背景中分割出来并确定其在图像中的位置。在某些可以控制拍摄条件的场合,如警察拍摄罪犯照片时将人脸限定在标尺内,此时的人脸定位由于己经具备了人脸位置的先验知识而相对比较简单;证件照(身份证、护照等)由于背景相对简单,定位也比较容易。但在通常情况的实际应用中,人脸在图像中的位置预先未能得知,人脸检测与定位将受到以下因素的制约:(1) 人脸在图像中的位置、角度和尺度不同以及光照的变化;

(2) 发型、眼镜、胡须以及人脸的表情变化等;(3) 图像中的噪声影响。因此从某种程度上说,人脸检测与定位甚至比人脸模式的识别更为关键。按照人脸检测技术的发展历程,本文依据采用的主要技术方法将人脸检测分为以下四种类型:基于特征检测的方法、基于肤色检测的方法、基于模板匹配的方法、基于外观统计学习的方法。

3.1 基于特征检测的方法

基于特征的人脸检测方法依据人脸的面部几何特征、纹理特征、肤色特征进行人脸和非人脸的判别,见下表:

表1 基于特征的人脸检测与关键特征定位算法

3.2 基于肤色检测的方法

利用人脸肤色信息进行人脸检测曾经一度成为人脸检测领域的研究热点,涌现了大量的学术文献,Lee等[14]最早利用人脸肤色信息进行人脸定位;Saber[15]利用肤色、人脸形状及几何对称信息实现人脸检测和面部特征的抽取;Jones[16]利用大量的样本图像对肤色检测问题进行了分析,并建立了人脸肤色的统计模型用于人脸检测,收到了较好的检测效果;Terrillon[17]使用高斯模型和混合高斯模型在不同色度空间建立肤色模型进行人脸检测,并进行了对比分析,结果发现混合高斯模型比一般高斯模型具有更好的泛化能力;Hadid[18]基于Skin-Locus建立肤色模型,提取彩色人脸区域实现人脸检测,但需要在固定成像参数下才保证有良好的性能,鲁棒性有待提高;Martinkauppi[19]对Skin-Locus理论进行了细致分析,发现人脸肤色在各种光照条件下可以用两个二次或者多次多项式进行拟合;Comanieiu[20]采用Mean-Shift算法进行局部搜索实现人脸的检测与跟踪,该算法提高了人脸的检测速度,对遮挡和光照的鲁棒性较好,但对于复杂背景和多个人脸目标的检测不够鲁棒;Hsu[21]采用光照补偿的办法克服光照问题,从一定程度上解决了偏色、复杂背景和多人脸目标的检测问题,对人脸的位置、尺度、旋转、姿态和表情等变化具有较好的鲁棒性;Sobottka和Pitas[22]结合肤色(HSV)和人脸的形状信息来定位人脸和进行面部特征的提取;Terrillon[23]等利用高斯模型对肤色象素进行聚类,并采用神经网络对二值图像的几何距进行学习实现人脸检测;Garcia和Tziritas[24]采用量化肤色区域合并结合小波分析实现人脸检测。

总的说来,基于肤色检测的方法鲁棒性的提高依赖于肤色模型的质量,在背景相对简单

的情况下可以获得良好的检测效果;但在复杂背景中,尤其是背景中存在较多的类肤色区域时,检测质量将急剧下降。而且,肤色模型在不同人种之间会存在较大的差异,因而很难建立一个通用性很强的人脸肤色统计模型。因此,基于肤色检测的人脸检测方法的应用受到一定限制。

3.3 基于模板匹配的方法

基于模板匹配的方法首先需要人工定义一组标准或参数化的人脸模式(通常为正面),称之为模板。对于给定输入图像,通过计算其与标准模板的相关系数并根据相关系数判断是否为人脸,详见表2。这种人脸检测方法实现简单,但是由于人脸尺度、姿态和形状的不确定性,基于模板的人脸检测方法通常达不到很高的准确率。

表2 基于模板匹配的人脸检测方法

3.4 基于统计学习的方法

与上述方法不同,基于统计学习的方法主要采用大量的人脸与非人脸样本对检测分类器进行训练,将人脸检测转化为二类模式分类问题。

Propp等人是最早采用神经网络[34]进行人脸检测的学者之一,他们通过构造一个4层(两个隐藏层)神经网络实现人脸检测,但没有相关检测性能的报道;后人在他们的基础上通过优化神经网络结构提出了时延神经网络(TDNN),自组织映射神经网络(SOM)、卷积神经网络(CNN)、概率决策神经网络(PDBNN)。Feraud等人通过构造自协商神经网络(SNNN)[35]进行非线性主元分析,可以检测正面到左右60度旋转的人脸,他们的方法后来被Listen 和Multrak采用。

Sung、Rowley、Lin&Kung 等[36]采用K-mean聚类算法在特征空间建立“人脸”和“非人脸”族,采用自举(bootstrap)方法首先建立一个仅使用人脸样本和少量非人脸样本训练的初始神经网络分类器对一组图像进行训练,将误检的非人脸样本加入非人脸样本库;然后训练新的分类器,如此不断迭代,直到收集到足够多的非人脸样本,这种方法后来被许多学者所采用。

Carleson、Yang等[37]人提出的SNoW(Sparse Network of Winnows)学习方法,对检测不同特征、表情、姿态和光照条件下的人脸收到了较好的效果。其实质就是采用Winnow算法进行权值更新的稀疏神经网络;H.Schneiderman[38]提出的基于后验概率估计的方法,先对样本进行小波变换,然后对这些特征进行统计,通过统计计算训练样本的直方图求得人脸与非人脸的概率分布实现人脸检测。

不同于传统基于经验风险最小化的分类器,如贝叶斯分类器、神经网络分类器等,支持向量机分类器(SVM)以基于结构风险最小化原理最小化泛化误差,通过构造最优分类超平面实现模式分类。在这一领域,Osuna等人最早提出采用SVM分类器进行人脸检测,并提出了针对大规模数据集的SVM训练算法。实验结果显示基于SVM的人脸检测速度比早先Sung等人提出的神经网络人脸检测快足足30倍。

Nefian[39]等人采用隐马尔可夫模型(Hidden Markov Models简称HMM)检测人脸。HMM 是一种双重的随机过程,采用节点表示状态,有向边表示状态之间的转移。因此适合描述信号统计特性。Nefian等通过检测区域中的每个子区域,采用K-L变换系数作为观测矢量,通过B-W和维特比算法获得HMM的模型参数,依据区域观测序列的输出概率判决是否为人脸。

3.5 AdaBoost算法训练器

康柏研究院的Viola[40]在2001国际计算机学术年会上发表的论文标志着人脸检测技术开始走向实用。他们通过综合AdaBoost[41,42,43]和Cascade算法实现了实时人脸检测,使得人脸检测开始迈向实用化的道路。而且首次引入了“积分图像”( Integal Image)的概念,大大加快了检测过程中特征的计算速度。利用Adaboost学习算法提高一个简单分类器(弱分类器)的性能,理论上最终形成的强分类器的训练错误率接近零,而且推广性好。Viola在他的实验中定义了180000种矩形特征,通过实验选择一小部分特征形成一个有效的分类器。

继Viola等提出用于人脸检测的AdaBoost算法之后,许多学者对他们的算法进行了继承和发展。首先,Lienlxart等人提出了新的旋转Haar-Like特征,可以用于旋转人脸的快速

检测,同时提出了一些其他的Boosting法:如Discrete AdaBoost, Real AdaBoost, Gentle AdaBoost等。

Froba在AdaBoost算法基础上提出了基于灰度图像的正面和平面内旋转人脸实时检测系统,在EOM ( Edge Orientation Matching)的基础上进行扩展,引入SNoW算法进行校验,得到一个更为鲁棒的系统。

国内的李子清在AdaBoost算法基础上提出了FloatBoost算法,实现多视角人脸检测,通过从粗到精、从简单到复杂的金字塔型的人脸检测;与传统的Adaboost算法相比,能在提高人脸检测速度的同时提高检测精度。

Liu提出了基于Kullback-Leibler Boosting ( KLB)算法的分类器,解决了传统AdaBoost 算法存在的弱分类器的最优组合以及最优分类器和特征的选择问题。Viola本人也对AdaBoost算法进行了改进,提出了不对称AdaBoost算法,用于快速图像检索和人脸检测。总的说来,基于Boosting和Cascade算法的系统在速度方面具有很大的优越性,通过Haar-Like特征训练一些弱分类器,再组合成一个强分类器。如何在提高检测精度的同时不降低检测速度,可以从以下方面综合考虑:采用更优的特征描述方法,综合AdaBoost和强分类器。

3.6 多种方法的结合

人脸检测与精确定位是一个颇具挑战性的研究课题,一些效果较好的人脸检测系统并不只是采用上述的某种方法,而是将多种方法有机地融合。主流的方法大多是基于统计学习的,因此受学习样本的影响较大,不同样本集合对算法的性能也有一定影响。复杂背景中正面人脸检测已经有了比较好的结果,多姿态人脸检测仍然是目前的研究重点,虽然取得了一些进展,但如何利用人脸的深度信息解决姿态和光照问题还有待进一步研究。

4 人脸的识别方法

识别人脸主要依据那些在不同个体之间存在较大差异而对于同一个人则比较稳定的特征。具体的特征形式随识别方法的不同而不同。早期研究较多的静态人脸识别方法有基于几何特征的人脸识别方法和基于相关匹配的人脸识别方法。目前,静止图像的人脸识别方法主要有三个研究方向:一是基于统计的识别方法,包括特征脸(Eigenface)方法[44]和隐马尔科夫模型(Hidden Markov Model)[45]方法;二是基于连接机制的识别方法,包括一般的神经网络方法[46]和弹性图匹配[47](Elastic Graph Matching)方法;三是其他一些综合方法或处

理非二维灰度图像的方法。

4.1 基于几何特征的人脸识别方法

常采用的几何特征[48]有人脸的五官如眼睛、鼻子、嘴巴等的局部形状特征,脸型特征以及五官在脸上分布的几何特征。提取特征时往往要用到人脸结构的一些先验知识。在这种基于几何特征的识别中,识别总归为特征矢量之间的匹配,基于欧氏距离的判决是最常用的识别方法。识别所采用的几何特征是以人脸器官的形状和几何关系为基础的特征矢量,其分量通常包括人脸指定两点间的欧式距离、曲率、角度等。

基于几何特征的识别方法具有如下优点:符合人类识别人脸的机理,易于理解;对每幅图像只需存储一个特征矢量,存储量小;对光照变化不太敏感。这种方法同样存在如下问题:从图像中抽取稳定的特征比较困难,特别是特征受到遮挡时这种情况更为明显;对强烈的表情变化和姿态变化的鲁棒性较差;一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息丢失,更适合于粗分类。

4.2基于模板匹配的人脸识别方法

模板匹配法[49][50]是一种经典的模式识别方法,这种方法大多是用归一化互相关直接计算两幅图像之间的匹配程度。由于这种方法要求两幅图像上的目标要有相同的尺度取向和光照条件,所以预处理要做尺度归一化和灰度归一化的工作。

最简单的人脸模板是将人脸看成一个椭圆,检测人脸也就是检测图像中的椭圆。另一种方法是将人脸用一组独立的小模板表示,如眼睛模板、嘴巴模板、鼻子模板、眉毛模板和下巴模板等。但这些模板的获得必须利用各个特征的轮廓,而传统的基于边缘提取的方法很难获得较高的连续边缘。即使获得了可靠度高的边缘,也很难从中自动提取所需的特征量。为此,用弹性模板方法提取特征显示出其独到的优越性。弹性模板由一组根据特征形状的先验知识设计的可调参数所定义。为了求出这组参数,需要利用图像的边缘、峰值、谷值和强度信息及特征形状的先验知识设计合适的能量函数。参数向能量减小方向调整,当能量达到最小时,这组参数对应的模板形状最符合特征形状。

4.3 特征脸方法

特征脸(Eigenface)[51]方法是从主成分分析(Principal Component Analysis ,PCA)[53]导出的一种人脸识别和描述技术。PCA实质上是K-L展开的网络递推实现,K-L变换是图像压缩中的一种最优正交变换,其生成矩阵一般为训练样本的总体散布矩阵。特征脸方法就是将包含人脸的图像区域看作是一种随机向量,因此可以采用K-L变换获得其正交K-L基

底,对应其中较大特征值的基底具有与人脸相似的形状,因此又称之为特征脸。利用这些基底的线性组合可以描述、表达和逼近人脸图像,因此可以进行人脸识别和合成。识别过程就是将人脸图像映射到由特征脸张成的子空间上,比较其与已知人脸在特征脸空间中的位置。

近年来,据此发展了多种对特征脸的改进方法,如双子空间法、相形歧义分析方法、Fisher脸方法等。另一方面,Albert等将PCA与人脸拓扑关系结合起来提出TPCA(topological principal component analysis)方法,识别率较单一的PCA类方法有所提高。此外,与K-L 变换的思想比较接近,但不是从统计角度出发的。另一种变换是奇异值分解(SVD)的方法,即将图像矩阵的奇异值作为模式的特征矢量。

4.4 隐马尔科夫模型

隐马尔科夫模型(Hidden Markov Model,HMM)[52]是用于描述信号统计特性的一组统计模型。HMM使用马尔科夫链来模拟信号统计特性的变化,而这种变化又是间接地通过观察序列来描述的,因此,隐马尔科夫过程是一个双重的随机过程。在HMM中,节点表示状态,有向边表示状态之间的转移,一个状态可以具有特征空间中的任意特征,对同一特征,不同状态表现出这一特征的概率不同。由于HMM是一个统计模型,对于同一特征序列,可能会对应于许多状态序列,特征序列与状态序列之间的对应关系是非确定的。这种模型对于状态序列来说是隐的,故称为隐马尔科夫模型。

HMM有三个主要问题:评估、估计及解码。我们关心的是前两个问题,评估用于解决识别问题,一般采取比较有效的“向前-向后”法;估计用来产生用于识别的各个单元的HMM,采取Baum-Welch方法。

4.5 基于神经网络的方法

利用神经网络,人们就不需要为人脸识别清晰地定义特征。Kohonen将自组织映射(self-organizing map ,缩写SOM)网络应用于人脸回忆。即使当输入图像带有强烈噪声或有部分丢失,准确的回忆能力仍然可以获得。Lawrence etal.[53]使用了一个混合的神经网络系统,主要包括了一个改进的五层SOM网络和CNN网络(Convolutional neural networks),其中CNN具有局部权值共享的拓扑结构。这种结构与基于接收区域(receptive fields)的生物网络有更多的相似点,并且提高了对局部变形的忍耐性。多层感知机神经网络(Multi-layer perceptron neural networks)和径向基函数网络(radial basis function networks)也已经被用于人脸识别。

4.6 弹性匹配方法

弹性图匹配方法[54][55]是一种基于动态链接结构(Dynamic Link Architecture ,DLA)的方法。它将人脸用格状的稀疏图表示,图中的节点用图像位置的Gabor小波分解得到的特征向量标记,图的边用连接节点的距离向量标记。匹配时,首先寻找与输入图像最相似的模型图,再对图中的每个节点位置进行最佳匹配,这样产生一个变形图,其节点逼近模型图的对应点的位置。Wiskott 等人使用弹性图匹配方法,以FERET图像库做实验,准确率达到97.3%。弹性图匹配方法对光照、位移、旋转及尺度变化都不敏感,是一种优于特征脸方法的人脸识别方法。此方法的主要缺点是对每个存储的人脸需计算其模型图,计算量大,存储量大。为此,Wiskott在原有方法的基础上提出聚束图匹配,部分克服了这些缺点。在聚束图中,所有节点都已经定位在相应目标上。对于大量数据库,这样可以大大减少识别时间,另外,利用聚束图还能够匹配不同人的最相似特征。因此可以获得关于未知人的性别、胡须和眼镜等相关信息。Lee等提出了一种基于弹性图动态链接模型的方法,既取得较高的识别速度,也获得了较理想的识别率,在一定程度上克服了以往方法总是在速度与识别率之间进行折中的缺点。

4.7 其它人脸识别方法

以上几种典型的人脸识别方法,每种方法各有其优缺点,因此可以把多种方法综合起来,或同时利用不同种类的特征。要从大量人脸数据库中进行识别,单靠扩展单一种类的特征数目是不够的,而要扩展与原特征集正交的其它种类特征。Jia等在正面人脸几何特征的基础上,将侧面轮廓特征、眼睛形状特征以及人脸轮廓特征也加入特征矢量,获得了较采用单一正面人脸几何特征为特征矢量方法更高的识别率。Lai等结合小波变换与傅立叶变换提出与平移、缩放、平面内旋转无关的光谱脸人脸表征方法。

目前人脸识别研究的对象基本上都是针对二维灰度图像,除此之外,还有深度人脸图像识别和红外人脸图像识别方法。深度图像包含了人脸的深度信息,Gordon针对深度图像提出了一种基于模板的用图像数据的曲率作描述子的识别方法。他使用一个旋转的激光扫描系统获得人脸深度图像,获得的曲面数据以柱坐标形式存储,然后根据曲面上各点法向最大和最小曲率的振幅和相位值定位眼睛、鼻子和两侧脸部区域红外人脸图像(也叫温谱图)对每个人来说都是唯一的。所以可以利用温谱图识别人脸。另外在黑暗中也能捕捉红外光,因此用红外人脸图像在黑暗中也能进行识别。

对于多CCD摄像机系统,可以得到多视点人脸图像,从而可以获得人脸的立体模型,含有三维信息的特征能有效解决人脸在光照伪装或年龄变化等情况下的识别问题。

5 人脸识别系统的优势与关键技术难题

人脸是三维非刚性体,利用人脸生物特征的自动人脸识别系统与基于其他人体生物特征的识别系统相比,既具有其独特的优势,也存在一些困难。

5.1 人脸识别的优势

自动人脸识别的技术优势主要表现在:

(1) 非接触式数据采集

人脸图像可以通过标准视频或热成像技术非接触式采集,因而不会对用户造成生理上的伤害,具有非直接侵犯性。

(2) 可隐蔽性强

用于捕获人脸图像的成像设备可以隐蔽安装,特别适合解决重大安全问题、罪犯监控、过滤敏感人物(间谍、恐怖分子)及实施抓捕,是其它基于指纹、虹膜、视网膜、掌纹等生物特征的识别技术所无法比拟的。

(3) 方便、快捷及便于事后追踪

自动人脸识别系统通过非接触方式捕获人脸图像,因而无需用户过多干预。且能够在事件发生的同时记录当事人面像,从而确保系统具有良好的事后追踪能力。

(4) 可交互性强

人类可以轻而易举地识别不同个体在不同时期不同状态下的人脸,而指纹、虹膜、视网膜等其他生物特征常人很难识别。因此与授权用户的交互和主动配合可以从很大程度上提高人脸识别系统的可靠性和可用性。

5.2 人脸识别系统若干关键技术问题

现所研究的一些人脸识别系统大多在约束环境下工作,如果注册原型图像和系统工作条件基本一致并且用户主动配合,尚能够达到令人满意的效果。但真正实用的人脸识别系统需要在大规模人脸库、工作环境非可控和用户不配合(罪犯监控与搜捕)等非约束环境下工作,虽然通过采用图像预处理技术(亮度均衡和姿态学习等)能从一定程度上得以补偿,但大的光照和姿态变化仍然使得系统的稳定性急剧下降,即使是目前性能最好的人脸识别商业系统识别率也不到80%而误识率却高达10%以上,基本无法满足实际应用的需求。FERET和FRVTS对人脸识别核心算法的评测至少揭示了面临的两个主要挑战:光照和姿态变化。此外,人脸局部遮挡、人脸老化、成像设备差异、化妆、饰物等因素的影响在非约束、非合作

(如视频监控)环境下是不可避免的。现有的许多算法由于种种原因未能应用于人脸识别,至少没有在大型人脸库上进行实际测试。而且,上述问题往往在实际应用中共同出现,这进一步增加了人脸识别的难度。下面就人脸识别系统所面临的五个主要技术挑战分别加以分析:

(1) 光照变化

光照变化,尤其在室外环境下,是基于2D人脸图像人脸识别核心算法遇到的最为棘手的问题。由于光照导致人脸图像的变化甚至超过不同个体之间的差异,进而改变人脸图像在特征子空间的分布,致使基于图像比对的识别算法性能急剧下降。

虽然人们提出了一些应对光照变化的解决方案,如启发式抛弃主元的方法、基于朗伯光照模型的3D光照子空间、光照锥、人脸3D模型合成虚拟图像等等。但大多都是基于理想条件和经验数据获取的人脸模型,因而很难走向实用。面向实际应用环境的光照变化问题仍然有待于进一步研究。

(2) 姿态变化

人脸姿态变化和光照变化一样,是实用人脸识别系统真正走向应用所面临的巨大障碍。即使能获取人脸所有不同视角、不同光照和表情下的样本图像,但这将导致人脸特征数据库的急剧膨胀和人脸识别核心算法的时间复杂度和空间复杂度急剧上升。目前多数人脸识别核心算法在正面人脸情况下的识别性能尚能接受,但是实际应用中输入人脸图像难以保证总是准正面人脸图像。因此,如何提高人脸关键特征定位算法的性能,据此估计待识别人脸图像的姿态并进行人脸姿态的校正是目前人脸识别系统急需解决且极具挑战性的研究课题。

(3) 人脸图像获取质量

目前大多数人脸识别核心算法都是基于图像质量较高人脸库的测试结果,因而获得了较高的识别率。但实用人脸识别系统往往会要求对低质量人脸图像进行识别,如视频监控、信息安全和门禁系统尤其是罪犯搜捕等应用场合获取的人脸图像质量低下,因而对人脸关键特征定位、特征抽取及人脸识别核心算法的性能产生严重影响。主要存在以下三个特点:(1)视频流的质量不高。视频流通常都是室外(或室内但光照条件差)而且用户非合作的状态下获取,因而人脸图像的光照和姿态存在很大的随机性;

(2)全自动安全监控系统。被监控的对象往往会存在局部遮挡和伪装(墨镜、帽子)的情况,从而造成面部特征甚至是关键特征(眼睛)的丢失,如何很好地解决此类问题也很值得我们关注;

(3)人脸图像小。由于受到捕获条件的限制(如成像距离等),人脸图像一般都小于静

态人脸图像比对系统,有时背景中的人脸图像只能达到15X15的分辨率,这样小的人脸图像无疑会增加人脸检测、特征抽取与识别的难度。

(4) 人脸老化

人脸是活性体,随着年龄的增长面部特征(皱纹、胡须甚至面部轮廓)会发生变化,但存储在人脸数据库中的注册原型图像则不会随着时间而老化,这就是所谓的人脸老化问题,也是实用人脸识别系统无法回避的问题。FRVT2002评测结果显示,性能较好的被测系统性能以每年5%的速度下降。因而,人脸老化问题也是人脸识别商业系统特别是面向公共安全领域的应用系统鱼需解决的关键问题。

(5) 化妆与整容

人们对于美的追求和向往促使面部化妆和整容技术迅猛发展。在现代社会,面部化妆在女性群体尤其普遍,这使得基于2D人脸灰度信息的人脸识别核心算法的效果大大降低。而最近几年来兴起的面部整容技术更是从根本上改变了人脸面部的外部表观,因此需要从面部特征数据的获取方式(如红外热成像)等多种技术层面进行考虑,最大限度地解决该问题。

6 小结

自动人脸识别技术己经成为一个非常活跃的研究领域,并渗透到图像处理、模式识别、计算机视觉、神经网络等相关学科。经过近几十年的研究,己经取得了长足的发展。本文从人脸检测、面部特征抽取及人脸识别核心算法等方面进行了较为详细的总结。

当今已有为数不少的人脸识别算法已经在人脸商业识别系统中得到了体现。现有的商业系统在限定的条件下(如小型人脸库、光照和姿态约束、用户主动配合等)取得了相当高的识别率。但这并不意味着人脸识别技术已经达到了很高的水平,相反正是由于现有的商业系统都是基于限定工作环境和用户主动配合,显示出目前人脸识别核心算法的鲁棒性还有待进一步提高。影响人脸识别核心算法性能的因素很多,本文也只是对一些关键影响因素进行了分析。

因此,研究更加鲁棒、实用性更强的人脸识别核心算法仍将是人脸识别领域的重点研究内容。此外,我们在构建实用的人脸识别系统时应该根据具体任务的特定要求选择人脸识别的核心算法。

读书的好处

1、行万里路,读万卷书。

2、书山有路勤为径,学海无涯苦作舟。

3、读书破万卷,下笔如有神。

4、我所学到的任何有价值的知识都是由自学中得来的。——达尔文

5、少壮不努力,老大徒悲伤。

6、黑发不知勤学早,白首方悔读书迟。——颜真卿

7、宝剑锋从磨砺出,梅花香自苦寒来。

8、读书要三到:心到、眼到、口到

9、玉不琢、不成器,人不学、不知义。

10、一日无书,百事荒废。——陈寿

11、书是人类进步的阶梯。

12、一日不读口生,一日不写手生。

13、我扑在书上,就像饥饿的人扑在面包上。——高尔基

14、书到用时方恨少、事非经过不知难。——陆游

15、读一本好书,就如同和一个高尚的人在交谈——歌德

16、读一切好书,就是和许多高尚的人谈话。——笛卡儿

17、学习永远不晚。——高尔基

18、少而好学,如日出之阳;壮而好学,如日中之光;志而好学,如炳烛之光。——刘向

19、学而不思则惘,思而不学则殆。——孔子

20、读书给人以快乐、给人以光彩、给人以才干。——培根

NMF综述报告

人脸识别的非负矩阵分解(NMF)方法文献综述 摘要:人类对整体的感知是基于对部分的感知,NMF(非负矩阵分解,Non-negative matrix factorization)的思想正是源于此。通过对矩阵分解因子加入了非负性约束,使得对高维非负原始数据矩阵的分解结果不存在负值,且具有一定的稀疏性,因而得到了相对低维、纯加性、拥有一定稀疏特性的分解结果。与PCA(主成分分析,principal components analysis)等传统人脸识别方法相比,NMF的基图像就是人脸的各个局部特征,并且通过对经典算法的一系列优化,改进的NMF算法的识别率和鲁棒性较传统方法有着显著优势。此外,NMF在机器学习、语义理解等领域也有着重要应用。 关键词:非负矩阵分解(NMF)稀疏性改进的NMF 语义理解 一、引言 在实际中的许多数据都具有非负性,而现实中对数据的处理又要求数据的低秩性经典的数据处理方法一般不能够确保非负性的要求,如何找到一个非负的低秩矩阵来近似原数据矩阵成为一个关键问题。在这样的背景下,NMF方法应运而生。 NMF方法思想最早可以追溯到由Paatero和Tapper在1994年提出的正矩阵分解(Positive Matrix Factorization,PMF)[1];此后1999年,Lee和Seung提出了一个以广义KL散度为优化目标函数的基本NMF模型算法,并将其应用于人脸图像表示[2];2001年,Lee和Seung通过对基本NMF算法进行深入研究,又提出了两个经典的NMF算法,即基于欧氏距离测度的乘性迭代算法和基于广义KL散度的乘性迭代算法,并给出了收敛性证明[3],这两种算法称为NMF方法的基准算法,广泛应用于各个领域。 但是在实际应用中,由于经典的基准NMF算法存在收敛速度较慢,未利用统计特征,对光线、遮挡等敏感,以及无法进行增量学习等问题,各种改进的NMF算法被提出。其中包括Lin提出的基于投影梯度(Projected Gradient,PG)的NMF方法[3],该方法有着很高的分解精度;Berry提出的基于投影非负最小二乘(Projected Non-negative Least Square,PNLS)的NMF方法[5],通过这种方法得到的基矩阵的稀疏性、正交性叫基准NMF方法都更好;此外还有牛顿类方法[6]和基于有效集[7]的NMF方法等。 二、NMF的基准算法 1.NMF模型 给定一个非负矩阵(即),和一个正整数,求未知非负矩阵和,使得 用表示逼近误差矩阵。可以用下图表示该过程:

人脸识别技术综述

人脸识别研究综述 摘要:论文首先介绍了人脸识别技术概念与发展历史,解释人脸识别技术的过程与优缺点;随后对近几年人脸识别技术的研究情况与一些经典的方法进行详细的阐述,最后提出人脸识别技术在生活中的应用与展望。 关键词:人脸识别研究现状应用与展望 一、概念 人脸识别技术是基于人的脸部特征,对输入的人脸图像或者视频流。首先判断其是否存在人脸,如果存在人脸,则进一步的给出每个脸的位置、大小和各个主要面部器官的位置信息。并依据这些信息,进一步提取每个人脸中所蕴涵的身份特征,并将其与已知的人脸进行对比,从而识别每个人脸的身份。 广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 二、发展历史 人脸识别的研究历史比较悠久。高尔顿(Galton)早在1888 年和1910 年就分别在《Nature》杂志发表了两篇关于利用人脸进行身份识别的文章,对人类自身的人脸识别能力进行了分析。但当时还不可能涉及到人脸的自动识别问题。最早的AFR1的研究论文见于1965 年陈(Chan)和布莱索(Bledsoe)在Panoramic Research Inc.发表的技术报告,至今已有四十年的历史。近年来,人脸识别研究得到了诸多研究人员的青睐,涌现出了诸多技术方法。 三、过程与优缺点 人脸的识别过程: (1)首先建立人脸的面像档案。即用摄像机采集单位人员的人脸的面像文件或取他们的照片形成面像文件,并将这些面像文件生成面纹(Faceprint)编码贮存起来。 (2)获取当前的人体面像。即用摄像机捕捉的当前出入人员的面像,或取照片输入,并将当前的面像文件生成面纹编码。 (3)用当前的面纹编码与档案库存的比对。即将当前的面像的面纹编码与档案库

人脸识别技术的应用背景及研究现状

1.人脸识别技术的应用 随着社会的不断进步以及各方面对于快速有效的自动身份验证的迫切要求,生物特征识别技术在近几十年中得到了飞速的发展。作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为了自动身份验证的最理想依据。当前的生物特征识别技术主要包括有:指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。与其他识别方法相比,人脸识别由于具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受,从而得到了广泛的研究与应用。除此之外,我们还能够对人脸识别的结果作进一步的分析,得到有关人的性别,表情,年龄等诸多额外的丰富信息,扩展了人脸识别的应用前景。当前的人脸识别技术主要被应用到了以下几个方面:(1)刑侦破案公安部门在档案系统里存储有嫌疑犯的照片,当作案现场或通过其他途径获得某一嫌疑犯的照片或其面部特征的描述之后,可以从数据库中迅速查找确认,大大提高了刑侦破案的准确性和效率。 (2)证件验证在许多场合(如海口,机场,机密部门等)证件验证是检验某人身份的一种常用手段,而身份证,驾驶证等很多其他证件上都有照片,使用人脸识别技术,就可以由机器完成验证识别工作,从而实现自动化智能管理。 (3)视频监控在许多银行,公司,公共场所等处都设有24小时的视频监控。当有异常情况或有陌生人闯入时,需要实时跟踪,监控,识别和报警等。这需要对采集到的图像进行具体分析,且要用到人脸的检测,跟踪和识别技术。 (4)入口控制入口控制的范围很广,既包括了在楼宇,住宅等入口处的安全检查,也包括了在进入计算机系统或情报系统前的身份验证。 (5)表情分析根据人脸图像中的面部变化特征,识别和分析人的情感状态,如高兴,生气等。此外,人脸识别技术还在医学,档案管理,人脸动画,人脸建模,视频会议等方面也有着巨大的应用前景。 2.人脸识别技术在国外的研究现状 当前很多国家展开了有关人脸识别的研究,主要有美国,欧洲国家,日本等,著名的研究机构有美国MIT的Media lab,AI lab,CMU的Human-Computer I nterface Institute,Microsoft Research,英国的Department of Engineerin g in University of Cambridge等。综合有关文献,目前的方法主要集中在以下几个方面: (1)模板匹配 主要有两种方法,固定模板和变形模板。固定模板的方法是首先设计一个或几个参考模板,然后计算测试样本与参考模板之间的某种度量,以是否大于阈值来判断测试样本是否人脸。这种方法比较简单,在早期的系统中采用得比较

人脸识别文献综述

文献综述 1 引言 在计算机视觉和模式识别领域,人脸识别技术(Face Recognition Technology,简称FRT)是极具挑战性的课题之一。近年来,随着相关技术的飞速发展和实际需求的日益增长,它已逐渐引起越来越多研究人员的关注。人脸识别在许多领域有实际的和潜在的应用,在诸如证件检验、银行系统、军队安全、安全检查等方面都有相当广阔的应用前景。人脸识别技术用于司法领域,作为辅助手段,进行身份验证,罪犯识别等;用于商业领域,如银行信用卡的身份识别、安全识别系统等等。正是由于人脸识别有着广阔的应用前景,它才越来越成为当前模式识别和人工智能领域的一个研究热点。 虽然人类能够毫不费力的识别出人脸及其表情,但是人脸的机器自动识别仍然是一个高难度的课题。它牵涉到模式识别、图像处理及生理、心理等方面的诸多知识。与指纹、视网膜、虹膜、基因、声音等其他人体生物特征识别系统相比,人脸识别系统更加友好、直接,使用者也没有心理障碍。并且通过人脸的表情/姿态分析,还能获得其他识别系统难以获得的一些信息。 自动人脸识别可以表述为:对给定场景的静态或视频序列图像,利用人脸数据库验证、比对或指认校验场景中存在的人像,同时可以利用其他的间接信息,比如人种、年龄、性别、面部表情、语音等,以减小搜索范围提高识别效率。自上世纪90年代以来,人脸识别研究得到了长足发展,国内外许多知名的理工大学及TT公司都成立了专门的人脸识别研究组,相关的研究综述见文献[1-3]。 本文对近年来自动人脸识别研究进行了综述,分别从人脸识别涉及的理论,人脸检测与定位相关算法及人脸识别核心算法等方面进行了分类整理,并对具有典型意义的方法进行了较为详尽的分析对比。此外,本文还分析介绍了当前人脸识别的优势与困难。 2 人脸识别相关理论 图像是人们出生以来体验最丰富最重要的部分,图像可以以各种各样的形式出现,我们只有意识到不同种类图像的区别,才能更好的理解图像。要建立一套完整的人脸识别系统(Face Recognetion System,简称FRS),必然要综合运用以下几大学科领域的知识: 2.1 数字图像处理技术 数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机

基于matlab人脸识别技术 开题报告

毕业设计(论文)开题报告 毕业设计(论文)课题情况,根据所查阅的文献资料,每人撰写2500字以上的文献综述,文后应列出所查阅的文献资料。 基于matlab人脸识别技术的实现 文献综述 一、MATLAB概述 MATLAB是矩阵实验室(Matrix Laboratory)的简称,是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。MATLAB主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了传统非交互式程序设计语言(如C、Fortran)的编辑模式,代表了当今国际科学计算软件的先进水平。应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。而在本文中主要用到的功能是图像处理功能。 二、BP神经网络概述 人工神经网络(Artificial Neural Net works,简写为ANNs)也简称为神经网络(NNs)或称作连接模型(Connectionist Model),它是一种模范动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。 人工神经网络发展的主要历程有:20世纪50年代末,Rosenblatt提出的感知器模型和Widrow提出的自适应线性元件,出现了简单的线性分类器;1986年,Rumelhart和Mcllelland 提出了层网络“误差反向传播算法(BP)”,使有导师学习多层感知器网络(ML PN)模式分类器走向实用化,在此基础上又派生出若干前向网络,如径向基函数网络( RBFN)和函数链网络等;1982年,美国加州工学院的物理学家Hopfield提出的一种用于联想记忆和优化计算的反馈网络模型,由于引进了“能量函数” 的概念,使网络走向具体电路有了保证;20世纪70年代,Watanabe 提出了使用模式子空间的概念来设计不同类别对应的子空间,由不同类别聚类的子空间实现模式识别; Kohonen提出的自组织特征映射网络模型等都为神经网络模式识别理论提供了进一步的根据。 构成人工神经网络的三个基本要素是:神经元、络拓扑结构和网络的训练(学习)方法。神经元(节点)的作用是把若干输入加权求和,并对这种加权和进行非线性处理后输出。神经元的选择一般有以下特点:每个神经元都具有多个输入、个输出,具有闭值,采用非线性函数。 1、神经元

单样本人脸识别综述

单样本人脸识别综述 南京杭空航天大学 ELSEVIER 摘要 当前人脸识别技术主要挑战之一在于样本收集的困难性。很少的样本意味着在收集样本时付出更少的劳动,在存储和处理它们是付出更少的代价。不幸的是,许多现有的人脸识别技术很大程度上依赖于训练样本集的规模和代表性,如果系统中仅有一个训练样本,则将会导致严重的性能下降甚至无法工作。这种情况称之为“单样本”问题,即给出每人一幅人脸的存储数据库,目标是仅根据单幅人脸图像在不同的姿态、光照等条件下从数据库中识别人脸图像的身份。由于训练集非常有限,这样的任务队当前大多数算法而言都是非常具有挑战性的。现有许多技术正试图解决该问题,本文的目的是对这些算法进行分类和评估,对较为突出的算法进行了描述和批判的分析。并讨论了诸如数据采集、小样本规模的影响、系统评估等一些相关问题,同时提出了一些未来研究中具有前景的方向。 关键词:人脸识别;单训练样本 1 引言 作为少数几个同时具有高精度和低干涉的生物特征方法,人脸识别技术在信息安全、法律事实和监控、智能车、访问控制等方面具有大量的潜在应用。因此,在过去20年中人脸识别技术已经受到了来自学术和工业方面的极大关注。近来,一些作者已经从不同方面调查和评估了现有的人脸识别技术。例如,Samal et al. [4] and Valentin et al. [5]分别对基于特征和基于神经网络的技术进行了调研。Yang等[6]评述了人脸识别技术,Pantic and Rothkrantz[7]对自动面部表达分析进行了调研,Daugman [3]指出了涉及人脸识别系统有效性的几个关键问题,而最近的综述应该是Zhao et al. [1],他对许多最新的技术进行了评论。 人脸识别的目的是从人脸图像的数据库中的静态图像或视频图像中识别或验证一个或多个人。许多研究工作集中在怎样提高识别系统的精度,然而,大部分研究工作似乎忽视了一个可能来源于人脸数据库的潜在问题,即可能由于样本采集的困难或由于系统存储空间的限制,数据库中可能对每一个人只存储了一副样本图像。在这种条件下,诸如特征脸(Eigenface)和Fisher人脸识别技术等传统方法将导致严重的性能下降甚至无法工作(详见第2节)。这个问题称之为单样本问题,即即给出每人一幅人脸的存储数据库,目标是仅根据单幅人脸图像在不同的姿态、光照等条件下从数据库中识别人脸图像的身份。由于其挑战性和现实应用的重要性,这个问题很快成为了人脸识别技术近年来的一个研究热点,许多专用技术被开发来解决该问题,例如合成虚拟样本,局部化单一训练图像,概率匹配和神经网络方法。 本文最主要的贡献是给出这些从单一人脸图像进行人脸识别的特定方法一个综合的、评论性的综述。我们相信这些工作是对参考文献[1–7]的一个有用的补充,这些文献中所考察的大多数技术没有考虑单样本问题。实际上,通过对这个问题更多的关注和技术的详细研究,我们希望这篇综述能够对这些技术的基本原则、相互联系、优缺点以及设计优化提供更多深刻的理解。对一些相关问题,如数据收集、小样本空间的影响以及系统评估等也进行了讨论。 接下来我们首先试图建立有关什么是单样本问题以及为什么、何时应道考虑这个问题的一个公共背景。特别的,我们也讨论了该问题所不需要考虑的方面。在第三节我们继续回顾有关该问题的前沿技术。借此,我们希望能够借鉴一些有用的经验来帮助我们更有效地解决这个问题。在第四节中,我们讨论了有关性能评估的几个问题。最后,在第五节中我们通过讨论几个具有前景的研究方向对单样本问题进行了总结。

人脸识别技术的应用背景及研究现状

人脸识别技术的应用背景及研究现状 1.人脸识别技术的应用 随着社会的不断进步以及各方面对于快速有效的自动身份验证的迫切要求,生物特征识别技术在近几十年中得到了飞速的发展。作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为了自动身份验证的最理想依据。当前的生物特征识别技术主要包括有:指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。与其他识别方法相比,人脸识别由于具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受,从而得到了广泛的研究与应用。除此之外,我们还能够对人脸识别的结果作进一步的分析,得到有关人的性别,表情,年龄等诸多额外的丰富信息,扩展了人脸识别的应用前景。当前的人脸识别技术主要被应用到了以下几个方面:(1)刑侦破案公安部门在档案系统里存储有嫌疑犯的照片,当作案现场或通过其他途径获得某一嫌疑犯的照片或其面部特征的描述之后,可以从数据库中迅速查找确认,大大提高了刑侦破案的准确性和效率。 (2)证件验证在许多场合(如海口,机场,机密部门等)证件验证是检验某人身份的一种常用手段,而身份证,驾驶证等很多其他证件上都有照片,使用人脸识别技术,就可以由机器完成验证识别工作,从而实现自动化智能管理。 (3)视频监控在许多银行,公司,公共场所等处都设有24小时的视频监控。当有异常情况或有陌生人闯入时,需要实时跟踪,监控,识别和报警等。这需要对采集到的图像进行具体分析,且要用到人脸的检测,跟踪和识别技术。 (4)入口控制入口控制的范围很广,既包括了在楼宇,住宅等入口处的安全检查,也包括了在进入计算机系统或情报系统前的身份验证。 (5)表情分析根据人脸图像中的面部变化特征,识别和分析人的情感状态,如高兴,生气等。此外,人脸识别技术还在医学,档案管理,人脸动画,人脸建模,视频会议等方面也有着巨大的应用前景。 2.人脸识别技术在国外的研究现状 当前很多国家展开了有关人脸识别的研究,主要有美国,欧洲国家,日本等,著名的研究机构有美国MIT的Media lab,AI lab,CMU的Human-Computer I nterface Institute,Microsoft Research,英国的Department of Engineerin g in University of Cambridge等。综合有关文献,目前的方法主要集中在以下几个方面:

人脸检测和识别技术的文献综述

人脸识别技术综述 摘要:在阅读关于人脸检测识别技术方面文献后,本文主要讨论了人脸识别技术的基本介绍、研究历史,人脸检测和人脸识别的主要研究方法,人脸识别技术的应用前景,并且总结了人脸识别技术的优越性和当下研究存在的困难。 关键词:人脸识别;人脸检测;几何特征方法;模板匹配方法;神经网络方法;统计方法;模板匹配;基于外观方法; 随着社会的发展,信息化程度的不断提高,人们对身份鉴别的准确性和实用性提出了更高的要求,传统的身份识别方式已经不能满足这些要求。人脸识别技术(FRT)是当今模式识别和人工智能领域的一个重要研究方向.虽然人脸识别的研究已有很长的历史,各种人脸识别的技术也很多,但由于人脸属于复杂模式而且容易受表情、肤色和衣着的影响,目前还没有一种人脸识别技术是公认快速有效的[1]基于生物特征的身份认证技术是一项新兴的安全技术,也是本世纪最有发展潜力的技术之一[2]。 1. 人脸识别技术基本介绍 人脸识别技术是基于人的脸部特征,一个完整的人脸识别过程一般包括人脸检测和人脸识别两大部分,人脸检测是指计算机在包含有人脸的图像中检测出人脸,并给出人脸所在区域的位置和大小等信息的过程[3],人脸识别就是将待识别的人脸与已知人脸进行比较,得

出相似程度的相关信息。 计算机人脸识别技术也就是利用计算机分析人脸图象, 进而从中出有效的识别信息, 用来“辨认”身份的一门技术.人脸自动识别系统包括三个主要技术环节[4]。首先是图像预处理,由于实际成像系统多少存在不完善的地方以及外界光照条件等因素的影响,在一定程度上增加了图像的噪声,使图像变得模糊、对比度低、区域灰度不平衡等。为了提高图像的质量,保证提取特征的有有效性,进而提高识别系统的识别率,在提取特征之前,有必要对图像进行预处理操作;人脸的检测和定位,即从输入图像中找出人脸及人脸所在的位置,并将人脸从背景中分割出来,对库中所有的人脸图像大小和各器官的位置归一化;最后是对归一化的人脸图像应用人脸识别技术进行特征提取与识别。 2. 人脸识别技术的研究历史 国内关于人脸自动识别的研究始于二十世纪80年代,由于人脸识别系统和视频解码的大量运用,人脸检测的研究才得到了新的发展利用运动、颜色和综合信息等更具有鲁棒性的方法被提出来变形模板,弹性曲线等在特征提取方面的许多进展使得人脸特征的定位变得更为准确。 人脸识别的研究大致可分为四个阶段。第一个阶段以Bertillon,Allen和Parke为代表,主要研究人脸识别所需要的面部特征;第二个阶段是人机交互识别阶段;第三个阶段是真正的机器自动识别阶段;第四个阶段是鲁棒的人脸识别技术的研究阶段。目前,国外多所

人脸识别技术综述解读

人脸识别研究 代上 (河南大学环境与规划学院河南开封 475004) 摘要:现今世界经济发展迅速,而面对繁杂的社会安全问题却显得有些捉襟见肘,人脸识别技术能够因通过面部特征信息识别身份而受到广泛关注。人脸识别通常使用采集含有人脸图像或视频流的设备,将收集到的人脸信息进行脸部检测,进而与数据库中已有信息进行对比确定被识别对象的身份,已经广泛的应用于公共安全、教育等多个方面,且在以后的社会发展中具有很大的应用前景。本文主要对人脸识别的发展历程、主要识别方法予以总结概括,并对其应用范围与发展趋势进行分析。 关键词:人脸识别;方法;应用;发展 1引言 人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。该项技术目前应用到社会的各个领域,例如个人家庭自动门的安全系统、犯罪人的身份识别系统、银行自动取款的服务系统等。 人脸识别系统给人带了很多方便,应用能力很强,但是人脸识别仍然有很多阻碍其发展的困难之处。主要表现在:在收集图像中目标自身的影响;在系统收集图像的过程中容易受到各种外界因素以及系统收集图像之后由于其它因素造成的面部损伤所带来的影响;随着时间的变迁,人的面部逐步发生变化的影响。这些都对人脸识别技术的发展造成了一定的困难,也使得该项技术面临着多种挑战性。 2 人脸识别研究的发展历史与研究现状 2.1发展历史 很早在19世纪80年代就有关于通过人脸对人类的身份进行辨别的论文发表,但是由于技术水平与设备的限制,人脸识别技术并没有受到重视。直到20世纪60年代末,Blcdsoc[1]提出了人脸识别研究的雏形,人脸识别技术才被人们接受。 在人脸识别研究的早期阶段,人们主要研究的是人脸识别的各种方法,但是在实际应用方面却没有得到实质性的进展。 进入20世纪90年代末的时候,人脸识别技术进入了一个快速发展阶段,在这个时期各种新的人脸识别方法相继出现,并创建了人脸图像数据库,对人脸识别的发展起到了巨大的促进作用。在实际应用方面也取得了很大的进展,运用人脸识别技术的产品逐渐进入了社会市场。 进入21世纪以后,人脸识别技术已经逐步发展成熟,但是由于非理想条件如(光照、天气、姿态)的影响,对人脸识别技术的要求也更高。为了解决这些不利因素所造成的影响,研究者们一直努力寻找更加趋于完美的方法,从而减少这些因素所带来的不利影响。 2.2研究现状 近几年来,人脸识别技术已经从以前的认知阶段发展到了实际应用阶段。但是由于每个人的面部都会因为各种不同的原因发生改变,这给人脸识别带来了不小的影响。如光照不同

人脸识别技术综述 论文

本科生毕业论文(设计) 题目人脸识别技术综述 学院计算机学院 专业计算机科学与技术 学生姓名陶健 学号 0643041077 年级 2006 指导教师周欣 教务处制表 二Ο年月日

人脸识别技术综述 计算机科学与技术 学生陶健老师周欣 [摘要]随着社会信息化,网络化得不断发展,个人身份趋于数字化,隐性化,如何准确的鉴定,确保信息安全得到越来越多的重视。人脸识别,一种应用比较广泛的生物识别方法,在基于人脸固有的生物特征信息,利用模式识别和图行图像处理技术来对个人身份进行鉴定,在国家安全,计算机交互,家庭娱乐等其他很多领域发挥着举足轻重的作用,能提高办事效率,防止社会犯罪等,有着重大的经济和社会意义。 本文主要研究了人脸识别在图像检测识别方面的一些常用的方法。由于图像处理的好坏直接影响着定位和识别的准确率,因此本文对图像的一些识别算法做了着重的介绍,例如基于二维Gabor小波矩阵表征人脸的识别算法,基于模型匹配人脸识别算法等。此外,本文还提及了一般人脸识别系统的设计,并着重介绍了图像预处理环节的光线补偿,图像灰度化等技术,使图像预处理模块在图像处理过程中能取到良好的作用,提高图像识别和定位的准确率。 [主题词]:人脸识别;特征提取;图像预处理;光线补偿

Face Recognition Overview Computer Science Student:TAO Jian Adviser: ZHOU Xin [Abstract] With the information society, network was growing, personal identity tends to digital, hidden, how to accurately identify, to ensure that information security is more and more attention. Face recognition, an application of biometric identification methods more widely, based on biometric facial information inherent in the use of pattern recognition and image processing techniques to map line of personal identity ,play a great role in the national security, computer interaction, family entertainment and many other areas. Face recognition can improve efficiency, prevent social crime, of course it has significant economic and social significance. This paper studies aspects of face recognition in image detection and some common methods of identification. As the image processing directly impact on the accuracy of location and identification, so some of image recognition algorithm will be focused presentation, such as Gabor wavelet-based two-dimensional matrix representation of face recognition algorithms, model-based matching face recognition algorithm. In addition, the article also mentioned a general recognition system design, and highlights the image preprocessing part of the light compensation, gray image techniques, the image preprocessing module in the image processing to get to the good , and improve image recognition and positioning accuracy. [Key Words] Face recognition; feature extraction; image preprocessing; light compensation

人脸表情识别

图像处理与模式识别 ------人脸表情识别介绍摘要:人脸表情是我们进行交往和表达情绪的一种重要手段,不经过特殊训练,人类对其面部表情往往很难掩饰,所以,通过对人脸表情进行分析,可以获得重要的信息。人脸表情识别是人机交互的智能化实现的一个重要组成部分,也是模式识别、图像处理领域的一个重要研究课题,近几年来,受到了越来越多的科研人员的关注。 本文综述了国内外近年来人脸表情识别技术的最新发展状况,对人脸表情识别系统所涉及到的关键技术: 人脸表情特征提取,做了详细分析和归纳。 关键词:人脸定位;积分投影;人脸表情识别;流形学习;局部切空间排列Abstract:Facial expression is a kind of important means that we communicate and express the special training, People often difficult to conceal their facial , by the analyzing facial expression, we can obtain important information. Facial expression recognition is an important component that the implementation of human-computer interaction, and an important research topic in the field of pattern recognition, image processing, in recent years, more and more researchers focus on this topic. In this paper,we present the latest development of this area,and give a detailed analysisand summary for facial

人脸自动识别方法综述_周杰

人脸自动识别方法综述 周 杰,卢春雨,张长水,李衍达 (清华大学自动化系,北京100084) 摘 要: 人脸自动识别是模式识别、图像处理等学科的一大研究热点,近几年来关于人脸识别的研究取得了很大进展.本文重点对近三、四年来人脸识别的研究进行综述并对各种方法加以评论. 关键词: 人脸自动识别;人脸检测;人脸定位 中图分类号: TP39114 文献标识码: A 文章编号: 0372-2112(2000)04-0102-05 A Su rvey of Automa tic Human Face Recognition ZHOU Jie,LU Chun -yu,ZHANG Chang -shui,LI Yan -da (De partment o f Automation ,Tsinghua Unive rsit y ,Be ijing 100084,China) Abstract: Automatic human face recogni tion is attractive in pattern recogniti on and i mage processing.In this paper we gave a survey of automatic human face recogni tion,mainly ai ming at the latest progress. Key words: automatic hu man face recognition;face detection;face localization 1 引言 随着社会的发展,各个方面对快速有效的自动身份验证的要求日益迫切.由于生物特征是人的内在属性,具有很强的自身稳定性和个体差异性,因此是身份验证的最理想依据.这其中,利用人脸特征进行身份验证又是最自然直接的手段,相比其它人体生物特征它具有直接、友好、方便的特点,易于为用户所接受[1]. 人脸识别是人类视觉最杰出的能力之一,它的研究涉及模式识别、图像处理、生理学、心理学、认知科学,与基于其它生物特征的身份鉴别方法以及计算机人机感知交互领域都有密切联系,因此早在六七十年代即引起了研究者的强烈兴趣.进入九十年代,由于各方面对人脸识别系统的迫切需求,人脸识别的研究重新变得非常热门.目前美国等国有许多研究组在从事人脸识别的研究,这些研究受到军方、警方及大公司的高度重视和资助,美国军方每年还专门组织人脸识别比赛以促进这一领域的发展.在国内,也开始有一些学校从事人脸识别相关的研究.近几年来关于人脸识别的研究取得了很大进步,国际上发表有关论文的数量大幅增长,IEEE 的PAM I 汇刊还于1997年7月出版了人脸识别专辑,每年的国际会议上关于人脸识别的专题也屡屡可见.而目前人脸识别综述的文章还是截止到1994年,因此我们认为非常有必要对近几年的研究工作进行一下总结.在本文中我们将对人脸识别方法进行综述,其中主要介绍近三、四年的研究工作,之前的研究工作请参看文[2,3]. 2 人脸自动识别系统 人脸自动识别系统包括两个主要技术环节(如图1所 示):首先是人脸检测和定位,即从输入图像中找到人脸及人脸存在的位置,并将人脸从背景中分割出来,然后才是对归一化的人脸图像进行特征提取与识别 . 图1 人脸自动识别系统构成 这两个环节的研究独立性很强.由于在很多特定情况下人脸检测与定位的工作比较简单,因此/特征提取与识别0环节得到了更为广泛和深入的研究;而近几年来随着人们越来越关心各种复杂情形下的人脸自动识别系统,人脸检测与定位才得到了较多的重视. 评价一个人脸自动识别系统的标准,一个是误识率即将某人错识别为其他人,另一个是虚警率即将其他人识别为这个人.这二者之间是存在矛盾的,所以在实际问题中往往需要进行某种折衷.如,在安全性要求较高的计算机登录系统中,必须要求虚警率要尽可能低,而误识率则可以高一些,这样只是增加合法用户的等录时间,并不会降低计算机系统的安全性.这一点同样适用于特征提取与识别环节,但是对于人脸检测与定位,我们一般则要求误识率要尽可能低,因为这样才可以保证所要识别的人不会在这一步就丢失. 收稿日期:1999-03-15;修订日期:1999-07-06基金项目:自然科学基金(No.69775009)资助课题 第4期2000年4月电 子 学 报ACTA ELECTRONICA SINICA Vol.28 No.4 April 2000

面部表情识别与面孔身份识别的独立加工与交互作用机制_汪亚珉

心理科学进展 2005,13(4):497~516 Advances in Psychological Science 面部表情识别与面孔身份识别的 独立加工与交互作用机制* 汪亚珉1,2 傅小兰1 (1中国科学院心理研究所,脑与认知国家重点实验室,北京 100101)(2中国科学院研究生院,北京 100039) 摘 要面孔识别功能模型认为,面部表情识别与面孔身份识别是两条独立的并行路径。以往诸多研究者都认可并遵循二者分离的原则。但近期研究表明,面部表情识别与面孔身份识别存在交互作用。首先总结和分析已有的面部表情识别的研究成果,评述神经心理学与认知神经科学研究中的论争,然后介绍人脸知觉的分布式神经机制以及相关的实验证据,最后提出面部表情识别与面孔身份识别的多级整合模型,并展望研究前景。 关键词面孔身份识别,面部表情识别,面孔识别功能模型,人脸知觉的分布式神经模型,多级整合模型。分类号 B842 面孔识别一直备受研究者关注。20世纪70年代,Ekman和Frisen系统地研究了人脸基本表情的文化普遍性,并从解剖学角度提出了6种基本的面部表情[1]。20世纪80年代,Bruce和Young系统地研究了人对面孔的识别及其影响因素,提出了经典的面孔识别功能模型[2]。自此,面孔识别成为认知科学研究领域中的热点问题之一。 人能轻易地从不同表情中识别出同一个人的面孔(即面孔身份识别,facial identity recognition),也能从不同人的面孔上识别出同一种表情(即面部表情识别,facial expression recognition),识别得如此精巧,以至众多研究者相信,识别面孔与识别表情 收稿日期:2005-04-24 * 本研究得到中国科技部973项目(2002CB312103)、国家自然科学基金重点项目(60433030)和面上项目 (30270466)、中国科学院心理研究所创新重点项目 (0302037)经费支持。 通讯作者:傅小兰,E-mail: fuxl@https://www.360docs.net/doc/c37506872.html, 两者相互独立,互不干扰[2~7]。那么,这种分离识别究竟是如何实现的?面孔身份识别与面部表情识别究竟是彼此独立的还是相互作用的?这已成为认知科学(尤其是计算机视觉)面孔识别研究领域中亟待解决的一个重要问题。 在过去开展的大量研究中,对面孔身份识别问题的探讨相对比较深入,而对面部表情识别的研究则囿于经典功能模型,并未能取得实质性进展。近年来随着脑认知研究技术的发展,面部表情识别的研究也在不断深入,研究者对面部表情识别与面孔身份识别间的关系也提出了新的阐释。本文在综述已有研究的基础上,试图进一步探讨面部表情识别与面孔身份识别之间的独立加工与交互作用机制。首先,基于经典面孔识别功能模型,分析传统的面孔身份识别与面部表情识别的并行分离加工观点,以及行为学、神经心理学与认知神经科学的研究发现;其

模式识别文献综述报告

指导老师:马丽 学号:700 班级: 075111 姓名:刘建 成绩: 目录 ............................................................ 一、报告内容要点............................................................ 二、《应用主成分分解(PCA)法的图像融合技术》............................................................ 三、《基于类内加权平均值的模块 PCA 算法》............................................................

四、《PCA-LDA 算法在性别鉴别中的应用》 ............................................................ 五、《一种面向数据学习的快速PCA算法》 ............................................................ 六、《Theory of fractional covariance matrix and its applications in PCA and 2D-PCA》 ............................................................ 七、课程心得体会 ............................................................ 八、参考文献 ............................................................ 一、报告内容要点 ①每篇论文主要使用什么算法实现什么 ②论文有没有对算法做出改进(为什么改进,原算法存在什么问题,改进方法是什么) ③论文中做了什么对比试验,实验结论是什么?可以加入自己的分析和想法,例如这篇论文还存在什么问题或者缺点,这篇论文所作出的改进策略是否好,你自己对算法有没有什么改进的想法? 二、《应用主成分分解(PCA)法的图像融合技术》 第一篇《应用主成分分解(PCA)法的图像融合技术》,作者主要是实现用PCA可以提取图像数据中主要成分这一特点,从元图像获得协方差矩阵的特征值和特征向量,据此确定图像融合算法中的加权系数和最终融合图像。 作者在图像融合的算法上进行改进,用PCA获得待融合的每幅图像的加权系数Wi。是这样实现的:计算待融合的i幅图像数据矩阵的协方差矩阵,从中获

自发表情识别方法综述

收稿日期:2015-04-03;修回日期:2015-05-26 基金项目:国家自然科学基金资助项目(61463034) 作者简介:何俊(1969-),男,江西东乡人,副教授,硕导,博士,主要研究方向为人机交互技术、模式识别等(boxhejun@tom.com);何忠文(1986-),男,江西九江人,硕士研究生,主要研究方向为人机交互技术、模式识别等;蔡建峰(1990-),男,河北人,硕士研究生,主要研究方向为人机交互;房灵芝(1988-),女,山东人,硕士研究生,主要研究方向为人机交互. 自发表情识别方法综述* 何 俊,何忠文,蔡建峰,房灵芝 (南昌大学信息工程学院,南昌330031) 摘 要:介绍了目前自发表情识别研究的现状与发展水平,详细阐述了自发表情识别研究的内容和方法,以及自发表情识别研究的关键技术,旨在引起研究者对此新兴研究方向的关注与兴趣,从而积极参与对自发表情识别问题的研究,并推动与此相关问题的进展。关键词:表情识别;自发表情;特征提取 中图分类号:TP391.41 文献标志码:A 文章编号:1001-3695(2016)01-0012-05doi:10.3969/j.issn.1001-3695.2016.01.003 Surveyofspontaneousfacialexpressionrecognition HeJun,HeZhongwen,CaiJianfeng,FangLingzhi (Information&EngineeringCollege,NanchangUniversity,Nanchang330031,China) Abstract:Thispaperintroducedtheactualityandthedevelopinglevelofspontaneousfacialexpressionrecognitionatthe presenttime,andpaidparticularattentiontothekeytechnologyontheresearchofspontaneousfacialexpressionrecognition.Thispaperaimedtoarouseresearchers’attentionandinterestsintothisnewfield,toparticipateinthestudyofthespontane-ousfacialexpressionrecognitionproblemsactively,andtoachievemoresuccessescorrelatedtothisproblem.Keywords:facialexpressionrecognition;spontaneousfacialexpression;featureextraction 表情识别被视为未来情感人机交互的重要技术[1] ,吸引了国内众多高校和科研机构的参与和研究[2~6]。但目前国内 外研究中比较常用的表情数据库中的人脸表情大都固定为正面,任务仅限于识别Ekma提出的六种基本表情(愤怒、高兴、悲伤、惊讶、厌恶和恐惧)。这不仅与实际表情不相符,而且忽视了真实表情中特有的脸部肌肉形变与头部运动之间的时空相关性。谷歌申请的新一代表情识别专利,挤眉弄眼方可解锁手机;荷兰开发的诺达斯(Noldus)面部表情分析系统是世界上第一个商业化开发的面部表情自动分析工具,用户使用该系统能够客观地评估个人的情绪变化,可以跟踪人的表情变化。但二者均要求测试者的头姿基本保持不动,实时连续头姿估计阻碍了其在手机等智能终端领域的应用。因此,面向实际应用的 非正面表情识别研究在国内外日益受到重视[7,8] 。 近十几年来,开展自发表情识别研究的机构主要有美国的加利福尼亚大学、卡耐基梅隆大学机器人研究所、匹兹堡大学心理学系,伊利诺伊大学、沃森研究中心、贝克曼研究所、伦斯勒理工学院、麻省理工大学媒体实验室、丹佛大学、德克萨斯大学计算机视觉研究中心、新泽西技术学院、芬兰的奥卢大学计算机科学与工程系机器视觉组、荷兰的阿姆斯特丹大学信息学院、澳大利亚的昆士兰科技大学科学与工程学院、加拿大的麦吉尔大学、日本的庆应义塾大学、爱尔兰的爱尔兰国立大学计算机视觉和成像实验室,中国的清华大学和中国科学技术大学等已经有人做了大量工作。目前该领域比较重要的国际会议包括计算机视觉与模式识别会议(InternationalConferenceonComputerVisionandPatternRecognition,CVPR)、模式识别会议 (InternationalConferenceonPatternRecognition,ICPR)、人脸与姿态自动识别会议(InternationalConferenceonAutomaticFaceGestureRecognition,FGR)。关于非正面表情识别的研究文章 逐年增多,但国内还只是刚开始涉足该领域的研究[9] ,一些非 正面表情识别中的关键技术尚有待突破。但总的来说,对目前自发表情识别的研究和探索还处于初级阶段,对自发表情识别的研究还需要研究人员共同的努力。本文介绍了常用的自发表情数据库以及自发表情识别关键技术研究进展。 1 自发表情数据库 1)USTC-NVIE数据库 USTC-NVIE(naturalvisibleandinfraredfacialexpressions) 数据库[10] 是由中国科学技术大学安徽省计算与通讯软件重点 实验室建立的一个大规模的视频诱发的集自发表情和人为表情的可见光和红外自发表情数据库。其中自发表情库由自发的表情序列和夸张帧组成,人为表情库仅由中性帧和夸张帧组成。该表情数据库包含年龄在17~31周岁的215名被试者的自发和人为的六种表情。 2)VAM数据库 VAM数据库[11] 采用的是以参加电视访谈节目(TVtalk show)的方式诱发的自发表情数据库,记录了节目中年龄在16~69周岁的6位男嘉宾和14位女嘉宾总共20位嘉宾的面部表情和语音信息。该数据集由834名评估者使用两种方式进行评估:a)采用Ekman的六种基本表情类别进行标注;b) 第33卷第1期2016年1月 计算机应用研究 ApplicationResearchofComputersVol.33No.1Jan.2016

相关文档
最新文档