人脸自动识别方法综述_周杰

合集下载

人脸识别技术的原理与应用解析

人脸识别技术的原理与应用解析

人脸识别技术的原理与应用解析随着科技的发展,以及智能手机、智能门锁等设备的普及,人脸识别技术也变得越来越成熟和普遍。

然而,对于许多人来说,人脸识别仍然是一个神秘的领域,因此本文将对人脸识别技术的原理和应用进行解析。

一、原理人脸识别技术的原理主要分为图像处理、特征提取、模式匹配和识别决策四个过程。

1. 图像处理人脸识别技术的第一步是通过摄像头或扫描仪等设备获取人脸图像。

由于摄像头给出的图像有噪声、光照问题等,因此需要将图像进行预处理,减少噪声并提高图像质量。

例如,可以使用滤波算法对图像进行去噪,或者通过增强图像的对比度和亮度等方式来提高图像质量。

2. 特征提取在获取到处理后的人脸图像后,需要对其进行特征提取,从而将脸部特征转换为可比较的数字特征向量。

通常,特征提取技术可以分为两种类型,一种是基于几何结构和形态的特征提取,另一种是基于纹理和颜色的特征提取。

目前,常用的特征提取技术有主成分分析(PCA)、线性判别分析(LDA)以及小波变换等,其中PCA是应用最广泛的一种。

3. 模式匹配在提取人脸图像的特征后,需要将其与已保存的样本进行比对,以寻找匹配项。

这个过程也被称为模式匹配,其主要是利用诸如平方误差距离(Squared Euclidean Distance)、K-近邻算法(KNN)、支持向量机(SVM)等算法进行。

4. 识别决策当找到匹配的样本后,人脸识别系统将做出一个识别决策,即判断当前的人脸图像与哪个已知的人脸最相似。

如果相似度高于一定阈值,即认为匹配成功。

如果相似度低于阈值,或者没有匹配到任何一个样本,系统将判断为无法识别的人脸图像。

二、应用随着科技的发展,人脸识别技术已经被广泛应用于生活、商业等各个方面,下面就分别从三个方面进行介绍。

1. 安防领域人脸识别技术在安防领域的应用已经非常普遍。

例如,一些公共场所,如机场、火车站、地铁站等,都安装了人脸识别系统,以便于警方认定嫌疑人踪迹。

此外,一些企事业单位内部也设置人脸识别门禁系统,用来加强安保措施,确保员工进出的安全。

通过计算机视觉技术实现人脸表情识别的步骤分享

通过计算机视觉技术实现人脸表情识别的步骤分享

通过计算机视觉技术实现人脸表情识别的步骤分享人脸表情识别是计算机视觉领域的重要研究方向之一,它涉及到人工智能、图像处理和机器学习等多个领域的知识。

随着计算机技术的不断进步,人脸表情识别在人机交互、情感计算和娱乐等领域具有广泛的应用前景。

本文将介绍通过计算机视觉技术实现人脸表情识别的基本步骤和方法。

1. 数据采集与预处理人脸表情识别需要大量的标注数据作为训练集,用于训练分类器。

数据采集过程中需要确保样本的多样性和代表性,包括不同人的表情、不同角度和光照条件下的人脸图像。

采集到的图像需要进行预处理,包括去噪、裁剪和归一化等操作,以提高后续处理的效果和准确性。

2. 特征提取特征提取是人脸表情识别的关键步骤,它的目标是从图像中提取出具有区分不同表情的特征。

传统的方法包括使用人工定义的特征提取算法,如LBP(Local Binary Patterns)和HOG(Histogram of Oriented Gradients)。

另外,由于深度学习的快速发展,也可以使用卷积神经网络(CNN)来自动地学习特征。

3. 特征选择与降维特征提取后得到的特征维度通常较高,需要进行特征选择和降维来提高识别性能和降低计算复杂度。

常用的特征选择方法包括方差分析和互信息等,降维方法包括主成分分析(PCA)和线性判别分析(LDA)等。

4. 建立分类器建立分类器是实现人脸表情识别的关键环节。

常用的分类器包括支持向量机(SVM)、K最近邻(KNN)和随机森林(Random Forest)等。

这些分类器需要根据特征向量和对应的表情标签进行训练,并进行模型选择和参数调优。

5. 表情识别与分类通过已建立好的分类器,对新的人脸图像进行表情识别和分类。

这个过程包括对新的人脸图像提取特征,然后将特征输入到分类器中进行预测。

最终得到的结果是该人脸图像的表情类别。

6. 精度评估与模型优化对于人脸表情识别系统的性能评估是十分重要的。

常用的评估指标包括准确率、召回率和F值等。

人脸识别简单原理

人脸识别简单原理

人脸识别简单原理一、人脸检测人脸识别的第一步是检测图像中的人脸。

这一步需要从复杂的背景中准确找出人脸的位置。

通常,这通过使用卷积神经网络(CNN)来实现。

CNN是一种深度学习算法,擅长于处理图像数据。

通过训练,CNN可以学习到人脸的特征,从而在新的图像中准确检测出人脸。

二、特征提取在检测到人脸后,下一步是提取人脸的特征。

这些特征是区分不同人脸的关键。

常用的特征提取方法有特征脸(Eigenfaces)、fisherfaces和深度学习方法。

深度学习方法,特别是卷积神经网络(CNN),因其强大的特征学习能力,成为目前最常用的特征提取方法。

三、特征匹配在提取到人脸特征后,需要将这些特征与数据库中的人脸特征进行匹配,以识别出人脸的身份。

这一步通常使用距离度量来完成,如欧氏距离。

距离越小,表示两张人脸越相似。

当距离小于某个阈值时,可以认为两张人脸属于同一个人。

四、活体检测为了防止人脸识别系统被照片或视频攻击,活体检测是必不可少的一步。

活体检测可以通过多种方式实现,如要求用户完成特定的动作,或者使用红外相机来检测人脸的温度和纹理。

五、隐私保护人脸识别技术涉及到个人隐私,因此隐私保护是至关重要的。

这可以通过多种方式实现,如只存储人脸的特征而不是原始图像,或者使用加密技术来保护数据的安全。

人脸识别简单原理概述:人脸识别技术是一种通过分析人脸特征来自动识别个人身份的技术。

它广泛应用于安全监控、身份验证和智能交互等领域。

本文将详细阐述人脸识别的基本原理,包括人脸检测、特征提取、特征匹配等关键步骤,并讨论活体检测和隐私保护的重要性。

引言:步骤详述:1. 人脸检测① 使用卷积神经网络(CNN)进行检测卷积神经网络(CNN)是一种深度学习算法,特别适用于图像处理。

通过训练,CNN能够从复杂的背景中准确识别出人脸。

② 运用Haar特征分类器Haar特征分类器是一种基于机器学习的方法,通过训练大量正负样本,学习到人脸的典型特征,从而实现人脸检测。

人脸识别技术的原理和应用案例剖析

人脸识别技术的原理和应用案例剖析

人脸识别技术的原理和应用案例剖析随着科技的不断发展,人脸识别技术已经逐渐成为了社会生活中不可或缺的一部分。

它的原理基于图像处理和模式识别技术,能够快速准确地识别出一个人的身份。

本文将从人脸识别技术的原理和应用案例两个方面进行探讨。

一、人脸识别技术的原理人脸识别技术的原理主要分为三个部分:人脸检测、特征提取和匹配识别。

首先,人脸检测是指从一幅图像中自动检测出人脸的位置和大小,它是整个人脸识别系统的第一步。

其中,人脸检测技术主要有基于Haar 特征的级联分类器、基于深度学习的卷积神经网络等。

其次,特征提取是指从检测到的人脸部分中提取出能够描述该人脸的特征。

这些特征包括人脸的轮廓、眉毛、眼睛、鼻子、嘴巴等等,用于帮助计算机识别出不同的人脸。

其中,常用的特征提取方法有局部二值模式直方图(Local Binary Patterns,LBP)、主成分分析(Principal Component Analysis,PCA)等。

最后,匹配识别是指将提取出的特征与已有的人脸数据进行比对,从而识别出这个人是谁。

其中,匹配识别技术主要有基于模板匹配的方法、基于距离的方法、基于神经网络的方法等。

综上所述,人脸识别技术通过人脸检测、特征提取和匹配识别三个步骤,实现了对人脸的自动识别和身份认证。

这种技术不但可以应用于安防领域,还可以广泛地应用于金融、零售、教育、医疗等各个领域中。

二、人脸识别技术的应用案例剖析1. 安防领域人脸识别技术在安防领域的应用非常广泛。

它可以帮助实现自动门禁、视频监控、犯罪侦查等多个方面。

根据国家发改委的数据,目前中国市场上的视频监控与安防设备数量已经达到了 2400万个,未来随着人脸识别技术的应用不断深入,这一数字还会不断增加。

2. 金融领域随着移动支付的不断发展,人脸识别技术在金融领域的应用也变得越来越普遍。

通过人脸识别技术,银行可以实现自动柜员机和二维码支付等多个场景下的身份认证。

其中,中国的农业银行、建设银行、工商银行等银行已经开始尝试将人脸识别技术应用到自助银行等场景中。

人脸识别方法综述

人脸识别方法综述

人脸识别方法综述引言人脸识别技术作为一种生物特征识别技术,可以通过分析和比对人脸的独特特征,实现识别和认证的功能。

它在安全监控、身份验证、社交媒体等领域有着广泛的应用。

本文将对人脸识别方法进行综述,从传统方法到深度学习方法,探讨其原理、特点以及应用情况。

传统方法特征提取•颜色特征:利用人脸图像的颜色信息进行提取,包括颜色直方图、颜色统计特征等。

•纹理特征:通过分析人脸图像的纹理信息,如纹理梯度、纹理对比度等。

•形状特征:提取人脸的几何形状特征,如人脸的轮廓、距离比例等。

模型匹配•通过构建人脸特征库,采用模型匹配的方法进行人脸识别。

常用的方法包括k近邻算法、支持向量机等。

局限性•传统方法对光照、姿态、室外环境等因素较为敏感,识别准确率不高。

•特征提取过程需要手动设计,对不同场景适应性较差。

基于深度学习的方法卷积神经网络(CNN)•CNN通过层层堆叠的卷积、池化和全连接层,自动学习图像中的特征,实现人脸识别的任务。

•通过端到端的训练方式,避免了手动设计特征的繁琐过程。

人脸识别网络VGGNet•VGGNet是一种经典的深度卷积神经网络,其特点是层数较深,参数较多。

•在人脸识别领域,VGGNet通过迁移学习和微调,可以取得较好的识别效果。

FaceNet•FaceNet是由Google开发的人脸识别网络,采用三元组损失函数进行训练。

•其核心思想是通过最小化同一个人脸图像的嵌入向量之间的距离,最大化不同人脸图像的嵌入向量之间的距离。

人脸检测与对齐Haar特征+级联分类器•Haar特征是一种基于人工设计的特征,可以用于人脸和非人脸的检测。

•级联分类器通过多个弱分类器级联组成,可以快速准确地实现人脸检测。

关键点检测与对齐•通过检测人脸图像中的关键点,如眼睛、鼻子、嘴巴等,实现人脸的对齐。

•通过对齐可以减小光照、姿态等因素的影响,提高识别准确率。

应用情况•安全监控:人脸识别技术可以应用于安全监控系统,实现人员的实时识别和报警功能。

人脸识别主要算法原理

人脸识别主要算法原理

人脸识别主要算法原理人脸识别是一种通过计算机技术对人脸图像进行分析和识别的技术手段。

其主要算法原理包括图像预处理、人脸检测、人脸特征提取和人脸匹配等步骤。

1.图像预处理:在人脸识别之前需要对输入的图像进行预处理,以提高后续算法的准确性和鲁棒性。

常用的图像预处理方法包括图像对比度增强,直方图均衡化,噪声去除以及图像尺寸归一化等。

这些处理可以降低光照变化、面部表情、姿态变化等对识别的影响。

2.人脸检测:人脸检测是人脸识别的第一步,其目标是从输入图像中准确地找到人脸位置和大小。

常用的检测方法包括基于特征的方法(如Haar特性、HOG特征)和基于机器学习方法(如级联分类器、支持向量机)。

这些方法从图像中提取特定的视觉特征,并通过分类器进行判断。

3.人脸特征提取:人脸特征提取是人脸识别的核心技术,通过对人脸图像进行特征提取,将其转化为高维的特征向量表示。

常用的特征提取方法包括主成分分析(PCA)、线性判别分析(LDA)、局部二值模式(LBP)等。

这些方法从人脸图像中提取出具有区分性能的特征,以便后续的识别和匹配。

4.人脸匹配:人脸匹配是人脸识别的最后一步,其目标是将输入的人脸特征与已有的人脸特征进行比对,以确定其身份。

常用的匹配方法包括欧氏距离、余弦相似度等。

这些方法根据特征向量之间的相似度进行分类或判断,得出最终的识别结果。

此外,人脸识别还应用了机器学习和深度学习等技术,以提高识别的准确性和鲁棒性。

例如,使用卷积神经网络(CNN)进行人脸特征提取和分类,通过大规模的训练数据集和深层网络结构,可以提高人脸识别的性能。

总之,人脸识别主要依靠图像预处理、人脸检测、人脸特征提取和人脸匹配等算法原理来实现。

通过这些步骤,可以从输入的人脸图像中提取出具有区分性能的特征,并将其与已有的人脸特征进行比对,从而实现人脸的识别和匹配。

随着机器学习和深度学习的发展,人脸识别的性能将得到进一步的提升。

人脸识别 原理

人脸识别 原理

人脸识别原理
人脸识别是一种通过计算机技术对人脸图像进行识别和验证的技术。

它是一种
生物识别技术,通过分析人脸图像的特征来识别和验证个体身份。

人脸识别技术在安防监控、手机解锁、人脸支付等领域有着广泛的应用。

人脸识别技术的原理主要包括人脸采集、人脸检测、人脸特征提取和人脸匹配
四个步骤。

首先,人脸采集是指利用摄像头等设备采集人脸图像。

采集到的人脸图像将作
为后续处理的输入数据。

接着,人脸检测是指对采集到的图像进行处理,通过图像处理算法识别出图像
中的人脸部分。

这一步骤是人脸识别的基础,也是整个过程的第一道关口。

然后,人脸特征提取是指从检测到的人脸图像中提取出人脸的特征信息。

这些
特征信息通常包括人脸的轮廓、眼睛、鼻子、嘴巴等部位的位置和大小等数据。

最后,人脸匹配是指将提取到的人脸特征信息与已有的人脸数据库中的信息进
行比对,从而确定图像中的人脸属于数据库中的哪个个体。

这一步骤通常采用模式识别和机器学习算法来实现。

人脸识别技术的实现依赖于图像处理、模式识别、机器学习等多个领域的知识
和技术。

通过对图像的处理和分析,识别出人脸图像中的特征信息,并与已有的数据库进行比对,从而实现对个体身份的识别和验证。

总的来说,人脸识别技术的原理是通过对人脸图像进行采集、检测、特征提取
和匹配等步骤,利用图像处理和模式识别等技术实现对个体身份的识别和验证。

随着人工智能和深度学习等技术的不断发展,人脸识别技术将在更多的领域得到应用,为人们的生活带来更多的便利和安全保障。

人脸识别技术的原理与实现

人脸识别技术的原理与实现

人脸识别技术的原理与实现随着信息技术的迅猛发展,人脸识别技术的应用越来越广泛,从安保、金融、医疗到智能家居,应用场景之多、应用前景之广都让人惊叹。

那么人脸识别技术作为最初的认知方式之一,有怎样的原理和实现方式呢?本文将会全方位为大家详细讲解。

一、人脸识别技术的原理人脸识别技术是通过图像处理和模式识别技术,对人的面部特征进行自动检测、跟踪、分析、识别,达到身份确认和身份验证的一种智能化技术。

人的面部特征因人而异,具有较好的唯一性和稳定性,就像人的指纹一样具有唯一性,而且不会因个人疾病等因素而改变。

因此,人脸识别技术具有很高的准确率和稳定性,被广泛用于各种应用场景。

常见的人脸特征包括以下几个方面:1、面部特征:包括眉毛、眼睛、鼻子、嘴巴等面部轮廓和特征。

2、肤色:指皮肤的纹理、颜色、皮肤状况等特征。

3、步态:指人们走路的姿态,每个人的步态都有一定的特征,因此步态识别也是一种常见的人体识别技术。

4、视网膜:视网膜是人眼最内层的组织,它具有较好的唯一性和不可伪造性,因此也可以用于身份识别。

人脸识别技术主要基于计算机视觉和模式识别技术来实现,其中最常用的是基于图像特征提取和分类的方法。

二、人脸识别技术的实现人脸识别技术的实现可以分成以下几个步骤:1、图像采集:图像采集是人脸识别技术的基础,它是指利用摄像头等设备将人的面部信息捕捉下来,并将其转化为数字信号进行处理。

2、预处理:由于人脸图像采集过程中受光照、姿态等因素的影响,需要对采集到的图像进行预处理,例如去除噪声、调整图像亮度和对比度等。

3、特征提取:人脸识别技术的核心在于特征提取,它是指从处理后的图像中提取出可以代表人脸特征的信息,例如轮廓、眼睛位置、嘴唇形状等。

4、特征匹配:特征匹配是指将提取出来的特征信息与数据库中的人脸特征进行匹配,从而实现身份确认和身份验证。

目前常用的特征匹配方法包括欧氏距离法、余弦相似度法等。

5、识别结果输出:根据特征匹配的结果,可以输出识别结果,并进行相关处理,例如弹出姓名、在屏幕上显示验证结果等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人脸自动识别方法综述周 杰,卢春雨,张长水,李衍达(清华大学自动化系,北京100084)摘 要: 人脸自动识别是模式识别、图像处理等学科的一大研究热点,近几年来关于人脸识别的研究取得了很大进展.本文重点对近三、四年来人脸识别的研究进行综述并对各种方法加以评论.关键词: 人脸自动识别;人脸检测;人脸定位中图分类号: TP39114 文献标识码: A 文章编号: 0372-2112(2000)04-0102-05A Su rvey of Automa tic Human Face RecognitionZHOU Jie,LU Chun -yu,ZHANG Chang -shui,LI Yan -da(De partment o f Automation ,Tsinghua Unive rsit y ,Be ijing 100084,China)Abstract: Automatic human face recogni tion is attractive in pattern recogniti on and i mage processing.In this paper we gave a survey of automatic human face recogni tion,mainly ai ming at the latest progress.Key words: automatic hu man face recognition;face detection;face localization1 引言随着社会的发展,各个方面对快速有效的自动身份验证的要求日益迫切.由于生物特征是人的内在属性,具有很强的自身稳定性和个体差异性,因此是身份验证的最理想依据.这其中,利用人脸特征进行身份验证又是最自然直接的手段,相比其它人体生物特征它具有直接、友好、方便的特点,易于为用户所接受[1].人脸识别是人类视觉最杰出的能力之一,它的研究涉及模式识别、图像处理、生理学、心理学、认知科学,与基于其它生物特征的身份鉴别方法以及计算机人机感知交互领域都有密切联系,因此早在六七十年代即引起了研究者的强烈兴趣.进入九十年代,由于各方面对人脸识别系统的迫切需求,人脸识别的研究重新变得非常热门.目前美国等国有许多研究组在从事人脸识别的研究,这些研究受到军方、警方及大公司的高度重视和资助,美国军方每年还专门组织人脸识别比赛以促进这一领域的发展.在国内,也开始有一些学校从事人脸识别相关的研究.近几年来关于人脸识别的研究取得了很大进步,国际上发表有关论文的数量大幅增长,IEEE 的PAM I 汇刊还于1997年7月出版了人脸识别专辑,每年的国际会议上关于人脸识别的专题也屡屡可见.而目前人脸识别综述的文章还是截止到1994年,因此我们认为非常有必要对近几年的研究工作进行一下总结.在本文中我们将对人脸识别方法进行综述,其中主要介绍近三、四年的研究工作,之前的研究工作请参看文[2,3].2 人脸自动识别系统人脸自动识别系统包括两个主要技术环节(如图1所示):首先是人脸检测和定位,即从输入图像中找到人脸及人脸存在的位置,并将人脸从背景中分割出来,然后才是对归一化的人脸图像进行特征提取与识别.图1 人脸自动识别系统构成这两个环节的研究独立性很强.由于在很多特定情况下人脸检测与定位的工作比较简单,因此/特征提取与识别0环节得到了更为广泛和深入的研究;而近几年来随着人们越来越关心各种复杂情形下的人脸自动识别系统,人脸检测与定位才得到了较多的重视.评价一个人脸自动识别系统的标准,一个是误识率即将某人错识别为其他人,另一个是虚警率即将其他人识别为这个人.这二者之间是存在矛盾的,所以在实际问题中往往需要进行某种折衷.如,在安全性要求较高的计算机登录系统中,必须要求虚警率要尽可能低,而误识率则可以高一些,这样只是增加合法用户的等录时间,并不会降低计算机系统的安全性.这一点同样适用于特征提取与识别环节,但是对于人脸检测与定位,我们一般则要求误识率要尽可能低,因为这样才可以保证所要识别的人不会在这一步就丢失.收稿日期:1999-03-15;修订日期:1999-07-06基金项目:自然科学基金(No.69775009)资助课题第4期2000年4月电 子 学 报ACTA ELECTRONICA SINICA Vol.28 No.4April 2000常用的人脸识别实验库以美国军方的FERET库[57]最为权威,它包括多人种、多年龄段、各种表情变化、光照变化、姿态变化的图像,图像的数量和实验人数也非常多,可以充分地验证人脸识别算法.另外如MIT、ORL等库也可以用来验证算法在某些方面的能力.目前尚没有专门测试人脸检测和定位算法的图像库.3人脸检测与定位方法综述人脸检测的基本思想是用知识或统计的方法对人脸建模,比较所有可能的待检测区域与人脸模型的匹配度,从而得到可能存在人脸的区域.其方法大致可分为基于统计和基于知识两类.前者将人脸图像视为一个高维向量,从而将人脸检测问题转化为高维空间中分布信号的检测问题;而后者则利用人的知识建立若干规则,从而将人脸检测问题转化为假设/验证问题.311基于统计的人脸检测方法(1)事例学习.将人脸检测视为区分非人脸样本与人脸样本的两类模式分类问题,通过对人脸样本集和非人脸样本集进行学习以产生分类器.目前国际上普遍采用人工神经网络[4~7].(2)子空间方法.Pentland等将KL变换引入了人脸检测[8,9],在人脸识别中利用的是主元子空间(特征验),而人脸检测利用的是次元子空间(特征脸空间的补空间).用待检测区域在次元子空间上的投影能量,也即待检测区域到特征脸子空间的距离做为检测统计量,距离越小,表明越像人脸.子空间方法的特点在于简便易行,但由于没有利用反例样本信息,对与人脸类似的物体辨别能力不足.(3)空间匹配滤波器方法[10].包括各种模板匹配方法、合成辨别函数方法等.312基于知识建模的人脸检测方法(1)器官分布规则:虽然人脸在外观上变化很大,但遵循一些几乎是普遍适用的规则,如五官的空间位置分布大致符合-三停五眼.等,检测图像中是否有人脸即是测试该图像中是否存在满足这些规则的图像块.这种方法一般有两种思路:一种是/从上到下0,其中最为简单有效的是Yang等人提出的Mosaic方法[11],它给出了基于人脸区域灰度分布的规则,依据这些规则对图像从粗分辨率到高分辨率进行筛选,以样本满足这些规则的程度做为检测的判据.类似的工作还有[13,14].另一种思路则是从下至上,先直接检测几个器官可能分布的位置,然后将这些位置点分别组合,用器官分布的几何关系准则进行筛选,找到可能存在的人脸[14].(2)轮廓规则:人脸的轮廓可以简单地看成一个近似椭圆,而人脸检测可以通过椭圆检测来完成[3].Goyindaraju提出认知模型方法,将人脸建模为两条直线(左右两侧面颊)和上下两个弧(头部和下巴),通过修正Hough变换来检测直线和弧[15].近期Tankus利用凸检测的方法进行人脸检测[16].(3)颜色、纹理规则:同民族人的面部肤色在颜色空间中的分布相对比较集中,颜色信息在一定程度上可以将人脸同大部分背景区分开来.Lee等设计了肤色模型表征人脸颜色,利用感光模型进行复杂背景下人脸及器官的检测与分割[17]. Dai利用了SGLD(空间灰度共生矩阵)纹理图信息做为特征进行低分辨率的人脸检测[18].Saber等则将颜色、形状等结合在一起来进行人脸检测[19].(4)运动规则:通常相对背景人总是在运动的,利用运动信息可以简单有效的将人从任意复杂背景中分割出来.其中包括利用瞬眼、说话等方法的活体人脸检测方法.文献[2,3]对利用运动信息进行头部运动跟踪检测进行了综述和探讨.(5)对称性:人脸具有一定的轴对称性,各器官也具有一定的对称性.Zabrodshky提出连续对称性检测方法[20],检测一个圆形区域的对称性,从而确定是否为人脸;Riesfield提出广义对称变换方法[21]检测局部对称性强的点来进行人脸器官定位.我们则定义方向对称变换[53],分别在不同方向上考察对称性,不仅能够用来寻找强对称点,而且可描述有强对称性物体的形状信息,在进行人脸器官定位时更为有效.4人脸特征提取与识别方法综述人脸识别本质上是三维塑性物体二维投影图像的匹配问题,它的困难体现在:(1)人脸塑性变形(如表情等)的不确定性;(2)人脸模式的多样性(如胡须、发型、眼镜、化妆等);(3)图像获取过程中的不确定性(如光照的强度、光源方向等).识别人脸主要依据人脸上的特征,也就是说依据那些在不同个体之间存在较大差异而对于同一个人则比较稳定的度量.由于人脸变化复杂,因此特征表述和特征提取十分困难.在对人脸图像进行特征提取和分类之前一般需要做几何归一化和灰度归一化.几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大小,灰度归一化是指对图像进行光照补偿等处理,光照补偿能够一定程度地克服光照变化的影响而提高识别率[50].关于人脸特征提取与识别的方法可概述如下:411基于几何特征的方法人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征.几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等.Jia[22]等由正面灰度图中线附近的积分投影模拟侧面轮廓图是一种很有新意的方法.采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征[23,24],但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观[25].可变形模板法[26,27,28]可以视为几何特征方法的一种改进,其基本思想是:设计一个参数可调的器官模型(即可变形模板,如图2所示),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征.这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广;二是能量函数优103第4期周杰:人脸自动识别方法综述化过程十分耗时,难以实际应用.图2 (a)可变形模板法的眼模型;(b)可变形模板法的嘴模型基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择.同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大.412 基于特征脸的方法Turk 和Pentland 提出特征脸的方法,它根据一组人脸训练图像构造主元子空间,由于主元具有脸的形状,也称为特征脸(如图3所示).识别时将测试图像投影到主元子空间上,得到一组投影系数,和各个已知人的人脸图像比较进行识别.在[8,9]中Pentland 等报告了相当好的结果,在200个人的3000幅图像中得到95%的正确识别率,在FERE T 数据库上对150幅正面人脸象只有一个误识别.但系统在进行特征脸方法之前需要作大量预处理工作如归一化等.图3 Pentland 得到的特征脸(主特征向量)在传统特征脸的基础上,研究者注意到特征值大的特征向量(即特征脸)并不一定是分类性能好的方向,据此发展了多种特征(子空间)选择方法,如Peng 的双子空间方法[30]、Weng 的线性歧义分析方法[31]、Belhumeur 的FisherFace 方法[32]等.事实上,特征脸方法是一种显式主元分析人脸建模,一些线性自联想、线性压缩型BP 网则为隐式的主元分析方法,它们都是把人脸表示为一些向量的加权和,这些向量是训练集叉积阵的主特征向量,Valentin 对此作了详细讨论[33].总之,特征脸方法是一种简单、快速、实用的基于变换系数特征的算法,但由于它在本质上依赖于训练集和测试集图像的灰度相关性,而且要求测试图像与训练集比较像,所以它有着很大的局限性.图4 Atick 的局部特征分析方法413 局部特征方法主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要.基于这种考虑,Atick 提出基于局部特征的人脸特征提取与识别方法[44](如图4所示).这种方法在实际应用取得了很好的效果,它构成了FaceIt 人脸识别软件的基础.414 基于弹性模型的方法Lades 等人针对畸变不变性的物体识别提出了动态链接模型(DLA),将物体用稀疏图形来描述(见图5),其顶点用局部能量谱的多尺度描述来标记,边则表示拓扑连接关系并用几何距离来标记,然后应用塑性图形匹配技术来寻找最近的已知图形[34,35].Wiscott 等人在此基础上作了改进,用FE RE T 图像库做实验,用300幅人脸图像和另外300幅图像作比较,准确率达到9713%[36,37].此方法的缺点是计算量非常巨大.图5 人脸识别的动态连接匹配方法Nastar 将人脸图像(Ñ)(x ,y )建模为可变形的3D 网格表面(x ,y ,I (x ,y ))(如图6所示),从而将人脸匹配问题转化为可变形曲面的弹性匹配问题[45,46].利用有限元分析的方法进行曲面变形,并根据变形的情况判断两张图片是否为同一个人.这种方法的特点在于将空间(x ,y )和灰度I (x ,y )放在了一个3D 空间中同时考虑,实验表明识别结果明显优于特征脸方法.Lanitis 等提出灵活表现模型方法[47,48],通过自动定位人脸的显著特征点将人脸编码为83个模型参数,并利用辨别分析的方法进行基于形状信息的人脸识别.415 神经网络方法目前神经网络方法在人脸识别中的研究方兴未艾.Valentin 提出一种方法,首先提取人脸的50个主元,然后用自104电 子 学 报2000年图6Nastar的可变形曲面方法相关神经网络将它映射到5维空间中,再用一个普通的多层感知器进行判别,对一些简单的测试图像效果较好[33];Intrator 等提出了一种混合型神经网络来进行人脸识别,其中非监督神经网络用于特征提取,而监督神经网络用于分类[39].Lee等将人脸的特点用六条规则描述,然后根据这六条规则进行五官的定位,将五官之间的几何距离输入模糊神经网络进行识别,效果较一般的基于欧氏距离的方法有较大改善[40]; Laurence等采用卷积神经网络方法进行人脸识别,由于卷积神经网络中集成了相邻像素之间的相关性知识,从而在一定程度上获得了对图像平移、旋转和局部变形的不变性,因此得到非常理想的识别结果[41];Lin等提出了基于概率决策的神经网络方法(PDBNN),其主要思想是采用虚拟(正反例)样本进行强化和反强化学习,从而得到较为理想的概率估计结果,并采用模块化的网络结构(OC ON)加快网络的学习.这种方法在人脸检测、人脸定位和人脸识别的各个步骤上都得到了较好的应用[7];其它研究还有:Dai等提出用Hopfield网络进行低分辨率人脸联想与识别[42];Gutta等提出将RB F与树型分类器结合起来进行人脸识别的混合分类器模型[43];Phillips等人将Matching Pursui t滤波器用于人脸识别[59];我们则采用统计学习理论中的支撑向量机进行人脸分类[54].神经网络方法在人脸识别上的应用比起前述几类方法来有一定的优势,因为对人脸识别的许多规律或规则进行显性的描述是相当困难的,而神经网络方法则可以通过学习的过程获得对这些规律和规则的隐性表达,它的适应性更强,一般也比较容易实现.416其他方法B runelli等对模板匹配方法作了大量实验,结果表明在尺度、光照、旋转角度等各种条件稳定的情况下,模板匹配的效果优于其他方法[23],但它对光照、旋转和表情变化比较敏感,影响了它的直接使用.Goudail等人采用局部自相关性作为人脸识别的判断依据,它具有平移不变性,在脸部表情变化时比较稳定[49].在最近的一些工作中,Benarie等提出VFR的表示框架并将它用于人脸识别的工作中[57],Lam等人研究了不同视点下的人脸匹配和识别问题[58],Vetter等人讨论了由单幅人脸图像生成其他视点的人脸图像的可能性[55],Mirhosseini等则探讨了多种信息融合的人脸识别方法[38].5总结与展望以下我们分别针对两个环节进行总结和展望:(1)人脸检测与定位:由于人脸模式的多样性和图像获取过程中的不确定性,人脸在图像空间中的分布非常复杂,建立人脸在高维图像空间中的精确分布模型是一件非常困难的事.建立一个统计可靠的估计不仅需要大量的正例样本,而且需要充分多数量的有效反例样本.目前研究的一个趋势是反例样本的产生和利用问题,这也是最终提高人脸检测正确率的必然道路.根据具体应用的需要,对检测环境进行合理的假定(比如运动、颜色等),从而简化问题,提高系统实用性能也是一条切实可行的途径.不难预见,知识与统计方法的综合应用,是解决实际问题所必须的.(2)特征提取与识别:与刚体不同,人脸是塑性变形体,更适合用弹性模型来描述.因此,任何基于刚体特性的特征抽取方法都很难达到满意的效果.其次,人脸识别被认为是人类视觉中独特的过程,因此对生理学和心理学结合是很有帮助的.可以预见,在人类视觉和非刚体两方面的研究成果将有助于找到抽取和描述人脸特征的最终解决方案.另外,无论对于检测定位还是识别,如何将能够获得的各种信息最大限度、有机地集成起来加以利用,这是一个具有普遍意义的课题,而且也是有效提高人脸识别系统效率的手段.参考文献[1]J.D.Woodward.Proceedings of IEEE,1997,85:1480~1492[2] A.Samal,P.A.Iyengar.Pattern Recogni ti on,1992,25:65~77[3]R.Chellappa et al.Procedings of IEEE,1995,83:705~740[4]K.Sung and T.Poggio.CVPR.95:398~406[5]K.Sung,T.Poggio.IEEE Trans.PA MI,1998,20:39~51[6]H.A.Rowley et al.IEEE Trans.PA M I,1998,20:23~38[7]S.Lin,S.Y.Kung,et al.IEEE Trans.NN,1997,8:114~132[8] B.Moghaddam,A.Pentland.IEEE Trans.PA M I,1997,19:696~710[9]M.A.Turk,A.P.Pentl and.CVPR.91:586~591[10]R.Brunelli,T.Poggio.Pattern Recognition,1997,30:751~768[11]G.Z.Yang et al.Pattern Recognition,1994,27:53~63[12] C.C.Lin,W.C.Lin.Pattern Recogni ti on,1996,29:2079~2101[13]S.H.Jeng e t al.Pattern Recogni ti on,1998,3:273~282[14]K.C.Yow et al.Image and Vi sion Computing,1997,15:713~735[15]puter Vi sion,1996,19:129~146[16] A.Tankus et al.PR Le tters,1997,18:913~922[17] C.H.Lee et al.Pattern Recognition,1996,29:1877~1899[18]Y.Dai and Y.Nakano.Pattern Recogni ti on,1996,29:1007~1017[19] E.Saber et al.Pattern Recogni ti on Letters,1998,19:669~680[20]H.Zabrodsky e t al.IEEE Trans.PAMI,1995,17:1154~1166[21] D.Reisfeld et puter Vision,1995,14:119~130[22]X.Jia,MS.IEEE Trans P AMI,1995,17:1167~1176[23]R.Brunelli,T.Poggio.IEEE Trans.PAMI,1993,15:1042~1052[24]I.J.Cox,J.Ghosn,P.N.Yi anilos.CVPR.96:209~216[25]N.Roder,X.Li.Patter Recogni ti on,1996,29:143~157[26] A.L.Yuille.J.Cogniti ve Neuroscience,1989,3:59~70[27] m,H.Yan.Pattern Recognition,1995,29:771~779[28]J.Ydeng,i.Pattern recognition,1997,30:403~419[29] A.Pentland et al.Proc.CV PR.94:84~91[30]H.Peng,D.Electronics Letters,1997,33:283~284[31] D.L.Swets and J.Weng.IEEE Trans.PA M I,1996,18:831~836[32]P.N.Belhumeur et al.IEEE Trans.PAMI,1997,19:711~720105第4期周杰:人脸自动识别方法综述[33] D.Valentin et al.Pattern Rec ogni tion,1994,27:1209~1230[34]des e t al.IEEE puter,1993,42:300~311[35]J.Zhang e t al.Proc.IEEE,1997,85:1423~1435[36]L.Wis kott.Pattern Recognition,1997,30:837~846[37]L.Wis kott et al.IEEE Trans.PAMI,1997,19:775~779[38] A.R.M irhoss ei puter Vision and Image Unders tanding,1998,71:213~230[39]N.Intrator,D.Reis feld,Y.Yes hurun.PR Letters,1996,17:67~76[40]S.Y.Lee et al.Pattern Recognition,1996,29:1863~1876[41]wrence et al.IEEE Trans.NN,1997,8:98~113[42]Y.Dai,Y.Nakano.Pattern Recognition,1998,31:159~167[43]S.Gutta,H.Wechs ler.Pattern Recogni tion,1997,30:539~553[44]P.S.Penev,work Co mputati on&Neural Net work,1996,7:477~490[45] C.Nas tar et puter Vision and Image Unders tanding,1997,65:179~191[46] B.Moghaddam et al.CVPR,1996[47] ni tis et al.Image&Visi on Computing,1995,13:393~401[48] ni tis et al.IEEE Trans.PAMI,1997,19:743~756[49] F.Goudail et al.IEEE Trans.PAMI,1996,18:1024~1028[50]Y.Adi ni et al.IEEE Trans.PA MI,1997,19:721~732[51]M.Golfarelli et al.IEEE Trans.P AMI,1997,19:786~796[52]K.S.Yoon et al.Pattern Recogniti on,1998,3:283~293[53]J.Zhou et al.Proceedings of SPIE,1998,3545:321~324[54] C.Y.Lu et al.ICNNB,1998,645~648[55]puter Vi sion,1998,28:103~116[56]P.J.Phillips et al.Image and Vision Computing,1998,16:295~306[57]J.Benarie,D.Nandy.IEEE Trans.PAMI,1998,20:449~457[58] m,H.Yan.IEEE Trans.PA MI,1998,20:673~686[59]P.J.Phillips.IEEE Trans.Image Process ing,1998,7:1150~1164周杰1968年出生,博士.现为清华大学自动化系副教授,研究方向为模式识别和图像处理,目前已在国内外发表论文20多篇.(上接第101页)[51] B.H B rtgen and P.B B ttgen.Frac tal approach to lo w rate video coding.In B.G.Haskell and H.-M.Hang,editors,Vis ual Communications andImage Processing c93,SPIE Proceedi ngs,Bos ton,MA,USA,November,1993,2094:120~131[52]Nicholls,J.A.,and Monro,D.M.Adaptive fractal video.N ATO ASIConference on the Application of frac tal technol ogies,1995[53]Monro,D.M.and Nicholls,J.A..Low bit rate colour fractal video,Proc.IEEE ICIP,1995,3:264~267[54]Nicholls,J.A.and Monro,D.M..Scalable video by s of tware.Proc.IEEE ICASSP,1996,4:2005~2008[55]Chang-Su Kim,Rin-Chul Ki m and Sang-Uk Lee.Fractal coding of videosequence using circ ular prediction mapping and nonc ontractive inter-fra me mapping.IEEE Trans.on Image Processing,April1998,7(4):601~604[56]Monro and Frank Dudbridge.Rendering algorithms for determinis ticfractals.IEEE Computer Graphics and Applications,January,1995,32~41[57]Roger.J.Clarke.Di gi tal Compres sion of still i mages and video.Aca-de mic Press Li mited,1995[58]Raittinen,H.,Kas ki,K..Critical revie w of fractal i mage compression,International Journal of M odern Physics C[Physics and Computers],1995,6(1):66~47[59]Y.Fis her,T.P.Shen,and D.Rogovi parison of fractal methodsw i th discre te cosi ne trans form(D CT)and wavelets.In S.-S.Chen,ed-itor,Neural and Stoc hastic M ethods i n Image and Signal Processi ngÓ,SPIE Proceedings,San Diego,CA,USA,J uly1994,2304:132~143106电子学报2000年。

相关文档
最新文档