人脸识别课程设计论文(完美版)

人脸识别课程设计论文(完美版)
人脸识别课程设计论文(完美版)

前言

在人类社会的发展进入到21世纪的今天,安全问题已经成为困扰人们日常生活的重要问题之一。社会的发展促进了人的流动性,进而也增加了社会的不稳定性,使得安全方面的需求成为21世纪引起广泛关注的问题。不论是享受各项服务如网上冲浪、还是居家、办公等都涉及到安全,以往这些行为基本上是通过符号密码来进行安全保护,但是随着服务数量的不断增加,密码越来越多以致无法全部记住,而且密码有时也会被他人所窃取,各种密码被破解的概率越来越高,因为通常由于记忆的原因,人们经常会选用自己或亲人的生日、家庭地址、电话号码等作为密码并长期使用,这些很容易被一些不法分子获取。可见在现代社会中,身份识别已经成为人们日常生活中经常遇到的一个基本问题。人们乎时时刻刻都需要鉴别别人的身份和证明自己的身份,以获得对特定资源的使用权或者制权,同时防止这些权限被他人随意的取得。传统的身份识别方法主要基于身份标识物(如证件、卡片)和身份标识知识(如用户名、密码)来识别身份,这在很长一段时期是非常可靠和方便的识别方法,得到了广泛的应用。但是,随着网络、通信、交通等技的飞速发展,人们活动的现实空间和虚拟空间不断扩大,需要身份认证的场合也变得无不在。人们需要携带的身份标识物品越来越多,身份标识知识也变得越来越复杂和冗长在这种情况下,传统身份识别方式的弊端日益彰显。身份标识物品容易被丢失和伪造,份标识知识容易被遗忘、窃取和破解,而身份标识的重要性又使得一旦失去了身份标识会给标识的所有者甚至整个社会带来重大的甚至难以弥补的损失。在美国,每年约有上百万的福利款被人以假冒的身份领取;每年发生的信用卡、ATM、移动电话和冒领支票等成的损失达数百亿美元[2]。面临着这样的状况,人们对身份识别的安全性、可靠性、准确和实用性提出了更高的要求,必须寻求身份识别的新途径。

于是,近年来人类生物特征越来越广泛地用于身份识别,而且生物特征可以更好的进行安全控制,世界各国政府都在大力推进生物识别技术的发展及应用。与原有的人类身分识别技术(如:个人密码、磁卡、智能卡等)相比,基于人类生物特征的识别技术具有安全可靠、特征唯一、不易伪造、不可窃取等优点。人类本身具有很多相对独特的特征,如DNA、指纹、虹膜、语音、人脸等。基于这些相对独特的人类特征,结合计算机技术,发展起众多的基于人类生物特征的人类身份识别技术,如DNA识别技术、指纹识别技术、虹膜识别技术、语音识别技术、人脸识别技术。

人脸识别和其他的生物识别比起来有以下几个优点:1、其他的生物特征识别方法都需要一些人为的行为配合,而人脸识别不需要。2、人脸识别可应用在远距离监控中。3、针一对现在的第一、二代身份证,每个身份证都有人脸的正面照片,也就是人脸库将是最完善的,包括人最多的,我们可以利用这个库来更直观、更方便的核查该人的身份。

4、相对于其他基于生物特征识别技术,人脸识别技术具有特征录入方一便,信息丰富,使用面广等优点,同时人脸识别系统更加直接友好。人脸识别技术作为生物识别技术的

一种,以其特有的稳足性、方便性、唯一性等特点被愈来愈多地应用于除安全问题外的各种身份识别领域。

人脸识别技术可应用于以下方面:

1.在安全防范领域中的应用

社会上有许多重要的部门,如军事、金融、保密等部门都需要对出入人员进行身份识别,以防止信息泄漏和不法现象的发生。使用该技术可以方便地进行身份识别,而不使被识别者感到不舒服。

2.在犯罪刑侦领域中的应用

在刑侦工作中,对罪犯的抓捕是至关重要的一环。应用人脸识别技术可以依据犯罪嫌疑人的人脸图像对机场、车站、港口等重要交通场所进行监控,从而大大促进了罪犯抓捕工作的开展。

3.在公共事业领域中的应用

在现代社会,许多领域都需要对人进行身份验证。如银行、保险、交通等公共事业部门。采用传统的密码、IC卡等手段和技术对人进行身份验证具有安全性差、易遗失、易伪造等缺点。而采用人脸识别技术进行身份验证则能够很好地克服传统身份验证手段和技术的缺点。

第一章人脸识别概述

1.1生物特征识别技术和人脸识别技术

生物特征识别技术是通过计算机利用人体所固有的生理特征或行为特征来进行个人身份鉴定。生理特征与生俱来多为先天性的;行为特征则是习惯使然,多是后天性的。我们将生理和行为特征统称为生物特征。常用的生物特征包括:指纹、掌纹、虹膜、视网膜、脸像、声音、笔迹等。

那么,生物特征识别技术是如何进行个人特征识别的呢?

生物鉴别的过程分成三个步骤:生物特征数据采样,生物特征提取和特征匹配。数据采样过程是通过各种传感器对生物特征进行原始数据采集的过程,生物特征提取过程则从传感器采集的数据中抽取出反映个体特性的信息(通常是某种数学上的编码过程),匹配阶段则是计算生物特征之间的相似性并进行排序和一致性判断的过程。

生物特征识别技术主要有人脸识别、指纹识别、语音识别、虹膜识别等。生物识别技术在上个世纪己经有了一定的发展,其中指纹识别技术己经趋近成熟,但人脸识别技术的研究目前还处于起步阶段。指纹、虹膜、掌纹等识别技术都需要被识别者的配合,有的识别技术还需要添置复杂昂贵的设备。人脸识别则可以用已有的照片或是摄像头远距离捕捉图像,无须特殊的采集设备,系统的成本低。并且自动人脸识别可以在当事人毫无察觉的情况下即完成身份确认识别工作,这对反恐怖活动等有非常重大的意义。由于人脸识别技术具有如此之多的优势,因此它的应用前景非常广阔,已成为最具潜力的生物特征识别技术之一。

所谓人脸识别,是指对输入的人脸图像或者视频,判断其中是否存在人脸,如果存在人脸,则进一步给出每张人脸的位置、大小和各个面部主要器官的位置信息,并且依据这些信息,进一步提取每张人脸蕴含的身份特征,并将其与已知人脸库中的人脸进行对比,从而识别每张人脸的身份。其研究内容包括以下五个方面:

(1)人脸检测从不同的背景中检测是否存在人脸,并确定其位置、大小、形状、姿态等信息的过程。它关系到后续识别工作能否正确进行,并保障最终识别结果的可靠性。

(2)人脸表征确定表示检测出的人脸和数据库中的已知人脸的描述方式。通常的表示方式包括几何特征(如欧氏距离、曲率、角度等)、代数特征(如矩阵的特征矢量)和固定特征模板等。

(3)人脸鉴别即狭义的人脸识别,就是通常所指的将待识别的人脸与数据库中的

已知人脸进行比较,得出相关信息。这一过程的核心是选择适当的人脸表示方式和匹配策略,系统地构造与人脸的表征方式密切相关。

(4)表情/姿态分析即对待识别人脸的表情或姿态进行分析,并对其加以归类。

(5)生理分类对待识别人脸的物理特征进行分类,得出其年龄、性别、种族等相关信息,或从几幅相关的图像中推导出希望得到的人脸图像,如从父母的脸推导出孩子的脸像等。

本论文中的人脸识别主要是指狭义的人脸识别,指将待识别的人脸与数据库中的已知人脸之间进行匹配的人脸鉴别。

人脸识别的目的是让计算机具有通过人脸的特征来鉴别身份的功能。基于人脸特征的身份识别主要设计到复杂场景中的人脸检测及识别技术,是一种依托于图像理解、模式识别及计算机视觉、统计学和人工智能等高技术的研究方向。

1.2人脸识别国内外发展概况

见诸文献的机器自动人脸识别研究开始于1966年PRI的Bledsoe的工作,1990年日本研制的人像识别机,可在1秒钟内中从3500人中识别到你要找的人。1993年,美国国防部高级研究项目署 (Advanced Research Projects Agency)和美国陆军研究实验室(Army Research Laboratory)成立了Feret(Face Recognition Technology) 项目组,建立了feret人脸数据库,用于评价人脸识别算法的性能。

美国陆军实验室也是利用vc++开发,通过软件实现的,并且FAR为49%。在美国的进行的公开测试中,FAR,为53%。美国国防部高级研究项目署,利用半自动和全自动算法。这种算法需要人工或自动指出图像中人的两眼的中心坐标,然后进行识别。在机场开展的测试中,系统发出的错误警报太多,国外的一些高校(卡内基梅隆大学(Carnegie Mellon University)为首,麻省理工大学(Massachusetts Institute of Technology )等,英国的雷丁大学(University of Reading))和公司(Visionics公司Facelt人脸识别系统、Viiage的FaceFINDER身份验证系统、Lau Tech公司Hunter系统、德国的BioID系统等)的工程研究工作也主要放在公安、刑事方面,在考试验证系统的实现方面深入研究并不多。

人脸识别系统现在在大多数领域中起到举足轻重的作用,尤其是用在机关单位的安全和考勤、网络安全、银行、海关边检、物业管理、军队安全、智能身份证、智能门禁、司机驾照验证、计算机登录系统。我国在这方面也取得了较好的成就,国家863项目“面像检测与识别核心技术”通过成果鉴定并初步应用,就标志着我国在人脸识别这一当今热点科研领域掌握了一定的核心技术。北京科瑞奇技术开发股份有限公司在2002年开发了一种人脸鉴别系统,对人脸图像进行处理,消除了照相机的影响,再对图像进行特征

提取和识别。这对于人脸鉴别特别有价值,因为人脸鉴别通常使用正面照,要鉴别的人脸图像是不同时期拍摄的,使用的照相机不一样。系统可以接受时间间隔较长的照片,并能达到较高的识别率,在计算机中库藏2300人的正面照片,每人一张照片,使用相距1--7年、差别比较大的照片去查询,首选率可以达到50%,前20张输出照片中包含有与输入照片为同一人的照片的概率可达70% 。2005年1月18日,由清华大学电子系人脸识别课题组负责人苏光大教授主持承担的国家”十五”攻关项目《人脸识别系统》通过了由公安部主持的专家鉴定。鉴定委员会认为,该项技术处于国内领先水平和国际先进水平。

1.3现阶段人脸识别应用举例

数码相机人脸自动对焦和笑脸快门技术

首先是面部捕捉。它根据人的头部的部位进行判定,首先确定头部,然后判断眼睛和嘴巴等头部特征,通过特征库的比对,确认是人面部,完成面部捕捉。然后以人脸为焦点进行自动对焦,可以大大的提升拍出照片的清晰度。笑脸快门技术就是在人脸识别的基础上,完成了面部捕捉,然后开始判断嘴的上弯程度和眼的下弯程度,来判断是不是笑了。以上所有的捕捉和比较都是在对比特征库的情况下完成的,所以特征库是基础,里面有各种典型的面部和笑脸特征数据。

公安刑侦破案

通过查询目标人像数据寻找数据库中是否存在重点人口基本信息。例如在机场或车站安装系统以抓捕在逃案犯。

门禁系统

受安全保护的地区可以通过人脸识别辨识试图进入者的身份。人脸识别系统可用于企业、住宅安全和管理。如人脸识别门禁考勤系统,人脸识别防盗门等

门禁系统

摄像防盗系统

可在机场、体育场、超级市场等公共场所对人群进行监视,例如在机场安装监视系统以防止恐怖分子登机。如银行的自动提款机,如果用户卡片和密码被盗,就会被他人冒取现金。如果同时应用人脸识别就会避免这种情况的发生。

信用卡网络支付

信用卡网络支付

利用人脸识别辅助信用卡网络支付,以防止非信用卡的拥有者使用信用卡等。

身份辨识

如电子护照及身份证。这或许是未来规模最大的应用。在国际民航组织已确定,从2010年4月1日起,其118个成员国家和地区,必须使用机读护照,人脸识别技术是首推识别模式,该规定已经成为国际标准。美国已经要求和它有出入免签证协议的国家在2006年10月26日之前必须使用结合了人脸指纹等生物特征的电子护照系统,到2006年底已经有50多个国家实现了这样的系统。今年年初,美国运输安全署( Transportation Security Administration)计划在全美推广一项基于生物特征的国内通用旅行证件。欧洲很多国家也在计划或者正在实施类似的计划,用包含生物特征的证件对旅客进行识别和管理。中国的电子护照计划公安部一所正在加紧规划和实施。

信息安全

如计算机登录、电子政务和电子商务。在电子商务中交易全部在网上完成,电子政务中的很多审批流程也都搬到了网上。而当前,交易或者审批的授权都是靠密码来实现。如果密码被盗,就无法保证安全。如果使用生物特征,就可以做到当事人在网上的数字身份和真实身份统一。从而大大增加电子商务和电子政务系统的可靠性。

1.4人脸识别的难点

人脸识别是机器视觉和模式识别领域最富有挑战性的课题之一,同时也具有较为广泛的应用意义。人脸识别技术是一个非常活跃的研究领域,它覆盖了数字图像处理、模式识别、计算机视觉、神经网络、心理学、生理学、数学等诸多学科的内容。如今,虽然在这方面的研究已取得了一些可喜的成果,但是FRT在实用应用中仍面临着很严峻的问题,因为人脸五官的分布是非常相似的,而且人脸本身又是一个柔性物体,表情、姿态或发型、化妆的千变万化都给正确识别带来了相当大的麻烦。如何能正确识别大量的人并满足实时性要求是迫切需要解决的问题。

目前人脸识别的难点主要存在于以下几个方面:

(1)光照变化是影响人脸识别性能的最关键因素,对该问题的解决程度关系着人脸识别实用化进程的成败,在人脸图像预处理或者归一化阶段,尽可能地补偿乃至消除其对识别性能的影响。

(2)成像角度及成像距离等因素的影响,即人脸的姿态的变化,会垂直于图像平面的两个方向的深度旋转,会造成面部信息的部分缺失。

(3)不同年龄的人脸有着较大的差别。身份证是以前照的,在逃犯的照片也是以前的,因此在公安部门的实际应用中,年龄问题是一个最突出的问题。

(4)采集图像的设备较多,主要有扫描仪、数码相机、摄像机等。由于成像的机理不同,形成了同类人脸图像的识别率较高,而不同类间人脸图像识别率较低的情况。随着人脸识别技术的发展,这一问题也将逐步得到解决。

(5)人脸图像的数据量巨大。目前由于计算量的考虑,人脸定位和识别算法研究大多使用尺寸很小的灰度图像。一张64*64像素的256级灰度图像就有4096个数据,每个数据有256种可能的取值。定位和识别算法一般都很复杂,在人脸库较大的情况下,计算量十分大,很多情况下速度令人难以忍受。而灰度数据事实上是丧失了色彩、运动等有用信息的。如果使用全部的有用信息,计算量就更大了。

第二章人脸识别的常用算法介绍

2.1人脸识别常用方法

人脸识别的方法主要有:基于几何特征的人脸识别方法、基于模板匹配的人脸识别方法、基于小波特征的人脸识别方法和基于模型的人脸识别方法。其中基于模型的人脸识别方法包括特征脸法(Eigneafec)、神经网络法(NN)、隐马尔可夫模型方法(HMM)等方法。

●基于面部几何特征的方法

这个方法在时间上来说是最早提出的人脸识别方法之一,其特征提取以人脸面部特征点的形状和几何关系为基础的。对于不同的人来说有着不同的人脸轮廓、大小、相对位置的分布也是不相同的,所以说用这种方法来进行人脸识别还是有一定依据的。这种方法的做法是,提取眉毛、眼睛、鼻子和嘴巴这几个特征点,计算出这几个特征点的大小,以及他们之间的几何距离,来进行人脸识别,几何距离一般包括特征点之间的距离、他们之间的夹角等。特征提取后选取最近邻分类器,相异度测试选用欧式距离。基于几何特征的人脸识别算法的优点是方法简单,计算速度快。但它识别人脸就靠几个特征点的大小和距离,以及特征点之间的夹角,这样的信息是远远不够的,对于一个稍微大一点的人脸库识别率不高,还有这种方法对于人脸表情变化时没有很好的鲁棒性。但是这种方法还是有一定潜力的,好比一个大型的人脸库,进行人脸比对前可以使用基于面部几何特征的方法对训练样本进行粗分类,这样可以大大降低人脸识别时间。

●基于模板匹配的方法

模板匹配方法也是模式识别中的一个比较传统的方法。把模板匹配方法用到人脸识别中要以Poggio和Bruneili所提出的基于局部特征的模板匹配算法为代表。他们首先利用积分投影的方法确定面部特征点,提取局部特征的模板,然后进行局部模板匹配,计算相关系数进行分类,Poggio和Brulleili比较了基于几何特征和基于模板匹配的人脸识别方法。他们的实验结果表明,在人脸尺度、光照、姿态稳定的情况下,基于模板匹配的人脸识别方法要优于基于几何特征的人脸识别方法。通过大量的实验表明,基于模板匹配的人脸识别方法对光照、旋转、人脸表情比较敏感,仅当这些因素比较稳定时,才能获得比较好的效果。这种方法的计算量要比基于面部几何特征的方法要大。

●基于小波特征的方法

小波变换是国际上公认的最新频率分析工具,由于其“自适应性‘,和“数学显微镜性质”而成为许多学科共同关注的焦点,在信号处理中起着至关重要的作用。目前小

波技术在验证的特征撮上用得较多。小波变换采用以高斯函数的二阶导数作为小波基的小波变换技术来进行拐点提取,然后以该方法为基础,进行不同图像之间拐点序列的匹配;最后再利用提敢的拐点来对图像进行分段和段一段对应处理。由于使用离散小波变换来分解图像的参数特征,特征提取用到自适应算法,匹配则选择动态规划方法,初步试验取得较好的效果。

●基于特征脸的方法

特征脸方法是从主成成分分析(PCA)导出的一种人脸识别和描述技术。它将包含人脸的图像区域看作一随机向量,采用K-L变换得到正交K-L基,对应其中较大特征值的基具有与人脸相似的形状,因此又被称为特征脸。利用这些基的线性组合可以描述、表达和逼近人脸图像,所以可进行人脸识别与合成。识别过程就是将人脸图像映射到由特征脸组成的子空间上,并比较其在特征脸空间中的位置,然后利用对图像的这种投影间的某种度量来确定图像间的相似度,最常见的就是选择各种距离函数来进行度量分类实现人脸识别。

●神经网络法

基于神经网络的人脸识别方法就是利用神经网络的学习能力和分类能力对人脸进行特征提取与识别。目前常用的人工神经网络方法是BP(Back-Propagation)神经网络、自组织神经网络、径向基函数神经网络。径向基函数神经网络与BP网络一样都是多层前向网络,它以径向基函数作为基准,以高斯函数作为隐含层的激励函数。这种网络的学习速率快、函数逼近、模式识别等能力均优于BP神经网络,并广泛应用于模式识别、图像处理等方面。但是这种网络比BP网络所用的神经元数目要多得多,使它的应用受到了一定的限制。

●隐马尔可夫模型方法(HMM)

HMM作为信号的一种统计模型,目前广泛应用于模式识别、图像处理的各个领域。HMM是一个由两种机理构成的随机过程:一个机理是内在的有限状态Markov链,体现为用具有限状态数的Markov链来模拟签名信号统计特征变化的隐含的随机过程,另一个是一系列随机函数所组成的集合,体现为与Markov链的每一个状态相关联的观测序列的随机过程。设有观察序列Q=Q1Q2…Qn和状态集=S{s1,s2,…sn},一个有n个状态的隐马尔可夫模型λ可以表示(π,A,B),其中π为初始状态概率矢量;A={aij}为状态转移概率矩阵,其中aij=P{qt+1=Sj|qt=St},1<=i,j<=N;B={bj}Qt)}为观察符号概率分布,若B有M个观察值{v1,v2…mv},则bj(Qt)=P{qt=vk|qt=sj,1<=j<=N,l<=k<=M}。

HMM的使用涉及到训练和分类两个阶段,训练阶段包括指定一个HMM的隐藏状态数,并且优化相应的状态转换和输出概率以便于产生的输出符号与在特定的运动类别之内所观察到的图像相匹配。匹配阶段涉及到一个特定的HMM可能产生相应于所观察图像特征的测试符号序列的概率计算。利用H顾进行验证同样由两个阶段组成,即利用训练样

本估计MHM模型参数和利用HMM评价测试。这两个过程目前都有成熟的算法,HMM参数的估计可用Baum-welch参数估计算法或Segmental K-means算法;对测试样本的评价,可以用Forward-Backward迭代算法估计签名满足模型的概率,或用viterbi最优状态搜索算法计算过程经过的最优状态。因此,利用HMM模型的关键在于HMM类型的选择和一些参数的选择以及阀值的估计[4]。

2.2分类器

在人脸识别过程中,通过提取特征模块,得到表示人脸图像的特征向量,此时需要利用分类器根据提取的特征向量进行分类处理,以确定当前人脸的身份。在这个过程中,分类器起着决策机制的作用,对最终的判别非常关键,分类器性能的优劣也将直接关系到人脸识别结果的好坏。常用的分类器有以下几种:

●最小距离分类器(NC)

最小距离分类器相似度量是以检测样本到类中心的距离大小为判据。

●最近邻分类器(NN)

最近邻法是将所有训练样本都作为代表点,因此在分类时需要计算待识别样本x到所有训练样本的距离,与x最近的训练样本所属于的类别即为待识别样本x所属类别。假定有C个类别ω1、ω、ωn的模式识别问题,每类有标明类别的样本Ni个,i=1,2,…,C,我们可以规定以类的判别函数为:

,k=1,2,…,N

i

.

●三阶近邻法

三阶近邻法是计算像素的差值的绝对值。距离公式可表示为:

L(x,y)=lx

i -y

i

l (2.2.3)

由式(2.2.3)计算所得出的具有最小值的图像并不一定属于同—类别。三阶近邻法计算出与测试图像距离最小的三幅图像,计算这三幅图像所属的类分别计为classl,class2,class3,若classl和class2且class2和class3不属于同一类,则测试图像属于classl;若classl和class2相同,则测试图像属于classl,而class2与测试图像也是相似的;若class2和class3属于同一类,则测试图像属于class2,而class3与测试图像也是相似的,但classl虽然与测试图像距离最近却不属于同一类,可能是

由测试图像的姿态和饰物引起的。

●贝叶斯分类器

如果知道各类的先验分布和条件分布,就可以采用最大后验估计(MAP)的方法进行分类。在人脸识别中,有时假定人脸服从高斯分布,能够得到不错的结果。

●支撑向量机(SVM)

在小样本情况下,降低了训练集的错分风险,又降低了未知人脸(如检测集)的错分风险。在人脸识别中已逐渐得到应用。

●神经网络分类器(NNC)

采用神经网络作为分类器是很自然的。一般一个3层网络对应模式识别中图像输入、特征提取、分类3部分。通常的NNC有多层感知机(MLP)模型、BP网络、径向基函数网络等。SVM也借鉴了神经网络的思想。

第三章人脸识别系统的设计及实现

3.1人脸识别流程

完成人脸识别的工作需要一系列的步骤,它们结合起来构成一个完整的流程。由于研究人员来自不同的学科、具有不同的背脊,而且不同的人脸识别应用中对识别的目标也不同,所以人脸识别的流程并不统一一个比较通用的人脸识别流程如下图所示:其主要步骤包括:人脸检测/跟踪(face detection/tracking),特征提取(face extraction),特征降维(face dimensionality reduction),匹配识别(matching and classification).它们之间基本上是串行的关系。

(1)人脸检测/跟踪。人脸检测是完成人脸识别工作的自动系统的第一个步骤。该步骤的目的是在输入的图像中寻找人脸区域。具体来说:给定意一幅任图像,人脸检测的目的是确定是否图像州有人脸存在,如果存在,给出每个人脸的具体位置和范围。实际应用中人脸图像的采集或获取常在非受控的条件下进行,这样所得到的图像中的人脸在尺寸、朝向、明暗、遮挡、分辨率等方面都有很多不同,使同一的人脸出现各种变形,并有可能导致各种误识、漏识等失败的情况。为校正人脸在尺度、光照和旋转等方面的变化,常需采用一些包括几何归一化(空间尺度归一化)和光照归一化(灰度幅值归一化)等手段来调整不同的人脸图像,以利于用统一算法进行识别。

(2)特征提取。为区分不同的人脸,需提取各种人脸的独特性质。也就是要从人脸图像中映射提取一组反映人脸特征的数值表示样本。这里首先需要采取某种表示方式来表示检测出的人脸和数据库中的已知人脸。通常的表示法包括几何特征(如欧氏距离、曲率、角度)、代数特征(如矩阵或特征向量)、固定特征模板、特征脸等。

(3)特征降维。人脸是一个非刚性的自然物体(柔性体),从人脸图像中可提取很多不同特征,所以表征人脸的原始特征对应高维空间中的数据(对一幅M*N的图像,空间维数可达M*N)。直接利用这样高维的数据进行识别除需要很多的匹配计算量外,由于很难对各高维数据的描述能力做有效的判断,故还不能保证基于这么多数据进行的识别结果的正确性。在特征提取后,需采用紧凑的人脸表征方式,将原始特征进行筛选组合,集中信息,降低维数,使这些低维空间的有效性的到提高,以有利于接下来的匹配分类。

(4)匹配识别。在特征提取的基础上,选择使当的匹配策略,可将待识别的人脸与数据库中的已知人脸进行匹配比较,建立它们的相关关系,并输出所作出的判断决策/决定(识别结果)。与人脸检测不同,这里利用的主要是人脸个体差异的信息。有两种识别目的和情况需要区别:一种是对人脸图像的验证(verification),即要确认输

入人脸图像中的人是否在数据库中,属于有监督的识别;另一种是对人脸图像的辨识(identification ),即要确认输入图像中的人的身份,属于无监督的识别。

3.2 kL 变换和PCA 人脸识别方法

3.2.1简介

我们希望将图像原特征做某种正交变换,获得的数据都是原数据的线性组合,从新数据中选出少数几个,使其尽可能多地反映各类模式之间的差异,又尽可能相互独立,一个常用的方法就是主成分分析(PCA)。KL(Karhunen-Loeve)变换或主分量分析 (Principal Component Analysis ,PCA),这是一种特殊的正交变换,它是重建均方误差最小意义下的最佳变换,起到减少相关性,突出差异性的效果,在图像编码上能去除冗余信息,也常用于一维和二维信号的数据压缩;这种变换采用主要特征对应的特征向量构成变换矩阵,保留原模式样本中方差最大的数据分量,在对高维图像编码时起到了降维作用。由于KL 变换和PCA 去相关性和降维作用,Mathew A.Turk 和P.Pentland 首先将主成分分析运用到人脸识别中来。通过K_L 变换得到高维人脸空间的投影矩阵,人脸图像都可以由这些矩阵的线性组合来表示,正是因为这些矩阵呈现人脸的形状,所以将这种人脸识别称为特征脸(Eigenface)方法。

对给定的信号x(n),如果它的各个分量之间完全不相关,那么表示该数据中没有冗余;若x(n)中有相关成分,通过去除其相关性则可达到数据压缩的目的。主成分分析方法(PCA)基本思想是提取出空间原始数据中的主要特征(主元),减少数据冗余,使得数据在一个低维的特征空间被处理,同时保持原始数据的绝大部分的有用信息,从而解决数据空间维数过高的瓶颈问题。

一个宽平稳的实随机向量x(n)=[[x(0),x(1),…,x(N-1)]T ,其协方差矩阵C x 定义为:

C x =E{(x-μx ) (x-μx )T }=

式中E{·}代表求均值运算,μ=E{x}是信号x 的均值向量,C x 的元素

C x (i ,j )=E{x(i)-μx }( x(j)-μx )]=C x (j,i)

即协方差阵是实对称的。显然,矩阵C x 体现了信号向量x 的各分量之间的相关性。

若x 的各分量互不相关,那么C x 中除对角线以外的元素皆为零。

KL 变换的思路是寻求正交矩阵A ,使得A 对x 的变换y 的协方差阵C x 为对角矩阵,

0,00,11,01,1N N N N C C C C ----?? ? ? ???

其步骤如下:

先由λ的N 阶多项式|λI -C x |=0,求矩阵C x 的特征值λ0,λ1,…λN-1,以及N 个特

征向量A 0,A 1,…A N-1。然后将A 0,A 1,…A N-1归一化,即令=1,i=0,1,2…,N-1。

由归一化的向量成A 0,A 1,…A N-1就构成归一化正交矩阵A ,即

A=[ A 0,A 1,…A N-1]T

最后由y-Ax 实现对信号x 的KL 变换。显然,矩阵A 各向量之间相互独立,体现了去相关性,在图像编码中去除了冗余。

3.2.2 KL 变换原理

假设X 为n 维的随机变量,X 可以用n 个基向量的加权和来表示:

(3.2.2.1)

式中:a i 为加权系数,Фi 为基向量,此式也可以用矩阵的形式表示:

X=(φ1φ2…φn )(a 1a 2…a n )T (3.2.2.2)

其中 Ф=(φ1φ2…φn ), α=(a 1a 2…a n )T

我们取基向量为正交向量,Ф由正交向量构成,所以Ф是正交矩阵,即ФT Ф=I 将公式(4.2.1.1)两边左乘ФT,并考虑到Ф为正交矩阵,得α=ФT X 即:αi =ФT i X 。

我们希望向量α的各个向量间互不相关。那么如何保证α的各个分量互不相关呢?这取决于选取什么样的正交向量集。设随即向量的总体自相关矩阵为:

R=E[X T X] (3.2.2.3) 将公式(4.2.1.1)代入上式(4.2.1.3),得

R=E[X T X]=E[Фα αT ФT ]= ФE[ααT ]ФT (3.2.2.4) 写成矩阵的形式

则:R=Ф△ФT (3.2.2.5)

将上式两边右乘上Ф,得: RФ=Ф△ФT Ф (3.2.2.6)

1n i

i X a ==∑1n λλ??

?=Λ

? ???

因为Ф是正交矩阵,所以得: R Ф=Ф△ (3.2.2.7) RФj =Фj △j (j=1,2,3,…n) (3.2.2.8)

可以看出,λi 是x 的自相关矩阵R 的特征值,。Фj 是对应特征向量。因为R 是实对

称矩阵,其不同本征值对应的特征向量应正交。

综上所述,KL 展开式的系数可用下列步骤求出:

步骤一:求随即向量x 的自相关矩阵R=E[X T X],由于没有类别信息的样本集的均值向量,常常没有意义,所以也可以把数据的协方差矩阵作为KL 坐标系的产生矩阵,这里召是总体均值向量。

步骤二:求出自相关矩阵或协方差矩阵R 的本征值λj 和本征向量Фj 。其中j=1,2…

n 。同时本征向量组成的矩阵为Фj 。j=1,2…n 。

步骤三:展开式系数即为α=ФT X 。

K-L 变换的实质是建立了一个新的坐标系,将一个物体主轴沿特征矢量对齐的旋转变换,这个变换解除了原有数据向量的各个分量之间相关性,从而有可能去掉那些带有较少信息的坐标系以达到降低特征空间维数的目的。

3.2.3主成分分析法 (PCA )

主成分分析法(PCA)在人脸识别领域成功应用的一个重要理论基础是较好的解决了K.L 变换后协方差矩阵的特征向量的求解问题。人脸识别是一个典型的高维小样本问题,即人脸图像向量的维数一般较高,比如,实验用的ORL 人脸库的图像大小为112x92的人脸图像,其对应的图像向量特征空间高达10304维,在如此高维的图像空间内,按照通常的算法,计算样本的协方差矩阵的特征向量是异常耗时的。同时,在人脸识别问题中,由于客观条件的限制,训练样本的数目一般较小,通常,训练样本的总数远远小于人脸图像向量的维数。针对高维小样本的情况,求解特征向量所采取算法的基本思想是,将高维的问题转化为低维的问题加以解决。

主成分分析法(PCA)是模式识别判别分析中最常用的一种线性映射方法,该方法是根据样本点在多维模式空间的位置分布,以样本点在空间中变化最大方向,即方差最大的方向,作为判别矢量来实现数据的特征提取与数据压缩。主成分分析法的原理如下:

已知n 维空间的随机向量用φ(φ∈R n )表示,利用公式将φ进行零均值处理,x=φ-E(φ),则E(x)=0。如果对x 用一组完备正交基μj ,j 二1,2,…n 展开,可得

(3.2.3.1)

1k i j

i x a u ==∑

假设只用前k 项进行重构,则

(3.2.3.2) 其均方误差为:ξ=E[(x-x rec )T (x-x rec )] (3.2.3.3)

因为:

且αj =μj T x

所以:

ξ=E 1n T T j j J k u xx u =+??????∑=1n

T j j J k u Cu =+∑ (3.2.3.4) 其中C=E[xx T ]=E[(φ-E[φ]) (φ-E[φ])T ]是x 和φ的总体协方差矩阵。

为了使重构的均方误差最小,并满足正交条件的约束,采用拉格朗日乘子法,将函数: J(u j )= - 对μj (j=1.2…n)求导,得:

(C-λj I)μJ =0,J=k+1,k+2…,n (3.2.3.5)

令k=1,此时ul ,u2,…,un 为总体协方差矩阵C 的本征向量,λ1, λ2…λn 分别

是它们对应的特征值,这些特征向量经过正交化处理所形成的空间称为特征空间。将特征向量ul ,u2,…,un 按照它们的特征值进行降序排列λ1≥λ2≥λ3…≥λn 。,则得到结论:

对于任一随机变量x ,如果采用总体协方差矩阵C 的前k 个最大非0特征值所对应的特征向量作为坐标轴展开,可在相等截断长度下获得所有正交展开中最小的截断均方误差ξmin

(3.2.3.6)

下面我们将主成分分析法用于人脸识别。

假设训练人脸图像的个数为M ,将每一副图像按列串相接的方式排成长度为N 的向量Γ1,Γ2,Γ3…, ΓM .其均值向量(即平均脸)为:

1

k rec j j

j x a u ==∑1n T

j j

J k u Cu =+∑()

11n T j j j J k u u λ=+-∑min 1n i j k ξλ=+=

Ψ=1/M

1n i j k =+Γ∑ (3.2.3.7)

每个图像相对于均值图像的差为ΦI -Ψ(i=1,2,…,M)。令矩阵A=[Φ1, Φ2…,Φm ],则散布矩阵∑可以表示为:

∑AA T =1/M 1n T i i j k =+ΦΦ∑ (3.2.3.8)

求出∑的特征值λk 和特征矢量μk ,由于μk 看起来像一张人脸,因此μk 常称作特征

脸向量,用特征向量构成的图像称为特征脸图像。由于∑是NxN 大小的矩阵,而且N 的值较大,一般远大于训练样本的个数M ,因此为了降低计算量,通常不直接求∑的特征向量μk ,而是先计算大小为MxM 的矩阵A T A 的特征向量νk ,根据代数理论,有:

(3.2.3.9)

对于这些相互正交的特征向量,根据其对应的特征值的大小按照从大到小的顺序进行排列,取前面J(J

ωi,k =<Φi ,u k >=u k T (Γi -ψ) , (i=1,2,…M;k=1,2,…,J)

这里“<·>”表示内积。对于任一待识别的图像,用同样的方法求出其投影系数Oi=(ω1, ω2,…, ωj),则满足下列条件的第J 个训练图像即为识别结果。

J *=arg (3.2.3.10)

3.3人脸识别中PCA 算法步骤及流程

3.3.1 pca 方法人脸识别步骤

具体的识别步骤如下:

(1)读入人脸库;

(2)计算K-L 变换的生成矩阵;

(3)利用SVD 定理计算特征值和特征向量;

(4)把训练图像和测试图像投影到特征空间;

(5)比较测试图像和训练图像,确定待识样本类别。

k 11n k j k u A ν=+=

∑1,2,...min {||||}i i M

=Ω-Ω

3.3.2计算特征脸

前提先假设我们读入的人脸库有M幅人脸图像每幅图像由N=K×L个像素组成(K表示行,L表示列),那么将这些图像按行排列,就形成N维列向量,构成N维样本集合xi=[……]T然后接下去将有M个人脸图像组成的集合表示成一个矩阵形式:X=[x1,x2,…,xm]∈RN×M。令ψ表示所有样本的均值向量(也就是我们所说的平均人脸),从X的每列中减去ψ得到向量A=[x1-ψ,x2-ψ,…,xm-ψ]。最后利用集合A求特征脸。

具体算法步骤如下:

①将每幅图像表示成向量xi,i=1,…,M;

②计算平均脸向量:

对yale图像训练的”平均脸”

③得出每幅图像的均值脸=xi-ψ;

④计算协方差阵:

C=

⑤计算AAT的特征向量μi;

⑥只保留K个最大的特征向量组成特征子空间。

⑦把训练后得到的图像集投影到特征子空间,得到特征脸。

对ORL图像训练的”特征脸

3.3.3使用特征脸进行人脸识别

基于特征脸的人脸识别过程也分为训练阶段和识别阶段。在训练阶段,我们把每个已知人脸映射到由特征脸组成的空间上,得到m维向量,接下去就是利用分类器进行判别分类,算法步骤如下:

①假设待识别的未知人脸为,在做识别之前,先要把人脸图像进行标准化。

②把标准化之后的人脸图像向特征子空间投影:

③在特征子空间里,再将该投影到的人脸表示成训练脸的向量,

④选择最近邻分类器欧几里德距离进行判别分类。

⑤采用最小距离法对人脸进行分类,分类规则如下:若er≥θc,则表示输入的图像包含未知人脸;若er<θc,则表示输入图像为库中第r个人的人脸。

3.4 pca方法的优点和缺点

Pca方法的优点:

(1)最小均方误差。可以证明,PCA是在均方误差最小意义下的最优正交分解方法,因此用PCA进行信号压缩能够得到最大的信噪比。

(2)降维。由于基函数的个数往往远小于信号的维数,因此PCA变换能够大大降低数据的表示维数。这对模式识别中的特征提取非常有利。

(3)消除冗余。在基函数上的投影系数彼此之间是不相关的。

(4)分解函数/合成函数相同。分解函数(Analysis Function))作用于输入信号,得到信号的编码;合成函数(Synthesis Function)作用于信号的编码,得到原始

信号。如果图像的分解和合成采用线性模型,则分解函数φ

I 和合成函数Ф

i

是和输入信

号具有相同维数的向量,它们可以表示为:

α

i =φ

i

T I, I=∑

i

α

i

Ф

i

主成分分析(PCA)法同样有其自身的缺点。PCA法将K-L变换后特征值从大到小进行排列,挑选相对大的特征值所对应的特征向量,构成一个K-L变换特征空间的子空间,来进行特征提取。又因为K-L特征空间中,较大特征值所对应的特征向量体现原图像的总体趋势、低频分量;较小特征值所对应特征向量体现原图像的细节变化、高频分量,所以PCA法提取图像总体特征,在人脸图像上的表现就是人脸的外形轮廓和灰度变化,以此作为人脸特征,却丢失了一些原有的重要信息。PCA法在人脸特征提取中可以取得较好的效果,但它是基于Kl一变换的一种特定的选择,无法根据图像的不同而进行优化选取,无法完全避免K-L变换的局限.

相关主题
相关文档
最新文档