基于DWT和ONMF的人脸表情特征提取

基于DWT和ONMF的人脸表情特征提取
基于DWT和ONMF的人脸表情特征提取

第29卷第18期计算机工程与设计2008年9月V01.29No.18ComputerEngineeringandDesignSept.2008

基于DWT和ONMF的人脸表情特征提取

杨丽瑞,张建明+,王良民

(江苏大学计算机科学与通信工程学院,江苏镇江212013)

摘要:提出了一种基于离散小波变换(discretewavelettransformation,DwT)和标准正交非负矩阵分解(orthonormainon—negativematrixfactorization,oNMF)的人脸表情特征提取方法,该方法先通过离散小波变换,降低图像的噪声,并将得到的图像的低频信息作为研究对象;再采用标准正交非负矩阵分解来提取表情特征.实验结果表明相对于PCA,NMF和LNMF方法,本文方法能够有效地减小类内与类间距离的比值,体现了很好的聚类效果;较高的识别率和较快的识别速度表明了该特征提取方法的有效性.

关键词:特征提取;离散小波变换;标准正交非负矩阵分解;类内类间距离比值;识别

中图法分类号:TP391.41文献标识码:A文章编号:1000—7024(2008)18-4789.05

FacialexpressionfeaturesextractionbasedonDWTandONMF

YANGLi?rui,ZHANGJian?ming+,WANGLiang-min

(CollegeofComputerScienceandCommunicationsEngineering,JiangsuUniversity,Zhenjiang212013,China)

Abstract:Anovelmethodbasedondiscretewavelettransformationandofthonormalnon?-negativematrixfactorizationforfacialex-?pressionrecognitionispresented.Firstly,discretewavelet

transformationisusedtoreducetheimagenoiseandproducearepresentationinthelowfrequencydomain.Then,orthonormalnon-negativematrixfactorizationisusedtoextractthefacialfeatures.Experimental

resultsshowthatthismethodCan

effectively

reducetheratioofthewith?-indistanceandbetween??classdistancecomparedtoPCANMF,

andLNMF,impliesthe

goodclusteringproperty.Highrecognitionrateandspeedalsoindicatestheeffectofthisfacialexpressionfeaturesextraction.

Keywords;featureextraction;DWT;ONMF;theratioofthewith-indistanceand

between-classdistance;recognition

O引言

人脸表情特征提取是表情识别的核心步骤,是识别技术的关键,决定着最终的识别结果。目前主要的特征提取方法有基于几何特征,外貌特征和混合特征的方法。外貌特征中统计的方法和Gabor小波方法是表情识别特征提取近来的热门研究方法,尤其是Gabor小波法01和PCA叫法。Gabor滤波器对人脸表情特征具有良好的表征能力,且对光照变化不敏感,但通常采用图像与滤波器组进行卷积,计算量大;PCA提取了最有代表性的特征,有效地消除了信息冗余,但没有考虑不同类别数据之间的区分性。混合特征方法中一类重要的方法是基于模型的方法,主动表观模型Ⅲ是目前广泛应用的一种人脸特征提取方法。相对于基于外貌特征的方法,基于模犁的方法可以得到更为可靠的人脸特征参数,但同时也有计算较为复杂,而且初始点获取困难等缺点。

近年来,关于特征降维和提取方法有了一些新的研究。Ice和Seung“1于1999年在(Nature))上提出了不同于传统PCA的非负矩阵分解(NMF)方法,引起了广大研究者的关注,通过NMF可以提取人脸的各种局部特征。但直接用于人脸表情特征提取时,基矩阵存在着大量的冗余信息,不利于分类地进行,且迭代过程需要较大的计算代价鲫。为消除信息冗余,研究者们提出了几种改进算法,局部非负矩阵分解(LNMF)【”,Fisher非负矩阵分解(Fm肛)和PCA非负矩阵分解(P№仔)蚓等使得分解后的基矩阵正交化,虽然识别率有所提高,但这些方法在得到基矩阵时需要更多的迭代时间,并且目标函数中限制条件的常量因子的确定目前还没有理论依据,都是通过反复试验确定。

针对上述J’廿J题,本文利用离散小波变换,结合标准正交化非负矩阵分解,提出了一种新的人脸表情特征提取方法。该方法首先通过Haardx波变换得到图像的低频信息,去除噪声,降低计算复杂度;然后将非负矩阵分解的基矩阵标准正交化来提取表情子空间特征,将人脸图像在该特征子空间投影,得到的投影系数作为特征向量。

收稿日期:2007-09-26E-mail:枷m@ujs.edu.ell

基金项目:江苏大学高级专业人才科研启动基金项目(05JDG020)。

作者简介:杨丽瑞(1983一),女,山东单县人,硕士研究生,研究方向为图像处理、模式识别;+通讯作者:张建明(1964一),男,江苏镇江人,博上,教授,研究方向为虚拟现实、图像处理、模式识别等;王良民(1977一),男,安徽潜山人,博士,讲师,研究方向为模式识别、图像处理及网络安全。

?--4789?——万方数据

1表情图像的预处理

表情图像预处理的好坏直接影响表情特征提取的效果和计算量,包括人脸定位及表情图像的归一化处理。本文采用Adaboost算法”1来检测人脸区域,通过对表情图像灰度直方图的修正从而调整图像的均值和方差来完成图像的灰度归一化处理,采用双线性插值算法来进行尺寸归一化。本文将所有图像进行预处理,尺寸标准化为60x80个像素大小。

2基于离散小波变换和标准正交非负矩阵分解的特征提取

2.1人脸图像的小波变换

小波变换是一种信号的时间.尺度(时间.频率)分析方法,具有多分辨率分析的特点,在时频两域都具有表征信号局部特征的能力,而且能够去除冗余信息和噪声,小波变换是基本小波(母小波)的函数妒(f)在不同尺度肉子,和时『日J参数k下与分析信号“f)做内积的变换过程。在计算机中实现时,连续小波必须加以离散化,将缩放因子和平移因子都取为2,(舢的整数)的倍数,得到母小波函数:纵f)=1/x/2口o(2-Jt-功,七∈z。离散小波变换用到了两组函数:尺度函数和小波函数,它们分别与低通滤波器和高通滤波器相对应。采用Mallat算法,可以把~幅图像分解成4个子带。如图l的(a)所示,dl是低频信息,代表图像的近似系数,集中了原始图像的绝大部分信息和能量,cHl是水平细节系数,cVl是垂直细节系数,cDl是对角细节系数。根据实际的需要,小波变换可以多次进行。

经过小波变换之后高频部分主要包含图像的边缘信息及

}_——H

cvllcDlI

1.............I..J

(a)第一层分解(b)图像的一层分解

图l图像的小波多尺度分解

噪声,而低频部分主要包含图像的形状信息。相对于边缘信息,形状信息作为表情特征更加有效,有较好的稳定性,这同时也符合人类的视觉特点n””。因此本文将小波变换后的低频图像作为研究对象。一幅原始图像经过n层小波变换后,低频子图像的尺寸仅为原图像的1/2“,可以有效地降低原图像的维数,从而降低计算复杂度,但层数过多会使原始图像变得模糊不清而不利于分类。本文选用Haar小波基对实验图像进行两维离散小波分解,选用第一层的低频分量作为小波特征,这样既保留了人脸的全局形状信息,J司时义淡化了局部细节。一幅图像的原始图像和经过一层小波变换后的图像如图l(b)所示。

2.2基于标准正交非负矩阵分解的特征提取

非负矩阵分解的问题141可以描述为:给定一系列"维非负数据向量,所有的向量组成一个tlxm的非负矩阵V,这里脚是数据集合中样本的个数,在满足陋WxH下,通过迭代规则,隐阵被近似分解为一个疗x,.的非负基矩阵形和一个,.x册的非负系数矩阵日。所以,非负矩阵分解是用非负性这一约束来表示数

?——4790?——

据的,即只允许分解的数据中出现加性组合,不允许减性运算。这一约束导致了基于部分的表示。

由于非负矩阵分解的摹矩阵∥的向量之间并不是正交的,所以数据之间存在着大量的冗余。借鉴于PCA消除信息冗余的思想,本文将∥矩阵进行标准正交化,得到一组互不相关的特征向量,以这组特征向量作为基底建立新的表情描述空间,将原始表情信息在新空间中进行投影得到新的表情特征值。本文使用施密特正交化过程来实现矩阵的标准正交化。

要得到满足降WxH的近似分解,需要找到合适的目标函数。目前常用的两种目标函数是欧式距离和K.L离散度(Kulibaek.Leiblerdivergence)“”。本文选用计算简单的欧式距离作为目标函数,如式(1)

Il肛t//*HII2=∑(%一(W*H)oY(1)则非负矩阵分解问题转化为如下的最优化问题:在职日非负,∑%=I的条件下,通过迭代规则,计算欧式距离,寻找使得该距离小于给定的阈值时的W¥FIIH。

该闯题的求解过程描述如下:

(1)初始化矽,日为非负随机矩阵。

(2)按式(2)对形和日进行迭代计算。

既一耽勰

耽一—!坠~(2)

艺耽

凰一巩糯

(3)根据式(1)计算欧式距离,如果大于给定的阈值,返回(2)继续运算;否则停止,此时的阡和H即是所求的两个分解矩阵。

设w。,w2,…w,是经过非负矩阵分解后得到的∥的r个基向量,正交化过程描述如下:

输入:Wl,w2,…wr,tzXr的特征向量组。

输出:OW。,ow2,…OWr,玎×,的标准正交化的特征向量组。

owt2W’

while(i<=r)

州训一苫舞篇㈨

■rl州’‘'v¨’‘,

Dm21r研

end

(wf,owk)是m和OWk的内积,I|OW||是向量OW的长度。经过上述Schimidt正交化过程,得到形的一个规范正交基OW.因为新的特征向量体现的是表情数据的聚类性,所以用新的表情特征作为分类依据能得到更好的分类结果。

选取10个人,每人每种表情6幅表情图像,总共360幅图像作为训练样本,用来建立非负矩阵子空间。将每幅图像预处理后进行一层Haar小波变换,提取低频图像系数矩阵,对应的低频图像的大小为30x40个像素大小,将每幅图像的低频系数矩阵进行向量化,组成矩阵巩1200x360),然后以欧式距离作为目标函数按公式(2)进行迭代运算,通过实验选择r=28,而作为限制条件的欧式距离取为15.43,此时迭代前后的两次

欧式距离之差小于0.0001,即当这个距离变化很小时,可以看万方数据

作迭代结束。经过NMF之后,得到了基矩阵职1200x28),基

图像如图2所示。

图2NMF分解后得到的基图像W

特征向量的获取:对于一个6幅图像的待测图像序列F,首先进行一层Haar小波变换,选取其低频系数矩阵,将每一幅低频系数矩阵向量化,整个图像序列组成矩阵x,根据公式

(3)得到对应的特征向量矩阿

fffiow’x

(3)

式中:D矿=(OW70聊。D矿,是标准正交化矩阵OW的广义逆

矩阵。则厂是28x6的特征向量矩阵,将其向量化为168维的列向量作为给定图像序列的特征向量。

3基于余弦相似测度的表情分类识别算法

余弦相似测度(CSM)是一种基于最近邻规则的常用相似度匹配方法,物理意义明确,聚类效果好,容易实现。角距离体现了向量和中心向量的贴合程度,利于确定状态的接近情况。本文采用余弦相似测度表达不同向量之间的距离,根据向量之间的夹角,夹角越大,该两向量之间的距离越大,相似度越小,反之,夹角越小,两向量之间的距离越小,相似度越大。两向量之间的余弦距离表示为

COSa=

式中:卜测试向量和模板向量之间的方向角,r模板向

量,r待测向量。a值越小,x与y之间的差异性就越小,即夹

角越小,余弦值大,两者的差异性小。本文中x代表6种表情的模板向量之一,Y表示待测表情特征向量。待测表情属于6

个余弦值中的最大的表情模板所代表的表情。

4表情特征提取实验过程

4.I实验数据

采用Cohn.Kanade表情库。该库中包含了200多人的6种表情的近2000个图像序列。每个序列都是从中性表情开始到表情的极大状态。本文随机选择40个人的表情图像来做实验,每个人每种表情按由弱到强的顺序包含6幅图像,共1440幅图像。

4.2表情特征提取的有效性测试

本文通过两种方法来说明提取特征的有效性:

(1)通过将提取到的特征向量进行重构原图像的方法来验证所提取特征的有效性;

(2)通过6类表情的类内与类间距离比值来分析特征提取方法的有效性,将本文方法与PCA,NMF和LNMF进行了一个直观的比较。

4.2.1

图像重构

将一幅表情图像图3(a)投影到基矩阵D∥上,再利用Haar

小波反变换重构该人脸表情图像。重柯效果如图3(b)所示,可以看出,本文所提取的表情特征包含了人脸表情的主要信息。

图3图像重构效果

4.2.2表情类内类问距离比值的分析

使用余下的30个人的图像序列进行类内类间距离比值的测试,对每种表情的30个图像序列分别进行一层离散小波变换,然后按公式(3)将得到的低频图像序列矩阵投影到基矩

阵OW,则6种表情得到6个168x30的特征向量矩阵,矩阵的每一列代表一个待测表情序列特征向量。根据这6个矩阵,分别使用欧式距离来计算6类表情的类内距离和类间距离,进而得到类内与类问距离的比值。根据模式识别理论,该比值越小,则各类之间的区分度越大。

对于PCA,NMF和LNMF,本文也分别计算它们的类内与类问距离的比值。其中PCA本文取了占其85%能量的特征值所对应的特征向量作为主元,比较结果如图4所示。

从图4中可以看出,这3种方法的结果值都是小于l的,即分类结果是偏向于类内的。本文方法计算“{来的类内类间距离之比绝大部分是小于PCA和NMF计算出来的类内类间距离之比的;而相比于LNMF,两者差别比较小,但总体而言,本文方法的距离比值还是占优势的。

一479l一

万方数据

图4每种表情与其它5种表情的类内类间距离的比值

图4(由中,相比于其它方法,本文方法计算的生气与生气之间的距离与生气与悲伤之间的距离比值相对较大,主要是由于本文在进行NMF之前,进行了小波变换,只取了其低频信息,在降低了计算复杂度的同时,也除去了对分类某些表情有用的纹理信息,这是导致生气表情的类内类间距离比值较大的主要原因。采用标准正交化之后,对于绝大部分表情而言,类内类间距离的比值明显减小,更有利于各种表情的区分。

LNMF通过对基矩阵∥增加了更多的限制条件而强化分解的结果,得到了较之NMF更好的结果6,71,但是用于高维数据时,矩阵分解需要更多的迭代时间同。采用相同的实验条件,本文使用Matlab7.0编程,在P42.4GHZ,512MB的PC机上运行,比较了迭代相同次数时本文方法和LNMF的时间,如表1所示。本文在进行非负矩阵分解之前进行了小波变换,由于小波变换之后所取低频图像的大小只有原图像大小的I/4,使得分解的速度大大提高。

表1LNMF和WT+ONMF的迭代时间对比

从类内与类间距离的比值和得到基矩阵的时间对比上来看,本文方法在表情特征的可区分性上优于PCA和№仃;与LNMF相比,分解的速度优于LNMF。

5表情分类识别

5.1训练过程

(1)选取进行非负矩阵分解的lO个人的360幅图像序列.—?4792?——

构成训练图像集,按上文所述,将每种表情得到的lO个28x6的特征向量矩阵平均化为1个28x6的平均特征向量矩阵。

(2)将得到的每种表情对应的特征向量矩阵向量化为168维的列向量,设圻(f=1名…,6)分别表示6种表情的模板特征向量。

5.2测试过程

选取余下的30个人,每个人每种表情一个图像序列共6幅图像。将待测图像序列分别同样进行小波变换,根据公式(3)得到特征向量矩阵,同样将其向量化为168维的列向量肠,使用余弦距离公式(5)计算其与6类表情模板向量的余弦值,最大的值对应的类别就是该图像序列所属的表情类别。

c。s%瓜)2而高蓠惫丽(5)式中:^板——6类表情的模板特征向量Z(i--l,2,…,6)。

最后本文方法得到的平均识别率是84.45%,选取NMF的改进算法LNMF进行比较,LNMF的平均识别率是83.34%。图5是识别结果比较图。另外本文还对两种算法的执行速度进行了比较,对于一个给定的待测图像序列从提取特征到最后的识别,本文所用的时间是0.2030s,LNMF所用的时间是1.125s。说明了本文方法相比于LNMF的速度优势。

-v-DWT+ONMF‘屺OS;*LNMF+cOS

图5表情识别结果

5.3表情分类实验结果分析

从图5可以看出,与LNMF相比,害怕、悲伤和惊讶的识别率有所提高,而生气的识别率低于LNMF,原因是生气主要表现为两眼眉骤起,嘴抿紧,而眼睛眉毛的部分纹理变化明显,本文方法采用小波变换后的低频部分,相对于采用原图像的LNMF,滤掉了部分对分类生气表情有用的纹理信息。

在现有的识别方法中,IoanBuciu01第一次将NMF和LNMF用于人脸表情识别特征提取,在使用余弦相似测度作为分类器的条件下,使用Cohn.Kanadc表情库,LNMF得到的最高识别率是81.42%,NMF的识别率低于80%。本文方法得到了84.45%的平均识别率,略高于LNMF的平均识别率,而识别的速度优于LNMF。所以,本文特征提取方法用于表情识别从识别率和识别时间上均达到了一定的要求。

6结束语

针对传统的NMF直接用于表情特征提取时基矩阵存在着大量的冗余,并且矩阵分解的时间比较长的问题,本文提出了离散小波变换结合标准正交非负矩阵分解的方法进行表情特征提取。通过选取小波变换后的低频信息作为研究对象,减少了NMF的迭代次数,提高了计算的效率,通过将NMF后

万方数据

得到的摹矩阵进行标准正交化,去除了冗余信息,进一步提高了表情数据的聚类性。该方法实现简单,通过图像重构可以看出其能够提取到有效的表情信息;通过与PCA,NMF比较发现,其类内类间距离的比值明显有所减小;与LNMF相比,各种表情之间的可区分性相当或稍好一点,而分解的速度优于LNMF;在余弦相似测度作为分类器的条件下84.45%的识别率也达到了一定的要求。对比的实验结果充分说明了本文特征提取方法的有效性。

参考文献:

【l】May-PingLob,Ya-PingWong,Chee-OnnWong.FacialeX-pressionrecognitionforE-learningsystemsusingGaborwaveletandneuralnetwork【C】.ProceedingsoftheSixthInternationalConferenceonAdvancedLearningTechnologies(ICAU’06).Washington,DC,USA:IEEEComputerSociety,2006:523—525.【2】Daw?TungLIN.FacialexpressionclassificationusingPCAandhierarchicalradialbasisfunctionnetwork[J].JournalofInforma—t'ionScienceandEngineering,2006,22:1033-1046.

【3】AbboudB,DavoineEAppearancefaetorizalionbasedfacialeX-pressionrecognitionandsynthesis[C】.Cambridge,UK:Procee-dingsofInternationalConf渊onPatternRecognition,2004:163-166.[4】LeeDD,SeungHS.Learningthepartsofobjectsbynon—negativematrixfactorization[J].Nature。1999,401:788-791.

【5】BuciuI,Pitas1.ApplicationofnonnegativeandMealnonnegativematrixfactorizationtofaeial

expressionrecognition[C].Cam-

bridge,UK:ProceedingsofInternationalConferenceonPatternRecognition,2004:288-291.

【6】ZhangDaoqiang,ChenSongcan,ZhouZhi—Hua.Two-dimen-sionalnon-negativematrixfactorizationforfacerepresentationandrecognition[C].Beijing,China:ProeeedingsoftheICCV'05WorkshoponAnalysisandModelingofFacesandGestures(AMFG。05)。2005:350-363.

【7】“SZ,XinWenHou,HongJiangZhang,eta1.Learningspatiallylocalized,parts-basedrepresentation[C].Hawaii:ComputerVi—sionandPatternRecognition,2001:207—212.

【8】WangYuan,JiaYtmde.Non-negativematrixfactorizationframe,-workforfacerecognition【J】.InternationalJournalofPatternRecognitionandArtificialIntelligence,2005,19(4):495-511.【9】ViolaP,JonesM.Robustrealtimeobjectdetection[C].Vancou-ver,Canada:8thIEEEInternationalConferenceonComputerVi-sion.200l:1-25.

【10】周建中,何良华.基于DwT.DCT-SⅥⅥ的人脸表情识别【J】.数据采集与处理,2006,21(1):64.68.

【11】TangJinshan,RyoheiNakatsu.Awavelettransformbasedaskeridentificationsystemforsmartmulti—pointteleconferences[C].Tokyo,Japan:Proceedingofthe28thSymposiumonVisualiza-tion,2000:17-19.

【12】LeeDD,SeungHS.Algorithmsfornon—negativematrixfactori-zation[J].AdvancesinNeuralInformationProcessingSystems,2000.13:556.562.

(上接第.4788页)

法,使算法不受神经元个数的限制,也可以进一步提高该算法

的在线识别速度。

参考文献:

【l】ZhaoWY,ChellappaR,RosenfeldA,eta1.Facerecognition:Alite-图8每个人在最大识别率时两种学习速率的

raturesurvey[R].UniversityofMaryland.2000.

在线识别情况比较

表1网络参数和最大识别率

学习速率声I选择参数nI警戒参数l最大在线识别率I每个数据的识别时问——j——上—生竺竺L-4』!墅竺_j——里纠1分6秒左右!:!I!:!!!!!l!:!竺!I!丝

4结束语

把ART神经网络应用于人脸识别,在识别准确率上比起以前的方法有所提高,但还是不够理想。进一步的研究包括,模仿生物神经元,为每个神经元或每组神经元采用不同和可变的警戒参数值,新识别的类不是增加神经元个数,也可能是减少神经元个数。采用除了Manhattan距离以外的方法来测量和比较特征的相似性,同时探索和设计新的人脸特征提取方法。同时,开发相应的硬件和软件支撑平台也是今后的研究方向,包括实现模糊ART的硬件,固化人脸特征提取的方

李武军,王崇骏,张炜,等.人脸识别研究综述【J】.模式识别与人工智能,2006,19(1):58-64.

KojiKotani,ChenQiu,TadahiroOhmi.FacerecognitionusingVe-etorquantizationhistogrammethod[C].IEEEICIP,2002:105—108.PatraPK,NayakM,NayakSl('eta1.Probabilisticneuralnetworkforpatternclassification[J].IEEE2002UCNN,2002:1200?1205.ChenLi—fen.AnewLDA-basedfacerecognitionsystemwhichcansolvethesmallsamplesizeproblem[J].PatternRecognition,2000,33(10):1713—1726.

AT&TLabaratoryCambridge.TheORLdatabaseoffaces[EB/oL】.http://www.uk.research.att.com/facedatabase.html.

FanJian,WuGeng-Feng.Foremost-policyreinforcementlearningbasedART2neuralnetwork[J].PatternRecognitionandArtifi—eialIntelligence,2006,19(3):428-432.

PhilPicton.Neuralnetworks[M].2ndEd.Hampshire:Palgrave,2000:115.137.

-—-4793-—-嘲

吲万方数据

人脸识别技术综述

人脸识别研究综述 摘要:论文首先介绍了人脸识别技术概念与发展历史,解释人脸识别技术的过程与优缺点;随后对近几年人脸识别技术的研究情况与一些经典的方法进行详细的阐述,最后提出人脸识别技术在生活中的应用与展望。 关键词:人脸识别研究现状应用与展望 一、概念 人脸识别技术是基于人的脸部特征,对输入的人脸图像或者视频流。首先判断其是否存在人脸,如果存在人脸,则进一步的给出每个脸的位置、大小和各个主要面部器官的位置信息。并依据这些信息,进一步提取每个人脸中所蕴涵的身份特征,并将其与已知的人脸进行对比,从而识别每个人脸的身份。 广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 二、发展历史 人脸识别的研究历史比较悠久。高尔顿(Galton)早在1888 年和1910 年就分别在《Nature》杂志发表了两篇关于利用人脸进行身份识别的文章,对人类自身的人脸识别能力进行了分析。但当时还不可能涉及到人脸的自动识别问题。最早的AFR1的研究论文见于1965 年陈(Chan)和布莱索(Bledsoe)在Panoramic Research Inc.发表的技术报告,至今已有四十年的历史。近年来,人脸识别研究得到了诸多研究人员的青睐,涌现出了诸多技术方法。 三、过程与优缺点 人脸的识别过程: (1)首先建立人脸的面像档案。即用摄像机采集单位人员的人脸的面像文件或取他们的照片形成面像文件,并将这些面像文件生成面纹(Faceprint)编码贮存起来。 (2)获取当前的人体面像。即用摄像机捕捉的当前出入人员的面像,或取照片输入,并将当前的面像文件生成面纹编码。 (3)用当前的面纹编码与档案库存的比对。即将当前的面像的面纹编码与档案库

人脸表情识别

图像处理与模式识别 ------人脸表情识别介绍摘要:人脸表情是我们进行交往和表达情绪的一种重要手段,不经过特殊训练,人类对其面部表情往往很难掩饰,所以,通过对人脸表情进行分析,可以获得重要的信息。人脸表情识别是人机交互的智能化实现的一个重要组成部分,也是模式识别、图像处理领域的一个重要研究课题,近几年来,受到了越来越多的科研人员的关注。 本文综述了国内外近年来人脸表情识别技术的最新发展状况,对人脸表情识别系统所涉及到的关键技术: 人脸表情特征提取,做了详细分析和归纳。 关键词:人脸定位;积分投影;人脸表情识别;流形学习;局部切空间排列Abstract:Facial expression is a kind of important means that we communicate and express the special training, People often difficult to conceal their facial , by the analyzing facial expression, we can obtain important information. Facial expression recognition is an important component that the implementation of human-computer interaction, and an important research topic in the field of pattern recognition, image processing, in recent years, more and more researchers focus on this topic. In this paper,we present the latest development of this area,and give a detailed analysisand summary for facial

人脸识别流程

概述 本项目的主要目的是身份证照片与摄像头获取的人脸照片进行比对,确定身份证和目标对象是不是同一个人。 本文项目主要分三个方面,首先是人脸的检测定位;其次是对照片中定位好的人脸进行预处理,处理到适合提取特征值的水平;最后提取特征值比对识别是不是同一个人。系统的大框架如下: 第一步人脸检测定位 确定是否包含人脸,如果包含人脸,则需要确定脸部所在的位置和尺寸。因为获取的都是彩色图像,首先可以进行肤色检测。在检测出肤色像素后,需要根据它们在色度上的相似性和空间上的相关性分割出可能的人脸区域,同时利用区域的几何特征或灰度特征进行是否是人脸的验证,以排除其它色彩类似肤色的物体。这一步流程图如下:

页脚内容 第二步人脸图像预处理 图像处理的目的是为了方便提取人脸的特征值,进而才能比对识别,所以这一步也至关 重要。第一,对于分割出的人脸,由于噪声带来失真和降质,在特征提取之前采用滤波的方式来去除噪声是必须的步骤。第二尺度归一化,其思想是将尺寸各不相同的人脸图像变换为统一的标准尺寸图像以便于人脸特征的提取。第三灰度归一化,人脸识别的研究一般以灰度图像为研究对象,对于彩色的脸像,可对其首先进行灰度化处理。第四灰度均衡化,由于在图像采集中光照的改变容易导致图像呈现不同的明暗程度,因此需要对人脸图像进行灰度均衡化处理。灰度均衡化,其作用是增强人脸图像的整体对比度,并使灰度分布均匀,以消除光照变化的影响。流程图如下: 第三步特征提取对比识别 人脸特征提取与识别是人脸识别研究中最为关键的两个问题。人脸特征提取又称人脸描 述,是在基于人脸检测定位、归一化等图像预处理的基础上进行的人脸各特征提取的过程,为人脸识别分类打下基础。

人脸识别实验报告

人脸识别——特征脸方法 贾东亚12346046 一、实验目的 1、学会使用PCA主成分分析法。 2、初步了解人脸识别的特征法。 3、更熟练地掌握matlab的使用。 二、原理介绍 1、PCA(主成分分析法介绍) 引用一个网上的例子。假设有一份对遥控直升机操作员的调查,用x1(i)表示飞行员i的 飞行技能,x2(i)表示飞行员i喜欢飞行的程度。通常遥控直升飞机是很难操作的,只有那些 非常坚持而且真正喜欢驾驶的人才能熟练操作。所以这两个属性x1(i)和x2(i)相关性是非常强的。我们可以假设两者的关系是按正比关系变化的。如下图里的任意找的向量u1所示,数据散布在u1两侧,有少许噪声。 现在我们有两项数据,是二维的。那么如何将这两项变量转变为一个来描述飞行员呢?由图中的点的分布可知,如果我们找到一个方向的U,所有的数据点在U的方向上的投影之 和最大,那么该U就能表示数据的大致走向。而在垂直于U的方向,各个数据点在该方向的投影相对于在U上的投影如果足够小,那么我们可以忽略掉各数据在该方向的投影,这样我们就把二维的数据转化成了在U方向上的一维数据。 为了将u选出来,我们先对数据进行预处理。先求出所有数据的平均值,然后用数据与平均值的偏差代替数据本身。然后对数据归一化以后,再代替数据本身。 而我们求最大的投影和,其实就是求各个数据点在U上的投影距离的方差最大。而XT u 就是投影的距离。故我们要求下式的最大值: 1 m ∑(x(i)T u)2=u T( 1 m ∑x(i)x(i)T m i=1 ) m i=1 u 按照u是单位向量来最大化上式,就是求1 m ∑x(i)x(i)T m i=1的特征向量。而此式是数据集的 协方差矩阵。

单样本人脸识别综述

单样本人脸识别综述 南京杭空航天大学 ELSEVIER 摘要 当前人脸识别技术主要挑战之一在于样本收集的困难性。很少的样本意味着在收集样本时付出更少的劳动,在存储和处理它们是付出更少的代价。不幸的是,许多现有的人脸识别技术很大程度上依赖于训练样本集的规模和代表性,如果系统中仅有一个训练样本,则将会导致严重的性能下降甚至无法工作。这种情况称之为“单样本”问题,即给出每人一幅人脸的存储数据库,目标是仅根据单幅人脸图像在不同的姿态、光照等条件下从数据库中识别人脸图像的身份。由于训练集非常有限,这样的任务队当前大多数算法而言都是非常具有挑战性的。现有许多技术正试图解决该问题,本文的目的是对这些算法进行分类和评估,对较为突出的算法进行了描述和批判的分析。并讨论了诸如数据采集、小样本规模的影响、系统评估等一些相关问题,同时提出了一些未来研究中具有前景的方向。 关键词:人脸识别;单训练样本 1 引言 作为少数几个同时具有高精度和低干涉的生物特征方法,人脸识别技术在信息安全、法律事实和监控、智能车、访问控制等方面具有大量的潜在应用。因此,在过去20年中人脸识别技术已经受到了来自学术和工业方面的极大关注。近来,一些作者已经从不同方面调查和评估了现有的人脸识别技术。例如,Samal et al. [4] and Valentin et al. [5]分别对基于特征和基于神经网络的技术进行了调研。Yang等[6]评述了人脸识别技术,Pantic and Rothkrantz[7]对自动面部表达分析进行了调研,Daugman [3]指出了涉及人脸识别系统有效性的几个关键问题,而最近的综述应该是Zhao et al. [1],他对许多最新的技术进行了评论。 人脸识别的目的是从人脸图像的数据库中的静态图像或视频图像中识别或验证一个或多个人。许多研究工作集中在怎样提高识别系统的精度,然而,大部分研究工作似乎忽视了一个可能来源于人脸数据库的潜在问题,即可能由于样本采集的困难或由于系统存储空间的限制,数据库中可能对每一个人只存储了一副样本图像。在这种条件下,诸如特征脸(Eigenface)和Fisher人脸识别技术等传统方法将导致严重的性能下降甚至无法工作(详见第2节)。这个问题称之为单样本问题,即即给出每人一幅人脸的存储数据库,目标是仅根据单幅人脸图像在不同的姿态、光照等条件下从数据库中识别人脸图像的身份。由于其挑战性和现实应用的重要性,这个问题很快成为了人脸识别技术近年来的一个研究热点,许多专用技术被开发来解决该问题,例如合成虚拟样本,局部化单一训练图像,概率匹配和神经网络方法。 本文最主要的贡献是给出这些从单一人脸图像进行人脸识别的特定方法一个综合的、评论性的综述。我们相信这些工作是对参考文献[1–7]的一个有用的补充,这些文献中所考察的大多数技术没有考虑单样本问题。实际上,通过对这个问题更多的关注和技术的详细研究,我们希望这篇综述能够对这些技术的基本原则、相互联系、优缺点以及设计优化提供更多深刻的理解。对一些相关问题,如数据收集、小样本空间的影响以及系统评估等也进行了讨论。 接下来我们首先试图建立有关什么是单样本问题以及为什么、何时应道考虑这个问题的一个公共背景。特别的,我们也讨论了该问题所不需要考虑的方面。在第三节我们继续回顾有关该问题的前沿技术。借此,我们希望能够借鉴一些有用的经验来帮助我们更有效地解决这个问题。在第四节中,我们讨论了有关性能评估的几个问题。最后,在第五节中我们通过讨论几个具有前景的研究方向对单样本问题进行了总结。

表情识别技术综述

表情识别技术综述 摘要:表情识别作为一种人机交互的方式,成为研究的热点。基于对表情识别的基本分析,文章重点介绍了面部表情识别的国内外研究情况和面部表情特征的提取方法。 关键词:表情识别;特征提取;表情分类。 前言:进入21世纪,随着计算机技术和人工智能技术及其相关学科的迅猛发展,整个社会的自动化程度不断提高,人们对类似于人和人交流方式的人机交互的需求日益强烈。计算机和机器人如果能够像人类那样具有理解和表达情感的能力,将从根本上改变人与计算机之间的关系,使计算机能够更好地为人类服务。表情识别是情感理解的基础,是计算机理解人们情感的前提,也是人们探索和理解智能的有效途径。如果实现计算机对人脸表情的理解与识别将从根本上改变人与计算机的关系,这将对未来人机交互领域产生重大的意义。 正文:一、面部表情识别的国内外研究情况 面部表情识别技术是近几十年来才逐渐发展起来的,由于面部表情的多样性和复杂性,并且涉及生理学及心理学,表情识别具有较大的难度,因此,与其它生物识别技术如指纹识别、虹膜识别、人脸识别等相比,发展相对较慢,应用还不广泛。但是表情识别对于人机交互却有重要的价值,因此国内外很多研究机构及学者致力于这方面的研究,并己经取得了一定的成果。 进入90年代,对面部表情识别的研究变得非常活跃,吸引了大量的研究人员和基金支持。美国、日本、英国、德国、荷兰、法国等经济发达国家和印度、新加坡都有专门的研究组进行这方面的研究。其中MIT的多媒体实验室的感知计算组、CMu、Ma州大学的计算机视觉实验室、Standford大学、日本城蹊大学、大阪大学、ArR研究所的贡献尤为突出。 国内的清华大学、哈尔滨工业大学、中科院、中国科技大学、南京理工大学、北方交通大学等都有专业人员从事人脸表情识别的研究,并取得了一定的成绩。在1999年的国家自然科学基金中的“和谐人机环境中情感计算理论研究”被列为了重点项目。同时中国科学院自动化所、心理所以及国内众多高校也在这方面取得了一定的进展。2003年,在北京举行了第一届中国情感计算与智能交互学术会议,会议期间集中展示了国内各研究机构近几年来从认知、心理、模式识别、系统集成等多种角度在情感计算领域取得的研究成果,一定程度上弥补了我国这方面的空白。国家“863”计划、“973”项目、国家自然科学基金等也都对人脸表情识别技术的研究提供了项目资助。 二、面部表情特征的提取方法 表情特征提取是表情识别系统中最重要的部分,有效的表情特征提取工作将使识别的性能大大提高,当前的研究工作也大部分是针对表情特征的提取。 目前为止的人脸面部表情特征提取方法大都是从人脸识别的特征提取方法别演变而来,所用到的识别特征主要有:灰度特征、运动特征和频率特征三种阎。灰度特征是从表情图像的灰度值上来处理,利用不同表情有不同灰度值来得到识别的依据。运动特征利用了不同表情情况下人脸的主要表情点的运动信息来进行识别。频域特征主要是利用了表情图像在不同的频率分解下的差别,速度快是其显著特点。在具体的表情识别方法上,分类方向主要有三个:整体识别法和局部识别法、形变提取法和运动提取法、几何特征法和容貌特征法。 整体识别法中,无论是从脸部的变形出发还是从脸部的运动出发,都是将表情人脸作为一个整体来分析,找出各种表情下的图像差别。其中典型的方法有:基于特征脸的主成分分析(prineipalComponentAnalysis,pCA)法、独立分量分析法(Indendent ComPonent Analysis,ICA)、Fisher线性判别法(Fisher’s Linear Discriminants,FLD)、局部特征分析(LoealFeatureAnalysis,LFA)、Fishe诞动法(Fisher^ctions)、隐马尔科夫模型法(HideMarkovModel,HMM)和聚类分析法。

人脸识别发展历史介绍

人脸识别发展历史介绍 1 引言 在我们生存的这个地球上,居住着近65亿人。每个人的面孔都由额头、眉毛、眼睛、鼻子、嘴巴、双颊等少数几个区域组合而成,它们之间的大体位置关系也是固定的,并且每张脸的大小不过七八寸见方。然而,它们居然就形成了那么复杂的模式,即使是面容极其相似的双胞胎,其家人通常也能够非常容易地根据他们面孔上的细微差异将他们区分开来。这使得我们不得不承认这个世界上找不出两张完全相同的人脸!那么,区分如此众多的不同人脸的“特征”到底是什么?能否设计出具有与人类一样的人脸识别能力的自动机器?这种自动机器的人脸识别能力是否能够超越人类自身?对这些问题的分析和解答无疑具有重要的理论和应用价值,这正是众多从事自动人脸识别研究的研究人员所面临的挑战。 然而,对这些问题的回答并不像看起来那么容易。即使在大量来自模式识别、计算机视觉、神经计算、生理学等领域的研究人员对自动人脸识别艰苦工作40余年之后,这些最基本的科学问题仍然困惑着研究人员。而退一步讲,即使对我们自己,尽管我们每天都在根据面孔区分着亲人、同学、朋友、同事等,大多数人却很难准确地描述出自己到底是如何区分他们的,甚至描述不出自己熟悉的人有什么具体的特征。即使专门从事相关的生理学、心理学、神经科学研究的一些专家,也很难描述清楚人类人脸识别的生理学过程。这意味着基于仿生学的人脸识别研究路线在实践上是难以操作的。当然,飞机的翅膀并不需要像鸟儿的翅膀一样煽动,自动人脸识别的计算模型也未必需要模拟“人脑”。我们也许可以通过另外的途径,例如建立人脸识别的计算模型,这种计算模型可能是基于仿生神经网络的,也可能是纯粹基于统计的,或者是这二者之外的第三只眼睛,并通过构建实用的自动人脸识别系统来验证这些计算模型,从而找出对上述基本科学问题的解答。 本文首先给出了人脸识别的一个一般计算模型,然后简单回顾自动人脸识别的研究历史,接下来阐述人脸识别的研究现状并介绍几种主流的技术方法,简单介绍计算所人脸识别研究组的研究进展,最后对上述哲学层面的问题作了一些简单的探讨。

人脸识别技术综述解读

人脸识别研究 代上 (河南大学环境与规划学院河南开封 475004) 摘要:现今世界经济发展迅速,而面对繁杂的社会安全问题却显得有些捉襟见肘,人脸识别技术能够因通过面部特征信息识别身份而受到广泛关注。人脸识别通常使用采集含有人脸图像或视频流的设备,将收集到的人脸信息进行脸部检测,进而与数据库中已有信息进行对比确定被识别对象的身份,已经广泛的应用于公共安全、教育等多个方面,且在以后的社会发展中具有很大的应用前景。本文主要对人脸识别的发展历程、主要识别方法予以总结概括,并对其应用范围与发展趋势进行分析。 关键词:人脸识别;方法;应用;发展 1引言 人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。该项技术目前应用到社会的各个领域,例如个人家庭自动门的安全系统、犯罪人的身份识别系统、银行自动取款的服务系统等。 人脸识别系统给人带了很多方便,应用能力很强,但是人脸识别仍然有很多阻碍其发展的困难之处。主要表现在:在收集图像中目标自身的影响;在系统收集图像的过程中容易受到各种外界因素以及系统收集图像之后由于其它因素造成的面部损伤所带来的影响;随着时间的变迁,人的面部逐步发生变化的影响。这些都对人脸识别技术的发展造成了一定的困难,也使得该项技术面临着多种挑战性。 2 人脸识别研究的发展历史与研究现状 2.1发展历史 很早在19世纪80年代就有关于通过人脸对人类的身份进行辨别的论文发表,但是由于技术水平与设备的限制,人脸识别技术并没有受到重视。直到20世纪60年代末,Blcdsoc[1]提出了人脸识别研究的雏形,人脸识别技术才被人们接受。 在人脸识别研究的早期阶段,人们主要研究的是人脸识别的各种方法,但是在实际应用方面却没有得到实质性的进展。 进入20世纪90年代末的时候,人脸识别技术进入了一个快速发展阶段,在这个时期各种新的人脸识别方法相继出现,并创建了人脸图像数据库,对人脸识别的发展起到了巨大的促进作用。在实际应用方面也取得了很大的进展,运用人脸识别技术的产品逐渐进入了社会市场。 进入21世纪以后,人脸识别技术已经逐步发展成熟,但是由于非理想条件如(光照、天气、姿态)的影响,对人脸识别技术的要求也更高。为了解决这些不利因素所造成的影响,研究者们一直努力寻找更加趋于完美的方法,从而减少这些因素所带来的不利影响。 2.2研究现状 近几年来,人脸识别技术已经从以前的认知阶段发展到了实际应用阶段。但是由于每个人的面部都会因为各种不同的原因发生改变,这给人脸识别带来了不小的影响。如光照不同

人脸检测综述_孙宁

2006 年 12 月JOURNAL OF CIRCUITS AND SYSTEMS December, 2006 文章编号:1007-0249 (2006) 06-0101-08 人脸检测综述* 孙宁1,2,邹采荣2,赵力1,2 (1. 东南大学学习科学研究中心,江苏南京 210096;2. 东南大学无线电工程系,江苏南京 210096) 摘要:人脸检测研究在近二十年的时间内取得了长足的进步,并且作为安控、人机界面、人类情感研究系统的重要组成部分得到了广泛的应用。该文首先对人脸检测所面临的问题进行了探讨,并将人脸检测方法分为:基于几何特征的方法、基于肤色模型的方法、基于统计理论的方法三个方面进行了阐述。分析了相关的理论及算法,对各个方法的优缺点进行了比较。最后,对人脸检测今后的研究方向进行了讨论。 关键词:人脸检测;人脸识别;机器学习;模式识别; 中图分类号:TP391 文献标识码:A 1 引言 观察一个人的面部可以自然的,无侵犯性的了解到一个人的很多信息,比如:身份,性别,年龄,情感等等。因此,在过去三十多年[1]的时间里人们对人脸检测和人脸识别始终保持着浓厚的研究兴趣。随着近些年来国际形势的变化,特别是9.11事件之后,各国对自身重要设施的安保性能越发重视,也积极研发了一些自动人脸识别系统并投入实用。比如,美国Identix公司的FaceIt[2]系统,该系统基于局部特征分析(LFA),能在不同的光照,肤色,姿态,表情情况下得到良好的检测性能。我国的生物特征认证与安全技术研究中心(CBSR)则在2004年成功研制出了基于人脸、指纹、虹膜三种识别方法的快速通关系统(MRTD)[3],取得了国际先进的整体性能。 任何人脸识别系统首先都需要从输入信息中获取人脸的位置、大小。因此,人脸检测是人脸识别系统的第一个步骤,这一步骤的所获得的精度与速度直接影响整个系统的性能。此外,人脸检测的应用也大大超越了人脸识别系统的范畴,在人脸表情识别系统,基于内容的检索,视频会议,三维人脸模型等方面也有重要的应用价值。 人脸的自动检测是一类具有很大挑战性的问题,其主要难点在于:(1)人脸是一类高度非刚性的目标,存在相貌,表情,肤色等差异,(2)人脸上可能会存在一些附属物,诸如,眼镜,胡须等。(3)人脸的姿态变化万千,并且可能存在遮挡物。(4)待检测图像性质的差异。比如:待检图像的分辨率;摄录器材的质量等;(5)光源的种类和角度。不同种类和角度的光源会对待检测的人脸产生不同性质的反射和不同区域的阴影。 针对以上问题,各国的科研人员作了很多的研究,国外比较著名的有CMU,MIT,UIUC等,国内的有微软亚洲研究院、中科院自动化研究所、清华大学等。此外,每年在国际国内的相关期刊和会议上都有大量的关于人脸检测的论文,其中综述性质的文章对近期人脸检测的研究进展进行总结,对人脸检测的研究方向进行展望。Chellappa、Zhao等人分别于1995和2003年发表的两篇人脸识别的综述论文[4,5],其中列出专门章节将人脸检测作为人脸识别系统的一部分进行了综述。前者总结了上世纪九十年代中期之前人脸检测技术的状况和发展,后者则着重介绍了最新的人脸检测技术的发展情况。2001年,E. Hjelmas等人发表的文章[6]将人脸检测技术分为基于图像的方法和基于特征的方法这两类进行了综述。2002年,M .H. Yang等在IEEE Trans. PAMI上发表了名为:Detecting Faces in Images: A Survey[7]的人脸检测技术综述文章,该文将人脸检测技术分为四类进行了详细介绍,并且针对以往关于人脸检测论文中检测性能估计方面的混乱情况,提出了较明确的估计准则。此外,还给出了许多用于人脸检 * 收稿日期:2005-04-11 修订日期:2005-08-17

人脸识别介绍

人脸识别技术是生物识别技术的一种,它结合了图像处理、计算机图形学、模式识别、可视化技术、人体生理学、认知科学和心理学等多个研究领域。从二十世纪六十年代末至今,人脸识别算法技术的发展共经历了如下四个阶段: 1. 基于简单背景的人脸识别 这是人脸识别研究的初级阶段。通常利用人脸器官的局部特征来描述人脸。但由于人脸器官没有显著的边缘且易受到表情的影响,因此它仅限于正面人脸(变形较小)的识别。 2. 基于多姿态/表情的人脸识别 这是人脸识别研究的发展阶段。探索能够在一定程度上适应人脸的姿态和表情变化的识别方法,以满足人脸识别技术在实际应用中的客观需求。 3. 动态跟踪人脸识别 这是人脸识别研究的实用化阶段。通过采集视频序列来获得比静态图像更丰富的信息,达到较好的识别效果,同时适应更广阔的应用需求。 4. 三维人脸识别 为了获得更多的特征信息,直接利用二维人脸图像合成三维人脸模型进行识别,即将成为该领域的一个主要研究方向。 人脸识别技术的研究范围主要包括以下几个方面: 1. 人脸检测:在输入的图像中寻找人脸区域。 2. 人脸的规范化:校正人脸在尺度、光照和旋转等方面的变化。 3. 特征提取:从人脸图像中映射提取一组能反映人脸特征的数值表示样本。 4. 特征匹配:将待识别人脸与数据库中的已知人脸比较,得出相关信息。 人脸识别流程 1图像预处理 1.1 图像去噪 一般来说,自然界中的噪声可以看成是一种随机信号。根据图像获取的途径人脸图像获取 人脸检测 定位人脸区域 预处理 特征抽取 人脸特征 对比识别 结果 人脸特征库

不同,噪声的融入也有多种方式: 1. 图像是直接以数字形式获取的,那么图像数据的获取机制会不可避免地 引入噪声信号; 2. 在图像采集过程中,物体和采集装置的相对运动。或采集装置的抖动, 也会引入噪声,使图像变的模糊不清; 3. 在图像数据的电子传输过程中,也不同程度的引入噪声信号。 这些噪声信号的存在,严重的情况会直接导致整幅图像的不清晰,图象中的景物和背景的混乱。对于用于人脸识别的图像。由于噪声的引入,将不可避免地造成识别率的下降。对图像噪声的消除可以通过两个途径:空间域滤波或频率域滤波。消除噪声的方法很多,对于不同的噪声应该采用不同的除噪方法。主要的方法是:线性滤波、中值滤波、维纳滤波以及小波去噪等。 1.2 增强对比度 为了使人脸在图像中更为突出以便于下一步的特征提取,增强图像对比度是很有必要的。增强对比度有很多种方法,常见的有直方图均衡化和“S ”形变换等方法。 “S ”形变换方法将灰度值处于某一范围(人脸特征范围)内的像素灰度分布差距拉开,从而保证了对比度的提高,但此方法降低了其他灰度值的对比度。而直方图均衡化则是将像素的灰度分布尽量展开在所有可能的灰度取值上,这样的方法同样能使得图像的对比度提高。 将彩色图像转化成灰度图像是人脸识别方法中常见的处理过程,虽然转化过程丢失了一部分色彩信息,但是灰度图像拥有更小的存储空间和更快的计算速度。文献[1]给出了一种能够将RGB 色彩转换成灰度级且适于突出人脸区域对比度的转换模型:()5.0144.0587.0299.0,+?+?+?=b g r y x f ;其中f 代表灰度值,r ,g ,b 分别表示Red,Green,Blue 分量的值。 文献[2]通过将人脸彩色图像从RGB 色彩空间转换到RIQ 色彩空间,得到了更适于频谱分析的特征分量。

模式识别特征选择与提取

模式识别特征选择与提取 中国矿业大学计算机科学与技术学院电子信息科学系 班级:信科11-1班,学号:08113545,姓名:褚钰博 联系方法(QQ或手机):390345438,e-mail:390345438@https://www.360docs.net/doc/8d15642687.html, 日期:2014 年06月10日 摘要 实际问题中常常需要维数约简,如人脸识别、图像检索等。而特征选择和特征提取是两种最常用的维数约简方法。特征选择是从某些事物中提取出本质性的功能、应用、优势等,而特征提取是对特征空间进行变换,将原始特征空间映射到低维空间中。 本文是对主成分分析和线性判别分析。 关键词:特征选择,特征提取,主成分分析,线性判别分析 1.引言 模式识别的主要任务是利用从样本中提取的特征,并将样本划分为相应的模式类别,获得好的分类性能。而分类方法与分类器设计,都是在d(变量统一用斜体)维特征空间已经确定的前提下进行的。因此讨论的分类器设计问题是一个选择什么准则、使用什么方法,将已确定的d维特征空间划分成决策域的问题。对分类器设计方法的研究固然重要,但如何确定合适的特征空间是设计模式识别系统另一个十分重要,甚至更为关键的问题。如果所选用的特征空间能使同类物体分布具有紧致性,即各类样本能分布在该特征空间中彼此分割开的区域内,这就为分类器设计成功提供良好的基础。反之,如果不同类别的样本在该特征空间中混杂在一起,再好的设计方法也无法提高分类器的准确性。本文要讨论的问题就是特征空间如何设计的问题。 基于主成分分析的特征选择算法的思想是建立在这样的基础上的:主成分分析方法将原始特征通过线性变换映射到新的低维空间时,获得的主成分是去了新的物理意义,难以理解,并且主成分是所有原始特征的线性组合。所以将主成分分析与特征选择相结合,设计多种相似性度量准则,通过找到与主成分相关的关键特征或者删除冗余、不相关以及没有意义的特征,将主成分又重新映射到原始空间,来理解成主成分的实际意义。 基于线性判别分析的高维特征选择将单个特征的Fisher准则与其他特征选择算法相结合,分层消除不相关特征与冗余特征。不相关特征滤波器按照每个特征的Fisher评价值进行特征排序,来去除噪音和不相关特征。通过对高维数据特征关联性的分析,冗余特征滤波器选用冗余度量方法和基于相关性的快速过滤器算法。分别在不同情境下进行数据分类实验,验证其性能。

基于K-L变换的人脸识别

基于K-L变换的人脸识别 一、实验原理及基本要求 特征脸方法是基于K-L变换的人脸识别方法,K-L变换是图像压缩的一种最优正交变换。高维的图像空间经过K-L变换后得到一组新的正交基,保留其中重要的正交基,由这些基可以张成低维线性空间。如果假设人脸在这些低维线性空间的投影具有可分性,就可以将这些投影用作识别的特征矢量,这就是特征脸方法用于人脸识别的基本思想。在人脸识别中,可以用离散K-L变换对人脸图像的原始空间进行转换,即构造人脸图像数据集的协方差矩阵,对之进行正交变换,求出协方差矩阵的特征向量,再依据特征值的大小对这些特征向量进行排序,每一个向量表示人脸图像中一个不同数量的变量,这些特征向量表示特征的一个集合,它们共同表示一个人脸图像。在人脸识别领域,人们常称这些特征向量为特征脸。每一个体人脸图像都可以确切地表示为一组特征脸的线性组合。这样我们首先通过有指导的训练(给定训练样本集已知分类)得到样本集在特征脸空间中的坐标。训练完成后,输入待辨识图像,求得在特征脸空间的坐标,采用欧式距离法,就可以实现人脸识别。 我们从网上下载人脸图像,构建人脸训练数据库和测试数据库,采用K-L变换进行特征脸提取,并实现人脸识别。通过K-L变换在人脸识别中的应用,加深对所学内容的理解和感性认识。 二、具体做法及流程图 ORL人脸库是由英国剑桥Olivetti实验室从1992年4月到1994年4月期间拍摄的一系列人脸图像组成,共有40个不同年龄、不同性别和不同种族的对象。每个对象10幅图像共计400幅灰度图像组成,图像尺寸是92×112,图像背景为黑色。其中人脸部分表情和细节均有变化,例如笑与不笑、眼睛睁着或闭着,戴或不戴眼镜等,人脸姿态也有变化,其深度旋转和平面旋转可达20度,人脸尺寸也有最多10%的变化。该库是目前使用最广泛的标准数据库,它含有大量的比较结果。 本次试验我们用的是ORL人脸库中的人脸样本集,每个人的人脸样本集中含有十个人脸样本。我们从其中挑出训练样本和测试样本。对训练样本集采用K-L变换进行特征脸提取,并对测试样本集进行人脸识别。 步骤:

人脸识别技术综述 论文

本科生毕业论文(设计) 题目人脸识别技术综述 学院计算机学院 专业计算机科学与技术 学生姓名陶健 学号 0643041077 年级 2006 指导教师周欣 教务处制表 二Ο年月日

人脸识别技术综述 计算机科学与技术 学生陶健老师周欣 [摘要]随着社会信息化,网络化得不断发展,个人身份趋于数字化,隐性化,如何准确的鉴定,确保信息安全得到越来越多的重视。人脸识别,一种应用比较广泛的生物识别方法,在基于人脸固有的生物特征信息,利用模式识别和图行图像处理技术来对个人身份进行鉴定,在国家安全,计算机交互,家庭娱乐等其他很多领域发挥着举足轻重的作用,能提高办事效率,防止社会犯罪等,有着重大的经济和社会意义。 本文主要研究了人脸识别在图像检测识别方面的一些常用的方法。由于图像处理的好坏直接影响着定位和识别的准确率,因此本文对图像的一些识别算法做了着重的介绍,例如基于二维Gabor小波矩阵表征人脸的识别算法,基于模型匹配人脸识别算法等。此外,本文还提及了一般人脸识别系统的设计,并着重介绍了图像预处理环节的光线补偿,图像灰度化等技术,使图像预处理模块在图像处理过程中能取到良好的作用,提高图像识别和定位的准确率。 [主题词]:人脸识别;特征提取;图像预处理;光线补偿

Face Recognition Overview Computer Science Student:TAO Jian Adviser: ZHOU Xin [Abstract] With the information society, network was growing, personal identity tends to digital, hidden, how to accurately identify, to ensure that information security is more and more attention. Face recognition, an application of biometric identification methods more widely, based on biometric facial information inherent in the use of pattern recognition and image processing techniques to map line of personal identity ,play a great role in the national security, computer interaction, family entertainment and many other areas. Face recognition can improve efficiency, prevent social crime, of course it has significant economic and social significance. This paper studies aspects of face recognition in image detection and some common methods of identification. As the image processing directly impact on the accuracy of location and identification, so some of image recognition algorithm will be focused presentation, such as Gabor wavelet-based two-dimensional matrix representation of face recognition algorithms, model-based matching face recognition algorithm. In addition, the article also mentioned a general recognition system design, and highlights the image preprocessing part of the light compensation, gray image techniques, the image preprocessing module in the image processing to get to the good , and improve image recognition and positioning accuracy. [Key Words] Face recognition; feature extraction; image preprocessing; light compensation

人脸表情识别综述

人脸表情识别综述 一、人脸表情识别技术目前主要的应用领域包括人机交互、安全、机器人制造、医疗、通信和汽车领域等 二、1971年,心理学家Ekman与Friesen的研究最早提出人类有六种主要情感,每种情感以唯一的表情来反映人的一种独特的心理活动。这六种情感被称为基本情感,由愤怒(anger)、高兴(happiness)、悲伤(sadness)、惊讶(surprise)、厌恶(disgust)和恐惧(fear)组成 人脸面部表情运动的描述方法---人脸运动编码系统FACS (Facial Action Coding System),根据面部肌肉的类型和运动特征定义了基本形变单元AU(Action Unit),人脸面部的各种表情最终能分解对应到各个AU上来,分析表情特征信息,就是分析面部AU的变化情况 FACS有两个主要弱点:1.运动单元是纯粹的局部化的空间模板;2.没有时间描述信息,只是一个启发式信息 三、人脸表情识别的过程和方法 1、表情库的建立:目前,研究中比较常用的表情库主要有:美国CMU机器人研究所和心理学系共同建立的 Cohn-Kanade AU-Coded Facial Expression Image Database(简称CKACFEID)人脸表情数据库;日本ATR 建立的日本女性表情数据库(JAFFE),它是研究亚洲人表情的重要测试库 2、表情识别: (1)图像获取:通过摄像头等图像捕捉工具获取静态图像或动态图像序列。 (2)图像预处理:图像的大小和灰度的归一化,头部姿态的矫正,图像分割等。 →目的:改善图像质量,消除噪声,统一图像灰度值及尺寸,为后序特征提取和分类识别打好基础 主要工作→人脸表情识别子区域的分割以及表情图像的归一化处理(尺度归一和灰度归一) (3)特征提取:将点阵转化成更高级别图像表述—如形状、运动、颜色、纹理、空间结构等,在尽可能保证稳定性和识别率的前提下,对庞大的图像数据进行降维处理。 →特征提取的主要方法有:提取几何特征、统计特征、频率域特征和运动特征等 1)采用几何特征进行特征提取主要是对人脸表情的显著特征,如眼睛、眉毛、嘴巴等的位置变化进行定位、测量,确定其大小、距离、形状及相互比例等特征,进行表情识别 优点:减少了输入数据量 缺点:丢失了一些重要的识别和分类信息,结果的精确性不高

人脸识别实验报告

人脸识别——特征脸方法 贾东亚 一、 实验目的 1、学会使用PCA 主成分分析法。 2、初步了解人脸识别的特征法。 3、更熟练地掌握matlab 的使用。 二、 原理介绍 1、 PCA (主成分分析法介绍) 引用一个网上的例子。假设有一份对遥控直升机操作员的调查,用x 1(i ) 表示飞行员i 的 飞行技能,x 2(i )表示飞行员i 喜欢飞行的程度。通常遥控直升飞机是很难操作的,只有那些非常坚持而且真正喜欢驾驶的人才能熟练操作。所以这两个属性x 1(i )和x 2(i )相关性是非常强的。我们可以假设两者的关系是按正比关系变化的。如下图里的任意找的向量u1所示,数据散布在u1两侧,有少许噪声。 现在我们有两项数据,是二维的。那么如何将这两项变量转变为一个来描述飞行员呢由图中的点的分布可知,如果我们找到一个方向的U ,所有的数据点在U 的方向上的投影之和最大,那么该U 就能表示数据的大致走向。而在垂直于U 的方向,各个数据点在该方向的投影相对于在U 上的投影如果足够小,那么我们可以忽略掉各数据在该方向的投影,这样我们就把二维的数据转化成了在U 方向上的一维数据。

为了将u选出来,我们先对数据进行预处理。先求出所有数据的平均值,然后用数据与平均值的偏差代替数据本身。然后对数据归一化以后,再代替数据本身。 而我们求最大的投影和,其实就是求各个数据点在U上的投影距离的方差最大。而X T u 就是投影的距离。故我们要求下式的最大值: 1 m ∑(x(i)T u)2=u T( 1 m ∑x(i)x(i)T m i=1 ) m i=1 u 按照u是单位向量来最大化上式,就是求1 m ∑x(i)x(i)T m i=1 的特征向量。而此式是数据集 的协方差矩阵。 在实际应用中,我们不止面临二维的数据。因此不能使用几何的形式呈现,但原理也是一样。就是找到一组相互正交的单位向量u k,然后根据贡献率考虑选择其中的部分作为考量的维数,这也就实现了数据的降维。 三、实验步骤 1、将库里的400张照片分成两组。一组作为训练,一组作为库。每个人的前五张照片作为 训练,后五张作为库。训练的照片按照顺序的数字重命名。库的照片名字不变。 2、库照片处理。 ①将每一张库的照片转化成N维的向量。(库里的照片是112*92,故将转化成的矩阵按列或行展开,就是个10304维的向量)我们稍后要对如此多维的向量用PCA进行降维。然后把这些向量存入一个矩阵里。而我是将这200个向量以列的形式存在了矩阵里。 即 Z={Γ1,Γ2,Γ3,Γ4 (200)

特征提取在人脸识别中的应用.pdf

特征提取在人脸识别中的应用 刘磊,2014080008 一、 人脸识别研究现状 人脸识别的研究早已展开,Calton等早在1888年和1910年就分别在Nature杂志上发表过两篇关于利用人脸特征进行身份识别的文章,提出检测人脸特征或是关键点的方法。自动人脸识别的研究论文最早出现在1965年Chan和Bledsoe在Panoramic Research Inc上发表的技术报告中至今已有四十多年的历史。学者们一般将AFR的研究历史按照研究内容、技术方法等划分为以下三个阶段。 第一阶段(1964—1990年)。这一阶段人脸识别刚刚起步,还只是被作为一个一般性的模式识别问题进行研究,所釆用的方法主要是比较人脸的几何结构。总体而言,这一阶段可以看做是人脸识别研究的初级阶段,代表性的成果没有很多,也没有得到实际应用。 第二阶段(1991一1997年)。尽管第二阶段的时间比较短暂,但却是人脸识别研究的发展高峰期,不仅涌现出大量重量级研究成果,而且出现了若干商业化运作的人脸识别系统。这一阶段的人脸识别技术发展非常之快,所提出的算法在较理想图像采集条件下的中小规模正面人脸数据库上可以达到令人满意的性能。 第三阶段(1998—现在)。20世纪90年代以来,对人脸识别方法的研究变得非常热门,吸引了大量的研究人员和基金支持。由于主流的人脸识别技术对于光照、姿态等非理想采集条件,以及用户不配合造成的人脸变化等条件下的鲁棒性比较差。目前非理想成像条件下(尤其是光照和姿态)、对象不配合、大规模人脸数据库上的人脸识别问题逐渐成为研究的热点问题。而非线性建模方法、统计学习理论、基于Boosting的学习技术、基于3D模型的人脸建模与识别方法等逐渐成为备受重视的技术发展趋势。 二、人脸识别系统 人脸识别系统是提取人脸的相关特征信息,并根据这些特征信息进行身份识别的生物识别技术,它利用计算机对人脸静态图像或动态视频流进行分析,提取出对识别有用的信息,从而进行身份认证,它是人类用来进行身份确认最直接、最自然、最友好的生物特征识别方法,而且与其他身份识别方法相比,人脸识别具有采集过程的非侵犯性、釆集的便捷性等优点,特别是使用者不会产生任何心理障碍,通过对人脸表情与姿态进行分析,还能获得其他识别系统难以获得的一些信息。 三、人脸识别的描述分类 1、人脸检测

相关文档
最新文档