基于Gabor小波与RBF神经网络的人脸识别新方法

合集下载

基于改进Gabor特征幻影的低分辨率人脸识别

基于改进Gabor特征幻影的低分辨率人脸识别

doi:10.3969/j.issn.1003-3106.2020.10.012引用格式:卞加祁,胡学龙,陈舒涵.基于改进Gabor 特征幻影的低分辨率人脸识别[J].无线电工程,2020,50(10):868-873.[BIAN Jiaqi,HU Xuelong ,CHEN Shuhan.Low-resolution Face Recognition Based on Improved Gabor-feature Hallucination[J].RadioEngineering,2020,50(10):868-873.]基于改进Gabor 特征幻影的低分辨率人脸识别卞加祁1,2,胡学龙1,2∗,陈舒涵1,2(1.扬州大学信息工程学院,江苏扬州225127;2.扬州大学人工智能学院,江苏扬州225127)摘㊀要:在传统的人脸识别系统中,分辨率是影响人脸识别率的重要因素之一㊂在Gabor 特征幻影的低分辨率人脸识别的基础之上,提出了相关改进算法㊂根据高低分辨率之间的流形结构,采用局部线性嵌入(LLE)构造高分辨率的Gabor 特征;将高低分辨率的Gabor 特征映射到随机典型相关分析中进一步揭示非线性关系㊂在YALE 和ORL 上的实验结果表明,改进后的算法对比原Gabor 特征的幻影算法,识别率得到了一定的提升㊂关键词:人脸识别;低分辨率;局部线性嵌入;随机典型相关分析中图分类号:TP391.41文献标志码:A开放科学(资源服务)标识码(OSID ):文章编号:1003-3106(2020)10-0868-06Low-resolution Face Recognition Based on Improved Gabor-feature HallucinationBIAN Jiaqi1,2,HU Xuelong1,2∗,CHEN Shuhan 1,2(1.School of Information Engineering ,Yangzhou University ,Yangzhou 225127,China ;2.School of Artificial Intelligence ,Yangzhou University ,Yangzhou 225127,China )Abstract :In traditional face recognition systems,the resolution is one important factor affecting face recognition rate.Based on thelow-resolution face recognition of Gabor feature hallucination,an improved algorithm is proposed.According to the manifold structurebetween high resolution and low resolution,the HR Gabor feature can be structured by local liner embedding.The nonlinear relationship is shown by mapping the high and low resolution Gabor feature to Randomized CCA.The experimental results show that the improvedmethod has a certain improvement compared with the previous Gabor feature hallucination method at YALE and ORL datasets.Key words :face recognition;low resolution;LLE;RCCA收稿日期:2020-04-06基金项目:国家自然科学基金资助项目(61802336);江苏省 六大人才高峰 第七批高层次人才资助项目(2010-DZXX -149)Foundation Item:Project Supported by the National Natural Science Foun-dation (61802336);Supported by the Seventh High level Talents of Six Major Talent Summit of Jiangsu Province(2010-DZXX -149)0㊀引言近年来,监控摄像头的应用颇为广泛,人脸识别系统备受重视㊂由于摄像头常处于非可控状态,故所拍摄得到的人脸图像一般分辨率较低且质量较差㊂如何提高此类低分辨率人脸的识别准确率具有重要的现实意义㊂目前,低分辨率人脸识别主要有超分辨率重建[1-6]和稳健特征提取[7-10]㊂超分辨率重建算法主要是先对低分辨率样本进行超分辨率增强,然后再进行识别㊂具体可以分为以下几类:基于流形学习㊁基于字典学习以及基于回归学习㊂在基于流形学习中,先假设高分辨率人脸和低分辨率人脸中具有相同的局部邻域结构,在这种假设下,可以通过邻域样本重建生成与低分辨率人脸相对应的高分辨率人脸;具体的流形思想有:局部几何结构以及稀疏邻域嵌入㊂在基于字典学习中,通过寻找和从低分辨率人脸和高分辨率人脸特征空间有关的稀疏编码系数来预测高分辨率人脸;基于字典学习的方法大致有2类:正交字典[3]和过完备字典㊂在基于回归学习中,首先通过高低分辨率人脸数据集,建立一个映射函数,再通过这个映射函数,来构建与低分辨率人脸相对应的高分辨率人脸㊂具体方法有核回归[5]㊁支持向量回归等㊂在超分辨率重建算法中,Pong 等[11]提出了一种基于Gabor 特征重建的低分辨率人脸识别,即先用局部线性回归建立一个映射函数,再通过这个映射函数,来构建高分辨率(HR)的Gabor 特征;将预测得到的HR 特征和低分辨率(LR)特征投影到GCCA [12]空间中,进行识别分类㊂在该算法中存在一些不足:①使用局部线性回归(LLR)[13]预测高分辨率人脸的Gabor 特征,忽略了高低分辨率之间的非线性,本文采用流形学习中一种LLE [14]的算法预测高分辨率人脸Gabor 特征,有效地预测了高分辨率人脸的非线性特征;②通过Randomized CCA 来揭示高低Gabor 人脸特征的非线性关系,取代了原论文中使用GCCA 仅能表示数据集之间线性关系的不足㊂1㊀Gabor 特征幻影1.1㊀Gabor 小波Gabor 小波与人类视觉系统中的简单细胞刺激响应非常相似㊂它在提取目标的局部空间和频率信息方面具有良好的特性㊂Gabor 小波能够提供良好的方向和尺度选择特性,而且对于光照变化并不敏感,能够提供对光照变化良好的适应性,正是这些良好的特征,所以能够被广泛地应用于视觉㊂本文的人脸特征提取采用Gabor 小波方法㊂在空间域中,由高斯函数调制的复指数构成,其公式为:ψω,θ(m ,n )=12πσ2e-(m cos θ+n sin θ)2+(n cos θ-m sin θ)22σ2ˑ[e i (ωm cos θ+ωn sin θ)-e -ωσ22]ψω,θ(m ,n )=12πσ2e-(m cos θ+n sin θ)2+(n cos θ-m sin θ)22σ2ˑ[e i (ωm cos θ+ωn sin θ)-e -ωσ22]ìîíïïïïïïïïïï,(1)式中,(m ,n )为人脸像素的位置;ω为复指数的径向中心频率;θ为Gabor 小波的方向;σ为高斯函数的标准偏差㊂1.2㊀高分辨率Gabor 特征预测Pong 使用了局部线性回归的方法来预测高分辨率Gabor 特征,这虽然能够在一定程度上预测高分辨率的Gabor 特征,但只假设了高低分辨率之间存在线性关系㊂而在流形学习中,认为高低分辨率人脸具有相似的内在结构㊂相比于简单的局部线性回归,使用流形学习进行HR Gabor 特征预测,更能准确地预测HR 人脸㊂分别计算高低分辨率人脸数据集的Gabor 特征来构成{X L ,X H }训练数据集㊂这里X H ={x 1H ,x 2H ,,x M H }来表示M 个高分辨率的Gabor 特征,X L={x 1L ,x 2L , ,x M L }表示M 个低分辨率的Gabor 特征㊂输入一个低分辨率人脸Gabor 特征:首先计算结构权重,并对该低分辨率人脸特征和训练集中的Ga-bor 特征的结构误差最小化来得到;接着通过结构权重和已知的高分辨率人脸特征集来预测高分辨率Gabor 人脸特征㊂嵌入算法在高分辨率人脸重建应用中,对于输入的低分辨率人脸特征:①在已知的低分辨率人脸特征数据集中,找出K 个近邻的x i L ㊂②通过输入的低分辨率人脸特征x t L 与训练集中人脸特征集构成结构误差,来计算结构权重:ε=x tL-ðk j =1αtjx j L,ðk j =1αtj=1㊂(2)③通过结构权重和对应K 个近邻的高分辨率来计算高分辨率Gabor 人脸特征:x i H =ðk j =1αtjx j H ㊂(3)1.3㊀典型相关分析典型相关分析(CCA)是一种处理2组随机变量之间相互关系的统计方法㊂它的意义在于:对给定的2组(或多组)数据集寻找一组合适的线性变换,从提取的数据中发现,度量和评价它们彼此之间存在的线性相关关系㊂CCA 的目的是为{(x i L ,x i H )ɪR p ˑR q }M i =1寻找2组基向量w l ɪR p 和w h ɪR q,使高低人脸数据集投影后的相关性达到最大㊂具体可表述为求如下相关系数的最大值问题:ρ=E [xy ]E [x 2]E [y 2]=E [w T l X L (X H )Tw h ]E [w T lX L (X L )Tw l ]㊃E [w T hX H (X H )Tw h ]=w T l C xL x Hw hωT l C xL xLw l w T hC xH x Hw h,(4)式中,E [∙]表示数学期望;C x L x L ɪR p ∗p 和C x H x H ɪR q ∗q 表示集合内协方差矩阵,C x L x H ɪR p ∗q 表示集合间协方差矩阵且C T xy=C yx ㊂1.4㊀随机CCA虽然CCA 能够最大化2组变量之间的相关性,但是CCA 是基于线性相关的,所以不能准确反映非线性关系㊂为了克服CCA 这一缺点,一系列的非线性拓展算法相继提出㊂比如Kernel CCA [15],利用核函数来构造2组变量的非线性关系;再如Deep CCA [16],利用DNN 网络来训练2组变量的非线性关系;但是这些算法虽然提高了相关性,但也具有相当高的计算复杂度和时间复杂度㊂David [17]提出了利用随机策略来构造可以与线性算法结合使用揭示非线性特征㊂其公式为:K (x i ,x j )=ʏp (Ω)e-j ΩT (x i -x j )d ωʈðmi =11me -j ΩTi x e j ΩTj x =ðmi =11m cos(ΩT i x i +b )cos(ΩT j x j+b )=<1m z (x i ),1mz (x j )>,(5)式中,p (Ω)设置为K 的逆傅里叶变换;b ~U (0,2π),Ωi ~N (0,2sI ),z i :[cos ΩT i x i +b i (), ,cos (ΩTix m +b i )]以及z ㊃():[z 1, ,z m ];m 为样本的个数㊂RCCA 中,使用m 个随机傅里叶特征来逼近内核K ,即:K ʈK random ʒ=1mz (X )z (X )T ㊂(6)通过拉格朗日乘法,得出U random 和V random ,即为:U random ʒ=(K random L)200(K random H )2éëêêùûúúV random ʒ=0K random L K randomH K random H K random L 0éëêêùûúúìîíïïïïïï㊂(7)为了避免过拟合,添加了μ和k 两个惩罚项:U random ʒ=(K random L+μI)200(K random H+κI)2éëêêùûúúV random ʒ=0K random L K randomH K random H K random L 0éëêêùûúúìîíïïïïïï㊂(8)1.5㊀Gabor 特征幻影的低分辨率人脸识别类似于CCA,选择前d 个特征值对应的特征向量W l =(α1,α2, ,αd )和W h =(β1,β2, ,βd ),将W l ,W h 称为广义典型投影向量,并且使用式(9)和式(10)组合的特征称为广义规范判别特征㊂即:x l ∗=(αT 1x l ,αT 2x l ,...,αTd x l )=(α1,α2,...,αd )T x l =W T l x l ,(9)x h ∗=(αT 1x h ,αT 2x h ,...,αTd x h )=(α1,α2,...,αd )T x h =W T h x h ㊂(10)用式(11)将x ∗l 和x ∗h 进行线性组合,并用作分类:Z 1=x ∗l x ∗h éëêêùûúú=W Tl x l W T h x h éëêêùûúú=W l 00W h éëêêùûúúx l x h éëêêùûúú㊂(11)计算m 对LR 和HR 的Gabor 特征的训练人脸向量{X i L ,X i H }m i =1,其中低分辨率人脸维度为X iL ɪR p ,高分辨率人脸维度为X i H ɪR q ㊂首先,中心化LR 和HR 人脸数据集X ︿i L=I i L-m L ,X ︿i H =I i H -m H ,其中m L ,m H 为LR 和HR 的训练集的均值向量;其次由于Gabor 特征高纬度给计算带来了维数灾难,本文采用PCA 算法进行降维:X ︿ᶄL =xᶄL {}M i =1=[x ︿1ᶄL , ,x ︿MᶄL ],X ︿ᶄH=X ︿ᶄH {}Mi =1=[x ︿1ᶄH , ,x ︿MᶄH ]㊂基于RCCA,2组训练集X ︿ᶄL ,X ︿ᶄH 通过式(8)产生W l ,W h ㊂对于一个未知的LR 人脸,计算它的Gabor 特征,并投影到PCA 空间中,记为x t 1l ㊂它对应的HR Gabor 特征通过LLE 算法得出,并记为x t 1h ;并将x t 1l 和x t 1h 投影到RCCA 空间中,通过式(12)将其级联,记为:T =W Tl x t 1L W T h x t 1H éëêêùûúú㊂(12)通过式(12)级联后并使用式(13)的计分函数将其分类:score(G ,H )=G ㊃HG ∗ H,(13)式中,G 和H 表示训练集和测试集里的人脸投影到RCCA 后的特征向量㊂1.6㊀框架图算法框架如图1所示,分为2个部分:训练部分和测试部分㊂训练部分:分别将高低分辨率的人脸数据集都基于Gabor 进行特征提取,再通过RCCA 获取LR 和HR 对应的相关特征,并将其线性连接;测试部分:输入一个LR 的人脸,利用LLE 构建HR 的Gabor 特征,分别将LR㊁HR 映射到相关的特征中并进行线性连接;最后送入最近邻分类器进行分类,求得识别结果㊂图1㊀算法框架Fig.1㊀Algorithm framework2㊀实验结果和分析为了验证改进算法的有效性,在YALE和ORL数据集上做了一些实验,将LLE与LLR,GCCA与RCCA 进行两两组合㊂保留PCA的97%的有效能量㊂实验环境为Intel Core i7CPU2.2GHz,内存8GB,操作系统Windows10,编程平台为Matlab2017b㊂2.1㊀数据集描述YALE数据集由耶鲁大学计算视觉与控制中心创建,包含15名志愿者,每名志愿者由11幅图像组成,这些人脸包含着明显不同的光照㊁表情以及姿态的变化㊂以YALE数据集为基础,将48pixelˑ48pixel 分辨率作为HR人脸图像集,对该数据集依次平滑下采样,依次获得8pixelˑ8pixel,9pixelˑ9pixel, 11pixelˑ11pixel,13pixelˑ13pixel,15pixelˑ15pixel, 17pixelˑ17pixel,19pixelˑ19pixel的LR人脸数据集㊂ORL数据集由剑桥大学AT&T实验室创建,包含40名志愿者,每名志愿者由10幅图像组成,分辨率大小统一为92pixelˑ112pixel㊂该数据库人脸表情和人脸姿态有一定的变化㊂以ORL数据集为基础,将48pixelˑ48pixel作为高分辨率人脸图像集,对该数据集依次平滑下采样,依次获得10pixelˑ10pixel,12pixelˑ12pixel,14pixelˑ14pixel, 16pixelˑ16pixel,18pixelˑ18pixel,20pixelˑ20pixel的低分辨率人脸数据集㊂2.2㊀重建Gabor特征对比在比对重建Gabor特征时,LR的Gabor特征分辨率为8pixelˑ8pixel,HR的Gabor特征的分辨率为48pixelˑ48pixel㊂如图2和图3所示㊂在YALE 的人脸集中,采用峰值信噪比(PSNR)和结构相似度值(SSIM)对比LLR和LLE算法重建的Gabor特征,所考虑的尺度和方向分别为5和8㊂图2㊀重建Gabor特征得PSNR对比Fig.2㊀PSNR comparison of Gabor feature reconstruction图3㊀重建Gabor 特征得SSIM 对比Fig.3㊀SSIM comparison of Gabor feature reconstruction从图2和图3可以得出,在PNSR 的比对中,LLR 算法重建特征效果好于K =10和K =20的,在K 为30,40,...,70时,效果均小于LLE 算法的重建效果;在SSIM 的比对中,LLE 算法的重建效果都好于LLR 算法的重建㊂2.3㊀YALE 数据集上的实验在YALE 数据集的实验中,每位志愿者随机抽取5张人脸作为训练集,其余作为测试集㊂将48pixel ˑ48pixel 作为HR 人脸,LR 人脸范围9pixel ˑ9pixel ~19pixel ˑ19pixel㊂在LLE 算法中,K 取值为30;RCCA 中的惩罚项μ和κ设置为0.001㊂实验结果如表1和图4所示㊂表1㊀YALE 上不同算法在不同分辨率下的识别率Tab.1㊀Recognition rate of different algorithms at differentresolutions on YALE不同算法的识别率/%分辨率pixel LLE +RCCA LLR +RCCA LLE +GCCA LLR +GCCA9ˑ972.2267.7870.0066.6711ˑ1174.4473.3372.2272.2213ˑ1378.8976.6781.1176.6715ˑ1580.0077.7884.4481.1117ˑ1780.0080.0082.2280.0019ˑ1982.2281.1183.3081.11D( QJYFM@ (/%图4㊀YALE 上各类算法识别率Fig.4㊀Recognition rate of different algorithms on YALE通过实验结果比对,本文基于LLE 算法而改进的重建HR 人脸的Gabor 特征,在不同分辨率下,识别率均高于原论文中基于LLR 算法而重建的HR 人脸Gabor 特征;本文所提出的基于LLE 重建Ga-bor 特征,结合原论文中的GCCA 算法,能够在不同的LR 下拥有最高的识别率;本文提出的LLE +RC-CA 的改进算法在不同分辨率下普遍高于原算法的LLR +GCCA 的组合,尤其是在超低分辨率9pixel ˑ9pixel 时,依然有72.22%的识别率㊂2.4㊀在ORL 数据集上的实验在ORL 人脸数据集的实验中,每位志愿者随机抽取5幅人脸作为训练集,其余作为测试集,以48pixel ˑ48pixel 作为HR 人脸,LR 范围10pixel ˑ10pixel ~20pixel ˑ20pixel㊂在LLE 算法中,K 值选取为40;RCCA 中的惩罚项μ和κ设置为0.001㊂实验结果如表2和图5所示㊂表2㊀ORL 上不同算法在不同分辨率下的识别率Tab.2㊀Recognition rate of different algorithms at differentresolutions on ORL不同算法的识别率/%分辨率pixel LLE +RCCA LLR +RCCA LLE +GCCA LLR +GCCA 10ˑ1086.5051.5083.5046.5012ˑ1289.5061.0084.0054.5014ˑ1487.0079.5092.5083.0016ˑ1688.5083.0088.0086.5018ˑ1890.5087.0095.0091.0020ˑ2089.0089.0092.5090.50D( QJYFM@ (/%图5㊀ORL 上各类算法识别率Fig.5㊀Recognition rate of different algorithms on ORL更换实验数据集,将实验放在ORL 数据集上测试㊂由于ORL 数据集的环境干扰比较少,所以识别率普遍提高㊂也得到和YALE 数据集相似的结论:本文基于LLE 算法而改进的重建HR 人脸的Gabor 特征,在不同分辨率下,识别率均高于原论文中基于LLR 算法而重建的HR 人脸Gabor 特征;本文所提出的基于LLE重建Gabor特征,结合原论文中的GCCA算法,能够在不同LR下拥有最高的识别率;本文提出的LLE+RCCA的改进算法在不同分辨率下普遍高于原算法的LLR+GCCA的组合,尤其是在超低分辨率10pixelˑ10pixel时,依然有86.50%的识别率;3㊀结束语本文提出了基于改进的Gabor特征幻影的人脸识别算法,在Pong的算法上提出了改进㊂主要有以下2点:采用基于流形学习的LLE算法取代原论文的LLR算法,更加注重高低分辨率之间的非线性关系;在特征投影方面,采用RCCA算法,更加注重训练集的非线性特征㊂在上述实验结果中,改进后的算法提高了识别率,尤其是极低分辨率的情况下㊂参考文献[1]㊀FARRUGIA R A,CHRISTINE G.Face Hallucination U-sing Linear Models of Coupled Sparse Support[J].IEEETransactions on Image Processing,2017,26(9):4562-4577.[2]㊀LAI Zhihui,WONG Waikeung,XU Yong,et al.Approxi-mate Orthogonal Sparse Embedding for Dimensionality[J].IEEE Transactions on Neural Networks and LearningSystems,2016,27(4):723-735.[3]㊀KUMAR N,SINHA R.Improved Structured DictionaryLearning via Correlation and Class Based Block Formation[J].IEEE Transactions on Signal Processing,2018,66(19):5082-5095.[4]㊀MOHAMED M N H,LU Yao,LÜFeng.Effective Two-stepMethod for Face Hallucination Based on Sparse Compen-sation on over-complete Patches[J].IET Image Process-ing,2013,7(6):624-632.[5]㊀SHI Jinggang,ZHAO Guoying.Face Hallucination viaCoarse-to-Fine Recursive Kernel Regression Structure[J].IEEE Transactions on Multimedia,2019,21(9):2223-2236.[6]㊀JEBADURAI J,PETER J D.SK-SVR:Sigmoid KernelSupport Vector Regression Based in-scale Single ImageSuper-resolution[J].Pattern Recognition Letters,2017,94(15):144-153.[7]㊀李嘉頔,陈振学,刘成云.分块CS-LBP和加权PCA的低分辨率人脸识别[J].光电子㊃激光,2016,27(2):210-216.[8]㊀YANG W K,WANG Z Y,ZHANG B C.Face RecognitionUsing Adaptive Local Ternary Patterns Method[J].Neu-rocomputing,2016(213):183-190.[9]㊀张一凡.低分辨率条件下的人脸识别算法研究[D].四川:电子科技大学,2018.[10]SUN G L,ZHANG X P,LI G Q.Robust Degraded FaceRecognition with Novel Face Representation and Multi-scale Fusion[J].Optical Engineering,2013,52(7):1-8.[11]PONG K H,LAM K M.Multi-resolution Feature Fusionfor Face Recognition[J].Pattern Recognition,2014,47(2):556-567.[12]TENENHAUS A,PHILIPPE C,VINCENT G et al.Varia-ble Selection for Generalized Canonical Correlation Analy-sis[J].Biostatistics,2014,15(3):569-583. [13]NASEEM I,TOGNERI R,BENNAMOUN M.Linear Re-gression for Face Recognition[J].IEEE Transactions onPattern Analysis and Machine Intelligence,2010,32(11):2106-2112.[14]YUAN Y H,ZHANG Z,LI Y,et al.Learning Parallel Ca-nonical Correlations for Scale-Adaptive Low ResolutionFace Recognition[C]ʊ201824th International Conferenceon Pattern Recognition.Beijing:ICPR,2018:922-927.[15]ZHANG Z,YUAN Y H,LI Y,et al.Face Hallucinationand Recognition Using Kernel Canonical Correlation Anal-ysis[C]ʊInternational Conference on Neural InformationProcessing.Singapore:ICONIP,2017:633-641. [16]ZHANG Z,YUAN Y H,SHEN X B,et al.Low ResolutionFace Recognition and Recognition Via Deep CanonicalCorrelation Analysis[C]ʊIEEE International Conferenceon Acoustics,Speech and Signal Processing.Calgary:IC-ASSP,2018:2951-2955.[17]DAVID L P,SUVRIT S SMOLA A J,et al.RandomizedNonlinear Component Analysis[C]ʊ31st InternationalConference on Machine Learning.Beijing:ICML,2014:1359-1367.作者简介卞加祁㊀男,(1994 ),就读于扬州大学电子与通信工程专业,硕士研究生㊂主要研究方向:人脸识别㊁图像处理等㊂(∗通信作者)胡学龙㊀男,(1960 ),博士,教授,硕士生导师㊂主要研究方向:图像处理㊁计算机视觉等㊂陈舒涵㊀男,(1987 ),博士,讲师㊂主要研究方向:深度学习㊁计算机视觉等.。

基于SIFT特征的人耳识别

基于SIFT特征的人耳识别

基于SIFT特征的人耳识别
雷松泽;姚红革;齐敏;郝重阳
【期刊名称】《计算机应用》
【年(卷),期】2009(029)006
【摘要】人耳的角度变化和遮挡是人耳识别中的难点问题,SIFT局部描述算子具有对图像尺度缩放、平移、旋转等的不变性,因此提出利用SIFT特征的人耳识别算法.该算法将人耳图像划分为相互重叠的网格区域,在每个子区域中计算SIFT的局部特征,再计算测试图像与训练图像的匹配相关度作为图像的全局特征,将SIFT的局部和全局特征相结合作为人耳识别的标准.通过在人耳库中的实验表明,此算法优于传统的全局方法,对于人耳角度变化和遮挡具有较好的鲁棒性,并且适用于单训练样本的情况.
【总页数】4页(P1690-1693)
【作者】雷松泽;姚红革;齐敏;郝重阳
【作者单位】西北工业大学,电子信息学院,西安,710072;西北工业大学,电子信息学院,西安,710072;西北工业大学,电子信息学院,西安,710072;西北工业大学,电子信息学院,西安,710072
【正文语种】中文
【中图分类】TP391
【相关文献】
1.基于 Gabor小波和 ASIFT特征点的人耳识别 [J], 田莹;徐超;张一鸣
2.基于改进SIFT特征和神经网络结合的场景识别 [J], 郭昊琛;闫帅帅;刘天鹤
3.基于改进SIFT特征和神经网络结合的场景识别 [J], 郭昊琛; 闫帅帅; 刘天鹤
4.一种基于SIFT特征及决策函数的人脸识别方法 [J], 杨璐
5.基于SIFT特征的3D人耳识别方法 [J], 查峰;达飞鹏
因版权原因,仅展示原文概要,查看原文内容请购买。

人脸特征提取与识别

人脸特征提取与识别

人脸特征提取与识别一、人脸特征提取1.几何特征:包括人脸的位置、尺度、姿态等几何信息。

常见的几何特征包括人脸的中心位置、眼睛、鼻子和嘴巴的位置等。

这些特征通常通过模板匹配、边缘检测和人脸关键点检测等方法获取。

2. 外观特征:主要包括人脸的纹理和颜色信息。

纹理特征是通过对人脸图像进行纹理分析提取得到的,常见的方法包括局部二值模式(LBP)、Gabor滤波器和Haar小波等。

颜色特征则是通过对人脸图像中的颜色进行统计和分析得到的,常见的方法包括颜色直方图和颜色矩等。

3.结构特征:主要是指人脸的结构性信息,包括人脸的轮廓、特征点和曲线等。

这些结构特征可以通过模型拟合、形状分析和曲线提取等方法获取。

4. 深度学习特征:近年来,随着深度学习的发展,深度卷积神经网络(CNN)在人脸特征提取方面取得了很大的突破。

通过使用大规模的人脸图像数据进行训练,CNN可以自动学习到表征人脸的高层抽象特征,如卷积层和全连接层的特征向量。

常用的深度学习模型包括AlexNet、VGGNet和ResNet等。

二、人脸特征识别人脸特征识别是指根据提取到的人脸特征进行身份认证或者验证的过程。

常见的人脸特征识别方法包括以下几种。

1.相关性方法:通过计算待识别人脸特征向量与数据库中已有特征向量的相关性来进行识别。

这种方法的关键在于选择合适的相似度度量指标,如余弦距离、欧式距离和马氏距离等。

2.统计方法:基于统计模型的识别方法,例如线性判别分析(LDA)、主成分分析(PCA)、高斯混合模型(GMM)和支持向量机(SVM)等。

这些方法通过建立一个统计模型,用于刻画人脸的变化规律,并进行分类。

3. 深度学习方法:深度学习在人脸特征识别领域也取得了很大成功。

通过使用大量的带标注人脸图像数据进行训练,深度学习模型可以学习到表示人脸的高级抽象特征,如卷积神经网络(CNN)、多任务卷积神经网络(MT-CNN)和孪生网络(Siamese Network)等。

小波变换与神经网络的结合在图像分析中的应用

小波变换与神经网络的结合在图像分析中的应用

小波变换与神经网络的结合在图像分析中的应用随着科技的不断发展,数字化技术在图像处理中的应用越来越广泛。

在图像分析领域中,小波变换和神经网络是两个重要的工具,它们可以互相结合,最终帮助人们更好地进行图像分析。

本文将探讨小波变换和神经网络的结合在图像分析中的应用。

一、小波变换的介绍小波变换是一种基于时间和频率分析的变换方法,它可以将信号分解为不同频率成分和时域特征。

相比于傅里叶变换,小波变换更适合处理非稳态信号,可以提取出更为准确的信息。

在图像分析中,小波变换可以用于图像压缩、去噪、边缘检测等方面。

通过分解和重构,小波变换可以将图像压缩到更小的尺寸,同时保留图像的主要信息。

此外,小波变换可以减少噪声在图像中的影响,提高图像的质量。

在边缘检测方面,小波变换可以定位图像中的边缘,并将其突出显示。

二、神经网络的介绍神经网络是一种基于生物神经系统的模拟技术,它通过多个节点(神经元)之间的连接,来实现信息的处理。

神经网络可以设置多个隐藏层,根据数据集不断进行学习,提高其对目标的识别准确性。

在图像分析中,神经网络可以用于图像识别、物体检测等方面。

通过对大量数据的学习,神经网络可以判断图像中是否存在目标物体,并将其与其他物体区分开来。

此外,神经网络还可以对图像进行分类,例如将不同的动物、车辆等分类出来。

三、小波变换与神经网络的结合小波变换和神经网络在图像分析中都有重要的作用,它们的结合可以更全面地分析图像。

以下是小波变换与神经网络结合的一些应用。

1. 基于小波变换的图像预处理在使用神经网络进行图像分析之前,需要对图像进行预处理。

由于神经网络对噪声、模糊等干扰比较敏感,因此需要使用小波变换来对图像进行去噪、边缘检测等处理,以提高神经网络的准确性。

2. 基于小波变换的神经网络训练方法神经网络的识别准确性与其所学习的数据集的质量有关。

在训练神经网络时,可以采用小波变换来对数据集进行压缩,从而减少神经网络的训练时间和计算量,提高训练效率。

人脸识别背景及其方法

人脸识别背景及其方法

人脸识别背景及其方法浅谈人脸识别技术的现状与发展宋磊卞迪白杰文范益彪李主南摘要人脸识别技术以其独特性、直接性、方便性等特点,在涉及身份特征识别的领域里被广为应用。

本文主要介绍人脸识别技术(FRT)的研究内容、研究背景价值及研究现状。

通过分析当前人脸识别技术的现状,总结了人脸识别的应用前景,提出了人脸识别技术的未来发展要求。

关键词:人脸识别,研究现状,发展趋势AbstractFace Recognition Technology, characterized by its uniqueness,direct and convenience's widely used in the identification of Identlty.This paper mainly introduces the research content^study background value.and research status of the Face Recognition Technology.Through the analysis of the present situation of Face Recognition Technology,the application prospect of Face Recognition is suininarized and the future development of Face Recognition Technology is proposed.Key words: Face Recognition, Research statusDeveloping trend引言随着现代信息技术的快速发展,进行身份认证的技术转到了生物特征层面。

现代生物识别技术主要是通过计算机与高科技手段密切结合,利用人体固有的生理特性和行为特征来进行个人身份的鉴定。

其中人脸识别是指人的面部五官以及轮廓的分布,这些分布特征因人而异,与生俱来。

基于改进LeNet-5的面部表情识别

基于改进LeNet-5的面部表情识别

信■与电BSChina Computer&Communication2020年第23期基于改进LeNet-5的面部表情识别邹佳丽(华北理工大学人工智能学院,河北唐山063210)摘要:本文提出一种改进的LeNet-5卷积神经网络用于面部表情识别的新方法°首先,对人脸图像进行裁剪、尺度归一化预处理后,把处理后的图像输入融合卷积层和池化层后的卷积层来提取表情特征并进行分类,然后训练网络模型时采用的是随机梯度下降法,在输出层使用了 Softmax分类器进行表情识别。

该方法使用了批量正则化和Relu激活函数来加快模型的训练速度,在全连接层通过使用Dropout方法降低训练过程中的过拟合问题.实验结果表明,在FER2013.CK+表情数据库上都取得了较高的识别效率,其训练速度较普通的卷积神经网络有很大的提高,验证了本文方法的有效性。

关键词:面部表情识别;卷积神经网络;Dropout技术中图分类号:TP391.41文献标识码:A文章编号:1003-9767(2020)23-065-03Facial Expression Recognition Based on Improved LeNet-5ZOU Jiali(School of Artificial Intelligence,North China University of Science and Technology,Tangshan Hebei063210,China) Abstract:An improved LeNet-5convolutional neural network is proposed for facial expression recognition.First,after cropping the face image,preprocessing the scale normalization,input the processed image to the convolutional layer after fusing the convolutional layer and the pooling layer to extract and classify the expression features,and then,when training the network model The stochastic gradient descent method is adopted,and the Softmax classifier is used for expression recognition in the output layer. The model method uses batch regularization and Relu activation function to improve the training speed of the model,and uses the Dropout method in the fully connected layer to reduce the overfitting problem during the training process.Experimental results show that good recognition results have been achieved on FER2013and CK+expression databases,and the training speed is greatly improved compared with ordinary convolutional neural networks,which verifies the effectiveness of this method.Keywords:facial expression recognition;convolutional neural network;Dropout technology0引言近年来,面部表情识别技术的发展十分迅速并成功应用到很多领域。

基于GA-BP神经网络的人脸检测算法

基于GA-BP神经网络的人脸检测算法1.被控对象的特性人脸是一个极为普通、重要而又十分复杂的模式,其中蕴含的信息量非常丰富,本来在复杂的背景图像中区别人脸和其它物体就是一个比较困难的同题。

并且由于以下原因使得人脸检测的困难加大。

(1)姿势;(2)脸部的相关结构化的部件;(3)脸部表情;(4)图像的定位;(5)图像的自身条件。

因此,如能够找到解决以上问题的方法,成功地构造出人脸检测系统,将为解决其它类似的复杂模式检测问题提供重要的启示。

因而人脸检测技术的研究具有重要的学术价值。

2.控制目标人脸检测的确切定义为:任意给出一幅图像,系统能够准确分析图像中的信息,判断出图像中是否存在人脸;如果存在,则返回人脸在图像中的确切位置和范围。

所以它研究的主要问题是判断静态图像或动态影像中是否存在人脸,如果存在则对人脸进行定位。

而我们控制的目标就是更加准确地判断图像中人脸的存在性和定位人脸,这个过程中又涉及到一些系统控制指标,如精度、自适应性、容错性、分类能力和检测时间等。

我们设计的控制系统应该尽量的提高系统控制指标。

3.控制方案的选定卷积神经网络擅于提取具有类别分辨能力的隐式特征,在人脸检测等领域获得巨大成功。

然而典型的卷积神经网络的固定结构又使得网络规模初始设定只能是经验性的,难以实现后继的再学习。

BP神经网络是一种多层前向网络,由输入层、输出层、隐含层(可以是一层或多层)构成,是一种典型的三层BP神经网络模型。

BP神经网络具有较强的容错性和自适应学习能力,但同时传统的BP如学习算法的收敛速度慢、局部极小问题和网络的初始的权值、阈值以及隐层的单元数根据经验选取等,这些都大大地影响其工作性能。

GA-BP神经网络是将遗传学习算法和误差反向传播算法相结合的混合算法来训练前馈人工神经网络,使网络收敛速度加快和避免局部极小,该网络不仅收敛速度快,而且易达到最优解,后继的再学习能力强,可以较好地解决人脸检测中往往存在的噪声、残缺和戴眼睛的人脸图像等。

基于Gabor小波和SVM的人脸表情识别算法

基于Gabor小波和SVM的人脸表情识别算法作者:陈亚雄来源:《现代电子技术》2011年第20期摘要:针对包含表情信息的静态图像,提出基于Gabor小波和SVM的人脸表情识别算法。

根据先验知识,并使用形态学和积分投影相结合定位眉毛眼睛区域,采用模板内计算均值定位嘴巴区域,自动分割出表情子区域。

对分割出的表情子区域进行Gabor小波特征提取,在利用Fisher线性判别对特征进行降维,去除冗余和相关。

利用支持向量机对人脸表情进行分类。

用该算法在日本表情数据库上进行测试,获得了较高的识别准确率。

证明了该算法的有效性。

关键词:Gabor小波变换;表情特征提取; Fisher线性判别;支持向量机中图分类号:TN919-34 文献标识码:A文章编号:1004-373X(2011)20-0001-04Facial Expression Recognition Algorithm Based on Gabor Wavelet Automatic Segmentation and SVMCHEN Ya-xiong(Department of Electronics and Information, Northwestern Polytechnical University, Xi’an 710072, China)Abstract: A facial recognition algorithm based on Gabor wavelet and SVM is proposed in allusion to static image containing expression Information. The mathematical morphology combined with projection is adopted to locate the brow and eye region, and the calculating mean value in template is employed to locate the mouth region, which can segment the expression sub-regions automatically. The features of the expression sub-regions are extracted by Gabor wavelet transformation and then effective Gabor expression features are selected by Fisher linear discriminate (FLD) to deduce the dimension and redundancy of the features. The features are sent to support vector machine (SVM) to classify the different expressions. The algorithm was tested in Japanese female expression database. It can get a high precision of recognition. The feasibility of this method was verified by experiments.Keywords: Gabor wavelet transform; expression feature extraction; Fisher linear discriminant (FLD) analysis; support vector machine (SVM)收稿日期:2011-05-11基金项目:西北工业大学2011年度研究生创业种子基金资助项目(Z2011090)0 引言人脸表情识别是指从给定的表情图像或视频序列中分析检测特定的表情状态,进而确定被识别对象的心理情绪。

Gabor特征与深度信念网络结合的人脸识别方法

Gabor特征与深度信念网络结合的人脸识别方法杨瑞;张云伟;苟爽;支艳利【摘要】提出了一种基于Gabor特征和深度信念网络(DBN)的人脸识别方法,通过提取Gabor人脸图像的不同尺度图进行卷积融合,将融合后的特征图作为DBN的输入数据,训练多层来获得更加抽象的特征表达,整个训练的过程中采用交差熵来微调DBN,模型的最顶层结合Softmax回归分类器对抽取后的特征进行分类.在AR 人脸库测试的实验结果表明:将Gabor特征与DBN结合应用于人脸识别,其准确率可高达92.7%,与其他浅层学习模型相比,DBN学习了数据的高层特征的同时还降低了特征维数,提高了分类器的分类精度,最终有效改善了人脸识别率.%A method for face recognition based on the Gabor feature and deep belief network (DBN)is proposed.By extracting different scales image of Gabor face images for convolution fusion and fused feature image is used as input data of DBN.Many layers are trained in order to get more abstract representation.In whole training process,cross entropy method is adopted to fine-tune DBN.The Softmax regression classifier is used for classification which is implemented at the top layer.The experimental result in AR face database shows that when Gabor feature extract combining with DBN are applied to face recognition,its accuracy reaches 92.7 %.Comparing with other shallow-layer learning models,DBN not only studies the high-level features of the data,but also reduces dimension and improves the precision of the classifier,which finally improves face recognition rate.【期刊名称】《传感器与微系统》【年(卷),期】2017(036)005【总页数】3页(P68-70)【关键词】Gabor特征;深度学习;受限玻尔兹曼机;深度信念网络;Softmax回归分类器【作者】杨瑞;张云伟;苟爽;支艳利【作者单位】昆明理工大学信息工程与自动化学院,云南昆明650504;昆明理工大学信息工程与自动化学院,云南昆明650504;昆明理工大学信息工程与自动化学院,云南昆明650504;昆明理工大学信息工程与自动化学院,云南昆明650504【正文语种】中文【中图分类】TP391人脸识别是模式识别和计算机视觉领域的研究热点,作为一种重要生物识别技术,在信息安全领域有着很好的应用前景。

基于Gabor变换和BP神经网络的人脸检测算法的Matlab实现


f m e OR c aa a e a d f al o te f c ee t n frt e t s s mp e u i gt mp ae mac i g r t L f e d tb s n n l d e d t ci o e t a l sn o h a i y h a o h e l t t h n a d mo p oo ia r s n a d d lt n p o e sn . h e u t h w t a , e ag r h h slw o lx — n r h lg c e o i n i i r c s i g T e r s l s o h t t oi m a o c mp e i l o ao s h l t t q ik o e a in a d h g e a i n d tci g a d lc t g t e r h o t l a e y, uc p r t n i h v r c t i e e t n o ai h g tf n a c . o y n n i r f
Ke r s:a e d t cin; b rwa ee ; y wo d fc ee to Ga o v l t BP e r ln t r n u a ewo k
0 引 言
近年来 , 着 计 算 机 技 术 的迅 速 发 展 , 脸 识 随 人 别技术 得到广 泛研 究 与 开发 , 为 模 式识 别 和 图像 成
Fa e d t ci n r aia in by M a l b u i g Ga r wa ee n c e e to e l to z ta sn bo v lta d BP
WA G L - a N iu n j
( oeeo no. n o E g , o h C lg frad Cm. n. N a l fI . C i T i a 3 0 1 C ia f o hn ay n00 5 , n ) a, u h
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

法 ,使得 R F 络 的 整 个 学 习过 程 具备 自适 应 能 力 。 B 网
2 基 于 Ga o 小 波 的 人 脸 特 征 提 取 br
21 构 造 G b r 波 . ao 小 Ga o 4 波 核 函数 定 义 如 下 [ : br , 】
收 稹 日期 t2 0 .31 0 60 .4
学 习 法 训 练 RB F神 经 网 络 。 用 O RL人 脸 库 进 行 试 验 , 结 果 表 明 本 文 提 出 的 方 法 具 有 优 秀 的 学 习 效 率 和 识 别 效 果 。 关 键 词 : 人 脸 识 别 ; G b r 波 ; 主 分 量 分 析 ; R F神 经 网络 ao 小 B
用 的 局 部特 征 。
提 高神 经 网络 的泛 化 能 力 问题 是 R F网络 的一 个 重 要 研 究 方 向 。 目前 ,提 高 网 络 泛化 能 力 的研 究 B 主要 集 中在 如何 选 取 恰 当 的 网络 规 模 , 即 网络 结 构 设 计 问题 上 。关 于 R F B 网络 结构 设计 ,一 个 公 认 的 指 导 原则 是 Mo d 准 则 ,即 :在 没 有 其 它 先 验 知 识 的情 况 下 , 与 给 定 样 本 一 致 的 规模 最 小 的 网络 就 是 oy
修 订 日期 :2 0 .71 0 60 .8
பைடு நூலகம்
维普资讯
7 4
电路 与 系 统 学 报
第 l 3卷
( 0 [ 】 x - - l p e e ( X 一 p
正 弦波 的波 长 之 比 。
( 1 )
上 式表 示一 个 经 过 高 斯包 络 调 制 过 的 正 弦波 ,其 中 =k + = P ,模 控 制 高 斯 窗 口的 宽度
D Masug  ̄ 【最 先 将 Ga o 4 波 引 入 人 脸 识 别 领 域 ,应 用Ga od 波 与 弹 性 图匹 配 技 术 相 结 合 取得 l rd 组 J b j br  ̄ b r ̄
了 良好 的识 别效 果 。 b r, 核 函 数 具有 与 哺 育动 物 大 脑 皮 层 简 单 细 胞 的二 维 反 射 区 相 同 的特 性 ,即 Gaod 波
网 络 的 人 脸 识 别 方 法 。 首 先 对 人 脸 进 行 Ga o 滤 波 ,选 取 有 效 的 Ga o 组 合 。进 行 小 波 分 解 , 获 取 低 频 图 像 , 构 造 特 br br
征矢量 ,采 用主 分量 分析 降低 特 征维 数 。接 着 ,提 出 了一 种聚 类方法 用 于确 定 R F神经 网络的 结构和 初值 ,采 用混合 B
模 式 识 别 领 域 极 富挑 战性 的 一个 热 点研 究 问题 。 别 所 选 取 的特 征 必须 对 上 述 因 素具 备 一 定 的稳 定 性 和 不 变 性 。Ga o4 波 是 G b r 换 与 小 波 理 论 相 结 b r ̄ a o变 合 的产 物 ,它 继 承 了小 波 变 换 的 多 分辨 率特 性 ,同 时具 有 Ga o 函 数本 身所 具有 的局 域 性 和 方 向性 。V br
线性方程组 的最小二乘解就是全局最优解['所 以本文采用混合学 习算法 :由线性最小二乘法计算 隐 3 】
层 和 输 出层之 间 的连 接 权 值 , 由梯 度 下 降法 调 整 隐 层 神 经元 的 中心 和 宽度 。这 种 方 法 与 单 纯 采 用梯 度 下 降 法 相 比 , 学 习速 度 更 快 ,而 且 可 以避 免 局 部 极 小值 问题 。 同 时提 出 了一 种 有 效 的学 习速 率估 算 方
VO.3 11
N O. 1
Fe uay, 20 br r 08
基 于 Ga o 小 波 与 RBF 经 网络 的 人 脸 识 别 新 方 法 br 神
胡步 发 , 王忠
( 州 大 学 机 械 工 程 及 自动 化 学 院 ,福 建 福 州 3 00 ) 福 50 2
摘要 ;在人脸 识别 中 ,高维 、小样 本是 一个 问题 。对此 ,提 出 了一种基 于 Ga o 波与径 向基 函数 ( B )神经 b r小 RF
具 有较 强 的 空 间位 置 和 方 向选 择 性 , 且 能 够 捕 捉 对 应 于 空 间 和 频率 的局 部 结构 信 息 ; b r 并 Ga o 滤波 器 对 于 图像 的亮 度 和 对 比度 变 化 以及 人 脸 姿 态 变 化 具有 较 强 的健 壮 性 , 并且 它 表 达 的是 对 人 脸 识 别最 为有
维普资讯
第1 3卷 第 1 期 20 年 2 月 08
文章 编 号 : 1 0 .2 9( 0 8 0 - 0 3 0 0 70 4 2 0 ) 1 7 -6 0
电路 与 系 统 学 报
J 0URNAL OF CI RCUI TS AND YS M S S TE
中 图分类号 ;T 3 l P 9
文献标 识码 :A

引 言
人 脸 识 别 是 人类 最 杰 出 的认 知 能力 之 一 ,让 计 算 机 具 有 人 的 智 能 , 使 它 可 以 象人 类 一 样 辨 认 人 ,

直 是 众 多 计 算 机科 学工 作 者追 求 的 目标 。人 脸 识 别 作 为 一 种 应 用 前 景 十 分广 泛 的 身份 鉴 别 方 法 ,是 人 脸 图像 由于 受光 照 、表 情 以及 姿 态 等 因素 的影 响 , 同一 个 人 的 脸像 矩 阵 差 异也 比较 大 ,人 脸 识
最好 的选 择 。 j
本 文 充 分 利 用 人 脸 特 征 矢 量 的相 对 分 布 信 息 ,提 出 了一 种 新 的聚 类 初 始 化 方 法 ,能 使RB 网络 逼 F 近 于 Mo d 准 则下 的最 优 结 构 ,从 而 保 证 该 网络 具 有 较 好 的 泛化 能 力 。由于 在 隐层 参 数 固 定 的 条件 下 , oy
相关文档
最新文档