一种基于核主成分分析的人脸识别方法

一种基于核主成分分析的人脸识别方法
一种基于核主成分分析的人脸识别方法

河北科技师范学院学报 第22卷第3期,2008年9月

Journal of Hebei Nor mal University of Science&Technol ogy Vol.22No.3Sep te mber2008

一种基于核主成分分析的人脸识别方法

杨 绍 华

(宁夏大学数学计算机学院,宁夏银川,750021)

摘要:针对主成分分析(PC A)算法中存在不能提取非线性特征的问题,提出了利用KPCA提取图像特征,最近邻法分类的人脸识别改进方法。基于ORL数据库的相关实验表明,这样的系统能够取得比传统PC A更好的识别性能。

关键词:人脸识别方法;核主成分分析;主成分分析

中图分类号:TP391 文献标志码:A 文章编号:167227983(2008)0320045204

人脸识别是模式识别领域一个重要的研究方向,与指纹、语言、虹膜等其他人体生物特征相比,人脸识别更加直接、友好,在身份识别、安检监控、视频会议领域具有广阔的应用前景。主成分分析(Princi2 pal Component Analysis)[1,2]是人脸图像识别中经典的线性特征提取方法,其通过对原始样本的协方差矩阵进行分解,选取前面R最大特征值所对应的特征向量组成最优投影矩阵,通过将样本数据在最优投影矩阵上投影,将其映射到主成分空间中,达到数据压缩和去除样本之间相关性的目的。目前,这种方法仍广泛应用于人脸识别等模式识别问题中[3~5]。

然而,PCA算法是一种线性方法,它无法揭示出人脸图像中的非线性特征。PCA从特征最大的角度而不是最优角度出发进行特征提取,因而这些非线性特征对识别可能也是有益的。此外,线性方法只能处理具有属性值的数据,在很多应用中可能不知道数据的属性值,而只知道相互关系(相似或不相似),线性方法无法直接应用于这样的场合[6]。针对上述特点,笔者在人脸特征提取过程中首先通过核函数映射,将原始样本映射到核函数空间中,利用KPCA方法[7,8]提取特征,最后最近邻法作为分类器进行分类识别。在ORL和Y ALE数据库上的相关实验表明,该方法较传统PCA有着更好的识别性能。

1 PCA提取特征的原理

设x

i ∈R n(i=1,2,…,m)是M个n维的观测样本,X=(x

1

,x2,…,x M)T为观测样本矩阵,其总体样

本的均值为:

μ=1

M ∑

M

i=1

x i(1)

在此用(x

i

-μ)表示样本均值,这里的讨论是以样本的零均值情况进行的。样本集的协方差矩阵定义为:

C x=E[(x i-μ)(x i-μ)T]

1

M

∑[(x

i

-μ)(x i-μ)T](2)

因为C

x 是实对称的,找到一组r个标准正交特征向量总是可能的。令λ

i

,i=1,2,…,r表示C x的r

个非零特征根,且按照顺序λ

1≥λ

2

≥…λ

r

排列,这些特征值相对应的特征向量为u

i

,i=1,2,…,r,构成

一个n×r矩阵

U=[u1,u2,…,u r](3)那么,对任何一个观测样本x∈R n来讲,基于投影矩阵U的投影系数是

y=U T x(4)

基金项目:宁夏大学自然科学基金资助项目(项目编号:ZR200716)。

收稿日期:2008206203;修改稿收到日期:2008207216

2 基于核方法的特征提取

许多利用机器学习的数据分析任务中,

都需要对数据进行合适的表示或描述。一个有效的数据表示能够使数据的内在结构更清晰、减少数据的维数,以利于进一步计算。KPCA (核主成分分析)的基本思想是通过一个非线性映射,把输入数据映射到一个高维的特征空间,在特征空间上进行线性主成分分

析[7]。设输入数据X k 被映射为φ(X k ),假设它们已经被中心化即满足如下条件:

∑N

k =1φ(X k )=0(5)

其中,X k 是N 维输入训练样本,φ(X k )是变换后的训练样本。映射后训练样本的协方差矩阵C 为:

C =1N ∑N j =1

φ(X j )φ(X j )T (6)求解该协方差的特征方程:

λV =CV (7)

根据再生核理论,特征向量V 一定位于由φ(X 1)…

φ(X N )长成的空间内,即V 可以由φ(X 1)…φ(X N )的线性组合表示:

V =∑N i =1αi φ(X i )(8)

其中α1,…,αN 为常数。

定义一个N ×N 的矩阵K,K ij =φ(X i )T φ(X i )

(9)

K 称为核矩阵,将公式(6),(8),(9)代入(7)式得:K

α=N λα(10)这样,求解式(7)的特征向量V 的问题就转换为求解(10)式中特征向量α。由式(9)得知,核矩阵K 是对称的、半正定方阵,其具有非负的特征向量。通过求解特征方程(10)得到一组非零特征值λj 以及对应满足归一化条件

(αj ,αj )=1(11)

的特征向量αj (j =1,…,N ′)(N ′≤N )。根据(8)式得到特征空间上的投影主分量V j (j =1,…,N ),设X

是测试样本,那么X 在投影主分量V j (j =1,…,N )上的投影为:

(V j )T <(X )=∑N j =1a j i <(X i )T <(X )=∑N j =1

a j i K (X i ,X )(12)于是将R f 空间的PCA 问题转换为R f 空间的内积问题,在求解过程中只要知道K (X i ,X )的表达式

即可,K (X i ,X )称为核函数,核函数的选择必须满足Mercy 定理,常用的核函数有

(1)线性函数 K (X i ,X )=

(2)二次核函数 K (X i ,X )=(+1)

(3)多项式核函数 K (X i ,X )=[+c]d

,d =1,2,…,当d =1,c =0时该函数为线性核函数。(4)Sig moid 核函数 K (X i ,X )=tanh [v (X ?X i )+c ]

(5)高斯径向基函数 K (X i ,X )=exp (-q ‖X -X i ‖2

)图1 ORL 人脸库部分图像

3 计算机仿真算法描述与实验结果

3.1 实验参数描述

本次实验是在I ntel Core T M Duo Pr ocess or T5500

1.66,内存512M ,W indows xp s p2机器上利用Mat 2

lab 7.0编程实现的。使用ORL 人脸数据库作为实

验数据集。ORL 数据库有40个人的人脸图像,每人

有10幅112×92像素的脸部图像,256级灰度。其64河北科技师范学院学报 22卷 

中人的脸部表情和脸部细节有着不同程度的变化,如笑或不笑,眼睛睁或闭,戴或不戴眼镜等;人脸姿态也有相当程度的变化,深度旋转和平面旋转可达20°;图1是ORL 人脸库的部分图像。

3.2 算法描述

核函数方法首先采用非线性映射将原始数据由数据空间映射到特征空间,进而在特征空间进行相应的线性变换,由于运用了非线性映射,且这种非线性映射往往是非常复杂的从而大大增加了非线性数据的处理能力,在实际应用中核函数的选择及相关参数的确定是问题的关键和难点所在,本次研究选择的是常用的多项式核函数,算法如图3所示

图2 基于核主成分分析的算法框图

训练阶段:

读入训练样本图像,构建人脸图像数据库,然后选择多项式核函数进行训练样本到核函数空间的映射,然后在核空间中实施PCA 方法,这样就将线性空间中的非线性问题转换为非线性空间中的线性问题来进行处理。选择合适的主成分分量维数构建核空间中的最优投影矩阵;训练样本在该投影矩阵上进行映射,获得训练样本的特征系数。

测试阶段:

读入测试样本图像,并在训练阶段产生的核空间最优投影矩阵上进行映射,获得测试样本的特征系数。分类阶段:

选择最近邻分类器进行分类,最近邻分类器的原理是通过计算测试样本特征系数到每个训练样本特征系数的距离,确定离测试样本最近的那个样本的类别为测试样本的类别。其中,度量距离选用的是欧氏距离。

3.3 实验与实验结果

实验1 多项式阶数d 的变化对识别率的影响。

多项式核函数K (X i ,X )=[〈X ?X i >+c ]d ,d =1,2,…中取多项式偏差c =1,需要调整的参数是多项式阶数d 。实验1比较了多项式阶数分别取1到7时,ORL 人脸数据库上识别性能的变化。其中每类人脸选取前5个作为训练样本,剩下5个作为测试样本。为了观察多项式阶数变化对识别性能的影响,主分量维数固定取值为32,表1给出了实验结果。

表1 ORL 数据库上不同多项式阶数下识别性能

多项式阶数d

训练时间/s 错误数正确数识别率/%测试时间/s 1

8.521518592.504.722

8.441518592.504.723

8.501618492.004.704

8.551718391.504.705

8.581818291.004.726

8.611918190.504.7578.552417688.004.72

74 3期 杨绍华 一种基于核主成分分析的人脸识别方法

实验2 主分量维数的变化对识别性能和识别时间的影响。

KPCA实际上是PCA的一种改进算法,即在核映射空间中实施PCA方法。因此,KPCA算法中选择不同的主分量数对人脸特征的贡献也是不同的。图3给出了主分量数变化过程中,KPCA算法和PCA 算法识别性能的变化比较;图4给出了主分量数变化过程中,KPCA算法和PCA算法识别时间的变化比较。实验中取每类人脸前5副图像进行训练,剩下的5副进行测试,KPCA中多项式阶数d=2。

表1结果表明,随着多项式阶数的增加,识别率并没有明显增加,反而随着多项式阶数的增加有所下降。其中算法在多项式阶数为1(线性情况)和多项式阶数为2和3(非线性情况)时的识别性能最好。这是因为通过核空间的映射后实施PCA方法,能够获得更多有益于样本进行分类的非线性特征,所以识别率较高。但随着多项式阶数的增加,映射过程变得更为复杂,然而复杂的核函数映射并没带来更多有利于人类的非线性特征,反而带来了干扰K NN正确分类的因素,当多项式阶数大于6时这种不利更为明显。

图3结果显示,随着主分量数的增加识别率呈明显增加趋势。因为排列在前面的主分量对原始人脸图像的表征意义最大,所以当主分量数从1到10的变化过程中,算法的识别率变化明显。但当主分量数达到一定的数量后,其对人脸正确分类的贡献就不再明显,这样在具体的识别问题中只需取前面个别的主分量数就能很好的表征人脸,起到很好的数据降维目的。同时也注意到由于KPCA能够提取到有益于人脸正确分类的非线性特征,因此有着比PCA更好的识别性能。图4结果表明,PCA方法中随着主分量的增加,识别时间呈较明显的上升趋势,KPCA算法中即使核映射过程增加了系统的开销,但还是表现出了较PCA更好的识别效率,在人脸识别这类实时性和准确性要求较高的应用中具有更好的实用价值。

图3 主分量数对识别性能的影响 图4 主分量数对识别时间的影响笔者通过分析PCA中存在不能提取图像中非线性特征的问题,提出利用KPCA进行特征提取(即通过核函数方法将原始样本空间映射到核空间中实施线性PCA),最近邻法进行分类的人脸识别方法,在ORL人脸数据库上表现出较传统PCA更好的识别性能,同时也注意到实验中相关参数的调整是通过实验来获得的。另外,虽然KPCA方法的识别效率较传统PCA更好,但随着训练样本的增加核函数映射过程会带来更大的系统开销,降低识别的效率,如何自适应的选择参数和有效降低数据维数提高识别效率是进一步要研究的问题。

参考文献:

[1] T URK M,PE NT LAND A.Eigenfaces f or Recogniti on[J].Journal of Cognitive Neur oscience,1991,3(1):71286.

[2] PETER N B,JOAO P H,DAV I D J K.Eigenfaces vs Fisherfaces:Recogniti on using class s pecific linear p r ojecti on[J].

I EEE Trans on Pattern AnalMachine I ntell,1997,19(7):7112720.

[3] 杨健,杨静宇.具有统计不相关性的图像投影鉴别分析及人脸识别[J].计算机研究与发展,2003,40(3):4472452.

(下转至第62页)

[8] 王汝成.园林规划设计[M ].北京:中国建筑工业出版社,1999.

[9] 赵宁,李兵营.孟家滩花园居住小区规划设计[J ].青岛理工大学学报,2007,28(1):43247.

作者简介:母传伟(19702),男,高级工程师、注册城市规划师。主要研究方向:城市规划、总图运输、景观设计。

(责任编辑:朱宝昌)

Bu ild i n g Har m on i ous Ne i ghborhood Env i ronm en t

———Q i n huangdao Sh ijiji a yuan Ne i ghborhood Pl ann i n g Concept

MU Chun 2wei 1,ZHANG L i 2ju

2(1Cap ital Engineering &Research I ncor porati on (Q inhuangdao )Co .L i m ited,Planning Centre,

2A rchitectural Design Centre,Q inhuangdao Hebei,066001,China )

Abstract:The paper discusses the p lanning concep t of Q inhuangdao Shijijiayuan based on the p ractice of o 2verall layout,architectural design,and landscape design .This concep t e mphasizes “har moni ous co 2existence of peop le,building and envir on ment ”,with an ai m t o build har moni ous and war m neighborhood envir on ment .Key words:har mony;Shijijiayuan;overall layout;landscape design

(上接第48页)

[4] Y ANG J,ZHANG D,Y ANG J Y .T wo 2di m ensi onal PCA:A ne w App r oach t o Appearance 2based Face Rep resentati on and

Recogniti on[J ].I EEE Trans on Pattern AnalM achine I ntell,2004,26(1):1312137.

[5] 陈伏兵,陈秀宏,张生亮,等.模块二维主成分分析———人脸识别新方法[J ].计算机工程,2006,32(14):1792180,

183.

[6] ZHANG D Q,CHE N S C,ZHOU Z H.Non 2negative matrix fact orizati on on kernels[C ]//Pr oceedings of the 9th pacific ri m

internati onal conference on artificial intelligence (PR I CA I’06),Guilin China:LNA I 4099,2006:4042412.

[7] SCH O ??

LK OPF B,S MOLA A,ROBERTMULLER K .Nonlinear component analysis as a kernel eigenvalue p r oble m [J ].Neu 2

ral computer,1998(10):129921319.

[8] M U ??LLER K R,M I K A S,R A ??TSCH G,et al .An I ntr oducti on t o Kernel 2Based Learning A lgorith m s[J ].I EEE Trans on Neu 2

ral Net w orks,2001,12(2):1812201.作者简介:杨绍华(19782),男,讲师,硕士。主要研究方向:模式识别,图形图像处理与多媒体技术。

(责任编辑:朱宝昌)

A Face Recogn iti on M ethod Ba sed On Kernel 2PCA

Y ANG Shao 2hua

(School ofMathe matics and Computer Science,N ingxia University,Yin chuan N ingxia,750021,China )Abstract:T o s olve the p r oble m s that Princi pal Component Analysis (PCA )can not extract nonlinear charac 2ter,this paper p resents an i m age recogniti on method .Thismethod makes use of Kernel 2PCA t o extract the fea 2ture inf or mati on of i m ages and the NN (Nearest Neighbor )is selected t o recognize the character .The experi 2ment based on ORL 2Database showed that this method could get better perf or mance than traditi onal PCA meth 2ods .

Key words:face recogniti on;kernel PCA;PCA

人脸识别实验报告

人脸识别——特征脸方法 贾东亚12346046 一、实验目的 1、学会使用PCA主成分分析法。 2、初步了解人脸识别的特征法。 3、更熟练地掌握matlab的使用。 二、原理介绍 1、PCA(主成分分析法介绍) 引用一个网上的例子。假设有一份对遥控直升机操作员的调查,用x1(i)表示飞行员i的 飞行技能,x2(i)表示飞行员i喜欢飞行的程度。通常遥控直升飞机是很难操作的,只有那些 非常坚持而且真正喜欢驾驶的人才能熟练操作。所以这两个属性x1(i)和x2(i)相关性是非常强的。我们可以假设两者的关系是按正比关系变化的。如下图里的任意找的向量u1所示,数据散布在u1两侧,有少许噪声。 现在我们有两项数据,是二维的。那么如何将这两项变量转变为一个来描述飞行员呢?由图中的点的分布可知,如果我们找到一个方向的U,所有的数据点在U的方向上的投影之 和最大,那么该U就能表示数据的大致走向。而在垂直于U的方向,各个数据点在该方向的投影相对于在U上的投影如果足够小,那么我们可以忽略掉各数据在该方向的投影,这样我们就把二维的数据转化成了在U方向上的一维数据。 为了将u选出来,我们先对数据进行预处理。先求出所有数据的平均值,然后用数据与平均值的偏差代替数据本身。然后对数据归一化以后,再代替数据本身。 而我们求最大的投影和,其实就是求各个数据点在U上的投影距离的方差最大。而XT u 就是投影的距离。故我们要求下式的最大值: 1 m ∑(x(i)T u)2=u T( 1 m ∑x(i)x(i)T m i=1 ) m i=1 u 按照u是单位向量来最大化上式,就是求1 m ∑x(i)x(i)T m i=1的特征向量。而此式是数据集的 协方差矩阵。

人脸识别主要算法原理

人脸识别主要算法原理 主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果; 2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。 1. 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧 面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。

可变形模板法可以视为几何特征方法的一种改进,其基本思想是: 设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。 2. 局部特征分析方法(Local Face Analysis) 主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识别方法。这种方法在实际应用取得了很好的效果,它构成了FaceIt人脸识别软件的 基础。 3. 特征脸方法(Eigenface或PCA)

人脸识别技术的主要研究方法

1、绪论 人脸识别是通过分析脸部器官的唯一形状和位置来进行身份鉴别。人脸识别是一种重要的生物特征识别技术,应用非常广泛。与其它身份识别方法相比,人脸识别具有直接、友好和方便等特点,因而,人脸识别问题的研究不仅有重要的应用价值,而且在模式识别中具有重要的理论意义,目前人脸识别已成为当前模式识别和人工智能领域的研究热点。本章将简单介绍几种人脸识别技术的研究方法。 关键词:人脸识别 2、人脸识别技术的主要研究方法 目前在国内和国外研究人脸识别的方法有很多,常用的方法有:基于几何特征的人脸识别方法、基于代数特征的人脸识别方法、基于连接机制的人脸识别方法以及基于三维数据的人脸识别方法。人脸识别流程图如图2.1所示: 图2.1人脸识别流程图 3、基于几何特征的人脸识别方法 基于特征的方法是一种自下而上的人脸检测方法,由于人眼可以将人脸在不此研究人员认为有一个潜在的假设:人脸或人脸的部件可能具有在各种条件下都不会改变的特征或属性,如形状、肤色、纹理、边缘信息等。基于特征的方法的目标就是寻找上述这些不变特征,并利用这些特征来定位入脸。这类方法在特定的环境下非常有效且检测速度较高,对人脸姿态、表情、旋转都不敏感。但是由于人脸部件的提取通常都借助于边缘算子,因此,这类方法对图像质量要求较高,对光照和背景等有较高的要求,因为光照、噪音、阴影都极有可能破坏人脸部件的边缘,从而影响算法的有效性。 模板匹配算法首先需要人TN作标准模板(固定模板)或将模板先行参数化(可变模板),然后在检测人脸时,计算输入图像与模板之间的相关值,这个相关值通常都是独立计算脸部轮廓、眼睛、鼻子和嘴各自的匹配程度后得出的综合描述,最后再根据相关值和预先设定的阈值来确定图像中是否存在人脸。基于可变模板的人脸检测算法比固定模板算法检测效果要好很多,但是它仍不能有效地处理人脸尺度、姿态和形状等方面的变化。 基于外观形状的方法并不对输入图像进行复杂的预处理,也不需要人工的对人脸特征进行分析或是抽取模板,而是通过使用特定的方法(如主成分分析方法(PCA)、支持向量机(SVM)、神经网络方法(ANN)等)对大量的人脸和非人脸样本组成的训练集(一般为了保证训练得到的检测器精度,非人脸样本集的容量要为人脸样本集的两倍以上)进行学习,再将学习而成的模板或者说分类器用于人脸检测。因此,这也是j 种自下而上的方法。这种方法的优点是利用强大的机器学习算法快速稳定地实现了很好的检测结果,并且

基于LBP的人脸识别算法研究

基于LBP的人脸识别算法研究 一、应用背景 随着社会的发展以及技术的进步,人们对快速、高效的自动身份验证的要求日益迫切,生物识别技术在科研领域得到了极大的重视和发展。在人与人的接触中,人脸所包含的视觉信息占据了重要地位,它无疑是区分人与人之间差异的最重要特征之一。相对于指纹、虹膜、掌纹、步态、笔迹、声纹等生物特征,利用人脸来识别具有不可比拟的优势:操作隐蔽,特别适用于安全、监控、和抓逃工作;非接触式采集,无侵犯性,容易接受;方便、快捷、强大的实时追踪能力;符合人类识别习惯,交互性强;应用摄像头即可完成图像采集,设备成本较低。人脸识别属于计算机科研领域的一项热门技术,它是一种基于生物特征的识别技术,利用计算机从图像或图像序列中检测出人脸,并判断其身份。 人脸识别目前主要运用在如下三个方面: 第一,刑侦破案方面。例如,公安部门获得案犯的照片之后,可以利用人脸识别技术在存储罪犯照片的数据库中找出最相像的人,即嫌疑犯。 第二,证件验证方面。如身份证、驾驶执照以及其他很多证件上都有照片,现在这些证件多是人工验证的,如果应用人脸识别技术,这项任务就可以交给机器去完成,从而实现自动化智能管理。 第三,人口控制方面。此应用范围很广,例如可以设在楼宇单位或者私人住宅入口的安全检查,也可以是计算机系统或者情报系统等的入口检查。 世界上很多国家都在积极地开展对人脸识别技术的相关研究,不同的研究机构或研究人员按照不同的划分标准,对人脸识别的研究内容的分类不尽相同。在此处按其所研究得具体技术的范围可以大致将人脸识别分为如下四个方面的内容来进行阐述: (1)人脸检测,主要的方法有:基于轮廓(或肤色等)信息人脸检测方法,基于Adaboost 算法人脸检测方法,基于支持向量机(SVM)人脸检测方法以及基于神经网络的人脸检测方法等; (2)人脸特征描述与提取即特征提取,主要方法:基于局部二值模式纹理特征提取方法,基于人脸几何特征的特征提取方法,还有基于主成分特征(PCA)特征提取方法,基于独立元特征的特征提取算法,如Gabor等,还有2D 和3D 形变模型方法等; (3)人脸特征降维,主要方法:线性降维方法如主成分分析PCA和LDA (Linear Discriminate Analysis) 等发展到非线性降维方法如局部线性嵌入(LLE) 、等距嵌入

基于主成分分析人脸识别

应用统计学课程设计 基于主成分分析和人工神经网络的人脸识别 姓名:崔卓须 学 号: 3101301308 姓 名: 姚顺兰 学 号: 3101301304 姓 名: 陈晓强 学号:3101301230 专业:信息与计算科学 指导教师:贺文武(博士) 2012年12月28日

目录 1. 人脸识别概述 (2) 1.1选题背景与意义 (2) 1.2人脸检测的基本概念 (2) 1.3人脸检测问题的分类和挑战性 (2) 2. 模型的建立 (3) 2.1主成分分析 (3) 2.11计算特征根矩阵 (4) 2.12计算主成分 (4) 2.2人工神经网络 (4) 2.21建立人工神经元 (4) 2.22神经网络工作 (5) 2.23分析结果 (6) 3. 优缺点分析 (7) 3.1优点 (7) 3.2缺点 (7) 4. 参考文献 (7) 5. 附件 (8)

摘要 人脸识别技术作为生物特征识别领域中一种基于生理特征的识别技术,是以通过计算机提取人脸的特征,并根据这些特征进行身份验证的一种技术。人脸与人体的其他生物特征一样与生俱来,它们所具有的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提;同其他生物特征识别技术相比,人脸识别技术具有操作简单、结果直观、隐蔽性好的优越性。因此,人脸识别在信息安全、刑事侦破、出入口控制等领域具有广泛的应用前景。 本文对于人脸识别模型的建立基于两个部分: 第一部分,基于主成分分析的特征脸法,通过选择ORL人脸图像库中的110 幅人脸作为训练样本集Ti|i =1,…,110:%计算其独立主成分(涵盖90%勺信息),实现对信息进行压缩处理,从而用主成分来进行人脸判别。 第二部分,用人工神经网络来进行人脸判别。建立输入人脸照片主成分输出人脸判别结果的神经网络,从而实现人脸的识别。 关键字:人脸识别,主成分分析,人工神经网络,特征脸

人脸识别实验报告.docx

人脸识别——特征脸方法 贾东亚12346046 一、实验目的 1、学会使用PCA主成分分析法。 2、初步了解人脸识别的特征法。 3、更熟练地掌握matlab的使用。 二、原理介绍 1、PCA(主成分分析法介绍) 引用一个网上的例子。假设有一份对遥控直升机操作员的调查,用x1(i)表示飞行员i 的 飞行技能,x2(i)表示飞行员i喜欢飞行的程度。通常遥控直升飞机是很难操作的,只有那些非常坚持而且真正喜欢驾驶的人才能熟练操作。所以这两个属性x1(i)和x2(i)相关性是非常强的。我们可以假设两者的关系是按正比关系变化的。如下图里的任意找的向量u1所示,数据散布在u1两侧,有少许噪声。 现在我们有两项数据,是二维的。那么如何将这两项变量转变为一个来描述飞行员呢?由图中的点的分布可知,如果我们找到一个方向的U,所有的数据点在U的方向上的投影之和最大,那么该U就能表示数据的大致走向。而在垂直于U的方向,各个数据点在该方向的投影相对于在U上的投影如果足够小,那么我们可以忽略掉各数据在该方向的投影,这样我们就把二维的数据转化成了在U方向上的一维数据。 为了将u选出来,我们先对数据进行预处理。先求出所有数据的平均值,然后用数据与平均值的偏差代替数据本身。然后对数据归一化以后,再代替数据本身。 而我们求最大的投影和,其实就是求各个数据点在U上的投影距离的方差最大。而X T u 就是投影的距离。故我们要求下式的最大值: 1mi=1m(x(i)Tu)2=uT(1mi=1mx(i)x(i)T)u 按照u是单位向量来最大化上式,就是求1mi=1mx(i)x(i)T的特征向量。而此式是数据集的协方差矩阵。 在实际应用中,我们不止面临二维的数据。因此不能使用几何的形式呈现,但原理也是一样。就是找到一组相互正交的单位向量uk,然后根据贡献率考虑选择其中的部分作为考

基于主成分分析的人脸识别的主要步骤和方法

技术平台 5 2017年第4期排故流程:检查左发进气滤、电嘴、磁电机外定时状况均良好,汽化器燃油清洁,空气盒状况良好。随后拆卸汽化器,发现在汽化器风门处有部分水迹,汽化器分解检查状况良好。(图4) 原因分析:当气流流过文氏管喉部时,温度会大幅度降低,且燃油汽化需要热量,也会降低局部温度,如果此时空气很湿润,极易在文氏管喉部处形成局部结冰[5]。当汽化器文氏管喉部结冰时,文氏管截面积减小,进气量减少,发动机功率下降,随着结冰的进一步加剧, 最终导致发动机停车。 图4?文氏管结冰积水图 3.3?汽化器本体裂纹或漏油 汽化器本体裂纹或漏油故障一般都是在各级定 检中发现。自飞机引进到目前为止,尚未发生因为汽化器本体裂纹或漏油导致的飞机空中或地面停车。但该型故障会导致燃油消耗较高、发动机失火等危险情况,也应引起重视。 关于汽化器的故障还有很多,比如因为启动注油过多造成的发动机失火、汽化器贫富油调节不当造成掉转不符合规定等,由于篇幅有限,在这里不再赘述。4 维护建议 飞机发动机是飞机的心脏,汽化器的正常工作则是发动机持续稳定运行的必要条件。在PA44-180飞机HA-6型汽化器的日常维护中,维护人员应注意如下几点:(1)在对发动机慢车转速或混合比进行调节前,应熟知汽化器性能;调节时,应依据对慢车转速的调整,相应地调节混合比使之匹配;在外界气温变化较大时,应注意随外界气温的高低相应地调高或调低混合比。(2)日常维护过程中,应加强对汽化器空气盒盖板毡垫状况的检查,防止因毡垫脱落造成节气门堵塞而导致发动机停车。在气温较高的季节,建议加大对汽化器加温通道以及空气盒的吹尘工作,防止外来物进入汽化器,污染燃油或堵塞燃油管路。(3)汽化器的工作原理是油气混合后再进入汽缸,这一特性导致汽化器容易在文氏管喉部结冰,故飞行人员在发现气温骤降或空气湿度较大时,应果断开启汽化器加温功能,防止因汽化器结冰导致的发动机停车。 参考文献:[1]Piper.PA44-180?Maintainance?Manual.[2]Lycoming.Lycoming?Engine?Overhaul?Manual.[3]Lycoming.Lycoming?Engine?Operator?Manual.[4]Flyer.Lycoming?Flyer?Key?Reprints.[5]Volare.HA-6?Carburettor?Operator?Manual.[6]M.M?马斯莲尼科夫.M.C?拉里蒲特?航空活塞发动[M]. 基于主成分分析的人脸识别的主要步骤和方法 许?萌 (西北工业大学,陕西?西安?710129) 摘?要:基于主成分分析的人脸识别之所以得到较为广泛的应用,主要是因为它把一幅人脸图像看成是一维的样本向量,从而无 须考虑人脸五官的位置和形状,也不需要对人脸进行复杂的图像提取和理解。K-L 变换指出,对于一组样本向量,利用正交变换以及在不同层网络协议的加、解密应用,如IPSec、TLS/SSL、PGP 等。关键词:人脸识别;样本向量;基本方法 1?样本输入 输入部分由证件像片的输入和持证人脸像的输入两步组成:第一步是证件像片的输入可采用近距离摄像或采用扫描仪获得,只要求摄像机或扫描仪具有较高分辨率。因为较高分辨率意味着图象具有更多的细节,可供提取的特征更丰富,持证人脸像的输入。在少数情况下,对持证人可以象在照像馆那样以固定角度、强光照射下进行标准成像,如违法分子或嫌疑犯 这是最理想的情形,第二步在大多数情况下,如在海关边防等部门,采用上面强迫手段是不可能的,只能考虑在自然光下采用某种与证件像片的不一致以及光照条件的变化,在这种情况下,最好是采用某种提示性的方法使得持证人不自觉地对准隐藏的摄像机,以便尽可能获得一些摄像角度与证件像片一致的人脸图

人脸识别技术的应用背景及研究现状

人脸识别技术的应用背景及研究现状 1.人脸识别技术的应用 随着社会的不断进步以及各方面对于快速有效的自动身份验证的迫切要求,生物特征识别技术在近几十年中得到了飞速的发展。作为人的一种内在属性,并且具有很强的自身稳定性及个体差异性,生物特征成为了自动身份验证的最理想依据。当前的生物特征识别技术主要包括有:指纹识别,视网膜识别,虹膜识别,步态识别,静脉识别,人脸识别等。与其他识别方法相比,人脸识别由于具有直接,友好,方便的特点,使用者无任何心理障碍,易于为用户所接受,从而得到了广泛的研究与应用。除此之外,我们还能够对人脸识别的结果作进一步的分析,得到有关人的性别,表情,年龄等诸多额外的丰富信息,扩展了人脸识别的应用前景。当前的人脸识别技术主要被应用到了以下几个方面:(1)刑侦破案公安部门在档案系统里存储有嫌疑犯的照片,当作案现场或通过其他途径获得某一嫌疑犯的照片或其面部特征的描述之后,可以从数据库中迅速查找确认,大大提高了刑侦破案的准确性和效率。 (2)证件验证在许多场合(如海口,机场,机密部门等)证件验证是检验某人身份的一种常用手段,而身份证,驾驶证等很多其他证件上都有照片,使用人脸识别技术,就可以由机器完成验证识别工作,从而实现自动化智能管理。 (3)视频监控在许多银行,公司,公共场所等处都设有24小时的视频监控。当有异常情况或有陌生人闯入时,需要实时跟踪,监控,识别和报警等。这需要对采集到的图像进行具体分析,且要用到人脸的检测,跟踪和识别技术。 (4)入口控制入口控制的范围很广,既包括了在楼宇,住宅等入口处的安全检查,也包括了在进入计算机系统或情报系统前的身份验证。 (5)表情分析根据人脸图像中的面部变化特征,识别和分析人的情感状态,如高兴,生气等。此外,人脸识别技术还在医学,档案管理,人脸动画,人脸建模,视频会议等方面也有着巨大的应用前景。 2.人脸识别技术在国外的研究现状 当前很多国家展开了有关人脸识别的研究,主要有美国,欧洲国家,日本等,著名的研究机构有美国MIT的Media lab,AI lab,CMU的Human-Computer Interface Institute,Microsoft Research,英国的Department of Engineering in Uni versity of Cambridge等。综合有关文献,目前的方法主要集中在以下几个方面:(1)模板匹配 主要有两种方法,固定模板和变形模板。固定模板的方法是首先设计一个或几个参考模板,然后计算测试样本与参考模板之间的某种度量,以是否大于阈值来判断测试样本是否人脸。这种方法比较简单,在早期的系统中采用得比较多。但是由于人脸特征的变化很大,很难得到有效的模板来表示人脸的共性。变形模板在原理上与固定模板相同,但其中包含一些非固定的元素,一种方法是手工构造参数化的曲线和曲面以表征人脸中的某些非固定特征,如眼睛,鼻子和嘴

人脸特征提取与识别(参考)

本科生毕业设计(论文)文献综述题目:人脸特征提取与识别 姓名: 学号: 学院: 专业: 年级: 指导教师:(签名) 系主任(或教研室主任):(签章)

目录 1 前言 (1) 2 人脸特征提取与识别方法 (1) 2.1 基于几何特征的方法 (1) 2.2 基于特征脸的方法 (2) 2.3 局部特征分析LFA方法 (3) 2.4 基于弹性模型的方法 (4) 2.5 神经网络方法 (4) 2.6 其他方法 (5) 3 总结 (5) 致谢: (6) 参考文献: (6)

人脸特征提取与识别 1前言 近年来,Internet和多媒体技术飞速发展,多媒体(包括图像、视频等)数据规模急剧膨胀。为了快速、准确地找到感兴趣的图像或视频,人们提出了基于内容的图像检索(content-based image retrieval,简称CBIR)技术,研究让计算机对图像进行分类和检索的算法。CBIR涉及图像内容表示、相似性度量、高维索引技术等方面。[1]图像内容的表示是需要首先解决的问题。为了实现对图像内容的存取、访问和检索,MPEG-7提出了图像内容描述子的概念,例如颜色描述子、纹理描述子、形状描述子等。 图像颜色内容通常用颜色直方图来表示,纹理特征以纹理模式区分图像,形状特征用于包含特定形状对象的图像检索。颜色直方图(或称为颜色谱)因其简单、有效的性能而在大多数CBIR系统中得到应用,但是颜色直方图对纹理图像的检索效果不好。不同的纹理图像可能有非常相似的颜色直方图。 所谓图像纹理,它反映的是图像的一种局部结构化特征,具体表现为图像像素点某邻域内像素点灰度级或者颜色的某种变化,而且这种变化是空间统计相关的,它由纹理基元和基元的排列两个要素构成。纹理分析方法有统计方法、结构方法和基于模型的方法。 2人脸特征提取与识别方法 人脸识别本质上是三维塑性物体二维投影图像的匹配问题,它的困难体现在:(1)人脸塑性变形(如表情等)的不确定性;(2)人脸模式的多样性(如胡须、发型、眼镜、化妆等); (3)图像获取过程中的不确定性(如光照的强度、光源方向等)。识别人脸主要依靠人脸上的特征。也就是说依据那些在不同个体上存在的较大差异而对同一个人则比较稳定的度量。由于人脸变化复杂,因此特征表述和特征提取十分困难。 在对人脸图像进行特征提取和分类之前一般需要做几何归一化和灰度归一化。几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大小,灰度归一化是指对图像进行光照补偿等处理,光照补偿能够一定程度地克服光照变化的影响而提高识别率。 2.1 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸干差万别,因此对这些部件的形状和结构关系的几何描述,可以作为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首

基于PCA的人脸识别方案

基于PCA的人脸识别方案 摘要:分析了基于主成分分析方法(PCA)的人脸识别特点,并对其实现方法进行了分析和仿真,结果表明方案比较完整的实现了人脸识别的功能,对于实际应用也有参考价值。 关键词:PCA 人脸识别分析 一概述 生物特征识别技术所研究的生物特征包括人脸、指纹、手掌纹、掌型、虹膜、视网膜、静脉、声音(语音)、体形人脸识别、红外温谱、耳型等,相应的识别技术就有人脸识别、指纹识别、掌纹识别、虹膜识别、视网膜识别、静脉识别、语音识别(用语音识别可以进行身份识别,也可以进行语音内容的识别,只有前者属于生物特征识别技术)、体形识别、键盘敲击识别、签字识别等。人脸识别特指利用分析比较人脸视觉特征信息进行身份鉴别的计算机技术。人脸识别是一项热门的计算机技术研究领域,可以将人脸明暗侦测,自动调整动态曝光补偿,人脸追踪侦测,自动调整影像放大;它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。人脸识别的优势 人脸识别的优势在于其自然性和不被被测个体察觉的特点。所谓自然性,是指该识别方式同人类(甚至其他生物)进行个体识别时所利用的生物特征相同。例如人脸识别,人类也是通过观察比较人脸区分和确认身份的,另外具有自然性的识别还有语音识别、体形识别等,而指纹识别、虹膜识别等都不具有自然性,因为人类或者其他生物并不通过此类生物特征区别个体。不被察觉的特点这会使该识别方法不令人反感,并且因为不容易引起人的注意而不容易被欺骗。人脸识别具有这方面的特点,它完全利用可见光获取人脸图像信息,而不同于指纹识别或者虹膜识别,需要利用电子压力传感器采集指纹,或者利用红外线采集虹膜图

主元分析(PCA)理论分析及应用

主元分析(PCA)理论分析及应用 姓名:苏刚学号:1515063004 学院:数学与计算机学院1 主元分析(PCA)的原理 PCA是(Principal component analysis)的缩写,中文翻译为主元分析。它是一种对数据进行分析的技术,最重要的应用是对原有数据进行简化。正如它的名字:主元分析,这种方法可以有效的找出数据中最“主要”的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单结构。它的优点是简单,而且无参数限制,可以方便的应用与各个场合。因此应用极其广泛,从神经科学到计算机图形学都有它的用武之地。被誉为应用线形代数最价值的结果之一。主成分分析是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题,对于某些复杂数据就可应用主成分分析法对其进行简化。计算主成分的目的是将高维数据投影到较低维空间。 从线形代数的角度来看,PCA的目标就是使用另一组基去重新描述得到的数据空间。而新的基要能尽量揭示原有的数据间的关系,而这个基即最重要的“主元”。PCA的目标就是找到这样的“主元”,最大程度的去除冗余和噪音的干扰。 设: Y = PX (1)并定义: i P表示P的行向量,X i表示X的列向量,i y表示Y的列向量。 公式1表示不同基之间的转换,在线性代数中,它表示P从X到Y的转换矩阵,在几何上,P对X进行旋转和拉伸得到Y。 将公式1展开: 可得到y i 表示X i 与P中对应列的点积,相当于是在对应向量上的投影。因此,P的行向量 事实上就是一组新的基,P的行向量就是PCA中所谓的“主元”。为了使得获得Y具有类间方差大,类内方差小,冗余信息少的特点。

【精品】人脸识别

【关键字】精品 武汉理工大学 毕业设计(论文) 基于PCA特征提取的面部 识别技术研究 学院(系):信息工程学院 专业班级:通信工程0602班 学生姓名:杨淑龙 指导教师:刘岚 学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包括任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承担。 作者签名: 年月日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保障、使用学位论文的规定,同意学校保留并向有关学位论文管理部门或机构送交论文的复印件和电子版,允许论文被查

阅和借阅。本人授权省级优秀学士论文评选机构将本学位论文的全部或部分内容编入有关数据进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 本学位论文属于1、保密囗,在年解密后适用本授权书 2、不保密囗。 (请在以上相应方框内打“√”) 作者签名:年月日 导师签名:年月日

毕业设计(论文)任务书 学生姓名杨淑龙专业班级通信0602 指导教师刘岚工作单位信息工程学院 设计(论文)题目: 基于PCA特征提取的面部识别技术研究 设计(论文)主要内容: 近年来,科学技术的进一步发展以及各种安全需要,各种基于生物特征的身份识别系统逐渐兴起。与指纹、视网膜、虹膜、基因、掌纹等其它人体生物特征识别系统相比,人脸识别更加直接、友好,且使用者无心理障碍。鉴于这些独特的优势,人脸识别被认为是一种可广泛使用的最理想的生物特征识别技术。本课题主要是对基于PCA特征抽取的面部识别技术进行研究。论文要求从项目研究的意义,特征抽取算法原理及系统具体实现过程,研究总结等方面进行论述。 要求完成的主要任务: 1. 查阅相关文献资料15篇以上(其中英文文献不少于2篇)。 2. 完成开题报告。 3. 研究面部识别分类模型的选取,使用已有的数据集完成PCA特征抽取、 判决器选取及系统GUI设计;并在此基础上进行系统功能调试。 4. 完成不少于15000字的论文的撰写并完成答辩的相关工作。 5. 在设计中完成不少于3张1~2#图纸的描绘。 6. 完成毕业设计周志。 7. 完成不低于5000汉字(20000英文印刷符)的教师指定的相关文献的 英译汉翻译。 必读参考资料: [1] 模式识别钟珞何平等/著武汉大学出版社 [2] Machine Learning (美)Tom M.Mitchell 著McGraw-Hill 出版

人脸识别

1.1.人脸识别 1.1.1.人脸识别主要算法原理 主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果; 2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。 1.1. 2.基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。 可变形模板法可以视为几何特征方法的一种改进,其基本思想是 :设计一个参数可调的器官模型 (即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需

基于神经网络和主元分析的人脸识别算法

———————————— 作者简介作者简介::张 敏(1981-),女,讲师,主研方向:智能信号处理,目标跟踪;曾晓辉,博士研究生 收稿日期收稿日期::2011-11-28 修回日期修回日期::2012-02-05 E-mail :tian_jian_2004@https://www.360docs.net/doc/f65937601.html, 基于优基于优选选信息熵的语音端点检测信息熵的语音端点检测方方法 张 敏,曾晓辉 (成都信息工程学院通信工程学院,成都 610225) 摘 要:为提高噪声环境中语音端点检测的准确率,提出一种基于信息熵的检测方法。将分帧语音信号按照不同阶数重新量化,选择其中波动范围大的信息熵作为该信号的优选信息熵,通过多次仿真实验确定较优门限,设计状态机对多段带噪语音进行端点检测。实验结果表明,该方法具有较好的抗噪声性能,在同等环境中的检测误判率较低。 关键词关键词::端点检测;波动范围;信息熵;门限;状态机;误判率 Speech Endpoint Detection Method Based on Optimum Information Entropy ZHANG Min, ZENG Xiao-hui (College of Communication Engineering, Chengdu University of Information Technology, Chengdu 610225, China) 【Abstract 】To enhance the accuracy of endpoint detection in noisy environment, a detection method based on optimum information entropy is proposed. According to the method, framed speeches are re-quantized with different groups of quantization level, and the group which has greatest range of entropy is chosen to calculate the optimum information entropy of the noisy speech. Thresholds are set by simulations and a state machine is employed to detect the endpoints of noisy speeches. Experimental results show that the method has better noise immunity and lower misjudgment rate. 【Key words 】endpoint detection; variation range; information entropy; threshold; state machine; misjudgment rate DOI: 10.3969/j.issn.1000-3428.2012.19.044 计 算 机 工 程 Computer Engineering 第38卷 第19期 V ol.38 No.19 2012年10月 October 2012 ·人工智能及识别技术人工智能及识别技术·· 文章编号文章编号::1000—3428(2012)19—0170—05 文献标识码文献标识码::A 中图分类号中图分类号::TP18 1 概述 语音端点检测,又称语音激活检测(Voice Activity Detection, VAD),是语音信号预处理的关键技术之一,即从包含语音的一段信号中,确定出语音的起始点和结束点。端点检测在传统的语音增强、语音编码和压缩,以及语音识别等领域中非常重要。在新兴VOIP 业务中,端点检测可应用于从声音信号流里的识别,以及消除长时间的静音期,在不降低业务质量的情况下,可节省宝贵的带宽资源[1]。 早期的孤立字识别系统通常工作在实验室环境下,在这种背景环境中,可以认为是无噪的。对于高信噪比环境下录制的语音,其背景噪声的能量远低于语音能量,基于能量和过零率的方法已可检测到比较准确的语音端点。 在实际应用中,分析的对象通常是混杂了各种干扰噪声的连续语音信号,当语音能量与背景噪声能量相当时,采用传统能量和过零率检测方法已很难准确地检测出语音的端点。为解决该问题,语音信号的更多特征参数被引入到语音端点检测中,如短时分形维数[2]、时域特征[3]、谱熵[4-6]、倒谱[7]、小波变换系数[8]。 本文提出一种基于优选信息熵的语音端点检测方法。围绕语音信号的时域波形展开分析,选取较优的信息熵,并对不同信噪比的连续语音段进行测试。 2 常用常用语音端点检测技术语音端点检测技术 语音是时变的、非平稳的、非遍历的随机过程,但在一段时间内(10 ms~30 ms),人的声带和声道形状具有相对稳定性,因此,可将语音分为若干分析帧,每一帧的语音可以认为是稳定的,而端点检测通常在分析语音短时特征的基础上进行。 2.1 短时能量 语音信号一般可分为静音段(或噪声段)、清音段、浊音段,一般来说,浊音段的平均能量大于清音段,清音段的平均能量大于静音段。假设将待分析的语音信号分帧,则一帧信号{x (n )}的短时能量定义为: 2[()()]n m E x m w n m ∞ =?∞=??∑ (1) 其中,w (n )为窗函数;N 为窗长,一般0

人脸识别技术大总结

人脸识别技术大总结 百度《人脸识别技术大总结》,觉得应该跟大家分享,这里给大家转摘到百度。 篇一:人脸识别技术的主要研究方法、绪论人脸识别是通过分析脸部器官的唯一形状和位置来进行身份鉴别。 人脸识别是一种重要的生物特征识别技术,应用非常广泛。 与其它身份识别方法相比,人脸识别具有直接、友好和方便等特点,因而,人脸识别问题的研究不仅有重要的应用价值,而且在模式识别中具有重要的理论意义,目前人脸识别已成为当前模式识别和人工智能领域的研究热点。 本章将简单介绍几种人脸识别技术的研究方法。 关键词:人脸识别、人脸识别技术的主要研究方法目前在国内和国外研究人脸识别的方法有很多,常用的方法有:基于几何特征的人脸识别方法、基于代数特征的人脸识别方法、基于连接机制的人脸识别方法以及基于三维数据的人脸识别方法。 人脸识别流程图如图.所示:图.人脸识别流程图、基于几何特征的人脸识别方法基于特征的方法是一种自下而上的人脸检测方法,由于人眼可以将人脸在不此研究人员认为有一个潜在的假设:人脸或人脸的部件可能具有在各种条件下都不会改变的特征或属性,如形状、肤色、纹理、边缘信息等。 基于特征的方法的目标就是寻找上述这些不变特征,并利用这些

特征来定位入脸。 这类方法在特定的环境下非常有效且检测速度较高,对人脸姿态、表情、旋转都不敏感。 但是由于人脸部件的提取通常都借助于边缘算子,因此,这类方法对图像质量要求较高,对光照和背景等有较高的要求,因为光照、噪音、阴影都极有可能破坏人脸部件的边缘,从而影响算法的有效性。 模板匹配算法首先需要人作标准模板(固定模板)或将模板先行参数化(可变模板),思想汇报专题然后在检测人脸时,计算输入图像与模板之间的相关值,这个相关值通常都是独立计算脸部轮廓、眼睛、鼻子和嘴各自的匹配程度后得出的综合描述,最后再根据相关值和预先设定的阈值来确定图像中是否存在人脸。 基于可变模板的人脸检测算法比固定模板算法检测效果要好很多,但是它仍不能有效地处理人脸尺度、姿态和形状等方面的变化。 基于外观形状的方法并不对输入图像进行复杂的预处理,也不需要人工的对人脸特征进行分析或是抽取模板,而是通过使用特定的方法(如主成分分析方法()、支持向量机()、神经网络方法()等)对大量的人脸和非人脸样本组成的训练集(一般为了保证训练得到的检测器精度,非人脸样本集的容量要为人脸样本集的两倍以上)进行学习,再将学习而成的模板或者说分类器用于人脸检测。 因此,这也是种自下而上的方法。 这种方法的优点是利用强大的机器学习算法快速稳定地实现了很

中科院模式识别大作业——人脸识别

人脸识别实验报告 ---- 基于PCA 和欧氏距离相似性测度 一、理论知识 1、PCA 原理 主成分分析(PCA) 是一种基于代数特征的人脸识别方法,是一种基于全局特征的人脸识别方法,它基于K-L 分解。基于主成分分析的人脸识别方法首次将人脸看作一个整体,特征提取由手工定义到利用统计学习自动获取是人脸识别方法的一个重要转变[1]。简单的说,它的 原理就是将一高维的向量,通过一个特殊的特征向量矩阵,投影到一个低维的向量空间中,表示为一个低维向量,并不会损失任何信息。即通过低维向量和特征向量矩阵,可以完全重构出所对应的原来高维向量。特征脸方法就是将包含人脸的图像区域看作是一种随机向量,因此,可以采用K-L 变换获得其正交K-L 基底。对应其中较大特征值的基底具有与人脸相似的形状,因此又称为特征脸。利用这些基底的线性组合可以描述、表达和逼近人脸图像,因此可以进行人脸识别与合成。识别过程就是将人脸图像映射到由特征脸张成的子空间上,比较其与己知人脸在特征空间中的位置,从而进行判别。 2、基于PCA 的人脸识别方法 2.1 计算特征脸 设人脸图像f(x,y)为二维N×M 灰度图像,用NM 维向量R 表示。人脸图像训练集为{}|1,2,...,i R i P =,其中P 为训练集中图像总数。这P 幅图像的平均向量为:

_ 11P i i R R P ==∑ 对训练样本规范化,即每个人脸i R 与平均人脸_ R 的差值向量: i A =i R -_R (i= 1,2,…,P) 其中列向量i A 表示一个训练样本。 训练图像由协方差矩阵可表示为: T C AA = 其中训练样本NM ×P 维矩阵12[,,...,]P A A A A = 特征脸由协方差矩阵C 的正交特征向量组成。对于NM 人脸图像,协方差矩阵C 的大小为NM ×NM ,对它求解特征值和特征向量是很困难的,由此引入奇异值分解定理来解决维数过高的问题。 2.2 奇异值分解定理 奇异值分解定理( Singular ValueDecomposition 简称SVD 定理)原理表述如下: 其中A 是一个秩为r 的n×r 维矩阵,则存在两个正交矩阵: 011[,,...,]n r T r U u u u R U U I ?-=∈= 011[,,...,]r r T r V v v v R V V I ?-=∈= 以及对角矩阵 []011,,...,r r r diag R λλλ?-Λ=∈ 且011r λλλ-≥≥≥L 满足下试: 1 2T A U V =Λ 其中: ()0,1,1i i r λ=-L 为矩阵T AA 和T A A 的非零特征值, i u 与i v 分别为T AA 和

相关文档
最新文档