基于PCA的人脸识别研究报告
基于PCA算法的人脸识别研究

基于PCA算法的人脸识别研究发布时间:2009-6-25 10:11:351 人脸识别的发展及现状人脸识别的研究已经有很长的历史,在19世纪,法国人Galton就曾对此问题进行了研究,他用一组数字代表不同的人脸侧面特征来实现对人脸侧面图像的识别。
国内外对于人脸识别的研究发展,分别经历了三个阶段:传统的人机交互式阶段、机器自动识别初级阶段、机器自动识别高级阶段。
1.1 传统的人机交互式阶段第一阶段是以Bertilion为代表,主要研究人脸识别所需要的面部特征,该阶段的识别依赖于人的操作。
这些人脸识别方法都需要利用操作员的某些先验知识,仍然摆脱不了人的干预。
1.2 自动识别初级阶段第二阶段主要是采用机器自动识别的手段进行识别,20世纪90年代以来,随着高速度高性能计算机的出现,人脸识别方法有了重大突破,进入了真正的机器自动识别阶段,人脸识别研究也得到了前所未有的重视。
1.3 机器自动识别高级阶段第三阶段是真正利用机器进行对人脸的自动识别,随着计算机的大型化、高速化和人脸识别的方法的发展,提出了许多人脸自动识别的系统。
2 PCA算法的原理PCA(主成分分析)算法是人脸识别中比较新的一种算法,该算法的优点是识别率高,识别速度快。
2.1 PCA算法介绍2.1.1 PCA原理令x为表示环境的m维随机向量。
假设x均值为零,即:E[x]=O.令w表示为m维单位向量,x在其上投影。
这个投影被定义为向量x和w的内积,表示为:而主成分分析的目的就是寻找一个权值向量w使得表达式E[y2]的值最大化:根据线性代数的理论,可以知道满足式子值最大化的训应该满足下式:即使得上述式子最大化的w是矩阵Cx的最大特征值所对应的特征向量。
2.1.2 主成分的求解步骤在PCA中主要的是要求出使得方差最大的转化方向,其具体的求解步骤如下:(1)构建关联矩阵:Cx=E[x*xT],Cx∈Pn*n.在实际应用中,由于原始数据的数学期望不容易求解,我们可以利用下式来近似构造关联矩阵:(其中x1,x2,…,xN,是各个原始灰度图像所有象素点对应的向量,N是原始图像的个数)(2)先计算出Cx的各个特征值(3)把特征值按大小排序(4)计算出前m个特征值对应正交的特征向量构成w。
《2024年基于深度学习的人脸识别方法研究综述》范文

《基于深度学习的人脸识别方法研究综述》篇一一、引言随着科技的进步,人脸识别技术已经成为了人工智能领域的研究热点。
基于深度学习的人脸识别方法以其高精度、高效率的特点,在众多领域得到了广泛应用。
本文旨在全面梳理和总结基于深度学习的人脸识别方法的研究现状、主要技术、应用领域及未来发展趋势。
二、人脸识别技术的发展历程人脸识别技术自诞生以来,经历了从传统的手工特征提取方法到基于深度学习方法的演变。
早期的人脸识别主要依靠人工设计的特征提取算法,如主成分分析(PCA)、线性判别分析(LDA)等。
随着深度学习技术的崛起,卷积神经网络(CNN)等人脸识别算法得到了广泛应用。
三、基于深度学习的人脸识别方法(一)深度卷积神经网络(Deep Convolutional Neural Network, DCNN)DCNN是目前应用最广泛的人脸识别方法之一。
通过训练大量的数据,DCNN可以自动学习和提取人脸特征,从而提高识别的准确性。
同时,DCNN具有较好的泛化能力,可以应对不同的人脸表情、光照、姿态等变化。
(二)深度学习与特征融合在人脸识别中,特征提取是关键的一步。
通过将深度学习与其他特征提取方法相结合,如基于局部二值模式(LBP)的特征提取方法,可以进一步提高人脸识别的准确性和鲁棒性。
此外,多模态特征融合技术也可以提高人脸识别的性能。
(三)基于深度学习的无约束人脸识别无约束人脸识别是近年来研究的热点。
由于实际应用中的人脸图像往往存在光照、姿态、表情等变化,因此基于深度学习的无约束人脸识别技术显得尤为重要。
该技术通过训练大量的无约束人脸数据,使得模型能够适应各种复杂的人脸变化。
四、主要技术应用领域(一)安防领域基于深度学习的人脸识别技术在安防领域得到了广泛应用。
例如,公安系统可以通过该技术对犯罪嫌疑人进行快速检索和比对,提高破案效率。
此外,该技术还可以应用于门禁系统、监控系统等场景。
(二)金融领域在金融领域,基于深度学习的人脸识别技术可以用于身份验证、支付等方面。
基于PCA的人脸识别算法在考试身份验证中的应用研究

基于PCA的人脸识别算法在考试身份验证中的应用研究摘要:研究了主成分分析(PCA)人脸识别算法的原理及实现,并将该算法应用于考试身份验证中,结果发现,该算法简单、快速、易行。
关键词:PCA;人脸识别;算法0引言考试仍然是当今教育体制中不可缺少的一个环节。
为了更真实地反映考生的学习情况、检验教学成效,杜绝考生找“枪手”进行替考等舞弊行为成为不容忽视的问题。
身份鉴别技术是解决这一问题的关键。
与传统的名字、密码等身份鉴别技术相比:生物特征识别手段的多样性,如指纹、掌纹、视网膜识别等,使之成为新兴的身份鉴别技术。
由于生物特征的唯一性使得用生物特征作为身份鉴别依据的安全性、可靠性更高。
在所有的生物识别技术中,指纹识别是最传统、发展最成熟的技术,但它需要被识别人主动配合,且获取识别信息需要时间,这给被识别人带来很大的不便。
而人脸识别恰恰弥补了这些不足,其隐蔽性好、非接触采集和采集设备成本低等特点使之成为生物识别技术中的研究热点。
人脸识别就其技术本质而言,是通过视频采集设备获取用户的面部图像,再利用核心的算法对其脸部的五官位置、脸型和角度进行计算分析,进而和自身数据库里已有的范本进行比对,最后判断出用户的真实身份。
因此,采用人脸识别在考试中进行身份验证是切实可行的。
利用人脸识别进行考生身份验证以代替传统的证件方式是有益的尝试。
本文进行的是狭义的人脸识别研究,即将待识别的人脸与数据库中的人脸之间进行匹配的人脸鉴别。
1考试身份验证系统设计考试身份验证系统流程框架如图1所示。
在考生进入在线考试系统之前,由该系统先进行身份验证。
首先由考生启动人脸识别客户端程序,驱动电脑摄像头(内置或外置)获得实时视频图像;根据捕获的视频图像定位人脸图像;经预处理来提高图像的品质,并将人脸图像设置成预先定义的尺寸;提取特征脸并在已有人脸图像数据库中进行查找、比对、识别;若能找出与客户端一致的特征脸则身份确认成功,并启动在线考试系统等待考生进入考试,否则身份确认失败,发出警报声引起监考人员警惕,考生暂不能进入考试,等待再次身份的确认(重复身份确认允许3次)。
人脸识别实验报告

人脸识别实验报告摘要:本实验通过使用人脸识别技术,对一组测试样本进行分类和识别。
首先,通过使用PCA降维算法对输入的人脸图像进行特征提取,然后使用支持向量机(SVM)分类算法进行分类。
实验结果表明,人脸识别技术在分类和识别方面取得了较好的效果。
一、引言人脸识别技术是一种将图像处理、模式识别和机器学习等方法相结合的多学科交叉技术。
它广泛应用于安全监控、人机交互、社交网络等领域,拥有广阔的应用前景。
本实验旨在研究人脸识别技术,并通过实验验证其分类和识别效果。
二、实验方法1.数据集准备:从公开数据集中选择合适的人脸图像作为训练集和测试集。
要求数据集包含不同人物的正面人脸图像,并且以文件夹形式存储。
2.数据预处理:读取训练集的人脸图像,将其转换为灰度图像,并进行直方图均衡化处理,增强图像质量。
3.特征提取:使用主成分分析(PCA)算法对图像进行特征提取。
首先,将每个图像的像素矩阵转换为一维向量,然后计算协方差矩阵。
接下来,通过对协方差矩阵进行特征值分解,得到特征值和特征向量。
最后,根据特征向量的重要程度,选择前n个主成分作为图像的特征。
4.分类算法:使用支持向量机(SVM)算法进行分类。
将提取的人脸特征向量作为输入样本,通过训练SVM模型,实现对人脸图像的分类和识别。
5.实验评价:使用测试集对分类和识别效果进行评价。
计算分类精度、召回率和F1值等指标,并绘制ROC曲线,分析模型的性能。
三、实验结果与分析实验结果显示,经过训练和测试,人脸识别模型的分类精度达到了90%以上,召回率和F1值也较高。
同时,根据绘制的ROC曲线可知,模型的性能相对稳定,具有较好的鲁棒性。
四、实验总结通过本实验,我们深入了解了人脸识别技术,并验证了其在分类和识别方面的效果。
实验结果表明,人脸识别技术具有较好的应用潜力,可以在实际场景中得到广泛应用。
然而,本实验还存在一些不足之处。
首先,使用的数据集规模较小,可能会对模型的训练和泛化能力产生影响。
基于PCA和LDA改进算法的人脸识别技术研究

基于PCA和LDA改进算法的人脸识别技术研究人脸识别是一种通过计算机视觉和模式识别技术来识别和验证人脸的生物特征,并将其与已知的人脸进行匹配的技术。
近年来,随着计算机算力的提升和人工智能技术的发展,人脸识别技术得到了广泛的应用,例如人脸解锁、人脸支付等。
PCA(Principal Component Analysis,主成分分析)和LDA(Linear Discriminant Analysis,线性判别分析)是两种常见的降维方法,用于从高维数据中提取有用的特征。
基于这两种方法的人脸识别技术研究已经得到了广泛关注。
PCA是一种无监督学习方法,通过将高维数据投影到低维子空间中,保持数据的大部分方差,从而达到降维的目的。
在人脸识别中,PCA可以通过计算训练集中人脸图像的协方差矩阵,然后提取其特征向量和特征值,选择前k个特征向量作为主成分,将人脸图像投影到主成分空间中。
在测试阶段,将待识别的人脸图像也投影到主成分空间中,通过计算其与训练集中人脸图像的距离,来判断其身份。
PCA的一个问题是它在无监督降维的可能忽略了一些与分类有关的信息。
为了解决这个问题,可以利用LDA来增加分类的准确性。
LDA是一种有监督学习方法,它通过最大化类别之间的差异性和最小化类别内的方差,选择最佳的投影方向。
在人脸识别中,LDA可以通过计算训练集中各类别的均值和类内散度矩阵,得到最佳的投影方向。
在测试阶段,将待识别的人脸图像投影到最佳的投影方向上,通过计算其与训练集中各类别的距离,来判断其身份。
由于PCA和LDA均是线性方法,它们对于人脸图像的非线性变化不敏感。
为了提高人脸识别的准确性,可以将PCA和LDA与非线性方法相结合,例如核技巧(kernel trick)。
通过将人脸图像映射到一个高维的特征空间中,利用核函数来计算其与训练集中人脸图像的相似性。
还可以利用深度学习方法来改进人脸识别技术。
深度学习是一种通过构建多层神经网络来学习数据特征的方法,它可以自动地学习人脸图像中的高级特征。
基于PCA和LDA改进算法的人脸识别技术研究

基于PCA和LDA改进算法的人脸识别技术研究人脸识别技术已成为信息安全、安防领域中的一项重要技术。
而PCA(Principal Component Analysis)和LDA(Linear Discriminant Analysis)是两种常见的人脸识别算法。
本文将对PCA和LDA算法进行简要介绍,并提出一种基于PCA和LDA改进算法的人脸识别技术。
PCA算法是通过对训练集图像进行主成分分析,得到训练集样本基础变换矩阵,使用该矩阵对待识别人脸图像进行变换,将其转化为低维空间中的向量,最后再进行分类识别。
PCA算法简单易懂,但是其容易受到噪声和光照变化等外部因素的影响,导致识别准确率不高。
LDA算法则是通过最大化同一类别内部的类内离散度并最小化不同类别之间的类间离散度,得到一个最好的分类平面,从而使得样本分类更加准确。
但是LDA算法面临的问题在于,当类别数目非常多时,其计算复杂度会大大增加,同时也容易发生过拟合现象。
针对PCA算法和LDA算法的局限性,本文提出了一种基于PCA和LDA改进算法的人脸识别技术。
该算法主要是在PCA算法和LDA算法基础上,通过引入核方法来进行特征提取和分类识别。
核方法是一种通过向高维空间的映射来处理低维空间中非线性问题的方法。
在本文中,我们选择使用径向基函数核(RBF Kernel)来进行特征提取。
这种核函数能够将样本从低维空间映射到高维空间,从而使得非线性问题也能够被线性分类。
具体而言,本文提出的改进算法具体步骤如下:1. 对于人脸图像的训练集,通过PCA算法对其进行主成分分析,并对每张图像进行降维处理,得到训练集样本基础变换矩阵。
2. 将训练集样本基础变换矩阵输入到LDA算法中,得到最佳分类平面参数。
3. 对于待识别的人脸图像,使用PCA算法将其转化为低维空间中的向量。
4. 将转化后的向量输入到径向基函数核中进行特征提取。
5. 基于提取后的特征,将人脸图像分类识别。
基于主成分分析(PCA)的人脸识别技术

基于主成分分析(PCA)的⼈脸识别技术本科期间做的⼀个课程设计,觉得⽐较好玩,现将之记录下来,实验所⽤。
1、实验⽬的(1)学习主成分分析(PCA)的基础知识;(2)了解PCA在⼈脸识别与重建⽅⾯的应⽤;(3)认识数据降维操作在数据处理中的重要作⽤;(4)学习使⽤MATLAB软件实现PCA算法,进⾏⼈脸识别,加深其在数字图像处理中解决该类问题的应⽤流程。
2、实验简介(背景及理论分析)近年来,由于恐怖分⼦的破坏活动发⽣越发频繁,包括⼈脸识别在内的⽣物特征识别再度成为⼈们关注的热点,各国均纷纷增加了对该领域研究的投⼊。
同其他⽣物特征识别技术,如指纹识别、语⾳识别、虹膜识别、DNA识别等相⽐,⼈脸识别具有被动、友好、⽅便的特点。
该技术在公众场合监控、门禁系统、基于⽬击线索的⼈脸重构、嫌疑犯照⽚的识别匹配等领域均有⼴泛应⽤。
⼈脸识别技术是基于⼈的脸部特征,对输⼊的⼈脸图像或者视频流,⾸先判断其是否存在⼈脸。
如果存在⼈脸,则进⼀步的给出每个脸的位置、⼤⼩和各个主要⾯部器官的位置信息。
其次并依据这些信息,进⼀步提取每个⼈脸中所蕴涵的⾝份特征,并将其与已知的⼈脸进⾏对⽐,从⽽识别每个⼈脸的⾝份。
⼴义的⼈脸识别实际包括构建⼈脸识别系统的⼀系列相关技术,包括⼈脸图像采集、⼈脸定位、⼈脸识别预处理、⾝份确认以及⾝份查找等;⽽狭义的⼈脸识别特指通过⼈脸进⾏⾝份确认或者⾝份查找的技术或系统。
我们在处理有关数字图像处理⽅⾯的问题时,⽐如经常⽤到的图像查询问题:在⼀个⼏万或者⼏百万甚⾄更⼤的数据库中查询⼀幅相近的图像。
其中主成分分析(PCA)是⼀种⽤于数据降维的⽅法,其⽬标是将⾼维数据投影到较低维空间。
PCA形成了K-L变换的基础,主要⽤于数据的紧凑表⽰。
在数据挖掘的应⽤中,它主要应⽤于简化⼤维数的数据集合,减少特征空间维数,可以⽤较⼩的存储代价和计算复杂度获得较⾼的准确性。
PCA法降维分类原理如下图所⽰:如上图所⽰,其中五⾓星表⽰⼀类集合,⼩圆圈表⽰另⼀类集合。
基于PCA的人脸特征提取和识别

基于PCA的人脸特征提取和识别首先,让我们了解一下PCA的基本原理。
PCA的目标是通过线性变换将原始高维数据转化为低维的特征空间,同时保留尽可能多的原始信息。
具体来说,PCA寻找投影方向,使得数据在该方向上的方差最大。
这些方差最大的方向被称为主成分,而数据在这些方向上的投影称为主成分分量。
在人脸识别中,利用PCA进行特征提取和识别的主要步骤如下:1.数据预处理:首先,对输入的人脸图像进行预处理,包括灰度化、直方图均衡化等,以增强图像的对比度和灰度分布。
2.数据采集:采集一组人脸图像作为训练样本。
这些图像应包含不同的表情、姿态和光照条件,以提高人脸识别系统的鲁棒性。
3.数据标准化:将采集到的人脸图像转化为向量表示。
这可以通过将图像像素按行展开成一个一维向量来实现。
4.特征提取:将标准化后的人脸向量输入到PCA模型中,利用PCA算法计算特征向量。
这些特征向量构成了人脸的特征空间。
5.降维:根据设定的降维维数,在特征向量中选择前n个主成分分量。
这些主成分分量可以看作是重要的人脸特征。
6.特征重构:通过将选择的主成分分量与原始数据相乘,可以将低维特征重构为高维特征。
7.人脸识别:将待识别的人脸图像转化为特征向量,并与已存储的特征向量进行比较。
常用的比较方法包括欧氏距离、余弦相似度等。
识别的过程就是找到与待识别特征向量最相似的已知特征向量,即找到最小的距离或最大的相似度。
首先,PCA能够对人脸图像进行降维处理,减少数据的维度,从而提高了特征提取和识别的效率。
其次,PCA能够自动地从大量的原始特征中提取出关键的主成分,消除了冗余信息,突出了人脸图像的主要特征。
另外,基于PCA的人脸识别方法对光照、表情、姿态等因素具有一定的鲁棒性,能够在不同条件下准确地识别人脸。
然而,基于PCA的人脸特征提取和识别方法也存在一些不足之处:首先,PCA是一种线性变换方法,对于一些非线性的人脸变化,如表情、姿态变化,其特征提取和识别能力有限。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
项目名称:基于PCA的人脸识别算法研究摘要随着人类社会的进步,以及科技水平的提高,一些传统的身份认证的方法逐渐暴露出各种问题,因此人们需要采用一种更加可靠安全的身份认证方法。
毫无疑问人体的生物特征的独一无二的,特别是其不容易丢失及复制的特性很好满足了身份识别的需要。
并且随着计算机科学技术和生物医学的发展使得利用生物特征识别成为了可能。
因此基于指纹、人脸、视网膜等生物特征的识别方法也越来越多。
由于人脸识别的操作快速简单,结果直观,准确可靠,不需要人的配合等优点已成为人们关注的焦点。
主成分分析(PCA)法通过提取高维度的人脸图像的主元,使得图像在低维度空间中被处理来降低了图像处理的难度。
由于其有效的解决了图像空间维数过高的问题,已经成为人脸识别领域非常重要的理论。
此次研究的就是基于PCA的人脸识别算法的实现。
本文按照完整人脸识别流程来分析基于PCA的人脸识别算法实现的性能。
首先使用常用的人脸图像的获取方法获取人脸图像。
本文为了更好的分析基于PCA人脸识别系统的性能分别选用了Essex人脸数据库和ORL人脸库,并在后期采用了自建的人脸库。
接下来是人脸图像预处理方法。
由于采用的人脸图像质量较好,而且已经做过相应的预处理,所以本文试验中只使用灰度处理。
接着使用PCA提取人脸特征,使用奇异值分解定理计算协方差矩阵的特征值和特征向量以及使用最近邻法分类器欧几里得距离来进行人脸判别分类。
在实验中我们发现基于PCA的人脸识别系统的识别率很高,而且具有一定鲁棒性,所以基于PCA的人脸识别算法的实现的研究还是有意义。
【关键词】人脸识别 PCA算法奇异值分解定理欧几里得距离ABSTRACTWith the development of science and technology, the progress of human society, the traditional identification is easy to lose, easy to be cracked and it has not play an identifiable role. People need a more secure and reliable identification technology. Biometric is unique, easy to lose and replication characteristics of good meet the needs of the identification. With the development of computer science and technology and biomedical makes use of biometric identification has become possible. In the field of biometric identification, face recognition with the advantages of operation is fast and simple, the results are intuitive, accurate and reliable,do not need co-ordination, has become the focus of attention. The principal component analysis (PCA) to extract high dimensional face image of the main element, making the images are processed in low-dimensional space and it reduces the difficulty of image processing. PCA solves effectively the problem of high dimension image space and it has become a very important theory in face recognition field. This paper is in this context of writing from.In accordance with the full recognition process to analyze the performance of PCA-based face recognition algorithm. The first to use the method of access to commonly used face images for face images. In order to better analysis is based on the performance of the PCA face recognition system selected Essex face database. Next is the face image preprocessing methods. Essex face image quality is better, and have done the appropriate pretreatment, using only gray-scale processing of this trial. Then use the PCA for face feature extraction using singular value decomposition theorem to calculate the covariance matrix of the eigenvalues and eigenvectors, and use the Euclidean distance of the nearest neighbor classifier to the classification of human face discrimination. In the experiment, we found that a high recognition rate of the PCA-based face recognition system, but with a certain robustness, the PCA-based face recognition algorithm to achieve meaningful. 【Key words】face recognition PCA algorithm SVD Euclidean distance前言随着社会和科技的发展,社会步伐的加快,人们对高效可靠的身份识别需求日益强烈。
各种技术在科研和实际中都受到了很大的重视和发展。
由于生物特征在的稳定性和唯一性使其成为了作为身份识别的理想依据。
人脸特征作为典型的生物特征外,还有隐蔽性好,易于被用户接受,不需要人的配合等优点。
现已成为了身份识别领域研究的热点。
PCA算法通过降低维度,提取主元素,减少了数据冗余,解决了图像纬度太高无法处理或处理很慢的特点,同时保持了原始图像的绝大部分信息。
在人脸识别领域,很多先进的识别算法都是在其基础上的改进。
所以研究基于PCA的人脸识别算法实现具有重要的理论和使用价值。
本文主要介绍基于PCA的人脸识别算法的实现,先介绍了PCA算法的理论基础,其次介绍了其在数字图像领域的应用,最后结合具体研究详述了研究过程。
第一节 主成分分析基本理论一、什么是主成分分析?主成分分析为Principle component analysis [10,11,12]的中文翻译,其英文简写为PCA 。
它是一种非常流行和实用的数据分析技术,最重要的应用是对原有数据进行简化。
主成分分析可以有效的找出数据中最“主要”的元素和结构,去除噪声和冗余,将原有的复杂数据降维处理,揭示出隐藏在复杂数据背后的简单结构。
它的优点是简单,而且无参数限制,可以方便的应用与各个场合。
因此应用极其广泛,从神经科学到计算机图形学都有它的身影。
PCA 被称为应用线形代数最有价值的结果之一。
二、基变换从线形代数的角度来看,PCA 的目标就是使用另一组基去重新描述得到的数据空间。
而新的基要能尽量揭示原有的数据间的关系。
在这个例子中,沿着某x 轴上的运动是最重要的。
这个维度即 最重要的“主元”。
PCA 的目标就是找到这样的“主元”,最大程度的去除冗余和噪音的干扰。
1. 标准正交基标准正交基表现了数据观测的一般方式。
在线形代数中,这组基表示为行列向量线形无关的单位矩阵。
12100010001m b b B I b ⎡⎤⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥===⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦ (4.2) 2. 基变换从更严格的数学定义上来说,PCA 回答的问题是:如何寻找到另一组正交基,它们是标准正交基的线性组合,而且能够最好的表示数据集?在PCA 方法中有一个很关键的假设:线性。
这是一个非常好的假设,它使问题得到了很大程度的简化,具体表现为数据被限制在一个向量空间中,能被一组基表示,并且还隐含的假设了数据间的连续性关系。
这样一来数据就可以被表示为各种基的线性组合。
令X 表示原数据集。
X 是一个m*n 的矩阵,它的每一个列向量都表示一个时间采样点上的数据X 。
Y 表示转换以后的新的数据集表示。
P 是他们之间的线性转换。
它们间的转换关系为PX Y = (4.3)有如下定义:p i 表示P 的行向量。
x i 表示X 的列向量。
y i 表示Y 的列向量。
上式(3)在线性代数中,它有如下的含义:P 是从X 到Y 的转换矩阵。
几何上来说,P 对X 进行旋转和拉伸得到Y 。
P 的行向量, (p 1,p 2,…,p m )是一组新的基,而Y 是原数据X 在这组新的基表示下得到的重新表示。
下面是对最后一个含义的说明:[]11n m p PX x x p ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦(4.4)1111n m m n p x p x Y p x p x ⋅⋅⎡⎤⎢⎥=⎢⎥⎢⎥⋅⎣⎦(4.5) 注意到Y 的列向量:1i i m i p x y p x ⋅⎡⎤⎢⎥=⎢⎥⎢⎥⋅⎣⎦(4.6) 可见y i 表示的是x i 与P 中对应列的点积,也就是相当于是在对应向量上的投影。
所以,P的行向量事实上就是一组新的基。
它对原数据X 进行重新表示。
3. 问题在线性的假设条件下,问题转化为寻找一组变换后的基,也就是P 的行向量(p 1,p 2,…,p m ),这些向量就是PCA 中所谓的“主元”。