核主元分析特征提取法的研究
基于核主成分分析特征提取及支持向量机的人脸识别应用研究

基于核主成分分析特征提取及支持向量机的人脸识别应用研究一、综述近年来,随着计算机技术的发展和人类对信息安全需求的日益增长,人脸识别作为一种具有广泛应用前景的技术,得到了广泛关注。
传统的面部识别方法面临着诸多挑战,例如在复杂环境下的人脸捕捉、处理以及识别准确性等问题。
为了克服这些问题,研究者们将目光投向了更为高效的特征提取算法和支持向量机(SVM)的分类器。
核主成分分析(Kernel PCA, KDE)是一种重要的非线性特征提取方法。
它通过对原始高维数据映射到低维空间,并在此空间中求取主成分,从而有效地减少数据的维度,同时保留数据中的主要信息。
KDE 在人脸识别领域展现出了良好的性能,为解决非线性问题提供了新的思路。
支持向量机(SVM)作为另一种重要的监督学习算法,在模式分类和回归分析等领域取得了显著的成果。
相较于传统方法,SVM 通过最大化间隔原则,有效地提高了分类器的泛化能力。
在人脸识别领域,SVM 可以克服特征维度高、分类困难等问题,从而进一步提高识别的准确率和鲁棒性。
将核主成分分析和支持向量机相结合用于人脸识别的研究逐渐受到关注。
这种结合充分利用了两者的优势,提高了特征提取与分类的效率。
本文将对相关研究进行综述,介绍 KPCA 和 SVM 在人脸识别中的应用进展,分析其在实际场景中的优缺点,为后续的研究提供参考。
1. 人脸识别的研究背景和意义在信息时代的浪潮下,人脸识别技术以其捕捉便捷、操作简便的特点,逐渐成为了网络安全领域中具有重要价值的身份验证手段。
随着人们生活节奏的不断加快,对安全和便捷性的需求也日益提升,人脸识别技术在金融、医疗、教育等多个行业的应用越来越广泛。
在此背景下,研究如何通过精确的身份识别技术来维护网络空间安全,已成为当前亟待解决的问题。
人脸识别技术的研究背景源于图像处理与模式识别领域的深层次理论——主成分分析(PCA)。
作为一种广泛应用的特征提取方法,PCA能有效减少数据集中的冗余信息,并将高维数据映射至低维空间,从而简化数据结构,提升数据分析的效率与准确性。
核函数主元分析及其在故障特征提取中的应用

程 中 , 了使 诊 断准确 可靠 , 于测试 信 号总希 望 通 为 对
过 预处 理获 得尽 可能 多 的特征 参数 。 但是 , 当太 多 的 特 征输 入分 类器 时 , 引起 训练 过程 耗时 费工 , 至 会 甚 妨 碍训 练 的收敛 性 , 最终 影响 分类 精度 。因此 , 从 要 故 障特 征集 中提 取对 状 态 敏感 的特 征 子集 , 一 工 这 作就 是特征 提 取 。 特征 提取 方法 有多 种 。主元 分析 ( C 是 最 为 P A) 常用 的特 征 提取 方 法 [ , 2 它依 据 输 入 变 量 的线 性 变 ] 换, 由输 入 变 量互 相 关 矩 阵 的 主要特 征 值 的大 小来 确定 坐标 变换 和 变 量 压缩 , 目的是在 数 据 空 间 中 其
本上 解 决非 线性 问题 。
基 于核 函数 的 主元 分 析 ( C KP A) 法 是 方
.
国 防 预 研 基 金 资 助 项 目。 收 稿 日期 :0 60 —3 修 改 稿 收 到 日期 :0 60 —1 2 0 —40 ; 20 —53 。
维普资讯
维普资讯
第2 7卷第 1 期
20 年 3月 07
振 动 、 试 与诊 断 测
J u n lo b ai n。 a u e n o r a fVi r t o Me s r me t& Dig o i a n ss
V0 . 7 No 1 12 .
找 出一 组 m 个 正交 向量 。 它们最 大 可能地 表示 数据
方差 , 以便 将 数 据从 原 始 的 ,维 空 间 映 射 到这 组 正 z
基于核主成分分析的铁谱磨粒特征提取方法研究

p rmee n o l e rrlt n h p a n e e p r mees P A b s d me o r sn e aa tr a d n ni a ea o s i mo g t s aa tr ,a K C - ae t d i p e td.B sd o e d ti t d cin o n i h h s e a e n t eal i r u t h d e no o f K C ag r h ,a r a ae w ssu id fr山e p l e o o sr ci b sa tma c rc g i o u -y tm hc a e s re P A lo tm i e lc s a t de 0 u 0 c n t t a d r uo t e o nt n sb s s s f u n g e i i i e w hC b v i n e d
维普资讯
第2 9卷第 2期
国 防 科 技 大 学 学 报 JU N LO AIN LU IE S YO EE S E H O O Y O R A FNTO A NV RI FD F NETC N L G T
V 1 9N . 0 o. o22 7 2 0
性, 因此, 去除参数问的相关性和降低磨粒参数维数有助于提高识别准确率和减少识别工作量。文献 [] 出采用 多元 统计 分析 中的主成 分分 析 (r c a Cm oetA a s ,C 进 行 铁谱 的磨粒 识 别 , 1提 Pi i l o pnn nl i P A) np s ys 取 得 一 定效果 , 为动力装 置状 态识 别 与故 障诊 断提 供 了一 种有 效 的特 征选 择 与特 征 提取 方法 。但 P A方 C
基于ReliefF算法的核主成分特征提取

技 术 与 市 场
第 l 卷第 8 21 年 9 期 02
技 术 研 发
基 于 R l f 法 的核 主成 分 特 征 提 取 ee i F算
孙雅妮 , 陈新 华
( 四川信 息职 业技 术 学 院 , 四川 广元 68 1) 207
摘 要 : 侵 检 测 中特 征 选 择 和 特 征 提 取 是 解 决 特 征 降维 的 方 法之 一 。 采 用基 于 R lf 法的 核 主 成 分 方 法 解 决 特 征 入 ee iF算
0. 2 8 024
O. 2 1 O 00
0. 8 5 03 l
0. 9 2 O6 3
3 4
3 5
0. o o 001
0. 0 o 00 0
0O 02 . 0 1
O. O o 00 o
1 5
0O6 2 .15
0. 5 6 O2 8
3 6
0. ( o o) O 0
从和 R同类的样 本集 中找 出样本 № 的 k 近邻 样本 ( ers i 个 nae t hs , i) 从每个 R的不 同类 的样本 中找 出 k 近邻 样本 ( er t t 个 nae s
粗糙核主元分析方法及其在故障特征提取中的应用

粗糙核主元分析方法及其在故障特征提取中的应用胡金海;谢寿生;侯胜利;汪诚;杨帆【期刊名称】《振动与冲击》【年(卷),期】2008(027)003【摘要】将粗糙集理论的属性约简与核主元分析方法结合起来,提出一种基于粗糙核主元分析的故障特征提取方法.该方法首先采用粗糙集理论的属性约简删除与分类无关或关系不大的特征,降低输入特征维数,排除干扰特征的影响,减小了特征提取计算量;然后再采用核主元分析方法进一步提取非线性特征;最后将该方法应用于轴承故障特征提取及故障识别中.应用结果表明,所提出的粗糙核主元分析方法(RKPCA)与传统的KPCA、PCA方法相比,使整个样本集的可分性变大,提高了分类正确率;同时还有效地降低了输入特征维数,提高了分类效率;并且对分类器具有较强的适应性和鲁棒性.【总页数】6页(P50-54,59)【作者】胡金海;谢寿生;侯胜利;汪诚;杨帆【作者单位】空军工程大学,工程学院,西安,710038;空军工程大学,工程学院,西安,710038;徐州空军学院,江苏,徐州,221006;空军工程大学,工程学院,西安,710038;空军工程大学,工程学院,西安,710038【正文语种】中文【中图分类】V263.6【相关文献】1.粗糙主成分分析在齿轮故障特征提取中的应用 [J], 肖健华;吴今培;樊可清;杨叔子2.核参数判别选择方法在核主元分析中的应用 [J], 张成;李娜;李元;逄玉俊3.局部倒频谱编辑方法及其在齿轮箱微弱轴承故障特征提取中的应用 [J], 张西宁; 周融通; 郭清林; 张雯雯4.RS-LOD方法及其在旋转机械故障特征提取中的应用 [J], 牛晓瑞;张亢;陈向民;廖力达;徐鼎杰5.n-FFT压缩感知降维智能方法及其在齿轮系统故障特征提取与分类中应用研究[J], 陈晓;黄传金因版权原因,仅展示原文概要,查看原文内容请购买。
基于ReliefF算法的核主成分特征提取

基于ReliefF算法的核主成分特征提取摘要:入侵检测中特征选择和特征提取是解决特征降维的方法之一。
本文采用基于relieff算法的核主成分方法解决特征降维问题,先采用relieff算法去除原始特征中与分类不相关的特征,再采用核主成分分析法进行特征提取。
实验数据表明:将41个特征变量降维成9个主成分,大大减轻了后续的分类器的工作量,同时也有助于提高分类器的分类精度。
关键词:特征选择 relieff算法 kpca 特征提取为了能获得理想的入侵检测效果,需要在两个方面进行努力:一是建造一个好的分类器,二是寻找对问题的一个好的表示,即选用的输入特征能为分类器提供最有用的信息。
对于前者,人们尝试利用各种基于不同原理的方法来检测入侵。
对于后者,一般有两种方法从原始的输入特征中获得问题更好的表达:特征选择和特征提取。
1、特征选择和特征提取技术采用模式识别方法进行入侵检测首先要解决特征降维问题。
现存的特征降维主要采用特征选择和特征再构造(也就是特征提取)两种方法。
特征选择是模式识别领域的重要问题。
在一个学习算法通过训练样本对未知样本进行预测之前,必须决定哪些特征应该采用,哪些特征应该忽略。
特征选择已广泛应用到文本分类、图像检索、入侵检测和基因分析等方面。
特征提取是提升分类器性能的另一类方法。
它通过对高维的输入特征进行变换从而获得新的低维特征。
入侵检测系统中特征的选择和提取如图1所示。
其中不相关的特征是指那些与分类过程没有关系的特征。
去不相关特征本文采用relieff算法。
特征提取本文采用核主成分分析(kpca)方法。
2、relieff算法及其实现kira等1992年提出了relief算法。
该算法仅适用于训练样本是两类的情况。
kononenko[31]扩展了relief算法得到relieff算法,relieff则可以应用于多类样本情况。
relieff算法在处理多类问题时,不是从所有不同类样本集合中统一选择最近邻样本,而是从每个不同类别的样本集合中选择最近邻样本,并且不是选择一个最近邻样本,而是选择k个最近邻样本。
一种基于核主元分析的话务量特征提取方法
一种基于核主元分析的话务量特征提取方法doi:10.3969/j.issn.1001-3695.2010.06.055Method of nonlinear character extraction in communication traffic based on KPCAZHONG Bingxiang, LI Taifu, WANG Debiao, SU Yingying (College of Electronic Information Engineering, Chongqing University of Science & Technology, Chongqing 401331, China)Abstract:In view of the communication traffic feature, this paper presented a method of nonlinear character extraction based on kernel function principal component analysis(KPCA). Nonlinear character extracted by KPCA reflectd the complex relationship between original input and output data and simplified the array dimension of input data. By comparing simulation results, the prediction model based on KPCARBFNN has better ability to deal with nonlinear data than that prediction model based on PCARBFNN. The experimental results show that this method is very effective.Key words:communication traffic; characterextraction; kernel function; principal component analysis; RBFNN0 引言话务量预测,是指通过分析通信网话务量的历史数据统计规律或相关因素,对未来网络可能出现的话务量进行估计和预期[1]。
国内外主成分分析特征提取研究现状
国内外主成分分析特征提取研究现状我国经过近十年来的发展,运用主成分分析的方法对高光谱遥感矿物信息特征提取已经取得了很大进展。
航空遥感中心高光谱遥感课题组对这方面进行了理论、技术方法以及规模化应用示范研究,取得了丰硕成果,取得了良好的经济与社会效益,申请了多项发明专利。
环境污染问题已经成为人们关注的焦点,为更好地监控治理污染,有必要对大气状况进行实时监测。
传统的湿式化学技术以及后续发展起来的气相色谱法、质谱和色谱联合技术等是以吸气取样后的实验分析为基础,不具备实时和连续监测能力。
近几年,运用主成分分析的光谱压缩特征提取方法对大气进行分析得出大气状况。
在国内还运用主成分分析的方法对人口、教育、地区的经济发展发面等方面研究,都取得了一定的成果。
在国外运用主成分分析的方法对医学,地质,人脸识别等领域。
在美国、英国等国家采用主成分分析的方法对氯吡格雷、肝素钠、肝素钙等低分子肝素相关产品的销售额数据进行处理,形成新的指标体系,而后应用BP神经网络的方法建立模型,评价模型的拟合能力。
在一些欧美国家用核主成分分析方法也就是主成分分析的改进算法,其采用非线性方法提取主成分,把核主成分分析应用到人脸识别中,利用核主成分分析方法选择合适的核函数在高维空间提取人脸图像的主成分,核主成分分析与传统主成分分析相比,可以得到更好的适合分类的特征,基于ORL人脸库,识别核主成分分析提取出的主成分的相关性系数。
实验结果表明,核主成分分析不仅实现了降维,而且能取得比传统主成分分析更好的识别性能,正确识别率为92.5%。
在日本运用主成分分析的方法对地质进行分析,从而来预测地震避免不必要的损失。
同时,主成分分析作为一种优秀的降维提取主要信息的手段,先后在海洋学、地质学、地球物理学、资源科学等地学分值中都得到了一定程度的应用。
该方法为地学的发展提供了有力工具。
基于主成分分析的特征提取方法研究毕业论文
毕业设计论文题目基于主成分分析的特征提取方法研究专业电子信息工程班级084 班姓名童佳威指导教师周扬讲师所在学院信息科技学院完成时间:2012 年 5 月承诺书我谨此郑重承诺:本毕业设计(论文)是本人在指导老师指导下独立撰写完成的。
凡涉及他人观点和材料,均依据著作规范作了注释。
如有抄袭或其它违反知识产权的情况,本人愿接受学校处分。
承诺人(签名):年月日基于主成分分析的特征提取方法研究信息学院电子信息工程专业童佳威摘要:本文选以小麦粉的红外光谱检测数据为研究对象,运用主成分分析(PCA),建立用于预测未知样品性质或组成的分析模型。
近红外光Near Infrared 简称NIR光谱区7802526nm主要是由含氢基团的倍频和组频吸收峰组成,吸收强度弱灵敏度相对较低,吸收带较宽且重叠严重,考虑到它属于弱光谱信号分析技术,所得信息受到许多因素影响,且作为信息源的近红外光谱中有效信息率低等,所以需要有效的方法来消除影响或降噪等,即降低光谱数据的维数,用以建立校正模型并预测未知样品性质或组成。
目前使用的较多的建模方法有逐步回归法、主成分回归方法和偏最小二乘回归方法等等。
本实验采用主成分分析技术,建立NIR 定量分析的多元校正模型,并用该模型预测样品数据。
关键词:数据降维;主成分分析;近红外光谱;偏最小二乘法Extraction method based on principal component analysis of the characteristics Tongjiawei Electronic information Engineering College of Information Science and Technology Abstract:This article was selected infrared spectra of wheat flour test data for the study principalcomponent analysis PCA the establishment of the analytical model used to predict the nature orcomposition of unknown samples.Near infrared Near the Infrared referred to as NIR spectral region780 2526nm is the frequency absorption peak of the composition the absorption intensity of theweak sensitivity to relatively low absorption by hydrogen groups multiplier and groups with a wideoverlap seriously to consider to the it belongs to the weak spectral signal analysis technology theinformation obtained is influenced by many factors and effective information rate is low as thenear-infrared spectra of the sources of information so the need for effective ways to eliminate theimpact or noise reduction ie reducing the dimension of the spectral data number used to establish thecalibration model and predict the nature or composition of unknown samples.Modeling methodscurrently used by more stepwise regression principal component regression and partial least squaresregression method. In this study principal component analysis multivariate calibration model of NIRquantitative analysis sample data and the model predicted. Keywords: Data dimensionality reduction principal component analysis near-infraredspectroscopyPartial Least Squares 目录1 绪论................................................................................................................................. 1 1.1 高维数据降维的方法.............................................................................................. 1 1.2 常用降维、特征变换方法的应用.......................................................................... 2 1.3 研究的内容与意义.................................................................................................. 52 主成分分析方法 (6)2.1 主成分分析的基本原理 (6)2.2 主成分分析的数学模型 (8)2.3 主成分分析的几何意义 (9)2.4 主成分分析的数学实现过程 (113)主成分分析在光谱分解中的应用 (13)3.1 近红外光谱分析技术与化学计量的关系 (13)3.11 近红外光谱分析技术................................................................................... 13 3.12 化学计量学方法的概述............................................................................... 14 3.13 常用化学计量学方法................................................................................... 14 3.14 化学计量学方法在近红外光谱分析技术应用........................................... 16 3.2 光谱主成分回归方法介绍................................................................................... 16 3.3 光谱主成分得分(系数)与成分建模(PLS 模型)....................................... 18 3.31 偏最小二乘基本概念................................................................................... 18 3.32 偏最小二乘基本模型................................................................................... 194 光谱主成分分析实验..................................................................................................... 214.1 Matlab 软件中关于关于主成分分析的实验........................................................ 21 4.11Matlab 简介.................................................................................................... 21 4.12Matlab 中主成分分析函数............................................................................ 22 4.13 基于Matlab 的PCA 实现............................................................................ 23 4.2 小麦粉光谱分析................................................................................................... 24 4.21 PCA 用于小麦粉NIR 分析......................................................................... 24 4.22 PLS 用于小麦粉NIR 分析.......................................................................... 275 结论................................................................................................................................. 31致谢................................................................................................................................. 32参考文献.. (33)1 绪论随着科技的发展,事物的发展越来越趋于复杂化,在研究的过程中,往往由于事物特征个数太多,且彼此之间存在着一定的相关性,因而使得所观测的数据在一定程度上有信息的重叠。
核PCA特征提取方法及其应用研究
南京航空航天大学硕士学位论文
图表清单
图 2.1 ORL 人脸数据库中的部分人脸图像…………………………………………………………13 图 3.1 核方法框架示意图……………………………………………………………………………15 图 3.2 KPCA 算法流程图………………………………………………………………………………19 图 4.1 图像检测系统原理图…………………………………………………………………………23 图 4.2 VS-808HC 微型彩色高清工业摄像机实物图…………………………………………………25 图 4.3 MV-E8800 PCI-E 8 路高清实时图像采集卡实物图…………………………………………25 图 4.4 PCA 与 KPCA 各主元累积贡献率比较图………………………………………………………28 图 5.1 航空发动机主滑油滤位置示意图……………………………………………………………32 图 5.2 滑油滤及金属屑图像…………………………………………………………………………33 图 5.3 滑油滤图像……………………………………………………………………………………33 图 5.4 滑油滤清洗和磨屑收集系统结构原理图……………………………………………………35 图 5.5 滑油滤清洗和磨屑收集系统实物图…………………………………………………………35 图 5.6 滑油滤清洗装备结构设计图…………………………………………………………………36 图 5.7 带磁环的滑油滤磨屑图像……………………………………………………………………37 图 5.8 取下磁环的滑油滤磨屑图像…………………………………………………………………37 图 5.9 DH-HV02 系列数字摄像机实物图……………………………………………………………37 图 5.10 正常滑油滤典型图像 ………………………………………………………………………38 图 5.11 异常滑油滤典型图像 ………………………………………………………………………38 图 5.12 PCA 与 KPCA 各主元累积贡献率比较图……………………………………………………39 图 6.1 ZT-3 多功能转子模拟实验台…………………………………………………………………43 图 6.2 ZT-3 多功能转子故障模拟实验台……………………………………………………………44 图 6.3 实验装置信号采集原理图……………………………………………………………………44 图 6.4 不平衡故障信预处理后的频谱(100 个点) …………………………………………………47 图 6.5 不对中故障信预处理后的频谱(100 个点)…………………………………………………47 图 6.6 碰摩故障信预处理后的频谱(100 个点)……………………………………………………47 图 6.7 油膜涡动故障信预处理后的频谱(100 个点)………………………………………………47 图 6.8 PCA 的主元方向特征矢量的投影图…………………………………………………………50 图 6.9 KPCA1 的主元方向特征矢量的投影图………………………………………………………50 图 6.10 KPCA2 的主元方向特征矢量的投影图………………………………………………………50 图 6.11 KPCA3 的主元方向特征矢量的投影图………………………………………………………50
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
形式,即
李- 。 Y(= Nx () P i N言
这 我 称 U 练 本 据{ 在 征 间 的 ( 训 样 数 f 。特 空 中 里 们 式) 为 x i 粱
标准化。 满足训练样本数据映射后的特征点有零均值,远比 训练样本数据有零均值来得困难。下面我们假设式(成立, ( 1 )
所以,可以 得知特征矢量9 必定在特粱 , 足 也 存 组 应 系 S 1满 r L a i
价 R" R , :n - m - - > ( 3 ) ( 2 ) 其中 P 示 线 映 ,( 非 性 射,m 为 空 的 数,m为 表 。 输入 间 维 , 特 将式(代入式( ,得
特征值。
22 2
信 号 处 理
SG I NAL OC S I G P R E SN
第 1卷 9
增刊
根 据 式 3 ( 有 虱= ( ) , 所 以 ) a' k kX P
核矩阵定义为
4 4= k k = (, a=k a= , k k () a () KXXa k A kk I 即 T ( Xa ' k kk P T 万 P X ) k a T
Jyg 1 Yue h g u i Gn o i 1 nn a . 2 w Za . 2 n
(S o oIo a n u UirtJn eC , g nP vc5 0 , ’ h l fmt , i ei ig n Ga d g ie 2 c o f i W y n s , m i u o r n 2 0 nr o v y a y t n o 9 2 o f r i a Io a n n rg ea Uiry en1 0 ) S o oEc ns n r t Egei, n nei Big 8 c l e oc n fm i n e Bi g s , 0 3 h lt d o i n h v t j 0 i
N N
4 艺 ;x = 1a() t; p j =
征 间 维 非 性 射价 输 空 的 量x映 为 空 的 数。 线 映 将 入 间 矢 i 射
特征空间 象例x) 的 ;o
艺j1 ci(x二 Ii ;x 艺 jx x j 威艺 (; a(Ki ) = a () p ) , p ii = =
A src: e eP ni l pnn nl i K r l ) nnna o a nta ee lao o stta K r l c aC m oetA a s (e eP A ia le f m a r gnri tn tii l bt t a n r p o i s y s n C s i r n a l az i f sc o r d u a
20 2
信 号 处 理
S GNAL ROCES I I P S NG
第 1卷 9
增刊
核主元分析特征提取法的研究*
甘俊英 ‘ ” 张有为 ’
( 五邑 信息学院 广东 江门 592; ’ 大学 200 , 北京航空航天大学电子信息工程学院 北京 108 ) 003
摘要: 核主元分析是统计主元分析的非线性形式, 是统计主元分析的自 然推广。 本文在统计主元分析的基础上探讨了核 主元分析的概念, 研究了核主元分析映射数据的标准化实现, 揭示了核主元分析与统计主元分析的内在联系, 得出了 核主元 分析用于特征提取的方法。 核主元分析用于特征提取, 是借助于核函数, 将输入空间的训练样本数据经过非线性映射转换到 特征空间, 然后向所选择的多个主特征矢量方向进行投影, 最后可以获得多个不相关的主元, 为特征提取以及模式识别的应
Kxx =T () (, l()x ij xT ; )p i
假 训 样 数 用认推 表 通 非 性 射(, 设 练 本 据 , 示, 过 线 映 P
其中,K x) 执,i定义为特征点的内积核函数,即
可 得 对 的 征 俪x艇 。 时 我 定 特 空 以 到 应 特 点 (),此 , 们 义 征 间 i 中 mx 相 矩 , 下 的 , 关 阵 如 m维 ,
ptr oni apct n ae r gi n lao. t e n c t pi i o
K y r : r l c a C m oet nl i K r l ) r c a C m oet nl i P ) e u s e e P ni l pnn A a s (e e P A P ni l pnn A a s ( A Fa r e w d K n r p o o i s y s n C ip o s y s C te
sna itn itn apd a ui , 山 i e nrao bten eP A P A vadF ay t drz i r lao om pe dtisd dad e r t i e e Kr l ad ir el . l t a d ao e zi f a a s e n t n e e tn h l w e C n C s e i l h n e n e
Pi i l m oet A a s (C ) I ts e t cnet K r l A d cs d t bs o P A T e r c a C pnn nl i P A. h ppr h ocp o e e P i i us o h ai f . n np o s y s n a , i e f n C s s e n e s C h
用提供了一条有效途径。 关挂词:核主元分析:主元分析:特征提取
A u y Faue t cin to S d o etr E r t M h d t f xa o e fr n l c aC mp n ns a s o K re Pi i l o e t A l i e r p o n nys
将 ( 边 乘 衬() 得 式4 同 以 x , ) 两 k
CX 。 N , , - N
二 乙 a nkkx) x,j =i 乙 a AI x ) j x ,i atix ) v i t j 乓,f
i j 1 月 = j1 =
s e l l at c acm oetc b otnd e s e l n evc r cos et , r ti i u e r ie vnpni l pnn a e a e w n r m ie net de i a s c dw e d a n t var e r r p o i s n b i h e a a i v g o i tn r e e he a n r e l p s c icnee io if te c b nnnam pi . ro , l ap a ip v e f f te a i ad p e ovrd t t a rs e ole ap gTe f a d r c s i d e u etco n a s t n h n u p y i r n h e r v i p o h r d o a r x tn t a e a e a o r r
K a N K 2= A a ( 6 )
其中,K 表示K与自 2 身的乘积。 (可以 从式( 6 得到一个简单 )
的特征值问题:
K a=刀几 a ( 7 )
化为
K a二肠 . () 9
其 , 与R 别 示 关 阵R 特 值 特 矢 由 中 A 分 表 相 矩 的 征 与 征 量。
于等式
其中, 系数矩阵a 表示与核矩阵K的特征值A 相对应的特征
矢 。 量。 归 化 过 关 阵R 特 矢 归 化 量 矢 的 一 通 相 矩 的 征 量4 一
K{ ;) =(二 K, x, }
核矩阵K的 特征值问 题则转化为
Ko 从 a a= o
a 会 一A ・=,“2, k ‘, T a k , ,
式(为系数矩阵a的归一化表达式。 ( 1 ) 1 对于测试样本数据的核主元提取, 我们必须计算测试样
本 数据t 特征空间 特征 在 中的 矢量4方向 投影, k 上的 即
在此前提下来研究核主元分析; 然后再探讨如何实现特征空
间中映射数据的标准化。
设入之 _ A A 表示核矩阵K的 凡> > N 特征值,即
A= A , j N;
J 1, N =, 2 八,
2
核主元分析的概念
对相关矩阵R,有
R 二q q A
其 , 表 相 矩 R 第 个 征 。 时 式7 中 凡 示 关 阵 的 I特 值 此 , ( ) 转
* 广东省自 然科学基金资助项目N . 07) (o 082 0
第 1卷 9
增刊
信 号 处 理
S GNAL ROCES I I P S NG
2 21
将核主元分析归属于非线性方法。然而,与非线性主元分析 的其它形式不同, 核主元分析的实现依赖于线性代数。 因此, 又把核主元分析看作为统计主元分析的自然推广。 设有一个非线性映射
*客x( 二 (P) _pT N( x 1 i )i (
核主元分析可以看成是将训练样本数据经过非线性映
、 。
、、 岸N
k=1 , , , A 2 N
射后的一种统计主元分析处理法。 在统计主元分析中, 训练 样本数据必须满足训练样本数据的标准化
下面我们引入两个矩阵: ① Nx N维矩阵K,即
m t d K r l iape i f t tco ieue. as o t ir utn kr l co i K r l , e o hw n P A pld e u e r tn dcdB cue h n o co o e ef tn e eP A h o e e C s i n r x a i s ae e f t d i f e n u i n n C n
即 S; 上N 一 二。
N ,’ = i
K 扭x l= 。 = (xl } i )扭 ,
称为核矩阵。该矩阵的第 i个元素表示内积核函数 i Kxx) (, 。 ;j
而在核主元分析中,同样必须保证训练样本数据映射后的特