LLE算法中有关参数选取问题的研究
LLE

算法过程 第二步是计算出样本点的局部重建权值矩阵 W。首先定义重构误差 之后定义局部协方差矩阵C: x表示特定的点,η表示x的k个近邻点 其中 最小化得到
核心:这里可以直接计算得到w,然后在步骤3中假设用数据 重构得到的权重w,降维空间中的重构权重w是共享的
算法过程
第三步将所有的样本点映射到低维空间中。映射条 件满足
基本思路
对于一组具有嵌套流行的数据集,在嵌套控件与内
在低维空间局部邻域间的点的关系应该不变。
即在嵌套空间每个采样点都可以用它的近邻点线性
表示,在低维空间中保持每个邻域中的权值不变,
重构原数据点,使重构误差变小。
算法过程
(1)寻找每个样本点的k个近邻点;
(2)由每个样本点的近邻点计算出该样本点的局部
实验观察
从(A)到(b)实现了寻找每个样本点的k个近邻点,然后 使用LLE算法将三维数据(b)映射到二维(c)之 后,映射后的数据仍能保持原有的数据流形(红色 的点互相接近,蓝色的也互相接近), 说明LLE有效地保持了数据原有的流行结构。
实验观察
优点介绍
(1)LLE算法能够突破主元分析法在非线性数据的 局限,可以处理、分析非线性信号。 (2)该算法可以很好表达数据的内在流行结构,这 样可以很好的保留原有数据特征,这点在故障诊 断中有重要的意义。 (3)该算法本身参数的选择很少,故能更好的进行 特征参数优化,这为故障检测和故障诊断打下坚 实的基础。
机器学习与模式识别算法之
LLE
Outlines:
1、背景,基本思想,原理,具体过程及算法 2、相关实验及优缺点分析与应用场合 3、相关改进算法
背景资料
LLE(Locally Linear Embedding,局部线性嵌入算法),是 一种非线性降维算法,它能够使降维后的数据较 好地保持原有流形结构。LLE可以说是流形学习 方法最经典的工作之一。很多后续的流形学习、 降维方法都与LLE有密切联系。
基于改进LLE算法的机械故障特征压缩与诊断

基于改进LLE算法的机械故障特征压缩与诊断王江萍;崔锦【摘要】局部线性嵌入法(locally linear embedding,LLE)是一种典型的流形学习算法.在分析LLE算法的基本计算思路的基础上,提出了一种基于最佳分类效果的k 和d综合参数选择方法.此方法综合考虑了故障类内和类间的离散度,并以此作为LLE算法特征压缩效果的评价依据.根据LLE算法的局部线性特征保持的基本特点,提出了一种增量式LLE算法用于柴油机机械故障特征压缩与诊断中.以平均子带能量法构造特征向量空间,子带数目的确定以同种故障类型特征参数间方差最小为准则.实验中,分别使用基于最佳参数选择的LLE算法、传统的主成分分析(principal component analysis,PCA)、增量式LLE算法对柴油机特征向量进行压缩,并对这三种算法的特征压缩结果运用K近邻算法(K-nearest neighborm,KNN)进行故障诊断与分类.结果表明基于最佳参数选择的LLE算法的诊断分类效果要优于传统的PCA方法,增量式LLE算法也取得良好的分类效果.实验表明,对LLE算法进行有关改进可以很好地应用到机械故障特征压缩与诊断中.【期刊名称】《科学技术与工程》【年(卷),期】2016(016)013【总页数】6页(P86-91)【关键词】改进LLE算法;机械故障诊断;特征压缩;子带能量【作者】王江萍;崔锦【作者单位】西安石油大学机械工程学院,西安710065;西安石油大学机械工程学院,西安710065【正文语种】中文【中图分类】TP391.4现代机械状态监测和故障诊断的方法很多,其实质都是模式识别和分类问题,根据机械设备的运行信息来识别机械设备的有关状态。
机械故障诊断的关键技术是信号的特征提取。
现代机械设备越来越复杂,检测信号又表现为高维非线性。
使用有效的降维方法,使高维信号映射到低维空间中,并且保持原有信号的固有特征和结构尤为重要。
基于LLE算法的图像降维方法研究

基于LLE算法的图像降维方法研究随着现代科技的发展,图像处理技术也越来越重要。
图像降维是图像处理中一个很重要的环节,它能够有效地减少图像数据量,简化分析过程,同时保证图像信息的有效性。
LLE算法是一种基于局部最小化的非线性降维方法,它已经成为图像降维领域中的一项研究焦点。
本文将介绍LLE算法及其在图像降维方面的应用。
一、 LLE算法简介LLE(Locally Linear Embedding)算法是一种非线性降维算法,它的基本思想是保持数据的局部线性结构,并在降维后尽可能地保持这种局部结构。
在LLE算法中,我们首先找到与每个数据点最近的k个邻居。
然后,对于每个数据点,我们通过最小化它与它的邻居之间的距离差异,得到其在低维空间中的表示。
最终,我们可以通过LLE算法中的最小二乘问题,求得数据点在低维空间中的投影。
二、 LLE算法在图像降维中的应用LLE算法在图像降维方面具有很好的应用前景。
在图像处理中,像素之间的关系往往是复杂的非线性关系。
对于图像降维,我们经常需要在保证像素之间关系有效的前提下,减少图像数据量,使分析图像变得更加简单。
而LLE算法正是基于这种效果,能够在保持图像局部结构的情况下,降低图像数据维度。
为了验证LLE算法在图像降维中的应用效果,我们选取了十张随机的灰度图像,每张图像大小为$100\times 100$像素。
然后,我们使用LLE算法在保持每个图像局部结构的情况下,将图像降至两维,从而得到了处理后的图像。
三、 LLE算法处理的效果分析通过对LLE算法处理后的图像进行观察比较,我们得到了以下结论:1. LLE算法能够有效地保留图像的局部结构通过对处理后的图像比较原始图像,我们可以看到LLE算法能够在图像降维的同时,有效地保持每个像素之间的关系。
即使在二维空间中,图像的关键特征也得到了保留。
2. LLE算法能够有效地压缩图像数据对于每张$100\times 100$像素的原始图像,我们使用LLE算法将其降至两维后,得到了每个图像只需$200$个数据点就能完整表示的结果。
高维数据降维算法的研究与优化

高维数据降维算法的研究与优化一、引言随着科技的发展,越来越多的数据被采集并存储,这些数据往往具有高维特征,也就是说,每个样本都包含着众多的属性。
然而,高维数据的处理与分析往往具有挑战性,我们需要寻找一种方法将这些复杂的数据进行简化,这就是降维算法的出现背景。
降维算法可以将高维数据转化为低维数据,从而减少数据的复杂度,方便后续的处理和分析。
本文将介绍常用的高维数据降维算法及其优化方法,为读者提供一些有益的参考。
二、PCA降维算法PCA是一种最常用的降维算法之一,它通过线性变换将原始数据投影到一个新的低维空间中。
该算法的核心思想是找到能最大程度区分数据差异的投影方向,也就是方差最大的方向。
假设原始数据的协方差矩阵为C,则选择前k个最大的特征值对应的特征向量组成投影矩阵,再将原始数据和投影矩阵相乘,即可得到降维后的数据。
但是,PCA算法也存在一些不足之处。
由于它只考虑了方差最大的方向,因此可能会忽略掉数据中一些重要的信息。
此外,该算法要求数据呈线性分布,因此对于非线性数据,其效果会大打折扣。
三、LLE降维算法LLE也是一种常用的降维算法,它的核心思想是通过保持样本间的邻近关系来降维。
具体来说,它先寻找每个样本的k个最近邻,然后将每个样本表示为和它最近邻之间的线性组合,从而得到一个低维表达。
该算法的优点在于它能够保持原始数据的流形结构,对于非线性数据具有很好的效果。
然而,LLE算法也有缺点。
对于噪声数据和稀疏数据,该算法的效果会有所下降。
此外,在选择最近邻时,需要手动确定参数,这也会对算法的效果产生一定的影响。
四、t-SNE降维算法t-SNE是一种非线性降维算法,它通过保持相似样本之间的邻近关系,将高维数据映射到二维或三维空间中。
该算法的核心思想在于,它将高维空间中的距离转化为条件概率,然后计算低维空间中的条件概率,从而最小化两个空间中的KL散度。
t-SNE算法在可视化高维数据方面具有很好的效果,它能够在二维或三维坐标系中保持原始数据的空间分布。
基于差分进化算法的PID参数整定_姜立强

收稿日期:2008-01-14 修回日期:2008-04-22第26卷 第6期计 算 机 仿 真2009年6月文章编号:1006-9348(2009)06-0204-03基于差分进化算法的PI D 参数整定姜立强,刘光斌,郭 铮(第二炮兵工程学院,陕西西安710025)摘要:研究了P I D 控制器的参数整定问题。
常用的工程整定法没有考虑系统的任何要求,只能提供给系统一个稳定的状态,无法使系统运行最佳。
理论设计法只能保证满足系统的某一特性要求。
针对这两种方法存在的缺陷,将差分进化算法应用于PI D 参数整定,提出了基于差分进化算法的PI D 参数整定方法。
新方法根据系统性能指标,设计适应度函数,充分利用差分进化算法优秀的寻优能力,寻找出较优的PID 参数。
最后,通过实例对三种参数整定方法的控制效果进行了仿真和比较,仿真结果证明了基于差分进化算法的PI D 参数整定方法明显优于工程整定法和理论设计法。
关键词:差分进化算法;比例积分微分;参数整定;仿真中图分类号:TP39119 文献标识码:APara m eter Tuni ng of PI D Controller Based on D ifferenti al Evol uti onJI A NG L i-qiang ,LIU G uang-b i n ,GUO Zheng(The Second A rtill e ry Eng i neeri ng A cade m y ,X i p an Shanx i 710025,Chi na)AB STRACT :P I D para m eter t uni ng is studied in th i s paper .Eng i neering tun i ng m et hod can on l y prov i de a stab l e sta te for the syste m and can no tm ake the system run opti m a ll y ,because it doesn p t take the syste m require m en ts i nto consi derati on .T heoretical design m ethod can on l y m ee t a certa i n character i stic requ i re m ent .In orde r to overcom e the d i sadvan tages of t he t w o me t hods ,t h i s paper puts D ifferenti a l Evo l uti on (DE)i nto use for P ID para m eter tun i ng and proposes a new m ethod based on DE .T he fitness f uncti on of DE is designed acco rd i ng to the syste m requ irem ents .Fo r DE p s pow erf u l globa l search ab ility ,the ne w m ethod can obta i n good P ID param eters .A t last ,si m u l a ti ons are ca rried out us i ng the t hree m ethods and the results show that the ne w m ethod ou t perfor m s both the eng i neer i ng t uning m ethod and theo re tica l desi gn m ethod apparently .K EY W ORDS :D ifferenti a l evo luti on ;P roportiona l-integ ra l-differential(P I D );P ara m eter tun i ng ;S i m u l a ti on1 引言P I D 控制至今为止最通用的控制方法。
一种基于改进距离的LLE算法

一种基于改进距离的LLE算法
邹艳;黄天民
【期刊名称】《西南民族大学学报(自然科学版)》
【年(卷),期】2012(038)003
【摘要】为解决现有局部线性嵌入算法处理稀疏不均匀源数据集失效问题,通过引入新的距离度量公式来替代原有算法中的欧氏距离来改进原有算法,在UCI数据集上的实验结果表明:改进后的算法对稀疏数据集比原有算法有更好的降维效果.【总页数】4页(P362-365)
【作者】邹艳;黄天民
【作者单位】西南交通大学数学学院,成都 610031;西南交通大学数学学院,成都610031
【正文语种】中文
【中图分类】O24
【相关文献】
1.基于LLE及其改进距离算法的轴承故障诊断模型 [J], 魏永合;刘炜;杨艳君;苏君金
2.基于模糊聚类和测地距离的 LLE 算法 [J], 张晓宇;孙海霞;黄天民
3.基于改进距离的LLE算法在人脸识别中的应用 [J], 狄晨;王伟智
4.基于聚类和改进距离的LLE方法在数据降维中的应用 [J], 王和勇;郑杰;姚正安;李磊
5.基于通勤时间距离与Rank-Order距离的LLE算法改进 [J], 吕冰倩;范林元
因版权原因,仅展示原文概要,查看原文内容请购买。
非线性数据降维方法---LLE及其改进算法介绍

⾮线性数据降维⽅法---LLE及其改进算法介绍LLE及其改进算法介绍Locally linear embedding (LLE) (Sam T.Roweis and Lawrence K.Saul, 2000)以及Supervised locally linear embedding (SLLE) (Dick and Robert, 2002) 是最近提出的⾮线性降维⽅法,它能够使降维后的数据保持原有拓扑结构。
LLE算法可以有图1所⽰的⼀个例⼦来描述。
在图1所⽰中,LLE能成功地将三维⾮线性数据映射到⼆维空间中。
如果把图1(B)中红颜⾊和蓝颜⾊的数据分别看成是分布在三维空间中的两类数据,通过LLE算法降维后,则数据在⼆维空间中仍能保持相对独⽴的两类。
在图1(B)中的⿊⾊⼩圈中可以看出,如果将⿊⾊⼩圈中的数据映射到⼆维空间中,如图1(C)中的⿊⾊⼩圈所⽰,映射后的数据任能保持原有的数据流形,这说明LLE算法确实能保持流形的领域不变性。
由此LLE算法可以应⽤于样本的聚类。
⽽线性⽅法,如PCA和MDS,都不能与它⽐拟的。
LLE算法操作简单,且算法中的优化不涉及到局部最⼩化。
该算法能解决⾮线性映射,但是,当处理数据的维数过⼤,数量过多,涉及到的稀疏矩阵过⼤,不易于处理。
在图1中的球形⾯中,当缺少北极⾯时,应⽤LLE算法则能很好的将其映射到⼆维空间中,如图1中的C所⽰。
如果数据分布在整个封闭的球⾯上,LLE则不能将它映射到⼆维空间,且不能保持原有的数据流形。
那么我们在处理数据中,⾸先假设数据不是分布在闭合的球⾯或者椭球⾯上。
图1 ⾮线性降维实例:B是从A中提取的样本点(三维),通过⾮线性降维算法(LLE),将数据映射到⼆维空间中(C)。
从C图中的颜⾊可以看出通过LLE算法处理后的数据,能很好的保持原有数据的邻域特性LLE算法是最近提出的针对⾮线性数据的⼀种新的降维⽅法,处理后的低维数据均能够保持原有的拓扑关系。
局部线性嵌入算法及其稳定性实现

局部线性嵌入算法及其稳定性实现摘要:局部线性嵌入算法是一种非线性降维方法,其能够处理高维数据,并能够保留数据的局部结构。
在本文中,我们将介绍局部线性嵌入算法的原理和实现方法。
我们还将讨论该算法的稳定性,并提出一些改进方法。
关键词:局部线性嵌入算法;非线性降维;稳定性正文:局部线性嵌入算法是一种基于局部线性关系的非线性降维方法。
其主要思想是通过对高维数据进行线性近似,来保留其局部结构,从而达到降维的目的。
该算法的主要步骤如下:1. 对每个数据点找到其局部邻域。
2. 在每个邻域中拟合一个线性模型。
3. 利用这些线性模型进行降维。
该算法通常使用局部加权线性回归(LWLR)来拟合线性模型。
LWLR在每个邻域内根据距离来赋予不同的权重,从而保证了更近的点对模型的贡献更大。
然而,由于数据的局部结构可能会受到噪声的影响,局部线性嵌入算法的稳定性可能会受到影响。
为了提高其稳定性,我们可以采用以下几种方法:1. 鲁棒性的LWLR:该方法使用鲁棒性的回归来避免噪声对局部结构的影响。
例如,使用Huber损失函数来替代平方损失函数。
2. 局部局限正则化:该方法通过对邻域内的线性模型引入L1或L2正则项,从而加强模型的鲁棒性。
3. 局部不变性:通过在LWLR中使用局部分段加权线性回归(LPWLR),以更好的适应数据的非线性结构。
在实际应用中,局部线性嵌入算法已经广泛应用于图像处理、生物信息学等领域,其在降维、特征提取等任务中都取得了良好的效果。
结论:尽管局部线性嵌入算法在处理高维数据方面很有效,但在应用中仍需要考虑其稳定性。
通过使用鲁棒性回归、局部局限正则化或局部不变性等方法,我们可以进一步提高算法的稳定性,以更好地适应实际应用中的挑战。
本文中介绍的局部线性嵌入算法是一种非常有效的降维算法,它可以将高维数据映射到低维空间中,并尽可能地保留了原始数据的结构和信息。
然而,在实际应用中,我们也需要考虑其稳定性以及不同方法之间的差异。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3) 将原始高维空间中的所有数据样本点映射嵌入到低维空间中,映射嵌入满足如下条件:
min Φ (Y )=
= i 1= j 1
∑
N
yi − ∑ wij yij
k
2
其中, Φ (Y ) 为损失函数。此时固定局部重建权值矩阵 W ,优化输出向量 Y 。且向量 Y 应满足以下两个 条件: ∑ yi = 0 和
Research on the Problem of Selecting the Parameter Values for LLE Algorithm
Fang Li, Xiang Gao*
School of Mathematical Sciences, Ocean University of China, Qingdao Shandong Received: Feb. 21 , 2017; accepted: Mar. 6 , 2017; published: Mar. 9 , 2017
k 个近邻点。
2) 由每个样本点 xi i = 1, 2, N 的 k 个近邻点计算出该样本点的局部重建权值矩阵 W :
= W arg min ε = (W )
= i 1= j 1
∑
N
xi − ∑ wij xij
k
2
其中, xij 表示第 i 样本点个 xi 的 k 个近邻点。 wij 表示第 j 个近邻点对第 i 样本点 xi 的权值(即贡献),且满 足条件: ∑ wij = 1 。
Statistics and Application 统计学与应用, 2017, 6(1), 7-16 Published Online March 2017 in Hans. /journal/sa https:///10.12677/sa.2017.61002
设给定数据集合 X = { x1 , x2 , , xN } 采样于某个潜在的光滑的流行,且这些数据包含 N 个实值向量, 向量的维数为 D 。采样的数据点要求足够多,每个采样数据点及其近邻点都落在该潜在流行的一个局部 线性块上或该块附近。从而采样数据点所在的低维流形在局部是线性的,每个采样点都可以用它的近邻 点线性表出。 进一步我们就可以得到数据样本点的局部重建权值矩阵 W 。 由于 LLE 算法是基于通过保持 高维数据与低维数据间的局部领域几何结构不变的几何思想,用局部的线性来逼近全局的非线性。而局 部重建权值矩阵 W 又代表着局部信息,可以用于刻画流行的局部几何性质,因而保持 W 固定不变,在使
= X 得重构的误差最小的条件下,优化输出原始高维空间中所有的数据样本点 = Y 入到低维空间中的数据
{ y1 , y2 , , yN } ∈ R d 。
{ x1 , x2 , , xN } ∈ R D 映射嵌
1) 对于高维空间的每个样本点 xi i = 1, 2, N ,计算和其他 N − 1 个样本点之间的距离。根据距离的 远近,找出与 xi 最近的 k 个点作为其近邻点( k 是一个预先给定值)。
2. LLE 算法介绍
流形学习的目的[3],就是找出原始高维空间中数据样本点隐藏在高维空间中的低维结构。针对高维 空间中的非线性流行, 2000 年, Roweis 和 Saul 在 Science 上提出了一种非线性降维方法——LLE 算法[4]。
8
李芳,高翔
2.1. LLE 算法的基本思想
LLE 是一种无监督的降维方法。其核心主要是将流形上的近邻点映射到低维空间的近邻点,保存原 流行中的局部几何特性,以达到高维数据映射到低维全局坐标系中的目的。该算法的前提假设是采样数 据所在的低维流形在局部是线性的,即每个采样点可以用它的近邻点线性表出。 LLE 算法基于用局部的线性来逼近全局的非线性,通过保持高维数据与低维数据间的局部领域几何 结构不变的几何思想,使在高维空间中相邻或相关的两个点映射到低维空间中也同样相邻或相关。LLE 算法是依赖于局部线性的的算法。它认为在局部意义下,数据的结构是线性的,或者说,局部意义下的 点在一个超平面上。再通过互相重叠的局部邻域来提供整体的信息,从而保证整体的几何性质,得到一 个全局的坐标系统。 如图 1 所示, LLE 算法能成功地将三维非线性数据映射到二维空间中[5]。 (A)中不同的颜色分别代表 原始三维空间中流行的不同结构; (B)是通过随机采样从原始三维空间(A)中提取的数据样本点; 通过 LLE 算法降维后,我们看到原始三维空间的数据样本点(B)映射到了二维空间中;通过观察(C),我们知道,通 过 LLE 算法降维后的数据样本点在二维空间中仍能保持相对独立的状态,即红色的点互相接近,黄色的 点互相接近,蓝色的也互相接近。这说明在将原始高维空间中的数据样本点映射到低维全局坐标系的过 程中,LLE 算法确实能有效地保持原有数据的邻域特性和流形结构。而线性方法,如 PCA 和 MDS,都 不能与 LLE 算法相比拟。 当原始高维空间中的数据分布在缺少北极面的球形面时,如最后一行图所示,在保持原有数据流行 的局部领域几何结构不变的意义下,应用 LLE 算法仍能很好地将其映射到二维空间中。但是,在有些情 况下 LLE 算法也并不适用,即如果原始高维空间中的数据分布在整个封闭的球面上,LLE 算法则不能通 过降维将它映射到二维空间,且不能保持原有的数据流形。所以在我们应用 LLE 算法处理原始高维空间 中的数据的时候,首先要假设原始高维空间中的数据不是分布在闭合的球面或者椭球面上。
(A) (B) (C)
Figure 1. Reduced-Dimension Map: map three-dimensional data into a twodimensional system by LLE 图 1. LLE 算法将三维非线性数据映射到二维空间的降维图
9翔*
中国海洋大学数学科学学院,山东 青岛
收稿日期:2017年2月21日;录用日期:2017年3月6日;发布日期:2017年3月9日
摘
要
本文针对locally linear embedding (LLE)算法中的两个参数:近邻点的个数 k 和降维后输出的维数 d 如 何选取的问题,对LLE算法进行了改进。首先对降维的相关知识进行了描述,并具体介绍了对高维数据 进行降维的目的。其次,讨论了LLE算法的基本思想和计算步骤。最后,针对LLE算法中存在的问题进行 了分析。
st th th
Abstract
Aiming at the problem of how to select two parameter values, the number of nearest neighbor points k and the output dimension d , locally linear embedding (LLE) algorithm is improved. Firstly, we describe dimensionality reduction and why reduce dimension of high-dimensional data. Secondly, we discuss the basic idea and computational procedure of the LLE algorithm. Finally, the problems existing in the LLE algorithm are analyzed.
i =1 N
1 N
∑ yi yiT = I 。
i =1
N
= X 根据高维空间中的样本点 = Y 低维空间中的数据
{ x1 , x2 , , xN } ∈ R D 和它的近邻点 xij 之间的权重 wij 来计算映射嵌入到 { y1 , y2 , , yN } ∈ R d 。由于 LLE 算法要求映射嵌入低维空间中的数据尽量保持高维
1.2. 降维的含义与目的
所谓的降维就是指采用某种映射方法[2],将原高维空间中的数据点映射到低维的空间中,从而找到 隐藏在高位观测数据中有意义的低维结构。降维的本质是学习一个映射函数 f : x → y ,其中 x 是原始高 维空间中数据点的表达,目前最多使用向量表达形式。 y 是数据点映射后的低维向量表达,通常 y 的维 度小于 x 的维度。 f 可能是显式的或隐式的、线性的或非线性的。 对原始空间或输入空间的高维数据降维的目的主要有以下四个方面: 1) 压缩数据到低维空间,可以解决“维数灾难”的问题,降低存储要求,并简化计算复杂度。 2) 在剔除冗余信息的同时,也降低了噪声对原始数据的影响。 3) 从非结构化数据集中提取出某种结构化成分,有利于寻找原始高维空间中数据的内在规律与本质 特征,以便更好地认识和理解数据。 4) 把数据投影到低维空间,特别是人眼可观测的二维空间或三维空间,可以实现高维数据可视化。
*
通讯作者。
文章引用: 李芳, 高翔. LLE 算法中有关参数选取问题的研究[J]. 统计学与应用, 2017, 6(1): 7-16. https:///10.12677/sa.2017.61002
李芳,高翔
关键词
LLE算法,相关系数,近邻点的个数 k ,极大似然估计,降维后输出的维数 d
Keywords
LLE Algorithm, Correlation Coefficient, Number of Nearest Neighbor Points k , Maximum Likelihood Estimation, Output Dimension d
LLE算法中有关参数选取问题的研究
空间中的局部线性结构。而局部重建权值矩阵 W 又代表着局部信息,因而在将原始高维空间中的所有数 据样本点映射嵌入到低维空间中的过程中,要保持局部重建权值矩阵 W 固定不变。另外,为了让重构的 误差最小,局部重建权值矩阵 W 必须服从一种重要的对称性。即对所有特定样本点来说,他们与自己的 近邻点之间经过旋转、重新排列、转换等各种变换后,彼此之间的拓扑结构必须保持不变,已达到让局 部重建权值矩阵 W 准确描述每个近邻的基本几何特性的要求。 所以可以认为, 应用 LLE 算法映射嵌入后 的低维流形上的局部拓扑结构,和原始高维空间内的数据的局部几何特性是完全等效的(图 2)。