线性判别分析

合集下载

第8章-线性判别分析--机器学习与应用第二版

第8章-线性判别分析--机器学习与应用第二版

第8章线性判别分析主成分分析的目标是向量在低维空间中的投影能很好的近似代替原始向量,但这种投影对分类不一定合适。

由于是无监督的学习,没有利用样本标签信息,不同类型样本的特征向量在这个空间中的投影可能很相近。

本章要介绍的线性判别分析也是一种子空间投影技术,但是它的目的是用来做分类,让投影后的向量对于分类任务有很好的区分度。

8.1用投影进行分类线性判别分析(Linear discriminant analysis,简称LDA)[1][2]的基本思想是通过线性投影来最小化同类样本间的差异,最大化不同类样本间的差异。

具体做法是寻找一个向低维空间的投影矩阵W,样本的特征向量x经过投影之后得到新向量:y Wx=同一类样本投影后的结果向量差异尽可能小,不同类的样本差异尽可能大。

直观来看,就是经过这个投影之后同一类的样本尽量聚集在一起,不同类的样本尽可能离得远。

下图8.1是这种投影的示意图:图8.1最佳投影方向上图中特征向量是二维的,我们向一维空间即直线投影,投影后这些点位于直线上。

在上图中有两类样本,通过向右上方的直线投影,两类样本被有效的分开了。

绿色的样本投影之后位于直线的下半部分,红色的样本投影之后位于直线的上半部分。

由于是向一维空间投影,这相当于用一个向量w和特征向量x做内积,得到一个标量:Ty=w x8.2寻找投影矩阵8.2.1一维的情况问题的关键是如何找到最佳投影矩阵。

下面先考虑最简单的情况,把向量映射到一维空间。

假设有n 个样本,它们的特征向量为i x ,属于两个不同的类。

属于类1C 的样本集为1D ,有1n 个样本;属于类2C 的样本集为2D ,有2n 个样本。

有一个向量w ,所有向量对该向量做投影可以得到一个标量:T y =w x投影运算产生了n 个标量,分属于与1C 和2C 相对应的两个集合1Y 和2Y 。

我们希望投影后两个类内部的各个样本差异最小化,类之间的差异最大化。

类间差异可以用投影之后两类样本均值的差来衡量。

linear discriminate analysis

linear discriminate analysis

linear discriminate analysis【实用版】目录1.线性判别分析的定义和基本概念2.线性判别分析的应用场景和问题解决能力3.线性判别分析的具体方法和步骤4.线性判别分析的优缺点和局限性5.线性判别分析的实际应用案例正文线性判别分析(Linear Discriminant Analysis,简称 LDA)是一种常用的监督学习方法,主要用于解决分类问题。

它是一种线性分类方法,通过找到一个最佳的线性分类器,将数据分为不同的类别。

LDA 基于数据分布的假设,即不同类别的数据具有不同的分布,通过最大化类内差异和最小化类间差异来实现分类。

LDA 的应用场景非常广泛,可以用于文本分类、图像分类、生物信息学、社会科学等领域。

在这些领域中,LDA 能够有效地解决分类问题,提高分类准确率。

例如,在文本分类中,LDA 可以通过分析词汇分布,将文本分为不同的主题或类别。

线性判别分析的具体方法和步骤如下:1.收集数据并计算数据矩阵。

2.计算数据矩阵的协方差矩阵和矩阵的特征值和特征向量。

3.根据特征值和特征向量构建线性分类器。

4.使用分类器对数据进行分类。

尽管 LDA 在分类问题上表现良好,但它也存在一些优缺点和局限性。

首先,LDA 要求数据矩阵的列向量是线性无关的,这可能会限制其在某些数据集上的表现。

其次,LDA 对数据中的噪声非常敏感,噪声的存在可能会对分类结果产生不良影响。

此外,LDA 是一种基于线性分类的方法,对于非线性分类问题可能无法有效解决。

尽管如此,LDA 在实际应用中仍然具有很高的价值。

例如,在文本分类中,LDA 可以有效地识别不同主题的文本,并为用户提供个性化的推荐。

在生物信息学中,LDA 可以用于基因表达数据的分类,以识别不同类型的细胞或疾病。

在社会科学中,LDA 可以用于对调查数据进行分类,以便更好地理解受访者的需求和偏好。

总之,线性判别分析是一种强大的分类方法,可以应用于各种领域。

线性判别分析

线性判别分析

线性判别分析
线性判别分析(linear discriminant analysis,LDA)是对费舍尔的线性鉴别方法的归纳,这种方法使用统计学,模式识别和机器学习方法,试图找到两类物体或事件的特征的一个线性组合,以能够特征化或区分它们。

所得的组合可用来作为一个线性分类器,或者,更常见的是,为后续的分类做降维处理。

之前我们讨论的PCA、ICA也好,对样本数据来言,可以是没有类别标签y的。

回想我们做回归时,如果特征太多,那么会产生不相关特征引入、过度拟合等问题。

我们可以使用PCA来降维,但PCA没有将类别标签考虑进去,属于无监督的。

比如回到上次提出的文档中含有“learn”和“study”的问题,使用PCA后,也许可以将这两个特征合并为一个,降了维度。

但假设我们的类别标签y是判断这篇文章的topic是不是有关学习方面的。

那么这两个特征对y几乎没什么影响,完全可以去除。

Fisher提出LDA距今已近七十年,仍然是降维和模式分类领域应用中最为广泛采用而且极为有效的方法之一,其典型应用包括人脸检测、人脸识别、基于视觉飞行的地平线检测、目标跟踪和检测、信用卡欺诈检测和图像检索、语音识别等。

线性判别分析(LinearDiscriminantAnalysis,LDA)

线性判别分析(LinearDiscriminantAnalysis,LDA)

线性判别分析(LinearDiscriminantAnalysis,LDA)⼀、LDA的基本思想线性判别式分析(Linear Discriminant Analysis, LDA),也叫做Fisher线性判别(Fisher Linear Discriminant ,FLD),是模式识别的经典算法,它是在1996年由Belhumeur引⼊模式识别和⼈⼯智能领域的。

线性鉴别分析的基本思想是将⾼维的模式样本投影到最佳鉴别⽮量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的⼦空间有最⼤的类间距离和最⼩的类内距离,即模式在该空间中有最佳的可分离性。

如下图所⽰,根据肤⾊和⿐⼦⾼低将⼈分为⽩⼈和⿊⼈,样本中⽩⼈的⿐⼦⾼低和⽪肤颜⾊主要集中A组区域,⿊⼈的⿐⼦⾼低和⽪肤颜⾊主要集中在B组区域,很显然A组合B组在空间上明显分离的,将A组和B组上的点都投影到直线L上,分别落在直线L的不同区域,这样就线性的将⿊⼈和⽩⼈分开了。

⼀旦有未知样本需要区分,只需将⽪肤颜⾊和⿐⼦⾼低代⼊直线L的⽅程,即可判断出未知样本的所属的分类。

因此,LDA的关键步骤是选择合适的投影⽅向,即建⽴合适的线性判别函数(⾮线性不是本⽂的重点)。

⼆、LDA的计算过程1、代数表⽰的计算过程设已知两个总体A和B,在A、B两总体分别提出m个特征,然后从A、B两总体中分别抽取出、个样本,得到A、B两总体的样本数据如下:和假设存在这样的线性函数(投影平⾯),可以将A、B两类样本投影到该平⾯上,使得A、B两样本在该直线上的投影满⾜以下两点:(1)两类样本的中⼼距离最远;(2)同⼀样本内的所有投影距离最近。

我们将该线性函数表达如下:将A总体的第个样本点投影到平⾯上得到投影点,即A总体的样本在平⾯投影的重⼼为其中同理可以得到B在平⾯上的投影点以及B总体样本在平⾯投影的重⼼为其中按照Fisher的思想,不同总体A、B的投影点应尽量分开,⽤数学表达式表⽰为,⽽同⼀总体的投影点的距离应尽可能的⼩,⽤数学表达式表⽰为,,合并得到求从⽽使得得到最⼤值,分别对进⾏求导即可,详细步骤不表。

线性判别分析(LDA)

线性判别分析(LDA)

线性判别分析(LDA)说明:本⽂为个⼈随笔记录,⽬的在于简单了解LDA的原理,为后⾯详细分析打下基础。

⼀、LDA的原理LDA的全称是Linear Discriminant Analysis(线性判别分析),是⼀种supervised learning。

LDA的原理:将带上标签的数据(点),通过投影的⽅法,投影到维度更低的空间中,使得投影后的点,会形成按类别区分,⼀簇⼀簇的情况,相同类别的点,将会在投影后的空间中更接近。

因为LDA是⼀种线性分类器。

对于K-分类的⼀个分类问题,会有K个线性函数:当满⾜条件:对于所有的j,都有Yk > Yj,的时候,我们就说x属于类别k。

上式实际上就是⼀种投影,是将⼀个⾼维的点投影到⼀条⾼维的直线上,LDA最求的⽬标是,给出⼀个标注了类别的数据集,投影到了⼀条直线之后,能够使得点尽量的按类别区分开,当k=2即⼆分类问题的时候,如下图所⽰:上图提供了两种⽅式,哪⼀种投影⽅式更好呢?从图上可以直观的看出右边的⽐左边的投影后分类的效果好,因此右边的投影⽅式是⼀种更好地降维⽅式。

LDA分类的⼀个⽬标是使得不同类别之间的距离越远越好,同⼀类别之中的距离越近越好。

⼆、LDA算法流程输⼊:数据集 D = {(x1, y1), (x1, y1), ... ,(x m, y m)},任意样本x i为n维向量,y i∈{C1, C2, ... , Ck},共k个类别。

现在要将其降维到d维;输出:降维后的数据集D'。

(1)计算类内散度矩阵 S B;(2)计算类间散度矩阵 S W;(3)将 S B和 S W代⼊上⾯公式计算得到特征值λ和特征向量 w,取前⾯⼏个最⼤的特征值向量λ'与特征向量相乘得到降维转换矩阵λ'w;(4)将原来的数据与转换矩阵相乘得到降维后的数据 (λ'w)T x ;三、LDA优缺点分析LDA算法既可以⽤来降维,⼜可以⽤来分类,但是⽬前来说,主要还是⽤于降维。

数据挖掘中的线性判别分析方法原理解析

数据挖掘中的线性判别分析方法原理解析

数据挖掘中的线性判别分析方法原理解析数据挖掘是一门利用计算机技术从大量数据中挖掘出有用信息的学科。

在这个信息爆炸的时代,人们面临着海量的数据,如何从中提取出有价值的信息成为了一项重要的任务。

线性判别分析(Linear Discriminant Analysis,简称LDA)是数据挖掘中一种常用的分类方法,它能够在高维数据中找到最佳的投影方向,从而实现数据的降维和分类。

LDA方法的基本思想是在保持不同类别之间的区分能力最大化的同时,最大化同一类别内部的相似性。

具体而言,LDA通过计算类别之间的散度和类别内部的散度来确定最佳的投影方向。

散度可以理解为数据的离散程度,散度越大表示数据之间的差异越大,散度越小表示数据之间的差异越小。

在进行LDA之前,首先需要对数据进行预处理。

通常情况下,我们会对数据进行标准化处理,使得数据的均值为0,方差为1。

这样可以避免某些特征对于分类结果的影响过大。

接下来,我们需要计算类别之间的散度和类别内部的散度。

类别之间的散度可以通过计算不同类别之间的均值差异来得到。

而类别内部的散度可以通过计算每个类别内部的协方差矩阵来得到。

协方差矩阵描述了数据之间的相关性,可以用来衡量数据的离散程度。

在计算完散度之后,我们需要求解一个优化问题,即最大化类别之间的散度和最小化类别内部的散度。

这个优化问题可以通过求解广义瑞利商的最大特征值和对应的特征向量来实现。

最大特征值对应的特征向量就是最佳的投影方向,它能够将数据从高维空间映射到一维空间。

通过LDA方法,我们可以将高维数据映射到低维空间,并且保持了数据的分类信息。

这样不仅可以减少数据的维度,降低计算复杂度,还可以提高分类的准确性。

除了在数据挖掘中的应用,LDA方法还被广泛应用于模式识别、人脸识别、图像处理等领域。

在人脸识别中,LDA可以提取出最具有判别性的特征,从而提高识别的准确性。

在图像处理中,LDA可以将图像从高维空间映射到低维空间,从而实现图像的降噪和压缩。

线性判别分析

线性判别分析

用线性判别分析(Linear Discriminant Analysis )对Wine 数据集进行分类 1. 线性判别分析(LDA )原理LDA 是统计学上一种经典的分析方法,在医学中的患者疾病分级、经济学的市场定位、产品管理、市场研究、人脸识别和机器学习等领域有广泛的应用。

LDA 可以用于对数据进行分类,首先,我们要用事先分好类的数据对LDA 进行训练,建立判别模型,所以LDA 属于监督学习的算法。

LDA 的基本思想是投影,将n 维数据投影到低维空间,使得投影后组与组之间尽可能分开,即在该空间中有最佳的可分离性,而衡量标准是新的子空间有最大的类间距离和最小的类内距离。

LDA 的目标是求出使新的子空间有最大的类间距离和最小的类内距离的向量a ,构造出判别模型。

形象地理解,如图1,红色点和蓝色点分别代表两个类别的数据,他们是二维的,取二维空间中的任一个向量,作各点到该向量的投影,可以看到,右图比左图投影后的分类效果好。

再如图2,是三维空间的各点作投影到二维空间,可以看到左图比右图分类效果好。

有时需要根据实际选择投影到几维才能实现最好的分类效果。

构造判别模型的过程: (1) 作投影设n 维数据样本集X={x i |i=1,2,3…j},这j 个样本可以分为k 个类别X 1,X 2,…,X k . 令w 为n 维空间中任一向量,则样本x i 在w 上的投影为w T x i ,得到的是一维数据. (2) 计算投影后的类内距离与类间距离其中利用了方差分析的思想:类内距离:E 0= ∑∑(w T x −w T X t ̅̅̅)2x∈X t k t=1X t ̅̅̅表示 X t 中的样本未投影前的平均.整理得 E 0=w T E w 其中矩阵E=∑∑(x −X t ̅̅̅)(x −X t ̅̅̅)T x∈X tk t=1类间距离:B 0= ∑n t (w T X t ̅̅̅−w T X ̅)2k t=1X̅表示所有样本未投影前的平均,n t 表示X t 中样本数 整理得 B 0=w T Bw 其中矩阵B= ∑n t (X t ̅̅̅−X ̅)(X t ̅̅̅−X ̅)T k t=1(3) 构造目标函数为了得到最佳的w ,我们希望E 0尽量小,B 0尽量大,因此构造J(w)= B0E 0问题转化为求w 使J(w)达到极大值,但使J(w)达到最大值的w 不唯一,于是我们加上一个约束条件E 0=1即求w ,使J(w)在约束条件E 0=1下达到极大值(4) 拉格朗日乘数法求w利用拉格朗日乘数法我们可以得到以下等式(E −1B)w =λw λ为拉格朗日乘子即λ为E −1B 的特征值,w 为对应的特征矩阵 由特征方程|E −1B −λI |= 0 可解除 特征值λ 和特征向量 w(5) 导出线性判别函数把特征值由大到小排列,取最大的特征值,所求w 就是对应的特征向量w 导出线性判别函数为u(x)=wx若用一个线性判别函数不能很好区别各个总体,可用第二大特征根,第三大特征根……对应的特征向量构造线性判别函数进行判别(即上面所说根据实际选择降维到几维空间),线性判别函数个数不超过k-1个。

线性判别分析

线性判别分析

线性判别分析(Linear DiscriminantAnalysis,LDA)是模式识别中较常用的一种算法,主要思想是最小化类内距离的同时最大化类间距离,得到最优的投影方向以产生最好的分类结果。

线性判别分析算法由于其简单有效性在多个领域都得到了广泛地应用,但是算法本身仍然存在一些局限性需要进行研究改进。

小样本问题由于样本库中的样本数量远小于样本的特征维数,样本与样本之间的距离变大使得距离度量失效,使LDA算法中的类内、类间离散度矩阵奇异,不能得到最优的投影方向,在人脸识别领域中表现得尤为突出。

目前影响线性判别分析算法在人脸识别领域中的识别结果的主要问题是光照、表情等外部条件变化引起的面部大变化带来的识别问题。

光照、表情等变化问题会使图像像素值发生大变化,引起人脸图像呈非凸复杂分布。

使用线性特征的基于外观的识别算法(如LDA)在光照、表情等变化下的识别性能下降,这是人脸识别中目前普遍存在的难题。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性判别分析(LDA)
介绍
线性判别分析(Linear Discriminant Analysis, LDA),也 叫做Fisher线性判别(Fisher Linear Discriminant ,FLD), 是模式识别的经典算法,1936年由Ronald Fisher首次提出, 并在1996年由Belhumeur引入模式识别和人工智能领域。
LDA
对于N(N>2)分类的问题,就可以直接写出以下的结论:
这同样是一个求特征值的问题,求出的第i大的特征向量,即为 对应的Wi。
LDA在人脸识别中的应用
要应用方法
K-L变换 奇异值分解 基于主成分分析 Fisher线性判别方法
主要应用方法
K-L变换
为了得到彩色人脸图像的主分量特征灰度图像,可以采用Ohta[3]等人提 出的最优基来模拟K-L变换方法,从而得到新的包含了彩色图像的绝大多 数特征信息的主分量特征图像.
LDA
LDA与PCA(主成分分析)都是常用的降维技术。PCA主要是从 特征的协方差角度,去找到比较好的投影方式。LDA更多的是 考虑了标注,即希望投影后不同类别之间数据点的距离更大, 同一类别的数据点更紧凑。
下面给出一个例子,说明LDA的目标:
可以看到两个类别,一个绿色类别,一个红色类别。左图是两个 类别的原始数据,现在要求将数据从二维降维到一维。直接投影 到x1轴或者x2轴,不同类别之间 会有重复,导致分类效果下降。 右图映射到的直线就是用LDA方法计算得到的,可以看到,红色 类别和绿色类别在映射之后之间的距离是最大的,而且每个类别 内 部点的离散程度是最小的(或者说聚集程度是最大的)。
LDA
假设用来区分二分类的直线(投影函数)为: LDA分类的一个目标是使得不同类别之间的距离越远越好,同 一类别之中的距离越近越好,所以我们需要定义几个关键的值:
LDA
类别i的原始中心点(均值)为:(Di表示属于类别i的点):
类别i投影后的中心点为:
衡量类别i投影后,类别点之间的分散程度(方差)为:
基于主成分分析(principal component analysis,简称PCA) 该方法将人脸图像按行(列)展开所形成的一个高维向量看作是一种随机 向量,因此可以采用K-L变换获得其正交K-L基底.对应于其中较大特征值 的基底具有与人脸相似的形状,故称其为特征脸.利用相对较小的 Eigenface集描述人脸,这样每幅人脸图像就对应于一个维数较低的权向 量,因此,人脸识别可以在降维后的空间上进行.然而,该方法的缺点是,得 到的特征在一般情况下是最佳描述特征(the most expressive features,简称MEFs),而不是最佳分类特征(the most discriminating features,简称MDFs).
主要应用方法
Fisher线性判别方法(Fisher linear discriminant analysis,简称 FLD)
使投影后的模式样本的类间散布矩阵最大而类内散布矩阵最小,也就是说 ,投影后保证模式样本在新的空间中有最大的类间距离和最小的类内距离 ,即模式在该空间中有最佳的可分离性.Fisher线性判别分析提取的特征 向量集强调的是不同人脸的差异而不是照明条件、人脸表情和方向的变 化.因而,采用FLD方法对光照条件、人脸姿态等的变化不太敏感,从而有 助于提高识别效果。然而,由于在正常情况下人脸识别问题总是一个小样 本问题,故其类内散布矩阵总为奇异阵而使此方法的求解变得很困难.
主要应用方法
奇异值分解(singular value decomposition,简称SVD) 是一种有效的代数特征提取方法.由于奇异值特征在描述图像时是稳定的 ,且具有转置不变性、旋转不变性、位移不变性、镜像变换不变性等重要 性质,因此奇异值特征可以作为图像的一种有效的代数特征描述。
主要应用方法
LDA
我们定义一个投影前的各类别分散程度的矩阵,这个矩阵看起 来有一点麻烦,其实意思是,如果某一个分类的输入点集Di里 面的点距离这个分类的中心店mi越近,则Si里面元素的值就越 小,如果分类的点都紧紧地围绕着mi,则Si里面的元素值越更 接近0.
带入Si,将J(w)分母化为:
LDA
同样的将J(w)分子化为: 这样目标优化函数可以化成下面的形式: 推导过程忽略了,最后推导结果如下:
基本思想
线性判别分析的基本思想是将高维的模式样本投影到最佳 鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效 果。投影后保证模式样本在新的子空间有最大的类间距离和最 小的类内距离,即模式在该空间中有最佳的可分离性。
因此,它是一种有效的特征抽取方法。使用这种方法能够使投 影后模式样本的类间散布矩阵最大,并且同时类内散布矩阵最 小。
LDA
上式实际上就是一种投影,是将一个高维的点投影到一条高维 的直线上,LDA最求的目标是,给出一个标注了类别的数据集, 投影到了一条直线之后,能够使得点尽量的按类别区分开,当 k=2即二分类问题的时候,如下图所示:
红色的方形的点为0类的原始点、蓝色的方形点为1类的原始点,经过 原点的那条线就是投影的直线,从图上可以清楚的看到,红色的点和 蓝色的点被原点明显的分开了,这个数据只是随便画的,如果在高维 的情况下,看起来会更好一点。下面我来推导一下二分类LDA问题的 公式:
最终我们可以得到一个下面的公式,表示LDA投影到w后的目 标优化函数:
LDA
我们分类的目标是,使得类别内的点距离越近越好(集中), 类别间的点越远越好。
LDA
分母表示每一个类别内的方差之和,方差越大表示一个类别内 的点越分散,分子为两个类别各自的中心点的距离的平方,我 们最大化J(w)就可以求出最优的w
LDA
要说明白LDA,首先得弄明白线性分类器(Linear Classifier)
:因为LDA是一种线性分类器。对于K-分类的一个分类问题,
会有K个线性函数:
权向量(weight vector) 法向量(normal vector)
阈值(threshold) 偏置(bias)
当满足条件:对于所有的j,都有Yk > Yj,的时候,我们就说x 属于类别k。对于每一个分类,都有一个公式去算一个分值, 在所有的公式得到的分值中,找一个最大的,就是所属的分类 。
相关文档
最新文档