线性判别分析

合集下载

LDA线性判别分析

LDA线性判别分析LDA（Linear Discriminant Analysis），也被称为Fisher线性判别分析，是一种经典的统计模型和机器学习算法，常用于降维和模式识别任务。

LDA的目标是寻找一个线性变换，将高维数据投影到一个低维子空间上，使得在该子空间上的投影具有最优的数据分离性能。

换句话说，LDA希望找到投影方式，使得不同类别的数据在低维子空间上的投影显著分离，并且同一类别内部的数据尽可能地紧密聚集。

LDA的基本思想是通过计算类间离散度矩阵和类内离散度矩阵来得到最佳的投影方向。

类间离散度矩阵度量的是不同类别数据分布之间的差异，而类内离散度矩阵度量的是同一类别内部数据之间的差异。

LDA目标函数可以表示为J(w)=w^T*Sw*w/(w^T*Sb*w)，其中w是投影方向，Sw为类内离散度矩阵，Sb为类间离散度矩阵。

在实际应用中，我们需要先计算类内离散度矩阵Sw和类间离散度矩阵Sb，然后通过求解J(w)的最大值来得到最佳的投影方向w。

通常情况下，可以通过特征值分解或者广义特征值分解来求解最优的投影方向。

LDA的应用非常广泛，特别是在模式识别和计算机视觉领域。

它可以用于人脸识别、手写数字识别、垃圾邮件过滤等任务。

LDA的优点是在高维数据集中可以找到最优的投影方向，具有很好的数据分离性能。

而且LDA不需要事先假设数据分布的形式，适用于各种分布情况。

然而，LDA也存在一些限制。

首先，LDA假设数据满足多元正态分布，如果数据违反了该假设，那么LDA的判别性能可能会下降。

其次，LDA投影到的低维子空间的维度最多等于类别数减一，这可能导致信息丢失。

此外，当类别样本数量不平衡时，LDA的效果可能会受到影响。

为了克服LDA的局限性，人们提出了一些改进的方法。

例如，局部判别分析（Local Discriminant Analysis）可以在局部区域内构建LDA模型，适用于非线性可分的数据。

深度学习的发展也为LDA的改进提供了新的思路和方法，如稀疏表示LDA和核LDA等。

线性判别分析算法在分类任务中的应用

线性判别分析算法在分类任务中的应用在机器学习领域中，分类任务是一个非常重要的应用领域。

通过机器学习算法对数据进行分类，能够帮助我们更好地理解数据，并且在实际应用中能够帮助我们快速准确地对未知数据进行分类。

其中，线性判别分析算法能够在一些常见的分类任务中发挥重要作用。

一、线性判别分析算法的基本原理线性判别分析，也称为Fisher线性判别，是一种经典的分类算法，它能够将数据进行降维，从而更容易地对数据进行分类。

其基本思路是，对于给定的数据，我们首先将其进行投影，从原始空间投影到一个较低维的空间中，使得在这个新空间中，数据点之间的距离最大化，并且同类数据点之间的距离最小化。

在这个过程中，我们需要寻找一个线性变换矩阵$W$，将原始空间中的数据$x$，变换到新的空间中$y$，即：$y=WX$其中，$X$是原始空间中的$n$维向量，$y$是新空间中的$d$维向量。

在这个过程中，我们要最大化两个指标，即类间距离和类内距离。

对于类间距离，我们希望不同类别之间的数据点更加分散，从而让分类更加准确。

我们可以定义一个类间距离的矩阵$S_B$，其为所有类别之间的数据点协方差矩阵的加权和，即：$S_B=\sum_{i=1}^kw_i(\mu_i-\mu)(\mu_i-\mu)^T$其中，$k$是类别数量，$w_i$是第$i$个类别中数据点数量，$\mu_i$是第$i$个类别的均值向量，$\mu$是所有数据点的均值向量。

对于类内距离，我们希望同一类别之间的数据点更加紧密，从而提高同类别数据点之间的相似度。

我们可以定义一个类内距离的矩阵$S_W$，其为所有类别内部数据点协方差矩阵的加权和，即：$S_W=\sum_{i=1}^kw_iS_i$其中，$S_i$是第$i$个类别的协方差矩阵，$w_i$是第$i$个类别中数据点数量。

类别数量越多，$S_W$的值就越大，数据进行降维时，对角线上的元素是降维后数据的方差，越小意味着降维后数据的区分度就越好，所以也就有了$J(W)$（评价指标）的定义：$J(W)=\frac{\mid W^TS_BW \mid}{\mid W^TS_WW \mid} $为了最大化类间距离和最小化类内距离，我们需要求解出最佳的投影矩阵$W$，使得$J(W)$最大。

linear discriminate analysis

linear discriminate analysis【实用版】目录1.线性判别分析的定义和基本概念2.线性判别分析的应用场景和问题解决能力3.线性判别分析的具体方法和步骤4.线性判别分析的优缺点和局限性5.线性判别分析的实际应用案例正文线性判别分析（Linear Discriminant Analysis，简称 LDA）是一种常用的监督学习方法，主要用于解决分类问题。

它是一种线性分类方法，通过找到一个最佳的线性分类器，将数据分为不同的类别。

LDA 基于数据分布的假设，即不同类别的数据具有不同的分布，通过最大化类内差异和最小化类间差异来实现分类。

LDA 的应用场景非常广泛，可以用于文本分类、图像分类、生物信息学、社会科学等领域。

在这些领域中，LDA 能够有效地解决分类问题，提高分类准确率。

例如，在文本分类中，LDA 可以通过分析词汇分布，将文本分为不同的主题或类别。

线性判别分析的具体方法和步骤如下：1.收集数据并计算数据矩阵。

2.计算数据矩阵的协方差矩阵和矩阵的特征值和特征向量。

3.根据特征值和特征向量构建线性分类器。

4.使用分类器对数据进行分类。

尽管 LDA 在分类问题上表现良好，但它也存在一些优缺点和局限性。

首先，LDA 要求数据矩阵的列向量是线性无关的，这可能会限制其在某些数据集上的表现。

其次，LDA 对数据中的噪声非常敏感，噪声的存在可能会对分类结果产生不良影响。

此外，LDA 是一种基于线性分类的方法，对于非线性分类问题可能无法有效解决。

尽管如此，LDA 在实际应用中仍然具有很高的价值。

例如，在文本分类中，LDA 可以有效地识别不同主题的文本，并为用户提供个性化的推荐。

在生物信息学中，LDA 可以用于基因表达数据的分类，以识别不同类型的细胞或疾病。

在社会科学中，LDA 可以用于对调查数据进行分类，以便更好地理解受访者的需求和偏好。

总之，线性判别分析是一种强大的分类方法，可以应用于各种领域。

线性判别分析

线性判别分析
线性判别分析(linear discriminant analysis，LDA)是对费舍尔的线性鉴别方法的归纳，这种方法使用统计学，模式识别和机器学习方法，试图找到两类物体或事件的特征的一个线性组合，以能够特征化或区分它们。

所得的组合可用来作为一个线性分类器，或者，更常见的是，为后续的分类做降维处理。

之前我们讨论的PCA、ICA也好，对样本数据来言，可以是没有类别标签y的。

回想我们做回归时，如果特征太多，那么会产生不相关特征引入、过度拟合等问题。

我们可以使用PCA来降维，但PCA没有将类别标签考虑进去，属于无监督的。

比如回到上次提出的文档中含有“learn”和“study”的问题，使用PCA后，也许可以将这两个特征合并为一个，降了维度。

但假设我们的类别标签y是判断这篇文章的topic是不是有关学习方面的。

那么这两个特征对y几乎没什么影响，完全可以去除。

Fisher提出LDA距今已近七十年，仍然是降维和模式分类领域应用中最为广泛采用而且极为有效的方法之一，其典型应用包括人脸检测、人脸识别、基于视觉飞行的地平线检测、目标跟踪和检测、信用卡欺诈检测和图像检索、语音识别等。

线性判别分析算法在数据分类中的应用

线性判别分析算法在数据分类中的应用线性判别分析算法（Linear Discriminant Analysis, LDA）是一种常用的数据分类方法。

它的基本思想是通过将数据投影到一条直线（或者是高维空间中的一个超平面），使得同类之间的数据点尽可能接近，不同类之间的数据点尽可能远离。

这样，我们就可以用这条直线来区分不同的类别，从而实现数据分类的任务。

LDA算法的应用非常广泛，比如在机器学习、模式识别、图像处理、生物信息学等领域都有大量的应用。

下面，我们将从几个方面来介绍LDA算法在数据分类中的应用。

1. LDA算法在二分类问题中的应用二分类是指只涉及两个类别的分类问题。

LDA算法可以被用来解决二分类问题，特别是在数据样本有限的情况下，LDA算法表现得更加优秀。

LDA算法将数据样本投影到一条直线上，使得同类之间的数据点尽可能接近，不同类之间的数据点尽可能远离。

这样，我们可以通过比较投影后的数据点的位置来判断它属于哪个类别。

在实际应用中，我们可以通过LDA算法来处理一些二分类问题，如人脸识别、声音识别、图像分类等。

例如，在人脸识别中，我们可以将不同人的人脸图像看做不同的类别，通过LDA算法将它们投影到一条直线上，从而实现对不同人脸图像的识别。

2. LDA算法在多分类问题中的应用在许多实际问题中，涉及到的不止两个类别，而是多个类别。

LDA算法同样可以被用来解决多分类问题。

LDA算法在多分类问题中的应用稍有不同。

在二分类问题中，我们可以将数据点投影到一条直线上，但在多分类问题中，我们需要将数据点投影到更高维的空间中，即超平面上。

具体地，我们可以将每个类别看做一个投影方向，然后将所有的投影方向合并起来，形成一个超平面。

通过将数据样本投影到这个超平面上，我们可以将数据分类成多个类别。

3. LDA算法在降维问题中的应用在高维数据处理中，数据的维数通常会非常高。

这对数据处理带来了困难，因为高维数据不能直观地展示出来，也很难直接分析。

线性判别分析

线性判别分析（LDA）
介绍
线性判别分析(Linear Discriminant Analysis, LDA)，也叫做Fisher线性判别(Fisher Linear Discriminant ,FLD)，是模式识别的经典算法，1936年由Ronald Fisher首次提出，并在1996年由Belhumeur引入模式识别和人工智能领域。
LDA
对于N(N>2)分类的问题，就可以直接写出以下的结论：
这同样是一个求特征值的问题，求出的第i大的特征向量，即为对应的Wi。
LDA在人脸识别中的应用
要应用方法
K-L变换奇异值分解基于主成分分析 Fisher线性判别方法
主要应用方法
K-L变换
为了得到彩色人脸图像的主分量特征灰度图像,可以采用Ohta[3]等人提出的最优基来模拟K-L变换方法,从而得到新的包含了彩色图像的绝大多数特征信息的主分量特征图像.
LDA
LDA与PCA(主成分分析)都是常用的降维技术。PCA主要是从特征的协方差角度，去找到比较好的投影方式。LDA更多的是考虑了标注，即希望投影后不同类别之间数据点的距离更大，同一类别的数据点更紧凑。
下面给出一个例子，说明LDA的目标：
可以看到两个类别，一个绿色类别，一个红色类别。左图是两个类别的原始数据，现在要求将数据从二维降维到一维。直接投影到x1轴或者x2轴，不同类别之间会有重复，导致分类效果下降。右图映射到的直线就是用LDA方法计算得到的，可以看到，红色类别和绿色类别在映射之后之间的距离是最大的，而且每个类别内部点的离散程度是最小的（或者说聚集程度是最大的）。
LDA
假设用来区分二分类的直线（投影函数)为： LDA分类的一个目标是使得不同类别之间的距离越远越好，同一类别之中的距离越近越好，所以我们需要定义几个关键的值:

线性判别分析（LinearDiscriminantAnalysis，LDA）

线性判别分析（LinearDiscriminantAnalysis，LDA）⼀、LDA的基本思想线性判别式分析(Linear Discriminant Analysis, LDA)，也叫做Fisher线性判别(Fisher Linear Discriminant ,FLD)，是模式识别的经典算法，它是在1996年由Belhumeur引⼊模式识别和⼈⼯智能领域的。

线性鉴别分析的基本思想是将⾼维的模式样本投影到最佳鉴别⽮量空间，以达到抽取分类信息和压缩特征空间维数的效果，投影后保证模式样本在新的⼦空间有最⼤的类间距离和最⼩的类内距离，即模式在该空间中有最佳的可分离性。

如下图所⽰，根据肤⾊和⿐⼦⾼低将⼈分为⽩⼈和⿊⼈，样本中⽩⼈的⿐⼦⾼低和⽪肤颜⾊主要集中A组区域，⿊⼈的⿐⼦⾼低和⽪肤颜⾊主要集中在B组区域，很显然A组合B组在空间上明显分离的，将A组和B组上的点都投影到直线L上，分别落在直线L的不同区域，这样就线性的将⿊⼈和⽩⼈分开了。

⼀旦有未知样本需要区分，只需将⽪肤颜⾊和⿐⼦⾼低代⼊直线L的⽅程，即可判断出未知样本的所属的分类。

因此，LDA的关键步骤是选择合适的投影⽅向，即建⽴合适的线性判别函数（⾮线性不是本⽂的重点）。

⼆、LDA的计算过程1、代数表⽰的计算过程设已知两个总体A和B，在A、B两总体分别提出m个特征，然后从A、B两总体中分别抽取出、个样本，得到A、B两总体的样本数据如下：和假设存在这样的线性函数（投影平⾯），可以将A、B两类样本投影到该平⾯上，使得A、B两样本在该直线上的投影满⾜以下两点：（1）两类样本的中⼼距离最远；（2）同⼀样本内的所有投影距离最近。

我们将该线性函数表达如下：将A总体的第个样本点投影到平⾯上得到投影点，即A总体的样本在平⾯投影的重⼼为其中同理可以得到B在平⾯上的投影点以及B总体样本在平⾯投影的重⼼为其中按照Fisher的思想，不同总体A、B的投影点应尽量分开，⽤数学表达式表⽰为，⽽同⼀总体的投影点的距离应尽可能的⼩，⽤数学表达式表⽰为，，合并得到求从⽽使得得到最⼤值，分别对进⾏求导即可，详细步骤不表。

LDA线性判别分析报告

LDA线性判别分析报告LDA线性判别分析（Linear Discriminant Analysis）是一种经典的线性分类方法。

它的目的是通过线性投影将数据从高维空间降维到低维空间，并在降维后的空间中寻找最佳的分类边界。

LDA在模式识别和机器学习领域有广泛的应用，特别在人脸识别、语音识别等领域取得了较好的效果。

LDA是一种有监督的降维方法，它在降维的同时将数据的类别信息考虑进去。

具体来说，LDA的目标是使得同一类别的数据点尽量聚集在一起，不同类别之间的距离尽量拉大。

这样一来，在降维后的空间中，可以更容易找到线性分类边界，从而提高分类的准确度。

LDA的思想基于以下两个假设：1.数据符合高斯分布。

LDA假设每个类别的数据点都符合高斯分布，且各个类别的协方差矩阵相同。

2.数据点是独立的。

LDA假设不同类别的数据点之间是独立的。

LDA的步骤如下：1.计算各个类别的均值向量。

对于有N个类别的数据，每个类别的均值向量可以通过计算平均值得到。

2.计算类内散度矩阵(Sw)和类间散度矩阵(Sb)。

类内散度矩阵衡量了同一类别数据点之间的差异，可以通过计算每个类别内部数据点和对应的均值向量之间的协方差矩阵的和来求得。

类间散度矩阵衡量了不同类别数据点之间的差异，可以通过计算不同类别均值向量之间的协方差矩阵的加权和来求得。

3.解LDA的优化问题。

LDA的目标是最大化类间散度矩阵与类内散度矩阵的比值，可以通过对Sw的逆矩阵与Sb的乘积进行特征值分解得到最佳投影方向。

4.选取投影方向。

根据上一步骤求得的特征值，选择最大的k个特征值对应的特征向量，这些特征向量构成了投影矩阵W。

其中k为降维后的维度，通常比原本的维度小。

LDA的优点在于它能充分利用类别信息，提高分类的准确度。

同时，LDA计算简单且直观，对数据的分布并没有太多的假设要求。

然而，LDA 也有一些限制。

首先，LDA假设数据符合高斯分布，这对于一些非线性数据是不适用的。

其次，LDA是一种线性分类方法，对于非线性问题可能效果不佳。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

用线性判别分析（Linear Discriminant Analysis ）对Wine 数据集进行分类 1. 线性判别分析（LDA ）原理
LDA 是统计学上一种经典的分析方法，在医学中的患者疾病分级、经济学的市场定位、产品管理、市场研究、人脸识别和机器学习等领域有广泛的应用。

LDA 可以用于对数据进行分类，首先，我们要用事先分好类的数据对LDA 进行训练，建立判别模型，所以LDA 属于监督学习的算法。

LDA 的基本思想是投影，将n 维数据投影到低维空间，使得投影后组与组之间尽可能分开，即在该空间中有最佳的可分离性，而衡量标准是新的子空间有最大的类间距离和最小的类内距离。

LDA 的目标是求出使新的子空间有最大的类间距离和最小的类内距离的向量a ，构造出判别模型。

形象地理解，如图1，红色点和蓝色点分别代表两个类别的数据，他们是二维的，取二维空间中的任一个向量，作各点到该向量的投影，可以看到，右图比左图投影后的分类效果好。

再如图2，是三维空间的各点作投影到二维空间，可以看到左图比右图分类效果好。

有时需要根据实际选择投影到几维才能实现最好的分类效果。

构造判别模型的过程：（1）作投影
设n 维数据样本集X={x i |i=1,2,3…j}，这j 个样本可以分为k 个类别X 1，X 2，…，X k . 令w 为n 维空间中任一向量，则样本x i 在w 上的投影为w T x i ，得到的是一维数据. （2）计算投影后的类内距离与类间距离
其中利用了方差分析的思想：
类内距离：E 0= ∑∑(w T x −w T X t ̅̅̅)2x∈X t k t=1
X t ̅̅̅表示 X t 中的样本未投影前的平均.
整理得 E 0=w T E w 其中矩阵E=∑∑(x −X t ̅̅̅)(x −X t ̅̅̅)T x∈X t
k t=1
类间距离：B 0= ∑n t (w T X t ̅̅̅−w T X ̅)2k t=1
X
̅表示所有样本未投影前的平均，n t 表示X t 中样本数整理得 B 0=w T Bw 其中矩阵B= ∑n t (X t ̅̅̅−X ̅)(X t ̅̅̅−X ̅)T k t=1
（3）构造目标函数
为了得到最佳的w ，我们希望E 0尽量小，B 0尽量大，因此构造
J(w)= B
0E 0
问题转化为求w 使J(w)达到极大值，但使J(w)达到最大值的w 不唯一，于是我们加上一个约束条件E 0=1
即求w ，使J(w)在约束条件E 0=1下达到极大值
（4）拉格朗日乘数法求w
利用拉格朗日乘数法我们可以得到以下等式
(E −1B)w =λw λ为拉格朗日乘子
即λ为E −1B 的特征值，w 为对应的特征矩阵由特征方程|E −1B −λI |= 0 可解除特征值λ 和特征向量 w
（5）导出线性判别函数
把特征值由大到小排列，取最大的特征值，所求w 就是对应的特征向量w 导出线性判别函数为u(x)=wx
若用一个线性判别函数不能很好区别各个总体，可用第二大特征根，第三大特征根……对应的特征向量构造线性判别函数进行判别（即上面所说根据实际选择降维到几维空间），线性判别函数个数不超过k-1个。

至此，已构造出判别模型，利用判别模型对新的样本代入判别函数，把结果与设定的阀指比较，把新样本判给不同的类别。

2. 利用R 语言中的lda()函数对wine 数据集进行分类
lda()函数用于线性判别分析，在MASS 包中代码如下：
3.运行结果及解释
用table()得到的列联表：
解释：列变量表示每个样本本身所属类别，行变量表示每个样本判归的类别
用barplot()得到的条形图：
解释：横轴对应列联表的列变量，柱子对应列联表的行变量
可以看出，LDA 对Wine 数据集的判别正确率为100%
12
3
0102030405060
7
4.LDA的性能分析
对于wine数据集，LDA的分类正确性，比决策树高。

（待续，参考：如何选择机器学习分类器/67671/）参考资料：peghoty的博文：/itplus/article/details/12035573。