谱聚类Clustering -

合集下载

SpectralClustering（谱聚类

SpectralClustering（谱聚类Spectral ClusteringSpectral Clustering（谱聚类）是一种基于图论的聚类方法，它能够识别任意形状的样本空间且收敛于全局最有解，其基本思想是利用样本数据的相似矩阵进行特征分解后得到的特征向量进行聚类，可见，它与样本feature无关而只与样本个数有关。

一、图的划分图划分的目的是将有权无向图划分为两个或以上子图，使得子图规模差不多而割边权重之和最小。

图的划分可以看做是有约束的最优化问题，它的目的是看怎么把每个点划分到某个子图中，比较不幸的是当你选择各种目标函数后发现该优化问题往往是NP-hard的。

怎么解决这个问题呢？松弛方法往往是一种利器（比如SVM中的松弛变量），对于图的划分可以认为能够将某个点的一部分划分在子图1中，另一部分划分在子图2中，而不是非此即彼，使用松弛方法的目的是将组合优化问题转化为数值优化问题，从而可以在多项式时间内解决之，最后在还原划分时可以通过阈值来还原，或者使用类似K-Means这样的方法，之后会有相关说明。

二、相关定义1、用表示无向图，其中和分别为其顶点集和边集；2、说某条边属于某个子图是指该边的两个顶点都包含在子图中；3、假设边的两个不同端点为和，则该边的权重用表示，对于无向无环图有且，为方便以下的“图”都指无向无环图；4、对于图的某种划分方案的定义为：所有两端点不在同一子图中的边的权重之和，它可以被看成该划分方案的损失函数，希望这种损失越小越好，本文以二分无向图为例，假设原无向图被划分为和，那么有：三、Laplacian矩阵假设无向图被划分为和两个子图，该图的顶点数为：，用表示维指示向量，表明该划分方案，每个分量定义如下：于是有：又因为：其中，为对角矩阵，对角线元素为：为权重矩阵：且。

重新定义一个对称矩阵，它便是Laplacian矩阵：矩阵元素为：进一步观察：如果所有权重值都为非负，那么就有，这说明Laplacian矩阵是半正定矩阵；而当无向图为连通图时有特征值0且对应特征向量为，这反映了，如果将无向图划分成两个子图，一个为其本身，另一个为空时，为0(当然，这种划分是没有意义的)。

谱聚类算法评估

谱聚类算法评估
谱聚类（Spectral Clustering）算法是一种基于图论和矩阵计算的聚类算法，不仅可以用于聚类分析，还可以用于图像分割、模式识别等领域。

其基本思想是将数据样本间的相似性转化成图论问题，再将其转化为代数问题来实现聚类。

聚类算法评估指标主要包括准确率、召回率、F值等。

其中准确率是指分类正确的样本数占样本总数的比例，召回率是指分类正确的样本数占该类别总数的比例，F值是综合了准确率和召回率的度量标准，它是准确率和召回率的加权调和平均数。

在谱聚类算法中，由于数据通常是经过降维处理的，因此需要通过调整降维参数来获得最佳的聚类效果。

在调整参数时，需要同时考虑聚类效果和算法的计算复杂度等因素。

在实际应用中，除了考虑聚类算法的性能指标，还需要考虑算法的效率、可扩展性和稳定性等因素。

算法的效率指算法在数据量很大时能否保证较快的运行速度；可扩展性指算法能否处理大规模的数据样本；稳定性指算法在处理数据时是否稳定、可靠。

因此，算法的效率、可扩展性和稳定性等因素也是评估谱聚类算法的重要指标。

在实际应用中，如何选择适当的谱聚类算法和参数调节，需要结合数据的特点和实际应用需求综合考虑，选择最佳的算法和参数，以达到较好的聚类效果和算法时间复杂度的平衡。

总之，谱聚类算法的评估需要综合考虑聚类算法的性能、效率、可扩展性和稳定性等因素，通过调整参数、选择合适的算法来达到最佳的聚类效果和算法时间复杂度的平衡。

谱聚类方法

谱聚类方法一、谱聚类的基本原理谱聚类（Spectral Clustering）是一种基于图论的聚类方法，通过研究样本数据的图形结构来进行聚类。

谱聚类方法的基本原理是将高维数据转换为低维数据，然后在低维空间中进行聚类。

它利用样本之间的相似性或距离信息，构建一个图模型（通常是相似度图或距离图），然后对图模型进行谱分解，得到一系列特征向量，最后在特征向量空间中进行聚类。

谱聚类的核心步骤是构建图模型和进行谱分解。

在构建图模型时，通常采用相似度矩阵或距离矩阵来表示样本之间的联系。

在谱分解时，通过对图模型的拉普拉斯矩阵进行特征分解，得到一系列特征向量，这些特征向量表示了样本数据的低维空间结构。

通过对特征向量空间进行聚类，可以将高维数据分为若干个类别。

二、谱聚类的优缺点1.优点（1）适用于高维数据：谱聚类方法能够有效地处理高维数据，因为它的核心步骤是将高维数据转换为低维数据，然后在低维空间中进行聚类。

这有助于克服高维数据带来的挑战。

（2）对噪声和异常值具有较强的鲁棒性：谱聚类方法在构建图模型时，会考虑到样本之间的相似性和距离信息，从而在一定程度上抑制了噪声和异常值的影响。

（3）适用于任意形状的聚类：谱聚类方法可以适用于任意形状的聚类，因为它的聚类结果是基于特征向量空间的，而特征向量空间可以捕捉到样本数据的全局结构。

2.缺点（1）计算复杂度高：谱聚类的计算复杂度相对较高。

构建图模型和进行谱分解都需要大量的计算。

在大规模数据集上，谱聚类的计算效率可能会成为问题。

（2）对相似度矩阵或距离矩阵的敏感性：谱聚类的结果会受到相似度矩阵或距离矩阵的影响。

如果相似度矩阵或距离矩阵不合理或不准确，可能会导致聚类结果不理想。

（3）对参数的敏感性：谱聚类的结果会受到参数的影响，如相似度度量方式、距离度量方式、图模型的构建方式等。

如果参数选择不当，可能会导致聚类效果不佳。

三、谱聚类的应用场景1.图像分割：谱聚类方法可以应用于图像分割，将图像中的像素点分为若干个类别，从而实现对图像的分割。

谱聚类（Spectralclustering）（2）：NCut

谱聚类（Spectralclustering）（2）：NCut作者：桂。

时间：2017-04-13 21:19:41声明：欢迎被转载，不过记得注明出处哦~前⾔本⽂为谱聚类的第⼆篇，主要梳理NCut算法，关于谱聚类的更多细节信息，可以参考之前的博⽂： 1） 2）内容主要参考，更多细节可以参考该作者博⽂，本⽂最后给出代码实现，全⽂包括： 1）NCut原理 2）NCut算法实现⼀、NCut原理 Ncut切图和RatioCut切图很类似，但是把Ratiocut的分母|Ai|换成vol(A_i)，由于⼦图样本的个数多并不⼀定权重就⼤，我们切图时基于权重也更合我们的⽬标，因此⼀般来说Ncut切图优于RatioCut切图。

vol(A): = \sum\limits_{i \in A}d_i对应的，Ncut切图对指⽰向量h做了改进。

注意到RatioCut切图的指⽰向量使⽤的是\frac{1}{\sqrt{|A_j|}}标⽰样本归属，⽽Ncut切图使⽤了⼦图权重\frac{1}{\sqrt{vol(A_j)}}来标⽰指⽰向量h，定义如下:那么我们对于h_i^TLh_i有：推导⽅式和RatioCut完全⼀致。

也就是说，我们的优化⽬标仍然是但是此时我们的H^TH \neq I⽽是H^TDH = I，推导如下：也就是说，此时我们的优化⽬标最终为：这个就是泛化瑞利熵的求解问题，。

这⾥再次给出细节分析。

令H = D^{-1/2}F，则优化⽬标转化为：⾄此已经完成了NCut的理论。

画蛇添⾜⼀下吧，注意到：事实上，连拉普拉斯矩阵都懒得构造了。

⼆、NCut算法实现⾸先给出算法步骤：步骤⼀：求解邻接矩阵W和度矩阵D步骤⼆：对{D^{ - \frac{1}{2}}}W{D^{ - \frac{1}{2}}}进⾏特征值分解，并取K个最⼤特征值对应的特征向量（K为类别数⽬）步骤三：将求解的K个特征向量（并分别归⼀化），构成新的矩阵，对该矩阵进⾏Kmeans处理Kmeans得到的类别标签，就是原数据的类别标签，⾄此完成NCut聚类。

谱聚类算法

1 1 2 2 1 2
其中： assoc(A k , V )
i
Ak ,j V
w ij
Melia 指出Ncut 和MNcut 的差异之处仅在于所使用的谱映射不同, 并且当k= 2 时, MNcut 与Ncut 等价。多路规范割集准则在实际应用中合理有效, 但其优化问题通常难以解决。
相似矩阵、度矩阵及Laplacian 矩阵
cut(A ,B )
i ,
w ij Aj B
通过最小化上述剪切值来划分图G, 这一划分准则被称为最小割集准则。他们用这个准则对一些图像进行分割, 并产生了较好的效果, 同时他们也注意到, 该准则容易出现歪斜( 即偏向小区域) 分割。规范割集准则及比例割集准则均可避免这种情况的发生。
谱聚类算法
根据不同的准则函数及谱映射方法, 谱聚类算法发展了很多
不同的具体实现方法, 但是都可以归纳为下面三个主要步骤 :
构建表示样本集的矩阵Z; 通过计算Z 的前k 个特征值与特征向量, 构建特征向量空间; 利用k-means 或其它经典聚类算法对特征向量空间中的特征向量进行聚类。上述步骤是谱聚类算法的一个框架, 在具体实现过程中,不同的算法在数据集矩阵Z 的表示上存在着不同。例如根据2 way cut 的目标函数, Z= W; 根据随机游动关系, 则Z=D- 1W 等。划分准则一般分为2 way 和k way, 本文根据所使用的划分准则, 将算法分为迭代谱和多路谱两类, 并分别讨论了各类中典型的谱聚类算法。
可以看出Avcut 和Ncut 函数都表示无向图G 中边界损
失与分割区域相关性的比值之和, 因此最小化Avcut 与Ncut 目标函数都能产生较准确的划分。其共同缺点是倾向于欠分割且易分割出只包含几个顶点的较小子图。文献通过实验发现, 当把Normalized cut 和Average cut 准则分别用于同

谱聚类基本概念

谱聚类基本概念谱聚类（spectral clustering）是一种经典的无监督学习算法，用于将数据集分成若干个不相交的子集或簇。

它借助于数据集的相似性矩阵或图结构进行聚类。

谱聚类的基本概念包括以下几点：1. 相似性矩阵：相似性矩阵用于表示数据样本之间的相似程度。

它可以是一个对称的矩阵，矩阵的元素表示样本之间的相似度或距离。

2. 图拉普拉斯算子：图拉普拉斯算子是图结构中的一种特殊矩阵，用于表示图的拓扑结构。

它将相似性矩阵进行规范化，得到一个对称的拉普拉斯矩阵。

3. 特征值分解：通过对图拉普拉斯矩阵进行特征值分解，可以得到一组特征值和对应的特征向量。

这些特征向量可以用于表示样本在新的低维空间中的投影。

4. 谱聚类过程：谱聚类的过程主要包括以下几步：计算相似性矩阵，构造图拉普拉斯矩阵，对图拉普拉斯矩阵进行特征值分解，选择特征值对应的特征向量，对特征向量进行聚类。

总的来说，谱聚类通过图论的方法，将样本投影到低维空间，并利用聚类算法进行聚类，从而实现数据集的聚类分析。

它可以处理非线性、非凸以及具有复杂结构的数据。

当进行谱聚类时，可以根据需要采用不同的相似度度量方法，比如欧氏距离、余弦相似度等。

具体的相似性度量方式取决于数据的特征和聚类的目标。

另外，在特征值分解时，通常选择特征值较小的前k个特征向量作为投影空间的基，这样可以将数据映射到一个低维空间。

通过对这些特征向量进行聚类，可以得到最终的聚类结果。

需要注意的是，谱聚类算法在大数据集上的计算量较大，因为它涉及到计算相似性矩阵和特征值分解等操作。

为了提高算法的效率，可以通过一些近似计算方法来加速计算，比如使用局部近似算法（Local Approximation Algorithm）或随机近似算法（Randomized Approximation Algorithm）。

总的来说，谱聚类是一种基于图论和线性代数的聚类方法，通过将数据映射到低维空间并进行聚类分析，可以有效地处理复杂的数据结构。

谱聚类与社区划分

图的分割问题：
谱聚类(Spectral Clustering)
RatioCut ：
谱聚类(Spectral Clustering)
RatioCut ：
谱聚类(Spectral Clustering)
Normalized Cut ：
谱聚类(Spectral Clustering)
Normalized Cut ：
谱聚类与社区划分
谱聚类(Spectral Clustering)
谱聚类(Spectral Clustering, SC)是一种基于图论的聚类方法：将带权无向图划分为两个或两个以上的最优子图，使子图内部尽量相似，而子图间距离尽量距离较远，以达到常见的聚类的目的。
谱聚类(Spectral Clustering)
谱聚类(Spectral Clustering)
谱聚类(Spectral Clustering)
小结：
针对以上两种图分割方法，谱聚类算法的步骤如下：
Step1：将每个样本看做图的顶点，构造无向加权图；
Step2：计算图的邻接矩阵W和拉普拉斯矩阵L； Step3：根据图的分割准则计算拉普拉斯矩阵的前k个特征向量； Step4：将拉普拉斯矩阵的前k个特征向量构成矩阵Y，把Y的每一行看对Y进行聚类。做一个样本，然后用k-means方法
其中的最优是指最优目标函数不同（例如）：
1.Smallest cut：割边最小分割
2.Best cut：分割规模差不多且割边最小的分割
这样，谱聚类能够识别任意形状的样本空间且收敛于全局最优解，其基本思想是利用样本数据的相似矩阵 (拉普拉斯矩阵)进行特征分解后得到的特征向量进行聚类。
谱聚类(Spectral Clustering)

谱聚类算法

谱聚类（Spectral Clustering）是一种常用的机器学习非监督学习算法，它可以将数据集进行非均匀划分，自动检测出数据集之间的联系，形成聚类，来支持分类和聚类任务。

谱聚类算法利用图分割技术进行数据集划分，其前提是，一个具有相似关系的数据集可以被抽象成一个图结构，它由节点（node）和边（edge）组成。

这种图将相似的节点连接起来，形成相关性的网络，这就是谱聚类的基本原理。

在谱聚类算法中，我们首先需要将数据集抽象为图结构，有了图后，会根据一些度量（局部密度、连接强度、等等）将其划分为一些小子集，再根据邻域性确定子集的内部结构和边界，从而将图分成若干聚类。

谱聚类的优势在于它可以实现非均匀的聚类，可以根据数据集的特征自动聚类，它不仅可以将数据集划分成几个大的聚类，还可以自动检测出数据集之间更复杂的联系，从而形成聚类。

此外，谱聚类算法还可以处理高维数据，它能够捕捉数据集中所有数据之间的复杂关系，从而实现更好的聚类。

综上所述，谱聚类算法是一种有效的机器学习非监督学习算法，它可以自动检测出数据之间的关系，进行非均匀的聚类，为聚类和分类任务提供有力的支持，是机器学习算法领域的重要研究成果。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

聚类分析1.聚类分析定义：2.聚类方法：3.谱聚类：3.1 常见矩阵变换3.2 谱聚类流程3.3 谱聚类理论前提、证明3.4 图像分割实例结果4.总结：聚类分析：•聚类分析（Cluster analysis，亦称为群集分析）是对于静态数据分析的一门技术，在许多领域受到广泛应用，包括机器学习，数据挖掘，模式识别，图像分析以及生物信息。

算法分类：•数据聚类算法可以分为结构性或者分散性。

•结构性算法以前成功使用过的聚类器进行分类。

结构性算法可以从上至下或者从下至上双向进行计算。

从下至上算法从每个对象作为单独分类开始，不断融合其中相近的对象。

而从上至下算法则是把所有对象作为一个整体分类，然后逐渐分小。

•分散型算法是一次确定所有分类。

K-均值法及衍生算法。

•谱聚类（spectral clustering）结构型：层次聚类的一个例子：分散型：K-均值算法：分散型k-means 及其衍生算法的比较：K-means K-MedoidsK-Means算法：1. 将数据分为k个非空子集2. 计算每个类中心点（k-means<centroid>中心点是所有点的average），记为seed point3. 将每个object聚类到最近seed point4. 返回2，当聚类结果不再变化的时候stop K-Medoids算法：1.任意选取K个对象作为medoids(O1,O2,…Oi…Ok）。

2.将余下的对象分到各个类中去（根据与medoid最相近的原则);3.对于每个类（Oi）中，顺序选取一个Or，计算用Or代替Oi后的消耗E（Or）。

选择E最小的那个Or来代替Oi。

转到2。

4.这样循环直到K个medoids固定下来。

这种算法对于脏数据和异常数据不敏感，但计算量显然要比K均值要大，一般只适合小数据量。

means无法解决。

而通过空间转换则可以解决)ρ=eαθρ=eα(θ−π)means无法解决。

而通过空间转换则可以解决)谱聚类算法流程：1.输入数据：d 1,d 2,,,d n ;2.计算相似度矩阵W n*n ，其元素W(i,j)为数据d i 与d j 的相似度。

(相似度计算的具体方法后面给出，同时，易知W 为对称矩阵)；3.计算矩阵D ，D 为对角矩阵，除对角元素外全为0，D 的对角元素D(j,j) = i=1n w i,j 。

D 的对角元素为W n∗n 对应列的所有元素之和。

4.计算矩阵L = D-W ；L 为拉普拉斯矩阵。

（不同的L 矩阵定义对应不同的聚类准则，如下文提到的L sym ≔D −12LD −12=I −D −12WD −12），同时，易知L 为对称矩阵谱聚类算法流程：5.求L的特征值并按照从小到大排列：γ1≤γ2≤⋯≤γn(对称矩阵有n个实值的特征值)。

6.对于K类聚类，选取前K个特征值所对应的特征向量，按列组成新的R = n*k维矩阵。

7.把矩阵R的每行元素作为新的数据（共n个，每个数据为k维），使用K-means聚类。

如果R的第i行元素被聚类到子类K j，那么原n个数据中的第i个数据属于子类j；谱聚类流程的具体说明：•下面主要介绍：1.相似度矩阵W n∗n 的计算；2.聚类的准则函数类型和定义；如：（其物理意义就是类A 与非A 类这两类之间的所有边的权值之和，当边值的大、小表示点之间的相关、不相关时，就是求一种分类A 和非A ，使得这个准则函数对应的值最小。

即类内相关、类间无关）。

3.准则函数RatioCut(A,A )的求解转换(将求解Ratiocut 的较难的图分割问题转化为求较简单的f 问题，即使得下方左侧最小的f 就是使得准则函数最小的分割，具体见后面讲解)。

A minRatioCut(A,A)=1/2 i∈A,j∈A W i,j获取数据计算W n∗n换k-means聚类小到大取前k个值、向量•输入4*6的图像image，则共计有4*6=24个像素点，其中包括图像的像素灰度值信息、像素的位置信息等。

•获取的图像数据中，24个像素包含灰度信息、RGB 颜色及位置信息。

•转化：•24个像素图中的点v i 。

i ∈1，2，，，，24；•像素与像素之间的信息图中点v i 与点v j 之间的边，所以可以用24*24的矩阵表示图中点v i 与点v j 之间的关系w ij 。

（w ij 表示图的邻接矩阵的第i 行第j列元素）获取数据计算W n∗n换k-means 聚类小到大取前k 个值、向量相似度矩阵计算•常见的转化方法：1.高斯距离：2.曼哈顿距离：3.欧式距离：（高斯距离：F为像素点灰度值，X为像素坐标，r为限定范围）获取数据计算W n∗n换k-means聚类小到大取前k个值、向量相似度矩阵计算•常见的转化方法：1.高斯距离：2.曼哈顿距离：3.欧式距离：像素的灰度值、位置越相近，则边值越大，相关性就越强。

获取数据计算W n∗n换k-means聚类小到大取前k个值、向量相似度矩阵计算曼哈顿距离和欧式距离区别于高斯距离，两点越相关距离越小。

越无关距离越大。

所以高斯距离准则函数求极小而曼哈都欧式距离求准则函数最大值。

具体见后面的准则函数定义。

•转化到图后：1.邻接矩阵W 24∗24；2.D 24∗24；（W 矩阵的i 列所有元素之和作为D 的（i,i ）元素，即D ii =j=124w ji ，实际上W 为对称的。

），D 的非对角元素全为0；placian 矩阵：L = D-W;4.3中的L 矩阵，是其中一种方法，还有其他的L 的定义，如：1.L sym ≔D −12LD−12=I −D −12WD −12；symmetric 矩阵，I 表示单位矩阵。

2.L rw ≔D −1LD 12=I −D −1W ；random walk 矩阵，I 表示单位矩阵。

获取数据计算W n∗n换k-means 聚类小到大取前k 个值、向量相似度矩阵计算•右图的一个W矩阵实例：acgbfde0.040.40.210.30.420.080.160.320.54获取数据计算W n∗n换k-means聚类小到大取前k个值、向量相似度矩阵计算a b c d e f ga100.040000b010.40.21000c0.040.4100.300d00.21010.420.080.54e000.30.42100.32f0000.08010.16g0000.540.320.161•准则函数1：•Min cut：图G分割为两类A，A A表示不属于A子图的点；•Min cut(A,A) = i∈A,j∈A w ijacgbfde0.040.40.210.30.420.080.160.320.54获取数据计算W n∗n换k-means聚类小到大取前k个值、向量图分割、准则函数及准则函数最小化问题转换Minacgbf d e0.040.40.210.30.420.080.160.320.54获取数据计算W n∗n换k-means 聚类小到大取前k 个值、向量图分割、准则函数及准则函数最小化问题转换•准则函数1：•Min cut ：图G 分割为两类A ，A A 表示不属于A 子图的点；•Min cut(A,A ) = i∈A,j∈A w ij Minacgb fde获取数据计算W n∗n换k-means 聚类小到大取前k 个值、向量图分割、准则函数及准则函数最小化问题转换min准则函数2：RatioCut(A,A )(|A i |表示子图A i 中的顶点个数)a c gb fd e 获取数据计算W n∗n 换k-means 聚类小到大取前k个值、向量图分割、准则函数及准则函数最小化问题转换准则函数2：RatioCut(A,A )(|A i |表示子图A i 中的顶点个数)min准则函数3：Ncut(A,A)其中，vol(A i)表示的是子图A i中的每个顶点上所有边的权值和。

获取数据计算W n∗n换k-means聚类小到大取前k个值、向量图分割、准则函数及准则函数最小化问题转换min•以准则函数2为例：对于含有7个顶点的图（见上前面的图，对于4*6的图像，则可以转为到24个点的图，图的边表示两个像素之间的相似度，故后面就以7个点的图为例），如果分为两类，那么：1.当一类只含有1个元素时有：C 71种可能。

（排列组合）2.当一类只含有2个元素是有：C 72种可能；3.、、、每一种情况对应一个准则函数的值准则函数最小时对应的分类就是聚类结果，但是在数据个数较大时，是个非线性时间复杂度问题，也就是NP 问题。

获取数据计算W n∗n 换k-means 聚类小到大取前k个值、向量图分割、准则函数及准则函数最小化问题转换min•为了求最好的分割将准则函数用另一种形式表示（即问题的转化）•对于前面得到的对称矩阵L ：这里对于任意f(f 1,f 2,,,f 7)成立。

(附录1)•如果把f 的每个元素分别对应到图的7点，那么，当第i 个顶点vi属于子图A 时，那么取f i 的值为|A|/|A|，否则顶点v i 就是属于A ，此时f i 取的值则为-|A|/|A|。

获取数据计算W n∗n 换k-means 聚类小到大取前k 个值、向量图分割、准则函数及准则函数最小化问题转换•例如：七个顶点的图分割共有C 71+C 72+⋯C 76种分割情况；•如果点a 、c 被分为一类其余点被分为另一类，则对应的f 设置为：•F(5/2,−25,5/2, −25, −25, −25, −25);其中（|A|/|A|= 5/2，-|A|/|A|= −25）•如果点a 、b 、d 被分为一类其余被分为另一类，则对应的f 为：•F(4/3,4/3,−34，4/3, −34，−34，−34);其中（|A|/|A|= 4/3，-|A|/|A|= −3/4）获取数据计算W n∗n 换k-means 聚类小到大取前k 个值、向量图分割、准则函数及准则函数最小化问题转换•为了求最好的分割将准则函数用另一种形式表示（即问题的转化）•这样，对于含有7个点的图分割问题，是个NP 问题，对于每种可能的分割，就对应着一个f(f 1,f 2,,,f 24)的值：即如果某个顶点v i 属于子图A ，那么我们就知道其对应的f i 值为|A|/|A|。

•反过来，每一个f 就对应着一个分割：若第i 个元素是|A|/|A|，那么我们就可以知道点v i 属于子图A ，如果是−A/|A|，那么点v i 就属于子图A 。

•其实，通过以上的步骤我们已经转换了问题；获取数据计算W n∗n 换k-means 聚类小到大取前k个值、向量图分割、准则函数及准则函数最小化问题转换•转换的原理在于：把f 带入下式：•也就是当f 的元素满足前面的约束时f T Lf 就是图分割的第二种准则函数，所以，求图分割的准则函数的最小值就转化为求f 的值，使得f T Lf 值最小。