数据挖掘中聚类算法研究进展_周涛

合集下载

基于DBSCAN聚类算法的研究与实现

基于DBSCAN聚类算法的研究与实现

随机访问 ,这样 ,单元格的编号就是索引指针数组的下标 。
具体算法为 :
while (1) {
/ / 找出连通分支
for (long i = 0 ;i < subUnitsCount ;i + + )
{
if (pUnitsFlag[ i ] = = 0) break ;
} / / 找出未被访问的点
if (i = = subUnitsCount) break ; / / 所有的连通分支都已经找到
Abstract :As an analyzing method of clustering algorithm in data mining ,DBSCAN finds relatively dense regions ,which are clusters. This paper analyses localization of the traditional clustering algorithm , discusses an implementation of DBSCAN. The algorithm digs out high dimension space and deals with data form. The high accuracy and efficiency of DBSCAN clustering algorithm are shown in the experiments.
收稿日期 :2003 - 10 - 27 ;修订日期 :2003 - 12 - 22 基金项目 :国家 973 计划资助项目 ( G1998030409) 作者简介 :荣秋生 (1973 - ) ,男 ,湖南常德人 ,讲师 ,硕士 ,主要研究方向 :数据挖掘 、网络管理 ; 颜君彪 (1963 - ) ,男 ,湖南常德人 ,副教授 ,主 要研究方向 :中间件 、网络管理 ; 郭国强 (1964 - ) ,男 ,湖南常德人 ,教授 ,主要研究方向 :网络服务质量 、多媒体网络.

完整版数据挖掘中的聚类分析方法

完整版数据挖掘中的聚类分析方法

完整版数据挖掘中的聚类分析方法聚类分析方法是数据挖掘领域中常用的一种数据分析方法,它通过将数据样本分组成具有相似特征的子集,并将相似的样本归为一类,从而揭示数据中隐藏的模式和结构信息。

下面将从聚类分析的基本原理、常用算法以及应用领域等方面进行详细介绍。

聚类分析的基本原理聚类分析的基本原理是将数据样本分为多个类别或群组,使得同一类别内的样本具有相似的特征,而不同类别之间的样本具有较大的差异性。

基本原理可以总结为以下三个步骤:1.相似性度量:通过定义距离度量或相似性度量来计算数据样本之间的距离或相似度。

2.类别划分:根据相似性度量,将样本分组成不同的类别,使得同一类别内的样本之间的距离较小,不同类别之间的距离较大。

3.聚类评估:评估聚类结果的好坏,常用的评估指标包括紧密度、分离度和一致性等。

常用的聚类算法聚类算法有很多种,下面将介绍常用的几种聚类算法:1. K-means算法:是一种基于划分的聚类算法,首先通过用户指定的k值确定聚类的类别数,然后随机选择k个样本作为初始聚类中心,通过迭代计算样本到各个聚类中心的距离,然后将样本划分到距离最近的聚类中心对应的类别中,最后更新聚类中心,直至达到收敛条件。

2.层次聚类算法:是一种基于树状结构的聚类算法,将样本逐步合并到一个大的类别中,直至所有样本都属于同一个类别。

层次聚类算法可分为凝聚式(自底向上)和分裂式(自顶向下)两种。

凝聚式算法首先将每个样本作为一个初始的类别,然后通过计算样本之间的距离来逐步合并最近的两个类别,直至达到停止准则。

分裂式算法则是从一个包含所有样本的初始类别开始,然后逐步将类别分裂成更小的子类别,直至达到停止准则。

3. 密度聚类算法:是一种基于样本密度的聚类算法,通过在数据空间中寻找具有足够高密度的区域,并将其作为一个聚类。

DBSCAN (Density-Based Spatial Clustering of Applications with Noise)算法是密度聚类算法的代表,它通过定义距离和邻域半径来确定样本的核心点、边界点和噪声点,并通过将核心点连接起来形成聚类。

数据挖掘中聚类算法研究综述

数据挖掘中聚类算法研究综述

数据挖掘中聚类算法研究综述随着数据量的不断增加,数据挖掘成为了探索数据背后规律的一种重要方法。

而聚类算法作为数据挖掘中的一种基本技术,其在数据分析、模式识别、生物信息学、社交网络分析等领域都有着广泛的应用。

本文就对数据挖掘中的聚类算法进行了研究和总结,旨在对聚类算法的原理、特点、应用等方面进行探讨。

一、聚类算法的基本原理聚类算法是指将一组对象划分为若干个组或类,使得组内对象之间的相似度尽可能大,组间对象之间的相似度尽可能小,从而达到数据分类和分析的目的。

聚类算法的基本原理包括以下三个方面:1. 相似度度量:聚类算法的基础在于相似度度量,即将每个对象之间的相似度进行计算。

相似度度量可以采用欧几里得距离、曼哈顿距离、余弦相似度等多种方法。

2. 聚类分配:聚类分配是指将每个对象划分到合适的聚类中。

聚类分配可以通过最近邻法、k-means算法等实现。

3. 聚类更新:聚类更新是指对各个聚类进行调整,使得聚类内对象之间的相似度尽可能大,聚类间对象之间的相似度尽可能小。

聚类更新可以采用层次聚类法、DBSCAN算法等。

二、聚类算法的分类根据聚类算法的不同特点和应用场景,可以将聚类算法分为以下几种类型:1. 基于距离的聚类算法:包括最近邻法、k-means算法、k-medoid 算法等。

2. 基于密度的聚类算法:包括DBSCAN算法、OPTICS算法等。

3. 基于层次的聚类算法:包括凝聚层次聚类法、分裂层次聚类法等。

4. 基于模型的聚类算法:包括高斯混合模型聚类、EM算法等。

三、聚类算法的应用聚类算法在各种领域中都有着广泛的应用,包括数据分析、模式识别、社交网络分析、生物信息学等。

下面简单介绍一下聚类算法在这些领域中的应用:1. 数据分析:聚类算法可以对数据进行分类和分组,从而提取出数据中的规律和趋势,帮助人们更好地理解和利用数据。

2. 模式识别:聚类算法可以对图像、声音、文本等数据进行分类和分组,从而实现对数据的自动识别和分类。

聚类分析

聚类分析

聚类分析1.1聚类分析的概念:聚类分析法是理想的多变量统计技术,主要有分层聚类法和迭代聚类法。

聚类分析也称群分析、点群分析,是研究分类的一种多元统计方法。

1.2常见的聚类分析法:K-means算法、凝聚聚类算法以及EM算法系统聚类法和K均值聚类法是聚类分析中最常用的两种方法经典的聚类分析方法:【数据挖掘中聚类算法研究和发展-周涛】1.2.1基于划分的相关聚类算法K-means 算法是一种最为典型的基于划分的聚类分析算法,自从该算法被开发出来后,就一直被拿来研究和改进。

该算法的主要思想是大家非常了解的,首先随机选取K个对象作为中心点,然后遍历每个数据对象,直到收敛为止。

1.2.2基于密度的相关聚类算法DBSCAN 算法是一种较为常见的基于密度的聚类分析算法,该算法首先需要将任意的数据对象设定为核心数据对象,在Eps 范围内包含的数据对象数目要不少于Minpts 规定的个数,然后根据相应的规则来对核心对象进行合并,最终完成类簇的聚类分析。

1.2.3基于层次的相关聚类算法BIRCH 算法[28]是一种出现较为基本且简单的可以进行良好的伸缩的层次聚类算法。

该算法具有较好的聚类表现,它主要包含两个概念:聚类特征(CF)和聚类特征树(CF-Tree),通过这两个概念来进行描述并使得该算法能够有效地处理数据集。

1.2.4基于网格的相关聚类算法Yang W 等人提出的STING(Statistical INformation Grid)算法的的核心思想是将目标数据集映射到矩形单元,该空间区域通过分层和递归方法进行划分,其主要是基于多分析率的网格算法。

1.2.5基于模型的相关聚类算法EM(Exception-Maximization)算法是一种基于模型的聚类方法,该算法主要分为两步,期望步和最大化步。

期望步先给定当前的簇中心,将每个数据对象划分到距离簇中心最近的簇,然后最大化步调整每个簇中心,使得该分派的数据对象到新中心的距离之和最小化,直到聚类收敛或改变充分小。

数据挖掘中聚类算法的综述

数据挖掘中聚类算法的综述

数据挖掘中聚类算法的综述3胡庆林 叶念渝 朱明富(华中科技大学控制科学与工程系 武汉 430074)摘 要 聚类算法是数据挖掘领域中非常重要的技术。

本综述按照聚类算法的分类,对每一类中具有代表性的算法进行了介绍,分析和评价。

最后从发现聚类形状、所适用的数据库和输入数据顺序的敏感性等方面进行了算法推荐,供大家在选择聚类算法时参考。

关键词 数据挖掘 聚类分析 聚类算法中图分类号 TP301.61 引言数据挖掘(Data M ining):是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用信息和知识的过程。

当人们使用数据挖掘工具对数据中的模型和关系进行辨识的时候,通常第一个步骤就是聚类。

因此根据实际科研情况,选择一个好的聚类算法对后续的研究工作是非常关键的。

聚类的定义:聚类是将数据划分成群组的过程。

通过确定数据之间在预先制定的属性上的相似性来完成聚类任务,这样最相似的数据就聚集成簇。

聚类与分类的不同点:聚类的类别取决于数据本身;而分类的类别是由数据分析人员预先定义好的。

聚类算法的分类:一般可分为基于层次的,基于划分的,基于密度的,基于网格的和基于模型的五种。

2 基于层次的聚类算法层次的聚类算法对给定数据对象进行层次上的分解。

根据层次分解的顺序是自下向上的还是自上向下的,可分为凝聚算法(自下向上)的和分裂算法(自上向下)。

2.1 凝聚算法思想初始的时候,每一个成员都是一个单独的簇,在以后的迭代过程中,再把那些相互临近的簇组成一个新簇,直到把所有的成员组成一个簇为止。

具体代表算法:单连接算法,全连接算法和平均连接算法2.1.1 单连接算法该算法的主要思想是发现最大连通子图,如果至少存在一条连接两个簇的边,并且两点之间的最短距离小于或等于给定的阀值,则合并这两个簇。

2.1.2 全连接算法该算法寻找的是一个团,而不是连通的分量,一个团是一个最大的图,其中任意两个顶点之间都存在一个条边。

聚类分析算法在数据挖掘中的应用研究

聚类分析算法在数据挖掘中的应用研究

聚类分析算法在数据挖掘中的应用研究随着大数据时代的到来,数据挖掘成为了热门研究领域。

数据挖掘的目的是从大量数据中提取出有价值的信息,进而发现数据之间的关系和规律,以便做出合理的决策。

数据挖掘技术广泛应用于商业、医疗、教育等领域,影响到了我们的生活和工作。

聚类分析是数据挖掘中最常见和重要的技术之一。

它的主要目的是将一组数据划分为若干个簇,使得同一个簇内的数据相似度较高,不同簇之间的数据相似度较低。

聚类分析的结果可以帮助我们更好地理解数据,发现数据的潜在结构和模式。

下面将着重介绍聚类分析算法在数据挖掘中的应用研究。

一、基本概念聚类分析算法是一种无监督学习方法,它不需要依赖先验知识,只需要通过自动学习得到数据的模式和特征。

聚类分析的基本概念如下:1. 簇(Cluster):簇是聚类分析的核心,它是指一组相似的数据对象,同一个簇内的数据对象具有较高的相似度,而不同簇之间的数据对象具有较低的相似度。

2. 相似度(Similarity):相似度是用来度量两个数据对象之间的相似程度的指标,它通常采用距离(Distance)或相似度(Similarity)来表示。

距离是指两个数据对象之间的差异程度,例如欧几里得距离、曼哈顿距离、余弦距离等。

相似度是指两个数据对象之间的相似程度,例如皮尔森相关系数、Jaccard距离、汉明距离等。

3. 聚类分析的步骤:聚类分析通常包括以下步骤:(1)选择合适的相似度度量方法和距离函数。

(2)选择合适的聚类算法,例如K-means、层次聚类、DBSCAN等。

(3)确定簇的个数。

(4)对数据进行聚类分析,生成簇的划分结果。

二、主要应用领域1. 社交网络分析社交网络分析是聚类分析的重要应用领域之一。

社交网络中的节点可以看作是数据对象,节点之间的联系可以看作是数据之间的相似度。

通过聚类分析,可以将社交网络中的节点划分为不同的社区,识别出社区内的重要节点和关键联系,从而发现网络的隐含结构和规律。

聚类算法在大数据处理中的应用研究

聚类算法在大数据处理中的应用研究

聚类算法在大数据处理中的应用研究随着互联网时代的到来,数据的产生和积累速度呈现爆发式增长。

这些数据包含了海量的信息,如何有效地处理和利用这些数据成为了人们关注和研究的热点问题。

在这个背景下,聚类算法作为一种数据挖掘技术,使用广泛,并在大数据处理中扮演了不可替代的角色。

本文将探讨聚类算法在大数据处理中的应用研究。

一、聚类算法概述聚类算法是将数据样本分成若干个不同的类别的一种方法,通过此方法可以将数据分成相似的组别,以便于后续的分析和处理。

聚类算法按照不同的分类标准可以分为很多种类,常见的聚类算法有K-Means算法、层次聚类算法、密度聚类算法等。

K-Means算法是一种基于距离的聚类算法,它通过最小化数据点与质心之间的距离来实现聚类。

层次聚类算法则是将数据样本看成一个个簇,通过一些距离的度量方法建立起这些数据样本之间的关系,最后将这些数据样本聚成几个大类。

密度聚类算法则是依据密度连接原则对数据样本进行聚类,并根据密度值构建聚类簇。

二、聚类算法在大数据处理中的应用随着现代社会科技和网络技术的发展,数据已经成为一个核心资源,许多应用场景都需要处理海量数据,这时候聚类算法的应用显得尤为重要。

聚类算法在大数据处理中的应用非常广泛,主要体现在以下几个方面:1. 数据挖掘在大数据处理中,数据挖掘是必不可少的环节,聚类算法作为一种数据挖掘技术,可以快速帮助人们对数据进行分类和整理。

举个例子,当我们有大量的电商数据需要分析时,利用聚类算法可以将用户行为和偏好分成不同的类别,以便更好地为用户提供个性化的服务。

2. 物联网随着物联网的普及和发展,许多传感器和设备产生的数据量巨大,如何处理这些数据,提取有效信息成为了一种挑战。

聚类算法可以对传感器所产生的数据进行分类,提高数据的利用率,并为后续的数据分析提供帮助。

3. 生物信息学聚类算法在生物信息学领域也发挥了重要的作用。

以基因芯片数据分析为例,一次实验可能产生40000~50000个基因表达数据,利用聚类算法可以将这些数据分成不同的类别,使分析工作更加高效、准确。

聚类算法的发展趋势与未来展望

聚类算法的发展趋势与未来展望

聚类算法的发展趋势与未来展望一、引言聚类算法是数据挖掘和机器学习领域中的重要技术之一,它通过对数据进行分组,将相似的数据点归为一类,以揭示数据之间的内在关系。

随着大数据时代的到来,聚类算法在各个领域的应用越来越广泛,其发展也备受关注。

本文将探讨聚类算法的发展趋势与未来展望。

二、传统聚类算法在传统的聚类算法中,K-means算法是最为经典和常用的方法之一。

该算法通过不断迭代更新聚类中心,将数据点划分到最近的中心点所代表的簇中。

此外,层次聚类、密度聚类等方法也被广泛应用。

然而,传统聚类算法在处理大规模高维数据时存在计算复杂度高、对初始聚类中心敏感等问题。

三、基于深度学习的聚类算法随着深度学习技术的迅猛发展,基于深度学习的聚类算法也逐渐成为研究热点。

深度学习技术的强大特征提取能力,使得基于深度学习的聚类算法在处理高维数据时表现出色。

例如,基于自编码器的聚类算法、谱聚类算法等,都取得了不错的效果。

未来,随着深度学习技术的不断进步,基于深度学习的聚类算法有望在更多领域得到应用。

四、非监督学习的发展聚类算法属于非监督学习范畴,近年来,非监督学习的发展也对聚类算法的发展产生了深远影响。

例如,生成对抗网络(GAN)等新型非监督学习技术,为聚类算法的改进提供了新的思路和方法。

未来,非监督学习技术的不断发展将为聚类算法的研究和应用带来新的动力。

五、跨学科融合的趋势随着多学科交叉融合的需求日益增长,聚类算法也将更多地与其他学科相结合。

例如,在生物信息学、医学影像分析等领域,跨学科融合将为聚类算法的应用带来更多可能性。

未来,跨学科融合将成为聚类算法发展的一大趋势。

六、移动端与边缘计算的兴起随着移动互联网的普及和边缘计算技术的发展,移动端和边缘设备上的聚类算法需求也日益增长。

相比传统的数据中心,移动端和边缘设备上的聚类算法需要考虑计算资源有限、能耗低等特点。

因此,未来的聚类算法发展将更加注重移动端和边缘计算领域的应用场景。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一书中, 即 “物以类聚, 人以群分” , 聚类这个古老的 问题, 它伴随着人类社会的产生和发展而不断深化, 人类要认识世界就必须区分不同的事物并认识事物 间的相似性。数据挖掘的重要任务之一就是发现大 型数据中的积聚现象, 并加以定量化描述。聚类分
基金项目: 国家自然科学基金 (No.81160183) ; 宁夏自然科学基金 (11105) ; 陕西省教育厅项目 (No.2010JK466) ; 宁夏卫生厅 重点科研项目 (No.2011033) ; 宁夏高等学校科学研究重点项目 (宁教高 [2011]263 号) ; 宁夏医科大学特殊人才项目 (No.XT2011004) ; 宁夏医科大学青年基金项目 (No.XQ2011011) 。 作者简介: 周涛 (1977—) , 男, 回族, 博士, 副教授, 硕士生导师, 主要研究方向为医学图像处理、 数据挖掘、 软计算理论等; 陆惠玲 (1976—) , 女, 讲师, 主要研究方向为数据挖掘、 医学图像处理。 收稿日期: 2011-10-18 修回日期: 2011-12-21 DOI: 10.3778/j.issn.1002-8331.2012.12.021
[6] 提出 k- 模 (k-modes) 方法, 它扩展了 k- 平均方法, 用
则矩阵 μ = ( μij) 具有如下性质:
μij Î{0 1} 且 å μij = 1 ( j = 1 2 n)
i=1 c
设 ni 表示第 i 类中所包含的样本个数, 则
ni = å μij (i = 1 2 c) 设 xi Î ÂN 表示第 i 类的中心, 则 xi = μij x j å j=1 μij å j=1
[8] Application based upon Randomized Search) 算法
所以第 i 类的类内差异为:
n S i ( μ) = å μij||xi - xi||2 j=1
将采样技术与 PAM 结合起来, 不考虑整个数据集合, 而是随机地选择实际数据的一小部分作为数据样
102
2012, 48 (12)
满足: (1)Ci ¹ Φ i = 1 2 K (2)Ci = X
i=1 K
考察上式不难发现, 当样本各自独立成类时, 即
c = n 时, S ( μ) 取得最小值 0。因此单凭该准则是不能
找到最优分类的, 必须同时寻找其他的能够找到最 优分类的条件, 即寻找一个合适的准则函数。
(3)Ci C j = Φ i j = 1 2 K且i ¹ j 从机器学习的角度来看, 聚类所说的类不是事 先给定的, 而是根据数据的相似性和距离来划分, 聚 类的数目和结构都没有事先假定, 所以聚类分析是 一种无监督的学习方法。聚类算法的目的是寻找数 据中潜在的自然分组结构和感兴趣的关系。聚类分 析则是用数学方法研究和处理所给对象的分类以及 各类之间的亲疏程度, 是在对数据不作任何假设的 条件下进行分析的工具。在人工智能和模式识别 中, 聚类分析亦称为 “无先验学习” , 是机器学习中知 识获取的重要环节。目前聚类己被广泛地应用于各 种工程和科学领域, 如心理学、 生物学、 医学等。
3
聚类算法发展
没有任何一种聚类技术 (聚类算法) 可以普遍适
用于揭示各种多维数据集所呈现出来的多种多样的 结构 [3]。根据数据在聚类中的积聚规则以及应用这 些规则的方法, 有多种聚类算法。聚类算法体系结 构如图 1 所示。
3.1
传统聚类方法
Macqueen[4] 提出的 k- 平均方法是解决聚类问题
n n j=1 n
模来代替类的平均值, Lauritzen 提出 EM (Expectation
[7] Maximization) 算法不把对象分配给一个确定的簇,
= 1 å μij x j (i = 1,2, c) n j=1
n
而是根据对象与簇之间隶属关系发生的概率来分配 对象。 Ng 和 Han 提出的 CLARANS (Clustering Large
N
量的该类数据能对平均值产生极大的影响。Kaufman 和 Roussseeuw 提出的 PAM (Partitioning Around Me[5] doid) 和 CLARA (Clustering Large Applications) 算
对 i=1, 2, …, c 和 j=1, 2, …, n, 定义:
100
2012, 48 (12)
Computer Engineering and Applications 计算机工程与应用
数据挖掘中聚类算法研究进展
周 涛, 陆惠玲 ZHOU Tao, LU Huiling
宁夏医科大学 理学院, 宁夏 银川 750004 School of Science, Ningxia Medical University, Yinchuan, Ningxia 750004, China ZHOU Tao, LU Huiling. Clustering algorithm research advances on data mining. Computer Engineering and Applications, 2012, 48 (12) : 100-111. Abstract: Clustering analysis is one of important research branches in data mining. Clustering criterion, similarity degree are illustrated; five kinds of traditional clustering algorithms are summarized, and their latest developments are pointed out; according to attribution ralation of the sample, sample data pre-processing, similarity measure of sample, sample update strategy, high-dimension of sample and integration with other disciplines, there are more than 20 clustering algorithms are explained and summarized, such as granular clustering, uncertainty clustering, quantum clustering, kernel clustering, spectral clustering, clustering ensemble, concept clustering, spherical shell clustering, affinity propagation clustering. That is a good summary and of positive significance for the clustering. Key words: data mining; clustering algorithm; clustering criterion 摘 要: 聚类分析是数据挖掘中重要的研究内容之一, 对聚类准则进行了总结, 对五类传统的聚类算法的研究
Computer Engineering -means PAM CLARA K-modes EM CLARANS ISODATA BIRCH CURE Chameleon STING Wavecluster CLIQUE DBSCAN OPTICS DENCLUE COBWEB CLASSIT AutoClass Competitive Learning LVQ SOM 统计 学方 法 神经 网络 方法
现状和进展进行了较为全面的总结, 就一些新的聚类算法进行了梳理, 根据样本归属关系、 样本数据预处理、 样本的相似性度量、 样本的更新策略、 样本的高维性和与其他学科的融合等六个方面对聚类中近 20 多个新算 法, 如粒度聚类、 不确定聚类、 量子聚类、 核聚类、 谱聚类、 聚类集成、 概念聚类、 球壳聚类、 仿射聚类、 数据流聚 类等, 分别进行了详细的概括。这对聚类是一个很好的总结, 对聚类的发展具有积极意义。 关键词: 数据挖掘; 聚类算法; 聚类准则 文章编号: 1002-8331 (2012) 12-0100-12 文献标识码: A 中图分类号: TP311
1
概述
最早的聚类思想出现于我国的 《战国策.齐策三》
析就是按照某种相似性度量, 具有相似特征的样本 归为一类, 使得类内差异相似度较小, 而类间差异较 大。迄今为止。聚类还没有一个学术界公认的定 义。这里给出 Everitt[1] 在 1974 年关于聚类所下的定 义: 一个类簇内的实体是相似的, 不同类簇的实体是 不相似的; 一个类簇是测试空间中点的会聚, 同一类 簇的任意两个点间的距离小于不同类簇的任意两个
这就是经典的类内平方误差和 (Within-Group Sum of Squared error, WGSS) 准则函数。 K-means 聚类算法的目的就是寻找 μ* = ( μ* ij ) 使得 S ( μ) 取得最 小值, 即
S ( μ*) = min{S ( μ)}
C ={C1 C 2 C K}(K £ N ) , 找 K 个划分, 这 K 个划分
模糊聚类 粗糙聚类
基于粒度的聚类算法 不确定聚类算法 球壳聚类算法 基于熵的聚类算法 核聚类算法 基于概念的聚类算法 谱聚类算法 仿射聚类算法 本体聚类算法 混合属性聚类算法 基于双重距离的聚类算法 基于流形距离的迭代 优化聚类算法 数据流增量聚类算法 基于生物智能的增量 聚类算法 投影寻踪聚类算法 子空间聚类算法 量子聚类算法 球壳聚类算法 聚类集成算法 基于随机游动的聚类算法 其他聚类算法 基于样本的 更新策略 基于样本的 相似度度量 基于样本的 预处理 聚类新算法 基于样本的 归属关系 聚类 算法 基于划分的聚类
相关文档
最新文档