聚类算法的研究

合集下载

传统聚类算法与深度学习聚类算法的比较研究

传统聚类算法与深度学习聚类算法的比较研究

传统聚类算法与深度学习聚类算法的比较研究聚类算法是一种常见的数据挖掘算法,它将相似的数据点划分到同一个簇内。

聚类算法被广泛应用于许多领域,例如图像处理、生物信息学、社交网络分析等。

传统聚类算法包括K均值聚类、层次聚类、密度聚类等。

这些算法的核心是通过某种距离度量方法,计算数据点之间的相似性,并根据相似性将数据点归类。

传统聚类算法的优点是简单易用、运算速度快。

但是,传统聚类算法也存在一些缺点。

例如,需要手动选择簇的个数、对噪声数据较为敏感、无法自适应地学习数据特征等。

与传统聚类算法相比,深度学习聚类算法的优势在于:具有更高的自适应性、更好的数据表达能力、更强的鲁棒性等。

深度学习聚类算法可以将数据进行自动表示和特征学习,并可以缓解传统聚类算法在簇数量选择和噪声数据处理方面的问题。

深度学习聚类算法的发展可以追溯到1991年,当时是使用自编码器进行聚类。

近年来,深度聚类算法的发展日益成熟,其中最具代表性的是基于自编码器的深度聚类算法和谱聚类。

基于自编码器的深度聚类算法使用单层或多层自编码器对数据进行编码和解码,并在编码层中对数据进行聚类。

自编码器是一种可以学习数据的稠密表示的神经网络,它可以通过降噪自编码器、变分自编码器、卷积自编码器、循环神经网络等不同的模型来实现。

基于自编码器的深度聚类算法可以有效利用数据的内在信息,并可形成比传统聚类方法更复杂、更强能力的特征空间表示,可提高聚类效果。

相比之下,一些传统聚类算法使用欧式距离等浅层特征来聚类,无法自动发掘数据深层次的关系和特征信息,因此无法真正反映数据本身的内在信息。

谱聚类是一种基于图论的聚类算法,它通过对数据的相似性矩阵进行谱分解来实现聚类效果。

这种算法通过建立样本之间的邻接图来描述数据之间的相似性,并利用谱分解来对数据进行降维和聚类。

与基于自编码器的深度聚类算法相比,谱聚类算法具有更好的鲁棒性和应用性,可以适应各种数据领域的聚类需求。

近年来,基于深度学习的聚类算法在许多领域取得了显著的进展,例如在图像聚类、文本聚类等领域。

基于聚类分析的电商商品推荐算法研究

基于聚类分析的电商商品推荐算法研究

基于聚类分析的电商商品推荐算法研究一、引言电商平台通过推荐算法实现个性化推荐,有助于提高用户购买体验和转化率。

商品聚类分析是一种有效的方式,可将相似的商品分组,从而为用户提供更加精准的推荐。

本文将从商品聚类分析的角度出发,探讨基于聚类分析的电商商品推荐算法的研究。

二、商品聚类分析基础知识1. 商品聚类分析概念商品聚类分析指的是将一组商品按照某种特征进行分类,以便进行分析和管理。

例如,可以将相似的商品分为一组,为用户提供更加精准的推荐。

2. 商品聚类分析算法商品聚类分析算法主要有两种:层次聚类算法和划分聚类算法。

层次聚类算法又分为凝聚层次聚类和分裂层次聚类。

凝聚层次聚类是从每个商品单独分组开始,逐渐将它们组合为更大的组,直到所有商品都归入一个大组。

分裂层次聚类则是从所有商品在一个大组开始,逐渐将它们分为更小的组。

划分聚类算法则是通过将商品分配给各个组,不断迭代直到达到指定的条件,例如达到最小的组内差异或达到指定次数的迭代次数。

3. 商品聚类分析的应用商品聚类分析已经广泛应用于电商平台的商品推荐系统中。

通过将相似的商品分为一组,将相关的推荐商品推荐给用户,提高了购买体验和转化率。

三、基于聚类分析的电商商品推荐算法1. 数据预处理为了进行聚类分析,需要将商品数据进行预处理,包括去除空值和不需要的变量,对类别变量进行编码,标准化和归一化数值变量等。

2. 特征选择选择适当的特征对于聚类分析至关重要。

可以从商品的价格,销量,评论数,品牌等因素进行选择。

这里需要运用统计方法和领域知识,选择最能反映商品特征的特征。

3. 初步聚类分析选择聚类算法,根据商品特征对商品进行初步聚类分析,对聚类结果进行评估和调整。

4. 优化聚类分析对初步聚类结果进行评估和调整后,进行优化聚类分析。

其中,聚类数的选择是非常重要的。

聚类数过多会使得聚类结果过于细致,不易理解;聚类数过少则可能出现相似的商品被分到不同组的情况。

此时,建议使用聚类分析矩阵和统计指标等分析工具来优化聚类结果。

数据挖掘中聚类算法研究综述

数据挖掘中聚类算法研究综述

步骤三 :根据当前簇 中心 ( 平均值 ) , 将其 余对 象赋给距离最近的中心点所代表 的簇 ; 步骤 四 :重新 计算每 个簇的平 均值 ; 步 骤 五 :直 到 划 分 不 发 生 变 化 。 优点 K 平均算法 实现 起来比较简单 其计 算复杂度为 (k )其中n n t, 为对象个 数 , k为聚类 个数 , 为循环次数 ,它具有可扩 t
D S ANE 。 B C 等
组就代表一个聚 类 ,其 中 K≤ N。而且这
K 个 分 组 满 足 下 列 条 件 : ( )每 一 个 分 组 1
Hale Waihona Puke K一中心 点算法不采用 簇中对象的平 均 值 作 为 参 照 点 , 是 选 用 簇 中位 置 最 中 而 心的点 ( 中心点 )作为聚类的 中心 点。剩 余的对象根据其与代表点的距离分配给最 近 的 一 个 簇 。 然 后 反 复 地 寻 找 更 好 的 质
展性 。
它们更靠近簇的 中心 。它的时 间复杂度在 最坏情 况下为 n l g 。o n。优点是 选择多个 代表 使得该算 法可 以适应非球状 的几何形 状, 簇的收缩或凝 聚可以有助于控制噪声
的影 响 ,同时 该 方 法 采 用 了随 机 抽 样 与 分 割相结合来提高效率 , 对大型数据库有 良 好的收缩性。
( )K一平 均算法对噪 声和异常数据 4 非 常 敏 感 。因 为 这 类 数 据 可 能 会 影 响 到 簇 中对象的均值 。 1. 2 K-ME I S算法 ( DO D K一中心
点算法 )
缺点。这种方法 的基本 思想是 :只要一个 区域中的点的密度大过某 个阈值 , 就把 它 加 到与之相近 的聚类 中去 。代表算 法有 :
缺 点:K一 平均算 法有以下四个缺 点: ( )K一平 均 算 法 只适 用 于 簇 中对 象 1

数据挖掘中聚类算法的研究

数据挖掘中聚类算法的研究
层层 的重组 ,直 到满 足终止条件为止。层次聚类分为合 并 型和分解 型 : 合并 型是 自下而上的方法 ,先把 D中的
每个 对象看 作一个 聚类 ,然后逐步被合并成 大类 ;分解 型则是 自上而下 的方 法 ,先把整个 D视为一个聚类 ,然
后 逐步被分解 为一个个 子类。层次聚类 的主要算法有 :
和 B B L — M。 U B EF
CR U E算法 采用抽样技术先对数据集 D 随机抽取
样本2 0 .2O 0 91。3 作者简介 :杨启仁 ( 93 ,男,贵 州思 南人 ,贵州民族学院讲师,硕士,研究方 向:数据挖掘、网络安全。 17 一)
k p o oy e 、 k me o d 、 C ARA、 C ARANS F c s d - r tt p s - d is L L oue
数据挖 掘是从 大量的数 据中挖掘 出隐藏的 、 未知的 、 用户可能感兴趣 的和对决策有潜在 价值 的知识和规则… 。 聚类是数据挖 掘 中重要的方法之~。与分 类有所不 同 , 聚类是在没有 任何 先验知识 的前提下 ,根 据数据 的相似 性将数据 聚合成不 同的簇 ( ) 使得 同一 聚类中 的对象 类 , 尽可能相似 ,不 同聚类 问的对象差别尽 可能大 ,因此 又 被称 为无指导 的分类。近年来 ,对 聚类方 法的研究 已经 取得 了很大 的进展 , 先后 出现 了许多聚类算法 。 一方 面 , 这些聚类算法 均有 其 自身的优缺点 ;另一方 面 ,如此繁
第 1卷 9
第6 期
牡丹 江 大学 学报
Ju n 1 o M d n in U i e s t o r a f u a j a g n v r i y
Vo1 9N 6 .1 o.

聚类算法的优缺点分析

聚类算法的优缺点分析

聚类算法的优缺点分析
一、聚类算法的定义
聚类算法是一种数据挖掘技术,它可以根据数据的相似性将数据分成不同的组。

聚类算法常用于市场分析、生物信息学、搜索引擎优化等领域,研究聚类算法的优缺点有助于更好地理解和应用这一技术。

二、优点分析
1. 数据解释性强:聚类算法可以将数据按照相似性进行分组,这有助于对数据进行解释和理解。

2. 发现隐藏模式:聚类算法可以帮助用户发现数据中的隐藏模式和规律,为决策提供支持。

3. 无监督学习:聚类算法是一种无监督学习方法,不需要预先标记的训练数据,适用于大多数数据挖掘场景。

4. 数据预处理:聚类算法可以用于数据预处理,帮助用户减少数据维度,提高数据处理效率。

三、缺点分析
1. 需要选择合适的距离度量:聚类算法的效果与距离度量的选择有关,不同的距离度量会导致不同的聚类结果。

2. 对初始值敏感:聚类算法对初始值敏感,初始值的选择会影响最终的聚类结果,需要谨慎选择。

3. 处理噪声和异常值困难:聚类算法对噪声和异常值比较敏感,这会影响聚类结果的准确性。

4. 难以处理大规模数据:一些聚类算法在处理大规模数据时效率较低,需要耗费大量的计算资源和时间。

四、结论
聚类算法是一种强大的数据挖掘技术,它可以帮助用户发现数据中的隐藏规律和模式,对于无监督学习和数据预处理都有很好的应用前景。

然而,聚类算法也存在一些缺点,比如对初始值敏感、处理噪声和异常值困难等问题,需要在实际应用中充分考虑。

在未来的研究中,可以进一步探讨聚类算法的改进和优化,以提高其在实际应用中的效率和准确性。

医学信息系统中的数据聚类方法研究

医学信息系统中的数据聚类方法研究

03
数据处理复杂
04
医学信息系统中的数据处理涉及 大量的计算和分析,如数据挖掘 、模式识别、图像处理等,需要 借助高性能计算和人工智能技术 。
数据安全和隐私保 护
医学信息系统中的数据涉及患者 的隐私和机密信息,必须采取严 格的数据安全和隐私保护措施, 确保数据不被泄露和滥用。
PART 03
数据聚类方法概述
特征选择
从提取的特征中选择出与目标变量相 关性强、对模型贡献大的特征,以降 低数据维度和提高模型性能。
PART 05
基于不同聚类算法的医学 数据聚类实验
实验设计和数据集介绍
实验设计
为了评估不同聚类算法在医学数据上的性能,我们设计了对比实验。实验包括数据预处理、特征提取 、聚类算法应用和结果评估四个主要步骤。
去噪
采用滤波、平滑等技术,消除数 据中的随机误差和噪声。
数据变换和标准化
数据变换
通过数学变换(如对数变换、Box-Cox变换等)改变数据的分布形态,使其更符 合后续分析的要求。
标准化
将数据按比例缩放,使之落入一个小的特定区间,以消除量纲和数量级对数据分 析的影响。
特征提取和选择
特征提取
从原始数据中提取出有意义的特征, 如基于医学知识的特征、基于统计学 的特征等。
国内外研究现状及发展趋势
01
国外研究现状
国外在医学信息系统数据聚类方法的研究起步较早,已经形成了较为完
善的理论和方法体系,并且在实践中取得了显著的应用成果。
02
国内研究现状
国内在医学信息系统数据聚类方法的研究相对较晚,但近年来发展迅速
,已经在理论方法和应用实践方面取得了一系列重要成果。
03
发展趋势

数据挖掘中聚类算法的研究

数据挖掘中聚类算法的研究
第7 第6 卷 期
2 0 年 6月 08
软 件 导 刊
S fwa eGu d o t r i e
Vo . 1 No. 7 6
Jn 2 O u .Og
数据挖掘 中聚 类算法 的研 究
张 胜
( 北工 业大 学 计算机 学 院 , 北 武汉 4 0 7 ) 湖 湖 304 摘 要: 目前 对聚类 算法 的研 究越 来越 多 , 在数 据挖掘 领域 , 类 面临 着新 的形 势 。总结 了数据挖 掘 中主要 的传统 聚 聚
聚类 分析 是研 究 数据 间 逻辑 上 或物 理上 的相 互 关 系 的技 术 , 分 析结 果不 仅 可 以揭示 数 据 间 的内在 联 系与 区别 , 其 还可 以为进一 步 的数 据分 析 与知识 发现 提供重 要依据 。 它是 数据挖 掘技 术 中的重要 组成 部分 。作为 统计 学 的重要研 究 内容之 一 , 聚类 分析 具有 坚实 的理论 基础 , 形成 了系统 的方 法学体 系 。 并
速度独 立 于数据 对象 的数 目, 只与量化 空 间中每一 维 的单要 优 点是它 的处理 速度 很快 , 这 其处 理
法, 也称 为 自底 向上 的方法 , 一开 始 将每 个对 象 作为 单 独 的一
个类 , 然后相 继地 合并 相近 的类 , 直到 所有 的类合 并为 一个 ( 层 次 的最 上层 ) 或者达 到一个 终 止条件 为止 。分裂 的方 法 , , 也称
平 均值距 离 :mcn C, = 叻l d a (i G) I
给定 一个包 含n 数据对 象 的数据 集 , 个 划分法 构建 数据 的k
个划 分 , 个 划分 表示 一 个类 , 每 并且 k 。 同时 满足 如 下 的要 ≤n

谱聚类算法研究综述

谱聚类算法研究综述
Survey of Spectral Clustering Algorithms BAI Lu1,2,3, ZHAO Xin1,2,3, KONG Yuting1,2,3, ZHANG Zhenghang1,2,3, SHAO Jinxin1,2,3, QIAN Yurong1,2,3
1.College of Software, Xinjiang University, Urumqi 830046, China 2.Key Laboratory of Software Engineering, Xinjiang University, Urumqi 830046, China 3.Key Laboratory of Signal Detection and Processing in Xinjiang Uygur Autonomous Region, Urumqi 830046, China
变化而改变,因此 σ 需要经过多次取值实验才能确定[23]。
度矩阵是记为 D 的对角矩阵,度值为对角元素。
计算方式如公式(2)所示:
∑ Dij = Wij j
(2)
规范相似矩阵一般形式定义为:
W nor
=
-
D
12WD-
1 2
Wnor(i,j) =
W (i,j) D(i.j) D(i,j)
(3) (4)
1 谱聚类算法概述
谱聚类算法的思想起源于谱图划分理论[18],谱聚类 通过样本相似度生成无向加权图,样本点可看作图的顶 点,样本点间的相似度为两点间边的权重,而对无向加 权图进行谱图划分就是将图划分为若干个子图,该过程 与聚类算法的聚类过程对应。图论的最优划分准则[14] 与聚类最优准则在思想上具有一致性,为聚类问题转化 为图划分问题提供思路与理论支撑。对于谱图划分而 言,图划分准则的选取将直接影响划分结果,常用的图 划分准则有规范割集、最小割集、平均割集、比例割集等 准则[19]。与谱图划分相比,谱聚类算法考虑问题连续放 松 形 式 ,将 图 分 割 问 题 转 换 为 求 相 似 矩 阵 的 谱 分 解 问 题[20]。谱聚类算法依据划分准则的不同,总体分为迭代 谱聚算法与多路谱聚类算法。目前多路谱聚类算法因 其简单易于理解特性应用更为广泛,NJW 算法是经典 多路谱聚类算法。多路谱聚算法实现细节略有差异,但 核心思想基本一致,其主要思想如下:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第3l卷第6期 V0l_31 No.6 长春师范学院学报(自然科学版) 

Journal of Changchun Normal University(Natural Science) 2012年6月 

Jun.2012 

聚类算法的研究 刘 洋 (大庆师范学院数学科学学院,黑龙江大庆163712) 

【摘要】聚类算法是多元统计的一个重要分支,在理论和实际生活中都有重要的意义。本文对聚类算 法的发展历程以及近年来发展的一些聚类算法进行研究。 【关键词】聚类算法;算法优缺点;混合模型聚类算法 【中图分类号】O212 【文献标识码】A 【文章编号]1008—178X(2012)06—0009—03 

聚类分析研究已有很长的历史,它不仅是多元统计中的一个重要分支,而且也是数据挖掘、模式识别 等研究方向的重要内容之一.通过聚类,可以给出数据稀疏和密集的区域,发现数据整体的分布模式,以及 数据彼此之间的相互关系等.聚类分析对较大数据集的分析处理也有重要应用. 不仅如此,聚类分析在其他领域也有重要的地位.例如,商业上聚类分析用于研究消费者行为;环境上 聚类分析是检验环境污染程度,对污染成分归类的有效工具;天文学中聚类分析用来对天体归类;生物学 中聚类分析被用来对动植物和基因进行分类,获取对种群固有结构的认识及发现新的基因;计算机中聚类 分析用来进行图像的分析处理等. 1 聚类及聚类的简单分类 迄今为止,聚类还没有一个被公认的定义.在此介绍应用多元统计分析lll中对聚类的描述:聚类分析又 称群分析,它是研究对样品或指示进行分类的一种多元统计方法.所谓的“类”,通俗地说,就是相似元素 的集合.分类有两种情形,一是对当前所研究的问题已知它的类别数目及类特征,只需将一些未知类的个 体,正确地归属于其中某一类;二是事先不知道研究的问题应分为几类,更不知道观测数据的具体分类情 况,需要对观测数据进行分析处理,选定一种度量数据接近程度的统计量,确定分类数目,建立一种分类 方法,并按接近程度对观、钡0对象给出合理的分类.聚类原则是使分到同一类间样本性质特征尽可能相似,不 同类间样本性质特征尽可能分开. 根据不同的分类标准,聚类算法有多种分类方式.根据对观测数据先验知识的有无,聚类被划分为无监 督聚类和有监督聚类.有监督聚类为上述的第一种情形,无监督聚类为上述的第二种情形.根据对观测数据内 在的概率框架的有无,聚类又可以分为基于模型和基于判断的聚类.根据实际问题的背景,观测数据类型, 又提出基于网格的聚类、基于最小生成树聚类、模糊聚类算、自组织映射聚类、蚁群聚类等. 2聚类算法 2.1分层聚类算法 分层聚类算法是对于给定的观测样本或指标进行层次上的分解的一种聚类算法,可以分为凝聚算法和 

【收稿日期】2012—04—05 【作者简介】刘 洋(1985一),女,黑龙江大庆人,大庆师范学院数学科学学院助教,硕士,从事多元统计分析研究。 

・9・ 分裂算法.分类的方法:一开始将所有的对象置于一个类中,计算每两个类间距离,把距离最小的两个类合 并为一个新类,如此下去,直到每个类只包含一个对象,或者达到一个终止条件为止. 分层聚类算法优点是可以得到各个数目的类;缺点是分到各个类问的观测样本不能自动调整,聚类计 算量太大,且在聚类时易忽略新类临时产生的信息,不能自动给出最优聚类数E1.此聚类算法适用于小型数 据. 2.2 K—means聚类算法 1967年,MacQueen首次提出了K—means聚类算法,大体思想是在最初的观测样本或指标中找出K个 观测样本作为始聚类中心,然后计算每一观测样本与每一个聚类中心的距离,把有最短距离的样本划分为 

一类,重新计算(求平均值)每个有变化的聚类中心,则得到新的聚类中心,如此下去,直到每一类都不 再发生变化为止. K—means聚类算法的优点是思想直观,聚类速度较快;缺点是它太依赖于初始聚类中心的选取,不能 自动给出聚类数目,仅适用于数值型数据.为此,很多学者针对K—means算法的缺点给出改进算法:比如 Huang为克服仅适用于数值型数据聚类的局限性提出K—modes—Huang算法[21,针对初始聚类中心的选择,谢 娟英等给出一种改进的全局K一均值聚类算法[31等. 2.3基于密度的聚类 此聚类算法的主要思想是以观测样本的密度为依据,把拥有较大密度的观测样本聚成一类.观测样本的 整个样本空间被低密度的观测样本划分为若干区间.算法的优点是预先不需要知道聚类的数目;缺点是只能 处理数值型观测数据,但是基于网格的聚类算法解决了这一弊端. 2.4基于模型聚类算法 基于模型聚类算法是以概率数理理论为基础的聚类算法.可以解决无监督聚类对观测噪音不能恰当处 理、对观测样本不能自动给出最优的聚类数目的弊端.基于模型的聚类算法与EM算法结合,对聚类数目的 确定,转化为模型选择问题;对观测噪音的处理,通过添加一个或多个观测数据的不同成分来处理. 2.4.1 聚类的混合模型 观测数据集记为X={x1,x2,x3,…,xn},设 (XI 是数据向量X所在第血个类的概率密度函数, 为参 G 数.设x可分为G个类,令仃 为X来自第k个类的权重(∑丌 1),则数据集x模型的一般框架为,( = 

=l 

G ∑订 I∞,假设x。,X2,X3,…,xn彼此独立,9=(8 一,oa,观测数据x的联合模型为f(x。,X2, ,…, ; = 

k=-l 

n G 兀∑7r (XI . 

:lt=1 

2.4.2混合模型聚类的理论 

对观测数据集 {xl,x2, ,…,xn}建立一个有限维的混合模型,对给定数据集X,Log一似然函数直接极 大化很困难.为此,引入x最有可能的分类标签向量集B=fB ,B2,B3,…, ,X的分类标签记为Bi=(bi , ,…, r,若数据X来自第七(k=l,2,…,G)个类,则 =1;否则 =0.通常情况下假定B ,B2,伤,…,Bn独立同分 

布,以概率丌。,仃 , ,…,丌G,(∑ =1)来自一个多维分布.则有 G P[ =1 I ]=仃 ,P lB, =Ⅱ (XI∞ . ’ 

r_I 利用分类标签向量集B,观测数据集的log一似然函数可以表示成 

n G logL8(8)=∑乏J(b ̄=1)log(7r★f I , 

・10・ 其中J( =1)为示性函数.把分类标签向量集B看成缺失向量集,利用EM算法估计式子中的参数0,使得似 然函数最大化.令参数0的极大似然估计为0,X来自第k个类的后验概率为 ,表达式为 P[ :1 Ix, ]= )_. ∑音ff (Xl 0 ) 

J=l 

根据后验概率 对样本进行聚类,将观测数据分类到有最大后验概率的类牙0用模型选择准则AIC, 

BIC等给出观测数据集的聚类数目x的最优选择. 基于模型的聚类算法,特别是基于混合模型的聚类算法应用广泛,但是对于非正态数据以及高维混合 数据集,此算法仍需进一步完善.WangL,RamoniMF,SebastianiP 2006 E ̄提出了多项式混合模型聚类方法, 提供了一个自动选择有最大后验概率的聚类数目的方法,特别适用于有孤立点数据的聚类.Xiao feng Dai等 (2009)[61建立了独立的Gaussian与Beta分布数据的有限维混合联合模型,讨论了两种不同类型数据的混合模 型. 3结论 随着科学的不断进步.数据呈现维数大、分布复杂等特点,对聚类算法的要求也越来越严格.在今后的发 展中,如何聚类不同类型的数据集,特别是观测数据的分量问结构不统一,彼此不独立的数据集.为此,应 该融合不同聚类算法的思想,利用不同算法的优缺点构建新的、解释性更合理的聚类算法. 

[参考文献】 【1]高惠璇.应用多元统计分析【M].北京:IL京大学出版社,2005. 【2]Huang Z.Extensions to the K—means algorithm for clustering large data sets with categorical values[J].Data Mining and Knowledge Discovery II,1998(2):283—304. [3】谢娟英,蒋帅,王春霞,等.一种改进的全局K一均值聚类算法[J].陕西师范大学学报:自然科学版,2010(2):18,22. 

【4]Kohomen T.The self-organizing map ̄].Proc IEEE,1990,78(9):1464-1480. 【5]Wang L,Ramoni M F,Sebastiani P.Clustering short gene expression profiles.Lecture Notesin computer Science:Reseach in computational Molecutar Biology:loth Annual Internationa1.conference[J].RECOMB,2006(3909):60-68. 【6】Xiao Feng D,Timo E,Olli Y H,et a1.A joint finite mixture model for clustering genes from independent Gaussian and beta distributed dataO].BMC Bioinformatics,2009(10):165. 

Research on the Clustering Algorithm LIU Yang (Science ofMathematics Department ofDaqing Normal University,Daqing 163712,China) 

Abstract:Clustering algorithm which is an impo ̄ant branch of muhivariate statistics plays a significant role in the theory and realistic life.The paper studies the Racks of clustering algorithm’S development and some kind of clustering algorithms developed in recent years. Key words:clustering algorithm;the advantages and disadvantages of algorithm;clustering algorithm in mixed model

相关文档
最新文档