医学统计学第十九章 聚类分析

合集下载

医学统计学第十九章 聚类分析

医学统计学第十九章  聚类分析
类。
0.732
0.085
身高
下肢长 胸围
腰围
图19-1 4个指标聚类的系统聚类图
2012-9-29
医学统计学
例19-2 今测得6名运动员4个运动项目(样品)的
能耗、糖耗的均数见表19-1,欲对运动项目归类, 以便提供相应的膳食标准,提高运动成绩。试用 样品系统聚类法将运动项目归类。
表19-1 4个运动项目的测定值 能耗 X1 (焦耳/分、m2 ) 27.892 23.475 糖耗 X2 (%) 61.42 56.83 1.315 0.174 0.688 0.088
2012-9-29 医学统计学
有g类的合并离差平方和为。如果将与合并,形成g-1类,
例19-1 测量了3454名成年女子身高(X1)、下肢长(X2)、 腰围(X3)和胸围(X4),计算得相关矩阵:
X2 X 3 X 4 X1 0 . 852 0 . 099 0 . 234 0 . 055 0 . 174 X
第十九章 聚类分析
(Clustering Analysis)
2012-9-29
医学统计学
Content
• • • • Similarity coefficient Hierarchical clustering analysis Dynamic clustering analysis Ordered sample clustering analysis
2012-9-29 医学统计学
一、类间相似系数的计算 系统聚类的每一步都要计算类间相似 系数,当两类各自仅含一个样品或变量 时,两类间的相似系数即是两样品或变 量间的相似系数或,按第一节的定义计 算。
2012-9-29
医学统计学

聚类分析

聚类分析

聚类分析聚类分析又称群分析,它是研究(样品或指标)分类问题的一种多元统计方法,所谓类,通俗地说,就是指相似元素的集合。

聚类分析内容非常丰富,按照分类对象的不同可分为样品分类(Q-型聚类分析)和指标或变量分类(R-型聚类分析);按照分类方法可分为系统聚类法和快速聚类法。

1. 系统聚类分析先将n 个样品各自看成一类,然后规定样品之间的“距离”和类与类之间的距离。

选择距离最近的两类合并成一个新类,计算新类和其它类(各当前类)的距离,再将距离最近的两类合并。

这样,每次合并减少一类,直至所有的样品都归成一类为止。

系统聚类法直观易懂。

1.1系统聚类法的基本步骤:第一,计算n 个样品两两间的距离 ,记作D= 。

第二,构造n 个类,每个类只包含一个样品。

第三,合并距离最近的两类为一新类。

第四,计算新类与各当前类的距离。

第五,重复步骤3、4,合并距离最近的两类为新类,直到所有的类并为一类为止。

第六,画聚类谱系图。

第七,确定类的个数和类。

1.2 系统聚类方法:1.2.1最短距离法1.2.2最长距离法1.2.3中间距离法1.2.4重心法1.2.5类平均法1.2.6离差平方和法(Ward 法)上述6种方法归类的基本步骤一致,只是类与类之间的距离有不同的定义。

最常用的就是最短距离法。

1.3 最短距离法以下用ij d 表示样品i X 与j X 之间距离,用ij D 表示类i G 与j G 之间的距离。

定义类i G 与j G 之间的距离为两类最近样品的距离,即ij G G G G ij d D j J i i ∈∈=,min设类p G 与q G 合并成一个新类记为r G ,则任一类k G 与r G 的距离是:ij G X G X kr d D j j i i ∈∈=,min ⎭⎬⎫⎩⎨⎧=∈∈∈∈ij G X G X ij G X G X d d q j k i p j k i ,,min ,min min {}kq kp D D ,min = 最短距离法聚类的步骤如下:ij d {}ij d(1)定义样品之间距离,计算样品两两距离,得一距离阵记为)0(D ,开始每个样品自成一类,显然这时ij ij d D =。

[医学]聚类分析在中药研究中的运用

[医学]聚类分析在中药研究中的运用

药n
0
0
……
功能k-1 0 0 1 1 1
功能k 1 0 0 1 1
关联性度量
例子2:中药相似性 每一味中药都包含很多成分,通过关联度计算中 药成分组成方面的相似性;
单味药
成分1
成分2
……
药1
1
1
……
药2
1
0
……
药3
1
0
……
……
0
1
……
药n
0
0
……
成分m-1 0 0 1 1 1
成分m 1 0 0 1 1 中药聚类Fra bibliotek数据:
中药的组成成分
方法:
根据组成成分分析 中药间的相似度,
进行聚类
结果:分析聚类结果 是否符合中药的性、 味、归、经及功效, 找出不同性、味、归、 经及功效下的主要成 分,分析中药的传统 分类是否有着分子基

例:
原子吸收分光光度法检测了丹参、枸杞子等共11种中药中钾、钙、 镁、铁、锰、铜、锌和铬元素的含量;
中药 1 2 3 …… m
成分1
成分2
……
0.45
0.04
……
0.33
0.098
……
0.03
0.03
……
0.022
0.04
……
成分n 0.31 0.12 0.24
0.6
关联性测度
当个案不能由有意义的n维数值来表示时,常根据 某些特征的存在与否来比较个案之间的相似性。 相似个案比不相似有更多的共同特征。
在聚类的过程中,通过不同的特征的选择(比如:化合物 结构,化合物靶标,化合物ADME特性,中药的性、味、 归、经等)和相似度的定义方法,则可以从不同的角度对 化合物进行分类,从不同侧面来发现中药或复方的功能特 点及其组成规律。

聚类分析数据

聚类分析数据

聚类分析数据聚类分析是一种数据挖掘技术,用于将相似的数据对象归类到同一个簇中。

通过对数据进行聚类分析,可以发现数据中的隐藏模式、结构和关系,帮助我们更好地理解数据。

本文将介绍聚类分析的基本概念、常用方法和步骤,并通过一个示例来演示如何进行聚类分析。

1. 聚类分析的基本概念聚类分析是一种无监督学习方法,不需要事先标记好的训练数据。

它根据数据样本之间的相似性,将它们划分为不同的簇。

聚类分析的目标是使同一簇内的数据对象相似度较高,而不同簇之间的相似度较低。

2. 聚类分析的常用方法聚类分析有多种方法,常见的包括层次聚类和K均值聚类。

2.1 层次聚类层次聚类是一种自底向上的聚类方法,它从每个数据对象作为一个簇开始,逐步合并最相似的簇,直到所有数据对象都被合并为一个簇或达到预设的簇数目。

2.2 K均值聚类K均值聚类是一种迭代的聚类方法,它将数据对象划分为K个簇,每个簇由一个质心代表。

初始时,随机选择K个质心,然后迭代地将每个数据对象分配到最近的质心所在的簇,再更新质心的位置,直到质心的位置不再变化或达到预设的迭代次数。

3. 聚类分析的步骤聚类分析通常包括以下步骤:3.1 数据准备首先,需要收集和整理要进行聚类分析的数据。

数据可以是数值型、分类型或混合型的。

确保数据的质量和完整性,处理缺失值和异常值。

3.2 特征选择根据分析目标和数据特点,选择合适的特征作为聚类分析的输入。

特征应该具有代表性,能够区分不同的数据对象。

3.3 数据标准化对于具有不同量纲的特征,需要进行数据标准化,以消除量纲影响。

常用的标准化方法包括最小-最大标准化和Z-score标准化。

3.4 选择聚类方法和参数根据数据的特点和分析目标,选择合适的聚类方法和参数。

不同的聚类方法适用于不同类型的数据和分析需求。

3.5 执行聚类分析根据选择的聚类方法和参数,执行聚类分析。

对于层次聚类,可以使用聚类树或热图来可视化聚类结果。

对于K均值聚类,可以绘制簇内离散度图或簇间离散度图来评估聚类的质量。

聚类分析_精品文档

聚类分析_精品文档

1聚类分析内涵1.1聚类分析定义聚类分析(Cluste.Analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术.也叫分类分析(classificatio.analysis)或数值分类(numerica.taxonomy), 它是研究(样品或指标)分类问题的一种多元统计方法, 所谓类, 通俗地说, 就是指相似元素的集合。

聚类分析有关变量类型:定类变量,定量(离散和连续)变量聚类分析的原则是同一类中的个体有较大的相似性, 不同类中的个体差异很大。

1.2聚类分析分类聚类分析的功能是建立一种分类方法, 它将一批样品或变量, 按照它们在性质上的亲疏、相似程度进行分类.聚类分析的内容十分丰富, 按其聚类的方法可分为以下几种:(1)系统聚类法: 开始每个对象自成一类, 然后每次将最相似的两类合并, 合并后重新计算新类与其他类的距离或相近性测度. 这一过程一直继续直到所有对象归为一类为止. 并类的过程可用一张谱系聚类图描述.(2)调优法(动态聚类法): 首先对n个对象初步分类, 然后根据分类的损失函数尽可能小的原则对其进行调整, 直到分类合理为止.(3)最优分割法(有序样品聚类法): 开始将所有样品看成一类, 然后根据某种最优准则将它们分割为二类、三类, 一直分割到所需的K类为止. 这种方法适用于有序样品的分类问题, 也称为有序样品的聚类法.(4)模糊聚类法: 利用模糊集理论来处理分类问题, 它对经济领域中具有模糊特征的两态数据或多态数据具有明显的分类效果.(5)图论聚类法: 利用图论中最小支撑树的概念来处理分类问题, 创造了独具风格的方法.(6)聚类预报法:利用聚类方法处理预报问题, 在多元统计分析中, 可用来作预报的方法很多, 如回归分析和判别分析. 但对一些异常数据, 如气象中的灾害性天气的预报, 使用回归分析或判别分析处理的效果都不好, 而聚类预报弥补了这一不足, 这是一个值得重视的方法。

聚类分析数据

聚类分析数据

聚类分析数据引言概述:聚类分析是一种数据分析方法,通过将数据分成不同的群组或者类别,匡助我们理解数据之间的关系和模式。

在各个领域,聚类分析都被广泛应用,例如市场营销、社交网络分析和医学研究等。

本文将详细介绍聚类分析的原理和应用,以及使用聚类分析来解决实际问题的方法。

一、聚类分析的原理1.1 聚类分析的定义和目标聚类分析是一种无监督学习方法,它通过将相似的数据点归为一类,将不相似的数据点分为不同的类别。

其目标是在数据中发现隐藏的模式和结构。

1.2 聚类算法的类型聚类算法有多种类型,常见的包括层次聚类、K均值聚类和密度聚类等。

层次聚类通过不断合并或者分割数据点来构建聚类树。

K均值聚类将数据点分为K个簇,通过最小化簇内的平方误差来优化聚类结果。

密度聚类根据数据点的密度来划分簇。

1.3 聚类分析的评估指标评估聚类结果的指标包括轮廓系数、Davies-Bouldin指数和互信息等。

轮廓系数衡量了数据点在自己所在簇和其他簇之间的距离。

Davies-Bouldin指数衡量了簇的密切度和分离度。

互信息衡量了聚类结果与真实类别之间的一致性。

二、聚类分析的应用2.1 市场营销中的聚类分析聚类分析可以匡助市场营销人员理解消费者的行为和需求。

通过将消费者分为不同的群组,可以定制个性化的营销策略。

例如,可以将消费者分为高价值客户、潜在客户和流失客户等,针对不同群组制定不同的促销活动。

2.2 社交网络分析中的聚类分析在社交网络中,聚类分析可以匡助我们发现社区结构和关键人物。

通过将用户分为不同的社区,可以了解社交网络中的群组和交互模式。

例如,可以将社交网络中的用户分为朋友圈、兴趣群体和影响力人物等,进一步分析他们之间的关系和行为。

2.3 医学研究中的聚类分析聚类分析在医学研究中被广泛应用,例如疾病分类和药物研发等。

通过将患者分为不同的簇,可以发现不同疾病的特征和治疗方法。

同时,聚类分析还可以匡助筛选候选药物和预测药物的疗效。

「聚类分析与判别分析」

「聚类分析与判别分析」

「聚类分析与判别分析」聚类分析和判别分析是数据挖掘和统计学中常用的两种分析方法。

聚类分析是一种无监督学习方法,通过对数据进行聚类,将相似的样本归为一类,不同的样本归入不同的类别。

判别分析是一种有监督学习方法,通过学习已知类别的样本,构建分类模型,然后应用模型对未知样本进行分类预测。

本文将对聚类分析和判别分析进行详细介绍。

聚类分析是一种数据探索技术,其目标是在没有任何先验知识的情况下,将相似的样本聚集在一起,形成互相区别较大的样本群。

聚类算法根据样本的特征,将样本分为若干个簇。

常见的聚类算法有层次聚类、k-means聚类和密度聚类。

层次聚类是一种自下而上或自上而下的层次聚合方法,通过测量样本间的距离或相似性,不断合并或分裂簇,最终形成一个聚类树状结构。

k-means聚类将样本划分为k个簇,通过优化目标函数最小化每个样本点与其所在簇中心点的距离来确定簇中心。

密度聚类基于样本点的密度来判断是否属于同一簇,通过划定一个密度阈值来确定簇的分界。

聚类分析在很多领域中都有广泛的应用,例如市场分割、医学研究和社交网络分析。

在市场分割中,聚类分析可以将消费者按照其购买行为和偏好进行分组,有助于企业制定更精准的营销策略。

在医学研究中,聚类分析可以将不同患者分为不同的亚型,有助于个性化的治疗和药物开发。

在社交网络分析中,聚类分析可以将用户按照其兴趣和行为进行分组,有助于推荐系统和社交媒体分析。

相比之下,判别分析是一种有监督学习方法,其目标是通过学习已知类别的样本,构建分类模型,然后应用模型对未知样本进行分类预测。

判别分析的目标是找到一个决策边界,使得同一类别内的样本尽可能接近,不同类别之间的样本尽可能远离。

常见的判别分析算法有线性判别分析(LDA)和逻辑回归(Logistic Regression)。

LDA是一种经典的线性分类方法,它通过对数据进行投影,使得同类样本在投影空间中的方差最小,不同类样本的中心距离最大。

逻辑回归是一种常用的分类算法,通过构建一个概率模型,将未知样本划分为不同的类别。

《医学统计课件:聚类分析的应用》

《医学统计课件:聚类分析的应用》

聚类分析在医学研究中的进一步发展和 应用前景
随着医学数据的不断增长和技术的发展,聚类分析在医学研究中的应用将变得更加广泛和深入。例如, 结合机器学习和深度学习的方法,可以进一步提高聚类分析的精度和效果。同时,聚类分析也可以与其 他数据挖掘技术和可视化方法相结合,为医学研究提供更全面的视角和洞察。
基于样本之间的密度来进行聚类,常用的方法包括DBSCAN和OPTICS。
3
层次聚类分析
通过不断合并或分割聚类来构建一个层次结构,可以得到不同层次的聚类结果。
聚类分析的步骤和流程

1 数据准备和清洗
收集和整理数据,并进 行数据清洗,去除噪声 和异常值。
2 特征选取和重要性
分析
选择合适的特征,并评 估它们对聚类结果的重 要性。
3 数据预处理和规范

对数据进行预处理和规 范化,例如标准化或归 一化。
4 聚类模型的构建
5 模型评估和结果解释
选择合适的聚类算法,构建聚类模型并进 行训练。
评估聚类模型的性能,并解释聚类结果。
医学领域中聚类分析的应用
医学影像聚类分析
通过对医学影像数据进行聚类,可以帮助发 现疾病特征和诊断模式。
基于生命体征数据的聚类分析
通过分析生命体征数据的聚类,可以识别不 同健康状态下的特征和变化。
基于遗传数据的聚类分析
利用个体的遗传数据进行聚类分析,可以揭 示遗传变异的模式和相关性。
基于病历数据的聚类分析
对病历数据进行聚类,可以发现疾病的亚型 和不同治疗策略的潜在效果。
聚类分析的优缺点及注意事项
优点
• 无监督学习方法,不 需要事先标记的训练
《医学统计课件:聚类分 析的应用》
在这个课件中,我们将探索聚类分析在医学研究中的应用。了解聚类分析的 定义、方法和步骤,并探讨在医学领域中的具体应用案例。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2012-9-29
医学统计学
第二节 系统聚类
系统聚类(hierarchical clustering analysis)是将相似 的样品或变量归类的最常用方法,聚类过程如下: 1)开始将各个样品(或变量)独自视为一类,即各类 只含一个样品(或变量),计算类间相似系数矩阵,其 中的元素是样品(或变量)间的相似系数。相似系数矩 阵是对称矩阵; 2)将相似系数最大(距离最小或相关系数最大)的两 类合并成新类,计算新类与其余类间相似系数; 重复第二步,直至全部样品(或变量)被并为一类。
第十九章 聚类分析
(Clustering Analysis)
2012-9-29
医学统计学
Content
• • • • Similarity coefficient Hierarchical clustering analysis Dynamic clustering analysis Ordered sample clustering analysis
类。
0.732
0.085
身高
下肢长 胸围
腰围
图19-1 4个指标聚类的系统聚类图
2012-9-29
医学统计学
例19-2 今测得6名运动员4个运动项目(样品)的
能耗、糖耗的均数见表19-1,欲对运动项目归类, 以便提供相应的膳食标准,提高运动成绩。试用 样品系统聚类法将运动项目归类。
表19-1 4个运动项目的测定值 能耗 X1 (焦耳/分、m2 ) 27.892 23.475 糖耗 X2 (%) 61.42 56.83 1.315 0.174 0.688 0.088
2012-9-29
医学统计学
判别分析:在已知分为若干个类的前提下,获得 判别模型,并用来判定观察对象的归属。 聚类分析:将随机现象归类的统计学方法,在不 知道应分多少类合适的情况下,试图借助数理 统计的方法用已收集到的资料找出研究对象的 适当归类方法。已成为发掘海量基因信息的首 选工具。 二者都是研究分类问题的多元统计分析方法。
运动项目名称 负重下蹲 G1 引体向上 G2
俯 卧 撑 G3
仰卧起坐 G4
2012-9-29
18.924
20.913
医学统计学
45.13
61.25
-1.001
-0.488
-1.441
0.665
本例选用欧氏距离,类间距离选
用最小相似系数法。为了克服变 量量纲的影响,分析前先将变量
标准化,
X i
2012-9-29 医学统计学
聚类实例分析 相似系数的定义以及类间相似 系数的定义的不同将导致系统 聚类结果有所差异。聚类分析 的结果解释除了要了解聚类方 法外,还必须结合专业知识。
r35 M ax( r13 , r23 ) M ax(0.099, 0.055) 0.099
r45 M ax( r14 , r24 ) M ax(0.234, 0.174 ) 0.234
G1,G3,G5的距离矩阵
D
(1 )
G3 G 5
G1 3 . 145 1 . 803
2012-9-29 医学统计学
(4)马氏距离:用表示m个变量间的样本协方差矩阵, 马氏距离(Mahalanobis distance)的计算公式为
d ij X S X
i1 j1 i2 j2 im jm
1
(19-6)
其中向量 X ( X X , X X , , X X ) 。不难看出,当 (单位矩阵)时,马氏距离就是欧氏距离的平方。 以上定义的4种距离适用于定量变量,对于定性变量 和有序变量必须在数量化后方能应用。
2 pq

1 n p nq

d ij
2
(19-1 0)
类平均法是系统聚类方法中较好的方法之一,它充分 反映了类内样品的个体信息。
2012-9-29
医学统计学
5.离差平方和法 又称Ward法,仅用于样品聚类。 此
法效仿方差分析的基本思想,即合理的分类使得类内 离差平方和较小,而类间离差平方和较大。假定n个样 品已分成g类,是其中的两类。此时有个样品的第k类 的离差平方和定义为:,其中为类内指标的均数。所 它们的合并离差平方和。由于并类引起的合并离差平 方和的增量定义为两类间的平方距离。显然,当n个样 品各自成一类时,n类的合并离差平方和为0。
rij
( X X )( X X ) (X X ) (X X
i i j j 2 i i j
(1 9 -1 )
j
)
2
绝对值越大表明两变量间相似程度越高。 同样也可考虑用Spearman秩相关系数定义非正态 变量与间的相似系数。当变量均为定性变量时,最好 用列联系数定义类间的相似系数。
2012-9-29 医学统计学
聚类分析属于探索性统计分析方法,按照分类目
的可分为两大类。
例如测量了n个病例(样品)的m个变量(指
标),可进行:
(1)R型聚类: 又称指标聚类,是指将m个指标
归类的方法,其目的是将指标降维从而选择有代
表性的指标。
(2)Q型聚类: 又称样品聚类,是指将n个样品 归类的方法,其目的是找出样品间的共性。
3.重心法(仅用于样品聚类) 用分别表示的均值向量(重 心),其分量是各个指标类内均数,类间相似系数计算公式为
2012-9-29 d D pq X 医学统计学
pXq
(1 9 -9 )
4.类平均法(仅用于样品聚类) 对类中的个样品与 类中的个样品两两间的个平方距离求平均,得到两类 间的相似系数
D
d ij
2 i j
(1 9 -3 )
d ij

q
| Xi X j |
(19-4)
(3)Minkowski距离:
d ij

| Xi X j |
q
(19-5)
绝对距离是q=1时的Minkowski距离;欧氏距离是q=2时的 Minkowski距离。Minkowski距离的优点是定义直观,计算简单; 缺点是没有考虑到变量间的相关关系。基于此引进马氏距离。
2012-9-29 医学统计学
有g类的合并离差平方和为。如果将与合并,形成g-1类,
例19-1 测量了3454名成年女子身高(X1)、下肢长(X2)、 腰围(X3)和胸围(X4),计算得相关矩阵:
X2 X 3 X 4 X1 0 . 852 0 . 099 0 . 234 0 . 055 0 . 174 X
2012-9-29 医学统计学
无论是R型聚类或是Q型聚类的
关键是如何定义相似性,即如何把
相似性数量化。聚类的第一步需要 给出两个指标或两个样品间相似性
的度量——相似系数(similarity
coefficient)的定义。
2012-9-29 医学统计学
第一节 相似系数
1.R型(指标)聚类的相似系数 X1,X2,…,Xm表示m个变量,R型聚类常用简单 相关系数的绝对值定义变量与间的相似系数:
2 2
1.289
同样负重下蹲与俯卧撑之间的距离
d 13
2 2 ( X 11 X 31 ) ( X 12 X 32 )
(1 .3 1 5 1 .0 0 1) (0 .6 8 8 1 .4 4 1)
2
2
3 .1 4 5
同理,计算出距离矩阵
(0)
D
G2 G 3 G 4
(4)最终将G5 ,G6合并成G7={G5 , G6},所有指标形成一 大类。
2012-9-29
医学统计学
根据聚类过程,绘制出 系统聚类图(见图191)。图中显示分成两类 较好:{X1,X2},{X3, X4},即长度指标归为一
图 19-1 图 4 个指标聚类系统聚类
0.234
类,围度指标归为另一
G3 2 . 168
(3)G1,G5间距离最小,将G1,G5并成一新类G6={ G1,G5}。 计算G6 与G3之间的距离
d 36 M ax ( d 13 , d 35 ) M ax (3 .1 4 5, 2 .1 6 8) 3 .1 4 5
(4)最终将G1 ,G6合并成G7={G1 , G6},所有指标形成一大类。
G1 1 . 289 3 . 145 1 . 803
G2
1 . 928 0 . 878
G3 2 . 168
2012-9-29
医学统计学
(2)G2,G4间距离最小,将G2,G4并成一新类G5={ G2,G4}。 应用最小相似系数法,按公式(19-8)计算G5与其他各类之间的 距离
2012-9-29 医学统计学
一、类间相似系数的计算 系统聚类的每一步都要计算类间相似 系数,当两类各自仅含一个样品或变量 时,两类间的相似系数即是两样品或变 量间的相似系数或,按第一节的定义计 算。
2012-9-29
医学统计学
当类内含有两个或两个以上样品或变量时,计算类间相似系 数有多种方法可供选择,下面列出5种计算方法。用分别表示两 类,各自含有个样品或变量。 1.最大相似系数法 类中的个样品或变量与类中的个样品或变 量两两间共有个相似系数,以其中最大者定义为与的类间相似 系数。
2012-9-29 医学统计学
2.Q型(样品)聚类常用相似系数 将n例(样品)看成是m维空间的n个点,用两点间的距离定义相 似系数,距离越小表明两样品间相似程度越高。 (1)欧氏距离: 欧氏距离(Euclidean distance)
(X X ) (2)绝对距离:绝对距离(Manhattan distance)
2012-9-29 医学统计学
根据聚类过程,绘制出系统聚类图(见图192)。结合系统聚类图和专业知识认为分成两类较 好:{ G1,G2,G4},{ G3}。负重下蹲、引体向 上、仰卧起坐三个运动项目体能消耗较大,训练
相关文档
最新文档