(完整版)主成分分析与因子分析的优缺点

合集下载

主成分与因子分析的10点异同总结

主成分与因子分析的10点异同总结一、原理不同主成分分析（Principal components analysis，PCA）基本原理：利用降维（线性变换)的思想，在损失很少信息的前提下把多个指标转化为几个不相关的综合指标（主成分),即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能（主成分必须保留原始变量90%以上的信息），从而达到简化系统结构，抓住问题实质的目的。

因子分析（Factor Analysis，FA）基本原理：利用降维的思想，由研究原始变量相关矩阵内部的依赖关系出发，把一些具有错综复杂关系的变量表示成少数的公共因子和仅对某一个变量有作用的特殊因子线性组合而成。

就是要从数据中提取对变量起解释作用的少数公共因子（因子分析是主成分的推广，相对于主成分分析，更倾向于描述原始变量之间的相关关系）二、线性表示方向不同因子分析是把变量表示成各公因子的线性组合主成分分析中则是把主成分表示成各变量的线性组合。

三、假设条件不同主成分分析：不需要有假设(assumptions),因子分析：需要一些假设。

因子分析的假设包括：各个共同因子之间不相关，特殊因子（specificfactor）之间也不相关，共同因子和特殊因子之间也不相关。

四、求解方法不同求解主成分的方法：从协方差阵出发（协方差阵已知），从相关阵出发（相关阵R已知），采用的方法只有主成分法。

（实际研究中，总体协方差阵与相关阵是未知的，必须通过样本数据来估计）注意事项：由协方差阵出发与由相关阵出发求解主成分所得结果不一致时，要恰当的选取某一种方法；一般当变量单位相同或者变量在同一数量等级的情况下，可以直接采用协方差阵进行计算；对于度量单位不同的指标或是取值范围彼此差异非常大的指标，应考虑将数据标准化，再由协方差阵求主成分；实际应用中应该尽可能的避免标准化，因为在标准化的过程中会抹杀一部分原本刻画变量之间离散程度差异的信息。

主成分分析与因子分析的异同比较及应用

主成分分析与因子分析的异同比较及应用一、相似之处：1.降低数据维度：主成分分析和因子分析都是降维方法，通过将原始变量进行线性组合，生成一组新变量，减少原始数据的维度。

2.揭示变量之间的关系：主成分分析和因子分析都可以揭示数据中变量之间的相关性和潜在结构，更好地理解变量之间的关系。

3.数据依赖：主成分分析和因子分析都依赖原始数据的线性关系。

二、主成分分析的特点和应用：1.数据探索：主成分分析可以用于对数据进行探索性分析，揭示数据中的模式和变量之间的关系。

2.特征选择：主成分分析可以用于提取最相关的变量，帮助选择最能代表数据信息的特征。

3.数据压缩：通过保留主要的主成分，主成分分析可以将数据压缩成较低维度，减少存储和计算的开销。

4.降噪：主成分分析可以通过去除与主成分相关较小的维度，减少噪声的影响。

三、因子分析的特点和应用：因子分析的目标是通过找到能够解释原始变量间共同方差的不可观测因子，来揭示变量背后的潜在结构。

因子分析的原理是通过将多个变量通过线性函数关系表示为少数几个潜在因子的和。

因子分析可以用于以下场景：1.变量间关系建模：因子分析可以用于建立变量之间的概念模型，识别变量的共同因子、独特因子和测量误差。

2.假设测试：因子分析可以用于检验变量之间的因果关系，以验证一些假设。

3.变量缩减：通过识别共同的因子，并组合成新的因子变量，因子分析可以减少数据集的维度。

4.数据恢复：因子分析可以通过基于因子提取的结果，恢复原始变量的丢失信息。

四、主成分分析与因子分析的区别：1.目标：主成分分析的目标是将原始变量转化为一组新的不相关的维度，以解释数据方差最大化；而因子分析的目标是将原始变量转化为一组潜在因子，以解释变量间的共同方差。

2.变量假设：主成分分析假设所有变量是观测变量的线性组合，而因子分析假设所有变量既有观测变量，也有不可观测的因子变量。

3.因素解释：主成分分析的主要解释对象是方差，因而主成分的解释目标是能够包含尽可能多的方差；而因子分析的解释对象是共同方差，因而因子的解释目标是能够解释原始变量之间的共同方差。

主成分分析、聚类分析、因子分析的基本思想及优缺点

之勘阻及广创作主成分分析：利用降维（线性变换)的思想，在损失很少信息的前提下把多个指标转化为几个综合指标（主成分),用综合指标来解释多变量的方差- 协方差结构，即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能（主成分必须保存原始变量90%以上的信息），从而达到简化系统结构，抓住问题实质的目的综合指标即为主成分。

求解主成分的方法：从协方差阵出发（协方差阵已知），从相关阵出发（相关阵R已知）。

（实际研究中，总体协方差阵与相关阵是未知的，必须通过样本数据来估计）注意事项：1. 由协方差阵出发与由相关阵出发求解主成分所得结果纷歧致时，要恰当的选取某一种方法；2. 对于度量单位或是取值范围在同量级的数据，可直接求协方差阵；对于度量单位分歧的指标或是取值范围彼此差别非常大的指标，应考虑将数据尺度化，再由协方差阵求主成分；3.主成分分析不要求数据来源于正态分布；4. 在选取初始变量进入分析时应该特别注意原始变量是否存在多重共线性的问题（最小特征根接近于零，说明存在多重共线性问题）。

优点：首先它利用降维技术用少数几个综合变量来代替原始多个变量，这些综合变量集中了原始变量的大部分信息。

其次它通过计算综合主成分函数得分，对客观经济现象进行科学评价。

再次它在应用上偏重于信息贡献影响力综合评价。

缺点：当主成分的因子负荷的符号有正有负时，综合评价函数意义就不明确。

命名清晰性低。

聚类分析：将个体（样品）或者对象（变量）按相似程度（距离远近）划分类别，使得同一类中的元素之间的相似性比其他类的元素的相似性更强。

目的在于使类间元素的同质性最大化和类与类间元素的异质性最大化。

其主要依据是聚到同一个数据集中的样本应该彼此相似，而属于分歧组的样本应该足够不相似。

经常使用聚类方法：系统聚类法，K-均值法，模糊聚类法，有序样品的聚类，分解法，加入法。

注意事项：1. 系统聚类法可对变量或者记录进行分类，K-均值法只能对记录进行分类；2. K-均值法要求分析人员事先知道样品分为多少类；3. 对变量的多元正态性，方差齐性等要求较高。

数据分析中的因子分析与主成分分析

数据分析中的因子分析与主成分分析在当今信息爆炸的时代，数据分析已经成为了各行各业中不可或缺的一部分。

在数据分析的过程中，因子分析和主成分分析是常用的两种统计方法。

它们可以帮助我们理解数据背后的隐藏规律和关联性。

本文将介绍因子分析和主成分分析的基本概念、应用场景以及它们之间的区别。

一、因子分析因子分析是一种用于探索多个变量之间关系的统计方法。

它的基本思想是将多个相关的变量归纳为少数几个潜在因子，从而简化数据的复杂性。

通过因子分析，我们可以找到隐藏在数据背后的共性因素，并将其用较少的变量来代表。

在因子分析中，我们需要确定两个重要的概念：因子载荷和公因子。

因子载荷表示变量与因子之间的相关性，取值范围为-1到1。

而公因子则是指影响多个变量的共同因素。

通过因子分析，我们可以得到每个变量对于每个公因子的因子载荷，从而得知变量之间的相关性以及它们与公因子的关系。

因子分析在实际应用中有着广泛的用途。

例如，在市场调研中，我们可以利用因子分析来确定消费者对于某个产品的偏好因素；在心理学研究中，我们可以通过因子分析来探索人们的个性特征。

因子分析的结果可以帮助我们更好地理解数据，为进一步的分析提供基础。

二、主成分分析主成分分析是一种用于降维的统计方法。

它的目标是通过线性组合将原始变量转化为一组新的互相无关的变量，即主成分。

主成分分析通过保留原始数据的大部分信息，同时减少数据的维度，从而达到简化数据和减少冗余的目的。

在主成分分析中，我们首先需要计算协方差矩阵。

然后，我们通过求解协方差矩阵的特征值和特征向量，得到主成分。

特征值表示主成分的重要性，而特征向量则表示主成分的方向。

通过选择特征值较大的主成分，我们可以保留较多的原始数据信息。

主成分分析在实际应用中也有着广泛的用途。

例如，在金融领域，我们可以利用主成分分析来构建投资组合，降低风险；在图像处理中，我们可以利用主成分分析来提取图像的特征。

主成分分析可以帮助我们更好地理解数据的结构，发现数据中的重要特征。

主成分分析与因子分析的优缺点

主成分分析与因子分析的优缺点1.降维效果好：主成分分析能够把高维度的数据转化为低维度的数据，保留了原始数据的重要信息，并且尽量去除冗余信息，使数据更具可解释性。

2.数据简化：通过主成分分析，我们可以将原始数据转化为由主成分构成的新数据集，这样可以简化后续的数据分析工作。

3.可视化效果好：主成分分析可以将高维度的数据转化为低维度的数据，便于可视化分析，帮助我们更好地理解数据的结构和关系。

4.降低数据噪声：主成分分析通过对原始数据进行线性组合，减少了数据中的噪声影响，提高了数据的信噪比。

5.无需先验知识：主成分分析不需要任何先验知识，只利用原始数据的变异性进行分析，更加普适。

1.数据过于简化：主成分分析会将原始数据进行简化，有可能会造成信息的损失，使得数据的可解释性降低。

2.需要处理缺失值：主成分分析对数据中的缺失值敏感，如果原始数据中存在缺失值，需要提前进行处理。

3.不适用于非线性关系：主成分分析只适用于线性数据，对于非线性数据效果不好，不能完全捕捉到数据的特征。

因子分析的优点：1.探索性分析：因子分析可以从数据中发现潜在的、隐含的因素，帮助我们理解问题背后的内在结构。

2.解释方差：因子分析可以将原始数据解释为若干个因子的线性组合，帮助我们理解这些因子解释了数据方差的比例。

3.提取共享因素：因子分析可以识别多个变量之间的共享因素，使我们能够更好地理解变量之间的关系。

4.指导模型构建：因子分析可以为后续的建模提供参考，帮助我们选择最重要的变量，从而提高模型的准确性和可解释性。

因子分析的缺点：1.先验假设：因子分析需要假设原始变量与因子之间存在线性相关关系，这个假设可能不总是成立。

2.选择困难：因子分析需要根据一些统计指标（如因子负荷值）来确定最终的因子个数，这一过程可能具有主观性，容易受到分析者主观意识的影响。

3.处理缺失值：因子分析对数据中的缺失值敏感，需要采取合适的方法来处理缺失值。

4.对离群值敏感：因子分析对离群值比较敏感，离群值的存在可能会影响因子提取的结果。

主成分分析与因子分析的比较

主成分分析与因子分析的比较一、主成分分析方法1、主成分分析介绍主成分分析是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法，又称主分量分析。

在实际问题中，为了全面分析问题，往往提出很多与此有关的变量（或因素），因为每个变量都在不同程度上反映这个课题的某些信息。

但是，在用统计分析方法研究这个多变量的课题时，变量个数太多就会增加课题的复杂性。

人们自然希望变量个数较少而得到的信息较多。

在很多情形，变量之间是有一定的相关关系的，当两个变量之间有一定相关关系时，可以解释为这两个变量反映此课题的信息有一定的重叠。

主成分分析是对于原先提出的所有变量，建立尽可能少的新变量，使得这些新变量是两两不相关的，而且这些新变量在反映问题的信息方面尽可能保持原有的信息。

信息的大小通常用离差平方和或方差来衡量。

主成分分析的基础思想是将数据原来的p 个指标作线性组合,作为新的综合指标(123,,,p F F F F )。

其中1F 是“信息最多”的指标，即原指标所有线性组合中使()1Var F 最大的组合对应的指标，称为第一主成分；2F 为除1F 外信息最多的指标，即()'12,j i Cov F F a a =∑且()2Var F 最大，称为第二主成分；依次类推。

易知123,,,p F F F F 互不相关且方差递减。

实际处理中一般只选取前几个最大的主成分（总贡献率达到85%），达到了降维的目的。

2、主成分确定的原则假设某个总体共有n 个样本，而每个样本测得p 项指标：X 1，X 2，X 3……X p ，得到原始数据()11121212221212p p p n n np x x x x x x X X X X x x x ⎡⎤⎢⎥⎢⎥==⎢⎥⎢⎥⎢⎥⎣⎦其中11211n x x X x ⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦， 1,2,3,i p = 。

将数据矩阵X 的p 个向量12p X X X 作线性组合'111121211'212122222'1122,,,p p p p p p p pp p p F a X a X a X a X F a X a X a X a X F a X a X a X a X ⎧==++⎪==++⎪⎨⎪⎪==++⎩简写成'1122,i i i pi p i F a X a X a X a X ==++ 其中1,2,3,i p =设均值()E X u =，协方差阵()D X =∑。

主成分分析与因子分析的比较与应用

主成分分析与因子分析的比较与应用在数据分析领域，主成分分析（Principal Component Analysis，PCA）和因子分析（Factor Analysis，FA）是常用的降维技术。

它们可以帮助我们理解数据之间的关系、提取相关特征以及简化数据集。

本文将比较主成分分析和因子分析的不同之处，并探讨它们在实际应用中的具体用途。

一、主成分分析主成分分析是一种无监督学习方法，用于将高维数据转换为低维数据。

主成分分析的目标是找到一组新的低维变量，称为主成分，它们能够解释原始数据中最大的方差。

主成分分析的基本思想是将数据投影到方差最大的方向上，以便保留尽可能多的信息。

主成分分析的步骤如下：1. 标准化数据：将原始数据进行标准化处理，使得各个特征的均值为0，方差为1。

2. 计算协方差矩阵：通过计算特征之间的协方差矩阵，了解各个特征之间的相关性。

3. 计算特征值和特征向量：通过对协方差矩阵进行特征值分解，得到特征值和对应的特征向量。

4. 选择主成分：按照特征值从大到小的顺序，选择最大的k个特征值对应的特征向量作为主成分。

5. 数据转换：将原始数据投影到所选主成分上，得到降维后的数据集。

主成分分析在实际应用中具有广泛的用途。

例如，在图像处理中，主成分分析可用于图像压缩和降噪；在金融领域，主成分分析可用于投资组合优化和资产定价；在生物科学中，主成分分析可用于基因表达数据的分析等。

二、因子分析因子分析也是一种常用的无监督学习方法，其目标是通过观察变量之间的共同变异性，识别潜在的影响因素或隐含变量。

因子分析的基本思想是将多个观测变量解释为少数几个潜在因子的线性组合，从而减少原始数据的维度。

因子分析的步骤如下：1. 建立模型：选择适当的因子分析模型，包括确定因子个数和选择因子旋转方法。

2. 估计参数：使用最大似然估计等方法，对模型中的参数进行估计。

3. 因子旋转：为了使得因子更易于解释，通常需要对因子进行旋转，常见的旋转方法有方差最大旋转和直角旋转等。

主成分分析、聚类分析、因子分析的基本思想及优缺点

主成分分析：利用降维（线性变换)的思想，在损失很少信息的前提下把多个指标转化为几个综合指标（主成分),用综合指标来解释多变量的方差- 协方差结构，即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能（主成分必须保留原始变量90%以上的信息），从而达到简化系统结构，抓住问题实质的目的综合指标即为主成分。

求解主成分的方法：从协方差阵出发（协方差阵已知），从相关阵出发（相关阵R已知）。

（实际研究中，总体协方差阵与相关阵是未知的，必须通过样本数据来估计）注意事项：1. 由协方差阵出发与由相关阵出发求解主成分所得结果不一致时，要恰当的选取某一种方法；2. 对于度量单位或是取值范围在同量级的数据，可直接求协方差阵；对于度量单位不同的指标或是取值范围彼此差异非常大的指标，应考虑将数据标准化，再由协方差阵求主成分；3.主成分分析不要求数据来源于正态分布；4. 在选取初始变量进入分析时应该特别注意原始变量是否存在多重共线性的问题（最小特征根接近于零，说明存在多重共线性问题）。

优点：首先它利用降维技术用少数几个综合变量来代替原始多个变量，这些综合变量集中了原始变量的大部分信息。

其次它通过计算综合主成分函数得分，对客观经济现象进行科学评价。

再次它在应用上侧重于信息贡献影响力综合评价。

缺点：当主成分的因子负荷的符号有正有负时，综合评价函数意义就不明确。

命名清晰性低。

聚类分析：将个体（样品）或者对象（变量）按相似程度（距离远近）划分类别，使得同一类中的元素之间的相似性比其他类的元素的相似性更强。

目的在于使类间元素的同质性最大化和类与类间元素的异质性最大化。

其主要依据是聚到同一个数据集中的样本应该彼此相似，而属于不同组的样本应该足够不相似。

常用聚类方法：系统聚类法，K-均值法，模糊聚类法，有序样品的聚类，分解法，加入法。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

主成分分析就是将多项指标转化为少数几项综合指标,用综合指标来解释多变量的方差- 协方差结构.综合指标即为主成分.所得出的少数几个主成分,要尽可能多地保留原始变量的信息,且彼此不相关. 因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较强的可解释性的一种多元统计分析方法.
聚类分析是依据实验数据本身所具有的定性或定量的特征来对大量的数据进行分组归类以了解数据集的内在结构,并且对每一个数据集进行描述的过程.其主要依据是聚到同一个数据集中的样本应该彼此相似,而属于不同组的样本应该足够不相似.
三种分析方法既有区别也有联系,本文力图将三者的异同进行比较,并举例说明三者在实际应用中的联系,以期为更好地利用这些高级统计方法为研究所用有所裨益.
二、基本思想的异同
(一) 共同点
主成分分析法和因子分析法都是用少数的几个变量(因子) 来综合反映原始变量(因子) 的主要信息,变量虽然较原始变量少,但所包含的信息量却占原始信息的85 %以上,所以即使用少数的几个新变量,可信度也很高,也可以有效地解释问题.并且新的变量彼此间互不相关,消除了多重共线性.这两种分析法得出的新变量,并不是原始变量筛选后剩余的变量.在主成分分析中,最终确定的新变量是原始变量的线性组合,如原始变量为x1 ,x2 ,. . . ,x3 ,经过坐标变换,将原有的p个相关变量xi 作线性变换,每个主成分都是由原有p 个变量线性组合得到.在诸多主成分Zi 中,Z1 在方差中占的比重最大,说明它综合原有变量的能力最强,越往后主成分在方差中的比重也小,综合原信息的能力越弱.因子分析是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系,它不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子与特殊因子两部分.公共因子是由所有变量共同具有的少数几个因子；特殊因子是每个原始变量独自具有的因子.对新产生的主成分变量及因子变量计算其得分,就可以将主成分得分或因子得分代替原始变量进行进一步的分析,因为主成分变量及因子变量比原始变量少了许多,所以起到了降维的作用,为我们处理数据降低了难度.
聚类分析的基本思想是: 采用多变量的统计值,定量地确定相互之间的亲疏关系,考虑对象多因素的联系和主导作用,按它们亲疏差异程度,归入不同的分类中一元,使分类更具客观实际并能反映事物的
内在必然联系.也就是说,聚类分析是把研究对象视作多维空间中的许多点,并合理地分成若干类,因此它是一种根据变量域之间的相似性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内在组合关系[3 ].聚类分析是通过一个大的对称矩阵来探索相关关系的一种数学分析方法,是多元统计分析方法,分析的结果为群集.对向量聚类后,我们对数据的处理难度也自然降低,所以从某种意义上说,聚类分析也起到了降维的作用.
(二) 不同之处
主成分分析是研究如何通过少数几个主成分来解释多变量的方差一协方差结构的分析方法,也就是求出少数几个主成分(变量) ,使它们尽可能多地保留原始变量的信息,且彼此不相关.它是一种数学变换方法,即把给定的一组变量通过线性变换,转换为一组不相关的变量(两两相关系数为0 ,或样本向量彼此相互垂直的随机变量) ,在这种变换中,保持变量的总方差(方差之和) 不变,同时具有最大方差,称为第一主成分；具有次大方差,称为第二主成分.依次类推.若共有p 个变量,实际应用中一般不是找p 个主成分,而是找出m (m < p) 个主成分就够了,只要这m 个主成分能反映原来所有变量的绝大部分的方差.主成分分析可以作为因子分析的一种方法出现.
因子分析是寻找潜在的起支配作用的因子模型的方法.因子分析是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低,每组变量代表一个基本结构,这个基本结构称为公共因子.对于所研究的问题就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量.通过因子分析得来的新变量是对每个原始变量进行内部剖析.因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子和特殊因子两部分.具体地说,就是要找出某个问题中可直接测量的具有一定相关性的诸指标,如何受少数几个在专业中有意义、又不可直接测量到、且相对独立的因子支配的规律,从而可用各指标的测定来间接确定各因子的状态.因子分析只能解释部分变异,主成分分析能解释所有变异.
聚类分析算法是给定m 维空间R 中的n 个向量,把每个向量归属到k 个聚类中的某一个,使得每一个向量与其聚类中心的距离最小.聚类可以理解为: 类内的相关性尽量大,类间相关性尽量小.聚类问题作为一种无指导的学习问题,目的在于通过把原来的对象集合分成相似的组或簇,来获得某种内
在的数据规律.
从三类分析的基本思想可以看出,聚类分析中并没于产生新变量,但是主成分分析和因子分析都产生了新变量.
三、数据标准化的比较
主成分分析中为了消除量纲和数量级,通常需要将原始数据进行标准化,将其转化为均值为0方差为1 的无量纲数据.而因子分析在这方面要求不是太高,因为在因子分析中可以通过主因子法、加权最小二乘法、不加权最小二乘法、重心法等很多解法来求因子变量,并且因子变量是每一个变量的内部影响变量,它的求解与原始变量是否同量纲关系并不太大,当然在采用主成分法求因子变量时,仍需标准化.不过在实际应用的过程中,为了尽量避免量纲或数量级的影响,建议在使用因子分析前还是要进行数据标准化.在构造因子变量时采用的是主成分分析方法,主要将指标值先进行标准化处理得到协方差矩阵,即相关矩阵和对应的特征值与特征向量,然后构造综合评价函数进行评价.
聚类分析中如果参与聚类的变量的量纲不同会导致错误的聚类结果.因此在聚类过程进行之前必须对变量值进行标准化,即消除量纲的影响.不同方法进行标准化,会导致不同的聚类结果要注意变量的分布.如果是正态分布应该采用z 分数法.
四、应用中的优缺点比较
(一) 主成分分析
1、优点
首先它利用降维技术用少数几个综合变量来代替原始多个变量,这些综合变量集中了原始变量的大部分信息.其次它通过计算综合主成分函数得分,对客观经济现象进行科学评价.再次它在应用上侧重于信息贡献影响力综合评价.
2、缺点
当主成分的因子负荷的符号有正有负时,综合评价函数意义就不明确.命名清晰性低.
(二) 因子分析
1、优点
第一它不是对原有变量的取舍,而是根据原始变量的信息进行重新组合,找出影响变量的共同因子,化
简数据；第二,它通过旋转使得因子变量更具有可解释性,命名清晰性高.
2、缺点
在计算因子得分时,采用的是最小二乘法,此法有时可能会失效.
(三) 聚类分析
1、优点
聚类分析模型的优点就是直观,结论形式简明.
2、缺点
在样本量较大时,要获得聚类结论有一定困难.由于相似系数是根据被试的反映来建立反映被试间内在联系的指标,而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系,但事物之间却无任何内在联系,此时,如果根据距离或相似系数得出聚类分析的结果,显然是不适当的,但是,聚类分析模型本身却无法识别这类错误.。