PCA主成分分析计算步骤

合集下载

主成分分析PCA(含有详细推导过程以与案例分析matlab版)

主成分分析法(PCA)在实际问题中，我们经常会遇到研究多个变量的问题，而且在多数情况下，多个变量之间常常存在一定的相关性。

由于变量个数较多再加上变量之间的相关性，势必增加了分析问题的复杂性。

如何从多个变量中综合为少数几个代表性变量，既能够代表原始变量的绝大多数信息，又互不相关，并且在新的综合变量基础上，可以进一步的统计分析，这时就需要进行主成分分析。

I. 主成分分析法(PCA)模型（一）主成分分析的基本思想主成分分析是采取一种数学降维的方法，找出几个综合变量来代替原来众多的变量，使这些综合变量能尽可能地代表原来变量的信息量，而且彼此之间互不相关。

这种将把多个变量化为少数几个互相无关的综合变量的统计分析方法就叫做主成分分析或主分量分析。

主成分分析所要做的就是设法将原来众多具有一定相关性的变量，重新组合为一组新的相互无关的综合变量来代替原来变量。

通常，数学上的处理方法就是将原来的变量做线性组合，作为新的综合变量，但是这种组合如果不加以限制，则可以有很多，应该如何选择呢？如果将选取的第一个线性组合即第一个综合变量记为1F ，自然希望它尽可能多地反映原来变量的信息，这里“信息”用方差来测量，即希望)(1F Var 越大，表示1F 包含的信息越多。

因此在所有的线性组合中所选取的1F 应该是方差最大的，故称1F 为第一主成分。

如果第一主成分不足以代表原来p 个变量的信息，再考虑选取2F 即第二个线性组合，为了有效地反映原来信息，1F 已有的信息就不需要再出现在2F 中，用数学语言表达就是要求0),(21=F F Cov ，称2F 为第二主成分，依此类推可以构造出第三、四……第p 个主成分。

（二）主成分分析的数学模型对于一个样本资料，观测p 个变量p x x x Λ,,21，n 个样品的数据资料阵为：⎪⎪⎪⎪⎪⎭⎫⎝⎛=np n n p p x x x x x x x x x X ΛM M M M ΛΛ212222111211()p x x x Λ,,21= 其中：p j x x x x nj j j j ΛM ,2,1,21=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=主成分分析就是将p 个观测变量综合成为p 个新的变量（综合变量），即⎪⎪⎩⎪⎪⎨⎧+++=+++=+++=ppp p p p pp pp x a x a x a F x a x a x a F x a x a x a F ΛΛΛΛ22112222121212121111 简写为：p jp j j j x x x F ααα+++=Λ2211p j ,,2,1Λ=要求模型满足以下条件：①j i F F ,互不相关（j i ≠，p j i ,,2,1,Λ=） ②1F 的方差大于2F 的方差大于3F 的方差，依次类推 ③.,2,1122221p k a a a kp k k ΛΛ==+++于是，称1F 为第一主成分，2F 为第二主成分，依此类推，有第p 个主成分。

主成分分析法pca的流程

主成分分析法pca的流程英文回答：PCA (Principal Component Analysis) is a popular technique used for dimensionality reduction and data visualization. It is widely used in various fields such as data analysis, machine learning, and pattern recognition. The main goal of PCA is to find the directions (or principal components) in the data that capture the maximum amount of variation.The process of PCA can be summarized in the following steps:1. Standardize the data: Before performing PCA, it is important to standardize the data by subtracting the mean and dividing by the standard deviation. This ensures that all variables are on a similar scale and prevents any one variable from dominating the analysis.2. Calculate the covariance matrix: The next step is to calculate the covariance matrix of the standardized data. The covariance matrix represents the relationships between different variables in the data. It is a square matrix where each element represents the covariance between two variables.3. Compute the eigenvectors and eigenvalues: The eigenvectors and eigenvalues of the covariance matrix are calculated next. The eigenvectors represent the directions (or components) in the data, while the eigenvalues represent the amount of variance explained by each component. The eigenvectors are sorted in descending order based on their corresponding eigenvalues.4. Select the principal components: The next step is to select the principal components based on the eigenvalues. The principal components with the highest eigenvalues capture the most variation in the data. Typically, acertain percentage of the total variance is chosen as a threshold for selecting the components.5. Transform the data: Finally, the data is transformed into the new coordinate system defined by the selected principal components. This transformation reduces the dimensionality of the data while preserving the maximum amount of variation. The transformed data can be used for further analysis or visualization.To illustrate the process, let's consider a datasetwith three variables: height, weight, and age. We want to reduce the dimensionality of the data and visualize it in a lower-dimensional space.First, we standardize the data by subtracting the mean and dividing by the standard deviation. Then, we calculate the covariance matrix to understand the relationships between the variables. Next, we compute the eigenvectorsand eigenvalues of the covariance matrix. Let's say we find that the first principal component explains 70% of thetotal variance, the second principal component explains 20%, and the third principal component explains 10%.Based on these eigenvalues, we decide to select thefirst two principal components, as they capture a total of 90% of the variation in the data. We transform the data into the new coordinate system defined by these two components.中文回答：主成分分析（Principal Component Analysis，PCA）是一种常用的降维和数据可视化技术。

PCA分析方法

主成分分析主成分分析（Principal Component Analysis ，PCA ）或者主元分析。

是一种掌握事物主要矛盾的统计分析方法，它可以从多元事物中解析出主要影响因素，揭示事物的本质，简化复杂的问题。

计算主成分的目的是将高维数据投影到较低维空间。

给定n 个变量的m 个观察值，形成一个n ′ m 的数据矩阵，n 通常比较大。

对于一个由多个变量描述的复杂事物，人们难以认识，那么是否可以抓住事物主要方面进行重点分析呢？如果事物的主要方面刚好体现在几个主要变量上，我们只需要将这几个变量分离出来，进行详细分析。

但是，在一般情况下，并不能直接找出这样的关键变量。

这时我们可以用原有变量的线性组合来表示事物的主要方面，PCA 就是这样一种分析方法。

PCA 主要用于数据降维，对于一系列例子的特征组成的多维向量，多维向量里的某些元素本身没有区分性，比如某个元素在所有的例子中都为1，或者与1差距不大，那么这个元素本身就没有区分性，用它做特征来区分，贡献会非常小。

所以我们的目的是找那些变化大的元素，即方差大的那些维，而去除掉那些变化不大的维，从而使特征留下的都是“精品”，而且计算量也变小了。

对于一个k维的特征来说，相当于它的每一维特征与其他维都是正交的（相当于在多维坐标系中，坐标轴都是垂直的），那么我们可以变化这些维的坐标系，从而使这个特征在某些维上方差大，而在某些维上方差很小。

例如，一个45度倾斜的椭圆，在第一坐标系，如果按照x,y坐标来投影，这些点的x和y的属性很难用于区分他们，因为他们在x,y轴上坐标变化的方差都差不多，我们无法根据这个点的某个x属性来判断这个点是哪个，而如果将坐标轴旋转，以椭圆长轴为x轴，则椭圆在长轴上的分布比较长，方差大，而在短轴上的分布短，方差小，所以可以考虑只保留这些点的长轴属性，来区分椭圆上的点，这样，区分性比x,y轴的方法要好！所以我们的做法就是求得一个k维特征的投影矩阵，这个投影矩阵可以将特征从高维降到低维。

主成分分析(PCA)数学原理详解

主成分分析（PCA）数学原理详解PCA的数学原理可以分为以下几个步骤：1.数据中心化PCA首先将原始数据进行中心化处理，即将每个特征的均值减去相应特征的平均值，这是因为PCA假设数据围绕着原点分布，中心化可以消除数据的平移影响。

2.协方差矩阵的计算PCA的关键是计算数据的协方差矩阵。

协方差矩阵描述了不同特征之间的相关性。

对于一个n维的数据集，协方差矩阵是一个n×n的矩阵，其中第(i,j)个元素表示第i个特征和第j个特征的协方差。

协方差矩阵的计算公式如下：$C = \frac{1}{n-1} \sum _{i=1}^{n}(X_i - \overline{X})(X_i - \overline{X})^T$其中，X是一个n×m的矩阵，表示n个样本的m个特征，$\overline{X}$ 表示特征均值向量协方差矩阵是一个对称矩阵，通过对协方差矩阵的特征值分解，可以得到特征值和特征向量。

3.特征值和特征向量的计算对协方差矩阵进行特征值分解，可以得到特征值和对应的特征向量。

特征值代表了数据在特征向量方向上的方差，而特征向量表示了数据的主成分方向。

设协方差矩阵为C，有如下特征值方程：$Cv = \lambda v$其中，v是特征向量，λ是特征值。

将特征值按从大到小的顺序排序，选择前k个最大的特征向量，即主成分，作为新的基向量。

这些特征向量构成了一个新的坐标系，用于表示原始数据的新坐标。

4.数据转换将原始数据投影到新的坐标系上，得到降维后的数据。

设原始数据集为X，新的基向量为V（由前k个特征向量组成），降维后的数据集为Y，可以通过如下公式计算：$Y=XV$其中，X是一个n×m的矩阵，表示n个样本的m个特征，V是一个m×k的矩阵，Y是一个n×k的矩阵。

通过PCA降维，可以获得降维后的数据集Y，它是一个n×k的矩阵。

总结：主成分分析（PCA）通过计算数据的协方差矩阵，得到协方差矩阵的特征值和特征向量。

主成分分析(PCA)详解(附带详细公式推导)

主成分分析（PCA）详解（附带详细公式推导）1.假设有一个m维的数据集X，其中每个数据点有n个样本。

需要将其降维到k维，且k<m。

2. 首先需进行数据的中心化，即对每个维度的数据减去该维度的均值，即X' = X - mean(X)。

3.然后计算协方差矩阵C=(1/n)*X'*X'^T，其中X'^T表示X'的转置。

4.对协方差矩阵C进行特征值分解，得到特征值和对应的特征向量。

5.接下来，将特征值按从大到小的顺序排列，选取前k个最大的特征值及其对应的特征向量。

6. 最后，将选取的k个特征向量组成一个投影矩阵W =[e1,e2,...,ek]，其中ei表示第i个特征向量。

7.对中心化的数据集进行降维，Y=W*X'，其中Y即为降维后的数据。

上述推导过程中，协方差矩阵C的特征值代表了数据的方差，特征向量则代表了数据的主成分。

选取最大的k个特征值和对应的特征向量，即实现了数据的降维。

PCA的应用包括但不限于以下几个方面：1.数据可视化：PCA能够将高维度的数据映射到二维或三维空间，从而方便数据的可视化展示。

2.数据预处理：PCA能够降低数据的维度，从而减少噪声和冗余信息，提升后续模型的精度和效率。

3.特征提取：PCA能够提取数据中最重要的特征，从而辅助后续建模和特征工程。

4.噪声过滤：PCA能够降低数据的维度，从而过滤掉一些无关的噪声信息。

需要注意的是，PCA只能应用于线性数据，并且假设数据的方差和协方差是固定的。

同时，PCA对于数据中非线性关系的捕捉能力较弱，因此在处理非线性数据时，需考虑使用其他非线性降维方法，如核主成分分析（Kernel PCA）等。

综上所述，PCA是一种常用的多变量数据降维技术，在数据分析和机器学习领域有着广泛的应用。

通过线性变换，PCA将高维度的数据投影到低维空间中，从而减少数据的维度，并保留了数据中的主要信息。

pca的使用方法和注意事项

PCA的使用方法和注意事项一、PCA简介主成分分析（Principal Component Analysis，PCA）是一种广泛使用的统计方法，用于降维、特征提取和数据可视化。

PCA通过找到数据中的主要模式，将高维数据转换为低维数据，同时保留数据中的主要结构或变化。

这种转换有助于简化数据、减少计算复杂性和提高模型的解释性。

二、PCA使用方法PCA的使用主要包括以下步骤：1.数据预处理：对数据进行标准化或归一化，使其具有零均值和单位方差。

这一步是必要的，因为PCA对数据的规模或量纲敏感。

2.计算协方差矩阵：使用标准化后的数据计算协方差矩阵。

协方差矩阵是一个衡量数据中变量之间相关性的矩阵。

3.特征值分解：对协方差矩阵进行特征值分解，找到最大的特征值及其对应的特征向量。

这一步通常使用数学库（如NumPy、SciPy）进行计算。

4.确定主成分数量：选择前k个最大的特征值对应的特征向量，用于构建主成分。

k通常根据保留的总方差比例或根据应用需求来确定。

5.投影数据：将原始数据投影到选定的主成分上，得到降维后的数据。

这一步可以通过简单的矩阵乘法完成。

三、PCA注意事项在使用PCA时，需要注意以下几点：1.避免解释性陷阱：PCA仅关注方差最大化，而不是解释性最大化。

因此，选择的主成分可能与原始变量有很少或没有解释性联系。

为了提高解释性，可以考虑使用其他降维技术，如因子分析或线性判别分析。

2.处理缺失值：PCA对缺失值敏感，因此在应用PCA之前，应处理或填充缺失值。

常用的方法包括插值、删除缺失值或使用其他数据处理技术。

3.选择合适的维度：选择合适的主成分数量对于结果的解释性和性能至关重要。

保留的主成分数量应根据问题的实际需求来确定，同时应保留足够的解释性以提供有用的信息。

4.比较与其它降维技术：PCA并不是唯一的降维技术，还有许多其他的降维方法可用。

比较不同方法的性能和适用性可以帮助选择最适合特定数据集的方法。

例如，如果目标是分类任务，则可以考虑使用线性判别分析（LDA）。

pca降维计算

PCA降维计算的基本步骤
PCA（主成分分析）是一种常用的降维方法，它的目的是找到数据中的主要变化方向，通过保留主要的特征，降低数据的维度。

以下是PCA降维计算的基本步骤：
1. 数据标准化：首先，需要将数据标准化，即每个特征减去其均值并除以其标准差，
使得处理后的数据的均值为0，标准差为1。

2. 计算协方差矩阵：接下来，需要计算标准化数据的协方差矩阵。

协方差矩阵的每个
元素表示两个特征之间的协方差。

3. 计算协方差矩阵的特征值和特征向量：然后，需要计算协方差矩阵的特征值和特征
向量。

这些特征向量表示数据的主成分，而特征值表示每个主成分的方差大小。

4. 选择主成分：通常，我们只保留前k个最大的特征值对应的特征向量，这些特征向
量可以表示原始数据中的主要特征。

其余的特征向量对应的特征值较小，可以被忽略。

5. 投影数据：最后，将原始数据投影到选定的k个主成分上，得到降维后的数据。

以上就是PCA降维计算的基本步骤。

需要注意的是，PCA是一种无监督的机器学习方法，它不依赖于标签信息。

此外，PCA假设数据中的主要变化方向是线性关系，如果
数据中的特征之间存在非线性关系，PCA可能无法提取出所有的重要特征。

主成分分析的算法

主成分分析的算法主成分分析（Principal Component Analysis，简称PCA）是一种常用的数据分析算法，用于处理多变量数据集。

它会将原来有多个关联变量的数据降维成几个不相关、但具有相关性的变量。

PCA经常用于概括一个数据集的拟合方式，也常被应用于降低计算，实现变量绘图和模式发现。

一、PCA的基本原理主成分分析（PCA）是一种数据变换和降维技术，它的目的是将原始数据变换成一组新的数据集，这组新的数据集的维度较低，同时站点比原始数据更好地捕捉更多数据的规律。

这组新的数据集就是PCA变换之后的结果，也就是主成分。

PCA最核心的是将原始数据从高维空间（多变量）映射到低维空间（一维到三维）。

具体来说，即将多个数据变量的线性组合，映射到更少的变量上，而且变换后的变量间成立线性关系，整个变换过程可以被称为降维。

实质上，变换后的变量组合可以有效的揭示原始数据的结构，也就是将原始数据进行变换，简化数据对其属性的表达，从而更好的分析和发现必要的信息。

二、PCA的步骤1. 数据标准化处理：首先，进行数据标准化处理，即将原始数据的每个变量标准化，使其均值为0和标准差为1。

这步操作其实是为了方便后续步骤的计算。

2. 计算协方差矩阵：计算数据协方差矩阵，即原始数据点之间的协方差。

3. 计算特征值和特征向量：计算协方差矩阵的特征值和特征向量。

特征值就是一个实数，用以衡量特征向量的大小，而特征向量是一个方向，负责表示原始数据的某种特征。

4. 根据特征值进行排序：根据计算出来特征值对特征向量进行排序，选择具有较大特征值的特征向量构成主成分。

5. 根据设定的阈值选取主成分：根据主成分的特征值，阈值设定，选取具有较大性能的主成分来组合构成新的变量坐标。

三、PCA的聚类应用聚类分析的目的是将一组数据划分为相似的组，依据数据特征和关系把观对用类概念来描述或表达。

主成分分析可以有效地减少聚类分析过程中使用数据维度，并且在推动聚类结果的准确性及减少数据维度这两方面起到双重作用，并且也可以在后续聚类分析工作过程中起到较小精度，更少时间复杂度的作用。

主成分分析PCA

• 两个向量方向，u1和u2，哪个向量可以更好的代表原始数据集？
基本思想
• 人们在对某一事物进行实证研究中,为了更全面、准确地反映出事物的特征及其发展规律，通常会考虑尽可能多的指标，以避免遗漏重要的信息
• 但过多的指标，会给研究带来一定困难，并且众多的指标之间可能存在一定的相关性，这样就造成了信息的重叠，给研究结果带来影响
基于主成分分析法的洞庭湖水质评价
• 根据主成分分析法中主成分个数选取原则，从表3 可见特征值λ>1 时有 3 个成分
• 图 2 分析特征根衰减的突变，可以确定应提取 3 个主成分
基于主成分分析法的洞庭湖水质评价
初始因子荷载矩阵计算，计算结果见表4。从表4 中可知，铜、六价铬和砷在第一主成分上荷载较大，说明第一主成分基本反映了这些指标的信息。从湖区实际污染来源看湖区水质受工业废水污染最为严重。
表1 地区土地生态安全评价相关关系矩阵
运用实例
3、由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率。
由右表可知，前3项贡献率依次为 60.907%、12.963%、11.335%，其累计贡献率85.205%，大于85%，表示前3项主成分具有较高的可信度，能够基本涵盖全部数据的信息，故将前三项作为主成分分析因子
总结
地下水质量评价是一个复杂多变的系统，不能只简单依靠单一指标来确定污染程度。本文采用的主成分分析法就是根据水质的污染情况，着重把地下水主要污染物进行类别分析，客观科学的确定权数。主成分分析方法注重遵循原始数据, 尽量减少原始数据的损失, 实际客观的确定权数, 消除了指标选择时因人为而造成的差异, 该评价方法科学严谨、体系完整, 有较高的可靠性此次评价选择的 16 个评价指标存在一定的关联性，该方法的水环境质量分级标准还有待提高完善，导致计算所得的综合主成分分值表现出的只是地下水质量的一种相对关系。

如何通俗易懂地理解PCA主成分分析

1.主成分分析（PCA）主成分分析（Principal Component Analysis，PCA）是一种无监督学习的多元统计分析方法。

PCA分析的主要原理是将高维数据投影到较低维空间，提取多元事物的主要因素，揭示其本质特征。

它可以高效地找出数据中的主要部分，将原有的复杂数据降维处理。

PCA分析被广泛应用于很多领域，比如理论物理学、气象学、心理学、生物学、化学、工程学等[1]。

2.PCA图解析图1、对照组和实验组的PCA得分图PCA得分图能将对照组和实验组样本区分开。

在PCA图中，如果样本之间聚集在一起，说明这些样本差异性小；反之样本之间距离越远，说明样本之间差异性越大。

图2、含质控样本的对照组和实验组PCA得分图PCA还可进行质控，PCA图中含质控样品（mix），若质控样品聚集在一起，表明检测过程稳定性好，数据可靠；若质控样品很分散或具有一定的变化趋势，则说明检测质量存在一定的问题。

3.PCA分析理解主成分分析是对于原先提出的所有变量，删去多余、重复的变量（关系紧密的变量），建立尽可能少的新变量，使得这些新变量是两两不相关。

PCA分析的过程就是信息浓缩的过程。

在用统计分析方法研究多变量的课题时，变量个数太多就会增加课题的复杂性，PCA分析可以用比较少的变量来概括描述课题信息的同时尽可能保持原有的信息，这些新变量称之为主成分。

PCA分析并不是选出一些变量，然后丢掉另外的变量，实际上是它找出一些新的变量，而且这些新变量可以很好的描述样本信息。

怎么找这些新变量呢？利用的还是之前的变量，通过空间投影和线性变换找到一些新的变量（线性组合）。

这样的变量有很多，PCA做的就是找出那些最佳组合[2]，PCA找出最佳新变量的过程如图3所示。

图3、PCA获取新变量的过程[2]4.PCA分析原理与算法（1）PCA原理图4、数据空间投影和线性变换图4里蓝点表示样本的两个特征x和y，它们是相关的，画一条穿过这些点的黑线，让这些点都投影到黑线上，黑线上的红点就表示蓝点的投影，这样就获得一个新变量（黑线上的红点）。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

主成分分析（ Principal Component Analysis ， PCA ）是一种掌握事物主要矛盾的统计分析方法，它可以从多元事物中解析出主要影响因素，揭示事物的本质，简化复杂的问题。

计算主成分的目的是将高维数据投影到较低维空间。

给定 n 个变量的 m 个观察值，形成一个 n*m 的数据矩阵， n 通常比较大。

但是，在一般情况下，并不能直接找出这样的关键变量。

这时我们可以用原有变量的线性组合来表示事物的主要方面， PCA 就是这样一种分析方法。

PCA 的目标是寻找 r （ r<n ）个新变量，使它们反映事物的主要特征，压缩原有数据矩阵的规模。

每个新变量是原有变量的线性组合，体现原有变量的综合效果，具有一定的实际含义。

这 r 个新变量称为“主成分”，它们可以在很大程度上反映原来 n 个变量的影响，并且这些新变量是互不相关的，也是正交的。

通过主成分分析，压缩数据空间，将多元数据的特征在低维空间里直观地表示出来。

例如，将多个时间点、多个实验条件下的基因表达谱数据（ N 维）表示为 3 维空间中的一个点，即将数据的维数从 RN 降到 R3 。

在进行基因表达数据分析时，一个重要问题是确定每个实验数据是否是独立的，如果每次实验数据之间不是独立的，则会影响基因表达数据分析结果的准确性。

对于利用基因芯片所检测到的基因表达数据，如果用 PCA 方法进行分析，可以将各个基因作为变量，也可以将实验条件作为变量。

当将基因作为变量时，通过分析确定一组“主要基因元素”，它们能够很好地说明基因的特征，解释实验现象；当将实验条件作为变量时，通过分析确定一组“主要实验因素”，它们能够很好地刻画实验条件的特征，解释基因的行为。

下面着重考虑以实验条件作为变量的 PCA 分析方法。

假设将数据的维数从 R N 降到 R 3 ，具体的 PCA 分析步骤如下：
(1) 第一步计算矩阵 X 的样本的协方差矩阵 S ；
(2) 第二步计算协方差矩阵S的特征向量 e1,e2,…,eN的特征值 , i = 1,2,…,N 。

特征值按大到小排序；
(3)第三步投影数据到特征向量张成的空间之中，这些特征向量相应的特征值为。

现在数据可以在三维空间中展示为云状的点集。

对于 PCA ，确定新变量的个数 r 是一个两难的问题。

我们的目标是减小 r ，如果 r 小，则数据的维数低，便于分析，同时也降低了噪声，但可能丢失一些有用的信息。

究竟如何确定 r 呢？这需要进一步分析每个主元素对信息的贡献。

令代表第 i 个特征值，定义第 i 个主元素的贡献率为：
(8-45)
前 r 个主成分的累计贡献率为：
(8-46)
贡献率表示所定义的主成分在整个数据分析中承担的主要意义占多大的比重，当取前 r 个主成分来代替原来全部变量时，累计贡献率的大小反应了这种取代的可靠性，累计贡献率越大，可靠性越大；反之，则可靠性越小。

一般要求累计贡献率达到 70% 以上。

经过 PCA 分析，一个多变量的复杂问题被简化为低维空间的简单问题。

可以利用这种简化方法进行作图，形象地表示和分析复杂问题。

在分析基因表达数据时，可以针对基因作图，也可以针对实验条件作图。

前者称为 Q 分析，后者称为 R 分析。