浅析主成分分析法及案例分析

合集下载

主成分分析案例范文

主成分分析案例范文

主成分分析案例范文假设我们有一个包含多个汽车特征的数据集,每个汽车被表示为一个m维向量。

我们想要对数据进行降维,以便更好地理解和可视化数据。

我们可以利用主成分分析,将高维数据转换为低维数据,然后选择其中的几个主成分进行分析。

首先,我们需要对数据进行标准化处理,即使得每个维度的均值为0,方差为1、这是因为PCA是一种基于协方差矩阵的方法,对于不同单位和尺度的变量,会导致主成分的不准确。

接下来,我们计算数据的协方差矩阵。

协方差矩阵描述了数据之间的线性关系,其中每个元素表示两个变量之间的协方差。

对于m维数据,其协方差矩阵为一个大小为mxm的矩阵。

然后,我们计算协方差矩阵的特征向量和特征值。

特征向量描述了协方差矩阵的主要方向,特征值表示了数据在特征向量方向的方差。

特征向量按照对应特征值的大小进行排序,最大的特征值对应的特征向量即为第一主成分,第二大的特征值对应的特征向量即为第二主成分,以此类推。

我们可以选择前k个主成分进行降维,其中k可以根据需求进行选择。

最后,我们将数据投影到所选择的前k个主成分上。

具体做法是将数据与特征向量构成的转换矩阵相乘,得到数据在新的低维空间中的表示。

通过PCA降维,我们可以减少数据的维度,并保留了大部分的方差信息。

这有助于数据可视化和分析。

下面以一个具体的例子说明PCA的应用。

假设我们有一个汽车数据集,其中包含汽车的各种特征,如车速、发动机功率、车重、燃油消耗等。

我们的目标是将这些特征进行降维,并查看是否可以找到一些有趣的模式。

首先,我们对数据进行标准化处理,确保每个特征的均值为0,方差为1然后,我们计算数据的协方差矩阵,找到其特征向量和特征值。

接下来,我们选择前两个特征值最大的特征向量作为第一和第二主成分。

这两个主成分分别表示数据的主要方向。

我们可以将数据投影到这两个主成分上,得到一个二维的表示。

最后,我们可以在二维空间中绘制投影后的数据,并观察数据之间的分布。

如果在二维空间中存在一些有趣的模式,我们可以进一步探索这些模式,并进行更深入的分析。

主成分分析法精华讲义及实例

主成分分析法精华讲义及实例

主成分分析类型:一种处理高维数据的方法。

降维思想:在实际问题的研究中,往往会涉及众多有关的变量。

但是,变量太多不但会增加计算的复杂性,而且也会给合理地分析问题和解释问题带来困难。

一般说来,虽然每个变量都提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。

因而人们希望对这些变量加以“改造”,用为数极少的互补相关的新变量来反映原变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。

一、总体主成分1.1 定义设 X 1,X 2,…,X p 为某实际问题所涉及的 p 个随机变量。

记 X=(X 1,X 2,…,Xp)T ,其协方差矩阵为()[(())(())],T ij p p E X E X X E X σ⨯∑==--它是一个 p 阶非负定矩阵。

设1111112212221122221122Tp p Tp pT pp p p pp p Y l X l X l X l X Y l X l X l X l X Y l X l X l X l X⎧==+++⎪==+++⎪⎨⎪⎪==+++⎩(1) 则有()(),1,2,...,,(,)(,),1,2,...,.T T i i i i TT T i j ijij Var Y Var l X l l i p Cov Y Y Cov l X l X l l j p ==∑===∑= (2)第 i 个主成分: 一般地,在约束条件1T i i l l =及(,)0,1,2,..., 1.T i k i k Cov Y Y l l k i =∑==-下,求 l i 使 Var(Y i )达到最大,由此 l i 所确定的T i i Y l X =称为 X 1,X 2,…,X p 的第 i 个主成分。

1.2 总体主成分的计算设 ∑是12(,,...,)T p X X X X =的协方差矩阵,∑的特征值及相应的正交单位化特征向量分别为120p λλλ≥≥≥≥及12,,...,,p e e e则 X 的第 i 个主成分为1122,1,2,...,,T i i i i ip p Y e X e X e X e X i p ==+++= (3)此时(),1,2,...,,(,)0,.Ti i i i Ti k i k Var Y e e i p Cov Y Y e e i k λ⎧=∑==⎪⎨=∑=≠⎪⎩ 1.3 总体主成分的性质1.3.1 主成分的协方差矩阵及总方差记 12(,,...,)T p Y Y Y Y = 为主成分向量,则 Y=P T X ,其中12(,,...,)p P e e e =,且12()()(,,...,),T T p Cov Y Cov P X P P Diag λλλ==∑=Λ=由此得主成分的总方差为111()()()()(),p ppTTiii i i i Var Y tr P P tr PP tr Var X λ=====∑=∑=∑=∑∑∑即主成分分析是把 p 个原始变量 X 1,X 2,…,X p 的总方差1()pii Var X =∑分解成 p 个互不相关变量 Y 1,Y 2,…,Y p 的方差之和,即1()pii Var Y =∑而 ()k k Var Y λ=。

主成分分析法实例

主成分分析法实例

主成分分析法实例PCA的基本思想是将原始数据在坐标系下进行变换,使得各个坐标轴之间的相关性最小化。

在变换后的坐标系中,第一个主成分表示数据中方差最大的方向,第二个主成分表示与第一个主成分正交且方差次大的方向,以此类推。

因此,保留前k个主成分就可以达到降维的目的。

下面我们通过一个实例来详细介绍PCA的应用过程。

假设我们有一个二维数据集,其中包含了500个样本点,每个样本点具有两个特征。

我们首先需要对数据进行标准化处理,即对每个特征进行零均值化和单位方差化,这可以通过下面的公式实现:\[x_j' = \frac{x_j - \overline{x_j}}{\sigma_j}\]其中,\(x_j\)表示第j个特征的原始值,\(\overline{x_j}\)表示第j个特征的均值,\(\sigma_j\)表示第j个特征的标准差。

通过标准化处理后,我们可以得到一个均值为0,方差为1的数据集。

接下来,我们计算数据集的协方差矩阵。

协方差矩阵可以帮助我们衡量变量之间的相关性,它的第i行第j列的元素表示第i个特征与第j个特征的协方差。

\[Cov(X) = \frac{1}{n-1}(X - \overline{X})^T(X -\overline{X})\]其中,X是一个n行m列的矩阵,表示数据集,\(\overline{X}\)是一个n行m列的矩阵,表示X的每一列的均值。

协方差矩阵可以通过求解数据集的散布矩阵来得到,散布矩阵的定义如下:\[Scatter(X) = (X - \overline{X})^T(X - \overline{X})\]我们将协方差矩阵的特征值和特征向量求解出来,特征值表示每个特征方向上的方差,特征向量表示每个特征方向上的权重。

我们将特征值按照从大到小的顺序排序,选择前k个特征值对应的特征向量作为主成分。

最后,我们将数据集投影到选取的主成分上,得到降维后的数据集。

投影的过程可以通过下面的公式实现:\[y=XW\]其中,X是一个n行m列的矩阵,表示数据集,W是一个m行k列的矩阵,表示主成分。

主成分分析法及其应用

主成分分析法及其应用

主成分分析法及其应用一、本文概述主成分分析法(Principal Component Analysis,简称PCA)是一种广泛应用于数据降维和特征提取的统计方法。

它通过正交变换将原始数据集中的多个变量转换为少数几个互不相关的主成分,这些主成分能够最大程度地保留原始数据集中的信息。

本文旨在全面介绍主成分分析法的基本原理、实现步骤以及在各个领域中的应用案例。

我们将详细阐述主成分分析法的数学基础和算法流程,包括协方差矩阵、特征值、特征向量等关键概念的计算方法。

然后,我们将通过实例演示如何使用主成分分析法进行数据降维和特征提取,以及如何通过可视化工具展示降维后的数据效果。

我们将探讨主成分分析法在机器学习、图像处理、生物信息学、社会科学等多个领域中的实际应用,展示其在数据分析和处理中的重要价值和潜力。

二、主成分分析法的基本原理主成分分析法(Principal Component Analysis,简称PCA)是一种在多个变量中找出主要影响因素,并通过降维技术把多个变量转化为少数几个互不相关的综合变量的统计方法。

这种方法在保持数据信息损失最小的原则下,通过正交变换将原始数据转化为一个新的坐标系统,使得在这个新的坐标系统中,任何数据的最大方差都投影在第一主成分上,第二大的方差都投影在第二主成分上,以此类推。

变量降维:在多数情况下,原始数据集中可能存在多个变量,这些变量之间可能存在相关性。

主成分分析通过构造新的变量(即主成分),这些新变量是原始变量的线性组合,并且新变量之间互不相关,从而将原始的高维数据空间降维到低维空间,实现数据的简化。

方差最大化:主成分分析的另一个重要原理是方差最大化。

这意味着,第一个主成分将捕获数据中的最大方差,第二个主成分捕获第二大方差,以此类推。

通过这种方式,主成分分析能够识别出数据中的主要变化方向和模式。

数据解释性:主成分分析生成的主成分是对原始数据的线性变换,因此,每个主成分都可以被解释为原始变量的某种组合。

主成分分析经典案例

主成分分析经典案例

主成分分析经典案例
主成分分析是一种常用的数据降维和模式识别方法,它可以帮助我们发现数据
中隐藏的结构和模式。

在实际应用中,主成分分析有很多经典案例,下面我们将介绍其中一些。

首先,我们来看一个经典的主成分分析案例,手写数字识别。

在这个案例中,
我们需要识别手写的数字,例如0-9。

我们可以将每个数字的图像表示为一个向量,然后利用主成分分析来找到最能代表数字特征的主成分。

通过这种方法,我们可以将复杂的图像数据降维到较低维度,从而更容易进行分类和识别。

另一个经典案例是面部识别。

在这个案例中,我们需要识别不同人脸的特征。

同样地,我们可以将每个人脸的图像表示为一个向量,然后利用主成分分析来找到最能代表人脸特征的主成分。

通过这种方法,我们可以将复杂的人脸数据降维到较低维度,从而更容易进行人脸识别和验证。

此外,主成分分析还可以应用于金融领域。

例如,在投资组合管理中,我们可
以利用主成分分析来发现不同资产之间的相关性和结构。

通过这种方法,我们可以将复杂的资产数据降维到较低维度,从而更容易进行资产配置和风险管理。

在医学领域,主成分分析也有着重要的应用。

例如,在基因表达数据分析中,
我们可以利用主成分分析来发现不同基因之间的相关性和结构。

通过这种方法,我们可以将复杂的基因表达数据降维到较低维度,从而更容易进行基因分析和疾病诊断。

总之,主成分分析在各个领域都有着重要的应用。

通过发现数据中的主要结构
和模式,主成分分析可以帮助我们更好地理解和利用数据。

希望以上经典案例的介绍能够帮助您更好地理解主成分分析的应用。

主成分分析法spss经典案例

主成分分析法spss经典案例

主成分分析法spss经典案例主成分分析法(PrincipalComponentAnalysis,简称PCA)是为了降低多变量数据集中变量间的关联性而提出的一种统计分析方法。

它用来检查数据点之间是否存在强相关,并在不损失数据信息的基础上将原有的多个变量转化为更少的变量,以便于它们可以更好地表达任务的要求。

PCA的合并变量称为主成分,它们代表了原有变量的重要特征。

主成分分析法在SPSS中的应用SPSS是一种常用的统计分析软件,其中包括PCA分析工具。

为了使用SPSS进行PCA分析,用户首先必须收集数据并将其输入到SPSS 中。

接下来,用户需要使用SPSS的主成分分析工具来进行分析。

首先,用户可以通过选择分析中的“确定转换”选项来确定要建立的主成分的数量。

然后,“每个变量的可变性”和“变量的可变性之间的相关性”等参数将被显示在右侧的表中。

最后,用户可以通过点击“运行”按钮运行PCA分析,并在报告中查看结果。

主成分分析法的经典案例下面我们将讨论一个常见的PCA案例:研究早期教育对学生未来表现的影响。

在这个案例中,研究者需要分析多个变量,包括孩子的出生年龄、家庭经济情况、孩子看到的早期教育环境等,来评估早期教育对学生未来表现的影响。

由于其中有多个变量,因此使用PCA来帮助分析这些变量间的关联性,为获得更准确的分析结果提供帮助。

在使用PCA进行分析之前,首先需要从相关文献中获取研究变量的数据。

之后,将数据输入到SPSS中,并使用SPSS的PCA分析工具来检查变量之间的相关性。

在报告中,可以看到每个变量的可变性以及它们之间的相关性,最后可以得出结论,即早期教育对学生未来表现的影响等。

主成分分析法的优点PCA是一种有用的分析工具,能够从原有的多个变量中提取最重要的特征,从而减少变量之间的关联性。

PCA的另一个优点是,它可以将复杂的问题简化为较小数量的变量,从而便于进行分析,并且可以有效减少数据中的“噪声”。

此外,PCA还可以用来可视化数据,检测数据中的潜在模式,以及进行定量比较。

主成分分析法案例

主成分分析法案例主成分分析(Principal Component Analysis,PCA)是一种常用的降维技术,可以将高维数据映射到低维空间,同时保持数据信息最大化。

本文将介绍一个应用主成分分析法的案例,以展示其在实际问题中的应用价值。

假设我们有一个销售数据集,包含100个样本和10个特征。

我们希望通过主成分分析法来降低数据的维度,以便更好地理解和解释数据。

第一步是标准化数据。

由于每个特征的单位和范围可能不同,我们需要将其缩放到相同的尺度。

这样可以避免某些特征对主成分分析结果的影响过大。

通过减去特征均值并除以标准差,我们可以将数据的均值调整为0,方差调整为1。

第二步是计算特征的协方差矩阵。

协方差矩阵可以衡量不同特征之间的关系。

通过计算特征之间的协方差,我们可以得到一个10×10的协方差矩阵。

第三步是计算协方差矩阵的特征值和特征向量。

特征值可以衡量每个特征的重要性,特征向量则表示数据在这些特征方向上的投影。

第四步是选择主成分。

我们可以通过特征值的大小来选择主成分的数量。

特征值越大,说明对应特征向量的信息量越大。

在这个案例中,我们选择前三个特征值最大的特征向量作为主成分。

第五步是计算主成分得分。

我们可以将原始数据映射到选定的主成分上,从而得到主成分得分。

主成分得分是原始数据在主成分上的投影。

最后,我们可以通过对主成分进行可视化和解释来理解数据。

在这个案例中,我们可以绘制主成分之间的散点图,观察样本之间的分布情况。

同时,我们还可以计算主成分与原始特征的相关系数,以评估特征在主成分中的重要性。

总之,主成分分析法是一种强大的降维技术,可以帮助我们更好地理解和解释数据。

通过选择主成分,计算主成分得分以及解释主成分,我们可以在高维数据中寻找关键的信息。

主成分分析法案例

主成分分析法案例主成分分析法(Principal Component Analysis, PCA)是一种常用的多变量统计分析方法,它可以帮助我们发现数据中的主要特征和结构,从而简化数据集并减少信息丢失。

在本文中,我们将通过一个实际案例来介绍主成分分析法的应用。

案例背景。

假设我们有一个包含多个变量的数据集,我们希望通过主成分分析法来找出其中的主要特征,并将数据进行降维,以便更好地理解和解释数据。

数据准备。

首先,我们需要对数据进行预处理,包括数据清洗、缺失值处理、标准化等操作。

在这个案例中,我们假设数据已经经过了预处理,并且符合主成分分析的基本要求。

主成分分析。

接下来,我们将利用主成分分析法来分析数据。

主成分分析的基本思想是通过线性变换将原始变量转化为一组线性无关的新变量,这些新变量被称为主成分,它们能够最大程度地保留原始数据的信息。

在进行主成分分析之前,我们需要计算数据的协方差矩阵,并对其进行特征值分解。

通过特征值分解,我们可以得到数据的主成分和对应的特征值,从而找出数据中的主要特征。

案例分析。

假设我们得到了数据的前三个主成分,我们可以通过观察主成分的载荷(loadings)来理解数据中的结构。

载荷可以帮助我们理解每个主成分与原始变量之间的关系,从而解释数据的特点和规律。

通过主成分分析,我们可以发现数据中的主要特征和结构,从而更好地理解数据。

同时,我们还可以利用主成分分析的结果进行数据的降维,从而简化数据集并减少信息丢失。

结论。

通过以上案例分析,我们可以看到主成分分析法在多变量数据分析中的重要作用。

通过主成分分析,我们可以发现数据中的主要特征和结构,从而简化数据集并减少信息丢失。

同时,主成分分析还可以帮助我们更好地理解和解释数据,为后续的分析和应用提供有力支持。

总结。

在本文中,我们通过一个实际案例介绍了主成分分析法的基本原理和应用。

主成分分析是一种常用的多变量统计分析方法,它可以帮助我们发现数据中的主要特征和结构,从而简化数据集并减少信息丢失。

主成分分析例题详解

主成分分析例题详解主成分分析(Principal Component Analysis,简称PCA)是一种常用的数据降维技术,用于发现数据中的主要模式和结构。

本文将通过一个例题详细介绍主成分分析的原理和应用。

1. 问题描述假设我们有一个包含10个变量的数据集,每个变量都与某个特定的因素相关。

我们希望通过主成分分析来降低数据的维度,并找出对总体方差贡献最大的主成分。

2. 数据预处理在进行主成分分析之前,我们需要对数据进行预处理。

首先,我们需要对数据进行标准化,使得每个变量具有相同的尺度。

这样可以避免某些变量的值对主成分分析结果造成过大的影响。

其次,我们计算数据的协方差矩阵。

协方差矩阵描述了各个变量之间的线性关系。

通过计算协方差矩阵,我们可以得到数据中的主要结构和模式。

3. 特征值分解在得到协方差矩阵之后,我们对其进行特征值分解。

特征值分解可以将协方差矩阵分解为特征值和特征向量的乘积。

特征值表示了每个特征向量对应的主成分解释的方差。

特征向量则表示了每个主成分的权重。

对于该例题,我们得到了10个特征值和10个特征向量。

我们可以通过排序特征值的大小,找出贡献最大的主成分。

4. 主成分的选择通常情况下,我们选择前k个特征值对应的特征向量作为主成分。

这样可以保留数据中大部分的结构和模式。

在该例题中,假设前3个特征值分别为λ1、λ2和λ3,并对应的特征向量分别为v1、v2和v3。

我们选择前3个特征值对应的特征向量作为主成分。

5. 降维和重构通过选择主成分,我们可以将数据从原先的10维降到3维。

其中,每个样本在新的3维空间中的坐标可以通过与主成分的内积计算得到。

此外,我们还可以通过主成分将数据从降维空间重新投影回原始空间。

这样可以保留主成分中所包含的结构和模式。

6. 结论通过主成分分析,我们成功地降低了数据的维度,并找到了对总体方差贡献最大的主成分。

这样的降维操作可以减少特征空间的维度,并提取出数据中的重要信息。

主成分分析报告PCA(含有详细推导过程以及案例分析报告matlab版)

主成分分析法(PCA)在实际问题中,我们经常会遇到研究多个变量的问题,而且在多数情况下,多个变量之间常常存在一定的相关性。

由于变量个数较多再加上变量之间的相关性,势必增加了分析问题的复杂性。

如何从多个变量中综合为少数几个代表性变量,既能够代表原始变量的绝大多数信息,又互不相关,并且在新的综合变量基础上,可以进一步的统计分析,这时就需要进行主成分分析。

I. 主成分分析法(PCA)模型(一)主成分分析的基本思想主成分分析是采取一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关。

这种将把多个变量化为少数几个互相无关的综合变量的统计分析方法就叫做主成分分析或主分量分析。

主成分分析所要做的就是设法将原来众多具有一定相关性的变量,重新组合为一组新的相互无关的综合变量来代替原来变量。

通常,数学上的处理方法就是将原来的变量做线性组合,作为新的综合变量,但是这种组合如果不加以限制,则可以有很多,应该如何选择呢?如果将选取的第一个线性组合即第一个综合变量记为1F ,自然希望它尽可能多地反映原来变量的信息,这里“信息”用方差来测量,即希望)(1F Var 越大,表示1F 包含的信息越多。

因此在所有的线性组合中所选取的1F 应该是方差最大的,故称1F 为第一主成分。

如果第一主成分不足以代表原来p 个变量的信息,再考虑选取2F 即第二个线性组合,为了有效地反映原来信息,1F 已有的信息就不需要再出现在2F 中,用数学语言表达就是要求0),(21=F F Cov ,称2F 为第二主成分,依此类推可以构造出第三、四……第p 个主成分。

(二)主成分分析的数学模型对于一个样本资料,观测p 个变量p x x x ,,21,n 个样品的数据资料阵为:⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=np n n p p x x x x x x x x x X212222111211()p x x x ,,21=其中:p j x x x x nj j j j ,2,1,21=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛= 主成分分析就是将p 个观测变量综合成为p 个新的变量(综合变量),即⎪⎪⎩⎪⎪⎨⎧+++=+++=+++=ppp p p p p p p p x a x a x a F x a x a x a F x a x a x a F 22112222121212121111 简写为:p jp j j j x x x F ααα+++= 2211p j ,,2,1 =要求模型满足以下条件:①j i F F ,互不相关(j i ≠,p j i ,,2,1, =)②1F 的方差大于2F 的方差大于3F 的方差,依次类推③.,2,1122221p k a a a kp k k ==+++于是,称1F 为第一主成分,2F 为第二主成分,依此类推,有第p 个主成分。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

主成分分析在统计学中,主成分分析(principal components analysis, PCA)是一种简化数据集的技术。

它是一个线性变换。

这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。

主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。

这是通过保留低阶主成分,忽略高阶主成分做到的。

这样低阶成分往往能够保留住数据的最重要方面。

在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。

这些涉及的因素一般称为指标,在多元统计分析中也称为变量。

因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。

在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。

主成分分析正是适应这一要求产生的,是解决这类题的理想工具主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p 个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。

主成分分析的主要作用体现在五个方面,第一,主成分分析能降低所研究的数据空间的维数。

第二,可通过因子负荷的结论,弄清X变量间的某些关系。

第三,可用于多为数据的一种图形表现方法。

第四,可由主成分分析构造回归模型,即把各个主成分作为新自变量代替原来自变量做回归分析。

第五,用主成分分析筛选回归变量。

案例分析:下表是关于全国31个省市的8项经济指标,以此为例,进行主成分分析。

省份国内生产居民消费固定资产职工工资货物周转消费价格商品零售工业产值北京1394.892505519.018144373.9117.3112.6843.43天津920.112720345.466501342.8115.2110.6582.51河北2849.521258704.8748392033.3115.2115.81234.85山西1092.481250290.94721717.3116.9115.6697.25内蒙832.881387250.234134781.7117.5116.8419.39辽宁2793.372397387.9949111371.7116.11141840.55吉林1129.21872320.454430497.4115.2114.2762.47黑龙江2014.532334435.734145824.8116.1114.31240.37上海2462.575343996.489279207.4118.71131642.95江苏5155.2519261434.9559431025.5115.8114.32026.64浙江3524.7922491006.396619754.4116.6113.5916.59安徽2003.5812544744609908.3114.8112.7824.14福建2160.522320553.975857609.3115.2114.4433.67江西1205.111182282.844211411.7116.9115.9571.84山东5002.3415271229.5551451196.6117.6114.22207.69河南3002.741034670.3543441574.4116.5114.91367.92湖北2391.421527571.684685849120116.61220.72湖南2195.71408422.6147971011.8119115.5843.83广东5381.7226991639.838250656.5114111.61396.35广西1606.151314382.595105556118.4116.4554.97海南364.171814198.355340232.1113.5111.364.33四川35341261822.544645902.3118.51171431.81贵州630.07942150.844475301.1121.4117.2324.72云南1206.6812613345149310.4121.3118.1716.65西藏55.98111017.877382 4.2117.3114.9 5.57陕西1000.031208300.274396500.9119117600.98甘肃553.351007114.815493507119.8116.5468.79青海165.31144547.76575361.6118116.3105.8宁夏169.75135561.985079121.8117.1115.3114.4新疆834.571469376.965348339119.7116.7428.76将数据输入SPSS软件,选择“分析”—“降维”—“因子分析”,在出现的对话框中进行以下步骤:第一步,将八个经济指标都转入到变量中去第二步:进行各选项的设置,如图第三步:按“确定”键,分析结果如下:GET DATA /TYPE=XLSX/FILE='C:\Users\11\Desktop\数据.xlsx'/SHEET=name 'Sheet1'/CELLRANGE=full/READNAMES=on/ASSUMEDSTRWIDTH=32767.DATASET NAME 数据集3 WINDOW=FRONT.FACTOR/VARIABLES 国内生产居民消费固定资产职工工资货物周转消费价格商品零售工业产值/MISSING LISTWISE/ANALYSIS 国内生产居民消费固定资产职工工资货物周转消费价格商品零售工业产值/PRINT UNIVARIATE INITIAL CORRELATION DET EXTRACTION/CRITERIA MINEIGEN(1) ITERATE(25)/EXTRACTION PC/ROTATION NOROTATE/METHOD=CORRELATION.因子分析附注创建的输出11-二月-2012 16时31分44秒注释输入活动的数据集数据集3过滤器<none>权重<none>拆分文件<none>工作数据文件中的N 行30 缺失值处理对缺失的定义MISSING=EXCLUDE:用户定义的缺失值作为缺失对待。

使用的案例LISTWISE:统计量基于对所使用任何变量都不含缺失值的案例。

语法FACTOR/VARIABLES 国内生产居民消费固定资产职工工资货物周转消费价格商品零售工业产值/MISSING LISTWISE/ANALYSIS 国内生产居民消费固定资产职工工资货物周转消费价格商品零售工业产值/PRINT UNIVARIATE INITIALCORRELATION DET EXTRACTION/CRITERIA MINEIGEN(1) ITERATE(25)/EXTRACTION PC/ROTATION NOROTATE/METHOD=CORRELATION.资源处理器时间00:00:00.078 已用时间00:00:01.410所需的最大内存9080 (8.867K) 字节[数据集3]描述统计量均值标准差分析N 国内生产1921.092667 1.4748060E3 30 居民消费1745.93 861.642 30 固定资产511.508667 402.8853614 30 职工工资5457.63 1310.218 30 货物周转666.140000 459.9669850 30 消费价格117.287 2.0253 30 商品零售114.907 1.8981 30 工业产值862.998000 584.5872585 30相关矩阵a商品零售工业产值相关国内生产-.264 .874居民消费-.593 .363固定资产-.359 .792职工工资-.539 .104货物周转.022 .659消费价格.763 -.125商品零售 1.000 -.192工业产值-.192 1.000a. 行列式= .000公因子方差初始提取国内生产 1.000 .945居民消费 1.000 .800固定资产 1.000 .902职工工资 1.000 .875货物周转 1.000 .857消费价格 1.000 .957商品零售 1.000 .929工业产值 1.000 .903提取方法:主成份分析。

从“解释的总方差”一表中可以得出相关系数矩阵的特征值为λ1=3.755,λ2=2.197,λ3=1.215,λ4=0.402,5=0.213,λ6=0.318,λ7=0.065,λ8=0.015前三个成分的特征值都大于1,并且累计贡献值达到了89.584%,所以选取了前三个因素作为主成分。

将“成分矩阵”表中没一列值分别除以特征值的开方,就得出了每一个特征值对应的特征向量,由此可以得出第一,第二,第三主成分表达式(令各因素为X1,X2……X8)F1=0.4567*X1+0.4095*X2+0.8274*X3+0.735*X4+1.053*X5-1.37*X6-2.4318 *X7+6.72*X8F2=0.1982*X2-0.4034*X2+0.1501*X3-1.1387*X4+2.0468*X5+0.6784*X6+2. 33*X7+3.4864*X8F3=0.0624*X1+0.1828*X2+0.1923*X3+0.5804*X4-0.5959*X5+2.1455*X6+1. 718*X7+1.7228*X8根据三个主成分表达式,通过SPSS的转换功能,就可以得出成分结果:省份F1F2F3北京13705.16-5881.957046.91天津10446.78-5197.365630.69河北15956.233467.834713.74山西9721-1372.144315.87内蒙7390.3-1650.263462.48辽宁19564.533621.656335.88吉林10015.51-1507.114506黑龙江14049.71160.945132.78上海21778.77-5587.419863.21江苏22960.753202.467724.23浙江14746.51-2511.376240.97安徽11271.67-213.014438.96福建9819.83-3990.124892.59江西8197.8-1804.893979.48山东23365.655193.377352.74河南15953.513670.484892.37湖北14283.24955.725312.38湖南11746.87-168.984564.4广东20630.81-2620.938383.58广西9209.94-2542.964455.72海南5248.71-5674.83899.05四川16350.022217.645689.45贵州6135.28-3224.343679.63云南9817.7-2591.244871.34西藏5522.4-8464.574950.51陕西8549.38-1775.924085.61甘肃8034.14-3509.364391.51青海5266.56-6247.954221.22宁夏4872.95-5290.883791.89新疆8015.83-3918.564491.04综合上述可知,各省份的8个经济指标中国内资产,居民消费,固定工资可以作为衡量经济的主要成分。

相关文档
最新文档