第8讲.SPSS的多元统计分析:因子分析、聚类分析、判别分析
多元统计分析中的因子分析和聚类分析

在多元统计分析中,因子分析和聚类分析是两种常用的数据分析方法。
它们可以帮助我们理解数据中的潜在结构和相似性,从而揭示数据背后的规律和关系。
首先,让我们来了解一下因子分析。
因子分析是一种主成分分析方法,用于研究多个变量之间的相关性。
通过对原始数据进行因子提取,可以将一组相关的变量转换为少数几个无关的维度,这些维度被称为因子。
因子分析的核心思想是将一组相关的变量解释为共同的因素或维度,从而减少数据的复杂性。
因子分析可以帮助我们理解变量之间的内在结构,并找到隐藏在数据背后的影响因素。
聚类分析是一种无监督学习方法,用于将数据集中的对象划分为不同的群组。
聚类分析的目标是找到数据中的相似性并将其归类到同一组中。
聚类分析可以帮助我们识别数据中的模式和群组,并进行数据的分类和分析。
聚类分析可以基于数据的相似性进行聚类,也可以基于数据的距离进行聚类。
通过聚类分析,我们可以发现数据中的群组结构,并推断这些群组之间的关系。
因子分析和聚类分析在多元统计分析中扮演着不同的角色。
因子分析更侧重于变量之间的相关性和潜在结构,可以帮助我们理解变量之间的共同特征和因素。
聚类分析则更侧重于数据的相似性和群组结构,可以帮助我们找到数据中的模式和群组。
由于它们的不同特点和应用场景,因子分析和聚类分析常常被结合使用,以获得更全面的数据分析结果。
在实际应用中,因子分析和聚类分析可以用于许多领域。
在社会科学中,因子分析可以用于分析调查问卷数据,找到共同的问题维度和影响因素。
聚类分析可以用于市场细分和受众分析,帮助企业发现潜在的目标市场并制定相应的营销策略。
在医学研究中,因子分析可以用于分析疾病的症状和因素,聚类分析可以用于发现疾病的亚型和患者的分类。
综上所述,因子分析和聚类分析在多元统计分析中发挥着重要作用。
它们可以帮助我们理解数据中的潜在结构和相似性,并用于数据分类、模式识别和关联分析。
因子分析和聚类分析是数据分析中常用的工具,研究人员可以根据具体问题和数据特点选择合适的方法。
第8章因子分析与聚类分析(含SPSS)

(二)因子分析的特点 1、因子变量的数量远少于原有指标变量的数 量。 2、因子变量并不是原有变量的简单取舍,而 是对原有变量的重新组构。 3、因子之间线性关系不显著。 4、因子变量具有命名解释性。
二、因子分析的数学模型和相关概念 (一)因子分析的数学模型
因子分析的数学模型为:
x1 a11f1 a12f2 a13f3 a1k fk 1
②Scree plot 复选项,要求显示按特征值大小排 列的因子序号,以特征值为两个坐标轴的碎石图。
(4)Extract 框,控制提取进程和提取结果的选择项。 ①Eigenvalues over 选项,指定提取的因子应该
具有的特征值范围,在此项后面的矩形框中给出。 ②Number of factors 选项,指定提取公因子的
行 KMO检验和球形Bartlett 检验。
5、单击“Extraction”按钮,进入Extraction对话框,如 图8-4 所示,可以选择不同的提取公因子的方法和控制提 取结果的判据。
图8-4 Extraction 对话框
(1)Method框,因子提取方法选择项 ①Principal components 选项,主成份法。 ②Unweighted least Square 选项,不加权最小 平方法。 ③Generalized least squares 选项,用变量值 的倒数加权。 ④Maximum Likelihoud 选项,最大似然法。 ⑤Principal Axis factoring 选项,使用多元相 关的平方作为对公因子方差的初始估计。 ⑥Alpha factoring 选项,因子提取法。 ⑦Image factoring 选项,映象因子提取法。
(二)因子提取和因子载荷矩阵的求解
spss使用教程聚类分析与判别分析新

3.2 SPSS中实现过程
研究问题 对一个班同学的各科成绩进行聚类,分析 哪些课程是属于一个类的。聚类的依据是4门 功课的考试成绩,数据如表2所示。
表2 姓 名 hxh yaju yu shizg
学生的四门课程的成绩 数 学 99.00 88.00 79.00 89.00 物 理 98.00 89.00 80.00 78.00 语 文 78.00 89.00 95.00 81.00 政 治 80.00 90.00 97.00 82.00
(4)Block距离 两个样本之间的Block距离是各样本所有 变量值之差绝对值的总和,计算公式为
(5)Minkowski距离 两个样本之间的Minkowski距离是各样 本所有变量值之差绝对值的p次方的总和,再 求p次方根。计算公式为
(6)Customized距离(用户自定义距离) 两个样本之间的Customized距离是各样 本所有变量值之差绝对值的p次方的总和,再 求q次方根。计算公式为
实现步骤
图9 在菜单中选择“Hierarchical Cluster”命令
图10 “Hierarchical Cluster Analysis”对话框(二)
图11 “Hierarchical Cluster Analysis:Method”对话框(二)
图12 “Hierarchical Cluster Analysis:Plots”对话框(二)
1.聚类分析与判别分析的基本概念
统计学研究这类问题的常用分类统计方法 主要有聚类分析(cluster analysis)与判 别分析(discriminant analysis)。其中聚 类分析是统计学中研究这种“物以类聚”问题 的一种有效方法,它属于统计分析的范畴。聚 类分析的实质是建立一种分类方法,它能够将 一批样本数据按照他们在性质上的亲密程度在 没有先验知识的情况下自动进行分类。这里所 说的类就是一个具有相似性的个体的集合,不 同类之间具有明显的区别。
SPSS统计分析第八章聚类分析与判别分析

SPSS统计分析第八章聚类分析与判别分析聚类分析与判别分析是SPSS统计分析中非常重要的两个方法。
聚类分析是寻找数据之间的相似性,将相似的数据划分为一个簇,从而实现对数据的归类和分组。
判别分析则是寻找数据之间的差异性,帮助我们理解不同因素对于数据的影响程度,从而实现对数据的分类预测。
首先,我们来介绍聚类分析。
聚类分析是根据数据之间的相似性进行归类的一种方法,通过度量数据之间的相似性,将相似的数据归为一类。
它在寻找数据内在组织结构和特点上具有很大的作用。
在SPSS中进行聚类分析的步骤如下:1.载入数据集:在SPSS软件中,选择"文件"->"打开"->"数据",选择需要进行聚类分析的数据集。
2.选择聚类变量:在"分析"->"分类"->"聚类"中,选择需要进行聚类分析的变量。
可以选择一个或多个变量作为聚类变量,决定了聚类的维度。
3.设置聚类参数:在设置参数的对话框中,可以选择使用不同的距离测度和聚类算法。
距离测度可以选择欧氏距离、曼哈顿距离、切比雪夫距离等,而聚类算法可以选择层次聚类、K均值聚类等。
根据具体的数据特点,选择合适的参数。
4.进行聚类分析:点击"确定"按钮,SPSS会自动进行聚类分析,并生成聚类的结果。
聚类结果可以通过树状图、散点图等形式展示,便于我们对数据的理解和分析。
接下来,我们来介绍判别分析。
判别分析是一种通过建立数学模型,根据不同的预测变量对数据进行分类和预测的方法。
判别分析可以帮助我们理解不同因素对于数据分类的重要性,从而进行有针对性的分析和预测。
在SPSS中进行判别分析的步骤如下:1.载入数据集:同样,在SPSS软件中,选择"文件"->"打开"->"数据",选择需要进行判别分析的数据集。
SPSS数据统计与分析标准教程聚类和判别分析

聚类和判别分析
在众多统计分析方法中,聚类分析和判别分析是用于解决类问题的多元统计方法。 其中,聚类分析是一项重要的人类行为,它可以将变量数据根据其自身特征,按照性质 上的亲疏程度在没有先验知识的情况下对其进行自动分类,从而产生多个分类结果,以 便研究者对变量数据进行深层次的推断分析。而判别分析则是根据已知类别的样本建立 判别公式和判别准则,并将建立的判别公式和准则应用到未知的新样本中,用以判别新 样本点所属的类别。聚类分析和判别分析是多元分析方法中最基层的分类方法,掌握这 两种统计方法对运用统计分析学具有非常重要的意义。在本章中,将以 SPSS 软件分析 方法为基础,详细介绍聚类和判别分析的基本原理和分析方法。 本章学习目标: 二阶聚类分析 K-均值聚类分析 层次聚类分析 普通判别分析 逐步判别分析 决策树分析
r q p Dij xik x jk k 1
1
260 260
SPSS 数据统计与分析标准教程
2.聚类分析中的相似性系数 聚类分析中的相似性系数一般用来测验变量之间的相似性,其取值范围介于-1~1 之 间。在实际分析中,变量之间相似性系数的大小,不仅取决于相似性关系绝对值的大小, 而且还取决于相关性方向。 距离分析中的相似性系数可分为积差相关性系数和夹角余弦等。 积差相关性系数为最常用的系数公式,要求测量数据为连续变化或近似于连续变化 的数据,其表现公式为:
11.1 聚类和判别分析概述
虽然使用 SPSS 软件可以轻松达到对数据进行聚类和判别分析的目的,但是为了可 以充分地理解和掌握聚类和判别分析的内涵,在使用 SPSS 软件对数据进行聚类和判别 分析之前,还需要先了解一下聚类分析和判别分析的基础理论。
11.1.1
使用SPSS软件进行因子分析和聚类分析的方法

使用SPSS软件进行因子分析和聚类分析的方法使用SPSS软件进行因子分析和聚类分析的方法随着统计分析软件的发展,SPSS(Statistical Package for the Social Sciences)软件作为一款功能强大、易于使用的统计分析工具受到广泛欢迎。
它能帮助研究人员进行各种统计分析,其中包括因子分析和聚类分析。
本文将介绍如何使用SPSS软件进行因子分析和聚类分析,并针对每个分析方法提供详细步骤和操作示例。
一、因子分析因子分析是一种常用的统计方法,在数据维度缩减和相关变量结构分析方面具有广泛的应用。
以下是使用SPSS软件进行因子分析的步骤:1. 数据准备首先,需要将原始数据导入SPSS软件中。
可以通过选择“文件”>“打开”>“数据”,然后选择合适的数据文件进行导入。
确保数据是以矩阵的形式存储,每个变量占据一列,每个观察单位占据一行。
2. 因子分析设置在SPSS软件中,选择“分析”>“数据准备”>“特殊分析”>“因子”。
在弹出的对话框中,选择需要进行因子分析的变量,将它们移动到“因子”框中。
然后,选择所需的因子提取方法(如主成分分析或因子分析),并指定所需的因子个数。
可以选择默认值,也可以根据实际需求进行调整。
3. 统计输出完成因子分析设置后,点击“确定”按钮开始分析。
SPSS软件将生成一个因子分析结果报告。
报告中将包含因子载荷矩阵、特征值、解释的方差比例等统计指标。
通过这些指标,可以对变量和因子之间的关系、每个因子的解释能力进行分析。
4. 结果解读对于因子载荷矩阵,可以根据因子载荷的大小来判断变量与因子之间的关系。
一般来说,载荷绝对值大于0.3的变量与因子之间具有显著关联。
解释的方差比例表示每个因子能够解释变量总方差的比例,一般来说,越大越好。
在解读结果时,需要综合考虑因子载荷和解释的方差比例。
二、聚类分析聚类分析是一种用于数据分类的统计方法。
它根据观测值之间的相似性将数据对象分组到不同的类别中。
多元统计分析数据处理中常见的方法与原理

多元统计分析数据处理中常见的方法与原理多元统计分析是一种从多个变量间关系来进行数据分析的方法。
它可以帮助我们发现变量间的关联,并揭示隐藏在数据背后的模式和规律。
在实际应用中,我们常常需要采用一些常见的方法来处理多元统计分析数据。
本文将介绍几种常见的方法及其原理,包括因子分析、聚类分析、判别分析和回归分析。
一、因子分析因子分析是一种用于降低变量维度的方法。
它基于一个假设,即多个观测变量可以由少数几个因子来解释。
因子分析的目标是找出这些因子,并确定它们与观测变量之间的关系。
因子分析的原理是通过对变量之间的协方差矩阵进行特征分解来获得因子载荷矩阵。
在这个矩阵中,每个变量与每个因子之间都有一个因子载荷系数。
这些系数表示了变量与因子之间的相关程度,值越大表示相关性越高。
通过分析因子载荷矩阵,我们可以确定哪些变量与哪些因子相关性最强,从而得出变量的潜在因子。
二、聚类分析聚类分析是一种用于将观测对象或变量进行分类的方法。
它基于一个假设,即属于同一类别的对象或变量在某些方面上相似,而不同类别之间的对象或变量则在某些方面上不同。
聚类分析可以帮助我们发现数据集中的群组,并研究不同群组之间的差异。
聚类分析的原理是通过测量对象或变量之间的相异性来确定分类。
最常用的相异性度量是欧氏距离和相关系数。
通过计算每个对象或变量之间的相异性,并基于相异性矩阵进行聚类,我们可以将数据划分为不同的类别。
三、判别分析判别分析是一种用于预测或解释分类变量的方法。
它基于一个假设,即存在一些预测变量对于解释或预测分类变量的发生概率有重要影响。
判别分析可以帮助我们确定哪些预测变量对于分类变量的发生概率有重要影响,并建立分类模型。
判别分析的原理是通过计算不同分类组之间的差异来确定预测变量的重要性。
最常用的差异度量是F统计量和卡方统计量。
通过计算这些统计量,并建立判别方程,我们可以将预测变量与分类变量之间的关系进行建模。
进而,我们可以使用该模型来对新的预测变量进行分类。
如何使用SPSS进行多元统计分析

如何使用SPSS进行多元统计分析第一章:SPSS简介SPSS(Statistical Package for the Social Sciences)是一种功能强大且广泛使用的统计分析软件。
它能够处理大量数据,进行各种统计分析和数据挖掘,是研究人员和数据分析师常用的工具。
第二章:设置数据在进行多元统计分析之前,首先需要设置数据。
SPSS支持导入外部数据文件,如Excel、CSV等格式。
用户可以在SPSS中创建新的数据集并录入数据,也可以导入已有数据集。
在设置数据时,需要注意数据的变量类型、缺失值处理以及数据的清洗与转换。
第三章:描述统计分析描述统计分析是理解数据的第一步。
SPSS提供了丰富的描述统计方法,包括平均数、标准差、最小值、最大值、频数分布等。
用户可以通过简单的命令或者界面操作来生成各种描述统计结果,并进一步进行数据的可视化展示。
第四章:相关性分析相关性分析是多元统计分析的常用方法之一。
SPSS提供了丰富的相关性分析工具,如Pearson相关系数、Spearman等。
用户可以通过相关分析来检测不同变量之间的关系,并进一步探索变量之间的线性或非线性关系。
第五章:线性回归分析线性回归分析是一种预测性分析方法,在多元统计分析中应用广泛。
SPSS可以进行简单线性回归分析和多元线性回归分析。
用户可以通过线性回归分析来建立模型,预测因变量与自变量之间的关系,并进行参数估计和显著性检验。
第六章:因子分析因子分析是一种常用的降维技术,用于发现隐藏在数据中的潜在变量。
SPSS提供了主成分分析、最大似然因子分析等方法。
用户可以通过因子分析来降低变量的维度,提取数据中的主要信息。
第七章:聚类分析聚类分析是一种用于将数据样本划分成相似组的方法。
SPSS支持多种聚类算法,如K均值聚类、层次聚类等。
用户可以通过聚类分析来识别数据中的固有模式和群体。
第八章:判别分析判别分析是一种用于将样本分类的方法,常用于研究预测变量对分类变量的影响。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
确定因子
因子旋转 求各因子得分 综合得分
因子分析
整体分析与设计的内容
三、操作
数据文件:“居民消费结构的变化.sav” 菜单:“分析→降维→因子分析”
选择符合条件的样本进行分析
因子分析
整体分析与设计的内容
三、操作
1.“描述”统计量
输出参与分析的各原始变量的 均值、标准差等。 初始分析结果,系统默认选项。输出 各个分析变量的初始共同度、特征值 以及解释方差的百分比等。
4.“选项” 按钮
选中该复选框后,即可输入 0~1 之间的数 值作为临界值。所有绝对值小于指定值的 载荷系数将不再显示。(系统默认为 0.10 )
因子分析
整体分析与设计的内容
四、输出分析
1.因子分析共同度
表示因子分析初始解下的变量共同度,它表明对原有8个 变量,如果采用主成份分析法提取 8 个特征根,那么原有 变量的所有方差都可被解释,变量的共同度均为 1(原变 量标准化后的方差为1)。
该方法假设变量是因子的纯线性 组合。第一主成份有最大的方差, 后续成分可解释的方差逐个递减。
输出未经旋转的因 子提取结果。 该图显示了按特征值大小排列的 因子序号,有助于确定保留多少 个因子。典型的碎石图会有一个 明显的拐点,在该拐点之前是与 大因子连接的陡峭的折线,之后 是与小因子相连的缓坡折线。 提取特征值大于指定数值的因子。 系统默认特征值为1.
第八章 SPSS的多元统计分析
本章主要内容:
因子分析
在工业、农业以及经济、管理等诸多领域中, 常常需要同时观测多个指标。例如,衡量一 个地区的经济发展,需观测的指标有:总产 值、利润、效益、劳动生产率、固定资产、 物价、信贷等。因此,受多种指标作用和影 响的现象是大量存在的。由于每个指标值是 不能预先确定的,那么该如何根据这些观测 数据进行有效的分析研究呢? ----------------多元统计分析,就是进行多个随机变量观测 数据分析的一种有效方法,它通过研究变量 之间的相互关系来揭示这些变量内在的变化 规律。在当前科技和经济迅速发展的今天, 国民经济许多领域只停留在定性分析上往往 是不够的。 为提高科学性、可靠性,通常需要定性与定 量分析相结合。而多元分析正是定量分析的 有效手段和方法。
设原有 p 个变量,且每个变量(或经标 准化处理后的变量)的均值为 0 ,标准 差为1.现将每个原有变量用k(k<p)因 子f1,f2,…,fk的线性组合来表示,即可得 此数学模型。 特殊因子,表示原变量不能被 因子解释的部分,均值为0
因子分析的基本思想是通过对变量的相关系数矩阵内 部结构的分析,从中找出少数几个能控制原始变量的 整体分析与设计的内容 随机变量 fi(选取的原则是使其尽可能多的包含原始 变量中的信息),并建立起数学模型。之后,忽略特 殊因子,用F代替X,并使其能再现原始变量X的信息, 从而达到简化变量、降低维数的目的。
聚类分析
判别分析
因子分析
整体分析与设计的内容
Hale Waihona Puke 一、案例背景 居民消费结构变化
“消费结构”是指消费过程中,各项消费支出占居民总支出的比重, 它是反映居民生活消费水平、生活质量变化状况以及内在过程合理化 程度的重要标志。
消费结构的变动不仅是消费领域的重要问题,而且也关系到国民经济的 发展。因为合理的消费结构及消费结构的升级和优化不仅反映了消费的 层次和质量的提高,而且也为建立合理的产业结构和产品结构提供了重 要的依据。 首先看一下本节课给出的相关数据: 本数据文件是某市民在食品、衣着、医疗保健等几个方面的消费数据。 这些指标之间存在着不同强弱的相关性。 如果单独分析这些指标,那么就很难全面的分析和了解居民消费结构的 特点。因此,我们可以考虑采用“因子分析”的方法,将这几个指标综 合为少数几个因子,通过这几个因子来考察居民消费结构的变动情况。
因子分析
二、方法原理
1.因子分析的数学模型 针对变量作因子分析,称为R型因子分析; 对样本个案做因子分析,称为Q型因子分析。 这两种方法有许多相似之处。其中,R型因子分析的数学模型如下:
x1 a11 f1 a12 f 2 ... a1k f k 1 x a f a f ... a f 2 21 1 22 2 2k k 2 ... x p a p1 f1 a p 2 f 2 ... a pk f k p
指明要提取的因子 数量。
因子分析
整体分析与设计的内容
三、操作
3.“旋转”按钮:因子 选择方法。
这是一种正交旋转法,使得 每个因子具有最高载荷的变 量数最小,可以简化对因子 的解释。 该方法中,每个变量中 需要解释的因子数最少。
直接斜交旋转法。点击该选 项后,需要输入 Delta 系数, 取值范围0~1.
因子分析
整体分析与设计的内容
四、输出分析
4.旋转前的因子载荷矩阵
这是因子分析的核心内容。通 过载荷系数大小可以分析不同 公共因子所反映的主要指标的 区别。从结果看,大部分因子 解释性较好。 采用因子旋转方法,能够使得 因子载荷系数向0或1两极分化, 使得大的载荷更大,小的载荷 更小,从而得到更具可解释性 的结果。
“方法”部分如果选择 “无”,则不能选该复选框。
因子分析
整体分析与设计的内容
三、操作
3.“得分”按钮:计算因子得分的方法。
将因子得分作为新变量保存 在数据文件中
巴特利法:其因子得分均值 为0. 是巴特利法的调整,可以保 证因子的正交性,其因子得 分均值为 0 ,标准差为 1 ,且 彼此不相关。 其因子得分的均值为 0 ;方差 等于估计因子得分与实际因子 得分之间的多元相关的平方, 即使公因子正交时此得分也可 能是相关的。
① 确认待分析的原变量是否适合作因子分析 因子分析的主要任务是将原有变量的信息重叠部分提取,综合成因子, 进而最终实现减少变量个数的目的,故它要求原始变量之间应存在较 强的相关关系。进行因子分析前,通常可以采取计算相关系数矩阵、 巴特利特球度检验和KMO检验等方法来检验候选数据是否适合采用因 子分析。
相关系数 矩阵的特 征值
方差贡献率。每个变量 后的数值表示其对原有 8 个变量总方差的解释 程度。 例如,第一个变量,即 可解释53.947%总方差
累积贡献率。前3个变量的累计贡 献率已经达到了94.196% 。 而且,也只有这三个变量的特征 根取值大于1.说明前3 个因子基本 包含了全部变量的主要信息,选 前3个因子为主因子即可。
因子分析
整体分析与设计的内容
四、输出分析
3.因子碎石图
横坐标为因子序号,纵坐 标为特征根。从图中可知, 第一个因子特征值最高, 对解释原有变量贡献最大; 第三个以后的因子特征根 都较小,取值都小于1,说 明它们对解释原有变量的 贡献很小,称为可以忽略 的“高山脚下的碎石”, 因此,提取前三个因子是 合适的。
因子分析
整体分析与设计的内容
三、操作
2.“抽取”对话框 (提取公因子)
适用于各变量度量 单位不同的情况 适用于各变量方差 不等的情况 用于输出与提取结 果有关的选择项。 理论上,因子数目 与原始变量数目相 等,但因子分析的 目的是用少量的因 子,替代多个原始 变量,因此需要这 个选项组来决定抽 取多少个因子。
其矩阵形式:
可实测的随机向量
X=AF+
因 子 载 荷 矩 阵 , 其 中 每 个 元 素 aij(i=1,2,…,p; j=1,2,…,k)称为因子载荷。
因子,由于它们出现在每个原有变量的线 性表达式中,又被称为公共因子。
因子分析
整体分析与设计的内容
二、方法原理
2.因子分析的基本操作步骤 一个完整的因子分析过程,主要包括如下几个步骤:
输出原始分析变量间 的相关系数矩阵。 相关系数的逆矩阵
因子分析后的相关矩 阵以及残差矩阵
前者用于检验变量间的偏相关是否 很小;后者用于检验相关系数矩阵 是否为单位矩阵,如果是,则表明 不合适采用因子模型。
反映像相关矩阵包括偏相关系数 的负数;反映像协方差矩阵包括 偏协方差的负数;一个好的因子 模型,对角线上的元素应较大, 非对角线元素则较小。
标准化原始数据 求标准数据的相关矩阵 求相关矩阵的特征值和特征向量 方差贡献率与累积方差贡献率
消除变量间在数量级和量纲上的不同。
设F1、F2,…,Fp为p个因子,其中前m个因子 包含的数据信息总量(即其累计贡献率)不 低于85%时,可取前m个因子来反映原评价指 标。 若所得的 m 个因子无法确定或其实际意义不是 很明显,这时需将因子进行旋转,以获得较为 明显的实际含义。 用原指标的线性组合来求。 通常以各因子的方差贡献率为权,由各因子的 线性组合得到综合评价指标函数。
因子分析
整体分析与设计的内容
四、输出分析
5.旋转后的因子载荷矩阵(待续)
从表中可知:第一主因子在 “交通和通信”、“医疗保健” 等 5 个指标上具有较大的载荷 系数; 第二主因子在“居住”和“衣 着”指标上系数较大。 第三主因子在“杂项商品与服 务”上的系数最大。 此时,各个因子的含义更加突 出。 第一主因子,是享受性消费因子,从系数的正负值可知:有的消费在递增,有的则递减。 第二主因子,是发展性消费因子,也包含了递增和递减的消费项目。 第三主因子,是其他类型的消费因子。
因子分析
整体分析与设计的内容
二、方法原理
在研究实际问题的时候,往往希望尽可能的收集相关变量,以期对问 题有较全面、完整的把握和认识。例如,企业综合评价研究中,可能会 收集诸如盈利能力、负债能力、运营能力等方面的经济指标数据。 这些数据在带来有关信息的同时,也给数据的分析带来了一定的困难: 这众多的变量之间可能存在着或多或少的相关性,实际观测到的数据包 含的信息有一部分可能是重复的。 为了解决这些问题,最简单和最直接的办法就是减少变量数目。但这 又将导致另一个问题,即信息丢失或不完整的问题。 因此,研究人员希望能够找到一种有效的方法,既能减少参与数据分 析的变量个数,同时又不会造成统计信息的大量浪费和丢失。 ----“因子分析”就这样应运而生了。 因子分析就是在尽可能不损失信息或少损失信息的情况下,将多个变量 减少为少数几个因子的方法,这几个因子可以高度概括大量数据中的信 息。这样,既减少了变量个数,又同样能再现变量之间的内在联系。