第11章因子分析和对应分析

合集下载

因子分析与对应分析

因子分析与对应分析
1 .9 .4
.0 .S 4
.0 .0 .4
专等 总 . 00o总 . 01 中
. 17 总
1. 63 专
. 82 中 . 4 ig总
. 8中
30 总 . 07 专
. 07 中
校人 .9 10r .1 00 .0 52 .5 99
1 .1 62 .0 8 . .3 8
返回
因子分析简单实例输出1
i
a
n
c
e
E
m
E
ig
s
e
n
o
v
f
a
lu
%
m
C
u% uo m
la f
t
uo
iv
la f
e
Co r
Vo t ia T %am a n o r l c t iap % e a no
l cn
5 7.1 463 7 . 8 66 . 47 6
4 63
66
6
9 5.2 337 3 . 7 93 . 99 9
xx32
21 31
f1 f1
22 32
f2 f2
2k 3k
fk fk
e2 e3

xm m1 f1 m2 f2 mk fk em
其中 x1 ~ xm 是对原始变量进行均值为0,标准差为1标准化后的变量。
特性方差V(e)
前k个因子,共性方差为:
k
Vc(xi)
2 ij
j 1
m
Vc(xi)
2 ij
j 1
返回
因子分析菜单
返回标的调查数据进行因子分析为例,本数据是美 国洛杉矶标准大城市统计区中的12个人口调查区的五个经济学变量的数据。

因子分析方法ppt课件

因子分析方法ppt课件

10
因子分析数学模型中几个相关概念
举例说明:
11
12
因子分析的五大基本步骤
第一步:因子分析的前提条件
由于因子分析的主要任务之一是对原有变量进行浓缩,即将 原有变量中的信息重叠部分提取和综合成因子,进而最终实 现减少变量个数的目的。因此它要求原有变量之间应存在较 强的相关关系。否则,如果原有变量相互独立,相关程度很 低,不存在信息重叠,它们不可能有共同因子,那么也就无 法将其综合和浓缩,也就无需进行因子分析。本步骤正是希 望通过各种方法分析原有变量是否存在相关关系,是否适合 进行因子分析。
2
因子分析的基本模型
因子分析模型中,假定每个原始变量由两部分组成: 共同因子和唯一因子。 共同因子是各个原始变量所共有的因子,解释变 量之间的相关关系。
唯一因子顾名思义是每个原始变量所特有的因子, 表示该变量不能被共同因子解释的部分。原始变量 与因子分析时抽出的共同因子的相关关系用因子负 荷表示。
18
第四步:决定因素与命名
• 转轴后,要决定因素数目,选取较少因素 层面,获得较大的解释量。在因素命名与 结果解释上,必要时可将因素计算后之分 数存储,作为其它程序分析之输入变量。
19
第五步:计算各样本的因子得分
• 因子分析的最终目标是减少变量个数,以 便在进一步的分析中用较少的因子代替原 有变量参与数据建模。本步骤正是通过各 种方法计算各样本在各因子上的得分,为 进一步的分析奠定基础。
因子分析方法
1
因子分析的基本概念
因子分析的概念 就是在尽可能不损失信息或少损失信息的情况下,将多个变量减少为 少数几个潜在的因子。也就是用少数几个因子来描述许多指标或因素之 间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方 法 主成分分析(Principal component analysis): 是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标 变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相 关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少 变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信 息。 两者关系:主成分分析(PCA)和因子分析(FA)是两种把变量维数降 低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子 分析的一个特例

11效度分析与因子分析PPT课件

11效度分析与因子分析PPT课件
最为重要——用KMO值来表示,该值越高, 表明越适宜使用因子分析。通常小于0.5时, 较不适宜进行因子分析。
SPSS操作步骤:P129
.
3
信度与效度的关系
P132 信度和效度是研究活动和结果具有科学价值和意义的保证。 信度:数据可信、一致、稳定
研究结果所显示的一致性、稳定程度,无论其过程是由谁操 作、或进行多少次同样的操作,其结果总是非常一致的。
随机误差影响信度。 效度:数据有效、有用
度量的精确度与事物的实际值相比,是对精确度的评价。 对研究结果正确性的评价标准。
系统误差影响效度,即测量了与研究目的无关的变量所引起 的误差。
.
4
信度与效度的关系
效度+ 信度+
效度-
信度↑
效度↑ 效度↓
.
5
因子分析
P255 应用最为广泛的多元分析方法 将相关比较紧密的几个变量归在一类 每类为一个因子 每类因子必须是可以被命名的 可以通过碎石图来直观地观察出因子个数 在归类过程中可以剔除归类不好的变量后,
KMO and Bartlet t's Test
Kaiser-Meyer-Olkin Measure of Sampling
Adequacy.
.601
Bartlett's Test of Approx. Chi-Squa2re46.962
Sphericity
df
91
Sig.
.000
.
14
因子分析—— 输出——共同性
相关系数矩阵
显示
非旋转因子解
碎石图
特征值
.
10
因子分析——转轴
方差最大正交旋转法
旋转解

因子分析与对应分析

因子分析与对应分析

【Analyze】/【Data Reduction】/【Factor】 要求:选入分析变量
(因子分析得变量)
(定义记录旋转条件)
Descriptives:选择需要输出得统计量
要求:输出相关系数矩阵;进行因子分析适用条件得检验
所有变量间得相关系数矩阵 显著性水平
相关系数矩阵得行列式值 KMO 检验和Bartlett球形检验
(统计量)
单变量描述统计量:各分析变量得均值、标准差及观测数 原始分析结果:原变量得公因子方差、与变量相同个数得因子、 各因子得特征根及其所占总方差得百分比和累计百分比
(相关矩阵)
相关系数矩阵得逆矩阵 再生相关系数矩阵
反映像协方差阵和相关阵
Extraction:选择因子提取得方法
要求:输出碎石图
(选择公共因子得提取方法)
相关矩阵 协方差矩阵
(设定公共因子提取标准)
显示未经旋转变换得因子提取结果 显示碎石图,体现各因子重要程度
以特征根大于指定数值为提取标准
自定义提取因子得数量
(收敛时得最大迭代次数)
公共因子的提取方法: (1)主成分分析法(默认); (2)不加权最小二乘法; (3)广义最小二乘法; (4)极大似然法; (5)主轴因子法; (6) 因子法; (7)影像因子法
因子分析与对应分析
第一节 因子分析——【Factor】过程
主成分分析得推广和发展,对观测量数目要求至少就是变量得5倍以上, 且越多越好
一、因子分析简介
• 做什么? 因子分析就是多元统计分析中处理降维得一种统计方法,她主要将 具有错综复杂关系得变量或者样品综合为数量较少得几个因子,以 再现原始变量与因子之间得相互关系。
拒绝原假设,认为各 变量之间不独立

因子分析及对应分析

因子分析及对应分析

2012-12-13 2012-12-13
5 5
在满足以上假定的条件下,就有:
cov( X i , X j ) E (ai F gi )(a j F g j ) ai a j var F ai a j
于是,有
cov( X i , X j ) cov( X i , X k )

aj ak
2012-12-13 2012-12-13
6 6
因为 a i 是一个常数,与 gi 相互独立且 F 与 X i 的方差均被假定为1。 F 于是有 1 ai2 var( gi )
因此,常数a i 的意义就在于其平方表示了公共因子F 解释X i 的方 2 差的比例,因此被称之为因子载荷,而 a i 被称作共同度。 对Spearman的例子进行推广,假定每一门科目的考试成绩都受 到 m个公共因子的影响及一个特殊因子的影响,于是上式就变 成了如下因子分析模型的一般形式:
x* a 1 1 f 1 a 1 2 f 2 a 1 p f p c 1 g 1 1 * x 2 a 2 1 f 1 a 2 2 f 2 a 2 p f p c 2 g2 x* a f a f a f c g , m1 1 m2 2 m p p m m m where E ( f j ) 0 , D( f j ) 1, E ( g i ) 0 , D( g i ) 1
X i ai 1 F1 ai 2 F2 aim Fm gi
2012-12-13 2012-12-13
7 7
X 式中, i为标准化后的第 i 门科目的考试成绩,均值为0,方差为 1。F1 , F2 , , Fm 是彼此独立的公共因子,都满足均值为0,方差 为1。gi为特殊因子,与每一个公共因子均不相关且均值为0。 则ai 1 , ai 2 , , aim 为对第 i 门科目考试成绩的因子载荷。对该模型, 有: 2 2 2

市场调查方法与技术 第5版 第十一章 定量调查资料的分析

市场调查方法与技术 第5版 第十一章 定量调查资料的分析
结合市场分析场景或案例分别介绍常见的描述分析方法、变量间相关分析方法(相关分析、列 联分析、对应分析等)、有监督统计分析方法(回归分析、方差分析、判别分析等)、以及无 监督统计分析方法(聚类和因子分析)。
表11-1数据类型及其适用的分析方法
4
01
单变量的 描述统计分析
描述统计分析
描述统计是市场调查分析中最常用的分析方法,关键是如何选择适当的图表或统计量使数据更易于解释。不同的 描述统计分析方法适用于不同的研究目的,适合不同的测量尺度数据。 下面我们以表11-2中的数据为例,介绍常用的描述统计方法
• 四分位差较小说明数据比较集中于中位数附近;反之 分布较分散。
• 四分位差常与中位数一起描述定距或定序变量分布。 缺点是四分位差没有充分利用所有数据信息。
10
数据的特征描述③ 离散趋势分析b
反映各数值远离其中心的程度,即数据分布的分散程度。数据的离散程度越大,则集中趋势测度值对该组数据的代 表性越差;离散程度越小,则其代表性就越好。
变异系数
全距
• 也称为离散系数,即标准差与均值的比值,主要用于 不同类别数据离散程度的比较,记为CV。公式如下:
• 也称极差,是一组数据中最大值与最小值之差, 计算公式是
• 标准差大小不仅与数据测度单位有关,也与观测值 的均值大小有关,不能直接用标准差比较离散程度, 而变异系数消除了测度单位和观测值水平不同的影 响,因而可以直接用来比较数据的离散程度。
图 11-1 显示公司员 工的年薪多在3.5万 元左右,但也有少数 员工的年薪达到10万 元以上,分布呈现一 定的右偏。
7
数据的特征描述①
• 频数分析和直方图可以清晰展示数据的取值分布情况,但有时这些信息过于详细,我们可能希望用一些统 计量对其信息进行概括性描述,例如用众数、中位数、均值描述数据的集中位置,用异众比例、四分位差、 标准差描述数据分布的变异性,同偏度与峰度描述分布的形态。

第11章 因子分析和对应分析

第11章  因子分析和对应分析

精通SPSS统计分析
2. 对应分析中的考虑事项
在对应分析中应考虑以下两种事项: (1)数据:用于分析的分类变量是名义变量。对合计数据或对除频数以 外的相应测度,使用有正相似值加权的变量。 (2)有关程序:如果被包括的变量超过两个,使用同质性分析。
精通SPSS统计分析
11.2 对应分析
对应分析也称相应分析,它是在 型和 型因子分析的基础上发展起来的一 种多元统计方法。 因子分析根据研究对象的不同而分为研究指标的 型因子分析和研究样品的 Q型因子分析,使用因子分析方法时这两个过程只能分开进行。
1. 对应分析与因子分析的联系与区别
对应分析和因子分析一样,都是描述变量间关系的一种实用的多元统计分 析技术。 因子分析要求等间隔数据,而且观测量数目必须是变量数的5倍,它只能 分别对指标或样品进行分类。对应分析不但可以很好地描述各个变量种类间的 关系,还可以秒素这些变量之间的关系。另外,对应分析可以用来对人物正对 应测度表格进行分析。
精通SPSS统计分析
第11章 因子分析和对应分析
本章重点:
因子分析
对应分析
精通SPSS统计分析
1ห้องสมุดไป่ตู้.1 因子分析
因子分析是多元统计分析中的一个重要分支,其主要目的是运用对诸多变 量的相关性进行研究,可以用假设的少数几个变量来表示原来变量的主要信息, 以便浓缩数据。 因子分析具有以下几个特点: (1)因子变量的数量远少于原有的指标变量的数量,对因子变量的分析 能减少分析中的计算工作量。 (2)因子变量不是对原有变量的取舍,而是根据原始变量的信息进行重 新组构,它能反映原有变量大部分的信息。 (3)因子变量之间不存在线性相关关系,对变量的分析比较方便。 (4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合 反映。

因子分析ppt课件

因子分析ppt课件

xi ai1 f1 ai2 f2 ... ui
特殊因子(unique factor)观测变量所
特有的因子,表示
公因子(common因fa子ct负or载s)(是factor load该in变gs量):不表能示被i公个因 观测变量所共有的变因量子在,第解j个释公因子上子的所负解载释,的是部因分子。
因子抽取方法的选择一般考虑因子分 析的目的和对变量方差的了解程度:
如果因子分析的目的是用最少的因子 最大程度地解释原始数据中的方差,或特 殊因子、误差带来的方差很小,则用主 成分分析法。
如果目的是确定数据结构,但不了解 变量方差的情况,则用公因子分析法。
五、解释因子(rotation)
初始因子很难解释,大多数因子都和很多变 量有关,因子的实际意义难以理解和把握。 因子旋转使因子结构更简单、更易于理解。
当公因子间不相关时,某变量 xi 的公因子方差
h2i
a2i1
a2i2
...
a
பைடு நூலகம்
2 im
即等于与该变量有关的公因子负载的平方和。
因子贡献率(contributions) 表示每个公因子对数据的解释能力, 它等于和该因子有关的因子负载的平 方和,能衡量公因子的相对重要性。
公因子个数 ≤ 观测变量数
能代表观测变量较多信息的公因子是 研究感兴趣的;求因子解时,第一个因 子代表信息最多,随后的因子代表性逐 渐衰减。
0.6以上,差; 0.5,很差;0.5以下不能接受;
KMO 用于检测变量之间的简单相关系数和偏 相关系数的相对大小,取值在0--1间,一般认 为KMO在0.9以上很适合做因子分析,0.8以上 比较适合做因子分析;
Bartlett's 球形检验虚无假设“相关矩 阵是单位矩阵”,拒绝该假设(P<.001)表明 数据适合进行因子分析。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2. 对应分析中的考虑事项

在对应分析中应考虑以下两种事项: (1)数据:用于分析的分类变量是名义变量。对合计数据或对除频数以 外的相应测度,使用有正相似值加权的变量。 (2)有关程序:如果被包括的变量超过两个,使用同质性分析。
第11章 因子分析和对应分析
本章重点:
因子分析
对应分析
11.1 因子分析
因子分析是多元统计分析中的一个重要分支,其主要目的是运用对诸多变 量的相关性进行研究,可以用假设的少数几个变量来表示原来变量的主要信息, 以便浓缩数据。 因子分析具有以下几个特点: (1)因子变量的数量远少于原有的指标变量的数量,对因子变量的分析 能减少分析中的计算工作量。 (2)因子变量不是对原有变量的取舍,而是根据原始变量的信息进行重 新组构,它能反映原有变量大部分的信息。 (3)因子变量之间不存在线性相关关系,对变量的分析比较方便。 (4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合 反映。
11.2 对应分析
对应分析也称相应分析,它是在 型和 型因子分析的基础上发展起来的一 种多元统计方法。 因子分析根据研究对象的不同而分为研究指标的 型因子分析和研究样品的 Q型因子分析,使用因子分析方法时这两个过程只能分开进行。
1. 对应分析与因子分析的联系与区别
对应分析和因子分析一样,都是描述变量间关系的一种实用的多元统计分 析技术。 因子分析要求等间隔数据,而且观测量数目必须是变量数的5倍,它只能 分别对指标或样品进行分类。对应分析不但可以很好地描述各个变量种类间的 关系,还可以秒素这些变量之间的关系。另外,对应分析可以用来对人物正对 应测度表格进行分析。
相关文档
最新文档