SPSS因子分析法例子解释

合集下载

spss因子分析案例

spss因子分析案例

spss因子分析案例在进行SPSS因子分析时,我们通常遵循以下步骤:数据准备、因子提取、因子旋转、因子得分和结果解释。

下面是一个因子分析的案例,展示了如何使用SPSS软件进行这一统计分析。

首先,我们需要准备数据。

这通常涉及收集问卷调查数据,其中包含多个项目或变量,这些变量被认为是潜在因子的指标。

在SPSS中,数据应该以数据集的形式输入,每个变量代表一个问卷项目,每个案例代表一个受访者的回答。

接下来,我们进行因子提取。

在SPSS中,我们可以通过“分析”菜单选择“降维”然后选择“因子”来开始因子分析。

在因子分析对话框中,我们需要指定分析的变量,并决定提取因子的方法。

常见的提取方法包括主成分分析和最大似然法。

此外,我们还需要决定因子提取的标准,如特征值大于1的规则或基于特定比例的方差提取。

因子提取后,我们通常需要进行因子旋转。

旋转的目的是使因子结构更加清晰,便于解释。

SPSS提供了多种旋转方法,如正交旋转(如Varimax)和斜交旋转(如Promax)。

旋转后,每个变量的因子载荷(即变量与因子的相关系数)将被重新估计。

然后,我们可以计算因子得分。

因子得分是每个受访者在每个因子上的估计得分,它可以帮助我们了解每个受访者在潜在因子上的位置。

在SPSS中,可以通过“保存”选项来保存因子得分,以便进一步分析。

最后,我们需要解释因子分析的结果。

这包括解释每个因子的含义,以及哪些变量与每个因子最相关。

我们可以通过查看因子载荷矩阵来完成这一步骤。

通常,载荷值较高的变量被认为是该因子的良好指标。

在实际应用中,因子分析可以帮助我们识别数据中的潜在结构,简化数据集,并为进一步的分析提供基础。

例如,在市场研究中,因子分析可以用来识别消费者行为的潜在维度,从而帮助企业更好地理解其客户群体。

通过上述步骤,我们可以使用SPSS软件有效地进行因子分析,从而揭示数据背后的潜在结构,并为决策提供支持。

SPSS因子分析经典案例分享

SPSS因子分析经典案例分享

SPSS因⼦分析经典案例分享因⼦分析已经被各⾏业⼴泛应⽤,各种案例琳琅满⽬,今天再次发布这⼀经典案例以飨读者。

什么是因⼦分析?因⼦分析⼜称因素分析,传统的因⼦分析是探索性的因⼦分析,即因⼦分析是基于相关关系⽽进⾏的数据分析技术,是⼀种建⽴在众多的观测数据的基础上的降维处理⽅法。

其主要⽬的是探索隐藏在⼤量观测数据背后的某种结构,寻找⼀组变量变化的共同因⼦。

因⼦分析能做什么?⼈的⼼理结构具有层次性,即分为外显和内隐。

但是作为具有同⼀性的个体来说,内隐的⽅⾯总是和外显的⽅⾯相互作⽤,内隐⽅⾯制约着外显特征。

所以我们经常说,⼀个⼈的内在⾃我会在相当程度上决定他的外在⾏为特征,表现为某些⾏为倾向具有⾼度的⼀致性或相关性。

反过来说,我们可以通过对个体进⾏系统的观察和测量,从⼀组⾼度相关的⾏为倾向(可观测)中,探索到某种稳定的内在⼼理结构(潜存在),这就是因⼦分析所能做的。

具体来说主要应⽤于:(1)个体的综合评价:按照综合因⼦得分对case进⾏排序;(2)调查问卷效度分析:问卷所列问题作为输⼊变量,通过KMO、因⼦特征值贡献率、因⼦命名等判断调查问卷架构质量;(3)降维处理,结果再利⽤:因⼦得分作为变量,进⾏聚类或其他分析。

案例描述:⾼中⼤家都读过吧,那是⼀个以成绩论英雄的时代,理科王⼦、⽂科⼩⽣是时代标签。

为什么我们会将数学、物理、化学归并为理科,其他的归并为⽂科,有没有数据⽀持?今天我们将⽤科学的⽅法找到答案。

100个学⽣数学、物理、化学、语⽂、历史、英语成绩如下表(部分),请你来评价他们。

这是⼀个有趣的案例,你可以客观的观测到每⼀科⽬的成绩,但你可以直接看到理科、⽂科的情况吗?6个科⽬的成绩是我们观测到的外在表现,隐藏在其中的公共因⼦你找到了吗?如果我们针对6科⽬做降维处理,会得到什么结果,拭⽬以待。

SPSS分析过程6科⽬成绩作为6个原始变量,利⽤SPSS进⾏因⼦分析,具体步骤请参照各因⼦分析教程,默认亦可,不在讨论范围之内。

如何利用SPSS做因子分析等分析(仅供参考)

如何利用SPSS做因子分析等分析(仅供参考)

我就以我的数据为例来做示范,仅供参考一、信度分析(即可靠度分析)1.分析——度量——可靠度分析图 12.然后就会弹出上图1的框框。

在这里,你可以对所有的问题进行可靠度分析,如果是这样,那你只需要选中所有的问题到右边这个白色的框框,然后点击“统计量”,按照右边这个图进行打钩。

然后点“继续”。

之后就点“确定”图2 3.接着去“输出1”这个框看分析结果,你就会看到很多分析结果,其中有一个就是右图,那第一个0.808就是你所选择进行分析的数据的信度。

如果你想把每一个维度的数据进行独立的信度分析,那道理也是一样的。

二、因子分析在做因子分析之前首先要判断这些数据是否适合做因子分析,那这里就需要进行效度检验,不过总共效度检验是和因子分析的操作同步的,意思就是说你在做因子分析的时候也可以做效度检验。

具体示范如下:1.分析——降维——因子分析图 2一般来说,咱们做因子分析的时候是为了把那些具有共同属性的因子归类成一类,说的简单点就是要验证咱们所选取的每一个维度下面的题目是属于这个维度,而非其他维度的。

那一般来说,因子分析做出来的结果就是你原本有几个维度,最终分析结果就会归类成几个公因子。

2.一般来说,自变量的题目和因变量的题目是要独立分析的。

我的课题是“店面形象对顾客购买意愿的影响”那自变量就是店面形象的那些维度,因变量就是顾客购买意愿。

3.将要做分析的题目选择到右边的白框之后,就如下图打钩:“抽取”和“选项”两个不用管他。

然后就点“确定”4.按照上述步骤操作下来之后,就可以去“输出1”看分析结果。

首先看效度检验的结果:这里要看第一行和最后一行的数据,第一行数据为0.756,表明效度较高,sig为0.000,这两个结果显示这份数据完全可以做因子分析。

那就去看因子分析的结果。

5.看下面这张图,看“初始特征值”这一项下面的“合计”的数值,有几个数据是>1,那就表明此次因子分析共提取了几个公因子。

下图所示,有5个数据是>1,这表明可以提取5个公因子。

SPSS因子分析法-例子解释

SPSS因子分析法-例子解释

因子分析的基本概念和步骤一、因子分析的意义在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。

例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。

虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在:计算量的问题由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。

虽然,现在的计算技术已得到了迅猛发展,但高维变量和海量数据仍是不容忽视的。

变量间的相关性问题收集到的诸多变量之间通常都会存在或多或少的相关性。

例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。

而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。

例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。

类似的问题还有很多。

为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。

为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。

因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。

因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。

SPSS数据的因子分析

SPSS数据的因子分析

每个因子的载荷系
总人口
Component
1
2
.581
.806
数没有很明显的差 别,所以不好命名.
中等学校平均校龄
.767
-.545
总雇员数
.672
.726
专业服务项目数
.932
-.104
中等房价
.791
-.558
为了对因子进行命名
Extraction Method: Principal Component Analysi,s.可以进行旋转,使
.968
-.006
第一主因子对中等学校平均校龄,专 业服务项目,中等房价有绝对值较大 的载荷(代表福利条件因子); 第二主因子对总人口和总雇员数有较 大的载荷(代表人口因子).
Extraction Method: Principal Component Analysis. Rotation Met hod: Varimax with Kaiser Normalization.
选择的变量有:多子率、综合节育率、初中以上文化程 度比例、城镇人口比例、人均国民收入。下表是1990年中国 30个省、自治区、直辖市的数据。
2019/12/20
21
zf
多子率(%) 综合节育率(%) 初中以上文化程度比例(%)
0.94
89.89
64.51
2.58
92.32
55.41
13.46
90.71
2019/12/20
15
zf
(3)因子旋转
通过正交旋转或斜交旋转使提取出的因子具有可解释性。
(4)计算因子得分
求解各样本在各因子上的得分,为进一步分析奠定基础。
2019/12/20

SPSS因子分析实例操作步骤

SPSS因子分析实例操作步骤

SPSS因子分析实例操作步骤实验目的:引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。

实验变量:以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。

实验方法:因子分析法软件:spss19.0操作过程:第一步:导入Excel数据文件???1.opendatadocument——opendata——open;2.Openingexceldatasource——OK.第二步:1.数据标准化:在最上面菜单里面选中Analyze——DescriptiveStatistics——OK?(变量选择除年份、合计以外的所有变量).2.降维:在最上面菜单里面选中Analyze——DimensionReduction——Factor?,变量选择标准化后的数据.3.点击右侧Descriptive,勾选CorrelationMatrix选项组中的Coefficients和KMOandBartlett’stextofsphericity,点击Continue.4.点击右侧Extraction,勾选ScreePlot和fixednumberwithfactors,默认3个,点击Continue.5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的LodingPlot(s);点击Continue.6.点击右侧Scores,勾选Method选项组中的Regression;勾选Displayfactorscorecoefficientmatrix;点击Continue.7.点击右侧Options,勾选CoefficientDisplayFormat选项组中所有选项,将Absolutevalueblow改为0.60,点击Continue.8.返回主对话框,单击OK.输出结果分析:1.描述性统计量DescriptiveStatistics该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、标准差。

运用spss做因子解析与主成分解析 (一)

运用spss做因子解析与主成分解析 (一)

主成分分析




当坐标轴和椭圆的长短轴平行,那么代表 长轴的变量就描述了数据的主要变化,而 代表短轴的变量就描述了数据的次要变化。 但是,坐标轴通常并不和椭圆的长短轴平 行。因此,需要寻找椭圆的长短轴,并进 行变换,使得新变量和椭圆的长短轴平行。 如果长轴变量代表了数据包含的大部分信 息,就用该变量代替原先的两个变量(舍 去次要的一维),降维就完成了。 椭圆(球)的长短轴相差得越大,降维也 越有道理。
R= 1.0000 0.4463 -0.7540 -0.3471 0.5624 0.4463 1.0000 -0.4578 0.4170 -0.3471 0.4170 0.3644 1.0000
i i i i
0.7179 0.4948 1.0000
-0.7540 -0.4578 1.0000 0.3644 -0.4170
因子分析(m<p)
f1 11x1 12 x2 f2 21x1 22 x2 fm m1x1 m2 x2
1p xp 2 p xp mp xp
因子得分
因子分析和主成分分析的一些注意事项




可以看出,因子分析和主成分分析都依赖于原始 变量,也只能反映原始变量的信息。所以原始变 量的选择很重要。 (因子要相关,不能完全独立)另外,如果原始 变量都本质上独立,那么降维就可能失败,这是 因为很难把很多独立变量用少数综合的变量概括。 数据越相关,降维效果就越好。 在得到分析的结果时,并不一定会都得到如我们 例子那样清楚的结果。这与问题的性质,选取的 原始变量以及数据的质量等都有关系 在用因子得分进行排序时要特别小心,特别是对 于敏感问题。由于原始变量不同,因子的选取不 同,排序可以很不一样。

基于SPSS软件的因子分析法及实证分析

基于SPSS软件的因子分析法及实证分析

基于SPSS软件的因子分析法及实证分析基于SPSS软件的因子分析法及实证分析引言:随着社会的发展和数据的大规模积累,研究者们面临着海量的数据,如何从中获取有效的信息成为一个亟待解决的问题。

因子分析(Factor Analysis)作为一种数据分析方法,广泛应用于心理学、社会学、教育学、市场营销等领域。

本文将介绍基于SPSS软件的因子分析法以及实证分析的基本原理和步骤。

一、因子分析法概述因子分析法是一种通过统计方法对变量进行降维的分析技术。

它的目的是通过寻找共同的变异性,将一组相关的变量转化为一组较少的潜在因子。

这使得复杂的数据集可以被简化为更容易理解和分析的几个潜在因子。

二、因子分析法的基本原理1. 主成分分析(Principal Component Analysis,PCA)主成分分析是因子分析的一种方法,旨在寻找数据中的最主要的一些因素。

它通过对协方差矩阵进行特征分解,得到特征值和特征向量。

特征值表示对应的特征向量的重要程度,特征向量表示潜在因子与原始变量之间的关系。

2. 公因子分析(Common Factor Analysis,CFA)公因子分析是另一种常用的因子分析方法。

它假设观测变量受到共同的潜在因子影响,同时还存在独立的特殊因素。

公因子分析通过最大似然估计或最小方差法估计因子载荷矩阵,找出与潜在因子最相关的观测变量。

三、基于SPSS软件的因子分析步骤1. 数据准备采集研究数据后,首先需要将数据导入SPSS软件,并保证数据的可靠性和完整性。

2. 数据检查与整理对数据进行检查,确保数据的完整性和一致性。

如有缺失值或异常值,可以选择删除或进行数据插补等处理。

3. 因子分析模型选择根据具体问题和数据特点,选择适合的因子分析模型,如主成分分析或公因子分析。

4. 因子提取通过SPSS软件进行因子提取。

在主成分分析中,可以根据特征值-特征向量矩阵选择特征值大于1的主成分,将其作为因子。

在公因子分析中,可以根据因子载荷矩阵确定合适的因子个数。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因子分析的基本概念与步骤一、因子分析的意义在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握与认识。

例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。

虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”与“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在:计算量的问题由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。

虽然,现在的计算技术已得到了迅猛发展,但高维变量与海量数据仍就是不容忽视的。

变量间的相关性问题收集到的诸多变量之间通常都会存在或多或少的相关性。

例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。

而变量之间信息的高度重叠与高度相关会给统计方法的应用带来许多障碍。

例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。

类似的问题还有很多。

为了解决这些问题,最简单与最直接的解决方案就是削减变量的个数,但这必然又会导致信息丢失与信息不完整等问题的产生。

为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。

因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。

因子分析的概念起源于20世纪初Karl Pearson与Charles Spearmen等人关于智力测验的统计分析。

目前,因子分析已成功应用于心理学、医学、气象、地址、经济学等领域,并因此促进了理论的不断丰富与完善。

因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。

通常,因子有以下几个特点:↓因子个数远远少于原有变量的个数原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。

↓因子能够反映原有变量的绝大部分信息因子并不就是原有变量的简单取舍,而就是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。

↓因子之间的线性关系并不显著由原有变量重组出来的因子之间的线性关系较弱,因子参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。

↓因子具有命名解释性通常,因子分析产生的因子能够通过各种方式最终获得命名解释性。

因子的命名解释性有助于对因子分析结果的解释评价,对因子的进一步应用有重要意义。

例如,对高校科研情况的因子分析中,如果能够得到两个因子,其中一个因子就是对科研人力投入、经费投入、立项项目数等变量的综合,而另一个就是对结项项目数、发表论文数、获奖成果数等变量的综合,那么,该因子分析就就是较为理想的。

因为这两个因子均有命名可解释性,其中一个反映了科研投入方面的情况,可命名为科研投入因子,另一个反映了科研产出方面的情况,可命名为科研产出因子。

总之,因子分析就是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法。

二、因子分析的基本概念1、因子分析模型因子分析模型中,假定每个原始变量由两部分组成:共同因子(common factors)与唯一因子(unique factors)。

共同因子就是各个原始变量所共有的因子,解释变量之间的相关关系。

唯一因子顾名思义就是每个原始变量所特有的因子,表示该变量不能被共同因子解释的部分。

原始变量与因子分析时抽出的共同因子的相关关系用因子负荷(factor loadings)表示。

因子分析最常用的理论模式如下:j m jm j j j j U F a F a F a F a Z ++⋅⋅⋅+++=332211(j=1,2,3…,n,n 为原始变量总数)可以用矩阵的形式表示为U AF Z +=。

其中F 称为因子,由于它们出现在每个原始变量的线性表达式中(原始变量可以用j X 表示,这里模型中实际上就是以F 线性表示各个原始变量的标准化分数j Z ),因此又称为公共因子。

因子可理解为高维空间中互相垂直的m 个坐标轴,A 称为因子载荷矩阵,)...3,2,1,...3,2,1(m i n j a ji ==称为因子载荷,就是第j 个原始变量在第i 个因子上的负荷。

如果把变量j Z 瞧成m 维因子空间中的一个向量,则ji a 表示j Z 在坐标轴i F 上的投影,相当于多元线性回归模型中的标准化回归系数;U 称为特殊因子,表示了原有变量不能被因子解释的部分,其均值为0,相当于多元线性回归模型中的残差。

其中,(1)j Z 为第j 个变量的标准化分数;(2)i F (i=1,2,…,m)为共同因素;(3)m 为所有变量共同因素的数目;(4)j U 为变量j Z 的唯一因素;(5)ji a 为因素负荷量。

2、因子分析数学模型中的几个相关概念因子载荷(因素负荷量factor loadings)所谓的因子载荷就就是因素结构中,原始变量与因素分析时抽取出共同因素的相关。

可以证明,在因子不相关的前提下,因子载荷ji a 就是变量j Z 与因子i F 的相关系数,反映了变量j Z 与因子i F 的相关程度。

因子载荷ji a 值小于等于1,绝对值越接近1,表明因子i F 与变量j Z 的相关性越强。

同时,因子载荷ji a 也反映了因子i F 对解释变量j Z 的重要作用与程度。

因子载荷作为因子分析模型中的重要统计量,表明了原始变量与共同因子之间的相关关系。

因素分析的理想情况,在于个别因素负荷量ji a 不就是很大就就是很小,这样每个变量才能与较少的共同因素产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则j U 彼此间或与共同因素间就不能有关联存在。

一般说来,负荷量为0、3或更大被认为有意义。

所以,当要判断一个因子的意义时,需要查瞧哪些变量的负荷达到了0、3或0、3以上。

↓变量共同度(共同性,Communality)变量共同度也就就是变量方差,就就是指每个原始变量在每个共同因子的负荷量的平方与,也就就是指原始变量方差中由共同因子所决定的比率。

变量的方差由共同因子与唯一因子组成。

共同性表明了原始变量方差中能被共同因子解释的部分,共同性越大,变量能被因子说明的程度越高,即因子可解释该变量的方差越多。

共同性的意义在于说明如果用共同因子替代原始变量后,原始变量的信息被保留的程度。

因子分析通过简化相关矩阵,提取可解释相关的少数因子。

一个因子解释的就是相关矩阵中的方差,而解释方差的大小称为因子的特征值。

一个因子的特征值等于所有变量在该因子上的负荷值的平方总与。

变量j Z 的共同度2h 的数学定义为:∑==mi ji a h 122,该式表明变量j Z 的共同度就是因子载荷矩阵A 中第j 行元素的平方与。

由于变量j Z 的方差可以表示成122=+u h ,因此变量j Z 的方差可由两个部分解释:第一部分为共同度2h ,就是全部因子对变量j Z 方差解释说明的比例,体现了因子全体对变量j Z 的解释贡献程度。

变量共同度2h 越接近1,说明因子全体解释说明了变量j Z 的较大部分方差,如果用因子全体刻画变量j Z ,则变量j Z 的信息丢失较少;第二部分为特殊因子U 的平方,反应了变量j Z 方差中不能由因子全体解释说明的比例,2u 越小则说明变量j Z 的信息丢失越少。

总之,变量d 共同度刻画了因子全体对变量j Z 信息解释的程度,就是评价变量j Z 信息丢失程度的重要指标。

如果大多数原有变量的变量共同度均较高(如高于0、8),则说明提取的因子能够反映原有变量的大部分信息(80%以上)信息,仅有较少的信息丢失,因子分析的效果较好。

因子,变量共同度就是衡量因子分析效果的重要依据。

↓因子的方差贡献(特征值eigenvalue)因子的方差贡献(特征值)的数学定义为:212∑==n j ji i a S ,该式表明,因子i F 的方差贡献就是因子载荷矩阵A 中第i 列元素的平方与。

因子i F 的方差贡献反映了因子i F 对原有变量总方差的解释能力。

该值越高,说明相应因子的重要性越高。

因此,因子的方差贡献与方差贡献率就是衡量因子重要性的关键指标。

为了便于说明,以三个变量抽取两个共同因素为例,三个变量的线性组合分别为:12121111U F a F a Z ++=22221212U F a F a Z ++=32321313U F a F a Z ++=素负荷量的平方与),也就就是个别变量可以被共同因素解释的变异量百分比,这个值就是个别变量与共同因素间多元相关的平方。

从共同性的大小可以判断这个原始变量与共同因素之间关系程度。

而各变量的唯一因素大小就就是1减掉该变量共同性的值。

(在主成分分析中,有多少个原始变量便有多少个“component ”成分,所以共同性会等于1,没有唯一因素)。

至于特征值就是每个变量在某一共同因素之因素负荷量的平方总与(一直行所有因素负荷量的平方与)。

在因素分析之共同因素抽取中,特征值大的共同因素会最先被抽取,其次就是次大者,最后抽取的共同因素之特征值最小,通常会接近0(在主成分分析中,有几个题项,便有几个成分,因而特征值的总与刚好等于变量的总数)。

将每个共同因素的特征值除以总题数,为此共同因素可以解释的变异量,因素分析的目的,即在因素结构的简单化,希望以最少的共同因素,能对总变异量作最大的解释,因而抽取的因素越少越好,但抽取因素之累积解释的变异量则越大越好。

3、社会科学中因素分析通常应用在三个层面:(1)显示变量间因素分析的组型(pattern)(2)侦测变量间之群组(clusters),每个群组所包括的变量彼此相关很高,同构型较大,亦即将关系密切的个别变量合并为一个子群。

(3)减少大量变量数目,使之称为一组涵括变量较少的统计自变量(称为因素),每个因素与原始变量间有某种线性关系存在,而以少数因素层面来代表多数、个别、独立的变量。

因素分析具有简化数据变量的功能,以较少层面来表示原来的数据结构,它根据变量间彼此的相关,找出变量间潜在的关系结构,变量间简单的结构关系称为“成份”(components)或“因素”(factors)、三、因素分析的主要方式围绕浓缩原有变量提取因子的核心目标,因子分析主要涉及以下五大基本步骤:1、因子分析的前提条件由于因子分析的主要任务之一就是对原有变量进行浓缩,即将原有变量中的信息重叠部分提取与综合成因子,进而最终实现减少变量个数的目的。

相关文档
最新文档