探索性因子分析及其在应用中存在的主要问题

合集下载

因子分析中的常见问题解决技巧分享(六)

因子分析中的常见问题解决技巧分享(六)

因子分析是一种常用的统计方法,用于确定观察变量之间的潜在结构。

它可以帮助研究人员简化数据集,发现变量之间的关联性,并且可以应用于各种学科领域,如心理学、教育学、市场研究等。

然而,因子分析也存在一些常见问题,本文将分享一些解决这些问题的技巧。

数据准备与预处理在进行因子分析之前,首先需要对数据进行准备和预处理。

这包括检查数据的完整性、一致性以及是否满足因子分析的假设。

例如,数据是否呈现正态分布,是否存在异常值,是否具有充分的样本大小等。

如果数据不符合这些假设,可能会导致因子分析结果不准确。

因此,在进行因子分析之前,要对数据进行适当的处理和转换,以确保数据的质量和适用性。

选择合适的因子数在因子分析中,选择合适的因子数是一个关键问题。

如果选择的因子数过多或过少,都会对因子分析的结果产生影响。

因此,需要使用一些统计指标来帮助确定合适的因子数。

例如,可以使用特征值、解释变异量和累积方差解释率等指标来评估因子的个数。

此外,还可以使用平行分析、拟合指数和负荷量等方法来帮助确定最佳的因子数。

解决共线性在因子分析中,共线性是一个常见问题。

共线性指的是变量之间存在高度相关性,这会导致因子分析结果不稳定。

为了解决共线性问题,可以使用一些方法,如删除高度相关的变量、合并相关变量、使用主成分分析或者正交旋转等。

这些方法可以帮助减少共线性对因子分析结果的影响,从而得到更稳定和可靠的因子。

选择合适的旋转方法在因子分析中,旋转是一种常用的方法,用于调整因子载荷矩阵,以便更好地解释数据的结构。

常见的旋转方法包括方差最大旋转、正交旋转、斜交旋转等。

选择合适的旋转方法可以帮助提高因子分析的解释性和可解释性。

通常情况下,可以根据数据的特点和研究的目的来选择最合适的旋转方法。

评估因子分析结果最后,需要对因子分析的结果进行评估。

这包括检验因子载荷矩阵的合理性、解释因子的含义和实际意义、验证因子结构的稳定性等。

对因子分析结果的充分评估可以帮助确定分析的可靠性和有效性,并且可以为后续的数据解释和应用提供支持。

因子分析中的常见误区与解决方法(八)

因子分析中的常见误区与解决方法(八)

因子分析是一种常用的统计学方法,用于揭示观测变量之间的潜在关联和结构。

然而,在实际应用中,很多研究者在进行因子分析时会遇到一些常见的误区。

本文将对因子分析中的常见误区进行分析,并提出解决方法。

误区一:选择因子数的方法不当在因子分析中,选择合适的因子数是至关重要的。

一般来说,可以通过特征值大于1、解释方差累计贡献率达到80%以上或者屏蔽图等方法来确定因子数。

然而,在实际应用中,很多研究者往往会根据经验或主观意识来确定因子数,导致结果不够准确或科学。

解决方法:一种常用的方法是通过并行分析来确定因子数。

并行分析是一种模拟方法,通过生成随机数据来确定实际数据中的特征值的临界值,从而确定因子数。

另外,也可以通过拟合指标如AIC、BIC等来确定因子数。

误区二:因子旋转不当因子旋转是因子分析中非常重要的一步,它能够使因子载荷矩阵更具有解释性和可解释性。

然而,很多研究者在进行因子旋转时往往会选择旋转方法不当,导致结果不够科学和可信。

解决方法:在选择因子旋转方法时,可以根据具体的研究目的来确定。

如果是为了更好地解释因子之间的关系,可以选择正交旋转方法如方差最大旋转(Varimax)。

如果是为了更好地解释变量之间的相关性,可以选择斜交旋转方法如极大似然旋转。

此外,也可以结合实际情况来选择具体的旋转方法。

误区三:因子负荷值过小在因子分析中,因子负荷值代表了变量与因子之间的关联程度。

然而,很多研究者在进行因子分析时往往会忽略因子负荷值过小的问题,导致结果不够可信。

解决方法:在因子负荷值过小的情况下,可以考虑删除此因子或者删除对应的变量。

此外,也可以通过增加样本量来提高因子负荷值的稳定性。

另外,也可以通过修改因子旋转方法或者使用其他因子分析方法来解决因子负荷值过小的问题。

误区四:样本量不足在进行因子分析时,样本量的大小直接影响到因子分析结果的可靠性和稳定性。

然而,很多研究者在进行因子分析时往往会忽略样本量不足的问题,导致结果不够可信。

探索性因子分析

探索性因子分析

• Example
• 旋转后的因子表达式可以写成:
FA1C 10.091po'p0.392sch'o0o.0l39emp' l 0.299serv'ic0.4es03hou' se FA2C 10.484po'p0.096sch'o0o.4l65emp' lo 0.138serv'ic0.0es98hou' se
• 因子旋转通常分为两类:
正交旋转
Varimax方差最大旋转,它使每个因子上的具有 最高载荷的变量数最小,可简化对因子的解释。
斜交旋转
因子旋转(二)
• 正交旋转的基本假定是,因子分析中被提 取出来的因子之间是相互独立的,因子间 并不相关。它的目的是要获得因子的简单 结构,即使每个变量在尽可能少的因子上 有较高的负载;而斜交旋转中,因子间的夹 角是任意的,也就是说斜交旋转对因子间 是否相关并无限定,这种因子旋转的结果 就会使各因子所解释的变量的方差出现一 定程度的重叠。
估计因子得分的方法
回归法
因子得分的均值为0,方差等于估计因子 得分与实际得分之间的多元相关的平方
Bartlett法
因子得分均值为0,超出变量范围的特殊 因子平方和被最小化
Anderson-Rubin法
因子得分的均值为0,标准差为1,且彼此 不相关。是为了保证因子的正交性而对 Bartlett因子的调整。
公因子的累积方差贡献率
根据累计贡献率达到的百分比确定
确定因子个数的方法(二)
• 实际上累积贡献率是一个次要指标 。主要指标是特征值, 在前一指标达 到的情况下,只要累计贡献率不是 太差都可以接受。即使70%也不是 太大的问题。实际处理中,很少碰 到累计贡献率太低的情况,如果问 卷设计和数据收集没有太大问题的 前提下。

探索性因子分析法.doc

探索性因子分析法.doc

探索性因子分析法(Exploratory Factor Analysis,EFA)目录[隐藏]∙ 1 什么是探索性因子分析法?∙ 2 探索性因子分析法的起源∙ 3 探索性因子分析法的计算∙ 4 探索性因子分析法的运用∙ 5 探索性因子分析法的步骤∙ 6 探索性因子分析法的优点∙7 探索性因子分析法的缺点∙8 探索性因子分析法的假定∙9 EFA在教育、心理领域存在的问题及建议[1]∙10 参考文献[编辑]什么是探索性因子分析法?探索性因子分析法(Exploratory Factor Analysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。

因而,EFA能够将将具有错综复杂关系的变量综合为少数几个核心因子。

[编辑]探索性因子分析法的起源因子分析法是两种分析形式的统一体,即验证性分析和纯粹的探索性分析。

英国的心理学家Charles Spearman在1904年的时候,提出单一化的智能因子(A Single Intellectual Factor)。

随着试验的深入,大量个体样本被分析研究,Spearman的单一智能因子理论被证明是不充分的。

同时,人们认识到有必要考虑多元因子。

20世纪30年代,瑞典心理学家Thurstone打破了流行的单因理论假设,大胆提出了多元因子分析(Multiple Factor Analysis)理论。

Thurstone 在他的《心智向量》(Vectors of Mind, 1935)一书中,阐述了多元因子分析理论的数学和逻辑基础。

[编辑]探索性因子分析法的计算在运用EFA法的时候,可以借助统计软件(如SPSS统计软件或SAS统计软件)来进行数据分析。

[编辑]探索性因子分析法的运用1、顾客满意度调查。

2、服务质量调查。

3、个性测试。

4、形象调查。

5、市场划分识别。

6、顾客、产品及行为分类。

[编辑]探索性因子分析法的步骤一个典型的EFA流程如下:1、辨认、收集观测变量。

因子分析中的常见问题解决技巧分享(十)

因子分析中的常见问题解决技巧分享(十)

因子分析是一种常用的数据降维技术,用于发现潜在的变量结构和减少变量的数量。

然而,在实际应用中,因子分析也常常面临一些常见问题。

本文将通过对常见问题的分析,提供一些解决技巧,帮助读者更好地应对因子分析中的挑战。

1. 数据准备与清洗在进行因子分析之前,首先需要对数据进行准备和清洗。

这包括缺失值处理、异常值检测和变量标准化等步骤。

其中,缺失值处理是一个常见问题。

如果数据中存在缺失值,可以采用删除、插补或者使用专门的缺失值处理方法(如EM算法)来处理。

另外,异常值的存在也可能影响因子分析的结果,因此需要进行异常值检测并进行相应的处理。

2. 因子数目确定确定因子的数量是因子分析中的一个关键问题。

常见的方法包括Kaiser准则、平行分析和拟合度指标等。

Kaiser准则建议保留特征值大于1的因子,但在实际中可能并不适用于所有情况。

平行分析是一种基于蒙特卡洛模拟的方法,通过生成随机数据集来确定因子数量,相对较为准确。

另外,拟合度指标(如CFI、TLI、RMSEA等)也可以用来评估模型的拟合程度,从而确定因子的数量。

3. 因子旋转因子旋转是因子分析中的一个重要步骤,旨在使因子具有更好的解释性。

常见的因子旋转方法包括方差最大化旋转(如Varimax)、极大似然估计旋转(如Promax)等。

在选择因子旋转方法时,需要考虑因子结构的简洁性和解释性,以及因子之间的相关性等因素。

4. 因子解释与命名在因子分析的结果中,因子的解释和命名是一个重要问题。

因子的解释需要考虑因子载荷矩阵、因子旋转后的载荷矩阵以及变量之间的关系等多方面因素。

同时,需要考虑因子的命名,以便更好地理解和解释因子的含义。

因子解释和命名需要结合领域知识和实际情况,确保因子具有良好的解释性和实用性。

5. 结果解释与应用最后,对因子分析的结果进行解释和应用也是一个重要问题。

在解释结果时,需要考虑因子的解释性、实用性和稳定性等因素。

同时,在应用结果时,需要考虑因子分析的局限性和适用范围,以便更好地利用因子分析的结果。

因子分析中的常见误区与解决方法(Ⅱ)

因子分析中的常见误区与解决方法(Ⅱ)

因子分析是一种常用的统计分析方法,用于研究变量之间的关系和潜在因素。

它可以帮助研究者发现数据内在的结构,找出变量之间的相关性,从而更好地理解数据。

然而,因子分析也存在一些常见的误区,导致分析结果不准确或解释不清晰。

本文将探讨因子分析中的常见误区,并提出相应的解决方法。

误区一:没有检查数据的适用性在进行因子分析之前,首先需要检查数据的适用性。

这包括检查样本的大小是否足够、变量之间的相关性是否满足进行因子分析的要求、数据是否符合正态分布等。

如果数据的适用性不符合要求,进行因子分析就会导致不准确的结果。

解决方法:对数据进行适用性检验是非常重要的。

可以使用卡方检验、巴特利特球形检验、Kaiser-Meyer-Olkin (KMO)测度等方法来检查数据的适用性。

如果数据不符合要求,可以考虑进行数据变换或者使用其他统计分析方法。

误区二:选择因子数的方法不当选择因子数是因子分析中的一个关键步骤。

如果选择的因子数不当,就会影响到因子分析的结果。

常见的误区包括过度提取因子或者提取过少的因子,都会导致结果不准确。

解决方法:在选择因子数时,可以使用多种方法来进行判断。

比如可以使用特征值大于1、并且累计方差贡献率达到60%以上的标准来确定因子数。

另外,也可以使用平行分析、最大似然估计等方法来帮助选择合适的因子数。

误区三:因子旋转方法选择不当因子旋转是因子分析中的一个重要步骤,它可以帮助解释因子之间的关系,使因子分析结果更加清晰和易于理解。

然而,因子旋转方法的选择不当会导致结果的解释不清晰。

解决方法:在选择因子旋转方法时,可以根据研究问题和数据的特点来进行选择。

常见的因子旋转方法包括方差最大旋转、极大方差旋转、斜交旋转等。

可以根据因子分析的目的和数据的特点来选择合适的因子旋转方法。

误区四:因子解释不清晰因子分析的最终目的是为了解释数据的内在结构,如果因子解释不清晰,就会影响到因子分析的有效性。

解决方法:在因子分析的过程中,可以使用因子载荷矩阵、因子贡献率、公共因子方差等指标来对因子进行解释。

因子分析中的常见误区与解决方法(五)

因子分析中的常见误区与解决方法(五)

因子分析是一种常用的多变量统计分析方法,用于探索变量之间的内在结构和关系。

在实际应用中,由于数据的复杂性和分析者的主观影响,常常会出现一些常见误区。

本文将针对因子分析中的常见误区进行探讨,并提出相应的解决方法。

误区一:因子数选择不当在因子分析中,选择合适的因子数是十分关键的。

若选择的因子数过多或过少,都会影响到因子分析的结果和解释。

因此,有必要进行因子数选择的评估。

解决方法可以采用Kaiser准则、平行分析、最大似然估计等方法来确定因子数。

其中,Kaiser准则是比较常用的一种方法,它建议选择特征根大于1的因子作为主成分,但在实际应用中也需要结合实际情况进行综合考虑。

误区二:变量选择不当在进行因子分析时,选取的变量应该是相关的,且具有一定的可解释性。

若选取的变量之间相关性较弱,或者存在较多的不相关变量,都会影响到因子分析的结果。

因此,需要在进行因子分析前对变量进行筛选和剔除。

通过相关性分析、因子载荷矩阵、变量间的理论联系等方法,可以对变量进行合理的选择和筛选,以确保因子分析的结果具有可靠性和解释性。

误区三:因子旋转选择不当在因子分析中,因子旋转是十分重要的一步,它可以使得因子的解释更加清晰和具有实际意义。

然而,在实际应用中,常常会出现因子旋转选择不当的情况。

解决方法可以采用方差最大旋转、正交旋转、斜交旋转等方法来进行因子旋转选择。

其中,方差最大旋转是比较常用的一种方法,它可以使得因子的解释更加清晰和简单,但在实际应用中也需要结合实际情况进行综合考虑。

误区四:因子载荷解释不当在因子分析中,因子载荷是十分重要的一部分,它可以反映变量与因子之间的关系和影响。

然而,在实际应用中,常常会出现因子载荷解释不当的情况。

解决方法可以通过因子载荷矩阵、变量间的理论联系、实际应用的经验等方法来进行因子载荷解释。

同时,也可以结合因子旋转的结果来对因子载荷进行解释和调整,以确保因子分析的结果具有可靠性和解释性。

误区五:因子分析结果解释不当在因子分析的结果解释中,需要结合实际应用的背景和经验来进行综合考虑。

因子分析中的因子结构验证方法(Ⅲ)

因子分析中的因子结构验证方法(Ⅲ)

因子分析是一种常用的数据分析方法,它通过发现变量之间的潜在关系,从而揭示数据背后的模式和结构。

在因子分析中,因子结构验证是非常重要的一步,它用于确认所提取的因子是否符合理论或者假设。

本文将介绍因子分析中的因子结构验证方法,并探讨其应用和局限性。

一、探索性因子分析探索性因子分析(EFA)是一种用于发现数据内在结构的方法。

在EFA中,研究者无需事先提出因子模型,而是通过对数据进行因子提取和旋转,来发现潜在的因子结构。

然而,EFA并不能提供一个明确的因子结构验证方法,因此在实际应用中,研究者往往需要进一步进行验证性因子分析(CFA)。

二、验证性因子分析验证性因子分析是在探索性因子分析的基础上,通过利用理论模型来验证因子结构的一种方法。

在CFA中,研究者需要先提出一个假设的因子结构模型,然后利用统计方法来检验这一模型是否符合实际数据。

常用的CFA方法包括最大似然估计、加权最小二乘法等。

这些方法可以帮助研究者评估因子结构的拟合度,从而确认因子结构的有效性。

三、模型拟合度指标在CFA中,常用的模型拟合度指标包括卡方值、比较拟合指数(CFI)、增量拟合指数(IFI)、均方根误差逼近度(RMSEA)等。

这些指标可以帮助研究者评估提出的因子结构模型与实际数据之间的拟合程度。

例如,CFI和IFI的取值范围在0到1之间,数值越接近1表示模型拟合度越好;而RMSEA的取值范围在0到1之间,数值越小表示模型拟合度越好。

通过对这些指标的综合评估,研究者可以得出对因子结构的验证结论。

四、因子旋转方法因子旋转是因子分析中的一个重要步骤,它可以帮助研究者更好地理解因子结构。

常用的因子旋转方法包括方差最大旋转(Varimax)、极大似然旋转(Promax)等。

这些方法可以使得因子载荷矩阵更具解释性,从而帮助研究者理解潜在的因子结构。

五、局限性和应用建议尽管CFA是一种常用的因子结构验证方法,但它也存在一些局限性。

例如,CFA需要研究者先提出一个明确的因子结构模型,这在某些情况下可能是困难的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

探索性因子分析及其在应用中存在的主要问题Ξ孙晓军ΞΞ 周宗奎(华中师范大学心理学院,武汉,430079)摘 要 探索性因子分析的发展非常迅速,已成为教育与社会心理学领域中最常用的统计方法之一。

本文全面介绍了探索性因子分析的基本原理,阐述了其发生的机制及基本过程,对其在教育、心理领域应用中存在的问题进行了总结,并针对应用中样本容量和观测变量数目不够、因子求解方法的误用、因子数目的确定标准及因子旋转中存在的问题、因子值缺乏重复验证性、研究结果呈现形式不规范、过于依赖SPSS 、缺乏主动性等问题提出了一些相应的建议。

关键词:探索性因子分析 因子旋转 因子值 因子分析(Factor Analysis )是通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量(因子)来表示基本的数据结构的方法[1]。

1904年,查尔斯・斯皮尔曼(Charles Spearman )在研究智力时首次采用了因子分析的方法,将因子分析方法运用于实践[2]。

随后,因子分析的理论和数学基础逐步得到发展和完善,特别是50年代以后,随着计算机的普及和各种统计软件的出现,因子分析得到了巨大的发展。

现在,因子分析已成为教育与社会心理学领域研究中最常用的统计方法之一。

但令人遗憾的是,在实际研究的应用中,研究者并不能合理、正确的使用这一方法,导致最后的研究结果缺乏可信度。

本文的目的就是通过对探索性因子分析发生原理、步骤的详细探讨,结合其在应用中存在的问题,希望对心理领域中探索性因子分析的运用提出一些实质性的建议,包括样本大小、因子数目、观测变量数目、因子旋转等等。

1 探索性因子分析的基本原理 探索性因子分析模型(见图1)的一般表达形式为:X 1=w 11F 1+w 21F 2+……w n1F n +w 1U 1+e 1其中,X n 表示观测变量,F M 代表因子分析中最基本的公因子(Common factor ),它们是各个观测变量所共有的因子,解释了变量之间的相关;U n 代表特殊因子(Unique factor ),它是每个观测变量所特有的因子,相当于多元回归分析中的残差项,表示该变量不能被公因子所解释的部分;w M 代表因子负载(Factor loading ),它是每个变量在各公因子上的负载,相当于多元回归分析中的回归系数;而e n 则代表了每一观测变量的随机误差。

图1 探索性因子分析模型(来源:郭志刚,1999) 探索性因子分析的过程实质就是寻求F 1、F 2、......F m等少数几个公因子以构建因子结构来最大限度地表示所有变量的信息[3]。

在探索性因子分析中,一个重要的假设就是所有的特殊因子间及特殊因子与公因子间是彼此独立、不相关的。

ΞΞΞ通讯作者:孙晓军,男。

E 2mail :sxj -ccnu @本研究得到国家自然科学基金资助,项目号30270473。

1440 心理科学 Psychological Science 2005,28(6):1440-14422 探索性因子分析的基本步骤2.1 研究设计因子分析中被试的数目一直是依据相应的观测变量的多少来确定的。

MacCallum等人(1999)[4]探讨了不同样本大小及不同变量公共方差情况下,所得的因子负载的精确程度,结果发现,如果观测变量的公共方差较高(0.60或更高),那么,即使被试人数很少(60名),因子负载的大小也是比较一致的;如果公共方差水平较低(0.50左右),那么100-200名被试将比较合适。

有些研究者研究则发现,在因子分析中,样本容量达到500为非常好,1000或更多则极好。

一般认为每个观测变量至少需要10名被试[5,6]。

同时,研究者认为,探索性因子分析中每个因子至少应包含4个或是更多的变量才能确保因子被有效的识别[5,7,8];也有研究者认为,观测变量的数目至少应该是公共因子的3-5倍[9];MacCallum等人(1999)[4]研究发现,如果每个因子含有的变量较多,那么排除变量的公共方差的影响之后,一定样本大小的因子分析中,因子分析的结果也会更精确;侯杰泰、成子娟(1999)[10]则建议,在小样本研究中,应尽量争取多一些题目,且不应将题目合成小组。

2.2 因子提取的个数及方法依据相关矩阵提取出因子之后,研究者就必须确定保留多少个因子才是有意义的或是重要的。

SPSS的缺省设置中,采用的是因子特征值≥1.0的标准,这一标准通常被称作K aiser标准。

特征值表示了一个因子所解释的方差数,其值等于因子负载的平方和。

研究者在实际研究中运用的最多的就是这种标准。

另一种取舍因子的标准是碎石检验法(Scree Test Criteri2 on)[11]。

SPSS程序中提供了碎石检验的曲线,一般认为,曲线变平开始前的一个点是提取的最大因子数,该点前的因子就是最后所提取的。

第三种标准是平行分析(Parallel Analysis)[12]。

实际这一方法只是碎石检验法的变异体,除了碎石检验中的散点图,该方法还增添了另一条特征值曲线,这些特征值取自相同变量和被试情况下的一组完全随机数据的因子分析结果。

当真实数据下的特征值小于随机数据特征值时,该点前的因子即为应提取的数目。

探索性因子分析最常用的提取因子的方法有两种:主成分分析法和主轴因子法。

主成分分析法和主轴因子法提取因子的程序基本相同,主要区别在于对观测变量公因子方差的估计不同。

在主成分分析法中,假定所有观测变量的方差都能被公因子所解释,即每个变量的公因子方差都为1.0。

而在主轴因子法中,它的基本假定是观测变量之间的相关能完全被公因子所解释,而变量的方差不一定完全被公因子所解释,所以,在主轴因子法中,公因子方差就不一定是1.0了。

2.3 因子旋转因子旋转的目的是为了便于理解和解释因子的实际意义,主要有两种方式:正交旋转(Orthogonal rotation)和斜交旋转(Oblique rotation)。

正交旋转的基本假定是,因子分析中被提取出来的因子之间是相互独立的,因子间并不相关。

它的目的是要获得因子的简单结构,即使每个变量在尽可能少的因子上有较高的负载;而斜交旋转中,因子间的夹角是任意的,也就是说斜交旋转对因子间是否相关并无限定,这种因子旋转的结果就会使各因子所解释的变量的方差出现一定程度的重叠,因此,比起正交旋转,斜交旋转更具有一般性。

2.4 计算因子值探索性因子分析中,研究者往往会用因子值来代表所提取的因子,因为因子值可以进行更深入的数据分析,这些因子值比起原始变量更有效、可靠,而且比起原始变量间的相关,因子值间相关较低。

值得注意的是,虽然因子值较可靠,但它实质上还是一种观测变量,也就是说它与因子或潜在变量并不完全一致,因此,使用这些因子值来进行的数据分析就会产生细微的随机误差。

3 EFA在教育、心理领域的应用中存在的主要问题及建议 作为一种重要而实用的数学统计方法,探索性因子分析的使用已越来越普遍。

国外学者做了一项相关的统计,结果表明,文献中使用这一方法的比例在不断增加,而且增长的速度也越来越快[3]。

而在国内,虽然总体上文献中探索性因子分析使用的频数并不高,但是这种增长的趋势和国外大体也是一致的[13]。

同时,探索性因子分析运用的领域也在不断的扩大,儿童社会技能[14]、同伴关系、人格发展模型、孤独感等情绪研究,包括心理学中各种行为量表的制定都广泛采用了探索性因子分析的方法。

虽然文献中使用探索性因子分析的比例不断增加,但遗憾的是,在实际研究的应用中,研究者并不能合理、正确的使用这一方法,导致最后的研究结果缺乏可信度。

回顾教育、心理领域中探索性因子分析的运用,主要存在以下一些问题。

3.1 样本容量、观测变量数目不够很多应用探索性因子分析的研究中,普遍存在的一个问题就是样本容量及观测变量数目太小。

探索性因子分析中,一般要求样本容量至少为100-200,当变量的公共方差较大时,则一定数目的小样本也能确保因子负载的稳定性[4]。

国内学者曾做过一项调查,结果表明:1991-2000年国内两种心理学期刊发表的运用因子分析的文章中,有近10%的文章研究样本小于100,甚至有多达50%的文章没有提供这一信息[13]。

而对于观测变量的数目,一般认为,观测变量与所提取的因子数目之比至少为4。

很多研究者认为观测变量的数目并不与被提取的因子数目相关联,因为研究者事先并不知道会有多少个因子被提取出来,因此,无法依据被提取的因子个数对观测变量的数目进行安排,但是,实际上很多研究者在因子分析前对所探讨的观测变量的因子结构已有了一定的预期[3]。

教育、心理领域中,存在着相当数量的研究并未达到这些标准[3,13]。

这或许是由于研究者对因子分析的要旨理解不深,但更有可能的是研究者对这类方法的细节重视不够。

3.2 因子提取方法的误用探索性因子分析中最常用的提取因子的方法主要有两种:主成分分析法和主轴因子法。

决定选用何种方法时,一般有两点值得考虑:一是因子分析的目的;二是对变量方差的了解程度[1]。

如果因子分析的目的是用最少的因子最大程度解释原始数据的方差,则应用主成分分析法;若因子分析的主要孙晓军等:探索性因子分析及其在应用中存在的主要问题1441目的是确定数据结构,则适合用主轴因子法。

实际上,虽然研究者大多认为主成分分析法和主轴因子法的结果差别不大[15,16,17],但是Widman(1993)[18]提出,主轴因子法使用复相关系数的平方作为公共方差的初始估计值,通过不断重复,最后得到确定的公共方差的值,所以,这一过程比起主成分分析法,因子负载就更准确。

因此,他建议研究者最好使用主轴因子法而不是主成分分析法。

但实际研究中,研究者大量使用的是主成分分析法,导致这一结果的最直接可能就是SPSS软件的缺省设置即为主成分分析法。

3.3 因子数目的确定标准及因子旋转中存在的问题心理领域中,研究者运用的确定因子数目的标准大多是K aiser法,即特征值≥1.0的标准。

SPSS中,缺省的提取因子方法就是K aiser法,但实际这一标准仅仅适用于主成分分析法[8]。

Fabrigar等人(1999)[7]提出,特征值≥1.0的标准通常会导致提取过多的因子。

当因子提取过多时,因子的重要性就值得怀疑了。

例如,假设有这样的案例,分别从5个变量和10个变量中提取因子,在5个变量的情况下,特征值为1.0的因子将解释变量总方差的20%(1/5,每个变量的方差估计为1,总方差即为5);相应地,在10个变量的情况下,同样特征值为1.0的因子只能解释总体方差的10%(1/10),显然,当从大量变量中提取因子时,使用这样的标准将导致所提取的因子只能解释总方差很小的一部分。

而碎石检验准则的主观性太强[19],并且,在有些情况下,因子的特征值并没有临界点,因为因子特征值是以一种线性的方式逐渐下降的,所以这种情况是可能存在的,例如双重负荷现象,因此,这种方法并没有太强的使用价值。

相关文档
最新文档