5因子分析

合集下载

因子分析的基本原理包括

因子分析的基本原理包括

因子分析的基本原理包括因子分析是一种常用的多变量统计分析方法,旨在通过分析一组观测变量之间的关系,将这些变量在几个相关的因子上进行归类和降维。

其基本原理包括以下几个方面:1. 共同性和独特性的分解:因子分析假设观测变量可以由一组潜在的因子解释。

观测变量中的共同变异可以归因于这些因子,而个别观测变量的独特变异则与这些因子无关。

因子分析通过将观测变量分解为共同性和独特性来揭示潜在的因子结构。

2. 因子载荷矩阵的确定:因子载荷矩阵反映了观测变量与因子之间的关系强弱。

每个观测变量与每个因子之间都存在一个因子载荷,表示变量对因子的重要性。

通过因子载荷矩阵的确定,可以判断每个因子对于解释观测变量的重要程度。

3. 共同因子的提取:共同因子的提取就是将观测变量的变异分解为共同变异和独特变异的过程。

常用的提取方法有主成分分析和主因子分析等。

主成分分析是按照原始变量的方差来提取因子,而主因子分析则是按照共同度来提取因子。

共同度是指观测变量的变异中可以归因于因子的部分。

4. 因子旋转:因子旋转是将提取出的因子通过线性变换,使得因子载荷矩阵更加简洁和易于解释。

旋转可以使因子之间更具独立性,从而减小因子之间的相关性,同时也能较清晰地刻画因子与观测变量之间的关系。

5. 因子解释:通过因子载荷矩阵和旋转后的因子载荷矩阵,可以对因子进行解释和命名。

因子的名称应与其所代表的变量之间的内在联系相一致,以便于研究者理解和解释因子的含义和意义。

总体而言,因子分析的基本原理是通过潜在的因子结构,将多个观测变量进行降维和分类,从而揭示潜在的内在关系和结构。

因子分析可应用于多个领域,如社会科学、经济学、心理学等,用于识别隐含因子、构建测量工具和降低数据维度,并有助于理解和解释复杂的数据模式和关系。

5-安全因子分析

5-安全因子分析

FATIGUE ANALYSIS IN HYPERLIFE CHAPTER 5: FACTOR OF SAFETY ANALYSISHYPERLIFE疲劳分析内容1.疲劳分析流程及HyperLife界面介绍2.疲劳分析基本概念3.高周疲劳(S-N)4.低周疲劳(E-N)5.安全因子分析6.焊缝疲劳安全因子分析•Dang Van安全因子评价准则•采用HyperLife进行安全因子计算DANG VAN方法介绍•Dang Van方法用来预测结构能否经历无限寿命•可以使用Dang Van方法进行分析的部件包括:➢承受多轴循环载荷的汽车零部件➢螺旋桨轴➢喷气式涡轮叶片DANG VAN CRITERION AND THE FACTOR OF SAFETY (FOS)•安全系数采用Dang Van准则进行分析•Dang Van分析中的安全系数(FOS)的计算为一系列微观偏剪应力(Microscopic Deviatoric Shear Stress )和宏观静应力(Macroscopic Hydrostatic Stress )计算的FOS 值的最小值•FOS计算涉及整个加载历程,将微观偏剪应力和宏观静应力作为时间的函数来计算。

is the Microscopic Shear Stressis the Macroscopic hydrostatic Stressare material constants•如果FOS 小于1,零部件将不能经历无限寿命•当前仅支持Dang Van 方法计算多轴疲劳安全系数•设置有限元模型单位:➢选择有限元模型单位,以便有限元应力到SN曲线应力的转换。

•可采用多种方法定义安全区域•失效线可以指定为一个单一的线段,也可以通过剪切应力与静压力的多个连续连接点(曲线)来指定•可以在“Assign Material ”模块中设置扭转疲劳极限值和静压力灵敏度值•在HyperLife中通过TFL值设置安全边界•TFL 为实数•TFL为曲线•TFL为实数TFL= HSS * HP + τ;When τ = 0, HP = Tfl/ HSSTFL: 扭转疲劳极限, HP:静水压力,T (tau):微观剪应力, HSS:静水压力敏感系数•TFL为曲线➢x值为静水压力,y值为剪切力➢STHETA:安全区角度。

因子分析的数据准备与处理方法(五)

因子分析的数据准备与处理方法(五)

因子分析是一种常用的数据分析方法,用于发现变量之间的潜在关联和结构。

在进行因子分析之前,需要对数据进行准备和处理,以确保结果的有效性和准确性。

本文将重点讨论因子分析的数据准备与处理方法。

1. 数据收集与清洗在进行因子分析之前,首先需要进行数据收集和清洗。

数据的质量对因子分析的结果有着重要的影响,因此在收集数据时应尽量确保数据的完整性和准确性。

同时,对于存在缺失值或异常值的数据,需要进行适当的清洗和处理。

可以通过填充缺失值、删除异常值等方式来处理数据,以确保数据的质量。

2. 变量选择与变换在进行因子分析时,需要选择合适的变量进行分析。

通常情况下,选择的变量应具有一定的相关性和共性,以便发现潜在的因子结构。

同时,对于非正态分布的变量,可以通过变换的方式来使其满足正态分布的要求,例如对数变换、平方根变换等。

3. 相关性分析在进行因子分析之前,需要对变量之间的相关性进行分析。

可以通过相关系数、散点图等方式来评估变量之间的关联程度,以便选择合适的变量进行因子分析。

同时,对于存在高度相关性的变量,可以考虑进行变量合并或剔除,以避免因子分析结果的偏误。

4. 抽样与抽样误差在进行因子分析时,需要考虑抽样的方法和抽样误差对结果的影响。

通常情况下,应尽量避免使用小样本进行因子分析,以防止结果的不稳定性和偏误。

同时,需要对抽样误差进行评估和控制,以确保因子分析结果的准确性和可靠性。

5. 数据标准化在进行因子分析之前,通常需要对数据进行标准化处理。

标准化可以使不同变量之间的量纲统一,以便进行有效的比较和分析。

常用的标准化方法包括Z-score标准化、最大-最小标准化等,可以根据实际情况选择合适的标准化方法进行处理。

6. 因子数确定在进行因子分析时,需要确定合适的因子数。

通常情况下,可以通过特征值、累计方差贡献率等方法来确定因子数。

同时,需要考虑因子数的解释性和实际意义,以确保因子分析结果的有效性和可解释性。

7. 因子旋转在因子分析的结果中,通常会出现因子载荷矩阵。

5因子分析

5因子分析
ห้องสมุดไป่ตู้
华中农业大学数学建模基地 网站
6 因子分析
由于F1、F2与每一个Xi都有关,因此,研究这 5个指标变量之间的关系可以转化为研究这两个潜 在因子之间的关系。 因子分析的基本原理就是依据可测指标变量 之间的相关关系,把一些具有错综复杂关系的变 量归结为少数几个有实际意义的潜在因子,并估 计出潜在因子对可测指标变量的影响程度。
6 因子分析
因子分析模型是主成分分析的推广。它也是利用 降维的思想,由研究原始变量相关矩阵内部的依赖关 系出发,把一些具有错综复杂关系的变量归结为少数 几个综合因子的一种多变量统计分析方法。 因子分析的思想始于1904年Charles Spearman对 学生考试成绩的研究。近年来,随着电子计算机的高 速发展,人们将因子分析的理论成功地应用于心理学、 医学、气象、地质、经济学等各个领域,也使得因子 分析的理论和方法更加丰富。
华中农业大学数学建模基地 网站
data ex842; input objects$ pop school employ services house@@; cards; /*数据省略*/ ; proc factor data=ex842 method=principal rotate=varimax /*rotate表示因子旋转*/ percent=0.8 /*要求累计贡献率大于0.8*/ score outstat=ex1; /*计算因子得分*/ var pop school employ services house; run; proc score data=ex842 score=ex1 out=ex2; var pop school employ services house; run; proc print data=ex1; proc print data=ex2; run;

因子分析案例

因子分析案例

因子分析案例---城市第三产业发展水平综合评价(一)案例教学目的因子分析是一种数据简化的技术。

它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。

这几个假想变量能够反映原来众多变量的主要信息。

原始的变量是可观测的显在变量,而假想变量是不可观测的潜在变量,称为因子。

本案例运用因子分析方法从反映城市第三产业发展水平的20个指标(变量)中抽出5个因子变量对44个城市的第三产业发展水平进行综合评价,分别计算出其因子得分和总得分,揭示出城市第三产业发展的发展状况。

通过本案例的教学,力图使学生加深对因子分析的统计思想和实际意义的理解,明确因子分析方法的适用环境,掌握因子分析软件实现操作方法,提高学生思考、分析和解决实际问题的能力。

(二)案例研究背景近年来,我国城市化进程不断发展,第三产业对经济增长的贡献也不断增大。

城市的第三产业发展状况是城市发展的一个重要方面,也是整个国民经济第三产业的一个重要部分。

对主要城市的第三产业发展状况进行比较和综合评价,可以了解城市第三产业发展状况,为制订相关的产业发展政策,促进地区经济发展提供依据。

(三)案例研究过程1、建立综合评价指标体系城市第三产业发展表现在多个方面,下面选取20项评价指标,具体如下:x1: 人口数x2: GDPx3: 第三产业增加值x4: 货运总量x5: 批、零、商品销售总额x6: 外贸收购总额x7: 年末银行贷款余额x8: 社会零售物价指数x9: 实际利用外资x10: 万名职工拥有科技人员数x11: 旅游外汇收入x12: 第三产业的就业比例x13: 邮电业务总量x14: 职工人均工资x15: 人均居住面积x16: 用水普及率x17: 煤气普及率x18: 人均道路面积x19: 人均公用绿地面积 x20: 政策体制2、数据资料以上20个指标的原始数据取自《城市统计年鉴1993-1994》。

3、因子分析将20个原始指标表示为少数m 个因子与特殊因子的线性组合,因子分析模型为:1111122112211222222020,1120,2220,20m m m m m m X l F l F l F X l F l F l F X l F l F l F εεε=+++⎧⎪=+++⎪⎨⎪⎪=+++⎩ (1) ()1,,m F F F '=称为公共因子,是不可观测向量; ()120,,εεε'=称为特殊因子;()20ij mL l ⨯=称为因子载荷(矩阵),称为第i 个变量在第j 个因子上的载荷。

因子分析法(自己整理)

因子分析法(自己整理)

因子分析法1.因子分析法简介:1)因子分析法的提出“因子分析”的名称于1931年由Thurstone 首次提出,但它的概念起源于二十世纪初Karl Pearson 和Charles Spearmen 等人关于智力测验的统计分析。

近年来,随着电子计算机的高速发展,人们将因子分析方法成功地应用于各个领域,使得因子分析的理论和方法更加丰富。

2)因子分析的定义因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。

因子分析法(Factor Analysis)就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。

运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。

3)与主成分分析的联系主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。

主成分分析一般很少单独使用:a,了解数据。

(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。

(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。

2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。

因子分析中的因子结构验证方法(五)

因子分析中的因子结构验证方法(五)

因子分析是一种常用的数据分析方法,用于发现变量间的潜在结构和关系。

在因子分析中,因子结构验证是非常重要的一部分,它帮助研究人员确定所提取的因子是否能够合理地解释观察到的变量之间的关系。

本文将介绍因子分析中的因子结构验证方法,并探讨其在实际研究中的应用。

一、探索性因子分析探索性因子分析是一种旨在探索变量之间潜在结构的方法。

在这种分析中,研究人员首先提取潜在因子,并根据因子载荷矩阵来解释这些因子和变量之间的关系。

在因子结构验证中,研究人员通常会使用各种统计方法来确定所提取的因子是否合理。

二、验证性因子分析验证性因子分析是用于验证由探索性因子分析提取的因子结构的方法。

在这种分析中,研究人员会根据理论假设提出一个模型,并使用统计方法来检验这个模型是否与观察数据相匹配。

常用的检验方法包括卡方检验、比较拟合指数(CFI)、增量拟合指数(IFI)等。

三、因子旋转因子旋转是一种常用的因子结构验证方法,它旨在提高因子载荷的解释性和可解释性。

常用的因子旋转方法包括方差最大化旋转(VARIMAX)、等方差最小化旋转(EQUAMAX)、极大似然旋转等。

通过因子旋转,研究人员可以更清晰地解释所提取的因子结构,从而提高研究结果的可信度。

四、交叉验证交叉验证是一种常用的因子结构验证方法,它通过将样本数据随机分成两个部分,一部分用于提取因子结构,另一部分用于验证提取的因子结构。

通过交叉验证,研究人员可以确保所提取的因子结构是稳健的,并且具有较好的泛化能力。

五、拆分样本验证拆分样本验证是一种常用的因子结构验证方法,它通过将样本数据分成两个部分,一部分用于提取因子结构,另一部分用于验证提取的因子结构。

拆分样本验证可以帮助研究人员检验因子结构在不同样本中的稳定性,从而提高研究结果的可信度。

六、交叉验证因子分析交叉验证因子分析是一种结合了交叉验证和验证性因子分析的方法,它旨在提高因子结构验证的稳健性和泛化能力。

通过交叉验证因子分析,研究人员可以在保证模型的合理性的同时,确保因子结构具有较好的泛化能力,从而提高研究结果的可信度。

因子分析原理

因子分析原理

因子分析原理因子分析是一种常用的统计方法,用于研究多个变量之间的相关关系。

它通过将多个观测变量转换成少数几个潜在因子,来揭示数据中存在的内在结构。

本文将介绍因子分析的基本原理及应用。

一、因子分析的基本原理因子分析的基本原理是通过对变量之间的相关性进行分析,找出可以解释数据变异的共同因素。

在进行因子分析前,需要满足以下三个假设:1. 变量之间存在线性关系:这意味着变量之间的相关性可以用线性函数来描述。

2. 变量间的相关性可以通过几个因子来解释:这表示数据中存在着少数几个共同因素,它们导致了变量之间的相关性。

3. 每个变量受到一个因子和一个特殊因素的影响:这表明每个变量的观测值可以由一个公共因子和一个特殊因素的线性组合来表示。

在因子分析中,有两种主要的因子提取方法:1. 主成分分析(Principal Component Analysis,简称PCA):它通过寻找最能解释数据变异的线性组合来提取因子。

这些线性组合被称为主成分,它们是原始变量的一种线性转换。

2. 最大似然估计(Maximum Likelihood Estimation,简称MLE):它假定变量之间的相关性符合多元正态分布,并基于这个假设来估计因子参数。

二、因子分析的应用1. 数据压缩因子分析可以将一大批变量转化为少数几个因子,从而实现对数据的压缩。

这对于处理大规模数据或减少变量数量有很大帮助,同时也便于后续的数据分析和解释。

2. 维度识别因子分析可以用于识别变量背后的潜在维度。

例如,在心理学研究中,通过对多个心理量的因子分析可以找到反映各种人格特征、心理状态或行为倾向的潜在因子。

3. 建立测量工具因子分析可以用于构建测量工具,例如问卷调查中的问卷量表。

通过分析问卷中各个问题的共性和相关性,可以归纳出少数几个潜在因子,并将其作为测量工具的维度。

4. 风险管理在金融领域,因子分析可以用于评估和管理投资组合的风险。

通过分析各个资产间的相关性,可以找到可以解释投资组合变动的风险因子,并据此进行风险控制和资产配置。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2、因子特征值及百分比
Initial Eigenvalues Compon er Craction Sums of Squared Loadings Rotation Sums of Squared Loadings
Total
% of Varia nce 31.900 15.933 13.402 10.139 8.536 8.024 6.856 5.209
2、基本步骤: 1)选择基础变量,并对基础变量的适合状况 进行分析(相关关系测量); 2)从基础变量中提取因子(公共因子法与主 成分法),涉及因子个数判别,因子个数应 少于基础变量; 3)进行因子旋转,即通过坐标变换使因子两 两独立,以得到更合理的因子解。不旋转, 因子负荷有时可能过分偏低。可注意对比转 轴前后的因子负荷矩阵; 4)计算每个样本在各个因子上的因子得分, 该得分即是每个样本在各因子变量上的取值。
• 重要概念: 因子负荷是一个矩阵,表示公因子与基 础变量间的相关系数。负荷大,表示 该公因子与某基础变量间存在较大关 系。观察负荷矩阵,可以看出公因子 在哪些变量上有较大负荷,可以据此 说明公因子的实际含义。若矩阵缺乏 规律,不能看出某个含义,还需要进 行因子旋转,(增加因子变量)以求得更好 的解释。
五、因子分析应用范例 1、问卷题目删留情况: 问卷的第三部分关于“群体身份认同”的调查采用里克特五 等级尺度总加量表,在问卷录入时,根据回答强态度的强 弱对回答结果进行赋值,具体赋值情况是:完全不同意为1, 有点不同意为2,说不清为3,基本同意为4,完全同意为5。 项目分析的目的是为了对项目进行筛选和修订,项目的选 择采用双重标准,首先计算项目鉴别系数,然后计算单项 与总分的相关系数。项目鉴别度的计算公式为:项目鉴别 指数=(RH-RL)/N 在此公式中,RH表示高分组在每个项目上的平均得分(高分 组之和除以N),RL表示低分组在每个项目上的平均得分 (低分组之和除以N),N表示抽出的项目数。从数据分析 结果看,有2项的鉴别指数达不到0.25(第21题和第26题), 首先删除;再进行单项与总分的相关系数计算(本量表采 用Pearson相关系数),结果显示有一项(第25题)相关系 数达不到显著性程度(P<0.05),最后保留8项。
三、SPSS因子分析操作与结果解释 analyze——data reduction——factor 1、选择并描述基础变量,并对基础变量进 行检验判断: Descriptives 对话框 Univariate descriptives:单变量描述统计 量,输出各基础变量的均值和标准差; coefficients:输出基础变量间的相关系数 矩阵,注意各值是否大于0.3; KMO and Bartlett’s test of sphericity:输 出检验显著度及KMO值。
对话框中选择display factor score coefficient matrix将输出: Component score coefficient matrix因子 得分函数系数矩阵,据此矩阵可写出各 公因子的线性表达式。
四、因子分析结果与其他分析方法的结合 主要依赖因子变量。注意因子变量是标准 化的变量。 因子变量成为因变量; 因子变量成为自变量; 因子变量成为分析变量,如根据因子变量 进行聚类。 (因子分析是下一步分析的起点,不是终点,而聚类是终点)
Extract:控制提取过程和提取结果。 Eigenvalues over中默认值为1,即提取特 征值(根)大于1的因子(小于1,说明该 因子解释力度还不如直接引入一个原变量 的平均解释力度大);利用number of factors可指定提取因子的数目。 Display:结果显示。Unrotated factor solution默认输出未经旋转的因子提取结果。
2、提取因子 两种方法:主成分法与公共因子法(数学原 理完全不同,具体的差异可见郭P101102)。早期人们使用主成分法,它对变 量的分布没有要求。后期发展出因子法, 更灵活有效。 Extraction因子提取对话框 Method中的principal components即为主成 分法,为系统默认; 如果数据良好,则各个方法提取因子的结果 相同;若样本数超过1500,极大似然法会 更精确;若数据不好,后两种方法更适用; 如果条件不明,仍用主成分法。
4、从因子分析结果出发形成的路径分析图
0.310 品牌考虑 0.860
u
身份区隔感
0.397 0.755
广告兴趣
0.279 =0.50ຫໍສະໝຸດ 0.433w=0.516
身份符合感
0.281
外观设计
身份紧张感
0.120 流行时尚 0.746
0.818
v
0.214
结果表明,身份区隔感对大多数消费符号存在影响,而且是直接 性的,它对品牌、广告以及时尚的作用强度分别达到0.310、 0.397和0.279,这说明大学生在进行电子产品消费时受到所在 群体的影响,他们消费的欲望更多的来源于符号价值的需求 而不是使用价值的需要。一件商品,越是能体现消费者的社 会品味和身份,越是能将消费者与他人区分开来,就越是受 到大学生们的喜爱。 身份符合感和身份区隔感存在相关,达到0.502,身份符合感与 广告兴趣和外观设计两者的相关系数分别为0.433和0.281,通 过广告的宣传渲染、外观设计的强化的推动,这种对于融入 群体的身份符合感也就越强,因此,在身份符合方面,大学 生们更多的把目光转向了外观设计和流行时尚。 在身份紧张感方面,由于身份紧张感在某种程度上可以看作是身 份区隔感和身份紧张感的缩影,因此相关系数仅为0.120和 0.214,比较合理的解释是大学生在电子产品消费中考虑更多 的是品牌和外观,通过这种外在的表现,能够帮助大学生在 心理上获得一种群体隶属来与他人“相称”或者使自己的身 份地位得到群体的承认,主要通过炫耀性消费来表现。上述 结果表明,大学生群体身份认同对电子产品消费的符号性的 影响更多属于是直接性的,而且是显著的。
例,结构效度 情绪及情绪应对量表: 1=完全没有 2=很少有 3=有时有 4=经常有 5=每 天都有 1 我感到愉快 2 我感到郁闷 3 我情绪不好时会想办法让自己高兴起来 4 我感到自己不知怎么做才好 5 我感到有压力 6 我想哭就哭,我哭出来感觉好多了 7 我感到没人能帮助我
8 我感到精力旺盛 9 我感到轻松 10 我会把烦心的事情放在心里 11 我遇到不高兴的事总是难以忘掉 12 我把烦心事说给别人听,之后感觉好多了 13 我感到紧张 14 我感到疲乏 积极情绪:1、8、9 消极情绪:2、4、5、7、13、14 外向应对:3、6、12 内向应对:10、11
4、计算每个样本在各个因子上的因子得分 Scores对话框 Save as variables (regression方法)。 即可在数据库中将因子存为单独的变量, 每个样本在该变量上的取值为因子得分, 是根据因子得分矩阵的线性方程计算得 出的。 这些因子变量及其取值存储在数据库中, 以便在其他分析中直接使用。
3)数据样本量应达到一定水平 一般要求样本量至少是变量数的5倍以上, 最好达到10倍以上; 理论上要求样本量不应该少于100。样本量 越大越好。 4)社会学中多见李克特量表(五级)用于 因子分析,使用时应注意该量表应具有一 定的鉴别力(鉴别力不强的要删掉,即某一问题的回答基 本一致),否则因子分析效果不佳。
Total
% of Varia nce 27.972 18.914 14.349 ------
Cumulative % 27.972 46.886 61.235 ------
1 2 3 4 5 6 7 8
2.552 1.275 1.072 0.811 0.683 0.642 0.548 0.417
2.552 1.275 1.072 ------
3、进行因子旋转,进一步明确因子组合。 旋转并不改变因子分析的整体结果,只是影 响各因子在各个变量上的载荷分布,并影 响各因子的贡献率。 Rotation对话框。SPSS提供5种旋转方法。 最常用的是Varimax方差最大正交旋转,其 次为Quartimax四次方最大正交旋转。 斜交旋转需要指明角度,一般不用。正交表 示各变量间两两独立,斜交则有一定相关 性。 确定旋转后将输出旋转后的因子负荷表。
独立用,做单变量;做双变量)
因子分析独立使用时通过少量的因子可以更 清楚地把握诸多变量的本质,另外它常是 一种数据整理或准备。
具体作用: 1)有些变量实际观察不到,但又确实发挥影响, 如价值观、能力、爱好等,只能使用抽象的 因子来测量; 2)变量太多,需要简化; 3)多元回归(毛病:自变量的相关性不能太强)中常出现多 重共线性,需要去掉一些变量,但无法有充 分理由选择去除某个变量,故可将这些变量 合并成因子,使用因子代替原有变量进行回 归分析,即无多重共线性。如将收入和受教 育程度合并为社会经济地位(SES)一个变量; 4)评价问卷的结构效度;
2.238 1.513 1.148 ------
3、旋转与解释 将因子负荷矩阵进行正交旋转(Component Matrix),通过改变 坐标轴位置,重新分配各因子所解释方差的比例,使因子结构 更简单,更易于解释。
题号及 因子 名 因子1 C5 C6 C7 因子2 C1 (身份区隔感): 若条件允许,我也想跟其他同学一样买昂贵的信息产品 我们青年人在购买产品时总是首先考虑它的时尚元素 题项
5)在路径分析模型(缺乏总的解释力)向 结构方程模型Lisrel(可以有总解释力) 转化中,潜在变量的影响作用常需作因子 处理(因为太多了),结构分析因此由回归 和因子分析组成。 如经典的研究子女收入的路径分析中,子 女教育程度被单向认为是决定子女收入的, 但实际上子女收入也会反过来影响子女教 育程度,且在子女收入上除教育程度外, 个人各种能力也会影响收入,这时只能使 用结构分析模型,个人能力影响部分就需 先作因子分析。
二、因子分析的数据要求和基本步骤 1、数据要求: 1)进行因子分析的各基础变量应是定距变 量,虚拟变量可以同时引入,但结果可 能不好(Why?数量级的影响); 2)各基础变量间应存在较强的相关关系。 可以计算各变量的相关矩阵(两两变量之间的 相关系数),最好相关矩阵中的所有相关系 数大于0.3;SPSS提供巴雷特球体检验和 KMO值,要求检验通过且KMO值大于 0.5,否则不能进行因子分析,KMO值大 于0.9时效果最好 。
相关文档
最新文档