基于因子分析的人均消费性支出研究

基于因子分析的人均消费性支出研究
基于因子分析的人均消费性支出研究

基于因子分析的人均消费性支出研究

[摘要] 针对全国31个省(市)的人均消费性支出情况,利用因子分析方法来探究其内部影响因素,经分析得出是由居民基本需求消费因子(F1)和居民生活质量因子(F2)的共同影响。最后,以因子得分为依据对各省(市)的消费情况进行排序和综合评价,进而提出政策性建议。

[关键词] 人均消费性支出因子分析综合评价

人均消费性支出(Per capita consumption expenditure)是指政府以消费者身份在市场上购买所需商品和劳务所发生的支出。消费支出可分为公共消费支出和个人消费支出两部分。而消费的不平衡性直接导致物价不平稳趋势不断加重,严重的影响居民的生活质量,增加生活压力。

基于此,在国内外对人均消费性支出的研究也是层出不穷。而大部分都是定位于政策性的导向研究[1,2],定量性研究[3-5]相对较少。本文主要利用因子分析方法,从多指标体系中提取公共的影响因子来定量性的实证研究。但因子分析的方法是比较单一的,对实际问题的处理还不够理想,因此本文在此种缺点上,把主成分思想有机的渗透于因子分析方法中。

为了对地方政府人均消费性支出的差异研究,本文考察31个省(市)的人均消费性支出相关的8项指标,并对其数据进行整理分析。发现各省(市)的人均消费性支出指数的相对差异,采用因子分析法探究差异的具体原因[4]。最后对全国的人均消费性支出的影响作出综合评价。

一、各省(市)的人均消费性支出的指标、数据和研究方法

1、数据来源、指标确定及软件选取

为了考察31个省(市)的人均消费性支出状况,选取2011年第一季度的数据[6]及相关指标作为研究的指标体系。其中有8个指标:食品(X1)/元、衣着(X2)/元、居住(X3)/元、家庭设备用品及服务(X4)/元、医疗保健及用品(X5)/元、交通和通信(X6)/元、教育文化娱乐服务及用品(X7)/元、其他商品和服务(X8)/元。同时,本文采用SPSS软件[7]对相关的数据进行分析处理,且从样本的相关系数矩阵作为研究的出发点。

2、基于主成分分析的因子分析法[8]

因子分析方法的主要功能是浓缩数据,把一个复杂的系统简单化,将多指标问题转化为少数的几个因子,进而建立一个有效的因子模型。在本文中就是利用因子分析方法将8个指标综合为2个公共因子,对整个系统进行综合评价。在这个过程中,因子的选取是至关重要的,对此利用主成分法提取必要的因子,同时利用正交方法按方差最大化原则进行旋转使因子结构更加的简单化,从而更能够

SPSS探索性因子分析报告地过程

现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示: 问题 题项 从未使用 很少使用 有时使用 经常使用 总是使用 1 2 3 4 5 a1 电脑 a2 录音磁带 a3 录像带 a4 网上资料 a5 校园网或因特网 a6 电子邮件 a7 电子讨论网 a8 CAI 课件 a9 视频会议 a10 视听会议 一.因子分析的定义 在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型 i m im i i i i U F F F F Z +++++=αααα · · · 332211 i Z 为第i 个变量的标准化分数;(标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的 那批分数中的相对位置的。) m F 为共同因子; m 为所有变量共同因子的数目; i U 为变量i Z 的唯一因素; im α为因子负荷。(也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关系数,它反映了第i 个变量在 第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。) 因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数,也就是i Z 在第m 个共同因子变量上的相

Amos_验证性因子分析步步教程

应用案例1 第一节模型设定 结构方程模型分析过程可以分为模型构建、模型运算、模型修正以及模型解释四个步骤。下面以一个研究实例作为说明,使用Amos7软件2进行计算,阐述在实际应用中结构方程模型的构建、运算、修正与模型解释过程。 一、模型构建的思路 本案例在著名的美国顾客满意度指数模型(ASCI)的基础上,提出了一个新的模型,并以此构建潜变量并建立模型结构。根据构建的理论模型,通过设计问卷对某超市顾客购物服务满意度调查得到实际数据,然后利用对缺失值进行处理后的数据3进行分析,并对文中提出的模型进行拟合、修正和解释。 二、潜变量和可测变量的设定 本文在继承ASCI模型核心概念的基础上,对模型作了一些改进,在模型中增加超市形象。它包括顾客对超市总体形象及与其他超市相比的知名度。它与顾客期望,感知价格和顾客满意有关,设计的模型见表7-1。 模型中共包含七个因素(潜变量):超市形象、质量期望、质量感知、感知价值、顾客满意、顾客抱怨、顾客忠诚,其中前四个要素是前提变量,后三个因素是结果变量,前提变量综合决定并影响着结果变量(Eugene W. Anderson & Claes Fornell,2000;殷荣伍,2000)。 表 2.1、顾客满意模型中各因素的具体范畴 参考前面模型的总体构建情况、国外研究理论和其他行业实证结论,以及小范围甄别调查的结果,模型中各要素需要观测的具体范畴,见表7-2。 1关于该案例的操作也可结合书上第七章的相关内容来看。 2本案例是在Amos7中完成的。 3见spss数据文件“处理后的数据.sav”。

三、关于顾客满意调查数据的收集 本次问卷调研的对象为居住在某大学校内的各类学生(包括全日制本科生、全日制硕士和博士研究生),并且近一个月内在校内某超市有购物体验的学生。调查采用随机拦访的方式,并且为避免样本的同质性和重复填写,按照性别和被访者经常光顾的超市进行控制。问卷内容包括7个潜变量因子,24项可测指标,7个人口变量,量表采用了Likert10级量度,如对 四、缺失值的处理 采用表列删除法,即在一条记录中,只要存在一项缺失,则删除该记录。最终得到401条数据,基于这部分数据做分析。 五、数据的的信度和效度检验 1.数据的信度检验 4正向的,采用Likert10级量度从“非常低”到“非常高”

探索性因子分析法.doc

探索性因子分析法(Exploratory Factor Analysis,EFA) 目录 [隐藏] ? 1 什么是探索性因子分析法? ? 2 探索性因子分析法的起源 ? 3 探索性因子分析法的计算 ? 4 探索性因子分析法的运用 ? 5 探索性因子分析法的步骤 ? 6 探索性因子分析法的优点 ?7 探索性因子分析法的缺点 ?8 探索性因子分析法的假定 ?9 EFA在教育、心理领域存在的问题及建议[1] ?10 参考文献 [编辑] 什么是探索性因子分析法? 探索性因子分析法(Exploratory Factor Analysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。因而,EFA能够将将具有错综复杂关系的变量综合为少数几个核心因子。 [编辑] 探索性因子分析法的起源 因子分析法是两种分析形式的统一体,即验证性分析和纯粹的探索性分析。英国的心理学家Charles Spearman在1904年的时候,提出单一化的智能因子(A Single Intellectual Factor)。随着试验的深入,大量个体样本被分析研究,Spearman的单一智能因子理论被证明是不充分的。同时,人们认识到有必要考虑多元因子。 20世纪30年代,瑞典心理学家Thurstone打破了流行的单因理论假设,大胆提出了多元因子分析(Multiple Factor Analysis)理论。 Thurstone 在他的《心智向量》(Vectors of Mind, 1935)一书中,阐述了多元因子分析理论的数学和逻辑基础。 [编辑] 探索性因子分析法的计算

在运用EFA法的时候,可以借助统计软件(如SPSS统计软件或SAS统计软件)来进行数据分析。 [编辑] 探索性因子分析法的运用 1、顾客满意度调查。 2、服务质量调查。 3、个性测试。 4、形象调查。 5、市场划分识别。 6、顾客、产品及行为分类。 [编辑] 探索性因子分析法的步骤 一个典型的EFA流程如下: 1、辨认、收集观测变量。 2、获得协方差矩阵(或Bravais-Pearson的相似系数矩阵) 3、验证将用于EFA的协方差矩阵(显著性水平、反协方差矩阵、Bartlett 球型测验、反图像协方差矩阵、KMO测度)。 4、选择提取因子法(主成分分析法、主因子分析法)。 5、发现因素和因素装货。因素装货是相关系数在可变物(列在表里)和因素(专栏之间在表里)。 6、确定提取因子的个数(以Kaiser准则和Scree测试作为提取因子数目的准则)。 7、解释提取的因子(例如,在上述例子中即解释为“潜在因子”和“流程因子”)。 [编辑]

AMOS做验证性因子分析

Amos模型设定操作 在使用AMOS进行模型设定之前,建议事先在纸上绘制出基本理论模型和变量影响关系路径图,并确定潜变量与可测变量的名称,以避免不必要的返工。 1.绘制潜变量 使用建模区域绘制模型中的潜变量,在潜变量上点击右键选择Object Properties,为潜变量命名。 2.为潜变量设置可测变量及相应的残差变量 使用绘制。在可测变量上点击右键选择Object Properties为可测变量命名。其中Variable Name对应的是数据的变量名,在残差变量上右键选择Object Properties为残差变量命名。

3.配置数据文件,读入数据 File——Data Files——File Name——OK。 4.模型拟合 View——Analysis Properties——Estimation——Maximum Likelihood。 5.标准化系数 Analysis Properties——Output——Standardized Estimates——因子载荷标准化系数。

6.参数估计结果 Analyze——Calculate Estimates。红色框架部分是模型运算基本结果信息,点击View the Output Path Diagram查看参数估计结果图。 7.模型评价 点击查看AMOS路径系数或载荷系数以及拟合指标评价。 路径系数/载荷系数的显著性 模型评价首先需要对路径系数或载荷系数进行统计显著性检验。 模型拟合指数 模型拟合指数是考察理论结构模型对数据拟合程度的统计指标。拟合指数的作用是考察理论模型

与数据的适配程度,并不能作为判断模型是否成立的唯一依据。拟合优度高的模型只能作为参考,还需要根据所研究问题的背景知识进行模型合理性讨论。

SPSS探索性因子分析的过程

SPSS探索性因子分析的过程

现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示: 一. 因子分析的定义

在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二. 数学模型 Z i i1F1 i2^ i3F3 …im F m U i 乙为第i个变量的标准化分数;(标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。) F m为共同因子; m为所有变量共同因子的数目; U为变量Z的唯一因素; i个变量与第im为因子负荷。(也叫因子载荷,统计意义就是第 m个公共因子的相关系数,它反映了第i个变量在第m个公共因子上的相对重要性也就是第m个共同因子对第i个变量的解释程

度。) 因子分析的理想情况,在于个别因子负荷im不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则U彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷.就是第i个原有变量和第m个因子变量间的相关系数,也就是Z在第m个共同因子变量上的相对重要性,因此,.绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针:一为“共同性”,二为“特征值”。 所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于0.8,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能

Amos-验证性因子分析步步教程

Amos-验证性因子分析步步教程

超市形象质量期望 质量感知感知价值顾客满意 顾客抱怨 顾客忠诚 应用案例1 第一节模型设定 结构方程模型分析过程可以分为模型构建、模型运算、模型修正以及模型解释四个步骤。下面以一个研究实例作为说明,使用Amos7软件2进行计算,阐述在实际应用中结构方程模型的构建、运算、修正与模型解释过程。 一、模型构建的思路 本案例在著名的美国顾客满意度指数模型(ASCI)的基础上,提出了一个新的模型,并以此构建潜变量并建立模型结构。根据构建的理论模型,通过设计问卷对某超市顾客购物服务满意度调查得到实际数据,然后利用对缺失值进行处理后的数据3进行分析,并对文中提出的模型进行拟合、修正和解释。 二、潜变量和可测变量的设定 本文在继承ASCI模型核心概念的基础上,对模型作了一些改进,在模型中增加超市形象。它包括顾客对超市总体形象及与其他超市相比的知名度。它与顾客期望,感知价格和顾客满意有关,设计的模型见表7-1。 模型中共包含七个因素(潜变量):超市形象、质量期望、质量感知、感知价值、顾客满意、顾客抱怨、顾客忠诚,其中前四个要素是前提变量,后三个因素是结果变量,前提变量综合决定并影响着结果变量(Eugene W. Anderson & Claes Fornell,2000;殷荣伍,2000)。 表7-1 设计的结构路径图和基本路径假设 设计的结构路径图基本路径假设 超市形象对质量期望有路径影响 质量期望对质量感知有路径影响 质量感知对感知价格有路径影响 质量期望对感知价格有路径影响 感知价格对顾客满意有路径影响 顾客满意对顾客忠诚有路径影响 超市形象对顾客满意有路径影响 超市形象对顾客忠诚有路径影响 2.1、顾客满意模型中各因素的具体范畴 参考前面模型的总体构建情况、国外研究理论和其他行业实证结论,以及小范围甄别调查的结果,模型中各要素需要观测的具体范畴,见表7-2。 1关于该案例的操作也可结合书上第七章的相关内容来看。 2本案例是在Amos7中完成的。 3见spss数据文件“处理后的数据.sav”。

amos_验证性因子分析报告步步教程

一、潜变量和可测变量的设定 本文在继承ASCI模型核心概念的基础上,对模型作了一些改进,在模型中增加超市形象。它包括顾客对超市总体形象及与其他超市相比的知名度。它与顾客期望,感知价格和顾客满意有关,设计的模型见表7-1。 模型中共包含七个因素(潜变量):超市形象、质量期望、质量感知、感知价值、顾客满意、顾客抱怨、顾客忠诚,其中前四个要素是前提变量,后三个因素是结果变量,前提变量综合决定并影响着结果变量(Eugene W. Anderson & Claes Fornell,2000;殷荣伍,2000)。 表 因此数据的效度检验就转化为结构方程模型评价中的模型拟合指数评价。对于本案例,从表7-16可知理论模型与数据拟合较好,结构效度较好。 二、结构方程模型建模 构建如图7.3的初始模型。

图7-3 初始模型结构 图7-4 Amos Graphics 初始界面图 第一节 Amos 实现1 一、 Amos 模型设定操作 1 这部分的操作说明也可参看书上第七章第二节:Amos 实现。

1.模型的绘制 在使用Amos进行模型设定之前,建议事先在纸上绘制出基本理论模型和变量影响关系路径图,并确定潜变量与可测变量的名称,以避免不必要的返工。相关软件操作如下:第一步,使用建模区域绘制模型中的七个潜变量(如图7-6)。为了保持图形的美观,可以使用先绘制一个潜变量,再使用复制工具绘制其他潜变量,以保证潜变量大小一致。 在潜变量上点击右键选择Object Properties,为潜变量命名(如图7-7)。绘制好的潜变量图形如图7-8。 第二步设置潜变量之间的关系。使用来设置变量间的因果关系,使用来设置变量间的相关关系。绘制好的潜变量关系图如图7-9。 图7-7 潜变量命名 图7-8 命名后的潜变量

探索性因子分析及其在应用中存在的主要问题

探索性因子分析及其在应用中存在的主要问题 Ξ 孙晓军ΞΞ 周宗奎 (华中师范大学心理学院,武汉,430079) 摘 要 探索性因子分析的发展非常迅速,已成为教育与社会心理学领域中最常用的统计方法之一。本文全面介绍了探索性因子分析的基本原理,阐述了其发生的机制及基本过程,对其在教育、心理领域应用中存在的问题进行了总结,并针对应用中样本容量和观测变量数目不够、因子求解方法的误用、因子数目的确定标准及因子旋转中存在的问题、因子值缺乏重复验证性、研究结果呈现形式不规范、过于依赖SPSS 、缺乏主动性等问题提出了一些相应的建议。关键词:探索性因子分析 因子旋转 因子值 因子分析(Factor Analysis )是通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量(因子)来表示基本的数据结构的方法[1]。1904年,查尔斯?斯皮尔曼(Charles Spearman )在研究智力时首次采用了因子分析的方法,将因子分析方法运用于实践[2]。随后,因子分析的理论和数学基础逐步得到发展和完善,特别是50年代以后,随着计算机的普及和各种统计软件的出现,因子分析得到了巨大的发展。现在,因子分析已成为教育与社会心理学领域研究中最常用的统计方法之一。但令人遗憾的是,在实际研究的应用中,研究者并不能合理、正确的使用这一方法,导致最后的研究结果缺乏可信度。 本文的目的就是通过对探索性因子分析发生原理、步骤的详细探讨,结合其在应用中存在的问题,希望对心理领域中探索性因子分析的运用提出一些实质性的建议,包括样本大小、因子数目、观测变量数目、因 子旋转等等。 1 探索性因子分析的基本原理 探索性因子分析模型(见图1)的一般表达形式为: X 1=w 11F 1+w 21F 2+……w n1F n +w 1U 1+e 1 其中,X n 表示观测变量,F M 代表因子分析中最基本的公因子(Common factor ),它们是各个观测变量所共有的因子,解释了变量之间的相关;U n 代表特殊因子(Unique factor ),它是每个观测变量所特有的因子,相当于多元回归分析中的残差项,表示该变量不能被公因子所解释的部分;w M 代表因子负载(Factor loading ),它是每个变量在各公因子上的负载,相当于多元回归分析中的回归系数;而e n 则代表了每一观测变量的随机误差。 图1 探索性因子分析模型(来源:郭志刚,1999) 探索性因子分析的过程实质就是寻求F 1、F 2、......F m 等少数几个公因子以构建因子结构来最大限度地表示所有变量的信息[3]。在探索性因子分析中,一个重要的假设就是所 有的特殊因子间及特殊因子与公因子间是彼此独立、不相关的。 ΞΞΞ通讯作者:孙晓军,男。E 2mail :sxj -ccnu @https://www.360docs.net/doc/ff4877575.html, 本研究得到国家自然科学基金资助,项目号30270473。1440 心理科学 Psychological Science 2005,28(6):1440-1442

验证性因子分析思路总结

目录 验证性因子分析 (1) 分析步骤 (3) (1)模型设定 (4) (2)模型拟合 (4) ( 3 )模型修正 (6) (4)模型分析 (9) 验证性因子分析,是用于测量因子与测量项(量表题项)之间的对应关系是否与研究者预测保 持一致的一种研究方法。尽管因子分析适合任何学科使用,但以社会科学居多。 目前有很多软件都可以非常便利地实现验证性因子分析,本文将基于SPSSAU系统进行说明。 验证性因子分析

Step1:因子分析类型 因子分析可分为两种类型:探索性因子分析(EFA)和验证性因子分析(CFA)。 探索性因子分析,主要用于浓缩测量项,将所有题项浓缩提取成几个概括性因子,达到减少分析次数,减少重复信息的目的。 验证性因子分析与探索性因子分析相似,两者区别只在于探索性因子分析(EFA)用于探索因 子与测量项之间的对应关系,验证性因子分析(CFA)用于验证结果与理论预期是否一致。 Step2:分析思路 在实际研究中,验证性因子分析常会与结构方程模型、路径分析等方法联系到一起,对于不 熟悉概念的研究人员容易搞混这些方法,下表对这几种方法进行简单说明:

探索性因子分析(EFA)验证性因子分析(CFA )研究测量关系研究测量关系 回归分析研究自变量对一个因变量的影响关系 路径分析研究多个自变量与多个因变量之间的影响关系 适用于非经典量表 适用于经典量表 y 为定量数据 可先用CFA/EFA 确定因子与研究项关系,再进行路径分析 结构方程模型包括两部分: 结构方程模型研究影响关系及测量关系 验证性因子分析和路径分析

探索性因子分析:验证因子与分析项的对应关系,索性因子分析。 验证性因子分析:验证因子与分析项的对应关系,性因子分析。确认测量关系后,后续可进行路径分析系。检验量表效度,非经典量表通常用探 检验量表效度,成熟量表通常用验证 / 线性回归分析研究具体的影响关 路径分析:用于研究多个自变量与多个因变量影响关系;如果因变量只有一个,可以使用线性回归分析。 结构方程模型SEM:包括测量关系和影响关系。如果仅包括影响关系,此时称作路径分析 (Path analysis,有时也称通径分析)。通常需要进行探索性因子分析和验证性因子分析, 均保证测量关系无误之后,再进行结构方程模型构建。 从分析思路上看,建议先用探索性因子分析EFA构建模型,确定存在几个因子及各分析项与因子的 对应关系,再用验证性因子分析CFA加以检验。 Step3:SPSSAU操作 分析步骤

因子分析方法

因子分析法 1. 因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较 密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不 可观测的,即不是具体的变量) ,以较少的几个因子反映原资料的大部分信息。运用这种研究技 术,我们可以方便地找岀影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响 力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 因子分析法与其他一些多元统计方法的区别: 2?主成分分析 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析 来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简 化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释各变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumpti on s),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子( specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定( spss根据一定的条件自动设定,只要是特征 值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技 术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进 行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的 变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息) 来进入后续的分析,则可 以使用主成分分析。当然,这种情况也可以使用因子得分做到。所以这种区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单 独使用:a,了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份 发对变量简化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

SPSS探索性因子分析的过程

一.因子分析的定义 在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型 i m im i i i i U F F F F Z +++++=αααα · · · 332211 i Z 为第i 个变量的标准化分数; (标准分是一种由原始分推导出来的相对地位量数,它是用来说明原始分在所属的那批分数中的相对位置的。) m F 为共同因子; m 为所有变量共同因子的数目;

i U 为变量i Z 的唯一因素; im α为因子负荷。 (也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关系数,它反映了第i 个变量在第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。) 因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数,也就是i Z 在第m 个共同因子变量上的相对重要性,因此,im α绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针:一为“共同性”,二为“特征值”。 所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能被因子变量所能解释的部分。 所谓特征值,是每个变量在某一共同因子的因子负荷的平方总和(一直行所有因子负荷的平方和),在因子分析的的共同因子抽取中,特征值最大的共同因子会最先被抽取,其次是次大者,最后抽取的共同因子的特征值会最小,通常会接近于0。将每个共同因子的特征值除以总题数,为此共同因子可以解释的变异量,因子分析的目的之一,即在因素结构的简单化,希望以最少的共同因子能对总变异量做最大的解释,因而抽取的因素越少越好,但抽取的因子的累积变异量越大越好。 三.SPSS 中实现过程 (一)录入数据 (二)因子分析 1.在菜单栏中依次单击“分析”|“降维”|“因子分析”选项卡,打开如图所示“因子分析”对话框。从原变量量表中选择需要进行因子分析的变量,然后单击箭头按钮将选中的变量选入“变量”列表中。“变量列表”的变量为要进行因子分析的的目标变量,变量在区间或比率级别应该是定量变量。分类数据(如:性别等)不适合因子分析。 2.“描述按钮”:主要设定对原始变量的基本描述并对原始变量进行相关性分析。

SPSS探索性因子分析的过程

S P S S探索性因子分析的 过程 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

现要对远程学习者对教育技术资源和使用情况进行了解,设计一个李克特量表,如下图所示: 一.因子分析的定义 在现实研究过程中,往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量,从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息,但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系,导致了信息的重叠现象,从而增加了问题分析的复杂性。 因子分析是将现实生活中众多相关、重叠的信息进行合并和综合,将原始的多个变量和指标变成较少的几个综合变量和综合指标,以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息,而各综合指标之间彼此是不相关的,代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系,以较少几个因子反应原资料的大部分信息的统计方法。 二.数学模型 Z为第i个变量的标准化分数;(标准分是一种由原始分出来的,它是用来说明原始分i 在所属的那批分数中的相对位置的。)

m F 为共同因子; m 为所有变量共同因子的数目; i U 为变量i Z 的唯一因素; im α为因子负荷。(也叫因子载荷,统计意义就是第i 个变量与第m 个公共因子的相关 系数,它反映了第i 个变量在第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。) 因子分析的理想情况,在于个别因子负荷im α不是很大就是很小,这样每个变量才能与较少的共同因子产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则i U 彼此间不能有关联存在。 所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关,即在各个因子变量不相关的情况下,因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数,也就是i Z 在第m 个共同因子变量上的相对重要性,因此,im α绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针:一为“共同性”,二为“特征值”。 所为共同性,也称变量共同度或者公共方差,就是每个变量在每个共同因子的负荷量的平方总和(一横列中所有因子负荷的的平方和),也就是个别变量可以被共同因子解释的变异量百分比,这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于,则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息,仅有较少的信息丢失,因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值,就是原有变量不能被因子变量所能解释的部分。 所谓特征值,是每个变量在某一共同因子的因子负荷的平方总和(一直行所有因子

在验证性因子分析中

X、在验证性因子分析中,有下列常见指标用以检验模型的拟合优度,如2 X、CFI、RMSEA来衡量模型与数据的拟和程度。其中, /2 df 2 X(卡方)是由拟合函数所转换而来的统计量,反应了结构方程模型假设模型的导出矩阵与观察矩阵的差异程度。所以卡方值越小,说明模型的拟合程度越好。 X(卡方自由度比):卡方自由度比越小,表示模型拟合度越高,反之/2 df 则表示模型拟合度越差。一般而言,卡方自由度比小于2时,表示模型具有理想的拟合度。 CFI:CFI指标反应了假设模型与无任何相关性的独立模型差异程度的量数,也考虑到被检验模型与中央卡方分配的离散性。当CFI>0.95时,说明模型拟合度较好。 RMSEA:用来比较理论模型与饱和模型的差距,不受样本数和模型复杂度的影响。当RMSEA<0.05时,模型具有良好的拟合度。 raw data from file ss.psf latent variables cleaning managing repairing shoufa shouka phonerepairing tiaopei satisfy relationships V1-V5=cleaning V6-V13=managing V14-V15=repairing V16-V17=shoufa V18-V19=shouka V20-V21=phonerepairing V22-V23=tiaopei V24-V25=satisfy managing=cleaning satisfy=cleaning managing repairing shoufa shouka phonerepairing tiaopei path diagram options:AD=OFF end of problem

验证性因子分析实例

验证性因子分析的实例分析 基本上,在应用CFA时,皆是在检验某个学者所发展的测验或量表。 CFA对测验或量表的检验可以有以下作为: (1)检验量表的面向性,或者称因子结构。 (2)检验因子的阶层关系,此种测量模式成为阶层式CFA。 (3)检验量表的信度与效度。 实例一:检验测验的面向性 测验或量表的形成是由理论所建构的,可能某些学者的理论认为某个量表是一种单一面向的量表,也可能有些理论认为该量表是有多个面向,对于这种测验或量表的面向性检验,就是一种理论建构的因素效度的检验。对CFA而言,它可以检验出哪一种面向比较符合观察数据,而决定出理论建构的最有效因子结构。 本例采用一个父母对孩子学校表现关注量表。这个量表一共7题(X1,…,X7),资料的搜集来自于某县初中3年级学生,共有590个样本。我们假定了三种面向性的模型:(1)此7题只建构了一个潜在因子,称为“关注”因子;(2)此7题可以建构2个潜因子,一个称为“探询”因子,一个称为“协助与督促”因子;(3)此7题可以建构成3个潜因子,第一个称为“了解”因子,第二个称为“与学校接触”因子,第三个称为“协助与督促”因子。 第一步:模型界定 利用路径图呈现3种模型中变量的关系。如图1~图3所示。 图1 父母对孩子学校表现关注量表单因子CFA模型 图2 父母对孩子学校表现关注量表一级二因子CFA模型 图3 父母对孩子学校表现关注量表一级三因子CFA模型 接着是把路径图转换成方程式,就可以用LISREL程序编写出来。 图1的方程式如下: X1=λ1ξ1+δ1 X2=λ2ξ1+δ2 X3=λ3ξ1+δ3 X4=λ4ξ1+δ4 X5=λ5ξ1+δ5 X6=λ6ξ1+δ6 X7=λ7ξ1+δ7 图2的方程式如下: X1=λ1ξ1+δ1 X2=λ2ξ1+δ2 X3=λ3ξ1+δ3 X4=λ4ξ1+δ4 X5=λ5ξ1+δ5 X6=λ6ξ2+δ6 X7=λ7ξ2+δ7 cov(探询,协助与督促) 图3的方程式如下: X1=λ1ξ1+δ1

LISREL验证性因子分析

LISREL验证性因素分析 数据预处理 1.生成PRELIS文件 首先需要在C盘新建一个文件夹存放将要分析的SAV数据。数据应该事先做整理,这个数据文件应该只包括需要分析的变量,而不应该包括其他无关的变量,以方便到后面使用。File → Import External Data in Other Formats→打开SPSS 的文件→保存为PRELIS Data 2.定义变量 Data→ Define Variables→选中一个变量→Variable Type →Continues →Apply to All → OK。 完成上述操作后点击Save保存数据(注意数据应保存在系统盘,否则可能得不出结果)。 3.计算协方差矩阵 Stati stics→ Output Option→ Save to File→命名A.cov;选LISREL System Data;选Save the Transformed Data to File→命名B.dsf→ OK。到此,数据的预处理工作算是完毕了。

建立模型 Fi le→New→ Path Diagram→保存为同名.PTH。 Setup→Title and Comments(一般不用定义)→Next→Group Names(一般也不用定义)→Next→Labels(左侧Observed Variables:观测变量即观测指标;右侧Latent Variables:潜变量) (1)先添加观测变量。Add/Read Variables——Read from File——PRELIS System File——Browse——出现PSF文件,OK。 (2)再添加潜变量。Add Latent Variables,直接命名潜变量即可,Next。

什么是探索性因子分析

什么是探索性因子分析? 探索性因子分析法(Exploratory Factor Analysis,EFA)是一项用来找出多元观测变量的本质结构、并进行处理降维的技术。因而,EFA能够将将具有错综复杂关系的变量综合为少数几个核心因子。 案例:您设定了一张查询表关于用户满意对民航产业(联合航空公司,三角洲,汉莎航空公司)。您辨认30个项目描述和评估买的票的用户满意(即“空服员的休息室的检查便利”,“便利”,“环境”,“友善”,“履行的特别欲望”,“质量位子的食物在上”,“舒适”,“到来的特价优待例如飞行中电影”,“准确性”)。通过利用EFA您在您分析的过程之内可以使套30个项目降低到强调您的套项目的两三个中央因素。例如,你可以将购票的方便程度、登机检查的方便程度、候机室休憩环境、机上食品质量、座椅舒适程度、电影提供等特别服务视作潜在维度,它们是航空公司经营航空业务、提供航空服务最为重要的考量因素。此外,空服人员友好程度、特殊要求满足程度以及飞行的精确度,更似乎位于同一个流程维度。 这就是说,EFA法就是要精确找出这些变量之间的本质结构——在上述例子中,就是要找出“潜在因子”和“流程因子”。在此分析基础之上,管理人员就能够有针对性地开展市场活动,通过关注“潜在因子”或是“流程因子”,来提高旅客满意度。 探索性因子分析法的起源、历史 因子分析法是两种分析形式的统一体,即验证性分析和纯粹的探索性分析。英国的心理学家Charles Spearman在1904年的时候,提出单一化的智能因子(A Single Intellectual Factor)。随着试验的深入,大量个体样本被分析研究,Spearman的单一智能因子理论被证明是不充分的。同时,人们认识到有必要考虑多元因子。 20世纪30年代,瑞典心理学家Thurstone打破了流行的单因理论假设,大胆提出了多元因子分析(Multiple Factor Analysis)理论。 Thurstone 在他的《心智向量》(Vectors of Mind,1935)一书中,阐述了多元因子分析理论的数学和逻辑基础。 探索性因子分析法的计算、公式 在运用EFA法的时候,可以借助统计软件(如SPSS或SAS)来进行数据分析。 探索性因子分析法的运用、应用 顾客满意度调查。

因子分析方法

第七周:因子分析方法——每周一讲多变量分析分类:市场研究 | 标签:市场研究研究方法统计分析多变量分析 2010-02-11 10:58阅读(10574)评论(6) 因子分析(Factor Analysis)是一种非常有用的多变量分析技术。我想说,你要想学好多变量分析技术,一是:理解多元回归分析,二是:理解因子分析;这是多变量分析技术的两个出发点。为什么这么说呢?多元回归分析是掌握有因变量影响关系的重点,无论什么分析,只要研究的变量有Y,也就是因变量,一般都是回归思想,无非就是Y的测量尺度不同,选择不同的变形方法。而因子分析则是研究没有因变量和自变量之分的一组变量X1 X2 X3 ... Xn之间的关系。 在市场研究中,我们经常要测量消费者的消费行为、态度、信仰和价值观,当然最重要的是测量消费者的消费行为和态度!我们往往采用一组态度量表进行测量,用1-5打分或1-9打分,经常提到的李克特量表。

上面的数据是我们为了测量消费者的生活方式或者价值观什么的,选择了24个语句, 让消费者进行评估,同意还是不同意,像我还是不像,赞成还是不赞成等等,用1-9打分; 因子分析有探索性因子分析和证实性因子分析之分,这里我们主要讨论探索性因子分析!证实性因子分析主要采用SEM结构方程式来解决。 从探索性因子分析角度看: ?一种非常实用的多元统计分析方法; ?一种探索性变量分析技术; ?分析多变量相互依赖关系的方法; ?数据和变量的消减技术; ?其它细分技术的预处理过程; 我们为什么要用因子分析呢? 首先,24个可测量的观测变量之间的存在相互依赖关系,并且我们确信某些观测变量 指示了潜在的结构-因子,也就是存在潜在的因子;而潜在的因子是不可观测的,例如:真实的满意度水平,购买的倾向性、收获、态度、经济地位、忠诚度、促销、广告效果、品牌形象等,所以,我们必须从多个角度或维度去测量,比如多维度测量购买产品的动机、消费习惯、生活态度和方式等; 这样,一组量表,有太多的变量,我们希望能够消减变量,用一个新的、更小的由原始变量集组合成的新变量集作进一步分析。这就是因子分析的本质,所以在SPSS软件中, 因子分析方法归类在消减变量菜单下。新的变量集能够更好的说明问题,利于简化和解释问题。 当然,因子分析也往往是预处理技术,例如,在市场研究中我们要进行市场细分研究,往往采用一组量表测量消费者,首先,通过因子分析得到消减变量后的正交的因子(概念),然后利用因子进行聚类分析,而不再用原来的测量变量了!我想这是市场研究中因子分析的主要应用! 其实,你可以想象,例如在多元回归分析中,如果多个自变量存在相关性,如果可以用因子分析,得到几个不相关的变量(因子),再进行回归,就解决了自变量共线性问题。(理论上是这样的,但市场研究很少这么操作!) 下面是要理解的因子分析的基本概念: ?一种简化数据的技术。 ?探索性因子分析和证实性因子分析 ?因子分析就是要找到具有本质意义的少量因子。 ?用一定的结构/模型,去表达或解释大量可观测的变量。 ?用相对少量的几个因子解释原来许多相互关联的变量之间的关系。 ?描述的变量是可观测的——显在变量。 ?相关性较高,联系比较紧密的变量放在一类。 ?每一类变量隐含一个因子——潜在变量。

如何用amos做验证性因子分析

如何用amos做验证性因子分析 验证性因素分析是20世纪60年代后从探索性因素分析发展而来的[12]。它可以通过协方差结构模型(Covariance Structure Modeling,CSM)或称结构方程模型(Structure Equation Modeling,SEM)实现。对于数据的计算和模型的验证,现已编有多种计算机软件,其中著名的一种是K.G.Joreskog和D.Sorbom编制的LISREL。在验证性因素分析方法出现之前,对评价中心的构想效度的验证,更多的是用多质多法。对于多质多法的批评意见,主要是认为这种方法以包含测量误差的可观测变量间的相关为基础,来对潜在的结构进行解释,而实际上测量误差每次是不一致的,从而会影响到相关系数,进而影响对潜在结构解释的准确性。 验证性因素分析方法则可以解决这个问题,它对误差和相关的变量进行控制,进而得出一个更加令人满意的结果。因而,它很快被公认为一种适宜且通用的评估MTMM数据的方法[12]。在这种方法中,同一特质不同测评方法所决定的因素代表测评的构想效度,而同一测评方法不同测评特质所代表的因素则表明了测评方法的效应。每一个可观测变量均由特质因素、方法因素和测量误差三部分组成。其最大优点在于能对因素的负荷进行固定,并对提出的不同假设模型进行检验。 每一种自由负荷的大小反映了问题的所在。如果在能力因素上的自由负荷小且不显著,而在方法因素上的自由负荷大且显著,那么,这种结果就是支持测评方法导向的。反过来,不同测评方法中的同一种能力的因素负荷的值大而且是显著的,那么,就可以认为不同测评方法之间能力的一致性可以得到确认。通过检测这些不同的假设模型,就可以得出评价中心的评分到底是指向测评维度的还是测评方法的。 验证性因素分析及其在心理与教育研究中的应用 在心理与教育研究中,方法的突破往往是研究取得新进展的一个重要方面。正如班特勒(Bentler,1990)指出:“研究的突破往往在研究方法的变革上。”而心理与教育研究非常复杂,它具有多层面、多指标的特性,常涉及许多变量(包括控制变量、依变量等),如何对多变量的问题进行研究,一直是人们努力的方向,也取得不少突破性的进展。如兴起于六、七十年代,目前已在社会科学领域里得到广泛的应用,并被称为近年来统计学三大进展之一的协方差结构模型方法(covarian structure models,CSM)。① 通常协方差结构模型分析由两部分组成,一部分是在心理与教育测量中经常使用的验证性因子模型(验证性因素分析),也可称之为测量模型;另一部分是在经济计量学中使用的结构方程模型。②③顾海根先生已在《上海教育科研》详细介绍了结构方程模型及其在研究中的应用,因而本文拟对验证性因子分析方法及其在心理与教育研究中的应用作一定的说明。 一、探索性因素分析与验证性因素分析 最早提出因素分析想法的是高尔顿,他奠定了因素分析的基础。其后,斯皮尔曼在研究“一般智力”(general intelligence)中首次采用了因素分析的数学模型方法,使得因素分析的方法得以真正成为现实。我们知道,因素分析是将多个实测变量转换为少数几个综合指标(或称潜变量),④它反映了一种降维的思想。我们在研究中往往需要对反映事物的多个变量进行观测,收集数据,变量庞大无疑为科学研究提供了丰富的信息,但在一定程度上增加了问题分析的复杂性,由于各变量存在一定相关关系,因而可以通过降维将相关性高的变量聚在一起,因素分析的思想由此而来。 最初在因素分析时常采用探索性因素分析方法,如SPSS软件包中的因素分析(Factor analysis),MINITAB 软件包中的因素分析,SYSTAT软件包中的因素分析。随着近年来EQS、LISREL、CALIS等软件的开发,

相关文档
最新文档