LISREL做CFA、模型及修正,手把手教会你
结构方程模型初级介绍

--
3.66 22.02
4.78
VAR 9
0.40
被解释的部分。
潜变量间的关系,即结构模型,是研究的兴趣重点, 所以整个分析也称结构方程模型。
三、建模过程
• (1)模型建构(model specification) • (2)模型拟合(model fitting) • (3)模型评价(model assessment) • (4)模型修正(model modification)
结构方程模型
Structural Equation Models
目录
• 一、为何要用结构方程模型? • 二、模型原理简介 • 三、模型建模 • 四、例子:员工流失动因模型
一、为何要用结构方程模型?
• 很多社会、心理研究中所涉及到的变量,都不能准 确、直接地测量,这种变量称为潜变量,如工作自 主权、工作满意度等。
探索性因子分析)、t检验、方差分析、比较各 组因子均值、交互作用模型、实验设计
结构化模型基本概念
计量回归分析研究的是显变量之间的关系,并且是直接效应的 关系。
在社会科学以及经济、市场、管理等研究领域,有时要处理多 个原因、多个结果的关系,或者会碰到不可直接观测的变量 (定义为潜变量,如智力、学习动机等),变量间的间接效应, 这些都是传统的多元回归分析统计方法不好解决的问题。
– 缺点:权重设计,需要相当的技巧,通常的方法,如 AHP,模糊综合评判等方法缺少信度与效度
• 针对4):没有办法解决
结构方程模型(SEM)的优点
• 同时处理多个因变量 • 容许自变量和因变量含测量误差--传统方法(如
回归)假设自变量没有误差
• 同时估计因子结构和因子关系 • 容许更大弹性的测量模型 • 估计整个模型的拟合程度[用以比较不同模型] • SEM包括:回归分析、因子分析(验证性因子分析、
探索式因素分析

F5
v12
w7 w8 1
v15 v14 v13
1
1
1
e15 e14 e13
e21
1
1
1 v16
e16
1
F6
v17
e17
1
v18
e18
26
Amos路径分析与SPSS回归比较
Co effi c i en t sa
Unstandardized Coefficients
Model
B
Std. Error
1
e7
x e2
2 Lx2
F1
b31
F3
y Ly2
2
e8
e3 x3 e4 x4
Lx3
cov21
Lx4
Ly3
y3 e9
b43
b41
D4
y4 e10
Ly4
e5 x5
Lx5
F2
e6 x6
Lx6
b42
F4
y5 e11
Ly5
Ly6
y6 e12
15
SEM的类别
1. 路径分析模型 2. 验证式因素分析模型 3. 结构回归模型 4. 潜在成长模型
▪ SEM最常使用的方法是将「外生潜在变项」变异数 设为1;或将潜在变项其中的一个「测量变项与潜在 变项」的因素负荷量设为1。
▪ 两种方法结果一样,若目的为理论验证,采第二种 方法较为适宜。
e1
x1
L1
L2
e2 x2
1 标准化设定
满意度
W
D1
忠诚度
y1 e3
1 未标准化设定
L4
y2
e4
31
SEM的重要矩阵
结构方程模型进阶(简体)

SEM的注意事项
(Chin, 1998)
Capitalization on Chance
根据修正指标的指示,在没有任何理论依 据下任意连结。 利用探索式因素分析的结果放入验证式因 素分析下进行探讨。
SEM的假设为S-Σ (θ )=0,不需要每一条 路径去做假设,但结果需探讨每一条的 关系并说明。
SEM的注意事项
(Chin, 1998)
所有的SEM分析均是反映型(reflective) 指标,不是形成型(formative)指标。 二阶因素分析的存在,需先证明一阶构 面据有收敛效度,二阶因素分析时,对 每一个一阶因素的loadings也要达0.7以 上。
SEM的注意事项
(Grimm & Yarnold, 2006)
当输入数据呈现非常态时,可采用 Bollen-Stine校正p-value,三步骤如下: 1. 确认您的数据分配为非多元常态 2. 利用Bollen-Stine校正p-value评估整体 配适度 3. 使用拔靴法(bootstrap)产生参数值、估 计参数标准误及每个参数的显著性检定
小样本分析处理 Bootstrapping (拔靴程序)
第五诫
模式估计除了要考虑统计证据外,也要把 理论依据及实务上的考虑考虑进来,
第四诫
测量模式要优先考虑于结构模式。
第三诫
考虑多个可能的竞争模型
结构方程模型估计十诫
(Grimm & Yarnold, 2006)
第二诫
有关于模式搜索,需要大样本执行,分析 时最好有一个独立的比较样本。
第一诫
绝对不要宣称本估计模型是最佳模型。
结构模式与测量模式多元常态及极端值检核
製造年限
e1
结构方程模型

• (3)参数估计方法选项,METHOD= 规定 参数的估计方法,估计方法有多种,如ML、 GLS、ULS、WLS等,默认的是ML。
• (4)最优化选项,OMETHOD= 最优化方 法包括LM、CG、NR、QN,缺省时为LM。
• (5)输出选项,主要是控制输出结果包括 的内容。 CALIS提供几种方法说明构建的 理论模型。在多数情况下,LINEQS语句和 RAM语句用起来比较方便,LINEQS语句直 接描述结构方程组,路径图可以用RAM语 句描述。至于具体选择哪个语句主要取决 于个人习惯。
• ⑥能分解相关系数 ,来考察一个变量对另一变量的 直接作用和间接作用。
2.缺点
• ①在 SEM 的应用早期由于其自身的相对复杂性 和不完善性 ,使研究者们未能准确把握其内涵 ,因 而出现了误用并把统计结果作为确定因果关系方 向的证据 ,这显然是本末倒置。又由于 SEM 对模 型的接受没有统一标准 ,所以在有等价模型的情况 下研究者很难拒绝某些模型 ,这也给模型选择带来 了困难;
1
2
X1
X2
11 21
3
4
X3
X4
31 41
1
11
21
1
2
3
4
y1
y2
y3
y4
11 21
31 41
ζ1
1
21
ζ2
2
52
62
y5
y6
5
6
72 82
y7
y8
7
8
4、结构方程模型的优点 Bollen和Long(1993)指出SEM有以下优点 :
(1)可同时考虑及处理多个依变项(endogenous / dependent variable); (2)容许自变及依变(exogenous / endogenous)项含测量误差; (3)与因素分析类同,SEM容许潜伏变项(如:社经地位)由多个观察指标变项 (如:父母职业、收入)构成,并可同时估计指标变项的信度及效度(reliability and validity); (4)SEM可采用比传统方法更有弹性的测量模型(measurement model),如某一 指标变项/题目从属于两潜伏因子;在传统方法,项目多依附单一因子; (5)研究者可构划出潜伏变项间的关系,并估计整个模式是否与数据拟合。
结构方程模型

反映性指标回归方程:
X1=β1η+ε1 X2=β2η+ε2 形成性指标回归方程: η=γ1X1+ γ2X2+ δ
内因变量与外因变量
测量模型在SEM模型中就是一般的验证式因素分析 (confirmatory factor analysis,CFA),用于检验数 个测量变量可以构成潜在变量的程度,即模型中观察 变量X与其潜在变量ξ间的因果模型是否与观察数据 契合。
整体模型是陪读检验就是检验总体的协方差矩阵(Σ 矩阵),与假设模型隐含的变量间的协方差矩阵(Σ (θ)矩阵)的差异。因为我们无法得知总体方差与协方 差,因而用样本数据得到的参数估计代替总体参数, 即用样本协方差矩阵S矩阵代替总体的Σ矩阵。
二、测量模型
测量模型由潜在变量与观察变量组成,就数学定义而 言,测量模型是一组观察变量的线性函数。
Amos
LISREL (Linear Structure Relationship)即线性结构关系 的缩写,由统计学者Karl G. Joreskog与Dag Sorbom 二人结合矩阵模型的分析技巧,用以处理协方差结构 分析的一套计算机程序。
Amos是Analysis of Moment Structure(矩结构分析)的 简称,可以验证各式测量模型、不同路径分析模型; 此外还可以进行多组群分析、结构平均数检验,单组 群或多组群多个竞争模型或选替模型的优选。
测量模型与结构模型
SEM分析模型中,只有测量模型而没有结构 结构模型的回归关系,即验证性因素分析;只 有结构模型没有测量模型,则潜在变量间因果 关系讨论,相当于传统的路径分析。
样本量太小适合做结构方程模型分析吗?

样本量太小适合做结构方程模型分析吗?现在结构方程模型应用非常普遍,尤其是人文社科领域,硕士、博士研究生做毕业论文或发表学术论文多数都用到结构方程模型。
这其中的一个重要问题是,多大的样本量才适合做结构方程模型,样本量太小能不能做结构方程模型?对此,有几个问题要明确:第一,结构方程模型只是一种统计建模与数据分析的方法,理论上来说,只要有数据,建立好模型,就可以运行软件进行分析,只是存在信度效度好不好、模型能不能识别、结果可不可靠的问题。
第二,样本量的大小没有绝对固定的“临界值”,而要根据研究的模型复杂性、样本的结构等来决定。
一些统计方法认为30以下是小样本,60以上是大样本,但这个只是针对个别情况而言的。
在结构方程模型中,模型越复杂,要求的样本量越大,因此,300的样本对于只有不到10个变量的模型来说可以算是大样本,但对于二三十个变量的模型,则是小样本。
第三,结构方程模型适合的样本量如何判断?经常看到咨询我们做数据分析的客户说,“不是说做结构方程模型的样本量达到变量个数的10倍以上就可以了吗?”网上也有很多帖子表达这种说法。
实际上这个说法是不确切的,比较准确的说法应该是,“样本量应该达到模型中需要估计的参数的数量的10倍以上”。
一个结构方程模型需要估计的参数与模型中的变量数目是不一样的,比如路径系数或相关系数(协方差)、方差、截距等都可能是需要估计的参数,因此,相同变量个数的模型,如果变量之间的路径关系或共变关系(如误差相关)数量不一样,约束限定的参数不同,那么,模型需要估计的参数数量也不同,进而所需要的样本量也不同。
此外,还要注意,越复杂的模型需要的倍数越高,比如一般自我效能感量表GES有10个题目,做CFA,那么样本量可以不到10倍(可能五倍都可以了)也可以有比较满意的参数估计,但如果是多个量表,题目得到四五十题,那么样本量就不是简单的10倍了,可能20倍都不足以支撑这么复杂的模型。
最后,如果根据各种标准判断手头的样本量确实很小呢,能不能用结构方程模型?我们南心网的看法是,小样本做结构方程模型很容易出现以下问题:非正定矩阵、系数不显著、模型拟合指数不达标等,尤其是模型拟合指数不达标。
如何用amos做验证性因子分析
如何用amos做验证性因子分析验证性因素分析是20世纪60年代后从探索性因素分析发展而来的[12]。
它可以通过协方差结构模型(Covariance Structure Modeling,CSM)或称结构方程模型(Structure Equation Modeling,SEM)实现。
对于数据的计算和模型的验证,现已编有多种计算机软件,其中著名的一种是K.G.Joreskog和D.Sorbom编制的LISREL。
在验证性因素分析方法出现之前,对评价中心的构想效度的验证,更多的是用多质多法。
对于多质多法的批评意见,主要是认为这种方法以包含测量误差的可观测变量间的相关为基础,来对潜在的结构进行解释,而实际上测量误差每次是不一致的,从而会影响到相关系数,进而影响对潜在结构解释的准确性。
验证性因素分析方法则可以解决这个问题,它对误差和相关的变量进行控制,进而得出一个更加令人满意的结果。
因而,它很快被公认为一种适宜且通用的评估MTMM数据的方法[12]。
在这种方法中,同一特质不同测评方法所决定的因素代表测评的构想效度,而同一测评方法不同测评特质所代表的因素则表明了测评方法的效应。
每一个可观测变量均由特质因素、方法因素和测量误差三部分组成。
其最大优点在于能对因素的负荷进行固定,并对提出的不同假设模型进行检验。
每一种自由负荷的大小反映了问题的所在。
如果在能力因素上的自由负荷小且不显著,而在方法因素上的自由负荷大且显著,那么,这种结果就是支持测评方法导向的。
反过来,不同测评方法中的同一种能力的因素负荷的值大而且是显著的,那么,就可以认为不同测评方法之间能力的一致性可以得到确认。
通过检测这些不同的假设模型,就可以得出评价中心的评分到底是指向测评维度的还是测评方法的。
验证性因素分析及其在心理与教育研究中的应用在心理与教育研究中,方法的突破往往是研究取得新进展的一个重要方面。
正如班特勒(Bentler,1990)指出:“研究的突破往往在研究方法的变革上。
验证性因子分析的讲解ppt课件
为了确定因子的维数——探索性因子分析(EFA) 根据某些理论或其他先验知识对可能的个数或因
子结构作出假设——验证性因子分析(CFA)
精选
EFA vs CFA
参考文献《探索性因子分析与验证性因子分析比 较研究》
精选
EFA&CFA——相同之处
都是为了考察观测变量之间的相关系数和方差协 方差。
数表示) Σ(Θ^):根据样本估计出Θ^后得到的协方差矩阵
精选
目的
S——Σ Σ(Θ^)——Σ(Θ) 估计出参数,使得Σ(Θ^)逼近S,即使得Σ(Θ)
逼近Σ
精选
参数估计 模型识别 模型评价等具体细节原理 教材CH9
精选
应用举例
《外资企业跨文化适应模式分析结构方程建模》
精选
验证性因子分析
龚颖
精选
结构方程分析
也称为“结构方程建模(Structural Equation Modeling ,SEM)”
定义:基于变量的协方差矩阵来分析变量之间关 系的一种统计方法
是一种非常通用的、主要的线形统计建模技术 是计量经济学、计量社会学与计量心理学等领域
的统计分析方法的综合 所常使用的分析软体包括:LISREL,EQS,AMOS
精选
基本思想的差异
EFA
CFA
主要是为了找出影响观测 变量的因子个数,以及各 个因子和各个观测变量之 间的相关程度
结构方程模型
Y 2 21 2
y 1
Y 4 42 4
y 2
y 11 Y 1 y 21 Y 2 0 Y 3 Y 4 0
1 2 1 y 3 32 2 y 4 42
二、結構方程模式原理簡介
結構方程式(structural equation modeling,SEM)可用以同時處理一系 列或多組自變項與依變項之間關係,它可透過分析軟體(Linear Structural Relation, LISREL)或SAS/CALIS加以分析。 LISREL模式可分為下列兩種模式: (一)測量模式(measurement model) 用以描述潛在變數或假設構念如何取決於(或為)觀察變數所指 出;它用以描述觀察變數之測量性質(信度及效度),亦即用以 描述潛在變項與觀察變項之關係。 (二)結構方程式模式(structural equation model) 用以描述潛在變數間之因果關係、形容因果效果及指配解釋及未 解釋變異LISREL模式特別適用於一模型:包括潛在變數、及獨立 變數及依變數之測量誤差、雙向因果關係,同時發生及相互依賴 性。
_1
2
N為觀察總數,t為八個參數矩陣中所要估計的參數數目總 和。p、q分別為觀察變數Y及X的數目。 如果檢定結果不顯著,則接受虛無假設,表示理論模式與觀
察資達一定之配適度。
三、LISREL模式之次模式 • 模式僅包含X變項及潛在自變項ξ時屬於「驗證性因素分析 (Confirmative Factor Analysis, CFA)」; • 模式僅包含Y變項及潛因變項ε時常見於「時間序列分析」; • 模式包含潛在變項ξ、ε及Y變項,但無X變項時稱為「二階 段因素分析(second-order CFA)」。 • 模式僅有X變項及Y變項時稱為「單指標徑路分析模式」。
结构方程模型
分,在测量模型即测量误差,在结构模型中为 干扰变量或残差项,表示内生变量无法被外生 变量及其他内生变量解释的部分。
ηη11== γ ξ + γ111ξ11+ ζ11 ζ1 η 1= γ11 ξ1+ γ12 ξ2 +ζ1
符号表示
潜在变量:被假定为因的外因变量,以ξ(xi/ksi) 表示;假定果的内因变量以η(eta)表示。
外因变量ξ的观测指标称为X变量,内因变量η观测值 表称为Y变量。
它们之间的关系是:①ξ与Y、η与X无关②ξ的协差 阵以Φ(phi)表示③ξ与η的关系以γ表示,即内因 被外因解释的归回矩阵④ξ与X之间的关系,以Λx表 示,X的测量误差以δ表示,δ间的协方差阵以Θε表 示⑥内因潜变量η与η之间以β表示。
观察变量
观察变量作为反映潜在变量的指标变量,可分为反映性指 标与形成性指标两种。
反映性指标又称为果指标,是指一个以上的潜在变量是引 起观察变量或显性变量的因,此种指标能反映其相对应的 潜在变量,此时,指标变量为果,而潜在变量为因。
相对的,形成性指标是指指标变量是成因,而潜在变量被 定义为指标变量的线性组合,因此潜在变量变成内生变量, 指标变量变为没有误差项的外生变量。
SEM包含了许多不同的统计技术
SEM融合了因子分析和路径分析两种统计技 术,可允许同时考虑许多内生变量、外生变量 与内生变量的测量误差,及潜在变量的指标变 量,可评估变量的信度、效度与误差值、整体 模型的干扰因素等。
SEM重视多重统计指标的运用
SEM所处理的是整体模型契合度的程度,关注整体模 型的比较,因而模型参考的指标是多元的,研究者必 须参考多种不同的指标,才能对模型的是陪读做整体 的判断,个别参数显著与否并不是SEM的重点。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
运行LISEREL Windows Application
协方差检验
File→Import External Data in Other Formats(导入外部数据)→右击任一变量名,选择Define
Variables(定义变量),点击Variable Type(设定变量类型),选择Continuous(连续型)和
Apply to all(应用到所有) ,点击OK、OK。如下图所示:
完成上述操作后点击save保存数据(注意数据应保存在系统盘,否则可能得不出结果)
Statistics→output options...(输出选项,选择Save to fi.. 、LISREL system data、Save the
transformed data to...。输入与之前文件名一致名字的cov、dsf文件(如下图中test1.cov、
test1.dsf),Covariances:协方差)
得到协方差矩阵
接下来进行CFA
Flie→New→Path Diagram→保存(同名文件test1.pth)
Setup(定义相关设定)→Title and comments(一般不用定义)→选择next,至Group names
(一般也不用定义)→next至Labels,如下图(左侧Observed Variables:观测变量即观测指
标;右侧Latent Variables:潜变量)
→选择Add/Read variables (得下图,在Add/Read variables中选择PRELIS System Flie)
选择Browse...→打开test1.psf→OK
选择Add latent Variables(添加潜变量,手输),如下图
得到
点击next进入Data(Statistics中选择Covariances,File中选择External ASCII Data,File
Browse... 中选择同名cov文件,Number of中输入样本数量)
点击OK
作图
Setup→Build LISREL Syntax→ → 选择estimates(估计值)中:Standardized
Solution
注:对于Standardized Solution值的删减标准无一定说法,但一般应当高于0.6、0.7。如果
观测指标不多,可适当降低标准。一般最少也应大于0.5。上图中对于较小的0.34应删除这
条路径,删除后再运行程序一次。如果有多条路径要删除,应当一条一条删。
完成删减路径工作后,查看模型拟合系数Output→ Fit indices(拟合指数),如下图:
以上CFA完成
接下来结构方程模型分析
File→new→选择Path Diagram,如下图
保存为test2.pth
Setup(定义相关设定)→Title and comments(一般不用定义)→选择next,至Group names
(一般也不用定义)→next至Labels,如下图(左侧Observed Variables:观测变量即观测指
标;右侧Latent Variables:潜变量)
→选择Add/Read variables (得下图,在Add/Read variables中选择PRELIS System Flie)
选择Browse...→打开test1.psf→OK
选择Add latent Variables(添加潜变量,手输),如下图
得到
点击next进入Data(Statistics中选择Covariances,File中选择External ASCII Data,File
Browse... 中选择同名cov文件,Number of中输入样本数量)
点击OK
绿色:外生潜变量;灰色:外生观测变量(外生观测指标)
黄色:内生潜变量;蓝色:内生观测变量(内生观测指标)
系统均默认为外生变量,在Y下选中,转化为内生观测变量,在Eta下选中转化为内生潜
变量
作图,与CFA一样,得到下图
其中,选择Estimate中T-values,从最小的开始,用以删路径。一般T值的绝对值应当大于
1.96,才说明显著水平达到0.05,用一个*表示。另,大于2.58用**表示,大于 用***表示。
选择Estimate中modification indices(修正系数,MI值:增加某条路径所减少的卡方值,从
大的开始),用以增加路径。但一定要有理论依据,一般不随便增加。
T值最小值开始用以删路径,MI值最大值开始用以增加路径。无论增、减路径都得一条一
条进行。
根据T值依次删除两条路径后(在其中最好保存语法)得到下图:
上图表明SPEE对MARK影响系数为0.45,EFFE对FINA影响系数为0.24。
根据MI值添加路径(①根据数值大小;②理论依据),后运行
以上结构修正完成,接下来输出相关指标数据:
选择Total Effects and Indirect Effects(总体影响和间接影响)、Standardized solution
点击Next,选择下列指标输出
点击OK
Setup 运行语法
打开同名OUT文件,所有指标数据可以看到。
例如:
表示 所有输入变量13个
Y变量(外生观测变量)6个
X变量(内生观测变量)6个
外生潜变量2个
内生潜变量2个
样本数309
上图表示输入的协方差矩阵
上图表示变量间的协方差矩阵
上图表示拟合优度的指标
BETA、GAMMA均显示直接影响,BETA是内生潜变量之间的关系,GAMMA是外生潜变
量与内生潜变量之间的关系
上图表明MARK对FINA影响系数为0.25,EFFE对FINA影响系数为0.18,SPEE对MARK
影响系数为0.43
上图表示EFFE对MARK没有影响,对FINA直接影响为0.18。
SPEE对MARK的直接影响为0.43,对FINA有间接影响为0.11(也即0.44×0.26=0.11)
注:由于报表数据只有两位所以大部分比结构图中的数字小一点(比如0.43,在结构图中实
为0.44)
上图与之前的图效果也一样,都可以看出直接小妖和间接效应(也就是中介效应)
Reduced Form
EFFE SPEE
-------- --------
MARK - - 0.43……………………代表影响系数
(0.07)……………………标准误
6.37……………………T值
FINA 0.18 0.11
(0.06) (0.03)
2.90 3.30
注 T值:1.96 * 2.58 ** 3.28 ***
统一根据T值来确定标*
例如,上面的0.11在论文报告中就可以写作0.11***