结构方程模型基础知识
结构方程模型解读

结构方程模型解读结构方程模型是一种统计分析方法,可以用来探究因变量和自变量之间的关系。
它是一种相对比较复杂的分析方法,但当被正确解读时,它有效地帮助研究者了解变量之间的关系以及变量如何影响彼此。
下面,我们将依次阐述如何理解结构方程模型。
一、构建模型:结构方程模型的第一步是构建模型。
这意味着研究者需要选择一个理论框架,并从中选择变量进行分析。
在选择变量时,研究者需要考虑变量之间的关系以及它们可能如何相互作用。
一旦选择了变量,研究者就需要确定变量之间的箭头方向,来表示它们之间的重要性和权重。
一般来说,箭头会从自变量指向因变量。
二、拟合模型:一旦成功地构建了模型,研究者需要拟合模型,这意味着他们需要在模型中添加数据并运行分析。
在这个步骤中,研究者采集数据,并将它们输入计算机程序中。
该程序将根据构建的模型来分析数据,并根据一些统计指标来计算模型的拟合度。
如果模型与数据的拟合度较高,则说明模型比较准确,反之则说明需要重新考虑模型结构。
三、解读结果:最后,研究者需要解读结果,这是最为挑战性的一步。
结果解释并不简单,因为它们可能包含了许多因素和变量。
因此,研究者需要进行更深层次的分析和理解,以找出关键的因素和变量之间的关系。
要解读结果,需要查看概览统计数据,包括R²值和残差,以及某些中介变量、潜在变量和多重潜在变量之间的关系。
这些数据将告诉研究者各个变量之间的影响力和关系。
在这里,研究者应该花时间来分析数据,并将其与模型进行对照。
如果模型与数据的拟合度很高,则研究者可以着手对数据中发现的关键变量进行更深入的分析。
总之,结构方程模型是一种富有成果的统计分析方法。
如果您正确地构建模型,并仔细解读结果数据,就可以从中得到非常好的结论。
★结构方程模型要点

★结构方程模型要点一、结构方程模型的模型构成1、变量观测变量:能够观测到的变量(路径图中以长方形表示)潜在变量:难以直接观测到的抽象概念,由观测变量推估出来的变量(路径图中以椭圆形表示)内生变量:模型总会受到任何一个其他变量影响的变量(因变量;路径图会受外生变量:模型中不受任何其他变量影响但影响其他变量的变量(自变量;路中介变量:当内生变量同时做因变量和自变量时,表示该变量不仅被其他变量影响,还可能对其他变量产生影响。
内生潜在变量:潜变量作为内生变量内生观测变量:内生潜在变量的观测变量外生潜在变量:潜变量作为外生变量外生观测变量:外生潜在变量的观测变量中介潜变量:潜变量作为中介变量中介观测变量:中介潜在变量的观测变量2、参数(“未知”和“估计”)潜在变量自身:总体的平均数或方差变量之间关系:因素载荷,路径系数,协方差参数类型:自由参数、固定参数自由参数:参数大小必须通过统计程序加以估计固定参数:模型拟合过程中无须估计(1)为潜在变量设定的测量尺度①将潜在变量下的各观测变量的残差项方差设置为1②将潜在变量下的各观测变量的因子负荷固定为1(2)为提高模型识别度人为设定限定参数:多样本间比较(半自由参数)3、路径图(1)含义:路径分析的最有用的一个工具,用图形形式表示变量之间的各种线性关系,包括直接的和间接的关系。
(2)常用记号:①矩形框表示观测变量②圆或椭圆表示潜在变量③小的圆或椭圆,或无任何框,表示方程或测量的误差单向箭头指向指标或观测变量,表示测量误差单向箭头指向因子或潜在变量,表示内生变量未能被外生潜在变量解释的部分,是方程的误差④单向箭头连接的两个变量表示假定有因果关系,箭头由原因(外生)变量指向结果(内生)变量⑤两个变量之间连线的两端都有箭头,表示它们之间互为因果⑥弧形双箭头表示假定两个变量之间没有结构关系,但有相关关系⑦变量之间没有任何连接线,表示假定它们之间没有直接联系(3)路径系数含义:路径分析模型的回归系数,用来衡量变量之间影响程度或变量的效应大小(标准化系数、非标准化系数)类型:①反映外生变量影响内生变量的路径系数②反映内生变量影响内生变量的路径系数路径系数的下标:第一部分所指向的结果变量第二部分表示原因变量(4)效应分解①直接效应:原因变量(外生或内生变量)对结果变量(内生变量)的直接影响,大小等于原因变量到结果变量的路径系数②间接效应:原因变量通过一个或多个中介变量对结果变量所产生的影响,大小为所有从原因变量出发,通过所有中介变量结束于结果变量的路径系数乘积③总效应:原因变量对结果变量的效应总和总效应=直接效应+间接效应4、矩阵方程式(1)和(2)是测量模型方程,(3)是结构模型方程 测量模型:反映潜在变量和观测变量之间的关系 结构模型:反映潜在变量之间因果关系 5x x ξδ=∧+ (1)y y ηε=∧+ (2) B ηηξζ=+Γ+ (3)三、模型修正1、参考标准模型所得结果是适当的;所得模型的实际意义、模型变量间的实际意义和所得参数与实际假设的关系是合理的;参考多个不同的整体拟合指数;2、修正原则①省俭原则两个模型拟合度差别不大的情况下,应取两个模型中较简单的模型;拟合度差别很大,应采取拟合更好的模型,暂不考虑模型的简洁性;最后采用的模型应是用较少参数但符合实际意义,且能较好拟合数据的模型。
结构方程模型初级介绍

--
3.66 22.02
4.78
VAR 9
0.40
被解释的部分。
潜变量间的关系,即结构模型,是研究的兴趣重点, 所以整个分析也称结构方程模型。
三、建模过程
• (1)模型建构(model specification) • (2)模型拟合(model fitting) • (3)模型评价(model assessment) • (4)模型修正(model modification)
结构方程模型
Structural Equation Models
目录
• 一、为何要用结构方程模型? • 二、模型原理简介 • 三、模型建模 • 四、例子:员工流失动因模型
一、为何要用结构方程模型?
• 很多社会、心理研究中所涉及到的变量,都不能准 确、直接地测量,这种变量称为潜变量,如工作自 主权、工作满意度等。
探索性因子分析)、t检验、方差分析、比较各 组因子均值、交互作用模型、实验设计
结构化模型基本概念
计量回归分析研究的是显变量之间的关系,并且是直接效应的 关系。
在社会科学以及经济、市场、管理等研究领域,有时要处理多 个原因、多个结果的关系,或者会碰到不可直接观测的变量 (定义为潜变量,如智力、学习动机等),变量间的间接效应, 这些都是传统的多元回归分析统计方法不好解决的问题。
– 缺点:权重设计,需要相当的技巧,通常的方法,如 AHP,模糊综合评判等方法缺少信度与效度
• 针对4):没有办法解决
结构方程模型(SEM)的优点
• 同时处理多个因变量 • 容许自变量和因变量含测量误差--传统方法(如
回归)假设自变量没有误差
• 同时估计因子结构和因子关系 • 容许更大弹性的测量模型 • 估计整个模型的拟合程度[用以比较不同模型] • SEM包括:回归分析、因子分析(验证性因子分析、
结构方程模型讲课文档

模型修正
• 模型的修正主要包括: • (1) 依据理论或有关假设 ,提出一个或数个合理的先验模型;
• (2) 检查潜变量与指标间的关系 ,建立测量方程模型; • (3) 若模型含多个因子 ,可以循序渐进地 ,每次只检验
含两个因子的模型 ,确立测量模型部分合理后 ,最后再 将所有因子合并成预设的先验模型 ,作总体检验;
(3)与因素分析类同,SEM容许潜伏变项(如:社经地位)由多个观察指标变项(如:父母职业、收入)
构成,并可同时估计指标变项的信度及效度(reliability and validity);
(4)SEM可采用比传统方法更有弹性的测量模型(measurement model),如某一指标变 项/题目从属于两潜伏因子;在传统方法,项目多依附单一因子; (5)研究者可构划出潜伏变项间的关系,并估计整个模式是否与数据拟合。
传统上先计算外向题目的总分(或者平均分)和自信题目的总分(或 者平均分),再计算两个总分(或者平均分)的相关,这种计算所得的 两个潜变量(外向和自信)的关系,不一定恰当,但是结构方程模型能 提供更佳的答案(如典型相关分析等)。
x1
x2
自信
x3
x4
y1
外向
y2
y3
y4
现在五页,总共六十八页。
模型举例
现在十页,总共六十八页。
5、结构方程模型中的变量
潜变量 显变量
内生变量
外源变量
变量
指标
自变量
因变量
现在十一页,总共六十八页。
潜变量:不可以直接观察的变量,或叫因子。如自 信、成就等。 显变量:可以直接观察的变量,如收入、成绩等。
因子荷载
现在十二页,总共六十八页。
结构方程模型经典实用

• (2)数据处理选项,如EDF= 在没有使用 原始数据且未指定样本数N时为模型指定自 由度;NOBS= 指定样本数N。
•结构方程模型
•结构方程模型
2. 应用结构方程模型的注意事项
• (1)通径图中 ,内源变量与外源变量间的 关系都是线性的。实际工作中的非线性偏 离被认为是可以忽略的 ,若有强的非线性关 系则应当设法对变量作变换 ,以便可以用线 性作近似;
• (2)结构方程不支持小样本。一般要求样 本容量在 200 以上 ,或是要估计的参数数目 的 5~20 倍;
•结构方程模型
• (6)当模型与数据拟合时 ,说明数据并不排斥模 式 ,不能说数据可以确认模式 ,也不能证明某一理 论基础;
• (7) 用同一样本数据 ,以相同数目的待估参数和 不同的组合形式可以产生许多不同模型 ,这些等同 模型哪一个更适合于研究问题 ,应按照模式表达的 意义从专业角度来鉴别;
• (8)) SEM 不能验证变量间的因果关系。同其他 统计方法一样 ,当模型与样本拟合时 ,只能说该模 型是可供考虑的模型 ,是目前为止尚未被否定的模 型。只有经严格的实验设计控制其他变量的影响 , 才能探讨主要变量的因果效应。绝不能因为使用 了 SEM 便说证明模型正确。严格地说 ,尽管 SEM 不能证明因果关系 ,但它的生命力在于能寻找变量 间最可能的因果关系。
等)。
x1
y1
x2
自信
x3
x4
外向
y2
y3
y4
•结构方程模型
模型举例
•结构方程模型
结构方程模型模型简约

结构方程模型模型简约结构方程模型(Structural Equation Modeling,简称SEM)是统计分析中一种全面且常用的多变量分析方法,旨在为研究者提供一种综合分析因果关系和协方差关系的框架。
SEM通常被用来研究各种不同学科领域,例如心理学、社会学、经济学和教育学等。
本篇文章将对SEM模型的基本概念、模型参数、统计推断、SEM应用场景等方面进行展开分析。
一、SEM模型的基本概念1. 定义SEM模型是指一个由多个指标和潜在变量之间建立起的模型。
其中潜在变量被认为是不能被直接观察的,但是通过其他目测变量的表现来推断它们的存在。
2. 组成SEM模型由2个主要部分组成:测量模型和结构模型。
测量模型用于解释指标之间的相互影响,而结构模型则用于解释潜在变量之间的相互影响。
3. 图示SEM模型通常以图示的形式呈现。
测量模型被表示为一个菱形,而结构模型被表示为一个圆形。
指标和潜变量之间的箭头代表一个因果或协方差关系。
二、SEM模型的参数估计1. 参数含义SEM模型中,估计的参数主要包括:factor loading、path coefficient、error variance、covariance等。
2. 参数估计方法有三种主要的估计方法:最小二乘法(Least Squares)、最大似然估计(Maximum Likelihood)以及广义最小二乘(Generalized Least Squares)。
三、SEM模型的统计推断1. 假设检验在SEM模型中,主要的假设检验包括:各个因素之间的相关性是否为显著,以及是否存在其他的回归规律等。
2. 模型拟合度检验常用的模型拟合度指标包括:χ²值(Chi-Square)、比值似然比CFI (Comparative Fit Index)、标准拟合度指数NFI/NNFI(Normed Fit Index/Non-Normed Fit Index)等。
结构方程模型基础知识

结构方程这几年热度不减,有必要研究一下它的R语言实现过程,今天先复习一下结构方程的相关理论,参考吉林大学余翠林的ppt一、为什么使用SEM?1、回归分析有几方面的限制:(1)不允许有多个因变量或输出变量(2)中间变量不能包含在与预测因子一样的单一模型中(3)预测因子假设为没有测量误差(4)预测因子间的多重共线性会妨碍结果解释(5)结构方程模型不受这些方面的限制2、SEM的优点:(1)SEM程序同时提供总体模型检验和独立参数估计检验;(2)回归系数,均值和方差同时被比较,即使多个组间交叉;(3)验证性因子分析模型能净化误差,使得潜变量间的关联估计较少地被测量误差污染;(4)拟合非标准模型的能力,包括灵活处理追踪数据,带自相关误差结构的数据库(时间序列分析),和带非正态分布变量和缺失数据的数据库。
3、结构方程模型最为显著的两个特点是:(1)评价多维的和相互关联的关系;(2)能够发现这些关系中没有察觉到的概念关系,而且能够在评价的过程中解释测量误差。
同时具有联系信息技术吸纳能力:SEM能够反映模型中要素之间的相互影响;吸纳能力概念作为一个重要的模型要素,难以直接度量,结构方程模型技术能够更为充分地体现其蕴含的要素信息和影响作用。
二、SEM的基本思想与方法SEM是基于变量的协方差矩阵来分析变量之间关系的一种统计方法,实际上是一般线性模型的拓展,包括因子模型与结构模型,体现了传统路径分析与因子分析的完美结合。
SEM一般使用最大似然法估计模型(Maxi-Likeliheod,ML) 分析结构方程的路径系数等估计值,因为ML法使得研究者能够基于数据分析的结果对模型进行修正。
1、 SEM术语(1)观测变量可直接测量的变量,通常是指标(2)潜变量潜变量亦称隐变量,是无法直接观测并测量的变量。
潜变量需要通过设计若干指标间接加以测量。
(3)外生变量是指那些在模型或系统中,只起解释变量作用的变量。
它们在模型或系统中,只影响其他变量,而不受其他变量的影响。
结构模型资料

1.结构方程模式结构方程模式是在已有的因果理论基础上,用与之相应的线性方程系统表该因果理论的一种统计分析技术.目的在于探索事物间因果关系并将这种关系用因果模式、路径图等表述(Kline,R.B1998)。
一般,结构方程模式由测量和潜在变量两部分组成:测量部分求出观察指标与潜在变量之间的关系;潜在变量部分求出潜在变量与潜在变量之间关系。
因此,结构方程模式分为测量模式与潜在结构模式(侯杰泰,1994)。
测量模式的方程:X、Y分别是外源和内源指标;η、ε分别是内源和外源变量,δ、e分别是X、Y的测量误差;Λx是X指标与外源潜在变量ζ的关系;Λy是Y指标与内源潜在变量η的关系。
结构模式的方程:η=βη+Γε+ζη是内源潜在变量,ε是外源潜在变量间关系,ζ是内源潜在变量间关系,Γ是外源潜在变量对内源潜在变量影响,是模式内未能解释的部分。
2.结构方程模式的建构(1)模式构想出发点是为观察变量问候设的基本因果关系建立具体的模式。
这就需要清晰地说明变量间的因果联系,即通过路径图的方式,对变量间假定的因果联系予以描述。
但同时我们应该认识到.模式的建立必须以正确的理论为基础,如果某一路径缺乏理论依据,则它无法正确解释变量间的因果联系。
(2)模式限定可以用代表因果理论的线性方程系统表示理论上的模式。
在从概念理论到统计模式的过渡.可形成假设。
一假设是:线性模式可完全代表观察数据余假设分为:有关观察指标与潜在变量关系的假设;有关潜在变量或观察指标因果关系的方向及属性的假设。
(3)模式识别的判定模式形成的重要阶段是判定模式能否被识别。
要能识别某个模式,就需要说明线性方程的各个系统参数。
这些系统参数可根据观察分数的方差和协方差矩阵所提供的信息进行估计。
模式识别的必要但非充分条件是模式的参数个数不多于观察的方差和协方差数目(Duncan,1975;Everitt,1984)。
(4)模式拟合把统计模式与观察数据相拟合。
根据研究者的需要,可选用适当的拟合指标以考察模式与数据的拟合程度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
结构方程这几年热度不减,有必要研究一下它的R语言实现过程,今天先复习一下结构方程的相关理论,参考吉林大学余翠林的ppt
一、为什么使用SEM?
1、回归分析有几方面的限制:
(1)不允许有多个因变量或输出变量
(2)中间变量不能包含在与预测因子一样的单一模型中
(3)预测因子假设为没有测量误差
(4)预测因子间的多重共线性会妨碍结果解释
(5)结构方程模型不受这些方面的限制
2、SEM的优点:
(1)SEM程序同时提供总体模型检验和独立参数估计检验;
(2)回归系数,均值和方差同时被比较,即使多个组间交叉;
(3)验证性因子分析模型能净化误差,使得潜变量间的关联估计较少地被测量误差污染;
(4)拟合非标准模型的能力,包括灵活处理追踪数据,带自相关误差结构的数据库(时间序列分析),和带非正态分布变量和缺失数据的数据库。
3、结构方程模型最为显著的两个特点是:
(1)评价多维的和相互关联的关系;
(2)能够发现这些关系中没有察觉到的概念关系,而且能够在评价的过程中解释测量误差。
同时具有联系信息技术吸纳能力:
SEM能够反映模型中要素之间的相互影响;
吸纳能力概念作为一个重要的模型要素,难以直接度量,结构方程模型技术能够更为充分地体现其蕴含的要素信息和影响作用。
二、SEM的基本思想与方法
SEM是基于变量的协方差矩阵来分析变量之间关系的一种统计方法,实际上是一般线性模型的拓展,包括因子模型与结构模型,体现了传统路径分析与因子分析的完美结合。
SEM一般使用最大似然法估计模型(Maxi-Likeliheod,ML) 分析结构方程的路径系数等估计值,因为ML法使得研究者能够基于数据分析的结果对模型进行修正。
1、SEM术语
(1)观测变量可直接测量的变量,通常是指标
(2)潜变量潜变量亦称隐变量,是无法直接观测并测量的变量。
潜变量需要通过设计若干指标间接加以测量。
(3)外生变量是指那些在模型或系统中,只起解释变量作用的变量。
它们在模型或系统中,只影响其他变量,而不受其他变量的影响。
在路径图中,只有指向其他变量的箭头,没有箭头指向它的变量均为外生变量。
(4)内生变量是指那些在模型或系统中,受模型或系统中其它变量包括外生变量和内生变量影响的变量,即在路径图中,有箭头指向它的变量。
它们也可以影响其它变量。
2、结构方程模型示意图
观测变量通常用长方形或方形表示,外生观测变量用x表示,内生观测变量用y 表示。
潜变量用椭圆或圆形表示,外生潜变量通常用ξ表示,内生潜变量通常用η表示。
δ外生观测变量x的误差;ε内生观测变量y的误差。
3、结构方程
结构方程模型通常包括三个矩阵方程式:
Λx—外生观测变量与外生潜变量直接的关系,是外生观测变量在外生潜变量上的因子载荷矩阵;
Λy—内生观测变量与内生潜变量之间的关系,是内生观测变量在内生潜变量上的因子载荷矩阵;
В—路径系数,表示内生潜变量间的关系;
Г—路径系数,表示外生潜变量对内生潜变量的影响;
ζ—结构方程的残差项,反映了”在方程中未能被解释的部分。
三、结构方程模型的四大步骤
1、模型构建
构建研究模型,具体包括:观测变量(指标)与潜变量(因子)的关系,各潜变量之间的相互关系等
2、模型拟合
对模型求解,其中主要是模型参数的估计,求得参数使模型隐含的协方差距阵与样本协方差距阵的“差距”最小
3、模型评价
检查1)路径系数/载荷系数的显著性;2)各参数与预设模型的关系是否合理;3)各拟合指数是否通过
4、模型修正
模型扩展(使用修正指数)或模型限制(使用临界比率)
四、具体过程
1、数据准备
样本量:一般认为样本数最少应在100以上才适合使用最大似然估计法(MLE)来估计结构方程(侯杰泰,2004),但样本数过大(如超过400到500时),MLE会变得过度敏感,容易使所有的拟合度指标检验都出现拟合不佳的结果(侯杰泰,2004)。
缺失数据处理:列删除法、配对删除法、插补法
2、一般应用SEM的论文中的数据分析
(1).信度、效度检验
信度Cronbach’s >0.7
效度验证性因子分析
(2). 评估模型拟合度
即
估算每一个因子的载荷量
标准化因子载荷,反映了观测变量影响潜在变量的部分差异,用于表示观测变量与潜变量之间的相对重要程度。
检查每一个单一因子的测量模型对问卷数据的拟合度
检查整个模型对问卷数据的拟合度
估算潜变量之间的关系
五、SEM的主要拟合度指标
1、基本拟合标准
基本拟合标准是用来检验模型的误差以及误输入等问题。
主要包括:
(1)不能有负的测量误差;
(2)测量误差必须达到显著性水平;
(3)因子载荷必须介于0.5-0.95之间;
(4)不能有很大的标准误差。
2、模型内在结构拟合度
模型的内在结构拟合度是用来评价模型内估计参数的显著程度、各指标及潜在变量的信度。
主要包括:
(1)潜变量的组成信度(CR),0.7以上表明组成信度较好;
潜变量的CR值是其所有观测变量的信度的组合,该指标用来分析潜变量的各观测变量间的一致性
(2)平均提炼方差(AVE),0.5以上为可以接受的水平。
AVE用于估计测量模型的聚合效度,反映了潜变量的各观测变量对该潜变量的平均差异解释力,即潜变量的各观测变量与测量误差相比在多大程度上捕捉到了该潜变量的变化。
3、整体模型拟合度
整体模型拟合度是用来评价模型与数据的拟合程度。
主要包括:
(1)绝对拟合度,用来确定模型可以预测协方差阵和相关矩阵的程度;(2)简约拟合度,用来评价模型的简约程度;
(3)增值拟合度,理论模型与虚无模型的比较。
包括
(1)χ2卡方拟合指数检验选定的模型协方差矩阵与观察数据协方差矩阵相匹配的假设。
原假设是模型协方差阵等于样本协方差阵。
如果模型拟合的好,卡方值应该不显著。
在这种情况下,数据拟合不好的模型被拒绝。
(2)RMR 是残差均方根。
RMR 是样本方差和协方差减去对应估计的方差和协方差的平方和,再取平均值的平方根。
RMR应该小于0.08,RMR越小,拟合越好。
(3)RMSEA 是近似误差均方根RMSEA应该小于0.06,越小越好。
GFI 是拟合优度指数,范围在0和1间,但理论上能产生没有意义的负数。
按照约定,要接受模型,GFI 应该等于或大于0.90。
(4)PGFI 是简效拟合优度指数。
它是简效比率(PRATIO,独立模式的自由度与内定模式的自由度的比率)乘以GFI。
PGFI 应该等于或大于0.90,越接近1越好。
(5)PNFI 是简效拟合优度指数,等于PRATIO乘以NFI。
PNFI应该等于或大于0.90,越接近1越好。
(6)NFI 是规范拟合指数,变化范围在0和1间, 1 = 完全拟合。
按照约定,NFI 小于0.90 表示需要重新设置模型。
越接近1越好。
(7)TLI 是Tucker-Lewis 系数,也叫做Bentler-Bonett 非规范拟合指数(NNFI)。
TLI接近1表示拟合良好。
(8)CFI 是比较拟合指数,其值位于0和1之间。
CFI 接近1表示拟合非常好,其值大于0.90表示模型可接受,越接近1越好。
六模型修正
研究者可以参考察初始模型的显著性检验结果和软件(AMOS)提供的模型修正指标对模型进行修正。
(1)模型扩展添加新路径,提高模型的拟合度
修正指数(modification index)
整个模型改良时卡方值减少
(2)模型限制删除或限制部分路径,提高模型可识别性
临界比率(Critical ration for difference)
使结果更具有现实性和解释性
七、一个例子——消费者网上信任模型。