结构方程模型的应用及分析策略
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
结构方程模型的应用及分析策略
侯杰泰成子娟
(香港中文大学教育学院东北师范大学教育学院,130024)
摘要:差不多所有心理、教育、社会等概念,均难以直接准确测量,结构方程(SEM,Structural Equation Modelling)提供一个处理测量误差的方法,采用多个指标去反映潜在变量,也令估计整个模型因子间关系,较传统回归方法更为准确合理。本文主要用一系列有关学习动机的虚拟例子,指出每个问题的主要分析策略,以展示SEM在教育及心理学可以应用的研究范畴。文内探讨的方法包括:验证性因素、高阶因子、路径及因果分析、多时段(multiwave)设计、单形模型(Simple Model)、及多组比较等。
关键词结构方程验证性因素分析路径及因果分析高阶因子多组比较
结构方程(SEM,Structural Equation Modelling)、协方差结构模型(Covariance Structure Modelling、LISREL)等类似名词已渐流行,并成为一种十分重要的数据分析技巧;在大学高等学位研究课程,它是多变量分析(multivariate analysis)的重要课题;比较重要的社会、教育、心理期刊,也早已特开专栏介绍(如:候,1994;Connell & Tanaka,1987;Joreskog & Sorbom,1982);可见SEM在统计学中所建立的声望及崇高地位是无容置疑的。本文主要用一系列有关学习动机的虚拟例子,来指出每个问题的主要分析策略,以展示结构方程模型在教育及心理学可以应用的研究范畴。
一、结构方程:优点及拟合概念
1.数学模式
很多社会、心理等变项,均不能准确地及直接地量度,这包括智力、社会阶层、学习动机等,我们只好退而求其次,用一些外项指标(observable indicators),去反映这些潜伏变项。例如:我们以学生父母教育程度、父母职业及其收入(共六个变项),作为学生家庭社经地位(潜伏变项)的指标,我们又以学生中、英、数三科成绩(外显变项),作为学业成就(潜伏变项)的指标。
简单来说SEM可分测量(measurement)及潜伏变项(latent variable)两部分。测量部分就是求出六个社经指标与社经地位(或三科成绩与学业成就)(即外显指标与潜伏变项之间)的关系:而潜伏变项部分则指社经地位与学业成就(即潜伏变项与潜伏变项间)的关系。
指标(外显变项)含有随机(或系统)性的量度上误差,但潜伏变项则不含这些部份。SEM可用以下矩阵方程表示(Bollen,1989;Joreskog & Sorbom,1993):
η=βη+Γξ+ζ
(a)对于潜伏变项(如:社经地位与学业成就)的关系,即潜伏变项部份:
η——内生(依变)(endogenous,dependent)潜伏变项(如:学业成就)
ξ——外源(自变)(exogenous,independent)潜伏变项(如:社经地位)
β——内生潜伏变项间的关系(如:学业成绩与其他内生潜伏变项的关系)
г——外源变项对内生变项的影响(如:社经地位对学业成就)
ζ——模式内未能解释部份(即模式内所包含的变项及变项间关系所未能解释部分)
(b)对于指标与潜伏变项(例如:六个社经指标与社经地位)间的关系,即测量模式部分:
X=Λxξ+δ
Y=Λyη+ε
X,Y是外源(如:六项社经指标)及内生(如:中、英、数成绩)指标。δ,ε是X,Y 测量上的误差。
Λx是X指标与ξ潜伏变项的关系(如:六项社经地位指标与潜伏社经地位的关系)。Λy是Y指标与η潜伏变项的关系(如:中、英、数成绩与学业成就间关系)。
在一典型分析过程中,我们输入:各指标变项的协方差矩阵(covariance matrix)、总受试人数、指标与潜伏变项的从属关系(指标如何归属于各潜伏变项)。程式(如:LISREL)会估计指标与潜伏、潜伏与潜伏、模式未能解释部份、指标测量上误差等指定参数,其数值亦反映各关系的强弱。此外程式亦计算研究者所提出的模型,是否与样本数据吻合(即数据是否可用模式表示)。
2.SEM优点
Bollen和Long(1993)指出SEM有数项优点(江&侯,1997;林&
侯,1995;Marsh,Hau,Balla & Grayson,1998),包括:
(1)可同时考虑及处理多个依变项(endogenous / dependent variable);
(2)容许自变及依变(exogenous / endogenous)项含测量误差;
(3)与因素分析类同,SEM容许潜伏变项(如:社经地位)由多个观察指标变项(如:父母职业、收入)构成,并可同时估计指标变项的信度及效度(reliability and validity);
(4)SEM可采用比传统方法更有弹性的测量模型(measurement model),如某一指
标变项/题目从属于两潜伏因子;在传统方法,项目多依附单一因子;
(5)研究者可构划出潜伏变项间的关系,并估计整个模式是否与数据拟合。
3.拟合概念
当我们测试某一模型时,其实我们在研究自己所提的模型(即哪些变项之间
有关,哪些则没有),是否与数据拟合。
SEM所输入的是指标变项的样本协方差矩阵(S,sample covariance
matrix)(注:虽然在一些SEM分析中,我们必须用协方差矩阵,但为方便了解,读
者亦可假设下述所有协方差矩阵为相关矩阵correlation matrix),而依我们指
定先验(a priori)模式,计算出一个最佳的衍生矩阵(E, reproduced/fitted covariance matrix); E与S接近,则表示我们建议的模型成立,若E与S差异大,则表示模型与数据不符;拟合优指数(CFI)是用于反映E与S差异的一个总指标。用以表达数据与模型吻合程度的指数甚多(e.g,侯、成、钟,1995;Marsh,Balla,& Hau, 1996),为简便起见,在下文我们只用CFI,当指数愈接近1,吻合愈好;指数愈小,则表示吻合愈差。
例如:我们有A、B、C、D、E、F六潜伏变项,我们建议的模型是:A、B是有
相关,而A、B引起C、D;C、D则导致E、F。假设S是所有指标变项(构成A、B、C、D、E、F的所有指标)的协方差矩阵,而E则是LISREL依上述模型估计出的最佳衍生矩阵;若拟合优指数高则表示E与S差异甚小,反之,则E与S差异甚大。
二、常用结构模型之应用
我们用一系列有关学习动机的虚拟例子,以说明结构方程模型的一些应用范围。所有模型的拟合结果及路经系数,均只设计用于协助讨论,并非由真实数据所得。在学习动机理论中,我们知道那些相信智力主要是后天决定的学生,他们更多倾向勤奋学习;相反,那些认为智力是遗传天生的,遇困难易于放弃(e.g., Dweck, Chiu & Hong, 1995; Hau & Salili, 1996),这种智力的内隐理论(implicit theory)影响著学生的动机行为。
1.验证性因素分析
假设我们不单对智力内隐理论有兴趣,我们也希望了解学生对性格、道德、创造力、情绪智力的看法,这五种个人属性是否天生不变?还是后天努力而形成的?我们设计一份共25题的问卷,每一属性各5题,用9点量表([十分同意]至[十分不同意];例如:在智力属性,[聪明与否,主要是由遗传决定的])。被试为500名初中三学生。
我们首先当然希望验证25项题目是否一如编写题目时的构念一样,分别从
属五个因子。与传统探索性因素分析(EFA)不同,在验证性因子分析(CFA),我们可以限制题目与各因子的从属关系,一般来说每题只从属一个因子;相反地,在EFA,