第七章 隐变量模型(计量经济模型课件中科院,许健)总结
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
将CFA作为对隐变量的测量,嫁接到路径 分析上,从而使路径分析具有了包含、 处理隐变量的能力。
一、结构方程模型的形成
从SEM的角度来看,CFA和路径分析都可 以视为一种特殊的结构方程模型,它们 都是SEM的一部分,即:
路径分析构成SEM的结构模型部分;CFA 构成它的测量模型部分。
一、结构方程模型的形成
结构方程模型
结构方程模型:SEM,(Structural Equation Modeling),是目前处理隐变 量以及复杂关联的主要模型。
主要内容:
结构方程模型的形成 模型的设定 模型的识别 模型的假定 模型的估计 模型的评价 模型的改进 模型的解释 应用案例
一、结构方程模型的形成
第七章 隐变量模型
关于隐变量
隐变量(Latent variable): 具有不可直接观测特征的综合性变量, 不可观测,或者说“隐”是其表象;综 合性是其本质。 与隐变量相应,我们将普通的变量称为 显变量(Manifest Variable)或者观测变 量(Observed Variable)
隐变量的处理思路
2
三、模型的识别
识别条件之二:递归规则
2 33
X4
Y3
2
22
3
二、结构方程模型的设定
模型设定的方程形式(按照LISREL的规定)
结构方程模型由3组方程,4组变量(2组有数 据),8个参数矩阵(待估计)所组成:
B X X Y Y
二、结构方程模型的设定
符号规定 四组变量:
CFA与EFA的根本区别在于是前者用以证实一个先验的 理论假设(表现为因子结构的规定)是否成立,需根 据相关理论事先规定作为公因子的隐变量的概念和数 量,以及隐变量和指标变量间的路径,后者则以探索 数据潜在的结构为目标,事先无须依据理论做任何设 定,隐变量的概念和数量以及哪些变量是其指标变量 均有待模型建立后,再根据理论知识予以确定。
22 0 33
三、模型的识别
联立方程都存在识别问题,即是否有足够的 方程以求得未知参数的解。一般说来,有三 种识变状态: 不能识别(Under identified) 恰好识别(Just identified) 过度识别(Over identified)
不使用模型处理隐变量的方法
3、生产函数余值法 根据CD生产函数可以推出,经济增长率等于要 素生产率的变化率(即技术进步率)加上资本 增长率与资本边际产出弹性之乘积,再加上劳 动增长率与劳动边际产出弹性之乘积。以经济 增长率减去其它两部分,就得到要素生产率这 个隐变量的变化率,将它比上经济增长率就可 得到贡献率。
X:外生指标变量向量; Y:内生指标变量向量;
:外生隐变量向量; :内生隐变量向量;
二、结构方程模型的设定
三组方程
B 外生隐变量测量方程: X X 内生隐变量测量方程: Y Y
结构方程:
二、结构方程模型的设定
符号规定 8个参数矩阵: Beta(记做B或BE):内生隐变量间结构系数矩阵; Gamma(记做Г 或GA):内生与外生隐变量间结构 系数阵; Phi(记做Φ 或PH):外生隐变量的协差阵; Psi(记做Ψ 或PS):内生隐变量误差项的协差阵;
一、结构方程模型的形成
无论是CFA还是EFA,都以隐变量(即潜 在结构)为核心,以显变量为其测度, 认为这些测度变量是隐变量的外在表现, 由隐变量所决定,因此可以利用测度变 量之间的关系推出其与内在隐变量的联 系,即因子载荷,这正是SEM处理隐变量 的思想。
一、结构方程模型的形成
将CFA与路径分析结合在一起就是SEM技 术。这两种方法的结合,可以理解为:
一、结构方程模型的形成
路径分析与一般线性模型不同的特色主要体 现在如下四个方面:
1、变量之间的关系必须先根据理论予以设定; 2、以路径图做为描述模型的重要工具; 3、将参数估计建立在变量的相关系数或协方差的基础上; 4、将简单相关系数分解为直接相关系数,间接相关系数。
一、结构方程模型的形成
证实性因子分析
二、结构方程模型的设定
模型设定的RAM图形式(Reticular Action Modeling)
根据理论分析绘制RAM图,是结构方程模 型建模的起点,也是表达建模结果的最有 效形式。
二、结构方程模型的设定
RAM图基本规定
1.变量用大写英文或希腊字母表示,其外围围以 方框的是显变量,其外围围以椭圆的是隐变量。 残差以小写希腊字母表示,外围亦应围以椭圆 (但为方便起见,经常不用);
二、结构方程模型的设定
2.路径用带箭头的线表示:
直的单方向箭头:表示因果关系,箭头所指为果; 双向箭头弧线:表示相关关系; 从自身到自身的双向箭头线:表示变量的方差。
二、结构方程模型的设定
3. 在每一条路径上以小写的英文或希腊字 母表示待估计的结构系数或方差,以数字 表示事先确定的固定参数;
4. 在图中,凡为因果路径所指者,为内生 变量,凡无如此箭头所指者为外生变量。
二、结构方程模型的设定
前图用方程形式表示:
1 1 1 1 B 2 2 2 2
X1 1 1 2 X2 X X 2 3 3 X 4 4
不使用模型处理隐变量的方法
2、德尔菲法
又名专家调查法,它的思想十分简单,即以专家判断 的方式对隐变量进行量化。 德尔菲法与多指标加权方法相比,其优势在于它更适 合于那些很难找到合适指标作为其测度的隐变量;其 不足则在于:1)需要进行调查,从而提高了分析的成 本;2)不能对隐变量进行深入进一步的分析;3)降 低了数据的计量尺度。
结构方程模型有两个思想来源:
路径分析(path analysis) 证实性因子分析(Confirmatory Factor Analysis,CFA ) (注意:通常所说因子分析是探索性因子分析,
Exploratory Factor Analysis,EFA)
一、结构方程模型的形成
路径分析
在20世纪二三十年代,由 Wright(1921, 1934)提出,与古典的多元线性回归模型相比, 路径分析是一种更为灵活、有力的多元数据分 析工具。
一、结构方程模型的形成
路径分析与线性回归分析最根本的区别 在于:
路径分析中,所有的变量都是随机变量, 从而所有的变量之间都可以有相关关系。 这毫无疑问是更接近于现实的假设,尤 其在社会经济领域。
不使用模型处理隐变量的方法
多指标综合评价的关键环节有二:
第一个环节是测度指标的选择; 第二个环节是权数的确定。
不使用模型处理隐变量的方法
多指标综合加权法的长处:
1)思路直观、方法简便、适用面广; 2)可容纳指标数量较多,更适合理论的需要; 3)可以对样本进行比较、排序,而且便于对隐 变量进一步的分析; 4)不依赖于变量的分布。
二、结构方程模型的设定
Lambda X (记做 Λ X 或 LX ):外生隐变量与其指 标变量间的结构系数矩阵;
Theta Delta(记做Θ δ 或TD):外生显变量测量 误差项的协差阵; Lambda Y(记做Λ Y或LY):内生隐变量与其指标 变量间的结构系数矩阵; Theta Epsilon(记做Θ ε 或TE):内生显变量测 量误差项的协差阵。
不使用模型处理隐变量的方法
第二类方法则利用隐变量和其它变量 (不是该隐变量的测度变量)之间的关 系,建立某种函数关系,以此为处理隐 变量的基础,它不需要搜集隐变量测度 指标这一过程。此类方法只能处理特殊 的隐变量,不具一般性。
不使用模型处理隐变量的方法
1、多指标综合评价法 根据隐变量的含义,将原本综合性的变量进行 分解,分解后隐变量的维度就从一维到了多维, 在此基础上,在每个维度选择合适的观测变量 度量隐变量在该方面的表现,最后再将这些观 测变量按一定的原则加权汇总,由多维又重新 回到一维,所得同时反映这多维表现的综合变 量即可做为对隐变量的度量。
Y1 0 1 Y2 Y 2 2 Y 3 3
二、结构方程模型的设定
4个结构系数矩阵是:
0 X 11 X 21 0 X 0 X 32 0 X 42 1 0 Y 0 Y 22 0 Y 32
不使用模型处理隐变量的方法
此种方法的不足之处则在于: 1)用以构建综合变量的观测变量,往往受多种 因素的影响,有时甚至作为测度对象的隐变 量不是主要的影响因素,因此最终得到的隐 变量的估计值,必定存在着系统的偏差; 2)加权所使用的权数难以确定 ; 3)不能提供对误差的度量,从而无法估计所建 立的隐变量测度的准确性。
0 12 B 0 0
11 0 21 22
二、结构方程模型的设定
4个协方差阵是:
1 0 1 11 0 22
11 21 22 0 0 33 0 0 0 44
SEM的优势:
能处理隐变量问题 可以处理复杂关联 可以处理随机误差相关问题 可包含测量误差
二、结构方程模型的设定
基本概念 方程: 分为测量方程与结构方程。测量方程反 映显变量和隐变量之间的联系,结构方 程反映隐变量之间的关系
二、结构方程模型的设定
变量: 隐变量和显变量(又名指标变量、观测变量), 进一步又分成: 外生隐变量:由模型以外因素决定; 内生隐变量:由模型内因素决定; 内生指标变量:作为内生隐变量的测度指标; 外生指标变量:作为外生隐变量的测度指标。
三、模型的识别
识别条件之一:t规则 协差阵中数据点的个数必须大于待估参数 的个数,这一条件是必要非充分条件。
SEM以最小化估计协差阵与样本协差阵为目标函 数,1个数据点即意味着一个方程。 如果将外生显变量的个数记为p,内生显变量的 个数为q,则待估参数(包括自由参数、限制参 数)的个数不能超过: p q p q 1
二、结构方程模型的设定
误差项 模型内有两类误差: 测量误差:内生、外生指标变量在测量隐 变量上的误差; 结构方程误差:影响内生隐变量的误差。
二、结构方程模型的设定
参数: 限制参数(restricted parameters): 限制其取值范围的参数; 固定参数(fixed parameters): 设定为常数的参数; 自由参数(free parameters): 不加任何设定由模型进行估计的参数。
二、结构方程模型的设定
RAM图示例
11
21
1 2
1 X1 X2
22 33
X 11 X 21 1 X 32 X 42 2
1
1 11 21
11
1 η
1
Y1
22
Y2
3
4
X3
44
22
12
η
2
Y 22 Y 32
隐变量的处理方法按照其所使用的分析 手段可以分为两大类:
以结构方程模型为代表的模型化方法 以多指标综合加权为代表的不使用模型的方法。
不使用模型处理隐变量的方法
Hale Waihona Puke Baidu
除结构方程模型外的其它处理方法可分 成两类: 第一类方法利用隐变量的多维特点,从 各个角度选择恰当的观测变量作为其测 度指标,以此作为隐变量处理的基础, 目前来看所有具有一般性的隐变量处理 方法,其思想均属此类;
一、结构方程模型的形成
从SEM的角度来看,CFA和路径分析都可 以视为一种特殊的结构方程模型,它们 都是SEM的一部分,即:
路径分析构成SEM的结构模型部分;CFA 构成它的测量模型部分。
一、结构方程模型的形成
结构方程模型
结构方程模型:SEM,(Structural Equation Modeling),是目前处理隐变 量以及复杂关联的主要模型。
主要内容:
结构方程模型的形成 模型的设定 模型的识别 模型的假定 模型的估计 模型的评价 模型的改进 模型的解释 应用案例
一、结构方程模型的形成
第七章 隐变量模型
关于隐变量
隐变量(Latent variable): 具有不可直接观测特征的综合性变量, 不可观测,或者说“隐”是其表象;综 合性是其本质。 与隐变量相应,我们将普通的变量称为 显变量(Manifest Variable)或者观测变 量(Observed Variable)
隐变量的处理思路
2
三、模型的识别
识别条件之二:递归规则
2 33
X4
Y3
2
22
3
二、结构方程模型的设定
模型设定的方程形式(按照LISREL的规定)
结构方程模型由3组方程,4组变量(2组有数 据),8个参数矩阵(待估计)所组成:
B X X Y Y
二、结构方程模型的设定
符号规定 四组变量:
CFA与EFA的根本区别在于是前者用以证实一个先验的 理论假设(表现为因子结构的规定)是否成立,需根 据相关理论事先规定作为公因子的隐变量的概念和数 量,以及隐变量和指标变量间的路径,后者则以探索 数据潜在的结构为目标,事先无须依据理论做任何设 定,隐变量的概念和数量以及哪些变量是其指标变量 均有待模型建立后,再根据理论知识予以确定。
22 0 33
三、模型的识别
联立方程都存在识别问题,即是否有足够的 方程以求得未知参数的解。一般说来,有三 种识变状态: 不能识别(Under identified) 恰好识别(Just identified) 过度识别(Over identified)
不使用模型处理隐变量的方法
3、生产函数余值法 根据CD生产函数可以推出,经济增长率等于要 素生产率的变化率(即技术进步率)加上资本 增长率与资本边际产出弹性之乘积,再加上劳 动增长率与劳动边际产出弹性之乘积。以经济 增长率减去其它两部分,就得到要素生产率这 个隐变量的变化率,将它比上经济增长率就可 得到贡献率。
X:外生指标变量向量; Y:内生指标变量向量;
:外生隐变量向量; :内生隐变量向量;
二、结构方程模型的设定
三组方程
B 外生隐变量测量方程: X X 内生隐变量测量方程: Y Y
结构方程:
二、结构方程模型的设定
符号规定 8个参数矩阵: Beta(记做B或BE):内生隐变量间结构系数矩阵; Gamma(记做Г 或GA):内生与外生隐变量间结构 系数阵; Phi(记做Φ 或PH):外生隐变量的协差阵; Psi(记做Ψ 或PS):内生隐变量误差项的协差阵;
一、结构方程模型的形成
无论是CFA还是EFA,都以隐变量(即潜 在结构)为核心,以显变量为其测度, 认为这些测度变量是隐变量的外在表现, 由隐变量所决定,因此可以利用测度变 量之间的关系推出其与内在隐变量的联 系,即因子载荷,这正是SEM处理隐变量 的思想。
一、结构方程模型的形成
将CFA与路径分析结合在一起就是SEM技 术。这两种方法的结合,可以理解为:
一、结构方程模型的形成
路径分析与一般线性模型不同的特色主要体 现在如下四个方面:
1、变量之间的关系必须先根据理论予以设定; 2、以路径图做为描述模型的重要工具; 3、将参数估计建立在变量的相关系数或协方差的基础上; 4、将简单相关系数分解为直接相关系数,间接相关系数。
一、结构方程模型的形成
证实性因子分析
二、结构方程模型的设定
模型设定的RAM图形式(Reticular Action Modeling)
根据理论分析绘制RAM图,是结构方程模 型建模的起点,也是表达建模结果的最有 效形式。
二、结构方程模型的设定
RAM图基本规定
1.变量用大写英文或希腊字母表示,其外围围以 方框的是显变量,其外围围以椭圆的是隐变量。 残差以小写希腊字母表示,外围亦应围以椭圆 (但为方便起见,经常不用);
二、结构方程模型的设定
2.路径用带箭头的线表示:
直的单方向箭头:表示因果关系,箭头所指为果; 双向箭头弧线:表示相关关系; 从自身到自身的双向箭头线:表示变量的方差。
二、结构方程模型的设定
3. 在每一条路径上以小写的英文或希腊字 母表示待估计的结构系数或方差,以数字 表示事先确定的固定参数;
4. 在图中,凡为因果路径所指者,为内生 变量,凡无如此箭头所指者为外生变量。
二、结构方程模型的设定
前图用方程形式表示:
1 1 1 1 B 2 2 2 2
X1 1 1 2 X2 X X 2 3 3 X 4 4
不使用模型处理隐变量的方法
2、德尔菲法
又名专家调查法,它的思想十分简单,即以专家判断 的方式对隐变量进行量化。 德尔菲法与多指标加权方法相比,其优势在于它更适 合于那些很难找到合适指标作为其测度的隐变量;其 不足则在于:1)需要进行调查,从而提高了分析的成 本;2)不能对隐变量进行深入进一步的分析;3)降 低了数据的计量尺度。
结构方程模型有两个思想来源:
路径分析(path analysis) 证实性因子分析(Confirmatory Factor Analysis,CFA ) (注意:通常所说因子分析是探索性因子分析,
Exploratory Factor Analysis,EFA)
一、结构方程模型的形成
路径分析
在20世纪二三十年代,由 Wright(1921, 1934)提出,与古典的多元线性回归模型相比, 路径分析是一种更为灵活、有力的多元数据分 析工具。
一、结构方程模型的形成
路径分析与线性回归分析最根本的区别 在于:
路径分析中,所有的变量都是随机变量, 从而所有的变量之间都可以有相关关系。 这毫无疑问是更接近于现实的假设,尤 其在社会经济领域。
不使用模型处理隐变量的方法
多指标综合评价的关键环节有二:
第一个环节是测度指标的选择; 第二个环节是权数的确定。
不使用模型处理隐变量的方法
多指标综合加权法的长处:
1)思路直观、方法简便、适用面广; 2)可容纳指标数量较多,更适合理论的需要; 3)可以对样本进行比较、排序,而且便于对隐 变量进一步的分析; 4)不依赖于变量的分布。
二、结构方程模型的设定
Lambda X (记做 Λ X 或 LX ):外生隐变量与其指 标变量间的结构系数矩阵;
Theta Delta(记做Θ δ 或TD):外生显变量测量 误差项的协差阵; Lambda Y(记做Λ Y或LY):内生隐变量与其指标 变量间的结构系数矩阵; Theta Epsilon(记做Θ ε 或TE):内生显变量测 量误差项的协差阵。
不使用模型处理隐变量的方法
第二类方法则利用隐变量和其它变量 (不是该隐变量的测度变量)之间的关 系,建立某种函数关系,以此为处理隐 变量的基础,它不需要搜集隐变量测度 指标这一过程。此类方法只能处理特殊 的隐变量,不具一般性。
不使用模型处理隐变量的方法
1、多指标综合评价法 根据隐变量的含义,将原本综合性的变量进行 分解,分解后隐变量的维度就从一维到了多维, 在此基础上,在每个维度选择合适的观测变量 度量隐变量在该方面的表现,最后再将这些观 测变量按一定的原则加权汇总,由多维又重新 回到一维,所得同时反映这多维表现的综合变 量即可做为对隐变量的度量。
Y1 0 1 Y2 Y 2 2 Y 3 3
二、结构方程模型的设定
4个结构系数矩阵是:
0 X 11 X 21 0 X 0 X 32 0 X 42 1 0 Y 0 Y 22 0 Y 32
不使用模型处理隐变量的方法
此种方法的不足之处则在于: 1)用以构建综合变量的观测变量,往往受多种 因素的影响,有时甚至作为测度对象的隐变 量不是主要的影响因素,因此最终得到的隐 变量的估计值,必定存在着系统的偏差; 2)加权所使用的权数难以确定 ; 3)不能提供对误差的度量,从而无法估计所建 立的隐变量测度的准确性。
0 12 B 0 0
11 0 21 22
二、结构方程模型的设定
4个协方差阵是:
1 0 1 11 0 22
11 21 22 0 0 33 0 0 0 44
SEM的优势:
能处理隐变量问题 可以处理复杂关联 可以处理随机误差相关问题 可包含测量误差
二、结构方程模型的设定
基本概念 方程: 分为测量方程与结构方程。测量方程反 映显变量和隐变量之间的联系,结构方 程反映隐变量之间的关系
二、结构方程模型的设定
变量: 隐变量和显变量(又名指标变量、观测变量), 进一步又分成: 外生隐变量:由模型以外因素决定; 内生隐变量:由模型内因素决定; 内生指标变量:作为内生隐变量的测度指标; 外生指标变量:作为外生隐变量的测度指标。
三、模型的识别
识别条件之一:t规则 协差阵中数据点的个数必须大于待估参数 的个数,这一条件是必要非充分条件。
SEM以最小化估计协差阵与样本协差阵为目标函 数,1个数据点即意味着一个方程。 如果将外生显变量的个数记为p,内生显变量的 个数为q,则待估参数(包括自由参数、限制参 数)的个数不能超过: p q p q 1
二、结构方程模型的设定
误差项 模型内有两类误差: 测量误差:内生、外生指标变量在测量隐 变量上的误差; 结构方程误差:影响内生隐变量的误差。
二、结构方程模型的设定
参数: 限制参数(restricted parameters): 限制其取值范围的参数; 固定参数(fixed parameters): 设定为常数的参数; 自由参数(free parameters): 不加任何设定由模型进行估计的参数。
二、结构方程模型的设定
RAM图示例
11
21
1 2
1 X1 X2
22 33
X 11 X 21 1 X 32 X 42 2
1
1 11 21
11
1 η
1
Y1
22
Y2
3
4
X3
44
22
12
η
2
Y 22 Y 32
隐变量的处理方法按照其所使用的分析 手段可以分为两大类:
以结构方程模型为代表的模型化方法 以多指标综合加权为代表的不使用模型的方法。
不使用模型处理隐变量的方法
Hale Waihona Puke Baidu
除结构方程模型外的其它处理方法可分 成两类: 第一类方法利用隐变量的多维特点,从 各个角度选择恰当的观测变量作为其测 度指标,以此作为隐变量处理的基础, 目前来看所有具有一般性的隐变量处理 方法,其思想均属此类;