高级计量经济学二元选择模型PPT课件
合集下载
二元选择模型

• (1) 平均边际效应(average marginal effect),即分别计算在每 个样本观测值上的边际效应,然后进行简单算术平均。
• (2) 样本均值处的边际效应 (marginal effect at mean),即在
• X=均值处的边际效应。
• (3) 在某代表值处的边际效应 (marginal effect at a
二、限值因变量模型
限值因变量有哪些情形 (limited dependent variable
regression model, LDV)
• 当因变量为定性变量或不连续变量 或是受约束的变量时,统称为限值 因变量回归模型。
• 不同的限值因变量模型中,因变量的 情形不同,所使用的估计方法不同, 如非线性最小二乘法,但使用最大似 然估计法较多。
限值因变量有哪些情形
(limited dependent variable
regression model, LDV)
线性概率模型(linear probability model,LPM)、对数单位模型( logit model)、概率单位模型 (probit model)、托比模型(tobit model)、泊松模型(possion model) 、截取回归模型(censored regression model)、断尾回归模型 (truncated regression model)
二元选择模型(Binary outcome model)
一、线性概率模型
二、Logit model 三、probit model 二元选择模型下的参数估计、解释、系数
解释等。
2.1 线性概率模型
• 因变量是一个取值为0,1的二值结果的分 类变量
考虑模型:
• (2) 样本均值处的边际效应 (marginal effect at mean),即在
• X=均值处的边际效应。
• (3) 在某代表值处的边际效应 (marginal effect at a
二、限值因变量模型
限值因变量有哪些情形 (limited dependent variable
regression model, LDV)
• 当因变量为定性变量或不连续变量 或是受约束的变量时,统称为限值 因变量回归模型。
• 不同的限值因变量模型中,因变量的 情形不同,所使用的估计方法不同, 如非线性最小二乘法,但使用最大似 然估计法较多。
限值因变量有哪些情形
(limited dependent variable
regression model, LDV)
线性概率模型(linear probability model,LPM)、对数单位模型( logit model)、概率单位模型 (probit model)、托比模型(tobit model)、泊松模型(possion model) 、截取回归模型(censored regression model)、断尾回归模型 (truncated regression model)
二元选择模型(Binary outcome model)
一、线性概率模型
二、Logit model 三、probit model 二元选择模型下的参数估计、解释、系数
解释等。
2.1 线性概率模型
• 因变量是一个取值为0,1的二值结果的分 类变量
考虑模型:
二计量经济学模型共34页35页PPT

• 作为“原因”的变量,例如生产函数中的资本、劳动、技 术,是模型中的解释变量,在单一方程模型中,处于右端
解释变量与被解释变量
lY n A a lK n b lL n
被解释变量
解释变量
如何正确地选择解释变量?
(1) 需 要 正 确 理 解 和 把 握 所 研 究的经济现象中暗含的经济学 理论和经济行为规律。 (2) 选 择 变 量 要 考 虑 数 据 的 可 得性。 (3) 选 择 变 量 时 要 考 虑 所 有 入 选变量之间的关系,使得每一 个解释变量都是独立的。
前定变量
• 滞后内生变量的数值是前期所决定的, • 因此,它和外生变量都是在求解本期内生
变量之前已经确定了的变量 • 滞后变量与外生变量合称为前定变量 • 用作解释变量
前定变量用法
1. 滞后内生变量的作用视着外生变量。 2. 在单一模型中,前定变量多作为自变量,
内生变量一般作为应变量;在联立方程模 型中内生变量既可以作为应变量也可以作 为自变量。
如何解决
图1-2
一、理论模型的设计 1.确定模型所包含的变量 2.确定模型的数学形式 3.拟定理论模型中待估参数的理论 期望值 二、样本数据的收集 三、模型参数的估计 四、模型的检验 五、模型的应用
一、理论模型的设计
1.确定模型所包含的变量
在单方程模型中,变量分为两类。作 为研究对象的变量,也就是因果关系中 的“果”,是模型中的被解释变量;而 作为“原因”的变量,是模型中的解释 变量。确定模型所包含的变量,主要是 指确定解释变量。可以作为解释变量的 有下列几类变量:外生经济变量、外生 条件变量、外生政策变量和滞后被解释 变量。
初级水平。
3.理论计量经济学与应用计量经济学
解释变量与被解释变量
lY n A a lK n b lL n
被解释变量
解释变量
如何正确地选择解释变量?
(1) 需 要 正 确 理 解 和 把 握 所 研 究的经济现象中暗含的经济学 理论和经济行为规律。 (2) 选 择 变 量 要 考 虑 数 据 的 可 得性。 (3) 选 择 变 量 时 要 考 虑 所 有 入 选变量之间的关系,使得每一 个解释变量都是独立的。
前定变量
• 滞后内生变量的数值是前期所决定的, • 因此,它和外生变量都是在求解本期内生
变量之前已经确定了的变量 • 滞后变量与外生变量合称为前定变量 • 用作解释变量
前定变量用法
1. 滞后内生变量的作用视着外生变量。 2. 在单一模型中,前定变量多作为自变量,
内生变量一般作为应变量;在联立方程模 型中内生变量既可以作为应变量也可以作 为自变量。
如何解决
图1-2
一、理论模型的设计 1.确定模型所包含的变量 2.确定模型的数学形式 3.拟定理论模型中待估参数的理论 期望值 二、样本数据的收集 三、模型参数的估计 四、模型的检验 五、模型的应用
一、理论模型的设计
1.确定模型所包含的变量
在单方程模型中,变量分为两类。作 为研究对象的变量,也就是因果关系中 的“果”,是模型中的被解释变量;而 作为“原因”的变量,是模型中的解释 变量。确定模型所包含的变量,主要是 指确定解释变量。可以作为解释变量的 有下列几类变量:外生经济变量、外生 条件变量、外生政策变量和滞后被解释 变量。
初级水平。
3.理论计量经济学与应用计量经济学
《高级计量经济学》幻灯片

京:中国统计出版社
• 高雪梅主编(2005).?计量经济分析方法与建模:
EVIEWS应用及实例?.北京:清华大学出版社.
4
△ 初、中、高级计量经济学
• 初级以计量经济学的数理统计学根底知识和经
典的线性单方程模型理论与方法为主要内容;
• 中级以用矩阵描述的经典的线性单方程模型理
论与方法、经典的线性联立方程模型理论与方 法,以及传统的应用模型为主要内容;
概率论根底
• 克莱因成为其理论与应用的集大成者
6
• 经典计量经济学在理论方法方面特征是: • ⑴ 模型类型—随机模型; • ⑵ 模型导向—理论导向; • ⑶ 模型构造—线性或者可以化为线性,因
果分析,解释变量具有同等地位,模型具有明 确的形式和参数;
• ⑷ 数据类型—以时间序列数据或者截面数
据为样本,被解释变量为服从正态分布的连续 随机变量;
2
参考书目 7.William H. Greene?计量经济学分析?,中国社会 科学出版社。 清华大学出版社出了该书的英文影印本 8. Michael Intriligator, Ronald Bodkin and Cheng Hsiao.?Econometric models, techniques, and applications?, Prentice Hall Inc. 9.Robert S. Pindyck and Daniel L. Rubinfeld?计 量经济学模型与经济预测?,机械工业出版社。 10.Ramu Ramanathan.?应用经济计量学?,机械 工业出版社。
11
• 宏观计量经济学名称由来已久,但是它的主要
内容和研究方向发生了变化。
• 经典宏观计量经济学:利用计量经济学理论方
• 高雪梅主编(2005).?计量经济分析方法与建模:
EVIEWS应用及实例?.北京:清华大学出版社.
4
△ 初、中、高级计量经济学
• 初级以计量经济学的数理统计学根底知识和经
典的线性单方程模型理论与方法为主要内容;
• 中级以用矩阵描述的经典的线性单方程模型理
论与方法、经典的线性联立方程模型理论与方 法,以及传统的应用模型为主要内容;
概率论根底
• 克莱因成为其理论与应用的集大成者
6
• 经典计量经济学在理论方法方面特征是: • ⑴ 模型类型—随机模型; • ⑵ 模型导向—理论导向; • ⑶ 模型构造—线性或者可以化为线性,因
果分析,解释变量具有同等地位,模型具有明 确的形式和参数;
• ⑷ 数据类型—以时间序列数据或者截面数
据为样本,被解释变量为服从正态分布的连续 随机变量;
2
参考书目 7.William H. Greene?计量经济学分析?,中国社会 科学出版社。 清华大学出版社出了该书的英文影印本 8. Michael Intriligator, Ronald Bodkin and Cheng Hsiao.?Econometric models, techniques, and applications?, Prentice Hall Inc. 9.Robert S. Pindyck and Daniel L. Rubinfeld?计 量经济学模型与经济预测?,机械工业出版社。 10.Ramu Ramanathan.?应用经济计量学?,机械 工业出版社。
11
• 宏观计量经济学名称由来已久,但是它的主要
内容和研究方向发生了变化。
• 经典宏观计量经济学:利用计量经济学理论方
2024版计量经济学(很好用的完整)ppt课件

贝叶斯计量经济学的定义
基于贝叶斯定理和概率分布理论进行计量分析的经济学分支。
贝叶斯先验分布的设定
根据历史数据、专家经验等因素设定参数的先验分布,作为后续推 断的基础。
贝叶斯计量模型的估计方法
包括马尔科夫链蒙特卡罗方法、变分贝叶斯方法等,用于估计模型 参数和进行统计推断。
机器学习在计量经济学中应用
机器学习算法在计量经济学中的应用场景
广义线性模型介绍
1
定义
广义线性模型是一类用于回归分析的统计 模型,它扩展了线性模型的框架,允许响 应变量遵循非正态分布,并且可以通过一 个链接函数与解释变量建立线性关系。
2
组成
广义线性模型由三部分组成——随机成分、 系统成分和链接函数。随机成分指定响应 变量的分布类型和参数,系统成分描述解 释变量与响应变量之间的线性关系,链接 函数则将随机成分和系统成分连接起来。
06
计量经济学软件应用
EViews软件介绍及操作指南
01
EViews软件概述
EViews是一款功能强大的计量 经济学软件,广泛应用于数据 分析、模型估计和预测等领域。
02
数据导入与预处理
介绍如何在EViews中导入数据、 进行数据清洗和预处理等操作。
03
模型估计与检验
详细讲解EViews中线性回归模 型、时间序列模型等模型的估 计方法,以及模型的检验和诊 断。
THANKS
包括变量选择、模型诊断、预测等。
监督学习在计量经济学中的应用
通过训练数据集学习模型,然后利用测试数据集评估模型性能。
非监督学习在计量经济学中的应用
通过聚类、降维等技术发现数据中的潜在结构和模式。
深度学习在计量经济学中的应用
高级计量经济学 第五章 二元选择模型-PPT精选文档

案例分析
共调查126户农户。
案例分析
注:用第一喜欢的技术作为划分农户类型的标准;选择第一喜欢施肥技术的人 太少,因而未估计相应的模型。
参阅文献
Binary outcomes: The linear probability, Probit and Logit models. (Long_chapter_3.pdf) Arthur Lewbe, 2000. Identification of the Binary Choice Model with misclassifications. (Wp457.pdf) 林毅夫《禀赋、技术和要素市场:中国农村改革中关于诱 致性制度创新假说的一个自然试验》,见《再论制度、技 术与中国农业发展》第三章(103-125页)。 都阳《贫困地区农户的非农劳动供给》,见《中国贫困地 区农户劳动供给研究》第五章(81-114页)。
第五章
二元选择模型
(Binary choice models)
本章内容
反映选择行为的模型 线性概率模型 经典二元选择模型
PROBIT模型 LOGIT模型 极端值模型
拟合优度测定 案例分析
用计量经济模型反映选择行为
行为主体从事的每项活动都可以看作是一种选择; 每个行为主体都有其偏好; 人们的行为有其规则; 在经济分析中,通常认为选择基于效用最大化标准。 研究中需要考虑:
得到的参数不会相同 但分析结论不会有大的差别 收敛特性有时出现差别
通常根据模型的统计表现和经验偏好决定取舍。
对Probit 模型和Logit模型的解释
利用概率模型做分析时,我们关心的通常是X的 变化如何影响概率P(y = 1|x),即∂p/ ∂x。 对于线性概率函数,x的边际影响可以很容易的从 其回归系数得知。 对于Probit 模型和Logit模型,计算对条件概率边 际影响的方法较为复杂:
高级计量经济学 第五章 二元选择模型

一个问题是,由线性概率方程推断得出的概率值可能落在
区间[0,1]之外,因而只有在均值附近才较为可靠。
由于线性概率函数的取值仅为0或1,因而误差项与模型参
数β出现相关,即e或是等于-β΄X,或是等于1-β΄X,因而存
,现在已经很少使用线性 概率模型。
不同统计分布的特征
Probit 模型
G(z)的一种可选形式是标准正态累积分布函数, 此即Probit模型。
Pi GZi
1 2
e Zi u22du
式中u是误差项,假定服从标准正态分布;
P代表事件发生的概率。
估计指标Z,需要应用累计正态分布函数的逆函数
Z iG 1P iX i
由于Probit模型是参数非线性函数,因而需要用最 大似然法来估计。
不同的选择)或连续值(反映选择强度)。
二元选择模型是因变量取值仅为0或1的特殊情况。
二元行为选择
可以简化表述为涉及“是”或“否”的决策
例如是否攻读研究生
净效用函数:U读研 = +1 X1 + 2 X2 + 1 Z1 + 2 Z2+ e
当U读研>0,那么选择读研究生。
使用的数据
因变量基于显示出的偏好
高级计量经济学 第五章 二元选择模型
本章内容
反映选择行为的模型 线性概率模型 经典二元选择模型
PROBIT模型 LOGIT模型 极端值模型
拟合优度测定 案例分析
用计量经济模型反映选择行为
行为主体从事的每项活动都可以看作是一种选择; 每个行为主体都有其偏好; 人们的行为有其规则; 在经济分析中,通常认为选择基于效用最大化标准。 研究中需要考虑:
行为主体选择第一项活动意味着Ui1t > Ui2t
《选择模型》PPT课件

对数似然函数为
(7.1.11) (7.1.12)
N
ln L {yiln F (x iβ )(1yi)ln 1 [F (x iβ )](} 7.1.13) i 函数的一阶条件为
lβ n LiN 1 yF iifi (1yi)(1 fF ii) xi 0
(7.1.14)
图7.3 精O选pt课io件npsp对t 话框
21
Option对话框有以下几项设置:
① 稳健标准差 (Robust Standard Errors) 对二元因变
量 模 型 而 言 , EViews 允 许 使 用 准 - 极 大 似 然 函 数
(Huber/White)或广义的线性模型(GLM)方法估计标
精选课件ppt
16
在回归结果中还提供几种似然函数: ① log likelihood是对数似然函数的最大值L(b),b是
未知参数 的估计值。
② Avg. log likelihood 是用观察值的个数N去除以对数 似然函数L(b) ,即对数似然函数的平均值。
③ Restr. Log likelihood是除了常数以外所有系数被限 制为0时的极大似然函数L(b) 。
下约束变量的个数的2分布。
⑥ McFadden R-squared是计算似然比率指标,正 像它的名字所表示的,它同线性回归模型中的R2是类似 的。它具有总是介于0和1之间的性质。
精选课件ppt
18
利用式(7.1.10),分布函数采用标准正态分布,即Probit模型, 例7.1计算结果为
y ˆ i * 7 .4 5 1 .6 2 G 2 3 i 5 0 P .0 8 T A 5U i 1 1 .4 7 C P 2 i E (6 S 7.1.153 I )
计量经济学ppt课件(完整版)

注意事项
在进行模型选择与比较时,需要注意避免过拟合和欠拟合问题,以及确保模型的稳定性和可靠性。此外 ,还需要关注模型的异方差性、共线性等问题,以确保模型的准确性和有效性。
04
时间序列分析及应用
时间序列基本概念及性质
01
时间序列定义
按时间顺序排列的一组数据,反映 现象随时间变化的发展过程。
时间序列类型
03
广义线性模型与非线性模型
广义线性模型介绍
定义
广义线性模型是一类用于描述响 应变量与一组预测变量之间关系 的统计模型,其特点在于响应变 量的期望值通过一个连接函数与 预测变量的线性组合相关联。
连接函数
连接函数是广义线性模型中一个 关键组成部分,它将响应变量的 期望值与预测变量的线性组合连 接起来。常见的连接函数包括恒 等连接、对数连接、逆连接等。
模型的统计性质
深入探讨多元线性回归模型的统计性质,包括无偏性、有效性和一致性等,并解释这些 性质在多元回归分析中的重要性。
多重共线性问题
详细讲解多重共线性的概念、产生原因、后果以及诊断和处理方法,如逐步回归、岭回 归等。
回归模型检验与诊断
模型的拟合优度 介绍衡量模型拟合优度的指标, 如可决系数、调整可决系数等, 并解释这些指标在实际应用中的 意义。
微观计量经济学在因果推断和政策评 估方面发挥着重要作用。目前,研究 者们关注于如何运用实验设计、工具 变量、双重差分等方法识别和处理内 生性问题,以更准确地估计因果关系 和评估政策效果。
高维数据处理与机器 学习
随着大数据时代的到来,高维数据处 理成为微观计量经济学面临的新挑战 。目前,研究者们正在探索如何将机 器学习等先进的数据分析技术应用于 微观计量经济学中,以处理高维数据 和挖掘更多的有用信息。
在进行模型选择与比较时,需要注意避免过拟合和欠拟合问题,以及确保模型的稳定性和可靠性。此外 ,还需要关注模型的异方差性、共线性等问题,以确保模型的准确性和有效性。
04
时间序列分析及应用
时间序列基本概念及性质
01
时间序列定义
按时间顺序排列的一组数据,反映 现象随时间变化的发展过程。
时间序列类型
03
广义线性模型与非线性模型
广义线性模型介绍
定义
广义线性模型是一类用于描述响 应变量与一组预测变量之间关系 的统计模型,其特点在于响应变 量的期望值通过一个连接函数与 预测变量的线性组合相关联。
连接函数
连接函数是广义线性模型中一个 关键组成部分,它将响应变量的 期望值与预测变量的线性组合连 接起来。常见的连接函数包括恒 等连接、对数连接、逆连接等。
模型的统计性质
深入探讨多元线性回归模型的统计性质,包括无偏性、有效性和一致性等,并解释这些 性质在多元回归分析中的重要性。
多重共线性问题
详细讲解多重共线性的概念、产生原因、后果以及诊断和处理方法,如逐步回归、岭回 归等。
回归模型检验与诊断
模型的拟合优度 介绍衡量模型拟合优度的指标, 如可决系数、调整可决系数等, 并解释这些指标在实际应用中的 意义。
微观计量经济学在因果推断和政策评 估方面发挥着重要作用。目前,研究 者们关注于如何运用实验设计、工具 变量、双重差分等方法识别和处理内 生性问题,以更准确地估计因果关系 和评估政策效果。
高维数据处理与机器 学习
随着大数据时代的到来,高维数据处 理成为微观计量经济学面临的新挑战 。目前,研究者们正在探索如何将机 器学习等先进的数据分析技术应用于 微观计量经济学中,以处理高维数据 和挖掘更多的有用信息。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章
二元选择模型
(Binary choice models)
本章内容
反映选择行为的模型 线性概率模型 经典二元选择模型
PROBIT模型 LOGIT模型 极端值模型
拟合优度测定 案例分析
用计量经济模型反映选择行为
行为主体从事的每项活动都可以看作是一种选择; 每个行为主体都有其偏好; 人们的行为有其规则; 在经济分析中,通常认为选择基于效用最大化标准。 研究中需要考虑:
不同统计分布的特征
Probit 模型
G(z)的一种可选形式是标准正态累积分布函数, 此即Probit模型。
P i GZi
1 2
Zi eu22du
式中u是误差项,假定服从标准正态分布;
P代表事件发生的概率。
估计指标Z,需要应用累计正态分布函数的逆函数
Z i G 1 P iX i
家庭或个人特征是否影响到选择
家庭收入是否对读研究生构成重要限制? 个人的学习能力是否影响到读研的决策?
推断不同条件下的研究生规模变化
提高费用/就业机会增加/居民收入增加
推断个人的行为
哪些学生最有可能报考研究生
二元选择模型可用于评价政策
在评价某项政策计划(或技术应用)产生的影响 时,常常可以用虚变量作为模型的因变量,例如:
对该式做以下变换:
[1+exp(-Z)]Pi=1 exp(-Z)=1/Pi-1=(1-Pi)/Pi
Z=log[(1-Pi)/Pi]=+X
上述变换使因变量成为选择机会比的对数。 Logit模型也是参数非线性函数,但容易线性化。
Extreme Value模型
G(z)的第三种可选形式是极端值分布;
变化如何影响概率P(y = 1|x),即∂p/ ∂x。
对于线性概率函数,x的边际影响可以很容易的从 其回归系数得知。
对于Probit 模型和Logit模型,计算对条件概率边 际影响的方法较为复杂:
∂p/ ∂xj = g(α+x) j,
式中g(z)表示dG(z)/dz
概率模型
FZ
1
线性概率函数
Z*
Z
概率函数模型
如前面所述,利用概率模型做推断时可能会遇到 计算值超出0~1区间的情况。
为了解决这一问题,我们用概率函数G(α+x)来模
拟事件发生的概率,该函数应满足0<G(z)<1。 常用的分布和模型形式有:
正态分布→ Probit模型 Logistic分布→ Logit模型 Gompertz分布→极端值(Extreme value)模型
行为理论基础 计量经济学模型方法
模型设定 统计理论和数据 估计方法和统计检验
行为假定
就可以选择的活动而言,行为主体的偏好具有传 递性和完备性。
每项选择都有其相应的效用水平Uijt。 每个行为主体都试图获得最大效用。 我们无法对效用直接进行观测,只能通过观察行
为主体做出的选择来揭示其偏好。
由于Probit模型是参数非线性函数,因而需要用最 大似然法来估计。
15
Logit模型
G(z)的另一种可选形式是逻辑曲线,它是标准逻 辑随机变量的累积分布函数,即Logit模型,有时 也称为Logistic曲线回归;
Pi=G(Z) = exp(Z)/[1 + exp(Z)]=1/[1+exp(-Z)]
Pi=G(Z) = exp(- e-Z)
Extreme Value模型也是参数非线性函数,需 要用最大似然法估计。
模型选择
由前面的图形可以看出,作为三种模型基础的三种统计分 布有类似的变化模式,接近零时概率密度最大(此时累积 分布函数上升最迅速),但分散程度有一定差异。
早期研究中使用Logit模型的情况较多,这是因为该模型较 容易计算。
行为主体选择第一项活动意味着Ui1t > Ui2t
随机效用函数 (Random Utility Functions)
形式:Uij = j + i’xij + i’zi + eij
j为与特定选择j相联系的常数项
xij 为选择j所具有的特性(Attributes)
i为反映行为主体偏好的权重
zi 为行为主体的特征
是否参与某政策计划:
当所分析对象参与该某政策计划时D=1,否则D=0;
是否采纳某种(新)技术
当所分析对象采纳该技术时D=1,否则D=0;
农业劳动力转移
当农户家庭中有劳动力实现转移时D=1,否则D=0。
农户土地流转、借贷行为、政府提价…
自我选择问题
在很多情行为主体选择的,由此 导致了自我选择问题。
i为行为主体特征的权重
eij为效用函数中不可观察的随机成分,假定E(eij)=0,
随机Var效(ei用j)=函1 数帮助建立了行为模式与观察到的数 据之间的关系。
二元行为选择
由模型分析可以获得的信息
研究生的社会经济特性是否具有重要意义
降低成本是否有助于吸引更多学生? 就业市场好坏是否对读研究生有重要影响
如果我们掌握有哪些因素影响到是否参与,那么 就可以对选择行为做分析。
然而经常出现的情况是,有一些无法观察的因素 影响到是否参与。
在此情况下,仅利用参与者的信息估计政策效果 可能出现偏差,进而导致制定错误的政策。
线性概率模型
我们可以用线性概率模型来研究二元选择行为,此时模型 可以写作:
P该j(表y方=示程1当推|x)x断j=变的化1yx1的时+值概…表率+示的做变KxK出化+该e 选择的概率。
一个问题是,由线性概率方程推断得出的概率值可能落在
区间[0,1]之外,因而只有在均值附近才较为可靠。
由于线性概率函数的取值仅为0或1,因而误差项与模型参
数β出现相关,即e或是等于-β΄X,或是等于1-β΄X,因而存
在异方差问题,导致统计检验失效。
随着计量经济学软件的不断发展,现在已经很少使用线性 概率模型。
现有的计量经济学软件提供了三种模型的计算程序,因而 都很容易计算。
没有严格的理由表明哪一个模型更可取:
得到的参数不会相同 但分析结论不会有大的差别 收敛特性有时出现差别
通常根据模型的统计表现和经验偏好决定取舍。
对Probit 模型和Logit模型的解释
利用概率模型做分析时,我们关心的通常是X的
二元选择模型
(Binary choice models)
本章内容
反映选择行为的模型 线性概率模型 经典二元选择模型
PROBIT模型 LOGIT模型 极端值模型
拟合优度测定 案例分析
用计量经济模型反映选择行为
行为主体从事的每项活动都可以看作是一种选择; 每个行为主体都有其偏好; 人们的行为有其规则; 在经济分析中,通常认为选择基于效用最大化标准。 研究中需要考虑:
不同统计分布的特征
Probit 模型
G(z)的一种可选形式是标准正态累积分布函数, 此即Probit模型。
P i GZi
1 2
Zi eu22du
式中u是误差项,假定服从标准正态分布;
P代表事件发生的概率。
估计指标Z,需要应用累计正态分布函数的逆函数
Z i G 1 P iX i
家庭或个人特征是否影响到选择
家庭收入是否对读研究生构成重要限制? 个人的学习能力是否影响到读研的决策?
推断不同条件下的研究生规模变化
提高费用/就业机会增加/居民收入增加
推断个人的行为
哪些学生最有可能报考研究生
二元选择模型可用于评价政策
在评价某项政策计划(或技术应用)产生的影响 时,常常可以用虚变量作为模型的因变量,例如:
对该式做以下变换:
[1+exp(-Z)]Pi=1 exp(-Z)=1/Pi-1=(1-Pi)/Pi
Z=log[(1-Pi)/Pi]=+X
上述变换使因变量成为选择机会比的对数。 Logit模型也是参数非线性函数,但容易线性化。
Extreme Value模型
G(z)的第三种可选形式是极端值分布;
变化如何影响概率P(y = 1|x),即∂p/ ∂x。
对于线性概率函数,x的边际影响可以很容易的从 其回归系数得知。
对于Probit 模型和Logit模型,计算对条件概率边 际影响的方法较为复杂:
∂p/ ∂xj = g(α+x) j,
式中g(z)表示dG(z)/dz
概率模型
FZ
1
线性概率函数
Z*
Z
概率函数模型
如前面所述,利用概率模型做推断时可能会遇到 计算值超出0~1区间的情况。
为了解决这一问题,我们用概率函数G(α+x)来模
拟事件发生的概率,该函数应满足0<G(z)<1。 常用的分布和模型形式有:
正态分布→ Probit模型 Logistic分布→ Logit模型 Gompertz分布→极端值(Extreme value)模型
行为理论基础 计量经济学模型方法
模型设定 统计理论和数据 估计方法和统计检验
行为假定
就可以选择的活动而言,行为主体的偏好具有传 递性和完备性。
每项选择都有其相应的效用水平Uijt。 每个行为主体都试图获得最大效用。 我们无法对效用直接进行观测,只能通过观察行
为主体做出的选择来揭示其偏好。
由于Probit模型是参数非线性函数,因而需要用最 大似然法来估计。
15
Logit模型
G(z)的另一种可选形式是逻辑曲线,它是标准逻 辑随机变量的累积分布函数,即Logit模型,有时 也称为Logistic曲线回归;
Pi=G(Z) = exp(Z)/[1 + exp(Z)]=1/[1+exp(-Z)]
Pi=G(Z) = exp(- e-Z)
Extreme Value模型也是参数非线性函数,需 要用最大似然法估计。
模型选择
由前面的图形可以看出,作为三种模型基础的三种统计分 布有类似的变化模式,接近零时概率密度最大(此时累积 分布函数上升最迅速),但分散程度有一定差异。
早期研究中使用Logit模型的情况较多,这是因为该模型较 容易计算。
行为主体选择第一项活动意味着Ui1t > Ui2t
随机效用函数 (Random Utility Functions)
形式:Uij = j + i’xij + i’zi + eij
j为与特定选择j相联系的常数项
xij 为选择j所具有的特性(Attributes)
i为反映行为主体偏好的权重
zi 为行为主体的特征
是否参与某政策计划:
当所分析对象参与该某政策计划时D=1,否则D=0;
是否采纳某种(新)技术
当所分析对象采纳该技术时D=1,否则D=0;
农业劳动力转移
当农户家庭中有劳动力实现转移时D=1,否则D=0。
农户土地流转、借贷行为、政府提价…
自我选择问题
在很多情行为主体选择的,由此 导致了自我选择问题。
i为行为主体特征的权重
eij为效用函数中不可观察的随机成分,假定E(eij)=0,
随机Var效(ei用j)=函1 数帮助建立了行为模式与观察到的数 据之间的关系。
二元行为选择
由模型分析可以获得的信息
研究生的社会经济特性是否具有重要意义
降低成本是否有助于吸引更多学生? 就业市场好坏是否对读研究生有重要影响
如果我们掌握有哪些因素影响到是否参与,那么 就可以对选择行为做分析。
然而经常出现的情况是,有一些无法观察的因素 影响到是否参与。
在此情况下,仅利用参与者的信息估计政策效果 可能出现偏差,进而导致制定错误的政策。
线性概率模型
我们可以用线性概率模型来研究二元选择行为,此时模型 可以写作:
P该j(表y方=示程1当推|x)x断j=变的化1yx1的时+值概…表率+示的做变KxK出化+该e 选择的概率。
一个问题是,由线性概率方程推断得出的概率值可能落在
区间[0,1]之外,因而只有在均值附近才较为可靠。
由于线性概率函数的取值仅为0或1,因而误差项与模型参
数β出现相关,即e或是等于-β΄X,或是等于1-β΄X,因而存
在异方差问题,导致统计检验失效。
随着计量经济学软件的不断发展,现在已经很少使用线性 概率模型。
现有的计量经济学软件提供了三种模型的计算程序,因而 都很容易计算。
没有严格的理由表明哪一个模型更可取:
得到的参数不会相同 但分析结论不会有大的差别 收敛特性有时出现差别
通常根据模型的统计表现和经验偏好决定取舍。
对Probit 模型和Logit模型的解释
利用概率模型做分析时,我们关心的通常是X的