第十一讲-二元选择模型(高级计量经济学课件-对外经济贸易大学-潘红宇)
合集下载
二计量经济学模型共34页35页PPT

• 作为“原因”的变量,例如生产函数中的资本、劳动、技 术,是模型中的解释变量,在单一方程模型中,处于右端
解释变量与被解释变量
lY n A a lK n b lL n
被解释变量
解释变量
如何正确地选择解释变量?
(1) 需 要 正 确 理 解 和 把 握 所 研 究的经济现象中暗含的经济学 理论和经济行为规律。 (2) 选 择 变 量 要 考 虑 数 据 的 可 得性。 (3) 选 择 变 量 时 要 考 虑 所 有 入 选变量之间的关系,使得每一 个解释变量都是独立的。
前定变量
• 滞后内生变量的数值是前期所决定的, • 因此,它和外生变量都是在求解本期内生
变量之前已经确定了的变量 • 滞后变量与外生变量合称为前定变量 • 用作解释变量
前定变量用法
1. 滞后内生变量的作用视着外生变量。 2. 在单一模型中,前定变量多作为自变量,
内生变量一般作为应变量;在联立方程模 型中内生变量既可以作为应变量也可以作 为自变量。
如何解决
图1-2
一、理论模型的设计 1.确定模型所包含的变量 2.确定模型的数学形式 3.拟定理论模型中待估参数的理论 期望值 二、样本数据的收集 三、模型参数的估计 四、模型的检验 五、模型的应用
一、理论模型的设计
1.确定模型所包含的变量
在单方程模型中,变量分为两类。作 为研究对象的变量,也就是因果关系中 的“果”,是模型中的被解释变量;而 作为“原因”的变量,是模型中的解释 变量。确定模型所包含的变量,主要是 指确定解释变量。可以作为解释变量的 有下列几类变量:外生经济变量、外生 条件变量、外生政策变量和滞后被解释 变量。
初级水平。
3.理论计量经济学与应用计量经济学
解释变量与被解释变量
lY n A a lK n b lL n
被解释变量
解释变量
如何正确地选择解释变量?
(1) 需 要 正 确 理 解 和 把 握 所 研 究的经济现象中暗含的经济学 理论和经济行为规律。 (2) 选 择 变 量 要 考 虑 数 据 的 可 得性。 (3) 选 择 变 量 时 要 考 虑 所 有 入 选变量之间的关系,使得每一 个解释变量都是独立的。
前定变量
• 滞后内生变量的数值是前期所决定的, • 因此,它和外生变量都是在求解本期内生
变量之前已经确定了的变量 • 滞后变量与外生变量合称为前定变量 • 用作解释变量
前定变量用法
1. 滞后内生变量的作用视着外生变量。 2. 在单一模型中,前定变量多作为自变量,
内生变量一般作为应变量;在联立方程模 型中内生变量既可以作为应变量也可以作 为自变量。
如何解决
图1-2
一、理论模型的设计 1.确定模型所包含的变量 2.确定模型的数学形式 3.拟定理论模型中待估参数的理论 期望值 二、样本数据的收集 三、模型参数的估计 四、模型的检验 五、模型的应用
一、理论模型的设计
1.确定模型所包含的变量
在单方程模型中,变量分为两类。作 为研究对象的变量,也就是因果关系中 的“果”,是模型中的被解释变量;而 作为“原因”的变量,是模型中的解释 变量。确定模型所包含的变量,主要是 指确定解释变量。可以作为解释变量的 有下列几类变量:外生经济变量、外生 条件变量、外生政策变量和滞后被解释 变量。
初级水平。
3.理论计量经济学与应用计量经济学
高级计量经济学消费行为模型(共48张PPT)

消费和收入均由持久性部分和偶然性部分所组成
Ct≡CPt+CTt,Yt≡YPt+YTt 假定现期的偶然性消费独立于过去的偶然性收入,并独立于持久性收入,其期望
值等于零。
持久性消费仅取决于持久性收入 CPt=YPt+ut
YP可以用现期和过去收入的加权平均值来表示,过去收入的效应随时间 推移而逐步减小到零。 Ct=+tYt+ut
也可以用微观个体调查的截面数据估计模型。
案例分析:商品组模型
(我国城镇居民这肉类N消个费) 方程反映了商品需求的决定因素;
同X 时i 也可D 以i 解P 1 出, P ,2 , 该值, 为P 收n , 入I 的 边际效i 用 。1 , 2 ,, n
10 第10页,共48页。
微观消费模型:理论基础
被看作是质量价格。
消除质量因素的价格可以按下式计算:
pi*h pih ˆjzijh
思考:这种处理方式j 可能引起什么问题?
14
第14页,共48页。
单一商品需求模型:理论基础
标准模型
微观消费行为理论(收入、商品的自身价格和替代商品的价 格)
局部均衡分析框架(假定该商品市场上发生的变化不会影响到 其他市场)
需要将未来的效用折现
模型选择主要受到研究目的和数据的限制
8
第8页,共48页。
微观消费模型:理论基础
基本模型形式:
Ma U X x1 ,X 2, ,X n
s.t. P 1 X 1 P 2X 2 P nX nI
写成拉格朗日方程形式
L= U(X1,X2,Xn)+ ( I-P1X1-P2X2--PnXn) 一阶条件:
n
viP i iiV P j ju i, i 1 ,2 , ,n j 1
Ct≡CPt+CTt,Yt≡YPt+YTt 假定现期的偶然性消费独立于过去的偶然性收入,并独立于持久性收入,其期望
值等于零。
持久性消费仅取决于持久性收入 CPt=YPt+ut
YP可以用现期和过去收入的加权平均值来表示,过去收入的效应随时间 推移而逐步减小到零。 Ct=+tYt+ut
也可以用微观个体调查的截面数据估计模型。
案例分析:商品组模型
(我国城镇居民这肉类N消个费) 方程反映了商品需求的决定因素;
同X 时i 也可D 以i 解P 1 出, P ,2 , 该值, 为P 收n , 入I 的 边际效i 用 。1 , 2 ,, n
10 第10页,共48页。
微观消费模型:理论基础
被看作是质量价格。
消除质量因素的价格可以按下式计算:
pi*h pih ˆjzijh
思考:这种处理方式j 可能引起什么问题?
14
第14页,共48页。
单一商品需求模型:理论基础
标准模型
微观消费行为理论(收入、商品的自身价格和替代商品的价 格)
局部均衡分析框架(假定该商品市场上发生的变化不会影响到 其他市场)
需要将未来的效用折现
模型选择主要受到研究目的和数据的限制
8
第8页,共48页。
微观消费模型:理论基础
基本模型形式:
Ma U X x1 ,X 2, ,X n
s.t. P 1 X 1 P 2X 2 P nX nI
写成拉格朗日方程形式
L= U(X1,X2,Xn)+ ( I-P1X1-P2X2--PnXn) 一阶条件:
n
viP i iiV P j ju i, i 1 ,2 , ,n j 1
经济计量模型分析及预测ppt

yt et 1et1 2et2 qetq
则称该时间 yt为 序移 列动平均序列 这。 种具 形有 式的模型
称为 q阶移动平均模型 M, A(q)。 记其 为中 1、2、 、q
为移动平均系数 型, 的是 待模 估计参数。
二、ARMA模型(5): ARMA模型
如果时间序列yt是它的当期和前期的随机误差项以及其前期值 的线性函数,即
一、数据整理和分析(2)
季节性判断
季节调整前
季节调整后
二、ARMA模型(1)
ARMA模型是一类常用的随机时序模型,由博克斯(Box)、詹 金斯(Jenkins)创立,亦称B-J方法。它是一种精度较高的时序短期 预测方法。其基本思想是:某些时间序列是依赖于时间t的一族随机变 量,构成该时序的单个序列值虽然具有不确定性,但整个序列的变化 却有一定的规律性,可以用相应的数学模型近似描述。通过对该数学 模型的分析研究,能够更本质地认识时间序列的结构与特征,达到最 小方差意义下的最优预测。
偏自相关:指对于时间序列yt ,在给定yt-1,yt-2,…, yt-k的条件 下, yt与yt-k之间的条件相关关系。滞后k阶的偏自相关系数是当yt 对yt-1,yt-2,…, yt-k作回归时的系数。称之为偏相关是因为它度 量了k期间距的相关而不考虑k-1期的相关。
二、ARMA模型(8): 相关性分析的Eviews实际操作
yt 1 yt1 2 yt 2 p yt p et 则称该时间序列为自回 归序列。
上式表示的模型为
p阶自回归模型,缩写为
AR
(
p
)。
、
1
、
2
、 p为自回归参数,是模型
的待估计参数。
et
~
N
则称该时间 yt为 序移 列动平均序列 这。 种具 形有 式的模型
称为 q阶移动平均模型 M, A(q)。 记其 为中 1、2、 、q
为移动平均系数 型, 的是 待模 估计参数。
二、ARMA模型(5): ARMA模型
如果时间序列yt是它的当期和前期的随机误差项以及其前期值 的线性函数,即
一、数据整理和分析(2)
季节性判断
季节调整前
季节调整后
二、ARMA模型(1)
ARMA模型是一类常用的随机时序模型,由博克斯(Box)、詹 金斯(Jenkins)创立,亦称B-J方法。它是一种精度较高的时序短期 预测方法。其基本思想是:某些时间序列是依赖于时间t的一族随机变 量,构成该时序的单个序列值虽然具有不确定性,但整个序列的变化 却有一定的规律性,可以用相应的数学模型近似描述。通过对该数学 模型的分析研究,能够更本质地认识时间序列的结构与特征,达到最 小方差意义下的最优预测。
偏自相关:指对于时间序列yt ,在给定yt-1,yt-2,…, yt-k的条件 下, yt与yt-k之间的条件相关关系。滞后k阶的偏自相关系数是当yt 对yt-1,yt-2,…, yt-k作回归时的系数。称之为偏相关是因为它度 量了k期间距的相关而不考虑k-1期的相关。
二、ARMA模型(8): 相关性分析的Eviews实际操作
yt 1 yt1 2 yt 2 p yt p et 则称该时间序列为自回 归序列。
上式表示的模型为
p阶自回归模型,缩写为
AR
(
p
)。
、
1
、
2
、 p为自回归参数,是模型
的待估计参数。
et
~
N
第十章定性选择模型计量经济学潘省初

log F (zi ) 1 F (zi )
exp(zi )
exp(zi )
log 1 exp(zi ) log
1 exp(zi )
1 exp(zi )
1 exp(zi ) exp(zi )
1 exp(zi )
1 exp(zi )
exp(zi )
log 1 exp(zi ) 1
log exp(zi )
INCOME的系数估计值0.002表明,一个学生的成 绩不变,而家庭收入增加1000美元,该生决定去读研 的概率的估计值增加0.002。
LPM模型中,解释变量的变动与虚拟因变量值为1 的概率线性相关,因而称为线性概率模型。
线性概率模型存在的问题
(1)线性概率模型假定自变量与Y=1的概率之间存 在线性关系,而此关系往往不是线性的。 (2)拟合值可能小于0或大于1,而概率值必须位于 0和1的闭区间内。
由于累积正态分布和累积logistic分布很接近,
只是尾部有点区别,因此,我们无论用(10.11)还
பைடு நூலகம்
是(10.12),也就是无论用logit法还是probit法,
得到的结果都不会有很大不同。可是,两种方法得
到的参数估计值不是直接可比的。由于logistic分布
的方差为
2
3
,因此,logit模型得到的的估计值必
Variable Coefficient Standard error t-Statistic
Constant
-0.51
0.19
-2.65
INCOME
0.0098
0.003
3.25
AGE
0.016
0.0053
3.08
高级计量经济学 第五章 二元选择模型-PPT精选文档

案例分析
共调查126户农户。
案例分析
注:用第一喜欢的技术作为划分农户类型的标准;选择第一喜欢施肥技术的人 太少,因而未估计相应的模型。
参阅文献
Binary outcomes: The linear probability, Probit and Logit models. (Long_chapter_3.pdf) Arthur Lewbe, 2000. Identification of the Binary Choice Model with misclassifications. (Wp457.pdf) 林毅夫《禀赋、技术和要素市场:中国农村改革中关于诱 致性制度创新假说的一个自然试验》,见《再论制度、技 术与中国农业发展》第三章(103-125页)。 都阳《贫困地区农户的非农劳动供给》,见《中国贫困地 区农户劳动供给研究》第五章(81-114页)。
第五章
二元选择模型
(Binary choice models)
本章内容
反映选择行为的模型 线性概率模型 经典二元选择模型
PROBIT模型 LOGIT模型 极端值模型
拟合优度测定 案例分析
用计量经济模型反映选择行为
行为主体从事的每项活动都可以看作是一种选择; 每个行为主体都有其偏好; 人们的行为有其规则; 在经济分析中,通常认为选择基于效用最大化标准。 研究中需要考虑:
得到的参数不会相同 但分析结论不会有大的差别 收敛特性有时出现差别
通常根据模型的统计表现和经验偏好决定取舍。
对Probit 模型和Logit模型的解释
利用概率模型做分析时,我们关心的通常是X的 变化如何影响概率P(y = 1|x),即∂p/ ∂x。 对于线性概率函数,x的边际影响可以很容易的从 其回归系数得知。 对于Probit 模型和Logit模型,计算对条件概率边 际影响的方法较为复杂:
高级计量经济学 第五章 二元选择模型

一个问题是,由线性概率方程推断得出的概率值可能落在
区间[0,1]之外,因而只有在均值附近才较为可靠。
由于线性概率函数的取值仅为0或1,因而误差项与模型参
数β出现相关,即e或是等于-β΄X,或是等于1-β΄X,因而存
,现在已经很少使用线性 概率模型。
不同统计分布的特征
Probit 模型
G(z)的一种可选形式是标准正态累积分布函数, 此即Probit模型。
Pi GZi
1 2
e Zi u22du
式中u是误差项,假定服从标准正态分布;
P代表事件发生的概率。
估计指标Z,需要应用累计正态分布函数的逆函数
Z iG 1P iX i
由于Probit模型是参数非线性函数,因而需要用最 大似然法来估计。
不同的选择)或连续值(反映选择强度)。
二元选择模型是因变量取值仅为0或1的特殊情况。
二元行为选择
可以简化表述为涉及“是”或“否”的决策
例如是否攻读研究生
净效用函数:U读研 = +1 X1 + 2 X2 + 1 Z1 + 2 Z2+ e
当U读研>0,那么选择读研究生。
使用的数据
因变量基于显示出的偏好
高级计量经济学 第五章 二元选择模型
本章内容
反映选择行为的模型 线性概率模型 经典二元选择模型
PROBIT模型 LOGIT模型 极端值模型
拟合优度测定 案例分析
用计量经济模型反映选择行为
行为主体从事的每项活动都可以看作是一种选择; 每个行为主体都有其偏好; 人们的行为有其规则; 在经济分析中,通常认为选择基于效用最大化标准。 研究中需要考虑:
行为主体选择第一项活动意味着Ui1t > Ui2t
第十三章 二元选择模型

14
本次您浏览到是第十四页,共二十六页。
图7.2 二元选择模型估计对话框
15
本次您浏览到是第十五页,共二十六页。
例7.1的估计输出结果如下:
16
本次您浏览到是第十六页,共二十六页。
参数估计结果的上半部分包含与一般的回归结 果类似的基本信息,标题包含关于估计方法(ML表 示极大似然估计)和估计中所使用的样本的基本信 息,也包括达到收敛要求的迭代次数。和计算系数 协方差矩阵所使用方法的信息。在其下面显示的是 系数的估计、渐近的标准误差、z-统计量和相应的 概率值及各种有关统计量。
3
本次您浏览到是第三页,共二十六页。
1、 线性概率模型及二元选择模型的形式
为了深刻地理解二元选择模型,首先从最简单的线性概率 模型开始讨论。线性概率模型的回归形式为:
yi 1x1i 2 x2i k xki ui (7.1.1)
i 1, 2 ,, N
其中:N是样本容量;k是解释变量个数;xj为第j个个体特征 的取值。例如,x1表示收入;x2表示汽车的价格;x3表示消费 者的偏好等。设 yi 表示取值为0和1的离散型随机变量:
yi 1 F xi β ui
即yi关于它的条件均值的一个回归。
(7.1.10)
9
本次您浏览到是第九页,共二十六页。
分布函数的类型决定了二元选择模型的类型,根据分布函 数F的不同,二元选择模型可以有不同的类型,常用的二元选择 模型如表7.1所示:
表7.1 常用的二元选择模型
ui*对应的分布
标准正态分布 逻辑分布 极值分布
yi 1
即
N
L [F ( xi β)]yi [1 F ( xi β)]1yi i1
对数似然函数为
(7.1.11) (7.1.12)
本次您浏览到是第十四页,共二十六页。
图7.2 二元选择模型估计对话框
15
本次您浏览到是第十五页,共二十六页。
例7.1的估计输出结果如下:
16
本次您浏览到是第十六页,共二十六页。
参数估计结果的上半部分包含与一般的回归结 果类似的基本信息,标题包含关于估计方法(ML表 示极大似然估计)和估计中所使用的样本的基本信 息,也包括达到收敛要求的迭代次数。和计算系数 协方差矩阵所使用方法的信息。在其下面显示的是 系数的估计、渐近的标准误差、z-统计量和相应的 概率值及各种有关统计量。
3
本次您浏览到是第三页,共二十六页。
1、 线性概率模型及二元选择模型的形式
为了深刻地理解二元选择模型,首先从最简单的线性概率 模型开始讨论。线性概率模型的回归形式为:
yi 1x1i 2 x2i k xki ui (7.1.1)
i 1, 2 ,, N
其中:N是样本容量;k是解释变量个数;xj为第j个个体特征 的取值。例如,x1表示收入;x2表示汽车的价格;x3表示消费 者的偏好等。设 yi 表示取值为0和1的离散型随机变量:
yi 1 F xi β ui
即yi关于它的条件均值的一个回归。
(7.1.10)
9
本次您浏览到是第九页,共二十六页。
分布函数的类型决定了二元选择模型的类型,根据分布函 数F的不同,二元选择模型可以有不同的类型,常用的二元选择 模型如表7.1所示:
表7.1 常用的二元选择模型
ui*对应的分布
标准正态分布 逻辑分布 极值分布
yi 1
即
N
L [F ( xi β)]yi [1 F ( xi β)]1yi i1
对数似然函数为
(7.1.11) (7.1.12)
扩展的单方程计量经济学模型

32
三、面板数据模型的优势
Panel Data 模型可以通过设置虚拟变量对个别 差异(非观测效应)进行控制---微观计量经济学
Panel Data 模型通过对不同横截面单元不同时 间观察值的结合,增加了自由度,减少了解释 变量之间的共线性,从而改进了估计结果的有 效性
Panel Data模型是对同一截面单元集的重复观 察,能更好地研究经济行为变化的动态性
33
四、面板模型的几个问题
变截距还是变系数的F检验 固定效应还是随机效应的检验---LR检验、
Hausman检验 固定效应:虚拟变量最小二乘法(LSDV) 随机效应:可行的广义最小二乘法(FGLS)
面板数据的协整和单位根检验---窄而长
的数据
34
变截距还是变系数的F检验
假设1 截距和系数在不同的横截面样本点和时间上都相同
e 0 1X
1
Pr ob(Y 1) p 1 e0 1X
1 e (0 1X )
13
Logistic回归模型
为便于进行参数估计,进行如下变换:
ln Pr ob(Y 1) ln p Pr ob(Y 0) 1 p
e 0 1X
(1 e (0 1X ) ) ln 1 e 0 1X (1 e ) (0 1X )
24
一、面板数据
时间维度+截面维度 如我们在分析中国各省份的经济增长时,共有31
个截面,每个截面都取2000-2010共10年的数据, 共有310个观察值,这是一个典型的面板数据 上市公司财务数据,研究一段时期内(1998-2008) 上市公司股利的发放数额与股票账面价值之间的 关系,共有20 ×11=220个观测值 宽而短、窄而长
39
附加:EViews操作举例
三、面板数据模型的优势
Panel Data 模型可以通过设置虚拟变量对个别 差异(非观测效应)进行控制---微观计量经济学
Panel Data 模型通过对不同横截面单元不同时 间观察值的结合,增加了自由度,减少了解释 变量之间的共线性,从而改进了估计结果的有 效性
Panel Data模型是对同一截面单元集的重复观 察,能更好地研究经济行为变化的动态性
33
四、面板模型的几个问题
变截距还是变系数的F检验 固定效应还是随机效应的检验---LR检验、
Hausman检验 固定效应:虚拟变量最小二乘法(LSDV) 随机效应:可行的广义最小二乘法(FGLS)
面板数据的协整和单位根检验---窄而长
的数据
34
变截距还是变系数的F检验
假设1 截距和系数在不同的横截面样本点和时间上都相同
e 0 1X
1
Pr ob(Y 1) p 1 e0 1X
1 e (0 1X )
13
Logistic回归模型
为便于进行参数估计,进行如下变换:
ln Pr ob(Y 1) ln p Pr ob(Y 0) 1 p
e 0 1X
(1 e (0 1X ) ) ln 1 e 0 1X (1 e ) (0 1X )
24
一、面板数据
时间维度+截面维度 如我们在分析中国各省份的经济增长时,共有31
个截面,每个截面都取2000-2010共10年的数据, 共有310个观察值,这是一个典型的面板数据 上市公司财务数据,研究一段时期内(1998-2008) 上市公司股利的发放数额与股票账面价值之间的 关系,共有20 ×11=220个观测值 宽而短、窄而长
39
附加:EViews操作举例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性概率模型
异方差
P{ x' | x} P( y 0 | x} 1 x' P{ 1 x' | x} P( y 1| x} x' V ( | x) x' (1 xபைடு நூலகம் )
边际效果不随解释变量的规模的变化而变化 dp/dxi=i例如1表示其他元素不变,x1增加一 个单位,事情发生的概率增加1个单位
LOGIT,PROBIT模型
逻辑函数(LOGIT MODEL) G(z)=exp(z)/(1+exp(z))=(z) 该函数是标准逻辑变量的累积分布函数 概率单位模型(PROBIT MODEL)
z
G(z) (z) (2 )1/ 2 exp(z 2 / 2)
对二元选择模型的解释
二元选择模型的解释
LOGIT模型与PROBIT模型和线性概率模型系数的 比较(不包括常数项)
因为正态分布密度函数g(0)=0.4,标准逻辑密度函数 g(0)=0.25 , 所 以 比 较 他 们 对 概 率 的 影 响 时 把 PROBIT模型除以2.5,把逻辑模型除以4可以同 线性概率模型的系数进行比较。
工作时间;年龄;小于6岁的孩子的个数。
例3
是否工作 变量
线性概率模型
逻辑模型
家庭其他收入 教育程度 工作时间 工作时间2 年龄 小于6岁孩子 个数 常数项
-0.0034 0.038 0.039 -0.0006 -0.016 -0.262 0.586
-0.021 0.221 0.206 -0.0032 -0.088 -1.443 0.425
例1 p(y=1|x)=G(0+1Z1+2Z21+3LOG(Z2)+ 4Z3) 变 量 Z1 改 变 一 个 单 位 , y=1 变 化 的 概 率 为
g(0+1Z1+2Z21+3LOG(Z3)+ 4Z3) ( 1 + 22 Z1) 变量Z2改变一个单位,y=1变化的概率为 g(0+1Z1+2Z21+3LOG(Z3)+ 4Z3)(3 /Z2)
二元选择模型的解释
三个二元选择模型的边际影响
(xi'
xik
)
(xi'
)k
L(xi' )
xik
e xi' (1 e xi' )2
k
(xi' )(1 (xi' ) k
xi'
xik
k (or 0)
二元选择模型的解释
(1)g(z)是密度函数,总是大于0,所以参数的符号为正
说明增加发生的概率,为负说明减少发生的概率,但是 程度的大小还需要计算。 (2)随着解释变量的变化,密度函数的取值发生变化。对 probit模型来说,当z=0时,密度值最大大约是0.4,这 时选择y=1概率50%,这时x改变的边际效果最大 (3)另一方面如果z取值非常大(小),这时y=1的概率 几乎等于1,x的改变的边际效果很小,因为f(z)近似 等于0
PROBIT模型
-0.012 0.131 0.123 -0.0019 -0.53 -0.868 0.27
例3
1)三种方法系数符号相同。 2)系数大小比较,逻辑模型乘0.25,probit模型乘
0.4。 3)重要的区别是线性概率模型假设边际效应相同,
而逻辑模型和概率单位模型假设边际效应递减。
例3
根据线性概率模型,如果增加一个小孩,不管已经有了几 个小孩,也不管其他解释变量的取值,参加工作的概率 减少26.2%。
根据PROBIT模型,假设取其他解释变量为样本均值,当没 有孩子,增加1个时,参加工作概率减少33.4%,如果已 经有1个,又增加一个,参加工作概率减少22.5%。
使用PROBIT模型:其他因素不变时,年龄对参加工作概 率的边际影响
P(y=1|X)=g(0.27-0.012收入的均值+0.131教育程度均值 +0.123工作时间均值-0.0019工作时间均值2-0.53年龄 -0.868小孩个数均值)(-0.53)
在大部分应用中关心的是xj的变化对P(y=1|x)的影 响,边际影响(margin effect)
如果解释变量连续 p / x j g(z) j
如果解释变量离散,假设x1取值0或1 概率变化很简单,其他量保持不变 G(0+1+2 x2…+xk)-G(0+2 x2+…+xk)
二元选择模型的解释
LOGIT,PROBIT模型
对于因变量只取0和1的模型,关心的是y=1的概率,所以 假设
P(y=1|x)=G(0+1x1+…+xk) G是取值在0和1之间的函数。 前面介绍的线性概率模型假设分布如下: G(z)=0,z<0 G(z)=z, 0z1 G(z)=1,z>1 其他两种常用的函数形式为
或者PROBIT 模型系数乘以1.6与LOGIT模型进行 比较
预测y=1的概率
P^(y=1|x)=G(b0+b1x1+…+bxk) Y^=1如果P^>0.5 Y^=0如果P^<=0.5
例2
选择公共交通还是开车上班 y=1选择开车 解释变量x是(乘公共交通需要的时间-开车需要的时间) -0.0644+0.0299Xi X=20时
高级计量经济学-11
二元选择模型
二元选择
线性回归模型或线性概率模型 y=1 事情会发生 y=0 事情不会发生 该随机变量的概率分布是 f(y)=py(1-p)(1-y) 回归模型如下: y=0+1x1+…+xk+u
线性概率模型
E(y| x1,…xk)= 0+x1+…+xk 因为y等于0或1 P(y=1|x)= E(y| x1,…xk)= 0+1x1+…+xk 模型刻画的是y=1的概率 线性回归模型的缺陷 1)y 的取值有时不在0和1之间 2)方差异方差 3)边际影响不随解释变量的变化而变化
dPˆ / dx f (b1 b2 x)b2 f (0.0644 0.0299 * 20)(0.0299 ) 0.0104
x=30时,Pˆ F (0.0644 0.0299 * 30) 0.798
预测结果y=1
例3
已婚女性是否参加工作的影响因素 抽样调查753个妇女,如果工作work=1 影响因素包括其他的收入;教育程度;结婚前的