第九章 二元选择模型
二元选择模型

• (2) 样本均值处的边际效应 (marginal effect at mean),即在
• X=均值处的边际效应。
• (3) 在某代表值处的边际效应 (marginal effect at a
二、限值因变量模型
限值因变量有哪些情形 (limited dependent variable
regression model, LDV)
• 当因变量为定性变量或不连续变量 或是受约束的变量时,统称为限值 因变量回归模型。
• 不同的限值因变量模型中,因变量的 情形不同,所使用的估计方法不同, 如非线性最小二乘法,但使用最大似 然估计法较多。
限值因变量有哪些情形
(limited dependent variable
regression model, LDV)
线性概率模型(linear probability model,LPM)、对数单位模型( logit model)、概率单位模型 (probit model)、托比模型(tobit model)、泊松模型(possion model) 、截取回归模型(censored regression model)、断尾回归模型 (truncated regression model)
二元选择模型(Binary outcome model)
一、线性概率模型
二、Logit model 三、probit model 二元选择模型下的参数估计、解释、系数
解释等。
2.1 线性概率模型
• 因变量是一个取值为0,1的二值结果的分 类变量
考虑模型:
回归分析二元选择模型

• 离散选择模型起源于Fechner于1860年进行的动 物条件二元反射研究。
• 1962年,Warner首次将它应用于经济研究领域, 用以研究公共交通工具和私人交通工具的选择问 题。
• 70、80年代,离散选择模型被普遍应用于经济布 局、企业定点、交通问题、就业问题、购买决策 等经济决策领域的研究。
二、二元离散选择模型
1、原始模型
• 对于二元选择问题,可以建立如下计量经济学模 型。其中Y为观测值为1和0的决策被解释变量;X 为解释变量,包括选择对象所具有的属性和选择
主体所具有的属性。
Y X yi Xi i
E(i ) 0 E(yi ) Xi
pi P( yi 1) 1 pi P( yi 0)
• 模型的估计方法主要发展于80年代初期。
一、二元离散选择模型的经济背景
实际经济生活中的二元选择问题
• 研究选择结果与影响因素之间的关系。 • 影响因素包括两部分:决策者的属性和备选方案
的属性。 • 对于单个方案的取舍。例如,购买者对某种商品
的购买决策问题 ,求职者对某种职业的选择问题, 投票人对某候选人的投票决策,银行对某客户的 贷款决策。由决策者的属性决定。 • 对于两个方案的选择。例如,两种出行方式的选 择,两种商品的选择。由决策者的属性和备选方 案的属性共同决定。
3、最大似然估计
• 欲使得效用模型可以估计,就必须为随机误差项 选择一种特定的概率分布。
• 两种最常用的分布是标准正态分布和逻辑 (logistic)分布,于是形成了两种最常用的二元 选择模型—Probit模型和Logit模型。
• 最大似然函数及其估计过程如下:
F(t) 1 F(t)
标准正态分布或逻 辑分布的对称性
二元选择模型

二元选择摸型如果回归模型的解释变量中含有定性变量,则可以用虚拟变量处理之。
在实际经济问题中,被解释变量也可能是定性变量。
如通过一系列解释变量的观测值观察人们对某项动议的态度,某件事情的成功和失败等。
当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的二元选择模型或多元选择模型,统称离散选择模型。
这里主要介绍Tobit (线性概率)模型,Probit (概率单位)模型和Logit 模型。
1.Tobit (线性概率)模型 Tobit 模型的形式如下,y i = α + β x i + u i (1) 其中u i 为随机误差项,x i 为定量解释变量。
y i 为二元选择变量。
此模型由James Tobin 1958年提出,因此得名。
如利息税、机动车的费改税问题等。
设 1 (若是第一种选择) y i =0 (若是第二种选择)-0.20.00.20.40.60.81.01.2330340350360370380XY对y i 取期望,E(y i ) = α + β x i (2) 下面研究y i 的分布。
因为y i 只能取两个值,0和1,所以y i 服从两点分布。
把y i 的分布记为, P ( y i = 1) = p i P ( y i = 0) = 1 - p i 则E(y i ) = 1 (p i ) + 0 (1 - p i ) = p i (3) 由(2)和(3)式有p i = α + β x i (y i 的样本值是0或1,而预测值是概率。
) (4)以p i = - 0.2 + 0.05 x i 为例,说明x i 每增加一个单位,则采用第一种选择的概率增加0.05。
现在分析Tobit 模型误差的分布。
由Tobit 模型(1)有,u i = y i - α - β x i =⎩⎨⎧=--=--0,1,1i i i i y x y x βαβαE(u i ) = (1- α - β x i ) p i + (- α - β x i ) (1 - p i ) = p i - α - β x i 由(4)式,有E(u i ) = p i - α - β x i = 0因为y i 只能取0, 1两个值,所以,E(u i 2) = (1- α - β x i )2 p i + (- α - β x i )2 (1 - p i )= (1- α - β x i )2 (α + β x i ) + (α +β x i )2 (1 - α - β x i ), (依据(4)式) = (1- α - β x i ) (α + β x i ) = p i (1 - p i ) , (依据(4)式) = E(y i ) [1- E(y i ) ]上两式说明,误差项的期望为零,方差具有异方差。
二元选择模型

二元选择模型一 线性概率模型(LPM)如果应变量的取值是二元的,则我们可定义应变量的取值如下:⎩⎨⎧=择第二个方案个被观测的决策主体选如果第择第一个方案个被观测的决策主体选如果第i i Y i 0,, 1 如果我们直接用最小二乘法作应变量对解释变量的回归,这样得到的模型称为线性概率模型。
如用i X 2表示解释变量(为简单记,我们在模型中只引入一个解释变量,如果要用多个解释变量来说明第i 个决策者的选择行为,则只要进行简单推广即可),则线性概率模型为i i i u X Y ++=221ββ (1)其中i u 是相互独立且均值为零的随机变量。
由于应变量i Y 只取两个值,所以从总体上看i Y 的均值即i Y 的数学期望可直接由期望的定义获得:i i i i P P P Y E =-⨯+⨯=)1(01)(其中i P 为第i 个决策者选择第一个方案的概率。
另一方面,由(4.26)式可得i Y 的数学期望为i i X Y E 221)(ββ+=故线性概率模型可表示为i i X P 221ββ+= (2)但如对解释变量的范围没作任何限制,则(2)式右边的值有可能会超出区间[0,1]的范围,从而使该式没有意义。
为了解释这个问题,通常的做法是将线性概率模型写成如下形式:⎪⎩⎪⎨⎧≥+<+<+≤+=1 ,110 ,0 0221221221221i i i i i X X X X P ββββββββ当当当, (3)按最小二乘法,利用观测到的样本值,对1)式进行估计,得i Y 的预测方程ii X Y 221ˆˆˆββ+= (4) 该预测方程即为第i 个决策主体选择第一个方案的概率的估计值。
如果第i 个决策主体的解释变量的值为02X X i =,则该决策主体选择第一个方案的概率的估计值为021ˆˆˆX Y i ββ+=。
而斜率项系数的意义则是:当解释变量增加一个单位时,决策主体选择第一个方案的概率增加2β。
二元选择模型的建立

二元选择模型的建立
二元选择模型是一种用来评估两个不同选项的得失情况的模型,其中一个选项的得失会被衡量和评估,以帮助用户做出最佳决定。
建立二元选择模型的过程可分为以下几个步骤:
1. 确定问题:确定比较的问题,是跟踪投资回报,比较两个投资机会,还是决定所采取的目标市场等。
2. 建立模型:将所有与该问题有关的数据分类收集并且建立选择模型,是一个表格或图表,或者一个数学模型等。
3. 加入偏好因素:建立模型的过程中,应考虑偏好的因素,比如风险大小、可承受的损失,或者对未来收益的期望等。
4. 评估得失:用不同的指标评估每个选择的得失,评估模型中各个依据及其对失误机率及后果的影响等。
5. 做出最终决定:最后,根据二元选择模型的评估结果,作出最佳决定。
二元选择模型

线性概率模型的缺陷
1、干扰项的非正态性
2.3 LOGIT模型的估计
• 采用极大似然估计法。为什么采用极大 似然估计法?
• Stata命令:
logit depvar [indepvars] [if] [in] [weight] [, options]
• 极大似然估计的出发点就是寻找样本观 的估计值 测值最有可能发生条件下的 。从样本看,如果第一种选择发生了n次 ,第二种选择发生了N-n次。设采取第 一种选择的概率是pi。采取第二种选择 的概率是(1- pi)。重新将样本数据排 列,使前n个观测值为第一种选择,后 N-n个观测值为第二种选择,则似然函 数是 L(1 , 2 ) P(Y1 , Y2 ,...YN ) P(Y1 ) P(Y2 )...P(YN )
Probit模型
为了解释二分因变量,除了逻辑斯蒂函数 以外,还可以采用正态分布函数。这就 是Probit模型,也称为概率单位模型。
P( y 1| x) G(1 2 x1 ... k xk ) G(1 x )
若G采取如下形式 G( z) ( z) (v)dv 这样可得到Probit model。Probit模型的 估计:极大似然估计法 • STATA命令: probit depvar [indepvars]
模型回归系数的解释
1、由于Probit 与Logit 使用的分布函数不同,其参数估计值并不 直接可比。须计算边际效应,然后进行比较。 2、但对于非线性模型,边际效应不是常数,随着解释变量而变。 常用的边际效应概念: • (1) 平均边际效应(average marginal effect),即分别计算在每 个样本观测值上的边际效应,然后进行简单算术平均。 • (2) 样本均值处的边际效应 (marginal effect at mean),即在 • X=均值处的边际效应。 • (3) 在某代表值处的边际效应 (marginal effect at a representative value),即给定x*,在x=x*处的边际效应。 3、在非线性模型中,样本均值处的个体行为并不等于样本中个体 的平均行为(average behavior of individuals differs from behavior of the average individual)。 4、对于政策分析而言,平均边际效应(Stata 的默认方法),或在某 • 代表值处的边际效应通常更有意义。
二元选择模型和二值响应模型

二元选择模型和二值响应模型
"二元选择模型"(Binary Choice Model)和"二值响应模型"(Binary Response Model)通常在统计学和计量经济学中使用,用于处理对一个二元结果的建模和分析。
尽管这两个术语有时可以互换使用,但它们通常涉及到略微不同的概念。
1.二元选择模型(Binary Choice Model):这个术语通常用于描述一类模型,其中观测值的因变量(响应变量)只有两个可能的取值,通常是0和1。
这个模型用于解释一个二元决策或选择的过程。
例如,考虑一个人是否购买某个产品(购买=1,不购买=0),这种情况下可以使用二元选择模型来建模。
2.常见的二元选择模型包括Logit模型(逻辑回归)和Probit模型(概率模型),它们都是处理二元结果的广泛应用的模型。
3.二值响应模型(Binary Response Model):这个术语更加通用,它指的是对于某个事件或观测结果的响应只有两个可能取值的模型。
这也可以包括那些不仅仅涉及到选择或决策的情境,还包括其他类型的二元结果。
例如,是否违约(违约=1,未违约=0)也可以用二值响应模型来建模。
4.二值响应模型可以包括二元选择模型,但不限于此,因为它可以应用于更广泛的情境,包括一些不涉及明确选择的问题。
总体而言,这两个术语都涉及到处理二元结果的模型,而具体使用哪一个取决于具体的上下文和研究问题。
逻辑回归和概率模型是处理这类问题时常见的方法,它们在许多领域,包括经济学、社会科学和医学等方面都有广泛的应用。
第9讲 二元结果模型

第9讲离散选择模型之二元结果模型参考书目:1.Long, J. S., and J. Freese. 2006. Regression Models for Categorical Dependent Variables Using Stata. 2nd ed. College Station, TX: Stata Press教学视频:Logistic regression, part 1: Binary predictorsLogistic regression, part 2: Continuous predictorsLogistic regression, part 3: Factor variables一、离散被解释变量的例子二元结果模型:考研或不考研;就业或待业;买房或不买房;买保险或不买保险;贷款申请被批准或拒绝;出国或不出国;回国或不回国;战争或和平;医药实验中的生或死。
多元结果模型:对不同交通方式的选择(走路、骑车、坐车上班);对不同职业的选择。
这类模型被称为“离散选择模型”(discrete choice model) 。
考虑到离散被解释变量的特点,通常不宜用OLS进行回归。
假设个体只有两种选择,比如y=1 (考研)或y=0 (不考研)。
是否考研,取决于研究生毕业后的预期收入、个人兴趣、本科毕业后直接就业的收入前景等。
所有解释变量都包括在向量x中。
二、二元结果模型的微观基础对于二元选择行为,可通过“潜变量”(latent variable)概括该行为的净收益(收益减去成本)。
如果净收益大于0,则选择做;否则,选择不做。
y*=x′β + ε其中,净收益y*为潜变量,不可观测。
选择规则为y=1,若y*>0y=0,若y*≤0如果ε为正态分布,则为Probit;如果ε为逻辑分布,则为Logit。
logistic — Logistic regression, reporting odds ratios (Logistic回归,报告优势比/比值比)对于Logit模型,记p= P(y =1|x ) ,则1-P= P(y =0|x )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(9.6)
其中,Yi*是潜变量或隐变量(Latent Variable), 它无法获得实际观测值,但是却可以观测到它的 性状,如Yi*>0或Yi*≤0。因此,我们实际上观测 到的变量是Yi而不是Yi*。(9.6)式称为潜变量反应 函数(Latent Response Function)或指示函数 (Index Function)。
一、二元离散选择模型的经济背景
实际经济生活中的二元选择问题
• 研究选择结果与影响因素之间的关系。
• 影响因素包括两部分:决策者的属性和备选方案 的属性。 • 对于单个方案的取舍。例如,购买者对某种商品 的购买决策问题 ,求职者对某种职业的选择问题, 投票人对某候选人的投票决策,银行对某客户的 贷款决策。由决策者的属性决定。
边际效应分析
• 对于Probit模型来说,其边际效应为:
Pr ob(Yi =1| Xi ) =( Xiβ)β= ( Xiβ)β Xi
(9.10)
• 对于Logit模型,其边际效应为:
Pr ob(Yi =1| Xi ) =( Xiβ)β=( Xiβ)(1-( Xiβ))β Xi
.30 .25 .20
1 1 e
(1 e
t
F (t )
et
et 1 e
t
(t )
e t
t
)
2
f (t )
1.0
(1 e )
t 2
(t )(1 (t ))
0.8
0.6 .15 0.4 .10 .05 .00 5 10 15 20 F 25 30 35 40 0.2
Pr ob(Yi 1| Xi )=1- =1-(-Xiβ) exp(-Xiβ) =11 exp(-Xiβ) exp( Xiβ) = = 1 exp(-Xiβ) 1 exp( Xiβ) 1 =( Xiβ)
Xiβ -
f ( i )d i
(9.9)
(9.9)式正是Logit模型。
说明
• 在经典计量经济学模型中,被解释变量通常被假 定为连续变量。
• 离散被解释变量数据计量经济学模型(Models with Discrete Dependent Variables)和离散 选择模型(DCM, Discrete Choice Model)。 • 二元选择模型(Binary Choice Model)和多元选择 模型(Multiple Choice Model)。 • 本节只介绍二元选择模型。
• 对于两个方案的选择。例如,两种出行方式的选 择,两种商品的选择。由决策者的属性和备选方 案的属性共同决定。
二、二元离散选择模型
1.线性概率(LPM)模型 • 假设有以下二元选择模型: Yi Xβ i i 1, 2,, T i • (9.1) 其中,Xi是包含常数项的k元解释变量, 1 某一事件发生; Yi 0 某一事件不发生。 • 假设在给定Xi的时候,Yi =1 的概率为p, 即Pr ob(Yi 1 Xi ) p ,则在给定Xi的时候, Yi =0 的概率为1-p, 即Pr ob(Yi 0 | Xi ) 1 p 。
Pr ob( X iβ i 0 | Xi ) Pr ob( i -Xiβ | Xi )
Xi
(9.7)
f ( i )d i
• 当 f ( i ) 为标准正态分布的概率密度函数
i2 1 ( i )= exp( ) 2 2
时,(9.7)式可以写成:
fi - fi log L N = Yi Xi +(1-Yi ) Xi β Fi 1-Fi i=1 Yi -Fi = Xi f i =0 Fi 1-Fi i=1
N
(9.13)
• 由于(9.13)式不存在封闭解,所以要用非线 性求解的迭代法求解。常用的迭代方法之 一是建立在泰勒级数展开基础上的NewtonRaphson迭代法或二次攀峰算法 (Quadratic Hill Climbing)。
最大似然估计(MLE)
• Probit和Logit模型都是非线性模型,不能用 OLS法估计。对于非线性模型的估计方法 之一是最大似然法。 对于Probit或Logit模型来说,
Pr ob(Yi 1| Xi ) F ( Xiβ)
Pr ob(Yi 0 | Xi ) 1-F ( Xiβ)
i i
1 X β X β
2
2
常数
因此,扰动项是异方差的。为了克服异方 差,可以采用处理异方差的方法去估计模 型。
• (4)由于因变量是二元选择的结果,因此按 传统线性回归模型所计算的判定系数R2不 再有实际的意义。可以定义
Count _ R
2
正确预测的个数 总观测值个数
• (2)由于Y是二元变量,因此扰动项
1 X β (Y 1) i i i Xiβ (Yi 0)
也应该是二元变量,它应该服从二项分布, 而不是我们通常假定的正态分布。但是, 当样本足够多时,二项分布收敛于正态分 布。
• (3)在LPM中,扰动项的方差为:
Var ( i ) 1 Xiβ p Xiβ (1 p)
(9.3)
综合(9.2)式和(9.3)式得:
E (Yi | Xi ) Xiβ Pr ob(Yi 1| Xi ) p
(9.4)
• 因此,(9.1)式拟合的是当给定解释变量Xi的 值时,某事件发生(即Yi取值为1)的平均 概率。在(9.4)式中,这一概率体现为线性 的形式 Xβ ,因此(9.1)式称为线性概率模 i 型(Linear Probability Model,LPM)。 • 对于线性概率模型,可以采用普通最小二 乘法进行估计,但是会存在一些问题。常 见的问题和相应的解决方法如下:
• 离散选择模型起源于Fechner于1860年进行的动物 条件二元反射研究。 • 1962年,Warner首次将它应用于经济研究领域, 用以研究公共交通工具和私人交通工具的选择问 题。 • 70、80年代,离散选择模型被普遍应用于经济布 局、企业定点、交通问题、就业问题、购买决策 等经济决策领域的研究。 • 模型的估计方法主要发展于80年代初期。
• 当Y的实际预测的值大于0.5时,我们视其 预测值为1;当小于0.5时,视其预测值为0。 然后比较预测值与实际值是否存在差异, 如果不存在差异,则认为是正确的预测。 然后将正确的预测的个数与总预测个数比 较,得到一个新的拟合优度的指标。
(5)边际效应的分析
• 对LPM进行边际效应分析得: E (Y | X i ) X i
• 因此,当解释变量是非虚拟变量时, 表 示的是解释变量变动一个单位时对Y取值为 1的平均概率的影响。如果解释变量是虚拟 变量,则 表示的是虚拟解释变量取值为 1和取值为0时,Y的取值为1的概率的差异。 因此,LPM的边际效应是一个常数,它与 解释变量取值的大小无关。
• 在LPM中,假设Yi =1 的概率是线性的,也 就是假设 Pr ob(Yi 1| Xi ) F ( Xiβ) 中的函数F为恒等函数,即
0.0 5 10 15 20 DF 25 30 35 40
• 如果将函数F定义为标准正态分布函数 即 ()
Pr ob(Yi 1| Xi ) ( Xiβ)
( X iβ)
Xiβ
,
1 z2 exp( )dz 2 2
会把概率的取值限定在0和1之间, 这时的概率模型称为Probit模型。
• (1)对(9.1)式的拟合的结果是对某一事件发 生的平均概率的预测,即
ˆ ˆ Yi Pr ob(Yi | Xi ) Xiβ
Xˆ • 但是, iβ 的值并不能保证在0和1之间,完 全有可能出现大于1和小于0的情形。实际 应用中,当出现的预测值大于1或小于0的 情况不是太多时,如果预测值大于1,就把 它看作是等于1,如果预测值小于0,就把 它看作是等于0.
• 对于Probit和Logit模型,同样可以计算(9.5) 式中 Count _ R2 的以反映模型的拟合优度。此 外,还可以计算类似于传统R2的McFadden 似然比指数(McFadden’s Likelihood Ratio Index)来度量拟合优度。似然比指数的定义 为 ln L 2 McFadden R =1(9.15) ln L0 McFadden R2总是介于0和1之间。当所有 的斜率系数都为0时,McFadden R2=0,但 是,McFadden R2不会恰好等于1。 McFadden R2越大,表明拟合得越好。
第九章
离散被解释变量数据计量经济学 模型—二元选择模型 Models with Discrete Dependent Variables—Binary Choice Model
一、二元离散选择模型的经济背景 二、二元LPM、Probit和Logit离散选择模型 及其参数估计 三、二元离散选择模型的变量显著性检验
似然比检验和拟合优度
• 似然比检验类似于检验模型整体显著性的F 检验, 原假设为全部解释变量的系数都为0,检验 的统计量LR为: LR=2(lnL-lnL0 ) (9.14) • 其中,lnL为对概率模型进行MLE估计的对 数似然函数值,lnL0为估计只有截距项的模 型的对数似然函数值。当原假设成立时, LR的渐近分布是自由度为k-1(即除截距项 2 分布。 外的解释变量的个数)的
Pr ob(Yi 1| Xi ) Xiβ
但是,
X不能保证概率的取值在0和1之间。 iβ
标准正态分布的概率分布函数
F (t )
t
(2 )
12
exp( x 2 2)dx
f ( x) (2 )
1
2
exp( x 2 2)
逻辑分布的概率分布函数