二元离散选择模型案例

合集下载

计量经济学72二元选择模型

§7.2 二元选择模型 Binary Choice Model
一、二元离散选择模型的经济背景二、二元离散选择模型三、二元Probit离散选择模型及其参数估计四、二元Logit离散选择模型及其参数估计五、二元离散选择模型的检验
说明
• 在经典计量经济学模型中，被解释变量通常被假定为连续变量。
• 需要将原始模型变换为效用模型。
• 这是离散选择模型的关键。
2、效用模型
U
1 i
X i 1
i1
第i个个体选择1的效用
U
0 i
X i 0
i0
第i个个体选择0的效用
U
1 i
U
0 i
Xi
(1
0 ) (i1
i0 )
yi* X i i*
作为研究对象的二元选择模型
P( yi 1) P( yi* 0) P(i* X i )
• 模型的估计方法主要发展于80年代初期。
一、二元离散选择模型的经济背景
实际经济生活中的二元选择问题
• 研究选择结果与影响因素之间的关系。 • 影响因素包括两部分：决策者的属性和备选方案
的属性。 • 对于单个方案的取舍。例如，购买者对某种商品
的购买决策问题，求职者对某种职业的选择问题，投票人对某候选人的投票决策，银行对某客户的贷款决策。由决策者的属性决定。 • 对于两个方案的选择。例如，两种出行方式的选择，两种商品的选择。由决策者的属性和备选方案的属性共同决定。
0
1.0000
0 26.00 -2
0.0000
0 89.00 -2
0.5498
1 5.000
1
2.1E-12
1 -9.000 -1

二元logit和多元logit

二元logit和多元logit引言二元logit和多元logit是经济学和统计学领域经常使用的两种统计模型。

它们用于分析离散型、有序类变量以及多分类问题。

本文将详细介绍二元logit和多元logit模型的原理、应用领域以及在实际中的应用案例。

二元logit模型原理二元logit模型是一种用于估计和解释两种可能结果的离散型因变量的统计模型。

典型的应用包括预测个体选择两个互斥选项之一的行为，如是否参与劳动力市场、是否购买某个商品等。

二元logit模型的核心思想是通过最大似然估计法估计模型参数。

应用领域二元logit模型在经济学和社会科学的研究中广泛应用。

它可以用于分析个体在选择两个互斥选项之一时的决策过程，从而帮助我们了解个体的行为模式。

例如，研究者可以利用二元logit模型分析个体的劳动力市场参与决策，研究个体特征对参与决策的影响。

应用案例下面通过一个简单的案例来解释二元logit模型的应用。

假设我们想研究个体的购车决策，即个体是否购买一辆新车。

我们收集了一些相关数据，包括个体的年龄、收入、家庭状况等变量。

我们可以使用二元logit模型来分析这个问题。

模型的结果可以告诉我们不同变量对购车决策的影响，并估计它们的影响程度。

多元logit模型原理多元logit模型是一种用于估计和解释多个离散型结果的统计模型。

与二元logit模型相比，多元logit模型可以处理具有三个或更多互斥选项的离散型因变量。

多元logit模型的核心思想是将多个二元logit模型扩展到多个互斥选项之间，并通过最大似然估计法估计模型参数。

应用领域多元logit模型在市场调研、消费者行为研究等领域得到广泛应用。

研究者可以借助多元logit模型分析消费者对多个产品或品牌的选择行为，从而了解消费者的偏好和购买决策。

多元logit模型还可以用于分析投票行为、市场份额预测等问题。

应用案例下面通过一个简单的案例来解释多元logit模型的应用。

假设我们想研究消费者对三个不同品牌的冰淇淋的选择行为。

二元选择模型

Λ ( β1 + β 2 ( q + 10) + β3v )
Λ ( β1 + β 2 q + β3v )
结论：数量分析成绩相对平均成绩增加分可提高分可提高20%被录取的可能性结论：数量分析成绩相对平均成绩增加10分可提高被录取的可能性
计算词汇能力成绩相对平均分增加10分时被录取概率增加值计算词汇能力成绩相对平均分增加分时被录取概率增加值
线性概率模型
修正
转换函数 Probit模型模型
yt = F ( xt β ) + ut
Logit模型模型
例题
讨论GRE考试成绩与研究生入学情况的关系考试成绩与研究生入学情况的关系讨论成绩（将GRE成绩（数量分析成绩和词汇能力成绩）与取得研究生入学资格的概率作为成绩数量分析成绩和词汇能力成绩）二元选择模型的研究对象
β1 + β 2 q + β3v
'数量分析成绩相对平均分高出分时被录取的概率数量分析成绩相对平均分高出10分时被录取的概率数量分析成绩相对平均分高出分时被录取的概率' series xqplus2=@cnorm(common2+eq2.@coefs(2)*(@mean(q)+10-@mean(q))) '数量分析成绩达到平均分时被录取的概率数量分析成绩达到平均分时被录取的概率' 数量分析成绩达到平均分时被录取的概率 series xq2=@cnorm(common2) '计算数量分析成绩相对平均分增加分时被录取概率增加值计算数量分析成绩相对平均分增加10分时被录取概率增加值计算数量分析成绩相对平均分增加分时被录取概率增加值' series var12=xqplus2-xq2

计量经济学72二元选择模型

• 原理相同
PPT文档演模板
计量经济学72二元选择模型
2、拟合检验
• P：样本观测值中被解释变量等于1的比例。 L0：模型中所有解释变量的系数都为0时的似然函数值。
• LRI=1，即L=1，完全拟合。 LRI=0，所有解释变量完全不显著，完全不拟合。
PPT文档演模板
计量经济学72二元选择模型
PPT文档演模板
PPT文档演模板
计量经济学72二元选择模型源自1、标准正态分布的概率分布函数
PPT文档演模板
计量经济学72二元选择模型
2、重复观测值不可以得到情况下二元Probit 离散选择模型的参数估计
PPT文档演模板
计量经济学72二元选择模型
• 关于参数的非线性函数，不能直接求解，需采用完全信息最大似然法中所采用的迭代方法。
3、重复观测值可以得到情况下二元Probit离散选择模型的参数估计
• 思路
– 对每个决策者有多个重复（例如10次左右）观测值。 – 对第i个决策者重复观测ni次，选择yi=1的次数比例为pi，
那么可以将pi作为真实概率Pi的一个估计量。 – 建立 “概率单位模型” ，采用广义最小二乘法估计。 – 实际中并不常用。
PPT文档演模板
计量经济学72二元选择模型
二、二元离散选择模型
PPT文档演模板
计量经济学72二元选择模型
1、原始模型
• 对于二元选择问题，可以建立如下计量经济学模型。其中Y为观测值为1和0的决策被解释变量；X 为解释变量，包括选择对象所具有的属性和选择主体所具有的属性。
PPT文档演模板
•左右端矛盾
– 对每个决策者有多个重复（例如10次左右）观测值。 – 对第i个决策者重复观测ni次，选择yi=1的次数比例为pi，

第七章(下) 二元离散选择模型

基于上述LPM的缺点，在现实应用中，原始模型一般不能作为实际研究二元选择问题的模型。
我们考虑对线性概率模型进行一些变换,来克服这些缺点。
效用模型
用
U
1 i
表示第
i个个体选择1的效用，U
0 i
表示第
i个
个体选择0的效用。其效用均为随机变量，于是有
UUi0i1

X i X i
1 0
Yi* X i ui*
中，假定ui*的分布为极值分布，则该模型称为 Extreme模型。
第二节二元离散选择模型最大似然估计
下面我们来构造二元离散选择模型的似然函数。这是二元离散选择模型最关键的问题。
我们假设有以Y 轴为对称的概率密度函数f（.），则
P(Yi 1 ) P(Yi* 0 ) P( u*i X i ) 1 F ( X i ) F ( X i )
Yi f ( Xi ) F ( Xi )

X
i
(*)
于是我们选择F不同的形式得到不同的经验模型
ln L

N i 1

(1

Yi
)
1
f ( Xi ) F ( Xi )

Yi f ( Xi ) F ( Xi )

X
i
(*)
一、 Logit模型的最大似然估计
标Yi准* 正X态i分布ui*
x
F ( x)
Yi
10e(xYYxpii**()
0 x)0
1
e

z2 2
dz
2 则
逻辑分布
F(x)
Λ( x)
P(Yi 1) P(Yi* 标0准) 正态P概1(u率i* 分ex布p曲(X线xi) )logi1stic分F布(曲X线i )

离散因变量模型演示文稿

P(
* i
Xi)
1
P(
* i
Xi)
1 F (Xi) F (Xi)
F(t) 1 F(t)
E( yi Xi ) 1 P 0 (1 P) F (Xi)
Y E(Y X )
总体回归模型
样本回归模
Y F ( XB) y型i F ( Xi B) i (i 1, 2......n)
（三）二元选择模型随机误差项及斜率
E( yi X i ) 1* P( yi 1 Xi ) 0 * P( yi 0 Xi ) 1 pi 0 (1 pi ) pi
yi E( yi Xi ) i pi i Xi B i
x j 对响应概率(p)的偏效应： j
LPM的估计方法：OLS
➢ 线性概率模型存在的问题及适用性
离散因变量模型演示文稿
（优选）离散因变量模型
一、二元选择模型
❖ 二元选择模型的理论模型 ❖ 二元选择模型经济计量的一般模型 ❖ 线性概率模型（LPM) ❖ Logit 模型 ❖ Probit 模型
（一）二元选择模型的理论模型
选择理论：效用是不可观测的，只能观测到选择行为
U
1 i
Xi 1
0
189
1
19
0
354
（1） Logit 模型的分布函数
如果选择
eZ
1
1
F(Z) 1 eZ 1 1 eZ 1 eZ
1
0.8 0.6 0.4
0.2 0 0
5
10
15
20
25
30
Logistic分布函数
具有以上分布函数的二元选择模型称为Logit模型。
（2） Logit 模型的设定

离散选择模型举例-二元离散选择模型

一．二元离散选择模型1．二元响应模型(Binary response model)我们往往关心响应概率()()()()z G x x G x y x y k k =+++=E ==P βββ...1110，其中x 表示各种影响因素（各种解释变量，包括虚拟变量）。

根据不同的函数形式可以分为下面三类模型：线性概率模型（Linear probability model ，LPM ）、对数单位模型（logit ）、概率单位模型(probit)：三种模型估计的系数大约有以下的关系：L PM probit probit it ββββ5.2,6.1log ==2．偏效应（1）如果解释变量是一个连续型变量，那么他对p(x)=p(y=1|x)的偏效应可以通过求下面的偏导数得出来：()()()()dzz dG z g x g x x p j j =+=∂∂,0βββ，偏效应的符号和该解释变量对应的系数的符号一致；两个解释变量偏效应之比等于它们各自的估计系数之比。

（2）如果解释变量是一个离散性变量，则k x 从k c 变化到k c +1时对概率的影响大小为：()()()k k k k c x G c x G ββββββ+++-++++...1 (110110)上面的其他解释变量的取值往往取其平均值。

3．估计方法与约束检验极大似然估计；三种常见的大样本检验：拉格朗日乘数检验、wald 检验、似然比检验。

4．Stata 程序语法（以Probit 为例）probit depvar [indepvars] [weight] [if exp] [in range] [, level(#) nocoef noconstant robust cluster(varname) score(newvar) asis offset(varname) maximize_options ] predict [type] newvarname [if exp] [in range] [, statistic rules asif nooffset ] where statistic isp predicted probability of a positive outcome; the default xb linear predictionstdp standard error of the prediction二．具体的例子1．数据：美国1988年的CPS 数据2．模型：估计成为工会成员的可能性，模型形式如下：参加工会的概率=F(潜在经验potexp 、经验的平方项potexp2、受教育年限grade 、婚否married 、工会化程度high)；解释变量：Potexp=年龄-受教育年限-5；grade=完成的受教育年限；married ：1表示婚，0未婚；high ：1表示高度工会化的行业，否则为0。

7.2 二元选择模型

标准正态分布或逻辑分布的对称性
P( y i 1) P( y i* 0) P( i* X i ) 1 P( i* X i ) 1 F ( X i ) F ( X i )
P ( y1 , y 2 , , y n )
n
(1 F ( X )) F ( X )
3、最大似然估计
• 欲使得效用模型可以估计，就必须为随机误差项选择一种特定的概率分布。
• 两种最常用的分布是标准正态分布和逻辑（logistic）分布，于是形成了两种最常用的二元选择模型—Probit模型和Logit模型。 • 最大似然函数及其估计过程如下：
F (t ) 1 F (t )
2
exp( x 2 2)
2、重复观测值不可以得到情况下二元Probit 离散选择模型的参数估计
ln L
fi fi Xi Xi 1 Fi F y 0 y 1 i

i

i
q i f ( q i X i ) Xi F ( q i X i ) i 1
§7.2 二元选择模型 Binary Choice Model
一、二元离散选择模型的经济背景二、二元离散选择模型三、二元Probit离散选择模型及其参数估计四、二元Logit离散选择模型及其参数估计五、二元离散选择模型的检验
说明
• 在经典计量经济学模型中，被解释变量通常被假定为连续变量。
左右端矛盾
1 X i 当y i 1，其概率为X i i X i 当y i 0，其概率为1 X i
具有异方差性
• 由于存在这两方面的问题，所以原始模型不能作为实际研究二元选择问题的模型。 • 需要将原始模型变换为效用模型。 • 这是离散选择模型的关键。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第七章二元离散选择模型案例
1、在一次选举中，由于候选人对高收入者有利，所以收入成为每个投票者表示同意或者反对的最主要影响因素。

以投票者的态度（y ）作为被解释变量，以投票者的月收入（x ）作为解释变量建立模型，同意者其观测值为1，反对者其观测值为0，样本数据见表7.1。

原始模型为：i i i y x αβμ=++。

利用Probit 二元离散选择模型估计参数。

表7.1 样本观测值
输入变量名，选择Probit 参数估计。

得到如下输出结果：
但是作为估计对象的不是原始模型，而是如下结果：
=---+
1@[( 4.75390.003067*)]
YF CONRM X
可以得到不同X值下的Y选择1的概率。

例如，当X=600时，查标准正态分布表，对应于2.9137的累积正态分布为0.9982；于是，Y的预测值YF=1-0.9982=0.0018，即对应于该个人，投赞成票的概率为0.0018。

2、某商业银行从历史贷款客户中随机抽取78个样本，根据涉及的指标体系分别计算它们的“商业信用支持度”（XY）和“市场竞争地位等级”（SC），对它们贷款的结果（JG）采用二元离散变量，1表示贷款成功，0表示贷款失败。

样本观测值见表8.2。

目的是研究JG与XY、SC之间的关系，并为正确贷款决策提供支持。

估计过程如下：
输入变量名，选择Logit参数估计。

得到如下输出结果：
用回归方程表示如下：
JGF CONRM XY SC
=---+
1@[(16.110.465035*9.379903*)]
该方程表示，当XY和SC已知时，带入方程，可以计算贷款成功的概率JGF。

3、某研究所1999年50名硕士考生的入学考试总分数（SCORE）及录取情况见表5。

考生考试总分数用SCORE表示，Y为录取状态，D1为表示应届生与往届生的虚拟变量。

表7.3 50名硕士考生的入学考试总分数（SCORE）及录取状况数据表
定义如下：
1,0,Y ⎧=⎨⎩录取
未录取， 1,10,D ⎧=⎨⎩
应届生非应届生
加入D1变量的目的是想考察考生为应届生或往届生是否也对录取产生影响。

考生录取状态（Y ）与考试总分数（SCORE ）的散点图如下图所示：
由于变量Y 只有两种状态，所以应该建立二元选择模型过程如下：
选择BINARY（二元）估计方法，选择logit 模型
得到如下输出结果：
由D1的相伴概率可以看出，D1的参数没有显著性，说明考生的应届、非应届特征对录取与否无显著性影响。

从模型中剔除D1，重新估计。

结果如下：
对比上述两个结果的赤池信息准则和施瓦茨准则也可以发现，应该剔除D1。

最终的回归方程可以表示如下：
=---+
y CNORM SCORE 1@[(243.73620.6794*)]。