4.2 多元选择模型
(整理)第四章 多元线性回归模型

第四章 多元线性回归模型在一元线性回归模型中,解释变量只有一个。
但在实际问题中,影响因变量的变量可能不止一个,比如根据经济学理论,人们对某种商品的需求不仅受该商品市场价格的影响,而且受其它商品价格以及人们可支配收入水平的制约;影响劳动力劳动供给意愿(用劳动参与率度量)的因素不仅包括经济形势(用失业率度量),而且包括劳动实际工资;根据凯恩斯的流动性偏好理论,影响人们货币需求的因素不仅包括人们的收入水平,而且包括利率水平等。
当解释变量的个数由一个扩展到两个或两个以上时,一元线性回归模型就扩展为多元线性回归模型。
本章在理论分析中以二元线性回归模型为例进行。
一、预备知识(一)相关概念对于一个三变量总体,若由基础理论,变量21,x x 和变量y 之间存在因果关系,或21,x x 的变异可用来解释y 的变异。
为检验变量21,x x 和变量y 之间因果关系是否存在、度量变量21,x x 对变量y 影响的强弱与显著性、以及利用解释变量21,x x 去预测因变量y ,引入多元回归分析这一工具。
将给定i i x x 21,条件下i y 的均值i i i i i x x x x y E 2211021),|(βββ++= (4.1) 定义为总体回归函数(Population Regression Function,PRF )。
定义),|(21i i i i x x y E y -为误差项(error term ),记为i μ,即),|(21i i i i i x x y E y -=μ,这样i i i i i x x y E y μ+=),|(21,或i i i i x x y μβββ+++=22110 (4.2)(4.2)式称为总体回归模型或者随机总体回归函数。
其中,21,x x 称为解释变量(explanatory variable )或自变量(independent variable );y 称为被解释变量(explained variable )或因变量(dependent variable );误差项μ解释了因变量的变动中不能完全被自变量所解释的部分。
多元回归模型

多元回归模型简介多元回归模型(Multiple Regression Model)是一种用于分析多个自变量与一个因变量之间关系的统计模型。
它可以用于预测和解释因变量的变化,并确定自变量对因变量的影响程度。
多元回归模型在许多领域中都得到广泛应用,特别是在经济学、金融学、社会科学和自然科学等领域。
它可以帮助研究人员找出多个自变量对一个因变量的综合影响,从而提供更准确的预测和解释。
建立多元回归模型的步骤建立多元回归模型一般包括以下几个步骤:1.收集数据:收集自变量和因变量的数据,并确保数据的完整性和准确性。
2.数据预处理:对数据进行清洗和处理,包括处理缺失值、异常值和离群值等。
3.确定自变量和因变量:根据研究目的和领域知识,确定自变量和因变量。
4.拟合回归模型:选择合适的回归模型,并使用最小二乘法等方法拟合回归模型。
5.模型评估:通过分析回归系数、残差、拟合优度等指标来评估模型的拟合效果。
6.解释结果:根据回归模型的系数和统计显著性,解释自变量对因变量的影响。
多元回归模型的方程多元回归模型可表示为以下方程:Y = β0 + β1X1 + β2X2 + … + βk*Xk + ε其中,Y表示因变量,X1、X2、…、Xk表示自变量,β0、β1、β2、…、βk表示回归系数,ε为误差项。
回归系数β0表示截距,表示当所有自变量为0时,因变量的值。
回归系数βi表示自变量Xi对因变量的影响,即当自变量Xi增加一个单位时,因变量的平均变化量。
误差项ε表示模型无法解释的部分,代表了观测误差和模型中遗漏的影响因素。
多元回归模型的拟合和评估拟合多元回归模型的常用方法是最小二乘法(Ordinary Least Squares,OLS)。
最小二乘法通过最小化观测值和模型预测值之间的残差平方和,找到最佳拟合的回归系数。
拟合好的多元回归模型应具备以下特征:1.较小的残差:模型的残差应该较小,表示模型能够较好地拟合数据。
2.显著的回归系数:回归系数应该达到统计显著性水平,表示自变量对因变量的影响是真实存在的。
二元logit与多元logit的比较分析

【文章】目录: 1. 前言 2. 二元Logit模型 3. 多元Logit模型 4. 二元Logit与多元Logit的比较分析 4.1 模型结构 4.2 数据类型 4.3 解释变量 4.4 输出结果 4.5 模型评估 5. 结论与观点1. 前言在统计学和经济学中,二元Logit模型和多元Logit模型是常用的数据分析工具。
它们可以在众多领域中用于解释、预测和模拟离散取值的因变量。
本文将对二元Logit模型和多元Logit模型进行比较分析,探讨它们的模型结构、数据类型、解释变量、输出结果和模型评估等方面的异同。
2. 二元Logit模型二元Logit模型是二分类问题的一种统计模型,它基于多元线性回归模型的基础上进行拓展,通常用于分析二元、二项式的因变量。
该模型的因变量通常表示某种二元选择或二项结果的概率。
预测一个学生是否会考上某个大学、是否购买某个产品等。
二元Logit模型的核心思想是将线性组合的结果转化为概率值,常用的转换函数是逻辑函数(也称为sigmoid函数)。
逻辑函数将线性组合的结果映射到0到1之间的概率值,方程形式如下:P(Y=1) = 1 / (1 + e^(-z))其中,P(Y=1)表示取值为1的概率,z表示线性组合的结果。
3. 多元Logit模型多元Logit模型是多分类问题的一种统计模型,它相较于二元Logit模型可以用于分析多个离散取值的因变量。
预测一个学生会选择哪个大学专业、一个消费者会购买哪个产品等。
多元Logit模型的核心思想是将多个分类结果的概率进行建模。
常见的方式是通过softmax函数,将线性组合的结果转化为对应类别的概率。
多元Logit模型的方程形式如下:P(Y=i) = e^(Xβ_i) / (∑_j(e^(Xβ_j)))其中,P(Y=i)表示取值为i的概率,X表示解释变量,β表示模型的参数。
4. 二元Logit与多元Logit的比较分析4.1 模型结构在模型结构方面,二元Logit模型和多元Logit模型的基本思想是相同的,都是通过一个线性组合来估计取值为某个分类的概率。
跳远运动中的数学问题

1 n 2 1 n xij ( xij x j ) 2 M j n i 1 n i 1
四、模型建立与及求解
4.1.1 阻滞增长模型 我们假设运动员跳高成绩增长率 r 是跳高原成绩 x 的线性减函数,即随着 跳高成绩的增加,跳高成绩增长速度会慢慢下降最终会达到饱和,且趋于一个常数 x m ,当 x x m 时,增长 率为 0:
r0 sxm 0
三、符号说明
r :运动员跳远成绩增长率; x :跳远原成绩; ������������ :跳远极限成绩; t :奥运会举办届数; L :最终成绩 V0:身体腾空的初速度 a:腾空时的起跳角 H:运动员的身高
3
g:重力加速度之间 Vx:水平速度 H0:0 时刻重心的竖直位移 Y : t 时刻重心的竖直位移
由上面的关系式可得出:
x r ( x) r0 1 xm
把上式代进指数增长模型的方程中,由于奥运会第一届跳远的规则是立定跳远, 而后面的比赛都是助跑的,所以第一届的数据不具有参考价值。利用初始条件 x(������2 ) = ������2 ,于是解得: ������������ x(t) = ������ 1 + ( ������������ − 1) ������ −������(������−������2 ) 2 4.1.2 利用阻滞增长模型进行预测 由初始条件������1 =7.185,������1 =1 可得模型公式为: ������������ x(t) = ������������ 1+( − 1) ������ −������(������−1) 7.185 利用 MATLAB(程序见附录 1)实现对历届奥运会男子跳远成绩的非线性拟 合(阻滞增长模型) ,可以得到: ������������ = 9.4407 r =0.2438 于是可以预测第 31 届夏季奥林匹克运动会男子跳远冠军成绩为: ������31 =8.7069(m) 如图 1 为利用该模型得到的跳远成绩拟合曲线:
多元选择模型

无序多元选择模型
❖ 如果样本属于重复试验,那么可以计算出与每 个组相联系的概率rij/ni,然后计算出机会比的对 数,与X做回归。 式中rij表示组i中选择j的次数占该组观察对象 总数ni的比例
❖ 如果没有足够多的重复,则需要利用最大似然 法进行估计。
8
举例
❖ 用多元Logit模型分析农户合作医疗方式选择 ❖ 数据:6个省的2505个农户的问卷调查,有951户做
log
P2 P1
21
21
X
log
P3 P1
31
31
X
log
P3 P2
32
32
X
❖ 即每个方程都假定,任两个选择的机会比对数是特征X的线 性函数。
❖ 由于所有概率之和等于1,因而机会比相互依赖,上述限制 使需要估计的参数由6个减少到4个。
5
❖ 对于无序选择模型,其行为选择假定出于优化一个 随机效用函数。
例1:个人达到的教育水平分文盲、小学、初中、高中、 大学、研究生等
例2:考试成绩分优秀、良好、及格和不及格等;学生奖 学金等级;
例3:评价意见调查分非常不满意、不满意、一般、满意、 非常满意等
例4:住房选择:租房、小户型、大户型、别墅 例5:银行信誉等级
4
二、无序多元选择模型
❖ 无序的Probit计算复杂,故考虑有三种选择的Logit模型
❖ 产生系数限制的原因:
log
P3 P2
log
P3 P1
log
P1 P2
log
P3 P1
log
P2 P1
31 31X 21 21X 31 21 31 21X
❖ 这意味着以下限制条件:
32 31 21 32 31 21
多元离散选择模型

nJ
lnL
dijlnP(yi j)
i1 j0
Ex1. Binary Logistic Model Result
Dependent variable: honcomp
Stata Output
Multinomial Logistic Model Result
Dependent variable: prog
多元离散选择模型
二○一一年十月
本讲内容
多元离散选择模型 定序选择模型
一、多元离散选择模型
与上次讲的有何不同?
问题:农村异地转移劳动力的迁移目的地
被解释变量:迁移目的地,即小城镇、县级市、地级市、 省级城市和超大城市,依次取值1、2、3、4、5。
解释变量:个人特征、家庭特征和目前所在地属性。连续 变量包括受教育程度、家庭规模、家庭内其他劳动力人数、 家庭负担、原有收入、现有收入,目前所在地属性中的所 在地农村人口、国内生产总值、城乡居民储蓄余额、粮食 产量、中学生在校人数、小学生在校人数等。离散变量包 括性别、婚姻状况、收入稳定与否,目前所在地所属级别 与家乡所在地所属级别等。
Multinomial Logistic Model
Multinomial logistic regression involves nominal response variables more than two categories
Multinomial logit models are multi-equation models
小城镇、县级市、地级市、省级城市和超大城市依 次取值1、2、3、4、5。
最终模型的估计结果(部分)
变量 常数项
教育程度
家庭情况
模型序号 系数估计 标准差
二元选择模型
对y i 取期望,E (y i ) = :- + X i(2)\ P ( y i = 1) = P i wP( y i = 0) = 1 - p i 则E(y i ) = 1 (P i ) + 0 (1 - P i ) = P i由(2)和(3)式有(y i 的样本值是0或1,而预测值是概率。
)以P i = - 0.2 + 0.05 X i 为例,说明X i 每增加一个单位,则采用第一种选择的概率增加 现在分析Tobit 模型误差的分布。
由 Tobit 模型(1)有,⑶⑷0.05。
R1 ―口 - “ , u = y i - a - P X i = *住严-取,y i =1y i =0E(U i ) = (1- : - : X i ) P i + (- : - : X i ) (1 - P i ) = P i - : - : X i 由(4)式,有二元选择摸型如果回归模型的解释变量中含有定性变量,则可以用虚拟变量处理之。
在实际经济问题中,被解释变量 也可能是 定性变量。
如通过一系列解释变量的观测值观察人们对某项动议的 态度,某件事情的成功和失败等。
当被解释变量为定性变量时怎样建立模型呢?这就是要介 绍的二元选择模型或多元选择模型,统称离散选择模型。
这里主要介绍 Tobit (线性概率)模型,Probit (概率单位)模型和 Logit 模型。
1. Tobit (线性概率)模型 Tobit 模型的形式如下,其中U i 为随机误差项,X i 为定量解释变量。
y i 为二元选择变量。
此模型由 年提出,因此得名。
如利息税、机动车的费改税问题等。
设James Tobin 1958(若是第一种选择)1.2 1.0 0.8 0.6 0.4 0.2 0.0 -0.2330340350360370380E(U i ) = p i -圧-!::i X i = 0因为y i 只能取0, 1两个值,所以,E(u i 2) = (1- : - - X i )2 p i + (- : - - X i )2 (1 - p)=(1- :- - X i )2 (: +1:, X i ) + (:- +1「X i )2(1 -:■ - !::; X i ), (依据 ⑷式)=(1- : -:X i ) ( :- + : X i ) = p i (1 - p i ),(依据⑷式)=E(y i ) [1- E(y i )]上两式说明,误差项的期望为零,方差具有异方差。
多元选择模型概述
组成的方程组。 打OK后,EVIEWS计算出每个观察值落入任一类别的可 能性,并将其储存在与因变量同名但附加上类别识别码 和模拟方案(Scenario)码的变量下。
17
举例:有序因变量模型估计
某政策出台后对居民收入有影响,由此对市民的政策支 持情况进行调查。通过调查取得了市民收入 (X) 、支持与否 (Y)的数据,其中如果选民支持则 Yi 取0,中立取1,不支持 取2。获得了24组数据,进行排序选择模型估计分析。
0 Yi* 1 * Y 1 Y 待估计的三元选择模型: i 1 i 2 * 2 Y i 2 待源自计的潜回归模型:1.模型的估计
Y * X u
待估计参数:
1 2
18
收入 X
550 600 650 700 750 800 900 1000
4
二、无序多元选择模型
无序的Probit计算复杂,故考虑有三种选择的Logit模型
P log 2 21 21 X P 1 P log 3 31 31 X P 1 P log 3 32 32 X P2
这意味着以下限制条件:
32 31 21 32 31 21
即只需要估计系统中的两个方程便可以得到所有参 数。
7
无序多元选择模型
如果样本属于重复试验,那么可以计算出与每 个组相联系的概率 rij/ni,然后计算出机会比的对 数,与X做回归。 式中 rij 表示组 i 中选择 j 的次数占该组观察对象 总数ni的比例 如果没有足够多的重复,则需要利用最大似然 法进行估计。
22
23
4、预测
因为排序选择模型的因变量代表种类或等级数据,所以 不能从估计排序模型中直接预测。 选择Procs/ Make Model,打开一个包含方程系统的没有标 题的模型窗口,单击模型窗口方程栏的Solve按钮。例中因变 量y*的拟合线性指标,拟和值落在第一类中的拟合概率被命 名为Y_0_0的序列,落在第二类中的拟合概率命名为Y_1_0的 序列中,落在第三类中的拟合概率命名为 Y_2_0 的序列中, 等等。注意对每一个观察值,落在每个种类中的拟合概率相 加值为 1 。 Y_0_0 , Y_1_0 , Y_2_0 分别是支持、中立、不支 持的概率,Y,INC是实际样本。
多元选择模型
• 调查样本,有效样本303份。 • 首先将定义的全部变量放进模型中进行估计,并通过比较 各个变量的P值来考虑具体剔除哪些变量以及对哪些变量 考虑将其交互影响的效应放进模型中去。 • 小城镇、县级市、地级市、省级城市和超大城市依次取值 1、2、3、4、5。
迁移目标 小城镇 县级市 地级市 省级城市 超大城市
ik
k 0
J
exp(X i j Z j )
多元logit(ML)估计
对数似然函数的形式:
ln L( y, X , ) yij ln pij
i 1 j 1 J J yij ( X i j Z j ) ln[ exp(X i k Z k )] i 1 j 1 k 0 n n J
现有收入 -0.00144* -0.00032** -0.00028**
log(2/5) -0.2800*** log(3/5) log(4/5) -0.1136* -0.0856
-0.1578*** -0.00030**
• 从教育程度来看,所有系数都是负值,教育程度越高的农 村劳动力越愿意进入规模较大的城市;从显著性水平来看, 相对于超大城市来说,县级市被选择的可能性最小,其次 是小城镇,然后是地级城市,而教育程度相似的农村劳动 力在省级城市与超大城市之间的选择没有明显的差异。 • 从家庭情况来看,所有系数都是负值,也就是说家庭情况 越好的农村劳动力越愿意进入规模较大的城市;从显著性 水平来看,相对于超大城市来说,省级城市最不容易被选 中,其次是县级市,而小城镇与地级市之间没有明显区 别。 • 从现有收入来看,所有系数都是负值,也就是说目前收入 越高的农村劳动力越愿意进入规模较大的城市;再从显著 性水平来看,所有系数都是显著的,这说明相对于任何级 别的城市而言,农村劳动力都更倾向于超大城市。
《二元选择模型》课件
与其他模型的比较研究
比较二元选择模型与其他分类模型的 优缺点,为实际应用提供参考。
应用领域的拓展
将二元选择模型应用于更多领域,如 生物医学、环境科学等,以挖掘更多 有价值的信息。
谢谢观看
实证结果分析
边际效应分析
通过实证分析,我们得到了每个解释变量的边际效应,这些边际效应可以帮助我们了解各 个变量对二元选择结果的影响程度。
条件概率分析
在二元选择模型中,我们计算了每个解释变量的条件概率,这些条件概率可以帮助我们了 解在控制其他变量的情况下,某个变量对二元选择结果的影响程度。
稳健性检验
Probit模型
另一种统计方法,与Logit模型类似,用于估计二元选择概率 的优势。Probit模型同样将因变量的取值概率为0到1之间的 连续变量转换为二分类的离散变量,并使用最大似然估计法 估计模型参数。
概率优势的检验方法
显著性检验
检验解释变量对概率优势的影响是否 显著。通过比较模型拟合优度、参数 估计值等指标,判断解释变量是否对 二元选择结果产生了显著影响。
最小二乘估计法
总结词
最小二乘估计法是一种线性回归分析中的参数估计方法,通过最小化预测值与实 际值之间的平方误差来估计参数。
详细描述
最小二乘估计法的基本思想是,对于一组样本数据,选择参数值使得预测值与实 际值之间的平方误差最小。通过最小化误差平方和,可以得到参数的估计值。这 种方法在二元选择模型中有时也被用来估计模型参数。
二元选择模型的重要性
预测和决策支持
二元选择模型能够预测二 元结果,帮助决策者了解 不同因素对结果的影响, 从而做出更好的决策。
深入了解影响因素
通过分析影响二元结果的 因素,可以深入了解这些 因素的作用机制和影响程 度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最终模型的估计结果(部分) 最终模型的估计结果(部分)
变量 常数项 模型序号 系数估计 1 2** 3** 4*** 教育程度 1** 2*** 3* 4 家庭情况 1 2* 3 4*** 1.2137 2.7685 2.3962 3.6742 -0.2475 -0.2800 -0.1136 -0.0856 -0.1299 -0.0943 -0.0337 -0.1578 标准差 1.4518 1.0998 0.9351 1.0665 0.1050 0.0727 0.0660 0.0696 0.1084 0.0552 0.0452 0.0586 P值 0.4032 0.0118 0.0104 0.0006 0.0184 0.0001 0.0852 0.2184 0.2310 0.0877 0.4556 0.0071
P ( yi = j) =
e
J
Z ij Γ + W i Α
∑e
j=0
=
Z ij Γ + W i Α
e
J
Z ij Γ
eWiΑ e
WiΑ
∑e
j=0
Z ij Γ
P ( yi = j) = e
e
Z ij Γ
eWiΑ
Z ij Γ
WiΑ
∑e
j=0
J
=
e
J
Z ij Γ Z ij Γ
∑e
j=0
实用的一般多元 实用的一般多元Logit选择模型又分 种情况。 选择模型又分3种情况 选择模型又分 种情况。 一是研究选择某种方案的概率与决策者的特征变 量之间的关系; 量之间的关系; 二是研究选择某种方案的概率与决策者的特征变 量以及方案的特征变量之间的关系; 量以及方案的特征变量之间的关系; 三是考虑到不同方案之间的相关性的情况。 三是考虑到不同方案之间的相关性的情况。
一、多元离散选择模型的经济背景
1、经济生活中的多元选择问题 、
一般的多元选择问题 排序选择问题 – 将选择对象按照某个准则排队,由决策者从中 将选择对象按照某个准则排队, 选择。 选择 – 决策者对同一个选择对象的偏好程度。 决策者对同一个选择对象的偏好程度。 嵌套选择问题
2、社会生活中的多元选择问题 、
另一种估计方法
可以计算得到相对于基准方案的对数概率比为: 可以计算得到相对于基准方案的对数概率比为:
ln( Pij Pi 0
Pij Pik
) = X iΒ
j
如果对每个决策者进行 重复观测, 重复观测,可以得到被 解释变量的观测值。 解释变量的观测值。
j
ln (
) = X i (Β
Βk )
如果对每个决策者只进 行一次观测, 行一次观测,如何得到 被解释变量的观测值? 被解释变量的观测值?
两点注意: 两点注意:
假设了原模型中( 假设了原模型中(J+1)个随机误差项互不相关。 )个随机误差项互不相关。 对估计结果的解释不同。 对估计结果的解释不同。
例题
农村异地转移劳动力的迁移目标研究。 农村异地转移劳动力的迁移目标研究。 被解释变量:迁移目标,即小城镇、县级市、地级市、省 被解释变量:迁移目标,即小城镇、县级市、地级市、 级城市和超大城市,依次取值1、 、 、 、 。 级城市和超大城市,依次取值 、2、3、4、5。 解释变量:个人特征和目前所在地属性。连续变量包括受 解释变量:个人特征和目前所在地属性。连续变量包括受 教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、 教育程度、家庭规模、家庭内其他劳动力人数、家庭负担、 原有收入、现有收入, 原有收入、现有收入,目前所在地属性中的所在地农村人 国内生产总值、城乡居民储蓄余额、粮食产量、 口、国内生产总值、城乡居民储蓄余额、粮食产量、中学 包括性别、 生在校人数、小学生在校人数等。离散变量包括性别 生在校人数、小学生在校人数等。离散变量包括性别、婚 姻状况、收入稳定与否,目前所在地所属级别与家乡所在 姻状况、收入稳定与否, 地所属级别等。 地所属级别等。 虽然作为被解释变量的城市规模本身是有序的,但是对于 虽然作为被解释变量的城市规模本身是有序的, 农村劳动力来说,选择进入哪一个级别的城市, 农村劳动力来说,选择进入哪一个级别的城市,本身是无 序的,因此对于城市化迁移目标构造多元名义 多元名义logit离散选 序的,因此对于城市化迁移目标构造多元名义 离散选 择模型。 择模型。
一般的多元选择问题 排序选择问题 嵌套选择问题
二、一般多元离散选择Logit模型 一般多元离散选择Logit模型 Logit
说明
在多元离散选择模型中,因为Probit模型需要对 在多元离散选择模型中,因为Probit模型需要对 Probit 多元正态分布的整体进行评价, 多元正态分布的整体进行评价,所以它的应用受 到限制。 到限制。 逻辑分布更适合于效用最大化时的分布选择,所 逻辑分布更适合于效用最大化时的分布选择, 以应用最多的多元离散选择模型是Logit模型。 Logit模型 以应用最多的多元离散选择模型是Logit模型。 Logit模型的似然函数能够快速可靠地收敛,当方 Logit模型的似然函数能够快速可靠地收敛, 模型的似然函数能够快速可靠地收敛 案或者决策个体数量较大时,计算比较简便。 案或者决策个体数量较大时,计算比较简便。
§4.2
离散被解释变量数据计量经济学 模型— 多元选择模型 模型 Models with Discrete Dependent Variables—Multiple Choice Model
一、多元离散选择模型的经济背景 一般多元离散选择Logit Logit模型 二、一般多元离散选择Logit模型 三、嵌套多元离散选择模型 四、排序多元离散选择模型
调查样本,有效样本303份。 调查样本,有效样本 份 用SAS统计软件进行估计与分析。 统计软件进行估计与分析。 统计软件进行估计与分析 首先将定义的全部变量放进模型中进行估计,并通过比较 首先将定义的全部变量放进模型中进行估计, 各个变量的P值来考虑具体剔除哪些变量以及对哪些变量 各个变量的 值来考虑具体剔除哪些变量以及对哪些变量 考虑将其交互影响的效应放进模型中去。 考虑将其交互影响的效应放进模型中去。 小城镇、县级市、地级市、省级城市和超大城市依次取值 小城镇、县级市、地级市、 1、2、3、4、5。 、 、 、 、 。
迁移 目标 小城镇 县级市 地级市 省级城市 超大城市
频数
百分比
累 计频数
累计百分 比
15 62 84 72 70
4.95 20.46 27.72 23.76 23.10
15 77 161 233 303
4.95 25.41 53.14 76.90 100.00
由于得到了频数,可以采用“对数概率模型”进行估计。 由于得到了频数,可以采用“对数概率模型”进行估计。
U ij = X ij Β + ε ij
P (U ij > U ik )
X ij Β X ij Β
选择j的概率
k = 0,1,2 , L , J
k ≠ j
如果(J+1)个随机误 差项互不相关,并且 服从Ⅰ类极值分布
P( yi = j) =
e
∑
j=0
J
e
F ( ε ij ) = e
ε ij
效用模型的解释变量中包括所有影响选择的因素, 效用模型的解释变量中包括所有影响选择的因素, 既包括决策者所具有的属性, 既包括决策者所具有的属性,也包括备选方案所 具有的属性。 具有的属性。 备选方案所具有的属性是随着方案的变化而变化 的。 决策者所具有的属性中一部分是随着方案的变化 而变化的, 而变化的,而一部分是不随着方案的变化而变化 的。 用Zij表示随着方案的变化而变化的那部分解释变 量,Wi表示不随着方案的变化而变化的那部分解 释变量。 释变量。
*代表的是90 %的显著性水 平, **代表的是95 %的显著性水 平, ***代表的是 99%的显著性 水平。
将模型的结果整理出来,并对每个解释变量进行分析。 将模型的结果整理出来,并对每个解释变量进行分析。 例如:教育程度、家庭情况及现有收入对迁移目标的影响: 例如:教育程度、家庭情况及现有收入对迁移目标的影响:
, , ,, , 能存在 1 个 dij =1。于是,可以写出 yij (i =12,L n; j =012,L J) 的联合概率函
数,由联合概率函数导出似然函数,进而得到对数似然函数为:
ln L =
∑∑d
i =1 j = 0
n
J
ij ln
P( yi = j)
ln L = பைடு நூலகம்Βj
∑ (d
i
ij
Pij ) X i
P( yi = j) = e
J X iΒ j X iΒ j
X中未包含备选方案所具有的 中未包含备选方案所具有的 属性变量,而参数向量B对不 属性变量,而参数向量 对不 同的选择方案(即不同的方程) 同的选择方案(即不同的方程) 是不同的。 是不同的。
∑e
j=0
P( y i = j ) = 1+
e
XiΒ j
从教育程度来看,所有系数都是负值,教育程度越高的农 从教育程度来看,所有系数都是负值, 村劳动力越愿意进入规模较大的城市;从显著性水平来看, 村劳动力越愿意进入规模较大的城市;从显著性水平来看, 相对于超大城市来说,县级市被选择的可能性最小,其次 相对于超大城市来说,县级市被选择的可能性最小, 是小城镇,然后是地级城市, 是小城镇,然后是地级城市,而教育程度相似的农村劳动 力在省级城市与超大城市之间的选择没有明显的差异。 力在省级城市与超大城市之间的选择没有明显的差异。 从家庭情况来看,所有系数都是负值,也就是说家庭情况 从家庭情况来看,所有系数都是负值, 越好的农村劳动力越愿意进入规模较大的城市; 越好的农村劳动力越愿意进入规模较大的城市;从显著性 水平来看,相对于超大城市来说,省级城市最不容易被选 水平来看,相对于超大城市来说, 其次是县级市, 中,其次是县级市,而小城镇与地级市之间没有明显区 别。 从现有收入来看,所有系数都是负值,也就是说目前收入 从现有收入来看,所有系数都是负值, 越高的农村劳动力越愿意进入规模较大的城市; 越高的农村劳动力越愿意进入规模较大的城市;再从显著 性水平来看,所有系数都是显著的, 性水平来看,所有系数都是显著的,这说明相对于任何级 别的城市而言,农村劳动力都更倾向于超大城市。 别的城市而言,农村劳动力都更倾向于超大城市。