第十章定性选择模型(计量经济学,潘省初)
计量经济学答案—湘潭大学(龚志民 马知遥)讲解

计量经济学课后习题答案——湘潭大学出版社(龚志民马知遥)本文档由湘潭大学13级经济学1班整理第一章导论1.1 说明什么是横截面数据、时间序列数据、合并截面数据和面板数据。
答:截面数据是指一个变量或多个变量在某个时点的数据集。
也就是说,在同一个时点观察多个对象的某个属性或变量取值。
时间序列数据是指对一个或几个变量跨期观察得到的数据。
也就是按固定的时间间隔观察某个对象的属性或变量的取值。
合并截面数据是指在不同时点截面数据的合并。
不同时点的截面单位可以不同,即不同时点抽取的样本不必相同。
面板数据也称纵列数据,是对若干固定对象的属性或变量值跟踪观察而得的数据,跟踪观察一般是按固定时间间隔的跨期观察。
1.2 你如何理解计量经济学?答:计量经济学是在对经济数据的收集和加工,并以图、表等各种形式展现经济发展现状的基础上,进行定量研究,同时进行经济理论的探索和经济变量之间关系的研究,并注重理论的可度量性及其经验验证。
总之,计量经济学是利用经济学理论、数学、数理统计学方法、计算机工具和统计软件研究经济学问题的一门学科。
1.3 DA TA1-1给出了2010-2011年中国31个省市GDP和固定资产投资的数据,你能想到那些方法研究两者之间的关系?答:方法一:用一元线性回归模型的方法。
方法二:相关分析。
利用数据可以求出两者之间的相关系数r,利用相关系数的性质即可判断出两者是否存在相关关系。
1.4 DA TA1-2给出了中国1952-2012年GDP和消费支出的数据,尝试对消费和收入的关系作出描述。
从中你有什么发现?答:从表中数据可以看出:当收入增加时,消费也会相应的增长;当收入增加幅度变大时,消费增加的幅度也变大,但消费增加的幅度比收入增加的幅度小。
也就是说,收入增加时,收入增加的一部分用于消费,而不是全部。
这很符合消费者边际消费倾向小于1的理论。
由此可见,消费和收入可能存在高度相关性。
通过描图更能直观地说明问题。
计量经济学知识串讲PPT课件

• 阿尔蒙法:
目的:消除多重共线性的影响。 基本原理:在有限分布滞后模型滞后长度 已知的情况
下,滞后项系数有一取值结构,把它看成是相应滞后 期 的函数。在以滞后期 为横轴、滞后系数取值为 纵轴的坐标系中,如果这些滞后系数落在一条光滑曲 线上,或近似落在一条光滑曲线上,则可以由一个关 于i的次数较低的m次多项式很好地逼近,即
第一章 导 论
• 计量经济学是以经济理论和经济数据的事实为依据,运用数学和统计学的 方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
第1页/共82页
计量经济学的研究步骤
选择变量和数学关系式 —— 模型设定 收集模型中的变量数据——数据收集 确定变量间的数量关系 —— 估计参数 检验所得结论的可靠性 —— 模型检验 作经济分析和经济预测 —— 模型应用
第49页/共82页
第50页/共82页
自相关系数pho的确定
• (1) Cochrane - Orcutt迭代法 • (2)德宾两步法
第51页/共82页
第七章 分布滞后模型与自回归模型
• 一、分布滞后模型
第52页/共82页
(一)分布滞后模型估计的困难
自由度问题 多重共线性问题 滞后长度难于确定的问题
第二章 简单线性回归模型
一、相关与回归 相关是回归的前提。回归研究的是变量间的因果关系,可以从一个变量去推测另一个变量的具体变化。 相关是对称相关。回归不一定。 相关与回归都得从经济意义和实际经验去考虑,否则有可能是“伪相关”和“伪回归”。 回归分析方法是计量经济学的基础。
第6页/共82页
二、涉及的四种方程或模型
第2页/共82页
模型中数据的类型: ——截面数据 ——时间序列数据 ——面板数据(混合数据) ——虚拟变量数据
《计量经济学》-谢识予-分章练习题

计量经济学分章练习题第一章习题一、判断题1.投入产出模型和数学规划模型都是计量经济模型。
(×)2.弗里希因创立了计量经济学从而获得了诺贝尔经济学奖。
(√)3.丁伯根因创立了建立了第1个计量经济学应用模型从而获得了诺贝尔经济学奖。
(√)4.格兰杰因在协整理论上的贡献而获得了诺贝尔经济学奖。
(√)5.赫克曼因在选择性样本理论上的贡献而获得了诺贝尔经济学奖。
(√)二、名词解释1.计量经济学,经济学的一个分支学科,是对经济问题进行定量实证研究的技术、方法和相关理论。
2.计量经济学模型,是一个或一组方程表示的经济变量关系以及相关条件或假设,是经济问题相关方面之间数量联系和制约关系的基本描述。
3.计量经济检验,由计量经济学理论决定的,目的在于检验模型的计量经济学性质。
通常最主要的检验准则有随机误差项的序列相关检验和异方差性检验,解释变量的多重共线性检验等。
4.截面数据,指在同一个时点上,对不同观测单位观测得到的多个数据构成的数据集。
5.面板数据,是由对许多个体组成的同一个横截面,在不同时点的观测数据构成的数据。
三、单项选择题1.把反映某一单位特征的同一指标的数据,按一定的时间顺序和时间间隔排列起来,这样的数据称为( B )A. 横截面数据B. 时间序列数据C. 面板数据D. 原始数据2.同一时间、不同单位按同一统计指标排列的观测数据称为( C )A.原始数据 B.时间序列数据C.截面数据 D.面板数据3.不同时间、不同单位按同一统计指标排列的观测数据称为( D )A.原始数据 B.时间序列数据C.截面数据 D.面板数据4.对计量经济模型进行的结构分析不包括( D )A.乘数分析 B.弹性分析C.比较静态分析 D.随机分析5.一个普通家庭的每月所消费的水费和电费是( B )A.因果关系 B.相关关系C.恒等关系 D.不相关关系6.中国的居民消费和GDP是( C )A.因果关系 B.相关关系C.相互影响关系 D.不相关关系7. 下列( B )是计量经济模型A .01i Y X ββ=+B .01i i Y X ββμ=++C .投入产出模型D .其他8. 投资是( A )经济变量A .流量B .存量C .派生D .虚拟变量9. 资本是( B )经济变量A .流量B .存量C .派生D .虚拟变量10. 对定性因素进行数量化处理,需要定义和引进( C )A .宏观经济变量B .微观经济变量C .虚拟变量D .派生变量四、计算分析题1.“计量经济模型就是数学”这种说法正确吗,为什么?计量经济学模型不是数学式子,相比数学式子多了一个随机误差项,是随机性的函数关系。
(完整word版)计量经济学中级教程(潘省初 清华大学出版社)课后习题答案

计量经济学中级教程习题参考答案第一章 绪论1.1 一般说来,计量经济分析按照以下步骤进行:(1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据(4)估计参数 (5)假设检验 (6)预测和政策分析 1.2 我们在计量经济模型中列出了影响因变量的解释变量,但它(它们)仅是影响因变量的主要因素,还有很多对因变量有影响的因素,它们相对而言不那么重要,因而未被包括在模型中。
为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。
1.3 时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。
横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。
如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。
1.4 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。
在一项应用中,依据估计量算出的一个具体的数值,称为估计值。
如Y 就是一个估计量,1nii YYn==∑。
现有一样本,共4个数,100,104,96,130,则根据这个样本的数据运用均值估计量得出的均值估计值为5.107413096104100=+++。
第二章 经典线性回归模型2.1 判断题(说明对错;如果错误,则予以更正) (1)对 (2)对 (3)错只要线性回归模型满足假设条件(1)~(4),OLS 估计量就是BLUE 。
(4)错R 2 =ESS/TSS 。
(5)错。
我们可以说的是,手头的数据不允许我们拒绝原假设。
(6)错。
因为∑=22)ˆ(tx Var σβ,只有当∑2t x 保持恒定时,上述说法才正确。
2.2 应采用(1),因为由(2)和(3)的回归结果可知,除X 1外,其余解释变量的系数均不显著。
计量经济学:模型总体设定

• 错例1:在一篇研究制度变迁与经济增长的关系的 博士论文中,建立了如下模型:
ln GDP t 0 1 ln MDIt t
其中,GDP表示国内生产总值,MDI表示制度变 迁。估计得到
ˆ 2.1 1
结论:制度变迁对于GDP的弹性系数为2.1。即制 度变迁变化1%,国内生产总值将变化2.1%。
• 基于时间序列数据的计量经济学模型由于存在非平稳性和 序列相关性,其统计分析理论方法得到了迅速的发展,一 方面为模型总体设定提供了强大的工具,另一方面又将模 型设定引入仅仅依赖数据的歧途。
• 对时间序列的非平稳性的识别与处理构成了数据关系转向 的主要内容; • 在非平稳随机过程之间,建立恒常的数据关系,成为数据 关系导向中时间序列分析的主要目标。
• 从这个意义上,单位根检验、因果关系检验和协整检验理 论,给出了总体回归模型设定的有效工具。
• 这就是计量经济学模型总体设定的“统计检验必要性”原 则。
五、计量经济学模型总体设定的“经济 主体动力学关系导向”原则
• 关于计量经济学模型总体设定的讨论,必须首先 回答:
– 要确定的是经济主体内在的本质意义的属性,还是经 济主体之间的关系意义的属性。 – 要确定的是主体之间的动力学关系,还是作为主体经 济活动结果的经济变量之间的数据关系。
1、模型总体设定
• 两种基本总体模型:
– 一是静态的总体模型。主要是描述经济因素之间不随 时间演变的静态平衡结构,力图揭示经济系统的平衡 关系法则,对应的总体是不随时间变化的静态随机分 布,通常利用截面数据来估计总体模型参数。 – 二是动态的总体模型。主要是描述持续演变的经济因 素之间的动态平衡结构,力图揭示经济系统的演变法 则,对应的总体是在时间维度上持续发生的随机过程, 通常利用时间序列数据来估计总体模型参数。
计量经济学_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年

计量经济学_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年1.如果解释变量中存在被解释变量的滞后项,那么检验是否存在自相关应当用答案:BG检验2.DW统计量值接近2时,随机误差项为()答案:无自相关3.如果回归模型中的随机误差项存在异方差,则模型参数的普通最小二乘估计量()答案:无偏但非有效4.在由n=30的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定系数为0.8500,则调整后的多重决定系数为()。
答案:0.83275.对于模型【图片】,如果在异方差检验中发现【图片】,则用加权最小二乘法估计模型参数时,权数应为()答案:6.若回归模型中的随机误差项存在异方差性,则估计模型参数应采用()答案:加权最小二乘法7.总体回归线是指答案:解释变量X取给定值时,被解释变量Y的条件均值或期望值的轨迹8.下列关于可决系数的陈述哪个是正确的。
答案:可决系数是指回归平方和(SSR)在总离差平方和(SST)中所占的比重9.在二元线性回归模型【图片】中,【图片】表示()。
答案:当X2不变时,X1每变动一个单位Y的平均变动。
10.在二元线性回归模型中,回归系数的显著性t检验的自由度为答案:n-311.面板模型中丢失若干观测值,可以说该面板数据是非平衡面板数据。
答案:错误12.面板数据模型有助于减少解释变量之间的共线性,得到更有效的估计量。
答案:正确13.面板数据模型可以解决样本量不足的问题,可以增加样本容量和自由度。
答案:正确14.固定效应模型和随机效应模型的选择性检验,通常采用的是答案:Hausman检验15.面板数据是指答案:不同时点上不同统计单位相同统计指标组成的数据16.当存在序列相关时,OLS估计量是有偏的并且也是无效的答案:错误17.两个模型,一个是一阶差分形式,一个是水平形式,这两个模型的是不可以直接比较的。
答案:正确18.关于BG检验,下列说法正确的是答案:适用于解释变量中包含被解释变量滞后项的回归_适用于检验自相关性19.DW统计量值接近2时,随机误差项为( )答案:无自相关20.BP检验的结果可以帮助我们为加权最小二乘法寻找合适的权重答案:正确21.存在异方差情况下,普通最小二乘估计量依然是无偏和有效的。
第十章定性选择模型计量经济学潘省初
log F (zi ) 1 F (zi )
exp(zi )
exp(zi )
log 1 exp(zi ) log
1 exp(zi )
1 exp(zi )
1 exp(zi ) exp(zi )
1 exp(zi )
1 exp(zi )
exp(zi )
log 1 exp(zi ) 1
log exp(zi )
INCOME的系数估计值0.002表明,一个学生的成 绩不变,而家庭收入增加1000美元,该生决定去读研 的概率的估计值增加0.002。
LPM模型中,解释变量的变动与虚拟因变量值为1 的概率线性相关,因而称为线性概率模型。
线性概率模型存在的问题
(1)线性概率模型假定自变量与Y=1的概率之间存 在线性关系,而此关系往往不是线性的。 (2)拟合值可能小于0或大于1,而概率值必须位于 0和1的闭区间内。
由于累积正态分布和累积logistic分布很接近,
只是尾部有点区别,因此,我们无论用(10.11)还
பைடு நூலகம்
是(10.12),也就是无论用logit法还是probit法,
得到的结果都不会有很大不同。可是,两种方法得
到的参数估计值不是直接可比的。由于logistic分布
的方差为
2
3
,因此,logit模型得到的的估计值必
Variable Coefficient Standard error t-Statistic
Constant
-0.51
0.19
-2.65
INCOME
0.0098
0.003
3.25
AGE
0.016
0.0053
3.08
第10章(离散选择模型) 计量经济学
R2 0.996, DW 0.58, F 1896.54
这一结果表明,分别来看,我国储蓄函数 的截距和斜率在1990年前后发生了结构变 化。
《计量经济学》,高教出版社, 2011年6月,王少平、杨继生、欧
对β1和β3的联合为0的原假设,我们使用约束的F检验。其约 束条件为 β1=β3 =0。记RSSr为有约束的残差平方和,RSSu为 无约束的残差平方和,构造并计算F统计量:
2011年6月,王少平、杨继生、欧
《计量经济学》,高教出版社, 2011年6月,王少平、杨继生、欧
可以使用通常的t统计量检验单个回归系数 β1或β3的显著性,而对于β1,β3的联合显著 性,则使用通常受约束的F统计量。模型 (10.1.5)的估计结果如下:
St 14847.4 13615.4 Dt 0.832GDPt 0.481Dt GDP et
( RSSr RSSu ) / q (6.44 108 2.67 108 ) / 2 F 17.65 8 RSSu /(n k 1) 2.67 10 /(29 3 1)
由于计算得到的F统计量值17.65>F0.05(2.25)=3.39 ,故拒绝原 假设,接受备择假设,我国储蓄函数在1990年前后发生显著 结构变化。 1990年以前的边际储蓄倾向为 β2 +β3=0.832-0.481 =0.351 1990年后的边际储蓄倾向为0.832
估计结果如下:
GDPt 13049.0 2125.3 D1t 2700.3 D2t 12747.4 D3t 1362.1 T et
t= (6.83) (1.)
潘省初计量经济学第3版
β 0 X 2t β1 X 2t X 1t ...... β K X 2t X Kt X 2tYt
......
......
......
......
β 0 X kt β1
X kt X 1t ...... β K
X Kt 2
X ktYt
按矩阵形式,上述方程组可表示为:
X'
1 Y1
X 1n
Y2
... ...
X
Kn
Yn
Y
即 ( X ' X )β X 'Y
β ( X X )1 X Y
14
三. 最小二乘估计量 β的性质 我们的模型为 Y X u
估计式为
Yˆ
Xβ
1.β 的均值
β ( X X )1 X Y
( X X )1 X ( Xβ u)
( X X )1 X Xβ ( X X )1 X u
收入不变的情况下,价格指数每上升一个点, 食品消费支出减少7.39亿元(0.739个billion)
3
例2:
Ct
β 1
β 2 Dt
β 3 Lt
ut
其中,Ct=消费,Dt=居民可支配收入 Lt=居民拥有的流动资产水平
β2的含义是,在流动资产不变的情况下,可支配收入变动 一个单位对消费额的影响。这是收入对消费额的直接影响。
为求Var( β ),我们考虑
E
β
β
β
β
β0 β0
E
β1 β1
...
β
0
β
0
β1 β1
...
βK
βK
β
K
βK
17
Var(β 0 )
应用经济学硕士研究生培养方案
应用经济学硕士研究生培养方案(学科代码:0202)一、培养目标本学科致力于培养具有严谨求实的学术作风,德、智、体全面发展,具有坚定正确的政治方向,具有扎实的经济学理论基础、合理的知识结构和宽广的知识面,具有独立从事经济研究的能力,能胜任经济类课程的教学,能胜任实际经济工作。
较为熟练地掌握一门外语并能阅读本学科的外文资料;毕业后可承担本学科的教学、科研工作和中高层次的经济管理工作;具有健康的心理和体魄。
二、学科专业1、区域经济学2、数量经济学3、财政学(含税收学)4、产业经济学5、统计学三、学习年限及应修学分全日制硕士研究生的学习年限一般为3年。
在完成培养要求的前提下,对少数学业优秀、科研成果突出的硕士生,可申请提前毕业,提前期一般不超过1年。
如确需延长学习年限的,延长期一般不超过1年。
至少须修满35学分,其中,课程学习32学分,实践环节3学分。
四、课程设置及考核方式(具体见课程设置与教学计划表)实践环节由科研实践和教学实践组成,科研实践必须参加校内外相关学科学术会议1次,撰写心得体会一份(计1学分);选听学科前沿系列讲座1次,至少6学时;撰写相关文献综述一份(计1学分)。
教学实践必须听课30学时,讲课30学时,提交教学大纲一份(计1学分)。
科研实践和教学实践均由导师负责考核。
五、培养方式研究生由导师及导师小组全面负责培养,以导师指导和本学科教师集体培养相结合为原则,建立和完善有利于学术群体作用的培养机制。
课程学习和研究并重;专业课的学习采取系统讲授、重点辅导、讨论讲座以及任课教师制定参考文献、书目,学习阅读后写综述和评论等多种形式。
加强研究生的自学能力、表达能力、写作能力、实际工作能力等的训练和培养。
六、学位(毕业)论文研究生在修完全部学位课程和修满所要求的总学分后,要在导师的指导下,进行学位(毕业)论文的研撰,由硕士研究生独立完成,论文写作时间不少于一年。
论文选题必须经过充分调查研究,查阅相关的文献,了解国内外本领域的研究历史和现状,选择本学科内有重要学术价值和实用价值、研究基础较为薄弱的问题,或能为解决当前、当地经济和社会发展的热点、难点问题以及为政府决策提供借鉴的问题作为论文选题;研究生确定了论文选题后,在论文写作之前,必须撰写开题报告,开题报告应包括论文选题的理由或意义、国内外有关该论题研究的现状及趋势、本人的详细研究计划、写作提纲、主要参考文献等内容。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
尽管因变量在这个二元选择模型中只能取两个值: 0或1,可是该学生的的拟合值或预测值为0.8。我们 将该拟合值解释为该生决定读研的概率的估计值。因 此,该生决定读研的可能性或概率的估计值为0.8。 需要注意的是,这种概率不是我们能观测到的数字, 能观测的是读研还是不读研的决定。
对斜率系数的解释也不同了。在常规回归中,斜 率系数代表的是其他解释变量不变的情况下,该解释 变量的单位变动引起的因变量的变动。而在线性概率 模型中,斜率系数表示其他解释变量不变的情况下, 该解释变量的单位变动引起的因变量等于1的概率的 变动。
log F (zi ) 1 F (zi )
exp(zi )
exp(zi )
log 1 exp(zi ) log
1 exp(zi )
1 exp(zi )
1 exp(zi ) exp(zi )
1 exp(zi )
1 exp(zi )
exp(zi )
log 1 exp(zi ) 1
须乘以 3,才能与probit模型得到的估计值相比较
(正态分布标准差为1)。
二.Probit模型
Probit模型可以解决很多线性概率模型中遇到的问 题。如我们在前面指出的,线性概率模型会给出小于 0或大于1 的这种不可能的概率估计值,Probit模型所 依据的是累积正态概率分布,将避免这类问题的发生, 同时它给出接近0或1的概率估计值的机会也要小于线 性概率模型。与线性概率模型相比,Probit模型更准 确地描述我们打算研究的许多决策过程。如图10-1所 示
正确预测观测值的百分比
正确预测的观测值数 观测值总数
100
需要指出的是,这个测度也不是很理想,但预测结
果的好坏,并非定性选择模型唯一关心的事,这类模 型常被用于研究影响人们进行某个决策的因素。让我 们来看一个竞选的例子。假设候选人甲和乙二人竞选 某市市长,我们可以用一个二元选择模型来研究影响 选民决策的因素,数据见表10-1,模型为:
从表10-3可看出,30个观测值中,27个(或90%) 预测正确。选甲的14人中,12人(或85.7%)预测正 确。选乙的16人中,15人(或93.8%)预测正确。
是0.58,表明模型解释了因变量的58%的变动, 这与R 290%的正确预测比例相比,低了不少。注意表10 -3中有一些拟合值大于1或小于0。这是我们前面指 出的这类模型的缺点之一,这些拟合值是概率的估计 值,而概率永远不可能大于1或小于0。
(3) 另一个问题是扰动项不是正态分布的。事实 上,线性概率模型的扰动项服从二项分布。
(4)此外,线性概率模型存在异方差性。扰动项
的方差是 p(1 p) ,这里 p 是因变量等于1的概率,
此概率对于每个观测值不同,因而扰动项方差将不 是常数,导致异方差性。可以使用WLS法,但不是 很有效,并且将改变结果的含义。
线性概率模型存在的问题
(1)线性概率模型假定自变量与Y=1的概率之间存 在线性关系,而此关系往往不是线性的。 (2)拟合值可能小于0或大于1,而概率值必须位于 0和1的闭区间内。
回到有关读研的例子。假设学生乙的GPA为4.0, 家庭收入为20万美元,则代入(10.3)式,Y的拟合 值为
Yˆ 0.7 0.4 4.0 0.002 200 1.3 (10.5)
log exp(zi )
zi
1 exp(zi )
结合(10.9)式,对于logit模型,有:
log pi
1 pi
0
k
ij X ij
j 1
上式的左端是机会(odds)的对数,称为对数机
会比率(log-odds ratio),因而上式表明对数机会
比率是各解释变量的线性函数,而对于线性概率模
从而得到一个不可能的结果(概率值大于1)。假设 另有一个学生丙的GPA为1.0,家庭收入为5万元,则 其Y的拟合值为 -0.2,表明读研的概率为负数,这也 是一个不可能的结果。
解决此问题的一种方法是,令所有负拟合值都等 于0,所有大于1的拟合值都等于1。但也无法令人十 分满意,因为在现实中很少会有决策前某人读研的 概率就等于1的情况,同样,尽管某些人成绩不是很 好,但他去读研的机会仍会大于0。线性概率模型倾 向于给出过多的极端结果:估计的概率等于0或1。
k
1 F[(0 j Xij )] j 1
其中F是u的累积分布函数。
如果u的分布是对称的,则 1 F(z) F(z) ,我们
可以将上式写成
k
Pi F (0 j X ij ) j 1
(10.9)
我们可写出似然函数:
L Pi (1 Pi ) Yi 1 Yi 0
CAND1i 0 1INCOMEi 2 AGEi 3MALEi ui
其中:
1 如果第i个选民投候选人甲的票
CAND1i 0 如果第i个选民不投候选人甲的票
(10.6)
INCOMEi 第i个选民的家庭收入(单位:千美元)
AGEi 第i个选民的年龄
1 男性 MALEi 0 女性
R 2 = 0.58
Adjusted R2 = 0.53
Residual Sum of Squares =3.15
F-statistic = 11.87
t-Statistic -2.65 3.25 3.08 0.02
p-Value 0.01 0.00 0.00 0.98
如表10-2所示,INCOME的斜率估计值为正,且 在1%的水平上显著。年龄和性别不变的情况下,收入 增加1000元,选择候选人甲的概率增加0.0098。
对每个观测值,我们可根据(10.3)式计算因变量 的拟合值或预测值。在常规OLS回归中,因变量的拟 合值或预测值的含义是,平均而言,我们可以预期的 因变量的值。但在本例的情况下,这种解释就不适用 了。假设学生甲的平均分为3.5,家庭年收入为5万美 元,Y的拟合值为
Yˆ 0.7 0.43.5 0.00250 0.8 (10.4)
型, pi为各解释变量的线性函数。
如果(10.9)式中 ui 服从正态分布,我们得到的
是probit模型(或normit模型),在这种情况下,累
积分布函数为:
F(zi )
zi /
1 exp( t2 )dt
2
2
(10.12)
无论是probit模型还是logit模型,极大似然函数 (10.10)都伴随着非线性估计方法,目前很多计量 经济分析软件已可用于probit和logit分析,用起来很 方便。
GPA的系数估计值0.4意味着家庭收入不变的情况 下,一个学生的GPA增加一个点(如从3.0到4.0), 该生决定去读研的概率的估计值增加0.4。
INCOME的系数估计值0.002表明,一个学生的成 绩不变,而家庭收入增加1000美元,该生决定去读研 的概率的估计值增加0.002。
LPM模型中,解释变量的变动与虚拟因变量值为1 的概率线性相关,因而称为线性概率模型。
其中:
1 第i个学生拿到学士学位后三年内去读研
Yi 0
该生三年内未去读研
GPAi 第i个学生本科平均成绩
INCOMEi 第i个学生家庭年收入(单位:千美元)
设回归结果如下(所有系数值均在10%水平统计 上显著):
Yˆi 0.7 0.4GPAi 0.002INCOMEi (10.3)
AGE的斜率估计值也在1%的水平上显著。在收入 和性别不变的情况下,年龄增加1岁,选择候选人甲的 概率增加0.016。MALE的斜率系数统计上不显著,因 而没有证据表明样本中男人和女人的选票不同。
我们可以得出如下结论:年老一些、富裕一些的选 民更喜欢投票给候选人甲。
表10-3给出CAND1的拟合值,每个大于等于0.5的 拟合值计入CAND1为1的预测,而小于0.5的拟合值则 计入CAND1为0的预测。
由于累积正态分布和累积logistic分布很接近,
只是尾部有点区别,因此,我们无论用(10.11)还
是(10.12),也就是无论用logit法还是probit法,
得到的结果都不会有很大不同。可是,两种方法得
到的参数估计值不是直接可比的。由于logistic分布
的方差为
2
3
,因此,logit模型得到的的估计值必
若Yi* 0 其它
(10.8)
这就是Probit和Logit方法的思路。Probit模型和 Logit模型的区别在于对(10.7)式中扰动项u的分布 的设定,前者设定为正态分布,后者设定为logistic分 布。
(10.7)式与线性概率模型的区别是,这里假设潜 变量的存在。例如,若被观测的虚拟变量是某人买车
表10-2 两候选人选举线性概率模型回归结果 Dependent variable:CAND1
Variable
Coefficient
Standard error
Constant
-0.51
0.19
INCOME
0.0098
0.003
AGE
0.016
0.0053
MALE
0.0031
0.13
Observations:30
这看上去与典型的OLS回归模型并无两样,但区 别是这里Y只取0和1两个值,观测值可以是个人、公 司、国家或任何其他横截面个体所作的决定。解释变 量中可以包括正常变量和虚拟变量。
下面用一个关于是否读研究生的例子来说明如何 解释线性概率模型的结果。模型为:
Yi 0 1GPAi 2INCOMEi ui (10.2)
第十章 定性选择模型
我们在第四章中曾介绍解释变量为虚拟变量的模 型,本章要讨论的是因变量为虚拟变量的情形。在这 种模型中,因变量描述的是特征、选择或者种类等不 能定量化的东西,如乘公交还是自己开车去上班、考 不考研究生等。在这些情况下,因变量是定性变量, 我们可以用定义虚拟变量的方法来刻画它们。这种因 变量为虚拟变量的模型被称为定性选择模型 (Qualitative choice models)或定性响应模型 (Qualitative response models)。