古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(定性响应回归模型)【圣才出品】
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(多元回归分析:推断问题)【圣才出品】

古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(多元回归分析:推断问题)【圣才出品】第8章多元回归分析:推断问题8.1 复习笔记考点一:再议正态性假定★当回归模型的参数用于估计和推断两个方面时,还需要假定u i服从正态性假定,即:u i~N(0,σ2)。
在三变量模型中,偏回归系数的OLS估计量与ML估计量一致,是最优线性无偏估计量(BLUE)。
参数估计量也是正态分布的,且(n-3)(σ∧2/σ2)~χ2(n-3)。
参数的t值均服从自由度为n-3的t分布。
t分布可用于构造置信区间并进行假设检验。
χ2分布可用于检验关于真实σ2的假设。
考点二:多元回归中的假设检验的多种形式★1.检验个别偏回归系数的假设。
2.检验估计的多元回归模型的总体显著性,即判别全部偏斜率系数是否同时为零。
3.检验两个或多个系数是否相等。
4.检验偏回归系数是否满足某种约束条件。
5.检验所估计的回归模型在时间上或在不同横截面单元上的稳定性。
6.检验回归模型的函数形式是否正确。
考点三:检验关于个别偏回归系数的假设★★t检验的程序是基于随机误差项u i服从正态分布的假定。
检验方法:给定一个特定的显著性水平α,当t值超过临界值tα/2(df),则拒绝原假设。
或使用p值判断,当p足够小,则拒绝原假设。
参数β∧2的(1-α)置信区间为:(β∧2-tα/2se(β∧2),β∧2+tα/2se(β∧2))。
由于不能直接观测u i,所以利用代理变量u∧i,即残差。
残差的正态性可进行雅克-贝拉(JB)检验(大样本检验)。
考点四:检验样本回归的总体显著性★★★★★1.总体显著性检验(1)定义总体显著性检验的原假设为:H0:β2=β3=0。
也就是检验Y是否与X2和X3存在线性关系。
(2)总体显著性检验与个别显著性检验检验个别显著性时,隐含地假定每一个显著性检验都是根据一个不同的(即独立的)样本进行的。
如果用同一样本数据去进行联合检验,就违反了检验方法所依据的基本假定。
古扎拉蒂《计量经济学基础》(第5版)笔记和课后习题详解

三、计量经济学方法论
大致说来,传统的计量经济学方法论按如下路线进行:
1.理论或假说的陈述;
2.理论的数学模型设定;
3.统计或计量经济模型设定;
4.获取数据;
5.计量经济模型的参数估计;
理论计量经济学是要找出适当的方法,去测度由计量经济模型设定的经济关系。为此,计量经济学家非常依赖于数理统计。
在应用计量经济学中,利用理论计量经济学工具去研究经济学或管理学中的某些特殊领域。
0.2
本章没有课后习题。本章是全书的一个引言,对计量经济学这门学科作一个简要介绍。对于本章内容,学员简单了解即可。
(3)在问卷调查中,无应答的问题也可能相当严重。
(4)获取数据的抽样方法可能变化很大,要比较不同样本得来的结果常常非常困难。
(5)通常获得的经济数据都是高度加总的。
(6)由于保密性质,某些数据只能以高度加总的形式公布。
研究结果不可能比数据的质量更好。所以,如果在一定情况下,研究者发现研究的结果“不能令人满意”的话,原因不一定是误用模型,而是数据的质量不好。
4.名义尺度
此类变量不具备比率尺度变量的任何一个特征。因此适合于比率尺度变量的计量经济方法可能不适合于名义尺度变量。
1.2
1.表1-1给出了7个工业化国家的消费者价格指数(CPI)数据,以1982~1984年为该指数的基期并令1982—1984=100。
1.经济理论所作的陈述或假说大多数是定性的。计量经济学家的工作就是要提供这一数值估计。换言之,计量经济学对大多数的经济理论赋予经验内容。
2.数理经济学的主要问题,是要用数学形式(方程式)来表述经济理论,而不管该理论是否可以量化或是否能够得到实证支持。计量经济学家常常使用数理经济学家所提供的数学方程式,但要把这些方程式改造成适合于经验检验的形式。这种从数学方程到计量经济方程的转换需要有许多的创造性和实际技巧。
计量经济学古扎拉蒂课后答案

计量经济学古扎拉蒂课后答案【篇一:计量经济学考试习题及答案】双对数模型 lny?ln?0??1lnx??中,参数?1的含义是()a.y关于x的增长率b.y关于x的发展速度c. y关于x的弹性d. y关于x 的边际变化2、设k为回归模型中的参数个数,n为样本容量。
则对多元线性回归方程进行显著性检验时,所用的f统计量可表示为()ess(/n?k)r2/(k?1)b. a.2rss(/k?1)(1?r)(/n?k)ess(/k?1)r2(/n-k)d.c. tss(/n?k)(1?r2)(/k?1)3、回归模型中具有异方差性时,仍用ols估计模型,则以下说法正确的是()a. 参数估计值是无偏非有效的b. 参数估计量仍具有最小方差性c. 常用f 检验失效d. 参数估计量是有偏的4、利用德宾h检验自回归模型扰动项的自相关性时,下列命题正确的是()a. 德宾h检验只适用一阶自回归模型b. 德宾h检验适用任意阶的自回归模型c. 德宾h 统计量渐进服从t分布d. 德宾h检验可以用于小样本问题5、一元线性回归分析中的回归平方和ess的自由度是()a. nb. n-1c. n-kd. 16、已知样本回归模型残差的一阶自相关系数接近于1,则dw统计量近似等于( )a. 0b. 1 c. 2 d. 47、更容易产生异方差的数据为 ( )a. 时序数据b. 修匀数据c. 横截面数据d. 年度数据8、设m为货币需求量,y为收入水平,r为利率,流动性偏好函数为?2分别是?1 、?2的估计值,则根据经济理m??0??1y??2r??,又设?1、论,一般来说(a )a. ?1应为正值,?2应为负值b. ?1应为正值,?2应为正值c. ?1应为负值,?2应为负值d. ?1应为负值,?2应为正值9、以下选项中,正确地表达了序列相关的是()a.co(v?i,?j)?0,i?jb.co(v?i,?j)?0,i?j ??????????vxi,?j)?0,i?j c.cov(xi,xj)?0,i?jd.co(10、在一元线性回归模型中,样本回归方程可表示为()a. yt??0??1??tb.yt?e(yt/x)??ic. yt??0??1xtd. e(yt/xt)??0??1xt11、对于有限分布滞后模型 ???yt????0xt??1xt?1??2xt?2????kxt?k??t在一定条件下,参数?i 可近似用一个关于i的阿尔蒙多项式表示(i?0,1,2,?,m),其中多项式的阶数m必须满足() ?a.mk b.m=kc.mkd.m?k12、设?t为随机误差项,则一阶线性自相关是指()a.cov(?t,?s)?0(t?s) b. ?t???t?1??tc. ?t??1?t?1??2?t?2??td. ?t??2?t?1??t13、把反映某一总体特征的同一指标的数据,按一定的时间顺序和时间间隔排列起来,这样的数据称为()a. 横截面数据b. 时间序列数据c. 修匀数据d. 原始数据14、多元线性回归分析中,调整后的可决系数r与可决系数r2之间的关系()22n?122a.?1?(1?r) b. ?r n?k22n?k2 c. ?0 d. ?1?(1?r) n?115、goldfeld-quandt检验法可用于检验( )a.异方差性b.多重共线性c.序列相关d.设定误差16、用于检验序列相关的dw统计量的取值范围是( )a.0?dw?1b.?1?dw?1c.?2?dw?2 d.0?dw?417、如果回归模型中解释变量之间存在完全的多重共线性,则最小二乘估计量的值为()a.不确定,方差无限大b.确定,方差无限大c.不确定,方差最小d.确定,方差最小18、应用dw检验方法时应满足该方法的假定条件,下列不是其假定条件的为()a.解释变量为非随机的b.被解释变量为非随机的c.线性回归模型中不能含有滞后内生变量d.随机误差项服从一阶自回归二、多项选择题1、古典线性回归模型的普通最小二乘估计量的特性有()a. 无偏性b. 线性性c. 最小方差性d. 不一致性e. 有偏性2、如果模型中存在自相关现象,则会引起如下后果()a.参数估计值有偏b.参数估计值的方差不能正确确定c.变量的显著性检验失效d.预测精度降低e.参数估计值仍是无偏的????x的特点() ???3、利用普通最小二乘法求得的样本回归直线yt12ta. 必然通过点(,)b. 可能通过点(,)?的平均值与y?的平均值相等 c. 残差et的均值为常数 d. ytte. 残差et与解释变量xt之间有一定的相关性4、广义最小二乘法的特殊情况是()a.对模型进行对数变换 b.加权最小二乘法c.数据的结合d.广义差分法e.增加样本容量5、计量经济模型的检验一般包括内容有()a、经济意义的检验b、统计推断的检验c、计量经济学的检验d、预测检验e、对比检验三、判断题(判断下列命题正误,并说明理由)1、在实际中,一元回归几乎没什么用,因为因变量的行为不可能仅由一个解释变量来解释。
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(虚拟变量回归模型)【圣才出品】

第9章虚拟变量回归模型9.1 复习笔记考点一:ANOVA模型★★★1.虚拟变量含义虚拟变量是指仅有0和1两个取值的变量,是一种定性变量。
一般而言,虚拟变量等于0表示变量不具有某种性质,等于1表示具有某种性质。
虚拟变量也可以放到回归模型中。
这种模型被称为方差分析(ANOVA)模型。
2.虚拟变量模型(1)虚拟变量的表达式Y i=β1+β2D2i+β3D3i+u i应看到,除了不是定量回归元而是定性或虚拟回归元(若观测值属于某特定组则取值为1,若它不属于那一组则取值0)之外,方程与前面考虑的任何一个多元回归模型都是一样的。
所有的虚拟变量都用字母D表示。
(2)使用虚拟变量的注意事项①若定性变量有m个类别,则只需引入m-1个虚拟变量,否则就会陷入虚拟变量陷阱,即完全共线性或完全多重共线性(若变量之间存在不止一个精确的关系)情形。
对每个定性变量而言,所引入的虚拟变量的个数必须比该变量的类别数少一个。
②不指定其虚拟变量的那一组被称为基组、基准组、控制组、比较组、参照组或省略组。
所有其他的组都与基准组进行比较。
③截距值(β1)代表了基准组的均值。
④附属于方程中虚拟变量的系数被称为级差截距系数,它反映取值为1的地区的截距值与基准组的截距系数之间的差别。
⑤如果定性变量不止一类,那么,基准组的选择完全取决于研究者。
⑥对于虚拟变量陷阱,如果在这种模型中不使用截距项,那么引入与变量的类别相同数量的虚拟变量就能够回避虚拟变量陷阱的问题。
因此,如果从方程中去掉截距项,并考虑如下模型Y i=β1D1i+β2D2i+β3D3i+u i由于此时没有完全共线性,所以就不会陷入虚拟变量陷阱。
但要确定做这个回归时,一定要使用回归软件包中的无截距选项。
⑦在一个含有截距的方程中,能更容易地处理是否有某个组与基准组有所不同以及有多大的不同,所以在方程中包括截距更方便。
为了检查分组是否得当,也可通过将虚拟变量的系数相对0做t检验(或者更一般地,对适当的虚拟变量系数集做一个F检验),就可以检验分类是否适当。
古扎拉蒂《计量经济学基础》(第5版)笔记和课后习题详解

资料来源:EconomicReport ofthe President,2007,Table13-110,P.356.
答:a.把汇率的对数作为纵轴并把时间作为横轴进行描点,如图1-4所示,汇率的波动性很大。比如,在1985年,1美元只能兑换0.257比索,但到了2004年,它能兑换约11.29比索。
2.回归分析与相关分析的区别
回归分析中,对因变量和解释变量的处理方法存在着不对称性。因变量被当作是统计的、随机的,也就是它有一个概率分布。而解释变量则被看作是(在重复抽样中)取固定值的。
相关分析中,任何(两个)变量的处理方法都是对称的;因变量和解释变量之间不加区别;两个变量都被看作是随机的。
五、术语与符号
计量经济学可定义为实际经济现象的数量分析。这种分析基于理论与观测的并行发展,而理论与观测又通过适当的推断方法得以联系。
计量经济学可定义为这样的社会科学:它把经济理论、数学和统计推断作为工具,应用于经济现象的分析。
2.研究对象和研究方法
计量经济学研究经济定律的经验判定。计量经济学家的艺术,就在于找出一组足够具体且足够现实的假定,使他尽可能最好地利用他所获得的数据。
图1-3
b.如图1-3所示,这六个国家的通货膨胀率与美国的通货膨胀率正相关。
c.相关并不意味着因果关系。从逻辑上说,回归得到的统计关系式本身不可能意味着任何因果关系。肯德尔和斯图亚特认为,一个统计关系式永远不能确立因果方面的联系,对因果关系的理念,必须来自统计学以外的某种理论。
3.表1-3给出了9个工业化国家1985~2006年间的外汇汇率数据。除英国外,汇率都定义为一美元兑换外币的数量;而英国的汇率定义为一英镑兑换美元的数量。
资料来源:Economic Report of the President,2007,Table l08,P.354.
(完整word版)计量经济学复习笔记

计量经济学复习笔记CH1导论1、计量经济学:以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究主体是经济现象及其发展变化的规律。
2、运用计量分析研究步骤:模型设定一一确定变量和数学关系式估计参数一一分析变量间具体的数量关系模型检验一一检验所得结论的可靠性模型应用一一做经济分析和经济预测3、模型变量:解释变量:表示被解释变量变动原因的变量,也称自变量,回归元。
被解释变量:表示分析研究的对象,变动结果的变量,也成应变量。
内生变量:其数值由模型所决定的变量,是模型求解的结果。
外生变量:其数值由模型意外决定的变量。
外生变量数值的变化能够影响内生变量的变化,而内生变量却不能反过来影响外生变量。
前定内生变量:过去时期的、滞后的或更大范围的内生变量,不受本模型研究范围的内生变量的影响, 但能够影响我们所研究的本期的内生变量。
前定变量:前定内生变量和外生变量的总称。
数据:时间序列数据:按照时间先后排列的统计数据。
截面数据:发生在同一时间截面上的调查数据。
面板数据:虚拟变量数据:表征政策,条件等,一般取0或1.4、估计评价统计性质的标准无偏:E (人3 )= 3 随机变量,变量的函数?有效:最小方差性一致:N趋近无穷时,3估计越来越接近真实值5、检验经济意义检验:所估计的模型与经济理论是否相等统计推断检验:检验参数估计值是否抽样的偶然结果,是否显著计量经济检验:是否符合计量经济方法的基本假定预测检验:将模型预测的结果与经济运行的实际对比CH2 CH3线性回归模型模型(假设)一一估计参数一一检验一一拟合优度一一预测1、模型(线性)(1)关于参数的线性模型就变量而言是线性的;模型就参数而言是线性的。
Yi = 3 1+ 3 2lnX i+u线性影响随机影响Y i=E (Y|X i) +u E (Y|X i) =f(X i)= 3 1+3 2lnX 引入随机扰动项,(3)古典假设A零均值假定 E ( U i |X i) =0B同方差假定Var(u i|XJ=E(u i2)=2(TC无自相关假定Cov(u i ,u j)=0D随机扰动项与解释变量不相关假定Cov(u i ,X i )=0E正态性假定u~N(0, d 2)F无多重共线性假定Rank(X)=k2、估计在古典假设下,经典框架,可以使用OLS方法:OLS 寻找min Ee i2人B iois = (Y均值)-人B 2(X均值)人B 2ois = Ex i y〃Ex i23、性质OLS回归线性质(数值性质)(1)回归线通过样本均值(X均值,Y均值)(2)估计值人Y的均值等于实际值Y的均值(3)剩余项e i的均值为0(4)被解释变量估计值人Y与剩余项8不相关Cov(人Y,ej=0(5)解释变量X与剩余项8不相关Cov(e i,X i)=0在古典假设下,OLS的统计性质是BLUE统计最佳线性无偏估计4、检验(1) Z检验Ho: B 2=0原假设验证B 2是否显著不为0标准化:Z= (A B 2- B 2) /SE (A B 2)〜N( 0,1 ) 在方差已知,样本充分大用Z检验拒绝域在两侧,跟临界值判断,是否B2显著不为0(2) t检验一一回归系数的假设性检验方差未知,用方差估计量代替 A d 2=Ee i2/(n-k) 重点记忆t =(人卩2- B 2) / A SE (A B 2)〜t (n-2)拒绝域:|t|>=t 2/a( n-2)拒绝,认为对应解释变量对被解释变量有显著影响。
古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-双变量模型:假设检验(圣才出品)
第3章双变量模型:假设检验3.1 复习笔记一、古典线性回归模型古典线性回归模型假定如下:假定1:回归模型是参数线性的,但不一定是变量线性的。
回归模型形式如下:Y i=B1+B2X i+u i这个模型可以扩展到多个解释变量的情形。
假定2:解释变量X与扰动误差项u不相关。
但是,如果X是非随机的(即为固定值),则该假定自动满足。
即使X值是随机的,如果样本容量足够大,也不会对分析产生严重影响。
假定3:给定X,扰动项的期望或均值为零。
即E(u|X i)=0(3-1)假定4:u i的方差为常数,或同方差,即var(u i)=σ2(3-2)假定5:无自相关假定,即两个误差项之间不相关。
即:cov(u i,u j)=0,i≠j(3-3)无自相关假定表明误差u i是随机的。
由于假定任何两个误差项不相关,所以任何两个Y值也是不相关的,即cov(Y i,Y j)=0。
由于Y i=B1+B2X i+u i,则给定B值和X值,Y 随u的变化而变化。
因此,如果u是不相关的,则Y也是不相关的。
假定6:回归模型是正确设定的。
换句话说,实证分析的模型不存在设定偏差或设定误差。
这一假定表明,模型中包括了所有影响变量。
二、普通最小二乘估计量的方差与标准误有了上述假定就能够估计出OLS估计量的方差和标准误。
由此可知,教材式(2-16)和教材式(2-17)给出的OLS估计量是随机变量,因为其值随样本的不同而变化。
这种抽样变异性通常由估计量的方差或其标准误(方差的平方根)来度量。
教材式(2-16)和式(2-17)中OLS估计量的方差及标准误是:(3-4)(3-5)(3-6)(3-7)其中,var表示方差,se表示标准误,σ2是扰动项u i的方差。
根据同方差假定,每一个u i具有相同的方差σ2。
一旦知道了σ2,就很容易计算等式右边的项,从而求得OLS估计量的方差和标准误。
根据下式估计σ2:(3-8)其中,σ∧2是σ2的估计量,是残差平方和,是Y的真实值与估计值差的平方和,即()122212var ibiXbn xσσ==∑∑1se()b=()22222varbibxσσ==∑()2se b=22ˆ2ienσ=−∑2ie∑n -2称为自由度,可以简单地看作是独立观察值的个数。
古扎拉蒂《计量经济学基础》第15章
问题的提出: LPM的局限:
P 1
(1)ui非正态 (2)ui异方差 (3)Yˆi在[0,1]之外 (4)R 2一般比较小
0
X
从几何图形看,希望模型像右图所示:
1.Logit模型
a.Logit模型中条件概率的表达式
Pi
P(Yi
1|
Xi)
E(Yi
|
Xi)
1
1 e ( 1
2
Xi
)
(1)
比较LPM : Pi P(Yi 1 | X i ) E(Yi | X i ) 1 2 X i
的概率增加0.1021或10.21%。 3.Yˆi的估计值中有12个小于0或大于1。
4. W L S 估 计
Yi 1.2456 1 0.1196 X i
Wi
Wi
Wi
(0.1206)
(0.0069)
t
(10.332)
(1 7 .4 5 4 )
R 2 0.9214
五、对数单位模型(Logit Model)
区间;可以将小于0的值改为0;大于1的值 改为1。 (2)在 log it模型和probit模型中, 可以保证条件期望的值域区间在[0,1]。
4.拟和优度 通常情况下,拟和优度不会太高,在0.2至 0.6之间。
Yˆ
LPM
……….无约束
1
Yˆ
………. 受约束
1
LPM
……….
……….
0
X
X
0
(a)
5.对于这些现象该如何建模:比如每年看 病的次数、给定年份中一个厂商获得专利的个 数、一年中大学教授所发表论文的篇数、五分 钟内接到电话的次数或者五分钟内通过某个收 费站的汽车数量?这些被称为计数数据(count data)或者稀有事件(rare event)数据的现 象都是泊松(概率)过程的例子。
古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-自相关:如果误差项相关会有什么结果(圣才出品
量对其滞后一期的回归。
(2)德宾-沃森 d 统计量的定义
n
( ) et − et−1 2
d = t=2 n
et 2
t =1
5 / 28
(10-3)
圣才电子书 十万种考研考证电子书、题库视频学习平台
即残差递差的平方和与残差平方和的比值。注意:在计算 d 统计量分子时,其样本容量
1 / 28
圣才电子书 十万种考研考证电子书、题库视频学习平台
图 10-1 自相关的模式 3.自相关产生的原因 (1)惯性 大多数经济时间序列的一个显著特征就是惯性或者说是迟滞性,即各经济变量的观测值 在时间前后存在着关联性。因此,在涉及时间序列数据的回归方程中,连续的观察值之间很 可能是互相依赖或是相关的。 (2)模型设定误差 不正确的模型设定是指本应纳入模型的重要变量未纳入模型或是模型选择了错误的函 数形式,如果发生这样的模型设定误差,得到的残差则会呈现出系统模式。一个简单的检验 方法是将遗漏变量纳入模型,判定残差是否仍然呈现系统模式。如果不存在系统模式,则序
可见,自相关的后果与异方差相似,也是严重的。因此,与异方差情形相同,在实际应 用中必须确定是否存在自相关问题。
三、自相关的诊断 1.图形法 与异方差情形相同,通过直接观察 OLS 残差 e 来判断误差项 u 中是否存在自相关。有 多种不同的残差图形的检验方法。 (1)残差 e 对时间的散点图 可以用残差对时间作图,如果随着时间的变化,残差呈现出某种有规律的趋势,则可能 存在着自相关。图 10-2 是回归的残差关于时间的时序图,从图可以看出:残差 e 并不是随 机分布的,而是呈现出明显的变动模式——开始是正的,接着变成负的,然后是正的,再然 后是负的,最后又是正的。图形展示了这样一种趋势:残差的递差之间正相关,表明序列存 在着正的自相关。
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(自相关:误差项相关会怎么样?)【圣才出品】
第 12 章 自相关:误差项相关会怎么样? 12.1 复习笔记
考点一:自相关问题癿性质 ★★★ 1.定义 自相关定义为“按时间(如在时间序列数据中)戒空间(如在横截面数据中)排序癿观 测序列各成员乊间癿相关”。若存在自相关,则用符号表示为:E(uiuj)≠0(i≠j)。 2.可能模式 自相关和无自相关癿一些可能模式,如图 12-1 所示。图 12-1(a)到图 12-1(d)中, 残差项随着时间发化表现出明显癿觃律性,本期癿残差和上期癿残差存在一定癿关联性。而 图 12-1(e)则没有明显癿关联,是非自相关模式。
4.自相关出现时癿 BLUE
利用双发量模型幵假定 AR(1)过程,可以证明 β2 癿 BLUE 估计量由下式给出:
ˆ2GLS
n t2
xt xt1
yt yt1 C
n t2
xt xt1
2
其中 C 是一校正因子,在实际中可以忽略。注意下标从 t=2 发到 t=n。从而斱差是:
var ˆ2GLS
2.德宾-沃森d 检验 (1)d 统计量癿一些基本假定 ①回弻含有截距项;
斱差不相关系数和跨度期数 s 相关。
斱程表明,在 AR(1)模式下,ut 癿斱差仍是同斱差癿,但 ut 丌仁不其过去一期癿值
相关,而丏不过去几期癿值也相关。若 ρ=1,上述斱差和协斱差都没有定义。若|ρ|<1,
斱程中给出癿 AR(1)过程是平稳癿,此时残差项癿均值和斱差丌发,协斱差癿值将随着
两个误差癿时间间隑越进而越小。
3.AR(1)模式癿估计结果
回到双发量回弻模型:Yt=β1+β2Xt+ut。在 AR(1)模式下,估计量癿斱差为:
var ˆ2 AR1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第15章定性响应回归模型
15.1 复习笔记
考点一:定性响应模型的性质★★
定性响应模型是指模型中的回归子是一个二值或二分变量的模型,通常被称为概率模型。
回归子也可以是多分响应变量或多类型响应变量。
将二值响应变量建立成概率模型的方法包括线性概率模型(LPM)、logit模型、probit模型和tobit模型。
考点二:线性概率模型(LPM)★★★★
1.LPM的定义
以下述回归模型为例说明:Y i=β1+β2X i+u i。
其中X表示家庭收入;Y=1,则表示该家庭拥有住房;Y=0,则该家庭不拥有住房。
该模型被称为线性概率模型,因为Y i在给定X i下的条件期望E(Y i|X i)可解释为在给定X i下事件(家庭拥有住房)发生的条件概率,即Pr(Y i=1|X i)。
2.LPM的特征
令P i表示“Y i=1”(即事件发生)的概率,而1-P i表示“Y i=0”(即事件不发生)的概率,则变量Y i服从贝努利概率分布。
根据期望的定义,有:E(Y i)=0(1-P i)+1P i=P i。
此外有:E(Y i|X i)=β1+β2X i =P i,即模型的条件期望事实上可以解释为Y i的条件概率。
该模型的约束条件为:0≤E(Y i|X i)≤1。
3.LPM的问题
(1)干扰项u i的非正态性
若把方程写成:u i=Y i-β1-β2X i,u i的概率分布见表15-1。
表15-1 u i的概率分布
可见u i服从贝努利分布而不是正态分布。
虽然干扰项不满足正态性假定,但OLS的点估计值仍具有无偏性。
此外在大样本下,OLS估计量一般都趋于正态分布,因此LPM的统计推断仍可用正态性假定下的OLS程序。
(2)干扰项的异方差性
即使LPM中的干扰项满足零均值和无序列相关性假定,但也不能说它具有同方差性。
对于贝努利分布,理论上的均值和方差分别为P和P(1-P),可见方差是均值的函数,而均值的取值依赖于X的值,因此LPM中的干扰项具有异方差性。
由于u i的方差依赖于E(Y i|X i),解决异方差性问题的方法之一就是进行数据变换,将模型的两边同时除以:
==
即:
12i i i Y X u ββ=++ 可以证明,上述方程中变换后的误差项是同方差的。
因此,可以用OLS 对该方程进行
估计,这就是加权最小二乘估计(WLS )。
在实践中,由于真实的E (Y i |X i )未知,所以权重w i 也是未知的。
为了估计w i ,可以用如下两步法:
步骤1:直接先对具有异方差的方程进行OLS 回归,可得到Y ∧i ,再求出w i 的估计值w ∧
i =Y ∧i (1-Y ∧i )。
步骤2:用估计的w i 去做数据变换,并用加权最小二乘法估计变换后的方程。
(3)不满足0≤E (Y i |X i )≤1情形
用OLS 估计LPM 时,没有考虑0≤E (Y i |X i )≤1的约束条件,因此无法保证E (Y i |X i )的估计量Y ∧i 的取值在0到1之间。
有两种方法可以使估计的Y ∧i 介于0到1之间: ①用OLS 法估计LPM ,对于小于0的Y ∧i 取值为零,大于1的Y ∧i 则取值为1。
②设计logit 和probit 模型等估计方法,以保证所估计的条件概率必定处于0与1之间。
(4)可疑的拟合优度:R 2值
在二分响应模型中,计算出的R 2大多介于0.2与0.6之间,比1小很多,可见R 2的价值是有限的。
因此,在有定性因变量的模型中应避免使用判定系数。
LPM 的根本问题在于,它假定P i =E (Y =1|X )随X 而线性增加,即X 的边际效应一直保持不变。
考点三:logit 模型 ★★★★
1.模型 LPM 若为:P i =β1+β2X i 。
现在考虑如下表达式:
()1211i i X P e ββ-+=
+
把方程写成: 111i i i
Z i Z Z e P e e -==++ 其中Z i =β1+β2X i 。
上式就是logistic (累积)分布函数。
并且由于: 111i
i Z P e -=+
因此有: 111i i i Z Z i Z i P e e P e
-+==-+ 取方程的自然对数得到:L i =ln[P i /(1-P i )]=Z i =β1+β2X i 。
可见,机会比率的对数
L i 是X i 和参数的线性函数,上述模型称为logit 模型。
2.logit 模型的特点(见表15-2)
表15-2 logit 模型的特点
考点四:logit模型的估计★★★★
为达到估计目的,将方程改写成:L∧i=ln[P∧i/(1-P∧i)]=β∧1+β∧2X i+u i。
对于模型的估计要区分个体层次上的数据和群组观测数据。
1.个体层次上的数据
如果数据属于微观或个体层次,就无法运用标准的OLS估计,只能采用极大似然(ML)法估计。
2.群组或重复观测数据
将相对频数作为P i估计值,即P∧i=n i/N i,可得logit模型:L∧i=ln[P∧i/(1-P∧i)]=β∧1+β∧2X i。
如果在每一X i处的观测个数N i都足够大,那么这将是真实logit即L i的相当好的估计值。
可以证明,如果N i相当大,且对于给定X i的每一次观测独立地服从一个二值变量的分布,那么u i~N{0,1/[N i P i(1-P i)]}。
因此,logit模型的干扰项也具有异方差性,必须使用加权最小二乘法。
在经验研究中,用P∧i代替未知的P i并用下式作为σ2的估计量:σ∧2=1/[N i P∧i(1-P∧i)]。
3.logit 回归的步骤 (1)对每个X i 计算估计概率P ∧
i =n i /N i 。
(2)对每个X i 求logit :L ∧i =ln[P ∧i /(1-P ∧i )]。
(3)为解决异方差性的问题,将方程变换如下:
2i i i ββ=++
或把它简写为:
2i i i L X ββυ**=++
其中权重w i =N i P ∧i (1-P ∧i )。
可以证明变换后的误差项υi 是同方差的。
(4)用OLS 去估计变换后的方程。
注意方程没有明确引入截距项,还需用过原点回归程序估计方程。
(5)按照平常的OLS 框架构造置信区间或检验假设。
但是仅当样本足够大时,所得到的结论才合理。
因此对于小样本解释估计结果时需谨慎。
4.logit 模型估计值解释
logit 估计值为L i =ln[P i /(1-P i )],取它的反对数便得到机会比率P i /(1-P i )。
一般地说,如果取笫i 个斜率系数的反对数,再减去1并乘以100得到的结果表示:对应于第一个回归元,每增加1单位导致机会比率的百分比变化。
考点五:非群组数据或个体数据的logit 模型 ★★★
一般性观察的结论:。