古扎拉蒂《计量经济学基础》第6章
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(多元回归分析:推断问题)【圣才出品】

古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(多元回归分析:推断问题)【圣才出品】第8章多元回归分析:推断问题8.1 复习笔记考点一:再议正态性假定★当回归模型的参数用于估计和推断两个方面时,还需要假定u i服从正态性假定,即:u i~N(0,σ2)。
在三变量模型中,偏回归系数的OLS估计量与ML估计量一致,是最优线性无偏估计量(BLUE)。
参数估计量也是正态分布的,且(n-3)(σ∧2/σ2)~χ2(n-3)。
参数的t值均服从自由度为n-3的t分布。
t分布可用于构造置信区间并进行假设检验。
χ2分布可用于检验关于真实σ2的假设。
考点二:多元回归中的假设检验的多种形式★1.检验个别偏回归系数的假设。
2.检验估计的多元回归模型的总体显著性,即判别全部偏斜率系数是否同时为零。
3.检验两个或多个系数是否相等。
4.检验偏回归系数是否满足某种约束条件。
5.检验所估计的回归模型在时间上或在不同横截面单元上的稳定性。
6.检验回归模型的函数形式是否正确。
考点三:检验关于个别偏回归系数的假设★★t检验的程序是基于随机误差项u i服从正态分布的假定。
检验方法:给定一个特定的显著性水平α,当t值超过临界值tα/2(df),则拒绝原假设。
或使用p值判断,当p足够小,则拒绝原假设。
参数β∧2的(1-α)置信区间为:(β∧2-tα/2se(β∧2),β∧2+tα/2se(β∧2))。
由于不能直接观测u i,所以利用代理变量u∧i,即残差。
残差的正态性可进行雅克-贝拉(JB)检验(大样本检验)。
考点四:检验样本回归的总体显著性★★★★★1.总体显著性检验(1)定义总体显著性检验的原假设为:H0:β2=β3=0。
也就是检验Y是否与X2和X3存在线性关系。
(2)总体显著性检验与个别显著性检验检验个别显著性时,隐含地假定每一个显著性检验都是根据一个不同的(即独立的)样本进行的。
如果用同一样本数据去进行联合检验,就违反了检验方法所依据的基本假定。
古扎拉蒂计量经济学第四版讲义Ch6 Multicollinearity

∗
∑c x
j =2 j
K
∗ j
≅0
3.32
符号 ≅ 表示,如果右端确实等于 0,那么这种线性依赖关系就是 exact,而且 X ' X 不再存在。
2
Use of eigenvalues and eigenvectors to explain multicollinearity 考虑相关系数形式的 X ' X 矩阵。 我们知道,总存在一个正交矩阵(orthogonal matrix) V = [ v 2 v 3 " v K ] ,使得
−1 2
( X ' X)
−1
中的 ( X ' X ) 不存在或无限大。
−1
课本以三元回归模型为例,写出β系数的表达式,比如
b2
∑ ( y − y )( x − x ) ∑ ( x − x ) − ∑ ( y − y )( x − x ) ∑ ( x − x )( x = x − x )( x − x ) ∑( x − x ) ∑(x − x ) − ∑ (
2)实际结果 In case of near or high multicollinearity, one is likely to encounter the following consequences: 1. Although BLUE, the OLS estimators have large variances and covariances, making precise estimation difficult. 2. Due to consequence 1, the confidence intervals tend to be much wider, leading to the acceptance of the zero null hypothesis more readily. 3. Also due to consequence 1, the t ratio of one or more coefficients tends to be statistically
古扎拉蒂《计量经济学基础》(第5版)笔记和课后习题详解

三、计量经济学方法论
大致说来,传统的计量经济学方法论按如下路线进行:
1.理论或假说的陈述;
2.理论的数学模型设定;
3.统计或计量经济模型设定;
4.获取数据;
5.计量经济模型的参数估计;
理论计量经济学是要找出适当的方法,去测度由计量经济模型设定的经济关系。为此,计量经济学家非常依赖于数理统计。
在应用计量经济学中,利用理论计量经济学工具去研究经济学或管理学中的某些特殊领域。
0.2
本章没有课后习题。本章是全书的一个引言,对计量经济学这门学科作一个简要介绍。对于本章内容,学员简单了解即可。
(3)在问卷调查中,无应答的问题也可能相当严重。
(4)获取数据的抽样方法可能变化很大,要比较不同样本得来的结果常常非常困难。
(5)通常获得的经济数据都是高度加总的。
(6)由于保密性质,某些数据只能以高度加总的形式公布。
研究结果不可能比数据的质量更好。所以,如果在一定情况下,研究者发现研究的结果“不能令人满意”的话,原因不一定是误用模型,而是数据的质量不好。
4.名义尺度
此类变量不具备比率尺度变量的任何一个特征。因此适合于比率尺度变量的计量经济方法可能不适合于名义尺度变量。
1.2
1.表1-1给出了7个工业化国家的消费者价格指数(CPI)数据,以1982~1984年为该指数的基期并令1982—1984=100。
1.经济理论所作的陈述或假说大多数是定性的。计量经济学家的工作就是要提供这一数值估计。换言之,计量经济学对大多数的经济理论赋予经验内容。
2.数理经济学的主要问题,是要用数学形式(方程式)来表述经济理论,而不管该理论是否可以量化或是否能够得到实证支持。计量经济学家常常使用数理经济学家所提供的数学方程式,但要把这些方程式改造成适合于经验检验的形式。这种从数学方程到计量经济方程的转换需要有许多的创造性和实际技巧。
计量经济学第六章

学
根据时间序列自身发展变化的基本规律和特点
夏
即趋势,选取适当趋势模型进行分析和预测
凡
趋势模型
一般形式
yˆt ft
常用的趋势模型
7
模型的选择
计 定性分析
量
在选模型之前,弄清楚模型的条件和预测对象性
经
质、特点
济
例如:指数曲线和Logistic曲线模型
学
夏 定量分析
凡
根据资料把握现象的特点
L=3646.067128 a=2.026802528 b=0.531299085
14
计
模型的参数估计(续5)
量
经 济
[例6-3]续例6-2,我国自行车销售量预测
学
参数考虑用NLS,得到参数的精确估计
夏 凡
用param 命令为参数赋初值,初值取前面算出的
L、a和b
c(1)=3646.067128
Y
由图可知,序列的增长在近期变缓,考虑建立 Logistic模型
由于增长上限事先无法确定,参数用三和值法估计 12
计
模型的参数估计(续3)
量 经
将数据等分成三段
济 学
本例全部数据为14个,则需舍弃部分数据
从预测角度看,舍弃最早的数据(1978和1979)
夏
将剩余的12个数据等分成三段
凡
预测值序列为ysaf2 模型的MAPE为4.78
26
季节模型预测应用(续3)
计 量
趋势模型的选择
经
由序列ysa、ysaf1和ysaf2的时序图,结合两
济 学
个模型的MAPE来看
二次曲线趋势模型的误差小于对数曲线趋势模型
夏
则最终选择二次曲线趋势模型作为趋势方程
古扎拉蒂《计量经济学基础》(第5版)视频网课

在各个章节中,通过列举并分析历年考研真题,明确命题规律和特点,引导学员掌握考点的历年出题思路及方式,从而有效指导学员复习相关知识点。
3.电子书(题库)(送手机版)
报名本课程后,本视频课程里的所有电子书(题库)均可使用。
需要提醒的是,考虑到课时的需要以及相关知识点的难易程度,对于一些简单的知识点、考试不易涉及的知识点,本课程不予以讲述或一带而过,故建议大家在学习本课程之前提前复习一遍教材,在翻看教材基础上,学习本课程。本课程的学员可以下载电子版讲义打印学习。
01:17:03
20
第13章计量经济建模:模型设定与误差检验(2)
01:19:04
21
第14章非线性回归模型
00:47:26
22
第15章定性响应回归模型(1)
00:55:23
23
第15章定性响应回归模型(2)
00:49:11
24
第16章面板数据回归模型(1)
00:50:16
25
第16章面板数据回归模型(2)
15
第11章异方差性:误差方差不是常数怎么办(1)
00:53:23
16
第11章异方差性:误差方差不是常数怎么办(2)
00:54:18
17
第12章自相关:误差项相关会怎么样(1)
01:10:52
18
第12章自相关:误差项相关会怎么样(2)
01:17:51
19
第13章计量经济建模:模型设定与误差检验(1)
01:04:41
9
第8章多元回归分析:推断问题(1)
01:01:49
10
第8章多元回归分析:推断问题(2)
00:55:55
11
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(虚拟变量回归模型)【圣才出品】

第9章虚拟变量回归模型9.1 复习笔记考点一:ANOVA模型★★★1.虚拟变量含义虚拟变量是指仅有0和1两个取值的变量,是一种定性变量。
一般而言,虚拟变量等于0表示变量不具有某种性质,等于1表示具有某种性质。
虚拟变量也可以放到回归模型中。
这种模型被称为方差分析(ANOVA)模型。
2.虚拟变量模型(1)虚拟变量的表达式Y i=β1+β2D2i+β3D3i+u i应看到,除了不是定量回归元而是定性或虚拟回归元(若观测值属于某特定组则取值为1,若它不属于那一组则取值0)之外,方程与前面考虑的任何一个多元回归模型都是一样的。
所有的虚拟变量都用字母D表示。
(2)使用虚拟变量的注意事项①若定性变量有m个类别,则只需引入m-1个虚拟变量,否则就会陷入虚拟变量陷阱,即完全共线性或完全多重共线性(若变量之间存在不止一个精确的关系)情形。
对每个定性变量而言,所引入的虚拟变量的个数必须比该变量的类别数少一个。
②不指定其虚拟变量的那一组被称为基组、基准组、控制组、比较组、参照组或省略组。
所有其他的组都与基准组进行比较。
③截距值(β1)代表了基准组的均值。
④附属于方程中虚拟变量的系数被称为级差截距系数,它反映取值为1的地区的截距值与基准组的截距系数之间的差别。
⑤如果定性变量不止一类,那么,基准组的选择完全取决于研究者。
⑥对于虚拟变量陷阱,如果在这种模型中不使用截距项,那么引入与变量的类别相同数量的虚拟变量就能够回避虚拟变量陷阱的问题。
因此,如果从方程中去掉截距项,并考虑如下模型Y i=β1D1i+β2D2i+β3D3i+u i由于此时没有完全共线性,所以就不会陷入虚拟变量陷阱。
但要确定做这个回归时,一定要使用回归软件包中的无截距选项。
⑦在一个含有截距的方程中,能更容易地处理是否有某个组与基准组有所不同以及有多大的不同,所以在方程中包括截距更方便。
为了检查分组是否得当,也可通过将虚拟变量的系数相对0做t检验(或者更一般地,对适当的虚拟变量系数集做一个F检验),就可以检验分类是否适当。
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(定性响应回归模型)【圣才出品】

第15章定性响应回归模型15.1 复习笔记考点一:定性响应模型的性质★★定性响应模型是指模型中的回归子是一个二值或二分变量的模型,通常被称为概率模型。
回归子也可以是多分响应变量或多类型响应变量。
将二值响应变量建立成概率模型的方法包括线性概率模型(LPM)、logit模型、probit模型和tobit模型。
考点二:线性概率模型(LPM)★★★★1.LPM的定义以下述回归模型为例说明:Y i=β1+β2X i+u i。
其中X表示家庭收入;Y=1,则表示该家庭拥有住房;Y=0,则该家庭不拥有住房。
该模型被称为线性概率模型,因为Y i在给定X i下的条件期望E(Y i|X i)可解释为在给定X i下事件(家庭拥有住房)发生的条件概率,即Pr(Y i=1|X i)。
2.LPM的特征令P i表示“Y i=1”(即事件发生)的概率,而1-P i表示“Y i=0”(即事件不发生)的概率,则变量Y i服从贝努利概率分布。
根据期望的定义,有:E(Y i)=0(1-P i)+1P i=P i。
此外有:E(Y i|X i)=β1+β2X i =P i,即模型的条件期望事实上可以解释为Y i的条件概率。
该模型的约束条件为:0≤E(Y i|X i)≤1。
3.LPM的问题(1)干扰项u i的非正态性若把方程写成:u i=Y i-β1-β2X i,u i的概率分布见表15-1。
表15-1 u i的概率分布可见u i服从贝努利分布而不是正态分布。
虽然干扰项不满足正态性假定,但OLS的点估计值仍具有无偏性。
此外在大样本下,OLS估计量一般都趋于正态分布,因此LPM的统计推断仍可用正态性假定下的OLS程序。
(2)干扰项的异方差性即使LPM中的干扰项满足零均值和无序列相关性假定,但也不能说它具有同方差性。
对于贝努利分布,理论上的均值和方差分别为P和P(1-P),可见方差是均值的函数,而均值的取值依赖于X的值,因此LPM中的干扰项具有异方差性。
(06)第6章 利用变量间的关系进行预测

用Excel计算相关系数 Excel计算相关系数
2008年 2008年5月 6 - 13
2008年 2008年5月 6-7
x
散点图
应用统计学
Applied Statistics
(scatter diagram)
完全正线性相关
完全负线性相关
非线性相关
正线性相关
2008年 2008年5月
负线性相关
不相关
6-8
散点图
应用统计学
Applied Statistics
(例题分析) 例题分析)
【 例 】 一家商业银行在多个
一元线性回归
1. 涉及一个自变量的回归 2. 因变量y与自变量x之间为线性关系 变量y与自变量x
被预测或被解释的变量称为因变量 (dependent variable),用y表示 variable), 用来预测或用来解释因变量的一个或多个变 量称为自变量(independent variable), 量称为自变量 (independent variable) , 用 x 表示
(不良贷款对其他变量的散点图) 不良贷款对其他变量的散点图)
14 12 10 8 6 4 2 0 (2) 不良贷款
不良贷款
0
5
10
15
20
25
30
100
200
300
400
贷款余额
14
累计应收贷款
14
12 10 不 贷 良 款 8 6 4 2 0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
倒数模型
Yi
1
2(
1 Xi
)
ui
这一模型的特点:关于参数是线性的,但关
于变量是非线性的,所以从回归的角度看,这是
一个线性回归模型;当X趋于无穷大时,1/X趋于0,
而 Y则趋于β2。
一个例子:菲利普斯曲线
其中Y为通胀变化率,X为失业率,上半部 (较陡)表明,当失业率低于自然失业率时, 失业的单位变化(下降)引起的工资的变化率 (通胀)上升,其速度快于对应的在失业率高 于自然失业率时,失业的同样变化所引起的工 资下降(下半部较上半部平缓)。
yt 1 2 xt ut (绝对变化) R 2 0.67 ln yt 1 2 xt u(t 相对变化) R2 0.8
对数-线性模型
Yi 1 2 ln X i ui
X 变化一个百分比,Y的绝对变化量
2
Y X / X
Y
2 X
/
X
含义:Y的绝对变化(Y)等于2乘以X的相对变化。
(参数线性)
Yi
X e 2 ui 1i
ln Yi
ln 1
2
ln
Xi
ui
(参数线性)
Yi
X 2 1i
ui
ln Yi
ln(
1
X
i
2
ui )
(参数非线性)
运用OLS估计,假定:ln ui ~ i.i.d.N (0, 2 )
因此,在检验残差是否为正态时时,是对估计的残差 lnˆ ui
进行诊断,而不是对原始的残差。
要点与结论 1.有时一个回归模型并不明显包含截距项。 这样的模型被称为过原点回归。虽然估计这种模型 的代数方法很简单,但应小心使用这些模型。对于 这种模型,残差和是非零的;此外,通常计算的r2 不一定有意义。除非有很强的理论原因,否则还是 在模型中明显地引入一个截距为好。 2.因为单位和尺度是回归系数赖以解释的关 键,所以用什么单位和尺度来表达回归子和回归元 是很重要的。在经验研究中,研究者不仅要注明数 据的来源,还要声明变量是怎样度量的。
(w2
/ w1 ) ˆ
同理,有
ˆ * w1ˆ
(ˆ * ) 2
w
2 1
ˆ
2
v a r(ˆ * )
w
2 1
v a r (
)
v a r ( ˆ1* ) ( w1 / w 2 ) 2 v a r ( ˆ1 )
rX Y rX *Y *
不难看出,当X和Y按同一标准减缩或扩大 w1= w2, 估计的斜率无变化,但截距变化,方差 变化。当w1≠w2时, 估计的斜率和截距均有变 化.但由于这种变换仅仅将数据扩大或减缩,所 以估计量的性质不发生改变。 一般而言,在实际应用中对于所拥有的数 据一般不改变度量单位,回归结果按原始数据
加1而形成的时间趋势变量,应变量为对数,
故为半对数模型。对于这种模型:
2
d ln Yt dt
1 Yt
dY dt
1 Yt
Yt t
Yt Yt
/ t
2
回归子Y的相对改变量 回归元X的绝对改变量
瞬时增长率
线性趋势模型
Yt 1 2t ut
其中的时间变量取名为趋势变量。
对于以上的半对数线性和线性趋势模型, 尽管回归的解释变量均为时间趋势变量,但被 解释变量分别为lnY和Y,所以不能比较这两个 模型的拟合优度(为什么?)。 对于如下模型,如何比较两个模型的拟合 优度?
四、回归模型的函数形式 对数线性模型 半对数模型 倒数模型 对数倒数模型
1.对数线性模型 :弹性测量
考虑指数回归模型
Yi
X e 2 u i 1i
取对数,有
其中
ln Yi ln 1 2 ln X i ui
ln Yi 2 ln X i ui
ln 1
这样即把指数模型变换为对数线性(双
的测度单位进行解释。
改变测量单位对OLS统计量的影响
对于模型:Yi 0 1X i ui
1.当w1 =w2即尺度因子相同时,斜率系数及其标准误的估计不变。 而截距项及其标准误会放大或缩小了w1倍。
2.X i的单位不变(w2 1),而Yi尺度按因子w1改变,则截距项和 斜率系数及其各自的标准误都会乘以相同的w1因子。
半对数模型
不变增长率模型.考虑复利公式
取对数,有
Y t Y 0 (1 r ) t
ln Yt ln Y0 t ln 1 r
令 1 ln Y0 , 2 ln (1 r )
上式变为 ln Yt 1 2(t 恒定增长模型) ln Yt 1 2t ut
上式是关于参数的线性模型,但对于变量 而言,为时间变量即样本初始点为1,每次增
相加性和相乘性随机误差项
无论是何种设定的模型,只要是关于参数的线性模型,
均可以运用OLS进行估计,但对于残差而言,只能对变换
后的模型的残差进行诊断其是否为正态,而不是直接对原
始扰动进行检验。考虑如下模型:
Yi
X 2 1i
为了估计,可以表述为下述模型:
Yi
1
X
2 i
ui
ln Yi
ln
1
2
ln
Xi
ln ui
截距不出现在模型中,故称为过原点回归。
其图形为
Yi
SRF
:
^ Yi
^2 X i
^2
1
0
Xi
过原点模型:Yi ˆ2 Xi ui,利用OLS,得出:
ˆ2
X iYi
X
2 i
var(ˆ2)
2
X
2 i
ˆ 2 uˆ2
n 1
而含有截距项的模型得出的估计是:
ˆ2
xi yi xi2
var(ˆ2)
X / X 改变1%(或0.01个单位)时,则Y的绝对变化
量是0.01 2
一个对数到线性模型什么时候有用? 一个有趣的应用在于所谓的恩格尔支出( Engel expenditure)模型——以德国统计学 家恩斯特·恩格尔的名字命名。 恩格尔写道:“用于食物的总支出以算术 级数增加,而总支出以几何级数增加”。
5.通常不应该过分强调r2这个指标,也就是 说,并非模型的r2值越大越好。如我们在下一章 中将讨论的那样,当我们在模型中添加更多的回 归元时,r2上不断地提高。更重要的地方在于所 选模型的理论基础、估计系数的符号及其统计显 著性。如果一个模型从这些准则来看不错,那么 较低的r2值也是完全可以接受的。将在第13章更 深入地讨论这个重要问题。 6.在有些情形中,确定一个特定的函数形式 不是那么容易,此时,或许可以使用所谓的博克 斯-考克斯变换(Box-Cox transformations)。
4.有时不止一个模型都能相当不错地拟 合一个给定的数据集。如在修正的菲利普斯曲 线中,可以对同样的数据拟合了一个线性模型 和一个倒数模型。在这两种情况下,系数都与 先验预期相一致,也都是统计显著的。
一个重要的区别在于,线性模型的r2值 比倒数模型的r2值大。因此人们略微倾向于使 用线性模型。但一定要注意,在比较两个r2值 时,两个模型的因变量或回归子必须相同;回 归元则可采用任何形式。
ˆ l nˆ 1 ˆ 1 ln 1 ˆ 不是β1的无偏估计。
弹性
一个变量Y 如需求量对另一变量如价格 X的弹性定义:
E
Y的%变化 X的%变化
Y X
Y 100 X 100
Y X
X Y
斜率
X Y
对数一对数模型的一个诱人且致使它获 得普遍应用的特点,就是斜率系数测度了Y 对X的弹性(elasticity),也就是给定X变 化的百分数引起y变化的百分数。
X*=w1X Y*=w2Y
对于使用X和Y的原始数据的模型
Y=a+bC+U
和使用数据X*和Y*的模型 Y*=a*+b*C*+ U*
估计的参数(a和a*,b和b*)之间有什么关系。
ˆ *
x
* i
y
* i
(
x
* i
)
2
w1 xi w2 yi w1w2
( w1 x1 ) 2
w
2 1
xi yi x12
对数双曲线或对数倒数模型
模型如下:
ln Yi
1
2 (
1 Xi
)
ui
Y首先以递增的速度增加(凸的),然后以递减的速度
增加(凹的),适用于短期生产函数模型。若考虑劳动
和资本是一个生产函数的投入,保持资本不变但劳动力
增加,那么产出与劳动之间的短期关系就是这种情形。
上述函数形式的总结
五、函数形式的选择 1.模型背后的理论(如菲利普斯曲线)可 能给出了一个特定的函数形式。 2.最好能求出回归子相对回归元的变化率 (即斜率)和回归子对回归元的弹性。 3.所选模型的系数应该满足一定的先验预 期。比如,如果考虑对汽车的需求是价格和其 他变量的函数,那应该预期价格变量的系数为 负。
对数)模型。
上式中,由于
2
d ln Yi d ln X i
Xi Yi
d Yi dX i
所以表示变量之间的不变弹性(假定样本
值不变,或者说任一点的弹性不变)即X每变动
1%,Y所变化的1%比变化。对上式运用OLS,即
可得到其估计。要注意的是,尽管 ˆ, ˆ2 分别为
a和b的无偏估计,但在上式中,由
则(标准化)回归子Yi会平均增加2单位个标准差。
注意区别:不在采用Y 和X 的单位,而是用标准差为单位。
标准化回归模型的优势 标准化回归模型与传统模型相比有什么优 势呢?若不止一个回归元,则优势更加明显,在 第7章将讨论这个论题。通过将回归元标准化, 就能将它们放到同等地位并直接进行比较。 如果一个标准化回归元的系数比模型中另 一个标准化回归元的系数大,那么前者就能比 后者更多地解释回归子。换言之,可以用β系 数作为各个回归元相对解释力的一种度量。在 接下来的两章有更多的说明。