古扎拉蒂计量经济学第四版讲义Ch3 Simple Linear Regression

合集下载

古扎拉蒂《计量经济学基础》第4章

古扎拉蒂《计量经济学基础》第4章

在满足基本假设条件下,对一元线性回归模型:
Yi 0 1 X i i
随机抽取n组样本观测值(Xi, Yi)(i=1,2,…n)。
假如模型的参数估计量已经求得,为 ˆ0、 ˆ1
那么Yi服从如下的正态分布:
Yi N( ˆ0 ˆ1 X i, 2)
于是,Y的概率函数为
P (Yi )
1
2
e-
如果存在大量独立且相同分布的随机变 量,那么,除了少数例外情形,随着这些变 量的个数无限地增加,它们的总和将趋向服 从正态分布。正是这个中心极限定理为ui的 正态性假定提供了理论基础。
2.中心极限定理的另一个说法是,即使 变量个数并不很大或这些变量并不是严格独 立的,但它们的总和仍可视为正态分布的。 3.如附录中所言,正态分布的一个性质 是,正态分布变量的任何线性函数都是正态 分布的。因此,在正态性假定下,OLS估计量 的概率分布很容易推导。前面曾讨论过,OLS 估计量是ui的线性函数。因此,若ui是正态分 布的,则OLS估计量也是正态分布的,这就使 得我们的假设检验工作十分简单。
但估计是成功的一半,假设检验是另一半。 回想在回归分析中的目标不仅仅是估计样本回 归函数(SRF),而是像第2章所强调的那样, 要用估计来对总体回归函数(PRF)进行推断。 因此,由于这些参数是随机变量,所以需 要清楚它们的概率分布,若不知其概率分布, 那就无法将它们与其真实值相联系 。
问题的引入 以前对ui的假定是其期望值为零,它们是
不相关的,并且有一个不变的方差。 以上假定对于点估计足够了。但兴趣在于 通过统计量对参数的真值(总体参数)进行推 断。即通过样本回归函数推测总体回归函数。 SRF→PRF 注意,既然它们都是估计量,所以它们的 值将随样本而变化。因此,这些估计量都是随 机变量。

计量经济学(第四版)

计量经济学(第四版)

计量经济学(第四版)本书是一本全面、权威、经典的应用计量经济学(第四版)专著,内容涵盖了计量经济学领域里最新和最重要的研究成果,并附有有关估计参数的实例,以及有关有代表性回归模型的实例和模型检验的讨论,引导读者掌握计量经济学的最基本的原理与方法。

一、绪论本书首先介绍了计量经济学的定义,然后讨论了计量经济学的历史发展,重点强调了计量经济学在经济科学研究的重要性。

接着,本书介绍了计量经济学研究中常用的统计方法,包括单因素分析、多元回归分析等,以及用于评价模型适用性程度的一系列模型检验方法。

二、宏观经济学分析本书还介绍了宏观经济学分析的面向,基于直观的理论分析,提供了宏观经济学范畴内经济现象研究的重要指导。

在此基础上,本书还提出了几种应用计量经济学研究宏观经济学现象的方法,包括协整分析、向量自回归(VAR)和估计系统(ES)分析等。

三、微观经济学分析本书致力于为微观经济学分析提供深入、全面的当今计量经济学研究的实例与说明,讨论了公共选择理论中的市场结构与政策分析、产业结构分析、环境外部性、最优税收与减贫研究等内容。

并且提供了用于估算上述经济现象的计量经济学方法,如面板数据分析、模态分类分析以及区域变量等。

四、计量经济学应用本书还提供了一系列应用计量经济学的实例,例如宏观经济学的财政弹性和外汇国际定价模型研究,企业社会责任与绩效研究,贸易研究,投资研究等。

为了使读者更好地理解这些实例,本书还附有一些数据统计分析,及其相关的检验结果分析,为计量经济学研究实践和论述提供参考。

五、结论本书介绍了计量经济学研究及应用领域里最新例子和非常详实的说明,引导读者更好地了解计量经济学,以有效地应用计量经济学方法研究各种经济问题和现象。

该书有助于提高读者应用计量经济学的综合能力,也帮助读者更好地处理和解决实际问题。

古扎拉蒂《计量经济学基础》第14章

古扎拉蒂《计量经济学基础》第14章

四、估计非线性回归模型的方法 1.直接搜索或试错法或不用求导的方法
这是在第三节中提到过的方法。 缺陷: a.如果回归元太多,计算会很复杂。 b.可以得到局部最小值,但不一定是绝对 最小值。 2.直接最优化 通过直接运用OLS方法,可以得到正规方程 (14.4) 和(14.5) ,然后运用最速下降法来解 出参数值。
国内外经典教材名师讲堂
古扎拉蒂《计量经济学基础》
第14章 非线性回归模型 主讲老师:李庆海
本章要点
●本质上的线性和非线性回归模型 ●线性和非线性回归模型的估计 ●估计非线性回归模型:试错法
一、本质上的线性和非线性回归模型
模型可以线性于参数,也可以线性于变量。 一开始讨论线性回归模型的时候,陈述过 本书所关心的基本上是线性于参数的模型。 如果一个模型非线性于参数,那么它就是 非线性回归模型。 然而,这里必须小心,有些模型可能看起 来非线性于参数,但是通过合适的变换它们可 以变成线性于参数的回归模型。
f '(0) x 1!
f
''(0) x2 2!
a1 a2 x a3x2 R
R a4 x3
三阶近似:
Y a1 a2 x a3x2 a4 x3
问:如何在x=a,z=b处展开Y=f(x,z)?
答:
f (x, z) f (a,b) fx (a,b)(x a) fz (a,b)(z b)
1 ln(
Yi
Yi
)
1 ln(
Yi
1)
ln(e12 Xi i
)
1
2 X i
i
所以这个模型本质上是线性的。
问题:常替代弹性(CES)生产函数是不 是本质线性的?
Yi A[ Ki ( 1 )L i ] 1 (14.2)

计量经济学(第四版)课件:一元线性回归分析基础

计量经济学(第四版)课件:一元线性回归分析基础

一元线性回归分析基础
第三节 最小二乘估计量的性质
β*1= - β1 =(1/n)∑Yt- ∑btYt =∑[(1/n)- bt]Yt 令 at= [(1/n)- bt] 由于和bt均为非随机变量,所以at也是非随机变量。 因此 β*1 =∑atYt 即β*1是Yt的线性组合。
一元线性回归分析基础
第三节 最小二乘估计量的性质
二、无偏性 指β*1和β*2 的期望值分别等于总体参数β1和β2。 即E(β*1)=β1 E(β*2 )=β2 E(β*2 )=E(β2+∑btut) =β2+∑btE(ut) =β2 E(β*1)=E(β1+∑atut) =β1
总体
有限总体
无限总体
任何样本都是有限的
一元线性回归分析基础
第三节 最小二乘估计量的性质
一、线性特性
是指参数估计值β*1和β*2分别为观察值Yt或扰动项ut的线性组合。
证: β*2 =∑Xtyt/ ∑Xt2 =∑Xt(Yt- )/∑X2t =∑(Xt/∑Xt2)Yt 令 bt= (Xt/∑Xt2) 得 β*2 = ∑ bt Yt 即β*2 是Yt的线性组合
一元线性回归分析基础
第三节 最小二乘估计量的性质
2.证明最小方差性 假设β**2是其他方法得到的关于β2的线性无偏估计 β**2=∑ctYt 其中,ct=bt+dt,dt为不全为零的常数 则容易证明 var(β**2)≥ var(β*2) 同理可证明β1的最小二乘估计量β*1具有最小方差。 高斯—马尔可夫定理(Gauss-Markov theorem): 满足性质1、2、3的最小二乘估计量是最优线性无偏估计量(best linear unbiased estimator:BLUE)

古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-双变量模型:假设检验(圣才出品)

古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-双变量模型:假设检验(圣才出品)

第3章双变量模型:假设检验3.1 复习笔记一、古典线性回归模型古典线性回归模型假定如下:假定1:回归模型是参数线性的,但不一定是变量线性的。

回归模型形式如下:Y i=B1+B2X i+u i这个模型可以扩展到多个解释变量的情形。

假定2:解释变量X与扰动误差项u不相关。

但是,如果X是非随机的(即为固定值),则该假定自动满足。

即使X值是随机的,如果样本容量足够大,也不会对分析产生严重影响。

假定3:给定X,扰动项的期望或均值为零。

即E(u|X i)=0(3-1)假定4:u i的方差为常数,或同方差,即var(u i)=σ2(3-2)假定5:无自相关假定,即两个误差项之间不相关。

即:cov(u i,u j)=0,i≠j(3-3)无自相关假定表明误差u i是随机的。

由于假定任何两个误差项不相关,所以任何两个Y值也是不相关的,即cov(Y i,Y j)=0。

由于Y i=B1+B2X i+u i,则给定B值和X值,Y 随u的变化而变化。

因此,如果u是不相关的,则Y也是不相关的。

假定6:回归模型是正确设定的。

换句话说,实证分析的模型不存在设定偏差或设定误差。

这一假定表明,模型中包括了所有影响变量。

二、普通最小二乘估计量的方差与标准误有了上述假定就能够估计出OLS估计量的方差和标准误。

由此可知,教材式(2-16)和教材式(2-17)给出的OLS估计量是随机变量,因为其值随样本的不同而变化。

这种抽样变异性通常由估计量的方差或其标准误(方差的平方根)来度量。

教材式(2-16)和式(2-17)中OLS估计量的方差及标准误是:(3-4)(3-5)(3-6)(3-7)其中,var表示方差,se表示标准误,σ2是扰动项u i的方差。

根据同方差假定,每一个u i具有相同的方差σ2。

一旦知道了σ2,就很容易计算等式右边的项,从而求得OLS估计量的方差和标准误。

根据下式估计σ2:(3-8)其中,σ∧2是σ2的估计量,是残差平方和,是Y的真实值与估计值差的平方和,即()122212var ibiXbn xσσ==∑∑1se()b=()22222varbibxσσ==∑()2se b=22ˆ2ienσ=−∑2ie∑n -2称为自由度,可以简单地看作是独立观察值的个数。

古扎拉蒂计量经济学第四版讲义Ch3 Simple Linear Regression

古扎拉蒂计量经济学第四版讲义Ch3 Simple Linear Regression

而 有 些 模 型 即 使 转 换 也 不 能 够 linearized in the parameters , 这 样 的 模 型 称 为 intrinsically nonlinear regression model,简称为非线性回归模型(NLRM)。如:
( ) Yi = β1 +
0.75 − β1
or
Yi = E (Y | Xi ) + εi
这里,偏差 εi 是一个不可观察的随机变量,可以取正值或负值。 我们把 εi 称为随机干扰项(stochastic disturbance)或随机误差项(stochastic error
term),它是随机的非系统的部分;而 E (Y | Xi ) 则是系统的,或确定性的部分。
ln Yi = β1 + β2 Xi + εi → inverse semilogarithmic
ln Yi
=
β1

β2

1 Xi

+
ε
i


logarithmic
reciprocal
甚至 ln Yi = ln β1 + β2 ln Xi + εi → logarithmic or double logarithmic let α = ln β1
如果对上式的两端同取期望值,得到
E (Yi | Xi ) = E E (Y | Xi ) + E (εi | Xi ) = E (Y | Xi ) + E (εi | Xi ) 这里用到了一个常数的期望值还是这个常数的性质;另外, E (Yi | Xi ) 与 E (Y | Xi ) 是一 回事,所以上述变换意味着: E (εi | X i ) = 0 。

古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-自相关:如果误差项相关会有什么结果(圣才出品

古扎拉蒂《经济计量学精要》(第4版)笔记和课后习题详解-自相关:如果误差项相关会有什么结果(圣才出品

量对其滞后一期的回归。
(2)德宾-沃森 d 统计量的定义
n
( ) et − et−1 2
d = t=2 n
et 2
t =1
5 / 28
(10-3)
圣才电子书 十万种考研考证电子书、题库视频学习平台

即残差递差的平方和与残差平方和的比值。注意:在计算 d 统计量分子时,其样本容量
1 / 28
圣才电子书 十万种考研考证电子书、题库视频学习平台

图 10-1 自相关的模式 3.自相关产生的原因 (1)惯性 大多数经济时间序列的一个显著特征就是惯性或者说是迟滞性,即各经济变量的观测值 在时间前后存在着关联性。因此,在涉及时间序列数据的回归方程中,连续的观察值之间很 可能是互相依赖或是相关的。 (2)模型设定误差 不正确的模型设定是指本应纳入模型的重要变量未纳入模型或是模型选择了错误的函 数形式,如果发生这样的模型设定误差,得到的残差则会呈现出系统模式。一个简单的检验 方法是将遗漏变量纳入模型,判定残差是否仍然呈现系统模式。如果不存在系统模式,则序
可见,自相关的后果与异方差相似,也是严重的。因此,与异方差情形相同,在实际应 用中必须确定是否存在自相关问题。
三、自相关的诊断 1.图形法 与异方差情形相同,通过直接观察 OLS 残差 e 来判断误差项 u 中是否存在自相关。有 多种不同的残差图形的检验方法。 (1)残差 e 对时间的散点图 可以用残差对时间作图,如果随着时间的变化,残差呈现出某种有规律的趋势,则可能 存在着自相关。图 10-2 是回归的残差关于时间的时序图,从图可以看出:残差 e 并不是随 机分布的,而是呈现出明显的变动模式——开始是正的,接着变成负的,然后是正的,再然 后是负的,最后又是正的。图形展示了这样一种趋势:残差的递差之间正相关,表明序列存 在着正的自相关。

第3章_双变量回归模型: 计量经济学-古扎拉蒂 教学课件_834

第3章_双变量回归模型: 计量经济学-古扎拉蒂 教学课件_834
的 – 假定3:干扰项ui的均值为零 – 假定4:同方差性或ui的方差相等
vauir|(Xi)E[ui E(ui)|Xi]2
E(ui2|Xi)2
f(u)
0
Y
X1
X2
X3
X4
X 同方差性:Var(ui|Xi)= Var(uj|Xj),i≠j
3.2经典线性回归模型
• 最小二乘法的基本假定
– 假定5:各个干扰之间无自相关
E (Yi X i ) 0 1 X i Var (Yi | X i ) 2
Cov (Yi , Y j ) 0 (i j )
Yi ~ N ( 0 1 X i , 2 )
3.3最小二乘估计的精度或标准 误差
方差:
var(ˆ2)
2
xi2
var( ˆ1 ) n
X
2 i
x
2 i
2
标准误:
3.2经典线性回归模型
• 最小二乘法的基本假定
– 假定7:观测次数n必须大于待估计的参数个 数.即观测次数n必须大于解释变量的个数
– 假定8:X值要有变异性 – 假定9:正确地设定了回归模型. – 假定10:没有完全的多重共线性.
3.2经典线性回归模型
• 由于被解释变量 Yi分布的性质决 定于ui ,因而对 ui的各项假定也 适用于 Yi,从而 有:
se(ˆ2)
xi2
se ( ˆ1 )
n
X
2 i
x
2 i
3.4最小二乘法回归线性质
• 回归线的性质
1. 它是通过Y和X的样本均值的一条直线. 2. 估计的Y(即 Yˆi )的期望值等于实测的Y的期望值. 3. 残差的期望值为零. 4. 残差和预测的Yi值不相关. 5. 残差和Xi不相关.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假定 1:线性回归模型。 即回归模型在参数上是线性的,这是 CLRM 的起点,全书将保持这种线性性假定。
4
假定 2:在重复抽样中,x 值是固定的,非随机的。 这个假定的根本意思就是,我们的回归分析是条件回归分析,以给定的解释变量 x 值为条件。
假定 3:干扰项具有零均值。即 E (εi | xi ) = 0 。
必须是一个有限的正值。
假定 9:回归模型正确设定。
假定 10:不存在多重共线性(multicollinearity)。 也就是说,在解释变量之间不存在完全的线性关系。这实际上是多元回归中的假定。这里先 提一下。
3、古典线性回归模型(CLRM)的估计 估计的方法一般是 OLS 和 MLE;总体上说,由于直观和简单,OLS 方法相对于 MLE 方法在回 归分析中用得更广泛。
intrinsically
a
nonlinear
model。
而 CES 生产函数
( ) yi = A δ Ki−β + 1− δ L−i β −1/ β
其中 A=scale parameter, δ =distribution parameter ( 0 < δ < 1), and β =substitution parameter ( β ≥ −1 ). 无论误差项 εi 以什么样的形式进入模型,都不可能把参数转换成线性关系。
从现在开始,我们所说的线性回归的线性性就是指这第二种含义(linear in the parameters,
the β s),并不要求 linear in the X s。给出一个表格进行总结:
3)PRF 的随机设定
我们可以用下式来表达个体 Yi 与它的条件期望值之间的偏差(deviation):
εi = Yi − E (Y | Xi )
而 有 些 模 型 即 使 转 换 也 不 能 够 linearized in the parameters , 这 样 的 模 型 称 为 intrinsically nonlinear regression model,简称为非线性回归模型(NLRM)。如:
( ) Yi = β1 +
0.75 − β1
Yi
=
1
+
1 e β1 + β2
Xi
+εi
→ logistic ( probability) distribution
function
上述 linear regression model 和 intrinsically linear regression model 统称为线性回 归模型(LRM)。
们用 E (Y ) 来表示随机变量 Y 的总体均值(总体期望值),而用 Y 表示从该总体中抽取的样
本的平均值。
举一个关于总体的例子:Y 轴为月消费支出,x 轴为月收入,取 10 个 x 的固定值,每个 x 值对应若干个 y 值(每组 5~7 个 y 值不等)。
对应于这 10 个 X 值,有 10 个 Y 的均值,称为 Y 的条件均值, E (Y | X ) ;要注意与 Y 的无 条件均值 E (Y ) 相区别。把这 10 个条件均值连接起来,就得到总体回归线(PRL)。这里,
ln Yi = β1 + β2 Xi + εi → inverse semilogarithmic
ln Yi
=
β1

β2

1 Xi

+
ε
i


logarithmic
reciprocal
甚至 ln Yi = ln β1 + β2 ln Xi + εi → logarithmic or double logarithmic let α = ln β1
机变量 εi 。
4)人类行为的内在随机性(Intrinsic randomness in human behavior); 5)不好的代理变量; 6)节减的原则(Principle of parsimony) 根据 Occam 的 razor 理论,我们应该让回归模型尽可能的简洁;当然,不应该为了简洁而把 相关的和重要的变量排除在外。 7)错误的方程形式设定。
假定 6: εi 和 Xi 之间的协方差等于 0。即 cov (εi , xi ) = E (εi , xi ) = 0 。
假定 7:观察值的个数 n 必须大于要估计的参数的个数。
假定 8:X 值的变化必须足够大。
∑( )
或者说,X
的方差
var
(
X
)

=
Xi − X n −1
2

为什么要使用随机干扰项 εi 呢?很多理由:
1)理论不清楚;
3
2)数据不可得; 3)核心变量与边缘变量之分(Core variables versus peripheral variables); 很大的可能许多边缘变量的联合影响如此之小,以至于它最多是非系统的或者随机的,基于 实际和成本的考虑,不值得在模型中显性地引入它们。我们希望把它们的联合影响处理成随
(heteroscedasticity),即
var
(εi
|
xi
)
=
σ
2 i

假定 5:干扰项之间不存在自相关(No autocorrelation between the disturbances)。 给定任意两个 X 值,对应的两个干扰项之间的相关(correlation)等于 0。即,
( ) cov εi ,ε j | xi , xj = 0 (i ≠ j) 。
该假定说的就是,没有显性包括在模型中而是包含在 εi 中的因素不会系统地影响 y 的均值, 正的 εi 和负的 εi 会相互抵消,所以,它们对 Y 的平均影响等于 0。
假定 4:干扰项具有同方差(Homoscedasticity)。即 var (εi | xi ) = σ 2 。
同方差的意思就是,围绕回归线的变化在不同的 x 值上是相同的,不会随着 x 的变化而增加 或减少。相反,如果 Y 总体的条件方差随 X 而变化,这种情形就称作异方差
ε e + −β2 ( Xi −2) i
再用 CD 生产函数的三种不同形式来区别:
β yi =
x x e β2 β3 εi
1 i2 i3
or
ln yi = ln β1 + β2 ln xi2 + β3 ln xi3 + εi
可称为 intrinsically linear regression model。
综上所述,随机干扰项 εi 在回归分析中起着极端重要的作用,我们在后面会看到。
4)样本回归方程(Sample Regression Function, SRF)
前面都是以总体为对象进行讨论的。现在我们开始讨论样本问题,因为,在实际中,我们所 有的仅仅是基于固定的 x 值的 y 的样本。所以,我们的任务是利用样本的信息来估计 PRF。 由样本数据绘制的回归线我们称为样本回归方程(SRF)或样本回归线(SRL)。由于抽样的 不稳定性,这些样本回归线至多是对真实 PRF 的近似。事实上,对于 N 个不同的样本,我们 能得到 N 个不同的 SRFs,而且这些 SRFs 不可能是相同的。
如果对上式的两端同取期望值,得到
E (Yi | Xi ) = E E (Y | Xi ) + E (εi | Xi ) = E (Y | Xi ) + E (εi | Xi ) 这里用到了一个常数的期望值还是这个常数的性质;另外, E (Yi | Xi ) 与 E (Y | Xi ) 是一 回事,所以上述变换意味着: E (εi | X i ) = 0 。
or
Yi = E (Y | Xi ) + εi
这里,偏差 εi 是一个不可观察的随机变量,可以取正值或负值。 我们把 εi 称为随机干扰项(stochastic disturbance)或随机误差项(stochastic error
term),它是随机的非系统的部分;而 E (Y | Xi ) 则是系统的,或确定性的部分。
Yi = b1 + b2 X i + ei
(2.6.2)
这里 ei 表示样本残差项(sample residual term)。 ei 类似于 εi ,可以被看作 εi 的估计值。
2、古典线性回归模型(CLRM)的假定
古典(或高斯、标准)线性回归模型(CLRM)作为大部分计量理论的基石,有 10 大假定。
注意,有些模型 look nonlinear in the parameter 但是 transform 后系数为线性的,像这 种必须通过取倒数、自然对数、变量相除等变换才能得到线性回归模型的原模型称为 intrinsically linear regression model。如:
Yi = eβ1+β2Xi +εi → ex ponential
与代表总体回归线的 PRF 相似,我们这里给出代表样本回归线的样本回归方程(SRF)):
Y i = b1 + b2 X i
(2.6.1)
这里, Y i 是 E (Y | Xi ) 的估计量, b1, b2 是 β1, β2 的估计量。
和 PRF 一样,我们也可以设定 SRF (2.6.1)的随机形式:
第三章 两变量线性回归
1、基本概念
两变量线性回归(bivariate, or two-variable regression)又称为一元线性回归或简单 回归(Simple regression analysis)。 1)一些概念-以例子引出 回归分析主要是从已知的或者确定的解释变量的值来估计或预测被解释变量的总体均值。我
(3.1.2)
OLS 估计量的推导过程: 利用 centered model 来进行
相关文档
最新文档