第二章回归分析与模型设定高级计量经济学清华大学潘文清

合集下载

潘文卿计量经济学

潘文卿计量经济学
——P . 萨谬尔逊(P . Samuelson)
●计量经济学是理解和运用现代经济学的重要基础
“在大多数大学和学院中,计量经济学的讲 授已成为经济学课程表中最有权威的一部分。”
——R . 克莱因(R . Klein)
●计量经济学是经济类各专业最重要的经济学课程之一
2
诺贝尔经济学奖获得者
直接因为对计量经济学的创立和 发展做出贡献而获奖者达13人,据 经济学各分支学科之首。 绝大多数获奖者,即使其主要贡 献不在计量经济学领域,但在他们 的研究中都普遍应用了计量经济学 方法。
教学方法
1.原理介绍
2.软件实现 3.案例分析
学习方法
1.认真听课 2.预习复习 3.上机练习 4.阅读文献 5.撰写论文
考核方式
1.平时(出勤、课堂讨论、上机实验) 20% 2.课程论文 30% 3.期末测试 50%
经济学类各专业核心课程
计量经济学
课程简介
1
引子——为什么要学习计量经济学?
这由计量经济学的性质和在经济学中的地位和作用所决定 “一门科学只有成功地运用了数学时,才算达 到了真正完善的地步”。
——卡尔 . 马Байду номын сангаас思(见拉法格的回忆录)
●从定性研究到定量分析是经济学更为精密、更为科学的表现
“第二次世界大战后的经济学是计量经济学的时 代。”
计出版社,2008 3.伍德里奇著,费剑平译校.计量经济学导论 (第四版),中国人民大学出版社,2010
4. 庞皓.计量经济学(第3版).科学出版社, 2014
6
主要参考期刊
[1] 经济研究 / [2] 统计研究 /tjshujia/tjyj/index.htm [3] 管理世界 /Faces/index.asp [4] 财贸经济:/qk/96197X/ [5] 投资研究:/qk/96500X/ [6] 财政研究:/qk/96682X/ [7] 税务研究:/qk/80935X/ [8] 国际贸易问题:/qk/96001X/ [9] 数量经济技术经济研究:/qk/94503X/ [10] 农业经济问题: [11]南开经济研究:/qk/96678X/ [12]中国农村经济:/qk/94178X/ [13]金融研究:/qk/97926X/ [14]世界经济:/qk/92713X/ [15]经济学家:/qk/97161X/ [16]中国工业经济:/qk/93800A/[

高级计量经济学导论复习资料

高级计量经济学导论复习资料

第一章高级计量经济学4 1.数据类型:42.经验经济分析的步骤:4 第二章简单回归模型41.回归分析(regression analysis):42.回归分析的主要内容包括:43.变量间的关系:44.变量关系的描述:45.相关关系的类型:46.线性相关的程度:57.回归分析的意义:58.总体回归线(population regression line )/总体回归曲线(population regression curve ):在给定解释变量Xi 条件下被解释变量Yi 的期望轨迹。

59.总体回归函数(PRF):E (y ∣x )=β0+β1x,510.随机干扰项(stochastic disturbance )或随机误差项(stochastic error ):511.样本回归方程(SRF ):01ˆˆˆi i y x =β+β 512.拟合值:当x=i 时,y 通过样本回归方程算出来的值。

即01ˆˆˆi i y x =β+β 5 13.样本回归模型(sample regression model ):01ˆˆˆi i i iY Y u X e =+=β+β+ 5 14.回归分析的主要目的:根据样本回归函数SRF ,估计总体回归函数PRF 。

6 第三章:简单回归方程分析61.简单回归方程:62.线性的含义:63.OLS 斜率估计,β0和β1的普通最小二乘估计值的推算:64.OLS 法是要找到一条直线,使残差平方和最小。

75.残差:是对误差项的估计,因此,它是拟合直线(样本回归函数)和样本点之间的距离。

76.OLS 统计量的代数性质:77.SST=SSE+SSR :88.拟合优度:来衡量样本回归线是否很好地拟合了样本数据的指标。

89.判定系数:解释变异与总变异之比。

即y 的样本变异中被x 解释的部分。

8 10.测量单位:811.在简单回归中加入非线性因素(因变量为对数):8 12.OLS 的基本假设:913.定理2.1: OLS 的无偏性:914.定理2.2 OLS 估计量的抽样方差:9 15.定理2.3:σ²的无偏估计1016.回归标准误差:ˆσ17.1ˆβ的标准误:11221ˆˆ()(())ni i se x x =σβ==-∑10第四章多元回归分析101.多元回归分析的优点:102.多元线性回归模型:103.多元线性回归的OLS估计值:104.SRF样本回归函数:115.拟合值和残差11ˆβ的计算116.偏效应以及17.比较简单回归和多元回归估计值:128.拟合优度(SST、SSR、SSE、R2):139.过原点的回归:1310.多元回归模型的假定及定理3.1、定理3.2:1411.多重共线性:两个或多个自变量之间高度(但不完全)相关。

第三章 回归模型的估计 概论(高级计量经济学-清华大学 潘文清)

第三章  回归模型的估计 概论(高级计量经济学-清华大学 潘文清)

2、极大似然估计
对具有pdf或pmf为f(Y;)的随机变量Y(其参数未知), 随机抽取一容量为n的样本Y=(Y1,Y2,…Yn)’其联合分布为:
gn(Y1,Y2,…Yn;)=if(Yi;) 可将其视为给定Y=(Y1,Y2,…Yn)’时关于的函数,称其为关于 的似然函数(likelihood function),简记为L() : L()= gn(Y1,Y2,…Yn;)=if(Yi;) 对离散型分布,似然函数L()就是实际观测结果的概率。 极大似然估计就是估计参数,以使这一概率最大; 对连续型分布,同样也是通过求解L()的最大化问题,来 寻找的极大似然估计值的。
二、类比估计法(The Analogy Principle)
1、基本原理
• 总体参数是关于总体某特征的描述,估计该参数, 可使用相对应的描述样本特征的统计量。 (1)估计总体矩,使用相应的样本矩
(2)估计总体矩的函数,使用相应的样本矩的函数 对线性回归模型: Y=0+1X+u
上述方法都是通过样本矩估计总体矩,因此,也 称为矩估计法(moment methods, MM)。 (3)类比法还有: • 用样本中位数估计总体中位数; • 用样本最大值估计总体最大值; • 用样本均值函数mY|X估计总体期望函数Y|X,等
可见,总体均值的极大似然估计就是样本均值,总 体方差的极大似然估计就是样本方差。
3、极大似然估计的统计性质
由数理统计学知识: (n-1)s*2/2~2(n-1)
因此, Var[(n-1)s*2/2]=2(n-1)
Var(S*2)=24/(n-1)
§3.2 估计总体关系 Estimating a Population Relation 一、问题的引入(Introduction)

计量经济学中级教程(潘省初清华大学出版社)课后习题答案

计量经济学中级教程(潘省初清华大学出版社)课后习题答案

计量经济学中级教程(潘省初清华大学出版社)课后习题答案计量经济学中级教程习题参考答案第一章绪论1.1 一般说来,计量经济分析按照以下步骤进行:(1)陈述理论(或假说)(2)建立计量经济模型(3)收集数据(4)估计参数(5)假设检验(6)预测和政策分析 1.2 我们在计量经济模型中列出了影响因变量的解释变量,但它(它们)仅是影响因变量的主要因素,还有很多对因变量有影响的因素,它们相对而言不那么重要,因而未被包括在模型中。

为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。

1.3 时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。

横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。

如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。

1.4 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。

在一项应用中,依据估计量算出的一个具体的数值,称为估计值。

如Y 就是一个估计量,1nii YYn==∑。

现有一样本,共4个数,100,104,96,130,则根据这个样本的数据运用均值估计量得出的均值估计值为5.107413096104100=+++。

第二章经典线性回归模型2.1 判断题(说明对错;如果错误,则予以更正)(1)对(2)对(3)错只要线性回归模型满足假设条件(1)~(4),OLS 估计量就是BLUE 。

(4)错R 2 =ESS/TSS 。

(5)错。

我们可以说的是,手头的数据不允许我们拒绝原假设。

(6)错。

因为∑=22)?(tx Var σβ,只有当∑2t x 保持恒定时,上述说法才正确。

2.2 应采用(1),因为由(2)和(3)的回归结果可知,除X 1外,其余解释变量的系数均不显著。

计量经济学课后答案第二章 简单线性回归模型

计量经济学课后答案第二章 简单线性回归模型

第二章课后答案2.11)设回归模型为: 01i i i Y X u ββ=++其中,Y 为国内生产总值,i X 为地方预算内财政收入对回归模型的参数进行估计,根据回归结果得:i Y = -3.611151+ 0.134582iX (4.161790) (0.003867)t = (-0.867692) (34.80013)2r =0.991810 F=1211.049 S.E.=7.532484 DW=2.0516402)斜率系数的经济意义:国内生产总值每增加1亿元,地方预算内财政收入平均增加0.315亿元。

3)由以上模型可看出,X 的参数估计的t 统计量远大于2,说明GDP 对地方财政收入确有显著影响。

模型在的可决系数为0.991810,说明GDP 解释了地方财政收入变动的99%,模型拟合程度较好。

4)预测点预测:若2005年GDP 为3600亿元,2005年的财政收入预测值为480.884。

区间预测:由X 、Y 的描述统计结果得: 22(1)587.269(121)3793733.66i x x n σ=-=⨯-=∑22()(3600-917.5874)7195337.357f X X -==取α=0.05,f Y 平均值置信度95%的预测区间为:/2f Y t α f X =3600时,480.884 2.228⨯7.5325⨯ 23.61476991 即,2005年财政收入的平均值预测区间为:480.884 23.34796 (457.2692, 504.4988)f Y 个别值置信度95%的预测区间为:/2f Y t α f X =3600,480.884 2.228⨯7.5325⨯ 28.97079 2005年财政收入的个别值预测区间为:480.884 28.97079 (451.91321,509.8548)2.2令Y 为利润额,X 为研究与发展经费研究与发展经费与利润额的相关系数表:设回归模型为:01i i i Y X u ββ=++其中i Y 为利润额,i X 为研究与发展经费。

清华大学 五道口金融学院 潘文卿 内生性工具变量与GMM估计

清华大学 五道口金融学院 潘文卿  内生性工具变量与GMM估计

第4章内生性、工具变量与GMM估计•外生性与常见的内生性问题•矩估计(MM)与工具变量法(IV)•线性模型的两阶段最小二乘估计(2SLS)•线性模型的广义矩估计(GMM)§4.1 外生性与常见的内生性问题一、外生性假设与内生性问题二、常见的内生性一、外生性假设与内生性问题线性回归模型中一个重要的假设是“严格外生性”: E(ε|X )=0严格外生性(strictly strictly exogeneity exogeneity exogeneity))的含义是:各期的解释变量X t 独立于所有期的随机扰动项εt 。

在严格外生性与球型假设假设下,OLS 估计量是BLUE 。

这两大假设也称为Y t 或εt 是独立同分布的(iid )。

对模型 Y t =β0+β1X t1+…+βk X tk +εt或 Y t = X t ’β+ εt 或 Y = X β +ε1、外生性与、外生性与OLS OLS OLS估计量的统计性质估计量的统计性质tΣ§4.2 矩估计与工具变量法一、矩估计二、矩估计中的工具变量法二、矩估计中的工具变量(IV)法假设有如下模型:Y t=X t1’β1+X t2β2+εt其中:X2为单一变量,X1为包括截距项的k维行向量β2、β1为对应的参数变量与参数向量。

如果模型设定正确,则有如下总体矩条件 E(X t1εt )=0, E(X t2εt)=0(1/n)ΣX t1(Y t-X t1’b1-X t2b2)=0(1/n)ΣX t2(Y t-X t1’b1-X t2b2) =0(1/n)ΣX t1(Y t -X t1’b 1-X t2b 2) =0(1/n)ΣX t2(Y t -X t1’b 1-X t2b 2) =0正规方程组如果缺少矩条件,如E(X t2εt )≠0,则上述正规方程组最后一个方程不存在,则无法求解。

这时,工具变量法就是寻找一工具变量Z2,满足E(Z t2εt)=0,E(Z t2X t2)≠0。

高级计量经济学 第二章 多元线性回归模型

高级计量经济学  第二章 多元线性回归模型

X' Xˆ X'Y
如果 X'X存在逆矩阵(这是满秩假定所要求的),
那么其解为: ˆ(X'X)1X'Y
最小二乘法估计
(多元回归模型)
如果将解释变量视作是非随机的,那么将X作为常 数矩阵,可以得知OLS估计量是线性无偏的: ˆ ( X ' X )1 X 'Y ( X ' X )1 X '( X e) ( X ' X )1 X 'e
ˆˆ1 0
N X1i
ˆ2 X2i
X1i X12i X1iX2i
XX 1iX 2i2i1 XY 1iiYi X2 2i X2iYi
思考:如果X1=2X2会出现什么情况?
最小二乘法估计
对拟合优度的统计检验
检验拟合优度的虚假设是所有解释变量均不是真 正的解释变量,即:
H 0 : 12 .. .k 0
备择假设为至少有一个解释变量的参数不等于零 。相应的统计量为:
F k 1 ,N kE RSS K N S S 1 K 1 R R 22N K K 1
如y果ˆ使xˆ12 , …x1,或 xk保持ˆ不1变 ,xyˆ1那么有
即每个估计的都反映出当其他因素不变时,该因
素产生的边际影响效果。
多元回归的拟合优度
多元回归方程的拟合优度同样可以用R2表示
R2RSS
TSS
Y Y ˆii Y Y2 21
最小二乘法估计
(多元回归模型)
上式实现最小化的必要条件是:
ESˆ(ˆS)2X'Y2X'Xˆ0
得出上述结果需要利用以下矩阵算法性质:

高级计量经济学2

高级计量经济学2

第2章 经典线性回归模型Chapter 2 The Classical Multiple Linear Regression Model进行计量经济分析时,我们将首先通过经济理论来指定变量之间精确的和确定性的关系,然后利用模型方法经验地探索这些估计,再通过适当的检验判断估计的准确性,最后使用这样的模型来推断和判断经济行为。

无论当前的计量经济分析多么复杂,仍然大都从线性回归模型(linear regression model)开始进行分析。

因此多元线性模型可以作为计量经济分析的基石。

线性模型的估计方法可以推广到更为广泛的模型当中。

§2.1 线性回归模型多元线性回归模型主要用于研究一个相依变量与一个或者多个独立变量之间的关系。

线性模型的一般形式是:εβββε++++=+=K K K x x x x x x f y 221121),,,( (2.1) 这里y 是相依变量(dependent variable)或者被解释变量(explained variable),K x x ,,1 是独立变量(independent variable)或者解释变量(explain variable)。

一些理论将有助于指定函数),,,(21K x x x f 的形式,这个函数通常称为y 基于K x x ,,1 的母体回归方程(population regression equation)①。

ε被称为随机扰动项(random disturbance),如此定义是因为它是对原本稳定关系的扰动。

随机扰动项的出现主要有下述原因:首先,无论模型是多么精美,也无法完全表示穷尽对经济变量的各种影响,因此它们被忽略掉的因素所产生的净影响便体现在扰动项中;其次,在经验模型中还有很多对随机扰动产生影响的因素,其中最为显著的可能是模型度量的误差。

虽然我们可能在理论上很容易地得到变量之间准确的关系,但是却很难获得这些变量准确和合理的度量;更为困难的是,可能一些理论上的变量在现实中难以寻求到对应的观测数据。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 回归分析与模型设定
General Regression Analysis and Model Specification
§2.1 回归分析:问题的引入
egression Analysis: Introduction
回归分析(Regression Analysis):一种最常用的 统计分析工具,用来分析一个变量关于其他变量的 依赖关系。 X 与 Y间的回归关系可用来研究X对Y 的影响,或用X来预测Y。 一、 总体均值与样本均值
12.5 0.014 0.008 0.013 0.024 0.042 0.000 0.004 0.006 0.002 0.113

17.5 0.004 0.007 0.006 0.020 0.007 0.000 0.003 0.002 0.003 0.052
The conditional mean of Y given X=xi is
given X
• X= i xi(xi) =population mean of X • Y|X= j yi(yj|xi) =population conditional mean of Y
given X
Y|x=E(Y|X)=F(X)
mY|x=f(X)
Question: how to get f(x)?
• 条件方差(The conditional variance)
Va(Yr | x)Va(Yr | Xx)
Fig 2.1
同样地,如果可获得总体数据,我们就可得到给出 X值时Y的总体条件均值 (population conditional means )
• (xi,yi) =joint frequencies of the population • (xi)=j (xi,yi) =marginal frequencies of X • (yj|xi)=(xi,yi)/(xi) =conditional frequencies of Y
Y在 X=x 的条件密度函数( conditional pdf ):
fY|X(y|x)=f(x,y)/fX(x)
条件 pdf fY|X(y|x) 完全描述了Y 对 X的依赖关系。
已知条件 pdf, 可计算:
• 条件期望(The conditional mean)
E ( Y |x ) E ( Y |X x )y Y |X f (y |x ) dy
5.5 0.005 0.007 0.011 0.020 0.029 0.000 0.016 0.008 0.007 0.103
6.7 0.008 0.008 0.020 0.042 0.047 0.000 0.017 0.008 0.005 0.155
8.8 0.009 0.009 0.019 0.054 0.039 0.000 0.014 0.008 0.003 0.155
m Y|xi
j
yjp(yj|xi)
j
yj p(p x(ix ,iy)j)
Conditional mean function of Y on X
mY|X
Savings Rate
-0.05 0.00 0.05 0.10 0.15 0.20
0.5 1.5 2.5 3.5 4.5 5.5 6.7 8.8 12.5 17.5 Income(thousands of dollars)
•如果经济理论表明: Y|x=+X 但表2.1显示 mY|X 并非一条直线 - 我们是保持 mY|X 的原样呢? 还是对样本的 mY|X
通过一条直线来平滑:
m*Y|X=a+bX -如果用平滑线, 如何寻找该直线?
-用平滑线估计总体均值,要比样本均值估计效 果更好吗? •如果经济理论表明: Y|X=X
mY|x=f(X)
We hope the SRF is a good estimate of the PRF.
Y
PRF
SRF
X
A simple illustration: how to find the sample mean
表 2.1 是1960年美国1027个家庭关于收入与储蓄率 的联合频率分布.
How to find the relationship between X and Y?
理论上应寻找总体回归函数( PRF),即在给定X时, Y的条件均值的函数 :
Y|x=E(Y|X)=F(X)
但我们往往只能得到样本数据。因此自然想到用 样本均值来估计总体均值, 并寻找样本回归函数 (SRF):
p(xi,yj) =the proportion of the 1027 families who reported the combination (X=xi and Y=yj).
Table 2.1 Joint frequency distribution of X=income and Y=saving rate
- 如何寻找该曲线(curve)? 平滑的样本曲线 m*Y|X 仍 能告知有关 Y|X的相关信息吗?
二、条件分布
假设(X,Y)的联合概率密度函数( joint probability density function , pdf) 为 f(x,y) ,则
X的边际密度函数(marginal pdf ): fX(x) =f(x,y)dy
2.5 0.007 0.006 0.004 0.009 0.033 0.000 0.011 0.013 0.010 0.093
3.5 0.006 0.007 0.007 0.012 0.031 0.002 0.005 0.006 0.006 0.082
X 4.5
0.005 0.010 0.010 0.016 0.041 0.001 0.012 0.009 0.009 0.113
Y 0.50 0.40 0.25 0.15 0.05 0.00 -0.05 -0.18 -0.25 p(x)
0.5 0.001 0.001 0.002 0.002 0.010 0.013 0.001 0.002 0.009 0.041
1.5 0.011 0.002 0.006 0.009 0.023 0.013 0.012 0.008 0.009 0.093
相关文档
最新文档