第二章回归分析与模型设定高级计量经济学清华大学潘文清

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.5 0.007 0.006 0.004 0.009 0.033 0.000 0.011 0.013 0.010 0.093
3.5 0.006 0.007 0.007 0.012 0.031 0.002 0.005 0.006 0.006 0.082
X 4.5
0.005 0.010 0.010 0.016 0.041 0.001 0.012 0.009 0.009 0.113
Y 0.50 0.40 0.25 0.15 0.05 0.00 -0.05 -0.18 -0.25 p(x)
0.5 0.001 0.001 0.002 0.002 0.010 0.013 0.001 0.002 0.009 0.041
1.5 0.011 0.002 0.006 0.009 0.023 0.013 0.012 0.008 0.009 0.093
p(xi,yj) =the proportion of the 1027 families who reported the combination (X=xi and Y=yj).
Table 2.1 Joint frequency distribution of X=income and Y=saving rate
第二章 回归分析与模型设定
General Regression Analysis and Model Specification
§2.1 回归分析:问题的引入
egression Analysis: Introduction
回归分析(Regression Analysis):一种最常用的 统计分析工具,用来分析一个变量关于其他变量的 依赖关系。 X 与 Y间的回归关系可用来研究X对Y 的影响,或用X来预测Y。 一、 总体均值与样本均值
• 条件方差(The conditional variance)
Va(Yr | x)Va(Yr | Xx)
m Y|xi
j
yjp(yj|xi)Biblioteka Baidu
j
yj p(p x(ix ,iy)j)
Conditional mean function of Y on X
mY|X
Savings Rate
-0.05 0.00 0.05 0.10 0.15 0.20
0.5 1.5 2.5 3.5 4.5 5.5 6.7 8.8 12.5 17.5 Income(thousands of dollars)
Fig 2.1
同样地,如果可获得总体数据,我们就可得到给出 X值时Y的总体条件均值 (population conditional means )
• (xi,yi) =joint frequencies of the population • (xi)=j (xi,yi) =marginal frequencies of X • (yj|xi)=(xi,yi)/(xi) =conditional frequencies of Y
given X
• X= i xi(xi) =population mean of X • Y|X= j yi(yj|xi) =population conditional mean of Y
given X
Y|x=E(Y|X)=F(X)
mY|x=f(X)
Question: how to get f(x)?
mY|x=f(X)
We hope the SRF is a good estimate of the PRF.
Y
PRF
SRF
X
A simple illustration: how to find the sample mean
表 2.1 是1960年美国1027个家庭关于收入与储蓄率 的联合频率分布.
- 如何寻找该曲线(curve)? 平滑的样本曲线 m*Y|X 仍 能告知有关 Y|X的相关信息吗?
二、条件分布
假设(X,Y)的联合概率密度函数( joint probability density function , pdf) 为 f(x,y) ,则
X的边际密度函数(marginal pdf ): fX(x) =f(x,y)dy
How to find the relationship between X and Y?
理论上应寻找总体回归函数( PRF),即在给定X时, Y的条件均值的函数 :
Y|x=E(Y|X)=F(X)
但我们往往只能得到样本数据。因此自然想到用 样本均值来估计总体均值, 并寻找样本回归函数 (SRF):
Y在 X=x 的条件密度函数( conditional pdf ):
fY|X(y|x)=f(x,y)/fX(x)
条件 pdf fY|X(y|x) 完全描述了Y 对 X的依赖关系。
已知条件 pdf, 可计算:
• 条件期望(The conditional mean)
E ( Y |x ) E ( Y |X x )y Y |X f (y |x ) dy
•如果经济理论表明: Y|x=+X 但表2.1显示 mY|X 并非一条直线 - 我们是保持 mY|X 的原样呢? 还是对样本的 mY|X
通过一条直线来平滑:
m*Y|X=a+bX -如果用平滑线, 如何寻找该直线?
-用平滑线估计总体均值,要比样本均值估计效 果更好吗? •如果经济理论表明: Y|X=X
12.5 0.014 0.008 0.013 0.024 0.042 0.000 0.004 0.006 0.002 0.113
17.5 0.004 0.007 0.006 0.020 0.007 0.000 0.003 0.002 0.003 0.052
The conditional mean of Y given X=xi is
5.5 0.005 0.007 0.011 0.020 0.029 0.000 0.016 0.008 0.007 0.103
6.7 0.008 0.008 0.020 0.042 0.047 0.000 0.017 0.008 0.005 0.155
8.8 0.009 0.009 0.019 0.054 0.039 0.000 0.014 0.008 0.003 0.155
相关文档
最新文档