第五章经典线性回归模型(II)(高级计量经济学清华大学潘文清)
stata初级入门5线性回归模型估计

1.2.3exposure
exposure(varname)表示约束模型中变量ln(varname) 的系数为1。该选项多出现于计数模型中。
计量经济学软件应用
12
2020/6/13
计量经济学软件应用
33
2020/6/13
菜单: Statistics > Postestimation > Reports and statistics
引起完全共线性的情况:(1)一个自变量是另一 个自变量的常数倍;(2)一个自变量恰好可以表 达为其它两个或多个自变量的一个线性函数。如果 此情况发生,自变量间就有多重共线性关系。
*自变量的样本有变异:在样本中,自变量不为相 同的常数。
同方差性(亦称有效性):var(u|x1,x2,x3,….)=σ2。
系数的方法。
method包括:
dw: rho_dw=1 - dw/2, 其中 dw 是Durbin-Watson值 regress:从残差回归方程et=rho_regress*et-1+vt freg:从残差回归方程中et=rho_freg*et+1+vt tscorr: rho=e‘et-1/e’e, 其中e和et-1 是残差和滞后一期残差。 theil: rho=rho_tscorr * (N-k)/N
rconsum
rneti _cons
Coef. Std. Err.
t P>|t|
.6478134 .0387183 482.8383 265.268
16.73 0.000 1.82 0.079
清华大学 五道口金融学院 潘文卿 内生性工具变量与GMM估计

第4章内生性、工具变量与GMM估计•外生性与常见的内生性问题•矩估计(MM)与工具变量法(IV)•线性模型的两阶段最小二乘估计(2SLS)•线性模型的广义矩估计(GMM)§4.1 外生性与常见的内生性问题一、外生性假设与内生性问题二、常见的内生性一、外生性假设与内生性问题线性回归模型中一个重要的假设是“严格外生性”: E(ε|X )=0严格外生性(strictly strictly exogeneity exogeneity exogeneity))的含义是:各期的解释变量X t 独立于所有期的随机扰动项εt 。
在严格外生性与球型假设假设下,OLS 估计量是BLUE 。
这两大假设也称为Y t 或εt 是独立同分布的(iid )。
对模型 Y t =β0+β1X t1+…+βk X tk +εt或 Y t = X t ’β+ εt 或 Y = X β +ε1、外生性与、外生性与OLS OLS OLS估计量的统计性质估计量的统计性质tΣ§4.2 矩估计与工具变量法一、矩估计二、矩估计中的工具变量法二、矩估计中的工具变量(IV)法假设有如下模型:Y t=X t1’β1+X t2β2+εt其中:X2为单一变量,X1为包括截距项的k维行向量β2、β1为对应的参数变量与参数向量。
如果模型设定正确,则有如下总体矩条件 E(X t1εt )=0, E(X t2εt)=0(1/n)ΣX t1(Y t-X t1’b1-X t2b2)=0(1/n)ΣX t2(Y t-X t1’b1-X t2b2) =0(1/n)ΣX t1(Y t -X t1’b 1-X t2b 2) =0(1/n)ΣX t2(Y t -X t1’b 1-X t2b 2) =0正规方程组如果缺少矩条件,如E(X t2εt )≠0,则上述正规方程组最后一个方程不存在,则无法求解。
这时,工具变量法就是寻找一工具变量Z2,满足E(Z t2εt)=0,E(Z t2X t2)≠0。
第四章--经典线性回归模型(高级计量经济学-清华大学-潘文清)PPT课件

(3)由性质(1)与性质(2)知:
MSE(b|X)=E(b-)(b-)’|X)
=Var(b|X)+[bias(b|X)]2
0
(n)
.
17
四、估计2及Var(b) Estimation of 2 and Var(b)
或
Y=X+
其中,=(0, 1,…,k)’, =(1,2,…,n)’
注意: 这里的线性性指Y关于参数是线性的。
.
3
假设2(strict Exogeneity): E(i|X)=E(i|X1,X2,…Xn)=0, (i=1,2,…n)
注意:
(1) 由E(i|X)=0 易推出:E()=0, E(Xji)=0 或有: Cov(Xj, i)=0 (i, j=1,2,…n)
求解min SSR(+)。
有约束的(i)的残差平方和不会小于无约束的(ii)的 残差平方和:e+’e+e’e
.
25
为避免将无解释力的解释变量纳入到X中去,引入 调整的决定系数(adjusted coefficient of determination):
(4)决定系数仅是对样本回归线拟合样本数据的程 度给予描述。而CR模型并不要求R2要有多高,CR 模型关心的是对总体回归参数的估计与检验。
如果X是非随机的,则假设2变成
E(i|X)=E(i)=0
(4)假设2的向量形式:
E(|X)=0
.
5
注意:
(1)本假设排除了解释变量间的多重共线性 (multicollinearity)
(2) 本假设意味着X’X是非奇异的,或者说X必须 满秩于k+1。因此应有k+1≤n。
第二章 回归分析与模型设定(高级计量经济学-清华大学 潘文清)

• 条件偏度 (The conditional skewness)
E[(Y E (Y | x)) 3 | x] S (Y | x) [Var(Y | x)]3 / 2
E[(Y E (Y | x)) 4 | x] K (Y | x) [Var(Y | x)]4 / 2
但我们往往只能得到样本数据。因此自然想到用 样本均值来估计总体均值, 并寻找样本回归函数 (SRF): mY|x=f(X) We hope the SRF is a good estimate of the PRF.
Y PRF SRF
X
A simple illustration: how to find the sample mean 表 2.1 是1960年美国1027个家庭关于收入与储蓄率 的联合频率分布. p(xi,yj) =the proportion of the 1027 families who reported the combination (X=xi and Y=yj).
Table 2.1 Joint frequency distribution of X=income and Y=saving rate
X Y 0.50 0.40 0.25 0.15 0.05 0.00 -0.05 -0.18 -0.25 p(x) 0.5 0.001 0.001 0.002 0.002 0.010 0.013 0.001 0.002 0.009 0.041 1.5 0.011 0.002 0.006 0.009 0.023 0.013 0.012 0.008 0.009 0.093 2.5 0.007 0.006 0.004 0.009 0.033 0.000 0.011 0.013 0.010 0.093 3.5 0.006 0.007 0.007 0.012 0.031 0.002 0.005 0.006 0.006 0.082 4.5 0.005 0.010 0.010 0.016 0.041 0.001 0.012 0.009 0.009 0.113 5.5 0.005 0.007 0.011 0.020 0.029 0.000 0.016 0.008 0.007 0.103 6.7 0.008 0.008 0.020 0.042 0.047 0.000 0.017 0.008 0.005 0.155 8.8 0.009 0.009 0.019 0.054 0.039 0.000 0.014 0.008 0.003 0.155 12.5 0.014 0.008 0.013 0.024 0.042 0.000 0.004 0.006 0.002 0.113 17.5 0.004 0.007 0.006 0.020 0.007 0.000 0.003 0.002 0.003 0.052
第五章 经典线性回归模型(II)(高级计量经济学-清华大学 潘文清)

如何解释j为“当其他变量保持不变,Xj变化一个 单位时Y的平均变化”?
本质上: j=E(Y|X)/Xj 即测度的是“边际效应”(marginal effect)
因此,当一个工资模型为 Y=0+1age+2age2+3education+4gender+ 时,只能测度“年龄”变化的边际效应: E(Y|X)/age=1+22age 解释:“当其他变量不变时,年龄变动1个单位时 工资的平均变化量” 2、弹性: 经济学中时常关心对弹性的测度。
X1’X1b1+X1’X2b2=X1’Y (*) X2’X1b1+X2’X2b2=X2’Y (**) 由(**)得 b2=(X2’X2)-1X2’Y-(X2’X2)-1X2’X1b1 代入(*)且整理得: X1’M2X1b1=X1’M2Y b1=(X1’M2X1)-1X1’M2Y=X1-1M2Y=b* 其中,M2=I-X2(X2’X2)-1X2’ 又 M2Y=M2X1b1+M2X2b2+M2e1 而 M2X2=0, M2e1=e1-X2(X2’X2)-1X2’e1=e1 则 M2Y=M2X1b1+e1 或 e1=M2Y-M2X1b1=e* 或
b1是1的无偏估计。
设正确的受约束模型(5.1.2)的估计结果为br,则有 br= b1+ Q1b2
或 b1=br-Q1b2 无论是否有2=0, 始终有Var(b1)Var(br) 多选无关变量问题:无偏,但方差变大,即是无效 的。变大的方差导致t检验值变小,容易拒绝本该纳 入模型的变量。
§5.2 多重共线性
1、估计量的方差 在离差形式的二元线性样本回归模型中: yi=b1x1i+b2x2i+e
《应用回归分析》第二版

x 图1. 2 y 与x 非确定性关系图
1 .2 回归方程与回归名称的由来
英国统计学家F.Galton(1822-1911年)。
F.Galton和他的学生、现代统计学的奠基者之一 K.Pearson(1856—1936年)在研究父母身高与其子女 身高的遗传问题时,观察了1 078对夫妇,
yˆ = 33.73 + 0.516x
yˆ = βˆ0 + βˆ1x
x
2 .2 参数β0、β1的估计
∑
∂Q
∂β0
β0
=
βˆ0
=
n
−2
i =1
( yi
− βˆ0
−
βˆ1xi )
=
0
∑ ∂Q
∂β1
β1
=
βˆ1
=
−2
n i =1
( yi
−
βˆ0
−
βˆ1xi )xi
=
0
经整理后,得正规方程组
∑ ∑ nβˆ0
n
+(
i =1
xi )βˆ1
2 .2 参数β0、β1的估计
一、普通最小二乘估计
(Ordinary Least Square Estimation,简记为OLSE)
最小二乘法就是寻找参数β0、β1的估计值使离差平方和达极小
∑n
Q ( βˆ0 , βˆ1 ) = ( y i − βˆ0 − βˆ1 xi ) 2
i =1
∑n
=
min
二、用统计软件计算 2. 例2.1用SPSS软件计算
Variables Entered/Removedb
2 .3 最小二乘估计的性质
三、βˆ0、βˆ1 的方差
【精品】清华大学课程《计量经济学》配套习题和答案

清华大学第一章《计量经济学》配套习题和答案第二章绪论(一)基本知识类题型1-1.什么是计量经济学?1-2.简述当代计量经济学发展的动向。
1-3.计量经济学方法与一般经济数学方法有什么区别?1-4.为什么说计量经济学是经济理论、数学和经济统计学的结合?试述三者之关系。
1-5.为什么说计量经济学是一门经济学科?它在经济学科体系中的作用和地位是什么?1-6.计量经济学的研究的对象和内容是什么?计量经济学模型研究的经济关系有哪两个基本特征?1-7.试结合一个具体经济问题说明建立与应用计量经济学模型的主要步骤。
1-8.建立计量经济学模型的基本思想是什么?1-9.计量经济学模型主要有哪些应用领域?各自的原理是什么?1-10.试分别举出五个时间序列数据和横截面数据,并说明时间序列数据和横截面数据有和异同?1-11.试解释单方程模型和联立方程模型的概念,并举例说明两者之间的联系与区别。
1-12.模型的检验包括几个方面?其具体含义是什么?1-13.常用的样本数据有哪些?1-14.计量经济模型中为何要包括随机误差项?简述随机误差项形成的原因。
1-15.估计量和估计值有何区别?哪些类型的关系式不存在估计问题? 1-16.经济数据在计量经济分析中的作用是什么?1-17.下列假想模型是否属于揭示因果关系的计量经济学模型?为什么?⑴S R t t =+1120012..其中S t 为第t 年农村居民储蓄增加额(亿元)、R t 为第t 年城镇居民可支配收入总额(亿元)。
⑵S R t t -=+144320030..其中S t -1为第(1-t )年底农村居民储蓄余额(亿元)、R t 为第t 年农村居民纯收入总额(亿元)。
1-18.指出下列假想模型中的错误,并说明理由:(1)RS RI IV t t t =-+83000024112... 其中,RS t 为第t 年社会消费品零售总额(亿元),RI t 为第t 年居民收入总额(亿元)(城镇居民可支配收入总额与农村居民纯收入总额之和),IV t 为第t 年全社会固定资产投资总额(亿元)。
第五章经典线性回归模型(II)(高级计量经济学清华大学潘文清)

X1’X1b1+X1’X2b2=X1’Y (*) X2’X1b1+X2’X2b2=X2’Y (**) 由(**)得 b2=(X2’X2)-1X2’Y-(X2’X2)-1X2’X1b1 代入(*)且整理得: X1’M2X1b1=X1’M2Y b1=(X1’M2X1)-1X1’M2Y=X1-1M2Y=b* 其中,M2=I-X2(X2’X2)-1X2’ 又 M2Y=M2X1b1+M2X2b2+M2e1 而 M2X2=0, M2e1=e1-X2(X2’X2)-1X2’e1=e1 则 M2Y=M2X1b1+e1 或 e1=M2Y-M2X1b1=e* 或
X2=X1Q1+(I-P1)X2 =explained part + residuals
其中,Q1=(X1’X1)-1X1’X2
对
X2=X1Q1+(I-P1)X2 =X1Q1+M1X2
=explained part + residuals
M1X2就是排除了X1的其他因素对X2的“净”影响。
X2对X1的回归称为辅助回归(aon: 如何测度X1对Y的“净”影响? 部分回归(Partial regression) Step 1: 排除X2的影响。 将Y对X2回归,得“残差”M2Y=[(I-X2(X2’X2)-1X2’]Y 将X1对X2回归,得“残差”M2X1=[(I-X2(X2’X2)1X ’]X 1 M 2Y为排除了 X 的净Y,M X 为排除了X 的净X
2 2 2 1 2
1
Step 2: 估计X1对Y的“净”影响。
将 M2Y对M2X1回归,得X1对Y的“净”影响:
M2Y=M2X1b*+e*
这里,b*=[(M2X1)’(M2X1)]-1(M2X1)’M2Y=X1-1M2Y e*=M2Y-M2X1b*
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Question: 受约束模型与无约束模型在X1前的参数 估计量相等吗? 记受约束模型(5.1.2)的OLS解为br=(X1’X1)-1X1’Y
则 Y=X1b1+X2b2+e1
且 X1’e1=0, X2’e1=0
于是 br=(X1’X1)-1X1’Y= (X1’X1)-1X1’[X1b1+X2b2+e1] =b1+ (X1’X1)-1X1’X2b2+ (X1’X1)-1X1’e1 =b1+ [(X1’X1)-1X1’X2]b2=b1+Q1b2 其中,Q1= (X1’X1)-1X1’X2 因此,当b2=0或X1与X2正交时,都有br=b1
第五章 经典线性回归模型(II)
Classical Linear Regression Model (II)
§5.1 回归模型的解释与比较 Interpreting and Comparing Regression Models
一、解释线性模型 interpreting the linear model 1、边际效应 对模型 Yi=0+1X1i+…+kXki+i
Question: 如何不遗漏相关变量,同时也不选择无关变量?
假设有如下两模型: Y=X11+X22+1 (5.1.1)
Y=X11+2
(5.1.2)
其中,(X1)nk1=(1,X1,,Xk1), (X2)n(k-k1)=(Xk1+1,,Xk)
1=(0,1,,k1)’, 2=(k1+1,,k)’
Question: 如何测度X1对Y的“净”影响? 部分回归(Partial regression) Step 1: 排除X2的影响。 将Y对X2回归,得“残差”M2Y=[(I-X2(X2’X2)-1X2’]Y 将X1对X2回归,得“残差”M2X1=[(I-X2(X2’X2)1X ’]X 1 M 2Y为排除了 X 的净Y,M X 为排除了X 的净X
这时模型常写为: lnYi=0+1lnX1i+…+klnXki+I 在E(i|lnX1i,lnX2i,,lnXki)=0的假设下,弹性为
[E(Y|X)/E(Y|X)]/[Xj/Xj]E(lnY|lnXj)/lnXj=k
当原始模型为
Yi=0+1X1i+…+kXki+i =j[Xj/(0+1X1+…+kXk)]
显然,(5.1.2)为(5.1.1)的受约束模型。
约束条件为:H0: 2=0
1、部分回归(partial regression) Question: 如何解释j为“当其他变量保持不变,Xj 变化一个单位时Y的平均变化”? 在X1与X2影响Y的同时,可 能存在着X1与X2间的相互影 响。如何测度? X2 将X2中的每一元素Xj (j=k1+1, , k)对X1回归: Y Xj=X1(X1’X1)-1X1’Xj+[Xj-X1(X1’X1)-1X1’Xj] 或 X2=X1(X1’X1)-1X1’X2+[X2-X1(X1’X1)-1X1’X2] X1
时,弹性为: [E(化而变化。 3、相对变化 如果模型为 则: lnYi=0+1X1i+…+kXki+i j=E(lnY|X)/Xj
解释为:Xj变化1个单位时Y的相对变化量。
二、选择解释变量 Select the Set of Regressors
如何解释j为“当其他变量保持不变,Xj变化一个 单位时Y的平均变化”?
本质上: j=E(Y|X)/Xj 即测度的是“边际效应”(marginal effect)
因此,当一个工资模型为 Y=0+1age+2age2+3education+4gender+ 时,只能测度“年龄”变化的边际效应: E(Y|X)/age=1+22age 解释:“当其他变量不变时,年龄变动1个单位时 工资的平均变化量” 2、弹性: 经济学中时常关心对弹性的测度。
2 2 2 1 2
1
Step 2: 估计X1对Y的“净”影响。
将 M2Y对M2X1回归,得X1对Y的“净”影响:
M2Y=M2X1b*+e*
这里,b*=[(M2X1)’(M2X1)]-1(M2X1)’M2Y=X1-1M2Y e*=M2Y-M2X1b*
Proof: b为原无约束回归模型的OLS解,则有 X’Xb=X’Y
2、遗漏相关变量(omitting variables)
Question: What happen if we omit relevant variable?
将无约束模型代入受约束模型(5.1.2)的OLS解 br=(X1’X1)-1X1’Y ,可得
br=(X1’X1)-1X1’(X11+X22+1)
X1’X1b1+X1’X2b2=X1’Y (*) X2’X1b1+X2’X2b2=X2’Y (**) 由(**)得 b2=(X2’X2)-1X2’Y-(X2’X2)-1X2’X1b1 代入(*)且整理得: X1’M2X1b1=X1’M2Y b1=(X1’M2X1)-1X1’M2Y=X1-1M2Y=b* 其中,M2=I-X2(X2’X2)-1X2’ 又 M2Y=M2X1b1+M2X2b2+M2e1 而 M2X2=0, M2e1=e1-X2(X2’X2)-1X2’e1=e1 则 M2Y=M2X1b1+e1 或 e1=M2Y-M2X1b1=e* 或
=1+(X1’X1)-1X1’X22+ (X1’X1)-1X1’1
于是: E(br|X1)=1+Q12+ (X1’X1)-1X1’E(1|X1) =1+Q12 因此,只有当2=0或X1与X2正交时,才有E(br|X1)=1
X2=X1Q1+(I-P1)X2 =explained part + residuals
其中,Q1=(X1’X1)-1X1’X2
对
X2=X1Q1+(I-P1)X2 =X1Q1+M1X2
=explained part + residuals
M1X2就是排除了X1的其他因素对X2的“净”影响。
X2对X1的回归称为辅助回归(auxiliary regression)