李子奈计量经济学课堂笔记

李子奈计量经济学课堂笔记
李子奈计量经济学课堂笔记

计量经济学模型的各种检验

经济意义检验:检验求得的经济模型的参数估计值的符号和大小是否符合经验和经济理论。统计检验:检验参数估计值的可靠性,包括拟合优度检验、回归效果的检验。拟合优度检验反映了解释变量的变化可以解释被解释变量R^2%的变动;回归效果的检验主要检验方程显著性、解释变量是否对被解释变量具有显著性影响。

计量经济学检验:包括随机干扰项的异方差性、序列相关性,解释变量的多重共线性,模型设定的偏误性检验。

模型的预测检验:检验模型参数估计量的稳定性及其在样本量变化时的灵敏度。

一元线性回归模型

普通最小二乘估计(ordinary least squares,OLS):使用OLS方法需要满足的假设有:对于随机干扰项,零均值、同方差、无序列相关性、服从正态分布;对于解释变量,应具有非随机性、如果是随机的不能与随机干扰项相关、各解释变量间不存在线性相关性。

最大似然估计=最大或然估计(maximum likelihood,ML)

拟合优度检验:检验模型对样本观测值的拟合程度,其统计量是可决系数R2,R2直接由回归结果给出。但是R2只是比较模糊的推测,不能给出严格的统计结论。

变量的显著性检验:考察解释变量是否对被解释变量有显著的线性影响,假设参数为0。使用t统计量检验,可以直接依据回归结果给出的P值判断(P<α时显著)。在一元回归中,变量的显著性检验与方程总体线性的显著性检验一致,因为只有一个解释变量。

参数的置信区间:Eviews5中,函数C(1)返回系数参数的估计值,C(2)返回截距参数的估计值,分别等于Eviews5输出结果中的Coefficient。置信度95%的置信区间的上下限为C(i)±@stderrs(i)*@qtdist(0.975, n-2)(i=1,2),其中@stderrs(i)(standard errors)为第i 个解释变量的标准误差,等于Eviews5输出结果中的Std. Error;@stderrs(i)*@qtdist(0.975, n-2)(i=1,2)为估计误差。

参数置信区间Eviews5操作:把置信区间保存为矩阵,建一个2行3列的矩阵,步骤:(1)使用matrix(2,3) para_conf_intval,创建一个存放置信区间的2行3列的矩阵(2)打开回归方程,使用scalar tinv=@qtdist(0.975, @regobs-2)创建并保存t分布临界值的标量tinv,因为下面的方法禁止使用二维数组形式的括号,所以上式无法合并到下式(3)打开回归方程,使用para_conf_intval.fill 1,2,C(1)-@stderrs(1)*tinv,C(2)-@stderrs(2)*tinv,C(1)+@stderrs(1)*

tinv,C(2)+@stderrs(2)* tinv,按先列后行的顺序填充矩阵。矩阵中的结果即为参数的置信区间,形式为(第几个参数,估计值下限,估计值上限),其中参数显示的顺序与回归结果中的变量顺序一致。

均值或个别值的估计值或预测值Eviews5操作:(1)使用scalar X0=解释变量的新观测值,将自变量的取值存放到标量X0中(2)由Y0=C(2)+C(1)*X0(X0为解释变量的取值),打开回归方程,使用scalar forecast_value=C(1)+C(2)*X0(注意:C(1)为截距系数),将Y0预测值存放到标量forecast_value中。

均值预测值的置信区间=预测值±均值预测值的估计误差,均值预测值的估计误差=t临界值×均值预测值的估计误差,均值预测值的估计误差=残差标准误差×sqrt(1/n+X0的离差方/X 的总离差方和)。Eviews5中的均值预测值95%置信区间公式为:Y0±@qtdist(0.975, n-2)×@se×@sqrt(1/n+(X0-@mean(X))^2/(n×@var(X))),其中,X0为解释变量X的样本观测值;函数@se返回残差标准误差(也称回归标准误差或随机干扰项标准差,其值等于Eviews5结果中的S.E. of regression,即σ2的估计值);(X0-@mean(X)) 2是X0的离差方;n×@var(X)返回X的总离差方和。

此问题必须在方程被显示的情况下进行。

均值预测值置信区间Eviews5操作:把均值预测值的置信区间保存为矩阵,建一个1行2列的矩阵,步骤:(1)使用matrix(1,2) mean_forecast_intval,创建一个存放置信区间

的2行3列的矩阵(2)打开回归方程,使用mean_forecast_intval.fill

forecast_value-tinv*@se*@sqrt(1/@regobs+(X0-@mean(X))^2/(@regobs*@var(X))), forecast_value+tinv*@se*@sqrt(1/@regobs+(X0-@mean(X))^2/(@regobs*@var(X))),按先列后行的顺序填充矩阵。矩阵中的结果即为参数的置信区间,形式为(第几个参数,估计值下限,估计值上限),其中参数显示的顺序与回归结果中的变量顺序一致。

个别值预测值的置信区间=预测值±个别值预测值的估计误差,个别值预测值的估计误差=t临界值×个别值预测值的估计误差,个别值预测值的估计误差=残差标准误差×sqrt(1+1/n+X0的离差方/X的总离差方和)。Eviews5中的个别值预测值95%置信区间公式为:Y0±

@qtdist(0.975, n-2)×@se×@sqrt(1+1/n+(X0-@mean(X))^2/(n×@var(X))) (注意:sqrt中要加1)。其中,X0为解释变量X的新观测值;函数@se返回残差标准误差(也称回归标准误差,其值等于Eviews5结果中的S.E. of regression);(X0-@mean(X)) 2是X0的离差方;n×@var(X)返回X的总离差方和。

此问题必须在方程被显示的情况下进行。

个值预测值置信区间Eviews5操作:把个别值预测值的置信区间保存为矩阵,建一个1行2列的矩阵,步骤:(1)使用matrix(1,2) single_forecast_intval,创建一个存放置信区间的2行3列的矩阵(2)打开回归方程,使用single_forecast_intval.fill

forecast_value-tinv*@se*@sqrt(1+1/@regobs+(X0-@mean(X))^2/(@regobs*@var(X)) ),

forecast_value+tinv*@se*@sqrt(1+1/@regobs+(X0-@mean(X))^2/(@regobs*@var(X) )),按先列后行的顺序填充矩阵。矩阵中的结果即为参数的置信区间,形式为(第几个参数,估计值下限,估计值上限),其中参数显示的顺序与回归结果中的变量顺序一致。

多元线性回归模型

矩估计(moment method,MM)

工具变量方法(intstrumental variables,IV)

广义矩估计法(generalized moment method,GMM)

拟合优度检验:统计量是可决系数R2,常使用调整的可决系数(Adjusted R-squared)。赤池信息准则(Akaike information criterion,AIC):用于比较所含解释变量个数不同的多元回归的拟合优度。如果增加变量后使得AIC减少,说明该增加的变量具有解释能力,则在模型中增加该解释变量。AIC由Eviews5直接输出。

施瓦茨准则(Schwarz criterion,SC):用于比较所含解释变量个数不同的多元回归的拟合优度。如果增加变量后使得SC减少,说明该增加的变量具有解释能力,则在模型中增加该解释变量。SC由Eviews5直接输出。

方程总体线性显著性检验:简称方程显著性检验,假设方程总体不呈线性。使用F统计量

(F-statistic)检验,可以直接依据回归结果给出的P值(Prob(F-statistic))判断(P<α时显著)。

变量的显著性检验:考察解释变量是否对被解释变量有显著的线性影响,以决定相应的解释变量能否被保留在模型中,当某解释变量的影响不显著时,应当将该变量从模型中剔除。假设参数为0。使用t统计量(t-Statistic)检验,可以直接依据回归结果给出的P值判断(P<α时显著)。

参数的置信区间:Eviews5中,使用函数C(i)获得第i个参数的估计值(i=1,2,…,k+1),等于Eviews5输出结果中的Coefficient,C(k+1)为截距的估计值,k为解释变量的个数,不含常数项,k+1为参数的个数。置信度95%的置信区间的上下限等于C(i)±@stderrs(i)×

@qtdist(0.975, n-k)(i=1,2,…,k+1),其中@stderrs(i)(standard errors)为第i个解释变量或截距的标准误差,等于Eviews5输出结果中的Std. Error;@stderrs(i)×

@qtdist(0.975,n-k)为估计误差。

参数的置信区间Eviews5操作:把置信区间保存为矩阵,建一个k行3列的矩阵,步骤:

(1)打开回归方程,使用scalar n=@regobs将样本容量存放到标量n中(2)使用scalar k=@ncoef将参数个数存放到标量k中(3)使用scalar tinv=@qtdist(0.975, n-k)创建并保存t分布临界值的标量tinv,因为下面的方法禁止使用二维数组形式的括号(4)使用matrix(k,3) para_conf_intval,创建一个存放置信区间的k行3列的矩阵(5)回归方程具有3个参数时,可使用para_conf_intval.fill

1,2,3,C(1)-@stderrs(1)*tinv,C(2)-@stderrs(2)*tinv,C(3)-@stderrs(3)*tinv,C(1)+@stde rrs(1)*tinv,C(2)+@stderrs(2)*tinv,C(3)+@stderrs(3)*tinv,按先列后行的顺序填充矩阵。矩阵中的结果即为参数的置信区间,形式为(第几个参数,估计值下限,估计值上限),其中参数显示的顺序与回归结果中的变量顺序一致。

均值或个别值的估计值或预测值:由Y0=C(k+1)+C(1)×X10+C(2)×X20+…C(k)×Xk0,其中,X10,X20,…,X k0为解释变量X1,X2,…,X k的观测值;C(k+1)为常数项;k为解释变量的个数,不含常数项,故参数个数为k+1。

均值与个值的估计值Eviews5操作:(1)使用scalar x10=X1的观测值,scalar

x20=X2的观测值…scalar xk0=Xk的观测值,将k个解释变量的观测值存放到标量中(2)使用matrix forecast_value=C(1)+C(2)*X10+C(3)*X20+…+C(k)*Xm0(注意:k=@ncoef 为参数个数,m=k-1),将预测值Y0存放到矩阵forecast_value中。

均值预测值的置信区间:多元回归的置信区间较麻烦,需使用矩阵。

均值的置信区间Eviews5操作:(1)使用命令:group gx 1 x1 x2 …(注意:只用空格间隔,开头没有等号,1为常数列向量,X1,X2为两个解释变量序列),将常数项和解释变量的列向量合并为n行k列的组(不是矩阵,此处的k是参数个数)(2):使用命令:stom(gx, x)将组gx转化为矩阵X(3)使用命令:matrix(1, k) x0(此处的

k=@ncoef是参数个数)创建一个1行k列的矩阵x0,表示新的观测值矩阵(4)使用命令:x0.fill 1, X10, X20,…(注意有逗号,有常数项列向量1,X k0表示第k个解释变量的观测值)把样本观测值X0用行向量矩阵表示为(1X10X20…)(5)使用matrix(1,2) mean_conf_intval,创建一个1行2列的0矩阵(6)使用colplace(mean_conf_intval,

forecast_value-tinv*@se*@sqrt(X0*@inverse(@transpose(X)*X)*@transpose(X0)),1)(注意:forecast_value是矩阵,不是上面的预测值)。将均值预测值置信度95%的置信区间的下限写入矩阵mean_conf_intval入的第1个单元格(7)使用colplace(mean_conf_intval, forecast_value+tinv*@se*@sqrt(X0*@inverse(@transpose(X)*X)*@transpose(X0)),2)(注意:forecast_value是矩阵,不是上面的预测值;最后一个逗号可能会出问题)。将均值预测值置信度95%的置信区间的上限写入矩阵mean_conf_intval入的第2个单元格。

个别值预测值的置信区间:多元回归的置信区间较麻烦,需使用矩阵。

个值的置信区间Eviews5操作:(1)使用matrix(1,2) single_conf_intval,创建一个1行2列的0矩阵(2)使用matrix one=1创建一个1行1列的单位矩阵(3)使用

colplace(single_conf_intval,

forecast_value-tinv*@se*@sqrt(one+X0*@inverse(@transpose(X)*X)*@transpose(X 0)),1)(注意:forecast_value是矩阵,不是上面的预测值;one不能改为1)。将均值预测值置信度95%的置信区间的下限写入矩阵mean_conf_intval入的第1个单元格(4)使用colplace(single_conf_intval,

forecast_value+tinv*@se*@sqrt(one+X0*@inverse(@transpose(X)*X)*@transpose(X 0)),2)(注意:forecast_value是矩阵,不是上面的预测值)。将均值预测值置信度95%的置信区间的上限写入矩阵mean_conf_intval入的第2个单元格。

可化为线性的多元非线性回归模型

倒数模型:1/Q=a+b/P+μ,用Y=1/Q,X=1/P置换,得到Y=a+bX+μ

多项式模型:s=a+br+cr2+μ,用X1=r,X2=r2置换,得到Y=a+bX1+cX2+μ

幂函数模型:Q=AKαLβeμ,取对数后,lnQ=lnA+α lnK+βlnL+μ,Q=f(X1,X2,…,

X k)的幂函数形式为Q=AX1β1X2β2…X kβk,注意使用全体样本取对数。

无约束回归模型:Q=AXβ1P1β2P0β3,取对数后lnQ=β0+β1lnX+β2lnP1+β3lnP0+μ,其中β0=lnA,然后进行多元线性回归。注意使用全体样本取对数。

有约束回归模型:Q=AXβ1P1β2 P0β3,s.t.β1+β2+β3=0,取对数后同上,将β3换做-β1-β2,得到lnQ=β0+β1ln(X/ P0)+β2ln(P1/ P0)+ μ。施加的约束为真的受约束回归模型与无约束回归模型具有相同的解释能力,但约束是否为真需要进行检验。

线性约束检验:即线性约束的零阶齐次性假设检验,假设方程受线性约束。如对模型URR:Y=β0+β1X1+β2X2+…+βk X k+μ,施加β1+β2=1,βk-1=βk的约束变为RR模型:

Y=β0+β1X1+(1-β1)X2+…+βk-1X k-1+βk X k+μ(样本量未变)。检验约束条件β1+β2=1,βk-1=βk 是否为真的统计量为F=((RSS R-RSSu)/(ku-k R))/(RSS U/(n-ku-1))~F(ku-k R,n-ku-1),其中,RSS R为有约束条件(Restrict)的残差平方和,RSS U为无约束回归模型(Unrestrict)的残差平方和,k R为有约束回归模型中的解释变量的个数,k U为无约束回归模型中的解释变量的个数,不含常数项,k U-k R为约束条件的个数,n为受约束模型的样本量。如果RSS R-RSS U值较大,则F较大,说明约束条件无效。计算置信度为95%的F临界值的公式是

@qfdist(0.95,1,10)。

线性约束检验稍复杂的Eviews5操作:注意样本量不变,实质的解释变量个数不变。(1)进行无约束回归,求scalar n=@regobs,scalar rssu=@ssr,scalar ku=@ncoef-1;

(2)按零阶齐次性表达式进行有约束回归,求scalar rssr=@ssr,scalar kr=@ncoef-1;

(3)计算F统计量scalar linear_restrict_F_stat=((rssr-rssu)/(ku-kr))/(rssu/(n-ku-1));(4)使用scalar linear_restrict_P_val=1-@cfdist(linear_restrict_F_stat, ku-kr,

rssu/(n-ku-1))求P值;(5)如果linear_restrict_P_val>0.05,不能拒绝约束不成立的假设,即不能拒绝解释变量不具有零阶齐次特性,亦即不能拒绝线性约束成立。

线性约束检验Eviews5菜单操作:进行无约束回归—view—Coefficient Tests—

Wald-Coefficient Restrictions—输入约束条件—根据结果中的F统计量值对应的P值判定,若P>0.05则不能拒绝约束成立的假设。

解释变量取舍:属于线性约束问题。假设变量没有解释能力。如在模型RR:Y=β0+β1X1+β2X2+…+βk X k+μ中添加变量后变成模型URR:Y=β0+β1X1+β1X2+…+βk X k+βk+1X k+1+…+βk+p X k+p+μ,RR即是在URR中施加了βk+1=βk+2=…=βk+p=0的(线性)约束条件(解释变量变化,但样本量未变)。检验约束条件βk+1=βk+2=…=βk+p=0是否为真的统计量为F=((RSS R-RSS U)/(k U-k R))/(RSS U/(n-k-k U+k R-1))~F(k U-k R,n-k-k U+k R-1),一般使用其等价式:F=((R2u-R2R)/(k u-k R))/(R2u/(n-k-k u+k R-1))~F(k u-k R,n-k u-1),其中,R2u为无约束回归模型的可决系数,R2R为有约束回归模型的可决系数,k U为无约束回归模型中的解释变量的个数,k R为有约束回归模型中的解释变量的个数,n为受约束模型的样本量。如果F计算值比临界值大,说明约束条件无效,即添加的解释变量有解释能力,或者说P<0.05,增加解释变量才是合适的。

解释变量取舍Eviews5操作:注意样本量不变,解释变量个数有变化。(1)进行解释变量个数较少的有约束回归,求scalar n=@regobs,scalar rr_square=@r2,scalar kr=@ncoef-1;(2)进行解释变量个数较多的无约束回归,求scalar ru_square=@r2,scalar ku=@ncoef-1;(3)根据统计量F=((R2u-R2R)/(ku-k R))/(1-R2u/(n-ku-1)),计算F统计量scalar

add_x_F_stat=((ru_square-rr_square)/(ku-kr))/((1-ru_square)/(n-ku-1 ));(4)scalar add_x_P_val=1-@cfdist(add_x_F_stat, ku-kr, n-ku-1)计算P值;

(5)如果add_x_P_val<0.05,说明新增的解释变量需要引入模型。

线性约束中的(邹氏)参数的稳定性检验(Chow test for parameter stablity):在使用不同样本量的连续的序列(无重合的多期)中,如果结构发生变化,会导致参数不稳定,从而模型的预测能力会下降。假设参数稳定。无约束模型URR:前期Y=β0+β1X1+β2X2+…+βk X k+μ1

及后期Y=α0+α1X1+α2X2+…+αk X k+μ2。如果序列结构没有发生变化,则β=α(矩阵式),故受约束模型RR:前期Y=β0+β1X1+β2X2+…+βk X k+μ1及后期Y=β0+β1X1+β2X2+…+βk X k+μ2。检验β=α是否为真的统计量为F=((RSS R-RSS U)/(k+1))/(RSS U/(n1+n2-2(k+1)))~F(k+1,n1+n2-2(k+1)),常用其等价式:F=((RSS R-(RSS1+RSS2))/(k+1))/((RSS1+RSS2)/(n1+n2-2(k+1)))~F(k+1,n1+n2-2(k+1))。线性约束中的邹氏参数的稳定性检验稍麻烦的Eviews5操作:注意样本量有变化,解释变量个数不变。(1)使用前期小样本进行无约束回归,求scalar n1=@regobs,scalar rss1=@ssr,scalar k=@ncoef-1;(2)使用后期小样本进行无约束回归,scalar n2=@regobs,scalar rss2=@ssr;(3)使用假设前后期参数一致的合并大样本进行有约束回归,scalar rssr_all=@ssr;(4)计算F统计量scalar chow_para_stabl_F_stat=((rssr_all-rss1-rss2)/(k+1))/((rss1+rss2)/(n1+n2-2*(k+1)));

(5)scalar chow_para_stabl_P_val=1-@cfdist(chow_para_stabl_F_stat,k+1, n1+n2-2*(k+1)),计算P值;(6)如果chow_para_stabl_P_val<0.05,说明参数不稳定,或者说序列结构发生显著变化。

线性约束中的邹氏参数的稳定性检验Eviews5菜单操作:进行大样本回归,得到回归方程;单击View-Stability Tests-Chow Breakpoint Test,输入断点时间(即拐点时间,它是后期的开始年份,可从时间-因变量线图上观察拐点。为了防止不准确,可以使用较麻烦的方法)。结果中给出了邹氏参数稳定性检验的F统计量和对应的P值,可直接利用P值进行检验。邹氏参数稳定性检验要求n2>k,即后期样本量不小于参数个数。

线性约束中的邹氏预测检验(Chow test for predictive failure):其思想是用第一时间段的估计参数对第二时间段的样本进行预测,若预测误差较大,说明参数发生了变化。假设参数稳定。假设参数不同的无约束模型(向量形式)URR:前期Y1=X1β+μ1及后期Y2=X2α+μ2=X2α+X2β-X2β+μ2=X2β+γ+μ2(记γ=X2(α-β)),如果序列结构没有发生变化,即β=α,则假设参数不变的受约束模型RR:前期Y1=X1β+μ1及后期Y2=X2β+μ2。检验β=α是否为真的统计量为F=((RSS R-RSS U)/n2)/(RSS U/(n1-k-1)))~F(k+1,n1+n2-2(k+1))。

线性约束中的邹氏预测检验稍麻烦的Eviews5操作:注意样本量有变化,解释变量个数不变。

(1)使用前期小样本进行无约束回归,求scalar n1=@regobs,scalar rss1=@ssr;(2)使用前后期参数一致的合并大样本进行有约束回归,scalar rssr_all=@ssr;(3)计算F统计量scalar chow_predict_F_stat=((rssr_all-rss1)/n2)/(rss1/(n1-k-1))(可手工录入后期样本量n2);(4)scalar chow_predict_P_val=1-@cfdist(chow_predict_F_stat,n2,n1-k-1),计算P值;(5)如果chow_predict_P_val<0.05,说明参数不稳定,或者说序列结构发生显著变化。

线性约束中的邹氏预测检验Eviews5菜单操作:进行大样本回归,得到回归方程;单击View-Stability Tests-Chow Forecastt Test,输入断点时间(即拐点时间,它是后期的开始年份,可从时间-因变量线图上观察拐点。为了防止不准确,可以使用较麻烦的方法)。结果中给出了邹氏预测检验的F统计量、对应的P值以及前期样本的最小二乘回归结果,可直接利用P值进行检验。邹氏预测检验不要求n2。

非线性约束:假设方程受到约束。如对模型URR:Y=β0+β1X1+β2X2+…+βk X k+μ,施加β1*β2=1的非线性约束变为RR模型:Y=β0+β1X1+(1/β1)X2+…+βk-1X k-1 +βk X k+μ(样本量未变)。非线性约束必须使用非线性最小二乘法(nonlinear least squares),包括最大似然比检验(likelihood ratio test,LR)、沃尔德检验(Wald test,WD)、拉格朗日乘数检验(Largrange multiplier test,LM)。这些方法也适用于线性约束。

约束中的最大似然比检验(LR):似然函数为L(β,σ2),似然比为L(βR,σ2R)/L(βu,σ2u)。在大样本条件下,检验的统计量为LR=-2(lnL(βR,σ2R)-lnL(βu,σ2u))~χ2(h),其中h为约束条件的个数,等于ku-kr。

约束中的最大似然比检验Eviews5操作:(1)作有约束回归,使用scalar log_like_r=@logl,求有约束回归的对数似然函数值;使用scalar kr=@ncoef-1求有约束解释变量个数;(2)作无约束回归,使用scalar log_like_u=@logl,求无约束回归的对数似然函数值;使用scalar ku=@ncoef-1求无约束解释变量个数;(3)使用scalar like_ratio_chisq_stat=2*(log_like_u-log_like_r),求最大似然比对应的卡方值;(4)使用scalar like_ratio_chisq_p_val=1-@cchisq(like_ratio_chisq_stat,ku-kr)计算P值;(5)如果like_ratio_chisq_p_val>0.05,则不能拒绝约束成立。

放宽基本假定的模型

计量经济学模型基本假定违背:随机干扰项序列存在异方差性、随机干扰项序列存在序列相关性、解释变量之间存在多重共线性、解释变量是随机变量且与随机干扰项相关、模型设定有偏误、解释变量的方差随样本容量的增加而增加。使用OLS方法进行回归时,不能有对基本假定的违背,即不能出现上述情况之一。

计量经济学检验:对回归模型是否满足OLS的基本假定进行检验。

异方差性

异方差性(Heteroskedasticity):总体中每个样本单位的随机干扰项的方差不相同。异方差意味着未进入模型的随机干扰项的误差会随着解释变量的变化而变化;异方差存在时;因变量取值的差异会随解释变量的不同而比较大,导致样本整体看来缺乏规律性。截面数据常存在异方差性。一般使用加权最小二乘法进行修正。

图示异方差检验:观察是否存在明显的散点扩大或缩小或复杂趋势即不在一个带状区域的Y-X散点图,或观察是否是一条水平直线的残差平方-X的散点图进行检验。

Park(帕克)检验和Gleiser(戈里瑟)检验:假设回归模型不存在异方差性。基本思想是,以残差绝对值或残差平方为被解释变量,某一解释变量X j为解释变量,进行回归,对回归方程进行显著性检验,若检验显著,则存在异方差性。

Park检验:假设回归模型不存在异方差性。(1)使用OLS方法建立回归方程,用series resid_ols=resid保存残差序列;(2)使用ls log(resid_ols^2) c log(x)求回归方程,若回归方程的检验与参数检验均显著,则存在异方差性。

Gleiser检验:假设回归模型不存在异方差性。选择X不同的函数形式,以| resid |为被解释变量,使用OLS方法依次建立回归方程,用ls abs(resid_ols) c x,ls abs(resid_ols) c @sqrt(x),ls abs(resid_ols) c 1/x,若某个回归方程的检验与参数检验均显著,则存在异方差性;有的方程检验也许不能拒绝同方差性。

GQ(Goldfeld-Quandt=戈德菲尔德-匡特)检验:假设回归模型不存在异方差性。(1)使用OLS 方法建立回归方程,用scalar n=@regobs保存总样本量,scalar k=@ncoef-1保存解释变量个数,使用series resid_ols=resid保存残差序列。找出最大的系数对应的解释变量,它是差异的主要来源,可能是引起异方差的主要因素;(2)使用sort(d) 主要解释变量,对所有序列降序排序(默认升序);(3)打开回归方程,使用scalar n_sub=@ceiling(3*n/8)计算子样本容量(n是样本总量,ceiling为上取整函数);(4)对排序后数据较大的子样本进行回归(Quick-Estimate Equation,在Sample文本框中输入1 n_sub的值),并求残差平方和scalar RSS1=@ssr;(5)使用sort 主要解释变量,对所有序列升序排序,对排序后数据较小的子样本进行回归(Quick-Estimate Equation,在Sample文本框中输入1n_sub的值),并求残差平方和scalar RSS2=@ssr;(6)利用两个子样的残差平方和之比构造统计量F=RSS1/RSS2~F(n_sub-k-1,n_sub-k-1)(k是解释变量个数)并进行异方差检验:使用scalar G_Q_F_stat=RSS1/RSS2计算F统计量,使用scalar G_Q_P_val=1-@cfdist(g_q_f_stat,n_sub-k-1,n_sub-k-1)计算F统计量的P值;(7)如果G_Q_P_val<0.05,则说明总体随机干扰项存在异方差。

White检验:假设回归模型不存在异方差性。无需排序,使用样本总量进行含交叉项辅助回归(即以残差平方和为被解释变量,各原解释变量的一次幂项、二次幂项、两变量的交叉乘积

项为解释变量),根据辅助回归的结果,nR2~χ2(k),其中n为样本容量,R2为辅助回归的可决系数,k为解释变量的个数,不含常数项。(1)含交叉项的White检验:其思想是先作含交叉项的辅助回归,即使用(各项)残差平方resid_square(因变量)、X i、X i2及交叉项X i*X j(或resid_square、lnX i、(lnX i)^2、lnX i*lnX j)进行回归,回归的结果使用怀特检验,统计量为辅助回归的结果中的Obs*R-squared~χ2(k),根据其对应的P值判断随机干扰项是否存在异方差。Eviews5菜单操作:选取原变量为Y、Xi(或lnY、lnXi)作OLS回归—view—ResidualTests—White Heteroskedasticity(cross terms)—LM=Obs*R-squared即为怀特统计量~χ2(k),其后即为对应的P值,若P<0.05,说明总体随机干扰项存在异方差;含交叉项怀特检验结果中还给出了辅助回归结果;(2)不含交叉项的White检验:其思想是先作去掉交叉项的辅助回归(样本量为总样本量),即使用(各项)残差平方resid_square(因变量)、X i、X i2(或resid_square、lnX i、(lnX i)^2)进行回归,回归的结果使用怀特检验,统计量为Obs*R-squared~χ2(k),根据其对应的P值,可判断总体随机干扰项是否存在异方差。Eviews5菜单操作:选取原变量为Y、Xi(或lnY、lnXi)作OLS回归—view—Residual Tests—White Heteroskedasticity(no cross terms)—LM=Obs*R-squared即为怀特统计量~χ2(k),其后即为对应的P值,若P<0.05,说明总体随机干扰项存在异方差;含交叉项怀特检验结果中还给出了辅助回归结果。通常直接使用不含交叉项的White检验。

加权最小二乘法(Weighted least squares,WLS):使用权数对原回归模型进行调整,通常选取1/abs(resid)、1/resid^2、1/@sqrt(resid)为权数。Eviews5菜单操作:使用总样本量进行OLS回归,使用series resid_ols=resid保存残差序列,并使用series resid_square=resid_ols^2求残差序列的平方;可以1/|resid|为权数,使用series weight=1/@abs(resid_ols)保存权数序列—Quick—Estimate Equation—options—输入序列weight。

异方差修正:(1)输入原始数据为序列;(2)写出经济学模型;(3)使用OLS方法对所有数据或数据的对数形式进行回归,用scalar n=@regobs求总样本量,scalar k=@ncoef-1求解释变量个数,由于下面的部分样本回归会影响resid序列,使用series resid_ols=resid保存残差序列;(4)找出最大的系数对应的解释变量,它是差异的主要来源,可能是引起异方差的主要因素,画出最大系数对应的解释变量与残差平方的散点图,大致观察异方差的特征;(5)进行G-Q检验;(6)进行White检验;(7)进行加权最小二乘法回归;(8)可再进行White异方差检验,若对应的P>0.05,则说明已不存在异方差性。在实际使用中,通常不进行异方差检验,而是直接选择加权最小二乘法。若确实存在异方差性,则会被消除;若不存在,则等价于最小二乘法。

序列相关性

序列相关性(Serial Correlation):随机干扰项不相互独立,总体中每个样本单位的随机干扰项相关。如果一样本单位只与上一个样本单位相关,称为一阶序列相关或自相关,其形式为μi=ρμi-1+εi。很多情况下,时间序列数据中解释变量以外的因素在时间上存在连续性,带来对被解释变量的影响的连续性,从而导致序列相关性。未进入回归模型的随机干扰因素受到历史的影响使不考虑历史影响的回归误差加大。时间序列数据常存在序列相关性。常使用广义最小二乘法、广义差分法修正。

图示序列相关性检验:观察残差与时间的散点图,或观察本期残差和上期残差的散点图。

回归检验法:假设回归模型不存在序列相关性。使用e t=ρe t-1+εt、e t=ρ1e t-1+ρ2e t-2+εt…一个一个的建立方程,并分别进行检验。如果某个函数形式存在,则原模型存在序列相关性。DW=杜宾-瓦森(Durbin-Watson)检验:假设不存在一阶自回归。只能检验一阶自相关,不能使用滞后被解释变量。根据样本量n、参数个数k查DW上下界表,若DW∈(0,d l),则存在正相关;若DW∈(4-d u,4-d l),则存在负相关;若DW∈(d u,4-d u),则无自相关;若DW∈( d l,d u),则不能确定。若DW不能判定,可借助LM判定。一般,DW在2附近时不存在序列相关性,偏离2越远,序列相关性越严重。

拉格朗日乘数(Lagrange multiplier,LM)检验:也称Breusch-Godfrey检验或GB检验。假设回归模型不存在序列相关性。用于检验高阶序列相关,以及存在滞后被解释变量的情形。作OLS回归—view—Residual Tests—Serial Correlation LM Test—输入滞后期:Lags —Obs*R-squared即为拉格朗日乘数,输出结果中Obs为样本容量,R-squared为辅助回归的可决系数,p为滞后期数。根据对应的P值,若P<0.05,则说明存在直到p阶的序列相关性。在实际检验中,从1阶、2阶…逐步向更高阶检验,并使用辅助回归的参数显著性检验判断序列相关的阶数。

广义差分法(generalized difference method):属于广义最小二乘法(generalized least squares,GLS)。若原模型存在p阶序列相关,则有μt=ρ1μt-1+ρ2μt-2+…+ρpμt-p+εt,原模

型可变换为广义差分模型:Y t-ρ

1Y t

-1

-…-ρp Y t-p=β0(1-ρ1-…-ρp)+β1(X1t-ρ1X1t-1-…

-ρp X1t-p)+…+βk(X kt-ρ1X kt-1-…-ρp X kt-p)+εt。广义差分法会损失部分样本观测值。常用的广义差分法有科克伦-奥科特(Cochrane-Orcutt)迭代法和杜宾两步法。科克伦-奥科特(Cochrane-Orcutt)迭代法:也称广义最小二乘法。杜宾两步法:假设不存在p阶自相关。对p阶差分模型稍作变化为Y t=ρ1Y t-1-…-ρp Y t-p+β0(1-ρ1-…-ρp)+β1(X1t-ρ1X1t-1-…-ρp X1t-p)+…+βk(X kt-ρ1X kt-1-…-ρp X kt-p)+εt,然后对差分模型进行OLS估计。

2阶自相关广义最小二乘(科克伦-奥科特=Cochrane-Orcutt迭代)法Eviews5操作:(1)构造2阶广义差分估计方程为ls Y c X AR(1) AR(2)(AR(m)为随机干扰项的p阶自回归,AR(m)前的系数即为序列相关系数),将方程保存为cochrane;(2)对回归方程cochrane 进行DW检验:根据方程的调整样本量n、参数个数k(不包括AR项)查DW上下界表,若DW∈(0,d l),则存在正相关;若DW∈(4-d u,4-d l),则存在负相关;若DW∈(d u,4-d u),则无自相关;若DW∈( d l,d u),则不能确定;(3)若DW不能判定,可借助LM判定:view —Residual Tests—Serial Correlation LM Test—输入滞后期:Lags—Obs*R-squared,若对应的P>0.05,则不存在自相关性;(4)写出Y=cochrane.c(1)+cochrane.c(2)*X+cochrane.c(3)*AR(1)即为最终要估计的原回归模型。2阶自相关杜宾两步法Eviews5操作:(1)使用ls Y c Y(-1) Y(-2) X X(-1) X(-2)(或对数形式)进行OLS估计,并将方程保存为Durbin1,Y(-t)前的系数即为相关系数ρ;(2)使用series Y0=Y-Durbin1.@coef(2)*Y(-1)-Durbin1.@coef(3)*Y(-2)(c为第一个参数)对被解释变量作差分变换;使用series X0=X-durbin1.@coef(2)*X(-1)-durbin1.@coef(3)*X(-2)对解释变量作差分变换;(3)使用差分变换结果重新进行OLS估计:ls Y0 c X0,并将方程保存为Durbin2,对方程Durbin2进行DW检验:根据方程Durbin2的调整样本量n、参数个数k查DW 上下界表,若DW∈(0,d l),则存在正相关;若DW∈(4-d u,4-d l),则存在负相关;若DW∈(d u,4-d u),则无自相关;若DW∈( d l,d u),则不能确定;(4)若DW不能判定,可借助LM判定:view—Residual Tests—Serial Correlation LM Test—输入滞后期:Lags—Obs*R-squared,若对应的P>0.05,则不存在自相关性;(5)使用scalar b0= durbin2.@coef(1)/(1-durbin1.@coef(2)-durbin1.@coef(3))求系数b0(截距项),其他系数bi可用scalar bi=durbin2. @coef(i+1)(i≥1)求得;(6)写出Y=b0+durbin2.c(2)*X即为最终要估计的原回归模型。

差分法(△X=X t-X t

-1

)估计模型:Quick—Estimate Equation—D(y) C D(x)。差分法可以用于消除序列相关性。差分法有无常数项根据模型来确定。

多重共线性

多重共线性(Multicollinearity):解释变量之间存在相关性。主要原因如变量间存在近似的比例关系、变量与滞后变量相关、样本量限制等。简单线性的时间序列模型常存在多重共线性,截面数据也存在,但问题较轻。多重共线的检验主要包括检验多重共线性是否存在、估计多重共线的范围。

多重共线性的存在性检验:主要使用简单相关系数法,即通过相关系数矩阵判断:Quick—Group Statistics—Correlations。一般若有参数未能通过t检验,而方程通过了F检验,可

考虑多重共线性。

估计多重共线的范围:即确定引起多重共线的变量,只要使用逐步回归法。

克服多重共线的方法:逐步回归法、差分法(使用增量代替原变量)、使用额外信息、增大样本量。

逐步回归法:(1)使用OLS方法进行回归;(2)找出未能通过检验的解释变量;(3)检验简单相关系数;(4)分别作被解释变量与单个解释变量的简单回归,找出可绝系数最大的模型,以之作为初始的回归模型;(5)将其他变量逐个累加到初始模型中,通过检验的新变量保留,不能通过的剔除,最终得到克服了多重共线性的回归模型。

)估计模型:Quick—Estimate Equation—D(y) C D(x)。差分法可以用差分法(△X=X t-X t

-1

于消除多重共线性。差分法有无常数项根据模型来确定。

随机解释变量问题

随机解释变量问题:模型中存在一个或多个随机变量作为解释变量,主要表现在被解释变量作为解释变量的情形。包括三种情形:随机解释变量与随机干扰项相互独立、随机解释变量与随机干扰项同期无关但异期相关、随机解释变量与随机干扰项同期相关。如果是随机解释变量与随机干扰项相互独立,可直接使用OLS方法估计;如果是同期无关但异期相关或同期相关,常使用工具变量法进行估计。

工具变量(generalized difference method)法:选取与随机解释变量高度相关、与随机干扰项不相关、与其他解释变量不相关的变量为工具变量。使用工具变量法不会改变原模型。如果模型中使用多个相互独立的工具变量,即形成广义矩估计法(generalized moment method,GMM)。如果随机解释变量与随机干扰项相关主要来源于同期测量误差,可以使用滞后一期随机解释变量作为工具变量。

工具变量法Eviews5操作:Quick—Estimate Equation—输入:被解释变量C解释变量—在下方Estimate Settings栏的Methods项中选择TSLS(Two-Stage LS,二阶段最小二乘法)—在Instruments中输入工具变量。

虚拟变量模型

虚拟变量模型:将定性因素量化后引入到模型中,定性变量只取0或1。引入虚拟变量的形式有加法形式和乘法形式;加法形式只改变截距,不改变斜率;乘法形式只改变斜率,不改变截距。如果有m个定性变量,需要引入m-1个虚拟变量,如果引入m个虚拟变量会导致参数无法求出,从而陷入“虚拟变量陷阱”。引入虚拟变量的检验可以检验结构的变化来自截距还是斜率,邹氏检验可以检验结构变化,但不能具体确定截距还是斜率变化。

虚拟变量模型Eviews5操作:假设要考察1997年(数据从1980年开始)后模型的参数是否改变:(1)使用series d1997=@year>=1997将1997年以后的年份用虚拟变量表示为1,以前的年份表示为0;(2)使用Quick—Estimate Equation—输入Y C X d1997 d1997*X进行OLS回归;在回归结果中,若d1997的系数检验显著,说明1997年后模型截距发生变化;若d1997*X的系数检验显著,说明1997年后模型斜率发生变化。

滞后变量模型

滞后变量(=动态)模型:经济活动中的时间滞后效应即动态性,过去时期的变量称为滞后变量,含有滞后变量的模型即为滞后变量模型,也称为动态模型。滞后变量模型分为三类:分布滞后模型、自回归模型、自回归分布滞后模型。

分布滞后模型=外生滞后变量模型:只含有解释变量的当前值和滞后值。分布滞后模型的系数称为乘数,当期系数称为短期或即期乘数,滞后期系数称为动态或延迟乘数,各期系数和称为长期或均衡乘数。

分布滞后模型的修正:经验加权法(通过对解释变量加权定义一个新变量,引入到原模型,然后求出原模型系数,带回并求出原模型;其权数是人为设定的)、阿尔蒙多项式(Almon)法、科伊克(Koyck)法。

有限分布滞后期模型的Almon多项式法原理:(1)阿尔蒙变换:将滞后s期的原分布滞后模

型Y t =α+β0X+β1X t -1+β2X t -2+…+βs X t -s +μt =α+∑βi X t -i +μt (i ≥0)的系数βi 用滞后期i 的m 阶(m=2或3,不超过4)多项式βi =α0+α1i+α2i 2+α3i 3(此处为m=3阶)=∑αk i k (0≤k ≤m)代替,定义新变量Z 0=X t +X t -1+X t -2+…+X t -s ,Z 1=0*X t +1*X t -1+2*X t -2+…

+s *X t -s =Z 1=X t -1+2*X t -2+…+s *X t -s ,Z 2=0^2*X t +1^2*X t -1+2^2*X t -2+…

+s^2*X t -s =Z 2=X t -1+2^2*X t -2+…+s^2*X t -s ,Z 3=0^3*X t +1^3*X t -1+2^3*X t -2+…

+s^3*X t -s =Z 3=X t -1+2^3*X t -2+…+s^3*X t -s (由m=3,引入4个新变量),则原模型变为Y=α+α0Z 0+α1Z 1+α2Z 2+α3Z 3+μt ;(2)对新模型进行OLS 估计,求得系数αi ,带入βi =α0+α1i+α2i 2+α3i 3求得原模型的系数βi 。

滞后3期的2阶Almon 多项式法Eviews5操作:Quick —Estimate Equation —输入:Y C PDL(X,3,2),常数项为上部的C 值(上部没有显示当期系数值),在Lag Distribution of X 栏可看到当期和滞后期解释变量的系数—单击View —Representations 即得到原分布滞后模型的方程。

无限分布滞后期模型的Koyck 法:将无限分布滞后期模型转化为自回归模型,然后进行估计。

(1)假设滞后无限期的原分布滞后模型Y t =α+β0X+β1X t -1+β2X t -2+…+μt =α+∑βi X t -i +μt (0≤i <∞)的系数βi 随滞后期i 按几何级数衰减:βi =β0* λi (i ≥0,0<λ<1),将βi 代入原模型变为Y t =α+β0∑λi X t -i +μt (i ≥0),将上式滞后一期变为Y t -1=α+β0∑λi -1X t -i +μt -1(i ≥1),再将滞后一期乘以λ变为λY t -1=λα+β0∑λi X t -i +λμt -1,从而得到科伊克模变换型:Y t -λY t -1=(1-λ)α+β0X t +v t (v t 为随机干扰项)或Y t =(1-λ)α+β0X t +λY t -1+v t 。

自回归模型=内生滞后变量模型:只含有解释变量的当前值和被解释变量的滞后值。分为自适应预期模型和局部调整模型。需要检验序列相关性。

自适应预期(自回归)模型:解释变量是长期起作用的因素。原模型为Y t =β0+β1X e t +μt ,由于预期变量不可观测,作自适应预测假设:X e t =rX t +(1-r)X e t -1,将假设带入原模型得到:Y t =β0+β1rX t +β1(1-r)X e t -1+μt ,原模型滞后一期为Y t -1=β0+β1X e t -1+μt -1,将滞后一期模型乘以(1-r)得到(1-r)Y t -1=β0(1-r)+β1(1-r)X e t -1+(1-r)μt -1,带有假设的原模型减滞后模型得到:Y t =r β0+r β1X t +(1-r)Y t -1+μt -(1-r)μt -1,此模型存在随机解释变量Y t -1与滞后期被解释变量Y t -1同期相关,不能直接使用OLS 方法估计,需要使用工具变量法,由于X t -1与Y t -1高度相关,加上X 与μ不相关的假设,可以使用X t -1作为Y t -1的工具变量。

自适应预期(自回归)模型Eviews5操作:Quick —Estimate Equation —输入:Y C X Y(-1)—如果方程系数检验不显著,再使用:在下方Estimate Settings 栏的Methods 项中选择TSLS (Two-Stage LS ,二阶段最小二乘法)—在Instruments 中输入工具变量 C X X(-1),方程保存为auto_e —回归结果中Y(-1)的系数即为1-r ,使用scalar r=1-auto_e.c(3)(这里Y(-1)为第3个系数)求得r —使用scalar bi=auto_e.c(i+1)/r (0≤i ≤参数个数)求得β0、β1。根据回归结果可以直接得到回归方程。可以使用LM 方法模型是否存在检验序列相关性。

局部调整(自回归)模型:用于求长期模型。原(长期)模型为Y e t =β0+β1X t +μt ,由于预期变量不可观测,作局部调整假设:Y t =δY e t +(1-δ)Y t -1,将原模型带入假设模型得到:Y t =δβ0+δβ1X t +(1-δ)Y t -1+δμt ,对新模型进行OLS 回归,求得的系数除以δ即为原模型系数。模型需要检验序列相关性。

局部调整(自回归)模型Eviews5操作:Quick —Estimate Equation —输入:Y C X Y(-1),方程保存为auto_part ,此方程是短期模型—回归结果中Y(-1)的系数即为1-δ,使用scalar derta=1-auto_part.c(3)(这里Y(-1)为第3个系数)求得调节系数δ—使用scalar bi=auto_part.c(i+1)/derta (0≤i ≤参数个数)求得长期模型的系数β0、β1。可以使用LM 方法模型是否存在检验序列相关性。

Granger (格兰杰)(非)因果关系检验:检验解释变量与被解释变量之间是否会相会影响,互为因果关系,其零假设是不存在因果关系。格兰杰因果关系检验对滞后期长度很敏感,不同

的滞后期会得到完全不同的检验结果,常进行不同滞后期长度的格兰杰因果检验,以通过模型中随机干扰项不存在序列相关的滞后期长度来选取滞后期。

Granger因果关系检验Eviews5操作:Quick—Group Statistics—Granger Causality Test—输入:Y X—输入滞后期数。结果中的Cause译为“引起、影响”。

模型设定偏误

模型设定偏误:包括解释变量的选取(漏选或多选)、模型函数形式偏误。如果遗漏了被解释变量与解释变量的滞后项,则称为动态设定偏误(dynamic mis-specification)。模型设定偏误是由人为的主观设定造成的。

无关变量检验:对回归结果的参数系数进行t检验即可,如果不能拒绝显著为零的假设,则说明模型中存在无关变量。

遗漏变量或函数形式设定偏误检验:与多选无关变量要严重。可以使用残差图示法、RESET 检验。

残差图示法:先对原模型进行OLS回归,得到残差序列,作残差序列与时间或残差序列与某解释变量的散点图,如果残差序列在有规律的变动(持续升降、正负交替循环变化),说明模型中遗漏了重要的解释变量或模型函数形式设定有误。异方差和序列相关性往往是模型设定时遗漏了重要的解释变量引起的。

RESET(regression error specification test)检验:由Ramsey(拉姆齐)提出,适用于遗漏变量检验、函数形式设定偏误(包括参数符号不符合实际意义与函数形式错误)检验。

遗漏变量RESET检验和回归模型函数形式设定偏误RESET检验Eviews5操作:假设没有遗漏变量,假设函数形式没有错误(多元模型不能使用一元回归模型中引入解释变量的若干次幂的方法)。(1)先使用原变量进行OLS估计,使用series resid_ols=resid保存残差序列,不要关闭回归结果,单击Forecast—保存被解释变量Y的估计值序列为y_fore;(2)作

Xi-resid_ols(先选Xi)的散点图,如果残差序列在有规律的变动(持续升降、正负交替循环变化),则说明存在模型设定偏误,如果只有一个解释变量与残差的散点图成规律性变化,则可以使用一元检验方法:根据X-resid_ols散点图,通过图形样式确定引入X的几次幂作为遗漏变量的替代变量;(3) 1阶自相关检验:打开回归结果,单击View—Residual Tests—Serial Correlation LM test—输入1,若结果中Obs*R-squared对应的P<0.05,说明模型存在一阶自相关性,而且很可能是由模型设定偏误引起的;观察函数系数的符号、解释变量的幂数是否符合经济理论,如不符合,则说明存在模型设定偏误;(4)以y_fore为(先选)自变量,resid_ols 为因变量,作散点图,通过图形样式确定引入y_fore的几次幂(一元模型可使用X的最高次幂数-1)作为遗漏变量的替代变量;(5)打开原估计方程,单击View—Stability Tests—Ramsey test—在Number of fitted terms(因变量拟合值个数)后输入Y的估计值即y_fore的最高次幂数-1;(6)输出结果中,若F统计值对应的P<0.05,说明模型存在设定偏误,即遗漏了重要的解释变量。对于一元模型,可以在模型中引入新解释变量:X^2,X^3,…,X^(X的最高次幂数),进行OLS估计、RESET检验,若检验结果中F统计值对应的P>0.05则说明已不存在模型设定偏误。

线性模型和双对数模型的比较:原模型与其对数模型不能直接进行模型优劣比较,通常使用Box-Cox变换进行比较。假设两模型残差平方和无差异。

Box-Cox变换Eviews5操作:(1)定义新序列series Y_Box_Cox=Y/exp(@mean(log(Y))),其中exp(@mean(log(Y)))返回被解释变量Y的样本几何均值;(2)使用ls Y_Box_Cox C X进行OLS估计,使用scalar rss_line=@ssr保存线性模型的残差平方和;(3)使用ls

log(Y_Box_Cox) C log(X)进行OLS估计,使用scalar rss_log=@ssr保存对数模型的残差平方和;(4)计算卡方统计量与P值:scalar

model_chi2=1/2*@obs(Y)*abs(log(rss_line/rss_log)),scalar

model_chi2_P_val=1-@cchisq(model_chi2,1)计算P值,若P<0.05,则残差平方和较小的模型更好;反之,残差平方和较大的更好。

联立方程计量经济学模型

单方程计量经济学模型:适用于单一经济形象的研究,揭示单向因果关系。

联立方程计量经济学模型:以经济系统为研究对象,揭示经济系统中的各部分、各因素之间的数量关系。

内生变量(endogenous variables):需要模型系统决定或者说需要由模型来解释的变量。外生变量(exogenous variables):不受模型系统决定的变量,本身不受模型系统的影响。滞后内生变量不能视为外生变量,常数项可被视为外生变量。

先决变量(predetermined variables):是外生变量和滞后内生变量的统称。

结构式模型(structural model):描述经济变量之间直接关系结构的计量经济学模型,是由多个单方程构成的方程组,其中,每一单个方程称为结构方程(structural equations);结构方程中将一个内生变量表示为其他内生变量、先决变量、随机干扰项的函数形式称为结构方程的正规形式。每个结构方程的参数称为结构参数(structural parameters or coefficients)。结构式模型中,用g表示结构式模型中结构方程的个数,k表示模型中先决变量(包括常数项)总的个数,gi表示第i个结构方程的内生变量个数,ki表示第i个结构方程的先决变量(包括常数项)的个数。在构建结构式模型中的每一个结构方程时,要使该方程包含至少一个其他方程不包含的变量(内生或先决变量)。

结构参数矩阵:按照(第1个方程的内生变量名第2个方程的内生变量名…第g个方程的内生变量名第1个方程的外生变量名即常数项…第k个方程的外生变量名)的顺序把结构式模型中每一个结构方程的参数系数从第一个方程向下逐个填入,如某个方程中没有某个变量,则参数系数填0,方程左边的参数系数取正值,右边的参数系数取相反数。

简化式模型(reduced-form model):把联立方程计量经济学模型的每个内生变量(包括内生解释变量,如果一个结构方程中含有内生解释变量,则此结构方程的简化式方程是一个方程组)表示成所有先决变量和随机干扰项的函数形式。所有的内生变量写在方程式的左边,所有的先决变量写在方程式的右边。

参数关系体系:描述简化式参数和结构式参数的对应关系。求法稍复杂。

模型识别(identification):若某个结构方程无法求解(某个结构方程不具有确定的即不唯一的统计形式),则称为不可识别;若某个结构方程的参数有唯一解,则称为恰好识别;若某个结构方程的参数有很多解,则称为过度识别。只有每个结构方程都可以识别,模型才可识别,从而才可以求解。平衡方程不需要识别。模型识别方法:若kg-1,第i个结构方程过度识别(over identification)。以上方法也适用于简化式模型。

联立方程计量经济学模型的估计方法:包括单方程估计方法和系统估计方法。

单方程估计方法=有限信息估计方法:对结构模型中的结构方程逐个进行估计。包括间接最小二乘法(indeirect least squares,ILS)、两阶段最小二乘法(two stage ls,2SLS)、工具变量法(instrumental variables,IV);有限信息最大似然法(limited information maximum likelihood,LIML)、最小方差比方法(least variable ration,LVR)。

系统估计方法=完全信息估计方法:包括三阶段最小二乘法(three stage ls,3SLS)、完全信息最大似然法(full information maximum likelihood,FIML)。

(狭义)工具变量法(IV):只适用于恰好识别的结构方程的估计。若要估计第i个方程,则选取第i个方程中不含有的先决变量(不包括常数项)作为内生解释变量的工具变量,其他先决变量以自己为工具变量。

间接最小二乘法(ILS):只适用于恰好识别的结构方程的估计。若要估计第i个方程,则先对关于第i个方程中的内生解释变量的简化方程式进行OLS估计,得到简化式参数估计量,然后通过参数关系体系求得结构式参数的估计量。

二阶段最小二乘法:二阶段最小二乘法可用于估计恰好识别和过度识别的方程,但过度识别

的模型只能使用二阶段最小二乘法,应用最普遍。

(1)找出第i个结构方程中的内生解释变量(即在自身结构方程中作为解释变量,同时又在其他结构方程中作为被解释变量),不考虑平衡方程;

(2)找出模型中的所有先决变量;

(3)作第i个结构方程内生解释变量对所有先决变量的OLS回归(简化式方程);

(4)不要关闭回归结果,单击Forecast—输入内生解释变量的估计值序列名;

(5)使用内生解释变量的估计值作为原内生解释变量的替代变量,对第i个结构方程进行OLS估计(或者将内生变量的估计值作为工具变量,进行OLS估计)。

主分量方法:不是估计方法,多配合两阶段最小二乘估计方法使用。主分量方法是使用较少数目的新变量Z重新表示原模型中较多数目的先决变量X的方法。主分量必须是先决变量X的线性组合,主分量之间必须正交。选择主分量就是求X T X的特征值和特征向量。X T Xai=λiai,其中λi是X T X的最大或最大的几个特征值,ai是对应的最大或最大的几个特征向量。

经典计量经济学应用模型

生产函数的一阶齐次性:非技术要素同时增长λ倍,如果规模报酬不变,则产出量也增长λ倍,即f(λK,λL,…)=λf(K,L,…)。

要素替代弹性:描述要素之间替代能力的大小。定义为两要素比例的变化率与边际替代率的变化率之比,用σ表示,σ=(d(K/L)/(K/L))/(d(MP L/MP K)/(MP L/MP K))。

狭义技术进步:仅指要素质量的提高,如性能的改进、文化水平的提高。

广义技术进步:包括要素质量的提高、管理水平的提高等。

中性技术进步:假设生产过程中除了技术外,只有资本和劳动两要素,定义两要素的产出弹性之比为相对资本密度,w=E L/E K。若技术进步使w越来越大,即劳动的产出弹性比资本的产出弹性增长得快,则称为节约劳动型技术进步;若技术进步使w越来越小,即劳动的产出弹性比资本的产出弹性增长得慢,则称为节约资本型技术进步;若技术进步前后w不变,则称为中性技术进步。

希克斯中性技术进步:中性技术进步中,要素比K/L不随时间变化,则为希克斯中性技术进步。索罗中性技术进步:中性技术进步中,劳动产出率Y/L不随时间变化。

哈罗德中型技术进步:中性技术进步中,资本产出率Y/K不随时间变化。

生产函数模型的发展:1928年,美国数学家Charles Cobb和经济学家Paul Dauglas提出生产函数这一名词,并提出C-D生产函数。生产函数的提出有两种思路:一是以要素之间的替代性质为线索,二是以技术要素为线索。

以要素之间的替代性质为线索的生产函数模型的发展:

(1)线性生产函数:Y=α0+α0K+α1L,其要素替代弹性为无限替代,即σ=∞;

(2)投入产出生产函数:Y=min(K/a,L/b),其要素替代弹性为完全不可替代,即σ=0;

(3)C-D生产函数:1928年,美国数学家Charles Cobb和经济学家Paul Dauglas提出,Y=AKαLβ,A为效率系数,是广义技术进步的反映,A>0;0≤α≤1、0≤β≤1,其假定α+β=1,即生产函数满足一阶齐次性,亦即假设研究对象规模报酬不变,函数也可写为Y=AKαL1-α,其对数线性形式为lnY/L=lnA+lnK/L;其要素替代弹性恒为1,即σ=1;

(4)C-D生产函数改进型:1937年,Durand提出,取消了α+β=1的假定,即承认研究对象可以规模报酬递增、递减或不变;其要素替代弹性也恒为1,即σ=1;

(5)CES生产函数:即不变替代弹性(constant elasticity of substitution)生产函数,1961年,Arrow、Chenery、Mihas、Solow提出,Y=A(δ1K-ρ+δ2L-ρ)-1/ρ,A>0,0<δ1<1、0<δ2<1,ρ>-1,A为效率系数,是广义技术进步的反映;δ1、δ2为分配系数,且δ1+δ2=1;ρ为替代参数;原假设研究对象规模报酬不变;其要素替代弹性为σ=1/(1+ρ);后取消规模报酬不变的的假定,模型改写为Y=A(δ1K-ρ+δ2L-ρ)-m/ρ,即承认研究对象可以规模报酬递增、递减或不变,m为规模报酬参数;估计Y=A(δ1K-ρ+δ2L-ρ)-m/ρ模型时,先取对数,然后将ln(δ1K-ρ+δ2L-ρ)在ρ=0处展开泰勒级数,得到估计式lnY=lnA+δ1mlnK+δ2mlnL-0.5ρmδ1δ2(lnK/L)^2,求系数时利用

δ1+δ2=1,先求scalar m=ces.C(2)+ces.C(3),再求δ1、δ2、ρ:scalar derta1=ces.C(2)/m,scalar derta2=ces.C(3)/m,scalar rou=-2*ces.C(4)/(m*derta1*derta2),替代弹性σ=1/(1+ρ);

(6)VES生产函数:即变替代弹性(variable ES)生产函数,1968年,Sato、Hoffman根据要素替代弹性是时间的线性函数即σ=σ(t)=a+bt的假设而提出,使用价值不大;1971年,Revanker要素替代弹性是要素比例的线性函数即σ=a+bK/L的假设,提出Y/L=Ae^(?d(K/L)/(K/L+c(K/(a L+b K))^(1/a))),常令a=1,则σ=1+bK/L,生产函数写为规模报酬不变的Y=AK1/(1+c)(L+bK/(1+c))c/(1+c),或规模报酬可变的Y=AK m/(1+c)(L+bK/(1+c))cm/(1+c),m为规模报酬参数;估计模型Y=AK m/(1+c)(L+bK/(1+c))cm/(1+c)时,需要先取对数,记λ=b/(1+c),然后将ln(L+bK/(1+c))=ln(L+λK)=Z(λ)在λ=0即b=0处展开泰勒级数,得到估计式lnY=lnA+(m/(1+c))lnK+(c m/(1+c))lnL+(cm b/((1+c)^2))K/L;

(7)多要素一级CES生产函数:假设多要素资本K、劳动L、能源E相互之间的替代弹性相同,Y=A(δ1K-ρ+δ2L-ρ+δ3E-ρ)-m/ρ,假定δ1+δ2+δ3=1,要素之间的替代弹性为σ=1/(1+ρ);

(8)多要素二级CES生产函数:1967年,Sato提出,假设多要素资本K、劳动L、能源E相互之间的替代弹性不相同,第一级CES生产函数为Y KE=(a1K-ρ1+a2L-ρ1)-1/ρ1,第二级CES 生产函数为Y=A(b1Y-ρKE+b2L-ρ)-m/ρ;估计模型时,需要先对二级CES生产函数取对数,然后将b1Y-ρKE+b2L-ρ在ρ=0处展开泰勒级数,得到估计式lnY=lnA+(b1m)lnY KE+b2mlnL-0.5ρm b1b2(lnY KE/L)^2;再将第一级CES生产函数在ρ1=0处展开泰勒级数,得到lnY KE=a1lnK+a2lnE-0.5ρa1a2(lnK/E)^2,将lnY KE带入第二级CES泰勒展开式中,然后逐步回归估计;求参数时,需要借助a1+a2=1,b1+ b2=1;

(9)多要素三级CES生产函数:当投入要素多于3个时构造三级CES模型,1980年出现于美国的一篇博士论文中;

(10)超越对数生产函数:1973年,L.Christensen、D.Jorgenson、Lau提出,lnY=β0+βK lnK+βL lnL+βKK(lnK)^2+βLL(lnL)^2+βKL lnK*lnL。

以技术要素为线索的生产函数模型的发展:

(1)技术要素为不变参数的生产函数:技术作为不变的参数,技术进步被假设为广义的,技术进步是中性的。如C-D生产函数Y=AKαLβ,CES生产函数Y=A(δ1K-ρ+δ2L-ρ)-m/ρ等,其中的A即为技术要素;

(2)改进的C-D、CES的生产函数:1957年,Solow提出改进的C-D生产函数Y=A(t)KαLβ,设A(t)=A0(1+r)t或A(t)=A0eλt,r表示年技术进步速度,λ含义不明确,但当技术进步速度很低时,λ也可看作技术进步速度;改进的C-D生产函数写为Y=A0(1+r)t KαLβ或A0eλt KαLβ,改进的CES生产函数写为Y=A0(1+r)t(δ1K-ρ+δ2L-ρ)-m/ρ或A0eλt(δ1K-ρ+δ2L-ρ)-m/ρ;希克斯中性技术进步生产函数为Y=A(t)f(K,L),索罗中性技术进步生产函数为Y=f[A(t)K,L],哈罗德中性技术进步生产函数为Y= f[K,A(t)L];

(3)含体现型技术进步的生产函数:体现型技术进步中一部分体现为资本、劳动要素质量的提高,由Solow提出,Nelson于1964年补充(也称Solow-Nelton同期模型);○11957年,Solow提出总量增长方程:△Y/Y=△A/A+α△K/K+β△L/L,△A/A是除资本与劳动以外的因素对产出增长的贡献,它被看做是技术进步的贡献,是一个大杂烩,需要分离;○2分离资本质量的含体现技术性进步的生产函数:将C-D生产函数改写为Y t=A t’J tαL tβ,J t表示以质量加权的资本数量,也称有效资本,J t=∑K mt(1+λ)m(m从0到t),K mt为第m年形成的第t年还在使用的资本数量,λ为由资本质量提高带来的资本效率年提高速度;A t’是除了体现资本质量提高以外的技术效率系数;分离资本质量后的总量增长方程为△Y/Y=(△A’/A’+αλ-αλ△a)+α△K/K+β△L/L,α为资本产出弹性,λ为由资本质量提高带来的资本效率年提高速度,△a为资本平均年龄的变化,αλ体现资本质量的提高,αλ△a反映资本平均年龄的变化;方程也可写为△Y/Y=△A’/A’+α(λ-λ△a+△K/K)+β△L/L;○3分离劳动质量的含体现技术性进步的生产函数:△Y/Y=△A”/A”+α(λ-λ△a+△K/K)+β(δ-δ△b+△L/L),δ表示由劳动者平均受教育水平的提

高带来的劳动效率年提高速度,△b表示劳动者平均年龄的变化,△A”/A”仅表示由于管理水平的提高等技术进步因素对产出增长的贡献;

(4)边界生产函数:1968年,Aigner、Chu提出;描述一定的投入要素组合与最大产出量之间的关系;实际应用中,无法取得最大产出量的样本观测值,用实际产出量描述一定的投入要素与平均产出量之间的关系,称为平均生产函数;边界生产函数可以分为确定性边界生产函数和随机性边界生产函数;确定性边界生产函数把影响产出量的其他因素不加区别归入误差项中,形式为Y=f(K,L,…)e-u(u≥0),Y为实际产出量,f(K,L,…)为边界生产函数,e-u表示生产非效率;模型的估计,如Y=AKαLβe-u,化为对数式,其估计方程为平均生产函数,设估计值为Y_f,求max(lnYi-lnYi_f)并用其值调整对数估计方程的常数项,即可得边界生产函数;随机性边界生产函数把不可控因素和可控因素相区别,形式为Y=f(K,L,…)e v-u=[f(K,L,…)e v]e-u,Y为实际产出量,f(K,L,…)e v为边界生产函数,e-u表示生产非效率。

年技术进步速度: r=y-αk-βl,r为技术进步速度,α、β为资本与劳动的产出弹性,y、k、l 为产出、资本、劳动的增长速度。

技术进步对经济增长的贡献率:E A=r/y,r为技术进步速度,y为产出的增长速度。

需求函数:描述某种商品的需求量与影响因素如收入、自价格、其他商品价格之间的数学关系,即q i=f(I,p1,…,p i,…p n)。

需求函数模型:包括耐用品存量调整模型、状态调整模型、扩展的线性支出系统模型、大类商品的需求模型。

需求函数的零阶齐次性条件:当收入、价格、其他商品的价格都增长λ倍时,对商品的需求量没有影响,即f(λI,λp1,…,λp i,…,λp n)=λ0f(I,p1,…,p i,…,p n)=f(I,p1,…,p i,…,p n)。

耐用品存量调整模型:属于需求函数模型。存量是指已经售出或购买且还在使用的某耐用品数量。设耐用品t时刻的期望存量S e t=α0+α1p t+α2I t+μt,S t=λS e t+(1-λ)S t-1,设δ为报废率,则S t=(1-δ)S t-1+q t,从而t时刻的需求量为q t=λα0+λα1p t+λα2I t+(δ-λ)S t-1+λμt。估计式需要外生给定报废率δ。

状态调整模型:属于需求函数模型。1970年,Houthakker与Taylor建议使用q t=β0+β1p t+β2I t+β3S t-1+λμt描述耐用品与非耐用品的需求,其中S t-1为状态变量,对于耐用品是存量,对于非耐用品是消费习惯等“心理存量”,可用上期实际实现的需求量(可设当期报废)表示,从而非耐用品的需求函数可写为q t=β0+β1p t+β2I t+β3q t-1+λμt。估计时需要使用广义差分或广义最小二乘消除随机干扰性。

扩展的线性支出系统需求函数模型(expend linear expenditure system,ELES):属于需求函数模型。1947年,Klein与Rubin提出LES函数:q k=r k+(b k/p k)(V-∑p L r L),r k是对第k 种商品的基本需求量,即维持基本生活所需要的,b k是边际预算份额,∑p L q L是对所有商品(包括第k种商品)的基本需求额,(b k/p k)(V-∑p L r L)是总预算中扣除对所有商品的基本需求支出后剩余部分中愿意用于对第k种商品的需求。由于总预算V是内生变量,因此此模型没有被实际使用;1973年,Liuch将LES模型修改为ELES模型:q k=r k+(b k/p k)(I-∑p L r L),r k是对第k种商品的基本需求量,b k定义为边际消费倾向,I为收入;常使用非线性模型的迭代法和截面数据的最小二乘法进行估计;截面数据的最小二乘法估计方法:将模型q k=r k+(b k/p k)(I-∑p L r L)两边乘p k,令V k=C k=p k q k(所有消费者对第k种商品的支出),得到V k =r k p k-b k∑p L r L+b k I+μk,记a k=r k p k-b k∑p L r L是一不变已知数,则V k=a k+b k I+μk;求所有商品的基本消费总额(即基本需求总额)∑p k r k=(∑a k)/(1-∑b k);求所有消费者对第k种商品的基本消费额(即第i种商品的基本需求额)p k r k=a k-b k∑p k r k,最终得到第k种商品的需求函数为C k=p k q k=V k=p k r k-b k∑p L r L+b k I;如果知道价格p k,则q k=C k/p k。

ELES需求函数模型Eviews5操作:

(1)设有m种商品,使用模型C ik=a i+b i Y i+μ(k表示第k种商品,Y i为第i个消费者的收入)对m种商品分别进行OLS估计,将方程分别命名为eq01、eq02…eq0k…eq0m;

(2)使用scalar sum_coef1=eq01.c(1)+…+eq0m.c(1),scalar sum_coef2=eq01.c(2)+…+eq0m.c(2),scalar sum_pr=sum_coef1/(1-sum_coef2),求所有商品的基本消费总额∑p k r k(即基本需求总额);

(3)使用scalar b k=eq0k.c(2)(1≤k≤m)求第k种商品的边际消费倾向;

(4)使用scalar pr k=eq0k.c(1)+b k*sum_pr(1≤k≤m),求第k种商品的基本消费额p k r k(即第i种商品的基本需求额);

(5)第k种商品的需求函数为p k q k=prk-bk*sum_pr+bk*Y,即p k q k=pr k+b k*(Y-sum_pr);如果知道价格p k,则q k=p k q k/p k;

(6)第k种商品的需求收入弹性为scalar elas_y k=b k*@mean(Y)/(pr k+b k*(@mean(Y)-sum_pr));第k种商品的需求自价格弹性为scalar elas_p k=(1-b k)*pr k/(pr k+b k*(@mean(Y)-sum_pr))-1;互价格弹性如第1种对第二种商品的互价格弹性E12为scalar elas_cross12=-b1*pr2/(pr1+b1*(@mean(Y)-sum_pr)),E21为scalar elas_cross21=-b2*pr1/(pr2+b2*(@mean(Y)-sum_pr))…。

消费函数模型:包括绝对收入假设需求函数模型、相对收入假设需求函数模型、生命周期假设需求函数模型、持久收入假设需求函数模型、合理预期的消费函数模型、适应预期的消费函数模型。

绝对收入假设需求函数模型:Keynesian提出,C t=α+βY t+μt,由于边际消费倾向β为常数,没有真正反映边际消费倾向递减规律,可建立变参数模型:C t=α+β0Y t+β1Y2t+μt,边际消费倾向β=β0+β1Y t。

相对收入假设需求函数模型:Duesenberry提出,有两种假设,(1)示范性相对收入假设模型:消费者的消费行为不仅受自身收入影响,还受周围人的消费水平的影响:C i/Y i=α0+α1y i/Y i,消费函数模型为C i=α0Y i+α1y i+μt,Y i为第i个消费者的收入水平,y i为消费者所处群体的平均收入水平;(2)不可逆性相对收入假设模型:消费者的消费行为不仅受当前收入的影响,还受自己历史上曾经实现的消费水平的影响,这种现象即消费的不可逆性:C t/Y t=α0+α1Y0/Y t,Y t为第i个消费者当期t的收入水平,Y0为该消费者曾经达到的最高收入水平,消费函数为C i=α0Y t+α1Y0+μt,一般收入随时间递增,故可用Y t-1代替Y0,从而消费函数模型改写为C t=α0Y t+α1Y t-1+μt。

生命周期假设需求函数模型:1945年,Modigliani、Brumberg、Ando提出,消费者现期消费不仅与现期收入有关,且与以后各期收入的期望值、开始时的资产数量和年龄有关,消费者希望将自己一生的全部收入在消费支出中进行最优分配;生命周期消费函数模型为C t=α1Y t+α2A t+μt,A t为t时刻的资产存量,即已经积累的财富,如储蓄;差分形式的生命周期模型△A t=A t-A t-1=Y t-1-C t-1(t期的财富增量为t-1期的储蓄),由C t-1=α1Y t-1+α2A t-1+μt-1得△C t=β0(Y t-1-C t-1)+β1△Y t+μt-μt-1(无常数项),差分形式可有效降低多重共线性和消除序列相关性,原函数为C t=(1-β0)C t-1+β1Y t+(β0-β1)Y t-1。

持久收入假设需求函数模型:1957年,Friedman提出,是对Keynesian绝对收入假设的修正与补充;收入中有一部分为可以预料到的持久性的带有常规性的持久收入,另一部分是非连续性的带有偶然性的瞬时收入,即Y t=Y p t+Y t t,Y t、Y p t、Y t t分别为实际收入、持久收入、瞬时收入;消费中有一部分是经常的必须保证的基本消费,另一部分是非经常的额外消费,即C t=C p t+C t t,C t、C p t、C t t分别为实际消费、持久消费、瞬时消费,持久消费由持久收入决定,瞬时消费由瞬时收入决定;消费函数模型为C t=α0+α1Y p t+α2Y t t+μt,t时刻的持久收入可表示为各期实际收入的加权和:Y p t=λY t+λ(1-λ)Y t-1+λ(1-λ)2Y t-2+…,即Y p t=λY t+(1-λ)Y p t-1。合理预期的消费函数模型:理性预期理论认为,人们可以对原因变量(解释变量)进行预期,然后根据原因变量的预期值对结果变量进行预测;设C t=α+βY e t,即消费者按收入预期决定自己的消费计划和实现消费,由Y e t=λY t+(1-λ)Y e t-1,从而C t=α(1-λ)+β(1-λ)Y t+λC t-1+μt。

适应预期的消费函数模型:适应预期理论认为,人们可以根据原因变量的实际值对结果变量进行预期,但需要对结果变量的预期值进行调整;设C e t=α+βY t,表示消费者按收入决定自

己的消费预期,由C t=λC e t+(1-λ)C t-1,从而C t=λα+λβY t+(1-λ)C t-1+μt。

消费函数模型估计:可从绝对收入假设模型开始,若其存在显著一阶甚至多阶自相关性,可借助一阶自相关模型C t=β0+β1Y t+β2C t-1+μt进行估计,判断一阶及多阶自相关是否被消除,若仍存在一阶或多阶自相关,再检验多重共线性,若存在多重共线性,则考虑改变模型,如使用差分形式的生命周期模型进行估计,可有效降低共线性和消除序列相关性。

宏观经济环境:主要指宏观经济从总体上处于需求导向还是供给导向,即需求不足还是供给不足。需求不足的经济环境中,需求是经济增长的主要制约,刺激需求是宏观经济政策的主要目标;需求决定生产,生产决定就业、收入和收入分配;主要方程的解释变量都应从需求方面来选择,决定投资的是需求方——产出的增长,加速模型是投资方程的主要理论形式;决定产出的也是需求方——需求量;决定出口的是其需求方——国际市场的需求。供给不足的经济环境中,供给是经济增长的主要制约,刺激生产是宏观经济政策的主要目标;生产决定就业、收入和收入分配;收入,包括居民、企业、政府和国外各个主体的收入决定消费、投资;由投资形成的新的生产能力决定产出的增长;主要方程的解释变量都应从需求方面来选择,决定投资的是供给方——资金来源,即居民、企业、政府和国外各个主体的收入;决定产出的也是供给方——生产要素的投入量,生产函数是生产方程的主要理论形式;决定出口的是其供给方——国内产出量。

体制:主要指宏观经济的决策方式,即集中决策还是分散决策。

结构:分量在总量中所处的地位与所占的份额。

部门分解与模型设定:在我国,农业需求是无限的,耕地是农业方程的重要解释变量;生产能力是采掘业、原材料工业的主要制约因素,因此需作为重要解释变量;需求是加工工业的主要制约因素,加工工业中,机械制造工业的需求是固定资产投资,对于轻纺工业,需求是居民消费和社会消费,所以居民收入是重要解释变量;贸易依存度=(出口总额+进口总额)/国内生产总值。

扩展的单方程计量经济学模型

变参数线性单方程计量经济学模型:分为确定性变参数模型与随机变参数模型。

确定性变参数模型:对于y t=αt+βt x t+μt中的α、β为确定性变量,分为3种:(1)参数随某一变量规律性变化:αt=α0+α1p t、βt=β0+β1p t,实际问题中p t常是确定性的政策变量;原模型可化为y t=α0+α1p t+β0x t+β1p t x t+μt,若α1、β1显著不为零,则说明变量p对α、β有影响;(2)参数作间断性变化:αt=α0+α1p t、βt=β0+β1p t,其中,p t=0当1≤t≤n0,p t=1当n0<t≤n;可用于描述某项政策的影响;n0已知时有两种估计方法:Chow方法(分段估计模型):y t=α0+β0x t+μ1t(1≤t≤n0),y t=(α0+α1)+(β0+β1)x t+μ2t(n0<t≤n),分别估计这两个方程;Gujarati方法(统一模型):y t=(α0+α1D t)+(β0+β1D t)x t+μt=α0+α1D t+β0x t+β1D t x t+μt,其中,D t=0当1≤t≤n0,D t=1当n0<t≤n;(3)Chow检验。

非线性单方程计量经济学模型:分为可化为线性的解释变量非线性、可化为线性的含参数非线性、不可化为线性的含参数非线性模型;不可对数化的模型对参数展开泰勒级数转化为近似线性回归是常用的线性化方法。

非线性普通最小二乘法(迭代)Eviews5操作:双击系数向量对象C,在编辑状态下依次输入参数的初始值;单击Quick—Estimate Equation—输入函数式Y=…,参数用C(i)表示。

X增长率的计算:series gx=@pch(x)、scalar g_x=(gx(2)*gx(3)*……*gx(n))^(1/@obs(x))。离散选择模型(discrete choice model,DCM):即离散被解释变量数据计量经济学模型(models with discrete dependent variables);用于选择问题即决策问题,在几个方案中进行选择,可供选择的方案用离散的数据表示;若解释变量只存在两种选择,称为二元(离散)选择模型(binary choice model);若解释变量存在多种选择,称为多元选择模型(multiple choice model);20c80s离散选择模型广泛用于经济布局、企业定点、交通、就业或职业选择、购买决策等领域;二元离散模型需要借助随机效用模型(选择两个方案的效用之差)来估计,方法常用最大似然估计方法,包括Probit模型和Logit模型;Probit模型假定随机干扰项服从标准正

态分布,Logit模型假定随机干扰项服从逻辑(logistic)分布(分布函数为F(t)=1/(1+e t));标准正态分布和逻辑分布函数都是对称的,即F(t)=1-F(-t)。

二元离散选择模型:二元离散选择的原始模型为Y=XB+N,Y为观测值为1和0的决策被解释变量矩阵,X为解释变量矩阵,N为随机干扰项矩阵;对于y i=X i B+μi,当y i=1时μi=1-X i B,当y i=0时μi=X i B,存在异方差性,不能直接使用;建立随机效用模型U1i=X i B1+ε1i、U0i=X i B0+ε0i,U1i、U0i分别表示第i个个体选择1和0的效用,均为随机变量,令y*=U1i-U0i=X i(B1-B0)+ε1i-ε0i,即y*=X i B+μ*i,此式即为二元选择模型。

重复观测值不可得到的二元Probit离散选择模型及Eviews5操作:采用完全信息最大似然法中的迭代方法估计;Quick—Estimate Equation—在估计方法method中选择Binary-binary choice(logit,probit)—输入各变量—选择Probit,估计方程保存为eq01—结果中Log likelihood 为最大似然函数值;使用series probit_y1_p_F=1-@cnorm(-(eq01.c(1)+eq01.c(2)*X))求Y选择1的概率预测值序列(概率单位),根据此概率进行决策。

重复观测值可得到的二元Probit离散选择模型(概率单位模型)及Eviews5操作:某个体可以多次重复选择,常为分组数据;若在样本数据中未采用0、1数据,只能使用此法;某个体所在的组有n个个体,对第i个决策者重复观测n i次,选择y i=1的次数比例为p i,定义观测到的概率单位v i=F-1(p i),F-1为标准正态分布函数的反函数采用广义最小二乘法估计。

根据标准正态分布分位点估计概率单位(Probit)模型:○1计算成功的概率series p=n i/n;○2计算成功概率的(左)分位点(即标准正态分布函数的反函数):series z=@qnorm(p);○3进行OLS估计:z c x,估计方程保存为eq01;○4使用series

probit_y1_p_F=1-@cnorm(-(eq01.c(1)+eq01.c(2)*X))求Y成功的概率预测值序列(概率单位),或用=1-@cnorm(-(eq01.c(1)+eq01.c(2)*X0))求某个具体的X0对应的Y成功的概率预测值(概率单位)。

根据概率单位估计概率单位(Probit)模型:不祥。

重复观测值不可得到的二元Logit离散选择模型及Eviews5操作:采用完全信息最大似然法中的迭代方法估计;Quick—Estimate Equation—在估计方法method中选择Binary-binary choice(logit,probit)—输入各变量—选择Logit—在结果中,Log likelihood即为最大似然函数值;使用series Y1_P_F=1-@cnorm(-(eq01.c(1)+eq01.c(2)*X))可求X值对应的Y选择1的概率值序列。

重复观测值可得到的二元Logit离散选择模型(对数成败比例模型)及Eviews5操作:重复抽样数据常为分组数据;若在样本数据中未采用0、1数据,只能使用此法;某个体所在的组有n 个个体,对第i个决策者重复观测n i次,选择y i=1的次数比例为p i,可视为真实概率的估计量,定义成败比例p i/(1-p i),取对数为ln(p i/(1-p i))=X i B+μ*i;采用广义最小二乘法估计;(1)计算成功的概率series p=n i/n;(2)计算对数成败比例series ln_suc_fail=log(p/(1-p));(3)使用OLS方法估计:Quick—Estimate Equation—输入ln_suc_fail C X;(4)一般存在异方差性,可用加权最小二乘法进行估计,权数可用series weight=@sqrt(n*p*(1-p));(5)使用WLS 方法估计:Quick—Estimate Equation—输入ln_suc_fail C X—单击Options选项—选中Weighted OLS/TSLS—输入权重序列weight。

平行数据=面板数据(panel data):在时间序列的每一个时间点上有多个截面的样本数据,或者说每一个截面上有多个时间点的样本数据;单方程平行数据模型形式为y it=αi+x itβi+μit,i

表示第i个截面,t表示第t个时间点;模型分三种形式:αi=αj,βi=βj(无个体影响,也无结构≠αj,βi=βj(变截距模型,存在个体影响,表现为模型中被忽略的反映个体差异的变化);α

i

变量的影响);αi≠αj,βi≠βj(变系数模型,不仅存在个体影响,在横截面上还存在结构变化,在不同横截面上的结构参数β是不同的);研究平行数据的第一步是检验参数在所有横截面样本点和时间上是否都是常数,以确定模型的形式,主要采用的检验方法是协变分析检验。

协变分析检验(analysis of covariance):主要有两个假设:H1:y it=αi+x itβi+μit,即斜率在不同截面样本点和时间上都相同,但截距不相同;H2:y it=α+x itβi+μit,即截距和斜率在不同截

面样本点和时间上都相同;若接受了H2,则不需要继续检验;若拒绝了H2,则需继续检验

H1;若拒绝h1,则使用模型y it=αi+x itβi+μit;使用F检验。

固定影响变截距模型或称变截距固定效应模型:形式为y it=αi+x itβ+μit,αi为个体影响,它是一个确定型参数,故称固定影响;可按面板数据估计方式估计;也可使用最小二乘虚拟变量模型进行估计。

变截距固定效应模型OLS估计:按横截面样本分别估计各单一回归方程。

变截距固定效应模型Pooled Least Squares估计Eviews5操作:右击工作文件—New Object —Pool—命名为pool1—输入横截面个体名称(常使用下划线作为命名连接符,如unit1_),每输入一个回车—单击Sheet—输入?y ?x1 ?x2…(或y? x1? x2?,?为通配符,代表多个字符,变量间以空格间隔)—Estimate—在Dependent variables后输入?y—在Common项下后输入解释变量?x1 ?x2…—在Estimation method项下的Cross-Section选择Fixed—确定

即得到估计结果。

最小二乘虚拟变量(ls dummy-variable,LSDV)=协方差分析模型(analysis-of-covariance model):使用虚拟变量进行估计,虚拟变量的个数为横截面个体数减1。

变截距固定效应模型检验Eviews5操作:第一类模型(假设斜率与截距都不相同)的残差平方和S1为按横截面样本点分别估计的各单一方程的残差平方和之和;第二类模型(假设斜率与截距都相同)的残差平方和S2为合成的大样本模型的残差平方和;第三类模型(假设斜率相同,截距不同)的残差平方和S3为固定效应变截距模型的残差平方和;(1)设有四个横截面个体,估计方程分别为eq01、eq02、eq03、eq04,则scalar

s1=eq01.@ssr+eq02.@ssr+eq03.@ssr+eq04.@ssr;(2)设第二类模型(大样本模型)方程为eq01,则scalar s2=eq01.@ssr,可把位于不同工作文件的标量s2复制到另一个工作文件中;

(3)设面板数据保存为pool1,则scalar s3=pool1.@ssr;(4)横截面个体个数为scalar n=4(此假设为4),解释变量个数为scalar k=2(此假设为2),时间序列个数为scalar t=@obs(y);(5)假设H2(截距和斜率在不同截面样本点和时间上都相同)的F统计量为scalar

F2=((S2-S1)/((n-1)*(k+1)))/(S1/(n*t-n*(k+1)))~F((n-1)(k+1),n t-n(k+1)),其对于的P值为scalar h2_p_value=1-@cfdist(F2,(n-1)*(k+1),n*t-n*(k+1)),若P>0.05,则接受截距和斜率都相同的假设,停止检验,并选择第二类模型为最终模型;若P<0.05,则拒绝截距和斜率在不同截面样本点和时间上都相同的假设,说明截距或者斜率有不同,需要继续下一步检验;(6)此时还需要对假设H1进行检验,scalar

F1=((S3-S1)/((n-1)*k))/(S1/(n*t-n*(k+1)))~F((n-1)k,n t-n(k+1)),其对于的P值为scalar

h1_p_value=1-@cfdist(F1,(n-1)*k,n*t-n*(k+1)),若P<0.05,则拒绝斜率相同、截距不同的假设,说明截距与斜率都不同,即应选择第一类模型为最终模型;若P>0.05,则接受斜率相同、截距不同的假设,从而选择第三类模型为最终模型。

变系数固定效应模型或称固定影响变系数模型OLS估计:按横截面样本分别估计各单一回归方程;与变截距固定效应模型的结果相同。

变系数固定效应模型Pooled Least Squares估计Eviews5操作:右击工作文件—New Object —Pool—命名为pool2—输入横截面个体名称(常使用下划线作为命名连接符,如unit1_),每输入一个回车—单击Sheet—输入?y ?x1 ?x2…(或y? x1? x2?,?为通配符,代表多个字符,变量间以空格间隔)—Estimate—在Dependent variables后输入?y—在Cross-section specific项下后输入解释变量?x1 ?x2…—在Estimation method项下的Cross-Section选择Fixed—确定即得到估计结果。

变系数固定效应模型GLS估计Eviews5操作:右击工作文件—New Object—Pool—命名为pool3—输入横截面个体名称(常使用下划线作为命名连接符,如unit1_),每输入一个回车—单击Sheet—输入?y ?x1 ?x2…(或y? x1? x2?,?为通配符,代表多个字符,变量间以空格间隔)—Estimate—在Dependent variables后输入?y—在Cross-section specific项下后

输入解释变量?x1 ?x2…—在Estimation method项下的Cross-Section选择Fixed—在

Weights项选择Cross-section weights—确定即得到估计结果。

时间序列计量经济学模型

选择软件:对时间序列计量经济学模型,Eviews3与Eviews5结果差别较大,建议使用Eviews3,Eviews3要求必须把工作文件放到“Example files”文件夹下,否则无法访问,可在Example files文件夹下建文件夹,文件名也可使用汉字。

协方差:γ=Cov(X,Y)=E(XY)-E(X)E(Y)。

相关系数:Corr(X,Y)=Cov(X,Y)/sqrt(Var(x)Var(Y))。

平稳随机时间序列:随机时间序列{X t}满足条件:(与t无关的常数),var(X t)=δ2(与t无关的常数),滞后k期协方差Cov(X t X t+k)=γk(只与时间间隔k有关,与t无关的常数,滞后1期的(自)协方差γ1=cov(X t X t+1));

白噪声(white noise):即具有零均值、同方差、独立分布的随机时间序列X t=μt~N(0,δ2),白噪声为最简单的平稳序列;Cov(μi,μj)=0(i≠j),E(μ2t)=δ2。

随机游走(random walk):即随机时间序列X t=X t-1+μt,μt为白噪声;设初值为X0(常数),则X t=X0+μ1+μ2+…+μt,由E(X0)=0,得E(X t)=0,方差为tδ2,非常数,故X t为非平稳序列;其一阶差分(first difference)为△X t=X t-X t-1=μt,故△X t为平稳序列。

随机时间序列自相关函数(autocorrelation function,ACF):ρk=γk/γ0,k为滞后长度;γ0为方差γ0=var(X t);k阶滞后自协方差γk=Cov(X t X t+k)=E(X t X t+k);若ρk=0,说明序列平稳;ρ0=1。

样本自相关系数=样本自相关函数(sample autocorrelation function,AC):是关于k的函数,k>0;r k=[(X1-mean(X))(X1+k-mean(X))+(X2-mean(X))(X2+k-mean(X))+…

(X n-k-mean(X))(X n-mean(X))]/[(X1-mean(X))2+(X2-mean(X))2+…+(X n-mean(X))2],n为样本量(期数),k为滞后期;巴特雷特(Bartlett)曾证明若时间序列由白噪声生成,则对所有的k>0,样本自相关系数r k~N(0,1/n);若r k=0,说明序列平稳。

求自协方差与自相关系数的程序:

!s=0 ‘和变量,初值

!n=10 ‘样本量,初值

!k=2 ‘滞后期数,可手工输入

for !i=1 to !n-!k

!s=!s+(x(!i)-@mean(x))*(x(!i+!k)-@mean(x))

next

scalar cov!k=!s/!n ‘保存自协方差

if !k<>0 then

scalar rou!k=!s/cov0 ‘保存自相关系数

endif

平稳性图示检验法:随机时间序列围绕均值不断波动为平稳;不同的时间段具有不同均值(持续上升或持续下降)的时间序列是非平稳的;双击序列s—View—Graph—Line—Freeze—Name为line_graph_s;此法不严格。

使用样本自相关系数(函数)检验序列平稳性Eviews3操作:(1)双击序列s—View—Correlogram—Correlogram of后选择Level,此处已默认为Level—输入滞后期数(可输入样本量)—Freeze—Name为cor_gram_s;(2)若样本自相关系数迅速下降为零(图形Autocorrelation列的条形框都在虚线边界以内),随后在零值附近波动且逐渐收敛于零,可断定原时间序列s平稳;(3)AC为样本自相关函数值;可复制AC数据—使用series s_ac创建序列s的自相关函数值序列—粘贴—双击序列s_ac—View—Graph—Line,其线图中的数据应在0值附近收敛式波动;(4)样本自相关系数AC服从N(0,1/n),95%的置信区间为

[=@sqrt(1/@obs(s1))*@qnorm(0.025),=@sqrt(1/@obs(s1))*@qnorm(0.975)]。

检验自相关系数都为零的Q LB统计量检验法:用于对所有的k>0,样本自相关系数都大于零的联合假设;Q LB=n(n+2)(r21/(n-1)+r22/(n-2)+…+r2k/(n-k))~χ2(k),k为滞后长度,r k为样本自

计量经济学-李子奈-计算题整理集合

计算分析题(共3小题,每题15分,共计45分) 1、下表给出了一含有3个实解释变量的模型的回归结果: 方差来源 平方和(SS ) 自由度(d.f.) 来自回归65965 — 来自残差— — 总离差(TSS) 66056 43 (1)求样本容量n 、RSS 、ESS 的自由度、RSS 的自由度 (2)求可决系数)37.0(-和调整的可决系数2 R (3)在5%的显著性水平下检验1X 、2X 和3X 总体上对Y 的影响的显著性 (已知0.05(3,40) 2.84F =) (4)根据以上信息能否确定1X 、2X 和3X 各自对Y 的贡献?为什么? 1、 (1)样本容量n=43+1=44 (1分) RSS=TSS-ESS=66056-65965=91 (1分) ESS 的自由度为: 3 (1分) RSS 的自由度为: d.f.=44-3-1=40 (1分) (2)R 2=ESS/TSS=65965/66056=0.9986 (1分) 2R =1-(1- R 2)(n-1)/(n-k-1)=1-0.0014?43/40=0.9985 (2分) (3)H 0:1230βββ=== (1分) F=/65965/39665.2/(1)91/40 ESS k RSS n k ==-- (2分) F >0.05(3,40) 2.84F = 拒绝原假设 (2分) 所以,1X 、2X 和3X 总体上对Y 的影响显著 (1分) (4)不能。 (1分) 因为仅通过上述信息,可初步判断X 1,X 2,X 3联合起来 对Y 有线性影响,三者的变化解释了Y 变化的约99.9%。但由于 无法知道回归X 1,X 2,X 3前参数的具体估计值,因此还无法 判断它们各自对Y 的影响有多大。 2、以某地区22年的年度数据估计了如下工业就业模型 i i i i i X X X Y μββββ++++=3322110ln ln ln 回归方程如下: i i i i X X X Y 321ln 62.0ln 25.0ln 51.089.3?+-+-= (-0.56)(2.3) (-1.7) (5.8) 2 0.996R = 147.3=DW 式中,Y 为总就业量;X 1为总收入;X 2为平均月工资率;X 3为地方政府的

计量经济学李子奈(第3版)例题+习题数据

计量经济学(第3版)例题和习题数据表表2.1.1 某社区家庭每月收入与消费支出统计表

表2.3.1 参数估计的计算表

表2.6.1 中国各地区城镇居民家庭人均全年可支配收入与人均全年消费性支出(元) 资料来源:《中国统计年鉴》(2007)。

表2.6.3 中国居民总量消费支出与收入资料 单位:亿元年份GDP CONS CPI TAX GDPC X Y 19783605.6 1759.1 46.21519.28 7802.5 6678.83806.7 19794092.6 2011.5 47.07537.828694.2 7551.64273.2 19804592.9 2331.2 50.62571.70 9073.7 7944.24605.5 19815008.8 2627.9 51.90629.899651.8 8438.05063.9 19825590.0 2902.9 52.95700.02 10557.3 9235.25482.4 19836216.2 3231.1 54.00775.5911510.8 10074.65983.2 19847362.7 3742.0 55.47947.35 13272.8 11565.06745.7 19859076.7 4687.4 60.652040.79 14966.8 11601.77729.2 198610508.5 5302.1 64.572090.37 16273.7 13036.58210.9 198712277.4 6126.1 69.302140.36 17716.3 14627.78840.0 198815388.6 7868.1 82.302390.47 18698.7 15794.09560.5 198917311.3 8812.6 97.002727.40 17847.4 15035.59085.5 199019347.8 9450.9 100.002821.86 19347.8 16525.99450.9 199122577.4 10730.6 103.422990.17 21830.9 18939.610375.8 199227565.2 13000.1 110.033296.91 25053.0 22056.511815.3 199336938.1 16412.1 126.204255.30 29269.1 25897.313004.7 199450217.4 21844.2 156.655126.88 32056.2 28783.413944.2 199563216.9 28369.7 183.416038.04 34467.5 31175.415467.9 199674163.6 33955.9 198.666909.82 37331.9 33853.717092.5 199781658.5 36921.5 204.218234.04 39988.5 35956.218080.6 199886531.6 39229.3 202.599262.80 42713.1 38140.919364.1 199991125.0 41920.4 199.7210682.58 45625.8 40277.020989.3 200098749.0 45854.6 200.5512581.51 49238.0 42964.622863.9 2001108972.4 49213.2 201.9415301.38 53962.5 46385.424370.1 2002120350.3 52571.3 200.3217636.45 60078.0 51274.026243.2 2003136398.8 56834.4 202.7320017.31 67282.2 57408.128035.0 2004160280.4 63833.5 210.6324165.68 76096.3 64623.130306.2 2005188692.1 71217.5 214.4228778.54 88002.1 74580.433214.4 2006221170.5 80120.5 217.6534809.72 101616.3 85623.136811.2资料来源:根据《中国统计年鉴》(2001,2007)整理。

计量经济学 李子奈 第七版 复习题

计量经济学 复习题 一、单选题 1、怀特检验法可用于检验( )。 A.异方差性 B.多重共线性 C.序列相关 D.模型设定误差 2、计量经济学分析问题的工作程序是( )。 A.设定模型,检验模型,估计模型,改进模型 B.设定模型,估计参数,检验模型,应用模型 C.估计模型,应用模型,检验模型,改进模型 D.搜集资料,设定模型,估计参数,应用模型 3、对下列模型进行经济意义检验,哪一个模型是没有实际意义的( )。 A.i C (消费)i I 8.0500+=(收入) B.di Q (商品需求)i I 8.010+=(收入)i P 9.0+(价格) C.si Q (商品供给)i P 75.020+=(价格) D.i Y (产出量)6.065.0i K =(资本)4 .0i L (劳动) 4、戈德菲尔德—匡特检验法可用于检验模型的( )。 A.异方差性 B.多重共线性 C.序列相关 D.设定误差 5、在满足基本假定的情况下,对单方程计量经济学模型而言,下列有关解 释变量和被解释变量的说法中正确的有( )。 A.被解释变量和解释变量均为随机变量 B.被解释变量和解释变量均为非随机变量 C.被解释变量为随机变量,解释变量为非随机变量 D.被解释变量为非随机变量,解释变量为随机变量 6、根据样本资料估计得到人均消费支出Y 对人均收入X 的回归方程为 X Y ln 75.000.2ln += ,这表明人均收入每增加1%,人均消费支出将增加 ( )。 A.2% B.0.75 C.0.75% D.7.5% 7、设k 为回归模型中的解释变量个数,n 为样本容量,则对总体回归模型 进行显著性检验(F 检验)时构造的F 统计量为( )。 A.)1/()/(--=k n RSS k ESS F B. )k n /(RSS )1k /(ESS 1F ---=

计量经济学(李子奈)第三版书中表格数据

计量经济学(第3版)例题和习题数据表

P24-25 表2.1.1 某社区家庭每月收入与消费支出统计表

表2.3.1 参数估计的计算表

表2.6.1 中国各地区城镇居民家庭人均全年可支配收入与人均全年消费性支出(元)

表2.6.3 中国居民总量消费支出与收入资料 单位:亿元年份GDP CONS CPI TAX GDPC X Y 19783605.6 1759.1 46.21519.28 7802.5 6678.83806.7 19794092.6 2011.5 47.07537.828694.2 7551.64273.2 19804592.9 2331.2 50.62571.70 9073.7 7944.24605.5 19815008.8 2627.9 51.90629.899651.8 8438.05063.9 19825590.0 2902.9 52.95700.02 10557.3 9235.25482.4 19836216.2 3231.1 54.00775.5911510.8 10074.65983.2 19847362.7 3742.0 55.47947.35 13272.8 11565.06745.7 19859076.7 4687.4 60.652040.79 14966.8 11601.77729.2 198610508.5 5302.1 64.572090.37 16273.7 13036.58210.9 198712277.4 6126.1 69.302140.36 17716.3 14627.78840.0 198815388.6 7868.1 82.302390.47 18698.7 15794.09560.5 198917311.3 8812.6 97.002727.40 17847.4 15035.59085.5 199019347.8 9450.9 100.002821.86 19347.8 16525.99450.9 199122577.4 10730.6 103.422990.17 21830.9 18939.610375.8 199227565.2 13000.1 110.033296.91 25053.0 22056.511815.3 199336938.1 16412.1 126.204255.30 29269.1 25897.313004.7 199450217.4 21844.2 156.655126.88 32056.2 28783.413944.2 199563216.9 28369.7 183.416038.04 34467.5 31175.415467.9 199674163.6 33955.9 198.666909.82 37331.9 33853.717092.5 199781658.5 36921.5 204.218234.04 39988.5 35956.218080.6 199886531.6 39229.3 202.599262.80 42713.1 38140.919364.1 199991125.0 41920.4 199.7210682.58 45625.8 40277.020989.3 200098749.0 45854.6 200.5512581.51 49238.0 42964.622863.9 2001108972.4 49213.2 201.9415301.38 53962.5 46385.424370.1 2002120350.3 52571.3 200.3217636.45 60078.0 51274.026243.2 2003136398.8 56834.4 202.7320017.31 67282.2 57408.128035.0 2004160280.4 63833.5 210.6324165.68 76096.3 64623.130306.2 2005188692.1 71217.5 214.4228778.54 88002.1 74580.433214.4 2006221170.5 80120.5 217.6534809.72 101616.3 85623.136811.2资料来源:根据《中国统计年鉴》(2001,2007)整理。

李子奈计量经济学分章习题与答案

第一章 导 论 一、名词解释 1、截面数据 2、时间序列数据 3、虚变量数据 4、内生变量与外生变量 二、单项选择题 1、同一统计指标按时间顺序记录的数据序列称为 ( ) A 、横截面数据 B 、虚变量数据 C 、时间序列数据 D 、平行数据 2、样本数据的质量问题,可以概括为完整性、准确性、可比性和 ( ) A 、时效性 B 、一致性 C 、广泛性 D 、系统性 3、有人采用全国大中型煤炭企业的截面数据,估计生产函数模型,然后用该模型预测未来 煤炭行业的产出量,这是违反了数据的哪一条原则。 ( ) A 、一致性 B 、准确性 C 、可比性 D 、完整性 4、判断模型参数估计量的符号、大小、相互之间关系的合理性属于什么检验? ( ) A 、经济意义检验 B 、统计检验 C 、计量经济学检验 D 、模型的预测检验 5、对下列模型进行经济意义检验,哪一个模型通常被认为没有实际价值? ( ) A 、i C (消费)5000.8i I =+(收入) B 、di Q (商品需求)100.8i I =+(收入)0.9i P +(价格) C 、si Q (商品供给)200.75i P =+(价格) D 、i Y (产出量)0.60.65i K =(资本)0.4 i L (劳动) 6、设M 为货币需求量,Y 为收入水平,r 为利率,流动性偏好函数为012M Y r βββμ=+++, 1?β和2 ?β分别为1β、2β的估计值,根据经济理论有 ( ) A 、1?β应为正值,2?β应为负值 B 、1?β应为正值,2 ?β应为正值 C 、1?β应为负值,2?β应为负值 D 、1?β应为负值,2 ?β应为正值 三、填空题 1、在经济变量之间的关系中, 因果关系 、 相互影响关系 最重要,是计量经济分析的重点。 2、从观察单位和时点的角度看,经济数据可分为 时间序列数据 、 截面数据 、 面板数据 。

计量经济学-李子奈-计算题整理集合

计量经济学-李子奈-计算题整理集合

计算分析题(共3小题,每题15分,共计45分) 1 (1)求样本容量n 、RSS 、ESS 的自由度、RSS 的自由度 (2)求可决系数)37.0(-和调整的可决系数2 R (3)在5%的显著性水平下检验1X 、2X 和3X 总体上对Y 的影响的显著性 (已知0.05(3,40) 2.84F =) (4)根据以上信息能否确定1X 、2X 和3X 各自对Y 的贡献?为什么? 1、 (1)样本容量n=43+1=44 (1分) RSS=TSS-ESS=66056-65965=91 (1分) ESS 的自由度为: 3 (1分) RSS 的自由度为: d.f.=44-3-1=40 (1分) (2)R 2=ESS/TSS=65965/66056=0.9986 (1分) 2R =1-(1- R 2)(n-1)/(n-k-1)=1-0.0014?43/40=0.9985 (2分) (3)H 0:1230βββ=== (1分) F=/65965/39665.2/(1)91/40 ESS k RSS n k ==-- (2分) F >0.05(3,40) 2.84F = 拒绝原假设 (2分) 所以,1X 、2X 和3X 总体上对Y 的影响显著 (1分) (4)不能。 (1分) 因为仅通过上述信息,可初步判断X 1,X 2,X 3联合起来 对Y 有线性影响,三者的变化解释了Y 变化的约99.9%。但由于 无法知道回归X 1,X 2,X 3前参数的具体估计值,因此还无法 判断它们各自对Y 的影响有多大。 2、以某地区22年的年度数据估计了如下工业就业模型 i i i i i X X X Y μββββ++++=3322110ln ln ln 回归方程如下: i i i i X X X Y 321ln 62.0ln 25.0ln 51.089.3?+-+-= (-0.56)(2.3) (-1.7) (5.8) 2 0.996R = 147.3=DW 式中,Y 为总就业量;X 1为总收入;X 2为平均月工资率;X 3为地方政府

计量经济学重点 李子奈

1、广义计量经济学和狭义计量经济学 广义…是利用经济理论、数学以及统计学定量研究经济现象的方法统称。(回归分析、投入产出分析、时间序列分析等) 狭义…以揭示经济变量间的关系为目的,主要应用回归分析方法。 单方程模型和联立方程模型 对股票市场的研究VS对金融市场的研究 a. 横截面数据集(cross-sectional data set):即给定时点对个人、家庭、企业、城市、国家或一系列其他单位采集的样本所构成的数据集(应该忽略细小的时间差别) b.时间序列数据集(time series data set): 是由一个或几个变量在不同时间的观测值所构成的。 c.混合横截面数据(pooled cross section): 有些数据既有横截面数据的特点又有时间序列的特点,但每一时点的样本不同,通常是分析政府政策效果的有力数据 d.综列数据(panel data): 由横截面数据集中每个数据的一个时间序列组成。(定点长期调查) 回归分析是关于研究一个应变量对另一个或多个自变量的依赖关系,通过后者的已知或给定值,去估计和预测前者的(总体)均值 随机干扰项的意义: 1。理论的含糊性(其他因素) 2。数据的欠缺(如财富) 3。核心变量与周边变量(或上或下的随机影响) 4。人类行为的内在随机性 5。糟糕的替代变量(永久消费和永久收入) 6。节省原则(多重共线性的影响) 7。错误的函数形式 线性回归模型的假定 1。函数形式: 2。干扰项的零均值:干扰项的零均值的意思是凡是模型不显著含有的并因而归属u的因素,对y的均值都没有系统的影响;正的u值抵销了负的u值,以至于他们对y的平均值的影响为零 3。同方差性:u的同方差性同时也意味着y的同方差性,即随着x的变动,y的取值的分布是一定的,是分布不变的。 4。无自相关:干扰项之间的无自相关意味着y的决定与其他期的u值无关,即不存在u(t-1)决定u(t)从而决定y的情况 5。回归量与干扰项的非相关:干扰项与自变量之间的非相关,干扰项本身是独立于自变量之外的,且如果干扰项与自变量存在相关,则不能独自说明其作用 6。正态性: 普通最小二乘法 总体回归函数(PRF)与样本回归函数(SRF)之差的平方和最小为最小二乘法的准则。 估计参数的特性 最小二乘估计量的线性和无偏性质 所谓线性即估计量是y的一个线性函数 所谓无偏即系数估计量的期望等于系数原值 估计参数的方差、标准差,协方差(注意到x的变差越大,则估计参数的方差越小)(如果

李子奈---计量经济学--第三版--考点整理(新)

题型 1、名词解释(5题10分) 2、选择题(10题20分) 3、判断题(8题8分) 4、问答题(2题20分) 5、计算题(3题42分) 一.名词解释 1.计量经济学:计量经济学是一门从数量上研究物质资料的生产、交换、分配、消费等经济关系和经济活动规律及其应用的科学。 2.数据质量:数据满足明确或隐含需求程度的指标。 3.相关分析:主要研究变量之间的相互关联程度,用相关系数表示。包括简单相关和多重相关(复相关)。 4.回归分析:研究一个变量(因变量)对于一个或多个其他变量(解释变量)的数量依存关系。其目的在于根据已知的解释变量的数值来估计或预测因变量的总体平均值。 5.面板数据:时间序列数据和截面数据的混合。 时间序列数据:一批按先后顺序排列的统计数据。截面数据:是一批发生在同一时间截面上的调查数据。 6.拟合优度(修正的拟合优度):指检验模型对样本观测值的拟合程度,用R2表示,该值越接近1拟合程度越好。 7.异方差:对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。 8.自相关:自相关是在时间序列资料中按时间顺序排列的观测值之间的相关或在横截面资料中按空间顺序排列的观测值之间的相关。 9.多重共线性:解释变量之间存在完全的或近似的线性关系。

解释变量存在完全的线性关系叫完全多重共线;解释变量之间存在近似的线性关系叫不完全(近似)多重共线。 10.工具变量:在模型估计过程中被作为工具使用,以替代模型中与随机误差项相关的随机解释变量。 11.虚拟变量:根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量,记为D。 12.滞后变量:滞后变量是指在回归模型中,因变量与解释变量的时间滞后量。 13.分布滞后模型:若滞后变量模型中没有滞后被解释变量,仅有解释变量X的当期值,称为分布滞后模型。(自回归模型:如果滞后变量模型中的解释变量仅包含X的当期值与被解释变量Y的一个或多个滞后值,则称为自回归模型。) 14.联立方程模型:需要多个单一方程和在一起的联立方程组来描述。这个方程组就是描述这个经济系统的联立方程模型。 15.内生(外生)变量:内生变量指由模型系统内决定的变量,取值在系统内决定,如D、S、P。 外生变量指模型系统外决定的变量,本身不受系统的影响。如Y、W 等。政策变量属于外生变量。 16.前定变量:所有的外生变量和滞后的内生变量。 前定变量=外生变量+滞后内生变量+滞后外生变量。 17.结构式(简化式)模型:体现经济理论中经济变量之间的关系结构的联立方程模型,称为结构式模型。

计量经济学(李子奈第4版)数据表(全)

计量经济学(第4版)数据表 表2.1.1 某社区家庭每月收入与消费支出统计表 每月家庭可支配收入X (元) 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 每 月 家 庭 消 费 支 出 Y (元) 561 638 869 1023 1254 1408 1650 1969 2090 2299 594 748 913 1100 1309 1452 1738 1991 2134 2321 627 814 924 1144 1364 1551 1749 2046 2178 2530 638 847 979 1155 1397 1595 1804 2068 2266 2629 935 1012 1210 1408 1650 1848 2101 2354 2860 968 1045 1243 1474 1672 1881 2189 2486 2871 1078 1254 1496 1683 1925 2233 2552 1122 1298 1496 1716 1969 2244 2585 1155 1331 1562 1749 2013 2299 2640 1188 1364 1573 1771 2035 2310 1210 1408 1606 1804 2101 1430 1650 1870 2112 1485 1716 1947 2200 2002 共计 2420 4950 11495 16445 19305 23870 25025 21450 21285 15510 表2.3.1 参数估计的计算表 i X i Y i x i y i i y x 2i x 2i y 2i X 2i Y 1 800 638 -1350 -945 892836 640000 407044 2 1100 935 -1050 -648 680295 419774 874225 3 1400 1155 -750 -428 320925 562500 183098 4 1700 1254 -450 -329 14800 5 202500 108175 5 2000 1408 -150 -175 26235 22500 30590 6 2300 1650 150 6 7 10065 22500 4502 7 2600 1925 450 342 153945 202500 117032 8 2900 2068 750 485 363825 562500 235322 9 3200 2266 1050 683 717255 466626 10 3500 2530 1350 947 896998 求和 21500 15829 平均 2150 1583

计量经济学试验完整版--李子奈

计量经济学试验完整版--李子奈 计量经济学试验??李子奈 目录 实验一一元线性回归5 一实验目的 5 二实验要求 5 三实验原理 5 四预备知识 5 五实验内容 5 六实验步骤 5 1.建立工作文件并录入数据 5 2.数据的描述性统计和图形统计: 7 3.设定模型,用最小二乘法估计参数: 8 4.模型检验: 8 5.应用:回归预测: 9 实验二可化为线性的非线性回归模型估计、受约束回归检验及参数稳定性检验12 一实验目的: 12 二实验要求12 三实验原理12

四预备知识12 五实验内容12 六实验步骤13 实验三多元线性回归14 一实验目的14 三实验原理15 四预备知识15 五实验内容15 六实验步骤15 6.1 建立工作文件并录入全部数据 15 6.2 建立二元线性回归模型15 6.3 结果的分析与检验16 6.4 参数的置信区间16 6.5 回归预测17 6.6 置信区间的预测18 实验四异方差性20 一实验目的20 二实验要求20 三实验原理20 四预备知识20 五实验内容20 六实验步骤20

6.1 建立对象: 20 6.2 用普通最小二乘法建立线性模型21 6.3 检验模型的异方差性21 6.4 异方差性的修正24 实验五自相关性28 一实验目地28 二实验要求28 三实验原理28 四预备知识28 五实验内容28 六实验步骤28 6.1 建立Workfile和对象 29 6.2 参数估计、检验模型的自相关性29 6.3 使用广义最小二乘法估计模型 33 6.4 采用差分形式作为新数据,估计模型并检验相关性35 实验六多元线性回归和多重共线性37 一实验目的37 二实验要求37 三实验原理37 四预备知识37 五实验内容37 六实验步骤37

《计量经济学》第三版课后题答案李子奈

第一章绪论 参考重点: 计量经济学的一般建模过程 第一章课后题(1.4.5) 1.什么是计量经济学?计量经济学方法与一般经济数学方法有什么区别? 答:计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科,是由经济学、统计学和数学三者结合而成的交叉学科。 计量经济学方法揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述;一般经济数学方法揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。 4.建立与应用计量经济学模型的主要步骤有哪些? 答:建立与应用计量经济学模型的主要步骤如下:(1)设定理论模型,包括选择模型所包含的变量,确定变量之间的数学关系和拟定模型中待估参数的数值范围;(2)收集样本数据,要考虑样本数据的完整性、准确性、可比性和—致性;(3)估计模型参数;(4)检验模型,包括经济意义检验、统计检验、计量经济学检验和模型预测检验。 5.模型的检验包括几个方面?其具体含义是什么? 答:模型的检验主要包括:经济意义检验、统计检验、计量经济学检验、模型的预测检验。在经济意义检验中,需要检验模型是否符合经济意义,检验求得的参数估计值的符号与大小是否与根据人们的经验和经济理论所拟订的期望值相符合;在统计检验中,需要检验模型参数估计值的可靠性,即检验模型的统计学性质;在计量经济学检验中,需要检验模型的计量经济学性质,包括随机扰动项的序列相关检验、异方差性检验、解释变量的多重共线性检验等;模型的预测检验主要检验模型参数估计量的稳定性以及对样本容量变化时的灵敏度,以确定所建立的模型是否可以用于样本观测值以外的范围。 第二章经典单方程计量经济学模型:一元线性回归模型参考重点: 1.相关分析与回归分析的概念、联系以及区别? 2.总体随机项与样本随机项的区别与联系?

研究生计量经济学考点精要(李子奈)教学提纲

计量经济学(2012-1-6) 1.计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科。 2.区分数理经济模型和计量经济模型:(1)数理经济模型揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。(2)计量经济模型揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述。 3.计量经济学的内容体系分类 (1)计量经济学有广义和狭义之分: 广义计量经济学:是利用经济理论、数学以及统计学定量研究经济现象的经济计量方法的统称。包括回归分析方法、投入产出分析方法、时间序列分析方法等。 狭义计量经济学:也就是我们通常所说的计量经济学,以揭示经济现象中的因果关系为目的,在数学上主要应用回归分析方法。 (2)根据研究对象和内容侧重面不同,可以分为理论计量经济学和应用计量经济学。 (3)按数据类型划分为:截面(cross-section)分析;时间序列(time-series)分析;平行数据(panel data)分析;离散数据(discrete data)分析;模糊数据(fuzzy data)分析。 (4)按模型类型划分:单方程模型与联立方程模型(单方程模型的研究对象是单一经济现象,揭示存在其中的单向因果关系。联立方程模型的研究对象是一个经济系统,揭示存在其中的复杂的因果关系。);线性模型与非线性模型;静态模型与动态模型;参数模型与非参数模型。 (5)按估计方法划分:从最小二乘原理出发的估计方法;从最大似然原理出发的估计方法;矩估计方法;非样本信息估计方法。 4.建立计量经济学模型的步骤: (1)理论模型的设计;(主要包含三部分工作:即选择变量、确定变量之间的数学关系、拟定模型中待估计参数的数值范围) (2)样本数据的收集;(样本数据的质量问题大体上可以概括为完整性、准确性、可比性和一致性) (3)模型参数的估计;(模型参数的估计方法,是计量经济学的核心内容) (4)模型的检验。(经济意义检验、统计学检验、计量经济学检验和预测检验) 5.计量经济学模型成功的三要素:理论、方法和数据。 理论:即经济理论,所研究的经济现象的行为理论,是计量经济学研究的基础。 方法:主要包括模型方法和计算方法,是计量经济学研究的工具与手段,是计量经济学不同于其它经济学分支学科的主要特征。 数据:反映研究对象的活动水平、相互间联系以及外部环境的数据,或更广义讲是信息,是计量经济学研究的原料。 6.经典计量经济学方法的核心是采用回归分析的方法揭示变量之间的因果关系。 7.计量经济学模型的应用大体可以被概括为四个方面:结构分析、经济预测、政策评价、检验与发展经济理论。 结构分析所采用的主要方法是弹性分析、乘数分析与比较静力分析。 8.经济变量之间的关系,大体可分为两类: 确定性关系或函数关系:研究的是确定性现象非随机变量间的关系。 统计依赖关系或相关关系:研究的是非确定性现象随机变量间的关系。 9. 回归分析是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。 其中:前一个变量被称为被解释变量(Explained V ariable )或因变量(Dependent Variable )。 后一个(些)变量被称为解释变量(Explanatory Variable )或自变量(Independent Variable )。 10.总体回归函数: 给定解释变量X 的某个确定值Xi ,与之统计相关的被解释变量Y 的总体均值(期望值)可以表示为: 上式说明了被解释变量Y 平均地说随解释变量X 变化的规律,一般称为 ()()i i E Y X f X

相关文档
最新文档