第10章 设定误差与模型选择(计量经济学-中南财经政法大学,向书坚)分析

合集下载

20世纪90年代时间序列预测领域主要研究动态

20世纪90年代时间序列预测领域主要研究动态

2001年第2期双月刊总第125期中南财经大学学报JOU RNAL O F ZHON GNAN UN I V ER S IT Y O F F I NAN CE AND ECONOM I CS№.2.2001B i m on th lySerial№.12520世纪90年代时间序列预测领域主要研究动态向书坚(中南财经政法大学信息学院,湖北武汉430064) 摘要:20世纪90年代,预测领域取得了比较丰硕的研究成果。

预测方法除主观判断方法外,主要有单变量方法和多变量方法。

单变量方法在实际中使用最多,主要涉及分数差分模型、结构模型、贝叶斯预测方法。

多元回归方法仍是最常用的多变量预测方法,但对经济时间序列拟合多元回归模型存在一些问题,于是人们对向量回归模型进行了大量的研究。

本文着重分析了国外学者关于预测方法的选择以及非线性模型的研究动态。

关键词:时间数列;分数差分;结构模型;神经网络中图分类号:F244 文献标识码:A 文章编号:100325230(2001)022******* 一、预测方法预测方法虽然众多,但可以简单地归纳为三类,第一类是主观判断方法,如德菲尔专家预测法;第二类是单变量方法(或称一元方法);第三类是多变量方法(或称多元方法)。

由于主观判断方法相对简单,应用范围有限,故本文主要讨论与后两类方法有关的研究情况。

(一)单变量方法。

相对于其他方法,单变量预测方法仍然是实际中使用最多的方法。

1.分数差分模型。

有人对A R I M A模型的替换形式进行过研究,即使用分数差分方式建立A R I M A模型。

模型的一般表达式为:Υ(B)(1-B)d X t=Η(B)Z t上式中,X t表示时间序列中第t期的观测值,Z t表示“误差”项,Υ和Η表示后移算子B中阶数为p和q的多项式,d为整数(通常取0或1)。

分数A R I M A模型是对上述模型的扩展,即允许d取小数,而且取值范围常常为0<dΦ12,在该区间内,随机过程平稳。

模型选择标准与检验

模型选择标准与检验

观察渗透理论theory-laden observation
• 美国科学哲学家汉森(Norwood Russell Hanson (1924– 1967) )提出旳著名命题。这个命题指出了我们 旳任何观察都不是纯粹客观旳,具有不同知 识背景旳观察者观察同一事物,会得出不同 旳观察成果。该理论破坏了逻辑实证主义所 追求旳科学合理性。
• (5) 一般估计旳a2旳方差是真实估计量b2旳 方差旳有偏估计量。虽然是b32等於零(也即 X2与X3不有关),这一方差依然是有偏旳
• (6) 一般旳置信区间和假设检验过程也就不 再可靠。
(2)假如X2与X1不有关,则1旳估计满足无偏性与 一致性;但这时0旳估计却是有偏旳。
由 Y=0+ 1X1+v 得
Inclusion of irrelevant variables: “overfitting” a model
• “过分拟合”(涉及非必须变量)旳逻辑思想是 涉及一种或多种不必要变量也不会有太大旳影 响—非有关变量是指没有详细旳理论表白应该 把这些变量涉及到模型中。
• 假如经济理论不完善,这種现象会發生。
x12i
1 2
x1i x2i x12i
x1i (i )
x12i
(1)假如漏掉旳X2与X1有关,则上式中旳第二项在小样本下 求期望与大样本下求概率极限都不会为零,从而使得OLS 估计量在小样本下有偏,在大样本下非一致。
“过低拟合”模型
• (2) a1和a2是不一致旳inconsistent,亦即, 不论样本容量有多大,偏差都不会消失。
用OLS法估计模型Y=0+1X1+2X2+ 因为全部旳经典假设都满足,所以 : (1)OLS估计量无偏且一致;误差项方差旳估计量正确。

[课件]第2章回归分析概要(计量经济学-中南财经政法大学,向书坚)PPT

[课件]第2章回归分析概要(计量经济学-中南财经政法大学,向书坚)PPT
i
0 1 i
非线性如: E ( Y / X 0 i)
X 1 i
本课程研究的“线性”主要针对参数而言,包含两种情 况:①对参数和变量均为线性; ②对参数为线性而对变量X则为非线性
2018/12/2
11

§2.1.5 回归与相关




回归分析和相关分析都是研究变量间关系的统计学 课题 两者的主要差别: ◇回归分析中需要区别自变量和因变量;相关分析 中则不需要区分 ◇相关分析中所涉及的变量y与x全是随机变量。而 回归分析中,因变量y是随机变量,自变量x 可以是 随机变量,也可以是非随机的确定变量 ◇相关分析的研究主要是为刻画两类变量间线性相 关的密切程度。而回归分析不仅可以揭示变量X对 变量y的影响大小,还可以由回归方程进行预测和 控制
◎一种极端的情况是一个变量的变化能完全决 定另一个变量的变化
9

2018/12/2

高档消费品的销售量与城镇居民收入之间的关系



粮食产量与施肥量之间的关系 储蓄额与居民收入之间的关系 广告支出与商品销售额 工业增加值与能源消耗量 数学成绩与统计学成绩 ◎以上变量间关系的一个共同特征是它们之间
2018/12/2
5
2018/12/2
6
2018/12/2
7
2018/12/2
8

§2.1.3 统计关系与确定性关系



社会经济与自然科学等现象之间的相互 联系和制约是一个普遍规律 ★要认识和掌握客观经济规律就必须探 求经济现象间经济变量的变化规律,变 量间的统计关系是经济变量变化规律的 重要特征 ★互有联系的经济现象及经济变量间关 系的紧密程度各不一样

计量经济学中级教程(潘省初清华大学出版社)课后习题答案

计量经济学中级教程(潘省初清华大学出版社)课后习题答案

计量经济学中级教程(潘省初清华大学出版社)课后习题答案计量经济学中级教程习题参考答案第一章绪论1.1 一般说来,计量经济分析按照以下步骤进行:(1)陈述理论(或假说)(2)建立计量经济模型(3)收集数据(4)估计参数(5)假设检验(6)预测和政策分析 1.2 我们在计量经济模型中列出了影响因变量的解释变量,但它(它们)仅是影响因变量的主要因素,还有很多对因变量有影响的因素,它们相对而言不那么重要,因而未被包括在模型中。

为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。

1.3 时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。

横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。

如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。

1.4 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。

在一项应用中,依据估计量算出的一个具体的数值,称为估计值。

如Y 就是一个估计量,1nii YYn==∑。

现有一样本,共4个数,100,104,96,130,则根据这个样本的数据运用均值估计量得出的均值估计值为5.107413096104100=+++。

第二章经典线性回归模型2.1 判断题(说明对错;如果错误,则予以更正)(1)对(2)对(3)错只要线性回归模型满足假设条件(1)~(4),OLS 估计量就是BLUE 。

(4)错R 2 =ESS/TSS 。

(5)错。

我们可以说的是,手头的数据不允许我们拒绝原假设。

(6)错。

因为∑=22)?(tx Var σβ,只有当∑2t x 保持恒定时,上述说法才正确。

2.2 应采用(1),因为由(2)和(3)的回归结果可知,除X 1外,其余解释变量的系数均不显著。

第10讲 如果误差项相关会有什么结果

第10讲 如果误差项相关会有什么结果

如何估计rou
从durbin – watson d中估计rou
d ˆ ρ ≈ 1− 2
Copyright © 2008 by Sun Jianjun. All Rights Reserved.
Institute of Securities and Investments of Hainan University
由于式1414本质上是一个非线性回归模型因为同时要对beta与rou进行估计故eviews采用marquardtnonlinearleastsquaresalgorithm方法估计书上的所有补救方法均是求出rou的估计后的ols方法
Institute of Securities and Investments of Hainan University
Copyright © 2008 by Sun Jianjun. All Rights Reserved.
Institute of Securities and Investments of Hainan University
Yt − ρYt −1 = β1 (1 − ρ ) + β 2 ( X t − ρ X t −1 ) + υt
Copyright © 2008 by Sun Jianjun. All Rights Reserved.
Institute of Securities and Investments of Hainan University
讲授完毕 欢迎指正 谢谢
海南大学 证券与投资研究所 孙建军 博士
Copyright © 2008 by Sun Jianjun. All Rights Reserved.
Durbin-Watson d statistic

计量经济学:模型总体设定

计量经济学:模型总体设定

• 错例1:在一篇研究制度变迁与经济增长的关系的 博士论文中,建立了如下模型:
ln GDP t 0 1 ln MDIt t
其中,GDP表示国内生产总值,MDI表示制度变 迁。估计得到
ˆ 2.1 1
结论:制度变迁对于GDP的弹性系数为2.1。即制 度变迁变化1%,国内生产总值将变化2.1%。
• 基于时间序列数据的计量经济学模型由于存在非平稳性和 序列相关性,其统计分析理论方法得到了迅速的发展,一 方面为模型总体设定提供了强大的工具,另一方面又将模 型设定引入仅仅依赖数据的歧途。
• 对时间序列的非平稳性的识别与处理构成了数据关系转向 的主要内容; • 在非平稳随机过程之间,建立恒常的数据关系,成为数据 关系导向中时间序列分析的主要目标。
• 从这个意义上,单位根检验、因果关系检验和协整检验理 论,给出了总体回归模型设定的有效工具。
• 这就是计量经济学模型总体设定的“统计检验必要性”原 则。
五、计量经济学模型总体设定的“经济 主体动力学关系导向”原则
• 关于计量经济学模型总体设定的讨论,必须首先 回答:
– 要确定的是经济主体内在的本质意义的属性,还是经 济主体之间的关系意义的属性。 – 要确定的是主体之间的动力学关系,还是作为主体经 济活动结果的经济变量之间的数据关系。
1、模型总体设定
• 两种基本总体模型:
– 一是静态的总体模型。主要是描述经济因素之间不随 时间演变的静态平衡结构,力图揭示经济系统的平衡 关系法则,对应的总体是不随时间变化的静态随机分 布,通常利用截面数据来估计总体模型参数。 – 二是动态的总体模型。主要是描述持续演变的经济因 素之间的动态平衡结构,力图揭示经济系统的演变法 则,对应的总体是在时间维度上持续发生的随机过程, 通常利用时间序列数据来估计总体模型参数。

第十章定性选择模型计量经济学潘省初

第十章定性选择模型计量经济学潘省初

log F (zi ) 1 F (zi )
exp(zi )
exp(zi )
log 1 exp(zi ) log
1 exp(zi )
1 exp(zi )
1 exp(zi ) exp(zi )
1 exp(zi )
1 exp(zi )
exp(zi )
log 1 exp(zi ) 1
log exp(zi )
INCOME的系数估计值0.002表明,一个学生的成 绩不变,而家庭收入增加1000美元,该生决定去读研 的概率的估计值增加0.002。
LPM模型中,解释变量的变动与虚拟因变量值为1 的概率线性相关,因而称为线性概率模型。
线性概率模型存在的问题
(1)线性概率模型假定自变量与Y=1的概率之间存 在线性关系,而此关系往往不是线性的。 (2)拟合值可能小于0或大于1,而概率值必须位于 0和1的闭区间内。
由于累积正态分布和累积logistic分布很接近,
只是尾部有点区别,因此,我们无论用(10.11)还
பைடு நூலகம்
是(10.12),也就是无论用logit法还是probit法,
得到的结果都不会有很大不同。可是,两种方法得
到的参数估计值不是直接可比的。由于logistic分布
的方差为
2
3
,因此,logit模型得到的的估计值必
Variable Coefficient Standard error t-Statistic
Constant
-0.51
0.19
-2.65
INCOME
0.0098
0.003
3.25
AGE
0.016
0.0053
3.08

第十章 计量经济学-模型设定.

第十章 计量经济学-模型设定.

对多元回归,非线性函数可能是关于若干个 或全部解释变量的非线性,这时可按遗漏变量的 程序进行检验。 例如,估计 Y=0+1X1+2X2+
但却怀疑真实的函数形式是非线性的。 这时,只需以估计出的Ŷ的若干次幂为“替代” 变量,进行类似于如下模型的估计
ˆ2 Y ˆ3 Y 0 1 X1 2 X 2 1Y 2
2.39 9.52
• 由所得系数可以看出,两种情况下均造成高估所保留变量的参数, 据此做分析可能导致得出错误的结论。 • 两个参数所处的区间应该分别为0 1 0.454 和 0 2 0.051
关于遗漏必要的解释变量的总结
• 遗漏必要的解释变量是一种严重的错误,必须 注意避免。 • 对别人的研究成果做评价时,是否存在遗漏必 要解释变量的错误是需要考察的最重要的一个 方面。
例如,先估计 Y=0+ 1X1+v 得 ˆ ˆ0 ˆ1 X 1 Y
ˆ2 Y ˆ3 Y 0 1 X 1 1Y 2
再根据增加解释变量的F检验来判断是否增加这 些“替代”变量。 若仅增加一个“替代”变量,也可通过t检验来 判断。
RESET检验也可用来检验函数形式设定偏误的 问题。
ˆ ) 2 Var( 1
ˆ1 ) Var(
2 x 1i
2
x
2 1i
x ( x1i x2i )
2 2i
x
2 2i
2

2 2 x ( 1 r 1i x1x2 )
2
如果X2与X1相关,显然有 如果X2与X1不相关,也有
ˆ) ˆ1 ) Var( Var( 1 ˆ) ˆ1 ) Var( Var( 1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
14
§ 10.4.2 名义与真实的显著水平
如果真实模型中有c个变量,而在建立模
型时只选取了k个变量作回归。那么原先确
定的显著水平并不能反应参数的真实显著水
平。真实显著水平 * 和名义显著水平 有如下关系:
* 1 (1 )c/ k
可以近似为: * (c / k )a



,由上式可以计算出真
其中 Yi* Yi i
,X
* i
Xi
vi
,i , vi

是测量误差
返回
6
§ 10.3 设定误差的后果
1、漏掉一个有关变量
为了避免使用矩阵代数,选用一个只有两个自变量的模型来说明。
真实模型:Yi 1 2 X 2i 3 X 3i ui
如用下述模型 Yi 1 2 X 2i vi
拟合,将漏掉 X 3 ,其后果
(
x2 )( 2i
x2 ) ( 3i
x2i x3i )2
(
yi x2i )(
x32i )
yi x2i
( x2 )( x2 ) x2
2i
3i
2i
9
也就是 ˆ2 ˆ2
。因此E(ˆ2) E(ˆ2)
,可以自己验证。
。对于E(ˆ1) 1
其实只要清楚系数估计量的表达式,对上述两条
结论的验证应该比较容易。
1
2 X i
3
X
2 i
4
X
3 i
5
X
4 i
u3i
u3i
u1i
5
X
4 i
u1i
误差项可以看做:
(在原模型中5 0)
5
③错误的函数形式:
ln Yi
1
2 X i
ห้องสมุดไป่ตู้
3
X
2 i
4
X
3 i
u4i
因变量以对数的形式出现在模型中。
④测量误差:
Y* i
* 1
*X* 2i
*
3
X
*2 i
X * *3 4i
u* i
(3)随机误差项的方差无法正确估计,致使参数
估计量的检验无法得出正确的结论。即
E(ˆ 2) Var(u)
E(ˆ 2 /
t检验失效
x2i ) Var(ˆ2 )
(4)习




的ˆ

2

差(
2 )是真实估计量
x22i
ˆ

2




量,









假设



的统计显著性容易得出错误结论
10
预测功效。预测是计量经济模型一个很重要的功能。注意:
R2 大并不能保证模型有好的预测精度
返回
4
§ 10.2 设定误差的类型
以立方总成本函数为例来说明。
Yi
1
2Xi
3
X
2 i
4
X
3 i
u1i
①漏掉一个变量:Yi
1
2 Xi
3
X
2 i
u2i
误差项可以看做:
u2i
u1i
4
X
3 i
②包含无关变量:Yi
返回
13
§ 10.4 设定误差的检验
§ 10.4.1对多余变量的侦查
假定为了解释某一现象而建立一个k变量的模型: Yi 1 2 X 2i 3 X 3i ... k X ki ui
对于X k 是否属于模型,一个简单的办法是作t检验, 即 t ˆk / se(ˆk )是否显著。这种思路在实际中很不可 取,因为这样就意味着凡是参数检验不显著的变量都 被排除在模型之外,显著的就包含在模型中。而不去 考虑这些变量的舍取是否有理论上的依据。
(2) i 的估计量是非有效的,即
Var(ˆi ) Var(ˆi )
11
对于第二点的解释:
由ols所估计的结果有
Var(ˆ2 )
2
x2
2i
Var(ˆ2 )

所以
Var(ˆ2 ) Var(ˆ2 )
1 1 r223
1
2
x
2
2i
(1
r223
)
Var(ˆ2) Var(ˆ2)
12
两种设定误差的后果比较: 遗漏有关变量。参数估计量有偏非一致,随机误差 项的方差估计亦不正确,致使区间估计和假设检验 都得不到正确的结论。 包含无关变量。参数估计量无偏且一致,随机误差 项的方差估计量为非有效的估计量,参数的统计推 断精度降低。 因此,不能简单认为与其略掉有关变量不如含有无 关变量。
2、包含无关变量
真实模型 Yi 1 2 X 2i ui
误设模型 Yi 1 2 X 2i 3 X 3i vi
后果:
(1)参数的ols估计量性质都还不错。 E(ˆ1) 1 E(ˆ2 ) 2 , E(ˆ2 ) 2 ,E(ˆ3 ) 3 0 。
E(ˆ 2 ) Var(u) ,置信区间和假设检验仍然有效。
x2i
2
x3i
)
yi x2i (Yi Y )(X2i X2)
8
在误设模型中
ˆ2
yi x2i x2
2i
再看第二条中的结论: E(ˆ1) 1 E(ˆ2 ) 2 我们只分析 ˆ2 ,
如果 X 2 与 X 3 不相关,那么 x2i x3i 0 ,即
ˆ2 (
yi x2i )( x32i ) ( yi x3i )( x2i x3i )
(1)如果 X 2 与 X 3 相关,则 ˆ1 ,ˆ 2 是 1, 2 的有偏
非一致估计。即无论样本容量有多大,
E(ˆ1) 1 E(ˆ2 ) 2
7
(2)即便 X 2 与X 3 不相关,此时 ˆ1 仍是有偏的,ˆ2 则
是无偏。
怎么理解上面两点?先看两个模型的系数估计表达式。
在真实模型中
这里小写ˆ字2 母(表示y(对i x2应i )x(变22i )量(x32的i )x离32i ()差,(yi例x3x如i2)i(x:3i )
实c的显1著5 水平k 5 。 5%
* 15%
15
§ 10.4.3 对遗漏变量和不正确的函数形式的检验
1、残差分析(仍然以前面的立方总成本函数为例)
Yi
1 2 X i
3
X
2 i
4
X
3 i
u1i
如果用二次函数拟合
Yi
1
2 X i
3
X
2 i
u2i
又或者用线性函数拟合
注意与后面韩德瑞的建模思想进行比较。 韩的建模思想是由一般到简单,即由尽可能 多变量进行约化,直到最后几个能通过检验 的变量。 (从一般到简单)
3
AER方法建模所所需遵循的准则:
节省性;以实用为标准,模型尽可能简单
识别性;同一参数必须有一个确定的估计值
拟合优度;拟合优度是评价模型好坏的标准之一
理论一致性;正确的系数符号,以保证模型能给出合理的经 济意义上的解释。
第10章
设定误差与模型选择
1
第10章 设定误差与模型选择
1、计量经济建模的传统观点:平均经济回归 2、设定误差类型 3、设定误差的后果 4、设定误差的检验 5、观测误差
2
§ 10.1 计量经济建模的传统观点
被称为平均经济回归(AER)建模思想是: 从含有一定个数的回归元的一个模型开始, 经过诊断,然后把越来越多的变量加到模型 中来。 (从简单到复杂)
相关文档
最新文档