计量经济学课件第9章
古扎拉蒂计量经济学第四版讲义Ch9 Model Specification

第九章模型设定Model Specification and Diagnostic Testing1. Introduction假如模型没有被正确设定,我们会遇到model specification error或model specification bias 问题。
本章主要回答这些问题:1、选择模型的标准是什么?2、什么样的模型设定误差会经常遇到?3、模型设定误差的后果是什么?4、有那些诊断工具来发现模型设定误差?5、如果诊断有设定误差,如何校正,有何益处?6、怎样评估相互竞争模型的表现(model evaluation)?Model Selection Criteria这是笼统的模型选择标准:1、利用该模型进行预测在逻辑上是可能的;2、模型的参数具有稳定性,否则,预测就很困难。
弗里德曼说:模型有效性的唯一检验标准就是比较模型的预测是否与经验一致。
3、模型要与经济理论一致。
4、解释变量必须与误差项不相关。
5、模型的残差必须是白噪声;否则就存在模型设定误差。
6、最后选择的模型应该涵盖其它可能的竞争模型;也就是说,其他模型不应该比所选模型的表现更好。
Types of specification errors大概有这几种设定误差:设定误差之一:所选模型忽略了重要的解释变量(该解释变量被包含在模型误差中)设定误差之二:所选模型包含了不必要或不相关的解释变量设定误差之三:所选模型具有错误的方程形式(比如y采用了不该采用的对数转换)设定误差之四:被解释变量and/or解释变量测量偏差(所用数据相对于真实值有偏差)导致的误差(commit the errors of measurement bias)设定误差之五:随机误差项进入模型的形式不对引起的误差(比如是multiplicatively还是additively)The assumption of the CLRM that the econometric model is correctly specified has two meanings. One, there are no equation specification errors, and two, there are no model specification errors.上面概括的五种设定误差称为equation specification errors。
9第九章 多维时间序列分析

DF检验假设了所检验的模型的随机扰动 项不存在自相关。对有自相关的模型, 需用ADF检验。 ADF检验:将DF检验的右边扩展为包含Yt 的滞后变量,其余同于DF检验。
构造统计量 查表、判断。
单位根检验: 单位根检验:ADF检验的方程式 检验的方程式
∆Yt= β0+β1t+δYt-1+αΣ ∆Yt-i + µt 其中i从1到m。 这一模型称为扩充的迪基-富勒检验。 因为ADF检验统计量和DF统计量有同样 的渐进分布,所以可以使用同样的临界 值。
模型形式
自回归条件异方差性模型 (Autoregressive Conditional Heteroscedasticity Model, ARCH) 简单形式
σt2 =α0 +α1εt2 1 −
即,εt的方差依赖于前一期误差的平方, 或者说,εt存在着以εt-1的变化信息为条件的 异方差。记成ARCH(1)
随机游走的比喻
一个醉汉的游走。醉汉离开酒吧后在时 刻t移动一个随机的距离ut,如果他无限 地继续游走下去,他将最终漂移到离酒 吧越来越远的地方。 股票的价格也是这样,今天的股价等于 昨天的股价加上一个随机冲击。
随机游走的表达式 Yt=ρYt-1+ µt (1) 等价于: Yt -Yt-1 =ρYt-1 -Yt-1 + µt 等价于: Yt -Yt-1 =(ρ-1)Yt-1 + µt 等价于: ∆Yt=δ Yt-1+ µt (2) “有单位根”=“ρ=1”=“δ=0”
1 Yt= 1 +(a11Yt−1 +⋯ 1mY −1) +⋯ (a11Yt−p +⋯ 1p Y −p ) +u1t c a1 mt + p1 a m mt 1 1
第9章 时间序列计量经济学模型的理论与方法-李子奈计量经济学课件

第九章时间序列计量经济学模型的理论与方法第一节 时间序列的平稳性及其检验第二节 随机时间序列模型的识别和估计第三节 协整分析与误差修正模型1§9.1 时间序列的平稳性及其检验一、问题的引出:非平稳变量与经典回归模型二、时间序列数据的平稳性三、平稳性的图示判断四、平稳性的单位根检验五、单整、趋势平稳与差分平稳随机过程2一、问题的引出:非平稳变量与经典回归模型3⒊ 数据非平稳,往往导致出现“虚假回归”问题表现在:两个本来没有任何因果关系的变量,却有很高的相关性(有较高的R2):例如:如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。
在现实经济生活中:情况往往是实际的时间序列数据是非平稳的,而且主要的经济变量如消费、收入、价格往往表现为一致的上升或下降。
这样,仍然通过经典的因果关系模型进行分析,一般不会得到有意义的结果。
7时间序列分析模型方法就是在这样的情况下,以通过揭示时间序列自身的变化规律为主线而发展起来的全新的计量经济学方法论。
时间序列分析已组成现代计量经济学的重要内容,并广泛应用于经济分析与预测当中。
8二、时间序列数据的平稳性9时间序列分析中首先遇到的问题是关于时间序列数据的平稳性问题。
假定某个时间序列是由某一随机过程(stochastic process)生成的,即假定时间序列{X t}(t=1, 2,t=1, 2, ……)的每一个数值都是从一个概率分布中随机得到,如果满足下列条件:1)均值E(X t)=µ是与时间t 无关的常数;2)方差Var(X t)=σ2是与时间t 无关的常数;3)协方差Cov(X t,X t+k)=γk是只与时期间隔k有关,与时间t 无关的常数;则称该随机时间序列是平稳的(stationary),而该随机过程是一平稳随机过程(stationary stochastic process)。
《计量经济学》课件

本课程重点是实践案例、计量模型和数据分 析技巧。
学习资源
课程教材
本课程所用教材为《计量经济 学》(第二版,高等教育出版 社)。
参考资料
课程还提供丰富的参考及 自主学习提高学习效果。
评估方式
1
作业
每周有一个统计分析作业,和一个回
考试
我们欢迎学生分享反馈、与教 师和同学一起讨论和学习。祝 大家学习愉快!
数据分析技巧
课程将介绍数据预处理和 清洗、模型诊断和结果解 释等实用数据分析技巧。
结语
毕业资格
获得60分及以上,完成所有作 业及考试,满足毕业要求即可 获得毕业资格。
继续学习
本课程旨在为学生提供实用的 计量经济学研究工具及数据分 析技能。学生可以进一步学习 相关课程、投身学术及研究岗 位。
分享反馈
2
归分析作业。
期末考试涵盖课程所有内容和应用。
3
课堂表现
学生可以通过课堂发言和问题解答, 积极参与课堂互动,提高交流能力和 思维水平。
课程重点
实践案例
本课程以丰富实践案例为 特色,学生可以在实践环 节中更好地理解课程内容, 提高数据分析和建模能力。
计量模型
本课程将介绍常见的计量 经济学模型,包括线性回 归模型、非线性回归模型、 面板数据模型和时间序列 模型等。
《计量经济学》课件
欢迎来到《计量经济学》课程!本课程将帮助学生了解各种经济现象和模型, 并通过实践案例提高数据分析能力。
课程介绍
课程目标
学习计量经济学基本理论及模型应用,提高 经济数据分析能力。
课程内容
本课程将介绍计量经济学中的基本概念、统 计分析、回归分析、面板数据和时间序列分 析。
适用对象
第9章_异方差:如果误差方差不是常数会有什么结果

var(µ i ) = σ 2 , i = 1,2, ⋯, n
如果出现
var(µ i ) = σ i , i = 1,2, ⋯, n
2
即对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。如 图 9-1 所示。
2.异方差的类型 (1)单调递增型,即 σ i 随 X 的增大而增大;
2
(2)单调递减型,即 σ i 随 X 的增大而减小;
2
56
本科教学课件
计量经济学基础
第 9 章 异方差:如果误差方差不是常数会有什么结果
(3)复杂型,即 σ i 与 X 的变化呈复杂形式。
2
如下图所示。
3.异方差产生的原因 (1)模型中遗漏了某些解释变量; (2)模型函数形式的设定误差; (3)样本数据的测量误差; (4)随机因素的影响。 经验表明,利用截面数据建立计量经济学模型时,由于不同样本点上解释变量以外的其他因素 的差异较大,所以往往存在异方差性。
本章主要讲授以下内容: 9.1 异方差的性质 9.2 异方差的后果 9.3 异方差的检验 9.4 异方差的处理
9.1 9.1 异方差的性质
1.异方差的概念 对于模型
Yi = B1 + B2 X 2i + B3 X 3i + ⋯ + Bk X ki + µ i , i = 1,2, ⋯, n
同方差假设为
Yi = B1 + B2 X i + µ i
(1)如果 var(ui)=σi2,且σi 已知,则可以进行下列变换:
1 = B1 σ σi i Yi
= B1 f (X i )
Yi
Xi + B 2 σ i
计量经济学-詹姆斯斯托克-第9章-面板数据的处理ppt课件

35
.
FatalityRate v. BeerTax:
36
.
问题
在上述模型中,如果超过两期,即T>2, 怎么处理呢?
37
.
面板数据模型的一般理论
在模型的设定上,分为两大类: (一)“固定效应”模型; (二)“随机效应”模型;
38
.
(一) 固定效应的回归 Fixed Effects Regression
2
.
面板数据,简而言之是时间序列和截面数据的混合。 严格地讲是对一组个体(如居民、国家、公司等)连 续观察多期得到的资料。所以很多时候我们也称其为 “追踪资料”。近年来,由于面板数据资料的获得变 得相对容易,使其应用范围也不断扩大。
3
.
当描述截面数据时,我们用下标表示个体,如Yi表示 变量Y的第i个个体。当描述面板数据时,我们需要其 他符号同时表示个体和时期。为此我们采用双下标而 不是单下标,其中第一个下标i表示个体,第二个下 标t表示观测时间。
23
.
案例二:
啤酒税与交通死亡率
啤酒税与交通死亡率会是什么关系?
24
.
U.S. traffic death data for 1982:
$1982
较高的啤酒税,会导致更多的交通死亡吗?
25
.
U.S. traffic death data for 1988
较高的啤酒税,会导致更多的交通死亡吗?
16000
15000
14000
13000
INC
12000
11000
10000
9000
8000 10000
15000
20000
25000
计量经济学-9

2 2 2 Var (v e0 ) u 0 u,即误差方差比没有测量误差时更大,也导致
函数形式误设的一般检验(RESET) 基本思想:如果原模型y 0 1 x1 2 x2 L k xk u 满足假定(u∣x) 0 E 那么,在方程中添加自变量的非线性关系应该是不显著的。 不过,当解释变量很多时,添加自变量的平方和立方项会产生更多的 解释变量,损失了很大一部分自由度。一般会在模型中添加被解释变量 ˆ ˆ 的预测值的平方y 2及立方y 3: ˆ ˆ y 0 1 x1 2 x2 L k xk 1 y 2 2 y 3 u 检验H 0:1 0, 2 0 F 统计量渐近服从F2,nk 3分布。显著的F 统计量表明存在某种函数形式问题
(2)经典的含误差变量(CEV)假定:cov(x1 , e1 )=0 2 2 2 x1 x1 e1, cov( x1 , e1 ) E ( x1e1 ) E ( x1 e1 ) E (e1 ) 0 e1 e1 ,
自变量与测量误差肯定相关,因此自变量与合成误差u 1e1也必然
因变量测量误差问题 假设模型:y 0 1 x1 L k xk u,满足CLRM 假定 y是对y 观测到的度量,它们之间的误差为:e0 y y , 可估计的模型变成:y 0 1 x1 L k xk u e0 , 随机误差项变成了u e0
自变量测量误差问题
考虑一个简单回归模型:y 0 1 x1 u,假设满足CLRM 假定, 则参数估计是无偏的和一致的,但是x1 观测不到,我们只能观测到x1, 它们之间存在着一个测量误差:e1 x1 x1 假定E(e1 )=0,u与x1和x1 都不相关,此时将x1取代x1 放入原方程进行OLS
计量经济学第九章虚拟变量

虚拟变量的类型
季节虚拟变量
用于反映季节变动对经济活动的影响。
政策虚拟变量
用于反映某项政策实施前后对经济活 动的不同影响。
地区虚拟变量
用于反映不同地区之间经济活动的差 异。
行业虚拟变量
用于反映不同行业之间经济活动的差 异。
虚拟变量的引入原因
解决遗漏变量问题
01
当某些重要变量无法直接观测或获取时,可以通过引入虚拟变
在模型中引入虚拟变量与解释变量的交互项,通过 改变斜率的值来反映不同组别之间的差异。
斜率变动模型的应用
适用于研究不同组别之间在某一解释变量上 的边际效应差异,如不同教育水平对收入的 影响等。
含有多个虚拟变量的模型
含有多个虚拟变量的模型的定义
当模型中引入多个虚拟变量时,称为含有多个虚拟变量的模型。
含有多个虚拟变量的模型的设定
VS
使用计算变量功能
可以使用SPSS的计算变量功能手动创建虚 拟变量。在数据视图中,点击“转换”菜 单下的“计算变量”选项。在弹出的对话 框中,输入虚拟变量的名称和标签,并在 计算表达式中输入相应的逻辑表达式。例 如,对于分类变量`industry`,可以使用如 下表达式生成虚拟变量
SPSS中实现虚拟变量的方法
截距变动模型的设
定
在模型中引入虚拟变量,通过改 变截距项的值来反映不同组别之 间的差异。
截距变动模型的应
用
适用于研究不同组别之间在某一 解释变量上的平均差异,如不同 性别、不同地区等。
斜率变动模型
斜率变动模型的定义
当虚拟变量不仅影响模型的截距项,还影响 解释变量的斜率时,称为斜率变动模型。
斜率变动模型的设定
通过比较政策虚拟变量的系数,可以分析 出政策变动对市场需求的影响程度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
t 0 1 1t
;Y
t t
t 1
X
0 1
1 t 1
t 1
其中 已知
t
将第 t 期观测值减去(滞后一
t 1
期观测值乘以
1t
),
X
(1 ) ( X
0 1 0 t t
d检验的缺陷是存在不确定域。如果统计量落入不确定域中时,无法 判断是否存在自相关。当d值落在“不确定”区域时,有两种处理方法。 ①加大样本容量或重新选取样本,重作d检验。有时d值会离开不确定区。 ②选用其它检验方法。 24
检验步骤:双侧检验 (1)做OLS回归,得到残差。 (2)计算统计量d (3)对给定的样本数量和解释变量数目,在给定显著水平下,找出临 界值的下界和上界dL、dU 。 (4)根据决策规则决定是否接受原假设。 原假设 无正序列相关 无负序列相关 拒绝 拒绝 决策 0<d<dl 4 - dl≤d≤4 du≤d≤4 -du dl<d<du 4 – du<d<4 -dl 条件
17
9.2 序列相关的后果
3、序列相关导致OLS估计量的方差是有偏的,从而 导致不可靠的假设检验. 典型的是,OLS常常低估系数的标准误,从而高 估t统计值,导致拒绝虚拟假设的可能性增大,犯第 一类错误的可能性增加。 4、假设检验如t检验和F检验,在纯序列相关的情况 下变得有偏且不可靠。 5、降低预测精度。用依据普通最小二乘法得到的回 归方程去预测,预测是无效的。
无正或负的序列相关 接受 无正或负的序列相关 不能确定
d检验的缺陷是存在两个不确定域。如果统计量落入不确定域中时, 无法判断是否存在自相关。当d值落在“不确定”区域时,有两种处理方 法。①加大样本容量或重新选取样本,重作d检验。有时d值会离开不确 定区。②选用其它检验方法。
25
9.3.3 运用杜宾—沃森d检验的例子
不能用
R 直接比较。
4、用 GLS 预测时需要调整。
29
这种广义差分交换可以推广到多个解释变 量的情形,也容易将差分变换推广到高阶。
30
注意:不能直接用OLS估计GLS模型
由于 OLS 要求方程对系数是线性 需要估计的系数有 的,而 GLS 模型本质上对系数是非 线性的。
0 , 1 和 ,而 与 0 , 1 是乘积关系。
6
正序列相关
正序列相关:误差项从某一期到下一期倾向于有相同 的符号. 例如:外部冲击对经济系统的影响会延续到后面几期. 图9-1
t
t 1
,
t
其中, 0 .
7
无序列相关
无序列相关:误差项的不同观测值之间完全不相关. 图9-2
t
t 1
,
t
其中, 0 .
第9章
序列相关性
经典假设4要求误差项的观察值互不相关。
序列相关:某期误差项的值以某种系统的方式 依赖于其他期误差项的值。
1
序列相关产生的原因
一、惯性。大多数经济时间序列都存在序列相关。其本期值往往受滞后
值影响。突出特征就是惯性与低灵敏度。如国民生产总值,固定资产投 资,国民消费,物价指数等随时间缓慢地变化,从而建立模型时导致误 差项序列相关。
t 是经典误差项。 却采用了线性回归的形
*
式:
* 2
Y t 0 1 X 1 t t , 其中 t 2 X 1 t t ,
这时,新的误差项
P 177
t 将表现为明显的序列相
*
关模式。
16
9.2 序列相关性的后果
1、纯序列相关不会导致对系数的有偏估计; 但由不正确设定产生的非纯序列相关,则可能 导致估计系数的偏误. 2、序列相关使OLS估计量不再是最小方差估 计量.序列相关增大了估计值分布的方差,增 大了任意给定的估计值可能异于真实值的数 量.
1
定义检验变量 d
T
ˆ 而,
ee
t2 t
t 1 2
d
2 t 1
e
t2
T
ˆ , d (1 ) 2
t
(e e )
t2 t
T
ˆ 1, 0 d 4 0 ˆ ,当 1 ˆ ,当 0 ˆ ,当 1
23
T
e
t2 T 2
et
et
t
(a)
e t 1
20
如(b)图所示,扰动项的估计值呈锯齿状,随时间 逐次改变符号,表明存在负相关。
e
e
t
t
t
(b)
e
t 1
21
9.3.1 杜宾—沃森d统计量
d检验(Durbin-Watson) d检验是检验序列相关的最著名的、最常用的方法。 1、使用条件 (1)回归模型中含有截距项; (2)随机扰动项是一阶相关;
X
t 1
1 t 1
)
t
令 * (1 ), Y * Y Y , X * X
1t
1t
1 t 1
, 可得到:
Y * X * , ( 8 19 )
*
t
t
0
1
1t
t
可以对 Y * X * , ( t 2 , 3 , n ) 进行 OLS 估计。
2
三、蛛网现象
许多农产品的供给表现出一种所谓的蛛网 现象。 例如,供给价格的反应要滞后一个时期。 今年种植的作物是受去年流行的价格影 响的,因此,相关的函数形式是:
St 1
2
Pt 1 t
这种现象就不能期望扰动项是随机的。
3
四、数据加工
在经验分析中,许多数据是经过加工而成的。 例如,在用到季度数据的时间序列回归中,季度数 据通常由月度数据加总而成。这种平均的计算减弱 了每月的波动而引进了数据的匀滑性。(内插与外 推等数据揉合技术) 注:序列相关也可能出现在横截面数据中,但更一 般出现在时间序列数据中。
二、 模型设定误差。(表现为应变量不相关,误差项相关)
1、若回归模型中丢掉了应该列入模型的重要解释变量,那么它的影响必 然归并到误差项中,从而使误差项呈现序列相关。当然略去多个带有序 列相关的解释变量,也许因互相抵消并不使误差项呈现序列相关。 2、模型选择了错误的函数形式。若所用的数学模型与变量间的真实关系 不一致,误差项常表现出序列相关。比如平均成本与产量呈抛物线关系, 当用线性回归模型拟合时,误差项必存在序列相关。 3、解决办法:将略去的变量加入模型或改变模型的函数形式。
如果实际中估计了如下 Y X
t 0 1 * 1t t t
方程:
* 2 2t
, 其中 X
* t
,
t
这时,新的误差项
2t
有可能序列相关,特别
是在以下情况中: 情况);
1、 X 本身存在序列相关(时 2、与 X 相比(依绝对值),
2 2
间序列很可能出现这种
12
序列相关的修正方法取决于是纯序列相 关还是非纯序列相关; 对于非纯序列相关,补救措施:加入遗漏变 量或选择正确的函数形式; 在考虑纯序列相关之前,应尽可能保证其 模型设定是最优的.
13
遗漏一个解释变量
假定真实的方程为: Y X
t 0 1 t 1t
X
2
2t
,
t
是经典误差项。
其中, 是所研究方程的误差项 上式又称一阶马尔可夫
的大小表明方程中序列
绝对值上趋向于
为 0,则不存在序列相关,
于决定当期值
当 在
1时,误差项的前期值对
t 就变得更加重要,
的趋势,
即存在高度序列相关。 若 在绝对值上大于 不合理,所以认为 1,意味着误差项的绝对 1 1。 值具有随时间持续增加
相对较小。
t
注意:由于由设定偏误 如果设定偏误得以纠正
引起,非纯序列相关可 ,则估计的有偏性与非
能导致有偏的估计系数 纯序列相关将同时被消
。 除。
14
一个例子
P176
15
不正确的函数形式
假定真实的函数形式为
2
多项式形式:
Y t 0 1 X 1t 2 X 1t t ,
8
负序列相关
负序列相关:在相继的观察期内,误差项的符号从负到正, 然后由正变负,如此不断地转换. 例如:潜在的随机干扰项的抽取,存在某种循环. 在大多数时间序列中,负的序列相关较少. 图9-3
t
t 1
,
t
其中, 0 .
9
季节的序列相关
在季节模型中,当前季节的误差项观察值可能与 上年同一季节的误差项观察值存在函数关系.
*
t
t
0
1
1t
t
28
广义最小二乘法(GLS)
Y t 0 1 X 1t t Y t Y t 1 0 ( 1 ) 1 ( X 1t X 1t 1 ) t
令 0 * 0 ( 1 ), Y t * Y t Y t 1 , X 1 t * X 1 t X 1 t 1 ,可得到:
P180
26
9.4 序列相关性的修正
修正序列相关的起点是检查方程中可能的 设定偏误所带来的非纯序列相关.函数形式是 否正确?是否存在遗漏变量; 杜宾—沃森d检验能帮助侦察到非纯序列相关, 负的序列相关常常是非纯序列相关的提示.但 杜宾—沃森d检验不能区别纯序列相关和非纯 序列相关.
27
9.4.1 广义最小二乘法
4