计量经济学虚拟解释变量模型
计量经济学10(1)

l 方差分析模型(Analysis of variance models,ANOVA):仅包含定性变量或 虚拟变量的回归模型,其形式如下:
Yi=B1+B2Di+ui l 假定Y:每年食品支出(美元);Di=1表示
女性;Di=0表示男性,则: l 男性食品支出的期望:E(Yi|Di=0)=B0 l 女性食品支出的期望: E(Yi|Di=0)=B0+B1
• D2=1表东北和中北部地区,D2=0为其它地区; • D3=1表南部地区,D3=0为其它地区
Ÿ 这是将西部地区看成是基准类。
计量经济学10(1)
¡ 再考虑政府机构用于每个学生的花费和地区对 教师平均年薪水的影响: AASi=B1+B2D2i+B3D3i+B4PPSi
¡ 对模型的解释:
l D2显著,而D3不显著,表明原模型存在设定误差; l PPS的系数的含义
计量经济学10(1)
l 上述模型的含义: l 截距B1表示男性平均食品支出,斜率系数
B2表示女性平均食品支出与男性的差异, B1 + B2表示女性平均食品支出。 l 对这类模型,零假设为:H0:B2=0
¡ 表示男女平均食品支出没有差异。我们可根据t 检验判定是否统计显著。
计量经济学10(1)
l 例10-1(P213):性别差异对食品消费支出 的影响
X 0.0803
5.54
DX -0.065
-4.096
1970-1995 C 62.423
4.89
X 0.0376
8.89
1970-1981 C 1.016
X 0.0803
1982-1995 C 153.49(1.016+152.479)
计量经济学第5章 虚拟变量模型

在经济计量模型中除了有量的因素外还有质的因 素,质的因素包括被解释变量为质的因素和解释变量 为质的因素。如果被解释变量为质的因素,主要是逻 辑回归要涉及的内容。本章就解释变量和被解释变量 为质的因素也就是存在虚拟解释变量和虚拟被解释变 量时如何进行参数估计等一系列问题进行讨论。
1
为基础类型截距项。
12
三、虚拟变量的作用 ⑴ 可以描述和测量定性因素的影响。
⑵ 能够正确反映经济变量之间的相互关系,提 高模型的精度。
⑶ 便于处理异常数据。
即将异常数据作为一个特殊的定性因素
1 , 异常时期
D
0
,
正常时期
13
第二节 虚拟解释变量模型
一 、截距变动模型(加法模型)
虚拟变量与其它变量相加,以加法形式引入模
Y i 0 1 D 1 i 2 D 2 i 3 X i u i
Y i ------年支出医疗保健费用支出 X i ------居民年可支配收入
18
1 , 高中
D 1i
0
,
其他
1 , 大学
D 2i
0
,
其他
于是:小学教育程度:
E (Y i X i,D 1 i 0 ,D 2 i 0 )03 X i
7
二、虚拟变量的设置规则
虚拟解释变量模型的设定因为质的因素的多少 和这些因素特征的多少而引入的虚拟变量也会不同。
以一个最简单的虚拟变量模型为例,如果只包 含一个质的因素,而且这个因素仅有两个特征,则 回归模型中只需引入一个虚拟变量。如果是含有多 个质的因素, 自然要引入多个虚拟变量。
8
如果只有一个质的因素,且该质的因素具有 m 个 相互排斥的特征(或类型、属性),那么在含有截距 项的模型中,只能引入 m-1 个虚拟变量,否则会陷入 所谓“虚拟变量陷阱”(dummy variable trap),产 生 完全的多重共线性,会使最小二乘法无解;在不含有 截距项的模型中, 引入 m 个虚拟变量不会导致完全 的多重共线性,不过这时虚拟变量参数的估计结果, 实际上是 D = 1 时的样本均值。
金融计量经济第五讲虚拟变量模型和Probit、Logit模型

二、虚拟变量的设置原则
• 引入虚拟变量一般取0和1。
• 对定性因素一般取级别数减1个虚拟变量。例 子1:性别因素,二个级别(男、女)取一个 虚拟变量,D=1表示男(女),D=0表示女 (男)。
• 例子2:季度因素,四个季度取3个变量。
1, 一季度 D1 0, 其它季度
1, 二季度
D2
0,
其它季度
• 同样可以写成二个模型:
y ˆi ˆ0(ˆˆ1)x1iˆkxki D1
y ˆi ˆ0ˆ1x1iˆkxki
D0
• 可考虑同时在截距和斜率引入虚拟变量:
y i 0 0 D i (1 D i 1 ) x 1 i k x k iu i (5.
.
.
• 3、虚拟变量用于季节性因素分析。
•取
1, 当样本 i季为 度第 的数据 Di 0,其它季度的, i数 2,3据 ,4
• 工资模型为:
• Ii01 [S 1 (1 D 1 i D 2 i)S ( i S 1 )] 2 [D 2 i(S 2 S 1 ) D 1 i(S i S 1 ) ]3 D 2 i(S i S 2 ) u i (5.7
.
D2=1
S0
D1=1
S1
S2
.
• 作OLS得到参数估计值后,三个阶段的 报酬回归模型为: Iˆi ˆ0ˆ1Si, Si S1 Iˆi ˆ0ˆ1S1ˆ2(Si S1), S2Si S1 Iˆi ˆ0ˆ1S1ˆ2(S2S1)ˆ3(Si S2), Si S2
0.503543 0.500354 1.13E+03 1.99E+09 -13241.74 1.648066
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)
金融计量经济第五讲虚拟变量模型和Probit、Logit模型

原始模型:
YX (5.8)
• 其中Y为观测值取1和0的虚拟被解释变量,X为 解释变量。
• 模型的样本形式: yi Xii
(5.9)
• 因为E(i)0
,E所(y以i)Xi
• 令: p i P ( y i 1 ) 1 p i P ( y i 0 )
• 于是有: E ( y i) 1 P ( y i 1 ) 0 P ( y i 0 ) p i
其它季度
1, 三季度
D3
0,
其它季度
• 小心“虚拟变量陷阱”!
精品课件
三、虚拟变量的应用
• 1、在常数项引入虚拟变量,改变截距。
y i0D 1 x 1 i kx k iu i (5.1)
• 对上式作OLS,得到参数估计值和回归模型:
y ˆiˆ0ˆD ˆ1 x 1 i ˆkx ki(5.2)
金融计量经济第五讲
虚拟变量模型和Probit、Logit模 型
精品课件
第一节 虚拟变量的一般应用
一、虚拟变量及其作用 1.定义:取值为0和1的人工变量,表示非量化
(定性)因素对模型的影响,一般用符号D表 示。例如:政策因素、地区因素、心理因素、 季节因素等。 2.作用: ⑴描述和测量定性因素的影响; ⑵正确反映经济变量之间的相互关系,提高模型 的精度; ⑶便于处理异常数据。
yˆt ˆ ˆxt yˆt ˆ ˆxt ˆ2 yˆt ˆ ˆxt ˆ3 yˆt ˆ ˆxt ˆ4
精品课件
一季度 二季度 三季度 四季度
例题:美国制造业的利润—销售额行为
• 模型:利 t 1 润 2 D 2 t 3 D 3 t 4 D 4 t ( 销 ) t u t售
0.503543 0.500354 1.13E+03 1.99E+09 -13241.74 1.648066
计量经济学解题整理

'
'
②代入公式 S
E (Y0 )
' 2 X 0 (X ' X )X 0 求出 Y 均值的标准差
③把结果代入均值的置信区间公式 Y 0 t a / 2 S
E (Y0 )
即可得到置信区间
三:多元线性回归模型
1.参数估计的普通最小二乘估计
(1)在命令窗口中输入 data x1 x2 y,录入数据
RSS 2 RSS1
(8)给定一个显著性水平 a,F 的临界值为 Fa ( 观察值个数) (9)若 F> Fa (
nc nc k 1, k 1 )(c 为去除的 2 2
nc nc k 1, k 1 ),则拒绝无异方差性假设,模型存在异方差性。 2 2
(三)White 检验 (1)用 OLS 方法求得原模型的估计结果
Y 的个别值的预测置信区间为 Y 0 t a / 2 S ,其中 S 为 Y 的个别值预测的标准差为
Y0 Y0 ' S 2 [1 X 0 ( X ' X ) X 0 ] Y0
①在 Equation 框中,点击“Forecast”,弹出 Forecast 话框,S.E.一栏为预测值的标准 差,命名为 yczbzc,点击 OK,即可在 Workfile 界面看到一个名为 yczbzc 的序列。
(2)被解释变量 Y 均值区间预测公式
(3)进行计算时, Y f 可以在前面点预测序列 yf2 中找到; t a / 2 可以查 t 分布表得到;样本 数 n 为已知; X ew/Descriptive Statistics/Common Sample,得描述统计结果,其中:Mean 为均值,Std.Dev 为标准差) ;由 总体方差的无偏估计式 方法二:
第六章计量经济学

第六章 虚拟变量的回归模型第一部分 学习目标和要求本章主要介绍虚拟变量的基本概念及其应用。
需要掌握并理解以下内容:(1) 虚拟变量的基本概念、虚拟变量分别作为解释变量和被解释变量的情形、虚拟变量回归模型的类型和解释变量个数选取规则; (2) 定量变量与不同数量定性变量(一对一、一对多和多对多)虚拟变量模型; (3) 应用虚拟变量改变回归直线的截距或斜率; (4) 分段线性回归;(5) 应用虚拟变量检验回归模型的结构稳定性、传统判别结构稳定性的方法及存在的缺陷、虚拟变量法比较两个回归方程的结构方法。
第二部分 练习题一、解释下列概念:1.虚拟变量2.方差分析模型(ANOV A ) 3.协方差模型(ANOCV A ) 4.基底5.级差截距系数 6.虚拟变量陷阱二、简要回答下列问题:1.虚拟变量在线性回归模型中的作用是什么?举例说明。
2.回归模型中虚拟变量个数的选取原则是什么?为什么?3.如果现在有月度数据,在对下面的假设进行检验时,你将引入几个虚拟变量? A) 一年中的每月均呈现季节性波动趋势;B) 只有双数月份呈现季节性波动趋势。
4.如果现在让你着手检验上海和深圳两个股票市场在过去5年内的收益率是否有显著差异,如何使用虚拟变量进行?三、考虑如下模型:12i i i Y D u ββ=++其中,i D 对前20个观察值取0,对后30个观察值取1。
已知2()300i Var u =。
(1) 如何解释1β和2β? (2) 这两组的均值分别是多少?(3) 已知12()15Cov ββ∧∧+=-。
如何计算12()ββ∧∧+的方差?四、考虑如下模型:12i i i i Y D X u ααβ=+++ 其中Y 代表一位大学教授的年薪; X 为从教年限; D 为性别虚拟变量。
考虑定义虚拟变量的三种方式:(1)D 对男性取值1,对女性取值0; (2)D 对女性取值1,对男性取值2; (3)D 对女性取值1,对男性取值-1;对每种虚拟变量定义解释上述回归模型。
计量经济学课后习题答案第八章_答案

第八章虚拟变量模型1. 回归模型中引入虚拟变量的作用是什么?答:在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响。
加法方式与乘法方式是最主要的引入方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
2. 虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况?答:在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。
除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。
3.什么是虚拟变量陷阱?答:根据虚拟变量的设置原则,一般情况下,如果定性变量有m个类别,则需在模型中引入m-1个变量。
如果引入了m个变量,就会导致模型解释变量出现完全的共线性问题,从而导致模型无法估计。
这种由于引入虚拟变量个数与类别个数相等导致的模型无法估计的问题,称为“虚拟变量陷阱”。
4.在一项对北京某大学学生月消费支出的研究中,认为学生的消费支出除受其家庭的每月收入水平外,还受在学校中是否得到奖学金,来自农村还是城市,是经济发达地区还是欠发达地区,以及性别等因素的影响。
试设定适当的模型,并导出如下情形下学生消费支出的平均水平:(1) 来自欠发达农村地区的女生,未得到奖学金;(2) 来自欠发达城市地区的男生,得到奖学金;(3) 来自发达地区的农村女生,得到奖学金;(4) 来自发达地区的城市男生,未得到奖学金。
解答: 记学生月消费支出为Y,其家庭月收入水平为X,则在不考虑其他因素的影响时,有如下基本回归模型:Y i=β0+β1X i+μi有奖学金1 来自城市无奖学金0 来自农村来自发达地区 1 男性0 来自欠发达地区0 女性Y i=β0+β1X i+α1D1i+α2D2i+α3D3i+α4D4i+μi由此回归模型,可得如下各种情形下学生的平均消费支出:(1) 来自欠发达农村地区的女生,未得到奖学金时的月消费支出:E(Y i|= X i, D1i=D2i=D3i=D4i=0)=β0+β1X i(2) 来自欠发达城市地区的男生,得到奖学金时的月消费支出:E(Y i|= X i, D1i=D4i=1,D2i=D3i=0)=(β0+α1+α4)+β1X i(3) 来自发达地区的农村女生,得到奖学金时的月消费支出:E(Y i |= X i , D 1i =D 3i =1,D 2i =D 4i =0)=(β0+α1+α3)+β1X i (4) 来自发达地区的城市男生,未得到奖学金时的月消费支出: E(Y i |= X i ,D 2i =D 3i =D 4i =1, D 1i =0)= (β0+α2+α3+α4)+β1X i5. 研究进口消费品的数量Y 与国民收入X 的模型关系时,由数据散点图显示1979年前后Y 对X 的回归关系明显不同,进口消费函数发生了结构性变化:基本消费部分下降了,而边际消费倾向变大了。
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(虚拟变量回归模型)【圣才出品】

第9章虚拟变量回归模型9.1 复习笔记考点一:ANOVA模型★★★1.虚拟变量含义虚拟变量是指仅有0和1两个取值的变量,是一种定性变量。
一般而言,虚拟变量等于0表示变量不具有某种性质,等于1表示具有某种性质。
虚拟变量也可以放到回归模型中。
这种模型被称为方差分析(ANOVA)模型。
2.虚拟变量模型(1)虚拟变量的表达式Y i=β1+β2D2i+β3D3i+u i应看到,除了不是定量回归元而是定性或虚拟回归元(若观测值属于某特定组则取值为1,若它不属于那一组则取值0)之外,方程与前面考虑的任何一个多元回归模型都是一样的。
所有的虚拟变量都用字母D表示。
(2)使用虚拟变量的注意事项①若定性变量有m个类别,则只需引入m-1个虚拟变量,否则就会陷入虚拟变量陷阱,即完全共线性或完全多重共线性(若变量之间存在不止一个精确的关系)情形。
对每个定性变量而言,所引入的虚拟变量的个数必须比该变量的类别数少一个。
②不指定其虚拟变量的那一组被称为基组、基准组、控制组、比较组、参照组或省略组。
所有其他的组都与基准组进行比较。
③截距值(β1)代表了基准组的均值。
④附属于方程中虚拟变量的系数被称为级差截距系数,它反映取值为1的地区的截距值与基准组的截距系数之间的差别。
⑤如果定性变量不止一类,那么,基准组的选择完全取决于研究者。
⑥对于虚拟变量陷阱,如果在这种模型中不使用截距项,那么引入与变量的类别相同数量的虚拟变量就能够回避虚拟变量陷阱的问题。
因此,如果从方程中去掉截距项,并考虑如下模型Y i=β1D1i+β2D2i+β3D3i+u i由于此时没有完全共线性,所以就不会陷入虚拟变量陷阱。
但要确定做这个回归时,一定要使用回归软件包中的无截距选项。
⑦在一个含有截距的方程中,能更容易地处理是否有某个组与基准组有所不同以及有多大的不同,所以在方程中包括截距更方便。
为了检查分组是否得当,也可通过将虚拟变量的系数相对0做t检验(或者更一般地,对适当的虚拟变量系数集做一个F检验),就可以检验分类是否适当。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
而在1979年以后, 物资逐渐丰富, 商 品的买卖也取消了票证的限制, 消费者 储蓄的主要目的之一是购买高档耐用 消费品,储蓄不再具有“被迫”的性 质。
24
(2)对没有截距的情况,我们如果设两个虚 拟变量,
Yi 1D1i 2D2i 3 Xi ui (8.10)
显然模型(8.10)中,解释变量D1,D2和X之间 无完全的多重共线性。可以使用普通最小二乘 法估计式(8.10)的参数。
25
(二)斜率变动模型 在实际问题中,斜率单独变动出现的
情形一般比较少,它指的是改变了变动的 速率也就是弹性。 例如城镇居民家庭与农 村居民家庭的消费函数, 在边际消费倾 向(斜率)上可能会有所不同,假设它们 的消费函数在截距项没有区别。
影响被解释变量,它有个m特征,我们 就要引入m-1个虚拟变量;
20
如果回归方程没有截距项,那么这个质 的因素有多少个特征就要设多少个虚拟 变量,这就是虚拟变量的使用原则。如 果虚拟变量设定不当,会使最小二乘法 无解,称这种情况为虚拟变量陷阱。
21
下面就用线性代数中的知识来说明这一 点。同样用例8.1,引入两个虚拟变量对有 截距项和没有截距项的情况分别讨论。
30
例如,我们用季度资料研究各种商品消 费额在季节上有没有什么区别?可以建立 模型如下:
Yt 0 1D1t 2 D2t 3 D3t 4 X t ut
(8.14) 其中,Yt=季度的消费,Xt=季度的收入, 对于四个季度,我们引入了三个虚拟变量:
31
1 第一季度
D1t 0
其他
1 第二季度
如果我们绘制图形,得到的结果仍然
是一样的。此时,β1<0,非正常年份的
线低于正常年份的线,代表非正常年份的 消费水平低于正常年份的消费水平。
18
2.虚拟变量D=0所代表的特性或 状态通常称为基础类型。和其它特征或状 态比较的意义上说,基础类型为对比的基 础,在式(8.2)和式(8.3)中,非正 常年份就是基础类型,而在式(8.5)和 式(8.6)中,正常年份就是基础类型。
在经济计量分析中, 经常会碰到 所建模型的被解释变量不仅受诸如收 入、产量、价格、 成本、需求、投资 等数量变量的影响,而且也受到诸如 战争、自然灾害、国际环境、季节变 动以及政府经济政策变动等质量变量 的影响。建立经济计量模型若不考虑 这些质量变量的影响作用,显然是不 适宜的。
2
所以,在建立经济计量模型时,即要 考虑数量变量,也要考虑质量变量。但 是,质量变量和数量变量不同,数量变 量可以在事前规定好的尺度上,用不同 的数值表现出来,质量变量却只能以属 性、种类的不同具体形式表现出来。
14
式(8.2)和式(8.3)分别为正常年 份和非正常年份的居民消费水平。二者 具有相同的斜率,但是截距不同。
15
利用最小二乘法对式(8.1)进行估计,可得到
Yˆi ˆ 0 ˆ1D ˆ 2 Xi (8.4)
对 β1 作t 检验,若 β1 显著地不为0,
我们就认为正常年份和非正常年份居民在 消费行为上的差异是明显的。若 β1 >0,则 正常年份的居民消费水平高于非正常年份 的居民消费水平。
0 0 0 0
1 4Xt 2 4Xt 3 4Xt 4Xt ut
ut ut ut
(8.15) (8.16) (8.17) (8.18)
33
(四)截距和斜率同时变动模型 在多数情况下,质的因素不但对回归
模型的截距有影响,而且还会改变模型 的斜率。例如城镇居民和农村居民的消 费函数不但在斜率上有差异,在截距上 也是有可能不一致的,将两个问题同时 考虑进来,我们可以得到回归方程
11
【例8.1】假设有一个包括正常年份和 非正常年份(亚洲金融危机或SARS的影 响)居民消费的样本,并打算用这些数据 估计消费函数。由于在正常年份和非正常 年份居民在消费水平上存在明显差异,所 以一些外界的影响是一个重要的解释变量 。
12
用一个虚拟变量来表示这个质的因素, 消费函数为
Yi 0 1D 2 X i ui (8.1)
7
第二节 虚拟解释变量的设定
虚拟解释变量模型的设定因为质的 因素的多少和这些因素特征的多少而引 入的虚拟变量也会不同。
8
以一个最简单的虚拟变量模型为例,如 果只包含一个质的因素,而且这个因素 仅有两个特征,则回归模型中只需引入 一个虚拟变量。如果是含有多个质的因 素, 自然要引入多个虚拟变量。
9
模型中的系数β0 为基础类型的截距项, 称为公共截距项;系数β1 称为差别截距
系数,指的是D取1时截距系数和基础类 型的截距系数的差异。
19
3.如果一个回归模型有截距项,而 且这个质的因素又有两种特征,也就是 将其分两类,则我们只需要引入一个虚 拟变量。如我们的例8.1所示。如果一个 回归方程有截距项,只有一个质的因素
41
1979年以后,我国居民的收入水平大 幅度提高,同时,居民储蓄也在大幅 度增长。从这些可以看出来,1979年 前后两个时期,我国居民的边际储蓄 倾向有显著性差异。
42
在改革开放前的大多数年份, 我国 的消费市场常常是供不应求, 许多商品 要国家下达计划指标, 居民凭票证购买, 经常出现的问题是顾客即使有钱也难 买到需要的商品, 就不得不把钱存起来。 这时候的储蓄就带有非自愿的性质。
26
那么回归模型可记为
Yi 0 1 X i 2 (DX i ) ui (8.11)
其中,Yi=第个家庭的消费水平,Xi= 第个家庭的收入水平,
D
1 0
城镇居民家庭 农村居民家庭
27
式(8.11)可以表示为
D 1, Yi 0 (1 2)Xi ui D 0, Yi 0 1Xi ui
3
例如,性别可表现为男或女;人种可表 现为白种人和非白种人;宗教信仰可表 现为教徒和非教徒;政府的经济政策可 表现为改革开放前和改革开放后,如此 等等。
4
显然,这种不同的具体形式是无法直接引 入经济计量模型中去的。但由于这类变量 通常表现为品质、属性、种类的出现或者 未出现,所以我们可以根据质量变量的这 一特征将其数量化。给定某一质量变量某 属性的出现为1,未出现为0,称这样的变 量为虚拟变量。
5
当然,把哪种情况取0,哪种情况取1要视研 究情况而定。0和1只是一个符号而已,不代 表他们有高低的意义。我们可以把男性设为 1,也可以设为0,得到的结果是一致的。 这样就可以把量化的质量变量引入经济计量 模型中,以便进一步进行数学处理。
6
需要指出的是,虚拟变量主要是用来 代表质的因素,但是有些情况下也可以 用来代表数量因素。例如在建立储蓄函 数时,“收入”显然是一个重要解释变 量,虽然是“数量”因素,但是为了方 便也可以用虚拟变量表示。
(8.21)
β1和 β3 分别表示城镇居民家庭和
农村居民家庭的消费函数在截距
和斜率上的差异。
36
我们一般通过t 检验来判定它们之间是否有
差异。 1. 若β1≠0 ,β3≠0,则为截距和斜率同时
变动模型; 2. 若 β1≠0,β3=0,则为截距变动模型; 3. 若 β1=0,β3=0, 则表示城镇居民家庭和
Sˆt 33.4 0.17Xt (8.22)
R2 =0.833, DW=0.398
40
模型(8.23)包含了这样一个假定,那 就是在1955到1985年期间我国城镇居民家 庭的储蓄行为大体保持不变。 这一假定 实际上是行不通的,因为在十一届三中全 会召开之后,居民的收入大大增加,而且 与居民储蓄有关的许多重要因素在1979年 以后发生了明显变化。在改革开放之前, 我国居民的收入水平仅仅能够维持温饱水 平,根本不可能有多少储蓄;
16
通过例8.1,我们可以找出虚拟变量模型的 一些特征。
1.用“1”来代表质的因素的哪个特征 是可以任意设定的。我们一般认为,“1” 代表具有某些特征,但没有具体规定。在上 例中,也可以指定D=1时为非正常年份,而 D=0就必然为正常年份。在这种情况下,正 常年份和非正常年份的消费函数分别为
17
D 0 时 正常年份 E(Y) i 0 2Xi D 1 时 非正常年份 E(YI ) 0 1 2Xi
式中,Yi=第个居民的消费水平,Xi=第个 居民的收入水平,D为虚拟变量。我们用 D=1表示正常年份这一特征,用D=0来表 示非正常年份
13
假设E(u i)=0,式(8.1 ) 0 1 2 X i
D0
(8.2)
非正常年份
E(Yi ) 0 2 X i
(8.3)
农村居 民家庭有着完全相同的消费模式; 4. 若 β1=0,β3≠0,则为斜率变动模型,这
种情况在现实中出现得不是很多。
37
下面,以我国的农村和城市的消费样本 为例,实际体会虚拟变量模型从建模到检 验再到估计参数最后下结论的全过程。
【例8.2】已有数据资料为我国城镇居民 家庭1955年至1985年人均收入和人均储蓄。 根据经验,也就是先验信息,再通过某些 检验,我们发现储蓄和收入有很强的相关 关系而且收入的变化会引起储蓄的变化。
34
Yi 0 1D 2 X i 3 (DX i ) ui
(8.19)
式中,Yi=第个家庭的消费水平,Xi=第个 家庭的收入水平,
D
1 0
城镇居民家庭 农村居民家庭
35
式(8.19)可以表示为
D 1 Yi 0 1 (2 3 )X i ui (8.20)
D 0 Yi 0 2 X i ui
(1)对有截距项的情况,我们如果设两个 虚拟变量,则回归模型为
Yi 0 1D1i 2 D2i 3 X i ui (8.7)
22
1 D1i 0
正常年份 非正常年份
式(8.7)也可表示为
1 非正常年份 D2i 0 正常年份
Yi 0 X1i 1 X 2i 2 X 3i 3 X i ui (8.8)