第五讲-虚拟变量模型
第五章_包含虚拟变量的回归模型(课堂PPT)

– 对数单位模型(Logit Model) – 概率单位模型(Probit Model)
1
《
55
包含虚拟因变量的回归模型
• 如何估计这类模型?是否可以用OLS? • 有特殊的统计推断问题吗? • 如何度量这种模型的拟合优度?
1
《
56
(一)线性概率模型(LPM)
yi 0 1xi ui
女性 : s·alaryi 17.96929 1.370714 yearsi
years
1
《
16
2定性变量+1定量变量
yi 0 1 d1i 2 d2i 3 xi ui
1, 男教师 d1i 0,女教师
1, 白种人 d2i 0, 非白种人
xi 教龄
1
《
17
思考题:以下定义方法的差别?
18.5 21.7 18.0 19.0 22.0
教育
0 1 0 0 1
1
《
7
1
《
8
y
1
1 3.28
d 0
《
d 1
x
9
• 虚拟变量系数(差别截距项系数)的经济 含义
• 赋值为0的一类常称为基准类(对比类)
1
《
10
思考题:如下定义存在什么问题?
yi 0 1 d1i 2 d2i ui
1
《
44
假说一和假说二
• 不同政策待遇的企业外国股权比例存在差 异
– 私营企业参与的合资企业比乡镇企业参与的合 资企业,其外国股权比例更高。
– 对资金有更大需求的企业比更小需求的企业, 其外国股权比例更高
1
《
45
假说三和假说四
• 由于浙江省对待不同企业的政策差异小于 江苏省,在浙江省所观察到的假说一和假 说二所描述的效应会弱于江苏省。
第5讲包含虚拟变量的回归

其中,Y表示年薪水平(单位:万元),X1表示年收入( 单位:万元),X2表示公司股票收益(单位:万元);D1 ,D2和D3均为虚拟变量,分别表示金融业、消费品工业和 公用事业。假设对比产业为交通运输业。
23
(1)解释三个虚拟变量参数的经济含义。
(2)保持X1和X2不变,计算公用事业和交通运输业之间
对于Yi 0 1 Di ui , 当虚拟变量D 0时,Y的均值为:E (Yi | Di 0) 0 当虚拟变量D 1时,Y的均值为:E (Yi | Di 1) 0 1
3
自变量包含虚拟变量的回归模型
例题
o 教育与年薪
1, 本科毕业以及上 自变量:edu 0,本科毕业以下(对照组) salaryi 18000 3280edui p (0.000) (0.000) 若本科毕业以下 , 平均年薪为18000 元 若本科毕业及以上 , 平均年薪为18000 3280 21280 元
21因变量为虚拟变量的回归模型线性概率模型linearprobabilitymodellpmkidsageeduincomehusbandworkwork不参加工作参加工作譬如对于一个已婚妇发生的条件概率式表示在给定各自变量是一个虚拟变量则上22因变量为虚拟变量的回归模型线性概率模型存在的问题概率的估计值很可能小于0或大于123其中y表示年薪水平单位
t (-6.11) (22.89) R 2 =0.9836 (4.33) (-2.55)
由3与4的t检验可知:参数显著地不等于0, 强烈示出两个时期的回归是相异的,储蓄函数 分别为:
1990年前: 1990年后:
ˆ Yi 1649 .7 0.4116 X i
ˆ Yi 15452 0.8881 X i
第五章虚拟变量-第八章虚拟变量

说明虚拟解释变量 D1,D2,D3,D4 存在完全的多重共线性 从而无法用普通最小二乘法进行估计。 反映季节因素的商品需求模型为:
Yt 0 1 X 1t 2 X 2t 3 D1t 4 D2t 5 D3t t
例3、由经济实际得知,出口消费品数量Y 主要取决于国民支出X,我国革新开放前 后出口消费品的数量发作清楚变化,以 1979年为转机期,树立出口消费品需求 模型,并反映这种变化。
Yt 0 1 X i i
式中,Y 是职工工资收入;X 是工龄 考虑职工收入受教育程度的影响而引入合适的虚拟 变量,对上述模型加以改进。
解:教育程度一般分为:高中以下,高中,大学及以上(包括大专) 这样教育程度有三个特征,故引入两个虚拟变量,并设教育程度的 改变,只影响截距的变动。
D1=
1, 0,
Yt 0 1 X t t
1979 年以后,Dt 为 1, 模型为
Yt
0
2X
* t
1 2 X t t
第5章习题
一、单项选择题 1、假设一个回归模型中不包括截距项,对一个
具有m个特征的质的要素需求引入的虚拟变量 的个数为: A、m B、m-1 C、m-2 D、m+1
2、设团体消费函数Yi=c0+c1Xi+ui中,消费支出Y不只 与支出X有关,而且与消费者的性别、年龄构成有关, 年龄构成可分为青年、中年和老年三个层次,假定边 沿消费倾向不变,那么思索上述要素的影响,该函数 引入虚拟变量的个数为:
的需求模型为: Yt 0 1 X 1t 2 X 2t t
式中,Y 是商品的需求量,X1 是价格,X2 时收入, 为了反映四个季节对商品需求量的影响,假定引入四个虚拟变量:
第五章第一节虚拟变量模型25页PPT

例。已知冷饮的销售量Y除受k种定量变量Xk的影响外,还受 春、夏、秋、冬四季变化的影响,要考察该四季的影响,只
需引入三个虚拟变量即可:
1 春季
D 1t
0
其他
1 夏季
D 2t
0
其他
1
D 3t
0
秋季 其他
1 春季
D 1t
0
其他
1 夏季
D 2t
0
其他
1
D 3t
0
秋季 其他
则冷饮销售量的模型为:
Y i01 X i2 D ii
其中:Yi为企业职工的薪金(千元),Xi为工龄;
1 Dt 0
男 女
Yˆ 17.971.37X1.33D t (93.61) (38.45) (8.57) R2 0.99
女性平均年薪:
Y ˆ1.9 7 71.3X 7
表明:当性别变量为常数时, 工龄每增加一年,平均年薪 增加1370元,当工龄保持不 变时,男性的平均年薪比女 性多1330元,性别对薪金的 影响是显著的。
三、虚拟变量的引入
• 虚拟变量做为解释变量引入模型有两种基本方式: 加法方式和乘法方式。
1、加法方式 Y i01 X i2 D ii
上述企业职工薪金模型中性别虚拟变量的引入采 取了加法方式。
在该模型中,如果仍假定E(i)=0,则 企业女职工的平均薪金为:
E ( Y i|X i,D i 0 ) 0 1 X i
男性平均年薪:
Y ˆ ( 1 .9 7 1 7 .3 ) 1 3 .3 X 7 1 .3 9 1 0 .3 X 7
二、虚拟变量的设置原则
虚拟变量的个数须按以下原则确定:
(1)若定性因素有m个相互排斥的类型或属性,只能引 入(m-1)个虚拟变量,否则会陷入“虚拟变量陷阱”,产 生完全共线性。(当无截距项时,应引入m个虚拟变量)
计量经济学(共33张PPT)

假定3>2,其几何意义:
问题:
虚拟变量为何只选“0”, ‘1“,选择0,1,2 等 可以吗
同一种属性,两个变量能够表示几种状态? 思考,如果在模型中引入季节效应?月份效应?
(3)多个虚拟变量的引入——多种因素
例:研究学历(本科及以上,本科以下),性别(男、女)对员工工资的 影响。
在例1基础上,再引入代表学历的虚拟变量D2:
离散选择模型(离散被解释变量)
D (2)多个虚拟变量的设定和引入 0 女职工本科以上学历的平均薪金:
本科以下
当回归模型有截距项时,只能引入 m-1 个虚拟变量
注意:加法方式引入虚拟变量,考察了截距的不同。
交互作用的引入方法:在模型中引入相关变量的乘积。
反映性别的虚拟变量可取为: 女职工本科以下学历的平均薪金:
几何意义:
•两个函数有相同的斜率,说明男女职工平均薪金对工龄的变 化率是一样的。
•如果2>0,表明两个函数截距不相同,且男职工平均薪金比 女职工高,两者平均薪金水平相差2。 •如果2<0,表明两个函数截距不相同,且男职工平均薪金比女 职工低,两者平均薪金水平相差2。 •如果2=0,表明两个函数截距相同,即男职工,女职工的平
均薪金没有显著差异。
可以通过传统的回归检验,对2的统计显著性进行 检验,以判断企业男女职工的平均薪金水平是否有 显著差异。
2
0
(2)多个虚拟变量的设定和引入
——一种因素多种状态(水平):
例:研究收入和教育水平(分为高,中,低三类)对个人保健支出的影响。
教育水平考虑三个层次:
低学历:高中以下,
中等学历:高中,及大中专 高学历:大学及其以上。
2、基本概念
定量因素——可直接测度,数值性的因素 定性因素——属性因素,表征某种属性存在
浙大宁波理工学院计量经济学第五章虚拟变量(DummyVariable)

第五章 虚拟变量 5.5 多个定性变量模型
根据样本数据的EViews回归结果如下:
Variable Coefficient Std.Error t-Statistic Prob
RACE GENDER CLERICAL C
561.1595 117.6163 -796.5342 1706.833
160.3815 191.3223 210.4523 177.5171
提高模型对现实经济现象的描述精度。
l例:根据消费理论,消费水平C主要取决于收入水平Y,但在一 个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾 害、战争等反常年份,消费倾向往往出现变化。这种消费倾向 的变化可通过在收入的系数中引入虚拟变量来考察。
第五章 虚拟变量
5.6 同时含有虚拟变量和定量变量的模型
第五章 虚拟变量 5.3 两分定性变量模型
由于R 2 只有0.195343,故模型整体的拟合优度很 差,但是对于只含有虚拟变量的模型,重要的是观 察自变量的性质是否影响到因变量。由于DUMMY 的p值为0.0015,意味着在1%的显著性水平下,可 以接受DUMMY之前的系数不为0。
第五章 虚拟变量 5.3 两分定性变量模型
2、乘法方式
许多情况下:往往是斜率就有变化,或斜率、截距同时发 生变化。
斜率的变化可通过以乘法的方式引入虚拟变量来测度。 l在所设定的计量经济模型中,将虚拟解释变量与其他解释变
量相乘作为新的解释变量出现在模型中,以达到其调整设定模
型斜率系数的目的。
l乘法形式引入虚拟解释变量的主要作用:①两个回归模型之间的比较;②
1 本科
1 研究生
D1=
, D2=
0 其他
0 其他
年薪模型为: y t 0 1 x 1 1 D 1 2 D 2 u t
虚拟变量回归模型课件.ppt

7.1 虚拟变量
7.1.1 虚拟变量的概念及作用
1.虚拟变量的内涵 在计量经济学中,我们把反映定性(或属性)因素变化,取值为0和1的人工变量称为 虚拟变量(Dummy Variable),或称为哑变量、虚设变量、属性变量、双值变量、类型变量、 定性变量、二元型变量、名义变量等,习惯上用字母D表示。例如
第2页,共32页。
虚拟变量
为什么要引入“虚拟变量” ?? 许多经济变量是可以定量度量的或者说是可以直接观测的
如商品需求量、价格、收入、产量等
但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测
如职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节 对某些产品(如冷饮)销售的影响等。
第3页,共32页。
第29页,共32页。
临界指标的虚拟变量的引入
在经济发生转折时期,可通过建立临界指 标的虚拟变量模型来反映。
第30页,共32页。
第31页,共32页。
当截距与斜率发生变化时,则需要同时引入加法与乘 法形式的虚拟变量。
OLS法得到该模型的回归方程为
则两时期进口消费品函数分别为:
当t<t*=1978年, Dt = 0
•女职工本科以上学历的平均薪金: E(Yt | Xt , D1 = 0, D2 = 1) = (b 0 + b3 ) + b1 Xt
•男职工本科以上学历的平均薪金:
E(Yt | Xt , D1 = 1, D2 = 1) = (b0 + b 2 + b3 ) + b1 Xt
第23页,共32页。
2、乘法方式
第8页,共32页。
这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些
虚拟变量模型

由上面分析,我们可以看到,利用虚拟变量可以把特殊
年份与正常年份构成统一的模型来表示,并且可以利用
OLS法得出适合各时期的统一的参数估计量。
这里应该指出,应用OLS法的条件是特殊年份与正常年
份消费具有相同的方差。
(三)多个虚拟变量的引进及虚拟变量陷井问题 某些商品的销售量是有季节性的,假设销售函数模
型为:
Ct 0 1 x1t k xkt ut (8.1.5)
其中Ct表示销量,x1t , x2t ,, xkt 表示决定销量的解
释变量,为了把季节变化对销售的影响反映到模型
中,如果我们引进四个虚拟变量:
1
Dit
0
第i 季 i 1,2,3,4. 其他季
这样销售函数的季节回归模型为
改变虚拟变量的引入方法。改为引入虚拟变量
1
Dit
0
第i 季 i 2,3,4. 其他季
第1季度用 D2t D3t D4t 0表示,这时销售函数的 季节回归模型可写为
Ct 0 1 x1t k xkt 2 D2t 3 D3t 4 D4t ut
这样就避免了虚拟变量的陷阱问题。
二、虚拟变量作为自变量的情况
(一)自变量中只有虚拟变量
例如调查某地区性别与收入之间的关系,我们可以
用模型表示:
yi Di ui
(8.1.1)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七讲 经典单方程计量经济学模型:专门问题
虚拟变量模型
学习目标:
1. 了解什么是虚拟变量以及什么是虚拟变量模型;
2. 理解虚拟变量的设置原则;
3. 掌握虚拟变量模型的两种基本引入方式(加法方式和乘法方式);
4. 能够自行设计虚拟变量模型,并能够解释其中蕴含的经济意义;
教学基本内容
一、 虚拟变量
许多经济变量是可以定量度量,例如:商品需求量、价格、收入、产量等;
但有一些影响经济变量的因素是无法定量度量。例如:职业、性别对收入的影响,
战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等。
定性变量:把职业、性别这样无法定量度量的变量称为定性变量。
定量变量:把价格、收入、销售额这样可以可以定量度量的变量称为定量变
量。
为了能够在模型中能够反映这些因素的影响,提高模型的精度,拓展回归模
型的功能,需要将它们“量化”。 这种“量化”通常是通过引入“虚拟变量”
来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常
称为虚拟变量(dummy variables) ,记为D。 虚拟变量只作为解释变量。
例如:反映性别的虚拟变量女男;0;1D
反映文化程度的虚拟变量
非本科学历本科学历;0;1D
一般地,基础类型和肯定类型取值为1;比较类型和否定类型取值为0。
二、 虚拟变量的设置原则
设置原则:
每一定性变量(qualitative variable)所需的虚拟变量个数要比该定性变量的状
态类别数(categories)少1。即如果有m种状态,只在模型中引入m-1个虚拟变量。
例如,冷饮的销售量会受到季节变化的影响。季节定性变量有春、夏、秋、
冬4种状态,只需要设置3个虚拟变量:
其他春季;0;11D 其他夏季;0;12D
其他秋季;0;13D
错误设置:
其他春季;0;11D 其他夏季;0;12D 其他秋季;0;13D
其他冬季;0;14D
如果设置第4个虚变量,则出现“虚拟变量陷井”(Dummy Variable Trap)问
题。
三、 虚拟变量模型
1. 概念
虚拟变量模型:同时含有一般解释变量与虚拟变量的模型称为虚拟变量模
型,也称方差分析(analysis-of variance: ANOVA)模型。
2. 例子
一个以性别为虚拟变量考察企业职工薪金的模型:
iiiiDXY210
女男;0;1D
其中:Yi为企业职工的薪金;Xi为工龄; Di=1,代表男性,Di=0,代表女性。
四、 虚拟变量的引入方式
虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。
1. 加法方式—考察截距的变化
上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式,即模型中将
虚拟变量以相加的形式引入模型。
iiiiDXY210
女男;0;1D
为了进行进一步的分析,深刻理解这种引入方法的内涵,假定E(i)=0,我
们将该模型化为:
男职工的平均薪金:
iiiiXDXYE120
)()1,|(
女职工的平均薪金:
iiiiXDXYE10
)0,|(
假定2>0,则两个函数有相同的斜率,但有不同的截距。这意味着,男女职
工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差2。
可以通过对2的统计显著性进行检验,以判断企业男女职工的平均薪金水平
是否有显著差异。
如图1所示对比图:
图 1
经济意义:男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金
水平却不一样,相差2,这也是生活中比价常见的现象,一般男性的基本工资要
高于女性,符合经济现实。
思考题:
将上例中的性别换成教育水平,教育水平考虑三个层次:高中以下、高中、
大学及其以上。如何建立虚拟变量模型?
iiiuDDXY231210
其他高中;0;11D
其他大学及以上;0;12D
高中以下的平均薪金:
iiiXDDXYE1021
)0,0,|(
高中的平均薪金:
iiiXDDXYE12021
)()0,1,|(
大学及以上的平均薪金:
iiiXDDXYE13021
)()1,0,|(
Y 大学及其以上
高中
高中以下
0 X
图2 不同教育程度人员薪金水平示意图
年薪Y 男职工
女职工
工龄X
2. 乘法方式——考察斜率的变化
在许多情况下,我们需要考察斜率的变化,此时可以通过乘法的方式引入虚
拟变量来测度。
例1:根据消费理论,收入决定消费,即消费水平C主要取决于收入水平X。
但是,在自然灾害、战争等反常年份,消费倾向往往发生变化。这种消费倾向的
变化可通过在收入的系数中引入虚拟变量来考察。
设: 1;0;tD农村居民城镇居民
消费模型建立如下:
ttttuXDXC210t
同样,我们把该函数分解来进行分析,可化为:
正常年份:
ttttXDXCE)()1,|(210
反常年份:
ttttXDXCE10
)0,|(
如图3所示对比图:
图 3
经济意义:无论是在正常年份还是反常年份人们首先必须解决衣食住行等
温饱问题,这是基本的生活开支。但是到了有战争、自然灾害、金融危机等反常
年份,人们的消费倾向就会下降。
例2:中国农村居民的边际消费倾向会与城镇居民的边际消费倾向不同?
这种消费倾向的差异可通过在收入的系数中引入虚拟变量来考察。
设:
1;0;iD农村居民
城镇居民
消费模型建立如下:
iiiiuXDXC210i
农村居民:
iiiiXDXCE)()1,|(210
城镇居民:
iiiiXDXCE10
)0,|(
3. 混合方式——同时考查截距与斜率的变化
当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量。
课后习题
如果在服装需求函数模型中必须包含3个定性变量:季节(4种状态)、性
别(2种状态)、职业(5种状态),自行设计一虚拟变量模型。