虚拟变量回归培训课件(PPT共 65张)
合集下载
第五章_包含虚拟变量的回归模型(课堂PPT)

• 其它模型
– 对数单位模型(Logit Model) – 概率单位模型(Probit Model)
1
《
55
包含虚拟因变量的回归模型
• 如何估计这类模型?是否可以用OLS? • 有特殊的统计推断问题吗? • 如何度量这种模型的拟合优度?
1
《
56
(一)线性概率模型(LPM)
yi 0 1xi ui
女性 : s·alaryi 17.96929 1.370714 yearsi
years
1
《
16
2定性变量+1定量变量
yi 0 1 d1i 2 d2i 3 xi ui
1, 男教师 d1i 0,女教师
1, 白种人 d2i 0, 非白种人
xi 教龄
1
《
17
思考题:以下定义方法的差别?
18.5 21.7 18.0 19.0 22.0
教育
0 1 0 0 1
1
《
7
1
《
8
y
1
1 3.28
d 0
《
d 1
x
9
• 虚拟变量系数(差别截距项系数)的经济 含义
• 赋值为0的一类常称为基准类(对比类)
1
《
10
思考题:如下定义存在什么问题?
yi 0 1 d1i 2 d2i ui
1
《
44
假说一和假说二
• 不同政策待遇的企业外国股权比例存在差 异
– 私营企业参与的合资企业比乡镇企业参与的合 资企业,其外国股权比例更高。
– 对资金有更大需求的企业比更小需求的企业, 其外国股权比例更高
1
《
45
假说三和假说四
• 由于浙江省对待不同企业的政策差异小于 江苏省,在浙江省所观察到的假说一和假 说二所描述的效应会弱于江苏省。
– 对数单位模型(Logit Model) – 概率单位模型(Probit Model)
1
《
55
包含虚拟因变量的回归模型
• 如何估计这类模型?是否可以用OLS? • 有特殊的统计推断问题吗? • 如何度量这种模型的拟合优度?
1
《
56
(一)线性概率模型(LPM)
yi 0 1xi ui
女性 : s·alaryi 17.96929 1.370714 yearsi
years
1
《
16
2定性变量+1定量变量
yi 0 1 d1i 2 d2i 3 xi ui
1, 男教师 d1i 0,女教师
1, 白种人 d2i 0, 非白种人
xi 教龄
1
《
17
思考题:以下定义方法的差别?
18.5 21.7 18.0 19.0 22.0
教育
0 1 0 0 1
1
《
7
1
《
8
y
1
1 3.28
d 0
《
d 1
x
9
• 虚拟变量系数(差别截距项系数)的经济 含义
• 赋值为0的一类常称为基准类(对比类)
1
《
10
思考题:如下定义存在什么问题?
yi 0 1 d1i 2 d2i ui
1
《
44
假说一和假说二
• 不同政策待遇的企业外国股权比例存在差 异
– 私营企业参与的合资企业比乡镇企业参与的合 资企业,其外国股权比例更高。
– 对资金有更大需求的企业比更小需求的企业, 其外国股权比例更高
1
《
45
假说三和假说四
• 由于浙江省对待不同企业的政策差异小于 江苏省,在浙江省所观察到的假说一和假 说二所描述的效应会弱于江苏省。
虚拟变量回归课件

虚拟变量回归在各个领域都有广泛的应用,其中包括房价预测和汽车保险费用预估。通过实际案例分析, 我们将展示其在实际问题中的应用。
虚拟变量回归面临的问题
在进行虚拟变量回归时,我们可能会面临多重共线性问题。为了解决这个问 题,我们将介绍哑变量陷阱和特征选 收集数据 2. 对数据进行预处理 3. 分析数据 4. 建立模型 5. 模型的评估与优化
虚拟变量回归
通过介绍虚拟变量回归,我们将探讨其概念、作用以及应用。还将讨论面临 的问题和解决方法,以及如何进行虚拟变量回归并提高模型精度。
什么是虚拟变量回归
虚拟变量回归是一种统计方法,用于处理具有分类特征或非数字特征的数据。 它将非数字变量转换为二元变量,以便在回归模型中使用。
虚拟变量回归的应用
总结
虚拟变量回归具有自身的优点和局限性。我们将总结这些,并探讨未来的发 展方向。最后,我们将分享一些提高模型精度的技巧和建议。
虚拟变量回归面临的问题
在进行虚拟变量回归时,我们可能会面临多重共线性问题。为了解决这个问 题,我们将介绍哑变量陷阱和特征选 收集数据 2. 对数据进行预处理 3. 分析数据 4. 建立模型 5. 模型的评估与优化
虚拟变量回归
通过介绍虚拟变量回归,我们将探讨其概念、作用以及应用。还将讨论面临 的问题和解决方法,以及如何进行虚拟变量回归并提高模型精度。
什么是虚拟变量回归
虚拟变量回归是一种统计方法,用于处理具有分类特征或非数字特征的数据。 它将非数字变量转换为二元变量,以便在回归模型中使用。
虚拟变量回归的应用
总结
虚拟变量回归具有自身的优点和局限性。我们将总结这些,并探讨未来的发 展方向。最后,我们将分享一些提高模型精度的技巧和建议。
第七章 虚拟变量 虚拟变量回归模型ppt汇总 计量经济学

第七章 虚拟变量
• 在回归分析中,被解释变量的影响因素 除了量(或定量)的因素还有质(或定 性)的因素,这些质的因素可能 会使回 归模型中的参数发生变化,为了估计质 的因素产生的影响,在模型中就需要引 入一种特殊的变量—虚拟变量。
2020/6/16
(二)作用
• 1、可以描述和测量定性(或属性)因素 的影响;
2、多个因素各两种属性
• 如果有m个定性因素,且每个因素各有两个不同的 属性类型,则引入m个虚拟变量。
• 例2
• 研究居民住房消费函数时,考虑到城乡差异和不同 收入层次的影响将消费函数设定为:
Yt=b0+b1Xt+a1D1t+ a2D2t+ μt
Yt=居民住房消费支出
Xt=居民可支配收入
1城镇居民
2020/6/16
虚拟变量对截距的影响
y
有适龄子女
b0
o
图1 虚拟变量对截距的影响
x
2020/6/16
2、乘法方式引入虚拟变量
• 基本思想:以乘法方式引入虚拟解释变量
,是在所设定的计量经济模型中,将虚拟 解释变量与其他解释变量相乘作为新 的解释变量,以达到其调整模型斜率的
目的。 • 该方式引入虚拟变量主要作用:
D=
0 无适龄子女
将家庭教育费用支出函数写成:Yt=b0+b1Xt+aDt+μt 即以加法形式引入虚拟变量。
2020/6/16
子女年龄结构不同的家庭教育 费用支出函数为:
• 无适龄子女家庭的教育费用支出函数(D=0 ):Yt=b0+b1Xt+μt
• 有适龄子女家庭的教育费用支出函数(D=1 ):Yt=(b0+a)+b1Xt+μt
• 在回归分析中,被解释变量的影响因素 除了量(或定量)的因素还有质(或定 性)的因素,这些质的因素可能 会使回 归模型中的参数发生变化,为了估计质 的因素产生的影响,在模型中就需要引 入一种特殊的变量—虚拟变量。
2020/6/16
(二)作用
• 1、可以描述和测量定性(或属性)因素 的影响;
2、多个因素各两种属性
• 如果有m个定性因素,且每个因素各有两个不同的 属性类型,则引入m个虚拟变量。
• 例2
• 研究居民住房消费函数时,考虑到城乡差异和不同 收入层次的影响将消费函数设定为:
Yt=b0+b1Xt+a1D1t+ a2D2t+ μt
Yt=居民住房消费支出
Xt=居民可支配收入
1城镇居民
2020/6/16
虚拟变量对截距的影响
y
有适龄子女
b0
o
图1 虚拟变量对截距的影响
x
2020/6/16
2、乘法方式引入虚拟变量
• 基本思想:以乘法方式引入虚拟解释变量
,是在所设定的计量经济模型中,将虚拟 解释变量与其他解释变量相乘作为新 的解释变量,以达到其调整模型斜率的
目的。 • 该方式引入虚拟变量主要作用:
D=
0 无适龄子女
将家庭教育费用支出函数写成:Yt=b0+b1Xt+aDt+μt 即以加法形式引入虚拟变量。
2020/6/16
子女年龄结构不同的家庭教育 费用支出函数为:
• 无适龄子女家庭的教育费用支出函数(D=0 ):Yt=b0+b1Xt+μt
• 有适龄子女家庭的教育费用支出函数(D=1 ):Yt=(b0+a)+b1Xt+μt
计量经济学课件PPT虚拟变量

35
load c:\lx4\jjtzh.wf1 genr q2=(cos(t*2*3.14159/4)<-0.999999) genr q3=(sin(t*2*3.14159/4)<-0.999999) genr q4=(cos(t*2*3.14159/4)>0.999999) equation jjtzheq.ls xshe c t q2 q3 q4 forecast xshef1 equation wjjtzheq.ls xshe c t forecast xshef2 group xsh xshe xshef1 xshef2 show xsh.line
• 虚拟变量是一用以反映质的属性的一个人 工变量,通常记为D(Dummy)。 • 虚拟变量D只取0或1两个值 • 对基础类型或肯定类型设D=1 • 对比较类型或否定类型设D=0
6
虚拟变量举例
• • D= •
• • D= •
1
0 0 1
本科学历
非本科学历 “文革”时期 非“文革”时期
7
虚拟变量的引入
加法与乘法组合引入——— 截距与斜率均不同
• • • • • • D=1 异常时期 D=0 正常时期 设定模型 Y=b0+ b1x+ b2D + b3Dx +e 异常时期模型:(截距与斜率均不同) Y= (b0 + b2) + (b1 +b3) x +e 反常时期模型:(截距与斜率均不同) Y= b0 + b1 x +e
虚拟变量设置的原则
• 在模型中引入多个虚拟变量时,虚拟变量 的个数应按下列原则确定: • 如果有 m 种互斥的属性类型,在模型中引 入 m-1 个虚拟变量 (虚拟变量的陷阱) • 例如,性别有2个互斥的属性,引用2-1=1个 虚拟变量 • 再如,文化程度分小学、初中、高中、大 学、研究生5类,引用4个虚拟变量
load c:\lx4\jjtzh.wf1 genr q2=(cos(t*2*3.14159/4)<-0.999999) genr q3=(sin(t*2*3.14159/4)<-0.999999) genr q4=(cos(t*2*3.14159/4)>0.999999) equation jjtzheq.ls xshe c t q2 q3 q4 forecast xshef1 equation wjjtzheq.ls xshe c t forecast xshef2 group xsh xshe xshef1 xshef2 show xsh.line
• 虚拟变量是一用以反映质的属性的一个人 工变量,通常记为D(Dummy)。 • 虚拟变量D只取0或1两个值 • 对基础类型或肯定类型设D=1 • 对比较类型或否定类型设D=0
6
虚拟变量举例
• • D= •
• • D= •
1
0 0 1
本科学历
非本科学历 “文革”时期 非“文革”时期
7
虚拟变量的引入
加法与乘法组合引入——— 截距与斜率均不同
• • • • • • D=1 异常时期 D=0 正常时期 设定模型 Y=b0+ b1x+ b2D + b3Dx +e 异常时期模型:(截距与斜率均不同) Y= (b0 + b2) + (b1 +b3) x +e 反常时期模型:(截距与斜率均不同) Y= b0 + b1 x +e
虚拟变量设置的原则
• 在模型中引入多个虚拟变量时,虚拟变量 的个数应按下列原则确定: • 如果有 m 种互斥的属性类型,在模型中引 入 m-1 个虚拟变量 (虚拟变量的陷阱) • 例如,性别有2个互斥的属性,引用2-1=1个 虚拟变量 • 再如,文化程度分小学、初中、高中、大 学、研究生5类,引用4个虚拟变量
庞浩计量经济学课件第八章 虚拟变量回归

二、虚拟变量的设置规则
1.虚拟变量个数的设置规则 若定性因素有m个相互排斥的类型(或属性、水 平),则: 在有截距项的模型中,只能引入m-1个虚拟变 量,否则会陷入“虚拟变量陷阱”(即:出 现完全的多重共线性); 在无截距项的模型中,可以引入m个虚拟变量, 不会导致完全的多重共线性。
4
例如:研究城乡居民的可支配收入对居民住房消费支 出的影响 C Y D u i 1 1 i 2 i i
21
分段线性回归
适合于社会经济现象会在解释变量达到某个临界值时 发生突变,考虑下述模型: Yt 1 1 X t 2 ( X t X * ) Dt ut 0, X t X * Dt * 1, X t X
当X t X *时, Yt 1 1 X t ut 当X t X 时, Yt 1 1 X t 2 ( X t X * ) ut
18
二、用虚拟变量表示不同斜率的回归—— 乘法类型
回归模型的比较——结构变化检验
分段线性回归
19
回归模型的比较——结构变化检验
研究改革开放前后(1950-2004),储蓄与收入的关系: Yi 1 2 Di 1 X i 2 ( Di X i ) ui
( 1950 1977 ) 0, 改革开放前 Di ( 1978 2004 ) 1, 改革开放后
Yi 1 2 Di 1 X i ui
0, 租房户 Di 1, 有房户
15
i 1 2 3 4 5 6 7 8 9 10
Y 1.0 1.3 0.7 0.8 0.5 2.4 0.3 3.2 2.8 0.0
X 20.0 24.0 12.0 16.0 11.0 32.0 10.0 40.0 32.0 7.0
虚拟变量回归PPT课件

Yi ——年工资
X i ——工龄
D1 =1 只是高中毕业
D2 =1 大学毕业及以上
D1=0 其他
D2 =0 其他
基础类型: E(Yi Xi , D1 0, D2 0) 0 Xi (高中以下)
比较类型:E(Yi Xi , D1 1, D2 0) (0 1) Xi(高中) E(Yi Xi , D1 0, D2 1) (0 2) X(i 大学及以上)
用t检验分别检验 1 和 2 的统计显著性:可以分别验
证两个定性变量对截距是否有显著影响
17
注意:
● u i 应服从基本假定
● 两个定性变量分别有两种类型,可以用两个虚拟变量,
不会落入虚拟变量陷阱(为什么?)
注意:“两个定性变量个两种类型”和“一个定性变量三种
类型”都用了两个虚拟变量,但其性质是不同的。
的变量称虚拟变量,一般常用D(dummy) 表示
D=0 表示某种属性或状态不出现或不存在
D=1 表示某种属性或状态出现或存在
4
虚拟变量的作用
● 作为属性因素的代表,如性别(男/女)
● 作为某些非精确计量的数量因素的代表,
如受教育程度(高中及以下、专科、本科及以上)
● 作为某些偶然因素或政策因素的代表,
作用:假定其他因素都不变,只研究某种定性因素在某定 量变量上是否表现出显著差异 (只论有无显著差异,不论差异的原因)
2. 解释变量中既含定量变量,又含虚拟变量
作用:研究定量变量和虚拟变量同时对被解释变量的影响
3. 虚拟被解释变量模型:被解释变量本身取值为0或1
作用:对某社会经济现象进行“是”与“否”判断研究 (离散选择模型)
●K个定性变量可选用K个虚拟变量去表示,这不会出现
第八章(虚拟变量回归)_图文

5.社会因素:包括社会治安、城市化水平、消费心理等;
6.行政(政策)因素:包括土地与住房制度、房地产价格政策等;
7.区域因素:包括所处地段的市政基础设施、交通状况等;
8.个别因素:包括朝向、结构、材料、功能设计、施工质量等;
9.房地产投机因素:投机者在房地产市场中的投机活动;
10.自然因素:包括自然环境、地质、地形、地势及气候等。
使用虚拟变量需注意的问题
v 虚拟变量陷阱:若定性变量有m个类别,则引入 m个虚拟变量将会产生完全多重共线性问题,避 免方法:
Ø 只引入(m-1)个虚拟变量 Ø 引入m个虚拟变量但去掉截距项
v 哪种方法更好:包含截距项更方便,可以很容易 地检验某个组与基准组之间是否存在显著差异以 及差异程度。
2、避免落入“ 虚拟变量陷阱”
•男职工本科以上学历的平均薪金:
1.解释变量只有一个分为两种类型的定性变量无 定量变量的回归
这种模型又称方差分析模型
其中:Y为公立学校教师工资,
D=0为农村学校;D=1为城镇学校
分析条件期望:
基础类型:
比较类型:
为差异截距系数,通过对系数 可检验
的 t 检验:
在其他因素不变的条件下,城乡教师的工资是否有显2著323
D=0 表示某种属性或状态不出现或不存在 5
虚拟变量的作用
● 作为属性因素的代表,如性别 ● 作为某些非精确计量的数量因素的代表,
如受教育程度(高中及以下、专科、本科及以上) ● 作为某些偶然因素或政策因素的代表,
如 伊拉克战争、“911事件”、四川汶川大地震 ● 时间序列分析中作为季节(月份)的代表 ● 分段回归——研究斜率、截距的变动 ● 比较两个回归模型的差异 ● 虚拟被解释变量模型:
虚拟变量回归课件

例1
(1)
D
=
1 0
男 女
( 2)D=1 0
改 革 开 放 以 后 改 革 开 放 以 前
(3)D1 =0 1
天气阴 其 他(4)D2
=1 0
天气雨 其他
问题:
为何只选0、1,选2、3、4行吗?为什么?
虚拟变量回归
14
属性的状态(水平)数与虚拟变量 数量的关系
定性因素的属性既可能为两种状态,也可能为多种 状态。例如,性别(男、女两种)、季节(4种状 态),地理位置(东、中、西部),行业归属,所 有制,收入的分组等。
虚拟变量回归
11
二、虚拟变量设置规则
虚拟变量的设置规则涉及三个方面: 1.“0”和“1”选取原则 2.属性(状态、水平)因素与设置虚拟变量
数量的关系 3.虚拟变量在回归分析中的角色以及作用等
方面的问题
虚拟变量回归
12
“0”和“1”选取原则
虚拟变量取“1”或“0”的原则,应从分析问题的 目的出发予以界定。
虚拟变量回归
16
一个例子(虚拟变量陷阱)
研究居民住房消费支出 Yi 和居民可支配收入 Xi 之间的
数量关系。回归模型的设定为:Y i= 0 + 1 X i+ u i( 1 )
现在要考虑城镇居民和农村居民之间的差异,如何办?
为了对 “城镇居民”、“农村居民”进行区分,分析
各自在住房消费支出 Yi上的差异,设 D1i = 1 为城镇;
非数值性的因素。 基本思想: 直接在回归模型中加入定性因素存在诸多的困难 (那些困难?),是否可将这些定性因素进行量 化,以达到定性因素能与定量因素有着相同作用 之目的。
虚拟变量回归
10
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例 如 : Y= D+ X+ i 0 1 i i μ i 模 型 形 式 Y=f ( D , X + μ D i i i) i 0 1 i
1 城 市 其 中 :- Y 支 出 ;- X 收 入 ; D i 0农 村
E Y , i 1 ( ) X i|XD i 0 1 i E Y , i 0 ( ) X i|XD i 0 i
1 天 气 雨 1 天 气 阴 ( 4 )D ( 3 )D 2= 1= 0 其 他 0 其 他
问题: 为何只选0、1,选2、3、4行吗?为什么?
10
属性的状态(水平)数与虚拟变量数量 Econometrics的关系
定性因素的属性既可能为两种状态,也可能为多种 状态。例如,性别(男、女两种)、季节(4种状 态),地理位置(东、中、西部),行业归属,所 有制,收入的分组等。
思考:
四种加法方式引入虚拟变量会产生什么效应?
19
Econometrics
(1)一个两种属性定性解释变量而无定量变量的情形
例 如 : Y D i 0 1 i i
模 型 形 式 : Y fD (i ) D i i 0 1 i
1城 市 其 中 : D = ( 比 较 的 基 础 : 农 村 ) i 0农 村
冬 季 、 城 市 居 民 E YX , D 0 , D 1 ) + X ( i| i 1 2 0 2 i
冬季、农村居民
E Y | X , D 0 , D 0 X i i 1 2 0 i
26
Econometrics
D 1 , D 1 1 2
虚拟变量在回归模型中的角色
虚拟变量既可作为被解释变量,也可作为解释
变量,分别称其为虚拟被解释变量和虚拟解释变量。
虚拟被解释变量的研究是当前计量经济学研究 的前沿领域,如MacFadden、Heckmen等人的微观 计量经济学研究,大量涉及到虚拟被解释变量的分 析。
本课程只是讨论虚拟解释变量的问题
0 i i
城市 Y ( + ) + X + μ i= 0 1 i i 农村
21
Econometrics
Y
X
共同的特征:截距发生改变(?)
22
(3)一个定性解释变量(两种以上属性)和一个定 Econometrics 量解释变量的情形
模型形式 Yi = f ( X i, D1, D2, ...) + μi (如:民族有56种特性;季度有 4种特性) 例如: 啤酒售量 Y 、人均收入 X 、季度 D ; Yi 0 1D1 2 D2 3 D3 X i i 1 一季度 1 其中: D1 D2 其 它 0 0 1 三季度 D3 其 它 0 二季度 其 它
虚拟变量的设置规则涉及三个方面:
数量的关系 3.虚拟变量在回归分析中的角色以及作用等 方面的问题
8
Econometrics
“0”和“1”选取原则
虚拟变量取“1”或“0”的原则,应从分析问题 的目的出发予以界定。
从理论上讲,虚拟变量取“0”值通常代表比较 的基础类型;而虚拟变量取“1”值通常代表被 比较的类型。
原 模 型 :
Y +β X u i= i+ i
加 法 方 式 引 入 = D 0+ 1 乘 法 方 式 引 入 = 2D 1+
实质:加法方式引入虚拟变量改变的是截距; 乘法方式引入虚拟变量改变的是斜率。
17
Econometrics
一、加法类型
以加法方式引入虚拟变量时,主要考虑的问 题是定性因素的属性和引入虚拟变量的个数。
Econometrics
第二节 虚拟解释变量的回归
本节基本内容:
●加法类型
●乘法类型
●虚拟解释变量综合应用
16
Econometrics
在计量经济学中,通常引入虚拟变量的方式分为 加法方式和乘法方式两种:即
Y Xu t 0 t t 1 D Y X u t 1 t t2 Xt D
E ( Y /,, D D . . . ,) D D DD . . . X t 1 t 2 t k t 01 1 t 2 2 t k k t t
28
Econometrics
加法方式引入虚拟变量的主要作用为: 1.在有定量解释变量的情形下,主要改变方程
显然,男女生在消费上存在差异。为了了解男、女生的
消费支出结构差异,应当如何建立模型? 面临的问题:如何把男女生这样的非数量变量引
入方程?
2
Econometrics
问题的一般性描述
在实际建模中,一些定性变量具有不可忽视的重要影响。
例如,研究某个企业的销售水平,产业属性(制造业、零
售业)、所有制(私营、非私营)、地理位置(东、中、 西部)、管理者的素质、不同的收入水平等是值得考虑的
本节基本内容:
●基本概念 ●虚拟变量设置规则
5
Econometrics
一、基本概念
定量因素:可直接测度、数值性的因素。 定性因素:属性因素,表征某种属性存在与否的 非数值性的因素。 基本思想: 直接在回归模型中加入定性因素存在诸多的困难 (那些困难?),是否可将这些定性因素进行量 化,以达到定性因素能与定量因素有着相同作用 之目的。
25
Econometrics
夏 季 、 城 市 居 民
夏季、农村居民
E Y | X , D 1 , D 1 X i i 1 2 0 1 2 i
( )
( ) +
E Y | X , D = 1 , D = 0 = + i i 1 2 0 1X i
23
Econometrics
一 季 度 : EY|X ,D ( ) X i 1,D 1 1 2 D 3 0 0 1 i 二 季 度 : EY|X ,D (0 2)Xi i 1,D 2 1 1 D 3 0 三 季 度 : EY|X ,D (0 3)Xi i 1,D 3 1 1 D 2 0 四 季 度 : EY|X 0 Xi i 1,D 1 D 2 D 3 0 准 : 四 季 度 基
那 么 : E Y D 1= + ) ( i| i= 0 1
Y ( ) i 0 1 i Y i 0 i
E Y D 0= i| i= 0
城 市
农村
20
(2) 一个定性解释变量(两种属性)和一个定量 Econometrics 解释变量的情形
6
Econometrics
虚拟变量的定义
计量经济学中,将取值为0和1的人工变量称为虚 拟变量。虚拟变量也称:哑元变量、定性变量等 等。通常用字母D或DUM加以表示(英文中虚拟 或者哑元Dummy的缩写)。 对定性变量的量化可采用虚拟变量的方式实现。
7
Econometrics
二、虚拟变量设置规则
1.“0”和“1”选取原则 2.属性(状态、水平)因素与设置虚拟变量
Y
D 1 , D 0 1 2
D 0 , D 1 1 2
D 0 , D 0 1 2
X
上述图形的前提条件是什么?
27
Econometrics
运用OLS得到回归结果,再用t检验讨论因素
是否对模型有影响。
加法方式引入虚拟变量的一般表达式: 基本分析方法: 条件期望。
Y D D . . . D X u t 0 1 1 t 2 2 t k k t tt
分为四种情形讨论:
(1)解释变量只有一个定性变量而无定量变量, 而且定性变量为两种相互排斥的属性; ( 2 )解释变量分别为一个定性变量(两种属性)
和一个定量解释变量;
18
Econometrics
(3)解释变量分别为一个定性变量(两种以上属 性)和一个定量解释变量; (4)解释变量分别为两个定性变量(各自分别是 两种属性)和一个定量解释变量;
“0”代表基期(比较的基础,参照物);
“1”代表报告期(被比较的效应)。
9
Econometrics
例如,比较收入时考察性别的作用。当研究男性收入是否 高于女性时,是将女性作为比较的基础(参照物),故有 男性为“1”,女性为“0”。
例1
(1)
1 男 D= 0 女
1改 革 开 放 以 后 ( 2 ) D = 0改 革 开 放 以 前
现在要考虑城镇居民和农村居民之间的差异,如何办?
为了对 “城镇居民”、“农村居民”进行区分,分析
各自在住房消费支出 Y i 上的差异,设 D1i = 1 为城镇; D1i = 0 为农村,则模型为 (模型有截距,“居民属性”定性变量只有两个相互排斥 的属性状态( m 2 ),故只设定一个虚拟变量。)
2.当回归模型无截距项时,则可引入 m 个虚拟变 量;否则,就会陷入“虚拟变量陷阱”。(为什 么?)
12
Econometrics
一个例子(虚拟变量陷阱)
研究居民住房消费支出 Y i 和居民可支配收入 X i 之间的 数量关系。回归模型的设定为:Y = + X + u 1 ) i 0 1 i i(
Econometrics
计量经济学 第七章 虚拟变量回归
1
Econometrics
引子:男女大学生消费真有差异吗?
在对在校学生的消费行为进行的调查中,发现在校生的
消费行为呈现多元化的结构。人际交往消费、手机类消费、
衣着类消费、化妆品类消费、电脑类消费、旅游类消费占 有较大的比例;而食品类消费、学习用品类消费不突显。
1 城 市 其 中 :- Y 支 出 ;- X 收 入 ; D i 0农 村
E Y , i 1 ( ) X i|XD i 0 1 i E Y , i 0 ( ) X i|XD i 0 i
1 天 气 雨 1 天 气 阴 ( 4 )D ( 3 )D 2= 1= 0 其 他 0 其 他
问题: 为何只选0、1,选2、3、4行吗?为什么?
10
属性的状态(水平)数与虚拟变量数量 Econometrics的关系
定性因素的属性既可能为两种状态,也可能为多种 状态。例如,性别(男、女两种)、季节(4种状 态),地理位置(东、中、西部),行业归属,所 有制,收入的分组等。
思考:
四种加法方式引入虚拟变量会产生什么效应?
19
Econometrics
(1)一个两种属性定性解释变量而无定量变量的情形
例 如 : Y D i 0 1 i i
模 型 形 式 : Y fD (i ) D i i 0 1 i
1城 市 其 中 : D = ( 比 较 的 基 础 : 农 村 ) i 0农 村
冬 季 、 城 市 居 民 E YX , D 0 , D 1 ) + X ( i| i 1 2 0 2 i
冬季、农村居民
E Y | X , D 0 , D 0 X i i 1 2 0 i
26
Econometrics
D 1 , D 1 1 2
虚拟变量在回归模型中的角色
虚拟变量既可作为被解释变量,也可作为解释
变量,分别称其为虚拟被解释变量和虚拟解释变量。
虚拟被解释变量的研究是当前计量经济学研究 的前沿领域,如MacFadden、Heckmen等人的微观 计量经济学研究,大量涉及到虚拟被解释变量的分 析。
本课程只是讨论虚拟解释变量的问题
0 i i
城市 Y ( + ) + X + μ i= 0 1 i i 农村
21
Econometrics
Y
X
共同的特征:截距发生改变(?)
22
(3)一个定性解释变量(两种以上属性)和一个定 Econometrics 量解释变量的情形
模型形式 Yi = f ( X i, D1, D2, ...) + μi (如:民族有56种特性;季度有 4种特性) 例如: 啤酒售量 Y 、人均收入 X 、季度 D ; Yi 0 1D1 2 D2 3 D3 X i i 1 一季度 1 其中: D1 D2 其 它 0 0 1 三季度 D3 其 它 0 二季度 其 它
虚拟变量的设置规则涉及三个方面:
数量的关系 3.虚拟变量在回归分析中的角色以及作用等 方面的问题
8
Econometrics
“0”和“1”选取原则
虚拟变量取“1”或“0”的原则,应从分析问题 的目的出发予以界定。
从理论上讲,虚拟变量取“0”值通常代表比较 的基础类型;而虚拟变量取“1”值通常代表被 比较的类型。
原 模 型 :
Y +β X u i= i+ i
加 法 方 式 引 入 = D 0+ 1 乘 法 方 式 引 入 = 2D 1+
实质:加法方式引入虚拟变量改变的是截距; 乘法方式引入虚拟变量改变的是斜率。
17
Econometrics
一、加法类型
以加法方式引入虚拟变量时,主要考虑的问 题是定性因素的属性和引入虚拟变量的个数。
Econometrics
第二节 虚拟解释变量的回归
本节基本内容:
●加法类型
●乘法类型
●虚拟解释变量综合应用
16
Econometrics
在计量经济学中,通常引入虚拟变量的方式分为 加法方式和乘法方式两种:即
Y Xu t 0 t t 1 D Y X u t 1 t t2 Xt D
E ( Y /,, D D . . . ,) D D DD . . . X t 1 t 2 t k t 01 1 t 2 2 t k k t t
28
Econometrics
加法方式引入虚拟变量的主要作用为: 1.在有定量解释变量的情形下,主要改变方程
显然,男女生在消费上存在差异。为了了解男、女生的
消费支出结构差异,应当如何建立模型? 面临的问题:如何把男女生这样的非数量变量引
入方程?
2
Econometrics
问题的一般性描述
在实际建模中,一些定性变量具有不可忽视的重要影响。
例如,研究某个企业的销售水平,产业属性(制造业、零
售业)、所有制(私营、非私营)、地理位置(东、中、 西部)、管理者的素质、不同的收入水平等是值得考虑的
本节基本内容:
●基本概念 ●虚拟变量设置规则
5
Econometrics
一、基本概念
定量因素:可直接测度、数值性的因素。 定性因素:属性因素,表征某种属性存在与否的 非数值性的因素。 基本思想: 直接在回归模型中加入定性因素存在诸多的困难 (那些困难?),是否可将这些定性因素进行量 化,以达到定性因素能与定量因素有着相同作用 之目的。
25
Econometrics
夏 季 、 城 市 居 民
夏季、农村居民
E Y | X , D 1 , D 1 X i i 1 2 0 1 2 i
( )
( ) +
E Y | X , D = 1 , D = 0 = + i i 1 2 0 1X i
23
Econometrics
一 季 度 : EY|X ,D ( ) X i 1,D 1 1 2 D 3 0 0 1 i 二 季 度 : EY|X ,D (0 2)Xi i 1,D 2 1 1 D 3 0 三 季 度 : EY|X ,D (0 3)Xi i 1,D 3 1 1 D 2 0 四 季 度 : EY|X 0 Xi i 1,D 1 D 2 D 3 0 准 : 四 季 度 基
那 么 : E Y D 1= + ) ( i| i= 0 1
Y ( ) i 0 1 i Y i 0 i
E Y D 0= i| i= 0
城 市
农村
20
(2) 一个定性解释变量(两种属性)和一个定量 Econometrics 解释变量的情形
6
Econometrics
虚拟变量的定义
计量经济学中,将取值为0和1的人工变量称为虚 拟变量。虚拟变量也称:哑元变量、定性变量等 等。通常用字母D或DUM加以表示(英文中虚拟 或者哑元Dummy的缩写)。 对定性变量的量化可采用虚拟变量的方式实现。
7
Econometrics
二、虚拟变量设置规则
1.“0”和“1”选取原则 2.属性(状态、水平)因素与设置虚拟变量
Y
D 1 , D 0 1 2
D 0 , D 1 1 2
D 0 , D 0 1 2
X
上述图形的前提条件是什么?
27
Econometrics
运用OLS得到回归结果,再用t检验讨论因素
是否对模型有影响。
加法方式引入虚拟变量的一般表达式: 基本分析方法: 条件期望。
Y D D . . . D X u t 0 1 1 t 2 2 t k k t tt
分为四种情形讨论:
(1)解释变量只有一个定性变量而无定量变量, 而且定性变量为两种相互排斥的属性; ( 2 )解释变量分别为一个定性变量(两种属性)
和一个定量解释变量;
18
Econometrics
(3)解释变量分别为一个定性变量(两种以上属 性)和一个定量解释变量; (4)解释变量分别为两个定性变量(各自分别是 两种属性)和一个定量解释变量;
“0”代表基期(比较的基础,参照物);
“1”代表报告期(被比较的效应)。
9
Econometrics
例如,比较收入时考察性别的作用。当研究男性收入是否 高于女性时,是将女性作为比较的基础(参照物),故有 男性为“1”,女性为“0”。
例1
(1)
1 男 D= 0 女
1改 革 开 放 以 后 ( 2 ) D = 0改 革 开 放 以 前
现在要考虑城镇居民和农村居民之间的差异,如何办?
为了对 “城镇居民”、“农村居民”进行区分,分析
各自在住房消费支出 Y i 上的差异,设 D1i = 1 为城镇; D1i = 0 为农村,则模型为 (模型有截距,“居民属性”定性变量只有两个相互排斥 的属性状态( m 2 ),故只设定一个虚拟变量。)
2.当回归模型无截距项时,则可引入 m 个虚拟变 量;否则,就会陷入“虚拟变量陷阱”。(为什 么?)
12
Econometrics
一个例子(虚拟变量陷阱)
研究居民住房消费支出 Y i 和居民可支配收入 X i 之间的 数量关系。回归模型的设定为:Y = + X + u 1 ) i 0 1 i i(
Econometrics
计量经济学 第七章 虚拟变量回归
1
Econometrics
引子:男女大学生消费真有差异吗?
在对在校学生的消费行为进行的调查中,发现在校生的
消费行为呈现多元化的结构。人际交往消费、手机类消费、
衣着类消费、化妆品类消费、电脑类消费、旅游类消费占 有较大的比例;而食品类消费、学习用品类消费不突显。