第7章 虚拟变量回归模型-案例 虚拟变量回归模型ppt汇总 计量经济学
合集下载
虚拟变量回归课件

虚拟变量回归在各个领域都有广泛的应用,其中包括房价预测和汽车保险费用预估。通过实际案例分析, 我们将展示其在实际问题中的应用。
虚拟变量回归面临的问题
在进行虚拟变量回归时,我们可能会面临多重共线性问题。为了解决这个问 题,我们将介绍哑变量陷阱和特征选 收集数据 2. 对数据进行预处理 3. 分析数据 4. 建立模型 5. 模型的评估与优化
虚拟变量回归
通过介绍虚拟变量回归,我们将探讨其概念、作用以及应用。还将讨论面临 的问题和解决方法,以及如何进行虚拟变量回归并提高模型精度。
什么是虚拟变量回归
虚拟变量回归是一种统计方法,用于处理具有分类特征或非数字特征的数据。 它将非数字变量转换为二元变量,以便在回归模型中使用。
虚拟变量回归的应用
总结
虚拟变量回归具有自身的优点和局限性。我们将总结这些,并探讨未来的发 展方向。最后,我们将分享一些提高模型精度的技巧和建议。
虚拟变量回归面临的问题
在进行虚拟变量回归时,我们可能会面临多重共线性问题。为了解决这个问 题,我们将介绍哑变量陷阱和特征选 收集数据 2. 对数据进行预处理 3. 分析数据 4. 建立模型 5. 模型的评估与优化
虚拟变量回归
通过介绍虚拟变量回归,我们将探讨其概念、作用以及应用。还将讨论面临 的问题和解决方法,以及如何进行虚拟变量回归并提高模型精度。
什么是虚拟变量回归
虚拟变量回归是一种统计方法,用于处理具有分类特征或非数字特征的数据。 它将非数字变量转换为二元变量,以便在回归模型中使用。
虚拟变量回归的应用
总结
虚拟变量回归具有自身的优点和局限性。我们将总结这些,并探讨未来的发 展方向。最后,我们将分享一些提高模型精度的技巧和建议。
第七章 虚拟变量 虚拟变量回归模型ppt汇总 计量经济学

第七章 虚拟变量
• 在回归分析中,被解释变量的影响因素 除了量(或定量)的因素还有质(或定 性)的因素,这些质的因素可能 会使回 归模型中的参数发生变化,为了估计质 的因素产生的影响,在模型中就需要引 入一种特殊的变量—虚拟变量。
2020/6/16
(二)作用
• 1、可以描述和测量定性(或属性)因素 的影响;
2、多个因素各两种属性
• 如果有m个定性因素,且每个因素各有两个不同的 属性类型,则引入m个虚拟变量。
• 例2
• 研究居民住房消费函数时,考虑到城乡差异和不同 收入层次的影响将消费函数设定为:
Yt=b0+b1Xt+a1D1t+ a2D2t+ μt
Yt=居民住房消费支出
Xt=居民可支配收入
1城镇居民
2020/6/16
虚拟变量对截距的影响
y
有适龄子女
b0
o
图1 虚拟变量对截距的影响
x
2020/6/16
2、乘法方式引入虚拟变量
• 基本思想:以乘法方式引入虚拟解释变量
,是在所设定的计量经济模型中,将虚拟 解释变量与其他解释变量相乘作为新 的解释变量,以达到其调整模型斜率的
目的。 • 该方式引入虚拟变量主要作用:
D=
0 无适龄子女
将家庭教育费用支出函数写成:Yt=b0+b1Xt+aDt+μt 即以加法形式引入虚拟变量。
2020/6/16
子女年龄结构不同的家庭教育 费用支出函数为:
• 无适龄子女家庭的教育费用支出函数(D=0 ):Yt=b0+b1Xt+μt
• 有适龄子女家庭的教育费用支出函数(D=1 ):Yt=(b0+a)+b1Xt+μt
• 在回归分析中,被解释变量的影响因素 除了量(或定量)的因素还有质(或定 性)的因素,这些质的因素可能 会使回 归模型中的参数发生变化,为了估计质 的因素产生的影响,在模型中就需要引 入一种特殊的变量—虚拟变量。
2020/6/16
(二)作用
• 1、可以描述和测量定性(或属性)因素 的影响;
2、多个因素各两种属性
• 如果有m个定性因素,且每个因素各有两个不同的 属性类型,则引入m个虚拟变量。
• 例2
• 研究居民住房消费函数时,考虑到城乡差异和不同 收入层次的影响将消费函数设定为:
Yt=b0+b1Xt+a1D1t+ a2D2t+ μt
Yt=居民住房消费支出
Xt=居民可支配收入
1城镇居民
2020/6/16
虚拟变量对截距的影响
y
有适龄子女
b0
o
图1 虚拟变量对截距的影响
x
2020/6/16
2、乘法方式引入虚拟变量
• 基本思想:以乘法方式引入虚拟解释变量
,是在所设定的计量经济模型中,将虚拟 解释变量与其他解释变量相乘作为新 的解释变量,以达到其调整模型斜率的
目的。 • 该方式引入虚拟变量主要作用:
D=
0 无适龄子女
将家庭教育费用支出函数写成:Yt=b0+b1Xt+aDt+μt 即以加法形式引入虚拟变量。
2020/6/16
子女年龄结构不同的家庭教育 费用支出函数为:
• 无适龄子女家庭的教育费用支出函数(D=0 ):Yt=b0+b1Xt+μt
• 有适龄子女家庭的教育费用支出函数(D=1 ):Yt=(b0+a)+b1Xt+μt
计量经济学-虚拟变量回归共71页文档

文 家 。汉 族 ,东 晋 浔阳 柴桑 人 (今 江西 九江 ) 。曾 做过 几 年小 官, 后辞 官 回家 ,从 此 隐居 ,田 园生 活 是陶 渊明 诗 的主 要题 材, 相 关作 品有 《饮 酒 》 、 《 归柳先 生 传 》 、 《 归 去来 兮 辞 》 等 。
计量经济学-虚拟变量回归
6
、
露
凝
无
游
氛
,
天
高
风
景
澈
。
7、翩翩新 来燕,双双入我庐 ,先巢故尚在,相 将还旧居。
8
、
吁
嗟
身
后
名
,
于
我
若
浮
烟
。
9、 陶渊 明( 约 365年 —427年 ),字 元亮, (又 一说名 潜,字 渊明 )号五 柳先生 ,私 谥“靖 节”, 东晋 末期南 朝宋初 期诗 人、文 学家、 辞赋 家、散
1
0
、
倚
南
窗
以
寄
傲
,
审
容
膝
之
易
安
。
66、节制使快乐增加并使享受加强。 ——德 谟克利 特 67、今天应做的事没有做,明天再早也 是耽误 了。——裴斯 泰洛齐 68、决定一个人的一生,以及整个命运 的,只 是一瞬 之间。 ——歌 德 69、懒人无法享受休息之乐。——拉布 克 70、浪费时间是一桩大罪过。——卢梭
计量经济学-虚拟变量回归
6
、
露
凝
无
游
氛
,
天
高
风
景
澈
。
7、翩翩新 来燕,双双入我庐 ,先巢故尚在,相 将还旧居。
8
、
吁
嗟
身
后
名
,
于
我
若
浮
烟
。
9、 陶渊 明( 约 365年 —427年 ),字 元亮, (又 一说名 潜,字 渊明 )号五 柳先生 ,私 谥“靖 节”, 东晋 末期南 朝宋初 期诗 人、文 学家、 辞赋 家、散
1
0
、
倚
南
窗
以
寄
傲
,
审
容
膝
之
易
安
。
66、节制使快乐增加并使享受加强。 ——德 谟克利 特 67、今天应做的事没有做,明天再早也 是耽误 了。——裴斯 泰洛齐 68、决定一个人的一生,以及整个命运 的,只 是一瞬 之间。 ——歌 德 69、懒人无法享受休息之乐。——拉布 克 70、浪费时间是一桩大罪过。——卢梭
计量经济学课件虚拟变量

提高模型精度和预测能力
通过引入虚拟变量,可以更准确地刻画经济现象的非线性特征,从而提高计量经济学模型 的精度和预测能力。
拓展应用领域
虚拟变量的引入使得计量经济学模型能够应用于更多的领域,如金融、环境、社会等,进 一步拓展了计量经济学的应用范围。
未来研究方向和趋势
深入研究虚拟变量的理论 和方法
未来研究将进一步深入探讨虚 拟变量的理论和方法,包括虚 拟变量的选择、设定和估计方 法等,以更准确地刻画经济现 象。
https://
未来研究将积极推动虚拟变量 在交叉学科领域的应用,如环 境经济学、金融经济学等,以 促进不同学科之间的交流和合 作。
WENKU DESIGN
WENKU DESIGN
2023-2026
END
THANKS
感谢观看
KEEP VIEW
WENKU DESIGN
WENKU DESIGN
WENKU
REPORTING
要点二
虚拟变量的设置原则
在设置虚拟变量时,需要遵循完备性 和互斥性的原则。完备性要求虚拟变 量的取值能够覆盖所有可能的情况, 而互斥性则要求不同虚拟变量之间不 能存在重叠或交叉的情况。
要点三
虚拟变量的回归系数 解释
在线性回归模型中,虚拟变量的回归 系数表示该定性因素对因变量的影响 程度。当虚拟变量取值为1时,其对 应的回归系数表示该水平与参照水平 相比对因变量的影响;当虚拟变量取 值为0时,则表示该水平对因变量没 有影响。
参数估计与假设检验
参数估计
采用最小二乘法等估计方法,对引入虚拟变量后的模型进行参数估计,得到各 解释变量的系数估计值。
假设检验
根据研究问题和假设,构建相应的原假设和备择假设,通过t检验、F检验等方 法对参数进行假设检验,判断虚拟变量对模型的影响是否显著。
通过引入虚拟变量,可以更准确地刻画经济现象的非线性特征,从而提高计量经济学模型 的精度和预测能力。
拓展应用领域
虚拟变量的引入使得计量经济学模型能够应用于更多的领域,如金融、环境、社会等,进 一步拓展了计量经济学的应用范围。
未来研究方向和趋势
深入研究虚拟变量的理论 和方法
未来研究将进一步深入探讨虚 拟变量的理论和方法,包括虚 拟变量的选择、设定和估计方 法等,以更准确地刻画经济现 象。
https://
未来研究将积极推动虚拟变量 在交叉学科领域的应用,如环 境经济学、金融经济学等,以 促进不同学科之间的交流和合 作。
WENKU DESIGN
WENKU DESIGN
2023-2026
END
THANKS
感谢观看
KEEP VIEW
WENKU DESIGN
WENKU DESIGN
WENKU
REPORTING
要点二
虚拟变量的设置原则
在设置虚拟变量时,需要遵循完备性 和互斥性的原则。完备性要求虚拟变 量的取值能够覆盖所有可能的情况, 而互斥性则要求不同虚拟变量之间不 能存在重叠或交叉的情况。
要点三
虚拟变量的回归系数 解释
在线性回归模型中,虚拟变量的回归 系数表示该定性因素对因变量的影响 程度。当虚拟变量取值为1时,其对 应的回归系数表示该水平与参照水平 相比对因变量的影响;当虚拟变量取 值为0时,则表示该水平对因变量没 有影响。
参数估计与假设检验
参数估计
采用最小二乘法等估计方法,对引入虚拟变量后的模型进行参数估计,得到各 解释变量的系数估计值。
假设检验
根据研究问题和假设,构建相应的原假设和备择假设,通过t检验、F检验等方 法对参数进行假设检验,判断虚拟变量对模型的影响是否显著。
计量经济第七章虚拟变量模型课件

log
P2i P1i
21
21 X i ;
log
P3i P1i
31
31 X i ;
log
P3i P2i
32
32 X i .
其中 P1i、P2i、P3i 分别表示第 个决策者做出 第1、2、3个选择的概率。
23
Yi 0 1D1i ui ,
i 1,2, ,n.
其中 Yi
为个人月支出,
D1i
=
1,已婚 0,未婚
6
• 未婚者的月期望支出为:
E Yi | D1i 0 E 0 1 0 ui 0
• 已婚者的月期望支出为:
E Yi | D1i 1 E 0 1 1 ui 0 1
0 :未婚者的月平均支出 1 :未婚者与已婚者的月平均支出差距 0 1 :已婚者的月平均支出
Zi
f
1
Pi
ln
1
Pi Pi
ln
Pi 1 Pi
0
1
X1i
+
+k X ki
17
二、二元Logit模型估计
• 1.可重复观测数据的二元Logit模型 参数估计
• P144 【相关链接】
• 2.不可重复观测数据的二元Logit模 型参数估计
• P145 【相关链接】
18
三、模型检验与拟合优度
定义:以虚拟变量为因变量的线性回 归模型称为线性概率模型。
(linear probability model,LPM) 模型的基本形式为:
Yi 0 1X1i +2 X2i k Xki ui ,
E Yi | X 0 1X1i +2 X2i k Xki ,
i 1,2, ,n.
虚拟变量回归模型课件

Dongbei University Of Finance & Economics
第二节 虚拟解释变量---加法模型和乘法模型
虚拟解释变量进入模型的基本形式:
Yi 1 2 X i i Yi 1 2 X i Di i
Yi 1 2 X i Di X i i
乘法模型的实质:
1、 Di 的引入按照是否城镇家庭这一特征将样本分为了不同群体,但与加法模型的区别在 于,此时的差异通过截距(自发消费)和斜率(边际消费倾向)同时体现。 2 + 2 2、城镇家庭与农村家庭样本的回归线差异: 消费
1 +1 1
2
收入
3、若例3采用了如例2的模型,则忽略了城镇家庭与农村家庭的哪一种差异? 4、在现实问题中,依据何种规则在加法、乘法和即加且乘模型中进行选择?
乘法模型的实质:
1、 Di 的引入依然按照是否户籍人口家庭这一特征将样本分为了不同群体,分别对其进行 了回归参数的估计。与加法模型的区别在于,此时的差异通过数量型变量收入而体现。 2、户籍家庭与流动人口家庭样本的回归线差异: 消费
2 +
2
1
收入
3、依据传统认识,流动人口家庭由于相关社会保障匮乏,因而具有较高的储蓄倾向,这一 事实通过什么来判断?
加法模型的实质:
1、 Di 的引入实质是按照是否高管这一特征将样本分为了不同群体,分别对其进行了回归 参数的估计。此时的差异体现在模型截距上。 ---那这与把样本分成两组,分别进行参数估计有何区别? 2、高管与非高管样本的回归线差异:
工资
1 1
3、不同岗位等级间是否存在显著的工资差异根据什么判断?
四、 虚拟变量应用模式比较
Dongbei University Of Finance & Economics
第二节 虚拟解释变量---加法模型和乘法模型
虚拟解释变量进入模型的基本形式:
Yi 1 2 X i i Yi 1 2 X i Di i
Yi 1 2 X i Di X i i
乘法模型的实质:
1、 Di 的引入按照是否城镇家庭这一特征将样本分为了不同群体,但与加法模型的区别在 于,此时的差异通过截距(自发消费)和斜率(边际消费倾向)同时体现。 2 + 2 2、城镇家庭与农村家庭样本的回归线差异: 消费
1 +1 1
2
收入
3、若例3采用了如例2的模型,则忽略了城镇家庭与农村家庭的哪一种差异? 4、在现实问题中,依据何种规则在加法、乘法和即加且乘模型中进行选择?
乘法模型的实质:
1、 Di 的引入依然按照是否户籍人口家庭这一特征将样本分为了不同群体,分别对其进行 了回归参数的估计。与加法模型的区别在于,此时的差异通过数量型变量收入而体现。 2、户籍家庭与流动人口家庭样本的回归线差异: 消费
2 +
2
1
收入
3、依据传统认识,流动人口家庭由于相关社会保障匮乏,因而具有较高的储蓄倾向,这一 事实通过什么来判断?
加法模型的实质:
1、 Di 的引入实质是按照是否高管这一特征将样本分为了不同群体,分别对其进行了回归 参数的估计。此时的差异体现在模型截距上。 ---那这与把样本分成两组,分别进行参数估计有何区别? 2、高管与非高管样本的回归线差异:
工资
1 1
3、不同岗位等级间是否存在显著的工资差异根据什么判断?
四、 虚拟变量应用模式比较
Dongbei University Of Finance & Economics
计量经济学——虚拟解释变量模型PPT课件

编辑版pppt
8
以一个最简单的虚拟变量模型为例,如 果只包含一个质的因素,而且这个因素 仅有两个特征,则回归模型中只需引入 一个虚拟变量。如果是含有多个质的因 素, 自然要引入多个虚拟变量。
编辑版pppt
9Байду номын сангаас
如果只有一个质的因素,且具有m个特 征,那么如果是含有截距项的,就要引入 m-1个虚拟变量;不含有截距项的, 应该 引入m个虚拟变量,这就是虚拟变量的设 定原则。
编辑版pppt
10
一 、截距变动模型和斜率变动模型
(一)包含一个虚拟变量的截距变动模型 首先从最简单的例子入手,假设只有一
个定性因素影响被解释变量的变化,而且这 个因素仅有两种特征,这时候只需要引入一 个虚拟变量。
编辑版pppt
11
【例8.1】假设有一个包括正常年份和
非正常年份(亚洲金融危机或SARS的影
17
D 0时 正常E 年 ( Y ) i 份 02 X i D 1时 非正E 常 ( Y I) 年 01份 2 X i
如果我们绘制图形,得到的结果仍然
是一样的。此时,β1<0,非正常年份的
线低于正常年份的线,代表非正常年份的 消费水平低于正常年份的消费水平。
编辑版pppt
18
2.虚拟变量D=0所代表的特性或
编辑版pppt
6
需要指出的是,虚拟变量主要是用来 代表质的因素,但是有些情况下也可以 用来代表数量因素。例如在建立储蓄函 数时,“收入”显然是一个重要解释变 量,虽然是“数量”因素,但是为了方 便也可以用虚拟变量表示。
编辑版pppt
7
第二节 虚拟解释变量的设定
虚拟解释变量模型的设定因为质的 因素的多少和这些因素特征的多少而引 入的虚拟变量也会不同。
虚拟变量回归模型课件.ppt

第7章 单方程回归模型的几个专门问题
7.1 虚拟变量
7.1.1 虚拟变量的概念及作用
1.虚拟变量的内涵 在计量经济学中,我们把反映定性(或属性)因素变化,取值为0和1的人工变量称为 虚拟变量(Dummy Variable),或称为哑变量、虚设变量、属性变量、双值变量、类型变量、 定性变量、二元型变量、名义变量等,习惯上用字母D表示。例如
第2页,共32页。
虚拟变量
为什么要引入“虚拟变量” ?? 许多经济变量是可以定量度量的或者说是可以直接观测的
如商品需求量、价格、收入、产量等
但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测
如职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节 对某些产品(如冷饮)销售的影响等。
第3页,共32页。
第29页,共32页。
临界指标的虚拟变量的引入
在经济发生转折时期,可通过建立临界指 标的虚拟变量模型来反映。
第30页,共32页。
第31页,共32页。
当截距与斜率发生变化时,则需要同时引入加法与乘 法形式的虚拟变量。
OLS法得到该模型的回归方程为
则两时期进口消费品函数分别为:
当t<t*=1978年, Dt = 0
•女职工本科以上学历的平均薪金: E(Yt | Xt , D1 = 0, D2 = 1) = (b 0 + b3 ) + b1 Xt
•男职工本科以上学历的平均薪金:
E(Yt | Xt , D1 = 1, D2 = 1) = (b0 + b 2 + b3 ) + b1 Xt
第23页,共32页。
2、乘法方式
第8页,共32页。
这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些
7.1 虚拟变量
7.1.1 虚拟变量的概念及作用
1.虚拟变量的内涵 在计量经济学中,我们把反映定性(或属性)因素变化,取值为0和1的人工变量称为 虚拟变量(Dummy Variable),或称为哑变量、虚设变量、属性变量、双值变量、类型变量、 定性变量、二元型变量、名义变量等,习惯上用字母D表示。例如
第2页,共32页。
虚拟变量
为什么要引入“虚拟变量” ?? 许多经济变量是可以定量度量的或者说是可以直接观测的
如商品需求量、价格、收入、产量等
但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测
如职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节 对某些产品(如冷饮)销售的影响等。
第3页,共32页。
第29页,共32页。
临界指标的虚拟变量的引入
在经济发生转折时期,可通过建立临界指 标的虚拟变量模型来反映。
第30页,共32页。
第31页,共32页。
当截距与斜率发生变化时,则需要同时引入加法与乘 法形式的虚拟变量。
OLS法得到该模型的回归方程为
则两时期进口消费品函数分别为:
当t<t*=1978年, Dt = 0
•女职工本科以上学历的平均薪金: E(Yt | Xt , D1 = 0, D2 = 1) = (b 0 + b3 ) + b1 Xt
•男职工本科以上学历的平均薪金:
E(Yt | Xt , D1 = 1, D2 = 1) = (b0 + b 2 + b3 ) + b1 Xt
第23页,共32页。
2、乘法方式
第8页,共32页。
这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3)一般方式
实际应用中,一般是直接以加法和乘法方式引入虚
拟变量,然后再利用t检验判断其系数是否显著的不
等于零,进而确定虚拟变量的具体引入方式。 我们还可以用加法模型与乘法模型相结合的方式建 立模型来拟合经济发展出现转折的情况。
例7.1.9 进口商品消费支出y主要取决于国民 生产总值x的多少。我国改革开放前后,由于国家政 策的变化,及改革开放后外资的大量引入等因素的 影响,1978年前后,y和x
收 入
还可将多个虚拟变量引入模型中以考察多种“定 性”因素的影响。
如在上述职工薪金的例中,再引入代表学历的 虚拟变量D2:
1 本科及以上学历
D2
=
0
本科以下学历
职工薪金的回归模型可设计为:
Yt = b 0 + b1 Xt + b 2 D1 + b 3 D2 + mt
于是,不同性别、不同学历职工的平均薪 金分别为:
加法方式引入虚拟变量,考察:截距的不同, 许多情况下:往往是斜率就有变化,或斜率、截距同时发
生变化。 斜率的变化可通过以乘法的方式引入虚拟变量来测度。
例:根据消费理论,消费水平C主要取决于收入水平Y,但在 一个较长的时期,人们的消费倾向会发生变化,尤其是在自然 灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾 向的变化可通过在收入的系数中引入虚拟变量来考察。
• 比较类型,否定类型取值为0。
概念:
同时含有一般解释变量与虚拟变量的模型称为 虚拟变量模型或者方差分析(analysis-of variance: ANOVA)模型。
一个以性别为虚拟变量考察企业职工薪金的模型:
Yt = b 0 + b1 Xt + b 2 Dt + mt
其中:Yt为企业职工的薪金,Xt为工龄, Dt=1,若是男性,Dt=0,若是女性。
§7.2 虚拟变量的引入
1、加法方式
所设定的计量经济模型中加入适当的虚拟变量,此时虚 拟变量与其他解释变量在设定模型中是相加关系。其作 用是改变了设定模型的截距水平。
企业职工薪金模型中性别虚拟变量的引y
=年薪,x
=工作年限,D
=
一般地,在虚拟变量的设置中, 基础类型和肯定类型取值为1; 比较类型和否定类型取值为0。
例如:
1)表示性别的虚拟变量可取为
1 男性 D1= 0 女性
2)表示文化程度的虚拟变量可取为
1 本科及以上学历
D2=
0 本科以下学历
3)表示地区的虚拟变量可取为
D3=
1 城市 0 农村
4)表示消费心理的虚拟变量可取为 1 喜欢某种商品
1 高中 1 大学及其
D 1= 0 其他 D 2= 0
其他
模型可设定如下:
Yt = b 0 + b1 Xt + b 2 D1 + b3 D2 + mt
在E(mt)=0 的初始假定下,高中以下、高中、大学 及其以上教育水平下个人保健支出的函数:
高中以下: E(Yt | Xt , D1 = 0, D2 = 0) = b0 + b1 Xt
这里,虚拟变量D以与X相乘的方式引入了模型中,从而 可用来考察消费倾向的变化。
假定E(mt)= 0,上述模型所表示的函数可化为:
正常年份:
bbb E ( C t|X t,D t= 1 ) = 0 + (1 + 2 ) X t
反常年份:
bb E ( C t|X t,D t= 0 )=0 + 1 X t
•女职工本科以下学历的平均薪金:
E(Yt | Xt , D1 = 0, D2 = 0) = b 0 + b1 Xt
•男职工本科以下学历的平均薪金:
E(Yt | Xt , D1 = 1, D2 = 0) = (b0 + b 2 ) + b1 Xt
•女职工本科以上学历的平均薪金: E(Yt | Xt , D1 = 0, D2 = 1) = (b 0 + b3 ) + b1 Xt
这意味着,男女职工平均薪金对工龄的变化率
是一样的,但两者的平均薪金水平相差 a。
可以通过传统的回归检验,对 a 的统计显著性进行检验,
以判断男女职工的平均薪金水平是否显著差异。
例7.1.4 居民家庭的教育费用支出除了受收入水平的影 响之外,还与子女的年龄结构密切相关。如果家庭中 有适龄子女(6-21岁),教育费用支出就多。因此,为了 反映“子女年龄结构”这一定性因素,设置虚拟变量:
例如,进口消费品数量Y主要取决于国民收入 X的多少,中国在改革开放前后,Y对X的回归关 系明显不同。
这时,可以t*=1978年为转折期,以1978年 的国民收入Xt*为临界值,设如下虚拟变量:
1
Dt
=
0
t t* t t*
则进口消费品的回归模型可建立如下:
y t= b 0 + b 1 x t+ a x t x t D t+ u t
•男职工本科以上学历的平均薪金:
E(Yt | Xt , D1 = 1, D2 = 1) = (b0 + b 2 + b3 ) + b1 Xt
2、乘法方式
在所设定的计量经济模型中,将虚拟解释变量与其他解释变 量相乘作为新的解释变量出现在模型中,以达到其调整设定 模型斜率系数的目的。
乘法形式引入虚拟解释变量的主要作用:①两个回归模型之间的比较; ②因素之间的交互影响分析;③提高模型对现实经济现象的描述精度。
(2)乘法类型
例7.1.6 随着收入水平的提高,家庭教育费用支出的边际消费倾向 可能会发生变化。为了反映定性因素对斜率的影响,可以用乘法方式 引入虚拟变量,将家庭教育费用支出函数取成:
图7.1.2 虚拟变量对斜率的影响
如,设
1 正常年份
Dt
=
0
反常年份
消费模型可建立如下:
bb b m C t=0 + 1 X t+2 D tX t+t
虚拟变量模型
同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型。
在模型中,虚拟变量可作为解释变量,也可作为被解释变量,但主要 是用作解释变量。
例如:一个以性别为虚拟变量来考察职工薪金的模型如下:
b b b m Y i=0+1X i+2D i+i
(7-1)
其中
Y i ——为职工的薪金;
D i =1 ——代表男性
年 薪 Y
b0+a b0
男 职 工 女 职 工
工 龄 X
7.2.虚拟变量的引入
虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。
1. 加法方式
yt=b 0+b 1xt+atD +u t,D
=
1 0
男性 女性
上述职工薪金模型(7-1)中性别虚拟变量的引入就采取了加法方式,
在该模型中,如仍假定 Eut =0 ,则:
第7章 虚拟变量回归模型
§7.1 虚拟变量的基本含义 §7.2 虚拟变量的引入 §7.3 案例分析
为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将 它们人为地“量化”,这种“量化”通常是通过引入“虚拟变量”来完成的。
这种用两个相异数字来表示对被解释变量有重要影响而自身又 没有观测数值的一类变量,称为虚拟变量(dummy variables)。
高中:
E(Yt | Xt , D1 = 1, D2 = 0) = (b 0 + b 2 ) + b1 Xt
大学及其以上: E(Yt | Xt , D1 = 0, D2 = 1) = (b0 + b3 ) + b1 Xt
假定b3>b2,其几何意义:
保 健 支 出
β3
β2
β0
大 学 教 育 高 中 教 育 低 于 中 学 教 育
当tt*=1978年, Dt =1
ˆ y t= b ˆ 0 a ˆx t + b ˆ 1 + a ˆx t
§7.3 案例
scalar demvotes = 0.484-0.0324*1+0.0564*1+0.0097*1*30.0083*1*3.019=0.51024
一个特殊的定性因素)。例如:
§7.1 虚拟变量的基本含义
许多经济变量是可以定量度量的,如:商品需求量、价格、 收入、产量等,
但也有一些影响经济变量的因素无法定量度量,如:职业、 性别对收入的影响,战争、自然灾害对GDP的影响,季节 对某些产品(如冷饮)销售的影响等等。
为了在模型中能够反映这些因素的影响,并提高模型的精 度,需要将它们“量化”。
临界指标的虚拟变量的引入
在经济发生转折时期,可通过建立临界 指标的虚拟变量模型来反映。
当截距与斜率发生变化时,则需要同时引入加 法与乘法形式的虚拟变量。
OLS法得到该模型的回归方程为
则两时期进口消费品函数分别为:
当t<t*=1978年, Dt = 0
ˆ y t= b ˆ 0+ b ˆ 1 x t+ a ˆx t x t D t
为什么下面这样的写法?
女职工的平均薪金为:
E y tx t,D t= 0= b 0+ b 1 x t
男职工的平均薪金为:
E y tx t,D t= 1 = b 0 + a + b 1 x t
从几何意义上看(图7-1),
a
图7-1 男女职工平均薪金示意图
假定 a0 ,
则两个函数有相同的斜率,但有不同的截距。
这种“量化”通常是通过引入“虚拟变量”来完成的。 根据这些因素的属性类型,构造只取“0”或“1”的人工 变量,通常称为虚拟变量(dummy variables),记为D。