庞浩计量经济学课件第八章 虚拟变量回归
合集下载
虚拟变量回归课件

虚拟变量回归在各个领域都有广泛的应用,其中包括房价预测和汽车保险费用预估。通过实际案例分析, 我们将展示其在实际问题中的应用。
虚拟变量回归面临的问题
在进行虚拟变量回归时,我们可能会面临多重共线性问题。为了解决这个问 题,我们将介绍哑变量陷阱和特征选 收集数据 2. 对数据进行预处理 3. 分析数据 4. 建立模型 5. 模型的评估与优化
虚拟变量回归
通过介绍虚拟变量回归,我们将探讨其概念、作用以及应用。还将讨论面临 的问题和解决方法,以及如何进行虚拟变量回归并提高模型精度。
什么是虚拟变量回归
虚拟变量回归是一种统计方法,用于处理具有分类特征或非数字特征的数据。 它将非数字变量转换为二元变量,以便在回归模型中使用。
虚拟变量回归的应用
总结
虚拟变量回归具有自身的优点和局限性。我们将总结这些,并探讨未来的发 展方向。最后,我们将分享一些提高模型精度的技巧和建议。
虚拟变量回归面临的问题
在进行虚拟变量回归时,我们可能会面临多重共线性问题。为了解决这个问 题,我们将介绍哑变量陷阱和特征选 收集数据 2. 对数据进行预处理 3. 分析数据 4. 建立模型 5. 模型的评估与优化
虚拟变量回归
通过介绍虚拟变量回归,我们将探讨其概念、作用以及应用。还将讨论面临 的问题和解决方法,以及如何进行虚拟变量回归并提高模型精度。
什么是虚拟变量回归
虚拟变量回归是一种统计方法,用于处理具有分类特征或非数字特征的数据。 它将非数字变量转换为二元变量,以便在回归模型中使用。
虚拟变量回归的应用
总结
虚拟变量回归具有自身的优点和局限性。我们将总结这些,并探讨未来的发 展方向。最后,我们将分享一些提高模型精度的技巧和建议。
庞皓《计量经济学》笔记和课后习题详解(虚拟变量回归)【圣才出品】

考点二:虚拟解释变量的回归 ★★★★
1.用虚拟变量表示不同截距的回归——加法方式 以加法方式将虚拟变量引入模型,只会改变模型在不同情况下的截距,不会影响斜率。 按照变量的种类和数量进行分类,可以分成四种情况,具体如表 8-2 所示。
2 / 27
圣才电子书 十万种考研考证电子书、题库视频学习平台
2.用虚拟变量表示不同斜率的回归——乘法方式 以乘法形式引入虚拟解释变量,会改变模型的截距和斜率。用乘法方式引入虚拟变量的 作用是:①进行两个回归模型的比较,即结构变化检验;②进行因素间的交互影响分析;③ 使模型更加符合现实经济现象。按照不同的作用,可以将乘法方式分成三种,具体如表 8-3 所示。
表 8-3 以乘法方式引入虚拟变量的三种类型
2.虚拟变量的作用及模型的类型 (1)虚拟变量的作用 ①可以作为性别、所有制等属性因素的代表。 ②可以作为受教育程度、管理者素质等非精确计量的数量因素的代表。 ③可以作为战争、灾害、改革前后等偶然因素或政策因素的代表。 ④可以作为时间序列分析中季节(月份)的代表。 ⑤可以实现分段回归,研究斜率、截距的变动,或比较两个回归模型的结构差异等。 (2)虚拟变量模型的类型(见表 8-1)
考点三:虚拟被解释变量 ★★★★
1.线性概率模型(LPM) (1)线性概率模型含义 当被解释变量是虚拟变量,并且模型的函数形式为线性时,即 Yi=β1+β2Xi+ui,该模 型就是线性概率模型。 由于 E(Yi)=0·(1-pi)+1·pi=pi,其中 pi 表示 Yi=1 的概率,所以系数 β2 可解释 为:当其他条件不变时,X 每增加 1 单位,Y=1 的概率增加值。 (2)线性概率模型的估计 ①线性概率模型不能直接用普通最小二乘进行估计,因为存在如下问题: a.随机扰动项 ui 的非正态性。在线性概率模型中,ui 不再服从正态分布,但是对参数 的假设检验和区间估计要求随机扰动项 ui 服从正态分布。当对大样本进行估计时,OLS 估 计量的概率分布将会趋近于正态分布,估计值不会因为非正态性而产生很大的误差。
1.用虚拟变量表示不同截距的回归——加法方式 以加法方式将虚拟变量引入模型,只会改变模型在不同情况下的截距,不会影响斜率。 按照变量的种类和数量进行分类,可以分成四种情况,具体如表 8-2 所示。
2 / 27
圣才电子书 十万种考研考证电子书、题库视频学习平台
2.用虚拟变量表示不同斜率的回归——乘法方式 以乘法形式引入虚拟解释变量,会改变模型的截距和斜率。用乘法方式引入虚拟变量的 作用是:①进行两个回归模型的比较,即结构变化检验;②进行因素间的交互影响分析;③ 使模型更加符合现实经济现象。按照不同的作用,可以将乘法方式分成三种,具体如表 8-3 所示。
表 8-3 以乘法方式引入虚拟变量的三种类型
2.虚拟变量的作用及模型的类型 (1)虚拟变量的作用 ①可以作为性别、所有制等属性因素的代表。 ②可以作为受教育程度、管理者素质等非精确计量的数量因素的代表。 ③可以作为战争、灾害、改革前后等偶然因素或政策因素的代表。 ④可以作为时间序列分析中季节(月份)的代表。 ⑤可以实现分段回归,研究斜率、截距的变动,或比较两个回归模型的结构差异等。 (2)虚拟变量模型的类型(见表 8-1)
考点三:虚拟被解释变量 ★★★★
1.线性概率模型(LPM) (1)线性概率模型含义 当被解释变量是虚拟变量,并且模型的函数形式为线性时,即 Yi=β1+β2Xi+ui,该模 型就是线性概率模型。 由于 E(Yi)=0·(1-pi)+1·pi=pi,其中 pi 表示 Yi=1 的概率,所以系数 β2 可解释 为:当其他条件不变时,X 每增加 1 单位,Y=1 的概率增加值。 (2)线性概率模型的估计 ①线性概率模型不能直接用普通最小二乘进行估计,因为存在如下问题: a.随机扰动项 ui 的非正态性。在线性概率模型中,ui 不再服从正态分布,但是对参数 的假设检验和区间估计要求随机扰动项 ui 服从正态分布。当对大样本进行估计时,OLS 估 计量的概率分布将会趋近于正态分布,估计值不会因为非正态性而产生很大的误差。
8第八章包含虚拟变量的回归

D1=1,大学;=0,其他 D2=1,中学;=0,其他 D3=1,中学以下;=0,其他 回归方程为: Y=b0+b1 X1 +
c1D1 +c2 D2+ c3 D3
引入二个虚拟变量
D1=1,大学;=0,其他 D2=1,中学;=0,其他
Y=b0+b1 X1 +
c1D1 +c2 D2
2、模型中一个定性变量,该变量 具有多种分类,p218
即多分定性变量 假定根据横截面数据,我们做个人旅游支 出Y对其收入X和学历的回归,学历这个定 性变量,可分为:
中学以下、中学、大学三个层次,
如何设置虚拟变量?
我们有如下选择
引入一个虚拟变量D 引入三个虚拟变量
D= 2,大学;=1,中学;=0,中学以下 回归方程为:Y=b0+b1 X1 +b2 D
这里有两个两分定性变量,肤色和种族 可引入两个虚拟变量
例-性别、肤色和工龄、学历(3种类型) 一起解释薪酬
性别、肤色分别引入2个虚拟变量,学历引入2
个虚拟变量
例题
P221 10-18:性别、种族对收入的影响
Y-小时工资,X-教育年限 D2-=1(女性);=0(男性) D3-=1(非白种人且非西班牙裔);=0(其 他) Y^=-0.26-2.36 D2-1.73 D3+0.80X 总结:每个定性变量所需引入的虚拟变量 比该变量类型数少一。 返回
对于方程10-18 ,其样本回归线
Y^=-0.26-2.36 D2-1.73 D3+0.80X,隐含假定
了不同性别下,种族变量对收入的影响是一样 的。同样的,不同种族下,性别变量对收入的 影响也是相同的。
c1D1 +c2 D2+ c3 D3
引入二个虚拟变量
D1=1,大学;=0,其他 D2=1,中学;=0,其他
Y=b0+b1 X1 +
c1D1 +c2 D2
2、模型中一个定性变量,该变量 具有多种分类,p218
即多分定性变量 假定根据横截面数据,我们做个人旅游支 出Y对其收入X和学历的回归,学历这个定 性变量,可分为:
中学以下、中学、大学三个层次,
如何设置虚拟变量?
我们有如下选择
引入一个虚拟变量D 引入三个虚拟变量
D= 2,大学;=1,中学;=0,中学以下 回归方程为:Y=b0+b1 X1 +b2 D
这里有两个两分定性变量,肤色和种族 可引入两个虚拟变量
例-性别、肤色和工龄、学历(3种类型) 一起解释薪酬
性别、肤色分别引入2个虚拟变量,学历引入2
个虚拟变量
例题
P221 10-18:性别、种族对收入的影响
Y-小时工资,X-教育年限 D2-=1(女性);=0(男性) D3-=1(非白种人且非西班牙裔);=0(其 他) Y^=-0.26-2.36 D2-1.73 D3+0.80X 总结:每个定性变量所需引入的虚拟变量 比该变量类型数少一。 返回
对于方程10-18 ,其样本回归线
Y^=-0.26-2.36 D2-1.73 D3+0.80X,隐含假定
了不同性别下,种族变量对收入的影响是一样 的。同样的,不同种族下,性别变量对收入的 影响也是相同的。
计量经济学课件虚拟变量

提高模型精度和预测能力
通过引入虚拟变量,可以更准确地刻画经济现象的非线性特征,从而提高计量经济学模型 的精度和预测能力。
拓展应用领域
虚拟变量的引入使得计量经济学模型能够应用于更多的领域,如金融、环境、社会等,进 一步拓展了计量经济学的应用范围。
未来研究方向和趋势
深入研究虚拟变量的理论 和方法
未来研究将进一步深入探讨虚 拟变量的理论和方法,包括虚 拟变量的选择、设定和估计方 法等,以更准确地刻画经济现 象。
https://
未来研究将积极推动虚拟变量 在交叉学科领域的应用,如环 境经济学、金融经济学等,以 促进不同学科之间的交流和合 作。
WENKU DESIGN
WENKU DESIGN
2023-2026
END
THANKS
感谢观看
KEEP VIEW
WENKU DESIGN
WENKU DESIGN
WENKU
REPORTING
要点二
虚拟变量的设置原则
在设置虚拟变量时,需要遵循完备性 和互斥性的原则。完备性要求虚拟变 量的取值能够覆盖所有可能的情况, 而互斥性则要求不同虚拟变量之间不 能存在重叠或交叉的情况。
要点三
虚拟变量的回归系数 解释
在线性回归模型中,虚拟变量的回归 系数表示该定性因素对因变量的影响 程度。当虚拟变量取值为1时,其对 应的回归系数表示该水平与参照水平 相比对因变量的影响;当虚拟变量取 值为0时,则表示该水平对因变量没 有影响。
参数估计与假设检验
参数估计
采用最小二乘法等估计方法,对引入虚拟变量后的模型进行参数估计,得到各 解释变量的系数估计值。
假设检验
根据研究问题和假设,构建相应的原假设和备择假设,通过t检验、F检验等方 法对参数进行假设检验,判断虚拟变量对模型的影响是否显著。
通过引入虚拟变量,可以更准确地刻画经济现象的非线性特征,从而提高计量经济学模型 的精度和预测能力。
拓展应用领域
虚拟变量的引入使得计量经济学模型能够应用于更多的领域,如金融、环境、社会等,进 一步拓展了计量经济学的应用范围。
未来研究方向和趋势
深入研究虚拟变量的理论 和方法
未来研究将进一步深入探讨虚 拟变量的理论和方法,包括虚 拟变量的选择、设定和估计方 法等,以更准确地刻画经济现 象。
https://
未来研究将积极推动虚拟变量 在交叉学科领域的应用,如环 境经济学、金融经济学等,以 促进不同学科之间的交流和合 作。
WENKU DESIGN
WENKU DESIGN
2023-2026
END
THANKS
感谢观看
KEEP VIEW
WENKU DESIGN
WENKU DESIGN
WENKU
REPORTING
要点二
虚拟变量的设置原则
在设置虚拟变量时,需要遵循完备性 和互斥性的原则。完备性要求虚拟变 量的取值能够覆盖所有可能的情况, 而互斥性则要求不同虚拟变量之间不 能存在重叠或交叉的情况。
要点三
虚拟变量的回归系数 解释
在线性回归模型中,虚拟变量的回归 系数表示该定性因素对因变量的影响 程度。当虚拟变量取值为1时,其对 应的回归系数表示该水平与参照水平 相比对因变量的影响;当虚拟变量取 值为0时,则表示该水平对因变量没 有影响。
参数估计与假设检验
参数估计
采用最小二乘法等估计方法,对引入虚拟变量后的模型进行参数估计,得到各 解释变量的系数估计值。
假设检验
根据研究问题和假设,构建相应的原假设和备择假设,通过t检验、F检验等方 法对参数进行假设检验,判断虚拟变量对模型的影响是否显著。
计量经济学第八章 虚拟变量回归

计量经济学
第八章
虚拟变量回归
1
第八章 虚拟变量回归
本章主要讨论:
●虚拟变量
●虚拟解释变量的回归
2
本章的教学目标
(1)深刻理解定性因素在计量经济分析中的 背景和含义; (2)明确虚拟变量在建立和估计计量经济模 型中的意义和作用; (3)熟练掌握引入和应用虚拟变量的基本思 想和方法; (4)能够运用虚拟变量模型作相应的经济实 证分析方面的应用; (5)掌握Eviews软件中相关内容的操作方法。
这表明三个时期居民储蓄增加额的回归方程在统计 意义上确实是不相同的。1996年以前收入每增加1 亿元,居民储蓄存款的平均增加0.1445亿元;在 2000年以后,则为0.4133亿元,已发生了很大变化。
20
上述模型与城乡居民储蓄存款与国民总收入之间 的散布图是吻合的,与当时中国的实际经济运行 状况也是相符的。 需要指出的是,在上述建模过程中,主要是从教 学的目的出发运用虚拟变量法则,没有考虑通货 膨胀因素。而在实证分析中,储蓄函数还应当考
单位:亿元
城乡居民 人民币储 蓄存款增 额 (YY) 2121.8 2517.8 3444.1 6315.3 8143.5 8858.5
年 份
城乡居民 国民总收 人民币储 蓄存款年 入 (GNI) 底余额 (Y) 3624.1 4038.2 4517.8 4860.3 5301.8 5957.4 210.6 281 399.5 532.7 675.4 892.5
(1,0) 天气阴 如:(D1 ,D2)= (0,1) 天气雨 (0,0) 其 他
29
虚拟变量数量的设置规则
1.若定性因素具有 m 个 (m 2) 相互排斥属性(或 几个水平),当回归模型有截距项时,只能引入
第八章
虚拟变量回归
1
第八章 虚拟变量回归
本章主要讨论:
●虚拟变量
●虚拟解释变量的回归
2
本章的教学目标
(1)深刻理解定性因素在计量经济分析中的 背景和含义; (2)明确虚拟变量在建立和估计计量经济模 型中的意义和作用; (3)熟练掌握引入和应用虚拟变量的基本思 想和方法; (4)能够运用虚拟变量模型作相应的经济实 证分析方面的应用; (5)掌握Eviews软件中相关内容的操作方法。
这表明三个时期居民储蓄增加额的回归方程在统计 意义上确实是不相同的。1996年以前收入每增加1 亿元,居民储蓄存款的平均增加0.1445亿元;在 2000年以后,则为0.4133亿元,已发生了很大变化。
20
上述模型与城乡居民储蓄存款与国民总收入之间 的散布图是吻合的,与当时中国的实际经济运行 状况也是相符的。 需要指出的是,在上述建模过程中,主要是从教 学的目的出发运用虚拟变量法则,没有考虑通货 膨胀因素。而在实证分析中,储蓄函数还应当考
单位:亿元
城乡居民 人民币储 蓄存款增 额 (YY) 2121.8 2517.8 3444.1 6315.3 8143.5 8858.5
年 份
城乡居民 国民总收 人民币储 蓄存款年 入 (GNI) 底余额 (Y) 3624.1 4038.2 4517.8 4860.3 5301.8 5957.4 210.6 281 399.5 532.7 675.4 892.5
(1,0) 天气阴 如:(D1 ,D2)= (0,1) 天气雨 (0,0) 其 他
29
虚拟变量数量的设置规则
1.若定性因素具有 m 个 (m 2) 相互排斥属性(或 几个水平),当回归模型有截距项时,只能引入
计量经济学第八章关于虚拟变量的回归.

年 薪 Y 女教授
类的截距。
2
2:级差截距系数
教龄X
1
0
薪金与性别:估计结果
1,若是男性 Di 0,若是女性
ˆ 17.969 1.371X 3.334D Y i i i se : (0.192) (0.036) (0.155) t : (93.61) (38.45) (21.455) r 2 0.993
一、虚拟变量的性质
例:教授薪金与性别、教龄的关系
男教授平均薪金和女 教授平均薪金水平相 差2,但平均年薪对 教龄的变化率是一样 的
Yi=1+2Di+Xi+I (1) 1,若是男性 D 其中:Yi=教授的薪金, Xi=教龄, Di=性别 0,若是女性 i 女教授平均薪金:E(Yi | X i , Di 0) 1 X i 被赋予0值的 男教授平均薪金:E(Yi | X i , Di 1) (1 2) X i 类别是基底(基 准),1是基底 男教授
比较英国在第二次大战后重建时期和重建后时期的总 储蓄-收入关系是否发生变化。数据如表。 Yt 1 2 Dt 1 X t 2 ( Dt X t ) t
D=1,重建时期
级差截距:区分两 个时期的截距 级差斜率系数:区分 两个时期的斜率 =0,重建后时期
D=1 D=0
E(Yt | Dt 0, X t ) 1 1 X t E(Yt | Dt 1, X t ) (1 2 ) ( 1 2 ) X t
男教授平均薪金水平比 女教授显著高$3.334K (男:21.3,女:17.969)
1,若是女性 Di 0,若是男性
ˆ 21.303 1.371X 3.334D Y i i i se : (0.182) (0.036) (0.155) t : (117.2) (38.45) (21.455)
类的截距。
2
2:级差截距系数
教龄X
1
0
薪金与性别:估计结果
1,若是男性 Di 0,若是女性
ˆ 17.969 1.371X 3.334D Y i i i se : (0.192) (0.036) (0.155) t : (93.61) (38.45) (21.455) r 2 0.993
一、虚拟变量的性质
例:教授薪金与性别、教龄的关系
男教授平均薪金和女 教授平均薪金水平相 差2,但平均年薪对 教龄的变化率是一样 的
Yi=1+2Di+Xi+I (1) 1,若是男性 D 其中:Yi=教授的薪金, Xi=教龄, Di=性别 0,若是女性 i 女教授平均薪金:E(Yi | X i , Di 0) 1 X i 被赋予0值的 男教授平均薪金:E(Yi | X i , Di 1) (1 2) X i 类别是基底(基 准),1是基底 男教授
比较英国在第二次大战后重建时期和重建后时期的总 储蓄-收入关系是否发生变化。数据如表。 Yt 1 2 Dt 1 X t 2 ( Dt X t ) t
D=1,重建时期
级差截距:区分两 个时期的截距 级差斜率系数:区分 两个时期的斜率 =0,重建后时期
D=1 D=0
E(Yt | Dt 0, X t ) 1 1 X t E(Yt | Dt 1, X t ) (1 2 ) ( 1 2 ) X t
男教授平均薪金水平比 女教授显著高$3.334K (男:21.3,女:17.969)
1,若是女性 Di 0,若是男性
ˆ 21.303 1.371X 3.334D Y i i i se : (0.182) (0.036) (0.155) t : (117.2) (38.45) (21.455)
计量经济学庞浩-第三版-课件

4
在实际的经济分析中,这些定性因素有时具有不可忽 视的重要作用。例如,研究居民收入水平时,职业、 性别、文化程度、就业的地域等因素,通常是值得考 虑的影响因素。 因此,在计量经济学的建模中有必要将定量因素和定 性因素同时纳入回归模型之内。
5
本章要研究的主要问题是: 1.如何将作为解释变量的定性因素引入回归模型? 2.这些定性解释变量在回归模型中有何特殊的作用?
(2)解释变量分别为一个定性变量(两种属性) 和一个定量解释变量;
22
(3)解释变量分别为一个定性变量(两种以上属 性)和一个定量解释变量;
(4)解释变量分别为两个定性变量(各自分别是 两种属性)和一个定量解释变量;
思考:
四种加法方式引入虚拟变量会产生什么效应?
23
(1)一个两种属性定性解释变量而 无定量变量的情形
计量经济学
第八章 虚拟变量回归
1
引子:定性因素对房地产价格有显著影响吗
不断走高的房地产价格已经成为人们关注的重点。很 多研究认为,影响商品房价格的因素有多个方面。 有关研究表明1,影响商品房价格的因素可分为两类: 一类是比较容易量化的定量因素。例如:成本费用因 素、房地产供求因素、经济因素、人口因素等。 另一类则是不易量化的定性因素。例如:社会因素、 区域因素、个别因素、房地产投机因素、自然因素等。 这些因素的基本特征则是不易量化的定性因素。
38
(1)结构变化分析
结构变化的实质是检验所设定的模型在样本期内 是否为同一模型。显然,平行回归、共点回归、 不同的回归三个模型均不是同一模型。 平行回归模型的假定是斜率保持不变(加法类型, 包括方差分析); 共点回归模型的假定是截距保持不变(乘法类型, 又被称为协方差分析); 不同的回归的模型的假定是截距、斜率均为变动 的(加法、乘法类型的组合)。
在实际的经济分析中,这些定性因素有时具有不可忽 视的重要作用。例如,研究居民收入水平时,职业、 性别、文化程度、就业的地域等因素,通常是值得考 虑的影响因素。 因此,在计量经济学的建模中有必要将定量因素和定 性因素同时纳入回归模型之内。
5
本章要研究的主要问题是: 1.如何将作为解释变量的定性因素引入回归模型? 2.这些定性解释变量在回归模型中有何特殊的作用?
(2)解释变量分别为一个定性变量(两种属性) 和一个定量解释变量;
22
(3)解释变量分别为一个定性变量(两种以上属 性)和一个定量解释变量;
(4)解释变量分别为两个定性变量(各自分别是 两种属性)和一个定量解释变量;
思考:
四种加法方式引入虚拟变量会产生什么效应?
23
(1)一个两种属性定性解释变量而 无定量变量的情形
计量经济学
第八章 虚拟变量回归
1
引子:定性因素对房地产价格有显著影响吗
不断走高的房地产价格已经成为人们关注的重点。很 多研究认为,影响商品房价格的因素有多个方面。 有关研究表明1,影响商品房价格的因素可分为两类: 一类是比较容易量化的定量因素。例如:成本费用因 素、房地产供求因素、经济因素、人口因素等。 另一类则是不易量化的定性因素。例如:社会因素、 区域因素、个别因素、房地产投机因素、自然因素等。 这些因素的基本特征则是不易量化的定性因素。
38
(1)结构变化分析
结构变化的实质是检验所设定的模型在样本期内 是否为同一模型。显然,平行回归、共点回归、 不同的回归三个模型均不是同一模型。 平行回归模型的假定是斜率保持不变(加法类型, 包括方差分析); 共点回归模型的假定是截距保持不变(乘法类型, 又被称为协方差分析); 不同的回归的模型的假定是截距、斜率均为变动 的(加法、乘法类型的组合)。
庞浩计量经济学课件第八章 虚拟变量回归

二、虚拟变量的设置规则
1.虚拟变量个数的设置规则 若定性因素有m个相互排斥的类型(或属性、水 平),则: 在有截距项的模型中,只能引入m-1个虚拟变 量,否则会陷入“虚拟变量陷阱”(即:出 现完全的多重共线性); 在无截距项的模型中,可以引入m个虚拟变量, 不会导致完全的多重共线性。
4
例如:研究城乡居民的可支配收入对居民住房消费支 出的影响 C Y D u i 1 1 i 2 i i
21
分段线性回归
适合于社会经济现象会在解释变量达到某个临界值时 发生突变,考虑下述模型: Yt 1 1 X t 2 ( X t X * ) Dt ut 0, X t X * Dt * 1, X t X
当X t X *时, Yt 1 1 X t ut 当X t X 时, Yt 1 1 X t 2 ( X t X * ) ut
18
二、用虚拟变量表示不同斜率的回归—— 乘法类型
回归模型的比较——结构变化检验
分段线性回归
19
回归模型的比较——结构变化检验
研究改革开放前后(1950-2004),储蓄与收入的关系: Yi 1 2 Di 1 X i 2 ( Di X i ) ui
( 1950 1977 ) 0, 改革开放前 Di ( 1978 2004 ) 1, 改革开放后
Yi 1 2 Di 1 X i ui
0, 租房户 Di 1, 有房户
15
i 1 2 3 4 5 6 7 8 9 10
Y 1.0 1.3 0.7 0.8 0.5 2.4 0.3 3.2 2.8 0.0
X 20.0 24.0 12.0 16.0 11.0 32.0 10.0 40.0 32.0 7.0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当X t X *时, Yt 1 1 X t ut 当X t X *时, Yt (1 2 X * ) (1 2 ) X t ut
23
说 明
1. 2 的显著性说明了在所设定的解释变量临界水 平X*处是否存在突变。 2.2段线性回归设置1个虚拟变量; k段线性回归设置k-1个虚拟变量。
10
解释变量只有一个分为两种相互排斥类型 的定性变量,而无定量变量的回归
假定文化程度、职业、性别等不变,研究农村居 民与城镇居民的年平均可支配收入是否有差异。
Yi 1 1 Di ui
0, 农村居民 Di 1, 城镇居民
1 表示农村居民的年平均可支配收入;
1 表示城镇居民与农村居民年平均可支配收入的 差异。 城乡居民年均可支配收入之间是否有差距,可通 过的 Di 显著性判断。 11
8
第二节 虚拟解释变量的回归
在计量经济模型中,加入虚拟解释变量,有两种 基本类型:加法类型和乘法类型。 一、用虚拟变量表示不同截距的回归——加法类 型 二、用虚拟变量表示不同斜率的回归——乘法类 型
9
一、用虚拟变量表示不同截距的回归—— 加法类型
解释变量只有一个分为两种相互排斥类型的定性
变量,而无定量变量的回归 解释变量包含一个定量变量和一个分为两种类型 定性变量的回归 解释变量包含一个定量变量和一个两种以上类型 的定性变量的回归 解释变量包含一个定量变量和两个定性变量的回 归
大专及以上:Yi (1 3 ) 1 X i ui
解释变量包含一个定量变量和两个定性变 量的回归
研究城乡居民卷烟需求量受居民可支配收入和性别的 影响: Yi 1 2 D2i 3 D3i 1 X i ui
0, 农村居民 D2i 1, 城镇居民 0, 女性 D3i 1, 男性
Yi 1 2 Di 1 X i ui
0, 租房户 Di 1, 有房户
15
i 1 2 3 4 5 6 7 8 9 10
Y 1.0 1.3 0.7 0.8 0.5 2.4 0.3 3.2 2.8 0.0
X 20.0 24.0 12.0 16.0 11.0 32.0 10.0 40.0 32.0 7.0
第八章
第一节 第二节 第三节 第四节
虚拟变量回归
虚拟变量 虚拟解释变量的回归 虚拟被解释变量 案例分析
1
第一节 虚拟变量
一、虚拟变量的基本概念
二、虚拟变量的设置规则 三、虚拟变量的作用
2
一、虚拟变量的基本概念
定量因素:指那些可直接测度的数值型因素。 定性因素:也称为属性因素,指不能直接测度的,说 明某种属性或状态存在与否的非数值型因素。 虚拟变量:也称为属性变量、双值变量、类型变量、 定性变量、二元型变量等。指人工构造的取值为0和 1的作为属性因素代表的变量,一般用字母D或DUM来 表示。(D=0,表示某种属性或状态不出现或不存在; D=1,表示某种属性或状态出现或存在) 例如:wagei 1 1educi 2 Di ui 0, 表示女性 Di 3 1, 表示男性
21
分段线性回归
适合于社会经济现象会在解释变量达到某个临界值时 发生突变,考虑下述模型: Yt 1 1 X t 2 ( X t X * ) Dt ut 0, X t X * Dt * 1, X t X
当X t X *时, Yt 1 1 X t ut 当X t X 时, Yt 1 1 X t 2 ( X t X * ) ut
二、虚拟变量的设置规则
1.虚拟变量个数的设置规则 若定性因素有m个相互排斥的类型(或属性、水 平),则: 在有截距项的模型中,只能引入m-1个虚拟变 量,否则会陷入“虚拟变量陷阱”(即:出 现完全的多重共线性); 在无截距项的模型中,可以引入m个虚拟变量, 不会导致完全的多重共线性。
4
例如:研究城乡居民的可支配收入对居民住房消费支 出的影响 C Y D u i 1 1 i 2 i i
0, 其他 D2 i 1, 初中 0, 其他 0, 其他 D4i D3 i 1, 大专及以上 1, 高中
Yi 1 1 X i 2 D2i 3 D3i 4 D4i ui
7
三、虚拟变量的作用
虚拟变量可以作为下列因素的代表: 属性因素 非精确计量的数量因素 偶然因素或政策因素 时间序列分析中的季节(或月份)因素 用于分段回归
0, 表示农村居民 Di 1, 表示城镇居民
若引入两个虚拟变量,则:
Ci 1 1Yi 2 D2i 3 D3i ui
0, D2i 1,
其他 城镇居民
0, D3i 1,
其他 农村居民
5
2.虚拟变量0和1的选取原则
虚拟变量取“0”,通常代表基础类型; 虚拟变量取“1”,通常代表与基础类型相比较 的类型。
城镇居民的消费函数: Ci (1 2 ) 1 X i ui
E(Ci | Di 1) (1 2 ) 1 X i
12
解释变量包含一个定量变量和一个两种以 上类型的定性变量的回归
研究居民的年医疗保健费用支出受可支配收入和居民 受教育程度的影响(受教育程度可分为:高中以下、 高中、大专及以上三个级别):
*
( 1 2 X * ) ( 1 2 ) X t ut
22
案 例
某公司为了激励公司的销售人员,按其销售额的 一定比例计提奖励,但是销售额在某一目标水 平X*以下和以上时,计提奖励的比例不同。
Yt 1 1 X t 2 ( X t X * ) Dt ut 0, X t X * Dt * 1 , X X t
解释变量包含一个定量变量和一个分为两 种类型定性变量的回归
研究城乡居民的消费函数: Ci 1 2 Di 1 X i ui
农村居民的消费函数:
Ci 1 1 X i ui
E(Ci | Di 0) 1 1 X i
0, 农村居民 Di 1, 城镇居民
24
3段分段线性回归举例
研究中国的货币流通量,从建国到现在历经了三 个时期: 从建国初期到1960年,增加速度比较快; 从1961年到1978年,由于处于经济困难和文化 革命时期,增加速度明显减缓; 从1978年改革开放往后,进入社会主义市场经 济时期,增加速度明显增加。 试建立中国的货币流通量的趋势模型。
16
4
3
Y
2
1
0 0 10 20 X
17
30
40
50
ˆ 0.3204 0.8273D 0.0675X Y i i i t ( 5.2) (16.9) (11.0) R 2 0.99
ˆ 0.3204 0.0675X 租房户: Y i i
ˆ 0.5069 0.0675X 有房户: Y i i
改革开放前: Yi 1 1 X i ui 改革开放后: Yi (1 2 ) ( 1 2 ) X i ui
20
以乘法方式引入虚拟变量做回归模型比较 的优点
用一个回归替代了多个回归,简化了分析过程;
可以方便地对模型结构的差异做各种假设检验;
合并了的回归增加了自由度,提高了参数估计 的精确性。
农村女性: Yi 1 1 X i ui 农村男性: Yi (1 3 ) 1 X i ui 城镇女性: Yi (1 2 ) 1 X i ui
城镇男性: Yi (1 2 3 ) 1 X i ui
14
案例
随机调查美国旧金山地区20个家庭的储蓄情况, 拟建立年储蓄额对年收入的回归模型,通过样 本的散点图发现,这20个家庭中,有房户和租 房户的储蓄额有较明显的区别,故在模型中加 入一个定性变量,以区别有房户和租房户。
例如:研究政府某项经济政策的施行与否对被解 释变量的影响
( 该项经济政策未施行 ) 0, 基 础 类 型 Di ( 该项经济政策施行了 ) 1, 比 较 类 型
6
练 习
将定性因素“学历”(分为:大专及以上、高中、 初中、小学及以下)作为解释变量引入下面的 模型中。 Yi 1 1 X i ui
25ቤተ መጻሕፍቲ ባይዱ
本章小结
虚拟变量的概念 虚拟变量的设置规则 加法类型引入虚拟变量 乘法类型引入虚拟变量
26
D 0 0 0 0 0 1 0 1 1 0
i 11 12 13 14 15 16 17 18 19 20
Y 0.3 0.0 1.0 2.0 0.4 0.7 1.5 1.6 0.6 0.6
X 9.0 6.0 18.0 20.0 12.0 14.0 15.0 16.0 15.0 14.0
D 0 0 0 1 0 0 1 1 0 0
Yi 1 2 D2i 3 D3i 1 X i ui
0, 其他 D2 i 1, 高中
0, 其他 D3i 1, 大专及以上
高中以下: Yi 1 1 X i ui 高中:
Yi (1 2 ) 1 X i ui
13
18
二、用虚拟变量表示不同斜率的回归—— 乘法类型
回归模型的比较——结构变化检验
分段线性回归
19
回归模型的比较——结构变化检验
研究改革开放前后(1950-2004),储蓄与收入的关系: Yi 1 2 Di 1 X i 2 ( Di X i ) ui
( 1950 1977 ) 0, 改革开放前 Di ( 1978 2004 ) 1, 改革开放后