计量经济学(回归模型的扩展 虚拟变量部分)

合集下载

计量经济学导论:ch07 多元回归分析:虚拟变量

计量经济学导论:ch07 多元回归分析:虚拟变量
MBR b0 d1CR1 d2CR2 d3CR3 d4CR4 其他因素
d j系数含义可解释为:保持其他因素不变,信用等级为j
级的城市和信用等级为零级的城市之间在MBR上的差异。 其中,j 1, 2,3, 4。
问题:两种估计方法中,哪种方法更优?
16
例7.7 相貌吸引力对工资的影响
在劳动力市场中,除了存在性别歧视之外,还 可能存在相貌、身高等歧视。如果将样本相貌 分为三类:一般水平、低于一般水平、高于一 般水平,并以一般水平组作为基组,分别对男 人、女人估计方程得:
y = b0 + d0d + b1x + u
This can be interpreted as an intercept shift
If d = 0, then y = b0 + b1x + u If d = 1, then y = (b0 + d0) + b1x + u
The case of d = 0 is the base/benchmark group
虚拟变量与非虚拟变量之间也有交互作用,使 得出现不同的斜率。
female 0,男性组截距是b0,受教育的斜率是b1; female 1,女性组的截距是b0 d0,受教育的斜率是b1 d1。
24
25
我们关心的两个假设: ➢ 男性和女性受教育的回报是相同的。
H0:d1 0
➢ 受教育水平相同的男性和女性的平均工资相同。
将式7.13中的调整R 平方与把排名作为一个单独变量得到
的调整R 平方比较,前者是0.905,后者是0.836。所以,式
7.13 增加了回归的灵活性。 另外,式 7.13中所有其他变量都变得不显著了,联合显著性

第七章 虚拟变量 虚拟变量回归模型ppt汇总 计量经济学

第七章 虚拟变量 虚拟变量回归模型ppt汇总 计量经济学
第七章 虚拟变量
• 在回归分析中,被解释变量的影响因素 除了量(或定量)的因素还有质(或定 性)的因素,这些质的因素可能 会使回 归模型中的参数发生变化,为了估计质 的因素产生的影响,在模型中就需要引 入一种特殊的变量—虚拟变量。
2020/6/16
(二)作用
• 1、可以描述和测量定性(或属性)因素 的影响;
2、多个因素各两种属性
• 如果有m个定性因素,且每个因素各有两个不同的 属性类型,则引入m个虚拟变量。
• 例2
• 研究居民住房消费函数时,考虑到城乡差异和不同 收入层次的影响将消费函数设定为:
Yt=b0+b1Xt+a1D1t+ a2D2t+ μt
Yt=居民住房消费支出
Xt=居民可支配收入
1城镇居民
2020/6/16
虚拟变量对截距的影响
y
有适龄子女
b0&#
o
图1 虚拟变量对截距的影响
x
2020/6/16
2、乘法方式引入虚拟变量
• 基本思想:以乘法方式引入虚拟解释变量
,是在所设定的计量经济模型中,将虚拟 解释变量与其他解释变量相乘作为新 的解释变量,以达到其调整模型斜率的
目的。 • 该方式引入虚拟变量主要作用:
D=
0 无适龄子女
将家庭教育费用支出函数写成:Yt=b0+b1Xt+aDt+μt 即以加法形式引入虚拟变量。
2020/6/16
子女年龄结构不同的家庭教育 费用支出函数为:
• 无适龄子女家庭的教育费用支出函数(D=0 ):Yt=b0+b1Xt+μt
• 有适龄子女家庭的教育费用支出函数(D=1 ):Yt=(b0+a)+b1Xt+μt

计量经济学课后习题答案第八章_答案

计量经济学课后习题答案第八章_答案

第八章虚拟变量模型1. 回归模型中引入虚拟变量的作用是什么?答:在模型中引入虚拟变量,主要是为了寻找某(些)定性因素对解释变量的影响。

加法方式与乘法方式是最主要的引入方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。

除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。

2. 虚拟变量有哪几种基本的引入方式? 它们各适用于什么情况?答:在模型中引入虚拟变量的主要方式有加法方式与乘法方式,前者主要适用于定性因素对截距项产生影响的情况,后者主要适用于定性因素对斜率项产生影响的情况。

除此外,还可以加法与乘法组合的方式引入虚拟变量,这时可测度定性因素对截距项与斜率项同时产生影响的情况。

3.什么是虚拟变量陷阱?答:根据虚拟变量的设置原则,一般情况下,如果定性变量有m个类别,则需在模型中引入m-1个变量。

如果引入了m个变量,就会导致模型解释变量出现完全的共线性问题,从而导致模型无法估计。

这种由于引入虚拟变量个数与类别个数相等导致的模型无法估计的问题,称为“虚拟变量陷阱”。

4.在一项对北京某大学学生月消费支出的研究中,认为学生的消费支出除受其家庭的每月收入水平外,还受在学校中是否得到奖学金,来自农村还是城市,是经济发达地区还是欠发达地区,以及性别等因素的影响。

试设定适当的模型,并导出如下情形下学生消费支出的平均水平:(1) 来自欠发达农村地区的女生,未得到奖学金;(2) 来自欠发达城市地区的男生,得到奖学金;(3) 来自发达地区的农村女生,得到奖学金;(4) 来自发达地区的城市男生,未得到奖学金。

解答: 记学生月消费支出为Y,其家庭月收入水平为X,则在不考虑其他因素的影响时,有如下基本回归模型:Y i=β0+β1X i+μi有奖学金1 来自城市无奖学金0 来自农村来自发达地区 1 男性0 来自欠发达地区0 女性Y i=β0+β1X i+α1D1i+α2D2i+α3D3i+α4D4i+μi由此回归模型,可得如下各种情形下学生的平均消费支出:(1) 来自欠发达农村地区的女生,未得到奖学金时的月消费支出:E(Y i|= X i, D1i=D2i=D3i=D4i=0)=β0+β1X i(2) 来自欠发达城市地区的男生,得到奖学金时的月消费支出:E(Y i|= X i, D1i=D4i=1,D2i=D3i=0)=(β0+α1+α4)+β1X i(3) 来自发达地区的农村女生,得到奖学金时的月消费支出:E(Y i |= X i , D 1i =D 3i =1,D 2i =D 4i =0)=(β0+α1+α3)+β1X i (4) 来自发达地区的城市男生,未得到奖学金时的月消费支出: E(Y i |= X i ,D 2i =D 3i =D 4i =1, D 1i =0)= (β0+α2+α3+α4)+β1X i5. 研究进口消费品的数量Y 与国民收入X 的模型关系时,由数据散点图显示1979年前后Y 对X 的回归关系明显不同,进口消费函数发生了结构性变化:基本消费部分下降了,而边际消费倾向变大了。

虚拟变量回归模型:计量经济学3

虚拟变量回归模型:计量经济学3
E( yi D2 0, D3 0) 1 xi
3、虚拟变量的实际应用
(1)虚拟变量可以用于研究制度变迁的影响

如:研究2001年中国加入WTO事件对中国进出 口贸易的影响,可以建立如下方程:
+d 主要贸易伙伴国 GDP+e DWTO
中国的进出口贸易总值 =a b 人民币汇率 c 中国GDP
计量经济学专题:
虚拟变量的回归与Probit模型、 Logit模型
1、虚拟变量的性质


与有明确尺度量化了的变量(GDP、产 量、价格、成本、汇率等)不同,虚拟 变量是一种定性性质的变量,如性别、 种族、国籍等只涉及“是”与“非”两 种状态的变量。 虚拟变量的取值只取0或1。1表示某种性 质出现,0表示某种性质不出现。

(3)对一个普通变量与两个两分虚拟变 量的回归

例:种族及性别差异对薪金的影响。 假定薪金除了受工作年限、性别的影响 之外,还受种族的影响。
yi 1 2 D2i 3D3i xi ui

yi 为某人的工资水平,xi 为工作年限。

yi 1 2 D2i 3D3i xi ui 虚拟变量模型:

白人女性的工资水平:
E( yi D2 0, D3 1) (1 3) xi

yi 1 2 D2i 3D3i xi ui 虚拟变量模型:

其他人种男性的平均工资:
E( yi D2 1, D3 0) (1 2) xi

其他人种女性的平均工资:
Pi P r(Y 1) P r(I i * I i ) F ( I i ) 1 2 1 2

Ii

计量经济学第三章-回归模型的扩展

计量经济学第三章-回归模型的扩展
验的结果,或直接取成 1/|ei|、1/ei2
第二节 自相关性
一Байду номын сангаас自相关性的概念及其产生原因:
1.定义:随机误差项的各期值之间存在相关性 COV(t, s)0, ts
例:投资函数、生产函数
2.产生原因: 1)模型遗漏了自相关的解释变量; 2)模型函数形式的设定误差; 3)经济惯性; 4)随机因素影响; (注:自相关性更易产生于时序数据)
原理:辅助回归检验 命令:View\ResidualTest \SerialCorrelation LM
Test
四、自相关性的修正方法
1.利用广义差分变换消除自相关性:
步骤: 实质:GLS估计
2.的估计方法:
1)近似估计; 2)迭代估计;
3.Eviews软件的实现:
1)检验自相关性的阶数; 2)在LS命令中增加AR项;
二、异方差的影响
1.OLS估计不再是最佳估计量; 2.T检验可靠性降低; 3.增大预测误差; 三、异方差的检验 ★1.图形分析: (1)观察Y、X相关图:SCAT Y X (2)残差分析:观察回归方程的残差图
在方程窗口直接点击Residual按钮; 或:点击View\Actual,Fitted,Residual\Table
1. 调整季节波动
y a bx 1D1 2D2 3D3
2. 检验模型结构的稳定性(P141)
y a bx D XD
3. 混合回归
例8.教材P132
第五节 滞后变量模型
一、滞后效应与滞后变量的作用 1、产生滞后效应的原因:
1)心理因素:消费习惯、消费心理(如价格、利率) 2)技术原因:农民收入、农产品价格、天气条件 3)制度原因:

计量经济学10虚拟变量回归模型

计量经济学10虚拟变量回归模型
把定性因素“定量化”的一个方法是建立人 工变量(也称为虚拟变量,Dummy variable),并赋值0和1:
0:不具备某种性质; 1:具备某种性质。 虚拟变量常用变量D表示。
10-4
例如,反映文化程度的虚拟变量可取为: 1, 本科学历
D= 0, 非本科学历
10-5
一般地,在虚拟变量的设置中:
品消费支出对的回归模型
回归模型如公式10-8,10-9 对模型的解释:
虚拟变量的统计显著; 常数统计显著; 对定量变量回归统计的解释。
对比没有虚拟变量的模型
10-13
例:一个以性别虚拟变量考察企业职工薪 水的模型:
Yi=B1+B2Xi+B3Di+ui
其中:Yi为企业职工的薪金,Xi为工龄, Di=1,若是男性,Di=0,若是女性。
研究类型、肯定类型取值为1; 基准类型,否定类型取值为0。
称虚拟变量也为二元变量binary variable
10-6
方差分析模型(Analysis of variance models,ANOVA):仅包含定性变量或 虚拟变量的回归模型,其形式如下: Yi=B0+B1Di+ui
假定Y:每年食品支出(美元);Di=1表示 女性;Di=0表示男性,则:
• D2=1表东北和中北部地区,D2=0为其它地区; • D3=1表南部地区,D3=0为其它地区
这是将西部地区看成是基准类。
10-15
再考虑政府机构用于每个学生的花费和地区对 教师平均年薪水的影响: AASi=B1+B2D2i+B3D3i+B4PPSi
对模型的解释:
D2显著,而D3不显著,表明原模型存在设定误差; PPS的系数的含义

计量经济学课件虚拟变量

提高模型精度和预测能力
通过引入虚拟变量,可以更准确地刻画经济现象的非线性特征,从而提高计量经济学模型 的精度和预测能力。
拓展应用领域
虚拟变量的引入使得计量经济学模型能够应用于更多的领域,如金融、环境、社会等,进 一步拓展了计量经济学的应用范围。
未来研究方向和趋势
深入研究虚拟变量的理论 和方法
未来研究将进一步深入探讨虚 拟变量的理论和方法,包括虚 拟变量的选择、设定和估计方 法等,以更准确地刻画经济现 象。
https://
未来研究将积极推动虚拟变量 在交叉学科领域的应用,如环 境经济学、金融经济学等,以 促进不同学科之间的交流和合 作。
WENKU DESIGN
WENKU DESIGN
2023-2026
END
THANKS
感谢观看
KEEP VIEW
WENKU DESIGN
WENKU DESIGN
WENKU
REPORTING
要点二
虚拟变量的设置原则
在设置虚拟变量时,需要遵循完备性 和互斥性的原则。完备性要求虚拟变 量的取值能够覆盖所有可能的情况, 而互斥性则要求不同虚拟变量之间不 能存在重叠或交叉的情况。
要点三
虚拟变量的回归系数 解释
在线性回归模型中,虚拟变量的回归 系数表示该定性因素对因变量的影响 程度。当虚拟变量取值为1时,其对 应的回归系数表示该水平与参照水平 相比对因变量的影响;当虚拟变量取 值为0时,则表示该水平对因变量没 有影响。
参数估计与假设检验
参数估计
采用最小二乘法等估计方法,对引入虚拟变量后的模型进行参数估计,得到各 解释变量的系数估计值。
假设检验
根据研究问题和假设,构建相应的原假设和备择假设,通过t检验、F检验等方 法对参数进行假设检验,判断虚拟变量对模型的影响是否显著。

计量经济学 第4讲 线性回归模型的扩展


或 :X1i

2 1
X 2i
k 1
X ki

1
1
ei
(
1
0)
),提供海量管理资料免费下载!
什么是多重共线性
例题4.1
X1
X2
X3
10 55
52
15 80
75
18 95
97
24 125 129
30 155 152
X4
67 r12 1: 完 全 共线 性
25
r13 0.9959:高度多重共线性 r14 0.2532:低度多重共线性
令1 X1i 2 X 2i k X ki 0
或 :X1i

2 1
X 2i
k 1
X ki
( 1 0 )
b.多 重 共 线 性 : 存 在 一 组不 同 时 为0的1、、k,
令1 X1i 2 X 2i k X ki ei 0
严重的问题;但如果研究的主要目的是假设检验,则高度多 重共线性的危害就很大
),提供海量管理资料免费下载!
多重共线性的处理
1) 剔除共线性变量中不太重要的解释变量 2) 补充新数据 3) 重新设定模型
o 练习题:p216-217,习题10.14-10.19 ),提供海量管理资料免费下载!
三、异方差性
多重共线性的诊断
简单诊断方法
o R2高而单个系数的t值小,换言之,F检验显著,但显著的 t值少
o 任意两个解释变量之间的相关系数较大,比如大于0.9 o 解释变量之间的偏相关系数较大
简单方法一般来说不很精确
),提供海量管理资料免费下载!
多重共线性的诊断

计量经济学第八章 虚拟变量回归

计量经济学
第八章
虚拟变量回归
1
第八章 虚拟变量回归
本章主要讨论:
●虚拟变量
●虚拟解释变量的回归
2
本章的教学目标





(1)深刻理解定性因素在计量经济分析中的 背景和含义; (2)明确虚拟变量在建立和估计计量经济模 型中的意义和作用; (3)熟练掌握引入和应用虚拟变量的基本思 想和方法; (4)能够运用虚拟变量模型作相应的经济实 证分析方面的应用; (5)掌握Eviews软件中相关内容的操作方法。
这表明三个时期居民储蓄增加额的回归方程在统计 意义上确实是不相同的。1996年以前收入每增加1 亿元,居民储蓄存款的平均增加0.1445亿元;在 2000年以后,则为0.4133亿元,已发生了很大变化。
20
上述模型与城乡居民储蓄存款与国民总收入之间 的散布图是吻合的,与当时中国的实际经济运行 状况也是相符的。 需要指出的是,在上述建模过程中,主要是从教 学的目的出发运用虚拟变量法则,没有考虑通货 膨胀因素。而在实证分析中,储蓄函数还应当考
单位:亿元
城乡居民 人民币储 蓄存款增 额 (YY) 2121.8 2517.8 3444.1 6315.3 8143.5 8858.5
年 份
城乡居民 国民总收 人民币储 蓄存款年 入 (GNI) 底余额 (Y) 3624.1 4038.2 4517.8 4860.3 5301.8 5957.4 210.6 281 399.5 532.7 675.4 892.5
(1,0) 天气阴 如:(D1 ,D2)= (0,1) 天气雨 (0,0) 其 他
29
虚拟变量数量的设置规则
1.若定性因素具有 m 个 (m 2) 相互排斥属性(或 几个水平),当回归模型有截距项时,只能引入

虚拟变量回归模型:计量经济学

在实时经济分析和决策支持方面,虚拟变量回归模型可以结合实时数据流进行 动态更新和预测,为政策制定者和市场参与者提供及时、准确的经济分析和决 策支持。
对未来研究的展望
拓展模型应用领域
未来研究可以进一步拓展虚拟变 量回归模型的应用领域,如环境 经济学、劳动经济学、金融经济 学等,以更深入地揭示经济现象 背后的规律。
宏观经济学领域应用
经济增长研究
引入虚拟变量以刻画不同国家或地区的经济增 长模式,并分析各种因素对经济增长的贡献。
通货膨胀与货币政策研究
利用虚拟变量回归模型,探讨通货膨胀的成因、 传导机制及货币政策的效应。
国际贸易研究
通过构建虚拟变量,分析贸易自由化、关税壁垒等因素对国际贸易流量的影响。
金融学领域应用
线性问题,影响模型的稳定性和解释性。
预测能力有限
03
对于具有复杂关系的数据,虚拟变量回归模型可能无法提供准
确的预测。
与其他模型的比较
01
与线性回归模型的比较
虚拟变量回归模型是线性回归模型的一种扩展,通过引入 虚拟变量来处理分类变量。线性回归模型则主要关注连续 变量的影响。
02 03
与逻辑回归模型的比引言 • 虚拟变量回归模型基本原理 • 虚拟变量回归模型应用举例 • 虚拟变量回归模型优缺点分析 • 虚拟变量回归模型在实证研究中的应用 • 虚拟变量回归模型的发展趋势和前景
01 引言
计量经济学简介
1 2
计量经济学定义
计量经济学是应用数学、统计学和经济学方法, 对经济现象进行定量分析的学科。
完善模型理论和方法
在模型理论和方法方面,未来研 究可以进一步完善虚拟变量回归 模型的理论基础和方法体系,提 高模型的解释力和预测能力。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

•男职工本科以上学历的平均薪金:
E(Yi | X i , D1 1, D2 1) ( 0 2 3 ) 1 X i
思考:研究性别(男、女),学历(分为高 学历,中等学历,低学历)对员工工资的影 响。一共要引入几个虚拟变量?
•注意:加法方式引入虚拟变量,考察了截距的不同。 但同时注意到,此时不同性别的人的学历差距对工 资的影响一样。这是一个较强的约束。 有可能当学历不同时,性别对于工资的影响不同 或者,性别不同时,学历对工资的影响不同 即:某变量的边际影响受到其他变量的调节作用。 如何体现这种交互效应?
去除时间序列的季节、周期等效应,更清晰的 反应变量之间的关系 利用虚拟变量方法反映季节因素的影响
三、虚拟变量的应用
(2)检验模型结构的稳定性(变化)
用途: 分析模型结构对样本变化的敏感性 比较两个或多个模型之间的差异情况 例如,不同性别人群消费函数是否相同?不同时期 居民消费行为是否发生变化? 为什么不简单的将数据分成两段? 分组后观测值大大减少,有时观测值少到难以估计 无法对结构变化进行检验
交互效应的处理 •一个解释变量的边际效应有时可能要依赖于另 一个解释变量。 •交互作用的引入方法:在模型中引入相关变量 的乘积。 •交互项的处理方法,对于数量变量和虚拟变量 都适用
例:研究工龄、性别,学历对工资的影响(包含性 别和学历的交互项)对工资的影响。
Y 1 2 X 1 3 D1 4 D2 5 D1D2+u
男性 女性
E(Yi | X i , Di 0) 0 1 X i
企业男职工的平均薪金为:
E(Yi | X i , Di 1) ( 0 2 ) 1 X i
几何意义:
•两个函数有相同的斜率,说明男女职工平均薪金对工 龄的变化率是一样的。 •如果2>0,表明两个函数截距不相同,且男职工平均 薪金比女职工高,两者平均薪金水平相差2。 •如果2<0,表明两个函数截距不相同,且男职工平 均薪金比女职工低,两者平均薪金水平相差2。 •如果2=0,表明两个函数截距相同,即男职工,女 职工的平均薪金没有显著差异。
假定3>2,其几何意义:
大学教育 保健 支出 高中教育 低于中学教育
收入
问题:
虚拟变量为何只选“0”, „1“,选择0,1,2 等 可以吗 同一种属性,两个变量能够表示几种状态? 思考,如果在模型中引入季节效应?月份效应?
(3)多个虚拟变量的引入——多种因素
例:研究学历(本科及以上,本科以下),性别(男、女) 对员工工资的影响。
1990年后:
E(Ct | X t , Dt 1) 0 ( 1 2 ) X t
3、当截距与斜率发生变化时,同时引入加法与乘法形式的虚 拟变量
例,利用1978-2001的居民储蓄与居民收入的数据。考察 1990年前、后中国居民的总储蓄-收入关系是否已发生变 化。
表 5.1.1 90年前 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 储蓄 281 399.5 523.7 675.4 892.5 1214.7 1622.6 2237.6 3073.3 3801.5 5146.9 7034.2
消费模型可建立如下:
Ct 0 1 X t 2 Dt X t t
这里,虚拟变量D以与X相乘的方式引入了模型中, 从而可用来考察消费倾向的变化。 假定E(i)= 0,上述模型所表示的函数可化为:
1990年前:
E(Ct | X t , Dt 0) 0 1 X t
可以通过传统的回归检验,对2的统计显著性进 行检验,以判断企业男女职工的平均薪金水平是 否有显著差异。
年薪 Y 男职工 女职工
2 0
工龄 X
(2)多个虚拟变量的设定和引入 ——一种因素多种状态(水平):
例:研究收入和教育水平(分为高,中,低三类)对个人保健支出的 影响。
教育水平考虑三个层次:
Y 0 1 X 2 D1 3 D2 u
对任意家庭都有: D1 D2 1 0 共线性,陷入“虚拟变量陷阱”
虚拟变量陷阱的实质是:完全多重共线性
如果模型本身不含截距项,引入两个虚拟变量:
1 城镇 D1 0 农村
回归模型为:
1 农村 D2 0 城镇
GNP 21662.5 26651.9 34560.5 46670.0 57494.9 66850.5 73142.7 76967.2 80579.4 88228.1 94346.4
储蓄-收入关系是否发生改变,可利用虚拟变量模型来 解决。
将1990年前与1990年的观测值合并,并用以估 计以下回归:
低学历: E(Yi | X i , D1 0, D2 0) 0 1 X i 中等学历:E(Yi | X i , D1 1, D2 0) ( 0 2 ) 1 X i 高学历 E(Yi | X i , D1 0, D2 1) ( 0 3 ) 1 X i
可分别表示1990年前与1990年后的储蓄函数。
在统计检验中, 如果3=0的假设被拒绝,则说明两个时期中储蓄函数的截距不同; (t检验) 如果4=0的假设被拒绝,则说明两个时期中储蓄函数的斜率不同。 (t检验)
三、虚拟变量的引入原则
若定性因素具有m个(m>=2)个相互排斥的属性 (或水平) 当回归模型有截距项时,只能引入 m-1 个虚拟 变量 当回归模型无截距项时,可引入m个虚拟变量
Y —表示工资收入 X 1—表示工龄 D1—表示性别的虚拟变量,男性=1,女性=0 D 2—表示是否为高学历的虚拟变量,高学历=1,低学历=0
此时,男性高学历的工作方程是怎样的? 如何检验交互效应是否存在?
H 0 : 5 0 H1 : 5 0
2.
乘法方式
乘法方式引入虚拟变量时,将虚拟变量与 其他解释变量(或者定量变量X,或者其 他虚拟变量D)的乘积,作为新的解释变 量出现在模型中。
在例1基础上,再引入代表学历的虚拟变量D2: 1 本科及以上学历 1 男性
D1 0 女性
D2 0
本科以下学历
职工薪金的回归模型可设计为: Yi 0 1 X i 2 D1 3 D2 i
于是,不同性别、不同学历职工的平均薪金分别为:
•女职工本科以下学历的平均薪金:
Yi 1 2 X i 3 Di 4 ( Di X i ) i
1 Di为引入的虚拟变量: D 0
90年后 90年前
于是有:
E (Yi | Di 0, X i ) 1 2 X i
E (Yi | Di 1, X i ) ( 1 3 ) ( 2 4 ) X i
否则就会陷入“虚拟变量陷阱”
例:虚拟变量陷阱
居民住房消费支出和居民可支配收入之间的数量 关系的回归模型为:
Y 0 1 X u
为了研究“城镇”和“农村”在住房消费上的支 出差异,引入虚拟变量:
1 城镇 D 0 农村
Y 0 1 X 2 D u
1 城镇 D 0 农村
具体的: 农村:Y 0 1 X u 城市:Y=( 0 2) 1 X u
0 对应农村居民的截距项 2 对应城市居民和农村居民住房上的差距。
如果引入两个虚拟变量:
1 城镇 D1 0 农村
回归模型为:
1 农村 D2 0 城镇
产生完全多重
低学历:高中以下, 中等学历:高中,及大中专 高学历:大学及其以上。
这时需要引入两个虚拟变量:
1 中等学历 D1 其他 0
1 高学历 D2 0 其他
模型可设定如下:
Yi 0 1 X i 2 D1 3 D2 i
在E(i)=0 的初始假定下,低学历,中等学历,高学历教育水平下 个人保健支出的函数:
E(Yi | X i , D1 0, D2 0) 0 1 X i
•男职工本科以下学历的平均薪金:
E(Yi | X i , D1 1, D2 0) ( 0 2 ) 1 X i
•女职工本科以上学历的平均薪金:
E(Yi | X i , D1 0, D2 1) ( 0 3 ) 1 X i
第三章 回归模型的扩展 之 虚拟变量
第四节 虚拟变量模型
一、虚拟变量的概念 二、虚拟变量引入的方式 三、虚拟变量的引入原则 四、虚拟变量的应用 五、案例分析
一、虚拟变量的概念 1、问题的引出
前面的回归模型中,所遇到的变量均为定量变量, 如GDP、工资、收入、销售额,教育年数等。 实际建模,一些定性变量有不可忽视的影响。 例如,研究某个企业的销售水平,产业属性(制造 业、零售业)、所有制(私营,非私营)、地理位 置(东、中、西部)等是值得考虑的因素。但这些 因素是定性描述的。
达到调整设定模型斜率的目的。
背景介绍:根据消费理论,消费水平C主要取决于收入水平Y,但在 一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、
战争等反常年份,消费倾向往往出现变。
例:利用1978-2001年的数据,分析1990年前后消费倾向 是否发生变化?
0 1990年前 设:Dt 1 1990年后
对定性变量的量化,以及对定量变量的分类, 都可以采用虚拟变量的方式进行。
例如,反映文化程度的虚拟变量可取为:
1 D 0
本科及以上
本科以下
反映性别的虚拟变量可取为:
1 D 0
男性 女性
4、虚拟变量中“0”,“1”选取原则
要从分析问题的目的出发予以界定
0—代表基期,比较的基期,参照组 1—代表报告期,被比较的效应,实验组
相关文档
最新文档