计量经济学8第八章 虚拟变量回归new

合集下载

第八章-虚拟变量回归

第八章-虚拟变量回归

1 高中 D2 0 其它
1 博士 D5 0 其它
1 大 学 D3 0 其 它
1 小 学 D6 0 其 它
则总体回归模型:
w 0 1 X 2 D1 3 D2 4 D3 5 D4 6 D5 7 D6+u
17
二、用虚拟变量测量斜率变动
基本思想
引入虚拟变量测量斜率变动,是在所设立的模型中,将虚 拟解释变量与其它解释变量的乘积,作为新的解释变量出 现在模型中,以达到其调整设定模型斜率系数的目的。
可能的情形:
(1)截距不变;
(2)截距和斜率均发生变化;
分析手段:仍然是条件期望。
18
(1)截距不变
模型形式:
意义:若α1显著,表明城市居民的平均人均可支配收入比农村 高α1元。但这种差异可能是由其它因素引起的,并不一定是由 户籍差异引起。
12
(2) 一个两属性定性解释变量和一个定量 解释变量
模型形式 Yi = f(Di,X i )+ μi 例如:Yi = 0 1 Di + X i + μi 1 城市 其中: Y-人均可支配收入;X-工作时间; Di 0 农村
会受到一些定性因素的影响,如性别、国籍、民族、自 然灾害和政治体制等。
问题:我们如何把这些定性想:将这些定性因素进行量化
由于定性变量通常表示某种属性是否存在,如是否男性、 是否经济特区、是否有色人和等。因此若该属性存在, 我们就将变量赋值为1,否则赋值为0,从而将定性因素 定量化。 计量经济学中,将取值为0和1的人工变量称为虚拟变量 (DUMMY)或哑元变量。通常用字母D或DUM表示。
7
一个例子(虚拟变量陷阱)
研究工资收入与学历之间的关系:

计量经济学第八章 虚拟变量回归

计量经济学第八章 虚拟变量回归
计量经济学
第八章
虚拟变量回归
1
第八章 虚拟变量回归
本章主要讨论:
●虚拟变量
●虚拟解释变量的回归
2
本章的教学目标





(1)深刻理解定性因素在计量经济分析中的 背景和含义; (2)明确虚拟变量在建立和估计计量经济模 型中的意义和作用; (3)熟练掌握引入和应用虚拟变量的基本思 想和方法; (4)能够运用虚拟变量模型作相应的经济实 证分析方面的应用; (5)掌握Eviews软件中相关内容的操作方法。
这表明三个时期居民储蓄增加额的回归方程在统计 意义上确实是不相同的。1996年以前收入每增加1 亿元,居民储蓄存款的平均增加0.1445亿元;在 2000年以后,则为0.4133亿元,已发生了很大变化。
20
上述模型与城乡居民储蓄存款与国民总收入之间 的散布图是吻合的,与当时中国的实际经济运行 状况也是相符的。 需要指出的是,在上述建模过程中,主要是从教 学的目的出发运用虚拟变量法则,没有考虑通货 膨胀因素。而在实证分析中,储蓄函数还应当考
单位:亿元
城乡居民 人民币储 蓄存款增 额 (YY) 2121.8 2517.8 3444.1 6315.3 8143.5 8858.5
年 份
城乡居民 国民总收 人民币储 蓄存款年 入 (GNI) 底余额 (Y) 3624.1 4038.2 4517.8 4860.3 5301.8 5957.4 210.6 281 399.5 532.7 675.4 892.5
(1,0) 天气阴 如:(D1 ,D2)= (0,1) 天气雨 (0,0) 其 他
29
虚拟变量数量的设置规则
1.若定性因素具有 m 个 (m 2) 相互排斥属性(或 几个水平),当回归模型有截距项时,只能引入

虚拟变量回归模型:计量经济学

虚拟变量回归模型:计量经济学
在实时经济分析和决策支持方面,虚拟变量回归模型可以结合实时数据流进行 动态更新和预测,为政策制定者和市场参与者提供及时、准确的经济分析和决 策支持。
对未来研究的展望
拓展模型应用领域
未来研究可以进一步拓展虚拟变 量回归模型的应用领域,如环境 经济学、劳动经济学、金融经济 学等,以更深入地揭示经济现象 背后的规律。
宏观经济学领域应用
经济增长研究
引入虚拟变量以刻画不同国家或地区的经济增 长模式,并分析各种因素对经济增长的贡献。
通货膨胀与货币政策研究
利用虚拟变量回归模型,探讨通货膨胀的成因、 传导机制及货币政策的效应。
国际贸易研究
通过构建虚拟变量,分析贸易自由化、关税壁垒等因素对国际贸易流量的影响。
金融学领域应用
线性问题,影响模型的稳定性和解释性。
预测能力有限
03
对于具有复杂关系的数据,虚拟变量回归模型可能无法提供准
确的预测。
与其他模型的比较
01
与线性回归模型的比较
虚拟变量回归模型是线性回归模型的一种扩展,通过引入 虚拟变量来处理分类变量。线性回归模型则主要关注连续 变量的影响。
02 03
与逻辑回归模型的比引言 • 虚拟变量回归模型基本原理 • 虚拟变量回归模型应用举例 • 虚拟变量回归模型优缺点分析 • 虚拟变量回归模型在实证研究中的应用 • 虚拟变量回归模型的发展趋势和前景
01 引言
计量经济学简介
1 2
计量经济学定义
计量经济学是应用数学、统计学和经济学方法, 对经济现象进行定量分析的学科。
完善模型理论和方法
在模型理论和方法方面,未来研 究可以进一步完善虚拟变量回归 模型的理论基础和方法体系,提 高模型的解释力和预测能力。

计量经济学第八章关于虚拟变量的回归.

计量经济学第八章关于虚拟变量的回归.
年 薪 Y 女教授
类的截距。
2
2:级差截距系数
教龄X
1
0
薪金与性别:估计结果
1,若是男性 Di 0,若是女性
ˆ 17.969 1.371X 3.334D Y i i i se : (0.192) (0.036) (0.155) t : (93.61) (38.45) (21.455) r 2 0.993
一、虚拟变量的性质

例:教授薪金与性别、教龄的关系

男教授平均薪金和女 教授平均薪金水平相 差2,但平均年薪对 教龄的变化率是一样 的
Yi=1+2Di+Xi+I (1) 1,若是男性 D 其中:Yi=教授的薪金, Xi=教龄, Di=性别 0,若是女性 i 女教授平均薪金:E(Yi | X i , Di 0) 1 X i 被赋予0值的 男教授平均薪金:E(Yi | X i , Di 1) (1 2) X i 类别是基底(基 准),1是基底 男教授

比较英国在第二次大战后重建时期和重建后时期的总 储蓄-收入关系是否发生变化。数据如表。 Yt 1 2 Dt 1 X t 2 ( Dt X t ) t
D=1,重建时期
级差截距:区分两 个时期的截距 级差斜率系数:区分 两个时期的斜率 =0,重建后时期
D=1 D=0
E(Yt | Dt 0, X t ) 1 1 X t E(Yt | Dt 1, X t ) (1 2 ) ( 1 2 ) X t
男教授平均薪金水平比 女教授显著高$3.334K (男:21.3,女:17.969)
1,若是女性 Di 0,若是男性
ˆ 21.303 1.371X 3.334D Y i i i se : (0.182) (0.036) (0.155) t : (117.2) (38.45) (21.455)

9第八章 虚拟变量回归模型

9第八章 虚拟变量回归模型
说明 X i 变动一个单位,机会比率对数平均变化 2 个单位,
Logit 模型的估计
区分两类数据:
(1)个体水平数据
购房概率 p 0 0 1 1
收入 X(千美元) 6 8 10 12
如果
pi
0,
Zi
ln
0 1
pi
1,
Zi
ln
1 0
可见,Z 表达式无意义,无法用OLS,需用ML(最大似然法)
冰箱销售量(千台) FRIG 1317 1615 1662 1295 1271 1555 1639 1238 1277 1258 1417 1185 1196 1410 1417 919 943 1175 1269
耐用品支出(10亿美元) DUR 252.6 272.4 270.9 273.9 268.9 262.9 270.9 263.4 260.6 231.9 242.7 248.6 258.7 248.4 255.5 240.4 247.7 249.1 251.8
4 回归分析操作命令: equation eq.ls Frig c Dur D1 D2 D3
提问 根据回归分析结果,发现存在什么问题?如何修改回归模型?
8.4 虚拟被解释变量的回归模型
【例】 研究是否购买住房与收入水平的关系。
设是否购房为被解释变量,用 Y 表示;收入为解释变量, 用 X 表示。
1 变量分析:
将DUR作为解释变量;FRIG作为被解释变量; 引入3个季度虚拟变量D1,D2,D3。 (虚拟变量数 = 属性数 – 1 )
2 季度虚拟变量的赋值规则:
D1=
1 (第1季度) 0 (其他季度)
D3=
1 (第3季度) 0 (其他季度)
D2=

第八章虚拟解释变量回归

第八章虚拟解释变量回归

第八章虚拟解释变量回归第一节虚拟变量一、虚拟变量的差不多概念在前面的分析中,被说明变量要紧受到一些能够直截了当度量的变量阻碍,如收入、产出、商品需求量、价格、成本、资金、人数等。

但现实经济生活中,阻碍被说明变量变动的因素,除了这些能够直截了当获得实际观测数据的定量变量外,还包括一些本质上为定性因素(或称属性因素)的阻碍,例如性别、种族、肤色、职业、季节、文化程度、战争、自然灾难、政府经济政策的变动等因素。

在实际经济分析中,这些定性变量有时具有不可忽视的重要阻碍。

例如,研究某个企业的销售水平,产业部门(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、治理者素养的高低等是值得经常考虑的阻碍因素,这些因素有共同的特点,即差不多上表示某种属性的,不能直截了当用数据精确描述的因素。

因此,被说明变量的变动经常是定量因素和属性因素共同作用的结果。

在计量经济模型中,应当同时包含定量和属性两种因素对被说明变量的阻碍作用。

定量因素是指那些可直截了当测度的数值型因素,如GDP、M2等。

定性因素,或称为属性因素,是不能直截了当测度的、说明某种属性或状态存在与否的非数值型因素,如男性或女性、都市居民或非都市居民、气候条件正常或专门、政府经济政策不变与改革等。

在计量经济学的建模中应当将定量因素和定性因素同时纳入模型之内。

为了在模型中反映定性因素,能够将定性因素转化为虚拟变量去表现。

虚拟变量(或称为属性变量、双值变量、类型变量、定性变量、二元型变量等),是人工构造的取值为0和1的作为属性变量代表的变量,一样用字母D(或DUM,英文dummy的缩写)表示。

属性因素通常具有若干类型或水平,通常虚拟变量的取值为0和1,当虚拟变量取值为0,即D=0时,表示某种属性或状态不显现或不存在,即不是某种类型;当虚拟变量取值为1,即D=1时,表示某种属性或状态显现或存在,即是某种类型。

例如,构造政府经济政策人工变量,当经济政策不变时,虚拟变量取值为0,当经济政策改变时,虚拟变量取值为1。

计量经济学第八章虚拟变量回归

计量经济学第八章虚拟变量回归

Y D D D X i 0 1 1 2 2 3 3 4 i i
D1

D2
1 一季度
1 二季度
D3
1 三季度
2 0 其他
2 0 其他
2 0 其他
15
例:美国制造业利润-销售额模型分析
Y X D D D 0 1 i 2 2 i 3 3 i 3 4 i i
比如在研究居民消费函数的时候,考虑到城乡差距和收入差距, 消费函数可以表示为: Y b b X b D b D
i 0 1i 2 1 i 32 i

i
D1i
1 城镇居民 2 0 农村 居民 农村低收入家庭 农村高收入家庭 城市低收入家庭 城市高收入家庭
D2i
1 高收入家庭
2 0 低收入家庭
计参数是否能通过显著性检验,最终确定虚拟变量的具体引入 方式。
9
课本P125页例7中数据建立的我国城镇居民彩电消费模型
ˆ Y 57 . 6113 0 . 0118 X 31 . 8731 D 0 . 0088 D X i i i i i
t
Di
(9.03)
(8.32)
(-6.59)
从这一章开始引入定性变量作为自变量,从而使线性 回归模型作为一种及其灵活的工具,可以处理经验研究中
许多实际的问题
2
• 由于这些定性变量通常指某一性质或属性的出现或不出现,
比如男性或女性、大学学历或专科学历等,因此量化这些 变量的方法就是构造一个取值为0或1的人为变量,可以用 0表示某种属性不出现,1表示某种属性出现。 • 这种人为设定的变量就称作虚拟变量(Dummy Variable) 1 大学毕业

计量经济学第八章 虚拟变量

计量经济学第八章 虚拟变量

Yi X i Di X i i
如果该模型设定正确,此时有:
E(Yi
)



(
X
)
i
X
i
D 1 D0
可见,城镇ቤተ መጻሕፍቲ ባይዱ民的边际消费倾向为 ( ) ,农
村居民的边际消费倾向为 。
如果不同属性类别对应的截距项和斜率项都 是有差异的,可在回归模型中同时引入虚拟 变量的加法方式和乘法方式,结果如下:
1 东部 D1 0 其他
1 中部 D2 0 其他
若考虑不同区域居民对应回归模型截距的不同 ,可构建模型如下:
Yi 1D1i 2 D2i X i i
则有:
E (Yi
)

( (

2) 1)

X i X i

Xi
Yi Di X i Di X i i
对于城镇居民和农村居民这两个类别,有总 体回归函数如下:
E(Yi
)

(


)

( X i

)X
i
D 1 D0
可见, 和 分别表示城镇居民与农村居民
的消费函数在截距和斜率上的差异。
注:
对于包含多个类别(M个)的属性变量,构 建M-1个虚拟变量,如在消费模型中,考虑 区域因素(东部,中部,西部)影响,可构 建2个虚拟变量:
Yi 1D1i 2 D2i (D1i D2i ) X i i
• 则有: ( 1 2 ) Xi

E
(Yi
)



( 1) Xi ( 2 ) Xi
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
GENR SMPL GENR D1=0 9 16 D1=1 输入虚拟变量的值 样本期调为1999年 输入虚拟变量的值
25
SMPL 1 16 GENR XD=X*D1 LS Y C X D1 XD 估计结果为: 操作演示
t统计量
样本期调至1998~1999年 生成XD的值 利用混合样本估计模型
R2的值
单位:亿元
城乡居民人 民币储蓄存 款增加额 (YY)
年 份
城乡居 民人民 国民总收 币储蓄 入 (GNI) 存款年 底余额 (Y ) 7206.7 8989.1 10201.4 11954.5 14922.3 16917.8 18598.4 1214.7 1622.6 2237.6 3073.3 3801.5 5146.9 7119.8
YY
NA 70.4 118.5 124.2 151.7 217.1 1991 1992 1993 1994 1995 1996
城乡居民人 民币储蓄存 国民总收 款年底余额 入 (GNI) (Y ) 21662.5 26651.9 34560.5 46670 57494.9 66850.5 9241.6 11759.4 15203.5 21518.8 29662.3 38520.8
第三节 虚拟变量的特殊应用
一、调整季节波动 例如,用季度数据分析某公司利润y与销售 收入x之间的相互关系时,为研究四个季度的季 节性影响,引入三个虚拟变量(设第1季度为基 础类型): 第i+1季度 i=1,2,3 1 Di 其他季度 0 利润函数可取为 : Yi=a+bxi+ α 1D1i+ α 2D2i + α 3D3i + ε i
计量经济学
第八章
虚拟变量回归
1
引子:男女大学生消费真有差异吗?
在对在校学生的消费行为进行的调查中,发现在校
生的消费行为呈现多元化的结构。人际交往消费、
手机类消费、衣着类消费、化妆品类消费、电脑类 消费、旅游类消费占有较大的比例;而食品类消费、 学习用品类消费不突显。 显然,男女生在消费上存在差异。为了了解男、女
二、检验模型结构的稳定性 设根据两个样本估计的回归模型分别为: 样本1: Yi=a1+b1xi +ε i 样本2: Yi=a2+b2xi +ε i 1 样本2 设置虚拟变量: D 0 样本1
估计模型:Yi=a1+b1xi+(a2-a1)Di+(b2-b1)XDi+ε 其中,XDi=xi*Di。
21
1 设虚拟变量为: D 0
三、分段回归
x>x* x<x*
分段回归模型设置成: Yi= a+bxi+β (xi-x*)Di+ε i 其中,x*是已知的临界水平(分段点)。 这样各段的函数为: Yi= a +bxi+ε i x<x* Yi= (a-β )+(b+β )xi+ε i x>x*
6
第二节 虚拟变量的设定
一、虚拟变量的引入方式 (1)加法方式 Yi=a+bxi+α Di+ε i a+α 等价为: 当Di =0时:Yi=a+bxi+ε i a 当Di =1时:Yi=(a+α )+bxi+ε i
D=1 α D=0
以加法方式引入,反映定性因素对截距的影响
(2)乘法方式
Yi=a+bxi+β XDi+ε i 其中:XDi=Xi*Di, 上式等价于: a 当Di =0时:Yi=a+bxi+ε i 当Di =1时:Yi=a+(b+β )xi+ε
1 农村居民 D1 0 城镇居民
城市低收入家庭 城市高收入家庭 农村低收入家庭 农村高收入家庭
1 高收入家庭 D2 0 低收入家庭
(D1=0,D2=0) (D1=0,D2=1) (D1=1,D2=0) (D1=1,D2=1)
这样可以反映各类居民家庭的住房消费情况:
思考:若是多因素、多个属性水平的问题,如何设置?
调整的R2值
26
第四节 案例分析
为了考察改革开放以来中国居民的储蓄存款与收 入的关系是否已发生变化,以城乡居民人民币储 蓄存款年底余额代表居民储蓄( Y ),以国民总
收入GNI代表城乡居民收入,分析居民收入对储
蓄存款影响的数量关系,并建立相应的计量经济
学模型 。
27
表8.1
国民总收入与居民储蓄存款
城乡居民 人民币储 年 蓄存款增 份 加额( )
单位:亿元
城乡居民 人民币储 蓄存款增 额 (YY) 2121.8 2517.8 3444.1 6315.3 8143.5 8858.5
年 份
城乡居民 国民总收 人民币储 蓄存款年 入 (GNI) 底余额 (Y) 3624.1 4038.2 4517.8 4860.3 5301.8 5957.4 210.6 281 399.5 532.7 675.4 892.5
1 D 0
政策紧缩
政策宽松
1 D 0
本科以上学历
本科以下学历
变量的划分应遵循穷举与互斥原则。
5
二、作用
⑴可以描述和测量定性因素的影响。
⑵能够正确反映经济变量之间的相互关系,提高模 型的精度。 ⑶便于处理异常数据。 即将异常数据作为一个特殊的定性因素
1 D 0
异常时期 正常时期
生的消费支出结构差异,应当如何建立模型?
面临的问题:如何把男女生这样的非数量变量引
入方程?
2
问题的一般性描述
在实际建模中,一些定性变量具有不可忽视的重要
影响。例如,研究某个企业的销售水平,产业属性
(制造业、零售业)、所有制(私营、非私营)、
地理位置(东、中、西部)、管理者的素质、不同
的收入水平等是值得考虑的重要影响因素,但这些 因素共同的特征是定性描述的。 如何对非定量因素进行回归分析? 采用“虚拟变量”对定性变量进行量化一种思路。
为比较两年的消费函数是否有显著差异,设置虚拟 变量: 1 1999年
D 0
1998年
并且合并两年的数据,估计以下模型: Yi= a1 +b1xi+α Di+β XDi +ε i 其中α =a2-a1 ,β =b2-b1。
24
使用EViews软件的估计过程如下: CREATE U 16 建立工作文件 DATA Y X (输入1998、1999年消费支出和收入的数据,1~8期 为1998年资料,9~16期为1999年资料) SMPL 1 8 样本期调为1998年
1978 1979 1980 1981 1982 1983
数据来源:《中国统计年鉴2004》,中国统计出版社。表中“城乡居民人民币 储蓄存款年增加额”为年鉴数值,与用年底余额计算的数值有差异。 28
表8.1
国民总收入与居民储蓄存款 (续)
城乡居 民人民 币储蓄 存款增 加额 (YY ) 322.2 407.9 615 835.7 728.2 1374.2 1923.4
使用虚拟变量能如 实描述不同阶段的 经济关系,又未减 少估计模型时样本 容量,保证了估计 精度。
22
四、混合回归 能否将变量的时序数据和横截面数据混合建模 【例】现有我国城镇居民1998年、1999年全年人均消 费支出和可支配收入的统计资料。试使用混合样本 数据估计我国城镇居民消费函数。 设1998年、1999年我国城镇居民消费函数分别为: 1998年:Yi=a1+b1xi +ε i 1999年:Yi=a2+b2xi +ε i
9
观察相关图
从相关图可以看出, 前3 个样本点与后 5 个样 本点存在较大差异,因 此,可设置虚拟变量反 映“收入层次”:
1 D 0
中高收入家庭 低收入家庭
10
将我国城镇居民的彩电需求函数设成: Yi=a+bxi+α Di+β XDi+ε i DATA D1 (由于D是EViews软件的保留字,所以将虚拟变量取 名为D1;另外,此时也可以用SMPL和GENR命令直 接生成D1变量) GENR XD=X*D1 生成变量XD LS Y C X D1 XD 估计需求函数 结果如下图所示:
1 本科 D1 0 其他
1 研究生 D2 0 其他
而将年薪模型取成(假设以加法方式引入):
Yi=a+bxi+α 1D1i+α 2D2i +ε 其等价于:
i
Yi=a+bxi+ε i Yi=(a+α 1)+ bxi+ε Yi=(a+α 2)+ bxi+ε
i i
大专以下(D1=D2=0) 本科(D1=1,D2=0) 研究生(D1=0,D2=1)
i
20
第(1)种情况下模型结构是稳定的, 利用t检验判断D、XD系数的显著性,得到四种 其余情况都表明模型结构不稳定。 重合回归检验结果: (1)a2=a1,b2=b1,两个回归模型没有显著差异。 (2)a2≠a1 ,b2=b1 ,两个回归模型之间的差异仅仅 平行回归 表现在截距上。 (3)a2=a1 ,b2≠b1 ,两个回归模型的截距相同,但 汇合回归 斜率存在显著差异。 (4)a2≠a1,b2≠b1,表明两个回归模型完全不同。 相异回归
年 份
国民总收入 (GNI)
城乡居民人 民币储蓄存 款年底余额 (Y )
1984 1985 1986 1987 1988 1989 1990
1997 1998 1999 2000 2001 2002 2003
73142.7 76967.2 80579.4 88254 95727.9 103935.3 116603.2
相关文档
最新文档