(精品)第五章-虚拟变量模型和滞后变量模型

(精品)第五章-虚拟变量模型和滞后变量模型
(精品)第五章-虚拟变量模型和滞后变量模型

第五章虚拟变量模型

1.表5.1中给出了中国1980—2001年以城乡储蓄存款新增额代表的居民当年储蓄及以GNP 代表的居民当年收入的数据。以1991年为界,判断1991年前和1991年后的两个时期中国居民的储蓄—收入关系是否已发生变化。

年份储蓄S GNP 年份储蓄S GNP 1980 118.5 4517.8 1991 2072.8 21662.5 1981 124.2 4860.3 1992 2438.4 26651.9 1982 151.7 5301.8 1993 3217 34560.5 1983 217.1 5957.4 1994 6756.4 46670 1984 322.2 7206.7 1995 8143.5 57494.9 1985 407.9 8989.1 1996 8858.5 66850.5 1986 615 10201.4 1997 7759 73142.7 1987 835.7 11954.5 1998 7127.7 76967.2 1988 728.2 14922.3 1999 6214.3 80579.4 1989 1345.4 16917.8 2000 4710.6 88228.1 1990 1887.3 18598.4 2001 9430 94346.4 估计以下回归模型:

0123

()

i i i i i i

Y X D D X u

ββββ

=++++

其中

i

D为引入的虚拟变量:

1,1991

0,1991

i

D

?

=?

?

年前

年后

对上面的模型进行估计,结果如下:

所以表达式为:

15350.0751981.90.032()i i i i i Y X D D X =+-+

(1.40) (4.45) (-1.38) (0.37)

从2β和3β的t 检验值可以知道,这两个参数显著的为0,所以1991年前和1991年后两个时期的回归结果是相同的。

下面用邹式检验来验证上面对于两个时期的回归结果相同的结论是否正确。

过程如下:

输入要验证的突变点,本例为1991年。

输出结果如下:

从伴随概率值可以看出,邹式检验的结果是接受原假设,即方程结构没有发生变化,1991年不是突变点。与设定虚拟变量的结果是一样的。

y,万吨)。

1.表4是1982:1—1985:4中国季度酒销量(

t

画序列图如下

得到序列图如下:

这是一个季节时间序列数据,呈明显的季节变化特征,通过加入季节虚拟变量来描述季节特征建立模型。

表4 全国酒销量(t y ,万吨) 季节数据 年月 Y D1 D2 D3 1982:1 92.7 1 0 0 1982:2 79.3 0 1 0 1982:3 80.1 0 0 1 1982:4 86.7 0 0 0 1983:1 104.1 1 0 0 1983:2 89.7 0 1 0 1983:3 90.2 0 0 1 1983:4 90.2 0 0 0 1984:1 107.9 1 0 0 1984:2 96.7 0 1 0 1984:3 97.8 0 0 1 1984:4 93.6 0 0 0 1985:1 111.5 1 0 0 1985:2 98.4 0 1 0 1985:3 97.7 0 0 1 1985:4 94

定义虚拟变量

1,1,1,1230,0,0,t t t D D D t t t ===???===???

≠≠≠???第一季度第二季度第三季度

,,第一季度第二季度第三季度

Eviews 操作如下

按上述过程依次定义D2和D3。

定义过虚拟变量后,建立模型,进行估计。

得到输出结果如下:

有上面的输出结果可以看出,D2和D3的相伴概率分别为0.3020和0.4939,可知,D2和D3的回归参数并不显著,所以从模型中剔除虚拟变量D2和D3。

重新进行参数估计:

得到如下输出结果:

相应估计式为:

80.94 1.2815.421t y t D =++

(48.5) (7.3) (8.3)

20.89,52,0.8R F DW ===

1982年第二季度令t=1。对于这组数据,只把第一季度区别于其他3个季度就可以了。

2. 表5.2给出了总过电力基本建设投资X 与发电量Y 的相关资料,拟建立一多项式分布滞

后模型来考察两者的关系。

表5.2 中国电力工业基本建设投资与发电量

年份 基本建设投资(亿元)X 发电量(亿千瓦时)Y 年份 基本建设投资(亿元)X 发电量(亿千

瓦时)Y

1975 30.65 1958 1986 161.6 4495 1976 39.98 2031 1987 210.88 4973 1977 34.72 2234 1988 249.73 5452 1978 50.91 2566 1989 267.85 5848 1979 50.99 2820 1990 334.55 6212 1980 48.14 3006 1991 377.75 6775 1981 40.14 3093 1992 489.69 7539 1982 46.23 3277 1993 675.13 8395 1983 57.46 3514 1994 1033.42 9218 1984 76.99 3770 1995 1124.15 10070 1985 107.86 4107

由于无法预知电力行业基本建设投资对发电量影响的时滞期,需取不同的滞后期试算。经过试算发现,在2阶阿尔蒙多项式变换下,滞后期数取到第6期,估计结果的经济意义比较合理。

估计过程如下:

输出结果如下:

输出结果的下边部分给出了分布滞后模型的各滞后期的参数。 最后得到分布滞后模型估计式为:

1234563319.50.323 1.777 2.69 3.061 2.891 2.180.927t t t t t t t t Y X X X X X X X ------=+++++++

(13.62) (0.19) (2.14) (1.88) (1.86) (1.96) (1.1) (0.24)

3.表5.3给出了中国1978—2000年按当年价测度的GDP与居民消费CONS数据,检验两

者的因果关系。

表5.3 中国GDP与消费支出单位:亿元年份CONS GDP 年份CONS GDP 1978 1759.100 3605.600 1990 9113.200 18319.50 1979 2005.400 4074.000 1991 10315.90 21280.40 1980 2317.100 4551.300 1992 12459.80 25863.70 1981 2604.100 4901.400 1993 15682.40 34500.70 1982 2867.900 5489.200 1994 20809.80 46690.70 1983 3182.500 6076.300 1995 26944.50 58510.50 1984 3674.500 7164.400 1996 32152.30 68330.40 1985 4589.000 8792.100 1997 34854.60 74894.20 1986 5175.000 10132.80 1998 36921.10 79003.30 1987 5961.200 11784.70 1999 39334.40 82673.10 1988 7633.100 14704.00 2000 42911.90 89112.50 1989 8523.500 16466.00

取两阶滞后,过程如下:

输入要检验的变量。

输入滞后阶数。

输出结果如下:

从上面的输出结果可以看出,根据伴随概率值知道,在5%的显著水平下:

拒绝GDP不是CONS的格兰杰检验,即GDP是CONS的格兰杰检验。

接受CONS不是GDP的格兰杰检验。

4.以深圳成指(SZ)和上海综指(SH)序列为例进行非因果性检验步骤。1999年1月4

日—2001年10月15日深圳成指(SZ)和上海综指(SH)序列如下图:

进行格兰杰检验,过程如下:

建立工作文件,打开数据租窗口。

输入滞后期,本例选择滞后5期

得到如下结果:

对上述分析结果进行分析:

由对应的概率可以看出:

接受“上海综指不是深圳成指变化的原因”的假设;拒绝“深圳成指不是上海综指变化的原因”,即深圳成指是上海综指变化的原因。

分别进行滞后5,10,15,20,25期的检验,均得到上述结论。

5.已知1970—1991年美国制造业固定厂房设备投资Y和销售量X的相关数据如表5.4所

示。

(1)假定销售量对厂房设备支出有一个分部滞后效应,使用4期滞后和2次多项式去估计此分布滞后模型。

(2)检验销售量与厂房设备支出的Granger因果关系,使用直至6期为止的滞后并评述结果。

表5.4 单位:10亿美元年份厂房开支Y 销售额X 年份厂房开支Y 销售额X 1970 36.99 52.805 1981 128.68 168.129 1971 33.6 55.906 1982 123.97 163.351 1972 35.42 63.027 1983 117.35 172.547 1973 42.35 72.931 1984 139.61 190.682 1974 52.48 84.79 1985 152.88 194.538 1975 53.66 86.589 1986 137.95 194.657 1976 68.53 98.797 1987 141.06 206.326 1977 67.48 113.201 1988 163.45 223.547 1978 78.13 126.905 1989 183.8 232.724 1979 95.13 143.936 1990 192.61 239.459 1980 112.6 154.391 1991 182.81 235.142

估计分布滞后模型,过程如下:

估计结果如下:

对应的分布滞后模型的表达式为:

123430.830.830.320.010.160.11t t t t t t Y X X X X X ----=-++---

做格兰杰检验,以一阶滞后为例,过程如下:

结果如下:

从上面F检验的伴随概率值可以知道,X与Y互为因果关系。

按上述过程分别做从1直到6期滞后的Granger因果关系检验,结果分别如下:2阶:

3阶:

4阶:

5阶:

6阶:

从上述结果可以看出,随着滞后期的增加,Y月X的Granger因果关系有所变化。在不超过4期滞后的检验中,两者互为因果关系;而滞后期为5和6的检验结果说明,两者不互为因果关系。

第七章 虚拟变量

第七章虚拟变量 第一节虚拟变量的引入 一、什么是虚拟变量 前面几章介绍的解释变量都是可以直接度量的,称为定量变量。如收入、支出、价格、资金等等。但在现实经济生活中,影响应变量变动的因素,除了这些可以直接获得实际观测数据的定量变量外,还包括一些无法定量的解释变量的影响,如性别、民族、国籍、职业、文化程度、政府经济政策变动等因素,他们只表示某种特征的存在与不存在,所以称为属性变量或定性变量。 属性变量:不能精确计量的说明某种属性或状态的定性变量。 在计量经济模型中,应当包含属性变量对应变量的影响作用。那怎么才能把定性变量包括在模型中呢?属性变量通常是非数值变量,直接纳入回归方程中进行回归,显然是很困难的。为此,人们采取了一种构造人工变量的方法,将这些定性变量进行量化,使其能与定量变量一样在回归模型中得以应用。 由于定性变量通常是表明某种特征或属性是否存在,如性别变量中以男性为分析基础的话,那就只有男性、非男性;政策变动变量中以政策不变为基准,则有政策不变,和政策变动;至于有两种以上的状态的话,比如学历分高中,本科,本科以上等等,我们又怎么办呢?把疑问留到后面去解决。既然定性变量只有存在或不存在两种状态,所以量化的一般方法是取值为0或1。称为虚拟变量。 虚拟变量:人工构造的取值为0或1的作为属性变量代表的变量。一般常用D表示。 D=0,表示某种属性或状态不存在D=1,表示某种属性或状态存在 比如前面说的性别变量,以男性为基准,则当样本为男性时,虚拟变量取0,当样本为女性时,则虚拟变量取1。 当虚拟变量作为解释变量引入计量经济模型时,对其回归系数的估计和统计检验方法都与定量解释变量相同。 二、虚拟变量的作用 1、作为属性因素的代表,如,性别、种族等 2、作为某些非精确计量的数量因素的代表,如:受教育程度、年龄段等; 3、作为某些偶然因素或政策因素的代表,如战争、911等。 4、时间序列分析中作为季节(月份)的代表(比如对某些明显有淡季、旺季之分的产品) 5、分段回归,研究斜率、截距的变动; 6、比较两个回归模型; 7、虚拟应变量概率模型,应变量本身是定性变量(比如你研究某产品的购买率,应变量本 身就是买或不买) 三、虚拟变量的设置规则 1、虚拟变量D取值为0,还是取值为1,要根据研究的目的决定。D取值为0的类型,是基础类型,是比较的基准。不如前面说的性别变量,如果你研究是以男性为研究基准,则样本为男性,D取值为0, 2、避免落入“虚拟变量陷阱”。 当一个定性变量含有m个相互排斥的类型时,应向模型引入m—1个虚拟变量。比如“性别”含男性和女性两个类别,所以当性别作为解释变量时,应向模型引入一个虚拟变量。取值方式是:D=1(男性)、D=0(女性)或D=0(男性)、D=1(女性) 而当“学历”含有四个类别时,即大学、中学、小学、无学历。当“学历”作为解释变量时,应向模型引入三个虚拟变量。一种取值方式是: 1 (大学)1(中学)1(小学) D1= 0 (非大学)D2 = 0(非中学)D3= 0(非小学) 所谓的“虚拟变量陷阱”就是当一个定性变量含有m个类别时,模型引入m个虚拟变量,造成了虚拟变量之间产生完全多重共线性,无法估计回归参数。 在m-1个虚拟变量中,虚拟变量可以同时取值为0,但不能全部取值为1。 3、当定性变量含有m个类别时,不能把虚拟变量的值设为D=0(第一类)D=1(二类)D=2(三类)等等。

第八章虚拟变量参考答案

练习题8.1参考解答: (1)在其它条件不变的情况下,对数人均收入提高1%,则平均预期寿命可能提高约0.0939年。但从统计检验结果看,对数人均收入lnX 对期望寿命Y 的影响并不显著。方程的拟合情况良好,可进一步进行多重共线性等其他计量经济学的检验。 (2)引入()ln 7i i D X -的原因是想从截距和斜率两个方面考证将人均收入超过1097美元的国家定义为富国的话,贫国和富国的预期寿命是否存在显著的区别。 如果人均收入大于1097美元,那么虚拟变量取值为1,否则为0。即: 1 1097 (l n ()7)0 1097 i i D X ?-=??人均收入大于美元人均收入低于 美元 (3) 对于贫穷国,其回归方程为: 2.409.39ln i X -+ 对于富国,其回归方程为: 2.40(9.39- 3.36)ln 3.36*721.12 6.03ln i i X X -++=+ 习题8.2参考答案 由于有四个季度,因此引入三个季度虚拟变量 1 1 1 1220 0 0 D D D ???===??????一季度二季度三季度其它其它其它 (1)按照加法模型引入三个虚拟变量,模型为:(加法模型的作用是改变了设定模型的截距 水平) i 0112233i i Y =D D D X ααααβμ+++++ 回归结果如下: 123i 22?=6910.449187.7317D 1169.32D 417.1182D 0.038008X t= (3.594792) (-0.28439 (1.835446) 065093256914 R =0.517642 R =0.416093 F=5.097454 DW=0.39625 i Y -+-+)(-.) (.) (2)由于考虑利润对销售额的变化率发生变异,即斜率的改变,因此按照乘法模型引入三 个虚拟变量,模型为: i 01i 1i 12i 23i 3i Y =X X D X D X D ββαααμ+++++ 回归结果如下: i i 1i 2i 322?=7014.7570.037068X -0.000933X D 0.00791X D 0.002385X D t= (3.934394) (3.273896 (-0.216776) 0.0040180.58529 R =0.519733 R =0.418624 F=5.140311 DW=0.429628 i Y ++--)() () (3)按照加法和乘法相结合的方式引入三个虚拟变量,模型为: i 01122331i 2i 13i 24i 3i Y =D D D X X D X D X D ααααββββμ++++++++ 回归结果为: i 123i i 1i 2i 322?Y =10457.394752.26D 3764.21D 4635.46D 0.0159X 0.029X D 0.03X D 0.0266X D t= (2.566) (-0.87 (-0.6860.8320.6280824089960749 R =0.546701 R =0.348383 F=2---++++-)) () () (.) (.)(.).756686 DW=0.464982

计量经济学第七章第5,6,7题答案

第7章练习5 解:根据Eview 软件得如下表: Dependent Variable: Y Method: ML - Binary Logit (Quadratic hill climbing) Date: 05/22/11 Time: 22:19 Sample: 1 16 Included observations: 16 Convergence achieved after 5 iterations Covariance matrix computed using second derivatives Variable Coefficient Std. Error z-Statistic Prob.?? C Q V McFadden R-squared ????Mean dependent var . dependent var ????. of regression Akaike info criterion ????Sum squared resid Schwarz criterion ????Log likelihood Hannan-Quinn criter. ????Restr. log likelihood LR statistic ????Avg. log likelihood Prob(LR statistic) Obs with Dep=0 7 ?????Total obs 16 Obs with Dep=1 9 于是,我们可得到Logit 模型为: V Q i 0177.0004.0107.11Y ?++-= () () () 685.40R 2 MCF = , LR(2)= 如果在Binary estination 这一栏中选择Probit 估计方法,可得到如下表:

第7章滞后变量习题

第七章 滞后变量模型 一.单项选择题 1.下列属于有限分布滞后模型的是( )。 A.u y b y b x b y t t t t t a +++++=-- 22110 B.u y b y b y b x b y t k t k t t t t a ++++++=--- 22110 C.u x b x b y t t t t a ++++=- 110 D.u x b x b x b y t k t k t t t a +++++=-- 110 2.消费函数模型t C ? =400+0.5I t +0.3I t-1+0.1I t-2,其中I 为收入,则当期收入I t 对未来消费C t+2的影响是:I 增加一单位,C t+2增加( )。 A.0.5单位 B.0.3单位 C.0.1单位 D.0.9单位 3.在分布滞后模型u x b x b x b y t k t k t t t +++++=-- 110α中,延期过渡性乘数( )。 A.b 0 B.b i (i=1,2,…,k) C.∑=k i i b 1 D.∑=k i i b 0 4.在分布滞后模型的估计中,使用时间序列资料可能存在的序列相关问题就表现为( )。 A.异方差问题 B.自相关问题 C.多重共线性问题 D.随机解释变量问题 5.有限多项式分布滞后模型中,通过将原分布滞后模型中的参数表示为滞后期i 的有限多项式,从而克服了原分布滞后模型估计中的( )。 A. 异方差问题 B.序列相关问题 C. 多重共线性问题 D. 由于包含无穷多个参数从而不可能被估计的问题 6.在分布滞后模型Y t =α+β0X t +β1X t-1+β2X t-2+…+u t 中,短期影响乘数为( ). A .αβ-11 B.1β C.αβ-11 D. β 6.对于有限分布滞后模型 t s t s t t t t u X X X X Y ++++++=---ββββα 22110 在一定条件下,参数 i β可近似用一个关于i 的多项式表示(i=0,1,2……k ),其中多项 式的阶数m 必须满足( ) A .k m < B.k m = C.k m > D.k m ≥ 7.自适应预期模型基于如下的理论假设:影响被解释变量t Y 的因素不是t X ,而是关于t X

第七章_虚拟变量

虚拟变量(dummy variable ) 在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。这些因素也应该包括在模型中。 由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。这种变量称作虚拟变量,用D 表示。虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。 1.截距移动 设有模型, y t = β0 + β1 x t + β2D + u t , 其中y t ,x t 为定量变量;D 为定性变量。当D = 0 或1时,上述模型可表达为, β0 + β1x t + u t , (D = 0) y t = (β0 + β2) + β1x t + u t , (D = 1) 20 40 60 20 40 60X Y 图8.1 测量截距不同 D = 1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若β2显著不为零,说明截距不同;若β2为零,说明这种分类无显著性差异。 例:中国成年人体重y (kg )与身高x (cm )的回归关系如下: –105 + x D = 1 (男) y = - 100 + x - 5D = – 100 + x D = 0 (女) 注意: ① 若定性变量含有m 个类别,应引入m -1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummy variable trap )。 ② 关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。 ③ 定性变量中取值为0所对应的类别称作基础类别(base category )。 ④ 对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。如: 1 (大学) D = 0 (中学) -1 (小学)。 β0 β0+β2 D = 1 D =0

第五讲 虚拟变量模型

第七讲 经典单方程计量经济学模型:专门问题 虚拟变量模型 学习目标: 教学基本内容 虚拟变量 许多经济变量是可以定量度量,例如:商品需求量、价格、收入、产量等; 但有一些影响经济变量的因素是无法定量度量。 例如:职业、性别对收入的影响, 战争、自然灾害对 GDP 勺影响,季节对某些产品(如冷饮)销售的影响等。 定性变量:把职业、性别这样无法定量度量的变量称为定性变量。 定量变量:把价格、 收入、 销售额这样可以可以定量度量的变量称为定量变 量。 为了能够在模型中能够反映这些因素的影响, 型的功能,需要将它们“量化”。 这种“量化” 来完成的。 根据这些因素的属性类型, 构造只取 称为虚拟变量( dummy variables ) ,记为 D 。 例如:反映性别的虚拟变量 D 1;男 0;女 1; 本科学历 反映文化程度的虚拟变量 D 0;1非;本本科科学学历历 一般地,基础类型和肯定类型取值为 1;比较类型和否定类型取值为 0。 二、 虚拟变量的设置原则 设置原则: 每一定性变量(qualitative variable )所需的虚拟变量个数要比该定性变量的状 态类别数(categories 少1。即如果有m 种状态,只在模型中引入m-1个虚拟变量。 例如,冷饮的销售量会受到季节变化的影响。季节定性变量有春、夏、秋、 冬 4 种状态,只需要设置 3 个虚拟变量: 1. 2. 3. 4. 了解什么是虚拟变量以及什么是虚拟变量模型; 理解虚拟变量的设置原则; 掌握虚拟变量模型的两种基本引入方式(加法方式和乘法方式) 能够自行设计虚拟变量模型,并能够解释其中蕴含的经济意义; 提高模型的精度, 拓展回归模 通常是通过引入“虚拟变量” 0”或“1”的人工变量, 通常 虚拟变量只作为解释变量。

第7章分布滞后模型与自回归模型多重共线性.doc

计量经济学课程教案

第7章 分布滞后模型与自回归模型 7.1 滞后效应与滞后变量模型 在经济运行过程中,广泛存在时间滞后效应。某些经济变量不仅受到同期各种因素的影响,而且也受到过去某些时期的各种因素甚至自身的过去值的影响。 通常把这种过去时期的,具有滞后作用的变量叫做滞后变量(Lagged Variable ),含有滞后变量的模型称为滞后变量模型。 滞后变量模型考虑了时间因素的作用,使静态分析的问题有可能成为动态分析。含有滞后解释变量的模型,又称动态模型(Dynamical Model )。 一、滞后效应与与产生滞后效应的原因 因变量受到自身或另一解释变量的前几期值影响的现象称为滞后效应。 表示前几期值的变量称为滞后变量。 如:消费函数 通常认为,本期的消费除了受本期的收入影响之外,还受前1期,或前2期收入的影响: C t =β0+β1Y t +β2Y t-1+β3Y t-2+μt Y t-1,Y t-2为滞后变量。 产生滞后效应的原因 1、心理因素:人们的心理定势,行为方式滞后于经济形势的变化,如中彩票的人不可能很快改变其生活方式。 2、技术原因:如当年的产出在某种程度上依赖于过去若干期内投资形成的固定资产。 3、制度原因:如定期存款到期才能提取,造成了它对社会购买力的影响具有滞后性。 二、滞后变量模型 以滞后变量作为解释变量,就得到滞后变量模型。它的一般形式为: q ,s :滞后时间间隔 自回归分布滞后模型(autoregressive distributed lag model, ADL ):既含有Y 对自身滞后变量的回归,还包括着X 分布在不同时期的滞后变量 有限自回归分布滞后模型:滞后期长度有限 无限自回归分布滞后模型:滞后期无限, (1)分布滞后模型(distributed-lag model ) 分布滞后模型:模型中没有滞后被解释变量,仅有解释变量X 的当期值及其若干期的滞后值: β0:短期(short-run)或即期乘数(impact multiplier),表示本期X 变化一单位对Y 平均值的影响程度。 βi (i=1,2…,s):动态乘数或延迟系数,表示各滞后期X 的变动对Y 平均值影响的大小。 称为长期(long-run )或均衡乘数(total distributed-lag multiplier ),表示X 变动一 个单位,由于滞后效应而形成的对Y 平均值总影响的大小。 如果各期的X 值保持不变,则X 与Y 间的长期或均衡关系即为: X Y E s i i )()(0 ∑=+=βα∑=s i i 0β t i t i s i t X Y μβα++=-=∑0 t s t s t t q t q t t t X X X Y Y Y Y μαααββββ+++++++++=-----ΛΛ11022110

第八章 虚拟变量回归 思考题

第八章 虚拟变量回归 思考题 8.1 什么是虚拟变量 ? 它在模型中有什么作用 ? 8.2 虚拟变量为何只选 0 、 1, 选 2 、 3 、 4 行吗 ? 为什么 ? 8.3 对 (8.10) 式的模型 , 如果选择一个虚拟变量 1,01D ?? =??-? 大专及大专以上,高中,高中以下 这样的设置方式隐含了什么假定 ? 这一假定合理吗 ? 8.4 引入虚拟解释变量的两种基本方式是什么 ? 它们各适用于什么情况 ? 8.5 四种加法方式引入虚拟变量会产生什么效应? 8.6 引入虚拟被解释变量的背景是什么?含有虚拟被解释变量模型的估计方法有哪些 ? 8.7 设服装消费函数为 12233t i i i i Y D D X u αααβ=++++ 其中,i X =收入水平 ;Y = 年服装消费支出 ; 1,30D ?=? ?大专及大学以上 ,其他 ;1,20D ?=??女性,其他 试写出不同人群组的服装消费函数模型。 8.8 利用月度数据资料 ,为了检验下面的假设,应引入多少个虚拟解释变量 ? 1) 一年里的 12 个月全部表现出季节模式 ; 2) 只有 2 月、 6 月、 8 月、 10 月和 12 月表现出季节模式。 练习题 8.1 1971 年 ,Sen 和 Sztvastava 在研究贫富国之间期望寿命的差异时 , 利用 101 个国家的数据 , 建立了如下回归模型 []? 2.409.39ln 3.36(ln 7)i i i i Y X D X =-+-- (4.37)(0.857)(2.42) R2=0.752 其中 ,X 是以美元计的人均收入 ;Y 是以年计的期望寿命 ; Sen 和 Srimstava 认为人均收入的临界值为 1097 美元 (ln1097=7), 若人均收入超过 1097 美元 , 则被认定为富国 ; 若人均收入低于1097美元 , 被认定为贫穷国。括号内的数值为对应参数估计值的t 值。 1) 解释这些计算结果。 2) 回归方程中引入(ln 7)i i D X =-的原因是什么?如何解释这个回归解释变量? 3) 如何对贫穷国进行回归 ? 又如何对富国进行回归 ? 4)这个回归结果中可得到的一般结论是什么 ?

第7章滞后变量习题

1 第七章 滞后变量模型 一.单项选择题 1.下列属于有限分布滞后模型的是( )。 A.u y b y b x b y t t t t t a +++++=--Λ22110 B.u y b y b y b x b y t k t k t t t t a ++++++=---Λ22110 C.u x b x b y t t t t a ++++=-Λ110 D. u x b x b x b y t k t k t t t a +++++=--Λ110 2.消费函数模型t C ? =400+0.5I t +0.3I t-1+0.1I t-2,其中I 为收入,则当期收入I t 对未来消费 C t+2的影响是:I 增加一单位,C t+2增加( )。 3.在分布滞后模型 u x b x b x b y t k t k t t t +++++=--Λ110α中,延期过渡性乘数( )。 A.b 0 B.b i (i=1,2,…,k) C.∑=k i i b 1 D.∑=k i i b 0 4.在分布滞后模型的估计中,使用时间序列资料可能存在的序列相关问题就表现为( )。 A.异方差问题 B.自相关问题 C.多重共线性问题 D.随机解释变量问题 5.有限多项式分布滞后模型中,通过将原分布滞后模型中的参数表示为滞后期i 的有限多项式,从而克服了原分布滞后模型估计中的( )。 A. 异方差问题 B.序列相关问题 C. 多重共线性问题 D.由于包含无穷多个参数从而不可能被估计的问题 6.在分布滞后模型Y t =α+β0X t +β1X t-1+β2X t-2+…+u t 中,短期影响乘数为( ). A .αβ-11 B.1β C.αβ-11 D.0β 6.对于有限分布滞后模型 t s t s t t t t u X X X X Y ++++++=---ββββαΛ22110 在一定条件下,参数 i β可近似用一个关于i 的多项式表示(i=0,1,2……k ),其中多项 式的阶数m 必须满足( ) A .k m < B.k m = C.k m > D.k m ≥ 7.自适应预期模型基于如下的理论假设:影响被解释变量t Y 的因素不是t X ,而是关于t X

第8章 滞后变量模型

第8章 滞后变量模型 8.1 滞后变量的基本概念 8.1.1 滞后现象和产生滞后现象的原因 很多情况下,解释变量与因变量的因果关系不可能同时发生,在这一过程中通常都有时间滞后,也就是说,解释变量需要通过一段时间后才能作用于因变量。同时,由于经济活动的连续性,因变量的当前变化也往往受到自身过去取值的影响。这种因变量受其自身或其它经济变量前期水平的影响,称为滞后现象。产生滞后现象的原因比较复杂,可以归结为以下几个方面: 1.经济变量自身的原因 有些变量的发展变化有很强的继往性,当期水平与前期水平有极为密切的关系。 2.决策者心理上的原因 3.技术上的原因 随着技术的进步、需求的改变和供求关系的变化,经济变量的影响因素亦随之发生改变。但由于技术上的原因,这种改变要经历一个过程,而不可能即期实现。 4.制度的原因 在现代社会,经济活动都是在一定制度背景下进行的,且存在众多的契约关系。这种制度及契约在一定时期内,对经济活动和资源、要素有较强的“锁定功能”,使它们的作用表现出滞后的特征。这些情况表明,当一种变量发生变化时,另一个变量由于制度方面的原因,需要经过一定时期才能做出相应的变动,从而形成滞后现象。 8.1.2 滞后变量和滞后变量模型 所谓滞后变量是指过去时期的、对当期变量产生影响的变量。滞后变量可分为滞后解释变量和滞后因变量两类。把滞后变量引入模型,这种回归模型称为滞后变量模型。在经济分析中,运用滞后变量模型可以使不同时期的经济现象彼此联系起来,同时也将经济活动的静态分析转化为动态分析,使模型更符合实际经济的运行状况。 滞后模型的一般形式为: 01111t t t k t k t p t p t y a b x b x b x y y u λλ----=++++++++ 滞后模型根据其滞后变量的类型分为分布滞后模型和自回归模型;根据其滞后的长度分为有限滞后模型和无限滞后模型。 1.分布滞后模型 如果滞后变量模型中没有滞后因变量,因变量受解释变量的影响只分布在解释变量不同时期的滞后值上,称为分布滞后模型(distributed lag model )。模型结构如下:

第五章-含虚拟变量的回归模型

Econometrics 第五章虚拟变量回归模型(教材第六章)

第五章虚拟变量回归模型 第一节虚拟变量的性质和引入的意义 第二节虚拟变量的引入 第三节交互作用效应 第四节含虚拟变量的回归模型 学习要点 虚拟变量的性质,虚拟变量的设定

5.1 虚拟变量的性质和引入的意义 虚拟变量的性质 f定性变量 性别(男,女) 婚姻状况(已婚,未婚) 受教育程度(高等教育,其他) 收入水平(高收入,中低收入) 肤色(白人,有色人种) 政治状况(和平时期,战争时期) f引入虚拟变量(Dummy Variables)

1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响,剔除不可比的“文革”因素。 2、检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。 3、提高模型的精度,相当与将不同属性的样本合并,扩大了样本量,从而提高了估计精度)。 5.1 虚拟变量的性质和引入的意义

5.2 虚拟变量的引入 虚变量引入的方式主要有两种 f加法方式 虚拟变量与其它解释变量在模型中是相加关系,称为虚拟 变量的加法引入方式。 加法引入方式引起截距变动

5.2 虚拟变量的引入 f 虚拟变量的作用在于把定性变量“定量化”:通过赋值0和1,0表示变量不具备某种性质,1表示具备。 f 例,0代表男性,1代表女性;0代表未婚,1代表已婚;等等。 f 这类取值为0和1的变量称为虚拟变量(dummy variables ),通常用符号D 表示。 f 事实上,模型可以只包括虚拟变量(ANOVA 模型): 其中,0,1,i i D D ==男性;女性。 12i i i Y B B D u =++

第七章 虚拟变量回归

第七章 虚拟变量回归 第一节 虚拟变量的性质 在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、政府的更迭(工党-保守党)、经济体制的改革、固定汇率变为浮动汇率、从战时经济转为和平时期经济等。这些因素也应该包括在模型中。 一、基本概念 由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。这种变量称作虚拟变量(dummy variable )。虚拟变量也称:哑元变量、定性变量等等。通常用字母D 或DUM 加以表示(英文中虚拟或者哑元Dummy 的缩写)。 用1表示具有某一“品质”或属性,用0表示不具有该“品质”或属性。 虚拟变量使得我们可以将那些无法定量化的变量引入回归模型中。 虚拟变量应用于模型中,对其回归系数的估计与检验方法和定量变量相同。 虚拟变量表示两分性质,即“是”或“否”,“男”或“女”等。 下面给出几个可以引入虚拟变量的例子。 例1:你在研究学历和收入之间的关系,在你的样本中,既有女性又有男性,你打算研究在此关系中,性别是否会导致差别。 例2:你在研究某省家庭收入和支出的关系,采集的样本中既包括农村家庭,又包括城镇家庭,你打算研究二者的差别。 例3:你在研究通货膨胀的决定因素,在你的观测期中,有些年份政府实行了一项收入政策。你想检验该政策是否对通货膨胀产生影响。 上述各例都可以用两种方法来解决,一种解决方法是分别进行两类情况的回归,然后看参数是否不同。另一种方法是用全部观测值作单一回归,将定性因素的影响用虚拟变量引入模型。 二、虚拟变量设置规则 虚拟变量的设置规则涉及三个方面: 1.“0”和“1”选取原则 虚拟变量取“1”或“0”的原则,应从分析问题的目的出发予以界定。 从理论上讲,虚拟变量取“0”值通常代表比较的基础类型;而虚拟变量取“1”值通常代表被比较的类型。 “0”代表基期(比较的基础,参照物);“1”代表报告期(被比较的效应)。 例如,比较收入时考察性别的作用。当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故有男性为“1”,女性为“0”。 2.属性(状态、水平)因素与设置虚拟变量数量的关系 定性因素的属性既可能为两种状态,也可能为多种状态。例如,性别(男、女两种)、季节(4种状态),地理位置(东、中、西部),行业归属,所有制,收入的分组等。 虚拟变量数量的设置规则 1.若定性因素具有 m (m ≥2) 个相互排斥属性(或几个水平),当回归模型有截距项时,只能引入m 个虚拟变量; 2.当回归模型无截距项时,则可引入m 个虚拟变量;否则,就会陷入“虚拟变量陷阱”。 (0,1) (0,0)D D ????? 12(1,0)天气阴如:(,)=天气雨其 他

第九章 滞后变量模型

第九章 滞后变量模型 一. 单项选择题 1.下列属于有限分布滞后模型的是( )。 A. t t t t t u Y b Y b X b Y +++++=-- 22110α B. t t t t u X b X b Y ++++=- 110α C. t k t k t t t t u Y b Y b Y b X b Y ++++++=--- 22110α D. t k t k t t t t u X b X b X b X b Y ++++++=--- 22110α 2.消费函数模型2 11.03.05.0400?--+++=t t t t I I I C ,其中I 为收入,则当期收入I t 对未来消费C t+2的影响是:I 增加1单位,C t+2增加( )。 A. 0.5单位; B. 0.3单位 C. 0.1单位; D. 0.9单位 3.在分布滞后模型t k t k t t t t u X b X b X b X b Y ++++++=--- 22110α中,长期乘数为( )。 A.0b B. i b (i=1,2,…,k) C. ∑=k i i b 1 D. ∑=k i i b 4.在分布滞后模型的估计中,使用时间序列资料可能存在的序列相关问题就表现为( )。 A.异方差问题 B.自相关问题 C.多重共线性问题 D.随机解释变量问题 5.对于有限分布滞后模型t k t k t t t t u X b X b X b X b Y ++++++=--- 22110α中,如果其参数i b (i=1,2,…, k) 可以近似地用一个关于滞后长度i (i=1,2,…,k) 的多项式表示,则称此模型为( )。 A.有限多项式滞后模型 B.无限多项式滞后模型 C.考伊克变换模型 D.自适应预期模型 6.自适应预期模型基于如下的理论假设:影响被解释变量Y t 的因素不是X t,而是关于X 的预期*1+t X ,且预期*1+t X 形成的过程是*1+t X -* t X =)(*1+-t t X X γ,其中0<γ<1,γ被称为( )。

第九章 含虚拟变量的回归模型

第九章含虚拟变量的回归模型 目前为止,在已学习的线性回归模型中,解释变量X都是定量变量。但有时候,解释变量是定性变量。 9.1 虚拟变量的性质 通常在回归分析中,应变量不仅受一些定量变量的影响,还受一些定性变量的影响(性别、种族、肤色、宗教、民族、罢工、政团关系、婚姻状况)。 如: 美国黑人的收入比相应的白人的收入低。 女学生的S.A.T.的数学平均分数比相应的男生低。 定性变量通常表明了具备或不具备某种性质,比如,男性或女性,黑人或白人,佛教徒或非佛教徒,本国公民或非本国公民。 把定性因素“定量化”的一个方法是建立人工变量,并赋值0和1,0表示变量不具备某种属性,1表示变量具备某种属性,该变量称为虚拟变量(dummy variable),用符号D表示。 虚拟变量一样可用于回归分析,一个回归模型的解释变量可以仅仅是虚拟变量,称为方差分析模型( ANOVA )。

Yi = B1 + B2Di + ui ( 9 - 1 ) 其中Y = 初职年薪 Di =1,大学毕业 =0,非大学毕业 假定随机扰动项满足古典线性回归模型的基本假定,根据模型( 9 - 1 )得到: 非大学毕业生的初职年薪的期望为: E(Yi|Di=0) = B1 + B2( 0 ) = B1 ( 9 - 2 ) 大学毕业生的初职年薪的期望为: E(Yi|Di=1) = B1+B2( 1 ) = B1+B2 ( 9 - 3 ) 可以看出: 截距B1表示非大学毕业生的平均初职年薪, “斜率”系数B2表明大学毕业生的平均初职年薪与非大学生的差距是多少; (B1+B2)表示大学毕业生的平均初职年薪。 零假设:大学教育没有任何益处(即B2=0),可根据t检验值

相关文档
最新文档