【精品】第八章单方程回归模型的几个专题

【精品】第八章单方程回归模型的几个专题
【精品】第八章单方程回归模型的几个专题

第八章单方程回归模型的几个专题

8.1虚拟变量(dummyvariable)

8。1。1概念与用作

在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质等因素的影响.这些因素也应该包括在模型中。为此人们采取了一种构造人工变量的方法,将这些定性变量进行量化,使其能与数值变量一样在回归模型中得以应用.

构造的规则是当某种属性存在时,人工变量取值为1;当某种属性不存在时时,取值为0。在计量经济学中,我们把反映定性因素变化,取值为0或1的人工变量称为虚拟变量。习惯上用D表示。如:

引入虚拟变量的作用主要有三个:1)可以描述定性因素的影响;2)能够正确反映经济变量的相互关系,提高模型的精度;3)便于处理异常数据。当样本资料中存在异常数

据时,一般有三种处理方式。一是直接剔除;二是平滑掉;三是设置虚拟变量.

8.1。2虚拟变量的设置

1、设置规则

1)一个因素多个属性:若定性因素有M个不同的属性,或相互排斥的类型,在模型中则只能引入M-1个虚拟变量,否则会引起完全多重共线性。

2)多个因素多个属性:每个因素的引入方法均按上述原则。

2、引入方式:

1)加法方式(截距移动)

设有模型,

y t=β0+β1x t+β2D+u t,

其中y t,x t为定量变量;D为定性变量.当D=0或1时,上述模型可表达为,

y t =??

?=+++=++1

)(0

12010D u x D u x t

t t t βββββ 020

40

60

20

40

60

X Y

图8。1测量截距不同

D =1

或0

表示某种特征的有无。反映在数学上是截距不同的两个函数。若β2显著不为零,说明截距不同;若β2为零,说明这种分类无显著性差异。

例:中国成年人体重y (kg)与身高x (cm)

的回归关系如下:

–105+xD =1(男)

y =—100+x —5D = –100+xD =0(女)

注意:

①若定性变量含有m 个类别,应引入m -1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummyvariabletrap )。

②关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果. ③定性变量中取值为0所对应的类别称作基础类别(basecategory)。

④对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。如:

1(大学) D =0(中学) -1(小学)。

例1:市场用煤销售量模型(file:Dummy1)

我国市场用煤销量的季节性数据(1982-1988,《中国统计年鉴》1987,1989)见下图与表。由于受取暖用煤的影响,每年第四季度的销售量大大高于其它季度。鉴于是季节数据可设三个季节变量如下:

1(4季度)1(3季度)1(2季度) D 1=D 2=D 3=

0(1,2,3季度)0(1,2,4季度)0(1,3,4季度)

β0

β0+β2

D =1 D =0

2500

300035004000450050005500

82

83

84

85

86

87

88

Y

2500

30003500400045005000550082

83

84

85

86

87

88

Y

2731.03+57.15*T

全国按季节市场用煤销售量数据(file:Dummy1)

数据来源:《中国统计年鉴》1989。注:以季节数据D 1为例,EViews 命令是D1=@seas (4).

以时间t 为解释变量(1982年1季度取t =1)的煤销售量(y )模型如下:

y =2431.20+49.00t +1388.09D 1+201.84D 2+85。00D 3(1)

(26。04)(10.81)(13。43)(1.96)(0.83)

R 2=0.95,DW=1。2,s 。e 。=191.7,F=100.4,T =28,t 0.05(28—5)=2。07

由于D 2,D 3的系数没有显著性,说明第2,3季度可以归并入基础类别第1季度。于是只考虑加入一个虚拟变量D 1,把季节因素分为第四季度和第一、二、三季度两类。从上式中剔除虚拟变量D 2,D 3,得煤销售量(y )模型如下:

y =2515。86+49.73t +1290.91D 1(2)

(32。03(10。63)(14。79)

R 2=0.94,DW=1.4,s 。e 。=198.7,F=184.9,T =28,t 0.05(25)=2.06

进一步检验斜率是否有变化,在上式中加入变量tD 1,

y =2509。07+50.22t +1321.19D 1—1。95tD 1(3)

(28.24)(9.13)(6。85)(—0.17)

R 2=0.94,DW=1.4,s.e 。=202。8,F=118。5,T =28,t 0.05(24)=2。06

第二章经典单方程计量经济学模型:一元线性回归模型

第二章经典单方程计量经济学模型:一元线性回归模型 一、内容提要 本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。 本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。 本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。 本章还有三方面的内容不容忽视。其一,若干基本假设。样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。Goss-markov定理表明OLS估计量是最佳线性无偏估计量。其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。 二、典型例题分析 例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为 β+ μ β kids =educ + 1

计量经济学习题第2章-一元线性回归模型

第2章 一元线性回归模型 一、单项选择题 1、变量之间的关系可以分为两大类__________。 A 函数关系与相关关系 B 线性相关关系和非线性相关关系 C 正相关关系和负相关关系 D 简单相关关系和复杂相关关系 2、相关关系是指__________。 A 变量间的非独立关系 B 变量间的因果关系 C 变量间的函数关系 D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。 A 都是随机变量 B 都不是随机变量 C 一个是随机变量,一个不是随机变量 D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。 A 01???t t Y X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+ 5、参数β的估计量?β 具备有效性是指__________。 A ?var ()=0β B ?var ()β为最小 C ?()0β β-= D ?()ββ-为最小 6、对于01??i i i Y X e ββ=++,以σ?表示估计标准误差,Y ?表示回归值,则__________。 A i i ??0Y Y 0σ∑ =时,(-)= B 2 i i ??0Y Y σ∑=时,(-)=0 C i i ??0Y Y σ∑=时,(-)为最小 D 2 i i ??0Y Y σ∑=时,(-)为最小 7、设样本回归模型为i 01i i ??Y =X +e ββ+,则普通最小二乘法确定的i ?β的公式中,错误的是__________。 A ()() () i i 1 2 i X X Y -Y ?X X β--∑∑= B ()i i i i 1 2 2 i i n X Y -X Y ?n X -X β ∑∑∑∑∑= C i i 1 2 2 i X Y -nXY ?X -nX β ∑∑= D i i i i 1 2x n X Y -X Y ?β σ ∑∑∑= 8、对于i 01i i ??Y =X +e ββ+,以?σ表示估计标准误差,r 表示相关系数,则有__________。 A ?0r=1σ =时, B ?0r=-1σ =时, C ?0r=0σ =时, D ?0r=1r=-1σ =时,或 9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为?Y 356 1.5X -=,这说明__________。 A 产量每增加一台,单位产品成本增加356元 B 产量每增加一台,单位产品成本减少1.5元 C 产量每增加一台,单位产品成本平均增加356元 D 产量每增加一台,单位产品成本平均减少1.5元

(完整版)第二章(简单线性回归模型)2-2答案

2.2 简单线性回归模型参数的估计 一、判断题 1.使用普通最小二乘法估计模型时,所选择的回归线使得所有观察值的残差和达到最小。(F) 2.随机扰动项和残差项是一回事。(F ) 3.在任何情况下OLS 估计量都是待估参数的最优线性无偏估计。(F ) 4.满足基本假设条件下,随机误差项i μ服从正态分布,但被解释变量Y 不一定服从正态分 布。 ( F ) 5.如果观测值i X 近似相等,也不会影响回归系数的估计量。 ( F ) 二、单项选择题 1.设样本回归模型为i 01i i ??Y =X +e ββ+,则普通最小二乘法确定的i ?β的公式中,错误的是( D )。 A . ()() () i i 1 2 i X X Y -Y ?X X β--∑∑= B .() i i i i 12 2i i n X Y -X Y ? n X -X β∑∑∑∑∑= C .i i 122i X Y -nXY ?X -nX β∑∑= D .i i i i 12x n X Y -X Y ?βσ∑∑∑= 2.以Y 表示实际观测值,?Y 表示回归估计值,则普通最小二乘法估计参数的准则是使( D )。 A .i i ?Y Y 0∑(-)= B .2 i i ?Y Y 0∑ (-)= C .i i ?Y Y ∑(-)=最小 D .2 i i ?Y Y ∑ (-)=最小 3.设Y 表示实际观测值,?Y 表示OLS 估计回归值,则下列哪项成立( D )。 A .?Y Y = B .?Y Y = C .?Y Y = D .?Y Y = 4.用OLS 估计经典线性模型i 01i i Y X u ββ+=+,则样本回归直线通过点( D )。 A .X Y (,) B . ?X Y (,) C .?X Y (,) D .X Y (,) 5.以Y 表示实际观测值,?Y 表示OLS 估计回归值,则用OLS 得到的样本回归直线i 01i ???Y X ββ+=满足( A )。 A .i i ?Y Y 0∑(-)= B .2 i i Y Y 0∑ (-)= C . 2 i i ?Y Y 0∑ (-)= D .2i i ?Y Y 0∑ (-)= 6.按经典假设,线性回归模型中的解释变量应是非随机变量,且( A )。 i u i e

【精品】第八章单方程回归模型的几个专题

第八章单方程回归模型的几个专题 8.1虚拟变量(dummyvariable) 8。1。1概念与用作 在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质等因素的影响.这些因素也应该包括在模型中。为此人们采取了一种构造人工变量的方法,将这些定性变量进行量化,使其能与数值变量一样在回归模型中得以应用. 构造的规则是当某种属性存在时,人工变量取值为1;当某种属性不存在时时,取值为0。在计量经济学中,我们把反映定性因素变化,取值为0或1的人工变量称为虚拟变量。习惯上用D表示。如: 引入虚拟变量的作用主要有三个:1)可以描述定性因素的影响;2)能够正确反映经济变量的相互关系,提高模型的精度;3)便于处理异常数据。当样本资料中存在异常数

据时,一般有三种处理方式。一是直接剔除;二是平滑掉;三是设置虚拟变量. 8.1。2虚拟变量的设置 1、设置规则 1)一个因素多个属性:若定性因素有M个不同的属性,或相互排斥的类型,在模型中则只能引入M-1个虚拟变量,否则会引起完全多重共线性。 2)多个因素多个属性:每个因素的引入方法均按上述原则。 2、引入方式: 1)加法方式(截距移动) 设有模型, y t=β0+β1x t+β2D+u t, 其中y t,x t为定量变量;D为定性变量.当D=0或1时,上述模型可表达为,

y t =?? ?=+++=++1 )(0 12010D u x D u x t t t t βββββ 020 40 60 20 40 60 X Y 图8。1测量截距不同 D =1 或0 表示某种特征的有无。反映在数学上是截距不同的两个函数。若β2显著不为零,说明截距不同;若β2为零,说明这种分类无显著性差异。 例:中国成年人体重y (kg)与身高x (cm) 的回归关系如下: –105+xD =1(男) y =—100+x —5D = –100+xD =0(女) 注意: ①若定性变量含有m 个类别,应引入m -1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummyvariabletrap )。 ②关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果. ③定性变量中取值为0所对应的类别称作基础类别(basecategory)。 ④对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。如: 1(大学) D =0(中学) -1(小学)。 例1:市场用煤销售量模型(file:Dummy1) 我国市场用煤销量的季节性数据(1982-1988,《中国统计年鉴》1987,1989)见下图与表。由于受取暖用煤的影响,每年第四季度的销售量大大高于其它季度。鉴于是季节数据可设三个季节变量如下: 1(4季度)1(3季度)1(2季度) D 1=D 2=D 3= 0(1,2,3季度)0(1,2,4季度)0(1,3,4季度) β0 β0+β2 D =1 D =0

简单线性回归模型试题及答案

第二章 简单线性回归模型 一、单项选择题: 1、回归分析中定义的( B )。 A 、解释变量和被解释变量都是随机变量 B 、解释变量为非随机变量,被解释变量为随机变量 C 、解释变量和被解释变量都为非随机变量 D 、解释变量为随机变量,被解释变量为非随机变量 2、最小二乘准则是指使( D )达到最小值的原则确定样本回归方程。 A 、1?()n t t t Y Y =-∑ B 、1?n t t t Y Y =-∑ C 、?max t t Y Y - D 、21?()n t t t Y Y =-∑ 3、下图中“{”所指的距离是( B )。 A 、随机误差项 i 、?i Y 的离差 4、参数估计量?β是i Y 的线性函数称为参数估计量具有( A )的性质。 A 、线性 B 、无偏性 C 、有效性 D 、一致性 5、参数β的估计量β?具备有效性是指( B )。 A 、0)?(=βVar B 、)?(βVar 为最小 C 、0?=-ββ D 、)?(ββ-为最小 6、反映由模型中解释变量所解释的那部分离差大小的是( B )。 A 、总体平方和 B 、回归平方和 C 、残差平方和 D 、样本平方和 7、总体平方和TSS 、残差平方和RSS 与回归平方和ESS 三者的关系是( B )。 A 、RSS=TSS+ESS B 、TSS=RSS+ESS C 、ESS=RSS-TSS D 、ESS=TSS+RSS 8、下面哪一个必定是错误的( C )。 A 、 i i X Y 2.030?+= ,8.0=XY r B 、 i i X Y 5.175?+-= ,91.0=XY r C 、 i i X Y 1.25?-=,78.0=XY r D 、 i i X Y 5.312?--=,96.0-=XY r 9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为?356 1.5Y X =-,这说明( D )。 A 、产量每增加一台,单位产品成本增加356元 B 、产量每增加一台,单位产品成本减少1.5元 C 、产量每增加一台,单位产品成本平均增加356元 D 、产量每增加一台,单位产品成本平均减少1.5元 10、回归模型i i i X Y μββ++=10,i = 1,…,25中,总体方差未知,检验010=β:H 时,所用的检验统计量1?1 1?βββS -服从( D )。 A 、)(22-n χ B 、)(1-n t C 、)(12-n χ D 、)(2-n t 11、对下列模型进行经济意义检验,哪一个模型通常被认为没有实际价值的( B )。 A 、i C (消费)i I 8.0500+=(收入) B 、di Q (商品需求)i I 8.010+=(收入)i P 9.0+(价格) C 、si Q (商品供给)i P 75.020+=(价格) D 、i Y (产出量)6.065.0i K =(资本)4.0i L (劳动) 12、进行相关分析时,假定相关的两个变量( A )。 X 1?β+ i Y

经典线性回归模型

2 经典线性回归模型 §2.1 概念与记号 1.线性回归模型是用来描述一个特定变量y 与其它一些变量x 1,…,x p 之间的关系。 2. 称特定变量y 为因变量 (dependent variable )、 被解释变量 (explained variable )、 响应变量(response variable )、被预测变量(predicted variable )、回归子 (regressand )。 3.称与特定变量相关的其它一些变量x 1,…,x p 为自变量(independent variable )、 解释变量(explanatory variable )、控制变量(control variable )、预测变量 (predictor variable )、回归量(regressor )、协变量(covariate )。 4.假定我们观测到上述这些变量的n 组值:( ) ip i i x x y , , , 1 L (i=1,…,n)。称 这n 组值为样本(sample )或数据(data )。 §2.2 经典线性回归模型的假定 假定 2.1(线性性(linearity)) i ip p i i x x y e b b b + + + + = L 1 1 0 (i=1,…,n)。 (2.1) 称方程(2.1)为因变量y 对自变量x 1,…,x p 的线性回归方程(linear regression equation ),其中 ( ) p , k k , , 1 0 L = b 是待估的未知参数(unknown parameters ), ( ) n i i , , 1 L = e 是满足一定限制条件的无法观测的误差项(unobserved error term ) 。称自 变量的函数 ip p i x x b b b + + + L 1 1 0 为回归函数(regression function )或简称为回归 (regression )。称 0 b 为回归的截距(ntercept),称 ( ) p k k , , 1 L = b 为自变量的回归系数 (regression coefficients ) 。某个自变量的回归系数表示在其它条件保持不变的情况下,

第三章-经典单方程计量经济学模型教学文稿

第三章 经典单方程计量经济学模型:多元线性回归模型 3—1 解释下列概念 (1)多元线性回归模型 解答:在现实经济活动中往往存在着一个变量受到其他多个变量的影响的现象,表现为在线性回归模型中有多个解释变量,这样的模型被称为多元线性回归模型,多元指多个解释变量。 (2)偏回归系数 解答:在多元回归模型中,每一个解释变量前的参数即为偏回归系数,它测度了当其他解释变量保持不变时,该解释变量增加1个单位对被解释变量带来的平均影响程度。 (3)正规方程组 解答:正规方程组指采用OLS 估计线性回归模型时,对残差平方和关于各参数求偏导,并 令偏导数为零得到的一组方程,其矩阵形式为Y X X X '=' β? (4)调整的多元可决系数 解答:调整的多元可决系数2 R ,又称独院判定系数,是一个用于描述伴随模型中解释变量的增加和多个解释变量对被解释变量的联合影响程度的量。它与2 R 有如下关系: 1 1 ) 1(122-----=k n n R R (5)多重共线性 解答:多重共线性是多元回归中特有的一个概念,指多个解释变量间存在线性相关的情形。如果存在完全的线性相关性,则模型的参数就无法求出,OLS 回归无法进行。 (6)联合假设检验 解答:联合假设检验是相对于单个假设检验来说的,指假设检验中的假设有多个,不止一个。如多元回归中的方程的显著性检验就是一个联合假设检验,而每个参数的t 检验就是单个假设检验。 (7)受约束回归

解答:在世纪经济活动中,常常需要根据经济理论对模型中的变量参数施加一定的约束条件,对模型施加约束条件后进行回归,称为受约束回归。 (8)无约束回归 解答:无约束回归是与受约束回归相当对的一个概念,无需对模型中变量的参数施加约束条件进行的回归称为无约束回归 3—2 观察下列方程并判断其变量是否呈线性?系数是否呈线性?或都是?或都不是? (1)i i i X Y εββ++=3 10 (2)i i i X Y εββ++=log 10 (3)i i i X Y εββ++=ln ln 10 (4)i i i X Y εβββ++=)(210 (5)i i i X Y εββ+= 10 (6)i i i i X Y εββ +-+=)1(10 (7)i i i i X X Y εβββ+++=10 22 110 解答:(1),(2),(3),(7)变量非线性,系数线性: (4)变量线性,系数非线性: (5),(6)变量和系数均为非线性。 3—4 为什么说最小二乘估计量是最优的线性无偏估计量?多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计的条件是什么? 解答:在多元回归的参数模型中,在模型满足经典假设的条件下,参数的最小二乘估计量具有线性性、无偏性以及最小方差性,所以被称为最有线性无偏估计量(BLUE )。 对于多元线性回归最小二乘估计的正规方程组,能解出唯一的参数估计量的条件是 1)(-'X X 存在,或者说各解释变量间不完全线性相关。

第二章(简单线性回归模型)2-2答案教学文稿

第二章(简单线性回归模型)2-2答案

2.2 简单线性回归模型参数的估计 一、判断题 1.使用普通最小二乘法估计模型时,所选择的回归线使得所有观察值的残差和达到最小。(F) 2.随机扰动项i u 和残差项i e 是一回事。(F ) 3.在任何情况下OLS 估计量都是待估参数的最优线性无偏估计。(F ) 4.满足基本假设条件下,随机误差项i μ服从正态分布,但被解释变量Y 不一定服从正态分 布。 ( F ) 5.如果观测值i X 近似相等,也不会影响回归系数的估计量。 ( F ) 二、单项选择题 1.设样本回归模型为i 01i i ??Y =X +e ββ+,则普通最小二乘法确定的i ?β的公式中,错误的是( D )。 A . ()() () i i 1 2 i X X Y -Y ?X X β--∑∑= B . () i i i i 1 2 2i i n X Y -X Y ?n X -X β ∑∑∑∑∑= C .i i 122i X Y -nXY ?X -nX β∑∑= D .i i i i 12 x n X Y -X Y ?βσ∑∑∑= 2.以Y 表示实际观测值,?Y 表示回归估计值,则普通最小二乘法估计参数的准则是使( D )。 A .i i ?Y Y 0∑(-)= B .2 i i ?Y Y 0∑ (-)= C .i i ?Y Y ∑(-)=最小 D .2 i i ?Y Y ∑ (-)=最小 3.设Y 表示实际观测值,?Y 表示OLS 估计回归值,则下列哪项成立( D )。 A .?Y Y = B .?Y Y = C .?Y Y = D .?Y Y = 4.用OLS 估计经典线性模型i 01i i Y X u ββ+=+,则样本回归直线通过点( D )。 A .X Y (,) B . ?X Y (,) C .?X Y (,) D .X Y (,) 5.以Y 表示实际观测值,?Y 表示OLS 估计回归值,则用OLS 得到的样本回归直线

第八章 单方程回归模型的几个专题

第八章 单方程回归模型的几个专题 8.1虚拟变量(dummy variable ) 8.1.1 概念与用作 在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质等因素的影响。这些因素也应该包括在模型中。为此人们采取了一种构造人工变量的方法,将这些定性变量进行量化,使其能与数值变量一样在回归模型中得以应用。 构造的规则是当某种属性存在时,人工变量取值为1;当某种属性不存在时时,取值为0。在计量经济学中,我们把反映定性因素变化,取值为0或1的人工变量称为虚拟变量。习惯上用D 表示。如: 引入虚拟变量的作用主要有三个:1)可以描述定性因素的影响;2)能够正确反映经济变量的相互关系,提高模型的精度;3)便于处理异常数据。当样本资料中存在异常数据时,一般有三种处理方式。一是直接剔除;二是平滑掉;三是设置虚拟变量。 8.1.2 虚拟变量的设置 1、设置规则 1)一个因素多个属性:若定性因素有M 个不同的属性,或相互排斥的类型,在模型中则只能引入M-1个虚拟变量,否则会引起完全多重共线性。 2)多个因素多个属性:每个因素的引入方法均按上述原则。 2、引入方式: 1)加法方式(截距移动) 设有模型, y t = β0 + β1 x t + β2D + u t , 其中y t ,x t 为定量变量;D 为定性变量。当D = 0 或1时,上述模型可表达为,

y t =?? ?=+++=++1 )(0 12010D u x D u x t t t t βββββ 020 40 60 20 40 60 X Y 图8.1 测量截距不同 D = 1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若β2显著不为零,说明截距不同;若β2为零,说明这种分类无显著性差异。 例:中国成年人体重y (kg )与身高x (cm )的回归关系如下: –105 + x D = 1 (男) y = - 100 + x - 5D = – 100 + x D = 0 (女) 注意: ① 若定性变量含有m 个类别,应引入m -1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummy variable trap )。 ② 关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。 ③ 定性变量中取值为0所对应的类别称作基础类别(base category )。 ④ 对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。如: 1 (大学) D = 0 (中学) -1 (小学)。 例1:市场用煤销售量模型(file: Dummy1) 我国市场用煤销量的季节性数据(1982-1988,《中国统计年鉴》1987,1989)见下图与表。由于受取暖用煤的影响,每年第四季度的销售量大大高于其它季度。鉴于是季节数据可设三个季节变量如下: 1 (4季度) 1 (3季度) 1 (2季度) D 1 = D 2 = D 3 = 0 (1, 2, 3季度) 0 (1, 2, 4季度) 0 (1, 3, 4季度) β0 β0+β2 D = 1 D =0

经典单方程计量经济学模型一元线性回归模型

经典单方程计量经济学模型一元线性回归模型

第二章经典单方程计量经济学模型:一元线性回归模型 一、内容提要 本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。 本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。 本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。

后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。 本章还有三方面的内容不容忽视。其一,若干基本假设。样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。Goss-markov定理表明OLS估计量是最佳线性无偏估计量。其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。 二、典型例题分析 例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为

第二章 简单线性回归模型练习题

第二章 简单线性回归模型练习题 一、术语解释 1 解释变量 2 被解释变量 3 线性回归模型 4 最小二乘法 5 方差分析 6 参数估计 7 控制 8 预测 二、填空 1 在经济计量模型中引入反映( )因素影响的随机扰动项t ξ,目的在于使模型更符合( )活动。 2 在经济计量模型中引入随机扰动项的理由可以归纳为如下几条:(1)因为人的行为的( )、社会环境与自然环境的( )决定了经济变量本身的( );(2)建立模型时其他被省略的经济因素的影响都归入了( )中;(3)在模型估计时,( )与归并误差也归入随机扰动项中;(4)由于我们认识的不足,错误的设定了( )与( )之间的数学形式,例如将非线性的函数形式设定为线性的函数形式,由此产生的误差也包含在随机扰动项中了。 3 ( )是因变量离差平方和,它度量因变量的总变动。就因变量总变动的变异来源看,它由两部分因素所组成。一个是自变量,另一个是除自变量以外的其他因素。( )是拟合值的离散程度的度量。它是由自变量的变化引起的因变量的变化,或称自变量对因变量变化的贡献。( )是度量实际值与拟合值之间的差异,它是由自变量以外的其他因素所致,它又叫残差或剩余。 4 回归方程中的回归系数是自变量对因变量的( )。某自变量回归系数β的意义,指的是该自变量变化一个单位引起因变量平均变化( )个单位。 5 模型线性的含义,就变量而言,指的是回归模型中变量的( );就参数而言,指的是回归模型中的参数的( );通常线性回归模型的线性含义是就( )而言的。 6 样本观察值与回归方程理论值之间的偏差,称为( ),我们用残差估计线性模型中的( )。 三、简答题 1 在线性回归方程中,“线性”二字如何理解? 2 用最小二乘法求线性回归方程系数的意义是什么? 3 一元线性回归方程的基本假设条件是什么? 4 方差分析方法把数据总的平方和分解成为两部分的意义是什么? 5 试叙述t 检验法与相关系数检验法之间的联系。 6 应用线性回归方程控制和预测的思想。 7 线性回归方程无效的原因是什么? 8 回归分析中的随机误差项i ε有什么作用?它与残差项t e 有何区别?

第2章习题

第二章 古典回归模型 一、单项选择题 1、回归分析中定义的( B ) A 、解释变量和被解释变量都是随机变量 B 、解释变量为非随机变量,被解释变量为随机变量 C 、解释变量和被解释变量都为非随机变量 D 、解释变量为随机变量,被解释变量为非随机变量 2、设OLS 法得到的样本回归直线为1?i Y β=2?i i X e β++,以下说法正确的是 ( D ) A 、0i e ≠∑ B 、?0i i e Y ≠∑ C 、?Y Y ≠ D 、0i i e X =∑ 3、最小二乘准则是指按使( )达到最小值的原则确定样本回归方程 ( D ) A 、 1 n i i e =∑ B 、1 n i i e =∑ C 、max i e D 、21 n i i e =∑ 4、参数i β的估计量?i β具备有效性是指 ( B ) A 、?()0i Var β= B 、在i β的所有线性无偏估计中?()i Var β最小 C 、?0i i ββ-= D 、在i β的所有线性无偏估计中?()i i ββ-最小 5、反映由模型中解释变量所解释的那部分离差大小的是 ( B ) A 、总离差平方和 B 、回归平方和 C 、残差平方和 D 、可决系数 6、总离差平方和TSS 、残差平方和RSS 与回归平方和ESS 三者的关系是 ( B ) A 、TSS>RSS+ESS B 、TSS=RSS+ESS C 、TSS

一元线性回归模型习题及答案.doc

一元线性回归模型 一、单项选择题 1、变量之间的关系可以分为两大类__________。A A 函数关系与相关关系 B 线性相关关系和非线性相关关系 C 正相关关系和负相关关系 D 简单相关关系和复杂相关关系 2、相关关系是指__________。D A 变量间的非独立关系 B 变量间的因果关系 C 变量间的函数关系 D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。A A 都是随机变量 B 都不是随机变量 C 一个是随机变量,一个不是随机变量 D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。C A 01???t t Y X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+ 5、参数β的估计量?β 具备有效性是指__________。B A ?var ()=0β B ?var ()β为最小 C ?()0β β-= D ?()ββ-为最小 6、对于01??i i i Y X e ββ=++,以σ?表示估计标准误差,Y ?表示回归值,则__________。B A i i ??0Y Y 0σ∑ =时,(-)= B 2 i i ??0Y Y σ∑=时,(-)=0 C i i ??0Y Y σ∑=时,(-)为最小 D 2 i i ??0Y Y σ∑=时,(-)为最小 7、设样本回归模型为i 01i i ??Y =X +e ββ+,则普通最小二乘法确定的i ?β的公式中,错误的是__________。D A ()()()i i 1 2 i X X Y -Y ?X X β--∑∑= B ()i i i i 1 2 2 i i n X Y -X Y ?n X -X β∑∑∑∑∑= C i i 1 2 2 i X Y -nXY ?X -nX β∑∑ = D i i i i 1 2 x n X Y -X Y ?βσ ∑∑∑= 8、对于i 01i i ??Y =X +e ββ+,以 ?σ表示估计标准误差,r 表示相关系数,则有__________。D A ?0r=1σ =时, B ?0r=-1σ =时, C ?0r=0σ =时, D ?0r=1r=-1σ =时,或 9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为?Y 356 1.5X -=,这说明__________。D

经典线性回归模型的诊断与修正

经典线性回归模型的诊断与修正下表为最近20年我国全社会固定资产投资与GDP的统计数据:1 年份国内生产总值(亿元)GDP 全社会固定资产投资(亿元)PI 1996 71813.6 22913.5 1997 79715 24941.1 1998 85195.5 28406.2 1999 90564.4 29854.7 2000 100280.1 32917.7 2001 110863.1 37213.49 2002 121717.4 43499.91 2003 137422 55566.61 2004 161840.2 70477.43 2005 187318.9 88773.61 2006 219438.5 109998.16 2007 270232.3 137323.94 2008 319515.5 172828.4 2009 349081.4 224598.77 2010 413030.3 251683.77 2011 489300.6 311485.13 2012 540367.4 374694.74 2013 595244.4 446294.09 1数据来源于国家统计局网站年度数据

1、普通最小二乘法回归结果如下: 方程初步估计为: GDP=75906.54+1.1754PI (32.351) R2=0.9822F=1046.599 DW=0.3653 2、异方差的检验与修正 首先,用图示检验法,生成残差平方和与解释变量PI的散点图如下:

从上图可以看出,残差平方和与解释变量的散点图主要分布在图形的下半部分,有随PI的变动增大的趋势,因此,模型可能存在异方差。但是否确定存在异方差,还需作进一步的验证。 G-Q检验如下: 去除序列中间约1/4的部分后,1996-2003年的OLS估计结果如下所示:

第二章经典单方程计量经济学模型:一元线性回归模型

第二章经典单方程计量经济学模型:一元线性回 归模型 复习总结 2.1回归分析概述 2、回归分析的基本概念 二、总体回归函数 总体回归线:在给定解释变量X i条件下被解释变量Y i的期望轨迹称为总体回归线(population regression line),或更一般地称为总体回归曲线(population regression curve)。 总体回归函数(population regression function, PRF) 三、随机扰动项 称i为观察值Y i围绕它的期望值E(Y|X i)的离差(deviation),是一个不可观测的随机变量,又称为随机干扰项(stochastic disturbance)或随机误差项(stochastic error) 总体回归函数(方程)PRF的随机设定形式。方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。 随机误差项主要包括下列因素的影响 1)在解释变量中被忽略的因素的影响; 2)变量观测值的观测误差的影响; 3)模型关系的设定误差的影响; 4)其它随机因素的影响。 四、样本回归函数(SRF) 样本散点图近似于一条直线,画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该线近似地代表总体回归线。该线称为样本回归线(sample regression lines)。 样本回归线的函数形式为 称为样本回归函数(sample regression function,SRF) 样本残差: ? 此节要点: ? PRL、PRF、PRM

? SRL、SRF、SRM ? 随机扰动项、样本残差 ? 要求:每个概念,与图形的对应 2.2一元线性回归模型的参数估计 一、线性回归模型的基本假设1-6 普通最小二乘法(Ordinary least squares, OLS)给出的判断标准是:二者之差的平方和最小 求正规方程组 离差形式 极大似然的基本原理 四、最小二乘估计量的性质 小样本性质:线性、无偏、有效的证明(重要) 大样本或渐近性质 估计量的标准差 牢记:由于随机项i不可观测,只能从i的估计——残差e i出发,对总体方差进行估计。它是关于2的无偏估计量 的样本方差: 的样本标准差:

计量经济学 第三章、经典单方程计量经济学模型:多元线性回归模型

第三章、经典单方程计量经济学模型:多元线性回归模型 一、内容提要 本章将一元回归模型拓展到了多元回归模型,其基本的建模思想与建模方法与一元的情形相同。主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方面的应用等方面。只不过为了多元建模的需要,在基本假设方面以及检验方面有所扩充。 本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。与一元回归分析相比,多元回归分析的基本假设中引入了多个解释变量间不存在(完全)多重共线性这一假设;在检验部分,一方面引入了修正的可决系数,另一方面引入了对多个解释变量是否对被解释变量有显著线性影响关系的联合性F检验,并讨论了F检验与拟合优度检验的内在联系。 本章的另一个重点是将线性回归模型拓展到非线性回归模型,主要学习非线性模型如何转化为线性回归模型的常见类型与方法。这里需要注意各回归参数的具体经济含义。 本章第三个学习重点是关于模型的约束性检验问题,包括参数的线性约束与非线性约束检验。参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检验以及参数的稳定性检验三方面的内容,其中参数稳定性检验又包括邹氏参数稳定性检验与邹氏预测检验两种类型的检验。检验都是以F检验为主要检验工具,以受约束模型与无约束模型是否有显著差异为检验基点。参数的非线性约束检验主要包括最大似然比检验、沃尔德检验与拉格朗日乘数检验。它们仍以估计无约束模型与受约束模型为基础,但以最大似然原 χ分布为检验统计量理进行估计,且都适用于大样本情形,都以约束条件个数为自由度的2 的分布特征。非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。 二、典型例题分析 例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为36 .0 . + = - 10+ 094 medu fedu .0 sibs edu210 131 .0 R2=0.214 式中,edu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,medu与fedu分别为母亲与父亲受到教育的年数。问

第四章 典线性回归模型(金融计量-浙大 蒋岳祥)

上课材料之五 第四章古典线性回归模型 在引论中,我们推出了满足凯恩斯条件的消费函数与收入有关的一个最普通模型:C=α+βX+ε,其中α>0,0<β<1ε是一个随机扰动。这是一个标准的古典线性回归模型。假如我们得到如下例1的数据 例1 可支配个人收入和个人消费支出 年份可支配收入个人消费 1970 751.6 672.1 1971 779.2 696.8 1972 810.3 737.1 1973 864.7 767.9 1974 857.5 762.8 1975 847.9 779.4 1976 906.8 823.1 1977 942.9 864.3 1978 988.8 903.2 1979 1015.7 927.6 来源:数据来自总统经济报告,美国政府印刷局,华盛顿特区,1984。 (收入和支出全为1972年的十亿美元) 一、线性回归模型及其假定 一般地,被估计模型具有如下形式: y i=α+βx i+εi,i=1,…,n, 其中y是因变量或称为被解释变量,x是自变量或称为解释变量,i标志n个样本观测值中的一个。这个形式一般被称作y对x的总体线性回归模型。在此背景下,y称为被回归量,x称为回归量。 构成古典线性回归模型的一组基本假设为: 1. 函数形式:y i=α+βx i+εi,i=1,…,n, 2. 干扰项的零均值:对所有i,有:E[εi]=0。

3. 同方差性:对所有i ,有:Var[εi ]=σ2,且2 σ是一个常数。 4. 无自相关:对所有i ≠j ,则Cov[εi ,εj ]=0。 5. 回归量和干扰项的非相关:对所有i 和j 有Cov[x i ,εj ]=0。 6. 正态性:对所有i ,εi 满足正态分布N (0,2 σ)。 模型假定的几点说明: 1、函数形式及其线性模型的转换 具有一般形式 i i i x g y f εβα++=)()( 对任何形式的g(x)都符合我们关于线性模型的定义。 [例] 一个常用的函数形式是对数线性模型: βAx y =。 取对数得: x y ln ln βα+=。 (A ln =α) 这被称作不变弹性形式。在这个方程中,y 对于x 的变化的弹性是 βη=== x d y d x dx y dy ln ln //, 它不随x 而变化。与之相反,线性模型的弹性是: x x dx dy x x x y dx dy βαββαη+=?? ? ?????? ??+=??? ??=。 对数线性模型通常用来估计需求函数和生产函数。 尽管线性模型具有巨大的灵活性,但在实际中存在着大量的非线性模型的形式。 例如,任何变换也不能将 x y ++ =βα1和ν βαx y +=(0<ν<1) 转化为线性回归模型。 2、回归量 对于回归量即解释变量我们有两种处理方法,第一种将X 设定为非随机变量,第二种方法将X 设定为随机变量。

第二章(简单线性回归模型)2-2答案

简单线性回归模型参数的估计 一、判断题 1.使用普通最小二乘法估计模型时,所选择的回归线使得所有观察值的残差和达到最小。(F) 2.随机扰动项i u 和残差项i e 是一回事。(F ) 3.在任何情况下OLS 估计量都是待估参数的最优线性无偏估计。(F ) 4.满足基本假设条件下,随机误差项i μ服从正态分布,但被解释变量Y 不一定服从正态分 布。 ( F ) 5.如果观测值i X 近似相等,也不会影响回归系数的估计量。 ( F ) 二、单项选择题 1.设样本回归模型为i 01i i ??Y =X +e ββ+,则普通最小二乘法确定的i ?β的公式中,错误的是( D )。 A .()() () i i 1 2 i X X Y -Y ?X X β--∑∑= B .() i i i i 12 2 i i n X Y -X Y ? n X -X β∑∑∑∑∑= C .i i 122i X Y -nXY ?X -nX β∑∑= D .i i i i 12x n X Y -X Y ?βσ∑∑∑= 2.以Y 表示实际观测值,?Y 表示回归估计值,则普通最小二乘法估计参数的准则是使( D )。 A .i i ?Y Y 0∑(-)= B .2 i i ?Y Y 0∑ (-)= C .i i ?Y Y ∑(-)=最小 D .2 i i ?Y Y ∑ (-) =最小 3.设Y 表示实际观测值,?Y 表示OLS 估计回归值,则下列哪项成立( D )。 A .?Y Y = B .?Y Y = C .?Y Y = D .?Y Y = 4.用OLS 估计经典线性模型i 01i i Y X u ββ+=+,则样本回归直线通过点( D )。 A .X Y (,) B . ?X Y (,) C .?X Y (,) D .X Y (,) 5.以Y 表示实际观测值,?Y 表示OLS 估计回归值,则用OLS 得到的样本回归直线i 01i ???Y X ββ+=满足( A )。 A .i i ?Y Y 0∑(-)= B .2 i i Y Y 0∑ (-)= C . 2 i i ?Y Y 0∑ (-)= D .2i i ?Y Y 0∑ (-)=

相关文档
最新文档