经典单方程计量经济学模型一元线性回归模型

经典单方程计量经济学模型一元线性回归模型
经典单方程计量经济学模型一元线性回归模型

经典单方程计量经济学模型一元线性回归模型

第二章经典单方程计量经济学模型:一元线性回归模型

一、内容提要

本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。

本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。

本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。

后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。

本章还有三方面的内容不容忽视。其一,若干基本假设。样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。Goss-markov定理表明OLS估计量是最佳线性无偏估计量。其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。

二、典型例题分析

例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为

μ

β+

β

kids

+

=educ

1

(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?

(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。

解答:

(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。

(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。

例2.已知回归模型μ

α+

β

E,式中E为某

+

=N

类公司一名新员工的起始薪金(元),N为所受教育水平(年)。随机扰动项μ的分布未知,其他

所有假设都满足。

(1)从直观及经济角度解释α和β。

(2)OLS估计量α?和β?满足线性性、无偏性及有效性吗?简单陈述理由。

(3)对参数的假设检验还能进行吗?简单陈述理由。

解答:

(1)Nβ

α+为接受过N年教育的员工的总体平均起始薪金。当N为零时,平均薪金为α,因此α表示没有接受过教育员工的平均起始薪金。β是每单位N变化所引起的E的变化,即表示每多接受一年学校教育所对应的薪金增加值。(2)OLS估计量α?和仍β?满足线性性、无偏性及有效性,因为这些性质的的成立无需随机扰动项μ的正态分布假设。

(3)如果

μ的分布未知,则所有的假设检验都

t

是无效的。因为t检验与F检验是建立在μ的正态分布假设之上的。

例3、在例2中,如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项与斜率项有无变化?如果解释变量所受教育

水平的度量单位由年改为月,估计的截距项与斜率项有无变化? 解答:

首先考察被解释变量度量单位变化的情形。以E*表示以百元为度量单位的薪金,则

μβα++=?=N E E 100* 由此有如下新模型

)

100/()100/()100/(*μβα++=N E

*

***μβα++=N E

这里100/*αα=,100/*ββ=。所以新的回归系数将为原始模型回归系数的1/100。

再考虑解释变量度量单位变化的情形。设N*为用月份表示的新员工受教育的时间长度,则N*=12N ,于是

μ

βαμβα++=++=)12/*(N N E

μ

βα++=*)12/(N E

可见,估计的截距项不变,而斜率项将为原回归系数的1/12。

例4、对没有截距项的一元回归模型

i

i

i

X Y μβ+=1

称之为过原点回归(regrission through the origin )。试证明

(1)如果通过相应的样本回归模型可得到通常的的正规方程组

∑∑==0

0i

i

i X e e

则可以得到1

β的两个不同的估计值:

X

Y =1~

β,

())∑∑=2

1?i

i i X Y X β。

(2)在基本假设0)(i

=μE 下,1

~

β与1

?β均为无偏估

计量。

(3)拟合线X Y 1

??β=通常不会经过均值点),(Y X ,

但拟合线X Y

1

~

~β=则相反。 (4)只有1

?β是1

β的OLS 估计量。

解答:

(1)由第一个正规方程 0=∑t

e 得

0)~

(1

=-∑t

t

X Y β

或 ∑∑=t

t

X Y 1

求解得 X Y /~

1

由第2个下规方程0)?(1

=-∑t

t

t

X Y X β得

∑∑=21

?t

t

t

X Y X β

求解得

)/()(?21

∑∑=t t t X Y X β (2)对于X

Y /~

1

,求期望

1

1111)](){[1

)]

(1[1)()~

(ββμβμββ==+=+==X

X

E n X E X X n

E X X Y E E t t t t

这里用到了t

X 的非随机性。 对于)

/()(?

21

∑∑=t t t X Y X β,求期望

)/()?(21

∑∑=t t t X Y X E E β

12212122)()1()()1(

)]([)1

()()1(βμβμβ=+=+==∑∑∑∑∑∑∑∑t t t

t t t t t t t t t E X X X X X X E X Y X E X

(3)要想拟合值X Y 1

??β=通过点),(Y X ,X 1

?β必须等

于Y 。但X X

Y

X X t

t t ∑

∑=2

1

?β,通常不等于Y 。这就意味着点),(Y X 不太可能位于直线X Y 1

??β=上。

相反地,由于Y X =1

,所以直线X Y 1

~?β=经过点)

,(Y X 。

(4)OLS 方法要求残差平方和最小

Min ∑∑-==2

1

2

)?(t

t

t

X Y e RSS β

关于1

?β求偏导得

0))(?(2?11

=--=??∑t

t t X X Y RSS ββ

即 0)?(1

=-∑t

t

t

X Y X β ()()∑

∑=2

1

?i

i

i X Y X β 可见1

?β是OLS 估计量。

例5.假设模型为t

t t

X Y

μβα++=。给定n 个观察值

)

,(11Y X ,)

,(22

Y X

,…,)

,(n n

Y X

,按如下步骤建立β的一

个估计量:在散点图上把第1个点和第2个点连接起来并计算该直线的斜率;同理继续,最终将第1个点和最后一个点连接起来并计算该条线的斜率;最后对这些斜率取平均值,称之为β?,即β的估计值。

(1)画出散点图,给出β?的几何表示并推出代数表达式。

(2)计算β?的期望值并对所做假设进行陈述。这个估计值是有偏的还是无偏的?解释理由。 (3)证明为什么该估计值不如我们以前用OLS 方法所获得的估计值,并做具体解释。 解答:

(1)散点图如下图所示。

(X 2,Y 2)

(X n ,Y n )

(X 1,Y 1)

首先计算每条直线的斜率并求平均斜率。连接

),(11Y X 和),(t

t

Y X 的直线斜率为)

/()(11

X X

Y Y t

t

--。由于共有

n

-1条这样的直线,因此

][11?21

1

∑==---=n t t t t X X Y Y n β

(2)因为X 非随机且0)(=t

E μ,因此

β

μμβμβαμβα=--+=-++-++=--][])()([][

1

1

11111X X E X X X X E X X Y Y E t t t t t t t

这意味着求和中的每一项都有期望值β,所以平均值也会有同样的期望值,则表明是无偏的。 (3)根据高斯-马尔可夫定理,只有β的OLS 估计量是最付佳线性无偏估计量,因此,这里得到的β?的有效性不如β的OLS 估计量,所以较差。

例6.对于人均存款与人均收入之间的关系式

t

t t Y S μβα++=使用美国36年的年度数据得如下估计

模型,括号内为标准差:

)

011.0()

105.151(067.0105.384?t

t Y S +=

2

R =0.538

023.199?=σ

(1)β的经济解释是什么?

(2)α和β的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?

(3)对于拟合优度你有什么看法吗?

(4)检验是否每一个回归系数都与零显著不同(在1%水平下)。同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么?

解答:

(1)β为收入的边际储蓄倾向,表示人均收入每增加1美元时人均储蓄的预期平均变化量。

(2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此α符号应为负。储蓄是收入的一部分,且会随着收入的增加而增加,因此预期β的符号为正。实际的回归式中,β的符号为正,与预期的一致。但截距项为负,与预期不符。这可能与由于模型的错误设定形造成的。如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对截距项的估计产生影响;另一种可能就是线性设定可能不正确。

(3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中53.8%的拟合优度,表明收入的变化可以解释储蓄中53.8 %的变动。

(4)检验单个参数采用t检验,零假设为参数为零,备择假设为参数不为零。双变量情形下在零假设下t 分布的自由度为n-2=36-2=34。由t分布表知,双侧1%下的临界值位于2.750与2.704之间。斜率项计算的t值为0.067/0.011=6.09,截距项计算的t值为384.105/151.105=2.54。可见斜率项计算的t 值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设。

三、习题

(一)基本知识类题型

2-1.解释下列概念:

1)总体回归函数

2)样本回归函数

3)随机的总体回归函

4)线性回归模型5)随机误差项(u i)和残差项(e i)

6)条件期望

7)非条件期望

8)回归系数或回归参

9)回归系数的估计量

10)最小平方法

11)最大似然法

12)估计量的标准差

13)总离差平方和14)回归平方和

15)残差平方和

16)协方差

17)拟合优度检验

18)t检验

19)F检验

2-2.判断正误并说明理由:

1)随机误差项u i和残差项e i是一回事

2)总体回归函数给出了对应于每一个自变量的

因变量的值

3)线性回归模型意味着变量是线性的

4)在线性回归模型中,解释变量是原因,被解释

变量是结果

5)随机变量的条件均值与非条件均值是一回事

2-3.回答下列问题:

1)线性回归模型有哪些基本假设?违背基本假

设的计量经济学模型是否就不可估计?

2)总体方差与参数估计误差的区别与联系。

3)随机误差项u i和残差项e i的区别与联系。

4)根据最小二乘原理,所估计的模型已经使得拟

合误差达到最小,为什么还要讨论模型的拟合优度问题?

5) 为什么用决定系数R 2评价拟合优度,而不用残差平方和作为评价标准? 6) R2检验与F 检验的区别与联系。 7) 回归分析与相关分析的区别与联系。 8) 最小二乘法和最大似然法的基本原理各是什么?说明它们有何区别?

9) 为什么要进行解释变量的显著性检验? 10) 是否任何两个变量之间的关系,都可以用两变量线性回归模型进行分析?

2-2.下列方程哪些是正确的?哪些是错误的?为什么? ⑴ y x t n

t t =+=αβ12,,,Λ ⑵ y x t n

t t t

=++=αβμ12,,,Λ ⑶ y x t n t t t =++=??,,,αβμ12Λ ⑷ ???,,,y x t n t t t =++=αβμ12Λ

⑸ y x t n t t =+=??,,,αβ12Λ ⑹ ???,,,y x t n

t t =+=αβ12Λ ⑺ y x t n t t t =++=???,,,αβμ12Λ ⑻

????,,,y x t n

t t t

=++=αβμ12Λ

其中带“^”者表示“估计值”。

2-3.下表列出若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正的、负的、还是无法确定?并说明理由。

因变量

自变量

GNP 利率 个人储蓄 利率 小麦产出 降雨量

美国国防开支

前苏联国防开支 棒球明星本垒打的次数 其年薪 总统声誉

任职时间 学生计量经济学成绩 其统计学成绩 日本汽车的进口量

美国人均国民收入

(二)基本证明与问答类题型

2-4.对于一元线性回归模型,试证明: (1)i

i

x y E βα+=)(

(2)2

)(σ=i

y D

(3)0),(=j

i

y y Cov

j

i ≠

2-5.参数估计量的无偏性和有效性的含义是什么?从参数估计量的无偏性和有效性证明过程说明,为什么说满足基本假设的计量经济学模型的普通最小二乘参数估计量才具有无偏性和有效性?

2-6.对于过原点回归模型i

i i

u X Y

+=1β ,试证明

∑=

22

1)(i

u X

Var σβ

2-7. 试证明: (1)0

=∑i

e

,从而:0=e (2)0

=∑i

i x

e

(3)0

=∧

∑i

i

Y e ;即残差i

e 与i

Y 的估计值之积的和为

零。

2-8.为什么在一元线性方程中,最小二乘估计量与极大似然估计量的表达式是一致的?证明:σ2

的ML 估计量为∑=∧=n i i

n 1

2

~

2

1σσ ,并且是有偏

的。

2-9.熟悉t 统计量的计算方法和查表判断。 2-10.证明:2

2

)(yx r R

= ;其中R 2是一元线性回归

模型的判定系数,yx

r 是y 与x 的相关系数。

2-11. 试根据置信区间的概念解释t 检验的概率意义,即证明:对于显著性水平α,当2

α

t t i

>时,

b i 的100(1-α)%的置信区间不包含0。 2-12.线性回归模型 y x t n t

t

t

=++=αβμ12,,,Λ

的0均值假设是否可以表示为1

1

n

t

t n

μ

=∑=?为什么?

2-13.现代投资分析的特征线涉及如下回归方程:t

mt t

u r r

++=10ββ;其中:r 表示股票或债券的收

益率;r m 表示有价证券的收益率(用市场指数表示,如标准普尔500指数);t 表示时间。在投资分析中,β1被称为债券的安全系数β,是用来度量市场的风险程度的,即市场的发展对公司的财产有何影响。依据1956~1976年间240个月的数据,Fogler 和Ganpathy 得到IBM 股票的回归方程;市场指数是在芝加哥大学建立的市场有价证券指数:

mt t r r 0598.17264.0+=∧

4710

.02=r

(0.3001) (0.0728)

要求:(1)解释回归参数的意义;(2)如何解释r 2?(3)安全系数β>1的证券称为不稳定证券,建立适当的零假设及备选假设,并用t 检验进行检验(α=5%)。 2-14. 已知模型i

i i

u x Y

++=βα,证明:估计量α可

以表示为:i

i

n i y W x n

)1

(1

-=∑=∧

α 这里∑?

?

=

2

i

i

i

x x W

2-15.已知两个量X 和Y 的一组观察值(x i ,y i ),i=1,2,…,n 。

证明:Y 的真实值和拟合值有共同的均值。 2-16.一个消费分析者论证了消费函数i

i

bY a C

+=是

无用的,因为散点图上的点(i

C ,i

Y )不在直线

i

i bY a C +=上。他还注意到,有时Y i 上升但C i 下降。

因此他下结论:C i 不是Y i 的函数。请你评价他的论据(这里C i 是消费,Y i 是收入)。 2-17.证明:仅当R 2=1时,y 对x 的线性回归的斜率估计量等于x 对y 的线性回归的斜率估计量的倒数。

2-18.证明:相关系数的另一个表达式是:y

x S S

r ∧

其中∧

β为一元线性回归模型一次项系数的估计

值,S x 、S y 分别为样本标准差。 2-19.对于经济计量模型:i

i i

u X b b Y

++=10 ,其OLS

估计参数1

b 的特性在下列情况下会受到什么影响:(1)观测值数目n 增加;(2)Xi 各观测值差额增加;(3)Xi 各观测值近似相等;(4)E (u 2)=0 。

2-20.假定有如下的回归结果:t

t

X Y

4795.06911.2-=∧,

其中,Y 表示美国的咖啡的消费量(每天每人消费的杯数),X 表示咖啡的零售价格(美元/杯),t 表示时间。 要求:

(1)这是一个时间序列回归还是横截面序列回归?做出回归线;

(2)如何解释截距的意义,它有经济含义吗?如何解释斜率?

(3)能否求出真实的总体回归函数? (4)根据需求的价格弹性定义:弹性=斜率×(X/Y ),依据上述回归结果,你能求出对咖啡需求的价格弹性吗?如果不能,计算此弹性还需要其他什么信息? (三)基本计算类题型

2-21.下面数据是对X 和Y 的观察值得到的。 ∑Y i =1110; ∑X i =1680; ∑X i Y i =204200 ∑X i 2=315400; ∑Y i 2=133300

假定满足所有的古典线性回归模型的假设,要求:(1)b 1和b 2?(2)b 1和b 2的标准差?(3)r 2?(4)对B 1、B 2分别建立95%的置信区间?利用置信区间法,你可以接受零假设:B 2=0吗? 2-22.假设王先生估计消费函数(用模型

i

i i u bY a C ++=表示),并获得下列结果:

i

i Y C 81.015+=∧

,n=19

(3.1) (18.7) R 2=0.98 这里括号里的数字表示相应参数的T 比率值。

要求:(1)利用T 比率值检验假设:b=0(取显著水平为5%);(2)确定参数估计量的标准方

差;(3)构造b的95%的置信区间,这个区间包括0吗?

2-23.下表给出了每周家庭的消费支出Y(美元)与每周的家庭的收入X(美元)的数据。

每周收入(X)每周消费支出(Y)

80 55,60,65,70,75

100 65,70,74,80,85,88

120 79,84,90,94,98

140 80,93,95,103,108,113,115

160 102,107,110,116,118,125

180 110,115,120,130,135,140

200 120,136,140,144,145

220 135,137,140,152,157,160,162

240 137,145,155,165,175,189

260 150,152,175,178,180,185,191

要求:

(1)对每一收入水平,计算平均的消费支出,E (Y︱X i),即条件期望值;

(2)以收入为横轴、消费支出为纵轴作散点图;(3)在散点图中,做出(1)中的条件均值点;(4)你认为X与Y之间、X与Y的均值之间的关系如何?

(5)写出其总体回归函数及样本回归函数;总体回归函数是线性的还是非线性的?

2-24.根据上题中给出的数据,对每一个X值,随机抽取一个Y值,结果如下:

Y 70 65 90 95 110 115 120 140 155 150

X 80 100 120 140 160 180 200 220 240 260

多元线性回归模型的案例分析

1. 表1列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ,鸡肉价格P 1,猪肉价格P 2与牛肉价格P 3的相关数据。 年份 Y/千 克 X/ 元 P 1/(元/千克) P 2/(元/千克) P 3/(元/千克) 年份 Y/千克 X/元 P 1/(元/ 千克) P 2/(元/ 千克) P 3/(元/千克) 1980 2.78 397 4.22 5.07 7.83 1992 4.18 911 3.97 7.91 11.40 1981 2.99 413 3.81 5.20 7.92 1993 4.04 931 5.21 9.54 12.41 1982 2.98 439 4.03 5.40 7.92 1994 4.07 1021 4.89 9.42 12.76 1983 3.08 459 3.95 5.53 7.92 1995 4.01 1165 5.83 12.35 14.29 1984 3.12 492 3.73 5.47 7.74 1996 4.27 1349 5.79 12.99 14.36 1985 3.33 528 3.81 6.37 8.02 1997 4.41 1449 5.67 11.76 13.92 1986 3.56 560 3.93 6.98 8.04 1998 4.67 1575 6.37 13.09 16.55 1987 3.64 624 3.78 6.59 8.39 1999 5.06 1759 6.16 12.98 20.33 1988 3.67 666 3.84 6.45 8.55 2000 5.01 1994 5.89 12.80 21.96 1989 3.84 717 4.01 7.00 9.37 2001 5.17 2258 6.64 14.10 22.16 1990 4.04 768 3.86 7.32 10.61 2002 5.29 2478 7.04 16.82 23.26 1991 4.03 843 3.98 6.78 10.48 (1) 求出该地区关于家庭鸡肉消费需求的如下模型: 01213243ln ln ln ln ln Y X P P P u βββββ=+++++ (2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。 先做回归分析,过程如下: 输出结果如下:

案例分析(一元线性回归模型)

案例分析报告(2014——2015学年第一学期) 课程名称:预测与决策 专业班级:电子商务1202 学号:2204120202 学生姓名:陈维维 2014 年11月

案例分析(一元线性回归模型) 我国城镇居民家庭人均消费支出预测 一、研究目的与要求 居民消费在社会经济的持续发展中有着重要的作用,居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。从理论角度讲,消费需求的具体内容主要体现在消费结构上,要增加居民消费,就要从研究居民消费结构入手,只有了解居民消费结构变化的趋势和规律,掌握消费需求的热点和发展方向,才能为消费者提供良好的政策环境,引导消费者合理扩大消费,才能促进产业结构调整与消费结构优化升级相协调,才能推动国民经济平稳、健康发展。例如,2008年全国城镇居民家庭平均每人每年消费支出为11242.85元,最低的青海省仅为人均8192.56元,最高的上海市达人均19397.89元,上海是黑龙江的2.37倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定 我研究的对象是各地区居民消费的差异。居民消费可分为城镇居民消费和农村居民消费,由于各地区的城镇与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城镇居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。 所以模型的被解释变量Y选定为“城镇居民每人每年的平均消费支出”。 因为研究的目的是各地区城镇居民消费的差异,并不是城镇居民消费在不同时间的变动,所以应选择同一时期各地区城镇居民的消费支出来建立模型。因此建立的是2008年截面数据模型。影响各地区城镇居民人均消费支

经典线性回归模型

2 经典线性回归模型 §2.1 概念与记号 1.线性回归模型是用来描述一个特定变量y 与其它一些变量x 1,…,x p 之间的关系。 2. 称特定变量y 为因变量 (dependent variable )、 被解释变量 (explained variable )、 响应变量(response variable )、被预测变量(predicted variable )、回归子 (regressand )。 3.称与特定变量相关的其它一些变量x 1,…,x p 为自变量(independent variable )、 解释变量(explanatory variable )、控制变量(control variable )、预测变量 (predictor variable )、回归量(regressor )、协变量(covariate )。 4.假定我们观测到上述这些变量的n 组值:( ) ip i i x x y , , , 1 L (i=1,…,n)。称 这n 组值为样本(sample )或数据(data )。 §2.2 经典线性回归模型的假定 假定 2.1(线性性(linearity)) i ip p i i x x y e b b b + + + + = L 1 1 0 (i=1,…,n)。 (2.1) 称方程(2.1)为因变量y 对自变量x 1,…,x p 的线性回归方程(linear regression equation ),其中 ( ) p , k k , , 1 0 L = b 是待估的未知参数(unknown parameters ), ( ) n i i , , 1 L = e 是满足一定限制条件的无法观测的误差项(unobserved error term ) 。称自 变量的函数 ip p i x x b b b + + + L 1 1 0 为回归函数(regression function )或简称为回归 (regression )。称 0 b 为回归的截距(ntercept),称 ( ) p k k , , 1 L = b 为自变量的回归系数 (regression coefficients ) 。某个自变量的回归系数表示在其它条件保持不变的情况下,

计量经济学知识点整理:联立方程

联立方程模型 一、概念: 联立方程模型系统将变量分为内生变量和外生变量两大类。 由系统决定的,同时也对模型系统产生影响,它会受到随机项的影 响。一般都是经济变量。每一个内生变量的值都要利用模型中的全 部方程才能决定。 外生变量:是不由系统决定的变量,是系统外变量,取值由系统外决定。一般是确定性变量,或者是具有临界概率分布的随机变量,其参数不是 模型系统研究的元素。外生变量影响系统,但本身不受系统的影响。 外生变量一般是经济变量、条件变量、政策变量、虚变量。 先决变量:外生变量和滞后内生变量 注:联立方程模型中有多少个内生变量就必定有多少个方程 :根据经济理论和行为规律建立的描述经济变量之间直接结构关系 的计量经济学方程系统称为结构式模型。 结构方程的正规形式:将一个内生变量表示为其他内生变量、先 决变量和随机干扰项的函数形式 完备的结构式模型:g个内生变量、k个先决变量、g个结构方程 行为方程:描述变量之间经验关系的方程,含有未知的参数和随 机扰动项。例如:凯恩斯收入决定模型中的消费函数 制度方程:由法律、制度、政策等制度性规定的经济变量之间的 函数关系,如税收方程。 恒等式:定义方程式和平衡方程。 简化式模型:用所有先决变量作为每个内生变量的解释变量所形成的模型。 参数关系体系:描述简化式参数与结构式参数之间的关系。

二、识别 方程之间的关系有严格的要求,一个方程模型想要能估计,必须可识别。 ∴进行模型的估计之前需要判断模型是否可以识别(即是否能被估计)。 1、识别的基本定义:是否具有确定的统计形式。 注:识别的定义是针对结构方程而言的。 模型中每个需要估计其参数的随机方程都存在识别问题。 如果一个模型中的所有随机方程都是可以识别的,则认为该联立方程模型 系统是可以识别的。反之不识别。 恒等方程由于不存在参数估计问题,所以也不存在识别问题。但是,在判 断随机方程的识别性问题时,应该将恒等方程考虑在内。 恰好识别:某一个随机方程只有一组参数估计量 过度识别:某一个随机方程具有多组参数估计量 方程的线性组合是否得到的新方程具有与消费方程相同的统计形式,决定了方程也是否是可以识别的。 2、如何修改模型使不可识别的方程变成可以识别 (1)或者在其它方程中增加变量; (2)或者在该不可识别方程中减少变量。 (3)必须保持经济意义的合理性。 3、识 别条件 结构式: B ΓN Y X +=

一元线性回归模型案例分析

一元线性回归模型案例分析 一、研究的目的要求 居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。例如,2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元,最高的上海市达人均10464元,上海是黑龙江的2.35倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定 我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y 选定为“城市居民每人每年的平均消费支出”。 因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2002年截面数据模型。 影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 从2002年《中国统计年鉴》中得到表2.5的数据: 表2.52002年中国各地区城市居民人均年消费支出和可支配收入

经典单方程计量经济学模型多元线性回归模型

第三章、经典单方程计量经济学模型:多元线性回归模型 一、内容提要 本章将一元回归模型拓展到了多元回归模型,其基本的建模思想与建模方法与一元的情形相同。主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方面的应用等方面。只不过为了多元建模的需要,在基本假设方面以及检验方面有所扩充。 本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。与一元回归分析相比,多元回归分析的基本假设中引入了多个解释变量间不存在(完全)多重共线性这一假设;在检验部分,一方面引入了修正的可决系数,另一方面引入了对多个解释变量是否对被解释变量有显著线性影响关系的联合性F检验,并讨论了F检验与拟合优度检验的内在联系。 本章的另一个重点是将线性回归模型拓展到非线性回归模型,主要学习非线性模型如何转化为线性回归模型的常见类型与方法。这里需要注意各回归参数的具体经济含义。 本章第三个学习重点是关于模型的约束性检验问题,包括参数的线性约束与非线性约束检验。参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检验以及参数的稳定性检验三方面的内容,其中参数稳定性检验又包括邹氏参数稳定性检验与邹氏预测检验两种类型的检验。检验都是以F检验为主要检验工具,以受约束模型与无约束模型是否有显著差异为检验基点。参数的非线性约束检验主要包括最大似然比检验、沃尔德检验与拉格朗日乘数检验。它们仍以估计无约束模型与受约束模型为基础,但以最大似然 χ分布为检验统计原理进行估计,且都适用于大样本情形,都以约束条件个数为自由度的2 量的分布特征。非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。 二、典型例题分析 例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为36 .0 . + = - 10+ 094 medu fedu .0 sibs edu210 131 .0 R2=0.214 式中,edu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,medu与fedu分别为母亲与父亲受到教育的年数。问

多元线性回归模型案例分析

多元线性回归模型案例分析 ——中国人口自然增长分析一·研究目的要求 中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的降到1980年,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。 影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。 二·模型设定 为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。 从《中国统计年鉴》收集到以下数据(见表1): 表1 中国人口增长率及相关数据

, 设定的线性回归模型为: 1222334t t t t t Y X X X u ββββ=++++ 三、估计参数 利用EViews 估计模型的参数,方法是: 1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对 话框“Workfile Range ”。在“Workfile frequency ”中选择“Annual ” (年 年份 @ 人口自然增长率 (%。) 国民总收入 (亿元) 居民消费价格指数增长 率(CPI )% 人均GDP (元) 1988 15037 1366 1989 … 17001 18 1519 1990 18718 1644 1991 【 21826 1893 1992 26937 2311 1993 . 35260 2998 1994 48108 4044 1995 — 59811 5046 1996 70142 5846 1997 ~ 78061 6420 1998 83024 6796 1999 【 88479 7159 2000 98000 7858 2001 [ 108068 8622 2002 119096 9398 2003 : 135174 10542 2004 159587 12336 2005 、 184089 14040 2006 213132 16024

经典线性回归模型的诊断与修正

经典线性回归模型的诊断与修正下表为最近20年我国全社会固定资产投资与GDP的统计数据:1 年份国内生产总值(亿元)GDP 全社会固定资产投资(亿元)PI 1996 71813.6 22913.5 1997 79715 24941.1 1998 85195.5 28406.2 1999 90564.4 29854.7 2000 100280.1 32917.7 2001 110863.1 37213.49 2002 121717.4 43499.91 2003 137422 55566.61 2004 161840.2 70477.43 2005 187318.9 88773.61 2006 219438.5 109998.16 2007 270232.3 137323.94 2008 319515.5 172828.4 2009 349081.4 224598.77 2010 413030.3 251683.77 2011 489300.6 311485.13 2012 540367.4 374694.74 2013 595244.4 446294.09 1数据来源于国家统计局网站年度数据

1、普通最小二乘法回归结果如下: 方程初步估计为: GDP=75906.54+1.1754PI (32.351) R2=0.9822F=1046.599 DW=0.3653 2、异方差的检验与修正 首先,用图示检验法,生成残差平方和与解释变量PI的散点图如下:

从上图可以看出,残差平方和与解释变量的散点图主要分布在图形的下半部分,有随PI的变动增大的趋势,因此,模型可能存在异方差。但是否确定存在异方差,还需作进一步的验证。 G-Q检验如下: 去除序列中间约1/4的部分后,1996-2003年的OLS估计结果如下所示:

案例分析 一元线性回归模型

案例分析报告 (2014——2015学年第一学期) 课程名称:预测与决策 专业班级:电子商务1202 学号: 2204120202 学生姓名:陈维维 2014 年 11月 案例分析(一元线性回归模型) 我国城镇居民家庭人均消费支出预测 一、研究目的与要求 居民消费在社会经济的持续发展中有着重要的作用,居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。从理论角度讲,消费需求的具体内容主要体现在消费结构上,要增加居民消费,就要从研究居民消费结构入手,只有了解居民消费结构变化的趋势和规律,掌握消费需求的热点和发展方向,才能为消费者提供良好的政策环境,引导消费者合理扩大消费,才能促进产业结构调整与消费结构优化升级相协调,才能推动国民经济平稳、健康发展。例如,2008年全国城镇居民家庭平均每人每年消费支出为11242.85元,?最低的青海省仅为人均8192.56元,最高的上海市达人均19397.89元,上海是黑龙江的2.37倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定?

我研究的对象是各地区居民消费的差异。居民消费可分为城镇居民消费和农村居民消费,由于各地区的城镇与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城镇居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。 所以模型的被解释变量Y选定为“城镇居民每人每年的平均消费支出”。 因为研究的目的是各地区城镇居民消费的差异,并不是城镇居民消费在不同时间的变动,所以应选择同一时期各地区城镇居民的消费支出来建立模型。因此建立的是2008年截面数据模型。影响各地区城镇居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。 为了与“城镇居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 以下是2008年各地区城镇居民人均年消费支出和可支配收入表

一元线性回归分析的结果解释

一元线性回归分析的结果解释 1.基本描述性统计量 分析:上表是描述性统计量的结果,显示了变量y和x的均数(Mean)、标准差(Std. Deviation)和例数(N)。 2.相关系数 分析:上表是相关系数的结果。从表中可以看出,Pearson相关系数为0.749,单尾显著性检验的概率p值为0.003,小于0.05,所以体重和肺活量之间具有较强的相关性。 3.引入或剔除变量表

分析:上表显示回归分析的方法以及变量被剔除或引入的信息。表中显示回归方法是用强迫引入法引入变量x的。对于一元线性回归问题,由于只有一个自变量,所以此表意义不大。 4.模型摘要 分析:上表是模型摘要。表中显示两变量的相关系数(R)为0.749,判定系数(R Square)为0.562,调整判定系数(Adjusted R Square)为0.518,估计值的标准误差(Std. Error of the Estimate)为0.28775。 5.方差分析表 分析:上表是回归分析的方差分析表(ANOVA)。从表中可以看出,回归的均方(Regression Mean Square)为1.061,剩余的均方(Residual Mean Square)为0.083,F检验统计量的观察值为12.817,相应的概率p 值为0.005,小于0.05,可以认为变量x和y之间存在线性关系。

6.回归系数 分析:上表给出线性回归方程中的参数(Coefficients)和常数项(Constant)的估计值,其中常数项系数为0(注:若精确到小数点后6位,那么应该是0.000413),回归系数为0.059,线性回归参数的标准误差(Std. Error)为0.016,标准化回归系数(Beta)为0.749,回归系数T检验的t统计量观察值为3.580,T检验的概率p值为0.005,小于0.05,所以可以认为回归系数有显著意义。由此可得线性回归方程为: y=0.000413+0.059x 7.回归诊断 分析:上表是对全部观察单位进行回归诊断(Casewise Diagnostics-all cases)的结果显示。从表中可以看出每一例的标准

现代计量经济学模型体系解析

#学术探讨# 现代计量经济学模型体系解析* 李子奈刘亚清 内容提要:本文对现代计量经济学模型体系进行了系统的解析,指出了现代计量经济学的各个分支是以问题为导向,在经典计量经济学模型理论的基础上,发展成为相对独立的模型理论体系,包括基于研究对象和数据特征而发展的微观计量经济学、基于充分利用数据信息而发展的面板数据计量经济学、基于计量经济学模型的数学基础而发展的现代时间序列计量经济学、基于非设定的模型结构而发展的非参数计量经济学,并对每个分支进行了扼要的描述。最后在/交叉与综合0的方向上提出了现代计量经济学模型理论的研究前沿领域。 关键词:经典计量经济学时间序列计量经济学微观计量经济学 一、引言 计量经济学自20世纪20年代末30年代初诞生以来,已经形成了十分丰富的内容体系。一般认为,可以以20世纪70年代为界将计量经济学分为经典计量经济学(Classical Econometrics)和现代计量经济学(Mo dern Eco no metr ics),而现代计量经济学又可以分为四个分支:时间序列计量经济学(Tim e Ser ies Econo metrics)、微观计量经济学(M-i cro-econometrics)、非参数计量经济学(Nonpara-m etric Econometrics)以及面板数据计量经济学(Panel Data Eco nom etrics)。这些分支作为独立的课程已经被列入经济学研究生的课程表,独立的教科书也已陆续出版,应用研究已十分广泛,标志着它们作为计量经济学的分支学科已经成熟。 据此提出三个问题:一是经典计量经济学的地位问题。既然现代计量经济学模型体系已经成熟,而且它们都是在经典模型理论的基础上发展的,那么经典模型还有应用价值吗?是不是凡是采用经典模型的研究都是低水平和落后的?二是现代计量经济学的各个分支的发展导向问题。即它们是如何发展起来的?三是现代计量经济学进一步创新和发展的基点在哪里?回答这些问题,对于正确理解计量经济学的学科体系,对于计量经济学的课程设计和教学内容安排,对于正确评价计量经济学理论和应用研究的水平,对于进一步推动中国的计量经济学理论研究,都是十分有益的。 现代计量经济学的各个分支是以问题为导向,以经典计量经济学模型理论为基础而发展起来的。所谓/问题0,包括研究对象和表征研究对象状态和变化的数据。研究对象不同,表征研究对象状态和变化的数据具有不同的特征,用以进行经验实证研究的计量经济学模型既然不同,已有的模型理论方法不适用了,就需要发展新的模型理论方法。按照这个思路,就可以用图1简单地描述经典计量经济学模型与现代计量经济学模型各个分支之间的关系。 本文试图从方法论的角度对现代计量经济学模型的发展,特别是现代计量经济学模型与经典计量经济学模型之间的关系进行较为系统的讨论,以期对未来我国计量经济学的发展研究提供借鉴和启示。本文的内容安排如下:首先分析经典计量经济学模型的基础地位,明确它在现代的应用价值,同时对发生于20世纪70年代的/卢卡斯批判0的实质进行讨论;然后依次讨论时间序列计量经济学、微观计量经济学、非参数计量经济学以及面板数据计量经济学的发展,回答它们是以什么问题为导向,以什么为目的而发展的;最后以/现代计量经济学模型体系的分解与综合0为题,讨论现代计量经济学的前沿研究领域以及从对我国计量经济学理论的创新和发展 ) 22 ) *本文受国家社会科学基金重点项目(08AJY001,计量经济学模型方法论基础研究)的资助。

计量经济学:联立方程部分习题以及解析

第六章 经典联立方程计量经济学模型:理论与方法 一、内容提要 联立方程计量经济学模型是相对于单一方程模型提出来的,旨在在讨论多个经济变量相互影响的错综复杂的运行规律,或者说讨论多个内生变量被联立决定的问题。 本章学习内容的一个重点是关于联立方程计量经济学模型区别于单方程模型的若干基本概念,包括内生变量、外生变量、前定变量的概念;结构式模型、简化式模型的概念;随机方程、恒等方程的概念;行为方程、技术方程、制度方程、统计方程、定义方程、平衡方程等相关概念。 本章学习的另一个重点是联立模型的识别问题。需掌握模型识别的基本概念、模型识别的类型(不可识别、恰好识别、过渡识别)、模型的结构式识别条件、模型的简化式识别条件以及实际应用中的经验识别方法。 本章学习的第三个重点是联立模型的估计问题。首先明确联立模型估计时会遇到的三个方面的问题。一是随机解释变量问题,即模型中的某些解释变量也能是与随机扰动项相关的随机解释变量;二是损失变量信息的问题,即以单方程方法估计模型时会损失其他方程变量所提供的信息;三是损失方程之间的相关性信息问题,即以单方程方法估计模型时会损失不同方程随机扰动项间的相关性方面的一些信息。其次,需要掌握联立模型两大类估计方法中的主要估计方法,如单方程估计方法中的狭义工具变量法(IV )、间接最小二乘法(ILS )、二阶段最小二乘法(2SLS ),系统估计方法中的三阶段最小二乘法(3SLS )等。 本章学习中不容忽视的还有联立方程计量经济学模型估计方法的比较,以及联立方程模型的检验问题。前者需要考察大样本估计量特性与小样本估计量的特性;后者包括拟合效果检验、预测性检验、方程间误差传递检验等方面的内容。 二、典型例题分析 1、如果我们将“供给”1Y 与“需求”2Y 写成如下的联立方程的形式:

多元线性回归模型案例

我国农民收入影响因素的回归分析 本文力图应用适当的多元线性回归模型,对有关农民收入的历史数据和现状进行分析,探讨影响农民收入的主要因素,并在此基础上对如何增加农民收入提出相应的政策建议。?农民收入水平的度量常采用人均纯收入指标。影响农民收入增长的因素是多方面的,既有结构性矛盾因素,又有体制性障碍因素。但可以归纳为以下几个方面:一是农产品收购价格水平。二是农业剩余劳动力转移水平。三是城市化、工业化水平。四是农业产业结构状况。五是农业投入水平。考虑到复杂性和可行性,所以对农业投入与农民收入,本文暂不作讨论。因此,以全国为例,把农民收入与各影响因素关系进行线性回归分析,并建立数学模型。 一、计量经济模型分析 (一)、数据搜集 根据以上分析,我们在影响农民收入因素中引入7个解释变量。即:2x -财政用于农业的支出的比重,3x -第二、三产业从业人数占全社会从业人数的比重,4x -非农村人口比重,5x -乡村从业人员占农村人口的比重,6x -农业总产值占农林牧总产值的比重,7x -农作物播种面积,8x —农村用电量。

资料来源《中国统计年鉴2006》。 (二)、计量经济学模型建立 我们设定模型为下面所示的形式: 利用Eviews 软件进行最小二乘估计,估计结果如下表所示: DependentVariable:Y Method:LeastSquares Sample: Includedobservations:19 Variable Coefficient t-Statistic Prob. C X1 X3 X4 X5 X6 X7 X8 R-squared Meandependentvar AdjustedR-squared 表1最小二乘估计结果 回归分析报告为: () ()()()()()()()()()()()()()()() 2345678 2? -1102.373-6.6354X +18.2294X +2.4300X -16.2374X -2.1552X +0.0100X +0.0634X 375.83 3.7813 2.066618.37034 5.8941 2.77080.002330.02128 -2.933 1.7558.820900.20316 2.7550.778 4.27881 2.97930.99582i Y SE t R ===---=230.99316519 1.99327374.66 R Df DW F ====二、计量经济学检验 (一)、多重共线性的检验及修正 ①、检验多重共线性 (a)、直观法 从“表1最小二乘估计结果”中可以看出,虽然模型的整体拟合的很好,但是x4x6

一元线性回归模型习题及答案解析

一元线性回归模型 一、单项选择题 1、变量之间的关系可以分为两大类__________。A A 函数关系与相关关系 B 线性相关关系和非线性相关关系 C 正相关关系和负相关关系 D 简单相关关系和复杂相关关系 2、相关关系是指__________。D A 变量间的非独立关系 B 变量间的因果关系 C 变量间的函数关系 D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________。A A 都是随机变量 B 都不是随机变量 C 一个是随机变量,一个不是随机变量 D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________。C A 01???t t Y X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+ 5、参数β的估计量?β 具备有效性是指__________。B A ?var ()=0β B ?var ()β为最小 C ?()0β β-= D ?()ββ-为最小 6、对于01??i i i Y X e ββ=++,以σ?表示估计标准误差,Y ?表示回归值,则__________。B A i i ??0Y Y 0σ∑ =时,(-)= B 2 i i ??0Y Y σ∑=时,(-)=0 C i i ??0Y Y σ∑=时,(-)为最小 D 2 i i ??0Y Y σ∑=时,(-)为最小 7、设样本回归模型为i 01i i ??Y =X +e ββ+,则普通最小二乘法确定的i ?β的公式中,错误的是__________。D A ()()()i i 1 2 i X X Y -Y ?X X β--∑∑= B ()i i i i 1 2 2 i i n X Y -X Y ?n X -X β ∑∑∑∑∑= C i i 1 2 2 i X Y -nXY ?X -nX β ∑∑= D i i i i 1 2 x n X Y -X Y ?β σ ∑∑∑= 8、对于i 01i i ??Y =X +e ββ+,以 ?σ表示估计标准误差,r 表示相关系数,则有__________。D A ?0r=1σ =时, B ?0r=-1σ =时, C ?0r=0σ =时, D ?0r=1r=-1σ =时,或 9、产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为?Y 356 1.5X -=,这说明__________。D

SPSS线性回归分析案例

回归分析 实验内容:基于居民消费性支出与居民可支配收入的简单线性回归分析 【研究目的】 居民消费在社会经济的持续发展中有着重要的作用。影响各地区居民消费支出的因素很多,例如居民的收入水平、商品价格水平、收入分配状况、消费者偏好、家庭财产状况、消费信贷状况、消费者年龄构成、社会保障制度、风俗习惯等等。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的经济模型去研究。 【模型设定】 : 我们研究的对象是各地区居民消费的差异。由于各地区的城市与农村人口比例及经济结构有较大差异,现选用城镇居民消费进行比较。模型中被解释变量Y选定为“城市居民每人每年的平均消费支出”。从理论和经验分析,影响居民消费水平的最主要因素是居民的可支配收入,故可以选用“城市居民每人每年可支配收入”作为解释变量X,选取2010年截面数据。 1、实验数据 表1: —

2010年中国各地区城市居民人均年消费支出和可支配收入

| 数据来源:《中国统计年鉴》2010年 2、实验过程 作城市居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)的散点图,如图1:

表2 模型汇总b — 模型 R R方调整R方标准估计的误差 - 1 .965a.932.930 ~ a.预测变量:(常量),可支配收入X(元)。 b.因变量:消费性支出Y(元) 表3 相关性 、 消费性支出Y (元) 可支配收入X(元) Pearson相关 性消费性支出Y(元)& .965 ! 从散点图可以看出居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)大体呈现为线性关系,所以建立如下线性模型:Y=a+bX

计量经济学简答题(经典)

1 ?什么是计量经济学?它与经济学、统计学和数学的关系怎样?答:1、计量经济学是一门运用经济理论和统计技术来分析经济数据的科学和艺术,它以经济理论为指导,以客观事实为依据,运用数学、统计学的方法和计算机技术,研究带有随机影响的经济变量之间的数量关系和规律。2、经济理论、数学和统计学知识是在计量经济学这一领域进行研究的必要前提,这三者中的每一个对于真正理解现代经济生活中的数量关系是必要的,但不充分,只有结合在一起才行。 2计量经济学三个要素是什么? 经济理论、经济数据和统计方法。 3. 计量经济学模型的检验包括哪几个方面?其具体含义是什么? 答:(1)经济意义检验,即根据拟定的符号、大小、关系,对参数估计结果的可靠性进行判断(2)统计检验,由数理统计理论决定。包括:拟合优度检验、总体显着性检验。(3)计量经济学检验,由计量经济学理论决定。包括:异方差性检验、序列相关性检验、多重共线性检验。(4)模型预测检验,由模型应用要求决定。包括:稳定性检验:扩大样本重新估计;预测性能检验:对样本外一点进行实际预测。 4. 计量经济学方法与一般经济数学方法有什么区别? 答:计量经济学揭示经济活动中各因素之间的定量关系,用随机性的数学方程加以描述;一般经济数学方法揭示经济活动中各因素之间的理论关系,用确定性的数学方程加以描述。 5. 计量经济学模型研究的经济关系有那两个基本特征? 答:一是随机关系,二是因果关系J - . ' /■ 6. 计量经济学研究的对象和核心内容是什么? 答:计量经济学的研究对象是经济现象,是研究经济现象中的具体数量规律。计量经济学的核心内容包括两个方面:一是方法论,即计量经济学方法或者理论计量经济学。二是应用,即应用计量经济学。 无论是理论计量经济学还是应用计量经济学,都包括理论、方法和数据三种要素。 7. 计量经济学中应用的数据类型怎样?举例解释其中三种数据类型的结构。 答:计量经济模型:WAGE二f(EDU,EXP,GEND,山 1)时间序列数据是按时间周期收集的数据,如年度或季度的国民生产总值。 2)横截面数据是在同一时间点手机的不同个体的数据。如世界各国某年国民生产总值。 3)混合数据是兼有时间序列和横截面成分的数据,女口 1985 —2010世界各国GDP数据。 8. 建立与应用计量经济学模型的主要步骤有哪些? (1)理论模型的设计(2)样本数据的收集(3)模型参数的估计(4)模型的检验 9. 用OLS建立多元线性回归模型,有哪些基本假设? 1、回归模型是线性的,模型设定无误且含有误差项 2、误差项总体均值为零 3、所有解释变量与误差 项都不相关4、误差项互不相关(不存在序列相关性)5、误差项具有同方差6、任何一个解释变量都不是其他解释变量的完全线性函数7、误差项服从正态分布。 10. 随机误差项包含哪些因素影响? 在解释变量中被忽略的因素的影响(影响不显着的因素、未知的影响因素、无法获得数据的因素);变量观测值的观测误差的影响;模型关系的设定误差的影响;其它随机因素的影响。 11. 为什么要计算调整后的可决系数? 在应用过程中发现,如果在模型中增加一个解释变量,?往往增大。这是因为残差平方和往往随着解 释变量的增加而减少,至少不会增加。这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。但是,现实情况往往是,由增加解释变量个数引起的的增大与拟合好坏无关,需调整。 =0.89表示被解释变量Y的变异性的89%能用估计的回归方程解释。 12. 叙述多重共线性的概念、后果和补救措施。 概念:如果两个或多于两个解释变量之间出现了相关性,则称模型存在多重共线性。 后果:1、估计量仍然是无偏的2、参数估计量的方差和标准差增大3、置信区间变宽4、t统计量会变 小5、估计量对模型设定的变化及其敏感6、对方程的整体拟合程度几乎没有影响7、回归系数符号

一元线性回归分析法

一元线性回归分析法 一元线性回归分析法是根据过去若干时期的产量和成本资料,利用最小二乘法“偏差平方和最小”的原理确定回归直线方程,从而推算出a(截距)和b(斜率),再通过y =a+bx 这个数学模型来预测计划产量下的产品总成本及单位成本的方法。 方程y =a+bx 中,参数a 与b 的计算如下: y b x a y bx n -==-∑∑ 222 n xy x y xy x y b n x (x)x x x --==--∑∑∑∑∑∑∑∑∑ 上式中,x 与y 分别是i x 与i y 的算术平均值,即 x =n x ∑ y =n y ∑ 为了保证预测模型的可靠性,必须对所建立的模型进行统计检验,以检查自变量与因变量之间线性关系的强弱程度。检验是通过计算方程的相关系数r 进行的。计算公式为: 22xy-x y r= (x x x)(y y y) --∑∑∑∑∑∑ 当r 的绝对值越接近于1时,表明自变量与因变量之间的线性关系越强,所建立的预测模型越可靠;当r =l 时,说明自变量与因变量成正相关,二者之间存在正比例关系;当r =—1时,说明白变量与因变量成负相关,二者之间存在反比例关系。反之,如果r 的绝对值越接近于0,情况刚好相反。 [例]以表1中的数据为例来具体说明一元线性回归分析法的运用。 表1: 根据表1计算出有关数据,如表2所示: 表2:

将表2中的有关数据代入公式计算可得: 1256750x == (件) 2256 1350y ==(元) 1750 9500613507501705006b 2=-??-?=(元/件) 100675011350a =?-=(元/件) 所建立的预测模型为: y =100+X 相关系数为: 9.011638 10500])1350(3059006[])750(955006[1350 750-1705006r 22==-??-???= 计算表明,相关系数r 接近于l ,说明产量与成本有较显著的线性关系,所建立的回归预测方程较为可靠。如果计划期预计产量为200件,则预计产品总成本为: y =100+1×200=300(元)

多元线性回归模型的案例讲解

多元线性回归模型的案 例讲解 Document number:NOCG-YUNOO-BUYTT-UU986-1986UT

1. 表1列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ,鸡肉价格P 1,猪肉价格P 2与牛肉价格P 3的相关数据。 年份 Y/ 千克 X/元 P 1/(元/千克) P 2/(元/千克) P 3/(元/千克) 年份 Y/ 千克 X/元 P 1/(元/千克) P 2/(元/千克) P 3/(元/ 千克) 1980 397 1992 911 1981 413 1993 931 1982 439 1994 1021 1983 459 1995 1165 1984 492 1996 1349 1985 528 1997 1449 1986 560 1998 1575 1987 624 1999 1759 1988 666 2000 1994 1989 717 2001 2258 1990 768 2002 2478 1991 843 (1) 求出该地区关于家庭鸡肉消费需求的如下模型: 01213243ln ln ln ln ln Y X P P P u βββββ=+++++ (2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。 先做回归分析,过程如下: 输出结果如下:

所以,回归方程为: 123ln 0.73150.3463ln 0.5021ln 0.1469ln 0.0872ln Y X P P P =-+-++ 由上述回归结果可以知道,鸡肉消费需求受家庭收入水平和鸡肉价格的影响,而牛肉价格和猪肉价格对鸡肉消费需求的影响并不显着。 验证猪肉价格和鸡肉价格是否有影响,可以通过赤池准则(AIC )和施瓦茨准则(SC )。若AIC 值或SC 值增加了,就应该去掉该解释变量。 去掉猪肉价格P 2与牛肉价格P 3重新进行回归分析,结果如下: Variable Coefficient Std. Error t-Statistic Prob.?? C LOG(X) LOG(P1) R-squared ????Mean dependent var Adjusted R-squared ????. dependent var . of regression ????Akaike info criterion Sum squared resid ????Schwarz criterion Log likelihood ????F-statistic Durbin-Watson stat ????Prob(F-statistic)

相关文档
最新文档