2 经典单方程计量经济学模型
合集下载
经典单方程模型

1、关于模型关系的假设
• 模型设定正确假设。The regression model is correctly specified. • 线性回归假设。The regression model is linear in the parameters。
Yi 0 1 X 1i 2 X 2 i k X ki i
ˆ e Y Xβ
e1 e2 e e n
四、经典线性回归模型的基本假设 The Basic Assumptions of Classical Linear Regression Model(CLRM)
说明
• 为保证参数估计量具有良好的性质,通常对模型 提出若干基本假设。 • 实际上这些假设与所采用的估计方法紧密相关。 • 下面的假设主要是针对采用普通最小二乘法 (Ordinary Least Squares, OLS)估计而提出的。 所以,在有些教科书中称为“The Assumption Underlying the Method of Least Squares”。 • 在不同的教科书上关于基本假设的陈述略有不同, 下面进行了重新归纳。
ˆ ˆ X ˆ X ˆ X ˆ Y i 0 1 1i 2 2i ki Ki
ˆ )2 Q ei2 (Yi Y i
i 1 i 1 n n
ˆ ˆ X ˆ X ˆ X )) (Yi ( 0 1 1i 2 2i k ki
§2 多元线性回归模型的估计
一、普通最小二乘估计
二、最大或然估计
三、矩估计 四、参数估计量的性质 五、样本容量问题 六、估计实例
说 明
估计方法: – 3大类方法:OLS、ML或者MM
2.1第二章 经典单方程计量经济学模型

正相关 线性相关 统计依赖关系 不相关 相关系数: 有因果关系 无因果关系 回归分析 相关分析 负相关 1 XY 1 正相关 非线性相关 不相关 负相关
2013-7-11
6
▲注意:
①不线性相关并不意味着不相关; ②有相关关系并不意味着一定有因果关系; ③回归分析/相关分析研究一个变量对另一个(些) 变量的统计依赖关系,但它们并不意味着一定有因 果关系。 ④相关分析和回归分析只是从数据出发定量地分 析经济变量间相互联系的手段,并不能决定经济现 象相互之间的本质联系。经济现象间内在的本质联 系和因果关系决定于它们的客观规律性,要结合实 践经验和经济理论来判断,所以在对经济问题进行 相关分析和回归分析时,要注意与定性的经济分析 相结合,才能得到有实际意义的结果。
引子:中国旅游业总收入将超过3000 亿美元吗?
◆从2004中国国际旅游交易会上获悉,到2020年,中国旅游 业总收入将超过3000亿美元,相当于国内生产总值的8%至 11%。(资料来源:国际金融报2004年11月25日第二版) 1、是什么决定性的因素能使中国旅游业总收入到2020年达到 3000亿美元? 2、旅游业的发展与这种决定性因素的数量关系究竟是什么?
共计
2013-7-11
2420
21450 21285
15510
22
分析: (1)由于不确定因素的影响,对同一收入水平 X,不同家庭的消费支出不完全相同; (2)但由于调查的完备性,给定收入水平X的 消费支出Y的分布是确定的,即以X的给定值为条件 的Y的条件分布(Conditional distribution)是已 知的, 如: P(Y=561|X=800)=1/4。 因此,给定收入X的值Xi,可得消费支出Y的条件 均值(conditional mean)或条件期望 (conditional expectation): E(Y|X=Xi) 该例中:E(Y | X=800)=605
2013-7-11
6
▲注意:
①不线性相关并不意味着不相关; ②有相关关系并不意味着一定有因果关系; ③回归分析/相关分析研究一个变量对另一个(些) 变量的统计依赖关系,但它们并不意味着一定有因 果关系。 ④相关分析和回归分析只是从数据出发定量地分 析经济变量间相互联系的手段,并不能决定经济现 象相互之间的本质联系。经济现象间内在的本质联 系和因果关系决定于它们的客观规律性,要结合实 践经验和经济理论来判断,所以在对经济问题进行 相关分析和回归分析时,要注意与定性的经济分析 相结合,才能得到有实际意义的结果。
引子:中国旅游业总收入将超过3000 亿美元吗?
◆从2004中国国际旅游交易会上获悉,到2020年,中国旅游 业总收入将超过3000亿美元,相当于国内生产总值的8%至 11%。(资料来源:国际金融报2004年11月25日第二版) 1、是什么决定性的因素能使中国旅游业总收入到2020年达到 3000亿美元? 2、旅游业的发展与这种决定性因素的数量关系究竟是什么?
共计
2013-7-11
2420
21450 21285
15510
22
分析: (1)由于不确定因素的影响,对同一收入水平 X,不同家庭的消费支出不完全相同; (2)但由于调查的完备性,给定收入水平X的 消费支出Y的分布是确定的,即以X的给定值为条件 的Y的条件分布(Conditional distribution)是已 知的, 如: P(Y=561|X=800)=1/4。 因此,给定收入X的值Xi,可得消费支出Y的条件 均值(conditional mean)或条件期望 (conditional expectation): E(Y|X=Xi) 该例中:E(Y | X=800)=605
李子奈《计量经济学》课后习题详解(经典单方程计量经济学模型:一元线性回归模型)【圣才出品】

2.下列计量经济学方程哪些是正确的?哪些是错误的?为什么?
(1)Yi=α+βXi,i=1,2,…,n;
(2)Yi=α+βXi+μi,i=1,2,…,n;
∧∧
(3)Yi=α+βXi+μi,i=1,2,…,n;
∧
∧∧
(4)Yi=α+βXi+μi,i=1,2,…,n;
∧∧
(5)Yi=α+βXi,i=1,2,…,n;
2 / 22
圣才电子书 十万种考研考证电子书、题库视频学习平台
www.10Leabharlann
假定随机扰动项满足条件零均值、条件同方差、条件序列丌相关性以及服从正态分布。 (2)违背基本假设的计量经济学仍然可以估计。虽然 OLS 估计值丌再满足有效性,但 仍然可以通过最大似然法等估计方法或修正 OLS 估计量来得到具有良好性质的估计值。
4.线性回归模型 Yi=α+βXi+μi,i=1,2,…,n 的零均值假设是否可以表示为
1
n
n i 1
i
0 ?为什么?
n
1 0 答:线性回归模型 Yi=α+βXi+μi 的零均值假设丌可以表示为
i
。
n i1
原因:零均值假设 E(μi)=0 实际上表示的是 E(μi∣Xi)=0,即当 X 取特定值 Xi 时,
3.一元线性回归模型的基本假设主要有哪些?违背基本假设的计量经济学模型是否就 丌可以估计?
答:(1)针对普通最小二乘法,一元线性回归模型的基本假设主要有以下三大类: ①关于模型设定的基本假设: 假定回归模型的设定是正确的,即模型的变量和函数形式均为正确的。 ②关于自变量的基本假设: 假定自变量具有样本变异性,且在无限样本中的方差趋于一个非零的有限常数。 ③关于随机干扰项的基本假设:
第二章 单方程计量经济模型理论与方法 一元线性回归模型

2020/1/6
※朱慧明 ※※ 湖南大学工商管理学院
24
▼回归分析的主要目的:根据样本回归函数 SRF,估计总体回归函数PRF。
即,根据 Yi Yˆi ei ˆ0 ˆ1Xi ei
估计
Yi E(Y | X i ) i 0 1 X i i
2020/1/6
Y为被解释变量,X为解释变量,0与1为待估参数, 为随机干扰项
2020/1/6
※朱慧明 ※※ 湖南大学工商管理学院
28
• 回归分析的主要目的是要通过样本回归函数(模型) SRF尽可能准确地估计总体回归函数(模型)PRF。
表 2.1.3 家庭消费支出与可支配收入的一个随机样本 Y 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 X 594 638 1122 1155 1408 1595 1969 2078 2585 2530
回答:能
2020/1/6
※朱慧明 ※※ 湖南大学工商管理学院
17
• 称为总体回归函数(PRF)的随机设定形式。表明被解 释变量除了受解释变量的系统性影响外,还受其他因素 的随机性影响。由于方程中引入了随机项,成为计量经 济学模型,因此也称为总体回归模型。
2020/1/6
※朱慧明 ※※ 湖南大学工商管理学院
18
• 随机误差项主要包括下列因素: –在解释变量中被忽略的因素的影响; –变量观测值的观测误差的影响; –模型关系的设定误差的影响; –其他随机因素的影响。
• 例2.1中,给定收入水平Xi ,个别家庭的支出可表示为 两部分之和:(1)该收入水平下所有家庭的平均消 费支出E(Y|Xi),称为系统性(systematic)或确定性 (deterministic)部分;(2)其他随机或非确定性
经典单方程计量经济学模型:一元线性回归模型

Yi 0 1Xi i
设由获得的样本观测值 (yi , xi ) ( i 1,2,, n) 去估计计量经济模型中的未知参数,
结果为
Yˆi ˆ0 ˆ1Xi 其能够很好的拟合样本数据。 Yˆi 为别 解释变量的估计值,它是由参数估计 量和解释变量的观测之计算得到的。 那么,被解释变量的估计值与观测值 应该在总体上最为接近。
ˆ i
~
N
(
i
,
c2
ii
)
(ˆ ) /
i
i
c2 ii
~
N (0,1)
而
ˆ 2 (n k 1) / 2 ee / 2 ~ 2 (n k 1)
则
(ˆ ) / c ee /(n k 1) ~ t(n k 1)
i
i
ii
可以用上述统计量检验解释变量系数是否为0,
原假设 H : 0 ,计算统计量
2
exp{
1
2 2
( yi
ˆ0
ˆ1xi )2}
i
1,2,n
联合密度(似然函数)
L(ˆ0, ˆ1, )
f ( y1,,
yn )
1
n
(2
)n
/
2
exp{
1
2
2
( yi
ˆ0
ˆ1xi )2}
或对数似然函数
L* ln(L) n ln(
2
)
1
2
2
( yi
ˆ0
ˆ1xi )2
极大化上式
ˆ0
ˆ1
1430 1650 1870 2112
1485 1716 1947 2200
2002
共计
2420 4950 11495 16445 19305 23870 25025 21450 21285 15510
设由获得的样本观测值 (yi , xi ) ( i 1,2,, n) 去估计计量经济模型中的未知参数,
结果为
Yˆi ˆ0 ˆ1Xi 其能够很好的拟合样本数据。 Yˆi 为别 解释变量的估计值,它是由参数估计 量和解释变量的观测之计算得到的。 那么,被解释变量的估计值与观测值 应该在总体上最为接近。
ˆ i
~
N
(
i
,
c2
ii
)
(ˆ ) /
i
i
c2 ii
~
N (0,1)
而
ˆ 2 (n k 1) / 2 ee / 2 ~ 2 (n k 1)
则
(ˆ ) / c ee /(n k 1) ~ t(n k 1)
i
i
ii
可以用上述统计量检验解释变量系数是否为0,
原假设 H : 0 ,计算统计量
2
exp{
1
2 2
( yi
ˆ0
ˆ1xi )2}
i
1,2,n
联合密度(似然函数)
L(ˆ0, ˆ1, )
f ( y1,,
yn )
1
n
(2
)n
/
2
exp{
1
2
2
( yi
ˆ0
ˆ1xi )2}
或对数似然函数
L* ln(L) n ln(
2
)
1
2
2
( yi
ˆ0
ˆ1xi )2
极大化上式
ˆ0
ˆ1
1430 1650 1870 2112
1485 1716 1947 2200
2002
共计
2420 4950 11495 16445 19305 23870 25025 21450 21285 15510
计量经济学2.1方程计量经济学模型

单方程计量经济学模型 理论与方法
Theory and Methodology of SingleEquation Econometric Model
第二章
经典单方程计量经济学模型: 一元线性回归模型
• • • • •
回归分析概述 一元线性回归模型的参数估计 一元线性回归模型检验 一元线性回归模型预测 实例
共计
2420
21450 21285
15510
分析: (1)由于不确定因素的影响,对同一收入水平X, 不同家庭的消费支出不完全相同; (2)但由于调查的完备性,给定收入水平X的消 费支出Y的分布是确定的,即以X的给定值为条件的 Y的条件分布(Conditional distribution)是已知的, 如: P(Y=561|X=800)=1/4。 因此,给定收入X的值Xi,可得消费支出Y的条件 均值(conditional mean)或条件期望(conditional expectation): E(Y|X=Xi) 该例中:E(Y | X=800)=605
问:能否从该样本估计总体回归函数PRF?
表 2.1.3 家庭消费支出与可支配收入的一个随机样本 Y X 800 594 1100 638 1400 1122 1700 1155 2000 1408 2300 1595 2600 1969 2900 2078 3200 2585 3500 2530
回答:能
• 含义:
回归函数(PRF)说明被解释变量Y的平均状 态(总体条件期望)随解释变量X变化的规律。
• 函数形式:
可以是线性或非线性的。 例2.1中,将居民消费支出看成是其可支配收 入的线性函数时:
E (Y | X i ) 0 1 X i
为一线性函数。其中,0,1是未知参数,称为 回归系数(regression coefficients)。 。
Theory and Methodology of SingleEquation Econometric Model
第二章
经典单方程计量经济学模型: 一元线性回归模型
• • • • •
回归分析概述 一元线性回归模型的参数估计 一元线性回归模型检验 一元线性回归模型预测 实例
共计
2420
21450 21285
15510
分析: (1)由于不确定因素的影响,对同一收入水平X, 不同家庭的消费支出不完全相同; (2)但由于调查的完备性,给定收入水平X的消 费支出Y的分布是确定的,即以X的给定值为条件的 Y的条件分布(Conditional distribution)是已知的, 如: P(Y=561|X=800)=1/4。 因此,给定收入X的值Xi,可得消费支出Y的条件 均值(conditional mean)或条件期望(conditional expectation): E(Y|X=Xi) 该例中:E(Y | X=800)=605
问:能否从该样本估计总体回归函数PRF?
表 2.1.3 家庭消费支出与可支配收入的一个随机样本 Y X 800 594 1100 638 1400 1122 1700 1155 2000 1408 2300 1595 2600 1969 2900 2078 3200 2585 3500 2530
回答:能
• 含义:
回归函数(PRF)说明被解释变量Y的平均状 态(总体条件期望)随解释变量X变化的规律。
• 函数形式:
可以是线性或非线性的。 例2.1中,将居民消费支出看成是其可支配收 入的线性函数时:
E (Y | X i ) 0 1 X i
为一线性函数。其中,0,1是未知参数,称为 回归系数(regression coefficients)。 。
建立经典单方程计量经济学模型的步骤和要点

建立经典单方程计量经济学模型的步骤和要点
1、确定研究对象和目标:首先需要明确研究的目的和研究对象,
并确定需要解决的问题和实现的目标。
2、收集数据:收集与研究对象和目标相关的数据,包括宏观经济
指标、市场数据、公司财务数据等。
3、确定自变量和因变量:根据研究目的和收集到的数据,选择合
适的自变量和因变量,自变量是影响因变量的变量,因变量是受自变量影响变化的变量。
4、模型设定和假设:根据经济学理论和实际情况,设定经典单方
程计量经济学模型的方程形式和假设条件,考虑线性或非线性关系、时间趋势、季节性等因素。
5、数据预处理:对收集到的数据进行预处理,包括缺失值填充、
异常值处理、数据转换等,以确保数据的准确性和可靠性。
6、模型拟合和参数估计:使用统计软件或编程语言进行模型拟合
和参数估计,根据设定的方程形式和假设条件,计算出自变量和因变量之间的参数估计值和误差等指标。
7、模型检验和调整:对拟合后的模型进行检验和调整,包括统计
显著性检验、经济意义检验、模型的多重共线性检验等,对不符合要求的模型进行修正和改进。
8、应用和解释:根据拟合好的经典单方程计量经济学模型,进行
应用和解释,包括预测未来趋势、政策评估、结构分析等。
2 单方程计量经济学模型 经典单方程计量经济学模型

22
随机误差项主要包括下列因素的影响:
1)代表未知的影响因素; 2)代表残缺的数据; 3)代表众多细小的影响因素; 4)代表数据观测误差; 5)代表模型设定误差; 6)变量的内在随机性; 其中,当随机干扰项仅包含3、6时,称为“原生”的随机 干扰,是模型固有的; 当随机干扰项包含1、2、4、5时,称为“衍生”的 随机误差,是模型设定过程中产生的,是可以避免的。
21
例2.1中,个别家庭的消费支出为:
(*) 即,给定收入水平Xi ,个别家庭的支出可表示为两部分之和: (1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为 系统性或确定性部分。 (2)其他随机或非确定性部分i。 (*)式称为总体回归函数(方程)PRF的随机设定形式。 表明被解释变量除了受解释变量的系统性影响外,还受其他因 素的随机性影响。 由于方程中引入了随机项,成为计量经济学模型,因 此也称为总体回归模型。
其中,0,1是未知参数,称为回归系数(regression coefficients) 上式也称为线性总体回归函数。
注意:经典计量经济方法中所涉及的线性函数,指回归系数是 线性的,即以一次方出现,对解释变量则可以不是线性的。
19
三、随机扰动项
总体回归函数说明在给定的收入水平Xi下,该社区家 庭平均的消费支出水平。 用一条直线表示: Y期望值 E(Y︱Xi ) = β0+β1Xi 总体回归直线
问:能否从该样本估计总体回归函数PRF?
回答:能
24
该样本的散点图(scatter diagram):
3000 2500 2000 1500 1000 500 0 0 500 1000 1500 2000 2500 3000 3500 4000
样本散点图近似于一条直线,画一条直线以尽好地拟合 该散点图,由于样本取自总体,可以该线近似地代表总体回 归线。该线称为样本回归线(sample regression lines)。 记样本回归线的函数形式为:
随机误差项主要包括下列因素的影响:
1)代表未知的影响因素; 2)代表残缺的数据; 3)代表众多细小的影响因素; 4)代表数据观测误差; 5)代表模型设定误差; 6)变量的内在随机性; 其中,当随机干扰项仅包含3、6时,称为“原生”的随机 干扰,是模型固有的; 当随机干扰项包含1、2、4、5时,称为“衍生”的 随机误差,是模型设定过程中产生的,是可以避免的。
21
例2.1中,个别家庭的消费支出为:
(*) 即,给定收入水平Xi ,个别家庭的支出可表示为两部分之和: (1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为 系统性或确定性部分。 (2)其他随机或非确定性部分i。 (*)式称为总体回归函数(方程)PRF的随机设定形式。 表明被解释变量除了受解释变量的系统性影响外,还受其他因 素的随机性影响。 由于方程中引入了随机项,成为计量经济学模型,因 此也称为总体回归模型。
其中,0,1是未知参数,称为回归系数(regression coefficients) 上式也称为线性总体回归函数。
注意:经典计量经济方法中所涉及的线性函数,指回归系数是 线性的,即以一次方出现,对解释变量则可以不是线性的。
19
三、随机扰动项
总体回归函数说明在给定的收入水平Xi下,该社区家 庭平均的消费支出水平。 用一条直线表示: Y期望值 E(Y︱Xi ) = β0+β1Xi 总体回归直线
问:能否从该样本估计总体回归函数PRF?
回答:能
24
该样本的散点图(scatter diagram):
3000 2500 2000 1500 1000 500 0 0 500 1000 1500 2000 2500 3000 3500 4000
样本散点图近似于一条直线,画一条直线以尽好地拟合 该散点图,由于样本取自总体,可以该线近似地代表总体回 归线。该线称为样本回归线(sample regression lines)。 记样本回归线的函数形式为:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0 1
其中e被称为样本残差。
§2.2 一元线性回归模型的基本假设
yi 0 1 xi i i 1,2,, n
1.对模型设定的假设 假设1:回归模型是正确设定的 2.对解释变量的假设 假设2:解释变量是确定的变量,不是随机变量,解 释变量之间互不相关。 假设3:解释变量X在所抽取的样本中具有变异性, 而且随着样本容量的无限增加,解释变量X的样 本方差趋于一个非零的有限常数
表2.1.1 某社区家庭每月可支配收入与消费支出统计表 每月家庭可支配收入X 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 每月家庭消费Y 561 638 869 1023 1254 1408 1650 1969 2090 2299 594 748 913 1100 1309 1452 1738 1991 2134 2321 627 814 924 1144 1364 1551 1749 2046 2178 2530 638 847 979 1155 1397 1595 1804 2068 2266 2629 935 1012 1210 1408 1650 1848 2101 2354 2860 968 1045 1243 1474 1672 1881 2189 2486 2871 1078 1254 1496 1683 1925 2233 2552 1122 1298 1496 1716 1969 2244 2585 1155 1331 1562 1749 2013 2299 2640 1188 1364 1573 1771 2035 2310 1210 1408 1606 1804 2101 1430 1650 1870 2112 1485 1716 1947 2200 2002 共计 2420 4950 11495 16445 19305 23870 25025 21450 21285 15510
§2.1 回归分析概述 一、回归分析基本概念 1. 变量之间的相互关系 2. 相关分析与回归分析
两个变量总体相关系数公式
两个变量的样本
相关系数公式
回归分析是研究一个变量关于另一个变量的依 赖关系的计算方法和理论。目的在于通过后者 的已知或者设定值,去顾及或预测前者的均值。 分为解释变量(自变量)和被解释变量(因变 量)。 回归分析包含的内容: (1)根据样本进行模型参数估计,得回归方 程; (2)对回归方程、参数估计值的显著性检验; (3)利用回归方程进行分析、评价、预测。
在如此假设条件下,可以推出
E ( i ) 0 Var( i ) 2
假设5:随机误差项与解释变量之间不相关, 即 Cov( xi , i ) 0 假设6:随机误差项服从0均值、同方差的正 态分布。即
i | X i ~ N (0, 2 )
i 1,2,, n
§2.3一元线性回归模型的参数估计
f ( yi )
2
1
exp{
1 2 2
ˆ ˆ ( yi 0 1xi )2} i 1,2, n
联合密度(似然函数)
ˆ ˆ L( 0 , 1, ) f ( y1, , yn )
1 n ( 2 ) n / 2
exp{
1 2 2
0 , 1
i 1 i i
由于
ˆ Q (Yi Yi ) 2
i 1 n n
ˆ ˆ (Yi - ( 0 1 X i )) 2
1
是待估参数的二次非负函数,因此其极小值 总存在。 Q 0 0 Q 1 0 易得
( 0 1 X i Yi ) 0 ( 2 .3 .2 ) ( 0 1 X i Yi ) X i 0
•未知因素的影响;
•残缺数据的影响;
•众多细小因素的影响
•变量观测值的观测误差的影响;
•模型关系的设定误差的影响;
•变量内在随机因素的影响。
样本回归函数 总体回归函数现实中未知,需通过抽样, 得到总体样本,通过样本信息估计总体回 归函数
ˆ ˆ ˆ 0 1 x y ˆ xe ˆ y
第二章 经典单方程计量经济学模型: 一元线性回归模型
线性回归模型的特征
历史渊源: 皮尔逊(Karl Pearson)搜集了一千 多个家庭成员身高的记录,发现身体高的 父亲一组,儿子们身高平均低于他们父亲 的身高,身体矮的父亲一组,儿子们平均 身高高于他们父亲的身高,这样,儿子的 高矮趋向所有人的平均身高,即“回归到 普通人”。
证明:1 线性性
由
ˆ yi2xi 1 x i
有
ˆ 1 kiYi
ˆ ki xix 2 。同样可证明另一个参数估计量 0 其中 i
的线性性。 2 无偏性 ˆ E ( 1 ) E ( ki ( 0 1 X i i )) ki (1 E ( i )) 1 其中用到 ki 0, ki X i 0 。对 ˆ 同理。 3.有效性
(Y ˆ (Y ˆ
i i
0 0
ˆ 1 X i ) 0 ˆ 1 X i ) X i 0
四、最小二乘估计的统计性质
衡量估计好坏的准则 1.线性性,线性是指参数估计量是被解释 变量的线性函数,可以从参数估计表达式 直接看出。 2.无偏性,指参数估计量的均值等于模型 参数值。即
2. 随机干扰项 ˆ 记 ei yi yi 为第 i 个样本观测点的残差,则随机 误差项方差的最小二乘、极大似然和MM估计量分 别为 2 2 2
ˆ
2
e i , 2 e i , 2 e i ˆ n2 ˆ n n
§2.4 一元线性回归模型的统计检验 一、拟合优度检验 1.总离差平方和的分解。样本回归直线
其能够很好的拟合样本数据。 Yˆi 为 对解释变量的估计值,它是由参数估 计量和解释变量的观测之计算得到的。 那么,被解释变量的估计值与观测值 应该在总体上最为接近。
根据被解释变量的估计值于观测值应该在 总体上最接近的原则,给出判断标准是二者 之差的平方和最小,即 n ˆ min ˆ ˆ Q (Y Y ) 2 (2.3.1)
Yi n 0 1 X i (2.3.3) Yi X i 0 X i 1 X 2 i
解得:
其中 若 X ˆ ˆ 2 2 1 n X i ( X i ) 0 ˆ n Yi X2i Yi X i 1 n X i ( X ) 2 i
ˆ E0 0
ˆ E1 1
ˆ E
2
2
3.有效性:所有无偏估计量中具有最小方差; 4.渐近无偏性,随着样本容量增加,估计量均值收 敛于总体真值; 5.一致性:随着样本容量的增加,估计量依概率收 敛于总体真值; 6.渐进有效性:随着样本容量的增加,估计量在所 有一致估计量中是否具有最小的方差。 在经典线性回归假设下,最小二乘估计量是具有最 小方差的线性无偏估计量,也就是具有所有有限 样本性质。
ˆ ˆ 2 ( yi 0 1 xi ) }
或对数似然函数
L* ln( L) n ln( 2 )
1
2 2
2 ˆ ˆ ( yi 0 1 xi )
极大化上式
ˆ ˆ ˆ ( yi 0 1 xi ) 2 0 0 ˆ ˆ ( yi 0 1 xi ) 2 0 ˆ1
x
1 n
Xi,
y
1 n
Y
i
Xi Xi X ,
Y Yi Y
则有
ˆ ˆ 0 y 1 x ˆ Yi X i 1 X 2 i
二、最大似然法(ML,Maximum Likelihood)
考虑在一组分布中使得样本出现的可能性最 大的分布为我们所求。 对于 Yi 0 1 X i ( i 1,2,, n)
i
E i 0 Di 2
i 1,2, , n i 1,2, , n
则对随机抽取的样本在获得参数估计值时, 应服从如下的正态分布
i ~ N (0, 2 )
i 1,2, , n
ˆ X , 2) Yi ~ N ( 0 ˆ1 i
则其概率密度为
一、普通最小二乘原理 OLS(ordinary least square) 给定一元线性回归模型
设由获得的样本观测值 ( yi , xi ) ( i 1,2,, n) 去估计计量经济模型中的未知参数,
Yi 0 1 X i i
结果为
ˆ ˆ ˆ Yi 0 1 X i
ˆ2
1 n
ˆ ˆ ( yi 0 1 xi ) 2
三、参数估计的矩法(MM)
矩估计(Method of Moment)思想:由
Ei 0 Cov( xi , i ) E ( xi i ) 0
使用相应的样本矩条件可写成
1 n 1 n
整理后可得与正规方程组(2.3.2)相同的组式, 故矩估计法与普通最小二乘法及极大似然法有相 同的结果。
支出随收入变化的简单散点图如下:
回归的现代解释
研究某一变量(被解释变量)与另一 个或多个变量(解释变量)间的因果 关系。用解释变量的已知值来估计和 预测因变量的总体平均值。
Y 0 1 X
Y E (Y | X )
•由于客观经济现象的复杂性
随机误差项主要包括以下因素的影响
在同族中抽取n对父-子的身高, 即有n对数据: (X1,Y1), (X2,Y2), … , (Xn,Yn). Yk a + bXk , 1kn. Yk ~ a + bXk , 1kn --男人平均身高. 由上式得 Yk - ~a + bXk - ~ a +(b-1) + b(Xk -) ~c+ b(Xk -) (注意=(1-b)+b ,c= a +(b-1) ,0<b<1)
其中e被称为样本残差。
§2.2 一元线性回归模型的基本假设
yi 0 1 xi i i 1,2,, n
1.对模型设定的假设 假设1:回归模型是正确设定的 2.对解释变量的假设 假设2:解释变量是确定的变量,不是随机变量,解 释变量之间互不相关。 假设3:解释变量X在所抽取的样本中具有变异性, 而且随着样本容量的无限增加,解释变量X的样 本方差趋于一个非零的有限常数
表2.1.1 某社区家庭每月可支配收入与消费支出统计表 每月家庭可支配收入X 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 每月家庭消费Y 561 638 869 1023 1254 1408 1650 1969 2090 2299 594 748 913 1100 1309 1452 1738 1991 2134 2321 627 814 924 1144 1364 1551 1749 2046 2178 2530 638 847 979 1155 1397 1595 1804 2068 2266 2629 935 1012 1210 1408 1650 1848 2101 2354 2860 968 1045 1243 1474 1672 1881 2189 2486 2871 1078 1254 1496 1683 1925 2233 2552 1122 1298 1496 1716 1969 2244 2585 1155 1331 1562 1749 2013 2299 2640 1188 1364 1573 1771 2035 2310 1210 1408 1606 1804 2101 1430 1650 1870 2112 1485 1716 1947 2200 2002 共计 2420 4950 11495 16445 19305 23870 25025 21450 21285 15510
§2.1 回归分析概述 一、回归分析基本概念 1. 变量之间的相互关系 2. 相关分析与回归分析
两个变量总体相关系数公式
两个变量的样本
相关系数公式
回归分析是研究一个变量关于另一个变量的依 赖关系的计算方法和理论。目的在于通过后者 的已知或者设定值,去顾及或预测前者的均值。 分为解释变量(自变量)和被解释变量(因变 量)。 回归分析包含的内容: (1)根据样本进行模型参数估计,得回归方 程; (2)对回归方程、参数估计值的显著性检验; (3)利用回归方程进行分析、评价、预测。
在如此假设条件下,可以推出
E ( i ) 0 Var( i ) 2
假设5:随机误差项与解释变量之间不相关, 即 Cov( xi , i ) 0 假设6:随机误差项服从0均值、同方差的正 态分布。即
i | X i ~ N (0, 2 )
i 1,2,, n
§2.3一元线性回归模型的参数估计
f ( yi )
2
1
exp{
1 2 2
ˆ ˆ ( yi 0 1xi )2} i 1,2, n
联合密度(似然函数)
ˆ ˆ L( 0 , 1, ) f ( y1, , yn )
1 n ( 2 ) n / 2
exp{
1 2 2
0 , 1
i 1 i i
由于
ˆ Q (Yi Yi ) 2
i 1 n n
ˆ ˆ (Yi - ( 0 1 X i )) 2
1
是待估参数的二次非负函数,因此其极小值 总存在。 Q 0 0 Q 1 0 易得
( 0 1 X i Yi ) 0 ( 2 .3 .2 ) ( 0 1 X i Yi ) X i 0
•未知因素的影响;
•残缺数据的影响;
•众多细小因素的影响
•变量观测值的观测误差的影响;
•模型关系的设定误差的影响;
•变量内在随机因素的影响。
样本回归函数 总体回归函数现实中未知,需通过抽样, 得到总体样本,通过样本信息估计总体回 归函数
ˆ ˆ ˆ 0 1 x y ˆ xe ˆ y
第二章 经典单方程计量经济学模型: 一元线性回归模型
线性回归模型的特征
历史渊源: 皮尔逊(Karl Pearson)搜集了一千 多个家庭成员身高的记录,发现身体高的 父亲一组,儿子们身高平均低于他们父亲 的身高,身体矮的父亲一组,儿子们平均 身高高于他们父亲的身高,这样,儿子的 高矮趋向所有人的平均身高,即“回归到 普通人”。
证明:1 线性性
由
ˆ yi2xi 1 x i
有
ˆ 1 kiYi
ˆ ki xix 2 。同样可证明另一个参数估计量 0 其中 i
的线性性。 2 无偏性 ˆ E ( 1 ) E ( ki ( 0 1 X i i )) ki (1 E ( i )) 1 其中用到 ki 0, ki X i 0 。对 ˆ 同理。 3.有效性
(Y ˆ (Y ˆ
i i
0 0
ˆ 1 X i ) 0 ˆ 1 X i ) X i 0
四、最小二乘估计的统计性质
衡量估计好坏的准则 1.线性性,线性是指参数估计量是被解释 变量的线性函数,可以从参数估计表达式 直接看出。 2.无偏性,指参数估计量的均值等于模型 参数值。即
2. 随机干扰项 ˆ 记 ei yi yi 为第 i 个样本观测点的残差,则随机 误差项方差的最小二乘、极大似然和MM估计量分 别为 2 2 2
ˆ
2
e i , 2 e i , 2 e i ˆ n2 ˆ n n
§2.4 一元线性回归模型的统计检验 一、拟合优度检验 1.总离差平方和的分解。样本回归直线
其能够很好的拟合样本数据。 Yˆi 为 对解释变量的估计值,它是由参数估 计量和解释变量的观测之计算得到的。 那么,被解释变量的估计值与观测值 应该在总体上最为接近。
根据被解释变量的估计值于观测值应该在 总体上最接近的原则,给出判断标准是二者 之差的平方和最小,即 n ˆ min ˆ ˆ Q (Y Y ) 2 (2.3.1)
Yi n 0 1 X i (2.3.3) Yi X i 0 X i 1 X 2 i
解得:
其中 若 X ˆ ˆ 2 2 1 n X i ( X i ) 0 ˆ n Yi X2i Yi X i 1 n X i ( X ) 2 i
ˆ E0 0
ˆ E1 1
ˆ E
2
2
3.有效性:所有无偏估计量中具有最小方差; 4.渐近无偏性,随着样本容量增加,估计量均值收 敛于总体真值; 5.一致性:随着样本容量的增加,估计量依概率收 敛于总体真值; 6.渐进有效性:随着样本容量的增加,估计量在所 有一致估计量中是否具有最小的方差。 在经典线性回归假设下,最小二乘估计量是具有最 小方差的线性无偏估计量,也就是具有所有有限 样本性质。
ˆ ˆ 2 ( yi 0 1 xi ) }
或对数似然函数
L* ln( L) n ln( 2 )
1
2 2
2 ˆ ˆ ( yi 0 1 xi )
极大化上式
ˆ ˆ ˆ ( yi 0 1 xi ) 2 0 0 ˆ ˆ ( yi 0 1 xi ) 2 0 ˆ1
x
1 n
Xi,
y
1 n
Y
i
Xi Xi X ,
Y Yi Y
则有
ˆ ˆ 0 y 1 x ˆ Yi X i 1 X 2 i
二、最大似然法(ML,Maximum Likelihood)
考虑在一组分布中使得样本出现的可能性最 大的分布为我们所求。 对于 Yi 0 1 X i ( i 1,2,, n)
i
E i 0 Di 2
i 1,2, , n i 1,2, , n
则对随机抽取的样本在获得参数估计值时, 应服从如下的正态分布
i ~ N (0, 2 )
i 1,2, , n
ˆ X , 2) Yi ~ N ( 0 ˆ1 i
则其概率密度为
一、普通最小二乘原理 OLS(ordinary least square) 给定一元线性回归模型
设由获得的样本观测值 ( yi , xi ) ( i 1,2,, n) 去估计计量经济模型中的未知参数,
Yi 0 1 X i i
结果为
ˆ ˆ ˆ Yi 0 1 X i
ˆ2
1 n
ˆ ˆ ( yi 0 1 xi ) 2
三、参数估计的矩法(MM)
矩估计(Method of Moment)思想:由
Ei 0 Cov( xi , i ) E ( xi i ) 0
使用相应的样本矩条件可写成
1 n 1 n
整理后可得与正规方程组(2.3.2)相同的组式, 故矩估计法与普通最小二乘法及极大似然法有相 同的结果。
支出随收入变化的简单散点图如下:
回归的现代解释
研究某一变量(被解释变量)与另一 个或多个变量(解释变量)间的因果 关系。用解释变量的已知值来估计和 预测因变量的总体平均值。
Y 0 1 X
Y E (Y | X )
•由于客观经济现象的复杂性
随机误差项主要包括以下因素的影响
在同族中抽取n对父-子的身高, 即有n对数据: (X1,Y1), (X2,Y2), … , (Xn,Yn). Yk a + bXk , 1kn. Yk ~ a + bXk , 1kn --男人平均身高. 由上式得 Yk - ~a + bXk - ~ a +(b-1) + b(Xk -) ~c+ b(Xk -) (注意=(1-b)+b ,c= a +(b-1) ,0<b<1)