第3章(一元线性回归模型)3 (1)
第三章 一元线性回归模型

第三章 一元线性回归模型一、预备知识(一)相关概念对于一个双变量总体,若由基础理论,变量和变量之间存在因果),(i i x y x y 关系,或的变异可用来解释的变异。
为检验两变量间因果关系是否存在、x y 度量自变量对因变量影响的强弱与显著性以及利用解释变量去预测因变量x y x ,引入一元回归分析这一工具。
y 将给定条件下的均值i x i yi i i x x y E 10)|(ββ+=(3.1)定义为总体回归函数(PopulationRegressionFunction,PRF )。
定义为误差项(errorterm ),记为,即,这样)|(i i i x y E y -i μ)|(i i i i x y E y -=μ,或i i i i x y E y μ+=)|(i i i x y μββ++=10(3.2)(3.2)式称为总体回归模型或者随机总体回归函数。
其中,称为解释变量x (explanatory variable )或自变量(independent variable );称为被解释y 变量(explained variable )或因变量(dependent variable );误差项解释μ了因变量的变动中不能完全被自变量所解释的部分。
误差项的构成包括以下四个部分:(1)未纳入模型变量的影响(2)数据的测量误差(3)基础理论方程具有与回归方程不同的函数形式,比如自变量与因变量之间可能是非线性关系(4)纯随机和不可预料的事件。
在总体回归模型(3.2)中参数是未知的,是不可观察的,统计计10,ββi μ量分析的目标之一就是估计模型的未知参数。
给定一组随机样本,对(3.1)式进行估计,若的估计量分别记n i y x i i ,,2,1),,( =10,),|(ββi i x y E 为,则定义3.3式为样本回归函数^1^0^,,ββi y ()i i x y ^1^0^ββ+=n i ,,2,1 =(3.3)注意,样本回归函数随着样本的不同而不同,也就是说是随机变量,^1^0,ββ它们的随机性是由于的随机性(同一个可能对应不同的)与的变异共i y i x i y x 同引起的。
第3章 一元线性回归分析

3.7 假设条件的放松
3.7.1 假设条件的放松(一)—非正态 分布误差项
• 放松了假设4后,与之相关的结论10和12 不再成立,t-检验、F-检验不再成立。 • 大样本情况下,t-统计量近似服从标准正态 分布,因此可以用标准正态分布临界值进 行判断。 • 去掉假设4不影响OLS估计的一致性、无偏 性和渐近正态性。
1
s ˆ
1
t-检验的涵义:估计参数的绝对值足够大或者 标准误很小(标准误小则随机性小,估计越精 确) 样本量较大时 (n>35),t分布接近正态分布, 5%置信水平下临界值接近2,因此常用统计量 是否大于2作为判断系数显著与否的标准。
3.5 拟合优度 R 和模型检验(F检验)
检验 X 和 Y 之间是否 具有线性关系:看 Y 的变化能被 X 的变化解释多少。 总平方和(total sum squared):
一元线性回归分析
3.6 用EViews7.2进行一元线性回归 3.7 假设条件的放松
3.7.1 假设条件的放松(一)—非正态分布误差 项 3.7.2 假设条件的放松(二)—异方差 3.7.3 假设条件的放松(三)—非随机抽样和序 列相关 3.7.4 假设条件的放松(四)—内生性 3.7.5 总结
重要概念
第3章
一元线性回归分析
一元线性回归分析
3.1 一元线性回归模型 3.2 一元线性回归模型参数估计
3.2.1 回归系数估计 3.2.2 误差的估计—残差 ˆ 和 ˆ 的分布 3.2.3 0 1
3.3 更多假设下OLS估计量性质 3.4 回归系数检验(t-检验) 2 R 3.5 拟合优度 和模型检验(F检验)
2
3.5 拟合优度 R 和模型检验(F检验)
不带常数项的模型其相应的TSS和ESS为:
(完整版)第三章(多元线性回归模型)3-1答案

3.1 多元线性回归模型及古典假定一、判断题1. 在实际应用中,一元回归几乎没什么用,因为因变量的行为不可能仅有一个解释变量来解释。
(T )2. 一元线性回归模型与多元线性回归模型的基本假定是相同的。
(F )二 、单项选择题1.在二元线性回归模型i i i i u X X Y +++=22110βββ中,1β表示( A )。
A .当X2不变时,X1每变动一个单位Y 的平均变动。
B .当X1不变时,X2每变动一个单位Y 的平均变动。
C .当X1和X2都保持不变时,Y 的平均变动。
D .当X1和X2都变动一个单位时,Y 的平均变动。
2.如果两个经济变量X 与Y 间的关系近似地表现为当X 发生一个绝对量变动(ΔX ) 时, Y 有一个固定地相对量(ΔY/Y )变动,则适宜配合的回归模型是( B )。
A .i i 21i u X Y ++=ββB .i i 21i u X Y ++=ββlnC .i i21i u X 1Y ++=ββ D .i i 21i u X Y ++=ln ln ββ3.在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数):( C )。
A. n ≥k+1 B .n<k+1C. n ≥30 或n ≥3(k+1)D. n ≥304、模型i i 21i u X Y ++=ln ln ββ中 ,2β的实际含义是( B )。
A. X 关于Y 的弹性B. Y 关于X 的弹性C. X 关于Y 的边际倾向D. Y 关于X 的边际倾向三、多项选择题1.下列哪些非线性模型可以通过变量替换转化为线性模型( ABC )A. i 2i 10i u X Y ++=ββB. i i10i u X 1Y ++=ββC. i i 10i u X Y ++=ln ln ββD. i i 210i u X Y ++=ββE. i i 10i u X Y ++=ββ四、简答题1.多元线性回归模型与一元线性回归模型有哪些区别?答:多元线性回归模型与一元线性回归模型的区别表现在如下几个方面:一是解释变量的个数不同;二是模型的经典假设不同,多元线性回归模型比一元线性回归模型多了个“解释变量之间不存在线性相关关系”的假定;三是多元线性回归模型的参数估计式的表达更为复杂。
第三章(多元线性回归模型)3-3答案(可编辑修改word版)

ESS kRSS (n - k -1) n3.3 多元线性回归模型的检验一、判断题1、在线性回归模型中,为解释变量或者被解释变量重新选取单位(比如,元变换成千元), 会影响 t 统计量和 R 2 的数值。
( F )2、在多元线性回归中,t 检验和 F 检验缺一不可。
( T) 3、回归方程总体线性显著性检验的原假设是模型中所有的回归参数同时为零。
( F )4、多元线性回归中,可决系数 R 2 是评价模型拟合优度好坏的最佳标准。
(F )二 、单项选择1、在模型Y t = 0 + 1 X 1t + 2 X 2t + 3 X 3t + t 的回归分析结果中,有 F = 462.58 ,F 的p 值= 0.000000 ,则表明(C )A 、解释变量 X 2t 对Y t 的影响不显著B 、解释变量 X 1t 对Y t 的影响显著C 、模型所描述的变量之间的线性关系总体上显著D 、解释变量 X 2t 和 X 1t 对Y t 的影响显著2、设k 为回归模型中的实解释变量的个数, n 为样本容量。
则对回归模型进行总体显著性 检验( F 检验)时构造的 F 统计量为 (A )A 、 F =B 、 F =C 、 F =ESS RSSD 、 F = 1-RSS TSS3、在多元回归中,调整后的可决系数 R 2与可决系数 R 2 的关系为 ( A )A 、 R 2 < R 2 C 、 R 2= R 2B 、 R 2 > R 2D 、 R 2 与 R 2 的关系不能确定4、根据调整的可决系数 R 2 与 F 统计量的关系可知,当 R 2 = 1 时,有 (C ) A 、F=0B 、F=-1C 、F→+∞D 、F=-∞5、下面哪一表述是正确的 (D )1 nA 、线性回归模型Y i = 0 + 1 X i + i 的零均值假设是指∑i= 0i =1ESS (k -1)RSS (n - k )0 1 1i 2 2ik ki i B 、对模型Y i = 0 + 1 X 1i + 2 X 2i + i 进行方程显著性检验(即 F 检验),检验的零假 设是 H 0 : 0 = 1 = 2 = 0C 、相关系数较大意味着两个变量存在较强的因果关系D 、当随机误差项的方差估计量等于零时,说明被解释变量与解释变量之间为函数关系5、对于Y i = ˆ +ˆ X +ˆ X+… +ˆ X + e ,如果原模型满足线性模型的基本假设则 在零假设 j = 0 下, 统计量 ˆj (B ) s (ˆj ) ( 其中 s (ˆj ) 是 j 的标准误差) 服从A 、t (n - k )B 、t (n - k -1)C 、 F (k -1, n - k )D 、 F (k , n - k -1)6、在由 n = 30 的一组样本估计的、包含 3 个解释变量的线性回归模型中,计算得多重可决系数为 0.8500,则调整后的多重可决系数为( D )A 、8603B 、 0.8389C 、0.8655D 、0.8327 7、可决系数 R 2=0.8,说明回归直线能解释被解释变量总变差的:( A )A 、 80%B 、 64%C 、 20%D 、 89%8、线性回归模型 y t= b 0 + b 1 x 1t + b 2 x 2t + ...... + b k x kt + u tH 0 : b t = 0(i = 0,1, 2,...k ) 时,所用的统计量服从(C )中,检验A.t(n-k+1)B.t(n-k-2)C.t(n-k-1)D.t(n-k+2)三、多项选择题1、对模型满足所有假定条件的模型Y i = 0 + 1 X 1i + 2 X 2i + i 进行总体显著性检验,如 果检验结果总体线性关系显著,则很可能出现 ( BCD )A 、1 = 2 = 0 C 、1 ≠ 0,2 ≠ 0 E 、1= 0,2 = 0B 、1 ≠ 0,2 = 0 D 、1= 0,2 ≠ 02、设 k 为回归模型中的参数个数(包含截距项)则总体线性回归模型进行显著性检验时所用的 F 统计量可以表示为( BC )∑(Y ˆ - Y )2/(n - k )∑(Y ˆ - Y )2/(k - 1)A 、 ii 2 ( ) B 、 ii 2 ( ) ∑e i / k- 1 ∑e i/ n- k R 2 /(k - 1)C 、(1 - R 2 )/(n - k )(1 - R 2 )/(n - k )D 、R 2/(k - 1)R2/(n -k )E、(1 -R2)/(k -1)3、在多元回归分析中,调整的可决系数R2与可决系数R2之间(AD )A、R2<R2B、R2≥R2C、R2只可能大于零D、R2可能为负值E、R2不可能为负值四、简答题1.在多元线性回归分析中,为什么用修正的可决系数衡量估计模型对样本观测值的拟合优度?答:因为人们发现随着模型中解释变量的增多,多重可决系数R2的值往往会变大,从而增加了模型的解释功能。
(完整版)第三章(多元线性回归模型)3-3答案

3.3 多元线性回归模型的检验一、判断题1、在线性回归模型中,为解释变量或者被解释变量重新选取单位(比如,元变换成千元),会影响t 统计量和 2R 的数值。
( F )2、在多元线性回归中,t 检验和F 检验缺一不可。
( T )3、回归方程总体线性显著性检验的原假设是模型中所有的回归参数同时为零。
( F )4、多元线性回归中,可决系数2R 是评价模型拟合优度好坏的最佳标准。
( F )二 、单项选择1、在模型0112233t t t t t Y X X X ββββμ=++++的回归分析结果中,有462.58F =,0.000000F p =的值,则表明 ( C )A 、解释变量2t X 对t Y 的影响不显著B 、解释变量1t X 对t Y 的影响显著C 、模型所描述的变量之间的线性关系总体上显著D 、解释变量2t X 和1t X 对t Y 的影响显著2、设k 为回归模型中的实解释变量的个数,n 为样本容量。
则对回归模型进行总体显著性 检验(F 检验)时构造的F 统计量为 ( A )A 、1)ESS k F RSS n k =--B 、(1)()ESS k F RSS n k -=- C 、ESS F RSS = D 、1RSS F TSS=- 3、在多元回归中,调整后的可决系数2R 与可决系数2R 的关系为 ( A ) A 、22R R < B 、22R R >C 、22R R =D 、2R 与2R 的关系不能确定4、根据调整的可决系数2R 与F 统计量的关系可知,当21R =时,有 ( C )A 、F=0B 、F=-1C 、F →+∞D 、F=-∞5、下面哪一表述是正确的 ( D ) A 、线性回归模型01i i i Y X ββμ=++的零均值假设是指110ni i n μ==∑ B 、对模型01122i i i i Y X X βββμ=+++进行方程显著性检验(即F 检验),检验的零假 设是0012:0H βββ===C 、相关系数较大意味着两个变量存在较强的因果关系D 、当随机误差项的方差估计量等于零时,说明被解释变量与解释变量之间为函数关系5、对于01122ˆˆˆˆi i i k ki iY X X X e ββββ=+++++…,如果原模型满足线性模型的基本假设则 在零假设0j β=下,统计量ˆˆ()j j s ββ(其中ˆ()js β是j β的标准误差)服从 (B )A 、()t n k -B 、(1)t n k --C 、(1,)F k n k --D 、(,1)F k n k --6、在由的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重可决系数为0.8500,则调整后的多重可决系数为( D )A 、8603B 、 0.8389C 、0.8655D 、0.83277、可决系数R 2=0.8,说明回归直线能解释被解释变量总变差的:( A )A 、 80%B 、 64%C 、 20%D 、 89%8、线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...)t H b i k ==时,所用的统计量服从( C )A.t(n-k+1)B.t(n-k-2)C.t(n-k-1)D.t(n-k+2)三、多项选择题1、对模型满足所有假定条件的模型01122i i i i Y X X βββμ=+++进行总体显著性检验,如果检验结果总体线性关系显著,则很可能出现 ( BCD )A 、120ββ==B 、120,0ββ≠=C 、120,0ββ≠≠D 、120,0ββ=≠E 、120,0ββ==2、设k 为回归模型中的参数个数(包含截距项)则总体线性回归模型进行显著性检验时所 用的F 统计量可以表示为 ( BC )A 、()()()∑∑---1k e k n Y Y 2i 2i i //ˆ B 、()()()∑∑---k n e 1k Y Y 2i2ii //ˆ C 、()()()k n R 11k R 22---// D 、()()()1k R k n R 122---// 30n =E 、()()()1k R 1k n R 22---// 3、在多元回归分析中,调整的可决系数2R 与可决系数2R 之间 ( AD )A 、22R R <B 、22R R ≥C 、2R 只可能大于零D 、2R 可能为负值E 、2R 不可能为负值四、简答题1.在多元线性回归分析中,为什么用修正的可决系数衡量估计模型对样本观测值的拟合优度?答:因为人们发现随着模型中解释变量的增多,多重可决系数2R 的值往往会变大,从而增加了模型的解释功能。
第三章 一元线性回归

LOGO
三、一元线性回归模型中随机项的假定
( xi , yi ),i,j=1,2,3,…,n后,为了估计(3.1.5) 在给定样本观测值(样本值) 式的参数 0和 1 ,必须对随机项做出某些合理的假定。这些假定通常称 为古典假设。
假设1、解释变量X是确定性变量,不是随机变量; 假设2、随机误差项具有零均值、同方差和不序列相关性: E(i)=0 Var (i)=2 i=1,2, …,n i=1,2, …,n
ˆ i ) ( y i 0 1 xi ) 2 Q( 0,1) ( yi y
2 i 1 i 1 n n
(3.2.3)
ˆ , ˆ ,使式 所谓最小二乘法,就是寻找参数 0,,1 的估计值 0 1 ˆ , ˆ 满足: (3.2.3)定义的离差平方和最小,即寻找 0 1
y 1 x
2 y 0 2 x
LOGO
二是被解释变量x与参数 之间为线性关系,即参数 仅以一次方的 形式出现在模型之中。用数学语言表示为:
y 1 0
y 0 2 0
2
y x 1
2 y 0 2 1
在经济计量学中,我们更关心被解释变量y与参数
之间的线性关系。因
第三章 一元线性回归
3.1 一元线性回归模型 3.2 回归参数 0,1 的估计 3.3 最小二乘估计的性质 3.4 回归方程的显著性检验
3.5 预测和控制
LOGO
3.1 一元线性回归模型
一、回归模型的一般形式
1、变量间的关系 经济变量之间的关系,大体可分为两类:
(1)确定性关系或函数关系:变量之间有唯一确定性的函数关 系。其一般表现形式为:
对于总体回归模型,
y f ( x1, x2 ,, xk ) u
计量第三章答案

第三章 一元经典线性回归模型的基本假设与检验问题 3.1TSS,RSS,ESS 的自由度如何计算?直观含义是什么?答:对于一元回归模型,残差平方和RSS 的自由度是(2)n -,它表示独立观察值的个数。
对于既定的自变量和估计量1ˆβ和2ˆβ,n 个残差 必须满足正规方程组。
因此,n 个残差中只有(2)n -个可以“自由取值”,其余两个随之确定。
所以RSS 的自由度是(2)n -。
TSS 的自由度是(1)n -:n 个离差之和等于0,这意味着,n 个数受到一个约束。
由于TSS=ESS+RSS ,回归平方和ESS 的自由度是1。
3.2 为什么做单边检验时,犯第一类错误的概率的评估会下调一半?答:选定显著性水平α之后,对应的临界值记为/2t α,则双边检验的拒绝区域为/2||t t α≥。
单边检验时,对参数的符号有先验估计,拒绝区域变为/2t t α≥或/2t t α≤-,故对犯第I 类错误的概率的评估下下降一半。
3.3 常常把高斯-马尔科夫定理简述为:OLS 估计量具有BULE 性质,其含义是什么? 答:含义是:(1)它是线性的(linear ):OLS 估计量是因变量的线性函数。
(2)它是无偏的(unbiased ):估计量的均值或数学期望等于真实的参数。
比如22ˆ()E ββ=。
(3)它是最优的或有效的(Best or efficient ):如果存在其它线性无偏的估计量,其方差必定大于OLS 估计量的方差。
3.4 做显著性检验时,针对的是总体回归函数(PRF )的系数还是样本回归函数(SRF )的系数?为什么?答:做显著性检验时,针对的是总体回归函数(SRF )的系数。
总体回归函数是未知的,也是研究者所关心的,所以只能利用样本回归函数来推测总体回归函数,后者是利用样本数据计算所得,是已知的,无需检验。
(习题)3.5 以下陈述正确吗?不论正确与否,请说明理由。
(1)X值越接近样本均值,斜率的OLS估计值就越精确。
第3章 一元回归模型:假设检验

ui ~ N (0, )
2
回顾:正态分布由来
高尔顿钉板
回顾:正态分布由来
高尔顿钉板
回顾:正态分布的平均值和方差
第327页
第三章 一元回归模型:假设检验
3.1 古典线性回归模型的基本假定
第三章 一元回归模型:假设检验
3.1 古典线性回归模型的基本假定
第三章 一元回归模型:假设检验
问:随机误差项
答:使用残差项
se(b2 ) var(b2 )
u i 的方差 2 不知道怎么办?? ei 的方差来估计随机误差项的方差:
EViews 回归结果
第三章 一元回归模型:假设检验
3.3 OLS估计量的性质
高斯-马尔科夫定理:
如果满足古典线性回归模型的基本假定,则OLS 估计量是最优线性无偏估计量(Best Linear Unbiased Evaluation , BLUE)。
3.1 古典线性回归模型的基本假定
二、对随机误差项
u i 的假定:
5. 解释变量与随机误差项不相关。
cov(ui , X i ) 0
6. 随机误差项之间不相关(无自相关、无序列相关)。
cov(ui , u j ) 0
i j i, j 1, 2,..., n
回顾:变量间的相关性
相关系数
第三章 一元回归模型:假设检验
3.3 OLS估计量的性质
1. 线性: b1和b2是线性估计量,即它们是Y的线性函数:
b1 Y b2 X
x y ( X X )(Y Y ) b x (X X ) X Y nXY X nX
i i i i 2 2 i 2 i i i 2 i 2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
16460.26 13422.47 9086.73 8806.55 10828.62 11231.48 9729.05 8622.97 19397.89 11977.55 15158.3 9524.04 12501.12 8717.37 图3.1.1 11006.61 8837.46 24724.89 9477.51 湖 北 19422.53 9945.52 湖 南 i 13441.09 15527.97 广 东 13119.05 9627.4 广 西 14432.55 9408.48 海 南 14392.69 11146.8 重 庆 i i 12829.45 9679.14 四 川 11581.28 8349.21 贵 州 26674.9 9076.61 云 南 18679.52 8323.54 西 藏 1 22726.66 9772.07 陕 西 12990.35 8308.62 甘 肃 17961.45 8192.56 青 海 12866.44 9558.29 宁 夏 样本数据的散点图和样本回归直线 16305.41 8669.36 新 疆 13231.11
i j , i, j 1, 2,
,N
以上这些对随机扰 动项的假定是由德国数 学家高斯(Gauss)最 早提出的,也称为线性 回归模型的经典假定或 高斯假定,满足上述假 定的线性回归模型,称 为经典线性回归模型
(3.1.5)
《计量经济学》,王少平、杨继生、欧阳志刚主编
二、普通最小二乘法(OLS)
《计量经济学》,王少平、杨继生、欧阳志刚主编
ˆ) E ( i i
即
ˆ ,E ˆ E 0 0 1 1
《计量经济学》,王少平、杨继生、欧阳志刚主编
高斯-马尔可夫定理
由以上分析可以看出,普通最小二乘估计量(ordinary least squares estimators)在经典假定下具有线性性、无偏性 和最小方差性等性质,称具有这些性质的估计量为最优线性无 偏估计量( best linear unbiased estimator ,BLUE)。
3.2.1
《计量经济学》,王少平、杨继生、欧阳志刚主编
一、总离差平方和的分解
已知由一组样本观测值 ( X i , Yi ) (i 1, 2, ˆ ˆX ˆ Y i 0 1 i
, N ) 得到如下样本回归直线:
(3.2.1)
Y的第 i 个观测值与样本均值的离差 yi Yi Y 可分解为两部分之和
假定4:零均值假定
假定5:同方差假定
E (ui | X i ) 0,
i 1, 2,
,N
假定6:无自相关假定
(3.1.3)
即
Var (ui | X i ) E[ui E (ui | X i )]2 E (ui 2 ) 2
i 1, 2, , N
(3.1.4)
即
Cov(ui , u j ) 0
第三章 一元线性回归模型
§3.1 §3.2 §3.3 一元线性回归模型参数的估计 拟合优度 回归参数的区间估计和假设检验
§3.4 § 3.5
例子:中国消费函数 对最小二乘估计量统计性质的直观认识---蒙特卡洛模拟
本章小结
《计量经济学》,王少平、杨继生、欧阳志刚主编
§3.1 一元线性回归模型参数的估计
i
2 i 2 i 2 i 2 i
x y (X
i i
i
X )(Yi Y ) 1 X i Yi N
X iYi
(3.1.11)
于是,估计量(3.1.9)可以表示为离差形式: ˆ x y x (3.1.12)
i i 1
ˆ ˆ 0 Y 1 X
其中 Y为 13152.86 i 13821.16 城市居民家庭平均每人每年消费支出;X 为城市居民人均 19732.86 年可支配收入。使用这组样本数据,对(3.1.13)做最小二乘 14146.04 12607.84 估计,结果为 14367.55 ˆ 725.3459+0.6647X (3.1.14 Y ) 12633.38
Cov( X i , ui ) E[ui E (ui )][ X i E ( X i )] 0
i 1, 2, , N
(3.1.2)
即模型对变量和函数形式没有设定偏误, 它的确切含义将在第5章中讨论。 《计量经济学》,王少平、杨继生、欧阳志刚主编
2、对随机扰动项的假定
即在给定解释变量的条件下,随机扰动 项的条件均值为零
在第二章,我们以人为设计的收入 与消费数据,讨论了总体回归模型与样 本回归模型。本章分析一元线性回归模 型的经典假定,以及经典假设下的最小 二乘估计方法和估计量的统计性质、区 间估计、假设检验,并运用蒙特卡洛模 拟直观认识和验证最小二乘估计量的统 计性质。
《计量经济学》,王少平、杨继生、欧阳志刚主编
归函数可知,边际消费倾向 增加1元,消费平均增加0.6647元。
ˆ 0.6647 从样本回 , 也就是说收入每
11758.76 13250.22 12481.51 12857.89 10969.41 11640.43 12931.53 11432.1
样本点紧密散布在样本回归直线周围,有的样本点 数据来源:《中国统计年鉴2009》 落在样本回归直线上,但是大多数样本点不在样本回归 请回答:我国宏观经济中的边际消费倾向是多少? 直线上,而是在直线上方或者下方,那么这条样本回归 直线“逼近”了总体回归直线吗?为什么要用普通最小 二乘法?如何度量样本回归模型对样本观测值的拟合程 度?要回答这些问题,我们必须学习估计量的统计性质和 模型的拟合优度等概念。
0 1
(3.1.8) 正则方程
第二步 对残差平方和求两个系数的偏导数 (一阶条件)
N N N N 2 X i Yi X i Yi X i i 1 i 1 i 1 ˆ i 1 ˆX Y 0 1 N N 2 2 N X i ( X i ) i 1 i 1 N N N N N Yi X i Yi X i (Yi Y )( X i X ) ˆ i 1 i 1 i 1 i 1 N 1 N N N X i2 ( X i ) 2 (Xi X ) 2 i 1 i 1 i 1 (3.1.9) (3.1.9)式即为OLS估计量
y
可以证明
2 i
2
i
ˆi 2 u ˆi 2 2 y ˆi u ˆi y
i i
(3.2.3)
记
ˆu ˆ 0 所以 y , ˆ u ˆ y y y (Y Y ) TSS
2 2 i i
(3.2.5) (3.2.4)
2
2
i
i
ESS称为回归平方和(explained sum of squares,ESS),反映由模 型中解释变量所解释的那部分离差的大小。 2 2 ˆ ˆ (3.2.6) y ( Y Y ) ESS i i RSS称为残差平方和(residual sum of squares,RSS),反映样本观测值 与估计值偏离的大小,也是模型中解释变量未解释的离差。
《计量经济学》,王少平、杨继生、欧阳志刚主编
6
第一步 构造含有待估计系数的残差平方和 并对其求最小
N Q ˆ ˆ X )0 2 ( Y i 0 1 i ˆ N N 0 i 1 2 ˆ ˆ X )u ˆ ˆi min Q u ( Y i i 0 1 i ˆ ˆ N , 1 i 1 Q i2 ˆ ˆ X )X 0 (Y i 3.1.70 i ( ) 1 i ˆ i 1 1
《计量经济学》,王少平、杨继生、欧阳志刚主编
对第二步的进一步演算 在(3.1.9)式中,令 xi X i X , yi Yi Y 和分别称为Xi和Yi的离差形式, 也可称为对Xi和Yi的中心化处理。为方便,我们 以下分析过程中,将和号 简写为 。容易证明: x 0 x (X X ) 1 (3.1.10) X ( X ) N
一元线性回归模型是指模型中只有一个解释变量的模型,也称为简单 线性回归模型,其一般形式是:
Yi 0 1 X i ui
i 1, 2,
,N
(3.1.1)
Y为被解释变量,X为解释变量。因为模型中共有两个变量,所以,模 型(3.1.1)也被称为双变量线性回归模型,β 0与β 1为待估参数,ui为随机 误差项或随机扰动项。
基于假定3,我们对模型(3.1.1)取条件期望,则有: ( i i 0 1 i 3.1.6)
E (Y X ) X
即:
Yi E (Yi X i ) u i
Yi的变化可以分为两部分,一部分是可以由Xi的变化解释 的,另一部分来自随机扰动。Yi向Xi所解释的“平均水平”回 归,这就是“回归”的含义。而斜率系数β 1是指,Xi每变化一 个单位,Yi平均变化β 1个单位。β 0是样本回归直线的截距。
2 i
ˆ ˆ 在计量经济学中,往往以小写字母表示对均值的离差。由于 和 是从最小二乘原理推导出来的,故称为普通最小二乘估计量。将样本数据 代入估计量的计算公式(3.1.12)即可求得参数的估计值。
0
1
《计量经济学》,王少平、杨继生、欧阳志刚主编
我们设定 例3.1.1 题目 解答 思考 样本回归模型 表3.1.1 2008年中国各地区城市居民人均年消费支出和可支配收入