计量经济学第二章 简单线性回归
计量经济学复习要点

计量经济学复习要点参考教材:李子奈 潘文卿 计量经济学 数据类型:截面、时间序列、面板第二章 简单线性回归回归分析的基本概念,常用术语现代意义的回归是一个被解释变量对若干个解释变量依存关系的研究,回归的实质是由固定的解释变量去估计被解释变量的平均值;简单线性回归模型是只有一个解释变量的线性回归模型; 回归中的四个重要概念1. 总体回归模型Population Regression Model,PRMt t t u x y ++=10ββ--代表了总体变量间的真实关系;2. 总体回归函数Population Regression Function,PRFt t x y E 10)(ββ+=--代表了总体变量间的依存规律;3. 样本回归函数Sample Regression Function,SRFtt t e x y ++=10ˆˆββ--代表了样本显示的变量关系; 4. 样本回归模型Sample Regression Model,SRMtt x y 10ˆˆˆββ+=---代表了样本显示的变量依存规律; 总体回归模型与样本回归模型的主要区别是:①描述的对象不同;总体回归模型描述总体中变量y 与x 的相互关系,而样本回归模型描述所关的样本中变量y 与x 的相互关系;②建立模型的依据不同;总体回归模型是依据总体全部观测资料建立的,样本回归模型是依据样本观测资料建立的;③模型性质不同;总体回归模型不是随机模型,而样本回归模型是一个随机模型,它随样本的改变而改变;总体回归模型与样本回归模型的联系是:样本回归模型是总体回归模型的一个估计式,之所以建立样本回归模型,目的是用来估计总体回归模型;线性回归的含义线性:被解释变量是关于参数的线性函数可以不是解释变量的线性函数线性回归模型的基本假设简单线性回归的基本假定:对模型和变量的假定、对随机扰动项u 的假定零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定 普通最小二乘法原理、推导最小二乘法估计参数的原则是以“残差平方和最小”; Min21ˆ()niii Y Y =-∑01ˆˆ(,)ββ: 1121()()ˆ()nii i n ii XX Y Y XX ==--β=-∑∑ , 01ˆˆY Xβ=-βOLS 估计量的性质1线性:是指参数估计值0β和1β分别为观测值t y 的线性组合; 2无偏性:是指0β和1β的期望值分别是总体参数0β和1β; 3最优性最小方差性:是指最小二乘估计量0β和1β在在各种线性无偏估计中,具有最小方差; 高斯-马尔可夫定理OLS 参数估计量的概率分布OLS 随机误差项μ的方差σ2的估计 拟合优度的检验R 2 离差平方和的分解:TSS=ESS+RSS“拟合优度”是模型对样本数据的拟合程度;检验方法是构造一个可以表征拟合程度的指标——判定系数又称决定系数;121SSE SST SSR SSRR SST SST SST-===-,表示回归平方和与总离差平方和之比;反映了样本回归线对样本观测值拟合优劣程度的一种描述; 2 2[0,1]R ∈;3 回归模型中所包含的解释变量越多,2R 越大变量显着性检验,t 检验例子:回归报告函数形式对数、半对数模型系数的解释101ˆˆˆi iY X =β+β:X 变化一个单位Y 的变化 2^22()i Var x σβ=∑2^22ie n σ=-∑201ˆˆˆln ln i i Y X =β+β: X 变化1%,Y 变化1ˆβ%,表示弹性; 301ˆˆˆln i i Y X =β+β:X 变化一个单位,Y 变化百分之1001ˆβ 401ˆˆˆln i iY X =β+β:X 变化1%,Y 变化1ˆβ/100; 第三章 多元线性回归1、变量系数的解释剔除、控制其他因素的影响对斜率系数1ˆβ的解释:在控制其他解释变量X2不变的条件下,X1变化一个单位对Y 的影响;或者,在剔除了其他解释变量的影响之后,X1的变化对Y 的单独影响2、多元线性回归模型中对随机扰动项u 的假定,除了零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定以外,还要求满足无多重共线性假定;3、多元线性回归模型参数的最小二乘估计式;参数估计式的分布性质及期望、方差和标准误差;在基本假定满足的条件下,多元线性回归模型最小二乘估计式是最佳线性无偏估计式;最小二乘法 OLS 公式: Y ' X X)' (X ˆ-1=β估计的回归模型: 的方差协方差矩阵: 残差的方差 : βˆ的估计的方差协方差矩阵是:4、修正可决系数的作用和方法;5、F 检验是对多元线性回归模型中所有解释变量联合显着性的检验,F 检验是在方差分析基础上进行的; 6、t检验7、可化为线性回归的模型 8、约束回归第四章 放宽基本假设一、异方差什么是异方差 异方差的后果ˆˆY =X β+u βˆ2ˆˆ'uu n k -s =异方差的检验White 检验 异方差的处理 加权最小二乘法 异方差稳健标准误二、序列相关什么是序列相关 序列相关的后果序列相关的检验DW 检验、LM 检验 序列相关的处理 广义最小二乘法 Newey-West 稳健标准误三、多重共线性多重共线性的概念 多重共线性的后果 多重共线性的检验 多重共线性的处理四、工具变量什么时候需要工具变量 作为工具变量的条件 两阶段最小二乘法第五章 专门问题一、虚拟变量1. 虚拟变量的定义:定性变量二值与多值;虚拟变量有时候不一定只是0和1;2. 如何引入虚拟变量:如果一个变量分成N 组,引入该变量的虚拟变量形式是只能放入N-1个虚拟变量;3. 虚拟变量系数的解释:不同组均值的差基准组或对照组与处理组4. 以下几种模型形式表达的不同含义;1tt t t u D X Y +++=210βββ:截距项不同;2tt t t t u X D X Y +++=210βββ:斜率不同;3tt t t t t u X D D X Y ++++=3210ββββ:截距项与斜率都不同;其中D 是二值虚拟变量,X 是连续的变量;第八章 时间序列平稳性的概念 白噪声 随机游走 单位根的概念单位根的检验ADF 检验,ADF 的三种形式 单整趋势平稳与差分平稳 协整的概念 协整的检验 误差修正模型Eviews 回归结果界面解释表计量经济学复习题第二章习题:1、2、3、5、6、7、9、10、11、12第三章习题:1、2、3、4、5、6、7、8、9、10、11、12、13 第四章习题:2、5、6、8、9、10 第五章习题:1、2、3、5、6 第八章习题:1、2、5、6、7、8 1、判断下列表达式是否正确 2、给定一元线性回归模型:1叙述模型的基本假定;2写出参数0β和1β的最小二乘估计公式; 3说明满足基本假定的最小二乘估计量的统计性质; 4写出随机扰动项方差的无偏估计公式; 3、对于多元线性计量经济学模型:1该模型的矩阵形式及各矩阵的含义; 2对应的样本线性回归模型的矩阵形式; 3模型的最小二乘参数估计量;4、根据美国1961年第一季度至1977年第二季度的数据,我们得到了如下的咖啡需求函数的回归方程:D D D P I P t t t t t t tT Q 321'0097.0157.00961.00089.0ln 1483.0ln 5115.0ln 1647.02789.1ˆln ----++-=其中,Q=人均咖啡消费量单位:磅;P=咖啡的价格以1967年价格为不变价格;I=人均可支配收入单位:千元,以1967年价格为不变价格;P '=茶的价格1/4磅,以1967年价格为不变价格;T=时间趋势变量1961年第一季度为1,…,1977年第二季度为66;D 1=1:第一季度;D 2=1:第二季度;D 3=1:第三季度; 请回答以下问题:① 模型中P 、I 和P '的系数的经济含义是什么 ② 咖啡的需求是否很有弹性 ③ 咖啡和茶是互补品还是替代品④ 你如何解释时间变量T 的系数 ⑤ 你如何解释模型中虚拟变量的作用 ⑥ 哪一个虚拟变量在统计上是显着的 ⑦ 咖啡的需求是否存在季节效应5、为研究体重与身高的关系,我们随机抽样调查了51名学生其中36名男生,15名女生,并得到如下两种回归模型:h W5662.506551.232ˆ+-= t=h D W7402.38238.239621.122ˆ++-= t=其中,Wweight=体重 单位:磅;hheight=身高 单位:英寸 请回答以下问题:① 你将选择哪一个模型为什么② 如果模型确实更好,而你选择了,你犯了什么错误 ③ D 的系数说明了什么6、以t Q 表示粮食产量,t A 表示播种面积,t C 表示化肥施用量,经检验,它们取对数后都是)1(I 变量且互相之间存在)1,1(CI 关系;同时经过检验并剔除不显着的变量包括滞后变量,得到如下粮食生产模型:t t t t t t C C A Q Q μααααα+++++=--1432110ln ln ln ln ln 1 ⑴ 写出长期均衡方程的理论形式; ⑵ 写出误差修正项ecm 的理论形式; ⑶ 写出误差修正模型的理论形式;⑷ 指出误差修正模型中每个待估参数的经济意义;7、简述异方差对下列各项有何影响:1OLS 估计量及其方差;2置信区间;3显着性t 检验和F 检验的使用;8、假设某研究使用250名男性和280名女性工人的工资Wage 数据估计出如下OLS 回归:标准误其中WAGE 的单位是美元/小时,Male 为男性=1,女性=0的虚拟变量;用男性和女性的平均收入之差定义工资的性别差距;1性别差距的估计值是多少2计算截距项和Male系数的t统计量,估计出的性别差距统计显着不为0吗5%显着水平的t统计量临界值为3样本中女性的平均工资是多少男性的呢4对本回归的R2你有什么评论,它告诉了你什么,没有告诉你什么评价这个回归结果5另一个研究者利用相同的数据,但建立了WAGE对Female的回归,其中Female 为女性=1,男性=0的变量;由此计算出的回归估计是什么9、基于人口调查1998年的数据得到平均小时收入对性别、教育和其他特征的回归结果,见下表;其中:AHE=平均小时收入;College=二元变量大学取1,高中取0;Female女性取1,男性取0;Age=年龄年;Northeast居于东北取1,否则为0;Midwest居于中西取1,否则为0;South居于南部取1,否则为0;West居于西部取1,否则取0;表1:基于2004年CPS数据得到的平均小时收入对年龄、性别、教育、地区的回归结果概括统计量和联合检验SERR2注:括号中是标准误;(1)计算每个回归的调整R2;(2)利用表1中列1的回归结果回答:大学毕业的工人平均比高中毕业的工人挣得多吗多多少这个差距在5%显着性水平下统计显着吗男性平均比女性挣的多吗多多少这个差距在5%显着性水平下统计显着吗(3)年龄是收入的重要决定因素吗请解释;使用适当的统计检验来回答;(4)Sally是29岁女性大学毕业生,Betsy是34岁女性大学毕业生,预测她们的收入;(5)用列3的回归结果回答:地区间平均收入存在显着差距吗利用适当的假设检验解释你的答案;(6)为什么在回归中省略了回归变量West如果加上会怎样;解释3个地区回归变量的系数的经济含义;7Juantia是南部28岁女性大学毕业生,Jennifer是中西部28岁女性大学毕业生,计算她们收入的期望差距。
最新《计量经济学》第二章-简单线性回归模型PPT课件

总体线性相关系数:
Cov(X,Y)
Var(X)Var(Y)
其中:Var( X ) ——X 的方差;V ar (Y ) ——Y的方差
Cov(X,Y) ——X和Y的协方差
样本线性相关系数:
__Байду номын сангаас
__
XY
(Xi X)(Yi Y)
__
__
(Xi X)2 (Yi Y)2
其中:X
Y 和
i
_ _i
分别是变量 X
E(Y Xi)f(Xi) 这个函数称为回归函数。 回归函数分为:总体回归函数和样本回归函数
举例:假如已知60个家庭构成的总体。
13
二、总体回归函数(PRF)
1. 总体回归函数的概念
前提:假如已知所研究的经济现象的总体应变
量 Y 和解释变量 X 的每个观测值, 可以计算出总体 应变量 Y 的条件均值 E (Y X i ) ,并将其表现为解释 变量 X 的某种函数
●回归线:
对于每一个 X
的取值, Y
都有 Y 的条件期望
E (Y X i ) 与之对应,
代表这些 Y 的条件期
望的点的轨迹所形成
的直线或曲线,称为
回归线。
Xi
X
12
回归线与回归函数
回归函数:应变量 Y 的条件期望 E (Y X i ) 随解 释变量 X 的的变化而有规律的变化,如果把 Y 的条件期望 E (Y X i ) 表现为 X 的某种函数
因素对 Y 的影响。
•
u
•
Xi
X
◆性质:u i 是期望为0有一定分布的随机变量
重要性:随机扰动项的性质决定着计量经济方
法的选择
18
计量经济学 庞皓 第三版课后答案

第二章简单线性回归模型2.1(1)①首先分析人均寿命与人均GDP的数量关系,用Eviews分析:Dependent Variable: YMethod: Least SquaresDate: 12/27/14 Time: 21:00Sample: 1 22Included observations: 22Variable Coefficient Std. Error t-Statistic Prob.C 56.64794 1.960820 28.88992 0.0000X1 0.128360 0.027242 4.711834 0.0001R-squared 0.526082 Mean dependent var 62.50000 Adjusted R-squared 0.502386 S.D. dependent var 10.08889 S.E. of regression 7.116881 Akaike info criterion 6.849324 Sum squared resid 1013.000 Schwarz criterion 6.948510 Log likelihood -73.34257 Hannan-Quinn criter. 6.872689 F-statistic 22.20138 Durbin-Watson stat 0.629074 Prob(F-statistic) 0.000134有上可知,关系式为y=56.64794+0.128360x1②关于人均寿命与成人识字率的关系,用Eviews分析如下:Dependent Variable: YMethod: Least SquaresDate: 11/26/14 Time: 21:10Sample: 1 22Included observations: 22Variable Coefficient Std. Error t-Statistic Prob.C 38.79424 3.532079 10.98340 0.0000X2 0.331971 0.046656 7.115308 0.0000R-squared 0.716825 Mean dependent var 62.50000 Adjusted R-squared 0.702666 S.D. dependent var 10.08889 S.E. of regression 5.501306 Akaike info criterion 6.334356 Sum squared resid 605.2873 Schwarz criterion 6.433542 Log likelihood -67.67792 Hannan-Quinn criter. 6.357721 F-statistic 50.62761 Durbin-Watson stat 1.846406 Prob(F-statistic) 0.000001由上可知,关系式为y=38.79424+0.331971x2③关于人均寿命与一岁儿童疫苗接种率的关系,用Eviews分析如下:Dependent Variable: YMethod: Least SquaresDate: 11/26/14 Time: 21:14Sample: 1 22Included observations: 22Variable Coefficient Std. Error t-Statistic Prob.C 31.79956 6.536434 4.864971 0.0001X3 0.387276 0.080260 4.825285 0.0001R-squared 0.537929 Mean dependent var 62.50000Adjusted R-squared 0.514825 S.D. dependent var 10.08889S.E. of regression 7.027364 Akaike info criterion 6.824009Sum squared resid 987.6770 Schwarz criterion 6.923194Log likelihood -73.06409 Hannan-Quinn criter. 6.847374F-statistic 23.28338 Durbin-Watson stat 0.952555Prob(F-statistic) 0.000103由上可知,关系式为y=31.79956+0.387276x3(2)①关于人均寿命与人均GDP模型,由上可知,可决系数为0.526082,说明所建模型整体上对样本数据拟合较好。
计量经济学第二章 简单线性回归

Yˆi Y
2
Yi Yˆi 2
计量经济学
ECONOMETRICS
计量经济学
ECONOMETRICS
两种不同的解释
Jeffrey M. Wooldridge等的解释。 SST表示Y的总体变异。它分为两部分,一部分SSE, 这部分可以由模型解释,另一部分SSR,这是模型解 释不了的部分。
另一种解释。 William H. Greene和Robert S. Pindyck等 SSE(Error Sum of Squares)——残差平方和 SSR(Regression Sum of Squares)——回归平方和
ECONOMETRICS
线性
ˆ1
X X Y Y X X 2
X X
X X
2Y
CY
ˆ0
Y
X
X X
X X
2Y
1 n
XC
Y
都是关于Y的线性函数
C 0
CX 1
C
2
1 X
X
2
计量经济学
ECONOMETRICS
ˆ0 , ˆ1
E
ˆ0
E
ˆ0
ˆ1 E ˆ1
Cov
1 n
Y
,
X X
X X
2
Y
XVar
ˆ1
X X 2 n X X 2
X
庞皓《计量经济学》(第4版)章节题库-第2章 简单线性回归模型【圣才出品】

二、选择题 1.下列属于线性总体回归函数的是( )。 A.Yi=β0+β1Xi+μi
1 / 30
圣才电子书
十万种考研考证电子书、题库视频学习平
台
B.E(Y∣Xi)=β0+β1Xi
C.Yi=Error!0+Error!1X0+Error!1Xi
4.下列各项中,不属于估计量的大样本性质的有( )。 A.一致性 B.无偏性 C.渐近无偏性 D.渐近有效性 【答案】B 【解析】考察总体的估计量其优劣性的准则:①线性性;②无偏性;③有效性;④渐 近无偏性;⑤一致性;⑥渐近有效性。前三个准则称作估计量的小样本性质,后三个准则 称为估计量的大样本或渐近性质。
5.对回归模型 Yi=β0+βiXi+μi,通常假定 μi 服从正态分布,如果利用最小二乘法估 计参数,那么( )。
A.Error!1 和 Error!0 是 F 分布 B.Error!1 和 Error!0 是 t 分布 C.Error!1 和 Error!0 是 χ2 分布
3 / 30
圣才电子书
2.对于一元线性回归模型,在经典线性回归的假定下,参数的最小二乘估计量是最 小方差无偏估计。( )
【答案】√ 【解析】普通最小二乘估计量具有的特征:①线性性,即估计量 0 和 Error!1 是 Yi 的线 性组合;②无偏性,即以 X 的所有样本值为条件,估计量 Error!0 和 Error!1 的均值(期望) 等于总体回归参数真值 β0 和 β1;③有效性,即在所有线性无偏估计量中,普通最小二乘 估计量 0 和 Error!1 具有最小方差。
圣才电子书
十万种考研考证电子书、题库视频学习平 台
第 2 章 简单线性回归模型
一、名词解释 1.总体回归函数 答:总体回归函数是指在给定量 Y 下,分布的总体均值与 X 所形成的函数关系(或者 说将总体被解释变量的条件期望表示为解释变量的某种函数)。由于变量间关系的随机性, 回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释 变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。
计量经济学第二章 简单线性回归模型公式

ˆ 1
x y x
i 2 i
i
E ( k ) k
^
方差
标准误差
Var ( 1 )
SE ( 1 )
^
^
xi
2
2
Var ( 0 ) 2
SE ( 0 )
^
^
n xi
Xi
2 2
2 2
x
2
i
OLS估计式是最佳线性无偏估计式。
X n x
18 16 14 12 10 8 6 4 2 0 50-60 70-80
35% 30% 25% 20%
`
15% 10% 5% 0% 90-100
计量经济学
第 二 章
简单线性回归模型
第二章小结
1、变量间的关系: 函数关系——相关关系。 相关系数——对变量间线性相关程度的度量。 2、现代意义的回归:一个被解释变量对若干个解释变量依存 关系的研究 回归的实质:由固定的解释变量去估计被解释变量的平均 值。 3、总体回归函数(PRF):将总体被解释变量Y的条件均值表 现为解释变量X的某种函数。 E (Yi X i ) 0 1 X i Y X u
i 0 1 i i
样本回归函数(SRF):将被解释变量Y的样本条件均值表 示为解释变量X的某种函数。
ˆ ˆ X e Yi 0 1 i i
ˆ ˆX ˆ Y i 0 1 i
2
总体回归函数与样本回归函数的区别与联系。
4、随机扰动项:被解释变量实际值与条件均值的偏差,代表排
除在模型以外的所有因素对Y的影响。
3
随机扰动与解释变量不相关假定: 正态性假定:
ui ~ N (0, 2 )
庞皓《计量经济学》笔记和课后习题详解(简单线性回归模型)【圣才出品】

圣才电子书 十万种考研考证电子书、题库视频学习平台
图 2-1 变量相关关系的散点图 根据涉及的变量数量、相关性质及相关程度的不同,变量之间的相关关系可以分为若干 类型。相关关系的类型见表 2-1。
表 2-1 相关关系的类型
2 / 39
圣才电子书 十万种考研考证电子书、题库视频学习平台
4 / 39
圣才电子书 十万种考研考证电子书、题库视频学习平台
是要根据解释变量的数值去估计所研究的被解释变量的总体平均值。 (4)相关分析与回归分析的联系与区别(见表 2-2) 表 2-2 相关ቤተ መጻሕፍቲ ባይዱ析与回归分析的联系与区别
注意:相关分析和回归分析只是从数据出发定量地分析经济变量间相互联系的手段,并 不能决定经济现象相互之间的本质联系。在对经济问题开展相关分析和回归分析时,要注意 与定性的经济分析相结合,才能得到有实际意义的结果。
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 2 章 简单线性回归模型
2.1 复习笔记
考点一:回归分析与回归函数 ★★★
1.相关分析与回归分析 (1)经济变量间的相互关系 ①确定性的函数关系 当一个或若干个变量 X 取一定数值时,某一个变量 Y 有确定的值与之相对应,则称变 量之间的这种关系为确定性的函数关系。一般情况下,确定性的函数关系可表示为 Y=(f X)。 ②相关关系 当一个或若干个变量 X 取一定数值时,与之相对应的另一个变量 Y 的值虽然不确定, 但却按某种规律在一定范围内变化,则称变量之间的这种关系为不确定的统计关系或相关关 系,一般可表示为 Y=f(X,u),其中,u 为随机变量。 坐标图(又称散点图)可以用来描述变量之间的相关关系,如变量 X 和 Y 之间关系的 散点图可描述为图 2-1。
庞浩计量经济学第二章简单线性回归模型

最小二乘法的应用
在统计学和计量经济学中,最 小二乘法广泛应用于估计线性 回归模型,以探索解释变量与 被解释变量之间的关系。
通过最小二乘法,可以估计出 解释变量的系数,从而了解各 解释变量对被解释变量的影响 程度。
最小二乘法还可以用于时间序 列分析、预测和数据拟合等场 景。
最小二乘法的局限性
最小二乘法假设误差项是独立同分布 的,且服从正态分布,这在实际应用 中可能不成立。
最小二乘法无法处理多重共线性问题, 当解释变量之间存在高度相关关系时, 最小二乘法的估计结果可能不准确。
最小二乘法对异常值比较敏感,异常 值的存在可能导致参数估计的不稳定。
04
模型的评估与选择
R-squared
总结词
衡量模型拟合优度的指标
详细描述
R-squared,也称为确定系数,用于衡量模型对数据的拟合程度。它的值在0到1之间,越接近1表示模型拟合越 好。R-squared的计算公式为(SSreg/SStot)=(y-ybar)2 / (y-ybar)2 + (y-ybar)2,其中SSreg是回归平方和, SStot是总平方和,y是因变量,ybar是因变量的均值。
数据来源
本案例的数据来源于某大型电商 平台的销售数据,包括商品的销 售量、价格、评价等。
数据处理
对原始数据进行清洗和预处理, 包括处理缺失值、异常值和重复 值,对分类变量进行编码,对连 续变量进行必要的缩放和转换。
模型建立与评估
模型建立
基于处理后的数据,使用简单线性回 归模型进行建模,以商品销售量作为 因变量,价格和评价作为自变量。
线性回归模型是一种数学模型, 用于描述因变量与一个或多个 自变量之间的线性关系。它通 常表示为:Y = β0 + β1X1 + β2X2 + ... + ε
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ei2 n2
1 xi2
谷物-化肥一例的参数显著性检验 计量经济学
ECONOMETRICS
谷物-化肥一例的参数显著性检验(续) 计量经济学
ECONOMETRICS
SE ˆ0
ei2 n2 n
X
2 i
xi2
47.3056 3816 1.98 10 2 10 576
计量经济学
ECONOMETRICS
回归的由来
回归(Regression)一词来源于19世纪英国生物学家葛 尔登(Francis Galton, 1822-1911)对人体遗传特征的 实验研究。他根据实验数据发现,双亲高的孩子个子 高,双亲矮的孩子个子矮,然而高和矮却不是无限制 的,总是越来越趋向于人的平均身高,他称这种现象 为“回归”。
ECONOMETRICS
Bushels of corn Y
90
80
70
60
50
40
30 5
10 15 20 25 30 35
Fertilizer X
利用Eviews所作
计量经济学
ECONOMETRICS
普通最小二乘估计(OLS)
计量经济学
ECONOMETRICS
普通最小二乘法
(ordinary least-squares method)
参数
自变量或 解释变量
计量经济学
ECONOMETRICS
简单线性回归模型的重要假设
1) X与Y之间的关系是线性的; 2) X是非随机的变量,它的值是确定的; 3) 误差项的期望为0; 4) 对于所有观测值,误差项具有相同的方差; 5) 随机误差之间相互独立; 6) 误差项服从正态分布。
参数估计的另一种表达式
令 xi Xi X yi Yi Y
则
ˆ1
xi yi xi2
cov X ,Y
2 X
计量经济学
ECONOMETRICS
误差和残差的区别
误差
Yi 0 1Xi i i Yi 0 1Xi
残差
Yˆi ˆ0 ˆ1Xi ei Yi Yˆi Yi ˆ0 ˆ1Xi
为2.306,因此我们得到估计的参数在5%的显著性
上是统计显著的。
计量经济学
ECONOMETRICS
P值
单侧:
H0 : 1 , H1 : 1
P值= Pt t1 H0
现在统计学上回归指的是变量之间的依存关系。
计量经济学
ECONOMETRICS
两变量线性模型
反映因变量和自变量之间的近似线性关系
Yi 0 1 X i
由于所有点不可能恰在直线上,因此上式需添加 一随机扰动,误差或随机项 i ,这样上式成为:
Yi 0 1Xi i
因变量或 被解释变量
谷物产量和所用化肥量的计算 计量经济学
ECONOMETRICS
计量经济学
谷物产量和所用化肥量的计算(续) ECONOMETRICS
ˆ1
xi yi xi2
956 576
1.66
ˆ0 Y ˆ1X 57 1.6618 27.12
Yˆi 27.12 1.66Xi
计量经济学
ECONOMETRICS
第二章 简单线性回归
● 模型的建立及其假定条件 ● 普通最小二乘估计(OLS) ● 参数估计的显著性检验 ● 回归方程检验 ● 普通最小二乘估计的特性 ● 预测 ● 模型应用及有关软件操作 ● Monte Carlo 模拟
计量经济学
ECONOMETRICS
模型的建立及其假定条件
当 Xi 18 X ,Yˆ 27.12 1.6618 57 Y
说明?
计量经济学
ECONOMETRICS
参数的显著性检验
计量经济学
ECONOMETRICS
参数的显著性检验
参数估计的方差
Var ˆ0
2
n
X
2 i
xi2
Var ˆ1 2
1 xi2
由于 2未知,因此常用 2 的无偏估计残差方差 s2
来替代
s2 ˆ 2 ei2 n2
其算术根称回归标准误
2表示估计 参数的个数
计量经济学
ECONOMETRICS
参数估计的标准误
SE ˆ0
ei2
X
2 i
n 2 n xi2
SE ˆ1
SE ˆ1
ei2 n2
1 xi2
47.3056
10 2576
0.1
因此
t0
ˆ0
SE
0 ˆ0
27.12 0 13.7 1.98
t1
ˆ1 1 SE ˆ1
1.66 16.6 0.1
由于自由度为8显著性水平为0.05的t分布的临界值
计量经济学
ECONOMETRICS
例: 某农场1971年至
Year Yi
Xi
1980年每英亩的谷物 1971 40
6
产量(bushel)和化肥施 用量(pound)之间的数
1972
44
10
据见表,求出产量与 1973 46
12
化肥施用量之间的关 1974 48
14
系。
1975 52
16
data21.xls
1976 58
18
注:蒲式耳(谷物,水果等容量单位,
1977
60
22
美=35.238升,英=36.368升) 1 pound (磅)=0.4536 kilogram
1978 68
24
(千克) 1 acre (英亩)=0.405 hectare (公顷)
1979
74
26
1980 80
32
谷物产量和化肥施用量之间散点图 计量经济学
OLS用来拟合XY观测值样本的一条最好的直 线,涉及到求如下的最小值:
Min Yi Yˆi 2
其中Yi 表示实际观测值,Yˆi 表示相应的拟合值,
Yi Yˆi ei 称为残差。
计量经济学
ECONOMETRICS
参数估计
SSR ˆ0, ˆ1 ei2 Yi ˆ0 ˆ1Xi 2
令
SSR
ˆ0
0
SSR
ˆ1
0
得
Yi nˆ0 ˆ1 Xi
XiYi ˆ0
Xi ˆ1
X
2 i
从而
X iYi Xi2
X i Yi
2
Xi
ˆ0 Y ˆ1X
计量经济学
ECONOMETRICS