计量经济学讲义-3--第一章 线性回归基础
计量经济学讲义—— 线性回归模型的自相关问题

10.5 自相关的诊断-Durbin-Watson d检验法
Durbin-Watson d统计量可以用来诊断回归模型的自相关
n
d =
∑
t=2
( e t − e t −1 ) 2
n
∑
样本容量为n-1。
t =1
e t2
(10.3)
Durbin-Watson d检验量是诊断自相关常用的检验 工具,必须掌握。
10.2 自相关产生的原因
1. 经济时间序列的惯性(inertia)或迟缓性(sluggishness)特征。 2. 模型适定误差。有些自相关并不是由于连续观察值之间相 关产生的,而是因为回归模型不是适定性的“好”模型。 “不好模型”有多种原因。 3. 蛛网现象(the cobweb phenomenon)。一个变量对另一个变 量的反映不是同步的,时滞一定的时间。商品供给对价格 的反映: St = B1 + B2*Pt-1 + ut (10.2)
∑
t=2 n
e t e t −1 e t2
ˆ ,− 1 ≤ ρ ≤ 1
(10.5)
∑
t =1
如果d接近0,则存在正相关;d接近4,则存在负相关;d 接近2,表示不存在相关。
10.5 自相关的诊断-Durbin-Watson d检验法
d 统计量诊断自相关需要一定的假设条件,不是任意可用的: 1. 回归模型包括一个截距项。因此,d统计量无法判断通过原 点的回归模型的自相关问题。 2. 变量X是非随机变量,即在重复抽样中变量X的值是固定不 变的。 3. 扰动项ui的生成机制是:
4. 数据处理。在做季节因素的调整时,经常要做移动平均。 移动平均的处理可以消除季节波动的影响,但带来新的问 题则是产生了自相关。
计量经济学重点讲解

计量经济学重点讲解计量经济学重点第⼀章经济计量学的特征及研究范围1、经济计量学的定义(P1)(1)经济计量学是利⽤经济理论、数学、统计推断等⼯具对经济现象进⾏分析的⼀门社会科学;(2)经济计量学运⽤数理统计学分析经济数据,对构建于数理经济学基础之上的模型进⾏实证分析,并得出数值结果。
2、学习计量经济学的⽬的(计量经济学与其它学科的区别)(P1-P2)(1)计量经济学与经济理论经济理论:提出的命题和假说,多以定性描述为主计量经济学:依据观测或试验,对⼤多数经济理论给出经验解释,进⾏数值估计(2)计量经济学与数理经济学数理经济学:主要是⽤数学形式或⽅程(或模型)描述经济理论计量经济学:采⽤数理经济学家提出的数学模型,把这些数学模型转换成可以⽤于经验验证的形式(3)计量经济学与经济统计学经济统计学:涉及经济数据的收集、处理、绘图、制表计量经济学:运⽤数据验证结论3、进⾏经济计量的分析步骤(P2-P3)(1)建⽴⼀个理论假说(2)收集数据(3)设定数学模型(4)设⽴统计或经济计量模型(5)估计经济计量模型参数(6)核查模型的适⽤性:模型设定检验(7)检验源⾃模型的假设(8)利⽤模型进⾏预测4、⽤于实证分析的三类数据(P3-P4)(1)时间序列数据:按时间跨度收集到的(定性数据、定量数据);(2)截⾯数据:⼀个或多个变量在某⼀时点上的数据集合;(3)合并数据:包括时间序列数据和截⾯数据。
(⼀类特殊的合并数据—⾯板数据(纵向数据、微观⾯板数据):同⼀个横截⾯单位的跨期调查数据)第⼆章线性回归的基本思想:双变量模型1、回归分析(P18)⽤于研究⼀个变量(称为被解释变量或应变量)与另⼀个或多个变量(称为解释变量或⾃变量)之间的关系2、回归分析的⽬的(P18-P19)(1)根据⾃变量的取值,估计应变量的均值;(2)检验(建⽴在经济理论基础上的)假设;(3)根据样本外⾃变量的取值,预测应变量的均值;(4)可同时进⾏上述各项分析。
计量经济学(第四版)课件:一元线性回归分析基础

一元线性回归分析基础
第三节 最小二乘估计量的性质
β*1= - β1 =(1/n)∑Yt- ∑btYt =∑[(1/n)- bt]Yt 令 at= [(1/n)- bt] 由于和bt均为非随机变量,所以at也是非随机变量。 因此 β*1 =∑atYt 即β*1是Yt的线性组合。
一元线性回归分析基础
第三节 最小二乘估计量的性质
二、无偏性 指β*1和β*2 的期望值分别等于总体参数β1和β2。 即E(β*1)=β1 E(β*2 )=β2 E(β*2 )=E(β2+∑btut) =β2+∑btE(ut) =β2 E(β*1)=E(β1+∑atut) =β1
总体
有限总体
无限总体
任何样本都是有限的
一元线性回归分析基础
第三节 最小二乘估计量的性质
一、线性特性
是指参数估计值β*1和β*2分别为观察值Yt或扰动项ut的线性组合。
证: β*2 =∑Xtyt/ ∑Xt2 =∑Xt(Yt- )/∑X2t =∑(Xt/∑Xt2)Yt 令 bt= (Xt/∑Xt2) 得 β*2 = ∑ bt Yt 即β*2 是Yt的线性组合
一元线性回归分析基础
第三节 最小二乘估计量的性质
2.证明最小方差性 假设β**2是其他方法得到的关于β2的线性无偏估计 β**2=∑ctYt 其中,ct=bt+dt,dt为不全为零的常数 则容易证明 var(β**2)≥ var(β*2) 同理可证明β1的最小二乘估计量β*1具有最小方差。 高斯—马尔可夫定理(Gauss-Markov theorem): 满足性质1、2、3的最小二乘估计量是最优线性无偏估计量(best linear unbiased estimator:BLUE)
计量经济学-3多元线性回归模型

2020/12/8
计量经济学-3多元线性回归模型
•第一节 概念和基本假定
•一、基本概念: • 设某经济变量Y 与P个解释变量:X1,X2,…,XP存在线性依
存关系。 • 1.总体回归模型:
•其中0为常数项, 1 ~ P 为解释变量X1 ~ XP 的系数,u为随机扰动项。 • 总体回归函数PRF给出的是给定解释变量X1 ~ XP 的值时,Y的期 望值:E ( Y | X1,X2,…,XP )。 • 假定有n组观测值,则可写成矩阵形式:
计量经济学-3多元线性回归模型
•2.样本回归模型的SRF
计量经济学-3多元线性回归模型
•二、基本假定: • 1、u零均值。所有的ui均值为0,E(ui)=0。 • 2、u同方差。Var(ui)=δ2,i=1,2,…,n
计量经济学-3多元线性回归模型
•
计量经济学-3多元线性回归模型
•
•第二节 参数的最小二乘估 计
•五、预测
•(一)点预测 •点预测的两种解释:
计量经济学-3多元线性回归模型
•(二)区间预测
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
•例5,在例1中,若X01=10,X02=10,求总体均值E(Y0|X0) 和总体个别值Y0的区间预测。
•
Yi=β0+β1Xi1+β2Xi2+ui
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
计量经济学-3多元线性回归模型
•三、最小二乘估计的性质
计量经济学-3多元线性回归模型
3、计量经济学【一元线性回归模型——参数估计】

ˆ Y i
(8) 651.8181 753.6363 855.4545 957.2727 1059.091 1160.909 1262.727 1364.546 1466.364 1568.182 11100
ˆ ei Yi Y i
(9)=(2)-(8) 48.18190 -103.6363 44.54550 -7.272700 40.90910 -10.90910 -62.72730 35.45450 83.63630 -68.18190
假设 5:随机误差项服从 0 均值,同方差的正态 分布,即
2 i ~ N (0, ), ,,,,,,,,, ,, i 1,2, n
以上这些假设称为线性回归模型的经典假
设,满足这些假设的线性回归模型,也称为 经典线性回归模型(classical linear regression model)。在回归分析的参数估计和统计检验 理论中,许多结论都是以这些假定作为基础 的。如果违背其中的某一项假定,模型的参 数估计就会存在问题,也就是说最小二乘法 (OLS)就不再适用,需对模型进行修正或 采用其他的方法来估计模型了。
二、参数的普通最小二乘估计(OLS) 三、最小二乘估计量的性质 四、参数估计量的概率分布及随机误差项
方差的估计
给出一元线性回归模型的一般形式:
Yi 0 1 X i i ,,,, , i 1, 2, ,n
其中 Yi :被解释变量,X i :解释变量,0 和 1 :待估参 数; i :随机误差项;
ei2
(10) 2321.495 10740.48 1984.302 52.89217 1673.554 119.0085 3934.714 1257.022 6995.031 4648.771 33727.27
计量经济学第三章-一元线性回归模型PPT课件

Y i Y ˆi ˆiˆ0ˆ1 X i e i
式中, ei 称为(样本)残差(或剩余)项(residual),是
实际观测值和拟合值的偏差。可看成是 的估i 计量 ˆi 。
由于方程中引入了随机项,成为计量经济模型, 因此也称为样本回归模型(sample regression model)。
.
7
含义:
回归函数(PRF)说明被解释变量Y的平均状 态(总体条件期望)随解释变量X变化的规律。
• 函数形式:
可以是线性或非线性的。 为什么线性形式这么重要?Taylor展开。
将粮食产量看成是播种面积的线性函数时:
E (Y|X i)01X i
为一线性函数。其中,0,1是未知参数,称为
回归系数(regression coefficients)。
.
16
每次抽样都能获得一组样本,就可以拟合一条 样本回归线,因此,样本回归线是随抽样波动 而变化的,可以有许多条,这就决定了SRF不 唯一。
.
6
概念:
在给定解释变量Xi条件下被解释变量Yi的 期望轨迹称为总体回归线(population regression line),或更一般地称为总体回归曲 线(population regression curve)。
相应的函数:
E(Y|Xi)f(Xi)
称为(双变量)总体回归函数(population regression function, PRF)。
.
8
注意:线性回归的含义 指的是对参数是线性的
E (cons|inc)01 inc
诸如此类,都是线性回归的范畴。 除此之外,很多模型不能塑造成线性回归模型,就 需要走入非线性回归模型的领域
实验3计量经济学实验一元线性回归模型

ˆ1 ~N(1,,
2
) (Xi X)2
三、知识点回顾
n 4、最小二乘估计量的性质及分布
随机干扰项 i 的方差 2 的估计 ˆ 0 和 ˆ 1 的方差表达式中都包含随机干扰项 i 的方差 2
,由于随机干扰项 i 实际上是无法观察测量的,因此其
量 Y 的平均值。
三、知识点回顾
1、四种重要的关系式
(2)总体回归函数(方程): E(YXi)01Xi
其中总体回归参数真值 0 , 1 是未知的;总体回归方程也是 未知的。
(3)样本回归函数(方程): Yˆi ˆ0 ˆ1Xi
在实际应用中,从总体中抽取一个样本,进行参数估计,从 而获得估计的回归方程,系数 ˆ 0 , ˆ1 为估计的回归系数;用 这个估计的回归方程近似替代总体回归方程,其中估计的回 归系数 ˆ 0 , ˆ1 是总体参数真值 0 , 1 的估计值;基于估计方程 计算的 Y ˆ i 就为 E (Y X i ) 的估计值; 由于我们从来就无法知道真实的回归方程,因此计量经济学 分析注重的是这个估计的回归方程和估计的回归系数;
据;普通最小二乘法给出的判断拟合程度的标准是:残差平
方和最小,即:m in Q ne i2n(Y i Y ˆi)2n Y i (ˆ0ˆ1 X i) 2
i 1
i 1
i 1
最小二乘法就是:在使上述残差平方和Q 达到最小时,确定
模型中的参数 ˆ 0 和 ˆ 1 的值,或者说在给定观测值之下,选
择出 ˆ 0 , ˆ1 的值,使残差平方和Q 达到最小。
接近,这也说明OLS估计值是非常有价值的。
三、知识点回顾
n 4、最小二乘估计量的性质及分布
计量经济学重点内容

计量经济学第一章use 打开数据 describe 查看数据集情况 summary 描述统计tabstat +[stats] 计算描述性统计量(指定) table+[contents] 类别变量+连续变量列联表 table/ tabulate 类别变量频次表 histogram 直方图第二章 一元回归线性模型:基本思想第三章 第四章 一元、多元线性回归模型:假设检验随机扰动项、参数的方差、标准误计算统计检验1模型的拟合优度检验:R2判定系数(可决系数)调整的可决系数:范围在0和1之间,越接近1,说明模型具有较高的拟合优度2方程的显着性检验:F 统计量,prob (F )F >F(k-1,n-k),拒绝原假设H0,即显着。
F<F(k-1,n-k),则暂时不拒绝,不显着。
显着性概率为0,小于给定显着性水平(0.05),表明模型对总体拟合显着 3变量的显着性检验:T 统计量 (服从n-2,n-k ),p 值Β2一般为0,T>2.306为显着,T<2.306为不显着(5%水平) 线性回归模型的基本假设:假设1:模型具有线性性(针对模型)。
Y 是参数βi 的线性组合,不一定要求是变量X 的线性组合。
假设2 :解释变量X 与u 不相关(针对扰动项)。
数学表达:cov(Xi,ui)=0通常说法:X 具有外生性假设3:给定X ,扰动项的期望或均值为零(针对扰动项)。
数学表达:E(?i |Xi)=0,i=1,2, …,n 假设4:同方差假定(针对扰动项)。
数学表达:Var (ui) = ??2 = Var (Yi) i=1,2, …,n. 假设5:无自相关(针对扰动项)。
数学表达:Cov(?i, ?j ) = 0= Cov(Y i, Y j ) i≠j 假设6:回归模型设定是正确的(表面是针对模型,实质上是针对扰动项)sort 排序 order 排序 drop 去除记录 keep 保留记录 generate 生产新变量 replace 给变量赋新值 rename 给变量重命名2R假设7:扰动项符合正态分布(针对扰动项)数学表达:?i~N(0, ??2 ) Y i~N(β0+β1X, ??2 )第五章线性回归模型拓展(函数形式,变量测度单位)第六章虚拟变量回归有截距,m个类别(取值),仅引入m-1个虚拟变量,无截距可以m个第七章模型设定误差1包含无关变量:后果(F,T检验)参数估计是无偏且一致的估计,但不是有效的估计,检验仍然有效,但方差增大,接收错误假设的概率较高。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4 最小二乘原理计量经济学最关心的理论模型是类似于y x αβ=+ 表示变量之间的关系。
1. 散点图为了弄清楚变量之间的关系,我们从画出他们的散点图开始比较好。
从画的图中我们可以大体上判断以下变量之间是呈直线关系,还是二次曲线关系。
这对准确建立模型很有帮助。
模型y x αβ=+代表只要我们知道x ,我们就可以完全知道y 。
但是现实中不是这样。
这时除了系统因素x 之外,还有其他别的因素影响y 。
此时我们用确率模型 ,1,2,,t t t Y X u t n αβ=++=来表示。
其中,y 是被说明变量,或从属变量;x 是说明变量,或独立变量;u 是误差项,也可以叫做搅乱项。
2. 函数的设定与参数的意义不同的模型定义,它所定义的参数的意义不同。
为简单起见,在本节中,我们先省去误差项。
我们讨论一下参数的意义。
在y x αβ=+中,dy dxβ=,β意味着x 发生一单位的变化时,y 相应地变化几个单位,也就是我们所熟悉的限界消费性向。
但是对于y x βα=来说,我们先两边取自然对数,log log log y x αβ=+,这时,log log d y d xβ=,其中,log ,log dy dx d y d x yx==,结果log log d y x dy d xy dxβ==。
β代表x 变化1%时,y 变化β%单位。
也就是弹力性。
3. 最小二乘法3-1. 基本符号样本平均 1111,nnt tt t X X Y Ynn====∑∑偏离样本平均的平方和 ()22222111nnnxttt t t t S xXXX nX=====-=-∑∑∑;()22222111nnnytttt t t S y YYYnY =====-=-∑∑∑()()111nnnxy tt ttt t t t t S xy XXYYX Y nX Y =====--=-∑∑∑其中,,t t t t x X X y Y Y =-=-,小写代表偏离样本平均的程度,即偏差。
偏差有以下重要性质:()110nnttt t xXX===-=∑∑; ()110nnt tt t y YY===-=∑∑证明:()121nt n t X X X X X X X X =-=-+-++-∑1nt t X nX ==-∑111nnt t t t X n X n==⎛⎫=-⎪⎝⎭∑∑=0 我们可以同样证明10nt t y ==∑。
下面我们再看看()222211nnxtt t t S XXX nX ===-=-∑∑。
()()2222112nnxttt t t S XXXX X X===-=-+∑∑22112nntt t t XXX nX ===-+∑∑()2212ntt XX nX nX==-+∑221nt t X nX ==-∑我们用同样的方法可以求出2,y xy S S 。
3-2. 最小二乘原理我们定义Y X αβ=+的推定线为ˆˆˆYX αβ=+,其中ˆY 和ˆˆ,αβ分别代表Y 和,αβ的推定值,∧读为ha.to 。
当t X X =时,ˆˆˆt t Y X αβ=+。
观察值t Y 与推定值ˆt Y 之间的差,我们称之为残差(residual)。
在图中,用垂直于横轴的线段t e 来表示。
即,ˆˆˆt t t t t e Y Y Y X αβ=-=--,te 代表观察时点t 时,观察值与推定值的不一致的程度。
为了评价所有的观察时点1,2,,t n = ,的不一致程度,我们用()2211ˆˆnntttt t e YX αβ===--∑∑作为衡量的尺度。
()2211ˆˆnntt tt t e Y X αβ===--∑∑我们把21nt t e =∑称为残差平方和(residual sum ofsquares,RSS)。
但是我们不能用1n t t e =∑,31ntt e =∑和51nt t e =∑作为衡量不一致程度的工具。
因为与观察值无关,只要给出足够大的ˆˆ,αβ,1nt t e =∑,31nt t e =∑和51ntt e =∑可以任意地变小。
也就是说它们没有最小值。
但是,21ntt e =∑ 确不一样。
21ntt e =∑的值与ˆˆ,αβ有关。
所以我们只要找到使得21nt t e =∑最小的ˆˆ,αβ最为,αβ的推定值。
这就是最小二乘法。
3-3. 最小二乘推定量的导出对于模型,1,2,,t t t Y X u t n αβ=++= 来说,,αβ的最小二乘推定量为ˆˆ,αβ,它们是使得残差平方和()2211ˆˆnnt ttt t e YX αβ===--∑∑最小的,αβ的推定值。
()()垐 垐t t t t Y X Y Y X X Y X αββαβ--=---+--()垐ˆtt yx Y X βαβ=-+-- 两边平方 2ˆˆ()t tY X αβ-- ()()()2222垐垐垐垐 222tt t t t t y x Y Xx y y Y x Y X βαββαββαβ=++---+----- ()21ˆˆnttt YX αβ=--∑()()()222211111垐垐垐垐 222nnnnntt t tt tt t t t t y x n Y Xx y Y y Y X xβαββαββαβ======++---+-----∑∑∑∑∑前面我们曾经提到10nt t e ==∑,进一步我们可以得到110,0nnt t t t x y ====∑∑,()21ˆˆnt tt Y X αβ=--∑()2222111垐 ˆ2nnntt t t t t t y x n Y X x y βαββ====++---∑∑∑我们用偏差平方和的写法把上面的残差平方和再重新改写一下,()21ˆˆnt tt Y X αβ=--∑()2222垐 ˆ2yx xyS S n Y X S βαββ=++--- ()2222垐 ˆ2y x xyS S n Y X S βαββ=++--- ()22222垐ˆxy xy x yx x S S n Y X S S S S αββ⎛⎫⎛⎫=--+-+- ⎪ ⎪ ⎪⎝⎭⎝⎭上式的右侧第三项中不含有ˆˆ,αβ,所以第三项不会随着ˆˆ,αβ的变化而变化。
第一项和第二项由都是平方的形式,因此只要第一项和第二项同时为0的是时候,残差平方和就为最小,也就是残差平方和为0。
()2ˆˆ0Y X αβ--= 2ˆ0xy x x S S S β⎛⎫-= ⎪⎝⎭这种求最小二乘推定量方法的优点是,不需要使用偏微分方法,也不需要讨论为使残差平方和最小而必须满足的二次条件。
4. 最小二乘回归线我们把ˆˆˆt tY X αβ=+称为最小二乘回归线或样本回归线。
我们把ˆˆY X αβ=-代入样本回归线中,我们发现 ()垐 ˆt t tY Y X X Y X X βββ=-+=+-,由此我们可以判断样本回归线经过样本平均点(),X Y 。
5. 练习题1). 使用下面的数据,用最小二乘法估计模型Y X u αβ=++。
X 6 11 17 8 13 Y13524。
第一种方法: x 6 11 17 8 13 55 sum(x) y1 352415 sum(y)xy 633 85 16 52 192 sum(xy)xx 36 121 289 64 169 679 sum(xx) ()2251925515135ˆ0.36556795555370n XY X Yn XX β-⨯-⨯====⨯-⨯-∑∑∑∑∑;ˆˆY Xnβα-=∑∑=-1.01另外一种求法:先求出均值,X Y ;求出small x,y;再求出2,,,x y x y x ∑∑∑∑;2垐ˆ;xy YX xβαβ==-∑∑;。