第3章 双变量模型假设检验

合集下载

经济计量学第三讲双变量回归模型的区间估计及其假设检验

经济计量学第三讲双变量回归模型的区间估计及其假设检验

决策准则:
5. 如果 t > tc 或 -t < - tc , 则拒绝 Ho
or | t | > | tc |
接受域
拒绝 H0 区域
( ) bˆ 2 -
t
c
a
* Se
2, n-2
bˆ 2
b2
东北财经大学数量经济系
拒绝 H0 区域
( ) bˆ 2
+
tc a 2,
*
n-2
Se
bˆ 2
第三节 双变量回归的假设检验(4)
t = 0.5091 - 0.3 = 0.2091 = 5.857 0.0357 0.0357
东北财经大学数量经济系
第三节 双变量回归的假设检验(7)
One-Tailed t-test (cont.)
2. 查表得知
tc 0.05, 8
where
tc 0.05 ,
8
=1.860
a = 0.05
3. 比较 t 和临界值 t
sˆ 2
Pr[(n - 2)
s 2 (n - 2)
sˆ 2
] =1-a
2 a/2
2 1-a / 2
东北财经大学数量经济系
第三节 双变量回归的假设检验(1) 第三节 双变量回归的假设检验
一、假设检验的基本问题 1.假设检验的基本思想 2.基本概念
二、假设检验的置信区间方法
东北财经大学数量经济系
一、正态性假定 1.正态性假定的含义 2.随机干扰项做正态假定的理由
二、在正态假定下OLS估计量的性质
东北财经大学数量经济系
第一节 正态性假定:经典正态线性回归模型(2)
三、最大似然法 1.双变量回归模型的最大似然估计 — 似然函数 — 最大似然法的基本思想 — 回归系数和随机干扰项的ML估计量

计量经济学 第3章 双变量模型:假设检验

计量经济学 第3章 双变量模型:假设检验

假设检验的前提是什么?
本章框图 一、古典假设
回归结果好坏? 三、高斯马尔科夫定理
二、估计量的分布问题
四、 假设 检验
七、正态性检验
方法 统计量 显著性
结论
五、拟合优度 六、预测
一、OLS估计需要的基本假设有哪些?
一、OLS估计需要的基本假设有哪些?
一、OLS估计需要的基本假设有哪些
一、OLS估计需要的基本假设有哪些?
十三、案例2股票价格和利率
理论和假说 变量选择 数据6-13 散点图 估计和结果 结论的经济意义
十四、案例3房价和贷款利率
理论和假说 变量选择 数据6-6 散点图 估计和结果 结论的经济意义
十五、案例4古董和拍卖价格
理论和假说 变量选择 数据6-14 散点图 估计和结果 结论的经济意义
第3章 双变量模型:模型检验
引子、样本回归参数的估计问题
引子、样本回归参数的估计问题
结论:
样本回归系数随样本变化。 样本回归系数是随机变量,如何描述? 样本回归系数和总体回归参数是什么关系 基于什么条件下,利用最小二乘估计的得
到的样本回归系数可以用来作为总体回归 参数的估计? 根据什么说明:总体回归函数的模型设定 是正确的。
习题讨论
习题讨论
习题讨论
习题讨论
习题讨论
习题讨论
习题讨论
五、显著性检验方法的原理是什么
五、显著性检验方法的原理是什么
五、显著性检验方法的原理是什么
五、显著性检验方法的原理是什么
六、样本回归函数拟合数据好坏的标准是什么?
六、样本回归函数拟合数据好坏的标准是什么?
六、样本回归函数拟合数据好坏的标准是什么?
七、判决系数的性质有哪些?

第3章 双变量模型-假设检验(1)

第3章 双变量模型-假设检验(1)


n
Xi X Yi Y b2 2 X X i 参数估计量的计算公式为: b1 Y b2 X
消费支出Y 3000 2500 2000 1500 1000 500 0 0
可支配收入X 1000 2000 3000 4000
小结:用EXCEL和Eviews实现最小二乘法
随机误差项ui的方差2的估计
由于随机项ui不可观测,只能从ui的估计——残差ei出发, 对随机项ui的方差2进行估计。
由数理统计的基本原理可以证明,2的最小二乘估计量为
ˆ
2
2 e i
n2

2 e i
2 2 2 2 e y b x i i 2 i 2 ˆ n 2 n 2
第3章 双变量模型参数的统计检验
一、线性回归模型的基本假设
二、普通最小二乘估计量的方差与标准误
三、OLS估计量的概率分布
四、变量的显著性检验
五、参数的置信区间
§3.1 线性回归模型的基本假设
回归分析的主要目的是要通过样本回归函数(模型)SRF 尽可能准确地估计总体回归函数(模型)PRF。
估计方法有多种,其种最广泛使用的是普通最小二乘法 (ordinary least squares, OLS)。
为保证参数估计量具有良好的性质,使用普通最小二乘法 通常对模型要提出若干基本假设。
线性回归模型的基本假设
假设1、解释变量X是确定性变量,不是随机变量 假设2、随机误差项具有零均值、同方差和不序列相关性
如果假设1、2 满足,则假设 3也满足; 如果假设4满 足,则假设2 也满足
E(ui)=0
量中,OLS估计量是具有最小方差的最优线性无偏估计量。

[农学]B03 假设检验:双变量模型

[农学]B03 假设检验:双变量模型
1 1 1

i
ˆ ) Var( ˆ ) / Se( 1 1
ˆ ) Se( 0
ˆ ) 2 [ X 2 / n ( X X )2 ] Var( i i 0
2 ( X X ) i
2 2 X /[ n ( X X ) ] i i
5
计量经济学
一、误差项的概率分布
1、进行OLS估计时,对误差项的概率分布没 有假定。对误差项的假定仅仅是:均值为0、没 有自相关且方差相等,有了这些假定,无论误 差项的分布为何,OLS估计量均为BLUE。 2、如果研究的目的只是估计参数,OLS方法 就可达到目的。但是,OLS估计量是误差项的 线性函数,所以OLS估计量的概率分布依赖于 误差项分布的假设。没有分布假设,就不可能 对估计的参数做出有意义的评价,也不可能进 行假设检验。
计量经济学
2、正态变量经过线性变换后仍为正态变量。 3、分布函数仅涉及两个参数:均值和方差。许 多现象都大致服从正态分布。 4、对于小样本或有限容量的样本,正态性假定 有助于推导出OLS估计量的精确概率分布,而且 2 能够用t、F和 分布来对回归模型的性质进行统 计检验。 ◎当样本容量较小时,应注意正态性假定是否 适当。当样本容量大到合理程度时,或许能够放 松正态性假定。
4
计量经济学
第2节

OLS估计的精度:标准误
一、标准误(Standard Error)
1、OLS估计量是样本的函数,评价估计量 的可信度或精度的工具是标准误。 在CLRM假定下,OLS估计量的标准误为: ˆ ) E( ˆ )2 2 / ( X X )2 Var(
18
计量经济学
五、关于假设检验的说明

【精品】第三章-双变量线性回归模型(计量经济学-西财-任栋)教学课件

【精品】第三章-双变量线性回归模型(计量经济学-西财-任栋)教学课件
4.什么是最好?—找出判断“最好”的原则。 最好指的是找这么一条直线,使得所有点到该直线的 纵向距离的和(平方和)最小。
(三)最小二乘法原理
1. 双变量线性回归模型的统计假设
我们的模型是:
Yt = + Xt + ut , t = 1, 2, ...,n
这里 .和 为未知总体参数,下一步的任务是应 用统计学的方法,由Y和X的观测值(即样本数据) 来估计.和 的总体值,常用的估计方法就是最小二 乘法。为了应用最小二乘法,得到好的估计量,双 变量线性回归模型需要满足一些统计假设条件,这 些统计假设是:
直观上看,也就是要求在X和Y的散点图上穿过 各观测点画出一条“最佳”直线,如下图所示。
Y
* * Y X
Yt
* **
Yˆ t
et * *
*
*
**
* * * Yˆ*t
*Y
Yt
*
Xt
X
图2
残差
拟合的直线 Y X 称为拟合的回归线.
对于任何数据点 (Xt, Yt), 此直线将Yt 的总值 分 成两部分。 第一部分是Yt的拟合值或预测值 Yˆt :
(a)恰当描述
图2-3
(b)不恰当描述
应该指出,对于任意两个变量的一组观测值,
我们总是可以运用最小二乘法得到一条直线,问题 是该直线能否较好地拟合所给定的观测值,这就是 拟合优度问题。拟合优度是两变量之间关系强度的 测度。在这里,指的是两变量间线性关系强度的测 度。
2. Y的变差(离差)的组成
(4). 解释变量Xt 为非随机量 即Xt的取值是确定的, 而不是随机的.
(5). ut ~ N( 0, 2 ) , t= 1, 2, ...,n 即各期扰动项服从正态分布.

第3章_双变量模型:假设检验

第3章_双变量模型:假设检验
Yi = b1 + b2 X i + ui (一元线性) 一元线性)
Yi = b1 + b2 X 2i + b3 X 3i + L + ui
(多元线性) 多元线性)
2. 解释变量X与扰动项u不相关假定 解释变量X与扰动项u
当X是非随机变量,即确定性变量时,该条件 是非随机变量,即确定性变量时, 自动满足; 自动满足; 是随机变量时,该假定要求X 不相关。 当X是随机变量时,该假定要求X与u不相关。
Yi = b1 + b2 X i + ei
ˆ Yi = b1 + b2 Xi
E ( Y X i )= B1+ B2 X i
Yi = B1+B2 X i + ui
双变量模型:假设检验 双变量模型:
X是
非随机的 随机误差项u是 随机的 Y 的生成是在随机误差项( 上加上一个非随机项( 由于Y的生成是在随机误差项( u)上加上一个非随机项( X),因而Y也 就变成了随机变量。 就变成了随机变量。 于是必须对yi的分布做一番讨论 的分布做一番讨论。 于是必须对yi的分布做一番讨论。 所有这些意味着:只有假定随机误差项是如何生成的, 假定随机误差项是如何生成的 所有这些意味着:只有假定随机误差项是如何生成的,才能判定样本 回归函数对真实回归函数拟合的好坏。 回归函数对真实回归函数拟合的好坏。
(博 彩 支 ) 最 小 二 乘 准 则
Y 出
Yi
ˆ SRF : Yi = b1 + b2 X i
e1
e3
e2
e4
X4
X
1
X
2
X
3
X(收入 收入) 收入
B1、B2的估计

第三章双变量模型 假设检验

第三章双变量模型 假设检验
那么,在一次抽样中,参数的估计值与真值的差异有 多大,是否显著,这就需要进一步进行统计检验。
34
第三节 统计检验
即样本回归函数能否代表总体回归函数进行统计推断
假设检验 检验样本回归函数与总体回归函数的“接近”程度 检验样本回归函数与总体 回归函数的“接近”程度 存在着显著的线性影响
一、参数的置信区间法
原因2:如果不满足这些假定,第二部分会进一步 进行处理。这是基于学习的由浅入深、由理想状 态到现实实际的步骤。
原因3:随机误差项加上一个非随机项X生成了Y, 因而Y也是随机变量。在根据SRF进行假设检验时, 如果不对随机误差项的生成做一些特殊的假定, 则无法进行假设检验。
3
二、古典线性回归模型的基本假定
2
2
1 X2 2 2 n x i
x nX n x
2 i 2 i
2
2
X n x
2 i i
2 2
15
二、普通最小二乘估计量的方差与标准误
随机误差项的方差2的估计
2又称为总体方差。
由于随机项i不可观测,只能从i的估计——残 差ei出发,对总体方差进行估计。
E(i X i)=0 i=1,2, …,n
随机误差项(其他影响因素)与Xi (纳入模型的变量)之间不相关。
5
假定4:随机误差项具有同方差,即方差为常数。
Var (i)=2 i=1,2, …,n
与给定X相对应的每个Y的条件分布具有同方差,即每 6 个Y值以相同的方差分布在其均值周围。
假定5:无自相关。即随机误差项之间不相关。
ˆ ˆ P lim( ) lim P( ) 1 n 渐近有效性:当样本容量 n 趋于无穷大时,在所有的一致估计式中,

双变量模型之假设检验

双变量模型之假设检验

ˆ 2 ei2 yi2 ˆ12 xi2 4590020 0.7772 7425000 13402
n2
n2
10 2
Sˆ0 ˆ 2
X
2 i
n
xi2 13402 53650000 /10 7425000 98.41
t
ˆ0 0
因此,定义 拟合优度:回归平方和ESS/总离差平方和TSS
2020/2/10
qcc
9
2、可决系数R2统计量

R2 ESS 1 RSS
TSS
TSS
称 R2 为(样本)可决系数/判定系数 (coefficient of determination)。
可决系数的取值范围:[0,1]
R2越接近1,说明实际观测点离样本线 越近,拟合优度越高。
R 2

ˆ12


xi2 yi2
在例收入-消费支出例中,
R2 ˆ12
xi2 yi2

(0.777)2 7425000 0.9766
4590020
注:可决系数是一个非负的统计量。它也是
随着抽样的不同而不同。为此,对可决系数
的统计可靠性也应进行检验。
2020/2/10
2020/2/10
qcc
15
二、变量的显著性检验
回归分析是要判断解释变量X是否是被解释变量Y 的一个显著性的影响因素。
在一元线性模型中,就是要判断X是否对Y具有显 著的线性影响。这就需要进行变量的显著性检验。
变量的显著性检验所应用的方法是数理统计学中的 假设检验。
计量經濟学中,主要是针对变量的参数真值是否为 零来进行显著性检验的。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

而要计算 Y 需先计算出 b1和b2 b1和b2 的计算是根据以下两个方程得到的,
e2 2 (Y b1 b2 X ) 0 b1
e2 2 (Y b1 b2 X )( X ) 0 b2
Y
这实际上相当于对Y值施加了两个约束条件, 从而其独立的观测值只有n-2个。故残差平方 和的自由度只有n-2
var(b1 )
x

2 2 i
2 ( X ) i
n

2
e
2 i
n2
se(b1 ) var(b1 )
var(b2 )
2 x i

2
2 e i 称为残差平方和
n-2
称为自由度 称为回归标准误
se(b2 ) var(b2 )

对于残差平方和自由度的理解
2 e 要计算残差平方和 i 需要先计算出
应变量Y也服从正态分布
OLS估计量是线性估计量,是应变量Y的线性函数 正态分布随机变量的线性 函数也服从正态分布
OLS估计量也服从正态分布
b1
N ( B1 ,
2X2
n x
2
)
b2
N ( B2 ,
x

2 2
)
为什么要推导OLS估计量的抽样分布?
3.5 假设检验
(1)经济意义上的检验
经济意义是由经济理论决定的,主要是参 数的符号和大小是否符合经济理论对这些 参数的符号和大小的约束。如果不符,则 要查找原因并采取必要的修正措施,否则, 参数估计值视为不可靠。
置信区间法的检验步骤为:
1.由于构造的是t统计量,根据给定的显著性水平5%和 自由度n-2,首先可求出t统计量的95%的置信区间.
p(2.036 t 2.036) 0.95
2.将 t
b2 B2
x

2 2
代入上式得
p(2.306
b2 B2
2 x

2
2.306) 0.95
Yi
(Y i Y ) yi
Y
Xi
X
x
对于所有样本点,则需考虑这些点与样本 均值离差的平方和,可以证明:
因为
y e b x e b x e b ( X X )e b X e b Xe 又由于 X i ei 0, ei 0
y i b2 xi
对于样本回归函数 Y i 432.4138 0.0013 X i
Yi B1 B2 X i ui
3.1 经典线性回归模型的基本假定
假定3.1 回归模型是参数线性的,但不一定是变 量线性的。
假定3.2 解释变量与随机误差项不相关。但是, 如果X是非随机的,则该假定自动满足。
条件回归分析,假定X的取值在重复抽样中是固 定的。
t (25.5774) (5.4354)
p值 (5.85*109 ) (0.0006)
r 0.7849 d. f . 8
3.整理得 p[b2 2.306se(b2 ) B2 b2 2.306se(b2 )] 0.95
这是一个随机区间,意思是抽取100个样本,按这种方 法计算置信区间,将有95个区间包含真实的总体参数.
4.根据手中的样本,可计算出具体的区间为
(0.00074,0.00187)
这是一个具体的区间,它包含真实的总体参数的概率?
1.总离差平方和的分解
已知由一组样本观测值(Xi,Yi),i=1,2…,n 得到如下样本回归直线
Yi b1 b2 X i
ˆ ) (Y ˆ Y ) e y ˆi yi Yi Y (Yi Y i i i
Y
Yi
ei (Yi Y i )
yi (Yi Y )
在一元线性模型中,就是要判断X是否对Y具有显 著的线性影响。这就需要进行变量的显著性检验。
计量经计学中,主要是针对变量的参数真值是 否为零来进行显著性检验的。
由于
b2
N ( B2 ,
x 所以可构造Z统计量,
2
2
)
z
b2 B2
2 x

2
N (0,1)
但是由于 2 未知,
用其估计量 2 代替,
3.3 OLS估计量的统计性质 高斯· 马尔柯夫定理:如果满足经典线 性回归模型的基本假定,OLS估计量 是最优线性无偏估计量。
何为最优线性无偏估计量?
线性
b1 , b2 是随机变量Y的线性函数。
对于b2 xy x
i 2 i i
xi 令 i 2 x i
则b2 i yi
这一假定的目的是? 斜率系数的含义是它衡量了在其它因素不变的情 况下,解释变量X的变动对Y的变动的影响。 如果解释变量X与随机误差项相关,就无法区分它 们各自对应变量Y的影响。
假定3.3 随机误差项的期望值为0,即 E (u | X i ) 0
Y
E(u | X 3 ) 0
E(u | X1 ) 0
假定3.4 同方差假定
Y
var(i | X i ) 2
var(i | X 3 ) 2
var(i | X1 ) 2
X1
X2
X3
X
假定同方差的目的是从不同的子总体中抽取 的Y值都是同样可靠的。因为它们各自的方 差是相等的,其分散程度相同。
相反,如果存在异方差,不同的子总体的方差 不同,那么一般说来,从方差较大的子总体中 抽取的Y值代表性较____。
5.结论:由于该置信区间没有包含原假设所设 定的参数值,所以,拒绝原假设。
3.5.2 显著性检验法 显著性检验的思想是先姑且认为原假设是真的, 然后根据该假设值,给定的显著性水平、自由 度和具体的样本统计量的值,计算出t统计量 的数值。 根据获得这样一个t统计量数值的概率大小来 决定是接受还是拒绝原假设. 如果这个概率小于给定的显著性水平,就认为小 概率事件发生了,拒绝原假设,认为该统计量在 统计上是显著的,即显著地异于0(只针对 “零”零假设而言)
异方差
Y
var(i | X i ) i 2
var(i | X1 ) 12 var(i | X 3 ) 32
X1
X2
X3
X
假定3.5 无自相关假定, Cov(ui , u j ) 0
i j
ui
ui
ui
uj
uj
uj
3.2 OLS估计量的方差与标准误
OLS估计量是随机变量,这样,就会产生抽样误 差,即不同样本的估计值的差异。
假定3.7:随机误差项服从正态分布
ui
N (0, )
2
中心极限定理:独立同分布的随机变量,随着变 量个数的无限增加,其和的分布趋向于服从正态 分布。 为什么要做这样一个假定,目的何在?
根据中心极限定理 随机误差项服从正 态分布
根据 Y B1 B2 X u 应变量Y是随机误差项 的线性函数 正态分布随机变量的线 性函数也服从正态分布
则我们可以构造t统计量,
t b2 B2
2 x

2
t (n 2)
3.5.1 置信区间法 对于回归模型
Y i 432.4138 0.0013 X i
提出零假设和备择假设,
给定显著性水平
H0 : B2 0, H1 : B2 0
5%
置信区间检验的思想是先不去管原假设是怎样假 定的,根据给定的显著性水平、自由度和样本统 计量的具体值构造一个具体的置信区间。 通过观察原假设所设定的参数值是否落在这个置 信区间之内来做出接受或拒绝原假设的判断.
常用的检验方法主要包括随机误差项的序列 相关检验、异方差检验、解释变量的多重共 线检验以及随机误差项的正态分布检验等。
对回归系数的检验分两种:
置信区间法 显著性检验法 建立原假设和备择假设
H 0 : B2 0 H1 : B Nhomakorabea 0为什么原假设是回 归系数值为0?
变量的显著性检验
回归分析是要判断解释变量X是否是被解释 变量Y的一个显著的影响因素。
对于回归模型 给定显著性水平:
Y i 432.4138 0.0013 X i
提出零假设和备择假设: H0 : B2 0, H1 : B2 0
5%
显著性检验的步骤:
1.根据原假设和抽取样本的统计量的值,计算t统 计量的值,
b2 0.0013
根 B2 0 据
x

2 2
对于b1 Y b2 X
1 b1 Y b2 X Y i yi * X n
无偏性: E(b1 ) B1 ,
E(b2 ) B2,
B1
b1
B2
b2
最小方差性
在所有的线性无偏估计量中,b 的方差最小 1 , b2
OLS估计 量 其它线性无偏 估计量
B1
3.4 OLS估计量的抽样分布
问题:采用普通最小二乘估计方法,已经保 证了模型最好地拟合了样本观测值,为什么还要 检验拟合程度?
在满足经典线性回归模型的基本假定下,应用 OLS方法可以获得BLUE估计量,即b1,b2是最 优线性无偏估计量,估计量的精度用其标准误 衡量。 拟合优度检验:对样本回归直线与样本观测值 之间拟合程度的检验。
(2)统计上的检验
统计检验是由统计理论决定的,其目的在于评定模型 参数估计值的可靠性。应该指出、统计检验准则相对 经济意义准则来说是第二位的。
常用的统计检验有拟合优度检验、t检验、F检 验等。
需要用到估计量的抽样分布或概率分布
(3)计量经济检验
计量经济检验是由计量经济学理论确定的、主 要是用来检验所采用的计量经济方法是否令人满 意、计量经济方法的假设条件是否得到满足、从 而确定统计检验的可靠性。
相关文档
最新文档