第8章多元回归分析:推断问题

合集下载

统计学 第8章 相关与回归分析

统计学 第8章 相关与回归分析

2
-1 1 0 -1 -2 0 1 -2
4
1 1 0 1 4 0 1 4 20
6 * 20 r 1 2 1 0.8788 2 n(n 1) 10 * (10 1)
6 d 2
8.3
8.3.1 8.3.2 8.3.3 8.3.4 8.3.5
一元线性回归
一元线性回归模型 参数的最小二乘估计 回归直线的拟合优度 显著性检验 利用回归方程进行预测
共计
325
462 77
445 89
707 101
685 137
1043 149
E(Y|X) 65
Y
X=X1时Y 的分布
X=X2时Y 的分布 X=X3时Y 的分布
b0
X=X1时的E(Y)
b0+ b 1X
X=X2时的E(Y) X=X3时的E(Y)
X1=80
X2=100
X3=120
X
总体回归函数
(population regression function)
相关系数的显著性检验
(检验的步骤)
1. 检验两个变量之间是否存在线性相关关系 2. 利用样本的相关系数对总体相关系数进行 检验 3. 采用R.A.Fisher提出的 t 检验 4. 检验的步骤为



提出假设:H0: ;H1: 0
n2 计算检验的统计量: tr ~ t (n 2) 2 1 r 确定显著性水平,并作出决策
2
2
或化简为 r
n x x n y y
2 2 2
n xy x y
2
例 产品产量与单位成本相关系数
产 月 量 份 x 1 2 2 3 3 4 4 3 5 4 6 5 合 21 计 单位 成本 y 73 72 71 73 69 68

第8章Excel教程 回归分析

第8章Excel教程  回归分析

8.1 线性回归分析的基本原理
8.1.1 回归分析的概念 8.1.2 回归分析的主要内容
返回首页
8.1.1 回归分析的概念
首先要区分两种主要类型的变量:一种变量相 首先要区分两种主要类型的变量: 当于通常函数关系中的自变量, 当于通常函数关系中的自变量,对这样的变量 能够赋予一个需要的值(如室内的温度、 能够赋予一个需要的值(如室内的温度、施肥 量)或者能够取到一个可观测但不能人为控制 的值(如室外的温度), ),这样的变量称为自变 的值(如室外的温度),这样的变量称为自变 量;自变量的变化能引起另一些变量(如水稻 自变量的变化能引起另一些变量( 亩产量)的变化,这样的变量称为因变量。 亩产量)的变化,这样的变量称为因变量。
(3)测定系数函数。 )测定系数函数。
(3)测定系数函数。 )测定系数函数。 该函数返回根据known_y's和known_x's中数据点 该函数返回根据 和 中数据点 计算得出的乘积矩相关系数的平方。 平方值 计算得出的乘积矩相关系数的平方 。 R平方值 可以解释为y方差与 方差的比例。 方差与x方差的比例 可以解释为 方差与 方差的比例。 语法: 语法:RSQ(known_y's,known_x's)
返回本节
8.2.3 利用工作表函数进行回归分析
在某大学一年级新生体检表中随机抽取10张 得到10名大 例8-4 在某大学一年级新生体检表中随机抽取 张,得到 名大 学生的身高( )和体重( )的数据,如图8-10(“身高体重” 学生的身高(x)和体重(y)的数据,如图 ( 身高体重” 工作表)所示。 工作表)所示。 提供的工作表函数进行相关计算。 用Excel提供的工作表函数进行相关计算。 提供的工作表函数进行相关计算 中分别输入“ 斜率” (1)在单元格 )在单元格A12~A15中分别输入“截距”、“斜率”、“测 中分别输入 截距” 定系数” 估计标准误差” 定系数”、“估计标准误差”。 中输入公式“ (2)在单元格 )在单元格B12中输入公式“=INTERCEPT(C2:C11,B2:B11)”, 中输入公式 , 回车后显示-79.42015。 回车后显示 。 中输入公式“ (3)在单元格 )在单元格B13中输入公式“=SLOPE(C2:C11,B2:B11)”,回 中输入公式 , 车后显示0.8041825。 车后显示 。 中输入公式“ (4)在单元格 )在单元格B14中输入公式“=RSQ(C2:C11,B2:B11)”,回车 中输入公式 , 后显示0.6817018。 后显示 。 中输入公式“ (5)在单元格 )在单元格B15中输入公式“=STEYX(C2:C11,B2:B11)”,回 中输入公式 , 车后显示2.8180738。计算结果如图 所示。 所示。 车后显示 。计算结果如图8-8所示

第8章相关回归分析

第8章相关回归分析

※相关关系和函数关系有区别也有联系: 1、实际现象中,函数关系往往通过相关关系表现 出来。 2、在研究相关关系时,常常使用函数关系的形式 来表现,它是相关分析的工具。
(二)相关关系的种类 1、按相关关系涉及的因素多少划分 (1)一元(单)相关:两个因素之间的相关。 (2)多元(复)相关:三个及三个以上因素之间
2、相关系数的计算: (1)基本计算公式(“积差法”公式)
r
2 xy
xy
式中:r 相关系数
自变量x数列的标准差 x
自变量y数列的标准差 y
2 xy
两个变量数列的协方差

(x x)2
x
n
y
( y y)2 n
2 xy
(x
x )( y
y)
n
相关系数的基本计算公式可变化为:
r
2xy x y
3、回归分析的种类 (1)按自变量的多少分
①简单(一元)回归:自变量只有一个 。 [例] y = a+bx 一元回归方程
②复(多元)回归:自变量为2个或2个以上。 [例] y=0+ 1x1+ 2x2+…+ nxn
(2)按回归方程式的特征分 ①线性回归:因变量为自变量的线性函数。 [例] y = a+bx 一元线性回归方程※ ②非线性回归:因变量为自变量的非线性函数。
3、相关系数的特点及应用
(1)相关系数的取值范围为:r 1 1 r 1 (2)当γ为正值时,两变量呈正相关;当γ为负值 时,两变量呈负相关。 (3)相关系数γ的绝对值愈大,表示两变量之间 相关程度愈密切; γ=﹢1为完全正相关; γ=﹣1为 完全负相关。 (4)相关系数γ的绝对值愈小,愈接近0,表示两 变量之间相关程度愈低,当 γ=0时,两变量完全没 有直线相关。

薛薇,《SPSS统计分析方法及应用》第八章 相关分析和线性回归分析

薛薇,《SPSS统计分析方法及应用》第八章  相关分析和线性回归分析

以控制,进行偏相关分析。
偏相关分 析输出结 果;负的 弱相关
相关分析 输出结果 ;正强相 关
8.4.1
8.4.2
回归分析概述
线性回归模型
8.4.3
8.4.4 8.4.5 8.4.6
回归方程的统计检验
基本操作
其它操作
应用举例

线性回归分析的内容

能否找到一个线性组合来说明一组自变量和因变量
可解释x对Y的影响大小,还可 以对y进行预测与控制
目的是刻画变量间的相关 程度
8.2.1 8.2.2 8.2.3 8.2.4
散点图 相关系数 基本操作 应用举例

相关分析通过图形和数值两种方式,有效地揭示事物
之间相关关系的强弱程度和形式。

8.2.1 散点图 它将数据以点的的形式画在直角坐标系上,通过

Distances 过程用于对各样本点之间或各个变量之间 进行相似性分析,一般不单独使用,而作为聚类分
析和因子分析等的预分析。
1) 选择菜单Analyze Correlate Bivariate,出现 窗口:
2) 把要分析的变量选到变量Variables框。
3) 在相关系数Correlation Coefficents框中选择计算哪种

一元线性回归模型的数学模型:
y 0 1 x

其中x为自变量;y为因变量; 0 为截距,即常量;
1 为回归系数,表明自变量对因变量的影响程度。

用最小二乘法求解方程中的两个参数,得到
1
( x x )( y y ) (x x)
i i 2 i
0 y bx

2015年《统计学》第八章 相关与回归分析习题及满分答案

2015年《统计学》第八章 相关与回归分析习题及满分答案

2015年《统计学》第八章相关与回归分析习题及满分答案一、单选题1.相关分析研究的是( A )A、变量间相互关系的密切程度B、变量之间因果关系C、变量之间严格的相依关系D、变量之间的线性关系2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着(A )。

A、正相关关系B、负相关关系C、直线相关关系D、曲线相关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着(B)。

A、正相关关系B、负相关关系C、直线相关关系D、曲线相关关系4.相关系数等于零表明两变量(B)。

A.是严格的函数关系B.不存在相关关系C.不存在线性相关关系D.存在曲线线性相关关系5.相关关系的主要特征是(B)。

A、某一现象的标志与另外的标志之间的关系是不确定的B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系C、某一现象的标志与另外的标志之间存在着严格的依存关系D、某一现象的标志与另外的标志之间存在着不确定的直线关系6.时间数列自身相关是指( C )。

A、两变量在不同时间上的依存关系B、两变量静态的依存关系C、一个变量随时间不同其前后期变量值之间的依存关系D、一个变量的数值与时间之间的依存关系7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间(D)。

A、不存在相关关系B、相关程度很低C、相关程度很高D、完全负相关8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间(C)。

A、无相关B、存在正相关C、存在负相关D、无法判断是否相关9.相关分析对资料的要求是(A)。

A.两变量均为随机的B.两变量均不是随机的C、自变量是随机的,因变量不是随机的D、自变量不是随机的,因变量是随机的10.回归分析中简单回归是指(D)。

A.时间数列自身回归B.两个变量之间的回归C.变量之间的线性回归D.两个变量之间的线性回归11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为10 00时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程为( A )A. y=6000+24xB. y=6+0.24xC. y=24000+6xD. y=24+6000x12.直线回归方程中,若回归系数为负,则(B) A.表明现象正相关B.表明现象负相关C.表明相关程度很弱D.不能说明相关方向和程度二、多项选择题1.下列属于相关关系的有(ABD )。

第8章 相关与回归分析

第8章 相关与回归分析

32
估计标准误差
估计标准误差(standard error of estimate)是 对各观测数据在回归直线周围分散程度的一个度 量值,它是对误差项ε的标准差σ的估计。 估计标准误差Sy可以看作是在排除了X对Y的线性 影响后,Y随机波动大小的一个估计量。
33
从估计标准误差的实际意义看,它反映了用估计 的回归方程预测因变量Y时预测误差的大小。若 各观测数据越靠近回归直线,Sy越小,回归直线 对各观测数据的代表性就越好,根据估计的回归 方程进行预测也就越准确。
当一个变量取一定数值时,另一个变量有确定值 与之相对应,这种关系称为确定性的函数关系。 当一个变量取一定数值时,与之相对应的另一变 量的数值虽然不确定,但它仍按某种规律在一定 的范围内变化,这种关系称为不确定性的相关关 系。
7
变量间的关系: 函数关系
y


ห้องสมุดไป่ตู้





x
是一一对应的确定关系 记为 y = f (x), x 称为自变 量,y 称为因变量 – 某种商品的销售额(y)与 销售量(x)之间的关系可 表示为 y = p x (p 为单 价) – 圆的面积(S)与半径之间 的关系: S = R2
19
复相关系数和偏相关系数
复相关系数反映一个变量Y与其他多个变量X1, X2,…Xk之间的线性相关程度 偏相关系数 反映在X2,…Xk不变的情况下,变量 Y与X1之间的线性相关程度
20
第三节 简单线性回归分析
回归分析的内容
回归分析的特点
相关分析与回归分析的区别与联系
21
相关分析研究变量之间相关的方向和相关的程度, 但是相关分析不能指出变量间相互关系的具体形 式,也无法从一个变量的变化来推测另一个变量 的变化情况。 回归分析则是研究变量之间相互关系的具体形式, 它对具有相关关系的变量之间的数量联系进行测 定,确定一个回归方程,根据这个回归方程可以 从已知量来推测未知量,从而为估算和预测提供 了一个重要的方法。

第8章--回归分析预测法概要


其表达F式 S余 为 ( /S回 n /m : m1)
20
❖ 将通过上式计算F的值,与F分布表查到的Fc 临界值比较,从而判断回归方程是否具有显 著性。
❖ ①当 F> Fc (α,m,n-m-1),则回归方程与实际 直线方程拟和的程度好,x和y之间的变化是 符合回归模型;
❖ ②当F ≤ FC(α,m,n-m-1)时,则回归模型与 实际直线方程拟和程度不好,x和y之间的变 化不符合实际直线的变化,预测模型无效。
i1
i1
i1
min (3)
即对(3)求极值,有:
Q
a
2
n i1
(
yi
a
bxi
)
0
Q
b
n
2
i1
( yi
a
bxi )xi
0
(4) (5)
15
由( 4 )得:
n
n
n
y i a bx i 0
i1
i1
i1
y i na b x i
由( 5)得:
n
n
n
x i y i ax i x i bx i 0
❖ ②确定变量之间的相关密切程度,这是相关 分析的主要目的和主要内容。
7
3、建立回归预测模型 ❖ 就是依据变量之间的相关关系,用恰当的数
学表达式表示出来。 4、回归方程模型检验 ❖ 建立回归方程的目的是预测,但方程用于预
测之前需要检验回归方程的拟合程度和回归 参数的显著性,只有通过了有关的检验后, 回归方程才可用于预测。常用的检验方法有 相关系数r检验、F检验、t检验等。
36
二、多元线性回归预测法 ❖ 一般形式:ŷi=a+b1X1+b2X2+……+bnXn ❖ 其中: X1,X2,……,Xn 为自变量, ❖ a, b1, b2, ……, bn为回归方程的参数 ❖ 存在两个自变量条件下的多元线性回归方程

伍德里奇《计量经济学导论》(第6版)复习笔记和课后习题详解-多元回归分析:推断【圣才出品】

伍德⾥奇《计量经济学导论》(第6版)复习笔记和课后习题详解-多元回归分析:推断【圣才出品】第4章多元回归分析:推断4.1复习笔记考点⼀:OLS估计量的抽样分布★★★1.假定MLR.6(正态性)假定总体误差项u独⽴于所有解释变量,且服从均值为零和⽅差为σ2的正态分布,即:u~Normal(0,σ2)。

对于横截⾯回归中的应⽤来说,假定MLR.1~MLR.6被称为经典线性模型假定。

假定下对应的模型称为经典线性模型(CLM)。

2.⽤中⼼极限定理(CLT)在样本量较⼤时,u近似服从于正态分布。

正态分布的近似效果取决于u中包含多少因素以及因素分布的差异。

但是CLT的前提假定是所有不可观测的因素都以独⽴可加的⽅式影响Y。

当u是关于不可观测因素的⼀个复杂函数时,CLT论证可能并不适⽤。

3.OLS估计量的正态抽样分布定理4.1(正态抽样分布):在CLM假定MLR.1~MLR.6下,以⾃变量的样本值为条件,有:∧βj~Normal(βj,Var(∧βj))。

将正态分布函数标准化可得:(∧βj-βj)/sd(∧βj)~Normal(0,1)。

注:∧β1,∧β2,…,∧βk的任何线性组合也都符合正态分布,且∧βj的任何⼀个⼦集也都具有⼀个联合正态分布。

考点⼆:单个总体参数检验:t检验★★★★1.总体回归函数总体模型的形式为:y=β0+β1x1+…+βk x k+u。

假定该模型满⾜CLM假定,βj的OLS 量是⽆偏的。

2.定理4.2:标准化估计量的t分布在CLM假定MLR.1~MLR.6下,(∧βj-βj)/se(∧βj)~t n-k-1,其中,k+1是总体模型中未知参数的个数(即k个斜率参数和截距β0)。

t统计量服从t分布⽽不是标准正态分布的原因是se(∧βj)中的常数σ已经被随机变量∧σ所取代。

t统计量的计算公式可写成标准正态随机变量(∧βj-βj)/sd(∧βj)与∧σ2/σ2的平⽅根之⽐,可以证明⼆者是独⽴的;⽽且(n-k-1)∧σ2/σ2~χ2n-k-1。

四、多元回归分析:推断


+ β 4 hrunsyr + β 5 rbisyr + u • 式中,salary为1993年总薪水;years为加入俱乐部 的年数;gamesyr为平均每年比赛的次数;bavg为 平均职业击球次数;hrunsyr为平均每年的本垒打次 数;rbisyr为每年的击球跑垒得分。
• 我们想检验的是:一旦控制了加入俱乐部的年数和 每年的比赛次数,度量球员表现的统计指标 (bavg,hrunsyr & rbisyr)对薪水有没有影响。零假设 可表示为: H 0 : β 3 = 0, β 4 = 0, β5 = 0 • 这里零假设称为多重约束,对多重约束进行的检验 称为多重假设检验(multiple hypotheses test)或联 合假设检验(joint hypotheses test)。相应的对立假 设为 H1 : H 0不正确
H0 : β j = a j
t=
• 相应的t统计量为
β j − aj
se( β j )
^
^
• 下面以两个例子来说明这种检验方法。
校园犯罪与注册人数
• 考虑大学校园内犯罪次数(crime)和学生注册人数的一个简 单模型
log(crime) = β 0 + β1 log(enroll ) + u
• 利用美国1992年97个大学和学院的数据,针对 β1 > 1 来检验 β1 = 1 。数据来源于联邦调查局的《统 一犯罪报告》。回归结果如下:
(0.104)
(0.007)
~
(0.0017)
(0.003)
R 2 = 0.316 • 针对exper对log(wage)的影响,考察下面三种检验: (1)H 0 : β exp er = 0, H1 : β exp er > 0 拒绝零假设;

多元回归分析


( 1 , 2 , , n )
( 0 , 1 ,
T
, p )T
1 x11 1 x21 X 1 xn1
x12 x22 xn 2
x1 p x2 p xnp
矩阵 X 是一 n ( p 1) 阶矩阵,称 X 为回归设计矩阵或 资料矩阵。
二、多元线性回归模型的基本假定
为了方便地进行模型的参数估计,对回归方程(7.2)式有如 下一些基本假定。 1、解释变量 x1 , x2 , , x p 是确定性 变量,不是随机变量,而 且要求 rank ( X ) p 1 n 。
2、随机误差项具有0均值和等方差(高斯-马尔柯夫条件),即
2
7.2.3 参数估计量的性质 ˆ 为 的线性无偏估计,且 D( ˆ ) Var ( ˆ ) 2 ( X T X )1 1 、 ˆ ) 0, Cov( ˆ) 2( I H ) 2、 E ( 2 3 、(Gauss-Markov定理)在假定 E (Y ) X , D(Y ) I n 的任一线性函数 T 的最小方差线性无偏估计(BLUE)为 时, ˆ ,其中 为 p 1维向量, 为 ˆ 的最小二乘估计。 T
在回归分析中,因变量y是随机变量,自变量x可以是随机变 量,也可以是非随机的确定变量;而在相关分析中,变量x和变 量y都是随机变量。 相关分析是测定变量之间的关系密切程度,所使用的工具是 相关系数;而回归分析则是侧重于考察变量之间的数量变化规律, 并通过一定的数学表达式来描述变量之间的关系,进而确定一个 或者几个变量的变化对另一个特定变量的影响程度。
ˆ) 0 X T (Y X
二、误差方差 2的估计
ˆ HY 为 Y 的拟合值(估计值),其中 ˆ X 1、设Y ˆ ( I H )Y , H X ( X T X )1 X T ,此时残差向量 ˆ Y Y n 满足以下结论: (1) H 与I n H 都是 n 阶对称幂等矩阵; T ˆ T ˆ 0 ,Y ˆ 0 ,( I n H ) X 0 ; (2) X ˆT ˆ T ( I n H ) (4)
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例 119个发展中国家1960-1985年的GDP增长率与相对 人均GDP
该模型只解释了GDPG变动的53%。但查F表可得,在5%的显著性 水平上是显著的,p值实际上是0.0425。因此,尽管R2只有0.053, 我们仍能拒绝这两个回归元对回归子没有影响的虚拟假设。
五、解释变量的“增量”或“边际”贡献
第八章
多元回归分析:推断问题
第八章
多元回归分析:推断问题
◆ 学习目的
理解多元线性回归模型的区间估计 和假设检验。
第八章
多元回归分析:推断问题
◆多元回归中的假设检验 ◆检验个别偏回归系数的假设 ◆检验样本回归的总显著性 ◆检验线性等式约束条件 ◆邹至庄检验
第一节
一、正态性假定
多元回归的假设检验
假定ui 遵循均值为零、方差σ2 为常数的正态分布。
例8.3 19551974年墨西哥 经济的CobbDouglas生产 函数
Dependent Variable: LNGDP Method: Least Squares Date: 02/21/12 Time: 16:22 Sample: 1955 1974 Included observations: 20 Variable C Coefficient -1.65242 Std. Error 0.606198 t-Statistic -2.72587 Prob. 0.0144
单位检验的
=1.671,拒绝虚拟假设。
假设检验和置信区间估计之间的关系
β2 的95%置信区间是: 具体到本例变为:
即是:
这样,如果选取了大小同为64的100个样本并构造像(8.4.2)这样的 100个置信区间,则我们预期其中的95个包含着真实总体参数β2 。由 于虚拟假设的零值不落在(8.4.2)区间内,故以95%的置信系数拒 绝虚拟假设β2 =0。 @qtdist(p,v):自由度为v的t统计量的p显著性水平(双尾)。 scalar h1=eq01.@coefs(2)+@qtdist(0.975,61)*@stderrs(2) scalar h2=eq01.@coefs(2)-@qtdist(0.975,61)*@stderrs(2)
注意:
t检验是基于误差项ui 服从正态分布的假定。我们能够观测到误差项 的代理变量 ,即残差。 对儿童死亡率一例而言,残差直方图为:
第三节
检验样本回归的总显著性
前面两节讨论的是个别的偏回归系数为零假设下的显著性问题,现考 虑如下假设: 该虚拟假设是关于β2 和β3 同时等于零的一个联合假设(joint hypothesis)。对这样一个假设的检验被称作对所估回归线的总显著性 检验(overall significance)。
二、F检验法:受约束最小二乘法
步骤: 1. 利用 把Cobb-Douglas生产函数写成:
(8.7.7) (8.7.8)
=产出/劳动比率,
=资本/劳动比率,有重要经济意义。
2. 一旦我们从(8.7.8)计算出β3 , β2 很容易从第一个关系式得出。 (8.7.8)所描述的程序被称为受约束的最小二乘法(restricted least squares, RLS) 。
因此,F检验既是所估回归的总显著 性的度量,也是R2 的一个显著性检验。

四、检验用R2 表示的多元回归 的总显著性
决策规则
给定k变量回归模型:
假设检验:
相对于H1:非全部斜率系数同时为零。 计算: 如果 ,则拒绝H0;否则不拒绝它,其中 是α显著水平、(k-1)个分子自由度和(n-k)个分母自由度的临界F 值。 另一种方法,如果F的p值足够小,即可拒绝H0。
为了评估在扣除X2的贡献后X3的增量贡献,我们构造:
新回归元个数 新模型中的参数个数
例子
Q2 Q4
这个F值是高度显著的,表明模型中增加了FLR明显提高了ESS并因 此提高R2值。
F比率还可仅用R2值重新表达出来:
新回归元个数 新模型中的参数个数
第四节
受约束的最小二乘法: 检验线性等式约束条件
所谓贡献,是指增加一个变量到模型中来,是否相对于 RSS“显著地”增加了ESS。把这一贡献称作一个解释变量 的增量(incremental)或边际(marginal)贡献。
假设先做儿童死亡率对PGNP的回归,得到如下结果:
由于p=0.0008,所以这个F值是高度显著的。我们拒绝PGNP对CM没 有影响的假设。这时把X3引入到模型中来,需回答: (1)知道PGNP在模型中和CM有显著关系,FLR的边际贡献为何? (2)FLR的增量贡献在统计上显著吗? (3)根据什么准则把变量加进模型?
LNEMPLOYMENT LNCAPITAL
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
如果从(8.5.3)算出的F值大于2%显著水平的F表中的临界F值,我们就拒绝 H0;否则不拒绝。另一种方法是,如果所测的p值足够低,可拒绝H0.
得到一个大于等于73.8325的F值的p值几乎为0,从而拒绝虚拟假设。 如果使用惯常的5%的显著性水平,分子自由度为2和分母自由度为60 (实际为61)的临界F值约为3.15。若用1%的显著性水平,临界F值约 为4.98. 显然,观察到约为74的F值比临界值大得多,则拒绝PGNP和FLR同时 对儿童死亡率都没有影响的假设。
接受域
临界域
实际上,我们不必假定一个特定的α值来进行假设检验,仅使用p值 即可。 本例中的p值是0.0065,其解释为:如果虚拟假设正确,则得到一个 大于等于2.8187的t值的概率仅为0.65%,这个概率比人为选定的 α=5%小得多。 既然推测儿童死亡率与人均GNP负相关,那我们就应该使用单位检 验。即虚拟和对立假设应该是:
二、检验多元回归的总显著性:F检验
决策规则
给定k变量回归模型: 假设检验: 相对于H1:非全部斜率系数同时为零。
计算:
如果 ,则拒绝H0;否则不拒绝它,其中 是α显著水平、(k-1)个分子自由度和(n-k)个分母自由度的临界F 值。 另一种方法,如果F的p值足够低,即可拒绝H0。
三、R2和F之间的一个重要关系式
表8.8 墨西哥的真实GDP、就业和真实固定资本 年份 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 GDP 114043 120410 129187 134705 139960 150511 157897 165286 178491 199457 212323 226977 241194 260881 277498 296530 306712 329030 354057 374977 就业 8310 8529 8738 8952 9171 9569 9527 9662 10334 10981 11746 11521 11540 12066 12297 12955 13338 13738 15924 14154 固定资本 182113 193749 205192 215130 225021 237026 248897 260661 275466 295378 315715 337642 363599 391847 422382 455049 484677 520553 561531 609825
经济理论有时会提出某一回归模型中的系数满足一些线性等式约 束条件。考察Cobb-Douglas生产函数:
对数形式: , 。 (8.7.2) Y=产出, X2 =劳力投入, X3 =资本投入。 现在如果是规模报酬不变(每一同比例的投入变化有同比例的产 出变化),经济理论将提出:
这就是线性等式约束条件。
怎样比较无约束和受约束的两个最小二乘回归呢?可通过F检验达到。 令: =无约束回归(8.7.2)的RSS =受约束回归(8.7.7)的RSS m = 线性约束个数 k = 无约束回归中的参数个数 n = 观测次数 于是,
(8.7.10)
注意:

分别得自(8.7.2)无约束和(8.7.7)受约束回归的R2 值。
如何判断约束条件是否正确?
一、t检验方法
步骤: 1. 先不考虑约束条件,按通常方法估计,做所谓的无约束或无 限制的回归(unrestricted or unconstrained regression)。 用OLS法估计出了β2 和β3 ,就可通过t检验来检验约束:
2.
3. 如果计算的t值超过选定显著性水平上的临界t值,则拒绝规 模报酬不变的假设;否则不拒绝。
能否用上节逐一检验
答案是否定的。。。

的显著性的方法来检验联合假设呢?
我们隐含的假定是每一个显著性检验都是根据一个不同的样本进行的。 如果用同一样本数据去检验联合假设, 和 有可能相关,则违背 了检验方法的基本假定。 怎样检验联立的虚拟假设 呢?
一、检验多元回归的总显著性的方差分析法: F检验
TSS有n-1个自由度,RSS有n-3个自由度,ESS是TSS和RSS的函数,有2个自由度。
5. 检验所估计的回归模型在时间上或不同横截面单元上的稳定性。
6. 检验回归模型的函数形式。
第二节
例8.1
检验个别偏回归系数的假设
引用假定 ,我们可用t检验统计量对任一个别的偏回 归系数的假设进行检验。考虑儿童死亡率的例子:
修正儿童死亡率例子
在第7章,我们用一个64个国家构成的样本将儿童死亡率对人均GNP和 妇女识字率进行回归。回归结果如下:
二、多元回归中的假设检验:总评
一旦我们走出简单的双变量线性回归模型的范围,假设检验就会以 多种有趣的形式出现: 1. 检验关于个别偏回归系数的假设。 2. 检验所估计的多元回归模型的总显著性,即判明是否全部偏斜 率系数同时为零。
相关文档
最新文档