第3章 双变量模型:假设检验
第三章假设检验

第三章假设检验1.一种机床加工的零件尺寸绝对平均误差为 1.35mm。
生产厂家现采用一种新的机床进行加工以期进一步降低误差。
为检验新机床加工的零件平均误差与旧机床相比是否有显著差异,从某天生产的零件中随机抽取50 个进行检验。
利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著差异?如果想检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低,结果会如何?( =0.01) 。
50 个零件尺寸的误差数据(mm)1.26 1.19 1.310.97 1.811.130.96 1.06 1.000.940.98 1.10 1.12 1.03 1.161.12 1.120.95 1.02 1.131.230.74 1.500.500.590.99 1.45 1.24 1.01 2.031.98 1.970.91 1.22 1.061.11 1.54 1.08 1.10 1.641.702.37 1.38 1.60 1.261.17 1.12 1.230.820.86答 : H :1.35 H1: <1.35 a = 0.01n = 50 检验统计量: 01. 3152 1. 35z 2. 6061而 z =-2.33,因此拒绝原假设,新机床加工的0. 365749 50零件尺寸的平均误差与旧机床相比有显著降低。
2.一种汽车配件的平均长度要求为 12cm,高于或低于该标准均被认为是不合格的。
汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。
现对一个配件提供商提供的 10 个样本进行了检验。
假定该供货商生产的配件长度服从正态分布,在 0.05 的显著性水平下,检验该供货商提供的配件是否符合要求?10 个零件尺寸的长度(cm)12.210.812.011.811.912.411.312.212.012.3答:供货商生产的配件长度服从正态分布,但为小样本,故使用t 检验。
本科经济计量学第3章(第4版)

假定3.3 给定Xi,随机扰动项的期望为零。即
Eu | X i 0
图3-1 扰动项的条件分布 3
第3章
假定3.4 同方差假定,即
Varui 2
图3-2a 同方差和异方差的对比
假定3.5 无自相关假定,即
cov
u i
,u
j
0
i j
图3-3 自相关
假定3.6 回归模型是正确设定的。即实证分析的
~
tn2
或
b2 B2
ˆ xi2
~ tn2
21
第3章
3.5.1 置信区间法 H0 : B2 0 H1 : B2 0 接上面例子,假定显著水平α为5%,由于是双尾检验, 查表可得(注意自由度,自由度=10-2=8):
P 2.306 t 2.306 0.95
P
已知:
b2 B2
seb2
~
tn2
在零假设
H
0
:
B2
B* 2
下,有:
t
b2 B2*
seb2
~t n 2
(3-29)
利用t统计量对模型参数做显著性假设检验的过程 称为t检验。
25
第3章
在具体应用t 检验时,需要知道: (1)对于双变量模型,自由度总为(n-2 ) (2)虽然在经验分析中常用的显著水平α有1%, 5%,10%,但显著性水平是由个人任意选取。 (3)可用于单边或双边检验。
F-statistic
29.54353
Prob(F-statistic)
0.000619
12
第3章
3.3 OLS估计量的性质 OLS方法能够得到如此广泛的使用是有原因的。
数理统计第三章假设检验

2
0.0039 , n2 8
得
F0
0.0091 2.33 . 0.0039
因 F0 落入接受域中,故无显著差异。
17
3.基于成对数据的检验( t 检验) 为了比较两种产品或两种仪器,两种方法的差异。我们在相 同的条件下,作对比试验,得到一批成对观察值,然后观察数据 作出推断。这种方法称为逐对比较法。 eg.比较两种安眠药 A 和 B 的疗效。以 10 个患者为实验对象。 以 X 1 表示试验 A 后延长睡眠时间 X 2 表示服用 B 后延长的睡眠 时间。对每个患者各服两种药分别实验一次,数据如下: 患者
32.6 31.0
29.7 29.5
31.6 31.8
30.2 31.4
试问:这批砖的抗断强度的均值是否较以往生产的砖有显著提高?
统计量 T 的观察值为
T X 0 31.05 30 3.1032 S / n 1.07 / 10
所以,拒绝原假设,认为这批砖的抗断强度的均值较以 往生产的砖有显著提高
2 ) 经过一段长时间储存,则方差 有一批枪弹 ~ N( 0 , 0
与期望发生了变化? H: 0, 2 02 是否成立。然后利用子 样 x1 , x2 ,..., xn 所提供信息,检验假设是否正确。 思路依据,小概率原理。
3
假设检验初述 二类错误
假设检验就是指在母体上做某项假设,从母体中随机的抽 取一样,用它检验此项假设是否成立? 在母体上的假设可分为两类 a.对母体分布中的参数作某项假设,一般是对母体的数字 特征作一项假设,称参数假设检验。用母体中子样检验此项是 否成立? eg1.母体的平均数 0 (已知)是否成立,
2 2 0
e
《数理统计》第三章 假设检验

P328
P329
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体方差的假设检验
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体方差的假设检验
两个正态总体方差比的假设检验 两个正态总体方差比的假设检验 方差比
两个正态总体方差比的假设检验 两个正态总体方差比的假设检验 方差比
P393
P393
第三章 1.2 参数假设检验Parameter hypothesis testing
两个正态总体均值,方差的假设检验举例 两个正态总体均值,方差的假设检验举例
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体均值的假设检验( 检验 检验) 一个正态总体均值的假设检验(U检验)
第三章 1.2 参数假设检验Parameter hypothesis testing
一个正态总体均值的假设检验( 检验) 一个正态总体均值的假设检验(U检验)表示
两个正态总体均值差假设检验举例 两个正态总体均值差假设检验举例
第三章 1.2 参数假设检验Parameter hypothesis testing
两个正态总体均值差假设检验举例 两个正态总体均值差假设检验举例
两个正态总体方差比的假设检验
第三章 1.2 参数假设检验Parameter hypothesis testing
总体分布函数的假设检验
1.3 非参数假设检验(Non-Parameter hypothesis testing) 非参数假设检验 Parameter
第3章:双变量回归模型:估计问题

(记Xi
X
xi,Yi Y
y
)
i
ˆ2
n n
X iYi
X
2 i
(
X i Yi X i)2
(X
i (X
X )(Yi i X )2
Y
)
xi yi
x
2 i
ˆ1
X
2 i
n
Y i
X
2 i
(
X i X iYi X i)2
Y
回归分析的目的:是运用样本数据估计SRL, 使SRL能最大限度逼近于PRL。
由此而提出的问题是,在什么假定下,运用何 种方法形成SRL,使SRL尽可能逼近PRL。
暨南大学经济学院统计系 陈文静
3
由
于
u
是
i
样
本
点
对
总
体
回
归
直
线
的
偏
差
,
自
然
地
希
望
基
于
u
i
来
实
现
这
一
目
的
。
由
于
u
的
i
估
计
uˆi
度
( uˆi2) / ˆ2 ( (Yi ˆ1 ˆ2Xi )2) / ˆ2 2 (Yi ˆ1 ˆ2Xi )Xi 2 uˆi Xi 0
暨南大学经济学院统计系 陈文静
9
进一步可以得出:
2 (Y i ˆ1 ˆ 2 X i ) 2 uˆ i 0
X i)2 n
第3章:双变量回归模型:估计问题

最小二乘估计
1. 德国科学家Karl Gauss(1777—1855)提出用 德国科学家Karl Gauss(1777—1855)提出用 最小化图中垂直方向的误差平方和来估计参数
2. 使因变量的观察值与估计值之间的离差平方 ˆ ˆ 和达到最小来求得β 0 和 β1的方法。即
ˆ ˆ ˆ ˆ ˆ ˆ min ∑ (ui ) 2 = ∑ (Yi − Yi ) 2 = ∑ (Yi − β1 − β 2 X i ) 2 = f ( β1 , β 2 )
回归分析的目的:是运用样本数据估计SRL, 回归分析的目的:是运用样本数据估计SRL,使 SRL SRL能最大限度逼近于PRL。 能最大限度逼近于PRL SRL能最大限度逼近于PRL。 由此而提出的问题是,在什么假定下,运用何种 由此而提出的问题是,在什么假定下, 方法形成SRL SRL, SRL尽可能逼近PRL? 尽可能逼近PRL 方法形成SRL,使SRL尽可能逼近PRL 注意:总体回归函数或直线是:固定的、唯一的 且是未知的。而我们每抽取一个样本,就可以得 出一条样本回归直线,所以样本回归直线不是固 定的,会随着样本的不同而不同,且是已知的, 估计思路就是用已知的或者可以获得的信息来估 计未知的总体信息。
i i i 2 i 2
∑ X ∑Y ∑XY −
i i i
i
1 (均值X = ∑ X i) n
2
∑ X Y − X ∑ Y ( (∑ X ) = n ∑ X − nX ∑Y ( X − X ) = ∑ X − nX ∑ ( X − X )(Y − Y ) = ∑(X − X )
i i i 2 i i 2 i 2 i
i i i 2 i 2 i
i
X i2 ∑ Y i − ∑ X i ∑ X iYi ∑ n∑ X i2 − (∑ X i ) 2
第3章 双变量回归模型:估计问题.ppt

() 式乘以 Xi ,() 式乘以n,得
请大家自己推导一次
贵州财经大学经济研究所 白万平 教授
Xi
Yi ˆ1n
X i ˆ2
2
Xi
(1)
n X i Yi ˆ1n X i ˆ2n X i 2 (2)
(2)-(1)得 :
n X iYi X i Yi ˆ2[n X i 2 X i 2 ]
贵州财经大学经济研究所 白万平 教授
假定5:各个干扰之间无自相关
给定任意两个X值,Xi和Xj,ui和uj之间的相关为零
注:
xi yi (Xi X )(Yi Y ) XiYi X Yi Y Xi nXY
其中 Xi nX Yi nY
上式 XiYi 2nXY nXY
n X iYi nXY
X iYi X i n
Yi
xi2 (Xi X )2 Xi2 2X Xi nX 2
Xi nX
上式
Xi2 2nX 2 nX 2
n Xi 2 nX 2
Xi2 n
2
Xi
贵州财经大学经济研究所 白万平 教授
返回
OLS估计量的数值性质:
Ⅰ.OLS估计量是纯粹可以用可观测的样本量(指X和Y)表达的, 因此,这些量是比较容易计算的
可以表达为离差形式(deviation form):
yi ˆ2 xi uˆi
证明: 我们已知有:
Y ˆ1 ˆ2 X
(2.6.2)式减去(3.1.12)式得:
(Yi Y ) ˆ2 (Xi X ) uˆi
数理统计 (研究生课程) :第三章 假设检验

必须认为这个差异反映了事物的本质差别,即反映 了生产已不正常.
这种差异称作 “系统误差”
正确
第二类错误
人们总希望犯这两类错误的概率越小越好,但 对样本容量一定时,不可能使得犯这两类错误的 概率都很小。 往往是先控制犯第一类错误的概率在一定限度 内,再考虑尽量减小犯第二类错误的概率。
即: 较小的 (0,1) 使得 P{拒绝H0|H0为真}≤ ,
然后减小P{接受H0|H0不真} 犯两类错误的概率:
如发现不正常,就应停产,找出原因,排除 故障,然后再生产;如没有问题,就继续按规定 时间再抽样,以此监督生产,保证质量.
很明显,不能由5罐容量的数据,在把握不大 的情况下就判断生产 不正常,因为停产的损失是 很大的.
当然也不能总认为正常,有了问题不能及时 发现,这也要造成损失.
如何处理这两者的关系,假设检验面对的就 是这种矛盾.
如果H0不成立,但统计量的实测 值未落入否定域,从而没有作出否定 H0的结论,即接受了错误的H0,那就 犯了“以假为真”的错误 . “取伪错误” 这两类错误出现的可能性是不可能排除的。 原因在于:由样本推导总体
假设检验的两类错误
实际情况 H0为真 H0不真 第一类错误 正确
决定 拒绝H0 接受H0
在上面的例子的叙述中,我们已经初步介绍 了假设检验的基本思想和方法 .
基于概率反证法的逻辑的检验: 如果小概率事件在一次试验中居然发生, 我们就以很大的把握否定原假设.