数理统计课件 4.2 正态总体均值与方差的假设检验
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
正态总体方差的假设检验

方差的计算方法
简单方差
适用于数据量较小,且数据间相互独立的情况。
加权方差
适用于数据量较大,且数据间存在相关关系的 情况,需要考虑到每个数据点的重要程度。
配对样本方差检验
总结词
配对样本方差检验用于比较两个相关样本的方差是否相同。
详细描述
在配对样本方差检验中,我们首先需要设定一个零假设,即两个相关样本的方差无显著差异。然后, 通过计算检验统计量(如Wilcoxon秩和统计量或Stevens' Z统计量),我们可以评估零假设是否被拒 绝。如果零假设被拒绝,则可以得出两个相关样本方差不相同的结论。
方差齐性检验的目的是为了后续 的方差分析提供前提条件,确保 各组数据具有可比性。
方差分析
方差分析(ANOVA)是
1
用来比较多个正态总体均
值的差异是否显著的统计
方法。
4
方差分析的结果通常以p值 表示,若p值小于显著性水 平(如0.05),则认为各组 均值存在显著差异。
2
方差分析的前提条件是各
组数据具有方差齐性和正
正态总体方差假设检验的未来发展
改进假设检验方法
结合其他统计方法
结合其他统计方法,如贝叶斯推断、机器学习等, 可以更全面地分析数据和推断总体特征。
针对正态总体方差假设检验的局限性,未来 研究可以探索更灵活、适应性更强的检验方 法。
拓展应用领域
正态总体方差假设检验的应用领域可以进一 步拓展,特别是在大数据和复杂数据分析方 面。
数学表达式
西北工业大学《概率论与数理统计》课件-第七章 假设检验

装糖重总体 X 的均值和标准差,
由长期实践可知, 标准差较稳定, 设 0.015,
则 X ~ N (, 0.0152 ), 其中 未知.
问题: 根据样本值判断 0.5 还是 0.5 ?
解 1º提出两个对立假设
H0 : 0 0.5 和 H1 : 0 . 2º X 是 的无偏估计量,
则我们拒绝 H0,
反之, 如果 u
x
/
0
n
u,则称 x 与0的差异是 2
不显著的, 则我们接受 H0,
上述关于 x 与 0 有无显著差异的判断是在显 著性水平 之下作出的.
2. 检验统计量
用于检验假设的统计量,称为检验统计量.
如:对于例2, 统计量 U X 0 / n
— 检验统计量.
3. 原假设与备择假设
1 假设 H0 : 0, H1 : 0 ;
2º取检验统计量
U X 0 ~ N (0,1), / n
(当H0为真时)
3º给定显著水平 ( 0< ≤ 0.05)
P{ U u }
2
由
(u
2
)
1
2
,查表可得
u
2
.
拒绝域: W1 {( x1, x2,, xn ) u u }, 2
u U ( x1, x2,, xn )
分析:从直观上分析,这批产品不能出厂. 因为抽样得到的次品率: 2 3% 10 然而,由于样本的随机性,如何才能根据抽
样结果判断总体(所有产品)的次品率是否≤3%?
解 用假设检验法,步骤:
1º提出假设 H0: p 0.03 其中 p为总体的次品率.
2º设
Xi
1, 0,
《概率论与数理统计》课件第八章 假设检验

正态总体均值和方差的假设检验

给定检验水平,查t(n-1)表得, t1-/2(n-1),使
得,
P{| T | t (n 1)}
即得,
1 2
P{|
x s
0
|
t 1
(n 1)}
n
2
拒绝域: 即
算出|T|与 t1比较,若 2 否则,接受H 0.
T , t1拒 绝 , H 0 2
例3 在某砖厂生产的一批砖中,随机地抽取6块进 行抗断强度试验,测得结果(单位:kg/cm2)如下: 32.56, 29.66, 31.64, 30.00, 31.87, 31.03, 设砖的抗断强度服从正态分布.问这批砖的 平均抗断强度是否为32.50 (kg/cm2)?(=0.05)。
2 0
,
H1
:
2
2 0
给定检验水平 ,查 2 n 1 分布表得
2 (n 1),
使得 P 2 2 (n 1)
根据样本值计算统计量的值.
如果 2 2 (n 1)
则拒绝 H 0 , 接受 H1.
第一类错误
弃真错误
第二类错误
取伪错误
假设检验的两类错误
所作判断 真实情况
H0 为真 H0 为假
接受 H0
拒绝 H0
正确
第二类错误 (取伪)
第一类错误 (弃真)
正确
犯第一类错误的概率通常记为 犯第二类错误的概率通常记为
P
否定H0
H
为真
0
P第一类错误
P
不否定H0
H
为假
0
P第二类错误
若 T t,1拒绝 ,H接0 受
H1
T t1 ,接受 H,0 拒绝 H。1
3,4形式的检验成为右边检验.
一个正态总体期望与方差的假设检验

W { 2 2.7 or 2 19.023}
而这里
2 / 2 (n
1)
2
2 1
/
2
(n
1)
即样本观测值落在拒绝域之外, 故接受原假设,认为该批金
属丝折断力的方差与64无显著差异.
以上对方差的检验属于双侧检验,另外还有单侧检验:
H0
:
2
2 0
;
H1
:
2
第八章
第二节 一个正态总体 期望与方差的假设检验
一、期望值的假设检验
二、方差的假设检验- 2检验
一、期望值的假设检验
1、方差
2
2为已知时对期望值
0
的检验—
u
检验
设样本 X1, X 2, , X n 来自正态总体 N (, 2 ), 方
差 2已知,对 的检验问题由上节中的五个步骤来进行.
u
0 t (n 1)
(c) H1 : 0
W {t t1 (n 1)}
W {t t1 (n 1)}
W {t t (n 1)}
2 (备择假设、拒绝域和显著性水平)
例3 电视台广告部称某类企业在该台黄金时段内播放 电视广告后的平均受益量(平均利润增加量)至少为15万元,
2未知, 由抽样分布定理知,若用样本标准差 s 代替 , U
统计量变为 t 统计量,
即
t
x 0
~ t(n 1)
s/ n
(8.2.2)
相应于上述三对假设,拒绝域见下图.
/2
/2
t
t (n 1) 0 t1 (n 1)
数理统计与管理课件 (9)

(3)对于给定的显著性水平α=0.05 ,查标准正态分布表 z z0.025 1.96
2
(4)计算统计量观察值 (5)结论
x 0 1637 1600 z 1.258 n 150 26
z 1.258 z 1.96
2
接受原假设H0
即不能否定这批产品该项指标为1600。
X 0 对于给定的显著性水平α=0.05 , S n 查t分布表得 t (n 1) t0.05 (8) 1.8595
S பைடு நூலகம்0 .3
t
由题意, x 62 .5
计算统计量观察值
x 0 62.5 62.0 5 S n 0.3 9
由于
t 5 t (n 1) 1.8595
X 0 选取统计量 Z n
查标准正态分布表
对于给定的显著性水平α=0.05 ,
z z0.05 1.645
已知n=9,σ=3, x 13.5 计算统计量观察值 x 0 13.5 15.5 z 2 n 3 9 由于 z 2 z 1.645 所以拒绝原假设H0,而接受H1, 即说明用新方法所需时间比用老方法所需时间短。
(2) H0:μ= μ0,H1:μ>μ0;检验规则为 X 0 当 T t (n 1) 时,拒绝H0 S n
当 T X 0 t (n 1) 时,接受H0 S n (3) H0:μ= μ0,H1:μ<μ0;检验规则为
X 0 当 T t (n 1) 时,拒绝H0 S n X 0 当 T t (n 1) 时,接受H0 S n
(2) H0:μ= μ0,H1:μ>μ0;检验规则为 X 0 当 Z z 时,拒绝H0 n
《统计学(第二版)》电子课件 第4章 假设检验

显著性检验本身对原假设起保护作用,水平越小, 检验犯第一类错误的概率就越小,换言之,越有 可能不拒绝原假设。
2021/8/7
《统计学》第4章假设检验
4-29
4.1.5 双侧检验和单侧检验
常见的三种显著性假设检验形式: (1)双侧检验 H0 : 0 H1 : 0 (2)右侧检验 H0 : 0 H1 : 0 (3)左侧检验 H0 : 0 H1 : 0
从该批产品中随机抽取了100件,发现其中有4件 次品,即样本次品率为4%,A公司认为样本次品 率4%大于1%,所以不接受B公司的这批产品,B 公司则认为虽然样本次品率为4%,但并不能说明 10万件产品的次品率大于1%,因为样本量很小;
2021/8/7
《统计学》第4章假设检验
4-3
问题
(1)A公司是否应该接受该批产品? (2)如果随机抽取了100件产品有3件次品,
H0:pp01%
2021/8/7
《统计学》第4章假设检验
4-12
记X为100件产品中次品的数目,直观上看, X越大,原假设越值得怀疑,反之, X越小, 对原假设越有利;问题是, X大到多少应 该拒绝原假设?
两种处理方法:
2021/8/7
《统计学》第4章假设检验
4-13
1. 假定H0成立,计算事件X≥4的概率
4-32
4.2 一个正态总体的检验
4.2.1 总体均值μ的检验: Z检验 考虑如下三种检验问题
H0:0 H1:0 H0:0 H1:0 H0:0 H1:0
(4.4) (4.5) (4.6)
2021/8/7
《统计学》第4章假设检验
4-33
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通常我们选取
λ1α=χ
2 1-α
(n
−
1),
λ2α=χ
2 α
(n
−
1)
,使
2
2
P{χ 2
使 P{| T |≥ tα / 2 (n − 1)} = α ,
即
|X− P{
Sn* /
µ0 | n
≥
tα
/2(n
−
1)}
=
α
,
故检验的拒绝域为
W
= {x : | x − µ0 |
S
* n
/
n
≥
tα / 2 (n − 1)}。
若| T |≥ tα /2(n − 1) ,拒绝假设 H0 ,即认为总体均值与 µ0 有显
10.9,10.6,10.8,10.5,10.7,10.2,10.7
假设切割的金属棒的长度服从正态 N (µ,σ 2 ) 分布,试问该
切割机工作是否正常(α = 0.05 )?
解问题归结为检验假设 H0 : µ = 10.5 ↔ H1 : µ ≠ 10.5 。 因σ 2 未知,现在用 t 检验。由样本均值计算出
以接受假设 H0 ,即认为两种安眠药的疗效无显著差异。
解 2 如果在本例中,只选了 10 个失眠者为试验对象,先
服用安眠药 A,以 X 表示服用 A 后延长的睡眠时间,经过
一段时间后,再服用安眠药 B,用 Y 表示延长的睡眠时间。
因为对同一病人服用两种药后延长的睡眠时间会有联
系,如对重症者都延长的少,对轻患者都延长的多,所
故检验的拒绝域为:
W ={
x− y
⋅
(n1 − 1)S1n1*2 + (n2 − 1)S2n2*2
⋅
n1n2 (n1 + n2 n1 + n2
−
2)
≥
tα / 2 (n1
+
n2
−
2)}
(4.11)
例 4.6 比较两种安眠药 A 与 B 的疗效,对两种药分
布抽取 10 个失眠者为试验对象,以 X 表示使用 A 后延长
检验方法。
由本例看出,同一批试验数据,看成由不同的试验方
法得来,采用不同的数学模型和检验方法,所得的结论
截然不同。因此对同一批试验数据,到底用配对试验的
分析方法还是用非配对试验的分析方法,要根据试验的
性质而确定。
三、 χ 2 检验
设 X1," Xn 是正态总体 N (µ,σ 2 ) 的一个样本,
欲检验假设
关于方差的检验
⎧χ 2 检验法(一个正态总体)
⎨ ⎩F
检验法
(两个正态总体 )
下面我们将分别予以讨论。
二、正态总体均值的检验 (一) U 检验法
U 检验适应在方差已知的情况下,对均值的检验(一个
总体或两个总体)。
1. 单个正态总体情形 设总体 X ~ N (µ,σ 2 ) ,样本 ( X1, X2,", Xn )T 来自总体 X,
作正常。
2.方差未知时两个正态总体均值的检验 设 X1," Xn1 和Y1,"Yn2 分别是来自独立正态总体 N (µ1,σ 2 ) 和 N (µ2 ,σ 2 ) 的样本。要检验假设
H0 : µ1 = µ2 ↔ H1 : µ1 ≠ µ2
这是对两个正态总体在方差相等的条件下检验均值是否
相等。
统计量
T=
一个自然的想法是以样本修正方差代替总体方差,构造
统计量
T = X − µ0 Sn* / n
∑ 其中
S
*2 n
=
1 n−1
n i =1
(Xi
−
X
)2
。
当 H0 成立时,T 服从自由度
为 n − 1的 t 分布。
当| T | 的值大时,假设不大可能成立,应否定 H0 。所以,
对给定 0 < α < 1 ,由 t 分布表即可得检验的临界值 tα /2(n − 1)
的睡眠时间,Y 表示使用 B 后延长的睡眠时间(单位:h),
试验结果如下:
X:1.9,0.8,1.1,0.1,-0.1,4.4,5.5,1.6,4.6,3.4;
Y:0.7,-1.6,-0.2,-1.2,-0.1,3.4,3.7,0.8,0,2.0
假定 X,Y 分别服从正态 N (µ1,σ 2 ) 和 N (µ2 ,σ 2 ) 分布,试问 两种药的疗效有无显著差异(α = 0.01 )? 解 1 由试验方案知 X 与 Y 独立,要求检验假设
n1 + n2
= 2.33 − 0.75 ⋅ 10×10× (10 + 10 − 2)
(4.132 + 0.75)× 9
10 + 10
= 4.9964 = 2.2613 2.2095
自由度为 n = n1 + n2 − 2 = 10 + 10 − 2 = 18 ,由α = 0.01 ,查附表
2 得 t0.005 (18) = 2.8784 ,于是 t = 2.26213 < 2.88784 = tα /2 (18) ,所
σ 2 已知. 1° 提出假设: H0: µ = µ0 ; H1: µ ≠ µ0
2° 取检验统计量: U = X − µ0 ,在 H0 成立的条件下,
σn
U = X − µ0 ~ N (0,1) σn
3°
给定显著性水平
α
,由
Φ(uα
2
)
=
1
−
α 2
,
查正态表可得
{ } 临界值 uα . 使 P U ≥ uα = α
在 H0 成立的条件下,U = ( X −Y ) ~ N (0,1)
σ
2 1
+ຫໍສະໝຸດ σ2 2n1 n2
3° 给定显著性水平
α
,由
Φ(uα
2
)
=
1
−
α 2
,
查表可得临界
{ } 值 uα ,使 P U ≥ uα = α
2
2
拒绝域:W = {( x1 , x2 ,", xn1 ; y1 , y2 ,", yn2 ) :
H0
:σ 2
=
σ
2 0
↔
H1
:σ
2
≠
σ
2 0
。
统计量。
n
∑ χ 2 =
nS
2 n
=
i =1
( Xi − X )2
σ
2 0
σ
2 0
(4.12)
在假设
H0 (σ
2
=
σ
2 0
)
成立时,服从自由度为
n
−
1
的
χ
2
分布。
对给定的检验水平 α ,选取实数 λ1α 和 λ2α 使得下
式成立:
P{λ1α ≤ χ 2 ≤ λ2α } = 1 − α
A:24 27 26 21 24
B:27 28 23 31 26
据经验知,尼古丁含量服从正态分布,且 A 种的方差为 5,
B 种的方差为 8,取 α=0.05,问两种烟草的尼古丁含量
是否有差异?
解 设两种烟草的尼古丁平均含量分别为 µ1 和 µ2 . 1° 提出零假设: H0: µ1 = µ2 ; H1: µ1 ≠ µ2
H0 : µ1 = µ2 ↔ H1 : µ1 ≠ µ2 。
现在 n1 = n2 = 10, x = 2.33h ,
S *2 1n1
=
4.132, y
=
0.75h, S2n2*2
=
3.201 ,代入公式(3.22)得
t=
x− y
⋅ n1n2 (n1 + n2 − 2)
(n1 − 1)S1n1*2 + (n2 − 1)S2n2*2
著差异;当| T |< tα /2(n − 1) ,则接受 H0 ,即认为总体均值与
µ0 无显著差异。这种利用服从 t 分布的统计量作为检验统
计量的检验方法称为 t 检验法。
**双边 t 检验的势函数为
β (δ ) = Pµ {| T |≥ tα / 2 (n − 1)}
∫ = 1 − k ∞ xn−2ϕ ( x)[Φ[ x tα / 2 (n − 1) − δ ]
X −Y
(n1 − 1)S1n1*2 + (n2 − 1)S2n2*2
n1n2 (n1 + n2 − 2) n1 + n2
(4.10)
在假设 H0 成立的条件下,T 服从自由度为 n1 + n2 − 2 的 t 分
布。给定显著水平α ,由附表 2 可查得 tα /2(n1 + n2 − 2) 使 P{| T |≥ tα / 2 (n1 + n2 − 2)} = α ,
2° 取检验统计量: U = ( X −Y )
σ
2 1
+
σ
2 2
n1 n2
在 H0 成立的条件下,U = ( X −Y ) ~ N (0,1)
σ
2 1
+
σ
2 2
n1 n2
3° 给定显著性水平 α = 0.05 ,由 Φ(u0.025 ) = 0.975 查
{ } 表可得临界值 u0.025 = 1.96. 使 P U ≥ u0.025 = 0.05
5+8
n1 n2
55
5° 作判断:因为 u0 ∈ W,所以接受 H0,即在显著水
平 α=0.05 下,认为两种烟草的尼古丁含量是无显著差
异.
(二)t 检验
1. 方差未知时,单个正态总体均值的检验