32正态总体均值与方差的假设检验

合集下载

正态总体方差的假设检验

方差计算公式为：$sigma^2 = frac{1}{N}sum_{i=1}^{N}(x_i mu)^2$，其中$N$是样本数量， $x_i$是每个样本值，$mu$是样本均值。
方差的计算方法
简单方差
适用于数据量较小，且数据间相互独立的情况。
加权方差
适用于数据量较大，且数据间存在相关关系的情况，需要考虑到每个数据点的重要程度。
配对样本方差检验
总结词
配对样本方差检验用于比较两个相关样本的方差是否相同。
详细描述
在配对样本方差检验中，我们首先需要设定一个零假设，即两个相关样本的方差无显著差异。然后，通过计算检验统计量（如Wilcoxon秩和统计量或Stevens' Z统计量），我们可以评估零假设是否被拒绝。如果零假设被拒绝，则可以得出两个相关样本方差不相同的结论。
方差齐性检验的目的是为了后续的方差分析提供前提条件，确保各组数据具有可比性。
方差分析
方差分析（ANOVA）是
1
用来比较多个正态总体均
值的差异是否显著的统计
方法。
4
方差分析的结果通常以p值表示，若p值小于显著性水平（如0.05），则认为各组均值存在显著差异。
2
方差分析的前提条件是各
组数据具有方差齐性和正
正态总体方差假设检验的未来发展
改进假设检验方法
结合其他统计方法
结合其他统计方法，如贝叶斯推断、机器学习等，可以更全面地分析数据和推断总体特征。
针对正态总体方差假设检验的局限性，未来研究可以探索更灵活、适应性更强的检验方法。
拓展应用领域
正态总体方差假设检验的应用领域可以进一步拓展，特别是在大数据和复杂数据分析方面。
数学表达式

正态分布均值的假设检验

VS
详细描述
在单样本均值假设检验中，我们首先需要确定一个期望的均值，然后计算样本的均值。通过比较这两个值，我们可以判断样本均值是否显著地偏离了期望的均值。常用的统计量包括z分数和t分数，用于评估样本均值与已知期望值之间的差异是否具有统计学上的显著性。
双样本均值的假设检验
总结词
双样本均值的假设检验是检验两个独立样本的均值是否存在显著差异。
详细描述
在双样本均值假设检验中，我们需要比较两个独立样本的均值。通过计算两组样本的均值，并比较这两个值，我们可以判断两个样本的均值是否存在显著差异。常用的统计量包括t检验和z分数，用于评估两个样本均值之间的差异是否具有统计学上的显著性。
配对样本均值的假设检验
总结词
配对样本均值的假设检验是检验两个相关样本的均值是否存在显著差异。
Part
0（H0）
样本数据来自的总体均值等于某一固定值。
备择假设（H1）
样本数据来自的总体均值不等于该固定值。
选择合适的检验统计量
• 常用的检验统计量有t统计量、Z统计量等，根据具体情况选择合适的统计量。
确定显著性水平
• 显著性水平（α）：在假设检验中，原假设为真但被拒绝的概率，通常取值在0.01至0.05之间。
正态分布在统计学中的重要性
基础性
正态分布是统计学中最重要的概率分布之一，许多统计方法和理论都基于正态分布。
广泛应用性
正态分布在自然和社会科学领域都有广泛的应用，如生物学、医学、经济学、心理学等。
理论依据
正态分布在统计学中提供了理论依据，许多统计推断和决策方法都基于正态分布的性质和假设。
1 2
判断假设是否成立
通过假设检验，可以判断一个假设是否成立，从而为进一步的研究或决策提供依据。

第二节正态总体均值的假设检验

α 2 α 2
σ
~ N(0,1)
n
（σ 2 已知)
原假设备择假设检验统计量及其在 H0为真时的分布 H0 H1
=0 ≠0
X 0 T= ~ T(n 1) S n
接受域
x 0 s n
≤ tα
（σ 2未知）
2
待估参数
枢轴量及其分布置信区间
X 0 T= ~ T(n 1) S n
( x tα
2
= 0 ≥ 0 ≤ 0
≠ 0 < 0 > 0
U=
X 0
σ
U ≥ zα
2
n
U ≤ zα
N(0,1)
U ≥ zα
未知) T 检验法 (σ2 未知) 原假设备择假设检验统计量及其 H0 H1 H0为真时的分布拒绝域
= 0 ≥ 0 ≤ 0
≠ 0 < 0 > 0
X 0 T= S n ~ t(n 1)
（2）关于 σ
2
χ2检验法的检验
拒绝域
原假设备择假设检验统计量及其在 H1 H0为真时的分布 H0
σ
2=σ 2 0
σ
2≠σ 2 0
χ =
2
∑(X )
i=1 i
n
χ ≤ χ (n)
2 2 1α 2
2
或 χ 2 ≥ χα2 (n)
2
σ 2≥σ 02 σ 2<σ 02
σ
2 0
~ χ (n)
2
χ ≤ χ (n)
(1) 关于均值差 1 – 2 的检验
原假设备择假设检验统计量及其在 H0为真时的分布 H0 H1
1 – 2 = δ 1 – 2 ≠ δ 1 – 2 ≥ δ 1 – 2 < δ 1 – 2 ≤ δ 1 – 2 > δ

正态总体均值的假设检验

t不落在拒绝域中，故接受 H 0
即认为元件的平均寿命不大于 225小时。
二、两个正态总体均值差的检验（t 检验N）o:
Image
设X1,X2,,Xn1是来自正态总体 N(m1,s2)的样本Y；1,Y2,,Yn2是来自正态总体 N(m2,s2)的样本，且设两样立本。独又分别记它们
1)
s
2 2
10 10 - 2
= 2.775,
t0.05 (18) = 1.7341,
故拒绝域为：
T = X -Y
Sp
11 10 10
- t 0.05 (18 ) = -1.7341 ,
可算得 T = -4.295 < -1.7341 , 故拒绝 H 0 ,
即认为新方法能提高得率。
已知总例体服从2正态某分布地，且区方差大高致相考同，负由抽样责获得人资料想如下：知道某年来自城市中学考生
当H0成立时T，~ t(n1 n2 -2)，对于给定 a 的
P{|T |>ta/2(n1 n2 -2)}=a,
故拒绝域为|T |>t a/2(n1 n2 -2).
说明： 1. 对于单侧检验 “ H0 : m1 - m2 ≤ m0 ” 和 “ H0 : m1- m2 ≥ m0 ”, 可以类似地讨论。常用的是 m0 = 0。 2. 对于两个正态总体的方差均为已知时,
的样本均值 X，Y为，样本方差 S12为 ,S22，并设 m1,m2,s2 均未知。
检验H： 0:m1-m2 =m0，H1:m1-m2 m0,
取统2
其
中
S2p
=
(n1
-1)S12 (n2 -1)S22 n1 n2 -2

正态总体均值及方差的假设检验表

或
2 ≤ 02
2 ≥ 02
2 > 02
2 < 02
2 个正态总体均值及方差的假设检验表(显著性水平 α)
条件原假设 H0 a1=a2
2 12 ， 2
备择假设 H1 a1≠a2 a1>a2 a1<a2 a1≠a2 a1>a2
检验统计量
拒绝域 |U|≥ u( n - 1) a
a=a0 已知方差 2
c2 =
1 n 2 x - a0 ) ～c (2n) 2 å ( i s i =1
轾n n 2 2 犏 x i - a0 ) x i - a0 ) 邋 ( ( 犏 i =1 , i =1 犏骣骣 a a 犏 c2 琪 c (2n) 琪 1琪犏 ( n) 琪 2 桫桫 2 臌
( )
U≥ u( n - 1) 2a
( ) ( )
U≤- u( n - 1) 2a |T|≥ t( n - 1) a
( )
σ 未知
2
a≤a0 a≥a0
T=
x - a0 ～ t( n- 1) S n- 1
T≥ t( n - 1) 2a
( )
( )
T≤- t( n - 1) 2a
2 = 02
a= a0 已知
(
已知
( )
( )
2 12 = 2
a1≤a2 a1≥a2
T=
未知
Z ～ t( n- 1) S n- 1
T≥ t( n - 1) 2a
( )
( )
T≤- t( n - 1) 2a
单正态总体均值及方差的区间估计(置信度 1-α)
待估参数条件检验统计量拒绝域

正态总体均值和方差的假设检验

给定检验水平，查t(n-1)表得, t1-/2(n-1),使
得,
P{| T | t (n 1)}
即得,
1 2
P{|
x s
0
|
t 1
(n 1)}
n
2
拒绝域：即
算出|Ｔ|与 t1比较，若 2 否则，接受H 0.
T ， t1拒绝， H 0 2
例３在某砖厂生产的一批砖中,随机地抽取6块进行抗断强度试验,测得结果(单位:kg/cm2)如下: 32.56, 29.66, 31.64, 30.00, 31.87, 31.03, 设砖的抗断强度服从正态分布．问这批砖的平均抗断强度是否为32.50 (kg/cm2)？(=0.05)。
2 0
,
H1
:
2
2 0
给定检验水平，查 2 n 1 分布表得
2 (n 1),
使得 P 2 2 (n 1)
根据样本值计算统计量的值.
如果 2 2 (n 1)
则拒绝 H 0 , 接受 H1.
第一类错误
弃真错误
第二类错误
取伪错误
假设检验的两类错误
所作判断真实情况
H0 为真 H0 为假
接受 H0
拒绝 H0
正确
第二类错误 (取伪)
第一类错误 (弃真)
正确
犯第一类错误的概率通常记为犯第二类错误的概率通常记为
P
否定H0
H
为真
0
P第一类错误
P
不否定H0
H
为假
0
P第二类错误
若 T t，1拒绝，H接0 受
H1
T t1 ，接受 H，0 拒绝 H。1
３，４形式的检验成为右边检验．

一个正态总体均值和方差假设检验

0.6685
1.7531
16
故接受H0 ，即认为元件的平均寿命不大于225小时。
12
二. 未知期望,检验方差
1.双边假设检验
未知期望, H0: 2 = 02 , H1: 202
(1) 提出原假设H0: 2 = 02 ，H1: 202.
(2)
选择统计量
2
(n
1)S
2
2
(3) 在假设H0成立的条件下，确定该统计量服从的分布：2～2(n-1),自由度为n-1.
当
2 0
2 (n
1)时，则拒绝H0
；
当
2 0
2 (n
1)时，则接受H0
.
19
例5 某种导线要求其电阻的标准差不得超0.005欧. 今在生产的一批导线中取样品9根，测得s=0.007欧. 问在＝0.05条件下,能认为这批导线的方差显著的偏大吗？
解提出原假设H0: 2 (0.005)2 ，H1: 2>(0.005)2.
选择统计量 T X
S
n
如果假设H0成立，那么
T
X
12 S
77
~
t(4)
5
9
取＝0.05，得t0.025(4)=2.776,则
P{|
X
S
1277 |
2.776}
0.05
4
根据样本值计算得x =1259, s2=570/4.所以
x 1277
| t0 || 570
|
45
| 1259 1277| 3.37 2.776
1)时，
2
2
则拒绝H0 ；
当
2 1
(n 1)
2 0

总体均值的假设检验

总体均值的假设检验一、正态总体均值的检验设n X X X ，，， 21为总体),(２σμN 的一个容量为n 的样本． 1．方差2σ已知，μ的检验——u 检验法．当202σσ=已知时，假设检验问题：0100μμμμ≠=：；：H H ．选择检验统计量nX U /00σμ-=，当0H 成立时，)1,0(~N U ．给定显著性水平α，由标准正态分布分位点的定义, 有αα=>}|{|2/u U P ，故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= ，这种利用服从正态分布的检验统计量的检验方法称为u 检验法．有时我们只关心总体的均值是否增大（或减小）．比如，经过工艺改革后，产品的质量（如材料的强度）比以前是否提高，此时我们要研究的是新工艺下总体的均值μ是小于等于原来的均值0μ，还是大于0μ，即检验假设 0100μμμμ>≤：；：H H ．可以证明，在显著性水平α下，上述假设检验问题和检验假设0100μμμμ>=：；：H H 有相同的拒绝域，因此，遇到形如00μμ≤：H 的检验问题，可归结为后一个假设检验问题讨论．类似地，形如0100μμμμ<≥：；：H H 的检验问题，可归结为检验假设 0100μμμμ<=：；：H H ．这都是单边检验问题．给定显著性水平α，求得的临界值点是上α分位点或上α-1分位点．例1 某厂生产的某种钢索的断裂强度X 服从),(２σμN ，其中40=σ(kg/cm 2)，现从这批钢索中抽取容量为9的样本，测得断裂强度的平均值x 较以往正常生产的μ大20(kg/cm 2)，设总体方差不变，问在1.00=α下，能否认为这批钢索质量有显著提高？解依题意，检验假设0100μμμμ>≤：；：H H ，由于40=σ已知，选择检验统计量nX U /0σμ-=因为0H 中的μ全部都比1H 中的μ要小，从直观上看，当0H 成立时，X 的取值x 不应比μ大很多，若偏差0μ-x 过大，则拒绝0H 而接受1H ．因为 0100μμμμ>=：；：H H 的拒绝域为}{αu U W >=，故在显著性水平1.00=α下原假设的拒绝域为}{}{0nu X u U W σμαα+>=>=．本题中，9=n ，40=σ，200=-μx ，33.201.0=u ，计算U 的值33.25.1/0<=-=nx u σμ因此在显著性水平1.00=α下不能拒绝0H ，即认为这批钢索质量没有显著提高．2．方差2σ未知，μ的检验——t 检验法．检验假设0100μμμμ≠=：；：H H ．因为2σ未知，而样本方差2S 是总体方差2σ的无偏估计量，用S 代替σ．选择检验统计量 nS X T /0μ-=，当0H 成立时，)1(~-n t T ．给定显著性水平α，由t 分布分位点的定义，有αα=->)}1(|{|2/n t T P ，故拒绝域)}1({)}1({)}1(|{|2/2/2/->--<=->=n t T n t T n t T W ααα ，这种利用服从t 分布的检验统计量的检验方法称为t 检验法．例2 某切割机工作正常时，切割每段金属棒的平均长度为10.5cm ．今在某段时间内随机地抽取15段进行测量，其结果如下(cm)：10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7问此段时间内该机工作是否正常(5.00=α)？假设金属棒长度服从正态分布．解依题意，检验假设0100.510μμμμ≠==：；：H H ，由于2σ未知，故选择检验统计量nS X T /0μ-=．在0H 下，)1(~-n t T ，15=n ．给定显著性水平5.00=α，查t 分布表，得临界值1448.2)14()1(025.02/==-t n t α，故拒绝域)}1(|{|2/->=n t T W α．由已知条件可得48.102.15715111=⨯==∑=n i i x n x056.0784.0141)(11122=⨯=--=∑=n i ix x n s 故2366.0=s ．计算统计量的值3274.015/2366.05.1048.10/0-=-=-=ns x t μ因为)1(||2/-<n t t α，所以接受0H ，认为切割机工作正常．例3 设木材的小头直径),(~２σμN X ，12≥μcm 为合格，今抽出12根测得小头直径的样本均值为2.11=x cm ，样本方差为44.12=s cm 2，问该批木材是否合格(5.00=α)？解依题意，检验假设010012μμμμ<=≥：；：H H ，选择检验统计量nS X T /0μ-=．在假设0100μμμμ<=：；：H H 下，)1(~-n t T ，12=n ．给定显著性水平5.00=α，查t 分布表，得临界值7959.1)11()1(05.0==-t n t α，故拒绝域)}1({--<=n t T W α，也是假设010012μμμμ<=≥：；：H H 的拒绝域．由于2.11=x ，44.12=s ，计算统计量的值3094.212/44.1122.11/0-=-=-=ns x t μ因为)1(--<n t t α，故拒绝0H ，认为该批木材是不合格的．二、正态总体方差的检验——2χ检验法设n X X X ，，， 21为来自总体),(２σμN 的一个样本，检验假设 20212020σσσσ≠=：；：H H ．1．均值μ已知．因为)1,0(~N X i σμ-，n i ,,2,1 =，则选取检验统计量∑∑==-=⎪⎪⎭⎫ ⎝⎛-=ni ini i XX 12201202)(1μσσμχ．当0H 成立时，)(~22n χχ，给定显著性水平α，由2χ分布表分位点的定义，有αχχχχαα=><-))}(())({(22/222/12n n P ，故得拒绝域)}({)}({22/222/12n n W ααχχχχ><=- ．2．均值μ未知．因为X 是总体均值μ的无偏估计量，用X 代替μ．选择检验统计量202122)1(σσχS n XX ni i -=⎪⎪⎭⎫ ⎝⎛-=∑=．当0H 成立时，)1(~22-n χχ，给定显著性水平α，由2χ分布表分位点的定义，有αχχχχαα=->-<-))}1(())1({(22/222/12n n P故得拒绝域)}1({)}1({22/222/12->-<=-n n W ααχχχχ ．类似地，在μ已知和μ未知时，可以求出检验假设20212020σσσσ>≤：；：H H 和20212020σσσσ<≥：；：H H的拒绝域．例如，在μ未知时，检验假设2020σσ≤：H 的拒绝域为)}1({22->=n W αχχ．上述检验所用的检验统计量均服从2χ分布，称这种检验方法为2χ检验法例4 某无线电厂生产的一种高频管，其中一指标服从正态分布),(２σμN ，今从一批产品中抽取8只管子，测得指标数据：68 43 70 65 55 56 60 72(1) 总体均值60=μ时，检验228=σ(取5.00=α)； (2) 总体均值μ未知时，检验228=σ(取5.00=α)．解本题是在显著性水平5.00=α下，检验假设2021220208σσσσ≠==：；：H H ，这里8=n ．(1) 60=μ已知时临界值35.517)8()(2025.022/==χχαn ，80.12)8()(2975.022/1==-χχαn ，而检验统计量的值359.10663641)(811222=⨯=-=∑=ni i x μχ，由于)()(22/222/1n n ααχχχ<<-，故接受0H ．(2) μ未知时临界值13.016)7()1(2025.022/==-χχαn ，90.61)7()1(2975.022/1==--χχαn ，而125.614898111=⨯==∑=n i i x n x ，875.652)()1(122=-=-∑=ni i x x s n ，检验统计量的值2012.1075.86526412=⨯=χ，由于)1()1(22/222/1-<<--n n ααχχχ，故接受0H ．§8.3 两个正态总体参数的假设检验设121n X X X ，，，为总体),(~11２σμN X 的一个样本，221n Y Y Y ，，，为总体),(~22２σμN Y 的一个样本．∑==1111n i i X n X 和∑==2121n i iYn Y 分别是两个样本的样本均值，∑=--=112121)(11n i i X X n S 和∑=--=212222)(11n i i Y Y n S 是相应的两个样本方差．设这两个样本相互独立．．一、两个正态总体均值的检验考虑检验假设 211210μμμμ≠=：；：H H ． 1．方差21σ与22σ已知——u 检验法．选取 22212121)()(n n Y X U σσμμ+---=．当0H 成立时，检验统计量)1,0(~222121N n n YX U σσ+-=．给定显著性水平α，由标准正态分布表分位点的定义,有αα=>}|{|2/u U P ，故拒绝域}{}{}|{|2/2/2/αααu U u U u U W >-<=>= ．例1 设从甲乙两场所生产的钢丝总体X ，Y 中各取50束作拉力强度试验，得1208=x ，1282=y ，已知801=σ，942=σ，请问两厂钢丝的抗拉强度是否有显著差别(5.00=α)？解本题是在显著性水平5.00=α下，检验假设211210μμμμ≠=：；：H H ，这里5021==n n ．选取检验统计量222121n n YX U σσ+-=．给定显著性水平05.0=α，查标准正态分布表，得临界值96.1025.02/==u u α，故拒绝域}|{|2/αu U W >=．由于1208=x ，1282=y ，801=σ，942=σ，计算检验统计量的值2392.450/)(2221-=+-=σσy x u ．由于2/||αu u >，故拒绝0H ，认为两厂钢丝的抗拉强度有显著差别． 2．方差21σ与22σ未知，但2221σσ=——t 检验法．选取 212111)()(n n S Y X T w+---=μμ．这里2)1()1(21222211-+-+-=n n S n S n S w ．当0H 成立时，检验统计量)2(~112121-++-=n n t n n S Y X T w．给定显著性水平α，由t 分布表分位点的定义，有αα=-+>)}2(|{|212/n n t T P ，故拒绝域)}2({)}2({212/212/-+>-+-<=n n t T n n t T W αα ．例2 某烟厂生产两种香烟，独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数，分别测得：甲种香烟：25 28 23 26 29 22 乙种香烟：28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差，在显著性水平5.00=α下，判断两种香烟的尼古丁含量有无显著差异？解检验假设211210μμμμ≠=：；：H H ，这里621==n n ．.525=x ，67.625=y ，7386.21=s ，3267.32=s ，0469.3=w s ．选取检验统计量2111n n S Y X T w+-=．给定显著性水平5.00=α，查t 分布表，得临界值2281.2)10()2(025.0212/==-+t n n t α，故拒绝域)}2(|{|212/-+>=n n t T W α．计算统计量的值0949.00469.33)667.255.25(1121-=⨯-=+-=n n s y x t w．由于)2(||212/-+<n n t t α，故接受0H ，认为两种香烟的尼古丁含量无显著差异．二、两个正态总体方差的检验——F 检验法考虑检验假设 2221122210σσσσ≠=：；：H H ． 1．均值1μ与2μ已知．因为)(~)(11212121211n Xn i iχμσχ∑=-=，)(~)(12212222222n Yn i iχμσχ∑=-=，选取221222211211222121/)(1/)(1//21σμσμχχ∑∑==--==n i i n i i Y n X n n n F ．当0H 成立时，检验统计量),(~)(1)(1211222121121n n F Y n X n F n i i n i i ∑∑==--=μμ．给定显著性水平α，由F 分布分位点的定义，有ααα=><-))},(()),({(212/212/1n n F F n n F F P ，故得拒绝域)},({)},({212/212/1n n F F n n F F W αα><=- ． 2．均值1μ与2μ未知．因为)1(~)1()(112212111221211--=-=∑=n S n X X n i i χσσχ，)1(~)1()(122222221222222--=-=∑=n S n Y Yn i iχσσχ，选取22222121222121//)1/()1/(σσχχS S n n F =--=．当0H 成立时，检验统计量)1,1(~212221--=n n F S S F ．给定显著性水平α，由F 分布分位点的定义，有ααα=-->--<-))}1,1(())1,1({(212/212/1n n F F n n F F P ，故得拒绝域)}1,1({)}1,1({212/212/1-->--<=-n n F F n n F F W αα ．例3某烟厂生产两种香烟，独立地随机抽取样本容量相同的烟叶标本测其尼古丁含量的毫克数，分别测得：甲种香烟：25 28 23 26 29 22 乙种香烟：28 23 30 25 21 27假定尼古丁含量都服从正态分布且具有公共方差，在显著性水平5.00=α下，判断两种香烟的尼古丁含量的方差是否相等? 解考虑检验假设2221122210σσσσ≠=：；：H H ．由于两个正态总体的均值都未知，选取检验统计量)1,1(~212221--=n n F S S F ．给定显著性水平α，查F 分布表，得两个临界值：15.7)5,5()1,1(025.0212/==--F n n F α1399.015.71)5,5(1)5,5()1,1(025.0975.0212/1====---F F n n F α，故得拒绝域}15.7{}1399.0{><=F F W ．计算统计量的值6777.03267.37386.2222221===s s F ．由于15.71399.0<<F ，故接受0H ，认为两种香烟的尼古丁含量的方差也无显著差异．§8.4 非正态总体参数的大样本检验本节讨论一般总体参数的检验．设总体X 的均值为μ，方差为2σ， n X X X ，，， 21为总体X 的一个样本．由中心极限定理可知，当样本容量n 足够大时，nX U /σμ-=近似地服从标准正态分布．因此，我们可以用正态分布去近似．如果对均值μ进行检验，方差2σ未知时，可以用样本方差2S 代替2σ；如果对方差2σ进行检验，均值μ未知时，可以用样本均值X 代替μ．下面举两个例子．例1 设某段高速公路上汽车限速为104.6km/h ，现检验85辆汽车的样本，测出的平均车速为106.7km/h ，已知总体标准差为.413=σ km/h ，但不知总体是否服从正态分布．在显著性水平50.0=α下，试检验高速公路上的汽车是否比限制速度104.6km/h 显著地快？解依题意，检验假设0100.6104μμμμ>=≤：；：H H ，由于.413=σ已知，n =85足够大，选择检验统计量nX U /0σμ-=近似地服从)10(，N ．其拒绝域}{αu U W >=，其中65.105.0==u u α．计算U 的值449.4185/4.136.1047.106=-=u ，由于αu u <，因此接受0H ，没有理由认为高速公路上的汽车比限制速度104.6km/h 显著地快．例2 为比较甲乙两种小麦植株的高度(单位：cm)，分别抽得甲、乙小麦各100穗，在相同条件下进行高度测定，算得甲乙小麦样本均值和样本方差分别为28=x ，8.3521=s ，26=y ，3.3222=s ，问这两种小麦的株高有无显著差异(50.0=α)？解依题意，检验假设 211210μμμμ≠=：；：H H ，选取 22212121)()(n n Y X U σσμμ+---=，这里两个方差用样本方差代替．当0H 成立时，检验统计量 222121n Sn S Y X U +-=近似地服从)1,0(N ．给定显著性水平05.0=α，查附表3，得临界值96.1025.02/==u u α，得拒绝域}|{|2/αu U W >=．计算U 的值4236.21003.328.352628=+-=u ，由于αu u >，因此拒绝0H ，认为这两种小麦的株高有显著差异．当总体服从(0-1)分布),1(p b 时，由于只有一个参数p ，总体均值p 和方差)1(p p -均只与p 有关，这时对参数p 进行假设检验时，检验统计量可以直接用样本和参数p 表示出来．例3 某厂有一批产品须经检验后方可出厂．按规定二级品率不得超过10%，从中随机抽取100件产品进行检查，发现有二级品14件，问这批产品是否可以出厂(50.0=α)？解这里n =100，14.0=x ．检验假设01001.0p p H p p H >=≤：；：，选取检验统计量 np p p X U )1(000--=，U 近似地服从)1,0(N ．由显著性水平50.0=α，可以得到拒绝域}{αu U W >=，其中65.105.0==u u α，计算U 的值333.31100.90.10.104.10=⨯-=u ，由于αu u <，因此接受0H ，认为这批产品二级品率没有超过10%，可以出厂．§8.5 分布的拟合检验前几节的检验都是参数的检验．实际问题中，有时需要对分布作出假设，进行检验．本节只介绍一种分布的检验方法——皮尔逊2χ检验法，它只适合于大样本的情形，一般要求样本容量50≥n ．设总体X 的分布函数为)(x F ，)(0x F 为一个已知的分布函数，n X X X ，，， 21为总体X 的一个样本，我们来检验关于总体分布的假设)()()()(0100x F x F H x F x F H ≠=：；：．一、基本原理2χ检验法的基本思想是：将随机试验的所有可能结果的全体分成k 个两两互不相容的事件k A A A ，，， 21，在n 次试验中，将i A 发生的次数i f 叫做i A 发生的频数，如果0H 为真，则由大数定律，在n 次试验中(n 足够大)，i A (k i ，，， 21=)出现的实际频率nf i与理论频率)(i i A P p =(可由分布函数)(0x F 算出)不应相差很大．基于这种想法，皮尔逊构造了统计量∑=-=ki i i i np np f 122)(χ或∑=-=ki i i i p n p n f 122ˆ)ˆ(χ，其中i p ˆ是由)(ˆ0x F 计算出来的理论频率，)(ˆ0x F 是)(0x F 中未知参数估计出后的分布函数，并证明了如下定理：定理1 若n 足够大，当0H 成立时，统计量2χ总是近似地服从自由度为1--r k 的2χ分布，其中r 是已知的分布函数)(0x F 中未知参数的个数．直观上看，2χ值表示实际观测结果与理论期望结果的相对差异的总和，当它的取值大于临界值时，应拒绝0H ．二、检验步骤如果)(0x F 为不带有未知参数的已知分布，皮尔逊2χ检验法的具体步骤如下：（1）将总体X 的值域划分成k 个不交的区间i A (k i ，，， 21=)，使得每个区间包含的理论频数满足5≥i np ，否则将区间适当调整；（2）在0H 成立时，计算各理论频率即概率i p 的值：)()()(100--==i i i i y F y F A P p ，k i ，，， 21=．这里1-i y 与i y 为区间i A 的端点，即](1i i i y y A ，-=；（3）数出i A 中含有样本值的个数，即i A 的频数i f ，并计算统计量∑=-=ki ii i np np f 122)(χ 的值2χ；（4）由2χ分布，对于给定的显著性水平α，找出临界值)1(2-k αχ；（5）判断：若)1(22->k αχχ，则拒绝0H ，否则可接受0H ．如果总体X 是离散型的，则假设0H 相当于假设总体X 的概率分布00}{i i p x X P H ==：，，，21=i ．如果总体X 是连续型的，则假设0H 相当于)()(00x f x f H =：，这里)(x f 为总体的概率密度．例1 至1984年底，南京市开办有奖储蓄以来，13期兑奖号码中诸数码的频数汇总如表8.1：表8.1试检验器械或操作方法是否有问题(50.0=α)．解设抽取的数码为X ，它可能的取值为0~9，如果检验器械或操作方法没有问题，则0~9出现是等可能的，即检验假设 1010=i p H ：，9210，，，， =i ，这里}{i X P p i ==．依题意知k =10，令}{i A i =，9210，，，， =i ，n =350，则理论频数35=i np ．57.61935688)(922==-=∑=i i i i np np f χ给定显著性水平5.00=α，查2χ分布表，得临界值9.16)9()1(205.02==-χχαk ．由于19.675>16.9，故拒绝0H ，即认为器械或操作方法有问题．如果)(0x F 为带有未知参数的已知分布，未知参数为r θθθ，，， 21，这时用这r 个未知参数的极大似然估计量r θθθˆˆˆ21，，，来代替)(0x F 中的参数r θθθ，，， 21，得到分布函数)(ˆ0x F ，然后建立统计量∑=-=ki i i i p n p n f 122ˆ)ˆ(χ，这里i p ˆ是由)(ˆ0x F 计算出来的理论频率，再用以上检验步骤进行检验，但此时检验统计量2χ近似服从)1(2--r k χ分布(这里k >r +1)．例2 某高校对100名新生的身高(厘米)做了检查，把测得的100个数据按由大到小的顺序排列，相同的数合并得表8.2：表8.2试问，在显著性水平5.00=α下是否可以认为学生身高X 服从正态分布？解这里n =100，我们来检验假设222)(021)(σμσπ--=x ex f H ：，+∞<<∞-x ，这里)(x f 为正态分布),(2σμN 的概率密度，设其分布函数为)(x F ，μ与0>σ为未知参数．先求μ与2σ的极大似然估计值μˆ，2ˆσ： 33.1661ˆ1==∑=n i i x n μ， 06.28)ˆ(1ˆ212=-=∑=μσn i i x n ．设服从正态分布)ˆ,ˆ(2σμN 的随机变量为Y ，分布函数为)(ˆy F ．按照分组要求，每个小区间的理论频数i pn ˆ不应小于5，因此我们将数据分成了7个组，使得每组的实际频数不小于5，各计算结果如下表8.3所示．表8.3中第3列i pˆ的计算如下： )(ˆ)(ˆ}{ˆ11---=≤<=i i i i i y F y F y Y y P p ，7210，，，， =i ，例如，}06.2833.1665.164ˆˆ06.2833.1665.161{}5.1645.161{ˆ3-≤-<-=≤<=σμY P Y P p1837.0)911.0()345.0(=-Φ--Φ=．给定显著性水平5.00=α，查2χ分布表，得临界值488.9)4()127()1(205.0205.02==--=--χχχαr k ．由于1.8843<9.488，故接受0H ，即认为学生身高服从正态分布．。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第8.2节正态总体均值与方差的假设检验
一、单个总体参数的检验二、两个总体参数的检验
三、基于成对数据的检验(t 检验) 四、小结
一、单个正态总体均值与方差的检验
1. 2为已知, 关于的检验(U 检验 )
在上节中讨论过正态总体 N (, 2 )
当 2为已知时, 关于 0的检验问题:
假设检验 H0 : 0 , H1 : 0 ;
(1)两批红砖的抗折强度的方差是否有显著差异? (2)两批红砖的抗折强度的数学期望是否有显著差
异? (均取 0.05)
解
(1) 检验假设:
H0
:
2 1
2 2
,
H1
:
2 1
2 2
用 F 检验法, 当 H0 为真时,
统计量F
S1*2 S2*2
~
F (n1 1,
n2 1),
查表7-3知拒绝域为
F F / 2(n1 1, n2 1)或 F F1 / 2(n1 1, n2 1),
于是| x0 / n
|
0.516
u0.05
1.645
故接受 H0, 认为该机工作正常.
2. 2为未知, 关于的检验( t 检验)
设总体 X ~ N(, 2 ), 其中, 2 未知, 显著性水平为 .
检验假设H0 : 0 , H1 : 0 .
设 X1, X2 , , Xn 为来自总体 X 的样本,
使得P{ ( X Y )
Sw
11 n1 n2
t/ 2 (n1 n2 2)}
故拒绝域为
(x y)
W1 { sw
1 1 t/ 2 (n1 n2 2)} n1 n2
例2 有甲、乙两台机床加工相同的产品, 从这两台机床加工的产品中随机地抽取若干件, 测得产品直径(单位:mm)为机床甲: 20.5, 19.8, 19.7, 20.4, 20.1, 20.0, 19.0, 19.9 机床乙: 19.7, 20.8, 20.5, 19.8, 19.4, 20.6, 19.2, 试比较甲、乙两台机床加工的产品直径有无显著差异? 假定两台机床加工的产品直径都服从正态
t分布表
查表得 t / 2(n 1) t0.025(14) 2.1448 t 0.327,
故接受 H0, 认为金属棒的平均长度无显著变化.
3. 为未知, 关于 2的检验( 2 检验)
设总体 X ~ N (, 2 ), , 2均为未知,
X1, X2 , , Xn 为来自总体 X 的样本,
要检验假设:
化? ( 0.05) 解依题意 X ~ N (, 2 ), , 2均为未知,
要检验假设 H0 : 10.5, H1 : 10.5, n 15, x 10.48, 0.05, sn* 0.237 ,
t x 0 10.48 10.5
sn* / n 0.237 / 15
0.327,
t
/
2
(n
1)
拒绝域为W1 { t
x 0 sn* / n
t/ 2 (n 1)}
上述利用 t 统计量得出的检验法称为t 检验法.
在实际中, 正态总体的方差常为未知, 所以我们常用 t 检验法来检验关于正态总体均值的检验问题.
例2 如果在例1中只假定切割的长度服从正态分布, 问该机切割的金属棒的平均长度有无显著变
k2
2
根据第六章§3定理6.8的推论2知
当H 0为真时,
S1* 2
S
*2 2
~ F (n1 1,
n2 1).
故得 k1 F / 2 (n1 1, n2 1), k2 F1 / 2(n1 1, n2 1).
检验问题的拒绝域为
F
s1* 2 s2* 2
F / 2 (n1 1,
n2 1)或
F
s1* 2 s2* 2
分布, 且总体方差相等. ( 0.05)
解依题意, 两总体 X 和Y 分别服从正态分布
N (1, 2 )和N (2 , 2 ), 1, 2, 2均为未知,
需要检验假设 H0 : 1 2, H1 : 1 2.
n1 8, x 19.925, s1*2 0.216,
n2 7, y 20.000, s2*2 0.397,
且 sw2
(8 1)s1*2 (7 1)s2*2 872
0.547,
查表可知 t0.05(13) 2.160,
| t || x y | 0.265 2.160, 所以接受 H0 ,
sw
11 87
即甲、乙两台机床加工的产品直径无显著差异.
3.两正态总体方差的检验
设 X1, X2 , , Xn1 为来自正态总体N(1,12 )的样本,
由 n1
10,
n2
8,
S1*2
40.96,
S
*2 2
14.44,
F0.025(9,7) 4.82,
F0.975 (9,7 )
1 F0.025 (7,9)
0.283,
得 F 40.96 2.837, 显然 0.283 2.837 4.82, 14.44
所以接受 H0, 认为抗折强度的方差没有显著差异.
其中 0 为已知常数. 设显著水平为 , 分析:Sn*2是2的无偏估计, 当H0为真时,
根据第六章§3知,
(n
1)
S
* n
2
02
~ 2(n 1),
取 2
(n
1)Sn*2 02
作为统
计
量.
当H 0为真时,由 2分布分位数的定义知
P
(
n
1)Sn*2 02
12/ 2 (n 1)
,
2
设 X1, X 2 , , X n1 为来自正态总体N (1, 2 ) 的样本,Y1,Y2 , ,Yn2 为来自正态总体N (2 , 2 )的
样本,且设两样本独立. 注意两总体的方差相等.
又设 X ,Y
分别是总体的样本均值,
S1* 2
,
S
* 2
2是样本
方差, 1 , 2 , 2均为未知,
取显著性水平为 .
选择统计量U X 0 ， / n
当H
成
0
立
时
，U
~
N (0,1)
对于给定的检验水平 0 1
由标准正态分布分位数定义知，
P U u / 2
因此，检验的拒绝域为 W1 { u u }，或者记为 2 W1 {x1, x2 , , xn : u u } 2 其中 u为统计量U的观测值。这种利用U统计量
P
(n
1)Sn* 02
2
2
/
2
(
n
1)
2
,
拒绝域为:
(n 1)s2
02
12 / 2(n 1)
或
(n 1)s2
02
2 / 2(n
1).
指它们的和集
例3 某厂生产的某种型号的电池, 其寿命长期以
来服从方差 2 =5000 (小时2) 的正态分布, 现有一
批这种电池, 从它生产情况来看, 寿命的波动性有所变化. 现随机的取26只电池, 测出其寿命的样本方差sn*2 =9200(小时2). 问根据这一数据能否推断这批电池的寿命的波动性较以往的有显著的变化?
02
44.314 .
因为 (n 1)sn*2
02
25 9200 5000
46 44.314 ,
所以拒绝 H0,
可认为这批电池的寿命的波动性较以往的
有显著的变化.
二、两个正态总体均值与方差的检验
1.已知方差时两正态总体均值的检验
利用u检验法检验.
设 X1, X2 , , Xn1 为来自正态总体N(1,12 )的样本,
变化, 试问该机工作是否正常? ( 0.1)
解因为 X ~ N(, 2 ), 0.15, 要检验假设
H0 : 10.5, H1 : 10.5,
n 15, x 10.48, 0.05, 则 x 0 10.48 10.5 0.516,
/ n 0.15/ 15
查表得 u0.05 1.645,
n2
),且X
,Y
独
立,
故
X Y
~
N
(1
2
,
2 1
n1
2 2
)
n2
取检验的统计量为
U (X Y )/
2 1
2 2
n1 n2
当H0成立时,统计量U ~ N (0,1)
取显著性水平为 .
由标准正态分布分位数的定义知
P{|(X Y ) / 故拒绝域为
2 1
n1
2 2
n2
| u/ 2 }
{|(x y)/
检验假设H0：1 2，H1：1 2
引入 t统计量
T
(X Y )
Sw
11 n1 n2
,
其中
S
2 w
(n1 1)S1*2 (n2 1)S2*2 n1 n2 2
.
当H0为真时, 根据第六章§3定理6.8的推论2知,
t ~ t(n1 n2 2).
对给定的由t分布的分位表可查得t/ 2 (n1 n2 2).
Y1, Y2, , Yn1 为来自正态总体N(2, 22 ) 的样本,
两样本独立
又设
1, 2均为未知,
2 1
,
2
2已
知,
需要检验假设: H0 : 1 2, H1 : 1 2 ,
上述假设可等价的变为
H0 : 1 2 0, H1 : 1 2 0,
由于X
~
N
(1,
12
n1
),Y
~
N