两个总体的假设检验
83 两个正态总体的假设检验

2 1
2 2
。
信息系 刘康泽
(2)均值检验
假设 H0 : 1 2 , H1 : 1 2
检验统计量:T X Y
Sw
11 n1 n2
~ t(n1 n2 2) ,
检验值:由于 sw2
(n1 1)s12 (n2 1)s22 n1 n2 2
5.40 ,
1
1 1 0.10 。
f / 2 (n2 1, n1 1) f0.025 (3, 4) 9.98
拒绝域 B (0, 0.10] [15.10, ) ,
由于 0.10 F0 2.894 15.10 故接受 H0 ,即可以认为甲、乙两矿煤的含灰率的方差
无显著差异,也即可以认为
信息系 刘康泽
构造小概率事件,对于①:
PF
剠 f1 n1 2
1, n2
或
F
f (n1 1,n2 ) ;
2
对于②: P F „ f1 n1 1,n2 ;
对于③: P F 協f n1 1,n2 。
其中
F
…
f
/2
(n1
1, n2
)
;
对于②: F „
1
;
f (n2 1, n1 1)
对于③: F … f n1 1, n2 .
(5)检验判断:检查是否有 F0 B ,确定是否拒绝 H0 或接受 H0 ,进而下统计结论。
信息系 刘康泽
例 2 从两煤矿各抽样数次,分析其含灰率(%)如下, 甲矿 24.3 20.8 23.7 21.3 17.4 乙矿 18.2 16.9 20.2 16.7
两个正态总体的假设检验

由样本观察值算出的 F 满足
F0.95 (9 , 9) 1 3.18 F 1.95 3.18 F0.05 (9 , 9) .
可见它不落入拒绝域,因此不能拒绝原假设 H0 :σ12 = σ22 ,
从而认为两个总体的方差无显著差异。
注意:在 μ1 与 μ2 已知时,要检验假设 H0 :σ12 = σ22 ,其
检验方法类同均值未知的情况,此时所采用的检验统计量是:
1 n1
2
(
X
)
i 1
n1 i 1
F
1 n2
2
(
Y
)
i 2
n2 i 1
其拒绝域参看表8-5。
( 2 )单边检验可作类似的讨论。
F0.05 (n1 , n2 ) .
8-5
概率学与数理统计
体的样本,且 μ1 与 μ2 未知。现在要检验假设 H0 : σ2 = σ02 ;
H1: σ2 ≠ σ02 。在原假设 H0 成立的条件下,两个样本方差的
比应该在1附近随机地摆动,所以这个比不能太大又不能太小。
于是我们选取统计量
S12
F 2.
S2
( 8.21 )
显然,只有当 F 接近1时,才认为有 σ12 = σ22 。
10 10 2
18
由( 8.20 )式计算得
2.063 2.059
t0
3.3 .
0.0000072 (2 10)
对于 α =0.01,查自由度为18的 t 分布表得 t 0.005( 18 )=2.878。
由于| t0|=3. 3 > t 0.005( 18 )=2.878 ,于是拒绝原假设 H0 :μ1 = μ2 。
两个正态总体方差的假设检验

两个正态总体方差的假设检验1. 引言嘿,大家好!今天我们来聊聊一个在统计学中非常重要,但听起来可能有点儿复杂的话题——两个正态总体方差的假设检验。
别担心,我们会用通俗易懂的方式,把这个问题掰开了揉碎了讲清楚。
你可能会问,“这跟我有什么关系呢?”其实,这些统计方法不仅仅是数学家的专属,很多实际问题都可以通过这些方法得到解决。
好比你买衣服时,会比较不同品牌的裤子,看哪个更适合你,其实也是在做“检验”。
所以,搞懂这个概念,绝对会让你在数据分析的世界里如鱼得水。
我们从最基本的概念开始聊起,循序渐进,一步一步深入。
2. 正态总体和方差2.1 正态总体是什么?首先,让我们搞清楚什么是“正态总体”。
简单来说,正态总体就是数据分布呈现钟形曲线的情况。
在生活中,很多自然现象都符合这种分布,比如人的身高、体重、考试分数等等。
正态分布的特点就是数据集中在中间,向两边渐渐减少,就像一个标准的山峰。
想象一下你在玩飞盘,飞盘从空中下落时的轨迹,就是一个典型的钟形曲线。
2.2 方差的作用接下来,我们来谈谈方差。
方差是用来衡量数据的离散程度的,换句话说,就是数据离中间值的远近程度。
方差大的话,数据就会分布得比较散,方差小的话,数据就比较集中。
好比你家里那只爱乱跑的猫,方差大,它就到处跑;而如果它安安静静地待在一个角落,那就是方差小了。
3. 假设检验的基本概念3.1 什么是假设检验?好,接下来进入正题:假设检验。
假设检验就像是在做一个“真心话大冒险”,我们要通过数据来验证某个“假设”是否成立。
比如你和朋友讨论哪家餐馆的菜最好,你们就会提出一个假设,然后用实际的体验来检验这个假设。
统计学中的假设检验也是类似的,只不过我们用的是数字和公式来做这个验证。
3.2 两个正态总体方差的假设检验现在,我们要做的是两个正态总体方差的假设检验。
这就像是比较两个篮球队的实力,看看哪个队更强。
假设我们有两个正态分布的数据集,我们的任务就是判断这两个数据集的方差是否相同。
两个正态总体的假设检验

有时,我们需要比较两总体的参数 有时,我们需要比较两总体的参数 是否存在显著差异。比如, 是否存在显著差异。比如,两个农作物 品种的产量,两种电子元件的使用寿命, 品种的产量,两种电子元件的使用寿命, 两种加工工艺对产品质量的影响, 两种加工工艺对产品质量的影响,两地 区的气候差异等等。 区的气候差异等等。
Fα2 (n1 − 1, n2 − 1) 和 F12 α (n1 − 1, n2 − 1) ,使 −
2
( P (F
P F < Fα (n1 − 1, n2 − 1) =
2 2
2
2
> F12 α −
2
)、(3) 由(2)、( )式可得检验的拒绝域为 )、(
F < F1−(α 2) ( n1 − 1, n2 − 1) 及 F > Fα 2 ( n1 − 1, n2 − 1)
拒绝H 两种灯泡的平均寿命 所以拒绝 假设, 所以拒绝 0假设,即认为 A、B两种灯泡的平均寿命 、 两种灯泡的 有统计意义。 有统计意义。
两个正态总体的方差检验 问题: 问题: X ~ N µ , σ 2 , Y ~ N µ ,σ 2 1 1
(
)
未知
µ1 , µ2 ,检验假设 0:σ 12 = σ 22 检验假设H
所以拒绝原假设 H20,即认为两种玉米的产量差异 有统计意义。 有统计意义。
(
2
2
)
F检验 检验
S12 σ 12 F = 2 2 ~ F ( n1 − 1, n2 − 1) 由抽样分布知 S2 σ 2 2 S 若假设H 成立, 若假设 0成立,则 F = 12 ~ F ( n1 − 1, n2 − 1) S2
f (x )
第四章_两个总体的假设检验

net
1
net
2
两个总体比率之差的检验
(例题分析)
H0 :1- 2 0 H1 :1- 2 < 0 = 0.05 n1=200 , n2=200
临界值(c):
拒绝域
检验统计量:
z
0.27 0.35
1 1 0.31 (1 0.31) 200 200 1.72976
两个总体均值之差的估计 (例题分析)
【例】为检验两种方法组装产品所需时间的差异,分别对两种 不同的组装方法各随机安排 12 个工人,每个工人组装一件产 品所需的时间(分钟)下如表。假定两种方法组装产品的时间服 从正态分布,但方差未知且不相等。取显著性水平0.05,能否 认为方法1组装产品的平均数量明显地高于方法2?
2 ( d d ) i i 1 n
d
di
i 1
n
nd
sd
nd 1
匹配样本
(数据形式)
观察序号 样本1 样本2 差值
1 2 M i M n
x11 x12 M x1i M x 1n
x21 x22 M x 2i M x 2n
d1 = x11 - x21 d2 = x12 - x22 M d i = x 1i - x 2i M dn = x1n- x2n
拒绝域
P值决策
z z / 2
z z
z z
P 拒绝H0
两个总体比率之差的检验
(例题分析)
【例】一所大学准备采取一项学生 在宿舍上网收费的措施,为了解男 女学生对这一措施的看法是否存在 差异,分别抽取了 200 名男学生和 200名女学生进行调查,其中的一个 问题是:“你是否赞成采取上网收 费的措施?”其中男学生表示赞成 的比率为 27% ,女学生表示赞成的 比率为 35% 。调查者认为,男学生 中表示赞成的比率显著低于女学生 。取显著性水平 =0.01 ,样本提供 的证据是否支持调查者的看法?
8.3两个正态总体参数的假设检验

方差
12
2 2
2
未知
1.H0 : 1 2 0 H1 : 1 2 0
由于
Sw2
1 n1 n2
n1
[ 2 i1
(Xi
X )2
n2 i1
(Yi
Y )2]
是
2 的无偏估计
检验统计量:T
Sw
X Y 1 n1
1 n2
~ t(n1 n2 2)
检验问题的拒绝域为:| T | t (n1 n2 2)
X Y H0
2 1
2 2
~ N (0,1)
n1 n2
检验问题的拒绝域为:|U | Z
2
方差
12 ,
2 2
已知
2.
检验统计量:U
X Y
2 1
2 2
n1 n2
检验问题的拒绝域为:U Z1
3. H0 : 1 2 0
方差
12 ,
2 2
已知
H1 : 1 2 0
检验统计量:U
X Y
2 1
2 2
n1 n2
检验问题的拒绝域为:U Z
例:设可乐厂车间使用灌装机生产的可乐容量服从正态分布, 方差为1。某天计量检验人员随机抽取10瓶可乐,容量数据如下 (单位:毫升):
499.5 496.3 500.5 499.1 499.3 499.2 499.0 500.2 500.1 499.8 另一可乐厂生产的可乐容量服从正态分布,方差为1.5。计 量检验人员随机抽取了的9瓶可乐,容量数据如下(单位:毫 升):
2. H0 : 1 2 0 H1 : 1 2 0
3. H0 : 1 2 0 H1 : 1 2 0
问题1称为双侧检验问题,问题2、3称为单侧检验问题。
两个总体的假设检验

案例1——哪种安眠药旳疗效好?
为分析甲、乙两种安眠药旳效果,某医院将20个失 眠病人提成两组,每组10人,两组病人分别服用甲、 乙两种安眠药作对比试验。试验成果如下:
两种安眠药延长睡眠时间对比试验(小时)
病人
安眠药
1 2 3 4 5 6 7 8 9 10
甲
1.9 0.8 1.1 0.1 –0.1 4.4 5.5 1.6 4.6 3.4
∵本例中“P(F<=f)单尾”旳值为 0.1503, 故其双边检验所到达旳明显性水平为
2×0.1503 = 0.3006 > 0.20
故在在水平 = 0.20下,12 与 22 间无明显差别。
23
§8.5 大样本两个总体百分比旳检验
设 P1, P2 分别是两个独立总体旳总体百分比,
原假设为
H0: P1 = P2
两种安眠药延长睡眠时间对比试验(小时)
病人 安眠药
1
2
34
5678
9 10
甲
1.9 0.8 1.1 0.1 –0.1 4.4 5.5 1.6 4.6 3.4
乙
0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0
(1)两种安眠药旳疗效有无明显差别?
(2)假如将试验措施改为对同一组10个病人,每人分别 服用甲、乙两种安眠药作对比试验,试验成果仍如 上表,此时两种安眠药旳疗效间有无差别?
~ t ( n1+n2-2 )
其中:
S
2 w
(n1
1)S12 (n2 1)S22 n1 n2 2
,
称为合并方差。
完全类似地,能够得到如下检验措施:
统计量
备择假设
两个正态总体参数的假设检验 推导

两个正态总体参数的假设检验推导一、引言假设检验是统计学中常用的方法,用于检验两个正态总体参数是否具有显著差异。
本文将介绍两个正态总体参数的假设检验的推导过程,主要包括以下步骤:假设提出、样本收集、样本检验、推断结论、结果解释和误差分析。
二、假设提出假设检验的基本思想是通过样本数据对总体参数进行推断。
在这个过程中,首先需要提出假设,即对两个正态总体参数的关系做出假设。
通常,假设检验中包含两个假设:零假设(H0)和备择假设(H1)。
零假设通常表示两个总体参数无显著差异,备择假设则是与零假设相对的假设。
例如,我们可以在零假设中设定两个总体均数相等,备择假设则是均数不等。
三、样本收集在提出假设后,需要收集样本数据以进行检验。
样本收集应遵循随机抽样的原则,以确保样本的代表性。
在收集样本时,还需要注意样本量的大小,以保证推断结论的准确性。
四、样本检验样本检验是假设检验的核心步骤,包括计算样本统计量、确定临界值和做出推断结论等步骤。
样本统计量是根据样本数据计算出的量,用于推断总体参数。
临界值是用于判断样本统计量是否达到显著差异的标准。
在做出推断结论时,需要根据样本统计量和临界值进行比较,以确定零假设是否被拒绝。
五、推断结论根据样本检验的结果,可以做出推断结论。
如果样本统计量超过了临界值,则可以拒绝零假设,接受备择假设;否则,不能拒绝零假设。
推断结论是假设检验的关键步骤之一,要求谨慎和客观地做出判断。
六、结果解释推断结论做出后,需要对结果进行解释。
解释结果时需要关注以下几点:一是理解推断结论的含义,二是明确结果对于实践的意义,三是注意结果的局限性,即样本量和误差范围等因素对结果的影响。
结果解释要求清晰明了地传达结果的含义和应用范围。
七、误差分析误差分析是假设检验中不可或缺的一环。
误差分为两类:一类是随机误差,由随机抽样造成;另一类是系统误差,由样本设计和处理等环节造成。
误差分析的目的是评估结果的可靠性和精确性,从而确定结果在实际应用中的可信度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
甲 乙
20.5 20.7
19.8 19.8
19.7 19.5
20.4 20.8
20.1 20.4
20.0 19.6
19.0 20.2
19.9
两个总体均值之差的检验
(例题分析)
H0 :1- 2 = 0 H1 :1- 2 0 = 0.05 n1 = 8,n2 = 7 临界值(c):
第1步:将原始数据输入到Excel工作表格中 第2步:选择“工具”下拉菜单并选择“数据分析”选项 第3步:在“数据分析”对话框中选择 “t-检验:双样本异方 差 假设” 第4步:当对话框出现后 在“变量1的区域”方框中输入第1个样本的数据区域 在“变量2的区域”方框中输入第2个样本的数据区域 在“假设平均差”方框中输入假定的总体均值之差 在“”方框中输入给定的显著性水平(本例为0.05) 在“输出选项”选择计算结果的输出位置,然后“确 用Excel进行检验 定”
两种饮料平均等级的样本数据
新饮料
旧饮料
5
6
4
6
7
7
4
5
3
8
9
5
7
6
6
两个总体均值之差的检验
(用Excel进行检验)
第1步:选择“工具”下拉菜单,并选择“数据分析”选项
第 3 步:在分析工具中选择“ t 检验:平均值的成对二样本分 析”
第4步:当出现对话框后
在“变量1的区域”方框内键入数据区域
在“变量2的区域”方框内键入数据区域 在“假设平均差”方框内键入假设的差值(这里为0) 在“”框内键入给定的显著性水平
1. 假定条件
两个总体都是正态分布 12, 22未知且不相等,即1222 样本容量相等,即n1=n2=n
2. 检验统计量 ( x1 x 2 ) ( 1 2 ) ( x1 x 2 ) ( 1 2 ) t 2 2 s12 s 2 s12 s 2 n1 n2 n
两个独立的小样本 两个总体都是正态分布 12, 22已知
2. 检验统计量
z
( x1 x 2 ) ( 1 2 )
12 22 n1 n2
~ N (0,1)
两个总体均值之差的检验
(12,22 未知但12=22)
1. 假定条件
两个独立的小样本 两个总体都是正态分布 12、 22未知但相等,即12=22
用Excel进行检验
两个总体比率之差的检验
两个总体比率之差的检验
1. 假定条件 两个总体都服从二项分布
可以用正态分布来近似
2. 检验统计量 检验H0:1-2=0 z
x1 x 2 p1 n1 p 2 n2 p n1 n 2 n 1 n2
p1 p 2
拒绝 H0
0.025
检验统计量:
t
( x1 x 2 ) s p 1 / n1 1 / n2
0.855
决策:
不拒绝H0
0.025
拒绝 H0
结论:
没有理由认为甲、乙两台机床 加工的零件直径有显著差异
-2.160
0
2.160
t
两个总体均值之差的检验
(用Excel进行检验)
第1步:将原始数据输入到Excel工作表格中 第2步:选择“工具”下拉菜单并选择“数据分析”选项 第3步:在“数据分析”对话框中选择 “t-检验:双样本等方 差 假设” 第4步:当对话框出现后 在“变量1的区域”方框中输入第1个样本的数据区域 在“变量2的区域”方框中输入第2个样本的数据区域 在“假设平均差”方框中输入假定的总体均值之差 在“”方框中输入给定的显著性水平(本例为0.05) 在“输出选项”选择计算结果的输出位置,然后“确 用Excel进行检验 定”
检验H0:1-2=d0 z
1 1 p (1 p ) n n 2 1 ( p1 p 2 ) d 0
p1 (1 p1 ) p 2 (1 p 2 ) n1 n2
两个总体比率之差的检验
(检验方法的总结)
假设 假设形式 双侧检验 左侧检验 右侧检验
s s n n 1 2 自由度:v 2 2 2 2 s1 n1 s2 n2 n1 1 n2 1
2 1 2 2
2
两个总体均值之差的检验
(例题分析)
【例】甲、乙两台机床同时加工某种同类型的零件, 已知两台机床加工的零件直径(单位: cm)分别服从正 态分布,并且有12=22 。为比较两台机床的加工精度 有无显著差异,分别独立抽取了甲机床加工的8个零件 和乙机床加工的7个零件,通过测量得到如下数据 。 在=0.05的显著性水平下,样本数据是否提供证据支 持 “两台机床加工的零件直径不一致”的看法?
P 拒绝H0
两个总体均值之差的检验
(例题分析)
【例】某饮料公司开发研制出一新产品,为比较消费者 对新老产品口感的满意程度,该公司随机抽选一组消费 者(8人),每个消费者先品尝一种饮料,然后再品尝另一 种饮料,两种饮料的品尝顺序是随机的,而后每个消费 者要对两种饮料分别进行评分(0分~10分),评分结果如 下表。取显著性水平 =0.05 ,该公司是否有证据认为 消费者对两种饮料的评分存在显著差异?
两个方法组装产品所需的时间
方法1
28.3 30.1 29.0 37.6 32.1
36.0 37.2 38.5 34.4 28.0 27.6 22.2 31.0 33.8 20.0
方法2
31.7 26.0 32.0 31.2 33.4
1
2
28.8
30.0
30.2
26.5
两个总体均值之差的检验
(用Excel进行检验)
2 ( d d ) i i 1 n
d
di
i 1
n
nd
sd
nd 1
匹配样本
(数据形式)
观察序号 样本1 样本2 差值
1 2 M i M n
x11 x12 M x1i M x 1n
x21 x22 M x 2i M x 2n
d1 = x11 - x21 d2 = x12 - x22 M d i = x 1i - x 2i M dn = x1n- x2n
2. 检验统计量 ( x1 x 2 ) ( 1 2 ) t 1 1 sp n1 n2
2 2 ( n 1 ) s ( n 1 ) s 2 1 2 2 其中: s p 1 n1 n2 2 自由度: n1 n2 2
两个总体均值之差的检验
(12, 22 未知且不相等1222)
两个总体参数的检验
一、两个总体均值之差的检验 二、两个总体比率之差的检验 三、两个总体方差比的检验
两个总体参数的检验
两个总体参数的检验 均值
独立样本 配对样本
比率
方差
z 检验
(大样本)
t 检验
(小样本)
t 检验
(小样本)
z 检验
F 检验
两个总体均值之差的检验
(独立大样本)
两个总体均值之差的检验 (独立大样本)
两个总体均值之差的检验
(匹配样本)
两个总体均值之差的检验
(匹配样本)
1. 假定条件
两个总体配对差值构成的总体服从正态分布 配对差是由差值总体中随机抽取的 数据配对或匹配(重复测量 (前/后))
2. 检验统计量
t
d d0 sd nd
~ t (n 1)
样本差值均值
样本差值标准差
两个总体均值之差的估计 (例题分析)
【例】为检验两种方法组装产品所需时间的差异,分别对两种 不同的组装方法各随机安排 12 个工人,每个工人组装一件产 品所需的时间(分钟)下如表。假定两种方法组装产品的时间服 从正态分布,但方差未知且不相等。取显著性水平0.05,能否 认为方法1组装产品的平均数量明显地高于方法2?
z ( x1 x 2 ) ( 1 2 ) n1 n2 ( x1 x 2 ) ( 1 2 )
2 2 s1 s2 n1 n2
12 , 22 已知
统计量
12
2 2
12 , 22 未知
拒绝域
P值决策
z
z z / 2
z z
z z
两个总体均值之差的检验
(匹配样本检验方法的总结)
假设 假设形式 双侧检验 H0 :d=0 H1 :d0 左侧检验 H0 :d0 H1 :d<0 右侧检验 H0 :d0 H1 :d>0
统计量 拒绝域 P值决策
t
d d0 sd nd
t t / 2 (n 1) t t (n 1) t t (n 1)
P 拒绝H0
两个总体均值之差的检验
(例题分析)
【例】某公司对男女职员 的平均小时工资进行了调 查,独立抽取了具有同类 工作经验的男女职员的两 个随机样本,并记录下两 个样本的均值、方差等资 料如右表。在显著性水平 为 0.05 的 条件下 ,能否认 为男性职员与女性职员的 平均小时工资存在显著差 异?
net
1
net
2
两个总体比率之差的检验
(例题分析)
H0 :1- 2 0 H1 :1- 2 < 0 = 0.05 n1=200 , n2=200
临界值(c):
拒绝域
检验统计量:
z
0.27 0.35
1 1 0.31 (1 0.31) 200 200 1.72976
自由度:n1 n2 2 2(n 1)
两个总体均值之差的检验