第8.2节-正态总体均值的假设检验——概率论和数理统计(李长青版)
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
8.2-0单正态假设检验

u X 0 . S/ n
拒绝域为| u | u / 2 .查表得 u / 2 = u0.025 = 1.96 .
由于
| u | | x 0 | 0.4 50 1.22 1.96 , s/ n 4
所以接受H0,即认为总体的均值μ=0.
147,150,149,154,152,153,148,151, 155
假设零件长度服从正态分布,问这批零件是否
合格(取 = 0.05)?
解 这里是在总体方差 2 未知的情况下,检验假设 H0: 0 150 ,H1: 150 .
在H0成立时,检验统计量
T X 0 ~ t(n 1) .
| t | | x 0 | 1.096 2.306 .
s/ n
所以接受H0,即认为这批零件合格.
三、正态总体方差的假设检验— 2 检验
设总体 X ~ N (, 2 ) 平 .
, (X1,X2,…,Xn)为X 的样本,给定显著性水
1.当 已知时,方差 2的假设检验
H0: 2
(5)由数据计算得x 112.8, s 1.1358
故T 112.8 112.6 0.4659 2.4469 1.1358 7
故接受H 0 ,即可认为用热敏电阻测温仪间接测量温度无系统 误差。
例2 某车间加工一种零件,要求长度为150mm, 今从一批加工后的这种零件中抽取 9 个,测得长度如 下:
2
2 (n)
或 2
2 1
2 (n)
2
2 0
2
2 0
2
2
正态总体均值和方差的假设检验

H0 : 1 2 4, H1 : 1 2 4
选取检验统计量
( P R) t 1 1 Sw n1 n2
~ t (n1 n2 2)
当H0成立时
拒绝域为
W { t t / 2 (n1 n2 2) }
计算可得
n1 8,
p 28.25, s12 31.93 s2 44
d c 选取检验统计量为 t ~ t ( n 1) 当H0成立时 sd / n
拒绝域为
d c W {t t / 2 (n 1)} sd / n
由 n 26, d 3.192, sd 5.879,
t /2 (25) t0.025 (25) 2.0595,
t ( n1 n2 2)
2
如果统计量的观测值 t t (n1 n2 2)
2
则拒绝原假设;否则接受原假设
2 2 , (2). 当 1 2 已知时 ( U 检验 )
检验假设: H0 : 1 2 ,
H1 : 1 2
(X Y )
为已知常数,显著水平为
H 0 的接受域 H 0 的拒绝域
2
2
x 0 如果统计量的观测值 u u 2 n
则拒绝原假设;否则接受原假设
例1 假设某装配车间由加工车间供应钢轴,长期积 累的数据资料表明钢轴直径ξ服从正态分布,其标准 差σ0=0.012厘米。根据设计要求,钢轴的直径应该是 μ0=0.150厘米,而且既不希望低于也不希望高于此规 格,否则拒收。现从一大批钢轴中抽验了75件,测 得它们的直径平均值为0.154厘米,问保证每批合格 品被拒收的概率不大于10%的前提下,应该接受还 是拒收这批产品?(P164, 例1) 解 假设检验
正态分布均值的假设检验

VS
详细描述
在单样本均值假设检验中,我们首先需要 确定一个期望的均值,然后计算样本的均 值。通过比较这两个值,我们可以判断样 本均值是否显著地偏离了期望的均值。常 用的统计量包括z分数和t分数,用于评估 样本均值与已知期望值之间的差异是否具 有统计学上的显著性。
双样本均值的假设检验
总结词
双样本均值的假设检验是检验两个独立样本的均值是否存在显著差异。
详细描述
在双样本均值假设检验中,我们需要比较两个独立样本的均值。通过计算两组样本的均值,并比较这两个值,我 们可以判断两个样本的均值是否存在显著差异。常用的统计量包括t检验和z分数,用于评估两个样本均值之间的 差异是否具有统计学上的显著性。
配对样本均值的假设检验
总结词
配对样本均值的假设检验是检验两个相关样本的均值是否存在显著差异。
Part
0(H0)
样本数据来自的总体均值等于某一固 定值。
备择假设(H1)
样本数据来自的总体均值不等于该固 定值。
选择合适的检验统计量
• 常用的检验统计量有t统计量、Z统计量等,根据具体情况选择合适的统计量。
确定显著性水平
• 显著性水平(α):在假设检验中,原假设为真但被拒绝 的概率,通常取值在0.01至0.05之间。
正态分布在统计学中的重要性
基础性
正态分布是统计学中最重要的概 率分布之一,许多统计方法和理 论都基于正态分布。
广泛应用性
正态分布在自然和社会科学领域 都有广泛的应用,如生物学、医 学、经济学、心理学等。
理论依据
正态分布在统计学中提供了理论 依据,许多统计推断和决策方法 都基于正态分布的性质和假设。
1 2
判断假设是否成立
通过假设检验,可以判断一个假设是否成立,从 而为进一步的研究或决策提供依据。
第二节 正态总体均值的假设检验8-2

14
三、基于成对数据的检验(t 检验):
设X和Y是两个正态总体, 均值分别为 1 和 2 , X 和 Y不是相互独立的。取成对样本 : (X1 , Y1) , (X2 , Y2) , … , ( Xn , Yn )。 要检验: H0 : 1 = 2 , H1 : 1 ≠ 2 . 可以把这个问题转化成单个总体的假设检验 , 令Z = X - Y , 它服从 N ( , 2) , 这里 (= 1- 2) , 2 均未知。 Zi = Xi – Yi (i=1 , 2 , … , n)是来自该正态总体的样本。 显然 , 检验 H0 : 1= 2 , H1 : 1 ≠ 2 等价于检验 H0 : =0 , H1: ≠0,
11
例 2. 在平炉上进行一项试验以确定改变操作方法的建 议是否会增加钢的得率, 试验是在同一只平炉上进行 的. 每炼一炉钢时除操作方法外, 其它条件都尽可能 做到相同. 先用标准方法炼一炉, 然后用建议的方法 炼一炉, 以后交替进行, 各炼了10炉, 其得率分别为: 标准方法: 78.1 72.4 76.2 74.3 77.4 78.4 新方法: 79.1 76.0 81.0 75.5 76.7 77.3 80.0 77.3 79.1
16
解: 分别作各对数据的差 zi = xi - yi ,如上表 ,
并假设 z1 , z2 , … , z9 来自正态总体N ( , 2 ) ,
这里 , 2 均属未知 。若两台仪器的性能一样, 则各对数据的差异可看作是随机误差, 而随机误差可以认为服从正态分布, 其均值为零, 因此本题归结为检验假设: H0: =0 , H1: ≠ 0. 由前面的结论知,可取 T =
问是否有理由认为元件的平均寿命大于225小时?
解 : 按题意需检验 H 0 : 0 = 225 , H 1 : > 225 . X- 取 a = 0 .05,统计量: t = 。 S n 当 H 0 成立时,由 X - 0 S n X- S n ,
正态总体均值的假设检验

假设检验
正态总体均值的假设检验
1.1 单个正态总体均值的假设检验
3.大样本单个正态总体均值的检验
设总体为 X ,它的分布是任意的,方差 2 未知, X1 ,X2 , ,Xn 为 来自总体 X 的样本,H0 : 0( 0 已知).当样本容量 n 很大( n 30 )
时,无论总体是否服从正态分布,统计量 t X 0 都近似服从正态分 S/ n
解 依题意,建立假设 由于 2 未知,故选取统计量
H0 : 0 72,H1 : 72 . t X 0 , S/ n
已知 0.05 ,故此检验问题的拒绝域为
W t | | t |
x 0
s/ n
t
/
2
(n
1)
.
又知 n 26,x 74.2,s 6.2,查表得 t /2 (25) t0.025 (25) 2.06 ,则有 | t | x 0 74.2 72 1.81 2.06 , s/ n 6.2/ 26
解 依题意,建立假设 由于 2 未知,取检验统计量
H0 : 0.8,H1 : 0.8 .
t X 0 ~ t(n 1) , S/ n
已知 0.05 ,故此检验问题的拒绝域为
W t | t x 0 s/ n
t (n 1) .
又知 n 16 ,x 0.92,s 0.32 ,查表得 t0.05 (16 1) t0.05 (15) 1.75,则有 t x 0 0.92 0.8 1.50 1.75 , s/ n 0.32/ 16
假设检验 H0 : 0 ,H1 : 0 的拒绝域为 W {t | t t (n 1)}.
(7-8) (7-9)
假设检验
正态总体均值的假设检验
1.1 单个正态总体均值的假设检验
【精品】概率论与数理统计PPT课件第八章 假设检验

16
假设检验的两类错误
所作判断 真实情况 H0 为真 H0 为假
接受 H0
拒绝 H0
正确
第一类错误
(弃真)
第二类错误
(取伪)
正确
犯第一类错误的概率通常记为
犯第二类错误的概率通常记为
17
如在例2中, 如果第一起交通事故发生后, 就 断定隧道南更容易发生交通事故, 犯第一类错 误的概率是0.35. 当第二起交通事故发生后, 断 定隧道南更容易发生交通事故, 犯第一类错误 的概率是0.352=0.1225. 如果第四起交通事故又 发生在隧道南, 否定p=0.35时犯第一类错误的概 率是0.354=0.015.
24
假设检验步骤(三部曲) 根据实际问题所关心的内容,建立H0与H1。
在H0为真时,选择合适的统计量T, 并确定
拒绝域。 根据样本值计算,并作出相应的判断.
25
提出 假设
总 结
抽取 样本
P(T W)=
-----犯第一 类错误的概率, W为拒绝域
根据统计调查的目的, 提出 原假设H0 和备择假设H1
P= 0.353 ≈ 0.043.
这是一个很小的概率, 一般不容易发生.
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
4
这是 小概率事件, 一般在一次试验中是不会发 生的, 现一次试验竟然发生, 故可认为原假设不 成立, 即该批产品次品率p>0.04 , 则该批产品不 能出厂.
8.2正态总体均值的假设检验

t t ( n1 n2 2).
x y 因为 t 4.295, 1 1 sw 10 10
t0.05 (18) 1.7341,
所以拒绝 H 0 ,
即认为建议的新操作方法较原来的方法为优.
例5 有甲、乙两台机床加工相同的产品, 从这两台机床加工 的产品中随机地抽取若干件, 测得产品直径(单位:mm)为 机床甲: 20.5, 19.8, 19.7, 20.4, 20.1, 20.0, 19.0, 19.9
X 0 P Z / n
拒绝域为 Z Z
或 H0: 0;H1:0
X 0 P Z / n
拒绝域为 Z Z
2、方差未知 问题:总体 X~N(,2),2未知 假设 H0:=0;H1:≠0 构造T统计量 T X 0 ~ t (n 1)
t检验 双边检验
X 0 由 P t 2 (n 1) S n 确定拒绝域 T t 2 (n 1) x 0 如果统计量的观测值 T t 2 (n 1) S n
则拒绝原假设;否则接受原假设
S
n
例2 化工厂用自动包装机包装化肥,每包重量服从正态 分布,额定重量为100公斤。某日开工后,为了确定包 装机这天的工作是否正常,随机抽取9袋化肥,称得平 均重量为99.978,均方差为1.212,能否认为这天的包 装机工作正常?(=0.1) 解 由题意可知:化肥重量X~N(,2),0=100 方差未知,要求对均值进行检验,采用T检验法。
得 k t / 2 (n1 n2 2).
故拒绝域为
( x y) t t / 2 ( n1 n2 2). 1 1 sw n1 n2
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P拒 绝 H 0|H 0为 真PX0k|0
PH0
X0 k
PH0
X
0
n
k
n
PH0
X0 n
u 2
取 k u 2n
所以本检验的拒绝域为
W: u u
2
U— 检验法
69 68 72 70 66 75
设手机的待机时间 X ~ N(,2), 由这些数据能否
说明其广告有欺骗消费者之嫌疑? (取α= 0.05)
解 需检验假设
H0:≥ 071.5; H1:071.5
由于方差未知,采用 t 检验法,选取检验统计量如下
由于方差未知,采用 t 检验法,选取检验统计量如下 T X 0 ~ t(n1)
s/ n
4
现 x0 .9 20 .7 5 7 1 4 4
接受原假设,否定厂方断言。
两正态总体均值差的检验
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 ) 两样本 X , Y
相互独立,
样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 观测值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
s/ n
4
现 x0.9 20.66
故接受原假设, 即否定厂方断言.
由此例可见: 对问题的提法不同(把哪个假设作为 原假设),统计检验的结果也会不同.
上述两种解法的立场不同,因此得到不同的结论. 第一种假设是不轻易否定厂方的结论; 第二种假设是不轻易相信厂方的结论.
由于假设检验是控制犯第一类错误的概率, 使得 拒绝原假设 H0 的决策变得比较慎重, 也就是 H0 得到 特别的保护. 因而, 通常把有把握的, 经验的结论作为 原假设, 或者尽量使后果严重的错误成为第一类错误.
又由已知,有 x 31.75, y 28.67,
(n11)s12 112.25, (n21)s22 66.64,
计算统计量的观测值, 得
sw 2.85
t xy 2.647 sw 1 n1 1 n2
比较,有
t 2 .6 4 7 2 .0 7 3 9 t/2(n 1 n 2 2 )
查标准正态分布表,得 u0.05 1.645
由此得检验统计量的观测值为 u4.3644.553.8511.645 0.108/ 5
拒绝H0,认为均值有明显下降.
例2 一手机生产厂家在其宣传广告中声称他们 生产的某种品牌的手机的平均待机时间至少为71.5 小时, 质检部门检查了该厂生产的这种品牌的手机 6部, 得到的待机时间为
~ T (n m 2)
12 22 2
未知
1 – 2 1 – 2 >
拒绝域
t t
2
t t
t t
其中
Sw
(n1)S12(m1)S22 nm2
例4 对用两种不同热处理方法加工的金属材料 做抗拉强度试验, 得到的试验数据如下:
方法I: 31 34 29 26 32 35 38 34 30 29 32 31 方法Ⅱ: 26 24 28 29 30 29 32 26 31 29 32 28 设两种热处理加工的金属材料的抗拉强度都服从正 态分布, 且方差相等. 比较两种方法所得金属材料的 抗拉强度有无显著差异. ( 显著性水平α = 0.05)
解 设两正态总体为 X~N 1,2 , Y~N 2,2 ,
要检验的假设为
H 0: 12;H 1: 12
检验统计量为
解 设两正态总体为 X~N 1,2 , Y~N 2,2 ,
要检验的假设为
H 0: 12;H 1: 12
U X Y
2 1
2 2
nm
~ N (0,1)
( 12,22 已知)
u u
2
u u
u u
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
1 – 2 = 1 – 2
T
X Y 1 n 1 mSw
1 – 2 1 – 2 <
T X 0
Sn
检验假设
H0 : 0 ; H1 : 0
当原假设 H0 为真时,有 T X 0 ~ t(n 1)
Sn
拒绝域的导出方法与前述方法相同,结果见下表
T 检验法 (2 未知)
原假设 备择假设
H0
H1
检验统计量及其 H0为真时的分布
0 0 0 < 0 0 > 0
把显著性水平α增大,取 0.3, t0.3(15)0.5357
从而有
x0.80.5357 x0.80.53570.320.842856
s/ n
4
现 x 0 .9 2 0 .8 4 2 8 5 6
拒绝原假设,否定厂方断言。
x0.80.5357 x0.80.53570.320.757144
T X 0 Sn
~ t(n 1)
拒绝域
t t
2
t t
t t
例1 已知铁水中碳的百分含量为 X~N4.55,0.1082 ,
现测定5炉, 其碳的百分含量(%)为 4.28 4.40 4.42 4.35 4.37
如果方差 σ2 不变, 试问均值μ是否明显下降? ( 0.05)
第八章
假设检验
第二节 正态总体均值的假设检验
一个正态总体均值 的检验
拒绝域的推导
给定显著性水平 与样本值 (x1,x2, … , xn ) 设 X ~N ( 2),2 已知,需检验:
H0 : 0 ; H1 : 0
构造统计量 U X 0 ~ N(0,1) n
现随机抽取16Байду номын сангаас马达试验, 求得平均工作电流为0.92 安培, 工作电流的标准差为0.32安培.
假设马达的工作电流服从正态分布,取显著性水平
为 = 0.05, 问根据这个样本, 能否否定厂方的断言?
解 根据题意待检假设可设为
H0 : 0.8 ; H1 : > 0.8 未知, 故选检验统计量: T X ~T(15)
S/ n
这是左边检验,拒绝域为
tt0.05(5)2.015
计算统计值得 x 70, s 2 1 0 , t 1.162,
因为 t 1 .1 6 2 2 .0 1 5 t0 .0 5 (5 )
拒绝H0, 即不能认为该厂广告有欺骗消费者之嫌疑.
例3 某厂生产小型马达, 说明书上写着:这种小型 马达在正常负载下平均工作电流不会超过0.8 安培.
解 要检验假设
H0:≥ 04.55; H1 :0
这是总体均值 μ 的左边检验, 取检验统计量
U X 0 / n
在原假设H0 为真时,U 服从标准正态分布
在原假设H0 为真时,U 服从标准正态分布
U X 0 ~ N(0,1) / n
由已知 x 4.364, 0 4.55, 0 0.108,
拒绝 H0, 平均抗拉强度有显著差异.
显著性水平
与一个总体的情形类似,两正态总体均值差的检验 方法如下表
关于均值差 1 – 2 的检验表
原假设 H0
备择假设 检验统计量及其在
H1
H0为真时的分布
拒绝域
1 – 2 = 1 – 2 1 – 2 1 – 2 < 1 – 2 1 – 2 >
4
现 x0.9 20.94
故接受原假设, 即不能否定厂方断言.
解二 H0 : 0.8 ; H1 : < 0.8 选用统计量: T X ~T(15)
S / 16 查表得 t0.05(15) = 1.753, 故拒绝域
x0.81.753 x0.81.7503.320.66
关于 U 检验法的其它情形见下表
U —检验法表(σ为已知)
原假设 备择假设
H0
H1
检验统计量及其 H0为真时的分布
0 0
0 < 0
U X 0 n N (0,1)
拒绝域
u u
2
u u
0 > 0
u u
若 σ未知, 用样本标准差 S 代替 σ, 选用 t 统计量
检验统计量为 T
X Y
Sw 1 n1 1 n2
在 H0 为真时,有 T~t(n1n22), n1 n2 12
查表得
t /2 ( n 1 n 2 2 ) t0 .0 2 5 ( 2 2 ) 2 .0 7 3 9
又由已知,有 x 31.75, y 28.67,
(n11)s12112.25, (n21)s22 66.64, sw 2.85
S / 16
解 根据题意待检假设可设为
H0 : 0.8 ; H1 : > 0.8 未知, 故选检验统计量: T X ~T(15)
S / 16
查表得 t0.05(15) = 1.753, 故拒绝域为
x0.81.753 x0.81.7503.320.94
s/ n