第八章 假设检验 第2讲
第8 假设检验(共80张PPT)

8.1 8.2 8.3 8.4
假设检验的根本问题 一个总体参数的检验 两个总体参数的检验 假设检验中的其他问题
我认为该企业生产的零件的平
均长度为4厘米!
什么是假设? 对总体 参数的一种看法
总体参数包括总 体均值、比例、方 差等
举例说明假设检验的根本思路
某单位职工上月平均收入为210元,这个 月的情况与上月没有大的变化,我们设想平均 收入还是210元.
样本均值的抽样分布
置信水平
拒绝域
1-
接受域
临界值
H0
样本统计量
如果备择假设具有符号“>〞,拒绝域位于抽样分 布的右侧,故称为右侧检验
样本均值的抽样分布
置信水平
1- 接受域
拒绝域
H0
样本统计量
临界值
请判断它们的拒绝域:
〔1〕假设检验的假设为H0:m=m0 ,H1: m≠m0,那么拒绝域为〔 〕。
〔2〕假设检验的假设为H0:m≥m0 ,H1: m < m0,那么拒绝域为〔 〕。
〔3〕假设检验的假设为H0:m≤m0 ,H1: m > m0,那么拒绝域为〔 〕。
检验统计量:Z > Z;
Z > Z/2 或Z <-Z/2 ;
Z <-Z
决策规那么
给定显著性水平 ,查表得出相应的临界 值 将检验统计量的值与 水平下的临界值进 行比较 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 得出拒绝或不拒绝原假设的结论
H0:m=10 H1:m≠10
例 6.2
某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设。
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
统计学贾俊平第8章 假设检验

两者都可以被选为null hypothesis
18
All rights reserved
假设的陈述
若FDA 选择以下的方式: H0:新药对于大众没有益处不应该上市 H1:新药对于大众有益处 此时药厂必须举证推翻H0,否则FDA不会核准 新药上市 由于这种假设方式,美国的新药上市过程十 分冗长,但好处为有害药物要上市十分困难
建立的原假设与备择假设应为
H0: 1000
H1: 1000
27
All rights reserved
双侧检验和单侧检验
假设
H0 H1
研究的问题
双侧检验 左侧检验 右侧检验
= 0
0
0
≠0
< 0
> 0
28
All rights reserved
H1: 1500
25
All rights reserved
双侧检验和单侧检验
一项研究表明,改进生产工艺后,会使产品的废 品率降低到2%以下。检验这一结论是否成立
研究者总是想证明自己的研究结论(废品率降 低)是正确的
备择假设的方向为“<”(废品率降低)
建立的原假设与备择假设应为
H0: 2%
13
All rights reserved
假设的陈述
备择假设 (alternative hypothesis)
与原假设对立的假设,也称“研究假设” 这与原假设为互斥 研究者想收集证据予以支持的假设。总是 有不等号: , 或 表示为 H1
例如,H1: < 某特定值 如 H1: < 3.5
4
All rights reserved
第八章----假设检验课件PPT

假设检验的基本问题 一个总体参数的检验 两个总体参数的检验
1
学习目标
假设检验的基本思想和原理 假设检验的步骤 一个总体参数的检验 两个总体参数的检验 P值的计算与应用 用Excel进行检验
2
正常人的平均体温是37oC吗?
37.1 36.9 36.9 37.1 36.4
在一次试验中小概率事件一旦发生,我们就有理 由拒绝原假设
8
原假设
(null hypothesis)
1. 又称“0假设”,研究者想收集证据予以反对的假 设,用H0表示
2. 所表达的含义总是指参数没有变化或变量之间没 有关系
3. 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它
4. 总是有符号 , 或
原假设为真时拒绝原假设 会产生一系列后果 第一类错误的概率为
❖被称为显著性水平
❖ 2.第二类错误(取伪错误)
原假设为假时接受原假设 第二类错误的概率为(Beta)
12
两类错误的控制
❖ 一般来说,对于一个给定的样本,如果犯第Ι 类错误的代价比犯第Ⅱ类错误的代价相对较 高,则将犯第Ⅰ类错误的概率定得低些较为 合理;反之,如果犯第Ι类错误的代价比犯第 Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错 误的概率定得高些
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
9
备择假设
(alternative hypothesis)
1. 也称“研究假设”,研究者想收集证据予以支持的 假设(期望出现的结论作为备选假设),用H1或Ha表 示
2. 所表达的含义是总体参数发生了变化或变量之间 有某种关系
➢ 我们应该放弃“正常人的平均体温是37oC”这个 共识吗?本章的内容就将提供一套标准统计程序 来检验这样的观点
ch8假设检验课件

2.两个正态总体的参数检验
σ12 =σ22 已知时均值的检验——u检验 σ12 =σ22 =σ2未知时均值的检验——t检验 μ1 ,μ2 未知时方差的检验——
F 检验
单个正态总体均值的检验
设总体 X ~ N ( , 2 ), X 1 , X 2 , X n为样本。 (1) σ2=σ02已知, 关于μ 的检验 —— u检验
思考:
如果例1中检验问题改为“养鸭户送来的鸭子平均重量 是否比“全聚德”要求偏轻?”,如何做出检验?
N ( 0 , 2 ), 0 2.00, 0.20 , 已知 “全聚德” 鸭子重量服从 样本的平均值 x 1.88 ,样本容量 n 100 ,
X N ( , 2 ) , 则 解:设养鸭户送来的鸭子重量 X N ( , 2 n)
2
2方
2 0.202, H 为真时,对于给定 差已知 当 0
的小概率 ,由
P X 0 k | 0
X 0 k P , / n / n
得
k
/ n
z ,
2
即
k
n
z
2
2
不同备择假设形式下的拒绝域示意图
(1)H1:μ≠μ0
u / 2
u / 2
(2)H1:μ>μ0
u
(3)H1:μ<μ0
u
(2) σ2未知, 关于μ 的检验 —— t 检验 ① 提出假设: 0 : 0 , H 1 : 0 H ② 检验统计量
X 0 T ~ t ( n 1) (H 0 真时) S/ n
③ 求临界值。 对水平 ,查 t 分布表求临界值 t ,使
统计学 第8章 假设检验 教学课件ppt

确定适当的检验统计量
什么是检验统计量?
1. 用于假设检验决策的统计量
原假设H0为真 点估计量的抽样分布 (样本均值、样本方差)
比较 3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
利用 P 值 进行决策
什么是P 值?
(P-value)
P值告诉我们: 如果原假设是正确的话,我们得到得到样本观察 结果或更极端结果出现的可能性有多大,如果这 个可能性很小,就应该拒绝原假设
因此,如果在一次抽样中竟然出现了满足
X 0 / n
ห้องสมุดไป่ตู้
的 u /2
X
那么我们就有理由怀疑原假设H0的正确性了,因此会拒
绝H0 。
由于 | U |
X 0 / n
u 2
是一个小概率事件.
故我们可以取拒绝域为:
W: | U | u 2
如果由样本值算得该统计量的实测值落入区域 W,则拒绝H0 ;否则,不能拒绝H0 .
1、生产已不正常
2、生产正常:但属于小概率事件,一次抽样中几乎 不可能发生
因此:在原假设成立(生产正常)的情况下, 若发生小概率事件,则我们有充分的理由怀 疑原假设已不成立。
因此若H0为真,即 0 时,
X
0
/ n
u /2
是一个小概率事件:1%、5%、10%
而小概率事件在一次试验中基本上不应该发生 。
第8章-假设检验全解PPT课件

临界点为: u 及 u
2
2
.
12
3. 两类错误
拒绝H0要承担一定的风险,有可能将正确的假设 误认为是错误的,在统计中称这种“以真为假”的错 误为第一类错误(弃真),犯第一类错误的概率显然是 显著水平α;
不拒绝H0同样要承担风险,这时,可能将错误的 假设误认为是正确的,这种“以假为真”的错误称 为第二类错误(取伪), 犯第二类错误的概率是:
.
3
第一节 假设检验的基本原理与方法 一、假设检验的基本原理 二、假设检验的相关概念 三、假设检验的一般步骤 四、小结
.
4
一、假设检验的基本原理
假设检验问题是统计推断的另一类重要问题.
在总体的分布函数完全未知或只知其形式、但 不知其参数的情况下, 为了推断总体的某些性质, 提出某些关于总体的假设.
对于给定的检验水平
01 由P
U
u
2
得拒绝域为 W {u u }
2
这种利用U统计量来检验的方法称为U检验法.
.
17
(2)检验假设 H 0:0,H 1:0
选择统 U计 X/n量 ~N(0,1)
当H0成立时,P( X u0
/ n
u )
P(Xuuu0
/ n
u)
P(X/unu0/unu)P(X/un u)
第八章
假设检验
第一节 参数假设检验的问题与方法
第二节 第三节
单总体参数的检验 两总体参数检验
第四节 非参数检验
.
1
[本章要求]
1. 理解假设检验的基本思想; 2. 熟练掌握假设检验的基本步骤; 3. 熟练掌握单个正态总体均值与方差的假设检验方法; 4. 掌握双正态总体均值差与方差比的假设检验方法.
第八章 假设检验2PPT课件

(1)待检验假设可设为
H0 : 0 21; H1 : 0 21
10
(2)检验统计量取为
(3)拒绝域为
Z X 0 0 nWLeabharlann {(x1,
...,
xn
)
:
x
0 /
0
n
z }
这n里 3,0 0.0,1
11
查表得,z=2.33, 由样本值计算
x
0
0
/ 30
2.55
2.33
z
落入拒绝域 (4)判断:拒绝原假设H0 . 认为新生产织物比过去的织物强力 有提高.
§2 正态总体均值的假设检验
一 单 个 总 体 N (,2 ) 均 值 的 检 验
设总体X~N (, 2 ),X1,X2,…,Xn为来自总
体X的样本.
12 = 0 2 已 知 , 关 于 均 值 的 检 验 ( Z 检 验 )
H 0:0 , H 1:0
1
构造检验统计量
Z X 0 0 n
W{(x1,x2, ,xn):|t||xs/n0|c}
H0为真时
t X 0 t(n1)
S/ n
14
按照控制第一类错误的原则,有
H0成立时
P
X 0
c
S/ n
由此 ct/2(n1)
拒绝域为 W {(x1,x2, ,xn):|t||x s/ n 0|t/2(n 1 )}
查表t/2(n-1) 计算 | x 0 |
正态分布 N(, 0.0152). 按规定袋装糖果的
重量的均值应为0.5(克).一批袋装糖果出 厂前进行抽样检查,抽查了9袋,重量分别 为, 0.497 0.506 0.518 0.524 0.498
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
©福建师范大学 福清分校
数学与计算机科学系,2006
23
现考虑两个正态总体均值差的t检验. 若两个正态总体N(m1,12), N(m2,22)中 12=22=2而2未知. 在均值差m1-m2的检验问 题H0:m1-m2=0, H1:m1-m20(或H0:m1-m20, H1:m1-m2>0或H0:m1-m20,H1:m1-m2<0)的t检验 法中, 当分别自两个总体取得的相互独立的样 本其容量n1=n2=n时, 给定a,b以及d=|m1-m2|/ 的值后可以查附表8得到所需样本容量, 使当 |m1-m2|/d时犯第II类错误的概率小于或等于 b.
©福建师范大学 福清分校
数学与计算机科学系,2006
22
在实际过程中经常是未知, 则先做n1次试验, 计算出样本方差S2作为2的估计, 然后根据此 估计值和给定的a,b,|m1-m2|的值查表获得一个 容量数n2, 如果n2小于n1, 则用已经获得的数据 进行检验就足够了, 而如果n2大于n1, 则再补 做n2-n1次试验, 获得的n2个样本的样本方差作 为2的估计, 再去查表获得正确的样本容量n3, 这样重复下去很快就能够找到所求的样本容 量n.
©福建师范大学 福清分校 数学与计算机科学系,2006
20
例2 考虑在显著性水平a=0.05下进行t检验: H0:m68, H1:m>68. (1) 要求在H1中mm1=68+时犯第II类错误的 概率不能超过b=0.05. 求所需的样本容量. (2) 若样本容量为n=30, 问在H1中 m=m1=68+0.75时犯第II类错误的概率是多 少? 解 (1)此处a=b=0.05, m0=68, d=(m1-m0)/=1, 查附表7得n=13. (2) 现在a=0.05, n=30, d=(m1-m0)/=0.75, 查 附表7, 得b=0.01.
©福建师范大学 福清分校
数学与计算机科学系,2006
15
解 检验问题可表达为H0:mm0, H1:m>m0, 拒绝 域为
按(5.3)式得
按给定的数据算得n24.35, 故取n=25. 且算出 当`x129.87时, 买方就拒绝这批产品, 而当`x <129.87时, 买方接受这批产品.
©福建师范大学 福清分校 数学与计算机科学系,2006
©福建师范大学 福清分校 数学与计算机科学系,2006
24
例4 比较两种汽车用燃料的辛烷值, 得数据:
燃料A 81 84 79 76 82 83 84 80 79 82 81 79
燃料B 76 74 78 79 80 79 82 76 81 79 82 78
燃料的辛烷值越高, 燃料的质量越好. 因燃料 B较燃料A价格便宜, 因此, 如果两者辛烷值相 同时, 则使用燃料B. 但若含量的均值差m1-m2 5则使用燃料A. 设两总体的分布可认为是正 态的, 而两个样本相互独立. 问应采用哪种燃 料(取a=0.01, b=0.01)?
©福建师范大学 福清分校 数学与计算机科学系,2006
30
先设H0中所假设的X的分布函数F(x)不含未知 参数. 将在H0下, X可能值的全体W分成k个两 两不相交的子集A1,A2,...,Ak.以fi(i=1,2,...,k)记样 本观察值x1,x2,...,xn中落在Ai中的个数, 这表示 在n次试验中事件Ai发生的频率为fi/n, 另一方 面, 当H0为真时, 我们可以根据H0所假设的X 的分布函数来计算事件Ai的概率, 得到 pi=P(Ai), i=1,2,...,k. 频率fi/n与概率pi会有差异, 但一般来说, 若H0为真, 且试验的次数又甚多 时, 这种差异不应太大, 因此(fi/n-pi)2不应太大.
©福建师范大学 福清分校
数学与计算机科学系,2006
4
定义 若C是参数q的某检验问题的一个检验 法, b(q)=Pq{接受H0} (5.1) 称为检验法C的施行特征函数或OC函数, 其图 形称为OC曲线.
©福建师范大学 福清分校
数学与计算机科学系,2006
5
(5.1) 由定义知, 若此检验法的显著性水平为a, 则 当真值qH0时, b(q)就是作出正确判断(即H0 为真时接受H0)的概率, 故此时b(q)1-a; 而当 qH1时, 则b(q)就是犯第II类错误的概率, 而 1-b(q)是作出正确判断(即H0为不真时拒绝H0) 的概率. 函数1-b(q)称为检验法C的功效函数. 当q*H1时, 值1-b(q*)称为检验法C在点q*的 功效, 它表示当参数q的真值为q*时, 检验法C 作出正确判断的概率. 我们只介绍正态总体均值检验的OC函数.
概率论与数理统计
第13讲(下)
福建师范大学福清分校数计系
©福建师范大学 福清分校 数学与计算机科学系,2006
1
第八章 假设检验
©福建师范大学 福清分校
数学与计算机科学系,2006
2
§5 样本容量的选取
©福建师范大学 福清分校
数学与计算机科学系,2006
3
以上我们在进行假设检验时, 总是根据问题的 要求, 预先给出显著性水平以控制犯第I类错 误的概率. 而犯第II类错误的概率则依赖于样 本的容量的选择. 在一些实际问题中, 我们除 了希望控制犯第I类错误的概率外, 往往还希 望控制犯第II类错误的概率. 在这一节, 我们 将阐明如何选取样本的容量使得犯第II类错 误的概率控制在预先给定的限度之内. 为此, 我们引入施行特征函数.
©福建师范大学 福清分校
数学与计算机科学系,2006
U 检验法中
右边检验 左边检验 双边检验 其 中
b
的计算公式
b ( za - )
b ( za )
b ( z a - ) ( z a ) - 1
2 2
m - m0
n
18
©福建师范大学 福清分校
©福建师范大学 福清分校 数学与计算机科学系,2006
6
b(q)=Pq{接受H0}
1, Z检验法的OC函数 右边检验问题. H0:mm0, H1:m>m0的OC函数是
X - m0 b (m ) Pm (接受H 0 ) Pm { za } / n
m - m0 X -m Pm { za } ( za - ) / n / n m - m0 (5.2) / n
©福建师范大学 福清分校 数学与计算机科学系,2006
25
解 按题意需要在显著性水平a=0.01下检验假 设 H0:mA-mB0, H1:mA-mB>0, 并要求在mA-mB 5时, 犯第II类错误的概率不超过b=0.01. 所取的样本容量为nA=nB=12, 且有`xA=80.83, `xB=78.67, s2A=5.61, s2B=6.06. 经水平为0.1的F 检验知, 可认为两总体的方差相等, 即有
数学与计算机科学系,2006
2, t检验法的OC函数 右边检验问题H0:mm0, H1:m>m0的t检验法的 OC函数是
其中变量
称它服从非中心参数为,自由度为n-1的非中 心t分布.
©福建师范大学 福清分校 数学与计算机科学系,2006
19
若给定a,b以及d>0, 可从书末附表7查得所需 容量n, 使得当mH1且(m-m0)/d时犯第II类 错误的概率不超过b. 若给定a,b及d>0,对于左边检验问题H0:mm0, H1:m<m0的t检验法, 也可从附表7查得所需容 量n, 使得当mH1且(m-m0)/-d时犯第II类错 误的概率不超过b. 对于双边检验问题 H0:m=m0,H1:mm0的t检验法也可从附表7查得 所需容量n, 使得当mH1,且|m-m0|/d时所犯 第II类错误的概率不超过b.
©福建师范大学 福清分校 数学与计算机科学系,2006
21
例3 考虑在显著性水平a=0.05下进行t检验 H0:m=14, H1:m14. 要求在H1中|m-14|/0.4时犯第II类错误的概 率不超过b=0.1, 求所需样本容量. 解 此处a=0.05, b=0.1, d=0.4, 查表得n=68.
©福建师范大学 福清分校
数学与计算机科学系,2006
29
(一)c2拟合检验法 这是在总体未知时, 根据 样本X1,X2,...,Xn来检验关于总体分布的假设 H0:总体X的分布函数为F(x), H1:总体X的分布函数不是F(x), (6.1) 的一种方法.
注意, 若总体X为离散型则(6.1)中的H0相当于 H0:总体X的分布律为P(X=ti)=pi,i=1,2,.... (6.2) 若总体X为连续型, 则(6.1)中的H0相当于 H0:总体X的概率密度为f(x). (6.3)
©福建师范大学 福清分校 数学与计算机科学系,2006
10
d
(5.3)
类似地, 可得左边检验问题H0:mm0, H1:m<m0 的OC函数为
当真值mm0时b(m)为作出正确判断的概率; 当 真值m<m0时, 给出犯第II类错误的概率. 只要 样本容量n满足
m - m0 b (m ) ( za ), / n
©福建师范大学 福清分校 数学与计算机科学系,2006
9
当mm0+d时有 b(m0+d)b(m).
于是只要 b(m0 +d )=( za - nd / ) b
亦即只要n满足 za - nd / - zb
或者说只要
即可
n
( za zb )
则当mH1且mm0+d时, 即真值(mm0+d)时犯 第II类错误的概率不超过b.
©福建师范大学 福清分校
数学与计算机科学系,2006
26
而右边检验的拒绝域为
由样本观察值算得t=2.19<2.5083, 故接受H0, 即采用B种燃料.