应用统计学第8章--参数假设检验举例
第8 假设检验(共80张PPT)

8.1 8.2 8.3 8.4
假设检验的根本问题 一个总体参数的检验 两个总体参数的检验 假设检验中的其他问题
我认为该企业生产的零件的平
均长度为4厘米!
什么是假设? 对总体 参数的一种看法
总体参数包括总 体均值、比例、方 差等
举例说明假设检验的根本思路
某单位职工上月平均收入为210元,这个 月的情况与上月没有大的变化,我们设想平均 收入还是210元.
样本均值的抽样分布
置信水平
拒绝域
1-
接受域
临界值
H0
样本统计量
如果备择假设具有符号“>〞,拒绝域位于抽样分 布的右侧,故称为右侧检验
样本均值的抽样分布
置信水平
1- 接受域
拒绝域
H0
样本统计量
临界值
请判断它们的拒绝域:
〔1〕假设检验的假设为H0:m=m0 ,H1: m≠m0,那么拒绝域为〔 〕。
〔2〕假设检验的假设为H0:m≥m0 ,H1: m < m0,那么拒绝域为〔 〕。
〔3〕假设检验的假设为H0:m≤m0 ,H1: m > m0,那么拒绝域为〔 〕。
检验统计量:Z > Z;
Z > Z/2 或Z <-Z/2 ;
Z <-Z
决策规那么
给定显著性水平 ,查表得出相应的临界 值 将检验统计量的值与 水平下的临界值进 行比较 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 得出拒绝或不拒绝原假设的结论
H0:m=10 H1:m≠10
例 6.2
某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设。
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
参数估计和假设检验案例

参数估计和假设检验案例案例一:工艺流程的检测某公司是一家为客户提供抽样和统计程序方面建议的咨询公司,这些建议可以用来监控客户的制造工艺流程。
在一个应用项目中,一名客户向该公司提供了一个样本,该样本由工艺流程正常运行时的800个观测值组成。
这些数据的样本标准差为0.21;因为有如此多的样本数据,因此,总体标准差被假设为0.21。
然后,该公司建议:持续不断地定期抽取容量为30的随机样本以对工艺流程进行检测。
通过对这些新样本的分析,客户可以迅速知道,工艺流程的运行状况是否令人满意。
当工艺流程的运行状况不能令人满意时,可以采取纠正措施来解决这个问题。
设计规格要求工艺流程的均值为12,该公司建议采用如下形式的假设检验。
μ=μ≠H0 :12 H1 :12只要H0被拒绝,就应采取纠正措施。
下表为第一天运行新的工艺流程的统计控制程序时,每隔一小时收集的样本数据。
问题:1、对每个样本在0.01的显著性水平下进行假设检验,并且确定,如果需要Z0.005=2.582、4、讨论将显著性水平改变为一个更大的值时的影响?如果增加显著性水平,哪种错误或误差将增加?显著性水平增加,置信区间减小,误差减小。
案例二:计算机辅助教学会使完成课程的时间差异缩小吗?某课程引导性教程采用一种个性化教学系统,每位学生观看教学录像,然后给以程式化的教材。
每位学生独立学习直至完成训练并通过考试。
人们关心的问题是学生完成训练计划的进度不同。
有些学生能够相当快地完成程式化教材,而另一些学生在教材上需要花费较长的时间,甚至需要加班加点才能完成课程。
学的较快的学生必须等待学得较慢的学生完成引导性课程才能一起进行其他方面的训练。
建议的替代系统是使用计算机辅助教学。
在这种方法中,所有的学生观看同样的讲座录像,然后每位学生被指派到一个计算机终端来接受进一步的训练。
在整个教程的自我训练过程中,由计算机指导学生独立操作。
为了比较建议的和当前的教学方法,刚入学的122名学生被随机地安排到这两种教学系统中。
应用统计学课件第8章假设检验

5.单尾检验中的接受域和拒绝域
左尾检验 H0 : 0 右尾检验 H0 : 0
6、假设检验决策规则
1)根据显著性水平 查表取得临界值 给定显著性水平 ,查表得出相应的临界值Za (单 尾检验)或Za/2 (双尾检验),根据总体分布情况、样本 容量大小等也会用到ta (单尾检验)或 ta/2(双尾检验)
如果能够得出与原假设相违背的结论,则拒绝原假设( 接受备择假设),否则不能拒绝原假设。
例8.2、 在企业持续生产的生产线上,质量控制人 员定期对某个金属零件的孔径进行检查,以确定金属 零件的孔径是否为3.0厘米。如果孔径大于或小于3.0厘 米均表示生产线失去控制,试表述在这一检验过程中, 检验人员的原假设和备择假设。
假设检验(原假设H0)
裁决结 实际情况 决策结果
果 无罪 有罪
实际情况 H0为真 H0为假
无罪 正确 错误 未拒绝
正确决策 第Ⅱ类错
(1-a)
误(β)
有罪 错误 正确 拒绝
第Ⅰ类错 正确决策
误(a)
(1-β)
4、p-值(p-value)
在例8.1中,由于|Z|=4.58>Z0.025=1.96拒绝原假设, 此时犯第一类错误的概率不超过5%,但是到底真实犯 第一类错的概率是多少呢?
解: 首先,假设新生儿体重为4.0公斤(原假设H0),如果 这一说法不正确,则新生儿体重不等于4.0公斤(备择假设 H1) 第一步:构造原假设和备择假设
H0 : 4.0, H1 : 4.0 第二步:构造样本统计量
Z x ~ N (0,1) / n
第三步,根据抽样所得样本数据计算样本统计量数值
2)比较,观察统计量值落入拒绝域还是非拒绝域 将检验统计量的值与 水平的临界值进行比较 , 作出决策(注意单尾检验临界值的正负号)。 双侧检验:|统计量| > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
统计学贾俊平第8章 假设检验

两者都可以被选为null hypothesis
18
All rights reserved
假设的陈述
若FDA 选择以下的方式: H0:新药对于大众没有益处不应该上市 H1:新药对于大众有益处 此时药厂必须举证推翻H0,否则FDA不会核准 新药上市 由于这种假设方式,美国的新药上市过程十 分冗长,但好处为有害药物要上市十分困难
建立的原假设与备择假设应为
H0: 1000
H1: 1000
27
All rights reserved
双侧检验和单侧检验
假设
H0 H1
研究的问题
双侧检验 左侧检验 右侧检验
= 0
0
0
≠0
< 0
> 0
28
All rights reserved
H1: 1500
25
All rights reserved
双侧检验和单侧检验
一项研究表明,改进生产工艺后,会使产品的废 品率降低到2%以下。检验这一结论是否成立
研究者总是想证明自己的研究结论(废品率降 低)是正确的
备择假设的方向为“<”(废品率降低)
建立的原假设与备择假设应为
H0: 2%
13
All rights reserved
假设的陈述
备择假设 (alternative hypothesis)
与原假设对立的假设,也称“研究假设” 这与原假设为互斥 研究者想收集证据予以支持的假设。总是 有不等号: , 或 表示为 H1
例如,H1: < 某特定值 如 H1: < 3.5
4
All rights reserved
假设检验例题和习题

(第二版) (原假设与备择假设旳拟定)
1. 属于决策中旳假设检验
2. 不论是拒绝H0还是不拒绝H0,都必需采用 相应旳行动措施
3. 例如,某种零件旳尺寸,要求其平均长度为 10cm,不小于或不不小于10cm均属于不合 格
我们想要证明(检验)不小于或不不小于这两种 可能性中旳任何一种是否成立
4. 建立旳原假设与备择假设应为
H0: = 5
H1: 5
= 0.05
df = 10 - 1 = 9 临界值(s):
拒绝 H0
拒绝 H0
.025
.025
-2.262 0 2.262 t
8 - 20
检验统计量:
t = x 0 = 5.3 5 = 3.16
s n 0.6 10
决策:
在 = 0.05旳水平上拒绝H0
结论:
阐明该机器旳性能不好
符?( = 0.05)
统计学
(第二版)
均值旳单尾 t 检验
(计算成果)
H0: 40000 H1: < 40000 = 0.05 df = 20 - 1 = 19 临界值(s):
拒绝域
.05
-1.7291 0
t
8 - 23
检验统计量:
t = x 0
sn
= 41000 40000 = 0.894 5000 20
8 - 12
双侧检验
统计学
(第二版)
H0: = 0.081
H1: 0.081
= 0.05
n = 200
临界值(s):
拒绝 H0
拒绝 H0
.025
.025
-1.96 0 1.96 Z
8 - 13
检验统计量:
统计学-第八章 假设检验

假设 原假设
双侧检验
单侧检验
左侧检验 右侧检验
H0 : m =m0 H0 : m m0 H0 : m m0
备择假设 H1 : m ≠m0 H1 : m <m0 H1 : m >m0
三、假设检验的程序---
4.例题分析
[例8.1] 某品牌洗衣粉在它的产品说明书中声称:平 均净含量不少于1250克。从消费者的利益出发,有关研 究人员要通过抽检其中的一批产品来验证该产品制造商 的说明是否属实。试写出用于检验的原假设与备择假设。
2.接受域:概率P>的区域,为大概率区域,称之 为原假设的接受区域。
3.拒绝域:概率P≤的区域,为小概率区域,称之 为原假设的拒绝区域。
三、假设检验的程序---
1.拒绝原假设H1 原则:临界值
2.接受原假设H0 原则:临界值
检验统计值的绝 对值大于临界值;
检验统计值的绝 对值小于临界值;
假设 H0为真实 H0为不真实
接受H0 判断正确
采伪错误()
拒绝H0 弃真错误()
判断正确
四、假设检验中的两类错误
第I类()错误和第II类()错误的关系
和的关系就像 翘翘板,小就 大, 大就小。
你要同时减少两类 错误的惟一办法是 增加样本容量!
关乎决策:三个与其
与其,人为地把显著性水平固定按某一水平上,不 如干脆选取检验统计量的P值;
第二节 一个正态总体的假设检验
二、均值m的假设检验
3.给出显著性水平(0.01、0.05或0.1)
4.确定接受域和拒绝域(以双侧检验为例)
2已知:当Z Z 2
,则拒绝原假设,反之则接受H0;
贾俊平版统计学课件 第8章

▽与原假设对立的假设称备择假设,记为 H1 ,用 、 或 表示。 对于新生儿体重的例子,可以表示为
H 0 : 3190
H1 : 3190
(2)确定检验统计量及其分布
▽用于检验假设的统计量称为检验统计量
▽根据 H 0 及相应条件选择适当的统计量,并确定统计量
的分布 对于新生儿体重的例子,可利用 x 0 构造检验统计量. 若新生儿体重为正态分布 N ( , 2 ) ,且 已知,则在 H 0 为真 时,用 z 作为检验统计量,并且
H 0 : 3190 H1 : 3190
并已知 x 3210, 80, n 100 ,则
z0 x 0
n
3210 3190 80 100
2.5
于是
p 2Pz z0 2 0.00621 0.01242
双侧检验的P值
/ 2
/ 2 拒绝
▽犯第二类错误的概率为 。
表8-1 假设检验中各种可能结果的概率
实际情况
H 0 为真 H 0 不真
决策
接受 H 0
1
拒绝 H 0
1
假设检验中的两类错误(决策结果)
H0: 无罪
假设检验就好像一场审判过程 统计检验过程
陪审团审判
实际情况 裁决 无罪 无罪 有罪 正确 错误 有罪 错误 正确 接受H0 拒绝H0 决策
若p-值 /2, 不能拒绝 H0 若p-值 < /2, 拒绝 H0
8.1.6 假设检验的形式
研究的问题 假设
双侧检验
H0 H1
左侧检验
右侧检验
= 0 ≠0
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可用 Excel 的统计函数 FINV 返回 F(n1,n2)。 语法规则如下: 格式:FINV( , n1, n2 ) 功能: 返回 F ( n1, n2 )的值。
20
2. 两总体方差的检验 ( F 检验 )
原假设为 H0:12=22。 当 H0为真时, 统计量
S12 F 2 ~ F ( n1-1, n2-1 ) S2
13
案例 1 解答
(1)设服用甲、乙两种安眠药的延长睡眠时间分别为 X1, X2, X1~N( 1, 2),X2~N( 2, 2), n1 = n2 =10。 由试验方法知 X1, X2 独立。 H0:1=2,H1:1≠2 由表中所给数据,可求得:
x1 2.33, S12=2.0022, x2 0.75, S22=1.7892
F ~ F ( n1, n2 )
n1 为第一(分子的)自由度,
n2 为第二(分母的)自由度。
17
F 分布密度函数的图形
f ( x) n1=20, n2=100
n1=20, n2=25
n1=20, n2=10
0
x
18
F 分布的右侧 分位点 F ( n1, n2 )
F 分布的右侧 分位点为满足 P{ F > F ( n1, n2 ) } = 的数值 F (n1, n2)。
t t
从而,若 “P(T<=t)单尾”或“P(T<=t)双尾”>0.05,则结果为不显著; “P(T<=t)单尾”或“P(T<=t)双尾”<0.05,则一般显著; “P(T<=t)单尾”或“P(T<=t)双尾”<0.01,则高度显著; “P(T<=t)单尾”或“P(T<=t)双尾”<0.001,则极高度显著。 本例中:∵ “P(T<=t)单尾”= 0.2387 >0.05; “P(T<=t)双尾”= 0.4773 >0.05, 故无论单边还是双边检验结果都不显著。 11
9
用 Excel 检验两总体均值
可用 Excel 的【工具】→“数据分析”→“ t检验:双 样本等方差假设”,检验 12=22= 2,但 2未知时 两个总体的均值。 在Excel 的输出结果中: “P(T<=t)单尾”—单边检验达到的临界显著性水平; “P(T<=t)双尾”—双边检验达到的临界显著性水平。 “P(T<=t)单尾”和“P(T<=t)双尾”统称为“ 乙两种安眠药的效果,某医院将20个失 眠病人分成两组,每组10人,两组病人分别服用甲、 乙两种安眠药作对比试验。试验结果如下: 两种安眠药延长睡眠时间对比试验(小时)
病人 安眠药
1 1.9
2 0.8
3 1.1
4
5
6
7
8
9
10
甲 乙
0.1 –0.1 4.4 5.5 1.6 4.6 3.4
| x1 x2 | | 1556 1733| | t | 0.74 S w 1 / n1 1 / n2 395 1 / 5 1 / 6
∵ | t | = 0.74 < t/2 (n1+n2-2) = t0.025(9) = 2.2622
故两种轿车的平均首次故障里程间无显著差异,
§8.3 成对样本试验— 案例 1 (2)解答
由于此时 X1, X2 为同一组病人分别服用两种安眠 药的疗效, 因此 X1, X2 不独立,属于成对样本试验。 对于这类“成对样本试验”的均值检验,应当化 为单个正态总体的均值检验。方法如下:
设 X=X1-X2 (服用甲、乙两种安眠药延长睡眠时 间之差), 则 X~N ( , 2 )。 H0: = 0, H1:≠0
2 2
2 12 2 2 12 2
【例2】在 =0.20下,检验【案例3】中两个正 态总体的方差是否存在显著差异。
解:由题意,H0:12=22,H1:12≠22,n1=5,n2=6 由例5的计算结果,S12=269.62,S22=471.92
S12 269.62 F 2 2 = 0.326 471.9 S2
f ( x)
0
F( n1, n2 )
x
F (n1, n2)有以下性质: F1- (n1, n2)=1/F(n2, n1) 利用上式可求得 F 分布表中未给出的 值的百分 位点。 如 F0.95(10, 15) = 1/F0.05(15, 10)
19
用 Excel 求 F( n1, n2 )
由表中所给数据,可求得 x 1.58, S =1.23,n =10
1.58 0 = 4.0621 > t 0.005(9) = 3.2498 | t | 1.23/ 10
故两种安眠药疗效间的差异是高度显著的!
15
用 Excel 求解
可用 Excel 的【工具】→“数据分析”→“ t检验: 平均值的成对二样本分析”
7
解: 12 = 22 = 2 未知, n1= 5,n2= 6, H0:1= 2
⑴双边检验问题 H1:1≠2。由所给数据,可求得 x1 1556 , x2 1733, S12=269.62, S22=471.92
2 2 2 (n1 1) S 1 (n2 1) S 2 4 269 . 6 5 471 . 9 2 395 Sw n1 n2 2 9
完全类似地,可以得到如下检验方法:
统计量 备择假设 拒绝域
F F / 2 (n1 1, n2 1) 或 F F1 / 2 (n1 1, n2 1) F F (n1 1, n2 1) F F1 (n1 1, n2 1)
21
S F S
2 1 2 2
2 1
完全类似地,可以得到如下检验方法:
统计量
t Sw X1 X 2 1 / n1 1 / n2
备择假设
1 2 1 2 1 2
| t | t / 2 (n1 n2 2) t t (n1 n2 2) t t (n1 n2 2)
9 2.0022 9 1.7892 1.8985 Sw 18 2.33 0.75 | t | 1.8609 t0.025 (18) 2.1009
1.8985 1 / 10 1 / 10
故不能拒绝H0,两种安眠药的疗效间无显著差异。 用Excel 求解本案例
14
F/2(n1-1, n2-1) = F0.1(4, 5) = 3.52 F1-/2(n1-1, n2-1) = F1-0.1(4, 5) =1/F0.1(5, 4) =1/4.05 = 0.247 ∵ F1-0.1(4, 5) = 0.247 < F = 0.326 < F0.1(4, 5) = 3.52 故在水平 = 0.20下, 12 与 22 间无显著差异。 可知案例4 中关于 12 = 22 的假定是合理的。
2
§8.1 案例介绍
【案例1】新工艺是否有效?
某厂生产的一种钢丝的平均抗拉强度为 10560 (kg/cm2)。 现采用新工艺生产了一种新钢丝,随机抽取 10 根, 测得抗拉强度为: 10512, 10623, 10668, 10554, 10776 10707, 10557, 10581, 10666, 10670 求得新钢丝的平均抗拉强度为 10631.4(kg/cm2)。 是否就可以作出新钢丝的平均抗拉强度高于原钢丝, 即新工艺有效的结论?
病人 安眠药 甲 乙 1 2 3 4 5 6 7 8 9 10 1.9 0.8 1.1 0.1 –0.1 4.4 5.5 1.6 4.6 3.4 0.7 –1.6 –0.2 –1.2 –0.1 3.4 3.7 0.8 0.0 2.0
(1)两种安眠药的疗效有无显著差异? (2)如果将试验方法改为对同一组10个病人,每人分别 服用甲、乙两种安眠药作对比试验,试验结果仍如 上表,此时两种安眠药的疗效间有无差异?
思考题:本例中为什么要将 取得较大?
22
用 Excel 求解
可用 Excel 的【工具】→“数据分析”→ “F检验: 双样本方差” 检验两个正态总体是否是同方差的。 在 Excel 的输出结果中 “P(F<=f)单尾”与“P(T<=t)单尾”的含义是相同 的,即 p 值。 ∵本例中“P(F<=f)单尾”的值为 0.1503, 故其双边检验所达到的显著性水平为 2×0.1503 = 0.3006 > 0.20 故在在水平 = 0.20下,12 与 22 间无显著差异。
进行成对样本试验的均值检验。
∵本例中“P(T<=t)双尾”= 0.0028 < 0.01, 故两种安眠药的疗效间存在高度显著差异。
16
§8.4 两个正态总体方差的检验
1. F 分布
则随机变量 Y~ 2(n2), 且 X 和 Y 相互独立, 设 X~ 2(n1),
X/n1 F Y/n2
服从自由度为( n1, n2 )的 F 分布,记为
f (t)
“P(T<=t)单尾”的值(概率) 0
由图可知:P(T<=t)双尾 = 2×P(T<=t)单尾
10
t (统计量)
“P(T<=t)单尾”与“P(T<=t)双尾”的使用
“P(T<=t)单尾” 由图可知: t > t 等价于“P(T<=t)单尾”< t > t/2 等价于“P(T<=t)双尾”<
2. 12≠22 且未知
此时,可用 Excel 的【工具】→“数据分析”→ “ t 检验:双样本异方差假设” 检验 12≠22且都未知时两个正态总体的均值。
12
【案例1】哪种安眠药的疗效好?
为分析甲、乙两种安眠药的效果,某医院将20个失 眠病人分成两组,每组10人,两组病人分别服用甲、 乙两种安眠药作对比试验。试验结果如下: 两种安眠药延长睡眠时间对比试验(小时)