数理统计第八章 假设检验重点
第8 假设检验(共80张PPT)

8.1 8.2 8.3 8.4
假设检验的根本问题 一个总体参数的检验 两个总体参数的检验 假设检验中的其他问题
我认为该企业生产的零件的平
均长度为4厘米!
什么是假设? 对总体 参数的一种看法
总体参数包括总 体均值、比例、方 差等
举例说明假设检验的根本思路
某单位职工上月平均收入为210元,这个 月的情况与上月没有大的变化,我们设想平均 收入还是210元.
样本均值的抽样分布
置信水平
拒绝域
1-
接受域
临界值
H0
样本统计量
如果备择假设具有符号“>〞,拒绝域位于抽样分 布的右侧,故称为右侧检验
样本均值的抽样分布
置信水平
1- 接受域
拒绝域
H0
样本统计量
临界值
请判断它们的拒绝域:
〔1〕假设检验的假设为H0:m=m0 ,H1: m≠m0,那么拒绝域为〔 〕。
〔2〕假设检验的假设为H0:m≥m0 ,H1: m < m0,那么拒绝域为〔 〕。
〔3〕假设检验的假设为H0:m≤m0 ,H1: m > m0,那么拒绝域为〔 〕。
检验统计量:Z > Z;
Z > Z/2 或Z <-Z/2 ;
Z <-Z
决策规那么
给定显著性水平 ,查表得出相应的临界 值 将检验统计量的值与 水平下的临界值进 行比较 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 得出拒绝或不拒绝原假设的结论
H0:m=10 H1:m≠10
例 6.2
某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设。
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论与数理统计-假设检验

14
若
取伪的概率较大.
15
/2
0.12 0.1
0.08 0.06 0.04 0.02
/2 H0 真
60 62.5 65 67.5 70 72.5 75
0.12 0.1
0.08 0.06 0.04 0.02
H0 不真
67.5 70 72.5 75 77.5 80 82.5
16
现增大样本容量,取n = 64, = 66,则
41
两个正态总体
设 X ~ N ( 1 1 2 ), Y ~ N ( 2 2 2 )
两样本 X , Y 相互独立, 样本 (X1, X2 ,…, Xn ), ( Y1, Y2 ,…, Ym ) 样本值 ( x1, x2 ,…, xn ), ( y1, y2 ,…, ym )
显著性水平
42
(1) 关于均值差 1 – 2 的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布拒绝域 Nhomakorabea1 – 2 = 1 – 2
1 – 2 1 – 2 <
1 – 2 1 – 2 > ( 12,22 已知)
43
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
1 – 2 = 1 – 2
拒绝域
1 – 2 1 – 2 <
1 – 2 1 – 2 >
12, 22未知
12
=
2 2
其中
44
(2)
关于方差比
2 1
/
2 2
的检验
原假设 备择假设 检验统计量及其在
H0
H1
H0为真时的分布
概率论与数理统计--第八章 假设检验(8.1--8.3)

假设检验中的两类错误 <决策结果>
H0: 无罪
假设检验就好像一场审判过程
陪审团审判
H0 检验
裁决 无罪
实际情况
无罪
有罪
正确
错误
决策
实际情况 H0为真 H0为假
未拒绝H0
正确决策
第Ⅱ类错
误( )
有罪
错误
正确
拒绝H0
第Ⅰ类错
误( )
正确决策
说明 当样本容量 n 一定时, 若减少犯第一类错误
如在前面实例中给定显著性水平的样本是来自总体为已知设总体左边检验的拒绝域为右边检验的拒绝域为提出原假设根据实际问题的要求cm25cm40取显著水平烧率有显著的提高以往生产的推进器的燃推进器的燃烧率是否较问用新方法生产的法下总体均方差仍为设在新方得燃烧率的样本均值为从正态分布推进器的燃烧率服某工厂生产的固体燃料下拒绝故在显著性水平根据题意需要检验假设40假设检验的基本原理相关概念和一般步骤
利用t检验法检验具有相同方差的两正态总 体均值差的假设.
设X1,X2,,Xn为来自正态N总 (1体 ,2) 的样,本 Y1,Y2,,Yn为来自正态N总 (2体 ,2)的
样本 ,且设两样本. 独 注意 立两总体的方. 差相
又设 X,Y分别是总体,的 S12,样 S22是 本样 均本 值
方,差 1,2,2均为,未知
检验问题的拒绝域为
x 0 n
z 2
n15, x1.04,80.0,5 z0.0251.96,
x0 10.4810.50.5161.96 n 0.15 15
故接受 H0,认为该机工作 . 正常
2 .2 为,未 关 的 知 于(检 t检 )验 验
概率论与数理统计第八章假设检验

为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
《概率论与数理统计》第八章1假设检验的基本概念

2. 从某批矿砂中,抽取10样本,检验这批砂矿的含 铁量是否为3%?
双侧检验 H0 : 0 3%, H1 : 3%
3.某学校学生英语平均分65分, 先抽取某个班的平均 分,看该成绩是否显著高于全校整体水平?
单侧检验 H0 : 0 65, H1 : 65
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?
分析 以 和 分别表示这一天袋装糖的净重
总体X 的均值和标准差,
由长期实践表明标准差比较稳定, 我们就设
0.015,于是 X ~ N(, 0.0152 ),这里 未知. 问题 问题是根据样本值判断 0.5 还是 0.5 .
所
以,原假
设H
不正确
0
。
对于这两种解释,哪种解释比较合理呢?
我们需要判断以上两种假设谁对谁错,并给出判断的理由
以上例子属于参数检验(parametric test) 的问题,(如针对总体均值,总体方差等参数的假 设检验)。
另外还有非参数检验(Nonparametric test) 的问题,如关于总体服从某种分布(如正态分布, 泊松分布)的假设检验。
4. 拒绝域与临界点
拒绝域W1: 拒绝原假设 H0 的所有样本值 (x1, x2, ···, xn)所组成的集合.
W1 W1 :拒绝原假设H0的检验统计量的取值范围.
临界点(值):拒绝域的边界点(值) (相应于检验统计量的值).
如: 在前面例4中,拒绝域 {u :| u | u / 2 }.
5. 双边备择假设与双边假设检验
之 下 做 出 的.
2. 检验统计量
概率论与数理统计(经管类)复习要点 第8章 假设检验
第八章 假设检验
1. 假设检验的统计思想:概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。
为了检验一个假设H 0是否成立。
我们先假定H 0是成立的。
如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H 0是不正确的,我们拒绝接受H 0;如果由此没有导出不合理的现象,则不能拒绝接受H 0,我们称H 0是相容的。
与H 0相对的假设称为备择假设,用H 1表示。
这里所说的小概率事件就是事件}{αR K ∈,其概率就是检验水平α,通常我们取α=0.05,有时也取0.01
或0.10。
2. 两类错误
(1)第一类错误,又称拒真错误
在H 0成立的情况下,样本值落入了拒绝域W ,因而H 0被拒绝。
一般记犯第一类错误的概率为α。
(2)第二类错误,又称取伪错误
在H 0不成立的情况下,样本值未落入拒绝域W ,因而H 0被接受。
一般记犯第二类错误的概率为β。
2018.4单解:α=0.05,拒真错误 2017.10填
解:β=0.2,取伪错
误
2018.4填解:
2017.10单解:2017.10填解:2017.4填
解:
2017.4填
解:。
统计学 第8章 假设检验 教学课件ppt
确定适当的检验统计量
什么是检验统计量?
1. 用于假设检验决策的统计量
原假设H0为真 点估计量的抽样分布 (样本均值、样本方差)
比较 3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
利用 P 值 进行决策
什么是P 值?
(P-value)
P值告诉我们: 如果原假设是正确的话,我们得到得到样本观察 结果或更极端结果出现的可能性有多大,如果这 个可能性很小,就应该拒绝原假设
因此,如果在一次抽样中竟然出现了满足
X 0 / n
ห้องสมุดไป่ตู้
的 u /2
X
那么我们就有理由怀疑原假设H0的正确性了,因此会拒
绝H0 。
由于 | U |
X 0 / n
u 2
是一个小概率事件.
故我们可以取拒绝域为:
W: | U | u 2
如果由样本值算得该统计量的实测值落入区域 W,则拒绝H0 ;否则,不能拒绝H0 .
1、生产已不正常
2、生产正常:但属于小概率事件,一次抽样中几乎 不可能发生
因此:在原假设成立(生产正常)的情况下, 若发生小概率事件,则我们有充分的理由怀 疑原假设已不成立。
因此若H0为真,即 0 时,
X
0
/ n
u /2
是一个小概率事件:1%、5%、10%
而小概率事件在一次试验中基本上不应该发生 。
统计学第8章假设检验
市场调查中常用的假设检验方法包括T检验、Z检验和卡方 检验等。选择合适的检验方法需要考虑数据的类型、分布 和调查目的。例如,对于连续变量,T检验更为适用;对于 分类变量,卡方检验更为合适。
医学研究中假设检验的应用
临床试验
在医学研究中,假设检验被广泛应用于临床试验。研究 人员通过设立对照组和实验组,对不同组别的患者进行 不同的治疗,然后收集数据并使用假设检验来分析不同 治疗方法的疗效。
03 假设检验的统计方法
z检验
总结词
z检验是一种常用的参数检验方法,用于检验总体均值的假设。
详细描述
z检验基于正态分布理论,通过计算z分数对总体均值进行检验。它适用于大样本 数据,要求数据服从正态分布。z检验的优点是简单易懂,计算方便,但前提假 设较为严格。
t检验
总结词
t检验是一种常用的参数检验方法,用于检验两组数据之间的差异。
卡方检验
总结词
卡方检验是一种非参数检验方法,用于 比较实际观测频数与期望频数之间的差 异。
VS
详细描述
卡方检验通过计算卡方统计量来比较实际 观测频数与期望频数之间的差异程度。它 适用于分类数据的比较,可以检验不同分 类之间的关联性。卡方检验的优点是不需 要严格的假设前提,但结果解释需谨慎。
04 假设检验的解读与报告
详细描述
t检验分为独立样本t检验和配对样本t检验,分别用于比较两组独立数据和同一组数据在不同条件下的 差异。t检验的前提假设是小样本数据近似服从正态分布。t检验的优点是简单易行,但前提假设需满 足。
方差分析
总结词
方差分析是一种统计方法,用于比较两个或多个总体的差异。
详细描述
方差分析通过分析不同组数据的方差来比较各组之间的差异。它适用于多组数据的比较,可以检验不同因素对总 体均值的影响。方差分析的前提假设是各组数据服从正态分布,且方差齐性。
数理统计8假设检验
X
0
H0
~
N(0,1)
n
H0接受域
2. 2未知,关于的检验(t检验)
H0 : 0 H1 : 0
T
X
0
H0
~ t(n 1)
Sn
(x)
2
H0接受域
t (n 1) 0 t (n 1x)
2
2
例3 用热敏电阻测温仪间接测量地热勘探井底温度, 重复测量7次,测得温度(℃): 112.0 113.4 111.2 112.0 114.5 112.9 113.6 而用某种精确办法测得温度为112.6(可看作真值), 试问用热敏电阻测温仪间接测温有无系统偏差(设温度 测量值X服从正态分布,取 =0.05 )?
注意:积分区间长度不变: 但积分区间的中心
(1)当样本容量固定时,一类错误概率的减少导致 另一类错误概率的增加. 因α减少,积分区间长度:
(2)要同时降低两类错误的概率 或者要在
不变的条件下降低 ,需要增加样本容量.
实际问题中,我们希望两类错误都能得到控制。一 般多是控制第I类错误的概率到适当程度而不管第II类 错误的大小,这种检验叫显著性检验。
X1, …, X5是取自正态总体的样本,
当生产比较稳定时, 2 是一个常数.
可从历史资料获得 的值 .
检验假设: H0: 0 (0 = 355) H1: 0
在实际工作中,
称H0为原假设 往往把不轻易 H1为备选假设
(或零假设); 否定的命题作 (或对立假设). 为原假设.
那么,如何判断原假设H0 是否成立呢?
8.2 单个正态总体均值与方差的假设检验
设总体 我们对μ,σ2作显著性检验
为X的样本。
一、总体均值μ的假设检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
显著性检验解题步骤简述:
做假设 ; 构造统计量 ; 推求拒绝域 ; 查表计算 ; 比较大小得结论.
8.2 单正态总体参数(均值与方差)的假设检验
一、 单总体均值的假设检验
设X 1, ,X n ~ N ( , 2 ), 给定检验水平,由观测 值 x1, ,xn检验假设H 0: 0;H1: 0。
按这种法则做出的检验称为“显著性检验”,此时称 为显著性水平或检验水平。
二、显著性检验法则的构造
构造统计量t =t(X1, …, Xn), x1, …, xn为样本观测值, 令 T={t =t (x1, …, xn)满足某条件: (x1, …, xn) ∈ C}
于是
P{t ∈T|H0真} =P{(x1, …, xn) ∈C| H0真} = ;
iid
1. 2已知的情形 对于假设H0: = 0; H1: 0,构造
iid
(三) 检验法则与拒绝域
以样本(1, …, n)出发制定一个法则,一旦观 测值(x1,…,xn)确定后,我们由这个法则就可作出 判断:是拒绝H0还是接受H0. 这种法则称为H0对H1的 一个检验法则,简称检验法。 样本观测值的全体组成样本空间S,把S分成两 个互不相交的子集C和C*,即S=C∪ C*, C∩C*=, 假设当(x1,…,xn)∈ C时,我们就拒绝H0;当
(二)简单假设与复合假设
如果一个统计假设完全确定总体的分布,则称该假设 为简单假设,否则就称为复合假设。 例如对于 1 , , n ~ f ( x, ), 则称
H 0: 0是简单假设,而H1: 0或 H 0:F ( x) F0 ( x; )(未知)则都是复合假设。
由观测值x1, …, xn检验假设H0:=0;H1:≠0 2、非参数假设检验
iid
检验假设H0: F(x)=F0(x;); H1: F(x)≠F0(x;)
1, , n ~ , 总体分布未知,由观测值x1,…, xn
iid
本课程主要讨论参数假设检验; 说明: (1)假设也称为统计假设; (2) H0称为原假设;H1称为备择假设; (3) 做假设检验的最终目的是作出推断:是接受原假设, 还是拒绝原假设而接受备择假设。
(五) 显著性检验
对于给定的一对H0和H1,总可找出许多临界域, 人们自然希望找到这种临界域C,使得犯两类错误的 概率和 都很小。但在样本容量n一定时,这又是做 不到的,除非容量 n无限增大。
奈曼—皮尔逊 (Neyman—Pearson)提出了一个 原则:在控制犯第一类错误的概率的条件下,尽量 使犯第二类错误 小,这是最优检验 (MPT) ,但是有 时MPT法则很难找到,甚至不存在。在这种情况下, 我们不得不降低要求,另提一些原则。应用上常采纳 的原则是“只对加以限制,而不考虑 的大小”。
其中C {( x1, , xn ):U z }, 简记为U z0.05 1.645, 计算得 x 1500 1675 1500 U 4.375 1.645 z 200 / 5 200 25
故观测值(x1,…,xn)∈C,可作出结论: 拒绝 H0 而接受H1: >1500,即认为采用新工艺后,灯管寿命有了显著提高.
X 1500 H 0真 X U ~ N (0, 1),其中 200,n 25; n n
H 0真时,
P{U z } ,其中z
K n
得到 T {t U
x 1500 z: ( x1, , xn ) C}, 200 n
显著性检验的思想和步骤:
(1)根据实际问题作出假设H0与H1;
(2)构造统计量,在H0真时其分布已知; (3)给定水平的值(一般为0.05,0.025,0.01,0.005等), 求出 H0对H1的拒绝域C;
(4)查表、计算得分位点和统计量的值; (5)比较统计量与分位点值的大小,得出结论,依据是小概率 原理。
(x1,…,xn)∈ C*时,我们就接受H0. 子集C S就 称为检验的拒绝域(或临界域 )。
(四) 检验的两类错误
我们给出了H0对H1的某个检验法则,即给出了S 的一个划分:C与C*,由于样本的随机性,在进行判断 时,还可能犯错误。
{拒绝H0| H0真}={(x1, …, xn) ∈ C | H0真} ——第一类错误或“弃真” {接受H0| H0假}={(x1, …, xn) ∈ C*| H0假} ——第二类错误或“取伪” 这两个事件都是小概率事件,常记P{拒绝H0| H0真}=, P{接受H0| H0假}= , , 在0~1之间,通常不超过0.1。
t ∈ T通常用一个不等式来表示,这样就得到了一个检验法 则。现在,我们已经把S的划分转化为统计量 t 的值域空间 的划分, 这是一个把n维的问题转化为一维的问题。
例:设某厂生产一种灯管,其寿命X~ N( , 40000),由以 往经验知平均寿命 =1500小时,现采用新工艺后,在所生 产的灯管中抽取25只,测得平均寿命1675小时,问采用新
第八章
假设检验
假设检验的基本思想和概念 参数假设检验
正态总体均值的假设检验 正态总体方差的假设检验
非参数假设检验 奈曼-皮尔逊引理和UMPT
8.1假设检验的基本概念和思想
一、基本概念
(一) 两类问题
1、参数假设检验
1 , , n ~ f ( x, ), 总体分布已知,参数未知,
工艺后,灯管寿命是否有显著提高。
解:经分析要检验的假设为 H 0: 1500;H1: 1500
由于拒绝H 0意味着接受H1: 1500,而 X 是的无偏估计, 故存在K 0,使 X 1500 K,从而,有
P{拒绝H 0 | H 0真} P{X 1500 K | 1500}