第8章 假设检验8.1 假设检验
假设检验的基本思想与步骤

§8.1 假设检验的基本思想与步骤
第1页
第8章 假设检验
假设检验是对总体的未知参数或总体服从的分布等,首先 提出某种假设,例如假设未知参数为某一常数或总体服从某 已知分布等,然后由样本提供的信息,对所做假设的“真实性” 做出否定还是不否定,即拒绝还是接受的判定。 假设检验问题分为如下两大类: 参数假设检验:对总体中某个数字特征或分布中的参数提 出假设检验。 非参数假设检验:对总体的分布、总体间的独立性以及是 否同分布等方面的检验。 本章主要介绍假设检验的基本概念、思想方法,讨论正态 总体参数的检验、频率检验、分布拟合检验(非参数假设检验) 等。
2
第 8) 章 一个例子 §8.1 假设检验的基本思想与步骤 ( 一
第3页
例1 某工厂生产10欧姆的电阻.根据以往生产的电阻 实际情况,可以认为其电阻值X~N( , 2), 标准差 σ=0.1.现在随机抽取10个电阻,测得它们的电阻值为: 9.9, 10.1, 10.2, 9.7, 9.9, 9.9, 10, 10.5, 10.1, 10.2. 试问:从这些样本,我们能否认为该厂生产的电阻的平 均值为10欧姆? 问题怎么建立: 确定总体:记X为该厂生产的电阻的测量值.根据假 设,X~N( , 2),这里=0.1. 明确任务:通过样本推断X的均值μ是否等于10欧姆. Hypothesis:上面的任务就是要通过样本去检验“X的 均值μ=10”这样一个假设是否成立.(在数理统计中把 “X的均值μ=10”这样一个待检验的假设记作 “H0:μ=10”称为 “原假设”或 “零假设”) 3
4
第8章
§8.1 假设检验的基本思想与步骤
第5页
合理的思路是找出一个界限c, 当 X 10 c 时,我们就接受原假设H0 , 而当 X 10 c 时,我们就拒绝原假设H0 .
假设检验一般概念

x 400 k 时接受原假设H0;
(1)
x 400 k 时拒绝原假设H0接受备择假设H1
(2)
进一步,由于当H0为真时,有
u x400 ~N(0,1) 25/ n
1 |u|要构x造一40个0具有明确k分布的统计量,可将(1)、(2)式转化为
25/ n 25/ n
2 |u|时接x受原40假0设H0 k
2. 拒绝域与接受域 称是检验水平或显著性水平,它是我们
制定检验标准的重要依据。常数u/2把标准正态分布密度曲线下
的区域分成了两大部分,其中一部分
(x1,x2, ,xn)uu/2
称为H0的拒绝域或否定域, 当样本点落入拒绝域时,我们便拒 绝原假设H0(同前述(6)式),另一部分
(x1,x2, ,xn)uu/2
(1)根据问题的要求提出假设,写明原假设H0和备择假设H1的
具体内容。
(2)根据H0的内容,建立(或选取)检验统计量并确定其分布。 (3)对给定(或选定)的显著性水平 ,由统计量的分布查表 或计算确定出临界值,进而得到H0的拒绝域和接受域。
(4)由样本观察值计算出统计量的值。
(5)做出推断:当统计量的值满足“接受H0的条件”时就接受 H0,否则就拒绝H0接受H1 。
u
2
时接受原假设H0 (5)
时拒绝原假设H0,接受备择假设 H1 (6)
分析(5)、(6)两式,可以这 样认为:
拒绝H0,是因为以H0成立 为出发点进行推理时,得到 了不合情理的结论,使小概 率事件在一次试验中发生了。
接受H0,是因为以H0成立 为出发点进行推理时,未发 现异常。
这就是带有概率特征的反证 法,认为小概率事件在一次 试验中不可能发生。
H0:X服从泊松分布;H1:X不服从泊松分布.
第八章 假设检验

(一)问题的提出
例1.1 体重指数BMI是目前国际上常用的衡量人体胖 瘦程度以及是否健康的一个标准. 专家指出, 健康 成年人的BMI 取值应在 18.55- 24.99 之间.某种 减肥药广告宣称, 连续使用该种减肥药一个星期便 可达到减肥的效果.为了检验其说法是否可靠,随机 抽取9位试验者(要求BMI 指数超过25,年龄在20-25 岁女生),
x 0.522 0.465, 依然拒绝H0;
那么,拒绝H0的最小的值 是多少?最小的显 著水平又是多少?
(一)问题的提出
先让每位女生记录没有服用减肥药前的体重, 然后 让每位女生服用该减肥药, 服药期间, 要求每位女 生保持正常的饮食习惯, 连续服用该减肥药1周后, 再次记录各自的体重.测得服减肥药前后的体重差 值X(服药前体重-服药后体重) (单位: kg): 1.5,0.6,-0.3,1.1,-0.8,0,2.2,-1.0,1.4 设X~N(μ,0.36), μ未知,根据目前的样本资料能否 认为该减肥药广告中的宣称是可靠的?
n i1
Xi
~
N(,
1 ), n
H0 : 0, H1 : 1( 0 ), 拒绝域:X c.
P1 (X c)
P0 (X c)
0
c
1
犯两类错误的 概率相互制约
11
例1.1中,犯第I类错误的概率
(c) P{拒绝H0|H0是真的} P{X c| 0}
P{ X c | 0} / n / n
例1.2 一种饼干的包装盒上标注净重200g,假 设包装盒的重量为定值,且设饼干净重服从N (μ,σ2), μ, σ2均未知.现从货架上取来3盒,称 得毛重(单位:g)为 233,215,221,根据这 些数据是否可以认为这种包装饼干的标准差超 过6g?
概率论与数理统计第八章假设检验

为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
8.1 假设检验的基本思想与步骤

如在工件直径的假设检验问题中,设α1 < α2 < α3, 对不同的分位数
电子科技大学
假设检验基本思想
(x)
显著性水 平α3下拒
绝H0
- u1 - u2- u3
u3 u2 u1
显著性水平α2下接受H0
α1 < α2 < α3
电子科技大学
假设检验基本思想
注2 在确定H0的拒绝域时应遵循有利准则: 将检验统计量对H0有利的取值区域确定为接受 域,对H1成立有利的区域作为拒绝域. 如在工件直径假设检验问题中
1.提出原假设:根据实际问题提出原假设
H0和备选假设H1;
电子科技大学
假设检验基本思想
2. 建立检验统计量:寻找参数的一个良好 估计量,据此建立一个不带任何未知参数的统
计量U作为检验统计量,并在H0成立的条件下,
确定U的分布(或近似分布);
2
3.确定H0的否定域:根据实际问题选定显
著性水平α,依据检验统计量的分布与H0的内
给定α,H1的否定域为:
x
-
0
-
0
n
uα
例中
x
-
2
-0.022
-
0
n
u0.05
-0.0165
拒绝H0,即认为新工艺使工件直径偏小.
大样本假设检验例
电子科技大学
假设检验基本思想
四、两类错误 1)假设检验的主要依据是“小概率事件原 理”,而小概率事件并非绝对不发生. 2)假设检验方法是依据样本去推断总体,样 本只是总体的一个局部,不能完全反映整体 特性.
统计学 第8章 假设检验 教学课件ppt

确定适当的检验统计量
什么是检验统计量?
1. 用于假设检验决策的统计量
原假设H0为真 点估计量的抽样分布 (样本均值、样本方差)
比较 3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
利用 P 值 进行决策
什么是P 值?
(P-value)
P值告诉我们: 如果原假设是正确的话,我们得到得到样本观察 结果或更极端结果出现的可能性有多大,如果这 个可能性很小,就应该拒绝原假设
因此,如果在一次抽样中竟然出现了满足
X 0 / n
ห้องสมุดไป่ตู้
的 u /2
X
那么我们就有理由怀疑原假设H0的正确性了,因此会拒
绝H0 。
由于 | U |
X 0 / n
u 2
是一个小概率事件.
故我们可以取拒绝域为:
W: | U | u 2
如果由样本值算得该统计量的实测值落入区域 W,则拒绝H0 ;否则,不能拒绝H0 .
1、生产已不正常
2、生产正常:但属于小概率事件,一次抽样中几乎 不可能发生
因此:在原假设成立(生产正常)的情况下, 若发生小概率事件,则我们有充分的理由怀 疑原假设已不成立。
因此若H0为真,即 0 时,
X
0
/ n
u /2
是一个小概率事件:1%、5%、10%
而小概率事件在一次试验中基本上不应该发生 。
第八章 假设检验

第八章 假设检验参数估计和假设检验是统计推断中的两类重要问题。
在前一章中我们讨论了用样本统计量来推断总体未知参数的方法—参数的点估计与区间估计,本章我们将讨论正态总体分布中的未知参数的假设检验以及总体分布函数的假设检验。
§8.1 假设检验的基本概念§8.1.1 问题的提出在实际工作中,我们经常要面对这样的问题:总体的分布函数的类型或分布函数中的一些参数是未知的,需要对总体分布函数的类型或分布函数中的未知参数提出某种"假设",然后通过已经获得的一个样本对提出的“假设”作出成立还是不成立的判断(或决策)。
为了介绍假设检验的基本思想,我们先来看一个例子:例8.1 某食品厂生产的罐头规定每听的标准重量为500克,这些罐头由一条生产线自动包装,在正常的情况下,由经验知道生产出的罐头重量(单位:克)服从正态分布N (500,22)。
质量管理中规定每隔一定时间要抽测5听罐头。
若某次抽测的5听罐头的重量为501,507,498,502,504(克),假定方差不变,这时我们是否可以得出生生产线运转正常(即这段时间生产的罐头的平均重量为500克)的判断呢?由题意知,罐头重量),2N(μ~X 2,记μ0=500,则要回答的问题是:μ=μ0吗? 我们可以先假定μ=μ0,并称之为待检假设或原假设,记为H 0:μ=μ0这个原假设可能成立也可能不成立。
当原假设不成立时,称μ的取值为备选假设,这里取“μ≠μ0”为备选假设,记为H 1:μ≠μ0所谓假设检验问题就是要利用样本提供给我们的信息,在原假设H 0与备选假设H 1之间作出拒绝哪一个、接受哪一个的判断,简称为H 0对H 1的检验问题。
在例8.1中,我们把问题归结成统计假设:H 0:μ=500,对H 1:μ≠500。
那么,如何来解决H 0对H 1的检验问题呢?由参数估计知,x 是μ的一个"好"估计量。
如果原假设H 0成立,即μ=500,那么,x 通常应很接近500,即|x -500|通常应很小;否则,就认为原假设H 0不成立,也即μ≠500。
概率论第八章8.1 假设检验的基本原理

0.12 0.1 0.08 0.06
α/2
0.04 0.02 60 62.5 65 67.5 70 72.5 75
α/2
H0 真
0. 12 0. 1 0. 08 0. 06 0. 04 0. 02
β
H0 不真
67 .5 70 72 .5 75 77 .5 80 82 .5
注 1º 一般,作假设检验时,先控制犯第一 一般,作假设检验时, 类错误的概率α,在此基础上使 β 尽量 一般要增大样本容量. 地小. 地小.要降低 β 一般要增大样本容量. 不真时,参数值越接近真值, 越大. 当H0不真时,参数值越接近真值,β 越大. 注 2º 备择假设可以是单侧,也可以双侧. 备择假设可以是单侧,也可以双侧. 引例2中的备择假设是双侧的. 引例2中的备择假设是双侧的.若根据以 往生产情况, =68.现采用了新工艺 现采用了新工艺, 往生产情况,µ0=68.现采用了新工艺,关 心的是新工艺能否提高螺钉强度, 心的是新工艺能否提高螺钉强度,µ越大 越好.此时可作如下的右边假设检验: 越好.此时可作如下的右边假设检验: H0 : µ = 68; H1 : µ > 68
拒绝 H0
第一类错误
(弃真) 弃真)
正确
犯第一类错误的概率通常记为 α 犯第二类错误的概率通常记为 β
任何检验方法都不能完全排除犯错 误的可能性. 误的可能性.理想的检验方法应使犯两类 错误的概率都很小, 错误的概率都很小,但在样本容量给定的 情形下,不可能使两者都很小,降低一个, 情形下,不可能使两者都很小,降低一个, 往往使另一个增大. 往往使另一个增大. 假设检验的指导思想是控制犯第一类 然后,若有必要, 错误的概率不超过α, 然后,若有必要,通 过增大样本容量的方法来减少 β .
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验
一、假设检验的基本原理 二、假设检验的相关概念 三、假设检验的一般步骤 四、小结
一、假设检验的基本原理
在总体的分布函数完全未知或只知其形式、 在总体的分布函数完全未知或只知其形式、 但不知其参数的情况下, 但不知其参数的情况下 为了推断总体的某些性 提出某些关于总体的假设. 质, 提出某些关于总体的假设 例如, 提出总体服从泊松分布的假设 又如, 例如 提出总体服从泊松分布的假设;
三、假设检验的一般步骤
1. 根据实际问题的要求 , 提出原假设 H 0 及备择假
设 H1 ;
2. 给定显著性水平 α 以及样本容量 n ;
确定检验统计量以及拒绝域形式; 3. 确定检验统计量以及拒绝域形式;
4. 按 P{ H 0 为真拒绝 H 0 } ≤ α 求出拒绝域 ; 5. 取样 , 根据样本观测值确定接 受还是拒绝 H 0 .
形如 H 0 : µ = µ 0 , H 1 : µ ≥ µ 0 的假设检验
称为右边检验 .
形如 H 0 : µ = µ 0 , H 1 : µ ≤ µ 0 的假设检验
称为左边检验 .
右边检验与左边检验统称为单边检验. 右边检验与左边检验统称为单边检验
9. 单边检验的拒绝域
设总体 X ~ N ( µ , σ 2 ), σ为已知 , X 1 , X 2 ,L, X n
3. 原假设与备择假设
, 下 检验假设 H 0 : µ = µ0 ,
H 1 : µ ≠ µ0 .
. “ 也常说成 在显著性水平 α下, 针对 H 1 检验 H 0 ”
H 0 称为原假设或零假设 , H 1 称为备择假设 .
4. 拒绝域与临界点
当检验统计量取某个区域C中的值时 当检验统计量取某个区域 中的值时, 我们拒 中的值时 则称区域C为拒绝域 为拒绝域, 绝原假设 H 0 , 则称区域 为拒绝域 拒绝域的边界 点称为临界点. 点称为临界点 如在上例中, 如在上例中,
拒绝域为 | z |≥ zα / 2 ,
临界点为 z = zα / 2 , z = − zα / 2 .
5. 两类错误及记号
假设检验的依据是: 假设检验的依据是 小概率事件在一次试验 中很难发生, 但很难发生不等于不发生, 中很难发生 但很难发生不等于不发生 因而假设 检验所作出的结论有可能是错误的. 检验所作出的结论有可能是错误的 这种错误有 两类: 两类: (1) 当原假设 0为真, 观察值却落入拒绝域 而 当原假设H 为真, 观察值却落入拒绝域, 第一类错误 作出了拒绝H 的判断, 称做第一类错误, 又叫弃 作出了拒绝 0的判断 称做第一类错误 又叫弃 犯第一类错误 真错误, 这类错误是“以真为假” 真错误 这类错误是“以真为假”. 的概率是显著性水平α .
因此拒绝域的形式为 x ≥ k , (k是某一正常数 )
由 P{ H 0 为真拒绝 H 0 } = Pµ∈H 0 {X ≥ k }
X − µ0 k − µ0 = Pµ ≤ µ0 ≥ σ / n σ / n X − µ k − µ0 ≥ ≤ Pµ ≤ µ0 σ / n σ / n
(2) 当原假设 H0 不真, 而观察值却落入接受域 不真, 而观察值却落入接受域, 的判断, 称做第二类错误 而作出了接受 H0 的判断 称做第二类错误 又叫 第二类错误, 取伪错误, 这类错误是“以假为真” 取伪错误 这类错误是“以假为真”. 犯第Ⅱ 犯第Ⅱ类错误的概率记为
P{当H 0不真接受 H 0 } 或 Pµ∈H1 { 接受H 0 }.
上式不等号成立的原因: 上式不等号成立的原因:
X − µ X − µ0 , 因为 µ ≤ µ 0 , 所以 ≥ σ/ n σ/ n
X − µ0 k − µ0 X − µ k − µ0 ≥ ≥ 事件 ⊂ . σ / n σ / n σ / n σ / n
要控制 P { H 0 为真拒绝 H 0 } ≤ α , 只需令 X − µ k − µ0 Pµ ≤ µ0 ≥ =α. σ / n σ / n
则称 x 与µ 0的差异是不显著的, 则我们接受H0 .
1. 显著性水平
. 数α 称为显著性水平 上述关于 x 与 µ 0 有无显著差异的判断是 在显
则我们接受 H 0 .
2. 检验统计量
X − µ0 . 称为检验统计量 统计量 Z = σ/ n
前面的检验问题通常叙述成:在显著性水平 α 前面的检验问题通常叙述成:
和
H 1 : µ ≠ µ0 .
我们给出一个合理的法则, 我们给出一个合理的法则, 然后, 根据这一法 然后,
则, 利用已知样本作出决策 是接受假设 H 0 (即拒绝
假设H 1 ) , 还是拒绝假设 H 0 (即接受假设 H 1 ) . 如果
作出的决策是接受 H 0 , 则认为 µ = µ 0, 即认为机器 工作是正常的, 否则, 认为是不正常的. 工作是正常的 否则 认为是不正常的
点温度 (0°C ). 测得生产商提交的 批牛奶的冰点 测得生产商提交的5批牛奶的冰点
温度, 温度, 其均值 x = −0.535°C , 问是否可以认为生产 商在牛奶中掺了水? 商在牛奶中掺了水? α = 0.05. 取
解
按题意需检验假设
H0 :
µ ≤ µ 0 = −0.545 µ > µ0
(即设牛奶未掺水 即设牛奶未掺水) 即设牛奶未掺水
分析 以 µ 和 σ 分别表示这一天袋装糖 的净 重总体X 重总体 的均值和标准差, 由长期实践表明标准差比较稳定, 由长期实践表明标准差比较稳定 我们就设
于是 X ~ N ( µ , 0.015 2 ), 这里µ 未知. σ = 0.015, 问题 问题是根据样本值判断 µ = 0.5 还是
µ ≠ 0.5 .为此, 为此, 我们提出两个相互对立的假设 H 0 : µ = µ 0 = 0.5
x − µ0 ≥ k时, 拒绝假设 H 0 , 当观测值 x满足 σ/ n x − µ0 反之, 反之, 若 < k时, 就接受假设 H 0 . σ/ n X − µ0 为真时, 由于当 H 0为真时, Z = ~ N (0,1), σ/ n
k 由标准正态分布分位点的定义得: 由标准正态分布分位点的定义得: = zα / 2 ,
是一个小概率事件 , 根据实际推断原理 , 就可以认
由一次试验得到满足不 等式 为如果 H 0为真 ,
x − µ0 ≥ zα / 2 的观察值 x , 几乎是不会发生的 . σ/ n
x − µ0 在一次观测中竟出 现了满足 ≥ zα / 2的 x , σ/ n
我们有理由怀疑原来的 假设H 0的正确性 , 因而拒
x − µ0 x − µ0 < zα / 2时, 接受H 0 . ≥ zα / 2时, 拒绝 H 0 , 当 σ/ n σ/ n
假设检验过程如下: 假设检验过程如下:
在实例中若取定 α = 0.05,
则 k = zα / 2 = z0.025 = 1.96,
又已知 n = 9, σ = 0.015, x − µ0 由样本算得 x = 0.511, 即有 = 2.2 > 1.96, σ/ n
7. 双边备择假设与双边假设检验
在 H 0 : µ = µ 0 和 H 1 : µ ≠ µ 0 中, 备择假设 H 1
表示 µ可能大于 µ 0 , 也可能小于 µ 0 , 称为双边备择
假设 , 形如 H 0 : µ = µ 0 , H 1 : µ ≠ µ 0 的假设检验称
为双边假设检验 .
8. 右边检验与左边检验
于是拒绝假设H 认为包装机工作不正常. 于是拒绝假设 0,认为包装机工作不正常
以上所采取的检验法是符合实际推断原理的. 以上所采取的检验法是符合实际推断原理的. 因通常 α总是取得很小, 一般取 α = 0.01,0.05.
X − µ0 因而当H 因而当 0为真, 即µ = µ 0时, ≥ zα / 2 σ / n
H1 :
(即设牛奶已掺水 即设牛奶已掺水) 即设牛奶已掺水
这是右边检验问题, 其拒绝域为 这是右边检验问题, x − µ0 z= ≥ z 0.05 =1.645. σ n 现在
某车间用一台包装机包装葡萄糖, 例1 某车间用一台包装机包装葡萄糖 袋装糖的 净重是一个随机变量, 它服从正态分布. 净重是一个随机变量 它服从正态分布 当机器正 常时, 其均值为0.5kg, 标准差为 常时 其均值为 标准差为0.015kg. 某日开工 后为检验包装机是否正常, 后为检验包装机是否正常 随机地抽取它所包装 的糖9袋 称得净重为(kg): 的糖 袋, 称得净重为 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常? 问机器是否正常
由于 所以
X−µ ~ N (0, 1), σ/ n σ k − µ0 k = µ0 + zα , = zα , n σ/ n
故右边检验的拒绝域为
x ≥ µ0 +
即 类似证, 类似证,
σ
n
zα ,
x µ0 ≤ − zα . 左边检验的拒绝域为 z = σ/ n
对于正态总体提出数学 期望等于 µ 0 的假设等.
假设检验就是根据样本对所提出的假设作出 判断: 是接受, 还是拒绝. 判断 是接受 还是拒绝. 假设检验问题是作出这一决策的过程. 假设检验问题是作出这一决策的过程.
假设检验问题是统计推断的另一类重要问题. 假设检验问题是统计推断的另一类重要问题. 如何利用样本值对一个具体的假设进行检验? 如何利用样本值对一个具体的假设进行检验? 通常借助于直观分析和理论 分析相结合的做法, 分析相结合的做法 其基本原理就 是人们在实际问题中经常采用的 所谓实际推断原理:“一个小概率 所谓实际推断原理 一个小概率 事件在一次试验中几乎是不可 能发生的”. 能发生的” 下面结合实例来说明假设检验的基本思想. 下面结合实例来说明假设检验的基本思想.