假设检验的基本概念(第八章)
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
教育与心理统计学第八章:假设检验

临界值
H0值
样本统计量
左侧检验示意图
(显著性水平与拒绝域 )
抽样分布
置信水平
拒绝域
1- 接受域
临界值
H0值
样本统计量
观察到的样本统计量
右侧检验示意图 (显著性水平与拒绝域 )
抽样分布
置信水平
1- 接受域
拒绝域
H0值 观察到的样本统计量
临界值
样本统计量
双侧检验原假设与备择假设的确定
▪ 双侧检验属于决策中的假设检验。即不论是拒绝H0还 是接受H0,都必需采取相应的行动措施。
1、原假设真实, 并接受原假设,判断正确; 2、原假设不真实,且拒绝原假设,判断正确; 3、原假设真实, 但拒绝原假设,判断错误; 4、原假设不真实,却接受原假设,判断错误。
假设检验是依据样本提供的信息进行判断,有犯错误 的可能。所犯错误有两种类型:
第一类错误是原假设H0为真时,检验结果把它当成不 真而拒绝了。犯这种错误的概率用α表示,也称作α错 误(αerror)或弃真错误。
型错误
β错误(取伪错误) 1-β(正确决策)
要使犯这两类错误的概率α 和β都尽可能小, α也不能定
的过低 。
在一般研究中,我们总是控制犯型错误
为什么???
假设检验中人们普遍执行同一准则:首先控制弃真错误(α错 误)。假设检验的基本法则以α为显著性水平就体现了这一原
则。
两个理由: 统计推断中大家都遵循统一的准则,讨论问题会比较方便。
0.076mm。试问新机床加工零件 的椭圆度均值与以前有无显著差
异?(=0.05)
属于决策中 的假设!
解:已知:X0=0.081mm, =.25,n=200,
x 0.076
假设检验的基本概念

第六节
双侧检验与单侧检验
单侧检验:只关心差别单侧方 向的单向检验。备择假设为 H1:μ2<μ1 或H1:μ2>μ1。
双侧检验:只检验差别不 管差别方向的双向检验。 备择假设为 H1:μ1≠μ2
图8–2 双侧u检验的检验水准
图8–3 单侧u检验的检验水准α
单、双侧检验的选择
♦ 在作练习时,根据题中的交代及提问方式加以选 择。
2.小概率事件原理:根据“小概率事件在一次试 验中一般不会发生”的原理,用概率的思想决 定是否拒绝原假设。
第二节 假设检验的基本步骤
一、建立假设,确定检验水准。
H0:µ = µ 0 =34.50 H1:µ µ 0 =34.50
二、 选定统计方法,计算检验统计量。
根据资料类型,设计方法,分析目的和样本含量 大小选用适当的检验方法,如u检验,t检验,F检 验,秩和检验和卡方检验等。
作业:
一、 二、
三、
1.
1.
3. 4. 8.
体率是否相等?
检验步骤如下:
(1)建立假设,确定检验水准。 H0:π1 =π2 H1:π1≠π2 α=0.05。 (2)计算检验统计量u值。
(3)确定P值,作出推断结论。
u0.05/2=1.96,现|u|<u0.05/2 , 故P > 0.05,按 α=0.05 检验水准,不拒绝H0,差异无统计学意义,尚不 能认为两种疗法治疗小儿支气管哮喘的疗效有差 别。 当样本率的分布不符合正态分布条件时,如n较 小,假设检验需采用 检验或Fisher确切概率法, 详见第九章。
二、两个率比较的u检验
对两个样本率进行检验的目的是推断样本所 代表的两个未知总体率是否相等。
例8-5 某医院用黄芩注射液和胎盘球蛋白进行穴位注 射治疗小儿支气管炎哮喘病人,黄芩注射液治疗117
概率论与数理统计教案第八章

例8为比较新老品种的肥料对作物的效用有无显著差别,选用了各方面条件差不多的10个地块种上此作物.随机选用其中5块施上新肥料,而剩下的5块施上老肥料.等到收获时观察到施新肥的地块,平均年产333(单位:千斤),样本方差为32,施老肥的地块平均年产330,样本方差为40.假设作物产量服从正态分布,检验新肥是否比老肥效用上有显著提高(显著性水平 ).
点面朝上
1
2
3
4
5
6
出现次数
23
26
21
20
15
15
在 水平下,请问,这颗骰子是否是均匀的
例2在某细纱机上进行断点率测定,测验锭子总数为440,测得断头次数记录如下表:
每锭断头数
0
1
2
34Βιβλιοθήκη 5678
锭数(实测)
269
112
38
19
3
1
0
0
3
试问在显著性水平 下能否认为锭子的断头数服从泊松分布
例3某高校研究在校学生的体重,现随机抽取了100位学生,测得他们的体重(单位:kg)为
检验参数
原假设与备择假设
检验统计量
拒绝域
方差
已知
;
当 时,
或
;
;
未知
;
当 时,
或
;
;
3、两个正态总体均值差的假设检验问题可汇总如下表
检验参数
抽样分布
检验统计量
拒绝域
均值差
已知
;
当 时,
;
;
未知
;
当 时,
;
;
4、两个正态总体方差比的假设检验问题可汇总如下表
统计学原理——假设检验与方差分析

二、假设检验中的两类错误**
第Ⅰ类错误/弃真错误 (type Ⅰ error)
当原假设为真时拒绝原假设。犯第Ⅰ类错误的概率
通常记为 。
第Ⅱ类错误/取伪错误(type Ⅱ error)
n1 P 40010.2 320 f 5
所以为大样本分布,检验统计量 Z 近似服从 正态分布。样本数据显示:
p 100 0.25 400
Z p P0 0.25 0.20 0.05 2.5
P 1 P 0.21 0.2 0.02
n
400
在显著性水平 0.05 情况下,查表可知,
比RMB 245.95小或者比RMB 274.05大。所以,在双侧 检验(见下图8-1)中有两个拒绝域。
拒绝域
接受域
拒绝域
245.95
260.00
274.05
图8-1 双边检验的拒绝域与接受域
[例8-2] 在例8-1的假设检验中,如果样本的均值
为 X 240.00 ,当显著性水平为0.05时,原假设是否被 拒绝。
重点是三种不同情况下的假设检验方法,总体方差已 知时正态总体均值和总体比例的假设检验。
难点是总体方差未知时正态总体均值的假设检验和方 差分析。
第一节 假设检验
一、假设检验的概念
一、假设检验的概念
假设(hypothesis),又称统计假设,是对总体参数 的具体数值所作的陈述。
假设检验(hypothesis test) 是先对总体参数提出 某种假设,然后利用样本信息判断假设是否成立的过程。
(3) H0:μ = μ0 H1:μ<μ
医学统计学第七、八章 假设检验的基本概念和t检验

S x 1 − x 2 为两样本均数差值的标准误
Sx −x
1
2
⎛1 1⎞ ⎟ = S ⎜ + ⎜n n ⎟ 2 ⎠ ⎝ 1
2 c
在两总体方差相等的条件下,可将两方差合并, 求合并方差(pooled variance) S c2
2 ⎡ ( Σ x1 ) ⎤ 2 ⎢ Σ x1 − ⎥ + n1 ⎦ ⎣ = n1 − 1 + 2 ⎡ ( Σx2 ) ⎤ 2 ⎢Σ x2 − ⎥ n2 ⎦ ⎣ n2 − 1
t 检验的应用条件:
① 单样本t检验中,σ 未知且n 较小,样本取自 正态总体; ② 两小样本均数比较时,两样本均来自正态分 布总体,两样本的总体方差相等;若两总体 方差不齐可用t’检验; ③ 两大样本均数比较时,可用Z检验。
1、样本均数与总体均数比较的 t 检验
• 使用范围:用于样本均数与已知总体均数(一 般为理论值、标准值或经过大量观察所得的稳 定值等)的比较。 • 分析目的:推断样本所代表的未知总体均数 μ 与已知总体均数 μ0有无差别。 • 若 n 较大,则 tα .ν ≈ tα .∞ , 可按算得的 t 值用 v = ∞ 查 t 界值表( t 即为 Z )得P值。
回到例子:
2.计算统计量
已知μ0= 3min,n=50, X=4min
4−3 t= = 4 .7140 1 .5 / 50
υ = 50 − 1 = 49
3、确定 P 值,作出统计推断 根据算出的检验统计量如 t、z 值,查 相应的界值表,即可得到概率 P。 P值是在H0成立前提下,抽得比现有样 本统计量更极端的统计量值的概率。 P值越小只能说明:作出拒绝H0 ,接受 H1的统计学证据越充分。
X −μ X −μ 用公式:t = 或z = σX SX
8.1 假设检验的基本思想与步骤

如在工件直径的假设检验问题中,设α1 < α2 < α3, 对不同的分位数
电子科技大学
假设检验基本思想
(x)
显著性水 平α3下拒
绝H0
- u1 - u2- u3
u3 u2 u1
显著性水平α2下接受H0
α1 < α2 < α3
电子科技大学
假设检验基本思想
注2 在确定H0的拒绝域时应遵循有利准则: 将检验统计量对H0有利的取值区域确定为接受 域,对H1成立有利的区域作为拒绝域. 如在工件直径假设检验问题中
1.提出原假设:根据实际问题提出原假设
H0和备选假设H1;
电子科技大学
假设检验基本思想
2. 建立检验统计量:寻找参数的一个良好 估计量,据此建立一个不带任何未知参数的统
计量U作为检验统计量,并在H0成立的条件下,
确定U的分布(或近似分布);
2
3.确定H0的否定域:根据实际问题选定显
著性水平α,依据检验统计量的分布与H0的内
给定α,H1的否定域为:
x
-
0
-
0
n
uα
例中
x
-
2
-0.022
-
0
n
u0.05
-0.0165
拒绝H0,即认为新工艺使工件直径偏小.
大样本假设检验例
电子科技大学
假设检验基本思想
四、两类错误 1)假设检验的主要依据是“小概率事件原 理”,而小概率事件并非绝对不发生. 2)假设检验方法是依据样本去推断总体,样 本只是总体的一个局部,不能完全反映整体 特性.
贾俊平《统计学》第8章 假设检验

备择假设的方向为“ 备择假设的方向为“<”,称为左侧检验 备择假设的方向为“ 备择假设的方向为“>”,称为右侧检验
双侧检验与单侧检验
(假设的形式) 假设的形式)
以总体均值的检验为例
假设
原假设 备择假设
双侧检验
H0 : =0 H1 : ≠0
单侧检验 左侧检验
H0 : ≥0 H1 : <0
右侧检验
提出假设
(结论与建议) 结论与建议)
1. 原假设和备择假设是一个完备事件组,而且 原假设和备择假设是一个完备事件组, 相互对立
在一项假设检验中, 在一项假设检验中, 原假设和备择假设必有一 个成立, 个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设 先确定备择假设, 3. 等号“=”总是放在原假设上 等号“ 4. 因研究目的不同,对同一问题可能提出不同 因研究目的不同, 的假设(也可能得出不同的结论) 的假设(也可能得出不同的结论)
1、某厂生产的化纤度服从正态分布, 纤维度的均值为1.4。某天测得25根纤维的 纤维度的均值为1.4。某天测得25根纤维的 均值为1.39,检验与原来设计的标准均值 均值为1.39,检验与原来设计的标准均值 相比是否有所变化,则假设形式是?
2、某一贫困地区估计营养不良人数高 达20%,然而有人认为这个比例实际上还 20%,然而有人认为这个比例实际上还 要高,要经验该说法是否正确,则假设形 式为?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假设检验的两类错误 实际情况 决定 H0为真 第一类错误 H0不真 正确
拒绝H0 接受H0
第一类错误 第二类错误
正确
第二类错误
拒真错误 取伪错误
犯两类错误的概率: P{拒绝H0|H0为真}= , P{接受H0|H0不真}= . 显著性水平 为犯第一类错误的概率. 通常计算犯第Ⅱ类错误的概率是很复杂 的,下面我们通过举例来说明
§8.1假设检验的基本概念
在本讲中,我们将讨论不同于参数估计 的另一类重要的统计推断问题. 这就是根据 样本的信息检验关于总体的某个假设是否 正确. 这类问题称作假设检验问题 . 假设检验
参数假设检验 非参数假设检验
总体分布已知, 检验关于未知参数 的某个假设
总体分布未知时的 假设检验问题
若对参数 一无所知
较大、较小是一个相对的概念,合理的界 限在何处?应由什么原则来确定?
问题归结为对差异作定量的分析,以确定 其性质.
差异可能是由抽样的随机性引起的,称为
“抽样误差”或 随机误差 这种误差反映偶然、非本质的因素所引起 的随机波动.
然而,这种随机性的波动是有一定限 度的,如果差异超过了这个限度,则我们 就不能用抽样的随机性来解释了. 必须认为这个差异反映了事物的本质差别, 即反映了生产已不正常.
即“ | u | Z 2 ”是一个小概率事件 . 得否定域 W: |u |>1.96
小概率事件在一次 试验中基本上不会 发生 .
第四步:
将样本值代入算出统计量 u的实测值, | u |=0.370<1.96 故不能拒绝H0 .
没有落入 拒绝域
这并不意味着H0一定对,只是差异 还不够显著, 不足以否定H0 .
当然也不能总认为正常,有了问题不能 及时发现,这也要造成损失. 如何处理这两者的关系,假设检验面 对的就是这种矛盾.
罐装可乐的容量按标准应在 350毫升和360毫升之间. 现在我们就来讨论这个问题.
在正常生产条件下,由于种种随机因素 的影响,每罐可乐的容量应在355毫升上下 波动. 这些因素中没有哪一个占有特殊重要 的地位. 因此,根据中心极限定理,假定每 罐容量服从正态分布是合理的.
设
66, n 36, X ~ N (66,3.6 / 36)
2
66 P(66.82 X 69.18 66)
69.18 66 66.82 66 0.6 0.6
(5.3) (1.37) 1 0.9147 0.0853
小概率事件在一次试验 中基本上不会发生.
我们不妨先假设:这个盒子里有99个白球. 现在我们从中随机摸出一个球,发现是
此时你如何判断这个假设是否成立呢?
小概率事件在一次试验 中基本上不会发生.
假设其中真有99个白球, 摸出红球的概率只有1/100, 这是小概率事件. 小概率事件在一次试验中竟然发生了,不能不 使人怀疑所作的假设. 这个例子中所使用的推理方法,可以称为
若
69, n 36, X ~ N (69,3.6 / 36)
2
69 P ( 66.82 X 69.18 69 )
69.18 69 66.82 69 0.6 0.6 (0.3) (3.63) 0.6179 0.0002 0.6177
二、两类错误 假设检验会不会犯错误呢?
由于作出结论的依据是下述
小概率原理 不是一定不发生
小概率事件在一次试验中基本上 不会发生 .
由例2可见,在给定的前提下,接受还是 拒绝原假设完全取决于样本值, 因此所作检 验可能导致以下两类错误的产生: 如果H0成立,但统计量的实测值落入否 定域,从而作出否定H0的结论,那就犯了“ 以真为假”的错误 . 如果H0不成立,但统计量的实 测值未落入否定域,从而没有作出 否定H0的结论,即接受了错误的H0 ,那就犯了“以假为真”的错误 .
也就是说,“ | U | u 2 ”是一个小概率事件. 故我们可以取拒绝域为: W: | U | u 2
u 2 , u 2 称为临界值
如果由样本值算得该统计量的实测值落入 区域W,则拒绝H0 ;否则,不能拒绝H0 .
这里所依据的逻辑是: 如果H0 是对的,那么衡量差异大小的 某个统计量落入区域 W(拒绝域) 是个小概 率事件. 如果该统计量的实测值落入W, 也就是说, H0 成立下的小概率事件发生 了,那么就认为H0不可信而否定它. 否则 我们就不能否定H0 (只好接受它).
1.96 可以确定拒绝域为
( , 67.118 ) 与 ( 68.882 , + ) 因此,接受域为(67.118, 68.882)
66 P ( 67.118 X 68.882 66 )
68.88 66 67.12 66 0.45 0.45
那么,如何判断原假设H0 是否成立呢? 由于 是正态分布的期望值,它的估计量是 样本均值 X ,因此可以根据 X 与 0的差距 | X - 0| 来判断H0 是否成立. 当 | X - 0| 较小时,可以认为H 是成立的;
0
当 | X - 0 | 较大时,应认为H0不成立,即 生产已不正常.
这样,我们可以认为X1,…,X5是取自正态 总体 N ( , 2 )的样本,当生产比较稳定时, 2 是一个常数. 现在要检验的假设是:
H0:
0( 0 = 355)
它的对立假设是:
H1: 0
在实际工作中, 往往把不轻易 否定的命题作 为原假设.
称H0为原假设(或零假设,解消假设); 称H1为备择假设(或对立假设).
在显著性假设检验问题中,由于我们控 制的是犯第一类错误的概率,因此原假设H0 与备择假设H1地位是不平等的,他们不能随 意交换,在实际问题中如何确定H0 与H1是 非常重要的。一般H0要取那个在长期实践中 受到保护的论断,这个论 假设
根据统计调查的目的, 提出 原假设H0 和备选假设H1 作出 决策
这样做显然 不行!
通常的办法是进行抽样检查.
每隔一定时间,抽查若干罐 . 如每隔1小时, 抽查5罐,得5个容量的值X1,…,X5,根 据这些值来判断生产是否正常.
如发现不正常,就应停产,找出原因, 排除故障,然后再生产;如没有问题,就 继续按规定时间再抽样,以此监督生产, 保证质量.
很明显,不能由5罐容量的数据,在把 握不大的情况下就判断生产 不正常,因为 停产的损失是很大的.
的选择要根据实际情况而定。
常取
0.1, 0.01, 0.05.
现在回到我们前面罐装可乐的例中: 在提出原假设H0后,如何作出接受和拒绝 H0的结论呢?
罐装可乐的容量按标准应在350毫 升和360毫升之间. 一批可乐出厂前应 进行抽样检查,现抽查了n罐,测得容 量为X1,X2,…,Xn,问这一批可乐的容量 是否合格?
提出假设
H0: = 355
H1: ≠ 355
X 0 ~ N(0,1) 选检验统计量 U n 它能衡量差异 | X 0 | 大小且分布已知 .
由于 已知,
对给定的显著性水平,可以在N(0,1)表 中查到分位点的值 u 2 ,使
P{| U | u 2 }
P{| U | u 2 }
在上面的例子的叙述中,我们已经初 步介绍了假设检验的基本思想和方法 . 下面,我们再结合另一个例子,进一步 说明假设检验的一般步骤 .
例2 某厂生产的螺钉,按标准强度为68/mm2, 长期实践的经验表明,其长度服从正态分布 N( , 3.62 ). 若E(X)==68,则认为这批螺钉 符合要求,某日为了检验生产螺钉的机器是否 正常,实测了9个螺钉,长度为69.0,65.3, 68.4,67.7,66.8,70.2,71.0,69.5,68.1, 问机器是否正常? 解 第一步: 提出原假设和备择假设
(6.4) (2.49)
1 0.9936 0.0064 0.0853
要同时降低两类错误的概率 , ,或 者要在 不变的条件下降低 ,需要增 加样本容量.
/2
/2
H0 真
H0 不真
当n增大时,图形变得陡峭,因此α,β都减少。
任何检验方法都不能完全排除犯错
误的可能性.理想的检验方法应使犯两类 错误的概率都很小,但在样本容量给定的 情形下,不可能使两者都很小,降低一个, 往往使另一个增大. 假设检验的指导思想是控制犯第一类 错误的概率不超过, 即只对犯第一类 错误的概率加以控制,然后,若有必要, 通过增大样本容量的方法来减少 。
注
º
关于原假设与备择假设的选取
以例2为例计算犯第二类错误的概率β
犯第Ⅰ类错误时 P(拒绝H0|H0为真) P{| u | Z 2 }
P ( X 66.824 X 69.18) 0.05
下面计算犯第Ⅱ类错误的概率
=P(接受H0|H0不真) H0不真,即 68,可能小于68,也可能大于 68, 的大小取决于 的真值的大小.
H 0 : 68 H1 : 68
第二步: 取一检验统计量,在H0成立下
求出它的分布
能衡量差异 大小且分布 已知
X 68 u ~ N (0,1) 9
对给定的显著性水平 =0.05,查表确 第三步: Z 2 Z 0.025 1.96 ,使 定临界值
P{| u | Z 2 }
/2
/2
H0 真
H0 不真
两类错误是互相关联的, 当样本容量固 定时,一类错误概率的减少导致另一类错误概 率的增加.
现增大样本容量,取n = 64, = 66,则
X ~ N (66,3.6 / 64) 仍取=0.05,则 c z z 0.025 1.96