8 假设检验
第8 假设检验(共80张PPT)

8.1 8.2 8.3 8.4
假设检验的根本问题 一个总体参数的检验 两个总体参数的检验 假设检验中的其他问题
我认为该企业生产的零件的平
均长度为4厘米!
什么是假设? 对总体 参数的一种看法
总体参数包括总 体均值、比例、方 差等
举例说明假设检验的根本思路
某单位职工上月平均收入为210元,这个 月的情况与上月没有大的变化,我们设想平均 收入还是210元.
样本均值的抽样分布
置信水平
拒绝域
1-
接受域
临界值
H0
样本统计量
如果备择假设具有符号“>〞,拒绝域位于抽样分 布的右侧,故称为右侧检验
样本均值的抽样分布
置信水平
1- 接受域
拒绝域
H0
样本统计量
临界值
请判断它们的拒绝域:
〔1〕假设检验的假设为H0:m=m0 ,H1: m≠m0,那么拒绝域为〔 〕。
〔2〕假设检验的假设为H0:m≥m0 ,H1: m < m0,那么拒绝域为〔 〕。
〔3〕假设检验的假设为H0:m≤m0 ,H1: m > m0,那么拒绝域为〔 〕。
检验统计量:Z > Z;
Z > Z/2 或Z <-Z/2 ;
Z <-Z
决策规那么
给定显著性水平 ,查表得出相应的临界 值 将检验统计量的值与 水平下的临界值进 行比较 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 得出拒绝或不拒绝原假设的结论
H0:m=10 H1:m≠10
例 6.2
某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设。
第8章假设检验

二、两均数比较的u检验
完全随机设计中两组计量资料的比较
观察性研究中分别从两个总体中随机抽取两个计 量资料样本进行比较,且两组的样本含量n1和n2要 求等于或大于30 基本原理:在H0成立的条件下,即两样本是从 同一总体随机抽取的,其均数之差可以大于0,或小 于0,围绕0分布。 差值 X1 X 2 服从均数为 1 2 0,标准差(两均数 差的标准误)为 S X X 的正态分布
0
所代表的未知总体均数记作μ;检验的目的是推断μ与μ0
是否有差别
u
X 0 S/ n
例 8 –2
n 85
S 5.3cm
X 171.2cm
168.5cm
1. 建立假设、确定检验水准α。
H 0 : 168.5 (与1995年相比,2003年当地20岁应征男青年的身 高没有变化)
2
p
的正态分布
统计量:
u p 0 p 0 0 (1 0 ) / n
p
例8 – 4
π0 =8.5% ,n=1000,p=5.5%
1.建立假设,确定检验水准。 H0:π=8.5% H1:π< 8.5% 单侧检验,α=0.05。 2.计算检验统计量u值
0.055 0.085 u 3.402 0.085(1 0.085) /1000
2. 样本数据不要求一定服从正态分布总体。
2. 两总体方差相等(方差齐性,即 12 22 )。
3. 理论上要求:单样本是从总体中随机抽取,两样本为随 机分组资料;观察性资料要求组间具有可比性,保证因果 推论的合理性。
一、单样本均数的u检验
样本均数与总体均数比较,总体均数指已知的理论值、 标准值或经过大量观察所得到的稳定值,记作 ;样本
概率论与数理统计(8)假设检验

概率论与数理统计(8)假设检验第八章假设检验第一节假设检验问题第二节正态总体均值的假设检验第三节正态总体方差的检验第四节大样本检验法第五节 p值检验法第六节假设检验的两类错误第七节非参数假设检验第一节假设检验问题前一章我们讨论了统计推断中的参数估计问题,本章将讨论另一类统计推断问题——假设检验.在参数估计中我们按照参数的点估计方法建立了参数的估计公式,并利用样本值确定了一个估计值,认为参数真值。
由于参数是未知的,只是一个假设(假说,假想),它可能是真,也可能是假,是真是假有待于用样本进行验证(检验).下面我们先对几个问题进行分析,给出假设检验的有关概念,然后总结给出检验假设的思想和方法.一、统计假设某大米加工厂用自动包装机将大米装袋,每袋的标准重量规定为10kg,每天开工时,需要先检验一下包装机工作是否正常. 根据以往的经验知道,自动包装机装袋重量X服从正态分布N( ).某日开工后,抽取了8袋,如何根据这8袋的重量判断“自动包装机工作是正常的”这个命题是否成立?请看以下几个问题:问题1引号内的命题可能是真,也可能是假,只有通过验证才能确定.如果根据抽样结果判断它是真,则我们接受这个命题,否则就拒绝接受它,此时实际上我们接受了“机器工作不正常”这样一个命题.若用H0表示“”,用H1表示其对立面,即“”,则问题等价于检验H0:是否成立,若H0不成立,则H1:成立.一架天平标定的误差方差为10-4(g2),重量为的物体用它称得的重量X服从N( ).某人怀疑天平的精度,拿一物体称n次,得n 个数据,由这些数据(样本)如何判断“这架天平的精度是10-4(g2)”这个命题是否成立?问题2记H0: =10-4,H1: ,则问题等价于检验H0成立,还是H1成立.某种电子元件的使用寿命X服从参数为的指数分布,现从一批元件中任取n个,测得其寿命值(样本),如何判定“元件的平均寿命不小于5000小时”这个命题是否成立?记问题3则问题等价于检验H0成立,还是H1成立.某种疾病,不用药时其康复率为,现发明一种新药(无不良反应),为此抽查n位病人用新药的治疗效果,设其中有s人康复,根据这些信息,能否断定“该新药有效”?记问题4则问题等价于检验H0成立,还是H1成立.自1965年1月1日至1971年2月9日共2231天中,全世界记录到震级4级及以上的地震共计162次,问相继两次地震间隔的天数X是否服从指数分布?问题5记服从指数分布,不服从指数分布.则问题也等价于检验H0成立,还是H1成立.在很多实际问题中,我们常常需要对关于总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学中将这些有待验证的陈述或命题称为统计假设,简称假设.如上述各问题中的H0和H1都是假设.利用样本对假设的真假进行判断称为假设检验。
概率论与数理统计第八章假设检验

为判断所作的假设是否正确, 从总体中抽取 样本, 根据样本的取值, 按一定的原则进行检 验, 然后, 作出接受或拒绝所作假设的决定.
整理课件
2
我们主要讨论的假设检验的内容有
参数检验 总体均值、均值差的检验 总体方差、方差比的检验
H0: Θ0 vs H1: Θ1,
根据样本,构造一个检验统计量T 和检验法则: 若与T的取值有关的一个小概率事件W发生,则 否定H0,否则接受H0,而且要求
P(W|H0)
此时称W为拒绝域,整为理课检件 验水平。
11
例 3. 某厂生产的螺钉,按标准强度为68克/mm2,
而实际生产的螺钉强度 X 服从 N ( ,3.6 2 ). 若 E ( X ) = = 68, 则认为这批螺钉符合要求,否
7
所以我们否定H0, 认为隧道南的路面发生交 通事故的概率比隧道北大.
做出以上结论也有可能犯错误。这是因为 当隧道南北的路面发生交通事故的概率相同, 而3起交通事故又都出现在隧道南时, 我们才犯 错误。这一概率正是P=0.043.
于是, 我们判断正确的概率是1-0.043=95.7%
整理课件
8
假设检验中的基本概念和检验思想 (1) 根据问题的背景, 提出原假设
再作一个备择假设
H1: p> 0.35. 在本问题中,如果判定H0不对,就应当承认H1.
检验: 三起交通事故的发生是相互独立的, 他们
之间没有联系.
如果H0为真, 则每一起事故发生在隧道南的 概率都是0.35, 于是这三起交通事故都发生在隧
道南的概率是
P= 0.353 ≈ 0.043.
第八章 假设检验

x z2
x z2 /
s n
上例,我们用求置信区间的方法,来判断 原假设是否合理。 大样本下满足中心极限定理,样本均值的 抽样分布服从正态分布,从而有置信区间:
x z2 s 24 =986 1.96 n 40
假设检验的步骤
1.确定原假设和备选假设 2.选择检验统计量 3.指定检验的显著性水平 4.建立拒绝原假设的规则 5.收集样本数据,计算检验统计量的值 6.将检验统计量的值域拒绝规则的临界值比较, 以决定是否拒绝原假设。或者,由检验统计量 的值计算p值,利用p值确定是否拒绝原假设。
x 2.92 3 z 2.67 / n 0.18 / 6
x z ~ N (0,1) / n
根据显著性水平α=0.01,对应的拒绝域面积为 0.01,临界值为-2.33 Z<-2.33,所以拒绝H0,即可认为没听咖啡的容量 不足3磅。 统计证据支持对HILLTOP咖啡重量不足采取投诉措 施。
(978.56,993.44)该区间不包含u0=1000, 因此我们拒绝原假设H0.检验表明,该包 装机未能正常工作。
总体均值的检验:小样本情形
小样本下,已知总体为正态分布,我们考 虑以下两种情况: 1.总体方差已知 2.总体方差未知 在总体方差已知的情况下,即使样本容量 较小,但样本平均数的抽样分布总是以平 均值 为均值,以 x 为标准差的正态分 布。因此其检验过程和检验统计量同大样 本情形。
拒绝域为α/2 拒绝域为α/2
z / 2
拒绝域
0
z / 2
第8章 假设检验

ˆ H0 : 0 ˆ H :
0 0
备择
假设
研究者想收集证据予以支持的假设。
1. 与原假设对立的假设 2. 总是有, 或 3. 表示为 H1
例如:
ˆ H0 : 0 ˆ H0 : 0 ˆ H :
0 0
ˆ H1 : 0 ˆ H1 : 0 ˆ H :
拒绝 H0
.025
拒绝 H0
.025
t
ta
2 . 262 /2
-2.262
0
2.262
t
不拒绝原假设,没有证据表明该供 货商提供的配件是不符合要求的。
二、总体比例的检验
大样本
p ~ N(,
(1 )
n
)
设假设的总体比例为0,总体比例的检验统计量为:
z
p 0
0 (1 0 )
拒绝 H0
.025
拒绝 H0
.025
-1.96
0
1.96
Z
由于是双侧检验,拒绝域在左右两侧,所以临界值为:
z za / 2 1.96
在显著性水平a=0.05上不拒绝原假设,表明样本提供的证据还 不足以推翻原假设,因此,没有证据表明该天生产的饮料不符
合标准要求。
【例】某批发商欲从生产厂家购进一批灯泡,根据 合同规定,灯泡的使用寿命平均不能低于1000小时。 已知灯泡使用寿命服从正态分布,标准差为20小时。 在总体中随机抽取100只灯泡,测得样本均值为960 小时。批发商是否应该购买这批灯泡? (a=0.05)
n
假设
双侧检验
左侧检验
右侧检验
假设形式
H0 : 0 H1 : 0
第八章 假设检验 (《统计学》PPT课件)

第二节 一个正态总体的假设检验
一、正态总体
设总体X ~ N(m, 2),抽取容量为n的样本 x1, x2, xn
样本均值 X 与方差S2 计算公式分别为:
2
1 n 1
n i1
(xi
X)
我们将利用上述信息,来检验关于未知参数均值 和方差的假设。
总体参数
均值
方差
总体方差已知
z 检验
(单尾和双尾)
总体方差已知
t 检验
(单尾和双尾)
2 检验
(单尾和双尾)
第二节 一个正态总体的假设检验
二、均值m的假设检验
1.H0:m=m0
2.选择检验统计量:
2已知: Z X m0 ~ N(0,1)
/ n
2未知:
小样本: t X m0 ~ t(n 1)
这个值不像我 们应该得到的 样本均值 ...
...因此我们拒绝 原假设μ=50
... 如果这是总 体的假设均值
60
μ=80
H0
样本均值
第一节 假设检验概述
三、假设检验的程序
一个完整的假设检验过程,通常包括以下几个步骤:
首先,设立原假设H0与备选假设H1; 第二步,构造检验统计量,并根据样本观察数据
小样本:当 t t
2
,则拒绝原假设,反之则接受H0;
5.得出结论。
二、均值m的假设检验
6.例题分析
[例8.3] 某广告公司在广播电台做流行歌曲磁带广告 ,它的插播广告是针对平均年龄为21岁的年轻人的,标 准差为16。这家广告公司经理想了解其节目是否为目标 听众所接受。假定听众的年龄服从正态分布,现随机抽 取400多位听众进行调查,得出的样本结果为x 25 岁S2,18 。以0.05的显著水平判断广告公司的广告策划是否符合 实际?
统计学第8章假设检验

市场调查中常用的假设检验方法包括T检验、Z检验和卡方 检验等。选择合适的检验方法需要考虑数据的类型、分布 和调查目的。例如,对于连续变量,T检验更为适用;对于 分类变量,卡方检验更为合适。
医学研究中假设检验的应用
临床试验
在医学研究中,假设检验被广泛应用于临床试验。研究 人员通过设立对照组和实验组,对不同组别的患者进行 不同的治疗,然后收集数据并使用假设检验来分析不同 治疗方法的疗效。
03 假设检验的统计方法
z检验
总结词
z检验是一种常用的参数检验方法,用于检验总体均值的假设。
详细描述
z检验基于正态分布理论,通过计算z分数对总体均值进行检验。它适用于大样本 数据,要求数据服从正态分布。z检验的优点是简单易懂,计算方便,但前提假 设较为严格。
t检验
总结词
t检验是一种常用的参数检验方法,用于检验两组数据之间的差异。
卡方检验
总结词
卡方检验是一种非参数检验方法,用于 比较实际观测频数与期望频数之间的差 异。
VS
详细描述
卡方检验通过计算卡方统计量来比较实际 观测频数与期望频数之间的差异程度。它 适用于分类数据的比较,可以检验不同分 类之间的关联性。卡方检验的优点是不需 要严格的假设前提,但结果解释需谨慎。
04 假设检验的解读与报告
详细描述
t检验分为独立样本t检验和配对样本t检验,分别用于比较两组独立数据和同一组数据在不同条件下的 差异。t检验的前提假设是小样本数据近似服从正态分布。t检验的优点是简单易行,但前提假设需满 足。
方差分析
总结词
方差分析是一种统计方法,用于比较两个或多个总体的差异。
详细描述
方差分析通过分析不同组数据的方差来比较各组之间的差异。它适用于多组数据的比较,可以检验不同因素对总 体均值的影响。方差分析的前提假设是各组数据服从正态分布,且方差齐性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(X 1 X 2)-(1 2) X1 X 2 u = 2 2 X1 X 2 1 / n1 2 / n2 2.9 5.2 1.92 / 32 2.7 2 / 40 4.23
3. 确定P值,作出统计决策
检验界值u0.05/2 =1.96,|u|=4.23>uα/2 ,得
=0.05 (双侧检验)
2. 计算统计量 X 0 171.2 168.5 u 4.70 5.3 / 85 / n 3. 确定P值,作出统计决策 检验界值u0.01/2 =2.58,|u|>u0.01/2 ,得P<0.01, 按0.05检验水准拒绝H0 ,接受H1 ,即2003年该地 20岁应征男青年身高与1995年相比,差别有统计学 意义。可以认为2003年该地20岁应征男青年身高比 1995年增高了。
2
总体均数的1 可信区间: u / 2 X
n
引例1:随机抽取一些常年锻炼的成年男子,测
其脉搏数,推断他们的平均脉搏数`X0与一
般正常成年男子脉搏数0是否有差别,以
说明锻炼对成年男子脉搏数的影响。
问题转化为:由抽样结果判断假设 “ = 0 ”是否成立 ?
引例2:将一批白鼠随机分为两组,分别喂不同饲
于一般新生儿。
(提出假设→抽样实验→作出决策)
提出假设
我认为矿区新 生儿头围与一 般的没有差别
作出决策
拒绝假设! 别无选择。
总体
抽样实验 P<0.05
假设检验的基本步骤
1、建立假设,确定检验水准: H0: μ 1=μ 2 (检验假设) H1: μ 1≠μ 2 (备择假设) 0.05(双侧) 2、选定方法,计算统计量:
检验水准和两类错误
假设检验就好像
一场审判过程
H0: 无罪,H1: 有罪 H0: 无差异,H1: 有差异
陪审团审判 裁决 无罪 实际情况 无罪 正确 有罪 错误 决策 接受H0 拒绝H0
假设检验
实际情况
H0为真
1
Ⅰ型错误
H0为假
Ⅱ 型错误
b 1b
有罪
错误
正确
表8-1
假设检验的两类错误(概率) 假设检验结论
P<0.01,按0.05检验水准拒绝H0 ,接受H1,即
两组平均退热天数差别有统计学意义,可认为两
组疗效不同,试验组平均退热天数比对照组短。
例7-7 95%可信区间: 3.3 ~ 1.3 (天)
可信区间 用 途
推断总体均数的范围
假设检验
推断总体均数是否相等 在检验假设条件之下,考 察样本均数与总体均数的差异 是否是抽样误差造成的。
当=0.05时,CI以95% 含 义 的可能性包含总体均数。
确定可信度(1-),计算 在H0 条件下,计算得到一 得到一个区间 个统计量,从而得到P值
方
未知:
法
x t / 2, S X
1.建立假设,确定检验水准
2.计算统计量 3.确定P值,作出统计决策
已知或未知但为大样本:
x u / 2 X 或 x u / 2 S X
0.025 -1.96 0
0.025 1.96
0.05 -1.645 0
图8-3 双侧u检验的检验水准
图8-4 单侧u检验的检验水准
总体均数的假设检验:
单侧检验比双侧检验更易得到拒绝H0的结论。
双侧检验
抽样分布
拒绝域 1- /2 接受域 /2
置信水平
拒绝域
解:本例,n=85,`X=171.2cm, μ0 =168.5cm,
用样本标准差作为的估计值,即
ˆ =S 5.3cm
1. 建立假设,确定显著性水平 H0: μ=168.5 (2003年该地20岁应征男青年 平均身高与1995年相比没有变化) H1: μ≠168.5 (2003年该地20岁应征男青年平 均身高与1995年相比有变化)
-2.273
0
假设检验中的小概率原理
小概率事件在一次试验中基本上不会发生
1. 在一次试验中,一个几乎不可能发生的事件
P<0.05(或P<0.01)----小概率事件
2. 在一次试验中小概率事件一旦发生,我们就有理
由拒绝检验假设。
4. 统计决策是否拒绝H0:
显著性水平(significance level):
料,一段时间后记录体重增加值,得到两
样本均数`X1、`X2,推断喂不同饲料的白鼠
平均体重增加值1、2是否有差别,以说
明不同饲料对白鼠体重增加值的影响。
问题转化为:由抽样结果判断假设 “ 1= 2 ” 是否成立 ?
假 设 检 验
事先对总体特征做出某种假设,通过分析样 本信息,判断该样本信息是否支持这种假设,从
为33.89cm,问该矿区新生儿的头围总体均数与一
般新生儿头围总体均数是否不同?
1.差异:
a 个体差异,抽样误差所致 矿区环境条件不影响新生儿头围大小 — 无统计学意义(no significance) b 总体间固有差异 矿区环境条件对新生儿头围有影响
— 有统计学意义(significance)
3.在H0条件下计算检验统计量:
2 2 X ~ N ( 0 , 0 ) X ~ N ( 0 , 0 / n)。
X 0 经过u变换,u ~N (0,1)。 0 / n
2 本例,n 55, 0 1.99 2,
在H 0 : 34.50条件下, 33.89 34.50 u 1.99 / 55 2.273
判断差别属于哪一种情况
2. 假设: 假设矿区新生儿头围均数与一般新
生儿头围总体均数0相同 ----检验假设(hypothesis to be tested)/零假设(null hypothesis) H0: =0 ,或 H0: =34.50
`X=33.89
----备择假设(alternative hypothesis) H1: 0 ,或H1: 34.50 假设H0条件成立,在这个条件下来考察样本均数与 总体均数的差异能否用抽样误差解释。
到的大于等于(或小于等于)现有样本统计量的概率。 在H0成立的假设下,出现当前检验统计量
及更极端情况的概率。
• • 左侧检验,小于等于 阴影部分 面积为P
当前检验统计量的概率
右侧检验,大于等于 当前检验统计量的概率 -2.273 0
2.273
利用 P 值进行决策
P≤ 按检验水准拒绝H0 ,接受H1, 差别有统计学意义; P > 按检验水准不拒绝H0 , 差别无统计学意义;
和 b 的关系
和b的关系就像 翘翘板,小b就 大, 大b就小
不能同时减 少两类错误!
b
双侧检验和单侧检验
two-sided test & one-sided test
研究的问题
假设
双侧检验
单侧检验 左侧检验 右侧检验
H0 H1
= 0 ≠0
= 0 < 0
= 0 > 0
H1: 1` 2 ,或μ 1-μ
2
≠0
在H0条件下, X X )~N ( 0, ( 1 2 1 2 X 统计量u值:
(X 1 X 2)-(1 2) u = X1 X 2
1X2
)
X X
1
2
1 / n1 2 / n2
2
2
例8-3 为比较某药治疗流行性出血热疗效,将72名 流行性乙型脑炎患者随机分为试验组和对照组,两 组的样本量、均数、标准差分别为:
H1: <0
1b b
X1 X2
H0: 0 1
0
图8-2 `型和型错误示意图(以单侧u检验为例)
(1-)即可信度(confidence level):重复抽样时,可 信区间包含总体参数的概率。 (1-b)即把握度(power of a test):两总体确有差别 时,按水准检验出有差别的能力,又称检验效能。
P/2
/2
u
0
u0.05/2
本例,|u|=2.27,u0.05/2=1.96,u0.01/2=2.58, u0.05/2< |u| <u0.01/2,0.01<P<0.05(P=0.023) 按=0.05检验水准拒绝H0 ,接受H1,样本均数
与总体均数的差异有统计学意义,可以认为该矿区新
生儿头围均数与一般新生儿不同,矿区新生儿头围小
已知总体均数μ0是否有差别。
计算统计量:
已知方差或方差的估计值 ,计算u
2
X 0
/ n
例8-2
1995年某地20岁应征男青年平均身高为
168.5cm,2003年在当地20岁应征男青年中随机 抽取85人,平均身高为171.2cm,标准差为5.3cm, 问2003年该地20岁男青年的身高与1995年相比是 否不同?
根据统计推断目的、设计、资料组数、样本含量等 选择方法。如两组大样本比较u检验、小样本比较用t检验、 方差齐性检验用F检验。
3、确定P值,作出统计决策:
P ≤ 拒绝H0 ,差别有统计学意义; P >
不拒绝H0 ,差别无统计学意义。
样本均数与总体均数比较的u检验
大样本量:所代表的未知总体均数,记为μ; 总体均数:记为0; 检验目的:推断样本所代表的未知总体均数μ与
假设检验
hypothesis test
统计学
统计描述
统计推断
参数估计
假设检验
统计推断(statistical inference)
1. 参数估计