第五章+统计学教案(假设检验)
统计学课件第五章假设检验

比原有的药物更有效!
2015-5-11
统计学课件(第5章)
3
§5.1 假设检验的基本原理
二、什么是假设检验?
1. ●先对总体的参数(或分布形式)提出某种假设,
然后利用样本信息判断假设是否成立的过程。
2.
3.
●有参数检验和非参数检验
●逻辑上运用反证法,统计上依据小概率原理
●假设检验与区间估计的区别
2015-5-11
2015-5-11
统计学课件(第5章)
10
§5.1 假设检验的基本原理
五、两类错误
接受 H 0 拒绝 H 0
第一类错误 (α) 判断正确 (1-β)
11
H 0 真实
H 0 不真实
2015-5-11
判断正确 (1-α) 第二类错误 ( β)
统计学课件(第5章)
§5.1 假设检验的基本原理
• 两者关系
2015-5-11
统计学课件(第5章)
8
§5.1 假设检验的基本原理
• 与原假设对立的是备择假设 H 1 ,备择假设是在原 假设被否定时另一种可能成立的结论。
• 备择假设比原假设还重要,这是因为我们一般把 期望出现的结论作为备择假设。
• 备择假设(研究假设):是研究者想收集证据予
以支持的假设。
2015-5-11 统计学课件(第5章) 9
2015-5-11
统计学课件(第5章)
13
§5.1 假设检验的基本原理
七、检验统计量与拒绝域
• 检验统计量:是根据样本观测结果计算得到的, 并据以对原假设和备择假设做出决策的某个样本 统计量。 • 拒绝域:能够拒绝原假设的统计量的所有可能取 值的集合。拒绝域就是由显著性水平α所围成的 区域。 • 临界值:是根据给定的显著性水平确定的拒绝域 的边界值。
医学统计学假设检验

❖ 例如,根据大量调查,已知正常成年男性 平均脉搏数为72次/分,现随机抽查了20名 肝阳上亢成年男性病人,其平均脉搏为84 次/分,标准差为6.4次/分。问肝阳上亢男 病人的平均脉搏数是否较正常人快?
❖ 以上两个均数不等有两种可能:
第一,由于抽样误差所致;
第二,由于肝阳上亢的影响。
例如
已知正常成年男子脉搏平均为72 次/分,现随机检查20名慢性胃炎所致 脾虚男病人,其脉搏均数为75次/分, 标准差为6.4次/分,问此类脾虚男病人 的脉搏快于健康成年男子的脉搏?
2、假设检验的目的
判断是由于何种原因造成的不同,以做出决策。
3、假设检验的原理
反证法:当一件事情的发生只有两种可能A和B,为了肯
定其中的一种情况A,但又不能直接证实A,这时否定另一 种可能B,则间接的肯定了A。
概率论(小概率) :如果一件事情发生的概率很小,那
么在进行一次试验时,我们说这个事件是“不会发生的”。 从一般的常识可知,这句话在大多数情况下是正确的,但是 它一定有犯错误的时候,因为概率再小也是有可能发生的。
α是在统计推断时,预先设定的一个小概率值,是当H0 为真时,允许错误地拒绝H0的概率。
双侧与单侧检验界值比较
(2) 选定适当的检验方法,计算检验
统计量值 t 检验 Z 检验
❖ 设计类型 ❖ 资料的类型和分布 ❖ 统计推断的目的 ❖ n的大小 ❖ 如完全随机设计实验中,已知样本均数
与总体均数比较,n又不大,可用t检验, 计算统计量t值。
(1)建立假设,选定检验水准:
假设两种:一种是检验假设,假设差异完全由抽样误差造 成,常称无效假设,用H0表示。另一种是和H0相对立的备 择假设,用H1表示。假设检验是针对H0进行的。
统计学__假设检验(第五章)_(1)_2

右侧检验:统计量 > 临界值,拒绝H0
(2)假设检验中的两类错误
第一类错误(弃真错误)
原假设为真时,拒绝原假设
会产生一系列后果 第一类错误的概率为,被称为显著性水平
假设检验的结果 不一定正确!
第二类错误(取伪错误)
原假设为假时,接受原假设 第二类错误的概率为
原假设抽样分布
α
µ0
接受域 (原假设为真)
第五章 假设检验 ۩ ۩ 假设检验的基本原理 假设检验的步骤
۩
۩
一个总体参数的检验
利用p 值进行假设检验
总体参数
推断估计
抽样分布
参数估计
随机原则
统计量
假设检验
检验
假设检验在统计方法中的地位:
统计方法
描述统计法 推断统计法
参数估计
假设检验
正常人的平均体温是37oC吗?
当问起健康的成年人体温是多少时,多数人的回 答是37oC!这似乎已经成了一种共识……以下是一 位研究人员测量的50个健康成年人的体温数据。
一、假设检验的基本原理
1. 假设检验(hypothesis test)
1° 先对总体参数(或分布形式)提出某种假设,再利用样
本信息判断假设是否成立 2°参数检验——总体的分布形式已知; 非参数检验 3°逻辑上运用反证法,统计上依据小概率原理! 小概率是在一次试验中,一个几乎不可能发生的事 件发生的概率; 在一次试验中小概率事件一旦发生,我们就有理由
根据样本数据,计算的平均值为36.8oC,标准差为0.36oC 根据参数估计方法,健康成年人平均体温的95%的置信区 间为(36.7,36.9) 研究人员发现这个区间内并没有包括37oC! 因此,提出了“不应该再把37oC作为正常人体温的一个 有任何特定意义的概念”
统计学导论 科学出版社 第五章 假设检验

右侧检验
或
H1 : µ > µ0
H1 : µ > µ0
确定适当的检验统计量
什么检验统计量? 什么检验统计量?
用于假设检验问题的统计量 选择统计量的方法与参数估计相同, 选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为
z= x − µ0
σ
n
选择显著性水平α,确定临界值
☺
☺ ☺ ☺ ☺ ☺ ☺ ☺ ☺
抽取随机样本
均值 ☺ ☺ X = 20
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ... ... 因此我们拒 绝假设 µ = 50
... 如果这是总 体的真实均值 20
µ = 50 H0
样本均值
假设检验应用举例
例1:抽样检验食品包装机工作是否正常 : 例2:由样本推断产品次品率是否超标 : 例3:研究黑人儿童是否有民族意识 : 例4:检验电池寿命波动性是否有显著变化 : 5: 例5:判断男女职工看电视时间是否有显著差异 例6:检验新工艺是否比旧工艺更好 : 例7:研究生活习惯是否影响血压 : 例8:检验两次地震间的天数是否服从指数分布 : 例9:比较两公司进货次品率,作出进货决策 :比较两公司进货次品率,
3、特点 、
采用逻辑上的反证法 依据统计上的小概率原理
第一节 假设检验的基本原理
一. 假设检验的一般思想 二. 假设检验的步骤 三. 假设检验的两类错误
假设检验的过程
(提出假设→抽取样本→作出决策) 提出假设→抽取样本→作出决策)
提出假设 作出决策
拒绝假设! 拒绝假设 别无选择. 别无选择
总体
《生统》第五章 假设检验-t检验

ni
检验步骤:
1、提出无效假设与备择假设 H0:μ1=μ2,HA: μ1 ≠ μ2 2、计算 t 值
表5-2 非配对设计资料的一般形式
处理 1 2 观察值xij x11, x12,… x1j X21, x22,… x2j 样本含量ni n1 n2i 平均数 总体平均数 μ1 μ2
x1 x2
显著性检验的基本步骤:
(一)提出无效假设与备择假设 (二)计算值 计算公式为:
t x1 x 2 S x1 x2
结论:差异极显著
二、配对设计两样本平均数 差异显著性检验
1、自身配对 2、同源配对 配对设计两样本平均数差异显著性检验的基本步骤: (一)提出无效假设与备择假设 (二)计算 t 值
d t Sd
Sd Sd n
d d
n(n 1)
2
d
2
n(n 1)
( d ) 2 / n
检验步骤:
2、计算 t 值
S x1 x2
( x1 x1 ) 2 ( x2 x2 ) 2 ( 1
(n1 1) (n 2 1)
n1
1 ) n2
1、提出无效假设与备择假设
sx1 x2
2 S12 (n1 1) S2 (n2 1) 1 1 (n1 1) n2 1) n1 n2
|t|<t0.05, |t|≥ t0.01 , 则 P>0.05 则 P≤0.01 差异不显著 差异显著 差异极显著 t0.01 ≤|t|< t0.05 ,则 0.01<P≤0.05
《统计学》第5章 假设检验

假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),
第五章 假设检验

0.05
结论:
改良后的新品种产量有显著提高
0
1.645
z
总体均值的检验
(大样本检验方法的总结)
假设 双侧检验 H0 : =0 H1 : 0 左侧检验 H0 : 0 H1 : <0 右侧检验 H0 : 0 H1 : >0
假设形式
已知:
统计量
z
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(双侧检验 )
抽样分布
拒绝H0 置信水平 拒绝H0 1-
/2
/2
临界值
0
临界值
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
拒绝H0 置信水平
第 5章 假设检验
5.1 假设检验的基本问题 5.2 总体均值的检验 5.3 总体比例的检验
假设检验在统计方法中的地位
统计方法
推断统计
描述统计
参数估计
假设检验
5.1 假设检验的基本问题
是否法国人的地理知识要比美国 人丰富?
1988年7月28日的纽约时报上刊登了一篇有关 人们地理知识的文章。这篇文章中描述了一个 由国家地理协会委托GalluP公司所做的研究结 果。研究者们从一些国家抽取许多成年人并请 他们鉴别在一个地图上的16个地方(包括13个 国家、中非、波斯湾和太平洋);然后把每个 人答对的个数加起来。 四个国家的样本中答对的个数的均值为:美国 6.9;墨西哥 8.2;大不列颠 9.0;法国 9.2。
数理统计之假设检验学习教案

第五页,共99页。
检验一个H0时,是根据检验统计量 来判决是否接受(jiēshòu)H0的,而检验 统计量是随机的,这就有可能判决错误. 这种错误有以下两类:
H0事实上是正确的,但被我们拒绝了 ,称犯了“弃真”的(或称第一类)错误.
H0事实上是不正确的,但被我们接受
(jiēshòu)了,称犯了“存伪”的(或称
2 82
检验假设 H0 : 570, H1 : 570
抽出10个样品进行检验,测得其折断力为
572 578 570 568 572 570 570 572 596 584 看在H0条件下会不会产生不合理的现象,
第10页/共99页
第十一页,共99页。
样本均值 X为 的无偏估计,X能较好反映 的大小.
P{拒绝H0| H0为真} 称 为显著性水平。
第7页/共99页
第八页,共99页。
参数(cānshù)假设检验解题步骤
1 根据问题提出原假设H0,同时给出对立假设H1(备选假设); 2 在H0成立的前提下,选择合适的统计量,这个统计量要包含待检的
参数,并求得其分布; 3 给定显著性水平 ,按分布写出小概率事件及其概率表达式; 4 由样本计算出需要的数值; 5 判断小概率事件是否发生,是则拒绝(jùjué),否接受
(x)
2
| t | t 2 则H0相容,接受H0 t
0
2
t x
2
| t | t 2 则否定H0,接受H1
选择假设H1表示(biǎoshì)Z可能大于μ0,也可能小于μ0 这称为(chēnɡ wéi)双边假设检验。
第28页/共99页
第二十九页,共99页。
例5 对一批新的某种液体存储(cún chǔ)罐进行耐裂试验,
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数进行推断。
前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证,从而作出真假判断。
通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。
通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。
2一、假设检验概述与基本概念1、假设检验概述2、假设检验的有关基本概念二、总体参数检验1、总体平均数的检验2、总体成数的检验3、总体方差的检验三、总体非参数检验1、符号检验2、秩和检验3、游程检验一、假设检验的有关基本概念;二、总体平均数与总体成数的检验;三、非参数检验;一、假设检验的基本思路与有关概念;二、两类错误的理解及其关系;一、假设检验概述假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设所作出的检验就是假设检验。
基本思路:首先,对总体参数作出某种假设,并假定它是成立的。
然后,根据样本得到的信息(统计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个假设。
所谓合理性,就是看是否在一次的观察中出现了小概率事件。
小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。
这种事件可以称其为“实际不可能事件”。
二、假设检验的基本概念:”表示(也称“零假设”、“虚无假设” ) 0 (一)原假设与对立假设这是研究者对总体参数事先提出的假设。
通常以总体没有发生显著变化为原假设。
1、原假设:用“ H2、对立假设:用“H:”表示 1对立假设也称“备择假设”这是与原假设完全对立的、矛盾的假设,假设总体发生了显著的变化。
(二)显著性水平与显著性差异1、显著性水平:在统计检验中,判断假设是否合理,是根据一定的标准来确定的,这个标准是在检验之前由研究者事先主观选定的一个小概率值,用α表示.这个α就是显著性水平。
常用的α有 0.1、0.05或 0.01等2、显著性差异:如果统计量和假设的参数值存在差距,有两种可能:(1)差距不是很大(即不在小概率范围内出现),即可认为总体没发生显著变化。
可接受原假设。
(2)差距很大(即出现在小概率范围内),即可认为总体发生了显著变化。
说明存在着显著性差异,故拒绝原假设。
(三)双侧检验与单侧检验1、双侧检验(双尾检验):双侧检验要求同时注意估计值偏高和偏低的倾向,这时,差距不分正负,给出的显著水平α平分在两侧。
2、单侧检验(单尾检验):(有左单侧和右单侧两种)单侧检验只注意估计值是否偏高(或偏低),它是单方向的,给出的显著性水平α集中在同一侧。
偏高时,差距为正,为右单侧检验;偏低时,差距为负,为左单侧检验。
(四)两种类型的错误1、第一类错误——以真为假此类错误是将原属正确的 H:错当成不正确的而给予否定了。
统计学中称这种错误为α错误,属0第一类错误,也叫做“弃真错误”。
α:错当成正确的而给予肯定了。
统计学中称这种错误为β错误,属0 2、第二类错误——以假为真第二类错误,也叫做“存伪错误”。
此类错误是将原属不正确的 H在统计检验中,必须做出否定H:或肯定H:的抉择,因此,不可避免地可能犯α错误或β错误。
00如果减小α错误,势必增加犯β错误的可能性;而若为了减小β错误,α错误必然增大。
所以,要同时减小犯两类错误的概率,就应增大样本容量。
此外,取多大的值,也应取决于所要研究的问题的性质。
(五)拒绝域、接受域和临界值1、拒绝域:计算结果表明总体发生了显著变化,而没有理由不拒绝原假设的区域。
2、接受域:计算结果表明总体没发生显著变化,从而接受原假设的区域。
3、临界值(临界点):拒绝域与接受域的界限。
表示在给定一个显著水平的前提下,假定总体发生显著变化的数值界限。
三、检验中决定使用的概率分布(以平均数的检验为例)假设检验中使用正态(Z)分布或t 分布的条件条件总体σ条件总体σ2 2 2 2 已知总体σ未知已知总体σ未知大样本正态分布正态分布( n 大于 30 )( Z 值表)( Z 值表)小样本正态分布 t 分布(总体为正态或近似正态)( Z 值表)( t 值表)四、假设检验的程序1、提出假设原假设 H:(以总体未发生显著变化为原假设) 0备择假设 H:(总体发生显著变化) 12、选择一个显著水平α等于对犯第一类错误的概率给出具体数值,通常显著水平用 0.1、0.05或0.01等。
3、构造一个检验值(选择 Z或 t 分布),x,XxX ,Z, 或 tS,xxn4、作出判断根据统计量 Z(或 t )的计算结果,看其是落在接受区域或者落在拒绝区域而作出接受或拒绝原假设的决定。
一、总体平均数的检验(一)总体标准差已知1、双侧检验2 52.1 5 600/cm, 250 /2cm 1005 5702/cm 0.051002 n100 σ250/cm α = 0.05 22 5600/cm x,5570/cm X, 2 H5600/cm X,02 H5600/cm X,1,5570,5600xX ,,1.2 Z250,x 100α = 0.05ZZ1.96 α/2| Z | < | Z | α/2,,Z, xx1.96×25490.050.05 1.2 221.96 0 1.965551 5600 56492、单侧检验52.2250450248550250 248 x,X, n50 σ4 α = 0.05 H? 250 X0H250 X1xX,248,250 3.54 Z,,4,x50α = 0.05ZZ1.645 α| Z | | Z|α,,Z,xx1.645×0.5660.930.053.54 1.645249.07 250(二)总体标准差未知1、双侧检验52.3 0.15100.1640.0151010 tn10 S0.015 α = 0.10 xx,X,0.15 0.164HX,0.15 0HX,0.15 1x,X0.164,0.15 Z,,2.8 S0.015x 10,1n,1α = 0.101019 t t1.833 α/2 | t | > | t| α/2,,t, xx1.883×0.0050.00920.10 0.10 221.833 0 1.8332.80.1408 0.15 0.15922、单侧检验52.4269410015526 tn25 S15 α = 0.05 xx,X,100 94HX,100 0HX,100 1x,X94,100 Z,,2 S15x26,1n,1α = 0.0526125 t t1.708 α| t | > | t| α,,t, xx1.708×35.1240.052 1.70894.876 100二、总体成数的检验1、双侧检验52.5 80400332520020.8×0.2 α = 0.05 pP80% p332/400 = 83% n200 σ,,Z,1.96×0.020.0392 ppH P0.8 0H P ? 0.8 10.050.05 221.5 1.96 0 1.960.7608 0.80 0.8392p,P0.83,0.80 1.5 Z,,P(1,P)0.8,0.2 n200α = 0.05ZZ1.96 α/2| Z | < | Z | α/22、单侧检验52.6 40%60215%60n60 σ20.4×0.6 α = 0.05 pP40% p21/60 = 35%H P ? 0.4 0H P 0.4 1p,P0.35,0.400.791 Z,,P(1,P)0.4,0.6n60α = 0.05ZZ1.645 α| Z | | Z| α,,Z,pp1.645×0.06320.1040.05 0.7911.645 00.296 0.40三、总体方差的检验主要是检验事物的变异程度是否发生显著变化。
总体方差检验的统计量( Z与 t 已不适合):则 x22 服从自由度 df =n-1 的 x分布。
1、单侧检验(1)右单侧检验2 52.7 σX36 104252 x22 n10 S42 σ36 α= 0.052 Hσ ? 36 02 Hσ 36 12n,S,(1)9422 x,,10.5 236,22 α = 0.05 df 9 xx16.919 0.0522 x10.5 x 16.9190.05α2 10.5 16.919 x(2)左单侧检验52.8 σ2.425 S2.112 n25 S2.1 σ2.4 α= 0.01 x 2 2 Hσ? 2.4 5.76 02 Hσ 5.76 122n,S,(1)242.12 x,,18.375 25.76, 22 α=0.01 df 24 xx10.856 0.9922 x18.375 x 10.8560.99α10.856 18.375 x22、双侧检验52.9 σ2016S2422 xn16 S24 σ20 α= 0.0222 Hσ 20400 02 Hσ ? 400 122n,S,(1)15242 x,,21.6 2400,,2 α = 0.02αx2,22221 xdf15 xx5.229 x30.578 0.990.012222x30.578 x21.6x5.2290.010.99,, 0.01 0.01 222 5.229 21.6 30.578 x应完成的作业(书后P168)一、P168-P171的选择、判断与填空题要求全做(可直接做在习题上)二、做好复习工作的同时,可通过P172的第1、2、3、5、8等简答题加以思考本章的主要内容。
三、计算题选做第1、2、3、4、5、6题(要求书面完成)。