第7章 假设检验(2014)
第7章 假设检验(2014)

假设检验不能证明原假设正确
1. 假设检验中通常是先确定显著性水平,这就等 于控制了第Ι类错误的概率,但犯第Ⅱ类错误的 概率却是不确定的。
2. 在拒绝H0时,犯第Ⅰ类错误的概率不超过给定 的显著性水平a。在不能拒绝H0时,也难以确切 知道第Ⅱ类错误发生的概率
3. 采用“不拒绝”而非“接受”,避免了错误发 生的风险。
4、计算检验统计量的样本观测值
将检验统计量的值与a 水平的临界值进行比较 给定显著性水平a,查表对应的临界值za 或za/2
双侧检验
抽样分布
拒绝H0
a/2
1 -a
置信水平 拒绝H0
a/2
临界值 H0
临界值
抽样分布拒绝H0a左侧检验置信水平
1 -a
H0 临界值
右侧检验
抽样分布
1 -a
置信水平 拒绝H0
2、统计量落在拒绝域不同的地方,实际的显著性是不 同的。
3、P值给出的是实际算出的显著水平,比根据统计量 检验提供更多的信息,可根据需要决定是否拒绝 原假设。
统计上的显著与P值
1. 当拒绝原假设时,我们称样本结果是统计上 显著的(Significant),否则是统计上不显著的
2. “显著的”(Significant) 是指“非偶然的” 3. 统计上的“显著”是指这样的(样本)结果不是
解:研究者想收集证据予以支持的假 设是“该城市中家庭拥有汽车的比例 超过30%”。建立的原假设和备择假设 为
H0 : 30% H1 : 30%
提出假设
1. 原假设和备择假设是一个完备事件组,而且 相互对立
在一项假设检验中,原假设和备择假设必有一 个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设 3. 等号“=”总是放在原假设上 4. 因研究目的不同,对同一问题可能提出不同
第7章假设检验

判断结果:接受原假设,或拒绝原假设。
基本思想
参数的假设检验:已知总体的分布类型,对分布函数或 密度函数中的某些参数提出假设,并检验。
基本原则——小概率事件在一次试验中是不可能发生的。
思想:如果原假设成立,那么某个分布已知的统计 量在某个区域内取值的概率应该较小,如果样本的观 测数值落在这个小概率区域内,则原假设不正确,所以, 拒绝原假设;否则,接受原假设。
Hypothesis Testing
■ 假设检验
抗氧化剂
乙酰胆碱酯酶抑制剂 抗炎药物
假设检验是统计钙推通断的道另阻一重滞要剂内容。正是应用统计推断的 理论和方法,人们才能顺利地通过有限的样本信息去把握总体特征, 实现抽样研究的目的。
21
问题实质上都是希望通过样本统计量与 总体参数的差别,或两个样本统计量的 差别,来推断总体参数是否不同。这种 识别的过程,就是本章介绍的假设检验 (hypothesis test)。
假设检验——根据问题的要求提出假设,构造适当的统 计量,按照样本提供的信息,以及一定的 规则,对假设的正确性进行判断。
基本原则——小概率事件在一次试验中是不可能发生的。
1、假设检验的基本思想
假设检验是利用小概率反证法思想,从问
题的对立面(H0)出发间接判断要解决的问 题(H1)是否成立。然后在H0成立的条件下 计算检验统计量,最后获得P值来判断。
Hypothesis Testing
H0: 0 H1: 0
• H1 的内容反映了检验的单双侧。若 H1
为 0 或 < 0,则为单侧检验(onesided test)。若 H1 为 0,则为双侧
第7章 假设检验

在正常生产条件下,由于种种随机因素的影响, 每罐可乐的容量应在355毫升上下波动. 这些因素 中没有哪一个占有特殊重要的地位. 因此,根据中 心极限定理,假定每罐容量服从正态分布是合理的.
这样,我们可以认为 1, 2 ,, 5 是取自正态 总体 ~ N (, 2 )的样本, 当生产比较稳定时, 2 是一个常数. 现在要检验的假设是: H0:
现在回到我们前面罐装可乐的例中:
在提出原假设H0后,如何作出接受和拒绝H0的结 论呢?
提出假设 H0: = 355 由于 已知, 选检验统计量 它能衡量差异 H1: ≠ 355
0 ~ N(0,1) U n | 0 | 大小且分布已知 .
对给定的显著性水平 ,可以在N(0,1)表中查到 分位点的值 u 2 ,使
每隔一定时间,抽查若干罐 . 如每隔1小时,抽 查5罐,得5个容量的值 1, 2 ,, 5 ,根据这些值 来判断生产是否正常.
如发现不正常,就应停产,找出原因,排除 故障,然后再生产;如没有问题,就继续按规定 时间再抽样,以此监督生产,保证质量.
罐装可乐的容量按标准应在 350毫升和360毫升之间. 现在我们就来讨论这个问题.
不能拒绝 H 0 ,即认为打包机工作是正常的。
2 ~ N ( , 2 ), 2已知 , 检验H0 : 0 H1 : 0
由于
U
~ N (0, 1) / n
0 / n 未必服从正态分布,
当 H 0 成立时, U 0
而
0 / n / n
第7章 假设检验
我们将讨论不同于参数估计的另一类重要的统计推 断问题. 这就是根据样本的信息检验关于总体的某个 假设是否正确. 这类问题称作假设检验问题 . 假设检验
第7章假设检验

犯第一类错误的概率是显著水平 a.
对下列检验问题: 原假设 H0: m=m0 对立假设 H1: m>m0
a u1-a 否定域
犯第一类错误的概率为: P{U∊W |H0 成立}=a
其中W 为拒绝域.
19
犯第二类错误的概率为 β. P{U∉W |H1 成立}= β
βห้องสมุดไป่ตู้
u1-a
要使犯错误的概率都很小.
2、掌握假设检验的基本步骤: (1)、提出假设检验问题 (2)、选定适当的检验统计量 (3)、根据统计量服从的分布确定适当的临界值(也就确 定了接收域和拒绝域) (4)、由样本值计算统计量的观测值并与“临界值”比较 (5)、根据比较结果给出判断结论
4
第七章 假设检验
3、假设检验的类型: 关于期望的检验:U检验法(已知方差)、T检验法 (未知方差) 关于方差的检验:c2检验法(一个正态总体)、F检 验法(两个正态总体)。 要求掌握和熟练运用假设检验中的几个统计量, 掌握一个正态总体参数的假设检验(包括单侧检验 和双侧检验,了解两个正态总体参数的假设检验。
比较,即看此观测值是落在接受域还是否定域。
例题
临界值
back next
15
二、未知N(m,s2)的s2,关于m的假设检验(T-检验)
2、单边右检验:
①. 原假设 H0: m=m0 对立假设 H1: m>m0
②.在H0成立条件下选取检验统计量: T = X- m0 ~ t(n -1)
Sn
a 1-a
t1-a 否定域
T>-t1-a为接受区间(接受域),T<-t1-a为拒绝区间(拒绝域) ④.根据样本观测值计算T-统计量的观测值T,并与临界值-t1-a
应用统计学 经管类 第7章 假设检验

• • • • • •
二、假设检验的步骤 (一)提出原假设与备择假设 (二)构造检验统计量 (三)确定拒绝域 (四)计算检验统计量的样本观测值 (五)做出结论
1、提出原假设与备择假设
• 消费者协会实际要进行的是一项统计检验 H0 工作。检验总体平均 =250是否成立。这 就是一个原假设(null hypothesis),通常用 表示,即: H0 : =250
第三节 自由分布检验
一、自由分布检验概述 自由分布检验与限定分布检验不同, 它是指在假设检验时不对总体分布的形状和参数加 以限制的检验。与参数检验相对应,自由分布检验又称为非参数检验,但这里的非参数只是 指未对检验统计量服从的分布及其参数做出限制, 并不意味着在检验中 “不涉及参数” “不 或 对参数进行检验” 。
• 解:通过统计软件进行计算。
(二)配对样本的均值检验 设配对观察值为(x,y),其差值是 d = x-y。设 d 为差值的总体均值,要检验的是:
H 0 : d 0 , H1 : d 0
记d
d ,则其方差是: n
2
2 d d / n Sd n(n 1) n
t
X 1000 S/ n
第三步:确定显著性水平,确定拒绝域。 α=0.05,查 t-分布表(自由度为 8),得临界值是 t / 2, n 1 t0.025,8 =2.306, 拒绝域是(-,-2.306]∪[2.306,+)。在 Excel 中,可以使用函数 TINV(0.05,8) 得到临界值 t0.025,8 。 第四步:计算检验统计量的样本观测值。 将 X 986 ,n=9,S=24,代入 t 统计量得:
H1 • 与原假设对立的是备选假设(alternative hypothesis) ,备选假设是在原假设被否 定时另一种可能成立的结论。备选假设比 原假设还重要,这要由实际问题来确定, 一般把期望出现的结论作为备选假设。
统计学单个总体的假设检验

求得新钢丝的平均抗拉强度为 10631.4(kg/cm2)。
是否就可以作出新钢丝的平均抗拉强度高于原钢丝,即新工艺有效的结论?
某台加工缸套外径的机床,正常状态下所加工缸套外径的标准差应不超过 0.02 mm。
检验人员从加工的缸套中随机抽取 9 个,测得外径的样本标准差为 S = 0.03 mm。
问:该机床的加工精度是否符合要求?
单个总体的假设检验小结
*
本例中,要检验的是总体均值 ,
当 H0 为真时,
~t (n-1)
估计,
故应使用
来构造检验 的统计量。
统计量
1.提出一个希望推翻的假设,称为原假设,
记为 H0
4.给定一个小概率 ,
称为显著性水平
显著性水平 是当 H0 为真时,
拒绝 H0 的概率
(即犯“弃真”错误的概率)。
也即当检验结果拒绝 H0 时,
10512, 10623, 10668, 10554, 10776
10707, 10557, 10581, 10666, 10670
问在显著性水平 = 0.05下,新钢丝的平均抗拉强度比原钢丝是否有显著提高?
3
2
1
4
案例 1 解答:
*
说明新工艺对提高钢丝绳的抗拉强度是有显著效果的。
统计量
与前面分析完全类似地,可得如下检验方法:
P≠P0
P > P0
P < P0
7.4 大样本单个总体比例的检验
解:由题意,H0:P = P0 = 25%,H1:P > 25%, 样本比例 p = 112/400 = 0.28
【案例5】某一系列电视剧是否获得成功 如果能够证明某一系列电视剧在播出的头13周其观众的收视率超过了25%,则可以断定它获得了成功。假定由400个家庭组成的样本中,有112个家庭在头13周看过了某系列电视剧。在 = 0.01 的显著性水平下,检验这部。 系列电视剧是否获得了成功。
第七章假设检验

或者对立假设,用表示 H1
。
第二,希望通过已经获得的一个样本实现
x1 , x2 ,, xn ,
对 H 0 做出成立还是不成立的判断(或者决策)。
© 概率统计教研室
2012
概率论与数理统计 The Probability Theory and Mathematical Statistics
上述各例的零假设与备择假设
这类问题称作假设检验问题 .
假设检验
参数假设检验 非参数假设检验
总体分布已 知,统计假设 仅涉及未知参 数
对总体分布类型做的统计假设
© 概率统计教研室
2012
概率论与数理统计 The Probability Theory and Mathematical Statistics
统计假设
例7.1 某车间生产的滚球直径X服从正态分布 N (15.1,(0.05)2 ) 。 现从某天生产的滚球中随机抽取6个,测得直径(单位:mm)为 14.6, 15.1, 14.9, 14.8, 15.2, 15.1,
所谓小概率原理是指“概率很小的事件在一次试验中 几乎不可能发生”。通常认为概率为0.05或0.01的事件为小 概率事件,有时也把概率为0.10的事件当作小概率事件。小 概率的标准在假设检验中又称之为显著水平,记为
小概率事件在一次试验中并非绝对不能发生,只不过是发 生的概率很小,以至于我们在实际统计推断中认为小概率事件 在一次抽样(试验)中不会发生。所以建立在小概率原理基础 上的带有概率性质的反证法所得结论是有一定风险的,即有可 能犯错误。
由于样本的随机性,可能发生两种类型的错误。 客观上零假设H 是正确的,而由于样本的随机性, 0 做出了拒绝零假设的决策,因而犯了错误,在统计学上 称为第一类错误,也称为“弃真”错误。显然,犯第一
2014年假设检验考试试题及答案解析

假设检验考试试题及答案解析一、单选题(本大题9小题.每题1.0分,共9.0分。
请从以下每一道考题下面备选答案中选择一个最佳答案,并在答题卡上将相应题号的相应字母所属的方框涂黑。
)第1题假设检验中的显著性水平α是( )。
A 推断时犯第Ⅱ类错误的概率B 推断时犯第Ⅰ和第Ⅱ类错误的概率C 推断时犯第Ⅰ类错误的概率D 推断时犯第Ⅲ类错误的概率【正确答案】:C【本题分数】:1.0分【答案解析】[解析] 显著性水平α是犯第Ⅰ类错误的概率,也就是原假设H0为真,却拒绝H的概率。
第2题当总体服从正态分布,但总体方差未知的情况下,H0:μ=μ,H1:μ<μ则H的拒绝域为( )。
A t≤tα(n-1)B t≤-tα(n-1)C t>-tα(n-1)D t≤(n-1)【正确答案】:B【本题分数】:1.0分第3题从一批零件中抽出100个测量其直径,测得平均直径为5.2cm,标准差为1.6cm,想知道这批零件的直径是否服从标准直径5cm,因此采用t检验法,那么在显著性水平α下,接受域为( )。
A |t|≥tα/2(99)B |t|<tα/2(100)C |t|<tα/2(99)D |t|≤tα/2(99)【正确答案】:C【本题分数】:1.0分【答案解析】[解析] 采用t检验法进行双边检验时,因为,所以在显著性水平α下,接受域为|t|≤tα/2(99)。
第4题在假设检验中,若抽样单位数不变,显著性水平从0.01提高到0.1,则犯第二类错误的概率( )。
A 也将提高B 不变C 将会下降D 可能提高,也可能不变【正确答案】:C【本题分数】:1.0分【答案解析】[解析] 原假设H0非真时作出接受H的选择,这种错误称为第二类错误。
在一定样本容量下,减少α会引起β增大,减少β会引起α的增大。
第5题机床厂某日从两台机器所加工的同一种零件中,分别抽取两个样本,检验两台机床的加工精度是否相同,则提出假设( )。
【正确答案】:B【本题分数】:1.0分【答案解析】[解析] 检验两台机床的加工精度是否相同,即检验两台机床加工的方差是否相同,因此适合采用双侧检验,并把“=”放进原假设。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一节 假设检验概述
定义:先对总体的参数提出某种假设,然后利用样本信息判 断假设是否成立的统计方法。
一、假设检验的基本思想 反证法,如果在原假设成立的前提下,在一次观察中小 概率事件发生了,则认为原假设不正确,应予以否 定。 小概率原理:概率很小的事件在一次试验中通常不可能 出现。 假设检验:通过小概率事件是否出现,判断对总体参 数做出的假设。
x 0 z ~ N (0,1) n
双侧检验
2 已知, 大样本
H0 : = 255 H1 : 255 a = 0.05 n = 40 临界值:
拒绝 H0
0.025
检验统计量:
z
x 0
n
255.8 255 5 40
1.01
决策:
α = 0.05, Z0=1.96 > 1.01
假设的形式
1. 备择假设没有特定的方向性,并含有符号“”, 称为双侧检验或双尾检验(two-tailed test) 37度
2. 备择假设具有特定的方向性,并含有符号“ >” 或“ <” ,称为单侧检验或单尾检验 (one-tailed test) <:左侧检验 >:右侧检验 例 单侧检验 : 假设 双侧检验 总 左侧检验 右侧检验
体 均 值 的 检 验
原假设 备择假设
H0 : =0
H0 : 0
H0 : 0
H1 : ≠0
H1 : <0
H1 : >0
提出假设
【例】某品牌洗涤剂在它的产品说明书中声称:平 均净含量不少于500克。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设
第 7 章 假设检验
第一节 假设检验概述
第二节 总体均值与成数的检验
实验证实爱因斯坦的假说
2004年,美国宇航局的绕地探测器证实了爱因 斯坦在广义相对论中提出的两个重要预言, 该理论描述了重力如何使物质将其周围的时 间和空间扭曲。这个项目始于1963年,是美 国宇航局持续时间最长的项目之一。 如果重力不会影响时间和空间,B型重力探测 器的回转仪就会始终指向同一个方向,重力 探测器本身也会围绕地球的极轨运行。但实 际上,回转仪的旋转方向发生了虽然微小但 是可以测量的变化,这是地球重力拖曳的结 果。
4. “显著”和“不显著”之间没有清楚的界限, P值越来越小时,检验的结果越来越显著
第 7 章 假设检验
第二节 单个总体均值与成数的检验
H0 : 某一数值
提出假设
【例】一种零件的生产标准是直径应为10cm,为对生 产过程进行控制,质量监测人员定期对一台加工机 床检查,确定这台机床生产的零件是否符合标准要 求 10cm,若生产过程不正常,必须进行调整。试 陈述用来检验生产过程是否正常的原假设和被择假 设
解:研究者想收集证据予以证明的 假设应该是“生产过程不正常”。 建立的原假设和备择假设为 H0 : 10cm H1 : 10cm
提出假设
1. 原假设和备择假设是一个完备事件组,而且 相互对立
在一项假设检验中,原假设和备择假设必有一 个成立,而且只有一个成立
2. 先确定备择假设,再确定原假设
3. 等号“=”总是放在原假设上
4. 因研究目的不同,对同一问题可能提出不同 的假设(也可能得出不同的结论)
2、构造检验统计量
1. 根据样本观测结果计算出某个样本统计量。
0
临界值
Z
计算出的样本统计量
P 值检验与统计量检验的比较
拒绝H0
a
拒绝H0
P1 值 拒绝H0 P2 值
Z
0
临界值 统计量1 统计量2
拒绝H0的两个统计量的不同显著性
P 值检验与统计量检验的比较
1、显著性水平是们事先给定的:
10% = “一些证据” 不利于原假设
5% = 适度证据 1% = 很强证据
a/2
a/2
临界值
H0
临界值
接受域:接受原假设的区域。 在原假设成立的前提下,概率为1-α的区域; 如果样本观测值落在里面,说明在一次抽样中并未发生小概率事件、
4、计算检验统计量的样本观测值
将检验统计量的值与a 水平的临界值进行比较 给定显著性水平a,查表对应的临界值za 或za/2 抽样分布
拒绝H0 置信水平 拒绝H0
第Ⅰ类错误 (α错误) :原假设为正确时拒绝原假设
真诚—虚假
第Ⅱ类错误 (β错误):原假设为错误时未拒绝原假设
0
临界值 1
a
a与关系示意图
两类错误的控制
1. 首先控制哪类错误发生的概率:比较发生哪一类错误的 后果更为严重。
2. 犯α错误的概率可以由研究者控制,因此先控制α错误。 在此条件下,犯β错误也应尽可能地小;即1-β(不取伪 的概率)应尽可能增大。
1、提出原假设与备择假设
假设(hypothesis) :在参数检验中,对总体参
数(总体均值、比例、方差等)的具体数 值所作的假设。
例:假设健康成年人体温为37度
原假设 (null hypothesis)
备择假设 (alternative hypothesis) H1 :收集证据予以支 持的假设 不是37oC
解:研究者抽检的意图是倾向于证实这种洗 涤剂的平均净含量并不符合说明书中的陈述 。建立的原假设和备择假设为 H0 : 500 H1 : < 500
提出假设
【例】一家研究机构估计,某城市中家庭拥有汽车 的比例超过 30% 。为验证这一估计是否正确, 该研究机构随机抽取了一个样本进行检验。试 陈述用于检验的原假设与备择假设 解:研究者想收集证据予以支持的假 设是“该城市中家庭拥有汽车的比例 超过30%”。建立的原假设和备择假设 为 H0 : 30% H1 : 30%
2、统计量落在拒绝域不同的地方,实际的显著性是不 同的。 3、P值给出的是实际算出的显著水平,比根据统计量 检验提供更多的信息,可根据需要决定是否拒绝 原假设。
统计上的显著与P值
1. 当拒绝原假设时,我们称样本结果是统计上 显著的(Significant),否则是统计上不显著的 2. “显著的”(Significant) 是指“非偶然的” 3. 统计上的“显著”是指这样的(样本)结果不是 偶然(靠机遇)能得到的
第4步:P值=2(1-0.843752345)=0.312495 P值>a,故不拒绝H0
四、两种类型的错误
由于决策是建立在样本信息的基础之上,而样 本又是随机的,因而可能犯决策错误。
假设检验四种可能的结果 接受 H0 拒绝 H0 H0 真实 H0 不真实 判断正确 取伪错误(概率为 β) 弃真错误(概率为 α) 判断正确
2. 对样本估计量的标准化
37
x 0 z ~ N (0,1) n
前提:原假设H0为真 总体参数的点估计量的抽样分布
3、确定拒绝域
在给定显著性水平α下,检 验统计量的取值范围分成2 部分:
抽样分布
拒绝H0
置信水平
拒绝H0
1-a
37
拒绝域:拒绝原假设的区域。 在原假设成立的前提下,概 率不超过α的区域; 如果样本观测值落在里面, 说明在一次抽样中发生了小 概率事件。37℃
双侧检验
a/2
1-a
a/2
临界值
H0
临界值
左侧检验
抽样分布
拒绝H0 置信水平
a
1-a
临界值
H0
右侧检验
抽样分布
置信水平 拒绝H0
1-a
a
H0
临界值
5、做出结论
双侧检验: I统计量I > 临界值 观测值落入拒绝域,拒绝H0,接受备择假设, 反之,则不否定原假设。
左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
假设检验不能证明原假设正确
假设检验的目的:收集证据拒绝原假设,支持备择假设。只提供 不利于原假设的证据。
“接受原假设” 产生误导:
暗示着原假设已经被证明是正确的 H0的真实值我们永远也无法知道 H0只是对总体真实值的一个假定值,由样本提供的信息 无法证明它是否正确
【例】假设全校学生生活费平均分别为H0:=560、550 ,从这个 总体中抽出两个随机样本,得到x=555、545,在a=0.05的 水平上,样本提供的证据都没有推翻原假设,如果“接受”原 假设,这意味着样本提供的证据证明=550、560是正确的。 究竟哪一个是“真实的”呢?
3. 检验功效或检验力: 1-β是反映统计检验判别能力大小 的重要标志。意味着当原假设不真实时,检验判断出原 假设不真实的概率越大,检验的判别能力就越好。 4. 最佳检验:给定α情况下,使β最小或1-β最大的检验。
假设检验不能证明原假设正确
1. 假设检验中通常是先确定显著性水平,这就等 于控制了第 Ι 类错误的概率,但犯第Ⅱ类错误的 概率却是不确定的。 2. 在拒绝 H0 时,犯第Ⅰ类错误的概率不超过给定 的显著性水平a。在不能拒绝H0时,也难以确切 知道第Ⅱ类错误发生的概率 3. 采用“不拒绝”而非“接受”,避免了错误发 生的风险。 4. 因为“接受”所得结论可靠性将由第Ⅱ类错误 的概率来测量,而的控制又相对复杂。
大样本 , 2 已知
【例】一种罐装饮料采用自动生产线生产,每罐的 容量是 255ml ,标准差为 5ml 。为检验每罐容量是否 符合要求,质检人员在某天生产的饮料中随机抽取 了40罐进行检验,测得每罐平均容量为255.8ml。取 显著性水平 a =0.05 ,检验该天生产的饮料容量是否 符合标准要求?
拒绝 H0
0.025
结论: 不拒绝H0