假设检验的两类错误
人大版统计学 习题加答案第四章 假设检验

第四章 假设检验填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、填空1、在做假设检验时容易犯的两类错误是 和2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为3、假设检验有两类错误,分别是 也叫第一类错误,它是指原假设H0是 的,却由于样本缘故做出了 H0的错误;和 叫第二类错误,它是指原假设H0是 的, 却由于样本缘故做出 H0的错误。
4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 。
5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 。
6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm ,标准差为1.6cm ,想知道这批零件的直径是否服从标准直径5cm ,在显著性水平α下,否定域为7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为 。
(用H 0,H 1表示)8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为β,若减少α,则β9、某厂家想要调查职工的工作效率,用方差衡量工作效率差异,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 (有,没有)达到该标准。
KEY: 1、弃真错误,纳伪错误 2、双边检验,单边检验3、拒真错误,真实的,拒绝,取伪错误,不真实的,接受4、显著性水平5、小概率事件6、1.25>21α-z7、H 0:t≥1000 H 1:t <1000 8、增大 9、有二、 选择1、假设检验中,犯了原假设H 0实际是不真实的,却由于样本的缘故而做出的接受H 0的错误,此类错误是( )A 、α类错误B 、第一类错误C 、取伪错误D 、弃真错误 2、一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( )A 、0:5H μ=,1:5H μ≠B 、0:5H μ≠,1:5H μ>C 、0:5H μ≤,1:5H μ>D 、0:5H μ≥,1:5H μ< 3、一个95%的置信区间是指( ) A 、总体参数有95%的概率落在这一区间内 B 、总体参数有5%的概率未落在这一区间内C 、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D 、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数4、假设检验中,如果增大样本容量,则犯两类错误的概率( ) A 、都增大 B 、都减小 C 、都不变 D 、一个增大一个减小5、一家汽车生产企业在广告中宣称“该公司的汽车可以保证在2年或24000公里内无事故”,但该汽车的一个经销商认为保证“2年”这一项是不必要的,因为汽车车主在2年内行驶的平均里程超过24000公里。
假设检验的两类错误

知识点8.2假设检验的两类错误由于样本具有随机性, 小概率事件也可能发生, 所以假设检验所得出的决策并不总是正确的.原假设H 0为真客观事实决策结果原假设H 0为假拒绝H 0接受H 0拒绝H 0接受H 0错误这种错误称为第一类错误又称“弃真”错误.犯第一类错误的概率记为α.错误这种错误称为第二类错误又称“取伪”错误.犯第二类错误的概率记为β.正确正确理想1:α和β的关系α和β都是0.现实:那不可能!理想2:α和β都很小.现实:如果样本容量n固定, 那也不可能!大↑↓小固定的样本容量nαβα和β真的不能都变小?除非样本容量够大!为了检验火柴的质量, 把火柴厂一天生产的所有火柴都划一遍?!经常在影视中看到的“地毯式搜索”意义何在?如果有人告诉你,本课程所有的考试题均来自于某一本习题集,但不知具体是哪几道,你将怎样复习?哪种错误的后果更严重?“宁可错杀一千,不可放过一个”又是什么意思?显著性检验方法:对犯第一类错误的概率严格加以控制.显著性检验体现了“保护原假设”的原则:只有当小概率事件发生时, 才会拒绝原假设, 所以原假设很难被拒绝.此外, 无论是原假设还是备择假设, 都应该是不可证明的命题, 否则就无需使用假设检验方法了.(2)在H0成立的前提下选取检验统计量W, 确定其概率分布;(1)提出原假设H0与备择假设H1;假设检验问题的基本步骤(3)选取显著性水平α及样本容量n;(4)确定临界值及H的拒绝域;(5)计算W的观测值, 作出拒绝H0还是接受H的决策.。
3[1].1假设检验初述,二类错误
![3[1].1假设检验初述,二类错误](https://img.taocdn.com/s3/m/259a1b59be23482fb4da4c43.png)
第三章 假设检验3.1 假设检验 两类错误(1)假设检验(hypothesis test ) 假设检验是统计推断的另一类重要问题,是概率意义下的一种反证法。
一般,当母体X 的分布完全未知,或只知其形式而不知其参数时,为推断母体的有关特性,提出针对母体的某项假设;再对母体进行抽样,依据子样值对所提假设做出接受或拒绝的决策。
(2)决策依据——实际推断原理 小概率事件在一次试验中几乎不发生。
若抽样结果是小概率事件在这一次试验中发生了,就有理由怀疑假设的正确性,从而做出拒绝原假设的决策;否则接受原假设。
例 3.1.1 某饮料厂在自动流水线上装饮料,每瓶的重量(单位:克))10,(~2μN X ,正常生产情况下500=μ,一段时间后,为检查机器工作是否正常,抽取9个样品,称重后算得494=x ,试问:此时自动流水线的工作是否正常?解:①提出假设母体)10,(~2μN X ,其中μ未知,在母体上作原假设0H 和备择假设(或称对立假设)1H 如下:↔==500:00μμH 500:01=≠μμH ②构造检验统计量X ∴的值应与μ很接近,想到用X 的值来检验原假设0H .当原假设成立时,10),,(~0200=σσμN X ,故),(~200n N X σμ,从而)1,0(~/10500/000N n X n X U H -=-=σμ(3-1)③给定小概率,找出拒绝域取小概率02.0=α,则有2αu 使}{2αα=≥u U P (3-2)}{2αu U ≥是一个小概率事件,如果一次抽样的结果是这一小概率事件发生了,则认为原假设不合理,应予拒绝。
即应取拒绝域}),,,{(221αu U x x x W n ≥= }),,,{(221ασμu n X x x x n ≥-= (3-3)④做出决策 这时,494=x ,5000=μ,9,100==n σ,8.1=∴U ;02.0=α,33.201.02==u u α,故2αu U <,∴应接受0H ,即认为机器工作正常.注:①假设检验又称为差异显著性检验;②假设检验是具有概率性质的反证法;③拒绝H的说服力强,接受0H的说服力不强;④α越小,拒绝H的说服力越强。
假设检验的两类错误及检验水准的调整

实际情况
H0 真 H0 不真
表1
假设检验的两类错误
检验结果
不拒绝 H0 结论正确 (1-琢)
Ⅱ型错误 (茁)
拒绝 H0 Ⅰ型错误 (琢) 结论正确 (1-茁)
统计学中还存在Ⅲ型和Ⅳ型错误。Ⅲ型错误指假 设检验回答了一个错误的问题,而这种错误的问题主 要是由研究设计错误引起的;Ⅳ型错误指对正确假设 检验作出错误解释 [2]。
2 多重比较检验水准的调整
2.1 问题的提出 当多组资料的假设检验 (如方差 分析等) 拒绝 H0,接受 H1,如需进一步了解哪几对 样本间存在统计学差异,须进行多样本间多重比较。 如仍采用 t 检验或类似方法进行多重比较,将增加犯 Ⅰ型错误概率,进行 c 次比较犯Ⅰ型错误概率为:1(1-琢) c (琢 为检验水准)。多重比较一般分为各样本 间两两比较 [比较次数 c=k (k-1) /2,k 为组数] 和 各处理组与对照组比较 (c= k-1)。 2.2 检验水准的调整 通过直接调整检验水准或采 用专门的统计方法可控制多重比较Ⅰ型错误概率。 Bonferroni 法用于多样本两两比较检验水准的调整,
LSD-t 检验常被列在统计教科书或统计软件多重 比较方法的第一个。但 LSD-t 检验没有对检验水准或 统计量进行调整,采用此法会增加犯Ⅰ型错误概率, 比较次数越多,犯Ⅰ型错误概率越大。因此在多重比 较时应慎用 LSD-t 检验。
从表 2 可见,采用 Bonferroni 法调整后的检验水 准低于 Sidak 法,随着比较次数增加,两者差距增 大。相对于 Bonferroni 法, 在两两比较时建议 选用 Sidak 法,尤其是组数较多时。
假设检验作出的推断具有概率性,因此其结论不 可能完全正确,可能发生两类错误。假设检验Ⅰ型错 误指拒绝了实际上成立的 H0,即“假阳性”。进行假 设检验应先设定检验水准,检验水准是预先规定允许 犯Ⅰ型错误的概率最大值,Ⅰ型错误概率大小用 琢 表示。 Ⅱ型 错 误 指接受 了 实 际 上 不 成 立 的 H0, 即 “假阴性”。Ⅱ型错误概率大小用 茁 表示,茁 只取单 尾。琢 越小,茁 越大,反之亦然。同时减小 琢 和 β 的唯一方法是增大样本量 [1]。
假设检验的两类错误

显著性 水平α
对差异进行定量的分析, 确定其性质 (是随机误差还是系统误差. 为给出两者界限, 找一检验统计量T, 在H0成立下其分布已知.)
代入 σ=2, n=25, 并由样本值计算得统计量U的实测值:
u=2.51>2.33
落入否定域
故拒绝原假设H0 ,
即新生产织物比过去的织物的强力有提高。
小结:
提出
假设
根据统计调查的目的,
数理统计
提出原假设H0 和备选假设H1
作出 决策
拒绝还是 不能拒绝H0
抽取 样本
检验 假设
P(T∈W)=α
α--犯第一类错误 的概率,
假设检验的两类错误
实际情况
决定
H0为真
H0不真
数理统计
拒绝H0 第一类错误
正确
接受H0
正确
第二类错误
犯两类错误的概率: P{拒绝H0|H0为真}=α,
P{接受H0|H0不真}=β.
显著性水平 α为犯第一类错误(Type I error)的概率; β为犯第二类错误(Type II error)的概率.
X0 n
u0.05
1.645
否定域为W : u u0.05 =1.645
代入 σ=2, n=25, 并由样本值计算得统计量U的实测值:
u=3.125>1.645
落入否定域
故拒绝H0 , 即认为这批燃料率较以往生产的有显著的提高。
例2: 某织物强力指标X的均值 μ0=21公斤. 改进工艺后生产一批织物, 今从中取30件,
数理统计
测得 X =21.55公斤.
假设强力指标服从正态分布 N(μ,σ2),
且已知 σ=1.2公斤, 问在显著性水平 α=0.01 下,
概率统计20 假设检验可能产生的两类错误

小概率事件在一次试验中几乎不可能发生
假设检验可能产生的两类错误
第一类错误 弃真
原假设H0 本来是正确的,而小概率 事件发生了,于是否定了H0
引例: 完全有可能次品率的确满足 p ≤ 0.01(200件 产品中次品不超过2件),但仍然抽中了次 品:A 发生。
= P{ A | H0}: 犯第一类错误的概率
P( A |
Ai
)
C5 200i C5 200
i 0,1, 2
件 竟 然
P(
A)
P(
A
|
A2
)
C5 198
/
C5 200
0.95
发
生
P( A) 1 P( A) 0.05
了
假设检验的基本思想
“反证法”
为了检验一个“假设”是否成立,就先假定这 个“假设”成立,而看由此会产生的后果:
第二届四川高校青年教师教学竞赛
《概率统计 II》
假设检验可能产生的 两类错误
(Two Types of Errors in Hypothesis Testing)
2014年7月
姓名:
学校:
问题的提出
某厂有一批产品共200件,须检验合格才能 出厂。按国家标准,次品率不得超过0.01, 今从产品中任取5件,发现这5件中有次品, 问这批产品能否出厂?
假设检验可能产生的两类错误
第二类错误 纳伪
原假设H0 本来不真,而经检验,接受 了H0
引例: 完全有可能次品率p超过了 0.01(200件产 品中次品大于2件),但抽了5次都没抽到
次品:A 发生。
β :犯第二类错误的概率
显著性检验
假设检验中的两类错误及其控制方法

假设检验中的两类错误及其控制方法假设检验是统计学中常用的一种推断方法,用于判断关于总体参数的假设是否成立。
在进行假设检验时,我们一般会面临两类错误,即第一类错误和第二类错误。
本文将介绍这两类错误的含义、造成原因以及控制方法。
一、第一类错误的含义及控制方法第一类错误,也被称为α错误,指的是当原假设为真时,却错误地拒绝了原假设的情况。
换句话说,第一类错误意味着我们得出了一个错误的结论,即在事实上不存在的关系。
控制第一类错误的方法主要是通过控制显著性水平α来实现。
1. 显著性水平的控制显著性水平α定义了我们在进行假设检验时拒绝原假设的临界值。
通常情况下,α的取值为0.05或0.01,代表了我们容忍犯第一类错误的概率。
较小的α值会降低犯第一类错误的风险,但同时也增加了犯第二类错误的概率。
2. 样本容量的控制样本容量对于控制第一类错误也至关重要。
较大的样本容量可以提供更多的信息,从而降低犯第一类错误的概率。
因此,在进行假设检验时,我们应尽可能选择足够大的样本容量来增加推断的准确性。
二、第二类错误的含义及控制方法第二类错误,也被称为β错误,指的是当原假设为假时,却错误地接受了原假设的情况。
换句话说,第二类错误意味着我们未能发现事实上存在的关系。
控制第二类错误的方法主要是通过改进实验设计或增大样本容量来实现。
1. 实验设计的改进良好的实验设计可以降低发生第二类错误的概率。
例如,在两组样本进行比较时,我们可以增加处理组与对照组的差异,从而提高检测到显著差异的能力。
此外,合理的随机分组和对照设计也能够有效地控制第二类错误。
2. 样本容量的增大与控制第一类错误类似,增大样本容量也是控制第二类错误的一种方法。
较大的样本容量可以提高检测到真实差异的概率,从而减少第二类错误的发生。
在做出假设检验计划时,我们应考虑到研究资金、时间和实验设计等方面的限制,尽可能选择足够大的样本容量。
总结:在假设检验中,我们需要控制两类错误,即第一类错误和第二类错误。
第7讲 t'检验、假设检验的两类错误及注意事项(2004)

3、方差不齐时两样本均数差别的统计意义检验(t '检验)用以上t 检验检验两样本均数的差别有无统计意义的另一前提条件为两总体的方差(variance)相等。
如果被检验的两个样本方差相差较大,则需先检验两样本方差的差别是否有统计意义。
如果差别有统计意义,则需要用校正t 检验(t '检验)。
检验两样本方差的差别有无统计意义可用方差齐性检验,即把两方差求一比值F (较大方差作分子,较小方差作分母),用公式表示:1 ,1 22112221-=-==n n S S F νν如果两个方差之比仅是抽样误差的影响,它一般不会离1太远,F 分布就是反映这个概率的分布。
注意:方差齐性检验本为双侧检验,但由于规定以较大方差作分子,F 值必然会大于1,故附表单侧0.025的界值,实对应双侧检验P=0.05.当两总体方差不齐时,用t 检验法就不近合理了。
据数理统计研究结果,可按下式求出均数之差的标准误及t '值(即作t '检验)。
')(21222121')(2121x x x x S x x t n S n S S ---='+=然后用下列公式求出作统计判断用的临界值(校正):22)0.05(2)0.05(205.0212211t ,t , x x x x S S S S t ++='νν有了t ' 值和校正界值,就可以得出P 值,作出推断结论。
例如:某医生测试了25例正常人和32例喉癌患者的血清铁蛋白(SF )平均浓度(ug/L ),试问:喉癌患者的血清铁蛋白浓度是否不同于正常人?组 别 例数 s x ±- 正 常 人 25 64.0±24.40厚爱患者 32 244.2±57.611、 进行方差齐性检验:21.257.540.2461.57)24.30(025.022===F FF > )24.30(025.0F P<0.052、9569.153261.572540.242.2440.642222212121=+-=+-='nSnSxxt0445.23261.572540.24040.23261.57064.22540.24tt222222)0.05(2)0.05(205.0212211=+⨯+⨯=++='xxxxSSSStννt'〉05.0t'P < 0.05可以认为:正常人与喉癌患者的血清铁蛋白总体平均浓度不同,喉癌患者的血清铁蛋白高于正常人。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
显著的提高?取显著性水平 αH 0 1 : 0
取统计量:UX n0 u0.051.645
否定域为W : uu0.05 =1.645
代入 σ=2, n=25, 并由样本值计算得统计量U的实测值:
u=3.125>1.645
落入否定域
故拒绝H0 , 即认为这批燃料率较以往生产的有显著的提高。
例2: 某织物强力指标X的均值 μ0=21公斤. 改进工艺后生产一批织物, 今从中取30件,
数理统计
测得 X =21.55公斤.
假设强力指标服从正态分布 N(μ,σ2),
且已知 σ=1.2公斤, 问在显著性水平 α=0.01 下,
小结:
提出
假设
根据统计调查的目的,
数理统计
提出原假设H0 和备选假设H1
作出 决策
拒绝还是 不能拒绝H0
抽取 样本
检验 假设
P(T∈W)=α
α--犯第一类错误 的概率,
W--为拒绝域
显著性 水平α
对差异进行定量的分析, 确定其性质 (是随机误差还是系统误差. 为给出两者界限, 找一检验统计量T, 在H0成立下其分布已知.)
新生产织物比过去的织物强力是否有提高?
解:提出假设: H 0: 2 1 H 1: 21 数理统计
取统计量: UX21~N(0,1)
n
否定域为W : uu0.01 =2.33
代入 σ=2, n=25, 并由样本值计算得统计量U的实测值:
u=2.51>2.33
落入否定域
故拒绝原假设H0 ,
即新生产织物比过去的织物的强力有提高。
两类错误的概率的关系
数理统计
两类错误是互相关联的, 当样本容量固定时, 一类错误概率的减少导致另一类错误概率的增加.
要同时降低两类错误的概率 α, β 或者 要在 α不变的条件下降低 β, 需要增加样本容量.
例1: 某厂生产的固体燃料推进器的燃烧率服从正态分布: 数理统计 N (,2 ) , 4 0 c m /s , 2 c m /s . 现在用新方法生产了一批推进器。从中随机取 n=25只, 测得燃烧率的样本均值为: x41.25cm /s.
数理统计
第六节 假设检验的两类错误
假设检验的两类错误
一、假设检验的两类错误
数理统计
假设检验会不会犯错误呢?
由于作出结论的依据是: 小概率原理
小概率事件在一次试验中基本上不会发生 .
不是一定不发生
如果H0成立, 但统计量的实测值落入否定域, 从而作出否定H0的结论, 那就犯了“以真为假”的错误 .
如果H0不成立, 但统计量的实测值未落入否定域, 从而没有作出否定H0的结论,即接受了错误的H0, 那就犯了“以假为真”的错误 .
假设检验的两类错误
实际情况
决定
H0为真
H0不真
数理统计
拒绝H0 第一类错误
正确
接受H0
正确
第二类错误
犯两类错误的概率: P{拒绝H0|H0为真}=α,
P{接受H0|H0不真}=β.
显著性水平 α为犯第一类错误(Type I error)的概率; β为犯第二类错误(Type II error)的概率.