第一类错误和第二类错误.ppt
合集下载
第8 假设检验(共80张PPT)

第 8 章 假设检验
8.1 8.2 8.3 8.4
假设检验的根本问题 一个总体参数的检验 两个总体参数的检验 假设检验中的其他问题
我认为该企业生产的零件的平
均长度为4厘米!
什么是假设? 对总体 参数的一种看法
总体参数包括总 体均值、比例、方 差等
举例说明假设检验的根本思路
某单位职工上月平均收入为210元,这个 月的情况与上月没有大的变化,我们设想平均 收入还是210元.
样本均值的抽样分布
置信水平
拒绝域
1-
接受域
临界值
H0
样本统计量
如果备择假设具有符号“>〞,拒绝域位于抽样分 布的右侧,故称为右侧检验
样本均值的抽样分布
置信水平
1- 接受域
拒绝域
H0
样本统计量
临界值
请判断它们的拒绝域:
〔1〕假设检验的假设为H0:m=m0 ,H1: m≠m0,那么拒绝域为〔 〕。
〔2〕假设检验的假设为H0:m≥m0 ,H1: m < m0,那么拒绝域为〔 〕。
〔3〕假设检验的假设为H0:m≤m0 ,H1: m > m0,那么拒绝域为〔 〕。
检验统计量:Z > Z;
Z > Z/2 或Z <-Z/2 ;
Z <-Z
决策规那么
给定显著性水平 ,查表得出相应的临界 值 将检验统计量的值与 水平下的临界值进 行比较 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 得出拒绝或不拒绝原假设的结论
H0:m=10 H1:m≠10
例 6.2
某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设。
8.1 8.2 8.3 8.4
假设检验的根本问题 一个总体参数的检验 两个总体参数的检验 假设检验中的其他问题
我认为该企业生产的零件的平
均长度为4厘米!
什么是假设? 对总体 参数的一种看法
总体参数包括总 体均值、比例、方 差等
举例说明假设检验的根本思路
某单位职工上月平均收入为210元,这个 月的情况与上月没有大的变化,我们设想平均 收入还是210元.
样本均值的抽样分布
置信水平
拒绝域
1-
接受域
临界值
H0
样本统计量
如果备择假设具有符号“>〞,拒绝域位于抽样分 布的右侧,故称为右侧检验
样本均值的抽样分布
置信水平
1- 接受域
拒绝域
H0
样本统计量
临界值
请判断它们的拒绝域:
〔1〕假设检验的假设为H0:m=m0 ,H1: m≠m0,那么拒绝域为〔 〕。
〔2〕假设检验的假设为H0:m≥m0 ,H1: m < m0,那么拒绝域为〔 〕。
〔3〕假设检验的假设为H0:m≤m0 ,H1: m > m0,那么拒绝域为〔 〕。
检验统计量:Z > Z;
Z > Z/2 或Z <-Z/2 ;
Z <-Z
决策规那么
给定显著性水平 ,查表得出相应的临界 值 将检验统计量的值与 水平下的临界值进 行比较 双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0 得出拒绝或不拒绝原假设的结论
H0:m=10 H1:m≠10
例 6.2
某品牌洗涤剂在它的产品说明书中声称:平均 净含量不少于500g。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设。
优选剖析假设检验的两类错误并举例说明ppt(共18张PPT)

犯 β错误的概率大小就是相对正态曲线A 而言,图 1 中阴影部分的面积:
是单侧检验,弃真错误的概率则为 α/2。 出现两类错误的概率计算
命题 2:真实的总体参数(μ)与假设的总体参数(μ0)之间的差异(△μ)越小, 犯β 错误的概率越பைடு நூலகம்。
β错误的概率的计算
• 犯β错误的概率的计算是比较复杂的,由于β错误的 出现原因是属于逻辑上的,所以在总体参数不知道 的情况下是无法计算它出现概率的大小的。
这样我们就可以在总体均值为 870 元和 880元两种情况下, 分别作出两条正态分布曲线 (A线和 B 线) ,见下图。
样本随机抽样调查,人均收入的调查结 如果是单侧检验,弃真错误的概率则为 α/2。
命题 2:真实的总体参数(μ)与假设的总体参数(μ0)之间的差异(△μ)越小, 犯β 错误的概率越大。 例子:一个公司有员工3000 人(研究的总体) ,为了检验公司员工工资统计报表的真实性,研究者作了 50 人的大样本随机抽样调查,人均收入的
出现两类错误的概率计算
• α 错误是由实际推断原理引起的,即 结果表明,如果总体的真值为 870 元,而虚无假设为880元的话,那么,平均而言每100 次抽样中,将约有8次把真实情况当作880 元被接受,即犯
“小概率事件不会发生”的假定所引起 β错误的概率大小是。
在假设检验时,根据检验结果做出的判断,即拒绝H0或不拒绝H0并不是100%的正确,可能发生两种错误 这就是 α 错误出现的原因。
在很多个样本平均数。也就是说,由于小概率事件的
出现,我们把本来真实的原假设拒绝了。这就是 α
错误出现的原因。
β 错误出现原因
• 第二个问题是,统计检验的逻辑犯了从结论推断前 提的错误。命题 B 是由命题 A 经演绎推论出来的, 或写作符号 A→B,命题 C 是我们在检验中所依据
是单侧检验,弃真错误的概率则为 α/2。 出现两类错误的概率计算
命题 2:真实的总体参数(μ)与假设的总体参数(μ0)之间的差异(△μ)越小, 犯β 错误的概率越பைடு நூலகம்。
β错误的概率的计算
• 犯β错误的概率的计算是比较复杂的,由于β错误的 出现原因是属于逻辑上的,所以在总体参数不知道 的情况下是无法计算它出现概率的大小的。
这样我们就可以在总体均值为 870 元和 880元两种情况下, 分别作出两条正态分布曲线 (A线和 B 线) ,见下图。
样本随机抽样调查,人均收入的调查结 如果是单侧检验,弃真错误的概率则为 α/2。
命题 2:真实的总体参数(μ)与假设的总体参数(μ0)之间的差异(△μ)越小, 犯β 错误的概率越大。 例子:一个公司有员工3000 人(研究的总体) ,为了检验公司员工工资统计报表的真实性,研究者作了 50 人的大样本随机抽样调查,人均收入的
出现两类错误的概率计算
• α 错误是由实际推断原理引起的,即 结果表明,如果总体的真值为 870 元,而虚无假设为880元的话,那么,平均而言每100 次抽样中,将约有8次把真实情况当作880 元被接受,即犯
“小概率事件不会发生”的假定所引起 β错误的概率大小是。
在假设检验时,根据检验结果做出的判断,即拒绝H0或不拒绝H0并不是100%的正确,可能发生两种错误 这就是 α 错误出现的原因。
在很多个样本平均数。也就是说,由于小概率事件的
出现,我们把本来真实的原假设拒绝了。这就是 α
错误出现的原因。
β 错误出现原因
• 第二个问题是,统计检验的逻辑犯了从结论推断前 提的错误。命题 B 是由命题 A 经演绎推论出来的, 或写作符号 A→B,命题 C 是我们在检验中所依据
假设检验PPT课件

假设检验
【学习目标】通过对本章的学习,掌握假设检验的概念和 类型、假设检验的两类错误和假设检验的一般步骤;重点掌握 单个总体均值的检验和比率的检验。
第一节 假设检验的基本问题 第二节 △ 假设检验的应用
假设检验
第一节 假设检验的基本问题
一、假设检验的概念 二、假设检验的两类错误 三、假设检验的类型 四、假设检验的类型一般步骤
假设检验
第一节 假设检验的基本问题
什么小概率?
1.在一次试验中,一个几乎不可能发生的事件发生的概率; 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假 设; 3.小概率由研究者事先确定。
假设检验
第一节 假设检验的基本问题
二、假设检验的两类错误(决策风险)
(一) 第一类错误 第一类错误,亦称拒真(弃真)错误。是指当原假设为 真时,但由于样本的随机性使样本统计量的具体值落入 了拒绝区域,这时所作的判断是拒绝原假设。 犯第一类错误的概率亦称拒真概率,它实质上就是前面
t
986 1000 24
2.333>
t n 1 2.1315
16
2
所以接受 H1,即这天包装机工作不正常。
假设检验
第二节 假设检验的应用
二、单个总体比率(成数)的假设检验
比率P是平均数的一种特殊形式,因而前面讲的平均 数检验理论都适用于总体比率P的假设检验,只是估计量 的形式略有不同。
【例4】我国出口的参茸药酒畅销于某国市场。据以往调查, 购买此种酒的顾客中40岁以上的男子占50%。经营该药酒 的进出口公司经理关心这个比率是否发生了变化,于是, 委托一个咨询机构进行调查,这个咨询机构从众多购买该 药酒的顾客中随机抽取了400名进行调查,结果有210名为 40岁以上的男子。试问在0.05的显著水平上,能否认为购 买此种药酒的顾客中40岁以上男子所占比率变化了?
【学习目标】通过对本章的学习,掌握假设检验的概念和 类型、假设检验的两类错误和假设检验的一般步骤;重点掌握 单个总体均值的检验和比率的检验。
第一节 假设检验的基本问题 第二节 △ 假设检验的应用
假设检验
第一节 假设检验的基本问题
一、假设检验的概念 二、假设检验的两类错误 三、假设检验的类型 四、假设检验的类型一般步骤
假设检验
第一节 假设检验的基本问题
什么小概率?
1.在一次试验中,一个几乎不可能发生的事件发生的概率; 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假 设; 3.小概率由研究者事先确定。
假设检验
第一节 假设检验的基本问题
二、假设检验的两类错误(决策风险)
(一) 第一类错误 第一类错误,亦称拒真(弃真)错误。是指当原假设为 真时,但由于样本的随机性使样本统计量的具体值落入 了拒绝区域,这时所作的判断是拒绝原假设。 犯第一类错误的概率亦称拒真概率,它实质上就是前面
t
986 1000 24
2.333>
t n 1 2.1315
16
2
所以接受 H1,即这天包装机工作不正常。
假设检验
第二节 假设检验的应用
二、单个总体比率(成数)的假设检验
比率P是平均数的一种特殊形式,因而前面讲的平均 数检验理论都适用于总体比率P的假设检验,只是估计量 的形式略有不同。
【例4】我国出口的参茸药酒畅销于某国市场。据以往调查, 购买此种酒的顾客中40岁以上的男子占50%。经营该药酒 的进出口公司经理关心这个比率是否发生了变化,于是, 委托一个咨询机构进行调查,这个咨询机构从众多购买该 药酒的顾客中随机抽取了400名进行调查,结果有210名为 40岁以上的男子。试问在0.05的显著水平上,能否认为购 买此种药酒的顾客中40岁以上男子所占比率变化了?
假设检验的两类错误

W--为拒绝域
显著性 水平α
对差异进行定量的分析, 确定其性质 (是随机误差还是系统误差. 为给出两者界限, 找一检验统计量T, 在H0成立下其分布已知.)
代入 σ=2, n=25, 并由样本值计算得统计量U的实测值:
u=2.51>2.33
落入否定域
故拒绝原假设H0 ,
即新生产织物比过去的织物的强力有提高。
小结:
提出
假设
根据统计调查的目的,
数理统计
提出原假设H0 和备选假设H1
作出 决策
拒绝还是 不能拒绝H0
抽取 样本
检验 假设
P(T∈W)=α
α--犯第一类错误 的概率,
假设检验的两类错误
实际情况
决定
H0为真
H0不真
数理统计
拒绝H0 第一类错误
正确
接受H0
正确
第二类错误
犯两类错误的概率: P{拒绝H0|H0为真}=α,
P{接受H0|H0不真}=β.
显著性水平 α为犯第一类错误(Type I error)的概率; β为犯第二类错误(Type II error)的概率.
X0 n
u0.05
1.645
否定域为W : u u0.05 =1.645
代入 σ=2, n=25, 并由样本值计算得统计量U的实测值:
u=3.125>1.645
落入否定域
故拒绝H0 , 即认为这批燃料率较以往生产的有显著的提高。
例2: 某织物强力指标X的均值 μ0=21公斤. 改进工艺后生产一批织物, 今从中取30件,
数理统计
测得 X =21.55公斤.
假设强力指标服从正态分布 N(μ,σ2),
且已知 σ=1.2公斤, 问在显著性水平 α=0.01 下,
显著性 水平α
对差异进行定量的分析, 确定其性质 (是随机误差还是系统误差. 为给出两者界限, 找一检验统计量T, 在H0成立下其分布已知.)
代入 σ=2, n=25, 并由样本值计算得统计量U的实测值:
u=2.51>2.33
落入否定域
故拒绝原假设H0 ,
即新生产织物比过去的织物的强力有提高。
小结:
提出
假设
根据统计调查的目的,
数理统计
提出原假设H0 和备选假设H1
作出 决策
拒绝还是 不能拒绝H0
抽取 样本
检验 假设
P(T∈W)=α
α--犯第一类错误 的概率,
假设检验的两类错误
实际情况
决定
H0为真
H0不真
数理统计
拒绝H0 第一类错误
正确
接受H0
正确
第二类错误
犯两类错误的概率: P{拒绝H0|H0为真}=α,
P{接受H0|H0不真}=β.
显著性水平 α为犯第一类错误(Type I error)的概率; β为犯第二类错误(Type II error)的概率.
X0 n
u0.05
1.645
否定域为W : u u0.05 =1.645
代入 σ=2, n=25, 并由样本值计算得统计量U的实测值:
u=3.125>1.645
落入否定域
故拒绝H0 , 即认为这批燃料率较以往生产的有显著的提高。
例2: 某织物强力指标X的均值 μ0=21公斤. 改进工艺后生产一批织物, 今从中取30件,
数理统计
测得 X =21.55公斤.
假设强力指标服从正态分布 N(μ,σ2),
且已知 σ=1.2公斤, 问在显著性水平 α=0.01 下,
卫生统计学课件_第六章_假设检验

16
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。
贾俊平版统计学课件 第8章

▽与原假设对立的假设称备择假设,记为 H1 ,用 、 或 表示。 对于新生儿体重的例子,可以表示为
H 0 : 3190
H1 : 3190
(2)确定检验统计量及其分布
▽用于检验假设的统计量称为检验统计量
▽根据 H 0 及相应条件选择适当的统计量,并确定统计量
的分布 对于新生儿体重的例子,可利用 x 0 构造检验统计量. 若新生儿体重为正态分布 N ( , 2 ) ,且 已知,则在 H 0 为真 时,用 z 作为检验统计量,并且
H 0 : 3190 H1 : 3190
并已知 x 3210, 80, n 100 ,则
z0 x 0
n
3210 3190 80 100
2.5
于是
p 2Pz z0 2 0.00621 0.01242
双侧检验的P值
/ 2
/ 2 拒绝
▽犯第二类错误的概率为 。
表8-1 假设检验中各种可能结果的概率
实际情况
H 0 为真 H 0 不真
决策
接受 H 0
1
拒绝 H 0
1
假设检验中的两类错误(决策结果)
H0: 无罪
假设检验就好像一场审判过程 统计检验过程
陪审团审判
实际情况 裁决 无罪 无罪 有罪 正确 错误 有罪 错误 正确 接受H0 拒绝H0 决策
若p-值 /2, 不能拒绝 H0 若p-值 < /2, 拒绝 H0
8.1.6 假设检验的形式
研究的问题 假设
双侧检验
H0 H1
左侧检验
右侧检验
= 0 ≠0
N-P准则(课堂PPT)
由于样本时随机的, 进行检验时可能犯
两类错误,其一是当
H
为真时,却拒绝
0
H
,
0
称为第一类错误, 其概率为
() P { x W }, 0 .
其二是当
H
为假时,却接受
0
H
,
0
称为第二类
错误,其概率为
8
( ) P { x W } 1 P { x W } , 1 .
定义8.1 一个检验的功效(Power)定义为当 H 0假
n 拒绝域为 W {x : x c } 。
24
注意这个例子的MPT仅与水平 有关,而与
备择假设中 1的具体取值无关,只要 1 0。
作为课后练习,试求原假设不变而备择假设
改为H 1: 10时的MPT。
例8.2设 X 1 ,X 2 , ,X n 是P 来 o分 i自 ss布 o
样本,试求检验问题 H 0 : 1 , H 1 : 1 ( 0 1 1 )
计算minomial两类错误功效和功效函数由于样本时随机的进行检验时可能犯两类错误其一是当为真时却拒绝称为第一类错误其概率为其二是当为假时却接受称为第二类错误其概率为定义81一个检验的功效power定义为当时拒绝的概率的不同取值这个函数称为功效函数
第八讲 假设检验
一、基本概念 二、Neyman-Pearson 引理 三、一致最优势检验
15
对于检验问题(1), 似然比为
L(x) p(x,1), p(x,0)
规定:当 p ( x ,0 ) 0 ,p ( x ,1 ) 0 时 L ( x ) , ,
当 p ( x ,0 ) p ( x ,1 ) 0 时 L ( x ) 0 , .
下面的N-P引理不但彻底解决了检验问题(1) 的 MPT的存在问题, 而且还给出了构造MPT检 验的方法。 虽然这个引理仅针对检验问题(1),
QC七种质量工具123
PPT文档演模板
QC七种质量工具123
第三节 统计数据及其分类
一、计量数据 二、计数数据
PPT文档演模板
QC七种质量工具123
一、计量数据
——凡是可以连续取值的,或者说可以用测量工具具体测量出小数
点以下数值的这类数据。如:长度、容积、质量、化学成分、温度、产量、 职工工资总额等。
——计量数据一般服从正态分布。
•7、由左到右累加每一项目的量值(以%表示),并画出 累计频数百分比曲线,此曲线又叫帕累托曲线,用来表示 各项目的累计作用。
•8、利用排列图确定对质量改进最为重要的项目。
PPT文档演模板
QC七种质量工具123
•要点提示
•1、排列图中的总频数N,以超过50为好。
•2、QC小组活动中采取近期的数据作图分析。
:样本的算术平均值; n :样本大小。
PPT文档演模板
QC七种质量工具123
二、样本中位数
把收集到的统计数据X 1,X 2,X 3….X n,按大小顺序重新排列,排在正
中间的那个数就叫作中位数,用符号 来表示。
当 n 为奇数时,正中间的数只有一个;
当 n 为偶数时,正中间的数有两个,此时,中位数为正中两个数的
• 2. 推断性 • ——统计方法都要通过详细研究样本来达到了解、推测总体状况的目 的,因此它具有由局部推断整体的性质。
• 3. 风险性 • ——统计方法既然要推断用部分整体,那么这种由推断而得出的结论 就不会是百分之百正确,即可能有错误。犯错误就要担风险。
PPT文档演模板
QC七种质量工具123
三、统计方法的用途
控制
限 总
体
工序
对一批产品质量进
一
统计学第八章
19
8.1.3 两类错误
项目
没有拒绝H0
拒绝H0
H0为真
1-α(正确)
α(弃真错误)
H0为假
β(取伪错误)
1-β(正确)
假设检验中各种可能结果的概率
20
8.1.3 两类错误
α和β的关系: 1、 α和β的关系就像跷跷板, α小β就大, α大β就小。因为, 要减少弃真错误α,就要扩大接受域。而扩大接受域,就必然导致取 伪错误的可能性增加。因此,不能同时做到犯两种错误的概率都很 小。要使α和β同时变小,唯一的办法就是增大样本量。 α和β两者的 关系就像是区间估计当中可靠性和精确性的关系一样。 2、在假设检验中,大家都在执行这样一个原则,即首先控制犯α错 误原则。
一般来说,在研究问题的过程中,我们想要予以反对的那个结论, 我们就把它作为原假设。
比如,一家研究机构估计,某城市当中家庭拥有汽车的比例超过 30%。为了验证这种估计是否正确,该研究机构随机的抽取了一个样本 进行检验。试陈述用于检验的原假设和备择假设。
解:研究者想要收集证据予以支持的假设是:“该城市中家庭拥有 汽车的比例超过30%”。因此,原假设是总体比例小于等于30%,备择 假设是总体比例大于30%。可见,通常我们应该先确定备择假设,再确 定原假设。
6
8.1.2 假设的表达式
在假设检验中,一般要先设立一个假设(比如从来没做过坏事),然 后从现实世界的数据中找出假设与现实的矛盾,从而否定该假设。所以, 在多数统计教材当中,假设检验都是以否定事先设定的那个假设为目标的。
如果搜集到的数据分析结构不能否定该假设,只能说明我们掌握的现 实不足以否定该假设,但不能说明该假设一定成立。这是假设检验做结论 的时候尤其要注意的一点。比如一个人在数次的观察中都没有干坏事,但 并不说明他从来都没干过坏事。
8.1.3 两类错误
项目
没有拒绝H0
拒绝H0
H0为真
1-α(正确)
α(弃真错误)
H0为假
β(取伪错误)
1-β(正确)
假设检验中各种可能结果的概率
20
8.1.3 两类错误
α和β的关系: 1、 α和β的关系就像跷跷板, α小β就大, α大β就小。因为, 要减少弃真错误α,就要扩大接受域。而扩大接受域,就必然导致取 伪错误的可能性增加。因此,不能同时做到犯两种错误的概率都很 小。要使α和β同时变小,唯一的办法就是增大样本量。 α和β两者的 关系就像是区间估计当中可靠性和精确性的关系一样。 2、在假设检验中,大家都在执行这样一个原则,即首先控制犯α错 误原则。
一般来说,在研究问题的过程中,我们想要予以反对的那个结论, 我们就把它作为原假设。
比如,一家研究机构估计,某城市当中家庭拥有汽车的比例超过 30%。为了验证这种估计是否正确,该研究机构随机的抽取了一个样本 进行检验。试陈述用于检验的原假设和备择假设。
解:研究者想要收集证据予以支持的假设是:“该城市中家庭拥有 汽车的比例超过30%”。因此,原假设是总体比例小于等于30%,备择 假设是总体比例大于30%。可见,通常我们应该先确定备择假设,再确 定原假设。
6
8.1.2 假设的表达式
在假设检验中,一般要先设立一个假设(比如从来没做过坏事),然 后从现实世界的数据中找出假设与现实的矛盾,从而否定该假设。所以, 在多数统计教材当中,假设检验都是以否定事先设定的那个假设为目标的。
如果搜集到的数据分析结构不能否定该假设,只能说明我们掌握的现 实不足以否定该假设,但不能说明该假设一定成立。这是假设检验做结论 的时候尤其要注意的一点。比如一个人在数次的观察中都没有干坏事,但 并不说明他从来都没干过坏事。
《假设检验》PPT课件-(2)
t检验的正确应用
资料的代表性与可比性 所谓代表性是指该样本从相应总体中经随机抽样获得,能够代表总体的特征; 所谓可比性是指各对比组间除了要比较的主要因素外,其它影响结果的因素应尽可能相同或相近 为了保证资料的可比性,必须要有严密的实验设计,保证样本随机抽取于同质总体,这是假设检验得以正确应用的前提 。
在两个样本均数比较时,若两组样本含量都很大,可用u检验,其计算公式为:
u为标准正态离差,按正态和1993抽查部分12岁男童对其发育情况进行评估,其中身高的有关资料如下,试比较这两个年度12岁男童身高均数有无差别。
1973 年:n1=120 =139.9cm s1=7.5cm; 1993 年:n2=153 =143.7cm s2=6.3cm。 H0 :1=2,即该市两个年度12岁男童平均身高相等; H1 :1≠2,即该市两个年度12岁男童平均身高不等。 双侧 =0.05。
-t
t
0
-2.064
2.064
0
=24
0.025
0.025
t0.05,24=2.064 P =P ( |t| ≥2.064 )=0.05
P=P(|t|≥5.4545)<0.05
结论(根据小概率原理作出推断)
在H0成立的前提下出现现有差别或更大差别的可能性P(| t | ≥5.4545)小于0.05,是小概率事件,即现有样本信息不支持H0。 抉择的标准为: 当P≤ 时,拒绝H0,接受H1 当P> 时,不拒绝H0 本例P<0.05,按 =0.05的水准,拒绝H0,接受H1,差别有统计学意义。认为该病女性患者的Hb含量高于正常女性的Hb含量。
根据抽样误差理论,在H0假设前提下,统计量t服从自由度为n-1的t分布,即t值在0的附近的可能性大,远离0的可能性小,离0越远可能性越小。 t值越小,越利于H0假设 t值越大,越不利于H0假设
资料的代表性与可比性 所谓代表性是指该样本从相应总体中经随机抽样获得,能够代表总体的特征; 所谓可比性是指各对比组间除了要比较的主要因素外,其它影响结果的因素应尽可能相同或相近 为了保证资料的可比性,必须要有严密的实验设计,保证样本随机抽取于同质总体,这是假设检验得以正确应用的前提 。
在两个样本均数比较时,若两组样本含量都很大,可用u检验,其计算公式为:
u为标准正态离差,按正态和1993抽查部分12岁男童对其发育情况进行评估,其中身高的有关资料如下,试比较这两个年度12岁男童身高均数有无差别。
1973 年:n1=120 =139.9cm s1=7.5cm; 1993 年:n2=153 =143.7cm s2=6.3cm。 H0 :1=2,即该市两个年度12岁男童平均身高相等; H1 :1≠2,即该市两个年度12岁男童平均身高不等。 双侧 =0.05。
-t
t
0
-2.064
2.064
0
=24
0.025
0.025
t0.05,24=2.064 P =P ( |t| ≥2.064 )=0.05
P=P(|t|≥5.4545)<0.05
结论(根据小概率原理作出推断)
在H0成立的前提下出现现有差别或更大差别的可能性P(| t | ≥5.4545)小于0.05,是小概率事件,即现有样本信息不支持H0。 抉择的标准为: 当P≤ 时,拒绝H0,接受H1 当P> 时,不拒绝H0 本例P<0.05,按 =0.05的水准,拒绝H0,接受H1,差别有统计学意义。认为该病女性患者的Hb含量高于正常女性的Hb含量。
根据抽样误差理论,在H0假设前提下,统计量t服从自由度为n-1的t分布,即t值在0的附近的可能性大,远离0的可能性小,离0越远可能性越小。 t值越小,越利于H0假设 t值越大,越不利于H0假设
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 14、Thank you very much for taking me with you on that splendid outing to London. It was the first time that I had seen the Tower or any of the other famous sights. If I'd gone alone, I couldn't have seen nearly as much, because I wouldn't have known my way about.
。2020年12月11日星期五2020/12/112020/12/112020/12/11
❖ 15、会当凌绝顶,一览众山小。2020年12月2020/12/112020/12/112020/12/1112/11/2020
❖ 16、如果一个人不知道他要驶向哪头,那么任何风都不是顺风。2020/12/112020/12/11December 11, 2020
1.0
0.8
S e ns itivity
0.6
0.4
0.2
0.0
0.0
0.2
0.4
0.6
0.8
1.0
1 - S p e c ific ity
H0的真状 决策 接受H0 拒绝H0
H0正确
正确接受H0
1
敏感度 P(接受|正确)
错误拒绝H0
第一类错误 P(拒绝|正确)
H0错误
错误接受H0
第二类错误 P(接受|错误)
正1确拒绝H0
势、奇异性 P(拒绝|错误)
❖ 在 一定的情况下,1 越大,效应
1 ❖ 也就越大。
❖ 问题: 、 1 的值,与累积概率又有
什么关系?
❖ 9、春去春又回,新桃换旧符。在那桃花盛开的地方,在这醉人芬芳的季节,愿你生活像春天一样阳光,心情像桃花一样美丽,日子像桃子一样甜蜜。 2020/12/112020/12/11Friday, December 11, 2020
第一类错误和第二类错误
实测
预测 会再犯的 监禁者
不会再犯 的监禁者
会再犯的监禁 者
正确肯定 (True positive
rate;TP)
错误否定 (False negitive;FN)
不会再犯的监禁 者
错误肯定(False positive;FP)
正确否定(TΒιβλιοθήκη ue negitive;TN)❖ 通过贝叶斯定理我们知道,要检验一个模型是否有 效,除了简单的ROC曲线判断外,还必须有效性 (效应effective size)是否大于50%或者基准概率 (base rate)是否太小。
❖ 10、人的志向通常和他们的能力成正比例。2020/12/112020/12/112020/12/1112/11/2020 6:12:23 PM ❖ 11、夫学须志也,才须学也,非学无以广才,非志无以成学。2020/12/112020/12/112020/12/11Dec-2011-Dec-20 ❖ 12、越是无能的人,越喜欢挑剔别人的错儿。2020/12/112020/12/112020/12/11Friday, December 11, 2020 ❖ 13、志不立,天下无可成之事。2020/12/112020/12/112020/12/112020/12/1112/11/2020
❖
THE END 17、一个人如果不到最高峰,他就没有片刻的安宁,他也就不会感到生命的恬静和光荣。2020/12/112020/12/112020/12/112020/12/11
谢谢观看