关于假设检验的两类错误问题的分析--论文

合集下载

关于假设检验的两类错误问题的分析--论文

关于假设检验的两类错误问题的分析--论文

关于假设检验的两类错误问题的分析摘要:本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。

关键词:假设检验,两类错误,关系,控制统计学知识具有理论丰富、应用广泛的特征,在生产实践中具有强烈的应用背景[1],由于受到人力、物力、财力、时间等的限制,以及某些实验与检测的破坏性,人们在实践中对总体的某一数量特征进行评估时,常常采取从总体中抽取若干数量的随机样本,然后,依据“小概率原理”和样本信息,用假设检验方法对总体数量特征做出判断。

例如,商业银行对企业进行信用评估问题[2],产品生产线工作是否异常的判断问题,炮弹质量检测问题等都要用到统计学中假设检验方面的知识。

人们总是希望能够依据样本信息做出关于总体特征的正确判断或决策。

然而,由于样本是从总体中随机抽取的,用少量的随机样本信息来对总体的某些特征进行假设检验难免不犯错误,这些错误我们通常称为假设检验的两类错误问题。

本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。

1问题引入由下例引出的问题[3]:例1:已知罐头番茄汁中维生素C含量服从正态分布,按规定,维生素C的平均含量不得少于21毫克,现在从一批罐头中抽取17罐。

算得维生素C含量的平均值X=23,S2=31982,问该批罐头维生素c含量是否合格? (α=0.05)。

解:维生素c含量X~N(μ,α2),检验假设:H0:μ<21,当H0成立时,则有查表得t0.05=1.746,即P{T>1.746}=0.05,经计算T=2.07>1.746,于是否定H0,认为μ≥21,即该批罐头合格。

在本例中,罐头是否合格,在解答之前并不知道,那么,为什么要设为H0<21而不设为H0>21呢?如果说两种地位均等,取哪一个都行,那么将会得出什么结论。

假设检验的论文

假设检验的论文

假设检验的论文摘要本文旨在介绍假设检验的基本概念、原理及应用。

首先,我们将详细解释什么是假设检验,并介绍其在统计学中的重要性。

然后,我们将讨论假设检验的基本步骤,包括设置原假设和备择假设、选择合适的检验统计量以及确定显著性水平。

接着,我们将介绍两类常见的假设检验:单样本检验和双样本检验,并通过示例来说明如何进行假设检验。

最后,我们还将探讨一些常见的假设检验错误类型和如何降低错误的风险。

通过本文的阅读,读者将能够充分理解假设检验的概念和应用,并在实际问题中灵活运用。

引言假设检验是统计学中一个重要的方法,用于评估样本数据与某种假设之间的一致性。

在研究过程中,我们往往需要根据样本数据来推断总体的特征,并对一些假设进行验证。

假设检验可以帮助我们确定样本数据是否支持特定的假设,从而对总体进行推断,并做出相应的决策。

假设检验的基本步骤1.设置原假设和备择假设:原假设(H0)是我们想要进行验证的假设,备择假设(H1)是与原假设对立的假设。

通常情况下,原假设是一种基本的假设,而备择假设是我们想要证明的假设。

2.选择合适的检验统计量:根据问题的特点和样本数据的性质选择合适的检验统计量。

常见的检验统计量有Z检验、T检验、卡方检验等。

3.确定显著性水平:显著性水平(α)是我们设定的一个界限值,用于判断样本数据是否能否拒绝原假设。

通常情况下,显著性水平是一个小于1的数值,常见的显著性水平有0.05和0.01。

4.计算检验统计量的值:根据样本数据和所选择的检验统计量计算出实际的检验统计量的数值。

5.做出决策:根据检验统计量的数值和显著性水平,判断样本数据是否支持或拒绝原假设。

如果检验统计量的数值落在拒绝域内,那么我们可以拒绝原假设;如果检验统计量的数值没有落在拒绝域内,那么我们无法拒绝原假设。

单样本检验单样本检验是假设检验中最基本的一种形式,用于比较一个样本的特征与某个已知值或总体特征之间的差异。

常见的单样本检验包括单样本均值检验和单样本比例检验。

统计学中的假设检验中的类型I和类型II错误

统计学中的假设检验中的类型I和类型II错误

统计学中的假设检验中的类型I和类型II错误统计学中的假设检验是一种推断性统计方法,用于评估样本数据与所假设的总体参数之间的关系。

在进行假设检验时,我们通常会做出两种可能的错误判断,即类型I错误和类型II错误。

本文将详细介绍这两种错误及其在假设检验中的作用。

一、类型I错误类型I错误是指在原假设为真的情况下,拒绝原假设的错误判断。

换句话说,当实际上不存在显著差异时,我们错误地得出了存在显著差异的结论。

类型I错误的发生概率称为显著性水平(α),通常设置在0.01或0.05。

在假设检验中,我们会首先建立一个零假设(H0),即假设两个样本或总体没有差异。

然后通过计算样本数据的p值(或计算出来的显著性水平)来判断是否拒绝零假设。

如果p值小于设定的显著性水平,我们将拒绝零假设,并得出结论有显著差异。

然而,这种结论可能是错误的,即发生了类型I错误。

类型I错误的概率在理论上是可以控制的,通常通过设定显著性水平来控制。

较小的显著性水平可以减少类型I错误的概率,但也会增加类型II错误的概率。

二、类型II错误类型II错误是指在原假设为假的情况下,接受原假设的错误判断。

换句话说,当实际上存在显著差异时,我们未能得出存在显著差异的结论。

类型II错误的概率称为β,通常难以确定。

类型II错误的概率与样本大小、效应大小以及显著性水平等因素有关。

当样本大小较小时,可能存在较高的类型II错误概率。

当效应较小或显著性水平较高时,也会增加类型II错误的概率。

为了最小化类型II错误的概率,可以通过增加样本大小、明确效应大小以及适当选择显著性水平来进行调整。

三、平衡类型I和类型II错误在进行假设检验时,我们希望能够在保证控制类型I错误概率的同时,尽量减少类型II错误概率。

通常情况下,类型I错误概率(α)和类型II错误概率(β)是相互制约的。

当我们降低显著性水平以减少类型I错误时,往往会增加类型II错误的概率。

相反,若提高显著性水平以减少类型II错误,则可能会增加类型I错误的概率。

关于参数假设检验中两类错误的思考

关于参数假设检验中两类错误的思考

商业文化·学术探讨 2008年2月319关于参数假设检验中两类错误的思考谢 铭 翟 彬(西安交通大学经济与金融学院,西安,710061)中图分类号:O212.1 文献标识码:A 文章编号:1006—4117(2008)02—0319—01一、参数假设检验中的两类错误在参数假设检验问题中首先根据实际问题的先验信息,确定参数的可能取值范围,再根据需判断的实际问题,将Θ分成互不相交的两部分0Θ和1Θ。

参数假设检验就是根据样本所携带的信息,推断参数的实际值究竟在哪个集合中。

0Θ称为原假设,用H0表示。

参数集的另一部分1Θ称为备选假设,用H 1表示。

在对总体参数进行假设检验时,我们期望的结果是:当H 0中所作的假设为真时,接受H 0;反之当H 1为真时,接受H 1,拒绝H 0,这时的判断与实际相符,没有错误发生。

但是由于客观上存在抽样的随机性,推断的结果也可能是完全相反的,H 0中所作的假设为真,却拒绝了H 0,或者H 0为假时,接受了H 0,这与实际的结果截然相反,发生了两类错误。

将上述结果列示如下:总体的情况 H0为真 H 0为假 接受H 0 结论正确 第二类错误(取伪错误) 拒绝H 0第一类错误(拒真错误)结论正确二、两类错误的计算方法在一般场合下,拒绝域和接受域要由α决定,α为事件“H 0为真但被拒绝”的概率,这个概率又称为显著性水平。

()1P X c α=>=−Φ(假设是一个右侧检验,c 为临界值)。

α值在一般情况下都是事先给定的。

当我们根据根据抽样的结果拒绝了H 0时,其结果要么正确,要么犯第一类错误,犯第一类错误得概率为α,进一步说,根据这一决定作出得行动有1-α的信心,所以当使用一个更小的α水平时,就可以持有更大的信心,控制α水平的意义即在于此。

在大多数假设检验中,人们一般只慎重考虑α的取值,而较少的关心β值的大小。

并且认为β值是不可计算,不能控制的。

果真如此吗?支持这一结论的观点是:总体的“未知性”。

假设检验中两类错误分析与实验

假设检验中两类错误分析与实验

本 质 . 文 拟 通 过 理 论 推 导 并 结 合 图 形 分 析 , 出犯 两 类 错 误 的 概 率 、 以及 样 本 数 量 n之 间 的 数 量 关 系 表 达 式 , 设 计 显 本 给 卢 并 著性 检 验 的 数 值 实 验 对 本 文 给 出 的 理 论 公 式 加 以验 证 .
1 两 类 错 误 分 析
两类 错 误 的 分 类 见 表 1 犯 “ 真 ” 误 的 前 提 条 件 是 . 弃 错
为 真 , “ 伪 ” 误 的 前 提 条 件 是 犯 取 错
为 假 , 于 犯 两 类 错 误 的 由
前 提 条件 不 同 , 犯 “ 真 ” 误 与 “ 伪 ” 误 不 是 对 立 事 件 , 故 弃 错 取 错 因而 , 一 般 情 况 下 十 在 卢≠1 关 于 犯 “ 伪 ” 误 的概 率 卢的 计 . 取 错 算 问题 , 以及 犯 两 类 错 误 的 概 率 n与 口 以及 样 本 数 量 n之 间 的数 量 关 系 问 题 , 较 复 杂 , 要 知 道 总 体 的 分 布 及 其 相 关 参 数. 比 需
策 , 类 错 误 称 为 “ 真 ” 误 , 发 生 的概 率 通 常 用 表 示 ( 即显 著 性 水 平 ) 另 一 类 是 在 原 假 设 为 假 时 没 有 拒 绝 原 假 设 , 这 弃 错 其 也 ; 这 类 错 误 称 为 “ 伪 ” 误 , 发 生 的概 率 通 常 用 卢表 示 . 两 类 错 误 的概 率 、 以及 样 本 数 量 n之 间 具 有 什 么 样 的 数 量 关 系 ? 取 错 其 犯 卢 与 口的 和 等 于 1 ? 有 学 者 对 假设 检 验 中两 类 错 误 及 相 关 问 题 做 过 一 些研 究 吗 , 关 于犯 两类 错 误 的 概 率 、 以及 样 本 但 卢

假设检验中控制第二类错误的探讨

假设检验中控制第二类错误的探讨

统计与决策2011年第22期(总第346期)假设检验中控制第二类错误的探讨甘伦知(四川理工学院经管学院,四川自贡643000)摘要:总体参数假设检验中犯第二类错误的概率受到检验水平、参数真值和样本容量等因素的影响。

花费过多的成本(样本容量很大)去检验总体参数与待检值是否还存在细小的差距往往是不必的,因而,在给定“辨别差距”的情况下,可以通过选择样本容量在一定程度上实际实现对两类错误的控制。

关键词:假设检验;第二类错误;控制中图分类号:F224.9文献标识码:A文章编号:1002-6487(2011)22-0035-030引言假设检验是一种实际应用非常广泛的统计推断方法。

由于抽样的随机性,假设检验中存在犯两类错误的可能。

其中,由于犯第二类错误的概率与总体参数的真实水平有关,因而对它的研究和讨论一直停留在理论上,难以在实践中实现对它的控制。

郭宝才(2010)[1]、励晶晶(2010)[2]等都对该问题展开过有益的讨论,但仍都未能提出实际可行的控制办法。

本文尝试提出一种“辨别差距”,在假设检验时给定“辨别差距”的情况下,可以通过选择样本容量实际实现对两类错误的控制。

本文将主要针对单总体参数的假设检验来讨论,涉及样本均为简单随机样本。

1β的影响因素在假设检验中,依据“小概率事件原理”作出的判断可能导致两类错误。

当原假设为真时,却错误地拒绝了它,于是犯了“弃真”的错误,称为第一类错误。

当原假设不真时,却错误地接受了它,于是犯了“取伪”的错误,称为第二类错误。

犯第二类错误的概率通常记为β。

我们以对单总体均值的右单尾Z 检验为例来认识β的影响因素。

设总体ξ~N (μ,σ2),σ2已知,原假设为H 0:μ μ0, H 1:μ>μ0。

检验水平为α,样本容量为n,则样本均值x ˉ~N (μ,σ2n ),检验统计量为Z有β=P (接受H 0|H 0为假)=P (Z <z α|μ>μ0)=Pz α|μ>μ0)=P z α>μ0)=Φ(zα(1)其中,Φ( ⋅ )为标准正态分布的分布函数,临界值z α满足Φ(z α)=1-α。

假设检验中几种常见的误区分析

假设检验中几种常见的误区分析

假设检验中几种常见的误区分析摘要:概率统计是广大理工科院校的必修课程,也是研究生入学考试的全国统考的课程,假设检验是概率统计的一个重要问题,不少学生对其有理解误区。

本文通过例题对困扰广大同学的三个假设检验问题问题进行分析。

关键词:概率统计假设检验错误分析《概率论与数理统计》作为大学数学的一个重要组成部分,是广大理工科院校的必修课程,也是研究生入学考试的全国统考的课程。

与其他学科不同的是,概率论与数理统计是研究自然界,人类社会中大量出现的随机显现规律性的一门数学分支。

它具有独特的理论和思想方法,别开生面的研究课题,并且随着现代科学技术的发展而迅速发展。

随着社会和经济的发展,它在自然科学,金融,经济管理,社会科学等方面的应用也越来越广泛,因此,概率统计的学习受到了同学和老师的高度重视。

统计推断是由样本推断总体,其中一个重要问题是假设检验问题,有关总体分布的未知参数或未知分布形式的种种论断叫统计假设,人们根据样本所提供的信息对所考虑的假设做出接受或拒绝的决策,做出这一决策的过程就是假设检验。

在假设检验这一章节的授课过程中,笔者发现学生对这一部分内容的学习,有点吃力,不少学生反映,不太理解这部分的内容,做题目时只能按照书上的例题照搬照抄,不理解为什么要这样做,特别是双边检验和单边检验的区分,左边检验还是右边检验,显著性水平不同时,结论卫生么有不同等问题很困惑,本文对这样几个误区的进行了探讨。

一、单边检验和双边检验的区分在教学过程中,绝大部分教材都会讲到双边检验和单边检验问题,无论是单正态总体的均值方差检验,还是两个正态总体的均值差方差比的检验,还是非正态总体的检验,双边和单边的区分在于原假设和备则假设H1的形式。

如果原假设H0和备则假设H1是形如“ = ”和“=”的形式,则该假设检验是双边假设检验,反之,该假设检验是单边假设检验。

例 1 某车间用一台包装机包装葡萄糖。

袋装糖的净重是一个随机变量,它服从正态分布。

统计学中的假设检验错误类型分析

统计学中的假设检验错误类型分析

统计学中的假设检验错误类型分析假设检验是统计学的重要理论之一,用于判断样本数据对某个总体假设的支持度。

在假设检验过程中,我们会遇到两种类型的错误,即第一类错误和第二类错误。

本文将对这两种错误类型进行分析,并探讨如何降低错误率。

1. 第一类错误第一类错误也被称为显著性水平(Significance Level)或α错误。

它指的是在原假设为真的情况下,拒绝原假设的错误判断。

在假设检验中,我们通常会设定一个显著性水平来进行决策,常见的显著性水平有0.05和0.01。

当结果的p值小于设定的显著性水平时,我们将拒绝原假设。

然而,这种判断并不是绝对准确的,存在一定概率犯下错误。

第一类错误的概率通常用α表示。

当我们将显著性水平设定为0.05时,即α=0.05,意味着有5%的可能犯下第一类错误。

如果显著性水平设定得较低,例如α=0.01,那么犯第一类错误的概率将更小,但同时也会增加犯第二类错误的概率。

2. 第二类错误第二类错误是在原假设为假的情况下,接受原假设的错误判断。

与第一类错误相反,第二类错误常用β表示。

第二类错误的概率与样本大小、效应大小和显著性水平等因素有关。

当样本大小较小时,相同效应大小下犯第二类错误的概率较高;当效应大小较小时,相同样本大小下犯第二类错误的概率也较高;而当显著性水平设定较低时,犯第二类错误的概率也会增加。

3. 降低错误率的方法在实际应用中,我们希望尽可能降低第一类错误和第二类错误的概率,提高假设检验的准确性。

以下是一些常用的方法:3.1 增加样本容量通过增加样本容量,可以降低第一类错误和第二类错误的概率。

较大的样本容量能够提供更充分的信息,减小抽样误差,提高判断结果的准确性。

在样本容量不足时,可能会导致犯下更多的错误。

3.2 提高显著性水平设定较低的显著性水平可以降低第一类错误的概率。

但需要注意的是,过低的显著性水平会增加犯第二类错误的概率,因此需要权衡选择适当的显著性水平。

3.3 增大效应大小提高研究中的效应大小可以降低第二类错误的概率。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

关于假设检验的两类错误问题的分析摘要:本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。

关键词:假设检验,两类错误,关系,控制统计学知识具有理论丰富、应用广泛的特征,在生产实践中具有强烈的应用背景[1],由于受到人力、物力、财力、时间等的限制,以及某些实验与检测的破坏性,人们在实践中对总体的某一数量特征进行评估时,常常采取从总体中抽取若干数量的随机样本,然后,依据“小概率原理”和样本信息,用假设检验方法对总体数量特征做出判断。

例如,商业银行对企业进行信用评估问题[2],产品生产线工作是否异常的判断问题,炮弹质量检测问题等都要用到统计学中假设检验方面的知识。

人们总是希望能够依据样本信息做出关于总体特征的正确判断或决策。

然而,由于样本是从总体中随机抽取的,用少量的随机样本信息来对总体的某些特征进行假设检验难免不犯错误,这些错误我们通常称为假设检验的两类错误问题。

本文对假设检验的两类错误问题进行分析,阐述了两类错误问题的基本概念,讨论了两类错误的产生的原因和它们之间的关系,并给出了减少统计假设检验中两类错误发生的方法。

1问题引入由下例引出的问题[3]:例1:已知罐头番茄汁中维生素C含量服从正态分布,按规定,维生素C的平均含量不得少于21毫克,现在从一批罐头中抽取17罐。

算得维生素C含量的平均值X=23,S2=31982,问该批罐头维生素c含量是否合格? (α=0.05)。

解:维生素c含量X~N(μ,α2),检验假设:H0:μ<21,当H0成立时,则有查表得t0.05=1.746,即P{T>1.746}=0.05,经计算T=2.07>1.746,于是否定H0,认为μ≥21,即该批罐头合格。

在本例中,罐头是否合格,在解答之前并不知道,那么,为什么要设为H0<21而不设为H0>21呢?如果说两种地位均等,取哪一个都行,那么将会得出什么结论。

请看下例:例2:例1中将平均值改为X=22,其它不变。

解:(1)检验假设H0:<21,经计算T=1.036,由于1.036<1.746,所以接受H0,即认为该批罐头不合格。

(2)检验假设H0:μ≥21,计算同上,由于P{T<-1.746}=0.05,而1.036>1.746,所以接受,即认为该批罐头合格。

在同一个检验标准下会有相反的结论,这样的检验是不能付诸现实的。

上面的例子是所谓单边检验,单边检验因为要有说明,所以理解起来似乎更困难一些,但是,在理论上对单边检验的研究却是对双边检验研究的基础,同时单边检验在实际中有许多应用[4]。

事实上,对于形如那样的双边检验也会遇到类似的问题。

例3:某砖厂生产的砖抗断强度服从正态分布,已知α2=1.21,今从一批砖中随便地抽取6块,测得抗断强度平均值=31.88公斤/平方厘米,现在问:这批转的平均抗断强度可否认为是32.50公斤/平方厘米(α=0.05)解:(1)抗断强度X N(32.50,1.12),检验假设H0:μ=32.50,当H0成立时,.查表知P{U>1.96}=0.05,但现在U=1.38<1.96,因此下结论不能否定H0,即认为这批产品的平均抗断强度是32.50公斤/平方厘米。

(2)又根据反证法的思想也可检验<32.50或>32.50,于是有检验假设H1:μ>32.50,当H1成立时,查表得μ0.05=1.65,由于P{<-1.65}0.05,经计算U=-1.38>-1.65,所以不能否定H1,当然H0不能成立[5]。

问题究竟出在哪里呢?2假设检验的两类错误2.1假设检验的基本原理假设检验的最基本原理是显著性原理,是根据样本观测值来判断是否有显著差异,这个差异是由两种可能因素引起的,一是系统性因素,一是偶然性因素。

问题的关键在于:这个差异是否可以仅以偶然性这个因素去解释,也就是说是否有充分的理由来否定这种解释。

如果有,就否定原假设,如果没有,就只能接受它。

假设检验的基本思想是应用小概率原理,所谓小概率原理就是认为小概率事件在一次试验中是几乎不可能发生的,如果发生了,就有充分的理由怀疑原假设为真,也即拒绝原假设[6]。

2.2两类错误如果原假设H0成立,而观察值落入否定域,从而作出拒绝H0的错误结论,称作第一类错误,第一类错误是“以真当假”,犯第一类错误的概率不超过显著性水平α。

如果原假设H0不成立,而观察值未落入否定域,从而作出接受H0的错误结论,称作第二类错误,第二类错误是“以假当真”,犯第二类错误的概率记作β[7]。

两类错误的分类见表1[8]。

表 1 显著性检验判断结果分类犯“弃真”错误的前提条件是H0为真,犯“取伪”错误的前提条件是H0为假,由于犯两类错误的前提条件不同,故犯“弃真”错误与“取伪”错误不是对立事件,因而,在一般情况下α+β≠1。

关于犯“取伪”错误的概率β的计算问题,以及犯两类错误的概率α与β以及样本数量n 之间的数量关系问题,比较复杂,需要知道总体的分布及其相关参数[9]。

然而,由中心极限定理知,无论总体X 服从什么分布,来自总体X 的独立同分布随机样本Xi(i =1,2,…,n)在样本容量n较大时(n≥30),其均值都近似服从正态分布。

因而,以正态总体为例研究犯两类错误的概率与样本容量之间的数量关系具有一般性。

2.3两类错误产生的原因在实践中.检验者往往确定允许犯第一类错误概率的最大值,称为检验的显著性水平(一般选择0.01或0.05)。

结果是,在拒绝H0时,要么结论正确,要么犯第一类错误(小慨率事件)。

因此,当样本数据支持H0时,犯错误的可能性大小(概率α)是可控的。

但是,当样本数据不支持拒绝H0时,我们只好接受H0,这时就有可能犯第二类错误,而第二类错误并不是总能控制的,也即在决定接受H0时,其决策正确的概率是不确定的。

因此,在样本数据不支持拒绝H0时,应使用“不能拒绝H0”而非“接受H0”的结论。

显然,当样本数据拒绝H0时,采取任何相应的行动都是恰当的(这就是要选择对被择假没进行检验的理由);当样本数据不能拒绝H0时,在研究性和陈述正确性检验中不必采取行动,但在决策情况下,必须接受H0并采取相应行动,此时就会冒犯第二类错误的风险[9]。

3假设检验中两种类型错误之间的关系(一)α与β是在两个前提下的概率。

α是拒绝H0时犯错误的概率(这时前提是“H0为真”);β是接受H0时犯错误的概率(这时“H0为假”是前提),所以α+β不一定等于1。

结合图1分析如下:图1 α与β的关系示意图如果H0:μ1=μ0为真,关于与μ0的差异就要在图1中左边的正态分布中讨论。

对于某一显著性水平α其临界点为。

(将两端各α/2放在同一端)。

右边表示H0的拒绝区,面积比率为α;左边表示H0的接受区,面积比率为1-α。

在“H0为真”的前提下随机得到的落到拒绝区时我们拒绝H0是犯了错误的。

由于落到拒绝区的概率为α,因此拒绝“H0为真”时所犯错误(I型)的概率等于α。

而落到H0的接受区时,由于前提仍是“H0为真”,因此接受H0是正确决定,落在接受区的概率为1-α,那么正确接受H0的概率就等于1-α。

如α=0.05则1-α=0.95,这0.05和0.95均为“H0为真”这一前提下的两个概率,一个指犯错误的可能性,一个指正确决定的可能性,这二者之和当然为1[10]。

但讨论β错误时前提就改变了,要在“H0为假”这一前提下讨论。

对于H0是真是假我们事先并不能确定,如果H0为假、等价于H l为真,这时需要在图1中右边的正态分布中讨论(H1:μ1>μ0),它与在“H0为真”的前提下所讨论的相似,落在临界点左边时要拒绝H l(即接受H0),而前提H l为真,因而犯了错误,这就是II型错误,其概率为β。

很显然,当α=0.05时,β不一定等于0.95。

(二)在其他条件不变的情况下,α与β不可能同时减小或增大。

这一点从图1也可以清楚看到。

当临界点向右移时,α减小,但此时β一定增大;反之向左移则α增大β减小。

一般在差异检验中主要关心的是能否有充分理由拒绝H0[11],从而证实H l,所以在统计中规定得较严。

至于β往往就不予重视了,其实许多情况需要在规定的同时尽量减小β。

这种场合最直接的方法是增大样本容量。

因为样本平均数分布的标准差为,当n增大时样本平均数分布将变得陡峭[12],在α和其他条件不变时β会减小(见图2)。

图2 不同标准差影响β大小示意图(三)在图1中Hl为真时的分布下讨论β错误已指出落到临界点左边时拒绝H l所犯错误的概率为β[13]。

那么落在临界点右边时接受H l则为正确决定,其概率等于1—β。

换言之,当Hl为真,即μ1与μ0确实有差异时(图1中,μ1与μ0的距离即表示μ1与μ0的真实差异),能以(1—β)的概率接受之[14]。

如图1所示,当α以及其他条件不变时,减小μ1与μ0的距离势必引起β增大、(1—β)减小,也就是说,其他条件不变,μ1与μ0真实差异很小时,正确接受H l的概率变小了。

或者说正确地检验出真实差异的把握度降低了。

相反,若其他条件不变μ1与μ0的真实差异变大时,(1—β)增大即接受H l的把握度增大。

所以说1—β反映着正确辨认真实差异的能力。

统计学中称(1—β)为统计检验力。

这是个比较重要的统计学概念。

假如真实差异很小时,某个检验仍能以较大的把握接受它,就说这个检验的统计检验力比较大[15]。

4两类错误的控制4.1增加样本容量n我们以正态分布为例,正态分布有两个参数μ和σ,μ是位置参数,μ越小,正态分布曲线的中心越向左移,μ越大,越向右移。

σ是形状参数,σ越大正态分布曲线越平缓低阔,σ越小曲线越陡峭高狭,在总体平均数显著性检验中,检验常常是在平均数为μ0,标准差为σ/n的正态分布中进行的。

n 越大,则σ/n 越小,正态分布形状越陡峭高狭,因而接受域上面积也就越小。

故当样本容量n 较大时,β较小,在检验中要想同时减少犯两类错误的概率α和β,最为有效的方法就是增加样本的容量。

但是,增加样本容量则意味着增加抽检费用和时间,有时并不容易实现,因此在多数场合,α不宜定得太小[16]。

4.2 根据研究的需要选择合适的α水平在样本容量n与μ都不变的条件下,α水平减少则β值就要增大。

因此,我们就要根据研究的需要,选择合适的α水平来降低统计错误的发生。

当一个研究力求证明所比较的两个总体在某个指标上存在差别时,研究者当然希望所推断的方法具有较高的可靠性,此时,在统计假设检验中就得力求有更高的把握拒绝原假设,而要达到这个目的[17],就要使α水平减小,使犯弃真错误的概率降低;当一个研究力求证明所比较的两个总体在某个指标上没有差异时,在统计假设检验中就要力求接受H0,这时只有犯纳违的错误的可能性。

相关文档
最新文档