01第一节 显著性检验的基本原理

合集下载

SAS显著性检验原理及应用

SAS显著性检验原理及应用

方差分析
方差分析用于比较两个或多个独立样本的均值是否存在显著 差异。
方差分析通过分析不同样本间的变异和误差来源,计算每个 样本的方差和自由度,并进一步计算F统计量,以评估各组均 值是否存在显著差异。方差分析适用于多组数据比较的情况 。
卡方检验
卡方检验用于比较实际观测频数与 期望频数之间的差异是否具有显著性 。
02
样本数据应具有独立性和随机性,且总体分布的方差
齐性。
03
在进行显著性检验之前,需要先对数据进行正态性和
方差齐性的检验,以确保样本数据满足假设条件。
02
常见的SAS显著性检验方法
T检验
T检验是一种常用的显著性检验方法,用于比较两组数据的均值是否存在显著差异。
T检验基于统计学原理,通过计算两组数据的差值、差值的概率分布以及自由度,来评估两组数据的均值是否存在显著差异 。T检验适用于样本量较小、总体标准差未知的情况。
机器学习方法的应用
随着机器学习技术的发展,越来越多的机器学习方法 被应用于SAS显著性检验中。
机器学习方法可以通过对大量数据进行训练和学习, 自动提取数据中的特征和规律,从而提高了检验的效 率和准确性。
大数据和云计算的结合
大数据和云计算技术的结合为SAS显著性检 验提供了强大的计算能力和存储空间,可以 处理大规模的数据集和复杂的模型。
01
显著性检验是统计学中用于判断观测数据是否符合 某种假设或理论的一种方法。
02
它通过比较样本数据与预期结果或理论值,评估两 者之间的差异是否具有统计学上的意义。
03
显著性检验的目的是确定样本数据是否能够支持或 拒绝某一假设,从而为决策提供依据。
SAS显著性检验的原理
SAS显著性检验基于概率论和统计学原理,通过计算观测数据的概率分布情况,判断其是否符合预期 或理论分布。

第二讲-第五章 t检验-2011

第二讲-第五章 t检验-2011
表5-4 粤黄鸡饲养试验增重
二、配对设计两样本平均数的差异显著性检验
非配对设计要求试验单位尽可能一致。如 果试验单位变异较大,如试验动物的年龄、体 重相差较大,若采用上述方法就有可能使处理 效应受到系统误差的影响而降低试验的准确性 与精确性。 为了消除试验单位不一致对试验结 果的影响,正确地估计处理效应,减少系统误 差,降低试验误差,提高试验的准确性与精确 性,可以利用局部控制的原则,采用配对设计。
表 非配对设计资料的一般形式
非配对设计两样本平均数差异显著性检 验的基本步骤如下:
(一)提出无效假设与备择假设
H0:1 2 ,H A:1 2
(二)计算t值 计算公式为:
t x1 x2 S x1x2
df (n1 1) (n2 1)
其中:
S x1x2
受 H A:1 2 ,表明长白后备种猪与蓝塘后
备种猪90kg背膘厚度差异极显著,这里表现 为长白后备种猪的背膘厚度极显著地低于蓝 塘后备种猪的背膘厚度。
【例5.4】 某家禽研究所对粤黄鸡进行饲 养对比试验,试验时间为60天,增重结果如 表5-4,问两种饲料对粤黄鸡的增重效果有无 显著差异?
一是非配对设计或成组设计两样本平均数差 异显著性检; 二是配对设计两样本平均数差异显著性检。
一、非配对设计两样本平均数的差异显著性检验 非配对设计或成组设计是指当进行只有两个处
理的试验时,将试验单位完全随机地分成两个组, 然后对两组随机施加一个处理。在这种设计中两组 的试验单位相互独立,所得的二个样本相互独立, 其含量不一定相等。非配对设计资料的一般形式见 下表。
两尾概率为0.01的临界t值:t0.01(18) =2.878,即:
P(|t|>2.101)= P(t>2.101) + P(t <-2.101)=0.05

显著性检验.

显著性检验.
上一张 下一张 主 页 退 出
显著性检验可能出现两种类型的错误: Ⅰ型错误 与Ⅱ型错误。
Ⅰ型错误又称为 错误,就是把非真实 的差异错判为是真实的差异,即实际上H0正 确,检验结果为否定H0。犯Ⅰ类型错误的可
能性一般不会超过所选用的显著水平 ;
上一张 下一张 主 页 退 出
Ⅱ型错误又称为 错误 ,就是把真实的 差异错判为是非真实的差异 ,即实际上HA 正确,检验结果却未能否定H0 。 犯Ⅱ类型 错误的可能性记为 ,一般是随着 0 的 减小或试验误差的增大而增大,所以 0
退 出
因为两个水稻品种平均产量 x1 、 x2 都 是从试验种植的10个小区获得,仅是两个品 种有关总体平均数 1 , 2 的估计值。由于存 在试验误差 ,样本平均数并不等于总体平均 数 ,样本平均数包含总体平均数与试验误差 二部分,即
x1 1 1
x2 2 2
上一张 下一张 主 页 退 出
上一张 下一张 主 页
退 出
如,某地进行了两个水稻品种对比试验,
在相同条件下,两个水稻品种分别种植10个
小区,获得两个水稻品种的平均产量为:
x1 510
x2 500
x1 x2 10
我们能否根据 x1 x2 10 就判定这两个 水稻品种平均产量不同?结论是,不一定。
上一张 下一张 主 页
若| u| < u ,则 不 能 在 定 H0 : 0 。

水平上否
上一张 下一张 主 页
退 出
区间 平
上的否定域,而区间 (u , u ) 称为 水平上的接受域。
, u

u ,
称为水 则
上一张 下一张 主 页

1 显著性检验的的原理是什么?显著性检验的基本步骤是什么?

1 显著性检验的的原理是什么?显著性检验的基本步骤是什么?

1. 显著性检验的的原理是什么?显著性检验的基本步骤是什么?答:显著性检验的原理就是“小概率事件实际不可能性原理”来接受或否定假设。

其基本步骤如下:第一:提出统计假设H 0和H A 。

第二:构造统计量t ,并根据样本资料计算t 值。

第三:根据t 分布的自由度,确定理论临界值t 0.05和t 0.01。

第四:作出判断。

2. 什么是配对法?什么是成组法?两种方法有何区别?答:将起始条件一致的两个试验个体配成对,并设有多个配对,每对个体分别随机地给予不同处理。

则所得的结果即为配对资料。

非配对资料又称成组资料,是指一组数据与另一组数据没有任何关系,也就是说两样本资料是相互独立的,是对两组平均数进行差异显著性检验。

配对法与成组法之间的差别一是在于试验材料的不同,二是检验的方法上的不同。

3答:根据已知条件得:)./(50.4,05.0678.2008.2,911019357.008443.0|50.4421.4|||08443.0102670.0)/(2670.01101021.4409.1961)()/(421.41021.441009.19621.44)/(50.405.001.005.0022220L mg P t t t t t n df S x t nS S L mg n nx xS L mg nx x n x x L mg x x 总体含氧量为即可以认为该鱼塘水中接受无效假设值表得查><===-=-==-=-=====--=--========∑∑∑∑∑μμ4答:01.0638.2989.1822483624766.36702.023.2356.256702.048136147354047.2912875.466114047.2914749.22875.4663565.34735:01.001.005.021212121212222221211212102121<>===-+=-+==-=-==⎪⎭⎫⎝⎛+++=⎪⎪⎭⎫ ⎝⎛+++==⨯===⨯=====--P t t t t n n df S X X t n n df df SS SS S df S SS df S SS df df X X H X X X X拒绝H 0,即8月龄公羊与母羊的体重存在着极显著的差异。

01第一节显著性检验的基本原理

01第一节显著性检验的基本原理

第一节显著性检验的基本原理一、显著性检验的意义为了便于理解,我们结合一个具体例子来说明显著性检验的意义。

随机抽测10头长白猪和10头大白猪经产母猪的产仔数,资料如下:长白:11,11,9,12,10,13,13,8,10,13大白:8,11,12,10,9,8,8,9,10,7经计算,得长白猪10头经产母猪产仔平均数=11头,标准差S1=1。

76头;大白猪10头经产母猪产仔平均数=9。

2头,标准差S2=1.549头。

能否仅凭这两个平均数的差值-=1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的.这是因为如果我们再分别随机抽测10头长白猪和10头大白猪经产母猪的产仔数,又可得到两个样本资料。

由于抽样误差的随机性,两样本平均数就不一定是11头和9。

2头,其差值也不一定是1。

8头。

造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽样误差)。

对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的.如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。

两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。

这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。

因此,不得不采用另一种方法,即研究样本,通过样本研究其所代表的总体.例如,设长白猪经产母猪产仔数的总体平均数为,大白猪经产母猪产仔数的总体平均数为,试验研究的目的,就是要给、是否相同做出推断。

由于总体平均数、未知,在进行显著性检验时只能以样本平均数、作为检验对象,更确切地说,是以(—)作为检验对象。

为什么以样本平均数作为检验对象呢?这是因为样本平均数具有下述特征:1、离均差的平方和∑(—)2最小.说明样本平均数与样本各个观测值最接近,平均数是资料的代表数.2、样本平均数是总体平均数的无偏估计值,即E()=μ。

显著性判断的基本原理

显著性判断的基本原理

显著性判断的基本原理
显著性判断是一种统计推断方法,用于确定两个或多个样本之间的差异是否真实存在。

其基本原理是通过比较观察到的样本差异与预期的随机差异来评估差异的显著性。

在进行显著性判断时,通常会先建立一个原假设(null hypothesis)和一个备择假设(alternative hypothesis)。

原假设通常表明两个样本之间没有差异或差异仅仅是由于随机因素引起的,而备择假设则表明两个样本之间存在真实的差异。

然后,通过收集样本数据并进行统计分析,计算出一个统计量(test statistic),该统计量能够衡量观察到的差异与预期的随机差异之间的差距。

接下来,将该统计量与一个临界值(critical value)进行比较,如果统计量超过了临界值,则可以拒绝原假设,认为观察到的差异是显著的;反之,如果统计量未超过临界值,则不能拒绝原假设,认为观察到的差异不是显著的。

在进行显著性判断时,还需要确定一个显著性水平(significance level),该水平用于确定临界值。

常见的显著性水平为0.05或0.01,表示在5%或1%的显著性水平下,拒绝原假设。

总之,显著性判断的基本原理是通过比较观察到的差异与预期的随机差异,来评估差异的显著性。

显著性检验

显著性检验

显著性检验1、什么是显著性检验显著性检验就是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否显著地有差异。

或者说,显著性检验要判断样本与我们对总体所做的假设之间的差异是纯属机会变异,还是由我们所做的假设与总体真实情况之间不一致所引起的。

显著性检验是针对我们对总体所做的假设做检验,其原理就是“小概率事件实际不可能性原理”来接受或否定假设。

抽样实验会产生抽样误差,对实验资料进行比较分析时,不能仅凭两个结果(平均数或率)的不同就作出结论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。

2、显著性检验的含义显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。

常把一个要检验的假设记作H0,称为原假设(或零假设)(null hypothesis) ,与H0对立的假设记作H1,称为备择假设(alternative hypothesis) 。

⑴在原假设为真时,决定放弃原假设,称为第一类错误,其出现的概率通常记作α;⑵在原假设不真时,决定接受原假设,称为第二类错误,其出现的概率通常记作β。

通常只限定犯第一类错误的最大概率α,不考虑犯第二类错误的概率β。

这样的假设检验又称为显著性检验,概率α称为显著性水平。

最常用的α值为0.01、0.05、0.10等。

一般情况下,根据研究的问题,如果放弃真错误损失大,为减少这类错误,α取值小些,反之,α取值大些。

3、显著性检验的原理一、无效假设显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的机率(P)水平的选择。

所谓“无效假设”,就是当比较实验处理组与对照组的结果时,假设两组结果间差异不显著,即实验处理对结果没有影响或无效。

经统计学分析后,如发现两组间差异系抽样引起的,则“无效假设”成立,可认为这种差异为不显著(即实验处理无效)。

《生统》第五章 假设检验-t检验

《生统》第五章 假设检验-t检验
表5-4 粤黄鸡饲养试验增重 饲料 A B 8 8 ni 增 重(g) 720、710、735、680、690、705、700、705 680、695、700、715、708、685、698、688
ni
检验步骤:
1、提出无效假设与备择假设 H0:μ1=μ2,HA: μ1 ≠ μ2 2、计算 t 值
表5-2 非配对设计资料的一般形式
处理 1 2 观察值xij x11, x12,… x1j X21, x22,… x2j 样本含量ni n1 n2i 平均数 总体平均数 μ1 μ2
x1 x2
显著性检验的基本步骤:
(一)提出无效假设与备择假设 (二)计算值 计算公式为:
t x1 x 2 S x1 x2
结论:差异极显著
二、配对设计两样本平均数 差异显著性检验
1、自身配对 2、同源配对 配对设计两样本平均数差异显著性检验的基本步骤: (一)提出无效假设与备择假设 (二)计算 t 值
d t Sd
Sd Sd n
d d
n(n 1)
2

d
2
n(n 1)
( d ) 2 / n
检验步骤:
2、计算 t 值
S x1 x2
( x1 x1 ) 2 ( x2 x2 ) 2 ( 1
(n1 1) (n 2 1)
n1

1 ) n2
1、提出无效假设与备择假设
sx1 x2
2 S12 (n1 1) S2 (n2 1) 1 1 (n1 1) n2 1) n1 n2
|t|<t0.05, |t|≥ t0.01 , 则 P>0.05 则 P≤0.01 差异不显著 差异显著 差异极显著 t0.01 ≤|t|< t0.05 ,则 0.01<P≤0.05
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一节显著性检验的基本原理一、显著性检验的意义为了便于理解,我们结合一个具体例子来说明显著性检验的意义。

随机抽测10头长白猪和10头大白猪经产母猪的产仔数,资料如下:长白:11,11,9,12,10,13,13,8,10,13大白:8,11,12,10,9,8,8,9,10,7经计算,得长白猪10头经产母猪产仔平均数=11头,标准差S1=1.76头;大白猪10头经产母猪产仔平均数=9.2头,标准差S2=1.549头。

能否仅凭这两个平均数的差值-=1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的。

这是因为如果我们再分别随机抽测10头长白猪和10头大白猪经产母猪的产仔数,又可得到两个样本资料。

由于抽样误差的随机性,两样本平均数就不一定是11头和9.2头,其差值也不一定是1.8头。

造成这种差异可能有两种原因,一是品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验误差(或抽样误差)。

对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。

如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。

两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。

这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。

因此,不得不采用另一种方法,即研究样本,通过样本研究其所代表的总体。

例如,设长白猪经产母猪产仔数的总体平均数为,大白猪经产母猪产仔数的总体平均数为,试验研究的目的,就是要给、是否相同做出推断。

由于总体平均数、未知,在进行显著性检验时只能以样本平均数、作为检验对象,更确切地说,是以(-)作为检验对象。

为什么以样本平均数作为检验对象呢?这是因为样本平均数具有下述特征:1、离均差的平方和∑(-)2最小。

说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。

2、样本平均数是总体平均数的无偏估计值,即E()=μ。

3、根据统计学中心极限定理,样本平均数服从或逼近正态分布。

所以,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。

由上所述,一方面我们有依据由样本平均数和的差异来推断总体平均数、相同与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于试验误差(或抽样误差)的不可避免性。

若对样本观测值的数据结构作一简单剖析,就可更清楚地看到这一点。

通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。

所以观测值由两部分组成,即= +。

总体平均数反映了总体特征,表示误差。

若样本含量为,则可得到个观测值:,,,。

于是样本平均数===+。

说明样本平均数并非总体平均数,它还包含试验误差的成分。

对于接受不同处理的两个样本来说,则有:=+,=+。

这说明两个样本平均数之差(-)也包括了两部分:一部分是两个总体平均数的差(-),叫做试验的处理效应(treatmenteffect);另一部分是试验误差(-)。

也就是说样本平均数的差(-)包含有试验误差,它只是试验的表面效应。

因此,仅凭(-)就对总体平均数、是否相同下结论是不可靠的。

只有通过显著性检验才能从(-)中提取结论。

对(-)进行显著性检验就是要分析:试验的表面效应(-)主要由处理效应(-)引起的,还是主要由试验误差所造成。

虽然处理效应(-)未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。

所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。

为了通过样本对其所在的总体作出符合实际的推断,要求合理进行试验设计,准确地进行试验与观察记载,尽量降低试验误差,避免系统误差,使样本尽可能代表总体。

只有从正确、完整而又足够的资料中才能获得可靠的结论。

若资料中包含有较大的试验误差与系统误差,有许多遗漏、缺失甚至错误,再好的统计方法也无济于事。

因此,收集到正确、完整而又足够的资料是通过显著性检验获得可靠结论的基本前提。

二、显著性检验的基本步骤仍以前面所举实例说明显著性检验的基本步骤。

(一)首先对试验样本所在的总体作假设这里假设=或-=0,即假设长白猪和大白猪两品种经产母猪产仔数的总体平均数相等,其意义是试验的表面效应:-=1.8头是试验误差,处理无效,这种假设称为无效假设(nullhypothesis),记作:=或-=0。

无效假设是被检验的假设,通过检验可能被接受,也可能被否定。

提出:=或-=0的同时,相应地提出一对应假设,称为备择假设(alternativehypothesis),记作。

备择假设是在无效假设被否定时准备接受的假设。

本例的备择假设是:≠或-≠0,即假设长白猪与大白猪两品种经产母猪产仔数的总体平均数与不相等或与之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。

(二)在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率对于上述例子,研究在无效假设:=成立的前提下,统计量(-)的抽样分布。

经统计学研究,得到一个统计量t:其中=叫做均数差异标准误;、为两样本的含量。

所得的统计量t服从自由度df=(-1)+(-1)的分布。

根据两个样本的数据,计算得:-=11-9.2=1.8;===0.742==2.426我们需进一步估计出|t|≥2.426的两尾概率,即估计P(|t|≥2.426)是多少?查附表3,在df=(-1)+(-1)=(10-1)+(10-1)=18时,两尾概率为0.05的临界值:=2.101,两尾概率为0.01的临界t值:=2.878,即:P(|t|>2.101)=P(t>2.101)+P(t<-2.101)=0.05P(|t|>2.878)=P(t>2.878)+P(t<-2.878)=0.01由于根据两样本数据计算所得的t值为2.426,介于两个临界t值之间,即:t0.05<2.426<t0.01所以,|t|≥2.426的概率P介于0.01和0.05之间,即:0.01<P<0.05。

如图5-1所示,说明无效假设成立的可能性,即试验的表面效应为试验误差的可能性在0.01─0.05之间。

(三)根据“小概率事件实际不可能性原理”否定或接受无效假设上章曾论及:若随机事件的概率很小,例如小于0.05,0.01,0.001,称之为小概率事件;在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。

根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设:=,接受备择假设:≠,即认为:试验的处理效应是存在的。

当试验的表面效应是试验误差的概率大于0.05时,则说明无效假设:=成立的可能性大,不能被否定,因而也就不能接受备择假设:≠。

本例中,按所建立的:=,试验的表面效应是试验误差的概率在0.01─0.05之间,小于0.05,故有理由否定:=,从而接受:≠。

可以认为长白猪与大白猪两品种经产母猪产仔数总体平均数和不相同。

综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。

对于各种显著性检验的方法,除明确其应用条件,掌握有关统计运算方法外,正确的统计推断是不可忽视的。

三、显著水平与两种类型的错误在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。

用来确定否定或接受无效假设的概率标准叫显著水平(significancelevel),记作。

在生物学研究中常取=0.05或=0.01。

对于上述例子所用的检验方法(t检验)来说,若|t|<,则说明试验的表面效应属于试验误差的概率P>0.05,即表面效应属于试验误差的可能性大,不能否定:=,统计学上把这一检验结果表述为:“两个总体平均数与差异不显著”,在计算所得的t值的右上方标记“”或不标记符号;若≤|t|<,则说明试验的表面效应属于试验误差的概率P在0.01—0.05之间,即0.01<P0.05,表面效应属于试验误差的可能性较小,应否定:=,接受:≠,统计学上把这一检验结果表述为:“两个总体平均数与差异显著”,在计算所得的t值的右上方标记“*”;若|t|≥,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P≤0.01,表面效应属于试验误差的可能性更小,应否定:=,接受:≠,统计学上把这一检验结果表述为:“两个总体平均数与差异极显著”,在计算所得的t值的右上方标记“**”。

这里可以看到,是否否定无效假设:=,是用实际计算出的检验统计量t 的绝对值与显著水平对应的临界t值比较。

若|t|≥,则在水平上否定:=;若|t|<,则不能在水平上否定:=。

区间和称为水平上的否定域,而区间(-,)则称为水平上的接受域。

假设检验时选用的显著水平,除=0.05和0.01为常用外,也可选=0.10或=0.001等等。

到底选哪种显著水平,应根据试验的要求或试验结论的重要性而定。

如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即值取大些。

反之,如试验耗费较大,对精确度的要求较高,不容许反复,或者试验结论的应用事关重大,则所选显著水平应高些,即值应该小些。

显著水平对假设检验的结论是有直接影响的,所以它应在试验开始前即确定下来。

因为显著性检验是根据“小概率事件实际不可能性原理”来否定或接受无效假设的,所以不论是接受还是否定无效假设,都没有100%的把握。

也就是说,在检验无效假设时可能犯两类错误。

第一类错误是真实情况为成立,却否定了它,犯了“弃真”错误,也叫Ⅰ型错误(typeⅠerror)。

Ⅰ型错误,就是把非真实差异错判为真实差异,即:=为真,却接受了:≠。

第二类错误是不成立,却接受了它,犯了“纳伪”错误,也叫Ⅱ型错误(typeⅡerror)。

Ⅱ型错误,就是把真实差异错判为非真实差异,即:≠为真,却未能否定:=。

我们是基于“小概率事件实际不可能性原理”来否定,但在一次试验中小概率事件并不是绝对不会发生的。

如果我们抽得一个样本,它虽然来自与对应的抽样总体,但计算所得的统计量t却落入了否定域中,因而否定了,于是犯了Ⅰ型错误。

但犯这类错误的概率不会超过。

Ⅱ型错误发生的原因可以用图5-2来说明。

相关文档
最新文档