方差齐性检验的原理

方差齐性检验的原理
方差齐性检验的原理

统计学搜索整理汇总——方差齐性检验的原理

LXK的结论:齐性检验时F越小(p越大),就证明没有差异,就说明齐,比如F=1.27,p>0.05则齐,这与方差分析均数时F越大约好相反。

LXK注:方差(MS或s2)=离均差平方和/自由度(即离均差平方和的均数)

标准差=方差的平方根(s)

F=MS组间/MS误差=(处理因素的影响+个体差异带来的误差)/个体差异带来的误差

=================

F检验为什么要求各比较组的方差齐性?

——之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。

在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验。如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F 检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致。

简单地说就是在进行两组或多组数据进行比较时,先要使各组数据符合正态分布,另外就是要使各组数据的方差相等(齐性)。

-----------------

在SPSS中,如果进行方差齐性检验呢?命令是什么?

方差分析(Anaylsis of Variance, ANOVA)要求各组方差整齐,不过一般认为,如果各组人数相若,就算未能通过方差整齐检验,问题也不大。

One-Way ANOVA对话方块中,点击Options…(选项…)按扭,

勾Homogeneity-of-variance即可。它会产生Levene、Cochran C、Bartlett-Box F等检验值及其显著性水平P值,若P值<于0.05,便拒绝方差整齐的假设。

顺带一提,Cochran和Bartlett检定对非正态性相当敏感,

若出现「拒绝方差整齐」的检测结果,或因这原因而做成。

---------------

用spss处理完数据的显示结果中,F值,t值及其显著性(sig)都分别是解释什么的?

答案

一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。

通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝

虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。

F值和t值就是这些统计检定值,与它们相对应的概率分布,就是F分布和t分布。统计显著性(sig)就是出现目前样本这结果的机率。

至於具体要检定的内容,须看你是在做哪一个统计程序。

举一个例子,

比如,你要检验两独立样本均数差异是否能推论至总体,而行的t检验。

两样本(如某班男生和女生)某变量(如身高)的均数并不相同,

但这差别是否能推论至总体,代表总体的情况也是存在著差异呢?

会不会总体中男女生根本没有差别,只不过是你那麼巧抽到这2样本的数值不同?

为此,我们进行t检定,算出一个t检定值,

与统计学家建立的以「总体中没差别」作基础的随机变量t分布进行比较,

看看在多少%的机会(亦即显著性sig值)下会得到目前的结果。

若显著性sig值很少,比如<0.05(少於5%机率),

亦即是说,「如果」总体「真的」没有差别,那麼就

只有在机会很少(5%)、很罕有的情况下,才会出现目前这样本的情况。

虽然还是有5%机会出错,但我们还是可以「比较有信心」的说:

目前样本中这情况(男女生出现差异的情况)不是巧合,是具统计学意义的,

「总体中男女生不存差异」的虚无假设应予拒绝,简言之,总体应该存在著差异。

每一种统计方法的检定的内容都不相同,

同样是t-检定,可能是上述的检定总体中是否存在差异,

也同能是检定总体中的单一值是否等於0或者等於某一个数值。

至於F-检定,方差分析(或译变异数分析,Analysis of Variance),

它的原理大致也是上面说的,但它是透过检视变量的方差而进行的。

它主要用于:均数差别的显著性检验、分离各有关因素并估计其对总变异的作用、分析因素间的交互作用、方差齐性(Equality of Variances)检验等情况。

----------

方差齐性检验在什么情况下进行?为什么要进行方差齐性检验?

如果需要进行方差分析,就要进行方差齐性检验,即若组间方差不齐则不适用方差分析。但可通过对数变换、平方根变换、倒数变换、平方根反正弦变换等方法变换后再进行方差齐性检验,若还不行只能进行非参数检验.

除了对两个研究总体的总体平均数的差异进行显著性检验以外,我们还需要对两个独立样本所属总体的总体方差的差异进行显著性检验,统计学上称为方差齐性(相等)检验。

方差齐性实际上是指要比较的两组数据的分布是否一致,通俗的来说就是两者是否适合比较

为什么要做方差齐性和正态检验?

在做方差分析时,为什么要做方差齐性和正态检验?目的是什么?

主要是确认数据的合理性(不具备相关性)而已。

正态分布以及近似正态分布是应用该分析的基本条件……

构造的统计量需要样本有正态等方差的条件,

或者说是这样的条件情况下的一种判断,

失去了这个前提,后期的判断分析都是空中楼阁。

就像讨论如何成为一个好男人,那么前提他必须是一个男人

而且方差齐性检验的Bartlett方法也是以正太分布为前提的,

其所构造的卡方统计量必须满足样本为正态分布。

-----------------

F检验与方差齐性检验

在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验。如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F 检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致。

但是,方差齐性检验也可以在F检验结果为多个样本所属总体平均数差异显著的情况下进行,因为F检验之后,如果多个样本所属总体平均数差异不显著,就不必再进行方差齐性检验。

----------------

Levene方差齐性检验也称为Levene检验(Levene's Test).由H.Levene在1960年提出[1].M.B.Brown和A.B.Forsythe在1974年对Levene检验进行了扩展[2],使对原始数据的数据转换不但可以使用数据与算术平均数的绝对差,也可以使用数据与中位数和调整均数(trimmed mean)的绝对差.这就使得Levene检验的用途更加广泛.Levene检验主要用于检验两个或两个以上样本间的方差是否齐性.要求样本为随机样本且相互独立.国内常见的Bartlett多样本方差齐性检验主要用于正态分布的资料,对于非正态分布的数据,检验效果不理想.Levene检验既可以用于正态分布的资料,也可以用于非正态分布的资料或分布不明的资料,其检验效果比较理想.

----------------------------

方差分析的条件之一为方差齐,即各总体方差相等。因此在方差分析之前,应首先检验各样本的方差是否具有齐性。常用方差齐性检验(test for homogeneity of variance)推断各总体方差是否相等。本节将介绍多个样本的方差齐性检验,本法由Bartlett于1937年提出,称Bartlett法。该检验方法所计算的统计量服从分布。

用自由度查界值表,若值大于等于界值,则P值小于等于相应的概率,反之,P值大于相应的概率。如果未经校正的值小于界值,则校正后的值更小,可不必再计算校正值。

……

例5.7对照组、A降脂药组、B降脂药组和C降脂药组家兔的血清胆固醇含量(mmol/L)的均数分别为5.845、2.853、2.972和1.768,方差分别为5.941、2.370、0.517和0.581,样本含量分别为6、6、6和7,问四样本的方差是否齐同?

……

本例自由度为,查界值表,得0.025>P>0.01,按=0.05水准拒绝H0,接受H1,可以认为

四总体方差不同或不全相同。

两个独立样本的方差齐性检验

例:某市初中毕业班进行了一次数学考试,为了比较该市毕业班男女生成绩的离散程度,从男生中抽出一个样本,容量为31,从女考生中也抽出一个样本,容量为21.男女生成绩的方差分别为49和36,请问男女生成绩的离散程度是否一致

解:1.提出假设

2.选择检验统计量并计算其值

3.统计决断查附表3,

得F(19,19)0.05=2.04

F=1.340.05,即男女生成绩的差异没有达到显著性差异.

两个相关样本的方差齐性检验

例子:教科书164页.

综合应用

例1:某省在高考后,为了分析男,女考生对语文学习上的差异,随机抽取了各20名男,女考生的语文成绩,并且计算得到男生平均成绩=54.6,标准差=16.9,女生的平均成绩=59.7,标准差=10.4,试分析男,女考生语文高考成绩是否有显著差异

解:先进行方差齐性检验: 1.提出假设

2.计算检验的统计量

3.统计决断查附表3,

得F(19,19)0.05=2.16

F=2.64>F(19,19)0.05=2.16,p<0.05,即方差不齐性.

然后,进行平均数差异的显著性检验:

1.提出假设

2.计算检验的统计量

3.确定检验形式

双侧检验

4.统计决断

1.120.05

所以,要保留零假设,即男,女考生语文高考成绩无显著差异.

例2:为了对某门课的教学方法进行改革,某大学对各方面情况相似的两个班进行教改实验,甲班32人,采用教师面授的教学方法,乙班25人,采用教师讲授要点,学生讨论的方法.一学期后,用统一试卷对两个班学生进行测验,得到以下结果:甲班平均成绩=80.3,标准差=11.9,乙班平均成绩=86.7,标准差=10.2,试问两种教学方法的效果是否有显著性差异解:先进行方差齐性检验:

1.提出假设

2.计算检验的统计量

3.统计决断查附表3,

得F(31,24)0.05=1.94

F=1.350.05,即方差齐性.

然后,进行平均数差异的显著性检验:

1.提出假设

2.计算检验的统计量

3.确定检验形式

双侧检验

4.统计决断

当df=55时,

t=2.105>2.009,P<0.05

所以,要在0.05的显著性水平上零假设,即两种教学方法的效果有显著性差异.

----------------------------------

哪位高手能帮我解释一下方差和SPSS?

问题补充:先对数据进行方差齐次性检验,必要时,对数据进行反正弦平方根转换。根据实验的要求分别进行单因素、双因素和三因素方差分析 (ANOVA)。在满足方差齐性的情况下,采用Tukey检验进行多重比较;方差非齐的情况下,采用Dunnett’s T3检验进行多重比较,确定哪些处理间的差异达到显著水平。

方差是用来比较两组数据的整齐程度,例如,两人打靶,各有一组成绩,且平均分相同,那么谁的成绩好呢?

用方差比较一下,数值小的成绩稳定。

其实在excel中的分析工具里,也可以进行方差和t校验的分析。

----------------

问题:我用spss做出的结果如下:

1.在Levene's Test for Equality of Variances一栏中 F值为

2.36, Sig.为.128是不是就应该看第一排的数据?是不是说明没有显著差异呢?

2.在t-test for Equality of Means中的Sig. (2-tailed)里,两排都是.000 第一排的其它数据为:t=8.892,df=84,Mean Difference=22.99

3.到底看哪个Levene's Test for Equality of Variances一栏中sig,还是看t-test for Equality of Means中那个Sig. (2-tailed)啊?我得出的这个结果倒底是显著不显著呢?

4.还有最后一个问题,我做的是T检验为什么会有F值呢?

最佳答案

t检验过程,是对两样本均数(mean)差别的显著性进行检验。惟t检验须知道两个总体的方差(Variances)是否相等;t检验值的计算会因方差是否相等而有所不同。也就是说,t 检验须视乎方差齐性(Equality of Variances)结果。所以,SPSS在进行t-test for Equality of Means的同时,也要做Levene's Test for Equality of Variances 。

1.

在Levene's Test for Equality of Variances一栏中 F值为2.36, Sig.为.128,表示方差齐性检验「没有显著差异」,即两方差齐(Equal Variances),故下面t检验的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结果。

2.

在t-test for Equality of Means中,第一排(Variances=Equal)的情况:t=8.892, df=84, 2-Tail Sig=.000, Mean Difference=22.99

既然Sig=.000,亦即,两样本均数差别有显著性意义!

3.

到底看哪个Levene's Test for Equality of Variances一栏中sig,还是看t-test for Equality of Means中那个Sig. (2-tailed)啊?

答案是:两个都要看。

先看Levene's Test for Equality of Variances,如果方差齐性检验「没有显著差异」,即两方差齐(Equal Variances),故接著的t检验的结果表中要看第一排的数据,亦即方差齐的情况下的t检验的结果。

反之,如果方差齐性检验「有显著差异」,即两方差不齐(Unequal Variances),故接著的t检验的结果表中要看第二排的数据,亦即方差不齐的情况下的t检验的结果。

4.

你做的是T检验,为什么会有F值呢?

就是因为要评估两个总体的方差(Variances)是否相等,要做Levene's Test for Equality of Variances,要检验方差,故所以就有F值。

--------------------------

1. 方差分析的概念

方差分析(ANOVA)又称变异数分析或F检验,其目的是推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。我们要学习的主要内容包括单因素方差分析即完全随机设计或成组设计的方差分析和两因素方差分析即配伍组设计的方差分析。

2. 方差分析的基本思想

下面我们用一个简单的例子来说明方差分析的基本思想:

如某克山病区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下,

患者:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11

健康人:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87

问该地克山病患者与健康人的血磷值是否不同?

从以上资料可以看出,24个患者与健康人的血磷值各不相同,如果用离均差平方和(SS)描述其围绕总均数的变异情况,则总变异有以下两个来源:

(1)组内变异,即由于随机误差的原因使得各组内部的血磷值各不相等;

(2)组间变异,即由于克山病的影响使得患者与健康人组的血磷值均数大小不等。

而且:SS总=SS组间+SS组内 v总=v组间+v组内

如果用均方MS(离均差平方和SS/自由度v,)代替离均差平方和以消除各组样本数不同的影响,则方差分析就是用组内均方去除组间均方的商(即F值)与1相比较,若F值接近1,则说明各组均数间的差异没有统计学意义,若F值远大于1,则说明各组均数间的差异有统计学意义。实际应用中检验假设成立条件下F值大于特定值的概率可通过查阅F界值表(方差分析用)获得。

3. 方差分析的应用条件

应用方差分析对资料进行统计推断之前应注意其使用条件,包括:

(1)可比性,若资料中各组均数本身不具可比性则不适用方差分析。

(2)正态性,即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。

(3)方差齐性,即若组间方差不齐则不适用方差分析。多个方差的齐性检验可用Bartlett 法,它用卡方值作为检验统计量,结果判断需查阅卡方界值表。

二、方差分析的主要内容

根据资料设计类型的不同,有以下两种方差分析的方法:

1. 对成组设计的多个样本均数比较,应采用完全随机设计的方差分析,即单因素方差分析。

2. 对随机区组设计的多个样本均数比较,应采用配伍组设计的方差分析,即两因素方差分析。

两类方差分析的基本步骤相同,只是变异的分解方式不同,对成组设计的资料,总变异分解为组内变异和组间变异(随机误差),即:SS总=SS组间+SS组内,而对配伍组设计的资料,总变异除了分解为处理组变异和随机误差外还包括配伍组变异,即:SS总=SS处理+SS 配伍+SS误差。整个方差分析的基本步骤如下:

(1)建立检验假设;

H0:多个样本总体均数相等。

H1:多个样本总体均数不相等或不全等。

检验水准为0.05。

(2)计算检验统计量F值;

(3)确定P值并作出推断结果。

三、多个样本均数的两两比较

经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。

1. 多个样本均数间两两比较

多个样本均数间两两比较常用q检验的方法,即 Newman-kueuls法,其基本步骤为:

建立检验假设-->样本均数排序-->计算q值-->查q界值表判断结果。

2. 多个实验组与一个对照组均数间两两比较

多个实验组与一个对照组均数间两两比较,若目的是减小第II类错误,最好选用最小显著差法(LSD法);若目的是减小第I类错误,最好选用新复极差法,前者查t界值表,后者查q’界值表

--------------------------------------------------------------------------------

egg1022请问老师,我们做作业时可以用计算机做方差齐性的检验,那考试中呢?默认为齐性吗?还需再说明吗?

medista 一般根据样本方差来判断,如果样本方差相差不大,一般不用做方差齐性检验。而如果样本方差相差比较大(比如相差3倍以上)时,则要怀疑方差不齐,需要进行总体方差齐性检验。

用SPSS做时,自动给出方差齐性检验;考试的时候,可以根据实际资料判断。

egg1022 请问老师,(1)假如S1=1 S2=3.5,我是否可以这样说:因为S2〉3S1,所以认为两样本方差不齐,故应用近似t检验。(2)两方差相差3倍是否就是通常所用的判断标准?谢谢老师:)

medista 不是这样的。

(1)我们比较的样本方差,而不是标准差。你举的例子,样本方差已经相差12倍以上了。

(2)3倍只是个例子,说明样本方差相差比较大而已(就象我们教材上所说的样本量n>60为大样本一样),只起提示作用。并没有定理说明样本方差相差3倍以上总体方差就不齐。总体方差是否齐性,还需要进行检验。切记切记

比如你举的例子,样本方差相差很大,提示总体方差不齐,要进行检验。

严格来说,方差齐不齐,都需要进行检验。

egg1022老师,(1)那假如说考试中两样本方差相差很大,提示总体方差不齐,没有计算机,怎么行检验呢?(2)假设检验中要求样本服从正态分布的,可为何例题(哪怕是小样本)不作正态分析呢?(3)在我看的一篇文献中,作者把受试对象分为4组,分别进行配对检验,为何他a取值不一致呢?有的组用0.05,有的用0.01,这样可以吗?呵呵,问题

有点多,谢谢老师!

medista (1)不要总盯着考试,老师们知道那时候没有计算机,也不能查表,不会让你为难。

(2)“假设检验中要求样本服从正态分布”?要严谨,同学!本章只讲t检验,只说t检验的条件。注意,是要求“总体”服从正态分布,这里还要注意是哪种t检验,要求哪个总体是正态的。比如配对t检验要求差值的总体服从正态分布,两样本t检验要求相应的两总体服从正态分布。

至于书上为什么不进行正态性检验,我想应该是为了编教材方便,默认总体是正态的吧,汗一个~~~~~~

(3)没见到文献不便发表意见,呵呵。至于为什么检验水准不一,如果是同一类数据,同一个指标,采用不同的检验水平,估计作者是根据P值然后才确定的alhpa,你别学他就好了。杂志中存在的统计问题太多,注意别被误导。

方差齐性检验的原理:

除了对两个研究总体的总体平均数的差异进行显著性检验以外,我们还需要对两个独立样本所属总体的总体方差的差异进行显著性检验,统计学上称为方差齐性(相等)检验。

对两个研究总体进行总体方差齐性的显著性检验,同两个总体平均数差异的显著性检验的步骤一样。首先提出两个总体方差没有差异的零假设,即,和备择假设。然后从两个研究总体中各抽取容量分别为两个样本,通过比较两个样本方差之间的差异,来推断两个总体方差之间的差异。对于两个样本方差的比较,采用的是比商的方法,因为统计学家已经证明的比值的抽样分布服从F分布,记为:

……

F分布有两个自由度,称为分子的自由度,称为分母的自由度,把称为F统计量。图5.2为F分布的曲线图。F分布的形态随F比值分子和分母中自由度的变化而形成一簇正偏态分布的曲线。

……

各种自由度组合所形成的理论F值,可以查F值表,见附表4。表的最上端横行表示F比值中分子的自由度,最左端纵列表示分母的自由度,附表3(1)、3(2)表示α=0.05的显著性水平的F临界值,附表3(3)、3(4)表示α=0.01的显著性水平的F临界值。

F值表只列有右侧临界值,所以在计算F统计量的值时,必须将样本方差较大的一个作分子,较小的一个作分母,使得F≧1,(LXK查书后注:表上有:分子v1是较大均方的自由度,分母v2是较小均方的自由度)以便可以同F值表中的临界值进行比较并作出决断:如果通过计算得到的F值大于临界值,就拒绝零假设;如果通过计算得到的F值小于临界值,就接受零假设。

在进行One Way ANOVA时若出现方差齐性不满足时,一般来说可以进行数据变换后再进行方差分析。在SPSS中进行方差分析时,Tamhane's T2 等方法不用假定方差相等(Equal Variances Not Assumed),可以用。其实这种情况下选非参数方法可能更好一些。至于删除一些数据,在统计学中有一些剔除异常值的方法可用,但正如楚鱼所说“那些零值显然不是异常值——明显偏离变量范围的值,是没有理由删除的”。可行的选择也许是仔细分析你的数据,找到引起不齐的原因(这一点你已找到了)及其生态学的意义。分析之后也许会发现,可能有更好的方法可以解决问题。统计分析的目的是为了解决问题或发现问题,而不是一定

要用某个方法分析数据

--------------------------------------------------------------------------------

单因素方差分析中,方差不齐,是不是就得用非参数检验?怎么做事后比较呢?

方差不齐只能说明差异不一定是由自变量造成的,因为方差分析的假设是变源都来自所有自变量,然后再细分哪1个影响较大而已,既然不符合此前提,你应该查看样本是否太小、无关变量是否控制好了,其实齐不齐自己知道行了,只是检验力度不太够,不用告诉别人,至于非参数检验总体是否正态分布、样本容量多大等都无需考虑!至于用哪种自己决定!

-----------------------

以前上统计课时,老师曾讲过,方差分析的前题之一是各组间的方差相等。但是我发现在的SPSS统计学软件上one-way ANOVA方差分析项的post Hoc test分别有二选项: 1.假设方差齐时有一系列的分析方法可选。2.假设方差不齐时又有一系列的分析方法可选。

因此我就疑惑了:是否方差不齐的多样本均数比较也能用SPSS进行one-way ANOVA方差分析??如果可以的话,这不就与经典的统计学书上相矛盾了吗?

答案:

方法一,把means±SD范围外的数据剔除。

方法二,把数据进行转换后进行多重比较,如转为log10。选择适当的转换形式,直到齐性检验变为不显著。

实际操作中对方差齐性等适用条件的把握:

1.单因素方差分析:根据BOX的研究结果,在单因素方差分析中,如果各组的例数相同(即均衡),或总体呈正态分布,则方差分析模型对方差略微不齐有一定的耐受力,只要最大与最小方差之比小于3,分析结果都是稳定的

2.单元格内无重复数据的方差分析分析:以配伍设计的方差分析最为典型,此时不需要考虑正态性和方差齐性问题,原因在于正态性和方差齐性的考察是以单元格为基本单位的,此时每个格子中只有一个元素,当然没法分析了.除配伍设计的方差分析外,交叉设计,正交设计等也可以出现无重复数据的情况.但必须指出,这里只是因条件不足,无法考察适用条件,而不是说可以完全忽视这两个问题.如果根据专业知识认为可能在不同单元格内正态性,方差齐性有问题,则应当避免使用这种无重复数据的设计方案.

3.有重复数据的多因素方差分析:由于正态性,方差齐性的考察以单元格为基本单位,此时单元格数目往往很多,平均每个单元格内的样本粒数实际上比较少。此时实际上很难检验出差别;另一方面,也可能只是因为极个别单元格方差不齐而单质检验不能通过。根据实际经验,实际在多因素方差分析中,极端值的影响远远大于方差齐性等问题的影响,因此实际分析中可以直接考察因变量的分布情况,如果数据分布不是明显偏态,不存在极端值,而一般而言方差齐性和正态齐性不会有太大问题,而且也可以基本保证单元格内无极端值.因此在多因素方差分析中,方差齐性往往只限于理论讨论,但对于较重要的研究,则建模后的残差分析是非常重要的

在EXCEL中实现多总体方差的Bartlett齐性检验

在EXCEL中实现多总体方差的Bartlet t齐性检验 在体育教学和运动训练等的科学实验中,对影响体育教学成绩及运动竞赛的成绩的原因的探究,一直是当代体育科研中研究的主线。例如,在运动训练中,为更加有效地提高运动成绩,通常需要考察不同的运动强度、不同的运动量和不同的运动持续时间等因素对不同的专项运动成绩的影响,目的是为了找出适合不同专项的运动强度、运动量、运动持续时间的较佳组合。又如,我们从运动系体操专业的学生中随机抽取条件相似的20 名学生随机分成4组,每组5人,由 4 位教师施以不同的教学方法,教20 个具有相当难度的体操动作,并规定每个动作的计分标准,试教一学期后举行测试,测得各组得分,见下表。现假定每组的得分服从正态分布,则这 4 种教学方法的效果间是否有显著性差异的问题就是我们迫切需要了解的。 如果仅仅从上例每组的总分上看,显然四种不同的教法带来了四种不同的学生得分,分值上肯定有差异,但这种差异主要是由随机误差引起的,还是主要是由于教学方法的不同而引起的,即是否有显著性差异的统计结论,还须经统计检验后才能得出。若用两个样本间均数差异的显著性检验方法来处理本类问题的话,需要做6次检验。若这样的试验安排共有N组,则需要做N (N-1)/2 次两两比较,这一方面,显然太麻烦了,另一方面,

当设定两两比较时,犯第一类错误的概率 a =0.05,则N个独立 样本两两比较时,每次比较不犯第一类错误的概率为0.95N(N-1) /2,相应犯第一类错误的概率为1-0.95N(N-1) /2,远远大于 事先设定的0.05。因此,多个均数比较时不宜采用我们熟知的t 检验作两两比较,应采用一种新的统计处理方法来实现。 解决这一类问题的方法是方差分析。它最早由英国统计学家费舍( R.A.Fisher )在1923 年提出,最初用于生物学和农业试验方面,后于1946年由斯内德克(G.W.Snedecor)进一步加以完善。为纪念费舍的杰出贡献,又把它称为 F 检验。现在它在体育领域中也得到了广泛的应用。 方差分析是在总体服从正态分布且方差齐性的假设下展开的,在满足总体正态性但方差不齐时,此法不可用,而只能改用方差不齐时两均数差异的显著性检验的方法来进行两两均数间的比较。因此,这里很有必要来考虑方差的齐性检验的问题。本文主要介绍在EXCEL中如何来实现多总体方差的Bartlett 齐性检验的自动计算。 1 Bartlett 方差齐性检验的方法 Bartlett 法是一种可在各水平重复测定次数不等时用来检验方差齐性的方法,虽然,当各水平重复测定次数相等时,可用Cochran 提供的检验方法,但Bartlett 法同样适用。 2在EXCEL中进行Bartlett 方差齐性检验的方法 2.1工作表的安排 在用Bartlett 法进行方差齐性检验时,为使计算相对自动化,

方差齐性检验的原理

统计学搜索整理汇总——方差齐性检验的原理 LXK的结论:齐性检验时F越小(p越大),就证明没有差异,就说明齐,比如F=1.27,p>0.05则齐,这与方差分析均数时F越大约好相反。 LXK注:方差(MS或s2)=离均差平方和/自由度(即离均差平方和的均数) 标准差=方差的平方根(s) F=MS组间/MS误差=(处理因素的影响+个体差异带来的误差)/个体差异带来的误差 ================= F检验为什么要求各比较组的方差齐性? ——之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。 在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验。如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F 检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致。 简单地说就是在进行两组或多组数据进行比较时,先要使各组数据符合正态分布,另外就是要使各组数据的方差相等(齐性)。 ----------------- 在SPSS中,如果进行方差齐性检验呢?命令是什么? 方差分析(Anaylsis of Variance, ANOVA)要求各组方差整齐,不过一般认为,如果各组人数相若,就算未能通过方差整齐检验,问题也不大。 One-Way ANOVA对话方块中,点击Options…(选项…)按扭, 勾Homogeneity-of-variance即可。它会产生Levene、Cochran C、Bartlett-Box F等检验值及其显著性水平P值,若P值<于0.05,便拒绝方差整齐的假设。 顺带一提,Cochran和Bartlett检定对非正态性相当敏感, 若出现「拒绝方差整齐」的检测结果,或因这原因而做成。 --------------- 用spss处理完数据的显示结果中,F值,t值及其显著性(sig)都分别是解释什么的? 答案 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝

方差齐性检验

一、方差齐性检验 1、 data abc; do a=1 to 4; do i=1 to 4; Input x @@; Output; end; end; t=_n_; /*自动生成序号变量t*/ cards; 19 23 21 13 21 24 27 20 20 18 19 15 22 25 27 22 ; Proc gplot data=a; /*绘图—按文件a作散点图*/ Plot x*t; /*纵坐标为x,横坐标为t*/ proc print a; proc anova; class a; model x=a; means a/hovtest; run; 2、 data d0; Input x @@; t=_n_; cards; 58 86 92 95 93 97 90 72 67 39 51 63 77 57 57 59 45 45 80 38 36 39 85 94 ; proc print; var t x; proc gplot data=d0; plot x*t; symbol c=red i=join v=star; run; data d1; do a=1 to 4; do i=1 to 6; Input y @@; output; end; end; cards; 58 86 92 95 93 97 90 72 67 39 51 63 77 57 57 59 45 45 80 38 36 39 85 94 ; proc anova; class a; model y=a; means a/hovtest; proc print; var a y; run; data d0; Input y @@; t=_n_; do a=1 to 4; do i=1 to 6; Input x @@; output; end; end; cards; 58 86 92 95 93 97 90 72 67 39 51 63 77 57 57 59 45 45 80 38 36 39 85 94 ; proc print; var t x; proc gplot data=d0; plot x*t; symbol c=red i=join v=star; run; proc anova; class a; model x=a; means a/hovtest; run;

方差齐性检验

LXK的结论:齐性检验时F越小(p越大),就证明没有差异,就说明齐,比如F=1.27,p>0.05则齐,这与方差分析均数时F越大约好相反。 LXK注:方差(MS或s2)=离均差平方和/自由度(即离均差平方和的均数) 标准差=方差的平方根(s) F=MS组间/MS误差=(处理因素的影响+个体差异带来的误差)/个体差异带来的误差================= F检验为什么要求各比较组的方差齐性? ——之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t分布作为其理论依据的检验方法。 在方差分析的F检验中,是以各个实验组内总体方差齐性为前提的,因此,按理应该在方差分析之前,要对各个实验组内的总体方差先进行齐性检验。如果各个实验组内总体方差为齐性,而且经过F检验所得多个样本所属总体平均数差异显著,这时才可以将多个样本所属总体平均数的差异归因于各种实验处理的不同所致;如果各个总体方差不齐,那么经过F检验所得多个样本所属总体平均数差异显著的结果,可能有一部分归因于各个实验组内总体方差不同所致。 简单地说就是在进行两组或多组数据进行比较时,先要使各组数据符合正态分布,另外就是要使各组数据的方差相等(齐性)。 ----------------- 在SPSS中,如果进行方差齐性检验呢?命令是什么? 方差分析(Anaylsis of Variance, ANOVA)要求各组方差整齐,不过一般认为,如果各组人数相若,就算未能通过方差整齐检验,问题也不大。 One-Way ANOVA对话方块中,点击Options…(选项…)按扭, 勾Homogeneity-of-variance即可。它会产生 Levene、Cochran C、Bartlett-Box F等检验值及其显著性水平P值, 若P值<于0.05,便拒绝方差整齐的假设。 顺带一提,Cochran和Bartlett检定对非正态性相当敏感, 若出现「拒绝方差整齐」的检测结果,或因这原因而做成。 --------------- 用spss处理完数据的显示结果中,F值,t值及其显著性(sig)都分别是解释什么的? 答案 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定。 通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那我

为何需要正态分布和方差齐性的检验

为何需要正态分布和方差齐性的检验? 很多时候,我们都需要使用从单一样本中获取的样本信息利用统计推断的方法来估计总体的参数信息,这是一种非常有用的统计方法,但在执行相关推断之前,我们需要验证一些假定,任何一条假定若是不能满足,则得到的统计结论就是无效的。 通常数据的分析假设为:随机数据,独立的,正态分布,等方差,稳定,当然,测量系统的精确性和准确性也是要满足测量要求的。 什么是正态分布假定? 在再进行统计分析之前,需要识别出数据的分布,否则,错误的统计检验将带来一定的风险,许多统计方法在执行之前嘉定数据服从正态分布,比如,单/双样本-T检验,过程能力分析,I-MR和方差分析等。如果数据不满足正态分布,则需要使用非参数方法,利用中位数进行检验而不是均值,也可以使用BOX-COX转换或JOHNSON变换的方法把数据转换为正态分布。 但是需要知道许多统计工具虽然假定数据满足正态但实际上当样本量大于15或20的时候就不需要正态分布了,但是如果样本量小于15且数据不满足正态分布,P值得数据就是错误的,相关统计结论就需要特别注意了。 在Minitab中,有许多方法可以判断数据的分布是否满足正态,下面我们来了解两种比较常用的方法:正态检验和图形化汇总 Minitab的正态检验将生成概率图和执行单样本假设检验来判断数据的分布是否来自满足正态的分布总体,原假设是数据满足正态分布而备择假设是不满足 选择统计—基本统计量—正态检验 下面我们先看看数据的正态检验

图形中的数据点应该在直线的附近,如果有些数据点在尾巴上远离直线也可以接受,但前提条件是必须在置信区间内才可以。 图形中的数据点应该靠近你和分布直线且通过“粗笔检验”,用一只“粗笔”盖在拟合直线上,如果铅笔能盖住所有数据点,则数据满足正态分布 与之相连的Anderson-Darling检验统计量应该很小 P值应该大于选择的Alpha风险(通常取或) Anderson-Darling统计量用来衡量数据点远离拟合直线的程度,是每个数据点到直线距离的平方和,对于一组给定的数据分布来说,分布拟合的越好,该值就会越小。 Minitab描述性统计输出通过图形化汇总直观的展示数据分布和计算了Anderson-Darling数值和P 值,图形化汇总输出四张图形:带有正态拟合线的直方图,箱线图,均值和中位数的95%置信区间图。 接下来分析图形化汇总中的正态检验: 数据通过直方图展示出来,查看图形的分布行形状(对称还是有偏度),数据在图形中是如何延伸的,且需要查看是否存在异常数据 与之相关的Anderson-Darling统计量数值应该很小 P值应该大于选择的Alpha风险(通常取或) 对于一些流程来说,比如时间和循环周期的数据,数据永远不会满足正态分布的,不满足正态分布的数据对于一些统计方法是适用的,但需要明确数据需要满足一些特殊需求。 什么是等方差假定? 通常,方差是指数据的分布离散程度,统计分析中,比如方差分析(ANOVA)中,嘉定虽然不同的样本数据来自不同均值的抽样总体,它们应该有相同的方差,方差齐性是指不同样本的方差大体相同,如果方差非齐性会影响第一类风险且导致错误的结论,如果比较两个或两个以上样本均值,比如双样本T检验和ANOVA中,如果方差显著有差异将会掩盖掉均值的差异信息并导致错误的结论。 Minitab提供了几种可以执行等方差检验的方法,可以参考Minitab的帮助来决定基于不同的数据类型该选择哪种方法,当然,也可以通过使用Minitab协助来验证该假定(技巧:当使用协助,点

方差齐性检验

但是,方差齐性检验也可以在F检验结果为多个样本所属总体平均数差异显著的情况下进行,因为F检验之后,如果多个样本所属总体平均数差异不显著,就不必再进行方差齐性检验。 ---------------- Levene方差齐性检验也称为Levene检验(Levene's Test).由H.Levene在1960年提出[1].M.B.Brown和A.B.Forsythe在1974年对Levene检验进行了扩展[2],使对原始数据的数据转换不但可以使用数据与算术平均数的绝对差,也可以使用数据与中位数和调整均数(trimmed mean)的绝对差.这就使得Levene检验的用途更加广泛.Levene检验主要用于检验两个或两个以上样本间的方差是否齐性.要求样本为随机样本且相互独立.国内常见的Bartlett多样本方差齐性检验主要用于正态分布的资料,对于非正态分布的数据,检验效果不理想.Levene检验既可以用于正态分布的资料,也可以用于非正态分布的资料或分布不明的资料,其检验效果比较理想. ---------------------------- 方差分析的条件之一为方差齐,即各总体方差相等。因此在方差分析之前,应首先检验各样本的方差是否具有齐性。常用方差齐性检验(test for homogeneity of variance)推断各总体方差是否相等。本节将介绍多个样本的方差齐性检验,本法由Bartlett于1937年提出,称Bartlett法。该检验方法所计算的统计量服从分布。 用自由度查界值表,若值大于等于界值,则P值小于等于相应的概率,反之,P值大于相应的概率。如果未经校正的值小于界值,则校正后的值更小,可不必再计算校正值。 …… 例5.7对照组、A降脂药组、B降脂药组和C降脂药组家兔的血清胆固醇含量(mmol/L)的均数分别为5.845、2.853、2.972和1.768,方差分别为5.941、2.370、0.517和0.581,样本含量分别为6、6、6和7,问四样本的方差是否齐同? …… 本例自由度为,查界值表,得0.025>P>0.01,按=0.05水准拒绝H0,接受H1,可以认为四总体方差不同或不全相同。 两个独立样本的方差齐性检验 例:某市初中毕业班进行了一次数学考试,为了比较该市毕业班男女生成绩的离散程度,从男生中抽出一个样本,容量为31,从女考生中也抽出一个样本,容量为21.男女生成绩的方差分别为49和36,请问男女生成绩的离散程度是否一致 解:1.提出假设 2.选择检验统计量并计算其值 3.统计决断查附表3, 得F(19,19)0.05=2.04 F=1.340.05,即男女生成绩的差异没有达到显著性差异. 两个相关样本的方差齐性检验 例子:教科书164页. 综合应用 例1:某省在高考后,为了分析男,女考生对语文学习上的差异,随机抽取了各20名男,女考生的语文成绩,并且计算得到男生平均成绩=54.6,标准差=16.9,女生的平均成绩=59.7,标准差=10.4,试分析男,女考生语文高考成绩是否有显著差异

t检验和方差分析的前提条件及应用误区

t检验和方差分析的前提条件及应用误区 用于比较均值的t检验可以分成三类,第一类是针对单组设计定量资料的;第二类是针对配对设计定量资料的;第三类则是针对成组设计定量资料的。后两种设计类型的区别在于事先是否将两组研究对象按照某一个或几个方面的特征相似配成对子。无论哪种类型的t检验,都必须在满足特定的前提条件下应用才是合理的。 若是单组设计,必须给出一个标准值或总体均值,同时,提供一组定量的观测结果,应用t检验的前提条件就是该组资料必须服从正态分布;若是配对设计,每对数据的差值必须服从正态分布;若是成组设计,个体之间相互独立,两组资料均取自正态分布的总体,并满足方差齐性。之所以需要这些前提条件,是因为必须在这样的前提下所计算出的t统计量才服从t分布,而t检验正是以t 分布作为其理论依据的检验方法。 值得注意的是,方差分析与成组设计t检验的前提条件是相同的,即正态性和方差齐性。 t检验是目前医学研究中使用频率最高,医学论文中最常见到的处理定量资料的假设检验方法。t检验得到如此广泛的应用,究其原因,不外乎以下几点:现有的医学期刊多在统计学方面作出了要求,研究结论需要统计学支持;传统的医学统计教学都把t检验作为假设检验的入门方法进行介绍,使之成为广大医学研究人员最熟悉的方法;t检验方法简单,其结果便于解释。简单、熟悉加上外界的要求,促成了t检验的流行。但是,由于某些人对该方法理解得不全面,导致在应用过程中出现不少问题,有些甚至是非常严重的错误,直接影响到结论的可靠性。将这些问题归类,可大致概括为以下两种情况:不考虑t检验的应用前提,对两组的比较一律用t检验;将各种实验设计类型一律视为多个单因素两水平设计,多次用t检验进行均值之间的两两比较。以上两种情况,均不同程度地增加了得出错误结论的风险。而且,在实验因素的个数大于等于2时,无法研究实验因素之间的交互作用的大小。 医学论文中常见的统计方法误用 一、等级资料用卡方检验代替秩和检验

方差齐性检验-EmpowerStats

方差齐性检验 比较两组或多组样本方差是否相同。检验方法有三种:(1)传统的 Levene 检验,该检验使用各组均数;(2)稳健 Brown-Forsythe Levene 类型检验,该检验使用各组的中位数;(3)稳健 Levene 类型检验,该检验使用修剪后的各组中位数。 方差齐性检验是假设各组的总体方差相同,如果检验结果,p值很小(如<0.05)拒绝H0,接受H1,认为各组总体方差不等(不齐)。 方差趋势检验 当分组变量是有序变量(如文化程度分低、中、高),比较两组或多组样本方差是否随分组变量变化呈线性变化趋势。检验方法有三种:(1)传统的 Levene 检验,该检验使用各组均数;(2)稳健 Brown-Forsythe Levene 类型检验,该检验使用各组的中位数;(3)稳健Levene 类型检验,该检验使用修剪后的各组中位数。 方差趋势检验是假设各组的总体方差无线性变化趋势,如果检验结果,p值很小(如 <0.05)拒绝H0,接受H1,认为各组总体方差呈线性变化趋势。 该模块在完成方差齐性检验后,自动进行方差趋势检验,如果所用的分组变量不是有序变量,忽略方差趋势检验检验结果即可。 如比较几个变量的方差是否相同,选择变量名,不输入分组变量即可。 例1,DEMO数据比较不同文化程度第一秒肺活量的方差是否齐,输入界面: 输出结果: 分组变量: EDU.NEW

modified robust Brown-Forsythe Levene-type test based on the absolute deviations from the median ltrend test based on the modified Brown-Forsythe Levene-type procedure using the group medians (two-tailed with Pearson correlation coefficient)

方差齐性检验

第五节多个样本的方差齐性检验 方差分析的条件之一为方差齐,即各总体方差相等。因此在方差分析之前,应首先检验各样本的方差是否具有齐性。常用方差齐性检验(test for homogeneity of variance)推断各总体方差是否相等。本节将介绍多个样本的方差齐性检验,本法由Bartlett于1937年提出,称Bartlett 法。该检验方法所计算的统计量服从分布。所用公式如下: (5.18) (5.19) 或,(5.20) (5.21)式中为第i组的样本含量;为第i组的样本方差;k为样本个数;C为校正数。 用自由度查界值表,若值大于等于界值,则P值小于等于相应的概率,反之,P值大于相应的概率。如果未经校正的值小于界值,则校正后的值更小,可不必再计算校正值。 例5.7对照组、A降脂药组、B降脂药组和C降脂药组家兔的血清胆固醇含量(mmol/L)的均数分别为5.845、2.853、2.972和1.768,方差分别为5.941、2.370、0.517和0.581,样本含量分别为6、6、6和7,问四样本的方差是否齐同? 1.建立检验假设和确定检验水准 H0:H1:各总体方差不同或不全相同=0.05

2.计算统计量值初步计算结果如表5.12。 表5.12四样本方差齐性检验的计算 分组 1 5.941529.705 1.781888.90939 2 2.370511.8500.86289 4.31445 30.5175 2.585-0.65971-3.29856 40.5816 3.486-0.54300-3.25803 合计—2147.626— 6.66725 =2.268 =17.19687 C=1+=1.090 =9.663 3.确定P值,作出统计推断结论。 本例自由度为,查界值表,得0.025>P>0.01,按=0.05水准拒绝H0,接受H1,可以认为四总体方差不同或不全相同。

相关主题
相关文档
最新文档