非参数检验方法

非参数检验的推断方法不涉及样本所属总体的分布形式,也不会使用均值、方差等统计量,非参数检验是通过研究样本数据的顺序和分布的性质来构成理论基础,下面介绍一些非参数检验经常使用的样本数据信息:

1.顺序:

将样本数据按照升序排列,可以得到X1≤X2≤X3≤Xi....≤Xn,其中Xi为第i个顺序量。

2.秩

将样本数据按照升序排列,可以得到X1≤X2≤X3≤Xi....≤Xn,Ri为Xi在这一列数据中的位置,称为秩,R1,R2,R3...Rn为样本数据的秩统计量

3.结

如果样本数据中存在相同的值,那么在排序时就会出现秩相同的情况,这样的情况称为结,结的取值是对应的秩的均值。注意是秩的均值而不是数据本身的均值。

非参数检验的统计理论都是根据上述概念计算而来,此外,和参数检验一样,当我们得到分析数据的时候,最先做的工作还是先通过图表和一些描述性统计量对数据整体进行探索性分析,掌握数据大致分布情况、有无极端值等,为后续正确选择分析方法打下基础。

================================================ ====

非参数检验主要应用在以下场合:

1.不满足参数检验的条件,且无适当的变换方法进行变换

2.分布类型无法获知的小样本数据

3.一端或两端存在不确定值,如>1000

4.有序分类变量求各等级之间的强度差别

更进一步来讲,非参数检验可以做以下分析:

一、单样本总体分布检验

二、两独立样本差异性检验

三、两配对样本差异性检验

四、多个独立样本差异性检验

五、多个相关样本差异性检验

可以看出,以上应用除了第一点之外,其他都有对应的参数检验方法,这就要根据样本数据的实际情况来进行选择了:适合使用参数检验的优先使用参数检验,否则使用非参数检验。

================================================ =

下面我们分别介绍一下上述应用对应的非参数检验方法

一、单样本总体分布检验

单样本总体分布检验主要用来检验某样本所在总体分布和某一理论分布是否存在显著差异,主要涉及的非参数检验方法有:

1.卡方检验

卡方检验可以检验样本数据是否符合某一期望分布或理论分布,这在卡方检验中有所介绍,在此不再多说

2.二项分布检验

二项分布检验主要用来检验样本数据是否符合某个指定的二项分布,该检验只适合二分类变量样本。

3.游程检验

无论是参数检验还是非参数检验,都需要样本是随机抽取的,因此有时我们不但关心样本数据分布如何,也同样希望考察样本数据的随机性如何,游程检验是一种非常常用的随机性检验方法。先说游程是什么概念,假设有一组二分类变量00110111000100100010,我们把连续相同的取值的记录称为一个游程,连续值个数称为游程的长度,上述二分类变量有1 1个游程,其中长度为1的游程有5个,长度为2的游程有3个,长度为3的游程有3个。根据游程检验的假设,该数据游程总数过大或过小,均不是随机序列。总数过大时,平均游程长度偏小,表示可能有某种短周期性影响数据随机性,极端例子如10101010101010;总数过小时,平均游程长度偏大,表示样本存在某种趋势或结构,有可能来自不同总体或样本值彼此不够独立,极端例子如111111100000

不只是二分类变量,任何能标有二分符号的连续变量或离散变量也可以进行游程分析。

游程检验分为游程最大程度检验和游程总数检验两种,SPSS使用的是游程总数检验方法。

4.Kolmogorov—Smirnov检验

Kolmogorov—Smirnov检验可以检验样本数据是否符合某一期望分布或理论分布,常用于探索连续性随机变量的分布形态,它是一类检验,其中的一种Kolmogorov—Smirnov Z检验我们在正态分布检验中介绍过它,此外,Kolmogorov—Smirnov Z检验还常用来检验泊松分布、均匀分布等。其基本原理是根据样本计算出累积分布函数Fn和已知的累积分布函数F0,再计算二者在相应变量上函数值的差,对这个差值进行检验,如果二者分布一致,则差值不会超过临界值。

二、两独立样本差异性检验

1.Kolmogorov—Smirnov检验

两独立样本差异性检验也可以使用K-S检验来分析二者所在总体分布有无明显差异。但是这种方法检验的是总体分布情况是否相同,而其他秩检验方法都是检验总体分布的中心位置是否相同,这里的区别要注意。

2.Mann-Whitney U检验

Mann-Whitney U检验是在秩和基础上改进而来,用来检验两个独立样本是否取自同一总体,和参数检验的两独立样本t检验相对应,只不过t检验是针对两样本取自的总体均值是否相同,而Mann-Whitney U检验是针对两样本取自的总体分布的中心位置是否相同,因此建立假设:

H0:两总体分布中心位置相同

H1:两总体分布中心位置不同

Mann-Whitney U检验的基本方法是:

将两组数据X和Y混合并升序排序,然后计算两组数据的秩和W1、W2,计算U统计量

其中n1为数据X样本量,n2为数据Y的样本量

选择U1和U2中最小者与临界值Uα比较,当U < Uα时,拒绝H0,接受H1

注:这里的临界值表为Mann-Whitney-Wilcoxon秩和分布表

在大样本情况下(n1、n2均大于30),U近似正态分布,均值和方差分别为

此时也可以进一步计算标准正态分布的统计量Z,并根据正态分布进行检验

如果两组数据存在相同的值,也就是说存在结,就会影响方差,此时需要将方差调整为

其中τj是第j个结值的个数,调整后的Z值为

其中分子加减0.5是为了对离散变量进行连续性修正,对于U-E(U)大于0减0.5,对于U -E(U)小于0加0.5

3.Wilcoxon检验

Wilcoxon检验和Mann-Whitney U检验方法没有实质上的差别,检验原理和结果也完全等价,只是Wilcoxon检验使用的是两组数据的秩和W1、W2中的较小值作为统计量,而Mann-Whitney U检验使用的是U1、U2中的较小值作为统计量,W和U只是一个线性变换的关系。

4.Wald-Wolfowitz Runs检验

Wald-Wolfowitz Runs检验是一种游程检验,原假设是两独立样本所在总体分布没有显著差异,如果两样本在集中、离散、偏度、变异等任一方面存在差异,都会拒绝原假设,具体做法和单样本总体分布中的游程检验一样,只是要先将两样本混合并升序排序为一个数据列,然后计算游程总数并进行分析,如果游程总数过大,则说明两组数据来自同一总体,反之如果过小,则两组数据的分布形态存在较大差异,有可能来自不同的总体。

和Kolmogorov—Smirnov检验一样,这种方法也是检验总体分布情况是否相同,而不是检验总体分布的中心位置是否相同。

5.Moses Extreme Reactions检验

译为Moses极端反应检验,注意:该检验结果只为单侧检验,且需要指定一个对照组,以检验样本是否存在极端反应。

建立的假设为

H0:极端值出现在两总体中的可能性均等

H1:极端值出现在两总体中的可能性不相等

如果原假设成立,那么说明各类极端值在两总体中出现的次数差不多,即两样本有较好的弥散性。否则极端值可能集中出现在某一个样本中,说明两样本有可能不是来自同一总体。

如果用它来做两独立样本差异性检验,那么原假设可以设为:两独立样本所在总体分布没有显著差异

具体实施方法为:将两组混合并升序排序,然后计算跨度(Span)=对照组最高秩-对照组最低秩+1,非整数四舍五入。如果有极端值,可以先去掉极端值之后再求跨度,称为截头跨度。如果跨度或截头跨度很小,说明两样本数据无法充分混合,可认为来自的总体分布存在差异性。

三、两配对样本差异性检验

配对样本的要求是两组样本观察数一致,并且观察值顺序不能改变,这样通过将数据混合编秩,并计算的检验方法就不能使用了,而是采用对差值来编秩并计算的方法。

1.Sign符号检验

符号检验的基本原理是:如果两个配对样本实际上没有区别,那么两样本数据相减所得的差值应该大致一半为正一半为负,数量基本平衡。由于不再假定两总体的分布形式,只关心分布是否相同,因此可以使用位置参数进行判断,例如中位数。如果两样本的总体具有相同的分布,那么中位数应该是相等的,并以此建立假设。

具体实施方式为:

将第二组的各观察值减去第一组相应的观察值,正数记为+,负数记为-,得出正号的个数S+和负号的个数S-,由上述原理得知S+和S-都应服从二项分布B(n,0.5),N=S+ + S-,S=min(s+,s-),根据N和显著性水平α,从符号检验表中查得临界值,与S进行比较,若S>临界值,则接受原假设,

也可以直接对正负符号序列进行二项分布检验,以此得出结论。

广义的符号检验是对连续变量π分位点Qπ进行的检验;而狭义的符号检验则是仅针对中位数(或0.5分位点)M=Q0.5进行的检验

符号检验只是利用数据对的差值的正负号这一信息进行分析,而没有考虑差值大小所带来的效应,因此检验效能比较低,精度也较差。

2.Wilcoxon符号秩检验

Wilcoxon符号秩检验在符号检验的基础上加入了差值秩的信息,因此检验效能比单纯的符号检验要高。

具体实施方法为:

首先和符号检验一样,将第二组的各观察值减去第一组相应的观察值,正数记为+,负数记为-,然后将差值绝对值序列按升序排序,并编秩,编秩时注意:

1.遇差值为0者,舍去不计,n相应减少

2.差值绝对值相等,取平均秩,注意是排序后秩的均值而,和实验数据本身没有关系。

接下来求出正数的秩和W+和负数的秩和W-,若两样本分布相同,W+和W-应大致相等。构造的W统计量为W=min(W+,W-),根据W和显著性α查询Wilcoxon符号秩和检验表得出P值,如果P<α,则拒绝原假设。

在大样本情况下,W统计量的抽样分布近似正态分布,可用Z值进行正态分布检验

其中n为配对值个数

3.McNemar检验

McNemar检验实际上就是配对卡方检验,我们在卡方检验中有详细介绍。该检验只适用于二分类变量,并且特别适合对于自身的对照设计。

4.Marginal Homogeneity检验

该检验是McNemar检验向多分类变量的扩展,适用于有序分类变量。

四、多个独立样本差异性检验

多样本问题主要解决如何检验几种不同的方法、决策或处理所产生的结果是否一样。

1.Kruskal-Wallis H检验

Kruskal-Wallis H检验可以看做是Wilcoxon检验的多样本推广,具体实现方法为:

将多个样本n1,n2,...,nk混合为一个样本,并按升序排序编秩,如存在相同数据,取秩的均值。然后求每个样本的秩和Ri以及平均秩Ri/ni,如果多个样本的总体分布无显著差异,那么他们的平均秩应该大致相等,否则可拒绝原假设。根据秩和及平均秩构成的检验统计量为

其中k为样本个数,nj为第j个样本的样本量,N为所有样本总的样本量,Rj为第j个样

本的秩和。

在这里,每个样本的大小可以不一样。

可以看出,当样本个数为2个时,Kruskal-Wallis H检验的H统计量就是Mann-Whitn ey U检验的U统计量,如果混合后的数据列存在结,H统计量也需要进行修正,修正的方法和Mann-Whitney U检验一样。

在大样本情况下,H统计量近似自由度为k-1的卡方分布。

2.中位数检验

也叫作Brown-Mood检验,用来检验各样本所在的总体是否具有相同的中位数,属于位置参数检验,具

体实施方法为:

将多样本混合为单样本,并按升序排序,求出中位数,如果这多个样本中位数相等,那么这些样本中大于或小于混合后中位数的样本点应该大致一样多,利用这个思想构建一个列联表,接下来就可以使用卡方检验进行分析了

3.Jonckheere-Terpstra检验

Jonckheere-Terpstra检验对连续变量和有序分类变量都适用,并且当分组变量为有序分类变量时,此方法的检验效能要高于Kruskal-Wallis H检验。

五、多个相关样本差异性检验

我们先来讲一下什么是多相关样本

假设我们从一个总体中随机抽取若干样本,让这些样本接受n种试验处理,以此检验n种试验处理之间是否存在显著差异,构造的列联表可以为如下形式

由于样本是从同一个总体中随机抽取的,因此每组样本之间是同质的且互相独立,这样的分析是多独立样本差异性检验

如果样本并非从同一个总体中抽取,而是有目的有选择性的抽取,那么每组样本之间可能存

在交互作用,彼此就不再独立,例如列联表为如下形式;

这里的样本组别变成了按照不同地区分组,地区之间有可能存在关联,这样的分析就是多相关样本差异性检验。

1.Friedman检验

是一种位置参数检验,基本思想是:由于各样本组之间有可能存在关联,那么就每组进行单独升序排序编秩(相同数据取平均秩)并求出秩和,以此构建统计量:

其中k为样本组数,N为处理个数,Rj为每组样本的秩和

当样本量较大时,统计量近似服从k-1的卡方分布,当某样本组存在结时,需要将统计量进行修正。

2.Kendall协和系数检验

该检验可以看做是Friedman检验的拓展,有时候我们需要通过分析知道某些带有一致性的结论,比如多个评判者对某些问题的评判是否一致,而Friedman检验的结果如果P>0. 5,仅能得知不认为有差异,但是这种没有差异或者说一致的程度如何,无法得知,此时就需要用到Kendall协和系数检验。

我们可以建立原假设为:这些评判者的评判标准不一致。

具体算法为:

先将每个评判者对所有被评判者的打分按升序排序并编秩,然后将每个被评判者得到的所有秩求秩和,以此得到一个S统计量

为了便于描述,将一致性程度定义在0-1之间,由此构建出W统计量,即Kendall协和系数

其Rj为某个被评判者的秩和,k为评判者个数,n为被评判者个数

此时大于等于1≥W≥0,W越大说明评判者的评价标准越一致。

在大样本情况下,还可以利用大样本的渐进性进行检验,统计量为:

大样本情况下渐近服从自由度为n-1的卡方分布,可以据此进行卡方检验。

可见,Kendall协和系数检验不仅能检验不同样本所在的总体是否具有差异,而且可以看出不同处理之间的一致性程度如何。

3.Cochran Q检验

注意这里不要和方差齐性检验的Cochran's C弄混,有时候我们得到的样本数据是二分类变量,这时候如果使用Friedman检验编秩会出现很多结,由于结太多,即使进行修正,也会影响结果精度,此时可以使用Cochran检验,该检验只适用于二分类变量。

由于二分类变量通常使用0,1表示,因此就不需要编秩,直接计算1的个数即可,如下表

构建的统计量为

大样本情况下渐近服从自由度为看k-1的卡方分布,可以据此进行卡方检验,k为处理组数==============================

秩变换分析:

以上我们介绍了在不同的应用中所涉及的一些非参数检验方法,从中可以看出,大多数非参数检验都是先将样本数据排序编秩,通过秩进一步计算各种统计量,这些都是秩变换分析的不同应用,下面简单说一下秩变换分析方法:

秩变换分析方法就是先将样本数据排序编秩,并以秩次代替原样本数据进行参数分析,在大样本情况下,该方法分析出来的结果和相应的非参数检验方法基本一致。但是秩变换分析还可以利用参数检验的方法,从而扩展了传统非参数检验的范围。

很多统计软件如SPSS都可以生成很多种类型的秩次以供选择。

===============================

介绍了非参数检验的一些方法,现在总结一下:

非参数检验的方法基本都是围绕秩统计量展开,因为秩统计量的分布和总体分布无关,可以摆脱总体分布的束缚,其中:

1.两独立样本非参数检验一般使用Mann-Whitney U检验,它是一种位置参数检验,原假设是两样本中心位置相同

2.两配对样本非参数检验一般使用Wilcoxon符号秩检验,它比单纯的符号检验更有效。

相关文档
最新文档