SAS系统和数据分析Wilcoxon秩和检验
SAS讲义 第二十八课Wilcoxon秩和检验

第二十八课 Wilcoxon 秩和检验一、 两样本的Wilcoxon 秩和检验由Mann ,Whitney 和Wilcoxon 三人共同设计的一种检验,有时也称为Wilcoxon 秩和检验,用来决定两个独立样本是否来自相同的或相等的总体。
如果这两个独立样本来自正态分布和具有相同方差时,我们可以采用t 检验比较均值。
但当这两个条件都不能确定时,我们常替换t 检验法为Wilcoxon 秩和检验。
Wilcoxon 秩和检验是基于样本数据秩和。
先将两样本看成是单一样本(混合样本)然后由小到大排列观察值统一编秩。
如果原假设两个独立样本来自相同的总体为真,那么秩将大约均匀分布在两个样本中,即小的、中等的、大的秩值应该大约均匀被分在两个样本中。
如果备选假设两个独立样本来自不相同的总体为真,那么其中一个样本将会有更多的小秩值,这样就会得到一个较小的秩和;另一个样本将会有更多的大秩值,因此就会得到一个较大的秩和。
设两个独立样本为:第一个x 的样本容量为1n ,第二个y 样本容量为2n ,在容量为21n n n +=的混合样本(第一个和第二个)中,x 样本的秩和为x W ,y 样本的秩和为y W ,且有2)1(21+=+++=+n n n W W y x (28.1)我们定义2)1(111+-=n n W W x (28.2)2)1(222+-=n n W W y (28.3)以x 样本为例,若它们在混合样本中享有最小的1n 个秩,于是2)1(11+=n n W x ,也是x W 可能取的最小值;同样y W 可能取的最小值为2)1(22+n n 。
那么,x W 的最大取值等于混合样本的总秩和减去y W 的最小值,即2)1(2)1(22+-+n n n n ;同样,y W 的最大取值等于2)1(2)1(11+-+n n n n 。
所以,(28.2)和(28.3)式中的1W 和2W 均为取值在0与2122112)1(2)1(2)1(n n n n n n n n =+-+-+的变量。
sas 秩和检验(配对完全随机)1

目的要求
1. 掌握利用univariate过程实现配对设计资 料的非参数检验; 2. 掌握利用npar1way过程及Wilcoxon选择 项实现完全随机设计资料的秩和检验。
一、非参数统计的使用范围
(1)等级资料; (2)偏态分布; (3)分布不明; (4)个别数据偏离过大; (5)各组方差明显不齐。
; proc univariate normal; var d; run;
符号秩和的统计量
P值
不服从正态分布
结果解释:
正态性检验:W=0.84,p=0.0483,可认为差值d不服从 正态分布。 符号秩和检验:S=T+-N(N+1)/4=-21, P=0.0313,拒绝H0, 差别有统计学意义,可以认为不同剂量组 的小鼠肝糖原含量有差别。
不同剂量组小鼠肝糖原含量(mg/100g) 小鼠对号 中剂量组 高剂量组 (1) (2) (3) 1 620.16 958.47 2 866.50 838.42 3 641.22 788.90 4 812.91 815.20 5 738.96 783.17 6 899.38 910.92 7 760.78 758.49 8 694.95 870.80 9 749.92 862.26 10 793.94 805.48
刺激物1组 1.94 1.94 2.92 2.92 2.92 2.92 3.27 3.27 3.27 3.27 3.70 3.70 3.74 刺激物2组 3.27 3.27 3.27 3.70 3.70 3.74
PROC NPAR1WAY过程格式
PROC NPAR1WAY Wilcoxon; CLASS 变量名; *指定区分不同组的分组变量 VAR 变量名; *指定要分析的变量 RUN;
Wilcoxon符号秩检验的使用方法(七)

Wilcoxon符号秩检验的使用方法Wilcoxon符号秩检验是一种非参数统计方法,用于检验两组相关样本的差异性。
与t检验不同,Wilcoxon符号秩检验不要求数据呈正态分布,适用范围更广。
本文将从概念、原理和步骤三个方面介绍Wilcoxon符号秩检验的使用方法。
一、概念Wilcoxon符号秩检验是由Frank Wilcoxon于1945年提出的,用于比较两组相关样本的差异。
它基于样本内观测值之间的差异性,而不是样本间的差异性。
因此,它对样本数据的分布形状没有要求,适用于各种类型的数据。
二、原理Wilcoxon符号秩检验的原理是将两组相关样本的差值按绝对值从小到大排列,然后为每个差值赋予一个秩次,最后计算秩次和。
如果样本来自同一总体,秩次和应该接近0;如果两组样本存在差异,秩次和会偏离0。
通过对秩次和进行假设检验,可以判断两组样本的差异性是否显著。
三、步骤1. 提出假设在进行Wilcoxon符号秩检验前,首先需要提出零假设和备择假设。
零假设通常是两组样本来自同一总体,备择假设是两组样本存在差异。
2. 计算差值对于两组相关样本,首先计算它们的差值。
将样本对中第一个样本减去第二个样本,得到一组差值。
3. 求秩次将差值的绝对值从小到大排序,然后为每个差值赋予一个秩次,相同的差值取秩次的平均值。
4. 计算秩次和将秩次和正负号保留,然后取绝对值,得到秩次和的值。
5. 计算临界值根据样本量和显著性水平,查找Wilcoxon符号秩检验的临界值。
可以借助统计表格或者统计软件进行查找。
6. 进行假设检验比较计算得到的秩次和与临界值,如果秩次和大于临界值,则拒绝零假设,认为两组样本存在显著性差异;如果秩次和小于临界值,则接受零假设,认为两组样本来自同一总体。
四、实例分析为了更好地理解Wilcoxon符号秩检验的使用方法,接下来以一个实例进行分析。
假设某医院想要比较两种治疗方法对患者血压的影响。
他们随机选择了20名患者,分别给予两种治疗方法,并在治疗前后测量患者的血压值。
4.2-两样本Wilcoxon秩和检验

3.统计量的性质
1) W和XY 之W间Y 只相差一个常数,即
WXY
WY
n(n 1) 2
WYX
WX
解:假设检验问题为:
H0 : M x M y H1 : M x M y 将 X1, X2, , X12与Y1,Y2 , ,Y7 混合在一起,求 m 12,n 7 在混合样本中的秩:
两样本W-M-W秩和检验
体重/g 70 83 85 94 97 101 104 107 112 113
(DW 2 , Dnm1W 2 )
对于例1:m=17,n=15,mn=255
查表得
所以
W 2 76
对于例(2D:Wm =2 ,1D2,nnm=17,Wmn2=)84 (D76, D255176 ) (D76, D180 ) (3916, 263)
查表得
所以
W 2 W0.025 19
(DW 2 , Dnm1W 2 ) (D19, D84119 ) (D19, D66 ) (3, 42)
再见
n
WY Rj 1 3 4 6 9 1116 50 i1
WXY
WY
n(n 1) 2
50
78 2
22
m
WX Ri 2 5 7 8 10 12 13 14 15 17 18 19 140 i1
pW值Y=X
m(m 1) 2
2)W在X的Y零精假确设分布成立下, 分布和累计概率分别H为0
SAS的基本统计分析

SAS的基本统计分析SAS(统计分析系统)是一种广泛使用的统计分析软件,被广泛应用于数据分析和建模。
它提供了各种强大的统计分析功能,包括描述性统计、推断统计、回归分析、多元分析等。
在本文中,我们将介绍SAS的一些基本统计分析功能。
1.描述性统计分析:描述性统计是对数据集的基本特征进行分析和总结。
SAS提供了各种描述性统计分析功能,包括计算均值、中位数、百分位数、方差、标准差等。
例如,我们可以使用SAS的`MEANS`过程计算数据集中的变量的均值和标准差。
2.推断统计分析:推断统计分析是根据样本数据推断总体的参数估计和假设检验。
SAS提供了一系列的推断统计分析功能,包括参数估计、置信区间估计、假设检验等。
例如,我们可以使用SAS的`TTEST`过程进行两个样本的t检验,或者使用`ANOV`过程进行方差分析。
3.回归分析:回归分析用于研究自变量与因变量之间的关系,并建立预测模型。
在SAS中,我们可以使用`REG`过程进行回归分析。
该过程提供了许多回归模型,如一元线性回归、多元线性回归、逻辑回归等。
我们可以通过回归分析来了解变量之间的关系,发现影响因变量的重要因素,并进行预测。
4.多元分析:多元分析是一种分析多个自变量对因变量的影响的方法。
SAS提供了多种多元分析的方法,如多元方差分析(MANOVA)、主成分分析(PCA)、因子分析等。
我们可以使用SAS的`GLM`过程进行多元方差分析,或者使用`FACTOR`过程进行因子分析。
5.时间序列分析:时间序列分析是一种对时间相关数据进行建模和预测的方法。
SAS提供了一些时间序列分析的功能,如自回归移动平均模型(ARMA)、自回归积分移动平均模型(ARIMA)等。
我们可以使用SAS的`ARIMA`过程进行时间序列分析,拟合ARIMA模型并进行预测。
6.非参数统计分析:非参数统计分析是一种不需要对总体进行任何假设的统计分析方法。
SAS提供了一些非参数统计分析的功能,如Wilcoxon秩和检验、Kruskal-Wallis检验等。
SAS系统和数据分析Wilcoxon秩和检验

第二十八课 Wilcoxon 秩和检验一、 两样本的Wilcoxon 秩和检验两样本的Wilcoxon 秩和检验是由Mann ,Whitney 和Wilcoxon 三人共同设计的一种检验,有时也称为Wilcoxon 秩和检验,用来决定两个独立样本是否来自相同的或相等的总体。
如果这两个独立样本来自正态分布和具有相同方差时,我们可以采用t 检验比较均值。
但当这两个条件都不能确定时,我们常替换t 检验法为Wilcoxon 秩和检验。
Wilcoxon 秩和检验是基于样本数据秩和。
先将两样本看成是单一样本(混合样本)然后由小到大排列观察值统一编秩。
如果原假设两个独立样本来自相同的总体为真,那么秩将大约均匀分布在两个样本中,即小的、中等的、大的秩值应该大约被均匀分在两个样本中。
如果备选假设两个独立样本来自不相同的总体为真,那么其中一个样本将会有更多的小秩值,这样就会得到一个较小的秩和;另一个样本将会有更多的大秩值,因此就会得到一个较大的秩和。
设两个独立样本为:第一个x 的样本容量为1n ,第二个y 样本容量为2n ,在容量为21n n n +=的混合样本(第一个和第二个)中,x 样本的秩和为x W ,y 样本的秩和为y W ,且有:2)1(21+=+++=+n n n W W y x (28.1)我们定义:2)1(111+-=n n W W x (28.2)2)1(222+-=n n W W y (28.3)以x 样本为例,若它们在混合样本中享有最小的1n 个秩,于是2)1(11+=n n W x ,也是xW 可能取的最小值;同样y W 可能取的最小值为2)1(22+n n 。
那么,x W 的最大取值等于混合样本的总秩和减去y W 的最小值,即2)1(2)1(22+-+n n n n ;同样,y W 的最大取值等于2)1(2)1(11+-+n n n n 。
所以,式(28.2)和式(28.3)中的1W 和2W 均为取值在0与2122112)1(2)1(2)1(n n n n n n n n =+-+-+的变量。
第二十八课Wilcoxon秩和检验

同一总体中抽得的独立随机样本, x i 和 y i 构成可分辨的排列情况,可看成一排 n 个球随机地 指定 n1 个为 x 球另 n 2 个为 y 球,共有 Cn 1 种可能,而且它们是等可能的。基于这样分析,在 原假设为真的条件下不难求出 W1 和 W2 的概率分布,显然它们的分布还是相同的,这个分布 称为样本大小为 n1 和 n 2 的 Mann-Whitney-Wilcoxon 分布。 一个具有实际价值的方法是,对于每个样本中的观察数大于等于 8 的大样本来说,我们 可以采用标准正态分布 z 来近似检验。 由于 W1 的中心点为 为
(28.3)
以 x 样本为例,若它们在混合样本中享有最小的 n1 个秩,于是 W x
n1 (n1 1) ,也是 W x 可 2
能取的最小值;同样 W y 可能取的最小值为
n 2 (n 2 1) 。那么, W x 的最大取值等于混合样本 2
的 总 秩 和 减 去 Wy 的 最 小 值 , 即
2
n1n2 ( 3 n1n2 (n1 n2 1) j j ) 12 12(n1 n2 )(n1 n2 1)
(28.6)
其中 j 第 j 个结值的个数。结值的存在将使原方差变小,这是一个显然正确的事实。标准化 后Wx 为
z
W x 0. 5
统一编秩 7 8 3.5 1 10 2 11 14
Wx
Wy
56.5
如果假定放弃预定座位旅客人数的总体是正态分布且有相等的方差,我们可以采用两样 本比较的 t 检验。但航空公司的 CEO 认为这两个假设条件不能满足,因此采用非参数的 Wilcoxon 秩和检验。将 x 组与 y 组看成是单一样本进行编秩,见表 28.1 中的第 3 列和第 5 列 所示。 ,最小值是 8 秩值为 1,最大值是 25 秩值为 17,有两个结值 10 和 11,两个 10 平均分 享秩值 3 和 4 为 3.5,两个 11 平均分享秩值 5 和 6 为 5.5。如果两组放弃预定座位的旅客人数 是相同的,那么我们期望的两组秩和 W x 和 W y 大约是相同的;如果两组放弃预定座位的旅客 人数是不相同的,那么我们期望的两组秩和 W x 和 W y 也是非常不相同的。 注意到 n1 9, n2 8, W x =96.5, W y =56.5, H 0 : 两组放弃预定座位旅客人数的分布 是相同的。标准正态分布 z 值的计算结果为
SAS的非参数检验

SAS的非参数检验非参数检验是一种统计方法,用于处理数据不满足正态分布或方差齐性的情况。
它们不依赖于任何概率分布的假设,因此也被称为非参数检验。
SAS(统计分析系统)是一种常用的统计软件,提供了多种非参数检验方法。
本文将介绍一些常见的非参数检验方法及其在SAS中的应用。
1. Wilcoxon符号秩检验(Wilcoxon Signed Rank Test):Wilcoxon符号秩检验是一种用于比较两个相关样本或配对样本的非参数检验方法。
它对于数据不满足正态分布的情况非常有用。
它的原假设是两个样本的中位数不同。
在SAS中,可以使用PROC UNIVARIATE来执行Wilcoxon符号秩检验。
下面是一个示例代码:```proc univariate data=mydata;var x1 x2;wilcoxon signedrank;run;```其中,mydata是数据集名称,x1和x2是要比较的两个变量。
wilcoxon signedrank选项告诉SAS执行Wilcoxon符号秩检验。
2. Mann-Whitney U检验(Mann-Whitney U Test):Mann-Whitney U检验是一种用于比较两个独立样本的非参数检验方法。
它的原假设是两个样本的总体分布相同。
在SAS中,可以使用PROC NPAR1WAY来执行Mann-Whitney U检验。
下面是一个示例代码:```proc npar1way data=mydata;var x;class group;mannwhitney u(x) / wilcoxon;run;```其中,mydata是数据集名称,x是要比较的变量,group是分组变量。
mannwhitney u选项告诉SAS执行Mann-Whitney U检验。
3. Kruskal-Wallis检验(Kruskal-Wallis Test):Kruskal-Wallis检验是一种用于比较三个或更多独立样本的非参数检验方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二十八课 Wilcoxon 秩和检验一、 两样本的Wilcoxon 秩和检验两样本的Wilcoxon 秩和检验是由Mann ,Whitney 和Wilcoxon 三人共同设计的一种检验,有时也称为Wilcoxon 秩和检验,用来决定两个独立样本是否来自相同的或相等的总体。
如果这两个独立样本来自正态分布和具有相同方差时,我们可以采用t 检验比较均值。
但当这两个条件都不能确定时,我们常替换t 检验法为Wilcoxon 秩和检验。
Wilcoxon 秩和检验是基于样本数据秩和。
先将两样本看成是单一样本(混合样本)然后由小到大排列观察值统一编秩。
如果原假设两个独立样本来自相同的总体为真,那么秩将大约均匀分布在两个样本中,即小的、中等的、大的秩值应该大约被均匀分在两个样本中。
如果备选假设两个独立样本来自不相同的总体为真,那么其中一个样本将会有更多的小秩值,这样就会得到一个较小的秩和;另一个样本将会有更多的大秩值,因此就会得到一个较大的秩和。
设两个独立样本为:第一个x 的样本容量为1n ,第二个y 样本容量为2n ,在容量为21n n n +=的混合样本(第一个和第二个)中,x 样本的秩和为x W ,y 样本的秩和为y W ,且有:2)1(21+=+++=+n n n W W y x (28.1)我们定义:2)1(111+-=n n W W x (28.2)2)1(222+-=n n W W y (28.3)以x 样本为例,若它们在混合样本中享有最小的1n 个秩,于是2)1(11+=n n W x ,也是xW 可能取的最小值;同样y W 可能取的最小值为2)1(22+n n 。
那么,x W 的最大取值等于混合样本的总秩和减去y W 的最小值,即2)1(2)1(22+-+n n n n ;同样,y W 的最大取值等于2)1(2)1(11+-+n n n n 。
所以,式(28.2)和式(28.3)中的1W 和2W 均为取值在0与2122112)1(2)1(2)1(n n n n n n n n =+-+-+的变量。
当原假设为真时,所有的i x 和i y 相当于从同一总体中抽得的独立随机样本,i x 和i y 构成可分辨的排列情况,可看成一排n 个球随机地指定1n 个为x 球,另2n 个为y 球,共有2nn C 种可能,而且它们是等可能的。
基于这样的分析,在原假设为真的条件下不难求出1W 和2W 的概率分布,显然它们的分布还是相同的,这个分布称为样本大小为1n 和2n 的Mann-Whitney-Wilcoxon 分布。
一个具有实际价值的方法是,对于每个样本中的观察数大于等于8的大样本来说,我们可以采用标准正态分布z 来近似检验。
由于1W 的中心点为221n n ,根据式(28.2),x W 中心点μ为:2)1(2)1(22111121++=+-=n n n n n n n μ (28.4)x W 的方差2σ从数学上可推导出:12)1(21212++=n n n n σ(28.5)如果样本中存在结值,将影响到公式(28.5)中的方差,按结值调整方差的公式为:)1)((12)(12)1(212132121212-++--++=∑n n n n n n n n n n j j ττσ (28.6)其中,j τ为第j 个结值的个数。
结值的存在将使原方差变小,这是一个显然正确的事实。
标准化后x W 为:)1,0(~)1)((12)(12)1(5.02)1(5.021213212121211N n n n n n n n n n n n n n W W z j x x -++--++±++-=±-=∑ττσμ(28.7)其中,分子加0.5或减0.5是为了对离散变量进行连续性修正,对于μ-x W 大于0减0.5修正,对于μ-x W 小于0加0.5修正。
例28.1某航空公司的CEO 注意到飞离亚特兰大的飞机放弃预订座位的旅客人数在增加,他特别有兴趣想知道,是否从亚特兰大起飞的飞机比从芝加哥起飞的飞机有更多的放弃预订座位的旅客。
获得一个从亚特兰大起飞的9次航班和从芝加哥起飞的8次航班上放弃预订座位的旅客人数样本,见表28.1中的第2列和第4列。
表28.1 放弃预订座位的旅客人数及统一秩值航班 次数 亚特兰大(x 组)芝加哥(y 组) 放弃人数统一编秩 放弃人数 统一编秩1 11 5.5 13 72 15 9 14 83 10 3.5 10 3.54 18 12 8 15 11 5.5 16 10 6 20 13 9 27 24 16 17 118 22 15 21 149 2517秩和x W 96.5y W56.5如果假定放弃预订座位旅客人数的总体是正态分布且有相等的方差,我们可以采用两样本比较的t 检验。
但航空公司的CEO 认为这两个假设条件不能满足,因此采用非参数的Wilcoxon 秩和检验。
将x 组与y 组看成是单一样本进行编秩,见表28.1中的第3列和第5列。
最小值是8,秩值为1,最大值是25,秩值为17,有两个结值10和11,两个10平均分享秩值3和4为3.5,两个11平均分享秩值5和6为5.5。
如果两组放弃预订座位的旅客人数是相同的,那么我们期望的两组秩和x W 和y W 大约是相同的;如果两组放弃预订座位的旅客人数是不相同的,那么我们期望的两组秩和x W 和y W 也是非常不相同的。
注意到=1n 9,=2n 8,x W =96.5,y W =56.5,:0H 两组放弃预订座位旅客人数的分布是相同的。
标准正态分布z 值的计算结果为44515.1)189)(89(12)2828)(8(912)189)(8(95.02)189(95.96=-++-+--++-++-=z如果设定显著水平=α0.05,我们知道标准正态分布在0.05显著水平时,上临界值为1.645,下临界值为-1.645,由于1.445<1.645,所以不能拒绝原假设。
在使用Wilcoxon 秩和检验时,也可以采用第二个样本的秩和y W 来计算标准正态分布z 值,但要注意公式中1n 和2n 的对换。
z 值的计算结果为:44515.1)189)(89(12)2828)(8(912)189)(8(95.02)189(85.56-=-++-+--+++++-=z由于-1.445>-1.645,因此得到的是相同的结果,不能拒绝原假设。
另外,要特别注意的是由于在连续型分布中随机地抽出n 个样本,几乎极少可能存在有些值相等的情况,但在社会经济中有很多离散变量,很可能存在数值相同的情况,即样本中存在着“结”。
我们处理“结”的方法采用分享平均秩,但当大量“结”存在时,将可能直接影响x W 的方差,因此需要把式(28.5)中的方差修正为式(28.6)。
但在手工计算和结值不多的情况下,常使用未修正方差来简化计算,因为与修正方差的计算结果比较只存在一些小差异,大多数情况下不影响最终的推断结果。
二、 单因子非参数方差分析的npar1way 过程单因子非参数方差分析的npar1way 过程是分析变量的秩,并计算几个基于经验分布的函数(EDF )和通过一个单因子分类变量的响应变量确定的秩得分的统计量。
秩的得分计算分成四种:Wilcoxon 得分、中位数得分、Savage 得分和Van der Waerden 得分。
然后,再由秩得分计算简单的线性秩统计量,由这个秩统计量可以检验一个变量的分布在不同组中是否具有相同的位置参数,或者在EDF 检验下,检验这个变量分布在不同组中是否分布相同。
秩得分的统计量也可以先用proc rank 过程计算秩得分,然后用proc anova 过程分析这些秩得分而得到。
1. 四种不同的秩得分计算用以下公式定义的统计量:)(1i ni i R a C S ∑==(28.8)称为线性秩统计量。
其中,i R 是第i 个观察的秩,)(i R a 是秩得分,i C 是一个指示向量(由0和1组成),它表示了第i 个观察所属的类,n 是观察的总数。
npar1way 过程的四种不同的)(i R a 秩得分计算为:(1) Wilcoxon 得分在Wilcoxon 得分中:)(i R a =i R(28.9)它对Logistic 分布的位置移动是局部最优的。
在计算两样本情况下的Wilcoxon 秩和统计量时,过程对零假设下的渐进标准正态分布的z 统计量进行一个连续的+0.5和-0.5校正。
(2) Median 得分Median 得分又称为中位数得分。
当观察的秩大于中位点时,中位数得分为1,否则为0,即:2/)1(1)(+>=n R R a i i 当2/)1(0)(+≤=n R R a i i 当(28.10)对于双指数分布,中位数得分是局部最优。
(3) Van der Waerden 得分Van der Waerden 得分简称为VW 的得分。
它是对正态分布的次序统计量的期望值的近似,即:)(i R a =))1/((F 1-+n R i(28.11)其中,)(F 1x -函数是标准正态的累积分布函数的反函数,这个得分对正态分布是最优的。
(4) Savage 得分Savage 得分是指数分布的次序统计量的期望值。
减去1使得得分以0为中心,即:)(i R a =1)1/(11-+-∑=iR i i n(28.12)Savage 得分在指数分布中比较尺度的不同性或在极值分布中的位置移动上是最优的。
2. npar1way 过程说明proc npar1way 过程一般由下列语句控制:proc npar1way data=数据集 <选项>;class 分类变量; var 变量列表; by 变量列表 ; run ;为了使用proc npar1way 过程,必须调用proc 和class 语句。
其余语句是供选择的。
(1) proc npar1way 语句的选项● anova ——对原始数据执行标准方差分析。
● edf ——计算基于经验分布函数(EDF )的统计量,如Kolmogorov-Smirnov 、Cramer-Von Meses 、Kuiper 统计量。
● missing ——把class 变量的缺失值看作一个有效的分类水平。
● median ——执行一个中位数得分分析。
对于两样本产生一个中位数检验,对于更多样本产生一个Brown-Mood 检验。
● savage ——执行一个Savage 得分分析。
该检验适用于数据服从指数分布的组间比较。
● vw ——执行一个Van der Waerden 得分分析。
这是一个通过应用反正态分布累积函数得到近似的正态得分。
对于两个水平情况,这是一个标准Van der Waerden 检验。