SAS讲义 第二十七课符号检验和Wilcoxon符号秩检验

合集下载

sas 秩和检验(配对完全随机)1

sas 秩和检验(配对完全随机)1
秩和检验(一) (配对设计和完全随机设计 的定量资料的非参数检验)
目的要求
1. 掌握利用univariate过程实现配对设计资 料的非参数检验; 2. 掌握利用npar1way过程及Wilcoxon选择 项实现完全随机设计资料的秩和检验。
一、非参数统计的使用范围
(1)等级资料; (2)偏态分布; (3)分布不明; (4)个别数据偏离过大; (5)各组方差明显不齐。
; proc univariate normal; var d; run;
符号秩和的统计量
P值
不服从正态分布
结果解释:
正态性检验:W=0.84,p=0.0483,可认为差值d不服从 正态分布。 符号秩和检验:S=T+-N(N+1)/4=-21, P=0.0313,拒绝H0, 差别有统计学意义,可以认为不同剂量组 的小鼠肝糖原含量有差别。
不同剂量组小鼠肝糖原含量(mg/100g) 小鼠对号 中剂量组 高剂量组 (1) (2) (3) 1 620.16 958.47 2 866.50 838.42 3 641.22 788.90 4 812.91 815.20 5 738.96 783.17 6 899.38 910.92 7 760.78 758.49 8 694.95 870.80 9 749.92 862.26 10 793.94 805.48
刺激物1组 1.94 1.94 2.92 2.92 2.92 2.92 3.27 3.27 3.27 3.27 3.70 3.70 3.74 刺激物2组 3.27 3.27 3.27 3.70 3.70 3.74
PROC NPAR1WAY过程格式
PROC NPAR1WAY Wilcoxon; CLASS 变量名; *指定区分不同组的分组变量 VAR 变量名; *指定要分析的变量 RUN;

Wilcoxon秩和检验

Wilcoxon秩和检验

秩和检验参数统计与非参数统计的区别:参数统计:即总体分布类型已知,用样本指标对总体参数进行推断或作假设检验的统计分析方法。

非参数统计:即不考虑总体分布类型是否已知,不比较总体参数,只比较总体分布的位置是否相同的统计方法。

下面我们将介绍非参数统计中一种常用的检验方法--秩和检验,其中“秩”又称等级、即按数据大小排定的次序号。

上述次序号的和称“秩和”,秩和检验就是用秩和作为统计量进行假设检验的方法。

二、不同设计和资料类型的秩和检验1.配对比较的资料:对配对比较的资料应采用符合秩和检验(Sighed rank test),其基本思想是:若检验假设成立,则差值的总体分布应是对称的,故正负秩和相差不应悬殊。

检验的基本步骤为:(1)建立假设;H0:差值的总体中位数为0;H1:差值的总体中位数不为0;检验水准为0.05。

(2)算出各对值的代数差;(3)根据差值的绝对值大小编秩;(4)将秩次冠以正负号,计算正、负秩和;(5)用不为“0”的对子数n及T(任取T+或T-)查检验界值表得到P值作出判断。

应注意的是当n>25时,可用正态近似法计算u值进行u检验,当相同秩次较多时u值需进行校正。

2. 两样本成组比较:两样本成组资料的比较应用Wilcoxon秩和检验,其基本思想是:若检验假设成立,则两组的秩和不应相差太大。

其基本步骤是:(1)建立假设;H0:比较两组的总体分布相同;H1:比较两组的总体分布位置不同;检验水准为0.05。

(2)两组混合编秩;(3)求样本数最小组的秩和作为检验统计量T;(4)以样本含量较小组的个体数n1、两组样本含量之差n2-n1及T值查检验界值表;(5)根据P值作出统计结论。

同样应注意的是,当样本含量较大时,应用正态近似法作u检验;当相同秩次较多时,应用校正公式计算u值。

3.多个样本比较:多个样本比较的秩和检验可用Kruskal-Wallis法,其基本步骤为:(1)建立假设;H0:比较各组总体分布相同;H1:比较各组总体分布位置不同或不全相同;检验水准为0.05。

wilcoxon方法

wilcoxon方法

wilcoxon方法摘要:一、Wilcoxon方法简介二、Wilcoxon符号秩检验三、Wilcoxon符号秩检验的应用四、Wilcoxon符号秩检验的优缺点五、总结正文:一、Wilcoxon方法简介Wilcoxon方法是一种非参数检验方法,主要用于比较两个样本的总体中位数是否显著不同。

它由美国统计学家Wilcoxon于1945年首次提出,适用于样本量较小、分布未知的情况。

Wilcoxon方法包括两种检验:Wilcoxon符号秩检验和Wilcoxon符号秩和检验。

二、Wilcoxon符号秩检验Wilcoxon符号秩检验是一种基于符号的检验方法,用于比较两个样本的中位数是否存在显著差异。

检验过程中,首先对两个样本的数据进行排序,然后计算符号检验的统计量Z。

若Z值显著,则说明两个样本的中位数存在显著差异。

三、Wilcoxon符号秩检验的应用Wilcoxon符号秩检验广泛应用于医学、生物学、心理学等领域。

例如,在临床试验中,可以利用Wilcoxon符号秩检验比较治疗组和对照组之间的疗效差异;在教育研究中,可以运用Wilcoxon符号秩检验分析不同教学方法对学生成绩的影响。

四、Wilcoxon符号秩检验的优缺点优点:1.不受分布假设的限制,适用于各种数据类型。

2.对样本量较小的情况具有较好的检验性能。

3.操作简单,计算方便。

缺点:1.对极端值敏感,可能导致检验结果不稳定。

2.当样本量较大时,Wilcoxon符号秩检验的检验力可能较低。

五、总结Wilcoxon方法作为一种非参数检验方法,在样本量较小、分布未知的情况下具有较好的应用价值。

通过Wilcoxon符号秩检验,我们可以有效地比较两个样本的中位数差异,为实证研究提供依据。

然而,Wilcoxon方法也存在一定的局限性,如对极端值敏感、在大样本情况下的检验力较低等。

R语言wilcoxon秩和检验及wilcoxon符号秩检验的操作

R语言wilcoxon秩和检验及wilcoxon符号秩检验的操作

R语⾔wilcoxon秩和检验及wilcoxon符号秩检验的操作说明wilcoxon秩和及wilcoxon符号秩检验是对原假设的⾮参数检验,在不需要假设两个样本空间都为正态分布的情况下,测试它们的分布是否完全相同。

操作#利⽤mtcars数据library(stats)data("mtcars")boxplot(mtcars$mpg~mtcars$am,ylab='mpg',names = c('automatic','manual))#执⾏wilcoxon秩和检验验证⾃动档⼿动档数据分布是否⼀致wilcox.test(mpg~am,data = mtcars)#wilcox.test(mtcars$mpg[mtcars$am==0],mtcars$mpg[mtcars$am==1])(与上⾯等价)Wilcoxon rank sum test with continuity correctiondata: mpg by amW = 42, p-value = 0.001871alternative hypothesis: true location shift is not equal to 0Warning message:In wilcox.test.default(x = c(21.4, 18.7, 18.1, 14.3, 24.4, 22.8, :⽆法精確計算带连结的p值总结执⾏wilcoxon秩和检验(也称Mann-Whitney U检验)这样⼀种⾮参数检验。

t检验假设两个样本的数据集之间的差别符合正态分布(当两个样本集都符合正态分布时,t检验效果最佳),但当服从正态分布的假设并不确定时,我们执⾏wilcoxon秩和检验来验证数据集中mtcars中⾃动档与⼿动档汽车的mpg值的分布是否⼀致,p 值<0.05,原假设不成⽴。

SAS---秩和检验

SAS---秩和检验

测得铅作业工人与非铅作业工人的血铅值
(μmol/L),问两组工人的血铅值有无差别?
铅作业组:
0.82 0.87 0.97 1.21 1.64 2.08 2.13 非铅作业组:
0.24 0.24 0.29 0.33 0.44 0.58 0.63 0.87 1.01
0.72
Data ex9_1;
g=1;
OUTPUT<OUT=数据集名><选项>;
RUN;
成组设计资料的秩和检验
定量资料两样本比较
实习指导 P54例9.1
定量资料多样本比较
P156例12.5
等级资料两样本比较
P155例12.4
等级资料多样本比较
P158例12.6(自行练习)
成组设计定量资料两样本比较
实习指导 P54例9.1
【VAR <变量名表>;】 【BY <变量名表>;】 【FREQ <变量名表>;】
NORMAL 进行正态性检验
【OUTPUT OUT=<数据集名>
统计量关键字=<新变量名表>;】
RUN;
Wilcoxon符号秩和检验
配对设计两样本比较
P150例12.1
单一样本与总体中位数比较
P152例12.2
14名患者发铜含量(μg/g): 6.11 6.20 6.27 6.58 7.31 8.52 9.59 9.72 10.63 11.32
6.78 11.16
7.22 11.23
data ex12_2; input x@@; d=x-11.2; /*各个观察值与总体中位数的差值*/ cards; 6.11 6.20 6.27 .... ;

案例分析配对样本的Wilcoxon符号秩检验及SPSS操作

案例分析配对样本的Wilcoxon符号秩检验及SPSS操作

⼀.案例案例来源:中华护理杂志2017年8期经⿐胃管喂养临床实践指南的临床应⽤。

⽅法:以渥太华证据转化模式为理论框架,从指南中筛选相关证据,构建新的⿐饲护理流程,在实施⼲预后,通过护⼠(15名)的⿐饲护理知识得分和对新流程的执⾏率及患者的⿐饲并发症发⽣情况等来评价指南应⽤效果。

(α=0.1)⼆.分析对于该研究,之前我们已经讨论过。

现在重新对另外15名护⼠在培训前后分别进⾏⿐饲护理知识的测试,通过两次测试的得分差异判断经⿐胃管喂养临床实践指南是否可以提⾼护⼠的⿐饲护理知识。

三.SPSS操作1.⽣成差值定义⽬标变量为差值,数字表达式为培训后得分减去培训前得分;点击确定。

2.正态性检验①差值描述可以看到原数据中增加了⼀列差值变量,即前后两次得分相减得到的数据,配对数据间的均值⽐较实质就是差值与0之间的⽐较,因此需要对差值进⾏正态性检验后选择分析⽅法。

②正态性检验将差值放⼊因变量列表,点击图,勾选含检验的正态图;点击继续,确定。

③检验结果由结果得:P=0.089<0.1,因此应该拒绝原假设,认为差值是不服从正态分布的。

对于配对设计的资料,若数据服从正态分布,则选⽤配对样本t检验,若不服从正态分布,则选⽤Wilcoxon符号秩检验。

3. Wilcoxon配对秩检验①操作步骤出现双关联样本检验对话框,将培训前得分和培训后得分选⼊检验对,检验类型选择威尔科克森,点击确定。

②结果解读(1)威尔科克森符号秩检验由结果可以看出,有11个护⼠培训后的得分⼤于培训前的得分,3个护⼠培训后的得分⼩于培训前的得分,1个护⼠培训前后得分相同。

(2)检验统计由结果得:Z=-2.766,P=0.006<0.1,因此应该拒绝原假设,认为培训前后护⼠的⿐饲护理知识得分存在显著性差异,且由培训前后的得分情况以及平均得分可以得出:经⿐胃管喂养临床实践指南是有效果的,可以增加护⼠在⿐饲护理⽅⾯的知识储备。

四.总结之前对于该研究的讨论(案例分析|2×2列联表卡⽅检验的SPSS操作),护⼠培训前后的得分⽐较运⽤的是配对样本的t检验,⽽这⾥运⽤的是Wilcoxon符号秩检验。

常用非参数检验简介

常用非参数检验简介
1. 2. 3. 4. 5. 6.

符号检验; Wilcoxon符号秩检验; Wilcoxon两样本秩和检验; Mann-Whitney检验; Kruskal-Wallis检验; Friedman检验。
ቤተ መጻሕፍቲ ባይዱ 1. 符号检验



(1)适用场合 当“单组设计定量资料”不满足正态性要求时, 可用此方法。 (2)基本原理 各观测值与‘标准值’相减,用K-和K+分别代 表小于和大于标准值的个数,H0为该指标所对 应的中位数为‘标准值’,于是, K-和K+理 论上应相等,根据二项分布原理,可求出K-或 K+的分布规律(见《教程》P185)。
t | RA RB | N ( N 1)(N 1 H ) 1 1 12( N K ) n n B A
Df=N-K,K为因素的水平数,H为秩和检验的统计量, 分子为对比两组的平均秩之差,查t值表得到P值。
2. Wilcoxon符号秩检验


(1)适用场合 当‘单组设计定量资料’和‘配对设计定量 资料的差量’不服从正态分布要求时,可用 此方法。 (2)基本原理 根据各对数据差量之绝对值编秩,分别求出 ‘正秩和R+’与‘负秩和R-’,H0为R+= R-,于 是,根据一种特殊的二项分布原理,可求出 R+’或R-的分布规律。


(1)适用场合 不适合用配伍组设计或两因素无重复实 验设计定量资料的方差分析时,可用此 方法。 (2)基本原理 按各区组(横向)分别编秩,再按因素 的各水平(列向)求秩和,利用秩和构 造卡方统计量,从而实现假设检验。
多样本间两两比较的秩和检验

Wilcoxon符号秩检验吴喜之例子

Total a. 死亡数 < 常数 b. 死亡数 > 常数 c. 死亡数 = 常数
N
Mean Rank Sum of Ranks
4a
2.50
10.00
6b
7.50
45.00
0c
10
Test Statisticsb
死亡数 - 常数
Z Asymp. Sig. (2-tailed)
-1.784a .074
洲十国新生儿死亡率可以认为是千分之 34.
下面是 SPSS 输出结果:
Ranks
X - M0 Negative Ranks Positive Ranks Ties Total
a. X < M0 b. X > M0 c. X = M0
Test Statisticsb
N
Mean Rank Sum of Ranks
Wilcoxon signed rank test data: x V = 29, p-value = 0.4609 alternative hypothesis: true location is greater than 34
95 percent confidence interval:
17.5 Inf
日本
4
以色列
6
韩国
9
斯里兰卡
15
叙利亚
31
中国
33
伊朗
36
印度
65
孟加拉国
77
巴基斯坦
88
这里想作两个检验作为比较。一个是 H0:M≥34 H1:M<34,
另一个是 H0:M≤16 H1:M>16。 之所以作这两个检验是因为 34 和 16 在这一列数中的位置是对称的,如果用符号检验,结果也应该 是对称的。现在来看 Wilcoxon 符号秩检验和符号检验有什么不同,先把上面的步骤列成表:

sas 秩和检验结果解读

sas 秩和检验结果解读效应大小是0.03的秩和检验结果解读秩和检验(Wilcoxon rank-sum test),也被称为Mann-Whitney U检验,是一种非参数统计方法,用于比较两个独立样本的中位数是否相等。

在本文中,我们将讨论一个秩和检验结果的解读,其中效应大小为0.03。

首先,我们需要了解秩和检验原假设和备择假设。

在秩和检验中,原假设(H0)是两个样本的中位数相等,备择假设(H1)是两个样本的中位数不相等。

根据给定的样本数据和问题的研究背景,我们进行了秩和检验,并获得了一个效应大小为0.03的结果。

效应大小是指独立变量对因变量的影响程度。

在秩和检验中,效应大小可以通过计算Wilcoxon秩和统计量(U统计量)的值来衡量。

U统计量的值越接近0,表示两个样本的中位数差异越大,而越接近两个样本大小之秩和,则表示两个样本的中位数差异越小。

现在,让我们来具体分析0.03的效应大小。

首先,我们需要检查该效应是否具有统计显著性。

对于秩和检验,通常会计算一个P值,用于衡量观察到的效应大小与偶然差异之间的关系。

如果P值小于事先确定的显著性水平(通常为0.05),则结果被认为是具有统计显著性的。

不过,在这种情况下,我们已经给出了具体的效应大小为0.03。

效应大小通常是计算两个组之间的差异的标准化度量。

在秩和检验中,常见的效应大小度量指标是Cohen’s d和r(也称为秩点二势效应量)。

Cohen’s d 的计算涉及样本标准差,而r的计算涉及秩二等级的和。

这两个标准化指标都是描述组间效应大小的方法,可以帮助我们更好地解读结果。

然而,需要注意的是,即使效应大小为0.03,它并不意味着效应是实际上存在的或者具有实际意义的。

效应大小仅仅是一个统计量,用于描述样本数据的差异,并不能直接反映真实世界的差异。

因此,在解读效应大小为0.03的秩和检验结果时,我们需要综合考虑以下几个因素:1. 检查P值:如果P值小于显著性水平(通常为0.05),则结果具有统计显著性。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二十七课 符号检验和Wilcoxon 符号秩检验在统计推断和假设检验中,传统的检验统计量都叫做参数检验,因为它们都依赖于确定的概率分布,这个分布带有一组自由的参数。

参数检验被认为是依赖于分布假定的。

通常情况下,我们对数据进行分析时,总是假定误差项服从正态分布,这是人们易于接受的事实,因为正态分布的原始出发点就是来自于误差分布,至于当样本相当大时,数据的正态近似,这是由于大样本理论所保证的。

但有些资料不一定满足上述要求,或不能测量具体数值,其观察结果往往只有程度上的区别,如颜色的深浅、反应的强弱等,此时就不适用参数检验的方法,而只能用非参数统计方法(non-parametric statistical analysis )来处理。

这种方法对数据来自的总体不作任何假设或仅作极少的假设,因此在实用中颇有价值,适用面很广。

一、 单样本的符号检验符号检验(sign test )是一种最简单的非参数检验方法。

它是根据正、负号的个数来假设检验。

首先需要将原始观察值按设定的规则,转换成正、负号,然后计数正、负号的个数作出检验。

该检验可用于样本中位数和总体中位数的比较,数据的升降趋势的检验,特别适用于总体分布不服从正态分布或分布不明的配对资料,有时当配对比较的结果只能定性的表示,如试验前后比较结果为颜色从深变浅、程度从强变弱,成绩从一般变优秀,即不能获得具体数字,也可用符号检验,例如用正号表示颜色从深变浅,用负号表示颜色从浅变深。

用于配对资料时,符号检验的计算步骤为:首先定义成对数据指定正号或负号的规则,然后计数正号的个数+S 及负号的个数-S ,由于在具体比较配对资料时,可能存在配对资料的前后没有变化,或等于假设中的中位数,此时仅需要将这些观察值从资料中剔除,当然样本大小n 也随之减少,故修正样本大小-++=S S n 。

当样本n 较小时,应使用二项分布确切概率计算法,当样本n 较大时,常利用二项分布的正态近似。

1. 小样本时的二项分布概率计算当20≤n 时,+S 或-S 的检验p 值由精确计算尺度二项分布的卷积获得。

在比较配对资料试验前后有否变化,或增加或减小的假设检验时,如果我们定义试验后比试验前增加为正号,反之为负号,那么对于原假设:试验前后无变化来说,正号的个数+S 和负号的个数-S 可能性应当相等,即正号出现的概率p =0.5,于是+S 与-S 均服从二项分布)5.0,(n B ,对于太大的+S 相应太小的-S ,或者太大的-S 相应太小的+S ,都将拒绝接受原假设;对于原假设:试验后比试验前有增加来说,正号的个数+S 大于负号的个数-S 的可能性应该大,即正号出现的概率5.0>p ,对于太小的+S 相应太大的-S ,将拒绝接受原假设;对于原假设:试验后比试验前减小来说,正号的个数+S 小于等于负号的个数-S 的可能性应该大,即正号出现的概率5.0≤p ,对于太大的+S 相应太小的-S ,将拒绝接受原假设。

例27.1有一种提高学生某种素质的训练,有人说它是无效的,有人说它是有效的,那么真实情况究竟应该是怎样的呢?随机地选取15名学生作为试验样本,在训练开始前做了一次测验,每个学生的素质按优、良、中、及、差打分,经过三个月训练后,再做一次测试对每个学生打分。

数据见表27.1所示。

我们将素质提高用正号表示,反之用负号表示,没有变化用0表示。

显著性水平取0.1。

表27.1 训练前后的素质比较学生编号训练之前 训练之后 差异符号 1 中 优 + 2 及 良 + 3 良 中 - 4 差 中 + 5 良 良 0 6 中 优 + 7 差 及 + 8 良 优 + 9 中 差 - 10 差 中 + 11 中 优 + 12 及 良 + 13 中 及 - 14 中 优 + 15差中+从表27.1中15名学生训练前后的差异分析可得出:有14名学生有差异,其中+S =11,-S =3。

1名学生无差异(学生编号为5),应该从分析中去掉,所以n =15-1=14。

假设检验为:5.0:0≤p H 即训练之后学生素质没有提高。

5.0:1>p H 即训练之后学生素质有提高。

由于试验的结果只有两种可能,正号或负号,对每一个学生试验出现正号的假定概率为p =0.5,负号为1—p =0.5,这样整个试验的概率是相同的,并且每一个试验是相互独立的。

因此在n =14次独立的试验中,正号出现的次数服从二项分布)5.0,14(B ,见表27.2所示。

表27.2 二项分布的概率和累计概率n =14,p =0.5正号出现的次数正号出现的概率累计概率 0 0.0001 0.0001 1 0.0009 0.0009 2 0.0056 0.0065 30.02220.02874 0.0611 0.08985 0.1222 0.21206 0.1833 0.39537 0.2095 0.60478 0.1833 0.78809 0.1222 0.9102 10 0.0611 0.9713 11 0.0222 0.9935 12 0.0056 0.9991 13 0.0009 0.9999 140.00011.0000从表27.2的累计概率列中我们看到,正号出现的次数大于10的概率为1-0.9713=0.0287,或者换一种方法计算为=0.0001+0.0009+0.0056+0.0222=0.0287,二者的微小差异是因为小数点后舍入问题造成的。

而试验的结果:正号出现的次数为11,大于10,出现的概率不会超过0.0287,我们开始设定的显著性水平为0.1,由于0.0287<0.1,所以我们拒绝原假设,接受备选假设。

如果我们的原假设为p =0.5,既训练前后学生素质相等,那么就是双侧检验,应该加上正号出现的次数小于4的概率0.0287,即2×0.0287=0.0574<0.1,同样是拒绝原假设,接受区间为4次到10次,而拒绝区间为小于等于3次(小于4次)或大于等于11次(大于10 次)。

2. 大样本时的正态近似概率计算当20>n 时,样本可以认为是大样本。

我们可以利用二项分布的正态近似,即对于),(~p n B S ,二项分布的期望均值为np ,方差为)1(p np -,当n 比较大时,且np 和)1(p n -大于5,可以近似地认为)1,0(~)1(N p np np S z --=(27.1)公式中的S 表示正号或者负号的个数,符号检验时,p =0.5代入(27.1)式中,得到大样本时的正态近似统计量)1,0(~5.05.0N nn S z -=(27.2)当S >2/n 时,应该修正S 为S -0.5;当S <2/n 时,应该修正S 为S +0.5。

S 值加或减的0.5是连续性修正因子,目的是为了能将连续分布应用到近似的离散型分布。

二、 配对资料的Wilcoxon 符号秩检验当两组配对资料近似服从正态分布,它们差值的检验可以使用配对t 检验法。

如果配对资料的正态分布的假设不能成立,就可以使用Frank Wilcoxon (1945)符号秩检验,它是一种非参数检验方法,对配对资料的差值采用符号秩方法来检验。

它的基本要求是差值数据设置为最小的序列等级和两组配对资料是相关的(配成对)。

在两组配对资料的差异有具体数值的情况下,符号检验只利用大于0和小于0的信息,即正号和负号的信息,而对差异大小所包含的信息却未加利用,但Wilcoxon 符号秩检验方法既考虑了正、负号,又利用了差值大小,故效率较符号检验法高。

例27.2某制造商想要比较两种不同的生产方法所花费的生产时间是否有差异。

随机地选取了11个工人,每一个工人都分别使用两种不同的生产方法来完成一项相同的任务,每一个工人开始选用的生产方法是随机的,即可以先使用生产方法1再使用生产方法2,也可以先用生产方法2再使用生产方法1。

这样,在样本中的每一个工人都提供了一个配对观察。

数据见表27.3所示。

任务完成时间的正差值表示生产方法1需要更多的时间,负差值表示生产方法2需要更多的时间。

表27.3 两种不同生产方法完成任务的时间(分钟) 工人编号n生产方法M 差值D 绝对差值 秩次 R 符号秩次R M 1 M 2 D =M 1-M 2|D | - + 1 10.2 9.5 0.7 0.7 8 8 2 9.6 9.8 -0.2 0.2 2 2 3 9.2 8.8 0.4 0.4 3.5 3.5 4 10.6 10.1 0.5 0.5 5.5 5.5 5 9.9 10.3 -0.4 0.4 3.5 3.5 6 10.2 9.3 0.9 0.9 10 10 7 10.6 10.5 0.1 0.1 1 1 8 10.0 10.0 0 0 — — — 9 11.2 10.6 0.6 0.6 7 7 10 10.7 10.2 0.5 0.5 5.5 5.5 1110.69.80.80.899 符号秩次总和-T =5.5,+T =49.55.549.5为了比较两种方法的任务完成时间是否有显著差异,假设检验为::0H 任务完成时间的两个总体是相同的。

:1H 任务完成时间的两个总体是不相同的。

使用Wilcoxon 符号秩检验方法的主要步骤见表27.3中每列的计算方法和过程,先求出每对数据的差值D ,按差值绝对值|D |由小到大排列并给秩R ,从秩1开始到秩10,注意工人编号为8的配对数据,由于差值为0,在排秩中丢弃,样本数目修正为n =11-1=10。

在给秩值时,遇到相等|D |,也称为结值(tied ),使用平均秩,如工人编号3和5具有相同的绝对差值0.4,所以平分秩3和秩4,各为秩3.5。

一旦绝对差值的秩值R 给出后,然后将R 分成正和负差值的两个部分秩值+R 和-R ,最后求符号秩和∑++=RT ,∑--=RT ,如-T =2+3.5=5.5。

对于样本数目有n 个,+T 与-T 的最小可能值为0,而最大可能值为(1+2+…+n )=n (n +1)/2。

显然,应当有+T +-T = n (n +1)/2,如本例5.5+49.5=55=10(10+1)/2。

那么符号秩的平均值为n (n +1)/4。

构造Wilcoxon 符号秩统计量为4)1(+-=+n n T S (27.3)显然如果原假设为真,+T 与-T 应该有相同的值,等于n (n +1)/4,因此太大的S 值或太小的S 值都是我们拒绝的依据。

在实际工作中便于计算常取W=min (+T ,-T ),W 服从所谓的Wilcoxon 符号秩分布,对于本例n =10,=S 49.5-10(10+1)/4=22,W = min (49.5,5.5)=5.5,查表可得在显著水平=α0.05,n =10的双侧检验的临界值为8,即W 值的拒绝区域为0到8,接受区域为8到27.5。

相关文档
最新文档