SAS讲义 第二十七课符号检验和Wilcoxon符号秩检验

合集下载

sas 秩和检验(配对完全随机)1

sas 秩和检验(配对完全随机)1
秩和检验(一) (配对设计和完全随机设计 的定量资料的非参数检验)
目的要求
1. 掌握利用univariate过程实现配对设计资 料的非参数检验; 2. 掌握利用npar1way过程及Wilcoxon选择 项实现完全随机设计资料的秩和检验。
一、非参数统计的使用范围
(1)等级资料; (2)偏态分布; (3)分布不明; (4)个别数据偏离过大; (5)各组方差明显不齐。
; proc univariate normal; var d; run;
符号秩和的统计量
P值
不服从正态分布
结果解释:
正态性检验:W=0.84,p=0.0483,可认为差值d不服从 正态分布。 符号秩和检验:S=T+-N(N+1)/4=-21, P=0.0313,拒绝H0, 差别有统计学意义,可以认为不同剂量组 的小鼠肝糖原含量有差别。
不同剂量组小鼠肝糖原含量(mg/100g) 小鼠对号 中剂量组 高剂量组 (1) (2) (3) 1 620.16 958.47 2 866.50 838.42 3 641.22 788.90 4 812.91 815.20 5 738.96 783.17 6 899.38 910.92 7 760.78 758.49 8 694.95 870.80 9 749.92 862.26 10 793.94 805.48
刺激物1组 1.94 1.94 2.92 2.92 2.92 2.92 3.27 3.27 3.27 3.27 3.70 3.70 3.74 刺激物2组 3.27 3.27 3.27 3.70 3.70 3.74
PROC NPAR1WAY过程格式
PROC NPAR1WAY Wilcoxon; CLASS 变量名; *指定区分不同组的分组变量 VAR 变量名; *指定要分析的变量 RUN;

两配对样本符号秩检验课件

两配对样本符号秩检验课件
符号秩检验在统计学中广泛应用于各种场景,如医学研究、 社会科学调查、质量控制等,尤其在无法满足参数检验的前 提假设时,如非正态分布或方差不齐。
符号秩检验的原理
符号秩检验基于以下原理:如果两个配对样本来自相同的 总体,那么它们之间的差异应该随机分布,正负差异的频 数应该大致相等。通过比较实际观测到的正负差异频数与 理论上的期望频数,可以判断两个样本的差异是否显著。
05
两配对样本符号秩检 验的注意事项
数据质量与处理
确保数据准确性和完整性
在实施两配对样本符号秩检验之前,应仔细核对数据,确保没有 遗漏或错误。
数据清洗
对于异常值或缺失值,需要进行适当的数据清洗和填充,以避免对 检验结果造成影响。
数据转换
在某些情况下,可能需要对数据进行适当的转换,以便更好地满足 检验的要求。
计算秩次及统计量
计算每对数据的秩次
根据符号化后的数据,按照大小顺序 计算每对数据的秩次。
计算统计量
利用秩次计算统计量,用于后续的假 设检验。
确定P值及结论
确定双尾或单尾检验
结论
根据实际情况选择双尾检验或单尾检 验。
根据P值的大小,判断两配对样本之 间的差异是否具有统计学显著性。
计算P值
根据选择的检验类型和统计量,计算 出P值。
两配对样本符号秩 检验课件
目录
• 符号秩检验的基本概念 • 两配对样本符号秩检验的步骤 • 两配对样本符号秩检验的案例分析 • 两配对样本符号秩检验的优缺点 • 两配对样本符号秩检验的注意事项
01
符号秩检验的基本概 念
Hale Waihona Puke 号秩检验的定义符号秩检验是一种非参数统计检验方法,用于比较两个配对 样本的差异是否显著。它通过比较两个样本中对应观测值的 符号(正、负或零)和绝对差值的大小,利用秩次的概念来 推断两个样本是否来自相同的总体分布。

常见的几种非参数检验方法

常见的几种非参数检验方法

常见的几种非参数检验方法非参数检验是一种不需要对数据进行假设检验的统计方法,它不需要满足正态分布等前提条件,因此被广泛应用于实际数据分析中。

在本文中,我们将介绍常见的几种非参数检验方法。

一、Wilcoxon符号秩检验Wilcoxon符号秩检验是一种用于比较两个相关样本之间差异的非参数检验方法。

它基于样本差异的符号和秩来计算统计量,并通过查表或使用软件进行显著性判断。

二、Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两个独立样本之间差异的非参数检验方法。

它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。

三、Kruskal-Wallis H检验Kruskal-Wallis H检验是一种用于比较多个独立样本之间差异的非参数检验方法。

它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。

四、Friedman秩和检验Friedman秩和检验是一种用于比较多个相关样本之间差异的非参数检验方法。

它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。

五、符号检验符号检验是一种用于比较两个相关样本之间差异的非参数检验方法。

它基于样本差异的符号来计算统计量,并通过查表或使用软件进行显著性判断。

六、秩相关检验秩相关检验是一种用于比较两个相关样本之间关系的非参数检验方法。

它基于样本排名来计算统计量,并通过查表或使用软件进行显著性判断。

七、分布拟合检验分布拟合检验是一种用于检验数据是否符合某个特定分布的非参数检验方法。

它基于样本数据与理论分布之间的差异来计算统计量,并通过查表或使用软件进行显著性判断。

八、重复测量ANOVA重复测量ANOVA是一种用于比较多个相关样本之间差异的非参数检验方法。

它基于样本方差和均值来计算统计量,并通过查表或使用软件进行显著性判断。

九、Bootstrap法Bootstrap法是一种用于估计总体参数和构建置信区间的非参数方法。

它基于自助重采样技术来生成大量虚拟样本,以此估计总体参数和构建置信区间。

SAS系统和数据分析Wilcoxon秩和检验

SAS系统和数据分析Wilcoxon秩和检验

SAS系统和数据分析Wilcoxon 秩和检验第二十八课Wilcoxon秩和检验一、两样本的Wilcoxon秩和检验两样本的Wilcoxon秩和检验是由Mann,Whitney和Wilcoxon三人共同设计的一种检验,有时也称为Wilcoxon秩和检验,用来决定两个独立样本是否来自相同的或相等的总体。

如果这两个独立样本来自正态分布和具有相同方差时,我们可以采用t检验比较均值。

但当这两个条件都不能确定时,我们常替换t检验法为Wilcoxon秩和检验。

Wilcoxon秩和检验是基于样本数据秩和。

先将两样本看成是单一样本(混合样本)然后由小到大排列观察值统一编秩。

如果原假设两个独立样本来自相同的总体为真,那么秩将大约均匀分布在两个样本中,即小的、中等的、大的秩值应该大约被均匀分在两个样本中。

如果备选假设两个独立样本来自不相同的总体为真,那么其中一个样本将会有更多的小秩值,这样就会得到一个较小的秩和;另一个样本将会有更多的大秩值,因此就会得到一个较大的秩和。

设两个独立样本为:第一个x 的样本容量为1n ,第二个y 样本容量为2n ,在容量为21n n n +=的混合样本(第一个和第二个)中,x 样本的秩和为x W ,y 样本的秩和为yW ,且有: 2)1(21+=+++=+n n n W W y x (28.1)我们定义: 2)1(111+-=n n W W x (28.2)2)1(222+-=n n W W y (28.3) 以x 样本为例,若它们在混合样本中享有最小的1n 个秩,于是2)1(11+=n n W x ,也是x W 可能取的最小值;同样y W 可能取的最小值为2)1(22+nn 。

那么,xW 的最大取值等于混合样本的总秩和减去yW 的最小值,即2)1(2)1(22+-+n n n n ;同样,y W 的最大取值等于2)1(2)1(11+-+n n n n 。

所以,式(28.2)和式(28.3)中的1W 和2W 均为取值在0与2122112)1(2)1(2)1(n n nn nn n n =+-+-+的变量。

Wilcoxon秩和检验

Wilcoxon秩和检验

秩和检验参数统计与非参数统计的区别:参数统计:即总体分布类型已知,用样本指标对总体参数进行推断或作假设检验的统计分析方法。

非参数统计:即不考虑总体分布类型是否已知,不比较总体参数,只比较总体分布的位置是否相同的统计方法。

下面我们将介绍非参数统计中一种常用的检验方法--秩和检验,其中“秩”又称等级、即按数据大小排定的次序号。

上述次序号的和称“秩和”,秩和检验就是用秩和作为统计量进行假设检验的方法。

二、不同设计和资料类型的秩和检验1.配对比较的资料:对配对比较的资料应采用符合秩和检验(Sighed rank test),其基本思想是:若检验假设成立,则差值的总体分布应是对称的,故正负秩和相差不应悬殊。

检验的基本步骤为:(1)建立假设;H0:差值的总体中位数为0;H1:差值的总体中位数不为0;检验水准为0.05。

(2)算出各对值的代数差;(3)根据差值的绝对值大小编秩;(4)将秩次冠以正负号,计算正、负秩和;(5)用不为“0”的对子数n及T(任取T+或T-)查检验界值表得到P值作出判断。

应注意的是当n>25时,可用正态近似法计算u值进行u检验,当相同秩次较多时u值需进行校正。

2. 两样本成组比较:两样本成组资料的比较应用Wilcoxon秩和检验,其基本思想是:若检验假设成立,则两组的秩和不应相差太大。

其基本步骤是:(1)建立假设;H0:比较两组的总体分布相同;H1:比较两组的总体分布位置不同;检验水准为0.05。

(2)两组混合编秩;(3)求样本数最小组的秩和作为检验统计量T;(4)以样本含量较小组的个体数n1、两组样本含量之差n2-n1及T值查检验界值表;(5)根据P值作出统计结论。

同样应注意的是,当样本含量较大时,应用正态近似法作u检验;当相同秩次较多时,应用校正公式计算u值。

3.多个样本比较:多个样本比较的秩和检验可用Kruskal-Wallis法,其基本步骤为:(1)建立假设;H0:比较各组总体分布相同;H1:比较各组总体分布位置不同或不全相同;检验水准为0.05。

wilcoxon方法

wilcoxon方法

wilcoxon方法摘要:一、Wilcoxon方法简介二、Wilcoxon符号秩检验三、Wilcoxon符号秩检验的应用四、Wilcoxon符号秩检验的优缺点五、总结正文:一、Wilcoxon方法简介Wilcoxon方法是一种非参数检验方法,主要用于比较两个样本的总体中位数是否显著不同。

它由美国统计学家Wilcoxon于1945年首次提出,适用于样本量较小、分布未知的情况。

Wilcoxon方法包括两种检验:Wilcoxon符号秩检验和Wilcoxon符号秩和检验。

二、Wilcoxon符号秩检验Wilcoxon符号秩检验是一种基于符号的检验方法,用于比较两个样本的中位数是否存在显著差异。

检验过程中,首先对两个样本的数据进行排序,然后计算符号检验的统计量Z。

若Z值显著,则说明两个样本的中位数存在显著差异。

三、Wilcoxon符号秩检验的应用Wilcoxon符号秩检验广泛应用于医学、生物学、心理学等领域。

例如,在临床试验中,可以利用Wilcoxon符号秩检验比较治疗组和对照组之间的疗效差异;在教育研究中,可以运用Wilcoxon符号秩检验分析不同教学方法对学生成绩的影响。

四、Wilcoxon符号秩检验的优缺点优点:1.不受分布假设的限制,适用于各种数据类型。

2.对样本量较小的情况具有较好的检验性能。

3.操作简单,计算方便。

缺点:1.对极端值敏感,可能导致检验结果不稳定。

2.当样本量较大时,Wilcoxon符号秩检验的检验力可能较低。

五、总结Wilcoxon方法作为一种非参数检验方法,在样本量较小、分布未知的情况下具有较好的应用价值。

通过Wilcoxon符号秩检验,我们可以有效地比较两个样本的中位数差异,为实证研究提供依据。

然而,Wilcoxon方法也存在一定的局限性,如对极端值敏感、在大样本情况下的检验力较低等。

wilcoxon符号秩检验例题

wilcoxon符号秩检验例题在统计学中,Wilcoxon符号秩检验是非参数假设检验方法之一,用于对两个相关样本进行比较和推断。

本文将以一个Wilcoxon符号秩检验的示例来说明该方法的使用过程和推断。

假设我们正在研究某种新药物对患者的治疗效果。

我们有一个由10名患者组成的样本,每个患者均接受了该药物的治疗。

我们想要确定这种药物是否对患者的症状有所改善。

首先,我们需要构建假设。

在这个例子中,我们的原假设(H0)是该药物对患者的症状没有改善,备择假设(H1)是该药物对患者的症状有改善。

接下来,我们需要收集数据。

我们让每个患者在开始治疗前和治疗后分别评估他们的症状,使用一个评级从1到10的量表。

以下是我们收集到的数据:患者编号治疗前评分治疗后评分1 5 42 6 73 7 64 4 35 8 86 6 77 3 48 7 69 5 410 6 5现在,我们将对这些数据应用Wilcoxon符号秩检验。

首先,我们需要计算每个患者的符号差异,即治疗前评分减去治疗后评分。

以下是计算得到的符号差异:-1, -1, 1, 1, 0, -1, -1, 1, 1, 1然后,我们对这些符号差异进行排序,并为每个差异赋予一个秩次。

以下是计算得到的秩次:2, 2, 8, 8.5, 5.5, 2, 2, 8, 8.5, 8.5接下来,我们需要计算正符号与负符号的和(即W+和W-)。

在这个例子中,W+ = 39,W- = 15。

根据Wilcoxon符号秩检验的原理,采取以下步骤进行推断:1. 根据样本数(n = 10)和符号和的较小值(min(W+, W-) = 15),查找临界值。

可以参考Wilcoxon符号秩检验的临界值表或使用计算机软件进行计算。

在显著性水平为0.05的情况下,临界值为11。

2. 比较实际计算得到的W+和W-与临界值。

如果W+或W-大于临界值,则拒绝原假设,否则接受原假设。

在这个例子中,W+ = 39,W- = 15,均大于临界值11。

R语言wilcoxon秩和检验及wilcoxon符号秩检验的操作

R语⾔wilcoxon秩和检验及wilcoxon符号秩检验的操作说明wilcoxon秩和及wilcoxon符号秩检验是对原假设的⾮参数检验,在不需要假设两个样本空间都为正态分布的情况下,测试它们的分布是否完全相同。

操作#利⽤mtcars数据library(stats)data("mtcars")boxplot(mtcars$mpg~mtcars$am,ylab='mpg',names = c('automatic','manual))#执⾏wilcoxon秩和检验验证⾃动档⼿动档数据分布是否⼀致wilcox.test(mpg~am,data = mtcars)#wilcox.test(mtcars$mpg[mtcars$am==0],mtcars$mpg[mtcars$am==1])(与上⾯等价)Wilcoxon rank sum test with continuity correctiondata: mpg by amW = 42, p-value = 0.001871alternative hypothesis: true location shift is not equal to 0Warning message:In wilcox.test.default(x = c(21.4, 18.7, 18.1, 14.3, 24.4, 22.8, :⽆法精確計算带连结的p值总结执⾏wilcoxon秩和检验(也称Mann-Whitney U检验)这样⼀种⾮参数检验。

t检验假设两个样本的数据集之间的差别符合正态分布(当两个样本集都符合正态分布时,t检验效果最佳),但当服从正态分布的假设并不确定时,我们执⾏wilcoxon秩和检验来验证数据集中mtcars中⾃动档与⼿动档汽车的mpg值的分布是否⼀致,p 值<0.05,原假设不成⽴。

案例分析配对样本的Wilcoxon符号秩检验及SPSS操作

⼀.案例案例来源:中华护理杂志2017年8期经⿐胃管喂养临床实践指南的临床应⽤。

⽅法:以渥太华证据转化模式为理论框架,从指南中筛选相关证据,构建新的⿐饲护理流程,在实施⼲预后,通过护⼠(15名)的⿐饲护理知识得分和对新流程的执⾏率及患者的⿐饲并发症发⽣情况等来评价指南应⽤效果。

(α=0.1)⼆.分析对于该研究,之前我们已经讨论过。

现在重新对另外15名护⼠在培训前后分别进⾏⿐饲护理知识的测试,通过两次测试的得分差异判断经⿐胃管喂养临床实践指南是否可以提⾼护⼠的⿐饲护理知识。

三.SPSS操作1.⽣成差值定义⽬标变量为差值,数字表达式为培训后得分减去培训前得分;点击确定。

2.正态性检验①差值描述可以看到原数据中增加了⼀列差值变量,即前后两次得分相减得到的数据,配对数据间的均值⽐较实质就是差值与0之间的⽐较,因此需要对差值进⾏正态性检验后选择分析⽅法。

②正态性检验将差值放⼊因变量列表,点击图,勾选含检验的正态图;点击继续,确定。

③检验结果由结果得:P=0.089<0.1,因此应该拒绝原假设,认为差值是不服从正态分布的。

对于配对设计的资料,若数据服从正态分布,则选⽤配对样本t检验,若不服从正态分布,则选⽤Wilcoxon符号秩检验。

3. Wilcoxon配对秩检验①操作步骤出现双关联样本检验对话框,将培训前得分和培训后得分选⼊检验对,检验类型选择威尔科克森,点击确定。

②结果解读(1)威尔科克森符号秩检验由结果可以看出,有11个护⼠培训后的得分⼤于培训前的得分,3个护⼠培训后的得分⼩于培训前的得分,1个护⼠培训前后得分相同。

(2)检验统计由结果得:Z=-2.766,P=0.006<0.1,因此应该拒绝原假设,认为培训前后护⼠的⿐饲护理知识得分存在显著性差异,且由培训前后的得分情况以及平均得分可以得出:经⿐胃管喂养临床实践指南是有效果的,可以增加护⼠在⿐饲护理⽅⾯的知识储备。

四.总结之前对于该研究的讨论(案例分析|2×2列联表卡⽅检验的SPSS操作),护⼠培训前后的得分⽐较运⽤的是配对样本的t检验,⽽这⾥运⽤的是Wilcoxon符号秩检验。

Wilcoxon符号秩检验吴喜之例子

Total a. 死亡数 < 常数 b. 死亡数 > 常数 c. 死亡数 = 常数
N
Mean Rank Sum of Ranks
4a
2.50
10.00
6b
7.50
45.00
0c
10
Test Statisticsb
死亡数 - 常数
Z Asymp. Sig. (2-tailed)
-1.784a .074
洲十国新生儿死亡率可以认为是千分之 34.
下面是 SPSS 输出结果:
Ranks
X - M0 Negative Ranks Positive Ranks Ties Total
a. X < M0 b. X > M0 c. X = M0
Test Statisticsb
N
Mean Rank Sum of Ranks
Wilcoxon signed rank test data: x V = 29, p-value = 0.4609 alternative hypothesis: true location is greater than 34
95 percent confidence interval:
17.5 Inf
日本
4
以色列
6
韩国
9
斯里兰卡
15
叙利亚
31
中国
33
伊朗
36
印度
65
孟加拉国
77
巴基斯坦
88
这里想作两个检验作为比较。一个是 H0:M≥34 H1:M<34,
另一个是 H0:M≤16 H1:M>16。 之所以作这两个检验是因为 34 和 16 在这一列数中的位置是对称的,如果用符号检验,结果也应该 是对称的。现在来看 Wilcoxon 符号秩检验和符号检验有什么不同,先把上面的步骤列成表:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二十七课 符号检验和Wilcoxon 符号秩检验在统计推断和假设检验中,传统的检验统计量都叫做参数检验,因为它们都依赖于确定的概率分布,这个分布带有一组自由的参数。

参数检验被认为是依赖于分布假定的。

通常情况下,我们对数据进行分析时,总是假定误差项服从正态分布,这是人们易于接受的事实,因为正态分布的原始出发点就是来自于误差分布,至于当样本相当大时,数据的正态近似,这是由于大样本理论所保证的。

但有些资料不一定满足上述要求,或不能测量具体数值,其观察结果往往只有程度上的区别,如颜色的深浅、反应的强弱等,此时就不适用参数检验的方法,而只能用非参数统计方法(non-parametric statistical analysis )来处理。

这种方法对数据来自的总体不作任何假设或仅作极少的假设,因此在实用中颇有价值,适用面很广。

一、 单样本的符号检验符号检验(sign test )是一种最简单的非参数检验方法。

它是根据正、负号的个数来假设检验。

首先需要将原始观察值按设定的规则,转换成正、负号,然后计数正、负号的个数作出检验。

该检验可用于样本中位数和总体中位数的比较,数据的升降趋势的检验,特别适用于总体分布不服从正态分布或分布不明的配对资料,有时当配对比较的结果只能定性的表示,如试验前后比较结果为颜色从深变浅、程度从强变弱,成绩从一般变优秀,即不能获得具体数字,也可用符号检验,例如用正号表示颜色从深变浅,用负号表示颜色从浅变深。

用于配对资料时,符号检验的计算步骤为:首先定义成对数据指定正号或负号的规则,然后计数正号的个数+S 及负号的个数-S ,由于在具体比较配对资料时,可能存在配对资料的前后没有变化,或等于假设中的中位数,此时仅需要将这些观察值从资料中剔除,当然样本大小n 也随之减少,故修正样本大小-++=S S n 。

当样本n 较小时,应使用二项分布确切概率计算法,当样本n 较大时,常利用二项分布的正态近似。

1. 小样本时的二项分布概率计算当20≤n 时,+S 或-S 的检验p 值由精确计算尺度二项分布的卷积获得。

在比较配对资料试验前后有否变化,或增加或减小的假设检验时,如果我们定义试验后比试验前增加为正号,反之为负号,那么对于原假设:试验前后无变化来说,正号的个数+S 和负号的个数-S 可能性应当相等,即正号出现的概率p =0.5,于是+S 与-S 均服从二项分布)5.0,(n B ,对于太大的+S 相应太小的-S ,或者太大的-S 相应太小的+S ,都将拒绝接受原假设;对于原假设:试验后比试验前有增加来说,正号的个数+S 大于负号的个数-S 的可能性应该大,即正号出现的概率5.0>p ,对于太小的+S 相应太大的-S ,将拒绝接受原假设;对于原假设:试验后比试验前减小来说,正号的个数+S 小于等于负号的个数-S 的可能性应该大,即正号出现的概率5.0≤p ,对于太大的+S 相应太小的-S ,将拒绝接受原假设。

例27.1有一种提高学生某种素质的训练,有人说它是无效的,有人说它是有效的,那么真实情况究竟应该是怎样的呢?随机地选取15名学生作为试验样本,在训练开始前做了一次测验,每个学生的素质按优、良、中、及、差打分,经过三个月训练后,再做一次测试对每个学生打分。

数据见表27.1所示。

我们将素质提高用正号表示,反之用负号表示,没有变化用0表示。

显著性水平取0.1。

表27.1 训练前后的素质比较学生编号训练之前 训练之后 差异符号 1 中 优 + 2 及 良 + 3 良 中 - 4 差 中 + 5 良 良 0 6 中 优 + 7 差 及 + 8 良 优 + 9 中 差 - 10 差 中 + 11 中 优 + 12 及 良 + 13 中 及 - 14 中 优 + 15差中+从表27.1中15名学生训练前后的差异分析可得出:有14名学生有差异,其中+S =11,-S =3。

1名学生无差异(学生编号为5),应该从分析中去掉,所以n =15-1=14。

假设检验为:5.0:0≤p H 即训练之后学生素质没有提高。

5.0:1>p H 即训练之后学生素质有提高。

由于试验的结果只有两种可能,正号或负号,对每一个学生试验出现正号的假定概率为p =0.5,负号为1—p =0.5,这样整个试验的概率是相同的,并且每一个试验是相互独立的。

因此在n =14次独立的试验中,正号出现的次数服从二项分布)5.0,14(B ,见表27.2所示。

表27.2 二项分布的概率和累计概率n =14,p =0.5正号出现的次数正号出现的概率累计概率 0 0.0001 0.0001 1 0.0009 0.0009 2 0.0056 0.0065 30.02220.02874 0.0611 0.08985 0.1222 0.21206 0.1833 0.39537 0.2095 0.60478 0.1833 0.78809 0.1222 0.9102 10 0.0611 0.9713 11 0.0222 0.9935 12 0.0056 0.9991 13 0.0009 0.9999 140.00011.0000从表27.2的累计概率列中我们看到,正号出现的次数大于10的概率为1-0.9713=0.0287,或者换一种方法计算为=0.0001+0.0009+0.0056+0.0222=0.0287,二者的微小差异是因为小数点后舍入问题造成的。

而试验的结果:正号出现的次数为11,大于10,出现的概率不会超过0.0287,我们开始设定的显著性水平为0.1,由于0.0287<0.1,所以我们拒绝原假设,接受备选假设。

如果我们的原假设为p =0.5,既训练前后学生素质相等,那么就是双侧检验,应该加上正号出现的次数小于4的概率0.0287,即2×0.0287=0.0574<0.1,同样是拒绝原假设,接受区间为4次到10次,而拒绝区间为小于等于3次(小于4次)或大于等于11次(大于10 次)。

2. 大样本时的正态近似概率计算当20>n 时,样本可以认为是大样本。

我们可以利用二项分布的正态近似,即对于),(~p n B S ,二项分布的期望均值为np ,方差为)1(p np -,当n 比较大时,且np 和)1(p n -大于5,可以近似地认为)1,0(~)1(N p np np S z --=(27.1)公式中的S 表示正号或者负号的个数,符号检验时,p =0.5代入(27.1)式中,得到大样本时的正态近似统计量)1,0(~5.05.0N nn S z -=(27.2)当S >2/n 时,应该修正S 为S -0.5;当S <2/n 时,应该修正S 为S +0.5。

S 值加或减的0.5是连续性修正因子,目的是为了能将连续分布应用到近似的离散型分布。

二、 配对资料的Wilcoxon 符号秩检验当两组配对资料近似服从正态分布,它们差值的检验可以使用配对t 检验法。

如果配对资料的正态分布的假设不能成立,就可以使用Frank Wilcoxon (1945)符号秩检验,它是一种非参数检验方法,对配对资料的差值采用符号秩方法来检验。

它的基本要求是差值数据设置为最小的序列等级和两组配对资料是相关的(配成对)。

在两组配对资料的差异有具体数值的情况下,符号检验只利用大于0和小于0的信息,即正号和负号的信息,而对差异大小所包含的信息却未加利用,但Wilcoxon 符号秩检验方法既考虑了正、负号,又利用了差值大小,故效率较符号检验法高。

例27.2某制造商想要比较两种不同的生产方法所花费的生产时间是否有差异。

随机地选取了11个工人,每一个工人都分别使用两种不同的生产方法来完成一项相同的任务,每一个工人开始选用的生产方法是随机的,即可以先使用生产方法1再使用生产方法2,也可以先用生产方法2再使用生产方法1。

这样,在样本中的每一个工人都提供了一个配对观察。

数据见表27.3所示。

任务完成时间的正差值表示生产方法1需要更多的时间,负差值表示生产方法2需要更多的时间。

表27.3 两种不同生产方法完成任务的时间(分钟) 工人编号n生产方法M 差值D 绝对差值 秩次 R 符号秩次R M 1 M 2 D =M 1-M 2|D | - + 1 10.2 9.5 0.7 0.7 8 8 2 9.6 9.8 -0.2 0.2 2 2 3 9.2 8.8 0.4 0.4 3.5 3.5 4 10.6 10.1 0.5 0.5 5.5 5.5 5 9.9 10.3 -0.4 0.4 3.5 3.5 6 10.2 9.3 0.9 0.9 10 10 7 10.6 10.5 0.1 0.1 1 1 8 10.0 10.0 0 0 — — — 9 11.2 10.6 0.6 0.6 7 7 10 10.7 10.2 0.5 0.5 5.5 5.5 1110.69.80.80.899 符号秩次总和-T =5.5,+T =49.55.549.5为了比较两种方法的任务完成时间是否有显著差异,假设检验为::0H 任务完成时间的两个总体是相同的。

:1H 任务完成时间的两个总体是不相同的。

使用Wilcoxon 符号秩检验方法的主要步骤见表27.3中每列的计算方法和过程,先求出每对数据的差值D ,按差值绝对值|D |由小到大排列并给秩R ,从秩1开始到秩10,注意工人编号为8的配对数据,由于差值为0,在排秩中丢弃,样本数目修正为n =11-1=10。

在给秩值时,遇到相等|D |,也称为结值(tied ),使用平均秩,如工人编号3和5具有相同的绝对差值0.4,所以平分秩3和秩4,各为秩3.5。

一旦绝对差值的秩值R 给出后,然后将R 分成正和负差值的两个部分秩值+R 和-R ,最后求符号秩和∑++=RT ,∑--=RT ,如-T =2+3.5=5.5。

对于样本数目有n 个,+T 与-T 的最小可能值为0,而最大可能值为(1+2+…+n )=n (n +1)/2。

显然,应当有+T +-T = n (n +1)/2,如本例5.5+49.5=55=10(10+1)/2。

那么符号秩的平均值为n (n +1)/4。

构造Wilcoxon 符号秩统计量为4)1(+-=+n n T S (27.3)显然如果原假设为真,+T 与-T 应该有相同的值,等于n (n +1)/4,因此太大的S 值或太小的S 值都是我们拒绝的依据。

在实际工作中便于计算常取W=min (+T ,-T ),W 服从所谓的Wilcoxon 符号秩分布,对于本例n =10,=S 49.5-10(10+1)/4=22,W = min (49.5,5.5)=5.5,查表可得在显著水平=α0.05,n =10的双侧检验的临界值为8,即W 值的拒绝区域为0到8,接受区域为8到27.5。

相关文档
最新文档