秩和检验
秩和检验

T Tmin( n1orn2 )
3.确定P值范围并作推断
(1)当n1 ≤ 10且n2-n1≤10时,
查附表7的T界值表(P269)
(2)当n1>10或n2-n1>10时,按正态 近似公式(7.3)
相同秩次较多时,校正公式(7.4)
其中 为第j个相同秩次的个数。
二、等级资料的两样本比较(例7.4)
3. 编秩次 (1)d=0 舍去不计,用以检验的有效对子
数n相应减少。
(2)│d│同,取平均秩
4. 求秩和,并定检验统计量
T=T+ orT- (核对:T++T-=(n+1)n/2 )
5.确定P值范围并作推断
(1)当有效对子数n≤50,查附表6的
T界值表(P268)
(2)当n>50时,按正态近似公式(7.1) 相同秩次较多时,校正公式(7.2)
1. 建立检验假设,确定检验水准
H0:总体M1=M2,
即两总体分布位置相同;
H1:总体M1≠M2,
即两总体分布位置不同; α=0.05
2.计算检验统计量u 值
(1)编秩:本例为等级资料,先 按组段计算各等级的合计人数,再 确定秩次范围及平均秩次。
(2)计算秩和,确定T 并求检验统 计量u 值:
以各组段的平均秩次分别与各等级例
在实际应用中,秩和检验法有多种具体化: 配对设计的两样本比较 成组设计两样本比较的秩和检验 成组设计多样本比较的秩和检验 多个样本两两比较的秩和检验
符号检验法
检验目标:X与Y是两个连续型总体,各有分布函数
F1(x)与 F2(x) ,现从中分别抽取两个独立样本 ( X1, X 2 , , X n )与 (Y1,Y2,...,Yn ) ,要在显著性水平
秩和检验【医学统计学】

568.4
14.0
384.6
3.0
556.2
13.0
369.1
1.0
435.7
7.0
377.8
2.0
574.8
15.0
436.7
8.0
468.7
12.0
662.9
19.5
433.4
6.0
582.8
16.5
442.3
10.0
438.1
9.0
426.1
5.0
n1 10
T1 101
n2 12
T2 152
2.求检验统计量T 值
①省略所有差值为0的对子数,观察单位数减去0对子数 的个数 ②按差值的绝对值从小到大编秩,绝对值相等的差值若 符号不同取平均值,并保持原差值的正负号;
③任取正秩和或负秩和为T,本例取T-=3。
3. 确定P 值,作出推断结论
2020/8/8
15
检验步骤
查附表12 • 本例T=3,n=10,
3 9 6 8 7 -1 10 4 -2 5
T 52 T 3
2020/8/8
10
配对符号秩检验基本思想
• 当H0(差值的总体中位数Md=0)成立,任一配对差值出现正号、负号的 机会均等,秩和T-与T+的理论数也应相等为n(n+1)/4
• 可以证明:
• H0为真时,秩统计量T是对称分布 • H0非真时,T呈偏态分布
单纯⑴虚寒型 ⑵3 ⑶6 ⑷25 ⑸26 13 ⑻ 73
喘息虚寒型
1
3 10
9
3 26
虚寒阻塞型 16 28 61 27 ⑹9 141
2020/8/8
21
秩和检验零值编秩原则

秩和检验零值编秩原则摘要:1.秩和检验概述2.零值编秩原则的定义3.零值编秩原则的应用4.零值编秩原则的优点与局限性正文:一、秩和检验概述秩和检验(Wilcoxon signed-rank test)是一种非参数检验方法,用于检验两个样本之间是否存在显著差异。
该方法由美国统计学家Wilcoxon 于1945 年提出,适用于总体分布不明、分布不对称以及组间方差不齐的情况下进行比较。
二、零值编秩原则的定义零值编秩原则是秩和检验中一种重要的编秩方法,其主要思想是将所有零值替换为最小的非零值,然后再进行排序。
具体操作步骤如下:1.对两个样本的数据进行合并,并按从小到大的顺序进行排序;2.将合并后的数据中所有零值替换为最小的非零值;3.根据替换后的数据,计算各数据点的秩次;4.根据秩次计算检验统计量,进而判断两组样本之间是否存在显著差异。
三、零值编秩原则的应用零值编秩原则在秩和检验中具有广泛的应用,尤其在处理数据中含有大量零值的情况时,可以有效地提高检验效能。
例如,在医学研究中,对两组治疗方法的效果进行比较时,可能会遇到一些患者未出现明显疗效的情况,这时采用零值编秩原则可以更好地分析数据。
四、零值编秩原则的优点与局限性1.优点:(1)适用于各种分布类型的数据;(2)对数据中的零值处理更加合理;(3)能有效提高检验效能,尤其适用于数据中含有大量零值的情况。
2.局限性:(1)零值编秩原则依赖于非零值的分布,当非零值分布严重偏态时,可能影响检验结果的准确性;(2)当样本量较小时,零值编秩原则可能无法充分发挥作用。
在这种情况下,可以考虑使用其他非参数检验方法,如Mann-Whitney U 检验等。
总之,零值编秩原则为秩和检验提供了一种有效的编秩方法,尤其在处理含有大量零值的数据时具有较高的实用价值。
秩和检验

三、建立假设检验,确定检验水准
H0: 三组总体分布相同,即三组吞噬指数的总体 分布相同
H1: 三组总体分布不全相同,即三组吞噬指数的 总体分布不全相同
787.47
880.83
差值
10
27.88
1.15
154.72
结果展示: 根据样本数据分布类型,选择合适的表示方法 正态分布时,用均数和标准差表示(mean±SD) 偏态分布时,用中位数和四分位间距表示
两样本比较的秩和检验
例2、在河流监测断面优化研究中,研究者从某河流甲乙两个
断面分别随机抽取10和15个样本,测得其亚硝酸盐氮(mg/L)
表1 不同剂量组小鼠肝糖原含量(mg/100g)
小鼠对号 1 2 3 4 5 6 7 8 9 10
中剂量组 620.16 866.50 641.22 812.91 738.96 899.38 760.78 694.95 749.92 793.94
高剂量组 958.47 838.42 788.90 815.20 783.17 910.92 758.49 870.80 862.26 805.48
要求掌握内容
计算机操作
配对比较的秩和检验 两样本比较的秩和检验 多个独立样本比较的秩和检验
结果的表达
配对比较的秩和检验
例1、某研究者欲研究保健食品对小鼠抗疲劳作用,将同种属的小鼠按性 别和年龄相同、体重相近配成对子,共10对,并将每对中的两只小鼠随 机分到保健食品两个不同的剂量组,过一定时期将小鼠处死,测得其肝 糖原含量(mg/100g),结果见表1,问不同剂量组的小鼠肝糖原含量有 无差别?
第十一讲 秩和检验

适用范围
1、成组设计的两样本计量数据,不符合 t 检 验的条件(方差相等,且服从正态分布); 2、两组等级资料或两端无确切值的资料。
一、原始数据的两样本比较
基本思想: • 假定:两组样本的总体分布形式相同(即 H0成立),则两样本来自同一总体,且任 一组秩和不应太大或太小 。即T 与平均秩 和 n1(N+1)/2应相差不大。 N = n1+n2
• 前面介绍的检验方法首先假定分析变量 服从特定的已知分布(如正态分布), 然后对分布参数(如均数)作检验。这 类 检 验 方 法 称 参 数 检 验 ( parametric test)。 • 今天介绍的检验方法不对变量的分布作 严格假定,这类检验称非参数检验 (nonparametric test)。
非参数统计
(nonparametric statistics)
对总体的分布类型不 作特殊要求 ,统计 推断时不涉及参数 不受总体参数的影响,比 较的是分布或分布位置
依赖于特定分布类 型,比较的是参数
非参数统计的适用情况
• • • • • 等级资料 偏态分布资料 分布不明资料 个别数据偏离过大的资料 各组方差明显不齐的资料
• 确定P值: 以较小绝对值的秩和为T值。 本例T=3.5 以n=11查附表6(P268,单侧) p<0.005, • 判定结果: 按α=0.05水准,拒绝H0,接受H1,故可以 认为该厂工人尿氟含量高于当地健康人。
第二节 成组设计两样本比较 的秩和检验
Wilcoxon rank sum test
这下面一行(记为Ri)就是上面一行数 据Xi的秩。
秩和检验原理
• 秩和检验(rank sum test):是通过对数 据依小到大排列的秩次,以求秩次之和来 进行假设检验的方法。
秩和检验

12
五、统计结果表达
表2 比较不同剂量的保健食品对小鼠抗疲劳作用的秩和检验
分组
例数 中位数 25百分位数 75百分位数 Z 统计量 P值
中剂量组 10 755.35
681.52
826.31 -2.193 0.028
高剂量组 10 826.81
秩和检验
(Rank Sum Test)
1
秩和检验(rank sum test)
秩和检验是一种非参数检验(non-parametric test)。它不依赖于总体分布的具体形式,应 用时可以不考虑被研究对象为何种分布以及分 布是否已知,因而适用性较强。
秩和检验是总体分布之间而不是参数(参数检 验,如t检验、方差分析)之间的检验。
787.47
880.83
差值
10
27.88
1.15
154.72
结果展示: 根据样本数据分布类型,选择合适的表示方法 正态分布时,用均数和标准差表示(mean±SD) 偏态分布时,用中位数和四分位间距表示
13
两样本比较的秩和检验
例2、在河流监测断面优化研究中,研究者从某河流甲乙两个
断面分别随机抽取10和15个样本,测得其亚硝酸盐氮(mg/L)
4
要求掌握内容 计算机操作
配对比较的秩和检验 两样本比较的秩和检验 多个独立样本比较的秩和检验
结果的表达
5
配对比较的秩和检验
例1、某研究者欲研究保健食品对小鼠抗疲劳作用,将同种属的小鼠按性 别和年龄相同、体重相近配成对子,共10对,并将每对中的两只小鼠随 机分到保健食品两个不同的剂量组,过一定时期将小鼠处死,测得其肝 糖原含量(mg/100g),结果见表1,问不同剂量组的小鼠肝糖原含量有 无差别?
秩和检验

某药对两种病情的老年慢性支气管炎患者的疗效
合 计 秩次范围 平均秩 次 秩 单纯性 和 肺气肿
控 制 显 效 有 效 无 效 合 计
65 42 107 1~107 18 6
54
3510 2151 4740
2268 717 3634
24 108~131 119.5 53 132~184 158
30 23 13 11
(2)大样本时,正态近似法:
| T n( n 1 ) / 4 | 0.5 u n( n 1 )( 2n 1 ) / 24
校正公式:(当相持个数较多时)
u | T n( n 1 ) / 4 | 0.5 ( t3 tj ) n( n 1 )( 2n 1 ) j 24 48
12 342 602 262 H 3(15 1) 6.32 15(15 1) 5 5 5
2 i
Hc H C
分子为H值,分母C为校正数,
tj C 1 N N 校正后,Hc>H,P值减小。
3 j 3
t
HC 1
H ( t3 tj ) j N3 N
此例n1=82,n2=126,n2-n1=44, 用正态分布法。求u值
计算校正的uc值,即:
8780.5 82 208 1 / 2 0.5 u 0.4974 82 126 208 1) 12 ( /
tj ( 3 107 243 24 533 53 243 24 107 )( )( )( ) C 1 1 0.8443 3 N N 208 208
3 j 3
t
0.4974 uc 0.541 0.8443
秩和检验

1、建立假设及确定检验水准 H0:差值总体水平为0。 H1:差值总体水平不为0。 α =0.05 2、计算T值 (1)求差:算出每对差值 (2)编秩:按差值绝对值大小从小到大编秩,并冠以 原差值的正负号。 A 若差值为0,可删去不计,不编秩。 B 若差值的绝对值相等,符号相反,则以平均秩 次作为每一个差值的秩次,保留原差值符号。 C 若差值完全相等,则按原秩号,不必平均。 (3)求秩和:将正负秩次分别相加,以秩和绝对值小 则为T。本例T=8。
3、确定值,判断结果。 (1)查表法:当n 50 时
得: T0.05,
若
11
= 10~56,( T0.01,
11
=
5~61)
T+ 或 T- :
落在范围内,则P>0.05; 落在范围外, 则P<0.05; 等于界值, 则P=0.05。
现T=8或58,故 0.01 < P<0.05
基本思想
注意:配对的对子数不能少于6。 本法的基本思想:若H0成立,则样本的正负秩和应较接近于T值的均数n(n+1 )/4,T值不会很小。若正负秩和相差悬殊,则T值特别小,则在H0成立的情况下, 由于抽样误差所至的可能性很小,当P<α 时,拒绝H0。 随着n增大,T的分布逐渐逼近均数为n(n+1)/4,方差为n(n+1)(2n+1) /24的正态分布。N>50时,可用u-T代替秩和检验。
本例 T = 170 查表得: T0.05,
(10,2) (10,2)
= 84~146
T0.01,
所以 P < 0.01
= 79~151
(2)正态近似法:
当超过附表的范围时(n1>10, n2 - n1 >10)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
1
1、M检验(Friedman查表法) H0穿四种防护服的脉搏次数分布相同; H1穿四种防护服的脉搏次数分布不全相
同。α=0.05 (1)按区组(受试者)编秩号,按处理(防护服分组)求秩和R1,R2,R3,…,相同 秩号取平均秩
(2)求平均秩: R 1 b(k 1)
2
(3)计算各处理组的 (Ri R);
适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
对于符合参数统计分析条件者,采用 非参数统计分析,其检验效能较低
秩和检验
秩和检验(rank sum test):一类常用 的非参数统计分析方法;基于数据的秩次与 秩次之和
第一节 第二节 第三节 第四节
两独立样本差别的秩和检验 配对设计资料的秩检验 完全随机设计多组差别的秩和检验 随机单位组设计的秩和检验
11
40
32
-8
-6
12
49
57
8
6
合计
T=10(68)
Md=0
(i)小样本(5≤n≤ 50)时,查附表9
若统计量T值在上、下界值范围内, 其P值大于相应的概率水平。
本例:T=10,n=12,查附表9,双侧检验
的界值区间(13,65),T位于区间外, 得P<0.05,拒绝H0,接受H1,故认为A, B两种照射方式造成的急性皮肤损伤程度 不同,B照射的损伤程度比A照射严重。
n1
n2
N n1 n2 n0 min( n1, n2 )
⑴ H0:两样本来自相同总体; H1:两样本来自不同总体(双侧)
=0.05
或H1:样本A高于样本B(单侧)
⑵ 编秩:两样本混合编秩次,求得R1、R2、T。 相同观察值(即相同秩,ties),不同组------平均秩次。
⑶ 确定P值作结论:
(ii)大样本(n>50)时,可采用正态近似
u | R n(n 1) / 4 | 10 12(12 1) / 4 2.275 n(n 1)(2n 1) / 24 12(12 1)(2 12 1) / 24
查标准正态分布表,得 P 值 校正公式:(当相同秩次个数较多时)
| R n(n 1) / 4 |
①查表法 (n0≤10,n2n1≤10)
如果T位于检验界值区间内,P
查附表9
,不拒绝H0;否则,P
,拒绝H0
本例T =47,取α=0.05,查附表10得双侧检验界值区间(49,87),T
位于区间外,P<0.05,因此在α=0.05的水平上,拒绝H0,接受H1。
②正态近似法:
|T u
n0 (N 1) / 2 |
验
一般文献上使用的方法:Wilcoxon_Mann_Whitney U 检验
两种方法是独立提出的,检验结果完全等价的;
前者用 T 统计量计算 u 统计量,而后者直接计算 u 值,即:
u
min(n1
n2
n1 (n1 2
1)
R1 , n1
n2
n2 (n2 2
1)
R2 )
上例中:
u min(126 82 126 127 12955.5,126 82 82 83 8780.5)
第一节 两独立样本差别的秩和检验
Wilcoxon rank sum test
表6-1 两独立样本秩和检验计算表
对于计量数据,如果资料方差相
A样本 观察值 秩号
7
4
14
6
B样本 观察值 秩号
3
1
5
2
等,且服从正态分布,就可以用t检 验比较两样本均数。
如果此假定不成立或不能确定是 否成立,就应采用秩和检验来分析 两样本是否来自同一总体。
• 同样方法,通过对各个处理组的数据由 小到大分别编秩,计算平均秩次,推断 各区组间差别有无统计学意义。
2、 2分布近似法
• 能用于k值或b值超过M界值的情况
二、多组处理效应间的两两比较 经Friedman秩和检验得多组处理效应 间存在差别时,仍然可进一步作各组间 两两比较
不满足方差分析的条件,可采用KruskalWallis秩和检验。
此法的基本思想与Wilcoxon-MannWhitney法相近:如果各组处理效应相同, 混合编秩号后,各组的秩和应近似相等。 既可用于观察指标是定量变量但不满足方差 分析的前提条件的情形,也可应用于观察指 标是有序变量的情形。
单因素多水平设计定量资料
4. 计算统计量
H
12 993(993 1)
383352 97
4238762 838
313102 58
3(993 1)
14.3
(ti3 ti ) =(1723172)+(3423342)+(4793479)=154991382
c
9933 993
1.1881
9933 993 154991382
表 6-4 脾淋巴细胞对 HPA 刺激的增值反应(测量指标 3H 吸收量 cpm)
A 组(对照)
B 组(截肢)
C 组(截肢治疗)
3H 吸收量
秩号 3H 吸收量 秩号 3H 吸收量 秩号
3012
11
2532
8
8138
15
9458
18
4682
12
2073
6
8419
16
2025
5
1867
4
9580
19
2268
u
n(n 1)(2n 1) / 24 (ti3 ti ) / 48
10 12(12 1) / 4 2.282
12(12 1)(212 1) / 24 [(33 3) (33 3)]/ 48
第三节 完全随机设计多组差别的秩和检验
(Kruskal-Wallis法) 对于完全随机设计多组资料比较,如果
第六章
非参数统计分析方法
参数统计
(parametric statistics)
已知总体分布类型,对 未知参数(μ、π)进 行统计推断
依赖于特定分布类 型,比较的是参数
非参数统计
(nonparametric statistics)
对总体的分布类 型不作任何要求
不受总体参数的影响, 比较分布或分布位置
(4)求 M; M (Ri R)2
(5)查 M 界值表(附表 12),M 大于或等于表中数值则差别有统计
意义。 本例, R 1 5(5 1) 15
2
M (Ri R)2 34.5
当b≤15,k ≤ 15时查附表11.
• 查M界值表,b=5,k=5,M0.05=113,不 拒绝H0,穿不同防护服脉搏数差别无统 计学意义。
单因素多水平设计定性资料
属于同一组段的观察值,一律取平均秩次(组中
值),再以该组段频数加权,计算Hc值。
表 分娩时孕周与乳量的关系
乳 量
早 产
足月 产
过期 产
合计
秩次 范围
平均
秩和
秩次 早产 足月产 过期产
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)
无 30 132 10 172 1~172 86.5 2595 11418 865
12682(208 1) /12
uc u c 0.5426
207 208
单纯型合并肺气肿 单纯型
有效 近控
2083 208 c 2083 208 ((1073 107) (243 24) (533 53) (243 24))
1.0883
Wilcoxon-Mann-Whitney U检
少 36 292 14 342 173~514 343.5 12366 100302 4809
多 31 414 34 479 515~993 754 23374 312156 25636
合计 97 838 58 993
38335 423876 31310
1. H0:三个总体分布相同,H1:三个总体分布不全相同 α=0.05 2. 编秩:计算各等级合计,确定秩次范围 3. 求秩和:各组频数与该组平均秩次乘积求和
n1n2 (N 1) /12
本例u 2.205 0.05/2 1.96
*校正公式(当相同秩次较多时)
N3 N
uc u c; c N 3 N (ti3 ti ) ;
i
ti为第i个相同秩号的数据个数
疗效
控制 显效 有效 近控
单纯型 (1)
65 18 30 13 126
表6-2 某药对两种不同病情的支气管炎疗效的秩和检验
7
885
2
13590
21
2775
9
6490
13
12787
20
2884
10
9003
17
6600
14
1717
3
0
1
秩和 Ri 例数 ni
平均秩和 Ri
119 7
17.000
54 7
7.714
58 7
8.826
1.
H0三组处理效应相同;
H1三组处理效应不全相同。α=0.05
2.
混合编秩号,分组求秩和R1,R2,R3,…
2
2
4954.5 0.4986
第二节 配对设计资料的秩检验
(Wilcoxon signed rank test)
表6-3 家兔皮肤损伤程度(评分)
1.H0:差值的总体中位数=0 ,
家兔号 A照射 B照射 A-B
(1)
(2) (3) (4)
1
39
55
16
2
42
54
12
秩次 (5) 10