第十章 基于秩次的非参数检验
医学统计学 -第10章 基于秩次的非参数检验

H0:多个总体分布相同(或者中位数相等) H1:多个总体分布不同或不全相同(或者中位数不全相等)
26
例10.5
某医院用3种方法治疗15例胰腺癌患者,每种方 法各治疗5例,治疗后生存月数如下表,问3种方法的 疗效有无差别?
当n≤50时,通过查T界值表来确定是否波动过
大
T在界值范围内,波动不大
P>α
T在界值范围外或等于界值时,波动大,P≤α
11
(4) 查表及推断结论 查T界值表T0.05(16)=29~107 由于T=28在上下界值范围外,所以P≤0.05。 按a=0.05检验水准拒绝H0,接受H1,可以 认为该厂工人尿铅含量不当地正常人有差异, 通过正负秩和的大小可以推断工人的尿铅含 量要高于正常人。
第十章 基于秩次的非参数检验
1
假设检验的方法分为两类
参数检验(parametric test)
已知总体分布类型,对未知参数(μ、π)进行统计推断 依赖于特定分布类型,比较的是参数 一般有严格的适用条件
如:样本来自正态分布、总体方差齐同等 这类方法比如:t检验、F检验等
非参数检验(nonparametric test)
Z
T n1(N 1) / 2 0.5
n1n2 (N 3 N
12N(N 1)
(t
3 j
t
j
))
2036 40(84 1) / 2 0.5
40 44 (843 84 (323 32) (323 32) (203 20)) 12 40 (84 1)
7.01
由于Z=7.01,大于Z0.05=1.96,所以P<0.05,按照α=0.05 检验水准拒绝H0,接受H1,可以认为夏冬两季居民体 内核黄素含量有差别。根据平均秩次可以知道夏季的含
基于秩次的非参数检验

基于秩次的非参数检验1. 问题的提出前面学习了连续型资料两组样本均数差异的假设检验方法:小样本用t检验,条件是变量服从正态分布和方差齐;大样本用标准正态分布的Z检验。
如果是小样本,变量的分布不清,或者已知不服从正态分布或经变量转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢?需要一种不依赖于分布假定的检验方法,即非参数检验。
2. 基本概念前面介绍的检验方法首先假定分析变量服从特定的已知分布(如正态分布),然后对分布参数(如均数)作检验。
这类检验方法称参数检验(parametric test)。
今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量的中心位置或分布位置作比较。
这类检验称非参数检验(nonparametric test),由于其对总体分布不作严格假定,所以又称任意分布检验。
(distribution-free test)非参数检验的优点:a.不受总体分布的限制,适用范围广。
b.适宜定量模糊的变量和等级变量。
c.方法简便易学。
缺点:如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布(如正态分布),这时人为地将精确测量值变成顺序的秩,将丢失部分信息,造成检验功效能下降。
基于秩次非参数检验(秩和检验)的基本思想假设变量X有观察值1.1, 1.3, 1.7, 4.3, 11.4显然这变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。
但如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。
然后对这秩分布的中心位置(中位数)作检验,这就是秩和检验。
7.1 配对样本的符号秩检验(Wilcoxon signed rank test)例7.1为研究出生先后的孪生兄弟间智力是否存在差异,12对孪生兄弟测试的结果见表7.3。
表7.3 12对孪生兄弟测试结果T +=24.5,T -=41.5符号秩检验的分布理论:假定有4个差值,如果H 0成立时,这4个差值有同等的概率取正值或负值,即每个值取正值的概率等于1/2。
10非参数秩和检验

n2=7
T2=134
Kruskal-Wallis test
(1) 建立假设检验
H0:四组鼠脾DNA含量的总体分布相同
H1:四组鼠脾DNA含量的总体分布位置不全相同 α=0.05
(2) 计算统计量
‣ 四个样本总例数N=8+7+9+8=32。将四样本32个观
察值统一由小到大编秩,见上表第(2)、(4)、(6)、 (8)列。在不同组中有相同含量值10.3两个,12.3三 个,均取各自的平均秩次。
Kruskal-Wallis test
Ti 2 12 H 3( N 1) N ( N 1) ni 1262 1342 123.5 2 54.5 2 12 3( 32 1) 19.90 32( 32 1) 8 7 9 8
Wilcoxon rank sum test
(3) 查表及结论
‣ n=n2-n1,查T界值表T0.05(4)=91~159,
两组患者的平均生存时间不同。
T1=162
落在界值范围外,所以P<0.05,拒绝H0,认为
二、正态近似法
例10-3 44例健康人与24例慢性气管炎病人痰液嗜酸 性粒细胞数的测量值(×106/L),问健康人与慢性 气管炎病人痰液嗜酸性粒细胞数有无显著差别?
0
计量 T 与总体的平均秩和应该相差不大;当与平均
秩相差太大时,超过了抽样误差可以解释的范围,
则 有 理 由 怀 疑 原 假 设 的 正 确 性 , 从 而 拒 绝 H0 。
(刘启贵)
的血清抗体滴度水平间差异是否有统计学意义?
抗体 滴度 (1) 1:10 1:20 1:40 1:80 1:160 1:320 合计 气 雾 组 皮下注 80亿 100亿 射组 (2) (3) (4) 2 15 10 5 1 — 33 4 7 12 7 2 — 32 2 1 13 9 5 1 31 累计 平均 秩次 (6) 4.5 20 49 77 91.5 96 秩 80亿 (7) 9 300 490 385 91.5 — 1275.5 100亿 (8) 18 140 588 539 183 — 1468 和 皮下 (9) 9 20 637 693 475.5 96 1912.5 和
第十章基于秩次的非参数检验课件

缺点:方法比较粗糙,对于符合参数检验条件者,采用
非参数检验会损失部分信息,其检验效能较低;样本含
2020/9/24量较大时,两者结论常相同
10
一、非参数统计的概念
秩次:观察值由小到大排列后得到的秩序号, 当几个数据大小相同时,取平均秩次作 为其秩次。
秩和:用秩次代替原始数据求和得到。 秩和检验:用秩和进行假设检验的方法。
(甲,乙,丙,丁,戊)(很好,好,一般,差)
2020/9/24
等级资料?
2
以下资料如何进行统计推断呢?
•不服从正态分布的资 料 •多组资料满足正态分 布但方差不齐 •等级资料
2020/9/24
非参数检验方法!
3
第十章 基于秩次的非参数检验
nonparametric test
第十章 基于秩次的非参数检验
2020/9/24
11
本章介绍的非参数统计方法 均基于秩次
秩次(rank)——将数值变量值从小到大,或等级变量值从弱到
强所排列的序号。
例1 11只大鼠存活天数:
存活天数4,10,7,50,3,15,2,9,13,>60,>60
秩次 3 6 4 9 2 8 1 5 7 10 11
秩次相同(tie)取平均秩次!!
10.5 10.5
例2 7名 肺炎病人的治疗结果: 危险程度 治愈 治愈 死亡 无效 治愈 有效 治愈
秩次 1 2 7 6 3 5 4 平均秩次 2.5 2.5 7 6 2.5 5 2.5
2020/9/24
12
二、配对设计和单样本资料的符号秩和检验
(一)、 配对设计资料的符号秩和检验
例10-1 某研究者欲研究保健食品对小鼠抗疲劳作用,将同 种属的小鼠按性别和年龄相同、体重相近配成对子,共10 对,并将每对中的两只小鼠随机分到保健食品两个不同的 剂量组,过一定时期将小鼠杀死,测得其肝糖原含量 (mg/100g),结果见表10-1, 问不同剂量组的小鼠肝糖 原含量有无差别?
基于秩次的非参数检验PPT课件

表10-4 某地居民夏冬两个季节体内核黄素营养状况比较
核黄素 营养状况
例数
夏季
冬季
合计 累积频数 秩次范围 平均秩次
缺乏
10
22
32
32
1~32
16.5
不足
14
18
32
64
33~64 48.5
适宜
16
4
20
84
65~84 74.5
合计
40
44
84
-
-
n140 T11.5 61 04.5 81 47.5 41 62036
绝对值|d| 1.88 1.72 0.37 0.02 0.04 0.18 0.23 0.51 0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
秩次 12 10 5 1 2 3 4 6 7 8 9 12 12 14 15 16
分配符号 -12 -10 -5 -1 2 3 4 6 7 8 9 12 12 14 15 16
9
3
14.9
13.5
1.4
3
3
4
30.2
27.6
2.6
8
8
5
8.4
9.1
-0.7
1.5
-1.5
6
7.7
7.0
0.7
1.5
1.5
7
16.4
14.7
1.7
5
5
8
19.5
17.2
2.3
6
6
9
127.0
155.0
-28.0
10
-10
10
18.7
16.3
第十章 基于秩次的非参数检验(本)_PPT幻灯片

(二)正态近似法
若n>25,超出T界值表的范围,可用正态 近似法作Z检验:
T nn 1 4
T n(n 1)(2n 1)/ 24
Z T T T nn 1 4 0.5
T
n(n 1)(2n 1)/ 24
式中0.5为连续性校正数。
如果相同秩次较多(不包括差值为0 者),应计算校正的Zc。
T nn1 4 0.5
0
77
65
-12
-10
91
90
-1
-1.5
70
65
-5
-5.5
71
80
9
9
88
81
-7
-8
87
72
-15
-11
T+=24.5, T-=41.5
H0:Md=0 (M1=M2) H1:Md≠0 (M1≠M2) α=0.05 求各对子的差值d; 编秩:按差值绝对值大小编秩并加上正负号,差值的绝对值
相同时取平均秩次;
治疗后 4.2 5.5 6.3 3.8 4.4 4.0 5.9 8.0 5.0
差值(d)
秩次
1.8
6.5
-0.7
-4.5
-1.8
-6.5
-0.4
-3
2.6
8
-0.2
-2
0.1
1
-4.5
-9
-0.7
-4.5
T+=15.5, T-=29.5
(二)方法步骤
H0:Md=0 H1:Md≠0
α=0.05
求各对子的差值d;
H0:Md=0 (即M=2.15) H1:Md>0 (即M>2.15) 单侧α=0.05
《医学统计学》第十章+非参数秩和检验

0.05
,即两个不同部位IL-6水平差值的总体中位数不为零
医学统计学(第7版)
符号秩和检验方法
(2)编秩次并求秩和统计量
首先求出各对数据的差值,见表的第(4)列;然后编秩次,按照差值绝
对值由小到大编秩,并按差值的正负给秩次加上正负号;若差值为“0”,舍
去不计,总的对子数也要减去此对子数(记为 n);若差值的绝对值相等,取
➢ 查表法:查 T 界值表(附表8),
T0.05(23) 73 ~ 203
,
T T 91 73
T 在此范围内,P >0.05, 按 α=0.05水准无理由拒绝 H0 ,即实行良好
的口腔卫生6个月后,尚不能说明此项干预对牙周改善有显著效果。
,
医学统计学(第7版)
(3) 确定P 值,做出推断
检测结果如下表(书中表10-1所示) 。
白癜风病人的不同部位白介素指标(pg/ml)
病人号
(1)
白斑部位
(2)
正常部位
(3)
d=(3)-(2)
秩次
(5)
1
2
3
4
5
6
7
8
合计
40.03
97.13
80.32
25.32
19.61
14.50
49.63
44.56
88.57
88.00
123.72
39.03
24.37
上表中第(1)列按第(2)与(3)列数据统一编秩号,第(5)列为各等级的平均秩次,
第(6)列则是较小样本的秩和,本例中 T=T1=560.5, 将其代入公式得出:
zc
| T n1 ( N 1) / 2 | 0.5
第10章基于秩次的非参数检验教案

2662.5
1384.5
显效
27
37
64
126- 189
157.5
4252.5
5827.5
合计
69
120
189
7663
10292
H 0 : 两 种 药 物 疗 效 的 总 体 分 布 相 同
H 1 : 两 种 药 物 疗 效 的 总 体 分 布 相 同
0 .0 5
①先确定各等级的合计人数、秩范围和平 均秩,见表10-4的(4)栏、(5)栏和(6) 栏,再计算两样本各等级的秩和,见(7)栏 和(8)栏;
①省略所有差值为0的对子数,令余下的有效 对子数为n,见表10-1第(4)栏,本例 n=10;
➢若多个差值为0,可通过提高测量工具的精 度来解决。
②按差值的绝对值从小到大编秩,然后分别 冠以正负号。遇差值绝对值相等则取平均秩,称为 相同秩(ties)(样本较小时,如果相同秩较多, 检验结果会存在偏性,因此应提高测量精度,尽量 避免出现较多的相同秩), 表10-1第(4)栏差值的 绝对值为2.29有2个,其秩依次应为1,2,皆取平 均秩为1.5,见表10-1第(5).
式(10-4)计算校正的统计量值 Zc。
Zc
T n(n 1)/ 4 0.5
n(n 1)(2n 1)
(t
3 j
t
j
)
24
48
(10-4)
式中tj 为第j(j=1,2…)次相持所含相同秩次的个数。如例10-1,第1 次相持,
有两个差值的绝对值均为 2.29,则 t1=2;第 2 次相持,有两个差值均为 11.54,
由于秩统计量的分布与原数据总体分布
无关,具有较好的稳健性,可用于任何分 布类型的资料。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十章基于秩次的非参数检验习题
一、选择题
1.两小样本均数比较,方差不齐时,下列说法不正确的是().
A. 采用秩和检验
B. 采用t′检验
C. 仍用t检验
D. 变量变换后再作决定
E. 要结合正态性检验结果方能作出决定
H是().
2. 两样本秩和检验的
A. 两样本秩和相等
B. 两总体分布相同
C. 两样本分布相同
D. 两总体秩和相等
E. 两总体均数相等
3. 在统计检验中是否选用非参数统计方法().
A. 要根据研究目的和数据特征作决定
B. 可在算出几个统计量和得出初步结论后进行选择
C. 要看哪个统计结论符合专业理论
D. 要看哪个P值更小
E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用
4. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是().
A. T越大,P值越小
B.T越大,P值越大
C. T值在界值范围内,P值小于相应的α
D. T值在界值范围内,P值大于相应的α
E. T值在界值范围上,P值大于相应的α
5. 成组设计两样本比较的秩和检验,其检验统计量T是().
A. 为了查T界值表方便,一般以秩和较小者为T
B. 为了查T界值表方便,一般以秩和较大者为T
C. 为了查T界值表方便,一般以例数较小者秩和为T
D. 为了查T界值表方便,一般以例数较大者秩和为T
E. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表
多样本定量资料比较,当分布类型不清时应选择().
A. 方差分析
B. t检验
C. Z检验
D. Kruskal-Wallis检验
E. Wilcoxon检验
6. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后
H值,则会().
的
c
A.提高检验的灵敏度
B.把一些无差别的总体推断成有差别
C. 把一些有差别的总体推断成无差别
D.Ⅰ、Ⅱ类错误概率不变
E. 以上说法均不对
二、简答题
1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法?
2. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”?
3. 多组定量资料比较时,统计处理的基本流程是什么?。