秩转换非参数检验PPT课件
合集下载
医学统计学非参数检验秩和检验详解(ppt)

T 与平均秩和应相差不大
T = 较小例数组的秩和, n1 ≠n 2 min( R1, R 2 ), n1 = n 2
4.确定P值和作出推断结论
当n1<=10或(n2-n1)<=10时,查表P值
当n1>10或(n2-n1)>10时,则可采用正 态近似法求u(Z)值来确定P值,其公式
如下:
1
T - 2 n1 (n +1) - 0.5
• 排队的优点 广泛适用于多种分布
• 排队的结果 将原始数据的比较转化为秩次的比较
秩次(rank)——将数值变量值从小到大,或等级变量值从弱到强 所排列的序号。
例1 11只大鼠存活天数: 存活天数4,10,7,50,3,15,2,9,13,>60,>60
秩次
3 6 4 9 2 8 1 5 7 10 11 10.5 10.5
应用非参数检验的情况
1.不满足正态和方差齐性条件的小样本资料; 2.总体分布类型不明的小样本资料; 3.一端或两端是不确定数值(如<0.002、>
65等)的资料(必选); 4.单向(双向)有序列联表资料; 5. 各种资料的初步分析。
方法的起点--排队与秩次
• 统计描述中排秩思想的成功应用 百分位数、中位数
• 第三步:非参数检验(2)
• 第四步:结果解读(1)
结果解读:例数、均数、标准差、中位数、四分 位间距等。标准差较大
• 第四步:结果解读(2)
结果解读: Z=3.630,P=0.000
【例2】20名正常人和32名铅作业工人尿铅定性检 查结果如表。问铅作业工人尿铅是否高于正常人?
结果
-
+
++ +++ ++++
T = 较小例数组的秩和, n1 ≠n 2 min( R1, R 2 ), n1 = n 2
4.确定P值和作出推断结论
当n1<=10或(n2-n1)<=10时,查表P值
当n1>10或(n2-n1)>10时,则可采用正 态近似法求u(Z)值来确定P值,其公式
如下:
1
T - 2 n1 (n +1) - 0.5
• 排队的优点 广泛适用于多种分布
• 排队的结果 将原始数据的比较转化为秩次的比较
秩次(rank)——将数值变量值从小到大,或等级变量值从弱到强 所排列的序号。
例1 11只大鼠存活天数: 存活天数4,10,7,50,3,15,2,9,13,>60,>60
秩次
3 6 4 9 2 8 1 5 7 10 11 10.5 10.5
应用非参数检验的情况
1.不满足正态和方差齐性条件的小样本资料; 2.总体分布类型不明的小样本资料; 3.一端或两端是不确定数值(如<0.002、>
65等)的资料(必选); 4.单向(双向)有序列联表资料; 5. 各种资料的初步分析。
方法的起点--排队与秩次
• 统计描述中排秩思想的成功应用 百分位数、中位数
• 第三步:非参数检验(2)
• 第四步:结果解读(1)
结果解读:例数、均数、标准差、中位数、四分 位间距等。标准差较大
• 第四步:结果解读(2)
结果解读: Z=3.630,P=0.000
【例2】20名正常人和32名铅作业工人尿铅定性检 查结果如表。问铅作业工人尿铅是否高于正常人?
结果
-
+
++ +++ ++++
秩转换的非参数检验

2)正态近似法:大样本时 (n≥50时), 可按式11-1计算统计量u值,作正态检验:
| T-n(n+1) / 4|-0.5 u=
n(n+1)(2n+1) / 24
(11-1)
如有相同秩次,应用校正公式:
u=
| T n(n 1) / 4 | 0.5
n(n 1)(2n 1) 1
24
48
(t
3 j
Tests of Normality
Kolmogorov-Smirnova
Statistic
差值
.420
df
Sig.
8
.000
a. Lilliefors Significance Correction
Shapiro-Wilk
Statistic
df
.628
8
Sig. .000
Tests of Normality
第八章 秩转换旳非参数检验
癌症. 1997;16(3):219
用改良旳Seldinger’s插管技术对8例临床及病理证明旳恶性滋养细胞 肿瘤进行选择性盆腔动脉插管灌注化疗。治疗前后hCG放免测定值。 采用t检验进行分析,治疗前后血hCG值经统计学处理有明显性差别。
1、资料类型 2、何种设计 3、统计措施
差值对数
Kolmogorov-Smirnova
Statistic df
Sig.
.372
8 .002
Shapiro-Wilk
Statistic df
.559
8
a. Lilliefors Significance Correction
Sig. .000
参数统计
(parametric statistics)
医学统计学非参数检验秩和检验PPT课件

• 第一步:建立变量。
第29页/共155页
第二步:输入原始数据
第30页/共155页
第三步:加权个案
第31页/共155页
第四步:非参数检验
第32页/共155页
• 第五步:结果解读
结果解读:
第33页/共155页
基于秩次的非参数检验
两个独立样本比较的非参数检验 多个独立样本比较的非参数检验 配对样本比较的非参数检验 随机区组设计多个样本比较的非参数检
第120页共155页诊断试验金标准合计有病d无病d阳性t阳性似然比阴性似然比第122页共155页灵敏度sensitivityse漏诊率omissidiagnosti筛检无症状病人而且该病发病率较低诊断试验金标准合计有病d无病d阳性t诊断试验金标准合计有病d无病d阳性t特异度specificitysp误诊率mistakediagnostic将实际无病的人错误判断为患者的比例高特异度试验的适用范围确诊某病诊断试验金标准合计有病d无病d阳性t诊断试验金标准合计有病d无病d阳性t以产生漏诊和误诊之和最小时的数据确定临界值第125页共155页受试者工作特征曲线receiveroperatorcharacteristiccurve简称roc曲线表示一个特定的诊断方法对区别特定的患者组与非患者组样本的检测性能
当组数K=3,每组样本含量ni≤5 时,可查附表(H界值表)得到P值。
若k>3或ni>5时,H值的分布近 似于自由度为k-1的χ2分布,此时可 查χ2界值表得到P值。
最后按P值作出推断结论。
第39页/共155页
【例3】比较小白鼠接种三种不同菌型伤寒杆菌 9D、11C和DSC1后存活日数,结果见表。问 小白鼠接种三种不同菌型伤寒杆菌的存活日 数有无差别?
第29页/共155页
第二步:输入原始数据
第30页/共155页
第三步:加权个案
第31页/共155页
第四步:非参数检验
第32页/共155页
• 第五步:结果解读
结果解读:
第33页/共155页
基于秩次的非参数检验
两个独立样本比较的非参数检验 多个独立样本比较的非参数检验 配对样本比较的非参数检验 随机区组设计多个样本比较的非参数检
第120页共155页诊断试验金标准合计有病d无病d阳性t阳性似然比阴性似然比第122页共155页灵敏度sensitivityse漏诊率omissidiagnosti筛检无症状病人而且该病发病率较低诊断试验金标准合计有病d无病d阳性t诊断试验金标准合计有病d无病d阳性t特异度specificitysp误诊率mistakediagnostic将实际无病的人错误判断为患者的比例高特异度试验的适用范围确诊某病诊断试验金标准合计有病d无病d阳性t诊断试验金标准合计有病d无病d阳性t以产生漏诊和误诊之和最小时的数据确定临界值第125页共155页受试者工作特征曲线receiveroperatorcharacteristiccurve简称roc曲线表示一个特定的诊断方法对区别特定的患者组与非患者组样本的检测性能
当组数K=3,每组样本含量ni≤5 时,可查附表(H界值表)得到P值。
若k>3或ni>5时,H值的分布近 似于自由度为k-1的χ2分布,此时可 查χ2界值表得到P值。
最后按P值作出推断结论。
第39页/共155页
【例3】比较小白鼠接种三种不同菌型伤寒杆菌 9D、11C和DSC1后存活日数,结果见表。问 小白鼠接种三种不同菌型伤寒杆菌的存活日 数有无差别?
基于秩次的非参数检验PPT课件

表10-4 某地居民夏冬两个季节体内核黄素营养状况比较
核黄素 营养状况
例数
夏季
冬季
合计 累积频数 秩次范围 平均秩次
缺乏
10
22
32
32
1~32
16.5
不足
14
18
32
64
33~64 48.5
适宜
16
4
20
84
65~84 74.5
合计
40
44
84
-
-
n140 T11.5 61 04.5 81 47.5 41 62036
绝对值|d| 1.88 1.72 0.37 0.02 0.04 0.18 0.23 0.51 0.63 0.77 1.04 1.88 1.88 2.55 3.58 8.77
秩次 12 10 5 1 2 3 4 6 7 8 9 12 12 14 15 16
分配符号 -12 -10 -5 -1 2 3 4 6 7 8 9 12 12 14 15 16
9
3
14.9
13.5
1.4
3
3
4
30.2
27.6
2.6
8
8
5
8.4
9.1
-0.7
1.5
-1.5
6
7.7
7.0
0.7
1.5
1.5
7
16.4
14.7
1.7
5
5
8
19.5
17.2
2.3
6
6
9
127.0
155.0
-28.0
10
-10
10
18.7
16.3
第十章 基于秩次的非参数检验(本)_PPT幻灯片

(二)正态近似法
若n>25,超出T界值表的范围,可用正态 近似法作Z检验:
T nn 1 4
T n(n 1)(2n 1)/ 24
Z T T T nn 1 4 0.5
T
n(n 1)(2n 1)/ 24
式中0.5为连续性校正数。
如果相同秩次较多(不包括差值为0 者),应计算校正的Zc。
T nn1 4 0.5
0
77
65
-12
-10
91
90
-1
-1.5
70
65
-5
-5.5
71
80
9
9
88
81
-7
-8
87
72
-15
-11
T+=24.5, T-=41.5
H0:Md=0 (M1=M2) H1:Md≠0 (M1≠M2) α=0.05 求各对子的差值d; 编秩:按差值绝对值大小编秩并加上正负号,差值的绝对值
相同时取平均秩次;
治疗后 4.2 5.5 6.3 3.8 4.4 4.0 5.9 8.0 5.0
差值(d)
秩次
1.8
6.5
-0.7
-4.5
-1.8
-6.5
-0.4
-3
2.6
8
-0.2
-2
0.1
1
-4.5
-9
-0.7
-4.5
T+=15.5, T-=29.5
(二)方法步骤
H0:Md=0 H1:Md≠0
α=0.05
求各对子的差值d;
H0:Md=0 (即M=2.15) H1:Md>0 (即M>2.15) 单侧α=0.05
第八章秩转换的非参数检验

3 j
T n1 ( N 1) / 2
C
校正
(33 3) (313 31) (273 27) (143 14) (43 4) C 1 0.8940 3 79 79
u 1917 39 (79 1) / 2 39 40 (79 1) 0.8940 12 3.7023
单个样本中位数与总体中位数比较
介绍思路
(P125) 假设:M=45.3 求差、编秩、求和 查表:n=11、T=1.5,P<0.005, (u= 2.8),差别有统计学意义,可认为该 厂工人的尿氟含量高于当地正常人 的尿氟含量。
**第二节 两个独立样本 比较的Wilcoxon秩和检验
(Wilcoxon rank sum test)
表 8–6
含量
(1) 很低 低 中 偏高 高 合计 (2) 1 8 16 10 4 39(n1)
吸烟工人和不吸烟工人的 HbCO(%)含量比较
合计
(4) 3 31 27 14 4 79
吸烟工人 不吸烟工人
(3) 2 23 11 4 0 40(n2)
秩范围
(5) 1~3 4~34 35~61 62~75 76~79 —
*一、多样本比较的秩和检验
1.建立检验假设: H0:三个处理组总体分布相同; H1:三个总体的分布不同或不全相同。 =0.05。 2.计算 编秩:将各组由小到大排队,再将三个组的数据统一 编秩。 编秩中, 若有相同的数据在同一组内,其秩次按位置顺序编号; 若相同的数据在不同组内,则取其平均秩次。 求秩和:将各组秩次相加,得Ri。
二、频数表资料的多样本比较
表 8-11
白细胞 ⑴ + ++ +++
T n1 ( N 1) / 2
C
校正
(33 3) (313 31) (273 27) (143 14) (43 4) C 1 0.8940 3 79 79
u 1917 39 (79 1) / 2 39 40 (79 1) 0.8940 12 3.7023
单个样本中位数与总体中位数比较
介绍思路
(P125) 假设:M=45.3 求差、编秩、求和 查表:n=11、T=1.5,P<0.005, (u= 2.8),差别有统计学意义,可认为该 厂工人的尿氟含量高于当地正常人 的尿氟含量。
**第二节 两个独立样本 比较的Wilcoxon秩和检验
(Wilcoxon rank sum test)
表 8–6
含量
(1) 很低 低 中 偏高 高 合计 (2) 1 8 16 10 4 39(n1)
吸烟工人和不吸烟工人的 HbCO(%)含量比较
合计
(4) 3 31 27 14 4 79
吸烟工人 不吸烟工人
(3) 2 23 11 4 0 40(n2)
秩范围
(5) 1~3 4~34 35~61 62~75 76~79 —
*一、多样本比较的秩和检验
1.建立检验假设: H0:三个处理组总体分布相同; H1:三个总体的分布不同或不全相同。 =0.05。 2.计算 编秩:将各组由小到大排队,再将三个组的数据统一 编秩。 编秩中, 若有相同的数据在同一组内,其秩次按位置顺序编号; 若相同的数据在不同组内,则取其平均秩次。 求秩和:将各组秩次相加,得Ri。
二、频数表资料的多样本比较
表 8-11
白细胞 ⑴ + ++ +++
秩转换的非参数检验 ppt课件

35
T
较小例数组的秩和, min(R1 ,R 2 ),n1 n2
n1
n2
N n1 n2
n0 min( n1 ,n2 )
较小例数组的平均秩和为: n0(1 N)/2
若H0成立,T值应接近 n0(1 N)/2 ,若T值严重偏离
n0(1 N)/2,则提示H0可能是不正确的。小样本时,
(2)余下的 n 个差数按绝对值自小至大排秩号,但排好后秩号
要保持原差数的正负号;
(3)差数绝对值相等时,要以平均秩号表示;
3.求秩号和,即将正、负秩号分别相加,正负秩号绝对值之
和应等于 n(n 1) / 2 ,可用以核对。
ppt课件
21
4. 检验统计量 T 取较小一个秩和(或任取),根据 T 值查附表 9 进行判断,该表左侧为对子数,表身内部 是秩和,与上端纵标目之概率相对应。 判断标准:
(ti3 ti ) / 48
注意:仍为非参数检验
ppt课件
25
2.配对设计等级资料的符号秩检验
1. 把等级从弱到强转换成秩,如某指标的检测结果 为-,+,++,+++,可转化为相应的秩次1,2, 3,4;
2. 求各对秩次的差值,省略所有差值为0的对子数, 令余下的有效对子数为n;
3. 按n个差值编正秩与负秩,求正秩和与负秩和 注意:由于等级资料相同秩多,此时小样本的检 验结果会存在偏性,最好用大样本。
528
偏高 10
4
14 62~75 68.5
总秩和 : TA+TB=12(12+1)/2=78
ppt课件
11
A组(x) 3, 5, 7, 9 11
秩和检验 PPT课件

结果为有序分类变量时无法使用。 例:尿糖检测结果
样本数据两端有不确定值时无法使用。 例:仪器性能限制,超出可测量范围
以上情况下强行使用参数统计方法可能会得到错误结论
非参数检验一般不直接用样本观察值作分析,统 计量的计算基于原数据在整个样本中按大小所占位 次。由于丢弃了观察值的具体数值,而只保留其大 小次序的信息,凡适合参数检验的资料,应首选参 数检验。但不清楚是否适合参数检验的资料,则应 采用非参数检验;尤其对于难以确定分布又出现少 量异常值的小样本数据,非参数检验在剔除这些数 据前后所得结论显示出其较好的稳健性。
表8-1 12份血清用原法和新法测血清谷-丙转氨酶的比较
编号 1 2 3 4 5 6 7 8 9
10 11 12 合计
原法 60 142 195 80 242 220 190 25 198 38 236 95 -
新法 76
152 243
82 240 220 205
38 243
44 190 100
-
本身在利用信息上就有丢失
Ⅰ型错误和Ⅱ型错误
真实结果
H0成立 H0不成立
由样本推断的结果
拒绝H0 Ⅰ型错误 α
不拒绝H0 推断正确(1-α)
推断正确(1-β) Ⅱ型错误β
(1-β)即把握度(检验效能)(power of a test):两总体确有差别,在α检验水准下,被检
出有差别的能力
(1-α)即可信度(confidence level):重复 抽样时,样本区间包含总体参数(m)的百分数
如:考试成绩的并列第三名 在默认情况下,秩和检验中的相同秩为它们按大小顺序 排列后所处位置的平均值。
非参数检验的方法很多,有符号检验、游程 检验、等级相关分析、秩和检验等。秩转换的 非参数检验(秩和检验)是在非参数检验中占 有重要地位且检验功效高的一种方法。
样本数据两端有不确定值时无法使用。 例:仪器性能限制,超出可测量范围
以上情况下强行使用参数统计方法可能会得到错误结论
非参数检验一般不直接用样本观察值作分析,统 计量的计算基于原数据在整个样本中按大小所占位 次。由于丢弃了观察值的具体数值,而只保留其大 小次序的信息,凡适合参数检验的资料,应首选参 数检验。但不清楚是否适合参数检验的资料,则应 采用非参数检验;尤其对于难以确定分布又出现少 量异常值的小样本数据,非参数检验在剔除这些数 据前后所得结论显示出其较好的稳健性。
表8-1 12份血清用原法和新法测血清谷-丙转氨酶的比较
编号 1 2 3 4 5 6 7 8 9
10 11 12 合计
原法 60 142 195 80 242 220 190 25 198 38 236 95 -
新法 76
152 243
82 240 220 205
38 243
44 190 100
-
本身在利用信息上就有丢失
Ⅰ型错误和Ⅱ型错误
真实结果
H0成立 H0不成立
由样本推断的结果
拒绝H0 Ⅰ型错误 α
不拒绝H0 推断正确(1-α)
推断正确(1-β) Ⅱ型错误β
(1-β)即把握度(检验效能)(power of a test):两总体确有差别,在α检验水准下,被检
出有差别的能力
(1-α)即可信度(confidence level):重复 抽样时,样本区间包含总体参数(m)的百分数
如:考试成绩的并列第三名 在默认情况下,秩和检验中的相同秩为它们按大小顺序 排列后所处位置的平均值。
非参数检验的方法很多,有符号检验、游程 检验、等级相关分析、秩和检验等。秩转换的 非参数检验(秩和检验)是在非参数检验中占 有重要地位且检验功效高的一种方法。