等级资料的秩和检验

合集下载

秩和检验

秩和检验
验统计量,即
T Tmin( n1orn2 )
3.确定P值范围并作推断
(1)当n1 ≤ 10且n2-n1≤10时,
查附表7的T界值表(P269)
(2)当n1>10或n2-n1>10时,按正态 近似公式(7.3)
相同秩次较多时,校正公式(7.4)
其中 为第j个相同秩次的个数。
二、等级资料的两样本比较(例7.4)
3. 编秩次 (1)d=0 舍去不计,用以检验的有效对子
数n相应减少。
(2)│d│同,取平均秩
4. 求秩和,并定检验统计量
T=T+ orT- (核对:T++T-=(n+1)n/2 )
5.确定P值范围并作推断
(1)当有效对子数n≤50,查附表6的
T界值表(P268)
(2)当n>50时,按正态近似公式(7.1) 相同秩次较多时,校正公式(7.2)
1. 建立检验假设,确定检验水准
H0:总体M1=M2,
即两总体分布位置相同;
H1:总体M1≠M2,
即两总体分布位置不同; α=0.05
2.计算检验统计量u 值
(1)编秩:本例为等级资料,先 按组段计算各等级的合计人数,再 确定秩次范围及平均秩次。
(2)计算秩和,确定T 并求检验统 计量u 值:
以各组段的平均秩次分别与各等级例
在实际应用中,秩和检验法有多种具体化: 配对设计的两样本比较 成组设计两样本比较的秩和检验 成组设计多样本比较的秩和检验 多个样本两两比较的秩和检验
符号检验法
检验目标:X与Y是两个连续型总体,各有分布函数
F1(x)与 F2(x) ,现从中分别抽取两个独立样本 ( X1, X 2 , , X n )与 (Y1,Y2,...,Yn ) ,要在显著性水平

两独立样本秩和检验等级资料

两独立样本秩和检验等级资料

2020/6/8
卫生统计学教研室
多个独立样本秩和检验(计量资 料)
2020/6/8
卫生统计学教研室

结果
2020/6/8
卫生统计学教研室
LOGO
三、 例3 使用中药两与独西立药样治本疗秩百和日检咳验,(并等观级察资其料疗)效,
其数据如下所示。
表3 中西药治疗百日咳疗效比较
组别 治愈 好转 无效 合计
中药
58
35
16
109
西药
37
35
35
107
合计
96
70
50
216
2020/6/8
卫生统计学教研室
两独立样本秩和检验(等级资料)
2020/6/8
Wilcoxon W、Z值;
TEXT
TEXT
2.双侧P值:p=0.043,两组的
血铅值有统计学差异,由于铅
作业组的平均秩次10.19大于 非铅作业组5.50,故铅作业组 的血铅值大于非铅作业组。
检验两抽样总体的位置是否相同,Mann-Whitney U检验、Wilcoxon秩和检验及两组比较的的 2020K/6/8 ruskal-Wallis H检验完全等卫生价统计学。教研室
T值
H值 M值
2020/6/8
卫生统计学教研室
SHale Waihona Puke SS一般操作步骤➢ 计量资料 数据建立正态和方差齐性检验秩和检验
➢ 等级资料 数据建立数据加权秩和检验
2020/6/8
卫生统计学教研室
例1、有9个水一样、,分配别对用重比量较法和的硬秩度联和合检测定验(EDTA)法进
行检测,测得硫酸盐含量的两组资料如下表所示。

秩和检验【医学统计学】

秩和检验【医学统计学】

568.4
14.0
384.6
3.0
556.2
13.0
369.1
1.0
435.7
7.0
377.8
2.0
574.8
15.0
436.7
8.0
468.7
12.0
662.9
19.5
433.4
6.0
582.8
16.5
442.3
10.0
438.1
9.0
426.1
5.0
n1 10
T1 101
n2 12
T2 152
2.求检验统计量T 值
①省略所有差值为0的对子数,观察单位数减去0对子数 的个数 ②按差值的绝对值从小到大编秩,绝对值相等的差值若 符号不同取平均值,并保持原差值的正负号;
③任取正秩和或负秩和为T,本例取T-=3。
3. 确定P 值,作出推断结论
2020/8/8
15
检验步骤
查附表12 • 本例T=3,n=10,
3 9 6 8 7 -1 10 4 -2 5
T 52 T 3
2020/8/8
10
配对符号秩检验基本思想
• 当H0(差值的总体中位数Md=0)成立,任一配对差值出现正号、负号的 机会均等,秩和T-与T+的理论数也应相等为n(n+1)/4
• 可以证明:
• H0为真时,秩统计量T是对称分布 • H0非真时,T呈偏态分布
单纯⑴虚寒型 ⑵3 ⑶6 ⑷25 ⑸26 13 ⑻ 73
喘息虚寒型
1
3 10
9
3 26
虚寒阻塞型 16 28 61 27 ⑹9 141
2020/8/8
21

等级资料常用检验方法

等级资料常用检验方法

Value
5.244 5.346
Asymp. Sig. df
(2-sided)
2
.073
2
.069
5.046
1
.025
118
结论:
两组疗效的构成百分比差异无统 计学意义。
两组的疗效无差别。(×)
注意:
一般的χ2检验不适用于有序分类 资料——“等级”、“程度”、“优 劣”的比较分析。因为检验只利用 了两组构成比提供的信息,损失了 有序指标包含的“等级”信息。
该方法对K (K>2)组独立样本进行K个 总体分布函数相同假设的检验,是在 Wilcoxon秩和检验基础上扩展的方法, 称为K-W检验。
例2 对54例牙病患者的64颗患牙的根端形态不同分 为3种,X线片显示喇叭口状为A型,管壁平行状为B 型,管壁由聚状为C型
比较不同根端形态患牙的疗效有否差别。
表 3 不同根端形态分型的疗效比较
治疗组 对照组 合计 秩次范围 平均秩次
无效
6
有效
19
显效
35
合计
60
14
20
1-20 10.5
20
39
21-59
40
24
59 60-118 89
58
118
计算两组秩号并进行秩和检验
两组的平均秩号分别为: 治疗组:R1= (6×10.5+19×40+35×89)/60 =65.6 对 照 组 : R2= ( 14×10.5+20×40+24×89 ) /58=53.1
病情
疗效
极重



恶化
20
20
30
10

等级资料常用检验方法

等级资料常用检验方法

有效 35 24
显然,两组反映的信息是不同的,但由于两组的结构百分比无变化 (仅仅是位置不同),不改变检验结果。(χ2=5.224,P>0.05)
等级资料正确的统计分析方法:

非参数统计的秩和检验 Kendall 、spearman等级相关 CMH卡方检验 Ridit分析 线性趋势卡方检验 有序变量的Logistic回归分析
3、结果
Ranks GROUP RESULT 1 2 3 T o ta l N 18 24 22 64 M ean Rank 4 0 .9 2 3 0 .8 8 2 7 .3 9
H =6.528,P =0.038
T e s t S ta tis tic s RESULT C h i-S q u a re df A s ym p . S ig . 6 .5 2 8 2 .0 3 8
同样方法,对表2数据进行秩和检验,结果如下:
GROUP RESULT 1 2 T o ta l
N 60 58 118
M ean Rank 6 1 .5 7 5 7 .3 6
Sum of Ranks 3 6 9 4 .0 0 3 3 2 7 .0 0
μ =0.731,P>0.05
结论:两组疗效差异没有统计学意义。
病情 1 .0 0 0 . 240 .2 7 5 .0 0 0 240 1 .0 0 0 . 240 .3 2 0 .0 0 0 240
疗效 .2 7 5 .0 0 0 240 1 .0 0 0 . 240 .3 2 0 .0 0 0 240 1 .0 0 0 . 240
一、非参秩和检验
由于非参数检验法不考虑数据的分 布规律,检验不涉及总体参数,检验统 计量多是人们在总结经验的基础上创造 出来的,所以这类检验方法的特点是针 对性强。但是不同设计、不同目的所用 的非参数检验法是不同的。

医学统计学等级资料的秩和检验

医学统计学等级资料的秩和检验
排除异常值
在某些情况下,可以排除异常值以提高检验的稳定性。但应谨慎处理,确保不会排除对 总体分布有重要影响的值。
稳健统计方法
采用稳健统计方法可以在一定程度上减少异常值对检验结果的影响,如使用中位数、众 数等稳健统计量进行秩和检验。
06
秩和检验的展望
秩和检验的发展趋势
广泛应用
秩和检验作为一种非参数统计方法,在医 学、生物学、环境科学等秩和,判断 两组数据的优劣或差异性,从而 进行假设检验。
适用范围
适用于等级资料和连续变量资料, 尤其适用于小样本和不服从正态 分布的数据。
秩和检验的步骤
01
数据整理
对等级资料进行排序,并赋予相应 的秩。
确定检验统计量
根据秩和计算出检验统计量,如Z值、 H值等。
03
02
计算秩和
在蛋白质组学研究中,秩和检验 用于分析蛋白质表达水平在不同 样本之间的差异。
在其他领域的应用
环境卫生研究
在环境卫生研究中,秩和检验用于评估不同暴露水平对健康的影响。
心理学研究
在心理学研究中,秩和检验用于比较不同干预或实验条件下的心理状态或行为差异。
05
秩和检验的注意事项
样本量的问题
样本量过小
当样本量过小时,无法充分反映总体分布情况,可能导致 检验结果不准确。
等级资料
按照事物的属性特征进行等级划分所得的数据,如 疗效评价中的治愈、显效、好转、无效等。
计量资料
通过度量衡等方法获得的数据,如身高、体重等。
等级资料的特点
有序性
等级资料具有有序性,不同等级之间存在一定的顺序 关系。
差异性
不同等级之间存在差异,同一等级内的数据具有相似 性。
相对性

8章 秩和检验

对总体的分布类 型不作任何要求
不受总体参数的影响,比较 的是分布或分布位置
适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
非参数检验的优缺点
⒈ 优点 ①不受总体分布的限制,适用范围广。 ②不受资料类型的限制,可以是计量资料、 等级资料以及一端或两端无确切数据的资料。
2 .缺点 ① 对于符合参数检验条件的资料,如果用非参 数检验,没有充分利用资料提供的信息,检验 效能低于参数检验。
H0:猫和兔子在缺氧条件下生存时间总体 中位数相同
H1:猫和兔子在缺氧条件下生存时间总体 中位数不同
a=0.05
混合编秩 相等数值取平均秩 取较小样本的秩和记为T, 本例T=127.5 以n1及n2- n1查秩和检验临界值表(附表9)
附表9
P414
0.01 0.02 0.05 0.10
2.秩和(rank sum) ♀=1+3+4+5+8+9=30 ♂=2+6+7+10+11+12=48
3.秩和检验(rank sum test)
用数据排序的秩来代替原始数据进行 假设检验,这种方法称为秩和检验。
秩(rank) → 秩和(rank sum) →秩和检验(rank sum test)
适宜作秩和检验的资料
若T与平均秩和n1(N+1)/2相差很大,则会有u≥ u,表示
抽得T如此大、以及比T更大的样本统计量的概率不大于检验 水准,因而拒绝检验假设H0
正态近似检验,公式为:
u

T
n1N 1/ 2 0.5 n1n2 N 1/12
(8-3)
当相同秩次较多时, 应采用校正公式:

等级资料的统计学方法

等级资料,即有序分类数据,是在统计学中常见的一种数据类型。

这种数据的特点是各类别之间存在一定的顺序关系,但不具备等距性。

针对等级资料的统计学方法主要有以下几种:
一、秩和检验:秩和检验是一种非参数统计方法,其应用范围广,对于不满足正态分布的数据也可适用。

主要包括Wilcoxon秩和检验和Kruskal-Wallis H检验。

前者适用于两独立样本的比较,后者则适用于多个独立样本的比较。

二、Ridit分析:Ridit分析是一种用于处理等级资料的统计方法,其基本思想是将原始数据转换为Ridit值,这样就可以将等级资料转换为计量资料进行处理。

这种方法既保留了等级资料的顺序信息,又充分利用了数据的全部信息,因此具有较高的效率。

三、有序多分类Logistic回归:有序多分类Logistic回归适用于因变量为有序多分类的情况。

它通过分析自变量对因变量各类别发生概率的影响,来揭示自变量对因变量的作用。

四、累积比数Logit模型:累积比数Logit模型是一种处理等级资料的回归分析方法。

它假设因变量的各类别之间存在一种“累积”的关系,并通过构建Logit模型来估计这种关系。

这种方法可以有效地处理等级资料,并且能够处理存在缺失值的情况。

以上就是针对等级资料的几种主要统计学方法。

在实际应用中,应根据数据的具体特点和研究目的选择合适的方法进行统计分析。

秩和检验分析


不确定值
方差齐性检验(以两样本t检验数据为例)
两样本t检验
两组独立样本秩和检验
根据经验,百分率通常 不属于正态分布
本书中两样本秩和检验示例
???
正态性检验及方差齐性检验
重新按照两独立样本t检验进行计算,结果一样
完全随机设计多样本秩和检验
若数据或经过数据转换仍不满足方差分析的前提条件的, 需进行秩和检验 方法同两样本秩和检验 Kruskal-Wallis H检验,适用于多样本连续型变量的分析
如果二者相差太大,超出界值范围,则拒绝原假设
应用Wilcoxon配对符号秩和检验
配对样本秩和检验
完全随机设计的两组独立样本秩和检验
资料不服从正态分布 资料方差不齐(样本较小时,专业知识判断很重要) 欲推断两样本代表的两总体分布是否相同,即是否来自同 一总体 两组数据由大到小,统一编秩,遇相同数据,取平均秩次 分别求两组秩和 选样本例数较小组秩和为统计量T 查表法或软件计算 Mann-Whitney Wilcoxon 检验,亦称Mann-Whitney U 检验
统计软件R
单样本秩和检验
推断样本中位数与已知总体中位数是否相等(各观察值与 已知总体中位数之差) 因差值有正有负,所以有符号的区别,故称为符号秩和检 验 对差值进行正态性检验,不符合即进行Wilcoxon符号秩和 检验 秩次相加,正秩、负秩分别相加,取绝对值小的秩和为T 统计量,查表或软件计算P值
正态性检验—单样本举例
秩和检验
(Rank Sum Test) (Rank-Based Test)
参数检验与非参数检验
参数检验
– 来自于某种分布的总体或总体符合某种假设 – 是对总体参数进行的假设检验 – 总体均数或方差 – 如u检验,t检验,方差分析等

秩和检验


(1) 优 良 可 差 合计
(4) (5) 61 35 21 7 124 1~61 62~96 97~117 118~124 ---
(6) 31 79 107 121 ---
步骤 1
2 3 4
建立检验假设,确定检验水准 H0: 两种治疗方法疗效的总体分布相同 H1: 两种治疗方法疗效的总体分布不同 α=0.05 编秩 见表4(5)(6)(7)(8)栏 求秩和 见(7)(8)栏合计,T1=4566, T2=3184 确定统计量 本例 n1 42 10, 需要用近似正态检验。
如果n1或n2 n1 10, 可按正态近似用 u检验。
T n1 n1 n2 1 2 0.5 u n1n2 n1 n2 1 / 12
若资料中相同秩次太多,(如超过25%),应按下列公式校正
3
3 c 1 t 3 t / N N j j
u uc c
n1=10
T1=93
n2=10
T2=117
1
建立检验假设,确定检验水准
H0 : 两总体分布相同 H1 : 两总体分布不同 α=0.05
2 编秩 将两组数据由小到大混合编。 3 求秩和并确定统计量T 两组秩次分别求和。若两组例数相等,任取一 组的秩和为统计量,若两组例数不等,以样本例数较小者 对应的秩和为统计量。 4 确定P并作出推断结论 (1) 查表法 (P124 附表7)
当 n1 10且n2 n1 10时 本例 所对应的T界值为78~132。
n1 n,概率为双侧 0.05, 2
T1 93在该范围内,故 P 0.05;
按α=0.05检验水准,不拒绝 H0 差别无统计学意义,尚不能认为治疗之 前两组的 SB2 M 值的总体 分布的位置不同。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

H
12 496 (496 1)
86459.52 361
65450424
uc u C 3.3669/ 0.8766 3.5961 u0.01
P<0.01,按 =0.05水准,拒绝H0 ,接受H1,差异有统计学 意义。可认为复方猪胆胶囊治疗老年性慢性支气管炎喘息 型与单纯型的疗效有差别。
8.3 多组比较的秩和检验
Kruskal-Wallis法 先对所有数据编秩;
比“定量”粗,而比一般的“定性”细; 等级间既非等距,亦不能度量。
8.1 秩次与秩和
秩次(rank),秩统计量 是指全部观察值按某种顺序排列的位序;
秩和(rank sum) 同组秩次之和。
例8.1 编秩
A组: - 、、+、+、+、++ B组: +、++、++、++、+++、+++
A组:- ± + + + ++ 12 3 4 5 7
基本思想
如果H0 成立,即两组分布位置相同,
则A组的实际秩和应接近理论秩和n1(N+1)/2; (B组的实际秩和应接近理论秩和n2(N+1)/2)。
或相差不大。 如果相差较大,超出了预定的界值,则可认为
H0不成立。
A组
B组

实际秩和 25
53
78
理论秩和 n1(N+1)/2 n2(N+1)/2 N(N+1)/2
求秩和T
计算 H 统计量; 查 H 界值表,或2界值表,界定 P 值; 作出结论。
三种方剂的疗效比较
表 8.2 三种复方小叶枇杷治疗老年性慢性支气管炎疗效比较
疗效
例数
等级 老复方 复方 I 复方 II
合计 秩次范围
平均 秩次
老复方
秩和 复方 I
复方 II
(1)
(2)
(3)
控制 36
4
显效 115
39
39
78
差值
-14
14
0
抽样误差?
如果H0成立,则理论秩和与实际秩和之差纯粹由抽 样误差造成。
检验结果
如果H0成立,则按0.05水准,
A 组秩和之界值为26~52。 现A组的实际秩和为25,在界值之外,故拒
绝H0,接受H1,认为两组的分布位置不同。
秩和检验的结论判断
A组的实际秩在界值之外,则拒绝H0,接受H1。
403
(5) 1~ 83 84~264 265~380 381~403
(6) 42 174 322.5 392
(7)=(2)(6) (8)=(3)(6)
966
2520
116447.5
4312
4704
T1=40682.5 T2=40723.5
H0 :两型老慢支疗效分布相同; H1 :两型老慢支疗效分布不同。
等级资料的秩和检验
医学统计教研室 荀鹏程
医学研究中的等级资料
疗 效:痊愈、显效、有效、无效、恶化 化验结果:-、、++、+++ 体格发育:下等、中下、中等、中上、上等 心功能分级:I、II、III… 文化程度:小学、中学、大学、研究生 营养水平:差、一般、好
等级资料的特点
既非呈连续分布的定量资料,也非仅按性 质归属于独立的若干类的定性资料;
B组:1
2
4.5 4.5 4.5
+
8.5
++
++
++
+++
+++
6 8 9 10 11 12
4.5 8.5 8.5 8.5 11.5 11.5
秩和
A组: - 、、+、+、+、 ++ 秩和: 1 2 4.5 4.5 4.5 8.5
TA=25
B组: +、++、++、++、+++、+++ 秩和: 4.5 8.5 8.5 8.5 11.5 11.5
N(N 1) ni
H 的校正与2近似
当有相同秩次时,H 需校正:
HC H /C
C 1
(t
3 j
t
j
)
/[
N
3
N
)]
当 n 较大时, H 近似服从 = k – 1 的 2 分布。 故可按 2 分布获得概率 P,作出统计推断。
三种方剂的疗效比较
H0 :三药疗效总体分布相同; H1 :三药疗效总体分布不同或不全相同。 =0.05。
(小于或等于下界,大于或等于上界)
A组的实际秩在界值之内,则不拒绝H0。
(大于下界且小于上界)
某药对两种病情的慢性支气管炎病人的疗效比较
疗效
人数 喘息型 单纯型
合计
秩次范围
平均秩次
秩和
喘息型
单纯型
(1)
(2)
(3)
(4)
治愈
23
60
83
显效
83
98
181
好转
65
51
116
无效
11
12
23
合计 n1=182 n2=221
18
(4)
(5)
(6)
(7) (8)=(2)(7) (9) =(3)(7) (10)=(4)(7)
1
41
1~41 21.0
756.0
84
21
9
142 42~183 112.5 12937.5 2025
1012.5
好转 184
44
25
253 184~436 310.0 57040.0 13640
7750
=0.05。
编秩
求秩和 T1 、 T2 确定检验统计量T
n1<n2:规定n1组的秩和为T; n1=n2:则任取一组的秩和为T 本例n1=182,n2=221, 则检验统计量 T=T1=40682.5。
确定P值,作出推断结论
若n110,且n2-n110:查表法 当n1>10或n2-n1>10时,正态近似法
无效 47
35
4
86 437~522 479.5 22536.5 16782.5 1918
合计 382 101
39
522
93270.0 32531.5 10701.5
多组等级比较的检验假设
H0 :各组总体的等级分布相同; H1 :各组总体的等级分布不同或不全相同。 =0.05。
H 12
Ri2 3(N 1)
TB=53
TA+TB=N(N+1)/2=78
秩次:在一定程度上反映了等级的高低; 秩和:在一定程度上反映了等级的分布位置。 对等级的分析,转化为对秩次的分析。秩和检验
就是通过秩次的排列求出秩和,进行假设检验。
8.2 两样本比较的秩和检验
检验假设
H0 :A、B两组等级分布相同; H1 :A、B两组等级分布不同(相互偏离)。 =0.05。
u T n1 (N 1) /2 0.5 n1n2 ( N 1) / 12
uc u C
C
1
(t
3 j
t
j
)
/( N
3
N)
40682.5 182(4031) /2 0.5
u
3.3669
(182)(221)(4031) /12
C
1
(t
3 j
t
j
)
1
8074188
0.8766
(N 3 N)
相关文档
最新文档