秩和检验
秩和检验

T Tmin( n1orn2 )
3.确定P值范围并作推断
(1)当n1 ≤ 10且n2-n1≤10时,
查附表7的T界值表(P269)
(2)当n1>10或n2-n1>10时,按正态 近似公式(7.3)
相同秩次较多时,校正公式(7.4)
其中 为第j个相同秩次的个数。
二、等级资料的两样本比较(例7.4)
3. 编秩次 (1)d=0 舍去不计,用以检验的有效对子
数n相应减少。
(2)│d│同,取平均秩
4. 求秩和,并定检验统计量
T=T+ orT- (核对:T++T-=(n+1)n/2 )
5.确定P值范围并作推断
(1)当有效对子数n≤50,查附表6的
T界值表(P268)
(2)当n>50时,按正态近似公式(7.1) 相同秩次较多时,校正公式(7.2)
1. 建立检验假设,确定检验水准
H0:总体M1=M2,
即两总体分布位置相同;
H1:总体M1≠M2,
即两总体分布位置不同; α=0.05
2.计算检验统计量u 值
(1)编秩:本例为等级资料,先 按组段计算各等级的合计人数,再 确定秩次范围及平均秩次。
(2)计算秩和,确定T 并求检验统 计量u 值:
以各组段的平均秩次分别与各等级例
在实际应用中,秩和检验法有多种具体化: 配对设计的两样本比较 成组设计两样本比较的秩和检验 成组设计多样本比较的秩和检验 多个样本两两比较的秩和检验
符号检验法
检验目标:X与Y是两个连续型总体,各有分布函数
F1(x)与 F2(x) ,现从中分别抽取两个独立样本 ( X1, X 2 , , X n )与 (Y1,Y2,...,Yn ) ,要在显著性水平
秩和检验

三、建立假设检验,确定检验水准
H0: 三组总体分布相同,即三组吞噬指数的总体 分布相同
H1: 三组总体分布不全相同,即三组吞噬指数的 总体分布不全相同
787.47
880.83
差值
10
27.88
1.15
154.72
结果展示: 根据样本数据分布类型,选择合适的表示方法 正态分布时,用均数和标准差表示(mean±SD) 偏态分布时,用中位数和四分位间距表示
两样本比较的秩和检验
例2、在河流监测断面优化研究中,研究者从某河流甲乙两个
断面分别随机抽取10和15个样本,测得其亚硝酸盐氮(mg/L)
表1 不同剂量组小鼠肝糖原含量(mg/100g)
小鼠对号 1 2 3 4 5 6 7 8 9 10
中剂量组 620.16 866.50 641.22 812.91 738.96 899.38 760.78 694.95 749.92 793.94
高剂量组 958.47 838.42 788.90 815.20 783.17 910.92 758.49 870.80 862.26 805.48
要求掌握内容
计算机操作
配对比较的秩和检验 两样本比较的秩和检验 多个独立样本比较的秩和检验
结果的表达
配对比较的秩和检验
例1、某研究者欲研究保健食品对小鼠抗疲劳作用,将同种属的小鼠按性 别和年龄相同、体重相近配成对子,共10对,并将每对中的两只小鼠随 机分到保健食品两个不同的剂量组,过一定时期将小鼠处死,测得其肝 糖原含量(mg/100g),结果见表1,问不同剂量组的小鼠肝糖原含量有 无差别?
秩和检验

12
五、统计结果表达
表2 比较不同剂量的保健食品对小鼠抗疲劳作用的秩和检验
分组
例数 中位数 25百分位数 75百分位数 Z 统计量 P值
中剂量组 10 755.35
681.52
826.31 -2.193 0.028
高剂量组 10 826.81
秩和检验
(Rank Sum Test)
1
秩和检验(rank sum test)
秩和检验是一种非参数检验(non-parametric test)。它不依赖于总体分布的具体形式,应 用时可以不考虑被研究对象为何种分布以及分 布是否已知,因而适用性较强。
秩和检验是总体分布之间而不是参数(参数检 验,如t检验、方差分析)之间的检验。
787.47
880.83
差值
10
27.88
1.15
154.72
结果展示: 根据样本数据分布类型,选择合适的表示方法 正态分布时,用均数和标准差表示(mean±SD) 偏态分布时,用中位数和四分位间距表示
13
两样本比较的秩和检验
例2、在河流监测断面优化研究中,研究者从某河流甲乙两个
断面分别随机抽取10和15个样本,测得其亚硝酸盐氮(mg/L)
4
要求掌握内容 计算机操作
配对比较的秩和检验 两样本比较的秩和检验 多个独立样本比较的秩和检验
结果的表达
5
配对比较的秩和检验
例1、某研究者欲研究保健食品对小鼠抗疲劳作用,将同种属的小鼠按性 别和年龄相同、体重相近配成对子,共10对,并将每对中的两只小鼠随 机分到保健食品两个不同的剂量组,过一定时期将小鼠处死,测得其肝 糖原含量(mg/100g),结果见表1,问不同剂量组的小鼠肝糖原含量有 无差别?
秩和检验

某药对两种病情的老年慢性支气管炎患者的疗效
合 计 秩次范围 平均秩 次 秩 单纯性 和 肺气肿
控 制 显 效 有 效 无 效 合 计
65 42 107 1~107 18 6
54
3510 2151 4740
2268 717 3634
24 108~131 119.5 53 132~184 158
30 23 13 11
(2)大样本时,正态近似法:
| T n( n 1 ) / 4 | 0.5 u n( n 1 )( 2n 1 ) / 24
校正公式:(当相持个数较多时)
u | T n( n 1 ) / 4 | 0.5 ( t3 tj ) n( n 1 )( 2n 1 ) j 24 48
12 342 602 262 H 3(15 1) 6.32 15(15 1) 5 5 5
2 i
Hc H C
分子为H值,分母C为校正数,
tj C 1 N N 校正后,Hc>H,P值减小。
3 j 3
t
HC 1
H ( t3 tj ) j N3 N
此例n1=82,n2=126,n2-n1=44, 用正态分布法。求u值
计算校正的uc值,即:
8780.5 82 208 1 / 2 0.5 u 0.4974 82 126 208 1) 12 ( /
tj ( 3 107 243 24 533 53 243 24 107 )( )( )( ) C 1 1 0.8443 3 N N 208 208
3 j 3
t
0.4974 uc 0.541 0.8443
秩和检验数据要求

秩和检验数据要求
秩和检验(Rank Sum Test),也称为Mann-Whitney U检验,是一种非参数统计检验方法,用于比较两个独立样本的中位数是否相同。
这种检验不依赖于数据的分布,特别适用于分布未知或非正态分布的数据。
进行秩和检验时,对数据的要求通常包括:
1. 独立性:两个比较的样本应该是独立的,即一个样本的数据不应该受到另一个样本数据的影响。
2. 可比性:虽然秩和检验不要求数据必须来自正态分布,但是数据应该是有可比性的,意味着每个样本应该是一个总体的一部分。
3. 同质性:通常,秩和检验要求两个样本的总体分布应该是同质的,这意味着两个总体的分布不应该有显著的差异。
4. 样本大小:虽然秩和检验可以用于小样本数据,但是当样本大小非常小(例如,每个样本小于10)时,检验的准确性可能会受到影响。
5. 数据的数值性质:秩和检验适用于定量数据,可以是连续的或离散的。
对于分类数据,需要先转换为定量数据,例如,通过计算每个类别的频数或频率。
6. 无异常值:虽然秩和检验在一定程度上可以处理异常值,但是过多的异常值可能会影响检验的准确性。
在进行秩和检验之前,通常需要对数据进行适当的预处理,例如,将分类数据转换为数值,处理缺失值,以及将异常值纳入考虑。
此外,
还需要检查数据的分布特性,以确定秩和检验是否适合。
在某些情况下,可能需要使用秩和检验的改进版本,如Wilcoxon符号秩检验或Wilcoxon秩和检验,来处理特定类型的问题。
秩和检验

1、建立假设及确定检验水准 H0:差值总体水平为0。 H1:差值总体水平不为0。 α =0.05 2、计算T值 (1)求差:算出每对差值 (2)编秩:按差值绝对值大小从小到大编秩,并冠以 原差值的正负号。 A 若差值为0,可删去不计,不编秩。 B 若差值的绝对值相等,符号相反,则以平均秩 次作为每一个差值的秩次,保留原差值符号。 C 若差值完全相等,则按原秩号,不必平均。 (3)求秩和:将正负秩次分别相加,以秩和绝对值小 则为T。本例T=8。
3、确定值,判断结果。 (1)查表法:当n 50 时
得: T0.05,
若
11
= 10~56,( T0.01,
11
=
5~61)
T+ 或 T- :
落在范围内,则P>0.05; 落在范围外, 则P<0.05; 等于界值, 则P=0.05。
现T=8或58,故 0.01 < P<0.05
基本思想
注意:配对的对子数不能少于6。 本法的基本思想:若H0成立,则样本的正负秩和应较接近于T值的均数n(n+1 )/4,T值不会很小。若正负秩和相差悬殊,则T值特别小,则在H0成立的情况下, 由于抽样误差所至的可能性很小,当P<α 时,拒绝H0。 随着n增大,T的分布逐渐逼近均数为n(n+1)/4,方差为n(n+1)(2n+1) /24的正态分布。N>50时,可用u-T代替秩和检验。
本例 T = 170 查表得: T0.05,
(10,2) (10,2)
= 84~146
T0.01,
所以 P < 0.01
= 79~151
(2)正态近似法:
当超过附表的范围时(n1>10, n2 - n1 >10)
医学统计学等级资料的秩和检验

在某些情况下,可以排除异常值以提高检验的稳定性。但应谨慎处理,确保不会排除对 总体分布有重要影响的值。
稳健统计方法
采用稳健统计方法可以在一定程度上减少异常值对检验结果的影响,如使用中位数、众 数等稳健统计量进行秩和检验。
06
秩和检验的展望
秩和检验的发展趋势
广泛应用
秩和检验作为一种非参数统计方法,在医 学、生物学、环境科学等秩和,判断 两组数据的优劣或差异性,从而 进行假设检验。
适用范围
适用于等级资料和连续变量资料, 尤其适用于小样本和不服从正态 分布的数据。
秩和检验的步骤
01
数据整理
对等级资料进行排序,并赋予相应 的秩。
确定检验统计量
根据秩和计算出检验统计量,如Z值、 H值等。
03
02
计算秩和
在蛋白质组学研究中,秩和检验 用于分析蛋白质表达水平在不同 样本之间的差异。
在其他领域的应用
环境卫生研究
在环境卫生研究中,秩和检验用于评估不同暴露水平对健康的影响。
心理学研究
在心理学研究中,秩和检验用于比较不同干预或实验条件下的心理状态或行为差异。
05
秩和检验的注意事项
样本量的问题
样本量过小
当样本量过小时,无法充分反映总体分布情况,可能导致 检验结果不准确。
等级资料
按照事物的属性特征进行等级划分所得的数据,如 疗效评价中的治愈、显效、好转、无效等。
计量资料
通过度量衡等方法获得的数据,如身高、体重等。
等级资料的特点
有序性
等级资料具有有序性,不同等级之间存在一定的顺序 关系。
差异性
不同等级之间存在差异,同一等级内的数据具有相似 性。
相对性
秩 和 检 验

(2)计算检验统计量 T 1求差值d,见表12.1(4) 2编秩
编秩原则:
依差值的绝对值从小到大编秩。 编秩时遇差值等于零,舍去不计,同时样本例数减1。 遇绝对值相等差值,取平均秩次。若符号相同,既可以 顺次编秩,也可以求平均秩次,并将各 秩次冠以原差值 的正负号。
3求秩和并确定检验统计量:分别求出正 负秩之和,任取正或负秩和作为统计量。 本例T=21.5或23.5。
切数据的资料
• 计算简便
缺点
• 对于符合参数检验条件的资料其检验效能较低,
因而,对这类资料应首选参数检验
秩及秩和的概念
秩(假设按年龄大小) f m f f f m m f f m m m 15 18 25 26 29 31 32 37 41 48 51 55 1 2 3 4 5 6 7 8 9 10 11 12 秩:对数据从小到大排序,顺序号即为秩
查附表 2(t 界值表, 时)得单侧P 0.0005 , 按 0.05 水准拒绝H 0 ,接受H1 ,可认为吸烟工人的 HbCO(%)含量高于不吸烟工人的 HbCO(%)含量。
完全随机设计多个样本比较的 Kruskal-Wallis H 检验
一、多个独立样本比较的 Kruskal-Wallis H 检验
Kruskal-Wallis H 检验,用于推断计量资料 或等级资料的多个独立样本所来自的多个总体 分布是否有差别。在理论上检验假设 H 0 应为多 个总体分布相同,即多个样本来自同一总体。由 于 H 检验对多个总体分布的形状差别不敏感, 故
在实际应用中检验假设 H 0 可写作多个总体分布 位置相同。 对立的备择假设 H1 为多个总体分布位 置不全相同。
表8-10 小白鼠接种三种不同菌型伤寒杆菌的存活日数比较
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实习秩和检验
一、目的要求
1、了解非参数检验的意义及优缺点
2、掌握常用秩和检验方法
(1)配对符号秩和检验,
(2)成组设计两样本资料秩和检验,
(3)成组设计多样本资料秩和检验。
二、归纳起来
1、计量资料
(1)单样本资料(样本均数与总体均数比较)
如服从正态分布-----t检验
如不服从正态分布-----秩和检验
(2)成组设计资料(两样本均数)
如方差齐,且两样本服从正态分布-----t检验
如方差不齐但服从正态分布----- t’检验或秩和检验
如方差不齐且不服从正态分布----- 秩和检验
(3)配对设计资料
如差值服从正态分布-----配对t检验
如差值不服从正态分布-----配对秩和检验
(4)多样本均数的比较
如方差齐,且样本服从正态分布-----F检验(方差分析)
如方差不齐或样本服从正态分布----- 秩和检验
2.计数资料
(1)单向有序资料(或称成组等级资料)
如比较分布或构成时----- 行×列表卡方检验
如比较不同组间效应是否有差别时----- 秩和检验
3. 等级资料或开口资料或明显偏态分布资料
不管是配对设计,还是成组设计或多样本比较----- 均采用秩和检验一、配对秩和检验(P172 9-1)
例9-1:配对设计的计量资料。
由于资料呈明显偏态分布,首选秩和检验。
SPSS使用要点:
(1)数据结构
(2)分析方法
Analyze→Nonparametric Test→2 Related-Samples Tests:
(配对设计两样本均数的非参数检验)。
(3)操作过程
1、Analyze==>Nonparametic test==>2 Related Samples..
2、Test Pair(S) List 框:
成对选入分析两个变量
3、Test type 复选框组:选中Wilcoxon 框 (默认)(符号秩检验)
4、单击
表2的检验结果,给出了Z
值(即通常所用的u 值)=-0.84, P=0.401(双侧)。
• 因Z=-0.84, P=0.401>0.05,故按a=0.05水准,不拒绝H 0,差别无统计学意义,尚不能认为两方法测定结果有差别 。
•
二、成组设计两样本比较(P 174 9-2,P 1779-4)
9-2、题意分析:资料不服从正态分布,故用两独立样本秩和检验。
SPSS 使用要点: (1) 数据结构
(1)原始数据:g (组别),x (观察值)
(2)频数表:d (等级), g (组别),f (频数)(记得加权!!)
(例9-2定义变量:分组group:为二巯丁二钠=1,二球基本磺酸钠=2;
x:排汞比值)
(2)分析方法
Analyze→ Nonparametric Test→2 Independent Samples
(成组设计的两样本均数比较的非参数检验)
(3)操作过程
1.Analyze==>Nonparametic test==>2 Independent Samples
2.Test variable list框:选入x(排汞比值);
3.grouping variables框:选入group(组别);
4.单击Define groups钮
5.在group1框和group2框中分别输入1和2
6.单击continue钮
7.单击OK钮
选择分析方法
定义组别
Mann-Whitney U检验:默认值,该法用途广泛,实际上就是大家学过的两样本比较的秩和检验。
这里我们就用它。
表2的检验结果,给出了Mann-Whitney U 统计量、Wilcoxon W 统计量和z值(通常所用的u值,大样本时用)。
近似法概率(P=0.009)和确切概率法概率(P=0.007)。
因P=0.009<0.05,按a=0.05水准,拒绝H0,接受H1,差别有统计学意义,故可认为两种药物排汞比值不同.
三、成组设计多样本比较(P178 9-5,P1809-6)
9-6:属单向有序资料,要求比较三种方法疗效(等级资料)。
(首选完全随机设计多样本比较的秩和检验)。
SPSS使用要点:
1、数据结构:
(1)原始数据:g(组别),x(观察值)
(2)频数表:d(等级), g(组别),f(频数)(记得加权!!)
(例9-6赋值说明:组别:甲法=1,乙法=2,丙法=3;疗效等级:无效=1,好转=2,显效=3,治愈=4;f:频数)
(2)weight框:选入f(人数)
(3)分析方法:Analyze →Nonparametric Test→K Independent Samples (4)操作过程
1)Analyze==>Nonpara metic test==> K Independent Samples 2)Test variable list框:疗效等级
3)grouping variables框:组别;
单击Define groups钮Array
在minimum框和maximum框中分别输入1和3 单击
4) 单击
选择分析方法
首先指明进行 Kruskal-Wallis H 检验。
第1个表给出各组的例数、平均秩和;最后一个表给出检验的结果,由于H 服从X 2分布,故以X 2值(Chi-Square )表示统计量。
X 2=51.39,v=2, P=0.000,按a=0.05水准,拒绝H 0,接受H 1,三组间差异有统计学意义,可认为三种方法治疗慢性喉炎的效果不同或不全相同。
四、区组设计多样本比较(P181,例9-7)
1、数据结构:x1(教学方式A),x2 (教学方式B),……
2、分析方法:Analyze Nonparametric Test
K Related Samples(Test Variables:x1/x2…)
例将同窝、同性别、体重相近的5只大白鼠配成配伍组,共8个配伍组。
将每个配伍组的5只大白鼠随机分到5种饲料组进行喂养,4周后测得增加的体重如下表,试比较5种不同饲料组大白鼠增重有无差别。
不同饲料组大白鼠所增加体重
配伍组甲蛋白乙蛋白丙蛋白丁蛋白骆蛋白
1 24.00 15.00 37.00 57.00 82.00
2 42.00 28.00 37.00 51.00 66.00
3 60.00 29.00 47.00 53.00 74.000
4 50.00 29.00 42.00 51.00 79.00
5 42.00 24.00 34.00 60.00 82.00
6 39.00 38.00 27.00 69.00 76.00
7 47.00 21.00 32.00 54.00 73.00
8 53.00 37.00 42.00 59.00 90.00
【操作过程】
1、建立数据文件
设定5个变量:分别是甲蛋白、乙蛋白、丙蛋白、丁蛋白、骆蛋白。
2、统计分析过程
Analyze==>Nonparametic test==>K Related Samples..
Test Variables框:选入所分析的5个变量;
Test type 复选框组:选中Friedman复选框 (默认)
单击OK钮
【结果解释】
Friedman Test
1、输出各组的平均秩和
2、检验结果
Friedman 统计量服从X2分布。
该检验X2=29.700,自由度V=4,P=0.000。
可以认为不同饲料组大白鼠所增加的体重不同或不全相同。
1、多样本秩和检验两两比较
(1)变量编秩:Rank Cases(原始数据:X;频数表:d)
(2)分析:Compare Means One-Way ANOV A (Post Hoc: SNK) 2、区组设计秩和检验两两比较(按配伍组方差分析进行)
(1)重新输数据(按配伍组方差分析结构)
(2)变量编秩:Rank Cases(X;by:区组)
(3)分析:General Linear Model Univariate
作业:P191:7、8题
P192:10题
9。