第十一讲 秩和检验

合集下载

医学统计学秩和检验课件课件

医学统计学秩和检验课件课件

医学统计学秩和检验课件xx年xx月xx日CATALOGUE目录•秩和检验概述•秩和检验的类型与计算方法•秩和检验的数据分析步骤•秩和检验的实例分析•秩和检验的注意事项与建议•总结与展望01秩和检验概述秩和检验是一种非参数统计方法,它通过将原始数据转换为秩(即相对位置),并利用秩的分布来进行假设检验。

定义秩和检验基于这样一个原理,即在不同组别中,如果总体分布相同,则秩的平均数应该相等。

因此,通过比较各组的秩平均数,可以判断各组的分布是否存在显著差异。

原理定义与原理优点适用于小样本数据:在样本量较小时,秩和检验仍然能够有效地检验假设,不受分布形状的限制。

不受异常值影响:由于秩和检验关注的是相对位置而不是具体数值,因此即使存在异常值,也不会对检验结果产生太大影响。

缺点对数据条件要求较高:秩和检验要求数据满足独立性、正态性和方差齐性等条件,否则可能导致误判。

检验效能较低:相对于参数检验方法,秩和检验的检验效能较低,即需要更大的样本量才能达到相同的检验效果。

秩和检验的优缺点临床医学研究在临床医学研究中,常常需要比较不同治疗方案的效果,此时可以使用秩和检验对不同组别的疗效进行比较。

秩和检验的应用场景生物医学研究在生物医学研究中,常常需要对不同生物样本(如动物、人类等)的生理指标进行比较,此时可以使用秩和检验来分析指标的差异。

流行病学研究在流行病学研究中,需要对不同地区、不同人群的疾病发病率、患病率等进行比较,此时可以使用秩和检验来分析差异是否存在。

02秩和检验的类型与计算方法配对比较法也称为配对t检验,它是对同一研究对象进行两种不同的处理,然后比较它们的结果。

配对比较法定义适用于小样本数据,特别是无法确定总体分布或总体方差未知的情况。

适用范围首先对配对数据求差值,然后对这些差值进行t检验。

计算方法独立样本法定义01独立样本法也称为独立t检验,它是对两个不同的总体进行比较。

适用范围02适用于大样本数据,并且样本的总体分布是正态分布或近似正态分布的情况。

秩和检验

秩和检验
结果: W检验:W1=0.865,P=0.019<0.05; W2=0.891,P=0.014<0.05; W3=0.937, P=0.232>0.05 其中两组独立样本资料均不符合正态分布
三、建立假设检验,确定检验水准
H0: 三组总体分布相同,即三组吞噬指数的总体 分布相同
H1: 三组总体分布不全相同,即三组吞噬指数的 总体分布不全相同
787.47
880.83
差值
10
27.88
1.15
154.72
结果展示: 根据样本数据分布类型,选择合适的表示方法 正态分布时,用均数和标准差表示(mean±SD) 偏态分布时,用中位数和四分位间距表示
两样本比较的秩和检验
例2、在河流监测断面优化研究中,研究者从某河流甲乙两个
断面分别随机抽取10和15个样本,测得其亚硝酸盐氮(mg/L)
表1 不同剂量组小鼠肝糖原含量(mg/100g)
小鼠对号 1 2 3 4 5 6 7 8 9 10
中剂量组 620.16 866.50 641.22 812.91 738.96 899.38 760.78 694.95 749.92 793.94
高剂量组 958.47 838.42 788.90 815.20 783.17 910.92 758.49 870.80 862.26 805.48
要求掌握内容
计算机操作
配对比较的秩和检验 两样本比较的秩和检验 多个独立样本比较的秩和检验
结果的表达
配对比较的秩和检验
例1、某研究者欲研究保健食品对小鼠抗疲劳作用,将同种属的小鼠按性 别和年龄相同、体重相近配成对子,共10对,并将每对中的两只小鼠随 机分到保健食品两个不同的剂量组,过一定时期将小鼠处死,测得其肝 糖原含量(mg/100g),结果见表1,问不同剂量组的小鼠肝糖原含量有 无差别?

秩和检验

秩和检验

某药对两种病情的老年慢性支气管炎患者的疗效
合 计 秩次范围 平均秩 次 秩 单纯性 和 肺气肿
控 制 显 效 有 效 无 效 合 计
65 42 107 1~107 18 6
54
3510 2151 4740
2268 717 3634
24 108~131 119.5 53 132~184 158
30 23 13 11
(2)大样本时,正态近似法:
| T n( n 1 ) / 4 | 0.5 u n( n 1 )( 2n 1 ) / 24
校正公式:(当相持个数较多时)
u | T n( n 1 ) / 4 | 0.5 ( t3 tj ) n( n 1 )( 2n 1 ) j 24 48
12 342 602 262 H 3(15 1) 6.32 15(15 1) 5 5 5
2 i
Hc H C
分子为H值,分母C为校正数,
tj C 1 N N 校正后,Hc>H,P值减小。
3 j 3
t
HC 1
H ( t3 tj ) j N3 N
此例n1=82,n2=126,n2-n1=44, 用正态分布法。求u值
计算校正的uc值,即:
8780.5 82 208 1 / 2 0.5 u 0.4974 82 126 208 1) 12 ( /
tj ( 3 107 243 24 533 53 243 24 107 )( )( )( ) C 1 1 0.8443 3 N N 208 208
3 j 3
t
0.4974 uc 0.541 0.8443

医学统计学等级资料的秩和检验

医学统计学等级资料的秩和检验
排除异常值
在某些情况下,可以排除异常值以提高检验的稳定性。但应谨慎处理,确保不会排除对 总体分布有重要影响的值。
稳健统计方法
采用稳健统计方法可以在一定程度上减少异常值对检验结果的影响,如使用中位数、众 数等稳健统计量进行秩和检验。
06
秩和检验的展望
秩和检验的发展趋势
广泛应用
秩和检验作为一种非参数统计方法,在医 学、生物学、环境科学等秩和,判断 两组数据的优劣或差异性,从而 进行假设检验。
适用范围
适用于等级资料和连续变量资料, 尤其适用于小样本和不服从正态 分布的数据。
秩和检验的步骤
01
数据整理
对等级资料进行排序,并赋予相应 的秩。
确定检验统计量
根据秩和计算出检验统计量,如Z值、 H值等。
03
02
计算秩和
在蛋白质组学研究中,秩和检验 用于分析蛋白质表达水平在不同 样本之间的差异。
在其他领域的应用
环境卫生研究
在环境卫生研究中,秩和检验用于评估不同暴露水平对健康的影响。
心理学研究
在心理学研究中,秩和检验用于比较不同干预或实验条件下的心理状态或行为差异。
05
秩和检验的注意事项
样本量的问题
样本量过小
当样本量过小时,无法充分反映总体分布情况,可能导致 检验结果不准确。
等级资料
按照事物的属性特征进行等级划分所得的数据,如 疗效评价中的治愈、显效、好转、无效等。
计量资料
通过度量衡等方法获得的数据,如身高、体重等。
等级资料的特点
有序性
等级资料具有有序性,不同等级之间存在一定的顺序 关系。
差异性
不同等级之间存在差异,同一等级内的数据具有相似 性。
相对性

《秩和检验》课件

《秩和检验》课件

3
解读结果
4
根据统计显著性水平和效应大小,确定 是否存在差异。
ห้องสมุดไป่ตู้确定研究问题
明确需要比较的两组样本和所要检验的 假设。
执行秩和检验
使用适当的统计软件进行秩和检验的计 算与分析。
总结和展望
重要性
秩和检验为非参数统计提供了 有力的工具,可以处理不满足 正态分布的数据。
发展趋势
随着大数据时代的到来,秩和 检验在更多领域的应用前景可 期。
秩和检验的实例分析
案例一
对两种不同工艺的制程数据进行 秩和检验,以确定是否存在显著 差异。
案例二
案例三
通过秩和检验,分析两组受访者 的回答差异,从而验证研究假设。
使用秩和检验,比较新药与常规 治疗的疗效,为临床决策提供依 据。
秩和检验的操作步骤
1
收集数据
2
采集两组样本的数据,并整理成适合秩
和检验的格式。
实践意义
掌握秩和检验的方法和应用, 能够更准确地分析数据,做出 科学决策。
秩和检验的重要性
秩和检验常用于医学、心理学 和社会科学等领域的研究,能 帮助我们发现隐藏在数据中的 差异。
秩和检验的基本原理
1
排序数据
将两组样本的数据合并后按大小排序。
2
计算秩和
为每个数据分配秩次,相同数值的数据排名取平均值。
3
比较秩和
使用统计检验方法来比较两组样本的秩和,确定是否存在显著差异。
秩和检验的应用领域
药物研究
秩和检验可用于比较不同药物的疗效,排除个体差异的影响。
市场调研
秩和检验可用于比较不同广告策略的效果,确定哪种策略更受欢迎。
社会调查
秩和检验可用于比较不同群体之间的意见差异,揭示社会问题的本质。

统计学课件之秩和检验

统计学课件之秩和检验

某研究者欲研究保健食品对小鼠的抗疲劳作用, 将同种属的小鼠按性别和年龄相同、体重相近配 成对子,共14对, 并将每对中的两只小鼠随机分 配到两个不同的剂量组,测量小鼠负重游泳时间 (分钟,负重5%体重)。试比较不同剂量组的小 鼠负重游泳时间有无差别。
小鼠对子 1 2 3 4 5 6 7 8 9 10 11 12 13 14
(H检验)
back
检验目的 配对设计两组资料的总体分布是否相同
(本质为考察差值的总体分布其中位数是否为0)
检验步骤
建立假设 H0:差值的总体中位数为0(Md=0) 编秩 按差值的绝对值从小到大编秩,再相应赋以
正负号;其中,①差值为0舍去;②若差值 绝对值相等且符号相同,则顺序编秩;③若 差值相等但符号相反,则取平均秩次。
计算统计量T 分别求T+与T-,并以绝对值较小者 作为最终统计量T 。
确定P值(T界值表或正态近似法),作出结论 back
检验目的 完全随机设计两组资料的总体分布位
置是否相同
检验步骤
建立假设 H0:两总体分布或分布位置相同 编秩 将两组数据从小到大统一编秩,其中 ①若
数值相等且在同一组,则顺序编秩; ② 若 数值相等但不在同一组,则取平均秩次。
中剂量组 14.00 13.00 15.00 17.00 13.00 18.00 17.50 10.20 10.00 10.50 13.80 3.03 15.20 16.50
高剂量组 15.20 5.50 14.00 6.50 5.50 13.50 10.00 10.20 10.00 9.50 6.80 3.48 5.50 9.00
3N
1
确定P值(
)2界,值作表 出结论
(注意:若经过检验,得到有显著性的结果,只能

第十一讲 秩和检验

第十一讲   秩和检验

多个样本比较秩和检验
(Kruskal-Wallis test)
例 某医生在研究再生障碍性贫血时,测得不同
程度再生障碍性贫血患者血清中可溶CD8抗原水 平(U/ml)如表第⑴、⑶、⑸栏,问不同程度再生 障碍性贫血患者血清中可溶性CD8抗原水平有无 差别?
不同程度再生障碍性贫血患者血清中可溶CD8 抗原水平(U/ml)
参数统计
(parametric statistics) 已知总体分布类型,对 未知参数(μ、π)进 行统计推断 依赖于特定分布类 型,比较的是参数
非参数统计
(nonparametric statistics) 对总体的分布类 型不作任何要求 不受总体参数的影响, 比较分布或分布位置 适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
⑶ 确定P值作结论:
①查表法 (n1≤10,n2n1≤10) 查T界值表, n1 与n2n1交叉处即为T的界值 如果T位于检验界值区间内, P ,不拒绝H0;否 则, P ,拒绝H0 本例T =47,取α =0.05,查表得双侧检验界值区 间(49,87),T位于区间外, P<0.05,因此在按 α =0.05的水准,拒绝 H0 ,接受 H1 ,差别有统计学意 义。
H1:两型老慢支疗效分布不同
α =0.05
2.编秩,求各组秩和,确定检验统计量T 本例T1=40682.5, T2=40723.5,取T= T1=40682.5 因为n1=182>10,超出T界值表范围,需用正态近似法
u | T n1 ( N 1) / 2 | 0.5 n1n2 ( N 1) /12
家兔号
(1) 1 2 3 4 5 6 7 8 9 10 11 12 合计

秩和检验

秩和检验

Z < Z0.05/2 = 1.96,P>0.05,不拒绝H0,尚不 能认为接触重金属工人和非接触工人的血 胰岛素平均水平有差别。
14
• 检验两样本均数有无差别时,应首先考虑两样本 所来自的总体是否满足正态性(正态性检验)和方差 齐性(方差齐性检验)的条件。 • 当资料满足正态性、方差齐性的条件时,可采用 两样本均数比较的t检验; • 当不满足方差齐性要求时,可采用两样本均数比 较的t’检验。 • 当总体不服从正态分布、分布未知、或数据一端 或两端有不确定值、或虽满足正态性但不满足方 差齐性的要求时,可采用两样本均数比较的 Wilcoxon秩和检验。 • 当资料满足t检验条件时而选用秩和检验,会降低 检验效能。 15
8
• 1,建立检验假设,确定检验水准。
– H0:患与未患妊娠合并症的孕妇葡萄糖耐 受水平总体分布相同; – H1:患与未患妊娠合并症的孕妇葡萄糖耐 受水平总体分布不同。 – 取检验水准 α=0.05 。
2,编秩, 求秩 和,确 定统计 量T。
9
将两组原始数据混合由小到大排序编秩,遇到相同的数据, 取平均秩次。分别将两组的秩次相加,得到两组的秩和T1和 T2。如两组样本含量不等,以样本含量较小组的秩和作为统 计量T;如两组样本量相等,任取一组秩和作为统计量T。 本例两组样本量不等,取T1为统计量T,即T=47.5。 10
注意:如果已知其计量资料满足(或近似 满足)t 检验或F检验条件,当然选t检 验或F检验,因为这时若选秩转换的非 参数检验,会降低检验效能。
• 如果资料不满足方差齐性或正态分布的条 件,或者资料分布未知,或者数据一端或两 端为不确定数据,这时可以用两样本资料的 Wilcoxon秩和检验。 • Wilcoxon秩和检验不直接比较两总体均数 是否相等,而是比较两总体分布是否相同。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

适用范围
1、成组设计的两样本计量数据,不符合 t 检 验的条件(方差相等,且服从正态分布); 2、两组等级资料或两端无确切值的资料。
一、原始数据的两样本比较
基本思想: • 假定:两组样本的总体分布形式相同(即 H0成立),则两样本来自同一总体,且任 一组秩和不应太大或太小 。即T 与平均秩 和 n1(N+1)/2应相差不大。 N = n1+n2
• 前面介绍的检验方法首先假定分析变量 服从特定的已知分布(如正态分布), 然后对分布参数(如均数)作检验。这 类 检 验 方 法 称 参 数 检 验 ( parametric test)。 • 今天介绍的检验方法不对变量的分布作 严格假定,这类检验称非参数检验 (nonparametric test)。
非参数统计
(nonparametric statistics)
对总体的分布类型不 作特殊要求 ,统计 推断时不涉及参数 不受总体参数的影响,比 较的是分布或分布位置
依赖于特定分布类 型,比较的是参数
非参数统计的适用情况
• • • • • 等级资料 偏态分布资料 分布不明资料 个别数据偏离过大的资料 各组方差明显不齐的资料
• 确定P值: 以较小绝对值的秩和为T值。 本例T=3.5 以n=11查附表6(P268,单侧) p<0.005, • 判定结果: 按α=0.05水准,拒绝H0,接受H1,故可以 认为该厂工人尿氟含量高于当地健康人。
第二节 成组设计两样本比较 的秩和检验
Wilcoxon rank sum test
这下面一行(记为Ri)就是上面一行数 据Xi的秩。
秩和检验原理
• 秩和检验(rank sum test):是通过对数 据依小到大排列的秩次,以求秩次之和来 进行假设检验的方法。
• 例如:欲比较两个班级学生身高均值的大 小,可先将两个班的学生混合按高矮顺序 排队,报数。然后分别清点各班级报数的 总和。
二、单一样本与总体中位数比较
1、建立检验假设:调查资料的总体中位数等 于已知总体中位数; 2、用各观察值与已知总体中位数求差值,按 差值绝对值从小到大编秩,加上符号; 3、分别求正、负秩和,任取正、负秩和之一 作为统计量T; 4、查T界值表,若T在上下界范围内,P大于 a,在T上下界范围外,P小于a 。
第七章 秩和检验 (秩转换的非参数检验)
问题的提出
• 前面学习了连续型资料两组样本均数差异 的假设检验方法: • 小样本用t检验,条件是变量服从正态分布 和总体方差齐; • 如果是小样本,变量的分布不清,或者已 知不服从正态分布或经变量转换后仍不服 从正态分布时,如何检验两个样本或多个 样本均数差异的统计学意义呢? • 需要一种不依赖于分布假定的检验方法, 即非参数检验。
0.005 0.010 0~36 1~44 … 68 ~257
• 确定P值: 以较小绝对值的秩和为T值。 本例T=3.5 以n=9查附表6(P268,双侧) 0.02<p<0.05, • 判定结果: 按α=0.05水准,拒绝H0,接受H1,故可以 认为甲乙两种方法测定大气中SO2日平均浓 度有差别。
秩和检验的基本步骤
1、建立检验假设,但假设中不涉及参数; 2、编秩(依实验设计方法不同而异),计算统 计量“秩”; 3、确定P值(小样本查表,超出表的范围用 正态近似或卡方近似),下结论。
第一节 Wilcoxon符号秩和检验
(Wilcoxon signed rank test)
Wilcoxon符号秩和检验的应用
尿氟含量 ( 1)
2.15 2.10 2.20 2.12 2.42 2.52 2.62 2.72 3.00 3.18
差值 (2)=(1)-2.15 0.00 -0.05 0.05 -0.03 0.27 0.37 0.47 0.57 0.85 1.03
秩次 ( 3) -2.5 2.5 -1.0 4 5 6 7 8 9 T+=62.5,T- =3.5
秩和
病人数 合计(4)
秩次 范围 (5)
平8)=(3)(6)
107 24 53 24 208
1~107 108~131 132~184 185~208 -
54.0 119.5 158.0 196.5 -
3510 2151 4740 2554.5 T2=12955.5
判断资料分布类型的途径
• 据文献或以往经验 • 频数表 • 正态性检验
– 若测定值(都是正值)服从正态分布, 则一般来说,标准差s不会大于均值,更 不会是均值的若干倍。
秩和检验
• 什么是一个数据的秩呢?一般来说,秩就 是该数据按照升序排列之后,每个观测值 的位置。例如我们有下面数据
Xi Ri 15 7 9 5 18 9 3 1 17 8 8 4 5 2 13 6 7 3 19 10
3 确定P值作结论: ①查表法 :(n1≤10,n2n1≤10)时查表 • 如果T 位于检验界值区间内,p>a,不拒绝 H0;否则,p<a, 拒绝H0。 ②正态近似法: | T n1 (N 1)/2 | 0.5 u n1n2 (N 1)/12 *校正公式(当相同秩次较多时)
3 uc u / c ; c 1 ( t 3 t ) /( N N ); j j
p268附表6 T界值表(配对比较的符号秩和检验用)
n
5 6 7 8 9 … 25
0.025 单侧:0.05 0.05 双侧:0.10 0~15 2~19 0~21 3~25 2~26 5~31 3~33 8~37 5~40 … … 100 ~ 225 89 ~236
0.01 0.02 0~28 1~35 3~42 … 76~249
t j 为第j个相同秩号的数据个数
• 例7.3 研究不同饲料对雌鼠体重增加的关系 ,资料如表7.3,试比较两种饲料对雌鼠体 重增加是否不同?p73 • 建立假设: H0:两种饲料所喂雌鼠增重的总体分布相同 H1:两种饲料所喂雌鼠增重的总体分布不相同 α=0.05 • 计算统计量T值
1 编秩: 将两组数据从小到大统一编秩 2 求秩和:分别求秩和。两组例数不等,以例 数较小者的秩和为统计量: 高蛋白组:n1=12;T1=145.5 低蛋白组:n2=7;T2=44.5 此时n=7较小,故T=44.5 查T值表(P269附表7),表左侧找到较小 样本n1, 表上方找到n2-n1(本例为5),交叉 处即为T的界值,确定概率,0.02<p<0.05 判定结果: …不同。
• 例7.2 已知某地正常人尿氟含量的中位数为 2.15mmol/L,今在该地某工厂随机抽取12 名工人的尿氟如表7.2,问该厂工人的尿氟 含量是否高于当地正常人? • 建立假设:
H0 :该厂……总体中位数等于2.15mmol/L H1:该厂……总体中位数不等于2.15mmol/L 单侧单侧α=0.05 • 计算统计量
T分布与正态分布
当H0成立,从总体随机抽取任一个样本, 所得T值在均数附近的概率最大,而T值远离 均数概率较小,随着n增大,T的分布逐渐逼 近均数为n(n+1)/4,方差为n(n+1)(2n+1)/24的 正态分布,当n>25时,T分布已近似正态分 布。当n>50时可用正态近似法做u检验。
正态近似法
T μT 0.5 T n(n 1)/4 0.5 u σT n(n 1)(2n 1)/24
相同秩序较多时作同分校正:
uc T n(n 1)/4 0.5 n(n 1)(2n 1) 24
3 (t j t j)
48
如秩次中遇有相同秩次:3.5,3.5,6,6,6,则 ∑(tj3-tj) =(23 – 2)+ (33 – 3)=30
t j为第j个相同秩号的数据个数
u
8780.5 82 (208 1) / 2 0.5 82 126 (208 1) / 12
3 j
0.4974
(t c 1
tj)
N N 3 3 (107 107) ... (24 24 ) 1 0.8443 3 208 208
检验步骤
1、建立检验假设:差值总体中位数为0; 2、求差值,按差值绝对值从小到大编秩(注 意取平均秩次),加上符号; 3、分别求正、负秩和,任取正、负秩和之一 作为统计量T; 4、当对子数小于等于50时查T界值表,若T在 上下界范围内,P大于a,在T上下界范围外, P小于a ; 5、当对子数大于50时,用正态近似法。
3
uc u / c 0.4974 / 0.8443 0.5413
• Uc=0.5413<1.96, P>0.05 • 按α =0.05,不能认为……分布不同.
甲法 ( 2) 210 40 320 30 232 35 35 300 45
乙法 差值d 秩次 (3) (4)=(2)-(3) ( 5) 225 -15 -6.5(6) 45 -5 -2.5(2) 335 -15 -6.5(7) 37 -7 -4 (4) 250 -18 -8 (8) 30 5 2.5 ( 3) 34 1 1 ( 1) 327 -27 -9 (9) 53 -8 -5 (5) T+=3.5 T-=41.5
二、频数表或等级资料的两样本比较
1 建立检验假设: H0: 两总体分布相同
H1:两总体分布不相同
2 按组段计算两样本合计,编秩次范围,计 算平均秩次,以各组例数与平均秩次相乘, 计算两组秩和。
n1 n 2时 :以较小样本的秩和为T值 T n1 n 2时 :以较小秩和为T值
• 例7.4 某医生将老年慢性支气管炎按是否合 并肺气肿分为两类,用某药治疗这两类病 人208人,其中未合并肺气肿126人,合并 肺气肿82人,疗效如表7.4,问该药对两种 病型的疗效有无不同? 1 建立检验假设:两总体分布相同 2 按组段计算两样本合计,编秩次范围,计 算平均秩次,以各组例数与平均秩次相乘, 计算两组秩和。
相关文档
最新文档