第九章非参数检验方法

合集下载

非参数检验方法

⾮参数检验⽅法⾮参数检验的推断⽅法不涉及样本所属总体的分布形式，也不会使⽤均值、⽅差等统计量，⾮参数检验是通过研究样本数据的顺序和分布的性质来构成理论基础，下⾯介绍⼀些⾮参数检验经常使⽤的样本数据信息：1.顺序：将样本数据按照升序排列，可以得到X1≤X2≤X3≤Xi....≤Xn,其中Xi为第i个顺序量。

2.秩将样本数据按照升序排列，可以得到X1≤X2≤X3≤Xi....≤Xn，Ri为Xi在这⼀列数据中的位置，称为秩，R1,R2,R3...Rn为样本数据的秩统计量3.结如果样本数据中存在相同的值，那么在排序时就会出现秩相同的情况，这样的情况称为结，结的取值是对应的秩的均值。

注意是秩的均值⽽不是数据本⾝的均值。

⾮参数检验的统计理论都是根据上述概念计算⽽来，此外，和参数检验⼀样，当我们得到分析数据的时候，最先做的⼯作还是先通过图表和⼀些描述性统计量对数据整体进⾏探索性分析，掌握数据⼤致分布情况、有⽆极端值等，为后续正确选择分析⽅法打下基础。

================================================ ====⾮参数检验主要应⽤在以下场合：1.不满⾜参数检验的条件，且⽆适当的变换⽅法进⾏变换2.分布类型⽆法获知的⼩样本数据3.⼀端或两端存在不确定值，如>10004.有序分类变量求各等级之间的强度差别更进⼀步来讲，⾮参数检验可以做以下分析：⼀、单样本总体分布检验⼆、两独⽴样本差异性检验三、两配对样本差异性检验四、多个独⽴样本差异性检验五、多个相关样本差异性检验可以看出，以上应⽤除了第⼀点之外，其他都有对应的参数检验⽅法，这就要根据样本数据的实际情况来进⾏选择了：适合使⽤参数检验的优先使⽤参数检验，否则使⽤⾮参数检验。

================================================ =下⾯我们分别介绍⼀下上述应⽤对应的⾮参数检验⽅法⼀、单样本总体分布检验单样本总体分布检验主要⽤来检验某样本所在总体分布和某⼀理论分布是否存在显著差异，主要涉及的⾮参数检验⽅法有：1.卡⽅检验卡⽅检验可以检验样本数据是否符合某⼀期望分布或理论分布，这在卡⽅检验中有所介绍，在此不再多说2.⼆项分布检验⼆项分布检验主要⽤来检验样本数据是否符合某个指定的⼆项分布，该检验只适合⼆分类变量样本。

第九章非参数检验方法

胃癌患者，观察其生存时间如表9-4所示，问两组患者的生存时间是否不同？
n1=10
T1=162
假设检验的要点
1. 2. 3. 4. 混合编秩、数据相等时取平均秩分别求两组的秩和以样本量较小组的秩和为T 查成组设计的T界值表、确定P值
1.建立检验假设： H0：两组患者生存时间的总体分布相同 H1：两组患者生存时间的总体分布不同 α＝0.05 2.计算检验统计量T值 ⑴编秩 ⑵求秩和，确定统计量T 3.确定P值（T界值：91～159）；做出推断结论
n1=8
T1=26
n2=7
T2=134
n3=9
n4=8
T4=54.5
秩和检验的两两比较
1、扩展的t检验 2、Nemenyi法检验
习题
• P105~P107 第1、3、5、7题
T1 16.2，T2＝9.86
n1=10
T1=162
• 正态近似法
①当n1≤10，n2n1≤10 ，查T界值表（两样本比较的秩和检验用）确定P值；
②当n1>10或n2>20的大样本时，对T进行u转换，则可用正态近似法：
| T n1 ( N 1) / 2 | 0.5 u n1n2 ( N 1) /12
1312312051211iitnnuttnnnnn?????????????????二等级资料的秩和检验表95两组人痰液嗜酸性粒细胞的秩和计算例数统一编秩嗜酸性粒细胞数健康人病人范围平均秩次例数较小组病人组的秩和51111685935181810101744174430530530503050?若选行列表资料的卡方检验只能推断两组样本疗效构成比的差别有无统计学意义损失疗效的等级信息应采用秩和检验可推断两组等级强度的差别有无统计学意义比较两组病情的疗效

第九章非参数检验

第九章非参数检验（医学统计之星）上次更新日期：非参数统计是统计分析的重要组成部分。

可是与之很不相称的是它的理论发展远远不及参数检验完善，因而比较完善的可供使用的方法也不多。

在SAS中，非参数统计主要由UNIVARIATE过程、MEANS过程和NPAR1WAY过程来实现，前两者在前面的章节中已经介绍，它们可以进行配对设计差值的符号秩和检验（WILCOXON配对法）；后者是一个单因素的非参数方差分析过程，可进行成组设计的两样本（WILCOXON法）或多样本比较（KRUSKAL-WALLIS法）的秩和检验。

本章将主要介绍NPAR1WAY过程。

由于在理论上还有争议，作为权威性的统计软件，SAS不提供非参检验两两比较的方法。

据我所知，其余统计软件里也只有PEMS提供这一功能（因为她是医统·医百的配套软件，而非参两两比较是写入了该书的）。

如果你需要这一结果，那么恐怕只有手算了。

9.0.1 语法格式NPAR1WAY过程不能处理按频数输入的资料。

这意味着如果你的数据是以频数方式输入的，那么除非你将资料想办法转换成按例记录的资料，否则SAS 无法处理。

有的同学将“NPAR1WAY”打成了“NPARLWAY”，可以这样来记：“NPAR”即“非参”的英文缩写，“WAY”是维数，更明确的说是因素的意思，而“1WAY”就代表一个因素，合起来“NPAR1WAY”说的是“单因素的非参数检验”。

怎么样，明白这个过程在做什么了吧！9.0.2 语法说明【过程选项】NPAR1WAY过程常用的选项有：∙MISSING 将缺失值也用于统计分析∙ANOV A 同时进行方差分析∙MEDIAN 要求进行中位数检验∙NOPRINT 禁止统计结果在OUTPUT视窗内输出∙SA V AGE 要求对样本进行SA V AGE得分分析∙WILCOXON 要求进行WILCOXON秩和检验我们常用的秩和检验就是WILCOXON秩和检验，对于其它方法，有兴趣的读者可参阅有关统计书籍。

09 第九章非参数检验

通过查阅正态分布表来把握观察的显著性水平，进而做出否定或保留虚无假设的统计决断。
第三节中位数检验
一、两个样本中位数差异的检验
二、多个样本中位数差异的检验
中位数检验法是通过对来自两个或多个独立总体的两个或几个样本的中位数的研究，以判断这两个或多个总体取值的平均状况是否存在显著性的差异。其基本思想是假设这两个或多个总体具有相同的分布律，那么它们的取值将具有相同的平均状态。中位数检验法的具体做法是：先将几组数据 X1 、 X 2 、… X k 合并成一个容量为 N n1 n2 nk 的样本，再找出这个样本的中位数 Md 。然后统计出 X1 中大于中位数的数据个数 a ，小于或等于中位数的数据个数 b ；X 2 中大于中位数的数据个数 c ，小于或等于中位数的数据个数 d ，…，即分别统计出每个样本中大于和小于等于中位数的数据个数，再进行“ r c ”表的 2 检验。
一、小样本的情况
当两个独立样本的容量都小于10，进行秩和检验的步骤一般为：（1）编排秩次：将两列变量 X1 、X 2 共计 n1 n2 个数据混合起来，由小到大编排秩次。最小的一个数据的秩次为1，最大的一个数据的秩次为 n1 n2 。对若干个数值相等的数据，则取它们相应的秩次的中位数。（2）求秩和：累计容量较小的样本中的 n1 个数据的秩次之和，并且记为 T 。（3）把握显著性水平与统计决断：根据两个独立样本的容量 n1 和 n2 ，以及显著性水平，查阅秩和检验表。将实际求得的秩和与表中相应的理论临界值（下限 T1 和上限 T2 ）做比较。如果由样本资料得到 T 的实际秩和 T T1 或 T T2 ，则可以在显著性水平上否定无差异的虚无假设；如果实际求得的秩和满足： T1 T T2 ，则应保留虚无假设。

九非参数检验方法

一、一般步骤 1、建立假设检验，确定检验水准 H0：差值总体中位数为0； H1：差值总体中位数不为0 ； α=0.05
第10页/共41页
2、计算统计量（1）按差值的绝对值自小到大排秩次，并保留原差数的正负号；（2）差数的绝对值相等，但符号相反时，取平均秩次；（3）差数为零时，弃之，总的对子数相应减少；（4）将正负秩次分别相加，得到T+和T-，并以绝对值较小者作为统计量T值。
主要内容:
第一节配对资料的符号秩和检验第二节两样本比较的秩和检验第三节多个样本比较的秩和检验
第1页/共41页
基本概念
1.参数检验（parametric test）
以特定的总体分布为前提，对总体参数进行估计或假设检验的一类检验方法。
由样本统计量推断未知总体参数。
这时，对总体参数μ、π进行估计或假设检验称为参数
A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7
A组
2.6 3.2
4.7 5.2 6.4
B组 1.7 2.3 2.6 3.6 3.7
秩次 1 2 3 4 5 6 7 8 9 10
第5页/共41页
适用情况
1.总体分布为偏态或分布形式未知的计量资料； 2.等级资料； 3.个别数据偏大或数据的某一端无确定的数值； 4.各组离散程度相差悬殊，即各总体方差不齐。
检验。分布：要求总体分布已知，如：
•计量资料——正态分布； •计数资料——二项分布、POISSON分布等。
第2页/共41页
2.非参数检验 (nonparametric test) 可以不考虑总体的参数和总体的分布类型,而对
总体的分布或分布位置进行检验。

《非参数检验方法》课件

用于比较两个独立样本的中位数是否相等。
用于比较三个或多个独立样本的中位数是否相等。
3 Wilcoxon符号秩检验
4 Friedmann检验
用于比较两个相关样本的中位数是否相等。
用于比较三个或多个相关样本的中位数是否相康型”饮料，是否对销售额产生显著影响？
使用 Mann-Whitney U检验来比较推出“健康型”饮料前后的销售额差异。
案例2：针对不同年龄段顾客的购物偏好是否存在差异？
使用 Kruskal-Wallis H检验来分析不同年龄段顾客的购物偏好是否有显著差异。
总结
非参数检验方法的应用场景和局限性。非参数检验方法的总体流程。非参数检验方法的意义及应用前景。
《非参数检验方法》PPT 课件
非参数检验方法PPT课件
简介
什么是非参数检验方法？为什么需要非参数检验方法？非参数检验方法的优势和劣势。
基本原理
什么是假设检验？什么是零假设和备择假设？非参数检验方法与参数检验方法的区别。
常见的非参数检验方法
1 Mann-Whitney U检验
2 Kruskal-Wallis H检验

非参数假设检验方法课件

特点
非参数假设检验具有灵活性、稳健性和适用范围广等优点，能够处理更广泛的数据类型和分布情况，不受特定参数假设的限制。
与参数检验的区别与联系
区别
参数检验基于对总体分布的参数假设，如正态分布等，而非参数检验则不依赖于这些假设。
联系
非参数检验和参数检验都是为了对总体进行推断，只是所依据的假设不同。在实际应用中，可以根据具体情况选择合适的检验方法。
大，可能会导致误判。
与参数检验的优缺点比较
适用范围
参数检验方法通常需要假定数据分布的形式，适用范围相对较窄；而非参数检验方法无需假定分布形式，适用范围更广。
解释性
参数检验方法通常可以提供具体的参数估计和效应量估计，解释性较强；而非参数检验方法的解释性相对较差。
计算复杂性
参数检验方法的计算过程通常较为复杂，需要使用复杂的数学公式和推导；而非参数检验方法的计算过程相对简单。
详细描述
符号检验通过计算两组数据中正例和负例的差异数，并利用二项分布的概率公式来计算差异显著的p值。该方法适用于小样本数据，并且对数据的分布没有严格要求。
威尔科克森符号秩检验
总结词
威尔科克森符号秩检验是用于比较两个独立样本的差异是否显著的统计方法。
详细描述
该方法通过比较两个样本的秩和，利用威尔科克森符号秩公式计算差异显著的p 值。该方法适用于处理数据量较小的情况，并且对数据的分布没有严格要求。
05
非参数假设检验的未来发展与展望
现有研究的不足与局限性
方法适用范围有限
01
目前非参数假设检验方法主要适用于特定类型的数据和问题，
对于复杂数据或特定领域的适用性有待提高。
理论基础尚不完备
02

非参数检验

➢ 编秩：数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重（kg）xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验（Friedman test）
正态近似法
如果n1或n2-n1超出附表的范围，可按下式计算u值：
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时，应用下式进行校正：
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料（或等级资料）两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分差值

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2
3 合计
2 5
2 4
7
6
11~17
18~23
14.0
20.5
28
41 T-=91
70
82 T+=185
3、查表与结论
查T界值，T0.05(23)=73~203
T=min(T+，T-)=T-=91>73，P>0.05，按α=0.05水准，不拒绝H0，即对28名有轻度牙周疾病的成年人，指导他们实行良好的口腔卫生习惯，6个月后，牙周情况尚无显著好转。
1．计量资料的多个样本比较 2．等级资料的多个样本比较
基本思想和步骤
（一）基本思想：如果各组来自同一总体，即H0成立时，对各组观测值混合编秩次后，各组的平均秩和应近似相等；否则拒绝H0，可以推断数据的总体分布不同。（二）步骤 1、建立假设检验 H0：各抽样总体分布相同
H1：各抽样总体的分布不同或不全相同
H0：差值总体中位数为0；
H1：差值总体中位数不为0 ；
α=0.05
2、计算统计量
（1）按差值的绝对值自小到大排秩次，并保留原差数的
正负号；
（2）差数的绝对值相等，但符号相反时，取平均秩次；
（3）差数为零时，弃之，总的对子数相应减少；（4）将正负秩次分别相加，得到T+和T-，并以绝对值较小者作为统计量T值。
表9-6 各组鼠脾DNA含量（mg）的秩和计算
正常脾
患自发性白血病脾
患移植白血病的脾（甲组）
患移植白血病的脾（乙组）
含量秩次
12.3 18
含量秩次
10.8 8
含量
9.3
秩次
1
含量
9.5
秩次
2
13.2
13.7 15.2 15.8 16.9 17.3 17.4
n1=8
22
26 28 29 30 31 32
. . . . . . .
+3 +2 +1 0 -1 -2 -3
4 5 6 5 4 2 2
1、建立假设检验
H0：差值总体中位数为0； H1：差值总体中位数不为0；
α=0.05。
2、计算统计量
表9-3 正负秩和计算表 d 1 - + 总 4 6 10 秩次范围 1~10 平均秩次 5.5 负秩和 22 正ቤተ መጻሕፍቲ ባይዱ和 33
T1=216
11.6
12.3 12.7 13.5 13.5 14.8
13
18 21 23 24 27
10.3
11.1 11.7 11.7 12.0 12.3 12.4
3.5
11 14 15 16 18 20
10.3
10.5 10.5 10.5 10.9 11.0 11.5
n4=8
3.5
5 6 7 9 10 12
例9.2 对28名患有轻度牙周疾病的成年人，指导他们实行良好的口腔卫生习惯，6个月后，牙周情况好转程度依高到低给予分数+3，+2，+1；牙周情况变差程度依次给予分数-1，-2，-3；没有变化给予0分。
表9-2 实行良好口腔卫生习惯6个月后牙周情况的变化程度
6个月后
6个月前
变化对应的分数
人数
. . . . . . .
3、查表，确定P值范围
n≤25时，查配对资料符号秩和检验用T界值表，T在
界值内时，P>α。当T在界值时或以外时，P值一般都小于对应的概率值。
n>25时，近似正态分布用u检验，公式为：
2 T～ ( T , T )
T n(n 1) / 4 T n(n 1)(2n 1) / 24
+ ++ +++ 合计
1、建立假设检验及确定检验水准 H0：两组总体分布相同；
H1 ：两组总体分布不相同；
α＝0.05。
2、计算统计量
3、确定P值，作出统计推断由于u0.05=1.96,u> u0.05,P<0.05，有统计学意义，所以拒绝H0，接受H1，可认为两总体分布不同。
第三节多个样本比较的秩和检验应用情况
T与n(n+1)/4的差距越大，相应的P值就越小。当P ≤α时，拒绝
H0。
1、建立假设检验，确定检验水准
H0：差值总体中位数为0；
H1：差值总体中位数不为0；
α=0.05。
2、计算统计量
T=min(T+，T-)= T-=3
3、查表及结论 n=8,界值表T0.05(8)=3~33，T=3恰好落在界点上，所以 P≤0.05，按α=0.05水准，拒绝H0 ，可认为白癍部位与正常部位的白介素IL-6有差异。
例9.6 霍乱菌苗不同途径免疫21天后血清抗体滴度水平测定结果，问各组间的血清抗体滴度水平之间差异是否有统计学意义？
表9-7 不同途径免疫21天后血清抗体滴度的分布与秩和计算抗体滴度 1:10 1:20 1:40 1:80 1:160 1:320 合计气雾组 80 亿 2 15 10 5 1 33 100 亿 4 7 12 7 2 32 皮下注射组 2 1 13 9 5 1 31 累计 8 23 秩次范围 1-8 9-31 平均秩次 4.5 20 49 77 91.5 96 秩和 80亿
3.常用的非参数检验方法有：符号检验、秩和检验、等级相关检验及Radit分析等。
秩和检验（rank sum test）：用秩号代替原始数据后，所得某些秩号之和，称为秩和，用秩和进行假设检验即为秩和检验。
举例：

“秩”即按数据大小排定的次序号，又称秩号。编秩就是将观察值按顺序由小到大排列，所得某些秩次号之和，即按某种顺序排列的序号之和，称为秩和。设有以下两组数据： A组 4.7 6.4 2.6 3.2 5.2 B组 1.7 2.6 3.6 2.3 3.7
16
28
19
5
能否用卡方检验？
表9-5-2
嗜酸性粒细胞数
两组人痰嗜酸性粒细胞的秩和计算
例数健康人 5 18 16 5 44 病人 11 10 3 0 24 范围 1-16 17-44 45-63 64-68
例数较小组的秩和平均秩次 8.5 30.5 54.0 66.0 93.5 305.0 162.0 0.0 T1=560.5
12.5
17 19 20 21 23 24
12
12 17 21 24 29 30 34 36 40 48
4.5
4.5 7 8 9 12.5 14 15 16 18 22
n1=10
T1=162
n2=14
T2=138
1、建立假设检验及确定检验水准
H0：两组生存时间总体分布相同； H1 ：两组生存时间总体分布不相同；
T4=54.5
13.6
n2=7 T2=134 n3=9
25
T3=123.5
1、建立假设检验确定检验水准
H0：四组鼠脾DNA含量的总体分布相同；
H1：四组鼠脾DNA含量的总体的分布不同或不全相同；
α=0.05。
2、计算统计量
3、查表及结论
现k=4，υ=k-1=4-1=3查卡方界值表χ20.05(3)=7.81，P<0.05按 α=0.05水准，拒绝H0，接受H1，故可认为四组DNA含量有差别。
例9.1 临床某医生研究白癜风病人的白介素IL-6水平（u/ml）在白癍部位与正常部位有无差异，调查的资料如下表：
表9-1 白癜风病人的不同部位白介素IL-6指标（u/ml）
病人号 1 2 3 4 5 6 7 8 合计
白癍部位 40.03 97.13 80.32 25.32 19.61 14.50 49.63 44.56
查u值表，u0.05=1.96，u< u0.05 ,P>0.05，按α=0.05水准，接受H0。两种方法结果相同。
第二节两样本比较的秩和检验
一、一般步骤 1、建立假设检验及确定显著水准 H0：两总体分布相同； H1：两总体分布不同； α=0.05。
2、计算统计量（1）编秩号两样本观察值从小到大混合编秩，属于不同组的相同观察值取原秩次的平均秩次。（2）求秩和，确定统计量T n1和n2为两样本含量，N= n1+n2。分别计算秩次T1和T2，取样本含量小的n的秩和T为统计量T值。当n1=n2，取任意T值。
优点：应用范围广，方法简便。缺点：检验效率低。犯第二类错误的可能性大于参数检验法。
对于适合参数统计的资料或经变量变换后适合于参数统计的资料，最好还是用参数检验。
第一节配对资料的符号秩和检验
配对资料的符号秩和检验(Wilcoxon signed rank test)是配对设计的非参数检验。
•计数资料——二项分布、POISSON分布等。
2.非参数检验 (nonparametric test) 可以不考虑总体的参数和总体的分布类型,而对总体的分布或分布位置进行检验。
样本所来自的总体分布，难以用某种函数形式来表达，还有一些资料的总体分布的函数式是未知的，只知道总体分布是连续型的或离散型的，解决这类问题需要一种不依赖总体分布的具体形式的统计方法。
α ＝0.05。 2、计算统计量将两样本24个数据由小到大统一编秩。两组例数各为 10、14，取较小者为n1=10，T1=162，故统计量 T=T1=162。
3、查表与结论
n2-n1=4，按α=0.05，查T值表（附表9）得范围 91~159。T=162>159，所以P<0.05，拒绝H0，即两组患者的平均生存时间不同。
2、计算统计量
α=0.05
（1）编秩次，将各组数据从小到大统一编秩次，如不同组有相同数值，应取平均秩次。（2）求秩和，分别计算各组的Ti。

第九章 非参数检验方法

非参数检验方法

第九章 非参数检验方法

第九章 非参数检验

09 第九章 非参数检验

九非参数检验方法

《非参数检验方法》课件

非参数假设检验方法课件

非参数检验

第九章非参数检验方法

第九章非参数检验方法

第九章非参数检验

09 第九章非参数检验