第十一章_非参数检验

合集下载

非参数检验的基本原理

非参数检验的基本原理非参数检验是一种利用统计方法来检验假设的一种方法，与参数检验相比，非参数检验不需要对总体的分布做出假设，更为灵活。

本文将介绍非参数检验的基本原理。

一、概述非参数检验是一种统计方法，既不要求数据符合特定分布，也不对总体参数做出假设。

与之相反，参数检验通常假设数据服从特定的分布，例如正态分布。

非参数检验的主要优点是可以更全面地处理数据，更适用于复杂的情况。

然而，非参数检验的统计效率通常较低，需要更多的样本来达到相同的置信水平。

二、基本原理1. 秩次转换非参数检验通常使用秩次转换来处理数据。

所谓秩次转换是将原始的数值转换为它们在样本中的秩次，从而消除数值的大小差异。

对于同一组数据，秩次转换后，可以应用更广泛的统计方法。

2. Wilcoxon符号秩检验Wilcoxon符号秩检验是一种非参数检验方法，主要应用于配对样本或者两组独立样本之间的差异比较。

它的基本思想是对每个观测值计算它们的符号秩，然后通过比较两组样本的秩和来判断差异是否显著。

3. Mann-Whitney U检验Mann-Whitney U检验是一种非参数检验方法，用于比较两组独立样本之间的差异。

它的基本原理是将两组样本中的所有观测值汇总，然后对这些观测值进行秩次转换，并计算两组样本排名和。

通过比较两组样本排名和的大小来判断差异是否显著。

4. Kruskal-Wallis H检验Kruskal-Wallis H检验是一种非参数的方差分析方法，用于比较三组或以上独立样本之间的差异。

它的基本原理是将所有样本的观测值汇总，然后进行秩次转换，并计算各组样本排名和的平均值。

通过比较平均排名和的大小来判断差异是否显著。

三、案例研究为了更好地理解非参数检验的原理，我们以某家公司销售部门的两个月销售额作为例子进行案例研究。

假设第一个月公司销售额为[100, 80, 120, 90, 110]，第二个月公司销售额为[95, 85, 115, 100, 105]。

研究生统计学讲义第8讲非参数检验与Ridit分析

第二节配对设计资料的秩和检验(Wilcoxon法)
所谓秩(rank), 又称等级, 实际上就是按数值大小顺序作1, 2, 3, …, 等级的一种编码. 秩和检验常用于有序分类变量或不符合用参数检验的资料. 两个或多个有序分类变量(等级资料)的比较, 如临床疗效分为治愈, 显效，好转, 无效; 尿糖分为－, ＋, ＋＋, ＋＋＋, ＋＋＋＋;针麻效果分为Ⅰ，Ⅱ，Ⅲ，Ⅳ级等.
-9
-7
-6 — -4
-5 -11
(1) H0：配对差值总体中位数Md＝0； H1：配对差值总体中位数Md ≠0 .α＝0.05. 差值 -20 36 -5 -2 2 0… -10 -48
rank -8 10 - 3 -1.5 1.5 … -5 -11
a.在n≤25时，可查统计用表11，用T值与T界值进行比较．若T值在上、下界范围内，则 P 值大于相应概率；若T值为上、下界值或范围外，则 P 值小于相应概率．由于n＝11(因为有0)，T+＝11.5、T-＝54.5，则统计量T ＝11.5. 查统计用表12，11.5在(10,56)内,双侧P>0.05，以＝0.05水准不拒绝H0，差值总体中位数与0的差异有无统计意义，尚不能认为两法检测谷-丙转氨酶的结
值范围是0~15，
而P(T＝0)＝P(T＝15)＝1/32＝0.03125，双侧概率为 0.03125×2＝0.06250，已大于0.05。所以当n≤5时，用符号秩和检验不能得出双侧概率P<0.05，故 n 必须大于5。
1．配对设计资料比较的符号秩和检验
①例对9.1
子编 1 2 3 4 5 6 7 8 9 10 11 12
ti为第i个相同秩次的个数
解法2:软件计算

第十一章-非参数检验

R>R0.05时，P>0.05， R≤R0.05时，P≤0.05
本例: R=10<R0.05＝14，n=12， P<0.05，拒绝H0，故认为A，B两种照射方式造成的急性皮肤损伤程度不同，B照射的损伤程度比A照20射24年严9月重2。1日
（ii）大样本（n>10）时, 可采用正态近似
u | R n(n 1) / 4 | 10 12(12 1) / 4 2.275 n(n 1)(2n 1) / 24 12(12 1)(2 12 1) / 24
在0.05检验水平拒绝H0，接受H1,认为三组脾淋巴细胞对HPA刺激的增值反应不全相同。
2024年9月21日
频数表法: 属于同一组段的观察值，一律取平均秩次（组中值），再以该组段频数加权，计算Hc值。表分娩时孕周与乳量的关系
乳量
早产
足月产
过期产
合计
秩次范围
平均
秩和
秩次早产足月产过期产
查标准正态分布表，得 P 值校正公式：（当相同秩次个数较多时）
| R n(n 1) / 4 |
u
n(n 1)(2n 1) / 24 (ti3 ti ) / 48
10 12(12 1) / 4 2.282
12(12 1)(212 1) / 24 [(33 3) (33 3)]/ 48
2024年9月21日
⑴ H0: 两样本来自相同总体； H1: 两样本来自不同总体（双侧）
=0.05
或H1: 样本A高于样本B（单侧）
⑵ 编秩：两样本混合编秩次，求得R1、R2.T。
相同观察值（即相同秩，ties），不同组------平均秩次。 ⑶ 确定P值作结论:
①查表法 (n0≤10，n2 n1≤10) 查附表9

第十一章非参数检验

第十一章非参数检验前面有关章节讨论的参数检验都要求总体服从一定的分布，对总体参数的检验是建立在这种分布基础上的。

例如，两样本平均数比较的t 检验和多个样本平均数比较的F 检验，都要求总体服从正态分布，推断两个或多个总体平均数是否相等。

本章引入另一类检验——非参数检验（non-parametric test ）。

非参数检验是一种与总体分布状况无关的检验方法，它不依赖于总体分布的形式，应用时可以不考虑被研究的对象为何种分布以及分布是否已知。

非参数检验主要是利用样本数据之间的大小比较及大小顺序，对两个或多个样本所属总体是否相同进行检验，而不对总体分布的参数如平均数、标准差等进行统计推断。

当样本观测值的总体分布类型未知或知之甚少，无法肯定其性质，特别是观测值明显偏离正态分布，不具备参数检验的应用条件时，常用非参数检验。

非参数检验具有计算简便、直观，易于掌握，检验速度较快等优点。

非参数检验法从实质上讲，只是检验总体分布的位置（中位数）是否相同，所以对于总体分布已知的样本也可以采用非参数检验法，但是由于它不能充分利用样本内所有的数量信息，检验的效率一般要低于参数检验方法。

例如，非配对资料的秩和检验，其效率为t 检验的86.4%，就是说以相同概率判断出差异显著，t 检验所需的样本个数要少13.6%。

非参数检验内容很多，本章只介绍常用的符号检验（sign test ），秩和检验（rank-sum test ）和等级相关分析（rank correlation analysis ）三种。

第一节符号检验一、配对资料的符号检验（一）配对资料符号检验的意义配对资料符号检验是根据样本各对数据之差的正负符号多少来检验两个总体分布位置的异同，而不去考虑差值的大小。

每对数据之差为正值用“+”表示，负值用“－”表示。

可以设想如果两个总体分布位置相同，则正或负出现的次数应该相等。

若不完全相等，至少不应相差过大，否则超过一定的临界值就认为两个样本所来自的两个总体差异显著，分布的位置不同。

第11章非参数检验——卡方检验

f (横行总次数) * (纵列总次数) N
2
a
n(ad bc)2
bc d a cb
d
第11章非参数检验——卡方2检验
一、卡方检验概述二、吻合性检验三、独立性检验
一、卡方检验原理
（一）定义检验频数资料的实际观测次数分布与理论次数分布之
间差异是否显著的方法。
（二）目的检验每一组实际观察次数与理论次数是否吻合；检验四格表中分类标志是否独立。
一、卡方检验原理
（三）公式
实际观测次数
2 ( f0 fe )2 fe
理论次数
（四）性质 1. 非负 2. 形状受df影响，当df趋近∞时，2分布为正态。 3. 实际观测次数与理论次数差异越大，2值越大；反
之，则2越小。
二、吻合性检验
实得分布与理论分布是否吻合；判断实得分布与原有分布是否之一。例1，例2，例3。
三、独立性检验
检验两种分类标志下现象间是否相互独立。
2 × 2列联表
df =（r-1）（c-1）
例4
f (横行总次数) * (纵列总次数) N
2
a
n(ad bc)2
bc d a cb
d

当df=1，f<5时，采用公式校正
例5
三、独立性检验
检验两种分类标志下现象间是否相互独立。 2 × 2列联表 df =（r-1）（c-1）

非参数统计(non-parametricstatistics)又称任意分布检验(

例11.6（P195）。
（一）建立检验假设
H0：某中药治疗四种病型的疗效总体分布相同 H1：四个总体的分布不同或不全同
0.05
（二）计算统计量H值（1）编秩：a、计算各等级的合计人数 b、确定秩次范围 c、计算平均秩次（2）求各组秩和
R1 65(139.5) 18(304.0) 30(397.5) 13(504.5)
血浆总皮质醇含量有差别（不同或不全同）。
若还希望分析具体哪些组之间有差别，需进一步两两组间比较。方法见《卫生统计学》第五版P196，《医学统计学》第二版P183等。
当相同秩次较多（超过25%）时，需进行如下校正。
例11.4（P193），见表11－4。
（一）建立检验假设
H0：接种三种不同菌型伤寒杆菌存活日数总体分布相同 H1：三个总体的位置不同或不全同
适用于完全随机设计分组的多个样本比较（即不满足参
数统计条件的），目的在于判断多个总体分布是否相同。
例11.3(P192)，见表11－3。
(一)建立检验假设
H
：血浆总皮质醇含量的
0
三个总体分布相同
H1：血浆总皮质醇含量的三个总体分布不同或不全同
0.05
（二）计算统计量H值
1、编秩
先将各组数据分别由小到大排列，统一编秩，不同组的
注意：等级资料对程度的比较不应选检验。
例11.5（P194）。
（一）建立检验假设
H
：吸烟工人和不吸烟工
0
人的HbCO％含量总体分布位置相
同
H1：吸烟工人的HbCO％含量高于不吸烟工人的HbCO％含量
0.0（5 单侧）
（二）计算统计量u值
（1）编秩：a、计算各等级的合计人数

第十一章非参数检验简述

不如参数检验。
• 两独立样本非参数检验方法
– 秩和检验法
– 中数检验法
• 两相关样本非参数检验方法
– 符号检验法 – 符号等级检验法 • 克—瓦式单向方差分析
第一节两独立样本非参数检验方法
一、秩和检验 • 两个样本的容量都小于或等于10时
– 将所有数据由小到大赋予秩次 – 求样本容量较小的一组数据的秩次之和“T” – 将T值与临界值作比较。若 T1 < T < T2 则差异不显著
Z T n ( n 1) / 4 n ( n 1)( 2 n 1) 24
第三节单向秩次方差分析
• 方法：将所有样本的数据合在一起，按从小到大编秩次，然后计算各样本的秩次和。如果各组没有显著性差异，各组秩次和应当相等或趋于相等；如果各组秩次和相差较大，那么各组有显著性差异的可能性较大。
例题
序号
1 2 3 4 5 n
甲校 128 114 103 92 85 5
原始分数乙校 90 91 106
丙校 89 80 101
3
3
• 2.37
Z ( r 0 .5 ) n / 2 1 2 n ( 9 0 . 5 ) 31 / 2 1 2 31 2 . 16
二、符号秩次检验
• 威尔科克松（F.Wilcoxon）提出了既考虑差数符号，又考虑差数大小的符号秩次检验法。
• 当样本容量n<25时，可用查表法进行符号秩次检验。 • 当样本容量n>25时，可用正态分布近似处理。检验统计量为：
Z
( r 0 .5 ) n / 2 1 2 n
例题
• 32名被试中有1名被试对两种包装打出相同的分数，有22名被试认为A包装比B包装好，另有9名被试认为B包装比包装A好。问：被试对两种包装的偏好程度有无显著差异？

语言统计第十一章非参数检验

检验步骤如下：
第一步：陈述零假设H0和备择假设H1
第二步：设定显著水平a
第三步：计算每一对观测值之差，并记下差的符号〔即正值还是负值〕。
第四步：不考虑差的正负号，按其绝对值从小到大排序〔即赋予每个差一个 “秩〞〕。如果差为零，即两观测值相同,那么排除在外, 不再参加以后的分析〔观测值的对子的个数N就相应减少一个〕；如差相同，那么像曼惠特尼U检验那样，将其在不并列的情况下所应占得等级的平均值
决定使用哪个检验：
原那么—当使用t检验的条件满足时，应尽量使用t 检验，因为它毕竟能更充分地利用数据中的信息，因而能更容易发现总体之间存在的真正差异。
总之，如果t检验的条件得到了满足或根本满足，就尽量使用t检验，反之，如果数据为顺序数据，或虽是等距数据，但所来自的总体严重偏态，就应使用U检验。
例如，我们请两个人在一个0-7〔0表示 “完全可以接受〞，7表示完全不可以接受〞〕的量表上对15个句子的可接受程度〔acceptability〕打分，结果如表11.3所示。
我们现在检验一下在0.05的显著水平上两人所打的分是否有显著差异〔双尾〕。我们先计算每对分数之差，记下差的符号〔表中第四列〕，其中4个差为正号，8个为负号，即S=4.由于有3 个差为零，所以有效数据只有12对，即N=12.查表得临界值为2，由于S值大于临界值，所以不能推翻零假设，因而两人的分数没有显著差异。
符号检验的原理是：如果样本所来自的总休的分布没有差异，那么正差的个数就应大体等于负差的个数。符号检验的目的就是检验一下正负差的个数之间有无显著差异。
符号检验的步骤是：记录下每一对观测值〔等级〕之差的方向，而不是差本身〔如一对观测值相等，即其差为零，就将其排除在外，观测值的对子数N也随之减少〕，然后计算符号出现次数较少的观测值的对子个数，记为S作为检验统计值。附表9给出了S的临界值，如果S值小于或等于临界值，就可以推翻零假设。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

2014-2-7 6
[例] 假设我们观测15个相配的对，获得两个差为零和13个差不为零，其中有11个正号，2个负号，试在2.5％的显著性水平上进行单侧检验。 [解] H0：p＝0.5 H1：p (+)＞p (―) 由α＝0.025确定否定域，查二项分布表（附表2） P (13；13，0.5)＝0.000 P (12； 13，0.5)＝0.002 P (11； 13，0.5)＝ 0.010 P (10； 13，0.5)＝0.035 P (13) + P（12）+ P (11)＝0.000 + 0.002 + 0.010 ＝0.012＜0.025 P (13) + P (12) + P (11) +P（10）＝ 0.012 + 0.035＝0.047＞0.025 所以否定域由x等于11，12，13组成。现检验统计量 x＝11，
12
配对符号秩检验的零假设基本上和符号检验以及用于配对样本的 t 检验的零假设相同。配对符号秩检验的步骤如下：
(1) 首先求出每对数据的差值d 。
(2) 不计正负，按绝对值大小把差值d按顺序排列起来。 (3)绝对值最小者赋秩为l，第二小者赋秩为2，……，绝对
值最大者赋秩为n (其中绝对值相等者，将它们应得的秩均分
2014-2-7
21

[解] H0：专科类院校和本科类院校的环境质量无差异 H1：专科类院校和本科类院校的环境质量有差异根据题意 R1＝l+2+4+5+6+7+9+11+14+17＝76 R2＝3+8+10+12+13+15+16+18+19＝114 代入下两式得
所以检验统计量U＝min(U1,U2)＝U2＝2l 由α＝0.05查附表10得 Uα(n1 ，n2)＝U 0.05(10 ，9)＝20＜2l 所以不否定零假设，说明在0.05的水平上，不能认为专科类院
2014-2-7 18
(3)分别计算两样本的秩和：样本l中所有X1，X2，…, X n1的秩和记作R1；样本2中所有Y1，Y2，…,Y n2的秩和记作R2。 (4)秩和检验是针对两个总体具有完全相同的形式的零假设而进行检验的。在均值差检验中，研究的重点放在中心趋势的差异上，而不是离差的差异或形式的差异。秩和检验的零假设则可以用任何差异形式表示出来。 (5)计算检验统计量U 。检验统计量U是对混合样本中n1+ n2个元素根据它们的秩和和它们所属的总体标出的双重指标
2014-2-7 10
第二节配对符号秩检验
对于配对样本，至此我们已经接触了两种检验，即符号检验和t检验。在符号检验中，只考虑差值d的符号而不管其大小，并且应用二项分布检验零假设。另一方面，最有力的检验—— t 检验，则不仅需要定距尺度，而且还要求假定差值d服从正态分布。配对符号秩检验兼备了上述两种检验的某些特征，其效力也介乎两者之间。
2014-2-7 16
将[例11.2.1]与[例l0.3.1]和[例11.1.2]对比，可见配对符号秩检验的效力比符号检验的效力高得多，而很接近于t 检验的效力。理论研究表明，对于配对样本非正态分布的差值d，配对符号秩检验是最佳检验。虽然本例中n 很小，但是为了说明用法，我们仍然使用正态近似
2014-2-7
15
[解] H0：T+ ＝|T-|，即在总体中，正秩和等于负秩和。 H1：T+ ＞|T-|。前表给出了有关资料，由此又列出了配对符号秩检验所需要的数据。根据表中数据，可以看出负秩和小于正秩和。因此检验统计量T 取负秩和。 T ＝|T-|＝1.5 + 4 + 8＝13.5 由α＝0.025，n＝13，查表得单侧检验的 T0.025(13)＝l7＞13.5，所以否定T+ ＝|T-|的零假设，即说明该实验刺激有效。
2014-2-7 2
非参数检验，无需做出经典统计所必要的
关于分布的任何假设。唯一需要的假设是：全
部数据或数据对都出自相同的基本总体，且取样是随机的、相互独立的。基于这种原因，非参数检验又称为分布自由(或无分布)检验。 “无
分布”不是指总体真的无分布，而是指虽有时对
总体分布一无所知，但仍可以进行分析。不仅如此，这些很容易理解的方法还可以用于处理
H1：p (+)＞p (―)
由上例知，B(x；13，0.5)在α＝0.025显著性
水平上，单侧检验（p＞0.5）否定域由 x 由11， 12，13组成。观察前表知，在13个相配的对中，10个差为正号，3个差为负号，即检验统计量 x＝10。所以零假设 p＝0.5在2.5％显著性水平上不能被拒绝。
[例] 设评审专家对19所大专院校按校园环境质量排名次，环境质量最好的学校记分数为1，环境质量最差的学技记分数为19。其中10所学校是本科院校，其他9所学校是专科院校。假定这19所学校是分别从全部大专院校中随机地抽取的，试问：专科类院校和本科类院校的环境质量是否有显著性差异(α＝0.05)? 本科院校环境质量的名次(秩)为： 1，2，4，5，6，7，9，11，14，17 (n1＝10) 专科院校环境质量的名次(秩)为： 3，8，10，12，13．15．16，18，19 (n2＝9)
双侧检验 p (+)≠p (―) 很显然，符号检验就是先假设 p＝0.5，按二项分布计算正号“+”
出现次数之抽样分布，然后以样本中正号“+”出现的次数 x 作为检
验统计量。如果它是B(x；n，0.5)下的小概率事件，便否定对差分布之中位数为零的零假设，即认为两总体存在平均水平上的差别。
由此可见，符号检验是二项检验的一种实际应用。
2014-2-7
19
检验统计量U是U1和U2中较小的一个，即U＝ min(U1,U2)，然后用下式核对计算
U1 + U2 ＝n1 n2
(6)给出显著性水平α，从秩和检验表(附表10)中查出临界值Uα，如果计算出的U值小于或等于从附表10 中查出的临界值Uα(n1 ，n2)，则零假设被拒绝。
2014-2-7 20
2014-2-7 11
配对符号秩检验对于非正态分布的d 值，是
最佳检验，其检验效力大大高于符号检验。如
果 t 检验的假定成立，配对符号秩检验的检验
效力对于大、小样本都近乎为95％。因此，在
定距尺度测量的水平上，若由于样本容量太小而不能假定正态分布的时候，配对符号秩检验特别有用。
2014-2-7
之)，再在差值前补填上符号。 (4)求得正差值的秩和T+ 及负差值的秩和T- 。我们期望两个秩和应该近似相等。如果T+和T-相差太大，就应该否定零假设。
2014-2-7
13
(5)取两个秩和中较小的一个，即T＝min(T+ ，|T-|)，作为检验统计量。 (6)给定显著性水平α。如果n小，从配对符号秩检验表(附表9）中直接查出临界值Tα(n)。如果n大(n＞25)，就要应用正态近似法，查出Zα(单侧检验)或Zα/2(双侧检验)，同时检验统计量Z按下式计算
2014-2-7 的是各个对的结果要相互独立。 5
符号检验的零假设就是配对观察结果的差平均起来等于零：人们期望这些差中有一半小于零(负号)，而另一半大于零(正号)，因此
符号检验就是对差分布之中位数为零的零假设检验。现将符号检验
的零假设和备择假设表达如下 H0：p (+)＝p (―)＝0.5
H1：单侧检验 p (+)＞p (―)或 p (+)＜p (―)
2014-2-7 1
与均值差等检验比较，非参数检验有什么优点呢？在对均值差进行t 检验时，不仅要有定距尺度的假定，还要有正态总体的假定。当然，对于大样本，正态总体的假定可以放松。但正是对于小样本，这种假定最容易出问题。因此，在满足下面两条件之一时，我们期望用非参数检验代替均值差检验：①没有根据采用定距尺度，但可以安排数据的顺序(即秩)；②样本小且不能假定具有正态分布。由于非参数检验不能充分利用全部现有的资料信息。因此，如果有根据采用定距尺度，并且如果对于小样本能够假定其具有正态性，或对大样本能够放松对正态性假定的要求，一般宁愿使用均值差检验，而不用非参数检验。
法计算一下检验统计量
在单侧检验中，Zα＝Z0.025＝1.96＜2.24，我们可以否定零假
设。但必须指出，正态近似计算法没有把同数值（或同分对）的情
况考虑在内而作出修正。因此，它在同数值的数目很大时不能使用。
2014-2-7 17
第三节秩和检验
前面我们刚刚讨论过的符号检验和配对符号秩检验，都只适用于配对样本。当样本为独立样本时，可采用本节所讨论的秩和检验法。其具体步骤为：
单一实验组的实验中，对于样本中每个个体的前测与后测，如果我们并不关心（X1―X0）的具体数值，而只关心是增大了还是减小了。具体来说，就是只研究差值 d 的符号，即若X1＞X0，记作“+”；若X1＜X0，记作“―”；若X1＝X0，删去。
那么我们面对的就将是配对样本的“符号检验”问题
了。“符号检验”并不要求配对样本出自同一个总体，重要
所以零假设 p＝0.5在2.5％显著性水平上被拒绝。
2014-2-7 7
[例] 随机地选择13个单位，放映一部描述吸烟有害于身体健康的影片，下表中的数字是各单位认为吸烟有害身体健康的职工的百分比，现试在0.05显著性水平上，用符号检验检验实验无效的零假设。
2014-2-7
8
[解 ]
H0：p＝0．5
数检验在使用100个数据时的效力等于t检验(在正确模型条件下)使用95 个数据的效力。
2014-2-7
检验力又称检验势，它是用1―β或[1―（犯第二类错误的概率）] 来定义的。也就是说，对于固定的样本容量，检验能够否定错误假设的能力越大，其相对检验力越大。