非参数检验

合集下载

【统计分析】非参数检验

α=0.05 2. 计算统计量： T+=62.5，T-=3.5
3. 查表与结论查T界值表，T0.05（11）=10～56，T=3.5，在界值范围外，P<0.05，拒绝H0。
符号检验（Sign test)
z n n 1 n
二、两样本比较的秩和检验（Wilcoxon法）
适用条件：完全随机设计的两个样本比较，若不满足参数检验的应用条件，则用本法；两个等级资料比较。
-0.45
-1
13
15.20
5.50
9.70
11
14
16.50
9.00
7.50
8.5
步骤
1. 建立假设：H0：差值的总体中位数=0， H1：差值的总体中位数0；
=0.05 2. 计算统计量
计算差值d，由小到大的顺序编秩次，并冠以原d 的正负号，然后分别求正负秩和，得到T+=73， T-=5，取秩和较小者作为检验统计量T=5 3. 查表及结论
1.0
2.5
4
17.00
6.50
10.50
12
5
13.00
5.50
7.50
8.5
6
18.00
13.50
4.50
5
7
17.50
10.00
7.50
8.5
8
10.20
10.20
0.00
-
9
10.00
10.00
0.00
-
10
10.50
9.50
1.00
2.5
11
13.80
6.80
7.00
6
12
3.03
3.48

第6章非参数检验

8.5
3 1
17
8.5
8 4
5 2
13 6
7 3
19 10
8+9 = 8.5 2
中央财经大学统计学院 37
Wilcoxon符号秩检验：基本原理符号秩检验：符号秩检验
分别计算出差值序列中正数的秩和以及负数的秩和。显然，如果零假设成立，W+与W-应该比较接近。如果二者过大或过小，则说明零假设不成立。将正数的秩和或者负数的秩作为检验统计量，根据其统计分布计算p值，从而可以得出检验的结论。
中央财经大学统计学院 38
特别说明
符号检验在匹配数据分析应用中只用到差值的符号，而对差值数值的大小未能考虑，因而失去了部分信息。Wilcoxon符号秩检验既考虑差值的符号，又考虑差值的大小，因此在所需的假设条件满足时其功效比符号检验高。 Wilcoxon符号秩检验也可以用于单样本中位数的非参数检验，这时只需要将第二个样本的值设为零假设中的数值即可。
中央财经大学统计学院 33
符号检验
对于差值序列中正数的个数和负数的个数按照符号检验的方法进行假设检验
中央财经大学统计学院
34
Wilcoxon符号秩检验：基本原理符号秩检验：符号秩检验
计算差值绝对值的秩。将差值绝对值从小到大排序，其位次就是的秩（rank），等于0值不参与排序。
中央财经大学统计学院
中央财经大学统计学院 18
软件操作
在SPSS软件中打开数据文件，选择“分析” “非参数检验” “1样本K-S”，在弹出的对话框中将“时间”设定为检验变量；检验分布为默认的“常规”（正态分布）。单击 “确定”
中央财经大学统计学院
19
结果分析

常见的几种非参数检验方法

常见的几种非参数检验方法非参数检验是一种不需要对数据进行假设检验的统计方法，它不需要满足正态分布等前提条件，因此被广泛应用于实际数据分析中。

在本文中，我们将介绍常见的几种非参数检验方法。

一、Wilcoxon符号秩检验Wilcoxon符号秩检验是一种用于比较两个相关样本之间差异的非参数检验方法。

它基于样本差异的符号和秩来计算统计量，并通过查表或使用软件进行显著性判断。

二、Mann-Whitney U检验Mann-Whitney U检验是一种用于比较两个独立样本之间差异的非参数检验方法。

它基于样本排名来计算统计量，并通过查表或使用软件进行显著性判断。

三、Kruskal-Wallis H检验Kruskal-Wallis H检验是一种用于比较多个独立样本之间差异的非参数检验方法。

它基于样本排名来计算统计量，并通过查表或使用软件进行显著性判断。

四、Friedman秩和检验Friedman秩和检验是一种用于比较多个相关样本之间差异的非参数检验方法。

它基于样本排名来计算统计量，并通过查表或使用软件进行显著性判断。

五、符号检验符号检验是一种用于比较两个相关样本之间差异的非参数检验方法。

它基于样本差异的符号来计算统计量，并通过查表或使用软件进行显著性判断。

六、秩相关检验秩相关检验是一种用于比较两个相关样本之间关系的非参数检验方法。

它基于样本排名来计算统计量，并通过查表或使用软件进行显著性判断。

七、分布拟合检验分布拟合检验是一种用于检验数据是否符合某个特定分布的非参数检验方法。

它基于样本数据与理论分布之间的差异来计算统计量，并通过查表或使用软件进行显著性判断。

八、重复测量ANOVA重复测量ANOVA是一种用于比较多个相关样本之间差异的非参数检验方法。

它基于样本方差和均值来计算统计量，并通过查表或使用软件进行显著性判断。

九、Bootstrap法Bootstrap法是一种用于估计总体参数和构建置信区间的非参数方法。

它基于自助重采样技术来生成大量虚拟样本，以此估计总体参数和构建置信区间。

8非参数检验

②正态近似法：
u | T n0 ( N 1) / 2 | n1n2 ( N 1) / 12
本例u 2.205 0.05/ 2 1.96
N3 N ; 3 3 N N (ti ti )
i
*校正公式（当相同秩次较多时）
uc u c; c
ti为第i个相同秩号的数据个数
假定：两组样本的总体分布形状相同
如果两总体分布相同
基本思想
两样本来自同一总体任一组秩和不应太大或太小
T 与平均秩和 n0 (1 N ) / 2 应相差不大
较小例数组的秩和, n1 n2 T min( R1 , R2 ), n1 n2
N n1 n2 n0 min( n1 , n2 )
控制显效有效近控
65 18 30 13 126
107 24 53 24
1-107 108-131 132-184 185-208
54 119.5 158 196.5
编号 1 2
病情单纯型单纯型合并肺气肿
疗效控制显效
3
4 … 206 207
单纯型合并肺气肿
单纯型 … 单纯型单纯型合并肺气肿
10 12(12 1) / 4 | R n(n 1) / 4 | u 2.275 n(n 1)(2n 1) / 24 12(12 1)(2 12 1) / 24
查标准正态分布表，得 P 值校正公式：（当相同秩次个数较多时）
u
| R n(n 1) / 4 | n(n 1)(2n 1) / 24 (ti3 ti ) / 48 10 12(12 1) / 4
第一节非参数检验的概念

第九章非参数检验方法

胃癌患者，观察其生存时间如表9-4所示，问两组患者的生存时间是否不同？
n1=10
T1=162
假设检验的要点
1. 2. 3. 4. 混合编秩、数据相等时取平均秩分别求两组的秩和以样本量较小组的秩和为T 查成组设计的T界值表、确定P值
1.建立检验假设： H0：两组患者生存时间的总体分布相同 H1：两组患者生存时间的总体分布不同 α＝0.05 2.计算检验统计量T值 ⑴编秩 ⑵求秩和，确定统计量T 3.确定P值（T界值：91～159）；做出推断结论
n1=8
T1=26
n2=7
T2=134
n3=9
n4=8
T4=54.5
秩和检验的两两比较
1、扩展的t检验 2、Nemenyi法检验
习题
• P105~P107 第1、3、5、7题
T1 16.2，T2＝9.86
n1=10
T1=162
• 正态近似法
①当n1≤10，n2n1≤10 ，查T界值表（两样本比较的秩和检验用）确定P值；
②当n1>10或n2>20的大样本时，对T进行u转换，则可用正态近似法：
| T n1 ( N 1) / 2 | 0.5 u n1n2 ( N 1) /12
1312312051211iitnnuttnnnnn?????????????????二等级资料的秩和检验表95两组人痰液嗜酸性粒细胞的秩和计算例数统一编秩嗜酸性粒细胞数健康人病人范围平均秩次例数较小组病人组的秩和51111685935181810101744174430530530503050?若选行列表资料的卡方检验只能推断两组样本疗效构成比的差别有无统计学意义损失疗效的等级信息应采用秩和检验可推断两组等级强度的差别有无统计学意义比较两组病情的疗效

非参数检验

200
200
取显著性水平为0.05，查 2 分布表得临界值
2 0.05
(4)
9.488
，由于
2统计量大于临界值，所以应该拒
绝原假设，即认为消费者对各种品牌茶叶的偏好是有差
别的。
二、符号检验
1. 单样本位置的符号检验
一个随机样本，有 n 个数据
x1,x2,…,xn，其实际的总体中位数为
M，假定的中位数是某个特定值，记做 M0 。位置检验是检验真实的中位数和假定的中位数的关系：大于、等于还是小于。
品牌，每一种只标上A、B、C、D、E，随机抽取1000消费者，每人都品尝五种茶叶，然后把最偏好的茶叶的字母写下来。下表是整理后的消费者偏好的频数分布。要求判断消费者对这几种品牌茶叶的偏好有没有差异？
各种品牌茶叶爱好者的频数分布
喜欢的品牌
A B C D E
合计
人数
220 302 175 80 223
一、检验
属于拟合程度检验，它是利用随机样本对总体分布与某种特定
分布拟合程度的检验。
检验步骤：
① 确立原假设和备择假设。 ② 按照“原假设为真”的假定，导出一组期望频数或理论频数。 ③ 计算 2 统计量。
2 k ( fi ei )2
i1
ei
若统计量的值较大，拒绝原假设。
【例10.14】假定有五种不同牌号的茶叶，但都未标明
市场调查
【例10.15】领导者的领导水平是可以训练的吗？
根据人的聪明程度、人品、受教育状况等，随机抽取30 人配成15对，每对中有一人随机选择受训，另一人不受训。经过一段时间后，按被设计好的问题评价他们的领导水平，结果如下表所示。
领导水平评价表

非参数检验

两种方法治疗扁平足效果观察
建立假设
病例号
原始记录 A法 B法
量化值 A法 B法
差值
秩次
H0：两法疗效差值的总体中位数
1 2
为0；
3
4
H1：差值的总体中位数不为0。
5
6
=0.05
7
8
计算检验统计量
9
10
编秩：
11
12
求秩和：T＋=61.5，T－
13
=4.5
14 15
好
差
好
好
好
差
好
中
差
中
中
差
好
中
好
差
秩和(rank sum)：同组秩次之和；在一定程度上反映了等级的分布位置。
秩和检验：就是通过秩次的排列求出秩和，进行假设检验。
11
非参数检验 (nonparametric test )
非参数检验的最常用方法——秩和检验（ rank test ）利用秩的大小进行推断就避免了不知道背景分布的
困难。这也是非参数检验的优点。多数非参数检验明显地或隐含地利用了秩的性质；
但也有一些非参数方法没有涉及秩的性质。掌握对数据进行编秩的方法是学习秩和检验的基本
要求。
12
非参数检验 (nonparametric test )
非参数检验的最常用方法——秩和检验（ rank test ）
A组：－、、+、+、+、＋、++、++、++、++、+++、+++
适用条件：（1）上述两种设计类型的资料不满足参数检验条件。（2）配对设计等级资料的比较。

第9章非参数检验

9.7多个独立样本比较秩和检验
1.多组计量资料的非参数检验
对于多组计量资料不服从正态性、方差齐性条件或经转换后也不满足，则采用H检验法
例9-8研究白血病时，测定四组鼠脾DNA的含量，结果如下表，分析各组DNA含量有无差别？(α=0.05)
正常脾
12.3
患自发性白血病的脾 10.8
患移植白血病的脾（甲组） 9.3
列联表(二维列联表按两个属性分类的表)分类： 1)双向无序表（检验法：Pearson卡方检验） 2)双向有序表（检验法：McNemar检验、Kappa检验） 3)单向有序表（等级资料，检验法：非参数检验）
Guiyang College of Traditional Chinese Medicine
例9-7《成都中医药大学学报》2004年第2期《益心钦口服液治疗冠心病心率失常的疗效》一文，调查数据如下表，判断其疗效与对照组是否相同？ (α=0.05)
Guiyang College of Traditional Chinese Medicine
2.等级资料两样本比较秩和检验
医药学研究中的等级资料： 1)疗效：痊愈、显效、有效、无效、恶化 2)化验结果：－ ++ +++ 3)体格发育：下等、中下、中等、中上、上等 4)心功能分级：I、II、III… 5)营养水平：差、一般、好
1959 30.5 1969 11.8
1960 24.5 1970 12.4
Guiyang College of Traditional Chinese Medicine
SPSS操作步骤
1)建立数据文件：变量名为x 2)Analyze→Nonparametric Tests→Runs,

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

目录第八章非参数检验 ________________________________________________________________________ 2第一节非参数检验概述 __________________________________________________________________ 3第二节单样本非参数检验 ________________________________________________________________ 3χ拟合优度检验__________________________________________________________________ 3一、2二、单样本K-S检验___________________________________________________________________ 5三、符号检验 _________________________________________________________________________ 6四、游程检验 _________________________________________________________________________ 7χ的独立性检验_________________________________________________________ 8第三节列联表与2第四节等级相关分析 ___________________________________________________________________ 10一、Spearman等级相关系数____________________________________________________________11二、Kendall等级相关系数 _____________________________________________________________ 12英文摘要与关键词 ______________________________________________________________________ 14习题 _________________________________________________________________________________ 15第八章非参数检验通过本章的学习，我们应该知道：1.非参数检验的优缺点2.常用的单样本非参数检验方法3.列联表与卡方的独立性检验4.S pearman和Kendall 等级相关系数的计算第一节非参数检验概述非参数检验（nonparametric tests ）是相对于参数检验而言的。

参数检验是一种适用于一些特定环境下的检验，如第六章中进行的均值检验就属于参数检验，首先它对总体作出了服从正态分布的假设，然后根据来自总体的样本资料对均值进行检验。

但在许多实际问题中，人们往往对总体的分布形式知之甚少，很难有正确的假定，这样就不能满足参数检验的条件，也就不能用参数检验方法了。

假定总体分布的具体形式未知，而是从样本数据本身来获得所需信息，对总体分布的类型和位置进行检验，这称为非参数检验。

非参数检验的特点是：1. 从非参数检验的前提条件看，仅要求“观测值是独立的”、“变量具有连续性”等简单假设，不要求确保样本所属的总体符合某种理论分布。

检验不受总体分布形状的限制，使得适用范围更为广泛。

2. 从非参数检验方法对原始数据的要求看，它不要求有很精确的计量值，可以使用分类数据和顺序数据，非参数检验的处理方法大都基于低精度数据，因而它几乎可以处理如何类型的数据。

3. 从非参数检验方法的效率看，虽然非参数检验的计算方法名目繁多，有时对某类数据的算法就有多种，但其表现形式一般比较简单并易于理解，依照不同类型数据的不同算法，效率也不同。

研究表明，多数常用的非参数检验方法的效能是参数检验方法的95%左右。

也就是说，通过95次独立观察获得的数据能够保证参数检验所要达到的精度，那么若用非参数检验方法，则需要100次的独立观察。

总之，非参数检验需要更大的样本容量来保证所要求的检验精度。

本章介绍单样本非参数检验（single-sample nonparametric test ）的常用方法：2χ拟合优度检验、K-S 检验、符号检验和游程检验，以及列联表与卡方的独立性检验。

第二节单样本非参数检验对获取的样本资料，往往最希望了解其所属总体的分布形态是否与已知的理论分布相吻合，或它们是否具有随机性。

人们可以通过绘图作粗略判断，但如果希望得到比较准确的结论，则需要用非参数检验。

下面介绍的方法中，2χ检验、K-S 检验和符号检验都属于拟合优度检验，即都是检验属于每一类别的观测数目与根据零假设所得到的期望数目之间是否有显著性差异；游程检验是用来对样本数据的随机性进行的检验。

一、2χ拟合优度检验2χ拟合优度检验（chi-square goodness-of-fit test ）适用于具有明显分类特征的数据。

如要研究消费者对某种产品是否有“颜色”的偏好，可以将200位消费者按购买不同颜色的产品分类，得到各颜色购买者的人数。

根据这些样本数据来判断样本所属的总体分布与某一设定分布是否有显著差异，所谓设定分布可以是我们熟悉的理论分布，如正态分布、均匀分布等，也可以是任何想象的分布。

零假设0H 是：样本所属总体其分布形态与设定分布无显著差异。

在进行检验时需要构造下面的2χ统计量： ∑=-=ki ei ei i f f f 1202)(χ （8.1）式中：k 是样本分类的个数，i f 0表示实际观察到的频数，ei f 表示设定频数，即理论频数。

可见，如果观察频数与设定频数越接近，则2χ值越小，根据皮尔逊定理，当n 充分大时，2χ统计量渐近服从于k-1个自由度的2χ分布。

我们可以计算出2χ统计量，判断有两种方法：一是依据2χ分布表，给出所对应的概率值，如果该概率值小于或等于给定的显著性水平α，则拒绝0H ，即样本所属的总体分布形态与设定的分布存在显著差异；如果该概率值大于给定的显著性水平α，则不能拒绝0H ，即没有理由认为样本所属的总体分布形态与设定分布有显著差异。

二是依据2χ分布表，给出α所对应的临界值2αχ，如果2χ统计量大于或等于临界值，则拒绝0H ，认为样本所属的总体分布形态与设定分布存在显著差异；如果2χ统计量小于临界值，则不能拒绝0H 。

由于奠定检验基础的皮尔逊定理要求样本是充分大，所以在搜集资料时必须要保证样本容量不小于50，同时每个单元中的期望频数不能太小,如果第一次分类时有单元中的频数小于5，则需要将它与相邻的组进行合并，如果20%的单元理论频数e f 小于5，则不能用2χ检验了。

【例8.1】某企业生产线上星期一至星期五的不合格产品数量如下表所示，试检验五个不同工作日的产品不合格率是否相同（α=0.05）？【解】0H ：五个不同工作日的产品不合格数相同；1H ：五个不同工作日的产品不合格数不相同。

由于不合格品数的实际数是134，所以其理论值为134÷5 = 26.8。

表8.1是相关数据的计算。

22χ统计量为16.2239，其对应的近似概率值为0.0027。

由于0.0027<0.05，故拒绝0H ，也就是说，五【例8.2】接上题，有人认为产品的不合格率与工人的情绪有关，星期一刚来上班情绪最不稳，不合格率为30%，星期二、五的不合格率次之，为25%，而星期三、四的不合格率仅为10%，这种观点有道理吗？以显著性水平α=0.05来检验这种说法的正确性。

【解】 0H ：%25%,10%,10%,25%,3054321=====πππππ1H ：至少有一个)5,4,3,2,1(=i i π与上述比例不同。

计算在各设定的比例为真的情况下，每天的不合格品数，如星期一的不合格品数为：134×30%=40.2，星期二的不合格品数为：134×25%=33.5，……，依次类推。

相关计算可借助Excel 数据表，结果见图8.1。

图8.12χ统计量的计算表由于实际的2χ统计量1.2687小于α=0.05对应的临界值9.4877，或根据2χ统计量对应的概率0.8667大于α，所以不能拒绝0H ，即没有理由认为假想的比例是错的。

二、单样本K-S 检验单样本K-S 检验（1-sample K-S test ）是以两位苏联数学家柯尔莫哥（Kolmogorov ）和斯米诺夫（Smirnov ）命名的。

K-S 检验是一种拟合优度检验，研究样本观察值的分布和设定的理论分布间是否吻合，通过对两个分布差异的分析确定是否有理由认为样本的观察结果来自所设定的理论分布总体。

设)(x S n 是一个n 次观察的随机样本观察值的累积概率分布函数，即经验分布函数；)(0x F 是一个特定的累积概率分布函数，即理论分布函数。

定义)()(0x F x S D n -=，显然若对每一个x 值来说，)(x S n 与)(0x F 十分接近，也就是差异很小，则表明经验分布函数与特定分布函数的拟合程度很高，有理由认为样本数据来自具有该理论分布的总体。

K-S 检验主要考察的是绝对差数)()(0x F x S D n -=中那个最大的偏差，即利用下面的统计量作出判断。

)()(max 0max x F x S D n -= （8.2）K-S 检验的步骤为：1. 提出假设：)()(:00x F x S H n =，)()(:01x F x S H n ≠2. 计算各个D ，找出统计量max D3. 查找临界值：根据给定的显著性水平α和样本数据个数n ，查《单样本K-S 检验统计量表》可以得到临界值αD （单样本K-S 检验统计量表见附录六）。

4. 作出判定：若max D ≥αD ，则在α水平上，拒绝0H ；若max D <αD ，则不能拒绝0H ；【例8.3】随机抽取100名生产线上的工人，调查他们的日产量，资料情况如下表，判断生产线上工【解】0H ：)(x S n 服从正态分布，1H ：)(x S n 不服从正态分布。

根据所给的资料，借助Excel 进行相关的计算，见图8.2：图8.2 max D 统计量的计算表查表得136.010036.1==αD ，由于max D = 0.0430<αD ，所以，不能拒绝0H ，即生产线上工人的日产量服从正态分布。

比较2χ检验与K-S 检验：两者均属拟合优度检验，2χ检验常用于分类数据，而K-S 检验还可以运用于顺序数据。

非参数检验

【统计分析】非参数检验

第6章 非参数检验

常见的几种非参数检验方法

8非参数检验

第九章 非参数检验方法

非参数检验

非参数检验

第9章 非参数检验

第6章非参数检验

第九章非参数检验方法

第9章非参数检验