SPSS非参数检验
第7章spss非参数检验

Statistics按钮: 计算卡方值,用于行列
变量的独立性检验
计算pearson和spearman 相关系数
定类资料的行列变 量相关性检验
定序资料的行列变 量相关性检验
定序与定距资料的行 列变量相关性检验
评判内部一致性 相关风险比例 两相关二项分类变量的非参检验
二项分类变量的因、自变量独立性检验
p(1 p) / n
17
【界面设置】
检验的落入第一组的 概率常数值
分组值,小于该值为1 组,其余为1组
注意大小样本的选择
18
【结果形式】
19
7.3 Runs 游程检验 主要用于对二分变量(数值型)或利用断点分 为两组的变量,检验取值的分布随机性或两总体分 布是否一致,即一个case的取值是否影响下一个。 统计原假设H0:样本二分值分布是随机的或两总体分 布相同。
5、 2 Independent Samples 两独立(成组)样本检验
6、 K Independent Samples K个独立样本检验 5、 2 Related Samples 两关联(配对)样本检验 6、 K Related Samples K个关联样本检验
2
7.1 Chi-Square
1、卡方拟合优度检验 (Nonparametric Tests - Chi-Square) 主要用于分析实际频数与理论频数(已知)拟合情况;χ2 值反映了实际频数和理论频数的吻合程度。χ2值越小, 说明实际频数与理论频数越吻合。 适用于一个变量的多项分类数据的检验分析。 统计原假设:实际频数与理论频数相等或实际构成比等于 已知构成比。 k ( f 0 f e )2 卡方统计量为 2
25
【界面设置】
SPSS的非参数检验

02
SPSS非参数检验概述
定义与特点
定义
非参数检验是在统计分析中,相对于参数检验的一种统计方法。 它不需要对总体分布做严格假定,只关注数据本身的特点,因此 具有更广泛的适用范围。
特点
非参数检验对总体分布的假设较少,强调从数据本身获取信息, 具有灵活性、稳健性和适用范围广等优点。
局限性
计算量大
对于大规模数据集,非参数检验的计算量可 能较大,需要较长的计算时间。
对数据要求高
非参数检验要求数据具有可比性,对于不可 比的数据集可能无法得出正确的结论。
解释性较差
非参数检验的结果通常较为简单,对于深入 的统计分析可能不够满足。
对异常值敏感
非参数检验对异常值较为敏感,可能导致结 果的偏差。
THANK YOU
感谢聆听
常用非参数检验方法
独立样本非参数检验
用于比较两个独立样本的差异 ,如Mann-Whitney U 检验 、Kruskal-Wallis H 检验等。
相关样本非参数检验
用于比较相关样本或配对样本 的关联性,如Wilcoxon signed-rank 检验、Kendall's tau-b 检验等。
等级排序非参数检验
案例二:两个相关样本的非参数检验
总结词
适用于两个相关样本的比较,如同一班级内不同时间点的成绩比较。
描述
使用SPSS中的两个相关样本的非参数检验,如Wilcoxon匹配对检验,可以比较两个相关样本的总体分布是否相 同。
案例二:两个相关样本的非参数检验
01
步骤
02
1. 打开SPSS软件,输入数据。
第七章SPSS非参数检验

二、SPSS两独立样本非参数检验
(一)目的 由独立样本数据推断两总体的分布是否存在显著差异
(或两样本是否来自同一总体)。 (二)基本假设 H0:两总体分布无显著差异(两样本来自同一总体) (三)数据要求 样本数据和分组标志
•第七章SPSS非参数检验
二、SPSS两独立样本非参数检验
– 与样本在相同点的累计频率进行比较。如果相差较小,则认为样
本所代表的总体符合指定的总体分布。
•第七章SPSS非参数检验
一、SPSS单样本非参数检验
(三)K-S检验 (4)基本步骤
菜单选项:analyze->nonparametric tests->1-sample k-s 选择待检验的变量入test variable list 框 指定检验的分布名称(test distribution)
将两样本混合并按升序排序 分别计算两个样本在相同点上的累计频数和累计频率 两个累计频率相减。 如果差距较小,则认为两总体分布无显著差异
应保证有较大的样本数
案例:7-5 p194使用寿命
•第七章SPSS非参数检验
二、SPSS两独立样本非参数检验
3.游程?检验(Wald-Wolfowitz runs)
一、SPSS单样本非参数检验
(二)总体分布的二项分布检验 (1)目的
通过样本数据检验样本来自的总体是否服从指定的 概率p的二项分布根据 (2)原假设 样本来自的总体与指定的二项分布无显著差异。 (3)案例7-2 p187 产品合格率
•第七章SPSS非参数检验
一、SPSS单样本非参数检验
(三)K-S检验 (1)目的
•第七章SPSS非参数检验
五、SPSS多配对样本非参数检验
SPSS第讲非参数检验(共72张PPT)

SPSS应用
Kendall协同系数检验中会计算Friedman检验方 法,得到friedman统计量和相伴概率。如果相伴概
率小于显著性水平,可以认为这10个节目之间没有 显著差异,那么可以认为这5个评委判定标准不一 致,也就是判定结果不一致。
SPSS应用
3.多配对样本的Cochran Q检验
多配对样本的Cochran Q检验也是对多个互 相匹配样本总体分布是否存在显著性差异的统计 检验。不同的是多配对样本的Cochran Q检验所能 处理的数据是二值的(0和1)。其零假设是:样 本来自的多配对总体分布无显著差异。
SPSS应用
单样本K-S检验可以将一个变量的实际频数分
布与正态分布(Normal)、均匀分布(Uniform)、
泊松分布(Poisson)、指数(Exponential)分 布进行比较。其零假设H0为样本来自的总体与指定
的理论分布无显著差异。
SPSS应用
6.2 两配对样本非参数检验
6.2.1 统计学上的定义和计算公式
SPSS应用
两配对样本非参数检验的前提要求两个样本 应是配对的。在应用领域中,主要的配对资料包 括:具有年龄、性别、体重、病况等非处理因素 相同或相似者。首先两个样本的观察数目相同, 其次两样本的观察值顺序不能随意改变。
SPSS应用
SPSS中有以下3种两配对样本非参数检验方 法。
SPSS应用
1验.两配对样本的McNemar变化显著性检
SPSS应用
2.两配对样本的符号(Sign)检验
当两配对样本的观察值不是二值数据时,无法 利用前面一种检验方法,这时可以采用两配对样本
的符号(Sign)检验方法。其零假设为:样本来
自的两配对样本总体的分布无显著差异。
第5讲SPSS非参数检验

数据文件:“糖果中的卡路里.sav” 菜单:“分析→非参数检验→旧对话框→K个独立样本”
多独立样本非参数检验整体分析与设计的内容
输入最大值、 最小值。
Kruskal-Wallis H检 验:是曼-惠特尼U 检验在多个独立样 本下的推广。
检验各个样本是否来自有相同中位数的 总体。--- 这种检验的效能最低。
2)对数据的测量尺度无约束,对数据的要求也不严格,任何数据类型 都可以。
3)适用于小样本、无分布样本、数据污染样本、混杂样本等。
注:若参数检验模型的所有假设在数据中都能满足,而且测量达到了所 要求的水平,那么,此时用非参数检验就浪费了数据。
因此,若所需假设都满足的情况下,一般就选择参数检验方法。
卡方检验
此时,零假设:两总体的 均值无显著性差异;就可 能不成立。
K-S检验。以变量的秩 作为分析对象;而非变 量值本身。
也需要先将两组样本混 合、升序排列。
两独立样本非参数检验整体分析与设计的内容 二、操作
该检验有特定用途,给出的结果均为单侧 检验。若施加的处理时的某些个体出现正 向效应,而另一些个体出现负向效应时, 就应当采用该检验方法。 基本思想为:将一组样本作为控制样本, 另一组作为试验样本。以控制样本为对照, 检验试验样本相对于控制样本是否出现了 极端反应。若无极端反应,则认为两总体 分布无显著性差异;否则,有显著性差异。
选择分布
“结”的处理
单样本K-S检验
整体分析与设计的内容
三、补充描述性统计的P-P图和Q-Q图
P-P图的输出样子: P-P图
期望(理论)累计 概率值
去势P-P图
样本数据实际累计 概率值
实际与期望的差值
样本数据实际累计 概率值
SPSS教程-非参数检验

一般用来对两个独立样本的均数、中位数、离 散趋势、偏度等进行差异比较检验。
两个样本是否独立,主要看在一个总体中抽取 样本对另外一个总体中抽取样本有无影响。
Mann-Whitney检验
=0.18576
计算表
SPSS基本操作
SPSS基本操作
SPSS基本操作
SPSS基本操作
SPSS基本操作
单样本K-S检验
利用样本数据推断样本来自的总体是否服从某一理论 分布,是一种拟合优度的检验方法,适用于探索连续 型随机变量的分布
步骤
计算各样本观测值在理论分布中出现的理论累计概率值F(x) 计算各样本观测值的实际累计概率值S(x) 计算理论累计概率值与实际累计概率值的差D(x) 计算差值序列中最大绝对差值D
针麻效果
(1) Ⅰ Ⅱ Ⅲ Ⅳ
表
肺癌 (2) 10 17 19 4
三种病人肺切除术的针麻效果比较肺化脓症Fra bibliotek肺结核
(3)
(4)
24
48
41
65
33
36
7
8
合计 (5) 82 123 88 19
SPSS基本操作
与例7的操作相同
随机区组设计资料的秩和检验
M检验(Friedman法)法计算步骤
将每个区组的数据由小到大分别编秩 计算各处理组的秩和Ri 求平均秩:R=1/2b(k+1) 计算各处理组的( Ri-R) 求M 查M界值表,F近似法
参数统计(parametric statistics) : 在 统计推断 中,若样本所来自的总体分布为已知的函数形式 (正态/近似正态分布),但其中的参数未知,统 计推断的目的就是对这些未知参数进行估计/检验, 这类统计推断方法称参数统计。
非参数检验-SPSS
非参数检验-SPSS什么是非参数检验?非参数检验是一种统计假设检验方法,它不依赖于总体的任何假设条件,如总体分布的正态性、方差的同一性等。
与参数检验相比,非参数检验更加灵活,能够适应更多的数据情况。
为什么需要非参数检验?当我们的数据不满足正态分布等假设条件时,就需要使用非参数检验。
此外,非参数检验还有以下优点:1.不需要知道总体分布的具体形态,从而更加适用于实际情况2.对于离群值和极端值并不敏感3.数据缺失并不会影响检验结果SPSS中的非参数检验现在我们来介绍SPSS中的非参数检验。
1. Wilcoxon符号秩检验Wilcoxon符号秩检验旨在检验两组配对样本的中位数差异是否为零。
它的原假设是两组样本中位数相同。
首先,我们需要打开SPSS,导入数据集,然后点击菜单栏中的“数据”-“配对样本T检验”-“Wilcoxon符号秩检验”。
接下来,我们需要在弹出的对话框中选择配对变量,然后点击“OK”即可得到检验结果。
2. Mann-Whitney U检验Mann-Whitney U检验是一种非参数检验方法,用于检验两组独立样本的中位数是否相同。
它的原假设是两组样本中位数相同。
要进行Mann-Whitney U检验,我们需要打开SPSS,导入数据集,然后点击菜单栏中的“分析”-“非参数检验”-“2独立样本”。
接着,在弹出的对话框中选择两组样本的变量,并设置分析的方法为“Mann-Whitney U检验”。
最后点击“OK”即可得到检验结果。
3. Kruskal-Wallis检验Kruskal-Wallis检验是一种非参数检验方法,用于检验多个独立样本的中位数是否相同。
它的原假设是多组样本中位数相同。
要进行Kruskal-Wallis检验,我们需要打开SPSS,导入数据集,然后点击菜单栏中的“分析”-“非参数检验”-“Kruskal-Wallis检验”。
接着,在弹出的对话框中选择多组样本的变量,并点击“OK”即可得到检验结果。
spss使用教程非参数检验
SPSS二项分布检验就是根据收集到的样本 数据,推断总体分布是否服从某个指定的二项 分布。其零假设是H0:样本来自的总体与所指 定的某个二项分布不存在显著的差异。
第24页/共152页
SPSS中的二项分布检验,在样本小于或等 于30时,按照计算二项分布概率的公式进行计 算;样本数大于30时,计算的是Z统计量,认 为在零假设下,Z统计量服从正态分布。Z统计 量的计算公式如下
人数 2 4 7 16 20 25 24 22 16 2 6 1
第49页/共152页
实现步骤
图10-12 在菜单中选择“1-Sample K-S”命令
第50页/共152页
图10-13 “One-Sample Kolmogorov-Smirnov Test”对话框
第51页/共152页
图10-14 “One-Sample K-S:Options”对话框
第28页/共152页
表10-2
35名婴儿的性别
婴儿
Sex
婴儿
Sex
婴儿
Sex
1
1
13
1
25
1
2
0
14
1
26
1
3
1
15
1
27
0
4
1
16
1
28
0
5
1
17
0
29
0
6
1
18
0
30
0
7
0
19
0
31
1
8
0
20
0
32
0
9
0
21
0
33
0
10
SPSS中非参数检验方法
1. 总体分布的卡方(Chi-square)检验 2. 二项分布检验 3. SPSS单样本变量的随机性检验 4. SPSS单样本的K-S检验 5. 两个独立样本的非参数检验 6. 多个独立样本的非参数检验 7. 两个配对样本的非参数检验 8. 多配对样本的非参数检验
本章主要介绍总体分布的卡方(Chi-square) 检验、二项分布(Binomial)检验、单样本K-S ( Kolmogorov-Smirnov ) 检 验 、 单 样 本 变 量 值 随机性检验(Runs Test);两独立样本非参数 检验、多独立样本非参数检验、两配对样本非 参数检验、多配对样本非参数检验等8类常用的 非参数检验方法。
前面已经讨论的统计分析方法,对总体有特殊的要求,如T检 验要求总体符合正态分布;F检验要求误差呈正态分布,且各 组方差齐,等等。这些方法常用来估计或检验总体参数,统 称为参数检验。
现实中,许多调查或实验所得的科研数据,其总体分布未知 或无法确定。因为有的数据不是来自所假定分布的总体,或 者数据根本不是来自一个总体;还有可能数据因为某种原因 被严重污染。这样在假定分布的情况下进行推断的做法,就 有可能产生错误的结论。此时人们希望检验对一个总体分布 形状不必作限制。
人数 2 4 7 16 20 25 24 22 16 2 6 1
实现步骤
在菜单中选择“1-Sample K-S”命令
“One-Sample Kolmogorov-Smirnov Test”对话框
“One-Sample K-S:Options”对话框
4.3 结果和讨论
(1)本例输出结果如下表所示。
总体分布的卡方检验的数据是实际收集到 的样本数据,而非频数数据。
1.2 SPSS中实现过程
SPSS数据分析教程-第6章-非参数
Median test
独立样本检验举例
➢ 一个公司把他们的销售代表随机分到三个 不同的组中,进行不同的培训。两个月后 对销售进行考察,我们想通过非参数检验 比较不同组别的销售代表考试得分是否有 显著性差异。这里,不同组别的考试得分 是相互独立的,因此为独立样本数据,我 们采用独立样本非参数检验。
➢
独立样本包括两个独立样本或者两个以上的独 立样本。
➢ SPSS提供的独立样本非参数检验的方法有:
两个独立样本分布的比较
Mann-Whitney U
Kolmogorov-Smimov
Wald-Wolfowitz K个独立样本分布的比较
Kruskal-Wallis
Jonckheere-Terpstra 比较全矩
➢ Wilcoxon符号秩检验用于检验样本所来自的 总体的中位数和所给的值是否有显著区别。 该检验适用于连续型数据(或者尺度数 据),它把观测值和原假设的中心位置之 差的绝对值的秩分别按照不同的符号相加 作为其检验统计量。
➢ Wilcoxon符号秩检验的假设为:
样本所来自的总体的中位数等于给定的数值。
游程检验
➢ 游程检验用于检验某一变量的两个值的出 现顺序是否随机,对于连续型变量的随机 性检验也可以转化为只有两个取值的分类 变量的随机性的检验。游程检验通过对样 本观测值的分析,用来检验该样本所来自 的总体序列是否为随机序列(又称为白噪 声序列)。它也可以用来检验一个样本的 观测值之间是否相互独立。
二项式检验
➢ SPSS的二项式检验通过样本数据检验样本 来自的总体是否服从指定的二项分布。例 如,现代社会男、女的比例是否为1.01:1; 工厂的次品率是否为1%等都可以通过二项 式检验完成。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS非参数检验非参数检验 SPSS单样本非参数检验是对单个总体的分布形态等进行推断的方法,其中包括卡方检验、二项分布检验、K-S检验以及变量值随机性检验等方法。
参数检验与非参数检验的区别:参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。
但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。
非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。
由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数检验”。
一、几种常见的非参数检验1、总体分布的卡方检验卡方检验方法可以根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常适于对有多项分类值的总体分布的分析。
它的原假设是:样本来自的总体分布与期望分布或某一理论分布无差异。
例如,医学家在研究心脏病人猝死人数与日期的关系时发现:一周之中,星期一心脏病人猝死者较多,其他日子则基本相当。
当天的比例近似为2.8:1:1:1:1:1:1。
现收集到心脏病人死亡日期的样本数据,推断其总体分布是否与上述理论分布相吻合。
2、二项分布检验SPSS的二项分布检验正是要通过样本数据检验样本来自的总体是否服从指定的概率为P的二项分布,其原假设是:样本来自的总体与指定的二项分布无显著差异。
在生活中有很多数据的取值是二值的,例如,人群可以分成男性和女性,产品可以分成合格和不合格,学生可以分成三好学生和非三好学生,投掷硬币实验的结果可以分成出现正面和出现反面等。
通常将这样的二值分别用1或0表示。
如果进行n次相同的实验,则出现两类(1或0)的次数可以用离散型随机变量X来描述。
如果随机变量X为1的概率设为P,则随机变量X值为0的概率Q便等于1-P,形成二项分布。
从某产品中随机抽取23个样品进行检测并得到检测结果。
用1表示一级品,用0表示非一级品。
根据抽样结果验证该批产品的一级品率是否为90%。
3、单样本K-S检验K-S检验方法能够利用样本数据推断样本来自的总体是否服从某一理论分布,是一种拟合优度的检验方法,适用于探索连续型随机变量的分布。
单样本K-S检验的原假设是:样本来自的总体与指定的理论分布无显著差异,SPSS的理论分布主要包括正态分布、均匀分布、指数分布和泊松分布等。
例如,收集一批周岁儿童身高的数据,需利用样本数据推断周岁儿童总体的身高是否服从正态分布。
再例如,利用收集的住房状况调查的样本数据,分析家庭人均住房面积是否服从正态分布。
4、变量值随机性检验变量值随机性检验通过对样本变量值的分析,实现对总体的变量值出现是否随机进行检验。
例如,在投硬币时,如果以1表示出现的是正面,以0表示出现的是反面,在进行了若干次投币后,将会得到一个以1,0组成的变量值序列。
这时可能会分析“硬币出现正反面是否是随机的”这样的问题。
变量值随机性检验正是解决这类问题的一个有效方法。
它的原假设是:总体变量值出现是随机的。
变量随机性检验的重要依据是游程。
所谓游程是样本序列中连续出现相同的变量值的次数。
可以直接理解,如果硬币的正反面出现是随机的,那么在数据序列中,许多个1或许多个0连续出现的可能性将不太大,同时,1和0频繁交叉出现的可能性也会较小。
因此,游程数太大或太小都将表明变量值存在不随机的现象。
例:为检验某耐压设备在某段时间内工作是否持续正常,测试并记录下该时间段内各个时间点上的设备耐压的数据。
现采用游程检验方法对这批数据进行分析。
如果耐压数据的变动是随机的,可认为该设备工作一直正常,否则认为该设备有不能正常工作的现象。
二、检验方法1、两独立样本的非参数检验两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。
独立样本是指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。
SPSS中提供了多种两独立样本的非参数检验方法,其中包括曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。
某工厂用甲乙两种不同的工艺生产同一种产品。
如果希望检验两种工艺下产品的使用是否存在显著差异,可从两种工艺生产出的产品中随机抽样,得到各自的使用寿命数据。
甲工艺:675 682 692 679 669 661 693乙工艺:662 649 672 663 650 651 646 652(1)曼-惠特尼U检验两独立样本的曼-惠特尼U检验可用于对两总体分布的比例判断。
其原假设:两组独立样本来自的两总体分布无显著差异。
曼-惠特尼U检验通过对两组样本平均秩的研究来实现判断。
秩简单说就是变量值排序的名次,可以将数据按升序排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。
(2)K-S检验K-S检验不仅能够检验单个总体是否服从某一理论分布,还能够检验两总体分布是否存在显著差异。
其原假设是:两组独立样本来自的两总体的分布无显著差异。
这里是以变量值的秩作为分析对象,而非变量值本身。
(3)游程检验单样本游程检验是用来检验变量值的出现是否随机,而两独立变量的游程检验则是用来检验两独立样本来自的两总体的分布是否存在显著差异。
其原假设是:两组独立样本来自的两总体的分布无显著差异。
两独立样本的游程检验与单样本游程检验的思想基本相同,不同的是计算游程数的方法。
两独立样本的游程检验中,游程数依赖于变量的秩。
(4)极端反应检验极端反应检验从另一个角度检验两独立样本所来自的两总体分布是否存在显著差异。
其原假设是:两独立样本来自的两总体的分布无显著差异。
基本思想是:将一组样本作为控制样本,另一组样本作为实验样本。
以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端反应。
如果实验样本没有出现极端反应,则认为两总体分布无显著差异,相反则认为存在显著差异。
2、多独立样本的非参数检验多独立样本的非参数检验是通过分析多组独立样本数据,推断样本来自的多个总体的中位数或分布是否存在显著差异。
多组独立样本是指按独立抽样方式获得的多组样本。
SPSS提供的多独立样本非参数检验的方法主要包括中位数检验、Kruskal-Wallis检验、Jonckheere-Terpstra检验。
例:希望对北京、上海、成都、广州四个城市的周岁儿童的身高进行比较分析。
采用独立抽样方式获得四组独立样本。
(1)中位数检验中位数检验通过对多组独立样本的分析,检验它们来自的总体的中位数是否存在显著差异。
其原假设是:多个独立样本来自的多个总体的中位数无显著差异。
基本思想是:如果多个总体的中位数无显著差异,或者说多个总体有共同的中位数,那么这个共同的中位数应在各样本组中均处在中间位置上。
于是,每组样本中大于该中位数或小于该中位数的样本数目应大致相同。
(2)Kruskal-Wallis检验Kruskal-Wallis检验实质是两独立样本的曼-惠特尼U检验在多个样本下的推广,也用于检验多个总体的分布是否存在显著差异。
其原假设是:多个独立样本来自的多个总体的分布无显著差异。
基本思想是:首先,将多组样本数据混合并按升序排序,求出各变量值的秩;然后,考察各组秩的均值是否存在显著差异。
容易理解:如果各组秩的均值不存在显著差异,则是多组数据充分混合,数值相差不大的结果,可以认为多个总体的分布无显著差异;反之,如果各组秩的均值存在显著差异,则是多组数据无法混合,某些组的数值普遍偏大,另一些组的数值普遍偏小的结果,可以认为多个总体的分布有显著差异。
(3)Jonckheere-Terpstra检验Jonckheere-Terpstra检验也是用于检验多个独立样本来自的多个总体的分布是否存在显著差异的非参数检验方法,其原假设是:多个独立样本来自的多个总体的分布无显著差异。
基本思想与两独立样本的曼-惠特尼U检验类似,也是计算一组样本的观察值小于其他组样本的观察值的个数。
3、两配对样本的非参数检验两配对样本的非参数检验是对总体分布不甚了解的情况下,通过对两组配对样本的分析,推断样本来自的两个总体的分布是否存在显著差异的方法。
SPSS提供的两配对样本非参数检验的方法主要包括McNemar检验、符号检验、Wilcoxon符号秩检验等。
例:要检验一种新的训练方法是否对提高跳远运动员的成绩有显著效果,可以收集一批跳远运动员在使用新训练方法前后的跳远最好成绩,这样的两组样本便是配对的。
再例如,分析不同广告形式是否对商品的销售产生显著影响,可以比较几种不同商品在不同广告形式下的销售额数据(其他条件保持基本稳定)。
这里不同广告形式下的若干组商品销售额样本便是配对样本。
可见,配对样本的样本数是相同的,且各样本值的先后次序是不能随意更改的。
(1)McNemar检验McNemar检验是一种变化显著性检验,它将研究对象自身作为对照者检验其“前后”的变化是否显著。
其原假设是:两配对样本来自的两总体的分布无显著差异。
分析学生在学习“统计学”课程前后对统计学重要性的认知程度是否发生了显著改变,可以随机收集一批学生在学习“统计学”之前以及学完以后认为统计学是否重要的样本数据(0表示“不重要”,1表示“重要”)。
应该看到:两配对样本的McNemar检验分析的变量是二值变量。
因此,在实际应用中,如果变量不是二值变量,应首先进行数据转换后方可采用该方法,因而它在应用范围方面有一定的局限性。
(2)符号检验符号检验也是用来检验两配对样本所来自的总体的分布是否存在显著差异的非参数方法。
其原假设是:两配对样本来自的两总体的分布无显著差异。
首先,分别用第二组样本的各个观察值减去第一组对应样本的观察值。
差值为正则记为正号,差值为负则记为负号。
然后,将正号的个数与负号的个数进行比较,容易理解:如果正号个数和负号个数大致相当,则可以认为第二组样本大于第一组样本变量值的个数,与第二组样本小于第一组样本的变量值个数是大致相当的,从总体上讲,这两个组配对样本的数据分布差距较小;相反,如果正号个数和负号个数相差较多,则可以认为两个配对样本的数据分布差距较大。
应该看到:配对样本的符号检验注重对变化方向的分析,只考虑数据变化的性质,即是变大了还是变小了,但没有考虑变化幅度,即大了多少,小了多少,因而对数据利用是不充分的。
(3)Wilcoxon符号秩检验Wilcoxon符号秩检验也是通过分析两配对样本,对样本来自的两总体的分布是否存在差异进行判断。
其原假设是:两配对样本来自的两总体的分布无显著差异。
基本思想是:首先,按照符号检验的方法,分布用第二组样本的各个观察值减去第一组对应样本的观察值。
差值为正则记为正号,为负则记为负号,并同时保存差值数据;然后,将差值变量按升序排序,并求出差值变量的秩;最后,分布计算正号秩总和W+和负号秩和W-。