第七章SPSS的非参数检验
SPSS应用之非参数检验

SPSS应⽤之⾮参数检验统计学的假设检验可以分为参数检验和⾮参数检验,参数检验是根据⼀些假设条件推算⽽来,当这些假设条件⽆法满⾜的时候,参数检验的效能会⼤打折扣,甚⾄出现错误的结果,⽽⾮参数检验通常是没有假设条件的,因此应⽤范围⽐参数检验要⼴。
⾮参数检验在不做任何假设的情况下,最⼤限度的使⽤样本信息,利⽤统计学、数学的⽅法和技巧构造统计量并加以检验,在某些情况下,⾮参数检验⽐参数检验拥有更⾼的效能,尽管如此,我们也不能⼀味的使⽤⾮参数检验,毕竟参数检验更加严谨,通常都是在数据不符合参数检验的条件是,才使⽤⾮参数检验,因此,对于数据的前期观察是⾮常重要的。
⾮参数检验⽅法⾮常多,但是绝⼤部分⾮参数检验⽅法都是基于秩和结来构造统计量的,中⾮参数检验是⼀个独⽴的过程,也保留了旧对话框,新对话框按照样本情况分类,根据样本情况来选择⽅法,并且更倾向于⾃动化分析,旧对话框的分类则不是很明确,分我们按照新对话框来进⾏介绍分析—⾮参数检验—单样本⼀、单样本1.⼆项式检验⼆项式检验也称为⼆项分布检验,⽤来检验样本是否来⾃⼆项分布,也就是检查样本的观测值的频数与某⼀特定⼆项分布下的期望频数是否⼀致。
不仅可以针对于⼆分类变量,对于连续变量也可以当做⼆分类变量来处理,例如成绩的及格与否,产品的合格与否等。
本例中是想检验三门学科的及格率是否都在95%以上2.卡⽅检验卡⽅检验是最常⽤的多分类⾮参数检验,卡⽅统计量也⼴泛被其他检验所引⽤,卡⽅检验依据卡⽅分布,主要包括适应性检验和独⽴性检验,适应性检验⽤于检验实际观察频数与期望频数是否⼀致,独⽴性检验⽤于检验两组或多组计数资料是否相互独⽴。
3.K-S检验全称为Kolmogorov-Smirnow检验,在探索性中,也曾出现过⽤它来检验是否服从正态分布。
该检验属于⾮参数检验,⽤来检验某⼀单样本是否服从某⼀理论分布。
4.Wilcoxon符号秩检验该检验将符号和秩相结合,效能⽐单纯的符号检验和秩和检验都⾼,因此⽐较常⽤5.游程检验我们知道样本的随机性很重要,⽽游程检验就是⽤来检验样本数据是否是随机抽取的。
SPSS的非参数检验

02
SPSS非参数检验概述
定义与特点
定义
非参数检验是在统计分析中,相对于参数检验的一种统计方法。 它不需要对总体分布做严格假定,只关注数据本身的特点,因此 具有更广泛的适用范围。
特点
非参数检验对总体分布的假设较少,强调从数据本身获取信息, 具有灵活性、稳健性和适用范围广等优点。
局限性
计算量大
对于大规模数据集,非参数检验的计算量可 能较大,需要较长的计算时间。
对数据要求高
非参数检验要求数据具有可比性,对于不可 比的数据集可能无法得出正确的结论。
解释性较差
非参数检验的结果通常较为简单,对于深入 的统计分析可能不够满足。
对异常值敏感
非参数检验对异常值较为敏感,可能导致结 果的偏差。
THANK YOU
感谢聆听
常用非参数检验方法
独立样本非参数检验
用于比较两个独立样本的差异 ,如Mann-Whitney U 检验 、Kruskal-Wallis H 检验等。
相关样本非参数检验
用于比较相关样本或配对样本 的关联性,如Wilcoxon signed-rank 检验、Kendall's tau-b 检验等。
等级排序非参数检验
案例二:两个相关样本的非参数检验
总结词
适用于两个相关样本的比较,如同一班级内不同时间点的成绩比较。
描述
使用SPSS中的两个相关样本的非参数检验,如Wilcoxon匹配对检验,可以比较两个相关样本的总体分布是否相 同。
案例二:两个相关样本的非参数检验
01
步骤
02
1. 打开SPSS软件,输入数据。
SPSS第讲非参数检验(共72张PPT)

SPSS应用
Kendall协同系数检验中会计算Friedman检验方 法,得到friedman统计量和相伴概率。如果相伴概
率小于显著性水平,可以认为这10个节目之间没有 显著差异,那么可以认为这5个评委判定标准不一 致,也就是判定结果不一致。
SPSS应用
3.多配对样本的Cochran Q检验
多配对样本的Cochran Q检验也是对多个互 相匹配样本总体分布是否存在显著性差异的统计 检验。不同的是多配对样本的Cochran Q检验所能 处理的数据是二值的(0和1)。其零假设是:样 本来自的多配对总体分布无显著差异。
SPSS应用
单样本K-S检验可以将一个变量的实际频数分
布与正态分布(Normal)、均匀分布(Uniform)、
泊松分布(Poisson)、指数(Exponential)分 布进行比较。其零假设H0为样本来自的总体与指定
的理论分布无显著差异。
SPSS应用
6.2 两配对样本非参数检验
6.2.1 统计学上的定义和计算公式
SPSS应用
两配对样本非参数检验的前提要求两个样本 应是配对的。在应用领域中,主要的配对资料包 括:具有年龄、性别、体重、病况等非处理因素 相同或相似者。首先两个样本的观察数目相同, 其次两样本的观察值顺序不能随意改变。
SPSS应用
SPSS中有以下3种两配对样本非参数检验方 法。
SPSS应用
1验.两配对样本的McNemar变化显著性检
SPSS应用
2.两配对样本的符号(Sign)检验
当两配对样本的观察值不是二值数据时,无法 利用前面一种检验方法,这时可以采用两配对样本
的符号(Sign)检验方法。其零假设为:样本来
自的两配对样本总体的分布无显著差异。
SPSS软件应用-第七章非参数检验

病例号 照射前 照射后
1
1.0 0.0
2
1.0 18.0
3
0.0 6.7
4
1.2 0.0
5
1.0 29.0
6
1.0 17.0
7
1.0 5.0
8
1.0 6.0
9
1.0 10.0
10
4.0
7.0
Questions &
Answers
饲料
肝脏内铁含量(μg)
A 2.23 1.14 2.63 1.00 1.35
B 5.59 0.96 6.96 1.23 1.61
C 4.50 3.92 10.33 8.23 2.07
练习2
10例食管癌病人在某种药物保护下,做 6000γ的放射照射,观察血中淋巴细胞 畸变百分数,结果如下表。问照射前后 血中淋巴细胞畸变百分数有无差别。
7.1 拟合优度检验(1-Sample K-S Test)
以例7-1数据(数据文件名“diameter_sub.sav”)为例,试检验变量 “trueap_mean”(矢状面管径)是否服从正态分布。
7.1 拟合优度检验(1-Sample K-S Test)
7.1 拟合优度检验(1-Sample K-S Test)
第二步:Analyze Nonparametric Test Legacy Dialogs 2 Related Samples Test
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.6 多个相关样本的非参数检验
牙齿 普通 RPI Y型 编号 卡环 卡环 卡环
7.2 样本率与总体率比较的二项分布检验(Binomial)
非参数检验-SPSS

非参数检验-SPSS什么是非参数检验?非参数检验是一种统计假设检验方法,它不依赖于总体的任何假设条件,如总体分布的正态性、方差的同一性等。
与参数检验相比,非参数检验更加灵活,能够适应更多的数据情况。
为什么需要非参数检验?当我们的数据不满足正态分布等假设条件时,就需要使用非参数检验。
此外,非参数检验还有以下优点:1.不需要知道总体分布的具体形态,从而更加适用于实际情况2.对于离群值和极端值并不敏感3.数据缺失并不会影响检验结果SPSS中的非参数检验现在我们来介绍SPSS中的非参数检验。
1. Wilcoxon符号秩检验Wilcoxon符号秩检验旨在检验两组配对样本的中位数差异是否为零。
它的原假设是两组样本中位数相同。
首先,我们需要打开SPSS,导入数据集,然后点击菜单栏中的“数据”-“配对样本T检验”-“Wilcoxon符号秩检验”。
接下来,我们需要在弹出的对话框中选择配对变量,然后点击“OK”即可得到检验结果。
2. Mann-Whitney U检验Mann-Whitney U检验是一种非参数检验方法,用于检验两组独立样本的中位数是否相同。
它的原假设是两组样本中位数相同。
要进行Mann-Whitney U检验,我们需要打开SPSS,导入数据集,然后点击菜单栏中的“分析”-“非参数检验”-“2独立样本”。
接着,在弹出的对话框中选择两组样本的变量,并设置分析的方法为“Mann-Whitney U检验”。
最后点击“OK”即可得到检验结果。
3. Kruskal-Wallis检验Kruskal-Wallis检验是一种非参数检验方法,用于检验多个独立样本的中位数是否相同。
它的原假设是多组样本中位数相同。
要进行Kruskal-Wallis检验,我们需要打开SPSS,导入数据集,然后点击菜单栏中的“分析”-“非参数检验”-“Kruskal-Wallis检验”。
接着,在弹出的对话框中选择多组样本的变量,并点击“OK”即可得到检验结果。
使用SPSS软件进行非参数检验

使用SPSS软件进行非参数检验非参数检验是数理统计学中对样本数据进行检验的一种重要检验方法,文章具体讲述了SPSS统计软件对3个班级中21个学生的成绩样本进行非参数检验分析,得出总体成绩存在显著性差异,说明了SPSS统计软件应用于概率论与数理统计教学的可行性。
标签:SPSS软件;非参数检验;显著性差异;可行性非参数检验是数理统计学的一个分支,它与参数检验相对应。
参数检验是一种适应于在特定环境下的检验,对总体分布参数的均值或方差等进行推断的方法。
非参数检验是假定总体分布的具体形式未知,从样本的数据获得需要的信息,对总体分布的类型和位置进行检验。
1 非参数检验方法的特点和分类非参数检验适用性很广,不要求有精确的观测值,SPSS软件是一种易学易操作的软件,软件中包括8种非参数检验的分析方法,这8种方法被分为了两大类:分布类型检验方法和分布位置检验方法,在第二大类中包括以下4中检验:两个独立样本显著性差异、多个独立性样本显著性差异、两个相关样本差异的显著性检验和多个相关样本差异的显著性检验。
文章主要研究多个独立性样本的显著性差异。
2 应用实例随机抽取3个班级的学生,得到21个学生的成绩样本,成绩如表1所示,问总体成绩是否存在显著差异?(1)假设H0:總体成绩没有显著差异(2)操作步骤:a.在SPSS软件的数据编辑窗口中输入数据,两个变量(banji,chengji),21个样本,即输入2列21行;b.单击分析→非参数检验→K个独立样本命令,打开多个独立样本对话框;c.将变量chengji移入到检验变量列表,将banji移入分组变量列表,在分组变量定义框内定义分组变量的范围,最小值为1,最大值为3,选择检验类型中的前两个,第三种方法不适合本题目;如图1所示。
d.单击OK按钮,即在输出窗口显示Kruskal-Wallis检验和中值检验的计算结果。
3 结果分析在输出窗口中显示了Kruskal-Wallis检验和中值检验的计算结果,见表2、表3。
SPSS学习笔记非参数检验

学习必备欢迎下载总体分布未知,不会涉及有关总体分布的参数1.单样本非参数检验:卡方分布,二项分布,K-S检验,变量值随机性检验2.两独立样本非参数检验:两独立样本所来自的总体分布是否存在显著差异3.两配对样本非参数检验4.多独立样本非参数检验5.多配对样本非参数检验得到样本数据后,判断总体分布:直方图、P-P图、Q-Q图,或非参数检验1.1 卡方检验:根据样本数据,推断总体分布于期望分布或某一理论分布是否存在显著性差异,是一种吻合性检验,离散型数据。
原假设:样本来自总体的分布与期望分布或某一理论分布无显著性差异。
Eg:心脏病猝死人数与日期。
1.2二项分布检验:检验总体是否服从指定概率为P的二项分布,原假设:样本来自的总体与指定的二项分布无显著差异。
用于:二值型数据,性别,是否合格,是否为三好学生,硬币正反面等,用01表示。
注:检验概率值(检验比例)1.3单样本K-S检验:样本来自的总体是否与某一理论分布有显著差异,是一种拟合优度的检验方法。
用于:探索连续性变量的分布。
正态分布(normal)、均匀分布(uniform)、指数分布(ex.)、泊松分布。
原假设:样本来自的总体与指定的理论分布无显著差异。
另外,对于数据量很大的连续型变量,可以用图形直观判断。
P-P图:数据与理论分布一致时,各个数据点应落在对角线上。
Q-Q图:如果数据与理论分布无显著差异,点应分布在0横线附近。
(没找到啊?)2 Test type:Mann-Whitney: 秩:变量值排序的名次或位置K-S检验:游程检验Wald-wolfwitz Runs极端反应检验Moses Extreme Reactions:踢出极端值前后P值变化情况,是否踢出。
注:不同分析方法对同批数据的分析,结论可能不相同,要反复进行探索性分析,还要注意方法本身侧重点上的差异性。
4 中位数检验强调位置,Kruskal-Wallis检验侧重分析平均秩,Jonckheere比较同相对数。
SPSS非参数检验

多个独立样本的非参数检验
结果:当多样本比较时统计量近似服从卡方分布
Ran ks
吞噬指数
分组 对照组 A菌组 B菌组
Total
N 17 24 19 60
Mean Rank 1 4.03 3 9.85 3 3.42
Test Stat istics a,b
Ch i -Sq u are
吞噬 指数
22.6 71
140
a. Comput ed only for a 2x2 t able b. 0 cells (.0%) have expected count less than 5. The minimum expect ed count is 17.57.
两(多)个率或构成比的比较
阅读检验结果 教科书:n≥40,T≥5时,使用普通卡方检验
df
(2-sided) (2-sided)
1
.005
1
.009
Exact Sig. (1-sided)
Likelihood Ratio
7.746
1
.005
Fisher's Exact Test
.008
.005
Linear-by-Linear Association 7.717
1
.005
N of Valid Cases
当两样本来自非正态总体或方差不齐时 H0:两总体分布相同 H1:两总体分布不同
11
两独立样本的非参数检验
应用案例 ➢ 分别对8名未患妊娠合并症的孕妇和9名患有妊娠合并
症的孕妇进行葡萄糖耐受水平的测试,据此推断这两 类孕妇的葡萄糖耐受能力是否不同?(naishou.sav)
12
两独立样本的非参数检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS
二项分布检验的基本操作与应用 (以产品合格率.sav为例) 分析
非参数检验
二项式
SPSS
输入检 验概率 值
SPSS
SPSS
由于概率P大于0.05, 所以不能拒绝原假设, 即认为一级品率不低 于0.9
SPSS 概念
单样本K-S检验
• K-S检验(Kolmogorow-Smirnov),该方法 能够利用样本数据推断样本来自总体是否 与某一个理论分布有显著差异,是一种拟 合优度的检验方法,适用于探索连续型随 机变量的分布。
k 0 2
e 2
SPSS
• 决策情况: 2 的概率 P ,则应拒 如果 绝原假设,即认为样本来自的总体分布 与期望分布或某一理论分布存在显著差 异;反之,则不存在显著差异。
SPSS
基本操作及应用举例 (以心脏病猝死.sav为例)
分析
非参数检验
卡方
SPSS
SPSS
输入检验 变量
输入理论(期 望)分布值
SPSS 1.在一个正20面体的各面上分别标出0~9个数 字,每个数字在两个面上标出,现将它投掷 805次,得出各数字朝上的次数。数据放在 Frequncy.sav文件中,试检验其均匀性。 2.试着检验抛硬币实验中,正面出现的概率 是否为1/2.数据在硬币结果.sav中。
练习
3.试着检验10个电子元件的使用寿命分布是 否服从指数分布?数据在电子元件使用寿 命.sav中。
SPSS
应用举例(以城镇和农村储户存款 SPSS 金额比较为例 )
SPSS
SPSS
SPSS 双样本
Kolmogorov-Smirnov 检验
SPSS
Wald-Wolfowitz 检验
SPSS
练习题
• 现有数据关于患者服用两种不同安眠药后 睡眠时间延长情况,请用四种不同方法来 检验两种不同安眠药对睡眠时间延长分布 是否有显著差异?
SPSS
分别对两组样本的秩求平均,得到两个平均秩 Wx/m和WY/m,然后比较它们的大小,若差值较大, 说明原假设很可能不成立。 计算两个样本各自优先于对方的秩的个数U1、U2, 即 1
然后对U1、U2大小进行比较,若它们相差较大时, 则有必要怀疑原假设的真实性。 计算WilcoxonW统计量,其为上述U1、U2较小 者所对应的秩和
SPSS
中位数检验
基本思想
• 概念:通过对多组独立样本的分析,检验 它们来自的总体的中位数是否存在显著差 异。 • 基本思想:如果多个总体的中位数没有显 著差异,那么这个共同的中位数应在各样 本组中均处在中间位置上。
SPSS
• 分析步骤: 首先,将多组样本混合按升序排序,并求出混合样 本的中位数。 然后,分别计算各组样本中大于和小于上述中位数 的样本个数,形成列联表。 接着,利用卡方检验方法分析各组样本来自的总体 对于上述中位数的分布是否一致。如果各组中大 于(或小于)上述中位数的样本比例大致相同, 则可认为多组样本有共同的中位数,它们来自的 总体的中位数没有显著差异。反之,则有显著差 异。 最后,进行统计决策。
分析
非参数检验
1-样本K-S
SPSS
SPSS
正态 分布
SPSS
SPSS
由于概率P大于 0.05,所以不能拒 绝原假设,即认为 周岁儿童身高的总 体分布与正态分布 无显著差异
P-P图
SPSS
SPSS
Q-Q图
SPSS
单样本K-S检验的基本操作与应用举例 以储户存款金额总体的分布检验为例
SPSS
SPSS 曼-惠特尼U检验 K-S检验 方法 w-w游程检验 极端反应检验
方法一:两独立样本的曼-惠特尼 SPSS U检验
基本思想 • 概念 通过对两组独立样本平均秩的研究来推断 它们来自的两个总体分布有无显著差异。 • 检验的基本步骤 首先将两组样本数据(X1,X2,…Xn)和 ( Y1,Y2,…Yn )混合并按升序排序,得到 每个数据各自的秩Ri
SPSS
第三节多独立样本的非参数检验
四城市周岁儿童身高样本数据
中位数检验 Kruskal-Wallis检 验 JonckheereTerpstra检验
城市 身高样本数据 北京 79,75,78,76, 72 上海 72,71,74,74, 73 成都 76,78,78,77, 75 广州 70,72,71,71, 69
SPSS
极端反应注重对跨度和截头跨度的分析。针对跨度 或截头跨度计算的H检验统计量为:
H (Qi Q)
i 1 m 2
小样本下,H统计量服从Hollander分布;大样本下, H统计量近似服从正态分布。 最后,进行统计决策。
SPSS
两独立样本的极端反应检验SPSS的基本操作 (以两独立样本-使用寿命为例)
方法四:两独立样本的 极端反应检验
基本思想
• 将一组样本作为控制样本,另一组样本作 为实验样本,以控制样本作为对照,检验 实验样本相对于控制样本是否出现了极端 反应。如果实验样本没有出现极端反应, 则认为两总体分布无显著差异;反之则差 异显著。
SPSS
• 具体分析过程: 首先,将两组样本混合按升序排序 然后,求出控制样本的最小秩 Qmin 和最大秩 Qmax,并计算出跨度S= Qmax- Qmin+1 接着, 为消除样本数据中极端值对分析结果 的影响,计算跨度之前可按比例去除控制 样本中部分靠近两端的样本值,然后再求 跨度,得到截头跨度。
i i
D max( S ( xi1 ) F ( xi ) )
SPSS
• 决策情况: 如果D统计量的概率 P值小于显著 性水平 ,则应拒绝原假设,即认 为样本来自的总体分布与指定的分布 存在显著差异;反之,则不存在显著 差异。
SPSS
单样本K-S检验的基本操作与应用举例 以儿童身高.sav为例
SPSS
根据游程数计算Z统计量
2n1n2 r 1 n1 n2 2n1n2 (2n1n2 (n1 n2 )) (n1 n2 ) 2 (n1 n2 1)
Z
最后,进行统计决策。
两独立样本的游程检验SPSS的基本操作 SPSS
(以两独立样本-使用寿命为例)
SPSS
SPSS
SPSS
第7章 SPSS非参数检验
前面进行的假设检验和方差分析, 大都是在数据服从ห้องสมุดไป่ตู้态分布或近似地服 从正态分布的条件下进行的。但是如果 总体的分布未知,如何进行总体参数的 检验,或者如何检验总体服从一个指定 的分布,都可以归结为非参数检验方法。
SPSS
本章主要内容
单样本的非参数检验 两独立样本非参数检验 两配对样本非参数检验 多独立样本非参数检验 多配对样本非参数检验
P{ X x} Cni pi q n i
i 0
在大样本下,采用近似检验,用Z检验统计量, 即
x 0.5 np Z np(1 p)
SPSS
决策情况: 如果上述两种情况下的概率 P值小 于显著性水平 ,则应拒绝原假设, 即认为样本来自的总体分布与指定的 二项分布存在显著差异;反之,则不 存在显著差异。
r
r
2n1n2 ur n1 n2
2n1n2 (2n1n2 n1 n2 ) r (n1 n2 )2 (n1 n2 1)
2
SPSS
变量值随机性检验的SPSS操作 以耐电压值.sav为例
SPSS
SPSS
因为概率P 值大于 0.05,所 以不能拒 绝原假设, 即认为该 设备是正 常工作的
方法二:两独立样本K-S检验
基本思想
• 概念 K-S检验不仅能够对单个总体的分布是否与 某一理论分布存在显著差异进行检验,还 可以对两个总体的分布是否存在差异进行 检验
SPSS • 基本思想同前面单样本K-S检验,但也有些 不同,就是分析的对象是变量值的秩。 • 基本步骤 首先,将两组样本混合并按升序排序 然后,分别计算两组样本秩的累计频数和累 计频率。 最后,计算两组累计频率的差,得到秩的差 值序列并得到D统计量,根据D统计量得出 的概率P与显著性水平大小进行比较判断。
SPSS
基本思想
将总体的取值范围分成有限个互不相容的子集, 从总体中抽取一个样本,考察样本观察值落到每个 子集中的实际频数,并按假设的总体分布计算每个 子集的理论频数,最后根据实际频数和理论频数的 差构造卡方统计量,即
当原假设成立时,统计量服从卡方分布。以此来检 验假设总体的分布是否成立。
( fi fi ) 0 fi i 1
SPSS 正态分布 均匀分布
理论分布类型
指数分布 泊松分布
SPSS
基本思想
在原假设成立的前提下,计算各样本观测值在理 论分布中出现的理论概率值F(x) 计算各样本观测值的实际累计概率值S(x);计 算实际累计概率值与理论累计概率值的差S(x) - F(x) 计算差值序列中的最大绝对差值,即 D max( S ( xi ) F (xi )) 修正的D为 D max(max( S ( x ) F ( x ) ))
两独立样本K-S检验SPSS基本操作
SPSS
(以两独立样本-使用寿命为例)
SPSS
SPSS
方法三:两独立样本的游程检验
基本思想
• 该方法的基本思想与单样本游程检验的基本相同, 不同的是计算游程数的方法。两独立样本的游程 数依赖于变量的秩。 首先,将两组样本混合并按升序排序,在变量值排 序的同时,对应的组标记值也会随之重新排列 然后,对组标记值序列按前面的计算游程的方法进 行计算游程数。若游程数较少,则说明两总体有 较大差异。反之,则差异不大。
SPSS
第一节单样本的非参数检验
总体分布的卡方检验 二项分布检验 单样本K-S检验 变量值随机性检验