第7章 SPSS 20.0非参数检验
SPSS应用之非参数检验

SPSS应⽤之⾮参数检验统计学的假设检验可以分为参数检验和⾮参数检验,参数检验是根据⼀些假设条件推算⽽来,当这些假设条件⽆法满⾜的时候,参数检验的效能会⼤打折扣,甚⾄出现错误的结果,⽽⾮参数检验通常是没有假设条件的,因此应⽤范围⽐参数检验要⼴。
⾮参数检验在不做任何假设的情况下,最⼤限度的使⽤样本信息,利⽤统计学、数学的⽅法和技巧构造统计量并加以检验,在某些情况下,⾮参数检验⽐参数检验拥有更⾼的效能,尽管如此,我们也不能⼀味的使⽤⾮参数检验,毕竟参数检验更加严谨,通常都是在数据不符合参数检验的条件是,才使⽤⾮参数检验,因此,对于数据的前期观察是⾮常重要的。
⾮参数检验⽅法⾮常多,但是绝⼤部分⾮参数检验⽅法都是基于秩和结来构造统计量的,中⾮参数检验是⼀个独⽴的过程,也保留了旧对话框,新对话框按照样本情况分类,根据样本情况来选择⽅法,并且更倾向于⾃动化分析,旧对话框的分类则不是很明确,分我们按照新对话框来进⾏介绍分析—⾮参数检验—单样本⼀、单样本1.⼆项式检验⼆项式检验也称为⼆项分布检验,⽤来检验样本是否来⾃⼆项分布,也就是检查样本的观测值的频数与某⼀特定⼆项分布下的期望频数是否⼀致。
不仅可以针对于⼆分类变量,对于连续变量也可以当做⼆分类变量来处理,例如成绩的及格与否,产品的合格与否等。
本例中是想检验三门学科的及格率是否都在95%以上2.卡⽅检验卡⽅检验是最常⽤的多分类⾮参数检验,卡⽅统计量也⼴泛被其他检验所引⽤,卡⽅检验依据卡⽅分布,主要包括适应性检验和独⽴性检验,适应性检验⽤于检验实际观察频数与期望频数是否⼀致,独⽴性检验⽤于检验两组或多组计数资料是否相互独⽴。
3.K-S检验全称为Kolmogorov-Smirnow检验,在探索性中,也曾出现过⽤它来检验是否服从正态分布。
该检验属于⾮参数检验,⽤来检验某⼀单样本是否服从某⼀理论分布。
4.Wilcoxon符号秩检验该检验将符号和秩相结合,效能⽐单纯的符号检验和秩和检验都⾼,因此⽐较常⽤5.游程检验我们知道样本的随机性很重要,⽽游程检验就是⽤来检验样本数据是否是随机抽取的。
SPSS第七章SPSS的非参数检验

7.1.2.3 二项分布检验应用举例
储户对未来收入看法检验,为检验储户是 对未来的收入是持乐观态度还是悲观态度, 我们将检验用户持乐观态度的概率是否为 0.6,这里采用二项分布检验法,具体结 果如下图:
Binomial T est Category Group 1 <= 1 Group 2 > 1 Total N 77 236 313 O bserved Prop. .2 .8 1.0 Test P rop. .6 Asymp. Sig. (1-tailed) .000a,b
7.1.3 单样本的K-S检验
可以解决的问题:推断样本来自的总体是否 服从一个理论分布,是一种拟合优度检验; 基本思想:根据数据,推断总体分布是否服 从某一理想分布,推断两者是否显著差异
正态分布、均匀分布、指数分布、泊松分布等
适用于探索连续型随机变量的分布
7.1.3.2 单样本K-S检验的基本操作
7.1.2.3 二项分布检验应用举例
产品合格率检验,为检验产品合格率是否 大于90%,抽出25个样品检验并得到检测 数据,其中1表示一级品,0表示非一级品, 这里采用二项分布检验法,具体结果如下 图:
Binomial T est Category Group 1 合格 Group 2 不合格 Total N 19 4 23 O bserv ed Prop. .8 .2 1.0 Test P rop. .9 Exact Sig . (1-tailed) .193a
7.1.1.3 总体卡方检验应用举例
为研究心脏病人猝死人数与日期的关系, 收集到168个观察数据;周一到周日死亡 人数分别是55 23 18 11 26 20 15,现用 这些样本,推断猝死人数在一周的分布是 否是2.8:1:1:1:1:1:1,采用总体分布卡方 检验,结果如下图:
第7章SPSS的非参数检验 ppt课件

ppt课件
19
SPSS多独立样本非参数检验
(一)目的:
– 与样本在相同点的累计频率进行比较.如果相差 较小,则认为样本所代表的总体符合指定的总体 分布.
ppt课件
9
SPSS的单样本K-S检验
K-S检验
(4)基本步骤:
菜单选项:analyze->nonparametric tests->1-sample k-s 选择待检验的变量入test variable list 框 指定检验的分布名称(test distribution)
ppt课件
17
SPSS两独立样本非参数检验
4. 极端反应检验(Moses Extreme Reaction)
首先,将两样本混合并按升序排序。
然后,求出控制样本的最小秩和最大秩,并计算
出跨度=最大—最小+1。
为了消除样本数据中极端值对分析结果的影响,
在计算跨度之前可按比例去除控制样本中部分靠近两端
的样本值,然后再求跨度,得到截头跨度。
样本数据和分组标志 ppt课件
14
SPSS两独立样本非参数检验
(四)基本方法
1.曼-惠特尼U检验(Mann-Whitney U):平均秩检验
将两样本数据混合并按升序排序 求出其秩 对两样本的秩分别求平均 如果两样本的平均秩大致相同,则认为两总体分布无显著 差异
ppt课件
15
SPSS两独立样本非参数检验
如果跨度或截头跨度较大,则说明是由于两类样
本数据充分混合的结果,p即pt课:件认为两总体分布无显著差异18 .
SPSS两独立样本非参数检验
(五)基本操作步骤
菜单选项:analyze->nonparametric tests->2 independent sample 选择待检验的变量入test variable list框 选择一种或几种检验方法
第7章-SPSS非参数检验课件

第7章-SPSS非参数检验
决策情况: 如果上述两种情况下的概率 P值小
于显著性水平 ,则应拒绝原假设,
即认为样本来自的总体分布与指定的 二项分布存在显著差异;反之,则不 存在显著差异。
第7章-SPSS非参数检验
二项分布检验的基本操作与应用 (以产品合格率.sav为例) 分析
非参数检验
二项式
第7章-SPSS非参数检验
基本思想:利用游程大小进行判断。
游程是指变量值序列中连续出现相同的值的 次数
检验统计量: Z r u r
其中,
ur
2 n1n2 n1 n2
r r2 第7章2(-nnSP11SnS非2参(n2数2n)检21验n(n21nn12n12))
变量值随机性检验的SPSS操作 以耐电压值.sav为例
2.试着检验抛硬币实验中,正面出现的概率是 否为1/2.数据在硬币结果.sav中。
3.试着检验10个电子元件的使用寿命分布是否 服从指数分布?数据在电子元件使用寿命.sav 中。
输入检 验概率
值
第7章-SPSS非参数检验
第7章-SPSS非参数检验
由于概率P大于0.05, 所以不能拒绝原假设, 即认为一级品率不低
于0.9 第7章-SPSS非参数检验
单样本K-S检验
概念 • K-S检验(Kolmogorow-Smirnov),该方
法能够利用样本数据推断样本来自总体是 否与某一个理论分布有显著差异,是一种 拟合优度的检验方法,适用于探索连续型 随机变量的分布。
Dm ax(S(xi1)F(xi))
第7章-SPSS非参数检验
• 决策情况: 如果D统计量的概率 P值小于显著
性水平 ,则应拒绝原假设,即认
第7章spss非参数检验

Statistics按钮: 计算卡方值,用于行列
变量的独立性检验
计算pearson和spearman 相关系数
定类资料的行列变 量相关性检验
定序资料的行列变 量相关性检验
定序与定距资料的行 列变量相关性检验
评判内部一致性 相关风险比例 两相关二项分类变量的非参检验
二项分类变量的因、自变量独立性检验
p(1 p) / n
17
【界面设置】
检验的落入第一组的 概率常数值
分组值,小于该值为1 组,其余为1组
注意大小样本的选择
18
【结果形式】
19
7.3 Runs 游程检验 主要用于对二分变量(数值型)或利用断点分 为两组的变量,检验取值的分布随机性或两总体分 布是否一致,即一个case的取值是否影响下一个。 统计原假设H0:样本二分值分布是随机的或两总体分 布相同。
5、 2 Independent Samples 两独立(成组)样本检验
6、 K Independent Samples K个独立样本检验 5、 2 Related Samples 两关联(配对)样本检验 6、 K Related Samples K个关联样本检验
2
7.1 Chi-Square
1、卡方拟合优度检验 (Nonparametric Tests - Chi-Square) 主要用于分析实际频数与理论频数(已知)拟合情况;χ2 值反映了实际频数和理论频数的吻合程度。χ2值越小, 说明实际频数与理论频数越吻合。 适用于一个变量的多项分类数据的检验分析。 统计原假设:实际频数与理论频数相等或实际构成比等于 已知构成比。 k ( f 0 f e )2 卡方统计量为 2
25
【界面设置】
第七章SPSS非参数检验

二、SPSS两独立样本非参数检验
(一)目的 由独立样本数据推断两总体的分布是否存在显著差异
(或两样本是否来自同一总体)。 (二)基本假设 H0:两总体分布无显著差异(两样本来自同一总体) (三)数据要求 样本数据和分组标志
•第七章SPSS非参数检验
二、SPSS两独立样本非参数检验
– 与样本在相同点的累计频率进行比较。如果相差较小,则认为样
本所代表的总体符合指定的总体分布。
•第七章SPSS非参数检验
一、SPSS单样本非参数检验
(三)K-S检验 (4)基本步骤
菜单选项:analyze->nonparametric tests->1-sample k-s 选择待检验的变量入test variable list 框 指定检验的分布名称(test distribution)
将两样本混合并按升序排序 分别计算两个样本在相同点上的累计频数和累计频率 两个累计频率相减。 如果差距较小,则认为两总体分布无显著差异
应保证有较大的样本数
案例:7-5 p194使用寿命
•第七章SPSS非参数检验
二、SPSS两独立样本非参数检验
3.游程?检验(Wald-Wolfowitz runs)
一、SPSS单样本非参数检验
(二)总体分布的二项分布检验 (1)目的
通过样本数据检验样本来自的总体是否服从指定的 概率p的二项分布根据 (2)原假设 样本来自的总体与指定的二项分布无显著差异。 (3)案例7-2 p187 产品合格率
•第七章SPSS非参数检验
一、SPSS单样本非参数检验
(三)K-S检验 (1)目的
•第七章SPSS非参数检验
五、SPSS多配对样本非参数检验
SPSS教程-非参数检验

一般用来对两个独立样本的均数、中位数、离 散趋势、偏度等进行差异比较检验。
两个样本是否独立,主要看在一个总体中抽取 样本对另外一个总体中抽取样本有无影响。
Mann-Whitney检验
=0.18576
计算表
SPSS基本操作
SPSS基本操作
SPSS基本操作
SPSS基本操作
SPSS基本操作
单样本K-S检验
利用样本数据推断样本来自的总体是否服从某一理论 分布,是一种拟合优度的检验方法,适用于探索连续 型随机变量的分布
步骤
计算各样本观测值在理论分布中出现的理论累计概率值F(x) 计算各样本观测值的实际累计概率值S(x) 计算理论累计概率值与实际累计概率值的差D(x) 计算差值序列中最大绝对差值D
针麻效果
(1) Ⅰ Ⅱ Ⅲ Ⅳ
表
肺癌 (2) 10 17 19 4
三种病人肺切除术的针麻效果比较肺化脓症Fra bibliotek肺结核
(3)
(4)
24
48
41
65
33
36
7
8
合计 (5) 82 123 88 19
SPSS基本操作
与例7的操作相同
随机区组设计资料的秩和检验
M检验(Friedman法)法计算步骤
将每个区组的数据由小到大分别编秩 计算各处理组的秩和Ri 求平均秩:R=1/2b(k+1) 计算各处理组的( Ri-R) 求M 查M界值表,F近似法
参数统计(parametric statistics) : 在 统计推断 中,若样本所来自的总体分布为已知的函数形式 (正态/近似正态分布),但其中的参数未知,统 计推断的目的就是对这些未知参数进行估计/检验, 这类统计推断方法称参数统计。
SPSS软件应用-第七章非参数检验

病例号 照射前 照射后
1
1.0 0.0
2
1.0 18.0
3
0.0 6.7
4
1.2 0.0
5
1.0 29.0
6
1.0 17.0
7
1.0 5.0
8
1.0 6.0
9
1.0 10.0
10
4.0
7.0
Questions &
Answers
饲料
肝脏内铁含量(μg)
A 2.23 1.14 2.63 1.00 1.35
B 5.59 0.96 6.96 1.23 1.61
C 4.50 3.92 10.33 8.23 2.07
练习2
10例食管癌病人在某种药物保护下,做 6000γ的放射照射,观察血中淋巴细胞 畸变百分数,结果如下表。问照射前后 血中淋巴细胞畸变百分数有无差别。
7.1 拟合优度检验(1-Sample K-S Test)
以例7-1数据(数据文件名“diameter_sub.sav”)为例,试检验变量 “trueap_mean”(矢状面管径)是否服从正态分布。
7.1 拟合优度检验(1-Sample K-S Test)
7.1 拟合优度检验(1-Sample K-S Test)
第二步:Analyze Nonparametric Test Legacy Dialogs 2 Related Samples Test
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.6 多个相关样本的非参数检验
牙齿 普通 RPI Y型 编号 卡环 卡环 卡环
7.2 样本率与总体率比较的二项分布检验(Binomial)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章
本章内容
7.1 单样本的非参数检验 7.2 两独立样本的非参数检验 7.3 多独立样本的非参数检验 7.4 两配对样本的非参数检验 7.5 多配对样本的非参数检验
非参数检验
非参数检验: (1)在总体分布未知或知道甚少的情况下, 利用样本数据对总体分布形态等进行推断 的方法。 (2)推断过程中不涉及有关总体分布的参 数。
D max( S(xi ) F(xi ) 由于实际累计概率为离散值,可对D修正为: 修正D : D max(max(S(xi ) F (xi ) , max( S(xi1) F(xi ) )
(4)原假设成立时:
①小样本下:D~kolmogorov分布
②大样本下: nD 近似服从K(x)分布 ③SPSS仅给出大样本下的 nD 和对应的p值 (5)决策
(3)检验步骤
①将两组样本混合并升序排列,得每个数据的秩 Ri
②分别对样本X和Y的秩求平均,得平均秩WY n 和 WX m ③计算样本X优于样本Y秩的个数 U1和样本Y优于样本
X秩的个数 U2
④依据
U
和
1
U
2计算WilcoxonW统计量和曼-惠特尼U统
计量。
WilcoxonW统计量:
若m n,则WilconxonW WY 若m n,则WilconxonW WX 若m n,则WilconxonW为第一个变量值所在样本值的W值
Z统计量的p值>显著性水平,不拒绝原假设,变量值的出现是 随机的。
2.实现步骤
分析-非参数检验-旧对话框-游程
(1)选定待检验的变量到“检验变量列表” 框
(2)割点:计算游程数的分界值 ①中位数:样本中位数为分界值
②众数:样本众数为分界值
③均值:样本均值为分界值
④设定:以用户输入的值为分界值,SPSS 将小于该分界值的所有变量作为一组,大 于或等于该分界值的所有变量作为一组, 计算游程。
2.实现步骤 分析 - 非参数检验-旧对话框-卡方检验
(1)选定待检验的变量到“检验变量列表”框 (2)在“期望全距”栏中确定参与分析的观测值的范
围:
从数据中获取:所有观测数据都参与分析 使用指定的范围:只在该取值范围内的观测数据才 参与分析。
(3)期望值:给出各理论值 所有类别相等:所有子集的频数都相同
曼-惠特尼统计量U为:
U W 1 k (k 1) 2
W Wilcoxon W,k W对应样本组的样本个数
大样本下,U近似服从正态分布
U 1 mn
Z
2
1 mm(m n 1)
12
小样本下依据U统计量和p值进行决策 大样不下依据Z统计量和p值进行决策
p ,拒绝原假设,样本来自的两总体的分布存在显著差异 p ,不拒绝原假设,样本来自的两总体的分布无显著差异
p :拒绝原假设,两总体的分布有显著差异
p :不拒绝原假设,两总体的分布无显著差异
7.2.3两独立样本的游程检验
1.基本思想 (1)原假设:两组独立样本来自的两总体的分布无显著差异。 (2)检验步骤 ①将两组样本混合并按升序排列,组标记值也随之重新排列 ②计算组标记值序列的游程数 ③根据游程数计算Z统计量,Z统计量近似服从正态分布 (3)决策p :: 拒绝原假设,两总体的分布有显著差异
分析: 产品合格与否属于二值变量,可以通过二 项分布检验实现。
7.1.3单样本K-S检验
1.基本思想 (1)以俄罗斯数学家柯尔莫哥和斯米诺夫名字命名 (2)利用样本数据推断样本来自的总体是否服从某一理论分布,
是一种拟合优度的检验方法,适用于探索连续型随机变量的分布。 (3)步骤 ①计算各样本观测值在理论分布中出现的理论累计概率值F(x) ②计算各样本观测值的实际累计概率值S(x) ③计算理论累计概率值与实际累计概率值的差D(x) ④计算差值序列中最大绝对差值D
n
n
2.实现步骤
分析-非参数检验-旧对话框-二项式
(1)选定待检验的变量到“检验变量列表” 框
(2)定义二分法:指定如何分类 从数据中获取:检验变量为二值变量
割点:输入具体数值,大于等于该值的为第 一组,大于该组的为第二组
(3)检验比例:输入二项分布的检验概率值
3.应用案例
利用“产品合格率”数据,推断该批产品 的一级品率是否为90%
7.3多独立样本的非参数检验
1.通过分析多组独立样本数据,推断样本来 自的多个总体的中位数或分布是否存在显 著差异。
2.方法:中位数检验、Kruskal-Wallis检验、 Jonckheere-Terpstra检验。
7.3.1中位数检验
1.基本思想
(1)原假设:多个独立样本来自的多个总体的中位 数无显著差异。
3.应用案例
利用“儿童身高”数据分析周岁儿童身高 总体是否服从正态分布。
分析: 可以通过单样本K-S检验实现。
7.1.4 变量值随机性检验
1.基本思想 (1)通过对样本变量值的分析,实现对总体
的变量值出现是否随机进行检验。
(2)原假设:总体变量值出现是随机的。 ①检验依据:游程-样本序列中连续出现相 同的变量值的次数。
框 (2)分组变量:存放组标志的变量,并通过
“定义组”给出两组的标志值。 (3)检验类型:选择相应的检验方法
7.2.6应用案例
利用“使用寿命”数据,判断两种工艺下 产品的使用寿命的分布是否存在显著差异, 进而对两个工艺的优劣进行判断。
分析: 两个工艺产品的使用寿命可看作两独立样本, 可以通过曼-惠特尼U检验、K-S检验、W-W 游程检验、极端反应检验实现。
p
:不拒绝原假设,两总体的分布无显著差异
7.2.4极端反应检验
1.基本思想
(1)原假设:两独立样本来自的两个总体的分布无显著差异。
(2)一组样本为控制样本,一组样本为实验样本,看实验样 本相对于控制样本是否出现了极端反应。
(3)检验步骤
①两组样本混合按升序排列
②求控制样本的最小秩 和最大秩
(3)决策
①卡方统计量的p值<显著性水平,拒绝原假设,多个 独立样本来自的多个总体的中位数存在显著差异。
②卡方统计量的p值>显著性水平,不拒绝原假设,多 个独立样本来自的总体的中位数不存在显著差异。
7.3.2多独立样本的Kruskal-Wallis检验
1.基本思想 (1)原假设:多个独立样本来自的多个总体的分布无显著差
(2)推断样本来自的两个总体的分布等是否 存在显著差异。
(3)方法:曼-惠特尼U检验、K-S检验、WW游程检验、极端反应检验等。
7.2.1两独立样本的曼-惠特尼U检验
1.基本思想
(1)原假设:两组独立样本来自的两总体分布无显著差 异。
(2)通过两组本平均秩的研究实现推断
秩-变量值排序的名次,变量值有几个,对应的秩便有 几个。
异。 (2)是两独立样本曼-惠特尼U检验的推广 (3)检验步骤 ①将多组样本数据混合并升序排列,求各变量的秩 ②考察各组秩的均值是否有显著差异
③各组秩的差异借助方差分析:秩的变差分解为:组间差和组 内差 a若秩的总变差大部分可由组间差解释,则各样本组的总体 分布存在显著差异 b若秩的总变差大部分不能由组间差解释,则各样本组的总 体分布无显著差异
④构造K-W统计量
秩的组间平方和 K W 秩总平方和的平均
12 N (N 1)
k i
ni (Ri R )2 ~ 2 (k 1)(k较大,通常大于3即可)
7.2.2两独立样本的K-S检验
1.基本思想 (1)原假设:两组独立样本来自的两总体的分布无显著差
异。 (2)与单样本K-S检验的基本思路大体一致,差别在于:以
变量值的秩为分析对象,而非变量值本身。 (3)检验步骤 ①将两组样本混合并按升序排列 ②分别计算两组样本秩的累计频数和累计频率 ③计算两组累计频率的差,得秩的差值序列及D统计量 ④SPSS计算大样本下的 nD和对应的p值 (3)决策:
值:依次输入值,通过【添加】、【更改】、【删除】 进行增加、修改和删除。
3.应用案例
医学研究表明心脏病人猝死人数与日期的 关系为:一周内,星期一猝死者较多,其 他日子基本相当,各天的比例近似为:2.8: 1:1:1:1:1:1 根据“心脏病猝死”数据,推断总体分布 是否与理论分布相吻合。
分析:
②游程数太大或太小都表明变量值存在不 随机的现象
(3)检验统计量
Z r r r:游程数 r
r
2n1n2 n1 n2
2 r
2n1n2 (2n1n2 n1 n2 ) (n1 n2 )2 (n1 n2 1)
n1 出现1的个数,n2 出现0的个数
(4)决策:
Z统计量的p值<显著性水平,拒绝原假设,变量值的出现不是 随机的。
小样本下,H服从Hollander分布,大样本下,H近似服从正态分布
(4)决策: ①H统计量的p值<显著性水平,拒绝原假设,两独立样本来自的 总体分布存在显著差异 ②H统计量的p值>显著性水平,不拒绝原假设,两独立样本来自 的总体分布不存在显著差异
7.2.5两独立样本非参数检验的步骤
分析-非参数检验-旧对话框-2 独立样本 (1)选择待检验的变量到“检验变量列表”
③计算跨度
Qmin
Qm ax
④为了消除样本S数 Q据ma中x Q的min极1端值,计算跨度前可按比例(通常 5%)去除控制样本中靠近两端的样本值,再求跨度,得截 头跨度
⑤针对跨度或截头跨度计算H统计量:
m
H (Qi Q )2 i 1
m 控制样本的样本数, Qi 控制样本在混合样本中的秩, Q 控制样本的平均秩