第七章 spss非参数估计
第7章SPSS的非参数检验 ppt课件

ppt课件
19
SPSS多独立样本非参数检验
(一)目的:
– 与样本在相同点的累计频率进行比较.如果相差 较小,则认为样本所代表的总体符合指定的总体 分布.
ppt课件
9
SPSS的单样本K-S检验
K-S检验
(4)基本步骤:
菜单选项:analyze->nonparametric tests->1-sample k-s 选择待检验的变量入test variable list 框 指定检验的分布名称(test distribution)
ppt课件
17
SPSS两独立样本非参数检验
4. 极端反应检验(Moses Extreme Reaction)
首先,将两样本混合并按升序排序。
然后,求出控制样本的最小秩和最大秩,并计算
出跨度=最大—最小+1。
为了消除样本数据中极端值对分析结果的影响,
在计算跨度之前可按比例去除控制样本中部分靠近两端
的样本值,然后再求跨度,得到截头跨度。
样本数据和分组标志 ppt课件
14
SPSS两独立样本非参数检验
(四)基本方法
1.曼-惠特尼U检验(Mann-Whitney U):平均秩检验
将两样本数据混合并按升序排序 求出其秩 对两样本的秩分别求平均 如果两样本的平均秩大致相同,则认为两总体分布无显著 差异
ppt课件
15
SPSS两独立样本非参数检验
如果跨度或截头跨度较大,则说明是由于两类样
本数据充分混合的结果,p即pt课:件认为两总体分布无显著差异18 .
SPSS两独立样本非参数检验
(五)基本操作步骤
菜单选项:analyze->nonparametric tests->2 independent sample 选择待检验的变量入test variable list框 选择一种或几种检验方法
第7章-SPSS非参数检验课件

第7章-SPSS非参数检验
决策情况: 如果上述两种情况下的概率 P值小
于显著性水平 ,则应拒绝原假设,
即认为样本来自的总体分布与指定的 二项分布存在显著差异;反之,则不 存在显著差异。
第7章-SPSS非参数检验
二项分布检验的基本操作与应用 (以产品合格率.sav为例) 分析
非参数检验
二项式
第7章-SPSS非参数检验
基本思想:利用游程大小进行判断。
游程是指变量值序列中连续出现相同的值的 次数
检验统计量: Z r u r
其中,
ur
2 n1n2 n1 n2
r r2 第7章2(-nnSP11SnS非2参(n2数2n)检21验n(n21nn12n12))
变量值随机性检验的SPSS操作 以耐电压值.sav为例
2.试着检验抛硬币实验中,正面出现的概率是 否为1/2.数据在硬币结果.sav中。
3.试着检验10个电子元件的使用寿命分布是否 服从指数分布?数据在电子元件使用寿命.sav 中。
输入检 验概率
值
第7章-SPSS非参数检验
第7章-SPSS非参数检验
由于概率P大于0.05, 所以不能拒绝原假设, 即认为一级品率不低
于0.9 第7章-SPSS非参数检验
单样本K-S检验
概念 • K-S检验(Kolmogorow-Smirnov),该方
法能够利用样本数据推断样本来自总体是 否与某一个理论分布有显著差异,是一种 拟合优度的检验方法,适用于探索连续型 随机变量的分布。
Dm ax(S(xi1)F(xi))
第7章-SPSS非参数检验
• 决策情况: 如果D统计量的概率 P值小于显著
性水平 ,则应拒绝原假设,即认
第7章spss非参数检验

Statistics按钮: 计算卡方值,用于行列
变量的独立性检验
计算pearson和spearman 相关系数
定类资料的行列变 量相关性检验
定序资料的行列变 量相关性检验
定序与定距资料的行 列变量相关性检验
评判内部一致性 相关风险比例 两相关二项分类变量的非参检验
二项分类变量的因、自变量独立性检验
p(1 p) / n
17
【界面设置】
检验的落入第一组的 概率常数值
分组值,小于该值为1 组,其余为1组
注意大小样本的选择
18
【结果形式】
19
7.3 Runs 游程检验 主要用于对二分变量(数值型)或利用断点分 为两组的变量,检验取值的分布随机性或两总体分 布是否一致,即一个case的取值是否影响下一个。 统计原假设H0:样本二分值分布是随机的或两总体分 布相同。
5、 2 Independent Samples 两独立(成组)样本检验
6、 K Independent Samples K个独立样本检验 5、 2 Related Samples 两关联(配对)样本检验 6、 K Related Samples K个关联样本检验
2
7.1 Chi-Square
1、卡方拟合优度检验 (Nonparametric Tests - Chi-Square) 主要用于分析实际频数与理论频数(已知)拟合情况;χ2 值反映了实际频数和理论频数的吻合程度。χ2值越小, 说明实际频数与理论频数越吻合。 适用于一个变量的多项分类数据的检验分析。 统计原假设:实际频数与理论频数相等或实际构成比等于 已知构成比。 k ( f 0 f e )2 卡方统计量为 2
25
【界面设置】
SPSS的非参数检验

02
SPSS非参数检验概述
定义与特点
定义
非参数检验是在统计分析中,相对于参数检验的一种统计方法。 它不需要对总体分布做严格假定,只关注数据本身的特点,因此 具有更广泛的适用范围。
特点
非参数检验对总体分布的假设较少,强调从数据本身获取信息, 具有灵活性、稳健性和适用范围广等优点。
局限性
计算量大
对于大规模数据集,非参数检验的计算量可 能较大,需要较长的计算时间。
对数据要求高
非参数检验要求数据具有可比性,对于不可 比的数据集可能无法得出正确的结论。
解释性较差
非参数检验的结果通常较为简单,对于深入 的统计分析可能不够满足。
对异常值敏感
非参数检验对异常值较为敏感,可能导致结 果的偏差。
THANK YOU
感谢聆听
常用非参数检验方法
独立样本非参数检验
用于比较两个独立样本的差异 ,如Mann-Whitney U 检验 、Kruskal-Wallis H 检验等。
相关样本非参数检验
用于比较相关样本或配对样本 的关联性,如Wilcoxon signed-rank 检验、Kendall's tau-b 检验等。
等级排序非参数检验
案例二:两个相关样本的非参数检验
总结词
适用于两个相关样本的比较,如同一班级内不同时间点的成绩比较。
描述
使用SPSS中的两个相关样本的非参数检验,如Wilcoxon匹配对检验,可以比较两个相关样本的总体分布是否相 同。
案例二:两个相关样本的非参数检验
01
步骤
02
1. 打开SPSS软件,输入数据。
第七章SPSS非参数检验

二、SPSS两独立样本非参数检验
(一)目的 由独立样本数据推断两总体的分布是否存在显著差异
(或两样本是否来自同一总体)。 (二)基本假设 H0:两总体分布无显著差异(两样本来自同一总体) (三)数据要求 样本数据和分组标志
•第七章SPSS非参数检验
二、SPSS两独立样本非参数检验
– 与样本在相同点的累计频率进行比较。如果相差较小,则认为样
本所代表的总体符合指定的总体分布。
•第七章SPSS非参数检验
一、SPSS单样本非参数检验
(三)K-S检验 (4)基本步骤
菜单选项:analyze->nonparametric tests->1-sample k-s 选择待检验的变量入test variable list 框 指定检验的分布名称(test distribution)
将两样本混合并按升序排序 分别计算两个样本在相同点上的累计频数和累计频率 两个累计频率相减。 如果差距较小,则认为两总体分布无显著差异
应保证有较大的样本数
案例:7-5 p194使用寿命
•第七章SPSS非参数检验
二、SPSS两独立样本非参数检验
3.游程?检验(Wald-Wolfowitz runs)
一、SPSS单样本非参数检验
(二)总体分布的二项分布检验 (1)目的
通过样本数据检验样本来自的总体是否服从指定的 概率p的二项分布根据 (2)原假设 样本来自的总体与指定的二项分布无显著差异。 (3)案例7-2 p187 产品合格率
•第七章SPSS非参数检验
一、SPSS单样本非参数检验
(三)K-S检验 (1)目的
•第七章SPSS非参数检验
五、SPSS多配对样本非参数检验
SPSS第讲非参数检验(共72张PPT)

SPSS应用
Kendall协同系数检验中会计算Friedman检验方 法,得到friedman统计量和相伴概率。如果相伴概
率小于显著性水平,可以认为这10个节目之间没有 显著差异,那么可以认为这5个评委判定标准不一 致,也就是判定结果不一致。
SPSS应用
3.多配对样本的Cochran Q检验
多配对样本的Cochran Q检验也是对多个互 相匹配样本总体分布是否存在显著性差异的统计 检验。不同的是多配对样本的Cochran Q检验所能 处理的数据是二值的(0和1)。其零假设是:样 本来自的多配对总体分布无显著差异。
SPSS应用
单样本K-S检验可以将一个变量的实际频数分
布与正态分布(Normal)、均匀分布(Uniform)、
泊松分布(Poisson)、指数(Exponential)分 布进行比较。其零假设H0为样本来自的总体与指定
的理论分布无显著差异。
SPSS应用
6.2 两配对样本非参数检验
6.2.1 统计学上的定义和计算公式
SPSS应用
两配对样本非参数检验的前提要求两个样本 应是配对的。在应用领域中,主要的配对资料包 括:具有年龄、性别、体重、病况等非处理因素 相同或相似者。首先两个样本的观察数目相同, 其次两样本的观察值顺序不能随意改变。
SPSS应用
SPSS中有以下3种两配对样本非参数检验方 法。
SPSS应用
1验.两配对样本的McNemar变化显著性检
SPSS应用
2.两配对样本的符号(Sign)检验
当两配对样本的观察值不是二值数据时,无法 利用前面一种检验方法,这时可以采用两配对样本
的符号(Sign)检验方法。其零假设为:样本来
自的两配对样本总体的分布无显著差异。
第7章 SPSS非参数检验

两独立样本的游程检验中,游程数依赖于 变量的秩。将两组样本混合后按升序排列, 然后按对应的组标记值序列计算游程数。 7.2.4极端反应检验(Moses 极限反应) 原假设:两独立样本来自的两个总体的分 布无显著差异。 将一组样本作为控制样本,另一组样本作 为实验样本,以控制样本作为对照,检验 实验样本相对于控制样本是否出现了极端 反应。
7.1.2二项分布检验 二项分布检验是通过样本数据检验样本来自的总 体是否服从指定概率为p的二项分布。 原假设:样本来自的总体与指定的二项分布无显 著差异。 一、二项分布检验的基本思想 变量只有两个取值0和1,如果进行n次相同的实 验,则出现两类(0和1)的次数可以分别用离散 型随机变量X来描述,如果随机变量值X为1的概 率设为p,则随机变量X值为0的概率便等于1-p, 形成二项分布。
典型的卡方统计量:Pearson卡方:
0 e 2 ( f f 2 i i ) 0 f i 1 i k
式中,k为子集的个数; f i 为观察频数; f i e为期望频数;= npi
0
如果卡方值较大,则说明观测频数分布与期望频数分布 差距较大;反之,则说明观测频数与期望频数分布较接 近。如果卡方的概率值小于显著性水平,则拒绝原假设, 认为样本来自的总体分布与期望分布存在显著性差异; 反之,则接受原假设,认为样本来自的总体分布与期望 分布无显著性差异。
2.选择待检验变量到[检验变量列表]框中 3.在[割点]框中确定计算游程的分界值。其中,中位数表 示以样本中位数为分界值;众数表示以样本众数为分界值; 均值表示以样本均值为分界值;设定表示以用户输入的值 为分界值,小于该值的为一组,大于等于该值的为另一组。
7.2 两独立样本的非参数检验
SPSS软件应用-第七章非参数检验

病例号 照射前 照射后
1
1.0 0.0
2
1.0 18.0
3
0.0 6.7
4
1.2 0.0
5
1.0 29.0
6
1.0 17.0
7
1.0 5.0
8
1.0 6.0
9
1.0 10.0
10
4.0
7.0
Questions &
Answers
饲料
肝脏内铁含量(μg)
A 2.23 1.14 2.63 1.00 1.35
B 5.59 0.96 6.96 1.23 1.61
C 4.50 3.92 10.33 8.23 2.07
练习2
10例食管癌病人在某种药物保护下,做 6000γ的放射照射,观察血中淋巴细胞 畸变百分数,结果如下表。问照射前后 血中淋巴细胞畸变百分数有无差别。
7.1 拟合优度检验(1-Sample K-S Test)
以例7-1数据(数据文件名“diameter_sub.sav”)为例,试检验变量 “trueap_mean”(矢状面管径)是否服从正态分布。
7.1 拟合优度检验(1-Sample K-S Test)
7.1 拟合优度检验(1-Sample K-S Test)
第二步:Analyze Nonparametric Test Legacy Dialogs 2 Related Samples Test
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.6 多个相关样本的非参数检验
牙齿 普通 RPI Y型 编号 卡环 卡环 卡环
7.2 样本率与总体率比较的二项分布检验(Binomial)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章非参数检验
1、为分析不同年龄段人群对某商品满意程度的异同,进行随机调查收集到以下数据:请选择恰当的非参数检验方法,以恰当形式组织上述数据,分析不同年龄段人群对该商品满意程度的分布状况是否一致。
原假设:不同年龄段人群对该商品满意程度的分布无显著差异。
步骤:建立SPSS数据数据→加权个案→对频次进行加权→分析→非参数检验→旧对话框→两个独立样本→把年龄段导入分组变量、满意程度导入检验变量列表→确定
表7-1
检验统计量a
满意程度
最极端差别绝对值.121
正.121
负.000
Kolmogorov-Smirnov Z 2.217
渐近显著性(双侧) .000
a. 分组变量: 年龄段
分析:从上表中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,即认为不同年龄段人群对该商品满意程度的分布存在显著差异。
2、利用习题二第6题数据,选择恰当的非参数检验方法,分析本次存款金额的总体分布与正态分布是否存在显著差异。
原假设:本次存款金额的总体分布与正态分布无显著差异
步骤:分析→非参数检验→旧对话框→单个独立样本K-S检验→本次存款金额导入检验变量列表→正太分布检验→确定
表7-2
单样本 Kolmogorov-Smirnov 检验
本次存款金额
N 282
正态参数a,b均值4738.09
标准差10945.569
最极端差别绝对值.333
正.292
负-.333
Kolmogorov-Smirnov Z 5.585
渐近显著性(双侧) .000
a. 检验分布为正态分布。
b. 根据数据计算得到。
分析:如上表,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,认为本次存款金额的分布与正太分布有显著差异。
3、利用习题二第6题数据,选择恰当的非参数检验方法,分析不同常住地人群本次存款金
额的总体分布是否存在显著差异。
原假设:不同常住地人群本次存款金额的总体分布无显著差异。
步骤:分析→非参数检验→旧对话框→2个独立样本→常住地导入分组变量、本次存款金额导入检验变量列表→确定
表7-3
检验统计量a
本次存款种类
最极端差别绝对值.280
正.000
负-.280
Kolmogorov-Smirnov Z 2.138
渐近显著性(双侧) .000
a. 分组变量: 常住地
分析:从图中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,故拒绝原假设,认为不同常住地人群本次存款金额的总体分布存在显著差异。
4、利用习题二第6题数据,选择恰当的非参数检验方法,分析不同收入人群本次存款金额的总体分布是否存在显著差异。
原假设:不同收入人群本次存款金额的总体分布无显著差异。
步骤:分析→非参数检验→旧对话框→2个独立样本→不同收入人群导入分组变量、本次存款金额导入检验变量列表→确定
表7-4
检验统计量a
本次存款金额
最极端差别绝对值.361
正.006
负-.361
Kolmogorov-Smirnov Z 2.238
渐近显著性(双侧) .000
a. 分组变量: 月收入水平
分析:在图中可以看出,在显著水平为0.05下得到的sig值均为0.00<0.05,所以拒绝原假设,即认为不同收入人群本次存款金额的总体分布存在显著差异。
5、选择恰当的非参数检验方法,对“裁判打分.sav”数据随机选取10%的样本,并以恰当形式重新组织数据后,分析不同国家裁判对运动员的打分标准是否一致。
原假设:不同国家裁判对运动员的打分标准无显著差异
步骤:数据→选择个案→随机个案样本→样本→大约10%所有个案→继续→确定
表7-5
中国38 8.0421 .67649 7.10 9.50
美国38 8.8658 1.00143 7.00 10.00
俄罗斯38 8.0737 .92113 7.00 9.80
步骤:挑选初选中的数据→国家和评分组建新的SPSS数据→分析→非参数检验→多个独立样本检验→把评分导入检验量→把国家导入分组→确定
表7-6
秩
国家N 秩均值
评分意大利38 134.26
韩国38 166.03
罗马尼亚38 97.22
法国38 171.45
中国38 96.54
美国37 164.86
俄罗斯37 97.05
总数264
表7-7
检验统计量a
N 38
卡方155.226
df 6
渐近显著性.000
a. Friedman 检验
表7-8
Jonckheere-Terpstra 检验a
评分
国家中的水平数7
N 264
J-T 观察统计量13691.500
J-T 统计量均值14934.500
J-T 统计量的标准差708.825
标准J-T 统计量-1.754
渐近显著性(双侧) .079
a. 分组变量: 国家
表7-9
频率
国家
意大利韩国罗马尼亚法国中国美国俄罗斯评分> 中值20 25 11 28 7 25 12 <= 中值18 13 27 10 31 12 25 表7-10
检验统计量b
评分
N 264
中值8.5000
卡方43.248a
df 6
渐近显著性.000
a. 0 个单元 (.0%) 具有小于 5 的期望频率。
单元最小期望频率为 17.9。
b. 分组变量: 国家
分析:根据上表,在秩检验和中值检验中,在显著水平为0.05下得到的sig值均为0.00,小于0.05,拒绝原假设,认为不同国家对其评分有显著影响。
但是在JTerpstra 检验中在显著水平为0.05下得到的sig值均为0.079,大于0.05,接受原假设,不同国家对其评分不具有显著影响。
6、为分析大众对牛奶品牌是否具有偏好性,随机挑选超市了收集其周一至周六各天三种品牌牛奶的日销售额数据,如下表:请选择恰当的非参数检验方法,以恰当形式组织上述数据进行分析,并说明分析结论。
原假设:日期与品牌的分布无显著差异
步骤:建立spss数据→加权个案→销售额进行加权→分析→非参数检验→两个独立样本检验→确定
表7-11::
秩
星期N 秩均值
品牌 1 21 62.76
2 2
3 83.80
3 31 72.63
4 32 77.83
5 2
6 81.27
6 16 67.16
总数149
表7-12
检验统计量a,b
品牌
卡方 4.469
df 5
渐近显著性.484
a. Kruskal Wallis 检验
检验统计量a,b
品牌
卡方 4.469
df 5
渐近显著性.484
a. Kruskal Wallis 检验
b. 分组变量: 星期
表7-13
频率
星期
1 2 3 4 5 6 7
品牌> 中值 4 8 10 10 9 3 0 <= 中值17 15 21 22 17 13 0
表7-14
检验统计量b
品牌
N 149
中值 2.00
卡方 2.787a
df 5
渐近显著性.733
表7-15
Jonckheere-Terpstra 检验a
品牌
星期中的水平数 6
N 149
J-T 观察统计量4706.000
J-T 统计量均值4578.500
J-T 统计量的标准差281.561
标准J-T 统计量.453
渐近显著性(双侧) .651
a. 分组变量: 星期
分析:根据上表7-11到7-15,在显著水平为0.05下得到的sig值均大于0.05,故接受原假设,认为日期与品牌的分布无显著差异。