样本分布的非参数检验(第七讲)

合集下载

非参数-第七章

非参数-第七章

第七章区组设计问题数据可以通过观察得到,也可以通过试验得到。

例6.1的数据是通过调查得到的。

向某公司的管理人员作调查,问他们来自哪一所大学,了解他们的年度表现评分。

调查得到的数据是观察数据。

例6.2是一个医学试验。

该试验将研究对象随机地分成四组,并规定这四组分别服用安慰剂、2.4克、4.8克和7.2克降血脂新药,然后于六周后测量他们低密度脂蛋白胆固醇含量。

这批数据是试验数据。

除例6.2这种类型的医学试验外,另一种类型的医学试验是区组试验设计,简称区组设计。

区组设计除用于医学试验外,还广泛用于工业、农业、心理和教育等试验活动。

本章讨论区组设计的数据分析问题。

例4.1的成对数据就是区组设计数据。

下面通过例4.1来讲解何谓区组设计.例4.1的目的是为了比较两种不同的生产方式,看哪一种生产方式完成一项生产任务所化的时间少。

我们把待比较的这两种生产方式分别称为处理1和处理2。

由于不同的生产工人的技术有高有低,所以让12个工人都分别使用这两种处理(即这两种生产方式)去完成同一项生产任务。

不同的工人用这两种生产方式完成一项生产任务所花时间的差异除了与随机因素有关外,还可能与这两种生产方式的优劣,以及这两个工人技术上的高低有关。

而同一个工人用这两种生产方式完成一项生产任务所花时间的差异除了与随机的因素有关外,仅可能与这两种生产方式的优劣有关。

我们把这12个工人分别称为区组1,区组2,区组,12。

例4.1是2个处理12个区组的区组设计。

对同一个区组(即同一个工人)用这两种生产方式完成一项生产任务所花时间差的数据分析,就能看出这两种生产方式有没有不同。

符号检验与符号秩和检验可用来解决2个处理的区组设计的数据分析问题。

如果我们要比较三种或更多种不同的生产方式,就有3个或更多个处理的区组设计。

本章将把符号检验与符号秩和检验加以推广,讨论一般的区组设计的数据分析问题。

§7.1介绍Friedman检验,§7.2介绍Hodges–Lehmann检验。

非参数检验

非参数检验


等级资料的分析方法是否和 一般计数资料的检验方法相同呢?
等级资料的分析应该选用什么方法?
实例1 考察硝苯地平治疗老年性支气管炎的疗效,治疗组 60人,用硝苯地平治疗,对照组58人,常规治疗,两组患
者的性别、年龄、病程无显著性差异,治疗结果见表1。
表 1 治疗组与对照组疗效比较 组别 治疗组 对照组 例数 60 58 例 数 无效 6 14 有效 19 20 显效 35 24 百分比(%) 无效 10.00 24.14 有效 31.67 34.48 显效 58.33 41.38
Test Statistics Chi-Squarea df Asymp. Sig. 身 体状 况 12.135 4 .016
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 5.0.
分布类型检验
分布位置检验
Nonparametric Test菜单(1)
• 分布类型检验方法
–Chi-Square 检验二项/多项分布 分类资料 –Binomial 检验二项分类变量分布 –Runs 检验样本序列随机性(游程检验) –1-Sample K-S 检验样本是否服从各种分布
Nonparametric Test菜单(2)
ill 1.00 num 1.00
1
2
0.00
399.00
• 1.weight cases by:num • 2.analyze-nonparametric test-binomial
Binomial Test Category 1.00 .00 N 1 399 400 Observed Prop. .00 1.00 1.00 Test Prop. .01 Asymp. Sig. Exact Sig. (1-tailed) (1-tailed) a,b .090 .090

实验6 7 社会统计学实验-非参数检验

实验6 7 社会统计学实验-非参数检验

渐近显著性(双侧)
精确显著性[2*(单侧显著性)] a. 没有对结进行修正
.003
.001a
b. 分组变量: 是否铅作业者
铅作业与非铅作业两组工人血铅值的平均秩分别为13.36和5.95, 显然铅作业组血铅值的平均秩较高。 小样本时的统计量值Mann-Whitney U为4.5,伴随概率P值为 0.001,大样本时统计量值Z为-2.98,对应伴随概率P值为0.003。 本例为小样本应取前者,P值为0.001,远小于检验水准0.05, 说明铅作业工人和非铅作业工人血铅值之间的差异有统计学意 义,所以可以认为铅作业与非铅作业工人血铅值有差异。
统计量=2.779,伴随概率P值为0.836,大于检验水准0.05。 说明一周内各日的死亡危险性差异没有统计学意义,因此可以认 定一周内各日的死亡危险性无差异。
二、两个独立样本的非参数检验
两个独立样本非参数检验是在对总体分布未知的情况下,通过 样本数据检验两独立样本的对应总体分布或分布位置差异是否 有统计学意义。 两个独立样本非参数检验方法最常用Mann-Whitney U 检验, 也称为威尔科克逊(Wilcoxon W)等级秩和检验。 秩和检验的原假设H0:两组独立样本来自的两总体分布相同。 SPSS结果,当小样本时,统计量以“Mann-Whitney U”给出, 伴随概率P值以“精确显著性(Exact Sig.)”给出。当大样本时, 统计量以“Z”给出,伴随概率P值以“渐近显著性(Asymp. Sig.)”
剂型A 剂型B 2.5 3.5 3.0 4.0 1.25 1.75 2.5 2.0 3.5 3.5 2.5 4.0 1.75 2.25 1.5 2.5 3.5 3.0 2.5 3.0 2.0 3.5
试检验两种剂型血药浓度的达峰时间是否具有相同的分布?

SPSS第讲非参数检验(共72张PPT)

SPSS第讲非参数检验(共72张PPT)

SPSS应用
Kendall协同系数检验中会计算Friedman检验方 法,得到friedman统计量和相伴概率。如果相伴概
率小于显著性水平,可以认为这10个节目之间没有 显著差异,那么可以认为这5个评委判定标准不一 致,也就是判定结果不一致。
SPSS应用
3.多配对样本的Cochran Q检验
多配对样本的Cochran Q检验也是对多个互 相匹配样本总体分布是否存在显著性差异的统计 检验。不同的是多配对样本的Cochran Q检验所能 处理的数据是二值的(0和1)。其零假设是:样 本来自的多配对总体分布无显著差异。
SPSS应用
单样本K-S检验可以将一个变量的实际频数分
布与正态分布(Normal)、均匀分布(Uniform)、
泊松分布(Poisson)、指数(Exponential)分 布进行比较。其零假设H0为样本来自的总体与指定
的理论分布无显著差异。
SPSS应用
6.2 两配对样本非参数检验
6.2.1 统计学上的定义和计算公式
SPSS应用
两配对样本非参数检验的前提要求两个样本 应是配对的。在应用领域中,主要的配对资料包 括:具有年龄、性别、体重、病况等非处理因素 相同或相似者。首先两个样本的观察数目相同, 其次两样本的观察值顺序不能随意改变。
SPSS应用
SPSS中有以下3种两配对样本非参数检验方 法。
SPSS应用
1验.两配对样本的McNemar变化显著性检
SPSS应用
2.两配对样本的符号(Sign)检验
当两配对样本的观察值不是二值数据时,无法 利用前面一种检验方法,这时可以采用两配对样本
的符号(Sign)检验方法。其零假设为:样本来
自的两配对样本总体的分布无显著差异。

实验七非参数统计

实验七非参数统计

例3 例4
某地某一时期内出生40名婴儿,其中女性12名,男性 28名。问这个地方出生婴儿的性比例与通常的男女性 比例是否不同?
根据以往经验,新生儿染色体异常率一般为1% ,现 某医院观察了当地共400 名新生儿,只发现一例染色 体异常。该地新生儿染色体异常率是否低于一般?
4、独立性检验 、
利用样本资料对总体的两个变量的数据是否彼此关联的检验, 利用样本资料对总体的两个变量的数据是否彼此关联的检验, 如果不关联,即为独立。 如果不关联,即为独立。
不同教师对三位运动员的技术所作评分 教师编号 1 2 3 4 5 6 7 8 运动员A 5.3 5.5 5.1 5.2 5.3 5.2 5.6 5.5 运动员B 6.2 6.4 4.8 5.0 6.0 4.9 6.7 6.2 运动员C 5.8 6.0 5.5 5.5 5.6 5.4 6.0 5.9
6、方差齐性检验 、
5、相关性检验 、
检验多个相关样本间差异性
例9
欲对三位运动员的综合技术作出评价,以不同专业层次的 欲对三位运动员的综合技术作出评价,以不同专业层次的8 位教师对三位运动员的技术作评分(下表), ),问不同教师对 位教师对三位运动员的技术作评分(下表),问不同教师对 三位运动员技术水平的评价有无不同? 三位运动员技术水平的评价有无不同?
某校15名学生5个月长跑锻炼前后的晨脉次数(单位:次/分钟)
学生号
1 70 48
2 76 54
3 56 60
4 63 64
5 63 48
6 56 55
7 58 54
8 60 45
9 67 50
10 65 48
11 75 56
12 66 48
13 56 62

第7章 SPSS非参数检验

第7章  SPSS非参数检验

两独立样本的游程检验中,游程数依赖于 变量的秩。将两组样本混合后按升序排列, 然后按对应的组标记值序列计算游程数。 7.2.4极端反应检验(Moses 极限反应) 原假设:两独立样本来自的两个总体的分 布无显著差异。 将一组样本作为控制样本,另一组样本作 为实验样本,以控制样本作为对照,检验 实验样本相对于控制样本是否出现了极端 反应。



7.1.2二项分布检验 二项分布检验是通过样本数据检验样本来自的总 体是否服从指定概率为p的二项分布。 原假设:样本来自的总体与指定的二项分布无显 著差异。 一、二项分布检验的基本思想 变量只有两个取值0和1,如果进行n次相同的实 验,则出现两类(0和1)的次数可以分别用离散 型随机变量X来描述,如果随机变量值X为1的概 率设为p,则随机变量X值为0的概率便等于1-p, 形成二项分布。
典型的卡方统计量:Pearson卡方:
0 e 2 ( f f 2 i i ) 0 f i 1 i k
式中,k为子集的个数; f i 为观察频数; f i e为期望频数;= npi
0
如果卡方值较大,则说明观测频数分布与期望频数分布 差距较大;反之,则说明观测频数与期望频数分布较接 近。如果卡方的概率值小于显著性水平,则拒绝原假设, 认为样本来自的总体分布与期望分布存在显著性差异; 反之,则接受原假设,认为样本来自的总体分布与期望 分布无显著性差异。

2.选择待检验变量到[检验变量列表]框中 3.在[割点]框中确定计算游程的分界值。其中,中位数表 示以样本中位数为分界值;众数表示以样本众数为分界值; 均值表示以样本均值为分界值;设定表示以用户输入的值 为分界值,小于该值的为一组,大于等于该值的为另一组。
7.2 两独立样本的非参数检验

SPSS软件应用-第七章非参数检验


病例号 照射前 照射后
1
1.0 0.0
2
1.0 18.0
3
0.0 6.7
4
1.2 0.0
5
1.0 29.0
6
1.0 17.0
7
1.0 5.0
8
1.0 6.0
9
1.0 10.0
10
4.0
7.0
Questions &
Answers
饲料
肝脏内铁含量(μg)
A 2.23 1.14 2.63 1.00 1.35
B 5.59 0.96 6.96 1.23 1.61
C 4.50 3.92 10.33 8.23 2.07
练习2
10例食管癌病人在某种药物保护下,做 6000γ的放射照射,观察血中淋巴细胞 畸变百分数,结果如下表。问照射前后 血中淋巴细胞畸变百分数有无差别。
7.1 拟合优度检验(1-Sample K-S Test)
以例7-1数据(数据文件名“diameter_sub.sav”)为例,试检验变量 “trueap_mean”(矢状面管径)是否服从正态分布。
7.1 拟合优度检验(1-Sample K-S Test)
7.1 拟合优度检验(1-Sample K-S Test)
第二步:Analyze Nonparametric Test Legacy Dialogs 2 Related Samples Test
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.5 两个相关样本的非参数检验
7.6 多个相关样本的非参数检验
牙齿 普通 RPI Y型 编号 卡环 卡环 卡环
7.2 样本率与总体率比较的二项分布检验(Binomial)

7、spss第七章 非参数检验


左表是频数分布情况表,第 二列为实际观察值出现次数, 第三列为理论上每天应出现 的次数,第四列为残差 左表是计算的卡方统计量 及对应的相伴概率值,由 于Sig.=0.014<0.05。说明 应拒绝每个工作日出现的 次品率相等的原假设。即 次品数出现是不均匀的。 10
工作日 Chi-Square df Asymp. Sig. 12.556a 4 .014
双尾检验的相伴概率为0.151,大于0.05,说明两种汽油无 显著性差异。
16
西南财经大学出版社
SPSS16.0与统计数据分析
主要内容
7.0 非参数检验概述 7.1单样本的非参数检验 7.2 两独立样本的非参数检验 7.3 多独立样本的非参数检验 7.4 两相关样本的非参数检验 7.5 多相关样本的非参数检验
17
西南财经大学出版社
SPSS16.0与统计数据分析
7.2 两独立样本的非参数检验
9
西南财经大学出版社
SPSS16.0与统计数据分析
7.1 单样本的非参数检验
7.1.1卡方检验 第5步 主要结果及分析
1 2 3 4 5 Total Observed N 25 15 8 16 26 90 Expected N 18.0 18.0 18.0 18.0 18.0 Residual 7.0 -3.0 -10.0 -2.0 8.0
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 18.0.
西南财经大学出版社
SPSS16.0与统计数据分析
7.1 单样本的非参数检验
7.1.2 二项分布检验

第7章 群体间的差异比较——非参数检验

输入检验变量 中第一类事件 的比例。
(三)二项分布检验(Binominal Test)
结果说明
检验比例
观测比例
单尾 检验的概值小于 5%,则拒绝原假设,认 为外地户口的比例不是 15%。从观测比例来看, 应小于15%。
(三)二项分布检验(Binominal Test)
例:针对“住房状况调查.sav”,分析现住面积在100平米以 上的是否为20%.
针对数据“住房状况调查.sav”,分析本市户口和外地户 口的现住面积和计划面积有无显著差异。
此例适用于双独立样本的T检验。但通过正态性检验发现, 数据不符合正态分布。
样本量足够大的情况下,即使违反正态性假设,T检验也 适用。
此时可做完T检验后再进一步用双独立样本的非参数检验 加以验证。
分析——非参数检验——旧对话框——2个独立样本
进行正态性检验知,样本并不服从正态总体。因此不能采 用t 检验,考虑用配对样本的非参数检验。
配对样本的非参数检验
原假设:前后测的差值为0(这种指导没有作用) 备择假设:后测-前测>0 分析——非参数检验——旧对话框——2个相关样本
Wilcoxon检验和Sign 检验都是假设前后测的 数据有相同的形状分布, 即两个分布有同样的均 值和方差。 因此,配对样本的非参 数检验并不关心分布的 具体类型。
(二)双独立样本的非参数检验
(二)双独立样本的非参数检验
本市户口的 现住面积和 计划面积都 更高。
本市户口和外地 户口的现住面积 差异显著,计划 面积差异不显著。
7.4 多独立样本的非参数检 验
多独立样本的非参数检验
我们在做自变量水平为两个以上的均值比较时,一般采用 方差分析。
方差分析是一种非常稳健的统计分析方法,即在违反数据 要求的情况下往往仍然能够得到科学的结果。

吴喜之-非参数检验教程(ppt 77页)

认为服从泊松分布。
One-Sample Kolmogorov-Smirnov Test
N Poisson Parameat,eb r
Most Extreme Differences
Mean Absolute Positive Negative
ZD 2608 3.8673 .012 .010
-.012
病人猝死人数与日期的关系为2.8:1:1:1:1:1:1 。
12.2 二项分布检验 Binomial test
二项分布:在现实生活中有很多的取值是两类的,如人 群的男和女、产品的合格和不合格、学生的三好学生和 非三好学生、投掷硬币的正面和反面。这时如果某一类 出现的概率是P,则另一类出现的概率就是1-P。这种 分布称为二项分布。
这都称为非参数检验。
为什么用非参数方法?
这些非参数检验在总体分布未知时有很大的优越 性。这时如果利用传统的假定分布已知的检验, 就会产生错误甚至灾难。
12.1 卡方检验 Chi-Square test
这里介绍的卡方检验可以检验列联表中某一个变量的各 个水平是否有同样比例或者等于你所想象的比例(如 5:4:1)
实例1:掷骰子300次,变量LMT,1、2、3、4、5、6 分别代表六面的六个点,试问这骰子是否均匀。数据 data12-01(300个cases)。
– Analyze-> Nonparametric Tests-> 2 related Samples
– Test Pairs: dlq-dlh – Test type:选一种或多种 – 比较有用的结果:看sig值,sig<.05, 拒绝零假设,认
为锻炼前后的晨脉有显著性的差异。
12.8 多个相关样本检验
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档