第9章非参数检验研究报告
非参数检验(卡方检验),实验报告

非参数检验(卡方检验),实验报告评分大理大学实验报告课程名称生物医学统计分析实验名称非参数检验(卡方检验)专业班级姓名学号实验日期实验地点2015—2016 学年度第学期一、实验目得对分类资料进行卡方检验。
二、实验环境1、硬件配置:处理器:Intel(R)Core(TM)i5-4210U CPU 1、7GHz 1、7GHz 安装内存(RAM):4、00GB系统类型:64 位操作系统 2、软件环境:IBM SPSS Statistics 19、0 软件三、实验内容(包括本实验要完成得实验问题及需要得相关知识简单概述)(1)课本第六章得例 6、1-6、5 运行一遍,注意理解结果;(2)然后将实验指导书得例 1-4 运行一遍,注意理解结果。
四、实验结果与分析(包括实验原理、数据得准备、运行过程分析、源程序(代码)、图形图象界面等)例例 6、1 表 1 灭螨A A 与灭螨B B 杀灭大蜂螨效果得交叉制表效果合计杀灭未杀灭组别灭螨A 32 12 44 灭螨B 14 22 36 合计 46 34 80 分析: 表1就是灭螨A与灭螨B杀灭大蜂螨效果得样本分类得频数分析表,即交叉列联表。
表 2 卡方检验X2 值df 渐进Sig、(双侧)精确Sig、(双侧)精确Sig、(单侧)Pearson 卡方 9、277a1、002连续校正b7、944 1、005似然比 9、419 1、002Fisher 得精确检验、003、002 有效案例中得 N 80a、0 单元格(、0%)得期望计数少于5。
最小期望计数为15、30。
b、仅对 2x2 表计算分析: 表2就是卡方检验得结果。
因为两组各自得结果互不影响,即相互独立。
对于这种频数表格式资料,在卡方检验之前必须用“加权个案”命令将频数变量定义为加权变量,才能进行卡方检验。
Pearson 卡方:皮尔逊卡方检验计算得卡方值(用于样本数n≥40且所有理论数E≥5);连续校正b : 连续性校正卡方值(df=1,只用于2*2列联表);似然比:对数似然比法计算得卡方值(类似皮尔逊卡方检验);Fisher 得精确检验:精确概率法计算得卡方值(用于理论数E<5)。
非参数检验

非参数检验的概念
非参数检验又称为任意(不拘) 非参数检验又称为任意(不拘)分布检验 distributiontest), ),这类方法 (distribution-free test),这类方法并不依赖总
非 参 数 检 验
体分布的具体形式,应用时可以不考虑研究变量 体分布的具体形式, 为何种分布以及分布是否已知,进行的是分布之 为何种分布以及分布是否已知, 间而不是参数之间的检验,故又称非参数检验
参数检验的特点
分析目的:对总体参数(µ π)进行估计或检验。 进行估计或检验。 分析目的:对总体参数(
非 参 数 检 验
分布:要求总体分布已知, 分布:要求总体分布已知,如:
•连续性资料——正态分布 连续性资料——正态分布 •计 数 资 料——二项分布、POISSON分布等 ——二项分布 POISSON分布等 二项分布、
序号 (1) 1 2 3 4 5 6 7 8 9 10 11 12
数据 (2) 39 42 45 43 52 45 22 48 40 45 40 49
排秩 ( 3)
非 参 数 检 验
非 参 数 检 验
疗效
A组 (1 ) 15 11 20 8
B组 (2 ) 12 3 7 4
排秩
平均秩次
控制 显效 有效 近控
参数检验方法的局限
非 参 数 检 验
t检验 成组t 成组t检验要求:正态、方差相等、个体独立 配对t 配对t检验要求:差值正态、个体独立 方差分析 单因素多水平比较方差分析要求:正态、方差 相等、个体独立 多个分析因素时方差分析要求:分布、方差、 个体独立性
定性无序分类资料
非 参 数 检 验
两组性别结构是否相同? 两组某种不良反应的发生率是否相同? 多组发生率是否相同? 多组构成是否相同?
非参数检验

两种方法治疗扁平足效果观察
建立假设
病例号
原始记录 A法 B法
量化值 A法 B法
差值
秩次
H0:两法疗效差值的总体中位数
1 2
为0;
3
4
H1:差值的总体中位数不为0。
5
6
=0.05
7
8
计算检验统计量
9
10
编秩:
11
12
求秩和:T+=61.5,T-
13
=4.5
14 15
好
差
好
好
好
差
好
中
差
中
中
差
好
中
好
差
秩和(rank sum): 同组秩次之和;在一定程度上反映了等级 的分布位置。
秩和检验:就是通过秩次的排列求出秩和,进行假设检验。
11
非参数检验 (nonparametric test )
非参数检验的最常用方法——秩和检验( rank test ) 利用秩的大小进行推断就避免了不知道背景分布的
困难。这也是非参数检验的优点。 多数非参数检验明显地或隐含地利用了秩的性质;
但也有一些非参数方法没有涉及秩的性质。 掌握对数据进行编秩的方法是学习秩和检验的基本
要求。
12
非参数检验 (nonparametric test )
非参数检验的最常用方法——秩和检验( rank test )
A组: - 、、+、+、+、+、++、++、++、++、+++、+++
适用条件: (1)上述两种设计类型的资料不满足参数检 验条件。 (2)配对设计等级资料的比较。
非参数检验(提纲)

非参数检验参数检验方法,尤其是对计量资料,需要对研究的总体作一些比较严格的假定。
例如t检验法要求总体分布是正态分布等。
在实际工作中的许多资料不符合这种要求,因此以上的参数检验方法的使用受到了限制。
近代统计学家发明了对总体分布不必作限制性假定的检验技术,这种技术称为非参数检验(Nonparametric tests)。
非参数检验法是指在总体不服从正态分布或分布情况不明时,用来检验数据资料是否来自相同总体假设的一类检验方法。
由于它的假定前堤比参数检验方法少的多,而且在收集资料方面也十分简单,例如可以用“等级”或“符号”来评定观察的结果等,故这类方法在实际中有着广泛的应用。
第一节两相关样本的显著性检验1.1 符号检验法在配对实验中,将每对(或同一)实验单位(或先后)给予两种不同的处理,比较两种处理的效果有无差异或比较一组实验单位处理先后有无不同。
凡配对计量资料不服从正态分布要求时,可选用符号检验法(Sign test)。
例题1 有x,y 12对数据,它们的数值及相差符号由表1给出。
表1 本例的数据资料序号 1 2 3 4 5 6 7 8 9 10 11 12X 3 1 6 3 2 1 4 7 3 8 4 5Y 2 4 4 7 2 2 2 5 3 6 2 2 问这两个序列数值的差异是否具有显著性(α=0.05)?1.2 符号秩和检验法符号检验中只考虑配对数据x i-y i的符号,计算十分简便,但因没有考虑到x i-y i 差值的大小,因此对资料的利用不够充分,检验的灵敏度也不够好。
符号秩和检验法是上述方法的改进,由于关注到了差值的大小,故效果较好。
凡配对计量或计数的资料,可选用符号秩和检验法(Wilcoxon法)。
例题2 为研究长跑运动对增强普通高校学生的心功能效果,对某学院15名男生进行实验,经过5个月的长跑锻炼后观察其晨脉变化情况。
锻炼前后的晨脉数据如下。
问锻炼前后晨脉间的差异有无显著性(α=0.05)?表2 长跑锻炼前后的晨脉数、差值及其秩次序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 前70 76 56 63 63 56 58 60 65 65 75 66 56 59 70 后46 54 60 64 48 55 54 45 51 48 56 48 64 50 54 差值22 22 -4 -1 15 1 4 15 14 17 19 18 -8 9 16 秩次14.5 14.5 –3.5 –1.5 8.5 1.5 3.5 8.5 7 11 13 12 -5 6 101.3 用spss对两相关样本进行非参数检验spss软件包的Nonparametric Tests过程为两相关样本通常提供了3种非参数检验方法,它们是:Sign 检验,用于对两相关样本的总体做符号检验。
第9章 非参数检验

(4)求秩和并确定检验统计量:
分别求出正负秩次之和,正秩和以T+ 表示,负秩和的绝对值以T-表示。T+及T之和等于n(n+1)/2。此式可验证T+和T-的 计算是否正确。如本例T+=19.5,T-=25.5, 其和为45,n=9(因舍去三对差值为0的数 据),9(9+1)/2=45。取T+和T-中较小者 作为检验统计量T,本例取T=19.5。
多个样本间两两比较的秩和 检验(Nemenyi法)
样本例数相等的两两比较秩 和检验 各样本例数不同或不全相同 的两两比较的秩和检验
非参数检验又称为任意分布检验 (distribution-free test),它不考 虑研究对象总体分布具体形式,也不对总 体参数进行统计推断,而是通过检验样本 所代表的总体分布形式是否一致来得出统 计结论。
4.确定P值和作出推断结论 本例样本含量较多,超出附表6的 范围,需用下式求u值来判断结论。又 因频数表资料相同秩次数较多(超过总 样本数25%),故需用校正公式。
u
T n1 ( N 1) / 2 0.5 n1n 2 ( N 1) 12 8780.5 82( 208 1) / 2 0.5
当n1>20或(n2-n1)>10时,附表6中 查不到P值,则可采用正态近似法求u值来 确定P值,其公式如下:
T n1 ( N 1) / 2 0.5 n1n 2 ( N n2 分别为两样本含量,N=n1+n2,0.5这连 续性校正数。上式为无相同秩次时使用 或作为相同秩次较少时的近似值。当两 样本相同秩次较多(超过总样本数的 25%)时,应按下式进行校正,u经校正 后可略增大,P值则相应减小。
uc u
非参数检验方法 PPT课件

对于符合参数统计分析条件者,采用 非参数统计分析,其检验效能较低
秩和检验
秩和检验(rank sum test):一类常用 的非参数统计分析方法;基于数据的秩次与 秩次之和
两独立样本差别的秩和检验 配对设计资料的秩检验 完全随机设计多组差别的秩和检验
两独立样本比较的秩和检验 Wilcoxon rank sum test
n1=8 T1=216 n2=7
21 26 24 27
T2=134
11.7 11.7 12.0 12.3 12.4 13.6
n3=9
14 15 16 16 20 25
T3=123.5
10.5 10.5 10.5 10.9 11.0 11.5
n4=8
6 7 9 10 12
T4=54.5
假设检验步骤
建立假设检验 • H0:四组鼠脾DNA含量的总体分布相同。 • H1:四组鼠脾DNA含量的总体分布位置不全相
第九章
非参数检验方法
参数统计
(parametric statistics)
已知总体分布类型,对 未知参数(μ、π)进 行统计推断
依赖于特定分布类 型,比较的是参数
非参数统计
(nonparametric statistics)
对总体的分布类 型不作任何要求
不受总体参数的影响, 比较分布或分布位置
适用范围广;可用于任何类型 资料(等级资料,或“>50mg” )
对于计量数据,如果资料方差相等,且服从 正态分布,就可以用 t 检验比较两样本均数。
如果此假定不成立或不能确定是否成立,就 应采用秩和时间(月)
无淋巴细胞转移
有淋巴细胞转移
时间
秩次
时间
秩次
SPSS非参数检验实验报告

实验项目非参数检验实验时间2017.10.27实验地点S308 成绩三、实验内容1、将一颗骰子连掷120次,各次所出现的点数顺次如“shai.sav” 所示,试检验掷骰子点数是否服从均匀分布?2、从随机数表中抽得20个数据如下:0.55 0.8 0.15 0.12 0.21 0.4 0.46 0.17 0.62 0.770.63 0.71 0.99 0.88 0.30 0.64 0.51 0.68 0.50 0.60要求:(1)利用单个样本的K–S检验法检验这些数据是否服从正态分布;(2)对结果进行分析,并填写新的实验报告。
1、SPSS单样本K-S检验的基本操作步骤如下:(1)选择菜单:【分析(A)】→【非参数检验(N)】→【旧对话框(L)】→【1样本K-S(1)】出现如图1-1所示的窗口。
图1-1 单样本K-S检验窗口(2)选择待检验的变量到【检验变量列表(T)】框中。
(3)在【检验分布】框中指定理论分布,这里选择【相等】,即代表均匀分布。
至此,SPSS将自动计算K-S检验统计量和对应的概率P-值,并将结果输出到查看器窗口中。
分析结果如图1-2所示。
图1-2掷骰子总体分布的K-S检验结果图1-2表明,数据极小值为1.00,极大值为6.00。
最大绝对差值为0.158,正差极值为0.158,负差极值为-0.142。
SPSS自动计算输出了√nD值(1.734)和概率P-值(0.005)。
如果显著性水平α为0.05,由于概率P-值小于显著性水平,因此拒绝原假设,接受备择假设,即掷骰子点数的总体分布为不是均匀分布。
2、SPSS单样本K-S检验的基本操作步骤如下:(1)选择菜单:【分析(A)】→【非参数检验(N)】→【旧对话框(L)】→【1样本K-S(1)】出现如图2-1所示的窗口。
图2-1单样本K-S检验窗口(2)选择待检验的变量到【检验变量列表(T)】框中。
(3)在【检验分布】框中指定理论分布,这里选择【常规】,即代表正态分布。
zh9非参数检验

当n1>20或(和)n2>20时,用正态
近似法计算u值。
n1n2 |U | 0.5 2 u n1n2 (n1 n2 1) 12
35
第三节
成组设计多个样本 比较的秩和检验
完全随机(成组)设计多样本比较,
如不能满足参数检验的要求,或为等级
资料,多选用Kruskal-Wallis H检验。
10
⑤分别求秩和:T+、T-。
T+与T-和等于n(n+1)/2。 ⑥可任取其一秩和作检验统计量,
本例T-=22。
11
3、确定P值和结论
n≤50时,查T界值表(P208) Tα下界<T<上界Tα P>α
T落在Tα上下界之外 P<α T等于Tα上界或下界 P<α
12
n=16-1=15 ( 1个秩次=0)
查表:
T0.05,15=25~95
T-=22或T+=98在界外
P<0.05 ,按α=0.05水准,拒绝H0,
接受H1,差别有统计学意义。可认为两种测
定结果不同。
13
n>50时,作u检验
| T n(n 1) / 4 | 0.5 u n(n 1)(2n 1) / 24
当相同的“差值绝对值”较多时,u值 偏小,应用校正公式计算:
… … 13 7 9 3.5 T+=98
1 2 … …
T-=22
9
d 20 10 -2 -2 13 31 0 -7 -5 36 -20 37 32 12 15 5
正T
负T
10.5 6 1 2 8 12 5 3.5 14 10.5 15 13 7 9 3.5
2、计算T值
①差值绝对值从小到
大编秩
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
根据给定的显著性水平α=0.05,查 分2 布表得临界值
2
(k
m
1)
2 0.05
(2)
5.99
(4)作出决策
2
7.34
2 0.05
(2)
5.99
,所以,拒绝H0
(5)给出结论
市场份额发生改变
8 - 11
正态总体拟合优度检验
统计学 正态总体拟合优度检验
STATISTICS (第三版)
(例题分析)
【例】一家公司人事部主管想知道求职者能力测验分数总
8 -7
统计学
STATISTICS
(第三版)
多项总体拟合优度检验
(多项总体与多项试验)
1. 多项总体
总体中的每一个个体被分配到几个类别中的一个 且仅被分配到一个类别中
是二项分布在三个及三个以上类别情形中的推广
2. 多项试验
二项试验
l 试验由完全相同的试验组成 l 每次试验有两种可能的结果。把其中一个称为成功,另一个
个等概
率区间
s
(xx)2
n1
10.41
2 =10.412
z
x
2=1 分成10
个等概 率区间
=68.42 X
0 z
x z 68.42 z 10.41
8 - 13
统计学 正态总体拟合优度检验
STATISTICS (第三版)
(例题分析)
解:(1)提出假设
H0 :测验分数总体服从均值为68.42和标准差为10.41的正态分布 H1 :测验分数总体不服从均值为68.42和标准差为10.41的正态分布 (2)计算检验统计量的具体值
5
4
16
3.20
63.01~65.82
6
5
1
1
0.20
65.82~68.42
2
5
-3
9
1.80
68.42~71.02
5
5
0
68.42-1.28×10.41=55.10
71.02~73.83
2
5
-3
0
0.00
9
1.80
z
73.83~77.16
5
5
0
71.16~81.74
5
5
0
0
0.00
0
0.00
81.74以上 合计
6
5
1
50
50
-
1
0.20
- 2 7.20
8 - 14
统计学 正态总体拟合优度检验
STATISTICS (第三版)
(例题分析)
解:(3)查表确定临界值
根据给定的显著性水平α=0.05,查 2分布表得临界值
2
(k
m
1)
2 0.05
(7)
14.07
(4)作出决策
2 检验统计量的计算结果
使用等 概率区
测验分数 55.10以下
观测频数 期望频数
(fo) 5
(fe) 5
差
(fo-fe) 0
差的平方
差的平方除以 期望频数
(f o f e)2 (fo fe)2 / fe
0
0.00
间是个 很好的 方法
55.10~59.68
5
5
0
0
0.00
59.68~63.01
9
拟合优度检验
1. 使用 2 统计量
2
(fo fe)2
fe
df k m 1
k表示类别数
f0表示观测频数
m表示用样本估计总体参数的个数
fe表示期望频数(fe 5,否则,可合并类别或增大样本容量)
2. 检验样本观测结果与原假设为真条件下期
望结果的吻合程度
3. 一般地,可以用于任何假设的概率分布
(2 df)
f
表示观测频数
0
fe表示期望频数(fe 5,否则,可合并类别或增大样本容量)
3. 决策规则
临界值法: 2 (2 df) ,拒绝原假设
P值法:P值 <α, 拒绝原假设
8 -4
统计学
STATISTICS (第三版)
8 -5
多项总体拟合优度检验
统计学
STATISTICS
(第三版)
统计学
STATISTICS
(第三版)
第 9 章 非参数检验
8 -1
统计学
STATISTICS
(第三版)
第 9 章 非参数检验
9.1 拟合优度检验 9.2 两个分类变量的独立性检验(列联表检
验)
9.3 总体比例的假设检验
8 -2
统计学
STATISTICS
(第三版)
学习目标
1. 掌握多项分布和正态分布的拟合优度检验
各类别的期 望频数不少 于5(可以合 并相邻类别 或增大样本
类别
A公司 B公司
假设比例 观测频数 期望频数 差
差的平方
差的平方除 以期望频数
(fo) (fe) (fo-fe) (fo fe)2 (fo fe)2 / fe
0.30
48
60
-12 144
2.40
0.50
98
100
-2
4
0.04
容量以达到
A公司 48
观测频数 B公司 98
C公司 54
8 -9
统计学
STATISTICS
(第三版)
多项总体拟合优度检验
(例题分析)
解:(1)提出假设
H0 :PA=0.30,PB=0.50,PC=0.20 H1 :总体比例不是PA=0.30,PB=0.50,PC=0.20 (2)计算检验统计量的具体值
2 检验统计量的计算结果
称为失败 l 每次试验中成功的概率(p)都相同,失败的概率(1-p)也
都相同 l 每次试验是相互独立的
多项试验
l 与二项试验唯一不同之处是每次多项试验有多种可能的结果
8 -8
统计学
STATISTICS
(第三版)
多项总体拟合优度检验
(例题分析)
【例】近几年A公司的市场份额稳定在30%,B公司的市场 份额稳定在50%,C公司的市场份额稳定在20%。最近C公司 开发了“新型改进”产品,推向市场取代当前所售产品。C公 司委托一家市场调查公司研究新产品是否使市场份额发生了 变化。市场调查公司随机抽取了200名顾客进行购买偏好调查, 结果如下:
2. 掌握两个分类变量独立性的检验(列联表 检验)
3. 掌握一个总体比例假设值的检验
4. 掌握两个总体或多个总体比例之间差异的 检验
5. 掌握返回独立性检验值的函数CHITEST
8 -3
统计学
STATISTICS
(第三版)
χ2统计量
1. 本章使用χ2检验统计量
2. 2
~ (fo fe)2 fe
C公司 0.20
54
40
这一要求) 总计
200
200
14 196
4.90
—
— 2 7.34
2
~ (fo fe)2 fe
2 (df )
df k m 1
k—类别数;m—用样本估计总体参数的个数
8 - 10
统计学
STATISTICS
(第三版)
多项总体拟合优度检验
(例题分析)
解:(3)查表确定临界值
体是否呈正态分布,随机抽取的50名求职者的测验分数如下
50名求职者的能力测验分数
71
66
61
65
54
93
60
73
73
55
63
56
62
76
76
68
53
58
85
80
56
65
62
90
69
76
79
77
65
65
61
56
63
80
56
86
70
70
54
82
79
61
61
64
54
64
74
71
79
84
x
x
n
68.42
分成10