生物统计 第11章 非参数检验

合集下载

医学统计学第十一章 非参数检验(课堂)

医学统计学第十一章 非参数检验(课堂)

正 秩 (3)
负 秩 (4) 1.5
1.5 3 4 5 6 7 8 9 10 11 64.5
1.5
0.05 的 T 范围为 13-53; T=1.5 在此范围之外,P<0.05,按 0.05 水准拒 绝 H 0 ,接受 H1 ,可认为该厂工人的尿氟含量 高于当地正常人的尿氟含量。
单侧 n 11 ,
3.分别求正负秩次之和,任取正秩和或负 秩和为T值 4.根据统计量T确定对应的P值 (i)n<=50小样本时,查表(附表9) (ii) n>50大样本时,正态近似
编号
1 2 3
原法
60 142 195
新法
76 152 243
差值
16 10 48
正秩
8 5 11
负秩
4
5 6
80
242 220
82
240 220
第三节 K个独立样本检验
完全随机设计多个样本比较的 Kruskal-Wallis H检验
1. 原始数据的多个样本比较 Kruskal-Wallis H检验
H0 :多个总体分布位置相同 H1 :多个总体分布位置不全相同
0.05
例8-5 用三种药物杀灭钉螺,每批用200 只活钉螺,用药后清点每批钉螺的死亡 数,再计算死亡率,结果见表,问三种 药物杀灭钉螺的效果有无差别?
数据的总体分布类型不作严格假定,
又称任意分布检验(distribution-free test),
它直接对总体分布的位置作假设检
验。
应用非参数检验的情况
1.不满足正态和方差齐性条件的小样本资料;
2.总体分布类型不明的小样本资料;
3.一端或二端是不确定数值(如<0.002、>65 等)的资料; 4.单向有序列联表资料;

常用的非参数检验(NonparametricTests)总结

常用的非参数检验(NonparametricTests)总结

常用的非参数检验(NonparametricTests)总结非参数检验(Nonparametric tests)是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。

参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。

但是,在数据分析过程中,由于种种原因,人们往往无法对总体分布形态作简单假定,此时参数检验的方法就不再适用了。

非参数检验正是一类基于这种考虑,在总体方差未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。

由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验。

•两独立样本的非参数检验两独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。

独立样本是指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。

SPSS中提供了多种两独立样本的非参数检验方法,其中包括曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。

某工厂用甲乙两种不同的工艺生产同一种产品。

如果希望检验两种工艺下产品的使用是否存在显著差异,可从两种工艺生产出的产品中随机抽样,得到各自的使用寿命数据。

甲工艺:675 682 692 679 669 661 693乙工艺:662 649 672 663 650 651 646 652(1)曼-惠特尼U检验两独立样本的曼-惠特尼U检验可用于对两总体分布的比例判断。

其原假设:两组独立样本来自的两总体分布无显著差异。

曼-惠特尼U 检验通过对两组样本平均秩的研究来实现判断。

秩简单说就是变量值排序的名次,可以将数据按升序排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。

(2)K-S检验K-S检验不仅能够检验单个总体是否服从某一理论分布,还能够检验两总体分布是否存在显著差异。

生物统计学 第11讲2 二项分布的检验+非参数检验

生物统计学 第11讲2  二项分布的检验+非参数检验

配对设计 关心:差值
差值
平均
0.501
标准误差 0.18
中位数
0.49
众数
#N/A标准差源自0.70方差0.50
峰度
0.86
偏度
0.34
区域
2.8
最小值
-0.92
最大值
1.88
求和
8.01
观测数
16
• 例3 差值的描述性统计
8
解 H0:两种处理效果相同. H0 : p 0.5
HA :H0不成立
大样本时……P125,例3.32
• 例4 Wilcoxon秩和检验
19
每个总体的样本含量>5,总样本含量>15 H0:各总体分布无差异.
2.多个独立样本的秩和检验
20
试判断三种不同人群的血浆总皮质醇测定有 无差别?
正常人
0.11 0.52 0.61 0.69 0.77 0.86 1.02 1.08 1.27 1.92
肺癌病人 3.23
肺癌病人
4.2
肺癌病人 4.87
肺癌病人 5.12
肺癌病人 6.21
肺癌病人 7.18
肺癌病人 8.05
肺癌病人 8.56
肺癌病人
9.6
group 肺癌病人 矽肺0期工人 肺癌病人 矽肺0期工人 矽肺0期工人 矽肺0期工人 肺癌病人 矽肺0期工人 矽肺0期工人 矽肺0期工人 矽肺0期工人 矽肺0期工人 矽肺0期工人 肺癌病人 肺癌病人 肺癌病人 肺癌病人 肺癌病人 肺癌病人 肺癌病人
6.82 2.78 9.60 59.80
10
16
group
RD
矽肺0期工人 3.23
矽肺0期工人 3.5

非参数检验(提纲)

非参数检验(提纲)

非参数检验参数检验方法,尤其是对计量资料,需要对研究的总体作一些比较严格的假定。

例如t检验法要求总体分布是正态分布等。

在实际工作中的许多资料不符合这种要求,因此以上的参数检验方法的使用受到了限制。

近代统计学家发明了对总体分布不必作限制性假定的检验技术,这种技术称为非参数检验(Nonparametric tests)。

非参数检验法是指在总体不服从正态分布或分布情况不明时,用来检验数据资料是否来自相同总体假设的一类检验方法。

由于它的假定前堤比参数检验方法少的多,而且在收集资料方面也十分简单,例如可以用“等级”或“符号”来评定观察的结果等,故这类方法在实际中有着广泛的应用。

第一节两相关样本的显著性检验1.1 符号检验法在配对实验中,将每对(或同一)实验单位(或先后)给予两种不同的处理,比较两种处理的效果有无差异或比较一组实验单位处理先后有无不同。

凡配对计量资料不服从正态分布要求时,可选用符号检验法(Sign test)。

例题1 有x,y 12对数据,它们的数值及相差符号由表1给出。

表1 本例的数据资料序号 1 2 3 4 5 6 7 8 9 10 11 12X 3 1 6 3 2 1 4 7 3 8 4 5Y 2 4 4 7 2 2 2 5 3 6 2 2 问这两个序列数值的差异是否具有显著性(α=0.05)?1.2 符号秩和检验法符号检验中只考虑配对数据x i-y i的符号,计算十分简便,但因没有考虑到x i-y i 差值的大小,因此对资料的利用不够充分,检验的灵敏度也不够好。

符号秩和检验法是上述方法的改进,由于关注到了差值的大小,故效果较好。

凡配对计量或计数的资料,可选用符号秩和检验法(Wilcoxon法)。

例题2 为研究长跑运动对增强普通高校学生的心功能效果,对某学院15名男生进行实验,经过5个月的长跑锻炼后观察其晨脉变化情况。

锻炼前后的晨脉数据如下。

问锻炼前后晨脉间的差异有无显著性(α=0.05)?表2 长跑锻炼前后的晨脉数、差值及其秩次序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 前70 76 56 63 63 56 58 60 65 65 75 66 56 59 70 后46 54 60 64 48 55 54 45 51 48 56 48 64 50 54 差值22 22 -4 -1 15 1 4 15 14 17 19 18 -8 9 16 秩次14.5 14.5 –3.5 –1.5 8.5 1.5 3.5 8.5 7 11 13 12 -5 6 101.3 用spss对两相关样本进行非参数检验spss软件包的Nonparametric Tests过程为两相关样本通常提供了3种非参数检验方法,它们是:Sign 检验,用于对两相关样本的总体做符号检验。

非参数检验

非参数检验
非参数检验又称为任意分布检验 (distribution-free test),它不考虑 研究对象总体分布具体形式,也不对总体 参数进行统计推断,而是通过检验样本所 代表的总体分布形式是否一致来得出统计 结论。
非参数检验的优点:
①适用范围广,不论样本来自的 总体分布形式如何,都可适用;
②某些非参数检验方法计算简便, 研究者在急需获得初步统计结果时可 采用;
的总体分布不同。 α=0.05
2.混合编秩
依据两组数值由小到大编秩,结果 见上表。
3.求秩和并确定检验统计量T
把两组秩次分别相加求出两组的秩 和值,R1=315.5,R2=149.5。因乳 酸钙组样本含量较小,故 T=R2=149.5。
4.确定P值和作出推断结论 以较小样本含量为n1,n1=14, n2n1=2,查附表6,两样本比较秩和检验 用T界值表(双侧)。
当n1>20或(n2-n1)>10时,附表6 中查不到P值,则可采用正态近似法求u 值来确定P值,其公式如下:
u T n1(N 1) / 2 0.5 n1n2(N 1) 12
上式中T为检验统计量值,n1、n2 分别为两样本含量,N=n1+n2,0.5这 连续性校正数。上式为无相同秩次时使 用或作为相同秩次较少时的近似值。当 两样本相同秩次较多(超过总样本数的 25%)时,应按下式进行校正,u经校 正后可略增大,P值则相应减小。
式中,Ri为各组的秩和,ni为各组 样本含量,N为总样本含量。
当各组相同秩次较多时,可对H值进 行校正,按下式求值。
Hc H c
C 1
(t
3 j
t
j
)
(N3 N)
4.确定P值和作出推断结论
当组数K=3,每组样本含量ni≤5时, 可查附表7(H界值表)得到P值。若 k>3或ni>5时,H值的分布近似于自 由度为k-1的χ2分布,此时可查附表 4χ2界值表得到P值。最后按P值作出 推断结论。

非参数检验——【北大 医学统计学】

非参数检验——【北大 医学统计学】
Z= 3.628,P=0.000<0.05,按α= 0.05水平,拒绝H0,
认为正常人和慢性支气管炎病人痰液此类白细胞的检 查结果不相同。
第三节 多个样本比较秩和检验 (Kruskal-Wallis法)
多样本比较当资料不满足参数检验的 条件时,可以采用秩和检验的分析方 法。
例4 某医院用中医、西医和中西医结 合三种疗法治疗某病,病人所需治愈 天数。问三种疗法所需治愈天数有无 差异?
人数

正常人 病人 数
累计 频数
秩次
平均 秩次
秩和 T1
(2)
(3)
(5) 范围 (7) (8)=(2)
(4)
(6)
(7)
11
5
16
16
1~16
8.5
93.5
10
18
28
44 17~44 30.0
305.0
3
16
19
63 45~63 54.5
162.0
0
5
5
68 64~68 66.0
0
24
44
68



T1=560.
5
秩和 T2
(9)=(3) (7)
42.5 549.0 864.0 330.0 T2=1785
.5
检验的基本原理同例2,由于相同秩
次的个数过多,需对z值进行校正。
SPSS操作同例2。
SPSS操作
dataweight case weight case by : freq
OK Analyze NonparametricTest
Test pairs list : old-new Test Type :选择Wilcoxon OK

统计学:非参数检验

统计学:非参数检验

例10-1 某研究者欲研究保健食品对小鼠抗 疲劳作用,将同种属的小鼠按性别和年龄相 同、体重相近配成对子,共10对,并将每对 中的两只小鼠随机分到保健食品两个不同的 剂量组,过一定时期将小鼠杀死,测得其肝 糖原含量(mg/100g),结果见表10-1, 问 不同剂量组的小鼠肝糖原含量是否不同?
5
表10-1 不同剂量组小鼠肝糖原含量(mg/100g) 小鼠对号 中剂量组 高剂量组 差值 d (1) (2) (3) (4)=(3)-(2) 1 620.16 958.47 338.31 2 866.50 838.42 -28.08 3 641.22 788.90 147.68 4 812.91 815.20 2.29 5 738.96 783.17 44.21 6 899.38 910.92 11.54 7 760.78 758.49 -2.29 8 694.95 870.80 175.85 9 749.92 862.26 112.34 10 793.94 805.48 11.54
15
表 10-3 某河流甲乙断面亚硝酸盐氮含量(mg/L)监测
河流甲断面 亚硝酸盐氮 秩次 含量 0.014 1.0 0.018 2.5 0.024 8.5 0.025 10.5 0.027 12.0 0.034 15.0 0.038 19.0 0.043 20.0 0.064 22.5 0.100 25.0 n1=10 T1=136 亚硝酸盐氮 含量 0.018 0.019 0.020 0.022 0.023 0.024 0.025 0.028 0.030 0.035 河流乙断面 秩次 亚硝酸盐氮 含量 2.5 0.036 4.0 0.037 5.0 0.055 6.0 0.064 7.0 0.067 8.5 10.5 13.0 14.0 16.0 n2=15 秩次 17.0 18.0 21.0 22.5 24.0

非参数检验

非参数检验

➢ 编秩:数据相等则取平均秩,
➢ 求秩和
➢ 计算检验统计量H值
H 12 N(N 1)
Ri2 3( N 1) ni
出生体重(kg)xij ABCD
相应秩次 Rij A BCD
2.7 2.9 3.3 3.5
3
4
7 11
2.4 3.2 3.6 3.6
2 5.5 12.5 12.5
2.2 3.2 3.4 3.7
χ 2 12
R
2 i
3(N1)
N(N1) ni
χ2
12 14(14 1)
152
4
152 3
37.52 4
37.52 3
3(14
1)
χ 2 9.375
χ
2 c
1
χ2
(t
3 j
t
j
)
n3 n
1
(23
9.375 2) (33 3) (23
143 14
2)
9.50
四、随机区组设计资料的秩和检验 (Friedman test)
正态近似法
如果n1或n2-n1超出附表的范围,可按下式 计算u值:
u | T n1(N 1) / 2 | 0.5 n1n2 (N 1) / 12
在相同秩次较多时,应用下式进行校正:
uC u / C
C 1
(t
3 j
t
j
)
/(N
3
N)
tj为第j组相同秩次的个数
频数表资料(或等级资料)两样本资料比较
xi (2) 86 71 77 68 91 72 77 91 70 71 88 87
12 对双胞胎兄弟心理测试结果
后出生者得分 差 值
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.计算差值、确定符号及其个数
统计样本观察值与已知总体中位数的差 值的符号
n= n++ n检验的统计量K 为n+、n-中的较小者。
3.统计推断(同配对资料的符号检验)
注意:
样本的配对数少于6对时,不能检验出差别,
在7-20对时也不敏感,在20对以上则比较有用。
【例11.2】已知某品种成年公黄牛胸围平均数为140
某试验用大白鼠研究饲料维生素E缺
乏与肝脏中维生素A含量的关系,先将大白鼠按性
别、月龄、体重等配为10对,再把每对中的两只
大白鼠随机分配到正常饲料组和维生素E缺乏饲料
组,试验结束后测定大白鼠肝中维生素A的含量如
表11-4。试检验两组大白鼠肝中维生素A的含量是
否有显著差异。
表11-3 不同饲料鼠肝维生素A含量资料
二、非配对试验资料的秩和检验 (Wilcoxon非配对法) 1.建立假设
HO:甲样本所在的总体的中位数=乙样本所 在的总体的中位数; HA:甲样本所在的总体的中位数≠乙样本所 在的总体的中位数。
2、求两个样本合并数据的秩次
将两样本合并后的数据按从小到大的顺 序排列,与每个数据对应的序号即为该数据 的秩次,最小数值的秩次为“1”,最大数值 的秩次为“n1+n2”。
n= n++ n检验的统计量为K 为n+、n-中的较小者
3、统计推断
由n查附表9(P310)得临界值K0.05(n),
K0.01(n),作统计推断:
如果K>K0.05(n) ,P>0.05,则不能否定
HO,两个试验处理差异不显著; 如果K0.01(n) <K≤K0.05(n) ,0.01< P≤0.05,则否定HO,接受HA,两个试验处理 差异组 1
3550
2
3
4
5
6
7
8
9
10
2000 3100 3000 3950 3800 3620 3750 3450 3050
维生素E 2450 2400 3100 1800 3200 3250 3620 2700 2700 1750 缺乏组 差值di 秩次
1100 -400 0 1200 750 550 0 1050 750 1300
+6
-1
+7
+3.5
+2
+5
+3.5
+8
1.提出无效假设与备择假设
HO:差值d总体的中位数=0;
HA:差值d总体的中位数≠0。
2.编秩次、定符号 计算表11-3中配对数据差值di,将d =0的舍去, 共有差值n=8 个。按绝对值从小到大排列秩次并标上 相应的符号,差值绝对值为750的有两个,它们的秩 次为3和4,所以其平均秩次为(3+4)/2=3.5,结果 见表11-3。
3、求H值
H
n(n 1)
12
2 Ri
3(n 1)
ni
式中,Ri为第i个样本的秩次之和;
ni为第i个样本的含量;n=∑ni
4、统计推断
根 据 n, ni 查 附 表 10 ( 3 ) , 得 临 界 值 :
H0.05,H0.01。
若H<H0.05,P>0.05,不能否定HO,可以认
厘米,今在某地随机抽取10头该品种成年公黄牛,
测得一组胸围数字:128.1, 144.4 ,
150.3 ,
146.2, 140.6, 139.7, 134.1, 124.3, 147.9,
143.0(cm)。 问该地成年公黄牛胸围与该品种胸
围平均数是否有显著差异?
表11-2 成年公黄牛胸围测定值符号检验表
3.确定统计量T
此例,正号有7个,其秩次为2,3.5,3.5,5,
6,7,8,秩次和为:2+3.5+3.5+5+6+7=35;负
号只有1个,其秩次为1,秩次和等于1。负号秩
次和较小,所以T=1。
4.统计推断 由n=8查附表10(1)得, T0.05(8)=3,T0.01(n)=0, 因为T0.01(8) <T<T0.05(8) ,0.01<P<0.05,否 定HO,接受HA,表明两个试验处理差异显著。
第十一章
非参数检验
非参数检验是一种与总体分布状况无关的 检验方法,它主要是利用样本数据之间的大小 比较及大小顺序,对样本及其所属总体作差别 检验,而不对总体分布的参数如平均数、标准 差等进行估计推断。
优点
计算简便、直观, 易于掌握,检验速度较快
缺点
降低了检验的准确性, 效率一般要低于参数检验方法
HO :噪声刺激前后猪的心率差值d总体
中位数 =0;
HA :噪声刺激前后猪的心率差值d总体
中位数≠0。
2.计算差值并赋予符号 噪声刺激前后的差值符号列于表11-1第 4 行 和 第 5 行 , 从 而 得 n+=2 , n-=13 , n=2+13=15,K=min{ n+,n-}= n+=2 。
本章主要内容
第一节 第二节 第三节 符号检验 (sign test) 秩和检验 (rank-sum test) 等级相关分析(rank correlation analysis)
第一节
符号检验
一、配对资料的符号检验 二、样本中位数与总体中位数比较的 符号检验
一、配对资料的符号检验
配对资料符号检验是根据样本各对数据
方法:
① 将观察值按由小到大的次序排列, ② 编定秩次, ③ 求出秩和进行假设检验。
本节主要内容
一、配对试验资料的符号秩和检验
二、非配对试验资料的秩和检验 三、多个样本比较的秩和检验 四、多个样本两两比较的秩和检验
一、配对试验资料的符号秩和检验
(Wilcoxon配对法)
1.建立假设 HO:差值d总体的中位数=0; HA:差值d总体的中位数≠0。
如果T>T0.05(n) ,P>0.05,则不能否定HO,表
明两个试验处理差异不显著;
如果T0.01(n) <T≤T0.05(n) ,0.01<P≤0.05,则
否定HO,接受HA,表明两个试验处理差异显著;
如果T≤T0.01(n),P≤0.01,则否定HO,接受HA,
表明两个试验处理差异极显著。
【例11.3】
低能量 秩 次
45 56 58 46 512 512 591 531 7 7 5 7 1 4 7 5 8.5 10 6 2
1.提出无效假设与备择假设
HO:高能量饲料增重总体的中位数=低能
量饲料增重总体的中位数;
HA:高能量饲料增重总体的中位数≠低
能量饲料增重总体的中位数。
2、编秩次
将两组数据混合从小到大排列为秩次。
牛号
1
2
144. 4 4.4 +
3
4
5
6
7
8
124. 3 -15.7 -
9
147. 9 7.9 +
10
143 3 +
胸围 128.1 差值 符号 -11.9 -
150. 140. 146.2 139.7 134.1 3 6 6.3 + 6.2 + 0.6 + -0.3 -5.9 -
1.提出无效假设与备择假设
3.统计推断
当n=15时,查附表9得临界值K0.05(15)=3 ,
K0.01(15) = 2 ,因为 K = 2 = K0.01(15),P≤0.01,
表明噪声刺激对猪的心率影响极显著。
二、样本中位数与总体中位数比较的符号检验
1.建立假设
HO:样本所在的总体中位数=已知总体中位数; HA :样本所在的总体中位数≠已知总体中位数 。(若将备择假设HA中的“≠”改为“<”或“> ”,则进行一尾检验)
两种不同能量水平的饲料对肉仔鸡增重的影响有无
差异?
表11-4 两种不同能量水平饲料的肉仔鸡增重及秩和检验
饲 料 60 3 肉仔鸡增重(g) 58 62 65 598 617 5 0 0 11 14 13 15 n1=6 T1=73.5 n2=9 T2=46.5
高能量 秩 次
12 8.5 48 9 3
当分布对称时,中位数与平均数相等。
配对资料的符号检验的步骤
1.建立假设 无效假设HO:两处理差值d总体中位数=0 备择假设HA:两处理差值d总体中位数≠0 或d总体中位数<0 (一尾检验) 或d总体中位数>0 (一尾检验)
2.计算差值并赋予符号
d>0者记为“+”,总个数记为n+ d<0者记为“-”,总个数记为nd=0记为“0”,总个数记为n0
2、秩次和符号

② ③
求配对数据的差值d;
按d绝对值从小到大编秩次; 根据原差值正负在各秩次前标上正负号
3.统计量T ① ② 分别计算正秩次及负秩次的和, 以绝对值较小的秩和绝对值为检验的 统计量T。
4、统计推断 根据n(正、负差值的总个数为n )查附表10(1) 符号秩和检验用T 临界值表,得T0.05(n),T0.01(n)。
定HO,
若 T 在T’0.05—T0.05 之外但在T’0.01—T0.01 之内,
0.01<P≤0.05,则否定HO,接受HA;
若T在T’0.01—T0.01之外,P<0.01,则否定HO,
接受HA。
【例11.4】
研究两种不同能量水平饲料对5-6周龄
肉仔鸡增重(克)的影响,资料如表11-4所示。问
在低能量组有两个“512”,不求平均秩次,其
秩次分别为4和5;在高、低两组有一对数据为
“585”,需求它们的平均秩次:(8+9)/2=8.5。
结果见表11-4。
3.确定统计量T
相关文档
最新文档