4.8 完全区组设计:Page 检验
完全区组试验设计及分析

第二章完全区组试验设计及分析第一节对比法和间比法试验设计及分析第二节完全随机设计及分析第三节随机区组设计及分析第四节拉丁方设计及分析(复习)第一节对比法和间比法试验设计及分析1CK23CK45CK67CK81.对比法试验设计7CK81CK23CK45CK65CK67CK81CK23CK48个处理3次重复对比排列(阶梯式)2.对比法试验结果的统计分析步骤•T t= 各处理在各重复中的小区产量相加•=各重复中的小区平均产量x t 各重复中的小区平均产量•相对生产力%=某处理总产量邻近CK总产量×100某处理平均产量邻近CK平均产量或×100实例有A、B、C、D、E、F6个玉米品种的比较试验,设标准品种CK,采用3次重复的对比试验设计。
试验结果如下(小区计产面积40 cm2),作分析。
119.398.3100.036.535.736.3平均109.5107.2109.0总和34.537.038.0B34.036.836.4A35.536.537.0CKⅢⅡⅠ各重复小区产量(kg)品种名称玉米品比试验(对比法)的产量结果分析相对生产力107.2109.0×100100.090.485.3100.0106.7111.7100.032.729.525.930.432.434.230.698.088.677.891.297.3102.591.830.532.335.0CK28.329.730.6F23.625.828.4E27.732.930.6CK30.132.035.2D31.035.036.5C29.530.831.5CK3.间比试验设计CK1234CK5678CKCK9101112CK1234CKCK5678CK9101112CK 4.间比法试验结果的统计分析步骤计算各品系的相对生产力某处理在各重复中的小区产量总和、平均数某处理平均产量前后CK平均产量×100相对生产力=计算前后两个对照产量的平均数CK实例有12个小麦新品系鉴定试验,另加一推广品种CK,采用5次重复间比法设计,田间排广品种,采用次重复间比法设计,田间排列在下表第一列基础上按阶梯更替,小区计产面积70m2,每隔4个品系设一个CK,其结果如下,作分析。
4.5 完全区组设计:Friedman 秩和检验

例 某田径队对新入队的学员要进行四个部分的技术训练, 以提高学员的身体素质。为检验这四个部分的技术训练是否确实 有效,随机抽选了14 名新学员,分别接受四个部分的训练。 每个训练结束后,均进行该部分的测试,成绩以 10 分为最高。 检测结果如下表所示:
Z10.0167 Z0.09833 2.13
SE 4 4 5 4 12 3.266. 6 63
比较式 A vs B A vs C A vs D B vs C B vs D C vs D
Ri-Rj的绝对值 15-8=7 15-11.5=3.5 15-5.5=9.5 8-11.5=3.5 8-5.5=2.5 11.5-5.5=6
6(k 1)
这是大样本时基于 Friedman 秩和检验的一个方法.
如果零假设 H 0 为 i 处理和 j 处理没有区别, 那么,双边检验的统计量为 Ri R j .
对于置信水平 ,如果 Ri R j Z * 2 bk (k 1) / 6, 则拒绝零假设,这里
*
总共可比较的对数
4.5 Friedman 检验
Friedman 检验又称弗利德曼 2 检验或弗利德曼 两因素秩方差分析. 它是由 Friedman 于 1937 年提出的,后来又被 Kendall 和 Smith 发展到多元度量的协同系数相关问题上.
它是针对完全区组设计而提出的检验方法.
Friedman 检验的问题是 k 个样本的位置参数 (用1 , 2 , , k 表示)是否相等.
技术训练A
4 1 2 3 1 2 3 3 4 3 3 1 1 2 33
技术训练B
完全随机试验设计方法

任一方向(左、右、上、下)连续抄下18个(两 不同畜舍、不同池塘等划分为单位组。
/kn- C =(942+812+1022)/12-2131. 各组头数不等,应将甲组多余的2头调整1头给乙组 、 1头给丙组。
处理组合:12个 重复:3 区组条件:试验场 用完全随机的方法将试验动物分为四组、五组或更多的组,方法相同。 LSRσ=SSRσ(k,dfe) ×√MSe/r √MSe/r= √0. 处理数以不超过20为宜 各组头数不等,应将甲组多余的2头调整1头给乙组 、 1头给丙组。 00b 2.
首先从随机数字表中任意一个随机数字开始 ,向 仍用随机的方法进行调整。
0 14 21 3
3
6 55 1
1 15 76 4
4
7
6
0
0 16 33 3
3
8 88 4
4 17 50 2
2
9 77 5
5 18 25 1
1
组别 编号
Ⅰ3
组别 编号
6 13 18 95 Ⅰ 3
6 18
Ⅱ 11 17
3 Ⅱ 11 13 17
Ⅲ 4 14 16
Ⅲ 4 14 16
Ⅳ 8 10 15
Ⅳ 8 10 15
【例】不同中草药饲料添加剂对猪增重的效果
添加剂
区组(母猪) Ⅰ Ⅱ ⅢⅣ
A
4
6
14 20
B
3
10 12 17
C
5
7
13 19
D
2
8
15 16
E
1
试验设计:区组设计

平衡不完全区组设计, Balanced incomplete block design, BIB设计
(3)b v, r k.
处理数超过区组数的 BIB设计是不存在的。
附表9(P401)对 4 v 10, r 10 给出了一些BIB设计表。 附表使用方法见书本P90 例3.2.1,例3.2.2
j 1 b
,v
它们之间的差异受到区组间差异的影响,故按 传统的公式计算处理平方和已经不再适合,下 面用最小二乘法来获得SA ,为此先计算误差平 方和Se。
误差平方和Se可从最小二乘的剩余平方和获得:
Se min nij ( yij i j ) 2
i 1 j 1 v b
方差分析
一、区组是试验设计的基本原则之一。
几点注释
错误结 论是因 为没有 重视区 组设计 而造成 的!
二、把区组看成另一个因子,有争议。
三、随机效应问题
• 在实际中,处理效应和区组效应可能是随机的: 1)仅仅处理效应是随机的; 2)仅仅区组效应是随机的; 3)处理效应和区组效应都是随机的 这一类问题的处理将放在下一章“两因子试 验的统计模型”详细叙述。
统计模型及其参数估计
平衡不完全区组设计只适用于处理和区组 间无交互作用的试验问题。其统计模型是:
平衡不完全区组设计和随机化完全区 组设计模型相同,差别仅在于BIB设计中 不是每个区组都包含所有处理。
考虑到BIB设计是“不完全的”,不是 对所有(i,j)做试验,关联矩阵N会起到区分 作用。 下面先求处理效应i的最小二乘估计。
假如每个区组都包含着每个处理(区组大小正好等于处 理个数a),成为随机化完全区组设计。
若区组大小小于处理个数a,这样的设计被称为随机化 不完全区组设计。
4.9 不完全区组设计:Durbin 检验

1. 建立检验问题
Durbin 检验的假设如下: H 0 : 1 2 k . H1 : 不是所有的位置参数都相等.
这里 d1 k 1, d 2 bt b k 1. 最近的一些研究表明,DF 比 Da 更精确.
例 4.3 比较四种材料(k 4)在四个部位(b 4)的磨损.
区组
I
处理
II 28 30
III 36
IV
A B
34 36
45
C
D
40
44
48
54
60
59
解:建立假设检验 H 0 : 1 2 3 4 . H1 : 不是所有的位置参数都相等.
2
性水平临界值 F 6, 8 3.58. 相同.
D 小于其 5% 显著性水平临界值 12.59,DF 大于其 5% 显著
小样本下后者更准确,所以几种冰淇淋受欢迎程度不完全
两处理间的多重比较: 自由度为 bt b k 1 8 的 t1 / 2 2.306. 所以 rt (t 1) t1 / 2 (n(t 1) Da ) 6(nt n k 1)
r t 1 1 k 1 k b 秩总平均为 Ri Rij . k i 1 k i 1 j 1 2
k 个处理的秩和在 H 0 下是非常接近的,
当某处理效应大时,则反映在秩上,其秩和与总平均之间 的差异也较大,于是可以构造
Durbin 检验统计量为 12( k 1) k r (t 1) D Ri 2 rk (t 1) i 1 2
箱线图是利用数据中的五个统计量

1.箱线图是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与
最大来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息。
下四分位数 (QL)等于该样本中所有数值由小到大排列后第25%的数字。
中位数等于该样本中所有数值由小到大排列后第50%的数字。
上四分位数 (QV)等于该样本中所有数值由小到大排列后第75%的数字。
极小值等于该样本中所有数值由小到大排列后最小的数字。
极大值等于该样本中所有数值由小到大排列后最大的数字。
2.Kruskal-Wallis秩和检验,正态记分检验,Jonckheere-Terspstra检验。
完全区组设
计(Friedman秩和检验,关于二元响应的Cochran检验,Page检验,Kendall协同系数检验)。
不完全区组设计(Durbin检验)
3. 1.假设组(x,y)①H0:X与Y不相关—H1:X与Y相关②H0:X与Y不相关—H1:X与
Y正相关③H0:X与Y不相关—H1:X与Y负相关。
2.检验统计量:Ri-Xi在X中的秩,Si-Yi在Y中的秩。
(公式) Rs(1完全正相关,-1完全负相关,0不相关,越接近1相关程度越高,越接近0相关程度越低)。
3.判断:双侧:2p<α拒绝,单侧:p<α拒绝。
随机完全区组设计

随机完全区组设计的设计特点是每个区组的受试对象数与处理组数相等,区组内的受试对象生物学特性较均 衡,可减少实验误差,提高统计假设检验的效率,是对完全随机设计的改进,但分组较繁。其数据统计分析方法 常用随机完全区组设计方差分析或Friedman秩和检验,可分析出处理组与配伍组2因素的影响。
概念
具体做法 配组原响实验结果的属性配组(非随机),如按动物的性别、体重配组,按病 人的年龄、职业、病情配组等。
配组的原则是属性相同或相近的分在同一区组内,共形成若干个区组,再分别将各区组内的受试对象随机分 配到各处理组中。
1)把试验单位分成a个处理和b个区组,每个处理在一个区组内仅出现一次;
如从随机数字表中第6行第9列起向下读取4个随机数为39、74、00、99,排列后的序号(R)为2、3、1、4, 如规定组别A、B、C、D对应的序号(R)为1、2、3、4,则第一个区组4头动物的组别顺序为B、C、A、D。其余3个 区组的随机分组方法类推,本例各区组分组结果见表1。
如果该动物实验又分甲、乙、丙、丁4种不同的处理方法,哪种方法用哪组动物呢?仍可用随机数字表进行分 配。对应甲、乙、丙、丁分别抄录4个随机数字,将4个随机数字按大小顺序排序号(R),再按序号规定甲、乙、 丙、丁分别对应的组别。
随机区组设计在临床观察和实验研究中是最常用的一种设计。多组实验中凡能做到划分区组的都应尽量采取 随机区组设计方法。
实例分析
例1
例2
将16头动物随机分为4组。
先将16头动物称重后,按体重由小到大依次编号为1,2,…,16,再把体重相近的每4头动物配成一个区组, 共形成4个区组。
从随机数字表中任意一行一列作起点顺序取4个两位随机数字,对应于第一个区组的4头动物,然后将随机数 字在同一区组内由小到大顺序排列得序号(R),再按序号大小规定组别。
4.1-Kruskal-Wallis-秩和检验(共42张)

xij ai ij , i 1, 2, , k,j 1, 2, , ni
其中 xij 表示第 i 个处理的第 j 个重复观测值,ni 表示第 i 个处理的 观测样本量.
第10页,共42页。
假设有 k 个总体 F x i ,i 1, 2, , k,即 k 个处理(水平),
k
• 样本独立地分别从各自的总体中抽取,并记 N ni . i 1
• 数据的测量层次至少在定序尺度上.
第14页,共42页。
完全随机设计数据形态
总体 1
总体 2
重
x11
x21
复
x12
x22
测
量
x1n1
x2 n2
其中 xij 表示第 i 个处理的第 j 个观测值.
总体 k xk1 xk 2
xknk
记第 i 个样本的第 j 个观测值 xij 的秩为 Rij .
ni
对每一个样本的观测值的秩求和,得到 Ri Rij , i 1, , k.
j 1
再找到它们在每组中的平均值
Ri
Ri ni
.
所有数据混合后的秩和为 R 1 2 ... N N (N 1) 2,
秩平均为 R (N 1) 2.
H1 : Fi (x) F (x i ) i 1, 2,..., k
( k 个总体位置不同)
这里 F 是某连续分布函数,而且这些位置参数 i 并不全部相同.
第16页,共42页。
这个问题也可以写成线性模型的形式. 假定有 k 个样本(总体),各样本(总体)的样本量为 ni ,i 1, 2, , k. 那么,观测值可以写成下面的线性模型:
xij i ij , i 1, 2, , k,j 1, 2, , ni
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
IV 65 53 35
A B C
试判断对于显著性水平 0.05, 不同汽车密度的城市居民的血铅含量是否一样.
解:建立假设检验 H 0 : 1 2 3 H 1 : 1 2 3 .
为了符号简单起见,把第一个城市 A 和第三个城市 C 对调. 于是检验成为 H 0 : 1 2 3 H 1 : 1 2 3 .
Page 检验统计量的大样本近似
当 k 固定, b 时,在零假设下有正态近似: L E ( L) ZL N (0,1) D( L)
有结数据情形
在区组内有打结的情况下,D L 作如下修正: D( L) k (k 2 1)
3 bk (k 2 1) ij ij i j
此时 Page 检验统计量的大样本近似:
当 k 固定, b 时,在零假设下有正态近似: ZL L E ( L) N (0,1) D( L)
4.8 完全区组设计:Page检验
• 对于完全区组设计数据,也可以进行趋势性检验, 进行类似于 Jonckheere Terpstra 检验的 Page 检验.
1. 建立假设检验
H0 : 1 2 k . H1 : 1 2 k .
2. 选择检验统计量
• 与 Friedman 检验统计量一样, 首先 在每个区组中,对各处理排序; 然后 对每个处理把观测值在各区组中的秩累加, 得到 Ri , i 1, 2, , k; 最后构造统计量:
L 如果备择假设 H1 正确,可以放大备择假设 H1 的效果.
注:在总体分布为连续的条件下,如果没有打结, 则该检验是和总体分布无关的.
Page 检验统计量的性质
bk (k 1)2 b(k 3 k )2 E ( L) ;D( L) . 4 144(k 1)
例 4.2 在不同的城市对不同的人群进行血液中铅含量的测试, 一共有 A, B, C 三个城市,代表着三种不同的处理 (k 3). 对试验者按职业分成四组 (b 4) 取血. 他们血铅含量如下表所示:
区组(职业) 处理(城市)
I 80 52 40
II 100 76 52
III 51 52 34
L E ( L) 55 48 7 2 故 ZL 2.4749. 4 D ( L) 2 2 计算 p 值为 0.0067. 故在 5%的显著性水平下,拒绝零假设.
或者由于 u10.05 1.65 Z L,故拒绝零假设,存在上升趋势.
Page 检验还可以很容易地推广到每一个 i, j 位置有任意多 的观测值 nij 的情况. 并且简单地对每一个区组对观测值排序. 这里所必需的假设是:不存在区组和处理的交互作用.
在表中加上各处理在每个区组(职业) 中的秩,得
区组(职业) 处理(城市)
I
40(1) 52(2) 80(3)
II
52(1) 76(2) 100(3)
III
34(1) 52(3) 51(2)
IV
35(31) 53(2) 65(3)
Ri
4 9 11
C B A
可以得到 R1 4, R2 9, R3 11,而且 L 4 2 9 3 11 55.
查表得,对于 k 3, b 4,P L 55 0.00694. 即精确检验 p 值为 0.00694.
对于水平 0.05,可以拒绝零假设. 也就是说,不同汽车密度的城市居民的血铅含量的确不一样.
方法二:应用正态分布近似 nk (k 1) 2 4 3 42 由于 E ( L) 48, 4 4 n(k 3 k ) 2 4 (33 3) 2 242 D ( L) 8. 144(k 1) 144 2 72
144(k 1)
.
这里 ij 为第 j 个处理中及第 i 个结中的观测值个数(结统计量). i 1, 2, , e k.
3. 作出决策
对于一部分 k, b 和 的值,可以由查表来得到在零假设下 的临界值 c, 满足 P L c .
可利用正态分布近似计算 p 值.
对于所有 i, j 位置的观测值都相等 nij n , 大样本时的近似正态统计量的 E ( L) 和 D( L) 为 nbk (k 1)(nk 1) E ( L) ; 4 3 nbk (n 2 k 2 1) ij ij i j D( L) nk (k 2 1) . 144(k 1)