第八章 常用试验设计及其统计分析1
合集下载
8第八章_回归正交试验设计

据处理
16
7.1.3 回归分析对数据的处理由被动变主动 古典的回归分析方法只是被动地处理已有的试验数据,对 试验的安排不提任何要求,对如何提高回归方程的精度研究 很少。 后果: (1)盲目增加试验次数,而这些试验结果还不能提供充分 的信息,以致在许多多因子试验问题中达不到试验目的。 (2)对模型的合适性有时无法检验,因为在被动处理数据 时在同一试验点上不一定存在重复试验数据。 为了适应寻求最佳工艺、最佳配方、建立生产过程的数学 模型等的需要,人们就要求以较少的试验次数建立精度较高 的回归方程。
ˆ b0 b1 x1 bp x p y 今后称 A X X 为正规方程组的系数矩阵, B X Y 为正规 1 方程组的常数项向量,C X X 为相关矩阵。 在模型(7.1.5)下,有
b ~ N ( , 2 ( X X ) 1 )
2015-1-9 试验设计与数据处理 9
( xi1 , xi 2 ,, xip , yi ), i 1,2,, n
假定回归模型为:
yi 0 1 xi1 p xip i,i 1,2,, n 2 各 iid ~ N ( 0 , ) i (7.1.5)
2015-1-9
试验设计与数据处理
i 1 i 1 i 1
ˆi )2 ( y ˆ i y) 2 S E S R ST ( yi y ) 2 ( yi y
其中
ˆi )2 S E ( yi y
ˆ i y) 2 S R ( y
i
为残差平方和,自由度为 为回归平方和,自由度为
2015-1-9 试验设计与数据处理 15
当H0j为真时,有 Fj ~ F (1, f E ) 。 给定的显著性水平 ,当 Fj F1 (1, f E ) 时拒绝假设H0j,即认 为 j 显著不为零,否则可以将对应的变量从回归方程中删除。 注:当有不显著的系数时,一般情况下一次只能删除一个F 值最小的变量,重新计算回归系数,再重新检验。通常要到余 下的系数都显著时为止。
16
7.1.3 回归分析对数据的处理由被动变主动 古典的回归分析方法只是被动地处理已有的试验数据,对 试验的安排不提任何要求,对如何提高回归方程的精度研究 很少。 后果: (1)盲目增加试验次数,而这些试验结果还不能提供充分 的信息,以致在许多多因子试验问题中达不到试验目的。 (2)对模型的合适性有时无法检验,因为在被动处理数据 时在同一试验点上不一定存在重复试验数据。 为了适应寻求最佳工艺、最佳配方、建立生产过程的数学 模型等的需要,人们就要求以较少的试验次数建立精度较高 的回归方程。
ˆ b0 b1 x1 bp x p y 今后称 A X X 为正规方程组的系数矩阵, B X Y 为正规 1 方程组的常数项向量,C X X 为相关矩阵。 在模型(7.1.5)下,有
b ~ N ( , 2 ( X X ) 1 )
2015-1-9 试验设计与数据处理 9
( xi1 , xi 2 ,, xip , yi ), i 1,2,, n
假定回归模型为:
yi 0 1 xi1 p xip i,i 1,2,, n 2 各 iid ~ N ( 0 , ) i (7.1.5)
2015-1-9
试验设计与数据处理
i 1 i 1 i 1
ˆi )2 ( y ˆ i y) 2 S E S R ST ( yi y ) 2 ( yi y
其中
ˆi )2 S E ( yi y
ˆ i y) 2 S R ( y
i
为残差平方和,自由度为 为回归平方和,自由度为
2015-1-9 试验设计与数据处理 15
当H0j为真时,有 Fj ~ F (1, f E ) 。 给定的显著性水平 ,当 Fj F1 (1, f E ) 时拒绝假设H0j,即认 为 j 显著不为零,否则可以将对应的变量从回归方程中删除。 注:当有不显著的系数时,一般情况下一次只能删除一个F 值最小的变量,重新计算回归系数,再重新检验。通常要到余 下的系数都显著时为止。
生物统计学 第十章 常用试验设计及其统计分析

试验误差是衡量试验精确度的依据,误差小表示精确度 高,误差差,则比较的可靠性较差,而要使处理间的差 异达到指定的显著水平就很困难。
四、试验误差及其控制途径
可以避免
系统误差(片面误差):由于试验处理以
试
外的其他条件明显不一致所产生的带有倾 向性的或定向性的偏差。
验
误 随机误差(偶然误差):由于试验中许多
➢设有8个处理,我们得到随机数字,去掉0和9及 重复数字,连续取得8个随机数字,即为一个区 组内的排列。
9, 3, 9, 4, 4, 6, 0, 2, 8, 4, 6, 5, 9, 8, 4, 4, 1, 4, 9, 2, 2, 4, 8, 7 9, 3, 9, 4, 4, 6, 0, 2, 8, 4, 6, 5, 9, 8, 4, 4, 1, 4, 9, 2, 2, 4, 8, 7
应用拉丁方进行试验设计,就是在行、列两个 方向上都进行局部控制,使行、列两向皆成完 全区组或重复。 相等
处理数
重复数
行数
列数
第四节:拉丁方设计(latin square design)
当行、列间皆有明显差异时,在控制 试验误差,提高试验精度方面,应用 拉丁方试验将比随机区组试验更有效。
随机区组设计
如果设计不合理,不仅达不到试验的目的,甚至导 致整个试验的失败。
➢能否合理地进行试验设计,关系到科研工作的成 败。
(四)意义
1 节省人力、物力、财力和时间
2
减少试验误差,提高试验的精确度, 取得真实的试验资料,为统计分析
得出正确的判断和结构打下基础。
二 生物学试验的基本要求
试验目的明确 试验条件要有代表性 试验结果可靠 试验结果可重演
平均值±标准差(误)
四、试验误差及其控制途径
可以避免
系统误差(片面误差):由于试验处理以
试
外的其他条件明显不一致所产生的带有倾 向性的或定向性的偏差。
验
误 随机误差(偶然误差):由于试验中许多
➢设有8个处理,我们得到随机数字,去掉0和9及 重复数字,连续取得8个随机数字,即为一个区 组内的排列。
9, 3, 9, 4, 4, 6, 0, 2, 8, 4, 6, 5, 9, 8, 4, 4, 1, 4, 9, 2, 2, 4, 8, 7 9, 3, 9, 4, 4, 6, 0, 2, 8, 4, 6, 5, 9, 8, 4, 4, 1, 4, 9, 2, 2, 4, 8, 7
应用拉丁方进行试验设计,就是在行、列两个 方向上都进行局部控制,使行、列两向皆成完 全区组或重复。 相等
处理数
重复数
行数
列数
第四节:拉丁方设计(latin square design)
当行、列间皆有明显差异时,在控制 试验误差,提高试验精度方面,应用 拉丁方试验将比随机区组试验更有效。
随机区组设计
如果设计不合理,不仅达不到试验的目的,甚至导 致整个试验的失败。
➢能否合理地进行试验设计,关系到科研工作的成 败。
(四)意义
1 节省人力、物力、财力和时间
2
减少试验误差,提高试验的精确度, 取得真实的试验资料,为统计分析
得出正确的判断和结构打下基础。
二 生物学试验的基本要求
试验目的明确 试验条件要有代表性 试验结果可靠 试验结果可重演
平均值±标准差(误)
常用试验设计及其统计分析(含共48页

26、要使整个人生都过得舒适、愉快,这是不可能的,因为人类必须具备一种能应付逆境的态度。——卢梭
▪
27、只有把抱怨环境的心情,化为上进的力量,才是成功的保证。——罗曼·罗兰
▪
28、知之者不如好之者,好之者不如乐之者。——孔子
▪
29、勇猛、大胆和坚定的决心能够抵得上武器的精良。——达·芬奇
▪
30、意志是一个强壮的盲人,倚靠在明眼的跛子肩上。——叔本华
谢谢!48Fra bibliotek常用试验设计及其统计分析(含
46、法律有权打破平静。——马·格林 47、在一千磅法律里,没有一盎司仁 爱。— —英国
48、法律一多,公正就少。——托·富 勒 49、犯罪总是以惩罚相补偿;只有处 罚才能 使犯罪 得到偿 还。— —达雷 尔
50、弱者比强者更能得到法律的保护 。—— 威·厄尔
▪
第八章正交实验设计

1 2 3 其中D下标与C下标正交: 3 1 2 2 3 1 这里,A、B、C、D四个因素两两之间搭配均匀,即任两个 因素的各个水平之间相互各碰一次,既无重复,也无遗漏。
18
列安排因素及交互作用等
将上面9次试验,安排在下表,即是一个正交表:
因素 试验号 1 2 3 4 5 6 8 7 9
1
目的要求: (一)了解试验设计的基本概念及原则。 (二)掌握正交表的特点及正交试验的一 般步骤。熟悉常见的正交表
(三)掌握正交试验的直观分析法,了解 有交互作用的试验分析及方差分析法。
2
第一节 试验设计概论
用统计方法处理问题常有三个环节:资料收集、资料 整理和资料分析。其实还有一个重要环节,即统计设计。 统计设计是根据统计研究的目的和研究对象的特点,对统计 工作的各个方面和环节通盘考虑和安排,设计出具体实施方 案的过程,是统计研究的起点,也是影响研究成功与否最关 键的一环。
设臵对照组,减少非试验因素的干扰。
(3)随机化(randomization)原则
等概率抽样,防止带倾向性的系统性误差。
(4)均衡(balance)原则
同质性原则,实验组和对照组条件一致。
试验设计方案很多,如配对设计,完全随机化设计、 均衡设计、正交设计等。
5
第二节 正交试验基本思想与步骤
正交试验的目的就是合理安排试验,做到既省时、省力、省 钱,又要有基本满意的试验效果。具体地,就是对多因素多水平 问题,找出因素的主次关系及最优搭配条件。 [例8.1】在中草药的有效成分提取中,为了摸清某生药用浸渍法 提取小檗硷的条件,根据经验拟考察四个因素,每个因素取三个 水平(如下表),试进行试验设计. 水平\因素 提取水的PH 浸渍时间(h) 盐析PH A 1 6 B 12 C 1 加食盐量(g) D 5
试验设计与数据处理教案-(李云雁)第8章--回归正交试验设计

第四页,共44页。
(2)因素(yīn sù)水平的编码
编码(coding):将因素(yīn sù)xj的各水平进行线性变换:
zj
xj xj0 j
➢ zj:因素(yīn sù)xj的编码 ,称为规范变量 ➢ xj:自然变量 ➢ 上水平xj2的编码 :zj2=1 ➢ 下水平xj1的编码:zj1=-1 ➢ 零水平xj0的编码:zj0=0
第十页,共44页。
1 n
a n i1 yi y
n
z ji y i
bj
i1
mc
j=1,2,…,m
n
(zk z j )i yi
bkj i1 m c
j>k, k=1,2,…,m-1
说明:
求得的回归系数直接反映了该因素作用的大小(dàxiǎo)
回归系数的符号反映了因素对试验指标影响的正负
4 1.210 1.414
1.525
1.607
5 1.267 1.471
1.575
1.664
6 1.320 1.525
1.623
1.719
7 1.369 1.575
1.668
1.771
8 1.414 1.623
1.711
1.820
9 1.457 1.668
1.752
1.868
10 1.498 1.711
0
1
0
0
8
0
-1
0
0
9
0
0
0
0
z22
z1’
z2’
1
1/3
1/3
1
1/3
1/3
1
1/3
1/3
1
1/3
(2)因素(yīn sù)水平的编码
编码(coding):将因素(yīn sù)xj的各水平进行线性变换:
zj
xj xj0 j
➢ zj:因素(yīn sù)xj的编码 ,称为规范变量 ➢ xj:自然变量 ➢ 上水平xj2的编码 :zj2=1 ➢ 下水平xj1的编码:zj1=-1 ➢ 零水平xj0的编码:zj0=0
第十页,共44页。
1 n
a n i1 yi y
n
z ji y i
bj
i1
mc
j=1,2,…,m
n
(zk z j )i yi
bkj i1 m c
j>k, k=1,2,…,m-1
说明:
求得的回归系数直接反映了该因素作用的大小(dàxiǎo)
回归系数的符号反映了因素对试验指标影响的正负
4 1.210 1.414
1.525
1.607
5 1.267 1.471
1.575
1.664
6 1.320 1.525
1.623
1.719
7 1.369 1.575
1.668
1.771
8 1.414 1.623
1.711
1.820
9 1.457 1.668
1.752
1.868
10 1.498 1.711
0
1
0
0
8
0
-1
0
0
9
0
0
0
0
z22
z1’
z2’
1
1/3
1/3
1
1/3
1/3
1
1/3
1/3
1
1/3
试验结果的统计分析PPT精品课件

依此类推。将算得结果列于表8-20
(四)结论 相对生产力超过对照10%以上的有2、7、8、9、10五个品系,
其中品系7增产幅度最大,达32.5%;超过对照5%以上的有3、4、 12三个品系,有必要作进一步试验观察。其余品系可予以淘汰。
Z2 随机排列设计试验结果的统计分析: 随机区组试验结果统计分析 1、试验设计特点: 在肥力梯度变化线上分组,区组内分小区,小区 数与处理数相等,合理利用局部控制的原则。区 组方向与肥力方向垂直;设计简单,易于掌握; 富有弹性,能提供误差分析条件,对试验地的地 形要求不严。 2、结果分析 要考虑局部控制,区组间的土壤存在明显的差异。 同一处理不同区组间的差异是误差引起 不同处理在同一区组的差异是误差+处理间效应 总变异=区组间变异+处理间变异+误差
本例对照区平均产量=71+79+77/9=25.22 2、计算对照品种667m2/产量 对照品种667m2产量=对照区平均产量 ×666.67/小区平方米 本例对照品种667m2产量=25.22×666.67/35
=480.38 3、计算各品种的矫正产量
各品种的矫正产量=品种对邻近CK产量的%× 对照品种667m2产量
第4段:“……生物的种,和变种一 样,是由以前别的种演变而来,而不 是分别创造出来的。”
第5段:“因此,我们对于生物变异 及相互适应的原因和方法,迫切地需 要有个明确的了解。”
第6段:“大量的、遗传的变异是可能的
第7段:“我深信生物的种不是不变 的;……我又确信自然选择作用,…… 也该是最重要的条件。”
指文章中十分重要的语句, 它 突出地体现了文章的旨趣,标 示文章的思路,显示文章结构 的特点。
进化论:亦称“天演论”、“演化
论”,通常指生物的进化理论。达尔 文的《物种起源》奠定了进化论的科 学基础,根本上否定了“神创 论”“物种不变论”等传统观念,成 为划时代巨著。恩格斯认为达尔文的 进化理论是19世纪自然科学三大发现 (能量守恒和转换定律、细胞学说和 进化论)之一。
(四)结论 相对生产力超过对照10%以上的有2、7、8、9、10五个品系,
其中品系7增产幅度最大,达32.5%;超过对照5%以上的有3、4、 12三个品系,有必要作进一步试验观察。其余品系可予以淘汰。
Z2 随机排列设计试验结果的统计分析: 随机区组试验结果统计分析 1、试验设计特点: 在肥力梯度变化线上分组,区组内分小区,小区 数与处理数相等,合理利用局部控制的原则。区 组方向与肥力方向垂直;设计简单,易于掌握; 富有弹性,能提供误差分析条件,对试验地的地 形要求不严。 2、结果分析 要考虑局部控制,区组间的土壤存在明显的差异。 同一处理不同区组间的差异是误差引起 不同处理在同一区组的差异是误差+处理间效应 总变异=区组间变异+处理间变异+误差
本例对照区平均产量=71+79+77/9=25.22 2、计算对照品种667m2/产量 对照品种667m2产量=对照区平均产量 ×666.67/小区平方米 本例对照品种667m2产量=25.22×666.67/35
=480.38 3、计算各品种的矫正产量
各品种的矫正产量=品种对邻近CK产量的%× 对照品种667m2产量
第4段:“……生物的种,和变种一 样,是由以前别的种演变而来,而不 是分别创造出来的。”
第5段:“因此,我们对于生物变异 及相互适应的原因和方法,迫切地需 要有个明确的了解。”
第6段:“大量的、遗传的变异是可能的
第7段:“我深信生物的种不是不变 的;……我又确信自然选择作用,…… 也该是最重要的条件。”
指文章中十分重要的语句, 它 突出地体现了文章的旨趣,标 示文章的思路,显示文章结构 的特点。
进化论:亦称“天演论”、“演化
论”,通常指生物的进化理论。达尔 文的《物种起源》奠定了进化论的科 学基础,根本上否定了“神创 论”“物种不变论”等传统观念,成 为划时代巨著。恩格斯认为达尔文的 进化理论是19世纪自然科学三大发现 (能量守恒和转换定律、细胞学说和 进化论)之一。
第八章方差分析与正交试验设计

nj i 1
X ij—数据的总平均 Nhomakorabeas nj
ST
( X ij X )2 —总偏差平方和(总变差)
j1 i1
1 nj
X•j
nj
X ij
i 1
— 水平Aj下的样本平均值
定理一(平方和分解定理)在单因素方差分 析模型中,平方和有如下的恒等式,
ST SE SA
注: 定理一的意义是将试验中的总偏差平方和 分解为试验随机误差的平方和与因素A的偏 差平方和.
其二,当假设 H0 不成时, Xij ~ N ( j , 2 ) ,各
个 Xij 的数学期望不同,当然取值也不会一致.
因此,我们想用一个量来刻划各个
X
之间
ij
的波动程度,并且把引起波动的两个原因区分
开来,这就是方差分析的总偏差平方和分解方
法,并由此构造检验用的统计量.
平方和的分解
X
1 n
s j 1
A4
75.8 71.5
58.2 51.0
48.7 41.4
试验指标: 射程
因素: 推进器和燃料
水平: 推进器有3个,燃料有4个 双因素试验
试验目的: 考察推进器和燃料两因素对射程有 无显著的影响.
数学模型
设因素A有s个水平A1 , A2 , , As ,在水平Aj ( j
1,2, , s)下,进行nj (nj 2)次独立试验,得到如下表
表 电路的响应时间
类型Ⅰ 类型Ⅱ 类型Ⅲ 类型Ⅳ
19 15
22 20 18
20 40
21 33 27
16 17 18
15
22
18
19
26
试验指标:电路的响应时间 因素:电路类型
八正交试验设计讲PPT课件

数理统计 08-05
平
这是三因素三水
试验,通常有两种试验 B3
方法:
(1)全面实验法:
B2
对所有的搭配做试验,共
B1
需进行3³=27次试验。如图 A1
所示,立方体包含了27个
节点,分别表示27次试验。
C3
C2
A2
A3 C1
数理统计
08-06 表8-1
数理统计 08-07
• 全面试验法的优缺点: 优点:对各因素与试验指标之间的关系剖析得比 较清楚,可以分析各因素的效应及交互作用,也 可选出最优条件组合。 缺点:(1) 试验次数太多,费时、费事,当因素 水平比较多时,试验无法完成;
的生产条件。
3
B3
2
B2
6 5 8
4
1
B1
A1
A2
9
7
C3 C2 A3 C1
用正交试验法( L9 (34 ) )安排试验只需要9次试验
数理统计 08-14
图8-2
(1)A1B1C1 (3)A1B3C3 (4)A2B1C2 (6)A2B3C1
(2)A1B2C2 (5)A2B2C3
数理统计
08•-1正5 交试验法的优点:
数理统计
08-18
• 正交表的正交性(以L9 (34 )为例)
数理统计 08-04
在例1中,对因素A、B、C在试验范围内分 别选取三个水平: A:A1=80℃、A2=85℃、A3=90℃ B:B1=90Min、B2=120Min、B3=150Min C:C1=5%、C2=6%、C3=7%
(正交试验设计中,因素可以是定量的, 也 可以是定性的。而定量因素各水平间的距离可以 相等也可以不等)。